CN1894408A - 除草剂代谢蛋白质,其基因及其应用 - Google Patents

除草剂代谢蛋白质,其基因及其应用 Download PDF

Info

Publication number
CN1894408A
CN1894408A CN 02825642 CN02825642A CN1894408A CN 1894408 A CN1894408 A CN 1894408A CN 02825642 CN02825642 CN 02825642 CN 02825642 A CN02825642 A CN 02825642A CN 1894408 A CN1894408 A CN 1894408A
Authority
CN
China
Prior art keywords
seq
protein
aminoacid sequence
representing
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 02825642
Other languages
English (en)
Other versions
CN100537764C (zh
Inventor
中岛宽树
椋本藤夫
高石昌直
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Chemical Co Ltd
Original Assignee
Sumitomo Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Chemical Co Ltd filed Critical Sumitomo Chemical Co Ltd
Publication of CN1894408A publication Critical patent/CN1894408A/zh
Application granted granted Critical
Publication of CN100537764C publication Critical patent/CN100537764C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供例如,编码选自以下蛋白质组的除草剂代谢蛋白质的DNA。该DNA可以例如用于生产抗除草剂植物。<蛋白质组>一种蛋白质,其包含在SEQ ID NO:1,2,3,108,159,160,136,137,138,215,216,217,218,219,220,221,222,223或224中表示的氨基酸序列,一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含与在SEQ ID NO:1,2,3,108,159,136,137,138,215,216,217,218,219,220,221,222,223或224中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,215,216,218,222或224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。

Description

除草剂代谢蛋白质,其基因及其应用
技术领域
本发明涉及具有代谢除草化合物能力的蛋白质(除草剂代谢蛋白质),其基因及其应用。
背景技术
当使用时除草剂是以需要量的稀释液利用。存在过量剩余的情形。还存在其中施用的除草剂在它施用片刻后残留在土壤或植物残体中的情形。最初,假定已经检查这些除草剂的安全性,这些少量的剩余溶液或残余物对环境或此后栽培的作物产生小的影响。然而,如果存在将包含的除草化合物转化为一种低除草活性的化合物的方法,那么例如可以根据需要进行钝化上述剩余溶液或残余物的处理。
另外,在使用除草剂的情形中,存在难以将栽培植物与近似种的杂草区别以选择性地仅控制杂草的情形。因而,需要开发赋予靶植物除草剂抗性的新方法。
发明内容
在这种情形下,本发明人深入研究,结果已经发现通过与特定的蛋白质反应可以将原卟啉原氧化酶(在下文中,有时称为“PPO”)抑制型的除草化合物转化为低除草活性的化合物,其导致本发明的完成。
即,本发明提供:
1.编码除草剂代谢蛋白的DNA,其中所述蛋白质选自:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,
并包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%的序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%的序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含与在SEQ ID NO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ ID NO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ ID NO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ ID NO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ ID NO:219,SEQID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ ID NO:223或SEQ IDNO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%的序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌(Streptomyces phaeochromogenes),砖红色链霉菌(Streptomycestestaceus),不产色链霉菌(Streptomyces achromogenes),灰褐链霉菌(Streptomyces griseofuscus),热淡天蓝链霉菌(Streptomycesthermocoerulescens),黑胡桃链霉菌(Streptomyces nogalater),津岛链霉菌(Streptomyces tsusimaensis),球团产色链霉菌(Streptomycesglomerochromogenes),橄榄产色链霉菌(Streptomyces olivochromogenes),装饰链霉菌(Streptomyces ornatus),灰色链霉菌(Streptomyces griseus),羊毛链霉菌(Streptomyces lanatus),三泽链霉菌(Streptomyces misawanensis),苍白色链霉菌(Streptomyces pallidus),玫瑰变红链霉菌(Streptomycesroseorubens),鲁地链霉菌(Streptomyces rutgersensis),斯堡链霉菌(Streptomyces steffisburgensis)或塔氏糖多孢菌(Saccharopolyspora taberi)的染色体DNA;
2.包含核苷酸序列的DNA,所述核苷酸序列选自:
(a1)在SEQ ID NO:6中表示的核苷酸序列;
(a2)在SEQ ID NO:7中表示的核苷酸序列;
(a3)在SEQ ID NO:8中表示的核苷酸序列;
(a4)在SEQ ID NO:109中表示的核苷酸序列;
(a5)在SEQ ID NO:139中表示的核苷酸序列;
(a6)在SEQ ID NO:140中表示的核苷酸序列;
(a7)在SEQ ID NO:141中表示的核苷酸序列;
(a8)在SEQ ID NO:142中表示的核苷酸序列;
(a9)在SEQ ID NO:143中表示的核苷酸序列;
(a10)在SEQ ID NO:225中表示的核苷酸序列;
(a11)在SEQ ID NO:226中表示的核苷酸序列;
(a12)在SEQ ID NO:227中表示的核苷酸序列;
(a13)在SEQ ID NO:228中表示的核苷酸序列;
(a14)在SEQ ID NO:229中表示的核苷酸序列;
(a15)在SEQ ID NO:230中表示的核苷酸序列;
(a16)在SEQ ID NO:231中表示的核苷酸序列;
(a17)在SEQ ID NO:232中表示的核苷酸序列;
(a18)在SEQ ID NO:233中表示的核苷酸序列;
(a19)在SEQ ID NO:234中表示的核苷酸序列;
(a20)一种核苷酸序列,其编码蛋白质的氨基酸序列,所述蛋白质具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,所述核苷酸序列与在SEQ ID NO:6,SEQ ID NO:7,SEQ IDNO:8或SEQ ID NO:109中任何一个表示的核苷酸序列具有至少80%序列同一性;和
(a21)一种核苷酸序列,其编码蛋白质的氨基酸序列,所述蛋白质具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,所述核苷酸序列与在SEQ ID NO:139,SEQ ID NO:140,SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:143,SEQ ID NO:225,SEQID NO:226,SEQ ID NO:227,SEQ ID NO:228,SEQ ID NO:229,SEQ IDNO:230,SEQ ID NO:231,SEQ ID NO:232,SEQ ID NO:233或SEQ IDNO:234中任何一个表示的核苷酸序列具有至少90%序列同一性;
3.按照上述1的DNA,其包含编码所述蛋白质的氨基酸序列的核苷酸序列,其中在所述核苷酸序列中的密码子使用是在来自引入DNA的宿主细胞物种的基因中密码子使用±4%的范围内并且所述核苷酸序列的GC含量是至少40%和至多60%;
4.包含在SEQ ID NO:214中表示的核苷酸序列的DNA;
5.包含在SEQ ID NO:368中表示的核苷酸序列的DNA;
6.包含在SEQ ID NO:393中表示的核苷酸序列的DNA;
7.一种DNA,其中具有编码胞内细胞器转运信号序列的核苷酸序列的DNA连接在按照上述1的框内DNA的上游;
8.一种DNA,其中按照上述1的DNA和在宿主细胞中起作用的启动子可操作地(operably)连接;
9.包含按照上述1的DNA的载体;
10.一种产生载体的方法,其包含将按照上述1的DNA插入可在宿主中复制的载体的步骤;
11.一种转化体,其中将按照上述1的DNA引入宿主细胞;
12.按照上述11的转化体,其中所述宿主细胞是微生物细胞或植物细胞;
13.一种产生转化体的方法,其包含将按照上述1的DNA引入宿主细胞的步骤;
14.一种产生具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的方法,所述方法包含培养按照上述11的转化体和回收产生的所述蛋白质的步骤;
15.按照上述1的DNA在生产具有将式(II)化合物转化为式(III)化合物的能力的蛋白质中的应用;
16.一种给予植物除草剂抗性的方法,所述方法包含将按照上述1的DNA引入植物细胞和在其中表达的步骤;
17.一种多核苷酸,其具有按照上述1的DNA的部分核苷酸序列或与所述部分核苷酸序列互补的核苷酸序列;
18.一种检测编码具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的DNA的方法,所述方法包含检测在杂交中与探针杂交的DNA的步骤,其使用按照上述1的DNA或按照上述17的多核苷酸作为探针;
19.一种检测编码具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的DNA的方法,所述方法包含检测在以按照上述17的多核苷酸作为引物的聚合酶链式反应中扩增的DNA的步骤;
20.按照上述19的方法,其中引物中至少一种选自包含在SEQ IDNO:124至128中任何一个表示的核苷酸序列的多核苷酸组成的组和包含在SEQ ID NO:129中显示的核苷酸序列的多核苷酸;
21.一种获得编码具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的DNA的方法,所述方法包含回收通过按照上述18或19的方法检测的DNA的步骤;
22.一种筛选含有编码具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的DNA的细胞的方法,所述方法包含通过按照上述18或19的方法从试验细胞中检测所述DNA的步骤;
23.一种除草剂代谢蛋白,其选自:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA;
24.一种识别除草剂代谢蛋白的抗体,所述除草剂代谢蛋白选自由下式物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA;
25.一种检测除草剂代谢蛋白的方法,所述方法包含:
(1)将试样与识别所述蛋白质的抗体接触的步骤和
(2)检测由所述接触产生的、所述蛋白质和所述抗体的复合体的步骤,其中所述蛋白质选自由下式物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA;
26.一种分析或检测试剂盒,其包含按照上述24的抗体;
27.一种编码铁氧还蛋白的DNA,所述铁氧还蛋白选自由下式物质组成的组:
(B1)包含在SEQ ID NO:12中表示的氨基酸序列的蛋白质;
(B2)包含在SEQ ID NO:13中表示的氨基酸序列的蛋白质;
(B3)包含在SEQ ID NO:14中表示的氨基酸序列的蛋白质;
(B4)包含在SEQ ID NO:111中表示的氨基酸序列的蛋白质;
(B5)包含与在SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQID NO:111中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列的铁氧还蛋白;
(B6)包含由核苷酸序列编码的氨基酸序列的铁氧还蛋白,其中所述核苷酸序列与编码在SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQID NO:111中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
(B7)包含在SEQ ID NO:149中表示的氨基酸序列的蛋白质;
(B8)包含在SEQ ID NO:150中表示的氨基酸序列的蛋白质;
(B9)包含在SEQ ID NO:151中表示的氨基酸序列的蛋白质;
(B10)包含在SEQ ID NO:152中表示的氨基酸序列的蛋白质;
(B11)包含在SEQ ID NO:153中表示的氨基酸序列的蛋白质;
(B12)一种铁氧还蛋白,其包含与在SEQ ID NO:149,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251或SEQ ID NO:253中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:150,SEQ ID NO:252或SEQ IDNO:254中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(B13)一种铁氧还蛋白,其包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:149,SEQ ID NO:150,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251,SEQ ID NO:252,SEQ ID NO:253或SEQ ID NO:254中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
(B14)包含在SEQ ID NO:245中表示的氨基酸序列的蛋白质;
(B15)包含在SEQ ID NO:247中表示的氨基酸序列的蛋白质;
(B16)包含在SEQ ID NO:248中表示的氨基酸序列的蛋白质;
(B17)包含在SEQ ID NO:249中表示的氨基酸序列的蛋白质;
(B18)包含在SEQ ID NO:250中表示的氨基酸序列的蛋白质;
(B19)包含在SEQ ID NO:251中表示的氨基酸序列的蛋白质;
(B20)包含在SEQ ID NO:252中表示的氨基酸序列的蛋白质;
(B21)包含在SEQ ID NO:253中表示的氨基酸序列的蛋白质;和
(B22)包含在SEQ ID NO:254中表示的氨基酸序列的蛋白质;
28.包含核苷酸序列的DNA,所述核苷酸序列选自由下述物质组成的组:
(b1)在SEQ ID NO:15中表示的核苷酸序列;
(b2)在SEQ ID NO:16中表示的核苷酸序列;
(b3)在SEQ ID NO:17中表示的核苷酸序列;
(b4)在SEQ ID NO:112中表示的核苷酸序列;
(b5)在SEQ ID NO:154中表示的核苷酸序列;
(b6)在SEQ ID NO:155中表示的核苷酸序列;
(b7)在SEQ ID NO:156中表示的核苷酸序列;
(b8)在SEQ ID NO:157中表示的核苷酸序列;
(b9)在SEQ ID NO:158中表示的核苷酸序列;
(b10)在SEQ ID NO:255中表示的核苷酸序列;
(b11)在SEQ ID NO:257中表示的核苷酸序列;
(b12)在SEQ ID NO:258中表示的核苷酸序列;
(b13)在SEQ ID NO:259中表示的核苷酸序列;
(b14)在SEQ ID NO:260中表示的核苷酸序列;
(b15)在SEQ ID NO:261中表示的核苷酸序列;
(b16)在SEQ ID NO:262中表示的核苷酸序列;
(b17)在SEQ ID NO:263中表示的核苷酸序列;
(b18)在SEQ ID NO:264中表示的核苷酸序列;和
(b19)一种核苷酸序列,其与在SEQ ID NO:15,SEQ ID NO:16,SEQID NO:17,SEQ ID NO:112,SEQ ID NO:154,SEQ ID NO:155,SEQ IDNO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:255,SEQ IDNO:257,SEQ ID NO:258,SEQ ID NO:259,SEQ ID NO:260,SEQ IDNO:261,SEQ ID NO:262,SEQ ID NO:263或SEQ ID NO:264中任何一个表示的核苷酸序列具有至少90%序列同一性
29.一种包含按照上述28的DNA的载体;
30.一种转化体,其中将按照上述28的DNA引入宿主细胞;
31.一种铁氧还蛋白,其选自由下述物质组成的组:
(B1)包含在SEQ ID NO:12中表示的氨基酸序列的蛋白质;
(B2)包含在SEQ ID NO:13中表示的氨基酸序列的蛋白质;
(B3)包含在SEQ ID NO:14中表示的氨基酸序列的蛋白质;
(B4)包含在SEQ ID NO:111中表示的氨基酸序列的蛋白质;
(B5)包含与在SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQID NO:111中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列的铁氧还蛋白;
(B6)包含由核苷酸序列编码的氨基酸序列的铁氧还蛋白,其中所述核苷酸序列与编码在SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQID NO:111中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
(B7)包含在SEQ ID NO:149中表示的氨基酸序列的蛋白质;
(B8)包含在SEQ ID NO:150中表示的氨基酸序列的蛋白质;
(B9)包含在SEQ ID NO:151中表示的氨基酸序列的蛋白质;
(B10)包含在SEQ ID NO:152中表示的氨基酸序列的蛋白质;
(B11)包含在SEQ ID NO:153中表示的氨基酸序列的蛋白质;
(B12)一种铁氧还蛋白,其包含与在SEQ ID NO:149,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251或SEQ ID NO:253中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:150,SEQ ID NO:252或SEQ IDNO:254中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(B13)一种铁氧还蛋白,其包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:149,SEQ ID NO:150,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251,SEQ ID NO:252,SEQ ID NO:253或SEQ ID NO:254中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
(B14)包含在SEQ ID NO:245中表示的氨基酸序列的蛋白质;
(B15)包含在SEQ ID NO:247中表示的氨基酸序列的蛋白质;
(B16)包含在SEQ ID NO:248中表示的氨基酸序列的蛋白质;
(B17)包含在SEQ ID NO:249中表示的氨基酸序列的蛋白质;
(B18)包含在SEQ ID NO:250中表示的氨基酸序列的蛋白质;
(B19)包含在SEQ ID NO:251中表示的氨基酸序列的蛋白质;
(B20)包含在SEQ ID NO:252中表示的氨基酸序列的蛋白质;
(B21)包含在SEQ ID NO:253中表示的氨基酸序列的蛋白质;和
(B22)包含在SEQ ID NO:254中表示的氨基酸序列的蛋白质;
32.一种包含核苷酸序列的DNA,所述核苷酸序列选自由下述物质组成的组:
(ab1)在SEQ ID NO:9中表示的核苷酸序列;
(ab2)在SEQ ID NO:10中表示的核苷酸序列;
(ab3)在SEQ ID NO:11中表示的核苷酸序列;
(ab4)在SEQ ID NO:110中表示的核苷酸序列;
(ab5)在SEQ ID NO:144中表示的核苷酸序列;
(ab6)在SEQ ID NO:145中表示的核苷酸序列;
(ab7)在SEQ ID NO:146中表示的核苷酸序列;
(ab8)在SEQ ID NO:147中表示的核苷酸序列;
(ab9)在SEQ ID NO:148中表示的核苷酸序列;
(ab10)在SEQ ID NO:235中表示的核苷酸序列;
(ab11)在SEQ ID NO:236中表示的核苷酸序列;
(ab12)在SEQ ID NO:237中表示的核苷酸序列;
(ab13)在SEQ ID NO:238中表示的核苷酸序列;
(ab14)在SEQ ID NO:239中表示的核苷酸序列;
(ab15)在SEQ ID NO:240中表示的核苷酸序列;
(ab16)在SEQ ID NO:241中表示的核苷酸序列;
(ab17)在SEQ ID NO:242中表示的核苷酸序列;
(ab18)在SEQ ID NO:243中表示的核苷酸序列;和
(ab19)在SEQ ID NO:244中表示的核苷酸序列;
33.包含按照上述32的DNA的载体;
34.一种转化体,其中将按照上述32的DNA引入宿主细胞;
35.按照上述34的转化体,其中所述宿主细胞是微生物细胞或植物细胞;
36.一种生产转化体的方法,其包含将按照上述32的DNA引入宿主细胞的步骤;
37.一种生产具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的方法,所述方法包含培养按照上述34的转化体和回收产生的所述蛋白质的步骤;
38.一种控制杂草的方法,其包含将化合物施用于表达至少一种除草剂代谢蛋白的植物的栽培区域的步骤,所述除草剂代谢蛋白选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属(Streptomyces)或糖多孢菌属(Saccharopolyspora)微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性,
其中所述化合物是式(I)的化合物:
其中在式(I)中,G表示在下列G-1至G-9中任何一个表示的基团:
Figure A0282564200542
其中在G-1至G-9中,
X表示氧原子或硫原子;
Y表示氧原子或硫原子;
R1表示氢原子或卤原子;
R2表示氢原子,C1-C8烷基,C1-C8卤代烷基,卤原子,羟基,-OR9基团,-SH基团,-S(O)pR9基团,-COR9基团,-CO2R9基团,-C(O)SR9基团,-C(O)NR11R12基团,-CONH2基团,-CHO基团,-CR9=NOR18基团,-CH=CR19CO2R9基团,-CH2CHR19CO2R9基团,-CO2N=CR13R14基团,硝基,氰基,-NHSO2R15基团,-NHSO2NHR15基团,-NR9R20基团,-NH2基团或苯基,其可以被一个或多个相同或不同的C1-C4烷基取代;
p表示0,1或2;
R3表示C1-C2烷基,C1-C2卤代烷基,-OCH3基团,-SCH3基团,-OCHF2基团,卤原子,氰基,硝基或C1-C3烷氧基,其用在苯环上可以被选自卤原子,C1-C3烷基,C1-C3卤代烷基,OR28基团,NR11R28基团,SR28基团,氰基,CO2R28基团和硝基中的至少一个取代基取代的苯基取代;
R4表示氢原子,C1-C3烷基,C1-C3卤代烷基;
R5表示氢原子,C1-C3烷基,C1-C3卤代烷基,环丙基,乙烯基,C2炔基,氰基,-C(O)R20基团,-CO2R20基团,-C(O)NR20R21基团,-CHR16R17CN基团,-CR16R17C(O)R20基团,-CR16R17CO2R20基团,-CR16R17C(O)NR20R21基团,-CHR16OH基团,-CHR16OC(O)R20基团或-OCHR16OC(O)NR20R21基团,或当G表示G-2或G-6时,R4和R5可以表示与它们结合的碳原子一起的C=O基团;
R6表示C1-C6烷基,C1-C6卤代烷基,C2-C6烷氧基烷基,C3-C6烯基或C3-C6炔基;
R7表示氢原子,C1-C6烷基,C1-C6卤代烷基,卤原子,-S(O)2(C1-C6烷基)或-C(=O)R22基团;
R8表示氢原子,C1-C8烷基,C3-C8环烷基,C3-C8烯基,C3-C8炔基,C1-C8卤代烷基,C2-C8烷氧基烷基,C3-C8烷氧基烷氧基烷基,C3-C8卤代炔基,C3-C8卤代烯基,C1-C8烷基磺酰基,C1-C8卤代烷基磺酰基,C3-C8烷氧羰基烷基,-S(O)2NH(C1-C8烷基)基团,-C(O)R23基团或可在苯环上被R24取代的苄基;
R9表示C1-C8烷基,C3-C8环烷基,C3-C8烯基,C3-C8炔基,C1-C8卤代烷基,C2-C8烷氧基烷基,C2-C8烷基硫代烷基,C2-C8烷基亚磺酰基烷基,C2-C8烷基磺酰基烷基,C4-C8烷氧基烷氧基烷基,C4-C8环烷基烷基,C4-C8环烷氧基烷基,C4-C8烯氧基烷基,C4-C8炔氧基烷基,C3-C8卤代烷氧基烷基,C4-C8卤代烯氧基烷基,C4-C8卤代炔氧基烷基,C4-C8环烷基硫代烷基,C4-C8烯基硫代烷基,C4-C8炔基硫代烷基,用在环上可以被至少一种选自卤原子,C1-C3烷基和C1-C3卤代烷基的取代基取代的苯氧基取代的C1-C4烷基,用在环上可以被至少一种选自卤原子,C1-C3烷基和C1-C3卤代烷基的取代基取代的苄氧基取代的C1-C4烷基,C4-C8 trialkylsyrylalkyl基团,C2-C8氰烷基,C3-C8卤代环烷基,C3-C8卤代烯基,C5-C8烷氧基烯基,C5-C8卤代烷氧基烯基,C5-C8烷基硫代烯基,C3-C8卤代炔基,C5-C8烷氧基炔基,C5-C8卤代烷氧基炔基,C5-C8烷基硫代炔基,C2-C8烷基羰基,在环上可以用至少一种选自卤原子,C1-C3烷基,C1-C3卤代烷基,-OR28基团,-NR11R28基团,-SR28基团,氰基,-CO2R28基团和硝基的取代基取代的苄基,-CR16R17COR10基团,-CR16R17CO2R20基团,-CR16R17P(O)(OR10)2基团,-CR16R17P(S)(OR10)2基团,-CR16R17C(O)NR11R12基团,-CR16R17C(O)NH2基团,-C(=CR26R27)COR10基团,-C(=CR26R27)CO2R20基团,-C(=CR26R27)P(O)(OR10)2基团,-C(=CR26R27)P(S)(OR10)2基团,-C(=CR26R27)C(O)NR11R12基团,-C(=CR26R27)C(O)NH2基团,或在Q-1至Q-7表示的环中的任何一个:
Figure A0282564200561
其在环上可以被至少一种选自卤原子,C1-C6烷基,C1-C6卤代烷基,C2-C6烯基,C2-C6卤代烯基,C2-C6炔基,C3-C6卤代炔基,C2-C8烷氧基烷基,-OR28基团,-SR28基团,-NR11R28基团,C3-C8烷氧羰基烷基,C2-C4羧基烷基,-CO2R28基团和氰基的取代基取代;
R10表示C1-C6烷基,C2-C6烯基,C3-C6炔基或四氢呋喃基团;
R11和R13独立地表示氢原子或C1-C4烷基;
R12表示C1-C6烷基,C3-C6环烷基,C3-C6烯基,C3-C6炔基,C2-C6烷氧基烷基,C1-C6卤代烷基,C3-C6卤代烯基,C3-C6卤代炔基,在环上可以被至少一种取代基取代的苯基,所述取代基选自卤原子,C1-C4烷基和C1-C4烷氧基,或-CR16R17CO2R25基团;或,
R11和R12一起可以表示-(CH2)5-,-(CH2)4-,或-CH2CH2OCH2CH2-,或者如果是那样的话,产生的环可以用选自C1-C3烷基,苯基和苄基的取代基取代;
R14表示C1-C4烷基或在环上可以用选自卤原子,C1-C3烷基和C1-C3卤代烷基取代的苯基;或,
R13和R14可以与它们结合的碳原子一起表示C3-C8环烷基;
R15表示C1-C4烷基,C1-C4卤代烷基或C3-C6烯基;
R16和R17独立地表示氢原子或C1-C4烷基,C1-C4卤代烷基,C2-C4烯基,C2-C4卤代烯基,C2-C4炔基,C3-C4卤代炔基;或,
R16和R17可以与它们结合的碳原子一起表示C3-C6环烷基,或者如此形成的环可以用至少一种选自卤原子,C1-C3烷基和C1-C3卤代烷基的取代基取代;
R18表示氢原子,C1-C6烷基,C3-C6烯基或C3-C6炔基;
R19表示氢原子,C1-C4烷基或卤原子;
R20表示氢原子,C1-C6烷基,C3-C6环烷基,C3-C6烯基,C3-C6炔基,C2-C6烷氧基烷基,C1-C6卤代烷基,C3-C6卤代烯基,C3-C6卤代炔基,在环上可以用至少一种取代基取代的苯基,所述取代基选自卤原子,C1-C4烷基和-OR28基团,或-CR16R17CO2R25基团;
R21表示氢原子,C1-C2烷基或-CO2(C1-C4烷基)基团;
R22表示氢原子,C1-C6烷基,C1-C6烷氧基或NH(C1-C6烷基)基团;
R23表示C1-C6烷基,C1-C6卤代烷基,C1-C6烷氧基,NH(C1-C6烷基)基团,苄基,C2-C8二烷基氨基或可以用R24取代的苯基;
R24表示C1-C6烷基,1-2个卤原子,C1-C6烷氧基或CF3基团;
R25表示C1-C6烷基,C1-C6卤代烷基,C3-C6烯基,C3-C6卤代烯基,C3-C6炔基或C3-C6卤代炔基;
R26和R27各自独立地表示氢原子,C1-C4烷基,C1-C4卤代烷基,C2-C4烯基,C2-C4卤代烯基,C2-C4炔基,C3-C4卤代炔基,-OR28基团,-NHR28基团,或-SR28基团;或,
R26和R27可以与它们结合的碳原子一起表示C3-C8环烷基,或每个如此形成的环可以用至少一种选自卤原子,C1-C3烷基和C1-C3卤代烷基的取代基取代;和
R28表示氢原子,C1-C6烷基,C1-C6卤代烷基,C3-C6烯基,C3-C6卤代烯基,C3-C6炔基,C3-C6卤代炔基,C2-C4羧基烷基,C3-C8烷氧羰基烷基,C3-C8卤代烷氧羰基烷基,C5-C9烯氧基羰基烷基,C5-C9卤代烯氧基羰基烷基,C5-C9炔氧基羰基烷基,C5-C9卤代炔氧基羰基烷基,C5-C9环烷氧基羰基烷基或C5-C9卤代环烷氧基羰基烷基;
39.一种控制杂草的方法,其包含将化合物施用于表达至少一种蛋白质的植物的栽培区域的步骤,所述蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA;
40.一种评估细胞对式(I)化合物的抗性的方法,所述方法包含:
(1)将所述化合物与表达至少一种除草剂代谢蛋白的细胞接触的步骤,所述除草剂代谢蛋白选自由下式物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属微生物的染色体DNA;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(2)评估在上述步骤(1)中对接触化合物的细胞的损伤程度的步骤;
41.按照上述40的方法,其中所述细胞是微生物细胞或植物细胞;
42.选择抗式(I)化合物的细胞的方法,所述方法包含基于在按照上述40的方法中评估的抗性,选择细胞的步骤;
43.通过按照上述42的方法选择的抗除草剂的细胞,或其培养物;
44.一种评估植物对式(I)化合物的抗性的方法,所述方法包含:
(1)将所述化合物与表达至少一种除草剂代谢蛋白的植物接触的步骤,所述除草剂代谢蛋白选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(2)评估对在步骤(1)中描述的接触化合物的植物的损伤程度的步骤;
45.一种选择抗式(I)化合物的植物的方法,所述方法包含基于在按照上述44的方法中评估的抗性,选择植物的步骤;
46.一种由按照上述45的方法选择的抗除草剂植物,或其后代;
47.一种处理式(I)化合物的方法,所述方法包含在含有电子供体的电子传递体系的存在下将所述化合物与至少一种除草剂代谢蛋白反应,所述除草剂代谢蛋白选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
48.按照上述47的方法,其中通过将所述化合物与转化体接触将所述化合物与所述除草剂代谢蛋白反应,在所述转化体中将编码所述除草剂代谢蛋白的DNA引入宿主细胞中能使它在所述细胞中表达的位置;
49.除草剂代谢蛋白在处理式(I)化合物中的应用,所述除草剂代谢蛋白选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
50.编码除草剂代谢蛋白的多核苷酸在处理式(I)化合物中的应用,所述除草剂代谢蛋白选自由下述物质组成的组
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性。
附图简述
图1显示用于获得本发明DNA(A1)和本发明DNA(B1)的PCR引物的退火位点。每个数字是指表示引物核苷酸序列的SEQ ID号。箭头表示具有以其SEQ ID号表示的核苷酸序列的寡核苷酸引物的退火位点和从引物DNA聚合酶反应的延伸方向。虚线表示通过使用引物的PCR扩增的DNA。粗线表示邻近DNA插入位点的载体区域,该载体用来生产染色体DNA文库。
图2显示用于获得本发明DNA(A2)和本发明DNA(B2)的PCR引物的退火位点。每个数字是指表示引物核苷酸序列的SEQ ID号。箭头表示具有以其SEQ ID号表示的核苷酸序列的寡核苷酸引物的退火位点和从引物DNA聚合酶反应的延伸方向。虚线表示通过使用引物的PCR扩增的DNA。粗线表示邻近DNA插入位点的载体区域,该载体用来生产染色体DNA文库。
图3显示用于获得本发明DNA(A4)和本发明DNA(B4)的PCR引物的退火位点。每个数字是指表示引物核苷酸序列的SEQ ID号。箭头表示具有以其SEQ ID号表示的核苷酸序列的寡核苷酸引物的退火位点和从引物DNA聚合酶反应的延伸方向。虚线表示通过使用引物的PCR扩增的DNA。粗线表示邻近DNA插入位点的载体区域,该载体用来生产染色体DNA文库。然而,由57表示的寡核苷酸引物是与邻近用来产生染色体DNA文库的载体的DNA插入位点的区域退火的引物,未能与本发明的DNA(A4)退火。
图4显示质粒pKSN2的限制性酶切图。
图5显示质粒pCRrSt12的限制性酶切图。
图6显示质粒pCR657ET的限制性酶切图。
图7显示质粒pCR657FET的限制性酶切图。
图8显示质粒pCR657Bs的限制性酶切图。
图9显示质粒pCR657FBs的限制性酶切图。
图10显示质粒pUCrSt12的限制性酶切图。
图11显示质粒pUCrSt657的限制性酶切图。
图12显示质粒pUCrSt657F的限制性酶切图。
图13显示质粒pUCCR16G6-p/t的限制性酶切图。
图14显示通过将由在SEQ ID NO:89中表示的核苷酸序列组成的寡核苷酸和由在SEQ ID NO:90中表示的核苷酸序列组成的寡核苷酸退火产生的接头NotI-EcoRI的结构。
图15显示质粒pUCCR16G6-p/tΔ的限制性酶切图。
图16显示通过将由在SEQ ID NO:91中表示的核苷酸序列组成的寡核苷酸和由在SEQ ID NO:92中表示的核苷酸序列组成的寡核苷酸退火产生的接头HindIII-NotI的结构。
图17显示质粒pNdG6-ΔT的限制性酶切图。
图18显示质粒pSUM-NdG6-rSt657的限制性酶切图。
图19显示质粒pSUM-NdG6-rSt657F的限制性酶切图。
图20显示质粒pKFrSt12的限制性酶切图。
图21显示质粒pKFrSt12-657的限制性酶切图。
图22显示质粒pKFrSt12-657F的限制性酶切图。
图23显示质粒pSUM-NdG6-rSt12-657的限制性酶切图。
图24显示质粒pSUM-NdG6-rSt12-657F的限制性酶切图。
图25显示通过将由在SEQ ID NO:98中表示的核苷酸序列组成的寡核苷酸和由在SEQ ID NO:99中表示的核苷酸序列组成的寡核苷酸退火产生的接头HindIII-NotI-EcoRI的结构。
图26显示质粒pBI121S的限制性酶切图。
图27显示质粒pBI-NdG6-rSt-657的限制性酶切图。
图28显示质粒pBI-NdG6-rSt-657F的限制性酶切图。
图29显示质粒pBI-NdG6-rSt12-657的限制性酶切图。
图30显示质粒pBI-NdG6-rSt12-657F的限制性酶切图。
图31显示质粒pCR923Sp的限制性酶切图。
图32显示质粒pNdG6-rSt12的限制性酶切图。
图33显示质粒pSUM-NdG6-rSt-923的限制性酶切图。
图34显示质粒pKFrSt12-923的限制性酶切图。
图35显示质粒pSUM-NdG6-rSt12-923的限制性酶切图。
图36显示质粒pBI-NdG6-rSt-923的限制性酶切图。
图37显示质粒pBI-NdG6-rSt12-923的限制性酶切图。
图38显示质粒pCR671ET的限制性酶切图。
图39显示质粒pCR671Bs的限制性酶切图。
图40显示质粒pUCrSt671的限制性酶切图。
图41显示质粒pSUM-NdG6-rSt-671的限制性酶切图。
图42显示质粒pKFrSt12-671的限制性酶切图。
图43显示质粒pSUM-NdG6-rSt12-671的限制性酶切图。
图44显示质粒pBI-NdG6-rSt-671的限制性酶切图。
图45显示质粒pBI-NdG6-rSt12-671的限制性酶切图。
图46显示通过用琼脂糖凝胶电泳检测通过PCR扩增的DNA的结果,该PCR使用具有本发明DNA(A)的部分核苷酸序列的寡核苷酸作为引物。泳道1,7,8,12,19,26,27,32,37,42和47表示DNA标记(φ174/HaeIII消化)的电泳。其它泳道表示表20和21所示样品的电泳。
图47显示通过将由在SEQ ID NO:134中表示的核苷酸序列组成的寡核苷酸和由在SEQ ID NO:135中表示的核苷酸序列组成的寡核苷酸退火产生的接头的结构。
图48显示质粒pUCrSt657soy的限制性酶切图。
图49显示质粒pSUM-NdG6-rSt-657soy的限制性酶切图。
图50显示质粒pKFrSt12-657soy的限制性酶切图。
图51显示质粒pSUM-NdG6-rSt12-657soy的限制性酶切图。
图52显示质粒pBI-NdG6-rSt-657soy的限制性酶切图。
图53显示质粒pBI-NdG6-rSt12-657soy的限制性酶切图。
图54显示质粒pUCrSt1584soy的限制性酶切图。
图55显示质粒pSUM-NdG6-rSt-1584soy的限制性酶切图。
图56显示质粒pKFrSt12-1584soy的限制性酶切图。
图57显示质粒pSUM-NdG6-rSt12-1584soy的限制性酶切图。
图58显示质粒pBI-NdG6-rSt-1584soy的限制性酶切图。
图59显示质粒pBI-NdG6-rSt12-1584soy的限制性酶切图。
图60显示质粒pUCrSt1609soy的限制性酶切图。
图61显示质粒pSUM-NdG6-rSt-1609soy的限制性酶切图。
图62显示通过将由在SEQ ID NO:402中表示的核苷酸序列组成的寡核苷酸和由在SEQ ID NO:403中表示的核苷酸序列组成的寡核苷酸退火产生的接头EcoT22I-12aa-EcoT22I的结构。
图63显示质粒pUCrSt12-1609soy的限制性酶切图。
图64显示质粒pSUM-NdG6-rSt12-1609soy的限制性酶切图。
图65显示质粒pBI-NdG6-rSt-1609soy的限制性酶切图。
图66显示质粒pBI-NdG6-rSt12-1609soy的限制性酶切图。
下面解释在上图所述的缩写:
DNA A1:本发明DNA(A1)
DNA A2:本发明DNA(A2)
DNA A3:本发明DNA(A3)
DNA A4:本发明DNA(A4)
DNA B1:本发明DNA(B1)
DNA B2:本发明DNA(B2)
DNA B4:本发明DNA(B4)
DNA A1S:本发明DNA(A1)S
DNA A23S:本发明DNA(A23)S
DNA A25S:本发明DNA(A25)S
tac p:tac启动子
rrnB t:rrnB终止子
ColEl ori:质粒ColE1的复制起点
Ampr:氨苄青霉素抗性基因
RuBPCssCTT:编码大豆(cv.Jack)核酮糖-1,5-二磷酸羧化酶的小亚基的叶绿体转运肽的核苷酸序列
12aa:编码成熟蛋白的12个氨基酸的核苷酸序列,其在大豆(cv.Jack)核酮糖-1,5-二磷酸羧化酶的小亚基的叶绿体转运肽之后
Kmr:卡那霉素抗性基因
F1 ori:质粒F1的复制起点
CR16G6p:CR16G6启动子
CR16t:CR16终止子
CR16tΔ:其中将限制酶ScaI的限制位点下游的核苷酸序列从CR16终
         止子中去除的DNA
CR16G6pΔ:其中将限制酶NdeI的限制位点上游的核苷酸序列从
         CR16G6终止子中去除的DNA
NOSp:胭脂碱合酶基因的启动子
NPTII:卡那霉素抗性基因
NOSt:胭脂碱合酶基因的终止子
GUS:β-葡糖醛酸糖苷酶基因
RB:T-DNA的右边缘序列
LB:T-DNA的左边缘序列
NdeI,HindIII,BspHI,EcoRI,BamHI,EcoT221,SphI,KpnI,SacI,BglII,NotI,ScaI:各种限制酶的限制酶切位点
实施本发明的最好方式
以下详细解释本发明。
选自下列蛋白质组合(下文有时称为本发明蛋白质(A))的除草剂代谢蛋白具有将式(II)化合物(下文有时称为“化合物(II)”)转化为式(III)化合物(下文有时称为“化合物(III)”)的能力。
<蛋白质组合>
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA。
作为本发明蛋白质(A)的具体实例,提及:
包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A1)”);
包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A2)”);
包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A3)”);
包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A4)”);
包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A11)”);
包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A12)”);
包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A13)”);
包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A14)”);
包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A15)”);
包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A16)”);
包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A17)”);
包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A18)”);
包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A19)”);
包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A20)”);
包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A21)”);
包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A22)”);
包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A23)”);
包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A24)”);和
包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(A25)”);
例如,通过将式(I)的PPO抑制型除草化合物(下文有时称为“化合物(I)”)与本发明蛋白质(A)反应,能够将该化合物转化成具有低除草活性的化合物。
另外,在将化合物(I)转化为低除草活性的化合物的处理中,还可以利用选自下列组合的除草剂代谢蛋白(下文有时称为“本发明蛋白质(A)”):
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性。
作为本发明蛋白质(A)的实例,可以提及以上所述的本发明蛋白质A。另外,作为其它实施例,可以提及包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质(下文有时称为“本发明的蛋白质(A9)”)和包含在SEQID NO:5中表示的氨基酸序列的蛋白质(下文有时称为“本发明的蛋白质(A10)”)。
在上述蛋白质组合中在(A5),(A6),(A7),(A8),(A26),(A27)或(A28)中表示的蛋白质的氨基酸序列中,从在SEQ ID NO:1,2,3,108,159,160,136,137,138,215,216,217,218,219,220,221,222,223或224中表示的氨基酸序列中可以观察到的差异是例如某些氨基酸的缺失,替换,和插入。这些差异包括例如来自包含在SEQ ID NO:1,2,3,108,159,160,136,137,138,215,216,217,218,219,220,221,222,223或224中表示的氨基酸序列的上述蛋白质在细胞中接受的加工的缺失。另外,包括自然发生的多态性变异,其是由例如获得蛋白质的生物的物种,个体等的差异导致;由通过例如定点诱变法,随机诱变法,诱变处理等人工引入的遗传突变引起的氨基酸缺失,替换,和插入。
经受这些缺失,替换和插入的氨基酸的数量可以在本发明蛋白质(A)能够发展将化合物(II)转化成化合物(III)的能力的范围内。另外,作为氨基酸的替换,可以提及例如替换成在疏水性,电荷,pK,立体结构特征等方面相似的氨基酸。作为这些替换,具体地例如提及下列各组内的替换:(1)甘氨酸和丙氨酸;(2)缬氨酸,异亮氨酸和亮氨酸;(3)天冬氨酸,谷氨酸,天冬酰胺和谷氨酰胺;(4)丝氨酸和苏氨酸;(5)赖氨酸和精氨酸;(6)苯丙氨酸和酪氨酸;等。
另外,在本发明蛋白质(A)中,优选存在于对准SEQ ID NO:1所示氨基酸序列中357号氨基酸的半胱氨酸的位点的半胱氨酸是保守的(未经受缺失或替换):该半胱氨酸的实例包括在SEQ ID NO:2所示氨基酸序列中350号氨基酸所示的半胱氨酸,在SEQ ID NO:3所示氨基酸序列中344号氨基酸所示的半胱氨酸,在SEQ ID NO:108所示氨基酸序列中360号氨基酸所示的半胱氨酸,在SEQ ID NO:4所示氨基酸序列中359号氨基酸所示的半胱氨酸,在SEQ ID NO:5所示氨基酸序列中355号氨基酸所示的半胱氨酸,在SEQ ID NO:159所示氨基酸序列中358号氨基酸所示的半胱氨酸,在SEQ ID NO:160所示氨基酸序列中374号氨基酸所示的半胱氨酸,在SEQ ID NO:136所示氨基酸序列中351号氨基酸所示的半胱氨酸,在SEQ ID NO:137所示氨基酸序列中358号氨基酸所示的半胱氨酸,在SEQID NO:138所示氨基酸序列中358号氨基酸所示的半胱氨酸,在SEQ IDNO:222所示氨基酸序列中347号氨基酸所示的半胱氨酸,在SEQ IDNO:224所示氨基酸序列中347号氨基酸所示的半胱氨酸等。
作为人工导致这些氨基酸缺失,插入或替换(下文有时共同称为氨基酸修饰)的方法,例如提及包含在编码在SEQ ID NO:1,2,3,108,159,160,136,137,138,215,216,217,218,219,220,221,222,223或224中任何一个表示的氨基酸序列的DNA上进行定点诱变,和然后通过常规方法使该DNA表达的步骤的方法。作为定点诱变方法,例如提及应用琥珀突变(缺口双链体法,Nucleic Acids Res.,12,9441-9456(1984))方法,一种通过使用引物的PCR引入突变等的方法。另外,作为人工修饰氨基酸的方法,例如提及包含在编码在SEQ ID NO:1,2,3,108,159,160,136,137,138,215,216,217,218,219,220,221,222,223或224中表示的任何一个氨基酸序列的DNA上进行随机诱变,然后通过常规方法使该DNA表达的步骤的方法。作为随机诱变法,例如提及通过将编码上述氨基酸序列中任何一个的DNA用作模板和通过应用可以扩增每个全长DNA的引物对,在用作底物的dATP,dTTP,dGTP和dCTP中每一个的浓度不同于通常的条件下或在其中促进聚合酶反应的Mg2+浓度增加到高于通常的条件下进行PCR的方法。作为这些PCR方法,例如提及在Method in Molecular Biology,(31),1994,97-112中描述的方法。另外,可以提及在PCT专利申请公开号WO 00/09682中描述的方法。
在本发明中,“序列同一性”是指两个核苷酸序列或两个氨基酸序列之间的同源性和同一性。该“序列同一性”可以通过在测试序列的全区域比较两个序列,每个以最优状态对比来确定。同样,插入或缺失(例如缺口)可以用于测试核苷酸序列或氨基酸序列的最优对比。该序列同一性可以通过使用程序如FASTA(Pearson & Lipman,Proc.Natl.Acad.Sci.USA,4,2444-2448(1988)),BLAST(Altschul等,Journal of Molecular Biology,215,403-410(1990)),CLUSTAL W(Thompson,Higgins & Gibson,Nucleic AcidResearch,22,4673-4680(1994a))等的同源性分析进行的产生对比的步骤计算。这些程序例如可以典型地在日本DNA数据库(在日本信息生物学和DNA数据库中心运行的国际数据库)的网页(http://www.ddbj.nig.ac.jp)上利用。另外,序列同一性可以通过使用可商购的序列分析软件来确定。具体地例如,可以使用GENETYX-WIN第5版(Software DevelopmentCompany,Ltd.)通过Lipman-Pearson法(Lipman,DJ.和Pearson,W.R.,Science,227,1435-1441,(1985))的同源性分析产生对比来计算它。
关于(A7)所述的“严谨条件”,可以提及例如在按照如Sambrook,J.,Frisch,E.F.,和Maniatis,T.,Molecular Cloning第二版,Cold SpringHarbor Press所述的常规方法进行的杂交中杂交物在45℃下在包含6xSSC(使包含1.5M NaCl和0.15M柠檬酸三钠的溶液为10xSSC)的溶液中形成和然后在50℃下用2xSSC(Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6)洗涤杂交物的条件。可以例如从2xSSC(低严谨条件)的条件至0.2xSSC的条件(高严谨条件)中选择洗涤步骤中的盐浓度。可以例如从室温(低严谨条件)至65℃(高严谨条件)中选择洗涤步骤中的温度。备选地,盐浓度和温度都可以改变。
作为“在严谨条件下与包含编码在SEQ ID NO:1,SEQ ID NO:2,SEQID NO:3或SEQ ID NO:108中任何一个表示的氨基酸的核苷酸序列的DNA杂交”的DNA,具体地例如可以提及包含编码在SEQ ID NO:1,2,3,4,5,108,159,160,136,137,138,215,216,217,218,219,220,221,222,223或224中任何一个表示的氨基酸序列的核苷酸序列的DNA,包含在SEQ ID NO:6,7,8,78,84,109,139,140,141,142,143,225,226,227,228,229,230,231,232,233或234中任何一个表示的核苷酸序列的DNA等。还可提及包含与在SEQ ID NO:6,7,8,78,84,109,139,140,141,142,143,225,226,227,228,229,230,231,232,233或234中任何一个表示的核苷酸序列具有至少约60%同一性的核苷酸序列的DNA。
作为通过十二烷基硫酸钠-聚丙烯酰胺凝胶电泳(下文称为“SDS-PAGE”)鉴定的分子量,本发明蛋白质(A)的分子量约为30,000-60,000,典型地约40,000-50,000(比得上例如由在SEQ ID NO:1,2,3,108,159,160,136,137,138,215,216,217,218,219,220,221,222,223或224中任何一个表示的氨基酸序列组成的蛋白质)。另外,只要将化合物(II)转化为化合物(II)的能力未消除,本发明蛋白质(A)可以用作向其氨基末端上游或其羧基末端下游添加氨基酸序列的蛋白质。
作为本发明蛋白质(A)代谢式(I)的PPO抑制型除草化合物的能力的标志,可以提及将式(II)化合物转化为式(III)化合物的能力。该能力例如可以通过在包含电子供体如辅酶NADPH的电子传递体系的存在下将化合物(II)与本发明蛋白质(A)反应和通过检测产生的化合物(III)来证实。
“包含电子供体的电子传递体系”是指其中氧化还原链式反应发生和电子从电子供体转移至本发明蛋白质(A)的系统。作为电子供体,例如提及辅酶NADPH,NADH等。例如,作为可构成从NADPH至本发明蛋白质(A)的电子传递体系的蛋白质,提及铁氧还蛋白和铁氧还蛋白-NADP+还原酶,NADPH-细胞色素P-450还原酶,等。
为了证实将化合物(II)转化为化合物(III)的能力,例如将包含本发明蛋白质(A),β-NADPH,铁氧还蛋白,铁氧还蛋白-NADP+还原酶和用放射性同位素标记的化合物(II)的约pH7的反应溶液在约30℃下温育约10分钟至1小时。随后,在通过加入盐酸使反应溶液变成酸性以后,用乙酸乙酯萃取。在将回收的乙酸乙酯层进行薄层层析(下文称为“TLC”)后,进行放射自显影,通过检测标记的化合物(III)可以证实将化合物(II)转化为化合物(III)的能力。
为了制备本发明蛋白质(A),例如首先,按照常规遗传工程方法(例如,在Sambrook,J.,Frisch,E.F.,Maniatis,T.;Molecular Cloning第二版,Cold Spring Harbor Laboratory press中描述的方法)获得编码本发明蛋白质(A)的DNA(下文有时共同称为“本发明DNA(A)”)。
作为木发明DNA(A)的实例,可以提及编码本发明蛋白质(A)的DNA(以下有时称为“本发明DNA(A)”)。作为本发明DNA(A)的具体实例,可以提及:
编码包含SEQ ID NO:1所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A1)”);
编码包含SEQ ID NO:2所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A2)”);
编码包含SEQ ID NO:3所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A3)”);
编码包含SEQ ID NO:108所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A4)”);
编码包含SEQ ID NO:159所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A11)”);
编码包含SEQ ID NO:160所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A12)”);
编码包含SEQ ID NO:136所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A13)”);
编码包含SEQ ID NO:137所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A14)”);
编码包含SEQ ID NO:138所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A15)”);
编码包含SEQ ID NO:215所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A16)”);
编码包含SEQ ID NO:216所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A17)”);
编码包含SEQ ID NO:217所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A18)”);
编码包含SEQ ID NO:218所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A19)”);
编码包含SEQ ID NO:219所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A20)”);
编码包含SEQ ID NO:220所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A21)”);
编码包含SEQ ID NO:221所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A22)”);
编码包含SEQ ID NO:222所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A23)”);
编码包含SEQ ID NO:223所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A24)”);
编码包含SEQ ID NO:224所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(A25)”);等。
另外,作为本发明DNA(A)的更具体的实例,可以提及:
包含SEQ ID NO:6所示核苷酸序列的DNA;
包含SEQ ID NO:9所示核苷酸序列的DNA;
包含SEQ ID NO:7所示核苷酸序列的DNA;
包含SEQ ID NO:10所示核苷酸序列的DNA;
包含SEQ ID NO:8所示核苷酸序列的DNA;
包含SEQ ID NO:11所示核苷酸序列的DNA;
包含SEQ ID NO:109所示核苷酸序列的DNA;
包含SEQ ID NO:110所示核苷酸序列的DNA;
包含SEQ ID NO:139所示核苷酸序列的DNA;
包含SEQ ID NO:144所示核苷酸序列的DNA;
包含SEQ ID NO:140所示核苷酸序列的DNA;
包含SEQ ID NO:145所示核苷酸序列的DNA;
包含SEQ ID NO:141所示核苷酸序列的DNA;
包含SEQ ID NO:146所示核苷酸序列的DNA;
包含SEQ ID NO:142所示核苷酸序列的DNA;
包含SEQ ID NO:147所示核苷酸序列的DNA;
包含SEQ ID NO:143所示核苷酸序列的DNA;
包含SEQ ID NO:148所示核苷酸序列的DNA;
包含SEQ ID NO:225所示核苷酸序列的DNA;
包含SEQ ID NO:235所示核苷酸序列的DNA;
包含SEQ ID NO:226所示核苷酸序列的DNA;
包含SEQ ID NO:236所示核苷酸序列的DNA;
包含SEQ ID NO:227所示核苷酸序列的DNA;
包含SEQ ID NO:237所示核苷酸序列的DNA;
包含SEQ ID NO:228所示核苷酸序列的DNA;
包含SEQ ID NO:238所示核苷酸序列的DNA;
包含SEQ ID NO:229所示核苷酸序列的DNA;
包含SEQ ID NO:239所示核苷酸序列的DNA;
包含SEQ ID NO:230所示核苷酸序列的DNA;
包含SEQ ID NO:240所示核苷酸序列的DNA;
包含SEQ ID NO:231所示核苷酸序列的DNA;
包含SEQ ID NO:241所示核苷酸序列的DNA;
包含SEQ ID NO:232所示核苷酸序列的DNA;
包含SEQ ID NO:242所示核苷酸序列的DNA;
包含SEQ ID NO:233所示核苷酸序列的DNA;
包含SEQ ID NO:243所示核苷酸序列的DNA;
包含SEQ ID NO:234所示核苷酸序列的DNA;
包含SEQ ID NO:244所示核苷酸序列的DNA;
包含SEQ ID NO:214所示核苷酸序列的DNA;
包含SEQ ID NO:368所示核苷酸序列的DNA;
包含SEQ ID NO:393所示核苷酸序列的DNA;
编码具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力的蛋白质并且与在SEQ ID NO:6,7,8或109中任何一个表示的核苷酸序列具有至少80%序列同一性的DNA;
编码具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力的蛋白质并且与在SEQ ID NO:139,140,141,142,143,225,226,227,228,229,230,231,232,233或234中任何一个表示的核苷酸序列具有至少90%序列同一性的DNA;等。
另外,作为本发明DNA(A)的实例,除了以上本发明DNA(A)以外,提及:
包含编码蛋白质的核苷酸序列的DNA,所述蛋白质包含在SEQ ID NO:4中表示的氨基酸序列(下文有时称为“本发明DNA(A9)”);
包含SEQ ID NO:78所示核苷酸序列的DNA;
包含编码蛋白质的核苷酸序列的DNA,所述蛋白质包含在SEQ ID NO:5中表示的氨基酸序列(下文有时称为“本发明DNA(A10)”);
包含SEQ ID NO:84所示核苷酸序列的DNA;
包含SEQ ID NO:85所示核苷酸序列的DNA;等。
本发明DNA(A)例如,可以是从自然界中克隆的DNA或者可以是通过如定点诱变法,随机诱变法已经将核苷酸的缺失,替换或插入引入从自然界中克隆的DNA的DNA,和可以是人工合成的DNA。随后,本发明蛋白质(A)可以通过按照常规遗传工程方法表达获得的本发明DNA(A)来生产或获得。这样,可以制备本发明蛋白质(A)。
例如通过以下方法制备本发明DNA(A)。首先,通过常规遗传工程方法如在Molecular Cloning:A Laboratory Manual第二版(1989),Gold
Spring Harbor Laboratory Press;和Current Protocols in MolecularBiology(1987),John Wiley & Sons公司中描述的那些,从微生物中制备染色体DNA,所述微生物属于链霉菌属,如暗产色链霉菌,砖红色链霉菌,不产色链霉菌,浅灰链霉菌(Streptomyces griseolus),Streptomycescarbophilus,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌和斯堡链霉菌,更具体地,暗产色链霉菌IFO 12898,砖红色链霉菌ATCC 21469,不产色链霉菌IFO 12735,浅灰链霉菌ATCC 11796,Streptomycescarbophilus SANK62585,灰褐链霉菌IFO 12870t,热淡天蓝链霉菌IFO14273t,黑胡桃链霉菌IFO 13445,津岛链霉菌IFO 13782,球团产色链霉菌IFO 13673t,橄榄产色链霉菌IFO 12444,装饰链霉菌IFO 13069t,灰色链霉菌ATCC 10137,灰色链霉菌IFO 13849T,羊毛链霉菌IFO 12787T,三泽链霉菌IFO 13855T,苍白色链霉菌IFO 13434T,玫瑰变红链霉菌IFO13682T,鲁地链霉菌IFO 15875T和斯堡链霉菌IFO 13446T,等;或属于糖多孢菌属的微生物,如塔氏糖多孢菌,更具体地,塔氏糖多孢菌JCM9383t等。接下来,在用限制酶如Sau3AI部分消化染色体DNA以后,回收约2kb的DNA。按照在“Molecular Cloning:A Laboratory Manual第二版”(1989),Cold Spring Harbor Laboratory Press;和“Current Protocolsin Molecular Biology”(1987),John Wiley & Sons公司中描述的常规遗传工程方法将回收的DNA克隆到载体中。作为载体,具体地例如,可以利用pUC 119(TaKaRa Shuzo Company),pTVA 118N(Takara Shuzo Company),pBluescript II(Toyobo Company),pCR2.1-TOPO(Invitrogen),pTrc99A(Amersham Pharmacia Biotech Company),pKK331-1A(AmershamPharmacia Biotech Company),等。通过从获得的克隆中提取质粒可以获得染色体DNA文库。
本发明DNA(A)可以通过在下述条件下将探针与获得的染色体DNA文库杂交和通过检测和回收与探针特异性结合的DNA而获得。探针可以是由约至少20个核苷酸组成的DNA,所述核苷酸包含编码在SEQ IDNO:1,2,3或108中任何一个表示的氨基酸序列的核苷酸序列。作为可以用作探针的DNA的具体实例,提及包含在SEQ ID NO:6,7,8或109中任何一个表示的核酸的DNA;包含在SEQ ID NO:6,7,8或109中任何一个表示的核酸序列的部分核苷酸序列的DNA;包含与所述部分核苷酸序列互补的核苷酸序列的DNA;等。
用放射性同位素,荧光染色等标记用作探针的DNA。为了用放射性同位素标记DNA,例如可以使用Boehringer或Takara shuzo Company的随机标记试剂盒。另外,通过进行PCR可以制备用32P标记的DNA。将用于探针的DNA用作模板。用(α-32P)dCTP交换典型地用在PCR反应溶液中的dCTP。另外,当用荧光染色标记DNA时,例如可以使用DIG-High PrimeDNA labeling和Detection Starter试剂盒II(Roche Company)。
接下来说明制备探针的具体实例。例如,通过将从如上所述的暗产色链霉菌IFO 12898制备的染色体DNA或染色体DNA文库用作模板,通过将由SEQ ID NO:93所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:94所示核苷酸序列组成的寡核苷酸用作引物,和通过如下述实例所述使用例如PCR DIG探针合成试剂盒(Roche Diagnostics GmbH)按照附装的手册进行PCR,可以获得包含SEQ ID NO:6所示的全长核苷酸序列、用洋地黄毒苷标记的DNA。类似地,通过将从如上所述的暗产色链霉菌IFO 12898制备的染色体DNA或染色体DNA文库用作模板,可以获得包含在SEQ IDNO:6中表示的从核苷酸57至核苷酸730的核苷酸序列、用洋地黄毒苷标记的DNA。作为引物,使用由SEQ ID NO:130所示的核苷酸序列组成的寡核苷酸和由SEQ ID NO:131所示的核苷酸序列组成的寡核苷酸进行PCR。另外,通过将从如上所述的塔氏糖多孢菌JCM 9383t制备的染色体DNA或染色体DNA文库用作模板,可以获得包含SEQ ID NO:7所示的全长核苷酸序列、用洋地黄毒苷标记的DNA。作为引物,使用由SEQ IDNO:61所示的核苷酸序列组成的寡核苷酸和由SEQ ID NO:62所示的核苷酸序列组成的寡核苷酸进行PCR。另外,通过将从如上所述的砖红色链霉菌ATCC 21469制备的染色体DNA或染色体DNA文库用作模板,可以获得包含SEQ ID NO:8所示的全长核苷酸序列、用洋地黄毒苷标记的DNA。作为引物,使用由SEQ ID NO:70所示的核苷酸序列组成的寡核苷酸和由SEQ ID NO:71所示的核苷酸序列组成的寡核苷酸进行PCR。另外,通过将从如上所述的砖红色链霉菌ATCC 21469制备的染色体DNA或染色体DNA文库用作模板,可以获得包含在SEQ ID NO:8中表示的从核苷酸21至核苷酸691的核苷酸序列、用洋地黄毒苷标记的DNA。作为引物,使用由SEQ ID NO:132所示的核苷酸序列组成的寡核苷酸和由SEQ IDNO:133所示的核苷酸序列组成的寡核苷酸进行PCR。
使探针与染色体DNA文库杂交的方法可包括菌落杂交和噬菌斑杂交,可以选择与文库制备所用载体的类型相容的适当方法。当所用文库是使用质粒载体构建时,进行菌落杂交。具体地,首先,通过将文库的DNA引入其中用于构建文库的载体可以复制的微生物获得转化体。稀释获得的转化体,涂布在琼脂平板上和培养直至菌落出现。当将噬菌体载体用于构建文库,进行噬菌斑杂交。具体地,首先,在侵染可能的条件下,将其中用于产生文库的噬菌体载体可以复制的微生物与文库的噬菌体混合。然后将混合物进一步与软琼脂混合。然后将该混合物涂布在琼脂平板上。随后,培养混合物直至噬菌斑出现。
接下来,在任一上述杂交的情形中,将膜放置在其中进行上述培养的琼脂板表面,将转化体的菌落或噬菌斑中的噬菌体颗粒转移到膜上。在碱处理膜后,进行中和处理。然后将从转化体或噬菌体颗粒洗脱的DNA固定在膜上。更具体地,例如在噬菌斑杂交的事件中,通过将硝化纤维膜或尼龙膜,具体地例如Hybond-N+(Amersham Pharmacia Biotech Company)放置在琼脂板上并等待1分钟将噬菌体颗粒吸收在膜上。将膜浸泡在碱性溶液(1.5M NaCl和0.5N NaOH)中约3分钟以溶解噬菌体颗粒和将噬菌体DNA洗脱到膜上。然后将膜浸泡在中和溶液(1.5M NaCl和0.5Mtris-HCl缓冲液pH7.5)中约5分钟。在洗涤溶液(0.3M NaCl,30mM柠檬酸钠,0.2M tris-HCl缓冲液pH7.5)中洗涤膜约5分钟,例如通过在真空中在约80℃下温育约90分钟将噬菌体DNA固定在膜上。
通过使用如此制备的膜,使用上述DNA作为探针进行杂交。例如可以按照“Molecular Cloning:A Laboratory Manual第二版(1989)”,ColdSpring Harbor Laboratory Press等中的描述进行杂交。
尽管可提供各种温度条件和试剂进行杂交,将如上所述制备的膜在42℃至65℃下浸泡和保持在以50μ1-200μl/1cm2膜的比率制备的预杂交液中1小时至4小时。预杂交液例如可以包含450mM至900mM NaCl和45mM至90mM柠檬酸钠,包含浓度为0.1%-1.0%的十二烷基硫酸钠(下文称为“SDS”),和包含浓度为0μg/ml-200μg/ml的变性的非特异性DNA,并可以有时包含各自浓度为0%-0.2%的清蛋白,phycol和聚乙烯吡咯烷酮。随后,例如将膜在42℃至65℃下浸泡和保持在以50μl-200μl/1cm2膜的比率制备的杂交液中12小时至20小时。杂交液是例如预杂交液和以上述制备方法获得的探针(相对数量为1.0×104cpm-2.0×106cpm/1cm2膜)的混合物,该预杂交液可以包含450mM至900mM NaCl和45mM至90mM柠檬酸钠,包含浓度为0.1%-1.0%的SDS,和包含浓度为0μg/ml-200μg/ml的变性的非特异性DNA,并可以有时包含各自浓度为0%-0.2%的清蛋白,phycol和聚乙烯吡咯烷酮。随后,移开膜并使用包含15mM-300mM NaCl,1.5mM-30mM柠檬酸钠和0.1%-1.0%SDS的42℃-65℃洗涤液进行5分钟至15分钟的洗涤约2-4次。此外,在用2x SSC溶液(300mM NaCl和30mM柠檬酸钠)轻轻漂洗后,将膜干燥。通过将膜进行放射自显影检测探针在膜上的位置,鉴定膜上与所用探针杂交的DNA的位置。备选地,预杂交和杂交可以使用可商购的杂交试剂盒,如使用包含在DIG-HighPrime DNA Labeling & Detection Starter试剂盒II(Roche)中的杂交液进行。在杂交后,例如,在包含0.1% SDS的2x SSC中在室温下洗涤膜两次5分钟,接着在包含0.1% SDS的0.5x SSC中在65℃下洗涤膜两次15分钟。通过再用包含在试剂盒中的检测液处理洗涤的膜和通过检测膜上探针的位置来检测在膜上与所用探针杂交的DNA的位置。
在原始的琼脂培养基上鉴定对应于膜上检测的DNA的位置的克隆,其可以被挑取来分离携带那些DNA的克隆。
可以按照“Molecular Cloning:ALaboratory Manual第二版”(1989),Cold Spring Harbor Laboratory Press,“Current Protocols in MolecularBiology”(1987),John Wiley & Sons Incorporated等所述的常规遗传工程方法将按照以上获得的本发明DNA(A)克隆到载体中。作为载体,具体地例如,可以使用pUCA 119(Takara Shuzo Company),pTVA118N(TakaraShuzo Company),pBluescript II(Toyobo Company),pCR2.1-TOPO(Invitrogen Company),pTrc99A(Pharmacia Company),pKK331-1A(Pharmacia Company)等。
另外,按照上述获得的本发明DNA(A)的核苷酸序列可以通过在F.Sanger,S.Nicklen,A.R.Coulson,Proceeding of National Academy of ScienceU.S.A.(1977)74:5463-5467中所述的双脱氧终止法分析。在核苷酸序列分析的样品制备中,可以使用可商购试剂,如Perkin Elmer公司的ABI PRISM染料终止循环测序简易反应试剂盒。
还可以如下制备本发明DNA(A)。可以通过进行PCR扩增本发明DNA(A)。PCR可以使用如上所述从微生物制备的染色体DNA或染色体DNA文库作为模板,所述微生物属于链霉菌属,如暗产色链霉菌,砖红色链霉菌,不产色链霉菌,浅灰链霉菌,Streptomyces carbophilus,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌和斯堡链霉菌,更具体地,暗产色链霉菌IFO 12898,砖红色链霉菌ATCC 21469,不产色链霉菌IFO12735,浅灰链霉菌ATCC 11796,Streptomyces carbophilus SANK62585,灰褐链霉菌IFO 12870t,热淡天蓝链霉菌IFO 14273t,黑胡桃链霉菌IFO13445,津岛链霉菌IFO 13782,球团产色链霉菌IFO 13673t,橄榄产色链霉菌IFO 12444,装饰链霉菌IFO 13069t,灰色链霉菌ATCC 10137,灰色链霉菌IFO 13849T,羊毛链霉菌IFO 12787T,三泽链霉菌IFO 13855T,苍白色链霉菌IFO 13434T,玫瑰变红链霉菌IFO 13682T,鲁地链霉菌IFO15875T和斯堡链霉菌IFO 13446T,等;或属于糖多孢菌属的微生物,如塔氏糖多孢菌,更具体地,塔氏糖多孢菌JCM 9383t等。PCR还可使用包含编码SEQ ID NO:1,2,3,4,5,108,159,160,136,137,138,215,216,217,218,219,220,221,222,223或224中任何一个所示氨基酸序列的核苷酸序列的5’末端至少约20个核苷酸的寡核苷酸,和包含与编码上述氨基酸序列中任何一个的核苷酸序列邻进3’末端或3’末端下游的至少约20个核苷酸互补的核苷酸序列的寡核苷酸。PCR可以在下述条件下进行。在上述用于PCR的引物的5’末端侧,可以增加限制酶识别序列。
更具体地例如,通过使用从暗产色链霉菌IFO 12898制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:51所示核苷酸序列的寡核苷酸和包含SEQ ID NO:52所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含编码SEQ ID NO:1所示氨基酸序列的核苷酸序列的DNA,包含SEQ ID NO:6所示核苷酸序列的DNA等。备选地,通过使用包含SEQ ID NO:51所示核苷酸序列的寡核苷酸和包含SEQID NO:53所示核苷酸序列的寡核苷酸作为引物进行PCR可以扩增包含SEQ ID NO:9(包含编码SEQ ID NO:1所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用从塔氏糖多孢菌JCM 9383t制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:61所示核苷酸序列的寡核苷酸和包含SEQ ID NO:62所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含编码SEQ ID NO:2所示氨基酸序列的核苷酸序列的DNA,包含SEQ ID NO:7所示核苷酸序列的DNA等。备选地,通过使用包含SEQ ID NO:61所示核苷酸序列的寡核苷酸和包含SEQ ID NO:63所示核苷酸序列的寡核苷酸作为引物进行PCR可以扩增包含SEQ IDNO:10(包含编码SEQ ID NO:2所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用从不产色链霉菌IFO 12735制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:119所示核苷酸序列的寡核苷酸和包含SEQ ID NO:120所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含编码SEQ ID NO:108所示氨基酸序列的核苷酸序列的DNA,包含SEQ ID NO:109所示核苷酸序列的DNA等。备选地,通过使用包含SEQ ID NO:119所示核苷酸序列的寡核苷酸和包含SEQ IDNO:121所示核苷酸序列的寡核苷酸作为引物进行PCR可以扩增包含SEQID NO:110(包含编码SEQ ID NO:108所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用从黑胡桃链霉菌IFO 13445制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:165所示核苷酸序列的寡核苷酸和包含SEQ ID NO:166所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含SEQ ID NO:144(包含编码SEQ ID NO:159所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用从津岛链霉菌IFO 13782制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:171所示核苷酸序列的寡核苷酸和包含SEQ ID NO:172所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含SEQ ID NO:145(包含编码SEQ ID NO:160所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用从热淡天蓝链霉菌IFO 14273t制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:177所示核苷酸序列的寡核苷酸和包含SEQ ID NO:178所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含SEQ ID NO:146(包含编码SEQ ID NO:136所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用从球团产色链霉菌IFO 13673t制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:183所示核苷酸序列的寡核苷酸和包含SEQ ID NO:184所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含SEQ ID NO:147(包含编码SEQ ID NO:137所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用从橄榄产色链霉菌IFO 12444制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:184所示核苷酸序列的寡核苷酸和包含SEQ ID NO:185所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含SEQ ID NO:148(包含编码SEQ ID NO:138所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
当将其中将染色体DNA引入载体的DNA文库用作模板时,例如,还可通过使用包含选自编码SEQ ID NO:1,2,3,4,5,108,159,160,136,137或138中所示任何一个氨基酸序列的核苷酸序列的核苷酸序列的寡核苷酸(例如包含编码SEQ ID NO:1所示氨基酸序列的核苷酸序列5’末端侧至少约20个核苷酸的核苷酸序列的寡核苷酸),和包含与邻近用于构建文库的载体DNA插入位点的核苷酸序列互补的核苷酸序列的至少约20个核苷酸的寡核苷酸作为引物进行PCR来扩增本发明DNA(A)。在如上所述用于PCR的引物的5’末端侧,可以加入限制酶识别序列。
关于上述这种PCR的条件,具体地例如,可以提及以下条件:保持97℃ 2分钟,然后重复10个循环,一个循环包括保持97℃ 15秒,接着65℃ 30秒,然后72℃ 2分钟;然后进行15个循环,一个循环包括保持97℃ 15秒,接着68℃ 30秒,和接着72℃ 2分钟(依次每个循环增加20秒);和然后保持在72℃ 7分钟。PCR可以使用50μl的反应溶液,其包含50ng染色体DNA,包含上述配对的2种引物各自300nM,包含5.0μl dNTP混合物(4种dNTP每种2.0mM的混合物),包含5.0μl 10x ExpandHF缓冲液(包含MgCl2,Roche Molecular Biochemicals Company)和包含0.75μl Expand HiFi酶混合物(Roche Molecular Biochemicals Company)。
备选地,可以提及以下条件:保持97℃ 2分钟,然后重复30个循环,一个循环包括97℃ 15秒,接着60℃ 30秒,接着72℃ 90秒,然后保持反应溶液在72℃ 4分钟。PCR可以使用50μl的反应溶液,其包含250ng染色体DNA,包含上述配对的2种引物各自200nM,包含5.0μl dNTP混合物(4种dNTP每种2.5mM的混合物),5.0μl 10x ExTaq缓冲液(包含MgCl2,Takara Shuzo Company)和包含0.5μl ExTaq聚合酶(Takara ShuzoCompany)。
备选地,例如基于在SEQ ID NO:6,7,8或109所示核苷酸序列中序列同一性特别高的区域的核苷酸序列,可以设计和制备用作引物的寡核苷酸。本发明DNA(A)还可以通过使用获得的寡核苷酸作为引物和染色体DNA或染色体DNA文库来进行PCR而获得。可以如上所述从微生物中制备染色体DNA或染色体DNA文库,所述微生物属于链霉菌属,如暗产色链霉菌,砖红色链霉菌,不产色链霉菌,浅灰链霉菌,Streptomycescarbophilus,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌和斯堡链霉菌,更具体地,暗产色链霉菌IFO 12898,砖红色链霉菌ATCC 21469,不产色链霉菌IFO 12735,浅灰链霉菌ATCC 11796,Streptomycescarbophilus SANK62585,灰褐链霉菌IFO 12870t,热淡天蓝链霉菌IFO14273t,黑胡桃链霉菌IFO 13445,津岛链霉菌IFO 13782,球团产色链霉菌IFO 13673t,橄榄产色链霉菌IFO 12444,装饰链霉菌IFO 13069t,灰色链霉菌ATCC 10137,灰色链霉菌IFO 13849T,羊毛链霉菌IFO 12787T,三泽链霉菌IFO 13855T,苍白色链霉菌IFO 13434T,玫瑰变红链霉菌IFO13682T,鲁地链霉菌IFO 15875T和斯堡链霉菌IFO 13446T,等;或属于糖多孢菌属的微生物,如塔氏糖多孢菌,更具体地,塔氏糖多孢菌JCM9383t等。关于“在SEQ ID NO:6,7,8或109所示核苷酸序列中序列同一性特别高的区域”,例如,提及对应于SEQ ID NO:6所示核苷酸序列中核苷酸290-315,458-485,496-525或1046-1073中每一个所示区域的区域。关于基于这些核苷酸序列区域设计的引物,例如,可以提及包含SEQ IDNO:124-129中任何一个所示核苷酸序列的引物。
SEQ ID NO:124;基于对应于以上核苷酸290-315所示区域的区域的核苷酸序列;
SEQ ID NO:125;基于对应于以上核苷酸458-485所示区域的区域的核苷酸序列;
SEQ ID NO:126;基于对应于以上核苷酸458-485所示区域的区域的核苷酸序列;
SEQ ID NO:127;基于对应于以上核苷酸496-525所示区域的区域的核苷酸序列;
SEQ ID NO:128;基于对应于以上核苷酸496-525所示区域的区域的核苷酸序列;和
SEQ ID NO:129;基于对应于以上核苷酸1046-1073所示区域的区域的核苷酸序列。
例如,通过使用包含SEQ ID NO:124所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸的配对作为引物扩增约800bp的DNA。通过使用包含SEQ ID NO:125所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸的配对作为引物扩增约600bp的DNA。通过使用包含SEQ ID NO:126所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸的配对作为引物扩增约600bp的DNA。通过使用包含SEQ ID NO:127所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸的配对作为引物扩增约580bp的DNA。另外,通过使用包含SEQ ID NO:128所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸的配对作为引物扩增约580bp的DNA。
关于PCR条件,具体地例如,提及以下条件:保持95℃ 1分钟;重复30个循环,一个循环包括保持94℃ 15秒,接着60℃ 30秒,然后72℃ 1分钟;然后保持在72℃ 5分钟。可以使用25μl的反应溶液,其包含10ng染色体DNA,包含2种引物各自200nM,包含0.5μl dNTP混合物(4种dNTP每种10mM的混合物),包含5μl 5x GC基因组PCR反应缓冲液,其包含5μl 5M GC-Melt和包含0.5μl Advantage-GC基因组聚合酶混合物(Clontech Company)。
通过回收如上所述扩增的DNA,可以获得包含本发明DNA(A)部分核苷酸序列的DNA。接下来,基于获得的“包含本发明DNA(A)部分核苷酸序列的DNA”具有的核苷酸序列,设计和制备包含所述核苷酸序列至少约20个核苷酸的部分核苷酸序列的寡核苷酸,或包含与所述核苷酸序列至少约20个核苷酸的部分核苷酸序列互补的核苷酸序列的寡核苷酸。通过进行PCR可以获得包含延伸如上所述获得的“包含本发明DNA(A)部分核苷酸序列的DNA”的3’末端下游或5’末端上游的本发明DNA(A)的部分核苷酸序列的DNA。PCR可以使用如上所述基于“包含本发明DNA(A)的部分核苷酸序列的DNA”的核苷酸序列制备的寡核苷酸和包含与用于构建上述文库的载体的DNA插入位点相邻区域的核苷酸序列的至少约20个核苷酸的寡核苷酸或者包含与其核苷酸序列互补的核苷酸序列的至少约20bp的寡核苷酸的配对作为引物。PCR可以例如使用从微生物中制备的染色体DNA文库作为模板,如上所述该微生物具有将化合物(II)转化为化合物(III)的能力。通过连接这种包含本发明DNA(A)部分核苷酸序列的DNA,可以获得本发明DNA(A)。在该生产方法中,可以使用可商购试剂盒,如Universal Genome Walker(Clontech Company)。备选地,通过基于如上所述连接本发明DNA(A)的部分核苷酸序列获得的本发明DNA(A)的全长核苷酸序列制备引物,通过使用该引物和通过使用如上述染色体DNA文库作为模板来进行PCR可以获得本发明DNA(A)。
例如,通过使用由黑胡桃链霉菌IFO 13445制备的染色体DNA或染色体DNA文库作为模板和通过使用包含SEQ ID NO:124所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸作为引物来进行PCR,可以制备包含SEQ ID NO:139的核苷酸316-1048(编码SEQ IDNO:159所示氨基酸序列的核苷酸序列的部分核苷酸序列)所示核苷酸序列的DNA。基于获得的DNA的核苷酸序列,依照上述获得包含延伸其3’末端下游或5’末端上游的核苷酸序列的DNA。通过连接产生的DNA可以获得包含SEQ ID NO:144(包含编码SEQ ID NO:159所示氨基酸序列的核苷酸序列和编码SEQ ID NO:149所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用由津岛链霉菌IFO 13782制备的染色体DNA或染色体DNA文库作为模板和通过使用包含SEQ ID NO:124所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸作为引物来进行PCR,可以制备包含SEQ ID NO:140的核苷酸364-1096(编码SEQ IDNO:160所示氨基酸序列的核苷酸序列的部分核苷酸序列)所示核苷酸序列的DNA。基于获得的DNA的核苷酸序列,按照以上描述获得包含延伸其3’末端下游或5’末端上游的核苷酸序列的DNA。通过连接产生的DNA可以获得包含SEQ ID NO:145(包含编码SEQ ID NO:150所示氨基酸序列的核苷酸序列和编码SEQ ID NO:160所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用由热淡天蓝链霉菌IFO 14273t制备的染色体DNA或染色体DNA文库作为模板和通过使用包含SEQ ID NO:124所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸作为引物来进行PCR,可以制备包含SEQ ID NO:141的核苷酸295-1027(编码SEQ ID NO:136所示氨基酸序列的核苷酸序列的部分核苷酸序列)所示核苷酸序列的DNA。基于获得的DNA的核苷酸序列,按照以上描述获得包含延伸其3’末端下游或5’末端上游的核苷酸序列的DNA。通过连接产生的DNA可以获得包含SEQ ID NO:146(包含编码SEQ ID NO:136所示氨基酸序列的核苷酸序列和编码SEQ ID NO:151所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用由球团产色链霉菌IFO 13673t制备的染色体DNA或染色体DNA文库作为模板和通过使用包含SEQ ID NO:124所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸作为引物来进行PCR,可以制备包含SEQ ID NO:142的核苷酸316-1048(编码SEQ ID NO:137所示氨基酸序列的核苷酸序列的部分核苷酸序列)所示核苷酸序列的DNA。基于获得的DNA的核苷酸序列,按照以上描述获得包含延伸其3’末端下游或5’末端上游的核苷酸序列的DNA。通过连接产生的DNA可以获得包含SEQ ID NO:147(包含编码SEQ ID NO:137所示氨基酸序列的核苷酸序列和编码SEQ ID NO:152所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用由橄榄产色链霉菌IFO 12444制备的染色体DNA或染色体DNA文库作为模板和通过使用包含SEQ ID NO:124所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸作为引物来进行PCR,可以制备包含SEQ ID NO:143的核苷酸316-1048(编码SEQID NO:138所示氨基酸序列的核苷酸序列的部分核苷酸序列)所示核苷酸序列的DNA。基于获得的DNA的核苷酸序列,按照以上描述获得包含延伸其3’末端下游或5’末端上游的核苷酸序列的DNA。通过连接产生的DNA可以获得包含SEQ ID NO:148(包含编码SEQ ID NO:138所示氨基酸序列的核苷酸序列和编码SEQ ID NO:153所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用由玫瑰变红链霉菌IFO 13682T制备的染色体DNA或染色体DNA文库作为模板和通过使用包含SEQ ID NO:124所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸作为引物来进行PCR,可以制备包含SEQ ID NO:232的核苷酸289-1015(编码SEQ ID NO:222所示氨基酸序列的核苷酸序列的部分核苷酸序列)所示核苷酸序列的DNA。基于获得的DNA的核苷酸序列,按照以上描述获得包含延伸其3’末端下游或5’末端上游的核苷酸序列的DNA。通过连接产生的DNA可以获得包含SEQ ID NO:242(包含编码SEQ ID NO:232所示氨基酸序列的核苷酸序列和编码SEQ ID NO:252所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
例如,通过使用由斯堡链霉菌IFO 13446T制备的染色体DNA或染色体DNA文库作为模板和通过使用包含SEQ ID NO:124所示核苷酸序列的寡核苷酸和包含SEQ ID NO:129所示核苷酸序列的寡核苷酸作为引物来进行PCR,可以制备包含SEQ ID NO:234的核苷酸289-1015(编码SEQ IDNO:224所示氨基酸序列的核苷酸序列的部分核苷酸序列)所示核苷酸序列的DNA。基于获得的DNA的核苷酸序列,按照以上描述获得包含延伸其3’末端下游或5’末端上游的核苷酸序列的DNA。通过连接产生的DNA可以获得包含SEQ ID NO:244(包含编码SEQ ID NO:234所示氨基酸序列的核苷酸序列和编码SEQ ID NO:254所示氨基酸序列的核苷酸序列)所示核苷酸序列的DNA。
通过按照“Molecular Cloning:A Laboratory Manual第二版”(1989),Cold Spring Harbor Laboratory Press,“Current Protocols in MolecularBiology”(1987),John Wiley & Sons公司等所述的常规遗传工程方法可以将通过使用上述PCR获得的本发明DNA(A)克隆于载体中。具体地例如,可以通过使用质粒载体如Strategene公司的pBluescript II或包含于Invitrogen公司的TA克隆试剂盒中的质粒载体进行克隆。
另外,例如如下所述可以制备本发明DNA(A)。首先,设计核苷酸序列。该核苷酸序列编码由本发明DNA(A)编码的蛋白质的氨基酸序列。该核苷酸序列具有至多60%和至少40%,优选至多55%和至少45%的GC含量。编码上述蛋白质氨基酸序列的核苷酸序列中密码子使用在来自引入本发明DNA(A)的宿主细胞物种的基因中密码子使用±4%的范围内。通过按照常规遗传工程方法制备具有设计的核苷酸序列的DNA,可以获得本发明DNA(A)。
例如,以下面所述方法可以设计编码本发明蛋白质(A1)的氨基酸序列(SEQ ID NO:1)和具有至多55%和至少45%GC含量的核苷酸序列,其中编码上述蛋白质的氨基酸序列的核苷酸序列中的密码子是在大豆基因中密码子使用±4%的范围内。首先,例如,比较编码可以获自暗产色链霉菌IFO 12898的本发明蛋白质(A1)氨基酸序列的核苷酸序列(SEQ IDNO:6)中的密码子使用(表22和表23)和大豆密码子使用(表24和表25)。基于比较的结果,将核苷酸替代加入SEQ ID NO:6所示核苷酸序列,以使GC含量至多55%和至少45%并且密码子使用是在大豆密码子使用±4%的范围内。作为该核苷酸替代,选择不导致氨基酸替代的核苷酸替代。例如,编码亮氨酸的CTG密码子的使用在大豆基因中为1.22%和在SEQ IDNO:6所示核苷酸序列中为7.09%。同样,例如将从SEQ ID NO:6所示核苷酸序列的核苷酸106,163,181,226,289,292,544,1111,和1210起始的CTG密码子中的每一个替代成CTT密码子;将从核苷酸211,547和1084起始的CTG密码子中的每一个替代成CTA密码子;将从核苷酸334起始的CTG密码子替代成TTA密码子;将从核苷酸664,718,733,772,835,1120和1141起始的CTG密码子中的每一个替代成TTG密码子;和将从核苷酸787起始的CTG密码子替代成TTA密码子。如此设计的核苷酸序列的一个序列在SEQ ID NO:214中表示,其中密码子的使用在表26和表27中显示。在SEQ ID NO:214所示的核苷酸序列中,例如,编码亮氨酸的CTG密码子的使用是1.71%并且在大豆密码子使用(1.22%)±4%的范围内。按照如Sambrook,J.,Frisch,E.F.,和Maniatis,T.;Molecular Cloning第二版,Cold Spring Harbor Press所述定点诱变法,可以通过将核苷酸替代引入具有SEQ ID NO:6所示核苷酸序列的DNA制备包含SEQ ID NO:214所示核苷酸序列的DNA。备选地,通过使用以下实施例46中所述PCR的DNA合成方法可以制备具有SEQ ID NO:214所示核苷酸序列的DNA。
类似地,SEQ ID NO:368所示核苷酸序列是设计编码本发明蛋白质(A23)的氨基酸序列(SEQ ID NO:222)和具有至多55%和至少45%GC含量的核苷酸序列的实例,其中编码上述蛋白质氨基酸序列的核苷酸序列中的密码子使用是在大豆基因密码子使用±4%的范围内。另外,SEQ ID NO:393所示核苷酸序列是设计编码本发明蛋白质(A25)的氨基酸序列(SEQID NO:224)和具有至多55%和至少45% GC含量的核苷酸序列的实例,其中编码上述蛋白质氨基酸序列的核苷酸序列中的密码子使用是在大豆基因密码子使用±4%的范围内。
按照如Sambrook,J.,Frisch,E.F.,和Maniatis,T.;“Molecular Cloning第二版”(1989),Cold Spring Harbor Press;“Current Protocols inMolecular Biology”(1987),John Wiley & Sons公司等所述常规遗传工程方法将如此获得的本发明DNA(A)克隆到载体中。作为载体,具体地例如,可以利用pUC 119(TaKaRa Shuzo Company),pTVA 118N(Takara ShuzoCompany),pBluescript II(Toyobo Company),pCR2.1-TOPO(Invitrogen),pTrc99A(Pharmacia Company),pKK331-1A(Pharmacia Company),等。
另外,如此获得的本发明DNA(A)的核苷酸序列可以通过F.Sanger,S.Nicklen,A.R.Coulson,Proceeding of National Academy of Science U.S.A.(1977)74:5463-5467所述的双脱氧终止法分析。
以下述方法用作为标记的将化合物(II)转化为化合物(III)的能力可以证实由上述方法获得的本发明DNA(A)编码的本发明蛋白质(A)的代谢式(I)PPO抑制型除草化合物的能力。首先,如下所述,将所述DNA插入载体以使它连接在可以在宿主细胞中起作用的启动子的下游,并导入宿主细胞获得转化体。接下来,在包含电子供体如辅酶NDAPH的电子传递体系的存在下,将转化体的培养物或获自破坏培养物的提取物与化合物(II)反应。分析从中产生的反应产物以检测化合物(III)。如此,可以检测具有代谢化合物(II)和产生化合物(III)的能力的转化体,确定该转化体具有编码具有该能力的蛋白质的本发明DNA(A)。更具体地例如,制备由0.1M磷酸钾缓冲液(pH7.0)组成的30μl反应溶液,其包含上述转化体的培养物或提取物,电子供体如终浓度约2mM的β-NADPH,终浓度约2mg/ml的来源于菠菜的铁氧还蛋白,终浓度约0.1U/ml的铁氧还蛋白还原酶和3ppm用放射性同位素标记的化合物(II)。将反应液在约30℃至40℃下温育10分钟至1小时。在该温育后,加入3μl2N HCl和90μl乙酸乙酯,搅拌并在8,000g下离心以回收上清液。在真空中干燥上清液以后,将残余物溶解在乙酸乙酯中并在TLC硅胶板上展开获得的溶液。通过放射自显影分析TLC板。通过鉴定对应于用放射性同位素标记的化合物(III)的斑点可以证实将化合物(II)转化为化合物(III)的能力。
使用本发明DNA(A)或包含所述DNA的部分核苷酸序列或与部分核苷酸序列互补的核苷酸序列的多核苷酸,通过进行如上所述的杂交或PCR可以进一步搜索编码具有将化合物(II)转化为化合物(III)的能力的蛋白质的DNA或具有该DNA的微生物。
具体地例如,进行如上所述的杂交和鉴定与探针杂交的DNA。使用本发明DNA(A)或包含本发明DNA(A)的部分核苷酸序列或与部分核苷酸序列互补的核苷酸序列的多核苷酸作为探针,和来源于天然微生物的基因组DNA进行杂交,例如,所述微生物属于链霉菌属,如暗产色链霉菌,砖红色链霉菌,不产色链霉菌,浅灰链霉菌,Streptomyces carbophilus,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌和斯堡链霉菌;所述微生物属于糖多孢菌属,如塔氏糖多孢菌;等。作为可以用作探针的DNA的具体实例,可以提及包含SEQ ID NO:6,7,8,109,139,140,141,142,143,225,226,227,228,229,230,231,232,233或234任一个所示的全长核苷酸序列的DNA,包含SEQ ID NO:6所示核苷酸序列的核苷酸57-730所示核苷酸序列的DNA;包含SEQ ID NO:8所示核苷酸序列的核苷酸21-691所示核苷酸序列的DNA;等。
备选地,如上所述可以进行PCR和可以检测扩增的DNA。PCR使用包含本发明DNA(A)的部分核苷酸序列或与部分核苷酸序列互补的核苷酸序列的多核苷酸。PCR使用来源于天然微生物的基因组DNA作为模板,例如,所述微生物属于链霉菌属,如暗产色链霉菌,砖红色链霉菌,不产色链霉菌,浅灰链霉菌,Streptomyces carbophilus,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌和斯堡链霉菌;所述微生物属于糖多孢菌属,如塔氏糖多孢菌;等。作为引物,可以提及基于如上所述“在SEQ ID NO:6,7,8或109所示核苷酸序列中序列同一性特别高的区域”的核苷酸序列设计的引物。作为引物更具体的实例,提及包含SEQ ID NO:124至128中任何一个所示核苷酸序列的引物和包含SEQ ID NO:129所示核苷酸序列的引物的配对。
回收如此检测的DNA。当回收的DNA不包含本发明DNA(A)的全长核苷酸序列时,以上述方式将该DNA使用和制备成对应于全长核苷酸序列的DNA。将获得的DNA导入宿主细胞以产生转化体。通过使用获得的转化体的培养物和以上述方法测量将化合物(II)转化为化合物(III)的能力可以评估由导入转化体的DNA编码的蛋白质将化合物(II)转化为化合物(III)的能力。
为了在宿主细胞中表达本发明DNA(A),将本发明DNA(A)导入宿主细胞中能够使它在所述细胞中表达的位置。通过将本发明DNA(A)导入“能使它表达的位置”,它是指将本发明DNA(A)导入宿主细胞以使它处于与指导从其核苷酸序列转录和翻译的核苷酸序列相邻的位置(即例如,促进本发明蛋白质(A)和编码本发明蛋白质(A)的RNA生产的核苷酸序列)。
为了将本发明DNA(A)导入宿主细胞以使它位于能使它表达的位置,例如,将其中本发明DNA(A)和在宿主细胞中起作用的启动子可操作连接的DNA导入宿主细胞。这里术语“可操作连接”是指其中本发明DNA(A)与启动子连接以致当将DNA导入宿主细胞中时它在启动子的控制下表达的情形。
当宿主细胞是微生物细胞时,作为起作用的启动子,例如可以提及大肠杆菌乳糖操纵子的启动子,大肠杆菌色氨酸操纵子的启动子,T7噬菌体启动子或在大肠杆菌中起作用的人造启动子,如tac启动子或trc启动子等。另外,可以利用在属于链霉菌属或糖多孢菌属的微生物的染色体中原来位于本发明DNA(A)上游的启动子。
当宿主细胞是植物细胞时,作为起作用的启动子,例如提及T-DNA衍生的组成型启动子,如胭脂碱合酶基因的启动子和章鱼碱合酶基因启动子;植物病毒衍生的启动子如花椰菜花叶病毒衍生的19S和35S启动子;可诱导的启动子如苯丙氨酸氨裂解酶基因的启动子,查耳酮合酶基因的启动子和致病相关的蛋白质基因的启动子;日本未审查的专利公开号2000-166577所述的植物启动子。另外,可以将在植物细胞中起作用的终止子连接到其中在植物细胞中起作用的启动子和本发明DNA(A)被可操作连接的DNA上。在该情形中,通常优选将终止子连接到本发明DNA(A)的下游。作为起作用的终止子,例如提及T-DNA衍生的组成型终止子如胭脂碱合酶基因(NOS)的终止子;植物病毒衍生的终止子如葱属病毒GVl或GV2的终止子;在日本未审查的专利公开号2000-166577中所述的植物终止子;等。
当导入本发明DNA(A)以使DNA处于能使它表达的位置时,例如可以使用含有编码转运至胞内细胞器的信号的核苷酸序列的DNA,其连接到本发明DNA(A)的上游以使可读框在框内。通过连接“以使可读框在框内”它是指将对胞内细胞器的转运信号的序列的可读框和本发明DNA(A)的可读框连接形成一个连续的可读框。作为提供蛋白质在植物细胞的胞内细胞器中转运和定位的转运信号序列,例如可以提及如美国专利5,717,084所述、来源于位于植物叶绿体中的蛋白质的胞质前体的转运信号,由美国专利RE36449所述的各种转运信号序列形成的嵌合序列。更具体地,提及来源于大豆核酮糖-1,5-二磷酸羧化酶小亚基的叶绿体转运肽,其按照下面实施例15所述方法可以获得。
典型地,可以将本发明DNA(A),如上所述连接含有编码对胞内细胞器的转运信号的核苷酸序列的DNA的本发明DNA(A),或其中该DNA与在宿主细胞中起作用的启动子可操作连接的DNA,各自可被插入在宿主细胞中可用的载体中,将这导入宿主细胞。当使用已经具有在宿主细胞中起作用的启动子的载体时,可以将本发明DNA(A)插入存在于载体中的启动子的下游以使所述启动子和本发明DNA(A)可以可操作连接。
作为载体,具体地当使用大肠杆菌作为宿主细胞时,例如,可以提及pUC 119(TaKaRa Shuzo Company),pTVA 118N(Takara Shuzo Company),pBluescript II(Strategene Company),pCR2.1-TOPO(Invitrogen),pTrc99A(Amersham Pharmacia Biotech Company),pKK331-1A(AmerchamPharmacia Biotech Company),pETlld(Novagen)等。通过使用包含选择性标记(例如赋予对抗生素的抗性的基因如卡那霉素抗性基因,新霉素抗性基因等)的载体,它是方便的,因为可以将选择性标记的表型用作指示物来选择导入本发明DNA的转化体。
关于将本发明DNA(A)或包含本发明DNA(A)的载体导入宿主细胞的方法,当宿主细胞是微生物,例如大肠杆菌(E.coli),枯草芽孢杆菌(Bacillus subtilis),短芽孢杆菌(Bacillus brevis),假单胞菌属物种(Pseudomonas sp.),发酵单胞菌属物种(Zymomonas sp.),乳酸菌,乙酸菌,葡萄球菌属物种(Staphylococcus sp.),链霉菌属物种(Streptomyces sp.),糖多孢菌属物种(Saccharopolyspora sp.),或酵母如酿酒酵母(Saccharomycescerevisiae),栗酒裂殖酵母(Schizosaccaromyces ponmbe),真菌如曲霉属(Aspergillus)等时,可以提及在Shin Seikagaku Zikken Kouza(Nippon-Seikagaku-Kai eds.,Tokyo Kagaku Dozin),17卷,Biseibutu-Zikken-Hou中所述方法。备选地,例如可以使用在Sambrook,J.,Frisch,E.F.,和Maniatis,T.;“Molecular Cloning第二版”Cold SpringHarborPress(Molecular Biology,John Wiley & Sons,N.Y.(1989)或在“Current Protocols in Molecualr Biology”(1987),John Wiley & Sons公司中所述的氯化钙法或在“Methods in Electroporation:Gene Pulser/E.coliPulser System”,Bio-Rad Laboratories(1993)中所述的电穿孔法。
例如通过如上所述选择包含在已经插入本发明DNA(A)的载体中的选择性标记的表型作为指示物可以选择其中已经导入本发明DNA(A)或包含本发明DNA(A)的载体的转化体。另外,通过从转化体中制备DNA和然后用制备的DNA进行在例如“Molecular Cloning第二版”,Cold SpringHarbor Press(Molecular Biology,John Wiley & Sons,N.Y.(1989)(如证实限制酶位点,DNA测序,DNA杂交,PCR等)所述的遗传工程分析方法可以证实转化体是否包含本发明DNA(A)或含本发明DNA(A)的载体。
当宿主细胞是植物细胞时,可以提及植物类型,例如,双子叶植物如烟草,棉花,油菜籽,甜菜,拟南芥,油菜(canola),亚麻,向日葵,马铃薯,苜蓿,莴苣,香蕉,大豆,豌豆,荚果,松树,杨树,苹果,葡萄,橙子,柠檬,其它柑橘属水果,杏,胡桃和其它坚果;单子叶植物如玉米,水稻,小麦,大麦,黑麦,燕麦,高梁,甘蔗和草;等。关于导入本发明DNA(A)的细胞可以使用植物组织,植物体,培养的细胞,种子等。
关于将本发明DNA(A)或包含本发明DNA(A)的载体导入宿主细胞的方法,提及方法如用农杆菌感染(日本审查专利公开号2-58917和日本未审查专利公开号60-70080),电穿孔到原生质体中(日本未审查专利公开号60-251887和日本未审查专利公开号5-68575)或基因枪法(日本未审查专利公开号5-508316和日本未审查专利公开号63-258525)。
在这些情形中,例如,通过与包含本发明DNA(A)的载体同时将选自潮霉素磷酸转移酶基因,新霉素磷酸转移酶基因和氯霉素转乙酰酶基因的选择性标记导入植物细胞,可以用选择性标记的表型作为指示物选择已经导入本发明DNA的转化体。可以将选择性标记基因和本发明DNA(A)插入相同的载体和导入。还可同时导入包含选择性标记基因的载体和包含本发明DNA(A)的载体。通过用包含式(I)PPO抑制型除草化合物的培养基培养和通过分离其中可增加的克隆也可以选择已经导入本发明DNA(A)的转化体。通过从转化体中制备DNA和然后用制备的DNA进行例如在“Molecular Cloning第二版”,Cold Spring Harbor Press(MolecularBiology,John Wiley & Sons,N.Y.(1989)中描述的遗传工程分析方法(如证实限制酶位点,DNA测序,DNA杂交,PCR等)可以证实转化体是否包含本发明DNA(A)。通过插入到包含在胞内细胞器如叶绿体中的DNA可以将导入植物细胞中的本发明DNA(A)保持在除了包含在核中的DNA以外的细胞中的位置。
从如此获得的转化的植物细胞,通过在Shokubutu-Idenshi-Sosa-Manual:Transgenic-Shokubutu-No-Tukurikata(Uchimiya,Kodansha-Scientific,1990),27-55页所述的植物细胞培养方法再生植物体可以获得已经导入本发明DNA(A)的转基因植物。另外,通过将靶类型的植物与已经导入本发明DNA(A)的转基因植物交配以使本发明DNA(A)导入靶类型植物的染色体中,可以产生已经导入本发明DNA(A)的靶植物类型。
具体地,例如,通过Model-Shokubutu-No-Jikken-Protocol:Ine,Shiroinunazuna-Hen(Supervisors:Koh SHIMAMOTO和Kiyotaka OKADA,Shujun-sha,1996),第四章所述的方法可以获得其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的水稻或拟南芥。另外,通过按照日本未审查的专利公开号3-291501所述方法用基因枪导入大豆体细胞胚可以获得其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的大豆。同样,通过按照Fromm,M.E.,等Bio/Technology,8;第838页(1990)所述方法用基因枪导入玉米体细胞胚可以获得其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的玉米。通过按照TAKUMI等,Journal ofBreeding Society(1995),44:Extra卷1,第57页所述常规方法用基因枪将基因导入无菌培养的小麦未成熟盾盖可以获得其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的小麦。同样,通过按照HAGIO,等,Journal of Breeding Society(1995),44;Extra卷1,第67页所述常规方法用基因枪导入无菌培养的大麦未成熟盾盖可以获得其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的大麦。
通过在它的细胞内将所述除草化合物转化成低除草活性的化合物,其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的转化体可以减轻由化合物(I)导致的植物损伤。具体地例如,通过在期望植物的播种之前将表达本发明蛋白质(A)的微生物散布在期望栽培的植物的栽培区域,残余在土壤中的除草化合物可以被代谢,可以减轻对期望植物的损伤。另外,通过使期望的各种植物表达本发明蛋白质(A),赋予所述植物将式(I)的PPO抑制型除草化合物代谢成低活性的化合物的能力。结果,减轻植物中来自除草化合物的植物损伤,赋予对所述化合物的抗性。
例如通过培养包含本发明DNA(A)的细胞可以制备本发明蛋白质(A)。关于该细胞,提及表达本发明DNA(A)和具有生产本发明蛋白质(A)的能力的微生物,如从自然界分离的包含本发明DNA(A)的微生物菌株,通过用试剂或紫外线处理等处理由天然菌株衍生的突变株。更具体地例如,提及属于链霉菌属的微生物,暗产色链霉菌IFO 12898,砖红色链霉菌ATCC 21469,不产色链霉菌IFO 12735,浅灰链霉菌ATCC11796,Streptomyces carbophilus SANK62585,灰褐链霉菌IFO 12870t,热淡天蓝链霉菌IFO 14273t,黑胡桃链霉菌IFO 13445,津岛链霉菌IFO13782,球团产色链霉菌IFO 13673t,橄榄产色链霉菌IFO 12444,装饰链霉菌IFO 13069t,灰色链霉菌ATCC 10137,灰色链霉菌IFO 13849T,羊毛链霉菌IFO 12787T,三泽链霉菌IFO 13855T,苍白色链霉菌IFO 13434T,玫瑰变红链霉菌IFO 13682T,鲁地链霉菌IFO 15875T和斯堡链霉菌IFO13446T,等;或属于糖多孢菌属的微生物,如塔氏糖多孢菌JCM 9383t等。另外,可以提及其中已经导入本发明DNA(A)或包含本发明DNA(A)的载体的转化体。具体地例如,提及其中将与tac启动子,trc启动子,lac启动子或t7噬菌体启动子可操作连接的本发明DNA(A)导入大肠杆菌的转化体。作为更多的具体实例,提及在下述实施例中描述的大肠杆菌JM109/pKSN657,大肠杆菌JM109/pKSN657F,大肠杆菌JM109/pKSN923,大肠杆菌JM109/pKSN923F,大肠杆菌JM109/pKSN11796,大肠杆菌JM109/pKSN11796F,大肠杆菌JM109/pKSN671,大肠杆菌JM109/pKSN671F,大肠杆菌JM109/pKSNCA,大肠杆菌JM109/pKSN646,大肠杆菌JM109/pKSN646F,大肠杆菌JM109/pKSN849AF,大肠杆菌JM109/pKSN1618F,大肠杆菌JM109/pKSN474F,大肠杆菌JM109/pKSN1491AF,大肠杆菌JM109/pKSN1555AF,大肠杆菌JM109/pKSN1584F,大肠杆菌JM109/pKSN1609F等。
作为培养上述包含本发明DNA(A)的微生物的培养基,可以使用通常用于培养微生物的那些中的任何一种,其包含碳源和氮源,如果适当的话有机和无机盐。可以加入血红素前体的化合物,如氨基乙酰丙酸。
作为碳源,例如提及糖类如葡萄糖,果糖,蔗糖和糊精;糖醇如甘油和山梨糖醇;和有机酸如延胡索酸,柠檬酸和丙酮酸;等。上面所列碳源加入培养基的量通常是基于培养基总量的约0.1%(w/v)至约10%(w/v)。
作为氮源,例如提及无机酸的铵盐如氯化铵,硫酸铵和磷酸铵;有机酸的铵盐如延胡索酸铵和柠檬酸铵;有机氮源如肉膏,酵母提取物,麦芽汁,大豆粉,玉米浆,棉籽粉,干酵母,酪蛋白水解物;以及氨基酸。在以上所列那些中,有机酸的铵盐,有机氮源和氨基酸也可以通常用作碳源。加入氮源的量通常是基于培养基总量的约0.1%(w/v)至约10%(w/v)。
作为无机盐,例如,提及磷酸盐如磷酸钾,磷酸氢二钾,磷酸钠,磷酸氢二钠;氯化物如氯化钾,氯化钠,氯化钴六水合物;硫酸盐如硫酸镁,硫酸铁七水合物,硫酸锌七水合物,硫酸锰三水合物;等。加入的量通常是基于培养基总量的约0.0001%(w/v)至约1%(w/v)。
在培养保持连接于T7噬菌体启动子下游的本发明DNA(A)和其中编码T7 RNA聚合酶(λDE3溶原菌)的核苷酸序列连接于lac UV5启动子下游的DNA的转化体的情形中,典型地可以加入少量例如异丙基-β-D-硫代半乳糖苷(以下称为“IPTG”)作为诱导物诱导本发明蛋白质(A)的生产。在培养已经导入DNA的转化体情形中,也可以将IPTG加入培养基,所述DNA中本发明DNA(A)与一类由乳糖诱导的启动子如tac启动子,trc启动子和lac启动子可操作连接。
可以按照通常用于培养微生物的方法,包括液相培养如旋转振荡培养,往复式振荡培养,小型发酵(小型发酵罐培养)和罐培养;或固相培养,培养包含本发明DNA(A)的微生物。当使用小型发酵罐时,通常以每分钟约0.1至约2倍培养液体积的通风速率将无菌空气导入小型发酵罐。实施培养的温度可以在允许微生物生长的范围内变化,通常为约15℃至约40℃,培养基的pH为约6至约8。培养时间可以根据培养条件变化,通常约为1天至约10天。
通过包含本发明DNA(A)的微生物生产的本发明蛋白质(A)可以以各种形式用于处理式(I)的PPO抑制型除草化合物,如生产本发明蛋白质(A)的微生物的培养物,生产本发明蛋白质(A)的微生物细胞,通过处理该细胞得到的材料,微生物的无细胞提取物,未完全纯化的蛋白质,纯化的蛋白质等。上述通过处理细胞获得的材料包括例如冻干细胞,丙酮干燥细胞,磨碎的细胞,细胞的自溶物,超声处理的细胞,碱处理的细胞,有机溶剂处理的细胞等。备选地,可以按照已知方法如使用吸附在无机载体如硅胶或陶瓷材料,多糖衍生物如DEAE-纤维素,合成聚合物如Amberite IRA-935(商品名,由Rohm和Haas制备)等之上的载体结合法,和使用包含在聚合物如聚丙烯酰胺,含硫多糖凝胶(例如角叉藻聚糖凝胶),藻酸胶,琼脂胶等的网状基质中的包含法来固定上述各种形式中任何一种本发明蛋白质(A),然后用于处理上述除草化合物。
作为从包含本发明DNA(A)的微生物的培养物中纯化本发明蛋白质(A)的方法,可以使用常规用于纯化蛋白质的方法。例如可以提及下列方法。
首先,通过离心等从微生物的培养物中收获细胞,然后通过超声处理,DYNOMILL处理,FRENCH PRESS处理等物理破裂,或通过使用表面活性剂或细胞裂解酶如溶菌酶化学破裂细胞。从如此获得的产生的裂解物中,通过离心,膜过滤等去除不溶物以制备无细胞提取物,其然后通过任何适当的分离和纯化方法,如阳离子交换层析,阴离子交换层析,疏水层析,凝胶过滤层析等分级,由此纯化本发明蛋白质(A)。用于该层析的支持材料包括例如树脂载体如与羧甲基(CM),二乙氨基乙基(DEAE),苯基或丁基连接的纤维素,葡聚糖和琼脂糖。也可以使用可商购的已经填充任何载体的柱子,如Q-Sepharose FF,Phenyl-Sepharose HP,PD-10和HiLoad26/10 Q Sepharose HP(商品名,来自Amersham Pharmacia Biotech),TSK-gel G3000SW(商品名,TOSOH CORPORATION)。
提供纯化本发明蛋白质(A)的一个实例。
通过离心收获产生本发明蛋白质(A)的微生物细胞,然后悬浮在缓冲液如0.1M磷酸钾(pH7.0)中。超声处理混悬液以破裂细胞,在约40,000g下离心如此获得的产生的裂解物约30分钟以获得上清液,其然后在150,000g下离心约1小时以回收上清液(无细胞提取物)。将获得的无细胞提取物进行硫酸铵分级分离以获得在45%-饱和硫酸铵的存在下可溶解和在55%-饱和的硫酸铵下沉淀的级分。在使用PD 10柱(AmershamPharmacia Biotech Company)用不包含硫酸铵的缓冲液如1M磷酸钾交换级分的溶剂后,将产生的级分上样到例如HiLoad 26/10 Q Sepharose HP柱(Amersham Pharmacia Biotech Company)上。用20mM双三丙烷(bistripropane)和NaCl线性梯度洗脱柱子而获得一系列洗脱物级分。回收显示在包含电子供体如辅酶NADPH的电子传递体系的存在下将化合物(II)转化为化合物(III)的活性的级分。接下来,在通过使用例如PD10柱(Amersham Pharmacia Biotech Company)交换级分中的缓冲液以后,将回收的级分上样到Bio-Scale Ceramic,例如羟磷灰石,I型柱子CHT10-I(BioRad Company)上。在用缓冲液A(包含1.5mM CaCl2的2mM磷酸钾缓冲液;pH7.0)洗涤柱子以后,用缓冲液A和线性梯度的缓冲液B(包含0.03mM CaCl2的100mM磷酸钾缓冲液)洗脱柱子以获得一系列洗脱物级分。回收显示在包含电子供体如辅酶NADPH的电子传递体系的存在下将化合物(II)转化为化合物(III)的活性的级分。在通过使用例如PD10柱(Amersham Pharmacia Biotech Company)交换级分中的缓冲液以后,通过例如超滤(microcon滤器装置microcon-30;Millipore公司)浓缩回收的级分。将产生的级分例如注射到HiLoad 16/60 Superdex柱75pg柱(Amersham Pharmacia Biotech Company)中和用包含0.15M NaCl(pH7.0)的0.05M磷酸钾缓冲液洗脱而获得一系列洗脱物级分。回收显示在包含电子供体如辅酶NADPH的电子传递体系的存在下将化合物(II)转化为化合物(III)的活性的级分。根据需要通过用SDS-PAGE分离可以纯化本发明蛋白质(A)。
通过以上述方法纯化本发明蛋白质(A),接着将获得的本发明蛋白质(A)用作免疫抗原,可以产生识别本发明蛋白质(A)的抗体(下文有时称为“本发明抗体(A)”)。
具体地例如,用以上述方法纯化的本发明蛋白质(A)作为抗原免疫动物。例如,为了免疫动物如小鼠,仓鼠,豚鼠,小鸡,大鼠,兔子,狗等,使用在例如W.H.Newsome,J.Assoc.Off.Anal.Chem.70(6)1025-1027(1987)中描述的常规免疫方法至少施用抗原一次。作为给药计划,例如提及在7至30天的间隔,优选12至16天的间隔给药2或3次。其剂量是例如每次给药约0.05mg-2mg抗原。给药途径可选自皮下给药,皮内给药,腹膜内给药,静脉内给药,和肌内给药,静脉内,腹膜内或皮下注射是典型的给药方式。典型地在溶于适当的缓冲液中后使用抗原,所述缓冲液例如磷酸钠缓冲液或生理盐水,其包含至少一种通常使用的佐剂如完全弗氏佐剂(Aracel A,Bayol F和死结核杆菌(tubercule bacillus)的混合物),RAS[MPL(单磷酰基类脂A)+TDM(合成trehalose dicorynomycolate)+CWS(细胞壁骨架)佐剂系统]或氢氧化铝。然而,取决于给药途径或病症,可以不使用上述佐剂。“佐剂”是经与抗原一起给药后增强非特异性针对抗原的免疫反应的物质。在喂养施用抗原的动物0.5-4个月后,从例如动物的耳静脉中采样少量血液和测量抗体效价。当抗体效价提高时,根据情形再施用抗原适当的次数。例如,可以以约100μg-1000μg的剂量再一次使用抗原。在最后一次给药1或2个月以后,以通常方式从免疫动物中收集血液。通过常规技术如通过离心或用硫酸铵或用聚乙二醇沉淀,层析如凝胶过滤层析,离子交换层析和亲和层析,等将血液分级,可以获得作为多克隆抗血清的本发明抗体(A)。另外,可以将抗血清例如在56℃下温育30分钟以使补体系统失活。
备选地,化学合成包含本发明蛋白质(A)部分氨基酸序列的多肽并作为免疫抗原施用于动物,由此产生本发明抗体(A)。关于用作免疫抗原使用的多肽的氨基酸序列,从本发明蛋白质(A)的氨基酸序列中选择与其它蛋白质的氨基酸序列具有尽可能低同源性的氨基酸序列。通过常规方法化学合成由所选氨基酸序列组成的、10个氨基酸至15个氨基酸长度的多肽,并例如使用MBS等与载体蛋白如Limulus plyhemus血蓝蛋白交联,然后如上所述用于免疫动物如兔子。
然后将产生的本发明抗体(A)与试样接触,然后通过常规免疫学方法检测试样中蛋白质与上述抗体的复合体,从而检测试样中的本发明蛋白质(A)或包含其部分氨基酸的多肽。具体地例如,如以下实施例45或73所述可以通过使用本发明抗体(A)的蛋白质印迹分析评估在检查试样中本发明蛋白质(A)的存在或定量本发明蛋白质(A)。
另外,例如,按照常规免疫学方法,通过将本发明抗体(A)与试验细胞或由试验细胞制备的试样接触,接着检测上述抗体和试验细胞或由试验细胞制备的试样中的蛋白质的复合体,可以检测表达本发明蛋白质(A)的细胞。通过如此检测表达本发明蛋白质(A)的细胞,还可以从多种细胞中选择表达本发明蛋白质(A)的细胞。使用本发明抗体(A)还可以克隆或选择包含本发明蛋白质(A)的克隆。例如,通过从表达本发明蛋白质(A)的细胞中提取基因组DNA,接着将基因组DNA插入表达载体可以产生基因组文库。将基因组文库导入细胞。从获得的细胞组中,以上述方法使用本发明抗体(A)选择表达本发明蛋白质(A)的细胞。
可以将包含本发明抗体(A)的试剂盒用来如上所述检测本发明蛋白质(A)或分析,检测或寻找表达本发明蛋白质(A)的细胞。本发明的试剂盒可以包含除了本发明抗体(A)以外的上述分析方法所需的试剂,可以含有与本发明抗体(A)一起使用的试剂。
通过将式(I)的PPO抑制型除草化合物在包含电子供体如辅酶NADPH的电子传递体系的存在下与本发明蛋白质(A)反应,将上述化合物代谢和转化成低除草活性的化合物。具体地例如,通过在包含电子供体如辅酶NADPH的电子传递体系的存在下将化合物(II)与本发明蛋白质(A)反应,化合物(II)被转化成化合物(III),其显示基本上没有除草活性。在该情形中的蛋白质(A)的实例是本发明蛋白质(A)。可以使用本发明蛋白质(A)的一个变体,可以一起使用多个变体。
式(I)的化合物是具有尿嘧啶结构的化合物。作为具体的实例,可以提及化合物(II)或式(IV)至(IX)中任何一个的化合物(下文分别称为化合物(IV)至化合物(IX))。按照在日本未审查的专利公开号2000-319264中所述方法可以合成化合物(II)和化合物(IX),按照美国专利5183492所述方法可以合成化合物(IV)和化合物(V),按照美国专利5674810所述方法可以合成化合物(VI),按照日本未审查专利公开号3-204865所述方法可以合成化合物(VII),按照日本未审查专利公开号6-321941所述方法可以合成化合物(VIII)。
Figure A0282564201131
Figure A0282564201141
另外,作为式(I)化合物的具体实例,可以提及式(X)至(XVII)中任何一项的化合物(以下分别称为化合物(X)至化合物(XVII))。
通过使化合物存在于反应,所述反应中在包含电子供体如辅酶NADPH的电子传递体系的存在下标记放射性同位素的化合物(II)与本发明蛋白质(A)反应,和检测作为标志的标记的化合物(II)至标记的化合物(III)的转化反应被本发明蛋白质(A)的竞争性抑制,能够选择可以是本发明蛋白质(A)的代谢反应底物的化合物。当测定来自试验化合物的竞争性抑制的存在时,典型地将试验化合物加至1-100倍标记化合物(II)的摩尔浓度的量。
可以例如在包含无机酸的盐如碱金属磷酸盐如磷酸钠和磷酸钾;或有机酸的盐如碱金属的乙酸盐如乙酸钠和乙酸钾等的含水缓冲液中进行化合物(I)与本发明蛋白质(A)的反应。在代谢反应液中式(I)化合物的浓度典型地为至多约30%(w/v)和优选约0.001%(w/v)至20%(w/v)。包含电子供体如NADPH的电子传递体系或者本发明蛋白质(A)的量可以例如根据反应时间而变化。反应温度选自典型地约10℃-70℃的范围,优选约20℃-50℃。反应液的pH选自典型地约4-12的范围,优选约5-10。反应时间可以根据需要变化,典型地约1小时至10天。
另外,可以在包含本发明DNA(A)的细胞中进行化合物(I)与本发明蛋白质(A)的反应。作为包含本发明DNA(A)的细胞,例如提及具有表达本发明DNA(A)和生产本发明蛋白质(A)的微生物,如从自然界中分离的包含本发明DNA(A)的那些微生物的菌株,通过用化学品或紫外线处理衍生于该微生物菌株的突变株,其中将本发明DNA(A)或包含本发明DNA(A)的载体导入宿主细胞的转化的微生物细胞。另外,提及导入本发明DNA(A)的转化的植物细胞或导入本发明DNA(A)的转化植物的细胞。在该情形中,可以将式(I)化合物直接加到包含本发明DNA(A)的细胞或可以加至细胞培养基或与细胞接触的土壤中以便进入细胞。包含电子供体如NADPH的电子传递体系可以是原来存在于细胞中的系统和可以从细胞外部加入。
例如通过检测由化合物(I)代谢产生的化合物可以证实由本发明蛋白质(A)导致的化合物(I)的代谢。具体地例如,如上所述可以用HPLC分析或TLC分析检测由代谢化合物(II)产生的化合物(III)。
另外,基于在化合物(I)与本发明蛋白质(A)反应后反应溶液中的除草活性相比较低于化合物(I)未与本发明蛋白质(A)反应的情形,可以证实由本发明蛋白质(A)导致的化合物(I)的代谢。作为检验除草活性的方法,例如提及其中将上述反应溶液施用于杂草如稗(Echinochloacrus-galli),大穗看麦娘(Alopercurus myosuroides),Ivyleaf morningglory(Ipomoea hederacea)和苘麻(Abutilon theophrasti)和检查除草效果的方法;或其中将杂草在施用上述反应溶液的土壤样品上栽培和检查除草效果的方法;等。另外,提及其中可以将上述反应溶液点在从植物采取的叶盘上和检查由反应溶液导致的植物损伤(变白)的存在的方法。
另外,通过检测作为标记的、在化合物(I)与本发明蛋白质(A)反应后的反应溶液中的PPO抑制活性相比较低于其中化合物(I)未与本发明蛋白质(A)反应的反应溶液中的活性,可以证实本发明蛋白质(A)导致的化合物(I)的代谢。PPO是催化原卟啉原IX向原卟啉IX(以下称为“PPIX”)转化的酶。例如,在将上述反应溶液加入PPO反应系统中以后,加入PPO的底物一原卟啉原IX并在黑暗中在30℃下温育约1-2小时。随后,使用HPLC等测量在各个温育的溶液中PPIX的量。当在加入化合物(I)与本发明蛋白质(A)反应后的反应溶液的系统中PPIX的量超过在加入化合物(I)未与本发明蛋白质(A)反应后的反应溶液的系统中的PPIX量时,确定化合物(I)已经由本发明蛋白质(A)代谢。作为PPO,可以使用从植物等中纯化的蛋白质或来自植物的叶绿体级分。当使用叶绿体级分时,可以将氨基乙酰丙酸而不是原卟啉原IX用于PPO反应系统中。氨基乙酰丙酸是叶绿素-血红素生物合成途径中原卟啉原IX的前体。在下面实施例42中给出一个更具体的实例。
通过如此与本发明蛋白质(A)反应,可以进行式(I)PPO抑制型除草化合物的处理,其导致化合物代谢和转化成低除草活性的化合物。通过在植物栽培区域上喷洒所述化合物的处理可以减轻来自所述化合物的植物损伤,具体地例如,喷洒在植物栽培区域上和保留在植物残体或土壤等之中的化合物与本发明蛋白质(A)反应。
作为可以用来使化合物(I)与本发明蛋白质(A)反应的“包含电子供体的电子传递体系”,例如可以提及包含NADPH,铁氧还蛋白和铁氧还蛋白-NADP+还原酶的系统。
作为在系统中提供“包含电子供体的电子传递体系”使化合物(I)与本发明蛋白质(A)反应的方法,例如提及将来源于植物如菠菜的NADPH,铁氧还蛋白和来源于植物如菠菜的铁氧还蛋白-NADP+还原酶加入上述反应系统的方法。另外,可以将可以从微生物如大肠杆菌中制备、包含对于本发明蛋白质(A)反应体系中的电子传递体系有作用的成分的级分加到所述反应体系中。为了制备该级分,例如在通过离心等从微生物的培养物中收获细胞以后,通过超声处理,DYNOMILL处理,FRENCH PRESS处理等物理破裂或通过使用表面活性剂或细胞裂解酶如溶菌酶化学破裂细胞。从如此获得的产生的裂解物中,通过离心,膜过滤等去除不溶物以制备无细胞提取物。可以将无细胞提取物作为包含对于本发明蛋白质(A)的反应体系中电子传递体系有作用的成分的级分用于交换上述铁氧还蛋白。另外,当可以将电子从电子供体传递到本发明蛋白质(A)的系统存在于该细胞中时,如同其中本发明蛋白质(A)与化合物(I)的反应是在细胞如微生物或植物细胞中进行的情形,可以不重新加入电子传递体系。
作为铁氧还蛋白,例如可以使用来源于微生物的铁氧还蛋白(下文有时共同称为“本发明蛋白质(B)”),所述微生物属于链霉菌属,如暗产色链霉菌,砖红色链霉菌,不产色链霉菌,浅灰链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌和斯堡链霉菌,更具体地,暗产色链霉菌IFO 12898,砖红色链霉菌ATCC 21469,不产色链霉菌IFO 12735,浅灰链霉菌ATCC11796,热淡天蓝链霉菌IFO 14273t,黑胡桃链霉菌IFO 13445,津岛链霉菌IFO 13782,球团产色链霉菌IFO 13673t,橄榄产色链霉菌IFO 12444,装饰链霉菌IFO 13069t,灰色链霉菌ATCC 10137,灰色链霉菌IFO 13849T,羊毛链霉菌IFO 12787T,三泽链霉菌IFO 13855T,苍白色链霉菌IFO13434T,玫瑰变红链霉菌IFO 13682T,鲁地链霉菌IFO 15875T和斯堡链霉菌IFO 13446T,等;或属于糖多孢菌属的微生物,如塔氏糖多孢菌,更具体地,塔氏糖多孢菌JCM 9383t等。具体地例如,可以提及选自以下组合的铁氧还蛋白(下文有时称为“本发明蛋白质(B)”)。
<蛋白质组合>
(B1)包含SEQ ID NO:12所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B1)”);
(B2)包含SEQ ID NO:13所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B2)”);
(B3)包含SEQ ID NO:14所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B3)”);
(B4)包含SEQ ID NO:111所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B4)”);
(B5)包含与SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQID NO:111中任何一个所示氨基酸序列具有至少80%序列同一性的氨基酸序列的铁氧还蛋白;
(B6)包含与编码SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQ ID NO:111中任何一个所示氨基酸序列的核苷酸序列具有至少90%序列同一性的核苷酸序列所编码的氨基酸序列的铁氧还蛋白;
(B7)包含SEQ ID NO:149所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B7)”);
(B8)包含SEQ ID NO:150所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B8)”);
(B9)包含SEQ ID NO:151所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B9)”);
(B10)包含SEQ ID NO:152所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B10)”);
(B11)包含SEQ ID NO:153所示氨基酸序列的蛋白质(下文有时称为“本发明蛋白质(B11)”);
(B12)一种铁氧还蛋白,其包含与在SEQ ID NO:149,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251,或SEQ ID NO:253中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:150,SEQ ID NO:252或SEQID NO:254中表示的氨基酸序列的任一个具有至少90%序列同一性的氨基酸序列;
(B13)一种铁氧还蛋白,其包含与编码SEQ ID NO:149,SEQ IDNO:150,SEQ ID NO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ IDNO:245,SEQ ID NO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ IDNO:250,SEQ ID NO:251,SEQ ID NO:252,SEQ ID NO:253或SEQ IDNO:254所示氨基酸序列的任何一个核苷酸序列具有至少90%序列同一性的核苷酸序列编码的氨基酸序列;
(B14)包含SEQ ID NO:245所示氨基酸序列的蛋白质;
(B15)包含SEQ ID NO:247所示氨基酸序列的蛋白质;
(B16)包含SEQ ID NO:248所示氨基酸序列的蛋白质;
(B17)包含SEQ ID NO:249所示氨基酸序列的蛋白质;
(B18)包含SEQ ID NO:250所示氨基酸序列的蛋白质;
(B19)包含SEQ ID NO:251所示氨基酸序列的蛋白质;
(B20)包含SEQ ID NO:252所示氨基酸序列的蛋白质;
(B21)包含SEQ ID NO:253所示氨基酸序列的蛋白质;和
(B24)包含SEQ ID NO:254所示氨基酸序列的蛋白质。
按照在Molecular Cloning:A Laboratory Manual第二版(1989),ColdSpring Harbor Laboratory Press;Current Protocols in Molecular Biology(1987),John Wiley & Sons公司等中描述的常规遗传工程方法,基于编码在SEQ ID NO:12,13,14,111,149,150,151,152,153,245,247,248,249,250,251,252,253或254中表示的本发明蛋白质(B)的氨基酸序列的核苷酸序列可以获得编码本发明蛋白质(B)的DNA(下文有时称为“本发明DNA(B)”)。
作为编码本发明蛋白质(B)的DNA(下文有时共同称为“本发明DNA(B)”),提及
编码包含SEQ ID NO:12所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B1)”);
编码包含SEQ ID NO:13所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B2)”);
编码包含SEQ ID NO:14所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B3)”);
编码包含SEQ ID NO:111所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B4)”);
编码包含与SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQ IDNO:111中任何一个所示氨基酸序列具有至少80%序列同一性的氨基酸序列的铁氧还蛋白的DNA;
编码铁氧还蛋白的DNA,所述铁氧还蛋白包含与编码SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQ ID NO:111中任何一个所示氨基酸序列的核苷酸序列具有至少90%序列同一性的核苷酸序列所编码的氨基酸序列;
编码包含SEQ ID NO:149所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B7)”);
编码包含SEQ ID NO:150所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B8)”);
编码包含SEQ ID NO:151所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B9)”);
编码包含SEQ ID NO:152所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B10)”);
编码包含SEQ ID NO:153所示氨基酸序列的蛋白质的DNA(下文有时称为“本发明DNA(B11)”);
编码铁氧还蛋白的DNA,所述铁氧还蛋白包含与在SEQ ID NO:149,SEQ ID NO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQID NO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251,或SEQ ID NO:253中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:150,SEQ ID NO:252或SEQID NO:254中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
编码铁氧还蛋白的DNA,所述铁氧还蛋白包含与编码SEQ IDNO:149,SEQ ID NO:150,SEQ ID NO:151,SEQ ID NO:152,SEQ IDNO:153,SEQ ID NO:245,SEQ ID NO:247,SEQ ID NO:248,SEQ IDNO:249,SEQ ID NO:250,SEQ ID NO:251,SEQ ID NO:252,SEQ ID NO:253或SEQ ID NO:254任一个所示氨基酸序列的核苷酸序列具有至少90%序列同一性的核苷酸序列编码的氨基酸序列;
编码包含SEQ ID NO:245所示氨基酸序列的蛋白质的DNA;
编码包含SEQ ID NO:247所示氨基酸序列的蛋白质的DNA;
编码包含SEQ ID NO:248所示氨基酸序列的蛋白质的DNA;
编码包含SEQ ID NO:249所示氨基酸序列的蛋白质的DNA;
编码包含SEQ ID NO:250所示氨基酸序列的蛋白质的DNA;
编码包含SEQ ID NO:251所示氨基酸序列的蛋白质的DNA;
编码包含SEQ ID NO:252所示氨基酸序列的蛋白质的DNA;
编码包含SEQ ID NO:253所示氨基酸序列的蛋白质的DNA;和
编码包含SEQ ID NO:254所示氨基酸序列的蛋白质的DNA。
作为本发明DNA(B)的更具体的实例,可以提及包含SEQ ID NO:15,16,17,112,154,155,156,157,158,255,257,258,259,260,261,262,263或264中任何一个所示核苷酸序列的DNA或包含与SEQ IDNO:15,16,17,112,154,155,156,157,158,255,257,258,259,260,261,262,263或264中任何一个所示核苷酸序列具有至少90%序列同一性的核苷酸序列的DNA。
按照在制备本发明DNA(A)的方法中所述条件,通过实施以包含其核苷酸序列的部分核苷酸序列的DNA作为引物进行PCR的方法或其中将该DNA用作探针的杂交方法可以制备该DNA。
具体地例如,通过使用从暗产色链霉菌IFO 12898制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:105所示核苷酸序列的寡核苷酸和包含SEQ ID NO:53所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含编码SEQ ID NO:12所示氨基酸序列的核苷酸序列的DNA,或包含SEQ ID NO:15所示核苷酸序列的DNA。
另外,通过使用从塔氏糖多孢菌JCM 9383t制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:106所示核苷酸序列的寡核苷酸和包含SEQ ID NO:63所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含编码SEQ ID NO:13所示氨基酸序列的核苷酸序列的DNA,或包含SEQ ID NO:16所示核苷酸序列的DNA。
另外,通过使用从砖红色链霉菌ATCC 21469制备的染色体DNA或染色体DNA文库作为模板,和通过使用包含SEQ ID NO:107所示核苷酸序列的寡核苷酸和包含SEQ ID NO:72所示核苷酸序列的寡核苷酸作为引物进行PCR可以制备包含编码SEQ ID NO:14所示氨基酸序列的核苷酸序列的DNA,或包含SEQ ID NO:17所示核苷酸序列的DNA。
另外,通过以由包含编码SEQ ID NO:12,13,14,111,149,150,151,152或153中任何一个所示氨基酸序列的核苷酸序列的约至少20个核苷酸组成的DNA作为探针,在上述条件下与染色体DNA文库杂交,接着检测和回收与所述探针特异性结合的DNA可以获得本发明DNA(B)。如上所述可以从微生物中制备染色体DNA文库,所述微生物属于链霉菌属,如暗产色链霉菌,砖红色链霉菌,不产色链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌和斯堡链霉菌,更具体地,暗产色链霉菌IFO 12898,砖红色链霉菌ATCC 21469,不产色链霉菌IFO 12735,热淡天蓝链霉菌IFO14273t,黑胡桃链霉菌IFO 13445,津岛链霉菌IFO 13782,球团产色链霉菌IFO 13673t,橄榄产色链霉菌IFO 12444,装饰链霉菌IFO 13069t,灰色链霉菌ATCC 10137,灰色链霉菌IFO 13849T,羊毛链霉菌IFO 12787T,三泽链霉菌IFO 13855T,苍白色链霉菌IFO 13434T,玫瑰变红链霉菌IFO13682T,鲁地链霉菌IFO 15875T和斯堡链霉菌IFO 13446T,等;或属于糖多孢菌属的微生物,如塔氏糖多孢菌,更具体地,塔氏糖多孢菌JCM9383t等。作为可以用作该探针的DNA的具体实例,提及包含SEQ ID NO:15,16,17,112,154,155,156,157,158,255,257,258,259,260,261,262,263或264中任何一个所示核苷酸序列的DNA;包含这些核苷酸序列的部分核苷酸序列的DNA;或包含与所述部分核苷酸序列互补的核苷酸序列的DNA。
为了用宿主细胞表达本发明DNA(B),例如按照在“Molecular Cloning:A Laboratory Manual第二版(1989)”,Cold Spring Harbor Laboratory Press;“Current Protocols in Molecular Biology(1987)”,John Wiley & Sons,公司等中所描述的常规遗传工程方法,制备其中本发明DNA(B)和在宿主细胞中起作用的启动子可操作连接的DNA,并导入宿主细胞中。通过从转化体中制备DNA和然后用制备的DNA进行例如在“Molecular Cloning第二版”,Cold Spring Harbor Press(Molecular Biology,John Wiley & Sons.N.Y.(1989)中所述的遗传工程分析方法(如证实限制酶位点,DNA测序,DNA杂交,PCR等),可以证实获得的转化体是否包含本发明DNA(B)。
通过将其中本发明DNA(B)和在宿主细胞中起作用的启动子可操作连接的DNA导入包含本发明DNA(A)的细胞,可以在相同的细胞中表达本发明DNA(B)和本发明DNA(A)。
例如通过培养包含本发明DNA(B)的细胞可以制备本发明蛋白质(B)。作为这种细胞,提及表达本发明DNA(B)和具有产生本发明蛋白质(B)的能力的微生物,如从自然界分离的包含本发明DNA(B)的微生物菌株,通过用试剂或紫外线等处理由所述天然菌株衍生的突变株。例如,提及属于链霉菌的微生物,如暗产色链霉菌,砖红色链霉菌,不产色链霉菌,浅灰链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌和斯堡链霉菌,更具体地,暗产色链霉菌IFO 12898,砖红色链霉菌ATCC 21469,不产色链霉菌IFO 12735,浅灰链霉菌ATCC 11796,热淡天蓝链霉菌IFO 14273t,黑胡桃链霉菌IFO 13445,津岛链霉菌IFO 13782,球团产色链霉菌IFO13673t,橄榄产色链霉菌IFO 12444,装饰链霉菌IFO 13069t,灰色链霉菌ATCC 10137,灰色链霉菌IFO 13849T,羊毛链霉菌IFO 12787T,三泽链霉菌IFO 13855T,苍白色链霉菌IFO 13434T,玫瑰变红链霉菌IFO 13682T,鲁地链霉菌IFO 15875T和斯堡链霉菌IFO 13446T,等;或属于糖多孢菌属,如塔氏糖多孢菌,更具体地,塔氏糖多孢菌JCM 9383t等。另外,可以提及其中已经导入本发明DNA(B)的转化体。具体地例如,提及其中已将与tac启动子,trc启动子,lac启动子或T7噬菌体启动子可操作连接的本发明DNA(B)导入大肠杆菌的转化体。作为更多的具体实例,提及在下述实施例中描述的大肠杆菌JM109/pKSN657FD,大肠杆菌JM109/pKSN923FD,大肠杆菌JM109/pKSN671FD等。
按照通常用于培养微生物的方法可以培养包含本发明DNA(B)的微生物,更具体地,按照在培养包含本发明DNA(A)的微生物的方法中的上述条件进行。
例如,通过包含本发明DNA(B)的微生物生产的本发明蛋白质(B)可以各种形式在本发明蛋白质(A)的反应体系中使用,如生产本发明蛋白质(B)的微生物的培养物,生产本发明蛋白质(B)的微生物细胞,通过处理该细胞得到的材料,微生物的无细胞提取物,未完全纯化的蛋白质,纯化的蛋白质等。上述通过处理细胞获得的材料包括例如冻干细胞,丙酮干燥细胞,磨碎的细胞,细胞的自溶物,超声处理的细胞,碱处理的细胞,有机溶剂处理的细胞等。备选地,可以按照已知方法如使用吸附在合成聚合物等之上的载体结合法,和使用包含于聚合物网状基质中的包含法可以固定上述各种形式中任何一种的本发明蛋白质(B),然后用于本发明蛋白质(A)的反应体系。
作为从包含本发明DNA(B)的微生物的培养物中纯化本发明蛋白质(B)的方法,可以使用常规用于纯化蛋白质的方法。例如可以提及下列方法。
首先,通过离心等从微生物的培养物中收获细胞,然后通过超声处理等物理破裂,或通过使用表面活性剂或细胞裂解酶如溶菌酶化学破裂细胞。从如此获得的产生的裂解液中,通过离心,膜过滤等去除不溶物以制备无细胞提取物,其然后通过任何适当的分离和纯化方法,如阳离子交换层析,阴离子交换层析,疏水层析,凝胶过滤层析等分级,由此纯化本发明蛋白质(B)。通过用SDS-PAGE分离如此获得的级分,可以进一步纯化本发明蛋白质(B)。
可以证实本发明蛋白质(B)作为铁氧还蛋白的功能是在化合物(I)与本发明蛋白质(A)反应的反应体系中作为从铁氧还蛋白-NADP+还原酶到本发明蛋白质(A)的电子转运蛋白的功能。具体地例如,通过加入本发明蛋白质(B)和NADPH,铁氧还蛋白-NADP+还原酶和本发明蛋白质(A)于化合物(I)与本发明蛋白质(A)反应的反应体系中,接着检测化合物(II)向化合物(III)的转化可以证实。
在本发明控制杂草的方法中,将化合物(I)施用于表达本发明蛋白质(A)的植物的栽培区域。该植物可以表达本发明蛋白质(A)的一个变体或可以表达本发明蛋白质(A)的多个变体。作为本发明蛋白质(A),例如,可以提及本发明蛋白质(A)。作为已经导入本发明DNA(A)的转基因植物可以获得表达本发明蛋白质(A)的植物。该导入包括以上述方式将本发明DNA(A)导入植物细胞以使DNA处于能使它表达的位置,接着从获得的转化细胞再生植物。导入植物细胞的本发明DNA(A)可以在其上游连接编码向胞内细胞器的转运信号的核苷酸序列,以使可读框在框内。
其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的植物在它的细胞内将化合物(I)代谢成低除草活性的化合物。结果,降低植物中来自除草化合物的植物损伤和赋予对所述化合物的抗性。因此,其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的植物即使在将化合物(I)施用于其栽培区域的情形中也可以生长良好。通过栽培所述植物和施用上述除草组合物于栽培区域可以有效去除除了其中已经导入本发明DNA(A)和表达本发明蛋白质(A)的植物以外的杂草。可以改善上述植物的产率,改善品质,减小所用除草剂的量和节省劳动。
通过将表达编码本发明蛋白质(A)的基因的细胞与所述化合物或所述除草组合物接触和评估对细胞的损伤程度,可以进行表达本发明蛋白质(A)的细胞对式(I)化合物或包含所述化合物的除草组合物的抗性评估。
具体地,为了评估表达本发明蛋白质(A)的微生物细胞对化合物(I)或包含化合物(I)的除草组合物的抗性,可以制备表达植物PPO和本发明蛋白质(A)的转化的大肠杆菌。该制备包括另外将本发明DNA(A)导入例如可以用来评估PPO活性抑制和已经在日本专利申请11-102534中描述的转化的大肠杆菌,更具体地其中将美国专利号5939602等所述的植物PPO基因有效地导入大肠杆菌BT3菌株和表达PPO基因的转化的大肠杆菌。如F.Yamamoto,H.Inokuti,H.Ozaki,(1988)Japanese Journal ofGenetics,63卷,第237-249页所述,大肠杆菌BT3菌株在PPO基因中有缺陷和没有增殖能力。通过在包含0-1.0ppm的化合物(I)或含所述化合物的除草组合物的液体培养基中在37℃下振荡培养产生的转化大肠杆菌约18-24小时和用600nm的光密度测量所述转化的大肠杆菌的增殖可以评估对化合物或除草组合物的抗性。作为本发明蛋白质(A),例如可以提及本发明蛋白质(A)。
作为评估表达本发明蛋白质(A)的植物对式(I)化合物或包含所述化合物的除草组合物的抗性程度的方法,提及将除草组合物施用于植物和测量植物生长程度的方法。为了更定量的证实,例如首先将植物的几片叶子浸到包含各种浓度的化合物(I)的水溶液中,或者将化合物(I)的水溶液喷洒在植物的数片叶子上,接着在室温下在光线中放置于琼脂培养基上。在数天后,按照Mackenney,G.,J.Biol.Chem.,140;第315页(1941)所述方法从植物叶子中提取叶绿素以测定叶绿素的含量。具体地例如,采取植物的叶子并沿着主叶脉等分成2片。将除草组合物散布在叶片之一的整个表面上。另一叶片留下未处理。将这些叶片放在包含0.8%琼脂的MS培养基上并在室温在光线中放置7天。然后,用杵和研钵在5ml 80%丙酮水溶液中研磨每个叶片以提取叶绿素。用80%丙酮水溶液稀释提取液10倍和按照Mackenney,G.,J.Biol.Chem.,140;第315页(1941)所述方法在750nm,663nm和645nm下测量吸光度以计算总叶绿素含量。通过显示处理的叶片的总叶绿素含量与未处理叶片的总叶绿素含量的百分点可以比较评估对化合物(I)的抗性的程度。作为本发明蛋白质(A),例如,可以提及本发明蛋白质(A)。
基于评估对化合物(I)或包含化合物(I)的除草组合物的抗性程度的上述方法,可以选择显示对化合物(I)或包含化合物(I)的除草组合物的抗性的植物或植物细胞。例如,选择从将化合物(I)或包含该化合物的除草组合物喷洒到植物栽培区域中未看到损伤的植物,或通过在化合物(I)的存在下培养仍连续生长的植物细胞。具体地例如,将土壤装填到具有例如10cm直径和10cm深度的塑料盆中。播种植物的种子并在温室中培养。通过混合5份包含化合物(I)的除草组合物,6份苏乳播(sorpol)3005X(Toho化学品)和89份二甲苯制备乳剂。用包含0.1%(v/v)粘着剂的水以1公顷1000L的比例稀释特定量的乳剂并用喷枪均匀地散布在来自上面在上述盆中培养的植物的叶子的所有面上。在温室中培养植物16天后,研究对植物的损伤。可以选择其中未观察到损伤的植物或其中损伤减轻的植物。进一步,通过交配这些选择的植物可以获得后代植物。
实施例
使用以下实施例更详细地解释本发明,但本发明不限于这些实施例。
在以下所示条件下进行实施例1,41和42中含量分析的HPLC和化合物的分级纯化。
(HPLC分析条件1)
柱:SUMIPAX ODS211(Sumika Chemical Analysis Service)
柱温:35℃
流速:1ml/分钟
检测波长:UV 254nm
洗脱剂A:0.01% TFA水溶液
洗脱剂B:乙腈
洗脱条件:将样品注射到用90%洗脱剂A和10%洗脱剂B的溶剂混合物平衡的柱中。然后流动90%洗脱剂A和10%洗脱剂B的溶剂混合物5分钟。这接着流动洗脱剂A和洗脱剂B的溶剂混合物20分钟,同时将洗脱剂B的比例从10%增加到90%。然后流动10%洗脱剂A和90%洗脱剂B的溶剂混合物8分钟。
实施例1通过微生物的化合物(II)的代谢
(1)化合物(II)的代谢
在ISP2琼脂培养基(1.0%(w/v)麦芽汁,0.4%(w/v)酵母提取物,0.4%(w/v)葡萄糖,2.0%(w/v)琼脂,pH7.3)中培养表1和2所示的各种微生物。将菌环量的每种微生物加入TGY培养基(0.5%(w/v)胰蛋白胨,0.5%(w/v)酵母提取物,0.1%(w/v)葡萄糖,0.01%(w/v)KH2PO4,pH7.0)并在30℃下振荡温育2-4天。将十分之一毫升(0.1ml)获得的培养物在包含100ppm化合物(II)的3ml孢子形成肉汤(0.1%(w/v)肉膏,0.2%(w/v)胰蛋白月示1%葡萄糖,pH7.1)中在30℃下振荡温育7-8天。将五十微升(50μl)2N HCl加入产生的培养物中并用3ml乙酸乙酯提取它。在HPLC上分析获得的乙酸乙酯层。减小化合物(II)的浓度(23.9分钟的柱保留时间),在21.6分钟和22.2分钟的保留时间检测到化合物的新峰(各自称为代谢物(I)和代谢物(II))。结果在表1和2中显示。
表1
  微生物菌株  化合物(II)的浓度(ppm)   代谢物(I)的峰面积(x104)   代谢物(II)的峰面积(x104)
  可可链霉菌阿苏亚种(Streptomycescacaoiasoensis)IFO 13813  77.8   3.43   3.57
  灰褐链霉菌IFO 12870t  49.5   7.96   9.86
  装饰链霉菌IFO 13069t  65.3   4.30   5.00
  热淡天蓝链霉菌IFO 14273t  51.7   7.47   9.16
  玫瑰产色链霉菌(Streptomycesroseochromogenes)ATCC 13400  81.9   0.71   0.82
  淡紫灰链霉菌(Streptomyceslavendulae)ATCC 11924  89.6   1.02   1.50
  灰色链霉菌ATCC 10137  65.6   6.19   1.30
  灰色链霉菌ATCC 11429  30.3   12.8   15.6
  灰色链霉菌ATCC 12475  51.1   0.52   2.27
  灰色链霉菌ATCC 15395  75.2   1.91   2.26
  红色糖多孢菌(Streptomyceserythreus)ATCC 11635  54.6   4.94   6.05
  疮痂病链霉菌(Streptomyces scabies)IFO 3111  88.3   3.28   4.40
  灰色链霉菌IFO 3102  22.6   14.4   18.5
  小串链霉菌(Streptomyces catenulae)IFO 12848  85.3   3.81   1.59
  春日链霉菌(Streptomyceskasugaensis)ATCC 15714  92.4   1.08   0.91
  龟裂链霉菌(Streptomyces rimosus)ATCC 10970  70.9   2.30   2.87
  不产色链霉菌IFO 12735  0.0   15.9   21.8
  利迪链霉菌(Streptomyces lydicus)IFO 13058  62.0   5.48   6.69
表2
  微生物菌株  化合物(II)的浓度(ppm)   代谢物(I)的峰面积(x104 )   代谢物(II)的峰面积(x104)
  暗产色链霉菌IFO 12898  46.4   8.28   10.5
  阿富汗链霉菌(Streptomycesafghaniensis)IFO 12831  80.6   2.54   3.59
  八丈岛链霉菌(Streptomyceshachijoensis)IFO 12782  83.9   4.99   2.91
  银样链霉菌丰中变种(Streptomycesargenteolus var.toyonakensis)ATCC21468  13.0   14.9   19.2
  砖红色链霉菌ATCC 21469  18.4   11.6   14.4
  浅绛红链霉菌(Streptomycespurpurascens)ATCC 25489  70.9   5.37   6.11
  灰产色链霉菌(Streptomycesgriseochromogenes)ATCC 14511  53.9   3.00   3.97
  春日链霉菌IFO 13851  66.3   12.1   12.6
  银样链霉菌丰中变种ATCC 21468t  90.1   2.75   3.01
  玫瑰产色链霉菌ATCC 13400t  71.8   4.66   4.00
  黑胡桃链霉菌IFO 13445  12.8   21.9   24.9
  Streptomyces rosechromogenusATCC 21895  74.2   4.14   5.87
  粪生链霉菌(Streptomycesfimicarius)ATCC 21900  46.5   8.33   11.3
  教酒链霉菌(Streptomyceschartreusis)ATCC 21901  61.1   3.70   3.94
  球孢链霉菌球孢亚种(Streptomycesglobisporus subsp.globisporus)ATCC21903  79.9   2.86   2.52
  浅灰链霉菌ATCC 11796  0   14.4   19.9
  塔氏糖多孢菌JCM 9383T   82.9   5.83   7.71
  链霉菌属物种SANK 62585   54.6   2.30   3.44
(2)代谢物(I)和代谢物(II)的结构测定
将灰色链霉菌ATCC 11429的冷冻原种加入3ml微生物培养基(0.7%(w/v)聚胨,0.5%(w/v)酵母提取物,1.0%(w/v)葡萄糖,0.5%(w/v)K2HPO4,pH7.2)并在试管中振荡温育过夜以获得预培养物。将该预培养物加入包含100ppm浓度的化合物(II)的300ml微生物培养基中。将这以每管3ml分到100个小试管中,并在30℃下振荡温育6天。在通过加入HCl将250ml的该培养物调节至pH2以后,用250ml乙酸乙酯萃取它。从乙酸乙酯层中去除溶剂。将残余物溶解于3ml丙酮中并点至TLC硅胶板上(TLC硅胶板60F254,20cm×20cm,0.25mm厚,Merck公司)。用甲苯,甲酸和甲酸乙酯的5∶7∶1(v/v/v)混合物展开TLC板。取Rf值为0.58左右的硅胶。用丙酮萃取TLC板的该内容物。从萃取层中去除丙酮。将残余物溶解于10ml乙腈中和用HPLC分级分离。回收仅包含代谢物(I)和代谢物(II)的级分以获得3.7mg代谢物(下文称为“代谢物A”)。
进行代谢物A的质谱分析。代谢物A具有比化合物(II)小14的质量。另外,从H-NMR分析,确定代谢物(A)是具有式(III)所示结构的化合物。
(3)化合物(III)的除草活性测试
将土壤装填到具有10cm直径和10cm深度的圆塑料盆中。在温室中播种和培养稗,大穗看麦娘,Ivyleaf morningglory10天。将五(5)份测试化合物,6份苏乳播3005X(Toho化学品公司)和89份二甲苯充分混合以产生乳剂。用包含0.1%(v/v)粘着剂的水以1公顷1000L的比例稀释特定量的乳剂并用喷枪均匀地散布在来自上面在上述盆中培养的植物的叶子的所有面上。在温室中培养植物16天后,研究测试化合物的除草活性。结果在表3中表示。
表3
 测试化合物   浓度(g/公顷)               除草活性
  稗   大穗看麦娘   Ivyleafmorningglory
 化合物(II)   500   10   10   10
  125   10   10   10
 化合物(III)   500   0   0   0
  125   0   0   0
将土壤装填到具有10cm直径和10cm深度的圆塑料盆中。播种稗,大穗看麦娘,Ivyleaf morningglory。将五(5)份测试化合物,6份苏乳播3005X(Toho化学品公司)和89份二甲苯充分混合以产生乳剂。用包含0.1%(v/v)粘着剂的水以1公顷1000L的比例稀释特定量的乳剂并用喷枪均匀地散布在土壤的表面上。在温室中培养植物19天后,研究除草活性。结果在表4中表示。
表4
 测试化合物   浓度(g/公顷)                除草活性
  稗   大穗看麦娘   Ivyleafmorningglory
 化合物(II)   500   10   10   10
 化合物(III)   500   0   0   0
在上面表3和4中,将除草活性的强度逐步表示为0,1,2,3,4,5,6,7,8,9,和10。数字“0”表示其中用于测试的植物检查时萌芽或生长与未处理施用比较并显示完全或基本上没有差异的情形。数字“10”表示其中植物完全枯萎或者萌芽或生长完全被抑制的情形。
实施例2本发明蛋白质(A1)的制备
(1)细胞粗提物的制备
将暗产色链霉菌IFO 12898的冷冻原种加入500ml三角烧瓶中的100ml A培养基(0.1%(w/v)葡萄糖,0.5%(w/v)胰蛋白胨,0.5%(w/v)酵母提取物,0.1%(w/v)磷酸氢二钾,pH7.0)并在30℃下旋转振荡温育1天以获得预培养物。将八毫升(8ml)预培养物加入200ml A培养基中并在30℃下在500ml带挡板的摇瓶中旋转振荡温育2天。通过将产生的培养物离心(3,000g,5分钟)回收细胞沉淀。将这些细胞沉淀悬浮在包含100ppm化合物(II)的100ml B培养基(1%(w/v)葡萄糖,0.1%牛肉膏,0.2%(w/v)胰蛋白月示)中并在30℃下在500ml坂口烧瓶中往复振荡温育16小时。通过将10L产生的培养物离心(3,000g,5分钟)回收细胞沉淀。用1L 0.1M磷酸钾缓冲液(pH7.0)洗涤产生的细胞沉淀2次以提供162g细胞沉淀。
以1g细胞沉淀2ml将这些细胞沉淀悬浮在0.1M磷酸钾缓冲液(pH7.0)中,向其中加入1mM PMSF,5mM苯甲脒HCl,1mM EDTA和1mM二硫垂陶耳(dithiotritol)。通过用弗氏压碎器(1000kg/cm2)(OhtakeSeisakusho)反复破裂细胞2次获得细胞裂解液。在将细胞裂解液离心(40,000xg,30分钟)以后,回收上清液并在150,000xg下离心1小时以回收上清液(以下称为“细胞粗提物”)。
(2)将化合物(II)转化为化合物(III)的能力的测定
制备0.1M磷酸钾缓冲液(pH7.0)的30μl反应液,其包含3ppm用14C标记的化合物(II),2.4mMβ-NADPH(以下称为“组分A”)(OrientalYeast Company),0.5mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例2(1)中回收的细胞粗提物。将反应溶液保持在30℃下1小时。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到TLC板(TLC硅胶板60F25420cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji FilmCompany)过夜。接着,在Image Analyzer BAS2000(Fuji Film Company)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表5中显示。
表5
                        反应组分   化合物(III)的斑点
  组分A   组分B   组分C   细胞粗提物   用14C标记的化合物(II)
  +   +   +   -   +   -
  +   +   +   +   +   +
  -   +   +   +   +   -
  +   -   -   +   +   -
(3)细胞粗提物的分级分离
将硫酸铵加入在实施例2(1)中获得的细胞粗提物至45%饱和的量。在冰冷却的条件下搅拌后,通过在12,000xg下离心10分钟回收上清液。在将硫酸铵加入到获得的上清液至55%饱和的量和在冰冷却的条件下搅拌以后,通过在12,000xg下离心10分钟回收沉淀。用27.5ml的20mM双三丙烷缓冲液(pH7.0)溶解沉淀。将该溶液进行PD10柱(AmershamPharmacia Company)和用20mM双三丙烷缓冲液(pH7.0)洗脱以回收38.5ml包含蛋白质的级分(以下称为“45-55%硫酸铵级分”)。
(4)本发明蛋白质(A1)的分离
将在实施例2(3)中制备的45-55%硫酸铵级分注射到HiLoad 26/10 QSepharose HP柱(Amersham Pharmacia Company)中。接下来,在106ml的20mM双三丙烷缓冲液(pH7.0)流进柱子以后,以NaCl线性梯度(NaCl的梯度是0.001415M/分钟,NaCl浓度的范围是0M-0.375M,流速为3ml/分钟)流动20mM双三丙烷缓冲液以分级回收在0.21M-0.22M的NaCl浓度下洗脱的25ml级分。进一步,将回收的级分进行PD10柱(AmershamPharmacia Biotech Company)和用20mM双三丙烷缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。
将回收的级分进行PD10柱(Amersham Pharmacia Biotech Company),用缓冲液A(包含1.5mM NaCl的2mM磷酸钾缓冲液,pH7.0)洗脱,以便回收包含蛋白质的级分。接下来,将级分注射于Bio-Scale Ceramic羟磷灰石I型柱子CHT10-I(BioRad Company)中。将三十毫升(30ml)缓冲液A流进柱子。随后,缓冲液A和线性梯度的缓冲液B(包含0.03mMNaCl的100mM磷酸钾缓冲液;线性梯度从100%缓冲液A开始在100分钟期间增加至50%缓冲液B,流速为2ml/分钟)一起流动以分级回收在17%-20%的缓冲液B的浓度下洗脱的级分。进一步,将回收的级分进行PD10柱(Amersham Pharmacia Biotech Company)并用0.05M磷酸钾缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。
使用超滤膜(Microcon YM-30,Millipore Company)将回收的级分浓缩20倍并注射到HiLoad 16/60 Superdex 75pg柱(Amersham PharmaciaBiotech Company)中。包含0.15M NaCl(pH7.0)的五十毫摩尔(50mM)磷酸钾缓冲液流进(流速1ml/分钟)柱子。以每个2ml将洗脱物分级。将在56ml-66ml的洗脱体积下洗脱的级分各自分级回收。用10%-20%SDS-PAGE分析在每个级分中包含的蛋白质。
类似于实施例2(2),在组分A,组分B,组分C和用14C标记的组合物(II)的存在下,加入和保持回收的级分而不是在实施例2(2)所述反应溶液中的细胞粗提物。将保持以后的反应溶液TLC分析以检查对应于用14C标记的化合物(III)的斑点的强度。观察到在上述SDS-PAGE中移动至47kDa位置的蛋白质在依次加入的级分条带的浓度方面具有平行于对应于化合物(III)的斑点的强度波动的波动。从SDS-PAGE凝胶中回收所述蛋白质并用蛋白质测序仪(Applied Biosystems Company,Procise494HT,脉冲液相方法)进行氨基酸序列分析。结果,提供在SEQ ID NO:18中表示的氨基酸序列。另外,在用胰蛋白酶消化上述蛋白质以后,在质谱仪(ThermoQuest Company,离子阱质谱仪LCQ,柱:LC PackingsCompany PepMap C18 75μm×150mm,溶剂A:0.1% HOAc-H2O,溶剂B:0.1% HOAc-甲醇,梯度:从用95%溶剂A和5%溶剂B的混合物洗脱开始在30分钟内增加到100%溶剂B的浓度的线性梯度,流速:0.2μl/分钟)上分析获得的消化物。结果,提供在SEQ ID NO:19中表示的氨基酸序列。
实施例3获得本发明DNA(A1)
(1)暗产色链霉菌IFO 12898的染色体DNA的制备
在50ml YEME培养基(0.3%(w/v)酵母提取物,0.5%(w/v)细菌用蛋白胨,0.3%(w/v)麦芽汁,1.0%(w/v)葡萄糖,34%(w/v)蔗糖和0.2%(v/v)2.5MgCl2·6H2O)中将暗产色链霉菌IFO 12898在30℃下振荡温育1天至3天。回收细胞。将获得的细胞悬浮在包含1.4%(w/v)甘氨酸和60mM EDTA的YEME培养基中并进一步振荡温育1天。从培养基中回收细胞。在用蒸馏水洗涤一次以后,以每200mg细胞1ml将它重悬浮在缓冲液(100mM Tris-HCl(pH8.0),100mM EDTA,10mM NaCl)中。加入二百微克每毫升(200μg/ml)的卵清溶菌酶。将细胞混悬液在30℃下振荡温育1小时。另外,加入0.5% SDS和1mg/ml蛋白酶K。将细胞混悬液在55℃下温育3小时。用酚,氯仿和异戊醇的混合物萃取细胞混悬液2次以回收每个水层。接下来,用氯仿和异戊醇的混合物萃取一次以回收水层。通过从水层中乙醇沉淀获得染色体DNA。
(2)暗产色链霉菌IFO 12898的染色体DNA文库的制备
用1单位限制酶Sau3AI在37℃下消化在实施例3(1)中制备的九百四十三纳克(943ng)染色体DNA60分钟。用0.7%琼脂糖凝胶电泳分离获得的消化液。从凝胶中回收约2.0kbp的DNA。按照所述试剂盒附带的说明书用Prep-A-GeneR DNA纯化试剂盒(Bio-Rad公司)纯化DNA以获得10μl包含目标DNA的溶液。将一微升(1μl)DNA溶液,98ng用限制酶BamHI消化和用去磷酸化处理的质粒载体pUC118和11μl来自连接试剂盒第二版(Takara Shuzo Company)的溶液I混合和在16℃下温育过夜。使用5μl连接溶液转化大肠杆菌DH5α。将大肠杆菌在30℃下振荡培养过夜。从获得的培养基中,回收大肠杆菌。提取质粒以提供染色体DNA文厍。
(3)本发明DNA(A1)的分离
通过将在实施例3(1)中制备的染色体DNA用作模板进行PCR(图1)。作为引物,使用具有SEQ ID NO:35所示核苷酸序列的寡核苷酸和具有SEQ ID NO:36所示核苷酸序列的寡核苷酸的配对(以下称为“引物对1”)。基于编码SEQ ID NO:18所示氨基酸序列的核苷酸序列设计SEQ IDNO:35所示核苷酸序列。另外,基于与编码SEQ ID NO:19所示氨基酸序列的核苷酸序列互补的核苷酸序列设计SEQ ID NO:36所示核苷酸序列。通过加入2种每种总计200nM的引物,250ng上述染色体DNA,0.5μldNTP混合物(4种dNTP每种10mM的混合物;Clontech公司),5μl 5xGC基因组PCR反应缓冲液(Clontech公司),1.1μl 25mM Mg(OAc)2,5μl 5MGC-Melt(Clontech公司)和0.5μl Advantage-GC基因组聚合酶混合物(Clontech公司)和蒸馏水,PCR反应溶液总计25μl。PCR的反应条件是在保持在95℃ 1分钟后,重复30个循环,一个循环包括保持在94℃ 15秒,接着60℃ 30秒,接着72℃ 1分钟,然后保持在72℃ 5分钟。在保持后,将反应溶液进行4%琼脂糖凝胶电泳。回收包含约150bp的DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到TA克隆载体pCR2.1(Invitrogen公司)并导入大肠杆菌TOP10F’。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用-21M13引物(Applied Biosystems日本公司)和M13Rev引物(AppliedBiosystems日本公司)作为引物,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。结果,提供在SEQ ID NO:9中表示的核苷酸序列的核苷酸36至132所示的核苷酸序列。所述核苷酸序列编码在SEQ ID NO:18所示氨基酸序列的氨基酸12至23中表示的氨基酸序列。在这点上,期望所述DNA编码本发明蛋白质(A1)的一部分。
接下来,类似上面用Advantage-GC基因组聚合酶混合物(Clontech公司)和通过将在实施例3(2)中制备的染色体DNA用作模板进行PCR。使用具有SEQ ID NO:37所示核苷酸序列的寡核苷酸和具有SEQ ID NO:38所示核苷酸序列的寡核苷酸的配对(以下称为“引物对2”)或具有SEQID NO:39所示核苷酸序列的寡核苷酸和具有SEQ ID NO:40所示核苷酸序列的寡核苷酸的配对(以下称为“引物对3”)作为引物。
接下来,通过PCR扩增具有其中3’末端延伸过SEQ ID NO:9所示核苷酸序列的核苷酸132所示核苷酸的核苷酸序列的DNA。通过将使用引物对2获得的反应溶液作为模板溶液和通过使用具有SEQ ID NO:41所示核苷酸序列的寡核苷酸和具有SEQ ID NO:38所示核苷酸序列的寡核苷酸的配对(以下称为“引物对4”)作为引物进行PCR。类似地,通过PCR扩增具有其中5’末端延伸过SEQ ID NO:9所示核苷酸序列的核苷酸36所示核苷酸的核苷酸序列的DNA。通过将使用引物对3获得的反应溶液作为模板溶液和通过使用具有SEQ ID NO:42所示核苷酸序列的寡核苷酸和具有SEQ ID NO:40所示核苷酸序列的寡核苷酸的配对(以下称为“引物对5”)作为引物进行PCR。类似于上面,将使用引物对4扩增的2kb DNA和使用引物对5扩增的150bp DNA克隆到TA克隆载体pCR2.1中。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用-21M13引物(AppliedBiosystems日本公司)和M13Rev引物(Applied Biosystems日本公司)和SEQ ID NO:43-50所示寡核苷酸作为引物,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。作为将通过使用引物对4扩增的2kbp DNA的核苷酸序列测序的结果,提供在SEQ ID NO:9所示核苷酸序列的核苷酸133至1439中所表示的核苷酸序列。另外,作为将通过使用引物对5扩增的150bp DNA的核苷酸序列测序的结果,提供在SEQ ID NO:9所示核苷酸序列的核苷酸1至35中所表示的核苷酸序列。作为连接获得的核苷酸序列的结果,获得在SEQ ID NO:9中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1227个核苷酸(包括终止密码子)组成和编码408个氨基酸残基的核苷酸序列(SEQ ID NO:6)以及由201个核苷酸(包括终止密码子)组成和编码66个氨基酸残基的核苷酸序列(SEQ ID NO:15)。由SEQ ID NO:6所示核苷酸序列编码的氨基酸序列(SEQ ID NO:1)组成的蛋白质的分子量据计算为45213Da。另外,由所述核苷酸序列编码的氨基酸序列包含从本发明蛋白质(A1)的N末端氨基酸测序测定的氨基酸序列(SEQ ID NO:18)和用质谱分析从胰蛋白酶消化片段的氨基酸测序测定的氨基酸序列(SEQ ID NO:19)。由SEQID NO:15所示核苷酸序列编码的氨基酸序列(SEQ ID NO:12)组成的蛋白质的分子量据计算为6818Da。
实施例4本发明蛋白质(A1)在大肠杆菌中的表达
(1)含有本发明蛋白质(A1)的转化大肠杆菌的产生
通过将在实施例3(1)中从暗产色链霉菌IFO 12898制备的染色体DNA用作模板和通过使用Expand High Fidelity PCR System(RocheMolecular Biochemicals Company)进行PCR。作为引物,使用具有SEQ IDNO:51所示核苷酸序列的寡核苷酸和具有SEQ ID NO:52所示核苷酸序列的寡核苷酸的配对(以下称为“引物对19”)或具有SEQ ID NO:51所示核苷酸序列的寡核苷酸和具有SEQ ID NO:53所示核苷酸序列的寡核苷酸的配对(以下称为“引物对20”)。通过加入2种每种总计300nM的引物,50ng上述染色体DNA,5.0μl dNTP混合物(4种dNTP每种2.0mM的混合物),5.0μl 10x Expand HF缓冲液(包含MgCl2)和0.75μl Expand HiFi酶混合物和蒸馏水,PCR反应溶液总计50μl。PCR的反应条件是在保持在97℃ 2分钟后;重复10个循环,一个循环包括保持在97℃ 15秒,接着65℃ 30秒,接着72℃ 2分钟;然后进行15个循环,一个循环包括保持在97℃ 15秒,接着68℃ 30秒,接着72℃ 2分钟(其中每个循环增加20秒保持在72℃);然后保持在72℃ 7分钟。在保持后,将反应溶液进行1%琼脂糖凝胶电泳。从经历使用引物对19的反应溶液的凝胶中回收包含约1.2kbp的DNA的凝胶区域。从经历使用引物对20的反应溶液的凝胶中回收包含约1.5kbp的DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到TA克隆载体pCR2.1(Invitrogen公司)并导入大肠杆菌TOP10F’。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用作为引物的-21M13引物(AppliedBiosystems日本公司)和M13Rev引物(Applied Biosystems日本公司),具有SEQ ID NO:43所示核苷酸序列的寡核苷酸和具有SEQ ID NO:46所示核苷酸序列的寡核苷酸,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。基于结果,将含有SEQ ID NO:6所示核苷酸序列的质粒命名为pCR657和将含有SEQ ID NO:9所示核苷酸序列的质粒命名为pCR657F。
另外,将具有SEQ ID NO:134所示核苷酸序列的寡核苷酸和具有SEQID NO:135所示核苷酸序列的寡核苷酸一起退火以提供接头(图47)。用HindIII和XmnI消化质粒pKSN24R2(Akiyoshi-ShibaTa M.等,Eur.J.Biochem.224:P335(1994))。将接头插入获得的约3kb的DNA。将获得的质粒命名为pKSN2(图4)。
接下来,用限制酶NdeI和HindIII消化pCR657和pCR657F中的每一个。将消化产物进行琼脂糖凝胶电泳。从进行pCR657消化产物的凝胶中切割包含约1.2kbp DNA的凝胶区域。从进行pCR657F消化产物的凝胶中切割包含约1.5kbp DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所示试剂盒附带的说明书用连接试剂盒版本1(Takara Shuzo Company)连接用NdeI和HindIII消化的每种获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体制备质粒DNA。分析其结构。将其中编码本发明蛋白质(A1)的约1.2kbp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:6所示核苷酸序列的质粒命名为pKSN657。另外,将其中编码本发明蛋白质(A1)的约1.5kbp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:9所示核苷酸序列的质粒命名为pKSN657F。将上述质粒pKSN657和pKSN657F中的每一个导入大肠杆菌JM109。将获得的大肠杆菌转化体分别命名为JM109/pKSN657和JM109/pKSN657F。另外,将质粒pKSN2导入大肠杆菌JM109。获得的大肠杆菌转化体命名为JM109/pKSN2。
(2)本发明蛋白质(A1)在大肠杆菌中的表达和所述蛋白质的回收
将大肠杆菌JM109/pKSN657,JM109/pKSN657F和JM109/pKSN2各自在37℃下在包含50μg/ml氨苄青霉素的10ml TB培养基(1.2%(w/v)胰蛋白胨,2.4%(w/v)酵母提取物,0.4%(w/v)甘油,17mM磷酸二氢钾,72mM磷酸氢二钾)中培养过夜。将一毫升(1ml)获得的培养物转移至包含50μg/ml氨苄青霉素的100ml TB培养基中并在26℃下培养。当OD660到达约0.5时,将5-氨基乙酰丙酸加至500μM的终浓度,继续培养。三十(30)分钟后,将IPTG加至1mM的终浓度,进一步培养17小时。
从每个培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1mM PMSF的上述缓冲液中。将获得的细胞混悬液在输出量为3,占空因数(duty cycle)30%的条件下进行超声波仪(Sonifer(Branson Sonic Power Company))6次,每次3分钟,以便获得细胞裂解液。在将细胞裂解液离心(1,200xg,5分钟)后回收上清液和离心(150,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSN657中获得的上清液级分称为“大肠杆菌pKSN657提取物”,将从大肠杆菌JM109/pKSN657F中获得的上清液级分称为“大肠杆菌pKSN657F提取物”,将从大肠杆菌JM109/pKSN2中获得的上清液级分称为“大肠杆菌pKSN2提取物”)。在15%-25% SDS-PAGE上分析一微升(1μl)上述上清液级分并用考马斯蓝(以下称为“CBB”)染色。结果,在大肠杆菌pKSN657提取物和大肠杆菌pKSN657F提取物中都检测到比大肠杆菌pKSN2提取物显著更强烈的条带,其位于对应于47kDa分子量的电泳位置。在大肠杆菌pKSN657F提取物中检测到比大肠杆菌pKSN657提取物更强烈的条带。显示大肠杆菌JM109/pKSN657F比大肠杆菌JM109/pKSN657更高程度地表达本发明蛋白质(A1)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下1小时。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),0.2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例4(2)中回收的上清液级分。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和搅拌到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到TLC板(TLC硅胶板60F254 20cm×20cm,0.25厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(FujiFilm Company)过夜。接着,在Image Analyzer BAS2000(Fuji FilmCompany)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表6中显示。
表6
                      反应组分   化合物(III)的斑点
  组分A   组分B   组分C   大肠杆菌提取物   用14C标记的化合物(II)
  +   +   +   -   +   -
  +   +   +   pKSN2   +   -
  +   +   +   pKSN657   +   +
  -   +   +   pKSN657   +   -
  +   -   +   pKSN657   +   -
  +   +   -   pKSN657   +   +
  +   +   +   pKSN657F   +   +
  -   +   +   pKSN657F   +   -
  +   -   +   pKSN657F   +   -
  +   +   -   pKSN657F   +   +
实施例5本发明蛋白质(A2)的制备
(1)细胞粗提物的制备
将塔氏糖多孢菌JCM 9383t的冷冻原种加入10ml试管中的10ml A培养基(0.1%(w/v)葡萄糖,0.5%(w/v)胰蛋白胨,0.5%(w/v)酵母提取物,0.1%(w/v)磷酸氢二钾,pH7.0)并在30℃下振荡温育1天以获得预培养物。将八毫升(8ml)预培养物加入200ml A培养基中并在30℃下在500ml带挡板的摇瓶中旋转培养2天。通过将10L产生的培养物离心(3,000g,10分钟)回收细胞沉淀。将这些细胞沉淀悬浮在包含100ppm化合物(II)的100ml B培养基(1%(w/v)葡萄糖,0.1%牛肉膏,0.2%(w/v)胰蛋白月示)中并在30℃下在500ml坂口烧瓶中往复振荡温育20小时。通过将10L产生的培养物离心(3,000xg,10分钟)回收细胞沉淀。用1L 0.1M磷酸钾缓冲液(pH7.0)洗涤产生的细胞沉淀2次以提供119g细胞沉淀。
以1g细胞沉淀2ml将这些细胞沉淀悬浮在0.1M磷酸钾缓冲液(pH7.0)中。加入一毫摩尔(1mM)PMSF,5mM苯甲脒HCl,1mM EDTA,3μg/ml亮抑酶肽,3μg/ml抑胃酶肽和1mM二硫垂陶耳。通过用弗氏压碎器(1000kg/cm2)(Ohtake Seisakusho)反复破裂混悬液2次获得细胞裂解液。在将细胞裂解液离心(40,000xg,30分钟)以后,回收上清液并在150,000xg下离心1小时以回收上清液(以下称为“细胞粗提物”)。
(2)将化合物(II)转化为化合物(III)的能力的测定
制备0.1M磷酸钾缓冲液(pH7.0)的30μl反应溶液,其包含3ppm用14C标记的化合物(II),2.4mM β-NADPH(以下称为“组分A”)(OrientalYeast Company),0.5mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例5(1)中回收的细胞粗提物。将反应体系保持在30℃下1小时。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到TLC板(TLC硅胶板60F254 20cm×20cm,0.25厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji FilmCompany)过夜。接着,在Image Analyzer BAS2000(Fuji Film Company)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表7中显示。
表7
                      反应组分   化合物(III)的斑点
  组分A   组分B   组分C   细胞粗提物  用14C标记的化合物(II)
  +   +   +   -  +   -
  +   +   +   +  +   +
  -   +   +   +  +   -
  +   -   -   +  +   -
(3)细胞粗提物的分级分离
将硫酸铵加入在实施例5(1)中获得的细胞粗提物至45%饱和的量。在冰冷却的条件下搅拌,通过在12,000xg下离心10分钟回收上清液。在将硫酸铵加入获得的上清液至55%饱和的量和在冰冷却的条件下搅拌以后,通过在12,000xg下离心10分钟回收沉淀。用32.5ml的20mM双三丙烷缓冲液(pH7.0)溶解沉淀。将该溶液进行PD10柱(AmershamPharmacia Company)和用20mM双三丙烷缓冲液(pH7.0)洗脱以回收45.5ml包含蛋白质的级分(以下称为“45-55%硫酸铵级分”)。
(4)本发明蛋白质(A2)的分离
将在实施例5(3)中制备的45-55%硫酸铵级分注射到HiLoad 26/10QSepharose HP柱(Amersham Pharmacia Company)中。接下来,在100ml的20mM双三丙烷缓冲液(pH7.0)流进柱子以后,以NaCl线性梯度(NaCl的梯度是0.004M/分钟,NaCl浓度的范围是0M-0.5M,流速为8ml/分钟)流动20mM双三丙烷缓冲液以分级回收在0.25M-0.26M的NaCl浓度下洗脱的30ml级分。进一步,将回收的级分进行PD10柱(AmershamPharmacia Biotech Company)和用20mM双三丙烷缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。
将回收的级分进行PD10柱(Amersham Pharmacia Biotech Company),用缓冲液A(包含1.5mM NaCl的2mM磷酸钾缓冲液,pH7.0)洗脱,以便回收包含蛋白质的级分。接下来,将级分注射于Bio-Scale Ceramic羟磷灰石I型柱子CHT10-I(BioRad Company)中。将二十毫升(20ml)缓冲液A流进柱子。随后,缓冲液A和线性梯度的缓冲液B(包含0.03mMNaCl的100mM磷酸钾缓冲液;线性梯度从100%缓冲液A开始在100分钟期间增加至50%缓冲液B,流速为2ml/分钟)一起流动以分级回10ml收在23%-25%的缓冲液B的浓度下洗脱的级分。进一步,将回收的级分进行PD10柱(Amersham Pharmacia Biotech Company)并用0.05M磷酸钾缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。
使用超滤膜(Microcon YM-30,Millipore Company)将回收的级分浓缩至约770μl并注射到HiLoad 16/60 Superdex 75pg柱(AmershamPharmacia Biotech Company)中。包含0.15M NaCl(pH7.0)的五十毫摩尔(50mM)磷酸钾缓冲液流进(流速1ml/分钟)柱子。以每个2ml将洗脱液分级。将在61ml左右的洗脱体积下洗脱的级分各自分级回收。用10%-20% SDS-PAGE分析在每个级分中包含的蛋白质。
类似于实施例5(2),在组分A,组分B,组分C和用14C标记的化合物(II)的存在下,加入和保持回收的级分而不是在实施例5(2)所述反应溶液中的细胞粗提物。将保持以后的反应溶液TLC分析以检查对应于用14C标记的化合物(III)的斑点的强度。观察到在上述SDS-PAGE中移动至47kDa位置的蛋白质在依次加入的级分条带的浓度方面具有平行于对应于化合物(III)的斑点的强度波动的波动。从SDS-PAGE凝胶中回收所述蛋白质并用蛋白质测序仪(Applied Biosystems Company,Procise494HT,脉冲液相方法)进行氨基酸序列分析以测序N末端氨基酸序列。结果,提供在SEQ ID NO:20中表示的氨基酸序列。另外,在用胰蛋白酶消化上述蛋白质以后,在质谱仪(ThermoQuest Company,离子阱质谱仪LCQ,柱:LC Packings Company PepMap C18 75μm×150mm,溶剂A:0.1% HOAc-H2O,溶剂B:0.1% HOAc-甲醇,梯度:从用95%溶剂A和5%溶剂B的混合物洗脱开始在30分钟内增加到100%溶剂B的浓度的线性梯度,流速:0.2μl/分钟)上分析获得的消化物。结果,提供在SEQ IDNO:21中表示的氨基酸序列。
实施例6获得本发明DNA(A2)
(1)塔氏糖多孢菌JCM 9383t的染色体DNA的制备
在50ml YEME培养基(0.3%(w/v)酵母提取物,0.5%(w/v)细菌用蛋白胨,0.3%(w/v)麦芽汁,1.0%(w/v)葡萄糖,34%(w/v)蔗糖和0.2%(v/v)2.5MgCl2·6H2O)中将塔氏糖多孢菌JCM 9383t在30℃下振荡温育1天至3天。回收细胞。将获得的细胞悬浮在包含1.4%(w/v)甘氨酸和60mM EDTA的YEME培养基中并进一步振荡温育1天。从培养基中回收细胞。在用蒸馏水洗涤一次以后,以每200mg细胞沉淀1ml将它重悬浮在缓冲液(100mM Tris-HCl(pH8.0),100mM EDTA,10mMNaCl)中。加入二百微克每毫升(200μg/ml)的卵清溶菌酶。将细胞混悬液在30℃下振荡温育1小时。另外,加入0.5% SDS和1mg/ml蛋白酶K。将细胞混悬液在55℃下温育3小时。用酚·氯仿·异戊醇萃取细胞混悬液2次以回收每个水层。接下来,用氯仿·异戊醇萃取一次以回收水层。通过乙醇沉淀水层获得染色体DNA。
(2)塔氏糖多孢菌JCM 9383t的染色体DNA文库的制备
用0.78U限制酶Sau3AI在37℃下消化在实施例5(1)中制备的十九微克(19μg)染色体DNA 60分钟。用1%琼脂糖凝胶电泳分离获得的消化液。从凝胶中回收约2.0kbp的DNA。按照所述试剂盒附带的说明书用QIA快速凝胶提取试剂盒(Qiagen公司)纯化DNA并用乙醇沉淀浓缩以获得10μl包含目标DNA的溶液。将八微升(8μl)DNA溶液,100ng用限制酶BamHI消化和用去磷酸化处理的质粒载体pUC118和12μl来自连接试剂盒第二版(Takara Shuzo Company)的溶液I混合和在16℃下保持3小时。用连接溶液转化大肠杆菌DH5α。将大肠杆菌转化体在37℃下在包含50mg/l氨苄青霉素的LB琼脂培养基中培养过夜。从琼脂培养基中回收获得的菌落。提取质粒并称为染色体DNA文库。
(3)本发明DNA(A2)的分离
通过将在实施例6(1)中制备的染色体DNA用作模板用Expand HiFiPCR系统(Boehringer Manheim Company)进行PCR(图2)。作为引物,使用具有SEQ ID NO:54所示核苷酸序列的寡核苷酸和具有SEQ ID NO:55所示核苷酸序列的寡核苷酸的配对(以下称为“引物对6”)。基于编码SEQ ID NO:20所示N末端氨基酸序列的核苷酸序列设计SEQ ID NO:54所示核苷酸序列。另外,基于与编码SEQ ID NO:21所示内部氨基酸序列的核苷酸序列互补的核苷酸序列设计SEQ ID NO:55所示核苷酸序列。通过加入300ng上述染色体DNA,2种每种总计7.5pmol的引物,0.2μldNTP混合物(4种dNTP每种2mM的混合物),2.5μl 10x缓冲液(包含MgCl2),0.19μl Expand HiFi酶混合物和蒸馏水,PCR反应溶液总计25μl。PCR的反应条件是在保持在97℃ 2分钟后,重复10个循环,一个循环包括保持在97℃ 15秒,接着65℃ 30秒,接着72℃ 1分钟;然后进行15个循环,一个循环包括保持在97℃ 15秒,接着65℃ 30秒,接着72℃ 1分钟(其中每个循环增加保持在72℃下20秒);然后保持在72℃ 7分钟。在保持后,将反应溶液进行2%琼脂糖凝胶电泳。回收包含约800bp的DNA的凝胶区域。通过按照附带的说明书使用Qiagen快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到TA克隆载体pCRII-TOPO(Invitrogen公司)并导入大肠杆菌TOP10F’。使用Qiagen Tip20(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用-21M13引物(Applied Biosystems日本公司)和M13Rev引物(Applied Biosystems日本公司)作为引物,用染料终止循环测序FS简易反应试剂盒(AppliedBiosystems日本公司)进行测序反应。用DNA测序仪373A(AppliedBiosystems日本公司)分析反应产物。结果,提供在SEQ ID NO:10中表示的核苷酸序列的核苷酸36至819所示的核苷酸序列。SEQ ID NO:10所示核苷酸序列的核苷酸37-60编码部分SEQ ID NO:20所示氨基酸序列。在这点上,期望所述DNA编码本发明蛋白质(A2)的一部分。
接下来,通过将在实施例6(2)中制备的染色体DNA用作模板和类似上面用Expand HiFi PCR系统进行PCR。使用具有SEQ ID NO:56所示核苷酸序列的寡核苷酸和具有SEQ ID NO:57所示核苷酸序列的寡核苷酸的配对(以下称为“引物对7”)作为引物。通过使用这些引物进行PCR,扩增具有其中5’末端延伸过SEQ ID NO:10所示核苷酸序列的核苷酸36所示核苷酸的核苷酸序列的DNA。另外,使用具有SEQ ID NO:58所示核苷酸序列的寡核苷酸和具有SEQ ID NO:59所示核苷酸序列的寡核苷酸的配对(以下称为“引物对8”)作为引物。通过使用这些引物进行PCR,扩增具有其中3’末端延伸过SEQ ID NO:10所示核苷酸序列的核苷酸819所示核苷酸的核苷酸序列的DNA。将使用引物对7扩增的1.3kb DNA和使用引物对8扩增的0.4kb DNA每个克隆到TA克隆载体pCRII-TOPO中。使用Qiagen Tip 20(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用-21M13引物(AppliedBiosystems日本公司)和M13Rev引物(Applied Biosystems日本公司)和SEQ ID NO:60所示寡核苷酸作为引物,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。作为将通过使用引物对7扩增的1.3kb DNA的核苷酸序列测序的结果,提供在SEQ ID NO:10所示核苷酸序列的核苷酸1至35中所表示的核苷酸序列。另外,作为将通过使用引物对8扩增的0.4kb DNA的核苷酸序列测序的结果,提供在SEQ IDNO:10所示核苷酸序列的核苷酸819至1415中所表示的核苷酸序列。作为连接获得的核苷酸序列的结果,获得在SEQ ID NO:10中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1206个核苷酸(包括终止密码子)组成和编码401个氨基酸残基的核苷酸序列(SEQ ID NO:7)以及由198个核苷酸(包括终止密码子)组成和编码65个氨基酸残基的核苷酸序列(SEQ ID NO:16)。由SEQ ID NO:7所示核苷酸序列编码的氨基酸序列(SEQ ID NO:2)组成的蛋白质的分子量据计算为43983Da。另外,由所述核苷酸序列编码的氨基酸序列包含从本发明蛋白质(A2)的N末端氨基酸测序测定的氨基酸序列(SEQ ID NO:20)和用质谱分析从胰蛋白酶消化片段的氨基酸测序测定的氨基酸序列(SEQ IDNO:21)。由SEQ ID NO:16所示核苷酸序列编码的氨基酸序列(SEQ IDNO:13)组成的蛋白质的分子量据计算为6707Da。
实施例7本发明蛋白质(A1)在大肠杆菌中的表达
(1)含有本发明蛋白质(A2)的转化大肠杆菌的产生
通过将在实施例6(1)中从塔氏糖多孢菌JCM 9383t制备的染色体DNA用作模板和通过使用Expand HiFi PCR System(Boehringer ManheimCompany)进行PCR。作为引物,使用具有SEQ ID NO:61所示核苷酸序列的寡核苷酸和具有SEQ ID NO:62所示核苷酸序列的寡核苷酸的配对(以下称为“引物对21”)或具有SEQ ID NO:61所示核苷酸序列的寡核苷酸和具有SEQ ID NO:63所示核苷酸序列的寡核苷酸的配对(以下称为“引物对22”)。通过加入2种每种总计300nM的引物,50ng上述染色体DNA,5.0μl dNTP混合物(4种dNTP每种2.0mM的混合物),5.0μl 10xExpand HF缓冲液(包含MgCl2)和0.75μl Expand HiFi酶混合物和蒸馏水,PCR反应溶液总计50μl。PCR的反应条件是在保持在97℃ 2分钟后;重复10个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 1分钟;然后进行15个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 1分钟(其中每个循环增加20秒保持在72℃);然后保持在72℃ 7分钟。在保持后,将反应溶液进行1%琼脂糖凝胶电泳。从经历利用引物对21的反应溶液的凝胶中回收包含约1.2kbp的DNA的凝胶区域。从经历利用引物对22的反应溶液的凝胶中回收包含约1.4kbp的DNA的凝胶区域。通过按照附带的说明书使用Qiagen快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到克隆载体pCRII-TOPO(Invitrogen公司)并导入大肠杆菌TOP10F’。使用Qiagen Tip20(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。接着,按照所述试剂盒附带的说明书,使用作为引物的-21M13引物(Applied Biosystems日本公司)和M13Rev引物(Applied Biosystems日本公司),具有SEQ ID NO:56所示核苷酸序列的寡核苷酸和具有SEQ ID NO:64所示核苷酸序列的寡核苷酸,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。基于结果,将具有SEQ ID NO:7所示核苷酸序列的质粒命名为pCR923和将具有SEQ ID NO:10所示核苷酸序列的质粒命名为pCR923F。
接下来,用限制酶NdeI和HindIII消化质粒pCR923和pCR923F中的每一个。将消化产物进行琼脂糖凝胶电泳。从进行pCR923消化产物的凝胶中切割包含约1.2kbp DNA的凝胶区域。从进行pCR923F消化产物的凝胶中切割包含约1.4kbp DNA的凝胶区域。通过按照附带的说明书使用Qiagen快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述试剂盒附带的说明书用连接试剂盒版本1(Takara ShuzoCompany)连接用NdeI和HindIII消化的每种获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体制备质粒DNA。分析其结构。将其中编码本发明蛋白质(A2)的约1.2kbp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:7所示核苷酸序列的质粒命名为pKSN923。另外,将其中编码本发明蛋白质(A2)的约1.4kbpDNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:10所示核苷酸序列的质粒命名为pKSN923F。将上述质粒pKSN923和pKSN923F中的每一个导入大肠杆菌JM109。将获得的大肠杆菌转化体分别命名为JM109/pKSN923和JM109/pKSN923F。另外,将质粒pKSN2导入大肠杆菌JM109。获得的大肠杆菌转化体命名为JM109/pKSN2。
(2)本发明蛋白质(A2)在大肠杆菌中的表达和所述蛋白质的回收
将大肠杆菌JM109/pKSN657,JM109/pKSN657F和JM109/pKSN2各自在37℃下在包含50μg/ml氨苄青霉素的10ml TB培养基(1.2%(w/v)胰蛋白胨,2.4%(w/v)酵母提取物,0.4%(w/v)甘油,17mM磷酸二氢钾,72mM磷酸氢二钾)中培养过夜。将一毫升(1ml)获得的培养物转移至包含50μg/ml氨苄青霉素的100ml TB培养基中并在26℃下培养。当OD660到达约0.5时,将5-氨基乙酰丙酸加至500μM的终浓度,继续培养。三十(30)分钟后,将IPTG加至1mM的终浓度,进一步培养17小时。
从每个培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1mM PMSF的所述缓冲液中。将获得的细胞混悬液在输出量为3,占空因数30%的条件下进行超声波仪(Sonifer(Branson SonicPower Company))6次,每次3分钟,以便获得细胞裂解液。在将细胞裂解液离心(1,200xg,5分钟)后回收上清液和离心(150,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSN923中获得的上清液级分称为“大肠杆菌pKSN923提取物”,将从大肠杆菌JM109/pKSN923F中获得的上清液级分称为“大肠杆菌pKSN923F提取物”,将从大肠杆菌JM109/pKSN2中获得的上清液级分称为“大肠杆菌pKSN2提取物”)。在15%-25% SDS-PAGE上分析一微升(1μl)上述上清液级分并用CBB染色。结果,在大肠杆菌pKSN923提取物和大肠杆菌pKSN923F提取物中都检测到比大肠杆菌pKSN2提取物显著更强烈的条带,其位于对应于47kDa分子量的电泳位置。证实大肠杆菌JM109/pKSN923和大肠杆菌JM109/pKSN923F表达本发明蛋白质(A2)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),0.2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例7(2)中回收的上清液级分。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F254 20cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji Film Company)过夜。接着,在Image Analyzer BAS2000(Fuji FilmCompany)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表8中显示。
表8
                    反应组分   化合物(III)的斑点
  组分A   组分B   组分C   大肠杆菌提取物   用14C标记的化合物(II)
  +   +   +   -   +   -
  +   +   +   pKSN2   +   -
  +   +   +   PKSN923   +   +
  -   +   +   pKSN923   +   -
  +   -   +   pKSN923   +   -
  +   +   -   pKSN923   +   +
  +   +   +   pKSN923F   +   +
  -   +   +   pKSN923F   +   -
  +   -   +   pKSN923F   +   -
  +   +   -   pKSN923F   +   +
实施例8本发明蛋白质(A10)的制备
(1)细胞粗提物的制备
将浅灰链霉菌ATCC 11796的冷冻原种加入500ml带挡板烧瓶中的250ml B培养基(1%(w/v)葡萄糖,0.1%(w/v)牛肉膏,0.2%(w/v)胰蛋白月示)并在30℃下旋转振荡温育3天以获得预培养物。将四十毫升(40ml)预培养物加入400ml B培养基中并在30℃下在1L三角烧瓶中旋转振荡温育24小时。在停止培养后,让培养物沉降。去除仅二百二十毫升(220ml)上清液。将类似制备的二百二十毫升(220ml)新鲜培养基加入剩余的220ml培养基以总计440ml。向其中加入化合物(II)至100ppm的量。在30℃下在1L三角烧瓶中旋转振荡温育细胞40小时。通过将2.6L产生的培养物离心(3,000g,5分钟)回收细胞沉淀。用1L 0.1MPIPES-NaOH缓冲液(pH6.8)洗涤产生的细胞沉淀以提供26g细胞沉淀。
以1g细胞沉淀3ml将这些细胞沉淀悬浮在0.1M PIPES-NaOH缓冲液(pH6.8)中,加入1mM PMSF,5mM苯甲脒HCl,1mM EDTA,3μg/ml亮抑酶肽,3μg/ml抑胃酶肽A和1mM二硫垂陶耳。通过用弗氏压碎器(1000kg/cm2)(Ohtake Seisakusho)反复破裂混悬液2次获得细胞裂解液。在将细胞裂解液离心(40,000xg,30分钟)以后,回收上清液并在150,000xg下离心1小时以回收上清液(以下称为“细胞粗提物”)。
(2)将化合物(II)转化为化合物(III)的能力的测定
制备0.1M磷酸钾缓冲液(pH7.0)的30μl反应溶液,其包含3ppm用14C标记的化合物(II),2.4mM β-NADPH(以下称为“组分A”)(OrientalYeast Company),0.5mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例8(1)中回收的细胞粗提物。将反应溶液保持在30℃下1小时。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和搅拌到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F254 20cm×20cm,0.25厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(FujiFilm Company)过夜。接着,在Image Analyzer BAS2000(Fuji FilmCompany)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表9中显示。
表9
                      反应组分   化合物(III)的斑点
  组分A   组分B   组分C   细胞粗提物  用14C标记的化合物(II)
  +   +   +   -  +   -
  +   +   +   +  +   +
  -   +   +   +  +   -
  +   -   -   +  +   -
(3)细胞粗提物的分级分离
将硫酸铵加入在实施例8(1)中获得的细胞粗提物至45%饱和的量。在冰冷却的条件下搅拌,通过在12,000xg下离心10分钟回收上清液。在将硫酸铵加入获得的上清液至55%饱和的量和在冰冷却的条件下搅拌以后,通过在12,000xg下离心10分钟回收沉淀。用20mM双三丙烷缓冲液(pH7.0)溶解沉淀至10ml的量。将该溶液进行PD10柱(AmershamPharmacia Company)和用20mM双三丙烷缓冲液(pH7.0)洗脱以回收14ml包含蛋白质的级分(以下称为“45-55%硫酸铵级分”)。
(4)本发明蛋白质(A10)的分离
将在实施例8(3)中制备的45-55%硫酸铵级分注射到MonoQHR 10/10柱(Amersham Pharmacia Company)中。接下来,在16ml的20mM双三丙烷缓冲液(pH7.0)流进柱子以后,与线性梯度的NaCl(NaCl的梯度是0.00625M/分钟,NaCl浓度的范围是0M-0.5M,流速为4ml/分钟)一起流动20mM双三丙烷缓冲液以分级回收在0.28M-0.31M的NaCl浓度下洗脱的15ml级分。进一步,将回收的级分进行PD10柱(AmershamPharmacia Biotech Company)和用20mM双三丙烷缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。
将回收的级分进行PD10柱(Amersham Pharmacia Biotech Company),用缓冲液A(包含1.5mM NaCl的2mM磷酸钾缓冲液,pH7.0)洗脱,以便回收包含蛋白质的级分。接下来,将级分注射于Bio-Scale Ceramic羟磷灰石I型柱子CHT10-I(BioRad Company)中。将五十毫升(50ml)缓冲液A流进柱子。随后,缓冲液A和线性梯度的缓冲液B(包含0.03mMNaCl的100mM磷酸钾缓冲液;线性梯度从100%缓冲液A开始在40分钟期间增加至50%缓冲液B,流速为5ml/分钟)一起流动以分级回收在16%-31%的缓冲液B的浓度下洗脱的级分。进一步,将回收的级分进行PD10柱(Amersham Pharmacia Biotech Company)并用0.05M磷酸钾缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。在10%-20% SDS-PAGE上分析包含在每个级分中的蛋白质。
类似于实施例8(2),在组分A,组分B,组分C和用14C标记的组合物(II)的存在下,加入和保持回收的级分而不是在实施例8(2)所述反应溶液中的细胞粗提物。将保持以后的反应溶液TLC分析以检查对应于用14C标记的化合物(III)的斑点的强度。观察到在上述SDS-PAGE中移动至47kDa位置的蛋白质在依次加入的级分条带的浓度方面具有平行于对应于化合物(III)的斑点的强度波动的波动。从SDS-PAGE凝胶中回收所述蛋白质和用胰蛋白酶消化。在质谱仪(ThermoQuest Company,离子阱质谱仪LCQ,柱:LC Packings Company PepMap C18 75μm×150mm,溶剂A:0.1% HOAc-H2O,溶剂B:0.1% HOAc-甲醇,梯度:从用95%溶剂A和5%溶剂B的混合物洗脱开始在30分钟内增加到100%溶剂B的浓度的线性梯度,流速:0.2μl/分钟)上分析获得的消化物。结果,提供在SEQ ID NO:22-34的每一个和任一个中表示的氨基酸序列。
实施例9浅灰链霉菌ATCC 11796的染色体DNA的制备
在50ml YEME培养基(0.3%(w/v)酵母提取物,0.5%(w/v)细菌用蛋白胨,0.3%(w/v)麦芽汁,1.0%(w/v)葡萄糖,34%(w/v)蔗糖和0.2%(v/v)2.5MgCl2·6H2O)中将浅灰链霉菌ATCC 11796在30℃下振荡温育1天至3天。回收细胞。将获得的细胞悬浮在包含1.4%(w/v)甘氨酸和60mM EDTA的YEME培养基中并进一步振荡温育1天。从培养基中回收细胞。在用蒸馏水洗涤一次以后,以每200mg细胞1ml将它重悬浮在缓冲液(100mM Tris-HCl(pH8.0),100mM EDTA,10mM NaCl)中。加入二百微克每毫升(200μg/ml)的卵清溶菌酶。将细胞混悬液在30℃下振荡温育1小时。另外,加入0.5% SDS和1mg/ml蛋白酶K。将细胞混悬液在55℃下温育3小时。用酚·氯仿·异戊醇萃取细胞混悬液2次以回收每个水层。接下来,用氯仿·异戊醇萃取一次以回收水层。通过乙醇沉淀水层获得染色体DNA。
实施例10获得编码本发明DNA(A10)的DNA和在大肠杆菌中的表达
(1)产生具有本发明DNA的转化的大肠杆菌
通过将在实施例9中从浅灰链霉菌ATCC 11796制备的染色体DNA用作模板和通过使用Expand High Fidelity PCR系统(Roche MolecularBiochemicals Company)进行PCR。作为引物,使用具有SEQ ID NO:79所示核苷酸序列的寡核苷酸和具有SEQ ID NO:80所示核苷酸序列的寡核苷酸的配对(以下称为“引物对23”)或具有SEQ ID NO:79所示核苷酸序列的寡核苷酸和具有SEQ ID NO:81所示核苷酸序列的寡核苷酸的配对(以下称为“引物对24”)。通过加入2种每种总计300nM的引物,50ng上述染色体DNA,5.0μl dNTP混合物(4种dNTP每种2.0mM的混合物),5.0μl 10x Expand HF缓冲液(包含MgCl2)和0.75μl Expand HiFi酶混合物和蒸馏水,PCR反应溶液总计25μl。PCR的反应条件是在保持在97℃ 2分钟后;重复10个循环,一个循环包括保持在97℃ 15秒,接着65℃ 30秒,接着72℃ 2分钟;然后进行15个循环,一个循环包括保持在97℃ 15秒,接着68℃ 30秒,接着72℃ 2分钟(其中每个循环增加保持在72℃下20秒);然后保持在72℃ 7分钟。在保持后,将反应溶液进行1%琼脂糖凝胶电泳。从使用引物对23的反应溶液进行的凝胶中回收包含约1.2kbp DNA的凝胶区域。从使用引物对24的反应溶液进行的凝胶中回收包含约1.5kbp DNA的凝胶区域。通过按照附带的说明书使用Qiagen快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到克隆载体pCR2.1-TOPO(Invitrogen公司)并导入大肠杆菌TOP10F’。使用Qiaprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。接下来,按照所述试剂盒附带的说明书,使用作为引物的-21M13引物(AppliedBiosystems日本公司),M13Rev引物(Applied Biosystems日本公司),具有SEQ ID NO:82所示核苷酸序列的寡核苷酸和具有SEQ ID NO:83所示核苷酸序列的寡核苷酸,用染料终止循环测序FS简易反应试剂盒(AppliedBiosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。基于结果,将含有SEQ ID NO:84所示核苷酸序列的质粒命名为pCR11796和含有SEQ ID NO:85所示核苷酸序列的质粒命名为pCR11796F。在SEQ ID NO:85中表示的所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1221个核苷酸(包括终止密码子)组成和编码406个氨基酸残基(在SEQ ID NO:5中表示的氨基酸序列)的核苷酸序列(SEQ ID NO:84)以及由210个核苷酸(包括终止密码子)组成和编码69个氨基酸残基的核苷酸序列。
接下来,用限制酶NdeI和HindIII消化pCR11796和pCR11796F中的每一个。将消化产物进行琼脂糖凝胶电泳。从进行pCR11796消化产物的凝胶中切割包含约1.2kbp DNA的凝胶区域。从进行pCR11796F消化产物的凝胶中切割包含约1.5kbp DNA的凝胶区域。通过按照附带的说明书使用Qiagen快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述试剂盒附带的说明书用连接试剂盒版本1(Takara ShuzoCompany)连接用NdeI和HindIII消化的每种获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体制备质粒DNA。分析其结构。将其中编码本发明蛋白质(A10)的约1.2kbp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:84所示核苷酸序列的质粒命名为pKSN11796。另外,将其中编码本发明蛋白质(A10)的约1.5kbp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:85所示核苷酸序列的质粒命名为pKSN11796F。将上述质粒pKSN11796和pKSN11796F中的每一个导入大肠杆菌JM109。将获得的大肠杆菌转化体分别命名为JM109/pKSN11796和JM109/pKSN11796F。另外,将质粒pKSN2导入大肠杆菌JM109。获得的大肠杆菌转化体命名为JM109/pKSN2。
(2)本发明蛋白质(A10)在大肠杆菌中的表达和所述蛋白质的回收
将大肠杆菌JM109/pKSN11796,JM109/pKSN11796F和JM109/pKSN2各自在37℃下在包含50μg/ml氨苄青霉素的10ml TB培养基(1.2%(w/v)胰蛋白胨,2.4%(w/v)酵母提取物,0.4%(w/v)甘油,17mM磷酸二氢钾,72mM磷酸氢二钾)中培养过夜。将一毫升(1ml)获得的培养物转移至包含50μg/ml氨苄青霉素的100ml TB培养基中并在26℃下培养。当OD660到达约0.5时,将5-氨基乙酰丙酸加至500μM的终浓度,继续培养。三十(30)分钟后,将IPTG加至1mM的终浓度,进一步培养17小时。
从每个培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1mM PMSF的上述缓冲液中。将获得的细胞混悬液在输出量3,占空因数30%的条件下进行超声波仪(Sonifer(Branson SonicPower Company))6次,每次3分钟,以便获得细胞裂解液。在将细胞裂解液离心(1,200xg,5分钟)后回收上清液和离心(150,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSN11796中获得的上清液级分称为“大肠杆菌pKSN11796提取物”,将从大肠杆菌JM109/pKSN11796F中获得的上清液级分称为“大肠杆菌pKSN11796F提取物”,将从大肠杆菌JM109/pKSN2中获得的上清液级分称为“大肠杆菌pKSN2提取物”)。在15%-25% SDS-PAGE上分析一微升(1μl)上述上清液级分并用考马斯蓝(以下称为“CBB”)染色。结果,在大肠杆菌pKSN11796提取物和大肠杆菌pKSN11796F提取物中都检测到比大肠杆菌pKSN2提取物显著更强烈的条带,其位于对应于45kDa分子量的电泳位置。在大肠杆菌pKSN11796F提取物中鉴定比在大肠杆菌pKSN11796提取物更强烈的条带。显示大肠杆菌JM109/pKSN11796F比大肠杆菌JM109/pKSN11796更高程度地表达本发明蛋白质(A10)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),0.1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例10(2)中回收的上清液级分。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F254 20cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji Film Company)过夜。接着,在Image Analyzer BAS2000(FujiFilm Company)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表10中显示。
表10
                        反应组分   化合物(III)的斑点
  组分A   组分B   组分C   大肠杆菌提取物   用14C标记的化合物(II)
  +   +   +   -   +   -
  +   +   +   pKSN2   +   -
  +   +   +   pKSN11796   +   +
  -   +   +   pKSN11796   +   -
  +   -   +   pKSN11796   +   -
  +   +   -   pKSN11796   +   +
  +   +   +   pKSN11796F   +   +
  -   +   +   pKSN11796F   +   -
  +   -   +   pKSN11796F   +   -
  +   +  -   pKSN11796F   +   +
实施例11获得本发明DNA(A3)
(1)砖红色链霉菌ATCC 21469的染色体DNA的制备
在50ml YEME培养基(0.3%(w/v)酵母提取物,0.5%(w/v)细菌用蛋白胨,0.3%(w/v)麦芽汁,1.0%(w/v)葡萄糖,34%(w/v)蔗糖和0.2%(v/v)2.5MgCl2·6H2O)中将砖红色链霉菌ATCC 21469在30℃下振荡温育1天至3天。回收细胞。将获得的细胞悬浮在包含1.4%(w/v)甘氨酸和60mM EDTA的YEME培养基中并进一步振荡温育1天。从培养基中回收细胞。在用蒸馏水洗涤一次以后,以每200mg细胞1ml将它重悬浮在缓冲液(100mM Tris-HCl(pH8.0),100mM EDTA,10mM NaCl)中。加入二百微克每毫升(200μg/ml)的卵清溶菌酶。将细胞混悬液在30℃下振荡1小时。另外,加入0.5% SDS和1mg/ml蛋白酶K。将细胞混悬液在55℃下温育3小时。用酚·氯仿·异戊醇萃取细胞混悬液2次以回收每个水层。接下来,用氯仿·异戊醇萃取一次以回收水层。通过乙醇沉淀水层获得染色体DNA。
(2)本发明DNA(A3)的分离
通过将在实施例11(1)中制备的染色体DNA用作模板进行PCR。作为引物,使用具有SEQ ID NO:65所示核苷酸序列的寡核苷酸和具有SEQID NO:66所示核苷酸序列的寡核苷酸的配对(以下称为“引物对9”)。通过加入250ng上述染色体DNA,2种每种总计200nM的引物,4μl dNTP混合物(4种dNTP每种2.5mM的混合物),5μl 10x ExTaq缓冲液,0.5μlExTaq聚合酶(Takara Shuzo Company)和蒸馏水,PCR反应溶液总计50μl。PCR的反应条件是保持在97℃ 2分钟;重复30个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 90秒;然后保持在72℃ 4分钟。在保持后,将反应溶液进行0.8%琼脂糖凝胶电泳。回收包含约1.4kbp的DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到TA克隆载体pCR2.1(Invitrogen公司)并导入大肠杆菌TOP10F’。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用具有SEQ ID NO:67所示核苷酸序列的寡核苷酸和具有SEQ ID NO:68所示核苷酸序列的寡核苷酸作为引物,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。结果,提供在SEQ ID NO:69中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1188个核苷酸(包括终止密码子)组成和编码395个氨基酸残基的核苷酸序列以及由195个核苷酸(包括终止密码子)组成和编码64个氨基酸残基的核苷酸序列(SEQID NO:17)。由SEQ ID NO:17所示核苷酸序列编码的氨基酸序列的分子量据计算为6666Da。
实施例12本发明蛋白质(A3)在大肠杆菌中的表达
(1)含有本发明DNA(A3)的转化大肠杆菌的产生
通过将在实施例11(1)中制备的染色体DNA用作模板和通过使用ExTaq聚合酶(Takara Shuzo Company)在如上类似的条件下进行PCR。作为引物,使用具有SEQ ID NO:70所示核苷酸序列的寡核苷酸和具有SEQ ID NO:71所示核苷酸序列的寡核苷酸的配对(以下称为“引物对10”)或具有SEQ ID NO:70所示核苷酸序列的寡核苷酸和具有SEQ ID NO:72所示核苷酸序列的寡核苷酸的配对(以下称为“引物对11”)。按照上述方法将通过使用引物对10扩增的1.2kb DNA和使用引物对11扩增的1.5kbDNA克隆到TA克隆载体pCR2.1中。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用具有SEQ ID NO:67所示核苷酸序列的寡核苷酸和具有SEQ ID NO:68所示核苷酸序列的寡核苷酸作为引物,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。结果,证实用引物对10扩增的DNA克隆的质粒含有SEQ ID NO:8所示核苷酸序列。证实用引物对11扩增的DNA克隆的质粒含有SEQ ID NO:11所示核苷酸序列。在SEQID NO:11中显示的所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1188个核苷酸(包括终止密码子)组成和编码395个氨基酸残基的核苷酸序列(SEQ ID NO:8)以及由195个核苷酸(包括终止密码子)组成和编码64个氨基酸残基的核苷酸序列。由SEQ ID NO:8所示核苷酸序列编码的氨基酸序列组成的蛋白质的分子量据计算为43752Da。至于获得的质粒,将含有SEQ ID NO:8所示核苷酸序列的质粒命名为pCR671和将含有SEQ ID NO:11所示核苷酸序列的质粒命名为pCR671F。
接下来,用限制酶NdeI和HindIII消化pCR671和pCR671F中的每一个。将消化产物进行琼脂糖凝胶电泳。从进行pCR671消化产物的凝胶中切割包含约1.2kbp DNA的凝胶区域。从进行pCR671F消化产物的凝胶中切割包含约1.5kbp DNA的凝胶区域。通过按照附带的说明书使用Qiagen快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述试剂盒附带的说明书用连接试剂盒版本1(Takara Shuzo Company)连接用NdeI和HindIII消化的每种获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体制备质粒DNA。分析其结构。将其中编码本发明蛋白质(A3)的约1200bp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:8所示核苷酸序列的质粒命名为pKSN671。另外,将其中编码本发明蛋白质(A3)的约1400bp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:11所示核苷酸序列的质粒命名为pKSN671F。将上述质粒pKSN671和pKSN671F中的每一个导入大肠杆菌JM109。将获得的大肠杆菌转化体分别命名为JM109/pKSN671和JM109/pKSN671F。另外,将质粒pKSN2导入大肠杆菌JM109。获得的大肠杆菌转化体命名为JM109/pKSN2。
(2)本发明蛋白质(A3)在大肠杆菌中的表达和所述蛋白质的回收
将大肠杆菌JM109/pKSN671,JM109/pKSN671F和JM109/pKSN2各自在37℃下在包含50μg/ml氨苄青霉素的10ml TB培养基(1.2%(w/v)胰蛋白胨,2.4%(w/v)酵母提取物,0.4%(w/v)甘油,17mM磷酸二氢钾,72mM磷酸氢二钾)中培养过夜。将一毫升(1ml)获得的培养物转移至包含50μg/ml氨苄青霉素的100ml TB培养基中并在26℃下培养。当OD660到达约0.5时,将5-氨基乙酰丙酸加至500μM的终浓度,继续培养。三十(30)分钟后,将IPTG加至1mM的终浓度,进一步培养17小时。
从每个培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1mM PMSF的所述缓冲液中。将获得的细胞混悬液在输出量3,占空因数30%的条件下进行超声波仪(Sonifer(Branson SonicPower Company))6次,每次3分钟,以便获得细胞裂解液。在将细胞裂解液离心(1,200xg,5分钟)后回收上清液和离心(150,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSN671中获得的上清液级分称为“大肠杆菌pKSN671提取物”,将从大肠杆菌JM109/pKSN671F中获得的上清液级分称为“大肠杆菌pKSN671F提取物”,将从大肠杆菌JM109/pKSN2中获得的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下1小时。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),0.1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例12(2)中回收的上清液级分组成。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和搅拌到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F25420cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji Film Company)过夜。接着,在Image Analyzer BAS2000(Fuji Film Company)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表11中显示。
表11
                       反应组分   化合物(III)的斑点
  组分A   组分B   组分C   大肠杆菌提取物  用14C标记的化合物(II)
  +   +   +   -   +   -
  +   +   +   pKSN2   +   -
  +   +   +   pKSN671   +   +
  -   +   +   pKSN671   +   -
  +   -   +   pKSN671   +   -
  +   +   -   pKSN671   +   +
  +   +   +   pKSN671F   +   +
  -   +   +   pKSN671F   +   -
  +   -   +   pKSN671F   +   -
  +   +   -   pKSN671F   +   +
实施例13获得本发明DNA(A9)
(1)Streptomyces carbophilus SANK 62585的染色体DNA的制备
在50ml YEME培养基(0.3%(w/v)酵母提取物,0.5%(w/v)细菌用蛋白胨,0.3%(w/v)麦芽汁,1.0%(w/v)葡萄糖,34%(w/v)蔗糖和0.2%(v/v)2.5MgCl2·6H2O)中将Streptomyces carbophilus SANK 62585(FERM BP-1145)在30℃下振荡温育1天。然后回收细胞。将获得的细胞悬浮在包含1.4%(w/v)甘氨酸和60mM EDTA的YEME培养基中并进一步振荡温育1天。从培养基中回收细胞。在用蒸馏水洗涤一次以后,以每200mg细胞1ml将它重悬浮在缓冲液(100mM Tris-HCl(pH8.0),100mM EDTA,10mM NaCl)中。加入二百微克每毫升(200μg/ml)的卵清溶菌酶。将细胞混悬液在30℃下振荡1小时。另外,加入0.5% SDS和1mg/ml蛋白酶K。将细胞混悬液在55℃下温育3小时。用酚·氯仿·异戊醇萃取细胞混悬液2次以回收每个水层。接下来,用氯仿·异戊醇萃取一次以回收水层。通过乙醇沉淀水层获得染色体DNA。
(2)本发明DNA(A9)的分离
通过将在实施例13(1)中制备的染色体DNA用作模板进行PCR。作为引物,使用具有SEQ ID NO:74所示核苷酸序列的寡核苷酸和具有SEQ ID NO:75所示核苷酸序列的寡核苷酸的配对(以下称为“引物对12”)或具有SEQ ID NO:76所示核苷酸序列的寡核苷酸和具有SEQ ID NO:77所示核苷酸序列的寡核苷酸的配对(以下称为“引物对13”)。通过加入2种每种总计200nM的引物,250ng上述染色体DNA,4μl dNTP混合物(4种dNTP每种2.5mM的混合物),5μl 10x ExTaq缓冲液,0.5μl ExTaq聚合酶(Takara Shuzo Company)和蒸馏水,PCR反应溶液总计50μl。PCR的反应条件是保持在95℃ 2分钟;重复30个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 90秒,然后保持在72℃ 4分钟。在保持后,将反应溶液进行0.8%琼脂糖凝胶电泳。从使用引物对12的PCR反应溶液进行的凝胶中回收包含约500bp的DNA的凝胶区域。从使用引物对13的PCR反应溶液进行的凝胶中回收包含约800bp的DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到TA克隆载体pCR2.1(Invitrogen公司)并导入大肠杆菌TOP10F’。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用具有SEQ ID NO:67所示核苷酸序列的寡核苷酸和具有SEQ ID NO:68所示核苷酸序列的寡核苷酸作为引物,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。结果,通过使用引物对12的PCR获得的DNA提供在SEQID NO:78所示核苷酸序列的核苷酸1-498中表示的核苷酸序列。通过使用引物对13的PCR获得的DNA提供在SEQ ID NO:78所示核苷酸序列的核苷酸469-1233中表示的核苷酸序列。将含有在SEQ ID NO:78中表示的核苷酸1-498的核苷酸序列的质粒命名为pCRSCA1。将含有在SEQ IDNO:78中表示的核苷酸469-1233的核苷酸序列的质粒命名为pCRSCA2。
实施例14本发明蛋白质(A9)在大肠杆菌中的表达
(1)含有本发明DNA(A9)的转化大肠杆菌的产生
使用在实施例13(2)中获得的质粒,用NdeI和NcoI消化上述质粒pCRSCA1并用NdeI和NcoI消化pCRSCA2。将消化产物进行琼脂糖凝胶电泳。从pCRSCA2消化产物进行的凝胶中切割包含约500bp DNA的凝胶区域。从pCRSCA2消化产物进行的凝胶中切割包含约800bp DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述试剂盒附带的说明书用连接试剂盒版本1(Takara Shuzo Company)连接用NdeI和HindIII消化的两种获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体中制备质粒DNA。分析其结构。将其中编码本发明蛋白质(A9)的DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:78所示核苷酸序列的质粒命名为pKSNSCA。
(2)本发明蛋白质(A9)在大肠杆菌中的表达和所述蛋白质的回收
将大肠杆菌JM109/pKSNSCA在37℃下在包含50μg/ml氨苄青霉素的10ml TB培养基(1.2%(w/v)胰蛋白胨,2.4%(w/v)酵母提取物,0.4%(w/v)甘油,17mM磷酸二氢钾,72mM磷酸氢二钾)中培养过夜。将获得的培养物转移至包含50μg/ml氨苄青霉素的100ml TB培养基中并在26℃下培养以使OD660为0.2。当OD660到达约2.0时,将5-氨基乙酰丙酸加至500μM的终浓度,继续培养。三十(30)分钟后,将IPTG加至200μM的终浓度,进一步培养5小时。
从每个培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1mM PMSF的所述缓冲液中。将获得的细胞混悬液在输出量3,占空因数30%的条件下进行超声波仪(Sonifer(Branson SonicPower Company))6次,每次3分钟,以便获得细胞裂解液。在将细胞裂解液离心(1,200xg,5分钟)后回收上清液和离心(150,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSNSCA中获得的上清液级分称为“大肠杆菌pKSNSCA提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),0.1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例14(2)中回收的上清液级分。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和搅拌到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F254 20cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji Film Company)过夜。接着,在Image Analyzer BAS2000(FujiFilm Company)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表12中显示。
表12
                        反应组分   化合物(III)的斑点
  组分A   组分B   组分C   大肠杆菌提取物  用14C标记的化合物(II)
  +   +   +   -   +   -
  +   +   +   pKSNSCA   +   +
实施例15大豆RuBPC基因的分离
在播种大豆(cv.Jack)后,在27℃下培养大豆30天和收集叶子。用液氮冷冻十分之二克(0.2g)至0.3g收集的叶子并用研钵和杵磨碎。随后,按照附带的手册使用RNA提取溶剂ISOGEN(Nippon Gene Company)从磨碎的产物中提取总RNA。进一步,通过按照附带的手册进行程序使用用于RT-PCR的Superscript第一条链合成系统(Invitrogen Company)合成cDNA。具体地,通过使用由试剂盒提供的寡(dT)12-18引物作为引物和总大豆RNA作为模板和通过向其中加入由试剂盒提供的逆转录酶合成第一条链cDNA。接下来,通过PCR扩增编码后面有成熟蛋白12个氨基酸的大豆(cv.Jack)核酮糖-1,5-二磷酸羧化酶(以下将核酮糖-1,5-二磷酸羧化酶称为“RuBPC”)小亚基叶绿体转运肽的DNA(以下,大豆(cv.Jack)RuBPC小亚基叶绿体转运肽有时称为“rSt”;编码后面有成熟蛋白12个氨基酸的大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的DNA称为“本发明rSt12 DNA”)。PCR使用获得的cDNA作为模板和具有SEQ ID NO:86所示核苷酸序列的寡核苷酸和具有SEQ ID NO:87所示核苷酸序列的寡核苷酸作为引物。PCR使用LA Taq聚合酶(Takara Shuzo Company)。通过保持94℃ 3分钟1次;进行30个循环,一个循环包括保持98℃ 25秒和然后68℃ 1分钟;和保持72℃ 10分钟1次来进行PCR。通过将扩增的DNA插入质粒pCR2.1(Invitrogen Company)PCR产物克隆位点中获得质粒pCRrSt12(图5)。接下来,将质粒导入大肠杆菌JM109菌株的感受态细胞中和选择抗氨苄青霉素菌株。另外,通过使用染料终止循环测序FS简易反应试剂盒(PE Applied Biosystems Company)和DNA测序仪373S(PE Applied Biosystems Company)测定包含在所选抗氨苄青霉素菌株中的质粒的核苷酸序列。结果,提供在SEQ ID NO:88中表示的核苷酸序列。证实质粒pCRrSt12包含本发明rSt12 DNA。
实施例16用于直接导入的包含本发明DNA(A1)的叶绿体表达质粒的构建
(1)本发明DNA(A1)的分离
通过PCR扩增包含SEQ ID NO:6所示核苷酸序列的DNA。通过使用放线菌属暗产色链霉菌IFO 12898的基因组DNA作为模板和通过使用由SEQ ID NO:93所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:94所示核苷酸序列组成的寡核苷酸作为引物进行PCR。另外,通过PCR扩增包含SEQ ID NO:9所示核苷酸序列的DNA。通过使用由SEQ ID NO:93所示核苷酸序列组成的寡核苷酸和SEQ ID NO:95所示寡核苷酸序列作为引物进行PCR。所述PCR使用Expand High Fidelity PCR System(BoehringerCompany)。在保持97℃ 2分钟1次以后;进行10个循环,一个循环包括保持97℃ 15秒,接着60℃ 30秒和接着72℃ 1分钟;然后进行15个循环,一个循环包括保持97℃ 15秒,接着60℃ 30秒和接着72℃ 1分钟(其中每个循环在72℃的保持增加20秒);然后保持72℃ 7分钟来进行PCR。通过将扩增的DNA插入pCR2.1(Invitrogen Company)的PCR产物克隆区域产生质粒pCR657ET(图6)和pCR657FET(图7)。此外,除了使用由SEQ ID NO:96所示核苷酸序列组成的寡核苷酸和由SEQ IDNO:94所示核苷酸序列组成的寡核苷酸以外,以类似于上述方法的程序获得质粒pCR657Bs(图8)。再进一步,除了使用由SEQ ID NO:96所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:97所示核苷酸序列组成的寡核苷酸以外,以类似于上述方法的程序获得质粒pCR657FBs(图9)。接下来,将质粒导入大肠杆菌DH 5α感受态细胞(Takara Shuzo Company)并选择抗氨苄青霉素的细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒2.0版(PE Applied Biosystems Company)和DNA测序仪3100(PE Applied Biosystems Company)测定包含在抗氨苄青霉素菌株中的质粒的核苷酸序列。结果,证实质粒pCR657ET和pCR657Bs含有SEQ ID NO:6所示核苷酸序列。证实质粒pCR657FET和pCR657FBs含有SEQ ID NO:9所示核苷酸序列。
(2)用于直接导入的包含本发明DNA(A1)的叶绿体表达质粒的构建-部分(1)
构建包含嵌合DNA的质粒作为用基因枪法将本发明DNA(A1)导入植物的质粒,所述嵌合DNA中本发明DNA(A1)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列(以下有时称为“编码叶绿体转运肽的序列”)之后而没有密码子框的变化。
首先,用限制酶HindIII和KpnI消化pCRrSt12。分离包含本发明rSt12DNA的DNA。另外,通过用限制酶HindIII和KpnI消化从质粒载体pUC19(Takara Shuzo Company)中去除约40bp DNA获得约2640bp的DNA。接下来,用牛小肠碱性磷酸酶(Takara Shuzo Company)将DNA的5’末端去磷酸化。向其中插入从pCRrSt12获得的、包含本发明rSt12DNA的DNA,获得pUCrSt12(图10)。接下来,通过用限制酶EcoT22I和SacI消化质粒pCR657ET和pCR657FET中的每一个分离包含本发明DNA(A1)的DNA。将获得的DNA中的每一个插入pUCrSt12的EcoT22I限制位点和SacI限制位点之间以获得包含嵌合DNA的质粒pUCrSt657(图11)和pUCrSt657F(图12),所述嵌合DNA中本发明DNA(A1)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
用限制酶EcoRI消化pBICR16G6PT(在日本未审查的专利2000-166577中描述)以分离约3kb的DNA。(以下,将包含在上面日本未审查专利所述的DNA中的启动子称为“CR16G6启动子”。另外,将包含在上面日本未审查专利所述的DNA中的终止子称为“CR16G6终止子”。)在用限制酶EcoRI消化质粒载体pUC19(Takara Shuzo Compnay)以后用牛小肠碱性磷酸酶(Takara Shuzo Company)将所述DNA的5’末端去磷酸化。向其中插入获自pBICR16G6PT的3kb DNA以获得质粒pUCCR16G6-p/t(图13)。用限制酶HindIII和ScaI消化pUCCR16G6-p/t以分离包含CR16G6启动子的DNA。另外,通过用限制酶HindIII和EcoRI消化质粒载体pUC19(Takara Shuzo Company),去除51bp的DNA和获得由2635bp组成的剩余DNA。接下来,用牛小肠碱性磷酸酶(Takara ShuzoCompany)将所述DNA的5’末端去磷酸化。向其中插入包含获自pUCCR16G6-p/t的CR16G6启动子的上述DNA和NotI-EcoRI接头(图14)以获得pUCCR12G6-p/tΔ(图15),所述NotI-EcoRI接头获自将由SEQ IDNo:89所示核苷酸序列组成的寡核苷酸和由SEQ ID No:90所示核苷酸序列组成的寡核苷酸退火。用限制酶NdeI和EcoRI消化pUCCR12G6-p/tΔ以分离含有CR16t终止子的部分核苷酸序列的DNA。另外,用限制酶HindIII和EcoRI消化质粒载体pUC19(Takara Shuzo Company)以获得2635bp的DNA。用牛小肠碱性磷酸酶(Takara Shuzo Company)将所述DNA的5’末端去磷酸化。向其中插入具有获自pUCCR12G6-p/tΔ的CR16t终止子的部分核苷酸序列的上述DNA和HindIII-NotI接头(图16)以获得pNdG6-ΔT(图17),所述HindIII-NotI接头获自将由SEQ ID No:91所示核苷酸序列组成的寡核苷酸和由SEQ ID No:92所示核苷酸序列组成的寡核苷酸退火。
接下来,通过用限制酶BamHI和SacI消化质粒pUCrSt657和pUCr657F中的每一个,分离包含嵌合DNA的DNA,在嵌合DNA中本发明DNA(A1)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。将DNA插入质粒pNdG6-ΔT的BglII限制酶位点和SacI限制酶位点之间以获得质粒pSUM-NdG6-rSt-657(图18)和质粒pSUM-NdG6-rSt-657F(图19)中的每一个。
(3)用于直接导入的具有本发明DNA(A1)的叶绿体表达质粒的构建-部分(2)
构建包含嵌合DNA的质粒作为用基因枪法将本发明DNA(A1)导入植物的质粒,所述嵌合DNA中本发明DNA(A1)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。首先,在用限制酶BspHI消化质粒载体pKF19(Takara Shuzo Company)以后,通过使用KOD DNA聚合酶(Toyobo Corporation)将核苷酸加入双链缺口将DNA末端平端化。通过用T4 DNA连接酶将得到的DNA自身环化获得质粒pKF19ΔBs。用限制酶HindIII和KpnI消化在实施例1中获得的pCRrSt12。分离包含本发明rSt12DNA的DNA。用限制酶HindIII和KpnI消化质粒pKF19ΔBs以获得约2160bp的DNA。用牛小肠碱性磷酸酶(Takara Shuzo Company)将所述DNA的5’末端去磷酸化。向其中插入包含获自pCRrSt12的本发明rSt12DNA的DNA以获得pKFrSt12(图20)。接下来,用限制酶BspHI和SacI消化在实施例16(1)中获得的质粒pCR657Bs和PCR657FBs中的每一个以分离包含本发明DNA(A1)的DNA。将这些DNA中的每一个插入质粒pKFrSt12的BspHI限制位点和SacI限制位点之间以获得质粒pKFrSt12-657(图21)和质粒pKFrSt12-657F(图22),其包含嵌合DNA,在所述嵌合DNA中本发明DNA(A1)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。
接下来,用BamHI和SacI消化质粒pKFrSt12-657和pKFrSt12-657F中的每一个以获得包含本发明DNA(A1)的DNA。将这些DNA中的每一个插入在实施例16(2)中获得的质粒pNdG6-ΔT的BglII限制位点和SacI限制位点之间,以获得质粒pSUM-NdG6-rSt12-657(图23)和pSUM-NdG6-rSt12-657F(图24),其中嵌合DNA连接在启动子CR16G6的下游,在所述嵌合DNA中本发明DNA(A1)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。
实施例17将本发明DNA(A1)导入大豆
(1)增殖体细胞胚的制备
在将大豆(栽培品种:Fayette和Jack)荚浸于1%次氯酸钠溶液灭菌以后,取出未成熟种子。将种皮从种子上剥离以除去具有2-5mm直径的未成熟胚。用解剖刀切割获得的未成熟胚的胚轴以制备未成熟子叶。将未成熟子叶分成2个子叶部分。将每个子叶部分分别放于体细胞胚发育培养基中。体细胞胚发育培养基是固体培养基,其中将0.2%(w/v)脱乙酰吉兰糖胶加入设定为pH7.0和其中加入已180μM 2,4-D和30g/L蔗糖的Murashige-Skoog培养基(在Murashige T.和Skoog F.,Physiol.Plant(1962)15,第473页;以下称为“MS培养基”)。在放置1个月以后,将形成的球形胚移植到体细胞胚生长培养基中。体细胞胚生长培养基是固体培养基,其中将0.2%(w/v)脱乙酰吉兰糖胶加入设定为pH5.8和其中加入90μM 2,4-D和30g/L蔗糖的MS培养基。其后以2-3周的间隔将球形胚移植到新鲜的体细胞胚生长培养基中5-8次。使用上述体细胞胚发育培养基和体细胞胚生长培养基的各自培养条件是23小时光照和1小时黑暗和全天23-25℃。
(2)将基因导入增殖体细胞胚
在将实施例17(1)所获球形胚移植到新鲜的体细胞胚生长培养基中和培养2-3天以后,将球形胚用于导入基因。将质粒pSUM-NdG6-rSt657,pSUM-NdG6-rSt657F,pSUM-NdG6-rSt12657和pSUM-NdG6-rSt12657F包被在直径1.0μm的金颗粒上以进行使用基因枪法的基因导入。对于1mg金颗粒的质粒的量为1.66μg。在导入基因后,将胚进一步培养2-3天。培养条件各自为23小时光照和1小时黑暗和全天23-25℃。
(3)用潮霉素选择体细胞胚
将在实施例17(2)获得的导入基因以后的球形胚移植到体细胞胚选择培养基。体细胞胚选择培养基是固体培养基,其中将0.2%(w/v)脱乙酰吉兰糖胶和15mg/L潮霉素加入设定为pH5.8和其中已加入90μM2,4-D和30g/L蔗糖的MS培养基。此后以2-3周的间隔将存活的球形胚移植至新鲜的体细胞选择培养基5-8次。在那时,体细胞胚选择培养基是固体培养基,其中将0.2%(w/v)脱乙酰吉兰糖胶和30mg/L潮霉素加入设定为pH5.8和其中加入90μM 2,4-D和30g/L蔗糖的MS培养基。使用上述体细胞胚选择培养基的培养条件各自为23小时光照和1小时黑暗和全天23-25℃。
(4)用化合物(II)选择体细胞胚
将在实施例17(2)获得的导入基因以后的球形胚移植到体细胞胚选择培养基。体细胞胚选择培养基是固体培养基,其中将0.2%(w/v)脱乙酰吉兰糖胶和0.1mg/L化合物(II)加入设定为pH5.8和其中已加入90μM2,4-D和30g/L蔗糖的MS培养基。此后以2-3周的间隔将存活的球形胚移植至新鲜的体细胞选择培养基5-8次。在那时,体细胞胚选择培养基是固体培养基,其中将0.2%(w/v)脱乙酰吉兰糖胶和0.3-1mg/L化合物(II)加入设定为pH5.8和其中已加入90μM 2,4-D和30g/L蔗糖的MS培养基。使用上述体细胞胚选择培养基的培养条件各自为23小时光照和1小时黑暗和全天23-25℃。
(5)从体细胞胚的植物再生
将在实施例17(3)或17(4)中选择的球形胚移植到发育培养基中并在23小时光照和1小时黑暗和全天23-25℃下培养4周。发育培养基是固体培养基,其中将0.8%(w/v)琼脂(Wako Pure Chemical Industries,Ltd.,用于植物组织培养)加入设定为pH5.8和其中已加入60g/L麦芽糖的MS培养基。其后6-8周获得白色至黄色子叶类型的胚。将这些子叶类型的胚移植至发芽培养基中并培养2周。发芽培养基是固体培养基,其中将0.2%(w/v)脱乙酰吉兰糖胶加入设定为pH5.8和其中已加入30g/L蔗糖的MS培养基。结果,可以获得已经长出叶子和具有根的大豆。
(6)再生植物的顺应和培养
将在实施例17(5)中获得的大豆移植到耕土并在23小时光照和1小时黑暗和全天23-25℃的孵化室中顺应。两(2)周以后,将生根的植物转移至直径为9cm的盆中并在室温下培养。在室温下的培养条件是全天自然光23℃-25℃。两至四(2-4)个月以后,收集大豆种子。
(7)对除草化合物(II)的抗性评估
收集再生植物的叶子并沿主叶脉等分成2片。将化合物(II)散布在叶片之一的整个表面上。另一叶片留下未处理。将这些叶片放在包含0.8%琼脂的MS培养基上并在室温下放置于光线中7天。然后,用杵和研钵在5ml 80%丙酮水溶液中研磨每个叶片以提取叶绿素。用80%丙酮水溶液稀释提取液10倍和按照Mackenney,G,J.Biol.Chem.(1941)140;第315页所述方法在750nm,663nm和645nm下测量吸光度以计算总叶绿素含量。通过显示处理的叶片的总叶绿素含量与未处理叶片的总叶绿素含量的百分位数可以比较评估对化合物(II)的抗性的程度。
接着,将土壤填塞至直径为10cm和深度为10cm的塑料盆中。播种上述植物的种子并在温室中培养。通过混合5份化合物(II),6份苏乳播(sorpol)3005X(Toho化学品)和89份二甲苯制备乳剂。用包含0.1%(v/v)粘着剂的水以1公顷1000L的比例稀释特定量的乳剂并用喷枪均匀地散布在来自上面在上述盆中培养的植物的叶子的所有面上。在温室中培养植物16天后,研究对植物的损伤,评估对化合物(II)的抗性。
实施例18用于农杆菌属导入的具有本发明DNA(A1)的叶绿体表达质粒的构建
构建用农杆菌法将本发明DNA(A1)导入植物的质粒。首先,在用限制酶NotI消化二元质粒(binary plasmid)载体pBI121(ClontechCompany)以后,通过使用DNA聚合酶I(Takara Shuzo Corporation)将核苷酸加入双链缺口将DNA末端平末端化。将T4 DNA连接酶用于自身环化。在用限制酶EcoRI消化获得的质粒以后,通过使用DNA聚合酶I(Takara Shuzo Corporation)将核苷酸加入双链缺口将DNA末端平末端化。将T4DNA连接酶用于自身环化以获得质粒pBI121ΔNotIEcoRI。在用HindIII消化质粒以后,用牛小肠碱性磷酸酶(Takara Shuzo Company)将获得的DNA的5’DNA末端去磷酸化。向其中插入通过将由SEQ ID NO:98所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:99所示核苷酸序列组成的寡核苷酸退火而获得的HindIII-NotI-EcoRI接头(图25)。通过自身环化得到二元质粒载体pBI121S(图26)。所述质粒具有HindIII-NotI-EcoRI接头以其中HindIII限制位点,NotI限制位点,和EcoRI限制位点从接近β-葡糖醛酸酶的位置依次排列的方向插入的结构。
接下来,用限制酶HindIII和EcoRI消化质粒pSUM-NdG6-rSt-657和pSUM-NdG6-rSt-657F中的每一个,以从其每一个获得嵌合DNA,其中本发明DNA(A1)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。将这些DNA插入上述二元质粒载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得质粒pBI-NdG6-rSt-657(图27)和pBI-NdG6-rSt-657F(图28)。另外,将上述质粒pSUM-NdG6-rSt12-657和pSUM-NdG6-rSt12-657F中的每一个用限制酶HindIII和EcoRI消化,以从每一个中获得嵌合DNA,其中本发明DNA(A1)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。将这些DNA插入上述二元质粒载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得质粒pBI-NdG6-rSt12-657(图29)和pBI-NdG6-rSt12-657F(图30)。
实施例19将本发明DNA(A1)导入烟草
使用在实施例18中获得的质粒pBI-NdG6-rSt-657,质粒pBI-NdG6-rSt-657F,质粒pBI-NdG6-rSt12-657和质粒pBI-NdG6-rSt12-657F,用农杆菌法将本发明DNA(A1)导入烟草。
首先,分别将质粒pBI-NdG6-rSt-657,pBI-NdG6-rSt-657F,pBI-NdG6-rSt12-657和pBI-NdG6-rSt12-657F导入根癌农杆菌(Agrobacterium tumefaciens)LBA4404(Clontech Company)。通过将产生的转化体在含有300mg/L链霉素,100mg/L利福平和25mg/L卡那霉素的LB琼脂培养基(0.5%酵母提取物,1.0%细菌用胰蛋白胨,0.5% NaCl)中培养和通过选择抗性克隆,分离含有pBI-NdG6-rSt-657,pBI-NdG6-rSt-657F,pBI-NdG6-rSt12-657或pBI-NdG6-rSt12-657F的转化的农杆菌菌株。
然后,按照植物基因操作手册(Hirofumi UCHIMIYA,Kodan-shaScientific,1992)所述方法,将基因导入烟草。将含有上述质粒的农杆菌属菌株各自在28℃下在含有300mg/L链霉素,100mg/L利福平和25mg/L卡那霉素的LB培养基中培养过夜,然后将无菌培养的烟草的叶片浸入液体培养基中。种植叶片并在室温下光照中在包含0.1mg/L萘乙酸和1.0mg/L苄氨基嘌呤的MS琼脂培养基(MS无机盐,MS维生素,3%蔗糖和0.8%琼脂,在Murashige T.和Skoog F.,Physiol.Plant.(1962)15,第473页中描述)中培养2天。然后,用无菌水洗涤叶片并在含有0.1mg/L萘乙酸,1.0mg/L苄氨基嘌呤和500mg/L头孢噻肟的MS琼脂培养基上培养7天。接下来,移植叶片并在含有0.1mg/L萘乙酸,1.0mg/L苄氨基嘌呤,500mg/L头孢噻肟和100mg/L卡那霉素的MS琼脂培养基中培养。培养连续进行4个月,同时以4周的间隔将叶片转移至相同组成的新鲜培养基。在那时,移植从叶片发育的不固定的芽并生根于包含300mg/L头孢噻肟和50mg/L卡那霉素的MS琼脂培养基中以获得再生体。将再生体移植并培育在包含50mg/L卡那霉素的MS琼脂培养基中,以分别获得其中已经导入pBI-NdG6-rSt-657,pBI-NdG6-rSt-657F,pBI-NdG6-rSt12-657或pBI-NdG6-rSt12-657F的T-DNA区域的转基因烟草。
另外,用农杆菌法将在实施例18中获得的质粒pBI121S导入烟草。除了使用质粒pBI121S而不是pBI-NdG6-rSt-657,pBI-NdG6-rSt-657F,pBI-NdG6-rSt12-657和pBI-NdG6-rSt12-657F以外,类似于上面分离含有pBI121S的转化的农杆菌属菌株。接下来,利用所述转化的农杆菌属,类似于上述获得已经导入质粒pBI121S的T-DNA区域的转基因烟草。
从转基因烟草取三(3)片叶子。将每片叶子分成4片,其中每片5-7mm宽。将每片叶子种植到含有0.1mg/L化合物(II)的MS琼脂培养基上并在光照中在室温下培养。在培养的第7天,观察每个叶片的除草损伤。来自导入对照DNA(质粒pBI121S的T-DNA区域)的烟草的叶片变白和枯萎。与此对比,来自导入本发明DNA(A1)(质粒pBI-NdG6-rSt-657,质粒pBI-NdG6-rSt12-657,pBI-NdG6-rSt-657F或pBI-NdG6-rSt12-657F的T-DNA区域)的烟草的叶片连续生长。
实施例20将本发明DNA导入植物
构建用于以基因枪法和农杆菌法导入本发明DNA(A2)的质粒。首先,通过PCR扩增具有SEQ ID NO:7所示核苷酸序列的本发明DNA(A2)。通过将放线菌属塔氏糖多孢菌JCM 9383t的基因组DNA用作模板和通过将由SEQ ID NO:100所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:101所示核苷酸序列组成的寡核苷酸用作引物来进行PCR。所述PCR使用Expand High Fidelity PCR System(Boehringer Company)。在保持97℃ 2分钟1次以后;重复10个循环,一个循环包括保持97℃ 15秒,接着60℃ 30秒和接着72℃ 60秒;然后进行15个循环,一个循环包括保持97℃ 15秒,接着60℃ 30秒和接着72℃ 1分钟(其中每个循环在72℃的保持增加20秒);和然后保持72℃ 7分钟来进行PCR。通过将扩增的DNA插入pCR2.1-TOPO(Invitrogen Company)的PCR产物克隆区域产生质粒pCR923Sp(图31)。接下来,将质粒导入大肠杆菌JM109感受态细胞(TakaraShuzo Company)并选择氨苄青霉素抗性细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒2.0版(PE Applied Biosystems Company)和DNA测序仪373S(PE Applied Biosystems Company)测定包含在抗氨苄青霉素菌株中的质粒的核苷酸序列。结果,证实质粒pCR923Sp具有SEQ IDNO:7所示核苷酸序列。
用限制酶BamHI和SacI消化在实施例16(3)中设计的质粒pKFrSt12以分离包含本发明rSt12DNA的DNA。将所述DNA插入在实施例16(2)中获得的pNdG6-ΔT的BglII限制位点和SacI限制位点之间以获得质粒pNdG6-rSt12(图32)。用限制酶SphI和KpnI消化质粒pCR923Sp以获得包含本发明DNA(A2)的DNA。用限制酶SphI和KpnI消化质粒pNdG6-rSt12以去除编码大豆(cv.Jack)RuBPC小亚基成熟蛋白质的12个氨基酸的DNA。在该位置,将包含从质粒pCR923Sp获得的本发明DNA(A2)的上述DNA插入以获得pSUM-NdG6-rSt-923(图33),其中CR16G6启动子已经连接到嵌合DNA的下游,在所述嵌合DNA中所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的序列之后而没有密码子框的变化。
接下来,用限制酶SphI消化质粒pCR923Sp。在用KOD DNA聚合酶将获得的DNA平末端化以后,将所述DNA用限制酶KpnI进一步消化以分离含有本发明DNA(A2)的DNA。用限制酶BspHI消化在实施例16(3)中产生的质粒pKFrSt12。在用KOD DNA聚合酶将获得的DNA平末端化以后,将所述DNA用限制酶KpnI进一步消化以去除约20bp的DNA。在该处,将包含从质粒pCR923Sp获得的含本发明DNA(A2)的上述DNA插入以获得包含嵌合DNA的质粒pKFrSt12-923(图34),在所述嵌合DNA中本发明DNA(A2)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。用限制酶SphI和KpnI消化pKFrSt12-923以获得嵌合DNA,其中本发明DNA(A2)和编码大豆(cv.Jack)RuBPC小亚基成熟蛋白的开始12个氨基酸的DNA连接。用限制酶SphI和KpnI消化质粒pNdG6-rSt12以去除编码大豆(cv.Jack)RuBPC小亚基成熟蛋白的12个氨基酸的DNA。在该位置,将获自质粒pKFrSt12-923的上述嵌合DNA插入以获得质粒pSUM-NdG6-rSt12-923(图35),其中CR16G6启动子已经从中连接到嵌合DNA的下游,在所述嵌合DNA中包含本发明DNA(A2)的所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的序列之后而没有密码子框的变化。
使用获得的质粒pSUM-NdG6-rSt-923和pSUM-NdG6-rSt12-923,以与实施例17所述方法相同的程序用基因枪法将本发明DNA(A2)导入大豆。
用限制酶HindIII和EcoRI消化上述质粒pSUM-NdG6-rSt-923以分离包含嵌合DNA的DNA,在所述嵌合DNA中包含本发明DNA(A2)的所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的序列之后而没有密码子框的变化。如在实施例18中产生pBI-NdG6-rSt657,将包含获自质粒pSUM-NdG6-rSt-923的嵌合DNA的上述DNA插入二元载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得pBI-NdG6-rSt-923(图36)。另外,用HindIII和EcoRI消化上述质粒pSUM-NdG6-rSt12-923以分离包含嵌合DNA的DNA,在所述嵌合DNA中包含本发明DNA(A2)的所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的序列之后而没有密码子框的变化。将获自pSUM-NdG6-rSt12-923的嵌合DNA插入二元载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得pBI-NdG6-rSt12-923(图37)。
将质粒pBI-NdG6-rSt-923和pBI-NdG6-rSt12-923中的每一个导入根癌农杆菌LBA4404。将产生的转化体培养在包含300μg/ml链霉菌,100μg/ml利福平和25μg/ml卡那霉素的LB培养基中。选择转化体以分离具有pBI-NdG6-rSt1-923或pBI-NdG6-rSt12-923的农杆菌属菌株。
用具有pBI-NdG6-rSt-923的农杆菌属菌株和具有pBI-NdG6-rSt12-923的农杆菌属菌株中的每一个感染无菌培养烟草的叶片。在类似于在实施例19中描述的方法的程序下获得已经导入本发明DNA(A2)的烟草。
从获得的转基因烟草中取三(3)片叶子。将每片叶子分成4片,其中每片5-7mm宽。将每片叶子种植到含有0.1mg/L化合物(II)的MS琼脂培养基上并在光照中在室温下培养。在培养的第7天,观察每个叶片的除草损伤。来自导入对照DNA(质粒pBI121S的T-DNA区域)的烟草的叶片变白和枯萎。与此对比,来自导入本发明DNA(A2)(质粒pBI-NdG6-rSt-923或质粒pBI-NdG6-rSt12-923的T-DNA区域)的烟草的叶片连续生长。
实施例21将本发明DNA(A3)导入烟草
构建以基因枪法和农杆菌法将本发明DNA(A3)导入植物的质粒。
首先,通过PCR扩增具有SEQ ID NO:8所示核苷酸序列的本发明DNA(A3)。通过将放线菌属砖红色链霉菌ATCC 21469的基因组DNA用作模板和通过将由SEQ ID NO:102所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:103所示核苷酸序列组成的寡核苷酸用作引物来进行PCR。所述PCR使用Expand High Fidelity PCR System(Boehringer Company)。在保持97℃ 2分钟1次以后;重复10个循环,一个循环包括保持97℃ 15秒,接着60℃ 30秒和接着72℃ 1分钟;然后进行15个循环,一个循环包括保持97℃ 15秒,接着60℃ 30秒和接着72℃ 1分钟(其中每个循环在72℃的保持增加20秒);和然后保持72℃ 7分钟来进行PCR。通过将扩增的DNA插入pCR2.1(Invitrogen Company)的PCR产物克隆区域产生质粒pCR671ET(图38)。另外,除了将由SEQ ID NO:104所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:103所示核苷酸序列组成的寡核苷酸用作引物以外,以类似于上述方法的程序获得质粒pCR671Bs(图39)。接下来,将质粒导入大肠杆菌JM109感受态细胞(Takara Shuzo Company)并选择氨苄青霉素抗性细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒2.0版(PE Applied Biosystems Company)和DNA测序仪3100(PE Applied Biosystems Company)测定包含在抗氨苄青霉素菌株中的质粒的核苷酸序列。结果,证实质粒pCR671ET和pCR671Bs具有SEQ ID NO:8所示核苷酸序列。
用限制酶EcoT22I和KpnI消化质粒pCR671ET以分离包含本发明DNA(A3)的DNA。将所述DNA插入EcoT22I限制位点和KpnI限制位点之间以获得包含嵌合DNA的质粒pUCrSt671(图40),在所述嵌合DNA中本发明DNA(A3)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的序列之后而没有密码子框的变化。用限制酶NheI和KpnI消化质粒pUCrSt671以分离包含本发明DNA(A3)的DNA。用限制酶NheI和KpnI消化在实施例16(2)中获得的质粒pNdG6-rSt12以去除约80bp的DNA。在该位置,将上述包含获自质粒pUCrSt671的本发明DNA(A3)的DNA插入以获得pSUM-NdG6-rSt-671(图41),其中CR16G6启动子已经连接到嵌合DNA的下游,在所述嵌合DNA中本发明DNA(A3)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的序列之后而没有密码子框的变化。
用限制酶BspHI和KpnI消化质粒pCR671Bs以分离包含本发明DNA(A3)的DNA。将所述DNA插入在实施例16(3)中获得的pKFrSt12的BspHI限制位点和KpnI限制位点之间以获得包含嵌合DNA的质粒pKFrSt12-671(图42),其中本发明DNA(A3)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的序列之后而没有密码子框的变化。用限制酶NheI和KpnI消化在实施例20中获得的质粒pNdG6-rSt12以去除约80bp的DNA。在该处,插入上述包含获自质粒pKFrSt12-671的本发明DNA(A3)的DNA以获得pSUM-NdG6-rSt12-671(图43),其中CR16G6启动子已经连接到嵌合DNA的下游,在所述嵌合DNA中本发明DNA(A3)紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的序列之后而没有密码子框的变化。
使用获得的质粒pSUM-NdG6-rSt-671和pSUM-NdG6-rSt12-671,以与实施例17所述方法相同的程序用基因枪法将本发明DNA(A3)导入大豆。
用限制酶HindIII和EcoRI消化上述质粒pSUM-NdG6-rSt-671以分离嵌合DNA,在所述嵌合DNA中本发明DNA(A3)紧连在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的序列之后而没有密码子框的变化。将包含获自质粒pSUM-NdG6-rSt-671的嵌合DNA的上述DNA插入实施例18中获得的二元载体质粒pBI121S的HindIII限制位点和EcoRI限制位点之间以获得pBI-NdG6-rSt-671(图44)。另外,用限制酶HindIII和EcoRI消化上述质粒pSUM-NdG6-rSt12-671以分离包含嵌合DNA的DNA,在所述嵌合DNA中包含本发明DNA(A3)的所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的序列之后而没有密码子框的变化。将获自质粒pSUM-NdG6-rSt12-671的嵌合DNA插入二元质粒载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得pBI-NdG6-rSt12-671(图45)。
将质粒pBI-NdG6-rSt-671和pBI-NdG6-rSt12-671中的每一个导入根癌农杆菌LBA4404。将产生的转化体培养在包含300μg/ml链霉菌,100μg/ml利福平和25μg/ml卡那霉素的LB培养基中。选择转化体以分离具有pBI-NdG6-rSt-671或pBI-NdG6-rSt12-671农杆菌菌株。
用具有pBI-NdG6-rSt-671的农杆菌菌株和具有pBI-NdG6-rSt12-671的农杆菌菌株中的每一个感染无菌培养烟草的叶片。在类似于在实施例19中描述的方法的程序下获得已经导入本发明DNA(A3)的烟草。
从转基因烟草中取三(3)片叶子。将每片叶子分成4片,其中每片5-7mm宽。将每片叶子种植到含有0.1mg/L化合物(II)的MS琼脂培养基上并在光照中在室温下培养。在培养的第7天,观察每个叶片的除草损伤。
实施例22本发明蛋白质(B1)在大肠杆菌中的表达
(1)含有本发明DNA(B1)的转化大肠杆菌的产生
通过将在实施例3(1)中从暗产色链霉菌IFO 12898制备的染色体DNA用作模板进行PCR。通过加入300ng上述染色体DNA,4μl dNTP混合物(4种dNTP每种2.5mM的混合物),5μl 10x ExTaq缓冲液,0.5ExTaq聚合酶(Takara Shuzo Company),蒸馏水和具有SEQ ID NO:105所示核苷酸序列的寡核苷酸和具有SEQ ID NO:53所示核苷酸序列的寡核苷酸每种200nM,PCR反应溶液总计50μl。PCR的反应条件是在保持在97℃ 2分钟后;重复25个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 90秒;然后保持72℃ 4分钟。按照所述载体附带的说明书将在保持后的反应溶液和载体pCR2.1-TOPO(Invitrogen公司)连接并导入大肠杆菌TOP10F’。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。使用由SEQ IDNO:67所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:68所示核苷酸序列组成的寡核苷酸作为引物,按照所述试剂盒附带的说明书,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。基于结果,将具有SEQ IDNO:15所示核苷酸序列的质粒命名为pCR657FD。
接下来,用限制酶NdeI和HindIII消化pCR657FD。将消化产物进行琼脂糖凝胶电泳。从凝胶中切割包含约200bp DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述试剂盒附带的说明书用连接试剂盒版本1(Takara Shuzo Company)连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体制备质粒DNA。分析其结构。将其中编码本发明蛋白质(B1)的约200bp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:15所示核苷酸序列的质粒命名为pKSN657FD。将质粒pKSN657FD导入大肠杆菌JM109。将获得的大肠杆菌转化体命名为JM109/pKSN657FD。另外,将质粒pKSN2导入大肠杆菌JM109。获得的大肠杆菌转化体命名为JM109/pKSN2。
(2)本发明蛋白质(B1)在大肠杆菌中的表达和所述蛋白质的回收
将大肠杆菌JM109/pKSN657FD和大肠杆菌JM109/pKSN2各自在37℃下在包含50μg/ml氨苄青霉素的10ml TB培养基(1.2%(w/v)胰蛋白胨,2.4%(w/v)酵母提取物,0.4%(w/v)甘油,17mM磷酸二氢钾,72mM磷酸氢二钾)中培养过夜。将一毫升(1ml)获得的培养基转移至包含50μg/ml氨苄青霉素的100ml TB培养基中并在26℃下培养。OD660到达约0.5以后三十(30)分钟,将IPTG加至1mM的终浓度,进一步培养20小时。
从每个培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1mM PMSF的所述缓冲液中。将获得的细胞混悬液在输出量3,占空因数30%的条件下进行超声波仪(Sonifer(Branson SonicPower Company))6次,每次3分钟,以便获得细胞裂解液。在将细胞裂解液离心(1,200xg,5分钟)后回收上清液和离心(150,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSN657FD中获得的上清液级分称为“大肠杆菌pKSN657FD提取物”,将从大肠杆菌JM109/pKSN2中获得的上清液级分称为“大肠杆菌pKSN2提取物”)。在15%-25% SDS-PAGE上分析一微升(1μl)上述上清液级分并用CBB染色。结果,在大肠杆菌pKSN657FD提取物中检测到比大肠杆菌pKSN2提取物显著更强烈的条带,其位于对应于7kDa分子量的电泳位置。显示大肠杆菌JM109/pKSN657FD表达本发明蛋白质(B1)。
(3)将本发明蛋白质(B1)应用于将化合物(II)转化为化合物(III)的反应体系
制备30μl的反应溶液并保持在30℃下10分钟。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),9μl在实施例22(2)中回收的大肠杆菌pKSN657FD提取物,0.1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和15μl在实施例4(2)中回收的大肠杆菌pKSN657F提取物(以下称为“组分D”)组成。另外,制备其中加入2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company)替代大肠杆菌pKSN657FD提取物的反应溶液和不加任何东西替代大肠杆菌pKSN657FD提取物的反应溶液。类似地保持这些反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F254 20cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji Film Company)过夜。接着,在Image Analyzer BAS2000(Fuji FilmCompany)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表13中显示。
表13
                      反应组分  化合物(III)的斑点
 组分A   大肠杆菌提取物  组分B  组分C  组分D   用14C标记的化合物(II)
 +   pKSN657FD  -  +  +   +  +
 +   -  -  +  +   +  -
 +   -  +  +  +   +  +
实施例23本发明蛋白质(B2)在大肠杆菌中的表达
(1)含有本发明DNA(B2)的转化大肠杆菌的产生
通过将在实施例6(1)中从塔氏糖多孢菌JCM 9383t制备的染色体DNA用作模板进行PCR。通过加入300ng上述染色体DNA,4μl dNTP混合物(4种dNTP每种2.5mM的混合物),5μl 10x ExTaq缓冲液,0.5ExTaq聚合酶(Takara Shuzo Company),蒸馏水和具有SEQ ID NO:106所示核苷酸序列的寡核苷酸和具有SEQ ID NO:63所示核苷酸序列的寡核苷酸每种200nM,PCR反应溶液总计50μl。PCR的反应条件是在保持在97℃ 2分钟后;重复25个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 90秒;然后保持72℃ 4分钟。按照所述载体附带的说明书将在保持后的反应溶液和载体pCR2.1-TOPO(Invitrogen公司)连接并导入大肠杆菌TOP10F’。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。使用由SEQ IDNO:67所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:68所示核苷酸序列组成的寡核苷酸作为引物,按照所述试剂盒附带的说明书,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪373A(Applied Biosystems日本公司)分析反应产物。基于结果,将具有SEQ IDNO:16所示核苷酸序列的质粒命名为pCR923FD。
接下来,用限制酶NdeI和HindIII消化质粒pCR923FD。将消化产物进行琼脂糖凝胶电泳。从凝胶中切割包含约200bp DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述试剂盒附带的说明书用连接试剂盒版本1(Takara Shuzo Company)连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体制备质粒DNA。分析其结构。将其中编码本发明蛋白质(B2)的约200bp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:16所示核苷酸序列的质粒命名为pKSN923FD。将质粒pKSN923FD导入大肠杆菌JM109。将获得的大肠杆菌转化体命名为JM109/pKSN923FD。另外,将质粒pKSN2导入大肠杆菌JM109。获得的大肠杆菌转化体命名为JM109/pKSN2。
(2)本发明蛋白质(B2)在大肠杆菌中的表达和所述蛋白质的回收
将大肠杆菌JM109/pKSN923FD和大肠杆菌JM109/pKSN2各自在37℃下在包含50μg/ml氨苄青霉素的10ml TB培养基(1.2%(w/v)胰蛋白胨,2.4%(w/v)酵母提取物,0.4%(w/v)甘油,17mM磷酸二氢钾,72mM磷酸氢二钾)中培养过夜。将一毫升(1ml)获得的培养基转移至包含50μg/ml氨苄青霉素的100ml TB培养基中并在26℃下培养。OD660到达约0.5以后三十(30)分钟,将IPTG加至1mM的终浓度,进一步培养20小时。
从每个培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1mM PMSF的所述缓冲液中。将获得的细胞混悬液在输出量3,占空因数30%的条件下进行超声波仪(Sonifer(Branson SonicPower Company))6次,每次3分钟,以便获得细胞裂解液。在将细胞裂解液离心(1,200xg,5分钟)后回收上清液和离心(150,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSN923FD中获得的上清液级分称为“大肠杆菌pKSN923FD提取物”,将从大肠杆菌JM109/pKSN2中获得的上清液级分称为“大肠杆菌pKSN2提取物”)。在15%-25% SDS-PAGE上分析一微升(1μl)上述上清液级分并用CBB染色。通过在对应于7kDa分子量的电泳位置在大肠杆菌pKSN923FD提取物中检测比大肠杆菌pKSN2提取物显著更强烈的条带,可以证实大肠杆菌表达本发明蛋白质(B2)。
(3)将本发明蛋白质(B2)应用于将化合物(II)转化为化合物(III)的反应体系
制备30μ1的反应溶液并保持在30℃下10分钟。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),9μl在实施例23(3)中回收的大肠杆菌pKSN923FD提取物,0.1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和15μl在实施例4(2)中回收的大肠杆菌pKSN657F提取物(以下称为“组分D”)。另外,制备其中加入2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(SigmaCompany)替代大肠杆菌pKSN923FD提取物的反应溶液和不加任何东西替代大肠杆菌pKSN923FD提取物的反应溶液。类似地保持这些反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F254 20cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji FilmCompany)过夜。接着,在Image Analyzer BAS2000(Fuji Film Company)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。通过证实化合物(III)在包括组分A,大肠杆菌pKSN923FD提取物,组分C和组分D的反应中产生,可以证实在将化合物(II)转化为化合物(III)的反应体系中可以使用本发明蛋白质(B2)代替来源于菠菜的铁氧还蛋白。
实施例24本发明蛋白质(B3)在大肠杆菌中的表达
(1)具有本发明DNA(B3)的转化大肠杆菌的产生
除了将在实施例11(1)中从砖红色链霉菌ATCC 21469制备的染色体DNA用作模板和将具有SEQ ID NO:107所示核苷酸序列的寡核苷酸和具有SEQ ID NO:72所示核苷酸序列的寡核苷酸用作引物以外,类似于实施例23(1)所述方法进行PCR。类似于实施例23(1)所述方法,使用获得的反应溶液获得具有SEQ ID NO:17所示核苷酸序列的质粒pCR671FD。
接下来,利用所述质粒,类似于实施例23(1)所述方法获得其中将本发明DNA(B3)插入pKSN2的NdeI位点和HindIII位点之间的质粒pKSN671FD。通过将质粒导入大肠杆菌JM109,可以获得具有本发明DNA(B3)的大肠杆菌JM109/pKSN671FD。
(2)本发明蛋白质(B3)在大肠杆菌中的表达和所述蛋白质的回收
使用大肠杆菌JM109/pKSN671FD,类似于实施例23(2)所述方法回收上清液级分(以下称为“大肠杆菌pKSN671FD级分”)。在15%-25%SDS-PAGE上分析一微升(1μl)上述上清液级分并用CBB染色。结果,通过在对应于7kDa分子量的电泳位置在大肠杆菌pKSN671FD提取物中检测比大肠杆菌pKSN2提取物显著更强烈的条带,可以证实大肠杆菌表达本发明蛋白质(B3)。
(3)将本发明蛋白质(B3)应用于将化合物(II)转化为化合物(III)的反应体系
除了使用在实施例24(2)中回收的大肠杆菌pKSN671FD提取物以外,类似于实施例23(3)所述方法证实对应于用14C标记的化合物(III)的斑点(Rf值0.24和0.29)。通过证实在包括组分A,大肠杆菌pKSN671FD提取物,组分C和组分D的反应中产生化合物(III),可以证实在将化合物(II)转化为化合物(III)的反应体系中可以使用本发明蛋白质(B3)代替来源于菠菜的铁氧还蛋白。
实施例25本发明蛋白质(A4)的制备
(1)细胞粗提物的制备
将不产色链霉菌IFO 12735的冷冻原种加入大试管中的10ml A培养基(0.1%(w/v)葡萄糖,0.5%(w/v)胰蛋白胨,0.5%(w/v)酵母提取物,0.1%(w/v)磷酸氢二钾,pH7.0)并在30℃下振荡温育1天以获得预培养物。将八毫升(8ml)预培养物加入200ml A培养基中并在30℃下在500ml带挡板的摇瓶中旋转振荡温育2天。通过将产生的培养物离心(3,000xg,10分钟)回收细胞沉淀。将这些细胞沉淀悬浮在包含100ppm化合物(II)的100ml B培养基(1%(w/v)葡萄糖,0.1%牛肉膏,0.2%(w/v)胰蛋白月示)中并在30℃下在500ml坂口烧瓶中往复振荡温育20小时。通过将2L产生的培养物离心(3,000g,10分钟)回收细胞沉淀。用1L 0.1M磷酸钾缓冲液(pH7.0)洗涤产生的细胞沉淀2次以提供136g细胞沉淀。
以1g细胞沉淀1ml-2ml将这些细胞沉淀悬浮在0.1M磷酸钾缓冲液(pH7.0)中,向细胞混悬液中加入一毫摩尔(1mM)PMSF,5mM苯甲脒HCl,1mM EDTA,3μg/ml亮抑酶肽,3μg/ml抑胃酶肽和1mM二硫垂陶耳。通过用弗氏压碎器(1000kg/cm2)(Ohtake Seisakusho)反复破裂混悬液2次获得细胞裂解液。在将细胞裂解液离心(40,000xg,30分钟)以后,回收上清液并在150,000xg下离心1小时以回收上清液(以下称为“细胞粗提物”)。
(2)将化合物(II)转化为化合物(III)的能力的测定
制备由0.1M磷酸钾缓冲液(pH7.0)组成的30μl反应溶液,其包含3ppm用14C标记的化合物(II),2.4mM β-NADPH(以下称为“组分A”)(Oriental Yeast Company),0.5mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和15μl在实施例25(1)中回收的细胞粗提物。将反应溶液保持在30℃下1小时。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F254 20cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji Film Company)过夜。接着,在Image Analyzer BAS2000(Fuji FilmCompany)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。结果在表14中显示。
表14
                       反应组分   化合物(III)的斑点
  组分A   组分B   组分C   细胞粗提物  用14C标记的化合物(II)
  +   +   +   -  +   -
  +   +   +   +  +   +
  -   +   +   +  +   -
  +   -   -   +  +   -
(3)细胞粗提物的分级分离
将硫酸铵加入在实施例25(1)中获得的细胞粗提物至45%饱和的量。在冰冷却的条件下搅拌以后,通过在12,000xg下离心30分钟回收上清液。在将硫酸铵加入获得的上清液至55%饱和的量和在冰冷却的条件下搅拌以后,通过在12,000xg下离心10分钟回收沉淀。用12.5ml的20mM双三丙烷缓冲液(pH7.0)溶解沉淀。将该溶液进行PD10柱(AmershamPharmacia Company)和用20mM双三丙烷缓冲液(pH7.0)洗脱以回收17.5ml包含蛋白质的级分(以下称为“45-55%硫酸铵级分”)。
(4)本发明蛋白质(A4)的分离
将在实施例25(3)中制备的45-55%硫酸铵级分注射到HiLoad 26/10 QSepharose HP柱(Amersham Pharmacia Company)中。接下来,在100ml的20mM双三丙烷缓冲液(pH7.0)流进柱子以后,以线性梯度的NaCl(NaCl的梯度是0.004M/分钟,NaCl浓度的范围是0M-1M,流速为4ml/分钟)流动20mM双三丙烷缓冲液以分级回收在0.12M-0.16M的NaCl浓度下洗脱的30ml级分。进一步,将回收的级分进行PD10柱(AmershamPharmacia Biotech Company)和用20mM双三丙烷缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。
将回收的级分进行PD10柱(Amersham Pharmacia Biotech Company),用缓冲液A(包含1.5mM NaCl的2mM磷酸钾缓冲液,pH7.0)洗脱,以便回收包含蛋白质的级分。接下来,将级分注射于Bio-Scale Ceramic羟磷灰石I型柱子CHT10-I(BioRad Company)中。将二十毫升(20ml)缓冲液A流进柱子。随后,缓冲液A和线性梯度的缓冲液B(包含0.03mMNaCl的100mM磷酸钾缓冲液;线性梯度从100%缓冲液A开始在100分钟期间增加至50%缓冲液B,流速为2ml/分钟)一起流动以分级回收在4%-6%的缓冲液B的浓度下洗脱的级分。进一步,将回收的级分进行PD10柱(Amersham Pharmacia Biotech Company)并用0.05M磷酸钾缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。
将类似量的包含2.0M硫酸铵的0.05M磷酸钾缓冲液(pH7.0)加入和混合到回收的级分中。然后将回收的级分注射到1ml RESOURSE PHE柱(Amersham Pharmacia Biotech Company)中。在流动包含1M硫酸铵的5ml 0.05M磷酸钾缓冲液(pH7.0)以后,0.05M磷酸钾缓冲液(pH7.0)和线性梯度的硫酸铵(硫酸铵的浓度梯度是0.1M/分钟,NaCl浓度的范围是1M-0M,流速是2ml/分钟)一起流动以分级回收在约0.4M-0.5M的硫酸铵浓度下洗脱的级分。在10%-20% SDS-PAGE上分析在每个级分中包含的蛋白质。
类似于实施例25(2),代替实施例25(2)所述的反应溶液中的细胞粗提物,在组分A,组分B,组分C和用14C标记的组分(II)的存在下,加入和保持回收的级分。将保持以后的反应溶液TLC分析以检查对应于用14C标记的化合物(III)的斑点的强度。从凝胶中回收在上述SDS-PAGE中移动至约45kDa位置的所述蛋白质并用蛋白质测序仪(AppliedBiosystems Company,Procise 494HT,脉冲液相方法)进行氨基酸序列分析以将N末端氨基酸序列测序。结果,提供在SEQ ID NO:113中表示的氨基酸序列。
实施例26获得本发明DNA(A4)
(1)不产色链霉菌IFO 12735的染色体DNA的制备
在50ml YEME培养基(0.3%(w/v)酵母提取物,0.5%(w/v)细菌用蛋白胨,0.3%(w/v)麦芽汁,1.0%(w/v)葡萄糖,34%(w/v)蔗糖和0.2%(v/v)2.5MgCl2·6H2O)中将不产色链霉菌IFO 12735在30℃下振荡培养1天至3天。回收细胞。将获得的细胞悬浮在包含1.4%(w/v)甘氨酸和60mM EDTA的YEME培养基中并进一步振荡温育1天。从培养基中回收细胞。在用蒸馏水洗涤一次以后,以每200mg细胞1ml将它重悬浮在缓冲液(100mM Tris-HCl(pH8.0),100mM EDTA,10mM NaCl)中。加入二百微克每毫升(200μg/ml)的卵清溶菌酶。将细胞混悬液在30℃下振荡1小时。另外,加入0.5% SDS和1mg/ml蛋白酶K。将细胞混悬液在55℃下温育3小时。用酚·氯仿·异戊醇萃取细胞混悬液2次以回收每个水层。接下来,用氯仿·异戊醇萃取一次以回收水层。通过乙醇沉淀水层获得染色体DNA。
(2)不产色链霉菌IFO 12735的染色体DNA文库的制备
用3.2U限制酶Sau3AI在37℃下消化在实施例26(1)中制备的三十八微克(38μg)染色体DNA 60分钟。用1%琼脂糖凝胶电泳分离获得的消化液。从凝胶中回收约2.0kbp的DNA。按照所述试剂盒附带的说明书用QIA快速凝胶提取试剂盒(Qiagen公司)纯化DNA并用乙醇沉淀浓缩以获得20μl包含目标DNA的溶液。将八微升(8μl)DNA溶液,100ng用限制酶BamHI消化和用去磷酸化处理的质粒载体pUC118和16μl来自连接试剂盒第二版(Takara Shuzo Company)的溶液I混合和在16℃下保持3小时。使用连接溶液转化大肠杆菌DH5α,并涂布在包含50mg/L氨苄青霉素的LB琼脂培养基上以在37℃下培养过夜。从琼脂培养基中回收获得的菌落。提取质粒。将获得的质粒称为染色体DNA文库。
(3)本发明DNA(A4)的分离
通过将在实施例26(2)中制备的染色体DNA用作模板进行PCR。作为引物,使用具有SEQ ID NO:114所示核苷酸序列的寡核苷酸和具有SEQ ID NO:57所示核苷酸序列的寡核苷酸的配对。基于SEQ ID NO:113所示氨基酸序列设计SEQ ID NO:114所示核苷酸序列。将Expand HiFiPCR系统(Boehringer Manheim Company)用来制备反应溶液。通过加入2.5μl上述染色体DNA文库,2种每种总计7.5pmol的引物,0.2μl dNTP混合物(4种dNTP每种2mM的混合物),0.2μl的10x缓冲液(包含MgCl2),0.38μl Expand HiFi酶混合物和蒸馏水,PCR反应溶液总计25μl。PCR的反应条件是在保持在97℃ 2分钟后,重复10个循环,一个循环包括保持在97℃ 15秒,接着65℃ 30秒,接着72℃ 1分钟;然后进行15个循环,一个循环包括保持在97℃ 15秒,接着65℃ 30秒,接着72℃ 1分钟(其中每个循环保持在72℃增加20秒);然后保持在72℃ 7分钟。在保持后,将2.5μl反应溶液用作模板溶液以进行第二次PCR。作为引物,使用具有SEQ ID NO:115所示核苷酸序列的寡核苷酸和具有SEQ ID NO:57所示核苷酸序列的寡核苷酸的配对。基于SEQ ID NO:113所示氨基酸序列设计SEQ ID NO:115所示核苷酸序列。类似于上述方法,将ExpandHiFi PCR系统(Boehringer Manheim Company)用来进行PCR。将保持后的反应溶液进行2%琼脂糖凝胶电泳。回收包含约800bp的DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到TA克隆载体pCRII-TOPO(Invitrogen公司)并导入大肠杆菌TOP10F’。使用Qiagen Tip20(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用具有SEQ ID NO:67所示核苷酸序列的引物和使用具有SEQ ID NO:68所示核苷酸序列的引物,用Big Dye终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒作为模板。用DNA测序仪3100(Applied Biosystems日本公司)分析反应产物。结果,提供在SEQ ID NO:110中表示的核苷酸序列的核苷酸57至832所示的核苷酸序列。在提供的核苷酸序列中,SEQ ID NO:110所示核苷酸序列的核苷酸58-60编码SEQ ID NO:113所示氨基酸序列的氨基酸20。
接下来,在上述条件下,将在实施例26(2)中制备的染色体DNA文库用作模板用Expand HiFi PCR系统(Boehringer Manheim Company)进行PCR。作为引物,使用具有SEQ ID NO:116所示核苷酸序列的寡核苷酸和具有SEQ ID NO:59所示核苷酸序列的寡核苷酸的引物配对。将约1.4kb的扩增的DNA克隆到克隆载体pCRII-TOPO中。利用Qiagen Tip20(Qiagen Company)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用具有SEQ ID NO:67所示核苷酸序列的引物和使用具有SEQ ID NO:68所示核苷酸序列的引物,用Big Dye终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒作为模板。用DNA测序仪3100(Applied Biosystems日本公司)分析反应产物。结果,提供在SEQ ID NO:110中表示的核苷酸序列的核苷酸1至58所示的核苷酸序列。
进行从SEQ ID NO:110所示核苷酸序列的核苷酸832表示的核苷酸3’末端延伸下游的DNA的克隆。具体地,用200U限制酶HincII在37℃下过夜消化在实施例26(1)中制备的13μg不产色链霉菌IFO 12735染色体DNA。在酚提取后,通过乙醇沉淀纯化DNA。将获得的DNA用来产生20μl水溶液。将其四微升(4μl),1.9μl的15μM基因组步行连接物(Genome Walker Adaptor),1.6μl 10x连接缓冲液和0.5μl 6U/μl T4连接酶混合和在16℃下保持过夜。其后,保持70℃ 5分钟和加入72μl蒸馏水以提供基因组步行(Genome Walker)文库。通过将所述文库用作模板进行PCR。通过加入1μl基因组步行文库和每个总计200nM的引物AP1(Universal Genome Walker试剂盒提供)和具有SEQ ID NO:117所示核苷酸序列的寡核苷酸,加入1μl dNTP混合物(4种dNTP每种10mM的混合物),10μl的5x GC基因组PCR缓冲液,2.2μl 25mM Mg(OAc)2,10μl5M GC-Melt和1μl Advantage-GC基因组聚合酶混合物和加入蒸馏水,提供总计50μl的PCR反应溶液。PCR的反应条件是在保持在95℃ 1分钟后;进行7个循环,一个循环包括保持在94℃ 10秒,然后72℃ 3分钟;36个循环,一个循环包括保持94℃ 10秒和然后68℃ 3分钟;和保持68℃ 7分钟。用蒸馏水将保持后的反应溶液稀释50倍。将该PCR产物称为第一PCR产物并用作模板来进行另一PCR。通过加入1μl第一PCR产物和每个总计200nM的引物AP2(Universal Genome Walker试剂盒提供)和具有SEQ ID NO:118所示核苷酸序列的寡核苷酸,加入1μl dNTP混合物(4种dNTP每种10mM的混合物),10μl的5x GC基因组PCR缓冲液,2.2μl 25mM Mg(OAc)2,10μl 5M GC-Melt和1μl Advantage-GC基因组聚合酶混合物和加入蒸馏水,提供总计50μl的PCR反应溶液。PCR的反应条件是在保持在95℃ 1分钟后;进行5个循环,一个循环包括保持在94℃ 10秒,然后72℃ 3分钟;20个循环,一个循环包括保持94℃ 10秒和然后68℃ 3分钟;和保持68℃ 7分钟。将保持以后的反应溶液进行1%琼脂糖凝胶电泳。回收包含约1300bp的DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到克隆载体pCRII-TOPO(Invitrogen公司)并导入大肠杆菌TOP10F’。使用QiagenTip20(Qiagen公司)从大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用SEQ ID NO:67所示的寡核苷酸和SEQ ID NO:68所示的寡核苷酸作为引物,用Big Dye终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒作为模板。用DNA测序仪3100(Applied Biosystems日本公司)分析反应产物。结果,提供在SEQ ID NO:110中表示的核苷酸序列的核苷酸644至1454所示的核苷酸序列。作为将所有分析的核苷酸连接的结果,提供在SEQ ID NO:110中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1236个核苷酸(包括终止密码子)组成和编码411个氨基酸残基(SEQ ID NO:108)的核苷酸序列(SEQ ID NO:109)以及由192个核苷酸(包括终止密码子)组成和编码63个氨基酸残基(SEQID NO:111)的核苷酸序列(SEQ ID NO:112)。由SEQ ID NO:109所不核苷酸序列编码的氨基酸序列(SEQ ID NO:108)组成的蛋白质的分子量据计算为45465Da。另外,由所述核苷酸序列编码的氨基酸序列包含从本发明蛋白质(A4)的N末端氨基酸测序所测定的氨基酸序列(SEQ ID NO:113)。由SEQ ID NO:112所示核苷酸序列编码的氨基酸序列(SEQ ID NO:111)组成的蛋白质的分子量据计算为6871Da。
实施例27本发明蛋白质(A4)在大肠杆菌中的表达
(1)具有本发明DNA(A4)的转化大肠杆菌的产生
通过将在实施例26(1)中从不产色链霉菌IFO 12735制备的染色体DNA用作模板和通过使用Expand HiFi PCR System(Boehringer ManheimCompany)进行PCR。作为引物,使用具有SEQ ID NO:119所示核苷酸序列的寡核苷酸和具有SEQ ID NO:120所示核苷酸序列的寡核苷酸的配对(以下称为“引物对25”)或具有SEQ ID NO:119所示核苷酸序列的寡核苷酸和具有SEQ ID NO:121所示核苷酸序列的寡核苷酸的配对(以下称为“引物对26”)。通过加入2种每种总计300nM的引物,50ng上述染色体DNA,5.0μl dNTP混合物(4种dNTP每种2.0mM的混合物),5.0μl 10x Expand HF缓冲液(包含MgCl2)和0.75μl Expand HiFi酶混合物和蒸馏水,PCR反应溶液总计50μl。PCR的反应条件是在保持在97℃2分钟后;重复10个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 1分钟;然后进行15个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 1分钟(其中每个循环增加20秒保持在72℃);然后保持在72℃ 7分钟。在保持后,将反应溶液进行1%琼脂糖凝胶电泳。从经历使用引物对25的反应溶液的凝胶回收包含约1.3kbp的DNA的凝胶区域。从经历使用引物对26的反应溶液的凝胶中回收包含约1.6kbp的DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到克隆载体pCRII-TOPO(Invitrogen公司)并导入大肠杆菌TOP10F’。使用Qiagen Tip20(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。接下来,按照所述试剂盒附带的说明书,使用SEQ ID NO:67,SEQ ID NO:68,SEQ ID NO:122和SEQ ID NO:123所示寡核苷酸作用引物,用Big Dye终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪3100(Applied Biosystems日本公司)分析反应产物。基于结果,将具有SEQ ID NO:109所示核苷酸序列的质粒命名为pCR646和将具有SEQ ID NO:110所示核苷酸序列的质粒命名为pCR646F。
接下来,用限制酶NdeI和HindIII消化质粒pCR646和pCR646F中的每一个。将消化产物进行琼脂糖凝胶电泳。从进行pCR646消化产物的凝胶中切割包含约1.3kbp DNA的凝胶区域。从进行pCR646F消化产物的凝胶中切割包含约1.6kbp DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从每个回收的凝胶中纯化DNA。按照所述试剂盒附带的说明书用连接试剂盒版本1(Takara ShuzoCompany)连接用NdeI和HindIII消化的每种获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体制备质粒DNA。分析其结构。将其中编码本发明蛋白质(A4)的约1.3kbp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:109所示核苷酸序列的质粒命名为pKSN646。另外,将其中编码本发明蛋白质(A4)的约1.6kbp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:110所示核苷酸序列的质粒命名为pKSN646F。将上述质粒pKSN646和pKSN646F中的每一个导入大肠杆菌JM109。将获得的大肠杆菌转化体分别命名为JM109/pKSN646和JM109/pKSN646F。另外,将质粒pKSN2导入大肠杆菌JM109。获得的大肠杆菌转化体命名为JM109/pKSN2。
(2)本发明蛋白质(A4)在大肠杆菌中的表达和所述蛋白质的回收
将大肠杆菌JM109/pKSN646,JM109/pKSN646F和JM109/pKSN2各自在37℃下在包含50μg/ml氨苄青霉素的10ml TB培养基(1.2%(w/v)胰蛋白胨,2.4%(w/v)酵母提取物,0.4%(w/v)甘油,17mM磷酸二氢钾,72mM磷酸氢二钾)中培养过夜。将一毫升(1ml)获得的培养基转移至包含50μg/ml氨苄青霉素的100ml TB培养基中并在26℃下培养。当OD660到达约0.5时,将5-氨基乙酰丙酸加至500μM的终浓度,继续培养。三十(30)分钟后,将IPTG加至1mM的终浓度,进一步培养17小时。
从每个培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1mM PMSF的上述缓冲液中。将获得的细胞混悬液在输出量3,占空因数30%的条件下进行超声波仪(Sonifer(Branson SonicPower Company))6次,每次3分钟,以便获得细胞裂解液。在将细胞裂解液离心(1,200xg,5分钟)后回收上清液和离心(150,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSN646中获得的上清液级分称为“大肠杆菌pKSN646提取物”,将从大肠杆菌JM109/pKSN646F中获得的上清液级分称为“大肠杆菌pKSN646F提取物”,将从大肠杆菌JM109/pKSN2中获得的上清液级分称为“大肠杆菌pKSN2提取物”)。在15%-25% SDS-PAGE上分析一微升(1μl)上述上清液级分并用CBB染色。结果,通过在大肠杆菌pKSN646提取物和大肠杆菌pKSN646F提取物中都检测到比大肠杆菌pKSN2提取物显著更强烈的条带,其位于对应于45kDa分子量的电泳位置,可以证实本发明蛋白质(A4)在大肠杆菌中表达。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),0.1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和18μl在实施例27(2)中回收的上清液级分。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C的至少一种组分的反应溶液。将三微升(3μl)2N HCl和90μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收75μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在6.0μl乙酸乙酯中。将其五微升(5.0μl)点到硅胶TLC板(TLC硅胶板60F254 20cm×20cm,0.25mm厚,Merck公司)上。用氯仿,乙酸和乙酸乙酯的6∶1∶2的混合物展开TLC板约1小时。然后让溶剂蒸发。将TLC板暴露于成像板(Fuji Film Company)过夜。接着,在Image Analyzer BAS2000(FujiFilm Company)上分析成像板。检查对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。可以证实化合物(III)在包含组分A,组分B,组分C和大肠杆菌pKSN646提取物的反应溶液中,或在包含组分A,组分B,组分C和大肠杆菌pKSN646F的反应溶液中的生产。
实施例28与本发明蛋白质相关的序列同一性
通过使用GENETYX-WIN第五版(Software Development Company)分析与本发明蛋白质和本发明DNA相关的序列同一性。通过用Lipman-Pearson法(Lipman,D.J.和Pearson,W.R.,Science,227,1435-1441,(1985))进行同源性分析产生对比。
关于本发明蛋白质(A1)至(A4)的氨基酸序列,确定彼此之间和对最高同源性的已知蛋白质的序列同一性。结果在表15中表示。
表15
  本发明蛋白质(A1)   本发明蛋白质(A2)   本发明蛋白质(A3)   本发明蛋白质(A4)   最高同源性的已知蛋白质*
  本发明蛋白质(A1)   100%   47%   64%   48%   73%AAC25766
  本发明蛋白质(A2)   47%   100%   48%   51%   52%CAB46536
  本发明蛋白质(A3)   64%   48%   100%   46%   67%AAC25766
  本发明蛋白质(A4)   48%   51%   46%   100%   50%CAB46536
*序列同一性在顶部显示,提供的蛋白质在Entrez数据库(由生物技术信息中心提供,http://www3.ncbi.nlm.nih.gov/Entrez/)中的登记号在底部显示。
关于具有SEQ ID NO:6所示核苷酸序列的本发明DNA(A1)的核苷酸序列,具有SEQ ID NO:7所示核苷酸序列的本发明DNA(A2)的核苷酸序列,具有SEQ ID NO:8所示核苷酸序列的本发明DNA(A3)的核苷酸序列和具有SEQ ID NO:109所示核苷酸序列的本发明DNA(A4)的核苷酸序列,确定彼此之间和对最高同源性的已知基因的序列同一性。结果在表16中表示。
表16
  SEQ ID NO:6[本发明  SEQ ID NO:7[本发明  SEQ ID NO:8[本发明  SEQ ID NO:109[本发明   最高同源性的已知基因*
  DNA(A1)]   DNA(A2)]   DNA(A3)]   DNA(A4)]
  SEQ ID NO:6[本发明DNA(A1)]   100%   61%   74%   62%   77%AF072709
  SEQ ID NO:7[本发明DNA(A2)]   61%   100%   64%   65%   66%Y18574
  SEQ ID NO:8[本发明DNA(A3)]   74%   64%   100%   63%   75%AF072709
  SEQ ID NO:109[本发明DNA(A4)]   62%   65%   63%   100%   64%Y18574
*序列同一性在顶部显示,提供的基因在Entrez数据库(由生物技术信息中心提供,http://www3.ncbi.nlm.nih.gov/Entrez/)中的登记号在底部显示。
关于本发明蛋白质(B1)至(B4)的氨基酸序列,确定彼此之间和对最高同源性的已知蛋白质的序列同一性。结果在表17中表示。
表17
  本发明蛋白质(B1)   本发明蛋白质(B2)   本发明蛋白质(B3)   本发明蛋白质(B4)   最高同源性的已知蛋白质*
  本发明蛋白质(B1)   100%   45%   78%   41%   76%AAC25765
  本发明蛋白质(B2)   45%   100%   40%   41%   60%AAF71770
  本发明蛋白质(B3)   78%   40%   100%   40%   73%AAC25765
  本发明蛋白质(B4)   41%   41%   40%   100%   55%AAA26824
*序列同一性在顶部显示,提供的蛋白质在Entrez数据库(由生物技术信息中心提供,http://www3.ncbi.nlm.nih.gov/Entrez/)中的登记号在底部显示。
关于具有SEQ ID NO:15所示核苷酸序列的本发明DNA(B1)的核苷酸序列,具有SEQ ID NO:16所示核苷酸序列的本发明DNA(B2)的核苷酸序列,具有SEQ ID NO:17所示核苷酸序列的本发明DNA(B3)的核苷酸序列和具有SEQ ID NO:112所示核苷酸序列的本发明DNA(B4)的核苷酸序列,确定彼此之间和对最高同源性的已知基因的序列同一性。结果在表18中表示。
表18
  SEQ ID NO:15[本发明DNA(B1)]  SEQ ID NO:16[本发明DNA(B2)]  SEQ ID NO:17[本发明DNA(B3)]  SEQ ID NO:112[本发明DNA(B4)]   最高同源性的已知基因*
  SEQ ID NO:15[本发明DNA(B1)]   100%  60%  80%  59%   84%AF072709
  SEQ ID NO:16[本发明DNA(B2)]   60%  100%  60%  59%   66%M32238
  SEQ ID NO:   80%  60%  100%  65%   79%
  17[本发明DNA(B3)]   AF072709
  SEQ ID NO:112[本发明DNA(B4)]   59%   59%   65%   100%   66%M32239
*序列同一性在顶部显示,提供的基因在Entrez数据库(由生物技术信息中心提供,http://www3.ncbi.nlm.nih.gov/Entrez/)中的登记号在底部显示。
实施例29使用具有本发明DNA(A)的部分核苷酸序列的寡核苷酸作为引物的PCR
通过将在实施例2中制备的暗产色链霉菌IFO 12898的染色体DNA;在实施例5中制备的塔氏糖多孢菌JCM 9383t的染色体DNA;在实施例9中制备的浅灰链霉菌ATCC 11796的染色体DNA;在实施例11中制备的砖红色链霉菌ATCC 21469的染色体DNA;在实施例26中制备的不产色链霉菌IFO 12735的染色体DNA中的每一个;和类似于实施例2所述方法制备的灰褐链霉菌IFO 12870t的染色体DNA,热淡天蓝链霉菌IFO14273t和黑胡桃链霉菌IFO 13445中的每一个用作模板进行PCR。作为引物,使用表19所示5对引物。在表19中显示通过使用基于SEQ ID NO:6的核苷酸序列的每个引物对的PCR扩增的DNA的预测大小。
表19
  引物对   引物   引物  扩增的DNA
  14   SEQ ID NO:124   SEQ ID NO:129  约800bp
  15   SEQ ID NO:125   SEQ ID NO:129  约600bp
  16   SEQ ID NO:126   SEQ ID NO:129  约600bp
  17   SEQ ID NO:127   SEQ ID NO:129  约580bp
  18   SEQ ID NO:128   SEQ ID NO:129  约580bp
通过加入200nM表19所示配对2条引物中每一种,加10ng染色体DNA,0.5μl dNTP混合物(4种dNTP每种10mM的混合物),5μl 5xGC基因组PCR缓冲液,1.1μl 25mM Mg(OAc)2,5μ1 5M GC-Melt和0.5μlAdvantage-GC基因组聚合酶混合物和加蒸馏水,PCR反应溶液总计25μl。反应条件是保持在95℃ 1分钟;重复30个循环,一个循环包括保持在94℃ 15秒,接着60℃ 30秒,接着72℃ 1分钟;和保持在72℃ 5分钟。用3%琼脂糖凝胶电泳分析保持后的每种反应溶液。结果在图46中和表20和表21中显示。在使用引物对14,15,16,17和18中每一个或全部的情形中以及在使用从任一菌株制备的染色体DNA作为模板的情形中观察到预测大小DNA的扩增。
表20
  泳道                试剂   DNA的扩增*
  模板染色体DNA的来源   引物对
  2   暗产色链霉菌IFO 12898   14   +
  3   暗产色链霉菌IFO 12898   15   +
  4   暗产色链霉菌IFO 12898   16   +
  5   暗产色链霉菌IFO 12898   17   +
  6   暗产色链霉菌IFO 12898   18   +
  9   砖红色链霉菌ATCC 21469   14   +
  10   塔氏糖多孢菌JCM 9393t   14   +
  11   浅灰链霉菌ATCC 11796   14   +
  13   砖红色链霉菌ATCC 21469   15   +
  14   塔氏糖多孢菌JCM 9393t   15   +
  15   浅灰链霉菌ATCC 11796   15   +
  16   砖红色链霉菌ATCC 21469   16   +
  17   塔氏糖多孢菌JCM 9393t   16   +
  18   浅灰链霉菌ATCC 11796   16   +
  20   砖红色链霉菌ATCC 21469   17   +
  21   塔氏糖多孢菌JCM 9393t   17   +
  22   浅灰链霉菌ATCC 11796   17   +
  23   砖红色链霉菌ATCC 21469   18   +
  24   塔氏糖多孢菌JCM 9393t   18   +
  25   浅灰链霉菌ATCC 11796   18   +
*“+”表示预测大小的DNA被检测到,“-”表示没有检测到。
表21
  泳道                  试剂   DNA的扩增*
  模板染色体DNA的来源   引物对
  28   灰褐链霉菌IFO 12870t   14   +
  29   热淡天蓝链霉菌IFO 14273t   14   +
  30   不产色链霉菌IFO 12735   14   -
  31   黑胡桃链霉菌IFO 13445   14   +
  33   灰褐链霉菌IFO 12870t   15   +
  34   热淡天蓝链霉菌IFO 14273t   15   +
  35   不产色链霉菌IFO 12735   15   -
  36   黑胡桃链霉菌IFO 13445   15   +
  38   灰褐链霉菌IFO 12870t   16   +
  39   热淡天蓝链霉菌IFO 14273t   16   +
  40   不产色链霉菌IFO 12735   16   +
  41   黑胡桃链霉菌IFO 13445   16   +
  43   灰褐链霉菌IFO 12870t   17   +
  44   热淡天蓝链霉菌IFO 14273t   17   +
  45   不产色链霉菌IFO 12735   17   +
  46   黑胡桃链霉菌IFO 13445   17   +
  48   灰褐链霉菌IFO 12870t   18   -
  49   热淡天蓝链霉菌IFO 14273t   18   +
  50   不产色链霉菌IFO 12735   18   -
  51   黑胡桃链霉菌IFO 13445   18   +
*“+”表示预测大小的DNA被检测到,“-”表示没有检测到。
实施例30使用由本发明DNA(A)的部分核苷酸序列和本发明DNA(A)组成的DNA作为探针的杂交
(1)探针制备
作为用洋地黄毒苷标记的探针(DIG标记的探针)生产由本发明DNA(A1)的部分核苷酸序列或本发明DNA(A1)的部分核苷酸序列组成的DNA。通过将在实施例3中制备的暗产色链霉菌IFO 12898的染色体DNA用作模板和通过将由SEQ ID NO:93所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:94所示核苷酸序列组成的寡核苷酸用作引物,按照附带的手册使用PCR DIG探针合成试剂盒(Roche Diagnostics GmbH Company)进行PCR。通过加入2种引物每一种总计200nM,加50ng染色体DNA,2.5μl dNTP混合物(4种dNTP每种2.0mM的混合物),2.5μl PCR DIG混合物(用DIG标记的4种dNTP每种2.0mM的混合物),5μl 10xPCR缓冲液和0.75μl Expand HiFi酶混合物和加蒸馏水,PCR反应溶液总计50μl。反应条件是在保持在95℃ 2分钟以后;重复10个循环,一个循环包括保持在95℃ 10秒,接着60℃ 30秒,接着72℃ 2分钟;然后进行15个循环,一个循环包括保持在95℃ 10秒,接着60℃ 30秒,接着72℃ 2分钟(其中每个循环保持在72℃增加20秒);然后保持在72℃ 7分钟。将保持后的反应溶液进行1%琼脂糖凝胶电泳。结果,证实约1.3kb的DNA的扩增。回收扩增的DNA以获得用洋地黄毒苷标记和具有SEQ ID NO:6所示核苷酸序列的DNA。在类似方法下,通过将暗产色链霉菌IFO 12898的染色体DNA用作模板和通过将由SEQ ID NO:130所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:131所示核苷酸序列组成的寡核苷酸用作引物进行PCR。将通过所述PCR扩增的DNA回收以获得用洋地黄毒苷标记和具有SEQ ID NO:6所示核苷酸序列的核苷酸57-730表示的核苷酸序列的DNA。
在类似方法下,通过将在实施例6中制备的塔氏糖多孢菌JCM 9393t的染色体DNA用作模板和通过将由SEQ ID NO:61所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:62所示核苷酸序列组成的寡核苷酸用作引物进行PCR。回收通过所述PCR扩增的DNA以获得用洋地黄毒苷标记和具有SEQ ID NO:7所示核苷酸序列的DNA。
另外,在类似的方法下,通过将在实施例11中制备的砖红色链霉菌ATCC 21469的染色体DNA用作模板和通过将由SEQ ID NO:70所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:71所示核苷酸序列组成的寡核苷酸用作引物进行PCR。回收通过所述PCR扩增的DNA以获得用洋地黄毒苷标记和具有SEQ ID NO:8所示核苷酸序列的DNA。另外,通过将上述染色体DNA用作模板和通过将由SEQ ID NO:132所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:133所示核苷酸序列组成的寡核苷酸用作引物进行PCR。回收通过所述PCR扩增的DNA以获得用洋地黄毒苷标记和具有SEQ ID NO:8所示核苷酸序列的核苷酸21-691表示的核苷酸序列的DNA。
(2)斑点杂交
将在实施例4中制备的pKSN657的DNA(包含本发明DNA(A1)的DNA),在实施例7中制备的pKSN923的DNA(包含本发明DNA(A2)的DNA),在实施例12中制备的pKSN671的DNA(包含本发明DNA(A3)的DNA),在实施例14中制备的pKSNSCA的DNA(包含本发明DNA(A9)的DNA)和在实施例10中制备的pKSN11796的DNA(包含本发明DNA(A10)的DNA)中的每一个以100ng和10ng的量印迹到尼龙膜HybondN+(Amersham Pharmacia Company)上。用透射仪将紫外光指向获得的膜5分钟。
按照附带的手册将DIG-High Prime DNA标记和检测Starter试剂盒II(Roche Diagnostics GmbH Company)用于杂交和检测。作为探针,使用用洋地黄毒苷标记和在实施例30(1)中生产的DNA中的每一个,其在100℃保持5分钟和然后快速在冰中冷却(以下称为“DIG标记的探针”)。将印迹的上述膜在42℃下在所述试剂盒提供的2.0ml DIGEasyHyb中振荡30分钟。接下来,将2.0ml Dig Easy Hyb,5.0μl DIG标记的探针和膜密封到塑料袋中以杂交,并保持在42℃下18小时。回收膜,在室温下在包含0.1% SDS的2x SSC中振荡2次5分钟,然后在65℃下在包含0.1% SDS的0.5x SSC中振荡2次15分钟。随后,将膜在50ml洗涤缓冲液中振荡2分钟,然后在室温下在50ml封闭液中振荡30分钟,然后在2.0ml抗体溶液中振荡30分钟,然后在50ml洗涤缓冲液中振荡2次15分钟。另外,在50ml检测缓冲液中振荡5分钟以后,将膜密封在含有2.0ml显色底物的杂交袋中并保持在室温下18小时。在用10ng和100ng pKSN657,pKSN923,pKSN671,pKSNSCA和pKSN11796中每一个的每种试剂进行杂交的每种情形中检测到信号。
实施例31获得本发明DNA(A11)
(1)黑胡桃链霉菌IFO 13445的染色体DNA的制备
在50ml YGY培养基(0.5%(w/v)酵母提取物,0.5%(w/v)胰蛋白胨,0.1%(w/v)葡萄糖和0.1%(w/v)K2HPO4,pH7.0)中将黑胡桃链霉菌IFO 13445在30℃下振荡培养3天。回收细胞。将获得的细胞悬浮在包含1.4%(w/v)甘氨酸和60mM EDTA的YGY培养基中并进一步振荡温育1天。从培养基中回收细胞。在用蒸馏水洗涤一次以后,将它悬浮在3.5ml缓冲液B1(50mM Tris-HCl(pH8.0),50mM EDTA,0.5%吐温-20和0.5% Triton X-100)中。将八十微升(80μl)100μg/ml的溶菌酶溶液和100μl Qiagen蛋白酶(600mAU/ml,Qiagen Company)加入混悬液并保持在37℃ 1小时。接下来,加入1.2ml缓冲液B2(3M盐酸胍和20%吐温-20),混合和保持50℃ 30分钟。将获得的细胞裂解液加入平衡在缓冲液QBT(750mM NaCl,50mM MOPS(pH7.0),15%异丙醇和0.15% TritonX-100)中的Qiagen基因组芯片100G(Qiagen Company)。接下来,在用7.5ml缓冲液QC(50mM MOPS(pH7.0)和15%异丙醇)洗涤芯片2次以后,通过流动5ml缓冲液QF(1.25M NaCl,50mM Tris HCl(pH8.5),15%异丙醇)洗脱DNA。将三和十分之五毫升(3.5ml)异丙醇混合到获得的DNA溶液中以沉淀和回收染色体DNA。在用70%乙醇洗涤以后,将回收的DNA溶解在1ml TB缓冲液中。
(2)具有本发明DNA(A11)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例31(1)中制备的染色体DNA用作模板和通过使用引物对14进行PCR。按照所述载体附带的说明书将扩增的DNA连接到克隆载体pCRII-TOPO(Invitrogen Company)和然后导入大肠杆菌TOP 10F’。使用Qiagen Tip20(Qiagen Company)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用具有SEQ ID NO:57所示核苷酸序列的引物和具有SEQ ID NO:59所示核苷酸序列的引物,用染料终止循环测序FS简易反应试剂盒(AppliedBiosystems日本公司)进行测序反应。测序反应使用获得的质粒作为模板。用DNA测序仪3100(Applied Biosystems日本公司)分析反应产物。结果,提供在SEQ ID NO:139所示核苷酸序列的核苷酸316至1048中所表示的核苷酸序列。
另外,用限制酶PvuII消化在实施例31(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:161所示核苷酸序列的寡核苷酸和引物AP1(Universal Genome Walker试剂盒(Clontech Company)),在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:162所示核苷酸序列的寡核苷酸和引物AP2(UniversalGenome Walker试剂盒(Clontech Company)),在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:144所示核苷酸序列的核苷酸1至330中所表示的核苷酸序列。
另外,用限制酶HincII消化在实施例31(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:163所示核苷酸序列的寡核苷酸和引物AP1(Universal Genome Walker试剂盒(Clontech Company)),在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:164所示核苷酸序列的寡核苷酸和引物AP2(UniversalGenome Walker试剂盒(Clontech Company)),在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:144所示核苷酸序列的核苷酸983至1449中所表示的核苷酸序列。
(3)本发明DNA(A11)的序列分析
通过连接由实施例31(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:144中表示的核苷酸序列。存在两个可读框(ORF)。因此,包含由1230个核苷酸(包括终止密码子)组成和编码409个氨基酸残基(SEQ IDNO:159)的核苷酸序列(SEQ ID NO:139)以及由207个核苷酸(包括终止密码子)组成和编码68个氨基酸残基(SEQ ID NO:149)的核苷酸序列(SEQ ID NO:154)。由SEQ ID NO:139所示核苷酸序列编码的氨基酸序列(SEQ ID NO:159)组成的蛋白质的分子量据计算为45177Da。另外,由SEQ ID NO:154所示核苷酸序列编码的氨基酸序列(SEQ ID NO:149)组成的蛋白质的分子量据计算为7147Da。
实施例32本发明蛋白质(A11)在大肠杆菌中的表达
(1)具有本发明蛋白质(A11)的转化大肠杆菌的产生
通过将在实施例31(1)中从黑胡桃链霉菌IFO 13445制备的染色体DNA用作模板和通过使用Expand HiFi PCR System(Boehringer ManheimCompany)进行PCR。作为引物,使用具有SEQ ID NO:165所示核苷酸序列的寡核苷酸和具有SEQ ID NO:166所示核苷酸序列的寡核苷酸的配对。反应溶液组成和保持类似于实施例27(1)所述情形。将保持后的反应溶液进行1%琼脂糖凝胶电泳。回收包含约1.5kbp的DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述载体附带的说明书将获得的DNA连接到克隆载体pCRII-TOPO(Invitrogen公司)并导入大肠杆菌TOP10F’。使用Qiagen Tip20(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA。按照所述试剂盒附带的说明书,使用分别具有SEQ ID NO:57,59,和186所示核苷酸序列的寡核苷酸作为引物,用染料终止循环测序FS简易反应试剂盒(Applied Biosystems日本公司)进行测序反应。测序反应使用获得的质粒DNA作为模板。用DNA测序仪3100(Applied Biosystems日本公司)分析反应产物。基于结果,将具有SEQ ID NO:144所示核苷酸序列的质粒命名为pCR849AF。
接下来,用限制酶NdeI和HindIII消化pCR849AF。将消化产物进行琼脂糖凝胶电泳。从凝胶中切割包含约1.5kbp DNA的凝胶区域。通过按照附带的说明书使用QIA快速凝胶提取试剂盒(Qiagen公司)从回收的凝胶中纯化DNA。按照所述试剂盒附带的说明书用连接试剂盒版本2(Takara Shuzo Company)连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2并导入大肠杆菌JM109。从获得的大肠杆菌转化体制备质粒DNA。分析其结构。将其中编码本发明蛋白质(A11)的约1.5kbp DNA插入pKSN2的NdeI位点和HindIII位点之间、包含SEQ ID NO:144所示核苷酸序列的质粒命名为pKSN849AF。将质粒pKSN849AF导入大肠杆菌JM109。将获得的大肠杆菌转化体命名为JM109/pKSN849AF。另外,将质粒pKSN2导入大肠杆菌JM109。获得的大肠杆菌转化体命名为JM109/pKSN2。
(2)本发明蛋白质(A11)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN849AF和JM109/pKSN2的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN849AF的上清液级分称为“大肠杆菌pKSN849AF提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。反应溶液由0.1M磷酸钾缓冲液(pH7.0)组成,其包含3ppm用14C标记的化合物(II),2mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),2mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(Sigma Company),0.1U/ml铁氧还蛋白还原酶(以下称为“组分C”)(Sigma Company)和23μl在实施例32(2)中回收的上清液级分。类似于实施例4(3),用乙酸乙酯萃取保持后的反应溶液并将萃取层进行TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN849AF提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例33获得本发明DNA(A12)
(1)津岛链霉菌IFO 13782的染色体DNA的制备
根据实施例31(1)所述方法,制备津岛链霉菌IFO 13782的染色体DNA。
(2)具有本发明DNA(A12)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例33(1)中制备的津岛链霉菌IFO 13782染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(InvitrogenCompany)。分析其核苷酸序列。结果,提供在SEQ ID NO:140所示核苷酸序列的核苷酸364至1096中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例33(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:167所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:168所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:145所示核苷酸序列的核苷酸1至392中所表示的核苷酸序列。
另外,用限制酶PvuII消化在实施例33(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:169所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:170所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:145所示核苷酸序列的核苷酸1048至1480中所表示的核苷酸序列。
(3)本发明DNA(A12)的序列分析
通过连接由实施例33(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:145中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1278个核苷酸(包括终止密码子)组成和编码425个氨基酸残基(SEQ ID NO:160)的核苷酸序列(SEQ ID NO:140)以及由198个核苷酸(包括终止密码子)组成和编码65个氨基酸残基(SEQ IDNO:150)的核苷酸序列(SEQ ID NO:155)。由SEQ ID NO:140所示核苷酸序列编码的氨基酸序列(SEQ ID NO:160)组成的蛋白质的分子量据计算为46549Da。另外,由SEQ ID NO:155所示核苷酸序列编码的氨基酸序列(SEQ ID NO:150)组成的蛋白质的分子量据计算为6510Da。
实施例34本发明DNA(A12)在大肠杆菌中的表达
(1)具有本发明DNA(A12)的转化大肠杆菌的产生
类似于实施例32(1),除了将在实施例33(1)中从津岛链霉菌IFO13782制备的染色体DNA用作模板和将具有SEQ ID NO:171所示核苷酸序列的寡核苷酸和具有SEQ ID NO:172所示核苷酸序列的寡核苷酸用作引物以外进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen公司)中。用分别具有SEQ IDNO:57,59,171,172和187所示核苷酸序列的寡核苷酸分析获得的质粒DNA的核苷酸序列。基于获得的结果,将含有SEQ ID NO:145所示核苷酸序列的质粒命名为pCR1618F。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1618F。从消化产物中纯化约1.5kbp的DNA。将用NdeI和HindIII消化的获得的DNA和质粒pKSN2连接以获得包含SEQ IDNO:145所示核苷酸序列的质粒,其中将编码本发明蛋白质(A12)的DNA插入pKSN2的NdeI位点和HindIII位点(以下称为“pKSN1618F”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1618F。
(2)本发明蛋白质(A12)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1618F和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1618F的上清液级分称为“大肠杆菌pKSN1618F提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。除了使用在实施例34(2)中回收的上清液级分(大肠杆菌pKSN1618F提取物或大肠杆菌pKSN2提取物)以外,类似于实施例32(3)制备反应溶液。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1618F提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例35获得本发明DNA(A13)
(1)热淡天蓝链霉菌IFO 14273t的染色体DNA的制备
根据实施例31(1)所述方法,制备热淡天蓝链霉菌IFO 14273t的染色体DNA。
(2)具有本发明DNA(A13)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例35(1)中制备的热淡天蓝链霉菌IFO 14273t染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(Invitrogen Company)。分析其核苷酸序列。结果,提供在SEQ ID NO:141所示核苷酸序列的核苷酸295至1027中所表示的核苷酸序列。
另外,用限制酶HincII消化在实施例35(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:173所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:174所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:146所示核苷酸序列的核苷酸1至370中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例35(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:175所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:176所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:146所示核苷酸序列的核苷酸960至1473中所表示的核苷酸序列。
(3)本发明DNA(A13)的序列分析
通过连接由实施例35(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:146中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1209个核苷酸(包括终止密码子)组成和编码402个氨基酸残基(SEQ ID NO:136)的核苷酸序列(SEQ ID NO:141)以及由252个核苷酸(包括终止密码子)组成和编码83个氨基酸残基(SEQ IDNO:151)的核苷酸序列(SEQ ID NO:156)。由SEQ ID NO:141所示核苷酸序列编码的氨基酸序列(SEQ ID NO:136)组成的蛋白质的分子量据计算为44629Da。另外,由SEQ ID NO:156所示核苷酸序列编码的氨基酸序列(SEQ ID NO:151)组成的蛋白质的分子量据计算为8635Da。
实施例36本发明蛋白质(A13)在大肠杆菌中的表达
(1)具有本发明蛋白质(A13)的转化大肠杆菌的产生
类似于实施例32(1),除了将在实施例35(1)中从热淡天蓝链霉菌IFO 14273t制备的染色体DNA用作模板和将具有SEQ ID NO:177所示核苷酸序列的寡核苷酸和具有SEQ ID NO:178所示核苷酸序列的寡核苷酸用作引物以外进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen公司)中。用分别具有SEQ ID NO:57,59,173,175和188所示核苷酸序列的寡核苷酸分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:146所示核苷酸序列的质粒命名为pCR474F。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR474F。从消化产物中纯化约1.5kbp的DNA。将用NdeI和HindIII消化的获得的DNA和质粒pKSN2连接以获得包含SEQ ID NO:146所示核苷酸序列的质粒,其中将编码本发明蛋白质(A13)的DNA插入pKSN2的NdeI位点和HindIII位点(以下称为“pKSN474F”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN474F。
(2)本发明蛋白质(A13)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN474F和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN474F的上清液级分称为“大肠杆菌pKSN474F提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。除了使用在实施例36(2)中回收的上清液级分(大肠杆菌pKSN474F提取物或大肠杆菌pKSN2提取物)以外,类似于实施例32(3)制备反应溶液。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN474F提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例37获得本发明DNA(A14)
(1)热淡天蓝链霉菌IFO 14273t的染色体DNA的制备
根据实施例31(1)所述方法,制备热淡天蓝链霉菌IFO 14273t的染色体DNA。
(2)具有本发明DNA(A13)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例37(1)中制备的球团产色链霉菌IFO 13673t染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(Invitrogen Company)。分析其核苷酸序列。结果,提供在SEQ ID NO:142所示核苷酸序列的核苷酸316至1048中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例37(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:179所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:180所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:147所示核苷酸序列的核苷酸1至330中所表示的核苷酸序列。
另外,用限制酶HincII消化在实施例37(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:181所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:182所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:147所示核苷酸序列的核苷酸982至1449中所表示的核苷酸序列。
(3)本发明DNA(A14)的序列分析
通过连接由实施例37(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:147中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1230个核苷酸(包括终止密码子)组成和编码409个氨基酸残基(SEQ ID NO:137)的核苷酸序列(SEQ ID NO:142)以及由207个核苷酸(包括终止密码子)组成和编码68个氨基酸残基(SEQ IDNO:152)的核苷酸序列(SEQ ID NO:157)。由SEQ ID NO:142所示核苷酸序列编码的氨基酸序列(SEQ ID NO:137)组成的蛋白质的分子量据计算为45089Da。另外,由SEQ ID NO:157所示核苷酸序列编码的氨基酸序列(SEQ ID NO:152)组成的蛋白质的分子量据计算为7174Da。
实施例38本发明DNA(A14)在大肠杆菌中的表达
(1)具有本发明DNA(A14)的转化大肠杆菌的产生
类似于实施例32(1),除了将在实施例37(1)中制备的球团产色链霉菌IFO 13673t染色体DNA用作模板和将具有SEQ ID NO:183所示核苷酸序列的寡核苷酸和具有SEQ ID NO:184所示核苷酸序列的寡核苷酸用作引物以外进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen公司)中。用分别具有SEQ IDNO:57,59和189所示核苷酸序列的寡核苷酸分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:147所示核苷酸序列的质粒命名为pCR1491AF。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1491AF。从消化产物中纯化约1.5kbp的DNA。将用NdeI和HindIII消化的获得的DNA和质粒pKSN2连接以获得包含SEQ ID NO:147所示核苷酸序列的质粒,其中将编码本发明蛋白质(A14)的DNA插入pKSN2的NdeI位点和HindIII位点(以下称为“pKSN1491AF”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1491AF。
(2)本发明蛋白质(A14)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1491AF和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1491AF的上清液级分称为“大肠杆菌pKSN1491AF提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。除了使用在实施例38(2)中回收的上清液级分(大肠杆菌pKSN1491AF提取物或大肠杆菌pKSN2提取物)以外,类似于实施例32(3)制备反应溶液。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1491AF提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例39获得本发明DNA(A15)
(1)橄榄产色链霉菌IFO 12444的染色体DNA的制备
根据实施例31(1)所述方法,制备橄榄产色链霉菌IFO 12444的染色体DNA。
(2)具有本发明DNA(A15)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例39(1)中制备的橄榄产色链霉菌IFO 12444染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(Invitrogen Company)。分析其核苷酸序列。结果,提供在SEQ ID NO:143所示核苷酸序列的核苷酸316至1048中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例37(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的DNA作为模板和通过使用具有SEQ ID NO:179所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:180所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:148所示核苷酸序列的核苷酸1至330中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例39(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:181所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:182所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:148所示核苷酸序列的核苷酸982至1449中所表示的核苷酸序列。
(3)本发明DNA(A15)的序列分析
通过连接由实施例39(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:148中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1230个核苷酸(包括终止密码子)组成和编码409个氨基酸残基(SEQ ID NO:138)的核苷酸序列(SEQ ID NO:143)以及由207个核苷酸(包括终止密码子)组成和编码68个氨基酸残基(SEQ IDNO:153)的核苷酸序列(SEQ ID NO:158)。由SEQ ID NO:143所示核苷酸序列编码的氨基酸序列(SEQ ID NO:138)组成的蛋白质的分子量据计算为45116Da。另外,由SEQ ID NO:158所示核苷酸序列编码的氨基酸序列(SEQ ID NO:153)组成的蛋白质的分子量据计算为7179Da。
实施例40本发明DNA(A15)在大肠杆菌中的表达
(1)具有本发明DNA(A15)的转化大肠杆菌的产生
类似于实施例32(1),除了将在实施例39(1)中制备的橄榄产色链霉菌IFO 12444染色体DNA用作模板和将具有SEQ ID NO:184所示核苷酸序列的寡核苷酸和具有SEQ ID NO:185所示核苷酸序列的寡核苷酸用作引物以外进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen公司)中。用分别具有SEQ IDNO:57,59和189所示核苷酸序列的寡核苷酸分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:148所示核苷酸序列的质粒命名为pCR1555AF。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1555AF。从消化产物中纯化约1.5kbp的DNA。将用NdeI和HindIII消化的获得的DNA和质粒pKSN2连接以获得包含SEQ ID NO:148所示核苷酸序列的质粒,其中将编码本发明蛋白质(A15)的DNA插入pKSN2的NdeI位点和HindIII位点(以下称为“pKSN1555AF”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1555AF。
(2)本发明蛋白质(A15)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1555AF和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1555AF的上清液级分称为“大肠杆菌pKSN1555AF提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
制备30μl的反应溶液并保持在30℃下10分钟。除了使用在实施例40(2)中回收的上清液级分(大肠杆菌pKSN1555AF提取物或大肠杆菌pKSN2提取物)以外,类似于实施例32(3)制备反应溶液。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1555AF提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例41通过本发明蛋白质(A1)的化合物的代谢
(1)质体级分的制备
将一百克(100g)萝卜绿叶种子(Takii Seed)锯到托盘中潮湿的实验室纸抹布中,在25℃下黑暗中培养6天,然后在荧光灯下培养4小时。用Nissei AM-8匀浆器(Nihonseiki Seisakusho;18,000-20,000rpm,4℃,5秒)在破裂缓冲液(1mM氯化镁,20mM N-三(羟甲基)甲基-2-氨乙基磺酸酯,10mM N-2-羟乙基哌啶-N’-2-乙基磺酸酯,0.5mM EDTA,5mM半胱氨酸,0.5M蔗糖;pH7.7)中磨碎三十克(30g)新变绿的子叶。将获得的细胞裂解液通过4层尼龙gause。将获得的溶液离心(13,170xg,1分钟)。用60ml破裂缓冲液悬浮获得的残余物级分并离心(2,640xg,4℃,2分钟)。将残余物级分重悬浮在10ml破裂缓冲液中,在离心管中用高密度缓冲液(1mM氯化镁,20mM N-三(羟甲基)甲基-2-氨乙基磺酸酯,30mM N-2-羟乙基哌啶-N’-2-乙基磺酸酯,O.5mM EDTA,5mM半胱氨酸,0.6M蔗糖;pH7.7)分层,并离心(675xg,4℃,15分钟)。将残余物悬浮在3ml悬浮缓冲液(1mM氯化镁,20mM N-三(羟甲基)甲基-2-氨乙基磺酸酯,30mM N-2-羟乙基哌啶-N’-2-乙基磺酸酯,0.5mM EDTA;pH7.7)中并称为质体级分。
(2)通过本发明蛋白质(A1)的化合物(XII)的代谢
制备50mM磷酸钾(pH7.0)的100μl反应溶液,其包含5ppm化合物(XII),3mMβ-NADPH(以下称为“组分A”)(Oriental Yeast Company),1mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(SigmaCompany),0.15U/ml铁氧还蛋白还原酶(以下称为“组分C”)(SigmaCompany)和20μl在实施例4(2)中回收的上清液级分。将反应溶液保持在30℃下10分钟。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C和在实施例4(2)中制备的上清液级分的至少一种组分的50mM磷酸钾缓冲液(pH7.0)的100μl反应溶液。将十微升(10μl)2N HCl和500μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。在8,000xg下将产生的反应溶液离心以回收490μl乙酸乙酯层。在减压下干燥乙酸乙酯层以后,将残余物溶解在100μl50mM的磷酸钾缓冲液(pH7.0)中。在HPLC上分析四十微升(40μl)级分溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例4(2)中回收的上清液级分的反应溶液的级分溶液称为“(XII)代谢溶液(A1)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例4(2)中回收的上清液级分的反应溶液的级分溶液称为“(XII)对照溶液(A1)”)。与从(XII)对照溶液(A1)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A1)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A1)检测到峰,其从(XII)对照溶液(A1)中未检测到。对于在该峰中包含的化合物进行质谱分析。包含在该峰中的化合物的质量比化合物(XII)的质量小14。
混合二十微升(20μl)稀释32倍的上述(XII)代谢溶液(A1)和60μl在实施例41(1)中制备的质体级分。在黑暗条件下,加入20μl底物溶液(10mM腺苷三磷酸,5mM氨基乙酰丙酸,4mM谷胱甘肽还原酶和0.6mM NAD+;pH6.5;以下,该底物溶液称为“PPO底物溶液”)并在30℃下保持1.5小时。另外,代替所述20μl稀释32倍的(XII)代谢溶液(A1),制备加入20μl稀释32倍的(XII)对照溶液(A1)的反应溶液,类似地加入和保持PPO底物溶液。将三百(300μl)二甲亚砜-甲醇混合物(二甲亚砜∶甲醇=7∶3)加入保持以后的每个反应溶液中并离心(8000xg,4℃,10分钟)。回收上清液并在以下分析条件下进行反相HPC分析以测量PPIX的量。加入(XII)代谢溶液(A1)的反应溶液中PPIX的量多于加入(XII)对照溶液(A1)的反应溶液中PPIX的量。
(HPLC分析条件2)
柱:SUMIPAX ODS212(Sumika Chemical Analysis Service)
流速:2ml/分钟
检测波长:荧光Ex:410nm Em:630nm
洗脱剂:甲醇和1M乙酸铵的95∶5混合物(pH5.7)
(3)通过本发明(A1)的化合物(XIII)的代谢
除了使用5ppm化合物(XIII)而不是5ppm化合物(XII)以外,类似实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的反应溶液中的每一个,将获得的残余物溶解在100μl二甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例4(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A1)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例4(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A1)”)。与从(XIII)对照溶液(A1)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A1)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A1)检测到峰,其从(XIII)对照溶液(A1)中未检测到。对于在该峰中包含的化合物进行质谱分析。包含在该峰中的化合物的质量比化合物(XIII)的质量小14。
混合二十微升(20μl)稀释128倍的上述(XIII)代谢溶液(A1)和60μl质体级分。在黑暗条件下,加入20μl PPO底物溶液并在30℃下保持1.5小时。另外,代替所述20μl稀释128倍的(XIII)代谢溶液(A1),制备加入20μl稀释128倍的(XIII)对照溶液(A1)的反应溶液,类似地加入和保持PPO底物溶液。类似于实施例4(2),制备保持后的各种反应溶液并在上述分析条件2下进行反相HPLC分析以测量PPIX的量。加入(XIII)代谢溶液(A1)的反应溶液中PPIX的量多于加入(XIII)对照溶液(A1)的反应溶液中PPIX的量。
(4)通过本发明(A1)的化合物(XVI)的代谢
除了使用12.5ppm化合物(XVI)而不是5ppm化合物(XII)以外,类似实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的反应溶液中的每一个,将获得的残余物溶解在200μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例4(2)中回收的上清液级分的反应溶液的溶液称为“(XVI)代谢溶液(A1)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例4(2)中回收的上清液级分的反应溶液的溶液称为“(XVI)对照溶液(A1)”)。与从(XVI)对照溶液(A1)检测的化合物(XVI)的浓度相比,从(XVI)代谢溶液(A1)检测的化合物(XVI)的浓度较低。另外从(XVI)代谢溶液(A1)检测到峰,其从(XVI)对照溶液(A1)中未检测到。
混合二十微升(20μl)稀释8倍的上述(XVI)代谢溶液(A1)和60μl质体级分。在黑暗条件下,加入20μl PPO底物溶液并在30℃下保持1.5小时。另外,代替所述20μl稀释8倍的(XVI)代谢溶液(A1),制备加入20μl稀释8倍的(XVI)对照溶液(A1)的反应溶液,类似地加入和保持PPO底物溶液。类似于实施例41(2),制备保持后的各种反应溶液并在上述分析条件2下进行反相HPLC分析以测量PPIX的量。加入(XVI)代谢溶液(A1)的反应溶液中PPIX的量多于加入(XVI)对照溶液(A1)的反应溶液中PPIX的量。
(5)通过本发明蛋白质(A1)的化合物(XVII)的代谢
除了使用12.5ppm化合物(XVII)而不是5ppm化合物(XII)以外,类似实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的反应溶液中的每一个,将获得的残余物溶解在200μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例4(2)中回收的上清液级分的反应溶液的溶液称为“(XVII)代谢溶液(A1)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例4(2)中回收的上清液级分的反应溶液的溶液称为“(XVII)对照溶液(A1)”)。与从(XVII)对照溶液(A1)检测的化合物(XVII)的浓度相比,从(XVII)代谢溶液(A1)检测的化合物(XVII)的浓度较低。另外从(XVII)代谢溶液(A1)检测到峰,其从(XVII)对照溶液(A1)中未检测到。
混合二十微升(20μl)稀释32倍的上述(XVII)代谢溶液(A1)和60μl质体级分。在黑暗条件下,加入20μl PPO底物溶液并在30℃下保持1.5小时。另外,代替所述20μl稀释32倍的(XVII)代谢溶液(A1),制备加入20μl稀释32倍的(XVII)对照溶液(A1)的反应溶液,类似地加入和保持PPO底物溶液。类似于实施例41(2),制备保持后的各种反应溶液并在上述分析条件2下进行反相HPLC分析以测量PPIX的量。加入(XVII)代谢溶液(A1)的反应溶液中PPIX的量多于加入(XVII)对照溶液(A1)的反应溶液中PPIX的量。
(6)通过本发明蛋白质(A1)的化合物(VI)的代谢
将大肠杆菌JM109/pKSN657F在37℃下在3ml包含50μg/ml氨苄青霉素的TB培养基中培养过夜。将一毫升(1ml)获得的培养基转移至100ml包含50μg/ml氨苄青霉素的TB培养基中并在26℃下培养。当OD660达到约0.5时,将5-氨基乙酰丙酸加至500μM的终浓度,继续培养。三十(30)分钟以后,加入IPTG至1mM的终浓度,进一步培养20小时。
从培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1%葡萄糖的0.1M Tris-HCl中。将化合物(VI)加入获得的细胞混悬液至100ppm的终浓度并在30℃下振荡温育。分别在振荡开始0小时和1天时,分级分离2ml细胞混悬液。每个加入五十微升(50μl)2N HCl并用2ml乙酸乙酯萃取。在反应条件1下在HPLC上分析获得的乙酸乙酯层。与从振荡开始后0小时的细胞混悬液制备的乙酸乙酯层检测的化合物(VI)的浓度相比,从振荡开始后1天的细胞混悬液制备的乙酸乙酯层检测的化合物(VI)的浓度较低。另外,从振荡开始后1天的细胞混悬液制备的乙酸乙酯层检测到峰,其在振荡开始后0小时的细胞混悬液制备的乙酸乙酯层中未检测到。进行包含在所述峰中的化合物的质谱分析。包含在所述峰中的化合物的质量比化合物(VI)的质量小14。
(7)通过本发明蛋白质(A1)的化合物(VIII)的代谢
除了使用化合物(VIII)而不是化合物(VI)以外,按照实施例41(6)所述方法进行大肠杆菌JM109/pKSN657F的培养,细胞混悬液的制备,加入化合物(VIII)的细胞混悬液的振荡温育,从细胞混悬液的试剂制备和试剂的HPLC分析。与从振荡开始后0小时的细胞混悬液制备的乙酸乙酯层检测的化合物(VIII)的浓度相比,从振荡开始后1天的细胞混悬液制备的乙酸乙酯层检测的化合物(VIII)的浓度较低。另外,从振荡开始后1天的细胞混悬液制备的乙酸乙酯层检测到两个峰,其在振荡开始后0小时的细胞混悬液制备的乙酸乙酯层中未检测到。进行包含在所述峰中的化合物的质谱分析。包含在所述峰中之一的化合物的质量比化合物(VIII)的质量小14,包含在另一个峰中的化合物的质量比化合物(VIII)的质量小28。
(8)通过本发明蛋白质(A1)的化合物(X)的代谢
除了使用化合物(X)而不是化合物(VI)以外,按照实施例41(6)所述方法进行大肠杆菌JM109/pKSN657F的培养,细胞混悬液的制备,加入化合物(X)的细胞混悬液的振荡培养,从细胞混悬液的试剂制备和试剂的HPLC分析。与从振荡开始后0小时的细胞混悬液制备的乙酸乙酯层检测的化合物(X)的浓度相比,从振荡开始后1天的细胞混悬液制备的乙酸乙酯层检测的化合物(X)的浓度较低。另外,从振荡开始后1天的细胞混悬液制备的乙酸乙酯层检测到两个峰,其在振荡开始后0小时的细胞混悬液制备的乙酸乙酯层中未检测到。进行包含在所述峰中的化合物的质谱分析。包含在所述峰中之一的化合物的质量比化合物(X)的质量小40,包含在另一个峰中的化合物的质量比化合物(X)的质量小54。
(9)通过本发明蛋白质(A1)的化合物(XI)的代谢
除了使用化合物(XI)而不是化合物(VI)以外,按照实施例41(6)所述方法进行大肠杆菌JM109/pKSN657F的培养,细胞混悬液的制备,加入化合物(XI)的细胞混悬液的振荡培养,从细胞混悬液的试剂制备和试剂的HPLC分析。与从振荡开始后0小时的细胞混悬液制备的乙酸乙酯层检测的化合物(XI)的浓度相比,从振荡开始后1天的细胞混悬液制备的乙酸乙酯层检测的化合物(XI)的浓度较低。另外,从振荡开始后1天的细胞混悬液制备的乙酸乙酯层检测到两个峰,其在振荡开始后0小时的细胞混悬液制备的乙酸乙酯层中未检测到。进行包含在所述峰中的化合物的质谱分析。包含在所述峰中之一的化合物的质量比化合物(XI)的质量小14,包含在另一个峰中的化合物的质量比化合物(XI)的质量小16。
实施例42通过本发明蛋白质(A11)的化合物的代谢
(1)通过本发明化合物(A11)的化合物(X)的代谢
将大肠杆菌JM109/pKSN849AF和大肠杆菌JM109/pKSN2各自在37℃下在3ml包含50μg/ml氨苄青霉素的TB培养基中培养过夜。将一毫升(1ml)获得的培养基转移至100ml包含50μg/ml氨苄青霉素的TB培养基中并在26℃下培养。当OD660达到约0.5时,将5-氨基乙酰丙酸加至500μM的终浓度,继续培养。三十(30)分钟以后,加入IPTG至1mM的终浓度,进一步培养18小时。
从培养基中回收细胞,用0.1M tris-HCl缓冲液(pH7.5)洗涤和悬浮在10ml包含1%葡萄糖的0.1M Tris-HCl中。将化合物(X)加入获得的细胞混悬液至25ppm的终浓度并在30℃下振荡温育。分别在振荡开始0小时和4天时,分级分离2ml细胞混悬液。每个加入五十微升(50μl)2N HCl并用2ml乙酸乙酯萃取。在反应条件1下在HPLC上分析获得的乙酸乙酯层。与从JM109/pKSN2细胞混悬液制备的乙酸乙酯层检测的化合物(X)的浓度相比,从JM109/pKSN849AF细胞混悬液制备的乙酸乙酯层检测的化合物(X)的浓度较低。另外,从JM109/pKSN849AF细胞混悬液制备的乙酸乙酯层检测到3个峰,其在从JM109/pKSN2细胞混悬液制备的乙酸乙酯层中未检测到。在3个峰中,峰1在HPLC中的洗脱时间与质量比实施例41(8)中检测的化合物(X)小40的化合物的峰洗脱时间相配。另外,另一个峰的HPLC洗脱时间与质量比实施例41(8)中检测的化合物(X)小54的化合物的峰洗脱时间相配。
在干燥后,分别地,将从上述JM109/pKSN2细胞混悬液制备的1ml乙酸乙酯层和1ml从上述JM109/pKSN849AF细胞混悬液制备的乙酸乙酯层,残余物溶解在1ml二甲亚砜中(以下,将来自从JM109/pKSN849AF制备的乙酸乙酯层的溶液称为“(X)代谢溶液(A11)”;另外,将来自从JM109/pKSN2细胞混悬液制备的乙酸乙酯层的溶液称为“(X)对照溶液(A11)”)。
混合二十微升(20μl)稀释128倍的上述(X)代谢溶液(A11)和60μl质体级分。在黑暗条件下,加入20μl PPO底物溶液并在30℃下保持1.5小时。另外,代替所述20μl稀释128倍的(X)代谢溶液(A11),制备加入20μl稀释128倍的(X)对照溶液(A11)的反应溶液,类似地加入和保持PPO底物溶液。类似于实施例41(2),制备保持后的各种反应溶液并在上述分析条件2下进行反相HPLC分析以测量PPIX的量。加入(X)代谢溶液(A11)的反应溶液中PPIX的量多于加入(X)对照溶液(A11)的反应溶液中PPIX的量。
(2)通过本发明蛋白质(A11)的化合物(XII)的代谢
除了使用20μl在实施例32(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例32(2)中回收的上清液级分的反应溶液的溶液称为“(XII)代谢溶液(A11)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例32(2)中回收的上清液级分的反应溶液的溶液称为“(XII)对照溶液(A11)”)。与从(XII)对照溶液(A11)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A11)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A11)检测到峰,其从(XII)对照溶液(A11)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(3)通过本发明蛋白质(A11)的化合物(XIII)的代谢
除了使用20μl在实施例32(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(3)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl二甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例32(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A11)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例32(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A11)”)。与从(XIII)对照溶液(A11)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A11)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A11)检测到峰,其从(XIII)对照溶液(A11)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)(XIII)代谢溶液(A11)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(4)通过本发明蛋白质(A11)的化合物(XVI)的代谢
除了使用20μl在实施例32(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(4)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在200μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例32(2)中回收的上清液级分的反应溶液的溶液称为“(XVI)代谢溶液(A11)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例32(2)中回收的上清液级分的反应溶液的溶液称为“(XVI)对照溶液(A11)”)。与从(XVI)对照溶液(A11)检测的化合物(XVI)的浓度相比,从(XVI)代谢溶液(A11)检测的化合物(XVI)的浓度较低。另外从(XVI)代谢溶液(A11)检测到峰,其从(XVI)对照溶液(A11)中未检测到。在HPLC上所述峰的洗脱时间与在实施例41(4)中从(XVI)代谢溶液(A11)中检测到和在(XVI)对照溶液(A11)中未检测到的峰的洗脱时间相配。
(5)通过本发明蛋白质(A11)的化合物(XVII)的代谢
除了使用20μl在实施例32(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(5)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在200μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例32(2)中回收的上清液级分的反应溶液的溶液称为“(XVII)代谢溶液(A11)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例32(2)中回收的上清液级分的反应溶液的溶液称为“(XVII)对照溶液(A11)”)。与从(XVII)对照溶液(A11)检测的化合物(XVII)的浓度相比,从(XVII)代谢溶液(A11)检测的化合物(XVII)的浓度较低。另外从(XVII)代谢溶液(A11)检测到峰,其从(XVII)对照溶液(A11)中未检测到。在HPLC上所述峰的洗脱时间与在实施例41(5)中从(XVII)代谢溶液(A1)中检测到和在(XVII)对照溶液(A1)中未检测到的峰的洗脱时间相配。
实施例43通过本发明蛋白质(A2),(A3),(A12),(A13),(A14)或(A15)或本发明蛋白质(A10)的化合物的代谢
(1)通过本发明蛋白质(A2)的化合物(XII)的代谢
除了使用20μl在实施例7(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例7(2)中回收的上清液级分的反应溶液的溶液称为“(XII)代谢溶液(A2)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例7(2)中回收的上清液级分的反应溶液的溶液称为“(XII)对照溶液(A2)”)。与从(XII)对照溶液(A2)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A2)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A2)检测到峰,其从(XII)对照溶液(A2)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(2)通过本发明蛋白质(A3)的化合物(XII)的代谢
除了使用20μl在实施例12(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例12(2)中回收的上清液级分的反应溶液的溶液称为“(XII)代谢溶液(A3)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例7(2)中回收的上清液级分的反应溶液的溶液称为“(XII)对照溶液(A3)”)。与从(XII)对照溶液(A3)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A3)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A3)检测到峰,其从(XII)对照溶液(A3)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(3)通过本发明蛋白质(A10)的化合物(XII)的代谢
除了使用20μl在实施例10(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例10(2)中回收的上清液级分的反应溶液的溶液称为“(XII)代谢溶液(A10)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例12(3)中回收的上清液级分的反应溶液的溶液称为“(XII)对照溶液(A10)”)。与从(XII)对照溶液(A10)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A10)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A10)检测到峰,其从(XII)对照溶液(A10)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(4)通过本发明蛋白质(A12)的化合物(XII)的代谢
除了使用20μl在实施例34(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例34(2)中回收的上清液级分的反应溶液的溶液称为“(XII)代谢溶液(A12)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例34(2)中回收的上清液级分的反应溶液的溶液称为“(XII)对照溶液(A12)”)。与从(XII)对照溶液(A12)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A12)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A12)检测到峰,其从(XII)对照溶液(A12)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(5)通过本发明蛋白质(A13)的化合物(XII)的代谢
除了使用20μl在实施例36(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例36(2)中回收的上清液级分的反应溶液的溶液称为“(XII)代谢溶液(A13)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例36(2)中回收的上清液级分的反应溶液的溶液称为“(XII)对照溶液(A13)”)。与从(XII)对照溶液(A13)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A13)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A13)检测到峰,其从(XII)对照溶液(A13)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(6)通过本发明蛋白质(A14)的化合物(XII)的代谢
除了使用20μl在实施例38(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例38(2)中回收的上清液级分的反应溶液的溶液称为“(XII)代谢溶液(A14)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例38(2)中回收的上清液级分的反应溶液的溶液称为“(XII)对照溶液(A14)”)。与从(XII)对照溶液(A14)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A14)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A14)检测到峰,其从(XII)对照溶液(A14)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(7)通过本发明蛋白质(A15)的化合物(XII)的代谢
除了使用20μl在实施例40(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(2)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl 50mM磷酸钾缓冲液(pH7.0)中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例40(2)中回收的上清液级分的反应溶液的溶液称为“(XII)代谢溶液(A15)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例40(2)中回收的上清液级分的反应溶液的溶液称为“(XII)对照溶液(A15)”)。与从(XII)对照溶液(A15)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A15)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A15)检测到峰,其从(XII)对照溶液(A15)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(8)通过本发明蛋白质(A2)的化合物(XIII)的代谢
除了使用20μl在实施例7(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(3)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl二甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例7(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A2)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例7(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A2)”)。与从(XIII)对照溶液(A2)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A2)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A2)检测到峰,其从(XIII)对照溶液(A2)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(9)通过本发明蛋白质(A3)的化合物(XIII)的代谢
除了使用20μl在实施例12(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(3)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl二甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例12(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A3)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例12(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A3)”)。与从(XIII)对照溶液(A3)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A3)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A3)检测到峰,其从(XIII)对照溶液(A3)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(10)通过本发明蛋白质(A10)的化合物(XIII)的代谢
除了使用20μl在实施例10(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(3)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl二甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例10(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A10)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例10(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A10)”)。与从(XIII)对照溶液(A10)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A10)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A10)检测到峰,其从(XIII)对照溶液(A10)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(11)通过本发明蛋白质(A12)的化合物(XIII)的代谢
除了使用20μl在实施例34(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(3)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl二甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例34(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A12)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例34(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A12)”)。与从(XIII)对照溶液(A12)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A12)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A12)检测到峰,其从(XIII)对照溶液(A12)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(12)通过本发明蛋白质(A13)的化合物(XIII)的代谢
除了使用20μl在实施例36(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(3)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl二甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例36(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A13)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例36(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A13)”)。与从(XIII)对照溶液(A13)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A13)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A13)检测到峰,其从(XIII)对照溶液(A13)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(13)通过本发明蛋白质(A14)的化合物(XIII)的代谢
除了使用20μl在实施例38(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(3)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl  甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例38(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A14)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例38(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A14)”)。与从(XIII)对照溶液(A14)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A14)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A14)检测到峰,其从(XIII)对照溶液(A14)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(14)通过本发明蛋白质(A15)的化合物(XIII)的代谢
除了使用20μl在实施例40(2)中回收的上清液级分而不是20μl在实施例4(2)中回收的上清液级分以外,按照实施例41(3)所述方法制备和保持反应溶液。类似于实施例41(2),用乙酸乙酯萃取保持后的各种反应溶液,并将获得的残余物溶解在100μl二甲亚砜中。在上述分析条件1下在HPLC上分析获得的溶液(以下,将来自包含组分A,组分B,组分C和20μl在实施例40(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)代谢溶液(A15)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例40(2)中回收的上清液级分的反应溶液的溶液称为“(XIII)对照溶液(A15)”)。与从(XIII)对照溶液(A15)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A15)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A15)检测到峰,其从(XIII)对照溶液(A15)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
实施例44识别本发明蛋白质(A1)的本发明抗体(A)(以下称为“本发明抗体(A1)”)的制备
(1)表达本发明蛋白质(A1)的大肠杆菌提取物的制备
按照实施例4(2)所述方法,将表达本发明蛋白质(A1)的大肠杆菌JM109/pKSN657F预培养过夜,然后在包含50μg/ml氨苄青霉素的1L TB培养基中培养。在回收和破裂细胞以后,从获得的细胞裂解液中制备上清液级分(大肠杆菌pKSN657F提取物)。
(2)本发明蛋白质(A1)的纯化
通过将在实施例44(1)中获得的上清液级分(大肠杆菌pKSN657F提取物)依次进行Hiload HiLoad26/10 Q Sepharose HP柱和然后Bio-ScaleCeramic羟磷灰石,I型柱CHT10-1柱,按照实施例2(4)所述方法纯化本发明蛋白质(A1)。在10%-20% SDS-PAGE上分析纯化的级分,以证实那些是仅为本发明蛋白质(A1)的级分。
(3)本发明抗体(A1)的制备
将在实施例44(2)中制备的本发明蛋白质(A1)溶解在0.05M磷酸钾缓冲液(pH7.0)中,以使浓度为1mg/ml。将已经在42℃-43℃温育的四十微升(40μl)RAS(MPL(单磷酰基脂A)+TDM(合成海藻糖Dicorynomycolate)+CWS(细胞壁骨架)佐剂系统(Sigma Company))加入并充分混合到2ml获得的溶液中。分别将获得的混合物以每只兔子1ml施用到新西兰白兔(雌性,14周龄,平均2.4kg)上。因此,将100μl皮下注射到背部10个位置。在每3周和5周后施用第一次给药量的约1/2。在该时间期间,通过从兔子的耳静脉取血样测量抗体效价。因为抗体效价在第三次给药后增加,将第三次给药后2周的免疫兔子被从颈部放血。将获得的血液加入Separapit Tube(Sekisui Chemical Company),在37℃下温育2小时和然后离心(3000rpm,20分钟,室温)。通过回收上清液获得抗血清(包含本发明抗体(A1))。
实施例45通过本发明抗体(A1)检测本发明蛋白质和检测表达本发明蛋白质的细胞
通过使用在实施例44中获得的本发明抗体(A1)对每个大肠杆菌提取物进行免疫印迹。有以下提取物的SDS聚丙烯酰胺凝胶电泳(40mA,1小时):在实施例4(2)中获得的大肠杆菌pKSN657F提取物(包含约0.5pmol本发明蛋白质(A1),包含约0.78mg蛋白质);在实施例4(2)中获得的大肠杆菌pKSN2提取物(包含约0.78mg蛋白质);在实施例7(2)中获得的大肠杆菌pKSN923F提取物(包含约2pmol本发明蛋白质(A2));在实施例12(2)中获得的大肠杆菌pKSN671F提取物(包含约2pmol本发明蛋白质(A3));在实施例27(2)中获得的大肠杆菌pKSN646F提取物(包含约2pmol本发明蛋白质(A4));在实施例10(2)中获得的大肠杆菌pKSN11796F提取物(包含约2pmol本发明蛋白质(A10));在实施例14(2)中获得的大肠杆菌pKSNSCA提取物(包含约2pmol本发明蛋白质(A9));在实施例32(2)中获得的大肠杆菌pKSN849AF提取物(包含约2pmol本发明蛋白质(A11));在实施例34(2)中获得的大肠杆菌pKSN1618F提取物(包含约2pmol本发明蛋白质(A12));在实施例36(2)中获得的大肠杆菌pKSN474F提取物(包含约2pmol本发明蛋白质(A13));在实施例38(2)中获得的大肠杆菌pKSN1491AF提取物(包含约2pmol本发明蛋白质(A14));和在实施例40(2)中获得的大肠杆菌pKSN1555AF提取物(包含约2pmol本发明蛋白质(A15))。将PVDF膜放在凝胶上。通过用BioRad印迹装置在4℃下30V处理2小时,同时在浸渍在转移缓冲液(25mM Tris,192mM甘氨酸,10%甲醇)的条件下将凝胶中的蛋白质转移到PVDF膜上。在用TBS+吐温20溶液(50mMTris-HCl(pH7.5),200mM NaCl,0.05%吐温20)洗涤以后,将获得的PVDF膜在包含3%BSA的TBS+吐温20溶液中温育30分钟,然后用于与稀释30,000倍的上述抗血清在包含3%BSA的TBS+吐温20溶液中反应30分钟。在反应后,用TBS+吐温20溶液洗涤PVDF膜2次。然后将PVDF膜用于在包含3%BSA的TBS+吐温20溶液中与稀释3000倍的用碱性磷酸酶(Santa Cruz Biotechnology Company)标记的抗兔IgG山羊抗血清反应30分钟。在反应后,用TBS+吐温20溶液洗涤PVDF膜2次和浸渍在NBT-BCIP溶液(Sigma Company)中。检测到对应于本发明蛋白质(A1),(A2),(A3),(A4),(A11),(A12),(A13),(A14)和(A15)以及本发明蛋白质(A9)和(A10)中每一个的条带的染色。用在实施例4(2)中获得的大肠杆菌pKSN2提取物(包含约0.78mg蛋白质)的试剂未检测到染色条带。
实施例46其中密码子使用已经针对在大豆中表达调整的本发明DNA(A1)(以下称为“本发明DNA(A1)S”)的制备和表达
(1)本发明DNA(A1)S的制备
通过使用具有SEQ ID NO:192所示核苷酸序列的引物和具有SEQ IDNO:213所示核苷酸序列的引物,按照附带的手册用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:191所示核苷酸序列的引物和具有SEQ IDNO:212所示核苷酸序列的引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:190所示核苷酸序列的引物和具有SEQ ID NO:211所示核苷酸序列的引物进行的PCR的模板。将获得的反应溶液称为反应溶液1。
按照附带的手册,通过使用具有SEQ ID NO:195所示核苷酸序列的引物和具有SEQ ID NO:210所示核苷酸序列的引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:194所示核苷酸序列的引物和具有SEQ IDNO:209所示核苷酸序列的引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:193所示核苷酸序列的引物和具有SEQ ID NO:208所示核苷酸序列的引物进行的PCR的模板。将获得的反应溶液称为反应溶液2。
按照附带的手册,通过使用具有SEQ ID NO:198所示核苷酸序列的引物和具有SEQ ID NO:207所示核苷酸序列的引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:197所示核苷酸序列的引物和具有SEQ IDNO:206所示核苷酸序列的引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:196所示核苷酸序列的引物和具有SEQ ID NO:205所示核苷酸序列的引物进行的PCR的模板。将获得的反应溶液称为反应溶液3。
按照附带的手册,通过使用具有SEQ ID NO:201所示核苷酸序列的引物和具有SEQ ID NO:204所示核苷酸序列的引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:200所示核苷酸序列的引物和具有SEQ IDNO:203所示核苷酸序列的引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:199所示核苷酸序列的引物和具有SEQ ID NO:202所示核苷酸序列的引物进行的PCR的模板。将获得的反应溶液称为反应溶液4。
将如此获得的反应溶液1至4混合。按照附带的手册,通过将其混合物的等分部分用作模板和使用具有SEQ ID NO:190所示核苷酸序列的引物和具有SEQ ID NO:202所示核苷酸序列的引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。证实扩增的DNA的核苷酸序列。获得具有其中核苷酸序列5’-cat-3’连接到SEQ ID NO:214所示核苷酸序列的5’末端上游和核苷酸序列5’-aagctt-3’连接到SEQ ID NO:214所示核苷酸序列的3’末端下游的序列的DNA。
在表22和表23中显示具有SEQ ID NO:6所示核苷酸序列的本发明DNA(A1)的密码子使用(GC含量70.58%)。在表24和表25中显示大豆的密码子使用(GC含量46.12%,由Kazusa DNA研究院出版的密码子使用数据库(http://www.kazusa.or.jp/codon))。在表26和表27中显示具有SEQ ID NO:214所示核苷酸序列的本发明DNA(A1)的密码子使用(51.59%的GC含量)。
表22
  密码子   %   密码子   %
  TTT   0.00   TCT   0.00
  TTC   3.18   TCC   1.71
  TTA   0.00   TCA   0.00
  TTG   1.22   TCG   2.20
  CTT   0.00   CCT   0.00
  CTC   3.67   CCC   4.16
  CTA   0.00   CCA   0.00
  CTG   7.09   CCG   2.69
  ATT   0.24   ACT   0.24
  ATC   4.16   ACC   2.69
  ATA   0.00   ACA   0.24
  ATG   2.69   ACG   1.96
  GTT   0.24   GCT   0.00
  GTC   3.67   GCC   7.58
  GTA   0.00   GCA   0.49
  GTG   3.18   GCG   3.42
表23
  密码子   %   密码子   %
  TAT   0.00   TGT   0.24
  TAC   1.47   TGC   0.98
  TAA   0.00   TGA   0.00
  TAG   0.24   TGG   0.98
  CAT   0.24   CGT   1.22
  CAC   2.20   CGC   4.40
  CAA   0.24   CGA   0.24
  CAG   2.93   CGG   4.16
  AAT   0.00   AGT   0.00
  AAC   1.22   AGC   0.49
  AAA   0.24   AGA   0.00
  AAG   0.98   AGG   0.00
  GAT   0.98   GGT   0.98
  GAC   7.82   GGC   3.42
  GAA   0.73   GGA   0.24
  GAG   5.38   GGG   1.22
表24
  密码子   %   密码子   %
  TTT   2.03   TCT   1.71
  TTC   2.09   TCC   1.21
  TTA   0.82   TCA   1.45
  TTG   2.21   TCG   0.44
  CTT   2.36   CCT   2.00
  CTC   1.66   CCC   1.01
  CTA   0.82   CCA   2.05
  CTG   1.22   CCG   0.40
  ATT   2.61   ACT   1.78
  ATC   1.64   ACC   1.49
  ATA   1.27   ACA   1.51
  ATG   2.27   ACG   0.41
  GTT   2.67   GCT   2.81
  GTC   1.24   GCC   1.69
  GTA   0.73   GCA   2.27
  GTG   2.20   GCG   0.59
表25
  密码子   %   密码子   %
  TAT   1.61   TGT   0.72
  TAC   1.53   TGC   0.75
  TAA   0.11   TGA   0.09
  TAG   0.06   TGG   1.21
  CAT   1.33   CGT   0.72
  CAC   1.09   CGC   0.63
  CAA   2.04   CGA   0.38
  CAG   1.71   CGG   0.27
  AAT   2.10   AGT   1.21
  AAC   2.27   AGC   1.08
  AAA   2.63   AGA   1.42
  AAG   3.83   AGG   1.35
  GAT   3.29   GGT   2.17
  GAC   2.06   GGC   1.38
  GAA   3.35   GGA   2.23
  GAG   3.46   GGG   1.29
表26
  密码子   %   密码子   %
  TTT   1.71   TCT   0.98
  TTC   1.47   TCC   0.73
  TTA   0.98   TCA   0.98
  TTG   2.93   TCG   0.24
  CTT   3.18   CCT   2.44
  CTC   2.20   CCC   1.22
  CTA   0.98   CCA   2.69
  CTG   1.71   CCG   0.49
  ATT   2.20   ACT   1.71
  ATC   1.22   ACC   1.47
  ATA   0.98   ACA   1.47
  ATG   2.69   ACG   0.49
  GTT   2.93   GCT   4.16
  GTC   1.22   GCC   2.69
  GTA   0.73   GCA   3.67
  GTG   2.20   GCG   0.98
表27
  密码子   %   密码子   %
  TAT   0.73   TGT   0.73
  TAC   0.73   TGC   0.49
  TAA   0.00   TGA   0.00
  TAG   0.24   TGG   0.98
  CAT   1.47   CGT   1.47
  CAC   0.98   CGC   1.47
  CAA   1.71   CGA   0.73
  CAG   1.47   CGG   0.49
  AAT   0.73   AGT   0.73
  AAC   0.49   AGC   0.73
  AAA   0.49   AGA   2.93
  AAG   0.73   AGG   2.93
  GAT   5.38   GGT   1.71
  GAC   3.42   GGC   1.22
  GAA   2.69   GGA   1.96
  GAG   3.42   GGG   0.98
(2)具有本发明蛋白质(A1)S的转化大肠杆菌的生产用限制酶NdeI和HindIII消化在实施例46(1)中获得的具有SEQ IDNO:214所示核苷酸序列的DNA。将用NdeI和HindIII消化的获得的DNA和质粒pKSN2连接以获得其中具有SEQ ID NO:214所示核苷酸序列的DNA插入pKSN2的NdeI位点和HindIII位点之间的质粒(以下称为“pKSN657soy”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN657soy。
(3)本发明蛋白质(A1)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养在实施例46(2)中获得的大肠杆菌JM109/pKSN657soy和在实施例4(1)中获得的大肠杆菌JM109/pKSN657中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将从大肠杆菌JM109/pKSN657soy获得的上清液级分称为“大肠杆菌pKSN657soy提取物”和将从大肠杆菌JM109/pKSN657获得的上清液级分称为“大肠杆菌JM109/pKSN657提取物”)。在大肠杆菌pKSN657soy提取物中包含的每一蛋白质的的量的P450的量可以比得上和高于在大肠杆菌pKSN657提取物中包含的每一蛋白质的量的P450的量。
实施例47将本发明DNA(A1)S导入植物
(1)用于直接导入的包含本发明DNA(A1)S的叶绿体表达质粒的构建-部分1
构建包含嵌合DNA的质粒作为用基因枪法将本发明DNA(A1)S导入植物的质粒,所述嵌合DNA中本发明DNA(A1)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
首先,通过PCR扩增包含SEQ ID NO:214所示核苷酸序列的DNA。通过将在实施例46(2)中获得的pKSN657soy用作模板和通过将由SEQ IDNO:394所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:395所示核苷酸序列组成的寡核苷酸用作引物来进行PCR。PCR使用KOD-plus(ToyoboCompany)。依照以下进行PCR:在94℃下进行保持2分钟;30个循环,一个循环包括保持94℃ 30秒,接着50℃ 30秒,接着68℃ 60秒;和最后保持在68℃ 30秒。通过按照附带手册进行程序用MagExtractor-PCR&Gel-Clean up(Toyobo Company)回收扩增的DNA并纯化。在用限制酶EcoT22I和SacI消化纯化的DNA以后,回收包含SEQID NO:214所示核苷酸序列的DNA。在用限制酶EcoT22I和SacI消化在实施例16(2)中获得的质粒pUCrSt657以后,分离约2.9kbp的DNA,其具有来源于pUC19的核苷酸序列和编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的序列。将获得的DNA和包含SEQ ID NO:214所示核苷酸序列的上述DNA连接以获得包含嵌合DNA的pUCrSt657soy(图48),其中本发明DNA(A1)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
用限制酶BamHI和SacI消化获得的质粒pUCrSt657soy以分离包含SEQ ID NO:214所示核苷酸序列的DNA。将所述DNA插入在实施例16(2)中获得的质粒pNdG6-AT的BglII限制酶位点和SacI限制酶位点之间以获得质粒pSUM-NdG6-rSt-657soy(图49),其中CR16G6启动子已经连接到嵌合DNA的下游,所述嵌合DNA中本发明DNA(A1)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
接下来,将质粒导入大肠杆菌DH5α感受态细胞(Takara ShuzoCompany)和选择氨苄青霉素抗性细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒3.0版(PE Applied Biosystems Company)和DNA测序仪3100(PE Applied Biosystems Company)测定包含在所选氨苄青霉素抗性菌株中的质粒的核苷酸序列。结果,证实质粒pSUM-NdG6-rSt-657soy具有SEQ ID NO:214所示核苷酸序列。
(2)用于直接导入的具有本发明DNA(A1)S的叶绿体表达质粒的构建-部分(2)
构建用基因枪法将本发明DNA(A1)S导入植物的质粒。该质粒包含嵌合DNA,其中本发明DNA(A1)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。首先,通过PCR扩增包含SEQ ID NO:214所示核苷酸序列的DNA。通过将在实施例46(2)中获得的pKSN657soy用作模板和通过将由SEQ ID NO:395所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:396所示核苷酸序列组成的寡核苷酸用作引物来进行PCR。PCR使用KOD-plus(Toyobo Company)。依照以下进行PCR:在94℃下进行保持2分钟;25个循环,一个循环包括保持94℃ 30秒,接着46℃ 30秒,接着68℃ 60秒;和最后保持在68℃ 3分钟。通过按照附带手册进行程序用MagExtractor-PCR&Gel-Clean up(Toyobo Company)回收扩增的DNA并纯化。在用限制酶SacI消化纯化的DNA以后,回收包含SEQ ID NO:214所示核苷酸序列的DNA。
用限制酶BspHI消化在实施例16(3)中获得的质粒pKFrSt12-657。然后通过按照附带手册使用TaKaRa BKL试剂盒(TaKaRa ShuzoCompany)将DNA平末端化和将5’末端去磷酸化。接下来,在用限制酶SacI消化DNA以后,分离来源于质粒pKFrSt12的DNA。将所述DNA与用SacI消化和包含SEQ ID NO:214所示核苷酸序列的DNA连接,以便获得包含嵌合DNA的质粒pKFrSt12-657soy(图50),在所述嵌合DNA中本发明DNA(A1)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。
用限制酶BamHI和SacI消化获得的质粒pKFrSt12-657soy以分离包含SEQ ID NO:214所示核苷酸序列的DNA。将所述DNA插入质粒pNdG6-AT的BglII限制酶位点和SacI限制酶位点之间以获得质粒pSUM-NdG6-rSt12-657soy(图51),其中CR16G6启动子已经连接到嵌合DNA的下游,所述嵌合DNA中所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
接下来,将质粒导入大肠杆菌DH5α感受态细胞(Takara ShuzoCompany)和选择氨苄青霉素抗性细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒3.0版(PE Applied Biosystems Company)和DNA测序仪3100(PE Applied Biosystems Company)测定包含在氨苄青霉素抗性菌株中的质粒的核苷酸序列。结果,证实质粒pSUM-NdG6-rSt12-657soy具有SEQ ID NO:214所示核苷酸序列。
(3)将本发明DNA(A1)S导入大豆
除了用B5培养基(O.L.Gamborg等,Exp.Cell Res.(1986)50 p151)的维生素来源替代MS培养基的维生素来源以外,按照实施例17(1)所述方法制备大豆(栽培品种:Fayette和Jack)的球形胚。
将获得的球形胚移植到新鲜体细胞胚生长培养基中和培养2-3天。按照实施例17(2)所述方法,将在实施例47(1)中构建的质粒pSUM-NdG6-rSt-657soy或在实施例47(2)中构建的质粒pSUM-NdG6-rSt12-657soy导入所述球形胚。
(4)用潮霉素选择体细胞胚
除了用B5培养基的维生素来源替代MS培养基的维生素来源以外,按照实施例17(3)所述方法进行用潮霉素选择在实施例47(3)中获得的在基因导入后的球形胚。然而,在第二次移植后,将加入0.2(w/v)%脱乙酰吉兰糖胶的培养基或未加脱乙酰吉兰糖胶的液体培养基用作体细胞胚选择培养基。在液体培养基的情形中,培养具有每分钟90和缓的旋转。
(5)用化合物(II)选择体细胞胚
除了用B5培养基的维生素来源替代MS培养基的维生素来源以外,按照实施例17(4)所述方法进行用化合物(II)选择在实施例47(3)中获得的导入基因以后的球形胚。
(6)从体细胞胚的植物再生,顺应和培养
按照实施例17(5)所述方法,从在实施例47(4)或47(5)中选择的球形胚进行植物的再生。然而,将发育培养基中的琼脂浓度调整至0.8(w/v)%或1.0(w/v)%。另外,用B5培养基的维生素来源替代发芽培养基的MS培养基的维生素来源。
相应地用实施例17(6)所述方法将具有根和发育的叶子的植物进行顺应和培养和收获。
(7)对除草化合物(II)的抗性评估
按照实施例17(4)所述方法评估在实施例47(6)中获得的再生植物对化合物(II)的抗性程度。
(8)用于农杆菌导入的具有本发明DNA(A1)S的叶绿体表达质粒的构建
构建用农杆菌法将本发明DNA(A1)S导入植物的质粒。用限制酶NotI消化质粒pSUM-NdG6-rSt-657soy以获得嵌合DNA,其中本发明DNA(A1)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。将所述DNA插入在实施例18中获得的上述二元质粒载体pBI121S的NotI限制位点中以获得质粒pBI-NdG6-rSt-657soy(图52)。另外,用限制酶NotI消化质粒pSUM-NdG6-rSt12-657soy以分离嵌合DNA,其中本发明DNA(A1)S紧接在编码大(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。将该DNA插入上述二元质粒载体pBI121S的NotI限制位点中以获得质粒pBI-NdG6-rSt12-657soy(图53)。
(9)将本发明DNA(A1)S导入烟草
使用在实施例47(8)中获得的质粒pBI-NdG6-rSt-657soy和pBI-NdG6-rSt12-657soy,用农杆菌法将本发明DNA(A1)S导入烟草。
首先,按照实施例19所述方法,分别将质粒pBI-NdG6-rSt-657soy和pBI-NdG6-rSt12-657soy导入根癌农杆菌LBA4404(Clontech Company)。分离具有pBI-NdG6-rSt-657soy或pBI-NdG6-rSt12-657soy的转基因农杆菌。
然后,除了在包含25mg/L卡那霉素的LB液体培养基中在30℃下过夜培养具有上述质粒的转基因农杆菌以外,按照实施例19所述方法将所述农杆菌用来将基因导入烟草。分别获得已经整合pBI-NdG6-rSt-657soy或pBI-NdG6-rSt12-657soy的T-DNA区域的转基因烟草。
(10)使用本发明DNA(A1)S转基因烟草的叶片的抗性评估
从35株在实施例47(9)中获得的转基因烟草采集叶子。将每片叶子分成几片,其中每片5-7mm宽。将叶片种植到含有0,0.05,0.1或0.2mg/L化合物(II)的MS琼脂培养基上并在光照中在室温下培养。在培养的第11天,观察每个叶片的除草损伤。另外,将叶片种植到含有0,0.01,0.02,0.05或0.1mg/L化合物(XII)的MS琼脂培养基上并在光照中在室温下培养。在培养的第7天,观察每个叶片的除草损伤。作为对照,将20个未进行基因导入的烟草叶片(以下,称为“野生型烟草”)用于各个浓度。通过对连续生长的叶片记1分,对其中观察到化学损伤的半枯萎的叶片记0.5分,和对变白和已经枯萎的叶片记0分,测定对每组的平均分数。对于化合物(II)和化合物(XII)中每一个,本发明DNA(A1)S(质粒pBI-NdG6-rSt-657soy或pBI-NdG6-rSt12-657soy的T-DNA区域)已经导入的烟草叶片提供比野生型烟草更高的分数。
实施例48获得本发明DNA(A16)
(1)装饰链霉菌IFO 13069t的染色体DNA的制备
根据实施例31(1)所述方法,制备装饰链霉菌IFO 13069t的染色体DNA。
(2)具有本发明DNA(A11)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例48(1)中从装饰链霉菌IFO13069t制备的染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(InvitrogenCompany)。分析其序列。结果,提供在SEQ ID NO:225所示核苷酸序列的核苷酸343至1069中所表示的核苷酸序列。
另外,用限制酶PvuII消化在实施例48(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:265所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:266所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:235所示核苷酸序列的核苷酸1至501中所表示的核苷酸序列。
另外,用限制酶PvuII消化在实施例48(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:267所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:268所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:235所示核苷酸序列的核苷酸1044至1454中所表示的核苷酸序列。
(3)本发明DNA(A16)的序列分析
通过连接由实施例48(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:235中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1251个核苷酸(包括终止密码子)组成和编码416个氨基酸残基(SEQ ID NO:215)的核苷酸序列(SEQ ID NO:225)以及由198个核苷酸(包括终止密码子)组成和编码65个氨基酸残基(SEQ IDNO:245)的核苷酸序列(SEQ ID NO:255)。由SEQ ID NO:225所示核苷酸序列编码的氨基酸序列(SEQ ID NO:215)组成的蛋白质的分子量据计算为46013Da。另外,由SEQ ID NO:255所示核苷酸序列编码的氨基酸序列(SEQ ID NO:245)组成的蛋白质的分子量据计算为6768Da。
实施例49本发明DNA(A16)在大肠杆菌中的表达
(1)具有本发明DNA(A16)的转化大肠杆菌的产生
通过使用GeneAmp High Fidelity PCR System(Applied BiosystemsJapan Company)和通过使用在实施例48(1)中从装饰链霉菌IFO 13069t制备的染色体DNA作为模板进行PCR。作为引物,使用具有SEQ ID NO:269所示核苷酸序列的寡核苷酸和具有SEQ ID NO:286所示核苷酸序列的寡核苷酸的配对。通过加入2种每种总计200nM的引物,50ng上述染色体DNA,5.0μl dNTP混合物(4种dNTP每种2.0mM的混合物;Clontech公司),5μl 10x缓冲液(包含MgCl2)和0.5μl GeneAmp HF酶混合物和通过加入蒸馏水,PCR反应溶液总计50μl。PCR的反应条件是在保持在97℃ 1分钟后,重复10个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 90秒;然后进行15个循环,一个循环包括保持在97℃ 15秒,接着60℃ 30秒,接着72℃ 90秒(其中每个循环保持在72℃增加20秒);和然后保持72℃ 7分钟。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(InvitrogenCompany)中。通过将分别具有SEQ ID NO:57,59,267,286和288所示核苷酸序列的寡核苷酸用作引物分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:235所示核苷酸序列的质粒称为pCR452F。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR452F。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:235所示核苷酸序列的质粒,其中将编码本发明蛋白质(A16)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN452F”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN452F。
(2)本发明蛋白质(A16)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN452F和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN452F的上清液级分称为“大肠杆菌pKSN452F提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似实施例32(3),制备30μ1的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例49(2)中制备的上清液级分(大肠杆菌pKSN452F提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN452F提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例50获得本发明DNA(A17)
(1)灰色链霉菌ATCC 10137的染色体DNA的制备
根据实施例31(1)所述方法,制备灰色链霉菌ATCC 10137的染色体DNA。
(2)具有本发明DNA(A17)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例50(1)中从灰色链霉菌ATCC 10137制备的染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(Invitrogen Company)。分析其核苷酸序列。结果,提供在SEQ ID NO:226所示核苷酸序列的核苷酸343至1069中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例50(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:270所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:271所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:236所示核苷酸序列的核苷酸1至361中所表示的核苷酸序列。
另外,用限制酶PvuII消化在实施例50(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:272所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:273所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:236所示核苷酸序列的核苷酸1035至1454中所表示的核苷酸序列。
(3)本发明DNA(A17)的序列分析
通过连接由实施例50(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:236中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1251个核苷酸(包括终止密码子)组成和编码416个氨基酸残基(SEQ ID NO:216)的核苷酸序列(SEQ ID NO:226)以及由198个核苷酸(包括终止密码子)组成和编码65个氨基酸残基(SEQ IDNO:246)的核苷酸序列(SEQ ID NO:256)。由SEQ ID NO:226所示核苷酸序列编码的氨基酸序列(SEQ ID NO:216)组成的蛋白质的分子量据计算为46082Da。由SEQ ID NO:256所示核苷酸序列编码的氨基酸序列(SEQ ID NO:246)组成的蛋白质的分子量据计算为6768Da。在SEQ IDNO:256中所示的核苷酸序列与在SEQ ID NO:255中所示核苷酸序列100%相同。在SEQ ID NO:246中表示的氨基酸序列与在SEQ ID NO:245中表示的氨基酸序列100%相同。
实施例51本发明DNA(A17)在大肠杆菌中的表达
(1)具有本发明DNA(A17)的转化大肠杆菌的产生
除了使用从实施例50(1)的灰色链霉菌ATCC 10137中制备的染色体DNA作为模板和使用具有SEQ ID NO:274所示核苷酸序列的寡核苷酸和具有SEQ ID NO:275所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例32(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:57,59,274,276和277所示核苷酸序列的寡核苷酸用作引物测序获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:236所示核苷酸序列的质粒称为pCR608F。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR608F。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:236所示核苷酸序列的质粒,其中将编码本发明蛋白质(A17)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN608F”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN608F。
(2)本发明蛋白质(A17)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN608F和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN608F的上清液级分称为“大肠杆菌pKSN608F提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μl的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例51(2)中制备的上清液级分(大肠杆菌pKSN608F提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN608F提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例52获得本发明DNA(A18)
(1)不产色链霉菌IFO 12735的染色体DNA的制备
根据实施例31(1)所述方法,制备不产色链霉菌IFO 12735的染色体DNA。
(2)具有本发明DNA(A18)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例52(1)中制备的不产色链霉菌IFO 12735的染色体DNA用作模板和通过使用引物对17进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(Invitrogen Company)。分析其核苷酸序列。结果,提供在SEQ ID NO:227所示核苷酸序列的核苷酸526至1048中所表示的核苷酸序列。
另外,用限制酶HincII消化在实施例52(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:278所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:279所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:237所示核苷酸序列的核苷酸1至600中所表示的核苷酸序列。
另外,用限制酶BalI消化在实施例52(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:163所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:164所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:237所示核苷酸序列的核苷酸983至1449中所表示的核苷酸序列。
(3)本发明DNA(A18)的序列分析
通过连接由实施例52(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:237中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1230个核苷酸(包括终止密码子)组成和编码409个氨基酸残基(SEQ ID NO:217)的核苷酸序列(SEQ ID NO:227)以及由207个核苷酸(包括终止密码子)组成和编码68个氨基酸残基(SEQ IDNO:247)的核苷酸序列(SEQ ID NO:257)。由SEQ ID NO:227所示核苷酸序列编码的氨基酸序列(SEQ ID NO:217)组成的蛋白质的分子量据计算为45099Da。由SEQ ID NO:257所示核苷酸序列编码的氨基酸序列(SEQ ID NO:247)组成的蛋白质的分子量据计算为7193Da。
实施例53本发明DNA(A18)在大肠杆菌中的表达
(1)具有本发明DNA(A18)的转化大肠杆菌的产生
除了使用从实施例52(1)中的不产色链霉菌IFO 12735制备的染色体DNA作为模板和使用具有SEQ ID NO:183所示核苷酸序列的寡核苷酸和具有SEQ ID NO:280所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例49(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:67,68,163,279和281所示核苷酸序列的寡核苷酸用作引物分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:237所示核苷酸序列的质粒称为pCR646BF。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR646BF。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:237所示核苷酸序列的质粒,其中将编码本发明蛋白质(A18)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN646BF”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN646BF。
(2)本发明蛋白质(A18)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN646BF和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN646BF的上清液级分称为“大肠杆菌pKSN646BF提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μl的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例53(2)中制备的上清液级分(大肠杆菌pKSN646BF提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN646BF提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例54获得本发明DNA(A19)
(1)灰色链霉菌IFO 13849T的染色体DNA的制备
根据实施例31(1)所述方法,制备灰色链霉菌IFO 13849T的染色体DNA。
(2)具有本发明DNA(A19)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例54(1)中制备的灰色链霉菌IFO 13849T染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(InvitrogenCompany)。分析其核苷酸序列。结果,提供在SEQ ID NO:228所示核苷酸序列的核苷酸343至1069中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例54(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:282所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:283所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:238所示核苷酸序列的核苷酸1至358中所表示的核苷酸序列。
另外,用限制酶HincII消化在实施例54(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:284所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:285所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:238所示核苷酸序列的核苷酸1005至1454中所表示的核苷酸序列。
(3)本发明DNA(A19)的序列分析
通过连接由实施例54(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:238中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1251个核苷酸(包括终止密码子)组成和编码416个氨基酸残基(SEQ ID NO:218)的核苷酸序列(SEQ ID NO:228)以及由156个核苷酸(包括终止密码子)组成和编码51个氨基酸残基(SEQ IDNO:248)的核苷酸序列(SEQ ID NO:258)。由SEQ ID NO:228所示核苷酸序列编码的氨基酸序列(SEQ ID NO:218)组成的蛋白质的分子量据计算为45903Da。由SEQ ID NO:258所示核苷酸序列编码的氨基酸序列(SEQ ID NO:248)组成的蛋白质的分子量据计算为5175Da。
实施例55本发明DNA(A19)在大肠杆菌中的表达
(1)具有本发明DNA(A19)的转化大肠杆菌的产生
除了使用从实施例54(1)中灰色链霉菌IFO 13849T制备的染色体DNA作为模板和使用具有SEQ ID NO:286所示核苷酸序列的寡核苷酸和具有SEQ ID NO:287所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例49(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:57,59,284,286和288所示核苷酸序列的寡核苷酸用作引物分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:238所示核苷酸序列的质粒称为pCR1502F。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1502F。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:238所示核苷酸序列的质粒,其中将编码本发明蛋白质(A19)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN1502F”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1502F。
(2)本发明蛋白质(A19)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1502F和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1502F的上清液级分称为“大肠杆菌pKSN1502F提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μl的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例55(2)中制备的上清液级分(大肠杆菌pKSN1502F提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1502F提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例56获得本发明DNA(A20)
(1)羊毛链霉菌IFO 12787T的染色体DNA的制备
根据实施例31(1)所述方法,制备羊毛链霉菌IFO 12787T的染色体DNA。
(2)具有本发明DNA(A20)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例56(1)中制备的羊毛链霉菌IFO 12787T染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(InvitrogenCompany)。分析其核苷酸序列。结果,提供在SEQ ID NO:229所示核苷酸序列的核苷酸304至1036中所表示的核苷酸序列。
另外,用限制酶PmacI消化在实施例56(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:278所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:289所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:239所示核苷酸序列的核苷酸1至318中所表示的核苷酸序列。
另外,用限制酶StuI消化在实施例56(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:290所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:291所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:239所示核苷酸序列的核苷酸969至1461中所表示的核苷酸序列。
(3)本发明DNA(A20)的序列分析
通过连接由实施例56(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:239中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1218个核苷酸(包括终止密码子)组成和编码405个氨基酸残基(SEQ ID NO:219)的核苷酸序列(SEQ ID NO:229)以及由231个核苷酸(包括终止密码子)组成和编码76个氨基酸残基(SEQ IDNO:249)的核苷酸序列(SEQ ID NO:259)。由SEQ ID NO:229所示核苷酸序列编码的氨基酸序列(SEQ ID NO:219)组成的蛋白质的分子量据计算为45071Da。由SEQ ID NO:259所示核苷酸序列编码的氨基酸序列(SEQ ID NO:249)组成的蛋白质的分子量据计算为7816Da。
实施例57本发明DNA(A20)在大肠杆菌中的表达
(1)具有本发明DNA(A20)的转化大肠杆菌的产生
除了使用从实施例56(1)羊毛链霉菌IFO 12787T制备的染色体DNA作为模板和使用具有SEQ ID NO:292所示核苷酸序列的寡核苷酸和具有SEQ ID NO:293所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例49(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:67,68,188,278和290所示核苷酸序列的寡核苷酸用作引物分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ IDNO:239所示核苷酸序列的质粒称为pCR1525F。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1525F。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:239所示核苷酸序列的质粒,其中将编码本发明蛋白质(A20)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN1525F”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1525F。
(2)本发明蛋白质(A20)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1525F和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1525F的上清液级分称为“大肠杆菌pKSN1525F提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μ1的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例57(2)中制备的上清液级分(大肠杆菌pKSN1525F提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1525F提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例58获得本发明DNA(A21)
(1)三泽链霉菌IFO 13855T的染色体DNA的制备
根据实施例31(1)所述方法,制备三泽链霉菌IFO 13855T的染色体DNA。
(2)具有本发明DNA(A21)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例58(1)中制备的三泽链霉菌IFO 13855T染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(InvitrogenCompany)。分析其核苷酸序列。结果,提供在SEQ ID NO:230所示核苷酸序列的核苷酸328至1063中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例58(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:294所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:295所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:240所示核苷酸序列的核苷酸1至341中所表示的核苷酸序列。
另外,用限制酶HincII消化在实施例58(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:296所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:297所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:240所示核苷酸序列的核苷酸1017至1458中所表示的核苷酸序列。
(3)本发明DNA(A21)的序列分析
通过连接由实施例58(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:240中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1245个核苷酸(包括终止密码子)组成和编码414个氨基酸残基(SEQ ID NO:220)的核苷酸序列(SEQ ID NO:230)以及由201个核苷酸(包括终止密码子)组成和编码66个氨基酸残基(SEQ IDNO:250)的核苷酸序列(SEQ ID NO:260)。由SEQ ID NO:230所示核苷酸序列编码的氨基酸序列(SEQ ID NO:220)组成的蛋白质的分子量据计算为45806Da。由SEQ ID NO:260所示核苷酸序列编码的氨基酸序列(SEQ ID NO:250)组成的蛋白质的分子量据计算为6712Da。
实施例59本发明DNA(A21)在大肠杆菌中的表达
(1)具有本发明DNA(A21)的转化大肠杆菌的产生
除了使用从实施例58(1)中三泽链霉菌IFO 13855T制备的染色体DNA作为模板和使用具有SEQ ID NO:298所示核苷酸序列的寡核苷酸和具有SEQ ID NO:299所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例32(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:57,59,296和300所示核苷酸序列的寡核苷酸用作引物分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:240所示核苷酸序列的质粒称为pCR1543BF。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1543BF。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:240所示核苷酸序列的质粒,其中将编码本发明蛋白质(A21)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN1543BF”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1543BF。
(2)本发明蛋白质(A21)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1543BF和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1543BF的上清液级分称为“大肠杆菌pKSN1543BF提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μl的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例59(2)中制备的上清液级分(大肠杆菌pKSN1543BF提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1543BF提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例60获得本发明DNA(A22)
(1)苍白色链霉菌IFO 13434T的染色体DNA的制备
根据实施例31(1)所述方法,制备苍白色链霉菌IFO 13434T的染色体DNA。
(2)具有本发明DNA(A22)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例60(1)中制备的苍白色链霉菌IFO 13434T染色体DNA用作模板和通过使用引物对15进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(Invitrogen Company)。分析其核苷酸序列。结果,提供在SEQ ID NO:231所示核苷酸序列的核苷酸483至1048中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例60(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:301所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:302所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:241所示核苷酸序列的核苷酸68至516中所表示的核苷酸序列。
另外,用限制酶HincII消化在实施例60(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:302所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:303所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:241所示核苷酸序列的核苷酸1至270中所表示的核苷酸序列。
另外,用限制酶HincII消化在实施例60(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:304所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:305所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:241所示核苷酸序列的核苷酸982至1448中所表示的核苷酸序列。
(3)本发明DNA(A22)的序列分析
通过连接由实施例60(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:241中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1230个核苷酸(包括终止密码子)组成和编码409个氨基酸残基(SEQ ID NO:221)的核苷酸序列(SEQ ID NO:231)以及由195个核苷酸(包括终止密码子)组成和编码64个氨基酸残基(SEQ IDNO:251)的核苷酸序列(SEQ ID NO:261)。由SEQ ID NO:231所示核苷酸序列编码的氨基酸序列(SEQ ID NO:221)组成的蛋白质的分子量据计算为45050Da。由SEQ ID NO:261所示核苷酸序列编码的氨基酸序列(SEQ ID NO:251)组成的蛋白质的分子量据计算为6914Da。
实施例61本发明DNA(A22)在大肠杆菌中的表达
(1)具有本发明DNA(A22)的转化大肠杆菌的产生
除了使用从实施例60(1)中苍白色链霉菌IFO 13434T制备的染色体DNA作为模板和使用具有SEQ ID NO:306所示核苷酸序列的寡核苷酸和具有SEQ ID NO:307所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例32(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:67,68和308所示核苷酸序列的寡核苷酸用作引物分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ IDNO:241所示核苷酸序列的质粒称为pCR1558BF。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1558BF。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:241所示核苷酸序列的质粒,其中将编码本发明蛋白质(A22)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN1558BF”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1558BF。
(2)本发明蛋白质(A22)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1558BF和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1558BF的上清液级分称为“大肠杆菌pKSN1558BF提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μl的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例61(2)中制备的上清液级分(大肠杆菌pKSN1558BF提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1558BF提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例62获得本发明DNA(A23)
(1)玫瑰变红链霉菌IFO 13682T的染色体DNA的制备
根据实施例31(1)所述方法,制备玫瑰变红链霉菌IFO 13682T的染色体DNA。
(2)具有本发明DNA(A23)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例62(1)中制备的玫瑰变红链霉菌IFO 13682T染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(Invitrogen Company)。分析其核苷酸序列。结果,提供在SEQ ID NO:232所示核苷酸序列的核苷酸289至1015中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例62(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:309所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:310所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:242所示核苷酸序列的核苷酸1至354中所表示的核苷酸序列。
另外,用限制酶PvuII消化在实施例62(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:311所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:312所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:242所示核苷酸序列的核苷酸966至1411中所表示的核苷酸序列。
(3)本发明DNA(A23)的序列分析
通过连接由实施例62(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:242中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1197个核苷酸(包括终止密码子)组成和编码398个氨基酸残基(SEQ ID NO:222)的核苷酸序列(SEQ ID NO:232)以及由201个核苷酸(包括终止密码子)组成和编码66个氨基酸残基(SEQ IDNO:252)的核苷酸序列(SEQ ID NO:262)。由SEQ ID NO:232所示核苷酸序列编码的氨基酸序列(SEQ ID NO:222)组成的蛋白质的分子量据计算为43624Da。由SEQ ID NO:262所示核苷酸序列编码的氨基酸序列(SEQ ID NO:252)组成的蛋白质的分子量据计算为6797Da。
实施例63本发明DNA(A23)在大肠杆菌中的表达
(1)具有本发明DNA(A23)的转化大肠杆菌的产生
除了使用在实施例62(1)中玫瑰变红链霉菌IFO 13682T制备的染色体DNA作为模板和使用具有SEQ ID NO:313所示核苷酸序列的寡核苷酸和具有SEQ ID NO:314所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例49(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:67,68,309,311和315所示核苷酸序列的寡核苷酸用作引物分析获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:242所示核苷酸序列的质粒称为pCR1584F。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1584F。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:242所示核苷酸序列的质粒,其中将编码本发明蛋白质(A23)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN1584F”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1584F。
(2)本发明蛋白质(A23)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1584F和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1584F的上清液级分称为“大肠杆菌pKSN1584F提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μ1的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例63(2)中制备的上清液级分(大肠杆菌pKSN1584F提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值O.24和0.29)。从包含大肠杆菌pKSN1584F提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例64获得本发明DNA(A24)
(1)鲁地链霉菌IFO 15875T的染色体DNA的制备
根据实施例31(1)所述方法,制备鲁地链霉菌IFO 15875T的染色体DNA。
(2)具有本发明DNA(A24)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在制备的实施例64(1)中鲁地链霉菌IFO 15875T染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(InvitrogenCompany)。分析其核苷酸序列。结果,提供在SEQ ID NO:233所示核苷酸序列的核苷酸322至1057中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例64(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:316所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:317所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:243所示核苷酸序列的核苷酸1至384中所表示的核苷酸序列。
另外,用限制酶NaeI消化在实施例64(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:318所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:319所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:243所示核苷酸序列的核苷酸992至1466中所表示的核苷酸序列。
(3)本发明DNA(A24)的序列分析
通过连接由实施例64(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:243中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1245个核苷酸(包括终止密码子)组成和编码414个氨基酸残基(SEQ ID NO:223)的核苷酸序列(SEQ ID NO:233)以及由198个核苷酸(包括终止密码子)组成和编码65个氨基酸残基(SEQ IDNO:253)的核苷酸序列(SEQ ID NO:263)。由SEQ ID NO:233所示核苷酸序列编码的氨基酸序列(SEQ ID NO:223)组成的蛋白质的分子量据计算为45830Da。由SEQ ID NO:263所示核苷酸序列编码的氨基酸序列(SEQ ID NO:253)组成的蛋白质的分子量据计算为7034Da。
实施例65本发明DNA(A24)在大肠杆菌中的表达
(1)具有本发明DNA(A24)的转化大肠杆菌的产生
除了使用在实施例64(1)中鲁地链霉菌IFO 15875T制备的染色体DNA作为模板和使用具有SEQ ID NO:320所示核苷酸序列的寡核苷酸和具有SEQ ID NO:321所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例49(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:67,68和322所示核苷酸序列的寡核苷酸用作引物测序获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ IDNO:243所示核苷酸序列的质粒称为pCR1589BF。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1589BF。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:243所示核苷酸序列的质粒,其中将编码本发明蛋白质(A24)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN1589BF”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1589BF。
(2)本发明蛋白质(A24)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1589BF和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1589BF的上清液级分称为“大肠杆菌pKSN1589BF提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μl的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例65(2)中制备的上清液级分(大肠杆菌pKSN1589BF提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1589BF提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例66获得本发明DNA(A25)
(1)斯堡链霉菌IFO 13446T的染色体DNA的制备
根据实施例31(1)所述方法,制备斯堡链霉菌IFO 13446T的染色体DNA。
(2)具有本发明DNA(A25)部分核苷酸序列的DNA的分离
按照实施例29所述方法,通过将在实施例66(1)中制备的斯堡链霉菌IFO 13446T染色体DNA用作模板和通过使用引物对14进行PCR。类似于实施例31(2),将扩增的DNA克隆到克隆载体pCRII-TOPO(InvitrogenCompany)。分析其核苷酸序列。结果,提供在SEQ ID NO:234所示核苷酸序列的核苷酸289至1015中所表示的核苷酸序列。
另外,用限制酶SmaI消化在实施例66(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:323所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:324所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:244所示核苷酸序列的核苷酸1至303中所表示的核苷酸序列。
另外,用限制酶PmacI消化在实施例66(1)中制备的染色体DNA。按照实施例26(3)所述方法,通过使用获得的DNA产生基因组步行文库。通过使用获得的文库作为模板和通过使用具有SEQ ID NO:311所示核苷酸序列的寡核苷酸和引物AP1,在实施例26(3)所述条件下进行PCR以获得第一PCR产物。接下来,通过使用第一PCR产物作为模板和通过使用具有SEQ ID NO:325所示核苷酸序列的寡核苷酸和引物AP2,在实施例26(3)所述条件下进行PCR。分析获得的DNA的核苷酸序列。提供在SEQ ID NO:244所示核苷酸序列的核苷酸966至1411中所表示的核苷酸序列。
(3)本发明DNA(A25)的序列分析
通过连接由实施例66(2)所获DNA提供的核苷酸序列获得在SEQ IDNO:244中表示的核苷酸序列。在所述核苷酸序列中存在两个可读框(ORF)。因此,包含由1197个核苷酸(包括终止密码子)组成和编码398个氨基酸残基(SEQ ID NO:224)的核苷酸序列(SEQ ID NO:234)以及由201个核苷酸(包括终止密码子)组成和编码66个氨基酸残基(SEQ IDNO:254)的核苷酸序列(SEQ ID NO:264)。由SEQ ID NO:234所示核苷酸序列编码的氨基酸序列(SEQ ID NO:224)组成的蛋白质的分子量据计算为44175Da。由SEQ ID NO:264所示核苷酸序列编码的氨基酸序列(SEQ ID NO:254)组成的蛋白质的分子量据计算为6685Da。
实施例67本发明DNA(A25)在大肠杆菌中的表达
(1)具有本发明DNA(A25)的转化大肠杆菌的产生
除了使用在实施例66(1)中斯堡链霉菌IFO 13446T制备的染色体DNA作为模板和使用具有SEQ ID NO:326所示核苷酸序列的寡核苷酸和具有SEQ ID NO:327所示核苷酸序列的寡核苷酸作为引物以外,类似于实施例49(1)进行PCR。类似于实施例32(1),从PCR反应溶液中纯化DNA并克隆到克隆载体pCRII-TOPO(Invitrogen Company)中。通过将分别具有SEQ ID NO:67,68,311,315和323所示核苷酸序列的寡核苷酸用作引物测序获得的质粒DNA的核苷酸序列。基于获得的结果,将具有SEQ ID NO:244所示核苷酸序列的质粒称为pCR1609F。类似于实施例32(1),用限制酶NdeI和HindIII消化pCR1609F。从消化产物中纯化约1.5kbp的DNA。连接用NdeI和HindIII消化的获得的DNA和质粒pKSN2以获得包含SEQ ID NO:244所示核苷酸序列的质粒,其中将编码本发明蛋白质(A25)的DNA插入pKSN2的NdeI位点和HindIII位点之间(以下称为“pKSN1609F”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1609F。
(2)本发明蛋白质(A25)在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养大肠杆菌JM109/pKSN1609F和JM109/pKSN2中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将获自大肠杆菌JM109/pKSN1609F的上清液级分称为“大肠杆菌pKSN1609F提取物”,将获自大肠杆菌JM109/pKSN2的上清液级分称为“大肠杆菌pKSN2提取物”)。
(3)将化合物(II)转化为化合物(III)的能力的检测
类似于实施例32(3),制备30μl的反应溶液并保持在30℃下10分钟。然而,作为上清液级分,使用在实施例67(2)中制备的上清液级分(大肠杆菌pKSN1609F提取物或大肠杆菌pKSN2提取物)。用乙酸乙酯萃取保持后的反应溶液并将萃取层TLC分析。在展开TLC板以后,检查其上对应于用14C标记的化合物(III)的斑点的存在(Rf值0.24和0.29)。从包含大肠杆菌pKSN1609F提取物的反应溶液中检测到对应于化合物(III)的斑点。与此对比,在包含大肠杆菌pKSN2提取物的反应溶液中未检测到该斑点。
实施例68通过本发明蛋白质(A16),(A17),(A18),(A19),(A20),(A21),(A22),(A23),(A24)或(A25)的化合物的代谢
(1)通过本发明蛋白质(A16)的化合物(XII)的代谢
制备50mM磷酸钾(pH7.0)的100μl反应溶液,其包含12.5ppm化合物(XII),3mM β-NADPH(以下称为“组分A”)(Oriental YeastCompany),1mg/ml来源于菠菜的铁氧还蛋白(以下称为“组分B”)(SigmaCompany),0.15U/ml铁氧还蛋白还原酶(以下称为“组分C”)(SigmaCompany)和20μl在实施例49(2)中回收的上清液级分。将反应溶液保持在30℃下10分钟。另外,类似地制备和保持未加入用于上述反应溶液组合物中的、选自组分A,组分B和组分C和在实施例49(2)中制备的上清液级分的至少一种组分的50mM磷酸钾缓冲液(pH7.0)的100μl反应溶液。将五微升(5μl)2N HCl和100μl乙酸乙酯加入和混合到保持以后的每种反应溶液中。用UltraFree MC 0.22μm滤器装置(MilliporeCompany)过滤在8,000xg下离心的上清液。在上述分析条件1下在HPLC上分析四十微升(40μl)液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例49(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A16)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例49(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A16)”)。与从(XII)对照溶液(A16)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A16)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A16)检测到峰,其从(XII)对照溶液(A16)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(2)通过本发明蛋白质(A17)的化合物(XII)的代谢
除了使用20μl在实施例51(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例51(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A17)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例51(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A17)”)。与从(XII)对照溶液(A17)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A17)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A17)检测到峰,其从(XII)对照溶液(A17)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(3)通过本发明蛋白质(A18)的化合物(XII)的代谢
除了使用20μl在实施例53(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例53(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A18)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例53(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A18)”)。与从(XII)对照溶液(A18)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A18)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A18)检测到峰,其从(XII)对照溶液(A18)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(4)通过本发明蛋白质(A19)的化合物(XII)的代谢
除了使用20μl在实施例55(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例55(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A19)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例55(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A19)”)。与从(XII)对照溶液(A19)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A19)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A19)检测到峰,其从(XII)对照溶液(A19)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(5)通过本发明蛋白质(A20)的化合物(XII)的代谢
除了使用20μl在实施例57(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例57(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A20)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例57(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A20)”)。与从(XII)对照溶液(A20)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A20)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A20)检测到峰,其从(XII)对照溶液(A20)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(6)通过本发明蛋白质(A21)的化合物(XII)的代谢
除了使用20μl在实施例59(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例59(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A21)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例59(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A21)”)。与从(XII)对照溶液(A21)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A21)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A21)检测到峰,其从(XII)对照溶液(A21)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(7)通过本发明蛋白质(A22)的化合物(XII)的代谢
除了使用20μl在实施例61(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例61(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A22)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例61(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A22)”)。与从(XII)对照溶液(A22)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A22)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A22)检测到峰,其从(XII)对照溶液(A22)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(8)通过本发明蛋白质(A23)的化合物(XII)的代谢
除了使用20μl在实施例63(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例63(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A23)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例63(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A23)”)。与从(XII)对照溶液(A23)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A23)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A23)检测到峰,其从(XII)对照溶液(A23)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(9)通过本发明蛋白质(A24)的化合物(XII)的代谢
除了使用20μl在实施例65(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例65(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A24)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例65(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A24)”)。与从(XII)对照溶液(A24)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A24)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A24)检测到峰,其从(XII)对照溶液(A24)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(10)通过本发明蛋白质(A25)的化合物(XII)的代谢
除了使用20μl在实施例67(2)中回收的上清液级分而不是20μl在实施例49(2)中回收的上清液级分以外,按照实施例68(1)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例67(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)代谢溶液(A25)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例67(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XII)对照溶液(A25)”)。与从(XII)对照溶液(A25)检测的化合物(XII)的浓度相比,从(XII)代谢溶液(A25)检测的化合物(XII)的浓度较低。另外从(XII)代谢溶液(A25)检测到峰,其从(XII)对照溶液(A25)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(2)的(XII)代谢溶液(A1)中检测的所述化合物(XII)小14的化合物的峰洗脱时间相配。
(11)通过本发明蛋白质(A17)的化合物(XIII)的代谢
除了使用12.5ppm化合物(XIII)而不是12.5ppm化合物(XII)以外,按照实施例68(2)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在上述分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例51(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)代谢溶液(A17)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例51(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)对照溶液(A17)”)。与从(XIII)对照溶液(A17)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A17)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A17)检测到峰,其从(XIII)对照溶液(A17)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(12)通过本发明蛋白质(A18)的化合物(XIII)的代谢
除了使用20μl在实施例53(2)中回收的上清液级分而不是20μl在实施例51(2)中回收的上清液级分以外,按照实施例68(11)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例53(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)代谢溶液(A18)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例53(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)对照溶液(A18)”)。与从(XIII)对照溶液(A18)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A18)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A18)检测到峰,其从(XIII)对照溶液(A18)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(13)通过本发明蛋白质(A19)的化合物(XIII)的代谢
除了使用20μl在实施例55(2)中回收的上清液级分而不是20μl在实施例51(2)中回收的上清液级分以外,按照实施例68(11)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例55(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)代谢溶液(A19)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例55(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)对照溶液(A19)”)。与从(XIII)对照溶液(A19)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A19)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A19)检测到峰,其从(XIII)对照溶液(A19)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(14)通过本发明蛋白质(A20)的化合物(XIII)的代谢
除了使用20μl在实施例57(2)中回收的上清液级分而不是20μl在实施例51(2)中回收的上清液级分以外,按照实施例68(11)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例57(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)代谢溶液(A20)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例57(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)对照溶液(A20)”)。与从(XIII)对照溶液(A20)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A20)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A20)检测到峰,其从(XIII)对照溶液(A20)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(15)通过本发明蛋白质(A21)的化合物(XIII)的代谢
除了使用20μl在实施例59(2)中回收的上清液级分而不是20μl在实施例51(2)中回收的上清液级分以外,按照实施例68(11)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例59(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)代谢溶液(A21)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例59(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)对照溶液(A21)”)。与从(XIII)对照溶液(A21)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A21)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A21)检测到峰,其从(XIII)对照溶液(A21)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(16)通过本发明蛋白质(A23)的化合物(XIII)的代谢
除了使用20μl在实施例63(2)中回收的上清液级分而不是20μl在实施例51(2)中回收的上清液级分以外,按照实施例68(11)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例63(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)代谢溶液(A23)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例63(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)对照溶液(A23)”)。与从(XIII)对照溶液(A23)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A23)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A23)检测到峰,其从(XIII)对照溶液(A23)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
(17)通过本发明蛋白质(A25)的化合物(XIII)的代谢
除了使用20μl在实施例67(2)中回收的上清液级分而不是20μl在实施例51(2)中回收的上清液级分以外,按照实施例68(11)所述方法制备和保持反应溶液。类似于实施例68(1),制备保持后的每种反应溶液。在分析条件1下在HPLC上分析四十微升(40μl)获得的液体滤过物(以下,将来自包含组分A,组分B,组分C和20μl在实施例67(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)代谢溶液(A25)”;另外,将来自不包含组分A,不包含组分B,不包含组分C和不包含在实施例67(2)中回收的上清液级分的反应溶液的液体滤过物称为“(XIII)对照溶液(A25)”)。与从(XIII)对照溶液(A25)检测的化合物(XIII)的浓度相比,从(XIII)代谢溶液(A25)检测的化合物(XIII)的浓度较低。另外从(XIII)代谢溶液(A25)检测到峰,其从(XIII)对照溶液(A25)中未检测到。在HPLC上所述峰的洗脱时间与质量比在实施例41(3)的(XIII)代谢溶液(A1)中检测的所述化合物(XIII)小14的化合物的峰洗脱时间相配。
实施例69其中本发明DNA(A1),(A2),(A3)或(A4)是探针的杂交
(1)探针制备
按照实施例30(1)所述方法进行PCR。然而,作为模板,使用10ng在实施例26(1)中制备的不产色链霉菌IFO 12735的染色体DNA而不是在实施例3(1)中制备的暗产色链霉菌IFO 12898的所述50ng染色体DNA。作为引物,使用具有SEQ ID NO:328所示核苷酸序列的寡核苷酸和具有SEQ ID NO:329所示核苷酸序列的寡核苷酸。回收通过所述PCR扩增的DNA以产生用洋地黄毒苷标记的具有SEQ ID NO:109所示核苷酸序列的探针(以下称为“DIG标记的探针(A4)”)。
(2)质粒溶液的制备
通过使用Advantage-GC基因组聚合酶混合物(Clontech Company)和将在实施例31(1)中制备的黑胡桃链霉菌IFO 13445的染色体DNA用作模板进行PCR。作为引物,使用具有SEQ ID NO:330所示核苷酸序列的寡核苷酸和具有SEQ ID NO:331所示核苷酸序列的寡核苷酸。通过加入2种每种总计200nM的引物,10ng染色体DNA,4.0μl dNTP混合物(4种dNTP每种2.5mM的混合物;Clontech公司),10.0μl 5xGC缓冲液,2.2μl 25mM Mg(OAc)2,10.0μl 5M GC-Melt和1.0μl Advantage-GC基因组聚合酶混合物(Clontech公司)和蒸馏水,PCR反应溶液总计50μl。PCR的反应条件是在保持在94℃ 1分钟后;重复7个循环,一个循环包括保持在94℃ 10秒,接着72℃ 3分钟;重复36个循环,一个循环包括94℃ 10秒,接着67℃ 3分钟;然后保持在67℃ 7分钟。通过按照所述试剂盒附带的说明书使用QIA快速PCR纯化试剂盒(Qiagen公司)从PCR反应溶液中纯化DNA。按照附带的手册将获得的DNA连接到TA克隆载体pCR2.1(Invitrogen公司)并导入大肠杆菌TOP10F’(Invitrogen公司)。使用QIAprep Spin Miniprep试剂盒(Qiagen公司)从获得的大肠杆菌转化体中制备质粒DNA以获得含有本发明DNA(A11)的质粒溶液。
类似地,通过将在实施例33(1)中制备的津岛链霉菌IFO 13782的染色体DNA用作模板和通过将具有SEQ ID NO:332所示核苷酸序列的寡核苷酸和具有SEQ ID NO:333所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A12)的质粒溶液。
类似地,通过将在实施例35(1)中制备的热淡天蓝链霉菌IFO 14273t的染色体DNA用作模板和通过将具有SEQ ID NO:331所示核苷酸序列的寡核苷酸和具有SEQ ID NO:334所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A13)的质粒溶液。
类似地,通过将在实施例37(1)中制备的球团产色链霉菌IFO 13673t的染色体DNA用作模板和通过将具有SEQ ID NO:330所示核苷酸序列的寡核苷酸和具有SEQ ID NO:331所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A14)的质粒溶液。
类似地,通过将在实施例39(1)中制备的橄榄产色链霉菌IFO 12444的染色体DNA用作模板和通过将具有SEQ ID NO:330所示核苷酸序列的寡核苷酸和具有SEQ ID NO:331所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A15)的质粒溶液。
类似地,通过将在实施例48(1)中制备的装饰链霉菌IFO 13069t的染色体DNA用作模板和通过将具有SEQ ID NO:335所示核苷酸序列的寡核苷酸和具有SEQ ID NO:336所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A16)的质粒溶液。
类似地,通过将在实施例50(1)中制备的灰色链霉菌ATCC 10137的染色体DNA用作模板和通过将具有SEQ ID NO:335所示核苷酸序列的寡核苷酸和具有SEQ ID NO:336所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A17)的质粒溶液。
类似地,通过将在实施例52(1)中制备的不产色链霉菌IFO 12735的染色体DNA用作模板和通过将具有SEQ ID NO:330所示核苷酸序列的寡核苷酸和具有SEQ ID NO:331所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A18)的质粒溶液。
类似地,通过将在实施例54(1)中制备的灰色链霉菌IFO 13849T的染色体DNA用作模板和通过将具有SEQ ID NO:333所示核苷酸序列的寡核苷酸和具有SEQ ID NO:335所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A19)的质粒溶液。
类似地,通过将在实施例56(1)中制备的羊毛链霉菌IFO 12787T的染色体DNA用作模板和通过将具有SEQ ID NO:331所示核苷酸序列的寡核苷酸和具有SEQ ID NO:337所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A20)的质粒溶液。
类似地,通过将在实施例58(1)中制备的三泽链霉菌IFO 13855T的染色体DNA用作模板和通过将具有SEQ ID NO:331所示核苷酸序列的寡核苷酸和具有SEQ ID NO:338所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A21)的质粒溶液。
类似地,通过将在实施例62(1)中制备的玫瑰变红链霉菌IFO 13682T的染色体DNA用作模板和通过将具有SEQ ID NO:331所示核苷酸序列的寡核苷酸和具有SEQ ID NO:339所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A23)的质粒溶液。
类似地,通过将在实施例66(1)中制备的斯堡链霉菌IFO 13446T的染色体DNA用作模板和通过将具有SEQ ID NO:331所示核苷酸序列的寡核苷酸和具有SEQ ID NO:339所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A25)的质粒溶液。
另外,类似地,通过将在实施例60(1)中制备的苍白色链霉菌IFO13434T的染色体DNA用作模板和通过将具有SEQ ID NO:340所示核苷酸序列的寡核苷酸和具有SEQ ID NO:341所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A22)的质粒溶液。
类似地,通过将在实施例64(1)中制备的鲁地链霉菌IFO 15875T的染色体DNA用作模板和通过将具有SEQ ID NO:342所示核苷酸序列的寡核苷酸和具有SEQ ID NO:343所示核苷酸序列的寡核苷酸用作引物进行PCR。类似上面将通过PCR获得的DNA连接到载体。然后转化大肠杆菌。从获得的大肠杆菌转化体中制备质粒以获得含有本发明DNA(A24)的质粒溶液。
(2)斑点杂交
将约100ng和10ng在实施例69(2)中制备的各种质粒印迹在HybondN+尼龙膜(Amersham Biosciences Company)上。质粒为:包含本发明DNA(A11)的质粒DNA,包含本发明DNA(A12)的质粒DNA,包含本发明DNA(A13)的质粒DNA,包含本发明DNA(A14)的质粒DNA,包含本发明DNA(A15)的质粒DNA,包含本发明DNA(A16)的质粒DNA,包含本发明DNA(A17)的质粒DNA,包含本发明DNA(A18)的质粒DNA,包含本发明DNA(A19)的质粒DNA,包含本发明DNA(A20)的质粒DNA,包含本发明DNA(A21)的质粒DNA,包含本发明DNA(A23)的质粒DNA,包含本发明DNA(A25)的质粒DNA。用透射仪将紫外光指向获得的膜5分钟。
按照实施例30(2)所述方法进行杂交和检测。将在实施例30(1)中制备的探针在100℃保持5分钟和然后快速在冰上冷却。作为探针,使用用洋地黄毒苷标记的具有SEQ ID NO:6所示核苷酸序列的DNA(以下称为“DIG标记的探针(A1)”),用洋地黄毒苷标记的具有SEQ ID NO:7所示核苷酸序列的DNA(以下称为“DIG标记的探针(A2)”),用洋地黄毒苷标记的具有SEQ ID NO:8所示核苷酸序列的DNA(以下称为“DIG标记的探针(A3)”)或在实施例69(1)中产生的DIG标记探针(A4)。在将DIG标记的探针(A1),(A2),(A3)或(A4)中任何一个用于杂交的情形中,对于10ng和100ng上述质粒DNA中每一个的各种试剂检测到信号。
另外,类似地,将约10ng和100ng在实施例69(2)中制备的含有本发明DNA(A22)的质粒DNA和含有本发明DNA(A24)的质粒DNA各自印迹在Hybond N+尼龙膜(Amersham Biosciences Company)上。按照实施例30(2)进行杂交和检测。
实施例70其中密码子使用已经针对在大豆中表达调整的本发明DNA(A23)(以下称为“本发明DNA(A23)S”)的制备
(1)本发明DNA(A23)S的制备
通过使用具有SEQ ID NO:346所示核苷酸序列的寡核苷酸和具有SEQ ID NO:367所示核苷酸序列的寡核苷酸作为引物,按照附带的手册用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:345所示核苷酸序列的寡核苷酸和具有SEQ ID NO:366所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQID NO:344所示核苷酸序列的寡核苷酸和具有SEQ ID NO:365所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。将获得的反应溶液称为反应溶液1。
另外,按照附带的手册,通过使用具有SEQ ID NO:349所示核苷酸序列的寡核苷酸和具有SEQ ID NO:364所示核苷酸序列的寡核苷酸作为引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:348所示核苷酸序列的寡核苷酸和具有SEQ ID NO:363所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:347所示核苷酸序列的寡核苷酸和具有SEQ ID NO:362所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。将获得的反应溶液称为反应溶液2。
另外,按照附带的手册,通过使用具有SEQ ID NO:352所示核苷酸序列的寡核苷酸和具有SEQ ID NO:361所示核苷酸序列的寡核苷酸作为引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:351所示核苷酸序列的寡核苷酸和具有SEQ ID NO:360所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:350所示核苷酸序列的寡核苷酸和具有SEQ ID NO:359所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。将获得的反应溶液称为反应溶液3。
另外,按照附带的手册,通过使用具有SEQ ID NO:355所示核苷酸序列的寡核苷酸和具有SEQ ID NO:358所示核苷酸序列的寡核苷酸作为引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:354所示核苷酸序列的寡核苷酸和具有SEQ ID NO:357所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:353所示核苷酸序列的寡核苷酸和具有SEQ ID NO:356所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。将获得的反应溶液称为反应溶液4。
将如此获得的反应溶液1至4混合。按照附带的手册,通过将其混合物的等分部分用作模板和使用具有SEQ ID NO:344所示核苷酸序列的寡核苷酸和具有SEQ ID NO:356所示核苷酸序列的寡核苷酸作为引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。证实扩增的DNA的核苷酸序列。获得具有其中核苷酸序列5’-cat-3’连接到SEQ ID NO:368所示核苷酸序列的5’末端上游和核苷酸序列5’-aagctt-3’连接到SEQ IDNO:368所示核苷酸序列的3’末端下游的序列的DNA。
在表28和表29中显示具有SEQ ID NO:232所示核苷酸序列的本发明DNA(A23)的密码子使用(GC含量73.10%)。在表24和表25中显示大豆的密码子使用(GC含量46.12%)。在表30和表31中显示具有SEQ IDNO:368所示核苷酸序列的本发明DNA(A23)S的密码子使用(52.38%的GC含量)。
表28
  密码子   %   密码子   %
  TTT   0.00   TCT   0.00
  TTC   4.01   TCC   1.50
  TTA   0.00   TCA   0.00
  TTG   0.00   TCG   0.50
  CTT   0.00   CCT   0.00
  CTC   4.26   CCC   5.76
  CTA   0.00   CCA   0.00
  CTG   7.77   CCG   2.26
  ATT   0.00   ACT   0.00
  ATC   4.51   ACC   3.76
  ATA   0.00   ACA   0.00
  ATG   2.26   ACG   2.76
  GTT   0.00   GCT   0.25
  GTC   3.51   GCC   9.27
  GTA   0.00   GCA   0.75
  GTG   2.51   GCG   1.75
表29
  密码子   %   密码子   %
  TAT   0.00   TGT   0.00
  TAC   1.00   TGC   0.75
  TAA   0.25   TGA   0.00
  TAG   0.00   TGG   0.75
  CAT   0.00   CGT   0.50
  CAC   2.26   CGC   6.02
  CAA   0.50   CGA   0.25
  CAG   2.51   CGG   3.01
  AAT   0.00   AGT   0.00
  AAC   1.00   AGC   1.25
  AAA   0.25   AGA   0.00
  AAG   0.50   AGG   0.50
  GAT   0.00   GGT   0.98
  GAC   7.27   GGC   6.27
  GAA   1.25   GGA   0.25
  GAG   5.26   GGG   1.00
表30
  密码子   %   密码子   %
  TTT   2.01   TCT   0.75
  TTC   2.01   TCC   0.50
  TTA   1.00   TCA   0.75
  TTG   3.01   TCG   0.25
  CTT   3.26   CCT   3.01
  CTC   2.26   CCC   1.50
  CTA   1.00   CCA   3.01
  CTG   1.50   CCG   0.50
  ATT   2.26   ACT   2.26
  ATC   1.25   ACC   1.75
  ATA   1.00   ACA   2.01
  ATG   2.26   ACG   0.50
  GTT   2.26   GCT   4.51
  GTC   1.00   GCC   2.76
  GTA   0.75   GCA   3.76
  GTG   2.01   GCG   1.00
表31
  密码子   %   密码子   %
  TAT   0.50   TGT   0.25
  TAC   0.50   TGC   0.50
  TAA   0.25   TGA   0.00
  TAG   0.00   TGG   0.75
  CAT   1.25   CGT   1.50
  CAC   1.00   CGC   1.25
  CAA   1.75   CGA   0.75
  CAG   1.25   CGG   0.50
  AAT   0.50   AGT   0.50
  AAC   0.50   AGC   0.50
  AAA   0.25   AGA   3.26
  AAG   0.50   AGG   3.01
  GAT   4.51   GGT   2.26
  GAC   2.76   GGC   1.50
  GAA   3.26   GGA   2.26
  GAG   3.26   GGG   1.50
(2)具有本发明蛋白质(A23)S的转化大肠杆菌的生产
用限制酶NdeI和HindIII消化在实施例70(1)中获得的具有SEQ IDNO:368所示核苷酸序列的DNA。将用NdeI和HindIII消化的获得的DNA和质粒pKSN2连接以获得其中具有SEQ ID NO:368所示核苷酸序列的DNA插入pKSN2的NdeI位点和HindIII位点之间的质粒(以下称为“pKSN1584soy”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1584soy。
(3)本发明蛋白质(A23)S在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养在实施例70(2)中获得的大肠杆菌JM109/pKSN1584soy和在实施例63(1)中获得的大肠杆菌JM109/pKSN1584F中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将从大肠杆菌JM109/pKSN1584soy获得的上清液级分称为“大肠杆菌pKSN1584soy提取物”和将从大肠杆菌JM109/pKSN1584F获得的上清液级分称为“大肠杆菌pKSN1584F提取物”)。在大肠杆菌pKSN1584soy提取物中包含的每一蛋白质的的量的P450的量可以比得上和高于在大肠杆菌pKSN1584F提取物中包含的每一蛋白质的量的P450的量。
实施例71其中密码子使用已经针对在大豆中表达调整的本发明DNA(A25)(以下称为“本发明DNA(A25)S”)的制备和表达
(1)本发明DNA(A25)S的制备
通过使用具有SEQ ID NO:371所示核苷酸序列的寡核苷酸和具有SEQ ID NO:392所示核苷酸序列的寡核苷酸作为引物,按照附带的手册用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:370所示核苷酸序列的寡核苷酸和具有SEQ ID NO:391所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQID NO:369所示核苷酸序列的寡核苷酸和具有SEQ ID NO:390所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。将获得的反应溶液称为反应溶液1。
另外,按照附带的手册,通过使用具有SEQ ID NO:374所示核苷酸序列的寡核苷酸和具有SEQ ID NO:389所示核苷酸序列的寡核苷酸作为引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:373所示核苷酸序列的寡核苷酸和具有SEQ ID NO:383所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:372所示核苷酸序列的寡核苷酸和具有SEQ ID NO:387所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。将获得的反应溶液称为反应溶液2。
另外,按照附带的手册,通过使用具有SEQ ID NO:377所示核苷酸序列的寡核苷酸和具有SEQ ID NO:386所示核苷酸序列的寡核苷酸作为引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:376所示核苷酸序列的寡核苷酸和具有SEQ ID NO:385所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:375所示核苷酸序列的寡核苷酸和具有SEQ ID NO:384所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。将获得的反应溶液称为反应溶液3。
另外,按照附带的手册,通过使用具有SEQ ID NO:380所示核苷酸序列的寡核苷酸和具有SEQ ID NO:383所示核苷酸序列的寡核苷酸作为引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。将获得的PCR产物的等分部分用作类似地使用具有SEQ ID NO:379所示核苷酸序列的寡核苷酸和具有SEQ ID NO:382所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。另外,将PCR产物的等分部分用作类似地使用具有SEQ ID NO:378所示核苷酸序列的寡核苷酸和具有SEQ ID NO:381所示核苷酸序列的寡核苷酸作为引物进行的PCR的模板。将获得的反应溶液称为反应溶液4。
将如此获得的反应溶液1至4混合。按照附带的手册,通过将其混合物的等分部分用作模板和使用具有SEQ ID NO:369所示核苷酸序列的寡核苷酸和具有SEQ ID NO:381所示核苷酸序列的寡核苷酸作为引物,用Pyrobest DNA聚合酶(Takara Shuzo Company)进行PCR。证实扩增的DNA的核苷酸序列。获得具有其中核苷酸序列5’-cat-3’连接到SEQ ID NO:393所示核苷酸序列的5’末端上游和核苷酸序列5’-aagctt-3’连接到SEQ IDNO:393所示核苷酸序列的3’末端下游的序列的DNA。
在表32和表33中显示具有SEQ ID NO:234所示核苷酸序列的本发明DNA(A25)的密码子使用(GC含量71.93%)。在表24和表25中显示大豆的密码子使用(GC含量46.12%)。在表34和表35中显示具有SEQ IDNO:393所示核苷酸序列的本发明DNA(A25)S的密码子使用(52.05%的GC含量)。
表32
  密码子   %   密码子   %
  TTT   0.00   TCT   0.00
  TTC   3.76   TCC   1.25
  TTA   0.00   TCA   0.25
  TTG   0.00   TCG   0.75
  CTT   0.00   CCT   0.25
  CTC   4.01   CCC   4.01
  CTA   0.00   CCA   0.25
  CTG   9.52   CCG   2.76
  ATT   0.00   ACT   0.25
  ATC   4.26   ACC   4.01
  ATA   0.25   ACA   0.00
  ATG   2.26   ACG   1.75
  GTT   0.00   GCT   0.00
  GTC   3.01   GCC   8.52
  GTA   0.00   GCA   0.50
  GTG   2.51   GCG   3.01
表33
  密码子   %   密码子   %
  TAT   0.00   TGT   0.25
  TAC   1.25   TGC   0.50
  TAA   0.25   TGA   0.00
  TAG   0.00   TGG   1.00
  CAT   0.25   CGT   0.75
  CAC   2.26   CGC   5.51
  CAA   0.00   CGA   1.25
  CAG   3.01   CGG   3.26
  AAT   0.00   AGT   0.00
  AAC   1.00   AGC   1.00
  AAA   0.25   AGA   0.25
  AAG   1.00   AGG   0.00
  GAT   0.00   GGT   0.25
  GAC   7.52   GGC   4.76
  GAA   1.00   GGA   0.25
  GAG   4.76   GGG   1.25
表34
  密码子   %   密码子   %
  TTT   1.75   TCT   1.25
  TTC   2.01   TCC   0.50
  TTA   1.25   TCA   0.50
  TTG   3.26   TCG   0.00
  CTT   3.51   CCT   2.76
  CTC   2.51   CCC   1.25
  CTA   1.25   CCA   2.76
  CTG   1.75   CCG   0.50
  ATT   2.26   ACT   2.01
  ATC   1.25   ACC   1.75
  ATA   1.00   ACA   1.75
  ATG   2.26   ACG   0.50
  GTT   2.26   GCT   4.51
  GTC   1.00   GCC   2.76
  GTA   0.50   GCA   3.76
  GTG   1.75   GCG   1.00
表35
  密码子   %   密码子   %
  TAT   0.50   TGT   0.25
  TAC   0.75   TGC   0.50
  TAA   0.25   TGA   0.00
  TAG   0.00   TGG   1.00
  CAT   1.25   CGT   1.75
  CAC   1.25   CGC   1.50
  CAA   1.50   CGA   0.75
  CAG   1.50   CGG   0.75
  AAT   0.50   AGT   0.50
  AAC   0.50   AGC   0.50
  AAA   0.50   AGA   3.26
  AAG   0.75   AGG   3.01
  GAT   4.76   GGT   2.01
  GAC   2.76   GGC   1.25
  GAA   2.76   GGA   2.01
  GAG   3.01   GGG   1.25
(2)具有本发明蛋白质(A25)S的转化大肠杆菌的生产
用限制酶NdeI和HindIII消化在实施例71(1)中获得的具有SEQ IDNO:393所示核苷酸序列的DNA。将用NdeI和HindIII消化的获得的DNA和质粒pKSN2连接以获得其中具有SEQ ID NO:393所示核苷酸序列的DNA插入pKSN2的NdeI位点和HindIII位点之间的质粒(以下称为“pKSN1609soy”)。将所述质粒导入大肠杆菌JM109。将获得的大肠杆菌转化体称为JM109/pKSN1609soy。
(3)本发明蛋白质(A25)S在大肠杆菌中的表达和所述蛋白质的回收
类似于实施例4(2),培养在实施例71(2)中获得的大肠杆菌JM109/pKSN1609soy和在实施例67(1)中获得的大肠杆菌JM109/pKSN1609F中的每一个。回收细胞。制备细胞裂解液。在实施例4(2)所述方法下,从细胞裂解液中制备上清液级分(以下,将从大肠杆菌JM109/pKSN1609soy获得的上清液级分称为“大肠杆菌pKSN1609soy提取物”和将从大肠杆菌JM109/pKSN1609F获得的上清液级分称为“大肠杆菌pKSN1609F提取物”)。在大肠杆菌pKSN1609soy提取物中包含的每一蛋白质的的量的P450的量可以比得上和高于在大肠杆菌pKSN1609F提取物中包含的每一蛋白质的量的P450的量。
实施例72识别本发明蛋白质(A25)的本发明抗体(A)(以下称为“本发明抗体(A25)”)的制备
(1)表达本发明蛋白质(A25)的大肠杆菌的提取物的制备
按照实施例4(2)所述方法,将在实施例71(2)中生产的大肠杆菌JM109/pKSN1609soy预培养过夜。将获得的培养基接种至包含50μg/ml氨苄青霉素的1L TB培养基中并在26℃下培养。然后将5-氨基乙酰丙酸加至500μM的终浓度,将IPTG加至1mM的终浓度,进一步培养。从培养基中回收细胞,用0.05M Tris-HCl缓冲液(pH7.5)洗涤和然后悬浮在100ml包含1mM PMSF的所述缓冲液中。将获得的细胞培养基在输出量5,占空因数30%的条件下进行超声波仪(Sonifer(Branson Sonic PowerCompany))3次,每次10分钟,以便获得细胞裂解液。在将细胞裂解液离心(9,000xg,10分钟)后回收上清液和离心(200,000xg,70分钟)以回收上清液级分(以下,将从大肠杆菌JM109/pKSN1609soy中获得的上清液级分称为“大肠杆菌pKSN11609soy提取物”。
(2)本发明蛋白质(A25)的纯化
将在实施例72(1)中获得的上清液级分(大肠杆菌pKSN11609soy提取物)注射到Hiload HiLoad 16/10 Q Sepharose HP柱(AmershamBioscience Company)中。接下来,在40ml的20mM双三丙烷缓冲液(pH7.0)流进柱子以后,与线性梯度的NaCl(NaCl的梯度是0.00125M/分钟,NaCl浓度的范围是0M-0.375M,流速为3ml/分钟)流动20mM双三丙烷缓冲液以分级回收在0.088M-0.100M的NaCl浓度下洗脱的10ml级分。
将回收的级分进行PD10柱(Amersham Biosciences Company),用20mM双三丙烷缓冲液(pH7.0)洗脱以回收包含蛋白质的级分。接下来,将所述级分注射于MonoQ HR 10/10(Amersham Biosciences Company)中。将十六毫升(16ml)20mM双三丙烷缓冲液流进柱子。接下来,与线性梯度的NaCl(NaCl的梯度是0.001042M/分钟,NaCl浓度的范围是0M-0.25M,流速为4ml/分钟)流动20mM双三丙烷缓冲液以分级回收在0.060M-0.069M的NaCl浓度下洗脱的8ml级分。
用20mM双三丙烷缓冲液(pH7.0)将回收的级分稀释2.5倍并注射于MonoQ HR 5/5柱(Amersham Biosciences Company)中。接下来,在将2ml 20mM双三丙烷缓冲液(pH7.0)流进柱子以后,与线性梯度的NaCl(NaCl的梯度是0.008333M/分钟,NaCl浓度的范围是0M-0.25M,流速为1ml/分钟)流动20mM双三丙烷缓冲液以分级回收在0.073M-0.077M的NaCl浓度下洗脱的0.5ml级分。
通过使用“PAG mini Daiichi 10/20”(Daiichi Pure Chemicals有限公司)用SDS-PAGE分析如此纯化的级分,以证实那些级分是主要包含本发明蛋白质(A25)的级分。
(3)本发明抗体(A25)的制备
按照实施例44(3)所述方法进行本发明抗体的制备。然而,不是使用本发明蛋白质(A1),将在实施例72(2)中获得的本发明蛋白质(A25)用来获得含有本发明抗体(A25)的抗血清。
实施例73通过本发明抗体(A25)检测本发明蛋白质
通过使用在实施例72(3)中获得的本发明抗体(A25)与每种大肠杆菌提取物进行免疫印迹。进行以下各项的SDS聚丙烯酰胺电泳(40mA,1小时):在实施例49(2)中获得的大肠杆菌pKSN452F提取物(含有约2pmol本发明蛋白质(A16));在实施例51(2)中获得的大肠杆菌pKSN608F提取物(含有约2pmol本发明蛋白质(A17));在实施例53(2)中获得的大肠杆菌pKSN646BF提取物(含有约2pmol本发明蛋白质(A18));在实施例55(2)中获得的大肠杆菌pKSN1502F提取物(含有约2pmol本发明蛋白质(A19));在实施例57(2)中获得的大肠杆菌pKSN1525F提取物(含有约2pmol本发明蛋白质(A20));在实施例59(2)中获得的大肠杆菌pKSN1543BF提取物(含有约2pmol本发明蛋白质(A21));在实施例61(2)中获得的大肠杆菌pKSN1558BF提取物(含有约2pmol本发明蛋白质(A22));在实施例63(2)中获得的大肠杆菌pKSN1584F提取物(含有约2pmol本发明蛋白质(A23));在实施例65(2)中获得的大肠杆菌pKSN1589BF提取物(含有约2pmol本发明蛋白质(A24));在实施例67(2)中获得的大肠杆菌pKSN1609F提取物(含有约0.5pmol本发明蛋白质(A25));在实施例70(3)中获得的大肠杆菌pKSN1584soy提取物(含有约2pmol本发明蛋白质(A23));在实施例71(3)中获得的大肠杆菌pKSN1609soy提取物(含有约0.5pmol本发明蛋白质(A25));和在实施例67(2)中获得的大肠杆菌pKSN2提取物(含有约0.8mg蛋白质)。按照实施例45所述方法将所述凝胶中的蛋白质转移到PDVF膜上。按照实施例45所述方法,将在实施例45中获得的PDVF膜(以下称为“PDVF膜(A)”)和从上述方法中获得的PDVF膜(以下称为“PDVF膜(B)”)与在实施例72(3)中获得的抗血清反应。随后,按照实施例45所述方法进行与第二抗体的反应,洗涤和染色。在PDVF膜(A)上检测到对应于本发明蛋白质(A1),(A2),(A3),(A4),(A11),(A12),(A13),(A14)和(A15)以及本发明蛋白质(A9)和(A10)的条带的染色。在PDVF膜(B)上检测到对应于本发明蛋白质(A16),(A17),(A18),(A19),(A20),(A21),(A22),(A23),(A24)和(A25)的条带的染色。对于PVDF膜(A)的在实施例4(2)中获得的大肠杆菌pKSN2提取物(含有0.78mg蛋白质)试剂和对于PVDF膜(B)的在实施例67(2)中获得的大肠杆菌pKSN2提取物(含有0.8mg蛋白质)试剂未检测到染色的条带。
实施例74将本发明DNA(A23)S导入植物
(1)用于直接导入的包含本发明DNA(A23)S的叶绿体表达质粒的构建-部分1
构建包含嵌合DNA的质粒作为用基因枪法将本发明DNA(A23)S导入植物的质粒,所述嵌合DNA中本发明DNA(A23)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
首先,通过PCR扩增包含SEQ ID NO:398所示核苷酸序列的DNA。通过将在实施例70(2)中获得的pKSN1584soy用作模板和通过将由SEQID NO:397所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:398所示核苷酸序列组成的寡核苷酸用作引物来进行PCR。PCR使用KOD-plus(Toyobo Company)。依照以下进行PCR:在94℃下进行保持2分钟一次;20个循环,一个循环包括保持94℃ 30秒,接着53℃ 30秒,接着68℃ 90秒;和最后保持在68℃ 3分钟。通过按照附带手册进行程序用MagExtractor-PCR&Gel-Clean up(Toyobo Company)回收和纯化扩增的DNA。通过按照附带的手册用TaKaRa BKL试剂盒(Takara ShuzoCompany)处理获得的DNA,将DNA平末端化和5’末端磷酸化。回收包含SEQ ID NO:368所示核苷酸序列的DNA。在用SmaI消化质粒pUC19(Takara Shuzo Company)以后,用牛小肠碱性磷酸酶(Takara ShuzoCompany)将5’末端去磷酸化。通过连接产生的去磷酸化的DNA和含有SEQ ID NO:368所示核苷酸序列的DNA产生质粒。在用限制酶EcoT22I和SacI消化获得的质粒以后,回收包含SEQ ID NO:368所示核苷酸序列的DNA。在用限制酶EcoT22I和SacI消化在实施例16(2)中获得的质粒pUCrSt657以后,分离约2.9kbp的DNA,其具有来源于pUC19的核苷酸序列和编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的序列。将获得的DNA和包含SEQ ID NO:368所示核苷酸序列的上述DNA连接以获得包含嵌合DNA的pUCrSt1584soy(图54),其中本发明DNA(A23)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
用限制酶BamHI和SacI消化获得的质粒pUCrSt1584soy以分离包含SEQ ID NO:368所示核苷酸序列的DNA。将所述DNA插入在实施例16(2)中获得的质粒pNdG6-ΔT的BglII限制酶位点和SacI限制酶位点之间以获得质粒pSUM-NdG6-rSt-1584soy(图55),其中CR16G6启动子已经连接到嵌合DNA的下游,在嵌合DNA中所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
接下来,将质粒导入大肠杆菌DH5α感受态细胞(Takara ShuzoCompany)和选择氨苄青霉素抗性细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒3.0版(PE Applied Biosystems Company)和DNA测序仪3100(PE Applied Biosystems Company)测定包含在氨苄青霉素抗性菌株中的质粒的核苷酸序列。结果,证实质粒pSUM-NdG6-rSt-1584soy具有SEQ ID NO:368所示核苷酸序列。
(2)用于直接导入的具有本发明DNA(A23)S的叶绿体表达质粒的构建-部分(2)
构建用基因枪法将本发明DNA(A23)S导入植物的质粒。该质粒包含嵌合DNA,其中本发明DNA(A23)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。首先,通过PCR扩增包含SEQ ID NO:368所示核苷酸序列的DNA。通过将在实施例70中获得的pKSN1584soy用作模板和通过将由SEQ ID NO:399所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:398所示核苷酸序列组成的寡核苷酸用作引物来进行PCR。PCR使用KOD-plus(Toyobo Company)。依照以下进行PCR:在94℃下进行保持2分钟一次;25个循环,一个循环包括保持94℃ 30秒,接着46℃ 30秒,接着68℃ 90秒;和最后保持在68℃ 3分钟。通过按照附带手册进行程序用MagExtractor-PCR&Gel-Clean up(Toyobo Company)回收并纯化扩增的DNA。通过按照附带手册用TaKaRa BKL试剂盒(TaKaRaShuzo Company)处理获得的DNA,将DNA平末端化和将5’末端磷酸化。回收含有SEQ ID NO:368所示核苷酸序列的DNA。在用SmaI消化在实施例15(3)中获得的质粒pKF19ΔBs以后,用牛小肠碱性磷酸酶(TakaraShuzo Company)将5’末端去磷酸化。通过连接产生的去磷酸化的DNA和含有SEQ ID NO:368所示核苷酸序列的DNA产生质粒。在用限制酶BspHI和SacI消化获得的质粒以后,回收含有SEQ ID NO:368所示核苷酸序列的DNA。接着用限制酶BspHI和SacI消化在实施例16(3)中获得的质粒pKFrSt12-657以分离来自质粒pKFrSt12的DNA。将所述DNA与用限制酶SacI和BspHI消化和包含SEQ ID NO:368所示核苷酸序列的DNA连接,以便获得包含嵌合DNA的质粒pKFrSt12-1584soy(图56),在所述嵌合DNA中本发明DNA(A23)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。
用限制酶BamHI和SacI消化获得的质粒pKFrSt12-1584soy以分离包含SEQ ID NO:368所示核苷酸序列的DNA。将所述DNA插入质粒pNdG6-ΔT的BglII限制酶位点和SacI限制酶位点之间以获得质粒pSUM-NdG6-rSt12-1584soy(图57),其中CR16G6启动子已经连接到嵌合DNA的下游,所述嵌合DNA中所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
接下来,将质粒导入大肠杆菌DH5α感受态细胞(Takara ShuzoCompany)和选择氨苄青霉素抗性细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒3.0版(PE Applied Biosystems Company)和DNA测序仪3100(PE Applied Biosystems Company)测定包含在氨苄青霉素抗性菌株中的质粒的核苷酸序列。结果,证实质粒pSUM-NdG6-rSt12-1584soy具有SEQ ID NO:368所示核苷酸序列。
(3)将本发明DNA(A23)S导入大豆
按照实施例47(3)所述方法制备大豆(栽培品种:Fayette和Jack)的球形胚。
将获得的球形胚移植到新鲜体细胞胚生长培养基中并培养2-3天。按照实施例17(2)所述方法,将在实施例74(1)中生产的质粒pSUM-NdG6-rSt-1584soy或在实施例74(2)中生产的质粒pSUM-NdG6-rSt12-1584soy导入那些球形胚。
(4)用潮霉素选择体细胞胚
按照实施例47(4)所述方法进行用潮霉素选择在实施例74(3)中获得的在基因导入后的球形胚。
(5)用化合物(II)选择体细胞胚
按照实施例47(5)所述方法进行用化合物(II)选择在实施例74(3)中获得的导入基因以后的球形胚。
(6)从体细胞胚的植物再生,顺应和培养
按照实施例47(6)所述方法,从在实施例74(4)或74(5)中选择的球形胚进行植物的再生。
相应地用实施例17(6)所述方法将具有根和发育的叶子的植物进行顺应和培养并收获。
(7)对除草化合物(II)的抗性评估
按照实施例17(4)所述方法评估在实施例74(6)中获得的再生植物对化合物(II)的抗性程度。
(8)用于农杆菌导入的具有本发明DNA(A23)S的叶绿体表达质粒的构建
构建用农杆菌法将本发明DNA(A23)S导入植物的质粒。用限制酶HindIII和EcoRI消化质粒pSUM-NdG6-rSt-1584soy以分离嵌合DNA,其中本发明DNA(A23)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。将所述DNA插入在实施例18中获得的上述二元质粒载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得质粒pBI-NdG6-rSt-1584soy(图58)。另外,用限制酶NotI消化质粒pSUM-NdG6-rSt12-1584soy以分离嵌合DNA,其中本发明DNA(A23)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。将该DNA插入上述二元质粒载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得质粒pBI-NdG6-rSt12-1584soy(图59)。
(9)将本发明DNA(A23)S导入烟草
使用在实施例74(8)中获得的质粒pBI-NdG6-rSt-1584soy和pBI-NdG6-rSt12-1584soy,用农杆菌法将本发明DNA(A23)S导入烟草。
首先,按照实施例19所述方法,分别将质粒pBI-NdG6-rSt-1584soy和pBI-NdG6-rSt12-1584soy导入根癌农杆菌LBA4404(ClontechCompany)。分离各自具有pBI-NdG6-rSt-1584soy或pBI-NdG6-rSt12-1584soy的转基因农杆菌。
然后,按照实施例47(9)所述方法将具有质粒的所述农杆菌用来将基因导入烟草,分别获得已经整合pBI-NdG6-rSt-1584soy或pBI-NdG6-rSt12-1584soy的T-DNA区域的转基因烟草。
(10)使用本发明DNA(A23)S转基因烟草的叶片的抗性评估
从35株在实施例74(9)中获得的转基因烟草采集叶子。将每片叶子分成几片,其中每片5-7mm宽。将叶片种植到包含化合物(II)或化合物(XII)的MS琼脂培养基上并在光照中在室温下培养。在培养几天后,观察每个叶片的除草损伤。作为对照,使用野生型烟草的叶片。通过对连续生长的叶片,具有化学损伤的叶片,和变白和已经枯萎的叶片记分评估转基因烟草的抗性。
实施例75将本发明DNA(A25)S导入植物
(1)用于直接导入的包含本发明DNA(A25)S的叶绿体表达质粒的构建-部分1
构建包含嵌合DNA的质粒作为用基因枪法将本发明DNA(A25)S导入植物的质粒,所述嵌合DNA中本发明DNA(A25)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
首先,通过PCR扩增包含SEQ ID NO:393所示核苷酸序列的DNA。通过将在实施例71(2)中获得的pKSN1609soy用作模板和通过将由SEQID NO:400所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:401所示核苷酸序列组成的寡核苷酸用作引物来进行PCR。PCR使用KOD-plus(Toyobo Company)。依照以下进行PCR:在94℃下进行保持2分钟一次;20个循环,一个循环包括保持94℃ 30秒,接着53℃ 30秒,接着68℃ 90秒;和最后保持在68℃ 3分钟。通过按照附带手册进行程序用MagExtractor-PCR&Gel-Clean up(Toyobo Company)回收和纯化扩增的DNA。通过按照附带的手册用TaKaRa BKL试剂盒(Takara ShuzoCompany)处理获得的DNA,将DNA平末端化和5’末端磷酸化。回收包含SEQ ID NO:393所示核苷酸序列的DNA。在用SmaI消化质粒pUC19(Takara Shuzo Company)以后,用牛小肠碱性磷酸酶(Takara ShuzoCompany)将5’末端去磷酸化。通过连接产生的去磷酸化的DNA和含有SEQ ID NO:393所示核苷酸序列的DNA产生质粒。在用限制酶EcoT22I和SacI消化获得的质粒以后,回收包含SEQ ID NO:393所示核苷酸序列的DNA。在用限制酶EcoT22I和SacI消化在实施例16(2)中获得的质粒pUCrSt657以后,分离约2.9kbp的DNA,其具有来源于pUC 19的核苷酸序列和编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的序列。将获得的DNA和包含SEQ ID NO:393所示核苷酸序列的上述DNA连接以获得包含嵌合DNA的pUCrSt1609soy(图60),其中本发明DNA(A25)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
用限制酶BamHI和SacI消化获得的质粒pUCrSt1609soy以分离包含SEQ ID NO:393所示核苷酸序列的DNA。将所述DNA插入质粒pNdG6-ΔT的BglII限制酶位点和SacI限制酶位点之间以获得质粒pSUM-NdG6-rSt-1609soy(图61),其中CR16G6启动子已经连接到嵌合DNA的下游,在嵌合DNA中所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
接下来,将质粒导入大肠杆菌DH5α感受态细胞(Takara ShuzoCompany)和选择氨苄青霉素抗性细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒3.0版(PE Applied Biosystems Company)和DNA测序仪3100(PE Applied Biosystems Company)测定包含在氨苄青霉素抗性菌株中的质粒的核苷酸序列。结果,证实质粒pSUM-NdG6-rSt-1609soy具有SEQ ID NO:393所示核苷酸序列。
(2)用于直接导入的具有本发明DNA(A25)S的叶绿体表达质粒的构建-部分(2)
构建用基因枪法将本发明DNA(A25)S导入植物的质粒。该质粒包含嵌合DNA,其中本发明DNA(A25)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。首先,在实施例75(1)中获得的质粒pUCrSt1609soy在它的EcoT22I限制位点插入接头EcoT22I-12aa-EcoT22I(图62),该接头是通过将由SEQ ID NO:402所示核苷酸序列组成的寡核苷酸和由SEQ ID NO:403所示核苷酸序列组成的寡核苷酸退火获得。获得包含嵌合DNA的质粒pUCrSt12-1609soy(图63),在所述嵌合DNA中本发明DNA(A25)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。
用限制酶BamHI和SacI消化获得的质粒pUCrSt12-1609soy以分离包含SEQ ID NO:393所示核苷酸序列的DNA。将所述DNA插入实施例16(2)中获得的质粒pNdG6-ΔT的BglII限制酶位点和SacI限制酶位点之间以获得质粒pSUM-NdG6-rSt12-1609soy(图64),其中CR16G6启动子已经连接到嵌合DNA的下游,所述嵌合DNA中所述DNA紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。
接下来,将质粒导入大肠杆菌DH5α感受态细胞(Takara ShuzoCompany)和选择氨苄青霉素抗性细胞。另外,通过使用BigDye终止循环测序简易反应试剂盒3.0版(PE Applied Biosystems Company)和DNA测序仪3100(PE Applied Biosystems Company)测定包含在氨苄青霉素抗性菌株中的质粒的核苷酸序列。结果,证实质粒pSUM-NdG6-rSt12-1609soy具有SEQ ID NO:393所示核苷酸序列。
(3)将本发明DNA(A23)S导入大豆
按照实施例47(3)所述方法制备大豆(栽培品种:Fayette和Jack)的球形胚。
将获得的球形胚移植到新鲜体细胞胚生长培养基中并培养2-3天。按照实施例17(2)所述方法,将在实施例75(1)中生产的质粒pSUM-NdG6-rSt-1609soy或在实施例75(2)中生产的质粒pSUM-NdG6-rSt12-1609soy导入那些球形胚。
(4)用潮霉素选择体细胞胚
按照实施例47(4)所述方法进行用潮霉素选择在实施例75(3)中获得的在基因导入后的球形胚。
(5)用化合物(II)选择体细胞胚
按照实施例47(5)所述方法进行用化合物(II)选择在实施例75(3)中获得的导入基因以后的球形胚。
(6)从体细胞胚的植物再生,顺应和培养
按照实施例47(6)所述方法,从在实施例74(4)或74(5)中选择的球形胚进行植物的再生。
相应地用实施例17(6)所述方法将具有根和发育的叶子的植物进行顺应和培养并收获。
(7)对除草化合物(II)的抗性评估
按照实施例17(4)所述方法评估在实施例75(6)中获得的再生植物对化合物(II)的抗性程度。
(8)用于农杆菌属导入的具有本发明DNA(A25)S的叶绿体表达质粒的构建
构建用农杆菌法将本发明DNA(A25)S导入植物的质粒。用限制酶HindIII和EcoRI消化质粒pSUM-NdG6-rSt-1609soy以获得嵌合DNA,其中本发明DNA(A25)S紧接在编码大豆(cv.Jack)RuBPC小亚基叶绿体转运肽的核苷酸序列之后而没有密码子框的变化。将所述DNA插入在实施例18中获得的二元质粒载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得质粒pBI-NdG6-rSt-1609soy(图65)。另外,用限制酶NotI消化质粒pSUM-NdG6-rSt12-1609soy以分离嵌合DNA,其中本发明DNA(A25)S紧接在编码大(cv.Jack)RuBPC小亚基叶绿体转运肽和编码其后成熟蛋白质的12个氨基酸的核苷酸序列之后而没有密码子框的变化。将该DNA插入上述二元质粒载体pBI121S的HindIII限制位点和EcoRI限制位点之间以获得质粒pBI-NdG6-rSt12-1609soy(图66)。
(9)将本发明DNA(A23)S导入烟草
使用在实施例75(8)中获得的质粒pBI-NdG6-rSt-1609soy和pBI-NdG6-rSt12-1609soy,用农杆菌法将本发明DNA(A25)S导入烟草。
首先,按照实施例19所述方法,分别将质粒pBI-NdG6-rSt-1609soy和pBI-NdG6-rSt12-1609soy导入根癌农杆菌LBA4404(ClontechCompany)。分离各自具有pBI-NdG6-rSt-1609soy或pBI-NdG6-rSt12-1609soy的转基因农杆菌。
然后,按照实施例47(9)所述方法将具有质粒的所述农杆菌用来将基因导入烟草,分别获得已经整合pBI-NdG6-rSt-1609soy或pBI-NdG6-rSt12-1609soy的T-DNA区域的转基因烟草。
(10)使用本发明DNA(A25)S转基因烟草的叶片的抗性评估
从在实施例75(9)中获得的转基因烟草采集叶子。按照实施例74(10)所述方法,将该叶子用于评估转基因烟草对化合物(II)或化合物(XII)的抗性。
工业适用性
根据本发明,可以提供具有代谢PPO抑制除草化合物和将该化合物转化成低除草活性的化合物的能力的蛋白质;编码该蛋白质的DNA;和表达该蛋白质的抗除草化合物的植物。
序列独立文本
SEQ ID NO:35
为PCR设计的寡核苷酸引物
SEQ ID NO:36
为PCR设计的寡核苷酸引物
SEQ ID NO:37
为PCR设计的寡核苷酸引物
SEQ ID NO:38
为PCR设计的寡核苷酸引物
SEQ ID NO:39
为PCR设计的寡核苷酸引物
SEQ ID NO:40
为PCR设计的寡核苷酸引物
SEQ ID NO:41
为PCR设计的寡核苷酸引物
SEQ ID NO:42
为PCR设计的寡核苷酸引物
SEQ ID NO:43
为PCR设计的寡核苷酸引物
SEQ ID NO:44
为PCR设计的寡核苷酸引物
SEQ ID NO:45
为PCR设计的寡核苷酸引物
SEQ ID NO:46
为PCR设计的寡核苷酸引物
SEQ ID NO:47
为PCR设计的寡核苷酸引物
SEQ ID NO:48
为PCR设计的寡核苷酸引物
SEQ ID NO:49
为PCR设计的寡核苷酸引物
SEQ ID NO:50
为PCR设计的寡核苷酸引物
SEQ ID NO:51
为PCR设计的寡核苷酸引物
SEQ ID NO:52
为PCR设计的寡核苷酸引物
SEQ ID NO:53
为PCR设计的寡核苷酸引物
SEQ ID NO:54
为PCR设计的寡核苷酸引物
SEQ ID NO:55
为PCR设计的寡核苷酸引物
SEQ ID NO:56
为PCR设计的寡核苷酸引物
SEQ ID NO:57
为PCR设计的寡核苷酸引物
SEQ ID NO:58
为PCR设计的寡核苷酸引物
SEQ ID NO:59
为PCR设计的寡核苷酸引物
SEQ ID NO:60
为PCR设计的寡核苷酸引物
SEQ ID NO:61
为PCR设计的寡核苷酸引物
SEQ ID NO:62
为PCR设计的寡核苷酸引物
SEQ ID NO:63
为PCR设计的寡核苷酸引物
SEQ ID NO:64
为PCR设计的寡核苷酸引物
SEQ ID NO:65
为PCR设计的寡核苷酸引物
SEQ ID NO:66
为PCR设计的寡核苷酸引物
SEQ ID NO:67
为PCR设计的寡核苷酸引物
SEQ ID NO:68
为PCR设计的寡核苷酸引物
SEQ ID NO:70
为PCR设计的寡核苷酸引物
SEQ ID NO:71
为PCR设计的寡核苷酸引物
SEQ ID NO:72
为PCR设计的寡核苷酸引物
SEQ ID NO:73
为PCR设计的寡核苷酸引物
SEQ ID NO:74
为PCR设计的寡核苷酸引物
SEQ ID NO:75
为PCR设计的寡核苷酸引物
SEQ ID NO:76
为PCR设计的寡核苷酸引物
SEQ ID NO:77
为PCR设计的寡核苷酸引物
SEQ ID NO:79
为PCR设计的寡核苷酸引物
SEQ ID NO:80
为PCR设计的寡核苷酸引物
SEQ ID NO:81
为PCR设计的寡核苷酸引物
SEQ ID NO:82
为PCR设计的寡核苷酸引物
SEQ ID NO:83
为PCR设计的寡核苷酸引物
SEQ ID NO:86
为PCR设计的寡核苷酸引物
SEQ ID NO:87
为PCR设计的寡核苷酸引物
SEQ ID NO:89
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:90
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:91
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:92
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:93
为PCR设计的寡核苷酸引物
SEQ ID NO:94
为PCR设计的寡核苷酸引物
SEQ ID NO:95
为PCR设计的寡核苷酸引物
SEQ ID NO:96
为PCR设计的寡核苷酸引物
SEQ ID NO:97
为PCR设计的寡核苷酸引物
SEQ ID NO:98
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:99
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:100
为PCR设计的寡核苷酸引物
SEQ ID NO:101
为PCR设计的寡核苷酸引物
SEQ ID NO:102
为PCR设计的寡核苷酸引物
SEQ ID NO:103
为PCR设计的寡核苷酸引物
SEQ ID NO:104
为PCR设计的寡核苷酸引物
SEQ ID NO:105
为PCR设计的寡核苷酸引物
SEQ ID NO:106
为PCR设计的寡核苷酸引物
SEQ ID NO:107
为PCR设计的寡核苷酸引物
SEQ ID NO:114
为PCR设计的寡核苷酸引物
SEQ ID NO:115
为PCR设计的寡核苷酸引物
为PCR设计的寡核苷酸引物
SEQ ID NO:116
为PCR设计的寡核苷酸引物
SEQ ID NO:117
为PCR设计的寡核苷酸引物
SEQ ID NO:118
为PCR设计的寡核苷酸引物
SEQ ID NO:119
为PCR设计的寡核苷酸引物
SEQ ID NO:120
为PCR设计的寡核苷酸引物
SEQ ID NO:121
为PCR设计的寡核苷酸引物
SEQ ID NO:122
为PCR设计的寡核苷酸引物
SEQ ID NO:123
为PCR设计的寡核苷酸引物
SEQ ID NO:124
为PCR设计的寡核苷酸引物
SEQ ID NO:125
为PCR设计的寡核苷酸引物
SEQ ID NO:126
为PCR设计的寡核苷酸引物
SEQ ID NO:127
为PCR设计的寡核苷酸引物
SEQ ID NO:128
为PCR设计的寡核苷酸引物
SEQ ID NO:129
为PCR设计的寡核苷酸引物
SEQ ID NO:130
为PCR设计的寡核苷酸引物
SEQ ID NO:131
为PCR设计的寡核苷酸引物
SEQ ID NO:132
为PCR设计的寡核苷酸引物
SEQ ID NO:133
为PCR设计的寡核苷酸引物
SEQ ID NO:134
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:135
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:161
为PCR设计的寡核苷酸引物
SEQ ID NO:162
为PCR设计的寡核苷酸引物
SEQ ID NO:163
为PCR设计的寡核苷酸引物
SEQ ID NO:164
为PCR设计的寡核苷酸引物
SEQ ID NO:165
为PCR设计的寡核苷酸引物
SEQ ID NO:166
为PCR设计的寡核苷酸引物
SEQ ID NO:167
为PCR设计的寡核苷酸引物
SEQ ID NO:168
为PCR设计的寡核苷酸引物
SEQ ID NO:169
为PCR设计的寡核苷酸引物
SEQ ID NO:170
为PCR设计的寡核苷酸引物
SEQ ID NO:171
为PCR设计的寡核苷酸引物
SEQ ID NO:172
为PCR设计的寡核苷酸引物
SEQ ID NO:173
为PCR设计的寡核苷酸引物
SEQ ID NO:174
为PCR设计的寡核苷酸引物
SEQ ID NO:175
为PCR设计的寡核苷酸引物
SEQ ID NO:176
为PCR设计的寡核苷酸引物
SEQ ID NO:177
为PCR设计的寡核苷酸引物
SEQ ID NO:178
为PCR设计的寡核苷酸引物
SEQ ID NO:179
为PCR设计的寡核苷酸引物
SEQ ID NO:180
为PCR设计的寡核苷酸引物
SEQ ID NO:181
为PCR设计的寡核苷酸引物
SEQ ID NO:182
为PCR设计的寡核苷酸引物
SEQ ID NO:183
为PCR设计的寡核苷酸引物
SEQ ID NO:184
为PCR设计的寡核苷酸引物
SEQ ID NO:185
为PCR设计的寡核苷酸引物
SEQ ID NO:186
为DNA测序设计的寡核苷酸引物
SEQ ID NO:187
为DNA测序设计的寡核苷酸引物
SEQ ID NO:188
为DNA测序设计的寡核苷酸引物
SEQ ID NO:189
为DNA测序设计的寡核苷酸引物
SEQ ID NO:190
为PCR设计的寡核苷酸引物
SEQ ID NO:191
为PCR设计的寡核苷酸引物
SEQ ID NO:192
为PCR设计的寡核苷酸引物
SEQ ID NO:193
为PCR设计的寡核苷酸引物
SEQ ID NO:194
为PCR设计的寡核苷酸引物
SEQ ID NO:195
为PCR设计的寡核苷酸引物
SEQ ID NO:196
为PCR设计的寡核苷酸引物
SEQ ID NO:197
为PCR设计的寡核苷酸引物
SEQ IDNO:198
为PCR设计的寡核苷酸引物
SEQ ID NO:199
为PCR设计的寡核苷酸引物
SEQ ID NO;200
为PCR设计的寡核苷酸引物
SEQ ID NO:201
为PCR设计的寡核苷酸引物
SEQ ID NO:202
为PCR设计的寡核苷酸引物
SEQ ID NO:203
为PCR设计的寡核苷酸引物
SEQ ID NO:204
为PCR设计的寡核苷酸引物
SEQ ID NO:205
为PCR设计的寡核苷酸引物
SEQ ID NO:206
为PCR设计的寡核苷酸引物
SEQ ID NO:207
为PCR设计的寡核苷酸引物
SEQ ID NO:208
为PCR设计的寡核苷酸引物
SEQ ID NO:209
为PCR设计的寡核苷酸引物
SEQ ID NO:21O
为PCR设计的寡核苷酸引物
SEQ ID NO:211
为PCR设计的寡核苷酸引物
SEQ ID NO:212
为PCR设计的寡核苷酸引物
SEQ ID NO:213
为PCR设计的寡核苷酸引物
SEQ ID NO:214
编码SEQ ID NO:1的氨基酸序列的设计的多核苷酸
SEQ ID NO:265
为PCR设计的寡核苷酸引物
SEQ ID NO:266
为PCR设计的寡核苷酸引物
SEQ ID NO:267
为PCR设计的寡核苷酸引物
SEQ ID NO:268
为PCR设计的寡核苷酸引物
SEQ ID NO:269
为PCR设计的寡核苷酸引物
SEQ ID NO:270
为PCR设计的寡核苷酸引物
SEQ ID NO:271
为PCR设计的寡核苷酸引物
SEQ ID NO:272
为PCR设计的寡核苷酸引物
SEQ ID NO:273
为PCR设计的寡核苷酸引物
SEQ ID NO:274
为PCR设计的寡核苷酸引物
SEQ ID NO:275
为PCR设计的寡核苷酸引物
SEQ ID NO:276
为DNA测序设计的寡核苷酸引物
SEQ ID NO:277
为DNA测序设计的寡核苷酸引物
SEQ ID NO:278
为PCR设计的寡核苷酸引物
SEQ ID NO:279
为PCR设计的寡核苷酸引物
SEQ ID NO:280
为PCR设计的寡核苷酸引物
SEQ ID NO:281
为DNA测序设计的寡核苷酸引物
SEQ ID NO:282
为PCR设计的寡核苷酸引物
SEQ ID NO:283
为PCR设计的寡核苷酸引物
SEQ ID NO:284
为PCR设计的寡核苷酸引物
SEQ ID NO:285
为PCR设计的寡核苷酸引物
SEQ ID NO:286
为PCR设计的寡核苷酸引物
SEQ ID NO:287
为PCR设计的寡核苷酸引物
SEQ ID NO:288
为DNA测序设计的寡核苷酸引物
SEQ ID NO:289
为PCR设计的寡核苷酸引物
SEQ ID NO:290
为PCR设计的寡核苷酸引物
SEQ ID NO:291
为PCR设计的寡核苷酸引物
SEQ ID NO:292
为PCR设计的寡核苷酸引物
SEQ ID NO:293
为PCR设计的寡核苷酸引物
SEQ ID NO:294
为PCR设计的寡核苷酸引物
SEQ ID NO:295
为PCR设计的寡核苷酸引物
SEQ ID NO:296
为PCR设计的寡核苷酸引物
SEQ ID NO:297
为PCR设计的寡核苷酸引物
SEQ ID NO:298
为PCR设计的寡核苷酸引物
SEQ ID NO:299
为PCR设计的寡核苷酸引物
SEQ ID NO:300
为DNA测序设计的寡核苷酸引物
SEQ ID NO:301
为PCR设计的寡核苷酸引物
SEQ ID NO:302
为PCR设计的寡核苷酸引物
SEQ ID NO:303
为PCR设计的寡核苷酸引物
SEQ ID NO:304
为PCR设计的寡核苷酸引物
SEQ ID NO:305
为PCR设计的寡核苷酸引物
SEQ ID NO:306
为PCR设计的寡核苷酸引物
SEQ ID NO:307
为PCR设计的寡核苷酸引物
SEQ ID NO:308
为DNA测序设计的寡核苷酸引物
SEQ ID NO:309
为PCR设计的寡核苷酸引物
SEQ ID NO:310
为PCR设计的寡核苷酸引物
SEQ ID NO:311
为PCR设计的寡核苷酸引物
SEQ ID NO:312
为PCR设计的寡核苷酸引物
SEQ ID NO:313
为PCR设计的寡核苷酸引物
SEQ ID NO:314
为PCR设计的寡核苷酸引物
SEQ ID NO:315
为DNA测序设计的寡核苷酸引物
SEQ ID NO:316
为PCR设计的寡核苷酸引物
SEQ ID NO:317
为PCR设计的寡核苷酸引物
SEQ ID NO:318
为PCR设计的寡核苷酸引物
SEQ ID NO:319
为PCR设计的寡核苷酸引物
SEQ ID NO:320
为PCR设计的寡核苷酸引物
SEQ ID NO:321
为PCR设计的寡核苷酸引物
SEQ ID NO:322
为DNA测序设计的寡核苷酸引物
SEQ ID NO:323
为PCR设计的寡核苷酸引物
SEQ ID NO:324
为PCR设计的寡核苷酸引物
SEQ ID NO:325
为PCR设计的寡核苷酸引物
SEQ ID NO:326
为PCR设计的寡核苷酸引物
SEQ ID NO:327
为PCR设计的寡核苷酸引物
SEQ ID NO:328
为PCR设计的寡核苷酸引物
SEQ ID NO:329
为PCR设计的寡核苷酸引物
SEQ ID NO:330
为PCR设计的寡核苷酸引物
SEQ ID NO:331
为PCR设计的寡核苷酸引物
SEQ ID NO:332
为PCR设计的寡核苷酸引物
SEQ ID NO:333
为PCR设计的寡核苷酸引物
SEQ ID NO:334
为PCR设计的寡核苷酸引物
SEQ ID NO:335
为PCR设计的寡核苷酸引物
SEQ ID NO:336
为PCR设计的寡核苷酸引物
SEQ ID NO:337
为PCR设计的寡核苷酸引物
SEQ ID NO:338
为PCR设计的寡核苷酸引物
SEQ ID NO:339
为PCR设计的寡核苷酸引物
SEQ ID NO:340
为PCR设计的寡核苷酸引物
SEQ ID NO:341
为PCR设计的寡核苷酸引物
SEQ ID NO:342
为PCR设计的寡核苷酸引物
SEQ ID NO:343
为PCR设计的寡核苷酸引物
SEQ ID NO:344
为PCR设计的寡核苷酸引物
SEQ ID NO:345
为PCR设计的寡核苷酸引物
SEQ ID NO:346
为PCR设计的寡核苷酸引物
SEQ ID NO:347
为PCR设计的寡核苷酸引物
SEQ ID NO:348
为PCR设计的寡核苷酸引物
SEQ ID NO:349
为PCR设计的寡核苷酸引物
SEQ ID NO:350
为PCR设计的寡核苷酸引物
SEQ ID NO:351
为PCR设计的寡核苷酸引物
SEQ ID NO:352
为PCR设计的寡核苷酸引物
SEQ ID NO:353
为PCR设计的寡核苷酸引物
SEQ ID NO:354
为PCR设计的寡核苷酸引物
SEQ ID NO:355
为PCR设计的寡核苷酸引物
SEQ ID NO:356
为PCR设计的寡核苷酸引物
SEQ ID NO:357
为PCR设计的寡核苷酸引物
SEQ ID NO:358
为PCR设计的寡核苷酸引物
SEQ ID NO:359
为PCR设计的寡核苷酸引物
SEQ ID NO:360
为PCR设计的寡核苷酸引物
SEQ ID NO:361
为PCR设计的寡核苷酸引物
SEQ ID NO:362
为PCR设计的寡核苷酸引物
SEQ ID NO:363
为PCR设计的寡核苷酸引物
SEQ ID NO:364
为PCR设计的寡核苷酸引物
SEQ ID NO:365
为PCR设计的寡核苷酸引物
SEQ ID NO:366
为PCR设计的寡核苷酸引物
SEQ ID NO:367
为PCR设计的寡核苷酸引物
SEQ ID NO:368
编码SEQ ID NO:222的氨基酸序列的设计的多核苷酸
SEQ ID NO:369
为PCR设计的寡核苷酸引物
SEQ ID NO:370
为PCR设计的寡核苷酸引物
SEQ ID NO:371
为PCR设计的寡核苷酸引物
SEQ ID NO:372
为PCR设计的寡核苷酸引物
SEQ ID NO:373
为PCR设计的寡核苷酸引物
SEQ ID NO:374
为PCR设计的寡核苷酸引物
SEQ ID NO:375
为PCR设计的寡核苷酸引物
SEQ ID NO:376
为PCR设计的寡核苷酸引物
SEQ ID NO:377
为PCR设计的寡核苷酸引物
SEQ ID NO:378
为PCR设计的寡核苷酸引物
SEQ ID NO:379
为PCR设计的寡核苷酸引物
SEQ ID NO:380
为PCR设计的寡核苷酸引物
SEQ ID NO:381
为PCR设计的寡核苷酸引物
SEQ ID NO:382
为PCR设计的寡核苷酸引物
SEQ ID NO:383
为PCR设计的寡核苷酸引物
SEQ ID NO:384
为PCR设计的寡核苷酸引物
SEQ ID NO:385
为PCR设计的寡核苷酸引物
SEQ ID NO:386
为PCR设计的寡核苷酸引物
SEQ ID NO:387
为PCR设计的寡核苷酸引物
SEQ ID NO:388
为PCR设计的寡核苷酸引物
SEQ ID NO:389
为PCR设计的寡核苷酸引物
SEQ ID NO:390
为PCR设计的寡核苷酸引物
SEQ ID NO:391
为PCR设计的寡核苷酸引物
SEQ ID NO:392
为PCR设计的寡核苷酸引物
SEQ ID NO:393
编码SEQ ID NO:224的氨基酸序列的设计的多核苷酸
SEQ ID NO:394
为PCR设计的寡核苷酸引物
SEQ ID NO:395
为PCR设计的寡核苷酸引物
SEQ ID NO:396
为PCR设计的寡核苷酸引物
SEQ ID NO:397
为PCR设计的寡核苷酸引物
SEQ ID NO:398
为PCR设计的寡核苷酸引物
SEQ ID NO:399
为PCR设计的寡核苷酸引物
SEQ ID NO:400
为PCR设计的寡核苷酸引物
SEQ ID NO:401
为PCR设计的寡核苷酸引物
SEQ ID NO:402
为表达载体构建设计的寡核苷酸接头
SEQ ID NO:403
为表达载体构建设计的寡核苷酸接头
                            序列表
<110>住友化学工业株式会社
<120>除草剂代谢蛋白质,其基因及其应用
<130>561096
<150>JP 2001/321307
<151>2001-10-19
<150>JP 2002/167239
<151>2002-06-07
<160>403
<210>1
<211>408
<212>PRT
<213>暗产色链霉菌(Streptmyces phaeochromogenes)IFO 12898
<400>1
Met Thr Asp Met Thr Asp Thr Ala Asp Val Lys Pro Leu Ser Ala Pro
  1               5                  10                  15
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Phe Gln Pro Pro Thr Gly
             20                  25                  30
Tyr Asp Pro Leu Arg Glu Ala Arg Pro Leu Ala Arg Val Thr Leu Tyr
         35                  40                  45
Asp Gly Arg Ala Ile Trp Leu Val Thr Gly Arg Asp Leu Ala Arg Ser
     50                  55                  60
Leu Leu Ala Asp Ser Arg Leu Ser Ser Asp Arg Leu Arg Pro Gly Phe
 65                  70                  75                  80
Pro Ala Thr Ser Pro Arg Ile Val Ala Phe Arg Asp Arg Arg Ala Ala
                 85                  90                  95
Leu Leu Asn Val Asp Asp Pro Glu His His Thr Gln Arg Arg Met Leu
            100                 105                 110
Val Pro Ser Phe Thr Leu Lys Arg Ala Ala Ala Leu Arg Pro Ala Ile
        115                 120                 125
Gln Arg Ile Val Asp Glu Cys Ile Asp Ala Met Leu Ala Lys Gly Pro
    130                 135                 140
Pro Ala Glu Leu Val Asn Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
Glu Gln Ser Arg Arg Leu Leu Arg Gly Arg Asp Val Asp Glu Val Arg
            180                 185                 190
Asp Ala Arg Asp Gln Leu Asp Cys Tyr Leu Gly Ala Leu Ile Asp Arg
        195                 200                 205
Lys Ser Glu Ser Ser Val Gly Asp Gly Val Leu Asp Ala Leu Val His
    210                 215                 220
Glu Gln Leu Arg Glu Gly Ala Val Asp Arg Gln Glu Ala Ile Ser Leu
225                 230                 235                 240
Ala Thr Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met Ile
                245                 250                 255
Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala Glu
            260                 265                 270
Leu Arg Asp Asp Pro Ser Leu Trp Pro Ala Ala Val Asp Glu Leu Met
        275                 280                 285
Arg Met Leu Ser Ile Ala Asp Gly Leu Met Arg Gln Ala Thr Glu Asp
    290                 295                 300
Ile Glu Val Ala Gly Thr Thr Ile Arg Ala Gly Glu Gly Val Val Phe
305                 310                 315                 320
Ala Thr Ser Val Ile Asn Arg Asp Gly Glu Val Tyr Ala Glu Pro Asp
                325                 330                 335
Ala Leu Asp Trp His Arg Pro Thr Arg His His Val Ala Phe Gly Phe
            340                 345                 350
Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Met Glu
        355                 360                 365
Ile Ala Leu Arg Ser Leu Phe Glu Arg Val Pro Gly Leu Arg Leu Asp
    370                 375                 380
Ile Ala Pro Asp Ala Val Arg Phe Lys Pro Gly Asp Thr Ile Gln Gly
385                 390                 395                 400
Met Leu Asp Leu Pro Val Ala Trp
                405
<210>2
<211>401
<212>PRT
<213>塔氏糖多孢菌(Saccharopolyspora taberi)JCM 9383t
<400>2
Met Pro Ala Ser Ser Glu Ala Leu Thr Tyr Pro Ile Pro Arg Thr Cys
  1               5                  10                  15
Pro Tyr Ser Pro Pro Asp Ser Tyr Ala Glu Leu Arg Arg Glu Gln Pro
             20                  25                  30
Val Arg Arg Val Pro Thr Leu Ala Gly Gly Ser Val Trp Leu Val Ser
         35                  40                  45
Arg His Glu Asp Val Arg Ala Val Leu Ser Asp Pro Arg Met Ser Ser
     50                  55                  60
Asn Arg Arg Lys Pro Gly Phe Pro Arg Leu Val Pro Gly Gln Ser Asp
 65                  70                  75                  80
Leu Ile Phe Ser Ser Lys Pro Ser Met Ile Gly Met Asp Gly Arg Glu
                 85                  90                  95
His Ser Ala Ala Arg Arg Ala Val Leu Gly Glu Phe Thr Val Arg Arg
            100                 105                 110
Ile Asn Ala Leu Arg Pro Arg Val Gln Glu Ile Val Asp Glu Ala Ile
        115                 120                 125
Asp Ala Met Leu Ala Ala Gly Gly Pro Val Asp Leu Val Arg Met Leu
    130                 135                 140
Ser Leu Pro Val Pro Ser Leu Val Ile Cys Glu Leu Leu Gly Val Pro
145                 150                 155                 160
Tyr Ala Asp His Glu Phe Phe Gln Gln Arg Ser Gly Arg Ile Ile Ser
                165                 170                 175
Arg Ala Thr Pro Gly Ala Glu Arg Glu Glu Ala Phe Phe Glu Leu Arg
            180                 185                 190
Ala Tyr Leu Ser Asp Leu Val Ala Asp Lys Val Arg Ala Pro Gly Asp
        195                 200                 205
Asp Leu Leu Gly Arg Gln Val Ala Lys Gln Arg Ala Glu Gly Glu Val
    210                 215                 220
Asp Gln Glu Ala Leu Val Ser Leu Ala Phe Leu Leu Leu Val Ala Gly
225                 230                 235                 240
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Ser Leu Ala Leu Leu
                245                 250                 255
Asp Asp Ser Ala Arg Trp Ala Glu Ile Ala Ala Asp Pro Ala Lys Thr
            260                 265                 270
Pro Gly Ala Val Glu Glu Met Leu Arg Phe Phe Ser Ile Val Asp Asn
        275                 280                 285
Ala Thr Ala Arg Thr Ala Thr Glu Asp Val Glu Ile Gly Gly Val Val
    290                 295                 300
Ile Gly Glu Gly Asp Gly Val Ile Ala Met Gly Tyr Ser Ala Asn His
305                 310                 315                 320
Asp Pro Glu Val Phe Asp Arg Pro Gly Asp Leu Asp Phe Ser Arg Ala
                325                 330                 335
Ala Arg Gln His Val Ala Phe Gly Phe Gly Ala His Gln Cys Leu Gly
            340                 345                 350
Gln Asn Leu Ala Arg Val Glu Leu Gln Ile Val Phe Asp Thr Leu Val
        355                 360                 365
Arg Arg Ile Pro Asp Leu Arg Leu Ala Val Gly Phe Asp Asp Ile Arg
    370                 375                 380
Phe Lys Glu Glu Ser Ala Ile Tyr Gly Ile His Glu Leu Met Val Thr
385                 390                 395                 400
Trp
<210>3
<211>395
<212>PRT
<213>砖红色链霉菌(Streptmyces testaceus)ATCC 21469
<400>3
Met Thr Glu Ala Ile Ala Tyr Phe Gln Asp Arg Thr Cys Pro Tyr His
  1               5                  10                  15
Pro Pro Ala Gly Tyr Gln Pro Leu Arg Asp Ala Gly Pro Leu Ala His
             20                  25                  30
Val Thr Leu Tyr Asp Gly Arg Lys Val Trp Ala Val Thr Gly His Thr
         35                  40                  45
Glu Ala Arg Ala Leu Leu Ser Asp Pro Arg Leu Ser Ser Asp Arg Gln
     50                  55                  60
Asn Pro Ala Phe Pro Ala Pro Phe Ala Arg Phe Ala Ala Leu Arg Gln
 65                  70                  75                  80
Val Arg Ser Pro Leu Ile Gly Val Asp Asp Pro Glu His Asn Thr Gln
                 85                  90                  95
Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys Arg Thr Ala Ala Leu
            100                 105                 110
Arg Pro Gln Ile Gln Gln Ile Val Asp Gly Leu Leu Asp Arg Met Leu
        115                 120                 125
Ala Gln Gly Pro Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val
    130                 135                 140
Pro Ser Met Val Ile Cys Ser Leu Leu Gly Val Pro Tyr Ser Asp His
145                 150                 155                 160
Glu Phe Phe Glu Glu Ala Ser Arg Arg Leu Leu Arg Ser Arg Thr Ala
                165                 170                 175
Glu Glu Ala Glu Glu Ala Arg Leu Arg Leu Glu Asp Tyr Phe Asp Glu
            180                 185                 190
Leu Ile Ala His Lys Glu Lys Thr Pro Arg Glu Gly Leu Leu Asp Glu
        195                 200                 205
Leu Val His Asp Glu Leu Arg Thr Gly Ala Leu Glu Arg Glu Asp Leu
    210                 215                 220
Val Arg Leu Ala Met Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala
225                 230                 235                 240
Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Glu His Pro Gly Gln
                245                 250                 255
Leu Ala Arg Leu Lys Ala Glu Glu Gly Leu Leu Pro Ala Ala Val Glu
            260                 265                 270
Glu Leu Leu Arg Phe Leu Ser Ile Ala Asp Gly Leu Leu Arg Val Ala
        275                 280                 285
Met Ala Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Asp Asp Gly
    290                 295                 300
Val Leu Phe Pro Thr Ser Leu Ile Asn Arg Asp Asp Gly Ala Tyr Pro
305                 310                 315                 320
Thr Pro Asp Glu Leu Asp Val Gly Arg Ser Ala Arg His His Val Ala
                325                 330                 335
Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala
            340                 345                 350
Glu Met Glu Ile Ala Leu Arg Ser Leu Phe Asp Arg Ile Pro Asp Leu
        355                 360                 365
Arg Leu Ala Val Pro Ala Ala Glu Ile Pro Phe Lys Pro Gly Asp Thr
    370                 375                 380
Leu Gln Gly Met Ile Glu Leu Pro Leu Ala Trp
385                 390                 395
<210>4
<211>410
<212>PRT
<213>Streptmyces carbophilus SANK 62585
<400>4
Met Thr Glu Met Thr Glu Lys Ala Thr Thr Phe Leu Thr Ser Gln Glu
  1               5                  10                  15
Ala Pro Ala Phe Pro Ala Asp Arg Thr Cys Pro Tyr Gln Leu Pro Thr
             20                  25                  30
Ala Tyr Ser Arg Leu Arg Asp Glu Pro Asp Ala Leu Arg Pro Val Thr
         35                  40                   45
Leu Tyr Asp Gly Arg Arg Ala Trp Val Val Thr Lys His Glu Ala Ala
     50                  55                  60
Arg Arg Leu Leu Ala Asp Pro Arg Leu Ser Ser Asp Arg Leu His Ala
 65                  70                  75                  80
Asp Phe Pro Ala Thr Ser Pro Arg Phe Lys Ala Phe Arg Gln Gly Ser
                 85                  90                  95
Pro Ala Phe Ile Gly Met Asp Pro Pro Glu His Gly Thr Arg Arg Arg
            100                 105                 110
Met Thr Ile Ser Glu Phe Thr Val Lys Arg Ile Lys Gly Met Arg Pro
        115                 120                 125
Asp Val Glu Arg Ile Val His Gly Phe Ile Asp Asp Met Leu Ala Ala
    130                 135                 140
Gly Pro Thr Ala Asp Leu Val Ser Gln Phe Ala Leu Pro Val Pro Ser
145                 150                 155                 160
Met Val Ile Cys His Met Leu Gly Val Pro Tyr Ala Asp His Glu Phe
                165                 170                 175
Phe Gln Asp Ala Ser Lys Arg Leu Val Gln Ala Val Asp Ala Asp Ser
            180                 185                 190
Ala Val Ala Ala Arg Asp Asp Phe Glu Arg Tyr Leu Asp Gly Leu Ile
        195                 200                 205
Thr Lys Leu Glu Ser Glu Pro Gly Thr Gly Leu Leu Gly Lys Leu Val
    210                 215                 220
Thr His Gln Leu Ala Asp Gly Glu Ile Asp Arg Ala Glu Leu Ile Ser
225                 230                 235                 240
Thr Ala Leu Leu Leu Leu Val Ala Gly His Glu Thr Thr Ala Ser Met
                245                 250                 255
Thr Ser Leu Ser Val Ile Thr Leu Leu Glu His Pro Asp Gln His Ala
            260                 265                 270
Ala Leu Arg Ala Asp Pro Ser Leu Val Pro Gly Ala Val Glu Glu Leu
        275                 280                 285
Leu Arg Val Leu Ala Ile Ala Asp Ile Ala Gly Gly Arg Ile Ala Thr
    290                 295                 300
Ala Asp Ile Glu Ile Asp Gly Gln Leu Ile Arg Ala Gly Glu Gly Val
305                 310                 315                 320
Ile Val Thr Asn Ser Ile Ala Asn Arg Asp Ser Ser Val Phe Glu Asn
                325                 330                 335
Pro Asp Arg Leu Asp Val His Arg Ser Ala Arg His His Leu Ser Phe
            340                 345                 350
Gly Tyr Gly Val His Gln Cys Leu Gly Gln Asn Leu Ala Arg Leu Glu
        355                 360                 365
Leu Glu Val Ile Leu Thr Val Leu Phe Asp Arg Ile Pro Thr Leu Arg
    370                 375                 380
Leu Ala Val Pro Val Gli Gln Leu Thr Leu Arg Pro Gly Thr Thr Ile
385                 390                 395                 400
Gln Gly Val Asn Glu Leu Pro Val Thr Trp
                405                 410
<210>5
<211>406
<212>PRT
<213>浅灰链霉菌(Streptmyces griseolus)ATCC 11796
<400>5
Met Thr Asp Thr Ala Thr Thr Pro Gln Thr Thr Asp Ala Pro Ala Phe
  1               5                  10                  15
Pro Ser Asn Arg Ser Cys Pro Tyr Gln Leu Pro Asp Gly Tyr Ala Gln
             20                  25                  30
Leu Arg Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly
         35                  40                  45
Arg Gln Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu
     50                  55                  60
Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala
 65                  70                  75                  80
Thr Ser Pro Arg Phe Glu Ala Val Arg Gli Ser Pro Gln Ala Phe Ile
                 85                 90                 95
Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr Ile Ser
            100                 105                 110
Glu Phe Thr Val Lys Arg Ile Lys Gly Met Arg Pro Glu Val Glu Glu
        115                 120                 125
Val Val His Gly Phe Leu Asp Glu Met Leu Ala Ala Gly Pro Thr Ala
    130                 135                 140
Asp Leu Val Ser Gln Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys
145                 150                 155                 160
Arg Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Gln Asp Ala
                 165                 170                 175
Ser Lys Arg Leu Val Gln Ser Thr Asp Ala Gln Ser Ala Leu Thr Ala
            180                 185                 190
Arg Asn Asp Leu Ala Gly Tyr Leu Asp Gly Leu Ile Thr Gln Phe Gln
        195                 200                 205
Thr Glu Pro Gly Ala Gly Leu Val Gly Ala Leu Val Ala Asp Gln Leu
    210                 215                 220
Ala Asn Gly Glu Ile Asp Arg Glu Glu Leu Ile Ser Thr Ala Met Leu
225                 230                 235                 240
Leu Leu Ile Ala Gly His Glu Thr Thr Ala Ser Met Thr Ser Leu Ser
                245                 250                 255
Val Ile Thr Leu Leu Asp His Pro Glu Gln Tyr Ala Ala Leu Arg Ala
            260                 265                 270
Asp Arg Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg Tyr Leu
        275                 280                 285
Ala Ile Ala Asp Ile Ala Gly Gly Arg Val Ala Thr Ala Asp Ile Glu
    290                 295                 300
Val Glu Gly Gln Leu Ile Arg Ala Gly Glu Gly Val Ile Val Val Asn
305                 310                 315                 320
Ser Ile Ala Asn Arg Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu
                325                 330                 335
Asp Ile His Arg Ser Ala Arg His His Leu Ala Phe Gly Phe Gly Val
            340                 345                 350
His Gln Cys Leu Gly Gln Asn Leu Ala Arg Leu Glu Leu Glu Val Ile
        355                 360                 365
Leu Asn Ala Leu Met Asp Arg Val Pro Thr Leu Arg Leu Ala Val Pro
    370                 375                 380
Val Glu Gln Leu Val Leu Arg Pro Gly Thr Thr Ile Gln Gly Val Asn
385                 390                 395                 400
Glu Leu Pro Val Thr Trp
                405
<210>6
<211>1227
<212>DNA
<213>暗产色链霉菌(Streptmyces phaeochromogenes)IFO 12898
<220>
<221>CDS
<222>(1)..(1227)
<400>6
atg aca gac atg acg gat acg gca gac gtg aag ccg ctc tcg gca ccc     48
Met Thr Asp Met Thr Asp Thr Ala Asp Val Lys Pro Leu Ser Ala Pro
  1               5                  10                  15
gtc gcc ttc ccc cag gac cgc acc tgc ccc ttc cag ccc ccc acg ggc     96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Phe Gln Pro Pro Thr Gly
             20                  25                  30
tac gac ccc ctg cgt gag gcc cgg ccg ctc gcc cgc gtg acc ctc tac    144
Tyr Asp Pro Leu Arg Glu Ala Arg Pro Leu Ala Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgg gcc atc tgg ctg gtc acc ggc cgt gac ctg gcc cgc agc    192
Asp Gly Arg Ala Ile Trp Leu Val Thr Gly Arg Asp Leu Ala Arg Ser
     50                  55                  60
ctg ctc gcc gat tcc cgc ctg tcg tcc gac cgc ctg cgc ccc ggc ttc    240
Leu Leu Ala Asp Ser Arg Leu Ser Ser Asp Arg Leu Arg Pro Gly Phe
 65                  70                  75                  80
ccg gcc acc tcg ccg cgc atc gtg gcg ttc cgc gac cgc cgg gcc gcc    288
Pro Ala Thr Ser Pro Arg Ile Val Ala Phe Arg Asp Arg Arg Ala Ala
                 85                  90                  95
ctg ctg aac gtc gac gac ccc gag cac cac acc cag cgg cgg atg ctg    336
Leu Leu Asn Val Asp Asp Pro Glu His His Thr Gln Arg Arg Met Leu
            100                 105                 110
gtc ccg agc ttc acc ctc aag cgc gcc gcc gcg ttg cgg ccg gcc atc    384
Val Pro Ser Phe Thr Leu Lys Arg Ala Ala Ala Leu Arg Pro Ala Ile
        115                 120                 125
cag cgg atc gtc gac gaa tgc atc gac gcg atg ctc gcg aag ggc ccg    432
Gln Arg Ile Val Asp Glu Cys Ile Asp Ala Met Leu Ala Lys Gly Pro
    130                 135                 140
ccc gcc gag ttg gtg aac gcc ttc gcg ctc ccc gtt ccc tcg atg gtg    480
Pro Ala Glu Leu Val Asn Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc gaa ctg ctc ggt gtc ccg tac gcc gat cac gag ttc ttc gag    528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gag cag tcc cgt cgg ctg ctg cgc ggc cgg gac gtg gac gag gtg cgg    576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Arg Asp Val Asp Glu Val Arg
            180                 185                 190
gac gcg cgg gac cag ctc gac tgc tac ctc ggg gcg ctg atc gac cgc    624
Asp Ala Arg Asp Gln Leu Asp Cys Tyr Leu Gly Ala Leu Ile Asp Arg
        195                 200                 205
aag tcc gag tcg tcc gtc ggt gac ggt gtc ctc gac gcc ctg gtc cac    672
Lys Ser Glu Ser Ser Val Gly Asp Gly Val Leu Asp Ala Leu Val His
    210                 215                 220
gag cag ttg cgc gag ggc gcg gtg gac cgg cag gag gcc atc tcg ctg    720
Glu Gln Leu Arg Glu Gly Ala Val Asp Arg Gln Glu Ala Ile Ser Leu
225                 230                 235                 240
gcc acg atc ctg ctg gtc gcc ggc cac gag acc acc gcc aac atg atc     768
Ala Thr Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met Ile
                245                 250                 255
tcg ctg ggc act tac acc ctg ctc caa cac ccc gag cga ctg gcg gag     816
Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala Glu
            260                 265                 270
ttg cgg gac gac ccg tcg ctg tgg ccc gcc gcc gtc gac gag ttg atg     864
Leu Arg Asp Asp Pro Ser Leu Trp Pro Ala Ala Val Asp Glu Leu Met
        275                 280                 285
cgg atg ctg tcc atc gcg gac ggg ctg atg cgg cag gcc acg gag gac     912
Arg Met Leu Ser Ile Ala Asp Gly Leu Met Arg Gln Ala Thr Glu Asp
    290                 295                 300
atc gag gtg gcc ggg acg acg atc cgc gcc ggt gag ggc gtg gtc ttc     960
Ile Glu Val Ala Gly Thr Thr Ile Arg Ala Gly Glu Gly Val Val Phe
305                 310                 315                 320
gcg acc tcg gtc atc aac cgc gac ggg gag gtc tac gcc gaa ccc gac    1008
Ala Thr Ser Val Ile Asn Arg Asp Gly Glu Val Tyr Ala Glu Pro Asp
                325                 330                 335
gcc ctc gac tgg cac cgg ccc acc cgc cat cac gtg gcg ttc ggc ttc    1056
Ala Leu Asp Trp His Arg Pro Thr Arg His His Val Ala Phe Gly Phe
            340                 345                 350
ggc atc cac cag tgt ctc ggc cag aac ctg gcc cgt gcc gag atg gag    1104
Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Met Glu
        355                 360                 365
atc gcc ctg cgt tcc ctg ttc gag cgg gtg ccc ggg ctg cgc ctc gac    1152
Ile Ala Leu Arg Ser Leu Phe Glu Arg Val Pro Gly Leu Arg Leu Asp
    370                 375                 380
att gcg ccg gac gcg gtc cgc ttc aaa ccg ggc gac acg atc cag gga    1200
Ile Ala Pro Asp Ala Val Arg Phe Lys Pro Gly Asp Thr Ile Gln Gly
385                 390                 395                 400
atg ctg gat ctg ccc gtg gcc tgg tag                                1227
Met Leu Asp Leu Pro Val Ala Trp
                405
<210>7
<21l>1206
<212>DNA
<213>塔氏糖多孢菌(Saccharopolyspora taberi)JCM 9383t
<220>
<221>CDS
<222>(1)..(1206)
<400>7
atg ccg gca tct tct gaa gct ctg acc tat ccg atc ccc cgg acc tgt      48
Met Pro Ala Ser Ser Glu Ala Leu Thr Tyr Pro Ile Pro Arg Thr Cys
  1               5                  10                  15
ccg tac tcg ccg ccc gac tcc tac gcc gaa ctc cgg cgc gag cag ccg      96
Pro Tyr Ser Pro Pro Asp Ser Tyr Ala Glu Leu Arg Arg Glu Gln Pro
             20                  25                  30
gtc cgc cgg gtg ccg acg ctg gcg gga ggc agc gtg tgg ctg gtg tcg     144
Val Arg Arg Val Pro Thr Leu Ala Gly Gly Ser Val Trp Leu Val Ser
         35                  40                  45
cgg cac gag gac gtg cgc gcg gtc ctc agc gac ccg cgg atg agc tcc     192
Arg His Glu Asp Val Arg Ala Val Leu Ser Asp Pro Arg Met Ser Ser
     50                  55                  60
gac cgc cgc aag ccc ggg ttc ccg cgg ctc gtg ccg ggg cag agc gac     240
Asp Arg Arg Lys Pro Gly Phe Pro Arg Leu Val Pro Gly Gln Ser Asp
 65                  70                  75                  80
ctg atc ttc agc tcc aag ccg tcg atg atc ggc atg gac ggg cgc gag    288
Leu Ile Phe Ser Ser Lys Pro Ser Met Ile Gly Met Asp Gly Arg Glu
                 85                  90                  95
cac tcg gcg gcc cgg cgg gcg gtt ctc ggt gag ttc acc gtc cgg cgg    336
His Ser Ala Ala Arg Arg Ala Val Leu Gly Glu Phe Thr Val Arg Arg
            100                 105                 110
atc aac gcg ctg cgc ccg cgc gtg cag gag atc gtc gac gag gcc atc    384
Ile Asn Ala Leu Arg Pro Arg Val Gln Glu Ile Val Asp Glu Ala Ile
        115                 120                 125
gac gcg atg ctg gcc gcg ggc ggg ccg gtc gac ctg gtg cgg atg ctc    432
Asp Ala Met Leu Ala Ala Gly Gly Pro Val Asp Leu Val Arg Met Leu
    130                 135                 140
tcg ctt ccg gtg ccg tcg ctg gtg atc tgc gag ctg ctc ggc gtt ccc    480
Ser Leu Pro Val Pro Ser Leu Val Ile Cys Glu Leu Leu Gly Val Pro
145                 150                 155                 160
tac gcc gac cac gag ttc ttc cag cag cgc agc ggc cgc atc atc agc    528
Tyr Ala Asp His Glu Phe Phe Gln Gln Arg Ser Gly Arg Ile Ile Ser
                165                 170                 175
cgg gcg acg ccg ggg gcc gag cgg gag gag gcg ttc ttc gaa ctc cgc    576
Arg Ala Thr Pro Gly Ala Glu Arg Glu Glu Ala Phe Phe Glu Leu Arg
            180                 185                 190
gcc tac ctg tcg gat ctg gtc gcg gac aag gtc cgc gca ccg ggc gac    624
Ala Tyr Leu Ser Asp Leu Val Ala Asp Lys Val Arg Ala Pro Gly Asp
        195                 200                 205
gac ctg ctc ggc agg cag gtg gcc aag cag cgg gcc gag ggc gag gtc    672
Asp Leu Leu Gly Arg Gln Val Ala Lys Gln Arg Ala Glu Gly Glu Val
    210                 215                 220
gac cag gag gcg ctg gtc agc ctc gcg ttc ctg ctg ctg gtc gcc ggg    720
Asp Gln Glu Ala Leu Val Ser Leu Ala Phe Leu Leu Leu Val Ala Gly
225                 230                 235                 240
cac gag acc acc gcg aac atg atc tcg ctt ggt agc ctg gcg ctg ctg    768
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Ser Leu Ala Leu Leu
                245                 250                 255
gac gat tcc gcc cgg tgg gcg gag atc gcc gcg gat ccg gcg aag acg    816
Asp Asp Ser Ala Arg Trp Ala Glu Ile Ala Ala Asp Pro Ala Lys Thr
            260                 265                 270
ccc ggc gcg gtg gag gag atg ctg cgg ttc ttc tcg atc gtc gac aac    864
Pro Gly Ala Val Glu Glu Met Leu Arg Phe Phe Ser Ile Val Asp Asn
        275                 280                 285
gcg acc gcg cgc acc gcg acc gag gac gtg gag atc ggc ggc gtg gtc    912
Ala Thr Ala Arg Thr Ala Thr Glu Asp Val Glu Ile Gly Gly Val Val
    290                 295                 300
atc ggg gag ggc gac ggg gtg atc gcg atg ggc tat tcg gcc aac cac    960
Ile Gly Glu Gly Asp Gly Val Ile Ala Met Gly Tyr Ser Ala Asn His
305                 310                 315                 320
gac ccc gag gtc ttc gac cgc ccc ggg gac ctc gac ttc tcc cgg gcc   1008
Asp Pro Glu Val Phe Asp Arg Pro Gly Asp Leu Asp Phe Ser Arg Ala
                325                 330                 335
gcc cgc cag cac gtc gcc ttc ggc ttc ggc gcg cac cag tgc ctg ggc   1056
Ala Arg Gln His Val Ala Phe Gly Phe Gly Ala His Gln Cys Leu Gly
            340                 345                 350
cag aac ctc gcg cgg gtg gag ttg cag atc gtc ttc gac acg ctg gtg   1104
Gln Asn Leu Ala Arg Val Glu Leu Gln Ile Val Phe Asp Thr Leu Val
        355                 360                 365
cgg cgg atc ccg gac ctg cgg ctg gcg gtc ggc ttc gac gac atc cgg   1152
Arg Arg Ile Pro Asp Leu Arg Leu Ala Val Gly Phe Asp Asp Ile Arg
    370                 375                 380
ttc aag gag gag tcg gcg atc tac gga atc cac gaa ctg atg gtc act   1200
Phe Lys Glu Glu Ser Ala Ile Tyr Gly Ile His Glu Leu Met Val Thr
385                 390                 395                 400
tgg tga                                                           1206
Trp
<210>8
<211>1188
<212>DNA
<213>砖红色链霉菌(Streptmyces testaceus)ATCC 21469
<220>
<221>CDS
<222>(1)..(1188)
<400>8
atg acc gaa gcc atc gcg tat ttc cag gac cgc acc tgc ccc tac cac     48
Met Thr Glu Ala Ile Ala Tyr Phe Gln Asp Arg Thr Cys Pro Tyr His
  1               5                  10                  15
ccg ccg gcc ggc tat cag ccg ctg cgt gac gca ggc ccg ctg gcc cat     96
Pro Pro Ala Gly Tyr Gln Pro Leu Arg Asp Ala Gly Pro Leu Ala His
             20                  25                  30
gtc acc ctc tac gac ggc cgc aag gtg tgg gcg gtg acc ggc cac acc    144
Val Thr Leu Tyr Asp Gly Arg Lys Val Trp Ala Val Thr Gly His Thr
         35                  40                  45
gag gcg cgg gcg ctg ctg agc gac ccg cgg ctg tcc tcc gac cgg cag    192
Glu Ala Arg Ala Leu Leu Ser Asp Pro Arg Leu Ser Ser Asp Arg Gln
     50                  55                  60
aac ccg gcc ttc ccg gcg ccg ttc gcc cgc ttc gcg gcg ctg cgc cag    240
Asn Pro Ala Phe Pro Ala Pro Phe Ala Arg Phe Ala Ala Leu Arg Gln
 65                  70                  75                  80
gtc agg tcg ccg ctg atc ggc gtg gac gac ccc gag cac aac acc cag    288
Val Arg Ser Pro Leu Ile Gly Val Asp Asp Pro Glu His Asn Thr Gln
                 85                  90                  95
cgc cgg atg ctg atc ccc agc ttc agc gtc aag cgg acc gcg gcg ctg    336
Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys Arg Thr Ala Ala Leu
            100                 105                 110
cgg ccg cag atc cag cag atc gtc gac ggg ctg ctg gac cgg atg ctg    384
Arg Pro Gln Ile Gln Gln Ile Val Asp Gly Leu Leu Asp Arg Met Leu
        115                 120                 125
gcg cag ggg ccg ccc gcc gag ctg gtc tcc gcg ttc gcg ctg ccg gtg    432
Ala Gln Gly Pro Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val
    130                 135                 140
ccc tcg atg gtg atc tgc tcg ctg ctc ggc gtc ccc tac tcc gac cac    480
Pro Ser Met Val Ile Cys Ser Leu Leu Gly Val Pro Tyr Ser Asp His
145                 150                 155                 160
gag ttc ttc gag gag gcc tcc cgc cgg ctc ctg cgc agc cgg acg gcc    528
Glu Phe Phe Glu Glu Ala Ser Arg Arg Leu Leu Arg Ser Arg Thr Ala
                165                 170                 175
gag gag gcg gag gag gcc cgc ctc cgg ctg gag gac tac ttc gac gag    576
Glu Glu Ala Glu Glu Ala Arg Leu Arg Leu Glu Asp Tyr Phe Asp Glu
            180                 185                 190
ctg atc gcc cac aag gag aag acc ccg cgc gag ggc ctg ctc gac gag    624
Leu Ile Ala His Lys Glu Lys Thr Pro Arg Glu Gly Leu Leu Asp Glu
        195                 200                 205
ctg gtc cac gac gag ctg cgc acc ggc gcc ctg gag cgc gag gat ctg    672
Leu Val His Asp Glu Leu Arg Thr Gly Ala Leu Glu Arg Glu Asp Leu
    210                 215                 220
gtc cgg ctc gcg atg atc ctg ctg gtg gcc ggc cac gag acc acc gcc     720
Val Arg Leu Ala Met Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala
225                 230                 235                 240
aac atg atc tcg ctc ggc acc ttc acc ctg ctg gag cac ccc gga cag     768
Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Glu His Pro Gly Gln
                245                 250                 255
ctg gcc cgg ctg aag gcc gag gag ggg ctg ctg ccg gcc gcc gtc gag     816
Leu Ala Arg Leu Lys Ala Glu Glu Gly Leu Leu Pro Ala Ala Val Glu
            260                 265                 270
gag ctg ttg cgg ttc ctg tcc atc gcg gac ggc ctg ctg cgg gtg gcc     864
Glu Leu Leu Arg Phe Leu Ser Ile Ala Asp Gly Leu Leu Arg Val Ala
        275                 280                 285
atg gcg gac atc gag atc ggc ggg cag gtc atc cgt gcc gac gac ggc     912
Met Ala Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Asp Asp Gly
    290                 295                 300
gtg ctg ttc ccc acc tcg ctg atc aac cgg gac gac ggc gcc tat ccg     960
Val Leu Phe Pro Thr Ser Leu Ile Asn Arg Asp Asp Gly Ala Tyr Pro
305                 310                 315                 320
aca ccg gac gag ctg gac gtc ggc cgg tcc gcc cgc cat cac gtg gcg    1008
Thr Pro Asp Glu Leu Asp Val Gly Arg Ser Ala Arg His His Val Ala
                325                 330                 335
ttc ggg ttc ggc atc cac cag tgc ctg ggg cag aac ctc gcc cgg gcg    1056
Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala
            340                 345                 350
gag atg gag atc gcg ctg cgc tcg ctg ttc gac cgg atc ccg gat ctg    1104
Glu Met Glu Ile Ala Leu Arg Ser Leu Phe Asp Arg Ile Pro Asp Leu
        355                 360                 365
cga ctc gcc gtg ccg gct gcc gag atc ccc ttc aag ccg ggg gac act    1152
Arg Leu Ala Val Pro Ala Ala Glu Ile Pro Phe Lys Pro Gly Asp Thr
    370                 375                 380
ctg caa gga atg atc gaa ctg ccg ctg gcc tgg tag                    1188
Leu Gln Gly Met Ile Glu Leu Pro Leu Ala Trp
385                 390                 395
<210>9
<211>1439
<212>DNA
<213>暗产色链霉菌(Streptmyces phaeochromogenes)IFO 12898
<220>
<221>CDS
<222>(1)..(1227)
<220>
<221>CDS
<222>(1239)..(1439)
<400>9
atg aca gac atg acg gat acg gca gac gtg aag ccg ctc tcg gca ccc      48
Met Thr Asp Met Thr Asp Thr Ala Asp Val Lys Pro Leu Ser Ala Pro
  1               5                  10                  15
gtc gcc ttc ccc cag gac cgc acc tgc ccc ttc cag ccc ccc acg ggc      96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Phe Gln Pro Pro Thr Gly
             20                  25                  30
tac gac ccc ctg cgt gag gcc cgg ccg ctc gcc cgc gtg acc ctc tac     144
Tyr Asp Pro Leu Arg Glu Ala Arg Pro Leu Ala Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgg gcc atc tgg ctg gtc acc ggc cgt gac ctg gcc cgc agc     192
Asp Gly Arg Ala Ile Trp Leu Val Thr Gly Arg Asp Leu Ala Arg Ser
     50                  55                  60
ctg ctc gcc gat tcc cgc ctg tcg tcc gac cgc ctg cgc ccc ggc ttc    240
Leu Leu Ala Asp Ser Arg Leu Ser Ser Asp Arg Leu Arg Pro Gly Phe
 65                  70                  75                  80
ccg gcc acc tcg ccg cgc atc gtg gcg ttc cgc gac cgc cgg gcc gcc    288
Pro Ala Thr Ser Pro Arg Ile Val Ala Phe Arg Asp Arg Arg Ala Ala
                 85                  90                  95
ctg ctg aac gtc gac gac ccc gag cac cac acc cag cgg cgg atg ctg    336
Leu Leu Asn Val Asp Asp Pro Glu His His Thr Gln Arg Arg Met Leu
            100                 105                 110
gtc ccg agc ttc acc ctc aag cgc gcc gcc gcg ttg cgg ccg gcc atc    384
Val Pro Ser Phe Thr Leu Lys Arg Ala Ala Ala Leu Arg Pro Ala Ile
        115                 120                 125
cag cgg atc gtc gac gaa tgc atc gac gcg atg ctc gcg aag ggc ccg    432
Gln Arg Ile Val Asp Glu Cys Ile Asp Ala Met Leu Ala Lys Gly Pro
    130                 135                 140
ccc gcc gag ttg gtg aac gcc ttc gcg ctc ccc gtt ccc tcg atg gtg    480
Pro Ala Glu Leu Val Asn Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc gaa ctg ctc ggt gtc ccg tac gcc gat cac gag ttc ttc gag    528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gag cag tcc cgt cgg ctg ctg cgc ggc cgg gac gtg gac gag gtg cgg    576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Arg Asp Val Asp Glu Val Arg
            180                 185                 190
gac gcg cgg gac cag ctc gac tgc tac ctc ggg gcg ctg atc gac cgc    624
Asp Ala Arg Asp Gln Leu Asp Cys Tyr Leu Gly Ala Leu Ile Asp Arg
        195                 200                 205
aag tcc gag tcg tcc gtc ggt gac ggt gtc ctc gac gcc ctg gtc cac    672
Lys Ser Glu Ser Ser Val Gly Asp Gly Val Leu Asp Ala Leu Val His
    210                 215                 220
gag cag ttg cgc gag ggc gcg gtg gac cgg cag gag gcc atc tcg ctg    720
Glu Gln Leu Arg Glu Gly Ala Val Asp Arg Gln Glu Ala Ile Ser Leu
225                 230                 235                 240
gcc acg atc ctg ctg gtc gcc ggc cac gag acc acc gcc aac atg atc    768
Ala Thr Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met Ile
                245                 250                 255
tcg ctg ggc act tac acc ctg ctc caa cac ccc gag cga ctg gcg gag    816
Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala Glu
            260                 265                 270
ttg cgg gac gac ccg tcg ctg tgg ccc gcc gcc gtc gac gag ttg atg    864
Leu Arg Asp Asp Pro Ser Leu Trp Pro Ala Ala Val Asp Glu Leu Met
        275                 280                 285
cgg atg ctg tcc atc gcg gac ggg ctg atg cgg cag gcc acg gag gac    912
Arg Met Leu Ser Ile Ala Asp Gly Leu Met Arg Gln Ala Thr Glu Asp
    290                 295                 300
atc gag gtg gcc ggg acg acg atc cgc gcc ggt gag ggc gtg gtc ttc    960
Ile Glu Val Ala Gly Thr Thr Ile Arg Ala Gly Glu Gly Val Val Phe
305                 310                 315                 320
gcg acc tcg gtc atc aac cgc gac ggg gag gtc tac gcc gaa ccc gac   1008
Ala Thr Ser Val Ile Asn Arg Asp Gly Glu Val Tyr Ala Glu Pro Asp
                325                 330                 335
gcc ctc gac tgg cac cgg ccc acc cgc cat cac gtg gcg ttc ggc ttc   1056
Ala Leu Asp Trp His Arg Pro Thr Arg His His Val Ala Phe Gly Phe
            340                 345                 350
ggc atc cac cag tgt ctc ggc cag aac ctg gcc cgt gcc gag atg gag   1104
Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Met Glu
        355                 360                 365
atc gcc ctg cgt tcc ctg ttc gag cgg gtg ccc ggg ctg cgc ctc gac    1152
Ile Ala Leu Arg Ser Leu Phe Glu Arg Val Pro Gly Leu Arg Leu Asp
    370                 375                 380
att gcg ccg gac gcg gtc cgc ttc aaa ccg ggc gac acg atc cag gga    1200
Ile Ala Pro Asp Ala Val Arg Phe Lys Pro Gly Asp Thr Ile Gln Gly
385                 390                 395                 400
atg ctg gat ctg ccc gtg gcc tgg tag ggggtccact c atg cac atc gac   1250
Met Leu Asp Leu Pro Val Ala Trp                  Met His Ile Asp
                405                                1
atc gac acg gac gtg tgc atc ggc gcc ggc cag tgc gcg ctg tcc gcc    1298
Ile Asp Thr Asp Val Cys Ile Gly Ala Gly Gln Cys Ala Leu Ser Ala
  5                  10                  15                  20
ccg gcc gtc ttc acg cag gac gac gac ggc ttc agc acc ctc ctg ccc    1346
Pro Ala Val Phe Thr Gln Asp Asp Asp Gly Phe Ser Thr Leu Leu Pro
                 25                  30                  35
gga cag gag gac agc ggc gac ccg atg gtc cgg gag gcg gcc cga gcc    1394
Gly Gln Glu Asp Ser Gly Asp Pro Met Val Arg Glu Ala Ala Arg Ala
             40                  45                  50
tgc ccg gtc ggt gcc atc aag gtc tcg gaa acc gcg cga ccg tga        1439
Cys Pro Val Gly Ala Ile Lys Val Ser Glu Thr Ala Arg Pro
         55                  60                  65
<210>10
<211>1415
<212>DNA
<213>塔氏糖多孢菌(Saccharopolyspora taberi)JCM 9383t
<220>
<221>CDS
<222>(1)..(1206)
<220>
<221>CDS
<222>(1218)..(1415)
<400>10
atg ccg gca tct tct gaa gct ctg acc tat ccg atc ccc cgg acc tgt      48
Met Pro Ala Ser Ser Glu Ala Leu Thr Tyr Pro Ile Pro Arg Thr Cys
  1               5                  10                  15
ccg tac tcg ccg ccc gac tcc tac gcc gaa ctc cgg cgc gag cag ccg      96
Pro Tyr Ser Pro Pro Asp Ser Tyr Ala Glu Leu Arg Arg Glu Gln Pro
             20                  25                  30
gtc cgc cgg gtg ccg acg ctg gcg gga ggc agc gtg tgg ctg gtg tcg     144
Val Arg Arg Val Pro Thr Leu Ala Gly Gly Ser Val Trp Leu Val Ser
         35                  40                  45
cgg cac gag gac gtg cgc gcg gtc ctc agc gac ccg cgg atg agc tcc     192
Arg His Glu Asp Val Arg Ala Val Leu Ser Asp Pro Arg Met Ser Ser
     50                  55                  60
gac cgc cgc aag ccc ggg ttc ccg cgg ctc gtg ccg ggg cag agc gac     240
Asp Arg Arg Lys Pro Gly Phe Pro Arg Leu Val Pro Gly Gln Ser Asp
 65                  70                  75                  80
ctg atc ttc agc tcc aag ccg tcg atg atc ggc atg gac ggg cgc gag     288
Leu Ile Phe Ser Ser Lys Pro Ser Met Ile Gly Met Asp Gly Arg Glu
                 85                  90                  95
cac tcg gcg gcc cgg cgg gcg gtt ctc ggt gag ttc acc gtc cgg cgg     336
His Ser Ala Ala Arg Arg Ala Val Leu Gly Glu Phe Thr Val Arg Arg
            100                 105                 110
atc aac gcg ctg cgc ccg cgc gtg cag gag atc gtc gac gag gcc atc     384
Ile Asn Ala Leu Arg Pro Arg Val Gln Glu Ile Val Asp Glu Ala Ile
        115                 120                 125
gac gcg atg ctg gcc gcg ggc ggg ccg gtc gac ctg gtg cgg atg ctc     432
Asp Ala Met Leu Ala Ala Gly Gly Pro Val Asp Leu Val Arg Met Leu
    130                 135                 140
tcg ctt ccg gtg ccg tcg ctg gtg atc tgc gag ctg ctc ggc gtt ccc     480
Ser Leu Pro Val Pro Ser Leu Val Ile Cys Glu Leu Leu Gly Val Pro
145                 150                 155                 160
tac gcc gac cac gag ttc ttc cag cag cgc agc ggc cgc atc atc agc     528
Tyr Ala Asp His Glu Phe Phe Gln Gln Arg Ser Gly Arg Ile Ile Ser
                165                 170                 175
cgg gcg acg ccg ggg gcc gag cgg gag gag gcg ttc ttc gaa ctc cgc     576
Arg Ala Thr Pro Gly Ala Glu Arg Glu Glu Ala Phe Phe Glu Leu Arg
            180                 185                 190
gcc tac ctg tcg gat ctg gtc gcg gac aag gtc cgc gca ccg ggc gac     624
Ala Tyr Leu Ser Asp Leu Val Ala Asp Lys Val Arg Ala Pro Gly Asp
        195                 200                 205
gac ctg ctc ggc agg cag gtg gcc aag cag cgg gcc gag ggc gag gtc     672
Asp Leu Leu Gly Arg Gln Val Ala Lys Gln Arg Ala Glu Gly Glu Val
    210                 215                 220
gac cag gag gcg ctg gtc agc ctc gcg ttc ctg ctg ctg gtc gcc ggg     720
Asp Gln Glu Ala Leu Val Ser Leu Ala Phe Leu Leu Leu Val Ala Gly
225                 230                 235                 240
cac gag acc acc gcg aac atg atc tcg ctt ggt agc ctg gcg ctg ctg     768
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Ser Leu Ala Leu Leu
                245                 250                 255
gac gat tcc gcc cgg tgg gcg gag atc gcc gcg gat ccg gcg aag acg     816
Asp Asp Ser Ala Arg Trp Ala Glu Ile Ala Ala Asp Pro Ala Lys Thr
            260                 265                 270
ccc ggc gcg gtg gag gag atg ctg cgg ttc ttc tcg atc gtc gac aac     864
Pro Gly Ala Val Glu Glu Met Leu Arg Phe Phe Ser Ile Val Asp Asn
        275                 280                 285
gcg acc gcg cgc acc gcg acc gag gac gtg gag atc ggc ggc gtg gtc     912
Ala Thr Ala Arg Thr Ala Thr Glu Asp Val Glu Ile Gly Gly Val Val
    290                 295                 300
atc ggg gag ggc gac ggg gtg atc gcg atg ggc tat tcg gcc aac cac     960
Ile Gly Glu Gly Asp Gly Val Ile Ala Met Gly Tyr Ser Ala Asn His
305                 310                 315                 320
gac ccc gag gtc ttc gac cgc ccc ggg gac ctc gac ttc tcc cgg gcc    1008
Asp Pro Glu Val Phe Asp Arg Pro Gly Asp Leu Asp Phe Ser Arg Ala
                325                 330                 335
gcc cgc cag cac gtc gcc ttc ggc ttc ggc gcg cac cag tgc ctg ggc    1056
Ala Arg Gln His Val Ala Phe Gly Phe Gly Ala His Gln Cys Leu Gly
            340                 345                 350
cag aac ctc gcg cgg gtg gag ttg cag atc gtc ttc gac acg ctg gtg    1104
Gln Asn Leu Ala Arg Val Glu Leu Gln Ile Val Phe Asp Thr Leu Val
        355                 360                 365
cgg cgg atc ccg gac ctg cgg ctg gcg gtc ggc ttc gac gac atc cgg    1152
Arg Arg Ile Pro Asp Leu Arg Leu Ala Val Gly Phe Asp Asp Ile Arg
    370                 375                 380
ttc aag gag gag tcg gcg atc tac gga atc cac gaa ctg atg gtc act    1200
Phe Lys Glu Glu Ser Ala Ile Tyr Gly Ile His Glu Leu Met Val Thr
385                 390                 395                 400
tgg tga ggagagtcgg g atg agg atc cag gcg gac gtg gag cgc tgc gtc   1250
Trp                  Met Arg Ile Gln Ala Asp Val Glu Arg Cys Val
                       1               5                  10
gga gcg ggt cag tgc gtg ctc gcc gcg gac gcg ctg ttc gac cag cgc    1298
Gly Ala Gly Gln Cys Val Leu Ala Ala Asp Ala Leu Phe Asp Gln Arg
             15                  20                  25
gac gac gac ggc acc gtg gtg gtg ctc gcg acc gag gtc ggc gac ggg   1346
Asp Asp Asp Gly Thr Val Val Val Leu Ala Thr Glu Val Gly Asp Gly
         30                  35                  40
gac gcc gac gcg gtc cgg gac gcg gtg acg ctc tgc ccg tcg ggc gtg   1394
Asp Ala Asp Ala Val Arg Asp Ala Val Thr Leu Cys Pro Ser Gly Val
     45                  50                  55
ttg tcg ctc gtg gag gac tga                                       1415
Leu Ser Leu Val Glu Asp
 60                  65
<210>11
<211>1418
<212>DNA
<213>砖红色链霉菌(Streptmyces testaceus)ATCC 21469
<220>
<221>CDS
<222>(1)..(1188)
<220>
<221>CDS
<222>(1224)..(1418)
<400>11
atg acc gaa gcc atc gcg tat ttc cag gac cgc acc tgc ccc tac cac     48
Met Thr Glu Ala Ile Ala Tyr Phe Gln Asp Arg Thr Cys Pro Tyr His
  1               5                  10                  15
ccg ccg gcc ggc tat cag ccg ctg cgt gac gca ggc ccg ctg gcc cat     96
Pro Pro Ala Gly Tyr Gln Pro Leu Arg Asp Ala Gly Pro Leu Ala His
             20                  25                  30
gtc acc ctc tac gac ggc cgc aag gtg tgg gcg gtg acc ggc cac acc    144
Val Thr Leu Tyr Asp Gly Arg Lys Val Trp Ala Val Thr Gly His Thr
         35                  40                  45
gag gcg cgg gcg ctg ctg agc gac ccg cgg ctg tcc tcc gac cgg cag    192
Glu Ala Arg Ala Leu Leu Ser Asp Pro Arg Leu Ser Ser Asp Arg Gln
     50                  55                  60
aac ccg gcc ttc ccg gcg ccg ttc gcc cgc ttc gcg gcg ctg cgc cag    240
Asn Pro Ala Phe Pro Ala Pro Phe Ala Arg Phe Ala Ala Leu Arg Gln
 65                  70                  75                  80
gtc agg tcg ccg ctg atc ggc gtg gac gac ccc gag cac aac acc cag    288
Val Arg Ser Pro Leu Ile Gly Val Asp Asp Pro Glu His Asn Thr Gln
                 85                  90                  95
cgc cgg atg ctg atc ccc agc ttc agc gtc aag cgg acc gcg gcg ctg    336
Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys Arg Thr Ala Ala Leu
            100                 105                 110
cgg ccg cag atc cag cag atc gtc gac ggg ctg ctg gac cgg atg ctg    384
Arg Pro Gln Ile Gln Gln Ile Val Asp Gly Leu Leu Asp Arg Met Leu
        115                 120                 125
gcg cag ggg ccg ccc gcc gag ctg gtc tcc gcg ttc gcg ctg ccg gtg    432
Ala Gln Gly Pro Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val
    130                 135                 140
ccc tcg atg gtg atc tgc tcg ctg ctc ggc gtc ccc tac tcc gac cac    480
Pro Ser Met Val Ile Cys Ser Leu Leu Gly Val Pro Tyr Ser Asp His
145                 150                 155                 160
gag ttc ttc gag gag gcc tcc cgc cgg ctc ctg cgc agc cgg acg gcc    528
Glu Phe Phe Glu Glu Ala Ser Arg Arg Leu Leu Arg Ser Arg Thr Ala
                165                 170                 175
gag gag gcg gag gag gcc cgc ctc cgg ctg gag gac tac ttc gac gag    576
Glu Glu Ala Glu Glu Ala Arg Leu Arg Leu Glu Asp Tyr Phe Asp Glu
            180                 185                 190
ctg atc gcc cac aag gag aag acc ccg cgc gag ggc ctg ctc gac gag    624
Leu Ile Ala His Lys Glu Lys Thr Pro Arg Glu Gly Leu Leu Asp Glu
        195                 200                 205
ctg gtc cac gac gag ctg cgc acc ggc gcc ctg gag cgc gag gat ctg    672
Leu Val His Asp Glu Leu Arg Thr Gly Ala Leu Glu Arg Glu Asp Leu
    210                 215                 220
gtc cgg ctc gcg atg atc ctg ctg gtg gcc ggc cac gag acc acc gcc    720
Val Arg Leu Ala Met Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala
225                 230                 235                 240
aac atg atc tcg ctc ggc acc ttc acc ctg ctg gag cac ccc gga cag    768
Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Glu His Pro Gly Gln
                245                 250                 255
ctg gcc cgg ctg aag gcc gag gag ggg ctg ctg ccg gcc gcc gtc gag    816
Leu Ala Arg Leu Lys Ala Glu Glu Gly Leu Leu Pro Ala Ala Val Glu
            260                 265                 270
gag ctg ttg cgg ttc ctg tcc atc gcg gac ggc ctg ctg cgg gtg gcc    864
Glu Leu Leu Arg Phe Leu Ser Ile Ala Asp Gly Leu Leu Arg Val Ala
        275                 280                 285
atg gcg gac atc gag atc ggc ggg cag gtc atc cgt gcc gac gac ggc    912
Met Ala Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Asp Asp Gly
    290                 295                 300
gtg ctg ttc ccc acc tcg ctg atc aac cgg gac gac ggc gcc tat ccg    960
Val Leu Phe Pro Thr Ser Leu Ile Asn Arg Asp Asp Gly Ala Tyr Pro
305                 310                 315                 320
aca ccg gac gag ctg gac gtc ggc cgg tcc gcc cgc cat cac gtg gcg   1008
Thr Pro Asp Glu Leu Asp Val Gly Arg Ser Ala Arg His His Val Ala
                325                 330                 335
ttc ggg ttc ggc atc cac cag tgc ctg ggg cag aac ctc gcc cgg gcg   1056
Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala
            340                 345                 350
gag atg gag atc gcg ctg cgc tcg ctg ttc gac cgg atc ccg gat ctg   1104
Glu Met Glu Ile Ala Leu Arg Ser Leu Phe Asp Arg Ile Pro Asp Leu
        355                 360                 365
cga ctc gcc gtg ccg gct gcc gag atc ccc ttc aag ccg ggg gac act   1152
Arg Leu Ala Val Pro Ala Ala Glu Ile Pro Phe Lys Pro Gly Asp Thr
    370                 375                 380
ctg caa gga atg atc gaa ctg ccg ctg gcc tgg tag ccgcggtgca cccggc 1204
Leu Gln Gly Met Ile Glu Leu Pro Leu Ala Trp
385                 390                 395
cgaacgaagg ggttttgga atg cgg atc acc atc gac acc gac gtc tgc atc  1256
                     Met Arg Ile Thr Ile Asp Thr Asp Val Cys Ile
                       1               5                  10
ggc gcc ggc cag tgc gcg ctg acc gcg ccc ggg gtg ttc acc cag gac   1304
Gly Ala Gly Gln Cys Ala Leu Thr Ala Pro Gly Val Phe Thr Gln Asp
             15                  20                  25
gac gac ggc ttc agc gag ctg ctg ccc ggc cgc gag gac ggc gcg ggc   1352
Asp Asp Gly Phe Ser Glu Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly
         30                  35                  40
gac ccg atg ctg cgg gag gcc gtg cgt gcc tgc ccc gtg cag gcc atc   1400
Asp Pro Met Leu Arg Glu Ala Val Arg Ala Cys Pro Val Gln Ala Ile
     45                  50                  55
acc gtc gcg gac gac tga                                           1418
Thr Val Ala Asp Asp
 60              64
<210>12
<211>66
<212>PRT
<213>暗产色链霉菌(Streptmyces phaeochromogenes)IFO 12898
<400>12
Met His Ile Asp Ile Asp Thr Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
Ala Leu Ser Ala Pro Ala Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
Thr Leu Leu Pro Gly Gln Glu Asp Ser Gly Asp Pro Met Val Arg Glu
         35                  40                  45
Ala Ala Arg Ala Cys Pro Val Gly Ala Ile Lys Val Ser Glu Thr Ala
     50                  55                  60
Arg Pro
 65
<210>13
<211>65
<212>PRT
<213>塔氏糖多孢菌(Saccharopolyspora taberi)JCM 9383t
<400>13
Met Arg Ile Gln Ala Asp Val Glu Arg Cys Val Gly Ala Gly Gln Cys
  1               5                  10                  15
Val Leu Ala Ala Asp Ala Leu Phe Asp Gln Arg Asp Asp Asp Gly Thr
             20                  25                  30
Val Val Val Leu Ala Thr Glu Val Gly Asp Gly Asp Ala Asp Ala Val
         35                  40                  45
Arg Asp Ala Val Thr Leu Cys Pro Ser Gly Ala Leu Ser Leu Val Glu
     50                  55                  60
Asp
 65
<210>14
<211>64
<212>PRT
<213>砖红色链霉菌(Streptmyces testaceus)ATCC 21469
<400>14
Met Arg Ile Thr Ile Asp Thr Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
Ala Leu Thr Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
Glu Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly Asp Pro Met Leu Arg
         35                  40                  45
Glu Ala Val Arg Ala Cys Pro Val Gln Ala Ile Thr Val Ala Asp Asp
     50                  55                  60
<210>15
<211>201
<212>DNA
<213>暗产色链霉菌(Streptmyces phaeochromogenes)IFO 12898
<220>
<221>CDS
<222>(1)..(201)
<400>15
atg cac atc gac atc gac acg gac gtg tgc atc ggc gcc ggc cag tgc     48
Met His Ile Asp Ile Asp Thr Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
gcg ctg tcc gcc ccg gcc gtc ttc acg cag gac gac gac ggc ttc agc     96
Ala Leu Ser Ala Pro Ala Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
acc ctc ctg ccc gga cag gag gac agc ggc gac ccg atg gtc cgg gag    144
Thr Leu Leu Pro Gly Gln Glu Asp Ser Gly Asp Pro Met Val Arg Glu
         35                  40                  45
gcg gcc cga gcc tgc ccg gtc ggt gcc atc aag gtc tcg gaa acc gcg    192
Ala Ala Arg Ala Cys Pro Val Gly Ala Ile Lys Val Ser Glu Thr Ala
     50                  55                  60
cga ccg tga                                                        201
Arg Pro
 65
<210>16
<211>198
<212>DNA
<213>塔氏糖多孢菌(Saccharopolyspora taberi)JCM 9383t
<220>
<221>CDS
<222>(1)..(198)
<400>16
atg agg atc cag gcg gac gtg gag cgc tgc gtc gga gcg ggt cag tgc     48
Met Arg Ile Gln Ala Asp Val Glu Arg Cys Val Gly Ala Gly Gln Cys
  1               5                  10                  15
gtg ctc gcc gcg gac gcg ctg ttc gac cag cgc gac gac gac ggc acc     96
Val Leu Ala Ala Asp Ala Leu Phe Asp Gln Arg Asp Asp Asp Gly Thr
             20                  25                  30
gtg gtg gtg ctc gcg acc gag gtc ggc gac ggg gac gcc gac gcg gtc    144
Val Val Val Leu Ala Thr Glu Val Gly Asp Gly Asp Ala Asp Ala Val
         35                  40                  45
cgg gac gcg gtg acg ctc tgc ccg tcg ggc gcg ttg tcg ctc gtg gag    192
Arg Asp Ala Val Thr Leu Cys Pro Ser Gly Ala Leu Ser Leu Val Glu
     50                  55                  60
gac tga                                                            198
Asp
 65
<210>17
<211>195
<212>DNA
<213>砖红色链霉菌(Streptmyces testaceus)ATCC 21469
<220>
<221>CDS
<222>(1)..(195)
<400>17
atg cgg atc acc atc gac acc gac gtc tgc atc ggc gcc ggc cag tgc     48
Met Arg Ile Thr Ile Asp Thr Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
gcg ctg acc gcg ccc ggg gtg ttc acc cag gac gac gac ggc ttc agc     96
Ala Leu Thr Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
gag ctg ctg ccc ggc cgc gag gac ggc gcg ggc gac ccg atg ctg cgg    144
Glu Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly Asp Pro Met Leu Arg
         35                  40                  45
gag gcc gtg cgt gcc tgc ccc gtg cag gcc atc acc gtc gcg gac gac    192
Glu Ala Val Arg Ala Cys Pro Val Gln Ala Ile Thr Val Ala Asp Asp
     50                  55                  60
tga                                                                195
<210>18
<211>23
<212>PRT
<213>暗产色链霉菌(Streptmyces phaeochromogenes)IFO 12898
<400>18
Thr Asp Met Thr Asp Thr Ala Asp Val Lys Pro Leu Ser Ala Pro Val
  1               5                  10                  15
Ala Phe Pro Gln Asp Arg Thr
             20
<210>19
<211>7
<212>PRT
<213>暗产色链霉菌(Streptmyces phaeochromogenes)IFO 12898
<400>19
Val Thr Leu Tyr Asp Gly Arg
  1               5
<210>20
<211>19
<212>PRT
<213>塔氏糖多孢菌(Saccharopolyspora taberi)JCM 9383T
<400>20
Pro Ala Ser Ser Glu Ala Leu Thr Tyr Pro Ile Pro Arg Thr Cys Pro
  1               5                  10                  15
Tyr Ser Pro
<210>21
<211>8
<212>PRT
<213>塔氏糖多孢菌(Saccharopolyspora taberi)JCM 9383T
<400>21
Gly Ala Val Glu Glu Met Leu Arg
  1               5
<210>22
<211>19
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>22
Thr Asp Thr Ala Thr Thr Pro Gln Thr Thr Asp Ala Pro Ala Phe Pro
  1               5                  10                  15
Ser Asn Arg
<210>23
<211>15
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>23
Arg Ser Cvs Pro Tyr Gln Leu Pro Asp Gly Tyr Ala Gln Leu Arg
  1               5                  10                  15
<210>24
<211>15
<212>PRT
<213>浅灰链霉菌(Streptomvces griseolus)ATCC11796
<400>24
Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly Arg
  1               5                  10                  15
<210>25
<211>7
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>25
Gln Ala Trp Val Val Thr Lys
  1               5
<210>26
<211>11
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>26
Thr Asp Asp Asn Phe Pro Ala Thr Ser Pro Arg
  1               5                  10
<210>27
<211>17
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>27
Glu Ser Pro Gln Ala Phe Ile Gly Leu Asp Pro Pro Glu His Gly Thr
  1               5                  10                  15
Arg
<210>28
<211>9
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>28
Met Thr Ile Ser Glu Phe Thr Val Lys
  1               5
<210>29
<211>14
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>29
Leu Val Gln Ser Thr Asp Ala Gln Ser Ala Leu Thr Ala Arg
  1               5                  10
<210>30
<211>12
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>30
Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg
  1               5                  10
<210>31
<211>11
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>31
Tyr Leu Ala Ile Ala Asp Ile Ala Gly Gly Arg
  1               5                  10
<210>32
<211>14
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>32
Ala Gly Glu Gly Val Ile Val Val Asn Ser Ile Ala Asn Arg
  1               5                  10
<210>33
<211>15
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>33
Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu Asp Ile His Arg
  1               5                  10                  15
<210>34
<211>13
<212>PRT
<213>浅灰链霉菌(Streptomyces griseolus)ATCC11796
<400>34
Leu Glu Leu Glu Val Ile Leu Asn Ala Leu Met Asp Arg
  1               5                  10
<210>35
<211>32
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>35
acsgayatga csgayacsgc sgaygtnaag cc                                  32
<210>36
<211>21
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>36
 vcgsccgtcg tagagcgtca c                                             21
<210>37
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>37
 atatgaccga taccgcggat gtgaagccgc tct                                33
<210>38
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>38
aacaatttca cacaggaaac agctatgacc                                     30
<210>39
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>39
ctggaagggg caggtgcggt cctgggggaa                                     30
<210>40
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>40
cagtcacgac gttgtaaaac gacggccagt                                     30
<210>41
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>41
cttcccccag gaccgcacct gccccttcca                                     30
<210>42
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>42
tgcggtcctg ggggaaggcg acgggtgccg aga                                 33
<210>43
<211>22
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>43
acgaatgcat cgacgcgatg ct                                             22
<210>44
<211>22
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>44
agttggtgaa cgccttcgcg ct                                             22
<210>45
<211>22
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>45
cctcgatggt gatctgcgaa ct                                             22
<210>46
<211>20
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>46
acttacaccc tgctccaaca                                                20
<210>47
<211>25
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>47
acgagttgat gcggatgctg tccat                                          25
<210>48
<211>22
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>48
tctccgagcg cgaataccgt ga                                             22
<210>49
<211>23
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>49
ttcgacctgg acgcgctcgt cat                                            23
<210>50
<211>24
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>50
tttccgagac cttgatggca ccga                                           24
<210>51
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>51
ctcatatgac agacatgacg gatacggca                                      29
<210>52
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>52
gaagcttcta ccaggccacg ggcagatcca                                     30
<210>53
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>53
aaagctttca cggtcgcgcg gtttccga                                       28
<210>54
<211>20
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>54
gaggcsctsa cstatccgat                                                20
<210>55
<211>18
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>55
catct cctcc accgcgcc                                                 18
<210>56
<211>22
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>56
gtgccgcgac accagccaca cg                                             22
<210>57
<211>17
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>57
caggaaacag ctatgac                                                   17
<210>58
<211>23
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>58
tcgacctggt gcggatgctc tcg                                            23
<210>59
<211>17
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>59
gttttcccag tcacgac                                                   17
<210>60
<211>23
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>60
catgatctcg cttggtagcc tgg                                            23
<210>61
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>61
cccatatgcc ggcatcttct gaagctctg                                      29
<210>62
<211>32
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>62
gaagctttca ccaagtgacc atcagttcgt gg                                  32
<210>63
<211>31
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>63
ctaagctttc agtcctccac gagcgacaac a                                   31
<210>64
<211>20
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>64
agtgcctggg ccagaacctc                                                20
<210>65
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>65
cgggaggaac tcgtgaccga agccatcgcg                                     30
<210>66
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>66
gagggcgccg gctcagtcgt ccgcgacggt gat                                 33
<210>67
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>67
caggaaacag ctatgaccat gattacgcca                                     30
<210>68
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>68
tgtaaaacga cggccagtga attgtaatac                                     30
<210>69
<211>1418
<212>DNA
<213>砖红色链霉菌(Streptmyces testaceus)ATCC 21469
<220>
<221>CDS
<222>(1)..(1188)
<220>
<221>CDS
<222>(1224)..(1418)
<400>69
gtg acc gaa gcc atc gcg tat ttc cag gac cgc acc tgc ccc tac cac     48
Val Thr Glu Ala Ile Ala Tyr Phe Gln Asp Arg Thr Cys Pro Tyr His
1                 5                  10                  15
ccg ccg gcc ggc tat cag ccg ctg cgt gac gca ggc ccg ctg gcc cat     96
Pro Pro Ala Gly Tyr Gln Pro Leu Arg Asp Ala Gly Pro Leu Ala His
             20                  25                  30
gtc acc ctc tac gac ggc cgc aag gtg tgg gcg gtg acc ggc cac acc    144
Val Thr Leu Tyr Asp Gly Arg Lys Val Trp Ala Val Thr Gly His Thr
         35                  40                  45
gag gcg cgg gcg ctg ctg agc gac ccg cgg ctg tcc tcc gac cgg cag    192
Glu Ala Arg Ala Leu Leu Ser Asp Pro Arg Leu Ser Ser Asp Arg Gln
     50                  55                  60
aac ccg gcc ttc ccg gcg ccg ttc gcc cgc ttc gcg gcg ctg cgc cag    240
Asn Pro Ala Phe Pro Ala Pro Phe Ala Arg Phe Ala Ala Leu Arg Gln
65                  70                  75                  80
gtc agg tcg ccg ctg atc ggc gtg gac gac ccc gag cac aac acc cag    288
Val Arg Ser Pro Leu Ile Gly Val Asp Asp Pro Glu His Asn Thr Gln
                 85                  90                  95
cgc cgg atg ctg atc ccc agc ttc agc gtc aag cgg acc gcg gcg ctg    336
Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys Arg Thr Ala Ala Leu
            100                 105                 110
cgg ccg cag atc cag cag atc gtc gac ggg ctg ctg gac cgg atg ctg    384
Arg Pro Gln Ile Gln Gln Ile Val Asp Gly Leu Leu Asp Arg Met Leu
        115                 120                 125
gcg cag ggg ccg ccc gcc gag ctg gtc tcc gcg ttc gcg ctg ccg gtg    432
Ala Gln Gly Pro Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val
    130                 135                 140
ccc tcg atg gtg atc tgc tcg ctg ctc ggc gtc ccc tac tcc gac cac    480
Pro Ser Met Val Ile Cys Ser Leu Leu Gly Val Pro Tyr Ser Asp His
145                 150                 155                 160
gag ttc ttc gag gag gcc tcc cgc cgg ctc ctg cgc agc cgg acg gcc    528
Glu Phe Phe Glu Glu Ala Ser Arg Arg Leu Leu Arg Ser Arg Thr Ala
                165                 170                 175
gag gag gcg gag gag gcc cgc ctc cgg ctg gag gac tac ttc gac gag    576
Glu Glu Ala Glu Glu Ala Arg Leu Arg Leu Glu Asp Tyr Phe Asp Glu
            180                 185                 190
ctg atc gcc cac aag gag aag acc ccg cgc gag ggc ctg ctc gac gag    624
Leu Ile Ala His Lys Glu Lys Thr Pro Arg Glu Gly Leu Leu Asp Glu
        195                 200                 205
ctg gtc cac gac gag ctg cgc acc ggc gcc ctg gag cgc gag gat ctg    672
Leu Val His Asp Glu Leu Arg Thr Gly Ala Leu Glu Arg Glu Asp Leu
    210                 215                 220
gtc cgg ctc gcg atg atc ctg ctg gtg gcc ggc cac gag acc acc gcc    720
Val Arg Leu Ala Met Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala
225                 230                 235                 240
aac atg atc tcg ctc ggc acc ttc acc ctg ctg gag cac ccc gga cag    768
Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Glu His Pro Gly Gln
                245                 250                 255
ctg gcc cgg ctg aag gcc gag gag ggg ctg ctg ccg gcc gcc gtc gag    816
Leu Ala Arg Leu Lys Ala Glu Glu Gly Leu Leu Pro Ala Ala Val Glu
            260                 265                 270
gag ctg ttg cgg ttc ctg tcc atc gcg gac ggc ctg ctg cgg gtg gcc    864
Glu Leu Leu Arg Phe Leu Ser Ile Ala Asp Gly Leu Leu Arg Val Ala
        275                 280                 285
atg gcg gac atc gag atc ggc ggg cag gtc atc cgt gcc gac gac ggc     912
Met Ala Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Asp Asp Gly
    290                 295                 300
gtg ctg ttc ccc acc tcg ctg atc aac cgg gac gac ggc gcc tat ccg     960
Val Leu Phe Pro Thr Ser Leu Ile Asn Arg Asp Asp Gly Ala Tyr Pro
305                 310                 315                 320
aca ccg gac gag ctg gac gtc ggc cgg tcc gcc cgc cat cac gtg gcg    1008
Thr Pro Asp Glu Leu Asp Val Gly Arg Ser Ala Arg His His Val Ala
                325                 330                 335
ttc ggg ttc ggc atc cac cag tgc ctg ggg cag aac ctc gcc cgg gcg    1056
Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala
            340                 345                 350
gag atg gag atc gcg ctg cgc tcg ctg ttc gac cgg atc ccg gat ctg    1104
Glu Met Glu Ile Ala Leu Arg Ser Leu Phe Asp Arg Ile Pro Asp Leu
        355                 360                 365
cga ctc gcc gtg ccg gct gcc gag atc ccc ttc aag ccg ggg gac act    1152
Arg Leu Ala Val Pro Ala Ala Glu Ile Pro Phe Lys Pro Gly Asp Thr
    370                 375                 380
ctg caa gga atg atc gaa ctg ccg ctg gcc tgg tag ccgcggtgca cccggc  1204
Leu Gln Gly Met Ile Glu Leu Pro Leu Ala Trp
385                 390                 395
cgaacgaagg ggttttgga atg cgg atc acc atc gac acc gac gtc tgc atc   1256
                     Met Arg Ile Thr Ile Asp Thr Asp Val Cys Ile
                       1               5                  10
ggc gcc ggc cag tgc gcg ctg acc gcg ccc ggg gtg ttc acc cag gac    1304
Gly Ala Gly Gln Cys Ala Leu Thr Ala Pro Gly Val Phe Thr Gln Asp
             15                  20                  25
gac gac ggc ttc agc gag ctg ctg ccc ggc cgc gag gac ggc gcg ggc    1352
Asp Asp Gly Phe Ser Glu Leu Leu Pro Gly Arg Glu Asp Gly Ala Gly
         30                  35                  40
gac ccg atg ctg cgg gag gcc gtg cgt gcc tgc ccc gtg cag gcc atc    1400
Asp Pro Met Leu Arg Glu Ala Val Arg Ala Cys Pro Val Gln Ala Ile
     45                  50                  55
acc gtc gcg gac gac tga                                            1418
Thr Val Ala Asp Asp
 60              64
<210>70
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>70
cgggaggaac atatgaccga agccatcgcg                                     30
<210>71
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>71
gcaaagcttc taccaggcca gcggcagttc gat                                 33
<210>72
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>72
gaggaagctt gctcagtcgt ccgcgacggt gat                                 33
<210>73
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>73
gtgccctcga tggtgatctg ctcgctgctc                                     30
<210>74
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>74
tcgagggttc atatgaccga gatgacagag                                     30
<210>75
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>75
gatgtggcag atcaccatgg acgggacggg                                     30
<210>76
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>76
cccgtcccgt ccatggtgat ctgccacatg                                     30
<210>77
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>77
ggcaagcttt caccaggtga ccgggagttc gtt                                 33
<210>78
<211>1233
<212>DNA
<213>Streptmyces carbophilus SANK 62585
<220>
<221>CDS
<222>(1)..(1233)
<400>78
atg acc gag atg aca gag aaa gcc acc aca ttc ctc acg tcg cag gag      48
Met Thr Glu Met Thr Glu Lys Ala Thr Thr Phe Leu Thr Ser Gln Glu
  1               5                  10                  15
gca ccg gcc ttc ccg gcg gac cgc aca tgt ccc tac caa cta ccc acg     96
Ala Pro Ala Phe Pro Ala Asp Arg Thr Cys Pro Tyr Gln Leu Pro Thr
             20                  25                  30
gcc tac agt cgg ttg agg gac gag ccg gat gcg ctg cgc ccg gtg acg    144
Ala Tyr Ser Arg Leu Arg Asp Glu Pro Asp Ala Leu Arg Pro Val Thr
         35                  40                  45
ctc tac gac ggc cgc cgc gcc tgg gtg gtg acc aag cac gag gcg gcg    192
Leu Tyr Asp Gly Arg Arg Ala Trp Val Val Thr Lys His Glu Ala Ala
     50                  55                  60
cgg cgg tta ctc gcg gac ccc cgg ctg tcc tcc gac cgc ctg cac gcc    240
Arg Arg Leu Leu Ala Asp Pro Arg Leu Ser Ser Asp Arg Leu His Ala
 65                  70                  75                  80
gac ttc ccc gcc acc tcg cca cgc ttc aag gcg ttc cgg cag ggc agc    288
Asp Phe Pro Ala Thr Ser Pro Arg Phe Lys Ala Phe Arg Gln Gly Ser
                 85                  90                  95
ccc gcg ttc atc ggg atg gat ccc ccc gag cac ggg acg cgt cgc cgc    336
Pro Ala Phe Ile Gly Met Asp Pro Pro Glu His Gly Thr Arg Arg Arg
            100                 105                 110
atg acg atc agc gag ttc acc gtg aag cgc atc aag ggc atg cgc ccg    384
Met Thr Ile Ser Glu Phe Thr Val Lys Arg Ile Lys Gly Met Arg Pro
        115                 120                 125
gac gtc gaa cgc atc gtg cac ggc ttc atc gac gac atg ctc gcc gcg    432
Asp Val Glu Arg Ile Val His Gly Phe Ile Asp Asp Met Leu Ala Ala
    130                 135                 140
gga ccc acc gcc gat ctg gtc agc cag ttc gcc ctg ccc gtc ccg tcc    480
Gly Pro Thr Ala Asp Leu Val Ser Gln Phe Ala Leu Pro Val Pro Ser
145                 150                 155                 160
atg gtg atc tgc cac atg ctc ggc gtc ccc tac gcc gac cac gag ttc    528
Met Val Ile Cys His Met Leu Gly Val Pro Tyr Ala Asp His Glu Phe
                165                 170                 175
ttc cag gac gcg agc aag cgc ctg gtg cag gcg gtg gac gcc gac agt    576
Phe Gln Asp Ala Ser Lys Arg Leu Val Gln Ala Val Asp Ala Asp Ser
            180                 185                 190
gcc gtc gcc gcc cgg gac gac ttc gag cgc tac ctg gac ggg ctg atc    624
Ala Val Ala Ala Arg Asp Asp Phe Glu Arg Tyr Leu Asp Gly Leu Ile
        195                 200                 205
acc aag ctg gag tcc gaa ccc ggg acc ggg ctc ctc ggc aaa ctg gtc    672
Thr Lys Leu Glu Ser Glu Pro Gly Thr Gly Leu Leu Gly Lys Leu Val
    210                 215                 220
acc cac cag ctg gcg gac ggc gag atc gac cgc gcg gag ctg atc tcc    720
Thr His Gln Leu Ala Asp Gly Glu Ile Asp Arg Ala Glu Leu Ile Ser
225                 230                 235                 240
acc gcc ctg ctg ctg ctc gtc gcc ggt cat gag acc acg gcc tcg atg    768
Thr Ala Leu Leu Leu Leu Val Ala Gly His Glu Thr Thr Ala Ser Met
                245                 250                 255
acc tcg ctc agc gtc atc acc ctg ctc gaa cac ccc gac cag cac gcc    816
Thr Ser Leu Ser Val Ile Thr Leu Leu Glu His Pro Asp Gln His Ala
            260                 265                 270
gcc ctg cgc gcc gac ccg tcc ctc gtg ccc gga gcg gtc gag gaa ctg    864
Ala Leu Arg Ala Asp Pro Ser Leu Val Pro Gly Ala Val Glu Glu Leu
        275                 280                 285
ctg cgc gtc ctg gcc atc gcg gac atc gcg ggc ggc cgc atc gcc acc    912
Leu Arg Val Leu Ala Ile Ala Asp Ile Ala Gly Gly Arg Ile Ala Thr
    290                 295                 300
gcc gac atc gag atc gac gga cag ctc atc cgg gcc ggt gaa gga gtg    960
Ala Asp Ile Glu Ile Asp Gly Gln Leu Ile Arg Ala Gly Glu Gly Val
305                 310                 315                 320
atc gtc acc aac tcc atc gcc aac cgc gac agt tcg gtg ttc gag aac    1008
Ile Val Thr Asn Ser Ile Ala Asn Arg Asp Ser Ser Val Phe Glu Asn
                325                 330                 335
ccg gac cgc ctc gat gtg cac cgc tcg gca cgc cac cac ctc tcc ttc    1056
Pro Asp Arg Leu Asp Val His Arg Ser Ala Arg His His Leu Ser Phe
            340                 345                 350
ggg tac ggg gtg cac cag tgc ctg ggc cag aac ctg gcc cgc ctc gaa    1104
Gly Tyr Gly Val His Gln Cys Leu Gly Gln Asn Leu Ala Arg Leu Glu
        355                 360                 365
ctc gaa gtc atc ctc acc gtg ttg ttc gac cgc att ccg acc ctg cgc    1152
Leu Glu Val Ile Leu Thr Val Leu Phe Asp Arg Ile Pro Thr Leu Arg
    370                 375                 380
ctg gcc gtc ccc gtg gag cag ctg acg ctg cgt ccg ggc acg acg atc    1200
Leu Ala Val Pro Val Glu Gln Leu Thr Leu Arg Pro Gly Thr Thr Ile
385                 390                 395                 400
cag ggc gtc aac gaa ctc ccg gtc acc tgg tga                        1233
Gln Gly Val Asn Glu Leu Pro Val Thr Trp
                405                 410
<210>79
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>79
gccatatgac cgataccgcc acgacgcc                                       28
<210>80
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>80
gcaagctttc accaggtgac cgggagttc                                      29
<210>81
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>81
gcaagcttct attccgtgtc ctcgacga                                       28
<210>82
<211>20
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>82
cacggcttcc tcgacgagat                                                20
<210>83
<211>20
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>83
gtggaggaac tgctccgcta                                               20
<210>84
<211>1221
<212>DNA
<213>浅灰链霉菌(Streptmyces griseolus)ATCC 11796
<220>
<221>CDS
<222>(1)..(1221)
<400>84
atg acc gat acc gcc acg acg ccc cag acc acg gac gca ccc gcc ttc     48
Met Thr Asp Thr Ala Thr Thr Pro Gln Thr Thr Asp Ala Pro Ala Phe
  1               5                  10                  15
ccg agc aac cgg agc tgt ccc tac cag tta ccg gac ggc tac gcc cag     96
Pro Ser Asn Arg Ser Cys Pro Tyr Gln Leu Pro Asp Gly Tyr Ala Gln
             20                  25                  30
ctc cgg gac acc ccc ggc ccc ctg cac cgg gtg acg ctc tac gac ggc    144
Leu Arg Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly
         35                  40                  45
cgt cag gcg tgg gtg gtg acc aag cac gag gcc gcg cgc aaa ctg ctc    192
Arg Gln Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu
     50                  55                  60
ggc gac ccc cgg ctg tcc tcc aac cgg acg gac gac aac ttc ccc gcc    240
Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala
 65                  70                  75                  80
acg tca ccg cgc ttc gag gcc gtc cgg gag agc ccg cag gcg ttc atc    288
Thr Ser Pro Arg Phe Glu Ala Val Arg Glu Ser Pro Gln Ala Phe Ile
                 85                  90                  95
ggc ctg gac ccg ccc gag cac ggc acc cgg cgg cgg atg acg atc agc    336
Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr Ile Ser
            100                 105                 110
gag ttc acc gtc aag cgg atc aag ggc atg cgc ccc gag gtc gag gag    384
Glu Phe Thr Val Lys Arg Ile Lys Gly Met Arg Pro Glu Val Glu Glu
        115                 120                 125
gtg gtg cac ggc ttc ctc gac gag atg ctg gcc gcc ggc ccg acc gcc    432
Val Val His Gly Phe Leu Asp Glu Met Leu Ala Ala Gly Pro Thr Ala
    130                 135                 140
gac ctg gtc agt cag ttc gcg ctg ccg gtg ccc tcc atg gtg atc tgc    480
Asp Leu Val Ser Gln Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys
145                 150                 155                 160
cga ctc ctc ggc gtg ccc tac gcc gac cac gag ttc ttc cag gac gcg    528
Arg Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Gln Asp Ala
                165                 170                 175
agc aag cgg ctg gtg cag tcc acg gac gcg cag agc gcg ctc acc gcg    576
Ser Lys Arg Leu Val Gln Ser Thr Asp Ala Gln Ser Ala Leu Thr Ala
            180                 185                 190
cgg aac gac ctc gcg ggt tac ctg gac ggc ctc atc acc cag ttc cag    624
Arg Asn Asp Leu Ala Gly Tyr Leu Asp Gly Leu Ile Thr Gln Phe Gln
        195                 200                 205
acc gaa ccg ggc gcg ggc ctg gtg ggc gct ctg gtc gcc gac cag ctg    672
Thr Glu Pro Gly Ala Gly Leu Val Gly Ala Leu Val Ala Asp Gln Leu
    210                 215                 220
gcc aac ggc gag atc gac cgt gag gaa ctg atc tcc acc gcg atg ctg    720
Ala Asn Gly Glu Ile Asp Arg Glu Glu Leu Ile Ser Thr Ala Met Leu
225                 230                 235                 240
ctc ctc atc gcc ggc cac gag acc acg gcc tcg atg acc tcc ctc agc     768
Leu Leu Ile Ala Gly His Glu Thr Thr Ala Ser Met Thr Ser Leu Ser
                245                 250                 255
gtg atc acc ctg ctg gac cac ccc gag cag tac gcc gcc ctg cgc gcc     816
Val Ile Thr Leu Leu Asp His Pro Glu Gln Tyr Ala Ala Leu Arg Ala
            260                 265                 270
gac cgc agc ctc gtg ccc ggc gcg gtg gag gaa ctg ctc cgc tac ctc     864
Asp Arg Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg Tyr Leu
        275                 280                 285
gcc atc gcc gac atc gcg ggc ggc cgc gtc gcc acg gcg gac atc gag     912
Ala Ile Ala Asp Ile Ala Gly Gly Arg Val Ala Thr Ala Asp Ile Glu
    290                 295                 300
gtc gag ggg cag ctc atc cgg gcc ggc gag ggc gtg atc gtc gtc aac     960
Val Glu Gly Gln Leu Ile Arg Ala Gly Glu Gly Val Ile Val Val Asn
305                 310                 315                 320
tcg ata gcc aac cgg gac ggc acg gtg tac gag gac ccg gac gcc ctc    1008
Ser Ile Ala Asn Arg Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu
                325                 330                 335
gac atc cac cgc tcc gcg cgc cac cac ctc gcc ttc ggc ttc ggc gtg    1056
Asp Ile His Arg Ser Ala Arg His His Leu Ala Phe Gly Phe Gly Val
            340                 345                 350
cac cag tgc ctg ggc cag aac ctc gcc cgg ctg gag ctg gag gtc atc    1104
His Gln Cys Leu Gly Gln Asn Leu Ala Arg Leu Glu Leu Glu Val Ile
        355                 360                 365
ctc aac gcc ctc atg gac cgc gtc ccg acg ctg cga ctg gcc gtc ccc    1152
Leu Asn Ala Leu Met Asp Arg Val Pro Thr Leu Arg Leu Ala Val Pro
    370                 375                 380
gtc gag cag ttg gtg ctg cgg ccg ggt acg acg atc cag ggc gtc aac    1200
Val Glu Gln Leu Val Leu Arg Pro Gly Thr Thr Ile Gln Gly Val Asn
385                 390                 395                 400
gaa ctc ccg gtc acc tgg tga                                        1221
Glu Leu Pro Val Thr Trp
                405
<210>85
<211>1451
<212>DNA
<213>浅灰链霉菌(Streptmyces griseolus)ATCC 11796
<220>
<221>CDS
<222>(1)..(1221)
<220>
<221>CDS
<222>(1242)..(1451)
<400>85
atg acc gat acc gcc acg acg ccc cag acc acg gac gca ccc gcc ttc      48
Met Thr Asp Thr Ala Thr Thr Pro Gln Thr Thr Asp Ala Pro Ala Phe
  1               5                  10                 15
ccg agc aac cgg agc tgt ccc tac cag tta ccg gac ggc tac gcc cag      96
Pro Ser Asn Arg Ser Cys Pro Tyr Gln Leu Pro Asp Gly Tyr Ala Gln
             20                  25                  30
ctc cgg gac acc ccc ggc ccc ctg cac cgg gtg acg ctc tac gac ggc     144
Leu Arg Asp Thr Pro Gly Pro Leu His Arg Val Thr Leu Tyr Asp Gly
         35                  40                  45
cgt cag gcg tgg gtg gtg acc aag cac gag gcc gcg cgc aaa ctg ctc     192
Arg Gln Ala Trp Val Val Thr Lys His Glu Ala Ala Arg Lys Leu Leu
     50                  55                  60
ggc gac ccc cgg ctg tcc tcc aac cgg acg gac gac aac ttc ccc gcc    240
Gly Asp Pro Arg Leu Ser Ser Asn Arg Thr Asp Asp Asn Phe Pro Ala
 65                  70                  75                  80
acg tca ccg cgc ttc gag gcc gtc cgg gag agc ccg cag gcg ttc atc    288
Thr Ser Pro Arg Phe Glu Ala Val Arg Glu Ser Pro Gln Ala Phe Ile
                 85                  90                  95
ggc ctg gac ccg ccc gag cac ggc acc cgg cgg cgg atg acg atc agc    336
Gly Leu Asp Pro Pro Glu His Gly Thr Arg Arg Arg Met Thr Ile Ser
            100                 105                 110
gag ttc acc gtc aag cgg atc aag ggc atg cgc ccc gag gtc gag gag    384
Glu Phe Thr Val Lys Arg Ile Lys Gly Met Arg Pro Glu Val Glu Glu
        115                 120                 125
gtg gtg cac ggc ttc ctc gac gag atg ctg gcc gcc ggc ccg acc gcc    432
Val Val His Gly Phe Leu Asp Glu Met Leu Ala Ala Gly Pro Thr Ala
    130                 135                 140
gac ctg gtc agt cag ttc gcg ctg ccg gtg ccc tcc atg gtg atc tgc    480
Asp Leu Val Ser Gln Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys
145                 150                 155                 160
cga ctc ctc ggc gtg ccc tac gcc gac cac gag ttc ttc cag gac gcg    528
Arg Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Gln Asp Ala
                165                 170                 175
agc aag cgg ctg gtg cag tcc acg gac gcg cag agc gcg ctc acc gcg    576
Ser Lys Arg Leu Val Gln Ser Thr Asp Ala Gln Ser Ala Leu Thr Ala
            180                 185                 190
cgg aac gac ctc gcg ggt tac ctg gac ggc ctc atc acc cag ttc cag    624
Arg Asn Asp Leu Ala Gly Tyr Leu Asp Gly Leu Ile Thr Gln Phe Gln
        195                 200                 205
acc gaa ccg ggc gcg ggc ctg gtg ggc gct ctg gtc gcc gac cag ctg    672
Thr Glu Pro Gly Ala Gly Leu Val Gly Ala Leu Val Ala Asp Gln Leu
    210                 215                 220
gcc aac ggc gag atc gac cgt gag gaa ctg atc tcc acc gcg atg ctg    720
Ala Asn Gly Glu Ile Asp Arg Glu Glu Leu Ile Ser Thr Ala Met Leu
225                 230                 235                 240
ctc ctc atc gcc ggc cac gag acc acg gcc tcg atg acc tcc ctc agc    768
Leu Leu Ile Ala Gly His Glu Thr Thr Ala Ser Met Thr Ser Leu Ser
                245                 250                 255
gtg atc acc ctg ctg gac cac ccc gag cag tac gcc gcc ctg cgc gcc    816
Val Ile Thr Leu Leu Asp His Pro Glu Gln Tyr Ala Ala Leu Arg Ala
            260                 265                 270
gac cgc agc ctc gtg ccc ggc gcg gtg gag gaa ctg ctc cgc tac ctc    864
Asp Arg Ser Leu Val Pro Gly Ala Val Glu Glu Leu Leu Arg Tyr Leu
        275                 280                 285
gcc atc gcc gac atc gcg ggc ggc cgc gtc gcc acg gcg gac atc gag    912
Ala Ile Ala Asp lle Ala Gly Gly Arg Val Ala Thr Ala Asp Ile Glu
    290                 295                 300
gtc gag ggg cag ctc atc cgg gcc ggc gag ggc gtg atc gtc gtc aac    960
Val Glu Gly Gln Leu Ile Arg Ala Gly Glu Gly Val Ile Val Val Asn
305                 310                 315                 320
tcg ata gcc aac cgg gac ggc acg gtg tac gag gac ccg gac gcc ctc   1008
Ser Ile Ala Asn Arg Asp Gly Thr Val Tyr Glu Asp Pro Asp Ala Leu
                325                 330                 335
gac atc cac cgc tcc gcg cgc cac cac ctc gcc ttc ggc ttc ggc gtg   1056
Asp Ile His Arg Ser Ala Arg His His Leu Ala Phe Gly Phe Gly Val
            340                 345                 350
cac cag tgc ctg ggc cag aac ctc gcc cgg ctg gag ctg gag gtc atc   1104
His Gln Cys Leu Gly Gln Asn Leu Ala Arg Leu Glu Leu Glu Val Ile
        355                 360                 365
ctc aac gcc ctc atg gac cgc gtc ccg acg ctg cga ctg gcc gtc ccc    1152
Leu Asn Ala Leu Met Asp Arg Val Pro Thr Leu Arg Leu Ala Val Pro
    370                 375                 380
gtc gag cag ttg gtg ctg cgg ccg ggt acg acg atc cag ggc gtc aac    1200
Val Glu Gln Leu Val Leu Arg Pro Gly Thr Thr Ile Gln Gly Val Asn
385                 390                 395                 400
gaa ctc ccg gtc acc tgg tga cgggggagag gggcaaggac atg acc atg cgg  1253
Glu Leu Pro Val Thr Trp                           Met Thr Met Arg
                405                                 1
gtg agt gcg gat cgg acg gtc tgc gtc ggt gcc ggg ctg tgt gcg ctg    1301
Val Ser Ala Asp Arg Thr Val Cys Val Gly Ala Gly Leu Cys Ala Leu
  5                  10                  15                  20
acg gcg ccg ggc gtc ctc gac cag gac gac gac ggg atc gtc acg gtg    1349
Thr Ala Pro Gly Val Leu Asp Gln Asp Asp Asp Gly Ile Val Thr Val
                 25                  30                  35
ctg acg gcc gaa ccc gcc gcc gac gac gac cgg cgc acc gcg cgc gag    1397
Leu Thr Ala Glu Pro Ala Ala Asp Asp Asp Arg Arg Thr Ala Arg Glu
             40                  45                  50
gcc ggc cat ctc tgt ccg tcc ggt gcg gtc cgc gtc gtc gag gac acg    1445
Ala Gly His Leu Cys Pro Ser Gly Ala Val Arg Val Val Glu Asp Thr
         55                  60                  65
gaa tag                                                            1451
Glu
 69
<210>86
<211>37
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>86
gaaagcttag aggatccaaa tggcttcctc aatgatc                             37
<210>87
<211>38
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>87
cgaggtaccg caagtaggaa agagtcatga acttcttc                            38
<210>88
<211>248
<212>DNA
<213>Glycine max(L.)Merrill
<220>
<221>CDS
<222>(20)..(220)
<400>88
gaaagcttag aggatccaa atg gct tcc tca atg atc tcc tcc cca gct gtt     52
                     Met Ala Ser Ser Met Ile Ser Ser Pro Ala Val
                       1               5                  10
acc acc gtc aac cgt gcc ggt gcc ggc atg gtt gct cca ttc acc ggc     100
Thr Thr Val Asn Arg Ala Gly Ala Gly Met Val Ala Pro Phe Thr Gly
             15                  20                  25
ctc aaa tcc atg gct ggc ttc ccc acg agg aag acc aac aat gac att     148
Leu Lys Ser Met Ala Gly Phe Pro Thr Arg Lys Thr Asn Asn Asp Ile
         30                  35                  40
acc tcc att gct agc aac ggt gga aga gta caa tgc atg cag gtg tgg    196
Thr Ser Ile Ala Ser Asn Gly Gly Arg Val Gln Cys Met Gln Val Trp
     45                  50                  55
cca cca att ggc aag aag aag ttc atgactcttt cctacttgcg gtacctcg     248
Pro Pro Ile Gly Lys Lys Lys Phe
 60                  65
<210>89
<211>9
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>89
gcggccgcg                                                            9
<210>90
<211>13
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>90
aattcgcggc cgc                                                      13
<210>91
<211>13
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>91
agcttgcggc cgc                                                      13
<210>92
<211>11
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>92
tagcggccgc a                                                        11
<210>93
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>93
tcatgcatga cagacatgac ggatacggca                                    30
<210>94
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>94
ggagctccta ccaggccacg ggcagatcca                                     30
<210>95
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>95
ggagctctca cggtcgcgcg gtttccgag a                                    30
<210>96
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>96
tctttcatga cagacatgac ggatacggca                                     30
<210>97
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>97
ggagctctca cggtcgcgcg gtttccgag a                                    30
<210>98
<211>19
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>98
agcttgcggc cgcgaattc                                                 19
<210>99
<211>19
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>99
agctgaattc gcggccgca                                                 19
<210>100
<211>35
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>100
ccaagcttgc atgccggcat cttctgaagc tctga                               35
<210>101
<211>35
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>101
gaagcttggt acctcaccaa gtgaccatca gttcg                               35
<210>102
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>102
aatgcatgac cgaagccatc gcgtatttc                                      29
<210>103
<211>24
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>103
ggggtaccgc ggctaccagg ccag                                           24
<210>104
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>104
aactcatgac cgaagccatc gcgtatttc                                      29
<210>105
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>105
ggtccacata tgcacatcga catcgacacg                                     30
<210>106
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>106
agagtccata tgaggatcca ggcggacgtg                                     30
<210>107
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>107
ggttttcata tgcggatcac catcgacacc                                     30
<210>108
<211>411
<212>PRT
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<400>108
Met Thr Gln Ser Ala Asp Ala Val Pro Glu Ala Glu Ala Pro Pro Val
1                 5                  10                  15
Gln Phe Pro Leu Arg Arg Thr Cys Pro Phe Ala Glu Pro Pro Glu Tyr
             20                  25                  30
Ala Gly Leu Arg Ala Asp Thr Pro Val Ala Arg Ala Ala Leu Lys Val
         35                  40                  45
Asn Gly Lys Pro Ala Trp Leu Val Thr Arg His Glu His Val Arg Gln
     50                  55                  60
Val Leu Gly Asp Ser Arg Val Ser Ser Asn Leu Lys Leu Pro Gly Tyr
65                  70                  75                  80
Pro His Gln Phe His Ile Pro Glu Glu Leu Leu Ala Gln Val Arg Leu
                 85                  90                  95
Met Met Leu Asn Met Asp Pro Pro Glu His Thr Ala His Arg Arg Met
            100                 105                 110
Leu Ile Pro Glu Phe Thr Ala Arg Arg Val Arg Glu Leu Arg Pro Arg
        115                 120                 125
Ile Gln Gln Ile Val Asp Glu His Val Asp Ala Met Leu Ala Ala Gly
    130                 135                 140
Gly Pro Val Asp Leu Val Thr Ala Leu Ala Leu Pro Val Pro Ser Leu
145                 150                 155                 160
Val Ile Cys Glu Leu Leu Gly Val Pro Tyr Glu Asp His Ala Arg Phe
                165                 170                 175
Glu Glu Trp Ser Ala Ala Leu Met Asn His Asp Leu Ser Pro Gln Glu
            180                 185                 190
Tyr Gly Ala Ala Val Gln Ala Leu Asp Thr Tyr Leu Asp Gln Leu Val
        195                 200                 205
Thr Leu Lys Glu Asn Glu Pro Gly Asp Asp Leu Ile Ser Arg Phe Leu
    210                 215                 220
Glu Lys Asn Arg Thr Glu Arg Val Ala Asp His Thr Asp Val Val Thr
225                 230                 235                 240
Met Ala Arg Leu Met Leu Val Gly Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
Ile Ala Leu Gly Val Leu Ala Leu Leu Arg His Pro Glu Gln Met Ala
            260                 265                 270
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Asn Ala Val Glu Glu Leu
        275                 280                 285
Leu Arg Val Phe Ser Ile Ser Asp Ser Gly Thr Ala Arg Val Ala Val
    290                 295                 300
Ala Asp Ile Glu Val Gly Asp Val Thr Ile Arg Ala Gly Glu Gly Ile
305                 310                 315                 320
Leu Ala Leu Asn Asn Ala Ala Asp His Asp Glu Ser Val Phe Pro Asp
                325                 330                 335
Pro Asp Thr Leu Asp Ile His Arg Lys Glu Ala Arg Ser His Leu Ala
            340                 345                 350
Phe Gly Tyr Gly Val His Gln Cys Ile Gly Ala Asn Leu Ala Arg Ala
        355                 360                 365
Glu Leu Glu Ala Val Tyr Gly Thr Leu Leu Arg Arg Val Pro Gly Leu
    370                 375                 380
Arg Leu Ala Ala Glu Pro Glu Asp Leu Arg Phe Lys Asp Asp Ala Met
385                 390                 395                 400
Val Tyr Gly Val Tyr Glu Leu Pro Val Thr Trp
                405                 410
<210>109
<211>1236
<212>DNA
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<220>
<221>CDS
<222>(1)..(1236)
<400>109
atg acc cag tcc gcc gac gcc gta ccc gag gcg gaa gca ccg ccg gtg     48
Met Thr Gln Ser Ala Asp Ala Val Pro Glu Ala Glu Ala Pro Pro Val
  1               5                  10                  15
cag ttc ccc ctg cgg cgc acc tgt ccg ttc gcc gag ccg ccc gag tac     96
Gln Phe Pro Leu Arg Arg Thr Cys Pro Phe Ala Glu Pro Pro Glu Tyr
             20                  25                  30
gcc ggg ctg cgc gcc gac aca ccc gtc gcc cgc gcc gcc ctg aaa gtg    144
Ala Gly Leu Arg Ala Asp Thr Pro Val Ala Arg Ala Ala Leu Lys Val
         35                  40                  45
aac ggc aag ccg gcc tgg ctg gtc acc cgg cac gag cac gtc cgg cag    192
Asn Gly Lys Pro Ala Trp Leu Val Thr Arg His Glu His Val Arg Gln
     50                  55                  60
gtg ctg ggc gac agc cgg gtc agc tcc aac ctc aaa ctg ccg ggc tat    240
Val Leu Gly Asp Ser Arg Val Ser Ser Asn Leu Lys Leu Pro Gly Tyr
 65                  70                  75                  80
ccc cac cag ttc cac atc ccc gag gaa ctg ctg gcg cag gtc cgg ctg    288
Pro His Gln Phe His Ile Pro Glu Glu Leu Leu Ala Gln Val Arg Leu
                 85                  90                  95
atg atg ctg aac atg gac ccg ccg gaa cac acc gcc cac cgg cgc atg    336
Met Met Leu Asn Met Asp Pro Pro Glu His Thr Ala His Arg Arg Met
            100                 105                 110
ctg ata ccg gag ttc acg gcc cgc cgg gtg cgg gag ttg cgc ccg cgg    384
Leu Ile Pro Glu Phe Thr Ala Arg Arg Val Arg Glu Leu Arg Pro Arg
        115                 120                 125
atc cag cag atc gtg gac gag cac gtg gac gcg atg ctg gcc gcg ggc    432
Ile Gln Gln Ile Val Asp Glu His Val Asp Ala Met Leu Ala Ala Gly
    130                 135                 140
ggc ccg gtg gac ctg gtc acc gcc ctc gcg ctg ccg gtg ccc tcg ctg    480
Gly Pro Val Asp Leu Val Thr Ala Leu Ala Leu Pro Val Pro Ser Leu
145                 150                 155                 160
gtg atc tgc gaa ctg ctc ggc gtg ccc tac gag gac cac gcg cgg ttc    528
Val Ile Cys Glu Leu Leu Gly Val Pro Tyr Glu Asp His Ala Arg Phe
                165                 170                 175
gag gag tgg tcg gcg gcg ctg atg aac cac gat ctg agc ccg cag gag    576
Glu Glu Trp Ser Ala Ala Leu Met Asn His Asp Leu Ser Pro Gln Glu
            180                 185                 190
tac ggg gcg gcc gtg cag gcc ctg gac acg tac ctc gac cag ctc gtc    624
Tyr Gly Ala Ala Val Gln Ala Leu Asp Thr Tyr Leu Asp Gln Leu Val
        195                 200                 205
acc ctg aag gag aac gag ccg ggc gac gac ctc atc agc cgc ttc ctg    672
Thr Leu Lys Glu Asn Glu Pro Gly Asp Asp Leu Ile Ser Arg Phe Leu
    210                 215                 220
gag aag aac cgc acc gag cgg gtc gcc gac cac acc gat gtg gtg acg    720
Glu Lys Asn Arg Thr Glu Arg Val Ala Asp His Thr Asp Val Val Thr
225                 230                 235                 240
atg gcc cgg ctg atg ctg gtc ggc ggc cac gag acc acc gcc aac atg    768
Met Ala Arg Leu Met Leu Val Gly Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc gcc ctc ggg gtg ctg gcc ctg ctg cgg cac ccg gag cag atg gcc    816
Ile Ala Leu Gly Val Leu Ala Leu Leu Arg His Pro Glu Gln Met Ala
            260                 265                 270
gag ttg cgg gcc gat ccg gcc ctg ctg ccg aac gcc gtg gag gag ttg    864
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Asn Ala Val Glu Glu Leu
        275                 280                 285
ctg cgc gtc ttc tcc atc tcc gac tcc ggc acc gcc cgg gtc gcg gtg    912
Leu Arg Val Phe Ser Ile Ser Asp Ser Gly Thr Ala Arg Val Ala Val
    290                 295                 300
gcg gac atc gag gtc ggt gac gtc acc atc cgc gcg ggt gag ggc atc    960
Ala Asp Ile Glu Val Gly Asp Val Thr Ile Arg Ala Gly Glu Gly Ile
305                 310                 315                 320
ctc gcc ctg aac aac gcg gcc gac cac gac gag tcg gtc ttc ccg gac   1008
Leu Ala Leu Asn Asn Ala Ala Asp His Asp Glu Ser Val Phe Pro Asp
                325                 330                 335
ccg gac acc ctc gac atc cac cgc aag gag gcc cgc tcc cac ctg gcc   1056
Pro Asp Thr Leu Asp Ile His Arg Lys Glu Ala Arg Ser His Leu Ala
            340                 345                 350
ttc ggc tac ggc gtc cac cag tgc atc ggc gcc aac ctc gcc cgg gcg   1104
Phe Gly Tyr Gly Val His Gln Cys Ile Gly Ala Asn Leu Ala Arg Ala
        355                 360                 365
gag ctg gag gcg gtc tac ggc acg ctg ctg cgc cgc gtc ccc ggc ctg   1152
Glu Leu Glu Ala Val Tyr Gly Thr Leu Leu Arg Arg Val Pro Gly Leu
    370                 375                 380
cgg ctg gcc gcc gag ccg gag gac ctg cgg ttc aag gac gac gcc atg   1200
Arg Leu Ala Ala Glu Pro Glu Asp Leu Arg Phe Lys Asp Asp Ala Met
385                 390                 395                 400
gtc tac ggc gtc tac gaa ctc ccc gtc acc tgg tga                   1236
Val Tyr Gly Val Tyr Glu Leu Pro Val Thr Trp
                405                 410
<210>110
<211>1454
<212>DNA
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<220>
<221>CDS
<222>(1)..(1236)
<220>
<221>CDS
<222>(1263)..(1454)
<400>110
atg acc cag tcc gcc gac gcc gta ccc gag gcg gaa gca ccg ccg gtg     48
Met Thr Gln Ser Ala Asp Ala Val Pro Glu Ala Glu Ala Pro Pro Val
  1               5                  10                  15
cag ttc ccc ctg cgg cgc acc tgt ccg ttc gcc gag ccg ccc gag tac     96
Gln Phe Pro Leu Arg Arg Thr Cys Pro Phe Ala Glu Pro Pro Glu Tyr
             20                  25                  30
gcc ggg ctg cgc gcc gac aca ccc gtc gcc cgc gcc gcc ctg aaa gtg    144
Ala Gly Leu Arg Ala Asp Thr Pro Val Ala Arg Ala Ala Leu Lys Val
         35                  40                  45
aac ggc aag ccg gcc tgg ctg gtc acc cgg cac gag cac gtc cgg cag    192
Asn Gly Lys Pro Ala Trp Leu Val Thr Arg His Glu His Val Arg Gln
     50                  55                  60
gtg ctg ggc gac agc cgg gtc agc tcc aac ctc aaa ctg ccg ggc tat    240
Val Leu Gly Asp Ser Arg Val Ser Ser Asn Leu Lys Leu Pro Gly Tyr
 65                  70                  75                  80
ccc cac cag ttc cac atc ccc gag gaa ctg ctg gcg cag gtc cgg ctg    288
Pro His Gln Phe His Ile Pro Glu Glu Leu Leu Ala Gln Val Arg Leu
                 85                  90                  95
atg atg ctg aac atg gac ccg ccg gaa cac acc gcc cac cgg cgc atg    336
Met Met Leu Asn Met Asp Pro Pro Glu His Thr Ala His Arg Arg Met
            100                 105                 110
ctg ata ccg gag ttc acg gcc cgc cgg gtg cgg gag ttg cgc ccg cgg    384
Leu Ile Pro Glu Phe Thr Ala Arg Arg Val Arg Glu Leu Arg Pro Arg
        115                 120                 125
atc cag cag atc gtg gac gag cac gtg gac gcg atg ctg gcc gcg ggc    432
Ile Gln Gln Ile Val Asp Glu His Val Asp Ala Met Leu Ala Ala Gly
    130                 135                 140
ggc ccg gtg gac ctg gtc acc gcc ctc gcg ctg ccg gtg ccc tcg ctg    480
Gly Pro Val Asp Leu Val Thr Ala Leu Ala Leu Pro Val Pro Ser Leu
145                 150                 155                 160
gtg atc tgc gaa ctg ctc ggc gtg ccc tac gag gac cac gcg cgg ttc    528
Val Ile Cys Glu Leu Leu Gly Val Pro Tyr Glu Asp His Ala Arg Phe
                165                 170                 175
gag gag tgg tcg gcg gcg ctg atg aac cac gat ctg agc ccg cag gag     576
Glu Glu Trp Ser Ala Ala Leu Met Asn His Asp Leu Ser Pro Gln Glu
            180                 185                 190
tac ggg gcg gcc gtg cag gcc ctg gac acg tac ctc gac cag ctc gtc     624
Tyr Gly Ala Ala Val Gln Ala Leu Asp Thr Tyr Leu Asp Gln Leu Val
        195                 200                 205
acc ctg aag gag aac gag ccg ggc gac gac ctc atc agc cgc ttc ctg     672
Thr Leu Lys Glu Asn Glu Pro Gly Asp Asp Leu Ile Ser Arg Phe Leu
    210                 215                 220
gag aag aac cgc acc gag cgg gtc gcc gac cac acc gat gtg gtg acg     720
Glu Lys Asn Arg Thr Glu Arg Val Ala Asp His Thr Asp Val Val Thr
225                 230                 235                 240
atg gcc cgg ctg atg ctg gtc ggc ggc cac gag acc acc gcc aac atg     768
Met Ala Arg Leu Met Leu Val Gly Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc gcc ctc ggg gtg ctg gcc ctg ctg cgg cac ccg gag cag atg gcc     816
Ile Ala Leu Gly Val Leu Ala Leu Leu Arg His Pro Glu Gln Met Ala
            260                 265                 270
gag ttg cgg gcc gat ccg gcc ctg ctg ccg aac gcc gtg gag gag ttg     864
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Asn Ala Val Glu Glu Leu
        275                 280                 285
ctg cgc gtc ttc tcc atc tcc gac tcc ggc acc gcc cgg gtc gcg gtg     912
Leu Arg Val Phe Ser Ile Ser Asp Ser Gly Thr Ala Arg Val Ala Val
    290                 295                 300
gcg gac atc gag gtc ggt gac gtc acc atc cgc gcg ggt gag ggc atc     960
Ala Asp Ile Glu Val Gly Asp Val Thr Ile Arg Ala Gly Glu Gly Ile
305                 310                 315                 320
ctc gcc ctg aac aac gcg gcc gac cac gac gag tcg gtc ttc ccg gac    1008
Leu Ala Leu Asn Asn Ala Ala Asp His Asp Glu Ser Val Phe Pro Asp
                325                 330                 335
ccg gac acc ctc gac atc cac cgc aag gag gcc cgc tcc cac ctg gcc    1056
Pro Asp Thr Leu Asp Ile His Arg Lys Glu Ala Arg Ser His Leu Ala
            340                 345                 350
ttc ggc tac ggc gtc cac cag tgc atc ggc gcc aac ctc gcc cgg gcg    1104
Phe Gly Tyr Gly Val His Gln Cys Ile Gly Ala Asn Leu Ala Arg Ala
        355                 360                 365
gag ctg gag gcg gtc tac ggc acg ctg ctg cgc cgc gtc ccc ggc ctg    1152
Glu Leu Glu Ala Val Tyr Gly Thr Leu Leu Arg Arg Val Pro Gly Leu
    370                 375                 380
cgg ctg gcc gcc gag ccg gag gac ctg cgg ttc aag gac gac gcc atg    1200
Arg Leu Ala Ala Glu Pro Glu Asp Leu Arg Phe Lys Asp Asp Ala Met
385                 390                 395                 400
gtc tac ggc gtc tac gaa ctc ccc gtc acc tgg tga cggccgacgc gaacgg  1252
Val Tyr Gly Val Tyr Glu Leu Pro Val Thr Trp
                405                 410
actgcccctg atg cgt gtc tcc gcc gaa cgc gac cgg tgc gtg ggc tcc     1301
           Met Arg Val Ser Ala Glu Arg Asp Arg Cys Val Gly Ser
             1               5                  10
ggc cag tgc gcg ctg ctg agc ccc gag gtg ttc gac cag gac gcc gac    1349
Gly Gln Cys Ala Leu Leu Ser Pro Glu Val Phe Asp Gln Asp Ala Asp
     15                  20                  25
ggc ctg gtc acc ctg ctg agc gag gag ccg gcc gag gag ctg cgc gag    1397
Gly Leu Val Thr Leu Leu Ser Glu Glu Pro Ala Glu Glu Leu Arg Glu
 30                  35                  40                  45
cag gtc gct cag gcc gcg gac ctg tgc ccg tcc cgc tcg atc cgc gtg    1445
Gln Val Ala Gln Ala Ala Asp Leu Cys Pro Ser Arg Ser Ile Arg Val
                  50                  55                  60
cac gac tga                                                       1454
His Asp
<210>111
<211>63
<212>PRT
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<400>111
Met Arg Val Ser Ala Glu Arg Asp Arg Cys Val Gly Ser Gly Gln Cys
  1               5                  10                  15
Ala Leu Leu Ser Pro Glu Val Phe Asp Gln Asp Ala Asp Gly Leu Val
             20                  25                  30
Thr Leu Leu Ser Glu Glu Pro Ala Glu Glu Leu Arg Glu Gln Val Ala
         35                  40                  45
Gln Ala Ala Asp Leu Cys Pro Ser Arg Ser Ile Arg Val His Asp
     50                  55                  60
<210>112
<211>192
<212>DNA
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<220>
<221>CDS
<222>(1)..(192)
<400>112
atg cgt gtc tcc gcc gaa cgc gac cgg tgc gtg ggc tcc ggc cag tgc     48
Met Arg Val Ser Ala Glu Arg Asp Arg Cys Val Gly Ser Gly Gln Cys
  1               5                  10                  15
gcg ctg ctg agc ccc gag gtg ttc gac cag gac gcc gac ggc ctg gtc     96
Ala Leu Leu Ser Pro Glu Val Phe Asp Gln Asp Ala Asp Gly Leu Val
             20                  25                  30
acc ctg ctg agc gag gag ccg gcc gag gag ctg cgc gag cag gtc gct    144
Thr Leu Leu Ser Glu Glu Pro Ala Glu Glu Leu Arg Glu Gln Val Ala
         35                  40                  45
cag gcc gcg gac ctg tgc ccg tcc cgc tcg atc cgc gtg cac gac tga    192
Gln Ala Ala Asp Leu Cys Pro Ser Arg Ser Ile Arg Val His Asp
     50                  55                  60
<210>113
<211>20
<212>PRT
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<400>113
Met Thr Gln Ser Ala Asp Ala Val Pro Glu Ala Glu Ala Pro Pro Val
  1               5                  10                  15
Gln Phe Pro Leu
             20
<210>114
<211>23
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>114
gacgcsgtsc csgaggcsga agc                                            23
<210>115
<211>23
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>115
gaggcsccsc csgtscagtt ccc                                            23
<210>116
<211>25
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>116
tcggcgaacg gacaggtgcg ccgca                                          25
<210>117
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>117
ccctcgctgg tgat ctgcga actgctc                                       27
<210>118
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>118
agctcgtcac cctgaaggag aacgagc                                        27
<210>119
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>119
accatatgac ccagtccgcc gacgccgt                                       28
<210>120
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>120
gtaagctttc accaggtgac ggggagtt                                       28
<210>121
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>121
cgaagctttc agtcgtgcac gcggatcg                                       28
<210>122
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>122
ttcctggaga agaaccgcac cgagcgg                                        27
<210>123
<211>26
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>123
cacccggagc agatggccga gttgcg                                         26
<210>124
<211>26
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>124
tgmtcggcvt sgacgacccc gagcac                                         26
<210>125
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>125
cgctgccsgt gccstcsatg gtgatctg                                       28
<210>126
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>126
cgctgccggt gccgtcsctg gtgatctg                                       28
<210>127
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>127
ggcgtsccct acgccgacca cgagttcttc                                     30
<210>128
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>128
ggcgtsccct acgaggacca cgssttcttc                                     30
<210>129
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>129
aggcactggt gsacsccgaa sccgaagg                                       28
<210>130
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>130
cttcccccag gaccgcacct gccccttcca                                     30
<210>131
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>131
ggatcgtggc cagcgagatg gcctcctgcc                                     30
<210>132
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>132
tttccaggac cgcacctgcc cctaccaccc                                     30
<210>133
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>133
ggatcatcgc gagccggacc agatcctcgc                                     30
<210>134
<211>72
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>134
agctattttt taataaaatc aggaggaaaa aacatatgag caagcttggc tgttttggcg    60
gatgagagaa ga                                                        72
<210>135
<211>68
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>135
tcttctctca tccgccaaaa cagccaagct tgctcatatg ttttttcctc ctgattttat    60
taaaaaat                                                             68
<210>136
<211>402
<212>PRT
<213>热淡天蓝链霉菌(Streptmyces thermocoerulescens)IFO 14273t
<400>136
Met Thr Asp Met Thr Glu Thr Pro Thr Val Ala Phe Pro Gln Ser Arg
  1              5                   10                  15
Thr Cys Pro Tyr His Pro Pro Ala Ala Tyr Ala Pro Leu Arg Asp Thr
             20                  25                  30
Arg Pro Leu Ala Arg Ala Arg Leu Tyr Asp Gly Arg Leu Val Trp Thr
         35                  40                  45
Val Thr Gly His Gly Leu Ala Arg Thr Leu Leu Ala Asp Pro Arg Leu
     50                  55                  60
Ser Thr Asp Pro Thr Arg Pro Glu Phe Pro Ala Thr Thr Glu Arg Ile
 65                  70                  75                  80
Ala Arg Ile Arg Arg Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro
                 85                  90                  95
Glu His Arg Val Gln Arg Arg Met Met Val Pro Ser Phe Thr Leu Gln
            100                 105                 110
Arg Ala Thr Ala Leu Arg Pro Arg Ile Gln Arg Val Val Asp Glu Arg
        115                 120                 125
Leu Asp Ala Met Ile Ala Gly Gly Pro Pro Ala Asp Leu Val Thr Ala
    130                 135                 140
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
145                 150                 155                 160
Pro Tyr Glu Asp His Asp Phe Phe Glu Glu Gln Ser Arg Arg Leu Leu
                165                 170                 175
Arg Gly Pro Thr Ala Glu Asp Ser Met Asp Ala Arg Ala Arg Met Glu
            180                 185                 190
Ala Tyr Phe Asp Glu Leu Ile Asp Arg Lys Gln Arg Gln Asp Ala Pro
        195                 200                 205
Gly Asp Gly Val Leu Asp Glu Leu Val His Gln Arg Leu Ala Ala Gly
    210                 215                 220
Glu Leu Asp Arg Glu Gly Leu Ile Ala Met Ala Ile Ile Leu Leu Val
225                 230                 235                 240
Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr
                245                 250                 255
Leu Leu Gly His Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Asp
            260                 265                 270
Leu Val Pro Ala Ala Val Glu Glu Leu Leu Arg Met Leu Ser Ile Ala
        275                 280                 285
Asp Gly Leu Leu Arg Val Ala Val Glu Asp Ile Glu Val Ala Gly Glu
    290                 295                 300
Thr Ile Arg Ala Gly Asp Gly Val Ile Phe Ser Thr Ser Val Ile Asn
305                 310                 315                 320
Arg Asp Glu Ala Val Tyr Pro Glu Pro Asp Thr Leu Asp Leu His Arg
                325                 330                 335
Pro Ala Arg His His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu
            340                 345                 350
Gly Gln Asn Leu Ala Arg Ala Glu Met Glu Ile Ala Leu Arg Thr Leu
        355                 360                 365
Phe Gly Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Pro Glu Glu Ile
    370                 375                 380
Pro Phe Lys Pro Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val
385                 390                 395                 400
Thr Trp
<210>137
<211>409
<212>PRT
<213>球团产色链霉菌(Streptmyces glomerochromogenes)IFO 13673T
<400>137
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Gly Gln Ala Gln Pro
  1               5                  10                  15
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Ala
     50                  55                  60
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
Pro Val Pro Ser Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
Leu Leu Gly Leu Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
Gln Arg Ile Val Asp Glu Leu Leu Asp Asp Met Ile Ala Arg Gly Pro
    130                 135                 140
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Gly Gly Ala Asp Thr Leu
            180                 185                 190
Asp Ala Arg Asp Arg Leu Glu Ala Tyr Leu Gly Glu Leu Ile Asp Ala
        195                 200                 205
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Val Leu Asp Asp Leu Val
    210                 215                 220
His Asn Arg Leu Arg Ala Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
Glu Leu Arg Ala Asp Pro Thr Val Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Leu Ala Leu Glu
    290                 295                 300
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
Asp Asp Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
Gly Met Leu Glu Leu Pro Val Thr Trp
                405
<210>138
<211>409
<212>PRT
<213>橄榄产色链霉菌(Streptmyces olivochromogenes)IFO 12444
<400>138
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Gly Gln Ala Glu Pro
  1               5                  10                  15
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Ala
     50                  55                  60
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
Pro Val Pro Ser Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
Leu Leu Gly Leu Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
Gln Arg Ile Val Asp Glu Leu Leu Asp Asp Met Ile Ala Arg Gly Pro
    130                 135                 140
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Gly Gly Ala Asp Thr Leu
            180                 185                 190
Asp Ala Arg Asp Arg Leu Glu Ala Tyr Leu Gly Glu Leu Ile Asp Ala
        195                 200                 205
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Asp Leu Val
    210                 215                 220
His Asn Arg Leu Arg Ala Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
Glu Leu Arg Ala Asp Pro Thr Val Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
Asp Gly Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
Gly Met Leu Glu Leu Pro Val Thr Trp
                405
<210>139
<211>1230
<212>DNA
<213>黑胡桃链霉菌(Streptmyces nogalater)IFO 13445
<220>
<221>CDS
<222>(1)..(1230)
<400>139
atg acg gaa ctg acg gac acc acc ggc ccg gcc gac gcg gcc gaa ccc     48
Met Thr Glu Leu Thr Asp Thr Thr Gly Pro Ala Asp Ala Ala Glu Pro
  1               5                  10                  15
gtc gca ttc ccc cag gac cgc acc tgc ccc tac cac ccc ccg acc ggc     96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
tac gac ccg ctg cgc gac ggg cgg ccc ctg tcc cgg gtc acc ctc tac    144
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgt gag gtc tgg ctg gtc acc gcg cag gcc acc gcc cgc acc    192
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Thr
     50                  55                  60
ctg ctc gcc gac ccc cgg ctg tcc acc gac cgc cgc cgc gac ggc ttc    240
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
ccc gtg ccc acc ccc cgc ttc gag ggc gga cgc gac cgc aag ctg gcc    288
Pro Val Pro Thr Pro Arg Phe Glu Gly Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
ctg ctc gga ctg gac gac ccc gag cac cag cag cag cgc cgg atg ctg    336
Leu Leu Gly Leu Asp Asp Pro Glu His Gln Gln Gln Arg Arg Met Leu
            100                 105                 110
atc ccg tcg ttc acc gtg aaa cgc gcc acc gcg cta cgc ccc tgg atc    384
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
cag cgg atc gtc gac gga ctg ctg gac gcc atg atc acc cgg ggg ccg    432
Gln Arg Ile Val Asp Gly Leu Leu Asp Ala Met Ile Thr Arg Gly Pro
    130                 135                 140
gtc gcc gac ctc gtg tcc gcc ttc gcg ctg ccc gtg ccg tcc atg gtc    480
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc gaa ctg ctc ggc gtg ccc tac gcc gac cac gag ttc ttc gag    528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gag cag tcc cgc cga ctg ctg agc gcc tcg acc agc gcc gac acc ctg    576
Glu Gln Ser Arg Arg Leu Leu Ser Ala Ser Thr Ser Ala Asp Thr Leu
            180                 185                 190
gac gcc cgg gac cgg ctg gag acg tac ctc ggc gac ctg atc gac gcc    624
Asp Ala Arg Asp Arg Leu Glu Thr Tyr Leu Gly Asp Leu Ile Asp Ala
        195                 200                 205
aag gcc aag gag gcc gag ccc ggc gac ggc atc ctg gac gag ctc gtc    672
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Glu Leu Val
    210                 215                 220
cac aac cgg ctc cgc aag ggc gag ctg gac cgg acc gac ctg gtg tcg    720
His Asn Arg Leu Arg Lys Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
ctc gcc gtc atc ctg ctg gtc gcc ggg cac gag acg acc gcc aac atg    768
Leu Ala Val Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc tcc ctg ggc acc tac acg ctg ctc cag cac ccc gag cgc ctg gcc    816
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
gag ctg cgc gcc gac ccc gcg ctg ctg ccc gcc gtc gtc gag gaa ctg    864
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
ctg cgg atg ctg tcc atc gcc gag ggg ctg caa cgg gtg gcg ctg gag    912
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
gac atc gag atc gac ggc acc acc atc cgg gcc ggc gac ggc gtc ctc    960
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
ttc tcc acc tcg gtc atc aac cgg gac acg gcc gtc tac gac gac ccg   1008
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
gac gac ctg gac ttc cac cgc gcc gac cgg cac cac gtg gcg ttc ggc   1056
Asp Asp Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
ttc ggc atc cac cag tgc ctg ggc cag aac ctg gcc cgc gcg gaa ctg   1104
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
gag atc gct ctc ggc agc ctg ttc acc cgc ttg ccc ggg ctc cgt ctg   1152
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
gcc gta ccg gcg aag gac att ccc ttc aaa ccg ggc gac acg atc cag   1200
Ala Val Pro Ala Lys Asp Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
ggg atg ctg gaa ctc ccc gtg acc tgg taa                           1230
Gly Met Leu Glu Leu Pro Val Thr Trp
                405                 410
<210>140
<211>1278
<212>DNA
<213>津岛链霉菌(Streptmyces tsusimaensis)IFO 13782T
<220>
<221>CDS
<222>(1)..(1278)
<400>140
atg acg gaa tcc acg aca gat ccg acg acc cgc cag gcc ctc ggc tcc     48
Met Thr Glu Ser Thr Thr Asp Pro Thr Thr Arg Gln Ala Leu Gly Ser
  1               5                  10                  15
acc acc ccc gcc gct gcc acc gcg acc gcc atc gac ccg acc ctc gcg     96
Thr Thr Pro Ala Ala Ala Thr Ala Thr Ala Ile Asp Pro Thr Leu Ala
             20                  25                  30
aca ccc ttc ccg cag gac cgg ggg tgc ccg tac cac ccg ccc gcc ggg    144
Thr Pro Phe Pro Gln Asp Arg Gly Cys Pro Tyr His Pro Pro Ala Gly
         35                  40                  45
tac gcg ccg ctg cgt gag ggc cga ccg ctc agc agg gtc gcc ctc ttc    192
Tyr Ala Pro Leu Arg Glu Gly Arg Pro Leu Ser Arg Val Ala Leu Phe
     50                  55                  60
gac ggg cgc ccg gtc tgg gcg gtc acc gga cac gcc ctg gcc cgc cgg    240
Asp Gly Arg Pro Val Trp Ala Val Thr Gly His Ala Leu Ala Arg Arg
 65                  70                  75                  80
ttg ctg gcc gat cca cgg ctc tcc acc gac cgt acc cac ccg gac ttc    288
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Thr His Pro Asp Phe
                 85                  90                  95
ccc gcc ccg gcc ccg cgc ttc gcc aac gcg aac cgg cgc cgc gtg gcc    336
Pro Ala Pro Ala Pro Arg Phe Ala Asn Ala Asn Arg Arg Arg Val Ala
            100                 105                 110
ctg ctc ggc gtc gac gac ccc gag cac aac acc cag cgc aga atg ctc    384
Leu Leu Gly Val Asp Asp Pro Glu His Asn Thr Gln Arg Arg Met Leu
        115                 120                 125
atc ccg gcc ttc tcc gtg aag cgg atc aac gct ctc cgc ccc cgc atc    432
Ile Pro Ala Phe Ser Val Lys Arg Ile Asn Ala Leu Arg Pro Arg Ile
    130                 135                 140
cag gag acc gtg gac cgg ttg ctc gac gcg atg gag cgc cag ggg cca    480
Gln Glu Thr Val Asp Arg Leu Leu Asp Ala Met Glu Arg Gln Gly Pro
145                 150                 155                 160
ccg gcc gag ctg gtg agc gcg ttc gcc ctg ccg gtg ccg tcg atg gtg    528
Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
                165                 170                 175
atc tgc tcc ctg ctc gga gtg ccg tac gcc gac cac gag ttc ttc gag    576
Ile Cys Ser Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
            180                 185                 190
gag cgc tcg cgg cgg ctc ctg cgc ggc ccc ggc gcg gcc gac gtg gac    624
Glu Arg Ser Arg Arg Leu Leu Arg Gly Pro Gly Ala Ala Asp Val Asp
        195                 200                 205
agg gcc ctc gac gaa ctc gag gag tac ctc ggc gcg ctg atc gac cgc    672
Arg Ala Leu Asp Glu Leu Glu Glu Tyr Leu Gly Ala Leu Ile Asp Arg
    210                 215                 220
aag cgt acg gaa ccg ggc gac ggc ctc ctc gac gag ctg atc cac cgc    720
Lys Arg Thr Glu Pro Gly Asp Gly Leu Leu Asp Glu Leu Ile His Arg
225                 230                 235                 240
gac cac ccc ggc gga ccg gtc gac cgc gag gag ctg gtc tcg ttc gcc    768
Asp His Pro Gly Gly Pro Val Asp Arg Glu Glu Leu Val Ser Phe Ala
                245                 250                 255
gtg atc ctg ctc atc gcg ggg cac gag acg acg gcg aac atg atc tcg    816
Val Ile Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser
            260                 265                 270
ctc ggc acc ttc acc ctg ctg cgc cac ccc gaa cag ctc gcg gcg ctg    864
Leu Gly Thr Phe Thr Leu Leu Arg His Pro Glu Gln Leu Ala Ala Leu
        275                 280                 285
cgg gcc ggc ggg acg acc acg gcc gtg gcg gtc gag gaa ctg ttg cgg    912
Arg Ala Gly Gly Thr Thr Thr Ala Val Ala Val Glu Glu Leu Leu Arg
    290                 295                 300
ttc ctc tcc atc gcc gac ggc ctg cag cgg ctg gcg acc gag gac atc     960
Phe Leu Ser Ile Ala Asp Gly Leu Gln Arg Leu Ala Thr Glu Asp Ile
305                 310                 315                 320
gag gtg ccg gac gcc ggg gtg acg atc cgc aag ggc gaa ggt gtg gtc    1008
Glu Val Pro Asp Ala Gly Val Thr Ile Arg Lys Gly Glu Gly Val Val
                325                 330                 335
ttc tcg acc tcg ctc atc aac cgc gac gac ggc gtg ttc ccg cag ccc    1056
Phe Ser Thr Ser Leu Ile Asn Arg Asp Asp Gly Val Phe Pro Gln Pro
            340                 345                 350
gaa acg ctc gac tgg gac cgc ccg gcc cgt cac cat ctc gcc ttc ggc    1104
Glu Thr Leu Asp Trp Asp Arg Pro Ala Arg His His Leu Ala Phe Gly
        355                 360                 365
ttc ggc gta cac cag tgc ctg ggg cag aac ctg gcc cgc gcg gaa ctc    1152
Phe Gly Val His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
    370                 375                 380
gac atc gcg atg cgc acg ctc ttc gag cgg ctg ccg ggc ctc cgg ctc    1200
Asp Ile Ala Met Arg Thr Leu Phe Glu Arg Leu Pro Gly Leu Arg Leu
385                 390                 395                 400
gcc gta ccc gcg cag gag atc ccc cat aaa ccg ggg gac acg atc cag    1248
Ala Val Pro Ala Gln Glu Ile Pro His Lys Pro Gly Asp Thr Ile Gln
                405                 410                 415
ggc atg ctc gaa ctg ccc gtg gcc tgg tga                            1278
Gly Met Leu Glu Leu Pro Val Ala Trp
            420                 425
<210>141
<211>1209
<212>DNA
<213>热淡天蓝链霉菌(Streptmyces thermocoerulescens)IFO 14273t
<220>
<221>CDS
<222>(1)..(1209)
<400>141
atg acg gac atg acg gaa acc ccc acc gtc gcc ttt ccc cag agc cgg      48
Met Thr Asp Met Thr Glu Thr Pro Thr Val Ala Phe Pro Gln Ser Arg
  1               5                  10                  15
acc tgt ccg tac cac ccg ccc gcc gcc tac gcc ccg ctg cgc gac acc      96
Thr Cys Pro Tyr His Pro Pro Ala Ala Tyr Ala Pro Leu Arg Asp Thr
             20                  25                  30
cgc ccg ctg gcc cgc gcc cgt ctc tac gac ggc cgc ctc gtc tgg acg     144
Arg Pro Leu Ala Arg Ala Arg Leu Tyr Asp Gly Arg Leu Val Trp Thr
         35                  40                  45
gtc acc ggt cac ggc ctc gcc cgc acc ctg ctc gcc gac ccc cgc ctg     192
Val Thr Gly His Gly Leu Ala Arg Thr Leu Leu Ala Asp Pro Arg Leu
     50                  55                  60
tcc acc gac ccc acc cgg ccg gag ttc ccc gcc acc acg gaa cgc atc     240
Ser Thr Asp Pro Thr Arg Pro Glu Phe Pro Ala Thr Thr Glu Arg Ile
65                  70                  75                  80
gcc cgg atc cgg cgc cgc cgg acc gcc ctg ctg ggc gtc gac gac ccc     288
Ala Arg Ile Arg Arg Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro
                 85                  90                  95
gaa cac cgc gtc cag cgg cgc atg atg gtc ccc agc ttc acc ctc cag     336
Glu His Arg Val Gln Arg Arg Met Met Val Pro Ser Phe Thr Leu Gln
            100                 105                 110
cgc gcc acc gcg ctg cgc ccc cgg atc cag cgg gtc gtc gac gaa cgc     384
Arg Ala Thr Ala Leu Arg Pro Arg Ile Gln Arg Val Val Asp Glu Arg
        115                 120                 125
ctc gac gcg atg atc gcc ggc ggc ccg ccc gcc gat ctc gtc acc gcg    432
Leu Asp Ala Met Ile Ala Gly Gly Pro Pro Ala Asp Leu Val Thr Ala
    130                 135                 140
ttc gcg ctg ccg gtg ccg tcc atg gtg atc tgc gcc ctg ctc ggc gtg    480
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
145                 150                 155                 160
ccc tac gag gac cac gac ttc ttc gag gag cag tca cgc cgg ctg ctg    528
Pro Tyr Glu Asp His Asp Phe Phe Glu Glu Gln Ser Arg Arg Leu Leu
                165                 170                 175
cgc ggc ccg acg gcc gag gac tcc atg gac gcc cgc gcc cga atg gag    576
Arg Gly Pro Thr Ala Glu Asp Ser Met Asp Ala Arg Ala Arg Met Glu
            180                 185                 190
gcc tac ttc gac gag ctg atc gac cgc aag cag cgg cag gac gcg ccc    624
Ala Tyr Phe Asp Glu Leu Ile Asp Arg Lys Gln Arg Gln Asp Ala Pro
        195                 200                 205
ggt gac ggc gtc ctg gac gaa ctc gtc cac cag cgg ctg gcc gcg ggc    672
Gly Asp Gly Val Leu Asp Glu Leu Val His Gln Arg Leu Ala Ala Gly
    210                 215                 220
gag ctg gac cgc gag ggg ctc atc gcc atg gcg atc atc ctg ctc gtc    720
Glu Leu Asp Arg Glu Gly Leu Ile Ala Met Ala Ile Ile Leu Leu Val
225                 230                 235                 240
gcc ggt cac gag acg acc gcc aac atg atc tcg ctc ggc acc ttc acg    768
Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr
                245                 250                 255
ctg ctc ggg cac ccc gag cgg ctg gcc gag ctg cgc gcc gac ccg gac    816
Leu Leu Gly His Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Asp
            260                 265                 270
ctg gtg ccc gcg gcc gtc gag gag ctg ctg cgc atg ctg tcc atc gcg    864
Leu Val Pro Ala Ala Val Glu Glu Leu Leu Arg Met Leu Ser Ile Ala
        275                 280                 285
gac ggc ctg ctg cgc gtc gcc gtc gag gac atc gag gtg gcc ggg gag    912
Asp Gly Leu Leu Arg Val Ala Val Glu Asp Ile Glu Val Ala Gly Glu
    290                 295                 300
acg atc cgc gcg ggc gac ggc gtc atc ttc tcg acg tcg gtc atc aac    960
Thr Ile Arg Ala Gly Asp Gly Val Ile Phe Ser Thr Ser Val Ile Asn
305                 310                 315                 320
cgg gac gag gcc gtc tac ccc gaa ccc gac acc ctg gac ctg cac cgc   1008
Arg Asp Glu Ala Val Tyr Pro Glu Pro Asp Thr Leu Asp Leu His Arg
                325                 330                 335
ccg gcc cgg cac cac gtc gcc ttc ggg ttc ggc atc cac cag tgc ctc   1056
Pro Ala Arg His His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu
            340                 345                 350
ggg cag aac ctg gcc cgc gcc gag atg gag atc gcc ctg cgc acc ctg   1104
Gly Gln Asn Leu Ala Arg Ala Glu Met Glu Ile Ala Leu Arg Thr Leu
        355                 360                 365
ttc ggc cgc ctg ccc gga ctg cgt ctg gcg gtc ccc ccg gag gaa atc   1152
Phe Gly Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Pro Glu Glu Ile
    370                 375                 380
ccg ttc aaa ccc ggc gac acg atc cag ggg atg ctg gaa ctc ccc gtg   1200
Pro Phe Lys Pro Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val
385                 390                 395                 400
acc tgg taa                                                       1209
Thr Trp
<210>142
<211>1230
<213>球团产色链霉菌(Streptmyces glomerochromogenes)IFO 13673T
<220>
<221>CDS
<222>(1)..(1230)
<400>142
atg acg gaa ctg acg gac atc acc ggc ccg gct ggc cag gcc caa ccc     48
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Gly Gln Ala Gln Pro
  1               5                  10                  15
gtc gca ttc ccc cag gac cgc acc tgt ccc tac cac ccc ccc acc gga     96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
tac gac ccg ctg cgc gac ggg cga ccc ctg tcc cgc gtc acc ctc tac    144
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgc gag gtc tgg ctg gtc acc gcc cag gcc acc gcc cgc gcc    192
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Ala
     50                  55                  60
ctg ctc gcc gac ccc cgg ctg tcc acc gac cgc cgc cgc gac ggc ttt    240
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
ccc gtg ccc agc ccc cgc ttc gag gcc ggc cgc gac cgc aaa ctg gcc    288
Pro Val Pro Ser Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
ctg ctc ggg ctg gac gac ccc gag cac cac cag cag cgc cgg atg ctg    336
Leu Leu Gly Leu Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
atc ccg tcg ttc acc gtc aaa cgc gcc acc gcg cta cgc ccc tgg atc    384
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
cag cgg atc gtc gac gaa ctg ctg gac gac atg atc gcc cgg ggg ccg    432
Gln Arg Ile Val Asp Glu Leu Leu Asp Asp Met Ile Ala Arg Gly Pro
    130                 135                 140
gtc gcc gac ctc gtg tcc gcg ttc gcg ctg ccc gtg ccg tcc atg gtc    480
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc gaa ctg ctc ggc gtg ccc tac gcc gac cac gag ttc ttc gag    528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gaa cag tcc cgc cgg ctg ctg cgc ggc ccg ggc ggc gcc gac acc ctg    576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Gly Gly Ala Asp Thr Leu
            180                 185                 190
gac gcc cgg gac cgg ctg gag gcg tac ctc ggc gag ctg atc gac gcc    624
Asp Ala Arg Asp Arg Leu Glu Ala Tyr Leu Gly Glu Leu Ile Asp Ala
        195                 200                 205
aag gcc aag gag gcc gag ccc ggc gac ggc gtt ctg gac gac ctg gtc    672
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Val Leu Asp Asp Leu Val
    210                 215                 220
cac aac cgg ctc cgc gcg ggc gag ctg gac cgg acc gac ctg gtg tcg    720
His Asn Arg Leu Arg Ala Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
ctc gcc ctc atc ctg ctg gtc gcc ggg cac gag acg acc gcc aac atg    768
Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc tcc ctg ggc acc tac acc ctg ctc cag cac ccc gaa cgg ctg gcc    816
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
gag ctg cgt gcc gac ccc acg gtg ctg ccc gcc gtc gtc gag gaa ctg     864
Glu Leu Arg Ala Asp Pro Thr Val Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
ctg cgg atg ctg tcc atc gcc gag ggg ctg caa cgg ctg gcg ctg gag     912
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Leu Ala Leu Glu
    290                 295                 300
gac atc gag atc gac ggc acc acc atc cgg gcc ggt gac ggc gtc ctc     960
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
ttc tcc acc tcg gtc atc aac cgg gac acg gcc gtc tac gac gac ccc    1008
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
gac gac ctg gac ttc cac cgc gcc gac cgg cac cac gtg gcg ttc ggc    1056
Asp Asp Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
ttc ggc atc cac cag tgc ctg ggc cag aac ctg gcc cgc gcg gaa ctg    1104
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
gag atc gcc ctc ggc agc ctc ttc acc cgg ctg ccc ggg ctg cgt ctt    1152
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
gcc gcc ccg gcc gag gag atc ccc ttc aaa ccg ggc gac acg atc cag    1200
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
ggg atg ctg gaa ctc ccc gtg acc tgg taa                            1230
Gly Met Leu Glu Leu Pro Val Thr Trp
                405                 410
<210>143
<211>1230
<212>DNA
<213>橄榄产色链霉菌(Streptmyces olivochromogenes)IFO 12444
<220>
<221>CDS
<222>(1)..(1230)
<400>143
atg acg gaa ctg acg gac atc acc ggc ccg gct ggc cag gcc gaa ccc      48
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Gly Gln Ala Glu Pro
  1               5                  10                  15
gtc gca ttc ccc cag gac cgc acc tgt ccc tac cac ccc ccc acc gga      96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
tac gac ccg ctg cgc gac ggg cga ccc ctg tcc cgc gtc acc ctc tac     144
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgc gag gtc tgg ctg gtc acc gcc cag gcc acc gcc cgc gcc     192
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Ala
     50                  55                  60
ctg ctc gcc gac ccc cgg ctg tcc acc gac cgc cgc cgc gac ggt ttt     240
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
ccc gtg ccc agc ccc cgc ttc gag gcc ggc cgc gac cgc aaa ctg gcc     288
Pro Val Pro Ser Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
ctg ctc ggg ctg gac gac ccc gag cac cac cag cag cgc cgg atg ctg     336
Leu Leu Gly Leu Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
atc ccg tcg ttc acc gtc aaa cgc gcc acc gcg cta cgc ccc tgg atc    384
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
cag cgg atc gtc gac gaa ctg ctg gac gac atg atc gcc cgg ggg ccg    432
Gln Arg Ile Val Asp Glu Leu Leu Asp Asp Met Ile Ala Arg Gly Pro
    130                 135                 140
gtc gcc gac ctc gtg tcc gcg ttc gcg ctg ccc gtg ccg tcc atg gtc    480
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc gaa ctg ctc ggc gtg ccc tac gcc gac cac gag ttc ttc gag    528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gaa cag tcc cgc cgg ctg ctg cgc ggc ccg ggc ggc gcc gac aca ctg    576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Gly Gly Ala Asp Thr Leu
            180                 185                 190
gac gcc cgg gac cgg ctg gag gcg tac ctc ggc gag ctg atc gac gcc    624
Asp Ala Arg Asp Arg Leu Glu Ala Tyr Leu Gly Glu Leu Ile Asp Ala
        195                 200                 205
aag gcc aag gag gcc gag ccc ggc gac ggc att ctg gac gat ctg gtc    672
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Asp Leu Val
    210                 215                 220
cac aac cgg ctc cgc gcg ggc gag ctg gac cgg acc gac ctg gtg tcg    720
His Asn Arg Leu Arg Ala Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
ctc gcc ctc atc ctg ctg gtc gcc ggg cac gag aca acc gcc aac atg    768
Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc tcc ctg ggc acc tac acc ctg ctc cag cac ccc gaa cgg ctg gcc    816
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
gag ctg cgt gcc gac ccc acg gtg ctg ccc gcc gtc gtc gag gaa ctg    864
Glu Leu Arg Ala Asp Pro Thr Val Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
ctg cgg atg ctg tcc atc gcc gag ggg ctg caa cgg gtg gcg ctg gag    912
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
gac atc gag atc gac ggc acc acc atc cgg gcc ggt gac ggc gtc ctc    960
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
ttc tcc acc tcg gtc atc aac cgg gac acg gcc gtc tac gac gac ccc   1008
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
gac ggc ctg gac ttc cac cgc gcc gac cgg cac cac gtg gcg ttc ggc   1056
Asp Gly Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
ttc ggc atc cac cag tgc ctg ggc cag aac ctg gcc cgc gcg gaa ctg   1104
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
gag atc gcc ctc ggc agc ctc ttc acc cgg ctg ccc gga ctg cgt ctt   1152
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
gcc gcc ccg gcc gag gag atc ccc ttc aaa ccg ggc gac acg atc cag   1200
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
ggg atg ctg gaa ctc ccc gtg acc tgg taa                           1230
Gly Met Leu Glu Leu Pro Val Thr Trp
                405                 410
<210>144
<211>1449
<212>DNA
<213>黑胡桃链霉菌(Streptmyces nogalater)IFO 13445
<220>
<221>CDS
<222>(1)..(1230)
<220>
<221>CDS
<222>(1243)..(1449)
<400>144
atg acg gaa ctg acg gac acc acc ggc ccg gcc gac gcg gcc gaa ccc     48
Met Thr Glu Leu Thr Asp Thr Thr Gly Pro Ala Asp Ala Ala Glu Pro
  1               5                  10                  15
gtc gca ttc ccc cag gac cgc acc tgc ccc tac cac ccc ccg acc ggc     96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
tac gac ccg ctg cgc gac ggg cgg ccc ctg tcc cgg gtc acc ctc tac    144
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgt gag gtc tgg ctg gtc acc gcg cag gcc acc gcc cgc acc    192
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Thr
     50                  55                  60
ctg ctc gcc gac ccc cgg ctg tcc acc gac cgc cgc cgc gac ggc ttc    240
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
ccc gtg ccc acc ccc cgc ttc gag ggc gga cgc gac cgc aag ctg gcc    288
Pro Val Pro Thr Pro Arg Phe Glu Gly Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
ctg ctc gga ctg gac gac ccc gag cac cag cag cag cgc cgg atg ctg    336
Leu Leu Gly Leu Asp Asp Pro Glu His Gln Gln Gln Arg Arg Met Leu
            100                 105                 110
atc ccg tcg ttc acc gtg aaa cgc gcc acc gcg cta cgc ccc tgg atc    384
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
cag cgg atc gtc gac gga ctg ctg gac gcc atg atc acc cgg ggg ccg    432
Gln Arg Ile Val Asp Gly Leu Leu Asp Ala Met Ile Thr Arg Gly Pro
    130                 135                 140
gtc gcc gac ctc gtg tcc gcc ttc gcg ctg ccc gtg ccg tcc atg gtc    480
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc gaa ctg ctc ggc gtg ccc tac gcc gac cac gag ttc ttc gag    528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gag cag tcc cgc cga ctg ctg agc gcc tcg acc agc gcc gac acc ctg    576
Glu Gln Ser Arg Arg Leu Leu Ser Ala Ser Thr Ser Ala Asp Thr Leu
            180                 185                 190
gac gcc cgg gac cgg ctg gag acg tac ctc ggc gac ctg atc gac gcc    624
Asp Ala Arg Asp Arg Leu Glu Thr Tyr Leu Gly Asp Leu Ile Asp Ala
        195                 200                 205
aag gcc aag gag gcc gag ccc ggc gac ggc atc ctg gac gag ctc gtc    672
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Glu Leu Val
    210                 215                 220
cac aac cgg ctc cgc aag ggc gag ctg gac cgg acc gac ctg gtg tcg    720
His Asn Arg Leu Arg Lys Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
ctc gcc gtc atc ctg ctg gtc gcc ggg cac gag acg acc gcc aac atg     768
Leu Ala Val Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc tcc ctg ggc acc tac acg ctg ctc cag cac ccc gag cgc ctg gcc     816
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
gag ctg cgc gcc gac ccc gcg ctg ctg ccc gcc gtc gtc gag gaa ctg     864
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
ctg cgg atg ctg tcc atc gcc gag ggg ctg caa cgg gtg gcg ctg gag     912
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
gac atc gag atc gac ggc acc acc atc cgg gcc ggc gac ggc gtc ctc     960
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
ttc tcc acc tcg gtc atc aac cgg gac acg gcc gtc tac gac gac ccg    1008
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
gac gac ctg gac ttc cac cgc gcc gac cgg cac cac gtg gcg ttc ggc    1056
Asp Asp Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
ttc ggc atc cac cag tgc ctg ggc cag aac ctg gcc cgc gcg gaa ctg    1104
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
gag atc gct ctc ggc agc ctg ttc acc cgc ttg ccc ggg ctc cgt ctg    1152
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
gcc gta ccg gcg aag gac att ccc ttc aaa ccg ggc gac acg atc cag    1200
Ala Val Pro Ala Lys Asp Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
ggg atg ctg gaa ctc ccc gtg acc tgg taa gaggcttcgt tc atg cac atc  1251
Gly Met Leu Glu Leu Pro Val Thr Trp                   Met His Ile
                405                 410
gac atc gat atc gac cag gac gtc tgc atc ggc gcc ggg cag tgc gcg    1299
Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly Gln Cys Ala
    415                 420                 425
ctg gcg gca ccg ggc gtc ttc acc cag gac gac gac ggc tac agc acc    1347
Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Tyr Ser Thr
430                 435                 440                 445
ctg ctg ccc ggc cag gag aac ggc gtg acc gac ccg atg gtc cgg gag    1395
Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met Val Arg Glu
                450                 455                 460
gcc gcc cgc gcc tgc ccg gtc agc gcg atc acc gtg cgg gag cgc acc    1443
Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg Glu Arg Thr
            465                 470                 475
gcc tga                                                            1449
Ala
<210>145
<211>1480
<212>DNA
<213>津岛链霉菌(Streptmyces tsusimaensis)IFO 13782T
<220>
<221>CDS
<222>(1)..(1278)
<220>
<221>CDS
<222>(1284)..(1480)
<400>145
atg acg gaa tcc acg aca gat ccg acg acc cgc cag gcc ctc ggc tcc     48
Met Thr Glu Ser Thr Thr Asp Pro Thr Thr Arg Gln Ala Leu Gly Ser
  1               5                  10                  15
acc acc ccc gcc gct gcc acc gcg acc gcc atc gac ccg acc ctc gcg     96
Thr Thr Pro Ala Ala Ala Thr Ala Thr Ala Ile Asp Pro Thr Leu Ala
             20                  25                  30
aca ccc ttc ccg cag gac cgg ggg tgc ccg tac cac ccg ccc gcc ggg    144
Thr Pro Phe Pro Gln Asp Arg Gly Cys Pro Tyr His Pro Pro Ala Gly
         35                  40                  45
tac gcg ccg ctg cgt gag ggc cga ccg ctc agc agg gtc gcc ctc ttc    192
Tyr Ala Pro Leu Arg Glu Gly Arg Pro Leu Ser Arg Val Ala Leu Phe
     50                  55                  60
gac ggg cgc ccg gtc tgg gcg gtc acc gga cac gcc ctg gcc cgc cgg    240
Asp Gly Arg Pro Val Trp Ala Val Thr Gly His Ala Leu Ala Arg Arg
 65                  70                  75                  80
ttg ctg gcc gat cca cgg ctc tcc acc gac cgt acc cac ccg gac ttc    288
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Thr His Pro Asp Phe
                 85                  90                  95
ccc gcc ccg gcc ccg cgc ttc gcc aac gcg aac cgg cgc cgc gtg gcc    336
Pro Ala Pro Ala Pro Arg Phe Ala Asn Ala Asn Arg Arg Arg Val Ala
            100                 105                 110
ctg ctc ggc gtc gac gac ccc gag cac aac acc cag cgc aga atg ctc    384
Leu Leu Gly Val Asp Asp Pro Glu His Asn Thr Gln Arg Arg Met Leu
        115                 120                 125
atc ccg gcc ttc tcc gtg aag cgg atc aac gct ctc cgc ccc cgc atc    432
Ile Pro Ala Phe Ser Val Lys Arg Ile Asn Ala Leu Arg Pro Arg Ile
    130                 135                 140
cag gag acc gtg gac cgg ttg ctc gac gcg atg gag cgc cag ggg cca    480
Gln Glu Thr Val Asp Arg Leu Leu Asp Ala Met Glu Arg Gln Gly Pro
145                 150                 155                 160
ccg gcc gag ctg gtg agc gcg ttc gcc ctg ccg gtg ccg tcg atg gtg    528
Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
                165                 170                 175
atc tgc tcc ctg ctc gga gtg ccg tac gcc gac cac gag ttc ttc gag    576
Ile Cys Ser Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
            180                 185                 190
gag cgc tcg cgg cgg ctc ctg cgc ggc ccc ggc gcg gcc gac gtg gac    624
Glu Arg Ser Arg Arg Leu Leu Arg Gly Pro Gly Ala Ala Asp Val Asp
        195                 200                 205
agg gcc ctc gac gaa ctc gag gag tac ctc ggc gcg ctg atc gac cgc    672
Arg Ala Leu Asp Glu Leu Glu Glu Tyr Leu Gly Ala Leu Ile Asp Arg
    210                 215                 220
aag cgt acg gaa ccg ggc gac ggc ctc ctc gac gag ctg atc cac cgc    720
Lys Arg Thr Glu Pro Gly Asp Gly Leu Leu Asp Glu Leu Ile His Arg
225                 230                 235                 240
gac cac ccc ggc gga ccg gtc gac cgc gag gag ctg gtc tcg ttc gcc    768
Asp His Pro Gly Gly Pro Val Asp Arg Glu Glu Leu Val Ser Phe Ala
                245                 250                 255
gtg atc ctg ctc atc gcg ggg cac gag acg acg gcg aac atg atc tcg    816
Val Ile Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser
            260                 265                 270
ctc ggc acc ttc acc ctg ctg cgc cac ccc gaa cag ctc gcg gcg ctg    864
Leu Gly Thr Phe Thr Leu Leu Arg His Pro Glu Gln Leu Ala Ala Leu
        275                 280                 285
cgg gcc ggc ggg acg acc acg gcc gtg gcg gtc gag gaa ctg ttg cgg     912
Arg Ala Gly Gly Thr Thr Thr Ala Val Ala Val Glu Glu Leu Leu Arg
    290                 295                 300
ttc ctc tcc atc gcc gac ggc ctg cag cgg ctg gcg acc gag gac atc     960
Phe Leu Ser Ile Ala Asp Gly Leu Gln Arg Leu Ala Thr Glu Asp Ile
305                 310                 315                 320
gag gtg ccg gac gcc ggg gtg acg atc cgc aag ggc gaa ggt gtg gtc    1008
Glu Val Pro Asp Ala Gly Val Thr Ile Arg Lys Gly Glu Gly Val Val
                325                 330                 335
ttc tcg acc tcg ctc atc aac cgc gac gac ggc gtg ttc ccg cag ccc    1056
Phe Ser Thr Ser Leu Ile Asn Arg Asp Asp Gly Val Phe Pro Gln Pro
            340                 345                 350
gaa acg ctc gac tgg gac cgc ccg gcc cgt cac cat ctc gcc ttc ggc    1104
Glu Thr Leu Asp Trp Asp Arg Pro Ala Arg His His Leu Ala Phe Gly
        355                 360                 365
ttc ggc gta cac cag tgc ctg ggg cag aac ctg gcc cgc gcg gaa ctc    1152
Phe Gly Val His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
    370                 375                 380
gac atc gcg atg cgc acg ctc ttc gag cgg ctg ccg ggc ctc cgg ctc    1200
Asp Ile Ala Met Arg Thr Leu Phe Glu Arg Leu Pro Gly Leu Arg Leu
385                 390                 395                 400
gcc gta ccc gcg cag gag atc ccc cat aaa ccg ggg gac acg atc cag    1248
Ala Val Pro Ala Gln Glu Ile Pro His Lys Pro Gly Asp Thr Ile Gln
                405                 410                 415
ggc atg ctc gaa ctg ccc gtg gcc tgg tga gcggc atg ggc gtc cag gtc  1298
Gly Met Leu Glu Leu Pro Val Ala Trp           Met Gly Val Gln Val
            420                 425                       430
gac agg gaa cgc tgc gtg ggg gcg ggc atg tgc gcg ctg acc gcg ccg    1346
Asp Arg Glu Arg Cys Val Gly Ala Gly Met Cys Ala Leu Thr Ala Pro
            435                 440                 445
gac gtg ttc acg cag gac gac gac ggc ctc agc gag gtg ctc ccg ggc    1394
Asp Val Phe Thr Gln Asp Asp Asp Gly Leu Ser Glu Val Leu Pro Gly
        450                 455                 460
cgc gcg gag acc gct gga gga cat ccc ttg gtg ggg gag gct gta cgg    1442
Arg Ala Glu Thr Ala Gly Gly His Pro Leu Val Gly Glu Ala Val Arg
    465                 470                 475
gcc tgc ccg gtg ggg gcg gtg gcc ctg tcc gcc gac tg                 1480
Ala Cys Pro Val Gly Ala Val Ala Leu Ser Ala Asp
480                 485                 490
<210>146
<211>1473
<212>DNA
<213>热淡天蓝链霉菌(Streptomyces thermocoerulescens)IFO 14273t
<220>
<221>CDS
<222>(1)..(1209)
<220>
<221>CDS
<222>(1222)..(1473)
<400>146
atg acg gac atg acg gaa acc ccc acc gtc gcc ttt ccc cag agc cgg      48
Met Thr Asp Met Thr Glu Thr Pro Thr Val Ala Phe Pro Gln Ser Arg
  1               5                  10                  15
acc tgt ccg tac cac ccg ccc gcc gcc tac gcc ccg ctg cgc gac acc      96
Thr Cys Pro Tyr His Pro Pro Ala Ala Tyr Ala Pro Leu Arg Asp Thr
             20                  25                  30
cgc ccg ctg gcc cgc gcc cgt ctc tac gac ggc cgc ctc gtc tgg acg     144
Arg Pro Leu Ala Arg Ala Arg Leu Tyr Asp Gly Arg Leu Val Trp Thr
         35                  40                  45
gtc acc ggt cac ggc ctc gcc cgc acc ctg ctc gcc gac ccc cgc ctg    192
Val Thr Gly His Gly Leu Ala Arg Thr Leu Leu Ala Asp Pro Arg Leu
     50                  55                  60
tcc acc gac ccc acc cgg ccg gag ttc ccc gcc acc acg gaa cgc atc    240
Ser Thr Asp Pro Thr Arg Pro Glu Phe Pro Ala Thr Thr Glu Arg Ile
 65                  70                  75                  80
gcc cgg atc cgg cgc cgc cgg acc gcc ctg ctg ggc gtc gac gac ccc    288
Ala Arg Ile Arg Arg Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro
                 85                  90                  95
gaa cac cgc gtc cag cgg cgc atg atg gtc ccc agc ttc acc ctc cag    336
Glu His Arg Val Gln Arg Arg Met Met Val Pro Ser Phe Thr Leu Gln
            100                 105                 110
cgc gcc acc gcg ctg cgc ccc cgg atc cag cgg gtc gtc gac gaa cgc    384
Arg Ala Thr Ala Leu Arg Pro Arg Ile Gln Arg Val Val Asp Glu Arg
        115                 120                 125
ctc gac gcg atg atc gcc ggc ggc ccg ccc gcc gat ctc gtc acc gcg    432
Leu Asp Ala Met Ile Ala Gly Gly Pro Pro Ala Asp Leu Val Thr Ala
    130                 135                 140
ttc gcg ctg ccg gtg ccg tcc atg gtg atc tgc gcc ctg ctc ggc gtg    480
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
145                 150                 155                 160
ccc tac gag gac cac gac ttc ttc gag gag cag tca cgc cgg ctg ctg    528
Pro Tyr Glu Asp His Asp Phe Phe Glu Glu Gln Ser Arg Arg Leu Leu
                165                 170                 175
cgc ggc ccg acg gcc gag gac tcc atg gac gcc cgc gcc cga atg gag    576
Arg Gly Pro Thr Ala Glu Asp Ser Met Asp Ala Arg Ala Arg Met Glu
            180                 185                 190
gcc tac ttc gac gag ctg atc gac cgc aag cag cgg cag gac gcg ccc    624
Ala Tyr Phe Asp Glu Leu Ile Asp Arg Lys Gln Arg Gln Asp Ala Pro
        195                 200                 205
ggt gac ggc gtc ctg gac gaa ctc gtc cac cag cgg ctg gcc gcg ggc    672
Gly Asp Gly Val Leu Asp Glu Leu Val His Gln Arg Leu Ala Ala Gly
    210                 215                 220
gag ctg gac cgc gag ggg ctc atc gcc atg gcg atc atc ctg ctc gtc    720
Glu Leu Asp Arg Glu Gly Leu Ile Ala Met Ala Ile Ile Leu Leu Val
225                 230                 235                 240
gcc ggt cac gag acg acc gcc aac atg atc tcg ctc ggc acc ttc acg    768
Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr
                245                 250                 255
ctg ctc ggg cac ccc gag cgg ctg gcc gag ctg cgc gcc gac ccg gac    816
Leu Leu Gly His Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Asp
            260                 265                 270
ctg gtg ccc gcg gcc gtc gag gag ctg ctg cgc atg ctg tcc atc gcg    864
Leu Val Pro Ala Ala Val Glu Glu Leu Leu Arg Met Leu Ser Ile Ala
        275                 280                 285
gac ggc ctg ctg cgc gtc gcc gtc gag gac atc gag gtg gcc ggg gag    912
Asp Gly Leu Leu Arg Val Ala Val Glu Asp Ile Glu Val Ala Gly Glu
    290                 295                 300
acg atc cgc gcg ggc gac ggc gtc atc ttc tcg acg tcg gtc atc aac    960
Thr Ile Arg Ala Gly Asp Gly Val Ile Phe Ser Thr Ser Val Ile Asn
305                 310                 315                 320
cgg gac gag gcc gtc tac ccc gaa ccc gac acc ctg gac ctg cac cgc   1008
Arg Asp Glu Ala Val Tyr Pro Glu Pro Asp Thr Leu Asp Leu His Arg
                325                 330                 335
ccg gcc cgg cac cac gtc gcc ttc ggg ttc ggc atc cac cag tgc ctc    1056
Pro Ala Arg His His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu
            340                 345                 350
ggg cag aac ctg gcc cgc gcc gag atg gag atc gcc ctg cgc acc ctg    1104
Gly Gln Asn Leu Ala Arg Ala Glu Met Glu Ile Ala Leu Arg Thr Leu
        355                 360                 365
ttc ggc cgc ctg ccc gga ctg cgt ctg gcg gtc ccc ccg gag gaa atc    1152
Phe Gly Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Pro Glu Glu Ile
    370                 375                 380
ccg ttc aaa ccc ggc gac acg atc cag ggg atg ctg gaa ctc ccc gtg    1200
Pro Phe Lys Pro Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val
385                 390                 395                 400
acc tgg taa gaggctccgg tc atg cac aac gaa acg cat gag aca cac gag  1251
Thr Trp                   Met His Asn Glu Thr His Glu Thr His Glu
                              405                 410
acc acc gcg gcg gcc tcc ggg acc cgt atc gac atc gac cac gac ctc    1299
Thr Thr Ala Ala Ala Ser Gly Thr Arg Ile Asp Ile Asp His Asp Leu
    415                 420                 425
tgc gtc ggc gcc ggg cag tgc gcc ctg gtc gcc ccg tcc gtc ttc acc    1347
Cys Val Gly Ala Gly Gln Cys Ala Leu Val Ala Pro Ser Val Phe Thr
430                 435                 440                 445
cag gac gac gac ggc ttc agc gag ctg atc ccc ggc cgc gag gac ggt    1395
Gln Asp Asp Asp Gly Phe Ser Glu Leu Ile Pro Gly Arg Glu Asp Gly
                450                 455                 460
gcc ggc gac ccg atg gtc cgg gag gcc gtc cgc gcc tgc ccc gtc agc    1443
Ala Gly Asp Pro Met Val Arg Glu Ala Val Arg Ala Cys Pro Val Ser
            465                 470                 475
gcc atc acc gtg acg gag gcc gcc gtc tga                            1473
Ala Ile Thr Val Thr Glu Ala Ala Val
        480                 485
<210>147
<211>1449
<212>DNA
<213>球团产色链霉菌(Streptmyces glomerochromogenes)IFO 13673T
<220>
<221>CDS
<222>(1)..(1230)
<220>
<221>CDS
<222>(1243)..(1449)
<400>147
atg acg gaa ctg acg gac atc acc ggc ccg gct ggc cag gcc caa ccc      48
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Gly Gln Ala Gln Pro
  1               5                  10                  15
gtc gca ttc ccc cag gac cgc acc tgt ccc tac cac ccc ccc acc gga      96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
tac gac ccg ctg cgc gac ggg cga ccc ctg tcc cgc gtc acc ctc tac     144
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgc gag gtc tgg ctg gtc acc gcc cag gcc acc gcc cgc gcc     192
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Ala
     50                  55                  60
ctg ctc gcc gac ccc cgg ctg tcc acc gac cgc cgc cgc gac ggc ttt     240
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
  65                 70                  75                  80
ccc gtg ccc agc ccc cgc ttc gag gcc ggc cgc gac cgc aaa ctg gcc     288
Pro Val Pro Ser Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
ctg ctc ggg ctg gac gac ccc gag cac cac cag cag cgc cgg atg ctg    336
Leu Leu Gly Leu Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
atc ccg tcg ttc acc gtc aaa cgc gcc acc gcg cta cgc ccc tgg atc    384
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
cag cgg atc gtc gac gaa ctg ctg gac gac atg atc gcc cgg ggg ccg    432
Gln Arg Ile Val Asp Glu Leu Leu Asp Asp Met Ile Ala Arg Gly Pro
    130                 135                 140
gtc gcc gac ctc gtg tcc gcg ttc gcg ctg ccc gtg ccg tcc atg gtc    480
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc gaa ctg ctc ggc gtg ccc tac gcc gac cac gag ttc ttc gag    528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gaa cag tcc cgc cgg ctg ctg cgc ggc ccg ggc ggc gcc gac acc ctg    576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Gly Gly Ala Asp Thr Leu
            180                 185                 190
gac gcc cgg gac cgg ctg gag gcg tac ctc ggc gag ctg atc gac gcc    624
Asp Ala Arg Asp Arg Leu Glu Ala Tyr Leu Gly Glu Leu Ile Asp Ala
        195                 200                 205
aag gcc aag gag gcc gag ccc ggc gac ggc gtt ctg gac gac ctg gtc    672
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Val Leu Asp Asp Leu Val
    210                 215                 220
cac aac cgg ctc cgc gcg ggc gag ctg gac cgg acc gac ctg gtg tcg    720
His Asn Arg Leu Arg Ala Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
ctc gcc ctc atc ctg ctg gtc gcc ggg cac gag acg acc gcc aac atg    768
Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc tcc ctg ggc acc tac acc ctg ctc cag cac ccc gaa cgg ctg gcc    816
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
gag ctg cgt gcc gac ccc acg gtg ctg ccc gcc gtc gtc gag gaa ctg    864
Glu Leu Arg Ala Asp Pro Thr Val Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
ctg cgg atg ctg tcc atc gcc gag ggg ctg caa cgg ctg gcg ctg gag    912
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Leu Ala Leu Glu
    290                 295                 300
gac atc gag atc gac ggc acc acc atc cgg gcc ggt gac ggc gtc ctc    960
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
ttc tcc acc tcg gtc atc aac cgg gac acg gcc gtc tac gac gac ccc   1008
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
gac gac ctg gac ttc cac cgc gcc gac cgg cac cac gtg gcg ttc ggc   1056
Asp Asp Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
ttc ggc atc cac cag tgc ctg ggc cag aac ctg gcc cgc gcg gaa ctg   1104
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
gag atc gcc ctc ggc agc ctc ttc acc cgg ctg ccc ggg ctg cgt ctt   1152
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
gcc gcc ccg gcc gag gag atc ccc ttc aaa ccg ggc gac acg atc cag    1200
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
ggg atg ctg gaa ctc ccc gtg acc tgg taa gaggcttcgc tc atg cac atg  1251
Gly Met Leu Glu Leu Pro Val Thr Trp                   Met His Met
                405                 410
gac atc gac atc gac cag gac gtc tgt atc ggc gcc ggg cag tgc gcg    1299
Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly Gln Cys Ala
            415                 420                 425
ctg gcg gca ccg ggc gtc ttc acc cag gac gac gac ggc tac agc acc    1347
Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Tyr Ser Thr
430                 435                 440                 445
ctg ctg ccc ggc cag gag aac ggc gtc acc gac ccg atg gtc cgg gag    1395
Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met Val Arg Glu
                450                 455                 460
gcc gcc cgc gcc tgc ccg gtc agc gcc atc acc gta cgg gag cgc acc    1443
Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg Glu Arg Thr
            465                 470                 475
gcc tga                                                            1449
Ala
<210>148
<211>1449
<212>DNA
<213>橄榄产色链霉菌(Streptmyces olivochromogenes)IFO 12444
<220>
<221>CDS
<222>(1)..(1230)
<220>
<221>CDS
<222>(1243)..(1449)
<400>148
atg acg gaa ctg acg gac atc acc ggc ccg gct ggc cag gcc gaa ccc      48
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Gly Gln Ala Glu Pro
  1                  5                  10                  15
gtc gca ttc ccc cag gac cgc acc tgt ccc tac cac ccc ccc acc gga      96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
                 20                  25                  30
tac gac ccg ctg cgc gac ggg cga ccc ctg tcc cgc gtc acc ctc tac     144
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
             35                  40                  45
gac ggc cgc gag gtc tgg ctg gtc acc gcc cag gcc acc gcc cgc gcc     192
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Ala
         50                  55                  60
ctg ctc gcc gac ccc cgg ctg tcc acc gac cgc cgc cgc gac ggt ttt     240
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
ccc gtg ccc agc ccc cgc ttc gag gcc ggc cgc gac cgc aaa ctg gcc     288
Pro Val Pro Ser Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
ctg ctc ggg ctg gac gac ccc gag cac cac cag cag cgc cgg atg ctg     336
Leu Leu Gly Leu Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
atc ccg tcg ttc acc gtc aaa cgc gcc acc gcg cta cgc ccc tgg atc     384
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
cag cgg atc gtc gac gaa ctg ctg gac gac atg atc gcc cgg ggg ccg     432
Gln Arg Ile Val Asp Glu Leu Leu Asp Asp Met Ile Ala Arg Gly Pro
    130                 135                 140
gtc gcc gac ctc gtg tcc gcg ttc gcg ctg ccc gtg ccg tcc atg gtc     480
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc gaa ctg ctc ggc gtg ccc tac gcc gac cac gag ttc ttc gag     528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gaa cag tcc cgc cgg ctg ctg cgc ggc ccg ggc ggc gcc gac aca ctg     576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Gly Gly Ala Asp Thr Leu
            180                 185                 190
gac gcc cgg gac cgg ctg gag gcg tac ctc ggc gag ctg atc gac gcc     624
Asp Ala Arg Asp Arg Leu Glu Ala Tyr Leu Gly Glu Leu Ile Asp Ala
        195                 200                 205
aag gcc aag gag gcc gag ccc ggc gac ggc att ctg gac gat ctg gtc     672
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Asp Leu Val
    210                 215                 220
cac aac cgg ctc cgc gcg ggc gag ctg gac cgg acc gac ctg gtg tcg     720
His Asn Arg Leu Arg Ala Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
ctc gcc ctc atc ctg ctg gtc gcc ggg cac gag aca acc gcc aac atg     768
Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc tcc ctg ggc acc tac acc ctg ctc cag cac ccc gaa cgg ctg gcc     816
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
gag ctg cgt gcc gac ccc acg gtg ctg ccc gcc gtc gtc gag gaa ctg     864
Glu Leu Arg Ala Asp Pro Thr Val Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
ctg cgg atg ctg tcc atc gcc gag ggg ctg caa cgg gtg gcg ctg gag     912
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
gac atc gag atc gac ggc acc acc atc cgg gcc ggt gac ggc gtc ctc     960
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
ttc tcc acc tcg gtc atc aac cgg gac acg gcc gtc tac gac gac ccc    1008
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
gac ggc ctg gac ttc cac cgc gcc gac cgg cac cac gtg gcg ttc ggc    1056
Asp Gly Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
ttc ggc atc cac cag tgc ctg ggc cag aac ctg gcc cgc gcg gaa ctg    1104
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
gag atc gcc ctc ggc agc ctc ttc acc cgg ctg ccc gga ctg cgt ctt    1152
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
gcc gcc ccg gcc gag gag atc ccc ttc aaa ccg ggc gac acg atc cag    1200
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
ggg atg ctg gaa ctc ccc gtg acc tgg taa gaggcttcgc tc atg cac atg  1251
Gly Met Leu Glu Leu Pro Val Thr Trp                   Met His Met
                405                 410
gac atc gac atc gac cag gac atc tgt atc ggc gcc ggg cag tgc gcg    1299
Asp Ile Asp Ile Asp Gln Asp Ile Cys Ile Gly Ala Gly Gln Cys Ala
    415                 420                 425
ctg gcg gca ccg ggc gtc ttc acc cag gac gac gac ggc tac agc acc    1347
Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Tyr Ser Thr
430                 435                 440                 445
ctg ctg ccc ggc cag gag aac ggc gtc acc gac ccg atg gtc cgg gag    1395
Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met Val Arg Glu
                450                 455                 460
gcc gcc cgc gcc tgc ccg gtc agc gcc atc acc gta cgg gag cgc acc    1443
Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg Glu Arg Thr
            465                 470                 475
gcc tga                                                            1449
Ala
<210>149
<211>68
<212>PRT
<213>黑胡桃链霉菌(Streptmyces nogalater)IFO 13445
<400>149
Met His Ile Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly
  1               5                  10                  15
Gln Cys Ala Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly
             20                  25                  30
Tyr Ser Thr Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met
         35                  40                  45
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg
     50                  55                  60
Glu Arg Thr Ala
 65
<210>150
<211>65
<212>PRT
<213>津岛链霉菌(Streptmyces tsusimaensis)IFO 13782T
<400>150
Met Gly Val Gln Val Asp Arg Glu Arg Cys Val Gly Ala Gly Met Cys
  1               5                  10                  15
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Leu Ser
             20                  25                  30
Glu Val Leu Pro Gly Arg Ala Glu Thr Ala Gly Gly His Pro Leu Val
         35                  40                  45
Gly Glu Ala Val Arg Ala Cys Pro Val Gly Ala Val Ala Leu Ser Ala
     50                  55                  60
Asp
65
<210>151
<211>83
<212>PRT
<213>热淡天蓝链霉菌(Streptmyces thermocoerulescens)IFO 14273t
<400>151
Met His Asn Glu Thr His Glu Thr His Glu Thr Thr Ala Ala Ala Ser
  1               5                  10                  15
Gly Thr Arg Ile Asp Ile Asp His Asp Leu Cys Val Gly Ala Gly Gln
             20                  25                  30
Cvs Ala Leu Val Ala Pro Ser Val Phe Thr Gln Asp Asp Asp Gly Phe
         35                  40                  45
Ser Glu Leu Ile Pro Gly Arg Glu Asp Gly Ala Gly Asp Pro Met Val
     50                  55                  60
Arg Glu Ala Val Arg Ala Cys Pro Val Ser Ala Ile Thr Val Thr Glu
65                  70                  75                  80
Ala Ala Val
<210>152
<211>68
<212>PRT
<213>球团产色链霉菌(Streptmyces glomerochromogenes)IFO 13673T
<400>152
Met His Met Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly
  1               5                  10                  15
Gln Cys Ala Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly
             20                  25                  30
Tyr Ser Thr Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met
         35                  40                  45
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg
     50                  55                  60
Glu Arg Thr Ala
 65
<210>153
<211>68
<212>PRT
<213>橄榄产色链霉菌(Streptmyces olivochromogenes)IFO 12444
<400>153
Met His Met Asp Ile Asp Ile Asp Gln Asp Ile Cys Ile Gly Ala Gly
  1               5                  10                  15
Gln Cys Ala Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly
             20                  25                  30
Tyr Ser Thr Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met
         35                  40                  45
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg
     50                  55                  60
Glu Arg Thr Ala
 65
<210>154
<211>207
<212>DNA
<213>黑胡桃链霉菌(Streptmyces nogalater)IFO 13445
<220>
<221>CDS
<222>(1)..(207)
<400>154
atg cac atc gac atc gat atc gac cag gac gtc tgc atc ggc gcc ggg     48
Met His Ile Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly
  1               5                  10                  15
cag tgc gcg ctg gcg gca ccg ggc gtc ttc acc cag gac gac gac ggc     96
Gln Cys Ala Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly
             20                  25                  30
tac agc acc ctg ctg ccc ggc cag gag aac ggc gtg acc gac ccg atg    144
Tyr Ser Thr Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met
         35                  40                  45
gtc cgg gag gcc gcc cgc gcc tgc ccg gtc agc gcg atc acc gtg cgg    192
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg
     50                  55                  60
gag cgc acc gcc tga                                                207
Glu Arg Thr Ala
 65
<210>155
<211>198
<212>DNA
<213>津岛链霉菌(Streptmyces tsusimaensis)IFO 13782T
<220>
<221>CDS
<222>(1)..(198)
<400>155
atg ggc gtc cag gtc gac agg gaa cgc tgc gtg ggg gcg ggc atg tgc     48
Met Gly Val Gln Val Asp Arg Glu Arg Cys Val Gly Ala Gly Met Cys
  1               5                  10                  15
gcg ctg acc gcg ccg gac gtg ttc acg cag gac gac gac ggc ctc agc     96
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Leu Ser
             20                  25                  30
gag gtg ctc ccg ggc cgc gcg gag acc gct gga gga cat ccc ttg gtg    144
Glu Val Leu Pro Gly Arg Ala Glu Thr Ala Gly Gly His Pro Leu Val
         35                  40                  45
ggg gag gct gta cgg gcc tgc ccg gtg ggg gcg gtg gcc ctg tcc gcc    192
Gly Glu Ala Val Arg Ala Cys Pro Val Gly Ala Val Ala Leu Ser Ala
     50                  55                  60
gac tga                                                            198
Asp
 65
<210>156
<211>252
<212>DNA
<213>热淡天蓝链霉菌(Streptmyces thermocoerulescens)IFO 14273t
<220>
<221>CDS
<222>(1)..(252)
<400>156
atg cac aac gaa acg cat gag aca cac gag acc acc gcg gcg gcc tcc     48
Met His Asn Glu Thr His Glu Thr His Glu Thr Thr Ala Ala Ala Ser
  1               5                  10                  15
ggg acc cgt atc gac atc gac cac gac ctc tgc gtc ggc gcc ggg cag     96
Gly Thr Arg Ile Asp Ile Asp His Asp Leu Cys Val Gly Ala Gly Gln
             20                  25                  30
tgc gcc ctg gtc gcc ccg tcc gtc ttc acc cag gac gac gac ggc ttc    144
Cys Ala Leu Val Ala Pro Ser Val Phe Thr Gln Asp Asp Asp Gly Phe
         35                  40                  45
agc gag ctg atc ccc ggc cgc gag gac ggt gcc ggc gac ccg atg gtc    192
Ser Glu Leu Ile Pro Gly Arg Glu Asp Gly Ala Gly Asp Pro Met Val
     50                  55                  60
cgg gag gcc gtc cgc gcc tgc ccc gtc agc gcc atc acc gtg acg gag    240
Arg Glu Ala Val Arg Ala Cys Pro Val Ser Ala Ile Thr Val Thr Glu
 65                  70                  75                  80
gcc gcc gtc tga                                                    252
Ala Ala Val
<210>157
<211>207
<212>DNA
<213>球团产色链霉菌(Streptmyces glomerochromogenes)IFO 13673T
<220>
<221>CDS
<222>(1)..(207)
<400>157
atg cac atg gac atc gac atc gac cag gac gtc tgt atc ggc gcc ggg     48
Met His Met Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly
  1               5                  10                  15
cag tgc gcg ctg gcg gca ccg ggc gtc ttc acc cag gac gac gac ggc     96
Gln Cys Ala Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly
             20                  25                  30
tac agc acc ctg ctg ccc ggc cag gag aac ggc gtc acc gac ccg atg    144
Tyr Ser Thr Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met
         35                  40                  45
gtc cgg gag gcc gcc cgc gcc tgc ccg gtc agc gcc atc acc gta cgg    192
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg
     50                  55                  60
gag cgc acc gcc tga                                                207
Glu Arg Thr Ala
  65
<210>158
<211>207
<212>DNA
<213>橄榄产色链霉菌(Streptmyces olivochromogenes)IFO 12444
<220>
<221>CDS
<222>(1)..(207)
<400>158
atg cac atg gac atc gac atc gac cag gac atc tgt atc ggc gcc ggg     48
Met His Met Asp Ile Asp Ile Asp Gln Asp Ile Cys Ile Gly Ala Gly
  1               5                  10                  15
cag tgc gcg ctg gcg gca ccg ggc gtc ttc acc cag gac gac gac ggc     96
Gln Cys Ala Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly
             20                  25                  30
tac agc acc ctg ctg ccc ggc cag gag aac ggc gtc acc gac ccg atg    144
Tyr Ser Thr Leu Leu Pro Gly Gln Glu Asn Gly Val Thr Asp Pro Met
         35                  40                  45
gtc cgg gag gcc gcc cgc gcc tgc ccg gtc agc gcc atc acc gta cgg    192
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg
     50                  55                  60
gag cgc acc gcc tga                                                207
Glu Arg Thr Ala
 65
<210>159
<211>409
<212>PRT
<213>黑胡桃链霉菌(Streptmyces nogalater)IFO 13445
<400>159
Met Thr Glu Leu Thr Asp Thr Thr Gly Pro Ala Asp Ala Ala Glu Pro
  1               5                  10                  15
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
Asp Gly Arg Glu Val Trp Leu Val Thr Ala Gln Ala Thr Ala Arg Thr
     50                  55                  60
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
Pro Val Pro Thr Pro Arg Phe Glu Gly Gly Arg Asp Arg Lys Leu Ala
                 85                  90                  95
Leu Leu Gly Leu Asp Asp Pro Glu His Gln Gln Gln Arg Arg Met Leu
            100                 105                 110
Ile Pro Ser Phe Thr Val Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
Gln Arg Ile Val Asp Gly Leu Leu Asp Ala Met Ile Thr Arg Gly Pro
    130                 135                 140
Val Ala Asp Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
Glu Gln Ser Arg Arg Leu Leu Ser Ala Ser Thr Ser Ala Asp Thr Leu
            180                 185                 190
Asp Ala Arg Asp Arg Leu Glu Thr Tyr Leu Gly Asp Leu Ile Asp Ala
        195                 200                 205
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Glu Leu Val
    210                 215                 220
His Asn Arg Leu Arg Lys Gly Glu Leu Asp Arg Thr Asp Leu Val Ser
225                 230                 235                 240
Leu Ala Val Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala
            260                 265                 270
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
Leu Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
Asp Ile Glu Ile Asp Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
Asp Asp Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
Ala Val Pro Ala Lys Asp Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
Gly Met Leu Glu Leu Pro Val Thr Trp
                405
<210>160
<211>425
<212>PRT
<213>津岛链霉菌(Streptmyces tsusimaensis)IFO 13782T
<400>160
Met Thr Glu Ser Thr Thr Asp Pro Thr Thr Arg Gln Ala Leu Gly Ser
  1               5                  10                  15
Thr Thr Pro Ala Ala Ala Thr Ala Thr Ala Ile Asp Pro Thr Leu Ala
             20                  25                  30
Thr Pro Phe Pro Gln Asp Arg Gly Cys Pro Tyr His Pro Pro Ala Gly
         35                  40                  45
Tyr Ala Pro Leu Arg Glu Gly Arg Pro Leu Ser Arg Val Ala Leu Phe
     50                  55                  60
Asp Gly Arg Pro Val Trp Ala Val Thr Gly His Ala Leu Ala Arg Arg
 65                  70                  75                  80
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Thr His Pro Asp Phe
                 85                  90                  95
Pro Ala Pro Ala Pro Arg Phe Ala Asn Ala Asn Arg Arg Arg Val Ala
            100                 105                 110
Leu Leu Gly Val Asp Asp Pro Glu His Asn Thr Gln Arg Arg Met Leu
        115                 120                 125
Ile Pro Ala Phe Ser Val Lys Arg Ile Asn Ala Leu Arg Pro Arg Ile
    130                 135                 140
Gln Glu Thr Val Asp Arg Leu Leu Asp Ala Met Glu Arg Gln Gly Pro
145                 150                 155                 160
Pro Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
                165                 170                 175
Ile Cys Ser Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
            180                 185                 190
Glu Arg Ser Arg Arg Leu Leu Arg Gly Pro Gly Ala Ala Asp Val Asp
        195                 200                 205
Arg Ala Leu Asp Glu Leu Glu Glu Tyr Leu Gly Ala Leu Ile Asp Arg
    210                 215                 220
Lys Arg Thr Glu Pro Gly Asp Gly Leu Leu Asp Glu Leu Ile His Arg
225                 230                 235                 240
Asp His Pro Gly Gly Pro Val Asp Arg Glu Glu Leu Val Ser Phe Ala
                245                 250                 255
Val Ile Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser
            260                 265                 270
Leu Gly Thr Phe Thr Leu Leu Arg His Pro Glu Gln Leu Ala Ala Leu
        275                 280                 285
Arg Ala Gly Gly Thr Thr Thr Ala Val Ala Val Glu Glu Leu Leu Arg
    290                 295                 300
Phe Leu Ser Ile Ala Asp Gly Leu Gln Arg Leu Ala Thr Glu Asp Ile
305                 310                 315                 320
Glu Val Pro Asp Ala Gly Val Thr Ile Arg Lys Gly Glu Gly Val Val
                325                 330                 335
Phe Ser Thr Ser Leu Ile Asn Arg Asp Asp Gly Val Phe Pro Gln Pro
            340                 345                 350
Glu Thr Leu Asp Trp Asp Arg Pro Ala Arg His His Leu Ala Phe Gly
        355                 360                 365
Phe Gly Val His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
    370                 375                 380
Asp Ile Ala Met Arg Thr Leu Phe Glu Arg Leu Pro Gly Leu Arg Leu
385                 390                 395                 400
Ala Val Pro Ala Gln Glu Ile Pro His Lys Pro Gly Asp Thr Ile Gln
                405                 410                 415
Gly Met Leu Glu Leu Pro Val Ala Trp
            420                 425
<210>161
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>161
agcagttcgc agatgaccat ggacggca                                       28
<210>162
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>162
tttcacggtg aacgacggga tcagcat                                        27
<210>163
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>163
acgagacgac cgccaacatg atctccct                                       28
<210>164
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>164
tcctcttctc cacctcggtc atcaacc                                        27
<210>165
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>165
ttcatatgac ggaactgacg gacacca                                        27
<210>166
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>166
cgaagctttc aggcggtgcg ctcccgca                                       28
<210>167
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>167
agcaaccggt ccacggtctc ctggatg                                        27
<210>168
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>168
gagagcgttg atccgcttca cggagaag                                       28
<210>169
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>169
caagggcgaa ggtgtggtct tctcgac                                        27
<210>170
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>170
ctcatcaacc gcgacgacgg cgtgttc                                        27
<210>171
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>171
accatatgac ggaatccacg acagatc                                        27
<210>172
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>172
cgaagctttc agtcggcgga cagggccac                                      29
<210>173
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>173
ctcctcgaag aagtcgtggt cctcgta                                        27
<210>174
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>174
atcatcgcgt cgaggcgttc gtcgacga                                       28
<210>175
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>175
ccaacatgat ctcgctcggc accttca                                        27
<210>176
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>176
cgtcatcttc tcgacgtcgg tcatcaa                                        27
<210>177
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>177
ctcatatgac ggacatgacg gaaaccccca                                     30
<210>178
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>178
cgaagctttc agacggcggc ctccgtca                                       28
<210>179
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>179
cagttcgtcg acgatccgct ggatcca                                        27
<210>180
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>180
tttgacggtg aacgacggga tcagcat                                        27
<210>181
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>181
gacatcgaga tcgacggcac caccatc                                        27
<210>182
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>182
gtcctcttct ccacctcggt catcaac                                        27
<210>183
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>183
cgaggtcttc atatgacgga actgacggac atc                                 33
<210>184
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>184
ccgccgaagc tttcaggcgg tgcgctcccg tac                                 33
<210>185
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>185
cgaggtcata tgacggaact gacggacatc                                     30
<210>186
<211>27
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>186
atgctgatcc cgtcgttcac cgtgaaa                                        27
<210>187
<211>28
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>187
cttctccgtg aagcggatca acgctctc                                       28
<210>188
<211>28
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>188
tcgtcgacga acgcctcgac gcgatgat                                       28
<210>189
<211>27
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>189
atggtcatct gcgaactgct cggcgtg                                        27
<210>190
<211>78
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>190
cgggatccca tatgacagat atgacagata ctgcagacgt taaaccacta tctgcaccag    60
ttgcatttcc tcaagata                                                  78
<210>191
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>191
agttgcattt cctcaagata gaacctgtcc attccagcct cctactgggt atgatccact    60
tcgtgaagct                                                           70
<210>192
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>192
atgatccact tcgtgaagct aggcctcttg ctagagttac actttacgat ggaagggcta    60
tctggcttgt                                                           70
<210>193
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>193
gttgatgacc ctgaacatca cactcaaagg cggatgttag ttcctagctt tacactcaag    60
cgcgctgctg                                                           70
<210>194
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>194
tacactcaag cgcgctgctg cgttgaggcc agccattcag aggattgtcg atgagtgcat    60
agatgctatg                                                           70
<210>195
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>195
atgagtgcat agatgctatg ttagctaagg gaccacctgc agagttggtt aacgccttcg    60
cacttcccgt                                                           70
<210>196
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>196
tgctacttag gagcactgat tgaccgcaag tccgaatcat ccgttggtga tggtgtcctc    60
gacgccttgg                                                           70
<210>197
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>197
tggtgtcctc gacgccttgg ttcacgagca attgagagaa ggagctgtgg ataggcagga    60
ggctatcagc                                                           70
<210>198
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>198
ataggcagga ggctatcagc ttggccacga ttctgttggt cgctggtcat gaaaccactg    60
ctaatatgat                                                           70
<210>199
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>199
caagccacag aggacatcga ggtggcaggt actactatta gagccggtga aggcgtggtc    60
tttgcgacct                                                           70
<210>200
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>200
aggcgtggtc tttgcgacct ctgtaatcaa cagagatggg gaggtttacg cagaacccga    60
cgccctcgat                                                           70
<210>201
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>201
cagaacccga cgccctcgat tggcataggc ccaccagaca tcacgtggca ttcggctttg    60
gcattcatca                                                           70
<210>202
<211>79
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>202
accagatgct gtccgcttta aaccaggtga cacgattcag ggaatgctgg atcttcccgt    60
ggcctggtag aagcttggg                                                 79
<210>203
<211>80
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>203
gatggagata gcacttcgta gtttgttcga gagagtgcct gggttgagac tcgacattgc    60
accagatgct gtccgcttta                                                80
<210>204
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>204
ttcggctttg gcattcatca atgtctcgga cagaatctag cacgtgccga gatggagata    60
gcacttcgta                                                           70
<210>205
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>205
ctgttgatga gttgatgagg atgctttcta tagcggacgg gctgatgaga caagccacag    60
aggacatcga                                                           70
<210>206
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>206
ccccgagcga ctggcggaat tgagggatga cccgagtttg tggcctgctg ctgttgatga    60
gttgatgagg                                                           70
<210>207
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>207
gaaaccactg ctaatatgat ctcattgggc acttatacat tactccaaca ccccgagcga    60
ctggcggaat                                                           70
<210>208
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>208
tacgcggacg ggatgtggac gaggtgcgtg atgcaaggga ccagctcgat tgctacttag    60
gagcactgat                                                           70
<210>209
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>209
tgtaccgtat gccgatcatg aattctttga ggaacaaagt cgtaggcttc tacgcggacg    60
ggatgtggac                                                           70
<210>210
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>210
aacgccttcg cacttcccgt tccatcaatg gtgatatgtg aactgctcgg tgtaccgtat    60
gccgatcatg                                                           70
<210>211
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>211
cctctccacg cattgtagca ttcagagacc gcagggctgc ccttcttaat gttgatgacc    60
ctgaacatca                                                           70
<210>212
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>212
cgcagattca cgactatcgt ccgatagact tcgacctggc tttccagcta cctctccacg    60
cattgtagca                                                           70
<210>213
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>213
ggaagggcta tctggcttgt taccggacgt gaccttgcta gaagcctgct cgcagattca    60
cgactatcgt                                                           70
<210>214
<211>1227
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(1227)
<223>设计的编码SEQ ID No.1的氨基酸序列的多核苷酸
<400>214
atg aca gat atg aca gat act gca gac gtt aaa cca cta tct gca cca      48
Met Thr Asp Met Thr Asp Thr Ala Asp Val Lys Pro Leu Ser Ala Pro
  1               5                  10                  15
gtt gca ttt cct caa gat aga acc tgt cca ttc cag cct cct act ggg      96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Phe Gln Pro Pro Thr Gly
             20                  25                  30
tat gat cca ctt cgt gaa gct agg cct ctt gct aga gtt aca ctt tac     144
Tyr Asp Pro Leu Arg Glu Ala Arg Pro Leu Ala Arg Val Thr Leu Tyr
         35                  40                  45
gat gga agg gct atc tgg ctt gtt acc gga cgt gac ctt gct aga agc     192
Asp Gly Arg Ala Ile Trp Leu Val Thr Gly Arg Asp Leu Ala Arg Ser
     50                  55                  60
ctg ctc gca gat tca cga cta tcg tcc gat aga ctt cga cct ggc ttt     240
Leu Leu Ala Asp Ser Arg Leu Ser Ser Asp Arg Leu Arg Pro Gly Phe
65                  70                  75                  80
cca gct acc tct cca cgc att gta gca ttc aga gac cgc agg gct gcc     288
Pro Ala Thr Ser Pro Arg Ile Val Ala Phe Arg Asp Arg Arg Ala Ala
                85                  90                  95
ctt ctt aat gtt gat gac cct gaa cat cac act caa agg cgg atg tta     336
Leu Leu Asn Val Asp Asp Pro Glu His His Thr Gln Arg Arg Met Leu
            100                 105                 110
gtt cct agc ttt aca ctc aag cgc gct gct gcg ttg agg cca gcc att     384
Val Pro Ser Phe Thr Leu Lys Arg Ala Ala Ala Leu Arg Pro Ala Ile
        115                 120                 125
cag agg att gtc gat gag tgc ata gat gct atg tta gct aag gga cca     432
Gln Arg Ile Val Asp Glu Cys Ile Asp Ala Met Leu Ala Lys Gly Pro
    130                 135                 140
cct gca gag ttg gtt aac gcc ttc gca ctt ccc gtt cca tca atg gtg     480
Pro Ala Glu Leu Val Asn Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
ata tgt gaa ctg ctc ggt gta ccg tat gcc gat cat gaa ttc ttt gag     528
Ile Cys Glu Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gaa caa agt cgt agg ctt cta cgc gga cgg gat gtg gac gag gtg cgt     576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Arg Asp Val Asp Glu Val Arg
            180                 185                 190
gat gca agg gac cag ctc gat tgc tac tta gga gca ctg att gac cgc     624
Asp Ala Arg Asp Gln Leu Asp Cys Tyr Leu Gly Ala Leu Ile Asp Arg
        195                 200                 205
aag tcc gaa tca tcc gtt ggt gat ggt gtc ctc gac gcc ttg gtt cac    672
Lys Ser Glu Ser Ser Val Gly Asp Gly Val Leu Asp Ala Leu Val His
    210                 215                 220
gag caa ttg aga gaa gga gct gtg gat agg cag gag gct atc agc ttg    720
Glu Gln Leu Arg Glu Gly Ala Val Asp Arg Gln Glu Ala Ile Ser Leu
225                 230                 235                 240
gcc acg att ctg ttg gtc gct ggt cat gaa acc act gct aat atg atc    768
Ala Thr Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met Ile
                245                 250                 255
tca ttg ggc act tat aca tta ctc caa cac ccc gag cga ctg gcg gaa    816
Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Glu Arg Leu Ala Glu
            260                 265                 270
ttg agg gat gac ccg agt ttg tgg cct gct gct gtt gat gag ttg atg    864
Leu Arg Asp Asp Pro Ser Leu Trp Pro Ala Ala Val Asp Glu Leu Met
        275                 280                 285
agg atg ctt tct ata gcg gac ggg ctg atg aga caa gcc aca gag gac    912
Arg Met Leu Ser Ile Ala Asp Gly Leu Met Arg Gln Ala Thr Glu Asp
    290                 295                 300
atc gag gtg gca ggt act act att aga gcc ggt gaa ggc gtg gtc ttt    960
Ile Glu Val Ala Gly Thr Thr Ile Arg Ala Gly Glu Gly Val Val Phe
305                 310                 315                 320
gcg acc tct gta atc aac aga gat ggg gag gtt tac gca gaa ccc gac   1008
Ala Thr Ser Val Ile Asn Arg Asp Gly Glu Val Tyr Ala Glu Pro Asp
                325                 330                 335
gcc ctc gat tgg cat agg ccc acc aga cat cac gtg gca ttc ggc ttt   1056
Ala Leu Asp Trp His Arg Pro Thr Arg His His Val Ala Phe Gly Phe
            340                 345                 350
ggc att cat caa tgt ctc gga cag aat cta gca cgt gcc gag atg gag   1104
Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Met Glu
        355                 360                 365
ata gca ctt cgt agt ttg ttc gag aga gtg cct ggg ttg aga ctc gac   1152
Ile Ala Leu Arg Ser Leu Phe Glu Arg Val Pro Gly Leu Arg Leu Asp
    370                 375                 380
att gca cca gat gct gtc cgc ttt aaa cca ggt gac acg att cag gga   1200
Ile Ala Pro Asp Ala Val Arg Phe Lys Pro Gly Asp Thr Ile Gln Gly
385                 390                 395                 400
atg ctg gat ctt ccc gtg gcc tgg tag                               1227
Met Leu Asp Leu Pro Val Ala Trp
                405
<210>215
<211>416
<212>PRT
<213>装饰链霉菌(Streptomyces ornatus)IFO 13069t
<400>215
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Pro Ala Pro Thr
  1               5                  10                  15
Ala Pro Pro Thr Gln Pro Thr Ser Thr Thr Pro Phe Pro Gln Asn Arg
             20                  25                  30
Asp Cys Pro Tyr His Pro Pro Thr Gly Tyr Gln Pro Leu Arg Ala Asp
         35                  40                  45
Arg Pro Leu Ser Arg Val Thr Leu Phe Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
 65                  70                  75                  80
Ser Thr Asp Arg Thr His Pro Asp Phe Pro Val Pro Ala Glu Arg Phe
                 85                  90                  95
Ala Asn Val Glu Arg Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                 105                 110
Glu His Asn Ala Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Gly Leu
    130                 135                 140
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
Pro Tyr Ala Asp His Glu Phe Phe Glu Gly Cys Ser Arg Arg Leu Leu
            180                 185                 190
Gln Gly Pro Gly Ala Ala Asp Val Asn Glu Ala Arg Ile Glu Leu Glu
        195                 200                 205
Gly Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Val Glu Pro Gly Glu
    210                 215                 220
Gly Leu Leu Asp Glu Leu Ile His Arg Asp His Pro Gly Gly Pro Val
225                 230                 235                 240
Asp Arg Glu Asp Leu Val Ser Phe Ala Val Ile Leu Leu Val Ala Gly
                245                 250                 255
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
Asn His Pro Glu Gln Leu Glu Ala Leu Arg Ser Gly Ser Thr Thr Thr
        275                 280                 285
Ala Ala Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
Leu Gln Arg Leu Ala Thr Glu Asp Ile Glu Val Ala Gly Thr Thr Ile
305                 310                 315                 320
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Ile Asn Arg Asp
                325                 330                 335
Thr Glu Val Tyr Glu Asn Pro Glu Thr Leu Asp Trp Asp Arg Pro Ser
            340                 345                 350
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
Asn Leu Ala Arg Thr Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Ala His Glu Ile Arg His
385                 390                 395                 400
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu His Leu Pro Val Ala Trp
                405                 410                 415
<210>216
<211>416
<212>PRT
<213>灰色链霉菌(Streptomyces griseus)ATCC 10137
<400>216
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Pro Ala Pro Thr
  1               5                  10                  15
Ala Pro Pro Thr Gln Pro Thr Ser Thr Thr Pro Phe Pro Gln Asn Arg
             20                  25                  30
Asp Cys Pro Tyr His Pro Pro Thr Gly Tyr Gln Pro Leu Arg Ala Asp
         35                  40                  45
Arg Pro Leu Ser Arg Val Thr Leu Phe Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
 65                  70                  75                  80
Ser Thr Asp Arg Thr His Pro Asp Phe Pro Val Pro Ala Glu Arg Phe
                 85                  90                  95
Ala Asn Val Glu Arg Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                 105                 110
Glu His Asn Ala Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Gly Leu
    130                 135                 140
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
Pro Tyr Ala Asp His Glu Phe Phe Glu Gly Cys Ser Arg Arg Leu Leu
            180                 185                 190
Gln Gly Pro Gly Ala Ala Asp Val Asn Glu Ala Arg Ile Glu Leu Glu
        195                 200                 205
Gly Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Val Glu Pro Gly Glu
    210                 215                 220
Gly Leu Leu Asp Glu Leu Ile His Arg Asp His Pro Gly Gly Pro Val
225                 230                 235                 240
Asp Arg Glu Asp Leu Val Ser Phe Ala Val Ile Leu Leu Val Ala Gly
                245                 250                 255
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
Asn His Pro Glu Gln Leu Glu Ala Leu Arg Ser Gly Arg Thr Thr Thr
        275                 280                 285
Ala Ala Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
Leu Gln Arg Leu Ala Thr Glu Asp Ile Glu Val Ala Gly Thr Thr Ile
305                 310                 315                 320
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Ile Asn Arg Asp
                325                 330                 335
Thr Glu Val Tyr Glu Asn Pro Glu Thr Leu Asp Trp Asp Arg Pro Ser
            340                 345                 350
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
Asn Leu Ala Arg Thr Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Ala His Glu Ile Arg His
385                 390                 395                 400
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu His Leu Pro Val Ala Trp
                405                 410                 415
<210>217
<211>409
<212>PRT
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<400>217
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Ala Glu Ala Glu Pro
  1               5                  10                  15
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
Asp Gly Arg Glu Ala Trp Leu Val Thr Gly Gln Ala Thr Ala Arg Ala
     50                  55                  60
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
Pro Val Pro Thr Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Val Ala
                 85                  90                  95
Leu Leu Gly Val Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
Ile Pro Ser Phe Thr Leu Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
Gln Arg Ile Val Asp Glu Leu Leu Asp Ala Met Ile Glu Arg Gly Pro
    130                 135                 140
Gly Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
Ile Cys Gly Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Thr Ser Ala Asp Thr Leu
            180                 185                 190
Asp Ala Arg Asp Arg Leu Glu Arg Phe Leu Gly Asp Leu Ile Asp Ala
        195                 200                 205
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Asp Leu Val
    210                 215                 220
His His Arg Leu Arg Glu Gly Glu Leu Asp Arg Gly Asp Leu Val Ser
225                 230                 235                 240
Leu Ala Val Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Asp Arg Leu Ala
            260                 265                 270
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
Met Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
Asp Val Glu Ile Ala Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
Asp Ala Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
Gly Met Leu Glu Leu Pro Val Thr Trp
                405
<210>218
<211>416
<212>PRT
<213>灰色链霉菌(Streptomyces griseus)IFO 13849T
<400>218
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Ala Ala Leu Thr
  1               5                  10                  15
Gly Ala Thr Thr Glu Pro Thr Ser Ala Pro Pro Phe Pro Gln Asp Arg
             20                  25                  30
Glu Cys Pro Tyr His Pro Pro Thr Gly Tyr Glu Pro Leu Arg Ala Asp
         35                  40                  45
Arg Pro Leu Ser Arg Val Thr Leu Tyr Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
 65                  70                  75                  80
Ser Thr Asp Arg Thr His Pro Ala Phe Pro Val Pro Ala Glu Arg Phe
                 85                  90                  95
Ala Gln Thr Arg Gln Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                 105                 110
Glu His Asn Thr Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Arg Leu
    130                 135                 140
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
Pro Tyr Ala Asp His Ala Leu Phe Glu Gly Cys Ser Arg Arg Leu Leu
            180                 185                 190
Arg Gly Pro Gly Ala Asp Asp Val Asp Ala Ala Arg Val Glu Leu Glu
        195                 200                 205
Glu Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Ala Asp Pro Gly Glu
    210                 215                 220
Gly Leu Leu Asp Glu Leu Ile His Arg Asp Arg Pro Asp Gly Pro Val
225                 230                 235                 240
Ser Arg Glu Asp Leu Val Ser Phe Ala Leu Ile Leu Leu Val Ala Gly
                245                 250                 255
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
Arg His Pro Gly Gln Leu Ala Ala Leu Arg Ser Gly Glu Thr Thr Thr
        275                 280                 285
Ala Val Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
Leu Gln Arg Leu Ala Ile Glu Asp Ile Glu Val Asp Gly Thr Thr Ile
305                 310                 315                 320
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Val Asn Arg Asp
                325                 330                 335
Ala Asp Val Phe Ala Asp Pro Glu Thr Leu Asp Trp Glu Arg Ser Ala
            340                 345                 350
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
Asn Leu Ala Arg Ala Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
Arg Leu Pro Ala Leu Arg Leu Ala Val Pro Ala Asp Glu Val Arg His
385                 390                 395                 400
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu Glu Leu Pro Val Ala Trp
                405                 410                 415
<210>219
<211>405
<212>PRT
<213>羊毛链霉菌(Streptomyces lanatus)IFO 12787T
<400>219
Met Thr Asp Met Thr Asp Met Thr Arg Pro Pro Thr Val Ala Phe Pro
  1               5                  10                  15
Gln Asn Arg Thr Cys Pro Tyr His Pro Pro Thr Ala Tyr Asp Pro Leu
             20                  25                  30
Arg Asp Thr Arg Pro Leu Ala Arg Ilc Thr Leu Tyr Asp Gly Arg Pro
         35                  40                  45
Val Trp Leu Val Thr Gly His Ala Leu Ala Arg Thr Leu Leu Ala Asp
    50                  55                  60
Pro Arg Leu Ser Ser Asp Arg Gly Arg Pro Gly Phe Pro Ala Pro Asn
 65                  70                  75                  80
Glu Arg Phe Ala Ala Val Arg Asp Arg Lys Ser Ala Leu Leu Gly Val
                 85                  90                  95
Asp Asp Pro Glu His Arg Val Gln Arg Arg Met Met Val Pro Ser Phe
            100                 105                 110
Thr Leu Arg Arg Ala Ala Glu Leu Arg Pro Gln Ile Gln Arg Ile Val
        115                 120                 125
Asp Glu Arg Leu Asp Ala Met Ile Asp Gln Gly Ala Pro Ala Glu Leu
    130                 135                 140
Val Asn Ala Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu
145                 150                 155                 160
Leu Gly Val Pro Tyr Ala Asp His Asp Phe Phe Glu Gly Glu Ser Arg
                165                 170                 175
Arg Leu Leu Arg Gly Ala Thr Ala Ala Glu Ala Met Asp Ala Arg Asp
            180                 185                 190
Arg Leu Glu Asn Tyr Phe Ile Glu Leu Ile Asp Arg Lys Gln Lys Asp
        195                 200                 205
Pro Glu Pro Gly Asp Gly Val Leu Asp Glu Leu Val His Arg Gln Leu
    210                 215                 220
Arg Asp Gly Asp Leu Asp Arg Glu Glu Val Val Ala Leu Ser Thr Ile
225                 230                 235                 240
Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly
                245                 250                 255
Thr Phe Thr Leu Leu Gln His Pro Glu Gln Leu Ala Glu Leu Arg Ala
            260                 265                 270
Asp Ala Gly Leu Leu Pro Ala Ala Val Glu Glu Leu Met Arg Met Leu
        275                 280                 285
Ser Ile Ala Asp Gly Leu Leu Arg Val Ala Ser Glu Asp Ile Glu Ala
    290                 295                 300
Gly Gly Glu Thr Ile Arg Ala Gly Asp Gly Val Val Phe Ser Thr Ser
305                 310                 315                 320
Val Ile Asn Arg Asp Glu Ser Val Tyr Pro Asp Pro Asp Ala Ile Asp
                325                 330                 335
Trp His Arg Pro Thr Arg His His Ile Ala Phe Gly Phe Gly Ile His
            340                 345                 350
Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Met Glu Ile Ala Leu
        355                 360                 365
Arg Thr Leu Phe Glu Arg Leu Pro Thr Leu Arg Leu Ala Val Pro Ala
    370                 375                 380
Gly Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln Gly Met Leu Glu
385                 390                 395                 400
Leu Pro Val Thr Trp
                405
<210>220
<211>414
<212>PRT
<213>三泽链霉菌(Streptomyces misawanensis)IFO 13855T
<400>220
Met Lys Glu Leu Thr Asp Leu Thr Glu Pro Ile Ser Pro Ala Gly Gln
  1               5                  10                  15
Ala Asp Pro Val Ala Trp Pro Gln Asp Arg Thr Cys Pro Tyr His Pro
             20                  25                  30
Pro Thr Gly Tyr Asp Pro Leu Arg Asp Gly Thr Pro Leu Ser Arg Val
         35                  40                  45
Thr Leu Tyr Asp Gly Arg Thr Val Trp Ala Val Thr Gly His Gly Thr
     50                  55                  60
Ala Arg Ala Leu Leu Ser Asp Pro Arg Leu Ser Ser Asp Arg Arg Arg
 65                  70                  75                  80
Asp Asp Phe Pro Met Pro Asn Ala Arg Phe Ala Ala Ala Arg Glu Arg
                 85                  90                  95
Arg Gln Leu Ala Leu Leu Gly Leu Asp Asp Pro Glu His Gln Ile Gln
            100                 105                 110
Arg Arg Met Leu Ile Pro Asp Phe Thr Leu Lys Arg Ala Thr Val Met
        115                 120                 125
Arg Pro Ala Ile Gln Arg Ile Val Asp Asp Leu Leu Asp Arg Met Ile
    130                 135                 140
Ala Ala Gly Pro Pro Ala Asp Leu Val Ser Ser Phe Ala Leu Pro Val
145                 150                 155                 160
Pro Ser Met Val Ile Cys Asp Leu Leu Gly Val Pro Tyr Ala Asp His
                165                 170                 175
Glu Phe Phe Glu Ala Gln Ser Arg Arg Leu Leu Arg Gly Pro Ala Pro
            180                 185                 190
Ala Asp Ser Leu Asp Ala Arg Asp Gln Leu Glu Ala Tyr Leu Gly Asp
        195                 200                 205
Leu Ala Asp Arg Lys Ser Arg Asp Ala Val Pro Gly Asp Gly Val Leu
    210                 215                 220
Asp Asp Leu Val His Gln Arg Leu Arg Asp Gly Ala Leu Asp Arg Ala
225                 230                 235                 240
Glu Val Val Ala Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr
                245                 250                 255
Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln Gln Pro
            260                 265                 270
Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Ala Leu Val Pro Ala Ala
        275                 280                 285
Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu Arg
    290                 295                 300
Val Ala Leu Glu Asp Ile Glu Thr Asp Gly Gly Thr Thr Ile Arg Lys
305                 310                 315                 320
Gly Glu Gly Val Leu Phe Ala Thr Ser Val Ile Asn Arg Asp Glu Ser
                325                 330                 335
Val Tyr Asp Asp Pro Asp Ala Leu Asp Trp His Arg Pro Ala Arg His
            340                 345                 350
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
        355                 360                 365
Ala Arg Thr Glu Leu Glu Ile Ala Leu Arg Thr Leu Trp Glu Arg Leu
    370                 375                 380
Pro Asp Leu Arg Leu Ala Ala Pro Pro Glu Glu IIe Pro Phe Lys Pro
385                 390                 395                 400
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
                405                 410
<210>221
<211>409
<212>PRT
<213>苍白色链霉菌(Streptomyces pallidus)IFO 13434T
<400>221
Met Ala Asp Thr Leu Ala Gly Ala Thr Pro Asp Ala Ala Ala Thr Val
  1               5                  10                  15
Pro Ala Tyr Pro Met Ala Arg Ala Ala Gly Cys Pro Phe Asp Pro Pro
             20                  25                  30
Pro Asp Leu Thr Ala Arg Gln Asp Glu Gly Arg Leu Val Arg Val Arg
         35                  40                  45
Leu Trp Asp Gly Ser Thr Pro Trp Leu Val Thr Arg Tyr Glu Asp Gln
     50                  55                  60
Arg Ala Leu Leu Leu Asp Pro Arg Val Ser Ala Asp Ile Thr Arg Pro
 65                  70                  75                  80
Gly Tyr Pro Leu Gln Ala Ala Gly Ala Gly Glu Asn Asn Ala Ser Phe
                 85                  90                  95
Ile Leu Met Asp Asp Pro Glu His Ala Arg Leu Arg Arg Met Val Thr
            100                 105                 110
Ala Pro Phe Ala Ile Lys Arg Val Glu Ala Met Arg Pro Gly Val Gln
        115                 120                 125
Gln Leu Val Asp Asp Leu Ile Asp Gly Met Leu Ala Gly Pro Lys Pro
    130                 135                 140
Val Asp Leu Val Glu Ala Phe Ala Leu Pro Val Pro Ser Leu Val Ile
145                 150                 155                 160
Cys Arg Met Leu Gly Val Pro Tyr Glu Asp His Asp Phe Phe Gln Glu
                165                 170                 175
Asn Ser Arg Ile Leu Ile Lys Arg Asp Ala Ala Met Glu Asp Arg Met
            180                 185                 190
Ala Ala His Gly Arg Leu Ile Ala Tyr Leu Asp Glu Leu Met Gly Glu
        195                 200                 205
Lys Thr Ala Arg Pro Ala Asp Asp Leu Leu Ser Gly Leu Val Glu Arg
    210                 215                 220
Val Arg Thr Gly Glu Leu Thr Arg Arg Glu Ser Ala Arg Met Gly Val
225                 230                 235                 240
Leu Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met Ile Ala Leu
                245                 250                 255
Gly Thr Leu Ala Leu Leu Glu His Pro Asp Gln Leu Ala Leu Leu Arg
            260                 265                 270
Asp Thr Asp Asp Pro Lys Leu Val Ala Gly Ala Ala Glu Glu Leu Leu
        275                 280                 285
Arg Tyr Leu Thr Ile Val His Asn Gly Arg Arg Arg Ala Ala Leu Ala
    290                 295                 300
Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Gly Glu Gly Met Ile
305                 310                 315                 320
Met Pro Asn Asp Leu Ala Asn Arg Asp Pro Gly Ala Phe Thr Asp Pro
                325                 330                 335
Asp Arg Leu Asp Leu Arg Arg Asp Ala Arg Arg His Ile Ala Phe Gly
            340                 345                 350
Phe Gly Val His Gln Cys Leu Gly Gln Pro Leu Ala Arg Met Glu Leu
        355                 360                 365
Gln Val Val Tyr Gly Thr Leu Tyr Arg Arg Ile Pro Thr Leu Arg Leu
    370                 375                 380
Ala Ala Pro Val Glu Ser Leu Ser Phe Lys His Asp Gly Ser Val Tyr
385                 390                 395                 400
Gly Val Tyr Glu Leu Pro Val Thr Trp
                405
<210>222
<211>398
<212>PRT
<213>玫瑰变红链霉菌(Streptomyces roseorubens)IFO 13682T
<400>222
Met Thr Asp Thr Thr Ala Pro Val Ala Phe Pro Gln Ser Arg Thr Cys
  1               5                  10                  15
Pro Tyr His Pro Pro Ala Ala Tyr Glu Pro Leu Arg Ala Glu Arg Pro
             20                  25                  30
Leu Thr Arg Ile Thr Leu Phe Asp Gly Arg Glu Ala Trp Leu Val Ser
         35                  40                  45
Gly His Ala Thr Ala Arg Ala Leu Leu Ala Asp Pro Arg Leu Ser Ser
     50                  55                  60
Asp Arg Asp Arg Pro Gly Phe Pro Thr Pro Thr Ala Arg Phe Ala Gly
 65                  70                  75                  80
Ile Arg Asn Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro Glu His
                 85                  90                  95
Arg Ala Gln Arg Arg Met Val Val Gly Asp Phe Thr Leu Lys Arg Ala
            100                 105                 110
Ala Ala Leu Arg Pro Arg Ile Gln Arg Ile Val Asp Glu Arg Leu Asp
        115                 120                 125
Ala Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val Ser Ala Phe Ala
    130                 135                 140
Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Pro Tyr
145                 150                 155                 160
Ala Asp His Asp Phe Phe Glu Ala Gln Ser Arg Arg Leu Leu Arg Gly
                165                 170                 175
Pro Gly Thr Ala Asp Val Gln Asp Ala Arg Ser Arg Leu Glu Glu Tyr
            180                 185                 190
Phe Gly Glu Leu Ile Asp Arg Lys Arg Glu Asp Pro Gly Thr Gly Leu
        195                 200                 205
Leu Asp Asp Leu Val Gln Arg Gln Pro Gly Asp Gly Gly Pro Asp Arg
    210                 215                 220
Glu Gly Leu Ile Ala Met Ala Leu Ile Leu Leu Val Ala Gly His Glu
225                 230                 235                 240
Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln His
                245                 250                 255
Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Ser Glu Val Met Pro Ala
            260                 265                 270
Ala Val Glu Glu Leu Met Arg Leu Leu Ser Ile Ala Asp Gly Leu Leu
        275                 280                 285
Arg Ile Ala Val Glu Asp Val Glu Val Ala Gly Thr Thr Ile Arg Ala
    290                 295                 300
Gly Glu Gly Val Val Phe Ala Thr Ser Val Ile Asn Arg Asp Glu Thr
305                 310                 315                 320
Val Phe Ala Glu Pro Asp Thr Leu Asp Trp Ser Arg Pro Ala Arg His
                325                 330                 335
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
            340                 345                 350
Ala Arg Ala Glu Leu Glu Ile Ala Leu Gly Thr Leu Phe Gly Arg Leu
        355                 360                 365
Pro Thr Leu Arg Leu Ala Ala Pro Pro Asp Glu Ile Pro Phe Lys Pro
    370                 375                 380
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
385                 390                 395
<210>223
<211>414
<212>PRT
<213>鲁地链霉菌(Streptomyces rutgersensis)IFO 15875T
<400>223
Met Thr Glu Thr Leu Ala Glu Thr Thr Thr Glu Ala Glu Glu Pro Leu
  1               5                  10                  15
Pro Glu Phe Pro Met Pro Arg Ala Asn Gly Cys Pro Phe Ala Pro Pro
             20                  25                  30
Pro Thr Ala Arg Ala Leu His Thr Glu Arg Pro Val Thr Arg Val Arg
         35                  40                  45
Leu Trp Asp Gly Ser Ala Pro Trp Leu Val Thr Arg Tyr Ala Asp Gln
     50                  55                  60
Arg Ala Leu Leu Gly Asp Pro Arg Val Ser Ser Glu Ala Thr Arg Pro
 65                  70                  75                  80
Gly Phe Pro His Ala Ser Ala Gly Phe Arg Glu Asn Ala Arg Arg Arg
                 85                  90                  95
Arg Ser Phe Ile Thr Met Asp Asp Pro Glu His Ala Arg Ile Arg Arg
            100                 105                 110
Met Val Thr Ala Pro Phe Ala Ile Lys Arg Val Glu Ala Met Arg Pro
        115                 120                 125
Asp Ile Gln Lys Ile Thr Asp Asp Leu Ile Asp Ser Met Leu Ala Gly
    130                 135                 140
Pro Thr Pro Val Asp Leu Val Arg Ala Leu Ala Leu Pro Leu Pro Ser
145                 150                 155                 160
Leu Val Ile Cys Arg Leu Leu Gly Val Pro Tyr Glu Asp His Asp Phe
                165                 170                 175
Phe Gln Arg Asn Ser Ser Leu Leu Ile Asn Arg Asn Ser Thr Thr Glu
            180                 185                 190
Glu Val Val Gly Ala Asn Glu Ala Leu Thr Asp Tyr Leu Asp Glu Leu
        195                 200                 205
Val Ser Ala Lys Leu Ala Asn Pro Ala Asp Asp Met Leu Ser Glu Leu
    210                 215                 220
Ala Ala Arg Val Thr Ala Gly Glu Leu Thr Gln Arg Glu Ala Ala Asn
225                 230                 235                 240
Met Gly Val Leu Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
Ile Ala Leu Gly Thr Val Ala Leu Leu Glu Asn Pro Asp Gln Leu Ala
            260                 265                 270
Val Leu Arg Glu Thr Asp Asp Pro Lys Ala Val Ala Lys Ala Val Glu
        275                 280                 285
Glu Leu Leu Arg Tyr Leu Thr Ile Val His Thr Gly Arg Arg Arg Val
    290                 295                 300
Ala Arg Glu Asp Ile Glu Ile Gly Gly Glu Thr Ile Arg Ala Gly Asp
305                 310                 315                 320
Gly Ile Ile Ile Tyr Thr Gly Thr Gly Asn Trp Asp Ala Glu Val Phe
                325                 330                 335
Pro Glu Pro Glu Arg Leu Asp Ile Gly Arg Asp Ala Arg Arg His Met
            340                 345                 350
Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln Pro Leu Ala Arg
        355                 360                 365
Val Glu Leu Gln Val Val Tyr Gly Thr Leu Tyr Arg Arg Ile Pro Thr
    370                 375                 380
Leu Arg Leu Ala Thr Gly Val Asp Gln Leu Pro Phe Lys Asp Asp Gly
385                 390                 395                 400
Leu Val Tyr Gly Val Tyr Glu Leu Pro Val Thr Trp Thr Ser
                405                 410
<210>224
<211>398
<212>PRT
<213>斯堡链霉菌(Streptomyces steffisburgensis)IFO 13446T
<400>224
Met Ser Asp Thr Thr Ala Pro Val Ala Phe Pro Gln Ser Arg Thr Cys
  1               5                  10                  15
Pro Tyr His Pro Pro Ala Ala Tyr Glu Pro Leu Arg Ala Glu Arg Pro
             20                  25                  30
Leu Thr Arg Ile Thr Leu Phe Asp Gly Arg Glu Ala Trp Leu Val Ser
         35                  40                  45
Gly His Ala Thr Ala Arg Ala Leu Leu Ala Asp Pro Arg Leu Ser Ser
     50                  55                  60
Asp Arg Asp Arg Pro Gly Phe Pro Ala Pro Thr Ala Arg Phe Ala Gly
 65                  70                  75                  80
Ile Arg Asn Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro Glu His
                 85                  90                  95
Arg Val Gln Arg Arg Met Val Ala Gly Asp Phe Thr Leu Lys Arg Ala
            100                 105                 110
Ala Gly Leu Arg Pro Arg Ile Gln Arg Ile Val Asp Arg Arg Leu Asp
        115                 120                 125
Ala Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val Ser Ser Phe Ala
    130                 135                 140
Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Pro Tyr
145                 150                 155                 160
Ala Asp His Asp Phe Phe Glu Thr Gln Ser Arg Arg Leu Leu Arg Gly
                165                 170                 175
Pro Gln Thr Ala Asp Val Met Asp Ala Arg Ala Arg Leu Asp Glu Tyr
            180                 185                 190
Phe Gly Glu Leu Ile Asp Arg Lys Arg Lys Glu Pro Gly Ala Gly Leu
        195                 200                 205
Leu Asp Asp Leu Val Gln Arg Gln Leu Arg Asp Gly Ala Leu Asp Arg
    210                 215                 220
Glu Gly Leu Ile Ala Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu
225                 230                 235                 240
Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln His
                245                 250                 255
Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Arg Leu Leu Pro Ala
            260                 265                 270
Ala Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu
        275                 280                 285
Arg Leu Ala Val Glu Asp Ile Glu Val Ala Gly Thr Thr Ile Arg Lys
    290                 295                 300
Gly Asp Gly Val Val Phe Leu Thr Ser Val Ile Asn Arg Asp Glu Thr
305                 310                 315                 320
Val Tyr Pro Glu Pro Asp Thr Leu Asp Trp His Arg Ser Ala Arg His
                325                 330                 335
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
            340                 345                 350
Ala Arg Ala Glu Leu Glu Ile Ala Leu Trp Thr Leu Phe Asp Arg Leu
        355                 360                 365
Pro Thr Leu Arg Leu Ala Ala Pro Ala Glu Glu Ile Ala Phe Lys Pro
    370                 375                 380
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
385                 390                 395
<210>225
<211>1251
<212>DNA
<213>装饰链霉菌(Streptomyces ornatus)IFO 13069t
<220>
<221>CDS
<222>(1)..(1251)
<400>225
atg acg gaa tcc acg acg gaa ccg gcc cgc cag gac ccc gct ccc acc     48
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Pro Ala Pro Thr
  1               5                  10                  15
gcc cct ccg acg caa ccg acc tcc acg aca ccc ttc ccc cag aac cgc     96
Ala Pro Pro Thr Gln Pro Thr Ser Thr Thr Pro Phe Pro Gln Asn Arg
             20                  25                  30
gac tgc ccc tac cac ccg ccc acc ggg tac caa ccg ctc cgc gcg gac    144
Asp Cys Pro Tyr His Pro Pro Thr Gly Tyr Gln Pro Leu Arg Ala Asp
         35                  40                  45
cgg ccg ctc agc cgg gtc acc ctc ttc gac ggg cgt ccg gtc tgg gcc    192
Arg Pro Leu Ser Arg Val Thr Leu Phe Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
gtc acc ggc cac gcc ctg gcc cgc cgg cta ctg gcg gat ccg cgc ctg    240
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
 65                  70                  75                  80
tcc acc gat cgc acc cac ccc gac ttc ccc gtt ccg gcc gag cgg ttc    288
Ser Thr Asp Arg Thr His Pro Asp Phe Pro Val Pro Ala Glu Arg Phe
                 85                  90                  95
gcg aac gtc gag cgg cgg cgc gtg gcc ctg ctc ggc gtc gac gac ccc    336
Ala Asn Val Glu Arg Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                 105                 110
gag cac aac gcc cag cgc agg atg ctc atc ccg agc ttc tcc gtg aag    384
Glu His Asn Ala Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
cgg ata gcc gcg ctg cgc ccc cgc atc cag gag acg gtg gac gga ctg    432
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Gly Leu
    130                 135                 140
ctg gac gcg atg gag cgg cag ggc ccg ccg tcc gaa ctg gtc gcc gac    480
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
ttc gcg ctg ccg gtg ccg tcg atg gtg atc tgc gcg ctc ctc ggt gtg    528
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
ccg tac gcc gac cac gag ttc ttc gag ggc tgc tcc cgg cgg ctc ctg    576
Pro Tyr Ala Asp His Glu Phe Phe Glu Gly Cys Ser Arg Arg Leu Leu
            180                 185                 190
cag ggc ccg ggc gcg gcc gat gtg aac gag gcc cgg atc gag ctg gag    624
Gln Gly Pro Gly Ala Ala Asp Val Asn Glu Ala Arg Ile Glu Leu Glu
        195                 200                 205
ggc tat ctg ggc gcc ctg atc gac cgc aag cgg gtg gag ccg ggg gag    672
Gly Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Val Glu Pro Gly Glu
    210                 215                 220
ggg ctc ctg gac gaa ctg atc cac cgg gac cac ccc ggc gga ccc gtc    720
Gly Leu Leu Asp Glu Leu Ile His Arg Asp His Pro Gly Gly Pro Val
225                 230                 235                 240
gac cgc gag gac ctc gtc tcg ttc gcg gtg atc ctc ctc gtc gcg ggg    768
Asp Arg Glu Asp Leu Val Ser Phe Ala Val Ile Leu Leu Val Ala Gly
                245                 250                 255
cac gag acg acg gcg aac atg atc tcg ctc ggc acg ttc acg ctg ctg    816
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
aac cac ccg gaa cag ctg gag gcg ctg cgg tcc ggg agc acg acg acg    864
Asn His Pro Glu Gln Leu Glu Ala Leu Arg Ser Gly Ser Thr Thr Thr
        275                 280                 285
gcc gcg gtg gtc gag gaa ctg ctg cgg ttc ctc tcc atc gcc gag gga    912
Ala Ala Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
ctg caa cgg ctg gcc acc gag gac atc gag gtg gcc ggg acg acg atc    960
Leu Gln Arg Leu Ala Thr Glu Asp Ile Glu Val Ala Gly Thr Thr Ile
305                 310                 315                 320
cgc gag gga gag ggc gtg ttc ttc tcg acc tcg ctc atc aac cgc gac   1008
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Ile Asn Arg Asp
                325                 330                 335
acc gag gtc tac gag aat ccg gag acg ctc gac tgg gac cgg cct tcc   1056
Thr Glu Val Tyr Glu Asn Pro Glu Thr Leu Asp Trp Asp Arg Pro Ser
            340                 345                 350
cgg cac cac ctc gcc ttc ggc ttc ggc gtc cat cag tgc ctg ggc cag   1104
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
aat ctg gcc cgc acc gag ctc gac atc gcc ctg cgc act ctc ttc gag   1152
Asn Leu Ala Arg Thr Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
cgg ctg ccg gga ctc agg ctc gcc gtg ccc gcg cac gag atc cgg cac   1200
Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Ala His Glu Ile Arg His
385                 390                 395                 400
aaa ccc ggg gac acg atc cag ggc ctt ctg cac ctg ccc gtg gcc tgg   1248
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu His Leu Pro Val Ala Trp
                405                 410                 415
tga                                                               1251
<210>226
<211>1251
<212>DNA
<213>灰色链霉菌(Streptomyces griseus)ATCC 10137
<220>
<221>CDS
<222>(1)..(1251)
<400>226
atg acg gaa tcc acg acg gaa ccg gcc cgc cag gac ccc gct ccc acc     48
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Pro Ala Pro Thr
  1              5                  10                  15
gcc cct ccg acg caa ccg acc tcc acg aca ccc ttc ccc cag aac cgc     96
Ala Pro Pro Thr Gln Pro Thr Ser Thr Thr Pro Phe Pro Gln Asn Arg
             20                  25                  30
gac tgc ccc tac cac ccg ccc acc ggg tac caa ccg ctc cgc gcg gac    144
Asp Cys Pro Tyr His Pro Pro Thr Gly Tyr Gln Pro Leu Arg Ala Asp
         35                  40                  45
cgg ccg ctc agc cgg gtc acc ctc ttc gac ggg cgt ccg gtc tgg gcc    192
Arg Pro Leu Ser Arg Val Thr Leu Phe Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
gtc acc ggc cac gcc ctg gcc cgc cgg cta ctg gcg gat ccg cgc ctg    240
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
 65                  70                  75                  80
tcc acc gat cgc acc cac ccc gac ttc ccc gtt ccg gcc gag cgg ttc    288
Ser Thr Asp Arg Thr His Pro Asp Phe Pro Val Pro Ala Glu Arg Phe
                 85                  90                  95
gcg aac gtc gag cgg agg cga gtg gcc ctg ctc ggc gtc gac gac ccc    336
Ala Asn Val Glu Arg Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                 105                 110
gag cac aac gcc cag cgc agg atg ctc atc ccg agc ttc tcc gtg aag    384
Glu His Asn Ala Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
cgg ata gcc gcg ctg cgc ccc cgc atc cag gag acg gtg gac gga ctg    432
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Gly Leu
    130                 135                 140
ctg gac gcg atg gag cgg cag ggc ccg ccg tcc gaa ctg gtc gcc gac    480
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
ttc gcg ctg ccg gtg ccg tcg atg gtg atc tgc gcg ctc ctc ggt gtg    528
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
ccg tac gcc gac cac gag ttc ttc gag ggc tgc tcc cgg cgg ctc ctg    576
Pro Tyr Ala Asp His Glu Phe Phe Glu Gly Cys Ser Arg Arg Leu Leu
           180                 185                 190
cag ggc ccg ggc gcg gcc gat gtg aac gag gcc cgg atc gag ctg gag    624
Gln Gly Pro Gly Ala Ala Asp Val Asn Glu Ala Arg Ile Glu Leu Glu
        195                 200                 205
ggc tat ctg ggc gcc ctg atc gac cgc aag cgg gtg gag ccg ggg gag    672
Gly Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Val Glu Pro Gly Glu
    210                 215                 220
ggg ctc ctg gac gaa ctg atc cac cgg gac cac ccc ggc gga ccc gtc    720
Gly Leu Leu Asp Glu Leu Ile His Arg Asp His Pro Gly Gly Pro Val
225                 230                 235                 240
gac cgc gag gac ctc gtc tcg ttc gcg gtg atc ctc ctc gtc gcg ggg    768
Asp Arg Glu Asp Leu Val Ser Phe Ala Val Ile Leu Leu Val Ala Gly
                245                 250                 255
cac gag acg acg gcg aac atg atc tcg ctc ggc acg ttc acg ctg ctg     816
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
aac cac ccg gaa cag ctg gag gcg ctg cgc tcc ggg agg acg acg acg     864
Asn His Pro Glu Gln Leu Glu Ala Leu Arg Ser Gly Arg Thr Thr Thr
        275                 280                 285
gcc gcg gtg gtc gag gaa ctg ctg cgg ttc ctc tcc atc gcc gag gga     912
Ala Ala Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
ctg caa cgg ctg gcc acc gag gac atc gag gtg gcc ggg acg acg atc     960
Leu Gln Arg Leu Ala Thr Glu Asp Ile Glu Val Ala Gly Thr Thr Ile
305                 310                 315                 320
cgc gag gga gag ggc gtg ttc ttc tcg acc tcg ctc atc aac cgc gac    1008
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Ile Asn Arg Asp
                325                 330                 335
acc gag gtc tac gag aat ccg gag acg ctc gac tgg gac cgg cct tcc    1056
Thr Glu Val Tyr Glu Asn Pro Glu Thr Leu Asp Trp Asp Arg Pro Ser
            340                 345                 350
cgg cac cac ctc gcc ttc ggc ttc ggc gtc cac cag tgc ctg ggc cag    1104
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
aat ctg gcc cgc acc gag ctc gac atc gcc ctg cgc act ctc ttc gag    1152
Asn Leu Ala Arg Thr Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
cgg ctg ccg gga ctc agg ctc gcc gtg ccc gcg cac gag atc cgg cac    1200
Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Ala His Glu Ile Arg His
385                 390                 395                 400
aaa ccc ggg gac acg atc cag ggc ctt ctg cac ctg ccc gtg gcc tgg    1248
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu His Leu Pro Val Ala Trp
                405                 410                 415
tga                                                                1251
<210>227
<211>1230
<212>DNA
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<220>
<221>CDS
<222>(1)..(1230)
<400>227
atg acg gaa ctg acg gac atc acc ggc ccg gct gcc gag gcc gaa ccc      48
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Ala Glu Ala Glu Pro
  1               5                  10                  15
gtc gcc ttc ccc cag gac cgc acc tgt ccc tac cac ccc ccc acc gga      96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
tac gac ccg ctg cgc gac ggg cga ccc ctg tcc cgc gtc acc ctc tac     144
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgc gag gcc tgg ctg gtc acc ggc cag gcc acc gcc cgc gcc     192
Asp Gly Arg Glu Ala Trp Leu Val Thr Gly Gln Ala Thr Ala Arg Ala
     50                  55                  60
ctg ctc gcc gac ccg cgg ctg tcc acc gac cgc cgc cgc gac ggc ttc     240
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
 65                  70                  75                  80
ccc gtg ccc acc ccc cgc ttc gag gcc ggc cgc gac cgc aag gtg gcc    288
Pro Val Pro Thr Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Val Ala
                 85                  90                  95
ctg ctc ggg gtg gac gat ccc gag cac cac cag cag cgc cgg atg ctg    336
Leu Leu Gly Val Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
atc ccg tcg ttc acc ctc aaa cgc gcc acc gcg ctg cgc ccc tgg atc    384
Ile Pro Ser Phe Thr Leu Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
cag cgg atc gtg gac gaa ctg ctg gac gcg atg atc gag cgg ggg ccg    432
Gln Arg Ile Val Asp Glu Leu Leu Asp Ala Met Ile Glu Arg Gly Pro
    130                 135                 140
ggg gcc gaa ctg gtc tcc gcc ttc gcg ctg ccc gtg ccg tcc atg gtc    480
Gly Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc ggc ctg ctc ggc gtg ccc tac gcc gac cac gag ttc ttc gag    528
Ile Cys Gly Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gag cag tcc cgc cgg ctg ctg cgc ggg ccg acc agc gcc gac acc ctg    576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Thr Ser Ala Asp Thr Leu
            180                 185                 190
gac gcc cgg gac cgg ctg gag cgg ttc ctc ggc gac ctg atc gac gcc    624
Asp Ala Arg Asp Arg Leu Glu Arg Phe Leu Gly Asp Leu Ile Asp Ala
        195                 200                 205
aag gcc aag gag gcc gag ccc ggc gac ggc att ctg gac gac ctc gtc    672
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Asp Leu Val
    210                 215                 220
cac cac cgg ctc cgc gag ggc gaa ctg gac cgg ggt gac ctg gtg tcg    720
His His Arg Leu Arg Glu Gly Glu Leu Asp Arg Gly Asp Leu Val Ser
225                 230                 235                 240
ctc gcc gtg atc ctg ttg gtc gcc ggg cac gag acg acc gcc aac atg    768
Leu Ala Val Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc tcc ctg ggc acc tac acc ctg ctc cag cac ccc gac cgg ctg gcc    816
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Asp Arg Leu Ala
            260                 265                 270
gag ctg cgg gcc gac ccc gcg ctg ctg ccc gcc gtc gtc gag gaa ctg    864
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
atg cgg atg ctg tcc atc gcc gag ggg ctg caa cgg gtg gcg ctg gag    912
Met Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
gac gtc gag atc gcc ggc acc acc atc cgg gcc ggc gac ggc gtc ctg    960
Asp Val Glu Ile Ala Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
ttc tcc acc tcg gtc atc aac cgg gac acg gcc gtc tac gac gac ccc   1008
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
gac gcg ctg gac ttc cac cgc gcc gac cgg cac cac gtg gcg ttc ggc   1056
Asp Ala Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
ttc ggc atc cac cag tgc ctg ggc cag aac ctg gcg cgc gcg gag ctg   1104
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
gag atc gcc ctc ggc agc ctg ttc acc cgg ttg ccc ggg ctg cgg ctc   1152
Gln Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
gcc gct ccg gcc gag gag atc ccc ttc aaa ccg ggc gac acg atc cag   1200
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
ggg atg ctg gaa ctc ccc gtg acc tgg taa                           1230
Gly Met Leu Glu Leu Pro Val Thr Trp
                405
<210>228
<211>1251
<212>DNA
<213>灰色链霉菌(Streptomyces griseus)IFO 13849T
<220>
<221>CDS
<222>(1)..(1251)
<400>228
atg acg gaa tcc acg acg gaa ccg gcc cgc cag gac gcc gcc ctc acc     48
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Ala Ala Leu Thr
  1               5                  10                  15
ggc gcc acc acc gaa ccg acc tcc gcc cca ccg ttc ccg cag gac cgc     96
Gly Ala Thr Thr Glu Pro Thr Ser Ala Pro Pro Phe Pro Gln Asp Arg
             20                  25                  30
gag tgc ccc tac cac ccg ccc acc ggg tac gaa ccg ctg cgc gcg gac    144
Glu Cys Pro Tyr His Pro Pro Thr Gly Tyr Glu Pro Leu Arg Ala Asp
         35                  40                  45
cgg ccg ttg agc cgg gtc acg ctc tac gac gga cgc ccg gtc tgg gcc    192
Arg Pro Leu Ser Arg Val Thr Leu Tyr Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
gtc acc gga cac gcc ctg gcc cgc cgc ctc ctg gcc gac ccc cga ctc    240
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
 65                  70                  75                  80
tcc acc gac cgc acc cac ccc gcc ttc ccc gtc ccg gcc gag cgg ttc    288
Ser Thr Asp Arg Thr His Pro Ala Phe Pro Val Pro Ala Glu Arg Phe
                 85                  90                  95
gcg cag acc cgg cag cgg cgc gtg gcc ctg ctc ggc gtc gac gac ccc    336
Ala Gln Thr Arg Gln Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                 105                 110
gag cac aac acc cag cgc agg atg ctc atc ccg agc ttc tcc gtg aaa    384
Glu His Asn Thr Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
cgg atc gcc gcg ctg cgc ccc cgt atc cag gag acg gtg gac cgg ctg    432
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Arg Leu
    130                 135                 140
ctg gac gcc atg gag cgg cag ggg ccg ccg tcc gaa ctg gtc gcc gac    480
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
ttc gcg ctg ccg gtg ccg tcc atg gtg atc tgc gcc ctc ctc ggc gtg    528
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
ccc tac gcc gac cac gcg ctc ttc gag ggc tgt tcg cgc cgg ctc ctg    576
Pro Tyr Ala Asp His Ala Leu Phe Glu Gly Cys Ser Arg Arg Leu Leu
           180                 185                 190
cgc ggt ccg ggc gcg gac gac gtg gac gcg gcc cgc gtc gaa ctg gag    624
Arg Gly Pro Gly Ala Asp Asp Val Asp Ala Ala Arg Val Glu Leu Glu
        195                 200                 205
gag tac ctc ggc gcg ttg atc gac cgc aaa cgc gcc gat ccg ggg gag    672
Glu Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Ala Asp Pro Gly Glu
    210                 215                 220
ggg ctg ctg gac gag ctg atc cac cgg gac cgt ccg gac gga ccc gtg     720
Gly Leu Leu Asp Glu Leu Ile His Arg Asp Arg Pro Asp Gly Pro Val
225                 230                 235                 240
agc cgg gag gac ctc gtc tcc ttc gcc ctg atc ctg ctc gtc gcc gga     768
Ser Arg Glu Asp Leu Val Ser Phe Ala Leu Ile Leu Leu Val Ala Gly
                245                 250                 255
cac gag acg acc gcg aac atg atc tcg ctc ggc acg ttc acc ctg ctg     816
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
cgc cac ccc ggt caa ctg gcg gcg ctg cgc tcg ggg gag acc acg acg     864
Arg His Pro Gly Gln Leu Ala Ala Leu Arg Ser Gly Glu Thr Thr Thr
        275                 280                 285
gcc gtc gtg gtc gag gag ttg ctg cgc ttc ctc tcc atc gcc gag ggg     912
Ala Val Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
ctg caa cgc ctc gcg atc gag gac atc gag gtg gac ggg acg acg atc     960
Leu Gln Arg Leu Ala Ile Glu Asp Ile Glu Val Asp Gly Thr Thr Ile
305                 310                 315                 320
cgc gag ggg gag ggc gtc ttc ttc tcc acc tcg ctc gtc aac cgc gac    1008
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Val Asn Arg Asp
                325                 330                 335
gcc gac gtg ttc gcg gac ccg gag acc ctg gac tgg gag cgg tcc gcc    1056
Ala Asp Val Phe Ala Asp Pro Glu Thr Leu Asp Trp Glu Arg Ser Ala
            340                 345                 350
cgg cac cac ctc gcg ttc ggc ttc ggc gtc cac cag tgc ctg gga cag    1104
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
aac ctg gcc cgc gcc gaa ctc gac atc gcg ctc cgc acg ctc ttc gaa    1152
Asn Leu Ala Arg Ala Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
cgg ctg ccc gcg ctc agg ctc gcc gta ccg gcg gac gag gtg agg cac    1200
Arg Leu Pro Ala Leu Arg Leu Ala Val Pro Ala Asp Glu Val Arg His
385                 390                 395                 400
aag ccc ggc gac acc atc cag ggc ctg ctc gaa ctg ccc gtg gcc tgg    1248
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu Glu Leu Pro Val Ala Trp
                405                 410                 415
tga                                                                1251
<210>229
<211>1218
<212>DNA
<213>羊毛链霉菌(Streptomyces lanatus)IFO 12787T
<220>
<221>CDS
<222>(1)..(1218)
<400>229
atg acg gac atg acc gat atg acg cga ccc ccc acc gtc gcc ttc ccc      48
Met Thr Asp Met Thr Asp Met Thr Arg Pro Pro Thr Val Ala Phe Pro
  1               5                  10                  15
cag aac cgc acc tgc ccc tac cac cca ccc acc gcc tac gac ccg ctc      96
Gln Asn Arg Thr Cys Pro Tyr His Pro Pro Thr Ala Tyr Asp Pro Leu
             20                  25                  30
cgc gac acc cgc ccc ctg gcg cgc atc acc ctc tac gac ggc cgc ccg     144
Arg Asp Thr Arg Pro Leu Ala Arg Ile Thr Leu Tyr Asp Gly Arg Pro
         35                  40                  45
gtc tgg ctg gtc acc ggg cac gcc ctc gcc cgc acc ctg ctc gcc gac     192
Val Trp Leu Val Thr Gly His Ala Leu Ala Arg Thr Leu Leu Ala Asp
     50                  55                  60
cct cgg ctg tcc tcc gac cgc ggc cgg ccc ggc ttc ccc gcg ccc aac    240
Pro Arg Leu Ser Ser Asp Arg Gly Arg Pro Gly Phe Pro Ala Pro Asn
 65                  70                  75                  80
gag cgg ttc gcg gcg gta cgc gac cgc aag tcc gcg ctg ctc ggc gtc    288
Glu Arg Phe Ala Ala Val Arg Asp Arg Lys Ser Ala Leu Leu Gly Val
                 85                  90                  95
gac gac ccc gaa cac cgg gtc cag cga cgg atg atg gtc ccc agc ttc    336
Asp Asp Pro Glu His Arg Val Gln Arg Arg Met Met Val Pro Ser Phe
            100                 105                 110
act ctc cgc cga gcc gcc gaa ctg cgc ccg cag atc cag cgg atc gtg    384
Thr Leu Arg Arg Ala Ala Glu Leu Arg Pro Gln Ile Gln Arg Ile Val
        115                 120                 125
gac gaa cgg ctc gac gcg atg atc gac cag ggg gcg ccc gcc gag ctg    432
Asp Glu Arg Leu Asp Ala Met Ile Asp Gln Gly Ala Pro Ala Glu Leu
    130                 135                 140
gtg aac gcc ttc gcg ctg ccc gtg ccc tcg atg gtc atc tgc gcc ctg    480
Val Asn Ala Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu
145                 150                 155                 160
ctg ggc gtg ccc tat gcc gac cac gac ttc ttc gag ggg gag tcc cgg    528
Leu Gly Val Pro Tyr Ala Asp His Asp Phe Phe Glu Gly Glu Ser Arg
                165                 170                 175
cgc ctg ctg cgc ggt gcc acg gcg gcc gag gcc atg gac gcc cgg gac    576
Arg Leu Leu Arg Gly Ala Thr Ala Ala Glu Ala Met Asp Ala Arg Asp
            180                 185                 190
cgg ctg gag aac tac ttc atc gag ctg atc gac cgc aag cag aag gac    624
Arg Leu Glu Asn Tyr Phe Ile Glu Leu Ile Asp Arg Lys Gln Lys Asp
        195                 200                 205
ccg gag ccc ggc gac ggc gtc ctc gac gaa ctc gtc cac cgg cag ctg    672
Pro Glu Pro Gly Asp Gly Val Leu Asp Glu Leu Val His Arg Gln Leu
    210                 215                 220
cgc gac ggc gac ctc gac cgc gag gaa gtc gtc gcc ctc tcg acc atc    720
Arg Asp Gly Asp Leu Asp Arg Glu Glu Val Val Ala Leu Ser Thr Ile
225                 230                 235                 240
ctg ctg gtc gcc ggc cac gag acg acc gcc aac atg atc tcg ctg ggt    768
Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly
                245                 250                 255
acc ttc aca ctg ctc caa cac ccg gag cag ctg gcc gag ttg cgc gcc    816
Thr Phe Thr Leu Leu Gln His Pro Glu Gln Leu Ala Glu Leu Arg Ala
            260                 265                 270
gac gcc ggg ttg ctg ccc gcc gcg gtc gag gag ctc atg cgg atg ctg    864
Asp Ala Gly Leu Leu Pro Ala Ala Val Glu Glu Leu Met Arg Met Leu
        275                 280                 285
tcg atc gcg gac ggg ctg ctg cgc gtc gcc tcc gag gac atc gag gcg    912
Ser Ile Ala Asp Gly Leu Leu Arg Val Ala Ser Glu Asp Ile Glu Ala
    290                 295                 300
ggc ggc gag acg atc cgg gcg ggc gac ggc gtg gtc ttc tcg acc tcg    960
Gly Gly Glu Thr Ile Arg Ala Gly Asp Gly Val Val Phe Ser Thr Ser
305                 310                 315                 320
gtc atc aac cgc gac gag tcc gtc tac ccc gac ccc gat gcc atc gac   1008
Val Ile Asn Arg Asp Glu Ser Val Tyr Pro Asp Pro Asp Ala Ile Asp
                325                 330                 335
tgg cac cgc ccc acc cgc cac cac atc gcc ttc ggg ttc ggc atc cac   1056
Trp His Arg Pro Thr Arg His His Ile Ala Phe Gly Phe Gly Ile His
            340                 345                 350
cag tgc ctc ggc cag aac ctg gcc cgc gcc gag atg gag atc gcc ctg   1104
Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Met Glu Ile Ala Leu
        355                 360                 365
cgc acc ctc ttc gag cgc ctg ccc acc ctg cgc ctt gcc gtc ccg gcg   1152
Arg Thr Leu Phe Glu Arg Leu Pro Thr Leu Arg Leu Ala Val Pro Ala
    370                 375                 380
ggg gaa atc ccc ttc aaa ccc ggc gac acg atc cag ggg atg ctg gaa   1200
Gly Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln Gly Met Leu Glu
385                 390                 395                 400
ctc ccc gtg acc tgg taa                                           1218
Leu Pro Val Thr Trp
                405
<210>230
<211>1245
<212>DNA
<213>三泽链霉菌(Streptomyces misawanensis)IFO 13855T
<220>
<221>CDS
<222>(1)..(1245)
<400>230
atg aaa gaa ctg acg gac ctg acg gaa ccc atc tct ccc gcc ggc cag     48
Met Lys Glu Leu Thr Asp Leu Thr Glu Pro Ile Ser Pro Ala Gly Gln
  1               5                  10                  15
gcc gac ccc gtg gcc tgg ccg cag gac cgc acg tgc ccc tac cac ccg     96
Ala Asp Pro Val Ala Trp Pro Gln Asp Arg Thr Cys Pro Tyr His Pro
             20                  25                  30
ccc acc ggc tac gac ccg ctc cgc gac ggc acc ccg ctg tcc cgc gtc    144
Pro Thr Gly Tyr Asp Pro Leu Arg Asp Gly Thr Pro Leu Ser Arg Val
         35                  40                  45
acc ctc tac gac ggc cgc acc gtc tgg gcg gtc acc ggc cac ggc acg    192
Thr Leu Tyr Asp Gly Arg Thr Val Trp Ala Val Thr Gly His Gly Thr
     50                  55                  60
gcc cgg gcg ctg ctc tcc gac ccc cgc ctc tcc agc gac cgc cgg cgc    240
Ala Arg Ala Leu Leu Ser Asp Pro Arg Leu Ser Ser Asp Arg Arg Arg
 65                  70                  75                  80
gac gac ttc ccg atg ccg aac gcc cgg ttc gcg gcg gcc cgg gag cgc    288
Asp Asp Phe Pro Met Pro Asn Ala Arg Phe Ala Ala Ala Arg Glu Arg
                 85                  90                  95
cga cag ctc gcc ctg ctg ggc ctc gac gac ccc gag cac cag atc cag    336
Arg Gln Leu Ala Leu Leu Gly Leu Asp Asp Pro Glu His Gln Ile Gln
            100                 105                 110
cgc cgg atg ctg atc ccg gac ttc acc ctc aag cgg gcg acc gtg atg    384
Arg Arg Met Leu Ile Pro Asp Phe Thr Leu Lys Arg Ala Thr Val Met
        115                 120                 125
cgg ccg gcc atc cag cgg atc gtc gac gat ctg ctc gac agg atg atc    432
Arg Pro Ala Ile Gln Arg Ile Val Asp Asp Leu Leu Asp Arg Met Ile
    130                 135                 140
gcc gcg ggc ccg ccc gcc gac ctg gtg agc tcc ttc gcg ctg ccc gtg    480
Ala Ala Gly Pro Pro Ala Asp Leu Val Ser Ser Phe Ala Leu Pro Val
145                 150                 155                 160
ccg tcc atg gtc atc tgt gac ctg ctc ggc gtg ccc tac gcc gac cac    528
Pro Ser Met Val Ile Cys Asp Leu Leu Gly Val Pro Tyr Ala Asp His
                165                 170                 175
gag ttc ttc gag gcg cag tcc cgg cgg ctg ctg cgc ggt ccg gcg ccc    576
Glu Phe Phe Glu Ala Gln Ser Arg Arg Leu Leu Arg Gly Pro Ala Pro
            180                 185                 190
gcc gac tcc ctg gac gcg cgc gac cag ctg gag gcc tat ctg ggc gac    624
Ala Asp Ser Leu Asp Ala Arg Asp Gln Leu Glu Ala Tyr Leu Gly Asp
        195                 200                 205
ctg gcc gac cgc aag agc cgg gac gcg gtc ccc ggc gac ggc gtc ctc    672
Leu Ala Asp Arg Lys Ser Arg Asp Ala Val Pro Gly Asp Gly Val Leu
    210                 215                 220
gac gac ctc gtc cac cag cgg ctg cgg gac ggc gcc ctg gac cgc gcc    720
Asp Asp Leu Val His Gln Arg Leu Arg Asp Gly Ala Leu Asp Arg Ala
225                 230                 235                 240
gag gtc gtc gcg ctg gcc ctc atc ctg ctg gtc gcc ggc cac gag acc    768
Glu Val Val Ala Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr
                245                 250                 255
acc gcc aac atg atc tcg ctc ggc acc ttc acc ctg ctc cag cag ccc    816
Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln Gln Pro
            260                 265                 270
gaa cgg ctc gcc gaa ctg cgc gcc gac ccc gcg ctg gtg ccc gcc gcc    864
Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Ala Leu Val Pro Ala Ala
        275                 280                 285
gtc gag gaa ctg atg cgg atg ctg tcc atc gcc gac ggg ctg ctg cgc    912
Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu Arg
    290                 295                 300
gtc gca ctg gag gac atc gag acg gac ggc ggc acc acc atc cgc aag    960
Val Ala Leu Glu Asp Ile Glu Thr Asp Gly Gly Thr Thr Ile Arg Lys
305                 310                 315                 320
ggc gag ggc gtg ctc ttc gcg acc tcg gtc atc aac cgt gac gag tcc   1008
Gly Glu Gly Val Leu Phe Ala Thr Ser Val Ile Asn Arg Asp Glu Ser
                325                 330                 335
gtg tac gac gac ccc gac gcc ctc gac tgg cac cgc ccg gcc cgc cac   1056
Val Tyr Asp Asp Pro Asp Ala Leu Asp Trp His Arg Pro Ala Arg His
            340                 345                 350
cac gtg gcc ttc ggc ttc ggc atc cac cag tgc ctg ggc cag aac ctg   1104
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
        355                 360                 365
gcc cgc acc gag ctg gag atc gcc ctg cgc acc ctg tgg gag cgg ctc   1152
Ala Arg Thr Glu Leu Glu Ile Ala Leu Arg Thr Leu Trp Glu Arg Leu
    370                 375                 380
ccg gac ctg cgg ctc gcc gca ccg ccg gag gag att ccc ttc aaa ccc   1200
Pro Asp Leu Arg Leu Ala Ala Pro Pro Glu Glu Ile Pro Phe Lys Pro
385                 390                 395                 400
ggc gac acg atc cag ggg atg ctg gaa ctc ccc gtg acc tgg taa       1245
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
                405                 410
<210>231
<211>1230
<212>DNA
<213>苍白色链霉菌(Streptomyces pallidus)IFO 13434T
<220>
<221>CDS
<222>(1)..(1230)
<400>231
atg gcc gac acc ctc gcc ggc gcc acg ccc gac gcc gcc gcg acg gtc     48
Met Ala Asp Thr Leu Ala Gly Ala Thr Pro Asp Ala Ala Ala Thr Val
  1               5                  10                  15
ccc gcg tac ccc atg gcc cgg gcc gcg ggc tgc ccc ttc gac ccg ccc     96
Pro Ala Tyr Pro Met Ala Arg Ala Ala Gly Cys Pro Phe Asp Pro Pro
             20                  25                  30
ccg gac ctc acc gcc cgg cag gac gag ggt cgg ctc gtc agg gtg cgc    144
Pro Asp Leu Thr Ala Arg Gln Asp Glu Gly Arg Leu Val Arg Val Arg
         35                  40                  45
ctc tgg gac ggc agt acg ccc tgg ctc gtg acc cgc tac gag gac cag    192
Leu Trp Asp Gly Ser Thr Pro Trp Leu Val Thr Arg Tyr Glu Asp Gln
     50                  55                  60
cgc gcc ctg ctc ctc gac ccc agg gtc agt gcc gac atc acc agg ccc    240
Arg Ala Leu Leu Leu Asp Pro Arg Val Ser Ala Asp Ile Thr Arg Pro
65                  70                  75                  80
gga tac ccc ctc cag gcc gcc ggc gcc ggc gag aac aac gcc agc ttc    288
Gly Tyr Pro Leu Gln Ala Ala Gly Ala Gly Glu Asn Asn Ala Ser Phe
                 85                  90                  95
atc ctc atg gac gac ccg gag cac gca cgg ctg cgc cgc atg gtg acc    336
Ile Leu Met Asp Asp Pro Glu His Ala Arg Leu Arg Arg Met Val Thr
            100                 105                 110
gcg ccc ttc gcg atc aag cgc gtc gag gcg atg cgg ccg ggc gtg cag    384
Ala Pro Phe Ala Ile Lys Arg Val Glu Ala Met Arg Pro Gly Val Gln
        115                 120                 125
cag ctc gtg gac gac ctc atc gac ggc atg ctc gcc ggg ccc aag ccg    432
Gln Leu Val Asp Asp Leu Ile Asp Gly Met Leu Ala Gly Pro Lys Pro
    130                 135                 140
gtc gac ctg gtg gag gcg ttc gcg ctg ccg gtg ccc tcg ctg gtc atc    480
Val Asp Leu Val Glu Ala Phe Ala Leu Pro Val Pro Ser Leu Val Ile
145                 150                 155                 160
tgc cgg atg ctc gga gtg ccg tac gag gac cac gac ttc ttc cag gag    528
Cys Arg Met Leu Gly Val Pro Tyr Glu Asp His Asp Phe Phe Gln Glu
                165                 170                 175
aac agc cgg atc ctc atc aag cgg gac gcg gcc atg gag gac cgc atg    576
Asn Ser Arg Ile Leu Ile Lys Arg Asp Ala Ala Met Glu Asp Arg Met
            180                 185                 190
gcc gcg cac ggg cgg ctg atc gcc tac ctc gac gag ctg atg ggc gag    624
Ala Ala His Gly Arg Leu Ile Ala Tyr Leu Asp Glu Leu Met Gly Glu
        195                 200                 205
aag acg gcc cgt ccg gcg gac gat ctg ctc tcc ggg ctc gtc gag cgg    672
Lys Thr Ala Arg Pro Ala Asp Asp Leu Leu Ser Gly Leu Val Glu Arg
    210                 215                 220
gtc agg acg ggg gag ctg acc cgg cgc gag tcg gcc cgc atg ggc gtg    720
Val Arg Thr Gly Glu Leu Thr Arg Arg Glu Ser Ala Arg Met Gly Val
225                 230                 235                 240
ctc ctg ctc atc gcc ggg cac gag acc acc gcc aac atg atc gcg ctc    768
Leu Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met Ile Ala Leu
                245                 250                 255
ggc acg ctc gcc ctg ctc gaa cac ccg gac cag ctc gcc ctg ctg cgt    816
Gly Thr Leu Ala Leu Leu Glu His Pro Asp Gln Leu Ala Leu Leu Arg
            260                 265                 270
gac acc gac gac ccg aag ctg gtc gcc gga gcg gcc gag gaa ctg ctg    864
Asp Thr Asp Asp Pro Lys Leu Val Ala Gly Ala Ala Glu Glu Leu Leu
        275                 280                 285
cgc tat ctg acc atc gtg cac aac gga cgc cgc cgg gcg gcc ctc gcg    912
Arg Tyr Leu Thr Ile Val His Asn Gly Arg Arg Arg Ala Ala Leu Ala
    290                 295                 300
gac atc gag atc ggc gga cag gtc atc cgg gcc ggc gag ggc atg atc    960
Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Gly Glu Gly Met Ile
305                 310                 315                 320
atg ccc aac gac ctc gcc aac cgg gac ccc ggc gcc ttc acc gac ccg   1008
Met Pro Asn Asp Leu Ala Asn Arg Asp Pro Gly Ala Phe Thr Asp Pro
                325                 330                 335
gac cgg ctg gac ctg cgc cgc gac gcc cgc cgg cac atc gcg ttc ggc   1056
Asp Arg Leu Asp Leu Arg Arg Asp Ala Arg Arg His Ile Ala Phe Gly
            340                 345                 350
ttc ggc gtg cac cag tgc ctg ggc cag ccg ctg gcc cgc atg gaa ctc   1104
Phe Gly Val His Gln Cys Leu Gly Gln Pro Leu Ala Arg Met Glu Leu
        355                 360                 365
cag gtc gtc tac ggc acc ctc tac cgc cgc atc ccc acg ctg cgg ctc   1152
Gln Val Val Tyr Gly Thr Leu Tyr Arg Arg Ile Pro Thr Leu Arg Leu
    370                 375                 380
gcc gcc ccg gtg gag agc ctg tcg ttc aag cac gac gga tcg gtc tac   1200
Ala Ala Pro Val Glu Ser Leu Ser Phe Lys His Asp Gly Ser Val Tyr
385                 390                 395                 400
ggc gtc tac gaa ctg ccc gtc acg tgg tga                           1230
Gly Val Tyr Glu Leu Pro Val Thr Trp
                405                 410
<210>232
<211>1197
<212>DNA
<213>玫瑰变红链霉菌(Streptomyces roseorubens)IFO 13682T
<220>
<221>CDS
<222>(1)..(1197)
<400>232
atg acg gac acg acc gca ccc gtc gcc ttc ccc cag agc agg acc tgc     48
Met Thr Asp Thr Thr Ala Pro Val Ala Phe Pro Gln Ser Arg Thr Cys
  1                   5                  10                  15
ccc tac cac ccg ccc gcc gcc tac gag ccg ctg cgc gcc gag cgc ccc     96
Pro Tyr His Pro Pro Ala Ala Tyr Glu Pro Leu Arg Ala Glu Arg Pro
                 20                  25                  30
ctg acc cgg atc acc ctc ttc gac ggc cgt gag gcc tgg ctg gtc agc    144
Leu Thr Arg Ile Thr Leu Phe Asp Gly Arg Glu Ala Trp Leu Val Ser
         35                  40                  45
ggc cac gcc acc gcc cgc gcc ctg ctc gcc gac ccc cgc ctg tcc tcc    192
Gly His Ala Thr Ala Arg Ala Leu Leu Ala Asp Pro Arg Leu Ser Ser
     50                  55                  60
gac cgc gac cgc ccc ggc ttc ccc acc ccc acc gcg cgc ttc gcc ggc    240
Asp Arg Asp Arg Pro Gly Phe Pro Thr Pro Thr Ala Arg Phe Ala Gly
 65                  70                  75                  80
atc cgc aac cgc cgt acg gcc ctg ctc ggc gtg gac gac ccc gag cac    288
Ile Arg Asn Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro Glu His
                 85                  90                  95
cgc gcc cag cgg cgg atg gtc gtc ggg gac ttc acc ctc aaa cgg gcc    336
Arg Ala Gln Arg Arg Met Val Val Gly Asp Phe Thr Leu Lys Arg Ala
            100                 105                 110
gcc gca ctg cgg ccc cgc atc cag cgg atc gtc gac gaa cga ctc gac    384
Ala Ala Leu Arg Pro Arg Ile Gln Arg Ile Val Asp Glu Arg Leu Asp
        115                 120                 125
gcg atg atc gcc cag ggc ccg ccc gcc gac ctg gtg agc gcc ttc gcg    432
Ala Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val Ser Ala Phe Ala
    130                 135                 140
ctg ccc gtg ccc tcc atg gtg atc tgc gcc ctg ctc ggc gtc ccc tac    480
Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Pro Tyr
145                 150                 155                 160
gcc gac cac gac ttc ttc gag gct cag tcg cgg cgc ctg ctg cgc ggc    528
Ala Asp His Asp Phe Phe Glu Ala Gln Ser Arg Arg Leu Leu Arg Gly
                165                 170                 175
ccg ggg acc gcc gac gtg cag gac gcc cgg agc agg ctg gag gag tac    576
Pro Gly Thr Ala Asp Val Gln Asp Ala Arg Ser Arg Leu Glu Glu Tyr
            180                 185                 190
ttc ggc gag ctg atc gac cgc aag cgc gag gac ccc ggc acc ggc ctc     624
Phe Gly Glu Leu Ile Asp Arg Lys Arg Glu Asp Pro Gly Thr Gly Leu
        195                 200                 205
ctg gac gac ctg gtc caa cgg cag ccc ggc gac ggc gga ccc gac cgc     672
Leu Asp Asp Leu Val Gln Arg Gln Pro Gly Asp Gly Gly Pro Asp Arg
    210                 215                 220
gag ggc ctg atc gcc atg gcc ctc atc ctg ctg gtc gcc ggc cac gag     720
Glu Gly Leu Ile Ala Met Ala Leu Ile Leu Leu Val Ala Gly His Glu
225                 230                 235                 240
acg acc gcc aac atg atc tcc ctc ggc acc ttc acg ctc ctg cag cac     768
Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln His
                245                 250                 255
ccc gag cgg ctc gcc gaa ctg cgc gcc gac tcc gag gtc atg ccg gcc     816
Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Ser Glu Val Met Pro Ala
            260                 265                 270
gcg gtc gag gaa ctg atg cgg ctg ctg tcc atc gcg gac ggc ctg ctg     864
Ala Val Glu Glu Leu Met Arg Leu Leu Ser Ile Ala Asp Gly Leu Leu
        275                 280                 285
cgc atc gcc gtc gag gac gtc gag gtg gcc ggg acg acg atc cgc gcc     912
Arg Ile Ala Val Glu Asp Val Glu Val Ala Gly Thr Thr Ile Arg Ala
    290                 295                 300
ggc gag ggc gtg gtg ttc gcg acg tcg gtc atc aac cgc gac gag acg     960
Gly Glu Gly Val Val Phe Ala Thr Ser Val Ile Asn Arg Asp Glu Thr
305                 310                 315                 320
gtc ttc gcc gag ccg gac acc ctc gac tgg agc cgc ccg gcc cgc cac    1008
Val Phe Ala Glu Pro Asp Thr Leu Asp Trp Ser Arg Pro Ala Arg His
                325                 330                 335
cac gtg gcg ttc ggc ttc ggc atc cac cag tgc ctc ggc caa aac ctc    1056
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
            340                 345                 350
gca cgc gcc gaa ctg gag atc gcc ctc ggc acc ctc ttc ggc cgg ctg    1104
Ala Arg Ala Glu Leu Glu Ile Ala Leu Gly Thr Leu Phe Gly Arg Leu
        355                 360                 365
ccc acg ctg cgc ctg gcc gcc ccg ccc gac gag atc ccc ttc aag ccg    1152
Pro Thr Leu Arg Leu Ala Ala Pro Pro Asp Glu Ile Pro Phe Lys Pro
    370                 375                 380
ggc gac acg atc cag ggg atg ctg gaa ctc ccc gtg acc tgg taa        1197
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
385                 390                 395
<210>233
<211>1245
<212>DNA
<213>鲁地链霉菌(Streptomyces rutgersensis)IFO 15875T
<220>
<221>CDS
<222>(1)..(1245)
<400>233
atg acc gaa acg ctg gca gag acc acg acc gag gcg gaa gag ccg ctt      48
Met Thr Glu Thr Leu Ala Glu Thr Thr Thr Glu Ala Glu Glu Pro Leu
  1               5                  10                  15
ccg gag ttc ccg atg ccg cgg gcg aac ggc tgc ccc ttc gcc ccg ccc      96
Pro Glu Phe Pro Met Pro Arg Ala Asn Gly Cys Pro Phe Ala Pro Pro
             20                  25                  30
ccg acc gca cgg gcg ctg cac acc gaa cgg ccg gtc acg cgg gta cgg     144
Pro Thr Ala Arg Ala Leu His Thr Glu Arg Pro Val Thr Arg Val Arg
         35                  40                  45
ctg tgg gac ggc agc gcc ccc tgg ctg gtg acc cgg tac gcc gac cag     192
Leu Trp Asp Gly Ser Ala Pro Trp Leu Val Thr Arg Tyr Ala Asp Gln
    50                  55                  60
cgc gcc ctg ctc ggc gac ccg cgg gtc agc tcc gag gcc acc cgg ccc    240
Arg Ala Leu Leu Gly Asp Pro Arg Val Ser Ser Glu Ala Thr Arg Pro
 65                  70                  75                  80
ggc ttt ccg cat gcg agc gcc ggc ttc cgc gag aat gcc agg cgg cgg    288
Gly Phe Pro His Ala Ser Ala Gly Phe Arg Glu Asn Ala Arg Arg Arg
                 85                  90                  95
cgc tcc ttc atc acc atg gac gac ccc gag cac gcc cgg atc cgc cgg    336
Arg Ser Phe Ile Thr Met Asp Asp Pro Glu His Ala Arg Ile Arg Arg
            100                 105                 110
atg gtc acc gcg ccg ttc gcc atc aag cgg gtc gag gcg atg cgg ccc    384
Met Val Thr Ala Pro Phe Ala Ile Lys Arg Val Glu Ala Met Arg Pro
        115                 120                 125
gac atc cag aag atc acc gac gat ctg atc gac tcc atg ctg gcc ggg    432
Asp Ile Gln Lys Ile Thr Asp Asp Leu Ile Asp Ser Met Leu Ala Gly
    130                 135                 140
ccg acc ccg gtc gac ctg gtg cgc gcg ttg gcg ctg ccg ctg ccg tcg    480
Pro Thr Pro Val Asp Leu Val Arg Ala Leu Ala Leu Pro Leu Pro Ser
145                 150                 155                 160
ctg gtg atc tgc cgg ctg ctc gga gtg ccg tac gag gac cac gac ttc    528
Leu Val Ile Cys Arg Leu Leu Gly Val Pro Tyr Glu Asp His Asp Phe
                165                 170                 175
ttc cag cgc aac agc tcg ctc ctg atc aac cgt aac tcc acg acc gaa    576
Phe Gln Arg Asn Ser Ser Leu Leu Ile Asn Arg Asn Ser Thr Thr Glu
           180                 185                 190
gag gtg gtc ggc gcc aac gag gcg ctg acc gac tat ctg gac gag ctg    624
Glu Val Val Gly Ala Asn Glu Ala Leu Thr Asp Tyr Leu Asp Glu Leu
        195                 200                 205
gtc agc gcc aaa ctc gcc aac ccc gcc gac gac atg ctc tcc gag ctg    672
Val Ser Ala Lys Leu Ala Asn Pro Ala Asp Asp Met Leu Ser Glu Leu
    210                 215                 220
gcc gcc cgg gtc acg gcc gga gag ctg acc cag cgc gag gcc gcc aat    720
Ala Ala Arg Val Thr Ala Gly Glu Leu Thr Gln Arg Glu Ala Ala Asn
225                 230                 235                 240
atg ggc gtg ctg ctg ctg atc gcc ggc cat gag acc acc gcc aac atg    768
Met Gly Val Leu Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc gcc ctc ggc acc gtc gcc ctg ctg gag aac ccc gac cag ctc gcc    816
Ile Ala Leu Gly Thr Val Ala Leu Leu Glu Asn Pro Asp Gln Leu Ala
            260                 265                 270
gtc ctg cgg gag acc gac gac ccg aag gcg gtc gcc aag gcc gtc gag    864
Val Leu Arg Glu Thr Asp Asp Pro Lys Ala Val Ala Lys Ala Val Glu
        275                 280                 285
gaa ctg ctg cgc tat ctg acc atc gtg cac acc ggc cgg cgc cgg gtc    912
Glu Leu Leu Arg Tyr Leu Thr Ile Val His Thr Gly Arg Arg Arg Val
    290                 295                 300
gcg cgg gag gac atc gag atc ggc ggc gag acc atc cgt gcc ggg gac    960
Ala Arg Glu Asp Ile Glu Ile Gly Gly Glu Thr Ile Arg Ala Gly Asp
305                 310                 315                 320
ggg atc atc atc tac acc ggc acc ggc aac tgg gac gcg gag gtc ttc   1008
Gly Ile Ile Ile Tyr Thr Gly Thr Gly Asn Trp Asp Ala Glu Val Phe
                325                 330                 335
ccc gag ccc gag cgg ctg gac atc ggc cgc gac gcc cgc cgc cac atg   1056
Pro Glu Pro Glu Arg Leu Asp Ile Gly Arg Asp Ala Arg Arg His Met
            340                 345                 350
gcg ttc ggt ttc ggc gtc cac cag tgc ctg ggc cag ccg ctg gcc cgg   1104
Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln Pro Leu Ala Arg
        355                 360                 365
gtg gag ctg cag gtg gtc tac ggc acg ctc tac cgc cgt atc ccc acg   1152
Val Glu Leu Gln Val Val Tyr Gly Thr Leu Tyr Arg Arg Ile Pro Thr
    370                 375                 380
ctg cgg ctg gcg acc ggg gtc gac caa cta ccg ttc aag gac gac ggt   1200
Leu Arg Leu Ala Thr Gly Val Asp Gln Leu Pro Phe Lys Asp Asp Gly
385                 390                 395                 400
ttg gtc tac ggc gtc tat gaa ctg ccc gtc acc tgg acg tct tga       1245
Leu Val Tyr Gly Val Tyr Glu Leu Pro Val Thr Trp Thr Ser
                405                 410
<210>234
<211>1197
<212>DNA
<213>斯堡链霉菌(Streptomyces steffisburgensis)IFO 13446T
<220>
<221>CDS
<222>(1)..(1197)
<400>234
atg tcg gac acg acc gca ccc gtg gcc ttc ccc cag agc cgg acc tgc     48
Met Ser Asp Thr Thr Ala Pro Val Ala Phe Pro Gln Ser Arg Thr Cys
  1               5                  10                  15
ccc tac cac ccg ccc gcc gcc tac gag ccg ctg cgc gcc gag cgc ccc     96
Pro Tyr His Pro Pro Ala Ala Tyr Glu Pro Leu Arg Ala Glu Arg Pro
             20                  25                  30
ctg acc cgt atc acc ctc ttc gac ggc cgt gag gcc tgg ctg gtc agc    144
Leu Thr Arg Ile Thr Leu Phe Asp Gly Arg Glu Ala Trp Leu Val Ser
         35                  40                  45
ggc cac gcc acc gcc cgc gcg ctg ctc gcc gac ccg cgc ctg tcc tcc    192
Gly His Ala Thr Ala Arg Ala Leu Leu Ala Asp Pro Arg Leu Ser Ser
     50                  55                  60
gac cgc gac cgc ccc ggc ttc ccc gcc ccc acc gcg cgc ttc gcc ggg    240
Asp Arg Asp Arg Pro Gly Phe Pro Ala Pro Thr Ala Arg Phe Ala Gly
 65                  70                  75                  80
atc cgc aac cgc aga acg gcc ctg ctg ggc gtc gac gac ccc gag cac    288
Ile Arg Asn Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro Glu His
                 85                  90                  95
cga gtc cag cgg cgg atg gtg gcc ggg gac ttc acc ctc aaa cgg gcc    336
Arg Val Gln Arg Arg Met Val Ala Gly Asp Phe Thr Leu Lys Arg Ala
            100                 105                 110
gcc gga ctg cga ccc cgc atc cag cgg atc gtg gac cga cga ctc gac    384
Ala Gly Leu Arg Pro Arg Ile Gln Arg Ile Val Asp Arg Arg Leu Asp
        115                 120                 125
gcg atg atc gcc cag ggc cca ccg gcc gac ctg gtg agc agc ttc gcg    432
Ala Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val Ser Ser Phe Ala
    130                 135                 140
ctg ccc gtc ccg tcc atg gtg atc tgt gcc ctg ctc ggc gtc ccg tac    480
Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Pro Tyr
145                 150                 155                 160
gcc gac cac gac ttc ttc gag acc cag tca cgg cgg ctg ctg cgc ggc    528
Ala Asp His Asp Phe Phe Glu Thr Gln Ser Arg Arg Leu Leu Arg Gly
                165                 170                 175
ccg cag acc gcc gac gtg atg gac gcc cgg gcc cgg ctg gac gag tac    576
Pro Gln Thr Ala Asp Val Met Asp Ala Arg Ala Arg Leu Asp Glu Tyr
            180                 185                 190
ttc ggc gaa ctg atc gac cgc aag cgg aag gaa ccc ggc gcc ggc ctg    624
Phe Gly Glu Leu Ile Asp Arg Lys Arg Lys Glu Pro Gly Ala Gly Leu
        195                 200                 205
ctg gac gac ctg gtc cag cga cag ctg cgc gac ggc gca ctc gac cgc    672
Leu Asp Asp Leu Val Gln Arg Gln Leu Arg Asp Gly Ala Leu Asp Arg
    210                 215                 220
gag ggc ctg atc gcc ctg gcg ctc atc ctg ctg gtc gcg ggc cac gag    720
Glu Gly Leu Ile Ala Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu
225                 230                 235                 240
acg acc gcc aac atg atc tcg ctc ggc acc ttc acc ctg ctg cag cac    768
Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln His
                245                 250                 255
ccc gaa cgg ctc gcc gag ctg cgc gcc gac ccg cgg ctg ctg cct gcg    816
Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Arg Leu Leu Pro Ala
            260                 265                 270
gcg gtc gag gag ctg atg cgc atg ctg tcc atc gcg gac ggt ctg ctc    864
Ala Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu
        275                 280                 285
cgc ctc gcc gtc gag gac ata gag gtg gcc ggg acc acg atc cgc aag    912
Arg Leu Ala Val Glu Asp Ile Glu Val Ala Gly Thr Thr Ile Arg Lys
    290                 295                 300
ggg gac ggc gtg gtg ttc ctg acg tcc gtc atc aac cgc gac gag acg    960
Gly Asp Gly Val Val Phe Leu Thr Ser Val Ile Asn Arg Asp Glu Thr
305                 310                 315                 320
gtc tac ccc gag ccg gac acc ctc gac tgg cac cgc tcg gcc cgg cat   1008
Val Tyr Pro Glu Pro Asp Thr Leu Asp Trp His Arg Ser Ala Arg His
                325                 330                 335
cac gtc gcg ttc ggc ttc ggc atc cac cag tgc ctc ggc cag aac ctc   1056
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
            340                 345                 350
gcg cgc gcc gag ctg gag atc gcc ctg tgg acc ctc ttc gac cgt ctg   1104
Ala Arg Ala Glu Leu Glu Ile Ala Leu Trp Thr Leu Phe Asp Arg Leu
        355                 360                 365
ccc acc ctg cgc ctg gcc gcg ccg gcc gag gag atc gcc ttc aag ccg   1152
Pro Thr Leu Arg Leu Ala Ala Pro Ala Glu Glu Ile Ala Phe Lys Pro
    370                 375                 380
ggc gac acg atc cag ggg atg ctg gaa ctc ccc gtg act tgg taa       1197
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
385                 390                 395
<210>235
<211>1454
<212>DNA
<213>装饰链霉菌(Streptomyces ornatus)IFO 13069t
<220>
<221>CDS
<222>(1)..(1251)
<220>
<221>CDS
<222>(1257)..(1454)
<400>235
atg acg gaa tcc acg acg gaa ccg gcc cgc cag gac ccc gct ccc acc     48
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Pro Ala Pro Thr
  1               5                  10                  15
gcc cct ccg acg caa ccg acc tcc acg aca ccc ttc ccc cag aac cgc     96
Ala Pro Pro Thr Gln Pro Thr Ser Thr Thr Pro Phe Pro Gln Asn Arg
             20                  25                  30
gac tgc ccc tac cac ccg ccc acc ggg tac caa ccg ctc cgc gcg gac    144
Asp Cys Pro Tyr His Pro Pro Thr Gly Tyr Gln Pro Leu Arg Ala Asp
         35                  40                  45
cgg ccg ctc agc cgg gtc acc ctc ttc gac ggg cgt ccg gtc tgg gcc    192
Arg Pro Leu Ser Arg Val Thr Leu Phe Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
gtc acc ggc cac gcc ctg gcc cgc cgg cta ctg gcg gat ccg cgc ctg    240
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
65                  70                  75                  80
tcc acc gat cgc acc cac ccc gac ttc ccc gtt ccg gcc gag cgg ttc    288
Ser Thr Asp Arg Thr His Pro Asp Phe Pro Val Pro Ala Glu Arg Phe
                 85                  90                  95
gcg aac gtc gag cgg cgg cgc gtg gcc ctg ctc ggc gtc gac gac ccc    336
Ala Asn Val Glu Arg Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                105                110
gag cac aac gcc cag cgc agg atg ctc atc ccg agc ttc tcc gtg aag    384
Glu His Asn Ala Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
cgg ata gcc gcg ctg cgc ccc cgc atc cag gag acg gtg gac gga ctg    432
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Gly Leu
    130                 135                 140
ctg gac gcg atg gag cgg cag ggc ccg ccg tcc gaa ctg gtc gcc gac    480
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
ttc gcg ctg ccg gtg ccg tcg atg gtg atc tgc gcg ctc ctc ggt gtg    528
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
ccg tac gcc gac cac gag ttc ttc gag ggc tgc tcc cgg cgg ctc ctg    576
Pro Tyr Ala Asp His Glu Phe Phe Glu Gly Cys Ser Arg Arg Leu Leu
            180                 185                 190
cag ggc ccg ggc gcg gcc gat gtg aac gag gcc cgg atc gag ctg gag    624
Gln Gly Pro Gly Ala Ala Asp Val Asn Glu Ala Arg Ile Glu Leu Glu
        195                 200                 205
ggc tat ctg ggc gcc ctg atc gac cgc aag cgg gtg gag ccg ggg gag    672
Gly Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Val Glu Pro Gly Glu
    210                 215                 220
ggg ctc ctg gac gaa ctg atc cac cgg gac cac ccc ggc gga ccc gtc    720
Gly Leu Leu Asp Glu Leu Ile His Arg Asp His Pro Gly Gly Pro Val
225                 230                 235                 240
gac cgc gag gac ctc gtc tcg ttc gcg gtg atc ctc ctc gtc gcg ggg    768
Asp Arg Glu Asp Leu Val Ser Phe Ala Val Ile Leu Leu Val Ala Gly
                245                 250                 255
cac gag acg acg gcg aac atg atc tcg ctc ggc acg ttc acg ctg ctg    816
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
aac cac ccg gaa cag ctg gag gcg ctg cgg tcc ggg agc acg acg acg    864
Asn His Pro Glu Gln Leu Glu Ala Leu Arg Ser Gly Ser Thr Thr Thr
        275                 280                 285
gcc gcg gtg gtc gag gaa ctg ctg cgg ttc ctc tcc atc gcc gag gga    912
Ala Ala Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
ctg caa cgg ctg gcc acc gag gac atc gag gtg gcc ggg acg acg atc    960
Leu Gln Arg Leu Ala Thr Glu Asp Ile Glu Val Ala Gly Thr Thr Ile
305                 310                 315                 320
cgc gag gga gag ggc gtg ttc ttc tcg acc tcg ctc atc aac cgc gac   1008
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Ile Asn Arg Asp
                325                 330                 335
acc gag gtc tac gag aat ccg gag acg ctc gac tgg gac cgg cct tcc   1056
Thr Glu Val Tyr Glu Asn Pro Glu Thr Leu Asp Trp Asp Arg Pro Ser
            340                 345                 350
cgg cac cac ctc gcc ttc ggc ttc ggc gtc cat cag tgc ctg ggc cag    1104
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
aat ctg gcc cgc acc gag ctc gac atc gcc ctg cgc act ctc ttc gag    1152
Asn Leu Ala Arg Thr Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
cgg ctg ccg gga ctc agg ctc gcc gtg ccc gcg cac gag atc cgg cac    1200
Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Ala His Glu Ile Arg His
385                 390                 395                 400
aaa ccc ggg gac acg atc cag ggc ctt ctg cac ctg ccc gtg gcc tgg    1248
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu His Leu Pro Val Ala Trp
                405                 410                 415
tga gcggc atg ggc gtg cgg gtc gac agg gaa cgg tgc gtg ggg gcc ggc  1298
          Met Gly Val Arg Val Asp Arg Glu Arg Cys Val Gly Ala Gly
                  420                 425                 430
atg tgc gcg ctg acc gcg ccc gac gtg ttc acg cag gac gac gac ggg    1346
Met Cys Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly
            435                 440                 445
ttc agc gag atg ctt ccc ggg agc acg gcg ggg acg ggg gac cac cca    1394
Phe Ser Glu Met Leu Pro Gly Ser Thr Ala Gly Thr Gly Asp His Pro
        450                 455                 460
cgg gtg cgg gag gcc gtt cgg gcc tgc ccg gtc ggg gcg gtg tcc ctg    1442
Arg Val Arg Glu Ala Val Arg Ala Cys Pro Val Gly Ala Val Ser Leu
    465                 470                 475
acc gac gac tga                                                    1454
Thr Asp Asp
480
<210>236
<211>1454
<212>DNA
<213>灰色链霉菌(Streptomyces griseus)ATCC 10137
<220>
<221>CDS
<222>(1)..(1251)
<220>
<221>CDS
<222>(1257)..(1454)
<400>236
atg acg gaa tcc acg acg gaa ccg gcc cgc cag gac ccc gct ccc acc      48
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Pro Ala Pro Thr
  1               5                  10                  15
gcc cct ccg acg caa ccg acc tcc acg aca ccc ttc ccc cag aac cgc      96
Ala Pro Pro Thr Gln Pro Thr Ser Thr Thr Pro Phe Pro Gln Asn Arg
             20                  25                  30
gac tgc ccc tac cac ccg ccc acc ggg tac caa ccg ctc cgc gcg gac     144
Asp Cys Pro Tyr His Pro Pro Thr Gly Tyr Gln Pro Leu Arg Ala Asp
         35                  40                  45
cgg ccg ctc agc cgg gtc acc ctc ttc gac ggg cgt ccg gtc tgg gcc     192
Arg Pro Leu Ser Arg Val Thr Leu Phe Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
gtc acc ggc cac gcc ctg gcc cgc cgg cta ctg gcg gat ccg cgc ctg     240
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
 65                  70                  75                  80
tcc acc gat cgc acc cac ccc gac ttc ccc gtt ccg gcc gag cgg ttc     288
Ser Thr Asp Arg Thr His Pro Asp Phe Pro Val Pro Ala Glu Arg Phe
                     85                  90                  95
gcg aac gtc gag cgg agg cga gtg gcc ctg ctc ggc gtc gac gac ccc    336
Ala Asn Val Glu Arg Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                 105                 110
gag cac aac gcc cag cgc agg atg ctc atc ccg agc ttc tcc gtg aag    384
Glu His Asn Ala Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
cgg ata gcc gcg ctg cgc ccc cgc atc cag gag acg gtg gac gga ctg    432
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Gly Leu
    130                 135                 140
ctg gac gcg atg gag cgg cag ggc ccg ccg tcc gaa ctg gtc gcc gac    480
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
ttc gcg ctg ccg gtg ccg tcg atg gtg atc tgc gcg ctc ctc ggt gtg    528
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
ccg tac gcc gac cac gag ttc ttc gag ggc tgc tcc cgg cgg ctc ctg    576
Pro Tyr Ala Asp His Glu Phe Phe Glu Gly Cys Ser Arg Arg Leu Leu
            180                 185                 190
cag ggc ccg ggc gcg gcc gat gtg aac gag gcc cgg atc gag ctg gag    624
Gln Gly Pro Gly Ala Ala Asp Val Asn Glu Ala Arg Ile Glu Leu Glu
        195                 200                 205
ggc tat ctg ggc gcc ctg atc gac cgc aag cgg gtg gag ccg ggg gag    672
Gly Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Val Glu Pro Gly Glu
    210                 215                 220
ggg ctc ctg gac gaa ctg atc cac cgg gac cac ccc ggc gga ccc gtc    720
Gly Leu Leu Asp Glu Leu Ile His Arg Asp His Pro Gly Gly Pro Val
225                 230                 235                 240
gac cgc gag gac ctc gtc tcg ttc gcg gtg atc ctc ctc gtc gcg ggg    768
Asp Arg Glu Asp Leu Val Ser Phe Ala Val Ile Leu Leu Val Ala Gly
                245                 250                 255
cac gag acg acg gcg aac atg atc tcg ctc ggc acg ttc acg ctg ctg    816
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
aac cac ccg gaa cag ctg gag gcg ctg cgc tcc ggg agg acg acg acg    864
Asn His Pro Glu Gln Leu Glu Ala Leu Arg Ser Gly Arg Thr Thr Thr
        275                 280                 285
gcc gcg gtg gtc gag gaa ctg ctg cgg ttc ctc tcc atc gcc gag gga    912
Ala Ala Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
ctg caa cgg ctg gcc acc gag gac atc gag gtg gcc ggg acg acg atc    960
Leu Gln Arg Leu Ala Thr Glu Asp Ile Glu Val Ala Gly Thr Thr Ile
305                 310                 315                 320
cgc gag gga gag ggc gtg ttc ttc tcg acc tcg ctc atc aac cgc gac   1008
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Ile Asn Arg Asp
                325                 330                 335
acc gag gtc tac gag aat ccg gag acg ctc gac tgg gac cgg cct tcc   1056
Thr Glu Val Tyr Glu Asn Pro Glu Thr Leu Asp Trp Asp Arg Pro Ser
            340                 345                 350
cgg cac cac ctc gcc ttc ggc ttc ggc gtc cac cag tgc ctg ggc cag   1104
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
aat ctg gcc cgc acc gag ctc gac atc gcc ctg cgc act ctc ttc gag   1152
Asn Leu Ala Arg Thr Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
cgg ctg ccg gga ctc agg ctc gcc gtg ccc gcg cac gag atc cgg cac   1200
Arg Leu Pro Gly Leu Arg Leu Ala Val Pro Ala His Glu Ile Arg His
385                 390                 395                 400
aaa ccc ggg gac acg atc cag ggc ctt ctg cac ctg ccc gtg gcc tgg    1248
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu His Leu Pro Val Ala Trp
                405                 410                 415
tga gcggc atg ggc gtg cgg gtc gac agg gaa cgg tgc gtg ggg gcc ggc  1298
          Met Gly Val Arg Val Asp Arg Glu Arg Cys Val Gly Ala Gly
                  420                 425                 430
atg tgc gcg ctg acc gcg ccc gac gtg ttc acg cag gac gac gac ggg    1346
Met Cys Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly
            435                 440                 445
ttc agc gag atg ctt ccc ggg agc acg gcg ggg acg ggg gac cac cca    1394
Phe Ser Glu Met Leu Pro Gly Ser Thr Ala Gly Thr Gly Asp His Pro
        450                 455                 460
cgg gtg cgg gag gcc gtt cgg gcc tgc ccg gtc ggg gcg gtg tcc ctg    1442
Arg Val Arg Glu Ala Val Arg Ala Cys Pro Val Gly Ala Val Ser Leu
    465                 470                 475
acc gac gac tga                                                    1454
Thr Asp Asp
480
<210>237
<211>1449
<212>DNA
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<220>
<221>CDS
<222>(1)..(1230)
<220>
<221>CDS
<222>(1243)..(1449)
<400>237
atg acg gaa ctg acg gac atc acc ggc ccg gct gcc gag gcc gaa ccc      48
Met Thr Glu Leu Thr Asp Ile Thr Gly Pro Ala Ala Glu Ala Glu Pro
  1               5                  10                  15
gtc gcc ttc ccc cag gac cgc acc tgt ccc tac cac ccc ccc acc gga      96
Val Ala Phe Pro Gln Asp Arg Thr Cys Pro Tyr His Pro Pro Thr Gly
             20                  25                  30
tac gac ccg ctg cgc gac ggg cga ccc ctg tcc cgc gtc acc ctc tac     144
Tyr Asp Pro Leu Arg Asp Gly Arg Pro Leu Ser Arg Val Thr Leu Tyr
         35                  40                  45
gac ggc cgc gag gcc tgg ctg gtc acc ggc cag gcc acc gcc cgc gcc     192
Asp Gly Arg Glu Ala Trp Leu Val Thr Gly Gln Ala Thr Ala Arg Ala
     50                  55                  60
ctg ctc gcc gac ccg cgg ctg tcc acc gac cgc cgc cgc gac ggc ttc     240
Leu Leu Ala Asp Pro Arg Leu Ser Thr Asp Arg Arg Arg Asp Gly Phe
65                  70                  75                  80
ccc gtg ccc acc ccc cgc ttc gag gcc ggc cgc gac cgc aag gtg gcc     288
Pro Val Pro Thr Pro Arg Phe Glu Ala Gly Arg Asp Arg Lys Val Ala
                 85                  90                  95
ctg ctc ggg gtg gac gat ccc gag cac cac cag cag cgc cgg atg ctg     336
Leu Leu Gly Val Asp Asp Pro Glu His His Gln Gln Arg Arg Met Leu
            100                 105                 110
atc ccg tcg ttc acc ctc aaa cgc gcc acc gcg ctg cgc ccc tgg atc     384
Ile Pro Ser Phe Thr Leu Lys Arg Ala Thr Ala Leu Arg Pro Trp Ile
        115                 120                 125
cag cgg atc gtg gac gaa ctg ctg gac gcg atg atc gag cgg ggg ccg     432
Gln Arg Ile Val Asp Glu Leu Leu Asp Ala Met Ile Glu Arg Gly Pro
    130                 135                 140
ggg gcc gaa ctg gtc tcc gcc ttc gcg ctg ccc gtg ccg tcc atg gtc     480
Gly Ala Glu Leu Val Ser Ala Phe Ala Leu Pro Val Pro Ser Met Val
145                 150                 155                 160
atc tgc ggc ctg ctc ggc gtg ccc tac gcc gac cac gag ttc ttc gag     528
Ile Cys Gly Leu Leu Gly Val Pro Tyr Ala Asp His Glu Phe Phe Glu
                165                 170                 175
gag cag tcc cgc cgg ctg ctg cgc ggg ccg acc agc gcc gac acc ctg     576
Glu Gln Ser Arg Arg Leu Leu Arg Gly Pro Thr Ser Ala Asp Thr Leu
            180                 185                 190
gac gcc cgg gac cgg ctg gag cgg ttc ctc ggc gac ctg atc gac gcc     624
Asp Ala Arg Asp Arg Leu Glu Arg Phe Leu Gly Asp Leu Ile Asp Ala
        195                 200                 205
aag gcc aag gag gcc gag ccc ggc gac ggc att ctg gac gac ctc gtc     672
Lys Ala Lys Glu Ala Glu Pro Gly Asp Gly Ile Leu Asp Asp Leu Val
    210                 215                 220
cac cac cgg ctc cgc gag ggc gaa ctg gac cgg ggt gac ctg gtg tcg     720
His His Arg Leu Arg Glu Gly Glu Leu Asp Arg Gly Asp Leu Val Ser
225                 230                 235                 240
ctc gcc gtg atc ctg ttg gtc gcc ggg cac gag acg acc gcc aac atg     768
Leu Ala Val Ile Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc tcc ctg ggc acc tac acc ctg ctc cag cac ccc gac cgg ctg gcc     816
Ile Ser Leu Gly Thr Tyr Thr Leu Leu Gln His Pro Asp Arg Leu Ala
            260                 265                 270
gag ctg cgg gcc gac ccc gcg ctg ctg ccc gcc gtc gtc gag gaa ctg     864
Glu Leu Arg Ala Asp Pro Ala Leu Leu Pro Ala Val Val Glu Glu Leu
        275                 280                 285
atg cgg atg ctg tcc atc gcc gag ggg ctg caa cgg gtg gcg ctg gag     912
Met Arg Met Leu Ser Ile Ala Glu Gly Leu Gln Arg Val Ala Leu Glu
    290                 295                 300
gac gtc gag atc gcc ggc acc acc atc cgg gcc ggc gac ggc gtc ctg     960
Asp Val Glu Ile Ala Gly Thr Thr Ile Arg Ala Gly Asp Gly Val Leu
305                 310                 315                 320
ttc tcc acc tcg gtc atc aac cgg gac acg gcc gtc tac gac gac ccc    1008
Phe Ser Thr Ser Val Ile Asn Arg Asp Thr Ala Val Tyr Asp Asp Pro
                325                 330                 335
gac gcg ctg gac ttc cac cgc gcc gac cgg cac cac gtg gcg ttc ggc    1056
Asp Ala Leu Asp Phe His Arg Ala Asp Arg His His Val Ala Phe Gly
            340                 345                 350
ttc ggc atc cac cag tgc ctg ggc cag aac ctg gcg cgc gcg gag ctg    1104
Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Leu
        355                 360                 365
gag atc gcc ctc ggc agc ctg ttc acc cgg ttg ccc ggg ctg cgg ctc    1152
Glu Ile Ala Leu Gly Ser Leu Phe Thr Arg Leu Pro Gly Leu Arg Leu
    370                 375                 380
gcc gct ccg gcc gag gag atc ccc ttc aaa ccg ggc gac acg atc cag    1200
Ala Ala Pro Ala Glu Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln
385                 390                 395                 400
ggg atg ctg gaa ctc ccc gtg acc tgg taa gaggcttcgc tc atg cac atg  1251
Gly Met Leu Glu Leu Pro Val Thr Trp                   Met His Met
                405                 410
gac atc gac atc gac cag gac gtc tgt atc ggc gcc ggg cag tgc gcg    1299
Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly Gln Cys Ala
            415                 420                 425
ctg gcg gca ccg ggc gtc ttc acc cag gac gac gac ggc tac agc acc    1347
Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly Tyr Ser Thr
430                 435                 440                 445
ctg ctg ccc ggc cgg gag aac ggc gtc acc gac ccg atg gtc cgg gag   1395
Leu Leu Pro Gly Arg Glu Asn Gly Val Thr Asp Pro Met Val Arg Glu
                450                 455                 460
gcc gcc cgc gcc tgc ccg gtc agc gcc atc acc gta cga gag cgc acc   1443
Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg Glu Arg Thr
            465                 470                 475
gcc tga                                                           1449
Ala
<210>238
<211>1454
<212>DNA
<213>灰色链霉菌(Streptomyces griseus)IFO 13849T
<220>
<221>CDS
<222>(1)..(1251)
<220>
<221>CDS
<222>(1299)..(1454)
<400>238
atg acg gaa tcc acg acg gaa ccg gcc cgc cag gac gcc gcc ctc acc     48
Met Thr Glu Ser Thr Thr Glu Pro Ala Arg Gln Asp Ala Ala Leu Thr
  1               5                  10                  15
ggc gcc acc acc gaa ccg acc tcc gcc cca ccg ttc ccg cag gac cgc     96
Gly Ala Thr Thr Glu Pro Thr Ser Ala Pro Pro Phe Pro Gln Asp Arg
             20                  25                  30
gag tgc ccc tac cac ccg ccc acc ggg tac gaa ccg ctg cgc gcg gac    144
Glu Cys Pro Tyr His Pro Pro Thr Gly Tyr Glu Pro Leu Arg Ala Asp
         35                  40                  45
cgg ccg ttg agc cgg gtc acg ctc tac gac gga cgc ccg gtc tgg gcc    192
Arg Pro Leu Ser Arg Val Thr Leu Tyr Asp Gly Arg Pro Val Trp Ala
     50                  55                  60
gtc acc gga cac gcc ctg gcc cgc cgc ctc ctg gcc gac ccc cga ctc    240
Val Thr Gly His Ala Leu Ala Arg Arg Leu Leu Ala Asp Pro Arg Leu
 65                  70                  75                  80
tcc acc gac cgc acc cac ccc gcc ttc ccc gtc ccg gcc gag cgg ttc    288
Ser Thr Asp Arg Thr His Pro Ala Phe Pro Val Pro Ala Glu Arg Phe
                 85                  90                  95
gcg cag acc cgg cag cgg cgc gtg gcc ctg ctc ggc gtc gac gac ccc    336
Ala Gln Thr Arg Gln Arg Arg Val Ala Leu Leu Gly Val Asp Asp Pro
            100                 105                 110
gag cac aac acc cag cgc agg atg ctc atc ccg agc ttc tcc gtg aaa    384
Glu His Asn Thr Gln Arg Arg Met Leu Ile Pro Ser Phe Ser Val Lys
        115                 120                 125
cgg atc gcc gcg ctg cgc ccc cgt atc cag gag acg gtg gac cgg ctg    432
Arg Ile Ala Ala Leu Arg Pro Arg Ile Gln Glu Thr Val Asp Arg Leu
    130                 135                 140
ctg gac gcc atg gag cgg cag ggg ccg ccg tcc gaa ctg gtc gcc gac    480
Leu Asp Ala Met Glu Arg Gln Gly Pro Pro Ser Glu Leu Val Ala Asp
145                 150                 155                 160
ttc gcg ctg ccg gtg ccg tcc atg gtg atc tgc gcc ctc ctc ggc gtg    528
Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val
                165                 170                 175
ccc tac gcc gac cac gcg ctc ttc gag ggc tgt tcg cgc cgg ctc ctg    576
Pro Tyr Ala Asp His Ala Leu Phe Glu Gly Cys Ser Arg Arg Leu Leu
            180                 185                 190
cgc ggt ccg ggc gcg gac gac gtg gac gcg gcc cgc gtc gaa ctg gag     624
Arg Gly Pro Gly Ala Asp Asp Val Asp Ala Ala Arg Val Glu Leu Glu
        195                 200                 205
gag tac ctc ggc gcg ttg atc gac cgc aaa cgc gcc gat ccg ggg gag     672
Glu Tyr Leu Gly Ala Leu Ile Asp Arg Lys Arg Ala Asp Pro Gly Glu
    210                 215                 220
ggg ctg ctg gac gag ctg atc cac cgg gac cgt ccg gac gga ccc gtg     720
Gly Leu Leu Asp Glu Leu Ile His Arg Asp Arg Pro Asp Gly Pro Val
225                 230                 235                 240
agc cgg gag gac ctc gtc tcc ttc gcc ctg atc ctg ctc gtc gcc gga     768
Ser Arg Glu Asp Leu Val Ser Phe Ala Leu Ile Leu Leu Val Ala Gly
                245                 250                 255
cac gag acg acc gcg aac atg atc tcg ctc ggc acg ttc acc ctg ctg     816
His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu
            260                 265                 270
cgc cac ccc ggt caa ctg gcg gcg ctg cgc tcg ggg gag acc acg acg     864
Arg His Pro Gly Gln Leu Ala Ala Leu Arg Ser Gly Glu Thr Thr Thr
        275                 280                 285
gcc gtc gtg gtc gag gag ttg ctg cgc ttc ctc tcc atc gcc gag ggg     912
Ala Val Val Val Glu Glu Leu Leu Arg Phe Leu Ser Ile Ala Glu Gly
    290                 295                 300
ctg caa cgc ctc gcg atc gag gac atc gag gtg gac ggg acg acg atc     960
Leu Gln Arg Leu Ala Ile Glu Asp Ile Glu Val Asp Gly Thr Thr Ile
305                 310                 315                 320
cgc gag ggg gag ggc gtc ttc ttc tcc acc tcg ctc gtc aac cgc gac    1008
Arg Glu Gly Glu Gly Val Phe Phe Ser Thr Ser Leu Val Asn Arg Asp
                325                 330                 335
gcc gac gtg ttc gcg gac ccg gag acc ctg gac tgg gag cgg tcc gcc    1056
Ala Asp Val Phe Ala Asp Pro Glu Thr Leu Asp Trp Glu Arg Ser Ala
            340                 345                 350
cgg cac cac ctc gcg ttc ggc ttc ggc gtc cac cag tgc ctg gga cag    1104
Arg His His Leu Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln
        355                 360                 365
aac ctg gcc cgc gcc gaa ctc gac atc gcg ctc cgc acg ctc ttc gaa    1152
Asn Leu Ala Arg Ala Glu Leu Asp Ile Ala Leu Arg Thr Leu Phe Glu
    370                 375                 380
cgg ctg ccc gcg ctc agg ctc gcc gta ccg gcg gac gag gtg agg cac    1200
Arg Leu Pro Ala Leu Arg Leu Ala Val Pro Ala Asp Glu Val Arg His
385                 390                 395                 400
aag ccc ggc gac acc atc cag ggc ctg ctc gaa ctg ccc gtg gcc tgg    1248
Lys Pro Gly Asp Thr Ile Gln Gly Leu Leu Glu Leu Pro Val Ala Trp
                405                 410                 415
tga gcggcgtgga cgtccaggta aacagggaac gctgcgtggg agccggc atg tgc    1304
                                                        Met Cys
gcg ctg acc gcg ccg gag gtg ttc aca cag gac gac gac ggt ttc agc    1352
Ala Leu Thr Ala Pro Glu Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
420                 425                 430                 435
gag gtg cgt ccc ggt ggc acg gcc gcc act gct ggc cac ccg ctg gta    1400
Glu Val Arg Pro Gly Gly Thr Ala Ala Thr Ala Gly His Pro Leu Val
                440                 445                 450
cgc gat gcc gca cgg gcc tgc ccg gtc ggg gcg gtg acc ctg acc gac    1448
Arg Asp Ala Ala Arg Ala Cys Pro Val Gly Ala Val Thr Leu Thr Asp
            455                 460                 465
gac tga                                                            1454
Asp
<210>239
<211>1461
<212>DNA
<213>羊毛链霉菌(Streptomyces lanatus)IFO 12787T
<220>
<221>CDS
<222>(1)..(1218)
<220>
<221>CDS
<222>(1231)..(1461)
<400>239
atg acg gac atg acc gat atg acg cga ccc ccc acc gtc gcc ttc ccc     48
Met Thr Asp Met Thr Asp Met Thr Arg Pro Pro Thr Val Ala Phe Pro
  1               5                  10                  15
cag aac cgc acc tgc ccc tac cac cca ccc acc gcc tac gac ccg ctc     96
Gln Asn Arg Thr Cys Pro Tyr His Pro Pro Thr Ala Tyr Asp Pro Leu
             20                  25                  30
cgc gac acc cgc ccc ctg gcg cgc atc acc ctc tac gac ggc cgc ccg    144
Arg Asp Thr Arg Pro Leu Ala Arg Ile Thr Leu Tyr Asp Gly Arg Pro
         35                  40                  45
gtc tgg ctg gtc acc ggg cac gcc ctc gcc cgc acc ctg ctc gcc gac    192
Val Trp Leu Val Thr Gly His Ala Leu Ala Arg Thr Leu Leu Ala Asp
     50                  55                  60
cct cgg ctg tcc tcc gac cgc ggc cgg ccc ggc ttc ccc gcg ccc aac    240
Pro Arg Leu Ser Ser Asp Arg Gly Arg Pro Gly Phe Pro Ala Pro Asn
 65                  70                  75                  80
gag cgg ttc gcg gcg gta cgc gac cgc aag tcc gcg ctg ctc ggc gtc    288
Glu Arg Phe Ala Ala Val Arg Asp Arg Lys Ser Ala Leu Leu Gly Val
                 85                  90                  95
gac gac ccc gaa cac cgg gtc cag cga cgg atg atg gtc ccc agc ttc    336
Asp Asp Pro Glu His Arg Val Gln Arg Arg Met Met Val Pro Ser Phe
            100                 105                 110
act ctc cgc cga gcc gcc gaa ctg cgc ccg cag atc cag cgg atc gtg    384
Thr Leu Arg Arg Ala Ala Glu Leu Arg Pro Gln Ile Gln Arg Ile Val
        115                 120                 125
gac gaa cgg ctc gac gcg atg atc gac cag ggg gcg ccc gcc gag ctg    432
Asp Glu Arg Leu Asp Ala Met Ile Asp Gln Gly Ala Pro Ala Glu Leu
    130                 135                 140
gtg aac gcc ttc gcg ctg ccc gtg ccc tcg atg gtc atc tgc gcc ctg    480
Val Asn Ala Phe Ala Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu
145                 150                 155                 160
ctg ggc gtg ccc tat gcc gac cac gac ttc ttc gag ggg gag tcc cgg    528
Leu Gly Val Pro Tyr Ala Asp His Asp Phe Phe Glu Gly Glu Ser Arg
                165                 170                 175
cgc ctg ctg cgc ggt gcc acg gcg gcc gag gcc atg gac gcc cgg gac    576
Arg Leu Leu Arg Gly Ala Thr Ala Ala Glu Ala Met Asp Ala Arg Asp
            180                 185                 190
cgg ctg gag aac tac ttc atc gag ctg atc gac cgc aag cag aag gac    624
Arg Leu Glu Asn Tyr Phe Ile Glu Leu Ile Asp Arg Lys Gln Lys Asp
    195                 200                 205
ccg gag ccc ggc gac ggc gtc ctc gac gaa ctc gtc cac cgg cag ctg    672
Pro Glu Pro Gly Asp Gly Val Leu Asp Glu Leu Val His Arg Gln Leu
    210                 215                 220
cgc gac ggc gac ctc gac cgc gag gaa gtc gtc gcc ctc tcg acc atc    720
Arg Asp Gly Asp Leu Asp Arg Glu Glu Val Val Ala Leu Ser Thr Ile
225                 230                 235                 240
ctg ctg gtc gcc ggc cac gag acg acc gcc aac atg atc tcg ctg ggt    768
Leu Leu Val Ala Gly His Glu Thr Thr Ala Asn Met Ile Ser Leu Gly
                245                 250                 255
acc ttc aca ctg ctc caa cac ccg gag cag ctg gcc gag ttg cgc gcc     816
Thr Phe Thr Leu Leu Gln His Pro Glu Gln Leu Ala Glu Leu Arg Ala
            260                 265                 270
gac gcc ggg ttg ctg ccc gcc gcg gtc gag gag ctc atg cgg atg ctg     864
Asp Ala Gly Leu Leu Pro Ala Ala Val Glu Glu Leu Met Arg Met Leu
        275                 280                 285
tcg atc gcg gac ggg ctg ctg cgc gtc gcc tcc gag gac atc gag gcg     912
Ser Ile Ala Asp Gly Leu Leu Arg Val Ala Ser Glu Asp Ile Glu Ala
    290                 295                 300
ggc ggc gag acg atc cgg gcg ggc gac ggc gtg gtc ttc tcg acc tcg     960
Gly Gly Glu Thr Ile Arg Ala Gly Asp Gly Val Val Phe Ser Thr Ser
305                 310                 315                 320
gtc atc aac cgc gac gag tcc gtc tac ccc gac ccc gat gcc atc gac    1008
Val Ile Asn Arg Asp Glu Ser Val Tyr Pro Asp Pro Asp Ala Ile Asp
                325                 330                 335
tgg cac cgc ccc acc cgc cac cac atc gcc ttc ggg ttc ggc atc cac    1056
Trp His Arg Pro Thr Arg His His Ile Ala Phe Gly Phe Gly Ile His
            340                 345                 350
cag tgc ctc ggc cag aac ctg gcc cgc gcc gag atg gag atc gcc ctg    1104
Gln Cys Leu Gly Gln Asn Leu Ala Arg Ala Glu Met Glu Ile Ala Leu
        355                 360                 365
cgc acc ctc ttc gag cgc ctg ccc acc ctg cgc ctt gcc gtc ccg gcg    1152
Arg Thr Leu Phe Glu Arg Leu Pro Thr Leu Arg Leu Ala Val Pro Ala
    370                 375                 380
ggg gaa atc ccc ttc aaa ccc ggc gac acg atc cag ggg atg ctg gaa    1200
Gly Glu Ile Pro Phe Lys Pro Gly Asp Thr Ile Gln Gly Met Leu Glu
385                 390                 395                 400
ctc ccc gtg acc tgg taa gaggctccgg tc atg cac aac gaa acg cac gaa  1251
Leu Pro Val Thr Trp                   Met His Asn Glu Thr His Glu
                405                               410
tca ggc cat atc cac atc gac atc gac cat gac gtc tgc gtc ggc gcc    1299
Ser Gly His Ile His Ile Asp Ile Asp His Asp Val Cys Val Gly Ala
    415                 420                 425
ggg cag tgc gcc ctc gcc gcc ccc tcc gtg ttc acc cag gac gac gac    1347
Gly Gln Cys Ala Leu Ala Ala Pro Ser Val Phe Thr Gln Asp Asp Asp
430                 435                 440                 445
ggc ttc agc acc ctg ctt ccc ggc cgc gag gac ggc ggc ggc gac ccc    1395
Gly Phe Ser Thr Leu Leu Pro Gly Arg Glu Asp Gly Gly Gly Asp Pro
                450                 455                 460
atg gtg cgg gag gcg gcc cgg gcg tgc ccg gtc agc gcc atc acc gtg    1443
Met Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val
            465                 470                 475
tcc gaa ggg ggg agt tga                                            1461
Ser Glu Gly Gly Ser
        480
<210>240
<211>1458
<212>DNA
<213>三泽链霉菌(Streptomyces misawanensis)IFO 13855T
<220>
<221>CDS
<222>(1)..(1245)
<220>
<221>CDS
<222>(1258)..(1458)
atg aaa gaa ctg acg gac ctg acg gaa ccc atc tct ccc gcc ggc cag     48
Met Lys Glu Leu Thr Asp Leu Thr Glu Pro Ile Ser Pro Ala Gly Gln
  1               5                  10                  15
gcc gac ccc gtg gcc tgg ccg cag gac cgc acg tgc ccc tac cac ccg     96
Ala Asp Pro Val Ala Trp Pro Gln Asp Arg Thr Cys Pro Tyr His Pro
             20                  25                  30
ccc acc ggc tac gac ccg ctc cgc gac ggc acc ccg ctg tcc cgc gtc    144
Pro Thr Gly Tyr Asp Pro Leu Arg Asp Gly Thr Pro Leu Ser Arg Val
         35                  40                  45
acc ctc tac gac ggc cgc acc gtc tgg gcg gtc acc ggc cac ggc acg    192
Thr Leu Tyr Asp Gly Arg Thr Val Trp Ala Val Thr Gly His Gly Thr
     50                  55                  60
gcc cgg gcg ctg ctc tcc gac ccc cgc ctc tcc agc gac cgc cgg cgc    240
Ala Arg Ala Leu Leu Ser Asp Pro Arg Leu Ser Ser Asp Arg Arg Arg
 65                  70                  75                  80
gac gac ttc ccg atg ccg aac gcc cgg ttc gcg gcg gcc cgg gag cgc    288
Asp Asp Phe Pro Met Pro Asn Ala Arg Phe Ala Ala Ala Arg Glu Arg
                 85                  90                  95
cga cag ctc gcc ctg ctg ggc ctc gac gac ccc gag cac cag atc cag    336
Arg Gln Leu Ala Leu Leu Gly Leu Asp Asp Pro Glu His Gln Ile Gln
            100                 105                 110
cgc cgg atg ctg atc ccg gac ttc acc ctc aag cgg gcg acc gtg atg    384
Arg Arg Met Leu Ile Pro Asp Phe Thr Leu Lys Arg Ala Thr Val Met
        115                 120                 125
cgg ccg gcc atc cag cgg atc gtc gac gat ctg ctc gac agg atg atc    432
Arg Pro Ala Ile Gln Arg Ile Val Asp Asp Leu Leu Asp Arg Met Ile
    130                 135                 140
gcc gcg ggc ccg ccc gcc gac ctg gtg agc tcc ttc gcg ctg ccc gtg    480
Ala Ala Gly Pro Pro Ala Asp Leu Val Ser Ser Phe Ala Leu Pro Val
145                 150                 155                 160
ccg tcc atg gtc atc tgt gac ctg ctc ggc gtg ccc tac gcc gac cac    528
Pro Ser Met Val Ile Cys Asp Leu Leu Gly Val Pro Tyr Ala Asp His
                165                 170                 175
gag ttc ttc gag gcg cag tcc cgg cgg ctg ctg cgc ggt ccg gcg ccc    576
Glu Phe Phe Glu Ala Gln Ser Arg Arg Leu Leu Arg Gly Pro Ala Pro
            180                 185                 190
gcc gac tcc ctg gac gcg cgc gac cag ctg gag gcc tat ctg ggc gac    624
Ala Asp Ser Leu Asp Ala Arg Asp Gln Leu Glu Ala Tyr Leu Gly Asp
        195                 200                 205
ctg gcc gac cgc aag agc cgg gac gcg gtc ccc ggc gac ggc gtc ctc    672
Leu Ala Asp Arg Lys Ser Arg Asp Ala Val Pro Gly Asp Gly Val Leu
    210                 215                 220
gac gac ctc gtc cac cag cgg ctg cgg gac ggc gcc ctg gac cgc gcc    720
Asp Asp Leu Val His Gln Arg Leu Arg Asp Gly Ala Leu Asp Arg Ala
225                 230                 235                 240
gag gtc gtc gcg ctg gcc ctc atc ctg ctg gtc gcc ggc cac gag acc    768
Glu Val Val Ala Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu Thr
                245                 250                 255
acc gcc aac atg atc tcg ctc ggc acc ttc acc ctg ctc cag cag ccc    816
Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln Gln Pro
            260                 265                 270
gaa cgg ctc gcc gaa ctg cgc gcc gac ccc gcg ctg gtg ccc gcc gcc    864
Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Ala Leu Val Pro Ala Ala
        275                 280                 285
gtc gag gaa ctg atg cgg atg ctg tcc atc gcc gac ggg ctg ctg cgc    912
Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu Arg
    290                 295                 300
gtc gca ctg gag gac atc gag acg gac ggc ggc acc acc atc cgc aag     960
Val Ala Leu Glu Asp Ile Glu Thr Asp Gly Gly Thr Thr Ile Arg Lys
305                 310                 315                 320
ggc gag ggc gtg ctc ttc gcg acc tcg gtc atc aac cgt gac gag tcc    1008
Gly Glu Gly Val Leu Phe Ala Thr Ser Val Ile Asn Arg Asp Glu Ser
                325                 330                 335
gtg tac gac gac ccc gac gcc ctc gac tgg cac cgc ccg gcc cgc cac    1056
Val Tyr Asp Asp Pro Asp Ala Leu Asp Trp His Arg Pro Ala Arg His
            340                 345                 350
cac gtg gcc ttc ggc ttc ggc atc cac cag tgc ctg ggc cag aac ctg    1104
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
        355                 360                 365
gcc cgc acc gag ctg gag atc gcc ctg cgc acc ctg tgg gag cgg ctc    1152
Ala Arg Thr Glu Leu Glu Ile Ala Leu Arg Thr Leu Trp Glu Arg Leu
    370                 375                 380
ccg gac ctg cgg ctc gcc gca ccg ccg gag gag att ccc ttc aaa ccc    1200
Pro Asp Leu Arg Leu Ala Ala Pro Pro Glu Glu Ile Pro Phe Lys Pro
385                 390                 395                 400
ggc gac acg atc cag ggg atg ctg gaa ctc ccc gtg acc tgg taa gaggc  1250
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
                405                 410                 415
tcctgcc atg cac atc gag atc gac agt gac gtc tgc atc ggc gcg ggg    1299
        Met His Ile Glu Ile Asp Ser Asp Val Cys Ile Gly Ala Gly
                            420                 425
cag tgt gcc ctg acc gcc ccc aac gtc ttc acc cag gac gac gac ggt    1347
Gln Cys Ala Leu Thr Ala Pro Asn Val Phe Thr Gln Asp Asp Asp Gly
430                 435                 440                 445
ttc agc acc ctg ctc ccc ggg atg gcg gac ggc ggc ggc gac ccg ctg    1395
Phe Ser Thr Leu Leu Pro Gly Met Ala Asp Gly Gly Gly Asp Pro Leu
                450                 455                 460
gtc aag gag gcg gcc cgg gcc tgc ccg gtg cac gcc atc acg gtc gag    1443
Val Lys Glu Ala Ala Arg Ala Cys Pro Val His Ala Ile Thr Val Glu
            465                 470                 475
gaa ccg tcg ggt tag                                                1458
Glu Pro Ser Gly
        480
<210>241
<211>1448
<212>DNA
<213>苍白色链霉菌(Streptomyces pallidus)IFO 13434T
<220>
<221>CDS
<222>(1)..(1230)
<220>
<221>CDS
<222>(1254)..(1448)
<400>241
atg gcc gac acc ctc gcc ggc gcc acg ccc gac gcc gcc gcg acg gtc      48
Met Ala Asp Thr Leu Ala Gly Ala Thr Pro Asp Ala Ala Ala Thr Val
  1               5                  10                  15
ccc gcg tac ccc atg gcc cgg gcc gcg ggc tgc ccc ttc gac ccg ccc      96
Pro Ala Tyr Pro Met Ala Arg Ala Ala Gly Cys Pro Phe Asp Pro Pro
                 20                  25                  30
ccg gac ctc acc gcc cgg cag gac gag ggt cgg ctc gtc agg gtg cgc     144
Pro Asp Leu Thr Ala Arg Gln Asp Glu Gly Arg Leu Val Arg Val Arg
         35                  40                  45
ctc tgg gac ggc agt acg ccc tgg ctc gtg acc cgc tac gag gac cag    192
Leu Trp Asp Gly Ser Thr Pro Trp Leu Val Thr Arg Tyr Glu Asp Gln
     50                  55                  60
cgc gcc ctg ctc ctc gac ccc agg gtc agt gcc gac atc acc agg ccc    240
Arg Ala Leu Leu Leu Asp Pro Arg Val Ser Ala Asp Ile Thr Arg Pro
 65                  70                  75                  80
gga tac ccc ctc cag gcc gcc ggc gcc ggc gag aac aac gcc agc ttc    288
Gly Tyr Pro Leu Gln Ala Ala Gly Ala Gly Glu Asn Asn Ala Ser Phe
                 85                  90                  95
atc ctc atg gac gac ccg gag cac gca cgg ctg cgc cgc atg gtg acc    336
Ile Leu Met Asp Asp Pro Glu His Ala Arg Leu Arg Arg Met Val Thr
            100                 105                 110
gcg ccc ttc gcg atc aag cgc gtc gag gcg atg cgg ccg ggc gtg cag    384
Ala Pro Phe Ala Ile Lys Arg Val Glu Ala Met Arg Pro Gly Val Gln
        115                 120                 125
cag ctc gtg gac gac ctc atc gac ggc atg ctc gcc ggg ccc aag ccg    432
Gln Leu Val Asp Asp Leu Ile Asp Gly Met Leu Ala Gly Pro Lys Pro
    130                 135                 140
gtc gac ctg gtg gag gcg ttc gcg ctg ccg gtg ccc tcg ctg gtc atc    480
Val Asp Leu Val Glu Ala Phe Ala Leu Pro Val Pro Ser Leu Val Ile
145                 150                 155                 160
tgc cgg atg ctc gga gtg ccg tac gag gac cac gac ttc ttc cag gag    528
Cys Arg Met Leu Gly Val Pro Tyr Glu Asp His Asp Phe Phe Gln Glu
                165                 170                 175
aac agc cgg atc ctc atc aag cgg gac gcg gcc atg gag gac cgc atg    576
Asn Ser Arg Ile Leu Ile Lys Arg Asp Ala Ala Met Glu Asp Arg Met
            180                 185                 190
gcc gcg cac ggg cgg ctg atc gcc tac ctc gac gag ctg atg ggc gag    624
Ala Ala His Gly Arg Leu Ile Ala Tyr Leu Asp Glu Leu Met Gly Glu
        195                 200                 205
aag acg gcc cgt ccg gcg gac gat ctg ctc tcc ggg ctc gtc gag cgg    672
Lys Thr Ala Arg Pro Ala Asp Asp Leu Leu Ser Gly Leu Val Glu Arg
    210                 215                 220
gtc agg acg ggg gag ctg acc cgg cgc gag tcg gcc cgc atg ggc gtg    720
Val Arg Thr Gly Glu Leu Thr Arg Arg Glu Ser Ala Arg Met Gly Val
225                 230                 235                 240
ctc ctg ctc atc gcc ggg cac gag acc acc gcc aac atg atc gcg ctc    768
Leu Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met Ile Ala Leu
                245                 250                 255
ggc acg ctc gcc ctg ctc gaa cac ccg gac cag ctc gcc ctg ctg cgt    816
Gly Thr Leu Ala Leu Leu Glu His Pro Asp Gln Leu Ala Leu Leu Arg
            260                 265                 270
gac acc gac gac ccg aag ctg gtc gcc gga gcg gcc gag gaa ctg ctg    864
Asp Thr Asp Asp Pro Lys Leu Val Ala Gly Ala Ala Glu Glu Leu Leu
        275                 280                 285
cgc tat ctg acc atc gtg cac aac gga cgc cgc cgg gcg gcc ctc gcg    912
Arg Tyr Leu Thr Ile Val His Asn Gly Arg Arg Arg Ala Ala Leu Ala
    290                 295                 300
gac atc gag atc ggc gga cag gtc atc cgg gcc ggc gag ggc atg atc    960
Asp Ile Glu Ile Gly Gly Gln Val Ile Arg Ala Gly Glu Gly Met Ile
305                 310                 315                 320
atg ccc aac gac ctc gcc aac cgg gac ccc ggc gcc ttc acc gac ccg   1008
Met Pro Asn Asp Leu Ala Asn Arg Asp Pro Gly Ala Phe Thr Asp Pro
                325                 330                 335
gac cgg ctg gac ctg cgc cgc gac gcc cgc cgg cac atc gcg ttc ggc   1056
Asp Arg Leu Asp Leu Arg Arg Asp Ala Arg Arg His Ile Ala Phe Gly
            340                 345                 350
ttc ggc gtg cac cag tgc ctg ggc cag ccg ctg gcc cgc atg gaa ctc    1104
Phe Gly Val His Gln Cys Leu Gly Gln Pro Leu Ala Arg Met Glu Leu
        355                 360                 365
cag gtc gtc tac ggc acc ctc tac cgc cgc atc ccc acg ctg cgg ctc    1152
Gln Val Val Tyr Gly Thr Leu Tyr Arg Arg Ile Pro Thr Leu Arg Leu
    370                 375                 380
gcc gcc ccg gtg gag agc ctg tcg ttc aag cac gac gga tcg gtc tac    1200
Ala Ala Pro Val Glu Ser Leu Ser Phe Lys His Asp Gly Ser Val Tyr
385                 390                 395                 400
ggc gtc tac gaa ctg ccc gtc acg tgg tga cgcgggaacc ggaggaggca acc  1253
Gly Val Tyr Glu Leu Pro Val Thr Trp
                405                 410
atg cga gtg gaa ctg gac gag ccg aag tgc gtc gcg tcg ggg cag tgc    1301
Met Arg Val Glu Leu Asp Glu Pro Lys Cys Val Ala Ser Gly Gln Cys
                415                 420                 425
gtg atg gcc gcc ccc gag gtc ttc gac cag cgc gag gag gac ggc atc    1349
Val Met Ala Ala Pro Glu Val Phe Asp Gln Arg Glu Glu Asp Gly Ile
            430                 435                 440
gcc ttc gtg ctg gac gag cgg ccg gcg gcg gac gtc ctg gcg gag gtg    1397
Ala Phe Val Leu Asp Glu Arg Pro Ala Ala Asp Val Leu Ala Glu Val
        445                 450                 455
cgc gag gcc gtg gcg atc tgc ccc gcc gcc gcg atc cgg ctg gtg gag    1445
Arg Glu Ala Val Ala Ile Cys Pro Ala Ala Ala Ile Arg Leu Val Glu
    460                 465                 470
tga                                                                1448
475
<210>242
<211>1411
<212>DNA
<213>玫瑰变红链霉菌(Streptomyces roseorubens)IFO 13682T
<220>
<221>CDS
<222>(1)..(1197)
<220>
<221>CDS
<222>(1211)..(1411)
<400>242
atg acg gac acg acc gca ccc gtc gcc ttc ccc cag agc agg acc tgc      48
Met Thr Asp Thr Thr Ala Pro Val Ala Phe Pro Gln Ser Arg Thr Cys
  1               5                  10                  15
ccc tac cac ccg ccc gcc gcc tac gag ccg ctg cgc gcc gag cgc ccc      96
Pro Tyr His Pro Pro Ala Ala Tyr Glu Pro Leu Arg Ala Glu Arg Pro
             20                  25                  30
ctg acc cgg atc acc ctc ttc gac ggc cgt gag gcc tgg ctg gtc agc     144
Leu Thr Arg Ile Thr Leu Phe Asp Gly Arg Glu Ala Trp Leu Val Ser
         35                  40                  45
ggc cac gcc acc gcc cgc gcc ctg ctc gcc gac ccc cgc ctg tcc tcc     192
Gly His Ala Thr Ala Arg Ala Leu Leu Ala Asp Pro Arg Leu Ser Ser
     50                  55                  60
gac cgc gac cgc ccc ggc ttc ccc acc ccc acc gcg cgc ttc gcc ggc     240
Asp Arg Asp Arg Pro Gly Phe Pro Thr Pro Thr Ala Arg Phe Ala Gly
 65                  70                  75                  80
atc cgc aac cgc cgt acg gcc ctg ctc ggc gtg gac gac ccc gag cac     288
Ile Arg Asn Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro Glu His
                 85                  90                  95
cgc gcc cag cgg cgg atg gtc gtc ggg gac ttc acc ctc aaa cgg gcc    336
Arg Ala Gln Arg Arg Met Val Val Gly Asp Phe Thr Leu Lys Arg Ala
            100                 105                 110
gcc gca ctg cgg ccc cgc atc cag cgg atc gtc gac gaa cga ctc gac    384
Ala Ala Leu Arg Pro Arg Ile Gln Arg Ile Val Asp Glu Arg Leu Asp
        115                 120                 125
gcg atg atc gcc cag ggc ccg ccc gcc gac ctg gtg agc gcc ttc gcg    432
Ala Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val Ser Ala Phe Ala
    130                 135                 140
ctg ccc gtg ccc tcc atg gtg atc tgc gcc ctg ctc ggc gtc ccc tac    480
Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Pro Tyr
145                 150                 155                 160
gcc gac cac gac ttc ttc gag gct cag tcg cgg cgc ctg ctg cgc ggc    528
Ala Asp His Asp Phe Phe Glu Ala Gln Ser Arg Arg Leu Leu Arg Gly
                165                 170                 175
ccg ggg acc gcc gac gtg cag gac gcc cgg agc agg ctg gag gag tac    576
Pro Gly Thr Ala Asp Val Gln Asp Ala Arg Ser Arg Leu Glu Glu Tyr
            180                 185                 190
ttc ggc gag ctg atc gac cgc aag cgc gag gac ccc ggc acc ggc ctc    624
Phe Gly Glu Leu Ile Asp Arg Lys Arg Glu Asp Pro Gly Thr Gly Leu
        195                 200                 205
ctg gac gac ctg gtc caa cgg cag ccc ggc gac ggc gga ccc gac cgc    672
Leu Asp Asp Leu Val Gln Arg Gln Pro Gly Asp Gly Gly Pro Asp Arg
    210                 215                 220
gag ggc ctg atc gcc atg gcc ctc atc ctg ctg gtc gcc ggc cac gag    720
Glu Gly Leu Ile Ala Met Ala Leu Ile Leu Leu Val Ala Gly His Glu
225                 230                 235                 240
acg acc gcc aac atg atc tcc ctc ggc acc ttc acg ctc ctg cag cac    768
Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln His
                245                 250                 255
ccc gag cgg ctc gcc gaa ctg cgc gcc gac tcc gag gtc atg ccg gcc    816
Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Ser Glu Val Met Pro Ala
            260                 265                 270
gcg gtc gag gaa ctg atg cgg ctg ctg tcc atc gcg gac ggc ctg ctg    864
Ala Val Glu Glu Leu Met Arg Leu Leu Ser Ile Ala Asp Gly Leu Leu
        275                 280                 285
cgc atc gcc gtc gag gac gtc gag gtg gcc ggg acg acg atc cgc gcc    912
Arg Ile Ala Val Glu Asp Val Glu Val Ala Gly Thr Thr Ile Arg Ala
    290                 295                 300
ggc gag ggc gtg gtg ttc gcg acg tcg gtc atc aac cgc gac gag acg    960
Gly Glu Gly Val Val Phe Ala Thr Ser Val Ile Asn Arg Asp Glu Thr
305                 310                 315                 320
gtc ttc gcc gag ccg gac acc ctc gac tgg agc cgc ccg gcc cgc cac   1008
Val Phe Ala Glu Pro Asp Thr Leu Asp Trp Ser Arg Pro Ala Arg His
                325                 330                 335
cac gtg gcg ttc ggc ttc ggc atc cac cag tgc ctc ggc caa aac ctc   1056
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
            340                 345                 350
gca cgc gcc gaa ctg gag atc gcc ctc ggc acc ctc ttc ggc cgg ctg   1104
Ala Arg Ala Glu Leu Glu Ile Ala Leu Gly Thr Leu Phe Gly Arg Leu
        355                 360                 365
ccc acg ctg cgc ctg gcc gcc ccg ccc gac gag atc ccc ttc aag ccg   1152
Pro Thr Leu Arg Leu Ala Ala Pro Pro Asp Glu Ile Pro Phe Lys Pro
    370                 375                 380
ggc gac acg atc cag ggg atg ctg gaa ctc ccc gtg acc tgg taa gaggc 1202
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
385                 390                 395
ttgcgggc atg cgc atc gac atc gac aag gac gtc tgc atc ggc gcg ggc   1252
         Met Arg Ile Asp Ile Asp Lys Asp Val Cys Ile Gly Ala Gly
         400                 405                 410
cag tgc gcc ctg acc gcc ccg gac gtg ttc acc cag gac gac gac ggc    1300
Gln Cys Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly
    415                 420                 425
tac agc acc ctg ctg ccc ggc cgg gag gac ggc ggc ggc agc ccg ctg    1348
Tyr Ser Thr Leu Leu Pro Gly Arg Glu Asp Gly Gly Gly Ser Pro Leu
430                 435                 440                 445
ctg cgg gag gcg gcc cgg gcc tgc ccg gtg agc gcc atc acc gtc tcg    1396
Leu Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Ser
                450                 455                 460
gag acc gtc ggc tga                                                1411
Glu Thr Val Gly
            465
<210>243
<211>1466
<212>DNA
<213>鲁地链霉菌(Streptomyces rutgersensis)IFO 15875T
<220>
<221>CDS
<222>(1)..(1245)
<220>
<221>CDS
<222>(1269)..(1466)
<400>243
atg acc gaa acg ctg gca gag acc acg acc gag gcg gaa gag ccg ctt      48
Met Thr Glu Thr Leu Ala Glu Thr Thr Thr Glu Ala Glu Glu Pro Leu
  1               5                  10                  15
ccg gag ttc ccg atg ccg cgg gcg aac ggc tgc ccc ttc gcc ccg ccc      96
Pro Glu Phe Pro Met Pro Arg Ala Asn Gly Cys Pro Phe Ala Pro Pro
             20                  25                  30
ccg acc gca cgg gcg ctg cac acc gaa cgg ccg gtc acg cgg gta cgg     144
Pro Thr Ala Arg Ala Leu His Thr Glu Arg Pro Val Thr Arg Val Arg
         35                  40                  45
ctg tgg gac ggc agc gcc ccc tgg ctg gtg acc cgg tac gcc gac cag     192
Leu Trp Asp Gly Ser Ala Pro Trp Leu Val Thr Arg Tyr Ala Asp Gln
     50                  55                  60
cgc gcc ctg ctc ggc gac ccg cgg gtc agc tcc gag gcc acc cgg ccc     240
Arg Ala Leu Leu Gly Asp Pro Arg Val Ser Ser Glu Ala Thr Arg Pro
 65                  70                  75                  80
ggc ttt ccg cat gcg agc gcc ggc ttc cgc gag aat gcc agg cgg cgg     288
Gly Phe Pro His Ala Ser Ala Gly Phe Arg Glu Asn Ala Arg Arg Arg
                 85                  90                  95
cgc tcc ttc atc acc atg gac gac ccc gag cac gcc cgg atc cgc cgg     336
Arg Ser Phe Ile Thr Met Asp Asp Pro Glu His Ala Arg Ile Arg Arg
            100                 105                 110
atg gtc acc gcg ccg ttc gcc atc aag cgg gtc gag gcg atg cgg ccc     384
Met Val Thr Ala Pro Phe Ala Ile Lys Arg Val Glu Ala Met Arg Pro
        115                 120                 125
gac atc cag aag atc acc gac gat ctg atc gac tcc atg ctg gcc ggg     432
Asp Ile Gln Lys Ile Thr Asp Asp Leu Ile Asp Ser Met Leu Ala Gly
    130                 135                 140
ccg acc ccg gtc gac ctg gtg cgc gcg ttg gcg ctg ccg ctg ccg tcg     480
Pro Thr Pro Val Asp Leu Val Arg Ala Leu Ala Leu Pro Leu Pro Ser
145                 150                 155                 160
ctg gtg atc tgc cgg ctg ctc gga gtg ccg tac gag gac cac gac ttc     528
Leu Val Ile Cys Arg Leu Leu Gly Val Pro Tyr Glu Asp His Asp Phe
                165                 170                 175
ttc cag cgc aac agc tcg ctc ctg atc aac cgt aac tcc acg acc gaa     576
Phe Gln Arg Asn Ser Ser Leu Leu Ile Asn Arg Asn Ser Thr Thr Glu
            180                 185                 190
gag gtg gtc ggc gcc aac gag gcg ctg acc gac tat ctg gac gag ctg     624
Glu Val Val Gly Ala Asn Glu Ala Leu Thr Asp Tyr Leu Asp Glu Leu
        195                 200                 205
gtc agc gcc aaa ctc gcc aac ccc gcc gac gac atg ctc tcc gag ctg     672
Val Ser Ala Lys Leu Ala Asn Pro Ala Asp Asp Met Leu Ser Glu Leu
    210                 215                 220
gcc gcc cgg gtc acg gcc gga gag ctg acc cag cgc gag gcc gcc aat     720
Ala Ala Arg Val Thr Ala Gly Glu Leu Thr Gln Arg Glu Ala Ala Asn
225                 230                 235                 240
atg ggc gtg ctg ctg ctg atc gcc ggc cat gag acc acc gcc aac atg     768
Met Gly Val Leu Leu Leu Ile Ala Gly His Glu Thr Thr Ala Asn Met
                245                 250                 255
atc gcc ctc ggc acc gtc gcc ctg ctg gag aac ccc gac cag ctc gcc     816
Ile Ala Leu Gly Thr Val Ala Leu Leu Glu Asn Pro Asp Gln Leu Ala
            260                 265                 270
gtc ctg cgg gag acc gac gac ccg aag gcg gtc gcc aag gcc gtc gag     864
Val Leu Arg Glu Thr Asp Asp Pro Lys Ala Val Ala Lys Ala Val Glu
        275                 280                 285
gaa ctg ctg cgc tat ctg acc atc gtg cac acc ggc cgg cgc cgg gtc     912
Glu Leu Leu Arg Tyr Leu Thr Ile Val His Thr Gly Arg Arg Arg Val
    290                 295                 300
gcg cgg gag gac atc gag atc ggc ggc gag acc atc cgt gcc ggg gac     960
Ala Arg Glu Asp Ile Glu Ile Gly Gly Glu Thr Ile Arg Ala Gly Asp
305                 310                 315                 320
ggg atc atc atc tac acc ggc acc ggc aac tgg gac gcg gag gtc ttc    1008
Gly Ile Ile Ile Tyr Thr Gly Thr Gly Asn Trp Asp Ala Glu Val Phe
                325                 330                 335
ccc gag ccc gag cgg ctg gac atc ggc cgc gac gcc cgc cgc cac atg    1056
Pro Glu Pro Glu Arg Leu Asp Ile Gly Arg Asp Ala Arg Arg His Met
            340                 345                 350
gcg ttc ggt ttc ggc gtc cac cag tgc ctg ggc cag ccg ctg gcc cgg    1104
Ala Phe Gly Phe Gly Val His Gln Cys Leu Gly Gln Pro Leu Ala Arg
        355                 360                 365
gtg gag ctg cag gtg gtc tac ggc acg ctc tac cgc cgt atc ccc acg    1152
Val Glu Leu Gln Val Val Tyr Gly Thr Leu Tyr Arg Arg Ile Pro Thr
    370                 375                 380
ctg cgg ctg gcg acc ggg gtc gac caa cta ccg ttc aag gac gac ggt    1200
Leu Arg Leu Ala Thr Gly Val Asp Gln Leu Pro Phe Lys Asp Asp Gly
385                 390                 395                 400
ttg gtc tac ggc gtc tat gaa ctg ccc gtc acc tgg acg tct tga gcaac  1250
Leu Val Tyr Gly Val Tyr Glu Leu Pro Val Thr Trp Thr Ser
                405                 410                 415
ggaggcaagg gagtcacc atg cgt gtg gaa gtc gat gtt ccc aag tgt gtg    1301
                    Met Arg Val Glu Val Asp Val Pro Lys Cys Val
                                    420                 425
gca tcg ggt cag tgc gtg atg atc gca ccc gat gtg ttc gac cag cgg    1349
Ala Ser Gly Gln Cys Val Met Ile Ala Pro Asp Val Phe Asp Gln Arg
            430                 435                 440
gag gag gac ggc atc gtg atc ctg ctg gac gag cag ccc gcg tcc gaa    1397
Glu Glu Asp Gly Ile Val Ile Leu Leu Asp Glu Gln Pro Ala Ser Glu
        445                 450                 455
ctc cac gcc gat gtg cgt gag tcc gcg gtg gtc tgc ccg gcg gcg gcg   1445
Leu His Ala Asp Val Arg Glu Ser Ala Val Val Cys Pro Ala Ala Ala
    460                 465                 470
ata cgg gtg gtc gag aat tga                                       1466
Ile Arg Val Val Glu Asn
475                 480
<210>244
<211>1411
<212>DNA
<213>斯堡链霉菌(Streptomyces steffisburgensis)IFO 13446T
<220>
<221>CDS
<222>(1)..(1197)
<220>
<221>CDS
<222>(1211)..(1411)
<400>244
atg tcg gac acg acc gca ccc gtg gcc ttc ccc cag agc cgg acc tgc     48
Met Ser Asp Thr Thr Ala Pro Val Ala Phe Pro Gln Ser Arg Thr Cys
  1               5                  10                  15
ccc tac cac ccg ccc gcc gcc tac gag ccg ctg cgc gcc gag cgc ccc     96
Pro Tyr His Pro Pro Ala Ala Tyr Glu Pro Leu Arg Ala Glu Arg Pro
             20                  25                  30
ctg acc cgt atc acc ctc ttc gac ggc cgt gag gcc tgg ctg gtc agc    144
Leu Thr Arg Ile Thr Leu Phe Asp Gly Arg Glu Ala Trp Leu Val Ser
         35                  40                  45
ggc cac gcc acc gcc cgc gcg ctg ctc gcc gac ccg cgc ctg tcc tcc    192
Gly His Ala Thr Ala Arg Ala Leu Leu Ala Asp Pro Arg Leu Ser Ser
     50                  55                  60
gac cgc gac cgc ccc ggc ttc ccc gcc ccc acc gcg cgc ttc gcc ggg    240
Asp Arg Asp Arg Pro Gly Phe Pro Ala Pro Thr Ala Arg Phe Ala Gly
 65                  70                  75                  80
atc cgc aac cgc aga acg gcc ctg ctg ggc gtc gac gac ccc gag cac    288
Ile Arg Asn Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro Glu His
                 85                  90                  95
cga gtc cag cgg cgg atg gtg gcc ggg gac ttc acc ctc aaa cgg gcc    336
Arg Val Gln Arg Arg Met Val Ala Gly Asp Phe Thr Leu Lys Arg Ala
            100                 105                 110
gcc gga ctg cga ccc cgc atc cag cgg atc gtg gac cga cga ctc gac    384
Ala Gly Leu Arg Pro Arg Ile Gln Arg Ile Val Asp Arg Arg Leu Asp
        115                 120                 125
gcg atg atc gcc cag ggc cca ccg gcc gac ctg gtg agc agc ttc gcg    432
Ala Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val Ser Ser Phe Ala
    130                 135                 140
ctg ccc gtc ccg tcc atg gtg atc tgt gcc ctg ctc ggc gtc ccg tac    480
Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Pro Tyr
145                 150                 155                 160
gcc gac cac gac ttc ttc gag acc cag tca cgg cgg ctg ctg cgc ggc    528
Ala Asp His Asp Phe Phe Glu Thr Gln Ser Arg Arg Leu Leu Arg Gly
                165                 170                 175
ccg cag acc gcc gac gtg atg gac gcc cgg gcc cgg ctg gac gag tac    576
Pro Gln Thr Ala Asp Val Met Asp Ala Arg Ala Arg Leu Asp Glu Tyr
            180                 185                 190
ttc ggc gaa ctg atc gac cgc aag cgg aag gaa ccc ggc gcc ggc ctg    624
Phe Gly Glu Leu Ile Asp Arg Lys Arg Lys Glu Pro Gly Ala Gly Leu
        195                 200                 205
ctg gac gac ctg gtc cag cga cag ctg cgc gac ggc gca ctc gac cgc     672
Leu Asp Asp Leu Val Gln Arg Gln Leu Arg Asp Gly Ala Leu Asp Arg
    210                 215                 220
gag ggc ctg atc gcc ctg gcg ctc atc ctg ctg gtc gcg ggc cac gag     720
Glu Gly Leu Ile Ala Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu
225                 230                 235                 240
acg acc gcc aac atg atc tcg ctc ggc acc ttc acc ctg ctg cag cac     768
Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln His
                245                 250                 255
ccc gaa cgg ctc gcc gag ctg cgc gcc gac ccg cgg ctg ctg cct gcg     816
Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Arg Leu Leu Pro Ala
            260                 265                 270
gcg gtc gag gag ctg atg cgc atg ctg tcc atc gcg gac ggt ctg ctc     864
Ala Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu
        275                 280                 285
cgc ctc gcc gtc gag gac ata gag gtg gcc ggg acc acg atc cgc aag     912
Arg Leu Ala Val Glu Asp Ile Glu Val Ala Gly Thr Thr Ile Arg Lys
    290                 295                 300
ggg gac ggc gtg gtg ttc ctg acg tcc gtc atc aac cgc gac gag acg     960
Gly Asp Gly Val Val Phe Leu Thr Ser Val Ile Asn Arg Asp Glu Thr
305                 310                 315                 320
gtc tac ccc gag ccg gac acc ctc gac tgg cac cgc tcg gcc cgg cat    1008
Val Tyr Pro Glu Pro Asp Thr Leu Asp Trp His Arg Ser Ala Arg His
                325                 330                 335
cac gtc gcg ttc ggc ttc ggc atc cac cag tgc ctc ggc cag aac ctc    1056
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
            340                 345                 350
gcg cgc gcc gag ctg gag atc gcc ctg tgg acc ctc ttc gac cgt ctg    1104
Ala Arg Ala Glu Leu Glu Ile Ala Leu Trp Thr Leu Phe Asp Arg Leu
        355                 360                 365
ccc acc ctg cgc ctg gcc gcg ccg gcc gag gag atc gcc ttc aag ccg    1152
Pro Thr Leu Arg Leu Ala Ala Pro Ala Glu Glu Ile Ala Phe Lys Pro
    370                 375                 380
ggc gac acg atc cag ggg atg ctg gaa ctc ccc gtg act tgg taa gaggc  1202
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp
385                 390                 395
ttcccccc atg cac atc gac atc gac aag gac gtc tgc atc ggc gcg ggc   1252
         Met His Ile Asp Ile Asp Lys Asp Val Cys Ile Gly Ala Gly
         400                 405                 410
cag tgc gcc ctg acc gcc ccg gac gtg ttc acc cag gac gac gac ggc    1300
Gln Cys Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly
    415                 420                 425
atc agc gcc ctg ctg ccg gga cag gag gac ggc ggc ggc agc ccg ctg    1348
Ile Ser Ala Leu Leu Pro Gly Gln Glu Asp Gly Gly Gly Ser Pro Leu
430                 435                 440                 445
gtg cgg gag gcg gcc cgt gcc tgc ccg gtg agc gcc atc acc gtg tcg    1396
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Ser
                450                 455                 460
gag acg gtg agc tga                                                1411
Glu Thr Val Ser
            465
<210>245
<211>65
<212>PRT
<213>装饰链霉菌(Streptomyces ornatus)IFO 13069t
<400>245
Met Gly Val Arg Val Asp Arg Glu Arg Cys Val Gly Ala Gly Met Cys
  1               5                  10                  15
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
Glu Met Leu Pro Gly Ser Thr Ala Gly Thr Gly Asp His Pro Arg Val
         35                  40                  45
Arg Glu Ala Val Arg Ala Cys Pro Val Gly Ala Val Ser Leu Thr Asp
     50                  55                  60
Asp
 65
<210>246
<211>65
<212>PRT
<213>灰色链霉菌(Streptomyces griseus)ATCC 10137
<400>246
Met Gly Val Arg Val Asp Arg Glu Arg Cys Val Gly Ala Gly Met Cys
  1               5                  10                  15
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
Glu Met Leu Pro Gly Ser Thr Ala Gly Thr Gly Asp His Pro Arg Val
         35                  40                  45
Ara Glu Ala Val Arg Ala Cys Pro Val Gly Ala Val Ser Leu Thr Asp
     50                  55                  60
Asp
 65
<210>247
<211>68
<212>PRT
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<400>247
Met His Met Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly
  1               5                  10                  15
Gln Cys Ala Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly
             20                  25                  30
Tyr Ser Thr Leu Leu Pro Gly Arg Glu Asn Gly Val Thr Asp Pro Met
         35                  40                  45
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg
     50                  55                  60
Glu Arg Thr Ala
 65
<210>248
<211>51
<212>PRT
<213>灰色链霉菌(Streptomyces griseus)IFO 13849T
<400>248
Met Cys Ala Leu Thr Ala Pro Glu Val Phe Thr Gln Asp Asp Asp Gly
  1               5                  10                  15
Phe Ser Glu Val Arg Pro Gly Gly Thr Ala Ala Thr Ala Gly His Pro
             20                  25                  30
Leu Val Arg Asp Ala Ala Arg Ala Cys Pro Val Gly Ala Val Thr Leu
         35                  40                  45
Thr Asp Asp
     50
<210>249
<211>76
<212>PRT
<213>羊毛链霉菌(Streptomyces lanatus)IFO 12787T
<400>249
Met His Asn Glu Thr His Glu Ser Gly His Ile His Ile Asp Ile Asp
  1               5                  10                  15
His Asp Val Cys Val Gly Ala Gly Gln Cys Ala Leu Ala Ala Pro Ser
             20                  25                  30
Val Phe Thr Gln Asp Asp Asp Gly Phe Ser Thr Leu Leu Pro Gly Arg
         35                  40                  45
Glu Asp Gly Gly Gly Asp Pro Met Val Arg Glu Ala Ala Arg Ala Cys
     50                  55                  60
Pro Val Ser Ala Ile Thr Val Ser Glu Gly Gly Ser
 65                  70                  75
<210>250
<211>66
<212>PRT
<213>三泽链霉菌(Streptomyces misawanensis)IFO 13855T
<400>250
Met His Ile Glu Ile Asp Ser Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
Ala Leu Thr Ala Pro Asn Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
Thr Leu Leu Pro Gly Met Ala Asp Gly Gly Gly Asp Pro Leu Val Lys
         35                  40                  45
Glu Ala Ala Arg Ala Cys Pro Val His Ala Ile Thr Val Glu Glu Pro
     50                  55                  60
Ser Gly
 65
<210>251
<211>64
<212>PRT
<213>苍白色链霉菌(Streptomyces pallidus)IFO 13434T
<400>251
Met Arg Val Glu Leu Asp Glu Pro Lys Cys Val Ala Ser Gly Gln Cys
  1               5                  10                  15
Val Met Ala Ala Pro Glu Val Phe Asp Gln Arg Glu Glu Asp Gly Ile
             20                  25                  30
Ala Phe Val Leu Asp Glu Arg Pro Ala Ala Asp Val Leu Ala Glu Val
         35                  40                  45
Arg Glu Ala Val Ala Ile Cys Pro Ala Ala Ala Ile Arg Leu Val Glu
     50                  55                  60
<210>252
<211>66
<212>PRT
<213>玫瑰变红链霉菌(Streptomyces roseorubens)IFO 13682T
<400>252
Met Arg Ile Asp Ile Asp Lys Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Tyr Ser
             20                  25                  30
Thr Leu Leu Pro Gly Arg Glu Asp Gly Gly Gly Ser Pro Leu Leu Arg
         35                  40                  45
Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Ser Glu Thr
     50                  55                  60
Val Gly
 65
<210>253
<211>65
<212>PRT
<213>鲁地链霉菌(Streptomyces rutgersensis)IFO 15875T
<400>253
Met Arg Val Glu Val Asp Val Pro Lys Cys Val Ala Ser Gly Gln Cys
  1               5                  10                  15
Val Met Ile Ala Pro Asp Val Phe Asp Gln Arg Glu Glu Asp Gly Ile
             20                  25                  30
Val Ile Leu Leu Asp Glu Gln Pro Ala Ser Glu Leu His Ala Asp Val
         35                  40                  45
Arg Glu Ser Ala Val Val Cys Pro Ala Ala Ala Ile Arg Val Val Glu
     50                  55                  60
Asn
 65
<210>254
<211>66
<212>PRT
<213>斯堡链霉菌(Streptomyces steffisburgensis)IFO 13446T
<400>254
Met His Ile Asp Ile Asp Lys Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Ile Ser
             20                  25                  30
Ala Leu Leu Pro Gly Gln Glu Asp Gly Gly Gly Ser Pro Leu Val Arg
         35                  40                  45
Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Ser Glu Thr
     50                  55                  60
Val Ser
 65
<210>255
<211>198
<212>DNA
<213>装饰链霉菌(Streptomyces ornatus)IFO 13069t
<220>
<221>CDS
<222>(1)..(198)
<400>255
atg ggc gtg cgg gtc gac agg gaa cgg tgc gtg ggg gcc ggc atg tgc     48
Met Gly Val Arg Val Asp Arg Glu Arg Cys Val Gly Ala Gly Met Cys
  1               5                  10                  15
gcg ctg acc gcg ccc gac gtg ttc acg cag gac gac gac ggg ttc agc     96
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
gag atg ctt ccc ggg agc acg gcg ggg acg ggg gac cac cca cgg gtg    144
Glu Met Leu Pro Gly Ser Thr Ala Gly Thr Gly Asp His Pro Arg Val
         35                  40                  45
cgg gag gcc gtt cgg gcc tgc ccg gtc ggg gcg gtg tcc ctg acc gac    192
Arg Glu Ala Val Arg Ala Cys Pro Val Gly Ala Val Ser Leu Thr Asp
     50                  55                  60
gac tga                                                            198
Asp
 65
<210>256
<211>198
<212>DNA
<213>灰色链霉菌(Streptomyces griseus)ATCC 10137
<220>
<221>CDS
<222>(1)..(198)
<400>256
atg ggc gtg cgg gtc gac agg gaa cgg tgc gtg ggg gcc ggc atg tgc     48
Met Gly Val Arg Val Asp Arg Glu Arg Cys Val Gly Ala Gly Met Cys
  1               5                  10                  15
gcg ctg acc gcg ccc gac gtg ttc acg cag gac gac gac ggg ttc agc     96
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
gag atg ctt ccc ggg agc acg gcg ggg acg ggg gac cac cca cgg gtg    144
Glu Met Leu Pro Gly Ser Thr Ala Gly Thr Gly Asp His Pro Arg Val
         35                  40                  45
cgg gag gcc gtt cgg gcc tgc ccg gtc ggg gcg gtg tcc ctg acc gac    192
Arg Glu Ala Val Arg Ala Cys Pro Val Gly Ala Val Ser Leu Thr Asp
     50                  55                  60
gac tga                                                            198
Asp
 65
<210>257
<211>207
<212>DNA
<213>不产色链霉菌(Streptomyces achromogenes)IFO 12735
<220>
<221>CDS
<222>(1)..(207)
<400>257
atg cac atg gac atc gac atc gac cag gac gtc tgt atc ggc gcc ggg     48
Met His Met Asp Ile Asp Ile Asp Gln Asp Val Cys Ile Gly Ala Gly
  1               5                  10                  15
cag tgc gcg ctg gcg gca ccg ggc gtc ttc acc cag gac gac gac ggc     96
Gln Cys Ala Leu Ala Ala Pro Gly Val Phe Thr Gln Asp Asp Asp Gly
             20                  25                  30
tac agc acc ctg ctg ccc ggc cgg gag aac ggc gtc acc gac ccg atg    144
Tyr Ser Thr Leu Leu Pro Gly Arg Glu Asn Gly Val Thr Asp Pro Met
         35                  40                  45
gtc cgg gag gcc gcc cgc gcc tgc ccg gtc agc gcc atc acc gta cga    192
Val Arg Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Arg
     50                  55                  60
gag cgc acc gcc tga                                                207
Glu Arg Thr Ala
 65
<210>258
<211>156
<212>DNA
<213>灰色链霉菌(Streptomyces griseus)IFO 13849T
<220>
<221>CDS
<222>(1)..(156)
<400>258
atg tgc gcg ctg acc gcg ccg gag gtg ttc aca cag gac gac gac ggt     48
Met Cys Ala Leu Thr Ala Pro Glu Val Phe Thr Gln Asp Asp Asp Gly
  1               5                  10                  15
ttc agc gag gtg cgt ccc ggt ggc acg gcc gcc act gct ggc cac ccg     96
Phe Ser Glu Val Arg Pro Gly Gly Thr Ala Ala Thr Ala Gly His Pro
             20                  25                  30
ctg gta cgc gat gcc gca cgg gcc tgc ccg gtc ggg gcg gtg acc ctg    144
Leu Val Arg Asp Ala Ala Arg Ala Cys Pro Val Gly Ala Val Thr Leu
         35                  40                  45
acc gac gac tga                                                    156
Thr Asp Asp
     50
<210>259
<211>231
<212>DNA
<213>羊毛链霉菌(Streptomyces lanatus)IFO 12787T
<220>
<221>CDS
<222>(1)..(231)
<400>259
atg cac aac gaa acg cac gaa tca ggc cat atc cac atc gac atc gac     48
Met His Asn Glu Thr His Glu Ser Gly His Ile His Ile Asp Ile Asp
  1               5                  10                  15
cat gac gtc tgc gtc ggc gcc ggg cag tgc gcc ctc gcc gcc ccc tcc     96
His Asp Val Cys Val Gly Ala Gly Gln Cys Ala Leu Ala Ala Pro Ser
             20                  25                  30
gtg ttc acc cag gac gac gac ggc ttc agc acc ctg ctt ccc ggc cgc    144
Val Phe Thr Gln Asp Asp Asp Gly Phe Ser Thr Leu Leu Pro Gly Arg
         35                  40                  45
gag gac ggc ggc ggc gac ccc atg gtg cgg gag gcg gcc cgg gcg tgc    192
Glu Asp Gly Gly Gly Asp Pro Met Val Arg Glu Ala Ala Arg Ala Cys
     50                  55                  60
ccg gtc agc gcc atc acc gtg tcc gaa ggg ggg agt tga                231
Pro Val Ser Ala Ile Thr Val Ser Glu Gly Gly Ser
 65                  70                  75
<210>260
<211>201
<212>DNA
<213>三泽链霉菌(Streptomyces misawanensis)IFO 13855T
<220>
<221>CDS
<222>(1)..(201)
<400>260
atg cac atc gag atc gac agt gac gtc tgc atc ggc gcg ggg cag tgt     48
Met His Ile Glu Ile Asp Ser Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
gcc ctg acc gcc ccc aac gtc ttc acc cag gac gac gac ggt ttc agc     96
Ala Leu Thr Ala Pro Asn Val Phe Thr Gln Asp Asp Asp Gly Phe Ser
             20                  25                  30
acc ctg ctc ccc ggg atg gcg gac ggc ggc ggc gac ccg ctg gtc aag    144
Thr Leu Leu Pro Gly Met Ala Asp Gly Gly Gly Asp Pro Leu Val Lys
         35                  40                  45
gag gcg gcc cgg gcc tgc ccg gtg cac gcc atc acg gtc gag gaa ccg    192
Glu Ala Ala Arg Ala Cys Pro Val His Ala Ile Thr Val Glu Glu Pro
     50                  55                  60
tcg ggt tag                                                        201
Ser Gly
 65
<210>261
<211>195
<212>DNA
<213>苍白色链霉菌(Streptomyces pallidus)IFO 13434T
<220>
<221>CDS
<222>(1)..(195)
<400>261
atg cga gtg gaa ctg gac gag ccg aag tgc gtc gcg tcg ggg cag tgc     48
Met Arg Val Glu Leu Asp Glu Pro Lys Cys Val Ala Ser Gly Gln Cys
  1               5                  10                  15
gtg atg gcc gcc ccc gag gtc ttc gac cag cgc gag gag gac ggc atc     96
Val Met Ala Ala Pro Glu Val Phe Asp Gln Arg Glu Glu Asp Gly Ile
             20                  25                  30
gcc ttc gtg ctg gac gag cgg ccg gcg gcg gac gtc ctg gcg gag gtg    144
Ala Phe Val Leu Asp Glu Arg Pro Ala Ala Asp Val Leu Ala Glu Val
         35                  40                  45
cgc gag gcc gtg gcg atc tgc ccc gcc gcc gcg atc cgg ctg gtg gag    192
Arg Glu Ala Val Ala Ile Cys Pro Ala Ala Ala Ile Arg Leu Val Glu
     50                  55                  60
tga                                                                195
<210>262
<211>201
<212>DNA
<213>玫瑰变红链霉菌(Streptomyces roseorubens)IFO 13682T
<220>
<221>CDS
<222>(1)..(201)
<400>262
atg cgc atc gac atc gac aag gac gtc tgc atc ggc gcg ggc cag tgc     48
Met Arg Ile Asp Ile Asp Lys Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
gcc ctg acc gcc ccg gac gtg ttc gcc cag gac gac gac ggc tac agc     96
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Tyr Ser
             20                  25                  30
acc ctg ctg ccc ggc cgg gag gac ggc ggc ggc agc ccg ctg ctg cgg    144
Thr Leu Leu Pro Gly Arg Glu Asp Gly Gly Gly Ser Pro Leu Leu Arg
         35                  40                  45
gag gcg gcc cgg gcc tgc ccg gtg agc gcc atc acc gtc tcg gag acc    192
Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Ser Glu Thr
     50                  55                  60
gtc ggc tga                                                        201
Val Gly
 65
<210>263
<211>198
<212>DNA
<213>鲁地链霉菌(Streptomyces rutgersensis)IFO 15875T
<220>
<221>CDS
<222>(1)..(198)
<400>263
atg cgt gtg gaa gtc gat gtt ccc aag tgt gtg gca tcg ggt cag tgc     48
Met Arg Val Glu Val Asp Val Pro Lys Cys Val Ala Ser Gly Gln Cys
  1               5                  10                  15
gtg atg atc gca ccc gat gtg ttc gac cag cgg gag gag gac ggc atc     96
Val Met Ile Ala Pro Asp Val Phe Asp Gln Arg Glu Glu Asp Gly Ile
             20                  25                  30
gtg atc ctg ctg gac gag cag ccc gcg tcc gaa ctc cac gcc gat gtg    144
Val Ile Leu Leu Asp Glu Gln Pro Ala Ser Glu Leu His Ala Asp Val
         35                  40                  45
cgt gag tcc gcg gtg gtc tgc ccg gcg gcg gcg ata cgg gtg gtc gag    192
Arg Glu Ser Ala Val Val Cys Pro Ala Ala Ala Ile Arg Val Val Glu
     50                  55                  60
aat tga                                                            198
Asn
 65
<210>264
<211>201
<212>DNA
<213>斯堡链霉菌(Streptomyces steffisburgensis)IFO 13446T
<220>
<221>CDS
<222>(1)..(201)
<400>264
atg cac atc gac atc gac aag gac gtc tgc atc ggc gcg ggc cag tgc     48
Met His Ile Asp Ile Asp Lys Asp Val Cys Ile Gly Ala Gly Gln Cys
  1               5                  10                  15
gcc ctg acc gcc ccg gac gtg ttc acc cag gac gac gac ggc atc agc     96
Ala Leu Thr Ala Pro Asp Val Phe Thr Gln Asp Asp Asp Gly Ile Ser
             20                  25                  30
gcc ctg ctg ccg gga cag gag gac ggc ggc ggc agc ccg ctg gtg cgg    144
Ala Leu Leu Pro Gly Gln Glu Asp Gly Gly Gly Ser Pro Leu Val Arg
         35                  40                  45
gag gcg gcc cgt gcc tgc ccg gtg agc gcc atc acc gtg tcg gag acg    192
Glu Ala Ala Arg Ala Cys Pro Val Ser Ala Ile Thr Val Ser Glu Thr
     50                  55                  60
gtg agc tga                                                         201
Val Ser
 65
<210>265
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>265
ctcgaagaac tcgtggtcgg cgtacgg                                        27
<210>266
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>266
cacaccgagg agcgcgcaga tcaccat                                        27
<210>267
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>267
cgtgttcttc tcgacctcgc tcatcaacc                                      29
<210>268
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>268
ctacgagaat ccggagacgc tcgactg                                        27
<210>269
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>269
ccaagctttc agtcgtcggt cagggacac                                      29
<210>270
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>270
agcagtccgt ccaccgtctc ctggatg                                        27
<210>271
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>271
ctatccgctt cacggagaag ctcgggatga                                     30
<210>272
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>272
ggcgtgttct tctcgacctc gctcatc                                        27
<210>273
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>273
caccgaggtc tacgagaatc cggagac                                        27
<210>274
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>274
gccatatgac ggaatccacg acggaac                                        27
<210>275
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>275
ccaagctttc agtcgtcggt cagggacac                                      29
<210>276
<211>23
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>276
gagcttctcc gtgaagcgga tag                                            23
<210>277
<211>30
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>277
caaagctttc accaggccac gggcaggtgc                                     30
<210>278
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>278
ccagggagat catgttggcg gtcgtct                                        27
<210>279
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>279
cttggcgtcg atcaggtcgc cgaggaa                                        27
<210>280
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>280
accgccgaag ctttcaggcg gtgcgct                                        27
<210>281
<211>27
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>281
ggacgaactg ctggacgcga tgatcga                                        27
<210>282
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>282
agcagccggt ccaccgtctc ctggatac                                       28
<210>283
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>283
cgtttcacgg agaagctcgg gatgagca                                       28
<210>284
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>284
gatcgaggac atcgaggtgg acgggac                                        27
<210>285
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>285
tcttcttctc cacctcgctc gtcaaccg                                       28
<210>286
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>286
atcatatgac ggaatccacg acggaacc                                       28
<210>287
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>287
cgaagctttc agtcgtcggt cagggtcac                                      29
<210>288
<211>20
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>288
gtatccagga gacggtggac                                                20
<210>289
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>289
gcggagagtg aagctgggga ccatcat                                        27
<210>290
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>290
cgaggagctc atgcggatgc tgtcgat                                        27
<210>291
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>291
cgtggtcttc tcgacctcgg tcatcaa                                        27
<210>292
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>292
cgaggtccat atgacggaca tgaccgatat                                     30
<210>293
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>293
gatgccaagc tttcaactcc ccccttcgga                                     30
<210>294
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>294
cgagcagatc gtcgacgatc cgctggat                                       28
<210>295
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>295
ttgagggtga agtccgggat cagcatc                                        27
<210>296
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>296
gaggaactga tgcggatgct gtccatc                                        27
<210>297
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>297
catcaaccgt gacgagtccg tgtacga                                        27
<210>298
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>298
ctcatatgaa agaactgacg gacctga                                        27
<210>299
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>299
gcaagcttct aacccgacgg ttcctcgac                                      29
<210>300
<211>22
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>300
gatgctgatc ccggacttca cc                                             22
<210>301
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>301
cttctcgccc atcagctcgt cgaggta                                        27
<210>302
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>302
gaggatccgg ctgttctcct ggaagaa                                        27
<210>303
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>303
catgaggatg aagctggcgt tgttctc                                        27
<210>304
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>304
gacatcgaga tcggcggaca ggtcatc                                        27
<210>305
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>305
atgatcatgc ccaacgacct cgccaac                                        27
<210>306
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>306
cgaccgagga gacatatggc cgacaccctc gcc                                 33
<210>307
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>307
aaatcgaagc tttcactcca ccagccggat cgc                                 33
<210>308
<211>30
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>308
ggagtgccgt acgaggacca cgacttcttc                                     30
<210>309
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>309
agcctcgaag aagtcgtggt cggcgta                                        27
<210>310
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>310
gagtcgttcg tcgacgatcc gctggat                                        27
<210>311
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>311
ccaacatgat ctccctcggc accttca                                        27
<210>312
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>312
ggtcatcaac cgcgacgaga cggtctt                                        27
<210>313
<211>33
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>313
gtctgcgagg tccatatgac ggacacgacc gca                                 33
<210>314
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>314
tgacaagctt tcagccgacg gtctccgaga                                     30
<210>315
<211>27
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>315
cgtcgacgaa cgactcgacg cgatgat                                        27
<210>316
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>316
cgtggagtta cggttgatca ggagcga                                        27
<210>317
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>317
cagatcgtcg gtgatcttct ggatgtc                                        27
<210>318
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>318
gaactgctgc gctatctgac catcgtg                                        27
<210>319
<211>28
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>319
atcatcgtct acaccggcac cggcaact                                       28
<210>320
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>320
ccgaggagac atatgaccga aacgctggca                                     30
<210>321
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>321
ccaccacaag cttcttcaat tctcgaccac                                     30
<210>322
<211>27
<212>DNA
<213>人工序列
<220>
<223>为DNA测序设计的寡核苷酸引物
<400>322
atggtgatct gccggctgct cggagtg                                        27
<210>323
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>323
ggtctcgaag aagtcgtggt cggcgta                                        27
<210>324
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>324
tttgagggtg aagtccccgg ccaccat                                        27
<210>325
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>325
cgtcatcaac cgcgacgaga cggtcta                                        27
<210>326
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>326
gaggtccata tgtcggacac gaccgca                                        27
<210>327
<211>26
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>327
tacaagcttt cagctcaccg tctccg                                         26
<210>328
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>328
atgacccagt ccgccgacgc cgtaccc                                        27
<210>329
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>329
tcaccaggtg acggggagtt cgtagac                                        27
<210>330
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>330
atgacggaac tgacggacat caccggc                                        27
<210>331
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>331
ttaccaggtc acggggagtt ccagcat                                        27
<210>332
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>332
atgacggaat ccacgacaga tccgacg                                        27
<210>333
<211>26
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>333
tcaccaggcc acgggcagtt cgagca                                         26
<210>334
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>334
atgacggaca tgacggaaac ccccacc                                        27
<210>335
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>335
atgacggaat ccacgacgga accggcc                                        27
<210>336
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>336
tcaccaggcc acgggcaggt gcagaag                                        27
<210>337
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>337
atgacggaca tgacggaaac ccccacc                                        27
<210>338
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>338
atgaaagaac tgacggacct gacggaa                                        27
<210>339
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>339
atgtcggaca cgaccgaccc cgtggcc                                        27
<210>340
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>340
atggccgaca ccctcgccgg cgccacg                                        27
<210>341
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>341
tcaccacgtg acgggcagtt cgtagac                                        27
<210>342
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>342
atgaccgaaa cgctggcaga gaccacg                                        27
<210>343
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>343
tcaagacgtc caggtgacgg gcagttc                                        27
<210>344
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>344
catatgacag atactactgc acctgttgca tttcctcaga gtaggacctg tccatatcat    60
ccacctgctg                                                           70
<210>345
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>345
tccatatcat ccacctgctg catacgaacc acttcgtgct gaacgtcctc tgactaggat    60
tactctcttt                                                           70
<210>346
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>346
tgactaggat tactctcttt gatggacgtg aagcatggtt ggttagtggt catgccaccg    60
cacgtgctct                                                           70
<210>347
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>347
aggaggatgg tcgttgggga cttcactctc aaacgggcag ctgcattgag gccccgcatt    60
cagaggattg                                                           70
<210>348
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>348
gccccgcatt cagaggattg ttgatgaacg actcgatgcg atgattgctc aaggaccacc    60
tgcagatttg                                                           70
<210>349
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>349
aaggaccacc tgcagatttg gtgagcgcat ttgcattgcc agtgccttca atggtgatat    60
gcgctttgct                                                           70
<210>350
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>350
aagagagaag atcctggtac tggattactt gatgaccttg ttcaacggca gccaggagat    60
ggtggacccg                                                           70
<210>351
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>351
gccaggagat ggtggacccg atagagaagg actgatagcc atggccctca tcctgcttgt    60
agcaggccat                                                           70
<210>352
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>352
tcctgcttgt agcaggccat gagacgaccg ccaacatgat atcactaggc acctttacac    60
tcttgcaaca                                                           70
<210>353
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>353
acaacaatcc gagctggaga aggcgtagtg ttcgcgacat cggtcatcaa tagagatgag    60
acagtctttg                                                           70
<210>354
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>354
tagagatgag acagtctttg ctgagccgga cactctcgac tggtctagac cagccagaca    60
tcacgtagcg                                                           70
<210>355
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>355
cagccagaca tcacgtagcg ttcggctttg ggattcacca gtgcttaggt caaaacttag    60
caagagccga                                                           70
<210>356
<211>56
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>356
aagcttttac caggtcacgg ggagttccaa catcccttgg atcgtgtcgc ctggct        56
<210>357
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>357
ttggatcgtg tcgcctggct tgaagggaat ctcatctgga ggagcggcca atctaagtgt    60
gggcaaccta                                                           70
<210>358
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>358
atctaagtgt gggcaaccta ccgaagaggg tgcctaaggc gatctcaagt tcggctcttg    60
ctaagttttg                                                           70
<210>359
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>359
tctccagctc ggattgttgt cccggccact tcaacatcct caacagcaat gcgcaacaga    60
ccatctgcaa                                                           70
<210>360
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>360
gcgcaacaga ccatctgcaa tggacagcaa cctcataagt tcctcaactg cggccggcat    60
gacctcggag                                                           70
<210>361
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>361
cggccggcat gacctcggag tcagctcgaa gttcagctag cctctcaggg tgttgcaaga    60
gtgtaaaggt                                                           70
<210>362
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>362
gtaccaggat cttctctctt gcggtcaata agctcaccga agtactcctc aagcctgctc    60
ctagcatcct                                                           70
<210>363
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>363
aagcctgctc ctagcatcct gcacatcagc agtccctggt cctctcagaa gtctccttga    60
ttgagcttca                                                           70
<210>364
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>364
gtctccttga ttgagcttca aagaagtcat ggtcagcata gggaacacct agcaaagcgc    60
atatcaccat                                                           70
<210>365
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>365
tccccaacga ccatcctcct ttgggcacgg tgctcaggat cgtccacacc gagaagagct    60
gtacgtctat                                                           70
<210>366
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>366
gagaagagct gtacgtctat tgcgtatccc agcaaatctc gcagtagggg ttgggaatcc    60
aggtctgtcg                                                           70
<210>367
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>367
ttgggaatcc aggtctgtcg cgatcagaag acaatcttgg atctgctaga agagcacgtg    60
cggtggcatg                                                           70
<210>368
<211>1197
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(1197)
<223>设计的编码SEQ ID No.222的氨基酸序列的多核苷酸
<400>368
atg aca gat act act gca cct gtt gca ttt cct cag agt agg acc tgt      48
Met Thr Asp Thr Thr Ala Pro Val Ala Phe Pro Gln Ser Arg Thr Cys
  1               5                  10                  15
cca tat cat cca cct gct gca tac gaa cca ctt cgt gct gaa cgt cct      96
Pro Tyr His Pro Pro Ala Ala Tyr Glu Pro Leu Arg Ala Glu Arg Pro
             20                  25                  30
ctg act agg att act ctc ttt gat gga cgt gaa gca tgg ttg gtt agt     144
Leu Thr Arg Ile Thr Leu Phe Asp Gly Arg Glu Ala Trp Leu Val Ser
         35                  40                  45
ggt cat gcc acc gca cgt gct ctt cta gca gat cca aga ttg tct tct     192
Gly His Ala Thr Ala Arg Ala Leu Leu Ala Asp Pro Arg Leu Ser Ser
     50                  55                  60
gat cgc gac aga cct gga ttc cca acc cct act gcg aga ttt gct ggg     240
Asp Arg Asp Arg Pro Gly Phe Pro Thr Pro Thr Ala Arg Phe Ala Gly
 65                  70                  75                  80
ata cgc aat aga cgt aca gct ctt ctc ggt gtg gac gat cct gag cac     288
Ile Arg Asn Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro Glu His
                 85                  90                  95
cgt gcc caa agg agg atg gtc gtt ggg gac ttc act ctc aaa cgg gca     336
Arg Ala Gln Arg Arg Met Val Val Gly Asp Phe Thr Leu Lys Arg Ala
            100                 105                 110
gct gca ttg agg ccc cgc att cag agg att gtt gat gaa cga ctc gat    384
Ala Ala Leu Arg Pro Arg Ile Gln Arg Ile Val Asp Glu Arg Leu Asp
        115                 120                 125
gcg atg att gct caa gga cca cct gca gat ttg gtg agc gca ttt gca    432
Ala Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val Ser Ala Phe Ala
    130                 135                 140
ttg cca gtg cct tca atg gtg ata tgc gct ttg cta ggt gtt ccc tat    480
Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Pro Tyr
145                 150                 155                 160
gct gac cat gac ttc ttt gaa gct caa tca agg aga ctt ctg aga gga    528
Ala Asp His Asp Phe Phe Glu Ala Gln Ser Arg Arg Leu Leu Arg Gly
                165                 170                 175
cca ggg act gct gat gtg cag gat gct agg agc agg ctt gag gag tac    576
Pro Gly Thr Ala Asp Val Gln Asp Ala Arg Ser Arg Leu Glu Glu Tyr
            180                 185                 190
ttc ggt gag ctt att gac cgc aag aga gaa gat cct ggt act gga tta    624
Phe Gly Glu Leu Ile Asp Arg Lys Arg Glu Asp Pro Gly Thr Gly Leu
        195                 200                 205
ctt gat gac ctt gtt caa cgg cag cca gga gat ggt gga ccc gat aga    672
Leu Asp Asp Leu Val Gln Arg Gln Pro Gly Asp Gly Gly Pro Asp Arg
    210                 215                 220
gaa gga ctg ata gcc atg gcc ctc atc ctg ctt gta gca ggc cat gag    720
Glu Gly Leu Ile Ala Met Ala Leu Ile Leu Leu Val Ala Gly His Glu
225                 230                 235                 240
acg acc gcc aac atg ata tca cta ggc acc ttt aca ctc ttg caa cac    768
Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln His
                245                 250                 255
cct gag agg cta gct gaa ctt cga gct gac tcc gag gtc atg ccg gcc    816
Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Ser Glu Val Met Pro Ala
            260                 265                 270
gca gtt gag gaa ctt atg agg ttg ctg tcc att gca gat ggt ctg ttg    864
Ala Val Glu Glu Leu Met Arg Leu Leu Ser Ile Ala Asp Gly Leu Leu
        275                 280                 285
cgc att gct gtt gag gat gtt gaa gtg gcc ggg aca aca atc cga gct    912
Arg Ile Ala Val Glu Asp Val Glu Val Ala Gly Thr Thr Ile Arg Ala
    290                 295                 300
gga gaa ggc gta gtg ttc gcg aca tcg gtc atc aat aga gat gag aca    960
Gly Glu Gly Val Val Phe Ala Thr Ser Val Ile Asn Arg Asp Glu Thr
305                 310                 315                 320
gtc ttt gct gag ccg gac act ctc gac tgg tct aga cca gcc aga cat   1008
Val Phe Ala Glu Pro Asp Thr Leu Asp Trp Ser Arg Pro Ala Arg His
                325                 330                 335
cac gta gcg ttc ggc ttt ggg att cac cag tgc tta ggt caa aac tta   1056
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
            340                 345                 350
gca aga gcc gaa ctt gag atc gcc tta ggc acc ctc ttc ggt agg ttg   1104
Ala Arg Ala Glu Leu Glu Ile Ala Leu Gly Thr Leu Phe Gly Arg Leu
        355                 360                 365
ccc aca ctt aga ttg gcc gct cct cca gat gag att ccc ttc aag cca   1152
Pro Thr Leu Arg Leu Ala Ala Pro Pro Asp Glu Ile Pro Phe Lys Pro
    370                 375                 380
ggc gac acg atc caa ggg atg ttg gaa ctc ccc gtg acc tgg taa       1197
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp Stop
385                 390                 395
<210>369
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>369
catatgtctg atactacagc acctgttgct tttccacaat ctcgtacctg cccctatcat    60
cctcctgctg                                                           70
<210>370
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>370
cccctatcat cctcctgctg cctatgaacc gttacgtgct gagagaccct tgactagaat    60
cacactcttt                                                           70
<210>371
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>371
tgactagaat cacactcttt gatggtagag aagcctggtt ggtcagtgga catgccacag    60
ctagggcatt                                                           70
<210>372
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>372
cgtaggatgg ttgcagggga ctttacactc aaaagagctg caggattgag gccacgcatt    60
caacggattg                                                           70
<210>373
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>373
gccacgcatt caacggattg tggacaggcg actcgatgcg atgatagctc agggtccacc    60
tgcagacctt                                                           70
<210>374
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>374
agggtccacc tgcagacctt gtgagcagct tcgcgttacc agttccgtcc atggtgatct    60
gtgccttgct                                                           70
<210>375
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>375
aaacggaagg aaccaggagc tggactgctt gatgacttgg ttcaacgaca gcttagagat    60
ggagcattag                                                           70
<210>376
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>376
gcttagagat ggagcattag acagggaagg tctgattgcc cttgcactca tcttgcttgt    60
tgctggtcac                                                           70
<210>377
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>377
tcttgcttgt tgctggtcac gagacgacag ccaacatgat ctctcttggc accttcaccc    60
tattgcaaca                                                           70
<210>378
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>378
accacaattc gcaaggggga tggagtggtg tttctgacta gtgtcatcaa ccgcgatgag    60
acagtctacc                                                           70
<210>379
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>379
ccgcgatgag acagtctacc ctgaaccaga caccctcgat tggcaccgtt ctgctagaca    60
tcacgtagcg                                                           70
<210>380
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>380
ctgctagaca tcacgtagcg ttcggcttcg gcattcacca gtgcctcggc cagaatcttg    60
cacgcgctga                                                           70
<210>381
<211>56
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>381
aagcttttac caagtcacag gaagttccaa catcccttga atcgtgtcac ctggct        56
<210>382
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>382
ttgaatcgtg tcacctggct tgaaggcaat ctcctcggct ggagctgcta agcgtagagt    60
gggcaaacga                                                           70
<210>383
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>383
agcgtagagt gggcaaacga tcgaagaggg tccaaagtgc aatctcaagc tcagcgcgtg    60
caagattctg                                                           70
<210>384
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>384
tcccccttgc gaattgtggt cccagcaact tctatgtcct caacggcgag tctaagcaaa    60
ccatccgcta                                                           70
<210>385
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>385
tctaagcaaa ccatccgcta tggacagcat gcgcatcagt tcctcgactg cagcaggcaa    60
tagacgagga                                                           70
<210>386
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>386
cagcaggcaa tagacgagga tctgctctca actcagcaag cctttcggga tgttgcaata    60
gggtgaaggt                                                           70
<210>387
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>387
gctcctggtt ccttccgttt cctgtcaatc agttctccaa agtactcatc caaccgtgct    60
ctagcatcca                                                           70
<210>388
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>388
caaccgtgct ctagcatcca tcacatcggc agtctgagga cctctaagta gtctccttga    60
ctgggtctca                                                           70
<210>389
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>389
gtctccttga ctgggtctca aagaaatcgt gatcggcgta tggaactccg agcaaggcac    60
agatcaccat                                                           70
<210>390
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>390
tcccctgcaa ccatcctacg ttgtactcga tgttcaggat cgtcaacacc cagtagtgca    60
gttctcctat                                                           70
<210>391
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>391
cagtagtgca gttctcctat tccttatccc agcaaacctt gcagtgggag ctgggaagcc    60
aggtctgtca                                                           70
<210>392
<211>70
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>392
ctgggaagcc aggtctgtca cgatcagatg aaagccttgg atcagcgagt aatgccctag    60
ctgtggcatg                                                           70
<210>393
<211>1197
<212>DNA
<213>人工序列
<220>
<221>CDS
<222>(1)..(1197)
<223>设计的编码SEQ ID No.224的氨基酸序列的多核苷酸
<400>393
atg tct gat act aca gca cct gtt gct ttt cca caa tct cgt acc tgc      48
Met Ser Asp Thr Thr Ala Pro Val Ala Phe Pro Gln Ser Arg Thr Cys
  1               5                  10                  15
ccc tat cat cct cct gct gcc tat gaa ccg tta cgt gct gag aga ccc      96
Pro Tyr His Pro Pro Ala Ala Tyr Glu Pro Leu Arg Ala Glu Arg Pro
             20                  25                  30
ttg act aga atc aca ctc ttt gat ggt aga gaa gcc tgg ttg gtc agt    144
Leu Thr Arg Ile Thr Leu Phe Asp Gly Arg Glu Ala Trp Leu Val Ser
         35                  40                  45
gga cat gcc aca gct agg gca tta ctc gct gat cca agg ctt tca tct    192
Gly His Ala Thr Ala Arg Ala Leu Leu Ala Asp Pro Arg Leu Ser Ser
     50                  55                  60
gat cgt gac aga cct ggc ttc cca gct ccc act gca agg ttt gct ggg    240
Asp Arg Asp Arg Pro Gly Phe Pro Ala Pro Thr Ala Arg Phe Ala Gly
 65                  70                  75                  80
ata agg aat agg aga act gca cta ctg ggt gtt gac gat cct gaa cat    288
Ile Arg Asn Arg Arg Thr Ala Leu Leu Gly Val Asp Asp Pro Glu His
                 85                  90                  95
cga gta caa cgt agg atg gtt gca ggg gac ttt aca ctc aaa aga gct    336
Arg Val Gln Arg Arg Met Val Ala Gly Asp Phe Thr Leu Lys Arg Ala
            100                 105                 110
gca gga ttg agg cca cgc att caa cgg att gtg gac agg cga ctc gat    384
Ala Gly Leu Arg Pro Arg Ile Gln Arg Ile Val Asp Arg Arg Leu Asp
        115                 120                 125
gcg atg ata gct cag ggt cca cct gca gac ctt gtg agc agc ttc gcg    432
Ala Met Ile Ala Gln Gly Pro Pro Ala Asp Leu Val Ser Ser Phe Ala
    130                 135                 140
tta cca gtt ccg tcc atg gtg atc tgt gcc ttg ctc gga gtt cca tac    480
Leu Pro Val Pro Ser Met Val Ile Cys Ala Leu Leu Gly Val Pro Tyr
145                 150                 155                 160
gcc gat cac gat ttc ttt gag acc cag tca agg aga cta ctt aga ggt    528
Ala Asp His Asp Phe Phe Glu Thr Gln Ser Arg Arg Leu Leu Arg Gly
                165                 170                 175
cct cag act gcc gat gtg atg gat gct aga gca cgg ttg gat gag tac    576
Pro Gln Thr Ala Asp Val Met Asp Ala Arg Ala Arg Leu Asp Glu Tyr
            180                 185                 190
ttt gga gaa ctg att gac agg aaa cgg aag gaa cca gga gct gga ctg    624
Phe Gly Glu Leu Ile Asp Arg Lys Arg Lys Glu Pro Gly Ala Gly Leu
        195                 200                 205
ctt gat gac ttg gtt caa cga cag ctt aga gat gga gca tta gac agg    672
Leu Asp Asp Leu Val Gln Arg Gln Leu Arg Asp Gly Ala Leu Asp Arg
    210                 215                 220
gaa ggt ctg att gcc ctt gca ctc atc ttg ctt gtt gct ggt cac gag    720
Glu Gly Leu Ile Ala Leu Ala Leu Ile Leu Leu Val Ala Gly His Glu
225                 230                 235                 240
acg aca gcc aac atg atc tct ctt ggc acc ttc acc cta ttg caa cat    768
Thr Thr Ala Asn Met Ile Ser Leu Gly Thr Phe Thr Leu Leu Gln His
                245                 250                 255
ccc gaa agg ctt gct gag ttg aga gca gat cct cgt cta ttg cct gct    816
Pro Glu Arg Leu Ala Glu Leu Arg Ala Asp Pro Arg Leu Leu Pro Ala
            260                 265                 270
gca gtc gag gaa ctg atg cgc atg ctg tcc ata gcg gat ggt ttg ctt    864
Ala Val Glu Glu Leu Met Arg Met Leu Ser Ile Ala Asp Gly Leu Leu
        275                 280                 285
aga ctc gcc gtt gag gac ata gaa gtt gct ggg acc aca att cgc aag    912
Arg Leu Ala Val Glu Asp Ile Glu Val Ala Gly Thr Thr Ile Arg Lys
    290                 295                 300
ggg gat gga gtg gtg ttt ctg act agt gtc atc aac cgc gat gag aca    960
Gly Asp Gly Val Val Phe Leu Thr Ser Val Ile Asn Arg Asp Glu Thr
305                 310                 315                 320
gtc tac cct gaa cca gac acc ctc gat tgg cac cgt tct gct aga cat    1008
Val Tyr Pro Glu Pro Asp Thr Leu Asp Trp His Arg Ser Ala Arg His
                325                 330                 335
cac gta gcg ttc ggc ttc ggc att cac cag tgc ctc ggc cag aat ctt    1056
His Val Ala Phe Gly Phe Gly Ile His Gln Cys Leu Gly Gln Asn Leu
            340                 345                 350
gca cgc gct gag ctt gag att gca ctt tgg acc ctc ttc gat cgt ttg    1104
Ala Arg Ala Glu Leu Glu Ile Ala Leu Trp Thr Leu Phe Asp Arg Leu
        355                 360                 365
ccc act cta cgc tta gca gct cca gcc gag gag att gcc ttc aag cca    1152
Pro Thr Leu Arg Leu Ala Ala Pro Ala Glu Glu Ile Ala Phe Lys Pro
    370                 375                 380
ggt gac acg att caa ggg atg ttg gaa ctt cct gtg act tgg taa        1197
Gly Asp Thr Ile Gln Gly Met Leu Glu Leu Pro Val Thr Trp Stop
385                 390                 395
<210>394
<211>29
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>394
ggggatgcat gacagatatg acagatact                                      29
<210>395
<211>30
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>395
ggggagctcc taccaggcca cgggaagatc                                     30
<210>396
<211>18
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>396
acagatatga cagatact                                                  18
<210>397
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>397
ggatgcatga cagatactac tgcacct                                        27
<210>398
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>398
gagctcttac caggtcacgg ggagttc                                        27
<210>399
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>399
ggggtcatga cagatactac tgcacct                                      27
<210>400
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>400
ggatgcatgt ctgatactac agcacct                                      27
<210>401
<211>27
<212>DNA
<213>人工序列
<220>
<223>为PCR设计的寡核苷酸引物
<400>401
gagctcttac caagtcacag gaagttc                                      27
<210>402
<211>36
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>402
tgcaggtgtg gccaccaatt ggcaagaaga aatgca                            36
<210>403
<211>36
<212>DNA
<213>人工序列
<220>
<223>为表达载体构建设计的寡核苷酸接头
<400>403
tttcttcttg ccaattggtg gccacacctg catgca                            36

Claims (50)

1.编码除草剂代谢蛋白质的DNA,其中所述蛋白质选自下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,
并包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%的序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%的序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含与在SEQ ID NO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ ID NO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ ID NO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ ID NO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列。
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%的序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌(Streptomyces phaeochromogenes),砖红色链霉菌(Streptomyces testaceus),不产色链霉菌(Streptomyces achromogenes),灰褐链霉菌(Streptomycesgriseofuscus),热淡天蓝链霉菌(Streptomyces thermocoerulescens),黑胡桃链霉菌(Streptomyces nogalater),津岛链霉菌(Streptomyces tsusimaensis),球团产色链霉菌(Streptomyces glomerochromogenes),橄榄产色链霉菌(Streptomyces olivochromogenes),装饰链霉菌(Streptomyces ornatus),灰色链霉菌(Streptomyces griseus),羊毛链霉菌(Streptomyces lanatus),三泽链霉菌(Streptomyces misawanensis),苍白色链霉菌(Streptomyces pallidus),玫瑰变红链霉菌(Streptomyces roseorubens),鲁地链霉菌(Streptomycesrutgersensis),斯堡链霉菌(Streptomyces steffisburgensis)或塔氏糖多孢菌(Saccharopolyspora taberi)的染色体DNA。
2.包含核苷酸序列的DNA,所述核苷酸序列选自下述物质组成的组:
(a1)在SEQ ID NO:6中表示的核苷酸序列;
(a2)在SEQ ID NO:7中表示的核苷酸序列;
(a3)在SEQ ID NO:8中表示的核苷酸序列;
(a4)在SEQ ID NO:109中表示的核苷酸序列;
(a5)在SEQ ID NO:139中表示的核苷酸序列;
(a6)在SEQ ID NO:140中表示的核苷酸序列;
(a7)在SEQ ID NO:141中表示的核苷酸序列;
(a8)在SEQ ID NO:142中表示的核苷酸序列;
(a9)在SEQ ID NO:143中表示的核苷酸序列;
(a10)在SEQ ID NO:225中表示的核苷酸序列;
(a11)在SEQ ID NO:226中表示的核苷酸序列;
(a12)在SEQ ID NO:227中表示的核苷酸序列;
(a13)在SEQ ID NO:228中表示的核苷酸序列;
(a14)在SEQ ID NO:229中表示的核苷酸序列;
(a15)在SEQ ID NO:230中表示的核苷酸序列;
(a16)在SEQ ID NO:231中表示的核苷酸序列;
(a17)在SEQ ID NO:232中表示的核苷酸序列;
(a18)在SEQ ID NO:233中表示的核苷酸序列;
(a19)在SEQ ID NO:234中表示的核苷酸序列;
(a20)一种核苷酸序列,其编码蛋白质的氨基酸序列,所述蛋白质具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,所述核苷酸序列与在SEQ ID NO:6,SEQ ID NO:7,SEQ IDNO:8或SEQ ID NO:109中任何一个表示的核苷酸序列具有至少80%序列同一性;和
(a21)一种核苷酸序列,其编码蛋白质的氨基酸序列,所述蛋白质具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,所述核苷酸序列与在SEQ ID NO:139,SEQ ID NO:140,SEQ ID NO:141,SEQ ID NO:142,SEQ ID NO:143,SEQ ID NO:225,SEQID NO:226,SEQ ID NO:227,SEQ ID NO:228,SEQ ID NO:229,SEQ IDNO:230,SEQ ID NO:231,SEQ ID NO:232,SEQ ID NO:233或SEQ IDNO:234中任何一个表示的核苷酸序列具有至少90%序列同一性。
3.按照权利要求1的DNA,其包含编码所述蛋白质的氨基酸序列的核苷酸序列,其中在所述核苷酸序列中的密码子使用是在来自引入所述DNA的宿主细胞物种的基因中密码子使用±4%的范围内并且所述核苷酸序列的GC含量是至少40%和至多60%。
4.包含在SEQ ID NO:214中表示的核苷酸序列的DNA。
5.包含在SEQ ID NO:368中表示的核苷酸序列的DNA。
6.包含在SEQ ID NO:393中表示的核苷酸序列的DNA。
7.一种DNA,其中具有编码胞内细胞器转运信号序列的核苷酸序列的DNA在框内连接在按照权利要求1的DNA的上游。
8.一种DNA,其中按照权利要求1的DNA和在宿主细胞中起作用的启动子可操作地连接。
9.包含按照权利要求1的DNA的载体。
10.一种生产载体的方法,其包含将按照权利要求1的DNA插入可在宿主细胞中复制的载体的步骤。
11.一种转化体,其中将按照权利要求1的DNA引入宿主细胞。
12.按照权利要求11的转化体,其中所述宿主细胞是微生物细胞或植物细胞。
13.一种生产转化体的方法,其包含将按照权利要求1的DNA引入宿主细胞的步骤。
14.一种生产具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的方法,所述方法包含培养按照权利要求11的转化体和回收产生的所述蛋白质的步骤。
15.按照权利要求1的DNA在生产具有将式(II)化合物转化为式(III)化合物的能力的蛋白质中的应用。
16.一种给予植物除草剂抗性的方法,所述方法包含将按照权利要求1的DNA引入植物细胞和在其中表达的步骤。
17.一种多核苷酸,其具有按照权利要求1的DNA的部分核苷酸序列或与所述部分核苷酸序列互补的核苷酸序列。
18.一种检测编码具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的DNA的方法,所述方法包含检测在杂交中与探针杂交的DNA的步骤,所述杂交使用按照权利要求1的DNA或按照权利要求17的多核苷酸作为探针。
19.一种检测编码具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的DNA的方法,所述方法包含检测在以按照权利要求17的多核苷酸作为引物的聚合酶链式反应中扩增的DNA的步骤。
20.按照权利要求19的方法,其中引物中至少一种选自包含在SEQ IDNO:124至128中任何一个表示的核苷酸序列的多核苷酸和包含在SEQ IDNO:129中显示的核苷酸序列的多核苷酸组成的组。
21.一种获得编码具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的DNA的方法,所述方法包含回收通过按照权利要求18或19的方法检测的DNA的步骤。
22.一种筛选具有编码一种蛋白质的DNA的细胞的方法,所述蛋白质具有将式(II)化合物转化为式(III)化合物的能力,所述方法包含通过按照权利要求18或19的方法从试验细胞中检测所述DNA的步骤。
23.一种除草剂代谢蛋白质,其选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA。
24.一种识别除草剂代谢蛋白质的抗体,所述除草剂代谢蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA。
25.一种检测除草剂代谢蛋白质的方法,所述方法包含:
(1)将试样物质与识别所述蛋白质的抗体接触的步骤和
(2)检测由所述接触产生的、所述蛋白质和所述抗体的复合体的步骤,其中所述蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA。
26.一种分析或检测试剂盒,其包含按照权利要求24的抗体。
27.一种编码铁氧还蛋白的DNA,所述铁氧还蛋白选自由下述物质组成的组:
(B1)包含在SEQ ID NO:12中表示的氨基酸序列的蛋白质;
(B2)包含在SEQ ID NO:13中表示的氨基酸序列的蛋白质;
(B3)包含在SEQ ID NO:14中表示的氨基酸序列的蛋白质;
(B4)包含在SEQ ID NO:111中表示的氨基酸序列的蛋白质;
(B5)包含与在SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQID NO:111中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸的铁氧还蛋白;
(B6)包含由核苷酸序列编码的氨基酸序列的铁氧还蛋白,所述核苷酸序列与编码在SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQ IDNO:111中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
(B7)包含在SEQ ID NO:149中表示的氨基酸序列的蛋白质;
(B8)包含在SEQ ID NO:150中表示的氨基酸序列的蛋白质;
(B9)包含在SEQ ID NO:151中表示的氨基酸序列的蛋白质;
(B 10)包含在SEQ ID NO:152中表示的氨基酸序列的蛋白质;
(B11)包含在SEQ ID NO:153中表示的氨基酸序列的蛋白质;
(B12)一种铁氧还蛋白,其包含与在SEQ ID NO:149,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251或SEQ ID NO:253中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:150,SEQ ID NO:252或SEQ IDNO:254中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(B13)一种铁氧还蛋白,其包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:149,SEQ ID NO:150,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251,SEQ ID NO:252,SEQ ID NO:253或SEQ ID NO:254中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
(B14)包含在SEQ ID NO:245中表示的氨基酸序列的蛋白质;
(B15)包含在SEQ ID NO:247中表示的氨基酸序列的蛋白质;
(B16)包含在SEQ ID NO:248中表示的氨基酸序列的蛋白质;
(B17)包含在SEQ ID NO:249中表示的氨基酸序列的蛋白质;
(B18)包含在SEQ ID NO:250中表示的氨基酸序列的蛋白质;
(B19)包含在SEQ ID NO:251中表示的氨基酸序列的蛋白质;
(B20)包含在SEQ ID NO:252中表示的氨基酸序列的蛋白质;
(B21)包含在SEQ ID NO:253中表示的氨基酸序列的蛋白质;和
(B22)包含在SEQ ID NO:254中表示的氨基酸序列的蛋白质。
28.包含核苷酸序列的DNA,所述核苷酸序列选自由下述物质组成的组:
(b1)在SEQ ID NO:15中表示的核苷酸序列;
(b2)在SEQ ID NO:16中表示的核苷酸序列;
(b3)在SEQ ID NO:17中表示的核苷酸序列;
(b4)在SEQ ID NO:112中表示的核苷酸序列;
(b5)在SEQ ID NO:154中表示的核苷酸序列;
(b6)在SEQ ID NO:155中表示的核苷酸序列;
(b7)在SEQ ID NO:156中表示的核苷酸序列;
(b8)在SEQ ID NO:157中表示的核苷酸序列;
(b9)在SEQ ID NO:158中表示的核苷酸序列;
(b10)在SEQ ID NO:255中表示的核苷酸序列;
(b11)在SEQ ID NO:257中表示的核苷酸序列;
(b12)在SEQ ID NO:258中表示的核苷酸序列;
(b13)在SEQ ID NO:259中表示的核苷酸序列;
(b14)在SEQ ID NO:260中表示的核苷酸序列;
(b15)在SEQ ID NO:261中表示的核苷酸序列;
(b16)在SEQ ID NO:262中表示的核苷酸序列;
(b17)在SEQ ID NO:263中表示的核苷酸序列;
(b18)在SEQ ID NO:264中表示的核苷酸序列;和
(b19)一种核苷酸序列,其与在SEQ ID NO:15,SEQ ID NO:16,SEQID NO:17,SEQ ID NO:112,SEQ ID NO:154,SEQ ID NO:155,SEQ IDNO:156,SEQ ID NO:157,SEQ ID NO:158,SEQ ID NO:255,SEQ IDNO:257,SEQ ID NO:258,SEQ ID NO:259,SEQ ID NO:260,SEQ IDNO:261,SEQ ID NO:262,SEQ ID NO:263或SEQ ID NO:264中任何一个表示的核苷酸序列具有至少90%序列同一性。
29.一种包含按照权利要求28的DNA的载体。
30.一种转化体,其中将按照权利要求28的DNA引入宿主细胞;
31.一种铁氧还蛋白,其选自由下述物质组成的组:
(B1)包含在SEQ ID NO:12中表示的氨基酸序列的蛋白质;
(B2)包含在SEQ ID NO:13中表示的氨基酸序列的蛋白质;
(B3)包含在SEQ ID NO:14中表示的氨基酸序列的蛋白质;
(B4)包含在SEQ ID NO:111中表示的氨基酸序列的蛋白质;
(B5)包含与在SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQID NO:111中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸的铁氧还蛋白;
(B6)包含由核苷酸序列编码的氨基酸序列的铁氧还蛋白,所述核苷酸序列与编码在SEQ ID NO:12,SEQ ID NO:13,SEQ ID NO:14或SEQ IDNO:111中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
(B7)包含在SEQ ID NO:149中表示的氨基酸序列的蛋白质;
(B8)包含在SEQ ID NO:150中表示的氨基酸序列的蛋白质;
(B9)包含在SEQ ID NO:151中表示的氨基酸序列的蛋白质;
(B10)包含在SEQ ID NO:152中表示的氨基酸序列的蛋白质;
(B11)包含在SEQ ID NO:153中表示的氨基酸序列的蛋白质;
(B12)一种铁氧还蛋白,其包含与在SEQ ID NO:149,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251或SEQ ID NO:253中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:150,SEQ ID NO:252或SEQ IDNO:254中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(B13)一种铁氧还蛋白,其包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:149,SEQ ID NO:150,SEQ IDNO:151,SEQ ID NO:152,SEQ ID NO:153,SEQ ID NO:245,SEQ IDNO:247,SEQ ID NO:248,SEQ ID NO:249,SEQ ID NO:250,SEQ IDNO:251,SEQ ID NO:252,SEQ ID NO:253或SEQ ID NO:254中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
(B14)包含在SEQ ID NO:245中表示的氨基酸序列的蛋白质;
(B15)包含在SEQ ID NO:247中表示的氨基酸序列的蛋白质;
(B16)包含在SEQ ID NO:248中表示的氨基酸序列的蛋白质;
(B17)包含在SEQ ID NO:249中表示的氨基酸序列的蛋白质;
(B18)包含在SEQ ID NO:250中表示的氨基酸序列的蛋白质;
(B19)包含在SEQ ID NO:251中表示的氨基酸序列的蛋白质;
(B20)包含在SEQ ID NO:252中表示的氨基酸序列的蛋白质;
(B21)包含在SEQ ID NO:253中表示的氨基酸序列的蛋白质;和
(B22)包含在SEQ ID NO:254中表示的氨基酸序列的蛋白质。
32.一种包含核苷酸序列的DNA,所述核苷酸选自由下述物质组成的组:
(ab1)在SEQ ID NO:9中表示的核苷酸序列;
(ab2)在SEQ ID NO:10中表示的核苷酸序列;
(ab3)在SEQ ID NO:11中表示的核苷酸序列;
(ab4)在SEQ ID NO:110中表示的核苷酸序列;
(ab5)在SEQ ID NO:144中表示的核苷酸序列;
(ab6)在SEQ ID NO:145中表示的核苷酸序列;
(ab7)在SEQ ID NO:146中表示的核苷酸序列;
(ab8)在SEQ ID NO:147中表示的核苷酸序列;
(ab9)在SEQ ID NO:148中表示的核苷酸序列;
(ab10)在SEQ ID NO:235中表示的核苷酸序列;
(ab11)在SEQ ID NO:236中表示的核苷酸序列;
(ab12)在SEQ ID NO:237中表示的核苷酸序列;
(ab13)在SEQ ID NO:238中表示的核苷酸序列;
(ab14)在SEQ ID NO:239中表示的核苷酸序列;
(ab15)在SEQ ID NO:240中表示的核苷酸序列;
(ab16)在SEQ ID NO:241中表示的核苷酸序列;
(ab17)在SEQ ID NO:242中表示的核苷酸序列;
(ab18)在SEQ ID NO:243中表示的核苷酸序列;和
(ab19)在SEQ ID NO:244中表示的核苷酸序列。
33.包含按照权利要求32的DNA的载体。
34.一种转化体,其中将按照权利要求32的DNA引入宿主细胞。
35.按照权利要求34的转化体,其中所述宿主细胞是微生物细胞或植物细胞。
36.一种生产转化体的方法,其包含将按照权利要求32的DNA引入宿主细胞的步骤。
37.一种生产具有将式(II)化合物转化为式(III)化合物的能力的蛋白质的方法,所述方法包含培养按照权利要求34的转化体和回收产生的所述蛋白质的步骤。
38.一种控制杂草的方法,其包含将化合物施用于表达至少一种除草剂代谢蛋白质的植物的栽培区域的步骤,所述除草剂代谢蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;
其中所述化合物是式(I)的化合物:
其中在式(I)中,G表示在下列G-1至G-9中任何一个表示的基团:
Figure A028256420019C2
Figure A028256420020C1
其中在G-1至G-9中,
X表示氧原子或硫原子;
Y表示氧原子或硫原子;
R1表示氢原子或卤原子;
R2表示氢原子,C1-C8烷基,C1-C8卤代烷基,卤原子,羟基,-OR9基团,-SH基团,-S(O)pR9基团,-COR9基团,-CO2R9基团,-C(O)SR9基团,-C(O)NR11R12基团,-CONH2基团,-CHO基团,-CR9=NOR18基团,-CH=CR19CO2R9基团,-CH2CHR19CO2R9基团,-CO2N=CR13R14基团,硝基,氰基,-NHSO2R15基团,-NHSO2NHR15基团,-NR9R20基团,-NH2基团或苯基,其可以被一个或多个可以相同或不同的C1-C4烷基取代;
p表示0,1或2;
R3表示C1-C2烷基,C1-C2卤代烷基,-OCH3基团,-SCH3基团,-OCHF2基团,卤原子,氰基,硝基或C1-C3烷氧基,其用在苯环上可以被至少一个取代基取代的苯基取代,所述取代基选自卤原子,C1-C3烷基,C1-C3卤代烷基,OR28基团,NR11R28基团,SR28基团,氰基,CO2R28基团和硝基;
R4表示氢原子,C1-C3烷基或C1-C3卤代烷基;
R5表示氢原子,C1-C3烷基,C1-C3卤代烷基,环丙基,乙烯基,C2炔基,氰基,-C(O)R20基团,-CO2R20基团,-C(O)NR20R21基团,-CHR16R17CN基团,-CR16R17C(O)R20基团,-CR16R17CO2R20基团,-CR16R17C(O)NR20R21基团,-CHR16OH基团,-CHR16OC(O)R20基团或-OCHR16OC(O)NR20R21基团,或当G表示G-2或G-6时,R4和R5可以表示与它们结合的碳原子一起的C=O基团;
R6表示C1-C6烷基,C1-C6卤代烷基,C2-C6烷氧基烷基,C3-C6烯基或C3-C6炔基;
R7表示氢原子,C1-C6烷基,C1-C6卤代烷基,卤原子,-S(O)2(C1-C6烷基)或-C(=O)R22基团;
R8表示氢原子,C1-C8烷基,C3-C8环烷基,C3-C8烯基,C3-C8炔基,C1-C8卤代烷基,C2-C8烷氧基烷基,C3-C8烷氧基烷氧基烷基,C3-C8卤代炔基,C3-C5卤代烯基,C1-C8烷基磺酰基,C1-C8卤代烷基磺酰基,C3-C8烷氧基羰基烷基,-S(O)2NH(C1-C8烷基)基团,-C(O)R23基团或可在苯环上被R24取代的苄基;
R9表示C1-C8烷基,C3-C8环烷基,C3-C8烯基,C3-C8炔基,C1-C8卤代烷基,C2-C8烷氧基烷基,C2-C8烷基硫代烷基,C2-C8烷基亚磺酰基烷基,C2-C8烷基磺酰基烷基,C4-C8烷氧基烷氧基烷基,C4-C8环烷基烷基,C4-C8环烷氧基烷基,C4-C8烯基氧基烷基,C4-C8炔基氧基烷基,C3-C8卤代烷氧基烷基,C4-C8卤代烯基氧基烷基,C4-C8卤代炔基氧基烷基,C4-C8环烷基硫代烷基,C4-C8烯基硫代烷基,C4-C8炔基硫代烷基,苯氧基取代的C1-C4烷基,所述苯氧基可在环上被至少一种取代基取代,所述取代基选自卤原子,C1-C3烷基和C1-C3卤代烷基,苄氧基取代的C1-C4烷基,所述苄氧基可在环上被至少一种取代基取代,所述取代基选自卤原子,C1-C3烷基和C1-C3卤代烷基,C4-C8 trialkylsyrylalkyl基团,C2-C8氰烷基,C3-C8卤代环烷基,C3-C8卤代烯基,C5-C8烷氧基烯基,C5-C8卤代烷氧基烯基,C5-C8烷基硫代烯基,C3-C8卤代炔基,C5-C8烷氧基炔基,C5-C8卤代烷氧基炔基,C5-C8烷基硫代炔基,C2-C8烷基羰基,在环上可以用至少一种选自卤原子,C1-C3烷基,C1-C3卤代烷基,-OR28基团,-NR11R28基团,-SR28基团,氰基,-CO2R28基团和硝基的取代基取代的苄基,-CR16R17COR10基团,-CR16R17CO2R20基团,-CR16R17P(O)(OR10)2基团,-CR16R17P(S)(OR10)2基团,-CR16R17C(O)NR11R12基团,-CR16R17C(O)NH2基团,-C(=CR26R27)COR10基团,-C(=CR26R27)CO2R20基团,-C(=CR26R27)P(O)(OR10)2基团,-C(=CR26R27)P(S)(OR10)2基团,-C(=CR26R27)C(O)NR11R12基团,-C(=CR26R27)C(O)NH2基团,或在Q-1至Q-7表示的环中的任何一个:
其在环上可以被至少一种取代基取代,所述取代基选自卤原子,C1-C6烷基,C1-C6卤代烷基,C2-C6烯基,C2-C6卤代烯基,C2-C6炔基,C3-C6卤代炔基,C2-C8烷氧基烷基,-OR28基团,-SR28基团,-NR11R28基团,C3-C8烷氧羰基烷基,C2-C4羧基烷基,-CO2R28基团和氰基;
R10表示C1-C6烷基,C2-C6烯基,C3-C6炔基或四氢呋喃基团;
R11和R13独立地表示氢原子或C1-C4烷基;
R12表示C1-C6烷基,C3-C6环烷基,C3-C6烯基,C3-C6炔基,C2-C6烷氧基烷基,C1-C6卤代烷基,C3-C6卤代烯基,C3-C6卤代炔基,在环上可以被至少一种取代基取代的苯基,所述取代基选自卤原子,C1-C4烷基和C1-C4烷氧基,或-CR16R17CO2R25基团;或,
R11和R12一起可以表示-(CH2)5-,-(CH2)4-,或-CH2CH2OCH2CH2-,或者如果是那样的话,产生的环可以用选自C1-C3烷基,苯基和苄基的取代基取代;
R14表示C1-C4烷基或在环上可以用选自卤原子,C1-C3烷基和C1-C3卤代烷基的取代基所取代的苯基;或,
R13和R14可以与它们结合的碳原子一起表示C3-C8环烷基;
R15表示C1-C4烷基,C1-C4卤代烷基或C3-C6烯基;
R16和R17独立地表示氢原子或C1-C4烷基,C1-C4卤代烷基,C2-C4烯基,C2-C4卤代烯基,C2-C4炔基,C3-C4卤代炔基;或,
R16和R17可以与它们结合的碳原子一起表示C3-C6环烷基,或者如此形成的环可以用至少一种选自卤原子,C1-C3烷基和C1-C3卤代烷基的取代基所取代;
R18表示氢原子,C1-C6烷基,C3-C6烯基或C3-C6炔基;
R19表示氢原子,C1-C4烷基或卤原子;
R20表示氢原子,C1-C6烷基,C3-C6环烷基,C3-C6烯基,C3-C6炔基,C2-C6烷氧基烷基,C1-C6卤代烷基,C3-C6卤代烯基,C3-C6卤代炔基,在环上可以用至少一种取代基取代的苯基,所述取代基选自卤原子,C1-C4烷基和-OR28基团,或-CR16R17CO2R25基团;
R21表示氢原子,C1-C2烷基或-CO2(C1-C4烷基)基团;
R22表示氢原子,C1-C6烷基,C1-C6烷氧基或NH(C1-C6烷基)基团;
R23表示C1-C6烷基,C1-C6卤代烷基,C1-C6烷氧基,NH(C1-C6烷基)基团,苄基,C2-C8二烷基氨基或可以用R24取代的苯基;
R24表示C1-C6烷基,1-2个卤原子,C1-C6烷氧基或CF3基团;
R25表示C1-C6烷基,C1-C6卤代烷基,C3-C6烯基,C3-C6卤代烯基,C3-C6炔基或C3-C6卤代炔基;
R26和R27各自独立地表示氢原子,C1-C4烷基,C1-C4卤代烷基,C2-C4烯基,C2-C4卤代烯基,C2-C4炔基,C3-C4卤代炔基,-OR28基团,-NHR28基团,或-SR28基团;或,
R26和R27可以与它们结合的碳原子一起表示C3-C8环烷基,或每个如此形成的环可以用至少一种选自卤原子,C1-C3烷基和C1-C3卤代烷基的取代基所取代;并且
R28表示氢原子,C1-C6烷基,C1-C6卤代烷基,C3-C6烯基,C3-C6卤代烯基,C3-C6炔基,C3-C6卤代炔基,C2-C4羧基烷基,C3-C8烷氧基羰基烷基,C3-C8卤代烷氧基羰基烷基,C5-C9烯基氧基羰基烷基,C5-C9卤代烯基氧基羰基烷基,C5-C9炔基氧基羰基烷基,C5-C9卤代炔基氧基羰基烷基,C5-C9环烷氧基羰基烷基或C5-C9卤代环烷氧基羰基烷基。
39.一种控制杂草的方法,其包含将化合物施用于表达至少一种蛋白质的植物的栽培区域的步骤,所述蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(A28)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物和包含在SEQ ID NO:129中表示的核苷酸序列的引物,并且模板为暗产色链霉菌,砖红色链霉菌,不产色链霉菌,灰褐链霉菌,热淡天蓝链霉菌,黑胡桃链霉菌,津岛链霉菌,球团产色链霉菌,橄榄产色链霉菌,装饰链霉菌,灰色链霉菌,羊毛链霉菌,三泽链霉菌,苍白色链霉菌,玫瑰变红链霉菌,鲁地链霉菌,斯堡链霉菌或塔氏糖多孢菌的染色体DNA。
40.一种评估细胞对式(I)化合物的抗性的方法,所述方法包含:
(3)将所述化合物与表达至少一种除草剂代谢蛋白质的细胞接触的步骤,所述除草剂代谢蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属的微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(4)评估在上述步骤(1)中对接触所述化合物的细胞的损伤程度的步骤。
41.按照权利要求40的方法,其中所述细胞是微生物细胞或植物细胞;
42.选择抗式(I)化合物的细胞的方法,所述方法包含基于在按照权利要求40的方法中评估的抗性来选择细胞的步骤。
43.通过按照权利要求42的方法选择的抗除草剂的细胞,或其培养物。
44.一种评估植物对式(I)化合物的抗性的方法,所述方法包含:
(3)将所述化合物与表达至少一种除草剂代谢蛋白质的植物接触的步骤,所述除草剂代谢蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属的微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性;和
(4)评估在上述步骤(1)中对接触所述化合物的植物的损伤程度的步骤。
45.一种选择抗式(I)化合物的植物的方法,所述方法包含基于在按照权利要求44的方法中评估的抗性来选择植物的步骤。
46.一种由按照权利要求45的方法选择的抗除草剂植物,或其后代。
47.一种处理式(I)化合物的方法,所述方法包含在含有电子供体的电子传递体系的存在下将所述化合物与至少一种除草剂代谢蛋白质反应,所述除草剂代谢蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属的微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性。
48.按照权利要求47的方法,其中通过将所述化合物与转化体接触将所述化合物与所述除草剂代谢蛋白质反应,在所述转化体中将编码所述除草剂代谢蛋白质的DNA引入能使它在所述细胞中表达的位置的宿主细胞中。
49.除草剂代谢蛋白质在处理式(I)化合物中的应用,所述除草剂代谢蛋白质选自由下述物质组成的组:
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属的微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性。
50.编码除草剂代谢蛋白质的多核苷酸在处理式(I)化合物中的应用,所述除草剂代谢蛋白质选自由下述物质组成的组
(A1)包含在SEQ ID NO:1中表示的氨基酸序列的蛋白质;
(A2)包含在SEQ ID NO:2中表示的氨基酸序列的蛋白质;
(A3)包含在SEQ ID NO:3中表示的氨基酸序列的蛋白质;
(A4)包含在SEQ ID NO:108中表示的氨基酸序列的蛋白质;
(A5)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列;
(A6)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中任何一个表示的氨基酸序列的核苷酸序列具有至少80%序列同一性;
(A7)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由DNA编码的氨基酸序列,所述DNA在严谨条件下与包含编码在SEQ ID NO:1,SEQ IDNO:2,SEQ ID NO:3或SEQ ID NO:108中表示的氨基酸序列的核苷酸序列的DNA杂交;
(A8)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并包含由可通过聚合酶链式反应扩增的DNA所编码的氨基酸序列,所述聚合酶链式反应使用包含在SEQ ID NO:129中表示的核苷酸序列的引物和包含在SEQ ID NO:124至128中任何一个表示的核苷酸序列的引物,并且模板为属于链霉菌属或糖多孢菌属的微生物的染色体;
(A9)包含在SEQ ID NO:4中表示的氨基酸序列的蛋白质;
(A11)包含在SEQ ID NO:159中表示的氨基酸序列的蛋白质;
(A12)包含在SEQ ID NO:160中表示的氨基酸序列的蛋白质;
(A13)包含在SEQ ID NO:136中表示的氨基酸序列的蛋白质;
(A14)包含在SEQ ID NO:137中表示的氨基酸序列的蛋白质;
(A15)包含在SEQ ID NO:138中表示的氨基酸序列的蛋白质;
(A16)包含在SEQ ID NO:215中表示的氨基酸序列的蛋白质;
(A17)包含在SEQ ID NO:216中表示的氨基酸序列的蛋白质;
(A18)包含在SEQ ID NO:217中表示的氨基酸序列的蛋白质;
(A19)包含在SEQ ID NO:218中表示的氨基酸序列的蛋白质;
(A20)包含在SEQ ID NO:219中表示的氨基酸序列的蛋白质;
(A21)包含在SEQ ID NO:220中表示的氨基酸序列的蛋白质;
(A22)包含在SEQ ID NO:221中表示的氨基酸序列的蛋白质;
(A23)包含在SEQ ID NO:222中表示的氨基酸序列的蛋白质;
(A24)包含在SEQ ID NO:223中表示的氨基酸序列的蛋白质;
(A25)包含在SEQ ID NO:224中表示的氨基酸序列的蛋白质;
(A26)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含与在SEQ IDNO:159,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:217,SEQ ID NO:219,SEQ ID NO:220,SEQ ID NO:221或SEQ IDNO:223中任何一个表示的氨基酸序列具有至少80%序列同一性的氨基酸序列或与在SEQ ID NO:160,SEQ ID NO:215,SEQ ID NO:216,SEQ IDNO:218,SEQ ID NO:222或SEQ ID NO:224中任何一个表示的氨基酸序列具有至少90%序列同一性的氨基酸序列;和
(A27)一种蛋白质,其具有在包含电子供体的电子传递体系的存在下将式(II)化合物转化为式(III)化合物的能力,并且包含由核苷酸序列编码的氨基酸序列,所述核苷酸序列与编码在SEQ ID NO:159,SEQ IDNO:160,SEQ ID NO:136,SEQ ID NO:137,SEQ ID NO:138,SEQ IDNO:215,SEQ ID NO:216,SEQ ID NO:217,SEQ ID NO:218,SEQ IDNO:219,SEQ ID NO:220,SEQ ID NO:221,SEQ ID NO:222,SEQ IDNO:223或SEQ ID NO:224中任何一个表示的氨基酸序列的核苷酸序列具有至少90%序列同一性。
CNB028256425A 2001-10-19 2002-10-17 除草剂代谢蛋白质,其基因及其应用 Expired - Fee Related CN100537764C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2001321307 2001-10-19
JP321307/2001 2001-10-19
JP167239/2002 2002-06-07

Publications (2)

Publication Number Publication Date
CN1894408A true CN1894408A (zh) 2007-01-10
CN100537764C CN100537764C (zh) 2009-09-09

Family

ID=35161068

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028256425A Expired - Fee Related CN100537764C (zh) 2001-10-19 2002-10-17 除草剂代谢蛋白质,其基因及其应用

Country Status (1)

Country Link
CN (1) CN100537764C (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015022640A2 (en) * 2013-08-12 2015-02-19 Basf Se Plants having increased tolerance to herbicides (ppo)
US10041087B2 (en) 2012-06-19 2018-08-07 BASF Agro B.V. Plants having increased tolerance to herbicides
US10087460B2 (en) 2013-08-12 2018-10-02 BASF Agro B.V. Transgenic or non-transgenic plants with mutated protoporphyrinogen oxidase having increased tolerance to herbicides
US10100329B2 (en) 2012-06-19 2018-10-16 BASF Agro B.V. Plants having increased tolerance to herbicides
US11274313B2 (en) 2010-12-16 2022-03-15 BASF Agro B.V. Plants having increased tolerance to herbicides

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11274313B2 (en) 2010-12-16 2022-03-15 BASF Agro B.V. Plants having increased tolerance to herbicides
US11572571B2 (en) 2012-06-19 2023-02-07 BASF Agro B.V. Plants having increased tolerance to herbicides
US10041087B2 (en) 2012-06-19 2018-08-07 BASF Agro B.V. Plants having increased tolerance to herbicides
US11441154B2 (en) 2012-06-19 2022-09-13 BASF Agro B.V. Plants having increased tolerance to herbicides
US10100329B2 (en) 2012-06-19 2018-10-16 BASF Agro B.V. Plants having increased tolerance to herbicides
US10087460B2 (en) 2013-08-12 2018-10-02 BASF Agro B.V. Transgenic or non-transgenic plants with mutated protoporphyrinogen oxidase having increased tolerance to herbicides
US10968462B2 (en) 2013-08-12 2021-04-06 BASF Agro B.V. Plants having increased tolerance to herbicides
US10982227B2 (en) 2013-08-12 2021-04-20 BASF Agro B.V. Transgenic or non-transgenic plants with mutated protoporphyrinogen oxidase having increased tolerance to herbicides
US10392630B2 (en) 2013-08-12 2019-08-27 BASF Agro B.V. Plants having increased tolerance to herbicides
WO2015022640A2 (en) * 2013-08-12 2015-02-19 Basf Se Plants having increased tolerance to herbicides (ppo)
WO2015022640A3 (en) * 2013-08-12 2015-05-14 Basf Agro B. V. Plants having increased tolerance to herbicides (ppo)
US11827896B2 (en) 2013-08-12 2023-11-28 BASF Agro B.V. Plants having increased tolerance to herbicides
US11866720B2 (en) 2013-08-12 2024-01-09 BASF Agro B.V. Transgenic or non-transgenic plants with mutated protoporphyrinogen oxidase having increased tolerance to herbicides

Also Published As

Publication number Publication date
CN100537764C (zh) 2009-09-09

Similar Documents

Publication Publication Date Title
CN1040024C (zh) 对除莠剂敏感的植物或植物细胞进行转化的方法
CN1252273C (zh) 编码植物脱氧海普赖氨酸合成酶的dna,植物真核起始因子5a,转基因植物和控制植物衰老和程序性细胞死亡的方法
CN1245516C (zh) 编码乙酰乳酸合酶基因的基因
CN1671850A (zh) 二酰甘油酰基转移酶核酸序列及相关产物
CN1246461C (zh) 修饰植物中次级代谢化合物水平的方法和组合物
CN101052715A (zh)
CN1852975A (zh) 转基因的高色氨酸植物
CN1341151A (zh) 除草剂的靶基因和方法
CN101065490A (zh) 用于植物的启动子分子
CN1372599A (zh) 植物甾醇酰基转移酰
CN1810977A (zh) 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸
CN101080492A (zh) 用于调节植物中油质蛋白表达的方法
CN1822763A (zh) 氮限制条件下生长得以改善的植物的制备方法
CN1887903A (zh) 硅藻的硝酸盐转运蛋白及其编码基因与应用
CN1195856C (zh) 启动子
CN1719971A (zh) 转基因高色氨酸植物
CN1712526A (zh) 一种具有转化黄曲霉毒素活性的解毒酶及编码该酶的基因
CN1262651C (zh) 使植物产生杂草防治化合物耐受性的方法
CN1639337A (zh) 具有催泪成分合成酶活性的蛋白质或多肽、编码该蛋白质或多肽的 DNA、利用该 DNA制造具有催泪成分合成酶活性的蛋白质或多肽的制造方法以及具有抑制该蛋白质或多肽的mRNA翻译的功能的核酸分子
CN1839154A (zh) elF-5A同工型:衰老-诱导elF-5A;损伤-诱导elF-5A;生长elF-5A和DHS
CN1646005A (zh) 具有改进形态发生的植物及其制备方法
CN1894408A (zh) 除草剂代谢蛋白质,其基因及其应用
CN1195855C (zh) 棉子糖合酶基因及其用途
CN1206347C (zh) Cyp79家族的p450单加氧酶
CN1930292A (zh) 硼酸抗性给予蛋白质及其基因

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090909

Termination date: 20191017