JP2004532021A - オルトソマイシン生合成遺伝子座の同定及び識別用の組成物並びに同定及び識別の方法 - Google Patents

オルトソマイシン生合成遺伝子座の同定及び識別用の組成物並びに同定及び識別の方法 Download PDF

Info

Publication number
JP2004532021A
JP2004532021A JP2002577914A JP2002577914A JP2004532021A JP 2004532021 A JP2004532021 A JP 2004532021A JP 2002577914 A JP2002577914 A JP 2002577914A JP 2002577914 A JP2002577914 A JP 2002577914A JP 2004532021 A JP2004532021 A JP 2004532021A
Authority
JP
Japan
Prior art keywords
seq
polypeptide
nucleic acid
homology
orthosomycin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002577914A
Other languages
English (en)
Inventor
エム ファーネット クリス
ザゾプロス エマヌエル
スタッファ アルフレド
Original Assignee
エコピア バイオサイエンシーズ インク
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エコピア バイオサイエンシーズ インク filed Critical エコピア バイオサイエンシーズ インク
Publication of JP2004532021A publication Critical patent/JP2004532021A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/445The saccharide radical is condensed with a heterocyclic radical, e.g. everninomycin, papulacandin

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明は、オルトソマイシン生合成遺伝子クラスターの同定に有用な組成物及び方法を提供するものである。本発明はまた、エベルニノマイシン型オルトソマイシン遺伝子クラスター及びアビラマイシン型オルトソマイシン遺伝子クラスターの識別に有用な組成物及び方法も提供する。オルトソマイシン、エベルニノマイシン型オルトソマイシン及びアビラマイシン型オルトソマイシンを識別する固有の構造的特徴に関与する特定のタンパク質ファミリーに由来するPCRプライマー、ハイブリダイゼーションプローブなど本発明の組成物を用いて、オルトソマイシン遺伝子クラスターを同定してもよい。コンピュータ読み取り可能な媒体に保存された参照配列をコードする配列など本発明の組成物を用いて、オルトソマイシン遺伝子クラスターを同定してもよい。

Description

【技術分野】
【0001】
本発明は、微生物学分野に関する。より詳しくは、オルトソマイシン産生に関与する遺伝子及び生物に関する。
【背景技術】
【0002】
オルトソマイシンは、2つのオルトエステル糖結合を含むオリゴ糖分子である。オルトソマイシンの一般的な構造を以下に図示する。上記オルトソマイシンの糖残基は、標識されたA−Hである。オルトソマイシンの重要な特徴であるオルトエステル結合を以下に示す。
【0003】
【化1】
Figure 2004532021
【0004】
既知のオルトソマイシン化合物は、(1)オリゴ糖鎖の末端部分にアミノ糖残基又はニトロ糖残基を含む、すなわち、上記分子中のRがエベルニトロースであるエベルニノマイシン、(2)末端部分にアミノ糖残基又はニトロ糖残基を含まない、すなわち、上記分子中のRが水素であるアビラマイシン、クラマイシン及びフランバマイシンの2種類に大別することができる。2種類目に分類されるオルトソマイシンのなかで、アビラマイシンとクラマイシンとの相違点は、糖残基G中のC45ヒドロキシル基とのエステル結合に見られるアシル側鎖の性質のみである。アビラマイシンもクラマイシンも、このヒドロキシル上に単純なメチル基を有していない。エベルニノマイシン類では、このヒドロキシルがO−メチル化されているのが一般的である。フランバマイシンとアビラマイシンとの相違点は糖残基DのC23位だけであり、アビラマイシンではメチレンカーボンが、フランバマイシンではヒドロキシル基がこの位置に存在している。エベルニノマイシンでは、この位置にヒドロキシルが存在する場合と存在しない場合がある。
【0005】
既知のオロトソマイシンの多くは、抗生作用を有している。従来の抗生物質に耐性をもつ細菌の出現により、新規抗微生物剤に対する必要性は差し迫ったものとなっている。オリゴ糖類の抗生物質は、メチシリン耐性黄色ブドウ球菌、バンコマイシン耐性腸球菌、及びペニシリン耐性肺炎球菌などのグラム陽性菌に対して広範囲にわたる抗菌性作用を示す。そのため、新規オルトソマイシン天然産物を同定する方法の開発が求められている。オルトソマイシン産生微生物は、新規抗生物質の重要な供給源である。したがって、オルトソマイシン産生生物を同定する方法及びそうした生物により産生されるオルトソマイシンの種類を識別する方法の開発も求められている。
【0006】
オルトソマイシン産生微生物を同定するための既存のスクリーニング方法は労力を要するとともに時間がかかるものであり、現在のところ識別も充分とはいえず、オルトソマイシン天然産物を低いレベルで産生する生物の検出には至っていない。オルトソマイシン産生生物を検出するツールの改良が必要とされている。また、従来の培養試験では検出されないレベルでオルトソマイシンを産生する生物を検出することが可能なツールも必要とされている。オルトソマイシンのなかでもアビラマイシンやエベルニノマイシンなど、オルトソマイシン分子の種類を識別するツールも必要とされている。
【発明の開示】
【0007】
本発明は、オルトソマイシン生合成遺伝子の同定に有用な組成物及び方法を提供するものである。本発明は、エベルニノマイシン型オルトソマイシン遺伝子クラスターとアビラマイシン型オルトソマイシン遺伝子クラスターとの識別に有用な組成物及び方法も提供する。標的のオルトソマイシン遺伝子を一度同定してしまえば、オルトソマイシン化合物の完全長又は部分的生合成遺伝子座が常法により単離される場合がある。
【0008】
本発明の1つの態様においては、ハイブリダイゼーションプローブやPCRプライマーなどの本発明の組成物を用いてオルトソマイシン遺伝子クラスターを同定している。本発明のハイブリダイゼーションプローブ又はPCRプライマーは、オルトソマイシン、エベルニノマイシン型オルトソマイシン、及びアビラマイシン型オルトソマイシンを識別する固有の構造的特徴に関与するタンパク質ファミリーに由来する。オルトソマイシン遺伝子クラスターを同定する場合は、該ハイブリダイゼーションプローブ又はPCRプライマーは、GFTE、GFTG、GTFH、HOXG、MTFD、MTFE、MTFF、MTLA、MTIA、OXRV、OXRW、OXRW、PHOD、UNAJ、UEVA、UEVB、及びUNKUという17個のタンパク質ファミリーに対応する核酸配列に由来している。エベルニノマイシン型オルトソマイシン遺伝子クラスターを同定する場合は、該ハイブリダイゼーションプローブ又はPCRプライマーは、DACT、DEPF、EPIM、GTFA、MTFG、MTFV、OXBN、OXCO及びUNBBという9個のタンパク質ファミリーに対応する核酸配列に由来している。アビラマイシン型オルトソマイシン遺伝子クラスターを同定する場合は、該ハイブリダイゼーションプローブ又はPCRプライマーは、ABCD、DEPN、MEMD、REBU、UNAI及びUNBRという6個のタンパク質ファミリーに対応する核酸配列に由来している。
【0009】
本発明は、オルトソマイシン生合成遺伝子、オルトソマイシン遺伝子断片、オルトソマイシン遺伝子クラスター又はオルトソマイシン産生生物の同定に使用する組成物を提供するものである。1つの態様においては、本発明は、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の配列、それらに相補的な配列のいずれかを、又は、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の配列、若しくはそれらに相補的な配列のいずれかの少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片を含有する、単離、精製又は濃縮を行った核酸を提供するものである。別の態様においては、本発明は、オルトソマイシン生合成遺伝子、オルトソマイシン遺伝子断片、オルトソマイシン遺伝子クラスター又はオルトソマイシン産生生物の同定に使用する上記核酸を提供するものである。該単離、精製又は濃縮を行った核酸は、cDNA、ゲノムDNA、及び合成DNAなどのDNAを含んでいてもよい。該DNAは二本鎖でも一本鎖でもよく、一本鎖の場合はコード鎖又は非コード(アンチセンス)鎖でもよい。あるいは、該単離、精製又は濃縮を行った核酸は、RNAを含んでいてもよい。
【0010】
配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208のいずれかの、単離、精製又は濃縮を行った核酸を用いて、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのいずれかを、又は配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは100個のアミノ酸を連続状態で含む断片を調製してもよい。
【0011】
したがって、本発明は、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのいずれかを、又は、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする、単離、精製又は濃縮を行った核酸も提供するものである。別の態様においては、本発明は、オルトソマイシン生合成遺伝子、オルトソマイシン遺伝子断片、オルトソマイシン遺伝子クラスター又はオルトソマイシン産生生物の検出に使用する上記核酸を提供するものである。
【0012】
これらの核酸のコード配列は、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の核酸、若しくはその断片のいずれかのコード配列と相同であってもよく、又は、オルトソマイシン生合成遺伝子若しくはオルトソマイシン産生生物の検出に使用する遺伝子情報の冗長性若しくは縮重の結果として、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのいずれかを、又は、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする別のコード配列であってもよい。
【0013】
本発明は、エベルニノマイシン型オルトソマイシン生合成遺伝子、エベルニノマイシン型オルトソマイシン遺伝子断片、エベルニノマイシン型オルトソマイシン遺伝子クラスター、及びエベルニノマイシン及びオルトソマイシン産生生物の同定に使用する組成物を提供するものである。1つの態様においては、本発明は、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の配列、それらに相補的な配列のいずれかを、又は、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の配列、若しくはそれらに相補的な配列のいずれかの少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片を含有する、単離、精製又は濃縮を行った核酸を提供するものである。別の態様においては、本発明は、エベルニノマイシン型オルトソマイシン遺伝子、エベルニノマイシン型オルトソマイシン遺伝子断片、エベルニノマイシン型オルトソマイシン遺伝子クラスター、並びにエベルニノマイシン様オルトソマイシン産生生物の同定に使用する上記核酸を提供するものである。該単離、精製又は濃縮を行った核酸は、cDNA、ゲノムDNA、及び合成DNAなどのDNAを含んでいてもよい。該DNAは二本鎖でも一本鎖でもよく、一本鎖の場合はコード鎖又は非コード(アンチセンス)鎖でもよい。あるいは、該単離、精製又は濃縮を行った核酸は、RNAを含んでいてもよい。
【0014】
配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244のいずれかの単離、精製又は濃縮を行った核酸を用いて、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243のポリペプチドのいずれかを、又は、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは100個のアミノ酸を連続状態で含む断片を調製してもよい。
【0015】
したがって、本発明は、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243のポリペプチドのいずれかを、又は、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする、単離、精製又は濃縮を行った核酸も提供するものである。別の態様においては、本発明は、エベルニノマイシン型オルトソマイシン遺伝子、エベルニノマイシン型オルトソマイシン遺伝子断片、エベルニノマイシン型オルトソマイシン遺伝子クラスター、並びにエベルニノマイシン型オルトソマイシン産生生物の同定に使用する上記核酸を提供するものである。これらの核酸のコード配列は、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の核酸若しくはその断片のいずれかのコード配列と相同であってもよく、又は、遺伝子情報の冗長性若しくは縮重の結果として、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243のポリペプチドのいずれかを、又は、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする別のコード配列であってもよい。
【0016】
本発明は、アビラマイシン型生合成遺伝子、アビラマイシン型オルトソマイシン遺伝子断片、アビラマイシン型オルトソマイシン遺伝子クラスター、並びにアビラマイシン型オルトソマイシン産生生物の同定に使用する組成物を提供するものである。1つの態様においては、本発明は、配列番号246、248、250、252、254、256の配列、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列、それらに相補的な配列のいずれかを、又は、配列番号246、248、250、252、254、256の配列、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列、若しくはそれらに相補的な配列のいずれかの少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片を含有する、単離、精製又は濃縮を行った核酸を提供するものである。別の態様においては、本発明は、アビラマイシン型オルトソマイシン遺伝子、及びアビラマイシン型オルトソマイシン産生生物の同定に使用する上記核酸を提供するものである。該単離、精製又は濃縮を行った核酸は、cDNA、ゲノムDNA、及び合成DNAなどのDNAを含んでいてもよい。該DNAは二本鎖でも一本鎖でもよく、一本鎖の場合はコード鎖又は非コード(アンチセンス)鎖でもよい。あるいは、該単離、精製又は濃縮を行った核酸は、RNAを含んでいてもよい。
【0017】
配列番号246、248、250、252、254、256のいずれかの、単離、精製又は濃縮を行った核酸を用いて、配列番号245、247、249、251、253及び255のポリペプチドのいずれかを、又は配列番号245、247、249、251、253ののポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは100個のアミノ酸を連続状態で含む断片を調製してもよい。
【0018】
したがって、本発明は、配列番号245、247、249、251、253、若しくはGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175のポリペプチドのいずれかを、又は、配列番号245、247、249、251、253、若しくはGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、AAK83175のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする、単離、精製又は濃縮を行った核酸も提供するものである。別の態様においては、本発明は、アビラマイシン型オルトソマイシン遺伝子、アビラマイシン型オルトソマイシン遺伝子断片、アビラマイシン型オルトソマイシン遺伝子クラスター、並びにアビラマイシン型オルトソマイシン産生生物の同定に使用する上記核酸を提供するものである。これらの核酸のコード配列は、配列番号246、248、250、252、254、256の核酸若しくはその断片のいずれかのコード配列のいずれかと相同であってもよく、又は、遺伝子情報の冗長性若しくは縮重の結果として、配列番号245、247、249、251、253、若しくはGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175のポリペプチドのいずれかを、又は、配列番号245、247、249、251、253、若しくはGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、AAK83175のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする別のコード配列であってもよい。
【0019】
配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256のポリペプチドのいずれかをコードする、単離、精製又は濃縮を行った核酸としては、(1)配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256のいずれかのコード配列のみ;(2)配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256のいずれかのコード配列、及びリーダー配列などの付加的なコード配列又はプロタンパク質;又は(3)配列番号のコード配列、及びイントロンなどの非コード配列、又はコード配列の非コード配列5’及び/又は3’が挙げられるが、これらに限定されるものではない。したがって、ここで使用されているように、「ポリペプチドをコードするポリヌクレオチド」という語は、付加的なコード配列及び/又は非コード配列をも含むポリヌクレオチドに加えて、該ポリペプチド用コード配列だけを含むポリヌクレオチドをも意味するものである。
【0020】
本発明は、オルトソマイシン生合成遺伝子、オルトソマイシン産生生物の検出に使用するポリヌクレオチドであって、「サイレントな」ポリヌクレオチド変化、たとえば、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256のポリヌクレオチドによりコードされるアミノ酸配列が変わらないような変化を示すポリヌクレオチドに関する。本発明はまた、オルトソマイシン生合成遺伝子及びオルトソマイシン産生生物の同定に使用する、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255のポリペプチドのアミノ酸の置換、付加、欠失、融合及び切断が生じるヌクレオチド変化を示すポリヌクレオチドに関する。
【0021】
1つの態様においては、本発明の組成物は、オルトソマイシン生合成遺伝子及びオルトソマイシン生合成遺伝子座を含有する試料を同定するプローブとして使用されている。試料は、環境由来バイオマス、純粋又は混合微生物培養物、純粋又は混合微生物培養物より単離したゲノムDNA、純粋又は混合微生物培養物由来のゲノムDNAライブラリーの形態であってもよい。該組成物は、当業者には周知の核酸ハイブリダイゼーション法及びポリメラーゼ連鎖反応で使用されている。
【0022】
別の実施形態においては、オルトソマイシンを産生する可能性のある微生物を含有する環境由来試料をPCR法で同定している。標的のオルトソマイシン生合成遺伝子配列を増幅するために、該環境由来試料に含まれる核酸を本発明のプライマーと接触させる。PCRにより陽性と考えられる環境由来試料については、標的の遺伝子配列を内包する微生物及びオルトソマイシン遺伝子クラスターの同定及び単離を行う。該環境由来試料に含まれる各種微生物群から代表的なゲノムDNAを集めたゲノムDNAライブラリー(例えば、コスミド、BACなど)を構築し、(例えば、ハイブリダイゼーション法又はPCRによって)標的の配列を内包するゲノムDNAクローン、及び重複する可能性のあるクローンの局在を確認し、目的のゲノムDNAクローンの配列を決定し、オルトソマイシン生合成遺伝子座のORFを推定することにより、オルトソマイシン遺伝子クラスターの同定を行ってもよい。オルトソマイシン生合成遺伝子座を含む微生物の同定及び単離は、例えば、本発明の核酸プローブ又は新しく同定したオルトソマイシン生合成遺伝子座に由来する核酸プローブのいずれかを用いたコロニーハイブリダイゼーションによって行ってもよい。単離したオルトソマイシン生合成遺伝子座を適切な代理宿主に導入して、オルトソマイシン化合物のヘテロローガスな生産(heterologous production)を行ってもよい。あるいは、オルトソマイシン生合成遺伝子座を含む微生物を同定し単離した場合には、発酵させることによりオルトソマイシン化合物を産生してもよい。
【0023】
本発明の別の実施形態においては、オルトソマイシン遺伝子クラスターを含有する微生物をまず同定し、例えば、本発明の核酸プローブを用いたコロニーハイブリダイゼーションによって、純粋培養物として単離している。純粋培養物を出発点として、この単一の種から代表的なゲノムDNAを集めたゲノムDNAライブラリー(例えば、コスミド、BACなど)を調製し、標的の配列を内包するゲノムDNAクローン、及び重複する可能性のあるクローンの局在を、本発明のプローブを用いて(例えば、ハイブリダイゼーション法又はPCRによって)確認し、目的のゲノムDNAクローンの配列を決定し、オルトソマイシン生合成遺伝子座のORFを推定する。オルトソマイシン生合成遺伝子座を含む微生物を発酵させてオルトソマイシン化合物を産生してもよく、又は、オルトソマイシン生合成遺伝子座を適切な代理宿主に導入して、オルトソマイシン化合物のヘテロローガスな生産を行ってもよい。
【0024】
本発明の別の態様においては、オルトソマイシン特異的核酸コード配列、エベルニノマイシン特異的核酸コード配列、アビラマイシン特異的核酸コード配列、オルトソマイシン特異的ポリペプチドコード配列、エベルニノマイシン特異的ポリペプチドコード配列、及びアビラマイシン特異的ポリペプチドコード配列から選択した1つ以上の配列を本発明の教示の通りに用いて、オルトソマイシン遺伝子クラスターをコンピュータシミュレーションで同定している。コンピュータ読み取り可能な媒体に保存されている一連のクエリー配列から1つのクエリーを読み出して、本発明の参照配列から選択したサブジェクトと比較する。該サブジェクトとクエリーとの間の類似の程度を測定し、オルトソマイシン遺伝子を表すクエリー配列を同定する。
【0025】
当然のことながら、オルトソマイシン生合成遺伝子クラスター、エベルニノマイシン型生合成遺伝子クラスター、及びアビラマイシン型生合成遺伝子クラスターを同定する組成物及び方法を提供する本発明は、同定された生合成遺伝子クラスターが産生するオルトソマイシン、エベルニノマイシン型オルトソマイシン、アビラマイシン型オルトソマイシンをも提供するものである。
【発明を実施するための最良の形態】
【0026】
本発明は、オルトソマイシン遺伝子クラスター及びオルトソマイシン産生生物を同定するための組成物及び方法を提供するものである。本発明はまた、エベルニノマイシン型オルトソマイシン遺伝子クラスターとアビラマイシン型オルトソマイシン遺伝子クラスターとを識別するため、及びエベルニノマイシン型オルトソマイシン産生株とアビラマイシン型オルトソマイシン産生株とを識別するための組成物及び方法をも提供するものである。本発明の組成物及び方法を提供するため、該2種類のオルトソマイシン化合物の各メンバーの完全長生合成遺伝子座を同定し、配列を決定し、アノテーションを行った。Micromonospora carbonacea var. aurantiacaにおけるエベルニノマイシンの生合成遺伝子座(EVER)は、約60kbに及んでおり、エベルニノマイシンの生合成に関与するタンパク質をコードする49個のORFを含んでいる。Streptomyces mobaraensis由来のアビラマイシン様化合物の生合成遺伝子座(AVIA)は、約50kbに及んでおり、アビラマイシン型化合物の生合成に関与するタンパク質をコードする42個のORFを含んでいる。
【0027】
EVER及びAVIAの分析により、すべてのオルトソマイシン分子に共通し、オルトソマイシン生合成遺伝子座を示す構造的特徴に関与する17個のタンパク質ファミリーが判明した。これら17個のタンパク質ファミリーの各メンバーは、EVER、すなわち、EVER ORF5、8、9、12、13、15、17〜19、24〜26、31、33、35及び40(それぞれ、配列番号113、65、201、71、125、101、195、155、107、53、205、161、169、177、59及び129)において、及びAVIA、すなわち、ORF1〜3、5、9、18、19、22〜26、31〜34及び37(それぞれ、配列番号123、203、127、57、199、165、167、99、105、153、111、193、51、63、159、175及び69)において認められている。EVERでは、2個のタンパク質ファミリーが融合してORF31(配列番号169)を形成している。17個のタンパク質ファミリーのメンバーは、Micromonospora carbonacea var. africana由来エベルニノマイシンの生合成遺伝子座及びStreptomyces viridochromogenesTu57由来アビラマイシン化合物の生合成遺伝子座でも認められている。これら17個のタンパク質ファミリーの配列は、オルトソマイシンの生合成に関与する遺伝子クラスターを同定するための組成物及び方法、並びにオルトソマイシン産生生物を同定するための組成物及び方法の基盤を形成している。
【0028】
EVER及びAVIAの分析により、エベルニノマイシン型オルトソマイシン生合成遺伝子座とアビラマイシン型オルトソマイシン生合成遺伝子座とを識別する9個のタンパク質ファミリーが判明した。これら9個のタンパク質ファミリーの各メンバーは、EVER、すなわち、EVER ORF3、4、21、42、43、44、45、46及び47(それぞれ、配列番号225、237、221、233、209、229、217、213及び241)において認められている。9個のタンパク質ファミリーそれぞれのメンバーは、Micromonospora carbonacea var. africana由来エベルニノマイシンの生合成遺伝子座でも認められている。AVIA、Streptomyces viridochromogenesTu57由来アビラマイシン化合物の生合成遺伝子座を含め、アビラマイシン型オルトソマイシンの生合成遺伝子座においては、これら9個のタンパク質ファミリーのメンバーはどれ1つとして認められなかった。これら9個のタンパク質ファミリーの配列は、エベルニノマイシン型オルトソマイシンの生合成に関与する遺伝子クラスターを同定するための組成物及び方法、並びにエベルニノマイシン型オルトソマイシン産生生物を同定するための組成物及び方法の基盤を形成している。
【0029】
EVER及びAVIAの分析により、アビラマイシン型オルトソマイシン生合成遺伝子座とエベルニノマイシン型オルトソマイシン生合成遺伝子座とを識別する6個のタンパク質ファミリーが判明した。これら6個のタンパク質ファミリーの各メンバーは、AVIA、すなわち、AVIA ORF6、7、10、21、27及び28(それぞれ、配列番号253、251、255、247、245及び249)において認められている。6個のタンパク質ファミリーのメンバーは、Streptomyces viridochromogenesTu57由来アビラマイシン化合物の生合成遺伝子座でも認められている。EVER及びMicromonospora carbonacea var. africana由来エベルニノマイシンの生合成遺伝子座を含め、エベルニノマイシン型オルトソマイシンの生合成遺伝子座においては、これら6個のタンパク質ファミリーのメンバーはどれ1つとして認められなかった。これら6個のタンパク質ファミリーの配列は、アビラマイシン型オルトソマイシンの生合成に関与する遺伝子クラスターを同定するための組成物及び方法、並びにアビラマイシン型オルトソマイシン産生生物を同定するための組成物及び方法の基盤を形成している。
【0030】
本発明の組成物及び方法を用いると、オルトソマイシン(エベルニノマイシン型オルトソマイシンとアビラマイシン型オルトソマイシンの両方)を産生するためのDNAを含有する事実上すべての生物を、該生物のオルトソマイシン産生遺伝子の発現レベル又は該生物のオルトソマイシン産生量に関係なく検出することができる。オルトソマイシン産生に関与する核酸配列又はアミノ酸配列を検出すると、通常の実験室条件下又は該生物が自然状態で見られるような典型的な環境条件下では該生物が産生することのない、新規オルトソマイシン天然産物の検出が可能になる。オルトソマイシン産生に関与する核酸配列又はアミノ酸配列を検出すると、培養試験では検出できないほど低いレベルで産生された新規オルトソマイシンの検出が可能になる。オルトソマイシン産生に関与する核酸配列又はアミノ酸配列を検出すると、新規オルトソマイシン天然産物の供給源である新規オルトソマイシン産生株(エベルニノマイシン型オルトソマイシン産生株とアビラマイシン型オルトソマイシン産生株の両方)の検出が可能になる。
【0031】
オルトソマイシン産生に必要なオープンリーディングフレームの有無を、本発明の組成物及び教示に基づき、ハイブリダイゼーションプローブ又はPCRプライマーで検出することができる。プローブを使用したスクリーニングは、コンピュータシミュレーション又は従来のハイブリダイゼーションスクリーニング法のいずれかで行うことができる。
【0032】
本明細書及び本件図面において、Micromonospora carbonacea var. aurantiacaNRRL2997由来エベルニノマイシンの生合成遺伝子座をEVERと称し、Micromonospora carbonacea var. africana(ATCC39149、SCC1413)由来エベルニノマイシンの生合成遺伝子座をEVEAと称し、Streptomyces mobaraensis由来アビラマイシン様化合物の生合成遺伝子座をAVIAと称し、Streptomyces viridochromogenesTu57由来アビラマイシン化合物の生合成遺伝子座をAVILと称する場合がある。
【0033】
EVER、EVEA、AVIA、及びAVILのORFには、推定される機能が割り当てられ、既知のタンパク質との相同性、又は既知のタンパク質との相同性の欠如に基づいて、ファミリー内でグループ分けが行われている。構造と機能を相関させるため、表Iに示したように、該タンパク質ファミリーを4文字で表記し、本明細書及び本図面では一貫してその表記を使用した。
【0034】
【表I−1】
Figure 2004532021
【表I−2】
Figure 2004532021
【0035】
「単離された」という語は、物質がその本来の環境、例えばそれが天然物として生じるのであればその自然環境から除去されたことを意味する。例えば、生体内に存在する自然に生じたポリヌクレオチド又はポリペプチドは、単離されてはいないが、その同じポリヌクレオチド又はポリペプチドが、自然界のシステムで共存している物質のすべて又は一部から分離された場合は、単離されたことになる。そうしたポリヌクレオチドをベクターの一部とすることができ、及び/又は、そうしたポリヌクレオチド又はポリペプチドを組成物の一部とすることができる。その場合もやはり単離されたことになる。なぜなら、そうしたポリヌクレオチド又はポリペプチドにとって、該ベクターや組成物は自然環境の一部ではないからである。
【0036】
「精製された」という語は、100%の純度を必要とするわけではなく、どちらかといえば、相対的な定義を意図するものである。従来、ライブラリーから得た個々の核酸は、電気泳動上で同質となるまで精製されている。これらのクローンから得た配列を、コスミドライブラリーなどの大型インサートライブラリー又は全生物DNAから直接得ることは不可能であった。本発明の精製された核酸は、生物のゲノムDNAの残存物から少なくとも104〜106倍に精製されたものである。しかし、「精製された」という語は、ゲノムDNAの残存物又はライブラリー若しくは他の環境に存在する他の配列から、少なくとも101倍、好ましくは102倍又は103倍、さらに好ましくは104倍又は105倍に精製された核酸も含むものである。
【0037】
「組換え体」という語は、核酸が、自然環境では隣接しない「骨格」核酸に隣接していることを意味する。「濃縮」核酸とは、核酸骨格分子群中に数にして5%以上の核酸インサートが存在することを示す。「骨格」分子には、発現ベクター、自己複製核酸、ウィルス、組込み(integrating)核酸などの核酸、及び目的の核酸の維持又は操作に使用する他のベクター又は核酸などがある。該濃縮核酸は、組換え骨格分子群中に存在する核酸インサート数の15%以上であることが好ましく、50%以上であることがさらに好ましく、90%以上であることがもっとも好ましい。
【0038】
「組換え」ポリペプチド又はタンパク質とは、組換えDNA技術により作製された、すなわち、目的のポリペプチド又はタンパク質をコードする外部DNAコンストラクトにより形質転換された細胞から作製されたポリペプチド又はタンパク質を示す。「合成」ポリペプチド又はタンパク質とは、化学合成により調製されたポリペプチド又はタンパク質のことである。
【0039】
「遺伝子」という語は、ポリペプチド鎖の作製に関与するDNAのセグメントであり、コード領域前後の領域(リーダー及びトレーラー)、及び該当する場合には、個々のコード部分(エキソン)の間にある領域(イントロン)も含むものである。
【0040】
ある特定のポリペプチド又はタンパク質を「コードするヌクレオチド配列」又はDNA「コード配列」とは、適切な制御配列の管理下に置かれた際にポリペプチド又はタンパク質に転写及び翻訳されるDNA配列のことである。
【0041】
オリゴヌクレオチドとは、遺伝子、mRNA、cDNA又はその他目的の核酸をコードするゲノムDNA分子、cDNA分子、又はmRNA分子とハイブリダイズする核酸であって、一般的には10個以上、好ましくは15個、さらに好ましくは20個以上で、好ましくは100個以下のヌクレオチドを有する核酸のことである。
【0042】
「オルトソマイシン産生株」又は「オルトソマイシン産生生物」とは、オルトソマイシン化合物を産生するのに必要な遺伝情報をもつ微生物を示し、該生物がオルトソマイシン産物を産生することが周知であるかどうかは、問題としない。自然環境下で存在している生物においてオルトソマイシン化合物を産生する遺伝情報が認められた場合も、組換え技術によって遺伝情報を生物に導入した場合も、この語はすべての生物に同じように適用される。オルトソマイシン産生株としては、Micromonosporaceae科、そのなかでも好ましくはMicromonospora、Actinoplanes及びDactylosporangium属の生物、Streptomycetaceae科、そのなかでも好ましくはStreptomyces及びKitasatospora属の生物、並びにPseudonocardiaceae科、そのなかでも好ましくはAmycolatopsis及びSaccharopolyspora属の生物が挙げられる。
【0043】
寄託株:Micromonospora carbonacea aurantiaca由来エベルニノマイシン生合成遺伝子座まで及ぶコスミドクローンをそれぞれ有する3つの大腸菌DH10B株を、2001年1月24日付で、カナダ国、R3E 3R2、マニトバ州、ウィニペグ、アーリントンストリート 1015のカナダ国際寄託局(IDAC)に寄託した。該寄託株のアクセッション番号は、IDAC240101−1、IDAC240101−2、及びIDAC240101−3であった。Streptomyces mobaraensis由来アビラマイシン生合成遺伝子座まで及ぶコスミドクローンをそれぞれ有する2つの大腸菌DH10B株を、2001年2月27日付で、カナダ国、R3E 3R2、マニトバ州、ウィニペグ、アーリントンストリート 1015のカナダ国際寄託局(IDAC)に寄託した。該寄託株のアクセッション番号は、IDAC270201−1、IDAC270201−2であった。ここでは、該寄託した大腸菌株を「寄託株」と称することとする。
【0044】
該寄託株はともに、Micromonospora carbonacea var. aurantiaca由来エベルニノマイシン用及びStreptomyces mobaraensis由来アビラマイシン型化合物用の完全な生合成遺伝子座を含んでいる。本明細書中の配列に関する記載との間で齟齬が生じた場合は、寄託株に含まれるポリヌクレオチド配列及びそれらにコードされるあらゆるポリペプチドのアミノ酸配列が優先される(controlling)。
【0045】
該寄託株の寄託は、特許手続上の微生物の寄託の国際的承認に関するブダペスト条約に基づいて行われた。特許証が発行されると、寄託株は最終的なものとして、無制限又は無条件で公開される。寄託株は当業者の便宜のためだけに提供されるものであり、米国特許法第112条で要求されている実施可能要件を満たすために寄託が必要というわけではない。寄託株及びそれに由来する化合物の作製、使用又は販売には許諾が必要となる場合があり、かかる許諾が寄託により与えられることはない。
【0046】
すべてのオルトソマイシンに共通する構造的特徴には、17個の特定のタンパク質ファミリー、すなわちGTFE、GTFG、GTFH、HOXG、MTFD、MTFE、MTFF、MTLA、MTIA、OXRV、OXRW、OXRW、PHOD、UNAJ、UEVA、UEVB、及びUNKUから選択される1つ以上のタンパク質が必要となる。この17個のタンパク質ファミリーにはOXRWが2つ含まれているが、EVERにおいては、2つ目のOXRWファミリーは、UNAJファミリー及びOXRWファミリーに由来するタンパク質の融合物であるため、OXRXと命名されている。これら17個のタンパク質ファミリーのいずれかのメンバーであるポリペプチド、又はこれら17個のタンパク質ファミリーのいずれかのメンバーであるポリペプチドをコードするポリヌクレオチドは、オルトソマイシン遺伝子クラスター及びオルトソマイシン産生生物に特徴的であると考えられている。
【0047】
オルトソマイシン生合成遺伝子座は、オルトソマイシン生合成遺伝子座に特徴的と考えられる17個のタンパク質ファミリー1つ1つについて、そのメンバーを含むわけではないと予想されている。例えば、UEVB及びMTIAタンパク質ファミリーは、EVEA遺伝子座では認められない。しかし、AVIA、AVIL及びEVER遺伝子座ではUEVB及びMTIAタンパク質ファミリーが認められていること、及び、他のホモログが今日まで発見されていないことから、UEVB及びMTIAタンパク質ファミリーは、オルトソマイシン遺伝子座を示すものであると考えられている。GTFE、GTFG、GTFH、HOXG、MTFD、MTFE、MTFF、MTLA、MTIA、OXRV、OXRW、OXRW、PHOD、UNAJ、UEVA、UEVB、及びUNKUという17個のタンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個、より好ましくは5個、より好ましくは6個、より好ましくは8個、より好ましくは10個以上が存在しているということは、オルトソマイシン生合成遺伝子座及びオルトソマイシン産生生物が存在するということである。
【0048】
GTFEタンパク質ファミリーのメンバーには、AVIA ORF31(配列番号51)、AVILGenbankアクセッション番号AAK83192、EVER ORF24(配列番号53)、EVEA ORF33(配列番号55)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号51、53、55、又は、AVILGenbankアクセッション番号AAK83192の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0049】
GTFGタンパク質ファミリーのメンバーには、AVIA ORF5(配列番号57)、AVILGenbankアクセッション番号AAK83170、EVER ORF35(配列番号59)、EVEA ORF27(配列番号61)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号57、59、61、又は、AVILGenbankアクセッション番号AAK83170の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0050】
GTFHタンパク質ファミリーのメンバーには、AVIA ORF32(配列番号63)、AVILGenbankアクセッション番号AAK83193、EVER ORF8(配列番号65)、EVEA ORF31(配列番号67)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号63、65、67、又は、AVILGenbankアクセッション番号AAK83193の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0051】
HOXGタンパク質ファミリーのメンバーには、AVIA ORF37(配列番号69)、EVER ORF12(配列番号71)、EVEA ORF43(配列番号73)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号69、71、又は73の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0052】
MTFDタンパク質ファミリーのメンバーには、AVIA ORF22(配列番号99)、AVILGenbankアクセッション番号AAK83184、EVER ORF15(配列番号101)、EVEA ORF8(配列番号103)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号99、101、103、又は、AVILGenbankアクセッション番号AAK83184の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0053】
MTFEタンパク質ファミリーのメンバーには、AVIA ORF23(配列番号105)、AVILGenbankアクセッション番号AAK83186、EVER ORF19(配列番号107)、EVEA ORF10(配列番号109)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号105、107、109、又は、AVILGenbankアクセッション番号AAK83186の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0054】
MTFFタンパク質ファミリーのメンバーには、AVIA ORF25(配列番号111)、AVILGenbankアクセッション番号AAK83188、EVER ORF5(配列番号113)、EVEA ORF12(配列番号115)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号111、113、115、又は、AVILGenbankアクセッション番号AAK83188の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0055】
MTLAタンパク質ファミリーのメンバーには、AVIA ORF3(配列番号127)、AVILGenbankアクセッション番号AAG32067、EVER ORF40(配列番号129)、EVEA ORF45(配列番号131)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号127、129、131、又は、AVILGenbankアクセッション番号AAG32067の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0056】
MTIAタンパク質ファミリーのメンバーには、AVIA ORF1(配列番号123)、AVILGenbankアクセッション番号AAG32066、EVER ORF13(配列番号125)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号123、125、又は、AVILGenbankアクセッション番号AAG32066の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0057】
OXRVタンパク質ファミリーのメンバーには、AVIA ORF24(配列番号153)、AVILGenbankアクセッション番号AAK83187、EVER ORF18(配列番号155)、EVEA ORF11(配列番号157)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号153、155、157、又は、AVILGenbankアクセッション番号AAK83187の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0058】
OXRWタンパク質ファミリーのメンバーには、AVIA ORF33(配列番号159)、EVER ORF26(配列番号161)、EVEA ORF30(配列番号163)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号159、161、又は、163の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0059】
OXRWタンパク質ファミリーのメンバーには、AVIA ORF19(配列番号167)、EVEA ORF6(配列番号173)、AVILGenbankアクセッション番号AAK83181、EVER ORF31(配列番号169)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号167、169、173、又は、AVILGenbankアクセッション番号AAK83181の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0060】
PHODタンパク質ファミリーのメンバーには、AVIA ORF34(配列番号175)、EVER ORF33(配列番号177)、EVEA ORF29(配列番号179)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号175、177、又は、179の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0061】
UNAJタンパク質ファミリーのメンバーには、AVIA ORF18(配列番号165)、EVEA ORF5(配列番号171)、EVER ORF31(配列番号169)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号165、169、又は171の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0062】
UEVAタンパク質ファミリーのメンバーには、AVIA ORF26(配列番号193)、AVILGenbankアクセッション番号AAK83189、EVER ORF17(配列番号195)、EVEA ORF14(配列番号197)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号193、195、197、又は、AVILGenbankアクセッション番号AAK83189の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0063】
UEVBタンパク質ファミリーのメンバーには、AVIA ORF9(配列番号199)、AVILGenbankアクセッション番号AAK83174、EVER ORF9(配列番号201)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号199、201、又は、AVILGenbankアクセッション番号AAK83174の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0064】
UNKUタンパク質ファミリーのメンバーには、AVIA ORF2(配列番号203)、EVER ORF25(配列番号205)、EVEA ORF32(配列番号207)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、配列番号203、205、又は、207の配列を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0065】
エベルニノマイシン型オルトソマイシンを他のオルトソマイシンから識別する構造的特徴には、9個のタンパク質ファミリー、すなわちDATC、DEPF、EPIM、GTFA、MTFG、MTFV、OXBN、OXCO及びUNBBから選択される1つ以上のタンパク質が必要となる。これら9個のタンパク質ファミリーのいずれかのメンバーであるポリペプチド、又はこれら9個のタンパク質ファミリーのいずれかのメンバーであるポリペプチドをコードするポリヌクレオチドは、エベルニノマイシン型オルトソマイシン遺伝子クラスター及びエベルニノマイシン型オルトソマイシン産生生物に特徴的であると考えられている。好ましい実施形態において、これら9個のタンパク質ファミリー、すなわち、DATC、DEPF、EPIM、GTFA、MTFG、MTFV、OXBN、OXCO及びUNBBのいずれかのメンバーであるポリペプチド、又はこれら9個のタンパク質ファミリーのいずれかのメンバーであるポリペプチドをコードするポリヌクレオチドは、オルトソマイシン遺伝子クラスターに特徴的な17個のタンパク質ファミリー、すなわち、GTFE、GTFG、GTFH、HOXG、MTFD、MTFE、MTFF、MTLA、MTIA、OXRV、OXRW、OXRW、PHOD、UNAJ、UEVA、UEVB、及びUNKUのいずれかのメンバーである1つ以上のポリペプチド、又はこれら17個のタンパク質ファミリーのメンバーであるポリペプチドをコードする1つ以上のポリヌクレオチドとともに検出されている。
【0066】
エベルニノマイシン型オルトソマイシン生合成遺伝子座は、エベルニノマイシン型オルトソマイシン生合成遺伝子座に特徴的と考えられる9個のタンパク質ファミリー1つ1つについて、そのメンバーを含むわけではないと予想されている。むしろ、DATC、DEPF、EPIM、GTFA、MTFG、MTFV、OXBN、OXCO及びUNBBという9個のタンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個、もっとも好ましくは6個以上が存在しているということは、エベルニノマイシン型オルトソマイシン生合成遺伝子座及びエベルニノマイシン型オルトソマイシン産生生物が存在するということである。好ましい実施形態において、オルトソマイシン生合成遺伝子クラスターに特徴的な、GTFE、GTFG、GTFH、HOXG、MTFD、MTFE、MTFF、MTLA、MTIA、OXRV、OXRW、OXRW、PHOD、UNAJ、UEVA、UEVB、及びUNKUという17個のタンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは4個、より好ましくは6個、より好ましくは8個、より好ましくは10個以上の存在とともに、DATC、DEPF、EPIM、GTFA、MTFG、MTFV、OXBN、OXCO及びUNBBという9個のタンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個、もっとも好ましくは6個以上の存在が検出されたということは、エベルニノマイシン型オルトソマイシン生合成遺伝子座及びエベルニノマイシン型オルトソマイシン産生生物が存在するということである。
【0067】
DATCタンパク質ファミリーのメンバーには、EVER ORF43(配列番号209)、EVEA ORF37(配列番号211)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF43(配列番号209)、EVEA ORF37(配列番号211)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0068】
DEPFタンパク質ファミリーのメンバーには、EVER ORF46(配列番号213)、EVEA ORF40(配列番号215)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF46(配列番号213)、EVEA ORF40(配列番号215)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0069】
EPIMタンパク質ファミリーのメンバーには、EVER ORF45(配列番号217)、EVEA ORF39(配列番号219)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF45(配列番号217)、EVEA ORF39(配列番号219)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0070】
GTFAタンパク質ファミリーのメンバーには、EVER ORF21(配列番号221)、EVEA ORF35(配列番号223)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF21(配列番号221)、EVEA ORF35(配列番号223)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0071】
MTFGタンパク質ファミリーのメンバーには、EVER ORF3(配列番号225)、EVEA ORF18(配列番号227)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF3(配列番号225)、EVEA ORF18(配列番号227)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0072】
MTFVタンパク質ファミリーのメンバーには、EVER ORF44(配列番号229)、EVEA ORF38(配列番号231)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF44(配列番号229)、EVEA ORF38(配列番号231)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0073】
OXBNタンパク質ファミリーのメンバーには、EVER ORF42(配列番号233)、EVEA ORF36(配列番号235)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF42(配列番号233)、EVEA ORF36(配列番号235)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0074】
OXCOタンパク質ファミリーのメンバーには、EVER ORF4(配列番号237)、EVEA ORF19(配列番号239)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF4(配列番号237)、EVEA ORF19(配列番号239)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0075】
UNBBタンパク質ファミリーのメンバーには、EVER ORF47(配列番号241)、EVEA ORF41(配列番号243)から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、EVER ORF47(配列番号241)、EVEA ORF41(配列番号243)のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0076】
アビラマイシン型オルトソマイシンを他のオルトソマイシンから識別する構造的特徴には、6個のタンパク質ファミリー、すなわちABCD、DEPN、MEMD、REBU、UNAI及びUNBRから選択される1つ以上のタンパク質が関与している。これら6個のタンパク質ファミリーのいずれかのメンバーであるポリペプチド、又はこれら6個のタンパク質ファミリーのいずれかのメンバーであるポリペプチドをコードするポリヌクレオチドは、アビラマイシン型オルトソマイシン遺伝子クラスター及びアビラマイシン型オルトソマイシン産生生物に特徴的であると考えられている。好ましい実施形態において、これら6個のタンパク質ファミリー、すなわち、ABCD、DEPN、MEMD、REBU、UNAI及びUNBRのいずれかのメンバーであるポリペプチド、又はこれら6個のタンパク質ファミリーのいずれかのメンバーであるポリペプチドをコードするポリヌクレオチドは、オルトソマイシン生合成遺伝子クラスターに特徴的な17個のタンパク質ファミリー、すなわち、GTFE、GTFG、GTFH、HOXG、MTFD、MTFE、MTFF、MTLA、MTIA、OXRV、OXRW、OXRW、PHOD、UNAJ、UEVA、UEVB、及びUNKUのいずれかのメンバーである1つ以上のポリペプチド、又はこれら17個のタンパク質ファミリーのメンバーであるポリペプチドをコードする1つ以上のポリヌクレオチドとともに検出されている。
【0077】
アビラマイシン型オルトソマイシン生合成遺伝子座は、アビラマイシン型オルトソマイシン生合成遺伝子座に特徴的と考えられる6個のタンパク質ファミリー1つ1つについて、そのメンバーを含むわけではないと予想されている。むしろ、ABCD、DEPN、MEMD、REBU、UNAI及びUNBRというタンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個、もっとも好ましくは5個又は6個が存在しているということは、アビラマイシン型オルトソマイシン生合成遺伝子座及びアビラマイシン型オルトソマイシン産生生物が存在するということである。好ましい実施形態において、オルトソマイシン生合成遺伝子クラスターに特徴的な、GTFE、GTFG、GTFH、HOXG、MTFD、MTFE、MTFF、MTLA、MTIA、OXRV、OXRW、OXRW、PHOD、UNAJ、UEVA、UEVB、及びUNKUという17個のタンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは4個、より好ましくは6個、より好ましくは8個、より好ましくは10個以上の存在とともに、ABCD、DEPN、MEMD、REBU、UNAI及びUNBRというタンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個、もっとも好ましくは5個又は6個の存在が検出されたということは、アビラマイシン型オルトソマイシン生合成遺伝子座及びアビラマイシン型オルトソマイシン産生生物が存在するということである。
【0078】
ABCDタンパク質ファミリーのメンバーには、AVIA ORF27(配列番号245)、AVILGenbankアクセッション番号AAG32068から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、AVIA ORF27(配列番号245)、又は、AVILGenbankアクセッション番号AAG32068のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0079】
DEPNタンパク質ファミリーのメンバーには、AVIA ORF21(配列番号247)、AVILGenbankアクセッション番号AAK83183から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、AVIA ORF21(配列番号247)、又は、AVILGenbankアクセッション番号AAK83183のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0080】
MEMDタンパク質ファミリーのメンバーには、AVIA ORF28(配列番号249)、AVILGenbankアクセッション番号AAG32069から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、AVIA ORF28(配列番号249)、又は、AVILGenbankアクセッション番号AAG32069のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0081】
REBUタンパク質ファミリーのメンバーには、AVIA ORF7(配列番号251)、AVILGenbankアクセッション番号AAK83172から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、AVIA ORF7(配列番号251)、又は、AVILGenbankアクセッション番号AAK83172のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0082】
UNAIタンパク質ファミリーのメンバーには、AVIA ORF6(配列番号253)、AVILGenbankアクセッション番号AAK83171から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、AVIA ORF6(配列番号253)、又は、AVILGenbankアクセッション番号AAK83171のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
【0083】
UNBRタンパク質ファミリーのメンバーには、AVIA ORF10(配列番号255)、AVILGenbankアクセッション番号AAK83175から選択したポリペプチド、及び、デフォルトパラメータを用いたBLASTPアルゴリズムで測定した場合に、AVIA ORF10(配列番号255)、又は、AVILGenbankアクセッション番号AAK83175のポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%、少なくとも60%の相同性を有するポリペプチドが含まれる。
ハイブリダイゼーションプローブ及びPCRプライマー:
オルトソマイシン産生生物又はオルトソマイシン生合成遺伝子座を同定するため、培養した微生物、又は、例えば土壌など、オルトソマイシン化合物を産生する遺伝的能力をもつ生物を含有する可能性のある環境試料に由来する核酸を、オルトソマイシンに共通する構造的特徴の生合成に関係する17個のタンパク質ファミリーのメンバーをコードするヌクレオチド配列に基づくプローブと接触させてもよい。次の(1)〜(17)からなる群から選択される1つの核酸、又は複数の核酸を組み合わせたものに基づいて、有用なプローブを設計してもよい:(1)GTFEファミリーのポリペプチドをコードする核酸配列、例えば、配列番号52、54、56(AVIA ORF31、EVER ORF24及びEVEA ORF33にて、GTFEタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83192をコードする核酸配列;(2)GTFGファミリーのポリペプチドをコードする核酸配列、例えば、配列番号58、60、62(AVIA ORF5、EVER ORF35及びEVEA ORF27にて、GTFGタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83170をコードする核酸配列;(3)GTFHファミリーのポリペプチドをコードする核酸配列、例えば、配列番号64、66、68(AVIA ORF32、EVER ORF8及びEVEA ORF31にて、GTFHタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83193をコードする核酸配列;(4)HOXGファミリーのポリペプチドをコードする核酸配列、例えば、配列番号70、72、74(AVIA ORF37、EVER ORF12及びEVEA ORF43にて、HOXGタンパク質をそれぞれコードする核酸配列)の核酸;(5)MTFDファミリーのポリペプチドをコードする核酸配列、例えば、配列番号100、102、104(AVIA ORF22、EVER ORF15及びEVEA ORF8にて、MTFDタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83184をコードする核酸配列;(6)MTFEファミリーのポリペプチドをコードする核酸配列、例えば、配列番号106、108、110(AVIA ORF23、EVER ORF19及びEVEA ORF10にて、MTFEタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83186をコードする核酸配列;(7)MTFFファミリーのポリペプチドをコードする核酸配列、例えば、配列番号112、114、116(AVIA ORF25、EVER ORF5及びEVEA ORF12にて、MTFFタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83188をコードする核酸配列;(8)MTLAファミリーのポリペプチドをコードする核酸配列、例えば、配列番号128、130、132(AVIA ORF3、EVER ORF40及びEVEA ORF45にて、MTLAタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAG32067をコードする核酸配列;(9)MTIAファミリーのポリペプチドをコードする核酸配列、例えば、配列番号124、126(AVIA ORF1及びEVER ORF13にて、MTIAタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAG32066をコードする核酸配列;(10)OXRVファミリーのポリペプチドをコードする核酸配列、例えば、配列番号154、156、158(AVIA ORF24、EVER ORF18及びEVEA ORF11にて、OXRVタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83187をコードする核酸配列;(11)OXRWファミリーのポリペプチドをコードする核酸配列、例えば、配列番号160、162及び164(AVIA ORF33、EVER ORF26及びEVEA ORF30にて、OXRWタンパク質をそれぞれコードする核酸配列)の核酸;(12)OXRW/OXRXファミリーのポリペプチドをコードする核酸配列、例えば、配列番号(配列番号167のAVIA ORF19、配列番号173のEVEA ORF6にて、2つ目のOXRWタンパク質をそれぞれコードする核酸配列)、配列番号170(EVER ORF31にて、OXRXタンパク質をコードする核酸)の核酸、及び、AVILGenbankアクセッション番号AAK83181をコードする核酸配列;(13)PHODファミリーのポリペプチドをコードする核酸配列、例えば、配列番号176、178及び180(AVIA ORF34、EVER ORF33及びEVEA ORF29にて、PHODタンパク質をそれぞれコードする核酸配列)の核酸;(14)UNAJ/OXRXファミリーのポリペプチドをコードする核酸配列、例えば、配列番号(配列番号165のAVIA ORF18、配列番号171のEVEA ORF5にて、UNAJタンパク質をそれぞれコードする核酸配列)、配列番号170(EVER ORF31にて、OXRXタンパク質をコードする核酸)の核酸;(15)UEVAファミリーのポリペプチドをコードする核酸配列、例えば、配列番号194、196及び198(AVIA ORF26、EVER ORF17及びEVEA ORF14にて、UEVAタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83189をコードする核酸配列;(16)UEVBファミリーのポリペプチドをコードする核酸配列、例えば、配列番号200及び202(AVIA ORF9、及びEVER ORF9にて、UEVBタンパク質をそれぞれコードする核酸配列)の核酸、又は、AVILGenbankアクセッション番号AAK83174をコードする核酸配列;(17)UNKUファミリーのポリペプチドをコードする核酸配列、例えば、配列番号204、206、208(AVIA ORF2、EVER ORF25及びEVEA ORF32にて、UNKUタンパク質をそれぞれコードする核酸配列)の核酸。好ましいプローブとしては、単離、精製又は濃縮を行った核酸であって、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、及びそれらに相補的な配列に由来するもの、又は、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の配列のいずれか、若しくはそれらに相補的な配列の、少なくとも10、15、20、25、30、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片に由来するものが挙げられる。
【0084】
そうした手順においては、培養した微生物、又は、オルトソマイシン化合物を産生する遺伝的能力をもつ生物を含有する可能性のある環境試料から核酸を得る。該核酸と本発明の教示及び組成物に基づいて設計したプローブとを、オルトソマイシン特異的タンパク質ファミリーの存在を示すどのような相補配列とも該プローブが特異的にハイブリダイズできるような条件下で接触させる。17個のオルトソマイシン特異的タンパク質ファミリーのうち、少なくとも2個、好ましくは3個、さらに好ましくは4個、さらに好ましくは5個、さらに好ましくは6個、さらに好ましくは8個、より好ましくは10個以上が存在しているということは、オルトソマイシン生合成遺伝子座又はオルトソマイシン産生生物が存在するということである。
【0085】
オルトソマイシン遺伝子、生合成遺伝子座、及びそうした遺伝子又は遺伝子座を含有する微生物を同定するための特徴的な核酸配列を、環境試料(例えば土壌など)由来の微生物の複雑な混合物に用いてもよい。微生物混合物とは、2つ以上の種又は株からなる異種微生物群を指す。微生物をその生息環境内でしか増幅させない場合には、そうした微生物混合物は培養されたものとはみなされない。必須栄養素を提供する各種成長培地を用いたインビトロ培養によってその生息環境以外で増幅や増殖を行うことにより、培養微生物混合物を得てもよい。しかし、使用する成長培地によっては、そのような増幅は、結果として混合物のサブ群の増幅になる場合が多いため、常に望ましいとは限らない。必要であれば、連続稀釈後に固形培地で増殖させるなど、個々のコロニー形成単位を単離するための確立した微生物学的技術により、培養又は非培養微生物混合物から、単一の種又は株である純粋培養物を得てもよい。
【0086】
PCR、ハイブリダイゼーション、ショットガン配列決定法などの実験法を行い、その後で配列データを生物情報学的に分析することにより、本発明に開示されている特徴的な核酸配列を用いた純粋培養物又は培養若しくは非培養微生物混合物のいずれかから、オルトソマイシン遺伝子及び/又はオルトソマイシン生合成遺伝子座を同定してもよい。単一の生物からなる純粋培養物中のオルトソマイシン遺伝子及び/又はオルトソマイシン生合成遺伝子座を同定することは、その種類のオルトソマイシンに属する1つ又は複数の天然化合物を産生する遺伝的能力を有する生物を直接識別するということである。培養又は非培養微生物混合物中のオルトソマイシン遺伝子及び/又はオルトソマイシン生合成遺伝子座を同定するには、それらを含有する微生物の同定及び単離を行って、その微生物の純粋培養物を得るという別の段階を経る必要がある。培養微生物混合物から、オルトソマイシン遺伝子及び/又はオルトソマイシン生合成遺伝子座を含有する微生物を同定する際に適用してもよい一般的な方法の1つに、そうした混合物を適切な固形培地で増殖させ、結果として生じたコロニー形成単位をナイロン膜などの固形マトリックス上で複製し、該膜を検出可能な特徴的核酸配列と接触させ、陽性のコロニー形成単位を同定し、元の培地上の対応するコロニー形成単位を同定し、精製し、増幅させるコロニーリフト法(Ausubel et al., Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997; Sambrook et al., Molecular Cloning: A Laboratory Manual 2d Ed., Cold Spring Harbor Laboratory Press, 1989)がある。
【0087】
オルトソマイシンに特徴的な核酸を用いて、多数の環境試料について、オルトソマイシン化合物を産生する可能性をもつ生物、すなわち、オルトソマイシン遺伝子及び/又はオルトソマイシン生合成遺伝子座を含有する生物の有無を調査してもよい。非培養微生物混合物から単離したDNA由来のポリペプチドを同定するために調査を利用するプロトコルの1つが、Seow et al. (1997) J. Bacteriol. Vol. 179 pp. 7360-7368に概述されている。
【0088】
エベルニノマイシン型オルトソマイシン産生株又はエベルニノマイシン型オルトソマイシン生合成遺伝子クラスターを同定するため、例えば、土壌など、エベルニノマイシン型オルトソマイシン化合物を産生する遺伝的能力をもつ生物を含有する可能性のある環境試料に由来する核酸を、エベルニノマイシン型オルトソマイシンに特有の構造的特徴の生合成に関連するタンパク質ファミリーに対応するヌクレオチド配列に基づいて構築したプローブと接触させてもよい。次の(1)〜(9)からなる群から選択される核酸に基づいて、有用なプローブを設計してもよい:(1)DATCファミリーのポリペプチドをコードする核酸配列、例えば、配列番号210、212(EVER ORF43及びEVEA ORF37にて、DATCタンパク質をそれぞれコードする核酸配列)の核酸;(2)DEPFファミリーのポリペプチドをコードする核酸配列、例えば、配列番号214、216(EVER ORF46及びEVEA ORF40にて、DEPFタンパク質をそれぞれコードする核酸配列)の核酸;(3)EPIMファミリーのポリペプチドをコードする核酸配列、例えば、配列番号218及び220(EVER ORF45及びEVEA ORF39にて、EPIMタンパク質をそれぞれコードする核酸配列)の核酸;(4)GTFAファミリーのポリペプチドをコードする核酸配列、例えば、配列番号222及び224(EVER ORF21及びEVEA ORF35にて、GTFAタンパク質をそれぞれコードする核酸配列)の核酸;(5)MTFGファミリーのポリペプチドをコードする核酸配列、例えば、配列番号226、228(EVER ORF3及びEVEA ORF18にて、MTFGタンパク質をそれぞれコードする核酸配列)の核酸;(6)MTFVファミリーのポリペプチドをコードする核酸配列、例えば、配列番号230、232(EVER ORF44及びEVEA ORF38にて、MTFVタンパク質をそれぞれコードする核酸配列)の核酸;(7)OXBNファミリーのポリペプチドをコードする核酸配列、例えば、配列番号234及び236(EVER ORF42及びEVEA ORF36にて、OXBNタンパク質をそれぞれコードする核酸配列)の核酸;(8)OXCOファミリーのポリペプチドをコードする核酸配列、例えば、配列番号238、240(EVER ORF4及びEVEA ORF19にて、OXCOタンパク質をそれぞれコードする核酸配列)の核酸;及び(9)UNBBファミリーのポリペプチドをコードする核酸配列、例えば、配列番号242、244(EVER ORF47及びEVEA ORF41にて、UNBBタンパク質をそれぞれコードする核酸配列)の核酸。好ましいプローブとしては、単離、精製又は濃縮を行った核酸であって、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、及びそれらに相補的な配列に由来するもの、又は、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の配列、及びそれらに相補的な配列のいずれかの少なくとも10、15、20、25、30、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片に由来するものが挙げられる。
【0089】
そうした手順においては、培養した微生物、又は、エベルニノマイシン型オルトソマイシン化合物を産生する遺伝的能力をもつ生物を含有する可能性のある環境試料から核酸を得る。かかる環境試料は、微生物混合物でもよく、単一の微生物からなる純粋培養物でもよい。該核酸と本発明の教示及び組成物に基づいて設計したプローブとを、エベルニノマイシン型オルトソマイシン特異的タンパク質ファミリーの存在を示すどのような相補配列とも該プローブが特異的にハイブリダイズできるような条件下で接触させる。9個のエベルニノマイシン型オルトソマイシン特異的タンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは4個、より好ましくは6個以上が存在しているということは、エベルニノマイシン型オルトソマイシン生合成遺伝子座及びエベルニノマイシン型オルトソマイシン産生生物が存在するということである。
【0090】
アビラマイシン型オルトソマイシン産生株又はアビラマイシン型オルトソマイシン生合成遺伝子座を同定するため、培養微生物、又は、例えば土壌など、アビラマイシン型オルトソマイシン化合物を産生する遺伝的能力をもつ生物を含有する可能性のある環境試料由来の核酸を、アビラマイシン型オルトソマイシンに共通の構造的特徴の生合成に関連する6個のタンパク質ファミリーのメンバーに対応するプローブと接触させる。次の(1)〜(6)からなる群から選択される核酸から、有用なプローブを設計してもよい:(1)ABCDファミリーのポリペプチドをコードする核酸配列、例えば、配列番号246(AVIA ORF27)、又は、AVILGenbankアクセッション番号AAG32068;(2)DEPNファミリーのポリペプチドをコードする核酸配列、例えば、配列番号248(AVIA ORF21)、又は、AVILGenbankアクセッション番号AAK83183;(3)MEMDファミリーのポリペプチドをコードする核酸配列、例えば、配列番号250(AVIA ORF28)、又は、AVILGenbankアクセッション番号AAG32069;(4)REBUファミリーのポリペプチドをコードする核酸配列、例えば、配列番号252(AVIA ORF7)、又は、AVILGenbankアクセッション番号AAK83172;(5)UNAIファミリーのポリペプチドをコードする核酸配列、例えば、配列番号254(AVIA ORF6)、又は、AVILGenbankアクセッション番号AAK83171;及び(6)UNBRファミリーのポリペプチドをコードする核酸配列、例えば、配列番号256(AVIA ORF10)、又は、AVILGenbankアクセッション番号AAK83175からなる群から選択される核酸。好ましいプローブとしては、単離、精製又は濃縮を行った核酸であって、配列番号246、248、250、252、254、256、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列、それらに相補的な配列に由来するもの、又は、配列番号246、248、250、252、254、256の配列及びそれらに相補的な配列のいずれかの少なくとも10、15、20、25、30、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片に由来するものが挙げられる。
【0091】
そうした手順においては、培養した微生物、又は、アビラマイシン型オルトソマイシン化合物を産生する遺伝的能力をもつ生物を含有する可能性のある環境試料から核酸を得る。かかる環境試料は、微生物混合物でもよく、単一の微生物からなる純粋培養物でもよい。該核酸と本発明の教示及び組成物に基づいて設計したプローブとを、アビラマイシン型オルトソマイシン特異的タンパク質ファミリーの存在を示すどのような相補配列とも該プローブが特異的にハイブリダイズできるような条件下で接触させる。6個のアビラマイシン型オルトソマイシン特異的タンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個以上が存在しているということは、アビラマイシン型オルトソマイシン生合成遺伝子座及びアビラマイシン型オルトソマイシン産生生物が存在するということである。
【0092】
必要な場合には、オルトソマイシン産生株から得た相補配列とオルトソマイシン産生株に由来しないコントロール配列の両方に該プローブを接触させることにより、該プローブがオルトソマイシン産生株由来の相補配列と特異的にハイブリダイズできるような条件を決定してもよい。いくつかの分析においては、コントロール配列がオルトソマイシン産生株に関連する生物に由来している場合がある。あるいは、コントロール配列がオルトソマイシン産生株に無関係の場合もある。該プローブがオルトソマイシン産生株由来の核酸と特異的にハイブリダイズできるような条件を確認するために、ハイブリダイゼーション緩衝液の塩濃度、ハイブリダイゼーション緩衝液のホルムアミド濃度、ハイブリダイゼーション温度などのハイブリダイゼーション条件を変えてもよい。
【0093】
試料中にオルトソマイシン産生株由来の核酸が含まれる場合は、プローブとオルトソマイシン産生株由来の核酸との特異的ハイブリダイゼーションがやがて検出される。放射性同位体、蛍光染料、又は検出可能な産物の形成に触媒作用を及ぼせる酵素などの検出可能な試薬を用いてプローブを標識することにより、ハイブリダイゼーションを検出してもよい。
【0094】
当業者であれば、標識プローブを用いて試料中のオルトソマイシン産生株由来核酸の有無を検出する多くの方法に精通している。そうした方法としては、サザンブロット法、ノーザンブロット法、コロニーハイブリダイゼーション法、及びドットブロット法が挙げられる。これらの各手法のプロトコルは、Ausubel et al., Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997; Sambrook et al., Molecular Cloning: A Laboratory Manual 2d Ed., Cold Spring Harbor Laboratory Press, 1989に記載されている。
【0095】
あるいは、本発明の教示及び組成物に基づいて設計された2つ以上のプローブを増幅反応に用いて、核酸試料がオルトソマイシン産生株由来核酸を含んでいるかどうかを測定してもよい。該プローブはオリゴヌクレオチドを含んでいることが好ましい。1つの実施態様においては、該増幅反応は、ポリメラーゼ連鎖反応(PCR)を含んでいてもよい。PCRのプロトコルは、上記Ausubel及びSambrookに記載されている。そうした手順においては、試料中の核酸をプローブと接触させ、増幅反応を行い、あらゆる増幅産物を検出する。反応産物に対してゲル電気泳動を行い、該ゲルを臭化エチジウムなどのインターキュレーター(interculator)で染色することにより、増幅産物を検出してもよい。あるいは、1つ以上のプローブを放射性同位体で標識し、該放射性同位体の有無及び放射性増幅産物の有無を、ゲル電気泳動後にオートラジオグラフィーで検出してもよい。
【0096】
配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256やそれらに相補的な配列の、単離、精製又は濃縮を行った核酸、又は配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256の配列のいずれかを、又は、それらに相補的な配列の少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片をプローブとして用いて、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255のポリペプチドをそれぞれコードするDNAの同定及び単離を行ってもよい。そうした手順においては、オルトソマイシン産生株を含む試料からゲノムDNAライブラリーを構築する。次いで、コード配列又はコード配列の断片を含み、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255のポリペプチド又はその断片のいずれかをコードするプローブと該ゲノムDNAライブラリーとを、該プローブがその相補配列と特異的にハイブリダイズできるような条件下で接触させる。好ましい実施形態においては、該プローブは、長さにして約10〜約30個のヌクレオチドを有し、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256の核酸に基づいて設計されたオリゴヌクレオチドである。次いで、該プローブとハイブリダイズするゲノムクDNAローンを検出し、単離する。目的のDNAクローンを調製し同定する手順は、Ausubel et al., Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997; Sambrook et al., Molecular Cloning: A Laboratory Manual 2d Ed., Cold Spring Harbor Laboratory Press, 1989に開示されている。
【0097】
配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256やそれらに相補的な配列の、単離、精製又は濃縮を行った核酸、又は配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256の配列のいずれか、若しくはそれらに相補的な配列の少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片をプローブとして用いて、関連する核酸の同定及び単離を行ってもよい。いくつかの実施形態において、該関連する核酸は、潜在的オルトソマイシン産生株由来のゲノムDNA(又はcDNA)であってもよい。そうした手順においては、潜在的オルトソマイシン産生株由来の核酸を含む核酸試料とプローブとを、該プローブが関連配列と特異的にハイブリダイズできるような条件下で接触させる。該核酸試料は、潜在的オルトソマイシン産生株由来のゲノムDNA(又はcDNA)ライブラリーであってもよい。次いで、上記方法のいずれかを用いて、該プローブと核酸とのハイブリダイゼーションを検出する。
【0098】
ハイブリダイゼーションは、低ストリンジェンシー条件下、中程度のストリンジェンシー条件下、又は高ストリンジェンシー条件下で行ってもよい。核酸ハイブリダイゼーションの一例を挙げる。0.9MのNaCl、50mMのNaH2PO4、pH7.0、5.0mMのNa2EDTA、0.5%のSDS、10×Denhardt's、及び0.5mg/mlのポリリボアデニル酸からなる溶液中で、不動化変性核酸を含むポリマー膜を、まず45℃で30分間プレハイブリダイズする。その後、約2×107cpm(比放射能4〜9×108cpm/ug)の32P末端標識オリゴヌクレオチドプローブを溶液に添加する。12〜16時間のインキュベーションを行った後、0.5%のSDSを含む1×SET(150mMのNaCl、20mMのTris塩酸、pH7.8、1mMのNa2EDTA)中で、かかる膜を室温で30分間洗浄し、新しい1×SET中で、オリゴヌクレオチドプローブ用にTm−10℃で30分間洗浄する。ここでTmとは融解温度のことである。その後、ハイブリダイゼーションシグナルを検出するため、かかる膜をオートラジオグラフ用フィルムに曝露させる。
【0099】
検出可能なプローブとハイブリダイズする、ゲノムDNA又はcDNAなどの核酸の同定に使用するハイブリダイゼーションストリンジェンシーの条件を変えると、該プローブに対して異なる相同性を有する核酸の同定及び単離が可能になる。該プローブの融解温度よりも低い温度で、いろいろと温度を変えてハイブリダイゼーションを行うことによって、ストリンジェンシーを変えてもよい。該プローブの融解温度は、下記の式を利用して計算してもよい。
【0100】
長さにして14〜70個のヌクレオチドからなるオリゴヌクレオチドの場合、摂氏での融解温度(Tm)は、下記の式を利用して計算してもよい。
Tm=81.5+16.6(log[Na+])+0.41(フラクションG+C)−(600/N)、式中、Nはオリゴヌクレオチドの長さ
ホルムアミドを含む溶液中でハイブリダイゼーションを行う場合、以下の方程式を用いて融解温度を計算してもよい。
Tm=81.5+16.6(log[Na+])+0.41(フラクションG+C)−(0.63%のホルムアミド)−(600/N)、式中、Nはプローブの長さ
6×SSC、5×Denhardt's試薬、0.5%のSDS、0.1mg/mlの変性分画サケ精子DNA、又は6×SSC、5×Denhardt's試薬、0.5%のSDS、0.1mg/mlの変性分画サケ精子DNA、50%のホルムアミド中で、プレハイブリダイゼーションをおこなってもよい。SSC及びDenhardt's溶液の組成については、上記Sambrook et al.中に列挙されている。
【0101】
上に列挙したハイブリダイゼーション溶液に検出可能なプローブを添加することにより、ハイブリダイゼーションを行う。該プローブが二本鎖DNAを含む場合には、温度を上げながらインキュベーションを行い、次いで急激に冷却することによりかかるDNAを変性させ、その後でハイブリダイゼーション溶液に添加する。また、二次構造の形成若しくはオリゴマー化を皆無にするため又は減らすために、一本鎖プローブを同様に変性させることが望ましい場合もある。フィルターを充分な時間ハイブリダイゼーション溶液と接触させて、相補配列又は相同配列を内包するcDNA又はゲノムDNAと該プローブがハイブリダイズできるようにする。長さにして200以上のヌクレオチドからなるプローブについては、Tmよりも15〜25℃低い温度でハイブリダイゼーションを行ってもよい。オリゴヌクレオチドプローブなど、それよりも短いプローブについては、Tmよりも5〜10℃低い温度でハイブリダイゼーションを行ってもよい。短いプローブのハイブリダイゼーションは、6×SSC中で行うのが好ましい。長いプローブのハイブリダイゼーションは、50%のホルムアミドを含む溶液中で行うのが好ましい。
【0102】
これまで述べたハイブリダイゼーションはすべて、高ストリンジェンシー条件下で行われるハイブリダイゼーションの例と考えられている。
【0103】
ハイブリダイゼーションに続いて、2×SSC、0.1%のSDS中で少なくとも15分間、目的のストリンジェンシーに応じて室温又はそれよりも高い温度で、フィルターを洗浄する。その後フィルターを1×SSC、0.5%のSDSで、30分〜1時間、(再び)室温で洗浄する。
【0104】
プローブとハイブリダイズした核酸を、オートラジオグラフィー又は他の従来の方法で同定する。
【0105】
プローブ配列との相同性が低下している核酸を同定する際には、上記手順を修正してもよい。例えば、検出可能なプローブとの相同性が低下している核酸を得るためには、低ストリンジェンシー条件を用いてもよい。例えば、Na+の濃度が約1Mのハイブリダイゼーション緩衝液において、ハイブリダイゼーション温度を、68℃から42℃まで、5℃ずつ下げていってもよい。ハイブリダイゼーション後、フィルターを2×SSC、0.5%のSDSで、ハイブリダイゼーション温度で洗浄してもよい。これらの条件は、50℃を越える温度では「中程度のストリンジェンシー」条件で、50℃以下の温度では「低ストリンジェンシー」条件であると考えられている。「中程度のストリンジェンシー」ハイブリダイゼーション条件の具体例として、上記ハイブリダイゼーションを55℃で行った場合が挙げられる。「低ストリンジェンシー」ハイブリダイゼーション条件の具体例として、上記ハイブリダイゼーションを45℃で行った場合が挙げられる。
【0106】
あるいは、ホルムアミドを含む、例えば6×SSCなどの緩衝液中で、42℃でハイブリダイゼーションを行ってもよい。この場合、プローブとの相同性が低下しているクローンを同定するために、ハイブリダイゼーション中のホルムアミドの濃度は、50%から0%へ、5%ずつ下げてもよい。ハイブリダイゼーション後、フィルターを6×SSC、0.5%のSDSで、50℃で洗浄してもよい。これらの条件は、ホルムアミドが25%を越える場合には「中程度のストリンジェンシー」条件で、25%以下の場合には「低ストリンジェンシー」条件であると考えられている。「中程度のストリンジェンシー」ハイブリダイゼーション条件の具体例として、上記ハイブリダイゼーションを30%のホルムアミドで行った場合が挙げられる。「低ストリンジェンシー」ハイブリダイゼーション条件の具体例として、上記ハイブリダイゼーションを10%のホルムアミドで行った場合が挙げられる。
【0107】
プローブとハイブリダイズした核酸を、オートラジオグラフィー又は他の従来の方法で同定する。
【0108】
例えば、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256の配列、上記配列の少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片、及びそれらの相補配列からなる群から選択した核酸配列に対して、少なくとも97%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、少なくとも70%の相同性を示す配列を有する核酸を単離するのに、上記方法を用いてもよい。デフォルトパラメータを用いたBLASTNのバージョン2.0で相同性を測定してもよい。例えば、相同的なポリヌクレオチドは、ここに記載したコード配列のいずれかに対して自然に発生したアレル変異体であるコード配列を有していてもよい。そうしたアレル変異体には、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、又はその相補配列の核酸と比較して、1つ以上のヌクレオチドの置換、欠失、付加が生じていてもよい。
【0109】
また、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255のいずれかの配列を有するポリペプチド、又は、デフォルトパラメータを用いたBLASTPのバージョン2.2.2アルゴリズムで測定した際に、上記配列の、少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片を有するポリペプチドに対して、少なくとも99%、少なくとも95%、少なくとも90%、少なくとも85%、少なくとも80%、又は少なくとも70%の相同性を示すポリペプチドをコードする核酸を単離するのに、上記方法を用いてもよい。
生物情報学:
ここで使用する「オルトソマイシン特異的核酸コード」という語には、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208のヌクレオチド配列、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の断片、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208に相同的なヌクレオチド配列、又は配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の断片に相同的なヌクレオチド配列、及び前記全配列の相補配列が含まれる。該断片には、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の、少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個のヌクレオチドを連続状態で含む、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の部分が含まれる。該断片は新規断片であることが好ましい。配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の相同配列及び断片とは、これらの配列に対して、少なくとも99%、98%、97%、96%、95%、90%、80%、75%、又は70%の相同性を有する配列のことである。相同性の測定は、デフォルトパラメータを用いたBLASTN及びTBLASTXをはじめとする、ここに記載したコンピュータプログラム及びパラメータのいずれを用いて行ってもよい。相同配列には、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の核酸コード中のチミンがウリジンに置換されているRNA配列も含まれる。相同配列は、ここに記載したどの手順を用いて得てもよく、また、シーケンシングエラー訂正の結果として生じる場合もある。当然のことながら、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の核酸コードは、G、A、T及びCがデオキシリボ核酸(DNA)配列のグアニン、アデニン、チミン及びシトシン塩基をそれぞれ表し、G、A、U及びCがリボ核酸(RNA)配列のグアニン、アデニン、ウラシル及びシトシン塩基をそれぞれ表す、従来の1文字表記形式(Stryer, Biochemistry, 3rd edition, W. H. Freeman & Co., New Yorkの裏表紙の見返し部分を参照のこと)、又は、配列中のヌクレオチドの同一性を記録するあらゆる形式で表すことができる。
【0110】
「エベルニノマイシン特異的核酸コード」という語は、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244のヌクレオチド配列、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の断片、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244に相同的なヌクレオチド配列、又は配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の断片に相同的なヌクレオチド配列、及び前記全配列の相補配列を含む。該断片には、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の、少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個のヌクレオチドを連続状態で含む、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の部分が含まれる。該断片は新規断片であることが好ましい。配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の相同配列及び断片とは、これらの配列に対して、少なくとも99%、98%、97%、96%、95%、90%、80%、75%、又は70%の相同性を有する配列のことである。相同性の測定は、デフォルトパラメータを用いたBLASTN及びTBLASTXをはじめとする、ここに記載したコンピュータプログラム及びパラメータのいずれを用いて行ってもよい。相同配列には、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の核酸コード中のチミンがウリジンに置換されているRNA配列も含まれる。相同配列は、ここに記載したどの手順を用いて得てもよく、また、シーケンシングエラー訂正の結果として生じる場合もある。当然のことながら、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の核酸コードは、G、A、T及びCがデオキシリボ核酸(DNA)配列のグアニン、アデニン、チミン及びシトシン塩基をそれぞれ表し、G、A、U及びCがリボ核酸(RNA)配列のグアニン、アデニン、ウラシル及びシトシン塩基をそれぞれ表す、従来の1文字表記形式(Stryer, Biochemistry, 3rd edition, W. H. Freeman & Co., New Yorkの裏表紙の見返し部分を参照のこと)、又は、配列中のヌクレオチドの同一性を記録するあらゆる形式で表すことができる。
【0111】
「アビラマイシン特異的核酸コード」という語は、配列番号246、248、250、252、254、256、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列のヌクレオチド配列;配列番号246、248、250、252、254、256、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列の断片;配列番号246、248、250、252、254、256、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列に相同的なヌクレオチド配列、又は配列番号246、248、250、252、254、256、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列の断片に相同的なヌクレオチド配列、及び前記全配列の相補配列を含む。該断片には、配列番号246、248、250、252、254、256、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列の、少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個のヌクレオチドを連続状態で含む、配列番号246、248、250、252、254、256、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列の部分が含まれる。該断片は新規断片であることが好ましい。配列番号246、248、250、252、254、256、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列の相同配列及び断片とは、これらの配列に対して、少なくとも99%、98%、97%、96%、95%、90%、80%、75%、又は70%の相同性を有する配列のことである。相同性の測定は、デフォルトパラメータを用いたBLASTN及びTBLASTXをはじめとする、ここに記載したコンピュータプログラム及びパラメータのいずれを用いて行ってもよい。相同配列には、配列番号246、248、250、252、254、256、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、AAK83175に対応する核酸配列の核酸コード中のチミンがウリジンに置換されているRNA配列も含まれる。相同配列は、ここに記載したどの手順を用いて得てもよく、また、シーケンシングエラー訂正の結果として生じる場合もある。当然のことながら、配列番号246、248、250、252、254、256、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、AAK83175に対応する核酸配列の核酸コードは、G、A、T及びCがデオキシリボ核酸(DNA)配列のグアニン、アデニン、チミン及びシトシン塩基をそれぞれ表し、G、A、U及びCがリボ核酸(RNA)配列のグアニン、アデニン、ウラシル及びシトシン塩基をそれぞれ表す、従来の1文字表記形式(Stryer, Biochemistry, 3rd edition, W. H. Freeman & Co., New Yorkの裏表紙の見返し部分を参照のこと)、又は、配列中のヌクレオチドの同一性を記録するあらゆる形式で表すことができる。
【0112】
「オルトソマイシン特異的ポリペプチドコード」という語には、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208のcDNAにコードされる配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチド配列、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドに相同性を示すポリペプチド配列、又は前記配列の断片が含まれる。相同ポリペプチド配列とは、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチド配列のいずれかに対して、少なくとも99%、98%、97%、96%、95%、90%、85%、80%、75%、又は70%の相同性を有するポリペプチド配列のことである。ポリペプチド配列の相同性の測定は、デフォルトパラメータ又はユーザー指定パラメータを用いたBLASTPバージョン2.2.2をはじめとする、ここに記載したコンピュータプログラム及びパラメータのいずれを用いて行ってもよい。相同配列は、ここに記載したどの手順を用いて得てもよく、また、シーケンシングエラー訂正の結果として生じる場合もある。ポリペプチド断片は、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのうち、少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のポリペプチドを連続状態で含んでいる。該断片は新規断片であることが好ましい。当然のことながら、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドコードは、従来の1文字表記形式又は3文字表記形式(Stryer, Biochemistry, 3rd edition, W. H. Freeman & Co., New Yorkの裏表紙の見返し部分を参照のこと)、又は、配列中のポリペプチドの同一性に関するあらゆる形式で表すことができる。
【0113】
「エベルニノマイシン特異的ポリペプチドコード」という語には、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244及び244のcDNAにコードされる配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241及び243のポリペプチド配列、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241及び243のポリペプチドに相同性を示すポリペプチド配列、又は前記配列の断片が含まれる。相同ポリペプチド配列とは、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241及び243のポリペプチド配列のいずれかに対して、少なくとも99%、98%、97%、96%、95%、90%、85%、80%、75%、又は70%の相同性を有するポリペプチド配列のことである。ポリペプチド配列の相同性は、デフォルトパラメータ又はユーザー指定パラメータを用いたBLASTPバージョン2.2.2をはじめとする、ここに記載したコンピュータプログラム及びパラメータのいずれを用いて測定してもよい。相同配列は、ここに記載したどの手順を用いて得てもよく、また、シーケンシングエラー訂正の結果として生じる場合もある。ポリペプチド断片は、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241及び243のポリペプチドのうち、少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のポリペプチドを連続状態で含んでいる。該断片は新規断片であることが好ましい。当然のことながら、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241及び243のポリペプチドコードは、従来の1文字表記形式又は3文字表記形式(Stryer, Biochemistry, 3rd edition, W. H. Freeman & Co., New Yorkの裏表紙の見返し部分を参照のこと)、又は、配列中のポリペプチドの同一性に関するあらゆる形式で表すことができる。
【0114】
「アビラマイシン特異的ポリペプチドコード」という語には、(配列番号246、248、250、252、254、256のcDNAにコードされる)配列番号245、247、249、251、253、255のポリペプチド配列、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171及びAAK83175のポリペプチド配列、配列番号245、247、249、251、253、255、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171及びAAK83175のポリペプチドに相同性を示すポリペプチド配列、又は前記配列の断片が含まれる。相同ポリペプチド配列とは、配列番号245、247、249、251、253、255のポリペプチド配列のいずれか、又はGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171及びAAK83175のポリペプチドに対して、少なくとも99%、98%、97%、96%、95%、90%、85%、80%、75%、又は70%の相同性を有するポリペプチド配列のことである。ポリペプチド配列の相同性は、デフォルトパラメータ又はユーザー指定パラメータを用いたBLASTPバージョン2.2.2をはじめとする、ここに記載したコンピュータプログラム及びパラメータのいずれを用いて測定してもよい。相同配列は、ここに記載したどの手順を用いて得てもよく、また、シーケンシングエラー訂正の結果として生じる場合もある。ポリペプチド断片は、配列番号245、247、249、251、253、255のポリペプチド、又はGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171及びAAK83175のポリペプチドのうち、少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のポリペプチドを連続状態で含んでいる。該断片は新規断片であることが好ましい。当然のことながら、配列番号245、247、249、251、253、255、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171及びAAK83175のポリペプチドのポリペプチドコードは、従来の1文字表記形式又は3文字表記形式(Stryer, Biochemistry, 3rd edition, W. H. Freeman & Co., New Yorkの裏表紙の見返し部分を参照のこと)、又は、配列中のポリペプチドの同一性に関するあらゆる形式で表すことができる。
【0115】
わかりやすくするために、オルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コード、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、アビラマイシン特異的ポリペプチドコード、又はそれらの一部を「参照配列」と総称する場合がある。
【0116】
当業者であれば容易にわかることだが、参照配列は、コンピュータによる読み取り及びアクセスが可能ないかなる媒体においても、保存、記録、及び操作が可能である。ここで使用する「記録した」及び「保存した」という語は、コンピュータ媒体に情報を保存する処理のことである。熟練者であれば、現時点で周知の、コンピュータ読み取り可能な媒体への情報の記録方法を容易に適用して、1つ以上のオルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コード、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、及びアビラマイシン特異的ポリペプチドコードを含む製品を作製することができる。
【0117】
コンピュータ読み取り可能な媒体としては、磁気的に読み取りが可能な媒体、光学的に読み取りが可能な媒体、電子的に読み取りが可能な媒体、及び磁気/光学的媒体が挙げられる。例えば、該コンピュータ読み取り可能な媒体が、ハードディスク、フロッピーディスク、磁気テープ、CD−ROM、デジタル多用途ディスク(DVD)、ランダムアクセスメモリ(RAM)、又はリードオンリーメモリ(ROM)、及び当業者に周知の他の種類の媒体であってもよい。
【0118】
さまざまなフォーマットのさまざまなデータプロセッサプログラムにおいて、オルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コード、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、アビラマイシン特異的ポリペプチドコードの保存及び操作を行ってもよい。例えば、オルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コード、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、アビラマイシン特異的ポリペプチドコード、核酸コードを、DB2又はORACLEなど当業者が精通している各種データベースプログラム中の、MicrosoftWORD又はWORDPERFECTなどのワードプロセッシングファイルにテキストやASCIIとして保存してもよい。また、配列の比較や同定を行う手段として、又は、オルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コード、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、アビラマイシン特異的ポリペプチドコードと比較するためのクエリーヌクレオチド配列又はクエリーポリペプチド配列の供給源として、多くのコンピュータプログラム及びデータベースを用いてもよい。
【0119】
下記のリストは、本発明を制限することではなく、本発明のオルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コード、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、アビラマイシン特異的ポリペプチドコードに有用なプログラム及びデータベースへの指針を提供することを目的とするものである。使用してもよいプログラム及びデータベースとしては、MacPattern(EMBL社製)、DiscoveryBase(Molecular Applications Group社製)、GeneMine(Molecular Applications Group社製)、Look(Molecular Applications Group社製)、MacLook(Molecular Applications Group社製)、BLAST及びBLAST2(NCBI社製)、BLASTN及びBLASTX(Altschul et al., J. Mol. Biol. 215: 403 (1990))、FASTA(Person and Lipman, Proc. Nalt. Acad. Sci. USA, 85: 2444(1998))、FASTDB(Brutlag et al. Comp. App. Biosci. 6-237-245, 1990)、Catalyst(Molecular Simulations Inc.社製)、Catalyst/SHAPE(Molecular Simulations Inc.社製)、Cerius2. DBAccess(Molecular Simulations Inc.社製)、HypoGen(Molecular Simulations Inc.社製)、Insight II(Molecular Simulations Inc.社製)、Discover(Molecular Simulations Inc.社製)、CHARMm(Molecular Simulations Inc.社製)、Felix(Molecular Simulations Inc.社製)、DelPhi(Molecular Simulations Inc.社製)、QuanteMM(Molecular Simulations Inc.社製)、Homology(Molecular Simulations Inc.社製)、Modeler(Molecular Simulations Inc.社製)、ISIS(Molecular Simulations Inc.社製)、Quanta/Protein Design(Molecular Simulations Inc.社製)、WetLab(Molecular Simulations Inc.社製)、WetLab Diversity Explorer(Molecular Simulations Inc.社製)、Gene Explorer(Molecular Simulations Inc.社製)、SeqFold(Molecular Simulations Inc.社製)、MDL利用可能化学品ディレクトリーデータベース、MDL薬剤データレポートデータベース、総合的医薬品化学データベース、Derwents'世界薬剤インデックスデータベース、BioByteMasterFileデータベース、Genbankデータベース、Gensyqnデータベースなどが挙げられるが、これらに限定されるものではない。本開示内容を入手した当業者であれば、この他にも多くのプログラム及びデータベースがあることがわかるであろう。
【0120】
本発明の実施形態は、システム、特に、ここに記載した配列情報を保存し操作するコンピュータシステムを含むものである。ここで使用する「コンピュータシステム」という語は、ハードウェアコンポーネント、ソフトウェアコンポーネント、及び参照配列の分析に使用するデータ保存コンポーネントを指す。
【0121】
かかるコンピュータシステムが、処理装置、データを保存するための1つ以上の内部データ保存コンポーネント、及び該データ保存コンポーネントに保存されたデータを取り出すための1つ以上のデータ取り出し装置を含む多目的システムであることが好ましい。現在利用可能なコンピュータシステムであればすべて好適であることは、熟練者であれば容易にわかることである。
【0122】
コンピュータシステムの一例を図4に示す。図4のコンピュータシステムには、中央システムバス116に接続された多数のコンポーネントが含まれている。そうしたコンポーネントとしては、内蔵キャッシュメモリ118と外部キャッシュメモリ120を備えた中央処理装置118、システムメモリ122、モニター100に接続したディスプレイアダプタ102、ネットワークインターフェイスとも称するネットワークアダプタ126、内蔵モデム124、サウンドアダプタ128、キーボード140及びマウス138、又はトラックボール若しくはタブレットなど他の適切な入力装置を接続してもよいIOコントローラ132、及び外部プリンター134、及び/又は、かなり多数の外部装置が挙げられる。かかる外部装置には、外部モデム、テープ保存ドライブ、又はディスクドライブなどがあるが、それらに限定されるものではない。図4に示されたすべてのコンポーネントが本発明を実施する際に必要であるわけではないこと、同様に、図4に示されていない他のコンポーネントが、本発明に用いるために考えられたコンピュータシステム中に存在している場合があることは、当業者であれば容易にわかることである。
【0123】
1つ以上のホストバスアダプタ114を、システムバス116に接続してもよい。1つ以上のディスクドライブ112(着脱可能式又は固定式)、フロッピードライブ110、テープドライブ108、デジタル多用途ディスクDVDドライブ106、及びコンパクトディスクCD−ROMドライブ104など1つ以上の保存ドライブを、ホストバスアダプタ114に任意に接続してもよい。読み取り専用モード、及び/又は読み取り書き込みモードで、かかる保存装置を操作してもよい。DVD106又はCD−ROM104など光学的な保存装置は、読み取り専用モードで使用されるのがより一般的であり、固定式ディスクドライブ112は、読み取り書き込みモードで操作される傾向にある。個々のディスクドライブ112よりも大きな大型データセットを格納しているコンピュータシステムもあり、その場合は専用のソフトウェアを使えば、多数のディスクからデータへのアクセスが可能になる。そのようなソフトウェアの例としては、Sun Microsystems社製のSolstice Disk Suite、又は、Sun Microsystems社製のRAID (redundant array of inexpensive disks) Managerが挙げられるが、これらに限定されるものではない。かかるコンピュータシステムは筐体又はケースに入れられていてもよい。かかるコンピュータシステムは、多数の中央処理装置118又は多数のメモリバンク122を任意に含んでいてもよい。
【0124】
図1の矢印142は、コンピュータシステムの内蔵コンポーネントの相互接続を示すものである。かかる矢印は説明のみを目的としており、実際の接続アーキテクチャを特定するものではない。メーカーによっては、1つ以上の中央処理装置をCPU/メモリボードに接続し、その後それをシステムバスに接続する場合がある。
【0125】
参照配列へのアクセス及び処理を行うためのソフトウェア(配列比較ソフトウェア、分析ソフトウェア、及び検索ツール、アノテーションツール、モデリングツールなど)は、実行中は、メインメモリ122に存在している。
【0126】
好ましい実施形態においては、かかるコンピュータシステムは、コンピュータ読み取り可能な媒体に保存されたクエリー配列の核酸コードと、同じくコンピュータ読み取り可能な媒体に保存された、オルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コードから選択されるサブジェクト配列とを比較する配列比較ソフトウェア、又はコンピュータ読み取り可能な媒体に保存されたクエリー配列のポリペプチドコードと、同じくコンピュータ読み取り可能な媒体に保存された、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、アビラマイシン特異的ポリペプチドコードから選択されるサブジェクト配列とを比較する配列比較ソフトウェアをさらに含んでいる。「配列比較ソフトウェア」は、コンピュータシステムに搭載され、ヌクレオチド配列を、データ保存手段内に保存された他のヌクレオチド配列と比較する、1つ以上のプログラムを指す。配列比較ソフトウェアの設計の一例を図2に示す。
【0127】
配列比較ソフトウェアは1つ以上の特定のコンパレータアルゴリズムを利用しているのが一般的である。当該分野で周知の各種配列コンパレータアルゴリズムを用いて、タンパク質及び/又は核酸配列類似性を評価してもよい。そうしたアルゴリズム及びプログラムとしては、TBLASTN、BLASTN、BLASTP、FASTA、TFASTA、CLUSTAL、HMMER、MAST、又は当業者には周知のその他の適切なアルゴリズムが挙げられるが、これらに限定されるものではない(Pearson and Lipman, 1988, Proc. Natl. Acad. Sci. USA 85 (8): 2444-2448; Altschul et al, 1990, J. Mol. Biol. 215 (3): 403-410; Thompson et al., 1994, Nucleic Acids Res. 22 (2): 4673-4680; Higgins et al., 1996, Methods Enzymol. 266: 383-402; Altschul et al, 1990, J. Mol. Biol. 215 (3): 403-410; Altschul et al., 1993, Nature Genetics 3: 266-272; Eddy S. R., Bioinformatics 14: 755-763, 1998; Bailey TL et al., J Steroid Biochem Mol Biol 1997 May; 62 (1): 29-44)。コンパレータアルゴリズムの一例を図3に示す。本明細書で確認した配列コンパレータアルゴリズムは、本発明のこの態様で使用するために特別に考えられたものである。
【0128】
配列比較ソフトウェアは1つ以上の特定のアナライザアルゴリズムを利用しているのが一般的である。アナライザアルゴリズムの一例を図4に示す。適切なアナライザアルゴリズムを用いて、コンパレータアルゴリズムにより測定されたクエリー/サブジェクト対の間の類似性を評価することができる。また、コンテキスト特定ルールに基づいて、サブジェクトのアノテーションをクエリーに割り当ててもよい。熟練者であれば、適切なアナライザアルゴリズム及び適切なコンテキスト依存規則の選択を容易に判断することができる。本明細書中の他の部分で確認したアナライザアルゴリズムは、本発明のこの態様での使用を目的として特別に考えたものである。
【0129】
図2は、クエリー配列とサブジェクト配列を比較する配列比較ソフトウェアの一例のフローチャートである。参照配列からサブジェクト配列を選択してもよく、その場合、ヌクレオチド配列、ポリペプチド配列又は他の形で表される1つの遺伝子又は一組の遺伝子と、本発明のオルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コード、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、アビラマイシン特異的ポリペプチドコードとの間に有意な類似性があるかどうかを、該ソフトウェアが判断することになる。C又はC++プログラミング言語、Java、Perl又は当業者に周知の他の適切なプログラミング言語で該ソフトウェアを実行してもよい。
【0130】
図2に関しては、データベース208にアクセスしている又はテキストファイル206を開いているユーザーからの入力210により、該プログラムによるクエリー配列へのアクセスを行ってもよい。「クエリー開始プロセス」により、クエリー配列へのアクセス及びクエリー配列のコンピュータメモリ122への取りこみ、又はディスクドライブ112若しくはクエリー配列アレイ216の形式の他の保存装置に保存されたプログラムによる管理が可能になる。クエリーアレイ216は、1つ以上のクエリーヌクレオチド又はポリペプチド配列であり、適切な識別子を伴うものである。データベース226にアクセスしている又はテキストファイル224を開いているユーザーからの入力228により、プログラムがデータセットにアクセスする。図2の「サブジェクトデータソース初期化プロセス」とは、それによって、オルトソマイシン特異的核酸コード、エベルニノマイシン特異的核酸コード、アビラマイシン特異的核酸コード、オルトソマイシン特異的ポリペプチドコード、エベルニノマイシン特異的ポリペプチドコード、アビラマイシン特異的ポリペプチドコードから選択した1つ以上の配列を含む参照データセットがコンピュータメモリ122に取りこまれる方法、又はディスクドライブ112若しくはサブジェクトアレイ234の形式の他の保存装置に保存されたプログラムの管理下に置かれる方法を示す。サブジェクトアレイ234は、1つ以上のサブジェクトヌクレオチド又はポリペプチド配列であり、適切な識別子を伴うものである。
【0131】
図2の「比較サブプロセス」とは、クエリー配列アレイ216のクエリー要素とサブジェクトアレイ234のサブジェクト要素とを2つ一組で比較するソフトウェアによりコンパレータアルゴリズム238が呼び出されるプロセスである。図2の「コンパレータアルゴリズム」とは、それぞれのアレイ216、234からのクエリー及びサブジェクトを2つ一組で比較することである。コンパレータアルゴリズム238は、クエリー/サブジェクト対に作用するものであればどのようなアルゴリズムでもよく、BLAST、Smith Waterman、Fastaなどの相同アルゴリズム、HMMERなどのMarkovモデルのような統計的表示/確率的アルゴリズム、又は当業者に周知の他の適切なアルゴリズムが例示できるが、これらに限定されるものではない。適切なアルゴリズムは一般に、クエリー/サブジェクト対の入力を要求し、スコア(クエリーとサブジェクトとの間の類似性表示)を返してくる。通常このプロセスには、BLASTで使用されるKarlin Altschul統計、Malkovモデルで使用されるForward又はViterbiアルゴリズムなどの適切な統計方法、又は当業者に周知の他の適切な統計が用いられる。
【0132】
図2の配列比較ソフトウェアには、コンパレータアルゴリズム238により2つ一組で比較した結果を分析する手段も含まれている。図2の「分析サブプロセス」とは、該ソフトウェアによりアナライザアルゴリズム244が呼び出されるプロセスである。「アナライザアルゴリズム」とは、コード化されてプログラムとなったコンテキスト依存規則、又は実行時間中に動的にロードされたコンテキスト依存規則にしたがってコンパレータアルゴリズム238が測定したクエリー/サブジェクト類似性に基づき、サブジェクトのアノテーションがクエリーに割り当てられるプロセスである。コンテキスト依存規則とは、比較というコンテキストを与えられたクエリーにサブジェクトのアノテーションを割り当てることが可能かどうかを判断するために用いるものである。こうした規則によって該ソフトウェアは、コンパレータアルゴリズム238が出した結果の全体的意味を適切なものにすることができる。
【0133】
1つの実施形態においては、コンパレータアルゴリズム238は、オルトソマイシン遺伝子座を代表するものと考えられる一連のクエリー配列について、該一連のクエリー配列が、下記の(1)〜(17)からなる群のうち、2つの群に由来するポリペプチドの核酸配列コードに対応する参照配列に対して統計的類似性を示すクエリー配列を少なくとも1つ含んでいるかどうかを判断しなくてはならない、とコンテキスト依存規則により指示される場合がある。(1)配列番号51、Genbankアクセッション番号AAK83192、配列番号53、配列番号55、及び配列番号51、53、55、又はGenbankアクセッション番号AAK83192の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(2)配列番号57、Genbankアクセッション番号AAK83170、配列番号59、配列番号61、及び配列番号57、59、61、又はGenbankアクセッション番号AAK83170の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(3)配列番号63、Genbankアクセッション番号AAK83193、配列番号65、配列番号67、及び配列番号63、65、67、又はGenbankアクセッション番号AAK83193の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(4)配列番号69、配列番号71、配列番号73、及び配列番号69、71、又は73の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(5)配列番号99、Genbankアクセッション番号AAK83184、配列番号101、配列番号103、及び配列番号99、101、103、又はGenbankアクセッション番号AAK83184の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(6)配列番号105、Genbankアクセッション番号AAK83186、配列番号107、配列番号109、及び配列番号105、107、109、又はGenbankアクセッション番号AAK83186の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(7)配列番号111、Genbankアクセッション番号AAK83188、配列番号113、配列番号115、及び配列番号111、113、115、又はGenbankアクセッション番号AAK83188の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(8)配列番号127、Genbankアクセッション番号AAG32067、配列番号129、配列番号131、及び配列番号127、129、131、又はGenbankアクセッション番号AAG32067の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(9)配列番号123、Genbankアクセッション番号AAG32066、配列番号125、及び配列番号123、125、又はGenbankアクセッション番号AAG32066の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(10)配列番号153、Genbankアクセッション番号AAK83187、配列番号155、配列番号157、及び配列番号153、155、157、又はGenbankアクセッション番号AAK83187の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(11)配列番号159、配列番号161、配列番号163、及び配列番号159、161、又は163の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(12)配列番号167、配列番号173、Genbankアクセッション番号AAK83181、配列番号169、及び配列番号167、169、173、又はGenbankアクセッション番号AAK83181の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(13)配列番号175、配列番号177、配列番号179、及び配列番号175、177、又は179の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(14)配列番号165、配列番号171、配列番号169、及び配列番号165、169、又は171の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(15)配列番号193、Genbankアクセッション番号AAK83189、配列番号195、配列番号197、及び配列番号193、195、197、又はGenbankアクセッション番号AAK83189の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(16)配列番号199、Genbankアクセッション番号AAK83174、配列番号201、及び配列番号199、201、又はGenbankアクセッション番号AAK83174の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;及び(17)配列番号203、配列番号205、配列番号207、及び配列番号203、205、又は207の配列を有するポリペプチドに対して少なくとも70%の相同性を有するポリペプチド。もちろん、好ましいコンテキスト依存規則が、オルトソマイシン生合成遺伝子又はオルトソマイシン産生生物を同定するための種々さまざまな基準点を、本発明の範囲から逸脱することなく特定する場合もある。好ましい基準点として考えられているものに、一連のクエリー配列のうち少なくとも1つのクエリー配列が、上記オルトソマイシン生合成遺伝子に特徴的な17群のポリペプチドのうち3、4、5、6、7、8、10、又はそれ以上のポリペプチドに対応する核酸コードに対して統計的類似性を示す点が挙げられる。他の好ましいコンテキスト依存規則は、各群に必要とされる相同性の程度を、1つ以上の参照配列について、70%、75%、80%、85%、90%、95%、又は98%に設定する。
【0134】
別の実施形態においては、コンパレータアルゴリズム238は、エベルニノマイシン型オルトソマイシンを代表するものと考えられる一連のクエリー配列について、そのうちの少なくとも1つが、下記の(1)〜(9)からなる群のうち、1つの群に由来するポリペプチドの核酸配列コードに対応する参照配列に対して統計的類似性を示すクエリー配列であるかどうかを判断しなくてはならない、とコンテキスト依存規則により指示される場合がある。(1)配列番号209、配列番号211、及び配列番号209又は配列番号211のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(2)配列番号213、配列番号215、及び配列番号213又は配列番号215のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(3)配列番号217、配列番号219、及び配列番号217又は配列番号219のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(4)配列番号221、配列番号223、及び配列番号221又は配列番号223のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(5)配列番号225、配列番号227、及び配列番号225又は配列番号227のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(6)配列番号229、配列番号231、及び配列番号229又は配列番号231のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(7)配列番号233、配列番号235、及び配列番号233又は配列番号235のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(8)配列番号237、配列番号239、及び配列番号237又は配列番号239のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;及び(9)配列番号241、配列番号243、及び配列番号241又は配列番号243のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド。もちろん、好ましいコンテキスト依存規則が、エベルニノマイシン型オルトソマイシン生合成遺伝子又はエベルニノマイシン型オルトソマイシン産生生物を同定するための種々さまざまな基準点を、本発明の範囲から逸脱することなく特定する場合もある。好ましい基準点として考えられているものに、一連のクエリー配列のうち少なくとも1つのクエリー配列が、上記エベルニノマイシン型オルトソマイシン生合成遺伝子に特徴的な9群のポリペプチドのうち2、3、4、5、6、7、8、又は9群のポリペプチドに対応する核酸コードに対して統計的類似性を示す点が挙げられる。さらに好ましい実施形態においては、該一連のクエリー配列は、エベルニノマイシン生合成遺伝子クラスターに特徴的な9群のポリペプチドのうち2、3、4、5、6、7、8、又は9群のポリペプチドに対応する核酸コードに対して統計的類似性を示す少なくとも1つのクエリー配列、及び上記オルトソマイシン生合成遺伝子に特徴的な17群のポリペプチドのうち、3、4、5、6、7、8、10、又はそれ以上のポリペプチドに対応する核酸コードに対して統計的類似性を示す、一連のクエリー配列中の少なくとも1つのクエリー配列を含んでいてもよい。他の好ましいコンテキスト依存は、各群に必要とされる相同性の程度を、1つ以上の参照配列について、70%、75%、80%、85%、90%、95%、又は98%に設定する。
【0135】
別の実施形態においては、コンパレータアルゴリズム238は、アビラマイシン型オルトソマイシン遺伝子座を代表するものと考えられる一連のクエリー配列について、該一連のクエリー配列が、下記の(1)〜(6)からなる群のうち、1つの群に由来するポリペプチドの核酸配列コードに対応する参照配列に対して統計的類似性を示すクエリー配列を少なくとも1つ含んでいるかどうかを判断しなくてはならない、とコンテキスト依存規則により指示される場合がある。(1)配列番号245、Genbankアクセッション番号AAG32068、及び配列番号245又はGenbankアクセッション番号AAG32068のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(2)配列番号247、Genbankアクセッション番号AAK83183、及び配列番号247又はGenbankアクセッション番号AAK83183のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(3)配列番号249、Genbankアクセッション番号AAG32069、及び配列番号249又はGenbankアクセッション番号AAG32069のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(4)配列番号251、Genbankアクセッション番号AAK83172、及び配列番号251又はGenbankアクセッション番号AAK83172のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(5)配列番号253、Genbankアクセッション番号AAK83171、及び配列番号253又はGenbankアクセッション番号AAK83171のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド;(6)配列番号255、Genbankアクセッション番号AAK83175、及び配列番号255又はGenbankアクセッション番号AAK83175のポリペプチドに対して少なくとも70%の相同性を有するポリペプチド。もちろん、好ましいコンテキスト依存規則が、アビラマイシン型オルトソマイシン生合成遺伝子又はアビラマイシン型オルトソマイシン産生生物を同定するための種々さまざまな基準点を、本発明の範囲から逸脱することなく特定する場合もある。好ましい基準点として考えられているものに、一連のクエリー配列のうち少なくとも1つのクエリー配列が、上記アビラマイシン型オルトソマイシン生合成遺伝子に特徴的な群のポリペプチドのうち2、3、4、5、又は6群のポリペプチドに対応する核酸コードに対して統計的類似性を示す点が挙げられる。さらに好ましい実施形態においては、該一連のクエリー配列は、アビラマイシン型生合成遺伝子クラスターに特徴的な2、3、4、5、又は6群のポリペプチドに対応する核酸コードに対して統計的類似性を示す少なくとも1つのクエリー配列、及び上記オルトソマイシン生合成遺伝子に特徴的な17群のポリペプチドのうち、3、4、5、6、7、8、10、又はそれ以上のポリペプチドに対応する核酸コードに対して統計的類似性を示す、一連のクエリー配列中の少なくとも1つのクエリー配列を含んでいてもよい。他の好ましいコンテキスト依存規則は、各群に必要とされる相同性の程度を、1つ以上の参照配列に対して、70%、75%、80%、85%、90%、95%、又は98%に設定する。
【0136】
このように、分析サブプロセスを、他のどのようなコンテキスト依存規則と併用してもよく、また、別の実施形態に適合させるために採用してもよい。アナライザアルゴリズム244の主な機能は、コンテキスト依存規則に基づき、意味又は診断を1つのクエリー又は一連のクエリーに割り当てることである。かかるコンテキスト依存規則はアプリケーション特異的であり、アナライザアルゴリズム244の全体的役割を変えずに、コンテキスト依存規則が変更される場合がある。
【0137】
最後に、図2の配列比較ソフトウェアには、コンパレータアルゴリズム238による比較の結果、及びアナライザアルゴリズム244による分析結果を、その比較を要求したユーザー又はプロセスに返す手段が含まれている。図2の「ディスプレイ/レポートサブプロセス」とは、コンパレータアルゴリズム238による比較の結果、及びアナライザアルゴリズム244による分析結果を、その比較を要求したユーザー又はプロセスに返すプロセスのことである。結果240、246をファイル252に書き込み、コンソール、カスタム・グラフィカル・インターフェース、ウェブ・インターフェース、若しくは他の適切な実装時固有インターフェースなどのユーザー・インターフェースに表示してもよく、又は、リレーショナルデータベース若しくは他の適切な実装時固有データベースなどのデータベースにアップロードしてもよい。
【0138】
その比較を要求したユーザー又はプロセスに結果を一旦返してしまうと、かかるプログラムは終了する。
【0139】
図2の配列比較ソフトウェアの原理は、クエリーの受領又はロードを行い、参照データセットの受領又はロードを行った後、コンパレータアルゴリズム238によって2つ一組での比較を行い、その後アナライザアルゴリズム244を用いて結果を評価して、クエリーが参照配列に対して有意な類似性を有しているかどうかの判断に達し、最終的にユーザー又は呼び出しているプログラム若しくはプロセスに結果を返すということである。
【0140】
図3は、2つの配列がホモログであるかどうかを判断するコンパレータアルゴリズム238のコンピュータ内プロセスの1つの実施形態を示すフローチャートである。かかるコンパレータアルゴリズムは、比較用のクエリー/サブジェクト対を受け取り、適切な比較を行い、相同性の程度を計算して、かかる対とともに返す。
【0141】
図3については、シーケンス304の冒頭で比較が開始されている。306で(x)個の文字の照合を試みているが、この(x)はユーザーが指定した数字である。一致物が見つからない場合は、サブジェクトについてポリペプチド1個分だけクエリー配列を316に進ませ、クエリーの最後が318に到達しない場合は、306で(x)個の文字について別の照合を試みる。一致物がまったく見つからない場合は、クエリー全体を、サブジェクトの開始位置を越えてさらに前進させ、クエリーの最後が318に到達すると、サブジェクトポインターがポリペプチド1個分だけ前進し、クエリーポインターが、クエリー318の冒頭に設定される。サブジェクトの最後が到達し、それでも一致物が見つからない場合は、ヌル相同性結果スコア(null homology result score)が324で割り当てられ、アルゴリズムが、一対の配列をヌルスコアとともに呼び出しプロセス又はプログラムへ返す。その後、アルゴリズムは326を終了する。308で一致物が見つかった場合、照合した領域の拡大が310で試みられ、一致物は312で統計的に分析される。かかる拡大は一方向性でも双方向性でもよい。アルゴリズムは閉回路内で照合した領域の拡大と相同性スコアの計算を継続し、ポリペプチド側鎖の化学的特性を考えればすべての不一致物が同じであるとは限らないことを考慮して、不一致物にペナルティーを与える。例えば、ともに塩基性側鎖を有するリジンとアルギニンとの不一致には、酸性側鎖を有するリジンとグルタミン酸との間の不一致よりも少ないペナルティーが与えられる。蓄積したペナルティーが、ユーザーにより指定されたある値を一旦越えた場合、又はいずれかの配列の最後が312に一旦到達した場合、拡大閉回路はストップする。最大スコアを314で保存し、316でサブジェクトについてポリペプチド1個分だけクエリー配列を進ませ、クエリーの最後が318に到達しない場合は、306で(x)個の文字について別の照合を試みる。クエリーの全長に対する一致物が存在するかどうかをサブジェクトの全長について評価するまで、かかるプロセスは続く。かかるアルゴリズムによって個々のスコア及びアラインメントを314で保存し、全体スコアを324で計算し、保存する。アルゴリズムは、一対の配列を局所的スコア及び全体的スコアとともに呼び出しプロセス又はプログラムへ返す。その後アルゴリズムは326で終了する。
【0142】
コンパレータアルゴリズム238アルゴリズムは、下記のとおり擬似コードで表してもよい。
【0143】
Figure 2004532021
【0144】
ヌクレオチド配列に使用するために、コンパレータアルゴリズム238を書いてもよい。その場合は、スコアを計算し、ヌクレオチドの化学特性に基づいてペナルティーを適用するために、採点計画を実施する。コンパレータアルゴリズム238は、ヌクレオチド又はポリペプチド配列の採点方法における格差の存在も考慮している場合がある。
【0145】
BLASTは、コンパレータアルゴリズム238の一実施手段である。HMMERは、Markovモデル分析に基づくコンパレータアルゴリズム238の別の実施手段である。HMMERという実施手段においては、クエリー配列は、配列相同性を利用するのではなく、サブジェクト配列を表す数学モデルと比較される。
【0146】
図4はオルトソマイシン生合成遺伝子座、エベルニノマイシン型オルトソマイシン生合成遺伝子座、又はアビラマイシン型オルトソマイシン生合成遺伝子座の有無を検出するアナライザアルゴリズム244のプロセスを図示するフローチャートである。図4のアナライザアルゴリズムを、コンパレータアルゴリズム238で測定した類似性に基づいて、及び、コード化されてプログラムとなったコンテキスト依存規則、又は実行時間中に動的にロードされたコンテキスト依存規則にしたがって、サブジェクトのアノテーションをクエリーに割り当てるプロセスに用いてもよい。コンテキスト依存規則とは、比較というコンテキストを与えられたクエリーにサブジェクトのアノテーションを割り当てることが可能かどうかを判断するものである。コンテキスト依存規則は、一致した対を評価するプロセスで受け入れられる類似性の程度と質を判断する基準点を設定する。
【0147】
アナライザアルゴリズム244は、コンパレータアルゴリズム238により組み合わされたアレイ状の対をインプットとして受け取る。そうしたアレイは、少なくともクエリー識別子、サブジェクト識別子、及びそれらの類似性測定における関連値で構成されている。一群のクエリー配列がアビラマイシン型オルトソマイシン生合成遺伝子クラスターに特徴的な配列を含んでいるかどうかを判断するため、データソースにアクセスし、アビラマイシン特異的核酸コード及びアビラマイシン特異的ポリペプチドコードに関するアビラマイシン特異的情報を取り出すことにより、参照又は診断アレイ406を作製する。診断アレイ406は、少なくともサブジェクト識別子及びそれらの関連アノテーションで構成されている。アビラマイシン型生合成遺伝子クラスターに特徴的な9個のタンパク質ファミリー、すなわち、ABCD、DEPN、MEMD、REBU、UNAI及びUNBRへの言及が、アノテーションに含まれていてもよい。遺伝子座における特異的構造分類の排他的存在に関する情報、又は、例えば以前コンピュータで算出した、モチーフのデータベースなど他のデータベースとの一致物が、アノテーションに含まれていてもよい。一旦、アルゴリズムによって、2つの必要なアレイ402と406の構築又は受理が首尾良く行われ、メモリにいずれかのコンテキスト依存規則が保有されると、コンパレータアルゴリズム238が判断したように、一致した対のそれぞれに対する評価が可能になる。該アルゴリズムは、一致した対のそれぞれに対して408での評価を行い、コンテキスト依存規則に基づいて、410で一致物が有効かどうかを確認する、又は確認しない。410で一致物の確認がうまくいった場合は、サブジェクトのアノテーションがクエリーに割り当てられる。それぞれの比較の結果は412で保存される。閉回路は、クエリー/サブジェクトアレイの最後が到達したときに終了する。アビラマイシン特異的核酸コード及びアビラマイシン特異的ポリペプチドコードについての、すべてのクエリー/サブジェクト対の評価が終わると、ORFのクエリーのセットがアビラマイシン遺伝子座であるかどうかを416で最終的に判断することができる。
【0148】
次いで該アルゴリズムは、呼び出し中のプログラム又はプロセスに、全体的な診断及び特徴づけを行ったクエリー/サブジェクト対のアレイを裏付けとなる証拠とともに返し、その後418で終了する。
【0149】
異なる診断アレイ及びコンテキスト依存規則を動的にロードするように、アナライザアルゴリズム244の設定を行ってもよい。例えば、クエリー/サブジェクト対と、エベルニノマイシン特異的核酸コード又はエベルニノマイシン特異的ポリペプチドコードなどの他の生合成経路に特徴的なサブジェクト、又は一連のアノテーション済サブジェクトとの比較に用いてもよい。
【0150】
これより本発明を下記の実施例によりさらに詳しく説明するが、本発明がそれら実施例に制限されるものではないことは、承知されてしかるべきである。
【実施例1】
【0151】
Micromonospora carbonacea var. aurantiacaにおけるエベルニノマイシン生合成遺伝子座の同定
61604、イリノイ州、ピオリア、ユニヴァーシティーストリート、1815Nに所在の米国農務省農業研究サービスカルチャーコレクションより、微生物Micromonospora carbonacea var. aurantiacaNRRL2997を入手した。NRRL2997株が産生するエベルニノマイシン化合物は、米国特許第3,499,078号に記載されている。カナダ国特許出願番号第2,352,451号に記載の方法にしたがい、エベルニノマイシンの生合成遺伝子座を、NRRL2997株から同定した(EVER)。エベルニノマイシンの生合成遺伝子座まで及ぶオーバーラップゲノムインサートを含むコスミドから得た配列を同定した。コスミドインサートの配列内部で、既知のタンパク質に対して相同性を有するポリペプチドをコードする多数のORFを同定した。デフォルトパラメータを用いたBLASTPのバージョン2.2.2というプログラムで相同性を測定した。EVERの隣接ヌクレオチド配列及び推定アミノ酸配列が提供されている。EVERは3つの隣接DNA配列(配列番号280、281、及び282)で形成されており、それらの配列はEVER内で見られるように、DNAcontig1(配列番号280)の3’末端がDNAcontig2(配列番号281)の5’末端に、DNAcontig2(配列番号281)の5’末端が、DNAcontig3(配列番号282)の5’末端に隣接するように配置されている。EVERに存在するORFは50のポリペプチドをコードしており、その配列は、下記のとおり提供されている。ORF1のアミノ酸配列(配列番号263)は、contig1(配列番号280)から引用した配列番号264の核酸配列から推定したものである。ORF2のアミノ酸配列(配列番号89)は、contig1(配列番号280)から引用した配列番号90の核酸配列から推定したものである。ORF3のアミノ酸配列(配列番号225)は、contig1(配列番号280)から引用した配列番号226の核酸配列から推定したものである。ORF4のアミノ酸配列(配列番号237)は、contig1(配列番号280)から引用した配列番号238の核酸配列から推定したものである。ORF5のアミノ酸配列(配列番号113)は、contig1(配列番号280)から引用した配列番号114の核酸配列から推定したものである。ORF6のアミノ酸配列(配列番号119)は、contig1(配列番号280)から引用した配列番号120の核酸配列から推定したものである。ORF7のアミノ酸配列(配列番号49)は、contig1(配列番号280)から引用した配列番号50の核酸配列から推定したものである。ORF8のアミノ酸配列(配列番号65)は、contig1(配列番号280)から引用した配列番号66の核酸配列から推定したものである。ORF9のアミノ酸配列(配列番号201)は、contig1(配列番号280)から引用した配列番号202の核酸配列から推定したものである。ORF10のアミノ酸配列(配列番号15)は、contig1(配列番号280)から引用した配列番号16の核酸配列から推定したものである。ORF11のアミノ酸配列(配列番号95)は、contig1(配列番号280)から引用した配列番号96の核酸配列から推定したものである。ORF12のアミノ酸配列(配列番号71)は、contig1(配列番号280)から引用した配列番号72の核酸配列から推定したものである。ORF13のアミノ酸配列(配列番号125)は、contig1(配列番号280)から引用した配列番号126の核酸配列から推定したものである。ORF14のアミノ酸配列(配列番号83)は、contig1(配列番号280)から引用した配列番号84の核酸配列から推定したものである。ORF15のアミノ酸配列(配列番号101)は、contig1(配列番号280)から引用した配列番号102の核酸配列から推定したものである。ORF16のアミノ酸配列(配列番号47)は、contig1(配列番号280)から引用した配列番号48の核酸配列から推定したものである。ORF17のアミノ酸配列(配列番号195)は、contig1(配列番号280)から引用した配列番号196の核酸配列から推定したものである。ORF18のアミノ酸配列(配列番号155)は、contig1(配列番号280)から引用した配列番号156の核酸配列から推定したものである。ORF19のアミノ酸配列(配列番号107)は、contig1(配列番号280)から引用した配列番号108の核酸配列から推定したものである。ORF20のアミノ酸配列(配列番号77)は、contig1(配列番号280)から引用した配列番号78の核酸配列から推定したものである。ORF21のアミノ酸配列(配列番号221)は、contig1(配列番号280)から引用した配列番号222の核酸配列から推定したものである。ORF22のアミノ酸配列(配列番号151)は、contig1(配列番号280)から引用した配列番号152の核酸配列から推定したものである。ORF23のアミノ酸配列(配列番号143)は、contig1(配列番号280)から引用した配列番号144の核酸配列から推定したものである。ORF24のアミノ酸配列(配列番号53)は、contig1(配列番号280)から引用した配列番号54の核酸配列から推定したものである。ORF25のアミノ酸配列(配列番号205)は、contig1(配列番号280)から引用した配列番号206の核酸配列から推定したものである。ORF26のアミノ酸配列(配列番号161)は、contig1(配列番号280)から引用した配列番号162の核酸配列から推定したものである。ORF27のアミノ酸配列(配列番号257)は、contig1(配列番号280)から引用した配列番号258の核酸配列から推定したものである。ORF28のアミノ酸配列(配列番号135)は、contig1(配列番号280)から引用した配列番号136の核酸配列から推定したものである。ORF29のアミノ酸配列(配列番号3)は、contig1(配列番号280)から引用した配列番号4の核酸配列から推定したものである。ORF30のアミノ酸配列(配列番号35)は、contig1(配列番号280)から引用した配列番号36の核酸配列から推定したものである。ORF31のアミノ酸配列(配列番号169)は、contig1(配列番号280)から引用した配列番号170の核酸配列から推定したものである。ORF32のアミノ酸配列(配列番号183)は、contig1(配列番号280)から引用した配列番号184の核酸配列から推定したものである。ORF33のアミノ酸配列(配列番号177)は、contig1(配列番号280)から引用した配列番号178の核酸配列から推定したものである。ORF34のアミノ酸配列(配列番号29)は、contig1(配列番号280)から引用した配列番号30の核酸配列から推定したものである。ORF35のアミノ酸配列(配列番号59)は、contig1(配列番号280)から引用した配列番号60の核酸配列から推定したものである。ORF36のアミノ酸配列(配列番号189)は、contig1(配列番号280)から引用した配列番号190の核酸配列から推定したものである。ORF37のアミノ酸配列(配列番号141)は、contig1(配列番号280)から引用した配列番号142の核酸配列から推定したものである。ORF38のアミノ酸配列(配列番号41)は、contig1(配列番号280)から引用した配列番号42の核酸配列から推定したものである。ORF39のアミノ酸配列(配列番号9)は、contig1(配列番号280)から引用した配列番号10の核酸配列から推定したものである。ORF40のアミノ酸配列(配列番号129)は、contig1(配列番号280)から引用した配列番号130の核酸配列から推定したものである。表II−Bに示したように、ここに提供されたORF41の配列は、ギャップを含んでいる。ORF41、C末端のアミノ酸配列(配列番号23)は、contig1(配列番号280)から引用した配列番号24の核酸配列から推定したものである。ORF41、N末端のアミノ酸配列(配列番号21)は、contig2(配列番号281)から引用した配列番号22の核酸配列から推定したものである。ORF42、C末端のアミノ酸配列(配列番号233)は、contig3(配列番号282)から引用した配列番号234の核酸配列から推定したものである。ORF43のアミノ酸配列(配列番号209)は、contig3(配列番号282)から引用した配列番号210の核酸配列から推定したものである。ORF44のアミノ酸配列(配列番号229)は、contig3(配列番号282)から引用した配列番号230の核酸配列から推定したものである。ORF45のアミノ酸配列(配列番号217)は、contig3(配列番号282)から引用した配列番号218の核酸配列から推定したものである。ORF46のアミノ酸配列(配列番号213)は、contig3(配列番号282)から引用した配列番号214の核酸配列から推定したものである。ORF47のアミノ酸配列(配列番号241)は、contig3(配列番号282)から引用した配列番号242の核酸配列から推定したものである。ORF48(配列番号259)のアミノ酸配列は、contig3(配列番号282)から引用した配列番号260の核酸配列から推定したものである。ORF49(配列番号267)のアミノ酸配列は、contig3(配列番号282)から引用した配列番号268の核酸配列から推定したものである。ORF50(配列番号261)のアミノ酸配列は、contig3(配列番号282)から引用した配列番号262の核酸配列から推定したものである。
【0152】
EVER中のORFには、表II−Aに示したように、既知のタンパク質との相同性に基づいて、推定される機能及びタンパク質ファミリー名が割り当てられている。配列番号280、281、及び282における各EVER ORFの位置、長さ、及び配向を、表II−Bにて提供している。
【0153】
【表II−A1】
Figure 2004532021
【表II−A2】
Figure 2004532021
【表II−A3】
Figure 2004532021
【表II−A4】
Figure 2004532021
【表II−A5】
Figure 2004532021
【表II−A6】
Figure 2004532021
【表II−A7】
Figure 2004532021
【0154】
【表II−B】
Figure 2004532021
【実施例2】
【0155】
Streptomyces mobaraensis由来アビラマイシン型化合物の生合成遺伝子座の同定
微生物Streptomyces mobaraensisNRRL B−3729株を、米国農務省農業研究サービスカルチャーコレクションより入手した。以前に、Streptomyces mobaraensisがアビラマイシン型化合物又はオルトソマイシン全般を産生すると報告されたことはなかった。カナダ国特許出願番号第2,352,451号に記載の方法を用いて、Streptomyces mobaraensisにおけるアビラマイシン型化合物の生合成遺伝子座(AVIA)を同定した。エベルニノマイシンの遺伝子座まで及ぶオーバーラップゲノムインサートを含むコスミドから得た配列を同定した。コスミドインサートの配列内部で、既知のタンパク質に対して相同性を有するポリペプチドをコードする多数のORFを同定した。デフォルトパラメータを用いたBLASTPのバージョン2.2.2というプログラムで相同性を測定した。AVIAにまで及ぶ隣接ヌクレオチド配列及びAVIAの推定アミノ酸配列は、下記のとおり提供されている。ORF1のアミノ酸配列(配列番号123)は、contig1(配列番号277)から引用した配列番号124の核酸配列から推定したものである。ORF2のアミノ酸配列(配列番号203)は、contig1(配列番号277)から引用した配列番号204の核酸配列から推定したものである。ORF3のアミノ酸配列(配列番号127)は、contig1(配列番号277)から引用した配列番号128の核酸配列から推定したものである。ORF4のアミノ酸配列(配列番号19)は、contig1(配列番号277)から引用した配列番号20の核酸配列から推定したものである。ORF5のアミノ酸配列(配列番号57)は、contig1(配列番号277)から引用した配列番号58の核酸配列から推定したものである。ORF6のアミノ酸配列(配列番号253)は、contig1(配列番号277)から引用した配列番号254の核酸配列から推定したものである。ORF7のアミノ酸配列(配列番号251)は、contig1(配列番号277)から引用した配列番号252の核酸配列から推定したものである。ORF8のアミノ酸配列(配列番号187)は、contig1(配列番号277)から引用した配列番号188の核酸配列から推定したものである。ORF9のアミノ酸配列(配列番号199)は、contig1(配列番号277)から引用した配列番号200の核酸配列から推定したものである。ORF10のアミノ酸配列(配列番号255)は、contig1(配列番号277)から引用した配列番号256の核酸配列から推定したものである。ORF11のアミノ酸配列(配列番号117)は、contig1(配列番号277)から引用した配列番号118の核酸配列から推定したものである。ORF12のアミノ酸配列(配列番号87)は、contig1(配列番号277)から引用した配列番号88の核酸配列から推定したものである。ORF13のアミノ酸配列(配列番号81)は、contig1(配列番号277)から引用した配列番号82の核酸配列から推定したものである。ORF14のアミノ酸配列(配列番号181)は、contig1(配列番号277)から引用した配列番号182の核酸配列から推定したものである。ORF15のアミノ酸配列(配列番号133)は、contig1(配列番号277)から引用した配列番号134の核酸配列から推定したものである。ORF16のアミノ酸配列(配列番号1)は、contig1(配列番号277)から引用した配列番号2の核酸配列から推定したものである。ORF17のアミノ酸配列(配列番号33)は、contig1(配列番号277)から引用した配列番号34の核酸配列から推定したものである。ORF18のアミノ酸配列(配列番号165)は、contig1(配列番号277)から引用した配列番号166の核酸配列から推定したものである。ORF19のアミノ酸配列(配列番号167)は、contig1(配列番号277)から引用した配列番号168の核酸配列から推定したものである。ORF20のアミノ酸配列(配列番号45)は、contig1(配列番号277)から引用した配列番号46の核酸配列から推定したものである。ORF21のアミノ酸配列(配列番号247)は、contig1(配列番号277)から引用した配列番号248の核酸配列から推定したものである。ORF22のアミノ酸配列(配列番号99)は、contig1(配列番号277)から引用した配列番号100の核酸配列から推定したものである。ORF23のアミノ酸配列(配列番号105)は、contig1(配列番号277)から引用した配列番号106の核酸配列から推定したものである。ORF24のアミノ酸配列(配列番号153)は、contig1(配列番号277)から引用した配列番号154の核酸配列から推定したものである。ORF25のアミノ酸配列(配列番号111)は、contig1(配列番号277)から引用した配列番号112の核酸配列から推定したものである。ORF26のアミノ酸配列(配列番号193)は、contig1(配列番号277)から引用した配列番号194の核酸配列から推定したものである。ORF27のアミノ酸配列(配列番号245)は、contig1(配列番号277)から引用した配列番号246の核酸配列から推定したものである。ORF28のアミノ酸配列(配列番号249)は、contig1(配列番号277)から引用した配列番号250の核酸配列から推定したものである。ORF29のアミノ酸配列(配列番号149)は、contig1(配列番号277)から引用した配列番号150の核酸配列から推定したものである。ORF30のアミノ酸配列(配列番号145)は、contig1(配列番号277)から引用した配列番号146の核酸配列から推定したものである。ORF31のアミノ酸配列(配列番号51)は、contig1(配列番号277)から引用した配列番号52の核酸配列から推定したものである。ORF32のアミノ酸配列(配列番号63)は、contig1(配列番号277)から引用した配列番号64の核酸配列から推定したものである。ORF33のアミノ酸配列(配列番号159)は、contig1(配列番号277)から引用した配列番号160の核酸配列から推定したものである。ORF34のアミノ酸配列(配列番号175)は、contig1(配列番号277)から引用した配列番号176の核酸配列から推定したものである。ORF35のアミノ酸配列(配列番号27)は、contig1(配列番号277)から引用した配列番号28の核酸配列から推定したものである。ORF36のアミノ酸配列(配列番号75)は、contig1(配列番号277)から引用した配列番号76の核酸配列から推定したものである。ORF37のアミノ酸配列(配列番号69)は、contig1(配列番号277)から引用した配列番号70の核酸配列から推定したものである。ORF38のアミノ酸配列(配列番号93)は、contig1(配列番号277)から引用した配列番号94の核酸配列から推定したものである。ORF39のアミノ酸配列(配列番号7)は、contig1(配列番号277)から引用した配列番号8の核酸配列から推定したものである。ORF40のアミノ酸配列(配列番号39)は、contig1(配列番号277)から引用した配列番号40の核酸配列から推定したものである。ORF41のアミノ酸配列(配列番号139)は、contig1(配列番号277)から引用した配列番号140の核酸配列から推定したものである。ORF42のアミノ酸配列(配列番号13)は、contig1(配列番号277)から引用した配列番号14の核酸配列から推定したものである。AVIA中のORFには、表III−Aに示したように、既知のタンパク質との相同性に基づいて、推定される機能及びタンパク質ファミリー名が割り当てられている。配列番号277における各AVIA ORFの位置、長さ、及び配向を、表III−Bにて提供している。
【0156】
【表III−A−1】
Figure 2004532021
【表III−A−2】
Figure 2004532021
【表III−A−3】
Figure 2004532021
【表III−A−4】
Figure 2004532021
【表III−A−5】
Figure 2004532021
【表III−A−6】
Figure 2004532021
【0157】
【表III−B】
Figure 2004532021
AVIAを、Streptomyces viridochromogenesTu57のアビラマイシンA遺伝子座(ここではAVILと称する)、GenbankヌクレオチドアクセッションAF333038と比較した(Weitnauer et al. 2001 Chemistry and Biology Vol. 8, pp. 569-581)。図5は、AVIA及びAVILにおける相同的なORFの存在及び配向を示すものである。図1の上部にあるスケールの単位は、キロ塩基対である。黒い矢印は、AVIA及びAVILにおける個々のORFの相対的な位置を表し、矢頭は各ORFの配向を示し、対応する4文字のファミリー名が各ORFの右側に示されている。2つの遺伝子座の間にある白い矢印は、相対的順序及び配向が2つの遺伝子座間で同一のORFを多数含むセグメントを明示するためのものである。AVIA中のORFの順序及び配向は、オキシドレダクターゼのOXRFファミリーメンバーと命名された、AVIL遺伝子座の中央部分にある1個のORFを除いて、AVIL中のものと全く同一である。AVIL中でOXRFと命名されたORFに対応するものは、(「X」と示されているように)AVIA遺伝子座中には存在しない。AVIL中のORFで、4文字表記法による名称に下線が引かれたものは、GenbankヌクレオチドアクセッションAF333038のStreptomyces viridochromogenesTu57アビラマイシンA生合成遺伝子クラスターでは開示されていない。本発明の組成物及び方法を用いて、本発明者らは、AVIL遺伝子座の3’末端の付加的なORFを同定した。HOXG及びUNKUと命名されたと考えられるタンパク質に対応するAVIL中のORFの配列は、フレームシフトにより崩壊したと思われる。これらのフレームシフトが、ORFの実際の混乱(失活すること)を反映しているのか、又は配列決定におけるエラーによるものなのかは、明らかではない。本発明者らは、以前に3個の小型ORF(UNIQと命名された)が報告されていた領域において、AVILのUNKU ORFの部分を検出した。AVILのUNKU ORFに相当する領域に多数のフレームシフトが存在することが、結果的に、違う鎖に基づく、3個のUNIQ ORFに関する以前の報告をもたらしたと思われる。
【実施例3】
【0158】
オルトソマイシン生合成遺伝子座を示す遺伝子
オルトソマイシン遺伝子座のある種の遺伝子は、オルトソマイシンオリゴ糖のすべての種類に共通で、かつ、オルトソマイシン生合成遺伝子座を示す構造的特徴と関連している。表IVは、4つのオルトソマイシン遺伝子座、すなわち、EVER(実施例1に記載)、AVIA(実施例2に記載)、EVEA(実施例10に記載)、及びAVIL(Weitnauer et al. 2001 Chemistry and Biology Vol. 8, pp. 569-581に記載)における、タンパク質ファミリーとそれぞれのORF番号を列挙したものである。表IVの各列は、1つのタンパク質ファミリーに関するものであり、それぞれの遺伝子座で、そのタンパク質ファミリーのメンバーと思われるORFを同定している。タンパク質ファミリーの同定は、4文字表記法で行われている(表I参照)。このように、ある特定のタンパク質ファミリーのメンバーが、EVEA、EVER、AVIA及びAVILのうちの1つ以上で見つかった場合、それらのメンバーは同じ列に列挙されている。遺伝子座AVILにおける、##、###というシンボル、及び小文字でのファミリー名は、GenbankヌクレオチドアクセッションAF333038のStreptomyces viridochromogenesTu57アビラマイシンA遺伝子座では開示されていないものの、本発明の組成物及び方法を用いて、現在同定されているこれらのORFを特定するものである。EVER及びEVEAは、エベルニノマイシン型オルトソマイシンの例であり、一方、AVIA及びAVILは、アビラマイシン型オルトソマイシンの例である。
【0159】
これら4つのオルトソマイシン生合成遺伝子座のタンパク質ファミリーを、その分布に基づいて5つのグループに分類することができる。i)オルトソマイシン遺伝子座に共通して認められるが、非オルトソマイシン遺伝子座でも認められ、そのためオルトソマイシン特異的ではないと思われる17個のファミリー、ii)大半のオルトソマイシン遺伝子座に共通して認められ、これより詳述するように、オルトソマイシンに特徴的と思われる17個のファミリー、iii)実施例5に詳述するように、特にグループ(ii)のタンパク質ファミリーメンバーとともに認められる場合に、アビラマイシン型オルトソマイシン遺伝子座に特徴的な6個のファミリー、iv)実施例4に詳述するように、特にグループ(ii)のタンパク質ファミリーメンバーとともに認められる場合に、エベルニノマイシン型オルトソマイシン遺伝子座に特徴的と思われる9個のファミリー、及びv)4つのオルトソマイシン遺伝子座のすべてに存在しているわけではなく、及び/又は、オルトソマイシン遺伝子座に固有ではない12個の種々雑多なファミリー(AVIL遺伝子座において「UNIQ」と命名されているものを除く)のグループである。本発明の組成物及び方法を使用すると、Weitnauer et al. 2001 Chemistry and Biology Vol. 8, pp. 569-581に開示されている、鎖の、AVIL ORF2、3及び4の反対側の領域が、UNKUタンパク質ファミリーのAVIAメンバーに相同性を示す。したがって、Weitnauer et al.に開示されているAVIL ORF2、3及び4は、正確さに欠ける概念的翻訳と思われ、表IVではUNIQと命名されている。
【0160】
【表IV−1】
Figure 2004532021
【表IV−2】
Figure 2004532021
【0161】
表IVのグループ(ii)は、オルトソマイシン遺伝子座に特徴的と思われる17個のタンパク質ファミリー、すなわち、GTFE、GTFG、GTFH、HOXG、MTFD、MTFE、MTFF、MTLA、OXRV、OXRW、OXRW、UNAJ、PHOD、UEVA、UNKU、UEVB、及びMTIAである。かかる17個のタンパク質ファミリーにはOXRWと命名された2個のファミリーが含まれているが、EVERにおいては、OXRWタンパク質のうちの1個がUNAJタンパク質ファミリーメンバーと融合しているため、OXRXと命名されている。そのため、EVERにはOXRWの独立したメンバーが1つ含まれており、UNAJの独立したメンバーは含まれていない。UEVB及びMTIAファミリーは、EVEA遺伝子座には存在していないが、その他の3つのオルトソマイシン遺伝子座において認められること、及び、これまでに既知のホモログが記載されていないことから、オルトソマイシン遺伝子座に特徴的と思われている。オルトソマイシン遺伝子座に特徴的と思われる17個のタンパク質ファミリーとは、オルトソマイシン以外の化合物の生合成に当然関与しているホモログが存在しない、及び/又は、オルトソマイシン生合成遺伝子座以外の状況でホモログが存在しないファミリーのことである。しかし、オルトソマイシン生合成遺伝子座は、オルトソマイシン遺伝子座に特徴的と思われる17個のタンパク質ファミリーの各メンバーをかならずしも含むわけではないと予想されている。
【0162】
次に述べる、オルトソマイシン生合成遺伝子座に特徴的と思われる17個のタンパク質ファミリーの各メンバーは、EVEA、EVER、AVIA及びAVILにて同定されている。GTFE(AVIA ORF31、配列番号51、AVILアクセッション番号AAK83192、EVER ORF24、配列番号53、EVEA ORF33、配列番号55)、GTFG(AVIA ORF5、配列番号57、AVILアクセッション番号AAK83170、EVER ORF35、配列番号59、EVEA ORF27、配列番号61)、GTFH(AVIA ORF32、配列番号63、AVILアクセッション番号AAK83193、EVER ORF8、配列番号65、EVEA ORF31、配列番号67)、HOXG(AVIA ORF37、配列番号69、EVER ORF12、配列番号71、EVEA ORF43、配列番号73)、MTFD(AVIA ORF22、配列番号99、AVILアクセッション番号AAK83184、EVER ORF15、配列番号101、EVEA ORF8、配列番号103)、MTFE(AVIA ORF23、配列番号105、AVILアクセッション番号AAK83186、EVER ORF19、配列番号107、EVEA ORF10、配列番号109)、MTFF(AVIA ORF25、配列番号111、AVILアクセッション番号AAK83188、EVER ORF5、配列番号113、EVEA ORF12、配列番号115)、MTLA(AVIA ORF3、配列番号127、AVILアクセッション番号AAG32067、EVER ORF40、配列番号129、EVEA ORF45、配列番号131)、MTIA(AVIA ORF1、配列番号123、AVILアクセッション番号AAG32066、EVER ORF13、配列番号125)、OXRV(AVIA ORF24、配列番号153、AVILアクセッション番号AAK83187、EVER ORF18、配列番号155、EVEA ORF11、配列番号157)、OXRW(AVIA ORF33、配列番号159、EVER ORF26、配列番号161、EVEA ORF30、配列番号163)、OXRW(AVIA ORF19、配列番号167、EVEA ORF6、配列番号173、AVILアクセッション番号AAK83181)、EVERにおいては、OXRWファミリーの2番目のメンバーはUNAJファミリー由来のタンパク質と融合しており、その結合ポリペプチドは、OXRX(EVER ORF31、配列番号169)、PHOD(AVIA ORF34、配列番号175、EVER ORF33、配列番号177、EVEA ORF29、配列番号179)、UNAJ(AVIA ORF18、配列番号165、EVEA ORF5、配列番号171)と命名されている。EVERにおいては、UNAJタンパク質はOXRWファミリーの二番目のメンバーと融合しており、その結合ポリペプチドは、OXRX(EVER ORF31、配列番号169)、UEVA(AVIA ORF26、配列番号193、AVILアクセッション番号AAK83189、EVER ORF17、配列番号195、EVEA ORF14、配列番号197)、UEVB(AVIA ORF9、配列番号199、AVILアクセッション番号AAK83174、EVER ORF9、配列番号201)、及びUNKU(AVIA ORF2、配列番号203、EVER ORF25、配列番号205、EVEA ORF32、配列番号207)と命名されている。
【0163】
オルトソマイシン遺伝子座に特徴的な17個のファミリーのそれぞれに属する4個のオルトソマイシン遺伝子座由来のホモログを、BLASTで比較した。アミノ酸配列の相同性及び類似性のパーセントを、表Vから表XXまでの16の表に示す。表Vから表XXにおける値は、2つ一組のブラスト2配列についての%相同性(%類似性)として表されている。n/aとは、UNAJ及びOXRWが非相同ORFであるため比較不可能であったことを示す。XXXとは、ファミリーのホモログがその遺伝子座に存在しないことを示す。アスタリスクつきのAVIL ORFは、(図10に示すように)公的に利用可能なアビラマイシン遺伝子座のヌクレオチド配列に存在しているが、Genbankタンパク質データベースに提出されていないものである。そのようなORFについて列挙されている相同性の値は、デフォルト設定及びクエリーとして対応するAVIAホモログを使用したtblastnにより、入手したものである。「図を参照」とは、おそらくは公的に利用可能な配列内のフレームシフトによって分割されたアビラマイシンORFを指す。下記の対応するTBLASTNアラインメントを参照のこと。
【0164】
【表V】
Figure 2004532021
【0165】
【表VI】
Figure 2004532021
【0166】
【表VII】
Figure 2004532021
【0167】
【表VIII】
Figure 2004532021
【0168】
【表IX】
Figure 2004532021
【0169】
【表X】
Figure 2004532021
【0170】
【表XI】
Figure 2004532021
【0171】
【表XII】
Figure 2004532021
【0172】
【表XIII】
Figure 2004532021
【0173】
【表XIV】
Figure 2004532021
【0174】
【表XV】
Figure 2004532021
【0175】
【表XVI】
Figure 2004532021
【0176】
【表XVII】
Figure 2004532021
【0177】
【表XVIII】
Figure 2004532021
【0178】
【表XIX】
Figure 2004532021
【0179】
【表XX】
Figure 2004532021
すべてのオルトソマイシン生合成遺伝子座に認められるタンパク質ファミリーの存在により、オルトソマイシン化合物を定義する構造要素の形成については、特定の作用機構又は生合成図式に限定されることなく説明することができる。図2は、アセチルCoA由来ジクロロイソエベルニン酸の生合成の一図式を示す。図2の図式において、KASA酵素(推定ケトアシルシンターゼ)は、アセチルCoAをPKSO(推定オルセリン酸シンターゼ)上にロードするプライミング酵素である。MFTA(芳香族O−メチルトランスフェラーゼに類似)はオルセリン酸をメチル化し、HOXM(非ヘムヒドロキシラーゼ/ハロゲナーゼに類似)はイソエベルニン酸を塩素化する。すべてのオルトソマイシン遺伝子座に存在する他のタンパク質ファミリーのメンバーも、オルトソマイシンのジクロロイソエベルニン酸部分の生合成に関与している場合がある。
【0180】
図7は、いずれも鉄アルファケトグルタル酸依存性酵素に対して配列類似性を有している2つのOXRW及び1つのOXRVによるオルトエステル形成についての2つの図式(A及びB)を示している。図式Aは、酸化的C−Oカップリング反応に先だつグリコシルトランスフェラーゼ酵素の作用の関与がない点で、図式Bと異なっている。同様の酸化的C−Oカップリング反応は、クラバミン酸(clavaminic acid)シンターゼなどの他の鉄アルファケトグルタル酸依存性酵素において観察されている(Salowe SP, Marsh EN, Townsend, CA, Biochemistry 29 (27): 6499-6508)。すべてのオルトソマイシン遺伝子座に存在する他のタンパク質ファミリーのメンバーも、オルトソマイシンのオルトエステル結合の形成に関与している場合がある。
【実施例4】
【0181】
エベルニノマイシン型オルトソマイシン生合成遺伝子座に特異的な遺伝子
DATC、DEPF、EPIM、GTFA、MTFG、MTFV、OXBN、OXCO及びUNBBタンパク質ファミリー(表IVのグループ(iv))は、特に、9個のタンパク質ファミリーのうち、少なくとも1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個、より好ましくは5個、もっとも好ましくは6個以上のメンバーが、表IVのグループ(ii)に列挙された17個のオルトソマイシン特異的タンパク質ファミリーのうち、1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個、より好ましくは6個、もっとも好ましくは8個以上のメンバーとともに見つかる場合には、エベルニノマイシン型オルトソマイシン生合成遺伝子座及びエベルニノマイシン型オルトソマイシン産生株に特徴的であると考えられる。DATC、DEPF、EPIM、GTFA、MTFV、OXBN、及びOXCOは、密接な関係にある物質がオルトソマイシン生合成とは無関係の二次代謝に関わっているため、エベルニノマイシン型オルトソマイシン生合成遺伝子座に固有であるとはいえない。MTFG及びUNBBとは、エベルニノマイシン型オルトソマイシン以外の化合物の生合成に当然関与しているホモログが存在しない、及び/又は、エベルニノマイシン型オルトソマイシン生合成遺伝子座以外の状況でホモログが存在しないため、エベルニノマイシン型オルトソマイシン遺伝子座に固有と考えられている2個のファミリーのことである。エベルニノマイシン型オルトソマイシン生合成遺伝子座は、エベルニノマイシン型オルトソマイシン遺伝子座に特徴的と思われる9個のタンパク質ファミリーのメンバーをかならずしも含むわけではないと予想されている。
【0182】
エベルニノマイシン型オルトソマイシン遺伝子座に特徴的で、EVER及びEVEAに存在する9個のタンパク質ファミリーのホモログを、デフォルトパラメータを用いたBlast分析で比較した。アミノ酸配列の相同性及び類似性のパーセントを、表XXIに示す。
【0183】
【表XXI】
Figure 2004532021
エベルニノマイシン型オルトソマイシン生合成遺伝子座に特徴的なタンパク質ファミリーの存在により、エベルニノマイシン化合物を特徴づける構造要素の形成については、特定の機構又は生合成図式に限定されることなく説明することができる。図8は、エベルニノマイシンのニトロ糖残基形成の一経路を示す。図8において、アミン酸化反応は、フラビン依存性モノオキシゲナーゼに対して配列類似性を有するOXBNにより、連続的な触媒作用を受けている。
【実施例5】
【0184】
アビラマイシン型オルトソマイシン生合成遺伝子座に特異的な遺伝子
ABCD、DEPN、MEMD、REBU、UNAI及びUNBRタンパク質ファミリー(表IVのグループ(iii))は、特に、アビラマイシン型オルトソマイシン生合成遺伝子座に特徴的な6個のタンパク質ファミリーのうち、1個、好ましくは2個、さらに好ましくは3個、より好ましくは4個以上のメンバーが、表IVのグループ(ii)に列挙された17個のオルトソマイシン特異的タンパク質ファミリーのうち、1個、好ましくは2個、さらに好ましくは4個、より好ましくは6個、より好ましくは8個、もっとも好ましくは10個以上のメンバーとともに見つかる場合には、アビラマイシン型オルトソマイシンに特徴的であると考えられる。
【0185】
アビラマイシン型オルトソマイシン生合成に特徴的であると考えられる6個のタンパク質ファミリーとは、ABCD(AVIA ORF27、配列番号245、AVILアクセッション番号AAG32068)、DEPN(AVIA ORF21、配列番号247、AVILアクセッション番号AAK83183)、MEMD(AVIA ORF28、配列番号249、AVILアクセッション番号AAG32069)、REBU(AVIA ORF7、配列番号251、AVILアクセッション番号AAK83172)、UNAI(AVIA ORF6、配列番号253、AVILアクセッション番号AAK83171)及びUNBR(AVIA ORF10、配列番号255、AVILアクセッション番号AAK83175)のことである。ABCD、DEPN、MEMD及びUNAIは、それらのタンパク質ファミリーと密接な関係にある物質がオルトソマイシン生合成とは無関係の二次代謝中に存在しているため、アビラマイシン型オルトソマイシン遺伝子座に固有であるとはいえない。REBU及びUNBRメンバーとは、アビラマイシン型オルトソマイシン以外の化合物の生合成に当然関与しているホモログが存在しない、及び/又は、アビラマイシン型オルトソマイシン生合成遺伝子座以外の状況でホモログが存在しないため、アビラマイシン型オルトソマイシン遺伝子座に固有と考えられている2個のファミリーのことである。アビラマイシン型オルトソマイシンは、オルトソマイシン遺伝子座に特徴的と思われる6個のタンパク質ファミリーの各メンバーをかならずしも含むわけではないと予想されている。
【0186】
アビラマイシン型オルトソマイシン遺伝子座に特徴的で、AVIA及びAVILに存在する6個のファミリーのホモログを、Blast分析で比較した。アミノ酸配列の相同性及び類似性のパーセントを、表XXIIに示す。
【0187】
【表XXII】
Figure 2004532021
AVIA及びAVILはいずれも、エベルニノマイシン型遺伝子座では見られない二成分輸送系を含んでいる。AVIA中のABCD及びMEMDタンパク質は、それぞれATP結合性トランスポーター(AviABCI)及び膜貫通型トランスポーター(AviABCII)として記載されている。また、アビラマイシンAに対する耐性をS. viridochromogenesが有しているのは、このタンパク質の関与によるものである(Weitnauer et al., 2001, Antimicrob. Agents Chemother., Vol. 45, pp. 690-695)。高い配列相同性に基づき、AVIAにおける対応物であるORF27(配列番号245)及びORF28(配列番号249)は、類似した機能を発揮すると考えられている。これらのタンパク質は、S. peucetiusのDrrA及びDrrBタンパク質にも類似している。S. peucetiusがダウノルビシン及びドキソルビシンに対する耐性を有しているのは、DrrA及びDrrBタンパク質の関与によるものである。ABCDタンパク質、AviABCIタンパク質及びDrrAタンパク質は、哺乳類腫瘍細胞のmdr遺伝子によりコードされるタンパク質に類似している。構造的には無関係の多くの化学療法剤に対してこれらの細胞が耐性を有しているのは、このタンパク質の関与によるものである。ABCDとMEMDは協調して作用を及ぼし、増幅又は過剰発現したmdr遺伝子を含有する哺乳類腫瘍細胞のために作り上げた交互輸送機構に似た機構により、アビラマイシン型オルトソマイシンオリゴ糖類に対する耐性を与える(Guilfoile et al., 1991, Proc. Natl. Acad. Sci. USA, Vol. 88, pp. 8553-8557)。AVIA及びAVILはいずれも、エベルニノマイシン型オルトソマイシン遺伝子座中のデヒドラターゼ/エピメラーゼ酵素とは異なる、「DEPN」と命名されたデヒドラターゼ/エピメラーゼを含んでいる。AVIA及びAVILはいずれも、未知の機能を有する「UNAI」と命名されたORFを含んでいる。これに対するホモログは、少なくとも1個存在しているが、エベルニノマイシン型オルトソマイシン遺伝子座には存在しない。その1個とはStreptomyces coelicolorA3(2)の仮説上のタンパク質SCF55.28cである。
【実施例6】
【0188】
ハイブリダイゼーション又はPCR増幅によるオルトソマイシン遺伝子同定のための診断用核酸配列の設計
オルトソマイシンオリゴ糖生合成遺伝子座に共通する17個のタンパク質ファミリーのうちの3個を使用して、他の生物中のオルトソマイシン生合成遺伝子座の同定を目的としたハイブリダイゼーションプローブ又はPCRプライマーとして用いてもよいオリゴヌクレオチドを設計した。本実施例で使用した3個のタンパク質ファミリーとは、UEVA、UEVB及びHOXGである。UEVA、UEVB及びHOXGタンパク質ファミリーのヌクレオチド配列でEVER由来のもの、すなわちEVER ORF17、9、及び12(それぞれ配列番号195、201及び71)、並びにAVIA由来のもの、すなわちAVIA ORF26、9及び37(それぞれ配列番号193、199及び69)を、BLASTを基盤とした、2個のタンパク質又はヌクレオチド配列を整列させるためのツールである「BLAST2配列」を用いた2つ一組の比較により整列させた(Tatiana et al. 1999 FEMS Microbiol Lett. 174:247-250)。フィルタリング(組成の複雑度(compositional complexity)が低いクエリー配列のセグメントのマスキング)を適用しなかったことを除いて、パラメータはすべてデフォルト設定であった。
【0189】
UEVA、UEVB及びHOXGタンパク質のEVER及びAVIL配列のアラインメントを下記の表XXIII、XXIV、及びXXVにぞれぞれ示す。表XXIIIはUEVAタンパク質ファミリーの核酸アラインメントであり、AVIA ORF26(配列番号193)及びEVER ORF17(配列番号195)を比較している。表XXIVはUEVBタンパク質ファミリーの核酸アラインメントであり、AVIA ORF9(配列番号199)及びEVER ORF9(配列番号201)を比較している。表XXVはHOXGタンパク質ファミリーの核酸アラインメントであり、AVIA ORF37(配列番号69)及びEVER ORF12(配列番号71)を比較している。診断用オリゴヌクレオチドを設計する際の基盤として機能するアラインメントのよく保存されたいくつかの領域を強調して表示している(「センス」方向に配置されたオリゴヌクレオチドを示すのに「>」を用い、「アンチセンス」方向に配置されたオリゴヌクレオチドを示すのに「<」を用いている。「∧」は、同一の配列を一本鎖として有するものの極性が逆転しているため一方の鎖とハイブリダイズできないことからネガティブコントロールとして機能するコントロールオリゴヌクレオチドを示す)。
【0190】
【表XXIII−1】
Figure 2004532021
【表XXIII−2】
Figure 2004532021
【0191】
【表XXIV−1】
Figure 2004532021
【表XXIV−2】
Figure 2004532021
【0192】
【表XXV−1】
Figure 2004532021
【表XXV−2】
Figure 2004532021
下記の表XXVIに列挙したオリゴヌクレオチド配列は、InvitrogenTM社より供給されたものである。必要に応じて、変性オリゴヌクレオチドを設計した。かかる変性オリゴヌクレオチド中、「S」はGとCをほぼ等モル混合してなるオリゴヌクレオチド中の塩基を示し、「R」はGとAをほぼ等モル混合してなるオリゴヌクレオチド中の塩基を示す。実施例7において詳述するように、オルトソマイシン遺伝子を同定するために、かかるオリゴヌクレオチドをハイブリダイゼーションプローブとして用いてもよい。実施例8に記載のとおり、(純粋培養物、混合培養物若しくは環境試料から)単離したDNAに由来するオルトソマイシン遺伝子又は粗細胞集団若しくは環境試料から直接由来するオルトソマイシン遺伝子の部分を増幅するために、かかるオリゴヌクレオチドをPCRプライマーとして用いてもよい。本出願に開示されている各遺伝子ファミリー他のメンバーが同定されているため、当業者であれば、例えば、多数の配列アラインメントを実行することができるClustalなどの適切なツールを使用して、オルトソマイシン遺伝子を同定し単離する診断用オリゴヌクレオチドを改良し改善することは可能であろう(Higgins and Sharp (1988) Gene Vol. 73 pp. 237-244)。
【0193】
【表XXVI】
Figure 2004532021
【実施例7】
【0194】
ハイブリダイゼーションによりオルトソマイシン遺伝子を同定する際の診断用核酸配列の使用
微生物Micromonospora carbonacea var. africanaNRRL15099を米国農務省農業研究サービスカルチャーコレクションより入手した。N−Zアミン寒天培地(水1リットルあたり:10.0gのグルコース、20gの可溶性デンプン、5.0gの酵母エキス、5.0gのN−ZアミンA型(Sigma社製C0626)、1.0gの試薬用CaCO3、15.0gの寒天)中でこの生物を数日間28℃で増殖させた。高分子量のゲノムDNAを単離するため、増殖させたばかりの、ほぼ密集状態になっている3つの100mmペトリ皿の細胞集団を使用した。かかる細胞集団をプラスチック製のスパチュラでそっとすくい取った。STE緩衝液(75mMのNaCl、20mMのTris−HCl、pH8.0、25mMのEDTA)で繰返し洗浄し、残った寒天培地を除去した。確立したプロトコル(Kieser et al., Practical Streptomyces Genetics, The John Innes Foundation, 2000)により、高分子量のDNAを単離し、FIGE MAPPERTM power supply(BIORAD社製)の事前設定プログラムNo.6を用いたフィールドインバージョンゲル電気泳動(FIGE)により、その完全性を実証した。
【0195】
SuperCos-1コスミドベクター(StratageneTM社製)を用いて、Micromonospora carbonacea var. africanaゲノムDNAコスミドライブラリーを調製した。製造者の指示にしたがい、コスミドアームを調製した。製造者から供給された緩衝液中で、DNA100μgあたり約1単位のSau3AI制限酵素(New England Biolabs社製)を使用して、高分子量DNAを37℃で部分的に分解した。さまざまな時点で、分解物の部分標本を新しい微量遠心チューブに移し、最終濃度で10mMのEDTA及び0.1%のSDSを添加してかかる酵素を失活させた。目的とするサイズ範囲(30〜50kb)の重要なDNA断片を含むことがFIGE分析によって判明した部分標本をプールし、フェノール/クロロホルム(1:1 vol:vol)で抽出し、エタノール沈殿によりペレット化した。製造者の説明書にしたがってアルカリホスファターゼ(Roche社製)を用いて、Sau3AI DNA断片の5’末端を37℃で30分間脱リン酸化した。かかるホスファターゼを70℃で10分間熱失活させ、フェノール/クロロホルム(1:1 vol:vol)でDNAを抽出し、エタノール沈殿によりペレット化し、滅菌水に再懸濁した。脱リン酸化したSau3AI DNA断片を、モルにして約4倍を越えるSuperCos-1コスミドアームを含む反応において、室温で一晩SuperCos-1コスミドアームに結合させた。GigapackR III XL パッケージング抽出物(StratageneTM社製)を製造者の説明書にしたがって使用し、結合産物のパッケージングを行った。864個の単離したコスミドクローンからなるライブラリーを選び、LB培養液(水1リットルあたり:10.0gのNaCl、10.0gのトリプトン、5.0gの酵母エキス)を入れた9枚の96ウェルマイクロタイタープレートに移し、一晩増殖させた後、最終濃度で25%のグリセロールを含むように調節した。これらのマイクロタイタープレートを−80℃で保管し、グリセロールの備蓄品とした。二つ組のマイクロタイタープレートをナイロン膜上に下記のように並べた。マイクロタイター上で増殖した培養物を、ペレット化及び少量のLB培養液での再懸濁によって濃縮した。1グリッドあたり96ピンの3×3グリッドをナイロン膜に置いた。完全なコスミドライブラリーであるこれらの膜を、その後LB寒天上で層状とし、37℃で一晩インキュベーションし、コロニーが育つようにした。DNAを変性させるため、事前に0.5NのNaOH/1.5MのNaClに10分間浸しておいた濾紙上で、かかる膜を層状とし、その後、事前に0.5MのTris(pH8)/1.5MのNaClに10分間浸しておいた濾紙上に移して中和した。細胞の残骸をプラスチック製のスパチュラでそっとすくい取り、GS GENE LINKERTM UV Chamber(BIORAD社製)を使用したUV照射により、DNAを膜上に交差結合させた。
【0196】
製造者により供給されたキナーゼ反応緩衝液中に5ピコモルのオリゴヌクレオチドと6.6ピコモルの[γ−P32]ATPを含む15μlの反応液において、T4ポリヌクレオチドキナーゼ(New England Biolabs社製)を使用し、オルトソマイシン特異的ハイブリダイゼーションオリゴヌクレオチドプローブをP32で放射能標識した。最終濃度が5mMになるようにEDTAを添加することにより、1時間後に37℃でキナーゼ反応を終了させた。積分器の機能を内蔵したモデル3ガイガーカウンター(テキサス州、スイートウォーター、Ludlum Measurements Inc.社製)を用いて、放射能標識したオリゴヌクレオチドプローブの特異的作用を評価した。85℃で10分間のインキュベーションに続いて氷中での急速冷却を行うことにより、放射能標識したオリゴヌクレオチドプローブを使用の直前に熱変性させた。
【0197】
ハイブリダイゼーションオーブンを低速振盪で使用し、プレハイブリダイゼーション溶液(6×SSC、20mMのNaH2PO4、5×Denhardt's、0.4%のSDS、超音波処理及び変性処理済の0.1mg/mlのシャケ精子DNA)において、42℃で少なくとも2時間のインキュベーションを行うことにより、コスミドライブラリー膜を調製した。その後、1×106cpm/mlの放射能標識オリゴヌクレオチドプローブを含むハイブリダイゼーション溶液(6×SSC、20mMのNaH2PO4、0.4%のSDS、超音波処理及び変性処理済の0.1mg/mlのシャケ精子DNA)にかかる膜を入れ、ハイブリダイゼーションオーブンを低速振盪で使用し、42℃で一晩のインキュベーションを行った。翌日、ハイブリダイゼーションオーブンを低速振盪で使用して、洗浄緩衝液(6×SSC、0.1%のSDS)でかかる膜を46℃、48℃及び50℃で、45分間ずつ洗浄した。その後、かかる膜をX線フィルムに曝露し、陽性のコスミドクローンの視覚化及び同定を行った。4個の代表的なオルトソマイシン特異的オリゴヌクレオチドプローブを用いて得た結果を表XXVIIに示す。ハイブリダイゼーション実験において陽性であったコスミドクローンを「+」で示している。これらのコスミドにおけるインサートの末端について、T7及びT13ユニバーサルプライマーで配列決定を行ったところ、予想どおり、EVER遺伝子座の配列と相同的な配列を含んでいることがわかった(データは図示せず)。EVER遺伝子座のOXCO遺伝子ファミリーに由来するものも含め、大半のオルトソマイシン特異的オリゴヌクレオチドプローブで検出されている(データは図示せず)ことからコスミドクローンIH01を選び、その配列をさらに分析した。ショットガン法により、このコスミドクローンの完全な配列決定を行った。コスミドクローンFB03及びDH01がIH01配列にオーバーラップし、IH01配列を5’及び3’方向へそれぞれ伸長させていることが判明したため、これら2つのクローンの配列決定も行った。オーバーラップコスミドクローンIH01、FB03及びDH01(ここでは、それぞれ050CB、050CA、及び050CGと称する)の大きさは85キロ塩基対を越え、そのなかにはMicromonospora carbonacea var. africanaのエベルニノマイシン生合成遺伝子座(EVEA)が含まれている。EVEAについては、実施例10でさらに詳しく述べる。
【0198】
【表XXVII】
Figure 2004532021
本発明の診断用プローブの特異性を実証するため、オルトソマイシン生合成遺伝子座を含むことが知られている3つの微生物に由来するコスミドDNAの部分標本50ngをナイロン膜に置き、変性させ、交差結合させ、上記のとおり検査した。15mlの培養物から、アルカリ溶解法(Sambrook et al. 1989 Molecular cloning: a laboratory manual, 2nd edition. Cold Spring Harbour Laboratory, Cold Spring Harbour, NY)にしたがって、コスミドDNAを単離した。この実験に使用したコスミドとしては、Micromonospora carbonacea var. africana由来エベルニノマイシン遺伝子座(EVEA)の050CA、050CB、及び050CG、Micromonospora carbonacea var. aurantiaca由来エベルニノマイシン遺伝子座(EVER)の010CA、010CB、及び010CG、Streptomyces mobaraensis由来アビラマイシン型遺伝子座(AVIA)の017CH、017CP、及び017CPが挙げられる。その他、ネガティブコントロールとして機能するオルトソマイシン遺伝子座とは無関係の、Micromonospora carbonacea var. aurantiacaゲノムDNAコスミドクローンの050CCも挙げられる。8個のオルトソマイシン特異的オリゴヌクレオチドプローブを用いて得た結果を表XXVIIIに示す。ハイブリダイゼーション実験において陽性であったコスミドクローンを「+」で示し、ハイブリダイゼーション実験において陰性であったコスミドクローンを「−」で示している。
【0199】
表XXVIIIにまとめた実験結果は、EVER、EVEA及びAVIAについて入手可能な配列情報と矛盾するものではない。EVERにおけるUEVA、HOXG及びUEVBタンパク質ファミリーのメンバーは、すべて010CAコスミドの内部に含まれている。他の2個の遺伝子座には同じことが当てはまらない。すなわち、EVEA及びAVIAにおけるUEVA、HOXG及びUEVBタンパク質ファミリーのメンバー間の距離は、もっと離れている。4個のUEVAプローブはすべて、EVER、EVEA及びAVIA中の同一のコスミドを常に検出したが、UEVA−S2プローブはEVEAに弱いシグナルを送っていた(表XXVIIIにて括弧で示す)。EVEAにはUEVBホモログが含まれていないため、UEVB−S1プローブは、EVEAコスミドとハイブリダイズしなかった(実施例10参照)。ネガティブコントロールのコスミドDNA、050CCとハイブリダイズするオリゴヌクレオチドプローブは、皆無であった。ネガティブコントロールのオリゴヌクレオチドプローブUEVB−CTL1は、どのコスミドDNAともハイブリダイズしなかった。
【0200】
【表XXVIII】
Figure 2004532021
【実施例8】
【0201】
PCR増幅によりオルトソマイシン遺伝子を同定する際の診断用核酸配列の使用
オルトソマイシン遺伝子及び生合成遺伝子座、及び/又はオルトソマイシン産生生物を同定するため、実施例6に記載のオリゴヌクレオチドをPCRプライマーとして使用してもよい。実施例7に記載したように、Micromonospora carbonacea var. africana及びMicromonospora carbonacea var. aurantiacaからゲノムDNAを調製した。アルカリ溶解法(Sambrook et al. 1989 Molecular cloning: a laboratory manual, 2nd edition. Cold Spring Harbour Laboratory, Cold Spring Harbour, NY)により、010CAコスミドDNAを調製した。ゲノムDNA及びコスミドDNAの部分標本を、1)UEVA−S2及びUEVA−AS1、2)UEVA−S1及びUEVA−AS1、3)UEVA−S2及びUEVA−AS2、及び4)UEVA−S1及びUEVA−AS2という4つのPCRプライマー対を用いたPCR反応における鋳型DNAとして使用した。
【0202】
それぞれのPCR増幅は、製造者より酵素とともに供給された反応緩衝液に、50〜100ナノグラムの鋳型DNA、37.5ピコモルの各プライマー、最終濃度が各0.2mMのdATP、dGTP、dCTP及びdTTP、最終濃度が10%のジメチルスルホキシド、及び2単位のPfu DNAポリメラーゼ(StratageneTM社製)を含む50μlの反応液を入れた中で行った。PCR条件は、最初に96℃で2分間変性させた後、96℃で30秒間の変性、45℃で30秒間のアニーリング、72℃で2.5分間の伸長という増幅サイクルを30サイクル行うというものであった。
【0203】
使用した4つのプライマー対は、オルトソマイシン特異的UEVA遺伝子の部分を増幅すると予想されており、増幅産物の予想サイズが小さい順に列挙されている。これらのオリゴヌクレオチドの相対的な位置は、下記及び図9に示すように、UEVA整列ヌクレオチド配列に記されている。
【0204】
図9は、臭化エチジウムで染色した1%アガロースゲルの図であり、かかるゲルには、PCR反応液の部分標本5μlが電気泳動により溶解している。図の上部に、プライマー対を示してある。数字は、PCR反応においてどの鋳型DNAが使用されたかを示すものである。すなわち、「1」はMicromonospora carbonacea var. africanaゲノムDNAを表し、「2」はMicromonospora carbonacea var. aurantiacaゲノムDNAを表し、「3」はEVER遺伝子座のコスミド010CAを表す。左端のレーンは、1Kb Plus DNA ladder(InvitrogenTM社製)分子量標準物質を含み、標準物質のなかには、塩基対(bp)単位で左方向に標識されているものもある。図9の下部の概略図は、EVER遺伝子座由来UEVA遺伝子の既知のヌクレオチド配列(実施例1に記載)に基づくプライマー対の相対的な位置及びPCR産物の予想サイズ(塩基対単位)を示している。
【0205】
図9については、ゲノムDNAを鋳型として使用したPCR反応により、テストした4個すべてのプライマー対にスメアが生じている。これに対して、精製した010CAコスミドDNAを鋳型として使用したPCR反応では、予想サイズと一致する明確なバンドが出現している。この結果は、使用したPCR条件が、ゲノムDNAからの増幅には最適ではないものの、あまり複雑ではない(less complex)サブクローン化DNA断片には充分であることを示唆している。ゲノムDNA鋳型使用時に生じるスメアは、サーマルサイクルにおけるアニーリング温度が最適ではないこと、高いG/C含有量及びゲノムDNAの複雑さ、標的配列の存在量が比較的少ないこと、及びオリゴヌクレオチドPCRプライマー中の変性した部分が存在することが重なって生じたミスプライミング(すなわち、伸長前のPCRプライマーの不正確なアニーリング)によるものと思われる。
【0206】
(図9のいくつかのレーンで見られるように)正確なプライミングイベントからある割合の増幅産物が生じるという仮定に基づき、UEVA−S2及びUEVA−AS1プライマー対を用いた2回目のPCR反応では、UEVA配列を特異的に増幅するために、UEVA−S1及びUEVA−AS2プライマー対を用いて得た産物の部分標本を鋳型DNAとして使用した。これは実質的に、第一ラウンドの増幅が、一対の「外側」UEVA由来プライマーを用いたUEVA配列の濃縮という役割をはたし、第二ラウンドの増幅は、該「外側」のプライマーが規定する領域に含まれるプライマーを用いて行われる、二段階ネスティッドPCRということになる。Micromonospora carbonacea var. africanaゲノムDNAとMicromonospora carbonacea var. aurantiacaゲノムDNAの両方にこの二段階ネスティッドPCR法を使用したところ、UEVA−S2及びUEVA−AS1プライマー対を用いたコスミド010CAで得たものと類似したサイズの明確なバンドを得た(データは図示せず)。かかるバンドをアガロースゲルに溶解し、グラスウールプラグでの遠心分離により精製し、フェノール/クロロホルム(1:1 vol:vol)で抽出し、エタノール沈殿によりペレット化した。その後、UEVA−S2及びUEVA−AS1プライマーを用いて、精製したDNAの配列決定を行った。
【0207】
M. carbonacea var. africanaPCR産物の配列決定により、EVEA中のUEVAタンパク質の69〜168位のアミノ酸をコードする領域と完全に一致する、質の高い配列情報を有する302個のヌクレオチドを得た(実施例10に記載)。
〔配列〕
Figure 2004532021
【0208】
M. carbonacea var. aurantiacaPCR産物の配列決定により、EVER遺伝子座中のUEVAタンパク質の72〜185位のアミノ酸をコードする領域と完全に一致する、質の高い配列情報を有する343個のヌクレオチドを得た(実施例1に記載)。
〔配列〕
Figure 2004532021
Figure 2004532021
【0209】
【実施例9】
【0210】
コンピュータシミュレーションによるオルトソマイシン生合成遺伝子の同定
本発明で教示されているポリペプチド及びポリヌクレオチドの配列情報により、どの生物試料についてもコンピュータシミュレーションによるオルトソマイシン生合成遺伝子座の同定が可能になる。生物試料は、環境試料(すなわち土壌)、環境試料又は培養した微生物由来の遺伝子原料及び精製した遺伝子原料(DNA、RNA、cDNA)であってもよい。
【0211】
培養したMicromonospora carbonacea var. africanaNRRL15009のゲノムDNAを抽出してカナダ国特許出願番号第2,352,451号に記載のとおりに抽出し、分析した。すなわち、抽出したゲノムDNAをランダムに断片化し、サイズ断片化し(size-fractionated)、小型のDNA断片を構築し、適切なプラスミドベクターにクローンして、ゲノムサンプルライブラリー(GSL)を構築した。GSLは、Micromonospora carbonacea var. africanaNRRL15009の全ゲノムをカバーする小型ランダムゲノムDNA断片のライブラリーである。
【0212】
クローン処理したゲノムDNAインサートの配列決定により、GSLライブラリーを分析した。それぞれフォワード(F)プライマー、リバース(R)プライマーと称されるユニバーサルプライマーのKS及び/又はSKを使用して標識DNAの重合を開始した。3700 ABI capillary electrophoresis DNA sequencer(Applied Biosystems社製)を用いて、生じたゲノム配列タグ(GST)の配列分析を行った。各種タンパク質配列データベースとの配列相同性を比較することにより、さらにGSTを分析した。得られたGSTのDNA配列をアミノ酸配列に翻訳し、文献(Altschul et al. J. Mol. Biol., October 5; 215 (3) 403-10)記載のアルゴリズムを用いて、National Center for Biotechnology Information(NCBI)の非冗長タンパク質データベース及びDECIPHERTM(カナダ国、ケベック州、サンローラン、Ecopia BioScience社製)と比較した。データベース中の機能が判明している既知のタンパク質に対する配列類似性により、翻訳されたGSTにコードされるポリペプチドから、本発明のタンパク質ファミリーを容易に認識できるようになる。
【0213】
Micromonospora carbonacea var. africanaGSLライブラリーの400個のGSTを分析し、上記タンパク質データベースと比較した。分析した400個のGSTのなかで、3個のGST(RAA12、RAC92、FAE38)が、本発明によりオルトソマイシン生合成遺伝子座に特徴的と教示されたタンパク質(それぞれ、HOXG、OXRW、MTFD)に対してかなりの配列類似性を有することが判明した。これら3個のGSTがオルトソマイシン特異的遺伝子座の相同タンパク質に対して示す類似性は、非オルトソマイシンコーディング遺伝子座の関連タンパク質に対するものよりも、はるかに高い。翻訳GST産物と、EVER、AVIA及びAVILオルトソマイシン遺伝子座におけるそのホモログとの間の相同性の程度を、表XXIXに示す。3個のGSTはすべて、オルトソマイシン化合物の生合成に固有のタンパク質ファミリーメンバーをコードする。HOXG、OXRW、及びMTFDは、オルトソマイシンコーディング遺伝子座でのみ認められ、それらがMicromonospora carbonacea var. africanaのゲノムサンプリングから検出されたということは、オルトソマイシン特異的遺伝子座がかかる微生物のゲノム内部に存在することをはっきりと示している。コンピュータシミュレーションによるオルトソマイシン遺伝子座の配列決定に使用したGSTは、EVEA遺伝子座の完全な配列決定で確認されたとおり、EVEAに属することがその後で判明した(実施例10を参照のこと)。
【0214】
エベルニノマイシン又はアビラマイシンに特徴的なタンパク質ファミリーを含有しているGSTが検出されていれば、予想されるオルトソマイシン化合物の種類をさらに決定することができただろう。オルトソマイシン特異的遺伝子座の存在は、かかる遺伝子座の検出及び完全な配列決定により確認された(実施例10を参照のこと)。
【0215】
同様の方法を用いて、オルトソマイシン化合物をコードするStreptomyces sp.(コレクションATCC39365)の能力を評価した。700個のGSTを分析し、タンパク質データベースと比較した。そのうち2個のGST(FAF63、FAA47)が、オルトソマイシン遺伝子座で見られるHOXG及びPKSOタンパク質ファミリーに対してかなりの配列相同性を有することが判明した(表XXIX参照)。HOXGは、オルトソマイシン生合成遺伝子座でしか見られないため、オルトソマイシンに特徴的なタンパク質ファミリーである。一方、PKSOは、オルトソマイシン遺伝子座で見られるタンパク質ファミリーではあるが、オルトソマイシン生合成以外の二次代謝にも関与していると思われる。本発明の組成物及び方法をStreptomyces sp.(コレクションATCC39365)に対して用いることにより、出現した代謝物の測定をこれまでまったく行っていなかった微生物又はバイオマスにおけるオルトソマイシン遺伝子座の発見に関する本発明の予測能力が実証される。
【0216】
表XXIXは、Micromonospora carbonacea var. africanaとStreptomyces sp.の翻訳されたGSTと、オルトソマイシン遺伝子座由来のそれらのホモログとの比較を示したものである。Blastxアルゴリズムを用いて、Blast分析を行った(Altschul et al. J. Mol. Biol., October 5; 215 (3) 403-10)。それぞれの比較結果中、1行目は2つのタンパク質セグメント間における同一アミノ酸の数及び同一性の程度を、2行目は類似したアミノ酸の数及び類似性の程度を示している。
【0217】
【表XXIX−1】
Figure 2004532021
【表XXIX−2】
Figure 2004532021
【実施例10】
【0218】
Micromonospora carbonacea var. africanaにおけるエベルニノマイシン生合成遺伝子座
61604、イリノイ州、ピオリア、ユニヴァーシティーストリート、1815Nに所在の米国農務省農業研究サービスカルチャーコレクションより、微生物Micromonospora carbonacea var. africanaNRRL15099を入手した。NRRL15099株が産生したエベルニノマイシン化合物は、米国特許第4,597,968号に記載されている。カナダ国特許出願番号第2,352,451号に記載の方法により、NRRL15099株由来エベルニノマイシンの生合成遺伝子座(EVEA)を同定した。EVEAまで及ぶオーバーラップゲノムインサートを含むコスミドから得た配列を同定した。コスミドインサートの配列内部で、既知のタンパク質に相同性を有するポリペプチドをコードする多数のORFを同定した。EVEAの隣接ヌクレオチド配列及び推定アミノ酸配列は、下記のとおり提供されている。ORF1のアミノ酸配列(配列番号271)は、contig1(配列番号278)から引用した配列番号272の核酸配列から推定したものである。ORF2のアミノ酸配列(配列番号137)は、contig1(配列番号278)から引用した配列番号138の核酸配列から推定したものである。ORF3のアミノ酸配列(配列番号5)は、contig1(配列番号278)から引用した配列番号6の核酸配列から推定したものである。ORF4のアミノ酸配列(配列番号37)は、contig1(配列番号278)から引用した配列番号38の核酸配列から推定したものである。ORF5のアミノ酸配列(配列番号171)は、contig1(配列番号278)から引用した配列番号172の核酸配列から推定したものである。ORF6のアミノ酸配列(配列番号173)は、contig1(配列番号278)から引用した配列番号174の核酸配列から推定したものである。ORF7のアミノ酸配列(配列番号49)は、contig1(配列番号278)から引用した配列番号50の核酸配列から推定したものである。ORF8のアミノ酸配列(配列番号103)は、contig1(配列番号278)から引用した配列番号104の核酸配列から推定したものである。ORF9のアミノ酸配列(配列番号269)は、contig1(配列番号278)から引用した配列番号270の核酸配列から推定したものである。ORF10のアミノ酸配列(配列番号109)は、contig1(配列番号278)から引用した配列番号110の核酸配列から推定したものである。ORF11のアミノ酸配列(配列番号157)は、contig1(配列番号278)から引用した配列番号158の核酸配列から推定したものである。ORF12のアミノ酸配列(配列番号115)は、contig1(配列番号278)から引用した配列番号116の核酸配列から推定したものである。ORF13のアミノ酸配列(配列番号121)は、contig1(配列番号278)から引用した配列番号122の核酸配列から推定したものである。ORF14のアミノ酸配列(配列番号197)は、contig1(配列番号278)から引用した配列番号198の核酸配列から推定したものである。ORF15のアミノ酸配列(配列番号91)は、contig1(配列番号278)から引用した配列番号92の核酸配列から推定したものである。ORF16のアミノ酸配列(配列番号185)は、contig2(配列番号279)から引用した配列番号186の核酸配列から推定したものである。ORF17のアミノ酸配列(配列番号85)は、contig2(配列番号279)から引用した配列番号86の核酸配列から推定したものである。ORF18のアミノ酸配列(配列番号227)は、contig2(配列番号279)から引用した配列番号228の核酸配列から推定したものである。ORF19のアミノ酸配列(配列番号239)は、contig2(配列番号279)から引用した配列番号240の核酸配列から推定したものである。ORF20のアミノ酸配列(配列番号79)は、contig2(配列番号279)から引用した配列番号80の核酸配列から推定したものである。ORF21のアミノ酸配列(配列番号275)は、contig2(配列番号279)から引用した配列番号276の核酸配列から推定したものである。ORF22のアミノ酸配列(配列番号11)は、contig2(配列番号279)から引用した配列番号12の核酸配列から推定したものである。ORF23のアミノ酸配列(配列番号43)は、contig2(配列番号279)から引用した配列番号44の核酸配列から推定したものである。ORF24のアミノ酸配列(配列番号143)は、contig2(配列番号279)から引用した配列番号144の核酸配列から推定したものである。ORF25のアミノ酸配列(配列番号17)は、contig2(配列番号279)から引用した配列番号18の核酸配列から推定したものである。ORF26のアミノ酸配列(配列番号191)は、contig2(配列番号279)から引用した配列番号192の核酸配列から推定したものである。ORF27のアミノ酸配列(配列番号61)は、contig2(配列番号279)から引用した配列番号62の核酸配列から推定したものである。ORF28のアミノ酸配列(配列番号31)は、contig2(配列番号279)から引用した配列番号32の核酸配列から推定したものである。ORF29のアミノ酸配列(配列番号179)は、contig2(配列番号279)から引用した配列番号180の核酸配列から推定したものである。ORF30のアミノ酸配列(配列番号163)は、contig2(配列番号279)から引用した配列番号164の核酸配列から推定したものである。ORF31のアミノ酸配列(配列番号67)は、contig2(配列番号279)から引用した配列番号68の核酸配列から推定したものである。ORF32のアミノ酸配列(配列番号207)は、contig2(配列番号279)から引用した配列番号208の核酸配列から推定したものである。ORF33のアミノ酸配列(配列番号55)は、contig2(配列番号279)から引用した配列番号56の核酸配列から推定したものである。ORF34のアミノ酸配列(配列番号25)は、contig2(配列番号279)から引用した配列番号26の核酸配列から推定したものである。ORF35のアミノ酸配列(配列番号223)は、contig2(配列番号279)から引用した配列番号224の核酸配列から推定したものである。ORF36のアミノ酸配列(配列番号235)は、contig2(配列番号279)から引用した配列番号236の核酸配列から推定したものである。ORF37のアミノ酸配列(配列番号211)は、contig2(配列番号279)から引用した配列番号212の核酸配列から推定したものである。ORF38のアミノ酸配列(配列番号231)は、contig2(配列番号279)から引用した配列番号232の核酸配列から推定したものである。ORF39のアミノ酸配列(配列番号219)は、contig2(配列番号279)から引用した配列番号220の核酸配列から推定したものである。ORF40のアミノ酸配列(配列番号215)は、contig2(配列番号279)から引用した配列番号216の核酸配列から推定したものである。ORF41のアミノ酸配列(配列番号243)は、contig2(配列番号279)から引用した配列番号244の核酸配列から推定したものである。ORF42のアミノ酸配列(配列番号273)は、contig2(配列番号279)から引用した配列番号274の核酸配列から推定したものである。ORF43のアミノ酸配列(配列番号73)は、contig2(配列番号279)から引用した配列番号74の核酸配列から推定したものである。ORF44のアミノ酸配列(配列番号97)は、contig2(配列番号279)から引用した配列番号98の核酸配列から推定したものである。ORF45のアミノ酸配列(配列番号131)は、contig2(配列番号279)から引用した配列番号132の核酸配列から推定したものである。デフォルトパラメータを用いたBLASTPのバージョン2.2.2アルゴリズムで相同性を測定した。表XXX-Aは、相同性分析の結果を表す。表XXX-Bは、配列番号278及び279の各EVEA ORFの位置、長さ、及び配置を示すものである。
【0219】
【表XXX−A−1】
Figure 2004532021
【表XXX−A−2】
Figure 2004532021
【表XXX−A−3】
Figure 2004532021
【表XXX−A−4】
Figure 2004532021
【表XXX−A−5】
Figure 2004532021
【表XXX−A−6】
Figure 2004532021
【0220】
【表XXX−B】
Figure 2004532021
図10は、Micromonospora carbonacea var. aurantiaca由来エベルニノマイシン生合成遺伝子座(EVER)とMicromonospora carbonacea var. africana由来エベルニノマイシン生合成遺伝子座(EVEA)とを比較し、その概略を表したものである。図の上部にあるスケールバーの単位は、キロ塩基対である。黒の矢印は、EVER及びEVEAにおける個々のORFの相対的位置を示し、矢頭は、各ORFの配向を示す。各ORFの右に、対応するタンパク質ファミリーを四文字表記で示している。2個の遺伝子座間の白い矢印は、相対的順序と配向が2個の遺伝子座間で同一である多数のORFを含むセグメントを明示したものである。白い矢印の配向は、各セグメントにおけるORFの相対的順序を示している。EVER遺伝子座中のセグメントには、すべて、「左から右」の配向が任意に割り当てられている。セグメントは、その相対的順序及び配向が、比較対象の遺伝子座間で同一である2個以上の隣接したORFとして定義されている。2個の遺伝子座間の実線は、一方の遺伝子座の各セグメントと他方の遺伝子座の対応するセグメントとを結んだものである。2個の遺伝子座間の点線は、セグメントを形成しない相同的なORFの個々の対を結んだものである。
【0221】
各遺伝子座のORFで、他の遺伝子座に対応物をもたないものを、「X」で示している。EVER中のORFで、EVEA中に対応物をもたないものは10個あり、MTBA、MTFH、UEVB、MTIA、OXRU、OXRT、DEPD、ENGA、REGL及びKINBタンパク質ファミリーメンバーと命名されている。EVEA中のORFで、EVER中に対応物をもたないものは4個あり、HYDH、OXRF、EFFA及びOXRFタンパク質ファミリーメンバーと命名されている。MTBA、MTFH、UEVB、MTIA、OXRU、OXRT、DEPD、ENGA、REGL、KINB、HYDH、OXRF、EFFA及びOXRFタンパク質ファミリーのORFが、エベルニノマイシン型オルトソマイシンのコア構造の組み立てに関与している可能性は低い。むしろ、それらは、メチル化(MTBA及びMTFH)、酸化/還元(OXRU、OXRT、OXRF)をはじめとするコア構造の各種修飾、又は耐性機構(MTIA、EFFA)に関与していると思われる。
【0222】
Reverse Position Specific BLASTを用いてNBCIのConserved Domain Databaseを調査したところ(Altschul et al., (1997) Nucleic Acids Res. 25: 3389-3402)、炭水化物結合及び別のコンテキストでのタンパク質−タンパク質相互作用に関与している二本鎖ベータヘリックスドメインに対して、UEVBファミリーが構造的相同性を示すことが判明した。したがって、UEVBファミリーは、オルトソマイシンのあるサブ構造を特異的に認識する小型の炭水化物結合タンパク質であるのかもしれない。さらなる修飾を防ぐために、UEVBタンパク質が糖残基Hを認識し、結合するという興味深い可能性が1つある。この仮説は、Micromonospora carbonacea var. africana由来のエベルニノマイシン遺伝子座にはUEVBホモログが含まれないという事実、及び、この生物が、オルセリン酸部分とのエステル結合を含めたさまざまな置換を糖残基H上で行ってエベルニノマイシンを産生するという事実に基づいている。したがって、この仮説に基づくと、AVIA、AVIL若しくはEVER遺伝子座、又はそうしたORFを含む可能性のあるその他のオルトソマイシン遺伝子座におけるUEVB ORFが崩壊した結果、糖残基Hにさらに置換が生じている新規オルトソマイシンが産生される場合があることが予測されるだろう。
【0223】
EVER及びEVEA遺伝子座がともに関連化合物を産生し、これらの遺伝子座をそれぞれ含む生物がともにMicromonospora carbonaceaに分類されるため、EVER及びEVEA遺伝子座のORFがある程度までシャッフルされ、各遺伝子座に対応物をもたないORFが存在するという事実は、予想を越えるものであった。
【0224】
ここに記載した実施形態は例示のみを目的とするものであること、及び、これらの実施形態を踏まえた各種修正や変更は、当業者であれば思いつくことであって、本出願の範囲及び後述のクレームの範囲に含まれるべきであることは理解されてしかるべきである。ここで触れたあらゆる刊行物、特許、特許出願は、あらゆる目的に使用できるように完全な形でここに参照として組み込んでいる。
【図面の簡単な説明】
【0225】
【図1】本発明の参照配列から選択したサブジェクトとクエリーとの比較を目的としたソフトウェアツールを実行するコンピュータシステムのブロック図である。
【図2】図2A、2B、2C及び2Dは、本発明の参照配列から選択したサブジェクトとクエリーとを比較する際に使用可能な配列比較ソフトウェアのフローチャートであり、図2Aは配列比較ソフトウェアのクエリー初期化サブプロセス、図2Bは配列比較ソフトウェアのサブジェクトデータソース初期化サブプロセスであり、図2Cは配列比較ソフトウェアの比較サブプロセス及び分析サブプロセスを示し、図2Dは配列比較ソフトウェアのディスプレイ/レポートサブプロセスである。
【図3】クエリー/サブジェクト対の間の類似性を1対単位で測定する際に使用可能なコンパレータアルゴリズムの1つの実施形態である図2Cのコンパレータアルゴリズム(238)のフローチャートである。
【図4】本発明の参照配列であるサブジェクト配列との類似性に基づいてクエリー配列に同一性を割り当てる際に使用可能なアナライザアルゴリズムの1つの実施形態である図2Cのアナライザアルゴリズム(244)のフローチャートである。
【図5】Streptomyces mobaraensis由来のアビラマイシン型生合成遺伝子座(AVIA)とStreptomyces viridochromogenesTu57由来のアビラマイシンA生合成遺伝子座(AVIL)とを比較した概略図であり、タンパク質ファミリーの4文字表記で遺伝子座中のORFを同定している。
【図6】生合成の図式を示しており、図中、オルトソマイシン生合成遺伝子座によく見られるタンパク質ファミリーメンバー、すなわち、KASA(EVEA ORF17、配列番号84;EVER ORF14、配列番号83;AVIA ORF13、配列番号81;及びAVIL ORF15、Genbankアクセッション番号AAK83178)、PKSO(EVEA ORF16、配列番号185;EVER ORF32、配列番号183;AVIA ORF14、配列番号181;及びAVIL ORF16、Genbankアクセッション番号AAK83194)、MTFA(EVEA ORF44、配列番号97;EVER ORF11、配列番号95;AVIA ORF38、配列番号93)、及びHOMX(EVEA ORF20、配列番号79;EVER ORF20、配列番号77;AVIA ORF36、配列番号75)が、オルトソマイシンオリゴ糖中の糖残基Bとのエステル結合に見られる、ジクロロイソエベルニン分子種を形成している。
【図7】2つの代替的生合成経路を図示しており、図中、オルトソマイシン生合成遺伝子座に特徴的なタンパク質ファミリーメンバー、すなわち、OXRW(AVIA ORF24及び33(配列番号153及び159);AVILGenbankアクセッション番号AAK83187;EVER ORF18及び26(配列番号155及び161);EVEA ORF11及び30(配列番号157及び163))並びにOXRV(AVIA ORF19(配列番号167);EVEA ORF6(配列番号173);AVILGenbankアクセッション番号AAK83181;EVER ORF31(配列番号169))が、オルトソマイシンオリゴ糖の残基CとDとを結ぶオルトエステル結合を形成している。
【図8】生合成の図式を示しており、図中、DATC(EVER ORF43(配列番号209);EVEA ORF37(配列番号211));MTFV(EVER ORF44(配列番号229);EVEA ORF38(配列番号231));EPIM(EVER ORF45(配列番号217);EVEA ORF39(配列番号219));DEPF(EVER ORF46(配列番号213);EVEA ORF40(配列番号215));及びOXBN(EVER ORF42(配列番号233);EVEA36(配列番号235))などのエベルニノマイシン型オルトソマイシン遺伝子クラスター及びエベルニノマイシン型オルトソマイシン産生株に特徴的なタンパク質ファミリーメンバーが、エベルニノマイシン型オルトソマイシンの特徴であるアミノ糖残基及びニトロ糖残基を形成している。
【図9】実施例8に記載のPCR増幅実験で作製した、臭化エチジウムで染色した1%アガロースゲルを示す図である。
【図10】Micromonospora carbonacea var. aurantiaca由来のエベルニノマイシン型生合成遺伝子座(EVER)とMicromonospora carbonacea var. africana由来のエベルニノマイシン型生合成遺伝子座(EVEA)とを比較した概略図であり、タンパク質ファミリーの4文字表記で遺伝子座中のORFを同定している。

Claims (42)

  1. ゲノムDNAを含む試料を提供し、
    a.配列番号51、Genbankアクセッション番号AAK83192、配列番号53、配列番号55、及び配列番号51、53、55、又はGenbankアクセッション番号AAK83192の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    b.配列番号57、Genbankアクセッション番号AAK83170、配列番号59、配列番号61、及び配列番号57、59、61、又はGenbankアクセッション番号AAK83170の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    c.配列番号63、Genbankアクセッション番号AAK83193、配列番号65、配列番号67、及び配列番号63、65、67、又はGenbankアクセッション番号AAK83193の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    d.配列番号69、配列番号71、配列番号73、及び配列番号69、71、又は73の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    e.配列番号99、Genbankアクセッション番号AAK83184、配列番号101、配列番号103、及び配列番号99、101、103、又はGenbankアクセッション番号AAK83184の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    f.配列番号105、Genbankアクセッション番号AAK83186、配列番号107、配列番号109、及び配列番号105、107、109、又はGenbankアクセッション番号AAK83186の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    g.配列番号111、Genbankアクセッション番号AAK83188、配列番号113、配列番号115、及び配列番号111、113、115、又はGenbankアクセッション番号AAK83188の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    h.配列番号127、Genbankアクセッション番号AAG32067、配列番号129、配列番号131、及び配列番号127、129、131、又はGenbankアクセッション番号AAG32067の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    i.配列番号123、Genbankアクセッション番号AAG32066、配列番号125、及び配列番号123、125、又はGenbankアクセッション番号AAG32066の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    j.配列番号153、Genbankアクセッション番号AAK83187、配列番号155、配列番号157、及び配列番号153、155、157、又はGenbankアクセッション番号AAK83187の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    k.配列番号159、配列番号161、配列番号163、及び配列番号159、161、又は163の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    l.配列番号167、配列番号173、Genbankアクセッション番号AAK83181、配列番号169、及び配列番号167、169、173、又はGenbankアクセッション番号AAK83181の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    m.配列番号175、配列番号177、配列番号179、及び配列番号175、177、又は179の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    n.配列番号165、配列番号171、配列番号169、及び配列番号165、169、又は171の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    o.配列番号193、Genbankアクセッション番号AAK83189、配列番号195、配列番号197、及び配列番号193、195、197、又はGenbankアクセッション番号AAK83189の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    p.配列番号199、Genbankアクセッション番号AAK83174、配列番号201、及び配列番号199、201、又はGenbankアクセッション番号AAK83174の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    及び、q.配列番号203、配列番号205、配列番号207、及び配列番号203、205、又は207の配列を有するポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    からなる群のうち、少なくとも2つの群に由来するポリペプチドをコードする核酸配列の有無を該試料中で検出することを特徴とするオルトソマイシン生合成遺伝子、遺伝子断片又は遺伝子クラスターの同定方法。
  2. さらに、
    a.下記の(r)〜(z)からなる群のうち、少なくとも1つの群に由来するポリペプチドをコードする核酸配列:
    r.配列番号209、配列番号211、及び配列番号209、又は配列番号211のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    s.配列番号213、配列番号215、及び配列番号213、又は配列番号215のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    t.配列番号217、配列番号219、及び配列番号217、又は配列番号219のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    u.配列番号221、配列番号223、及び配列番号221、又は配列番号223のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    v.配列番号225、配列番号227、及び配列番号225、又は配列番号227のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    w.配列番号229、配列番号231、及び配列番号229、又は配列番号231のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    x.配列番号233、配列番号235、及び配列番号233、又は配列番号235のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    y.配列番号237、配列番号239、及び配列番号237、又は配列番号239のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    及び、z.配列番号241、配列番号243、及び配列番号241、又は配列番号243のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    又は;
    b.下記の(aa)〜(ff)からなる群のうち、少なくとも1つの群に由来するポリペプチドをコードする核酸配列:
    aa.配列番号245、Genbankアクセッション番号AAG32068、及び配列番号245、又はGenbankアクセッション番号AAG32068のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    bb.配列番号247、Genbankアクセッション番号AAK83183、及び配列番号247、又はGenbankアクセッション番号AAK83183のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    cc.配列番号249、Genbankアクセッション番号AAG32069、及び配列番号249、又はGenbankアクセッション番号AAG32069のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    dd.配列番号251、Genbankアクセッション番号AAK83172、及び配列番号251、又はGenbankアクセッション番号AAK83172のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    ee.配列番号253、Genbankアクセッション番号AAK83171、及び配列番号253、又はGenbankアクセッション番号AAK83171のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    及び、ff.配列番号255、Genbankアクセッション番号AAK83175、及び配列番号255、又はGenbankアクセッション番号AAK83175のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    のいずれかの有無を検出し、さらに検出された遺伝子クラスターが、エベルニノマイシン型オルトソマイシン遺伝子クラスターであるか、又はアビラマイシン型オルトソマイシン遺伝子クラスターであるかを測定することを特徴とする請求項1記載の方法。
  3. さらに、検出した核酸配列を用いて、ゲノムDNAを含む試料からオルトソマイシン遺伝子クラスターを単離することを特徴とする請求項1又は2記載の方法。
  4. さらに、該試料中のゲノムDNAから検出された核酸配列を内包する生物を同定することを特徴とする請求項1、2又は3記載の方法。
  5. DNAを含む試料が、環境由来のバイオマスであることを特徴とする請求項1〜4のいずれか記載の方法。
  6. 該バイオマスが微生物混合培養物であることを特徴とする請求項5記載の方法。
  7. 該ゲノムDNAを含む試料が、混合生物群より得られることを特徴とする請求項1〜6のいずれか記載の方法。
  8. 該ゲノムDNAを含む試料が複数のクローンを含むゲノムライブラリーであって、該クローンを作製する該ゲノムDNAが混合生物群より得られることを特徴とする請求項1〜7のいずれか記載の方法。
  9. 該ゲノムDNAを含む試料が、純粋培養物より得られることを特徴とする請求項1〜4のいずれか記載の方法。
  10. 該ゲノムDNAを含む試料が複数のクローンを含むゲノムライブラリーであって、該クローンを作製する該DNAが純粋培養物より得られることを特徴とする請求項1〜4のいずれか記載の方法。
  11. (a)〜(q)群のうち少なくとも4つの群に由来する核酸配列の有無を、該ゲノムDNA試料において検出することを特徴とする請求項1〜10のいずれか記載の方法。
  12. (a)〜(q)群に由来するポリペプチドをコードする核酸配列の有無を検出する際に、
    a.配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の配列、それらに相補的な配列のいずれかを、又は、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の配列、若しくはそれらに相補的な配列のいずれかの少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片を含有する、単離、精製又は濃縮を行った核酸;
    又は、
    b.配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのいずれかを、又は、配列番号51、53、55、57、59、61、63、65、67、69、71、73、99、101、103、105、107、109、111、113、115、123、125、127、129、131、153、155、157、159、161、163、165、167、169、171、173、175、177、179、193、195、197、199、201、203、205、207のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする、単離、精製又は濃縮を行った核酸;
    に由来するPCRプライマー又はハイブリダイゼーションプローブを使用することを特徴とする請求項1〜11のいずれか記載の方法。
  13. 請求項3記載の方法により得られるオルトソマイシン遺伝子クラスター。
  14. DNAを含む試料を提供し、
    r.配列番号209、配列番号211、及び配列番号209、又は配列番号211のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    s.配列番号213、配列番号215、及び配列番号213、又は配列番号215のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    t.配列番号217、配列番号219、及び配列番号217、又は配列番号219のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    u.配列番号221、配列番号223、及び配列番号221、又は配列番号223のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    v.配列番号225、配列番号227、及び配列番号225、又は配列番号227のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    w.配列番号229、配列番号231、及び配列番号229、又は配列番号231のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    x.配列番号233、配列番号235、及び配列番号233、又は配列番号235のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    y.配列番号237、配列番号239、及び配列番号237、又は配列番号239のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    及び、z.配列番号241、配列番号243、及び配列番号241、又は配列番号243のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    からなる群のうち、少なくとも1つの群に由来するポリペプチドをコードする核酸配列の有無を検出することを特徴とする、エベルニノマイシン型オルトソマイシン生合成遺伝子、遺伝子断片又は遺伝子クラスターの同定方法。
  15. さらに、請求項1記載の(a)〜(q)群のうち少なくとも2つの群に由来するポリペプチドをコードする核酸配列の有無を該試料中で検出することを特徴とする請求項14記載の方法。
  16. (r)〜(g)群のうち少なくとも2つの群に由来するポリペプチドをコードする核酸配列の有無を検出する際に、
    a.配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の配列、それらに相補的な配列のいずれかを、又は、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の配列、若しくはそれらに相補的な配列のいずれかの少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片を含有する、単離、精製又は濃縮を行った核酸;
    又は、
    b.配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243のポリペプチドのいずれかを、又は、配列番号209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする、単離、精製又は濃縮を行った核酸;
    に由来するPCRプライマー又はハイブリダイゼーションプローブを使用することを特徴とする請求項14又は15記載の方法。
  17. さらに、検出した核酸配列を用いて、該ゲノムDNAを含む試料からエベルニノマイシン型オルトソマイシン生合成遺伝子クラスターを単離することを特徴とする請求項14〜17記載の方法。
  18. 該試料中のゲノムDNAから検出された核酸配列を内包する生物を同定することを特徴とする請求項14〜27のいずれか記載の方法。
  19. 該DNAを含む試料が、環境由来のバイオマスであることを特徴とする請求項14〜18のいずれか記載の方法。
  20. 該バイオマスが微生物混合培養物であることを特徴とする請求項14〜19のいずれか記載の方法。
  21. 該ゲノムDNAを含む試料が、混合生物群より得られることを特徴とする請求項14〜20のいずれか記載の方法。
  22. 該ゲノムDNAを含む試料が複数のクローンを含むゲノムライブラリーであって、該クローンを作製する該ゲノムDNAが混合生物群より得られることを特徴とする請求項14〜21のいずれか記載の方法。
  23. 該ゲノムDNAを含む試料が、純粋培養物より得られることを特徴とする請求項14〜18のいずれか記載の方法。
  24. 該ゲノムDNAを含む試料が複数のクローンを含むゲノムライブラリーであって、該クローンを作製する該DNAが純粋培養物より得られることを特徴とする請求項14〜18のいずれか記載の方法。
  25. (r)〜(z)群のうち少なくとも2つの群の有無を、該ゲノムDNA試料において検出することを特徴とする請求項14〜24のいずれか記載の方法。
  26. 請求項17記載の方法により得られるエベルニノマイシン型オルトソマイシン生合成遺伝子クラスター。
  27. ゲノムDNAを含む試料を提供し、
    aa.配列番号245、Genbankアクセッション番号AAG32068、及び配列番号245、又はGenbankアクセッション番号AAG32068のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    bb.配列番号247、Genbankアクセッション番号AAK83183、及び配列番号247、又はGenbankアクセッション番号AAK83183のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    cc.配列番号249、Genbankアクセッション番号AAG32069、及び配列番号249、又はGenbankアクセッション番号AAG32069のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    dd.配列番号251、Genbankアクセッション番号AAK83172、及び配列番号251、又はGenbankアクセッション番号AAK83172のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    ee.配列番号253、Genbankアクセッション番号AAK83171、及び配列番号253、又はGenbankアクセッション番号AAK83171のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    及び、ff.配列番号255、Genbankアクセッション番号AAK83175、及び配列番号255、又はGenbankアクセッション番号AAK83175のポリペプチドに対して少なくとも65%の相同性を有するポリペプチド;
    からなる群のうち、少なくとも1つの群に由来するポリペプチドをコードする核酸配列の有無を該試料中で検出することを特徴とする、アビラマイシン型オルトソマイシン生合成遺伝子、遺伝子断片又は遺伝子クラスターの同定方法。
  28. さらに、請求項1記載の(a)〜(q)群のうち少なくとも2つの群に由来するポリペプチドをコードする核酸配列の有無を該DNA試料中で検出することを特徴とする請求項27記載の方法。
  29. (aa)〜(ff)群のうち少なくとも2つの群に由来するポリペプチドをコードする核酸配列の有無を検出する際に、
    a.配列番号246、248、250、252、254、256の配列、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列、それらに相補的な配列のいずれかを、又は、配列番号246、248、250、252、254、256の配列、並びにGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列、若しくはそれらに相補的な配列のいずれかの少なくとも10、15、20、25、30、35、40、50、75、100、150、200、300、400若しくは500個の塩基を連続状態で含む断片を含有する、単離、精製又は濃縮を行った核酸;
    又は、
    b.配列番号245、247、249、251、253、若しくはGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175のポリペプチドのいずれかを、又は、配列番号245、247、249、251、253、若しくはGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175のポリペプチドのいずれかの少なくとも5、10、15、20、25、30、35、40、50、75、100、若しくは150個のアミノ酸を連続状態で含む断片をコードする、単離、精製又は濃縮を行った核酸;
    に由来するPCRプライマー又はハイブリダイゼーションプローブを使用することを特徴とする請求項27又は28記載の方法。
  30. さらに、検出した核酸配列を用いて、該ゲノムDNAを含む試料からアビラマイシン型オルトソマイシン生合成遺伝子クラスターを単離することを特徴とする請求項27、28又は29記載の方法。
  31. 該試料中のゲノムDNAから検出された核酸配列を内包する生物を同定することを特徴とする請求項27〜30のいずれか記載の方法。
  32. 該DNAを含む試料が、環境由来のバイオマスであることを特徴とする請求項27〜31のいずれか記載の方法。
  33. 該バイオマスが微生物混合培養物であることを特徴とする請求項27〜32のいずれか記載の方法。
  34. 該ゲノムDNAを含む試料が、混合生物群より得られることを特徴とする請求項27〜33のいずれか記載の方法。
  35. 該ゲノムDNAを含む試料が複数のクローンを含むゲノムライブラリーであって、該クローンを作製する該ゲノムDNAが混合生物群より得られることを特徴とする請求項27〜34のいずれか記載の方法。
  36. 該ゲノムDNAを含む試料が、純粋培養物より得られることを特徴とする請求項27〜31のいずれか記載の方法。
  37. 該ゲノムDNAを含む試料が複数のクローンを含むゲノムライブラリーであって、該クローンを作製する該DNAが純粋培養物より得られることを特徴とする請求項27〜31のいずれか記載の方法。
  38. (aa)〜(zz)群のうち少なくとも2つの群の有無を、該ゲノムDNA試料において検出することを特徴とする請求項27〜37のいずれか記載の方法。
  39. 請求項30により得られるアビラマイシン型オルトソマイシン生合成遺伝子クラスター。
  40. オルトソマイシン遺伝子、オルトソマイシン遺伝子断片、オルトソマイシン遺伝子クラスター、及びオルトソマイシン産生生物の検出に使用する、
    a.配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208;
    b.配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の少なくとも10個のヌクレオチドを連続状態で含む、配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の断片;
    c.配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208に対して少なくとも70%の相同性、又は配列番号52、54、56、58、60、62、64、66、68、70、72、74、100、102、104、106、108、110、112、114、116、124、126、128、130、132、154、156、158、160、162、164、166、168、170、172、174、176、178、180、194、196、198、200、202、204、206、208の断片に対して少なくとも70%の相同性を有する配列;
    及び、d.該(a)、(b)及び(c)の配列に相補的な配列;
    からなる群より選ばれる配列を保存した、コンピュータ読み取り可能な媒体。
  41. エベルニノマイシン型オルトソマイシン遺伝子、遺伝子断片、遺伝子クラスター、又はエベルニノマイシン型オルトソマイシン産生生物の同定に使用する、
    a.配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244;
    b.配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の少なくとも10個のヌクレオチドを連続状態で含む、配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の断片;
    c.配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244に対して少なくとも70%の相同性、又は配列番号210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244の断片に対して70%の相同性を有する配列;
    及び、d.該(a)、(b)及び(c)の配列に相補的な配列;
    からなる群より選ばれる配列を保存した、コンピュータ読み取り可能な媒体。
  42. アビラマイシン型オルトソマイシン遺伝子、遺伝子断片、遺伝子クラスター、又はアビラマイシン型オルトソマイシン産生生物の同定に使用する、
    a.配列番号246、248、250、252、254、256、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列;
    b.配列番号246、248、250、252、254、256、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列の少なくとも10個のヌクレオチドを連続状態で含む、配列番号246、248、250、252、254、256、及びGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列の断片;
    c.配列番号246、248、250、252、254、256、若しくはGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列に対して70%の相同性、又は配列番号246、248、250、252、254、256、若しくはGenbankアクセッション番号AAG32068、AAK83183、AAG32069、AAK83172、AAK83171、及びAAK83175に対応する核酸配列の断片に対して70%の相同性を有する配列;
    及び、d.該(a)、(b)及び(c)の配列に相補的な配列;
    からなる群より選ばれる配列を保存した、コンピュータ読み取り可能な媒体。
JP2002577914A 2001-03-28 2002-03-28 オルトソマイシン生合成遺伝子座の同定及び識別用の組成物並びに同定及び識別の方法 Withdrawn JP2004532021A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US27909501P 2001-03-28 2001-03-28
US27970901P 2001-03-30 2001-03-30
US28521401P 2001-04-20 2001-04-20
PCT/CA2002/000432 WO2002079505A2 (en) 2001-03-28 2002-03-28 Compositions and methods for identifying and distinguishing orthosomycin biosynthetic loci

Publications (1)

Publication Number Publication Date
JP2004532021A true JP2004532021A (ja) 2004-10-21

Family

ID=27403041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002577914A Withdrawn JP2004532021A (ja) 2001-03-28 2002-03-28 オルトソマイシン生合成遺伝子座の同定及び識別用の組成物並びに同定及び識別の方法

Country Status (5)

Country Link
EP (1) EP1373309A2 (ja)
JP (1) JP2004532021A (ja)
AU (1) AU2002245973A1 (ja)
CA (1) CA2375097A1 (ja)
WO (1) WO2002079505A2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6861513B2 (en) * 2000-01-12 2005-03-01 Schering Corporation Everninomicin biosynthetic genes
US20030143666A1 (en) * 2000-01-27 2003-07-31 Alfredo Staffa Genetic locus for everninomicin biosynthesis
DE10109166A1 (de) * 2001-02-25 2002-09-12 Combinature Biopharm Ag Avilamycin-Derivate
CA2352451C (en) * 2001-07-24 2003-04-08 Ecopia Biosciences Inc. High throughput method for discovery of gene clusters

Also Published As

Publication number Publication date
AU2002245973A1 (en) 2002-10-15
CA2375097A1 (en) 2002-06-08
EP1373309A2 (en) 2004-01-02
WO2002079505A3 (en) 2003-10-09
WO2002079505A2 (en) 2002-10-10

Similar Documents

Publication Publication Date Title
Weitnauer et al. Biosynthesis of the orthosomycin antibiotic avilamycin A: deductions from the molecular analysis of the avi biosynthetic gene cluster of Streptomyces viridochromogenes Tü57 and production of new antibiotics
Zhou et al. A novel DNA modification by sulphur
Moffitt et al. Characterization of the nodularin synthetase gene cluster and proposed theory of the evolution of cyanobacterial hepatotoxins
Schwartz et al. Biosynthetic gene cluster of the herbicide phosphinothricin tripeptide from Streptomyces viridochromogenes Tu494
Han et al. A novel alternate anaplerotic pathway to the glyoxylate cycle in streptomycetes
US20100016170A1 (en) High throughput method for discovery of gene clusters
KR20180093083A (ko) 켈리마이신 생합성 유전자 클러스터
CN101203606B (zh) 新β-半乳糖苷-α2,3-唾液酸转移酶及其编码基因和生产方法
US7462705B2 (en) Nucleic acids encoding an enediyne polyketide synthase complex
CA2352451C (en) High throughput method for discovery of gene clusters
Anderson et al. The detection of diverse aminoglycoside phosphotransferases within natural populations of actinomycetes
CN102816783A (zh) 刺糖多孢菌染色体的基因整合
JP2004532021A (ja) オルトソマイシン生合成遺伝子座の同定及び識別用の組成物並びに同定及び識別の方法
Shao et al. Phylogeny and characterization of phytoplasmal NusA and use of the nusA gene in detection of group 16SrI strains
EP1944377B1 (en) Nucleic acid molecules specific for bacterial antigens and uses thereof
WO2003010193A2 (en) Genes and proteins for the biosynthesis of rosaramicin
JP2004535175A (ja) ポリケチド生合成用遺伝子及びタンパク質
CN103224905A (zh) 鉴定和表征来自生产多杀菌素的刺糖多孢菌的siponactin生物合成基因簇
US20030224364A1 (en) Compositions and methods for identifying and distinguishing orthosomycin biosynthetic loci
US20030054353A1 (en) High throughput method for discovery of gene clusters
CA2119379A1 (en) Secondary-metabolite biosynthesis genes from actinomycetes, method of isolating them and their use
CA2445687C (en) Compositions, methods and systems for the discovery of enediyne natural products
WO2001055180A2 (en) Gene cluster for everninomicin biosynthesis
US20090130675A1 (en) Genes Involved in the Biosynthesis of Thiocoraline and Heterologous Production of Same
WO2012013960A2 (en) Tunicamycin gene cluster

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050125

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20050520

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050517