JP7404229B2 - ヒト治療標的およびそのモジュレーター - Google Patents

ヒト治療標的およびそのモジュレーター Download PDF

Info

Publication number
JP7404229B2
JP7404229B2 JP2020515852A JP2020515852A JP7404229B2 JP 7404229 B2 JP7404229 B2 JP 7404229B2 JP 2020515852 A JP2020515852 A JP 2020515852A JP 2020515852 A JP2020515852 A JP 2020515852A JP 7404229 B2 JP7404229 B2 JP 7404229B2
Authority
JP
Japan
Prior art keywords
etag
nucleic acid
biosynthetic gene
biosynthetic
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020515852A
Other languages
English (en)
Other versions
JP2020533991A (ja
JP2020533991A5 (ja
Inventor
ジョン バクスター ビギンズ,
ブライアン ロジャー ボウマン,
グレゴリー エル. ヴァーダイン,
Original Assignee
ライフマイン セラピューティクス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ライフマイン セラピューティクス, インコーポレイテッド filed Critical ライフマイン セラピューティクス, インコーポレイテッド
Publication of JP2020533991A publication Critical patent/JP2020533991A/ja
Publication of JP2020533991A5 publication Critical patent/JP2020533991A5/ja
Priority to JP2023127703A priority Critical patent/JP2023153953A/ja
Application granted granted Critical
Publication of JP7404229B2 publication Critical patent/JP7404229B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Library & Information Science (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

関連出願の相互参照
本願は、その全体を参照により本明細書に組み込む、2017年9月14日に出願された米国特許仮出願第62/558,744号に対する優先権を主張する。
ヒトプロテオーム内のいわゆる「ドラッガブル(druggable)」標的の同定は、「重大な課題」として説明されてきた。例えば、Dixon et al Curr. Opin. Chem. Biol. 13:549, 2009を参照されたい。2011年の時点で、報告は、ヒトタンパク質の約2%のみが、承認された薬物による標的化に成功したこと、さらに、ヒトタンパク質の10~15%のみが、標的化に対して感受性でさえある(すなわち、「ドラッガブル」である)ことを推定した。例えば、Stockwell Sci. Am 305:20, 2011を参照されたい。
Dixonら、Curr.Opin.Chem.Biol.(2009)13:549
一部の微生物生合成遺伝子クラスターが、クラスターによってコードされる酵素によって産生される関連する生合成産物の合成に関与しないと思われる遺伝子(「パッセンジャー」遺伝子と本明細書で称される)を含有することもあることの証拠が現れつつある。場合によっては、斯かるパッセンジャー遺伝子は、明らかに、関連する生合成産物に対して宿主生物を抵抗性にすることができるタンパク質をコードするため、「自己防衛的」として記載された。例えば、場合によっては、生合成産物のトランスポーター、生合成産物に作用する解毒酵素、またはその活性が生合成産物によって標的化されるタンパク質の抵抗性バリアントをコードする遺伝子が報告された。例えば、Cimermancic et al Cell 158:412, 2014;Keller Nat. Chem. Biol. 11:671, 2015を参照されたい。研究者は、斯かる遺伝子およびその機能の同定が、クラスターの酵素によって合成された生合成産物の役割の決定において有用となり得ることを提案した。例えば、Yeh et al. ACS Chem. Biol. 11:2275, 2016;Tang et al. ACS Chem. Biol. 10:2841, 2015;Regueira et al. Appl, Environ. Microbiol. 77:3035, 2011;Kennedy et al., Science 284:1368, 1999;Lowther et al., Proc. Natl. Acad. Sci. USA 95:12153, 1998;Abe et al, Mol. Genet. Genomics 268:130, 2002を参照されたい。
とりわけ、本開示は、本明細書に記載されている生合成遺伝子クラスターに存在する、またはクラスターの生合成遺伝子に対する近接ゾーンに存在する非生合成遺伝子に関する異なる観点を提供し、ヒト治療薬におけるある特定の斯かる遺伝子の潜在的有用性に関する新たな洞察を提供する。一部の実施形態では、本開示は、斯かる洞察を利用して、ヒト治療薬を開発および/または改善する技術を提供する。
とりわけ、本開示は、生合成遺伝子クラスターに、またはクラスターの生合成遺伝子に対する近接ゾーンに、特に、真核生物(例えば、細菌とは対照的に、真菌)生合成遺伝子クラスターに存在するある特定の非生合成遺伝子が、治療上の関心の標的を表すヒト遺伝子のホモログを表すことができるという洞察を提供する。本開示は、「埋め込まれた標的遺伝子」または「ETaG」と本明細書で称される、斯かる目的の非生合成遺伝子を特徴付けるパラメータを定義する。本開示は、ETaGを同定するおよび/または特徴付けるための技術、生合成遺伝子クラスターおよび/またはETaG遺伝子配列(および必要に応じて関連するアノテーション)を含むデータベース、ETaGに対応するヒト標的遺伝子を同定するおよび/または特徴付けるためのシステム、ならびに斯かるヒト標的遺伝子、および/またはこれを含有および/または発現するシステムを作製および/または使用する方法、等を提供する。
本開示は、ETaGおよびその関係した生合成遺伝子クラスター(それに対し内部にETaGがある近接ゾーン内の生合成遺伝子を含有する生合成遺伝子クラスター)の間の関係性が、対応するヒト標的遺伝子の有効なモジュレーターの同定、設計および/または特徴付けを知らせるという、さらなる洞察に寄与する。本開示は、斯かる同定、設計および/または特徴付けのための技術を提供し、また、関連するヒト標的遺伝子のモジュレーションを達成する薬剤、ならびに斯かる薬剤を提供および/または使用する方法を提供する。
上に記す通り、本開示は、ETaGが、医学的(例えば、治療的)関連性があるヒト標的の機能的ホモログ(例えば、オルソログ)として機能し得るという洞察を包含する。本開示において、真核生物(例えば、真菌)生合成遺伝子クラスター内の、またはクラスターの生合成遺伝子に対する近接ゾーンにおけるパッセンジャー(すなわち、非生合成)遺伝子の配列を、ヒト遺伝子の配列と比較することができる。核酸配列類似性、ペプチド配列類似性および/または系統発生的関係性を、比較される配列に関して決定(例えば、定量的に評価および/または進化系統樹視覚化により)することができる。それに代えてまたはその上、公知の構造的および/またはタンパク質エフェクターエレメントの保存を評価することができる。一部の実施形態では、ヒト配列に対する比較的高い相同性、および/または保存された構造的および/またはタンパク質エフェクターエレメントを有するパッセンジャー遺伝子を、ヒト薬物標的としての目的のETaGとして優先順位付けすることができる。
一部の実施形態では、本開示は、
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
真菌核酸配列のうち少なくとも1種の内で、
クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内にあり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップと
を含む方法を提供する。
典型的には、生合成遺伝子クラスターは、1種または複数の生合成遺伝子を含む。一部の実施形態では、生合成遺伝子クラスターは、1種または複数の生合成遺伝子、および1種または複数の非生合成遺伝子を含む。一部の実施形態では、非生合成遺伝子は、調節性、例えば、転写因子である。一部の実施形態では、バイオインフォマティクスによって同定された生合成遺伝子クラスターにおいて、非生合成遺伝子は、仮定上の遺伝子であり得る。一部の実施形態では、生合成遺伝子クラスターの境界は、バイオインフォマティクス方法、例えば、antiSMASHによって定義される。一部の実施形態では、生合成遺伝子および非生合成遺伝子は、バイオインフォマティクスに基づき指定される。一部の実施形態では、非生合成遺伝子は、バイオインフォマティクス方法によって非生合成遺伝子として同定された(および/または本開示において非生合成遺伝子として示された)場合であっても、生合成機能を有する可能性がある。
一部の実施形態では、本開示は、
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
真菌核酸配列のうち少なくとも1種の内で、
クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップと
を含む方法を提供する。
一部の実施形態では、本開示は、真核生物の真菌由来のETaGが、例えば、あるとすれば、ある特定の細菌等の原核生物におけるその対応物よりも、哺乳動物遺伝子に対する類似性を有することができるという認識を包含する。一部の実施形態では、真菌は、ヒトから進化的により遠い生物よりも治療上関連するETaGを含有する、および/またはその生物よりも多くの治療上関連するETaGを含有する。
一部の実施形態では、本開示は、
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
真菌核酸配列のうち少なくとも1種の内で、
クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内にあり、
発現される哺乳動物核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップと
を含む方法を提供する。
一部の実施形態では、本開示は、
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
真菌核酸配列のうち少なくとも1種の内で、
クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
発現される哺乳動物核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップと
を含む方法を提供する。
一部の実施形態では、近接ゾーンは、クラスターにおける生合成遺伝子の1~100以下、例えば、1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90または100kb以下上流または下流である。一部の実施形態では、近接ゾーンは、クラスターにおける生合成遺伝子の1~100以下、例えば、1、2、3、4、5、6、7、8、9または10kb以下上流または下流である。一部の実施形態では、ETaGは、生合成遺伝子クラスター内にある。一部の実施形態では、近接ゾーンは、生合成遺伝子クラスターの2種の生合成遺伝子の間にある。
一部の実施形態では、ETaG配列は、哺乳動物核酸配列と相同である。一部の実施形態では、哺乳動物配列は、ヒト核酸配列である。一部の実施形態では、ETaG配列は、ヒト核酸配列と相同である。一部の実施形態では、ETaG配列は、発現される哺乳動物核酸配列と相同である。一部の実施形態では、ETaG配列は、発現されるヒト核酸配列と相同である。一部の実施形態では、哺乳動物核酸、例えば、ヒト核酸配列は、ヒト疾患、障害または状態に関係する。一部の実施形態では、斯かるヒト核酸配列は、治療上の関心の既存の標的である。一部の実施形態では、斯かるヒト核酸配列は、治療上の関心の新規標的である。一部の実施形態では、斯かるヒト核酸配列は、例えば、小分子による標的化に対する感受性がないと以前にみなされた標的である。一部の実施形態では、関係した生合成遺伝子クラスターによってコードされる酵素によって産生された生合成産物、またはそのアナログは、ヒト標的のモジュレーター(例えば、活性化因子、阻害剤等)である。
一部の実施形態では、ETaG配列は、その配列またはその部分が、発現される哺乳動物核酸配列のものと少なくとも50%、60%、70%、80%または90%同一であるという点において、発現される哺乳動物核酸配列と相同である。一部の実施形態では、ETaG配列は、ETaGから産生されるmRNA、またはその部分が、哺乳動物核酸配列のものと相同であるという点において、哺乳動物核酸配列と相同である。一部の実施形態では、相同部分は、少なくとも50、100、150または200塩基対の長さである。一部の実施形態では、相同部分は、真菌から哺乳動物まで、保存されたタンパク質、またはタンパク質の保存された部分、例えば、タンパク質ドメイン、機能(例えば、別の分子(例えば、タンパク質、小分子、等)への相互作用、酵素活性、等)に関する残基のセット、等をコードする。
一部の実施形態では、ETaG配列は、ETaGによってコードされる産物、またはその部分が、哺乳動物核酸配列によってコードされるものと相同であるという点において、哺乳動物核酸配列と相同である。一部の実施形態では、ETaG配列は、ETaGによってコードされるタンパク質、またはその部分が、哺乳動物核酸配列によってコードされるものと相同であるという点において、哺乳動物核酸配列と相同である。一部の実施形態では、ETaG配列は、ETaGによってコードされるタンパク質の部分が、哺乳動物核酸配列によってコードされるものと相同であるという点において、哺乳動物核酸配列と相同である。
一部の実施形態では、タンパク質の部分は、タンパク質ドメインである。一部の実施形態では、タンパク質ドメインは、酵素ドメインである。一部の実施形態では、タンパク質ドメインは、1種または複数の薬剤、例えば、小分子、脂質、炭水化物、核酸、タンパク質、等と相互作用する。
一部の実施形態では、タンパク質の部分は、当該タンパク質が属するタンパク質ファミリーを定義する、機能および/または構造ドメインである。タンパク質(patent)ファミリーを定義する特異的触媒または構造ドメイン内で、予測サブファミリードメインアーキテクチャに基づき選択され、相同性のアライメント解析における使用のための、様々なアッセイによって必要に応じて検証され得る、アミノ酸残基が存在する。
一部の実施形態では、タンパク質の部分は、タンパク質の機能に重要な、連続したまたは連続していない、鍵となる残基のセットである。一部の実施形態では、機能は、酵素活性であり、タンパク質の部分は、活性に要求される残基のセットである。一部の実施形態では、機能は、酵素活性であり、タンパク質の部分は、基質、中間体または産物と相互作用する残基のセットである。一部の実施形態では、残基のセットは、基質と相互作用する。一部の実施形態では、残基のセットは、中間体と相互作用する。一部の実施形態では、残基のセットは、産物と相互作用する。
一部の実施形態では、機能は、1種または複数の薬剤、例えば、小分子、脂質、炭水化物、核酸、タンパク質、等との相互作用であり、タンパク質の部分は、相互作用に要求される残基のセットである。一部の実施形態では、残基のセットはそれぞれ独立して、相互作用剤(interacting agent)と接触する。例えば、一部の実施形態では、セットの残基のそれぞれは、相互作用小分子と独立して接触する。一部の実施形態では、タンパク質は、キナーゼであり、相互作用小分子は、核酸塩基であるまたはこれを含み、残基のセットはそれぞれ独立して、例えば、水素結合、静電力、ファンデルワールス力、芳香族スタッキング(aromatic stacking)、等を介して核酸塩基と接触する。一部の実施形態では、相互作用剤は、別の巨大分子である。一部の実施形態では、相互作用薬剤(interaction agent)は、核酸である。一部の実施形態では、残基のセットは、相互作用核酸と接触するセット、例えば、転写因子におけるセットである。一部の実施形態では、残基のセットは、相互作用タンパク質と接触するセットである。
一部の実施形態では、タンパク質の部分は、例えば、ヒト標的の三次タンパク質構造に基づく、タンパク質エフェクターリクルートメントおよび/または結合の必須構造エレメントであるか、またはこれを含む。
タンパク質ドメイン、生物学的機能の原因となる残基のセット等、タンパク質の部分は、本開示において説明されている通り、種から種へと、例えば、一部の実施形態では、真菌からヒトへと保存され得る。
一部の実施形態では、タンパク質相同性は、正確な同一性、例えば、所与の位置における同じアミノ酸残基に基づき測定される。一部の実施形態では、相同性は、1種または複数の特性、例えば、1種または複数の同一または同様の特性(例えば、極性、非極性、疎水性、親水性、サイズ、酸性、塩基性、芳香族、等)を有するアミノ酸残基に基づき測定される。相同性を評価するための例示的な方法は、本技術分野で広く公知であり、例えば、MUSCLE、TCoffee、ClustalW、等を用いて、本開示に従って利用することができる。
一部の実施形態では、ETaGによってコードされるタンパク質、またはその部分(例えば、本開示に記載されているもの)は、哺乳動物核酸配列によってコードされるものと少なくとも50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%または100%(100%の場合は同一)相同である。一部の実施形態では、ETaGによってコードされるタンパク質、またはその部分は、発現される哺乳動物核酸配列によってコードされるものと少なくとも50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%または100%相同である。
一部の実施形態では、ETaGは、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子と同時調節される。一部の実施形態では、ETaGは、生合成遺伝子クラスターにおける2種またはそれよりも多い遺伝子と同時調節される。一部の実施形態では、ETaGは、生合成遺伝子クラスターによってコードされる酵素によって産生された生合成産物(生合成遺伝子クラスターの生合成産物)が産生されると、ETaGの発現が増加されるまたはオンにされるという点において、生合成遺伝子クラスターと同時調節される。一部の実施形態では、ETaGは、生合成遺伝子クラスターの生合成産物のレベルが増加されると、ETaGの発現が増加されるまたはオンにされるという点において、生合成遺伝子クラスターと同時調節される。
一部の実施形態では、ETaG遺伝子配列は、必要に応じて、同じゲノムにおける1種または複数の遺伝子配列と約10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%または99%を超えて相同である。一部の実施形態では、ETaG遺伝子配列は、必要に応じて、同じゲノムにおける2、3、4、5、6、7、8、9種またはそれよりも多い遺伝子配列と約10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%または99%を超えて相同である。一部の実施形態では、相同性は、10%を超える。一部の実施形態では、相同性は、20%を超える。一部の実施形態では、相同性は、30%を超える。一部の実施形態では、相同性は、40%を超える。一部の実施形態では、相同性は、50%を超える。一部の実施形態では、相同性は、60%を超える。一部の実施形態では、相同性は、70%を超える。一部の実施形態では、相同性は、80%を超える。一部の実施形態では、相同性は、90%を超える。ある特定の例は、図に提示されている。
一部の実施形態では、ETaG遺伝子配列は、必要に応じて、異なる真菌株に由来し、相同生合成遺伝子クラスターを含むセットにおける少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%または99.9%真菌核酸配列におけるいずれかの発現される遺伝子配列と約10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%または99%以下同一である。一部の実施形態では、ETaG遺伝子配列は、必要に応じて、異なる真菌株由来の相同生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーン内にある少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%または99.9%真菌遺伝子配列と約10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%または99%以下同一である。一部の実施形態では、ETaG遺伝子配列は、必要に応じて、異なる真菌株由来の相同生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーン内にある少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%または99.9%真菌遺伝子配列と約10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%または99%以下同一である。一部の実施形態では、ETaG遺伝子配列は、必要に応じて、異なる真菌株に由来し、相同生合成遺伝子クラスターを含むセットにおけるいずれかの真菌核酸配列におけるいずれかの発現される遺伝子配列と約10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%または99%以下同一である。一部の実施形態では、ETaG遺伝子配列は、必要に応じて、異なる真菌株由来の相同生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーン内にあるいずれかの発現される遺伝子配列と約10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%または99%以下同一である。一部の実施形態では、これは、約10%以下同一である。一部の実施形態では、これは、約20%以下同一である。一部の実施形態では、これは、約30%以下同一である。一部の実施形態では、これは、約40%以下同一である。一部の実施形態では、これは、約50%以下同一である。一部の実施形態では、これは、約60%以下同一である。一部の実施形態では、これは、約70%以下同一である。一部の実施形態では、これは、約80%以下同一である。一部の実施形態では、これは、約90%以下同一である。
一部の実施形態では、ヒト標的遺伝子および/またはその産物は、生合成遺伝子クラスターの生合成産物またはそのアナログによるモジュレーションに対して感受性であり、ヒト標的遺伝子は、生合成遺伝子クラスター内に、またはクラスターの生合成遺伝子に対する近接ゾーンに、その相同ETaGを有する。一部の実施形態では、ヒト標的遺伝子によってコードされるタンパク質は、生合成遺伝子クラスターの生合成産物またはそのアナログによるモジュレーションに対して感受性であり、ヒト標的遺伝子は、生合成遺伝子クラスター内に、またはクラスターの生合成遺伝子に対する近接ゾーンに、その相同ETaGを有する。よって、一部の実施形態では、本開示は、新規ヒト標的を提供するのみならず、斯かるヒト標的をモジュレートするための方法および薬剤も提供する。
一部の実施形態では、本開示は、ETaGおよび/またはその医学的関連性、例えば、その治療的関連性を同定するための技術、例えば、方法、データベース、システム等を提供する。一部の実施形態では、本開示は、ETaG、関係した生合成遺伝子クラスター、生合成遺伝子クラスターの関係した生合成産物および/またはそのアナログ、関係した相同哺乳動物核酸配列(例えば、ヒト遺伝子)、等の効率的な同定、検索、使用等のために構造化された、必要に応じて様々なアノテーションを有するデータベースを提供する。とりわけ、本開示は、例えば、ETaG同定のためのコンピュータ処理効率および/または精度を改善するために構造化された、データベースおよび/または配列を提供する。
例えば、一部の実施形態では、提供されるデータベースは、全ての生合成遺伝子クラスターが同定およびアノテートされるように構築された。次いで、これらのクラスターの核酸配列は、真菌ゲノムにおける核酸配列の残りから計算的に切り取られ、データベース化された。次いで、生合成遺伝子クラスターのその結果生じるデータベースをETaG検索に使用した。とりわけ、ETaG検索におけるヒットが、斯かるデータベースを使用して同定された場合、生合成クラスター(またはその近接ゾーン)に存在した配列のみが検索されたため、ヒットはETaGであった。全ゲノム配列から生合成遺伝子クラスター配列を分離することは、シグナル対ノイズ比を改善し、ETaG検索プロセスを大いに迅速化する。とりわけ、提供されるデータベースの使用と比較すると、全真菌ゲノム配列におけるETaGの検索は、偽陽性を高頻度でもたらし、同定されたヒットは、生合成遺伝子クラスターまたはその近接ゾーンではなくゲノムに位置する「ハウスキーピング」遺伝子であった。一部の実施形態では、提供される技術(例えば、方法、データベース、等)から同定されたヒット、例えば、ETaGは、ハウスキーピング遺伝子ではない。一部の実施形態では、提供される技術から同定されたヒット、例えば、ETaGは、同じゲノムにおける第2の核酸配列(例えば、遺伝子)またはその部分と相同性を共有する配列であるか、またはこれを含む。本開示における配列の配列相同性は、少なくとも20%、30%、40%、50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99.5%であり得る。一部の実施形態では、相同性は、少なくとも50%;一部の実施形態では、少なくとも60%;一部の実施形態では、少なくとも70%;一部の実施形態では、少なくとも75%;一部の実施形態では、少なくとも80%;一部の実施形態では、少なくとも85%;一部の実施形態では、少なくとも90%;および一部の実施形態では、少なくとも95%である。本開示の配列の部分は、少なくとも5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900または1000個のアミノ酸残基(タンパク質配列の場合)または核酸塩基(核酸配列の場合)を含むことができる。一部の実施形態では、核酸配列の部分は、少なくとも10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450、500、600、700、800、900または1000核酸塩基の長さである。一部の実施形態では、長さは、少なくとも20核酸塩基である。一部の実施形態では、長さは、少なくとも30核酸塩基である。一部の実施形態では、長さは、少なくとも40核酸塩基である。一部の実施形態では、長さは、少なくとも50核酸塩基である。一部の実施形態では、長さは、少なくとも100核酸塩基である。一部の実施形態では、長さは、少なくとも150核酸塩基である。一部の実施形態では、長さは、少なくとも200核酸塩基である。一部の実施形態では、長さは、少なくとも300核酸塩基である。一部の実施形態では、長さは、少なくとも400核酸塩基である。一部の実施形態では、長さは、少なくとも500核酸塩基である。一部の実施形態では、提供される技術から同定されたヒット、例えば、ETaGは、同じゲノムにおける第2の核酸配列(例えば、遺伝子)によってコードされる産物、またはその部分(例えば、本開示に記載されている通り、タンパク質の鍵となる残基のセット、タンパク質ドメイン、等)と相同性(例えば、少なくとも50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99.5%)を共有する産物、例えば、タンパク質をコードする配列であるか、またはこれを含む。本明細書に記載されている通り、相同性/類似性は、当業者によって認められる通り、種々の技術を使用して評価することができる。一部の実施形態では、第2の核酸配列は、ハウスキーピング遺伝子であるか、またはこれを含む。一部の実施形態では、第2の核酸配列は、2またはそれよりも多い種の間で共有される。一部の実施形態では、ETaGが、その対応する生合成クラスターの産物(例えば、小分子)に対する抵抗性をもたらす産物(例えば、タンパク質)をコードするが、第2の核酸配列はこれをコードしないという点において、ETaGは、第2の核酸配列と相同であるが、第2の核酸配列とは異なる。
一部の実施形態では、本開示は、
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットを表すデータを記憶する、1個または複数の非一過性機械可読記憶媒体
を含むシステムを提供する。
一部の実施形態では、本開示は、
それぞれETaG配列であるか、またはETaG配列を含む、核酸配列のセットを表すデータを記憶する、1個または複数の非一過性機械可読記憶媒体
を含むシステムを提供する。
一部の実施形態では、セットの核酸配列の少なくとも10、20、50、100、200もしくは500種または少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは95%または全てが、インデックス化されたおよび/またはアノテートされたETaGを含む。一部の実施形態では、提供されるシステムは、処理されるべきデータの量を大幅に低下させるように構造化されているため、コンピュータ処理効率を大幅に改善することができる。例えば、1種または複数の(場合によっては、数百もしくは数千種またはさらに多くの)真菌ゲノムの全てのゲノムまたは生合成遺伝子クラスター配列データを処理して、ETaGを検索する代わりに、提供されるシステムは、ETaGとしてインデックス化された/マークされた遺伝子のみを検索し、これにより、ETaGとしてインデックス化されていない配列の処理に使用される時間およびコストを節約することができる。その上およびそれに代えて、ETaGは、その関係した生合成遺伝子クラスター(これは、その近接ゾーン内にETaGがある生合成遺伝子を含有する)、関係した生合成遺伝子クラスターの生合成産物の構造、および/またはETaGのヒトホモログ等の情報により独立してアノテートされ得る。一部の実施形態では、セットのETaGの少なくとも10、20、50、100、200もしくは500種または少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは95%または全てが、次のうち少なくとも1種により独立してアノテートされる:関係した生合成遺伝子クラスター、およびETaGのヒトホモログ。一部の実施形態では、セットのETaGの少なくとも10、20、50、100、200もしくは500種または少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは95%または全てが、次のうち少なくとも1種により独立してアノテートされる:関係した生合成遺伝子クラスター、関係した生合成遺伝子クラスターの生合成産物、およびETaGのヒトホモログ。一部の実施形態では、ETaGインデックスおよびアノテーションにより配列データを構造化することにより、提供されるシステムは、多数の利点を提供することができる。例えば、一部の実施形態では、提供されるシステムは、データサイズおよびコストを低く維持しつつ、有用な関係した情報、例えば、その関係した生合成遺伝子クラスターおよびヒトホモログによりETaGへの高速アクセスを提供する(逆もまた同じ)。
一部の実施形態では、とりわけ、提供される方法およびシステムは、生合成遺伝子クラスター、ETaGおよびヒト標的遺伝子の間に関連性を提供するため、提供される方法およびシステムは、ヒト標的同定および/または特徴付けに有用である。一部の実施形態では、本開示は、真菌におけるその相同ETaGおよび関係した生合成遺伝子クラスターを提供することにより、特に、本開示に先立ちドラッガブルではないとみなされた標的への洞察を提供する。一部の実施形態では、本開示は、本開示に先立ちドラッガブルではないとみなされた標的のドラッガビリティを大幅に改善し、場合によっては、例えば、真菌におけるその相同ETaG、関係した生合成遺伝子クラスター、関係した生合成遺伝子クラスターの生合成産物(これは、ヒト標的のモジュレーターとして直接的に使用することができる、および/または、そのアナログをモジュレーターとして使用することができる)によって、これをドラッガブル標的へと本質的に変換する。
一部の実施形態では、本開示は、生合成遺伝子クラスターの生合成産物のヒト標的、または産物のアナログを同定するおよび/または特徴付けるための方法を提供する。
一部の実施形態では、本開示は、
生合成遺伝子クラスターの少なくとも1種の遺伝子に対する近接ゾーン内にある、または第2の生合成遺伝子クラスターの少なくとも1種の遺伝子に対する近接ゾーン内にあるETaGのヒトホモログを同定するステップであって、この第2の生合成遺伝子クラスターが、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物を産生する酵素をコードする、ステップと、
ヒト標的に対する、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物、または産物のアナログの効果を必要に応じてアッセイするステップと
を含む方法を提供する。
一部の実施形態では、本開示は、
生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にある、または第2の生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にあるETaGのヒトホモログを同定するステップであって、この第2の生合成遺伝子クラスターが、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物を産生する酵素をコードする、ステップと、
ヒト標的に対する、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物、または産物のアナログの効果を必要に応じてアッセイするステップと
を含む方法を提供する。
一部の実施形態では、本開示は、
生合成遺伝子クラスターの少なくとも1種の遺伝子に対する近接ゾーン内にあるETaGのヒトホモログを同定するステップと、
ヒト標的に対する、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物、または産物のアナログの効果を必要に応じてアッセイするステップと
を含む方法を提供する。
一部の実施形態では、本開示は、
生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にあるETaGのヒトホモログを同定するステップと、
ヒト標的に対する、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物、または産物のアナログの効果を必要に応じてアッセイするステップと
を含む方法を提供する。
一部の実施形態では、その近接ゾーンがETaGを含有する生合成遺伝子を含まない生合成遺伝子クラスターに関して、斯かる生合成遺伝子クラスターの産物(および/またはそのアナログ)の哺乳動物標的、例えば、ヒト標的は、同じ生合成産物を産生する酵素をコードする第2の生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーンに存在するETaGを介して同定することができる。一部の実施形態では、第2の生合成遺伝子クラスターは、異なる生物に存在する。一部の実施形態では、第2の生合成遺伝子クラスターは、異なる真菌株に存在する。
一部の実施形態では、本開示は、生合成遺伝子クラスターの生合成産物のヒト標的、または産物のアナログを同定するおよび/または特徴付けるための方法であって、
第2の生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にあるETaGのヒトホモログを同定するステップであって、この第2の生合成遺伝子クラスターが、生合成遺伝子クラスターによってコードされる酵素によって産生される同じ生合成産物を産生する酵素をコードする、ステップと、
ヒト標的に対する、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物、または産物のアナログの効果を必要に応じてアッセイするステップと
を含む方法を提供する。
一部の実施形態では、提供される技術は、化合物とヒト標的との相互作用の評価に有用である。一部の実施形態では、本開示は、化合物とヒト標的との相互作用を評価(access)するための方法であって、
ヒト標的の核酸配列、またはヒト標的をコードする核酸配列を、1種または複数のETaGを含む核酸配列のセットと比較するステップ
を含む方法を提供する。
一部の実施形態では、ETaG(その部分を含む、核酸レベルまたはタンパク質レベル)との相同性から、ETaGおよびその生合成産物の関係した生合成遺伝子クラスターにたどり着く。一部の実施形態では、生合成産物およびヒト標的の間の斯かる関連性は、ヒト標的、またはそれによってコードされる産物の相互作用および/またはモジュレーションを示す。一部の実施形態では、斯かる生合成産物は、ヒト標的、またはそれによってコードされる産物と相互作用する、および/またはこれをモジュレートする。
一部の実施形態では、とりわけ、提供される技術は、生合成遺伝子クラスター、ETaG、およびヒト標的遺伝子の間の関連性を提供するため、提供される技術は、ヒト標的のためのモジュレーターの設計および/または提供に有用である。
一部の実施形態では、本開示は、生合成遺伝子クラスターによってコードされる酵素の産物である化合物であって、生合成遺伝子クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、化合物を提供する。
一部の実施形態では、提供される化合物は、提供される生合成遺伝子クラスターによってコードされる酵素の産物である。一部の実施形態では、提供される化合物は、提供される生合成遺伝子クラスターによってコードされる酵素の産物のアナログである。一部の実施形態では、提供される生合成遺伝子クラスターは、図5~図12および図20~図39のうち1つに提示されている1種または複数の生合成遺伝子を含む。一部の実施形態では、提供される生合成遺伝子クラスターは、図5~図12および図20~図39のうち1つである。一部の実施形態では、提供される化合物は、図5~図12および図20~図39のうち1つに提示されている提供される生合成遺伝子クラスターによってコードされる酵素の産物である。一部の実施形態では、提供される化合物は、図5~図12および図20~図39のうち1つに提示されている提供される生合成遺伝子クラスターの産物、または図5~図12および図20~図39のうち1つに提示されている1種もしくは複数の生合成遺伝子を含む生合成遺伝子クラスターである。一部の実施形態では、提供される化合物は、図5~図12および図20~図39のうち1つに提示されている提供される生合成遺伝子クラスターの産物である。一部の実施形態では、提供される化合物は、図5~図12および図20~図39のうち1つに提示されている1種または複数の生合成遺伝子を含む提供される生合成遺伝子クラスターの産物である。一部の実施形態では、提供される化合物は、図5~図12および図20~図39のうち1つに提示されている提供される生合成遺伝子クラスターによってコードされる酵素の産物のアナログである。一部の実施形態では、提供される化合物は、図5~図12および図20~図39のうち1つに提示されている1種または複数の生合成遺伝子を含む提供される生合成遺伝子クラスターの産物のアナログである。一部の実施形態では、提供される化合物は、ヒト標的の機能をモジュレートする。一部の実施形態では、本開示は、提供される化合物の医薬組成物を提供する。一部の実施形態では、本開示は、提供される化合物またはその薬学的に許容される塩を含む医薬組成物を提供する。一部の実施形態では、本開示は、提供される化合物またはその薬学的に許容される塩、および薬学的に許容される担体を含む医薬組成物を提供する。一部の実施形態では、提供される組成物における提供される化合物は、生合成遺伝子クラスターによってコードされる酵素の産物またはその塩のアナログである。一部の実施形態では、提供される組成物における提供される化合物は、生合成遺伝子クラスターによってコードされる酵素の産物の非天然塩である。
一部の実施形態では、本開示は、ヒト標的のモジュレーターを同定するおよび/または特徴付けるための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、生合成遺伝子クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップを含む方法を提供する。
一部の実施形態では、本開示は、ヒト標的のモジュレーターを同定するおよび/または特徴付けるための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップを含む方法を提供する。
一部の実施形態では、本開示は、ヒト標的をモジュレートするための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、生合成遺伝子クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップを含む方法を提供する。
一部の実施形態では、本開示は、ヒト標的をモジュレートするための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップを含む方法を提供する。
一部の実施形態では、本開示は、ヒト標的に関連する状態、障害または疾患を処置するための方法であって、それに対して感受性であるまたはそれを患う被験体に、生合成産物またはそのアナログを投与するステップを含み、
生合成産物が、生合成遺伝子クラスターのものであり、生合成遺伝子クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、方法を提供する。
一部の実施形態では、本開示は、ヒト標的に関連する状態、障害または疾患を処置するための方法であって、それに対して感受性であるまたはそれを患う被験体に、生合成産物またはそのアナログを投与するステップを含み、
生合成産物が、生合成遺伝子クラスターのものであり、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、方法を提供する。
一部の実施形態では、ヒト標的は、Rasタンパク質である。一部の実施形態では、ヒト標的は、RasGEFドメインを含む。一部の実施形態では、ヒト標的は、RasGAPドメインを含む。
一部の実施形態では、ETaGは、提供される方法によって同定される。
一部の実施形態では、産物(例えば、生合成産物)は、真菌によって産生される。一部の実施形態では、産物は、非環式である。一部の実施形態では、産物は、ポリケタイドである。一部の実施形態では、産物は、テルペン化合物である。一部の実施形態では、産物は、非リボソーム的に合成される。
一部の実施形態では、アナログは、参照物質と、1種または複数の特定の構造的特色、エレメント、構成成分または部分を共有する物質である。典型的には、アナログは、参照物質との有意な構造的類似性、例えば、コアまたはコンセンサス構造の共有を示すが、同様に、ある特定の別々の仕方で異なる。一部の実施形態では、アナログは、例えば、参照物質の化学的操作によって、参照物質から生成され得る物質である。一部の実施形態では、アナログは、参照物質を生成するプロセスと実質的に同様の(例えば、これと複数のステップを共有する)合成プロセスの実行により生成され得る物質である。一部の実施形態では、アナログは、参照物質の生成に使用されるプロセスとは異なる合成プロセスの実行により生成されるまたはされ得る。一部の実施形態では、物質のアナログは、その置換可能な位置のうち1個または複数において置換されている物質である。
一部の実施形態では、産物のアナログは、産物の構造的コアを含む。一部の実施形態では、生合成産物は、環式、例えば、単環式、二環式または多環式であり、産物の構造的コアは、単環式、二環式または多環式環系であるか、またはこれを含む。一部の実施形態では、産物は、ポリペプチドであるまたはこれを含み、構造的コアは、ポリペプチドの骨格である。一部の実施形態では、産物は、ポリケタイドであるまたはこれを含み、構造的コアは、ポリケタイドの骨格である。
一部の実施形態では、アナログは、置換された生合成産物である。一部の実施形態では、アナログは、本明細書に記載されている1個または複数の置換基で置換された構造的コアであるか、またはこれを含む。
一部の実施形態では、本開示は、提供される生合成遺伝子クラスターの生合成産物またはそのアナログの組成物であって、ETaGが、生合成遺伝子クラスターの少なくとも1種の遺伝子に対する近接ゾーン内に存在する、組成物を提供する。一部の実施形態では、提供される組成物は、医薬組成物である。一部の実施形態では、提供される医薬組成物は、提供される生合成遺伝子クラスターの生合成産物またはそのアナログの薬学的に許容される塩と、薬学的に許容される担体とを含み、ETaGは、生合成遺伝子クラスターの少なくとも1種の遺伝子に対する近接ゾーン内に存在する。
一部の実施形態では、一方の存在、レベルおよび/または形態が、他方のそれと相関する場合、2種の事象または実体は、互いに関連する。例えば、その存在、レベルおよび/または形態が、疾患、障害または状態の発生率(incidence)および/またはそれに対する感受率(susceptibility)(例えば、関連する集団にわたる)と相関する場合、特定の実体(例えば、ポリペプチド、遺伝的シグネチャー、代謝物、微生物、等)は、特定の疾患、障害または状態と関連するとみなされる。
一部の実施形態では、疾患は、がんである。一部の実施形態では、疾患は、感染性疾患である。一部の実施形態では、疾患は、心臓疾患である。一部の実施形態では、疾患は、脂質、タンパク質、ヒト代謝物、等のレベルに関連する。
図1は、Penicillium vulpinum IBT 29486において同定されたブレフェルジンA ETaGを描写する。同定されたETaG例は、Sec7グアニンヌクレオチド交換因子スーパーファミリー(pfam01369)である。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Sec7ドメインのものである。
図2は、Aspergillus terreus ATCC 20542において同定されたロバスタチンETaGを描写する。同定されたETaG例は、ヒドロキシメチルグルタリルコエンザイムAレダクターゼ(HMG-CoA;pfam00368)である。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、HMG-CoAドメインのものである。
図3は、Aspergillus nidulans FGSC A4において同定されたフェルタミド(Fellutamide)ETaGを描写する。同定されたETaG例は、プロテアソーム20Sベータ-サブユニット(pfam00227)である。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、20Sベータ-のものである。
図4は、Tolypocladium inflatum NRRL 8044において同定されたシクロスポリンETaGを描写する。同定されたETaG例は、シクロフィリン型ペプチジルプロリル、シス・トランスイソメラーゼ(pfam00160)である。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、シクロフィリンドメインのものである。
図5は、Thermomyces lanuginosus ATCC 200065(公共)において同定されたRas ETaGを描写する。同定されたETaG例は、Rasファミリーに由来する(pfam00071)。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Rasドメインのものである。ETaGは、スケールの下に提示されている。
図6は、Talaromyces leycettanus株CBS 398.68において同定されたRas ETaGを描写する。同定されたETaG例は、Rasファミリーに由来する(pfam00071)。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Rasドメインのものである。ETaGは、スケールの下に提示されている。
図7は、Sistotremastrum niveocremeum HHB9708またはSistotremastrum suecicum HHB10207(National Forestry Service)において同定されたRas ETaGを描写する。同定されたETaG例は、Rasファミリーに由来する(pfam00071)。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Rasドメインのものである。ETaGは、スケールの下に提示されている。
図8は、Agaricus bisporus var.burnettii JB137-S8(Fungal Genome Stock Center)において同定されたRas ETaGを描写する。同定されたETaG例は、Rasファミリーに由来する(pfam00071)。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Rasドメインのものである。ETaGは、スケールの下に提示されている。
図9は、Coprinopsis cinerea okayama 7#130(Fungal Genome Stock Center)において同定されたRas ETaGを描写する。同定されたETaG例は、Rasファミリーに由来する(pfam00071)。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Rasドメインのものである。ETaGは、スケールの下に提示されている。
図10は、Colletotrichum higginsianum IMI 349063(CABI)において同定されたRas ETaGを描写する。同定されたETaG例は、Rasファミリーに由来する(pfam00071)。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Rasドメインのものである。ETaGは、スケールの下に提示されている。
図11は、Gyalolechia flavorubescens KoLRI002931において同定されたRas ETaGを描写する。同定されたETaG例は、Rasファミリーに由来する(pfam00071)。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Rasドメインのものである。ETaGは、スケールの下に提示されている。
図12は、Bipolaris maydis ATCC 48331において同定されたRas ETaGを描写する。同定されたETaG例は、Rasファミリーに由来する(pfam00071)。配列類似性は、MUSCLEアライメントアルゴリズムを使用して計算された、Rasドメインのものである。ETaGは、スケールの下に提示されている。
図13は、ヒトRas遺伝子およびある特定の同定されたRas ETaGのアライメントを描写する。図示されている通り、ヒトRas遺伝子および提示されているETaGは、KRASヌクレオチド結合残基の多くの位置において同じアミノ酸残基を共有する。
図14は、ヒトRas遺伝子およびある特定の同定されたRas ETaGのアライメントを描写する。図示されている通り、ヒトRas遺伝子および提示されているETaGは、BRAFの4Å以内にあるKRAS残基の多くの位置において同じアミノ酸残基を共有する。
図15は、ヒトRas遺伝子およびある特定の同定されたRas ETaGのアライメントを描写する。図示されている通り、ヒトRas遺伝子および提示されているETaGは、rasGAPの4Å以内にあるKRAS残基の多くの位置において同じアミノ酸残基を共有する。
図16は、ヒトRas遺伝子およびある特定の同定されたRas ETaGのアライメントを描写する。図示されている通り、ヒトRas遺伝子および提示されているETaGは、SOSの4Å以内にあるKRAS残基の多くの位置において同じアミノ酸残基を共有する。
図17は、ETaGがインデックス化された/マークされた(暗色)配列例を描写する。
図18は、Penicillium vulpinum IBT 29486におけるSec7ホモログを含む生合成遺伝子クラスターを描写する。
図19は、Sec7の配列アライメントを描写する。(A)ブレフェルジンA相互作用残基例。(B)配列アライメント例。 図19は、Sec7の配列アライメントを描写する。(A)ブレフェルジンA相互作用残基例。(B)配列アライメント例。
図20は、例えば、Thermomyces lanuginosus ATCC 200065、Aspergillus rambelliおよびAspergillus ochraceoroseusに由来するRasに関係する生合成遺伝子クラスター例を描写する。説明されているRasホモログは、黒色で示されている。
図21は、例えば、Agaricus bisporus var.burnettii JB137-S8、Agaricus bisporus H97、Coprinopsis cinerea okayama、Hypholoma sublateritum FD-334に由来するRasに関係する生合成遺伝子クラスター例を描写する。説明されているRasホモログは、黒色で示されている。
図22は、例えば、Sistotremastrum niveocremeum HHB9708およびSistotremastrum suecicum HHB10207に由来するRasに関係する生合成遺伝子クラスター例を描写する。説明されているRasホモログは、黒色で示されている。
図23は、例えば、Talaromyces leycettanus株CBS 398.68に由来するRasに関係する生合成遺伝子クラスター例を描写する。説明されているRasホモログは、黒色で示されている。
図24は、例えば、Thermoascus crustaceusに由来するRasに関係する生合成遺伝子クラスター例を描写する。説明されているRasホモログは、黒色で示されている。
図25は、例えば、Bipolaris maydis ATCC 48331に由来するRasに関係する生合成遺伝子クラスター例を描写する。説明されているRasホモログは、黒色で示されている。
図26は、例えば、Colletotrichum higginsianum IMI 349063(CABI)に由来するRasに関係する生合成遺伝子クラスター例を描写する。説明されているRasホモログは、黒色で示されている。
図27は、例えば、Gyalolechia flavorubescensに由来するRasに関係する生合成遺伝子クラスター例を描写する。説明されているRasホモログは、黒色で示されている。
図28は、例えば、Penicillium chrysogenum Wisconsin 54-1255およびLecanosticta acicola CBS 871.95に由来するRasGEFに関係する生合成遺伝子クラスター例を描写する。説明されているRasGEFホモログは、黒色で示されている。
図29は、例えば、Magnaporthe oryzae 70-15に由来するRasGEFに関係する生合成遺伝子クラスター例を描写する。説明されているRasGEFホモログは、黒色で示されている。
図30は、例えば、Arthroderma gypseum CBS 118893に由来するRasGEFに関係する生合成遺伝子クラスター例を描写する。説明されているRasGEFホモログは、黒色で示されている。
図31は、例えば、Endocarpon pusillum株KoLRI No.LF000583に由来するRasGEFに関係する生合成遺伝子クラスター例を描写する。説明されているRasGEFホモログは、黒色で示されている。
図32は、例えば、Fistulina hepatica ATCC 64428に由来するRasGEFに関係する生合成遺伝子クラスター例を描写する。説明されているRasGEFホモログは、黒色で示されている。
図33は、例えば、Aureobasidium pullulans var.pullulans EXF-150に由来するRasGEFに関係する生合成遺伝子クラスター例を描写する。説明されているRasGEFホモログは、黒色で示されている。
図34は、例えば、Acremonium furcatum var.pullulans EXF-150に由来するRasGAPに関係する生合成遺伝子クラスター例を描写する。説明されているRasGAPホモログは、黒色で示されている。
図35は、例えば、Purpureocillium lilacinum株TERIBC 1およびFusarium sp.JS1030に由来するRasGEFに関係する生合成遺伝子クラスター例を描写する。説明されているRasGEFホモログは、黒色で示されている。
図36は、例えば、Corynespora cassiicola UM 591およびMagnaporthe oryzae株SV9610に由来するRasGAPに関係する生合成遺伝子クラスター例を描写する。説明されているRasGAPホモログは、黒色で示されている。
図37は、例えば、Colletotrichum acutatum株1 KC05_01に由来するRasGAPに関係する生合成遺伝子クラスター例を描写する。説明されているRasGAPホモログは、黒色で示されている。
図38は、例えば、Hypoxylon sp.E7406BおよびDiaporthe ampelina単離株DA912に由来するRasGAPに関係する生合成遺伝子クラスター例を描写する。説明されているRasGAPホモログは、黒色で示されている。
図39は、例えば、Talaromyces piceae株9-3およびSporothrix insectorum RCEF 264に由来するRasGAPに関係する生合成遺伝子クラスター例を描写する。説明されているRasGAPホモログは、黒色で示されている。
1.定義
本明細書で使用される場合、他に指示がなければ、次の定義が適用されるものとする。本開示の目的のため、化学元素は、the Periodic Table of the Elements, CAS version, Handbook of Chemistry and Physics, 75th Edに従って同定される。その上、有機化学の一般原則は、“Organic Chemistry”, Thomas Sorrell, University Science Books, Sausalito: 1999および“March’s Advanced Organic Chemistry”, 5th Ed., Ed.: Smith, M.B. and March, J., John Wiley & Sons, New York: 2001に記載されている。
脂肪族:本明細書で使用される場合、「脂肪族」は、完全に飽和した、または1もしくは複数単位の不飽和を含有する、直鎖(すなわち、非分枝)または分枝、置換または非置換の炭化水素鎖、あるいは完全に飽和した、または1もしくは複数単位の不飽和を含有する、置換または非置換の単環式、二環式または多環式炭化水素環、あるいはこれらの組合せを意味する。他に指定がなければ、脂肪族基は、1~100個の脂肪族炭素原子を含有する。一部の実施形態では、脂肪族基は、1~20個の脂肪族炭素原子を含有する。他の実施形態では、脂肪族基は、1~10個の脂肪族炭素原子を含有する。他の実施形態では、脂肪族基は、1~9個の脂肪族炭素原子を含有する。他の実施形態では、脂肪族基は、1~8個の脂肪族炭素原子を含有する。他の実施形態では、脂肪族基は、1~7個の脂肪族炭素原子を含有する。他の実施形態では、脂肪族基は、1~6個の脂肪族炭素原子を含有する。また他の実施形態では、脂肪族基は、1~5個の脂肪族炭素原子を含有し、さらに他の実施形態では、脂肪族基は、1、2、3または4個の脂肪族炭素原子を含有する。適した脂肪族基として、線形または分枝、置換または非置換のアルキル、アルケニル、アルキニル基、およびこれらのハイブリッドが挙げられるがこれらに限定されない。
アルキル:本明細書で使用される場合、用語「アルキル」は、本技術分野におけるその通常の意味を与えられ、直鎖アルキル基、分枝鎖アルキル基、シクロアルキル(脂環式)基、アルキル置換シクロアルキル基およびシクロアルキル置換アルキル基を含む飽和脂肪族基を含むことができる。一部の実施形態では、アルキルは、1~100個の炭素原子を有する。ある特定の実施形態では、直鎖または分枝鎖アルキルは、その骨格に約1~20個の炭素原子(例えば、直鎖ではC~C20、分枝鎖ではC~C20)、代替的に、約1~10個の炭素原子を有する。一部の実施形態では、シクロアルキル環は、斯かる環が単環式、二環式または多環式である場合、その環構造に約3~10個の炭素原子を有し、代替的に、環構造に約5、6または7個の炭素を有する。一部の実施形態では、アルキル基は、低級アルキル基であり得、低級アルキル基は、1~4個の炭素原子を含む(例えば、直鎖低級アルキルではC~C)。
アリール:単独で、または「アラルキル」、「アラルコキシ(aralkoxy)」もしくは「アリールオキシアルキル」におけるようなより大型の部分の一部として使用される用語「アリール」は、総計5~30環員を有する単環式、二環式または多環式環系を指し、系中の少なくとも1個の環は、芳香族である。一部の実施形態では、アリール基は、総計5~14環員を有する単環式、二環式または多環式環系であり、系中の少なくとも1個の環は、芳香族であり、系中の各環は、3~7環員を含有する。一部の実施形態では、アリール基は、ビアリール基である。用語「アリール」は、用語「アリール環」と互換的に使用することができる。本開示のある特定の実施形態では、「アリール」は、1個または複数の置換基を有することができる、フェニル、ビフェニル、ナフチル、ビナフチル、アントラシル(anthracyl)その他が挙げられるがこれらに限定されない、芳香族環系を指す。一部の実施形態では、本明細書で使用される際の用語「アリール」の範囲内には、インダニル、フタルイミジル、ナフトイミジル(naphthimidyl)、フェナントリジニル(phenanthridinyl)またはテトラヒドロナフチルその他等、1個または複数の非芳香族環に芳香族環が融合された基も含まれ、遊離基または取り付けポイントは、アリール環にある。
脂環式:用語「脂環式」は、本明細書で使用される場合、例えば、3~30員を有する飽和または部分的に不飽和の脂肪族単環式、二環式または多環式環系を指し、脂肪族環系は、必要に応じて置換されている。脂環式基は、シクロプロピル、シクロブチル、シクロペンチル、シクロペンテニル、シクロヘキシル、シクロヘキセニル、シクロヘプチル、シクロヘプテニル、シクロオクチル、シクロオクテニル、ノルボルニル、アダマンチルおよびシクロオクタジエニルを限定することなく含む。一部の実施形態では、シクロアルキルは、3~6個の炭素を有する。用語「脂環式」は、デカヒドロナフチルまたはテトラヒドロナフチル等、1個または複数の芳香族または非芳香族環に融合された脂肪族環を含むこともでき、遊離基または取り付けポイントは、脂肪族環にある。一部の実施形態では、炭素環式基は、二環式である。一部の実施形態では、炭素環式基は、三環式である。一部の実施形態では、炭素環式基は、多環式である。一部の実施形態では、「脂環式」(または「炭素環」もしくは「シクロアルキル」)は、単環式C~C炭化水素、または完全に飽和したまたは1もしくは複数単位の不飽和を含有するが、芳香族ではない、C~C10二環式炭化水素、または完全に飽和したまたは1もしくは複数単位の不飽和を含有するが、芳香族ではない、C~C16三環式炭化水素を指す。
ハロゲン:用語「ハロゲン」は、F、Cl、BrまたはIを意味する。
ヘテロ脂肪族:用語「ヘテロ脂肪族」は、本技術分野におけるその通常の意味を与えられ、1個または複数の炭素原子が、1個または複数のヘテロ原子(例えば、酸素、窒素、硫黄、ケイ素、リンその他)に置き換えられた、本明細書に記載されている脂肪族基を指す。
ヘテロアルキル:用語「ヘテロアルキル」は、本技術分野におけるその通常の意味を与えられ、1個または複数の炭素原子が、ヘテロ原子(例えば、酸素、窒素、硫黄、ケイ素、リンその他)に置き換えられた、本明細書に記載されているアルキル基を指す。ヘテロアルキル基の例として、アルコキシ、ポリ(エチレングリコール)-、アルキル-置換アミノ、テトラヒドロフラニル、ピペリジニル、モルフォリニル等が挙げられるがこれらに限定されない。
ヘテロアリール:単独で、またはより大型の部分、例えば、「ヘテロアラルキル」もしくは「ヘテロアラルコキシ」の一部として使用される用語「ヘテロアリール」および「ヘテロアル-(heteroar-)」は、例えば、総計5~30環員を有する単環式、二環式または多環式環系を指し、系中の少なくとも1個の環が芳香族であり、少なくとも1個の芳香族環原子がヘテロ原子である。一部の実施形態では、ヘテロ原子は、窒素、酸素または硫黄である。一部の実施形態では、ヘテロアリール基は、5~10個の環原子(すなわち、単環式、二環式または多環式)、一部の実施形態では、5、6、9または10個の環原子を有する基である。一部の実施形態では、ヘテロアリール基は、環式アレイにおいて共有される6、10または14個のπ電子を有し;炭素原子に加えて、1~5個のヘテロ原子を有する。ヘテロアリール基は、チエニル、フラニル、ピロリル、イミダゾリル、ピラゾリル、トリアゾリル、テトラゾリル、オキサゾリル、イソオキサゾリル、オキサジアゾリル、チアゾリル、イソチアゾリル、チアジアゾリル、ピリジル、ピリダジニル、ピリミジニル、ピラジニル、インドリジニル(indolizinyl)、プリニル(purinyl)、ナフチリジニル(naphthyridinyl)およびプテリジニルを限定することなく含む。一部の実施形態では、ヘテロアリールは、ビピリジルその他等、ヘテロビアリール基である。用語「ヘテロアリール」および「ヘテロアル-(heteroar-)」は、本明細書で使用される場合、ヘテロ芳香族環が、1個または複数のアリール、脂環式またはヘテロシクリル(heterocyclyl)環に融合された基も含み、遊離基または取り付けポイントは、ヘテロ芳香族環にある。非限定的な例として、インドリル、イソインドリル、ベンゾチエニル、ベンゾフラニル、ジベンゾフラニル、インダゾリル、ベンズイミダゾリル、ベンズチアゾリル、キノリル、イソキノリル、シンノリニル(cinnolinyl)、フタラジニル(phthalazinyl)、キナゾリニル、キノキサリニル、4H-キノリジニル(quinolizinyl)、カルバゾリル、アクリジニル、フェナジニル、フェノチアジニル(phenothiazinyl)、フェノキサジニル(phenoxazinyl)、テトラヒドロキノリニル、テトラヒドロイソキノリニルおよびピリド[2,3-b]-1,4-オキサジン-3(4H)-オンが挙げられる。ヘテロアリール基は、単環式、二環式または多環式であり得る。用語「ヘテロアリール」は、用語「ヘテロアリール環」、「ヘテロアリール基」または「ヘテロ芳香族」と互換的に使用することができ、これらの用語はいずれも、必要に応じて置換された環を含む。用語「ヘテロアラルキル」は、ヘテロアリール基によって置換されたアルキル基を指し、アルキルおよびヘテロアリール部分は独立して、必要に応じて置換されている。
ヘテロ原子:用語「ヘテロ原子」は、炭素でも水素でもない原子を意味する。一部の実施形態では、ヘテロ原子は、酸素、硫黄、窒素、リン、ホウ素またはケイ素(窒素、硫黄、リンまたはケイ素のいずれかの酸化型;複素環式環のいずれかの塩基性窒素または置換可能な窒素(例えば、3,4-ジヒドロ-2H-ピロリルにおけるようなN)、NH(ピロリジニルにおけるような)またはNR(N置換ピロリジニルにおけるような)の四級化型;等を含む)である。一部の実施形態では、ヘテロ原子は、ホウ素、窒素、酸素、ケイ素、硫黄またはリンである。一部の実施形態では、ヘテロ原子は、窒素、酸素、ケイ素、硫黄またはリンである。一部の実施形態では、ヘテロ原子は、窒素、酸素、硫黄またはリンである。一部の実施形態では、ヘテロ原子は、窒素、酸素または硫黄である。
ヘテロシクリル:本明細書で使用される場合、用語「複素環」、「ヘテロシクリル」、「複素環遊離基」および「複素環式環」は、互換的に使用され、飽和または部分的に不飽和し、1個または複数のヘテロ原子の環原子を有する、単環式、二環式または多環式環部分(例えば、3~30員の)を指す。一部の実施形態では、ヘテロ原子は、ホウ素、窒素、酸素、ケイ素、硫黄またはリンである。一部の実施形態では、ヘテロ原子は、窒素、酸素、ケイ素、硫黄またはリンである。一部の実施形態では、ヘテロ原子は、窒素、酸素、硫黄またはリンである。一部の実施形態では、ヘテロ原子は、窒素、酸素または硫黄である。一部の実施形態では、ヘテロシクリル基は、飽和または部分的に不飽和の、炭素原子に加えて、上に定義されている1個または複数の、好ましくは、1~4個のヘテロ原子を有する、安定した5~7員の単環式または7~10員の二環式複素環部分である。複素環の環原子を参照しつつ使用される場合、用語「窒素」は、置換された窒素を含む。例として、酸素、硫黄または窒素から選択される0~3個のヘテロ原子を有する飽和または部分的に不飽和の環において、窒素は、N(3,4-ジヒドロ-2H-ピロリルにおけるような)、NH(ピロリジニルにおけるような)またはNR(N置換ピロリジニルにおけるような)であり得る。複素環式環は、安定した構造をもたらすいずれかのヘテロ原子または炭素原子においてそのペンダント基に取り付けることができ、環原子のいずれかは、必要に応じて置換されていてよい。斯かる飽和または部分的に不飽和の複素環遊離基の例は、テトラヒドロフラニル、テトラヒドロチエニル、ピロリジニル、ピペリジニル、ピロリニル、テトラヒドロキノリニル、テトラヒドロイソキノリニル、デカヒドロキノリニル、オキサゾリジニル、ピペラジニル、ジオキサニル(dioxanyl)、ジオキソラニル(dioxolanyl)、ジアゼピニル(diazepinyl)、オキサゼピニル(oxazepinyl)、チアゼピニル(thiazepinyl)、モルフォリニルおよびキヌクリジニルを限定することなく含む。用語「複素環」、「ヘテロシクリル」、「ヘテロシクリル環」、「複素環基」、「複素環部分」および「複素環遊離基」は、本明細書で互換的に使用されており、インドリニル(indolinyl)、3H-インドリル、クロマニル、フェナントリジニルまたはテトラヒドロキノリニル等、1個または複数のアリール、ヘテロアリールまたは脂環式環にヘテロシクリル環が融合された基も含み、遊離基または取り付けポイントは、ヘテロ脂肪族環にある。ヘテロシクリル基は、単環式、二環式または多環式であり得る。用語「ヘテロシクリルアルキル」は、ヘテロシクリルによって置換されたアルキル基を指し、アルキルおよびヘテロシクリル部分は独立して、必要に応じて置換されている。
部分的に不飽和の:本明細書で使用される場合、用語「部分的に不飽和の」は、少なくとも1個の二重または三重結合を含む部分を指す。用語「部分的に不飽和の」は、複数の不飽和部位を有する基を包含することを意図するが、アリールまたはヘテロアリール部分を含むことは意図しない。
医薬組成物:本明細書で使用される場合、用語「医薬組成物」は、1種または複数の薬学的に許容される担体と共に製剤化された活性薬剤を指す。一部の実施形態では、活性薬剤は、関連する集団に投与された場合、所定の治療効果を達成する統計的に有意な確率を示す治療レジメンにおける投与に適切な単位用量で存在する。一部の実施形態では、医薬組成物は、次のものに適応されたものを含む、固体または液体形態での投与のために特別に製剤化することができる:経口投与、例えば、水薬(水性または非水性溶液または懸濁物)、錠剤、例えば、頬側、舌下および全身性吸収に標的化された錠剤、ボーラス、粉末、顆粒、舌に塗布するためのペースト;例えば、無菌溶液もしくは懸濁物、もしくは徐放性製剤としての、例えば、皮下、筋肉内、静脈内もしくは硬膜外注射による非経口的投与;例えば、皮膚、肺もしくは口腔に適用されるクリーム、軟膏、もしくは制御放出パッチもしくはスプレーとしての、局所的適用;例えば、ペッサリー、クリームもしくは泡としての腟内もしくは直腸内;舌下;眼;経皮;または経鼻、肺性、および他の粘膜表面への投与。
薬学的に許容される:本明細書で使用される場合、語句「薬学的に許容される」は、健全な医学的判断の範囲内で、妥当な損益比に釣り合った、過剰な毒性、刺激作用、アレルギー応答、または他の問題もしくは合併症を伴わない、人間および動物の組織と接触した使用に適した、化合物、材料、組成物および/または剤形を指す。
薬学的に許容される担体:本明細書で使用される場合、用語「薬学的に許容される担体」は、ある臓器または身体部分から別の臓器または身体部分への対象化合物の運搬または輸送に関与する、液体または固体の充填剤、希釈剤、賦形剤または溶媒封入材料等、薬学的に許容される材料、組成物またはビヒクルを意味する。各担体は、製剤の他の成分と適合性であり、患者に対する傷害性がないという意味合いにおいて「許容され」なくてはならない。薬学的に許容される担体として機能し得る材料の数例として、次のものが挙げられる:ラクトース、グルコースおよびスクロース等、糖;トウモロコシデンプンおよびジャガイモデンプン等、デンプン;カルボキシルメチル・セルロース・ナトリウム、エチルセルロースおよび酢酸セルロース等、セルロースおよびその誘導体;粉末トラガント;麦芽;ゼラチン;タルク;カカオバターおよび坐剤ワックス等、賦形剤;ピーナッツ油、綿実油、ベニバナ油、ゴマ油、オリーブ油、トウモロコシ油およびダイズ油等、油;プロピレングリコール等、グリコール;グリセリン、ソルビトール、マンニトールおよびポリエチレングリコール等、ポリオール;オレイン酸エチルおよびラウリン酸エチル等、エステル;寒天;水酸化マグネシウムおよび水酸化アルミニウム等、緩衝剤;アルギン酸;発熱物質不含水;等張性生理食塩水;リンゲル溶液;エチルアルコール;pH緩衝溶液;ポリエステル、ポリカーボネートおよび/またはポリ酸無水物;ならびに薬学的製剤において用いられる他の無毒性適合性物質。
薬学的に許容される塩:用語「薬学的に許容される塩」は、本明細書で使用される場合、医薬品の文脈における使用に適切であるような化合物の塩、すなわち、健全な医学的判断の範囲内で、過度の毒性、刺激作用、アレルギー応答その他を伴わない、ヒトおよび下等動物の組織と接触した使用に適し、妥当な損益比に釣り合った、塩を指す。薬学的に許容される塩は、周知のものである。例えば、S. M. Bergeらは、薬学的に許容される塩について、J. Pharmaceutical Sciences, 66: 1-19 (1977)において詳細に記載する。一部の実施形態では、薬学的に許容される塩として、塩酸、臭化水素酸、リン酸、硫酸および過塩素酸等の無機酸または酢酸、マレイン酸、酒石酸、クエン酸、コハク酸もしくはマロン酸等の有機酸により、またはイオン交換等の他の公知方法を使用することにより形成されたアミノ基の塩である無毒性酸付加塩が挙げられるがこれらに限定されない。一部の実施形態では、薬学的に許容される塩として、アジピン酸塩、アルギン酸塩、アスコルビン酸塩、アスパラギン酸塩、ベンゼンスルホン酸塩、安息香酸塩、重硫酸塩、ホウ酸塩、酪酸塩、カンフォレート(camphorate)、カンフォスルホン酸塩(camphorsulfonate)、クエン酸塩、シクロペンタンプロピオン酸塩、ジグルコン酸塩、ドデシル硫酸塩、エタンスルホン酸塩、ギ酸塩、フマル酸塩、グルコヘプトン酸塩、グリセロリン酸塩、グルコン酸塩、ヘミ硫酸塩、ヘプタン酸塩、ヘキサン酸塩、ヨウ化水素酸塩、2-ヒドロキシ-エタンスルホン酸塩、ラクトビオン酸塩、乳酸塩、ラウリン酸塩、ラウリル硫酸塩、リンゴ酸塩、マレイン酸塩、マロン酸塩、メタンスルホン酸塩、2-ナフタレンスルホン酸塩、ニコチン酸塩、硝酸塩、オレイン酸塩、シュウ酸塩、パルミチン酸塩、パモ酸塩、ペクチネート(pectinate)、過硫酸塩、3-フェニルプロピオン酸塩、リン酸塩、ピクリン酸塩、ピバル酸塩、プロピオン酸塩、ステアリン酸塩、コハク酸塩、硫酸塩、酒石酸塩、チオシアン酸塩、p-トルエンスルホン酸塩、ウンデカン酸塩、吉草酸塩その他が挙げられるがこれらに限定されない。一部の実施形態では、薬学的に許容される塩として、提供される化合物の酸性基(例えば、オリゴヌクレオチドのリン酸連結基、オリゴヌクレオチドのホスホロチオエート連結基、等)と塩基によって形成された塩等、無毒性塩基付加塩が挙げられるがこれらに限定されない。代表的なアルカリまたはアルカリ土類金属塩は、ナトリウム、リチウム、カリウム、カルシウム、マグネシウムその他の塩を含む。一部の実施形態では、薬学的に許容される塩は、アンモニウム塩(例えば、-N(R) )である。一部の実施形態では、薬学的に許容される塩は、ナトリウム塩である。一部の実施形態では、薬学的に許容される塩は、適切であれば、無毒性アンモニウム、四級アンモニウム、およびハロゲン化物、水酸化物等の対イオンを使用して形成されたアミンカチオン、カルボン酸塩、硫酸塩、リン酸塩、硝酸塩、1~6個の炭素原子を有するアルキル、スルホン酸塩、およびアリールスルホン酸塩を含む。
保護基:語句「保護基」は、本明細書で使用される場合、潜在的に反応性の官能基を望まれない化学変換から保護する一時的な置換基を指す。斯かる保護基の例として、カルボン酸のエステル、アルコールのシリルエーテル、ならびにそれぞれアルデヒドおよびケトンのアセタールおよびケタールが挙げられる。「Si保護基」は、Si-トリアルキル(例えば、トリメチルシリル、トリブチルシリル、t-ブチルジメチルシリル)、Si-トリアリール、Si-アルキル-ジフェニル(例えば、t-ブチルジフェニルシリル)またはSi-アリール-ジアルキル(例えば、Si-フェニルジアルキル)等、Si原子を含む保護基である。一般に、Si保護基は、酸素原子に取り付けられる。保護基化学の分野は概説されている(Greene, T. W.; Wuts, P. G. M. Protective Groups in Organic Synthesis, 5th ed.; John Wiley and Sons: Hoboken, NJ, 2014)。例示的な保護基(および関連する保護される部分)について詳細に後述する。
保護されたヒドロキシル基は、本技術分野で周知であり、その全体を参照により本明細書に組み込む、Protecting Groups in Organic Synthesis, T. W. Greene and P. G. M. Wuts, 3rd edition, John Wiley & Sons, 1999に詳細に記載されているものを含む。適切に保護されたヒドロキシル基の例として、エステル、炭酸エステル、スルホン酸エステル、アリルエーテル、エーテル、シリルエーテル、アルキルエーテル、アリールアルキルエーテルおよびアルコキシアルキルエーテルがさらに挙げられるがこれらに限定されない。適したエステルの例として、ギ酸エステル、酢酸エステル、プロピオン酸エステル、ペンタン酸エステル(pentanoate)、クロトン酸エステルおよび安息香酸エステルが挙げられる。適したエステルの具体例として、ギ酸エステル、ベンゾイルギ酸エステル、クロロ酢酸エステル、トリフルオロ酢酸エステル、メトキシ酢酸エステル、トリフェニルメトキシ酢酸エステル、p-クロロフェノキシ酢酸エステル、3-フェニルプロピオン酸エステル、4-オキソペンタン酸エステル、4,4-(エチレンジチオ)ペンタン酸エステル、ピバル酸エステル(pivaloate)(トリメチル酢酸エステル)、クロトン酸エステル、4-メトキシ-クロトン酸エステル、安息香酸エステル、p-ベンジル安息香酸エステル、2,4,6-トリメチル安息香酸エステルが挙げられる。適した炭酸エステルの例として、9-フルオレニルメチル、エチル、2,2,2-トリクロロエチル、2-(トリメチルシリル)エチル、2-(フェニルスルホニル)エチル、ビニル、アリル、およびp-ニトロベンジル炭酸エステルが挙げられる。適したシリルエーテルの例として、トリメチルシリル、トリエチルシリル、t-ブチルジメチルシリル、t-ブチルジフェニルシリル、トリイソプロピルシリルエーテルおよび他のトリアルキルシリルエーテルが挙げられる。適したアルキルエーテルの例として、メチル、ベンジル、p-メトキシベンジル、3,4-ジメトキシベンジル、トリチル、t-ブチルおよびアリルエーテル、またはこれらの誘導体が挙げられる。アルコキシアルキルエーテルは、メトキシメチル、メチルチオメチル、(2-メトキシエトキシ)メチル、ベンジルオキシメチル、ベータ-(トリメチルシリル)エトキシメチルおよびテトラヒドロピラン-2-イルエーテル等のアセタールを含む。適したアリールアルキルエーテルの例として、ベンジル、p-メトキシベンジル(MPM)、3,4-ジメトキシベンジル、O-ニトロベンジル、p-ニトロベンジル、p-ハロベンジル、2,6-ジクロロベンジル、p-シアノベンジル、2-および4-ピコリルエーテルが挙げられる。
保護されたアミンは、本技術分野で周知であり、Greene (1999)に詳細に記載されているものを含む。適した1箇所保護された(mono-protected)アミンとして、アラルキルアミン、カルバメート、アリルアミン、アミドその他がさらに挙げられるがこれらに限定されない。適した1箇所保護されたアミノ部分の例として、t-ブチルオキシカルボニルアミノ(-NHBOC)、エチルオキシカルボニルアミノ、メチルオキシカルボニルアミノ、トリクロロエチルオキシカルボニルアミノ、アリルオキシカルボニルアミノ(-NHAlloc)、ベンジルオキソカルボニルアミノ(-NHCBZ)、アリルアミノ、ベンジルアミノ(-NHBn)、フルオレニルメチルカルボニル(-NHFmoc)、ホルムアミド、アセトアミド、クロロアセトアミド、ジクロロアセトアミド、トリクロロアセトアミド、フェニルアセトアミド、トリフルオロアセトアミド、ベンズアミド、t-ブチルジフェニルシリルその他が挙げられる。適した2箇所保護された(di-protected)アミンは、1箇所保護されたアミンとして上に記載された置換基から独立して選択された2個の置換基で置換されたアミンを含み、フタルイミド、マレイミド、スクシンイミドその他等の環式イミドをさらに含む。適した2箇所保護されたアミンは、ピロールその他、2,2,5,5-テトラメチル-[1,2,5]アザジシロリジン(azadisilolidine)その他、およびアジドも含む。
保護されたアルデヒドは、本技術分野で周知であり、Greene (1999)に詳細に記載されているものを含む。適した保護されたアルデヒドとして、非環式アセタール、環式アセタール、ヒドラゾン、イミンその他がさらに挙げられるがこれらに限定されない。斯かる基の例として、ジメチルアセタール、ジエチルアセタール、ジイソプロピルアセタール、ジベンジルアセタール、ビス(2-ニトロベンジル)アセタール、1,3-ジオキサン、1,3-ジオキソラン、セミカルバゾン、およびこれらの誘導体が挙げられる。
保護されたカルボン酸は、本技術分野で周知であり、Greene (1999)に詳細に記載されているものを含む。適した保護されたカルボン酸として、必要に応じて置換されたC1~6脂肪族エステル、必要に応じて置換されたアリールエステル、シリルエステル、活性化されたエステル、アミド、ヒドラジドその他がさらに挙げられるがこれらに限定されない。斯かるエステル基の例として、メチル、エチル、プロピル、イソプロピル、ブチル、イソブチル、ベンジルおよびフェニルエステルが挙げられ、各基は、必要に応じて置換されている。追加的な適した保護されたカルボン酸は、オキサゾリンおよびオルトエステルを含む。
保護されたチオールは、本技術分野で周知であり、Greene (1999)に詳細に記載されているものを含む。適した保護されたチオールとして、ジスルフィド、チオエーテル、シリルチオエーテル、チオエステル、チオカーボネートおよびチオカルバメートその他がさらに挙げられるがこれらに限定されない。斯かる基の例として、ほんの数例を挙げると、アルキルチオエーテル、ベンジルおよび置換ベンジルチオエーテル、トリフェニルメチルチオエーテル、ならびにトリクロロエトキシカルボニルチオエステルが挙げられるがこれらに限定されない。
置換:本明細書に記載されている通り、本開示の化合物は、必要に応じて置換されたおよび/または置換された部分を含有することができる。一般に、用語「置換された」は、用語「必要に応じて」が先行するか否かにかかわらず、指定された部分の1個または複数の水素が、適した置換基に置き換えられたことを意味する。他に指示がなければ、「必要に応じて置換された」基は、当該基の各置換可能な位置に適した置換基を有することができ、いずれか所与の構造における2個以上の位置が、特定された基から選択される2個以上の置換基で置換されてよい場合、置換基は、全位置で同じであっても異なっていてもよい。本開示によって想定される置換基の組合せは、好ましくは、安定したまたは化学的に実現可能な化合物の形成をもたらす組合せである。用語「安定した」は、本明細書で使用される場合、本明細書に開示されている目的の1種または複数のために、その産生、検出、ならびにある特定の実施形態では、その回収、精製および使用を可能にする条件に付された際に、実質的に変更されない化合物を指す。一部の実施形態では、置換基例について後述する。
適した一価置換基は、ハロゲン;-(CH0~4;-(CH0~4OR;-O(CH0~4、-O-(CH0~4C(O)OR;-(CH0~4CH(OR;Rで置換されていてよい-(CH0~4Ph;Rで置換されていてよい-(CH0~4O(CH0~1Ph;Rで置換されていてよい-CH=CHPh;Rで置換されていてよい-(CH0~4O(CH0~1-ピリジル;-NO;-CN;-N;-(CH0~4N(R;-(CH0~4N(R)C(O)R;-N(R)C(S)R;-(CH0~4N(R)C(O)N(R;-N(R)C(S)N(R;-(CH0~4N(R)C(O)OR;-N(R)N(R)C(O)R;-N(R)N(R)C(O)N(R;-N(R)N(R)C(O)OR;-(CH0~4C(O)R;-C(S)R;-(CH0~4C(O)OR;-(CH0~4C(O)SR;-(CH0~4C(O)OSi(R;-(CH0~4OC(O)R;-OC(O)(CH0~4SR、-SC(S)SR;-(CH0~4SC(O)R;-(CH0~4C(O)N(R;-C(S)N(R;-C(S)SR;-SC(S)SR、-(CH0~4OC(O)N(R;-C(O)N(OR)R;-C(O)C(O)R;-C(O)CHC(O)R;-C(NOR)R;-(CH0~4SSR;-(CH0~4S(O);-(CH0~4S(O)OR;-(CH0~4OS(O);-S(O)N(R;-(CH0~4S(O)R;-N(R)S(O)N(R;-N(R)S(O);-N(OR)R;-C(NH)N(R;-Si(R;-OSi(R;-P(R;-P(OR;-OP(R;-OP(OR;-N(R)P(R;-B(R;-OB(R;-P(O)(R;-OP(O)(R;-N(R)P(O)(R;-(C1~4直鎖状または分枝状アルキレン)O-N(R;または-(C1~4直鎖状または分枝状アルキレン)C(O)O-N(Rであり、各Rは、下に定義される通りに置換されていてよく、独立して、水素、C1~20脂肪族、窒素、酸素、硫黄、ケイ素およびリンから独立して選択される1~5個のヘテロ原子を有するC1~20ヘテロ脂肪族、-CH-(C6~14アリール)、-O(CH0~1(C6~14アリール)、-CH-(5~14員のヘテロアリール環)、窒素、酸素、硫黄、ケイ素およびリンから独立して選択される0~5個のヘテロ原子を有する5~20員の、単環式、二環式もしくは多環式、飽和した、部分的に不飽和の、またはアリール環である、または、上述の定義にもかかわらず、Rの2個の独立した出現は、それらの介在する原子(複数可)と一緒になって、下に定義される通りに置換されていてよい、窒素、酸素、硫黄、ケイ素およびリンから独立して選択される0~5個のヘテロ原子を有する5~20員の、単環式、二環式もしくは多環式、飽和した、部分的に不飽和の、またはアリール環を形成する。
(またはRの2個の独立した出現をそれらの介在する原子と一緒にすることによって形成された環)における適した一価置換基は、独立して、ハロゲン、-(CH0~2、-(ハロR)、-(CH0~2OH、-(CH0~2OR、-(CH0~2CH(OR;-O(ハロR)、-CN、-N、-(CH0~2C(O)R、-(CH0~2C(O)OH、-(CH0~2C(O)OR、-(CH0~2SR、-(CH0~2SH、-(CH0~2NH、-(CH0~2NHR、-(CH0~2NR 、-NO、-SiR 、-OSiR 、-C(O)SR、-(C1~4直鎖状または分枝状アルキレン)C(O)OR、または-SSRであり、各Rは、非置換である、または「ハロ」が先行する場合は、1個または複数のハロゲンのみで置換されており、C1~4脂肪族、-CHPh、-O(CH0~1Ph、または窒素、酸素および硫黄から独立して選択される0~4個のヘテロ原子を有する5~6員の飽和した、部分的に不飽和の、またはアリール環から独立して選択される。Rの飽和炭素原子における適した二価置換基は、=Oおよび=Sを含む。
適した二価置換基は、次に挙げる:=O、=S、=NNR 、=NNHC(O)R、=NNHC(O)OR、=NNHS(O)、=NR、=NOR、-O(C(R ))2~3O-または-S(C(R ))2~3S-であり、Rのそれぞれ独立した出現は、水素、下に定義される通りに置換されていてよいC1~6脂肪族、または窒素、酸素および硫黄から独立して選択される0~4個のヘテロ原子を有する非置換の5~6員の飽和した、部分的に不飽和の、もしくはアリール環から選択される。「必要に応じて置換された」基の近接する置換可能な炭素に結合された適した二価置換基は、-O(CR 2~3O-を含み、Rのそれぞれ独立した出現は、水素、下に定義される通りに置換されていてよいC1~6脂肪族、または窒素、酸素および硫黄から独立して選択される0~4個のヘテロ原子を有する非置換の5~6員の飽和した、部分的に不飽和の、もしくはアリール環から選択される。
の脂肪族基における適した置換基は、ハロゲン、-R、-(ハロR)、-OH、-OR、-O(ハロR)、-CN、-C(O)OH、-C(O)OR、-NH、-NHR、-NR または-NOであり、各Rは、非置換である、または「ハロ」が先行する場合は、1個または複数のハロゲンのみで置換されており、独立して、C1~4脂肪族、-CHPh、-O(CH0~1Ph、または窒素、酸素および硫黄から独立して選択される0~4個のヘテロ原子を有する5~6員の飽和した、部分的に不飽和の、もしくはアリール環である。
一部の実施形態では、置換可能な窒素における適した置換基は、-R、-NR 、-C(O)R、-C(O)OR、-C(O)C(O)R、-C(O)CHC(O)R、-S(O)、-S(O)NR 、-C(S)NR 、-C(NH)NR または-N(R)S(O)であり、各Rは、独立して、水素、下に定義される通りに置換されていてよいC1~6脂肪族、非置換の-OPh、または窒素、酸素および硫黄から独立して選択される0~4個のヘテロ原子を有する非置換の5~6員の飽和した、部分的に不飽和の、もしくはアリール環である、または、上述の定義にもかかわらず、Rの2個の独立した出現は、それらの介在する原子(複数可)と一緒になって、窒素、酸素および硫黄から独立して選択される0~4個のヘテロ原子を有する非置換の3~12員の飽和した、部分的に不飽和の、もしくはアリール単環もしくは二環式環を形成する。
の脂肪族基における適した置換基は、独立して、ハロゲン、-R、-(ハロR)、-OH、-OR、-O(ハロR)、-CN、-C(O)OH、-C(O)OR、-NH、-NHR、-NR または-NOであり、各Rは、非置換である、または「ハロ」が先行する場合は、1個または複数のハロゲンのみで置換されており、独立して、C1~4脂肪族、-CHPh、-O(CH0~1Ph、または窒素、酸素および硫黄から独立して選択される0~4個のヘテロ原子を有する5~6員の飽和した、部分的に不飽和の、もしくはアリール環である。
不飽和の:用語「不飽和の」は、本明細書で使用される場合、部分が、1または複数単位の不飽和を有することを意味する。
他に指定がなければ、提供される化合物の薬学的に許容される酸または塩基付加塩等の塩、立体異性体形態、および互変異性体形態が含まれる。
2.ある特定の実施形態の詳細な説明
とりわけ、本開示は、真菌生合成遺伝子クラスターによってコードされる酵素によって産生される多くの産物を用いて、ヒト標的に対する治療薬を開発して、様々な疾患を処置することができるという認識を包含する。本開示は、真菌産物使用の課題の1つが、そのヒト標的を同定することであると認識する。一部の実施形態では、本開示は、真菌生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物のヒト標的の効率的な同定のための技術を提供する。一部の実施形態では、提供される技術は、生合成遺伝子クラスターの生合成遺伝子の近接ゾーンにおける埋め込まれた標的遺伝子(ETaG)を同定し、必要に応じて、ETaG配列を、ヒト核酸配列、特に、タンパク質をコードするヒト遺伝子を含む発現されるヒト核酸配列と比較することにより、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物のヒト標的をさらに同定する。当業者によって容易に認められる通り、生合成遺伝子クラスター由来の生合成産物、ETaGおよびヒト標的の間の関連性は、ひとたび確立されれば、様々な方法において利用することができる。例えば、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物から始め、生合成遺伝子クラスターの生合成遺伝子の近接ゾーン内のETaGへと、次いで、ETaGと相同なヒト標的へと進むことができる。ヒト標的が同定されたら、これを優先順位付けし(これがドラッガブルではないと以前にみなされたとしても)、生合成産物を使用してヒト標的のモジュレーターを開発することができ、これは、例えば、当業者に利用できる多くの方法を使用して、産物のアナログを調製およびアッセイすることによる、医学的使用のための生合成産物の必要に応じたさらなる最適化を含む。また、治療上の関心のヒト標的から始めて、ヒト標的と相同なETaGへと、次いで、その近接ゾーンがETaGを含有する生合成遺伝子を含有する生合成遺伝子クラスターへと進むこともできる。生合成遺伝子クラスターが同定されたら、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物を、ヒト標的またはその産物のモジュレーションに関して特徴付けおよびアッセイすることができる。生合成産物は、本開示に従って本技術分野における多数の方法を使用して、最適化のためのリードとして使用して、多くの医学的、例えば、治療目的に有用な薬剤を提供することができる。
いかなる理論にも限定される意図はないが、一部の実施形態では、本開示は、真核生物由来のETaGおよび/またはそれによってコードされる産物が、例えば、あるとすれば(in any)、細菌等の原核生物におけるその対応物よりも、哺乳動物遺伝子および/またはそれによってコードされる産物に対する類似性を有することができるという認識を包含する;一部の実施形態では、真核生物ETaGは、より治療上関連することができる。一部の実施形態では、真菌におけるETaGは、系統樹における哺乳動物と真菌との相対的な近さを考慮して、ヒト治療薬の開発に特に有用であり得る。
一部の実施形態では、本開示は、ETaGを同定するおよび/または特徴付けるための技術を提供し、ETaGが、ETaGを含有する生合成遺伝子クラスターによってコードされる酵素によって産生される産物の合成に必ずしも関与しない、またはその遺伝子、一部の実施形態では、生合成遺伝子に対する近接ゾーンがETaGを含有する(生合成遺伝子クラスターによってコードされる酵素は、ETaGなしで生合成産物を産生することができる)という点において、ETaGは、非生合成遺伝子である。一部の実施形態では、ETaGは、ETaGを含有する生合成遺伝子クラスターによってコードされる酵素によって産生される産物の合成に要求されない、またはその遺伝子、一部の実施形態では、生合成遺伝子に対する近接ゾーンがETaGを含有する(生合成遺伝子クラスターによってコードされる酵素は、ETaGなしで生合成産物を産生することができる)。一部の実施形態では、ETaGは、ETaGを含有する生合成遺伝子クラスターによってコードされる酵素によって産生される産物の合成に関与しない、またはその遺伝子、一部の実施形態では、生合成遺伝子に対する近接ゾーンがETaGを含有する(生合成遺伝子クラスターによってコードされる酵素は、ETaGなしで生合成産物を産生することができる)。一部の実施形態では、ETaGは、ヒト遺伝子と相同である、またはヒト遺伝子と相同な配列を含む、例えば、ヒトタンパク質または配列(例えば、ドメイン、機能的構造的特色(ヘリックス、シート、等)等、機能的および/または構造的単位)と少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%または95%相同性を共有する。
一部の実施形態では、ETaGは、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子と同時調節される。一部の実施形態では、ETaGは、ETaGの発現が、生合成遺伝子クラスターの酵素によってコードされる産物の産生に相関するという点において、生合成遺伝子クラスターと同時調節される。一部の実施形態では、ETaGは、自己防衛的機能を提供する。一部の実施形態では、ETaGは、生合成遺伝子クラスターの酵素によって産生される産物のトランスポーターをコードする。一部の実施形態では、ETaGは、生合成遺伝子クラスターの酵素によって産生される産物を解毒することができる産物、例えば、タンパク質をコードする。一部の実施形態では、ETaGは、その活性が、生合成遺伝子クラスターの酵素によって産生される産物によって標的化されるタンパク質の抵抗性バリアントをコードする。
一部の実施形態では、本開示は、
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
真菌核酸配列のうち少なくとも1種の内で、
生合成遺伝子クラスターによってコードされる酵素によって産生される産物の合成に関与せず、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップと
を含む方法を提供する。
一部の実施形態では、ETaGは、哺乳動物核酸配列と相同である。一部の実施形態では、本開示は、
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
真菌核酸配列のうち少なくとも1種の内で、
生合成遺伝子クラスターによってコードされる酵素によって産生される産物の合成に関与せず、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
発現される哺乳動物核酸配列と相同であり、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップと
を含む方法を提供する。
近接ゾーン
一部の実施形態では、ETaGは、典型的に、生合成遺伝子クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内にある。一部の実施形態では、ETaGは、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にある。一部の実施形態では、近接ゾーンは、遺伝子の1~100kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の1~50kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80または90kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の1kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の5kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の10kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の15kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の20kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の25kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の30kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の35kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の40kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の45kb以下上流または下流である。一部の実施形態では、近接ゾーンは、遺伝子の50kb以下上流または下流である。
一部の実施形態では、ETaGは、生合成遺伝子クラスター内にある。一部の実施形態では、ETaGは、生合成遺伝子クラスターの最初の遺伝子および最後の遺伝子によって画定される領域内にないが、生合成遺伝子クラスターの最初の遺伝子または最後の遺伝子に対する近接ゾーン内にある。
相同性
一部の実施形態では、ETaGは、発現される哺乳動物核酸配列と相同である。一部の実施形態では、哺乳動物核酸配列は、発現される哺乳動物核酸(nucleic)配列である。一部の実施形態では、哺乳動物核酸配列は、哺乳動物遺伝子である。一部の実施形態では、哺乳動物核酸配列は、発現される哺乳動物遺伝子である。一部の実施形態では、哺乳動物核酸は、ヒト核酸配列である。一部の実施形態では、ヒト核酸配列は、発現されるヒト核酸配列である。一部の実施形態では、ヒト核酸配列は、ヒト遺伝子である。一部の実施形態では、ヒト核酸配列は、発現されるヒト遺伝子である。一部の実施形態では、ヒト核酸配列は、治療上の関心の既存の標的である、または治療上の関心の既存の標的である産物をコードする。一部の実施形態では、ヒト核酸配列は、治療上の関心の新規標的である、または治療上の関心の新規標的である産物をコードする。一部の実施形態では、ヒト核酸配列は、本開示に先立ちドラッガブルではないとみなされた標的である、またはそのような標的である産物をコードする。一部の実施形態では、ヒト核酸配列は、本開示に先立ち小分子によりドラッガブルではないとみなされた標的である、またはそのような標的である産物をコードする。一部の実施形態では、本開示は、ドラッガブルではないと伝統的にみなされてきた標的が、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物または生合成産物のアナログである小分子により有効にモジュレートまたは標的化され得、この生合成遺伝子クラスターが、生合成遺伝子を含有し、生合成遺伝子に対する近接ゾーンが、標的に相同なETaG(またはその部分、またはそれによってコードされる産物および/またはその部分)を含有するという、予想外の知見を提供する。
一部の実施形態では、本開示は、
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
真菌核酸配列のうち少なくとも1種の内で、
生合成遺伝子クラスターによってコードされる酵素によって産生される産物の合成に関与せず、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
発現されるヒト核酸配列と相同であり、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)を同定するステップと
を含む方法を提供する。
一部の実施形態では、ETaGおよび核酸配列は、核酸配列相同性を共有する。一部の実施形態では、ETaG配列は、ETaG核酸配列またはその部分が、核酸塩基配列のレベルで、別の核酸配列またはその部分と類似性を共有するという点において、別の核酸配列(例えば、発現されるヒト核酸配列)と相同である。一部の実施形態では、ETaGの配列は、別の核酸配列と核酸塩基配列類似性を共有する。一部の実施形態では、ETaGの配列の部分は、別の核酸配列の部分と核酸塩基配列類似性を共有する。
一部の実施形態では、相同部分は、少なくとも50、100、150、200、300、400、500、600、70、800、900または1000塩基対の長さである。一部の実施形態では、長さは、少なくとも50塩基対である。一部の実施形態では、長さは、少なくとも100塩基対である。一部の実施形態では、長さは、少なくとも150塩基対である。一部の実施形態では、長さは、少なくとも200塩基対である。一部の実施形態では、長さは、少なくとも300塩基対である。一部の実施形態では、長さは、少なくとも400塩基対である。一部の実施形態では、長さは、少なくとも500塩基対である。
一部の実施形態では、相同部分は、コードされるタンパク質のある特定の構造的および/または機能的単位のものであるアミノ酸残基をコードする。例えば、一部の実施形態では、相同部分は、本開示に記載されている通り、酵素活性がある、エフェクターとの相互作用の原因となる、等、コードされるタンパク質のファミリーに特徴的なタンパク質ドメインをコードすることができる。
核酸配列の類似性/相同性を評価するための方法は、本技術分野で広く公知であり、本開示に従って使用することができる。
一部の実施形態では、ETaGおよび核酸配列は、それらのコードされる産物、例えば、タンパク質における相同性を共有する。一部の実施形態では、ETaGおよび核酸配列は、ETaGまたはその部分によってコードされる産物が、核酸配列またはその部分によってコードされる産物と類似性を共有するという点において、相同である。一部の実施形態では、コードされる産物は、タンパク質である。一部の実施形態では、ETaGおよび核酸配列によってコードされる産物は、それらの全長にわたって類似性を共有する。一部の実施形態では、ETaGおよび核酸配列によってコードされる産物は、ある特定の部分において類似性を共有する。
一部の実施形態では、ETaGおよび核酸は、ETaGまたはその部分によってコードされるタンパク質が、核酸またはその部分によってコードされるタンパク質と類似性を共有するという点において、相同である。ETaGおよび核酸配列によってコードされるタンパク質は、それらの全長または部分のレベルのいずれかで類似性を共有することができる。一部の実施形態では、相同部分における全アミノ酸残基は、連続する。一部の実施形態では、相同部分におけるアミノ酸残基は、全てが連続するとは限らない。
一部の実施形態では、タンパク質の部分は、タンパク質ドメインである。一部の実施形態では、タンパク質ドメインは、タンパク質ファミリーに特徴的な構造を形成する。一部の実施形態では、タンパク質ドメインは、特徴的な機能を果たす。例えば、一部の実施形態では、タンパク質ドメインは、酵素機能を有する。一部の実施形態では、斯かる機能は、ETaGによってコードされるタンパク質、および相同核酸配列、例えば、ヒト遺伝子によってコードされるタンパク質によって共有される。一部の実施形態では、特徴的機能は、非酵素的である。一部の実施形態では、特徴的機能は、他の実体、例えば、小分子、核酸、タンパク質、等との相互作用である。
一部の実施形態では、タンパク質の部分は、タンパク質の機能に重要な、連続したまたは連続していないアミノ酸残基のセットである。一部の実施形態では、機能は、酵素活性である。一部の実施形態では、タンパク質の部分は、活性に要求される残基のセットである。一部の実施形態では、部分は、基質、中間体、産物または補因子と相互作用する残基のセットである。一部の実施形態では、部分は、基質と相互作用する残基のセットである。一部の実施形態では、部分は、中間体と相互作用する残基のセットである。一部の実施形態では、部分は、産物と相互作用する残基のセットである。一部の実施形態では、部分は、補因子と相互作用する残基のセットである。
一部の実施形態では、機能は、別の実体との相互作用である。一部の実施形態では、実体は、小分子である。一部の実施形態では、実体は、脂質である。一部の実施形態では、実体は、炭水化物である。一部の実施形態では、実体は、核酸である。一部の実施形態では、実体は、タンパク質である。一部の実施形態では、部分は、相互作用剤と接触するアミノ酸残基のセットである。例えば、図13は、Rasタンパク質およびその相同ETaGの、ヌクレオチドと相互作用する部分(アミノ酸のセット)を説明し、図14~図16は、タンパク質-タンパク質相互作用に関与する部分を説明する。
一部の実施形態では、相互作用実体とアミノ酸残基との相互作用は、水素結合、静電力、ファンデルワールス力、芳香族スタッキング、等によって評価することができる。一部の実施形態では、相互作用は、相互作用実体までのアミノ酸残基の距離(例えば、ある事例において使用される場合、4Å)によって評価することができる。
一部の実施形態では、類似性とは、2種の構造が、1、2、3、4、5、6、7、8、9、10、15、20、30、40または50平方オングストローム以内のCアルファ骨格rmsd(平均二乗偏差)を有し、同じ全体的フォールドまたはコアドメインを有することである。一部の実施形態では、Cアルファ骨格rmsdは、以内である。
一部の実施形態では、タンパク質の部分は、タンパク質エフェクターリクルートメントに必須な構造エレメントであるか、またはこれを含む。一部の実施形態では、斯かる部分は、ETaGと相同な核酸配列、例えば、ETaGと相同なタンパク質をコードするヒト遺伝子によってコードされるタンパク質の構造および/または活性データに基づき選択することができる。
一部の実施形態では、タンパク質の部分は、少なくとも2~200、2~100、2~50、2~40、2~30、2~20、2~15、2~10、3~200、3~100、3~50、3~40、3~30、3~20、3~15、3~10、4~200、4~100、4~50、4~40、4~30、4~20、4~15、4~10、5~200、5~100、5~50、5~40、5~30、5~20、5~15または5~10個のアミノ酸残基を含む。一部の実施形態では、タンパク質の部分は、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、40、50、60、70、80、90、100または150個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも2個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも3個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも4個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも5個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも6個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも7個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも8個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも9個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも10個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも15個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも20個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも25個のアミノ酸残基を含む。一部の実施形態では、部分は、少なくとも30個のアミノ酸残基を含む。
核酸配列およびタンパク質配列の類似性は、本開示に従って、本技術分野で公知の方法を含む多数の方法によって評価することができる。例えば、タンパク質配列に関するMUSCLE。一部の実施形態では、類似性は、正確な同一性、例えば、所与の位置における同じアミノ酸残基に基づき測定される。一部の実施形態では、類似性は、1種または複数の共通特性、例えば、1種または複数の同一または同様の特性(例えば、酸性、塩基性、芳香族、等)を有するアミノ酸残基に基づき測定される。
一部の実施形態では、ETaGおよび核酸塩基配列の間の類似性が、本明細書に記載されている通り、ETaGおよび核酸配列もしくはそれらの部分の核酸配列、またはETaGおよび核酸配列もしくはそれらの部分によってコードされるタンパク質に基づくレベル以上であるという点において、ETaGは、核酸配列(例えば、発現されるヒト核酸配列)と相同である。一部の実施形態では、ETaGおよび核酸配列の間の類似性が、ETaGおよび核酸配列またはそれらの部分の核酸塩基配列に基づくレベル以上であるという点において、ETaGは、核酸配列と相同である。一部の実施形態では、ETaGおよび核酸配列の間の類似性が、ETaGおよび核酸配列またはそれらの部分によってコードされるタンパク質に基づくレベル以上であるという点において、ETaGは、核酸配列と相同である。一部の実施形態では、レベルは、少なくとも10%~99%である。一部の実施形態では、レベルは、少なくとも10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%である。一部の実施形態では、レベルは、少なくとも10%である。一部の実施形態では、レベルは、少なくとも20%である。一部の実施形態では、レベルは、少なくとも30%である。一部の実施形態では、レベルは、少なくとも40%である。一部の実施形態では、レベルは、少なくとも50%である。一部の実施形態では、レベルは、少なくとも60%である。一部の実施形態では、レベルは、少なくとも70%である。一部の実施形態では、レベルは、少なくとも80%である。一部の実施形態では、レベルは、少なくとも90%である。一部の実施形態では、レベルは、100%である。一部の実施形態では、レベルは、100%未満である。一部の実施形態では、レベルは、90%、91%、92%、93%、94%、95%、96%、97%、98%または99%以下である。
一部の実施形態では、ETaGまたはその部分によってコードされるタンパク質が、核酸配列によってコードされるタンパク質のものと同様の三次元構造を有するという点において、ETaGは、核酸配列と相同である。一部の実施形態では、類似性は、例えば、1~100、例えば、5、10、20、30、40、50平方オングストローム以内のCアルファ骨格rmsd(平均二乗偏差)によって評価される。一部の実施形態では、配列は、類似性を共有し、10平方オングストローム以下のCアルファ骨格rmsdを有し、また、同じ全体的フォールドまたはコアドメインを有する。一部の実施形態では、構造的類似性は、別の実体、例えば、小分子、核酸、タンパク質、等との相互作用によって評価される。一部の実施形態では、構造的類似性は、小分子結合によって評価される。一部の実施形態では、埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質に結合する小分子が、核酸配列またはその部分によってコードされるタンパク質にも結合するという点において、埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質は、核酸配列によってコードされるタンパク質と同様の三次元構造を有する。一部の実施形態では、結合は、1~100(例えば、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100)μM以下のKdを有する。
同時調節
一部の実施形態では、ETaGは、その近接ゾーンがETaGを含有する生合成遺伝子を含有する生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子と同時調節される。一部の実施形態では、ETaGは、その近接ゾーンがETaGを含有する生合成遺伝子を含有する生合成遺伝子クラスターと同時調節される。一部の実施形態では、ETaGの発現、および/またはETaGによってコードされる産物、例えば、タンパク質の産生が、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物の産生と相関するという点において、ETaGは、生合成遺伝子クラスターと同時調節される。一部の実施形態では、ETaGによってコードされる産物、例えば、タンパク質の産生は、生合成遺伝子クラスターによってコードされる酵素による生合成産物の産生と時間的に重複する。一部の実施形態では、ETaGは、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物が産生されると、ETaGの発現が増加されるまたはオンにされるという点において、生合成遺伝子クラスターと同時調節される。一部の実施形態では、ETaGは、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物のレベルが増加されると、ETaGの発現が増加されるまたはオンにされるという点において、生合成遺伝子クラスターと同時調節される。
一部の実施形態では、同時調節される生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物が産生されると、ETaGは、そのホスティング生物、例えば、真菌に利点を提供する。例えば、一部の実施形態では、ETaGによってコードされるタンパク質は、産物を産生する細胞の外への生合成産物の輸送に寄与する。一部の実施形態では、ETaGによってコードされるタンパク質は、生合成産物が、生合成産物を産生する生物を害さないが、他の生物の成長または生存に影響するように、生合成産物を解毒する。
一部の実施形態では、本開示は、ETaGを同定するための様々な方法を提供する。例えば、一部の実施形態では、典型的には異なる真菌株由来の相同生合成遺伝子クラスター、例えば、そのコードされる酵素が、同じ生合成産物(産物の予測(例えば、配列に基づく予測)および/または同定に基づく)を産生する生合成遺伝子クラスターのセットが比較される。セットにおける唯一または少数の生合成遺伝子クラスター(生合成遺伝子クラスター内または生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーン内の)に存在するが、生合成遺伝子クラスターの大部分には存在しない非生合成遺伝子を、ETaG候補として同定し、哺乳動物、例えば、ヒトの核酸配列と必要に応じてさらに比較して、相同哺乳動物核酸配列を同定する。一部の実施形態では、実施例に説明される通り、斯かる方法を使用して、例えば、多くの(例えば、数百、数千種またはさらにより多くの)ゲノムの配列から、ゲノムスケールでETaGを同定することができる。同定されたETaGは、その哺乳動物ホモログ、特に、ヒトホモログの治療重要性に基づき優先順位付けすることができる。一部の実施形態では、図中で説明されている通り、ETaGを含む生物は、ETaGの1種または複数の相同遺伝子を含む。
一部の実施形態では、ETaGは、セットの生合成遺伝子クラスターの1%、5%または10%以下で存在する。一部の実施形態では、ETaGは、セットの相同生合成遺伝子クラスターの1%、5%または10%以下で存在する。一部の実施形態では、ETaGは、セットの生合成遺伝子クラスターの1%、5%または10%以下で存在し、この生合成遺伝子クラスターは、同じ生合成産物を産生する酵素をコードする。一部の実施形態では、パーセンテージは、1%未満である。一部の実施形態では、パーセンテージは、5%未満である。一部の実施形態では、パーセンテージは、10%未満である。
一部の実施形態では、本開示は、生合成遺伝子クラスターおよび/または生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーン内のETaGを含む核酸配列の提供されるセットへの問い合わせを行うことによる、治療上の関心の標的をコードするヒト核酸のための相同ETaGの同定に特に有効かつ効率的な方法を提供する。
一部の実施形態では、本開示は、本明細書に記載されている核酸配列のセットを提供する。一部の実施形態では、本開示は、それぞれが真菌株(stain)において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットを提供する。一部の実施形態では、本開示は、それぞれが真菌株(stain)において見出され、ETaGを含む、核酸配列のセットを提供する。一部の実施形態では、本開示は、それぞれが真菌株(stain)において見出され、生合成遺伝子クラスターおよび生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーン内にあるETaGを含む、核酸配列のセットを提供する。一部の実施形態では、生合成遺伝子クラスターを含む核酸配列は、生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーン以外の配列および生合成遺伝子クラスターの配列を含まない。一部の実施形態では、本開示は、核酸配列の提供されるセットを含むデータベースを提供する。
一部の実施形態では、提供される技術の生合成遺伝子クラスターは、少なくとも1種の共通の化学的特質を共有する化合物の合成に関与し得る酵素をコードする生合成遺伝子を含む。一部の実施形態では、共通の化学的特質は、環式コア構造である。一部の実施形態では、共通の化学的特質は、大環式コア構造である。一部の実施形態では、共通の化学的特質は、共有される非環式骨格である。一部の実施形態では、共通の化学的特質は、化合物が全て、ある特定のカテゴリー、例えば、非リボソームペプチド(NPRS)、テルペン、イソプレン、アルカロイド、等に属することである。一部の実施形態では、生合成遺伝子クラスターのための個々のETaGを同定することにより、本開示は、構造上同様であったとしても、共通の化学的特質を共有する化合物を区別することができる。
提供されるセットは、様々なサイズおよび/または多様性のものであり得る。一部の実施形態では、より多くの種由来のより多くの配列を有して、ETaGおよび生合成遺伝子クラスターの数を増加させることが望ましい。一部の実施形態では、セットは、生合成遺伝子クラスターを含む少なくとも100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、20,000、50,000、100,000、500,000、1,000,000、1,500,000または2,000,000種の核酸配列を含む。一部の実施形態では、セットは、少なくとも100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、50,000、100,000、500,000、1,000,000、1,500,000または2,000,000種の生合成遺伝子クラスターを含む。一部の実施形態では、セットは、ETaGに関係する少なくとも100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、50,000、100,000、500,000、1,000,000、1,500,000または2,000,000種の生合成遺伝子クラスターを含む(その近接ゾーンがETaGを含有する生合成遺伝子を含有する生合成遺伝子クラスター)。一部の実施形態では、セットは、少なくとも100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、50,000、100,000、500,000、1,000,000、1,500,000または2,000,000種のETaGを含む。一部の実施形態では、提供されるセットの配列は、異なる種、例えば、異なる真菌種由来の少なくとも100、200、300、400、500、1,000、1,500、2,000、3,000、5,000、10,000、20,000、50,000、100,000種のゲノムに由来する。
とりわけ、提供されるデータベースおよび/または提供されるセットは、例えば、ETaGを同定する、所与の生合成遺伝子クラスターに関係するETaGを同定する、所与のETaGに関係する生合成遺伝子クラスターを同定する、所与の哺乳動物核酸配列(例えば、ヒト遺伝子)と相同なETaGを同定する、所与の哺乳動物核酸配列(例えば、ヒト遺伝子;必要に応じて関係したETaGを介して)に関係する生合成遺伝子クラスターを同定する、所与のETaGと相同な哺乳動物核酸配列(例えば、ヒト遺伝子)、所与の生合成遺伝子クラスター(必要に応じて関係したETaGを介して)と相同なヒト遺伝子を同定する、生合成遺伝子クラスター(必要に応じて関係したETaGおよび生合成遺伝子クラスターを介して)によってコードされる酵素によって産生される所与の産物(および/またはそのアナログ)に関係する哺乳動物核酸配列(例えば、ヒト遺伝子)を同定する、所与の哺乳動物核酸配列(例えば、ヒト遺伝子;必要に応じて関係した生合成遺伝子クラスターおよびETaGを介して)に関係する生合成遺伝子クラスターによってコードされる酵素によって産生される産物(および/またはそのアナログ)を同定する、等をするための効率を特に改善するように構造化される。
例えば、一部の実施形態では、提供されるセットおよび/またはデータベースにおけるETaGは、検索のためにインデックス化されている/マークされている。例えば、図17(本出願人は、提供されるセットおよびデータベースが、数百、数千または数百万種の配列を含有し得ることを指摘する)は、提供されるセットおよび/またはデータベース由来の配列例を描写し、ETaGが、特異的にインデックス化されている/マークされている(暗色)。とりわけ、斯かる構造的特色は、例えば、問い合わせ効率を大幅に改善することができる:目的のヒト遺伝子に相同なETaGに関して数十、数百または数千種のゲノムを検索するのではなく、その代わりに、提供される技術を使用して、検索の焦点を、インデックス化された/マークされたETaGに合わせて(例えば、非生合成遺伝子クラスター配列および/または非ETaG配列(例えば、図17における空白の矢印、およびその間の配列)をスキップする)、ヒット(例えば、図17における丸で囲まれたETaG)の位置を迅速に特定し、これにより、圧倒的多数の無関係のゲノム情報を検索するための時間およびリソースを節約することができる。
その上およびそれに代えて、配列の提供されるセットおよびデータベースは、ETaGが、その関係した生合成遺伝子クラスター(ETaGの関係した生合成遺伝子クラスターは、その近接ゾーンにETaGがある生合成遺伝子を含有する生合成遺伝子クラスターである)、関係した生合成遺伝子クラスターによってコードされる酵素によって産生される産物およびそのアナログ、その相同哺乳動物核酸配列(例えば、ヒト遺伝子)等の情報により独立してアノテートされ得るように構造化される。同様に、生合成遺伝子クラスターは、その関係したETaG(生合成遺伝子クラスターの関係したETaGは、生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーン内にあるetgである)、生合成遺伝子クラスターによってコードされる酵素によって産生される生合成産物およびそのアナログ、その関係したETaGの相同哺乳動物核酸配列およびそれによってコードされる産物等の情報により独立してアノテートされ得る。インデックスおよびアノテーションにより配列データを構造化することにより、提供されるセットおよびデータベースは、多数の利点を提供することができる。例えば、一部の実施形態では、提供されるシステムは、データサイズおよび問い合わせコストを低く維持しつつ、有用な関係した情報、例えば、その関係した生合成遺伝子クラスターおよびヒトホモログによりETaGへの高速アクセスを提供する(逆もまた同じ)。
一部の実施形態では、セットのETaGの少なくとも10、20、50、100、200、500、1,000、2,000、2,500、5,000もしくは10,000種または少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは95%または全てが、独立してアノテートされる。一部の実施形態では、セットのETaGの少なくとも10、20、50、100、200、500、1,000、2,000、2,500、5,000もしくは10,000種または少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは95%または全てが、その関係した生合成遺伝子クラスターおよび相同哺乳動物核酸配列により独立してアノテートされる。一部の実施形態では、セットの生合成遺伝子クラスターの少なくとも10、20、50、100、200、500、1,000、2,000、2,500、5,000もしくは10,000種または少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは95%または全てが、独立してアノテートされる。一部の実施形態では、セットの生合成遺伝子クラスターの少なくとも10、20、50、100、200、500、1,000、2,000、2,500、5,000もしくは10,000種または少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%もしくは95%または全てが、その関係したETaGにより独立してアノテートされる。
一部の実施形態では、配列の提供されるセットおよび/またはデータベースは、コンピュータ可読媒体において具現化されている。一部の実施形態では、本開示は、配列の提供されるセットおよび/またはデータベースを表すデータを記憶する、1個または複数の非一過性機械可読記憶媒体を含むシステムを提供する。提供されるデータの具現化に適した非一過性機械可読記憶媒体は、例として、半導体記憶域デバイス、例えば、EPROM、EEPROMおよびフラッシュ記憶域デバイス;磁気ディスク、例えば、内蔵ハードディスクまたはリムーバブルディスク;光磁気ディスク;ならびにCD-ROMおよびDVD-ROMディスクを含む、あらゆる形態の不揮発性記憶域を含む。とりわけ、提供されるシステムは、本明細書に記載されている特定の構造を有する提供されるセットおよびデータベースのため、特に効率的であり得る。
一部の実施形態では、本開示は、提供される技術を実行することができるコンピュータシステムを提供する。一部の実施形態では、本開示は、提供される方法を実行するように適応されたコンピュータシステムを提供する。一部の実施形態では、本開示は、配列の提供されるセットへの問い合わせを行うように適応されたコンピュータシステムを提供する。一部の実施形態では、本開示は、提供されるデータベースへの問い合わせを行うように適応されたコンピュータシステムを提供する。一部の実施形態では、本開示は、提供されるデータベースにアクセスするように適応されたコンピュータシステムを提供する。
提供される技術の全てまたは一部の実装に使用することができるコンピュータシステムは、様々な形態のデジタルコンピュータを含むことができる。デジタルコンピュータの例として、ラップトップ、デスクトップ、ワークステーション、パーソナルデジタルアシスタント、サーバー、ブレードサーバー、メインフレーム、スマートテレビおよび他の適切なコンピュータが挙げられるがこれらに限定されない。モバイルデバイスを使用して、提供される技術の全てまたは一部を実装することができる。モバイルデバイスとして、タブレットコンピュータ処理デバイス、パーソナルデジタルアシスタント、携帯電話、スマートフォン、デジタルカメラ、デジタル眼鏡(digital glasses)および他の携帯型コンピュータ処理デバイスが挙げられるがこれらに限定されない。本明細書に記載されているコンピュータ処理デバイス、それの関連性および関係性、ならびにそれの機能は、単なる例であることを意味し、技術の実装の限定を意味するものではない。
本明細書に記載されている技術の全てまたは一部、およびその様々な改変は、少なくとも一部には、コンピュータプログラム製品、例えば、1種または複数の情報担体、例えば、データ処理装置、例えば、プログラム可能なプロセッサー、コンピュータまたは複数のコンピュータによる実施のための、またはその演算を制御するための1種または複数の有形機械可読記憶媒体において有形に具現化されたコンピュータプログラムを介して実装することができる。
提供される技術のためのコンピュータプログラムは、コンパイルされた言語または翻訳された言語を含むいずれかの形態のプログラミング言語において書くことができ、コンピュータ処理環境における使用に適したスタンドアロンプログラムとして、またはモジュール、部分、サブルーチンもしくは他のユニットとしての導入を含め、いずれかの形態で導入することができる。コンピュータプログラムは、1個のサイトにおける、または複数のサイトにわたって分布しネットワークによって相互接続した、1個のコンピュータまたは複数のコンピュータにおいて実施されるように導入することができる。
例えば、プログラムおよび技術の実装に関連する行為は、提供される技術を実行するための1個または複数のコンピュータプログラムを実施する1個または複数のプログラム可能なプロセッサーによって実行することができる。プロセスの全てまたは一部は、特殊目的論理回路、例えば、FPGA(フィールド・プログラマブル・ゲート・アレイ)および/またはASIC(特定用途向け集積回路)として実装することができる。
コンピュータプログラムの実施に適したプロセッサーは、例として、一般および特殊目的マイクロプロセッサーの両方、ならびにいずれかの種類のデジタルコンピュータのいずれか1個または複数のプロセッサーを含む。一般に、プロセッサーは、リードオンリー記憶域もしくはランダムアクセス記憶域またはその両方から命令およびデータを受け取るであろう。コンピュータのエレメント(サーバーを含む)は、命令を実施するための1個または複数のプロセッサー、ならびに命令およびデータを記憶するための1個または複数の記憶域デバイスを含む。一般に、コンピュータは、データを記憶するための大容量記憶デバイス、例えば、磁気、光磁気ディスクまたは光ディスク等、1個または複数の機械可読記憶媒体も含むであろう、またはこれからデータを受け取るようにもしくはこれにデータを転送するようにまたはその両方を行うように動作可能にカップリングされるであろう。コンピュータプログラム命令およびデータの具現化に適した非一過性機械可読記憶媒体は、例として、半導体記憶域デバイス、例えば、EPROM、EEPROMおよびフラッシュ記憶域デバイス;磁気ディスク、例えば、内蔵ハードディスクまたはリムーバブルディスク;光磁気ディスク;ならびにCD-ROMおよびDVD-ROMディスクを含むあらゆる形態の不揮発性記憶域を含む。
タブレットコンピュータ等、各コンピュータ処理デバイスは、データおよびコンピュータプログラムを記憶するためのハードドライブ、ならびにコンピュータプログラムを実施するための処理デバイス(例えば、マイクロプロセッサー)およびメモリ(例えば、RAM)を含むことができる。各コンピュータ処理デバイスは、スチルカメラまたはビデオカメラ等、画像取込デバイスを含むことができる。画像取込デバイスは、コンピュータ処理デバイスに対し内蔵型または単純にアクセス可能であり得る。
各コンピュータ処理デバイスは、ディスプレイスクリーンを含むグラフィックシステムを含むことができる。LCDまたはCRT(陰極線管)等、ディスプレイスクリーンは、コンピュータ処理デバイスのグラフィックシステムによって生成された画像をユーザーにディスプレイする。周知の通り、コンピュータディスプレイ(例えば、モニタ)におけるディスプレイは、コンピュータディスプレイを物理的に変換する。例えば、コンピュータディスプレイがLCDに基づく場合、ユーザーにとって視覚的に明白な物理的変換におけるバイアス電圧の印加によって液晶の配向を変化させることができる。別の例として、コンピュータディスプレイがCRTである場合、同様に視覚的に明白な物理的変換における電子の衝突によって蛍光スクリーンの状態を変化させることができる。各ディスプレイスクリーンは、ユーザーが、仮想キーボードを介してディスプレイスクリーン上に情報を入力することを可能にする、接触感受性であり得る。デスクトップまたはスマートフォン等、一部のコンピュータ処理デバイスにおいて、ディスプレイスクリーン上に情報を入力するために、物理的QWERTYキーボードおよびスクロールホイールを提供することができる。各コンピュータ処理デバイス、およびそこで実施されるコンピュータプログラムは、音声コマンドを受理し、斯かるコマンドに応答して機能を実行するように構成することもできる。
とりわけ、提供される技術(方法、セット、データベース、システム、等)は、生合成遺伝子クラスター、生合成遺伝子クラスターによってコードされる酵素によって産生される産物、ETaG、ETaGの相同哺乳動物核酸配列、例えば、ヒト遺伝子、等の間の関連性を確立する。よって、提供される技術は、一部の実施形態では、生合成遺伝子クラスターによってコードされる酵素によって産生される産物のヒト標的の同定および/または特徴付けに特に強力であり得る。提供される技術はまた、ヒト標的のモジュレーターの同定および開発に特に強力であり得る。例えば、一部の実施形態では、ヒト標的のための治療薬を開発するために、その関係した生合成遺伝子クラスターおよび/または生合成遺伝子クラスターの酵素によって産生される生合成産物の情報と共に、提供される技術を使用して、ヒト標的(またはヒト標的をコードする核酸配列)のETaGを迅速に同定することができる。関係した生合成遺伝子クラスターの産物をさらに特徴付けることができ、必要であれば、そのアナログを調製、特徴付けおよびアッセイして、改善された特性を有する治療薬を開発することができる。提供される技術は、標的化するのに難易度が高い、および/または本開示に先立ちドラッガブルではないとみなされたヒト標的に特に有用であり得る。
一部の実施形態では、本開示は、同定されたETaGおよびそれによってコードされる産物を使用して、化合物を評価するための方法を提供する。一部の実施形態では、本開示は、
少なくとも1種の被験化合物を、真菌核酸配列の埋め込まれた標的遺伝子によってコードされる遺伝子産物と接触させるステップであって、この埋め込まれた標的遺伝子が、
生合成遺伝子クラスターの産物の生合成に要求されることも関与することもなく、
クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
哺乳動物核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする、ステップと、
被験化合物が存在しない場合と比較して、被験化合物が存在する場合に遺伝子産物のレベルもしくは活性が変更される、または
遺伝子産物のレベルもしくは活性が、レベルもしくは活性に公知の効果を有する参照薬剤が存在する場合に観察されるものに匹敵する
ことを決定するステップと
を含む方法を提供する。
一部の実施形態では、本開示は、生合成遺伝子クラスターによってコードされる酵素によって産生される産物または産物のアナログの哺乳動物、例えば、ヒト標的を同定するおよび/または特徴付けるための方法であって、
生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にある、または第2の生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にある、ETaGのヒトホモログを同定するステップであって、この第2の生合成遺伝子クラスターが、生合成遺伝子クラスターによってコードされる酵素によって産生される同じ生合成産物を産生する酵素をコードする、ステップと、
標的に対する、生合成遺伝子クラスターによってコードされる酵素によって産生される産物または産物のアナログの効果を必要に応じてアッセイするステップと
を含む方法を提供する。
一部の実施形態では、本開示は、ETaGと相同である哺乳動物、例えば、ヒト核酸配列によってコードされる産物を使用して、化合物を評価するための方法を提供する。一部の実施形態では、本開示は、
少なくとも1種の被験化合物を、
生合成遺伝子クラスターの産物の生合成に要求されることも関与することもなく、
クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
哺乳動物核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子と相同である哺乳動物核酸配列によってコードされる遺伝子産物と接触させるステップと、
被験化合物が存在しない場合と比較して、被験化合物が存在する場合に遺伝子産物のレベルもしくは活性が変更される、または
遺伝子産物のレベルもしくは活性が、レベルもしくは活性に公知の効果を有する参照薬剤が存在する場合に観察されるものに匹敵する
ことを決定するステップと
を含む方法を提供する。
一部の実施形態では、本開示は、生合成遺伝子クラスターによってコードされる酵素によって産生される産物または産物のアナログの哺乳動物、例えば、ヒト標的を同定するおよび/または特徴付けるための方法であって、
生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にあるETaGのヒトホモログを同定するステップと、
標的に対する、生合成遺伝子クラスターによってコードされる酵素によって産生される産物または産物のアナログの効果を必要に応じてアッセイするステップと
を含む方法を提供する。
一部の実施形態では、提供される方法およびシステムは、化合物とヒト標的との相互作用の評価に有用である。一部の実施形態では、本開示は、化合物とヒト標的との相互作用を評価(access)するための方法であって、
ヒト標的の核酸配列、またはヒト標的をコードする核酸配列を、1種または複数のETaGを含む核酸配列のセットと比較するステップ
を含む方法を提供する。
一部の実施形態では、生合成遺伝子クラスターの酵素によって産生される化合物は、生合成遺伝子クラスターに関係するETaGと相同である哺乳動物、例えば、ヒト核酸(nucleic)配列によってコードされる標的と相互作用する。
一部の実施形態では、とりわけ、提供される技術は、生合成遺伝子クラスター、ETaGおよびヒト標的遺伝子の間の関連性を提供するため、提供される技術は、ヒト標的のモジュレーターの設計および/または提供に特に有用である。
一部の実施形態では、本開示は、ヒト標的のモジュレーターを同定するおよび/または特徴付けるための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む方法を提供する。
一部の実施形態では、ヒト標的は、Rasタンパク質である。一部の実施形態では、Rasタンパク質は、HRasタンパク質である。一部の実施形態では、Rasタンパク質は、KRasタンパク質である。一部の実施形態では、Rasタンパク質は、NRasタンパク質である。一部の実施形態では、ヒト標的は、RasGEFドメインを含むタンパク質である。一部の実施形態では、タンパク質は、KNDC1、PLCE1、RALGDS、RALGPS1、RALGPS2、RAPGEF1、RAPGEF2、RAPGEF3、RAPGEF4、RAPGEF5、RAPGEF6、RAPGEFL1、RASGEF1A、RASGEF1B、RASGEF1C、RASGRF1、RASGRF2、RASGRP1、RASGRP2、RASGRP3、RASGRP4、RGL1、RGL2、RGL3、RGL4/RGR、SOS1、SOS2、またはヒトグアニンヌクレオチド交換因子である。一部の実施形態では、タンパク質は、SOS1である。一部の実施形態では、タンパク質は、ヒトグアニンヌクレオチド交換因子である。一部の実施形態では、ヒト標的は、RasGAPドメインを含むタンパク質である。一部の実施形態では、タンパク質は、DAB2IP、GAPVD1、IQGAP1、IQGAP2、IQGAP3、NF1、RASA1、RASA2、RASA3、RASA4、RASAL1、RASAL2またはSYNGAP1である。一部の実施形態では、タンパク質は、タンパク質p120である。一部の実施形態では、タンパク質は、ヒトグアニンヌクレオチド活性化因子である。
一部の実施形態では、本開示は、ヒトRasタンパク質のモジュレーターを同定するおよび/または特徴付けるための方法であって、
生合成遺伝子クラスターによってコードされる酵素によって産生される化合物のアナログを調製するステップであって、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
ヒトRasタンパク質、RasGEFドメインもしくはRasGAPドメイン、またはヒトRasタンパク質、RasGEFドメインもしくはRasGAPドメインをコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む方法を提供する。
一部の実施形態では、RasGEFドメインを含むタンパク質は、ヒトRasタンパク質の1種または複数の機能をモジュレートする。一部の実施形態では、RasGAPドメインを含むタンパク質は、ヒトRasタンパク質の1種または複数の機能をモジュレートする。
一部の実施形態では、本開示は、ヒトRasタンパク質のモジュレーターを同定するおよび/または特徴付けるための方法であって、
生合成遺伝子クラスターによってコードされる酵素によって産生される化合物のアナログを調製するステップであって、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
ヒトRasタンパク質、またはヒトRasタンパク質をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む方法を提供する。
一部の実施形態では、本開示は、RasGEFドメインを含むタンパク質のモジュレーターを同定するおよび/または特徴付けるための方法であって、
生合成遺伝子クラスターによってコードされる酵素によって産生される化合物のアナログを調製するステップであって、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
RasGEFドメイン、またはRasGEFドメインをコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む方法を提供する。
一部の実施形態では、本開示は、RasGAPドメインを含むタンパク質のモジュレーターを同定するおよび/または特徴付けるための方法であって、
生合成遺伝子クラスターによってコードされる酵素によって産生される化合物のアナログを調製するステップであって、
生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
RasGAPドメイン、またはRasGAPドメインをコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む方法を提供する。
一部の実施形態では、生合成遺伝子クラスターは、Rasタンパク質と相同なETaGと共に図の1つに説明されている、生合成遺伝子クラスター例、または1種もしくは複数の生合成遺伝子を含む生合成遺伝子クラスターである、例えば、図5~図12および図20~図27。一部の実施形態では、生合成遺伝子クラスターは、Rasタンパク質と相同なETaGと共に図の1つに説明されている、生合成遺伝子クラスター例である、例えば、図5~図12および図20~図27。一部の実施形態では、生合成遺伝子クラスターは、RasGEFドメインと相同なETaGと共に図の1つに説明されている、生合成遺伝子クラスター例、または1種もしくは複数の生合成遺伝子を含む生合成遺伝子クラスターである、例えば、図28~図33および図35。一部の実施形態では、生合成遺伝子クラスターは、RasGEFドメインと相同なETaGと共に図の1つに説明されている、生合成遺伝子クラスター例である、例えば、図28~図33および図35。一部の実施形態では、生合成遺伝子クラスターは、RasGEFドメインと相同なETaGと共に図の1つに説明されている、生合成遺伝子クラスター例、または1種もしくは複数の生合成遺伝子を含む生合成遺伝子クラスターである、例えば、図34および図36~図39。一部の実施形態では、生合成遺伝子クラスターは、RasGEFドメインと相同なETaGと共に図の1つに説明されている、生合成遺伝子クラスター例である、例えば、図34および図36~図39。ETaG配列例は、本開示に提示されており、とりわけ、生合成遺伝子クラスター、生合成遺伝子、等の位置の特定および同定に利用することができる。
一部の実施形態では、本開示は、ヒト標的をモジュレートするための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む方法を提供する。
一部の実施形態では、本開示は、Rasタンパク質をモジュレートするための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、図5~図12および図20~図27のうち1つの生合成遺伝子クラスターによってコードされる酵素によって産生される、ステップ
を含む方法を提供する。
一部の実施形態では、本開示は、RasGEFタンパク質をモジュレートするための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、図28~図33および図35のうち1つの生合成遺伝子クラスターによってコードされる酵素によって産生される、ステップ
を含む方法を提供する。
一部の実施形態では、本開示は、RasGAPタンパク質をモジュレートするための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、図34および図36~図39のうち1つの生合成遺伝子クラスターによってコードされる酵素によって産生される、ステップ
を含む方法を提供する。
一部の実施形態では、ETaGは、提供される方法によって同定される。
一部の実施形態では、産物は、生合成遺伝子クラスターによって産生される二次代謝物である、生合成遺伝子クラスターによってコードされる酵素によって産生される。
一部の実施形態では、産物のアナログは、産物の構造的コアを含む。一部の実施形態では、産物は、環式、例えば、単環式、二環式または多環式である。一部の実施形態では、産物の構造的コアは、単環式、二環式または多環式環系であるか、またはこれを含む。一部の実施形態では、産物の構造的コアは、産物の二環式または多環式環系の1個の環を含む。
一部の実施形態では、産物は、線形であり、構造的コアは、その骨格である。一部の実施形態では、産物は、ポリペプチドであるまたはこれを含み、構造的コアは、ポリペプチドの骨格である。一部の実施形態では、産物は、ポリケタイドであるまたはこれを含み、構造的コアは、ポリケタイドの骨格である。
一部の実施形態では、アナログは、本明細書に記載されている1個または複数の適した置換基で置換された産物である。一部の実施形態では、アナログは、本明細書に記載されている1個または複数の適した置換基で置換された構造的コアである。
とりわけ、本開示は、次の例示的実施形態を提供する:
1.それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
真菌核酸配列のうち少なくとも1種の内で、
生合成遺伝子クラスターの産物の生合成に要求されることも関与することもなく、
クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内にあり、
哺乳動物核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップと
を含む、方法。
2.ETaG配列が、クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にある、実施形態1に記載の方法。
3.生合成遺伝子クラスターを含む核酸配列が、生合成遺伝子クラスターの生合成遺伝子に対する近接ゾーンの核酸配列、および生合成遺伝子クラスターの核酸配列以外の配列を含有しない、先行する実施形態のいずれか一つに記載の方法。
4.近接ゾーンが、クラスターにおける生合成遺伝子の1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90または100kb以下上流または下流である、先行する実施形態のいずれか一つに記載の方法。
5.近接ゾーンが、クラスターにおける生合成遺伝子の50kb以下上流または下流である、先行する実施形態のいずれか一つに記載の方法。
6.近接ゾーンが、クラスターにおける生合成遺伝子の40kb以下上流または下流である、先行する実施形態のいずれか一つに記載の方法。
7.近接ゾーンが、クラスターにおける生合成遺伝子の30kb以下上流または下流である、先行する実施形態のいずれか一つに記載の方法。
8.近接ゾーンが、クラスターにおける生合成遺伝子の20kb以下上流または下流である、先行する実施形態のいずれか一つに記載の方法。
9.近接ゾーンが、クラスターにおける生合成遺伝子の10kb以下上流または下流である、先行する実施形態のいずれか一つに記載の方法。
10.近接ゾーンが、生合成遺伝子クラスターの2種の生合成遺伝子の間の領域である、先行する実施形態のいずれか一つに記載の方法。
11.哺乳動物核酸配列が、発現される配列である、先行する実施形態のいずれか一つに記載の方法。
12.哺乳動物核酸配列が、遺伝子である、先行する実施形態のいずれか一つに記載の方法。
13.哺乳動物核酸配列が、ヒト核酸配列である、先行する実施形態のいずれか一つに記載の方法。
14.埋め込まれた標的遺伝子配列が、その塩基配列またはその部分が、哺乳動物核酸配列のものと少なくとも50%、60%、70%、80%または90%同一であるという点において、発現される哺乳動物核酸配列と相同である、先行する実施形態のいずれか一つに記載の方法。
15.配列またはその部分が、少なくとも50、100、150または200塩基対の長さである、実施形態14に記載の方法。
16.埋め込まれた標的遺伝子配列が、埋め込まれた標的遺伝子またはその部分によってコードされる産物が、哺乳動物核酸配列またはその部分のものと相同であるという点において、発現される哺乳動物核酸配列と相同である、実施形態1~13のいずれか一つに記載の方法。
17.産物が、タンパク質である、実施形態16に記載の方法。
18.埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質が、哺乳動物核酸配列またはその部分によってコードされるものと少なくとも50%、60%、70%、80%または90%類似性である、実施形態16に記載の方法。
19.埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質が、哺乳動物核酸配列またはその部分によってコードされるタンパク質のものと同様の三次元構造を有する、実施形態16に記載の方法。
20.埋め込まれた標的遺伝子によってコードされるタンパク質の部分が、哺乳動物核酸配列によってコードされるタンパク質のものと同様の三次元構造を有する、実施形態19に記載の方法。
21.類似性は、構造が、10平方オングストローム以内のCアルファ骨格rmsd(平均二乗偏差)を有し、同じ全体的フォールドまたはコアドメインを有することである、実施形態19~20のいずれか一つに記載の方法。
22.埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質が、埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質に結合する小分子が、哺乳動物核酸配列またはその部分によってコードされるタンパク質にも結合するという点において、哺乳動物核酸配列によってコードされるタンパク質と同様の三次元構造を有する、実施形態19~20のいずれか一つに記載の方法。
23.埋め込まれた標的遺伝子および哺乳動物核酸配列またはそれらの部分によってコードされるタンパク質への小分子の結合が、100μM、50μM、10μM、5μMまたは1μM以下のKdを有する、実施形態22に記載の方法。
24.小分子が、真菌によって産生される、実施形態22~23のいずれか一つに記載の方法。
25.小分子が、非環式である、実施形態24に記載の方法。
26.小分子が、環式である、実施形態24に記載の方法。
27.小分子が、真菌によって産生される二次代謝物分子である、実施形態24~26のいずれか一つに記載の方法。
28.小分子が、非リボソーム的に合成される、実施形態24~27のいずれか一つに記載の方法。
29.小分子が、生合成遺伝子クラスターの生合成産物である、実施形態24~28のいずれか一つに記載の方法。
30.埋め込まれた標的遺伝子によってコードされるタンパク質の部分が、発現される哺乳動物核酸配列によってコードされるタンパク質の部分と少なくとも50%、60%、70%、80%または90%類似性である、実施形態16に記載の方法。
31.タンパク質の部分が、タンパク質ドメインである、実施形態30に記載の方法。
32.タンパク質の部分が、機能に必要なアミノ酸残基のセットである、実施形態30~31のいずれか一つに記載の方法。
33.機能が、酵素機能である、実施形態32に記載の方法。
34.アミノ酸残基のセットが、基質に接触する、実施形態33に記載の方法。
35.アミノ酸残基のセットが、中間体に接触する、実施形態33に記載の方法。
36.アミノ酸残基のセットが、産物に接触する、実施形態33に記載の方法。
37.機能が、別の実体との相互作用である、実施形態32に記載の方法。
38.実体が、小分子である、実施形態37に記載の方法。
39.実体が、脂質である、実施形態37に記載の方法。
40.実体が、炭水化物である、実施形態37に記載の方法。
41.実体が、核酸である、実施形態37に記載の方法。
42.実体が、タンパク質である、実施形態37に記載の方法。
43.セットの残基のそれぞれが、実体の4Å以内にある、実施形態32~42のいずれか一つに記載の方法。
44.埋め込まれた標的遺伝子が、クラスターにおける少なくとも1種の遺伝子と同時調節される、先行する実施形態のいずれか一つに記載の方法。
45.埋め込まれた標的遺伝子が、異なる真菌株に由来し、かつ相同なまたは同一の生合成遺伝子クラスターを含むセットにおける全真菌核酸配列の80%、90%、95%または100%に存在しない、先行する実施形態のいずれか一つに記載の方法。
46.セットが、少なくとも100、1,000、5,000、10,000、50,000、100,000、500,000、1,000,000、1,500,000、2,000,000または2,500,000種の別個の真菌核酸配列を含む、先行する実施形態のいずれか一つに記載の方法。
47.セットが、少なくとも100、500、1,000、5,000、10,000、15,000、20,000、22,000、25,000または30,000種の別個の真菌株由来の核酸配列を含む、先行する実施形態のいずれか一つに記載の方法。
48.ETaG配列が、ハウスキーピング遺伝子ではない、先行する実施形態のいずれか一つに記載の方法。
49.ETaG配列が、同じゲノムにおける第2の核酸配列またはその部分と相同である配列であるか、またはこれを含む、先行する実施形態のいずれか一つに記載の方法。
50.ETaG配列が、同じゲノムにおける第2の核酸配列によってコードされる産物またはその部分と相同である産物をコードする配列であるか、またはこれを含む、先行する実施形態のいずれか一つに記載の方法。
51.相同性が、少なくとも50%、60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%または99.5%である、実施形態49または50に記載の方法。
52.相同性が、少なくとも70%である、実施形態49に記載の方法。
53.相同性が、少なくとも80%である、実施形態49に記載の方法。
54.相同性が、少なくとも90%である、実施形態49に記載の方法。
55.第2の核酸配列が、ハウスキーピング遺伝子であるか、またはこれを含む、実施形態48~54のいずれか一つに記載の方法。
56.ETaG配列が、生合成遺伝子クラスターの産物に対する抵抗性をもたらす産物をコードする一方、第2の核酸配列がそのような産物をコードしない、実施形態48~55のいずれか一つに記載の方法。
57.ETaG配列が、生合成遺伝子クラスターの小分子産物に対する抵抗性をもたらすタンパク質をコードする一方、第2の核酸配列によってコードされるタンパク質が、そのような抵抗性をもたらさない、実施形態56に記載の方法。
58.セット内の核酸配列が、その生合成遺伝子が少なくとも1種の共通の化学的特質を共有する化合物の合成に関与する酵素をコードする生合成遺伝子クラスターを含む、先行する実施形態のいずれか一つに記載の方法。
59.核酸配列が、複数の真菌株に由来する、先行する実施形態のいずれか一つに記載の方法。
60.共通の化学的特質が、環式系であるか、またはこれを含む、先行する実施形態のいずれか一つに記載の方法。
61.共通の化学的特質が、大環状分子であるか、またはこれを含む、先行する実施形態のいずれか一つに記載の方法。
62.共通の化学的特質が、非環式骨格であるか、またはこれを含む、実施形態52~61のいずれか一つに記載の方法。
63.少なくとも1種の共通の化学的特質を共有する化合物が、ポリケタイドである、実施形態52~62のいずれか一つに記載の方法。
64.少なくとも1種の共通の化学的特質を共有する化合物が、非リボソームペプチドである、実施形態52~62のいずれか一つに記載の方法。
65.少なくとも1種の共通の化学的特質を共有する化合物が、アルカロイドである、実施形態52~62のいずれか一つに記載の方法。
66.少なくとも1種の共通の化学的特質を共有する化合物が、テルペン/イソプレンである、実施形態52~62のいずれか一つに記載の方法。
67.少なくとも1種の被験化合物を、真菌核酸配列の埋め込まれた標的遺伝子によってコードされる遺伝子産物と接触させるステップであって、この埋め込まれた標的遺伝子(ETaG)が、
生合成遺伝子クラスターの産物の生合成に要求されることも関与することもなく、
クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
哺乳動物核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする、ステップと、
被験化合物が存在しない場合と比較して、被験化合物が存在する場合に遺伝子産物のレベルもしくは活性が変更される、または
遺伝子産物のレベルもしくは活性が、レベルもしくは活性に公知の効果を有する参照薬剤が存在する場合に観察されるものに匹敵する
ことを決定するステップと
を含む、方法。
68.ETaGが、実施形態1~66のいずれか一つに記載のETaGである、実施形態67に記載の方法。
69.哺乳動物核酸配列が、ヒトRas配列である、実施形態67または68に記載の方法。
70.哺乳動物核酸配列が、KRas、HRasまたはNRas配列である、実施形態69に記載の方法。
71.哺乳動物核酸配列が、RasGEFドメインをコードする配列である、実施形態67または68に記載の方法。
72.哺乳動物核酸配列が、RasGAPドメインをコードする配列である、実施形態67または68に記載の方法。
73.ETaGが、図1~図39のうち1つにおけるETaGである、実施形態66~72のいずれか一つに記載の方法。
74.生合成遺伝子クラスターが、図1~図39のうち1つにおける生合成遺伝子クラスターである、実施形態66~73のいずれか一つに記載の方法。
75.被験化合物が、生合成遺伝子クラスターの生合成産物またはそのアナログである、実施形態66~74のいずれか一つに記載の方法。
76.少なくとも1種の被験化合物を、発現される哺乳動物核酸配列によってコードされる遺伝子産物と接触させるステップであって、この配列が、実施形態1~75のいずれか一つに記載の埋め込まれた標的遺伝子配列と相同である発現される哺乳動物核酸配列である、ステップ
を含む、方法。
77.哺乳動物核酸配列が、ヒトRas配列である、実施形態76に記載の方法。
78.哺乳動物核酸配列が、KRas、HRasまたはNRas配列である、実施形態77に記載の方法。
79.哺乳動物核酸配列が、RasGEFドメインをコードする配列である、実施形態76または77に記載の方法。
80.哺乳動物核酸配列が、RasGAPドメインをコードする配列である、実施形態76または77に記載の方法。
81.ETaGが、図1~図39のうち1つにおけるETaGである、実施形態76~80のいずれか一つに記載の方法。
82.生合成遺伝子クラスターが、図1~図39のうち1つにおける生合成遺伝子クラスターである、実施形態76~81のいずれか一つに記載の方法。
83.被験化合物が、生合成遺伝子クラスターの生合成産物またはそのアナログである、実施形態76~82のいずれか一つに記載の方法。
84.生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にあるETaGのヒトホモログを同定するステップと、
ヒトホモログに対する、生合成遺伝子クラスターによってコードされる酵素によって産生される産物または産物のアナログの効果を必要に応じてアッセイするステップと
を含む、方法。
85.ETaGが、実施形態1~66のいずれか一つに記載のETaGである、実施形態77に記載の方法。
86.ヒト標的のモジュレーターを同定するおよび/または特徴付けるための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、生合成遺伝子クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む、方法。
87.ETaGが、実施形態1~83のいずれか一つに記載のETaGである、実施形態86に記載の方法。
88.ヒト標的が、Rasタンパク質である、実施形態86に記載の方法。
89.ヒト標的が、KRas、HRasまたはNRasである、実施形態88に記載の方法。
90.ヒト標的が、RasGEFドメインを含む、実施形態86に記載の方法。
91.ヒト標的が、RasGAPドメインを含む、実施形態86に記載の方法。
92.ETaGが、図1~図39のうち1つにおけるETaGである、実施形態86~91のいずれか一つに記載の方法。
93.生合成遺伝子クラスターが、図1~図39のうち1つにおける生合成遺伝子クラスターである、実施形態86~92のいずれか一つに記載の方法。
94.ヒト標的をモジュレートするための方法であって、
産物またはそのアナログを提供するステップであって、この産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
ヒト標的、またはヒト標的をコードする核酸配列と相同であり、
クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む、方法。
95.ヒト標的が、Rasタンパク質である、実施形態94に記載の方法。
96.ヒト標的が、KRas、HRasまたはNRasである、実施形態94に記載の方法。
97.ヒト標的が、RasGEFドメインを含む、実施形態94に記載の方法。
98.ヒト標的が、RasGAPドメインを含む、実施形態94に記載の方法。
99.ETaGが、図1~図39のうち1つにおけるETaGである、実施形態94~98のいずれか一つに記載の方法。
100.生合成遺伝子クラスターが、図1~図39のうち1つにおける生合成遺伝子クラスターである、実施形態94~99のいずれか一つに記載の方法。
101.ETaGが、実施形態1~93のいずれか一つに記載のETaGである、実施形態94に記載の方法。
102.それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセット
を含むデータベースであって、
核酸配列のセットが、コンピュータ可読媒体において具現化されている、データベース。
103.実施形態1~101のいずれか一つに記載の1種または複数の埋め込まれた標的遺伝子が、インデックス化されている、実施形態102に記載のデータベース。
104.それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットを表すデータを記憶する、1個または複数の非一過性機械可読記憶媒体
を含むシステム。
105.それぞれETaG配列であるか、またはETaG配列を含む、核酸配列のセットを表すデータを記憶する、1個または複数の非一過性機械可読記憶媒体
を含むシステム。
106.実施形態1~101のいずれか一つに記載の1種または複数の埋め込まれた標的遺伝子が、インデックス化されている、実施形態105に記載のシステム。
107.実施形態1~101のいずれか一つに記載の方法を実行するように適応されたコンピュータシステム。
108.実施形態95~103のいずれか一つに記載のデータベースにアクセスするように適応されたコンピュータシステム。
提供される技術の非限定的な例について後述する。
(実施例1)
データベース例の構築およびその使用例。
例えば、antiSMASHを使用して、2,000種前後の報告された真菌ゲノムを処理して潜在的生合成遺伝子クラスターを同定し、およそ70,000種の同定された生合成遺伝子クラスターをデータベースに加えた。目的のヒト標的を使用して、初期データベースへの問い合わせを行った。例えば、ヒトSec7のタンパク質配列を使用して、初期ライブラリーに対してBLAST検索して、ETaGを同定した。それに代えておよびその上、生合成遺伝子クラスターは、それら自身の間で比較することができる。例えば、プロセスの1つにおいて、1種または数種の生合成遺伝子クラスターに存在する(生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にある)が、同じ生合成産物のための大部分の他の相同生合成遺伝子クラスターには存在しない非生合成遺伝子は、潜在的なETaGとして同定され、核酸レベルおよび/または好ましくはタンパク質レベルで相同哺乳動物核酸配列(例えば、ヒト遺伝子)を有するか否かを解析することによりさらに確認される。同定されたETaGは、インデックス化/マークし、アノテートすることができる。データベースは、ヌクレオチド配列(例えば、BLASTN;tBLASTx)またはタンパク質配列(例えば、tBLASTn)のいずれかにより検索可能である。
ヒト標的のBLAST問い合わせの結果を、一部の実施形態では、配列相同性の強度の順序で収載し、データベース内の全推定ヒットを示した。次いで、全ヒット生合成遺伝子クラスターのDNA配列を点検して、標的タンパク質の1種または複数のオープンリーディングフレーム(遺伝子)ホモログが、生合成遺伝子クラスターの予測される範囲内にあることを検証した。
一部の実施形態では、各生合成クラスターのGenBank形式の配列ファイル(*.gbk)をアセンブルおよび精選し、これから、予測アルゴリズム、例えば、antiSMASHを含む予測アルゴリズムおよび/または方法により、ETaGタンパク質配列を得た。オープンリーディングフレームのタンパク質ファミリー(pfam)機能は、例えば、antiSMASHによって予測することができ、antisSMASHによって予測される各同定されたETaGおよびその最も近い生合成酵素の間のヌクレオチド距離を決定することができる。一部の実施形態では、予測されるETaGが生合成酵素に近いほど、このオープンリーディングフレームが、正規の(legitimate)ETaGをコードする見込みが高くなる。
本出願人は、いくつかの真正なETaG含有生合成遺伝子クラスター(シクロスポリン、フェルタミド、ロバスタチン、ミコフェノール酸およびブレフェルジンの生合成遺伝子クラスター)以外の、関係したETaGを有する多くの生合成遺伝子クラスターの同定に成功した。
一部の実施形態では、本開示は、ETaGが、推定ヒト標的タンパク質の機能的ホモログ(オルソログ)として機能することができるという認識を包含する。一部の実施形態では、推定ETaGヒットのタンパク質配列を、ヒト標的オルソログの配列と比較した。例えば、ヒトプロテインAのETaGを見出すためのプロジェクトにおいて、推定プロテインAホモログを含有するn種の生合成遺伝子クラスターが見出され、n種の予測されるETaGタンパク質の全てをヒトプロテインAと整列した。一部の実施形態では、ETaG/標的のpfam境界を画定する特異的触媒または構造ドメイン内のアミノ酸のみ(例えば、予測サブファミリードメインアーキテクチャに基づく)をアライメント解析において使用した。全ETaGおよびヒト標的タンパク質(複数可)を整列することにより、ETaG配列をそのヒト対応物と直接比較し、それらの系統発生的関係性は、定量的相関性データ(例えば、ペプチド配列類似性および/または進化系統樹視覚化)を生じた。追加的な解析は、例えば、ヒト標的の三次タンパク質構造の試験に基づく、タンパク質エフェクターリクルートメント/結合の必須構造エレメントの保存/類似性を含むことができる。例えば、一部の実施形態では、整列された配列を、対応する係合しているタンパク質の4オングストローム以内の標的タンパク質残基に対応するPDB結晶構造と比較した。いかなる理論にも限定される意図はないが、これらの構造モチーフが、真菌ETaG内に保存されている場合、これは、ETaGに関係した生合成遺伝子クラスターによって産生される代謝物が、真菌およびヒト標的タンパク質の両方のエフェクターである確率の増加を示すことができ、産生される代謝物は、ヒト標的に対する薬物候補、または薬物開発のためのリードであり得る。一部の実施形態では、上述の解析を使用して、ヒト標的の標的化に関して、ETaGおよびその関係した生合成遺伝子クラスター、ならびに生合成遺伝子クラスターから産生される代謝物を優先順位付けした。
(実施例2)
ヒト標的 - Sec7のモジュレーター。
とりわけ、本開示は、ヒト標的のモジュレーターを同定するための技術を提供する。一部の実施形態では、ヒト配列を利用して、提供されるデータベースへの問い合わせを行って、その近接ゾーンにヒト配列のホモログが存在する生合成遺伝子クラスターを同定する。
例えば、とりわけ、本開示は、その生合成産物がSec7機能をモジュレートし得る、生合成遺伝子クラスターを提供する。ヒトSec7ドメインのモジュレーターを同定するために、Sec7タンパク質配列を使用して、データベース、例えば、実施例1に提供されているデータベースへの問い合わせを行った。関係した生合成遺伝子クラスターを有するPenicillium vulpinum IBT 29486においてSec7相同ETaG例を同定した(ETaGは、生合成遺伝子クラスターの生合成遺伝子の1つに対する近接ゾーンにある)。図1、図18および図19を参照されたい。とりわけ、同定された生合成遺伝子クラスターは、Eupenicillium brefeldianumにおけるブレフェルジンAの生合成遺伝子クラスターと相同性を共有し、ブレフェルジンAを産生することが予想された。したがって、ブレフェルジンAは、Sec7の候補モジュレーターおよび/またはモジュレーターのリード化合物として同定された。所望される場合、本開示に従って本技術分野で利用できる多数の方法を使用して、Penicillium vulpinum IBT 29486の生合成遺伝子クラスターを発現させ、その産物を単離し特徴付け、次いで、Sec7に対する産物の機能をアッセイすることにより、結果を必要に応じて検証することができる。ブレフェルジンAは、ヒトGBF1のSec7ドメインを標的化することが報告されたため、本実施例は、提供される技術を利用してヒト標的のモジュレーターを同定することに成功し得ることを説明する。
(実施例3)
ロバスタチン、フェルタミドおよびシクロスポリンのETaG。
提供される技術を利用して、様々な実体のETaGを同定することができる。例えば、本明細書で実証される通り、提供される技術を効率的に使用して、ロバスタチン、フェルタミドおよびシクロスポリンに関係するEtaGを同定することができる。結果例を図2~図4に提示した。
(実施例4)
ヒト標的 - Rasのモジュレーター
とりわけ、本開示は、その生合成産物が、Rasタンパク質、および/またはRasGEFドメインを含むタンパク質(例えば、KNDC1、PLCE1、RALGDS、RALGPS1、RALGPS2、RAPGEF1、RAPGEF2、RAPGEF3、RAPGEF4、RAPGEF5、RAPGEF6、RAPGEFL1、RASGEF1A、RASGEF1B、RASGEF1C、RASGRF1、RASGRF2、RASGRP1、RASGRP2、RASGRP3、RASGRP4、RGL1、RGL2、RGL3、RGL4/RGR、SOS1、SOS2、等)および/またはRasGAPドメインを含むタンパク質(DAB2IP、GAPVD1、IQGAP1、IQGAP2、IQGAP3、NF1、RASA1、RASA2、RASA3、RASA4、RASAL1、RASAL2、SYNGAP1;等)の1種または複数の機能をモジュレートし得る、生合成遺伝子クラスターを提供する。Rasタンパク質、例えば、HRas、KRasおよびNRasは、多くのヒトがんと関連付けされているが、創薬にとっては悪名高く困難な標的である。とりわけ、本開示は、Ras阻害剤を含むRasモジュレーターを開発するための技術を提供する。
ヒトRas配列を使用して、提供されるデータベース、例えば、実施例1のデータベースへの問い合わせを行った。ヒトRasタンパク質に対する様々なレベルの配列類似性を有する、8種のETaG例を異なる株から同定した。関係した生合成遺伝子クラスターは、異なる種類の化合物を産生するための酵素をコードする。図5~図12および図20~図27を参照されたい。タンパク質をコードする同定されたETaGは、ヒトRasタンパク質と高度に相同であり得る。例えば、ヌクレオチド結合残基の類似性については図13を、BRAF相互作用残基については図14を、rasGAP相互作用残基については図15を、SOS相互作用残基については図16を参照されたい。
同様に、その生合成産物がRasGEFおよびRasGAPドメインをモジュレートし得る、生合成遺伝子クラスターが同定される。本明細書で実証される通り、同定された生合成遺伝子クラスター例は、様々な種類の部分/産物、例えば、テルペン、PKS、NRPS、等の合成に関与する遺伝子および/またはモジュールを含有することができる。例えば、同定された生合成遺伝子クラスターならびにRasGEFおよびRasGAPホモログ、図28~図39を参照されたい。
同定されたETaG配列例を下に収載する:
図5:Thermomyces lanuginosus。Ras ETaG配列:
図6:Talaromyces leycettanus CBS 398.68。Ras ETaG配列:
図7:Sistotremastrum niveocremeum。Ras ETaG配列:
Sistotremastrum suecicum。Ras ETaG配列:
図8:Agaricus bisporus var.burnettii JB137-S8。Ras ETaG配列:
図9:Coprinopsis cinerea okayama。Ras ETaG配列:
図10:Colletotrichum higginsianum。Ras ETaG配列:
図11:Gyalolechia flavorubescens KoLRI002931。Ras ETaG配列:
図12:Bipolaris maydis ATCC 48331。Ras ETaG配列:
図18:Penicillium vulpinum IBT 29486。Sec7 ETaG配列:
図20:Thermomyces lanuginosus ATCC 200065。Ras ETaG配列:
Aspergillus rambelli。Ras ETaG配列:
Aspergillus ochraceoroseus。Ras ETaG配列:
図21:Agaricus bisporus var.burnettii JB137-S8。Ras ETaG配列:
Agaricus bisporus H97。Ras ETaG配列:
Coprinopsis cinerea okayama。Ras ETaG配列:
Hypholoma sublateritum FD-334。Ras ETaG配列:
図22:Sistotremastrum niveocremeum。Ras ETaG配列:
Sistotremastrum suecicum。Ras ETaG配列:
図23:Talaromyces leycettanus CBS 398.68。Ras ETaG配列:
図24:Thermoascus crustaceus。Ras ETaG配列:
図25:Bipolaris maydis ATCC 48331。Ras ETaG配列:
図26:Colletotrichum higginsianum IMI 349063。Ras ETaG配列:
図27:Gyalolechia flavorubescens。Ras ETaG配列:
図28:Lecanosticta acicola CBS 871.95。RasGEF ETaG配列:
Penicillium chrysogenum Wisconsin 54-1255。RasGEF ETaG配列:
図29:Magnaporthe oryzae 70-15。RasGEF ETaG配列:
図30:Arthroderma gypseum CBS 118893。RasGEF ETaG配列:
図31:Endocarpon pusillum株KoLRI No.LF000583。RasGEF ETaG配列:
図32:Fistulina hepatica ATCC 64428。RasGEF ETaG配列:
図33:Aureobasidium pullulans var.pullulans EXF-150。RasGEF ETaG配列:
図34:Acremonium furcatum。RasGAP ETaG配列:
図35:Purpureocillium lilacinum株TERIBC 1。RasGEF ETaG配列:
Fusarium sp.JS1030。RasGEF ETaG配列:
図36:Corynespora cassiicola UM 591。RasGAP ETaG配列:
Magnaporthe oryzae株SV9610。RasGAP ETaG配列:
図37:Colletotrichum acutatum株1 KC05_01。RasGAP ETaG配列:
図38:Hypoxylon sp.E7406B。RasGAP ETaG配列:
Diaporthe ampelina単離株DA912。RasGAP ETaG配列:
図39:Talaromyces piceae株9-3。RasGAP ETaG配列:
Sporothrix insectorum RCEF 264。RasGAP ETaG配列:
同定された生合成遺伝子クラスターにより、多数の方法を利用して、本開示に従って、これらの生合成遺伝子クラスター(例えば、Clevenger, et al., Nat. Chem. Bio., 13, 895-901 (2017)およびその中で引用されている参考文献に記載されている)の酵素によって産生される化合物を同定および特徴付けることができる。化合物は、ひとたび同定されると、アッセイして、ヒトRasタンパク質のモジュレーションに関してその能力を評価することができる。その上およびそれに代えて、化合物は、例えば、SAR研究のためのさらなるアナログを調製するためのリード化合物として使用して、Ras活性をモジュレートするための親和性、有効性、選択性、等をさらに改善することができる。有用な化合物が、同定されたETaGに関係する生合成遺伝子クラスターから開発されるであろうと予想される。
様々な実施形態について本明細書で記載および説明してきたが、当業者であれば、機能を実行するため、および/または結果および/または本開示に記載されている利点のうち1種もしくは複数を得るための、種々の他の手段および/または構造を容易に想定するであろう、また、斯かる変種および/または改変のそれぞれが含まれるものと思われる。より一般には、当業者であれば、本明細書に記載されているあらゆるパラメータ、寸法、材料および構成が、一例であることを意味し、実際のパラメータ、寸法、材料および/または構成が、本開示の教示が使用される特異的な応用(単数または複数)に依存するであろうことを容易に認めるであろう。当業者であれば、本開示に記載されている本開示の特異的実施形態の多くの均等を認識するであろう、または慣用的な実験法に過ぎないものを使用して確かめることができるであろう。したがって、前述の実施形態が、単なる例として提示されており、請求されるべき技術を含む提供される技術が、特に記載および請求されている仕方以外で実施され得ることを理解されたい。加えて、2種またはそれよりも多い特色、システム、物品、材料、キットおよび/または方法のいずれかの組合せは、斯かる特色、システム、物品、材料、キットおよび/または方法が相互に矛盾しないのであれば、本開示の範囲内に含まれる。
本発明は、例えば、以下の項目を提供する。
(項目1)
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行うステップと、
前記真菌核酸配列のうち少なくとも1種の内で、
前記生合成遺伝子クラスターの産物の生合成に要求されることも関与することもなく、
前記クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内にあり、
哺乳動物核酸配列と相同であり、
前記クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップと
を含む、方法。
(項目2)
前記ETaG配列が、前記クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にある、項目1に記載の方法。
(項目3)
生合成遺伝子クラスターを含む核酸配列が、前記生合成遺伝子クラスターの前記生合成遺伝子に対する前記近接ゾーンの核酸配列、および前記生合成遺伝子クラスターの核酸配列以外の配列を含有しない、項目2に記載の方法。
(項目4)
近接ゾーンが、前記クラスターにおける生合成遺伝子の1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90または100kb以下上流または下流である、項目3に記載の方法。
(項目5)
前記哺乳動物核酸配列が、ヒト核酸配列である、項目4に記載の方法。
(項目6)
埋め込まれた標的遺伝子配列は、その塩基配列またはその部分が、哺乳動物核酸配列のものと少なくとも50%、60%、70%、80%または90%同一であるという点において、発現される哺乳動物核酸配列と相同である、項目5に記載の方法。
(項目7)
前記配列またはその部分が、少なくとも50、100、150または200塩基対の長さである、項目6に記載の方法。
(項目8)
埋め込まれた標的遺伝子配列が、埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質が、哺乳動物核酸配列またはその部分のものと相同であるという点において、発現される哺乳動物核酸配列と相同である、項目5に記載の方法。
(項目9)
埋め込まれた標的遺伝子またはその部分によってコードされる前記タンパク質が、哺乳動物核酸配列またはその部分によってコードされるタンパク質と少なくとも50%、60%、70%、80%または90%類似性のものである、項目8に記載の方法。
(項目10)
埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質が、埋め込まれた標的遺伝子またはその部分によってコードされるタンパク質に結合する小分子が、哺乳動物核酸配列またはその部分によってコードされるタンパク質にも結合するという点において、哺乳動物核酸配列によってコードされるタンパク質と同様の三次元構造を有する、項目9に記載の方法。
(項目11)
前記埋め込まれた標的遺伝子またはそれらの部分によってコードされるタンパク質および前記哺乳動物核酸配列またはそれらの部分によってコードされるタンパク質への前記小分子の結合が、100μM、50μM、10μM、5μMまたは1μM以下のKdを有する、項目10に記載の方法。
(項目12)
前記小分子が、生合成遺伝子クラスターの生合成産物である、項目10に記載の方法。
(項目13)
埋め込まれた標的遺伝子によってコードされるタンパク質の部分が、発現される哺乳動物核酸配列によってコードされるタンパク質の部分と少なくとも50%、60%、70%、80%または90%類似性のものであり、前記タンパク質の前記部分が、タンパク質ドメインである、項目5に記載の方法。
(項目14)
前記埋め込まれた標的遺伝子が、異なる真菌株に由来し、かつ相同なまたは同一の生合成遺伝子クラスターを含む前記セットにおける全真菌核酸配列の80%、90%、95%または100%に存在しない、先行する項目のいずれか一項に記載の方法。
(項目15)
前記セットが、少なくとも100、500、1,000、5,000、10,000、15,000、20,000、22,000、25,000または30,000種の別個の真菌株由来の核酸配列を含む、項目14に記載の方法。
(項目16)
少なくとも1種の被験化合物を、真菌核酸配列の埋め込まれた標的遺伝子によってコードされる遺伝子産物と接触させるステップであって、前記埋め込まれた標的遺伝子(ETaG)が、
生合成遺伝子クラスターの産物の生合成に要求されることも関与することもなく、
前記クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内にあり、
哺乳動物核酸配列と相同であり、
前記クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ことを特徴とする、ステップと、
前記被験化合物が存在しない場合と比較して、前記被験化合物が存在する場合に前記遺伝子産物のレベルもしくは活性が変更される、または
前記遺伝子産物のレベルもしくは活性が、前記レベルもしくは活性に公知の効果を有する参照薬剤が存在する場合に観察されるものに匹敵する
ことを決定するステップと
を含む、方法。
(項目17)
前記ETaGが、項目1~15のいずれか一項に記載のETaGである、項目16に記載の方法。
(項目18)
前記哺乳動物核酸配列が、ヒトRas配列である、項目17に記載の方法。
(項目19)
前記生合成遺伝子クラスターが、図1~図39のうち1つにおける生合成遺伝子クラスターである、項目16に記載の方法。
(項目20)
前記被験化合物が、前記生合成遺伝子クラスターの生合成産物またはそのアナログである、項目16に記載の方法。
(項目21)
少なくとも1種の被験化合物を、発現される哺乳動物核酸配列によってコードされる遺伝子産物と接触させるステップであって、前記配列が、項目1~15のいずれか一項に記載の埋め込まれた標的遺伝子配列と相同である発現される哺乳動物核酸配列である、ステップ
を含む、方法。
(項目22)
前記哺乳動物核酸配列が、ヒトRas配列である、項目21に記載の方法。
(項目23)
前記ETaGが、図1~図39のうち1つにおけるETaGである、項目21に記載の方法。
(項目24)
前記生合成遺伝子クラスターが、図1~図39のうち1つにおける生合成遺伝子クラスターである、項目21に記載の方法。
(項目25)
前記被験化合物が、前記生合成遺伝子クラスターの生合成産物またはそのアナログである、項目21に記載の方法。
(項目26)
生合成遺伝子クラスターの少なくとも1種の生合成遺伝子に対する近接ゾーン内にあるETaGのヒトホモログを同定するステップと、
前記ヒトホモログに対する、生合成遺伝子クラスターによってコードされる酵素によって産生される産物または前記産物のアナログの効果を必要に応じてアッセイするステップと
を含む、方法。
(項目27)
前記ETaGが、項目1~15のいずれか一項に記載のETaGである、項目26に記載の方法。
(項目28)
ヒト標的のモジュレーターを同定するおよび/または特徴付けるための方法であって、
産物またはそのアナログを提供するステップであって、前記産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、前記生合成遺伝子クラスターにおける少なくとも1種の遺伝子に対する近接ゾーン内に、
前記ヒト標的、または前記ヒト標的をコードする核酸配列と相同であり、
前記クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む、方法。
(項目29)
前記ETaGが、項目1~15のいずれか一項に記載のETaGである、項目28に記載の方法。
(項目30)
前記ヒト標的が、Rasタンパク質である、項目28に記載の方法。
(項目31)
前記ETaGが、図1~図39のうち1つにおけるETaGである、項目28に記載の方法。
(項目32)
前記生合成遺伝子クラスターが、図1~図39のうち1つにおける生合成遺伝子クラスターである、項目28に記載の方法。
(項目33)
ヒト標的をモジュレートするための方法であって、
産物またはそのアナログを提供するステップであって、前記産物が、生合成遺伝子クラスターによってコードされる酵素によって産生され、前記生合成遺伝子クラスターにおける少なくとも1種の生合成遺伝子に対する近接ゾーン内に、
前記ヒト標的、または前記ヒト標的をコードする核酸配列と相同であり、
前記クラスターにおける少なくとも1種の生合成遺伝子と、必要に応じて同時調節される
ETaGが存在する、ステップ
を含む、方法。
(項目34)
前記ヒト標的が、Rasタンパク質である、項目33に記載の方法。
(項目35)
前記ETaGが、図1~図39のうち1つにおけるETaGである、項目33に記載の方法。
(項目36)
前記生合成遺伝子クラスターが、図1~図39のうち1つにおける生合成遺伝子クラスターである、項目33に記載の方法。
(項目37)
前記ETaGが、項目1~15のいずれか一項に記載のETaGである、項目33に記載の方法。
(項目38)
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセット
を含むデータベースであって、
核酸配列の前記セットが、コンピュータ可読媒体において具現化されている、データベース。
(項目39)
項目1~37のいずれか一項に記載の1種または複数の埋め込まれた標的遺伝子が、インデックス化されている、項目38に記載のデータベース。
(項目40)
それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットを表すデータを記憶する、1個または複数の非一過性機械可読記憶媒体
を含むシステム。
(項目41)
それぞれETaG配列であるか、またはETaG配列を含む、核酸配列のセットを表すデータを記憶する、1個または複数の非一過性機械可読記憶媒体
を含むシステム。
(項目42)
項目1~37のいずれか一項に記載の1種または複数の埋め込まれた標的遺伝子が、インデックス化されている、項目41に記載のシステム。
(項目43)
項目1~37のいずれか一項に記載の方法を実行するように適応されたコンピュータシステム、または項目34~39のいずれか一項に記載のデータベースにアクセスするように適応されたコンピュータシステム。
(項目44)
例示的実施形態1~108のいずれか一つに記載の方法、データベースまたはシステム。

Claims (16)

  1. 哺乳動物治療標的を調節する小分子産物を産生する生合成遺伝子クラスターを同定するための方法であって、
    (i)前記哺乳動物治療標的の核酸配列を用いて、それぞれ真菌株において見出され、かつ生合成遺伝子クラスターを含む、核酸配列のセットへの問い合わせを行い、前記哺乳動物治療標的の核酸配列のホモログを同定するステップと、
    (ii)前記問い合わせに基づいて、前記真菌核酸配列のうち少なくとも1の内で、
    前記生合成遺伝子クラスターの産物の生合成に要求されることがなく、
    前記生合成遺伝子クラスターにおける少なくとも1の生合成遺伝子に対する近接ゾーン内にあり、かつ
    前記哺乳動物治療標的の核酸配列のホモログである
    ことを特徴とする埋め込まれた標的遺伝子(ETaG)配列を同定するステップであって、前記近接ゾーンが、前記生合成遺伝子クラスターにおける前記少なくとも1つの生合成遺伝子の100kb以下上流または下流である、同定するステップ
    を含み、前記同定されたETaGを含む前記生合成遺伝子クラスターの産物が、前記哺乳動物治療標的のモジュレーター候補である、方法。
  2. 前記ETaG配列の発現が、前記クラスターにおける少なくとも1の生合成遺伝子の発現と同時調節される、請求項1に記載の方法。
  3. 生合成遺伝子クラスターを含む核酸配列が、前記生合成遺伝子クラスターの前記生合成遺伝子に対する前記近接ゾーンの核酸配列、および前記生合成遺伝子クラスターの核酸配列以外の配列を含有しない、請求項1に記載の方法。
  4. 近接ゾーンが、前記生合成遺伝子クラスターにおける前記少なくとも1つの生合成遺伝子の1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、または0kb以下上流または下流である、請求項1~3のいずれか一項に記載の方法。
  5. 前記哺乳動物治療標的の核酸配列が、ヒト治療標的の核酸配列である、請求項1に記載の方法。
  6. 前記埋め込まれた標的遺伝子配列塩基配列が、哺乳動物治療標的の核酸配列の塩基配列と少なくとも20%、30%、40%、50%、60%、70%、80%または90%同一である、請求項1に記載の方法。
  7. 前記埋め込まれた標的遺伝子配列の前記塩基配列が、少なくとも50、100、150または200塩基対の長さである、請求項6に記載の方法。
  8. 前記埋め込まれた標的遺伝子配列によってコードされるタンパク質が、前記哺乳動物治療標的の核酸配列によってコードされるタンパク質のホモログである、請求項1に記載の方法。
  9. 前記埋め込まれた標的遺伝子配列によってコードされる前記タンパク質のアミノ酸配列が、前記哺乳動物治療標的の核酸配列によってコードされる前記タンパク質のアミノ酸配列と少なくとも20%、30%、40%、50%、60%、70%、80%または90%同一である、請求項8に記載の方法。
  10. 前記埋め込まれた標的遺伝子配列によってコードされる前記タンパク質に結合する小分子が、前記哺乳動物治療標的の核酸配列によってコードされる前記タンパク質にも結合するという点において、前記埋め込まれた標的遺伝子配列によってコードされる前記タンパク質が、前記哺乳動物治療標的の核酸配列によってコードされるタンパク質と同様の三次元構造を有する、請求項9に記載の方法。
  11. 前記埋め込まれた標的遺伝子配列によってコードされる前記タンパク質および前記哺乳動物治療標的の核酸配列によってコードされるタンパク質への前記小分子の結合が、100μM、50μM、10μM、5μMまたは1μM以下のKdを有する、請求項10に記載の方法。
  12. 前記小分子が、生合成遺伝子クラスターの生合成産物である、請求項10に記載の方法。
  13. 前記埋め込まれた標的遺伝子配列によってコードされる前記タンパク質が、前記哺乳動物治療標的の核酸配列によってコードされる前記タンパク質と少なくとも50%、60%、70%、80%または90%同一であり、前記タンパク質が、タンパク質ドメインを含む、請求項9に記載の方法。
  14. 前記同定された埋め込まれた標的遺伝子配列が、非相同の、または非同一の生合成遺伝子クラスターを含む前記セットにおける全真菌核酸配列に存在せず、かつ前記同定された埋め込まれた標的遺伝子配列が、ETaGを含むものとは異なる真菌株に由来する前記セットにおける全真菌核酸配列に存在しない、請求項1~4のいずれか一項に記載の方法。
  15. 前記セットが、少なくとも100、500、1,000、5,000、10,000、15,000、20,000、22,000、25,000または30,000種の別個の真菌株由来の核酸配列を含む、請求項14に記載の方法。
  16. 前記哺乳動物治療標的の核酸配列によってコードされる前記タンパク質を、ETaGを含む前記真菌核酸配列中の生合成遺伝子クラスターの前記小分子産物と接触させて、前記小分子が、前記哺乳動物治療標的の核酸配列によってコードされる前記タンパク質のレベルまたは活性を変化させるかどうかを決定するステップをさらに含む、請求項1~4のいずれか一項に記載の方法。
JP2020515852A 2017-09-14 2018-09-14 ヒト治療標的およびそのモジュレーター Active JP7404229B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2023127703A JP2023153953A (ja) 2017-09-14 2023-08-04 ヒト治療標的およびそのモジュレーター

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762558744P 2017-09-14 2017-09-14
US62/558,744 2017-09-14
PCT/US2018/051134 WO2019055816A1 (en) 2017-09-14 2018-09-14 HUMAN THERAPEUTIC TARGETS AND MODULATORS THEREFOR

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023127703A Division JP2023153953A (ja) 2017-09-14 2023-08-04 ヒト治療標的およびそのモジュレーター

Publications (3)

Publication Number Publication Date
JP2020533991A JP2020533991A (ja) 2020-11-26
JP2020533991A5 JP2020533991A5 (ja) 2021-09-30
JP7404229B2 true JP7404229B2 (ja) 2023-12-25

Family

ID=65723840

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2020515852A Active JP7404229B2 (ja) 2017-09-14 2018-09-14 ヒト治療標的およびそのモジュレーター
JP2023127703A Pending JP2023153953A (ja) 2017-09-14 2023-08-04 ヒト治療標的およびそのモジュレーター

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023127703A Pending JP2023153953A (ja) 2017-09-14 2023-08-04 ヒト治療標的およびそのモジュレーター

Country Status (6)

Country Link
US (2) US11749375B2 (ja)
EP (1) EP3682022A4 (ja)
JP (2) JP7404229B2 (ja)
CN (1) CN111655855A (ja)
CA (1) CA3075528A1 (ja)
WO (1) WO2019055816A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10612032B2 (en) 2016-03-24 2020-04-07 The Board Of Trustees Of The Leland Stanford Junior University Inducible production-phase promoters for coordinated heterologous expression in yeast
CA3075528A1 (en) 2017-09-14 2019-03-21 Lifemine Therapeutics, Inc. Human therapeutic targets and modulators thereof
IL294909A (en) 2020-02-13 2022-09-01 Zymergen Inc A metagenomic library and natural product discovery platform
US11200446B1 (en) 2020-08-31 2021-12-14 Element Biosciences, Inc. Single-pass primary analysis
AU2022383192A1 (en) * 2021-11-05 2024-06-13 Lifemine Therapeutics, Inc. Methods and systems for discovery of embedded target genes in biosynthetic gene clusters
EP4434038A1 (en) * 2021-11-16 2024-09-25 LifeMine Therapeutics, Inc. Methods and systems for discovery of non-embedded target genes
WO2023097290A1 (en) * 2021-11-23 2023-06-01 Lifemine Therapeutics, Inc. Deep learning methods for biosynthetic gene cluster discovery
CA3240445A1 (en) * 2021-12-10 2023-06-15 Chunhong Zhou Primary analysis in next generation sequencing

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6261842B1 (en) * 1997-10-23 2001-07-17 Wisconsin Alumni Research Foundation Microorganism genomics, compositions and methods related thereto
US6892139B2 (en) * 1999-01-29 2005-05-10 The Regents Of The University Of California Determining the functions and interactions of proteins by comparative analysis
WO2000047771A2 (en) * 1999-02-12 2000-08-17 Genset Biallelic markers derived from genomic regions carrying genes involved in arachidonic acid metabolism
JP2003519495A (ja) * 2000-01-11 2003-06-24 マキシジェン, インコーポレイテッド 多様性生成およびスクリーニングのための一体化されたシステムおよび方法
JP2005512504A (ja) 2001-03-26 2005-05-12 協和発酵工業株式会社 レイナマイシン生合成遺伝子クラスターおよびその成分ならびにそれらの使用
US20040076981A1 (en) * 2001-11-21 2004-04-22 Olen Yoder Fungal gene cluster associated with pathogenesis
US7053204B2 (en) 2002-09-24 2006-05-30 Wisconsin Alumni Research Foundation Global regulator of secondary metabolite biosynthesis and methods of use
WO2005071058A2 (en) 2004-01-27 2005-08-04 Compugen Ltd. Methods and systems for annotating biomolecular sequences
US8065089B1 (en) * 2004-03-30 2011-11-22 University Of North Carolina At Charlotte Methods and systems for analysis of dynamic biological pathways
US20090011476A1 (en) 2005-08-19 2009-01-08 Wisconsin Alumni Research Foundation Gene cluster and method for the biosynthesis of terrequinone a
AU2007204597B2 (en) * 2006-01-11 2013-01-24 Agriculture Victoria Services Pty Ltd Method of producing transgenic graminaceous cells and plants
WO2007139871A2 (en) 2006-05-24 2007-12-06 The Regents Of The University Of California Methods and materials for making simvastatin and related compounds
US8871494B2 (en) 2009-04-24 2014-10-28 Wisconsin Alumni Research Foundation Over-production of secondary metabolites by over-expression of the VEA gene
SG10201504099WA (en) 2009-10-08 2015-06-29 Univ California LovD MUTANTS EXHIBITING IMPROVED PROPERTIES TOWARDS SIMVASTATIN SYNTHESIS
US9499803B2 (en) 2009-10-08 2016-11-22 The Regents Of The University Of California Variant LovD polypeptide
TW201247315A (en) 2011-05-16 2012-12-01 Du Pont Catalytic hydrogenation of fluoroolefins, alpha-alumina supported palladium compositions and their use as hydrogenation catalysts
US20150310168A1 (en) * 2012-09-24 2015-10-29 National Institute Of Advanced Industrial Science And Technolgoy Method for predicting gene cluster including secondary metabolism-related genes, prediction program, and prediction device
US10968446B2 (en) * 2012-11-01 2021-04-06 Massachusetts Institute Of Technology Directed evolution of synthetic gene cluster
AU2014227811C1 (en) 2013-03-15 2018-09-27 Amyris, Inc. Use of phosphoketolase and phosphotransacetylase for production of acetyl-coenzyme a derived compounds
US10077448B2 (en) 2015-02-16 2018-09-18 Wisconsin Alumni Research Foundation Methods and systems for producing fungal secondary metabolites
US10118945B2 (en) 2015-10-30 2018-11-06 University Of Kansas Dereplication strain of Aspergillus nidulans
CA3008183A1 (en) * 2015-12-14 2017-06-22 Mcmaster University A natural product and genetic data analysis and discovery system, method and computational platform therefor
WO2017205387A1 (en) 2016-05-23 2017-11-30 Northwestern University Systems and methods for untargeted metabolomic screening
US11810649B2 (en) 2016-08-17 2023-11-07 The Broad Institute, Inc. Methods for identifying novel gene editing elements
US20200143907A1 (en) 2016-09-28 2020-05-07 The Broad Institute, Inc. Systematic screening and mapping of regulatory elements in non-coding genomic regions, methods, compositions, and applications thereof
CA3042726A1 (en) * 2016-11-16 2018-05-24 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for identifying and expressing gene clusters
WO2018175635A1 (en) 2017-03-21 2018-09-27 The Regents Of The University Of California Herbicidal compositions and methods of use thereof
CA3075528A1 (en) 2017-09-14 2019-03-21 Lifemine Therapeutics, Inc. Human therapeutic targets and modulators thereof
US20190130999A1 (en) 2017-10-26 2019-05-02 Indigo Ag, Inc. Latent Representations of Phylogeny to Predict Organism Phenotype

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ACS Chem. Biol.,2016年06月13日,Vol. 11,P. 2275-2284, Supporting Information
Nature Chemical Biology,2015年,Vol. 11,P. 671-677
Oncogene,2002年,Vol. 21,P. 2713-2720

Also Published As

Publication number Publication date
EP3682022A1 (en) 2020-07-22
JP2020533991A (ja) 2020-11-26
EP3682022A4 (en) 2021-06-09
JP2023153953A (ja) 2023-10-18
CN111655855A (zh) 2020-09-11
US20200211673A1 (en) 2020-07-02
WO2019055816A1 (en) 2019-03-21
US11749375B2 (en) 2023-09-05
CA3075528A1 (en) 2019-03-21
US20240212788A1 (en) 2024-06-27

Similar Documents

Publication Publication Date Title
JP7404229B2 (ja) ヒト治療標的およびそのモジュレーター
Zhou et al. Enzymatic synthesis of resorcylic acid lactones by cooperation of fungal iterative polyketide synthases involved in hypothemycin biosynthesis
Srinivas et al. Widespread remodeling of the m6A RNA-modification landscape by a viral regulator of RNA processing and export
Xu et al. Systemic in silico screening in drug discovery for coronavirus disease (COVID-19) with an online interactive web server
KR20180069141A (ko) PHLDA1 또는 PIK3C2B의 발현에 기초한 PI3K/AKT/mTOR 저해제의 치료 효과의 예측 방법
US8637684B2 (en) Tautomycetin and tautomycetin analog biosynthesis
Moertel et al. Oligonucleotide microarray analysis of strain-and gender-associated gene expression in the human blood fluke, Schistosoma japonicum
CA2707009A1 (en) Methods for inhibiting fascin
Wang et al. Identification of a putative polyketide synthase gene involved in usnic acid biosynthesis in the lichen Nephromopsis pallescens
Lou et al. The life of SARS-CoV-2 inside cells: Replication–transcription complex assembly and function
Huang et al. OAS1, OAS2, and OAS3 contribute to epidermal keratinocyte proliferation by regulating cell cycle and augmenting IFN-1‒Induced jak1‒signal transducer and activator of transcription 1 phosphorylation in psoriasis
Koga et al. Tumor suppressor cylindromatosis acts as a negative regulator for Streptococcus pneumoniae-induced NFAT signaling
Ryder et al. Analysis of emerging variants in structured regions of the SARS-CoV-2 genome
Walker et al. Enisamium is a small molecule inhibitor of the influenza A virus and SARS-CoV-2 RNA polymerases
Matsui et al. 2-Alkylquinolone alkaloid biosynthesis in the medicinal plant Evodia rutaecarpa involves collaboration of two novel type III polyketide synthases
Bharatham et al. Pharmacophore identification and virtual screening for methionyl-tRNA synthetase inhibitors
Salusso et al. Histone methyltransferase 1 regulates the encystation process in the parasite Giardia lamblia
Al-Rashedi et al. Prediction of potential inhibitors against SARS-CoV-2 endoribonuclease: RNA immunity sensing
KR101496232B1 (ko) 포스포트랜스아세틸라제 억제 활성을 가지는 화합물을 포함하는 세균 감염 질환 예방 또는 치료용 약제학적 조성물
Korolev et al. Structural-functional analysis of 2, 1, 3-benzoxadiazoles and their N-oxides as HIV-1 integrase inhibitors
Breger et al. Ghost authors revealed: The structure and function of human N 6‐methyladenosine RNA methyltransferases
Bailey et al. Stability-Based Proteomics for Investigation of Structured RNA–Protein Interactions
Mirasol-Meléndez et al. Characterization of multiple enolase genes from Trichomonas vaginalis. Potential novel targets for drug and vaccine design
Sobhia et al. Rapid structure-based identification of potential SARS-CoV-2 main protease inhibitors
Lee et al. Histone H4-specific deacetylation at active coding regions by Hda1C

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210817

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220621

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220722

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221021

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20221220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230413

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230804

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20230912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231213

R150 Certificate of patent or registration of utility model

Ref document number: 7404229

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150