JP2019508821A

JP2019508821A - タンパク質−リガンド相互作用を同定するためのプロテオームドッキング方法

Info

Publication number: JP2019508821A
Application number: JP2018553273A
Authority: JP
Inventors: ステファンスコットマッキンノン; レオナルドデイヴィッドモレイニス; ジェイソンミタキディス; フアドジーグワドリー
Original assignee: Cyclica Inc
Current assignee: Cyclica Inc
Priority date: 2015-12-31
Filing date: 2015-12-31
Publication date: 2019-03-28
Also published as: CN109155148B; WO2017113004A1; CN109155148A; EP3398102C0; EP3398102A1; EP3398102B1; US12033723B2; CA3010226A1; US20240321391A1; EP3398102A4; CA3010226C; US20190018924A1

Abstract

本発明は、標的タンパク質を同定するための方法を含む。本発明は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信すること；リガンドを使用して、第１のタンパク質を同定することであって、リガンドが第１のタンパク質と結合してリガンド−タンパク質複合体を形成するものであり；第１のタンパク質について第１の結合部位プロファイルを生成することであって、第１の結合部位プロファイルは、第１のタンパク質の分子特性を表すものであり；被制御サーバから、多数のタンパク質についての表面の分子特性を表す構造データを得ることであって、多数のタンパク質は標的タンパク質を含むものであり；第１の結合部位プロファイルおよび構造データを用いて、標的タンパク質を同定すること；および標的タンパク質をユーザに提示することを含む。【選択図】なし

Description

タンパク質−リガンド相互作用を同定するためのトップケモゲノミクスマッピングおよびタンパク質標的同定方法は、定量的構造活性相関（ＱＳＡＲ）およびファーマコフォアモデリングを用いる。これらの方法は、薬物そのものの構造的類似性が生物学的活性（例えば、生物学的標的、毒性、有効性など）における類似性に対応すると仮定して、クエリリガンドを既知のリガンドのデータベースと比較する機械学習を用いる。構造的データに基づくタンパク質−リガンド相互作用マッピングは一般に、選択された受容体足場および／または薬物足場に限定される。

一般に、一態様において、実施形態は、標的タンパク質を同定するための方法に関する。この方法は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信することを含む。この方法は、リガンドを使用して、第１のタンパク質を同定することをさらに含み、リガンドは第１のタンパク質と結合してリガンド−タンパク質複合体を形成する。この方法は、第１のタンパク質の第１の結合部位プロファイルを生成することをさらに含み、第１の結合部位プロファイルは第１のタンパク質の分子特性を表す。この方法はさらに、被制御サーバから、多数のタンパク質の表面の分子特性を表す構造データを得ることを含み、多数のタンパク質は標的タンパク質を含む。この方法は、第１の結合部位プロファイルおよび構造データを用いて、標的タンパク質を同定することをさらに含む。本方法は、標的タンパク質をユーザに提示することをさらに含む。

一般に、一態様では、実施形態は、標的タンパク質を同定するためのシステムに関する。このシステムは、多数のタンパク質の表面の分子特性を表す構造データを保存するデータリポジトリを含む。システムは、コンピュータプロセッサと、プロセッサによって実行可能なメモリとを含む被制御サーバをさらに備える。メモリは、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信するための機能を備える。このメモリは、リガンドを使用して、第１のタンパク質を同定するための機能をさらに備え、リガンドは第１のタンパク質と結合してリガンド−タンパク質複合体を形成する。このメモリは、第１のタンパク質の第１の結合部位プロファイルを生成するための機能をさらに備え、第１の結合部位プロファイルは第１のタンパク質の分子特性を表す。このメモリは、被制御サーバから、多数のタンパク質の表面の分子特性を表す構造データを得るための機能をさらに備え、多数のタンパク質は標的タンパク質を含む。このメモリは、第１の結合部位プロファイルおよび構造データを用いて、標的タンパク質を同定するための機能をさらに備える。このメモリは、標的タンパク質をユーザに提示するための機能をさらに備える。

一般に、一態様では、実施形態は、標的タンパク質を同定するための様々な命令を保存する非一時的なコンピュータ可読媒体（ＣＲＭ）に関する。この命令は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信するための機能を備える。この命令は、リガンドを使用して、第１のタンパク質を同定するための機能をさらに備え、リガンドは第１のタンパク質と結合してリガンド−タンパク質複合体を形成する。この命令は、第１のタンパク質の第１の結合部位プロファイルを生成するための機能をさらに備え、第１の結合部位プロファイルは第１のタンパク質の分子特性を表す。この命令は、被制御サーバから、多数のタンパク質の表面の分子特性を表す構造データを得るための機能をさらに備え、多数のタンパク質は標的タンパク質を含む。この命令は、第１の結合部位プロファイルおよび構造データを用いて、標的タンパク質を同定するための機能をさらに備える。この命令は、標的タンパク質をユーザに提示するための機能をさらに備える。

本発明の他の態様は、以下の説明および添付の特許請求の範囲から明らかになるであろう。

本発明の１つ以上の実施形態によるシステムを示す図である。本発明の１つ以上の実施形態によるフローチャートを示す図である。本発明の１つ以上の実施形態によるフローチャートを示す図である。本発明の１つ以上の実施形態によるフローチャートを示す図である。本発明の１つ以上の実施形態による例を示す図である。本発明の１つ以上の実施形態による例を示す図である。本発明の１つ以上の実施形態による例を示す図である。本発明の１つ以上の実施形態による例を示す図である。本発明の１つ以上の実施形態による例を示す図である。本発明の１つ以上の実施形態によるコンピューティングシステムを示す図である。

本発明の特定の実施形態を、添付の図面を参照してここで詳細に説明する。様々な図の同様の要素は、一貫性のために同様の参照番号で示される。

本発明の実施形態の以下の詳細な説明では、本発明のより完全な理解をもたらすために、多数の特定の詳細が記載される。しかし、当業者であれば、これらの特定の詳細がなく、本発明を実施できることは明らかであろう。他の例では、説明を不必要に複雑にすることを避けるために、周知の特徴は詳細には説明されていない。

本出願全体を通して、序数（例えば、第１、第２、第３など）は、要素（すなわち、本出願内の任意の名詞）の形容詞として使用されてよい。序数の使用は、要素の特定の順序付けを暗示または作成するものでなく、用語「前」「後」「単一」、および他のこのような語法の使用によってなど、明示的に開示されない限り、単一の要素のみである任意の要素に限定するものではない。むしろ、序数の使用は要素を区別することである。一例として、第１の要素は第２の要素と区別され、第１の要素は２つ以上の要素を包含してもよく、第２の要素を要素の順序で後にする（または先行する）ことができる。

本発明の１つ以上の実施形態は、タンパク質−リガンド相互作用を同定するためのプロテオームドッキングのための方法、システム、および非一時的コンピュータ可読媒体を含む。本発明は、分子と種々のタンパク質構造との間の相互作用を同定するための任意の分子を受け入れることができる。例えば、本発明の実施形態は、１０００ダルトンまでのサイズを有する分子を受け入れることができる。当業者は、他のサイズの分子が許容され得ることを理解するであろう。特に、１つ以上の実施形態は、リガンドに基づいて標的タンパク質を同定するリクエストを受信することに関する。さらに、１つ以上の実施形態は、リガンドを用いて第１のタンパク質を同定することに関する。１つ以上の実施形態では、リガンドは第１のタンパク質と結合してリガンド−タンパク質複合体を形成する。さらに、１つ以上の実施形態は、第１のタンパク質の第１の結合部位プロファイルを生成することに関する。１つ以上の実施形態では、第１の結合部位プロファイルは、第１のタンパク質の分子特性を表す。さらに、１つ以上の実施形態は、被制御サーバから複数のタンパク質の表面の分子特性を表す構造データを得ることに関する。１つ以上の実施形態では、複数のタンパク質は、標的タンパク質を含む。さらに、１つ以上の実施形態は、第１の結合部位プロファイルおよび構造データを使用して標的タンパク質を同定することに関する。さらに、１つ以上の実施形態は、標的タンパク質をユーザに提示することに関する。

図１は、本発明の１つ以上の実施形態によるシステムの概略図を示す。図１は、構成要素の構成を示すが、他の構成も本発明の範囲から逸脱することなく使用できる。例えば、様々な構成要素を組み合わせて単一の構成要素を形成できる。別の例として、単一の部品によって実行される機能は、２つ以上の部品によって実施されてもよい。

ここで図１を参照すると、本発明の１つ以上の実施形態によれば、システム（１００）は、１つ以上の被制御サーバ（１１０）を備えてよい。１つ以上の実施形態では、被制御サーバ（１１０）は、ドッキングシミュレータ（１１１）、ドッキングスコアジェネレータ（１１３）、およびプロファイルジェネレータ（１１５）などの様々なモジュールを備える。

被制御サーバ（１１０）は、データリポジトリ（例えば、データリポジトリ（１２０））内の様々なデータ構造中に様々なデータ（例えば、分子データ（１２１）、タンパク質データ（１３０））を保存できる。本発明の１つ以上の実施形態では、データリポジトリ（１２０）は、データを保存するための任意のタイプのストレージユニットおよび／またはデバイス（例えば、ファイルシステム、データベース、テーブルのコレクション、または任意の他のストレージメカニズム）である。さらに、データリポジトリ（１２０）は、複数の異なるストレージユニットおよび／またはデバイスを備えてもよい。複数の異なるストレージユニットおよび／またはデバイスは、同じタイプのものであってよく、または同じ物理的な場所に配置されてもよい。

１つ以上の実施形態では、被制御サーバ（１１０）は、ネットワーク（１０５）を介してリモートサーバ（１６０）に動作可能に接続される。リモートサーバ（１６０）は、データリポジトリ（図示せず）内の様々なデータ構造中に様々なデータ（例えば、参照分子データ（１６１）、参照タンパク質データ（１６２））を保存できる。

１つ以上の実施形態では、分子データ（１２１）は、リガンドデータ（１２２）を含む。一般に、リガンドは、タンパク質に結合し得る原子、分子、イオン、および／または化学化合物であり得る。１つ以上の実施形態では、リガンドは、薬物、薬物候補、栄養補助食品、ビタミン、補因子、および／または毒素として記載される。リガンドデータ（１２２）は、リガンドの分子構造および／または化学的官能性に基づいて、リガンドの分子特性を含み得る。さらに、リガンドデータ（１２２）は、リガンドの化学的特性、物理的特性、および／または構造的特性を含み得る。例えば、リガンドデータ（１２２）は、インビボおよび／またはインビトロでの試験リガンドの生物学的活性および／または薬理学的活性を表すことができる。別の例では、リガンドデータ（１２２）は、種々の無機および／または有機試薬と化学的に反応するときに試験リガンドが示す効果を表すことができる。さらに、リガンドデータ（１２２）は、リガンドがＵＶ−ＶＩＳおよびＩＲ放射線と相互作用する様式について表すことができる。さらに、リガンドデータ（１２２）は、リガンドの核磁気共鳴（ＮＭＲ）スペクトルを含んでよく、ＮＭＲ分光法はリガンドの１つ以上の原子の物理的および化学的特性を決定する。

さらに、分子データ（１２１）は、１つ以上の実施形態に従って、被制御サーバ（１１０）によって生成される１つ以上の分子の分子指紋を含む。分子指紋は、リガンドの１つ以上の分子特性を表す定量値であってよい。例えば、試験リガンドの分子特性は、２進数字のストリングに変換され、分子指紋としてデータリポジトリ中に保存されてよく、各２進数字および／または２進数字セットは試験リガンドの特定の分子特性に対応する。さらに、分子指紋は、試験リガンド内の特定の分子サブ構造の存在の有無を表すことができる。１つ以上の実施形態では、分子指紋は、分子量、分子容、モル屈折率、分配係数、透過性、バイオアベイラビリティ、原子数、原子の種類、結合数、結合長、環数、接続指数、溶媒接触可能表面積、主要な慣性モーメント、部分電荷、極性指数、熱力学的特性、および／または静電表面記述子を表す。

１つ以上の分子の記述子は、分子データ中に保存されてよい（１２１）。記述子は、１つ以上の分子の分子特性を特徴付けることができる数値として定義され得る。１つ以上の実施形態では、１つ以上の分子に関する記述子が、１つ以上の分子の分子指紋を生成するために使用される。記述子は、分子特性の計算（ＱＳＰＲ−定量的構造特性関係）または化学的活性（ＱＳＡＲ−定量的構造活性関係）の計算に使用できる。１つ以上の実施形態では、分子記述子は、０Ｄ記述子（すなわち、構成記述子、カウント記述子、結合数、分子量、原子数）、１Ｄ記述子（すなわち、構造フラグメント、指紋、水素結合受容体および供与体のリスト）、２Ｄ記述子（すなわちグラフ不変体）、３Ｄ記述子（すなわち、幾何学的記述子、表面特性、３Ｄ−ＭｏＲＳＥ記述子、ＷＨＩＭ記述子、ＧＥＴＡＷＡＹ記述子、量子化学的記述子、サイズ、立体構造、表面構造および／またはボリューム記述子）、および／または４Ｄ記述子（すなわち、ＧＲＩＤおよび／またはＣｏＭＦＡ法、Ｖｏｌｓｕｒｆから派生したもの）を含む。

１つ以上の実施形態では、分子データ（１２１）は、類似リガンドデータ（１２３）を含む。類似リガンドデータ（１２３）は、リガンドデータ（１２２）中に保存されたリガンドに対するそれらの類似性に基づいて同定され得る１つ以上の分子に関する分子特性を含み得る。例えば、１つ以上の類似リガンドは、被制御サーバ（１１０）に動作可能に接続されたコンピューティングデバイス（図示せず）のコンピュータプロセッサ（図示せず）によって同定されてよく、類似リガンドは、リガンドデータ（１２２）中に保存された試験リガンドの分子特性に類似している分子特性、生物学的特性、および／または化学的特性を基準として同定され得る。１つ以上の実施形態では、類似リガンドデータ（１２３）は、リガンドデータ（１２２）中に保存された試験リガンドの特性に関して上に開示した類似リガンドの同じタイプの分子特性を表す。

１つ以上の実施形態では、分子データ（１２１）は、１つ以上のプロテオーム結合プロファイルについてのプロテオーム結合プロファイルデータ（１２５）を含む。プロテオーム結合プロファイルデータ（１２５）は、１つ以上のリガンドについてのプロテオーム結合プロファイルを含み得る。さらに、プロテオーム結合プロファイルは、リガンドデータ（１２２）または類似リガンドデータ（１２３）中に保存された分子と相互作用する１つ以上のタンパク質を表すことができる。例えば、プロテオーム結合プロファイルデータ（１２５）は、リガンドデータ（１２２）中に保存された試験リガンドのプロテオーム結合プロファイルを含んでよく、プロテオーム結合プロファイルは、試験リガンドとうまく結合してリガンド−タンパク質複合体を形成するタンパク質を表す。１つ以上の実施形態では、リガンド−タンパク質複合体は、タンパク質の１つ以上の結合部位に対してリガンドが親和性を示す結果として、タンパク質にリガンドが首尾よく結合する場合に結果として生じる構造体である。別の例では、リガンドデータ（１２２）中に保存された試験リガンドは、１つ以上のタンパク質とのドッキングシミュレーションを受け、閾値を満たすドッキングスコアを有する得られたタンパク質を、試験リガンドのプロテオーム結合プロファイル中に挿入できる。さらに、プロテオーム結合プロファイルは、試験リガンドと相互作用する、および／または結合すると予測されるそれらの結合親和性と共にタンパク質の完全なセットを含んでよい。１つ以上の実施形態では、分子データ（１２１）は、分子の有形のおよび／または物理的実験室の試験中に実験的に決定される。１つ以上の実施形態では、分子データ（１２１）は、遠隔サーバ（１６０）に保存された参照分子データ（１６１）から得られる。１つ以上の実施形態では、分子データ（１２１）は、１つ以上のタンパク質と１つ以上のリガンドとのドッキングシミュレータ（１１１）によって実施される仮想ドッキングシミュレーションおよび／または計算的結合予測から得られたデータを含む。

１つ以上の実施形態では、タンパク質データ（１３０）は、タンパク質構造データ（１３１）を含む。タンパク質構造データ（１３１）は、１つ以上のタンパク質の分子特性（幾何学的および／または生物物理学的特性など）を含み得る。さらに、タンパク質構造データ（１３１）は、形状、平面性、幾可学的配置、静電特性、アミノ酸残基組成、原子組成、サイズ、疎水性、極性、および／または柔軟性などの１つ以上のタンパク質の分子特性を表すタンパク質表面記述子を含み得る。１つ以上の実施形態では、タンパク質構造データ（１３１）は、１つ以上のタンパク質の生物学的活性および／または生化学的活性を表す非分子的属性を含む。１つ以上の実施形態では、タンパク質構造データ（１３１）は、実験的に決定された構造、相同性モデリングによるタンパク質構造体、タンパク質構造予測、および／またはタンパク質コンフォメーションのアンサンブルから得られる。１つ以上の実施形態では、タンパク質構造データ（１３１）は、類似の分子特性を示す他のタンパク質の一致および同定を可能にするために２進数字および／または英数字フォーマットで保存されるタンパク質表面の分子特性を含む。

１つ以上の実施形態では、タンパク質データ（１３０）は、標的タンパク質データ（１３３）を含む。標的タンパク質データ（１３３）は、試験リガンドと結合してリガンド−タンパク質複合体を形成すると予測される１つ以上のタンパク質の分子特性を含み得る。１つ以上の実施形態では、標的リガンドに類似している分子と結合する他のタンパク質との分子類似性に基づいて、標的タンパク質が同定される。例えば、標的タンパク質は、標的タンパク質の表面の分子特性と、類似分子と結合するタンパク質の分子特性との間の類似性因子に基づいて同定され得る。類似因子は、ユーザによって手動で設定される閾値であってよく、またはコンピューティングデバイスによって計算され設定されてもよい。

１つ以上の実施形態では、タンパク質データ（１３０）は、１つ以上の結合部位プロファイルについての結合部位プロファイルデータ（１３４）を含む。結合部位プロファイルデータ（１３４）は、１つ以上のタンパク質の結合部位プロファイルを含み得る。１つ以上の実施形態では、結合部位プロファイルは、タンパク質の１つ以上の結合部位の化学的および幾何学的特徴を表す分子特性を含む。１つ以上の実施形態では、タンパク質の結合部位プロファイルは、タンパク質に対する１つ以上のリガンドの結合親和性を含む。１つ以上の実施形態では、タンパク質データ（１３０）は、タンパク質の有形の実験室試験中に採取される実験データを含む。１つ以上の実施形態では、タンパク質データ（１３０）は、１つ以上のタンパク質と１つ以上のリガンドとのドッキングシミュレータ（１１１）によって実施される仮想ドッキングシミュレーションから得られるデータを含む。１つ以上の実施形態では、タンパク質データ（１３０）は、遠隔サーバ（１６０）に保存された参照タンパク質データ（１６２）から得られる。１つ以上の実施形態では、結合部位プロファイルデータ（１３５）は、類似の分子特性を示す他のタンパク質との一致を可能にするために２進数字および／または英数字フォーマットで保存される分子特性を含む。

１つ以上の実施形態では、ドッキングシミュレータ（１１１）は、リガンドとタンパク質の１つ以上の結合部位との間の結合をシミュレートするために、分子データ（１２１）からのリガンドの分子特性、およびタンパク質データ（１３０）からのタンパク質の分子特性を取得し、抽出する。さらに、ドッキングは、タンパク質の１つ以上の結合部位に結合するリガンドの計算シミュレーションとして記載されてよい。さらに、ドッキングシミュレーションは、リガンドがタンパク質の結合部位と結合した後に結果として生じるリガンド−タンパク質複合体の構造を予測、再生、および／または合成するものとして記載されてよい。１つ以上の実施形態では、ドッキングスコアジェネレータ（１１３）は、各リガンドおよびタンパク質対についてのドッキングスコアを作成し、ドッキングスコアは、リガンドとタンパク質の１つ以上の結合部位との間の適合度、および／または得られたリガンド−タンパク質複合体の安定性の程度と直接相関する。さらに、ドッキングスコアは、水素結合、金属配位、疎水性力、ファンデルワールス力、π−π相互作用、ハロゲン結合、静電作用および電磁作用などのリガンド−タンパク質複合体の安定性を増加させる好ましい分子間相互作用の数と相関し得る。ドッキングスコアの信頼性は、予想されるタンパク質−リガンド複合体ドッキングスコアを、ランダムに選択されたタンパク質に同じリガンドをドッキングすることにより得られるスコアと比較することによって計算できる。１つ以上の実施形態では、リガンドとタンパク質の結合部位との間の相互作用を外挿し予測するために、ドッキングシミュレーションおよびドッキングスコアの作成を統計的解析と共に適用できる。ドッキングシミュレータ（１１１）は、例えばＧＯＬＤ、ＦｌｅｘＸ、ＴａｒＦｉｓＤｏｃｋ、ＴａｒＳｅａｒｃｈ−Ｘ、および／またはＴａｒＳｅａｒｃｈ−Ｍなどの１つ以上のドッキングシミュレーションアルゴリズムを実行できる。当業者であれば、他のドッキングシミュレーションアルゴリズムは、ドッキングシミュレータ（１１１）と互換性があり、これにより実行できることを理解するであろう。

１つ以上の実施形態では、プロファイルジェネレータ（１１５）は、プロテオーム結合プロファイルデータ（１２５）中に保存される１つ以上のプロテオーム結合プロファイルを生成する。例えば、プロファイルジェネレータ（１１５）は、試験リガンドと結合する１つ以上のタンパク質に関するタンパク質データ（１３０）を取得し抽出して、試験リガンドのプロテオーム結合プロファイルを生成できる。１つ以上の実施形態では、プロファイルジェネレータ（１１５）は、結合部位プロファイルデータ（１３４）中に保存される１つ以上の結合部位プロファイルを生成する。例えば、プロファイルジェネレータ（１１５）は、標的タンパク質の１つ以上の結合部位の分子特性を表し、かつ標的タンパク質の１つ以上の結合部位に首尾よく結合するリガンドの分子特性を表す結合部位プロファイルを生成するために、タンパク質データ（１３０）および／または分子データ（１２１）を取得し抽出してもよい。

システム（１００）は、１つ以上のコンピューティングデバイスを備えてよい。コンピューティングデバイスは、専用のコンピュータシステムの形態をとってよい。コンピューティングデバイスは、図５に関連して見られ記載されるタイプの同じまたは異なる専用のコンピュータシステム上に実装されてよい。１つ以上の実施形態では、コンピューティングデバイスは、ディスプレイデバイスを使用してデータを表示するように構成されたハードウェアとソフトウェアの組み合わせであってよい。例えば、コンピューティングデバイスは、携帯電話、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、または本明細書に記載されるように動作するように構成された任意の他のデバイスであってよい。

図２、図３Ａおよび図３Ｂは、本発明の１つ以上の実施形態によるフローチャートを示す。これらのフローチャートで様々なステップが順番に提示され説明されるが、当業者であれば、ステップの一部または全部が異なる順序で実行されてよく、組み合わされまたは省略されてよく、およびステップの一部または全部が並行して実行されてよいことを認識するであろう。さらに、これらのステップは能動的または受動的に行われてよい。一例として、決定ステップは、本発明の１つ以上の実施形態に従って状態が存在することを示すために割込みが受信されない限り、コンピュータプロセッサに命令を処理することを要求しないことがある。

図２は、本発明の１つ以上の実施形態による標的タンパク質を同定するための方法を表すフローチャートを示す。ステップ２００において、１つ以上の実施形態は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信することに関する。１つ以上の実施形態では、ステップ２００で受信されるリガンドは、試験リガンドとも呼ばれる。１つ以上の実施形態では、ステップ２００で受信されたリクエストに応じて、第１のタンパク質がコンピューティングデバイスによってステップ２１０で同定され、試験リガンドは第１のタンパク質と結合してリガンド−タンパク質複合体を形成する。第１のタンパク質は、図３Ａのステップ３００〜ステップ３２２によって記載されるように同定され得る。

ステップ２２０において、コンピューティングデバイスは、１つ以上の実施形態に従って、第１のタンパク質について結合部位プロファイルを生成する。結合部位プロファイルは、第１のタンパク質の１つ以上の結合部位の分子特性および幾何学的特徴を表し得る。

ステップ２３０において、１つ以上の実施形態に従って、コンピューティングデバイスは、１つ以上のタンパク質の表面の分子特性を表すタンパク質構造データを抽出する。１つ以上の実施形態では、タンパク質構造データは、被制御サーバによってホストされる私的データベースから得られる。

ステップ２４０において、標的タンパク質は、１つ以上の実施形態による第１のタンパク質の結合部位プロファイルおよびタンパク質構造データを用いて同定される。第１のタンパク質の結合部位がタンパク質構造データ内の１つ以上のタンパク質の表面の分子特性を有する類似性の閾値を満たすかどうかを決定できる。さらに、あるタンパク質が第１のタンパク質の結合部位プロファイル内の分子特性に一致する分子特性を示すとタンパク質構造データから同定される場合、タンパク質構造データから同定されたその一致タンパク質を、標的タンパク質として標識できる。

ステップ２５０において、標的タンパク質は、１つ以上の実施形態に従ってユーザに提示するために１つ以上のコンピューティングデバイスに送信される。１つ以上の実施形態では、例えば、標的タンパク質および試験リガンドは、それぞれのコンピューティングデバイス上での表示のためにコンピューティングデバイスに送信される。標的タンパク質および／または試験リガンドに関連する様々な分子特性もまた、コンピューティングデバイス上での表示のために送信されてよい。

図３Ａおよび図３Ｂは、本発明の１つ以上の実施形態による標的タンパク質を同定するための方法を表すフローチャートを示す。ステップ３００において、１つ以上の実施形態は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信することに関する。さらに、このリクエストに応じて、コンピューティングデバイスは、リガンドの分子特性を同定できる。例えば、試験リガンドの化学的特性、物理的特性、構造的特性、薬理学的特性、および／または生物学的特性を同定できる。次に、試験リガンドの分子特性に基づいて、試験リガンドの分子指紋が生成され得る。例えば、試験リガンドの分子特性を２進数字のストリングに変換し、試験リガンドの分子指紋としてデータリポジトリ中に保存できる。

ステップ３０２では、１つ以上の実施形態に従いステップ３００で受信されたリクエストに応じて、コンピューティングデバイスは、１つ以上の分子の分子特性を含む分子データを取得し抽出する。１つ以上の実施形態では、分子データは、１つ以上の分子の化学的および構造的特性を提供する公的にアクセス可能な参照分子データベースから得られる。１つ以上の実施形態において、分子データは、被制御サーバによってホストされる私的データベースから得られる。

ステップ３０４では、１つ以上の実施形態に従いステップ３０２で抽出された分子データに応じて、分子データから１つ以上の分子の分子指紋が抽出される。１つ以上の実施形態では、ステップ３０２で抽出された分子データを使用して、１つ以上の分子の分子指紋が生成される。さらに、試験リガンドに構造的および／または分子的に類似している１つ以上の分子が、その分子指紋に基づいて同定される。例えば、コンピューティングデバイスのコンピュータプロセッサは、ステップ３００で生成された試験リガンドの分子指紋と類似している分子指紋を有する１つ以上の分子を同定できる。言い換えれば、コンピュータプロセッサは、試験リガンドの分子指紋と重複する分子指紋を有する１つ以上の分子を同定できる。さらに、試験リガンドの分子指紋と同様の分子指紋を有する１つ以上の分子を、コンピュータプロセッサによって類似のリガンドとして標識できる。例えば、試験リガンドの分子指紋と比較した場合に類似性の閾値を満たす分子指紋を有する分子を、コンピュータプロセッサにより類似リガンドとして標識してもよい。

ステップ３０６では、１つ以上の実施形態に従いステップ３０４で類似リガンドを同定することに応じて、コンピューティングデバイスは、１つ以上のタンパク質の分子特性を含むタンパク質データを取得し抽出する。１つ以上の実施形態では、タンパク質データは、１つ以上のタンパク質の化学的および構造的特性を提供する公的にアクセス可能な参照タンパク質データベースから得られる。１つ以上の実施形態では、タンパク質データは、被制御サーバによってホストされる私的データベースから得られる。

ステップ３０８では、１つ以上の実施形態に従いステップ３０６でタンパク質データを抽出することに応じて、タンパク質データおよび分子データを使用して、類似リガンドと結合する第１の複数のタンパク質を同定する。例えば、コンピュータプロセッサは、特定の類似リガンドの分子特性を用いて、その特定の類似リガンドと相互作用してリガンド−タンパク質複合体を形成する１つ以上のタンパク質を同定できる。

ステップ３１０において、１つ以上の実施形態に従いステップ３０６において類似リガンドと結合する第１の複数のタンパク質を同定することに応じて、特異的タンパク質が第１の複数のタンパク質から選択される。例えば、コンピューティングデバイスによって第１の複数のタンパク質からタンパク質を反復して選択し、続いて、その後のステップにおいて試験リガンドを選択されたタンパク質にドッキングする。

ステップ３１２では、１つ以上の実施形態に従い第１の複数のタンパク質からタンパク質を選択することに応じて、選択されたタンパク質および試験リガンドを用いてドッキングシミュレーションを実施する。ここで、選択されたタンパク質の分子特性および試験リガンドの分子特性を抽出して、選択されたタンパク質と試験リガンドとの間の相互作用をシミュレートできる。例えば、コンピュータプロセッサは、試験リガンドと選択されたタンパク質の結合部位との間の結合をシミュレートするために、試験リガンドの分子指紋および選択されたタンパク質の分子特性を用いて計算を実施できる。１つ以上の実施形態では、コンピュータプロセッサは、試験リガンドを、選択されたタンパク質の１つ以上の結合部位にドッキングする。

ステップ３１４では、１つ以上の実施形態に従いドッキングシミュレーションを実施することに応じて、選択されたタンパク質についてドッキングスコアが生成される。ドッキングスコアは、試験リガンドと選択されたタンパク質の１つ以上の結合部位との間の適合度と相関し得る。例えば、高いドッキングスコアは、選択されたタンパク質の結合部位に対する試験リガンドの高い親和性を示し得る。

ステップ３１６では、選択されたタンパク質についてドッキングスコアを生成することに応じて、選択されたタンパク質のドッキングスコアがドッキングスコア閾値を満たすかどうか、および／またはドッキングスコア閾値を超えるかどうかの決定が、１つ以上の実施形態によるコンピューティングデバイスを使用して行われる。ドッキングスコア閾値は、ユーザによって手動で設定されてよく、コンピュータプロセッサによって計算され設定されてもよい。ドッキングスコアがドッキングスコア閾値を満たす場合、プロセスはステップ３１８に進む。ドッキングスコアがドッキングスコア閾値を満たさない場合、プロセスはステップ３１０に進んで、第１の複数のタンパク質中の次のタンパク質を反復して選択する。

ステップ３１８では、選択されたタンパク質のドッキングスコアがドッキングスコア閾値を満たすと決定することに応じて、選択されたタンパク質が、１つ以上の実施形態に従って第１の複数のタンパク質のサブセットに挿入される。例えば、選択されたタンパク質がドッキングスコア閾値を満たす場合、選択されたタンパク質は、その後のステップにおけるさらなる処理のためにサブグループに挿入され得る。選択されたタンパク質がドッキングスコア閾値を満たさない場合、選択されたタンパク質は試験リガンドと不適合であるとみなされ、プロセスはステップ３１０に戻って異なるタンパク質を反復して選択できる。

ステップ３２０では、選択されたタンパク質を第１の複数のタンパク質のサブセットに挿入することに応じて、選択されたタンパク質について結合部位プロファイルが、１つ以上の実施形態に従って生成される。結合部位プロファイルは、選択されたタンパク質の１つ以上の結合部位の分子特性および幾何学的特徴を表すことができる。１つ以上の実施形態では、選択されたタンパク質の結合部位プロファイルは、選択されたタンパク質の１つ以上の結合部位に対する１つ以上のリガンドの結合親和性を含む。さらに、選択されたタンパク質の結合部位プロファイルは、選択されたタンパク質の１つ以上の結合部位に対して高い親和性を有する可能性のあるリガンドをもたらし得る特定の分子特性および／または分子指紋を記載してもよい。

ステップ３２２において、コンピューティングデバイスを使用して、１つ以上の実施形態に従って第１の複数のタンパク質中にさらなるタンパク質が残っているかどうかを決定する。例えば、コンピュータプロセッサは、ドッキングシミュレーションのために、第１の複数のタンパク質中で追加のタンパク質がまだ選択されていないかを決定できる。追加のタンパク質が検出されない場合、プロセスはステップ３２４に進む。追加のタンパク質が検出された場合、プロセスはステップ３１０に進んで第１の複数のタンパク質中で次のタンパク質を反復して選択する。

ステップ３２４では、１つ以上の実施形態に従って、コンピューティングデバイスは、１つ以上のタンパク質の表面の分子特性を表すタンパク質構造データを抽出する。ステップ３２６では、特定のタンパク質が、１つ以上の実施形態に従って第１の複数のタンパク質のサブセットから選択される。例えば、タンパク質は、コンピューティングデバイスを使用して第１の複数のタンパク質のサブセットから反復して選択される。さらに、選択されたタンパク質の結合部位プロファイルが、コンピューティングデバイスを使用して抽出されてもよい。

ステップ３２８では、１つ以上の実施形態による選択されたタンパク質の結合部位プロファイルおよびタンパク質構造データを使用して、標的タンパク質が同定される。次いで、選択されたタンパク質の結合部位がタンパク質構造データ内の１つ以上のタンパク質の分子特性との類似性の閾値を満たしているかが決定される。あるタンパク質が、選択されたタンパク質の結合部位プロファイルと一致する分子特性を示すとタンパク質構造データ内から同定される場合、タンパク質構造データから同定されたこのタンパク質は、標的タンパク質として同定され得る。アミノ酸配列ごとの１つ以上のタンパク質の一致する表面をクラスタ化し、一致する表面を分子特性の類似性に従ってランク付けできる。

１つ以上の実施形態では、マッチングは、リガンドおよび／または結合部位の柔軟性を考慮しながら、タンパク質表面の幾何学的および静電的特徴などの１つ以上のタンパク質の表面の分子特性に基づいて行われる。柔軟性は、リガンドおよび／またはタンパク質の結合部位の１つ以上の位置および／またはコンフォメーションをシミュレートするアルゴリズムに参照してもよい。例えば、ドッキングシミュレーションは、リガンドの並進、回転、および／または捻れの面に沿った操作で実施され得る。さらに、ドッキングシミュレーションは、タンパク質の１つ以上の結合部位に結合するためのリガンドの最適な配向を決定するために、リガンドの様々なコンフォメーション（単結合に沿った回転など）を用いて実施され得る。同様に、ドッキングシミュレーションは、リガンド−タンパク質相互作用のギブス自由エネルギーが最小化されるようタンパク質とリガンドとの間のコンフォメーションおよび／または配向を達成するために、タンパク質の結合部位の構造の種々の調節を用いて実施され得る。さらに、リガンドとタンパク質の結合部位の相対的配向は生成されるシグナルのタイプに影響し得るので、ドッキングシミュレーションは、タンパク質の結合部位に対するリガンドの結合親和性、ならびにリガンド−タンパク質複合体の形成時に生成されるシグナルのタイプを予測し得る。

ステップ３３０では、１つ以上の実施形態に従い、かつタンパク質構造データから標的タンパク質を同定することに応じて、標的タンパク質および試験リガンドとのドッキングシミュレーションが実施される。ここで、標的タンパク質の分子特性および試験リガンドの分子特性を抽出して、標的タンパク質と試験リガンドとの間の相互作用をシミュレートできる。例えば、コンピュータプロセッサは、試験リガンドと標的タンパク質の結合部位との間の結合をシミュレートするために、試験リガンドの分子指紋、並びに標的タンパク質の分子特性および／またはタンパク質構造データを使用して計算を実施できる。１つ以上の実施形態では、コンピュータプロセッサは、試験リガンドを標的タンパク質の１つ以上の結合部位にドッキングする。試験リガンドは、ドッキングスコアに基づいて最も高い一致表面に直接的にドッキングされてよく、それは標的タンパク質の一致する表面を取り囲む局所領域に限定され得る。

ステップ３３２では、１つ以上の実施形態に従い、かつドッキングシミュレーションを実施することに応じて、標的タンパク質についてのドッキングスコアが生成される。ドッキングスコアは、試験リガンドと標的タンパク質の１つ以上の結合部位との間の適合度と相関し得る。例えば、高いドッキングスコアは、標的タンパク質の結合部位に対する試験リガンドの高い親和性を示し得る。

ステップ３３４では、標的タンパク質についてのドッキングスコアを生成することに応じて、標的タンパク質のドッキングスコアが、１つ以上の実施形態に従ってドッキングスコア閾値を満たしているか、および／またはドッキングスコア閾値を超えているかの決定が行われる。ドッキングスコアがドッキングスコア閾値を満たしている場合、プロセスはステップ３３６に進む。ドッキングスコアがドッキングスコア閾値を満たしていない場合、プロセスはステップ３４０に進む。

ステップ３３６では、標的タンパク質のドッキングスコアがドッキングスコア閾値を満たしていると決定することに応じて、標的タンパク質は、１つ以上の実施形態に従って試験リガンドのプロテオーム結合プロファイルに挿入される。試験リガンドのプロテオーム結合プロファイルは、試験リガンドと結合すると予測されるおよび／または実験的に決定された１つ以上のタンパク質を含み得る。例えば、標的タンパク質がドッキングスコア閾値を満たしている場合、標的タンパク質は、試験リガンドのプロテオーム結合プロファイルに挿入され得る。標的タンパク質がドッキングスコア閾値を満たしていない場合、選択されたタンパク質の構造は試験リガンドと適合していないとみなされ、プロセスはステップ３４０に進み得る。試験リガンドと同様の追加の分子をドッキングシミュレーションステップに含めて、分子的に関連する化合物のプロテオーム結合プロファイルを直接比較してもよい。プロテオーム結合プロファイルを使用して、異なる分子およびそれらのそれぞれの予測されるタンパク質結合部位をクラスタ化してもよい。予測されるタンパク質相互作用のリストを生成することにより、本明細書に記載の方法は、一次タンパク質相互作用を共有する分子を橋渡しできる。

ステップ３３８では、標的タンパク質は、１つ以上の実施形態に従ってユーザに提示するために、１つ以上のコンピューティングデバイスに送信される。１つ以上の実施形態では、例えば、標的タンパク質および試験リガンドは、それぞれのコンピューティングデバイス上での表示のためにコンピューティングデバイスに送信される。標的タンパク質および／または試験リガンドに関連する様々な分子特性もまた、コンピューティングデバイス上での表示のために送信されてもよい。

ステップ３４０では、１つ以上の実施形態に従って、選択されたタンパク質に基づいて追加の標的タンパク質が残っているかどうかの決定が行われる。例えば、コンピューティングデバイスのコンピュータプロセッサは、ステップ３２６で選択されたタンパク質の分子特性に基づいて、ステップ３２８で追加の標的タンパク質が同定されるかどうかを決定できる。追加の標的タンパク質が検出されない場合、プロセスはステップ３４２に進む。さらなる標的タンパク質が検出された場合、プロセスは、コンピュータプロセッサが次の標的タンパク質を反復して選択し、かつ試験リガンドを用いて次の標的タンパク質とのドッキングシミュレーションを実施するためにステップ３３０に進む。

ステップ３４２では、１つ以上の実施形態に従って第１の複数のタンパク質のサブセット中に追加のタンパク質が残っているかどうかの決定がコンピューティングデバイスによって行われる。例えば、コンピューティングデバイスのコンピュータプロセッサは、ドッキングシミュレーションのための標的タンパク質を同定するために、第１の複数のタンパク質のサブセット中で追加のタンパク質がまだ選択されていないかどうかを決定し得る。追加のタンパク質が検出されない場合、プロセスは終了する。追加のタンパク質が検出された場合、プロセスはステップ３２６に進んで、第１の複数のタンパク質のサブセット中で次のタンパク質を反復して選択する。

１つ以上の実施形態では、被制御サーバは、１つ以上のタンパク質の機能を表すタンパク質データを含む。例えば、被制御サーバによってホストされるタンパク質データは、１つ以上のタンパク質に関連する生物学的役割および／または生物学的経路を表し得る。別の例では、タンパク質データは、１つ以上のタンパク質の活性と相関する１つ以上の疾患および／または治療を表すことができる。したがって、試験リガンドは、ステップ３３６で同定された標的タンパク質に関連する生物学的役割を促進および／または阻害すると予測され得る。さらに、試験リガンドの作用機序は、試験リガンドによって標的化されると予測される特定のタンパク質の同定に基づいて決定されてもよい。例えば、第１の疾患の治療に使用される薬物が、第２の疾患に関与する特定のタンパク質と相互作用すると予測される場合、その薬物は、第２の疾患の治療のために再使用され得る。すなわち、本明細書に記載の方法は、既存の化合物について新しい用途の特定を可能にし得る。さらに、本明細書に記載の方法は、薬物の追加の標的タンパク質の同定を可能にし得る。例えば、薬物のための単一の標的タンパク質が同定され得るが、その薬物は追加のタンパク質と相互作用する可能性を有し得る。したがって、本明細書に記載の方法は、薬物と追加のタンパク質との間の潜在的な相互作用を予測し得る。さらに、追加のタンパク質の生物学的役割に基づいて、薬物の潜在的な有益な効果、有害作用、および／または毒性が予測され得る。

タンパク質結合相互作用の予測は、薬物−標的会合、遺伝子疾患関連、タンパク質−タンパク質相互作用、および経路分析を含む、公的に利用可能な参照データベースの組み込みを可能にし得る。２つ以上のタンパク質が物理的に会合して細胞機能を果たす場合、タンパク質−タンパク質相互作用（ＰＰＩ）が起こり得る。所与のタンパク質に結合するリガンドはまた、周囲のタンパク質の活性に影響し得る。本明細書に記載の方法をＰＰＩ相互作用のデータベースと組み合わせることにより、二次タンパク質相互作用の同定が可能になり得る。さらに、経路分析は、様々なタンパク質の生物学的プロセスの同定を可能にし得る。さらに、標的タンパク質は、薬物−標的関連のデータベースと相互参照されて、潜在的な相乗的または拮抗的な薬物−薬物相互作用を同定し得る。さらに、標的タンパク質は、遺伝子−疾患関連のデータベースと相互参照されて、治療的適用または試験リガンドとの併用薬物療法のための新しい可能性を明らかにし得る。

図４Ａ、図４Ｂ、図４Ｃ、図４Ｄ、および図４Ｅは、本発明の１つ以上の実施形態による標的タンパク質を同定するための例を示す。以下の実施例は説明の目的のみのためのものであり、本発明の範囲を限定するものではない。例示のみの目的のために、薬物候補（４０１）が被制御サーバまたは他のコンピューティングデバイス（図示せず）によって試験リガンドとして受信されるシナリオを検討する。この例では、被制御サーバまたは他のコンピューティングデバイスは、薬物候補（４０１）、薬物候補（４０１）に分子的に類似している１つ以上のリガンド（例えば、類似分子Ａ（４０３Ａ）、類似分子Ｂ（４０３Ｂ））、薬物候補および／または１つ以上の類似分子と結合できる１つ以上のタンパク質（例えば、適合タンパク質Ａ（４０５Ａ）、適合タンパク質Ｂ（４０５Ｂ）、適合タンパク質Ｃ（４０５Ｃ）、適合タンパク質Ｄ（４０５Ｄ））の分子特性に関するデータを保存するデータリポジトリ（４１０）を含む（またはそれへのアクセスを有する）。さらに、データリポジトリ４１０は、１つ以上のタンパク質（例えば、タンパク質α（４１２Ａ）、タンパク質β（４１２Ｂ）、タンパク質Ｎ（４１２Ｎ））の表面の分子特性、例えば幾何学的および／または生物物理的特性、を表すタンパク質構造データ（４１１）を含む。この例では、被制御サーバは、１つ以上の分子および／またはタンパク質の参照分子データを保存する１つ以上の遠隔サーバ（図示せず）に動作可能に接続される。

図４Ａに戻って、被制御サーバ（またはある種のプロセッサを使用する任意のコンピューティングデバイス）は、薬物候補（４０１）の分子特性に基づいて分子指紋を生成し、その分子指紋を分子リポジトリ（４１０）中に保存する。分子指紋を生成するために使用される分子特性は、薬物候補（４０１）の直接実験室試験によって決定され得る。さらに、分子特性は、参照分子データベースから得ることができる。

次に、１つ以上の分子に関する参照分子データを得るために、参照分子データベースがアクセスされる。１つ以上の分子指紋は、データリポジトリ（４１０）中に保存するための参照分子データを使用して、様々な分子について生成されてよい。本明細書では、薬物候補（４０１）の分子指紋および参照分子データは、１つ以上の類似分子（例えば、類似分子Ａ（４０３Ａ）、類似分子Ｂ（４０３Ｂ））を同定するために使用され、薬物候補の分子指紋および類似分子の分子指紋は類似性の閾値を満たす。

類似分子が同定されると、参照タンパク質データベースにアクセスして、１つ以上のタンパク質に関する参照タンパク質データを得る。参照タンパク質データおよび参照分子データを次いで使用して、類似の分子と結合する１つ以上のタンパク質（例えば、適合タンパク質Ａ（４０５Ａ）、適合タンパク質Ｂ（４０５Ｂ）、適合タンパク質Ｃ（４０５Ｃ）、適合タンパク質Ｄ）を同定する。

次に、特定のタンパク質が、ドッキングシミュレーションのために適合タンパク質から選択される。例えば、タンパク質はコンピューティングデバイスによって適合タンパク質のリストから反復して選択され、続いて、薬物候補が選択されたタンパク質にドッキングされる。ここでは、選択されたタンパク質の分子特性および薬物候補の分子特性が抽出されて、選択されたタンパク質と薬物候補との間の相互作用をシミュレートする。ドッキングシミュレーションを実施することに応じて、選択されたタンパク質についてドッキングスコアが生成される。図４Ｂに示すように、薬物候補（４０１）と適合タンパク質Ａ（４０５Ａ）との間のドッキングシミュレーションは、ドッキングスコア閾値を超えるドッキングスコアをもたらす。さらに、薬物候補（４０１）と適合タンパク質Ｂ（４０５Ｂ）との間のドッキングシミュレーションは、ドッキングスコア閾値を超えるドッキングスコアをもたらす。しかし、この例では、薬物候補（４０１）と適合タンパク質Ｃ（４０５Ｃ）との間の、および薬物候補と適合タンパク質Ｄ（４０５Ｄ）との間のドッキングシミュレーションは、ドッキングスコア閾値を満たしていない。したがって、適合タンパク質Ａについての結合部位プロファイル（例えば、結合部位プロファイルＡ（４０７Ａ））および適合タンパク質Ｂについての結合部位プロファイル（例えば、結合部位プロファイルＢ（４０７Ｂ））が生成される。

さらに、コンピューティングデバイスは、１つ以上のタンパク質の表面の分子特性を表すタンパク質構造データを抽出する。次いで、適合タンパク質の結合部位プロファイル（例えば、結合部位プロファイルＡ（４０７Ａ）、結合部位プロファイルＢ（４０７Ｂ））およびタンパク質構造データ（例えば、結合部位プロファイルα（４１３Ａ）、結合部位プロファイルβ（４１３Ｂ））を使用して、１つ以上のタンパク質（例えば、タンパク質α（４１２Ａ）、タンパク質β（４１２Ｂ））が同定される。この実施例では、適合タンパク質の結合部位プロファイル（例えば、結合部位プロファイルＡ（４０７Ａ）、結合部位プロファイルＢ（４０７Ｂ））が、タンパク質構造データ内の１つ以上のタンパク質の分子特性（例えば、結合部位プロファイルα（４１３Ａ）、結合部位プロファイルβ（４１３Ｂ）、結合部位プロファイルＮ（４１３Ｎ））との類似性の閾値を満たしているか決定を行う。得られたタンパク質は同定され、相互作用候補タンパク質（例えば、タンパク質α（４１２Ａ）、タンパク質β（４１２Ｂ））として標識される。

さらに、相互作用候補および薬物候補を用いてドッキングシミュレーションが実施される。ここで、薬物候補の分子特性および相互作用候補の分子特性が抽出されて、相互作用候補と薬物候補との間の相互作用をシミュレートする。図４Ｄに示すように、薬物候補（４０１）と相互作用候補タンパク質β（４１２Ｂ）との間のドッキングシミュレーションは、ドッキングスコア閾値を超えるドッキングスコアをもたらす。しかし、この例では、薬物候補（４０１）と相互作用候補タンパク質α（４１２Ａ）との間のドッキングシミュレーションは、ドッキングスコア閾値を満たしていない。このため、図４Ｅに示すとおり、プロテオーム結合プロファイル（４１５）が薬物候補（４０１）について生成され、それはタンパク質β（４１２Ｂ）を含む。

本発明の実施形態は、コンピューティングシステム上に実装できる。モバイル、デスクトップ、サーバ、埋め込み型、または他の型のハードウェアの任意の組み合わせを使用できる。例えば、図５に示すように、コンピューティングシステム（５００）は、１つ以上のコンピュータプロセッサ（５０２）、関連メモリ（５０４）（例えば、ランダムアクセスメモリ（ＲＡＭ）、キャッシュメモリ、フラッシュメモリなど）、１つ以上のストレージデバイス（例えば、ハードディスク、コンパクトディスク（ＣＤ）ドライブまたはデジタル多用途ディスク（ＤＶＤ）ドライブなどの光学ドライブ、フラッシュメモリスティック）、ならびに他の多数の要素および機能を備えてよい。コンピュータプロセッサ（複数可）（５０２）は、命令を処理するための集積回路であってよい。例えば、コンピュータプロセッサ（複数可）は、１つ以上のコア、またはプロセッサのマイクロコアであってよい。コンピューティングシステム（５００）はまた、タッチスクリーン、キーボード、マウス、マイクロフォン、タッチパッド、電子ペン、または任意の他のタイプの入力デバイスなどの１つ以上の入力デバイス（５１０）を備えてもよい。さらに、コンピューティングシステム（５００）は、スクリーン（例えば、液晶ディスプレイ（ＬＣＤ）、プラズマディスプレイ、タッチスクリーン、陰極線管（ＣＲＴ）モニタ、プロジェクタ、または他の表示装置）などの１つ以上の出力デバイス（５０８）、プリンタ、外部ストレージ、または任意の他の出力装置を備えてもよい。出力デバイスのうちの１つ以上は、入力デバイス（複数可）と同じであっても異なっていてもよい。コンピューティングシステム（５００）は、ネットワークインターフェイス接続（図示せず）を介して、ネットワーク（５１２）（例えば、ローカルエリアネットワーク（ＬＡＮ）、インターネットなどのワイドエリアネットワーク（ＷＡＮ）、モバイルネットワーク、または任意の他のタイプのネットワーク）に接続されてよい。入力および出力デバイス（複数可）は、コンピュータプロセッサ（複数可）（５０２）、メモリ（５０４）、およびストレージデバイス（複数可）（５０６）にローカルまたはリモート（例えば、ネットワーク５１２を介して）で接続されてよい。多くの異なるタイプのコンピューティングシステムが存在し、前述の入力デバイスおよび出力デバイス（複数可）は、他の形態をとってもよい。

本発明の実施形態を実施するためのコンピュータ可読プログラムコードの形態のソフトウェア命令は、ＣＤ、ＤＶＤ、ストレージデバイス、フロッピーディスク、テープ、フラッシュメモリ、物理メモリ、または任意の他のコンピュータ可読ストレージ媒体などの非一時的コンピュータ可読媒体に全体的または部分的に、一時的または永続的に、保存されてよい。具体的には、ソフトウェア命令は、コンピュータプロセッサ（複数可）によって実行される際に、本発明の実施形態を実施するように構成されたコンピュータ可読プログラムコードに対応してよい。

さらに、前述のコンピューティングシステム（５００）の１つ以上の要素は、遠隔地に配置され、ネットワーク（５１２）を介して他の要素に接続されてもよい。さらに、本発明の実施形態は、複数のノードを有する分散システム上で実施でき、本発明の各部分は、分散システム内の異なるノード上に配置されてよい。本発明の一実施形態では、ノードは、別個のコンピューティングデバイスに対応する。あるいは、ノードは、関連する物理メモリを有するコンピュータプロセッサに対応してもよい。あるいは、ノードは、共有メモリおよび／またはリソースを有するコンピュータプロセッサまたはコンピュータプロセッサのマイクロコアに対応してよい。

本発明は、限られた数の実施形態に関して記載されているが、本開示の恩恵を受ける当業者は、本明細書中に開示される本発明の範囲から逸脱しない他の実施形態が考案され得ることを理解するであろう。したがって、本発明の範囲は、添付の特許請求の範囲によってのみ限定されるべきである。

Claims

標的タンパク質を同定するための方法であって、
リガンドに基づいて標的タンパク質を同定するためのリクエストを受信すること、
前記リガンドを使用して、第１のタンパク質を同定することであって、前記リガンドは、前記第１のタンパク質と結合してリガンド−タンパク質複合体を形成するものであり、
前記第１のタンパク質について第１の結合部位プロファイルを生成することであって、前記第１の結合部位プロファイルは、前記第１のタンパク質の分子特性を表すものであり、
被制御サーバから、複数のタンパク質の表面の分子特性を表す構造データを得ることであって、前記複数のタンパク質は、前記標的タンパク質を含むものであり、
前記第１の結合部位プロファイルおよび前記構造データを用いて、前記標的タンパク質を同定すること、および
前記標的タンパク質をユーザに提示すること、
を含む、方法。
前記標的タンパク質は、複数の標的結合部位を含み、かつ
前記構造データは、前記複数の標的結合部位の分子特性をさらに表す、請求項１に記載の方法。
前記標的タンパク質を同定することは、
前記第１の結合部位プロファイルおよび前記構造データを使用して、前記複数の標的結合部位の標的結合部位を同定すること、および
前記標的結合部位を前記ユーザに提示すること、
をさらに含む、請求項２に記載の方法。
前記標的タンパク質を同定することは、
前記第１の結合部位プロファイルを前記標的タンパク質の前記構造データと比較することによって、類似性尺度を生成すること、および
前記類似性尺度が、所定の閾値を超えると決定すること、
をさらに含む、請求項１に記載の方法。
前記第１のタンパク質を同定することは、
参照分子データベースから、複数の分子の分子特性を含む分子データを抽出すること、
前記リガンドおよび前記分子データを使用して類似リガンドを同定することであって、前記類似リガンドは、前記リガンドと分子的に関連するものであり、
参照タンパク質データベースからタンパク質データを抽出することであって、前記タンパク質データは、前記類似リガンドと結合してリガンド−タンパク質複合体を形成する第１の複数のタンパク質を同定するものであり、および
前記第１の複数のタンパク質のサブセットを同定するために前記リガンドおよび前記第１の複数のタンパク質を用いて複数のドッキングシミュレーションを実施することであって、前記第１の複数のタンパク質の前記サブセットは、前記第１のタンパク質を含むものである、
を含む、請求項１に記載の方法。
前記複数のドッキングシミュレーションを実施することは、
前記リガンドを前記第１の複数のタンパク質の各タンパク質にドッキングすること、
前記リガンドを前記第１の複数のタンパク質にドッキングすることに応じて、前記第１の複数のタンパク質の各タンパク質についてドッキングスコアを生成すること、
前記第１の複数のタンパク質の前記サブセットの各タンパク質についてのドッキングスコアが所定の閾値を超えるという決定を実行すること、および
前記決定に応じて、前記第１の複数のタンパク質の前記サブセットの各タンパク質について結合部位プロファイルを生成すること、
をさらに含む、請求項５に記載の方法。
前記第１の複数のタンパク質の各タンパク質は、複数の結合部位を含む、請求項６に記載の方法。
前記複数のドッキングシミュレーションを実施することは、前記リガンドを前記複数の結合部位の各結合部位にドッキングすることをさらに含む、請求項７に記載の方法。
前記決定に応じて、前記リガンドについてプロテオーム結合プロファイルを生成することであって、前記プロテオーム結合プロファイルが、前記リガンドと結合してリガンド−タンパク質複合体を形成する前記第１の複数のタンパク質の前記サブセットを含む、請求項６に記載の方法。
標的タンパク質を同定するためのシステムであって、
複数のタンパク質についての表面の分子特性を表す構造データを保存するデータリポジトリと、
命令を有するコンピュータプロセッサを含む被制御サーバとを備え、
前記命令は、
リガンドに基づいて標的タンパク質を同定するためのリクエストを受信すること、
前記リガンドを使用して第１のタンパク質を同定することであって、前記リガンドは、前記第１のタンパク質と結合してリガンド−タンパク質複合体を形成するものであり、
前記第１のタンパク質について第１の結合部位プロファイルを生成することであって、前記第１の結合部位プロファイルは、前記第１のタンパク質の分子特性を表すものであり、
前記複数のタンパク質についての表面の分子特性を表す前記構造データを得ることであって、前記複数のタンパク質は、前記標的タンパク質を含むものであり、
前記第１の結合部位プロファイルおよび前記構造データを用いて、前記標的タンパク質を同定すること、および
前記標的タンパク質をユーザに提示すること、
を実行できる命令である、システム。
前記標的タンパク質は、複数の標的結合部位を含み、かつ
前記構造データは、前記複数の標的結合部位の分子特性をさらに表す、請求項１０に記載のシステム。
前記標的タンパク質を同定することができる命令は、
前記第１の結合部位プロファイルおよび前記構造データを使用して、前記複数の標的結合部位の標的結合部位を同定すること、および
前記標的結合部位を前記ユーザに提示すること、
をさらに含む、請求項１１に記載のシステム。
前記標的タンパク質を同定することができる命令は、
前記第１の結合部位プロファイルを前記標的タンパク質の前記構造データと比較することによって、類似性尺度を生成すること、および
前記類似性尺度が所定の閾値を超えると決定すること、
をさらに含む、請求項１０に記載のシステム。
前記第１のタンパク質を同定することができる命令は、
参照分子データベースから、複数の分子の分子特性を含む分子データを抽出すること、
前記リガンドおよび前記分子データを使用して、類似リガンドを同定することであって、前記類似リガンドは、前記リガンドと分子的に関連するものであり、
参照タンパク質データベースから、タンパク質データを抽出することであって、前記タンパク質データは、前記類似リガンドと結合してリガンド−タンパク質複合体を形成する第１の複数のタンパク質を同定するものであり、および
前記第１の複数のタンパク質のサブセットを同定するために前記リガンドおよび前記第１の複数のタンパク質を用いて複数のドッキングシミュレーションを実施することであって、前記第１の複数のタンパク質の前記サブセットは、前記第１のタンパク質を含むものである、
を含む、請求項１０に記載のシステム。
前記複数のドッキングシミュレーションを実施することができる命令は、
前記リガンドを前記第１の複数のタンパク質の各タンパク質にドッキングすること、
前記リガンドを前記第１の複数のタンパク質にドッキングすることに応じて、前記第１の複数のタンパク質の各タンパク質についてドッキングスコアを生成すること、
前記第１の複数のタンパク質の前記サブセットの各タンパク質についてのドッキングスコアが所定の閾値を超えるという決定を実行すること、および
前記判定に応じて、前記第１の複数のタンパク質の前記サブセットの各タンパク質について結合部位プロファイルを生成すること、
をさらに含む、請求項１４に記載のシステム。
前記第１の複数のタンパク質の各タンパク質は、複数の結合部位を含む、請求項１５に記載のシステム。
前記複数のドッキングシミュレーションを実施することができる命令は、前記リガンドを前記複数の結合部位の各結合部位にドッキングすることをさらに含む、請求項１６に記載のシステム。
前記複数のドッキングシミュレーションを実施することができる命令は、
前記決定に応じて、前記リガンドについてプロテオーム結合プロファイルを生成することであって、前記プロテオーム結合プロファイルは、前記リガンドと結合してリガンド−タンパク質複合体を形成する前記第１の複数のタンパク質の前記サブセットを含むものである、
をさらに含む、請求項１５に記載のシステム。
標的タンパク質を同定するための方法を実施するためにコンピュータプロセッサ上で実行できる命令を含む非一時的なコンピュータ可読媒体であって、
リガンドに基づいて標的タンパク質を同定するためのリクエストを受信すること、
前記リガンドを使用して、第１のタンパク質を同定することであって、前記リガンドは、前記第１のタンパク質と結合してリガンド−タンパク質複合体を形成するものであり、
前記第１のタンパク質について第１の結合部位プロファイルを生成することであって、前記第１の結合部位プロファイルは、前記第１のタンパク質の分子特性を表すものであり、
被制御サーバから、複数のタンパク質についての表面の分子特性を表す構造データを得ることであって、前記複数のタンパク質は前記標的タンパク質を含むものであり、
前記第１の結合部位プロファイルおよび前記構造データを用いて、前記標的タンパク質を同定すること、および
前記標的タンパク質をユーザに提示すること、
を含む、媒体。