JP2019508821A - タンパク質−リガンド相互作用を同定するためのプロテオームドッキング方法 - Google Patents
タンパク質−リガンド相互作用を同定するためのプロテオームドッキング方法 Download PDFInfo
- Publication number
- JP2019508821A JP2019508821A JP2018553273A JP2018553273A JP2019508821A JP 2019508821 A JP2019508821 A JP 2019508821A JP 2018553273 A JP2018553273 A JP 2018553273A JP 2018553273 A JP2018553273 A JP 2018553273A JP 2019508821 A JP2019508821 A JP 2019508821A
- Authority
- JP
- Japan
- Prior art keywords
- protein
- ligand
- proteins
- target
- binding site
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003446 ligand Substances 0.000 title claims abstract description 184
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000003032 molecular docking Methods 0.000 title claims description 101
- 230000003993 interaction Effects 0.000 title description 21
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 414
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 414
- 238000004088 simulation Methods 0.000 claims description 32
- 108010026552 Proteome Proteins 0.000 claims description 22
- 230000004044 response Effects 0.000 claims description 20
- 238000011524 similarity measure Methods 0.000 claims 4
- 238000012360 testing method Methods 0.000 description 64
- 229940000406 drug candidate Drugs 0.000 description 22
- 238000000547 structure data Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 13
- 229940079593 drug Drugs 0.000 description 10
- 239000003814 drug Substances 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 239000000284 extract Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 101710150593 Protein beta Proteins 0.000 description 5
- 125000004429 atom Chemical group 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 108010042653 IgA receptor Proteins 0.000 description 4
- 102100034014 Prolyl 3-hydroxylase 3 Human genes 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000001747 exhibiting effect Effects 0.000 description 4
- 230000004850 protein–protein interaction Effects 0.000 description 4
- 101800004937 Protein C Proteins 0.000 description 3
- 238000004617 QSAR study Methods 0.000 description 3
- 102100036546 Salivary acidic proline-rich phosphoprotein 1/2 Human genes 0.000 description 3
- 101800001700 Saposin-D Proteins 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 229960000856 protein c Drugs 0.000 description 3
- 230000006916 protein interaction Effects 0.000 description 3
- 102100037840 Dehydrogenase/reductase SDR family member 2, mitochondrial Human genes 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 101710188053 Protein D Proteins 0.000 description 2
- 101710132893 Resolvase Proteins 0.000 description 2
- 239000003596 drug target Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003068 pathway analysis Methods 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 238000011282 treatment Methods 0.000 description 2
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 238000004618 QSPR study Methods 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229940000425 combination drug Drugs 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 230000008406 drug-drug interaction Effects 0.000 description 1
- -1 fingerprint Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000000455 protein structure prediction Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/30—Detection of binding sites or motifs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/10—Ontologies; Annotations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
Landscapes
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Library & Information Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Physiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Computing Systems (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
本発明は、標的タンパク質を同定するための方法を含む。本発明は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信すること;リガンドを使用して、第1のタンパク質を同定することであって、リガンドが第1のタンパク質と結合してリガンド−タンパク質複合体を形成するものであり;第1のタンパク質について第1の結合部位プロファイルを生成することであって、第1の結合部位プロファイルは、第1のタンパク質の分子特性を表すものであり;被制御サーバから、多数のタンパク質についての表面の分子特性を表す構造データを得ることであって、多数のタンパク質は標的タンパク質を含むものであり;第1の結合部位プロファイルおよび構造データを用いて、標的タンパク質を同定すること;および標的タンパク質をユーザに提示することを含む。【選択図】なし
Description
タンパク質−リガンド相互作用を同定するためのトップケモゲノミクスマッピングおよびタンパク質標的同定方法は、定量的構造活性相関(QSAR)およびファーマコフォアモデリングを用いる。これらの方法は、薬物そのものの構造的類似性が生物学的活性(例えば、生物学的標的、毒性、有効性など)における類似性に対応すると仮定して、クエリリガンドを既知のリガンドのデータベースと比較する機械学習を用いる。構造的データに基づくタンパク質−リガンド相互作用マッピングは一般に、選択された受容体足場および/または薬物足場に限定される。
一般に、一態様において、実施形態は、標的タンパク質を同定するための方法に関する。この方法は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信することを含む。この方法は、リガンドを使用して、第1のタンパク質を同定することをさらに含み、リガンドは第1のタンパク質と結合してリガンド−タンパク質複合体を形成する。この方法は、第1のタンパク質の第1の結合部位プロファイルを生成することをさらに含み、第1の結合部位プロファイルは第1のタンパク質の分子特性を表す。この方法はさらに、被制御サーバから、多数のタンパク質の表面の分子特性を表す構造データを得ることを含み、多数のタンパク質は標的タンパク質を含む。この方法は、第1の結合部位プロファイルおよび構造データを用いて、標的タンパク質を同定することをさらに含む。本方法は、標的タンパク質をユーザに提示することをさらに含む。
一般に、一態様では、実施形態は、標的タンパク質を同定するためのシステムに関する。このシステムは、多数のタンパク質の表面の分子特性を表す構造データを保存するデータリポジトリを含む。システムは、コンピュータプロセッサと、プロセッサによって実行可能なメモリとを含む被制御サーバをさらに備える。メモリは、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信するための機能を備える。このメモリは、リガンドを使用して、第1のタンパク質を同定するための機能をさらに備え、リガンドは第1のタンパク質と結合してリガンド−タンパク質複合体を形成する。このメモリは、第1のタンパク質の第1の結合部位プロファイルを生成するための機能をさらに備え、第1の結合部位プロファイルは第1のタンパク質の分子特性を表す。このメモリは、被制御サーバから、多数のタンパク質の表面の分子特性を表す構造データを得るための機能をさらに備え、多数のタンパク質は標的タンパク質を含む。このメモリは、第1の結合部位プロファイルおよび構造データを用いて、標的タンパク質を同定するための機能をさらに備える。このメモリは、標的タンパク質をユーザに提示するための機能をさらに備える。
一般に、一態様では、実施形態は、標的タンパク質を同定するための様々な命令を保存する非一時的なコンピュータ可読媒体(CRM)に関する。この命令は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信するための機能を備える。この命令は、リガンドを使用して、第1のタンパク質を同定するための機能をさらに備え、リガンドは第1のタンパク質と結合してリガンド−タンパク質複合体を形成する。この命令は、第1のタンパク質の第1の結合部位プロファイルを生成するための機能をさらに備え、第1の結合部位プロファイルは第1のタンパク質の分子特性を表す。この命令は、被制御サーバから、多数のタンパク質の表面の分子特性を表す構造データを得るための機能をさらに備え、多数のタンパク質は標的タンパク質を含む。この命令は、第1の結合部位プロファイルおよび構造データを用いて、標的タンパク質を同定するための機能をさらに備える。この命令は、標的タンパク質をユーザに提示するための機能をさらに備える。
本発明の他の態様は、以下の説明および添付の特許請求の範囲から明らかになるであろう。
本発明の特定の実施形態を、添付の図面を参照してここで詳細に説明する。様々な図の同様の要素は、一貫性のために同様の参照番号で示される。
本発明の実施形態の以下の詳細な説明では、本発明のより完全な理解をもたらすために、多数の特定の詳細が記載される。しかし、当業者であれば、これらの特定の詳細がなく、本発明を実施できることは明らかであろう。他の例では、説明を不必要に複雑にすることを避けるために、周知の特徴は詳細には説明されていない。
本出願全体を通して、序数(例えば、第1、第2、第3など)は、要素(すなわち、本出願内の任意の名詞)の形容詞として使用されてよい。序数の使用は、要素の特定の順序付けを暗示または作成するものでなく、用語「前」「後」「単一」、および他のこのような語法の使用によってなど、明示的に開示されない限り、単一の要素のみである任意の要素に限定するものではない。むしろ、序数の使用は要素を区別することである。一例として、第1の要素は第2の要素と区別され、第1の要素は2つ以上の要素を包含してもよく、第2の要素を要素の順序で後にする(または先行する)ことができる。
本発明の1つ以上の実施形態は、タンパク質−リガンド相互作用を同定するためのプロテオームドッキングのための方法、システム、および非一時的コンピュータ可読媒体を含む。本発明は、分子と種々のタンパク質構造との間の相互作用を同定するための任意の分子を受け入れることができる。例えば、本発明の実施形態は、1000ダルトンまでのサイズを有する分子を受け入れることができる。当業者は、他のサイズの分子が許容され得ることを理解するであろう。特に、1つ以上の実施形態は、リガンドに基づいて標的タンパク質を同定するリクエストを受信することに関する。さらに、1つ以上の実施形態は、リガンドを用いて第1のタンパク質を同定することに関する。1つ以上の実施形態では、リガンドは第1のタンパク質と結合してリガンド−タンパク質複合体を形成する。さらに、1つ以上の実施形態は、第1のタンパク質の第1の結合部位プロファイルを生成することに関する。1つ以上の実施形態では、第1の結合部位プロファイルは、第1のタンパク質の分子特性を表す。さらに、1つ以上の実施形態は、被制御サーバから複数のタンパク質の表面の分子特性を表す構造データを得ることに関する。1つ以上の実施形態では、複数のタンパク質は、標的タンパク質を含む。さらに、1つ以上の実施形態は、第1の結合部位プロファイルおよび構造データを使用して標的タンパク質を同定することに関する。さらに、1つ以上の実施形態は、標的タンパク質をユーザに提示することに関する。
図1は、本発明の1つ以上の実施形態によるシステムの概略図を示す。図1は、構成要素の構成を示すが、他の構成も本発明の範囲から逸脱することなく使用できる。例えば、様々な構成要素を組み合わせて単一の構成要素を形成できる。別の例として、単一の部品によって実行される機能は、2つ以上の部品によって実施されてもよい。
ここで図1を参照すると、本発明の1つ以上の実施形態によれば、システム(100)は、1つ以上の被制御サーバ(110)を備えてよい。1つ以上の実施形態では、被制御サーバ(110)は、ドッキングシミュレータ(111)、ドッキングスコアジェネレータ(113)、およびプロファイルジェネレータ(115)などの様々なモジュールを備える。
被制御サーバ(110)は、データリポジトリ(例えば、データリポジトリ(120))内の様々なデータ構造中に様々なデータ(例えば、分子データ(121)、タンパク質データ(130))を保存できる。本発明の1つ以上の実施形態では、データリポジトリ(120)は、データを保存するための任意のタイプのストレージユニットおよび/またはデバイス(例えば、ファイルシステム、データベース、テーブルのコレクション、または任意の他のストレージメカニズム)である。さらに、データリポジトリ(120)は、複数の異なるストレージユニットおよび/またはデバイスを備えてもよい。複数の異なるストレージユニットおよび/またはデバイスは、同じタイプのものであってよく、または同じ物理的な場所に配置されてもよい。
1つ以上の実施形態では、被制御サーバ(110)は、ネットワーク(105)を介してリモートサーバ(160)に動作可能に接続される。リモートサーバ(160)は、データリポジトリ(図示せず)内の様々なデータ構造中に様々なデータ(例えば、参照分子データ(161)、参照タンパク質データ(162))を保存できる。
1つ以上の実施形態では、分子データ(121)は、リガンドデータ(122)を含む。一般に、リガンドは、タンパク質に結合し得る原子、分子、イオン、および/または化学化合物であり得る。1つ以上の実施形態では、リガンドは、薬物、薬物候補、栄養補助食品、ビタミン、補因子、および/または毒素として記載される。リガンドデータ(122)は、リガンドの分子構造および/または化学的官能性に基づいて、リガンドの分子特性を含み得る。さらに、リガンドデータ(122)は、リガンドの化学的特性、物理的特性、および/または構造的特性を含み得る。例えば、リガンドデータ(122)は、インビボおよび/またはインビトロでの試験リガンドの生物学的活性および/または薬理学的活性を表すことができる。別の例では、リガンドデータ(122)は、種々の無機および/または有機試薬と化学的に反応するときに試験リガンドが示す効果を表すことができる。さらに、リガンドデータ(122)は、リガンドがUV−VISおよびIR放射線と相互作用する様式について表すことができる。さらに、リガンドデータ(122)は、リガンドの核磁気共鳴(NMR)スペクトルを含んでよく、NMR分光法はリガンドの1つ以上の原子の物理的および化学的特性を決定する。
さらに、分子データ(121)は、1つ以上の実施形態に従って、被制御サーバ(110)によって生成される1つ以上の分子の分子指紋を含む。分子指紋は、リガンドの1つ以上の分子特性を表す定量値であってよい。例えば、試験リガンドの分子特性は、2進数字のストリングに変換され、分子指紋としてデータリポジトリ中に保存されてよく、各2進数字および/または2進数字セットは試験リガンドの特定の分子特性に対応する。さらに、分子指紋は、試験リガンド内の特定の分子サブ構造の存在の有無を表すことができる。1つ以上の実施形態では、分子指紋は、分子量、分子容、モル屈折率、分配係数、透過性、バイオアベイラビリティ、原子数、原子の種類、結合数、結合長、環数、接続指数、溶媒接触可能表面積、主要な慣性モーメント、部分電荷、極性指数、熱力学的特性、および/または静電表面記述子を表す。
1つ以上の分子の記述子は、分子データ中に保存されてよい(121)。記述子は、1つ以上の分子の分子特性を特徴付けることができる数値として定義され得る。1つ以上の実施形態では、1つ以上の分子に関する記述子が、1つ以上の分子の分子指紋を生成するために使用される。記述子は、分子特性の計算(QSPR−定量的構造特性関係)または化学的活性(QSAR−定量的構造活性関係)の計算に使用できる。1つ以上の実施形態では、分子記述子は、0D記述子(すなわち、構成記述子、カウント記述子、結合数、分子量、原子数)、1D記述子(すなわち、構造フラグメント、指紋、水素結合受容体および供与体のリスト)、2D記述子(すなわちグラフ不変体)、3D記述子(すなわち、幾何学的記述子、表面特性、3D−MoRSE記述子、WHIM記述子、GETAWAY記述子、量子化学的記述子、サイズ、立体構造、表面構造および/またはボリューム記述子)、および/または4D記述子(すなわち、GRIDおよび/またはCoMFA法、Volsurfから派生したもの)を含む。
1つ以上の実施形態では、分子データ(121)は、類似リガンドデータ(123)を含む。類似リガンドデータ(123)は、リガンドデータ(122)中に保存されたリガンドに対するそれらの類似性に基づいて同定され得る1つ以上の分子に関する分子特性を含み得る。例えば、1つ以上の類似リガンドは、被制御サーバ(110)に動作可能に接続されたコンピューティングデバイス(図示せず)のコンピュータプロセッサ(図示せず)によって同定されてよく、類似リガンドは、リガンドデータ(122)中に保存された試験リガンドの分子特性に類似している分子特性、生物学的特性、および/または化学的特性を基準として同定され得る。1つ以上の実施形態では、類似リガンドデータ(123)は、リガンドデータ(122)中に保存された試験リガンドの特性に関して上に開示した類似リガンドの同じタイプの分子特性を表す。
1つ以上の実施形態では、分子データ(121)は、1つ以上のプロテオーム結合プロファイルについてのプロテオーム結合プロファイルデータ(125)を含む。プロテオーム結合プロファイルデータ(125)は、1つ以上のリガンドについてのプロテオーム結合プロファイルを含み得る。さらに、プロテオーム結合プロファイルは、リガンドデータ(122)または類似リガンドデータ(123)中に保存された分子と相互作用する1つ以上のタンパク質を表すことができる。例えば、プロテオーム結合プロファイルデータ(125)は、リガンドデータ(122)中に保存された試験リガンドのプロテオーム結合プロファイルを含んでよく、プロテオーム結合プロファイルは、試験リガンドとうまく結合してリガンド−タンパク質複合体を形成するタンパク質を表す。1つ以上の実施形態では、リガンド−タンパク質複合体は、タンパク質の1つ以上の結合部位に対してリガンドが親和性を示す結果として、タンパク質にリガンドが首尾よく結合する場合に結果として生じる構造体である。別の例では、リガンドデータ(122)中に保存された試験リガンドは、1つ以上のタンパク質とのドッキングシミュレーションを受け、閾値を満たすドッキングスコアを有する得られたタンパク質を、試験リガンドのプロテオーム結合プロファイル中に挿入できる。さらに、プロテオーム結合プロファイルは、試験リガンドと相互作用する、および/または結合すると予測されるそれらの結合親和性と共にタンパク質の完全なセットを含んでよい。1つ以上の実施形態では、分子データ(121)は、分子の有形のおよび/または物理的実験室の試験中に実験的に決定される。1つ以上の実施形態では、分子データ(121)は、遠隔サーバ(160)に保存された参照分子データ(161)から得られる。1つ以上の実施形態では、分子データ(121)は、1つ以上のタンパク質と1つ以上のリガンドとのドッキングシミュレータ(111)によって実施される仮想ドッキングシミュレーションおよび/または計算的結合予測から得られたデータを含む。
1つ以上の実施形態では、タンパク質データ(130)は、タンパク質構造データ(131)を含む。タンパク質構造データ(131)は、1つ以上のタンパク質の分子特性(幾何学的および/または生物物理学的特性など)を含み得る。さらに、タンパク質構造データ(131)は、形状、平面性、幾可学的配置、静電特性、アミノ酸残基組成、原子組成、サイズ、疎水性、極性、および/または柔軟性などの1つ以上のタンパク質の分子特性を表すタンパク質表面記述子を含み得る。1つ以上の実施形態では、タンパク質構造データ(131)は、1つ以上のタンパク質の生物学的活性および/または生化学的活性を表す非分子的属性を含む。1つ以上の実施形態では、タンパク質構造データ(131)は、実験的に決定された構造、相同性モデリングによるタンパク質構造体、タンパク質構造予測、および/またはタンパク質コンフォメーションのアンサンブルから得られる。1つ以上の実施形態では、タンパク質構造データ(131)は、類似の分子特性を示す他のタンパク質の一致および同定を可能にするために2進数字および/または英数字フォーマットで保存されるタンパク質表面の分子特性を含む。
1つ以上の実施形態では、タンパク質データ(130)は、標的タンパク質データ(133)を含む。標的タンパク質データ(133)は、試験リガンドと結合してリガンド−タンパク質複合体を形成すると予測される1つ以上のタンパク質の分子特性を含み得る。1つ以上の実施形態では、標的リガンドに類似している分子と結合する他のタンパク質との分子類似性に基づいて、標的タンパク質が同定される。例えば、標的タンパク質は、標的タンパク質の表面の分子特性と、類似分子と結合するタンパク質の分子特性との間の類似性因子に基づいて同定され得る。類似因子は、ユーザによって手動で設定される閾値であってよく、またはコンピューティングデバイスによって計算され設定されてもよい。
1つ以上の実施形態では、タンパク質データ(130)は、1つ以上の結合部位プロファイルについての結合部位プロファイルデータ(134)を含む。結合部位プロファイルデータ(134)は、1つ以上のタンパク質の結合部位プロファイルを含み得る。1つ以上の実施形態では、結合部位プロファイルは、タンパク質の1つ以上の結合部位の化学的および幾何学的特徴を表す分子特性を含む。1つ以上の実施形態では、タンパク質の結合部位プロファイルは、タンパク質に対する1つ以上のリガンドの結合親和性を含む。1つ以上の実施形態では、タンパク質データ(130)は、タンパク質の有形の実験室試験中に採取される実験データを含む。1つ以上の実施形態では、タンパク質データ(130)は、1つ以上のタンパク質と1つ以上のリガンドとのドッキングシミュレータ(111)によって実施される仮想ドッキングシミュレーションから得られるデータを含む。1つ以上の実施形態では、タンパク質データ(130)は、遠隔サーバ(160)に保存された参照タンパク質データ(162)から得られる。1つ以上の実施形態では、結合部位プロファイルデータ(135)は、類似の分子特性を示す他のタンパク質との一致を可能にするために2進数字および/または英数字フォーマットで保存される分子特性を含む。
1つ以上の実施形態では、ドッキングシミュレータ(111)は、リガンドとタンパク質の1つ以上の結合部位との間の結合をシミュレートするために、分子データ(121)からのリガンドの分子特性、およびタンパク質データ(130)からのタンパク質の分子特性を取得し、抽出する。さらに、ドッキングは、タンパク質の1つ以上の結合部位に結合するリガンドの計算シミュレーションとして記載されてよい。さらに、ドッキングシミュレーションは、リガンドがタンパク質の結合部位と結合した後に結果として生じるリガンド−タンパク質複合体の構造を予測、再生、および/または合成するものとして記載されてよい。1つ以上の実施形態では、ドッキングスコアジェネレータ(113)は、各リガンドおよびタンパク質対についてのドッキングスコアを作成し、ドッキングスコアは、リガンドとタンパク質の1つ以上の結合部位との間の適合度、および/または得られたリガンド−タンパク質複合体の安定性の程度と直接相関する。さらに、ドッキングスコアは、水素結合、金属配位、疎水性力、ファンデルワールス力、π−π相互作用、ハロゲン結合、静電作用および電磁作用などのリガンド−タンパク質複合体の安定性を増加させる好ましい分子間相互作用の数と相関し得る。ドッキングスコアの信頼性は、予想されるタンパク質−リガンド複合体ドッキングスコアを、ランダムに選択されたタンパク質に同じリガンドをドッキングすることにより得られるスコアと比較することによって計算できる。1つ以上の実施形態では、リガンドとタンパク質の結合部位との間の相互作用を外挿し予測するために、ドッキングシミュレーションおよびドッキングスコアの作成を統計的解析と共に適用できる。ドッキングシミュレータ(111)は、例えばGOLD、FlexX、TarFisDock、TarSearch−X、および/またはTarSearch−Mなどの1つ以上のドッキングシミュレーションアルゴリズムを実行できる。当業者であれば、他のドッキングシミュレーションアルゴリズムは、ドッキングシミュレータ(111)と互換性があり、これにより実行できることを理解するであろう。
1つ以上の実施形態では、プロファイルジェネレータ(115)は、プロテオーム結合プロファイルデータ(125)中に保存される1つ以上のプロテオーム結合プロファイルを生成する。例えば、プロファイルジェネレータ(115)は、試験リガンドと結合する1つ以上のタンパク質に関するタンパク質データ(130)を取得し抽出して、試験リガンドのプロテオーム結合プロファイルを生成できる。1つ以上の実施形態では、プロファイルジェネレータ(115)は、結合部位プロファイルデータ(134)中に保存される1つ以上の結合部位プロファイルを生成する。例えば、プロファイルジェネレータ(115)は、標的タンパク質の1つ以上の結合部位の分子特性を表し、かつ標的タンパク質の1つ以上の結合部位に首尾よく結合するリガンドの分子特性を表す結合部位プロファイルを生成するために、タンパク質データ(130)および/または分子データ(121)を取得し抽出してもよい。
システム(100)は、1つ以上のコンピューティングデバイスを備えてよい。コンピューティングデバイスは、専用のコンピュータシステムの形態をとってよい。コンピューティングデバイスは、図5に関連して見られ記載されるタイプの同じまたは異なる専用のコンピュータシステム上に実装されてよい。1つ以上の実施形態では、コンピューティングデバイスは、ディスプレイデバイスを使用してデータを表示するように構成されたハードウェアとソフトウェアの組み合わせであってよい。例えば、コンピューティングデバイスは、携帯電話、デスクトップコンピュータ、ラップトップコンピュータ、タブレットコンピュータ、または本明細書に記載されるように動作するように構成された任意の他のデバイスであってよい。
図2、図3Aおよび図3Bは、本発明の1つ以上の実施形態によるフローチャートを示す。これらのフローチャートで様々なステップが順番に提示され説明されるが、当業者であれば、ステップの一部または全部が異なる順序で実行されてよく、組み合わされまたは省略されてよく、およびステップの一部または全部が並行して実行されてよいことを認識するであろう。さらに、これらのステップは能動的または受動的に行われてよい。一例として、決定ステップは、本発明の1つ以上の実施形態に従って状態が存在することを示すために割込みが受信されない限り、コンピュータプロセッサに命令を処理することを要求しないことがある。
図2は、本発明の1つ以上の実施形態による標的タンパク質を同定するための方法を表すフローチャートを示す。ステップ200において、1つ以上の実施形態は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信することに関する。1つ以上の実施形態では、ステップ200で受信されるリガンドは、試験リガンドとも呼ばれる。1つ以上の実施形態では、ステップ200で受信されたリクエストに応じて、第1のタンパク質がコンピューティングデバイスによってステップ210で同定され、試験リガンドは第1のタンパク質と結合してリガンド−タンパク質複合体を形成する。第1のタンパク質は、図3Aのステップ300〜ステップ322によって記載されるように同定され得る。
ステップ220において、コンピューティングデバイスは、1つ以上の実施形態に従って、第1のタンパク質について結合部位プロファイルを生成する。結合部位プロファイルは、第1のタンパク質の1つ以上の結合部位の分子特性および幾何学的特徴を表し得る。
ステップ230において、1つ以上の実施形態に従って、コンピューティングデバイスは、1つ以上のタンパク質の表面の分子特性を表すタンパク質構造データを抽出する。1つ以上の実施形態では、タンパク質構造データは、被制御サーバによってホストされる私的データベースから得られる。
ステップ240において、標的タンパク質は、1つ以上の実施形態による第1のタンパク質の結合部位プロファイルおよびタンパク質構造データを用いて同定される。第1のタンパク質の結合部位がタンパク質構造データ内の1つ以上のタンパク質の表面の分子特性を有する類似性の閾値を満たすかどうかを決定できる。さらに、あるタンパク質が第1のタンパク質の結合部位プロファイル内の分子特性に一致する分子特性を示すとタンパク質構造データから同定される場合、タンパク質構造データから同定されたその一致タンパク質を、標的タンパク質として標識できる。
ステップ250において、標的タンパク質は、1つ以上の実施形態に従ってユーザに提示するために1つ以上のコンピューティングデバイスに送信される。1つ以上の実施形態では、例えば、標的タンパク質および試験リガンドは、それぞれのコンピューティングデバイス上での表示のためにコンピューティングデバイスに送信される。標的タンパク質および/または試験リガンドに関連する様々な分子特性もまた、コンピューティングデバイス上での表示のために送信されてよい。
図3Aおよび図3Bは、本発明の1つ以上の実施形態による標的タンパク質を同定するための方法を表すフローチャートを示す。ステップ300において、1つ以上の実施形態は、リガンドに基づいて標的タンパク質を同定するためのリクエストを受信することに関する。さらに、このリクエストに応じて、コンピューティングデバイスは、リガンドの分子特性を同定できる。例えば、試験リガンドの化学的特性、物理的特性、構造的特性、薬理学的特性、および/または生物学的特性を同定できる。次に、試験リガンドの分子特性に基づいて、試験リガンドの分子指紋が生成され得る。例えば、試験リガンドの分子特性を2進数字のストリングに変換し、試験リガンドの分子指紋としてデータリポジトリ中に保存できる。
ステップ302では、1つ以上の実施形態に従いステップ300で受信されたリクエストに応じて、コンピューティングデバイスは、1つ以上の分子の分子特性を含む分子データを取得し抽出する。1つ以上の実施形態では、分子データは、1つ以上の分子の化学的および構造的特性を提供する公的にアクセス可能な参照分子データベースから得られる。1つ以上の実施形態において、分子データは、被制御サーバによってホストされる私的データベースから得られる。
ステップ304では、1つ以上の実施形態に従いステップ302で抽出された分子データに応じて、分子データから1つ以上の分子の分子指紋が抽出される。1つ以上の実施形態では、ステップ302で抽出された分子データを使用して、1つ以上の分子の分子指紋が生成される。さらに、試験リガンドに構造的および/または分子的に類似している1つ以上の分子が、その分子指紋に基づいて同定される。例えば、コンピューティングデバイスのコンピュータプロセッサは、ステップ300で生成された試験リガンドの分子指紋と類似している分子指紋を有する1つ以上の分子を同定できる。言い換えれば、コンピュータプロセッサは、試験リガンドの分子指紋と重複する分子指紋を有する1つ以上の分子を同定できる。さらに、試験リガンドの分子指紋と同様の分子指紋を有する1つ以上の分子を、コンピュータプロセッサによって類似のリガンドとして標識できる。例えば、試験リガンドの分子指紋と比較した場合に類似性の閾値を満たす分子指紋を有する分子を、コンピュータプロセッサにより類似リガンドとして標識してもよい。
ステップ306では、1つ以上の実施形態に従いステップ304で類似リガンドを同定することに応じて、コンピューティングデバイスは、1つ以上のタンパク質の分子特性を含むタンパク質データを取得し抽出する。1つ以上の実施形態では、タンパク質データは、1つ以上のタンパク質の化学的および構造的特性を提供する公的にアクセス可能な参照タンパク質データベースから得られる。1つ以上の実施形態では、タンパク質データは、被制御サーバによってホストされる私的データベースから得られる。
ステップ308では、1つ以上の実施形態に従いステップ306でタンパク質データを抽出することに応じて、タンパク質データおよび分子データを使用して、類似リガンドと結合する第1の複数のタンパク質を同定する。例えば、コンピュータプロセッサは、特定の類似リガンドの分子特性を用いて、その特定の類似リガンドと相互作用してリガンド−タンパク質複合体を形成する1つ以上のタンパク質を同定できる。
ステップ310において、1つ以上の実施形態に従いステップ306において類似リガンドと結合する第1の複数のタンパク質を同定することに応じて、特異的タンパク質が第1の複数のタンパク質から選択される。例えば、コンピューティングデバイスによって第1の複数のタンパク質からタンパク質を反復して選択し、続いて、その後のステップにおいて試験リガンドを選択されたタンパク質にドッキングする。
ステップ312では、1つ以上の実施形態に従い第1の複数のタンパク質からタンパク質を選択することに応じて、選択されたタンパク質および試験リガンドを用いてドッキングシミュレーションを実施する。ここで、選択されたタンパク質の分子特性および試験リガンドの分子特性を抽出して、選択されたタンパク質と試験リガンドとの間の相互作用をシミュレートできる。例えば、コンピュータプロセッサは、試験リガンドと選択されたタンパク質の結合部位との間の結合をシミュレートするために、試験リガンドの分子指紋および選択されたタンパク質の分子特性を用いて計算を実施できる。1つ以上の実施形態では、コンピュータプロセッサは、試験リガンドを、選択されたタンパク質の1つ以上の結合部位にドッキングする。
ステップ314では、1つ以上の実施形態に従いドッキングシミュレーションを実施することに応じて、選択されたタンパク質についてドッキングスコアが生成される。ドッキングスコアは、試験リガンドと選択されたタンパク質の1つ以上の結合部位との間の適合度と相関し得る。例えば、高いドッキングスコアは、選択されたタンパク質の結合部位に対する試験リガンドの高い親和性を示し得る。
ステップ316では、選択されたタンパク質についてドッキングスコアを生成することに応じて、選択されたタンパク質のドッキングスコアがドッキングスコア閾値を満たすかどうか、および/またはドッキングスコア閾値を超えるかどうかの決定が、1つ以上の実施形態によるコンピューティングデバイスを使用して行われる。ドッキングスコア閾値は、ユーザによって手動で設定されてよく、コンピュータプロセッサによって計算され設定されてもよい。ドッキングスコアがドッキングスコア閾値を満たす場合、プロセスはステップ318に進む。ドッキングスコアがドッキングスコア閾値を満たさない場合、プロセスはステップ310に進んで、第1の複数のタンパク質中の次のタンパク質を反復して選択する。
ステップ318では、選択されたタンパク質のドッキングスコアがドッキングスコア閾値を満たすと決定することに応じて、選択されたタンパク質が、1つ以上の実施形態に従って第1の複数のタンパク質のサブセットに挿入される。例えば、選択されたタンパク質がドッキングスコア閾値を満たす場合、選択されたタンパク質は、その後のステップにおけるさらなる処理のためにサブグループに挿入され得る。選択されたタンパク質がドッキングスコア閾値を満たさない場合、選択されたタンパク質は試験リガンドと不適合であるとみなされ、プロセスはステップ310に戻って異なるタンパク質を反復して選択できる。
ステップ320では、選択されたタンパク質を第1の複数のタンパク質のサブセットに挿入することに応じて、選択されたタンパク質について結合部位プロファイルが、1つ以上の実施形態に従って生成される。結合部位プロファイルは、選択されたタンパク質の1つ以上の結合部位の分子特性および幾何学的特徴を表すことができる。1つ以上の実施形態では、選択されたタンパク質の結合部位プロファイルは、選択されたタンパク質の1つ以上の結合部位に対する1つ以上のリガンドの結合親和性を含む。さらに、選択されたタンパク質の結合部位プロファイルは、選択されたタンパク質の1つ以上の結合部位に対して高い親和性を有する可能性のあるリガンドをもたらし得る特定の分子特性および/または分子指紋を記載してもよい。
ステップ322において、コンピューティングデバイスを使用して、1つ以上の実施形態に従って第1の複数のタンパク質中にさらなるタンパク質が残っているかどうかを決定する。例えば、コンピュータプロセッサは、ドッキングシミュレーションのために、第1の複数のタンパク質中で追加のタンパク質がまだ選択されていないかを決定できる。追加のタンパク質が検出されない場合、プロセスはステップ324に進む。追加のタンパク質が検出された場合、プロセスはステップ310に進んで第1の複数のタンパク質中で次のタンパク質を反復して選択する。
ステップ324では、1つ以上の実施形態に従って、コンピューティングデバイスは、1つ以上のタンパク質の表面の分子特性を表すタンパク質構造データを抽出する。ステップ326では、特定のタンパク質が、1つ以上の実施形態に従って第1の複数のタンパク質のサブセットから選択される。例えば、タンパク質は、コンピューティングデバイスを使用して第1の複数のタンパク質のサブセットから反復して選択される。さらに、選択されたタンパク質の結合部位プロファイルが、コンピューティングデバイスを使用して抽出されてもよい。
ステップ328では、1つ以上の実施形態による選択されたタンパク質の結合部位プロファイルおよびタンパク質構造データを使用して、標的タンパク質が同定される。次いで、選択されたタンパク質の結合部位がタンパク質構造データ内の1つ以上のタンパク質の分子特性との類似性の閾値を満たしているかが決定される。あるタンパク質が、選択されたタンパク質の結合部位プロファイルと一致する分子特性を示すとタンパク質構造データ内から同定される場合、タンパク質構造データから同定されたこのタンパク質は、標的タンパク質として同定され得る。アミノ酸配列ごとの1つ以上のタンパク質の一致する表面をクラスタ化し、一致する表面を分子特性の類似性に従ってランク付けできる。
1つ以上の実施形態では、マッチングは、リガンドおよび/または結合部位の柔軟性を考慮しながら、タンパク質表面の幾何学的および静電的特徴などの1つ以上のタンパク質の表面の分子特性に基づいて行われる。柔軟性は、リガンドおよび/またはタンパク質の結合部位の1つ以上の位置および/またはコンフォメーションをシミュレートするアルゴリズムに参照してもよい。例えば、ドッキングシミュレーションは、リガンドの並進、回転、および/または捻れの面に沿った操作で実施され得る。さらに、ドッキングシミュレーションは、タンパク質の1つ以上の結合部位に結合するためのリガンドの最適な配向を決定するために、リガンドの様々なコンフォメーション(単結合に沿った回転など)を用いて実施され得る。同様に、ドッキングシミュレーションは、リガンド−タンパク質相互作用のギブス自由エネルギーが最小化されるようタンパク質とリガンドとの間のコンフォメーションおよび/または配向を達成するために、タンパク質の結合部位の構造の種々の調節を用いて実施され得る。さらに、リガンドとタンパク質の結合部位の相対的配向は生成されるシグナルのタイプに影響し得るので、ドッキングシミュレーションは、タンパク質の結合部位に対するリガンドの結合親和性、ならびにリガンド−タンパク質複合体の形成時に生成されるシグナルのタイプを予測し得る。
ステップ330では、1つ以上の実施形態に従い、かつタンパク質構造データから標的タンパク質を同定することに応じて、標的タンパク質および試験リガンドとのドッキングシミュレーションが実施される。ここで、標的タンパク質の分子特性および試験リガンドの分子特性を抽出して、標的タンパク質と試験リガンドとの間の相互作用をシミュレートできる。例えば、コンピュータプロセッサは、試験リガンドと標的タンパク質の結合部位との間の結合をシミュレートするために、試験リガンドの分子指紋、並びに標的タンパク質の分子特性および/またはタンパク質構造データを使用して計算を実施できる。1つ以上の実施形態では、コンピュータプロセッサは、試験リガンドを標的タンパク質の1つ以上の結合部位にドッキングする。試験リガンドは、ドッキングスコアに基づいて最も高い一致表面に直接的にドッキングされてよく、それは標的タンパク質の一致する表面を取り囲む局所領域に限定され得る。
ステップ332では、1つ以上の実施形態に従い、かつドッキングシミュレーションを実施することに応じて、標的タンパク質についてのドッキングスコアが生成される。ドッキングスコアは、試験リガンドと標的タンパク質の1つ以上の結合部位との間の適合度と相関し得る。例えば、高いドッキングスコアは、標的タンパク質の結合部位に対する試験リガンドの高い親和性を示し得る。
ステップ334では、標的タンパク質についてのドッキングスコアを生成することに応じて、標的タンパク質のドッキングスコアが、1つ以上の実施形態に従ってドッキングスコア閾値を満たしているか、および/またはドッキングスコア閾値を超えているかの決定が行われる。ドッキングスコアがドッキングスコア閾値を満たしている場合、プロセスはステップ336に進む。ドッキングスコアがドッキングスコア閾値を満たしていない場合、プロセスはステップ340に進む。
ステップ336では、標的タンパク質のドッキングスコアがドッキングスコア閾値を満たしていると決定することに応じて、標的タンパク質は、1つ以上の実施形態に従って試験リガンドのプロテオーム結合プロファイルに挿入される。試験リガンドのプロテオーム結合プロファイルは、試験リガンドと結合すると予測されるおよび/または実験的に決定された1つ以上のタンパク質を含み得る。例えば、標的タンパク質がドッキングスコア閾値を満たしている場合、標的タンパク質は、試験リガンドのプロテオーム結合プロファイルに挿入され得る。標的タンパク質がドッキングスコア閾値を満たしていない場合、選択されたタンパク質の構造は試験リガンドと適合していないとみなされ、プロセスはステップ340に進み得る。試験リガンドと同様の追加の分子をドッキングシミュレーションステップに含めて、分子的に関連する化合物のプロテオーム結合プロファイルを直接比較してもよい。プロテオーム結合プロファイルを使用して、異なる分子およびそれらのそれぞれの予測されるタンパク質結合部位をクラスタ化してもよい。予測されるタンパク質相互作用のリストを生成することにより、本明細書に記載の方法は、一次タンパク質相互作用を共有する分子を橋渡しできる。
ステップ338では、標的タンパク質は、1つ以上の実施形態に従ってユーザに提示するために、1つ以上のコンピューティングデバイスに送信される。1つ以上の実施形態では、例えば、標的タンパク質および試験リガンドは、それぞれのコンピューティングデバイス上での表示のためにコンピューティングデバイスに送信される。標的タンパク質および/または試験リガンドに関連する様々な分子特性もまた、コンピューティングデバイス上での表示のために送信されてもよい。
ステップ340では、1つ以上の実施形態に従って、選択されたタンパク質に基づいて追加の標的タンパク質が残っているかどうかの決定が行われる。例えば、コンピューティングデバイスのコンピュータプロセッサは、ステップ326で選択されたタンパク質の分子特性に基づいて、ステップ328で追加の標的タンパク質が同定されるかどうかを決定できる。追加の標的タンパク質が検出されない場合、プロセスはステップ342に進む。さらなる標的タンパク質が検出された場合、プロセスは、コンピュータプロセッサが次の標的タンパク質を反復して選択し、かつ試験リガンドを用いて次の標的タンパク質とのドッキングシミュレーションを実施するためにステップ330に進む。
ステップ342では、1つ以上の実施形態に従って第1の複数のタンパク質のサブセット中に追加のタンパク質が残っているかどうかの決定がコンピューティングデバイスによって行われる。例えば、コンピューティングデバイスのコンピュータプロセッサは、ドッキングシミュレーションのための標的タンパク質を同定するために、第1の複数のタンパク質のサブセット中で追加のタンパク質がまだ選択されていないかどうかを決定し得る。追加のタンパク質が検出されない場合、プロセスは終了する。追加のタンパク質が検出された場合、プロセスはステップ326に進んで、第1の複数のタンパク質のサブセット中で次のタンパク質を反復して選択する。
1つ以上の実施形態では、被制御サーバは、1つ以上のタンパク質の機能を表すタンパク質データを含む。例えば、被制御サーバによってホストされるタンパク質データは、1つ以上のタンパク質に関連する生物学的役割および/または生物学的経路を表し得る。別の例では、タンパク質データは、1つ以上のタンパク質の活性と相関する1つ以上の疾患および/または治療を表すことができる。したがって、試験リガンドは、ステップ336で同定された標的タンパク質に関連する生物学的役割を促進および/または阻害すると予測され得る。さらに、試験リガンドの作用機序は、試験リガンドによって標的化されると予測される特定のタンパク質の同定に基づいて決定されてもよい。例えば、第1の疾患の治療に使用される薬物が、第2の疾患に関与する特定のタンパク質と相互作用すると予測される場合、その薬物は、第2の疾患の治療のために再使用され得る。すなわち、本明細書に記載の方法は、既存の化合物について新しい用途の特定を可能にし得る。さらに、本明細書に記載の方法は、薬物の追加の標的タンパク質の同定を可能にし得る。例えば、薬物のための単一の標的タンパク質が同定され得るが、その薬物は追加のタンパク質と相互作用する可能性を有し得る。したがって、本明細書に記載の方法は、薬物と追加のタンパク質との間の潜在的な相互作用を予測し得る。さらに、追加のタンパク質の生物学的役割に基づいて、薬物の潜在的な有益な効果、有害作用、および/または毒性が予測され得る。
タンパク質結合相互作用の予測は、薬物−標的会合、遺伝子疾患関連、タンパク質−タンパク質相互作用、および経路分析を含む、公的に利用可能な参照データベースの組み込みを可能にし得る。2つ以上のタンパク質が物理的に会合して細胞機能を果たす場合、タンパク質−タンパク質相互作用(PPI)が起こり得る。所与のタンパク質に結合するリガンドはまた、周囲のタンパク質の活性に影響し得る。本明細書に記載の方法をPPI相互作用のデータベースと組み合わせることにより、二次タンパク質相互作用の同定が可能になり得る。さらに、経路分析は、様々なタンパク質の生物学的プロセスの同定を可能にし得る。さらに、標的タンパク質は、薬物−標的関連のデータベースと相互参照されて、潜在的な相乗的または拮抗的な薬物−薬物相互作用を同定し得る。さらに、標的タンパク質は、遺伝子−疾患関連のデータベースと相互参照されて、治療的適用または試験リガンドとの併用薬物療法のための新しい可能性を明らかにし得る。
図4A、図4B、図4C、図4D、および図4Eは、本発明の1つ以上の実施形態による標的タンパク質を同定するための例を示す。以下の実施例は説明の目的のみのためのものであり、本発明の範囲を限定するものではない。例示のみの目的のために、薬物候補(401)が被制御サーバまたは他のコンピューティングデバイス(図示せず)によって試験リガンドとして受信されるシナリオを検討する。この例では、被制御サーバまたは他のコンピューティングデバイスは、薬物候補(401)、薬物候補(401)に分子的に類似している1つ以上のリガンド(例えば、類似分子A(403A)、類似分子B(403B))、薬物候補および/または1つ以上の類似分子と結合できる1つ以上のタンパク質(例えば、適合タンパク質A(405A)、適合タンパク質B(405B)、適合タンパク質C(405C)、適合タンパク質D(405D))の分子特性に関するデータを保存するデータリポジトリ(410)を含む(またはそれへのアクセスを有する)。さらに、データリポジトリ410は、1つ以上のタンパク質(例えば、タンパク質α(412A)、タンパク質β(412B)、タンパク質N(412N))の表面の分子特性、例えば幾何学的および/または生物物理的特性、を表すタンパク質構造データ(411)を含む。この例では、被制御サーバは、1つ以上の分子および/またはタンパク質の参照分子データを保存する1つ以上の遠隔サーバ(図示せず)に動作可能に接続される。
図4Aに戻って、被制御サーバ(またはある種のプロセッサを使用する任意のコンピューティングデバイス)は、薬物候補(401)の分子特性に基づいて分子指紋を生成し、その分子指紋を分子リポジトリ(410)中に保存する。分子指紋を生成するために使用される分子特性は、薬物候補(401)の直接実験室試験によって決定され得る。さらに、分子特性は、参照分子データベースから得ることができる。
次に、1つ以上の分子に関する参照分子データを得るために、参照分子データベースがアクセスされる。1つ以上の分子指紋は、データリポジトリ(410)中に保存するための参照分子データを使用して、様々な分子について生成されてよい。本明細書では、薬物候補(401)の分子指紋および参照分子データは、1つ以上の類似分子(例えば、類似分子A(403A)、類似分子B(403B))を同定するために使用され、薬物候補の分子指紋および類似分子の分子指紋は類似性の閾値を満たす。
類似分子が同定されると、参照タンパク質データベースにアクセスして、1つ以上のタンパク質に関する参照タンパク質データを得る。参照タンパク質データおよび参照分子データを次いで使用して、類似の分子と結合する1つ以上のタンパク質(例えば、適合タンパク質A(405A)、適合タンパク質B(405B)、適合タンパク質C(405C)、適合タンパク質D)を同定する。
次に、特定のタンパク質が、ドッキングシミュレーションのために適合タンパク質から選択される。例えば、タンパク質はコンピューティングデバイスによって適合タンパク質のリストから反復して選択され、続いて、薬物候補が選択されたタンパク質にドッキングされる。ここでは、選択されたタンパク質の分子特性および薬物候補の分子特性が抽出されて、選択されたタンパク質と薬物候補との間の相互作用をシミュレートする。ドッキングシミュレーションを実施することに応じて、選択されたタンパク質についてドッキングスコアが生成される。図4Bに示すように、薬物候補(401)と適合タンパク質A(405A)との間のドッキングシミュレーションは、ドッキングスコア閾値を超えるドッキングスコアをもたらす。さらに、薬物候補(401)と適合タンパク質B(405B)との間のドッキングシミュレーションは、ドッキングスコア閾値を超えるドッキングスコアをもたらす。しかし、この例では、薬物候補(401)と適合タンパク質C(405C)との間の、および薬物候補と適合タンパク質D(405D)との間のドッキングシミュレーションは、ドッキングスコア閾値を満たしていない。したがって、適合タンパク質Aについての結合部位プロファイル(例えば、結合部位プロファイルA(407A))および適合タンパク質Bについての結合部位プロファイル(例えば、結合部位プロファイルB(407B))が生成される。
さらに、コンピューティングデバイスは、1つ以上のタンパク質の表面の分子特性を表すタンパク質構造データを抽出する。次いで、適合タンパク質の結合部位プロファイル(例えば、結合部位プロファイルA(407A)、結合部位プロファイルB(407B))およびタンパク質構造データ(例えば、結合部位プロファイルα(413A)、結合部位プロファイルβ(413B))を使用して、1つ以上のタンパク質(例えば、タンパク質α(412A)、タンパク質β(412B))が同定される。この実施例では、適合タンパク質の結合部位プロファイル(例えば、結合部位プロファイルA(407A)、結合部位プロファイルB(407B))が、タンパク質構造データ内の1つ以上のタンパク質の分子特性(例えば、結合部位プロファイルα(413A)、結合部位プロファイルβ(413B)、結合部位プロファイルN(413N))との類似性の閾値を満たしているか決定を行う。得られたタンパク質は同定され、相互作用候補タンパク質(例えば、タンパク質α(412A)、タンパク質β(412B))として標識される。
さらに、相互作用候補および薬物候補を用いてドッキングシミュレーションが実施される。ここで、薬物候補の分子特性および相互作用候補の分子特性が抽出されて、相互作用候補と薬物候補との間の相互作用をシミュレートする。図4Dに示すように、薬物候補(401)と相互作用候補タンパク質β(412B)との間のドッキングシミュレーションは、ドッキングスコア閾値を超えるドッキングスコアをもたらす。しかし、この例では、薬物候補(401)と相互作用候補タンパク質α(412A)との間のドッキングシミュレーションは、ドッキングスコア閾値を満たしていない。このため、図4Eに示すとおり、プロテオーム結合プロファイル(415)が薬物候補(401)について生成され、それはタンパク質β(412B)を含む。
本発明の実施形態は、コンピューティングシステム上に実装できる。モバイル、デスクトップ、サーバ、埋め込み型、または他の型のハードウェアの任意の組み合わせを使用できる。例えば、図5に示すように、コンピューティングシステム(500)は、1つ以上のコンピュータプロセッサ(502)、関連メモリ(504)(例えば、ランダムアクセスメモリ(RAM)、キャッシュメモリ、フラッシュメモリなど)、1つ以上のストレージデバイス(例えば、ハードディスク、コンパクトディスク(CD)ドライブまたはデジタル多用途ディスク(DVD)ドライブなどの光学ドライブ、フラッシュメモリスティック)、ならびに他の多数の要素および機能を備えてよい。コンピュータプロセッサ(複数可)(502)は、命令を処理するための集積回路であってよい。例えば、コンピュータプロセッサ(複数可)は、1つ以上のコア、またはプロセッサのマイクロコアであってよい。コンピューティングシステム(500)はまた、タッチスクリーン、キーボード、マウス、マイクロフォン、タッチパッド、電子ペン、または任意の他のタイプの入力デバイスなどの1つ以上の入力デバイス(510)を備えてもよい。さらに、コンピューティングシステム(500)は、スクリーン(例えば、液晶ディスプレイ(LCD)、プラズマディスプレイ、タッチスクリーン、陰極線管(CRT)モニタ、プロジェクタ、または他の表示装置)などの1つ以上の出力デバイス(508)、プリンタ、外部ストレージ、または任意の他の出力装置を備えてもよい。出力デバイスのうちの1つ以上は、入力デバイス(複数可)と同じであっても異なっていてもよい。コンピューティングシステム(500)は、ネットワークインターフェイス接続(図示せず)を介して、ネットワーク(512)(例えば、ローカルエリアネットワーク(LAN)、インターネットなどのワイドエリアネットワーク(WAN)、モバイルネットワーク、または任意の他のタイプのネットワーク)に接続されてよい。入力および出力デバイス(複数可)は、コンピュータプロセッサ(複数可)(502)、メモリ(504)、およびストレージデバイス(複数可)(506)にローカルまたはリモート(例えば、ネットワーク512を介して)で接続されてよい。多くの異なるタイプのコンピューティングシステムが存在し、前述の入力デバイスおよび出力デバイス(複数可)は、他の形態をとってもよい。
本発明の実施形態を実施するためのコンピュータ可読プログラムコードの形態のソフトウェア命令は、CD、DVD、ストレージデバイス、フロッピーディスク、テープ、フラッシュメモリ、物理メモリ、または任意の他のコンピュータ可読ストレージ媒体などの非一時的コンピュータ可読媒体に全体的または部分的に、一時的または永続的に、保存されてよい。具体的には、ソフトウェア命令は、コンピュータプロセッサ(複数可)によって実行される際に、本発明の実施形態を実施するように構成されたコンピュータ可読プログラムコードに対応してよい。
さらに、前述のコンピューティングシステム(500)の1つ以上の要素は、遠隔地に配置され、ネットワーク(512)を介して他の要素に接続されてもよい。さらに、本発明の実施形態は、複数のノードを有する分散システム上で実施でき、本発明の各部分は、分散システム内の異なるノード上に配置されてよい。本発明の一実施形態では、ノードは、別個のコンピューティングデバイスに対応する。あるいは、ノードは、関連する物理メモリを有するコンピュータプロセッサに対応してもよい。あるいは、ノードは、共有メモリおよび/またはリソースを有するコンピュータプロセッサまたはコンピュータプロセッサのマイクロコアに対応してよい。
本発明は、限られた数の実施形態に関して記載されているが、本開示の恩恵を受ける当業者は、本明細書中に開示される本発明の範囲から逸脱しない他の実施形態が考案され得ることを理解するであろう。したがって、本発明の範囲は、添付の特許請求の範囲によってのみ限定されるべきである。
Claims (19)
- 標的タンパク質を同定するための方法であって、
リガンドに基づいて標的タンパク質を同定するためのリクエストを受信すること、
前記リガンドを使用して、第1のタンパク質を同定することであって、前記リガンドは、前記第1のタンパク質と結合してリガンド−タンパク質複合体を形成するものであり、
前記第1のタンパク質について第1の結合部位プロファイルを生成することであって、前記第1の結合部位プロファイルは、前記第1のタンパク質の分子特性を表すものであり、
被制御サーバから、複数のタンパク質の表面の分子特性を表す構造データを得ることであって、前記複数のタンパク質は、前記標的タンパク質を含むものであり、
前記第1の結合部位プロファイルおよび前記構造データを用いて、前記標的タンパク質を同定すること、および
前記標的タンパク質をユーザに提示すること、
を含む、方法。 - 前記標的タンパク質は、複数の標的結合部位を含み、かつ
前記構造データは、前記複数の標的結合部位の分子特性をさらに表す、請求項1に記載の方法。 - 前記標的タンパク質を同定することは、
前記第1の結合部位プロファイルおよび前記構造データを使用して、前記複数の標的結合部位の標的結合部位を同定すること、および
前記標的結合部位を前記ユーザに提示すること、
をさらに含む、請求項2に記載の方法。 - 前記標的タンパク質を同定することは、
前記第1の結合部位プロファイルを前記標的タンパク質の前記構造データと比較することによって、類似性尺度を生成すること、および
前記類似性尺度が、所定の閾値を超えると決定すること、
をさらに含む、請求項1に記載の方法。 - 前記第1のタンパク質を同定することは、
参照分子データベースから、複数の分子の分子特性を含む分子データを抽出すること、
前記リガンドおよび前記分子データを使用して類似リガンドを同定することであって、前記類似リガンドは、前記リガンドと分子的に関連するものであり、
参照タンパク質データベースからタンパク質データを抽出することであって、前記タンパク質データは、前記類似リガンドと結合してリガンド−タンパク質複合体を形成する第1の複数のタンパク質を同定するものであり、および
前記第1の複数のタンパク質のサブセットを同定するために前記リガンドおよび前記第1の複数のタンパク質を用いて複数のドッキングシミュレーションを実施することであって、前記第1の複数のタンパク質の前記サブセットは、前記第1のタンパク質を含むものである、
を含む、請求項1に記載の方法。 - 前記複数のドッキングシミュレーションを実施することは、
前記リガンドを前記第1の複数のタンパク質の各タンパク質にドッキングすること、
前記リガンドを前記第1の複数のタンパク質にドッキングすることに応じて、前記第1の複数のタンパク質の各タンパク質についてドッキングスコアを生成すること、
前記第1の複数のタンパク質の前記サブセットの各タンパク質についてのドッキングスコアが所定の閾値を超えるという決定を実行すること、および
前記決定に応じて、前記第1の複数のタンパク質の前記サブセットの各タンパク質について結合部位プロファイルを生成すること、
をさらに含む、請求項5に記載の方法。 - 前記第1の複数のタンパク質の各タンパク質は、複数の結合部位を含む、請求項6に記載の方法。
- 前記複数のドッキングシミュレーションを実施することは、前記リガンドを前記複数の結合部位の各結合部位にドッキングすることをさらに含む、請求項7に記載の方法。
- 前記決定に応じて、前記リガンドについてプロテオーム結合プロファイルを生成することであって、前記プロテオーム結合プロファイルが、前記リガンドと結合してリガンド−タンパク質複合体を形成する前記第1の複数のタンパク質の前記サブセットを含む、請求項6に記載の方法。
- 標的タンパク質を同定するためのシステムであって、
複数のタンパク質についての表面の分子特性を表す構造データを保存するデータリポジトリと、
命令を有するコンピュータプロセッサを含む被制御サーバとを備え、
前記命令は、
リガンドに基づいて標的タンパク質を同定するためのリクエストを受信すること、
前記リガンドを使用して第1のタンパク質を同定することであって、前記リガンドは、前記第1のタンパク質と結合してリガンド−タンパク質複合体を形成するものであり、
前記第1のタンパク質について第1の結合部位プロファイルを生成することであって、前記第1の結合部位プロファイルは、前記第1のタンパク質の分子特性を表すものであり、
前記複数のタンパク質についての表面の分子特性を表す前記構造データを得ることであって、前記複数のタンパク質は、前記標的タンパク質を含むものであり、
前記第1の結合部位プロファイルおよび前記構造データを用いて、前記標的タンパク質を同定すること、および
前記標的タンパク質をユーザに提示すること、
を実行できる命令である、システム。 - 前記標的タンパク質は、複数の標的結合部位を含み、かつ
前記構造データは、前記複数の標的結合部位の分子特性をさらに表す、請求項10に記載のシステム。 - 前記標的タンパク質を同定することができる命令は、
前記第1の結合部位プロファイルおよび前記構造データを使用して、前記複数の標的結合部位の標的結合部位を同定すること、および
前記標的結合部位を前記ユーザに提示すること、
をさらに含む、請求項11に記載のシステム。 - 前記標的タンパク質を同定することができる命令は、
前記第1の結合部位プロファイルを前記標的タンパク質の前記構造データと比較することによって、類似性尺度を生成すること、および
前記類似性尺度が所定の閾値を超えると決定すること、
をさらに含む、請求項10に記載のシステム。 - 前記第1のタンパク質を同定することができる命令は、
参照分子データベースから、複数の分子の分子特性を含む分子データを抽出すること、
前記リガンドおよび前記分子データを使用して、類似リガンドを同定することであって、前記類似リガンドは、前記リガンドと分子的に関連するものであり、
参照タンパク質データベースから、タンパク質データを抽出することであって、前記タンパク質データは、前記類似リガンドと結合してリガンド−タンパク質複合体を形成する第1の複数のタンパク質を同定するものであり、および
前記第1の複数のタンパク質のサブセットを同定するために前記リガンドおよび前記第1の複数のタンパク質を用いて複数のドッキングシミュレーションを実施することであって、前記第1の複数のタンパク質の前記サブセットは、前記第1のタンパク質を含むものである、
を含む、請求項10に記載のシステム。 - 前記複数のドッキングシミュレーションを実施することができる命令は、
前記リガンドを前記第1の複数のタンパク質の各タンパク質にドッキングすること、
前記リガンドを前記第1の複数のタンパク質にドッキングすることに応じて、前記第1の複数のタンパク質の各タンパク質についてドッキングスコアを生成すること、
前記第1の複数のタンパク質の前記サブセットの各タンパク質についてのドッキングスコアが所定の閾値を超えるという決定を実行すること、および
前記判定に応じて、前記第1の複数のタンパク質の前記サブセットの各タンパク質について結合部位プロファイルを生成すること、
をさらに含む、請求項14に記載のシステム。 - 前記第1の複数のタンパク質の各タンパク質は、複数の結合部位を含む、請求項15に記載のシステム。
- 前記複数のドッキングシミュレーションを実施することができる命令は、前記リガンドを前記複数の結合部位の各結合部位にドッキングすることをさらに含む、請求項16に記載のシステム。
- 前記複数のドッキングシミュレーションを実施することができる命令は、
前記決定に応じて、前記リガンドについてプロテオーム結合プロファイルを生成することであって、前記プロテオーム結合プロファイルは、前記リガンドと結合してリガンド−タンパク質複合体を形成する前記第1の複数のタンパク質の前記サブセットを含むものである、
をさらに含む、請求項15に記載のシステム。 - 標的タンパク質を同定するための方法を実施するためにコンピュータプロセッサ上で実行できる命令を含む非一時的なコンピュータ可読媒体であって、
リガンドに基づいて標的タンパク質を同定するためのリクエストを受信すること、
前記リガンドを使用して、第1のタンパク質を同定することであって、前記リガンドは、前記第1のタンパク質と結合してリガンド−タンパク質複合体を形成するものであり、
前記第1のタンパク質について第1の結合部位プロファイルを生成することであって、前記第1の結合部位プロファイルは、前記第1のタンパク質の分子特性を表すものであり、
被制御サーバから、複数のタンパク質についての表面の分子特性を表す構造データを得ることであって、前記複数のタンパク質は前記標的タンパク質を含むものであり、
前記第1の結合部位プロファイルおよび前記構造データを用いて、前記標的タンパク質を同定すること、および
前記標的タンパク質をユーザに提示すること、
を含む、媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CA2015/051384 WO2017113004A1 (en) | 2015-12-31 | 2015-12-31 | Methods for proteome docking to identify protein-ligand interactions |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019508821A true JP2019508821A (ja) | 2019-03-28 |
Family
ID=59224064
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018553273A Pending JP2019508821A (ja) | 2015-12-31 | 2015-12-31 | タンパク質−リガンド相互作用を同定するためのプロテオームドッキング方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US12033723B2 (ja) |
EP (1) | EP3398102B1 (ja) |
JP (1) | JP2019508821A (ja) |
CN (1) | CN109155148B (ja) |
CA (1) | CA3010226C (ja) |
WO (1) | WO2017113004A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020213417A1 (ja) * | 2019-04-16 | 2020-10-22 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190130064A1 (en) * | 2017-10-27 | 2019-05-02 | Dassault Systemes Americas Corp. | Biological sequence fingerprints |
CN111667886B (zh) * | 2020-04-22 | 2023-04-18 | 大连理工大学 | 一种动态蛋白质复合物识别方法 |
CN111640468B (zh) * | 2020-05-18 | 2021-08-24 | 天士力国际基因网络药物创新中心有限公司 | 一种基于复杂网络筛选疾病相关蛋白的方法 |
CN113299339B (zh) * | 2021-05-28 | 2024-05-07 | 平安科技(深圳)有限公司 | 基于深度学习的药物疗效预测方法、装置、设备以及存储介质 |
CN115631808B (zh) * | 2022-10-25 | 2023-08-01 | 贵州大学 | 一种分子靶点快速预测及关联机理分析方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756931A (ja) * | 1993-08-12 | 1995-03-03 | Fujitsu Ltd | 立体構造を解析するための装置 |
JPH07274965A (ja) * | 1993-11-12 | 1995-10-24 | Kokuritsu Idengaku Kenkyusho | 遺伝子のモチーフ抽出処理装置及び処理方法 |
US20020072887A1 (en) * | 2000-08-18 | 2002-06-13 | Sandor Szalma | Interaction fingerprint annotations from protein structure models |
JP2003535394A (ja) * | 2000-05-11 | 2003-11-25 | ワシントン・ユニバーシティ | 転写因子結合部位クラスターの同定 |
JP2008217594A (ja) * | 2007-03-06 | 2008-09-18 | Nec Corp | 化合物のスクリーニング方法及びそのスクリーニングシステム。 |
WO2009064015A1 (ja) * | 2007-11-12 | 2009-05-22 | In-Silico Sciences, Inc. | インシリコスクリーニング装置、および、インシリコスクリーニング方法 |
JP2009151406A (ja) * | 2007-12-19 | 2009-07-09 | National Institute Of Advanced Industrial & Technology | タンパク質機能識別装置 |
JP2013255467A (ja) * | 2012-06-13 | 2013-12-26 | Okinawa Institute Of Science & Technology Graduate Univ | 相互作用予測装置、相互作用予測方法、および、プログラム |
US20150324546A1 (en) * | 2012-06-21 | 2015-11-12 | Georgetown University | Method for predicting drug-target interactions and uses for drug repositioning |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU1925699A (en) * | 1997-12-18 | 1999-07-05 | Sepracor, Inc. | Methods for the simultaneous identification of novel biological targets and leadstructures for drug development |
JP4935009B2 (ja) * | 2005-07-13 | 2012-05-23 | 富士通株式会社 | タンパク質表面形状検索装置、タンパク質表面形状検索方法、およびタンパク質表面形状検索プログラム |
WO2009132656A2 (en) * | 2008-04-27 | 2009-11-05 | H. Lundbeck A/S | Design of specific ligands to sortilin |
CN103792293A (zh) * | 2012-10-29 | 2014-05-14 | 天津市国际生物医药联合研究院有限公司 | 筛选靶蛋白配体的方法 |
US20150134266A1 (en) * | 2013-11-12 | 2015-05-14 | New York University | Method of identifying the molecular basis of the activity of a drug compound, pharmaceutical compositions, and treatment methods |
CN104693306B (zh) * | 2013-12-09 | 2018-07-10 | 苏州工业园区晨健抗体组药物开发有限公司 | 一种人鼠嵌合单克隆抗体及其制备方法和应用 |
CN104965998B (zh) * | 2015-05-29 | 2017-09-15 | 华中农业大学 | 多靶标药物和/或药物组合的筛选方法 |
WO2016200681A1 (en) | 2015-06-08 | 2016-12-15 | Georgetown University | Predicting drug-target interactions and uses for drug repositioning and repurposing |
US11024492B2 (en) * | 2015-07-07 | 2021-06-01 | Institute For Systems Biology | Method to obtain unbiased identification of interaction of test compounds with the proteome |
US20170147743A1 (en) * | 2015-11-23 | 2017-05-25 | University Of Miami | Rapid identification of pharmacological targets and anti-targets for drug discovery and repurposing |
EP3714458A4 (en) | 2017-11-22 | 2021-08-18 | Cyclica Inc. | DIFFERENTIAL DRUG DISCOVERY PROCESS AND SYSTEM |
CN118197481A (zh) | 2018-09-13 | 2024-06-14 | 思科利康有限公司 | 预测化学结构性质的方法和系统 |
EP3906556A4 (en) | 2019-01-04 | 2022-09-28 | Cyclica Inc. | METHOD AND SYSTEM FOR PREDICTING DRUG BINDING USING SYNTHESIS DATA |
-
2015
- 2015-12-31 CA CA3010226A patent/CA3010226C/en active Active
- 2015-12-31 JP JP2018553273A patent/JP2019508821A/ja active Pending
- 2015-12-31 WO PCT/CA2015/051384 patent/WO2017113004A1/en active Application Filing
- 2015-12-31 CN CN201580085846.2A patent/CN109155148B/zh active Active
- 2015-12-31 US US16/067,465 patent/US12033723B2/en active Active
- 2015-12-31 EP EP15911664.9A patent/EP3398102B1/en active Active
-
2024
- 2024-06-05 US US18/734,587 patent/US20240321391A1/en active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756931A (ja) * | 1993-08-12 | 1995-03-03 | Fujitsu Ltd | 立体構造を解析するための装置 |
JPH07274965A (ja) * | 1993-11-12 | 1995-10-24 | Kokuritsu Idengaku Kenkyusho | 遺伝子のモチーフ抽出処理装置及び処理方法 |
JP2003535394A (ja) * | 2000-05-11 | 2003-11-25 | ワシントン・ユニバーシティ | 転写因子結合部位クラスターの同定 |
US20020072887A1 (en) * | 2000-08-18 | 2002-06-13 | Sandor Szalma | Interaction fingerprint annotations from protein structure models |
JP2008217594A (ja) * | 2007-03-06 | 2008-09-18 | Nec Corp | 化合物のスクリーニング方法及びそのスクリーニングシステム。 |
WO2009064015A1 (ja) * | 2007-11-12 | 2009-05-22 | In-Silico Sciences, Inc. | インシリコスクリーニング装置、および、インシリコスクリーニング方法 |
JP2009151406A (ja) * | 2007-12-19 | 2009-07-09 | National Institute Of Advanced Industrial & Technology | タンパク質機能識別装置 |
JP2013255467A (ja) * | 2012-06-13 | 2013-12-26 | Okinawa Institute Of Science & Technology Graduate Univ | 相互作用予測装置、相互作用予測方法、および、プログラム |
US20150324546A1 (en) * | 2012-06-21 | 2015-11-12 | Georgetown University | Method for predicting drug-target interactions and uses for drug repositioning |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2020213417A1 (ja) * | 2019-04-16 | 2020-10-22 | ||
WO2020213417A1 (ja) * | 2019-04-16 | 2020-10-22 | 富士フイルム株式会社 | 特徴量算出方法、特徴量算出プログラム、特徴量算出装置、スクリーニング方法、スクリーニングプログラム、及び化合物創出方法 |
JP7297057B2 (ja) | 2019-04-16 | 2023-06-23 | 富士フイルム株式会社 | 特徴量算出方法、特徴量算出プログラム、特徴量算出装置、スクリーニング方法、スクリーニングプログラム、及び化合物創出方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109155148B (zh) | 2022-06-24 |
WO2017113004A1 (en) | 2017-07-06 |
CN109155148A (zh) | 2019-01-04 |
EP3398102C0 (en) | 2024-02-21 |
EP3398102A1 (en) | 2018-11-07 |
EP3398102B1 (en) | 2024-02-21 |
US12033723B2 (en) | 2024-07-09 |
CA3010226A1 (en) | 2017-07-06 |
US20240321391A1 (en) | 2024-09-26 |
EP3398102A4 (en) | 2020-07-08 |
CA3010226C (en) | 2023-02-14 |
US20190018924A1 (en) | 2019-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lim et al. | Predicting drug–target interaction using a novel graph neural network with 3D structure-embedded graph representation | |
Luo et al. | Biomedical data and computational models for drug repositioning: a comprehensive review | |
Agamah et al. | Computational/in silico methods in drug target and lead prediction | |
US20240321391A1 (en) | Methods for proteome docking to identify protein-ligand interactions | |
Agrawal et al. | Benchmarking of different molecular docking methods for protein-peptide docking | |
Wang et al. | Rfdt: A rotation forest-based predictor for predicting drug-target interactions using drug structure and protein sequence information | |
Schindler et al. | Fully blind peptide-protein docking with pepATTRACT | |
DeLuca et al. | Fully flexible docking of medium sized ligand libraries with RosettaLigand | |
Durrant et al. | NNScore 2.0: a neural-network receptor–ligand scoring function | |
Hofmarcher et al. | Large-scale ligand-based virtual screening for SARS-CoV-2 inhibitors using deep neural networks | |
Cheng et al. | Prediction of chemical–protein interactions: multitarget-QSAR versus computational chemogenomic methods | |
Hu et al. | ATPbind: accurate protein–ATP binding site prediction by combining sequence-profiling and structure-based comparisons | |
Takaya et al. | FMODB: The world’s first database of quantum mechanical calculations for biomacromolecules based on the fragment molecular orbital method | |
Venhorst et al. | Assessment of scaffold hopping efficiency by use of molecular interaction fingerprints | |
Sael et al. | Detecting local ligand‐binding site similarity in nonhomologous proteins by surface patch comparison | |
Weber et al. | VAMMPIRE: a matched molecular pairs database for structure-based drug design and optimization | |
Oferkin et al. | Evaluation of Docking Target Functions by the Comprehensive Investigation of Protein‐Ligand Energy Minima | |
Chen et al. | Predicting drug–target interactions with deep-embedding learning of graphs and sequences | |
Wu et al. | PRL‐dock: Protein‐ligand docking based on hydrogen bond matching and probabilistic relaxation labeling | |
Wang et al. | Predicting target-ligand interactions using protein ligand-binding site and ligand substructures | |
Carregal et al. | Docking-based virtual screening of Brazilian natural compounds using the OOMT as the pharmacological target database | |
Swift et al. | Knowledge-based methods to train and optimize virtual screening ensembles | |
Patiyal et al. | A deep learning-based method for the prediction of DNA interacting residues in a protein | |
Vilar et al. | State of the art and development of a drug-drug interaction large scale predictor based on 3D pharmacophoric similarity | |
Nunez et al. | Assessment of a novel scoring method based on solvent accessible surface area descriptors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200303 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20201006 |