JP7175455B2 - 薬物有害反応の予測 - Google Patents

薬物有害反応の予測 Download PDF

Info

Publication number
JP7175455B2
JP7175455B2 JP2020505477A JP2020505477A JP7175455B2 JP 7175455 B2 JP7175455 B2 JP 7175455B2 JP 2020505477 A JP2020505477 A JP 2020505477A JP 2020505477 A JP2020505477 A JP 2020505477A JP 7175455 B2 JP7175455 B2 JP 7175455B2
Authority
JP
Japan
Prior art keywords
drug
adr
processor
adrs
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020505477A
Other languages
English (en)
Other versions
JP2020530158A5 (ja
JP2020530158A (ja
Inventor
ルオ、ヘン
チャン、ピン
フォコウエ-ンコウチ、アキッレ、ベリー
ヒュー、ジャンイン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2020530158A publication Critical patent/JP2020530158A/ja
Publication of JP2020530158A5 publication Critical patent/JP2020530158A5/ja
Application granted granted Critical
Publication of JP7175455B2 publication Critical patent/JP7175455B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Software Systems (AREA)
  • Medicinal Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Toxicology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Description

本発明は、概して、薬物有害反応を予測するためのシステムおよび方法に関し、特に、薬剤候補についての潜在的な薬物有害反応(ADR:adverse drug reaction)および市販薬についての未検出のADRを予測すること、ならびに関連のある標的を識別することについてのフレームワークに関する。さらなる態様は、フレームワークの使用が、あるADRについてのアクションのメカニズムを査定することを可能にする。
薬物有害反応を予測し薬剤の安全性を改善するために、機械学習モデルが開発されている。効果的な予測方法もあるが、大抵の機械学習モデルは、予測結果についての生物学的説明、特に標的(ターゲット)結合に関連する情報が、あるとしても十分に提供しない。
薬物有害反応(ADR)は、複雑であり、個人個人で異なり得る。関連のある標的の識別は、ADRのメカニズムを理解する助けとなり得るだけでなく、遺伝子変異などの潜在的に原因となる態様に着目する助けにもなり、したがって、精密医療の改善を手助けする。
多様な特徴(例えば、化学構造、結合アッセイ、および表現型情報)ならびにモデル(例えば、ロジスティック回帰、ランダム・フォレスト、およびサポート・ベクトル・マシン)を用いて薬物有害反応を予測するために、計算方法が開発されているが、研究の大半は、メカニズムの説明の仮説生成ではなく、特徴の多様性およびモデル性能に着目している。
薬剤分子の構造入力のみを要求することによって、新規薬剤または候補薬剤について起こり得るADRを予測するためのシステム、方法、およびコンピュータ・プログラム製品である。さらに、そのようなADRを引き起こすことにおいて重要な役割を果たし得る、関連のある結合標的が、識別され/強調され得る。
1つの実施形態によれば、新規薬剤についての薬物有害反応を自動的に予測するため、または現在市販されている薬剤についての未検出の薬物有害反応を予測するための方法が提供される。
方法は、プロセッサにおいて、薬剤の分子構造に関するデータを受信することと、プロセッサを用いて、薬剤について複数の薬剤標的間相互作用特徴を計算することであって、薬剤標的間相互作用特徴のそれぞれが、薬剤分子の構造と複数の固有の高分解能標的タンパク質構造のそれぞれとの間を相互に関連付ける、計算することと、プロセッサにおいて、対応する1以上の既知の薬物有害反応(ADR)に関連付けられた1以上の分類モデルを実行することと、1以上の分類モデルのそれぞれを用いて、薬剤標的間相互作用特徴および既知の薬剤とADRとの関係に基づいて、1以上のADRを予測することと、プロセッサによって、予測された1以上のADRを示す出力を生成することと、を含む。
さらなる実施形態において、薬剤についての薬物有害反応を自動的に予測するためのシステムが提供される。システムは、少なくとも1つのメモリ機能デバイスと、少なくとも1つのメモリ記憶デバイスに動作可能に接続された1以上のハードウェア・プロセッサと、を備え、1以上のハードウェア・プロセッサが、薬剤の分子構造に関するデータを受信し、薬剤について複数の薬剤標的間相互作用特徴を計算し、薬剤標的間相互作用特徴のそれぞれが、薬剤分子の構造と複数の固有の高分解能標的タンパク質構造のそれぞれとの間のものであり、対応する1以上の既知の薬物有害反応(ADR)に関連付けられた1以上の分類モデルを実行し、各分類モデルを用いて、薬剤および既知の薬剤とADRとの関係が関与する薬剤標的間相互作用特徴に基づいて、1以上のADRを予測し、予測された1以上のADRを示す出力を生成するように構成される。
さらなる態様において、動作を実行するためのコンピュータ・プログラム製品が提供される。コンピュータ・プログラム製品は、処理回路により可読の、かつ方法を実行する処理回路によって実行される命令を記憶する記憶媒体を含む。方法は、上記で列挙されたものと同一である。
本発明の実施形態が、ここで単なる例として添付図面を参照して説明される。
1つの実施形態において、関連する薬剤標的およびADRについてのメカニズムに対する仮説を予測するための方法を実施する、システム・フレームワーク100を概して示す。 薬剤を行として、標的タンパク質を列として、計算された結合スコアを特徴として含む、そのような特徴データ・マトリクスの可視化の例である。 薬剤を行として、ADRラベルを列として含む、そのようなバイナリ・ラベル・マトリクスの可視化の例である。 1つの実施形態による、未知の薬剤構造または新規の薬剤構造について、概してADRを予測するため、および根本的なADRメカニズムを判定するための方法を概念的に示す。 1つの実施形態による、新規の薬剤分子または既存の薬剤分子についての標的結合予測およびADRを判定するための例示的な方法を示す。 本明細書中の方法による処理のための未知の薬剤分子または新規の薬剤分子の入力を示す、例示的なコンピュータ・システム・インターフェース表示を示す。 特定の例としてのADRざ瘡様皮膚炎についてのそれぞれの信頼性で予測される上位3つの薬剤の生成されたリストを示す。 モメタゾンについての上位予測の結合タンパク質を示す表を示す。 第1のケース・スタディの例のADRざ瘡様皮膚炎の原因に対する仮説を生成するために使用され得る、さらなる分析ステップ700を示す。 開発されたADRモデルに従ってグルココルチコイド受容体が2番目に寄与する特徴であると判定され得る、上位ランクのタンパク質の例を示す。 第2のケース・スタディの例のADR被膜下白内障の原因に対する仮設を生成するために使用され得る、さらなる分析ステップを示す。 例としての第1のケース・スタディについて、薬剤モメタゾンと既知のタンパク質のオーファン核内受容体ガンマ(RORγt)リガンド結合領域との間の予測される結合立体構造を示す。 本発明の実施形態を実施するために適用可能な、例示的なコンピュータ・システム/コンピューティング・デバイスを概略的に示す。 本発明による、さらなる別の例示的なシステムを示す。
薬剤分子の構造入力から薬物有害反応(ADR)を予測するためのシステム、方法、およびコンピュータ・プログラム製品である。システムおよび方法は、ADRを引き起こすことにおいて重要な役割を果たし得る関連する結合標的を強調することによって、仮説をさらに生成する。より具体的には、システム・フレームワークは、薬剤の3D構造に関連付けられた相互作用スコアを自動的に生成し、構造ライブラリからそのようなスコアに合致させる方法を実施するために提供される。
図1は、新規薬剤化合物の構造を表すデータからADRを予測するためのコンピュータ・システムによって実行される方法100の概要を示す。最初に、図13に示されるシステムなどのコンピュータ・システムは、まず、薬剤分子を表すデータおよび複数のタンパク質構造を表すデータを取得し、薬剤標的間相互作用特徴、すなわち分子結合スコアを生成するための分子ドッキング・プログラムを実行する。1つの実施形態において、方法は、市販のDrugBankバージョン5.0データベース・リソース102(例えば、www.drugbank.caにおいて利用可能)などのデータベースから薬剤分子の2D構造または3D構造を抽出することを含む。既知のように、DrugBankリソース102は、詳細な薬剤(すなわち、化学、薬理学、および製薬)データを包括的な薬剤標的(すなわち、配列、構造、および経路)と組み合わせる。1つの実施形態において、薬剤セットまたは薬剤ライブラリ104を取得するために、コンピュータ・システムは、DrugBank5.0内の全ての小分子の分子構造を符号化するために使用されるSMILES(Simplified Molecular-Input Line-Entry System)表記を取り入れる。
さらなる実施形態において、薬剤セット104内の薬剤分子について、コンピュータ・システムは、例えば、Marvin Beans(例えば、ChemAxon Marvin Beans6.0.1から利用可能)において利用可能なプログラム・ツール「MolConverter」によって生成されたインターフェースを介して「molconvert」コマンド・ラインを使用して、入力化学式または2D分子を表す図に基づき関連する3D分子構造を生成するためのツールにアクセスしてもよい。1つの実施形態において、Marvin Beansは、化学スケッチおよび可視化のためのアプリケーションおよびAPI、ならびに、例えば分子ファイル・フォーマット、グラフィック・フォーマットなどの、2Dおよび3Dの多様なファイル・フォーマット間でファイルを変換するためのMolconverterツールである。
さらに、1つの実施形態において、薬剤セット104内の3D薬剤分子について、システムは、まず、回転可能な結合を有しない(例えば、酢酸カルシウムなど)、または大きすぎる(分子量>1200を有する、例えば、ベシル酸シサトラクリウムなど)薬剤分子を除去し得る。それらは、意味のあるドッキング・スコアを生成しない、例えば、大きすぎてタンパク質ポケット内に合わない場合があるためである。
図1にさらに示されるように、コンピュータ・システムは、さらに、複数のタンパク質構造を表すデータを取得する。説明のため、ヒトタンパク質が使用されるが、発明は、他の動物のタンパク質型に適合されてもよい。タンパク質セットについて、システムは、結晶構造の精選されたソースである、PDBBindデータベース・リソース112(例えば、www.pdbbind.org.cnにおいて利用可能)または類似のタンパク質データバンクの全般的なコレクションを取り入れる。ヒトタンパク質114が選択され、最良の分解能を有する各タンパク質についてただ1つの固有の構造が選択された。コンピュータ・システム・インターフェースを介して、ユーザは、例えば、分解能、PD、固有の選択、およびPDBBind基準に従って、PDBBindデータベース・リソース112にインターフェースを介して入力することによって、特定のタンパク質を選択し得る。
1つの実施形態において、PDBBindデータベース112から抽出されるのは、固有のヒトタンパク質標的を表すデータである。標的タンパク質は、以下の選択された基準に従って、PDBBindデータベース112から選択される。(1)高品質:抽出されるタンパク質構造全てが、1.98±0.47Åのオーダの高分解能を有するべきである。(2)標的設定可能:構造は、実験的リガンド結合データを利用可能である。(3)固有ヒトタンパク質:構造は、固有ヒトタンパク質を表し、すなわち、1つのタンパク質に対して、最も高い分解能を有する利用可能な多くの可能性のある結晶構造のうちの1つを選択する。(4)境界のはっきりした結合ポケット:構造は、結合ポケットを定義する埋め込みリガンドを有する。
薬剤分子セット104および固有標的タンパク質セット114の選択および抽出の後、方法は、AutoDock Tools1.5.6(例えば、autodock.scripps.eduにおいて利用可能)などの自動ドッキング・ツールを用いて構造ファイルを準備する。1つの実施形態において、ガスタイガー(Gasteiger)・チャージは、AutoDock Toolsの準備スクリプトを用いて薬剤および標的構造の両方に追加される。既知のように、AutoDock Toolsは、基質または薬剤候補などの小分子が既知の3D(例えば、標的タンパク質)構造の受容体にどのように結合するかを予測するために必要なファイルを準備するように構成されるソフトウェア・プログラムである。1つの実施形態において、タンパク質の結合ポケットは、ポケット単位の変動を減少させるために、25×25×25Åの固定サイズで元の埋め込みリガンドの中心にある。
図1の方法100において続けると、107における方法は、固定の乱数シードおよび他のデフォルト・パラメータでAutoDock Vina1.1.2研究ツール(例えば、vina.scripps.eduにおいて利用可能)を用いて、セット104からの薬剤分子のそれぞれをタンパク質セット114のタンパク質構造のそれぞれに対してドッキングすることを含む。既知のように、AutoDock Vinaは、非常に正確な結合モードの予測を提供する分子ドッキングを実行するため、すなわち、分子ドッキング・スコア107(または分子結合スコア)およびそれらの間の立体構造を計算するためのソフトウェア・プログラムである。1つの実施形態において、その入力および出力について、AutoDock Vinaは、AutoDockツールおよびAutoDock4によって使用される同一のPDBQT(Protein Data Bank、Partial Charge(Q)、&Atom Type(T)フォーマット)分子構造ファイル・フォーマットを使用する。必要な全ては、ドッキングされている分子の構造、および結合部位を含む探索空間の仕様である。最も低いドッキング・スコアおよび対応する結合立体構造は、薬剤標的間相互作用特徴セット117として抽出され、記憶された。
ドッキング・スコアの生成まで至る図1の方法ステップに基づいて、1つの実施形態において、特徴データ・マトリクスが取り入れられる。図2は、薬剤104を行として、標的タンパク質114を列として、および相互作用する薬剤/標的タンパク質の個々の計算された結合スコア107を、薬剤標的間相互作用特徴セット117を形成する特徴として含む、そのような特徴データ・マトリクス150(2Dマトリクス)の可視化の例である。
図1に戻って、並列(並行)または後続のプロセスにおいて、方法100は、薬剤ラベルから抽出される薬物有害反応(ADR)情報を、ADRラベル127のセット(http://sideeffects.embl.deにおいて見つけられ得る)についてのグランド・トゥルースとして含む、SIDERデータベース・バージョン4.1などのSIDER(Side Effect Resource)データベース122からデータを取り入れることを実行する。1つの実施形態において、方法は、DrugBankの類義語を用いてSIDERデータベースからDrugBankIDへ薬剤名のマッピングを実行する。したがって、SIDERデータベースから既知の既存の薬剤とADRとの関係が取り入れられる。
1つの実施形態において、ADRラベル127の生成まで至る図1の方法ステップに基づいて、第2のバイナリ・ラベル・マトリクスを表すデータが取り入れられる。図3は、薬剤104を行として、ADRラベル127を列として含む、そのようなバイナリ・ラベル・マトリクス160の可視化の例である。各ADRについて、薬剤が、それを引き起こすと知られる場合、薬剤とADRのペア・ラベル128は、バイナリ値、例えば、「1」(正)とマークされ、薬剤がADRを引き起こすことを意味する。そうでない場合、薬剤とADRのペア・ラベル128は、「0」(負)バイナリ値とマークされ、薬剤とADRとの間に関係はないことを意味する。
1つの実施形態において、方法は、まず、正のサンプルが少なすぎるため、所定量よりも少ない正の薬剤、例えば、5つの正の薬剤を含むADRをフィルタリングするフィルタリング・ステップを含み得る。
図1に戻って、後続のプロセスにおいて、コンピュータ実装方法は、薬剤標的間相互作用特徴および既知の薬剤とADRとの関係に基づいて、新規薬剤についてのADRを予測するために使用され得る機械学習モデル130を開発すること、および評価することを含む。すなわち、(図2、図3の)第1の取り込まれた特徴マトリクス150および第2の取り込まれたバイナリ・ラベル・マトリクス160を訓練データ・セットとして扱って、方法100は、機械学習問題:Y=f(X):特徴(X):がドッキング・スコアであり、ラベル(Y):がADRを引き起こすか否か、を定義する。各ADRについて、対応する予測モデルが開発され、特に、L2正則化を有する1つのロジスティック回帰分類子が、タンパク質結合スコアを特徴として用いて各ADRについて開発される。1つの実施形態において、分類子は、Python2.7.12(例えば、Anaconda(R)4.1.1ソフトウェア)においてsklearnバージョン0.17.1を用いて実装され得る(Anaconda(R)は、テキサス州オースティン 78701のContinuum Analytics Inc.の登録商標である)。
1つの実施形態において、1つのロジスティック分類モデルが、各ADRについて生成される。1つの実施形態において、ADRモデルを訓練することは、特定のADRについて、ラベル(Y)を表すバイナリ値を有する1つのADR列、例えば、図3の列118を一度に取得することと、図2に示される薬剤相互作用特徴マトリクス150などの特徴マトリクスf(X)全体を取得することと、を含む。分類子を構築するために、各ADRについて、1つのラベル列118(図3)に対応する入力データ、および列、例えば、図2の列114内に対応する複数の特徴(分子結合スコア)の(1以上の行104の)それぞれの各薬剤サンプル108についての入力が存在し、行104として複数の薬剤サンプルが存在する。
1つの実施形態において、特定のADRモデルについて、これらの入力は、
Figure 0007175455000001
などの1つのロジスティック回帰関数において受信される。
薬剤xとすると、600個のタンパク質に対する分子ドッキング・スコアは、(x,x,...,x600)のベクトルである。係数(b,b,...,b600)が定数aのための値と共に、モデル訓練プロセス中に取得された。方法は、薬剤xがこの特定のADRを引き起こし得るという、予測された信頼スコア(範囲:0%~100%)としてf(x)を計算することを含む。
1つの実施形態において、Anaconda(R)Pythonにおけるsklearnパッケージは、ロジスティック回帰モデルを開発するためにコンピュータ・システム上で実装されてもよく、1つの実施形態において、係数は、コスト関数(予測と実測値との間の集められた差である)を最小化することによって判定される。L2正則化の使用が、最良の予測性能を有する係数をもたらし得る。Pythonプログラミング言語用のScikit-learnソフトウェア機械学習ライブラリも、ADRモデルを開発するために使用され得る。
1つの実施形態において、機械学習数学技術を使用して構築されたロジスティック回帰ADRモデルにおいて計算される係数は、ADRメカニズムを理解するために関連する標的分析の対象となる。
1つの実施形態において、モデルに対する最良パラメータを選択するために、正則化タイプ(L1およびL2)ならびに10分割交差検証中のパラメータ(C=0.001、0.01、0.1、1、10、100、および1000)の異なる組み合わせが探索されてもよく、最良パラメータは、受信者動作特性曲線(AUROC)の下の最良エリアに基づいて選択され得る。分子ドッキングのADR予測性能を実証するために、7つの異なるタイプの構造フィンガープリントが、特徴比較のために訓練セット内の薬剤について生成された。7つの構造フィンガープリントは、E-state、Extended Connectivity Fingerprint(ECFP)-6、Functional-Class Fingerprints(FCFP)-6、FP4、Klekota-Roth法、MACCS、およびPubChem構造記述子(それぞれ、E-state、ECFP6、FCFP6、FP4、KR、MACCS、およびPubChemと呼ばれる)である。AUROCおよび精度-再現率曲線(AUPR)値の下のエリアの両方についての10分割交差検証による、これらの構造フィンガープリントに対する分子ドッキングの予測性能を比較した後、最終モデル130が、最適パラメータを有する分子ドッキング特徴に基づいて開発された。
ADRを予測するために開発され得る、異なるタイプの予測モデルが存在すると理解されるべきである。例えば、説明されたように各ADRについて別々のモデルが構築されるが、全てのADRについて予測し得るただ1つのモデルが開発されてもよい。この代替的な手法について、訓練セット内の各行が、薬剤とADRのペアを表し、それが薬剤とADR特徴の両方を含むように、ADRについての特徴を取り入れる必要がある。そのような行についてのラベルは、「正」(既知の薬剤とADRの関連を表す)、または「負」(未知の薬剤とADRの関連を表す)のいずれかである。
図1にさらに示されるように、133において、開発されたモデルは、次いで訓練セットにまだ存在しない薬剤についてADR予測を行うために使用され得る。さらに、135において、例えば、上位ランクのドッキング・スコアおよび訂正の両方の点からADR予測に関連付けられるタンパク質結合特徴を分析することによって、ADRについて考えられるメカニズムが判定され得る。
図4は、1つの実施形態による、システムに入力される未知のまたは新規の薬剤構造301(例えば、薬剤X)について、ADRを概して予測するため、および基礎となるADRメカニズムを判定するための方法300を、概念的に示す。薬剤相互作用マトリクス(例えば、図2に示されるものなど)およびADRラベル・マトリクス(例えば、図3に示されるものなど)の生成を含む、訓練セットデータの構築後、かつ上述したロジスティック回帰分類子を用いて各ADR機械学習モデルを開発した後、新規薬剤のADRを判定する方法が、図4に示されている。最初に、方法は、テストされている新規薬剤の物理的3D構造301を含み得る新規/未知の薬剤Xについての分子構造を取得することを含む。次いで、新規薬剤構造301は、AutoDockプログラムまたは類似のドッキング・ツール310、例えば、AutoDock Vinaに入力され、そこで、新規薬剤の分子結合スコアが、複数の固有の標的タンパク質304のそれぞれについて取得される。ドッキングの結果として、各標的タンパク質に対する新規薬剤xについてのドッキング・スコアのベクトル315をもたらすために、標的分子結合スコア(相互作用スコア)が、各標的タンパク質相互作用について取得される。標的は、次いでどの標的タンパク質が新規薬剤に最も結合するかを示すために、薬剤Xに対するそれらの相互作用スコアによってランク付けされ得る。さらに、薬剤Xとライブラリ標的との間の立体構造が取得され得る。
次いで、相互作用の結果が、機械学習モデルf(x)を介してADRを予測するために使用される。さらに、特徴分析が、ADRの根本的なメカニズムを理解するために実施され得る。
したがって、図4に示されるように、構築されたADR予測モデルf(x)330は、次いで、(ランク付けされ得る)各標的に関連するドッキング・スコアのベクトル315に適用される。すなわち、薬剤Xとライブラリ標的との間の各相互作用スコアに基づいて、モデルは、相互作用スコアに基づく薬剤Xについての潜在ADR350を予測するために適用される。
1つの実施形態において、ADRは、信頼スコアによってランク付けされる。例えば、薬剤Xについての上位の結合標的は、薬剤とADRとの関係に基づくメカニズムを研究するために使用され得る。例えば、本明細書の以下の第1のケース・スタディの例1を参照されたい。
代替的に、ADRについて最も関連のある標的が、ADRのメカニズムを理解するためにモデルベースの特徴/係数分析によって識別され得る。例えば、本明細書の以下の第2のケース・スタディの例2を参照されたい。
図5は、新規(または既存)の薬剤分子、例えば、訓練セット内に存在しない薬剤Xについての標的結合予測およびADRを、相互作用スコアの結果およびADRの根底にあるメカニズムの判定に基づいて判定するための例示的な方法400を示す。
図5の402において、第1の実施形態では、まず薬剤Xについての3D分子構造の記号データ表現が受信される。既存の、または既知の薬剤構造について、402においてコンピュータ・システムに入力される新規薬剤Xについての分子SMILESコード表現が取得され得る。
代替的な実施形態において、図5に示されるように、401において、まずシステムへの入力として、新規(候補)薬剤のユーザが生成した2D分子または化学式を表すデータが受信され得る。一度システムに受信されると、404に示されるように、システムは、新規(候補)薬剤式の対応する3D分子構造を生成する分子変換ツールにアクセスするために、コンピュータ実装プログラムまたはツールを呼び出す。このようなツールは、Marvin Beans(例えば、ChemAxon Marvin Beans6.0.1から利用可能)において利用可能なMolconverterコマンド・ライン・プログラム・ツールを含み得る。
第1のインスタンスにおいて取得されてもされなくても、予め存在するリストから既知の薬剤式を選択することおよび入力すること、ならびに図5の402において説明されたように対応するSMILESコード表現を取得することによって、または薬剤Xのユーザが生成した1D文字列もしくは2D構造表現をまず受信すること、およびそれを図5の404、次いで図5の405に示されるように対応する3D分子構造表現に変換することによって、3D構造内の結合場所およびゾーンが判断される。分子ドッキング・ツールを用いると、標的タンパク質構造の適当な標的結合部位内における新規薬剤Xの3D構造の小分子リガンドの立体構造が、ある程度の正確性で予測され得る。これは、AutoDockなどのプログラムを実装することによって実行され得る。入力薬剤式についてこのデータを使用すると、システムは、標的タンパク質と共に相互作用特徴をさらに生成し、すなわち、ライブラリ標的タンパク質のそれぞれに対する分子結合スコアおよび立体構造を取得する。さらに、405において、薬剤Xと標的との相互作用のランク付けおよび可視化が実行される。次いで、図5の410において、方法は、機械学習したADRモデル412を実行して、新規薬剤XについてのADRを予測し、ランク付けする。このステップにおいて、入力薬剤(例えば、新規薬剤X)がADRに関連付けられた薬剤タンパク質間の相互作用を引き起こす可能性を示す、出力信頼スコアが生成され得る。次いで、415において、さらなる分析が、上位のADR予測を判定するために行われ、420において、新規薬剤の考えられる原因または解釈を判定する。システムは、次いで、薬剤Xについての結合スコアおよび立体構造の両方を含む予測される結合標的、薬剤Xについての予測されるADR、およびADRに関連のある標的タンパク質を含む出力を生成し得る。
例としてのケース・スタディ1
第1の例としてのケース・スタディにおいて、薬剤モメタゾンは、ざ瘡様皮膚炎ADRを引き起こすと判定された。よって、図5の例示的な方法400を用いると、まずモメタゾンについて分子SMILESコードにおいてコンピュータ・システムに入力される。次いで、405において、抽出されたライブラリの標的タンパク質で、相互作用特徴、すなわち分子結合スコアが生成される。
図6は、本明細書中の方法による処理のための未知のまたは新規の薬剤の入力を示す、例示的なコンピュータ・システム・インターフェース表示500を示す。例示のため、DrugBankから取得されるその対応するSMILESを伴う第1の例としての薬剤502(例えば、モメタゾン)が、入力505である。1つの実施形態において、入力用の薬剤は、ユーザ・インターフェースを介して「薬剤リスト」タグ507を選択することに応答して表示される薬剤リストを介して選択され得る。さらなる実施形態において、ユーザは、潜在的な新規薬剤に関連付けられた新規の化学式の1D文字列または2D構造表現もしくはレンダリングをシステムに入力してもよく、アプリケーション・プログラミング・インターフェースを呼び出すことによって、入力された分子構造の1Dまたは2Dレンダリングから最適化された3D分子オブジェクトを構成するツールを提供するコンピュータ実装アプリケーションにアクセスしてもよい。いずれかの実施形態において、新規薬剤の3D構造(例えば、505における薬剤モメタゾンの1Dレンダリング)を入力した後、既存のまたは新規の薬剤式が、「提出」インターフェースボタン510の選択によって、AutoDock Vinaプログラムに入力される。AutoDock Vinaプログラムは、立体構造の探索アルゴリズムを採用し、セット内の標的タンパク質の全てとの新規の薬剤502の相互作用515、結合エネルギー論の定量予測を生成する機能を採用する。1つの例としての実施形態において、相互作用スコアが生成される600個の標的タンパク質が存在し、各薬剤標的タンパク質間相互作用スコアが表示され得る。薬剤520は、対応するタンパク質識別子(PDBID)515、およびAutoDock Vinaプログラムによって生成されるそれらの対応する相互作用スコア530と共にリスト化される。1つの実施形態において、これらのスコアは、それらの結合スコア530に従ってランク付けされる。
次いで、図5のステップ410において説明されるように、方法は、新規薬剤または既存薬剤、例えば、モメタゾンについてのADRを予測するためにADRモデル412を実行する。
第1の実例において、各入力薬剤についての相互作用スコア530に対する各ADRモデル実行の出力として、薬剤が現在のADRに関連付けられた薬剤タンパク質間相互作用をもたらす信頼スコアが生成される。図7のチャート600に示されるように、ADRざ瘡様皮膚炎についてのそれぞれの信頼性605で予測される上位3つの薬剤リストが生成される。
既知のように、ざ瘡様皮膚炎(統合医学用語システム・コンセプトID:C0234708)は、ざ瘡のような皮膚発疹である。図7に示されるように、ADRざ瘡様皮膚炎についてのADRモデルの実行からの予測結果は、モメタゾン(DrugBank ID:DB00764)が、0.649の信頼性でこのADRを引き起こす、テストセット内で最高ランクの薬剤であったことを示した。ざ瘡様発疹は、モメタゾンの使用によって引き起こされる局所的な副作用であると報告されており、それは予測を立証する。
このADRの潜在的メカニズムを理解するために、薬剤Xについての標的結合分析およびADR特有の特徴分析が行われ得る。1つの実施形態において、方法は、全ての標的タンパク質に対する新規薬剤についての結合スコアにアクセスする。この第1のケース・スタディの例について、プロセスは、モメタゾンについての上位の結合タンパク質を判定するため、およびそれらの結合スコアによってそれらをランク付けするために呼び出される。図8は、モメタゾンについての上位予測の結合タンパク質を示す表650を示す。オーファン核内受容体ガンマ(RORγt)リガンド結合領域(Protein Data Bank ID、すなわちPDB ID:3B0W)は、図8に示されるように、-10.4の結合スコアを有するモメタゾンについての上位3番目の結合標的652であると予測された。
図12は、例としての第1のケース・スタディについて、薬剤モメタゾン1001とオーファン核内受容体ガンマ(RORγt)リガンド結合領域1010(例えば、PDB ID:3B0W)との間の予測される結合立体構造1000の可視化を示す。図12において、予測される結合立体構造のそれぞれに関連付けられた相互作用エネルギーの正確な予測が判定される、受容体の結合キャビティ1012にドッキングされたリガンドを示す受容体1010の3次元構造におけるリガンド1001の3次元構造が示されている。タンパク質標的1010の「細い棒状の」タンパク質残基1007が、タンパク質標的1010の結合キャビティ1012内に示され、リガンド1001との密接な相互作用を有する。
1つの実施形態において、このADR相互作用を回避するために、薬剤修飾または3B0Wタンパク質との結合を最小化または回避するために開発された新規薬剤が開発され得る。代替的には、既存の薬剤構造が、3B0Wタンパク質との結合を最小化または回避するために再設計され、または修飾され得る。このような修飾は、リガンド長、サイズ、または形状、あるいはその組み合わせを変更すること、空間構成、極性、および水素結合性態様を変更すること、例えば、ヘテロ原子(酸素、窒素など)またはADRの根本原因と判定されるタンパク質との相互作用を回避するために水素結合性をもたらす基を加えることを含むが、これらに限定されない当技術分野において既知のものを含む。
図1に関して上述したように、さらなる分析ステップ135において、ADRの原因についての仮説が生成され得る。図9は、第1のケース・スタディの例のADRざ瘡様皮膚炎の原因に対する仮説を生成するために使用され得る、さらなる分析ステップ700を示す。研究では、IL-17発現細胞およびTh17関連信号伝達が、ざ瘡様病変705に存在し、または引き起こすことが分かっている。708において、RORγtが、Th17細胞分化およびIL-17生産に必要とされることが示されている。710において、RORγtに結合すること、およびそれによってTh17/IL-17レベルに影響を及ぼすことを通して、モメタゾン薬702は、ざ瘡様皮膚炎712の発生を引き起こすということが、仮説とされ得る。
例としてのケース・スタディ2
第2の例としてのケース・スタディにおいて、コンピュータ・システムは、ADRモデルの特徴係数を分析することと、ADRに関連のあるメカニズムを理解するために係数に従って標的をランク付けすることと、を含むモデルベースの特徴分析、すなわち係数分析を実行する。
第2の例としてのケース・スタディにおいて、被膜下白内障、ADRを引き起こし得る薬剤が判定され得る。したがって、図1のさらなる分析ステップ133によれば、600個のタンパク質特徴のそれぞれからのドッキング・スコア・ベクトル(図2)は、それらの個々の性能を評価するために、被膜下白内障ADRのラベル・ベクトル(図3)に対して分析される。
分析の結果として、方法は、対応するADRモデルによって重み付けされるように、対象のADRに関する上位のタンパク質特徴を判定する。図10は、被膜下白内障ADRに関連する上位3つのタンパク質特徴を、そのADRモデルについてのそれらのロジスティック回帰係数の絶対値に従って示す、表800の例を示す。したがって、第2の例としてのケース・スタディにおいて、ADR予測(例えば、被膜下白内障)に対する対応するタンパク質標的タンパク質1~600の重み寄与を示すために、係数(b,b,...,b600)の絶対値が取得される。絶対値が大きいほど、モデルに対する寄与が大きいことを示す。
図10の表800に示される分析において、グルココルチコイド受容体805は、開発されたADRモデルに従って2番目に寄与する特徴であると判定される。
図11は、第2のケース・スタディの例のADR被膜下白内障912の原因についての仮説を生成するために使用され得る、さらなる分析ステップ900を示す。このADRの潜在メカニズムを理解するために、ステロイド誘発性後嚢下白内障が、グルココルチコイド活性を有するステロイドにのみ関連し、そこで、グルココルチコイド受容体活性化905およびその後の変化(細胞増殖および抑圧された分化など)908は、重要な役割を果たすということが研究において報告された。したがって、グルココルチコイド受容体に対して結合する薬剤(例えば、新規薬剤X)は、被膜下白内障の発生に重要であり得ると判断される。
したがって、この特徴に基づく分析から、ADRに関連付けられるタンパク質標的を見つけることが可能であり、よって、ADRのメカニズムを探索し、理解する助けとなる仮説を生成する。
上記ケース・スタディから、方法は、薬剤分子についてのADRを予測し得るだけでなく、結合標的を介して起こり得るメカニズムの説明を提供し得る。ADRは、複雑化し、個人個人で異なるため、そのような説明が、仮説を生成し、ADRメカニズムについてのウェットラボ実験についての設計を助けるために毒性学の研究者に手がかりを潜在的に提供し得る。したがって、薬剤の安全性評価が改善される。方法は、ADRを予測するために薬剤分子の構造情報を必要とするだけであるため、薬剤候補の他の種類の情報が限定されるときに、初期の薬剤開発段階においてそれを使用することが実現可能である。
図13は、本発明の実施形態を実施するために適用可能な、例示的なコンピュータ・システム/コンピューティング・デバイスを概略的に示す。
ここで図13を参照すると、関連する薬剤標的および薬物有害反応についてのメカニズムに対する仮説を予測し、生成するための方法を実行するコンピュータ・システム・フレームワーク200が示される。いくつかの態様では、システム200は、コンピューティング・デバイス、モバイル・デバイス、またはサーバを含み得る。いくつかの態様において、コンピューティング・デバイス200は、例えば、パーソナル・コンピュータ、ラップトップ、タブレット、スマート・デバイス、スマート・フォン、スマート・ウェアラブル・デバイス、スマート・ウォッチ、または任意の他の類似のコンピューティング・デバイスを含み得る。
コンピューティング・システム200は、少なくとも1つのプロセッサ252、例えば、オペレーティング・システムまたはプログラム命令あるいはその両方を記憶するためのメモリ254、ネットワーク・インターフェース256、ディスプレイ・デバイス258、入力デバイス259、およびコンピューティング・デバイスに共通の任意の他の特徴を含む。いくつかの態様において、コンピューティング・システム200は、例えば、データベース230ウェブサイト225またはウェブベースもしくはクラウドベースのサーバ220と、公衆または私設通信ネットワーク99を介して通信するように構成される任意のコンピューティング・デバイスであり得る。さらに、システム200の一部として示されるのは、抽出された薬剤標的間相互作用特徴、および例えば、ADRモデルを構築するために使用される薬剤-ADR情報を一時的に記憶するためのさらなるメモリ260である。例えば、1つの実施形態において、さらなるメモリ260は、識別される薬剤およびヒトタンパク質標的のデータベース、ならびに分子ドッキングを介して計算されたそれらの相互作用プロファイルを含む、構造ライブラリを提供し得る。
1つの実施形態において、図13に示されるように、デバイス・メモリ254は、関連する薬剤標的および薬物有害反応についてのメカニズムに対する仮説を予測および生成する能力をシステムに提供する、プログラム・モジュールを記憶する。例えば、薬剤/新規薬剤構造ハンドラ・モジュール265には、詳細な薬剤(すなわち、化学、薬理学、および製薬)データの処理およびハンドリングのためにDrugbankデータベースV5.0ウェブサイトと対話するための、コンピュータ可読命令、データ構造、プログラム・コンポーネント、およびアプリケーション・インターフェースが提供される。標的タンパク質ハンドラ・モジュール270には、標的タンパク質の選択および処理のためにPDBBind112データベース・ウェブサイトと対話するための、コンピュータ可読命令、データ構造、プログラム・コンポーネント、およびアプリケーション・インターフェースが提供される。ドッキング・ツール・ハンドラ・モジュール275には、薬剤と選択された標的タンパク質との間の分子結合スコアを生成するためにAutoDock Vinaドッキング・プログラムと対話するための、コンピュータ可読命令、データ構造、プログラム・コンポーネント、およびアプリケーション・インターフェースが提供される。ADR-薬剤抽出ハンドラ・モジュール280には、特定の薬剤ラベルから抽出したADR情報を取得するためにSIDERデータベースと対話するための、コンピュータ可読命令、データ構造、プログラム・コンポーネント、およびアプリケーション・インターフェースが提供される。機械学習ツール・ハンドラ・モジュール285には、ロジスティック回帰ADRモデルを生成するために教師あり機械学習プログラムと対話するための、コンピュータ可読命令、データ構造、プログラム・コンポーネント、およびアプリケーション・インターフェースが提供される。さらなるプログラム・モジュールは、図5のステップに従って新たな薬剤についてADR予測分析および仮説生成を行うための、コンピュータ可読命令、データ構造、プログラム・コンポーネント、およびアプリケーション・インターフェースが提供される、分析教師ありハンドラ・モジュール290である。
図13において、プロセッサ252は、例えば、マイクロコントローラ、フィールド・プログラマブル・ゲート・アレイ(FPGA)、または多様な動作を実行するように構成される任意の他のプロセッサを含み得る。プロセッサ252は、図1および図5の方法に従って命令を実行するように構成され得る。これらの命令は、例えば、メモリ254に記憶され得る。
1つの実施形態において、コンピュータ・システム200は、複数のプロセッサを実装する機械である。分子ドッキング・プロセスは、最も時間のかかるプロセスであるため、すなわち、新規薬剤が処理されるべき時間毎に、600個のタンパク質にドッキングする必要があり、次いで、複数の制御プロセッサ・ユニット、例えば、CPU252A、252B、252Cは、ドッキング・プロセスを並列計算することによってこれを加速し得る。例えば、分子が600個のタンパク質を1つずつドッキングする代わりに、50個のコアマシンが、一度に50のドッキングを行い得る。1つの実施形態において、コンピュータ・システム200は、マルチコア機械であってもよく、それによって、多くのコアを有するほど、計算は早くなる。ADRモデル開発について、複数コアが、パラメータ・テストを加速する助けとなる。例えば、10セットのパラメータをテストするのが望ましい場合、10個のコアマシンが1つのバッチでそれを行い得る。
メモリ254は、例えば、非一過性コンピュータ可読媒体を、ランダム・アクセス・メモリ(RAM)またはキャッシュ・メモリあるいはその両方などの揮発性メモリの形態で含み得る。メモリ254は、例えば、他のリムーバブル/非リムーバブル、揮発性/不揮発性記憶媒体を含み得る。単なる非限定的な例として、メモリ254は、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュ・メモリ)、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD-ROM)、光記憶デバイス、磁気記憶デバイス、または前述したものの任意の適当な組み合わせを含み得る。
ネットワーク・インターフェース256は、例えば、有線または無線接続を介して、データまたは情報をデータベース・ウェブサイト・サーバ220へ送信および受信するように構成される。例えば、ネットワーク・インターフェース256は、ローカル・エリア・ネットワーク(LAN)を介して、ワイド・エリア・ネットワーク(WAN)を介して、Bluetooth(R)、WIFI(例えば、802.11a/b/g/n)、セルラネットワーク(例えば、CDMA、GSM、M2M、および3G/4G/4G LTE)、近距離通信システム、衛星通信などの無線技術および通信プロトコル、またはコンピューティング・デバイス200が、サーバ220に情報を送信し、サーバ220から情報を受信すること、例えば、特定の標的タンパク質構造データを選択し、もしくはそれぞれのデータベースから小分子薬剤構造データを指定することを可能にする任意の他の形式の通信を利用し得る。
ディスプレイ・デバイス258は、例えば、コンピュータ・モニタ、テレビ、スマート・テレビ、例えば、ラップトップ、スマート・フォン、スマート・ウォッチ、仮想現実ヘッドセット、スマート・ウェアラブル・デバイスなどのパーソナル・コンピューティング・デバイスに統合されたディスプレイ・スクリーン、またはユーザに情報を表示するための任意の他のメカニズムを含み得る。いくつかの態様において、ディスプレイ258は、液晶ディスプレイ(LCD)、eペーパ/eインク・ディスプレイ、有機LED(OLED)ディスプレイ、または他の類似のディスプレイ技術を含み得る。いくつかの態様において、ディスプレイ258は、タッチ感知型であってもよく、入力デバイスとしても機能してもよい。
入力デバイス259は、例えば、キーボード、マウス、タッチ感知型ディスプレイ、キーパッド、マイクロフォン、またはユーザにコンピューティング・デバイス200と対話する能力を提供するために単独で、もしくは一緒に使用され得る、他の類似の入力デバイスもしくは任意の他の入力デバイスを含み得る。
初期の薬剤開発段階において、製薬会社は、このシステム・フレームワーク200を使用して、薬剤候補についての潜在的なADRを予測し、関連する標的を識別し得る。したがって、それらは、ADRを回避するために、より安全である、またはリスクのある標的と結合しにくい他の候補を選んでもよい。さらに、販売後の段階において、製薬会社は、このシステム・フレームワーク200を使用して、あるADRについてのアクションのメカニズムを識別し得る。フレームワークによって関連する標的を研究することによって、それらは、これらの標的に関するADRへの感受性を変化させ得る遺伝子変異を見つけ得る。したがって、それらは、特定の遺伝子変異を有する患者に、リスクのある薬剤の使用を調整するように助言し得る(別名、精密医療)。
図14は、本発明による、例としてのコンピューティング・システムを示す。示されるコンピュータ・システムは、適当な処理システムの単なる1つの例であり、本発明の実施形態の使用または機能性の範囲に関するいかなる限定も示唆することを意図しないと理解されるべきである。例えば、示されるシステムは、多数の他の汎用または専用コンピューティング・システム環境または構成を用いて動作可能であってもよい。図14に示されるシステムを用いた使用に適当であり得る周知のコンピューティング・システム、環境、または構成、あるいはその組み合わせの例は、パーソナル・コンピュータ・システム、サーバ・コンピュータ・システム、シン・クライアント、シック・クライアント、手持ちまたはラップトップ・デバイス、マルチプロセッサ・システム、マイクロプロセッサベース・システム、セット・トップ・ボックス、プログラマブル家電、ネットワークPC、ミニコンピュータ・システム、メインフレーム・コンピュータ・システム、および上記システムまたはデバイスのうちのいずれかを含む分散型クラウド・コンピューティング環境などを含み得るが、これらに限定されない。
いくつかの実施形態において、コンピュータ・システムは、コンピュータ・システム実行可能命令の汎用コンテキストにおいて説明され、コンピュータ・システムによって実行されている、メモリ16に記憶されたプログラム・モジュールとして具現化されてもよい。概して、プログラム・モジュールは、特定のタスクを実行し、または本発明(例えば、図1参照)による特定の入力データもしくはデータ型またはその両方を実装し、あるいはその両方を行う、ルーチン、プログラム、オブジェクト、コンポーネント、ロジック、データ構造などを含み得る。
コンピュータ・システムのコンポーネントは、1以上のプロセッサまたは処理ユニット12、メモリ16、およびメモリ16を含む多様なシステム・コンポーネントをプロセッサ12に動作可能に連結するバス14を含み得るが、これらに限定されない。いくつかの実施形態において、プロセッサ12は、メモリ16からロードされる1以上のモジュール10を実行してもよく、そこで、プログラム・モジュールは、本発明の1以上の方法の実施形態をプロセッサに実行させるソフトウェア(プログラム命令)を具現化する。いくつかの実施形態において、モジュール10は、プロセッサ12の集積回路にプログラミングされ、メモリ16、記憶デバイス18、またはネットワーク24、あるいはそれらの組み合わせからロードされ得る。
バス14は、メモリ・バスまたはメモリ・コントローラ、周辺バス、高速グラフィック・ポート、および多様なバス・アーキテクチャのいずれかを使用するプロセッサまたはローカル・バスを含む複数の種類のバス構造のいずれかの1以上を表し得る。限定ではなく例として、そのようなアーキテクチャは、インダストリ・スタンダード・アーキテクチャ(ISA)・バス、マイクロ・チャネル・アーキテクチャ(MCA)・バス、拡張ISA(EISA)バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション(VESA)・ローカル・バス、およびペリフェラル・コンポーネント・インターコネクト(PCI)・バスを含む。
コンピュータ・システムは、多様なコンピュータ・システム可読媒体を含み得る。このような媒体は、コンピュータ・システムによってアクセス可能な任意の利用可能な媒体であってもよく、それは、揮発性媒体および不揮発性媒体の両方、リムーバブル媒体および非リムーバブル媒体の両方を含み得る。
メモリ16(システム・メモリと呼ばれることがある)は、ランダム・アクセス・メモリ(RAM)、キャッシュ・メモリ、または他の形式、あるいはその組み合わせなどの、揮発性メモリ形式のコンピュータ可読媒体を含み得る。コンピュータ・システムは、他のリムーバブル/非リムーバブル、揮発性/不揮発性コンピュータ・システム記憶媒体をさらに含み得る。単なる例として、記憶システム18は、非リムーバブル、不揮発性磁気媒体(例えば、「ハード・ドライブ」)から読み出しおよび書き込むために提供され得る。図示されないが、リムーバブル、不揮発性磁気ディスク(例えば、「フロッピー・ディスク」)からの読み出しおよび書き込みのための磁気ディスク・ドライブ、およびCD-ROM、DVD-ROM、または他の光学媒体などのリムーバブル、不揮発性光ディスクからの読み出しまたは書き込みのための光学ディスク・ドライブが、提供され得る。このような場合、それぞれが、1以上のデータ媒体インターフェースによってバス14に接続され得る。
コンピュータ・システムは、また、キーボード、ポインティング・デバイス、ディスプレイ28などの1つもしくは複数の外部デバイス26、ユーザがコンピュータ・システムと対話することを可能にする1つもしくは複数のデバイス、またはコンピュータ・システムが1つもしくは複数の他のコンピューティング・デバイスと通信することを可能にする任意のデバイス(例えば、ネットワーク・カード、モデムなど)、あるいはその組み合わせと通信し得る。このような通信は、入力/出力(I/O)インターフェース20を介して発生し得る。
さらに、コンピュータ・システムは、ネットワーク・アダプタ22を介して、ローカル・エリア・ネットワーク(LAN)、汎用ワイド・エリア・ネットワーク(WAN)、または公衆ネットワーク(例えば、インターネット)、あるいはその組み合わせなどの1以上のネットワーク24と通信し得る。図示されるように、ネットワーク・アダプタ22は、バス14を介してコンピュータ・システムの他のコンポーネントと通信する。図示されないが、ハードウェア・コンポーネントまたはソフトウェア・コンポーネント、あるいはその両方が、コンピュータ・システムと併せて使用され得ると理解されるべきである。例は、マイクロコード、デバイス・ドライバ、冗長処理ユニット、外部ディスク・ドライブ・アレイ、RAIDシステム、テープ・ドライブ、およびデータ・アーカイブ記憶システムなどを含むが、これらに限定されない。
本発明は、任意の可能な統合の技術的詳細レベルにおけるシステム、方法、またはコンピュータ・プログラム製品、あるいはその組み合わせであってもよい。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有するコンピュータ可読記憶媒体を含んでもよい。
コンピュータ可読記憶媒体は、命令実行デバイスによる使用のための命令を保持し、記憶し得る有形デバイスであり得る。コンピュータ可読記憶媒体は、例えば、電子記憶デバイス、磁気記憶デバイス、光学記憶デバイス、電磁気記憶デバイス、半導体記憶デバイス、または前述したものの任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ可読記憶媒体のより具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、消去可能プログラマブル読み取り専用メモリ(EPROMまたはフラッシュ・メモリ)、静的ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック、フロッピー・ディスク、パンチカードまたはその上に記録された命令を有する溝内の隆起構造などの機械的に符号化されたデバイス、および前述したものの任意の適当な組み合わせを含む。本明細書で用いられるコンピュータ可読記憶媒体は、本来、電波もしくは他の自由伝播する電磁波、導波管もしくは他の送信媒体を通って伝播する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、または電線を通って送信される電気信号などの、一過性信号であると解釈されるべきではない。
本明細書に記載されるコンピュータ可読プログラム命令は、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスに、またはネットワーク、例えば、インターネット、ローカル・エリア・ネットワーク、ワイド・エリア・ネットワーク、もしくはワイヤレス・ネットワーク、またはその組み合わせを介して外部コンピュータまたは外部記憶デバイスに、ダウンロードされ得る。ネットワークは、銅伝送ケーブル、光伝送ファイバ、ワイヤレス伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを含み得る。各コンピューティング/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェースは、コンピュータ可読プログラム命令をネットワークから受信し、それぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体の記憶のためにコンピュータ可読プログラム命令を転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、機械命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用の構成データ、またはSmalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語もしくは類似のプログラミング言語などの手続き型プログラミング言語を含む、1つもしくは複数のプログラミング言語の任意の組み合わせで書かれたソース・コードもしくはオブジェクト・コードのいずれかであってもよい。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で完全に、ユーザのコンピュータ上で部分的に、スタンドアロン・ソフトウェア・パッケージとして、ユーザのコンピュータ上で部分的かつリモート・コンピュータ上で部分的に、またはリモート・コンピュータもしくはサーバ上で完全に、実行してもよい。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN)またはワイド・エリア・ネットワーク(WAN)を含む任意の種類のネットワークを通して、ユーザのコンピュータに接続されてもよい。あるいは、接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを通して)外部コンピュータに対して行われてもよい。いくつかの実施形態では、例えば、プログラマブル・ロジック回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、またはプログラマブル・ロジック・アレイ(PLA)を含む電子回路は、本発明の態様を実行するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路を個別化することによって、コンピュータ可読プログラム命令を実行し得る。
本発明の態様は、本発明の実施形態による、方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して、本明細書において説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、およびフローチャート図またはブロック図あるいはその両方のブロックの組み合わせは、コンピュータ可読プログラム命令によって実施され得ると理解されたい。
コンピュータまたは他のプログラマブル・データ処理装置のプロセッサによって実行する命令が、フローチャートまたはブロック図あるいはその両方のブロックにおいて指定される機能/動作を実施する手段を作り出すように、これらのコンピュータ可読プログラム命令は、汎用コンピュータ、専用コンピュータ、または機械を製造するための他のプログラマブル・データ処理装置のプロセッサに提供されてもよい。コンピュータ可読記憶媒体に記憶される命令を有するコンピュータ可読記憶媒体が、フローチャートまたはブロック図あるいはその両方のブロックにおいて指定される機能/動作の態様を実施する命令を含む製品を含むように、これらのコンピュータ可読プログラム命令は、また、コンピュータ、プログラマブル・データ処理装置、または他のデバイス、あるいはその組み合わせが特定の方法で機能するように指示し得る、コンピュータ可読記憶媒体に記憶されてもよい。
コンピュータ、他のプログラマブル装置、または他のデバイス上で実行する命令が、フローチャートまたはブロック図あるいはその両方のブロックにおいて指定された機能/動作を実施するように、コンピュータ可読プログラム命令は、また、一連の動作ステップが、コンピュータ実施されたプロセスを生成するためにコンピュータ、他のプログラマブル装置、または他のデバイス上で実行されるようにするために、コンピュータ、他のプログラマブル・データ処理装置、または他のデバイス上にロードされてもよい。
図面中のフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータ・プログラム製品の考えられる実施のアーキテクチャ、機能性、および動作を示している。この点に関して、フローチャートまたはブロック図の各ブロックは、指定された論理機能を実施するための1以上の実行可能命令を含む、モジュール、セグメント、または命令の一部を表してもよい。いくつかの代替的な実施において、ブロック内に記載された機能は、図面中に記載された順序以外で発生してもよい。例えば、連続して示される2つのブロックが、実際には、実質的に同時に実行されてもよく、または、ブロックが、関係する機能性次第で、逆の順序で実行されることがあってもよい。ブロック図またはフローチャート図あるいはその両方の各ブロック、およびブロック図またはフローチャート図あるいはその両方におけるブロックの組み合わせが、指定された機能もしくは動作を実行し、または専用ハードウェアおよびコンピュータ命令の組み合わせを実行する専用ハードウェア・ベース・システムによって実施され得ることにも留意されたい。
本明細書で使用される用語は、単に特定の実施形態を説明する目的のためであり、発明を限定することを意図するものではない。本明細書で使用される、単数形「a(1つの)」、「an(1つの)」、および「the(その)」は、文脈が特段明示していない限り、複数形も同様に含むことを意図するものである。「comprises(備える)」、または「comprising(備えている)」、あるいはその両方という用語は、本明細書で使用されるとき、述べられた特徴、整数、ステップ、動作、要素、またはコンポーネント、あるいはその組み合わせの存在を明示するものであって、1以上の他の特徴、整数、ステップ、動作、要素、コンポーネント、またはそれらの集合、あるいはその組み合わせの存在または追加を排除するものではないと、さらに理解されたい。下記の特許請求の範囲における全ての要素の対応する構造、物質、動作、および均等物は、具体的に特許請求される他の特許請求される要素と組み合わせて機能を実行するための任意の構造、物質、または動作を含むように意図される。本発明の説明は、例示および説明の目的で提示されているが、網羅的であるように、または開示された形態に発明を限定されるように意図されない。多くの修正および変形が、本発明の範囲から逸脱することなく当業者には明らかである。実施形態は、発明の原理および実際の適用を最もよく説明するため、ならびに考えられる特定の用途に適する多様な修正を伴う多様な実施形態についての発明を他の当業者が理解できるようにするために、選択され説明された。

Claims (13)

  1. 薬剤についての薬物有害反応を自動的に予測する方法であって、
    プロセッサ、薬剤構造に関連付けられたデータを受信することと、
    前記プロセッサ、前記薬剤について複数の薬剤標的間相互作用特徴(drug-target interaction features)を計算することと、ここで、前記薬剤標的間相互作用特徴のそれぞれが、前記薬剤構造と複数の固有の高分解能標的タンパク質構造のそれぞれとの間のものである、
    前記プロセッサ、対応する1以上の既知の薬物有害反応(ADR:adverse drug reactions)に関連付けられた1以上の分類モデルそれぞれを用いて、前記薬剤と前記1以上の既知のADRが関与する前記薬剤標的間相互作用特徴に基づいて、1以上のADRを予測することと、ここで、前記1以上の分類モデルのそれぞれが、前記1以上の既知のADRのそれぞれに対応し、前記薬物標的間相互作用特徴及び対応する既知の薬物-ADR関係とに基づく対応するADRを予測する為に訓練されている、
    前記プロセッサ、予測された前記1以上のADRを示す出力を生成することと、
    を含み、
    前記訓練することが、
    前記プロセッサが、前記薬剤構造を行として、タンパク質を列として、前記薬剤構造と前記高分解能標的タンパク質との間の結合能に関連付けられた分子ドッキング・スコアを特徴として表すデータを含む、第1の特徴マトリクス(以下、第1のマトリクスという)を取り入れることと、
    前記プロセッサが、前記薬剤構造のそれぞれと薬物有害反応(ADR)との間の関係をマッピングすることと、
    前記プロセッサが、各ADRについて前記薬剤が前記ADRに関連付けられるかどうかを判定することと、
    前記プロセッサが、前記薬剤が前記ADRに関連付けられる場合に、第1のバイナリ値に従って薬剤とADRの対を分類すること、および前記薬剤が前記ADRに関連付けられない場合に、前記薬剤と前記ADRとの対を第2のバイナリ値に分類することと、
    前記プロセッサが、薬剤を行として、ADRを列として含むバイナリ・ラベル・マトリクス(以下、第2のマトリクスという)を取り入れることと、
    前記プロセッサが、前記第1のマトリクスおよび前記第2のマトリクスを用いて、前記分子ドッキング・スコアを特徴として用いて、各ADRについてロジスティック回帰分類モデルを生成することと
    を含む、
    前記 方法。
  2. 前記複数の薬剤標的間相互作用特徴を計算することが、
    前記プロセッサが、前記薬剤構造と前記高分解能標的タンパク質との間の結合能に関連付けられた前記分子ドッキング・スコアを生成することと、
    前記プロセッサが、前記薬剤について、計算された前記分子ドッキング・スコアに基づき前記高分解能標的タンパク質をランク付けすることと
    をさらに含む、請求項1に記載の方法。
  3. 薬剤構造に関する受信された前記データが、薬剤分子の2次元(2D)表現であり、
    前記方法が、
    前記プロセッサが、 前記2D薬剤分子表現を前記薬剤分子構造の3次元(3D)表現に変換することをさらに含み、前記薬剤標的間相互作用特徴のそれぞれが、前記3D薬剤構造と前記複数の固有の高分解能標的タンパク質構造のそれぞれの結合受容体との間のものである請求項1または2に記載の方法。
  4. 前記プロセッサ、前記薬剤標的間相互作用特徴のそれぞれ、および対応する既知の薬剤とADRとの関係に基づいて対応するADRを予測するために、前記1以上の既知のADRのそれぞれに対応するロジスティック回帰分類モデルを訓練することをさらに含む、請求項1ないしのいずれか一項に記載の方法。
  5. 前記ロジスティック回帰分類モデルを訓練することが、
    前記プロセッサ、複数の薬剤のそれぞれの構造に関するデータを受信することと、
    前記プロセッサ、前記複数のタンパク質標的のそれぞれの構造に関するデータを受信することと、
    前記プロセッサ、前記複数の薬剤のそれぞれと前記複数の標的との間の分子ドッキング・スコアを含む複数の薬剤標的間特徴を取得することと、
    前記プロセッサ、前記1以上の既知のADRのリストおよび対応する既知のADRと薬剤との関係を含むデータを取得することと、
    前記プロセッサ前記複数の薬剤のそれぞれと前記複数の標的との間の前記分子ドッキング・スコアおよび前記既知のADRと薬剤との関係に基づいてADRを予測するために、前記ロジスティック回帰分類モデルを訓練するための機械学習技術を実施することと
    を含む、請求項1ないし4のいずれか一項に記載の方法。
  6. 特定のADRについての各ロジスティック回帰分類モデルが、薬剤構造が前記特定のADRに関連付けられる信頼スコアを予測するために使用される、対応するロジスティック回帰関数を含み、
    記訓練することが、
    前記プロセッサ、特定のADR予測によって示される1以上のタンパク質標的に関連付けられた複数の対応する分子ドッキング・スコアの重み寄与を示す係数のセットを、対応するロジスティック回帰関数について生成すること
    をさらに含む、請求項1ないし5のいずれか一項に記載の方法。
  7. 前記プロセッサが、予測された前記ADRの原因の基礎となる標的タンパク質との相互作用を回避するために前記薬剤構造を修飾することをさらに含む、請求項1ないしのいずれか一項に記載の方法。
  8. 前記方法が、
    前記プロセッサが、ユーザ・インターフェースを介して、薬剤の入力を受け取ること
    をさらに含む、請求項1~7のいずれか1項に記載の方法。
  9. 前記薬剤の入力が、
    前記ユーザ・インターフェースを介して、薬剤リストタグを選択することによって、
    前記薬剤の1D文字列又は2D構造表現若しくはレンダリングを入力することによって、又は、
    前記薬剤の1D文字列若しくは2D構造表現又はレンダリングを入力し、それによって、該入力された1D文字列若しくは2D構造表現又はレンダリングから、3D分子オブジェクトを構成するツールを提供するコンピュータ実装アプリケーションにアクセスすることによって
    行われる、請求項8に記載の方法。
  10. 前記プロセッサが、前記薬剤と前記タンパク質との間の予測される結合立体構造を、ユーザ・インターフェースを介して可視化すること
    をさらに含む、請求項1~9のいずれか1項に記載の方法。
  11. 薬剤についての薬物有害反応を自動的に予測するシステムであって、
    少なくとも1つのメモリ記憶デバイスと、
    前記少なくとも1つのメモリ記憶デバイスに動作可能に接続された1以上のハードウェア・プロセッサと、を備え、前記1以上のハードウェア・プロセッサが、請求項1ないし10のいずれか一項に記載の方法の各ステップを実行する、前記システム。
  12. 薬剤についての薬物有害反応を自動的に予測する為のプログラムであって、 プロセッサに、請求項1ないし10のいずれか一項に記載の方法の各ステップを実行させる、前記プログラム。
  13. 薬剤についての薬物有害反応を自動的に予測する為のプログラムを記憶したコンピュータ可読記憶媒体であって、 プロセッサに、請求項1ないし10のいずれか一項に記載の方法の各ステップを実行させるためのプログラムを記憶した前記コンピュータ可読記憶媒体。
JP2020505477A 2017-08-08 2018-08-03 薬物有害反応の予測 Active JP7175455B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/671,898 2017-08-08
US15/671,898 US20190050537A1 (en) 2017-08-08 2017-08-08 Prediction and generation of hypotheses on relevant drug targets and mechanisms for adverse drug reactions
PCT/IB2018/055836 WO2019030627A1 (en) 2017-08-08 2018-08-03 PREDICTING ADVERSE REACTIONS TO A MEDICATION

Publications (3)

Publication Number Publication Date
JP2020530158A JP2020530158A (ja) 2020-10-15
JP2020530158A5 JP2020530158A5 (ja) 2021-02-12
JP7175455B2 true JP7175455B2 (ja) 2022-11-21

Family

ID=65271964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020505477A Active JP7175455B2 (ja) 2017-08-08 2018-08-03 薬物有害反応の予測

Country Status (5)

Country Link
US (2) US20190050537A1 (ja)
JP (1) JP7175455B2 (ja)
CN (1) CN110998739B (ja)
GB (1) GB2578265A (ja)
WO (1) WO2019030627A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190259482A1 (en) * 2018-02-20 2019-08-22 Mediedu Oy System and method of determining a prescription for a patient
WO2019173401A1 (en) 2018-03-05 2019-09-12 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for spatial graph convolutions with applications to drug discovery and molecular simulation
KR102604438B1 (ko) * 2018-03-05 2023-11-21 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 머신 러닝 및 분자 시뮬레이션에 기반한 결합 및 활성 예측 향상 방법
US20240020576A1 (en) * 2019-07-31 2024-01-18 BioSymetrics, Inc. Methods, systems, and frameworks for federated learning while ensuring bi directional data security
CN110534153B (zh) * 2019-08-30 2024-04-19 广州费米子科技有限责任公司 基于深度学习的靶标预测系统及其方法
US11664094B2 (en) 2019-12-26 2023-05-30 Industrial Technology Research Institute Drug-screening system and drug-screening method
CN111383708B (zh) * 2020-03-11 2023-05-12 中南大学 基于化学基因组学的小分子靶标预测算法及其应用
CN111599403B (zh) * 2020-05-22 2023-03-14 电子科技大学 一种基于排序学习的并行式药物-靶标相关性预测方法
CN111863281B (zh) * 2020-07-29 2021-08-06 山东大学 一种个性化药物不良反应预测系统、设备及介质
CN112133367B (zh) * 2020-08-17 2024-07-12 中南大学 药物与靶点间的相互作用关系预测方法及装置
CN112086145B (zh) * 2020-09-02 2024-04-16 腾讯科技(深圳)有限公司 一种化合物活性预测方法、装置、电子设备和存储介质
CN112466410B (zh) * 2020-11-24 2024-02-20 江苏理工学院 蛋白质与配体分子结合自由能的预测方法及装置
KR102457159B1 (ko) * 2021-01-28 2022-10-20 전남대학교 산학협력단 딥러닝 기반 화합물 의약 효과 예측 방법
US20220246233A1 (en) * 2021-02-03 2022-08-04 International Business Machines Corportion Structure-based, ligand activity prediction using binding mode prediction information
CN112863695B (zh) * 2021-02-22 2024-08-02 西京学院 基于量子注意力机制双向长短期记忆预测模型及提取方法
CN113160894B (zh) * 2021-04-23 2023-10-24 平安科技(深圳)有限公司 药物与靶标的相互作用预测方法、装置、设备及存储介质
CN113470741B (zh) * 2021-07-28 2023-07-18 腾讯科技(深圳)有限公司 药物靶标关系预测方法、装置、计算机设备及存储介质
CN113838541B (zh) * 2021-09-29 2023-10-10 脸萌有限公司 设计配体分子的方法和装置
CN114358202B (zh) * 2022-01-11 2024-10-15 平安科技(深圳)有限公司 基于药物分子图像分类的信息推送方法及装置
CN116597892B (zh) * 2023-05-15 2024-03-19 之江实验室 一种模型训练的方法以及分子结构信息的推荐方法及装置
CN116978451A (zh) * 2023-07-31 2023-10-31 苏州腾迈医药科技有限公司 分子对接预测方法及装置
CN117935984A (zh) * 2024-01-26 2024-04-26 苏州腾迈医药科技有限公司 分子运动的展示方法及装置、介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122750A (ja) 1994-10-31 2005-05-12 Akiko Itai 三次元構造データベースから新規リガンド化合物を検索するためのデータベースの作成方法
WO2016201575A1 (en) 2015-06-17 2016-12-22 Uti Limited Partnership Systems and methods for predicting cardiotoxicity of molecular parameters of a compound based on machine learning algorithms
US20170177803A1 (en) 2015-12-21 2017-06-22 International Business Machines Corporation Predicting drug-drug interactions and specific adverse events

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2600269A3 (en) * 2011-12-03 2013-12-04 Medeolinx, LLC Microarray sampling and network modeling for drug toxicity prediction
US9530095B2 (en) * 2013-06-26 2016-12-27 International Business Machines Corporation Method and system for exploring the associations between drug side-effects and therapeutic indications
CN105160206A (zh) * 2015-10-08 2015-12-16 中国科学院数学与系统科学研究院 一种预测药物的蛋白质相互作用靶点的方法和系统
CN105787261B (zh) * 2016-02-19 2018-09-28 厦门大学 一种基于分子指纹图谱快速评估药物不良反应的方法
CN106709272B (zh) * 2016-12-26 2019-07-02 西安石油大学 基于决策模板预测药物靶蛋白相互作用关系的方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122750A (ja) 1994-10-31 2005-05-12 Akiko Itai 三次元構造データベースから新規リガンド化合物を検索するためのデータベースの作成方法
WO2016201575A1 (en) 2015-06-17 2016-12-22 Uti Limited Partnership Systems and methods for predicting cardiotoxicity of molecular parameters of a compound based on machine learning algorithms
US20170177803A1 (en) 2015-12-21 2017-06-22 International Business Machines Corporation Predicting drug-drug interactions and specific adverse events

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Adverse Drug Reaction Prediction Using Scores Produced by Large-Scale Drug-Protein Target Docking on High-Performance Computing Machines,PLOS ONE,2014年09月05日,Vol. 9,p.1-13,URL : https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0106298,DOI : 10.1371/journal.pone.0106298

Also Published As

Publication number Publication date
CN110998739B (zh) 2024-02-20
US20190050537A1 (en) 2019-02-14
GB202001657D0 (en) 2020-03-25
US20190050538A1 (en) 2019-02-14
GB2578265A (en) 2020-04-22
CN110998739A (zh) 2020-04-10
WO2019030627A1 (en) 2019-02-14
JP2020530158A (ja) 2020-10-15

Similar Documents

Publication Publication Date Title
JP7175455B2 (ja) 薬物有害反応の予測
Nguyen et al. A comprehensive survey of regulatory network inference methods using single cell RNA sequencing data
Tran et al. Artificial intelligence in drug toxicity prediction: recent advances, challenges, and future perspectives
Gabel et al. Beware of Machine Learning-Based Scoring Functions On the Danger of Developing Black Boxes
Ma et al. Protein threading using context-specific alignment potential
McGibbon et al. MDTraj: a modern open library for the analysis of molecular dynamics trajectories
Nantasenamat et al. Maximizing computational tools for successful drug discovery
Zhang et al. Network biology in medicine and beyond
Singh et al. Artificial intelligence and machine learning in pharmacological research: bridging the gap between data and drug discovery
Ocaña et al. Parallel computing in genomic research: advances and applications
US11948667B2 (en) System and interfaces for processing and interacting with clinical data
US20220246233A1 (en) Structure-based, ligand activity prediction using binding mode prediction information
Partin et al. Learning curves for drug response prediction in cancer cell lines
Zheng et al. Quantitative prediction of hemolytic toxicity for small molecules and their potential hemolytic fragments by machine learning and recursive fragmentation methods
Hu et al. Improving DNA-binding protein prediction using three-part sequence-order feature extraction and a deep neural network algorithm
Czub et al. Artificial intelligence-based quantitative structure–property relationship model for predicting human intestinal absorption of compounds with serotonergic activity
Farzan Artificial intelligence in Immuno-genetics
Roche et al. E (3) equivariant graph neural networks for robust and accurate protein-protein interaction site prediction
Chelur et al. Birds-binding residue detection from protein sequences using deep resnets
Conev et al. 3pHLA-score improves structure-based peptide-HLA binding affinity prediction
Chavda et al. Bioinformatics Tools for Pharmaceutical Drug Product Development
Singh et al. Application of artificial intelligence in drug design: A review
Kim et al. Computational methods in glaucoma research: current status and future outlook
Chhina et al. Revolutionizing pharmaceutical industry: The radical impact of artificial intelligence and machine learning
Chavda et al. Introduction to Bioinformatics, AI, and ML for Pharmaceuticals

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201228

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220315

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20220614

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220614

RD12 Notification of acceptance of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7432

Effective date: 20220614

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20221019

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20221019

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221026

R150 Certificate of patent or registration of utility model

Ref document number: 7175455

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150