JP7404648B2 - 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム - Google Patents
治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム Download PDFInfo
- Publication number
- JP7404648B2 JP7404648B2 JP2019084188A JP2019084188A JP7404648B2 JP 7404648 B2 JP7404648 B2 JP 7404648B2 JP 2019084188 A JP2019084188 A JP 2019084188A JP 2019084188 A JP2019084188 A JP 2019084188A JP 7404648 B2 JP7404648 B2 JP 7404648B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- database
- protein
- relationship
- proteins
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 85
- 229940126585 therapeutic drug Drugs 0.000 title claims description 63
- 108090000623 proteins and genes Proteins 0.000 claims description 172
- 102000004169 proteins and genes Human genes 0.000 claims description 148
- 102000008300 Mutant Proteins Human genes 0.000 claims description 92
- 108010021466 Mutant Proteins Proteins 0.000 claims description 92
- 230000003993 interaction Effects 0.000 claims description 68
- 230000009471 action Effects 0.000 claims description 67
- 239000003814 drug Substances 0.000 claims description 40
- 229940124597 therapeutic agent Drugs 0.000 claims description 33
- 230000000694 effects Effects 0.000 claims description 21
- 238000010801 machine learning Methods 0.000 claims description 17
- 201000010099 disease Diseases 0.000 claims description 16
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 16
- 230000004850 protein–protein interaction Effects 0.000 description 34
- 230000037361 pathway Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 19
- 230000015654 memory Effects 0.000 description 13
- 229920000333 poly(propyleneimine) Polymers 0.000 description 13
- 229940079593 drug Drugs 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000007476 Maximum Likelihood Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000007721 medicinal effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 101710107904 NADH-ubiquinone oxidoreductase subunit 9 Proteins 0.000 description 2
- 101710132845 Protein P1 Proteins 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 101001100194 Drosophila melanogaster Heterogeneous nuclear ribonucleoprotein 87F Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 108010042653 IgA receptor Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102100034014 Prolyl 3-hydroxylase 3 Human genes 0.000 description 1
- 101710142276 Protein P21 Proteins 0.000 description 1
- 101710142283 Protein P25 Proteins 0.000 description 1
- 101710132807 Protein P5 Proteins 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013479 data entry Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002483 medication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
- G06F16/3328—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages using graphical result space presentation or visualisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
- G16B35/20—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Bioethics (AREA)
- Computing Systems (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Library & Information Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Chemical & Material Sciences (AREA)
- Algebra (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
しかし、世の中には、単一のデータベースのみからでは調べることができない情報間の関連性が存在していることが多い。
複数の要素と、前記複数の要素における2つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成し、
前記結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索する。
複数の要素と、前記複数の要素における2つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する作成部と、
前記結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索する探索部と、
を備える。
コンピュータに、
複数の要素と、前記複数の要素における2つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成させ、
前記結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索させる。
また、他の一つの側面では、単一のデータベースのみからでは調べることができない要素間の関連性を探索可能な関連性探索装置を提供できる。
また、他の一つの側面では、単一のデータベースのみからでは調べることができない要素間の関連性を探索可能な関連性探索プログラムを提供できる。
本件の関連性探索方法は、複数の要素と、複数の要素における2つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する。
関連性探索方法は、更に、結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索する。
関連性探索方法は、例えば、関連性があると判断された、直接に関連性がない2つの要素間の関連性を提示する。
作成部は、複数の要素と、複数の要素における2つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する。
探索部は、結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索する。
提示部は、関連性があると判断された、直接に関連性がない2つの要素間の関連性を提示する。
関連性探索プログラムは、更に、コンピュータに、結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索させる。
関連性探索プログラムは、例えば、更に、コンピュータに、直接に関連性がない2つの要素間の関連性を提示させる。
図1に、関連性を探索する方法の一例のフローチャートを示す。図2に、関連性探索装置1の構成図を示す。
まず、結合データベースの作成を行う(S101)。結合データベースの作成は、例えば、関連性探索装置1の作成部11において行われる。
工程S101では、例えば、図3Aに示すグラフ構造を有する第1のデータベースと、図3Bに示すグラフ構造を有する第2のデータベースとを結合し、図3Cに示すグラフ構造を有する結合データベースを作成する。
第1のデータベースは、要素e1~要素e3と、2つの要素間の関連性情報k1~関連性情報k3とを有する。図3Aに示すグラフ構造は、要素e1~要素e3をノードとし、関連性情報k1~関連性情報k3をエッジとするグラフ構造である。
第2のデータベースは、要素e2、要素e3、要素e11、及び要素e12と、2つの要素間の関連性情報k11~関連性情報k14とを有する。図3Bに示すグラフ構造は、要素e2、要素e3、要素e11、及び要素e12をノードとし、関連性情報k11~関連性情報k14をエッジとするグラフ構造である。
結合データベースの作成では、例えば、重複する要素を一つの要素に統合する。
そうすると、第1のデータベースと第2のデータベースとを結合した結合データベースでは、図3Cに示すように、要素e1、要素e2、要素e3、要素e11、及び要素e12と、2つの要素間の関連性情報k1、関連性情報k2、及び関連性情報k11~関連性情報k14とを有する。図3Cに示すグラフ構造は、要素e1、要素e2、要素e3、要素e11、及び要素e12をノードとし、関連性情報k1、関連性情報k2、及び関連性情報k11~関連性情報k14をエッジとするグラフ構造である。
なお、結合データベースを作成する際、2つの要素間に異なる関連性情報がある場合(例えば、要素e2、要素e3との間に、異なる関連性情報k3と関連性情報k11とがある場合)、どちらの関連性情報を用いて結合データベースを作成してもよい。また、関連性情報は、結合データベースを作成した後に、学習データを用いて、更新することが好ましい。
次に、結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索する(S102)。2つの要素間の関連性の探索は、例えば、関連性探索装置1の探索部12において行われる。
例えば、図3Cに示すグラフ構造を有する結合データベースを用いて、直接に関連性がない要素e1と要素e11との関連性を探索する。この関連性は、図3Aに示すグラフ構造を有する第1のデータベース単独、及び図3Bに示すグラフ構造を有する第2のデータベース単独では見いだせない関連性である。要素e1と要素e11との関連性の強さは、例えば、要素e1及び要素e11間の一つの経路に存在する複数の関連性情報の合計により算出される。
・タンパク質と、タンパク質間の相互作用情報とが収録されたデータベース
・人名と、人名間の友人関係とが収録されたデータベース
関連性探索方法、関連性探索装置、及び関連性探索プログラムは、既存の単一のデータベースからは調べることができない、治療薬の探索・推薦に用いることができる。
上記手順についてのコンピュータを用いた支援として、パスウェイデータベースからの検索を行うことで列挙を支援する方法、パスウェイの情報を利用して、ペトリネットなどの手法を用いてシミュレーションを行い、判断を支援する方法などが行われている。
しかし、これらの方法では、既知のパスウェイが前提となっている技術であるため、未知の薬効を発見できるものではない。
しかし、この方法で得られるものは、パスウェイのグラフ構造のみであり、既知のパスウェイに付随する分岐条件、合流条件など統計的に得られない情報が欠けている。
しかし、この方法では、複数のタンパク質の関係からなる(すなわち、経路長2以上の)パスについて推定を行うことはできない。
ここで、複数のデータベースは、以下(1)及び(2)の少なくともいずれかを満たす。
(1)複数のデータベースには、変異遺伝子から生成される変異タンパク質の情報を有するデータベース、及び治療薬が直接作用するターゲットタンパク質の情報を有するデータベースが含まれる。
(2)複数のデータベースには、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを有するデータベースが含まれる。
そのため、結合データベースは、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを有する。
治療薬提示方法においては、更に、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索する。
治療薬提示方法においては、更に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示する。
なお、タンパク質の情報とは、例えば、タンパク質名、アミノ酸配列などが挙げられる。
治療薬提示装置は、更に、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索する探索部を有する。
治療薬提示装置は、更に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示する提示部を有する。
治療薬提示プログラムにおいては、更に、コンピュータに、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索させる。
治療薬提示プログラムにおいては、更に、コンピュータに、治療薬提示方法においては、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示させる。
まず、結合データベースの作成を行う(S201)。結合データベースの作成は、例えば、治療薬提示装置2の作成部21において行われる。
工程S201では、例えば、図6Aに示すデータベースD1と、図6Bに示すデータベースD2とを結合し、図6Cに示す結合データベースD3を作成する。
図6Aは、治療薬と変異遺伝子との関係がリアクションパスウェイによって関係づけられたデータベースD1である。図6Aにおいて、P1~P5、P11~P15、P21~P25は、要素であるタンパク質を表す。図6Aにおいて、i1~i4、i11~i14、i21~i24は、リアクションパスウェイを構成する個々の関連性情報である、2つのタンパク質間の相互作用を示す相互作用情報(タンパク質-タンパク質相互作用、以下「PPI」と称することがある)を表す。タンパク質P1は、変異遺伝子1から生成される変異タンパク質である。タンパク質P11は、変異遺伝子2から生成される変異タンパク質である。タンパク質P21は、変異遺伝子3から生成される変異タンパク質である。タンパク質P5は、治療薬1が直接作用するターゲットffタンパク質である。タンパク質P15は、治療薬2が直接作用するターゲットタンパク質である。タンパク質P25は、治療薬3が直接作用するターゲットタンパク質である。
図6Bは、タンパク質P3、P13、P23と、PPI(i31、i32)とを有するデータベースD2である。
図6Cに示す結合データベースD3では、データベースD1にデータベースD2を加えたことにより、データベースD1には存在しなかった、以下の6種類の新しいパスが生成されている。
(i)P1-P15間のパス
(ii)P1-P25間のパス
(iii)P11-P5間のパス
(iv)P11-P25間のパス
(v)P21-P5間のパス
(vi)P21-P15間のパス
・Reactome:リアクションパスウェイのデータベース
・HiNT:タンパク質-タンパク質相互作用データベース(PPIデータベース)
・INstruct:タンパク質-タンパク質相互作用データベース(PPIデータベース)
・Guide To Pharmacology:治療薬と遺伝子のデータベース(治療薬が直接作用するターゲットタンパク質の情報を含んでいる)
次に、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索する(S202)。変異タンパク質と、ターゲットタンパク質との関係性の探索は、例えば、治療薬提示装置11の探索部12において行われる。
例えば、図6Cに示す結合データベースD3を用いて、変異タンパク質とターゲットタンパク質との関係性を探索する。ここでの関係性とは、例えば、ターゲットタンパク質が変異タンパク質に及ぼす影響が挙げられる。そのような影響の強さは、例えば、変異タンパク質とターゲットタンパク質との間の経路に存在する複数の相互作用情報を統合して得られる。
例えば、変異タンパク質であるタンパク質P1と、ターゲットタンパク質であるタンパク質P15との間には、図7に示すように、5つのPPI(i1、i2、i31、i13、i14)が存在する。そして、例えば、個々の相互作用の相対的な強さを作用確率とし、その作用確率が図7に示すような確率であった場合、ターゲットタンパク質であるタンパク質P15との間のパスの作用確率は以下のように求められる。
パス作用確率=0.5×0.8×0.9×0.8×0.4=0.1152
変異タンパク質と、ターゲットタンパク質との関係性の探索は、例えば、存在する変異タンパク質-ターゲットタンパク質間の全てのパスについて行われてもよい。また、変異タンパク質と、ターゲットタンパク質との関係性の探索は、特定の変異タンパク質と、ターゲットタンパク質との間の全てのパスについて行われてもよい。
なお、作用確率の設定方法については、後述する。
次に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示する(S203)。当該提示は、例えば、治療薬提示装置11の提示部13において行われる。
具体的には、例えば、特定の変異タンパク質-ターゲットタンパク質間の全てのパスについて求められたパス作用確率を一覧として表示することにより行われる。例えば、変異タンパク質1に起因する疾患に有効な治療薬を提示する場合、変異タンパク質1-ターゲットタンパク質(P1、P15、P25)間の全てのパスについて求められた個々のパス作用確率を、図8に示すように、パス作用確率の数値が大きいものから順に並べた降順リストを作成し、表示する。
なお、特定の変異タンパク質と特定のターゲットタンパク質との間に複数のパスが存在する場合には、複数のパスから求められる複数のパス作用確率のうちで最も大きいパス作用確率を、特定の変異タンパク質と特定のターゲットタンパク質とのパス作用確率を代表するパス作用確率としてもよい(最尤推定)。
距離=C0・-log(作用確率)
なお、作用確率の高低を求める目的には定数C0の計算は不要である。
以下に、工程S201におけるデータベースの結合の変形例を示す。
図6A~図6Cを用いた説明では、治療薬と変異遺伝子との関係がリアクションパスウェイによって関係づけられたデータベースD1を用いた。本変形例では、変異遺伝子から生成される変異タンパク質の情報を有するデータベースと、治療薬が直接作用するターゲットタンパク質の情報を有するデータベースと、2つのタンパク質間の相互作用を示す相互作用情報を有するデータベースを用いる。
図9Aに示すデータベースは、変異遺伝子から生成される変異タンパク質の情報と、変異タンパク質と相互作用するタンパク質の情報と、変異タンパク質とタンパク質との相互作用情報とを有するデータベースD4である。図9Aにおいて、P31、P32、P41、P42、P51、P52は、タンパク質を表す。図9Aにおいて、i41、i51、i61は、相互作用情報を表す。タンパク質P31は、変異遺伝子4から生成される変異タンパク質である。タンパク質P41は、変異遺伝子5から生成される変異タンパク質である。タンパク質P51は、変異遺伝子6から生成される変異タンパク質である。
図9Bに示すデータベースは、タンパク質の情報と、2つのタンパク質間の相互作用情報とを有するデータベースD5である。図9Bにおいて、P31、P32、P33、P34、P35、P42、P43、P44、P45、P52、P53は、タンパク質を表す。図9Bにおいて、i41、i42、i43、i44、i52、i53、i54、i62、i71、i72は、相互作用情報を表す。
図9Cに示すデータベースは、治療薬が直接作用するターゲットタンパク質の情報と、ターゲットタンパク質と相互作用するタンパク質の情報と、ターゲットタンパク質とタンパク質との相互作用情報とを有するデータベースD6である。図9Cにおいて、P34、P35、P44、P45、P54、P55は、タンパク質を表す。図9Cにおいて、i44、i54、i64は、相互作用情報を表す。
図9A、図9B、及び図9Cのデータベースを結合すると、図9Dに示す結合データベースが得られる。
工程202において、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索する際には、例えば、変異タンパク質とターゲットタンパク質との間の経路に存在する複数の相互作用情報から、変異タンパク質とターゲットタンパク質との相互作用の相対的な強さを求める。その際、個々の相互作用の相対的な強さ(個々の相互作用情報)である作用確率の積から、パス作用確率を求める。
その際の個々の作用確率は、例えば、ベイズ推定による機械学習により設定することができる。その方法の一例を以下に示す。
図10は、作用確率の設定の一例を説明するためのフローチャートである。
まず、準備段階として、複数のデータベースを結合して、結合データベースを作成する(S301)。図11Aは、データベースを結合する様子の概念図である。図11Aにおいては、リアクションパスウェイデータベース(DB)として、Reactomeを用い、PPIデータベースとしてHINT及びINstructを用いる。
結合データベースの構造は、例えば、タンパク質をノードとし、タンパク質-タンパク質相互作用(PPI)をエッジとするグラフ構造であり、グラフ構造の規模としては、例えば、ノード数が数万となり、エッジ数が数十万となる。
作用確率の学習の準備段階(その1)として、結合データベースに対して、タンパク質-タンパク質相互作用(PPI)に作用確率の初期値を設定する(S302)。
この場合、各エッジの真の値は大きく異なる可能性があるため単一の初期値を与えることは危険である。また、作用確率を推定するうえで、訓練データとなる薬や症例ごとの薬効データには大きなバラつきがあるため、訓練データの多寡に応じて推定の精度を制御する必要がある。
そこで、作用確率としては単一の推定値を与えるのではなく、推定値の確率分布を与えることが好ましい。作用自体は有無を表すベルヌーイ分布で記述されるため、作用確率を表す確率分布はベルヌーイ分布の共役事前分布であるベータ分布を採ると利便性が高い(図11B)。図11Bは、タンパク質-タンパク質相互作用(PPI)に作用確率の初期値としてベータ分布を付与した状態を表す概念図である。
したがって、PPIの作用確率に事前分布としてベータ分布Be(αPPI,βPPI)を割り当てる。αPPIとβPPIは分布のパラメータであり、期待値が0.1などの低い値となるように設定する。その確率密度関数は以下で表される〔ただし、Β(,)はベータ関数〕。
次に、作用確率の学習の準備段階(その2)として、既知のリアクションパスウェイ中のPPIの作用確率の事前分布を設定する。これは、既知のリアクションパスウェイは有効な薬効の機序となりえる有用性が高いため、既知のリアクションパスウェイ中のPPIの作用確率には高い事前分布を与えることが好ましいためである。ここで、既知のリアクションパスウェイは、パスウェイDBであるReactomeに収録された情報である。
既知のリアクションパスウェイ中に現れるPPIごとに、その作用確率を、ある程度高い確率、及び適切に設定した試行数で、ベイズ更新を行う(S303)。事前分布がベータ分布の確率密度関数fprior(x;α,β)で表されるとき、成功率r(例えば、r=0.99)、試行数n(例えば、n=0.1)の試行を経ることによりベイズ更新された事後確率の密度関数はベイズの定理により次式のfposterior(x;α,β)で求められる。これは閉じた形式で解けるため、計算は容易である。αは、薬効があった数を表し、βは、薬効がなかった数を表す。
リアクションパスウェイ中のPPIと類似するPPIは、リアクションパスウェイのPPIと同様に振る舞うことが期待される。それが学習データに含まれないPPIであれば、未知の薬効を推定するための手がかりとなりえる。類似するPPIとしては、例えば、リアクションパスウェイ中のPPIと同じドメイン間相互作用を持つPPIが挙げられる。ここでは、「同じドメイン間相互作用を持つPPIは似ている」という仮定を適用している。類似PPIの判定には、例えば、INstructデータベースのタンパク質ドメイン間相互作用の情報を用いる。
そこで、リアクションパスウェイのPPIによるベイズ更新の際には、そのPPIの類似PPIも弱く(=試行数を減じて)ベイズ更新する(S304)。例えば、成功率r(例えば、r=0.99)、試行数n(例えば、n=0.001)の試行を行う。そうすることで、知識の転用を行う。
学習段階として、学習データを用いて学習を行う(S305)。
学習は、例えば、以下の方法で行う。図11Dは、以下の方法により、学習データを用いて学習を行う状態を表す概念図である。図12は、以下の学習のフローチャートである。以下に、図12のフローチャートを用いて、学習データを用いた学習の一例を説明する。
DGIdbデータベースとGuideToPharmacologyデータベースを用いて、既知の薬効のある変異タンパク質とターゲットタンパク質のペアの学習データを用意する(S401)。
次に、学習データから1エントリを選び、変異タンパク質とターゲットタンパク質とのパスを最尤推定する(S402)。これは、最短経路問題を解くことと等価である。
最尤推定したパス上のPPIに対し、ある程度高い確率と適切に設定した試行数でベイズ更新を行う(S403)。例えば、成功率r(例えば、r=0.99)、試行数n(例えば、n=0.3)の試行を行う。
工程S304と同様に、類似PPIについても弱くベイズ更新を行う(S404)。
工程S402~工程S404を、全エントリについて繰り返す(S405)。
ある変異タンパク質を選び、全てのターゲットタンパク質へのパス作用確率を列挙し、正例(学習データに存在するターゲットタンパク質)のパス作用確率が非正例のパス作用確率より低い場合、その正例のパスに属するPPIを比較的高い確率でベイズ更新する(S406)。例えば、成功率r(例えば、r=0.99)、試行数n(例えば、n=0.3)の試行を行う。
全ての変異タンパク質について工程S406を繰り返す(S407)。
ある変異タンパク質を選び、全てのターゲットタンパク質へのパス作用確率を列挙し、非正例のパス作用確率が正例のパス作用確率より高い場合、その非正例のパスに属するPPIを比較的低い確率でベイズ更新する(S408)。例えば、成功率r(例えば、r=0.10)、試行数n(例えば、n=0.3)の試行を行う。
全ての変異タンパク質について工程S409を繰り返す(S409)。
評価値(例えば、後述するRecall@kの平均)を求める(S410)。
そして、評価が改善している間、工程S402~工程S410を繰り返す。
ここで、Recall@kはデータ中の全正解のうち、上位k個までに正解の何%が含まれるかを表す性能評価指標である。値が大きいほど正確であることを意味する。
例えば、図13のようなPPIがあり、変異タンパクAからターゲットタンパクBという学習データのエントリが現れた場合、最初はA-X-Bというパスが選ばれる
このとき、真のパスがA-Z-Y-Bであった場合、最初に選ばれたパスは誤りである。もし、最初にA-X-BというパスのPPIにあまりにも高い確率を割り当てた場合、A-Z-Y-Bというパスは二度と辿られることは無くなってしまう。
もし、確率の変更が少しであれば、他の学習データから、A-Z,Z-Y,Y-BのPPIが高確率に学習されるチャンスが残る。これは誤った局所解に落ちて脱出できないという状態を避けることを意味する。
関連性探索方法、関連性探索装置、及び関連性探索プログラムは、既存の単一のデータベースからは調べることができない、友人関係の探索にも用いることができる。
しかし、SNS同士をまたいで友人関係の探索を行うことはできない。
友人探索方法においては、更に、結合データベースを用いて、直接に関連性がない2人の間の関連性を探索する。
友人探索方法においては、例えば、更に、関連性があると判断された、直接に関連性がない2人の間の関連性を提示する。
友人探索装置においては、更に、結合データベースを用いて、直接に関連性がない2人の間の関連性を探索する探索部を有する。
友人探索装置においては、例えば、更に、関連性があると判断された、直接に関連性がない2人の間の関連性を提示する提示部を有する。
友人探索プログラムにおいては、更に、結合データベースを用いて、直接に関連性がない2人の間の関連性を探索させる。
友人探索プログラムにおいては、例えば、更に、関連性があると判断された、直接に関連性がない2人の間の関連性を提示させる。
図14に、友人関係を探索する方法の一例のフローチャートを示す。図15に、友人探索装置3の構成図を示す。
まず、結合データベースの作成を行う(S501)。結合データベースの作成は、例えば、友人探索装置3の作成部21において行われる。
工程S501では、例えば、図16Aに示すグラフ構造を有する第1のデータベースと、図16Bに示すグラフ構造を有する第2のデータベースとを結合し、図16Cに示すグラフ構造を有する結合データベースを作成する。
第1のデータベースは、人情報h1~人情報h3と、2人の間の直接の関連性を示す関連性情報y1~関連性情報y3とを有する。図16Aに示すグラフ構造は、人情報h1~人情報h3をノードとし、関連性情報y1~関連性情報y3をエッジとするグラフ構造である。
第2のデータベースは、人情報h2、人情報h3、人情報h11、及び人情報h12と、2人の間の直接の関連性を示す関連性情報y11~関連性情報y14とを有する。図16Bに示すグラフ構造は、人情報h2、人情報h3、人情報h11、及び人情報h12をノードとし、2人の間の直接の関連性を示す関連性情報y11~関連性情報y14をエッジとするグラフ構造である。
結合データベースの作成では、例えば、重複する人情報を一つの人情報に統合する。
そうすると、第1のデータベースと第2のデータベースとを結合した結合データベースでは、図16Cに示すように、人情報h1、人情報h2、人情報h3、人情報h11、及び人情報h12と、2人の間の直接の関連性を示す関連性情報y1、関連性情報y2、及び関連性情報y11~関連性情報y14とを有する。図16Cに示すグラフ構造は、人情報h1、人情報h2、人情報h3、人情報h11、及び人情報h12をノードとし、関連性情報y1、関連性情報y2、及び関連性情報y11~関連性情報y14をエッジとするグラフ構造である。
なお、結合データベースを作成する際、2人の間の直接の関連性を示す関連性情報がある場合(例えば、人情報h2、人情報h3との間に、異なる関連性情報y3と関連性情報y11とがある場合)、どちらの関連性情報を用いて結合データベースを作成してもよい。
次に、結合データベースを用いて、直接に関連性がない2人の間の関連性を探索する(S502)。2人の間の関連性の探索は、例えば、友人探索装置3の探索部32において行われる。
例えば、図16Cに示すグラフ構造を有する結合データベースを用いて、直接に関連性がない人情報h1と人情報h11との関連性を探索する。この関連性は、図16Aに示すグラフ構造を有する第1のデータベース単独、及び図16Bに示すグラフ構造を有する第2のデータベース単独では見いだせない関連性である。人情報h1と人情報h11との関連性の強さは、例えば、人情報h1及び人情報h11間の一つの経路に存在する複数の関連性情報の合計により算出される。
次に、関連性があると判断された、直接に関連性がない2人の間の関連性を提示する(S503)。提示は、例えば、友人探索装置3の提示部33において行われる。
例えば、関連性の提示としては、例えば、共通する趣味、共通する友人の数の提示などが挙げられる。
プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。
コンピュータが読み取り可能な記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、CD-ROM、DVD-ROM、MOディスク、USBメモリなどが挙げられる。
記録媒体は、プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。
関連性探索装置10は、例えば、CPU11、メモリ12、記憶部13、表示部14、入力部15、出力部16、I/Oインターフェース部17等がシステムバス18を介して接続されて構成される。
プログラムは、記憶部13に格納され、メモリ12のRAM(主メモリ)にロードされ、CPU11により実行される。
入力部15は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス(例えば、マウス等)などである。
出力部16は、各種データの出力装置であり、例えば、プリンタである。
I/Oインターフェース部17は、各種の外部装置を接続するためのインターフェースである。例えば、CD-ROM、DVD-ROM、MOディスク、USBメモリなどのデータの入出力を可能にする。
図18の一例は、クラウド型の構成例であり、CPU11が、記憶部13等とは独立している。この構成例では、ネットワークインターフェース部19、20を介して、記憶部13等を格納するコンピュータ30と、CPU11を格納するコンピュータ40とが接続される。
ネットワークインターフェース部19、20は、インターネットを利用して、通信を行うハードウェアである。
図19の一例は、クラウド型の構成例であり、記憶部13が、CPU11等とは独立している。この構成例では、ネットワークインターフェース部19、20を介して、CPU11等を格納するコンピュータ30と、記憶部13を格納するコンピュータ40とが接続される。
(付記1)
複数の要素と、前記複数の要素における2つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成し、
前記結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索することを特徴とする関連性探索方法。
(付記2)
前記結合データベースの構造が、前記要素をノードとし、前記関連性情報をエッジとするグラフ構造である付記1に記載の関連性探索方法。
(付記3)
前記関連性があると判断された、前記直接に関連性がない2つの要素間の関連性を提示する付記1から2のいずれかに記載の関連性探索方法。
(付記4)
治療薬提示方法であって、
前記複数の要素が、複数のタンパク質の情報であり、
前記関連性情報が、前記複数のタンパク質における2つのタンパク質間の相互作用を示す相互作用情報であり、
前記複数のデータベースが、以下(1)及び(2)の少なくともいずれかを満たし、
前記関連性を探索することが、変異タンパク質と、ターゲットタンパク質との関係性を探索することであり、
更に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示することを含む、付記1から2のいずれかに記載の関連性探索方法。
(1)前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報を有するデータベース、及び治療薬が直接作用する前記ターゲットタンパク質の情報を有するデータベースが含まれる。
(2)前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報と、治療薬が直接作用する前記ターゲットタンパク質の情報とを有するデータベースが含まれる。
(付記5)
前記結合データベースにおける個々の前記相互作用情報が、相互作用の相対的な強さを表す作用確率であり、
前記作用確率が、機械学習により設定される付記4に記載の関連性探索方法。
(付記6)
前記機械学習が、ベイズ推定による機械学習であり、
前記作用確率の初期値をベータ分布などの確率分布とし、高い作用確率を与える対象の相互作用情報の作用確率の初期値をベイズ更新した後に、学習データを用いて学習を行う、付記5に記載の関連性探索方法。
(付記7)
前記機械学習の際、更に、高い作用確率を与える対象の前記相互作用情報と類似する相互作用情報の作用確率の初期値に対して、高い作用確率を与える対象の前記相互作用情報の前記作用確率の前記初期値の前記ベイズ更新よりも弱いベイズ更新を行う、付記6に記載の関連性探索方法。
(付記8)
友人探索方法であって、
前記複数の要素が、複数の人の情報であり、
前記関連性情報が、前記複数の人における2人の間の直接の関連性を示す関連性情報であり、
前記関連性を探索することが、直接に関連性がない2人の間の関連性を探索することであり、
更に、前記関連性があると判断された、前記直接に関連性がない2人の間の関連性を提示することを含む、付記1に記載の関連性探索方法。
(付記9)
複数の要素と、前記複数の要素における2つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する作成部と、
前記結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索する探索部と、
を備えることを特徴とする関連性探索装置。
(付記10)
前記結合データベースの構造が、前記要素をノードとし、前記関連性情報をエッジとするグラフ構造である付記9に記載の関連性探索装置。
(付記11)
前記関連性があると判断された、前記直接に関連性がない2つの要素間の関連性を提示する提示部を有する付記9から10のいずれかに記載の関連性探索装置。
(付記12)
治療薬提示装置であって、
前記複数の要素が、複数のタンパク質の情報であり、
前記関連性情報が、複数のタンパク質における2つのタンパク質間の相互作用を示す相互作用情報であり、
前記複数のデータベースが、以下(1)及び(2)の少なくともいずれかを満たし、
前記関連性を探索することが、変異タンパク質と、ターゲットタンパク質との関係性を探索することであり、
更に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示する提示部を備える、付記9から10のいずれかに記載の関連性探索装置。
(1)前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報を有するデータベース、及び治療薬が直接作用する前記ターゲットタンパク質の情報を有するデータベースが含まれる。
(2)前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報と、治療薬が直接作用する前記ターゲットタンパク質の情報とを有するデータベースが含まれる。
(付記13)
前記結合データベースにおける個々の前記相互作用情報が、相互作用の相対的な強さを表す作用確率であり、
前記作用確率が、機械学習により設定される付記12に記載の関連性探索装置。
(付記14)
前記機械学習が、ベイズ推定による機械学習であり、
前記作用確率の初期値をベータ分布などの確率分布とし、高い作用確率を与える対象の相互作用情報の作用確率の初期値をベイズ更新した後に、学習データを用いて学習を行う、付記13に記載の関連性探索装置。
(付記15)
前記機械学習の際、更に、高い作用確率を与える対象の前記相互作用情報と類似する相互作用情報の作用確率の初期値に対して、高い作用確率を与える対象の前記相互作用情報の前記作用確率の前記初期値の前記ベイズ更新よりも弱いベイズ更新を行う、付記14に記載の関連性探索装置。
(付記16)
友人探索装置であって、
前記複数の要素が、複数の人の情報であり、
前記関連性情報が、前記複数の人における2人の間の直接の関連性を示す関連性情報であり、
前記関連性を探索することが、直接に関連性がない2人の間の関連性を探索することであり、
更に、前記関連性があると判断された、前記直接に関連性がない2人の間の関連性を提示する提示部を備える、付記9に記載の関連性探索装置。
(付記17)
コンピュータに、
複数の要素と、前記複数の要素における2つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成させ、
前記結合データベースを用いて、直接に関連性がない2つの要素間の関連性を探索させる、
ことを特徴とする関連性探索プログラム。
(付記18)
前記結合データベースの構造が、前記要素をノードとし、前記関連性情報をエッジとするグラフ構造である付記17に記載の関連性探索プログラム。
(付記19)
前記関連性があると判断された、前記直接に関連性がない2つの要素間の関連性を提示する付記17から18のいずれかに記載の関連性探索プログラム。
(付記20)
治療薬提示プログラムであって、
前記複数の要素が、複数のタンパク質の情報であり、
前記関連性情報が、複数のタンパク質における2つのタンパク質間の相互作用を示す相互作用情報であり、
前記複数のデータベースが、以下(1)及び(2)の少なくともいずれかを満たし、
前記関連性を探索することが、変異タンパク質と、ターゲットタンパク質との関係性を探索することであり、
更に、コンピュータに、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示させる、付記17から18のいずれかに記載の関連性探索プログラム。
(1)前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報を有するデータベース、及び治療薬が直接作用する前記ターゲットタンパク質の情報を有するデータベースが含まれる。
(2)前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報と、治療薬が直接作用する前記ターゲットタンパク質の情報とを有するデータベースが含まれる。
(付記21)
前記結合データベースにおける個々の前記相互作用情報が、相互作用の相対的な強さを表す作用確率であり、
前記作用確率が、機械学習により設定される付記20に記載の関連性探索プログラム。
(付記22)
前記機械学習が、ベイズ推定による機械学習であり、
前記作用確率の初期値をベータ分布などの確率分布とし、高い作用確率を与える対象の相互作用情報の作用確率の初期値をベイズ更新した後に、学習データを用いて学習を行う、付記21に記載の関連性探索プログラム。
(付記23)
前記機械学習の際、更に、高い作用確率を与える対象の前記相互作用情報と類似する相互作用情報の作用確率の初期値に対して、高い作用確率を与える対象の前記相互作用情報の前記作用確率の前記初期値の前記ベイズ更新よりも弱いベイズ更新を行う、付記22に記載の関連性探索プログラム。
(付記24)
友人探索プログラムであって、
前記複数の要素が、複数の人の情報であり、
前記関連性情報が、前記複数の人における2人の間の直接の関連性を示す関連性情報であり、
前記関連性を探索することが、直接に関連性がない2人の間の関連性を探索することであり、
更に、コンピュータに、前記関連性があると判断された、前記直接に関連性がない2人の間の関連性を提示させることを含む、付記17から18のいずれかに記載の関連性探索プログラム。
2 治療薬提示装置
3 友人探索装置
11 作成部
21 作成部
31 作成部
12 探索部
22 探索部
23 提示部
33 提示部
Claims (6)
- プログラムされたコンピュータによって治療薬の関連性を探索して提示する治療薬提示方法であって、
複数のタンパク質の情報と、前記複数のタンパク質における2つのタンパク質間の相互作用を示す相互作用情報とをそれぞれに備える、以下(1)及び(2)の少なくともいずれかを満たす複数のデータベースを結合して、前記タンパク質の情報をノードとし、前記相互作用情報をエッジとするグラフ構造を有する結合データベースを作成し、
(1)前記複数のタンパク質の情報が、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報を有するデータベース、及び前記ターゲットタンパク質の情報を有するデータベースを含む
(2)前記複数のタンパク質の情報が、前記変異タンパク質の情報と、前記治療薬が直接作用する前記ターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報とを有するデータベースを含む
前記結合データベースを用いて、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報との関係性を探索し、
前記変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、前記変異タンパク質に起因する疾患の治療薬として提示することを特徴とする治療薬提示方法。 - 前記結合データベースにおける個々の前記相互作用情報が、相互作用の相対的な強さを表す作用確率であり、
前記作用確率が、機械学習により設定される請求項1に記載の治療薬提示方法。 - 前記機械学習が、ベイズ推定による機械学習であり、
前記作用確率の初期値を、作用確率を表す確率分布とし、高い作用確率を与える対象の相互作用情報の作用確率の初期値をベイズ更新した後に、学習データを用いて学習を行う、請求項2に記載の治療薬提示方法。 - 前記機械学習の際、更に、高い作用確率を与える対象の前記相互作用情報と類似する相互作用情報の作用確率の初期値に対して、高い作用確率を与える対象の前記相互作用情報の前記作用確率の前記初期値の前記ベイズ更新よりも弱いベイズ更新を行う、請求項3に記載の治療薬提示方法。
- 複数のタンパク質の情報と、前記複数のタンパク質における2つのタンパク質間の相互作用を示す相互作用情報とをそれぞれに備える、以下(1)及び(2)の少なくともいずれかを満たす複数のデータベースを結合して、前記タンパク質の情報をノードとし、前記相互作用情報をエッジとするグラフ構造を有する結合データベースを作成する作成部と、
(1)前記複数のタンパク質の情報が、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報を有するデータベース、及び前記ターゲットタンパク質の情報を有するデータベースを含む
(2)前記複数のタンパク質の情報が、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報とを有するデータベースを含む
前記結合データベースを用いて、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報との関係性を探索する探索部と、
前記変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、前記変異タンパク質に起因する疾患の治療薬として提示する提示部と、
を備えることを特徴とする治療薬提示装置。 - コンピュータに、
複数のタンパク質の情報と、前記複数のタンパク質における2つのタンパク質間の相互作用を示す相互作用情報とをそれぞれに備える、以下(1)及び(2)の少なくともいずれかを満たす複数のデータベースを結合して、前記タンパク質の情報をノードとし、前記相互作用情報をエッジとするグラフ構造を有する結合データベースを作成させ、
(1)前記複数のタンパク質の情報が、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報を有するデータベース、及び前記ターゲットタンパク質の情報を有するデータベースを含む
(2)前記複数のタンパク質の情報が、前記変異タンパク質の情報と、前記治療薬が直接作用する前記ターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報とを有するデータベースを含む
前記結合データベースを用いて、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報との関係性を探索させ、
前記変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、前記変異タンパク質に起因する疾患の治療薬として提示させる、
ことを特徴とする治療薬提示プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019084188A JP7404648B2 (ja) | 2019-04-25 | 2019-04-25 | 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム |
US16/850,631 US11615125B2 (en) | 2019-04-25 | 2020-04-16 | Relevance searching method, relevance searching apparatus, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019084188A JP7404648B2 (ja) | 2019-04-25 | 2019-04-25 | 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020181378A JP2020181378A (ja) | 2020-11-05 |
JP7404648B2 true JP7404648B2 (ja) | 2023-12-26 |
Family
ID=72921670
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019084188A Active JP7404648B2 (ja) | 2019-04-25 | 2019-04-25 | 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11615125B2 (ja) |
JP (1) | JP7404648B2 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002040913A (ja) | 2000-07-28 | 2002-02-08 | Katsunori Nonogaki | 分子生物学的学習システム |
JP2003203078A (ja) | 2001-10-19 | 2003-07-18 | Mitsubishi Electric Corp | 生理機能解析方法及びシステム |
JP2005267282A (ja) | 2004-03-18 | 2005-09-29 | Kitakyushu Foundation For The Advancement Of Industry Science & Technology | 研究遺伝子産物関連度予測システム |
JP2009070096A (ja) | 2007-09-12 | 2009-04-02 | Michio Kimura | ゲノム情報と臨床情報との統合データベースシステム、および、これが備えるデータベースの製造方法 |
JP2010066814A (ja) | 2008-09-08 | 2010-03-25 | Nippon Telegr & Teleph Corp <Ntt> | トピック友人距離測定装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 |
JP2014235474A (ja) | 2013-05-31 | 2014-12-15 | 国立大学法人京都大学 | 関係性グラフ相互連携システム |
JP2018139111A (ja) | 2013-01-29 | 2018-09-06 | モレキュラー ヘルス ゲーエムベーハー | 臨床判断支援のためのシステムおよび方法 |
JP2019507444A (ja) | 2015-12-07 | 2019-03-14 | データフォーキュア、インク. | 測定データおよびテキストからオントロジーベースの動的学習および知識統合を行う方法およびシステム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100491666B1 (ko) * | 2002-09-23 | 2005-05-27 | 학교법인 인하학원 | 단백질 상호작용 네트웍의 분할 시각화 기법 |
KR100470977B1 (ko) * | 2002-09-23 | 2005-03-10 | 학교법인 인하학원 | 대규모 단백질 상호작용 데이터의 효율적 시각화 기법 |
JP2007128163A (ja) | 2005-11-01 | 2007-05-24 | Internatl Business Mach Corp <Ibm> | 人物間の関連性を評価するシステム |
US8396884B2 (en) * | 2006-02-27 | 2013-03-12 | The Regents Of The University Of California | Graph querying, graph motif mining and the discovery of clusters |
US7808921B2 (en) * | 2006-05-19 | 2010-10-05 | The Research Foundation Of State University Of New York | Bridging centrality: a concept and formula to identify bridging nodes in scale-free networks |
US20080059455A1 (en) * | 2006-08-31 | 2008-03-06 | Canoy Michael-David N | Method and apparatus of obtaining or providing search results using user-based biases |
EP2318548B1 (en) | 2008-08-15 | 2013-10-16 | Merrimack Pharmaceuticals, Inc. | Methods and systems for predicting response of cells to a therapeutic agent |
JP2010165230A (ja) | 2009-01-16 | 2010-07-29 | Pharma Design Inc | 薬剤標的となるタンパク質−タンパク質相互作用を予測する方法及び予測システム |
US10192641B2 (en) | 2010-04-29 | 2019-01-29 | The Regents Of The University Of California | Method of generating a dynamic pathway map |
US10129211B2 (en) * | 2011-09-15 | 2018-11-13 | Stephan HEATH | Methods and/or systems for an online and/or mobile privacy and/or security encryption technologies used in cloud computing with the combination of data mining and/or encryption of user's personal data and/or location data for marketing of internet posted promotions, social messaging or offers using multiple devices, browsers, operating systems, networks, fiber optic communications, multichannel platforms |
US9034839B2 (en) * | 2012-04-20 | 2015-05-19 | Aptamir Therapeutics, Inc. | miRNA modulators of thermogenesis |
CN107449921A (zh) | 2012-05-22 | 2017-12-08 | 博格有限责任公司 | 用于鉴别药物诱导毒性标志物的基于细胞的探询式分析 |
US10318583B2 (en) * | 2013-03-15 | 2019-06-11 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for recommending relationships within a graph database |
US20170329914A1 (en) * | 2016-05-11 | 2017-11-16 | International Business Machines Corporation | Predicting Personalized Cancer Metastasis Routes, Biological Mediators of Metastasis and Metastasis Blocking Therapies |
WO2019161204A1 (en) * | 2018-02-19 | 2019-08-22 | Protabit LLC | Platform for protein storage, analysis and engineering |
-
2019
- 2019-04-25 JP JP2019084188A patent/JP7404648B2/ja active Active
-
2020
- 2020-04-16 US US16/850,631 patent/US11615125B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002040913A (ja) | 2000-07-28 | 2002-02-08 | Katsunori Nonogaki | 分子生物学的学習システム |
JP2003203078A (ja) | 2001-10-19 | 2003-07-18 | Mitsubishi Electric Corp | 生理機能解析方法及びシステム |
JP2005267282A (ja) | 2004-03-18 | 2005-09-29 | Kitakyushu Foundation For The Advancement Of Industry Science & Technology | 研究遺伝子産物関連度予測システム |
JP2009070096A (ja) | 2007-09-12 | 2009-04-02 | Michio Kimura | ゲノム情報と臨床情報との統合データベースシステム、および、これが備えるデータベースの製造方法 |
JP2010066814A (ja) | 2008-09-08 | 2010-03-25 | Nippon Telegr & Teleph Corp <Ntt> | トピック友人距離測定装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 |
JP2018139111A (ja) | 2013-01-29 | 2018-09-06 | モレキュラー ヘルス ゲーエムベーハー | 臨床判断支援のためのシステムおよび方法 |
JP2014235474A (ja) | 2013-05-31 | 2014-12-15 | 国立大学法人京都大学 | 関係性グラフ相互連携システム |
JP2019507444A (ja) | 2015-12-07 | 2019-03-14 | データフォーキュア、インク. | 測定データおよびテキストからオントロジーベースの動的学習および知識統合を行う方法およびシステム |
Also Published As
Publication number | Publication date |
---|---|
JP2020181378A (ja) | 2020-11-05 |
US20200342015A1 (en) | 2020-10-29 |
US11615125B2 (en) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6662933B2 (ja) | 臨床判断支援のためのシステムおよび方法 | |
Blakely et al. | Reflection on modern methods: when worlds collide—prediction, machine learning and causal inference | |
Steinrücken et al. | Model‐based detection and analysis of introgressed Neanderthal ancestry in modern humans | |
JP2016513303A5 (ja) | ||
Mancini et al. | Computing personalised treatments through in silico clinical trials. A case study on downregulation in assisted reproduction | |
Lilhore et al. | Hybrid model for precise hepatitis-C classification using improved random forest and SVM method | |
US20030220777A1 (en) | Method and system for determining genotype from phenotype | |
Pölsterl et al. | Heterogeneous ensembles for predicting survival of metastatic, castrate-resistant prostate cancer patients | |
JP2022524083A (ja) | 薬物に依存しない患者固有の投薬レジメンのためのシステムおよび方法 | |
Montoya et al. | Efficient and robust approaches for analysis of sequential multiple assignment randomized trials: Illustration using the ADAPT-R trial | |
JP7404648B2 (ja) | 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム | |
CN110009128A (zh) | 行业舆情指数预测方法、装置、计算机设备及存储介质 | |
Kobylińska et al. | Explainable machine learning for modeling of early postoperative mortality in lung cancer | |
Tao et al. | Predicting Glaucoma Progression to Surgery with Artificial Intelligence Survival Models | |
Petersen et al. | Individualized treatment rules: Generating candidate clinical trials | |
Vittinghoff et al. | Survival analysis | |
Shechter et al. | Irreversible treatment decisions under consideration of the research and development pipeline for new therapies | |
Norgeot et al. | Time aggregation and model interpretation for deep multivariate longitudinal patient outcome forecasting systems in chronic ambulatory care | |
CN111971754B (zh) | 医学信息处理装置、医学信息处理方法及存储介质 | |
van der Laan et al. | Statistical learning of origin-specific statically optimal individualized treatment rules | |
Das et al. | A discrete simulation optimization approach towards calibration of an agent-based simulation model of hepatitis C virus transmission | |
Zhou et al. | Emerging methods for oncology clinical trials | |
Rotich | Methods for Improving Inference in Clinical Outcomes | |
McDonough | Utilizing data mining techniques and ensemble learning to predict development of surgical site infections in gynecologic cancer patients | |
Wang | Robust and adaptive design approaches for stepped wedge cluster randomized trials |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190614 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211208 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20220601 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221024 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230328 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230508 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230830 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231127 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7404648 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |