JP7404648B2

JP7404648B2 - 治療薬提示方法、治療薬提示装置、及び治療薬提示プログラム

Info

Publication number: JP7404648B2
Application number: JP2019084188A
Authority: JP
Inventors: 健一小林; 真一郎多湖; 紘孝柴田; 晴康上田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-04-25
Filing date: 2019-04-25
Publication date: 2023-12-26
Anticipated expiration: 2039-04-25
Also published as: JP2020181378A; US20200342015A1; US11615125B2

Description

本発明は、関連性探索方法、関連性探索装置、及び関連性探索プログラムに関する。

既知のデータベースでは、通常、データベース内に構築されたネットワークによって、データベース内の情報間の関連性を調べることができる（例えば、特許文献１参照）。
しかし、世の中には、単一のデータベースのみからでは調べることができない情報間の関連性が存在していることが多い。

特開２００７－１２８１６３号公報

本件は、単一のデータベースのみからでは調べることができない要素間の関連性を探索可能な関連性探索方法、関連性探索装置、及び関連性探索プログラムを提供することを目的とする。

１つの態様では、本件の関連性探索方法は、
複数の要素と、前記複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成し、
前記結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索する。

他の１つの態様では、本件の関連性探索装置は、
複数の要素と、前記複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する作成部と、
前記結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索する探索部と、
を備える。

他の１つの態様では、本件の関連性探索プログラムは、
コンピュータに、
複数の要素と、前記複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成させ、
前記結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索させる。

一つの側面では、単一のデータベースのみからでは調べることができない要素間の関連性を探索可能な関連性探索方法を提供できる。
また、他の一つの側面では、単一のデータベースのみからでは調べることができない要素間の関連性を探索可能な関連性探索装置を提供できる。
また、他の一つの側面では、単一のデータベースのみからでは調べることができない要素間の関連性を探索可能な関連性探索プログラムを提供できる。

図１は、関連性を探索する方法の一例のフローチャートである。図２は、関連性探索装置の一例の構成図である。図３Ａは、第１のデータベースのグラフ構造の一例である。図３Ｂは、第２のデータベースのグラフ構造の一例である。図３Ｃは、図３Ａ及び図３Ｂを結合した結合データベースのグラフ構造である。図４は、治療薬を提示する方法の一例のフローチャートである。図５は、治療薬提示装置の一例の構成図である。図６Ａは、治療薬と変異遺伝子との関係がリアクションパスウェイによって関係づけられたデータベースの一例である。図６Ｂは、タンパク質－タンパク質相互作用データベースの一例である。図６Ｃは、図６Ａ及び図６Ｂの結合データベースの一例である。図７は、パス作用確率の計算方法の一例を説明するための図である。図８は、結果の提示例である。図９Ａは、変異タンパク質の情報と、変異タンパク質と相互作用するタンパク質の情報と、変異タンパク質とタンパク質との相互作用情報とを有するデータベースの一例である。図９Ｂは、タンパク質の情報と、２つのタンパク質間の相互作用情報とを有するデータベースの一例である。図９Ｃは、ターゲットタンパク質の情報と、ターゲットタンパク質と相互作用するタンパク質の情報と、ターゲットタンパク質とタンパク質との相互作用情報とを有するデータベースの一例である。図９Ｄは、図９Ａ、図９Ｂ及び図９Ｃの結合データベースの一例である。図１０は、作用確率の設定の一例を説明するためのフローチャートである。図１１Ａは、作用確率の設定方法の一例を説明するための図である（その１）。図１１Ｂは、作用確率の設定方法の一例を説明するための図である（その２）。図１１Ｃは、作用確率の設定方法の一例を説明するための図である（その３）。図１１Ｄは、作用確率の設定方法の一例を説明するための図である（その４）。図１２は、学習方法の一例を説明するためのフローチャートである。図１３は、作用確率を反復的に少しずつ変更する理由の一例を説明するための図である。図１４は、友人関係を探索する方法の一例のフローチャートである。図１５は、友人探索装置の一例の構成図である。図１６Ａは、第１のデータベースのグラフ構造の一例である。図１６Ｂは、第２のデータベースのグラフ構造の一例である。図１６Ｃは、図１６Ａ及び図１６Ｂを結合した結合データベースのグラフ構造の一例である。図１７は、開示の関連性探索装置の一例のハードウェア構成図である。図１８は、開示の関連性探索装置の他の一例のハードウェア構成図である。図１９は、開示の関連性探索装置の他の一例のハードウェア構成図である。

（関連性探索方法、関連性探索装置、及び関連性探索プログラム）
本件の関連性探索方法は、複数の要素と、複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する。
関連性探索方法は、更に、結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索する。
関連性探索方法は、例えば、関連性があると判断された、直接に関連性がない２つの要素間の関連性を提示する。

本件の関連性探索装置は、作成部と、探索部とを少なくとも備え、更に必要に応じて、提示部を備える。
作成部は、複数の要素と、複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する。
探索部は、結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索する。
提示部は、関連性があると判断された、直接に関連性がない２つの要素間の関連性を提示する。

本件の関連性探索プログラムは、コンピュータに、複数の要素と、複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成させる。
関連性探索プログラムは、更に、コンピュータに、結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索させる。
関連性探索プログラムは、例えば、更に、コンピュータに、直接に関連性がない２つの要素間の関連性を提示させる。

結合データベースの構造は、例えば、要素をノードとし、関連性情報をエッジとするグラフ構造である。

関連性情報は、例えば、２つの要素間の関連性の強さを表す情報である。

なお、個々のデータベースには、全ての要素における全ての２つの組み合わせの関連性情報が存在している必要はない。

開示の関連性探索方法、関連性探索装置、及び関連性探索プログラムにおいては、例えば、以下のようにして、単一のデータベースのみからでは調べることができない要素間の関連性を探索する。
図１に、関連性を探索する方法の一例のフローチャートを示す。図２に、関連性探索装置１の構成図を示す。

＜工程Ｓ１０１＞
まず、結合データベースの作成を行う（Ｓ１０１）。結合データベースの作成は、例えば、関連性探索装置１の作成部１１において行われる。
工程Ｓ１０１では、例えば、図３Ａに示すグラフ構造を有する第１のデータベースと、図３Ｂに示すグラフ構造を有する第２のデータベースとを結合し、図３Ｃに示すグラフ構造を有する結合データベースを作成する。
第１のデータベースは、要素ｅ１～要素ｅ３と、２つの要素間の関連性情報ｋ１～関連性情報ｋ３とを有する。図３Ａに示すグラフ構造は、要素ｅ１～要素ｅ３をノードとし、関連性情報ｋ１～関連性情報ｋ３をエッジとするグラフ構造である。
第２のデータベースは、要素ｅ２、要素ｅ３、要素ｅ１１、及び要素ｅ１２と、２つの要素間の関連性情報ｋ１１～関連性情報ｋ１４とを有する。図３Ｂに示すグラフ構造は、要素ｅ２、要素ｅ３、要素ｅ１１、及び要素ｅ１２をノードとし、関連性情報ｋ１１～関連性情報ｋ１４をエッジとするグラフ構造である。
結合データベースの作成では、例えば、重複する要素を一つの要素に統合する。
そうすると、第１のデータベースと第２のデータベースとを結合した結合データベースでは、図３Ｃに示すように、要素ｅ１、要素ｅ２、要素ｅ３、要素ｅ１１、及び要素ｅ１２と、２つの要素間の関連性情報ｋ１、関連性情報ｋ２、及び関連性情報ｋ１１～関連性情報ｋ１４とを有する。図３Ｃに示すグラフ構造は、要素ｅ１、要素ｅ２、要素ｅ３、要素ｅ１１、及び要素ｅ１２をノードとし、関連性情報ｋ１、関連性情報ｋ２、及び関連性情報ｋ１１～関連性情報ｋ１４をエッジとするグラフ構造である。
なお、結合データベースを作成する際、２つの要素間に異なる関連性情報がある場合（例えば、要素ｅ２、要素ｅ３との間に、異なる関連性情報ｋ３と関連性情報ｋ１１とがある場合）、どちらの関連性情報を用いて結合データベースを作成してもよい。また、関連性情報は、結合データベースを作成した後に、学習データを用いて、更新することが好ましい。

また、結合するデータベースの数は、２つに限られず、３つ以上であってもよい。

＜工程Ｓ１０２＞
次に、結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索する（Ｓ１０２）。２つの要素間の関連性の探索は、例えば、関連性探索装置１の探索部１２において行われる。
例えば、図３Ｃに示すグラフ構造を有する結合データベースを用いて、直接に関連性がない要素ｅ１と要素ｅ１１との関連性を探索する。この関連性は、図３Ａに示すグラフ構造を有する第１のデータベース単独、及び図３Ｂに示すグラフ構造を有する第２のデータベース単独では見いだせない関連性である。要素ｅ１と要素ｅ１１との関連性の強さは、例えば、要素ｅ１及び要素ｅ１１間の一つの経路に存在する複数の関連性情報の合計により算出される。

本件の関連性探索方法、関連性探索装置、及び関連性探索プログラムに用いるデータベースとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、以下のデータベースなどが挙げられる。
・タンパク質と、タンパク質間の相互作用情報とが収録されたデータベース
・人名と、人名間の友人関係とが収録されたデータベース

関連性探索方法、関連性探索装置、及び関連性探索プログラムは、例えば、既存の単一のデータベースからは調べることができない、治療薬の探索・推薦、友人関係の探索などに用いることができる。

＜治療薬の探索・推薦＞
関連性探索方法、関連性探索装置、及び関連性探索プログラムは、既存の単一のデータベースからは調べることができない、治療薬の探索・推薦に用いることができる。

ガンなど遺伝子の変異が原因となって発症する病気は多い。遺伝子の変異は、患者の遺伝子解析を行うことで調べることができる。遺伝子の変異に起因する病気の治療に関しては、タンパク質に直接作用する分子標的治療薬が、効果を上げている。

しかし、病気の原因となる変異のある遺伝子から生成されるタンパク質（以下、「変異タンパク質」と称することがある）と、分子標的治療薬が直接作用するタンパク質（以下、「ターゲットタンパク質」と称することがある）とは等しいとは限らない。そのため、遺伝子の変異に対して有効な分子標的治療薬を割り出すことが、有効な治療のために必要となる。

従来、治療薬の探索は、作用が実験により確認されたパスウェイと呼ばれるタンパク質のパスが蓄積されているデータベースを用い、パスウェイの中から変異タンパク質からターゲットタンパク質までのパスを含むものを見つけ、それが有効であるかを精査するといった手順により行われている。パスウェイは作用の有無と種類とを示すものであり、それが直接に薬の有効性を示すものではないため、必ず医療知識保持者の介入が必要となる。
上記手順についてのコンピュータを用いた支援として、パスウェイデータベースからの検索を行うことで列挙を支援する方法、パスウェイの情報を利用して、ペトリネットなどの手法を用いてシミュレーションを行い、判断を支援する方法などが行われている。
しかし、これらの方法では、既知のパスウェイが前提となっている技術であるため、未知の薬効を発見できるものではない。

他方、ベイジアンネットなどを用いて統計的にパスウェイを推定する方法も提案されている。
しかし、この方法で得られるものは、パスウェイのグラフ構造のみであり、既知のパスウェイに付随する分岐条件、合流条件など統計的に得られない情報が欠けている。

また、タンパク質とタンパク質の１対１関係について、タンパク質の属性を調べることで薬効の有無を推定する方法が提案されている。
しかし、この方法では、複数のタンパク質の関係からなる（すなわち、経路長２以上の）パスについて推定を行うことはできない。

開示の関連性探索方法、関連性探索装置、及び関連性探索プログラムの一例を用いることで、疾患に対して薬効のある治療薬を、既知の治療薬のみならず、未知の治療薬についても提示することが可能となる。以下にその方法を説明する。

なお、以下において、関連性探索方法を治療薬の提示に用いる場合、治療薬提示方法と称する。関連性探索装置を治療薬の提示に用いる場合、治療薬提示装置と称する。関連性探索プログラムを治療薬の提示に用いる場合、治療薬提示プログラムと称する。

開示の治療薬提示方法においては、まず、複数のタンパク質の情報と、複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報とを備える複数のデータベースを結合して、結合データベースを作成する。
ここで、複数のデータベースは、以下（１）及び（２）の少なくともいずれかを満たす。
（１）複数のデータベースには、変異遺伝子から生成される変異タンパク質の情報を有するデータベース、及び治療薬が直接作用するターゲットタンパク質の情報を有するデータベースが含まれる。
（２）複数のデータベースには、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを有するデータベースが含まれる。
そのため、結合データベースは、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを有する。
治療薬提示方法においては、更に、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索する。
治療薬提示方法においては、更に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示する。
なお、タンパク質の情報とは、例えば、タンパク質名、アミノ酸配列などが挙げられる。

開示の治療薬提示装置においては、複数のタンパク質の情報と、複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報とを備える複数のデータベースを結合して、結合データベースを作成する作成部を有する。
治療薬提示装置は、更に、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索する探索部を有する。
治療薬提示装置は、更に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示する提示部を有する。

開示の治療薬提示プログラムにおいては、まず、コンピュータに、複数のタンパク質の情報と、複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報とを備える複数のデータベースを結合して、結合データベースを作成させる。
治療薬提示プログラムにおいては、更に、コンピュータに、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索させる。
治療薬提示プログラムにおいては、更に、コンピュータに、治療薬提示方法においては、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示させる。

開示の治療薬提示方法、治療薬提示装置、及び治療薬提示プログラムにおいては、例えば、以下のようにして、疾患に対して薬効のある治療薬を、既知の治療薬のみならず、未知の治療薬についても提示する。

図４に、治療薬を提示する方法の一例のフローチャートを示す。図５に、治療薬提示装置の構成図を示す。

＜工程Ｓ２０１＞
まず、結合データベースの作成を行う（Ｓ２０１）。結合データベースの作成は、例えば、治療薬提示装置２の作成部２１において行われる。
工程Ｓ２０１では、例えば、図６Ａに示すデータベースＤ１と、図６Ｂに示すデータベースＤ２とを結合し、図６Ｃに示す結合データベースＤ３を作成する。
図６Ａは、治療薬と変異遺伝子との関係がリアクションパスウェイによって関係づけられたデータベースＤ１である。図６Ａにおいて、Ｐ１～Ｐ５、Ｐ１１～Ｐ１５、Ｐ２１～Ｐ２５は、要素であるタンパク質を表す。図６Ａにおいて、ｉ１～ｉ４、ｉ１１～ｉ１４、ｉ２１～ｉ２４は、リアクションパスウェイを構成する個々の関連性情報である、２つのタンパク質間の相互作用を示す相互作用情報（タンパク質－タンパク質相互作用、以下「ＰＰＩ」と称することがある）を表す。タンパク質Ｐ１は、変異遺伝子１から生成される変異タンパク質である。タンパク質Ｐ１１は、変異遺伝子２から生成される変異タンパク質である。タンパク質Ｐ２１は、変異遺伝子３から生成される変異タンパク質である。タンパク質Ｐ５は、治療薬１が直接作用するターゲットｆｆタンパク質である。タンパク質Ｐ１５は、治療薬２が直接作用するターゲットタンパク質である。タンパク質Ｐ２５は、治療薬３が直接作用するターゲットタンパク質である。
図６Ｂは、タンパク質Ｐ３、Ｐ１３、Ｐ２３と、ＰＰＩ（ｉ３１、ｉ３２）とを有するデータベースＤ２である。
図６Ｃに示す結合データベースＤ３では、データベースＤ１にデータベースＤ２を加えたことにより、データベースＤ１には存在しなかった、以下の６種類の新しいパスが生成されている。
（ｉ）Ｐ１－Ｐ１５間のパス
（ｉｉ）Ｐ１－Ｐ２５間のパス
（ｉｉｉ）Ｐ１１－Ｐ５間のパス
（ｉｖ）Ｐ１１－Ｐ２５間のパス
（ｖ）Ｐ２１－Ｐ５間のパス
（ｖｉ）Ｐ２１－Ｐ１５間のパス

なお、結合するデータベースの数は、２つに限られず、３つ以上であってもよい。

結合に使用されるデータベースの一例を以下に示す。
・Ｒｅａｃｔｏｍｅ：リアクションパスウェイのデータベース
・ＨｉＮＴ：タンパク質－タンパク質相互作用データベース（ＰＰＩデータベース）
・ＩＮｓｔｒｕｃｔ：タンパク質－タンパク質相互作用データベース（ＰＰＩデータベース）
・ＧｕｉｄｅＴｏＰｈａｒｍａｃｏｌｏｇｙ：治療薬と遺伝子のデータベース（治療薬が直接作用するターゲットタンパク質の情報を含んでいる）

＜工程Ｓ２０２＞
次に、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索する（Ｓ２０２）。変異タンパク質と、ターゲットタンパク質との関係性の探索は、例えば、治療薬提示装置１１の探索部１２において行われる。
例えば、図６Ｃに示す結合データベースＤ３を用いて、変異タンパク質とターゲットタンパク質との関係性を探索する。ここでの関係性とは、例えば、ターゲットタンパク質が変異タンパク質に及ぼす影響が挙げられる。そのような影響の強さは、例えば、変異タンパク質とターゲットタンパク質との間の経路に存在する複数の相互作用情報を統合して得られる。
例えば、変異タンパク質であるタンパク質Ｐ１と、ターゲットタンパク質であるタンパク質Ｐ１５との間には、図７に示すように、５つのＰＰＩ（ｉ１、ｉ２、ｉ３１、ｉ１３、ｉ１４）が存在する。そして、例えば、個々の相互作用の相対的な強さを作用確率とし、その作用確率が図７に示すような確率であった場合、ターゲットタンパク質であるタンパク質Ｐ１５との間のパスの作用確率は以下のように求められる。
パス作用確率＝０．５×０．８×０．９×０．８×０．４＝０．１１５２
変異タンパク質と、ターゲットタンパク質との関係性の探索は、例えば、存在する変異タンパク質－ターゲットタンパク質間の全てのパスについて行われてもよい。また、変異タンパク質と、ターゲットタンパク質との関係性の探索は、特定の変異タンパク質と、ターゲットタンパク質との間の全てのパスについて行われてもよい。
なお、作用確率の設定方法については、後述する。

＜工程Ｓ２０３＞
次に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示する（Ｓ２０３）。当該提示は、例えば、治療薬提示装置１１の提示部１３において行われる。
具体的には、例えば、特定の変異タンパク質－ターゲットタンパク質間の全てのパスについて求められたパス作用確率を一覧として表示することにより行われる。例えば、変異タンパク質１に起因する疾患に有効な治療薬を提示する場合、変異タンパク質１－ターゲットタンパク質（Ｐ１、Ｐ１５、Ｐ２５）間の全てのパスについて求められた個々のパス作用確率を、図８に示すように、パス作用確率の数値が大きいものから順に並べた降順リストを作成し、表示する。
なお、特定の変異タンパク質と特定のターゲットタンパク質との間に複数のパスが存在する場合には、複数のパスから求められる複数のパス作用確率のうちで最も大きいパス作用確率を、特定の変異タンパク質と特定のターゲットタンパク質とのパス作用確率を代表するパス作用確率としてもよい（最尤推定）。

そして、特定の変異タンパク質からパス作用確率が最も高いターゲットタンパク質を求めることは、以下の変換を与えることにより、変異タンパク質からターゲットタンパク質への最短パスのターゲットタンパク質を求めることと等価となる。すなわち、特定の変異タンパク質からパス作用確率の高いターゲットタンパク質を求めることは、最短経路問題に帰着させることができ、例えば、最短経路問題の古典的な解法であるダイクストラ法で解くことができる。
距離＝Ｃ_０・－ｌｏｇ（作用確率）
なお、作用確率の高低を求める目的には定数Ｃ_０の計算は不要である。

＜＜データベースの結合の変形例＞＞
以下に、工程Ｓ２０１におけるデータベースの結合の変形例を示す。
図６Ａ～図６Ｃを用いた説明では、治療薬と変異遺伝子との関係がリアクションパスウェイによって関係づけられたデータベースＤ１を用いた。本変形例では、変異遺伝子から生成される変異タンパク質の情報を有するデータベースと、治療薬が直接作用するターゲットタンパク質の情報を有するデータベースと、２つのタンパク質間の相互作用を示す相互作用情報を有するデータベースを用いる。
図９Ａに示すデータベースは、変異遺伝子から生成される変異タンパク質の情報と、変異タンパク質と相互作用するタンパク質の情報と、変異タンパク質とタンパク質との相互作用情報とを有するデータベースＤ４である。図９Ａにおいて、Ｐ３１、Ｐ３２、Ｐ４１、Ｐ４２、Ｐ５１、Ｐ５２は、タンパク質を表す。図９Ａにおいて、ｉ４１、ｉ５１、ｉ６１は、相互作用情報を表す。タンパク質Ｐ３１は、変異遺伝子４から生成される変異タンパク質である。タンパク質Ｐ４１は、変異遺伝子５から生成される変異タンパク質である。タンパク質Ｐ５１は、変異遺伝子６から生成される変異タンパク質である。
図９Ｂに示すデータベースは、タンパク質の情報と、２つのタンパク質間の相互作用情報とを有するデータベースＤ５である。図９Ｂにおいて、Ｐ３１、Ｐ３２、Ｐ３３、Ｐ３４、Ｐ３５、Ｐ４２、Ｐ４３、Ｐ４４、Ｐ４５、Ｐ５２、Ｐ５３は、タンパク質を表す。図９Ｂにおいて、ｉ４１、ｉ４２、ｉ４３、ｉ４４、ｉ５２、ｉ５３、ｉ５４、ｉ６２、ｉ７１、ｉ７２は、相互作用情報を表す。
図９Ｃに示すデータベースは、治療薬が直接作用するターゲットタンパク質の情報と、ターゲットタンパク質と相互作用するタンパク質の情報と、ターゲットタンパク質とタンパク質との相互作用情報とを有するデータベースＤ６である。図９Ｃにおいて、Ｐ３４、Ｐ３５、Ｐ４４、Ｐ４５、Ｐ５４、Ｐ５５は、タンパク質を表す。図９Ｃにおいて、ｉ４４、ｉ５４、ｉ６４は、相互作用情報を表す。
図９Ａ、図９Ｂ、及び図９Ｃのデータベースを結合すると、図９Ｄに示す結合データベースが得られる。

＜＜作用確率の設定方法＞＞
工程２０２において、結合データベースを用いて、変異タンパク質と、ターゲットタンパク質との関係性を探索する際には、例えば、変異タンパク質とターゲットタンパク質との間の経路に存在する複数の相互作用情報から、変異タンパク質とターゲットタンパク質との相互作用の相対的な強さを求める。その際、個々の相互作用の相対的な強さ（個々の相互作用情報）である作用確率の積から、パス作用確率を求める。
その際の個々の作用確率は、例えば、ベイズ推定による機械学習により設定することができる。その方法の一例を以下に示す。
図１０は、作用確率の設定の一例を説明するためのフローチャートである。

－工程Ｓ３０１（結合データベースの作成）－
まず、準備段階として、複数のデータベースを結合して、結合データベースを作成する（Ｓ３０１）。図１１Ａは、データベースを結合する様子の概念図である。図１１Ａにおいては、リアクションパスウェイデータベース（ＤＢ）として、Ｒｅａｃｔｏｍｅを用い、ＰＰＩデータベースとしてＨＩＮＴ及びＩＮｓｔｒｕｃｔを用いる。
結合データベースの構造は、例えば、タンパク質をノードとし、タンパク質－タンパク質相互作用（ＰＰＩ）をエッジとするグラフ構造であり、グラフ構造の規模としては、例えば、ノード数が数万となり、エッジ数が数十万となる。

－工程Ｓ３０２〔学習の準備段階（その１）〕－
作用確率の学習の準備段階（その１）として、結合データベースに対して、タンパク質－タンパク質相互作用（ＰＰＩ）に作用確率の初期値を設定する（Ｓ３０２）。
この場合、各エッジの真の値は大きく異なる可能性があるため単一の初期値を与えることは危険である。また、作用確率を推定するうえで、訓練データとなる薬や症例ごとの薬効データには大きなバラつきがあるため、訓練データの多寡に応じて推定の精度を制御する必要がある。
そこで、作用確率としては単一の推定値を与えるのではなく、推定値の確率分布を与えることが好ましい。作用自体は有無を表すベルヌーイ分布で記述されるため、作用確率を表す確率分布はベルヌーイ分布の共役事前分布であるベータ分布を採ると利便性が高い（図１１Ｂ）。図１１Ｂは、タンパク質－タンパク質相互作用（ＰＰＩ）に作用確率の初期値としてベータ分布を付与した状態を表す概念図である。
したがって、ＰＰＩの作用確率に事前分布としてベータ分布Ｂｅ（α_ＰＰＩ，β_ＰＰＩ）を割り当てる。α_ＰＰＩとβ_ＰＰＩは分布のパラメータであり、期待値が０．１などの低い値となるように設定する。その確率密度関数は以下で表される〔ただし、Β（，）はベータ関数〕。

－工程Ｓ３０３〔学習の準備段階（その２）〕－
次に、作用確率の学習の準備段階（その２）として、既知のリアクションパスウェイ中のＰＰＩの作用確率の事前分布を設定する。これは、既知のリアクションパスウェイは有効な薬効の機序となりえる有用性が高いため、既知のリアクションパスウェイ中のＰＰＩの作用確率には高い事前分布を与えることが好ましいためである。ここで、既知のリアクションパスウェイは、パスウェイＤＢであるＲｅａｃｔｏｍｅに収録された情報である。
既知のリアクションパスウェイ中に現れるＰＰＩごとに、その作用確率を、ある程度高い確率、及び適切に設定した試行数で、ベイズ更新を行う（Ｓ３０３）。事前分布がベータ分布の確率密度関数ｆ_{ｐｒｉｏｒ}（ｘ；α，β）で表されるとき、成功率ｒ（例えば、ｒ＝０．９９）、試行数ｎ（例えば、ｎ＝０．１）の試行を経ることによりベイズ更新された事後確率の密度関数はベイズの定理により次式のｆ_{ｐｏｓｔｅｒｉｏｒ}（ｘ；α，β）で求められる。これは閉じた形式で解けるため、計算は容易である。αは、薬効があった数を表し、βは、薬効がなかった数を表す。

なお、複数のリアクションパスウェイの間でＰＰＩが重複する場合があるため、あるＰＰＩのベイズ更新が複数回起こることがあり得る。

－工程Ｓ３０４〔サブステップ（類似ＰＰＩへのベイズ更新の適用）〕－
リアクションパスウェイ中のＰＰＩと類似するＰＰＩは、リアクションパスウェイのＰＰＩと同様に振る舞うことが期待される。それが学習データに含まれないＰＰＩであれば、未知の薬効を推定するための手がかりとなりえる。類似するＰＰＩとしては、例えば、リアクションパスウェイ中のＰＰＩと同じドメイン間相互作用を持つＰＰＩが挙げられる。ここでは、「同じドメイン間相互作用を持つＰＰＩは似ている」という仮定を適用している。類似ＰＰＩの判定には、例えば、ＩＮｓｔｒｕｃｔデータベースのタンパク質ドメイン間相互作用の情報を用いる。
そこで、リアクションパスウェイのＰＰＩによるベイズ更新の際には、そのＰＰＩの類似ＰＰＩも弱く（＝試行数を減じて）ベイズ更新する（Ｓ３０４）。例えば、成功率ｒ（例えば、ｒ＝０．９９）、試行数ｎ（例えば、ｎ＝０．００１）の試行を行う。そうすることで、知識の転用を行う。

図１１Ｃは、既知のリアクションパスウェイ中に現れるＰＰＩの作用確率をベイズ更新する状態を表す概念図である。

－工程Ｓ３０５（学習段階）－
学習段階として、学習データを用いて学習を行う（Ｓ３０５）。
学習は、例えば、以下の方法で行う。図１１Ｄは、以下の方法により、学習データを用いて学習を行う状態を表す概念図である。図１２は、以下の学習のフローチャートである。以下に、図１２のフローチャートを用いて、学習データを用いた学習の一例を説明する。

－－工程Ｓ４０１－－
ＤＧＩｄｂデータベースとＧｕｉｄｅＴｏＰｈａｒｍａｃｏｌｏｇｙデータベースを用いて、既知の薬効のある変異タンパク質とターゲットタンパク質のペアの学習データを用意する（Ｓ４０１）。

－－工程Ｓ４０２－－
次に、学習データから１エントリを選び、変異タンパク質とターゲットタンパク質とのパスを最尤推定する（Ｓ４０２）。これは、最短経路問題を解くことと等価である。

－－工程Ｓ４０３－－
最尤推定したパス上のＰＰＩに対し、ある程度高い確率と適切に設定した試行数でベイズ更新を行う（Ｓ４０３）。例えば、成功率ｒ（例えば、ｒ＝０．９９）、試行数ｎ（例えば、ｎ＝０．３）の試行を行う。

－－工程Ｓ４０４－－
工程Ｓ３０４と同様に、類似ＰＰＩについても弱くベイズ更新を行う（Ｓ４０４）。

－－工程Ｓ４０５－－
工程Ｓ４０２～工程Ｓ４０４を、全エントリについて繰り返す（Ｓ４０５）。

－－工程Ｓ４０６－－
ある変異タンパク質を選び、全てのターゲットタンパク質へのパス作用確率を列挙し、正例（学習データに存在するターゲットタンパク質）のパス作用確率が非正例のパス作用確率より低い場合、その正例のパスに属するＰＰＩを比較的高い確率でベイズ更新する（Ｓ４０６）。例えば、成功率ｒ（例えば、ｒ＝０．９９）、試行数ｎ（例えば、ｎ＝０．３）の試行を行う。

－－工程Ｓ４０７－－
全ての変異タンパク質について工程Ｓ４０６を繰り返す（Ｓ４０７）。

－－工程Ｓ４０８－－
ある変異タンパク質を選び、全てのターゲットタンパク質へのパス作用確率を列挙し、非正例のパス作用確率が正例のパス作用確率より高い場合、その非正例のパスに属するＰＰＩを比較的低い確率でベイズ更新する（Ｓ４０８）。例えば、成功率ｒ（例えば、ｒ＝０．１０）、試行数ｎ（例えば、ｎ＝０．３）の試行を行う。

－－工程Ｓ４０９－－
全ての変異タンパク質について工程Ｓ４０９を繰り返す（Ｓ４０９）。

－－工程Ｓ４１０－－
評価値（例えば、後述するＲｅｃａｌｌ＠ｋの平均）を求める（Ｓ４１０）。

－－工程Ｓ４１１－－
そして、評価が改善している間、工程Ｓ４０２～工程Ｓ４１０を繰り返す。
ここで、Ｒｅｃａｌｌ＠ｋはデータ中の全正解のうち、上位ｋ個までに正解の何％が含まれるかを表す性能評価指標である。値が大きいほど正確であることを意味する。

ここで、作用確率を反復的に少しずつ変更する理由について述べる。
例えば、図１３のようなＰＰＩがあり、変異タンパクＡからターゲットタンパクＢという学習データのエントリが現れた場合、最初はＡ－Ｘ－Ｂというパスが選ばれる
このとき、真のパスがＡ－Ｚ－Ｙ－Ｂであった場合、最初に選ばれたパスは誤りである。もし、最初にＡ－Ｘ－ＢというパスのＰＰＩにあまりにも高い確率を割り当てた場合、Ａ－Ｚ－Ｙ－Ｂというパスは二度と辿られることは無くなってしまう。
もし、確率の変更が少しであれば、他の学習データから、Ａ－Ｚ，Ｚ－Ｙ，Ｙ－ＢのＰＰＩが高確率に学習されるチャンスが残る。これは誤った局所解に落ちて脱出できないという状態を避けることを意味する。

＜友人関係の探索＞
関連性探索方法、関連性探索装置、及び関連性探索プログラムは、既存の単一のデータベースからは調べることができない、友人関係の探索にも用いることができる。

現代では、インターネット上に多くのＳｏｃｉａｌｎｅｔｗｏｒｋｉｎｇｓｅｒｖｉｃｅ（以下、「ＳＮＳ」と称することがある）が存在している。それらは、独立に、友人関係の探索を行う機能を有する場合がある。
しかし、ＳＮＳ同士をまたいで友人関係の探索を行うことはできない。

開示の関連性探索方法、関連性探索装置、及び関連性探索プログラムの一例を用いることで、既存の単一のデータベースからは調べることができない友人関係を探索することが可能となる。以下にその方法を説明する。

なお、以下において、関連性探索方法を友人関係の探索に用いる場合、友人探索方法と称する。関連性探索装置を友人関係の探索に用いる場合、友人探索装置と称する。関連性探索プログラムを友人関係の探索に用いる場合、友人探索プログラムと称する。

開示の友人探索方法においては、まず、複数の人の情報と、複数の人における２人の間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する。
友人探索方法においては、更に、結合データベースを用いて、直接に関連性がない２人の間の関連性を探索する。
友人探索方法においては、例えば、更に、関連性があると判断された、直接に関連性がない２人の間の関連性を提示する。

開示の友人探索装置においては、複数の人の情報と、複数の人における２人の間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する作成部を有する。
友人探索装置においては、更に、結合データベースを用いて、直接に関連性がない２人の間の関連性を探索する探索部を有する。
友人探索装置においては、例えば、更に、関連性があると判断された、直接に関連性がない２人の間の関連性を提示する提示部を有する。

開示の友人探索プログラムは、コンピュータに、複数の人の情報と、複数の人における２人の間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成させる。
友人探索プログラムにおいては、更に、結合データベースを用いて、直接に関連性がない２人の間の関連性を探索させる。
友人探索プログラムにおいては、例えば、更に、関連性があると判断された、直接に関連性がない２人の間の関連性を提示させる。

結合データベースの構造は、例えば、人の情報をノードとし、関連性情報をエッジとするグラフ構造である。

関連性情報は、例えば、２人の間の直接の関連性の強さを表す情報であり、例えば、共通する趣味、共通する友人の数、ＳＮＳ内での会話の回数などが挙げられる。

友人探索方法、友人探索装置、及び友人探索プログラムにおいては、例えば、以下のようにして、単一のデータベースのみからでは調べることができない要素間の関連性を探索する。
図１４に、友人関係を探索する方法の一例のフローチャートを示す。図１５に、友人探索装置３の構成図を示す。

＜工程Ｓ５０１＞
まず、結合データベースの作成を行う（Ｓ５０１）。結合データベースの作成は、例えば、友人探索装置３の作成部２１において行われる。
工程Ｓ５０１では、例えば、図１６Ａに示すグラフ構造を有する第１のデータベースと、図１６Ｂに示すグラフ構造を有する第２のデータベースとを結合し、図１６Ｃに示すグラフ構造を有する結合データベースを作成する。
第１のデータベースは、人情報ｈ１～人情報ｈ３と、２人の間の直接の関連性を示す関連性情報ｙ１～関連性情報ｙ３とを有する。図１６Ａに示すグラフ構造は、人情報ｈ１～人情報ｈ３をノードとし、関連性情報ｙ１～関連性情報ｙ３をエッジとするグラフ構造である。
第２のデータベースは、人情報ｈ２、人情報ｈ３、人情報ｈ１１、及び人情報ｈ１２と、２人の間の直接の関連性を示す関連性情報ｙ１１～関連性情報ｙ１４とを有する。図１６Ｂに示すグラフ構造は、人情報ｈ２、人情報ｈ３、人情報ｈ１１、及び人情報ｈ１２をノードとし、２人の間の直接の関連性を示す関連性情報ｙ１１～関連性情報ｙ１４をエッジとするグラフ構造である。
結合データベースの作成では、例えば、重複する人情報を一つの人情報に統合する。
そうすると、第１のデータベースと第２のデータベースとを結合した結合データベースでは、図１６Ｃに示すように、人情報ｈ１、人情報ｈ２、人情報ｈ３、人情報ｈ１１、及び人情報ｈ１２と、２人の間の直接の関連性を示す関連性情報ｙ１、関連性情報ｙ２、及び関連性情報ｙ１１～関連性情報ｙ１４とを有する。図１６Ｃに示すグラフ構造は、人情報ｈ１、人情報ｈ２、人情報ｈ３、人情報ｈ１１、及び人情報ｈ１２をノードとし、関連性情報ｙ１、関連性情報ｙ２、及び関連性情報ｙ１１～関連性情報ｙ１４をエッジとするグラフ構造である。
なお、結合データベースを作成する際、２人の間の直接の関連性を示す関連性情報がある場合（例えば、人情報ｈ２、人情報ｈ３との間に、異なる関連性情報ｙ３と関連性情報ｙ１１とがある場合）、どちらの関連性情報を用いて結合データベースを作成してもよい。

＜工程Ｓ５０２＞
次に、結合データベースを用いて、直接に関連性がない２人の間の関連性を探索する（Ｓ５０２）。２人の間の関連性の探索は、例えば、友人探索装置３の探索部３２において行われる。
例えば、図１６Ｃに示すグラフ構造を有する結合データベースを用いて、直接に関連性がない人情報ｈ１と人情報ｈ１１との関連性を探索する。この関連性は、図１６Ａに示すグラフ構造を有する第１のデータベース単独、及び図１６Ｂに示すグラフ構造を有する第２のデータベース単独では見いだせない関連性である。人情報ｈ１と人情報ｈ１１との関連性の強さは、例えば、人情報ｈ１及び人情報ｈ１１間の一つの経路に存在する複数の関連性情報の合計により算出される。

＜工程Ｓ５０３＞
次に、関連性があると判断された、直接に関連性がない２人の間の関連性を提示する（Ｓ５０３）。提示は、例えば、友人探索装置３の提示部３３において行われる。
例えば、関連性の提示としては、例えば、共通する趣味、共通する友人の数の提示などが挙げられる。

開示のプログラムは、使用するコンピュータシステムの構成及びオペレーティングシステムの種類・バージョンなどに応じて、公知の各種のプログラム言語を用いて作成することができる。

開示のプログラムは、内蔵ハードディスク、外付けハードディスクなどの記録媒体に記録しておいてもよいし、ＣＤ－ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＤＶＤ－ＲＯＭ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＭＯディスク（Ｍａｇｎｅｔｏ－Ｏｐｔｉｃａｌｄｉｓｋ）、ＵＳＢメモリ〔ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ｆｌａｓｈｄｒｉｖｅ〕などの記録媒体に記録しておいてもよい。プログラムをＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＭＯディスク、ＵＳＢメモリなどの記録媒体に記録する場合には、必要に応じて随時、コンピュータシステムが有する記録媒体読取装置を通じて、これを直接、又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域（他のコンピュータ等）にプログラムを記録しておき、必要に応じて随時、外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することもできる。
プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。

開示のプログラムは、例えば、開示のコンピュータが読み取り可能な記録媒体に記録してなる。
コンピュータが読み取り可能な記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＭＯディスク、ＵＳＢメモリなどが挙げられる。
記録媒体は、プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。

図１７に、開示の関連性探索装置の一例を示す。
関連性探索装置１０は、例えば、ＣＰＵ１１、メモリ１２、記憶部１３、表示部１４、入力部１５、出力部１６、Ｉ／Ｏインターフェース部１７等がシステムバス１８を介して接続されて構成される。

ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１１は、演算（四則演算、比較演算等）、ハードウエア及びソフトウエアの動作制御などを行う。

メモリ１２は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）などのメモリである。ＲＡＭは、ＲＯＭ及び記憶部１３から読み出されたＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）及びアプリケーションプログラムなどを記憶し、ＣＰＵ１１の主メモリ及びワークエリアとして機能する。

記憶部１３は、各種プログラム及びデータを記憶する装置であり、例えば、ハードディスクである。記憶部１３には、ＣＰＵ１１が実行するプログラム、プログラム実行に必要なデータ、ＯＳなどが格納される。
プログラムは、記憶部１３に格納され、メモリ１２のＲＡＭ（主メモリ）にロードされ、ＣＰＵ１１により実行される。

表示部１４は、表示装置であり、例えば、ＣＲＴモニタ、液晶パネル等のディスプレイ装置である。
入力部１５は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス（例えば、マウス等）などである。
出力部１６は、各種データの出力装置であり、例えば、プリンタである。
Ｉ／Ｏインターフェース部１７は、各種の外部装置を接続するためのインターフェースである。例えば、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＭＯディスク、ＵＳＢメモリなどのデータの入出力を可能にする。

図１８に、開示の関連性探索装置の他の一例を示す。
図１８の一例は、クラウド型の構成例であり、ＣＰＵ１１が、記憶部１３等とは独立している。この構成例では、ネットワークインターフェース部１９、２０を介して、記憶部１３等を格納するコンピュータ３０と、ＣＰＵ１１を格納するコンピュータ４０とが接続される。
ネットワークインターフェース部１９、２０は、インターネットを利用して、通信を行うハードウェアである。

図１９に、開示の関連性探索装置の他の一例を示す。
図１９の一例は、クラウド型の構成例であり、記憶部１３が、ＣＰＵ１１等とは独立している。この構成例では、ネットワークインターフェース部１９、２０を介して、ＣＰＵ１１等を格納するコンピュータ３０と、記憶部１３を格納するコンピュータ４０とが接続される。

以上の実施形態に関し、更に以下の付記を開示する。
（付記１）
複数の要素と、前記複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成し、
前記結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索することを特徴とする関連性探索方法。
（付記２）
前記結合データベースの構造が、前記要素をノードとし、前記関連性情報をエッジとするグラフ構造である付記１に記載の関連性探索方法。
（付記３）
前記関連性があると判断された、前記直接に関連性がない２つの要素間の関連性を提示する付記１から２のいずれかに記載の関連性探索方法。
（付記４）
治療薬提示方法であって、
前記複数の要素が、複数のタンパク質の情報であり、
前記関連性情報が、前記複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報であり、
前記複数のデータベースが、以下（１）及び（２）の少なくともいずれかを満たし、
前記関連性を探索することが、変異タンパク質と、ターゲットタンパク質との関係性を探索することであり、
更に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示することを含む、付記１から２のいずれかに記載の関連性探索方法。
（１）前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報を有するデータベース、及び治療薬が直接作用する前記ターゲットタンパク質の情報を有するデータベースが含まれる。
（２）前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報と、治療薬が直接作用する前記ターゲットタンパク質の情報とを有するデータベースが含まれる。
（付記５）
前記結合データベースにおける個々の前記相互作用情報が、相互作用の相対的な強さを表す作用確率であり、
前記作用確率が、機械学習により設定される付記４に記載の関連性探索方法。
（付記６）
前記機械学習が、ベイズ推定による機械学習であり、
前記作用確率の初期値をベータ分布などの確率分布とし、高い作用確率を与える対象の相互作用情報の作用確率の初期値をベイズ更新した後に、学習データを用いて学習を行う、付記５に記載の関連性探索方法。
（付記７）
前記機械学習の際、更に、高い作用確率を与える対象の前記相互作用情報と類似する相互作用情報の作用確率の初期値に対して、高い作用確率を与える対象の前記相互作用情報の前記作用確率の前記初期値の前記ベイズ更新よりも弱いベイズ更新を行う、付記６に記載の関連性探索方法。
（付記８）
友人探索方法であって、
前記複数の要素が、複数の人の情報であり、
前記関連性情報が、前記複数の人における２人の間の直接の関連性を示す関連性情報であり、
前記関連性を探索することが、直接に関連性がない２人の間の関連性を探索することであり、
更に、前記関連性があると判断された、前記直接に関連性がない２人の間の関連性を提示することを含む、付記１に記載の関連性探索方法。
（付記９）
複数の要素と、前記複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成する作成部と、
前記結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索する探索部と、
を備えることを特徴とする関連性探索装置。
（付記１０）
前記結合データベースの構造が、前記要素をノードとし、前記関連性情報をエッジとするグラフ構造である付記９に記載の関連性探索装置。
（付記１１）
前記関連性があると判断された、前記直接に関連性がない２つの要素間の関連性を提示する提示部を有する付記９から１０のいずれかに記載の関連性探索装置。
（付記１２）
治療薬提示装置であって、
前記複数の要素が、複数のタンパク質の情報であり、
前記関連性情報が、複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報であり、
前記複数のデータベースが、以下（１）及び（２）の少なくともいずれかを満たし、
前記関連性を探索することが、変異タンパク質と、ターゲットタンパク質との関係性を探索することであり、
更に、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示する提示部を備える、付記９から１０のいずれかに記載の関連性探索装置。
（１）前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報を有するデータベース、及び治療薬が直接作用する前記ターゲットタンパク質の情報を有するデータベースが含まれる。
（２）前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報と、治療薬が直接作用する前記ターゲットタンパク質の情報とを有するデータベースが含まれる。
（付記１３）
前記結合データベースにおける個々の前記相互作用情報が、相互作用の相対的な強さを表す作用確率であり、
前記作用確率が、機械学習により設定される付記１２に記載の関連性探索装置。
（付記１４）
前記機械学習が、ベイズ推定による機械学習であり、
前記作用確率の初期値をベータ分布などの確率分布とし、高い作用確率を与える対象の相互作用情報の作用確率の初期値をベイズ更新した後に、学習データを用いて学習を行う、付記１３に記載の関連性探索装置。
（付記１５）
前記機械学習の際、更に、高い作用確率を与える対象の前記相互作用情報と類似する相互作用情報の作用確率の初期値に対して、高い作用確率を与える対象の前記相互作用情報の前記作用確率の前記初期値の前記ベイズ更新よりも弱いベイズ更新を行う、付記１４に記載の関連性探索装置。
（付記１６）
友人探索装置であって、
前記複数の要素が、複数の人の情報であり、
前記関連性情報が、前記複数の人における２人の間の直接の関連性を示す関連性情報であり、
前記関連性を探索することが、直接に関連性がない２人の間の関連性を探索することであり、
更に、前記関連性があると判断された、前記直接に関連性がない２人の間の関連性を提示する提示部を備える、付記９に記載の関連性探索装置。
（付記１７）
コンピュータに、
複数の要素と、前記複数の要素における２つの要素間の直接の関連性を示す関連性情報とをそれぞれに備える複数のデータベースを結合して、結合データベースを作成させ、
前記結合データベースを用いて、直接に関連性がない２つの要素間の関連性を探索させる、
ことを特徴とする関連性探索プログラム。
（付記１８）
前記結合データベースの構造が、前記要素をノードとし、前記関連性情報をエッジとするグラフ構造である付記１７に記載の関連性探索プログラム。
（付記１９）
前記関連性があると判断された、前記直接に関連性がない２つの要素間の関連性を提示する付記１７から１８のいずれかに記載の関連性探索プログラム。
（付記２０）
治療薬提示プログラムであって、
前記複数の要素が、複数のタンパク質の情報であり、
前記関連性情報が、複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報であり、
前記複数のデータベースが、以下（１）及び（２）の少なくともいずれかを満たし、
前記関連性を探索することが、変異タンパク質と、ターゲットタンパク質との関係性を探索することであり、
更に、コンピュータに、変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、変異タンパク質に起因する疾患の治療薬として提示させる、付記１７から１８のいずれかに記載の関連性探索プログラム。
（１）前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報を有するデータベース、及び治療薬が直接作用する前記ターゲットタンパク質の情報を有するデータベースが含まれる。
（２）前記複数のデータベースには、変異遺伝子から生成される前記変異タンパク質の情報と、治療薬が直接作用する前記ターゲットタンパク質の情報とを有するデータベースが含まれる。
（付記２１）
前記結合データベースにおける個々の前記相互作用情報が、相互作用の相対的な強さを表す作用確率であり、
前記作用確率が、機械学習により設定される付記２０に記載の関連性探索プログラム。
（付記２２）
前記機械学習が、ベイズ推定による機械学習であり、
前記作用確率の初期値をベータ分布などの確率分布とし、高い作用確率を与える対象の相互作用情報の作用確率の初期値をベイズ更新した後に、学習データを用いて学習を行う、付記２１に記載の関連性探索プログラム。
（付記２３）
前記機械学習の際、更に、高い作用確率を与える対象の前記相互作用情報と類似する相互作用情報の作用確率の初期値に対して、高い作用確率を与える対象の前記相互作用情報の前記作用確率の前記初期値の前記ベイズ更新よりも弱いベイズ更新を行う、付記２２に記載の関連性探索プログラム。
（付記２４）
友人探索プログラムであって、
前記複数の要素が、複数の人の情報であり、
前記関連性情報が、前記複数の人における２人の間の直接の関連性を示す関連性情報であり、
前記関連性を探索することが、直接に関連性がない２人の間の関連性を探索することであり、
更に、コンピュータに、前記関連性があると判断された、前記直接に関連性がない２人の間の関連性を提示させることを含む、付記１７から１８のいずれかに記載の関連性探索プログラム。

１関連性探索装置
２治療薬提示装置
３友人探索装置
１１作成部
２１作成部
３１作成部
１２探索部
２２探索部
２３提示部
３３提示部

Claims

プログラムされたコンピュータによって治療薬の関連性を探索して提示する治療薬提示方法であって、
複数のタンパク質の情報と、前記複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報とをそれぞれに備える、以下（１）及び（２）の少なくともいずれかを満たす複数のデータベースを結合して、前記タンパク質の情報をノードとし、前記相互作用情報をエッジとするグラフ構造を有する結合データベースを作成し、
（１）前記複数のタンパク質の情報が、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報を有するデータベース、及び前記ターゲットタンパク質の情報を有するデータベースを含む
（２）前記複数のタンパク質の情報が、前記変異タンパク質の情報と、前記治療薬が直接作用する前記ターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報とを有するデータベースを含む
前記結合データベースを用いて、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報との関係性を探索し、
前記変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、前記変異タンパク質に起因する疾患の治療薬として提示することを特徴とする治療薬提示方法。
前記結合データベースにおける個々の前記相互作用情報が、相互作用の相対的な強さを表す作用確率であり、
前記作用確率が、機械学習により設定される請求項１に記載の治療薬提示方法。
前記機械学習が、ベイズ推定による機械学習であり、
前記作用確率の初期値を、作用確率を表す確率分布とし、高い作用確率を与える対象の相互作用情報の作用確率の初期値をベイズ更新した後に、学習データを用いて学習を行う、請求項２に記載の治療薬提示方法。
前記機械学習の際、更に、高い作用確率を与える対象の前記相互作用情報と類似する相互作用情報の作用確率の初期値に対して、高い作用確率を与える対象の前記相互作用情報の前記作用確率の前記初期値の前記ベイズ更新よりも弱いベイズ更新を行う、請求項３に記載の治療薬提示方法。
複数のタンパク質の情報と、前記複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報とをそれぞれに備える、以下（１）及び（２）の少なくともいずれかを満たす複数のデータベースを結合して、前記タンパク質の情報をノードとし、前記相互作用情報をエッジとするグラフ構造を有する結合データベースを作成する作成部と、
（１）前記複数のタンパク質の情報が、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報を有するデータベース、及び前記ターゲットタンパク質の情報を有するデータベースを含む
（２）前記複数のタンパク質の情報が、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報とを有するデータベースを含む
前記結合データベースを用いて、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報との関係性を探索する探索部と、
前記変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、前記変異タンパク質に起因する疾患の治療薬として提示する提示部と、
を備えることを特徴とする治療薬提示装置。
コンピュータに、
複数のタンパク質の情報と、前記複数のタンパク質における２つのタンパク質間の相互作用を示す相互作用情報とをそれぞれに備える、以下（１）及び（２）の少なくともいずれかを満たす複数のデータベースを結合して、前記タンパク質の情報をノードとし、前記相互作用情報をエッジとするグラフ構造を有する結合データベースを作成させ、
（１）前記複数のタンパク質の情報が、変異遺伝子から生成される変異タンパク質の情報と、治療薬が直接作用するターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報を有するデータベース、及び前記ターゲットタンパク質の情報を有するデータベースを含む
（２）前記複数のタンパク質の情報が、前記変異タンパク質の情報と、前記治療薬が直接作用する前記ターゲットタンパク質の情報とを含み、
前記複数のデータベースが、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報とを有するデータベースを含む
前記結合データベースを用いて、前記変異タンパク質の情報と、前記ターゲットタンパク質の情報との関係性を探索させ、
前記変異タンパク質に対して関係性があると判断されたターゲットタンパク質に作用する治療薬を、前記変異タンパク質に起因する疾患の治療薬として提示させる、
ことを特徴とする治療薬提示プログラム。