JP2016204376A

JP2016204376A - リード化合物の抽出方法、創薬ターゲットの選択方法及び散布図生成装置並びにデータの可視化方法及び可視化装置

Info

Publication number: JP2016204376A
Application number: JP2016085433A
Authority: JP
Inventors: 昌邦黒野; Masakuni Kurono; 啓江頭; Hiroshi Egashira; 竹内　淳; Atsushi Takeuchi; 淳竹内
Original assignee: Ono Pharmaceutical Co Ltd
Current assignee: Ono Pharmaceutical Co Ltd
Priority date: 2015-04-22
Filing date: 2016-04-21
Publication date: 2016-12-08
Anticipated expiration: 2036-04-21
Also published as: WO2016171220A1; JP6135795B2; GB201717613D0; US20180089363A1; JP2017130207A; GB2555252A8; JP6191791B2; GB2555252A

Abstract

【課題】良質なリード化合物の抽出方法及び創薬ターゲットの選択方法を提供する。
【解決手段】創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する方法であって、複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、散布図上の所定領域5内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含む。散布図において、化合物の第１及び第２の特性（例えば、選択性及び活性値）に基づきシンボル3の配置位置が決定され、化合物の第３及び第４の特性（例えば、分子量及びリガンド効率）に基づきシンボル3の属性（例えば、色、大きさ）が決定される。
【選択図】図１

Description

本発明は、リード化合物の抽出方法、創薬ターゲットの選択方法及びそれらの方法に用いる散布図を生成する装置に関する。また、本発明はデータの可視化方法及び可視化装置に関する。

医薬品の開発の成功確率は非常に低い。今や、医薬品の候補として研究を始めた化合物が新薬として世に出る成功確率は３万５９１分の１と言われている。成功率を高め、少しでも早く新薬を世に出すためには、良質なリード化合物を取得することが肝要である。

リード化合物とは、創薬標的（以下「創薬ターゲット」ともいう）に対する活性と薬理作用を示す"drug like"な化合物で、さらなる最適化（Lead Optimization）の出発点となりうる化合物のことをいう。

リード化合物がそのまま医薬品になることはまずない。医薬品の候補化合物として認められるためには、活性の強度だけでなく、主活性に対する他の活性との選択性、動物実験における薬理作用、薬物動態、安全性、原薬の安定性、製造コスト、または特許性等、様々な観点から検討し、それらをすべて満足させねばならない。したがって、それら項目を満たすべく、リード化合物を起点として、広範囲にわたる合成展開が通例行われる。

すなわち、リード化合物のなかでも、合成展開の可能性の期待値が高い化合物を、良質なリード化合物と呼ぶことができる。

リード化合物は、創薬標的に対する化合物スクリーニングにより、ある設定基準以上の活性を示す化合物（ヒット化合物）から選択される。化合物スクリーニングにより得られた結果は、例えばヒートマップ等の形式で可視化され、リード化合物の選択に利用することができる。また、活性と選択性について二次元散布図を作成し、高活性かつ高選択性を有する化合物を選択する方法も知られている（非特許文献１、非特許文献２）。

ところで、昨今、コンビナトリアルケミストリーやハイスループットスクリーニングの技術の発展により、多種類の化合物ライブラリに対して、多様なスクリーニングを短期間に行うことができるようになった。また、情報処理技術も進歩し、数百万データポイントといった大量のデータをコンピュータで処理することができるようになった。

ヒートマップは、化合物と活性値の関係を一枚で見るには便利な表示システムであるが、データを俯瞰的に捉えることが難しく、とりわけデータポイント数が膨大になるとその取扱いは大変である。また、二次元散布図により、高活性かつ高選択性を有する化合物群を選択することはできるものの、その群に合成展開の可能性を期待できるか否かは判断できなかった。

特開２０１５−１９４３号公報

"High-throughput kinase profiling as a platform for drug discovery", David M. Goldstein, et al., Nature Reviews Drug Discovery，2008，7，391-397 "CASE Plots for the Chemotype-Based Activity and Selectivity Analysis: A CASE Study of Cyclooxygenase Inhibitors", Jaime Perez-Villanueva, et al.，Chem Biol Drug Des.，2012，80，752-762 「創造的創薬研究の橋渡しに向けて」独立行政法人医薬基盤研究所パンフレット（http://www.nibio.go.jp/part/promote/fundamental/pdf/link.pdf）

多種類の化合物ライブラリから得られる膨大なデータから良質なリード化合物を抽出する方法や、合成展開の可能性を期待できる創薬ターゲットを選択する方法が望まれている。

本発明は、合成展開の可能性を期待できる良質なリード化合物や創薬ターゲットを抽出／選択する方法を提供することを目的とする。また、本発明は、それらの方法に用いる散布図を生成する散布図生成装置を提供することを目的とする。

本発明者らは上記の課題に鑑み、鋭意検討した結果、スクリーニングによって得られた活性、選択性、分子量およびリガンド効率の値を用い、四次元散布図を作成することにより、良質なリード化合物を選択できることを見出した。すなわち、合成展開の可能性を俯瞰的に考察することができる、良質なリード化合物を選択するための膨大なデータポイントの四次元散布図を用いた可視化方法を見出し、本発明を完成した。

この四次元散布図を用いれば、四次元散布図作成時点では良質なリード化合物を見いだせなくても、対象の創薬ターゲットが、将来的に合成展開することによって医薬品の候補化合物が得られるものか否かを判断することができる。

さらに、この四次元散布図を用いれば、ある創薬ターゲットに対して、その化合物ライブラリから合成展開すべきか否かを判断することもできる。すなわち、ある創薬ターゲットに対するその化合物ライブラリの適性を判断することができる。

本発明の第１の態様において、創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する方法が提供される。リード化合物を抽出する方法は、複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、散布図上の所定領域内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含む。散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定され、化合物の第３及び第４の特性に基づきシンボルの属性が決定される。

本発明の第２の態様において、創薬ターゲットの選択方法が提供される。創薬ターゲットの選択方法は、所定の分子ターゲットについて、複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、散布図上に配置されたシンボルの分布に基づいて、所定の分子ターゲットを創薬ターゲットとして選択するステップと、を含む。散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定され、化合物の第３の特性に基づきシンボルの属性が決定される。化合物は、第３の特性に関する所定の条件に基づき複数のグループに分類されており、選択するステップは、各グループに属する化合物のシンボルの分布の変化の方向に基づいて、所定の分子ターゲットを創薬ターゲットとして選択するか否かを決定する。

本発明の第３の態様において、所定の創薬ターゲットに対する複数の化合物の特性を示す散布図を生成する散布図生成装置が提供される。散布図生成装置は、複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段と、複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して散布図を生成して出力する散布図作成手段と、を備える。散布図作成手段は、化合物毎に、化合物の第１及び第２の特徴量に基づき散布図上のシンボルの配置位置を決定し、化合物の第３及び第４の特徴量に基づきシンボルの属性を決定して、決定した位置及び属性に基づき化合物を示すシンボルを散布図上に配置する。

本発明の第４の態様において、少なくとも第１ないし第４の特性を有するデータの傾向を可視化する可視化方法が提供される。可視化方法は、第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、第３及び第４の特性に基づき、各データを示すシンボルの属性を決定し、決定した位置並びに属性に基づいて、各データを示すシンボルを散布図上に配置する。

本発明の第５の態様において、少なくとも第１ないし第４の特性を有するデータの傾向を可視化する可視化装置が提供される。可視化装置は、複数のデータについて、データ毎の特性に関する特性情報を取得する取得手段と、取得したデータの特性情報に基づいて散布図を生成する散布図生成手段と、を備える。散布図生成手段は、第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、第３及び第４の特性に基づき、各データを示すシンボルの属性を決定し、決定した位置及び属性に基づき各データを示すシンボルを散布図上に配置する。

本発明の第６の態様において、創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する第２の抽出方法が提供される。第２の抽出方法は、複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、散布図上の所定領域内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含む。散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定される。第１の特性は、所定の創薬ターゲットに対する化合物の選択性であり、第２の特性は、所定の創薬ターゲットに対する化合物の活性である。所定領域は、化合物の選択性及び化合物の活性の双方が所定値以上となる領域である。第２の抽出方法は、所定領域に配置されたシンボルが示す化合物のうちリガンド効率が0.3以上である化合物を抽出する。

本発明の第７の態様において、少なくとも第１ないし第３の特性を有する複数のデータの傾向を可視化する第２の可視化方法が提供される。第２の可視化方法は、第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、決定した位置に基づいて、各データを示すシンボルを散布図上に配置し、第３の特性に関して所定の条件でデータを複数のグループに分類し、分類した複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印を散布図上に配置する。

本発明のリード化合物の抽出方法によれば、散布図上の所定領域の中からリード化合物の候補を抽出することで、合成展開の可能性を期待できる良質なリード化合物を抽出することが可能となる。

本発明の創薬ターゲットの選択方法によれば、第３の特性に関して分類された各グループ内における化合物のシンボルの分布の変化の方向と終点に基づいて、所定のターゲットを、創薬に用いる創薬ターゲットとして選択する。これにより、合成展開の可能性を期待できる創薬ターゲットを選択することが可能となる。

本発明の散布図生成装置は、上記のリード化合物の抽出または創薬ターゲットの選択に好適な散布図を提供することができる。この散布図において、散布図にプロットする化合物のシンボルの位置は化合物の第１及び第２の特性に基づき設定され、シンボルの属性（色、大きさ等）は化合物の第３及び第４の特性に基づき設定される。これにより、化合物の４つの特性を同時に視覚的に把握することが可能となる。また、データを俯瞰的に捉えることが可能となり、合成展開の可能性の予測が可能となる。

本発明の可視化装置及び可視化方法によれば、解析対象データの４つの特性について同時に視覚的に認識することができ、解析対象データの傾向を容易に把握することができる。

所定の創薬ターゲットに対して複数の化合物を示すシンボルを各化合物の種々の特性に基づいてプロットした四次元散布図の一例を示した図２種のキナーゼ（創薬ターゲット）の阻害化合物についての、既存の可視化形態である活性と選択性を用いた二次元散布図を示した図２種のキナーゼ（創薬ターゲット）の阻害化合物についての、本実施形態の可視化形態である四次元散布図を示した図合成展開の可能性を予測する矢印を配置した四次元散布図を示した図合成展開の可能性を予測する矢印のみを配置した図５種のキナーゼ（創薬ターゲット）のそれぞれに対する四次元散布図が並べて表示された態様を示した図５種のキナーゼ（創薬ターゲット）について、それぞれの四次元散布図から発生させた、合成展開の可能性を予測する矢印のみを示した図ターゲットCに対して数万化合物を評価した結果を示した図四次元散布図生成装置のハードウェア構成を示した図四次元散布図生成装置における四次元散布図の表示動作を示すフローチャート高活性・高選択性の領域において第１優先領域と第２優先領域とを区別して示すための枠を説明した図四次元散布図生成装置における合成展開の可能性を予測する矢印の生成処理を示すフローチャート有望な創薬ターゲットの判定処理を示すフローチャート複数の創薬ターゲットに対して合成展開の可能性を予測する矢印を表示する場合の表示態様の他の例を示した図複数の創薬ターゲットに対して合成展開の可能性を予測する矢印を表示する場合の表示態様のさらに別の例を示した図気象データに関する四次元散布図の例を示した図医療データに関する四次元散布図の例を示した図

以下、添付の図面を参照しながら、本発明の実施形態を説明する。

以下の開示において、分子ターゲットとは、生体内にあり、臨床的障害や疾患を引き起こす原因と深く関わっており、それを何らかの方法で制御することにより、その疾患を予防および／または治療することができる機能性高分子を意味する。具体的には、受容体（例えば、イオンチャネル共役型受容体、チロシンキナーゼ共役型受容体、Ｇタンパク質共役型受容体等の細胞表面受容体、レチノイン酸受容体、ステロイドホルモン受容体等の核内受容体等）、酵素（例えば、デヒドロゲナーゼ、レダクターゼ、オキシダーゼ、オキシゲナーゼ、ヒドロペルオキシダーゼ等の酸化還元酵素、メチルトランスフェラーゼ、ヒドロキシメチルトランスフェラーゼ、ホルミルトランスフェラーゼ、カルボキシルトランスフェラーゼ、カルバモイルトランスフェラーゼ、アミドトランスフェラーゼ、アシルトランスフェラーゼ、アミノアシルトランスフェラーゼ、グリコシルトランスフェラーゼ、アミノトランスフェラーゼ、オキシミノトランスフェラーゼ、ホスホトランスフェラーゼ（例えば、キナーゼ等）、ヌクレオチジルトランスフェラーゼ、スルファートランスフェラーゼ、スルホトランスフェラーゼ、ＣｏＡトランスフェラーゼ等の転移酵素、プロテアーゼ、エステラーゼ、グリコシダーゼ、ペプチダーゼ等の加水分解酵素、アルドラーゼ、デカルボキシラーゼ、デヒドラターゼ、カルボキシキナーゼ等のリアーゼ、ラセマーゼ、エピメラーゼ、シス−トランスイソメラーゼ、糖イソメラーゼ、トートメラーゼ、Δ−イソメラーゼ、ムターゼ、シクロイソメラーゼ等の異性化酵素、ＤＮＡリガーゼ等のリガーゼ等）、輸送体タンパク質（例えば、イオンチャネル、イオンポンプ等）、核酸（例えば、ｍｉｃｒｏ‐ＲＮＡ、ＲＮＡ、ＤＮＡ等）等が挙げられる。

また、創薬ターゲットとは、分子ターゲットのうち、創薬の対象とするターゲットを意味する。創薬ターゲットは、好ましくは酵素であり、より好ましくは、転移酵素であり、特に好ましくは、キナーゼである。創薬ターゲットは、酵素以外に、受容体または輸送体タンパク質であってもよい。

また、リード化合物とは、創薬ターゲットにおける活性を有し、該創薬ターゲット以外の分子ターゲットにおける活性が該創薬ターゲットにおける活性よりも弱い化合物であって、構造変換によって医薬品になりうる化合物を意味する。創薬ターゲットにおける活性は、まだ十分に強くない場合もある。また、目的とする医薬品によっては、２以上の創薬ターゲットにおける活性を有するリード化合物が望まれることもある。

散布図とは、縦軸、横軸に２つの項目（特性）について量や大きさ等を対応させてデータをシンボルでプロットした図である。すなわち、各データは２つの項目（特性）について量や大きさ等を有する。

（実施の形態１）
１．四次元散布図
最初に、リード化合物の抽出または創薬ターゲットの選択に使用する四次元散布図について説明する。

図１は、本実施形態における四次元散布図の一例を示した図である。同図に示す四次元散布図は、ある対象キナーゼ（創薬ターゲットまたは分子ターゲットの一例）に対する化合物の活性値（例えば、pIC₅₀）、選択性（例えば、エントロピースコア）、リガンド効率、分子量の４つのパラメータに基づいて、複数の化合物をプロットした散布図である。同図に示すように、四次元散布図は、横軸（X軸）を選択性とし、縦軸（Y軸）を活性値とし、選択性−活性値の二次元平面上に化合物を示すシンボル３（○マーク）がプロットされて生成される。化合物を示すシンボル３の色及び大きさは化合物の分子量及びリガンド効率のそれぞれに基づいて決定される（詳細は後述）。このような四次元散布図によれば、化合物の４つの特性を同時に視覚的に把握することが可能となり、また、データを俯瞰的に捉えることが可能となり、合成展開の可能性の予測が可能となる。

以下、四次元散布図の生成に使用される活性値、選択性およびリガンド効率の算出方法について説明する。

（１）活性値の算出
創薬ターゲットに対するリード化合物の活性としては、受容体結合活性、受容体制御活性、受容体シグナル伝達活性化活性、受容体シグナル伝達阻害活性、酵素制御活性、酵素活性化活性、酵素阻害活性、チャネル結合活性、チャネル制御活性、チャネル活性化活性、チャネル阻害活性、ポンプ結合活性、ポンプ制御活性、ポンプ活性化活性、ポンプ阻害活性、タンパク‐タンパク相互作用の阻害剤等が挙げられる。

活性値の表記方法は、特に限定されないが、例えば、活性化率、阻害率、制御率、半数活性化濃度（EC₅₀）、pEC₅₀、半数阻害濃度（IC₅₀）、pIC₅₀、見積り半数阻害濃度（eIC₅₀）、peIC₅₀、半数致死濃度（LC₅₀）、pLC₅₀、活性化定数（K_a）、pK_a、阻害定数（K_i）、pK_i、解離定数（K_d）、pK_d、半数有効用量（ED₅₀）、pED₅₀、半数阻害用量（ID₅₀）、pID₅₀、半数致死用量（LD₅₀）、pLD₅₀、結合速度定数（k_on）、解離速度定数（k_off）、滞留時間（Residence time）、自由エネルギー（ΔG）、エンタルピー（ΔH）、エントロピー（ΔS）、融解温度（Tm）等が挙げられる。好ましくは、活性化率、阻害率、半数活性化濃度、pEC₅₀、半数阻害濃度、pIC₅₀、活性化定数、pK_a、阻害定数、pK_i、解離定数、pK_dであり、より好ましくは、半数活性化濃度、pEC₅₀、半数阻害濃度、pIC₅₀、活性化定数、pK_a、阻害定数、pK_i、解離定数、pK_dであり、特に好ましくは、半数阻害濃度（IC₅₀）、pIC₅₀である。

本実施形態では、活性値の表記方法の例として半数阻害濃度IC₅₀（pIC₅₀）を用いた。以下、酵素阻害活性についての半数阻害濃度（IC₅₀（pIC₅₀））の算出方法を説明する。

アッセイバッファー（20mM HEPES, 0.01% Triton X-100, 2mM DTT, pH7.5）にて調製した5mLの4倍濃度被験物質溶液（数千化合物）、5mLの4倍濃度基質/ATP/金属イオン（マグネシウムイオン、所望によりさらにマンガンイオンを加える（キナーゼによって異なる））溶液および10mLの2倍濃度キナーゼ溶液（数百種類）をポリプロピレン製384ウェルプレートのウェル内で混合し、室温にて1もしくは5時間（キナーゼによって異なる）反応させた。60mLのTermination Buffer（QuickScout Screening Assist MSA; Carna Biosciences社製）を添加して反応を停止させた。反応溶液中の基質ペプチドとリン酸化ペプチドをLabChip3000 system（Caliper LifeScience社製）にて分離、定量した。キナーゼ反応は基質ペプチドピーク高さ（S）とリン酸化ペプチドピーク高さ（P）から計算される生成物比（P/(P+S)）にて評価した。

全ての反応コンポーネントを含むコントロールウェルの平均シグナルを0% Inhibition、バックグランドウェル（酵素非添加）の平均シグナルを100% Inhibitionとし、各被験物質試験ウェルのシグナルから阻害率（%）を計算した。

基質のリン酸化を50％阻害する化合物濃度をIC₅₀と定義した。IC₅₀値は、得られた阻害率を以下のlogistic式に入れて最小二乗法により算出した。
Y＝Bottom＋(Top−Bottom）／(1＋10^(HillSlope×(logIC₅₀−log₁₀ (X)))
ここで、Y：阻害率（%）、X：濃度、Top：最大の阻害率（当実験では100）、Bottom：最小の阻害率（当実験では0）、HillSlope：傾き（当実験では1）

上式において、決定係数R² > 0.5, LogIC₅₀最大誤差 < 1を満たさない場合は、最大評価濃度の阻害率（%）を用いて、下記の式によりIC₅₀値を算出した。
IC₅₀＝ 100×X/Y−X
ここで、Y：阻害率（%）、X：濃度（μM）

最大評価濃度での阻害率（%）が20%以下、すなわち活性を示さなかった場合は、後の選択性の指標とするエントロピースコアの算出に用いるため、一定の値とした。今回の場合は最大評価濃度が10μMのときのIC₅₀値は4,000μM、最大評価濃度が100μMの時のIC₅₀値は40,000μMとした。

上記方法により算出したIC₅₀値を、pIC₅₀値すなわちモル濃度での−logIC₅₀値に変換し、これを活性値とした。

（２）選択性の算出
リード化合物の選択性とは、対象とする創薬ターゲット以外の分子ターゲットにおけるリード化合物の活性に対する、対象とする創薬ターゲットにおけるリード化合物の活性の比率を意味する。

リード化合物の創薬ターゲットに対する選択性の指標は、特に限定されないが、例えば、エントロピースコア（Entropy Score）、選択性エントロピー（selectivity entropy）、情報エントロピー（information entropy）、シャノンエントロピー（Shannon entropy）、選択性スコア（selectivity score）、選択性指数（selectivity index）、ジニ係数（Gini coefficient）、ジニスコア（Gini score）、分配係数（partition coefficient）等が挙げられる。好ましくは、エントロピースコア、選択性スコア、選択性指数、ジニ係数、分配係数であり、より好ましくは、ジニ係数、エントロピースコアであり、特に好ましくは、エントロピースコアである。

本実施形態では、選択性の指標としてエントロピースコア（Entropy Score）を用いた。エントロピースコアは、上記方法で算出したIC₅₀値から非特許文献（BMC Bioinformatics、2011、12、94）にしたがって算出した。選択性の指標として、エントロピースコアに代えて、選択性スコア（Nature Biotechnology, 2008, 26, 1, 127）、ジニ係数（J.Med.Chem., 2007, 50, 23, 5773）、分配係数（J.Med.Chem., 2010, 53, 11, 4502）などを用いてもよい。

（３）リガンド効率の算出
リガンド効率とは、分子の大きさ当たりの活性の強さを見積もった化合物の評価指標を意味する。

リガンド効率の指標は、特に限定されないが、例えば、リガンド効率（ligand efficiency）、パーセント阻害効率指数（percentage efficiency index）、結合効率指数（binding efficiency index）、表面結合効率指数（surface-binding efficiency index）、フィットクオリティスコア（fit quality score）、パーセント阻害効率（Percent Ligand Efficiency）、グループ効率（group efficiency、GE）、リガンド脂溶性効率（ligand lipophilicity efficiency、LLE）等が挙げられる。好ましくは、リガンド効率、パーセント阻害効率指数、結合効率指数，表面結合効率指数であり、より好ましくは、リガンド効率，パーセント阻害効率指数であり、特に好ましくは、リガンド効率である。

本実施形態では、リガンド効率は、上記方法で算出したIC₅₀値と、化合物の水素を除外した原子（重原子）の数とを用いて、文献（Drug Discovery Today, 2005, 10, 987）に記載の方法にしたがって算出した。

各創薬ターゲットに対して上記方法で算出した活性値（pIC₅₀）、選択性（エントロピースコア（Entropy Score））、リガンド効率、そして分子量の４つの特性を用いて図１に示すような四次元散布図を作成した。すなわち、四次元散布図の縦軸（Y軸）を活性値とし、横軸（X軸）を選択性として、化合物を示すシンボル３をプロットした。さらに、プロットするシンボル３の色を分子量に応じて異ならせた。図１の例では、化合物を、分子量が300未満の第１グループ、分子量が300以上かつ350未満の第２グループ、分子量が350以上の第３グループの３つのグループに分類し、それぞれのグループ毎に化合物を示すシンボル３の色（例えば、赤、黄、青）を異ならせている。

また、シンボル３の大きさを、リガンド効率に応じて異ならせた。図１の例では、リガンド効率の値が大きいときは、シンボル３の大きさをより大きな大きさとし、リガンド効率の値が小さいときは、シンボル３の大きさをより小さい大きさとした。また、リガンド効率の値が一定値よりも大きいときには、シンボル３の大きさをある一定の大きさとして表わし、リガンド効率の値が一定値よりも小さいときには、シンボル３の大きさをある一定の小ささとして表わした。

活性値としてpIC₅₀を用いた場合、リード化合物のpIC₅₀としては、好ましくは、４以上であり、より好ましくは、５以上であり、特に好ましくは、６以上である。選択性としてエントロピースコアを用いた場合、リード化合物のエントロピースコアとしては、好ましくは、４以下であり、より好ましくは、３以下であり、特に好ましくは、２以下である。リード化合物の分子量としては、500以下が好ましく、400以下がより好ましく、350以下が特に好ましい。リード化合物のリガンド効率としては、0.25以上が好ましく、0.3以上がより好ましく、0.35以上が特に好ましい。

図１に示す四次元散布図では、縦軸に示した活性値は数値が大きいほど活性が強く、横軸に示した選択性は数値が小さいほど選択性が良い化合物を示す。リード化合物の抽出のための、四次元散布図上の所定領域としては、活性値としてpIC₅₀を用い、選択性の評価方法としてエントロピースコアを用いた場合、好ましくは、pIC₅₀が６以上、かつエントロピースコアが４以下であり、より好ましくは、pIC₅₀が７以上、かつエントロピースコアが３以下であり、特に好ましくは、pIC₅₀が８以上、かつエントロピースコアが２以下である。すなわち、活性が８以上かつ選択性が２以下の領域は、リード化合物として特に好ましい化合物が含まれる領域を示す。このことから、高活性・高選択性の領域５を示す枠を四次元散布図上に配置した。高活性・高選択性の領域５は、リード化合物としてより好ましい化合物が含まれる領域である。この領域５に含まれる化合物に着目することにより、リード化合物として好ましい化合物を容易に認識することができる。

一般に、リード化合物はより低分子量で高活性と高選択性を持つことが好ましい。四次元散布図では、分子量に応じてシンボルの色を異ならせることにより、分子量の変化に伴って活性や選択性が向上していることが認識し易くなる。さらに、四次元散布図では、リガンド効率をその値に応じてシンボルの大きさで表現した。これにより、分子量の小さい化合物でも活性を示すような効率の良い化合物も一目で理解することができる。シンボル（○マーク）が大きいほどその化合物が効率よく活性を獲得していることを示す（図１参照）。

図２(A),(B)はそれぞれ、２種のキナーゼ（創薬ターゲット）A,Bに対する、既存の可視化形態である活性と選択性を用いた二次元散布図を示している。キナーゼA,Bの双方とも、高活性・高選択的な領域５に化合物がプロットされている。既存の可視化形態では、高活性・高選択性の化合物が良質なリード化合物に成り得るか否かは不明である。

図３は、キナーゼ（創薬ターゲット）A,Bに対する、本発明の実施形態である四次元散布図を示した図である。図３に示す四次元散布図においては、良質なリード化合物として重要な因子である分子量の分布が理解でき、さらにリガンド効率も一目で認識できる。例えば、図３(A)を参照すると、キナーゼAについて領域５内には、分子量300未満および300以上350未満であって、且つリガンド効率の良い化合物が複数存在する。これに対し、図３(B)を参照すると、キナーゼBの領域５内の化合物は、ほとんどが分子量350以上であってリガンド効率の悪い化合物である。たとえ高活性・高選択的な化合物であっても、リガンド効率が悪ければ、リード化合物としては適当ではない。すなわち、キナーゼBよりもキナーゼAの方がより良質なリード化合物を取得できることがわかる。

２．リード化合物の抽出方法
四次元散布図における高活性・高選択性の領域５は、リード化合物としてより好ましい化合物が含まれる領域である。よって、この領域５に含まれる化合物群の中から化合物を抽出する。これによりリード化合物として好ましい化合物を抽出することができる。なお、高活性・高選択性の領域５に含まれる化合物群の中から、さらに、分子量及び／またはリガンド効率が所定の条件を満たす化合物を選択するようにしてもよい。所定の条件として、例えば、分子量については所定値以下であり、リガンド効率について所定値以上としてもよい。例えば、高活性・高選択性の領域５に含まれる化合物のうち、リガンド効率が0.3以上のものをリード化合物として抽出してもよい。または、高活性・高選択性の領域５に含まれる化合物のうち、分子量が350以下でかつリガンド効率が0.3以上のものをリード化合物として抽出してもよい。

３．合成展開の可能性を予測するための矢印の表示
図４は、合成展開の可能性を予測するための矢印７をさらに配置した四次元散布図を示した図である。図５は、図４に示す図において、プロットされたシンボルを排除して合成展開の可能性を予測するための矢印７、化合物の分布の重心G１,G２,G３、及び化合物の分布の重心の好ましい領域を示した図である。四次元散布図に配置された矢印７を参照することにより、四次元散布図に示す対象キナーゼ（換言すれば、創薬ターゲット候補である分子ターゲット）についてリード化合物からの合成展開の可能性を予測することができ、その対象キナーゼ（分子ターゲット）が創薬ターゲットとして適切か否かを判断することが可能となる。

矢印７を求めるにあたっては、最大評価濃度の阻害率が20％以下の化合物データを除外した。各キナーゼについて、分子量分類ごとに活性値（pIC₅₀）、選択性、リガンド効率の各データにおいて、平均値よりも良い化合物のデータを採用した。本例では、平均よりも良いデータを採用する作業であるが、上位から任意の数のより良いデータを使用することも可能である。

各キナーゼにおいて、分子量の３つの分類グループの各々において、選択性−活性値の二次元平面における化合物の分布の重心G１,G２,G３を算出し、図４、図５に示すように、分子量の範囲が隣接するグループ間で重心G１,G２,G３を矢印７で結んだ。すなわち、重心G１-G２間及び重心G２-G３間を矢印７で結んだ。この矢印７は、分子量が小さい方から大きい方へ変化する際の分布の重心の変化の方向（すなわち、分布の変化方向）を示す。重心G１は分布の変化の始点を示し、重心G３は分布の変化の終点を示す。重心G１,G２,G３は、それぞれ分子量について分類された第１ないし第３グループにおける選択性−活性値の二次元平面上での分布の重心であり、具体的には、活性値と選択性のそれぞれの特性値について下記式により求められる。
Gx＝（X1＋X2＋…＋Xn）／ n (1)
ここで、Xn：活性値（Y座標値）または選択性の値（X座標値）、Gx：特性値の重心（x=1〜3）、n：分子量に基づき分類された各グループに属する化合物の数。

または、標準化した活性、選択性、リガンド効率の値を用いて、活性値と選択性のデータにリガンド効率のデータで重み付けした後に、各キナーゼにおいて、分子量分類ごとに活性値、選択性の各重心を算出し、算出した重心から重み付けした矢印７を求めてもよい。
Sx＝（Xi−Xmin）／（Xmax−Xmin） (2)
ここで、Xi：活性値（Y座標値）または選択性の値（X座標値）(i=1〜n)、Sx：標準化後の特性値の値、Xmin：最小値、Xmax：最大値。
Wz＝（Wi−Wmin）／（Wmax−Wmin） (3)
ここで、Wi：リガンド効率の値(i=1〜n)、Wz：標準化後の特性値の値、Wmin：最小値、Wmax：最大値。
G'x＝{（S1×W1）＋（S2×W2）＋…＋（Sn×Wn）}／ΣWi (4)
ここで、G'x：重み付けした特性値の重心（x=1〜3）。

４．創薬ターゲットの選択方法
以上のようにして、ある分子ターゲットに対して求めた重心G１,G２,G３の位置及び重心G１-G２間、G２-G３間の矢印の方向に基づいて、その分子ターゲットが創薬ターゲットとして適しているか否かを判断する。具体的には、以下に示す条件Aを満たすとともに、条件B１、B２及びB３の少なくともいずれか一方を満たす場合に、その分子ターゲットが創薬ターゲットとして適していると判断する。
条件A）重心G１-G２間の矢印（重心G１から重心G２へ向かう矢印）が領域の方向（散布図における左上方向、以下「高活性・高選択性領域５」ともいう）を向いている。
条件B１）重心G２が高活性・高選択性領域５内に含まれる。
条件B２）重心G２-G３間の矢印（重心G２から重心G３へ向かう矢印）が領域の方向（散布図における左上方向）を向いている。かつ、分布の変化の終点として示される重心G３が、高活性・高選択性領域５内に含まれる。
条件B３）重心G２-G３間の矢印が領域の方向（散布図における左上方向）を向いている。かつ、分布の変化の終点として示される重心G３が所定の活性値（pIC₅₀が５以上）の範囲に含まれる。

図６に、５種の分子ターゲット（キナーゼ）A〜Eに対する四次元散布図の例を示す。図７は、分子ターゲットA〜Eの四次元散布図から発生させた、合成展開の可能性を予測するための矢印７、化合物の分布の重心G１,G２,G３、化合物の分布の重心の好ましい領域、及び所定の活性値の範囲を示した図である。図７では、高活性・高選択性領域５を、活性（pIC₅₀）＞7.0、選択性（エントロピースコア）＜2.5の領域とし、所定の活性値の範囲をpIC₅₀が５以上の領域としている。

分子ターゲットA：分子量300未満の化合物群の重心G１に対して、分子量300以上350未満の化合物群の重心G２は左上にプロットされ（条件A）、さらに重心G３が高活性・高選択性領域５（活性（pIC₅₀）＞7.0、選択性（エントロピースコア）＜2.5）に含まれる（条件B１）。すなわち、条件Aと条件B１を満たすことから、分子ターゲットAは有望な創薬ターゲットと判断できる。

分子ターゲットB：重心G１に対して、重心G２、そして分子量350以上の化合物群の重心G３は左上にプロットされ（条件A）、さらに重心G２が高活性・高選択性領域５に含まれる（条件B２）。すなわち、条件Aと条件B２を満たすことから、分子ターゲットBは有望な創薬ターゲットと判断できる。

分子ターゲットC：重心G１に対して、重心G２、そして重心G３は左上にプロットされるが（条件A）、重心G２、重心G３は高活性・高選択性領域５に含まれない。すなわち、条件Aは満たすが、条件B１は満たさない。しかし分子量の増加にともない、重心G２から重心G３への矢印７が高活性・高選択性領域５の方向に向いていること、重心G３が合成展開する上で必要と判断した活性pIC₅₀＞5.0を満たす（条件B３）。すなわち、条件Aと条件B３を満たすことから、分子ターゲットCは有望な創薬ターゲットであると判断できる。

分子ターゲットD：重心G１に対して、重心G２は左上にプロットされるが、重心G３は左上ではなく、活性が減弱する左下にプロットされる（条件B２、B３を満たさない）。すなわち、分子量の増加にも関わらず活性が上がらない。また、重心G３は高活性・高選択性領域５内に含まれない（条件B１を満たさない）。すなわち、条件Aは満たすが、条件B１〜B３のいずれも満たさないことから、分子ターゲットDは有望な創薬ターゲットとして好ましくないと判断できる。

分子ターゲットE：重心G１に対して、重心G２と重心G３は左上にプロットされるが、重心G３は、高活性・高選択性領域５内に含まれないし（条件B１、B２を満たさない）、合成展開する上で必要と判断した活性pIC₅₀＞5.0も満たさない（条件B３を満たさない）。すなわち、条件Aは満たすが、条件B１〜B３のいずれも満たさないことから、分子ターゲットEは有望な創薬ターゲットとして好ましくないと判断できる。

以上のように、合成展開の可能性を予測するための矢印７により、ある分子ターゲットが有望な創薬ターゲットであるか否かを判断することができる。すなわち、矢印７及び重心を参照することにより、複数の分子ターゲットの中から有望な創薬ターゲットを選択することができる。

このような合成展開の可能性を予測するための矢印７を参照することにより、種々のキナーゼの中から創薬ターゲットとして有望なキナーゼを自動的に選択することが可能となる（詳細は後述）。また、分子ターゲットCは、図６に示すように、高活性・高選択性の領域５に化合物が存在していないため、その時点では良質なリード化合物を得ることができなかった。しかし、図７に示す分子ターゲットCの矢印７を参照した判断結果では、分子ターゲットCは有望な創薬ターゲットとして判断できる。言い換えると、分子ターゲットCは、より多くの化合物（例えば、数万化合物）のスクリーニングや合成展開をすることで良質なリード化合物を得ることができる分子ターゲットであると予測できる。

以下に示すとおり、実際に分子ターゲットCに対して数万化合物のスクリーニングを実施し、ターゲットCに対して活性を示した数十化合物に対して、数百種のキナーゼに対する活性を評価した。先の方法で得られた阻害率（％）を用いて、下記の式によりIC₅₀値を算出した。
IC₅₀＝ 100×X/Y−X
ここで、Y：阻害率（%）、X：濃度（μM）

最大評価濃度での阻害率（%）が20%以下の場合、すなわち活性を示さなかった場合は、後の選択性の指標とするエントロピースコアの算出に用いるため、IC₅₀値を一定の値とした。また、最大評価濃度が0.1μMのときのIC₅₀値は40μM、最大評価濃度が1μMの時のIC₅₀値は400μMとした。また最小評価濃度での阻害率（%）が99％以上の場合もIC₅₀値を一定値とした。今回の場合は最小評価濃度が0.1μMのときのIC₅₀値は0.001μM、最小評価濃度が1μMの時のIC₅₀値は0.01μMとした。

上記方法により算出したIC₅₀値を用いて、活性値（pIC₅₀）、選択性（エントロピースコア）、リガンド効率を算出した。図８に、図６に示すターゲットCの四次元散布図上にさらに数十化合物を示すシンボル（□マーク）をプロットした。その結果、複数化合物が高活性・高選択性の領域５に配置された。すなわち、ターゲットCは、合成展開によって高活性かつ高選択性を有する化合物が得られる創薬ターゲットであることが示された。

このように四次元散布図上にプロットされたシンボルからでは良質なリード化合物を得ることができなかったと判断された分子ターゲットであっても、矢印７を参照することにより、有望な創薬ターゲットとして選択される場合もある。

５．四次元散布図生成装置
上述した四次元散布図を生成して表示する四次元散布図生成装置（可視化装置の一例）の構成、動作について以下に説明する。

５．１装置の構成
図９は、四次元散布図を生成して表示する四次元散布図生成装置のハードウェア構成を示した図である。四次元散布図生成装置100は、パーソナルコンピュータのような情報処理装置で構成される。四次元散布図生成装置100は、その全体動作を制御する制御部11と、画面表示を行う表示部17と、ユーザが操作を行う操作部19と、データやプログラムを記憶するデータ格納部21とを備える。

表示部17は例えば、液晶ディスプレイや有機ＥＬディスプレイで構成される。操作部19はキーボード、マウス、タッチパネル等を含む。

さらに、四次元散布図生成装置100は、外部機器やネットワークに接続するためのインタフェース部25を含む。インタフェース部25は、USBやHDMI（登録商標）等のインタフェースに準拠した種々の機器（プリンタ、通信装置、入力装置等）を接続可能であり、接続した機器と四次元散布図生成装置100間のデータや制御コマンドの通信を可能とする。

制御部11は四次元散布図生成装置100全体の動作を制御するものであり、プログラムを実行することで所定の機能を実現するCPUやMPUで構成される。制御部11で実行されるプログラムは通信回線や、CD、DVD、メモリカード等の記録媒体を介して提供されてもよい。制御部11は、所定の機能を実現するように設計された専用のハードウェア回路（FPGA,ASIC等）で構成されてもよい。

データ格納部21はデータやプログラムを記憶する装置であり、例えばハードディスク（HDD）、SSD、半導体メモリ素子、光ディスクで構成することができる。データ格納部21は、四次元散布図の生成や表示を行うための制御プログラム31や、化合物のデータを格納する化合物ライブラリデータベース（以下「化合物ライブラリDB」と称する）32、生成した四次元散布図等の情報を格納する。

化合物ライブラリDB32は、複数の化合物について各化合物の特性に関する情報を管理するデータベースである。具体的には、化合物ライブラリDB32は、各化合物について、少なくとも、複数のキナーゼに対する活性値や選択性、化合物の分子量、化合物のリガンド効率に関する特性値を格納している。化合物ライブラリDB32は例えば下記のフォーマットを有する。

すなわち、化合物ライブラリDB32は、複数の化合物のそれぞれについて、複数のキナーゼに対する活性値や選択性、及び化合物の分子量、化合物のリガンド効率に関する特性値を格納している。化合物ライブラリDB32は、CD、DVD、メモリカード等の記録媒体や、通信回線を通じて外部サーバから提供されてもよい。

５．２装置の動作
５．２．１四次元散布図の表示
四次元散布図生成装置100の動作を説明する。図10は、四次元散布図生成装置100における、四次元散布図の表示動作を示すフローチャートである。図10を参照して、四次元散布図生成装置100における四次元散布図の表示動作を説明する。

制御部11は、リード化合物を抽出したい分子ターゲットに対して種々の化合物の特性値に関する情報を化合物ライブラリDB32から取得する（S11）。具体的には、制御部11は、化合物ライブラリDB32から、各化合物について、少なくとも、分子ターゲットに対する活性値及び選択性、分子量、リガンド効率に関する情報を取得する。このとき、制御部11は、化合物ライブラリDB32に含まれる化合物の中から、所定の条件（例えば、最大評価濃度の阻害率が20％以上）を満たす化合物のみを選択して取得するようにしてもよい。

次に、制御部11は、取得した化合物群の中の一つの化合物について、分子ターゲットに対するその化合物の活性、選択性に基づき、その化合物を示すシンボルをプロットする四次元散布図上の位置を決定する（S12）。

さらに、制御部11は、その化合物の分子量に基づき、その化合物を示すシンボルの色を決定する（S13）。具体的には、分子量が300未満である場合は、シンボルの色を赤色に設定し、分子量が300以上かつ350未満の場合、シンボルの色を黄色に設定し、分子量が350以上の場合、シンボルの色を青色に設定する。

さらに、制御部11は、その化合物のリガンド効率に基づき、その化合物を示すシンボルの大きさを決定する（S14）。具体的には、リガンド効率の値に応じたシンボルの大きさとする。すなわち、リガンド効率の値が大きいときに、シンボルの大きさをより大きな大きさとし、リガンド効率の値が小さいときに、シンボルの大きさをより小さい大きさとする。なお、リガンド効率の値が一定値よりも大きいときには、シンボルの大きさをある一定の大きさとして表わし、リガンド効率の値が一定値よりも小さいときには、シンボルの大きさをある一定の小ささとして表わしてもよい。

以上のようにして一つの化合物に対して、シンボルの配置位置や属性（色、大きさ）が決定される（S12〜S14）。以後、制御部11は、化合物ライブラリDB32から取得した化合物のすべてに対して、四次元散布図に配置するシンボルの位置や属性（色、大きさ）を決定する（S15）。

取得した化合物のすべてに対して、四次元散布図に配置するシンボルの位置や属性（色、大きさ）が決定されると（S15でYES）、制御部11は、決定したシンボルの位置や属性（色、大きさ）に基づき各化合物を示すシンボルを、選択性−活性値の二次元平面上に配置して四次元散布図（すなわち、四次元散布図を示す画像データ）を生成して、表示部17に表示する（S16）。これにより、表示部17上に例えば図１に示すような四次元散布図が表示される。このとき、制御部11は、生成した四次元散布図を表示部17に表示する代わりに又は表示するとともに、四次元散布図を示す画像データをデータ格納部21に格納したり、または、インタフェース部25を介して外部機器に出力したりしてもよい。

制御部11は、四次元散布図上において、高活性・高選択性の領域５を示す枠を合わせて表示させる。高活性・高選択性の領域５は、リード化合物としてより好ましい化合物が含まれる領域であり、例えば、活性（pIC₅₀）＞8.0、かつ、選択性（エントロピースコア）＜2.0となる領域、または、活性（pIC₅₀）＞7.0、かつ、選択性（エントロピースコア）＜3.0となる領域に設定される。

このとき、制御部11は、高活性・高選択性の領域５内に含まれる化合物を抽出し、リード化合物候補として抽出し、抽出した化合物に関する情報（化合物名等）を、分子ターゲットと関連づけて、データ格納部21に格納したり、表示部17に表示させたりしてもよい。また、制御部11は、高活性・高選択性の領域５内に含まれる化合物のうち、分子量及び／またはリガンド効率が所定の条件を満たす化合物のみを抽出するようにしてもよい。データ格納部21に格納された又は表示部17に表示された化合物に関する情報を参照することにより、リード化合物としてより好ましい化合物を容易に認識することができる。

また、制御部11は、図11に示すように、高活性・高選択性の領域について、有望な化合物が含まれる領域（第２優先領域）５Bと、より有望な化合物が含まれる領域（第１優先領域）５Aをそれぞれ示す枠をさらに表示させてもよい。例えば、第１優先領域５Aは、活性（pIC₅₀）が８以上かつ選択性（エントロピースコア）が２以下に設定し、第２優先領域５Bは、活性(pIC₅₀)が７以上かつ８未満、かつ選択性（エントロピースコア）が２より大きくかつ３以下に設定する。これによって、優先して抽出すべきリード化合物候補を段階的に認識することができる。

なお、図10のフローチャートは一つの分子ターゲットに対する四次元散布図の表示処理を説明した。図３や図６に示すように、複数の分子ターゲットに対する四次元散布図を複数同時に表示させる場合は、図10のフローチャートの処理を分子ターゲット毎に複数回実行すればよい。

５．２．２合成展開の可能性を予測するための矢印の表示
図12は、図４、図５等に示す合成展開の可能性を予測するための矢印７の生成処理を示すフローチャートである。図12を参照して、四次元散布図生成装置100における合成展開の可能性を予測するための矢印７の生成処理を説明する。

制御部11は、化合物を、分子量に関して３つのグループ、すなわち、分子量が300未満の第１グループ、分子量が300以上かつ350未満の第２グループ、分子量が350以上の第３グループの３つのグループに分類して管理している。そして、制御部11は、分子量のグループ毎に、選択性−活性値の二次元平面における各シンボルの分布（選択性−活性値の二次元平面における分布）の重心G１,G２,G３を算出する（S21）。

具体的には、制御部11は、第１グループに属する化合物について、式(1)を用いて、活性値および選択性それぞれについて平均値を算出することで、第１グループに属する化合物の分布における重心G１を算出する。同様に、制御部11は、式(1)を用いて、第２グループに属する化合物について、活性値および選択性それぞれについて平均値を算出することで第２グループに属する化合物の分布における重心G２を算出し、第３グループに属する化合物について、活性値および選択性それぞれについて平均値を算出することで第３グループに属する化合物の分布における重心G３を算出する。なお、重心G１,G２,G３は、重みづけした式(3)を用いて算出してもよい。

制御部11は、分子量の範囲が隣接するグループ間の重心G１‐G２間、重心G２‐G３間をそれぞれ矢印で結び、四次元散布図上に表示させる（S22）。これにより、例えば、図４(A)(B)に示すように分布の変化を示す矢印７が四次元散布図上に表示される。

なお、制御部11は、図５(A)(B)に示すように、プロットされたシンボルを示さずに矢印７のみを表示してもよい。または、図７に示すように、複数の分子ターゲットに対する矢印を並べて表示してもよい。この場合、図12のフローチャートの処理を複数の分子ターゲットのそれぞれに対して実行すればよい。

また、制御部11は、算出した重心G１〜G３の位置や矢印７の向き（傾き）に応じて、分子ターゲットが有望な創薬ターゲットであるか否かを判定し、判定結果をデータ格納部21に格納したり、表示部17に表示したりしてもよい。これにより、四次元散布図で示された分子ターゲットが有望な創薬ターゲットであるか否かを装置の利用者に提示することができる。

以下、重心の位置や矢印の向きに基づき分子ターゲットが有望な創薬ターゲットであるか否かを判定する動作について説明する。図13は、制御部11のその判定動作のフローチャートである。

制御部11はまず、重心G１-G２間の矢印（重心G１から重心G２へ向かう矢印）が高活性・高選択性領域５の方に向かっているか否か（条件A）を判断する（S31）。具体的には、制御部11は、重心G１-G２間の矢印が選択性−活性値の二次元平面において左上方向を向いているか否かを判断する。重心G１-G２間の矢印が高活性・高選択性領域５の方に向かっていない場合（S31でNO）、制御部11は、当該分子ターゲットを有望な創薬ターゲットでないと判定する（S37）。

重心G１-G２間の矢印が高活性・高選択性領域５の方に向かっている場合（S31でYES）、制御部11は、重心G２が高活性・高選択性領域５内に含まれるか否か（条件B１）を判断する（S32）。重心G２が高活性・高選択性領域５内に含まれる場合（S32でYES）、制御部11は、当該分子ターゲットを有望な創薬ターゲットであると判定する（S36）。

重心G２が高活性・高選択性領域５内に含まれない場合（S32でNO）、制御部11は、重心G２-G３間の矢印（重心G２から重心G３へ向かう矢印）が高活性・高選択性領域５の方に向かっているか否かを判断する（S33）。重心G２-G３間の矢印が高活性・高選択性領域５の方に向かっていない場合（S33でNO）、制御部11は、当該分子ターゲットを有望な創薬ターゲットでないと判定する（S37）。重心G２-G３間の矢印が高活性・高選択性領域５の方に向かっている場合（S33でYES）、制御部11は、重心G３が高活性・高選択性領域５内に含まれるか否か（条件B２）を判断する（S34）。重心G３が高活性・高選択性領域５内に含まれる場合（S34でYES）、制御部11は、当該分子ターゲットを有望な創薬ターゲットであると判定する（S36）。

重心G３が高活性・高選択性領域５内に含まれない場合（S34でNO）、制御部11は、重心G３が所定の活性値以上（例えば、pIC₅₀が５以上）の領域内に含まれるか否か（条件B３）を判断する（S35）。重心G３が所定の活性値以上の領域内に含まれる場合（S35でYES）、制御部11は、当該分子ターゲットを有望な創薬ターゲットであると判定する（S36）。重心G３が所定の活性値以上の領域内に含まれない場合（S35でNO）、制御部11は、当該分子ターゲットを有望な創薬ターゲットでないと判定する（S37）。

以上のようにして制御部11は、重心の位置や矢印の向きに基づき分子ターゲットが有望な創薬ターゲットであるか否かを判定し、その判定結果をデータ格納部21に格納したり、表示部17に表示したりする（S38）。

ここでの高活性・高選択性の領域５は、重心が配置されるより好ましい領域であり、例えば、活性（pIC₅₀）＞5.0、かつ、選択性（エントロピースコア）＜4.0となる領域、活性（pIC₅₀）＞6.0、かつ、選択性（エントロピースコア）＜3.0となる領域、活性（pIC₅₀）＞7.0、かつ、選択性（エントロピースコア）＜2.5となる領域、または、活性（pIC₅₀）＞7.0、かつ、選択性（エントロピースコア）＜2.0となる領域に設定してもよい。

また、複数の分子ターゲットのそれぞれに対して、合成展開の可能性を予測するための矢印を表示する際の表示態様は、図７に示すような縦横に並べて表示する態様に限定されるものではない。例えば、図14に示すように横方向に一例に並べて表示してもよいし、図15に示すように縦方向に一例に並べて表示してもよい。いずれの表示態様であっても、各分子ターゲットの矢印の傾向を把握でき、矢印の位置や向きに基づき各分子ターゲットが有望な創薬ターゲットであるか否かを判断することができる。

６．効果、等
以上説明した四次元散布図は、分子ターゲットに対する化合物の選択性（第１の特性の一例）及び活性値（第２の特性）に基づきシンボルの配置位置が決定され、化合物の分子量（第３の特性の一例）及びリガンド効率（第４の特性の一例）に基づきシンボルの属性（色、大きさ）が決定される。この四次元散布図によれば、データを俯瞰的に捉えることが可能となり、合成展開の可能性の予測が可能となる。また、四次元散布図により、良質なリード化合物として重要な因子である分子量の分布が理解でき、さらにリガンド効率も一目で認識できる。また、四次元散布図における所定の領域（高活性・高選択性の領域５）に着目することにより、リード化合物としてより好ましい化合物を容易に認識することができる。

本実施形態で開示したリード化合物の抽出方法は、四次元散布図上の所定領域（高活性・高選択性の領域）５内に配置されたシンボルが示す化合物の中からリード化合物を抽出する。これにより、合成展開の可能性を期待できる良質なリード化合物を抽出することができる。

また、四次元散布図上に、分子量に基づき分類された化合物のシンボルの分布の変化を示す矢印を表示してもよい。本実施形態で開示した創薬ターゲットの選択方法は、そのような四次元散布図上での、分子量に基づき分類された化合物のシンボルの分布の変化の方向に基づいて、所定のターゲットを、創薬に用いる創薬ターゲットとして選択するか否かを決定する。このように、分子量で区別された化合物のシンボルの分布の変化の方向に基づいて、創薬ターゲットであるか否かを判定することで、対象の創薬ターゲットが、将来的に合成展開することによって医薬品の候補化合物が得られるものか否かを判断することができる。

また、上記の実施形態によれば、所定の創薬ターゲットおよび／または分子ターゲットに対する複数の化合物の特性を示す四次元散布図を生成する四次元散布図生成装置100が提供される。四次元散布図生成装置100は制御部11を備える。制御部11は、複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段（S11）、及び、複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して四次元散布図を生成して出力する散布図作成手段（S12-S16）として機能する。この四次元散布図生成装置100により四次元散布図を生成することができる。

（他の実施の形態）
上記の実施の形態は本発明の一実施形態を開示したものであり、本発明の思想は上記の実施の形態に限定されるものではない。開示した技術に対して、適宜、変更、修正、置換、付加、省略等を行うことも可能である。以下、それらの変形例をいくつか説明する。

（１）上記の説明では、四次元散布図にプロットする際に用いる化合物の特性として、活性（第１の特性の一例）、選択性（第２の特性の一例）、分子量（第３の特性の一例）、リガンド効率（第４の特性の一例）を用いたが、化合物の特性はこれらに限定されない。化合物の特性は、創薬において用いられる評価項目であればよく、例えば、活性、選択性、分子量、リガンド効率、脂溶性（logP、logD、clogP、AlogP、MlogP等）、重原子数、水素結合供与体数、水素結合受容体数、回転可能結合数、極性表面積（PSA、TPSA等）、芳香族環数、忌避構造数、酸解離定数、QED（quantitative estimate of drug-likeness）、CNS MPO（central nervous system multiparameter optimization）、溶解性、熱安定性、湿度安定性、光安定性、膜透過性、経口吸収性、ヒト腸管吸収（HIA）性、血液脳関門（BBB）移行性、シトクロムP450（CYP3A4、CYP2D6等）代謝安定性、シトクロムP450阻害（CYP3A4等）活性、発がん性、変異原性（Ames試験等）、皮膚感作性、蓄積性、hERG阻害、染色体異常発現性等が挙げられる。また、これらのうちの２以上の特性を組み合わせて示される特性（例えば、活性と脂溶性を組み合わせて示される特性であるリガンド脂溶性効率等）を用いてもよい。しかし、活性、選択性、分子量およびリガンド効率の組み合わせが好ましい組み合わせである。

（２）上記の説明では、化合物の分子量に基づきシンボルの色を設定し、リガンド効率に基づきシンボルの大きさを設定したが、化合物の分子量に基づきシンボルの大きさを設定し、リガンド効率に基づきシンボルの色を設定してもよい。

（３）また、シンボルの形状は円形状としたが、シンボルの形状はその形状に限定されるものではない。シンボルは三角、四角、星形、×等任意の形状で表すことができる。

（４）また、シンボルの属性として色と大きさを用い、それらを化合物の特性（分子量、リガンド効率）に応じて変化させたが、シンボルの属性としてさらに形状や３次元座標（選択性を示すX軸及び活性を示すY軸で定まる平面に垂直なZ軸上の座標）を加えても良い。すなわち、色、大きさ、形状、３次元座標の中から選択した２つの属性を、化合物の特性（分子量、リガンド効率）に応じて変化させるようにしてもよい。

例えば、化合物の分子量及びリガンド効率のいずれか１つに応じてZ軸座標を決定した場合、四次元散布図は３次元的に表現される。

（５）また、化合物の一つの特性に基づきシンボルの一つの属性を変化させたが、化合物一つの特性に基づきシンボルの複数の属性を変化させてもよい。例えば、化合物の分子量に応じてシンボルの色と形状を組み合わせて変化させてもよい。

（６）上記の説明では、対象データの４つの特性のそれぞれをシンボルの位置や色等の属性に反映された四次元散布図を作成したが、散布図はこれに限定されるものではない。散布図を、５つ以上の特性を同時に視認できるように、プロットするシンボルの属性を変化させて生成してもよい。例えば、５つの特性のそれぞれに応じて、シンボルの位置（Ｘ軸、Ｙ軸）、シンボルの色、大きさ、形状を決定して散布図を生成してもよい。

（７）上記の例では、良質なリード化合物の抽出や創薬ターゲットの選択に有効なデータ可視化方法を説明した。しかし、上記の実施の形態で開示した四次元散布図を用いたデータ可視化方法は、リード化合物の抽出や創薬ターゲットの選択に用いる化合物候補の特性データの可視化に限定されるものではない。上記の実施の形態で開示したデータ可視化方法は、一般的な四次元以上の特性を持つデータを可視化する際の可視化方法にも適用することができる。このような可視化方法は、ビッグデータの解析や、その結果に基づく方針決定に有効に適用することができる。

例えば、下記の分野における様々なデータの可視化にも適用することができる。
−医療（例えば、診療データ分析、投薬情報分析、検査結果分析、バイタルデータ分析、罹患リスク分析、感染予測分析、地域情報分析等）
−金融や保険（例えば、不正解析、取引分析、リスク分析、位置情報分析等）、
−通信や放送（例えば、通信ログ分析、ネットワーク解析、視聴率分析、コンテンツ分析等）
−流通や小売（例えば、POSデータ分析、購買ログ分析、ロイヤリティ分析、プロモーション分析、コールセンター分析、アイトラッキング分析、リピート率分析、サービス利用状況分析、ポイント活用状況分析、クリックストリーム分析等）、
−製造（例えば、品質分析、需要分析、トレーサビリティ、故障事前検知、故障時期予測等）
−WEB等のメディア（例えば、アクセス分析、コンテンツ分析、ソーシャルメディア分析等）、
−公共や公益（例えば、気象データ分析、地震データ分析、エネルギー消費分析、リスク分析（防衛、犯罪等）、橋脚異常検知、社会インフラの効率的運用等）、
−交通（例えば、自動車走行データ分析、渋滞予測、事故原因分析、CO2排出量分析等）、
−観光（例えば、観光客のニーズ分析等）、
−農業や水産業（例えば、動態分析、生育状況分析、漁場予測等）

すなわち、この可視化方法は、少なくとも第１ないし第４の特性を有する複数の解析対象のデータについて、第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定する。さらに、第３及び第４の特性に基づき、各データを示すシンボルの属性を決定する。そして、決定した位置及び属性に基づいて各データを示すシンボルを配置することにより四次元散布図を生成する。このようにして生成された四次元散布図を参照することで、解析対象データの４つの特性について同時に視覚的に認識することができ、解析対象データの傾向を容易かつ直感的に把握することができる。

例えば、気象データにおける、気温、湿度、観測年、および降水量の４つの特性に基づき、図16のような四次元散布図を得ることができる。データとして、日本の気象データであり、京都、札幌、東京、沖縄の四都市について1900年から2015年までの平均気温、湿度、降水量のデータを使用した。四次元散布図においては、横軸に「気温」、縦軸に「湿度」、シンボルの色に「観測年」（輝度が低いほど新しい）、シンボルの大きさに「降水量」を割り当てている。図16を参照すると、各都市において近年に近づくほど気温が上昇しているのが見られる。すなわち、地球温暖化の傾向が読み取れる。さらに、気温の上昇に伴い湿度も低下してきていることが把握できる。このように気象に関する四次元散布図を参照することで、環境変化の傾向を容易かつ直感的に把握することができる。

また、例えば、医療データにおける、がんによる死亡率、喫煙率、調査年、および人口の４つの特性に基づき、図17のような四次元散布図を得ることができる。データとして、日本の医療データであり、日本の各都道府県について、2001年から３年毎に2013年までの、がんによる県別の死亡率（悪性新生物75歳未満年齢調整死亡率、人口10万対）、県別の喫煙率、人口のデータを使用した。四次元散布図においては、横軸に「喫煙率」、縦軸に「がんによる死亡率」、シンボルの色に「調査年」（輝度が低いほど新しい）、シンボルの大きさに「人口」を割り当てている。図17を参照すると、まず、喫煙率とがんによる死亡率には相関が見られる。また、各調査毎の全国平均の喫煙率およびがんによる死亡率をプロットし（図17中の太字丸）、それらを矢印で結ぶと、ほぼ調査毎に、喫煙率とがんによる死亡率が共に低下してきていることが把握できる。このように医療に関する四次元散布図を参照することで、がんによる死亡率変化の傾向を容易かつ直感的に把握することができる。

この場合、四次元散布図生成装置100の制御部11を下記の機能を実現するように構成すればよい。すなわち、制御部11は、解析対象データの第１ないし第４の特性を有する複数の解析対象のデータについて、第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定すればよい。さらに、制御部11は、第３及び第４の特性に基づき、各データを示すシンボルの属性を決定すればよい。そして、制御部11は、決定した位置及び属性に基づいて各データを示すシンボルを配置することにより四次元散布図を生成すればよい。さらに、制御部11は、第３の特性に関して所定の条件でデータを複数のグループに分類し、分類した複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印を散布図上に配置してもよい。この矢印の方向や重心の位置を参照することで、第３の特性に関して分類した解析対象のデータの分布の変化の傾向を視覚的に容易に認識することができる。

（本開示）
上記の実施の形態において下記の思想が開示されている。

（１）創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する方法。
その抽出する方法は、
複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上の所定領域内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含む。
散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定され、化合物の第３及び第４の特性に基づきシンボルの属性が決定されている。

（２）（１）において、シンボルの属性は、シンボルに関する、色、形状、大きさ及び前記第１及び第２の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す３次元座標のうちの少なくとも２つを含んでもよい。

（３）（１）において、第１の特性は、所定の創薬ターゲットに対する化合物の選択性であり、第２の特性は、所定の創薬ターゲットに対する化合物の活性であり、第３の特性は化合物の分子量であり、第４の特性は化合物のリガンド効率であってもよい。

（４）（３）において、所定領域は、化合物の選択性及び化合物の活性の双方が所定値以上となる領域であってもよい。

（５）（４）において、所定領域に配置されたシンボルが示す化合物のうちリガンド効率が0.3以上である化合物を抽出してもよい。

（６）（１）から（５）のいずれかの方法において、創薬ターゲットは、酵素、受容体または輸送体タンパク質であってもよい。

（７）創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する方法。
その抽出する方法は、
複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上の所定領域内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含む。
散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定される。第１の特性は、所定の創薬ターゲットに対する化合物の選択性であり、第２の特性は、所定の創薬ターゲットに対する化合物の活性である。所定領域は、化合物の選択性及び化合物の活性の双方が所定値以上となる領域であり、所定領域に配置されたシンボルが示す化合物のうちリガンド効率が0.3以上である化合物を抽出する。

（８）創薬ターゲットの選択方法。
その選択方法は、所定の分子ターゲットについて、複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上に配置されたシンボルの分布に基づいて、前記所定の分子ターゲットを創薬ターゲットとして選択するステップと、を含む。
散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定され、化合物の第３及び第４の特性に基づきシンボルの属性が決定される。化合物は、第３の特性に関して所定の条件で複数のグループに分類されている。選択するステップは、各グループに属する化合物のシンボルの分布の変化の方向及び変化の終点に基づいて、所定の分子ターゲットを創薬ターゲットとして選択するか否かを決定する。

（９）（８）において、シンボルの属性は、シンボルに関する、色、形状、大きさ及び前記第１及び第２の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す３次元座標のうちの少なくとも２つを含んでもよい。

（１０）（８）において、第１の特性は、所定の分子ターゲットに対する化合物の選択性であり、第２の特性は、所定の分子ターゲットに対する化合物の活性であり、第３の特性は化合物の分子量であり、前記第４の特性は化合物のリガンド効率である。

（１１）（１０）において、複数の化合物が分子量に基づき複数のグループに分類されてもよい。各グループに属する化合物のシンボルの分布の重心を結ぶ矢印が散布図上に配置されてもよい。

（１２）（１１）において、各グループに属する化合物のシンボルの分布の重心を結ぶ矢印が、散布図上の所定領域に向かう場合に、当該分子ターゲットを創薬ターゲットとして選択してもよい。

（１３）（１２）において、散布図上の変化の終点となる分布についてその分布の重心の位置が、選択性が所定値以上となりかつ活性が所定値以上となる領域に含まれる場合に、当該分子ターゲットを創薬ターゲットとして選択してもよい。

（１４）（８）ないし（１３）のいずれかにおいて、前記創薬ターゲットおよび／または分子ターゲットは、酵素、受容体または輸送体タンパク質でもよい。

（１５）所定の創薬ターゲットに対する複数の化合物の特性を示す散布図を生成する散布図生成装置。散布図生成装置は、
複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段と、
複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して散布図を生成して出力する散布図作成手段と、を備える。
散布図作成手段は、化合物毎に、化合物の第１及び第２の特性に基づき散布図上のシンボルの配置位置を決定し、化合物の第３及び第４の特性に基づきシンボルの属性を決定して、決定した位置及び属性に基づき化合物を示すシンボルを散布図上に配置する。

（１６）（１５）において、シンボルの属性は、シンボルに関する、色、形状、大きさ及び第１及び第２の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す３次元座標のうちの少なくとも２つを含んでもよい。

（１７）（１５）において、第１の特性は、所定の創薬ターゲットに対する化合物の選択性であってもよい。第２の特性は、所定の創薬ターゲットに対する化合物の活性であってもよい。第３の特性は化合物の分子量であってもよい。第４の特性は化合物のリガンド効率であってもよい。

（１８）（１７）において、散布図作成手段は、化合物の選択性が所定値以上で、かつ、化合物の活性が所定値以上となる領域を示す情報を散布図上に配置してもよい。

（１９）（１８）において、前記領域内にシンボルが配置された化合物の中の少なくとも１つをリード化合物として抽出する抽出手段をさらに備えてもよい。

（２０）（１７）において、散布図作成手段は、複数の化合物を分子量に基づき複数のグループに分類し、各グループに属する化合物のシンボルの分布の重心を結ぶ矢印を散布図上に配置してもよい。

（２１）（１５）ないし（２０）のいずれかにおいて、創薬ターゲットは、酵素、受容体または輸送体タンパク質であってもよい。

（２２）コンピュータに、所定の創薬ターゲットに対する複数の化合物の特性を示す散布図を生成させるプログラム。
そのプログラムはコンピュータを、
複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段、及び複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して散布図を生成する散布図作成手段として動作させる。
散布図作成手段は、化合物毎に、化合物の第１及び第２の特性に基づき散布図上のシンボルの配置位置を決定し、化合物の第３及び第４の特性に基づき、シンボルの属性を決定し、決定した配置位置及び属性に基づき化合物を示すシンボルを散布図上に配置する。

（２３）少なくとも第１ないし第４の特性を有する複数のデータの傾向を可視化する第１の方法。その可視化する第１の方法は、
第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、
第３及び第４の特性に基づき、各データを示すシンボルの属性を決定し、
決定した位置及び属性に基づいて、各データを示すシンボルを散布図上に配置する。

（２４）（２３）の方法において、第３の特性に関して所定の条件でデータが分類され、分類された複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印が散布図上に配置されてもよい。

（２５）少なくとも第１ないし第３の特性を有する複数のデータの傾向を可視化する第２の方法。その可視化する第２の方法は、
第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、
決定した位置に基づいて、各データを示すシンボルを散布図上に配置し、
第３の特性に関して所定の条件でデータを複数のグループに分類し、分類した複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印を前記散布図上に配置する。

（２６）少なくとも第１ないし第４の特性を有するデータの傾向を可視化する装置。
その可視化する装置は、
複数のデータについて、データ毎の特性に関する特性情報を取得する取得手段と、
取得したデータの特性情報に基づいて散布図を生成する散布図生成手段と、を備える。
散布図生成手段は、第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、第３及び第４の特性に基づき、各データを示すシンボルの属性を決定し、決定した位置及び属性に基づき各データを示すシンボルを散布図上に配置する。

以上、本発明の具体的な例として、上述の特定の実施形態を説明したが、当業者にとっては、特許請求の範囲及びその均等の範囲において、他の多くの変形例、修正、置換、付加、省略等を行うことができる。

３四次元散布図上に配置されるシンボル
５、５Ａ、５Ｂ高活性・高選択性の領域
７分子量に基づき分類された化合物群の分布の変化の方向を示す矢印
１１制御部
１７表示部
１９操作部
２１データ格納部
２５インタフェース部
３１制御プログラム
３２化合物ライブラリデータベース
１００四次元散布図生成装置

Claims

創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する方法であって、
複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上の所定領域内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含み、
前記散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定され、化合物の第３及び第４の特性に基づきシンボルの属性が決定された、
リード化合物の抽出方法。
シンボルの属性は、シンボルに関する、色、形状、大きさ及び前記第１及び第２の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す３次元座標のうちの少なくとも２つを含む、請求項１に記載のリード化合物の抽出方法。
前記第１の特性は、所定の創薬ターゲットに対する化合物の選択性であり、前記第２の特性は、所定の創薬ターゲットに対する化合物の活性であり、前記第３の特性は化合物の分子量であり、前記第４の特性は化合物のリガンド効率である、
請求項１に記載のリード化合物の抽出方法。
前記所定領域は、化合物の選択性及び化合物の活性の双方が所定値以上となる領域である、請求項３に記載のリード化合物の抽出方法。
前記所定領域に配置されたシンボルが示す化合物のうちリガンド効率が0.3以上である化合物を抽出する、請求項４に記載のリード化合物の抽出方法。
前記創薬ターゲットは、酵素、受容体または輸送体タンパク質である、請求項１ないし５のいずれかに記載のリード化合物の抽出方法。
創薬ターゲットに対して複数の化合物の中からリード化合物を抽出する方法であって、
複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上の所定領域内に配置されたシンボルが示す化合物の中からリード化合物を抽出するステップと、を含み、
前記散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定され、
前記第１の特性は、所定の創薬ターゲットに対する化合物の選択性であり、前記第２の特性は、所定の創薬ターゲットに対する化合物の活性であり、
前記所定領域は、化合物の選択性及び化合物の活性の双方が所定値以上となる領域であり、
前記所定領域に配置されたシンボルが示す化合物のうちリガンド効率が0.3以上である化合物を抽出する、リード化合物の抽出方法。
創薬ターゲットの選択方法であって、
所定の分子ターゲットについて、複数の化合物に対して、化合物の複数の特性にしたがい化合物を示すシンボルを配置して散布図を作成するステップと、
散布図上に配置されたシンボルの分布に基づいて、前記所定の分子ターゲットを創薬ターゲットとして選択するステップと、を含み、
前記散布図において、化合物の第１及び第２の特性に基づきシンボルの配置位置が決定され、化合物の第３及び第４の特性に基づきシンボルの属性が決定され、
化合物は、第３の特性に関して所定の条件で複数のグループに分類されており、
前記選択するステップは、各グループに属する化合物のシンボルの分布の変化の方向及び変化の終点に基づいて、前記所定の分子ターゲットを創薬ターゲットとして選択するか否かを決定する、
創薬ターゲットの選択方法。
前記シンボルの属性は、シンボルに関する、色、形状、大きさ及び前記第１及び第２の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す３次元座標のうちの少なくとも２つを含む、請求項８記載の創薬ターゲットの選択方法。
前記第１の特性は、所定の分子ターゲットに対する化合物の選択性であり、前記第２の特性は、所定の分子ターゲットに対する化合物の活性であり、前記第３の特性は化合物の分子量であり、前記第４の特性は化合物のリガンド効率である、
請求項８に記載の創薬ターゲットの選択方法。
前記複数の化合物が分子量に基づき複数のグループに分類され、
各グループに属する化合物のシンボルの分布の重心を結ぶ矢印が前記散布図上に配置された、請求項１０に記載の創薬ターゲットの選択方法。
各グループに属する化合物のシンボルの分布の重心を結ぶ矢印が、散布図上の所定領域に向かう場合に、当該分子ターゲットを創薬ターゲットとして選択する、請求項１１に記載の創薬ターゲットの選択方法。
散布図上の変化の終点となる分布についてその分布の重心の位置が、選択性が所定値以上となりかつ活性が所定値以上となる領域に含まれる場合に、当該分子ターゲットを創薬ターゲットとして選択する、請求項１２記載の創薬ターゲットの選択方法。
前記創薬ターゲットおよび／または分子ターゲットは、酵素、受容体または輸送体タンパク質である、請求項８ないし１３のいずれかに記載の創薬ターゲットの選択方法。
所定の創薬ターゲットに対する複数の化合物の特性を示す散布図を生成する散布図生成装置であって、
複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段と、
複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して散布図を生成して出力する散布図作成手段と、
を備え、
散布図作成手段は、化合物毎に、化合物の第１及び第２の特性に基づき散布図上のシンボルの配置位置を決定し、化合物の第３及び第４の特性に基づきシンボルの属性を決定して、決定した位置及び属性に基づき化合物を示すシンボルを散布図上に配置する、
散布図生成装置。
前記シンボルの属性は、前記シンボルに関する、色、形状、大きさ及び前記第１及び第２の特性に基づきシンボルが配置される平面に垂直な方向の位置を示す３次元座標のうちの少なくとも２つを含む、請求項１５記載の散布図生成装置。
前記第１の特性は、所定の創薬ターゲットに対する化合物の選択性であり、前記第２の特性は、所定の創薬ターゲットに対する化合物の活性であり、前記第３の特性は化合物の分子量であり、前記第４の特性は化合物のリガンド効率である、
請求項１５に記載の散布図生成装置。
前記散布図作成手段は、化合物の選択性が所定値以上で、かつ、化合物の活性が所定値以上となる領域を示す情報を散布図上に配置する、請求項１７に記載の散布図生成装置。
前記領域内にシンボルが配置された化合物の中の少なくとも１つをリード化合物として抽出する抽出手段をさらに備えた、請求項１８に記載の散布図生成装置。
前記散布図作成手段は、複数の化合物を分子量に基づき複数のグループに分類し、各グループに属する化合物のシンボルの分布の重心を結ぶ矢印を前記散布図上に配置する、請求項１７に記載の散布図生成装置。
前記創薬ターゲットは、酵素、受容体または輸送体タンパク質である、請求項１５ないし２０のいずれかに記載の散布図生成装置。
コンピュータに、所定の創薬ターゲットに対する複数の化合物の特性を示す散布図を生成させるプログラムであって、
コンピュータを、
複数の化合物について、化合物の種々の特性に関する特性情報を取得する取得手段、及び
複数の化合物について、取得した特性情報にしたがい各化合物を示すシンボルを配置して散布図を生成する散布図作成手段として動作させ、
前記散布図作成手段は、化合物毎に、化合物の第１及び第２の特性に基づき散布図上のシンボルの配置位置を決定し、化合物の第３及び第４の特性に基づき、シンボルの属性を決定し、
決定した配置位置及び属性に基づき化合物を示すシンボルを散布図上に配置する、
プログラム。
少なくとも第１ないし第４の特性を有する複数のデータの傾向を可視化する方法であって、
第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、
第３及び第４の特性に基づき、各データを示すシンボルの属性を決定し、
決定した位置及び属性に基づいて、各データを示すシンボルを散布図上に配置する、
可視化方法。
第３の特性に関して所定の条件でデータが分類されており、
分類された複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印が前記散布図上に配置された、請求項２３に記載の可視化方法。
少なくとも第１ないし第３の特性を有する複数のデータの傾向を可視化する方法であって、
第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、
決定した位置に基づいて、各データを示すシンボルを散布図上に配置し、
第３の特性に関して所定の条件でデータを複数のグループに分類し、分類した複数のグループに属するデータのシンボルの分布の重心を結ぶ矢印を前記散布図上に配置する、
可視化方法。
少なくとも第１ないし第４の特性を有するデータの傾向を可視化する装置であって、
複数のデータについて、データ毎の特性に関する特性情報を取得する取得手段と、
取得したデータの特性情報に基づいて散布図を生成する散布図生成手段と、
を備え、
散布図生成手段は、第１及び第２の特性に基づき、各データを示すシンボルを配置する位置を決定し、第３及び第４の特性に基づき、各データを示すシンボルの属性を決定し、決定した位置及び属性に基づき各データを示すシンボルを散布図上に配置する、
可視化装置。