JP4840597B2 - Drug discovery multi-target screening device - Google Patents
Drug discovery multi-target screening device Download PDFInfo
- Publication number
- JP4840597B2 JP4840597B2 JP2007058741A JP2007058741A JP4840597B2 JP 4840597 B2 JP4840597 B2 JP 4840597B2 JP 2007058741 A JP2007058741 A JP 2007058741A JP 2007058741 A JP2007058741 A JP 2007058741A JP 4840597 B2 JP4840597 B2 JP 4840597B2
- Authority
- JP
- Japan
- Prior art keywords
- compound
- activity
- compounds
- learning
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
Description
本発明は創薬の分野において2種以上のターゲットタンパクに対して化合物のスクリーニングを行うときに効率の良いスクリーニング装置を提供するものである。 The present invention provides an efficient screening apparatus for screening compounds against two or more target proteins in the field of drug discovery.
創薬においてある1つのターゲットタンパクに対して化合物のスクリーニングを行う方法は確立されている。大手製薬会社においてはハイスループットスクリーニング(HTS)という装置を使って自動的に実験を行うようなシステムが使われている。 A method of screening a compound against one target protein in drug discovery has been established. A major pharmaceutical company uses a system that automatically performs experiments using an apparatus called high-throughput screening (HTS).
最近、一つの化合物について2種以上のターゲットに対する活性をもつ化合物を探すという動きが出始めており、上述のシステムにおいて複数のターゲットタンパクに対する活性を調べようとすると、化合物ライブラリに含まれる全ての化合物についてターゲットタンパクに対する活性を調べた後、それらの結果をあわせて解析するということが行われる。 Recently, there has been a movement to search for compounds having activity against two or more targets for one compound, and when trying to examine the activity against multiple target proteins in the above system, all compounds included in the compound library are searched. After investigating the activity against the target protein, the results are analyzed together.
この方法によると、ライブラリに含まれる全ての化合物について個々のターゲットタンパクに対する活性を調べることとなり、多大な時間と費用が必要となる。 According to this method, all the compounds contained in the library are examined for activity against individual target proteins, which requires a great deal of time and expense.
そこで、スクリーニング効率を向上させるため、学習法を用いて、あらかじめ計算機上でターゲットタンパクに作用する可能性のある化合物を探索し、候補を絞り込むということが行われる。例えば、スクリーニング効率を向上させる方法として、能動学習法を用いた創薬スクリーニング化合物選抜法が開発されている(非特許文献1)。 Therefore, in order to improve the screening efficiency, a learning method is used to search in advance for compounds that may act on the target protein on a computer and narrow down candidates. For example, as a method for improving screening efficiency, a drug discovery screening compound selection method using an active learning method has been developed (Non-patent Document 1).
能動学習法とは、学習者(コンピュータ)が訓練データを能動的に選択することで予測精度を向上させる学習法である。学習者が能動的に学習データを選択するマイニング技術の一つであり、選択データの実験・学習・未実験データの予測により、未実験データのうちで実験すべきデータを選択することを繰り返して、少ない実験で十分な予測性能を実現することが可能となる。例えば、1997年発行の日本の雑誌「情報処理」38巻7号558−561頁記載の安倍と中村による解説「能動学習概要」等に記されている。 The active learning method is a learning method in which a learner (computer) actively selects training data to improve prediction accuracy. This is one of the mining techniques for learners to actively select learning data. By selecting the data to be experimented, learning, and predicting unexperimental data, it is possible to repeatedly select the data to be experimented from the unexperienced data. Therefore, sufficient prediction performance can be realized with a small number of experiments. For example, it is described in the description “Active Learning Overview” by Abe and Nakamura described in Japanese magazine “Information Processing”, Vol. 38, No. 7, pp. 558-561 published in 1997.
非特許文献1は、能動学習により学習の効率を向上させ、膨大な種類の化合物の中から特定のタンパク質に対し活性のある化合物を効率的に発見する創薬スクリーニング方法として注目されている。 Non-Patent Document 1 is attracting attention as a drug discovery screening method that improves the efficiency of learning by active learning and efficiently discovers compounds active against a specific protein from a vast variety of compounds.
しかし、計算機で絞り込んだ化合物について活性を測定し、目的化合物を見つけ出すという、いわゆるインシリコ技術を使ったスクリーニング(<非特許文献1>)においても、個々のターゲットタンパクに対する活性を調べ、それらの結果を合わせるという点では、上記手法と本質的に変わりはない。
上述のように、複数のターゲットタンパクに活性を有する化合物をスクリーニングする場合には、学習法の利用の有無に関わらず、個々のターゲットタンパクについて活性を有する化合物を探索した後に、全てのターゲットタンパクに活性を有する化合物を選択するということが行われてきた。 As described above, when screening for compounds that have activity on multiple target proteins, regardless of whether or not a learning method is used, after searching for compounds that have activity on individual target proteins, It has been done to select compounds with activity.
したがって、複数のターゲットタンパクに同時に活性を有する化合物の探索を行う場合、従来のスクリーニング方法では、探索効率は著しく低いものであった。つまり、複数のターゲットについて同時に活性を見るシステムとしては従来装置では十分なものとはいえなかった。 Therefore, when searching for a compound having activity on a plurality of target proteins simultaneously, the conventional screening method has a significantly low search efficiency. That is, it cannot be said that the conventional apparatus is sufficient as a system for simultaneously viewing the activity of a plurality of targets.
そこで、本発明は、複数のターゲットタンパクについて活性を有する化合物の探索において、効率的なスクリーニング方法を提供するものである。 Therefore, the present invention provides an efficient screening method in searching for compounds having activity with respect to a plurality of target proteins.
また、本発明は、複数のターゲットタンパクについて活性を有する化合物の探索において、効率的なスクリーニングを可能とする装置を提供するものである。 The present invention also provides an apparatus that enables efficient screening in searching for compounds having activity with respect to a plurality of target proteins.
本発明に係るシステムは、
2種以上のターゲットタンパクに対する活性を有する化合物を特定するためのシステムであって、
複数の化合物を所定位置に配置してなる化合物ライブラリと、
2種以上のターゲットタンパクを各々独立して所定位置に配置した同一のプレートが複数枚含まれているタンパクライブラリと、
該プレートの各反応領域で試験化合物とターゲットタンパクとを反応させるための反応装置と、
該反応領域内での試験化合物とターゲットタンパクとの反応を検出するための検出装置と、
前記化合物ライブラリ中の化合物に試験選択順位を付けるための制御手段とを有することを特徴とするシステムである。
The system according to the present invention comprises:
A system for identifying a compound having activity against two or more target proteins,
A compound library in which a plurality of compounds are arranged at predetermined positions;
A protein library including a plurality of identical plates each having two or more target proteins independently arranged at predetermined positions;
A reaction apparatus for reacting a test compound and a target protein in each reaction region of the plate;
A detection device for detecting a reaction between the test compound and the target protein in the reaction region;
And a control means for assigning a test selection order to the compounds in the compound library.
本発明に係るスクリーニング方法は、
2種以上のターゲットタンパクに活性を有する化合物のスクリーニング方法において、
化合物群から順次選択される化合物に対して、前記2種以上のターゲットタンパクの少なくとも1種に対する活性を測定する工程を含み、
学習法又は類似度計算方法によって次に測定する化合物を選び出すことを特徴とするスクリーニング方法である。
The screening method according to the present invention comprises:
In a screening method for compounds having activity on two or more target proteins,
Measuring the activity of at least one of the two or more target proteins for compounds sequentially selected from the group of compounds,
A screening method characterized by selecting a compound to be measured next by a learning method or a similarity calculation method.
本発明に係るスクリーニング方法は、
2種以上のターゲットタンパクに活性を有する化合物のスクリーニング方法において、
化合物群から順次選択される化合物に対して、前記2種以上のターゲットタンパクの少なくとも1種に対する活性を測定する工程を含み、
活性を有する化合物と化合物ライブラリに含まれる個々の化合物との類似度を計算し、
類似度の計算結果を基に次に実験する化合物を選び出すことを特徴とするスクリーニング方法である。
The screening method according to the present invention comprises:
In a screening method for compounds having activity on two or more target proteins,
Measuring the activity of at least one of the two or more target proteins for compounds sequentially selected from the group of compounds,
Calculate the similarity between the active compound and the individual compounds in the compound library,
This screening method is characterized in that the next compound to be tested is selected based on the similarity calculation result.
本発明によれば複数のターゲットタンパクのスクリーニングを行う場合更なる効率化が可能である。 According to the present invention, further efficiency can be achieved when screening a plurality of target proteins.
図1に本発明における構成を示す。 FIG. 1 shows a configuration in the present invention.
本システムは、化合物が収納されている化合物ライブラリ101、ターゲットタンパクが格納されているタンパクライブラリ102、化合物とターゲットタンパクを混ぜ合わせるための化合物タンパク混ぜ合わせ装置103、混ぜ合わせた後に反応を行う反応装置104、反応後のプレートを受け取り活性を測定するための検出装置としての活性測定装置105、装置全体の制御を行うための制御手段としての制御装置106、制御装置からの情報を元に次に実験する化合物を運び出すための分配手段としての化合物ピックアップ装置107から構成されている。ここで、化合物タンパク混ぜ合わせ装置103、反応装置104、活性測定装置は105及びピックアップ装置107は、説明の簡略化のために別個独立の装置として記載したものであり、一般に個々の装置を別個に設ける必要はなく、化合物とターゲットタンパクを混ぜ合わせる機能、反応を行う機能、活性を測定する機能及び化合物を運び出す機能をあわせもつ実験装置として、一つにまとめて構成することも可能である。
This system includes a
化合物ライブラリ101と制御装置106は配線によって結ばれており、化合物ライブラリに含まれる化合物の情報が化合物ライブラリの管理装置から制御装置106に伝えられる。化合物ライブラリ101と化合物ピックアップ装置107は、化合物ライブラリに含まれる化合物が化合物ピックアップ装置107に収められるように結ばれている。タンパクライブラリ102と化合物タンパク混ぜ合わせ装置103は、ターゲットタンパクが収納されたプレートがこれらの間を移動できるように結ばれている。化合物タンパク混ぜ合わせ装置103と反応装置104は、混ぜ合わせた後のプレートが反応装置104に移動できるように結ばれている。反応装置104と活性測定装置105は、反応後のプレートが活性測定装置105に移動できるように結ばれている。活性測定装置105と制御装置106は活性を測定した化合物の活性測定情報を提供できるように結ばれている。制御装置106と化合物ピックアップ装置107は、制御装置106で決めた次に実験する選択化合物が化合物ピックアップ装置107に伝えられるように結ばれている。化合物タンパク混ぜ合わせ装置103と化合物ピックアップ装置107は、化合物ピックアップ装置107が化合物ライブラリ101から運び出した選択化合物を、タンパクライブラリ102から提供されたターゲットタンパクが収納されているプレートのウエルに入れることができるように結ばれている。
The
ここで、化合物ライブラリに含まれる化合物の情報はあらかじめ制御装置106に記憶されておいてもよい。
Here, information on compounds included in the compound library may be stored in the
化合物ライブラリ及びタンパクライブラリは通常の構成の装置を用いて構成できる。例えば、アンプルやバイアル中に各化合物の溶液をそれぞれの位置情報により規定された位置に配置し、そこからピペッター等の分配装置により、プレートのウエル等から構成される反応領域に必要量を分配すればよい。 The compound library and the protein library can be constructed using an apparatus having a usual configuration. For example, a solution of each compound is placed in an ampoule or vial at a position specified by the position information, and a required amount is distributed to a reaction area composed of a plate well or the like by a dispensing device such as a pipetter. That's fine.
次に各装置の動作について図2を参照しながら説明する。 Next, the operation of each apparatus will be described with reference to FIG.
まず、ユーザーがタンパクライブラリ102に複数のターゲットタンパクを並べ、化合物ライブラリ101に活性を測定する化合物を並べているとする(ステップ201)。 First, it is assumed that a user arranges a plurality of target proteins in the protein library 102 and arranges compounds whose activity is measured in the compound library 101 (step 201).
化合物ライブラリ101に化合物を並べる順番に特に制約はない。また化合物の情報も同時に化合物ライブラリの管理装置等に記憶される。化合物の情報として記憶されるものは化合物を学習可能な形で表現したものであり、例えば化合物の構造記述子や物理化学定数等がある。また、化合物の情報は化合物ライブラリにおける位置情報とともに記憶される。
There are no particular restrictions on the order in which the compounds are arranged in the
位置情報の記述方法としては、例えばプレートの端から順に番号付けを行っても良いし、プレート番号とプレート内部の番号という組で表現しても良い。 As a description method of the position information, for example, numbering may be performed sequentially from the end of the plate, or it may be expressed by a set of a plate number and a number inside the plate.
タンパクライブラリ102でも1枚のプレート内部では制約はないが、プレート間では同じ順序に並べなければならない。つまり任意のプレートにおいて1番目の穴は同じタンパクが注入されていることが前提条件となる。 The protein library 102 is not limited within one plate, but must be arranged in the same order between the plates. That is, the precondition is that the same protein is injected into the first hole in any plate.
次に、化合物ライブラリ101に含まれる化合物は化合物ピックアップ装置107に送られ、化合物の情報はその位置情報とともに制御装置106に送られる(ステップ202)。
Next, the compound contained in the
次に、制御装置106では記憶された化合物の情報を学習し、次に実験する化合物を選択し、その情報を化合物ピックアップ装置107に伝える(ステップ203)。
Next, the
このとき化合物を選択する手段としては、学習(マイニング)した結果、正例スコアの高い化合物を選び出すような手法や、活性を有した化合物との類似度をTanimoto係数等の類似度計算方法によって計算して類似度が高いものから順に化合物を選び出す方法等がある。また、非特許文献1に記載されるような能動学習法を用いて、次に測定する化合物を選択することも可能である。 At this time, as a means for selecting a compound, a method of selecting a compound having a high positive example score as a result of learning (mining), or a similarity with a compound having activity is calculated by a similarity calculation method such as a Tanimoto coefficient. Thus, there is a method of selecting compounds in descending order of similarity. Moreover, it is also possible to select the compound to be measured next by using an active learning method as described in Non-Patent Document 1.
使用する学習法は、例えば、決定木、決定リスト、ニューラルネットワーク、ナイーブベイズ(Naive Bayes)、ベイジアンネットワーク、遺伝的アルゴリズム、回帰分析、サポートベクタマシン等の何らかの表現形を用いて入出力データを学習するアルゴリズムであれば何でもよい。スコアは、個々の未知データの正例らしさの数値であり、例えば値が大きいほど、正例である可能性が高いことを示す。 The learning method used is, for example, learning input / output data using some expression such as a decision tree, decision list, neural network, naive Bayes, Bayesian network, genetic algorithm, regression analysis, support vector machine, etc. Any algorithm can be used. The score is a numerical value of the likelihood of a positive example of each unknown data. For example, the larger the value, the higher the possibility of being a positive example.
次に、化合物タンパク混ぜ合わせ装置103では、化合物ピックアップ装置107から送られてきた選択化合物が、タンパクライブラリ102から送られてきたターゲットタンパクが収納されている個々のウエルに入れて混ぜられる。混ぜられた選択化合物とターゲットタンパクを有するプレートは反応装置104に送られる(ステップ204)。
Next, in the compound
次に、反応装置104では選択化合物のターゲットタンパクに対する活性を調べるため、それぞれのターゲットタンパクに対応した条件で反応が行われる。このときプレート内に配置された個々のターゲットタンパクの反応条件は同じであっても良いし、異なっていてもよい。反応終了後のプレートは活性測定装置105に送られる(ステップ205)。
Next, in order to examine the activity of the selected compound with respect to the target protein in the
活性測定装置105では選択化合物の個々のターゲットタンパクに対する活性が測定される。得られた活性測定情報は選択化合物の位置情報とともに制御装置106に伝えられる。ここで、活性測定情報とは、例えば、活性の有無、活性の測定値等がある。
The
次に、制御装置106では活性測定装置105から受け取った活性測定情報を蓄積し記憶する。そのとき個々のターゲットタンパクに対する化合物の活性情報の記憶方法としては、例えば、活性の測定値の情報をそのまま記憶させる、または、ある閾値を設けその閾値以上の活性を持つ場合には1、それ以外の場合には0として扱う手法等がある。
Next, the
また、選択化合物の複数のターゲットタンパクに対する実験結果については、例えば、個々のターゲットタンパクの結果を個々に記憶させたり、いずれか少なくとも1つのタンパクにおいて活性が認められた場合には1、すべてのタンパクにおいて活性が認められなかった場合には0として値を記憶させることもできる。また、活性測定情報は選択化合物の位置情報と対応付けて制御装置106に記憶される。
In addition, with regard to the experimental results of a selected compound for a plurality of target proteins, for example, the results of individual target proteins are individually memorized, or when activity is recognized in at least one protein, all proteins If no activity is observed in, the value can be stored as 0. The activity measurement information is stored in the
次に、制御装置106に蓄積された化合物の情報と新たに取得した選択化合物の活性測定情報を基に、学習や類似度計算を行い、その結果スコアリング結果が高い化合物のうち実験を行っていないものから順に次に実験する化合物が選択される。そして、新たに選択された化合物の位置情報が化合物ピックアップ装置107に送られる(ステップ207)。新たな選択化合物の位置情報を送った後はステップ203から207の処理が、それらの処理をユーザーが終了させるまで、繰り返される。
Next, learning and similarity calculation are performed based on the compound information accumulated in the
なお、本発明の構成を、ターゲットタンパクがプレートのウエルに収納され、そこに試験化合物を入れて反応を行う方法による例に基づいて説明したが、特にこの例に限定されるものではない。例えば、ターゲットタンパクを収納する容器として試験管やバイアルを使用してもよいし、反応を行う容器としても試験管やバイアル等を使用し、その試験管等に化合物溶液やタンパク溶液を混ぜ合わせることができる。 In addition, although the structure of this invention was demonstrated based on the example by the method by which target protein is accommodated in the well of a plate and puts a test compound in there and reacts, it is not limited to this example in particular. For example, a test tube or a vial may be used as a container for storing the target protein, or a test tube or a vial may be used as a container for reaction, and a compound solution or a protein solution is mixed in the test tube. Can do.
また、本発明の構成を説明するにあたり、次に活性を測定する化合物を選択する方法として能動学習法を利用しているが、本発明で使用する学習法は特に能動学習法に限定されるものではなく、通常の学習法や類似度計算方法を使用することもできる。 In the description of the configuration of the present invention, the active learning method is used as a method for selecting the compound whose activity is to be measured next. However, the learning method used in the present invention is particularly limited to the active learning method. Instead, a normal learning method or similarity calculation method can be used.
以下、実施例を挙げ、本発明をより具体的に説明するが、本発明はこれら実施例に何ら限定されるものではない。 EXAMPLES Hereinafter, although an Example is given and this invention is demonstrated more concretely, this invention is not limited to these Examples at all.
(実施例1)
実施例1では、化合物ライブラリとして4962個の市販ライブラリに含まれる化合物を使い、ターゲットタンパクとしてはGaba、Benzodiazepineという2つの受容体を用い、両ターゲットタンパクに活性を有する化合物の探索に本発明の構成を有するスクリーニング装置を用いた場合に、どの程度効率的に探索できるのかを確認した。
Example 1
In Example 1, the compounds contained in 4962 commercially available libraries are used as the compound library, and two receptors, Gaba and Benzodiazepine, are used as the target proteins, and the constitution of the present invention is used to search for compounds having activity in both target proteins. It was confirmed how efficiently the search can be performed when a screening apparatus having the above is used.
使用した化合物ライブラリに含まれる化合物において、Gaba受容体のみに対し活性を有する化合物は39個、Benzodiazepine受容体のみに対し活性を有する化合物は6個、Gaba及びBenzodiazepine両方の受容体に活性を有する化合物は5個含まれている。なお、Gaba受容体に対し活性を有する化合物は44個、Benzodiazepine受容体に対し活性を有する化合物は11個含まれていることになる。 Of the compounds included in the compound library used, 39 compounds have activity only for the Gaba receptor, 6 compounds have activity only for the Benzodiazepine receptor, and compounds that have activity on both Gaba and Benzodiazepine receptors. Are included. In addition, 44 compounds having activity with respect to the Gaba receptor and 11 compounds having activity with respect to the benzodiazepine receptor are included.
以上のような目的で本提案装置を適合させると以下のようになる。 When the proposed apparatus is adapted for the above purpose, it is as follows.
化合物ライブラリ101には4962個の化合物が存在しており、タンパクライブラリ102に格納されるターゲットタンパクを収納するプレートには、少なくとも2つのウエルがあり、それぞれのウエルには個々のターゲットタンパクが収納されている。そのウエルが反応領域となり、活性を測定する化合物を注入し混ぜ合わせ、反応を行うことになる。1種の化合物について1プレート使用する設定となるため、個々のターゲットタンパクが所定位置のウエルに収納された同一のプレートが複数枚用意されていることになる。
There are 4962 compounds in the
また、化合物ピックアップ装置107においては同時に96化合物を選び出すようなシステム構成とした。つまり、化合物ピックアップ装置107にて96化合物を選択し、化合物タンパク混ぜ合わせ装置103にてそれぞれの化合物を96枚の個々のターゲットタンパクが収納されたプレートのウエルに注入して混ぜ合わせることになる。
The
制御装置106の内部では、決定木を下位学習機とした能動学習法(「発見科学とデータマイニング」参照、ISBN4−320−12018−3)を用いて次に実験を行う化合物を決めた。能動学習をした結果、まだ実験を行っていない化合物からスコアが高く判定された順に試験選択順位を決定し、化合物を選び出した。
Inside the
学習用データは、10分割を行い、そのうちの1つのデータセットを活性既知データとして学習を開始し、他の9つのデータセットを活性未知データとして扱い、活性未知データの中から両受容体に作用する化合物を特定することにした。データの分割は、(i)G
abaとBenzodiazepineの両方の受容体に活性のないものを10分割、(ii)GabaとBenzodiazepineの両方の受容体に活性を有する化合物を10分割、(iii)Gaba受容体のみ活性を有する化合物を10分割、(iv)Benzodiazepine受容体にのみ活性を有する化合物を10分割した後、(i)乃至(iv)における1分割づつをあわせ、10分割したデータを作成した。なお、正確に割り切れない部分は適当に振り分けた。
The learning data is divided into 10 parts, one of the data sets starts learning as activity known data, the other 9 data sets are treated as activity unknown data, and act on both receptors from the activity unknown data. It was decided to identify the compound to be. The data is divided into (i) G
Inactive compounds for both aba and benzodiapine receptors are divided into 10 parts, (ii) compounds having activity in both Gaba and benzodiazepine receptors are divided into 10 parts, and (iii) compounds having activity only in Gaba receptor are provided in 10 parts Dividing, (iv) After dividing the compound having activity only on the benzodiazepine receptor into 10 parts, the data in 10 parts were prepared by combining 1 part in (i) to (iv). In addition, the part which cannot be divided correctly was distributed appropriately.
評価は両ターゲットタンパクに対する活性を持つ全5化合物がいかに早期の段階で特定できるのかということで行った。なお、選び出した化合物の活性の有無については、活性測定を実際に行うことをせず、データベースに登録されている情報により確認した。 The evaluation was performed based on how early all 5 compounds having activity against both target proteins can be identified. The presence or absence of activity of the selected compound was confirmed by information registered in the database without actually measuring the activity.
制御装置106に記憶する活性の表現方法としては、以下の4種類である。
(A)Gaba及びBenzodiazepineの両方の受容体に活性を有する化合物のみを1とし、他の化合物を0として表現した場合
(B)Gaba受容体に活性を有する化合物のみを1とし、他の化合物を0として表現した場合
(C)Benzodiazepine受容体に活性を有する化合物のみを1とし、他の化合物を0として表現した場合
(D)Gaba及びBenzodiazepineのうちいずれか一方の受容体に活性を有する化合物のみを1とし、他の化合物を0として表現した場合
(A)は両受容体に作用する化合物を直接特定するとき、(B)はGaba受容体に作用する化合物を手がかりとして両受容体に作用する化合物を特定するとき、(C)はBenzodiazepine受容体に作用する化合物を手がかりとして両受容体に作用する化合物を特定するとき、(D)はいずれかの受容体のに作用する化合物を手がかりとして両受容体に作用する化合物を特定するとき、に相当している。
There are the following four types of expression methods of activity stored in the
(A) When only compounds having activity at both receptors of Gaba and Benzodiazepine are set to 1 and other compounds are expressed as 0 (B) Only compounds having activity at the Gaba receptor are set to 1, and other compounds are When expressed as 0 (C) When a compound having activity at the benzodiazepine receptor is 1, only when the other compound is expressed as 0 (D) Only a compound having activity at one of the receptors of Gaba and benzodiapine Is expressed as 1 and other compounds are expressed as 0. (A) directly identifies compounds acting on both receptors, (B) acts on both receptors using compounds acting on Gaba receptors as clues. When identifying a compound, (C) is a compound that acts on the Benzodiazepine receptor. When identifying a compound that acts on both receptors as a key, (D) corresponds to identifying a compound that acts on both receptors using a compound acting on either receptor as a clue.
(A)及び(C)の場合には10分割すると学習の初期段階において値1を持つデータが含まれていないようなデータセットが出現してしまい、性能を正確に測定することができなくなるおそれがあるため、理論的に妥当な5分割の1つのデータセットから学習を開始し、残りの4つのデータセットからデータを選び出すこととした。 In the case of (A) and (C), if the number is divided into 10, a data set that does not include data having a value of 1 appears in the initial stage of learning, and the performance cannot be accurately measured. Therefore, learning is started from one theoretically valid data set divided into five, and data is selected from the remaining four data sets.
そのような問題設定のもと、両タンパク受容体に対する全活性化合物を特定するために要した化合物数は、
(A)では1473化合物、
(B)では976化合物、
(C)では880化合物、
(D)では784化合物
であった。
Under such a problem setting, the number of compounds required to identify all active compounds for both protein receptors is:
(A) is a 1473 compound,
(B) 976 compounds,
In (C), 880 compounds,
In (D), it was 784 compounds.
従来法のようにHTSでそのままアッセイ実験を行う場合には全化合物について実験する必要があるため、4962化合物をすべて実験する必要がある。最初から2つのターゲットに対する活性を有する化合物のみを探索する場合((A)の場合)には1473化合物、Gaba受容体に作用する化合物を探したのち、その中からBenzodiazepine受容体にも作用する化合物を探す場合には976化合物、Benzodiazepine受容体に作用する化合物を探したのちGaba受容体にも作用する化合物を探す場合には880化合物、Gaba受容体とBenzodiazepine受容体とのいずれかに作用する化合物を探していく場合には784化合物で探し出すことができ、本発明の装置の有効性を示すことができた。 When an assay experiment is performed as it is with HTS as in the conventional method, it is necessary to experiment on all compounds, and therefore it is necessary to experiment on all 4962 compounds. When searching only for compounds having activity against two targets from the beginning (in the case of (A)), after searching for compounds that act on 1473 compounds and Gaba receptors, compounds that also act on Benzodiapine receptor from among them When searching for 976 compounds, searching for compounds that act on the benzodiazepine receptor and then searching for compounds that also act on the gaba receptor, 880 compounds, compounds that act on either the gaba receptor or the benzodiapine receptor In this case, it was possible to search for 784 compounds, and to show the effectiveness of the apparatus of the present invention.
(実施例2)
制御装置106においては上記のような能動学習法だけでなく、通常の学習法も手段として使うことができる。
(Example 2)
The
その場合、制御装置106における処理の方法としては、学習を行った結果、ターゲットタンパクに対する活性を有する化合物の特徴を持つというスコア順にランキング付けを行うということになる。上記と同様のシステム構成によって、通常の学習法を使ったときの実験を行った。
In this case, as a processing method in the
下位学習機械としては決定木を使ったアンサンブル学習を行った。代表的なアンサンブル学習として、例えばバギング(Bagging)とブースティング(Boosting)がある。 As a subordinate learning machine, ensemble learning using decision trees was performed. As typical ensemble learning, there are, for example, bagging and boosting.
そのときの評価方法としては、学習後に選び出された最初の96個の化合物中に、両受容体に活性を有する化合物がいくつ含まれているかを比較した。 As an evaluation method at that time, the number of compounds having activity at both receptors in the first 96 compounds selected after learning was compared.
その結果以下のような結果になった。 As a result, the following results were obtained.
(A)の場合0化合物
(B)の場合1化合物
(C)の場合0化合物
(D)の場合2化合物
この結果、早期の段階で、(D)が最も多くの活性化合物を探し出していることがわかり、制御装置106における学習方法は能動学習法だけでなく、通常の学習法も有効であることがわかった。
In the case of (A) 0 compound in the case of (B) 1 compound in the case of (C) 2 compound in the case of (D) As a result, (D) is searching for the most active compounds at an early stage. Thus, it was found that the learning method in the
(実施例3)
制御装置106においては学習法だけでなくTanimoto係数をはじめとする類似度計算手法も使うことができる。
(Example 3)
The
その場合、制御装置106における処理方法として、高い活性をもつ化合物と化合物ライブラリ101に含まれる化合物との類似度を計算し、その類似度の高い順にランキング付けを行うということになる。そのような手法の有効性は<非特許文献1>の類縁化合物選択法の性能が示すように、能動学習法ほどではないにせよ、同様の優れた効果を持つことが示されている。
In this case, as a processing method in the
(実施例4)
本提案の手法は2つのターゲットを探索する場合だけでなく、3つ以上のターゲットに同時に作用するような化合物を探す場合にも容易に拡張できる。拡張方法はタンパクライブラリ102におけるターゲットの数を3以上にし、制御装置106では少なくとも1つのターゲットにおいて活性を認められた化合物に対して1、いずれのターゲットに対しても活性が認められなかった化合物には0と表現すればよいためである。そのように表現することによって前述の装置と同様の問題設定となるため、学習もしくは類似度検索により同様の効果をもつといえる。
Example 4
The proposed method can be easily extended not only when searching for two targets but also when searching for compounds that act simultaneously on three or more targets. In the expansion method, the number of targets in the protein library 102 is set to 3 or more, and the
101:化合物ライブラリ
102:タンパクライブラリ
103:化合物タンパク混ぜ合わせ装置
104:実験装置
105:活性測定装置
106:制御装置
107:化合物ピックアップ装置
DESCRIPTION OF SYMBOLS 101: Compound library 102: Protein library 103: Compound protein mixing apparatus 104: Experimental apparatus 105: Activity measuring apparatus 106: Control apparatus 107: Compound pick-up apparatus
Claims (5)
複数の化合物を所定位置に配置してなる化合物ライブラリと、
2種以上のターゲットタンパクを各々独立して所定位置に配置した同一のプレートが複数枚含まれているタンパクライブラリと、
該プレートの各反応領域で試験化合物とターゲットタンパクとを反応させるための反応装置と、
該反応領域内での試験化合物とターゲットタンパクとの反応を検出するための検出装置と、
前記化合物ライブラリ中の化合物に試験選択順位を付けるための制御手段と、
前記化合物ライブラリから試験化合物を取り出して、前記プレートの反応領域中に分配するための分配手段と、
を有し、
前記制御手段により、前記試験選択順位に基づいて選択された試験化合物の新たな分析プレートへの分配が前記分配手段に指令され、
前記制御手段は、前記化合物ライブラリにおける化合物の位置情報を用いて前記試験選択順位に基づいて選択された化合物を、前記化合物ライブラリにおける化合物の位置情報を用いて選択し、選択された位置にある化合物を新たなプレートへの分配を指令し、
前記試験選択順位は、前記検出装置からの検出データと前記化合物ライブラリの各化合物に関する情報とを用いた学習又は類似度計算により決定され、
前記学習又は類似度計算を行うときのターゲットタンパクに対する活性の表現方法として、少なくとも1つのターゲットタンパクに対する活性を持つことを示す値と、いずれのターゲットタンパクに対しても活性を持たないことを示す値との2値により表現を行うことを特徴とする記載のシステム。 A system for identifying a compound having activity against two or more target proteins,
A compound library in which a plurality of compounds are arranged at predetermined positions;
A protein library including a plurality of identical plates each having two or more target proteins independently arranged at predetermined positions;
A reaction apparatus for reacting a test compound and a target protein in each reaction region of the plate;
A detection device for detecting a reaction between the test compound and the target protein in the reaction region;
Control means for assigning a test selection order to the compounds in the compound library ;
A dispensing means for removing a test compound from the compound library and dispensing it into the reaction region of the plate;
Have
The control means instructs the distribution means to distribute the test compound selected based on the test selection order to a new analysis plate,
The control means selects a compound selected based on the test selection order using the position information of the compound in the compound library using the position information of the compound in the compound library, and is a compound at the selected position. Command distribution to a new plate,
The test selection order is determined by learning or similarity calculation using detection data from the detection device and information on each compound in the compound library,
As a method for expressing the activity for the target protein when performing the learning or similarity calculation, a value indicating that the target protein has activity with respect to at least one target protein, and a value indicating that the target protein does not have activity The system according to claim 1, wherein the system is expressed by binary values.
化合物ライブラリに含まれる化合物群から順次選択される化合物に対して、前記2種以上のターゲットタンパクの少なくとも1種に対する活性を測定する工程を含み、
学習法又は類似度計算方法によって次に測定する化合物が選択され、
学習や類似度計算を行うときのターゲットタンパクに対する活性の表現方法として、少なくとも1つのターゲットタンパクに対する活性を持つことを示す値と、いずれのターゲットタンパクに対しても活性を持たないことを示す値との2値により表現を行うことを特徴とするスクリーニング方法。 In a screening method for compounds having activity on two or more target proteins,
Measuring the activity against at least one of the two or more target proteins with respect to compounds sequentially selected from the compound group included in the compound library ,
The compound to be measured next is selected by the learning method or the similarity calculation method ,
As a method of expressing the activity against the target protein when performing learning or similarity calculation, a value indicating that it has activity against at least one target protein, and a value indicating that it does not have activity against any target protein A screening method characterized in that the expression is performed using the binary value .
前記類似度の計算結果を基に次に実験する化合物を選択する請求項2乃至4のいずれかに記載のスクリーニング方法。 The similarity between the individual compounds included in the target protein at least one also compound with said compound library have a activity in the process is calculated,
The screening method according to any one of claims 2 to 4 for selecting a compound that next experiment based on the calculation result of the similarity.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007058741A JP4840597B2 (en) | 2007-03-08 | 2007-03-08 | Drug discovery multi-target screening device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007058741A JP4840597B2 (en) | 2007-03-08 | 2007-03-08 | Drug discovery multi-target screening device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008224235A JP2008224235A (en) | 2008-09-25 |
JP4840597B2 true JP4840597B2 (en) | 2011-12-21 |
Family
ID=39843061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007058741A Active JP4840597B2 (en) | 2007-03-08 | 2007-03-08 | Drug discovery multi-target screening device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4840597B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10533979B2 (en) | 2011-06-01 | 2020-01-14 | Tsumura & Co. | Method of and apparatus for formulating multicomponent drug |
WO2012164954A1 (en) * | 2011-06-01 | 2012-12-06 | 株式会社ツムラ | Method for evaluating similarity of aggregated data, similarity evaluation program, and similarity evaluation device |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2001253319A1 (en) * | 2000-04-14 | 2001-10-30 | Caliper Life Sciences, Inc. | Screening assay methods and systems using target pooling |
US20050009204A1 (en) * | 2003-07-11 | 2005-01-13 | Ye Fang | Multiplexed binding assays for receptor arrays |
WO2004102165A1 (en) * | 2003-05-07 | 2004-11-25 | Novasite Pharmaceuticals, Inc. | Multiplexed multitarget screening method |
-
2007
- 2007-03-08 JP JP2007058741A patent/JP4840597B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2008224235A (en) | 2008-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020201622B2 (en) | Methods and system for detecting sequence variants | |
US20210280272A1 (en) | Methods and systems for quantifying sequence alignment | |
JP6902073B2 (en) | Methods and systems for aligning arrays | |
US10325675B2 (en) | Methods and systems for detecting sequence variants | |
Stormo | [13] consensus patterns in dna | |
Zhu et al. | Big data in chemical toxicity research: the use of high-throughput screening assays to identify potential toxicants | |
Bajorath | Computational analysis of ligand relationships within target families | |
JP2016533182A (en) | Methods and systems for identifying disease-induced mutations | |
WO2002103030A2 (en) | Multidimensional biodata integration and relationship inference | |
BG107717A (en) | Method of operating a computer system to perform a discrete substructural analysis | |
JP4840597B2 (en) | Drug discovery multi-target screening device | |
Panagiotou et al. | The impact of network biology in pharmacology and toxicology | |
Terai et al. | Predicting rules on organization of cis-regulatory elements, taking the order of elements into account | |
Kozak et al. | Data mining techniques in high content screening: a survey | |
KR100456627B1 (en) | System and method for predicting 3d-structure based on the macromolecular function | |
Reynolds et al. | Accelerating biological insight for understudied genes | |
JP2008100918A (en) | Similarity calculation processing system, processing method and program of the same | |
US20140171332A1 (en) | System for the efficient discovery of new therapeutic drugs | |
Kümmel et al. | The interweaving of cheminformatics and HTS | |
Johnson et al. | Gene coexpression networks reveal a broad role for lncRNAs in inflammatory bowel disease | |
Viesná et al. | FastContext: A tool for identification of adapters and other sequence patterns in next generation sequencing (NGS) data | |
Ferreira et al. | The identification of DNA binding regions of the σ54 factor using artificial neural network | |
Miertus et al. | Key Ingredients for Efficient High-Throughput Screening Lucia Carrano and Stefano Donadio | |
WO2024151979A2 (en) | Approaches to designing and performing compressed biological experiments and systems for implementing the same | |
Carrano et al. | Key ingredients for efficient high throughput screening |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100218 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110622 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110907 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4840597 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141014 Year of fee payment: 3 |