JPWO2009118845A1 - 化合物の予測信頼性評価システム - Google Patents
化合物の予測信頼性評価システム Download PDFInfo
- Publication number
- JPWO2009118845A1 JPWO2009118845A1 JP2010505086A JP2010505086A JPWO2009118845A1 JP WO2009118845 A1 JPWO2009118845 A1 JP WO2009118845A1 JP 2010505086 A JP2010505086 A JP 2010505086A JP 2010505086 A JP2010505086 A JP 2010505086A JP WO2009118845 A1 JPWO2009118845 A1 JP WO2009118845A1
- Authority
- JP
- Japan
- Prior art keywords
- compound
- prediction
- virtual
- prediction target
- target compound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 0 *C([*+]c(cc1)cc(C2(CCCCCCCCCC2)F)c1F)=O Chemical compound *C([*+]c(cc1)cc(C2(CCCCCCCCCC2)F)c1F)=O 0.000 description 3
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
Landscapes
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Computing Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
Abstract
Description
予測精度=予測値の分散+予測値のバイアスの二乗
として示される値であって、予測モデルの予測傾向を評価する指標であり、ここで言う個々の化合物の「予測信頼性」とは全く異なったものである。
110 入力装置
120 出力装置
130 制御装置
140 記憶装置
150 構造類似化合物の生成装置
160 パラメータ発生装置
170 類似度計算装置
180 予測値算出装置
190 信頼度算出装置
図1は、一実施形態にかかる化合物の予測信頼性評価システム100の概略構造を示すブロック図である。予測信頼性評価システム100は、予測対象化合物の構造式および予め作成された予測モデルに関するデータを入力するための入力装置110、予測結果、予測信頼度および処理途中の必要なデータを出力する出力装置120、システム全体の制御を行う制御装置130、入力データ、演算途中のデータ、出力データ等を一時保存するための記憶装置140を備えている。
Y=a1・x1±a2・x2±・・・±an・xn±C (1)
本方法を実施するには、予測対象化合物を基本としてその類似サンプルを生成することが必用となる。サンプルの類似性は、予測対象化合物との類似性が問題であり、生成された仮想化合物同士の類似性は検討対象外となる。従って、生成する仮想化合物は、予測対象化合物からの化合物構造式の変化が最小であり、かつサンプル母集団内の化合物の構造変化性の大きさよりも充分に小さいことが望まれる。以下に、化合物の類似構造の生成手法について説明する。
類似化合物とは、比較される二つのサンプル(化合物)間での構造的な変化性が少ない化合物を意味する。化合物の特性から、構造変化性が少ないということは、化合物を構成する基本となる原子数が似ているということである。従って、化合物の構造変化が少ない(即ち、類似化合物である)ということは、原子数が似ていることといえる。従って、予測対象サンプルを基本として、その化合物から最少の数の原子を取り除く、あるいは付加することで、類似化合物の生成が可能である。
類似化合物生成という内容から考えて大きく全く方向性の異なる二種類の構造式変換アプローチが考えられる。これらは、予測対象化合物を起点とし、そのサンプルから原子を取り除いて構造変化を生じさせるアプローチと、逆に予測対象化合物に原子、更にはもう少し大きなグループ(例えば官能基等)を付け加えて構造変化を実現するアプローチである。これが、化合物構造式変化の大きな二大方向性となる。個々のより具体的な化合物構造式変換様式としては、化合物の構造変化性を考えると、原子の種類や数、結合の種類、環構造、架橋構造、縮合構造、芳香属/非芳香族、分子量、立体情報、その他の様々な変化要因が考えられる。今回の目的から考えると、これらの変化要因中、構造式を変えたとしてもその変化の影響が小さい手段を取ることが必要である。
炭素原子(飽和)は化合物の基本骨格を形成する上で極めて重要な原子である。ところが、炭素原子、特にメチル基(ME)の付加は、化合物の構造上の変化のみならず、化合物の特性(電子密度関連、種々物性関連、全体的形状、分子量、他)に大きな変化を及ぼさない。また、化合物構造式中、メチル基を追加できる部分は比較的多い。従って、最小数のメチル基を構造式中に追加することで、化合物の全体的な類似性を保ちつつ構造式を変化させることが可能である。
次に、例えば二次元構造式の形でコンピュータ上に入力された予測対象化合物から、仮想化合物のファイルを作成するための一手法について説明する。この手法では、ケモインフォマティクスにおいて汎用されているMOLファイルを利用する。
図1および2に示す実施形態では、1個の仮想化合物を生成すると、その仮想化合物の予測対象化合物に対する類似度を計算する。類似度評価のために種々の方法が提案されているが、どのような計算方法を採用しても良い。あるいは、ユーザ定義による類似度評価関数を使用しても良い。ユーザ定義による類似度評価関数としては、例えば、予測対象化合物に対してME基を付加して仮想化合物を生成する場合、ME基の数を類似度評価関数にするものなどが考えられる。この例については、後述の、発明者が行った実験例を説明する項において詳細に説明する。
以下に、図17〜図19を参照して、アセトアミノフェンを予測対象化合物として予測信頼性の評価を行った場合の実験結果を示す。図17は、ID番号1のアセトアミノフェンを予測対象サンプルとし、このサンプルに構造類似する20個の仮想化合物(ID番号8〜27)を発生させ、予測対象化合物と各仮想化合物に対して発癌性と2種類の変異原性試験(AMES−TA100、AMES−TA98)結果を予測した結果を示す。仮想化合物8〜27の構造を図18および図19に示す。本実験では、予測対象サンプルであるアセトアミノフェン(ID番号1)に対して、メチル基(ME)を付加することによって構造類似サンプルを生成した。
Claims (20)
- 予測対象化合物に構造類似する複数の化合物を仮想的に生成する仮想化合物生成装置と、
前記予測対象化合物と前記生成された各仮想化合物に対して予測モデルを適用し目的変数の予測値を算出する予測値算出装置と、
前記予測対象化合物の予測値と前記各仮想化合物の予測値との一致の度合いに基づいて、前記予測対象化合物の予測信頼度を算出する予測信頼度算出装置と、を備える、化合物の予測信頼性評価システム。 - 請求項1に記載のシステムにおいて、前記仮想化合物生成装置は、前記予測対象化合物との構造の類似度が予め決定した一定値以上の化合物を仮想化合物として生成する、化合物の予測信頼性評価システム。
- 請求項1に記載のシステムにおいて、前記予測信頼度算出装置は、前記仮想化合物の予測値に個々の仮想化合物の前記予測対象化合物との構造の類似度に基づく重み付けを行って予測信頼度を算出する、化合物の予測信頼性評価システム。
- 請求項1に記載のシステムにおいて、前記仮想化合物生成装置は、ユーザによって指定された仮想化合物を入力する入力ユニットを含む、化合物の予測信頼性評価システム。
- 請求項1に記載のシステムにおいて、前記仮想化合物生成装置は、予測対象化合物に原子又は官能基を付加することによって仮想化合物を生成する、化合物の予測信頼性評価システム。
- 請求項1に記載のシステムにおいて、前記仮想化合物生成装置は、予測対象化合物から原子又は官能基を削除することによって仮想化合物を生成する、化合物の予測信頼性評価システム。
- 請求項1に記載のシステムにおいて、前記仮想化合物生成装置は、予測対象化合物に少なくとも1個のメチル基を付加することにより仮想化合物を生成する、化合物の予測信頼性評価システム。
- 請求項1に記載のシステムにおいて、前記仮想化合物生成装置は、予測対象化合物のベンゼン環以外のC、O、SまたはN原子にメチル基を付加することにより、仮想化合物を生成する、化合物の予測信頼性評価システム。
- 予測対象化合物を準備し、
前記予測対象化合物に構造類似する複数の化合物を仮想的に生成し、
前記予測対象化合物と前記仮想的に生成した化合物とに同一の予測モデルを適用して各化合物の予測値結果を獲得し、
前記予測対象化合物の予測信頼性評価のために前記獲得した各化合物の予測結果の一致度を算出する、各ステップを備える、化合物の予測信頼性の評価方法。 - 請求項9に記載の方法において、前記仮想化合物を生成するステップは、前記予測対象化合物との構造の類似度が予め決定した一定値以上の化合物を仮想化合物として生成する、化合物の予測信頼性の評価方法。
- 請求項9に記載の方法において、前記予測結果の一致度を算出するステップは、前記仮想化合物の予測値に個々の仮想化合物の前記予測対象化合物との構造の類似度に基づく重み付けを行って予測信頼度を算出する、化合物の予測信頼性の評価方法。
- 請求項9に記載の方法において、前記仮想化合物を生成するステップは、予測対象化合物に原子又は官能基を付加することによって仮想化合物を生成するステップを含む、化合物の予測信頼性評価方法。
- 請求項9に記載の方法において、前記仮想化合物を生成するステップは、予測対象化合物から原子又は官能基を削除することによって仮想化合物を生成するステップを含む、化合物の予測信頼性評価方法。
- 請求項9に記載の方法において、前記仮想化合物を生成するステップは、予測対象化合物に少なくとも1個のメチル基を付加することにより仮想化合物を生成するステップを含む、化合物の予測信頼性評価方法。
- 請求項9に記載の方法において、前記仮想化合物を生成するステップは、予測対象化合物のベンゼン環以外のC、O、SまたはN原子にメチル基を付加することにより、仮想化合物を生成するステップを含む、化合物の予測信頼性評価方法。
- 予測対象化合物を入力する手順と、
前記予測対象化合物に構造類似する複数の化合物を仮想的に生成する手順と、
前記予測対象化合物と前記仮想的に生成した化合物とに同一の予測モデルを適用して各化合物の予測値結果を獲得する手順と、
前記予測対象化合物の予測信頼性評価のために前記獲得した各化合物の予測結果の一致度を算出する手順と、
前記算出した結果を予測対象化合物の予測結果と共に出力する手順と、をコンピュータに実行させるための、化合物の予測信頼性評価プログラム。 - 請求項16に記載のプログラムにおいて、前記仮想化合物を生成する手順は、前記予測対象化合物との構造の類似度が予め決定した一定値以上の化合物を仮想化合物として生成する、化合物の予測信頼性評価プログラム。
- 請求項16に記載のプログラムにおいて、前記予測結果の一致度を算出する手順は、前記仮想化合物の予測値に個々の仮想化合物の前記予測対象化合物との構造の類似度に基づく重み付けを行って予測信頼度を算出する、化合物の予測信頼性評価プログラム。
- 請求項16に記載のプログラムにおいて、前記仮想化合物を生成する手順は、予測対象化合物に原子又は官能基を付加することによって仮想化合物を生成する手順を含む、化合物の予測信頼性評価プログラム。
- 請求項16に記載のプログラムにおいて、前記仮想化合物を生成する手順は、予測対象化合物に少なくとも1個のメチル基を付加することにより仮想化合物を生成する手順を含む、化合物の予測信頼性評価プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2008/055753 WO2009118845A1 (ja) | 2008-03-26 | 2008-03-26 | 化合物の予測信頼性評価システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009118845A1 true JPWO2009118845A1 (ja) | 2011-07-21 |
JP5087756B2 JP5087756B2 (ja) | 2012-12-05 |
Family
ID=41113086
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010505086A Active JP5087756B2 (ja) | 2008-03-26 | 2008-03-26 | 化合物の予測信頼性評価システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5087756B2 (ja) |
WO (1) | WO2009118845A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5340204B2 (ja) * | 2010-03-01 | 2013-11-13 | キヤノン株式会社 | 推論装置、その制御方法およびプログラム |
US10497464B2 (en) | 2015-10-28 | 2019-12-03 | Samsung Electronics Co., Ltd. | Method and device for in silico prediction of chemical pathway |
JP6941353B2 (ja) * | 2017-07-12 | 2021-09-29 | 国立大学法人東海国立大学機構 | 毒性予測方法及びその利用 |
CN116635352A (zh) * | 2020-12-25 | 2023-08-22 | 富士胶片株式会社 | 信息处理装置、信息处理方法及信息处理程序 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003323601A (ja) * | 2002-05-01 | 2003-11-14 | Fujitsu Ltd | 信頼性尺度付き予測装置 |
JP2007153767A (ja) * | 2005-12-01 | 2007-06-21 | Univ Of Tokushima | 化学構造の類似度を算出し化合物の安全性を評価する方法及びこれを用いた医薬品安全性情報システム |
-
2008
- 2008-03-26 JP JP2010505086A patent/JP5087756B2/ja active Active
- 2008-03-26 WO PCT/JP2008/055753 patent/WO2009118845A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003323601A (ja) * | 2002-05-01 | 2003-11-14 | Fujitsu Ltd | 信頼性尺度付き予測装置 |
JP2007153767A (ja) * | 2005-12-01 | 2007-06-21 | Univ Of Tokushima | 化学構造の類似度を算出し化合物の安全性を評価する方法及びこれを用いた医薬品安全性情報システム |
Non-Patent Citations (3)
Title |
---|
SHERIDAN, R.P.: "Similarity to Molecules in the Training Set Is a Good Discriminator for Prediction Accuracy in QSAR", J. CHEM. INF. COMPUT. SCI., vol. 44, JPN6012038847, 2004, pages 1912 - 1928, XP002380043, ISSN: 0002287263, DOI: 10.1021/ci049782w * |
湯田浩太郎: "K-step Yard sampling methodの開発とADME-T予測への適用", 第34回構造活性相関シンポジウム講演要旨集, JPN6012038844, 7 November 2006 (2006-11-07), pages 29 - 30, ISSN: 0002287262 * |
颯々野学: "サポートベクタマシンを使った文書分類における仮想事例の利用", 自然言語処理, vol. 第13巻,第3号, JPN6012038843, 10 July 2006 (2006-07-10), pages 21 - 35, ISSN: 0002287261 * |
Also Published As
Publication number | Publication date |
---|---|
WO2009118845A1 (ja) | 2009-10-01 |
JP5087756B2 (ja) | 2012-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5104877B2 (ja) | 二クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび二クラス分類予測モデルの作成装置 | |
JP5141767B2 (ja) | サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置 | |
JP5293739B2 (ja) | 重回帰分析による予測モデルの作成方法、作成システムおよび作成プログラム | |
JP4985653B2 (ja) | 2クラス分類予測モデルの作成方法、分類予測モデル作成のためのプログラムおよび2クラス分類予測モデルの作成装置 | |
Ienco et al. | Deep multivariate time series embedding clustering via attentive-gated autoencoder | |
EP3764252A1 (en) | Polymer physical property prediction device, storage medium, and polymer physical property prediction method | |
Gimpy | Missing value imputation in multi attribute data set | |
JP5087756B2 (ja) | 化合物の予測信頼性評価システム | |
JP2010009177A (ja) | 学習装置、ラベル予測装置、方法、及び、プログラム | |
Zheng et al. | A self-adaptive temporal-spatial self-training algorithm for semisupervised fault diagnosis of industrial processes | |
Le Thi et al. | Gene selection for cancer classification using DCA | |
Tompkins et al. | Fourier feature approximations for periodic kernels in time-series modelling | |
JP7353874B2 (ja) | 材料特性予測装置および材料特性予測方法 | |
Cuentas et al. | An SVM-GA based monitoring system for pattern recognition of autocorrelated processes | |
Nowak et al. | Conversion of CVSS Base Score from 2.0 to 3.1 | |
Colla et al. | GADF—Genetic Algorithms for distribution fitting | |
JP6629682B2 (ja) | 学習装置、分類装置、分類確率計算装置、及びプログラム | |
Dzemyda et al. | Data science: new issues, challenges and applications | |
JP7298870B2 (ja) | 分子動力学データ解析装置及びプログラム | |
Salles et al. | Towards the next generation of species delimitation methods: an overview of Machine Learning applications | |
Yu | Independent screening for nonparametric additive Cox model | |
Sun | Imbalanced Binary Classification for Detecting Transcription Factor Binding Sites in H1 Human Embryonic Stem Cells | |
Chang et al. | TimeDRL: Disentangled Representation Learning for Multivariate Time-Series | |
Kırbaş | Determination of Appropriate Distribution Functions for the Wind Speed Data Using the R Language | |
Elarabi et al. | Utilizing LASSO for Breast Cancer Prediction: A Hyper Machine Learning Technique with Significant |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120731 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120813 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150921 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5087756 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |