JP2008081435A - 化合物の仮想スクリーニング方法および装置 - Google Patents
化合物の仮想スクリーニング方法および装置 Download PDFInfo
- Publication number
- JP2008081435A JP2008081435A JP2006262595A JP2006262595A JP2008081435A JP 2008081435 A JP2008081435 A JP 2008081435A JP 2006262595 A JP2006262595 A JP 2006262595A JP 2006262595 A JP2006262595 A JP 2006262595A JP 2008081435 A JP2008081435 A JP 2008081435A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- conformation
- score
- compound
- virtual screening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】複数のエネルギー関数を用いて、計算機により生成された化合物の配座のエネルギーを計算する段階(ステップA2〜A3)と、得られたエネルギー値とタンパク質・化合物間の結合指標とについて教師付き学習を行う段階(ステップA4)と、教師付き学習の結果に基づいて化合物の配座を予測する段階(ステップA5)と、を設ける。
【選択図】図1
Description
ここで、xは複数のスコア関数の集合、yはRMSDである。ステップB2において分岐候補数mとブートストラップ回数Bとを設定し、ステップB3において、データセットのラウンド数bをb=1で初期化する。次に、ステップB4において、データ集合Dから重複を許してN回無作為にリサンプリングを行う。この操作をB回行い、ブートストラップサンプルをB個生成する。
2 データ処理装置
3 記憶装置
4 出力装置
21 配座サンプリング部
22 スコア計算部
23 学習部
24 予測スコア計算部
31 訓練用構造データ記憶部
32 予測用分子構造データ記憶部
33 配座データ記憶部
34 訓練用スコアデータ記憶部
35 予測用スコアデータ記憶部
36 予測モデル記憶部
Claims (13)
- タンパク質と結合する化合物を探索する仮想スクリーニング方法において、
複数のエネルギー関数を用いて、計算機により生成された化合物の配座のエネルギーを計算する段階と、
得られたエネルギー値とタンパク質・化合物間の結合指標とについて教師付き学習を行う段階と、
前記教師付き学習の結果に基づいて化合物の配座を予測する段階と、
を有することを特徴とする化合物の仮想スクリーニング方法。 - 前記化合物の配座のエネルギーを、分子力場あるいは経験的なモデルに基づくエネルギー関数を用いて計算する請求項1に記載の仮想スクリーニング方法。
- 前記結合指標は、実験的に決定された化合物の結合配座と計算機によって生成された化合物の配座との間のRMSD(Root Mean Squared Deviation;根平均二乗変位)である、請求項1または2に記載の仮想スクリーニング方法。
- 前記教師付き学習を行う段階において、RMSD値に対する回帰モデルあるいは一定のしきい値によりRMSDを離散化した分類モデルを学習する、請求項1乃至3のいずれか1項に記載の仮想スクリーニング方法。
- 前記教師付き学習は、アンサンブル学習であるブースティングあるいはバギングを用いる学習である、請求項1乃至4のいずれか1項に記載の仮想スクリーニング方法。
- 前記教師付き学習は、ランダムフォレストによる学習である、請求項1乃至5のいずれか1項に記載の仮想スクリーニング方法。
- 前記教師付き学習を行う段階において、反復バギング法のバギングをランダムフォレストにより構成する、請求項1乃至6のいずれか1項に記載の仮想スクリーニング方法。
- 前記教師付き学習を行う段階において、確率勾配ブースティング法の勾配が反復ランダムフォレスト法に適用される、請求項1乃至7のいずれか1項に記載の仮想スクリーニング方法。
- 教師付き学習方法が分類モデルの場合に、少数クラスのデータ数と同数あるいは同じオーダーのデータを多数クラスからリサンプリングする、請求項1乃至4のいずれか1項に記載の仮想スクリーニング方法。
- 教師付き学習方法が分類モデルの場合に、少数クラスに重み付き学習を行う、請求項1乃至4のいずれか1項に記載の仮想スクリーニング方法。
- タンパク質・化合物複合体の立体構造に基づき、タンパク質と結合する化合物を探索するために用いられる仮想スクリーニング装置において、
タンパク質・リガンド複合体の立体構造情報を記憶する訓練用構造データ記憶部と、
予測用の分子構造を記憶する予測用分子構造データ記憶部と、
分子の立体配座を生成する配座サンプリング手段と、
前記配座サンプリング手段によって生成された配座の配座情報を記憶する配座データ記憶部と、
タンパク質立体構造と配座に基づいて複数のスコア関数を計算するスコア計算手段と、
タンパク質と複合体を形成する分子の配座情報を記憶する訓練用スコアデータ記憶部と、
予測用の分子の配座情報を予測用スコアデータとして記憶する予測用スコアデータ記憶部と、
各配座のRMSD(Root Mean Squared Deviation;根平均二乗変位)と複数のスコア値とに基づき教師付き学習を行う学習手段と、
前記学習手段によって学習された予測モデルを記憶する予測モデル記憶部と、
予測用スコアデータに対して前記予測モデルを適用し、予測スコア値を計算する予測スコア計算手段と、
を有することを特徴とする仮想スクリーニング装置。 - タンパク質・化合物複合体の立体構造に基づき、タンパク質と結合する化合物を探索するために用いられる仮想スクリーニング装置において、
予測用の分子構造を記憶する予測用分子構造データ記憶部と、
分子の立体配座を生成する配座サンプリング手段と、
前記配座サンプリング手段によって生成された配座の配座情報を記憶する配座データ記憶部と、
タンパク質立体構造と配座に基づいて複数のスコア関数を計算するスコア計算手段と、
予測用の分子の配座情報を予測用スコアデータとして記憶する予測用スコアデータ記憶部と、
教師付き学習によって得られた予測モデルを記憶する予測モデル記憶部と、
前記予測用スコアデータに対して前記予測モデルを適用し、予測スコア値を計算する予測スコア計算手段と、
を有することを特徴とする仮想スクリーニング装置。 - タンパク質と結合する化合物を探索する仮想スクリーニングを実行するコンピュータに、
化合物の配座を生成する処理と、
複数のエネルギー関数を用いて、前記生成された化合物の配座のエネルギーを計算する処理と、
得られたエネルギー値とタンパク質・化合物間の結合指標とについて教師付き学習を行う処理と、
前記教師付き学習の結果に基づいて化合物の配座を予測する処理と、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006262595A JP5211458B2 (ja) | 2006-09-27 | 2006-09-27 | 化合物の仮想スクリーニング方法および装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006262595A JP5211458B2 (ja) | 2006-09-27 | 2006-09-27 | 化合物の仮想スクリーニング方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008081435A true JP2008081435A (ja) | 2008-04-10 |
JP5211458B2 JP5211458B2 (ja) | 2013-06-12 |
Family
ID=39352639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006262595A Expired - Fee Related JP5211458B2 (ja) | 2006-09-27 | 2006-09-27 | 化合物の仮想スクリーニング方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5211458B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014034577A1 (ja) | 2012-08-27 | 2014-03-06 | 株式会社京都コンステラ・テクノロジーズ | 化合物設計装置、化合物設計方法、及びコンピュータプログラム |
CN111402967A (zh) * | 2020-03-12 | 2020-07-10 | 中南大学 | 一种基于机器学习算法提升对接软件虚拟筛选能力的方法 |
CN112086145A (zh) * | 2020-09-02 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种化合物活性预测方法、装置、电子设备和存储介质 |
WO2021044857A1 (ja) | 2019-09-05 | 2021-03-11 | 株式会社日立製作所 | 材料特性予測システムおよび情報処理方法 |
JP2021190110A (ja) * | 2020-05-26 | 2021-12-13 | 中国海洋大学 | rmsdマルチ特徴に基づく薬物分子動力学結果の分析方法 |
CN114708931A (zh) * | 2022-04-22 | 2022-07-05 | 中国海洋大学 | 结合机器学习和构象计算提高药-靶活性预测精度的方法 |
WO2023108465A1 (zh) * | 2021-12-15 | 2023-06-22 | 深圳晶泰科技有限公司 | 虚拟筛选方法、装置及电子设备 |
WO2023131206A1 (zh) * | 2022-01-04 | 2023-07-13 | 上海智峪生物科技有限公司 | 复合物的结合强度评估方法、装置及计算机设备 |
-
2006
- 2006-09-27 JP JP2006262595A patent/JP5211458B2/ja not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014034577A1 (ja) | 2012-08-27 | 2014-03-06 | 株式会社京都コンステラ・テクノロジーズ | 化合物設計装置、化合物設計方法、及びコンピュータプログラム |
WO2021044857A1 (ja) | 2019-09-05 | 2021-03-11 | 株式会社日立製作所 | 材料特性予測システムおよび情報処理方法 |
CN111402967A (zh) * | 2020-03-12 | 2020-07-10 | 中南大学 | 一种基于机器学习算法提升对接软件虚拟筛选能力的方法 |
CN111402967B (zh) * | 2020-03-12 | 2023-04-07 | 中南大学 | 一种基于机器学习算法提升对接软件虚拟筛选能力的方法 |
JP2021190110A (ja) * | 2020-05-26 | 2021-12-13 | 中国海洋大学 | rmsdマルチ特徴に基づく薬物分子動力学結果の分析方法 |
CN112086145A (zh) * | 2020-09-02 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种化合物活性预测方法、装置、电子设备和存储介质 |
CN112086145B (zh) * | 2020-09-02 | 2024-04-16 | 腾讯科技(深圳)有限公司 | 一种化合物活性预测方法、装置、电子设备和存储介质 |
WO2023108465A1 (zh) * | 2021-12-15 | 2023-06-22 | 深圳晶泰科技有限公司 | 虚拟筛选方法、装置及电子设备 |
WO2023131206A1 (zh) * | 2022-01-04 | 2023-07-13 | 上海智峪生物科技有限公司 | 复合物的结合强度评估方法、装置及计算机设备 |
CN114708931A (zh) * | 2022-04-22 | 2022-07-05 | 中国海洋大学 | 结合机器学习和构象计算提高药-靶活性预测精度的方法 |
CN114708931B (zh) * | 2022-04-22 | 2023-01-24 | 中国海洋大学 | 结合机器学习和构象计算提高药-靶活性预测精度的方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5211458B2 (ja) | 2013-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gao et al. | Incorporation of solvent effect into multi-objective evolutionary algorithm for improved protein structure prediction | |
JP5211458B2 (ja) | 化合物の仮想スクリーニング方法および装置 | |
Zimmerman et al. | Choice of adaptive sampling strategy impacts state discovery, transition probabilities, and the apparent mechanism of conformational changes | |
Nakajima et al. | Multicanonical ensemble generated by molecular dynamics simulation for enhanced conformational sampling of peptides | |
Kirillova et al. | An NMA‐guided path planning approach for computing large‐amplitude conformational changes in proteins | |
Agnihotry et al. | Protein structure prediction | |
Brylinski et al. | e FindSite: Improved prediction of ligand binding sites in protein models using meta-threading, machine learning and auxiliary ligands | |
US20050278124A1 (en) | Methods for molecular property modeling using virtual data | |
Thomas et al. | Integrating structure-based approaches in generative molecular design | |
Dodd et al. | Simulation-based methods for model building and refinement in cryoelectron microscopy | |
JP2009007302A (ja) | 仮想スクリーニング方法及び装置 | |
Zaborowski et al. | A maximum-likelihood approach to force-field calibration | |
Tropsha et al. | Integrating QSAR modelling and deep learning in drug discovery: the emergence of deep QSAR | |
Ismi et al. | Deep learning for protein secondary structure prediction: Pre and post-AlphaFold | |
Stringer et al. | PIPENN: protein interface prediction from sequence with an ensemble of neural nets | |
Binkowski et al. | Virtual high-throughput ligand screening | |
Zhao et al. | Discriminative learning for protein conformation sampling | |
US11621054B2 (en) | Method and apparatus for preprocessing of binding free energy calculation, and binding free energy calculation method | |
Antal et al. | Predicting the initial steps of salt-stable cowpea chlorotic mottle virus capsid assembly with atomistic force fields | |
Özçelik et al. | Structure-based drug discovery with deep learning | |
Ward et al. | Benchmarking deep graph generative models for optimizing new drug molecules for covid-19 | |
JP5262709B2 (ja) | 分子構造予測システム、方法及びプログラム | |
Talluri | Algorithms for protein design | |
WO2003038672A1 (fr) | Technique d'analyse, systeme d'analyse et programme d'analyse | |
Han et al. | Distribution of Bound Conformations in Conformational Ensembles for X-ray Ligands Predicted by the ANI-2X Machine Learning Potential |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120117 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120316 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120619 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130211 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |