JP5211486B2 - 化合物の仮想スクリーニング方法及び装置 - Google Patents
化合物の仮想スクリーニング方法及び装置 Download PDFInfo
- Publication number
- JP5211486B2 JP5211486B2 JP2007010581A JP2007010581A JP5211486B2 JP 5211486 B2 JP5211486 B2 JP 5211486B2 JP 2007010581 A JP2007010581 A JP 2007010581A JP 2007010581 A JP2007010581 A JP 2007010581A JP 5211486 B2 JP5211486 B2 JP 5211486B2
- Authority
- JP
- Japan
- Prior art keywords
- compound
- conformation
- energy
- binding
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 150000001875 compounds Chemical class 0.000 title claims description 74
- 238000000034 method Methods 0.000 title claims description 31
- 238000003041 virtual screening Methods 0.000 title claims description 24
- 230000006870 function Effects 0.000 claims description 46
- 238000004364 calculation method Methods 0.000 claims description 31
- 102000004169 proteins and genes Human genes 0.000 claims description 25
- 108090000623 proteins and genes Proteins 0.000 claims description 25
- 238000005070 sampling Methods 0.000 claims description 11
- 238000013145 classification model Methods 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 description 19
- 238000012549 training Methods 0.000 description 16
- 238000000547 structure data Methods 0.000 description 15
- 238000012545 processing Methods 0.000 description 13
- 239000003446 ligand Substances 0.000 description 9
- 238000007637 random forest analysis Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 6
- 238000003032 molecular docking Methods 0.000 description 6
- 238000004088 simulation Methods 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 101150008432 Postn gene Proteins 0.000 description 1
- 102100025368 Runt-related transcription factor 2 Human genes 0.000 description 1
- 101150086605 Runx2 gene Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 238000003003 empirical scoring function Methods 0.000 description 1
- 238000003092 force field based scoring function Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 238000004219 molecular orbital method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- NGVDGCNFYWLIFO-UHFFFAOYSA-N pyridoxal 5'-phosphate Chemical compound CC1=NC=C(COP(O)(O)=O)C(C=O)=C1O NGVDGCNFYWLIFO-UHFFFAOYSA-N 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- LSJNBGSOIVSBBR-UHFFFAOYSA-N thionyl fluoride Chemical compound FS(F)=O LSJNBGSOIVSBBR-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- Pharmacology & Pharmacy (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
Renxiao Wang, Yipin Lu, Shaomeng Wang, Comparative evaluation of 11 scoring functions for molecular docking, Journal of Medicinal Chemistry 2003 vol.46 no.12 2287−2303
[非特許文献3] Leo Breiman, Bagging Predictors, Machine Learning 1996 vol.24 123−140
[非特許文献4] Leo Breiman, Random Forests, Machine Learning 2001 vol.45 5−32
[非特許文献5] Leo Breiman, Using Iterated Bagging to Debias Regressions, Machine Learning 2001 vol.45 261−277
[非特許文献6] Jerome H. Friedman, Stochastic gradient boosting, Computational Statistics and Data Analysis 2002 vol.38 367−378
D={(x1,y1),…,(xN,yN)}
ΔG=ΔGmatchΣFmatch+ΔGlipoΣFlipo+ΔGambigΣFambig+ΔGclashΣFclash+ΔGrotΣFrot+ΔG0
2 データ処理装置
3 記憶装置
4 出力装置
21 配座サンプリング手段
22 エネルギー計算手段
23 学習手段
24 予測スコア計算手段
31 訓練用構造データ記憶部
32 予測用構造データ記憶部
33 配座データ記憶部
34 訓練用エネルギーデータ記憶部
35 予測用エネルギーデータ記憶部
36 予測モデル記憶部
Claims (8)
- 標的蛋白質と結合する化合物の結合能及び結合配座を予測する化合物の仮想スクリーニング方法において、
エネルギー計算手段が、前記化合物の結合能を評価するスコアリング関数を構成するエネルギー項を用いて、コンピュータにより生成された前記化合物の配座に対するエネルギー値を計算し、
学習手段が、該計算で得られたエネルギー値と、前記標的蛋白質及び前記化合物の間における、実験的に決定された前記化合物の結合配座とコンピュータにより生成された前記化合物の計算配座との間のRMSD(Root Mean Squared Deviation:根平均二乗変位)とについて教師付き学習を行って予測モデルを求め、
予測スコア計算手段が、該予測モデルを前記化合物に適用することにより、前記化合物の結合能及び結合配座を予測する
ことを特徴とする化合物の仮想スクリーニング方法。 - 配座サンプリング手段は、前記標的蛋白質と化合物との、実験的に決定された実験結合構造と、前記化合物のコンピュータにより生成された計算構造とに基づいて、前記化合物の配座データを生成し、
前記エネルギー計算手段は、前記エネルギー項と前記生成された配座データとを用いて、前記化合物の配座に対するエネルギー値を計算する請求項1に記載の化合物の仮想スクリーニング方法。 - 前記学習手段は、前記RMSDに対する回帰モデルを予測モデルとして生成する請求項1または請求項2記載の化合物の仮想スクリーニング方法。
- 前記学習手段は、前記RMSDを閾値とする分類モデルを予測モデルとして生成する請求項1または請求項2記載の化合物の仮想スクリーニング方法。
- 標的蛋白質と結合する化合物の結合能及び結合配座を予測する化合物の仮想スクリーニング装置において、
前記化合物の結合能を評価するスコアリング関数を構成するエネルギー項を用いて、コンピュータにより生成された前記化合物の配座に対するエネルギー値を計算するエネルギー計算手段と、
該計算で得られたエネルギー値と、前記標的蛋白質及び前記化合物の間における、実験的に決定された前記化合物の結合配座とコンピュータにより生成された前記化合物の計算配座との間のRMSD(Root Mean Squared Deviation:根平均二乗変位)とについて教師付き学習を行うことにより予測モデルを生成する学習手段と、
前記生成された予測モデルを前記化合物に適用することにより、前記化合物の結合能及び結合配座を予測する予測スコア計算手段と
を備える化合物の仮想スクリーニング装置。 - 前記標的蛋白質と化合物との、実験的に決定された実験結合構造と、前記化合物のコンピュータにより生成された計算構造とに基づいて、前記化合物の配座データを生成する配座サンプリング手段をさらに備え、
前記エネルギー計算手段は、前記エネルギー項と前記生成された配座データとを用いて、前記化合物の配座に対するエネルギー値を計算する請求項5に記載の化合物の仮想スクリーニング装置。 - 前記学習手段は、前記RMSDに対する回帰モデルを予測モデルとして生成する請求項5または請求項6記載の化合物の仮想スクリーニング装置。
- 前記学習手段は、前記RMSDを閾値とする分類モデルを予測モデルとして生成する請求項5または請求項6記載の化合物の仮想スクリーニング装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007010581A JP5211486B2 (ja) | 2007-01-19 | 2007-01-19 | 化合物の仮想スクリーニング方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007010581A JP5211486B2 (ja) | 2007-01-19 | 2007-01-19 | 化合物の仮想スクリーニング方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008174503A JP2008174503A (ja) | 2008-07-31 |
JP5211486B2 true JP5211486B2 (ja) | 2013-06-12 |
Family
ID=39701793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007010581A Expired - Fee Related JP5211486B2 (ja) | 2007-01-19 | 2007-01-19 | 化合物の仮想スクリーニング方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5211486B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5243888B2 (ja) * | 2008-08-18 | 2013-07-24 | 日本放送協会 | データ分類装置及びデータ分類プログラム |
CA2976947C (en) * | 2015-02-18 | 2023-02-28 | Siemens Healthcare Diagnostics Inc. | Locality-based detection of tray slot types and tube types in a vision system |
CN111613275B (zh) * | 2020-05-26 | 2021-03-16 | 中国海洋大学 | 一种基于rmsd多特征的药物分子动力学结果分析方法 |
CN114708931B (zh) * | 2022-04-22 | 2023-01-24 | 中国海洋大学 | 结合机器学习和构象计算提高药-靶活性预测精度的方法 |
-
2007
- 2007-01-19 JP JP2007010581A patent/JP5211486B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008174503A (ja) | 2008-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sacha et al. | Molecule edit graph attention network: modeling chemical reactions as sequences of graph edits | |
Lee et al. | Ab initio protein structure prediction | |
Grechishnikova | Transformer neural network for protein-specific de novo drug generation as a machine translation problem | |
Zimmerman et al. | Choice of adaptive sampling strategy impacts state discovery, transition probabilities, and the apparent mechanism of conformational changes | |
Li et al. | istar: A web platform for large-scale protein-ligand docking | |
Nakajima et al. | Multicanonical ensemble generated by molecular dynamics simulation for enhanced conformational sampling of peptides | |
Shukla et al. | Molecular dynamics simulation in drug discovery: opportunities and challenges | |
Kirillova et al. | An NMA‐guided path planning approach for computing large‐amplitude conformational changes in proteins | |
Shamsi et al. | Enhanced unbiased sampling of protein dynamics using evolutionary coupling information | |
Oferkin et al. | Evaluation of Docking Target Functions by the Comprehensive Investigation of Protein‐Ligand Energy Minima | |
JP5211458B2 (ja) | 化合物の仮想スクリーニング方法および装置 | |
Zhang et al. | Identification of DNA–protein binding sites by bootstrap multiple convolutional neural networks on sequence information | |
JP7317815B2 (ja) | 代替コアを有する化合物の活性セットを予測する方法、およびそれを伴う創薬方法 | |
JP5211486B2 (ja) | 化合物の仮想スクリーニング方法及び装置 | |
Ismi et al. | Deep learning for protein secondary structure prediction: Pre and post-AlphaFold | |
CN114446383B (zh) | 一种基于量子计算的配体-蛋白相互作用的预测方法 | |
Zhao et al. | Discriminative learning for protein conformation sampling | |
Jaume-Santero et al. | Transformer performance for chemical reactions: Analysis of different predictive and evaluation scenarios | |
Tian et al. | LAST: Latent Space-Assisted Adaptive Sampling for Protein Trajectories | |
Kalayan et al. | Thermodynamic origin of differential excipient-lysozyme interactions | |
Martin et al. | High-Throughput Structure-Based Drug Design (HT-SBDD) Using Drug Docking, Fragment Molecular Orbital Calculations, and Molecular Dynamic Techniques | |
Childers et al. | Molecular dynamics methods for antibody design | |
Gao et al. | Co-supervised Pre-training of Pocket and Ligand | |
Ajagekar et al. | Molecular design with automated quantum computing-based deep learning and optimization | |
JP5262709B2 (ja) | 分子構造予測システム、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091214 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20110919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120816 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130211 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |