JP7191969B2 - 化合物の合成適性の評価方法、化合物の合成適性の評価プログラム及び化合物の合成適性の評価装置 - Google Patents
化合物の合成適性の評価方法、化合物の合成適性の評価プログラム及び化合物の合成適性の評価装置 Download PDFInfo
- Publication number
- JP7191969B2 JP7191969B2 JP2020546217A JP2020546217A JP7191969B2 JP 7191969 B2 JP7191969 B2 JP 7191969B2 JP 2020546217 A JP2020546217 A JP 2020546217A JP 2020546217 A JP2020546217 A JP 2020546217A JP 7191969 B2 JP7191969 B2 JP 7191969B2
- Authority
- JP
- Japan
- Prior art keywords
- compound
- synthesis
- atomic
- atomic arrangement
- evaluating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
- G16C20/64—Screening of libraries
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Library & Information Science (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
非特許文献2 : “Estimation of synthetic Accessibilityscoreof drug-like molecules based on molecular complexity and fragment contributions”、Peter Ertl and AnsgarSchuffenhauer, Journal of Cheminformatics2009, 1;8 [2018年7月23日検索]、インターネット(https://jcheminf.springeropen.com/articles/10.1186/1758-2946-1-8)
図1は、化合物の合成適性の評価装置(以下、単に「合成適性評価装置」ともいう)10の構成を示すブロック図である。合成適性評価装置10は、化合物の合成適性を評価する装置であり、コンピュータを用いて実現することができる。図1に示すように、合成適性評価装置10は、処理部100、記憶部200、表示部300、及び操作部400を備え、互いに接続されて必要な情報が送受信される。これらの構成要素については、各種の設置形態を採用することができ、各構成要素が1箇所(1筐体内、1室内等)に設置されていてもよいし、離れた場所に設置されネットワークを介して接続されていてもよい。また、合成適性評価装置10はインターネット等のネットワークNWを介して外部サーバ500、及び外部データベース510に接続し、必要に応じて、合成適性を評価する化合物の構造式及び/又は化合物データベースに収納された複数の基準化合物の構造式等の情報を取得することができる。
図2は処理部100の構成を示す図である。処理部100は、データベース選択部105、構造取得部110、第1の抽出部115、第2の抽出部120、計算部125、評価部130、出力部135、表示制御部140、CPU145(CPU:Central Processing Unit)、ROM150(ROM:Read Only Memory)、及びRAM155(RAM:Random Access Memory)を備える。
記憶部200はDVD(Digital Versatile Disk)、ハードディスク(Hard Disk)、各種半導体メモリ等の非一時的記録媒体及びその制御部により構成され、図3に示す画像及び情報が記憶される。構造情報205は合成適性の評価対象である化合物の構造を含む。基準化合物情報210は、化合物データベース中に収納された複数の基準化合物の構造式を含む。原子配列情報215は、合成適性の評価対象である化合物から抽出した原子配列を含む。出現頻度情報220は、合成適性の評価対象である化合物から、抽出した原子配列の化合物中の出現頻度を含む。基準原子配列情報225は、化合物データベース中に含まれる複数の基準化合物から抽出した基準原子配列を含む。基準出現頻度情報230は、化合物データベース中に含まれる複数の基準化合物の、抽出した原子配列の基準出現頻度を含む。関数情報235は、部分スコアを計算する関数、及び、合計スコアを計算する関数を含む。
表示部300はモニタ310(表示装置)を備えており、入力した画像及び情報、記憶部200に記憶された画像及び情報、処理部100による処理の結果等を表示することができる。操作部400は入力デバイス及び/又はポインティングデバイスとしてのキーボード410及びマウス420を含んでおり、ユーザーはこれらのデバイス及びモニタ310の画面を介して、本実施形態に係る化合物の合成適性の評価方法の実行に必要な操作を行うことができる。ユーザーが実行できる操作には、合成適性を評価する化合物の構造の入力、化合物データベースの選択、抽出する原子配列の指定等が含まれる。
上述した化合物の合成適性の評価装置10では、操作部400を介したユーザーの指示に応じて化合物の合成適性の評価を行うことができる。
図4は、化合物の合成適性の評価方法を示すフローチャートである。合成適性の評価方法は、合成適性の評価基準となる複数の基準化合物が収納された化合物データベースを選択する工程(ステップS10)と、合成適性を評価する化合物の構造を決定する工程(ステップS12)と、化合物データベースに収納されている基準化合物から基準原子配列を抽出し、基準原子配列の基準出現頻度を求める工程(ステップS14)と、化合物の構造から原子配列を抽出し、原子配列の出現頻度を求める工程(ステップS16)と、化合物の原子配列が、化合物データベース中の基準化合物中に出現する頻度を、部分スコアとして計算する工程(ステップS18)と、部分スコアを合計した合計スコアから、合成適性を評価する工程(ステップS20)と、を有する。
化合物データベースを選択する工程は、複数ある化合物データベースの中から、合成適性の評価基準となる化合物データベースを選択する工程である。選択する化合物データベースとしては、基本的には、構造多様性の高い化合物データベースが望ましい。構造多様性の高い化合物データベースを選択することで、様々な化合物を基準にして、合成適性を評価することができる。また、評価する化合物に特別な目的がある場合、目的に合わせた構造に偏りを有する化合物を有する化合物データベースを用いてもよい。例えば、化合物が色素らしい化合物であるか判断したい場合には、公知の色素化合物を多く含む化合物データベースを選択することもできる。また、化合物が医薬品化合物であるか判断したい場合は、公知の医薬品化合物を多く含む化合物データベースを選択することもできる。このように、特別な目的に合わせた構造の偏りを有する化合物データベースを用いることで、この化合物データベース中の色素化合物又は医薬品化合物に、高い出現頻度で出現する原子配列か否かを評価することができる。出現頻度が高い場合は、評価する化合物は、選択した化合物データベース中の基準化合物の構造、又は、原子配列に近い構造を有すると考えられ、目的の化合物と同じ特性を有すると考えられる。
化合物の構造を決定する工程は、合成適性の評価対象である化合物の構造を決定する工程である。化合物は、操作部400を介したユーザーの操作に応じて、化合物の構造を入力し、化合物の構造を決定してもよい。また、コンピュータ上で、所望の物性が得られるように構造を改変した化合物の構造を用い、この改変後の化合物を、合成適性の評価対象である化合物と決定することもできる。化合物の構造は、ネットワークNWを介して外部サーバ500及び外部データベース510から取得し、決定してもよい。なお、本実施形態においては、合成適性の評価対象である化合物として、図5に示す化合物の構造を与える。
基準原子配列を抽出し基準出現頻度を求める工程は、ステップS10で選択した化合物データベース中の基準化合物から、基準原子配列を抽出し、この基準原子配列の基準化合物中の出現頻度である基準出現頻度を求める工程である。
原子配列を抽出し出現頻度を求める工程は、ステップS12で入力した化合物の構造から原子配列を抽出し、出現頻度を求める工程である。
部分スコアを計算する工程は、合成適性の評価対象である化合物の原子配列が、化合物データベース中の基準化合物中に出現する頻度を部分スコアとして計算する工程である。
合成適性を評価する工程は、部分スコアを合計した合計スコアから合成適性を評価する工程である。
以上説明したように、化合物の合成適性の評価装置10では、本実施形態に係る化合物の合成適性の評価方法及び化合物の合成適性の評価プログラムを用いて、化合物の合成適性、特に、計算機上で生成又は改変した化合物の合成適性の評価を適切に行うことができる。
100 処理部
105 データベース選択部
110 構造取得部
115 第1の抽出部
120 第2の抽出部
125 計算部
130 評価部
135 出力部
140 表示制御部
145 CPU
150 ROM
155 RAM
200 記憶部
205 構造情報
210 基準化合物情報
215 原子配列情報
220 出現頻度情報
225 基準原子配列情報
230 基準出現頻度情報
235 関数情報
300 表示部
310 モニタ
400 操作部
410 キーボード
420 マウス
500 外部サーバ
510 外部データベース
NW ネットワーク
Claims (12)
- 合成適性の評価基準となる複数の基準化合物が収納された化合物データベースを選択する工程と、
合成適性の評価対象である化合物の構造を決定する工程と、
前記化合物データベースに収納されている前記基準化合物の構造から基準原子配列を抽出し、前記基準原子配列の基準出現頻度を求める工程と、
前記化合物の構造から原子配列を抽出し、前記原子配列の出現頻度を求める工程と、
前記化合物の前記原子配列に含まれる結合本数、及び、前記原子配列に対応する前記基準原子配列の前記出現頻度に基づいて合成適性を評価する工程と、を有する化合物の合成適性の評価方法。 - 前記合成適性を評価する工程は、前記原子配列毎に部分的な部分評価を行い、前記部分評価を合計した合計評価により行う請求項1に記載の化合物の合成適性の評価方法。
- 前記合成適性を評価する工程は、前記原子配列毎に部分スコアを算出して数値化し、前記部分スコアを合計し合計スコアにより評価を行う請求項1又は2に記載の化合物の合成適性の評価方法。
- 前記部分スコアの計算は、前記原子配列の前記化合物データベース中での出現頻度が0の場合に特異点を有さない関数を用いる請求項3に記載の化合物の合成適性の評価方法。
- 前記合計スコアから、前記化合物と、前記化合物データベースに収納される前記基準化合物の特徴との類似性を評価する工程を有する請求項3又は4に記載の化合物の合成適性の評価方法。
- 前記合成適性を評価する工程は、単調減少又は単調増加の関数を用いて評価を行う請求項1から5のいずれか1項に記載の化合物の合成適性の評価方法。
- 抽出される前記基準原子配列及び前記原子配列は、直鎖状、分岐状、環状又はこれらの組み合わせの原子配列である請求項1から6のいずれか1項に記載の化合物の合成適性の評価方法。
- 前記基準原子配列及び前記原子配列は、原子の電子状態が異なる場合、異なる原子配列として抽出される請求項1から7のいずれか1項に記載の化合物の合成適性の評価方法。
- 前記化合物の構造から前記原子配列を抽出する際に、結合の端部が水素である原子配列を抽出しない請求項1から8のいずれか1項に記載の化合物の合成適性の評価方法。
- 請求項1から9のいずれか1項に記載の化合物の合成適性の評価方法をコンピュータに実行させる化合物の合成適性の評価プログラム。
- 非一時的かつコンピュータ読取可能な記録媒体であって、前記記録媒体に格納された指令がコンピュータによって読み取られた場合に請求項10に記載のプログラムをコンピュータに実行させる記録媒体。
- 合成適性の評価基準となる複数の基準化合物が収納された化合物データベースを選択するデータベース選択部と、
合成適性の評価対象である化合物の構造を取得する構造取得部と、
前記化合物データベースに収納されている前記基準化合物の構造から基準原子配列を抽出し、前記基準原子配列の基準出現頻度を求める第1の抽出部と、
前記化合物の構造から原子配列を抽出し、前記原子配列の出現頻度を求める第2の抽出部と、
前記化合物の前記原子配列に含まれる結合本数、及び、前記原子配列に対応する前記基準原子配列の前記出現頻度に基づいて、前記原子配列に含まれる結合本数及び前記出現頻度が大きくなるほど数値が小さくなる関数を用いて、前記原子配列が前記基準化合物中に出現する頻度を、部分スコアとして計算を行い、前記部分スコアを合計し、合計スコアを計算する計算部と、
前記合計スコアに基づいて、合成適性を評価する評価部と、を有する化合物の合成適性の評価装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018172576 | 2018-09-14 | ||
JP2018172576 | 2018-09-14 | ||
PCT/JP2019/036072 WO2020054839A1 (ja) | 2018-09-14 | 2019-09-13 | 化合物の合成適性の評価方法、化合物の合成適性の評価プログラム及び化合物の合成適性の評価装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020054839A1 JPWO2020054839A1 (ja) | 2021-08-30 |
JP7191969B2 true JP7191969B2 (ja) | 2022-12-19 |
Family
ID=69777218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020546217A Active JP7191969B2 (ja) | 2018-09-14 | 2019-09-13 | 化合物の合成適性の評価方法、化合物の合成適性の評価プログラム及び化合物の合成適性の評価装置 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP3852113A4 (ja) |
JP (1) | JP7191969B2 (ja) |
CN (1) | CN112689877A (ja) |
IL (1) | IL281379A (ja) |
WO (1) | WO2020054839A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7398334B2 (ja) * | 2020-04-30 | 2023-12-14 | 株式会社日立製作所 | ユーザに提案する材料を決定するシステム |
CN113416215A (zh) * | 2021-07-12 | 2021-09-21 | 成都大学 | 一种新型化合物d-dicy及其合成方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017091526A (ja) | 2015-11-04 | 2017-05-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 新規物質探索方法および装置 |
-
2019
- 2019-09-13 CN CN201980059938.1A patent/CN112689877A/zh active Pending
- 2019-09-13 EP EP19859449.1A patent/EP3852113A4/en active Pending
- 2019-09-13 WO PCT/JP2019/036072 patent/WO2020054839A1/ja unknown
- 2019-09-13 JP JP2020546217A patent/JP7191969B2/ja active Active
-
2021
- 2021-03-10 IL IL281379A patent/IL281379A/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017091526A (ja) | 2015-11-04 | 2017-05-25 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 新規物質探索方法および装置 |
Non-Patent Citations (1)
Title |
---|
谷村 隆次,成熟期を迎えた de novo 医薬設計,日本化学会情報化学部会誌 第28巻(2010)第3号,日本,[オンライン],[検索日 2019.11.25],2010年,第57-61頁(特に第60頁),インターネット<URL:https://www.jstage.jst.go.jp/article/cicsj/28/3/28_3_57/_pdf/-char/ja>,<DOI:https://doi.org/10.11546/cicsj.28.57> |
Also Published As
Publication number | Publication date |
---|---|
IL281379A (en) | 2021-04-29 |
EP3852113A1 (en) | 2021-07-21 |
WO2020054839A1 (ja) | 2020-03-19 |
EP3852113A4 (en) | 2021-10-27 |
CN112689877A (zh) | 2021-04-20 |
US20210193272A1 (en) | 2021-06-24 |
JPWO2020054839A1 (ja) | 2021-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | POSREG: proteomic signature discovered by simultaneously optimizing its reproducibility and generalizability | |
Baumann et al. | Reliable estimation of prediction errors for QSAR models under model uncertainty using double cross-validation | |
Cao et al. | Protein single-model quality assessment by feature-based probability density functions | |
Smith et al. | METLIN: a metabolite mass spectral database | |
Poli et al. | Reliability analysis and optimization of the consensus docking approach for the development of virtual screening studies | |
Luo et al. | An alternative approach to confidence interval estimation for the win ratio statistic | |
JP7191969B2 (ja) | 化合物の合成適性の評価方法、化合物の合成適性の評価プログラム及び化合物の合成適性の評価装置 | |
Kim et al. | Comparative analysis of mass spectral similarity measures on peak alignment for comprehensive two‐dimensional gas chromatography mass spectrometry | |
Léonard et al. | mulPBA: an efficient multiple protein structure alignment method based on a structural alphabet | |
Liang | Prior sensitivity in Bayesian structural equation modeling for sparse factor loading structures | |
WO2016147290A1 (ja) | 情報分析プログラム、情報分析方法および情報分析装置 | |
Wang et al. | MUFOLD‐WQA: A new selective consensus method for quality assessment in protein structure prediction | |
JP6586850B2 (ja) | テーブル再構成装置と方法 | |
Fang et al. | MUFold-SSW: a new web server for predicting protein secondary structures, torsion angles and turns | |
Sarica et al. | Introducing the rank-biased overlap as similarity measure for feature importance in explainable machine learning: a case study on Parkinson’s disease | |
Yang et al. | Toward an objective and reproducible model choice via variable selection deviation | |
WO2016147289A1 (ja) | 情報分析プログラム、情報分析方法および情報分析装置 | |
JP7036378B2 (ja) | 病理診断文入力支援プログラム、病理診断文入力支援方法および病理診断文入力支援システム | |
Yu et al. | Regression calibration in semiparametric accelerated failure time models | |
US12040056B2 (en) | Method for evaluating synthetic aptitude of compound, program for evaluating synthetic aptitude of compound, and device for evaluating synthetic aptitude of compound | |
Dramiński et al. | The Monte Carlo feature selection and interdependency discovery is unbiased | |
CN114780368A (zh) | 表数据同步工具评测方法与表述数据同步方法 | |
JP7190498B2 (ja) | 化合物構造の生成方法、化合物構造の生成プログラム、及び化合物構造の生成装置 | |
JP2011085991A (ja) | 文書検索方法、文書検索装置、文書検索プログラム | |
JP2017004493A (ja) | データ分析方法、データ分析装置およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210427 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210427 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220610 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221118 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7191969 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |