JP6934662B2 - 化合物設計装置と化合物設計方法及び化合物設計プログラム - Google Patents

化合物設計装置と化合物設計方法及び化合物設計プログラム Download PDF

Info

Publication number
JP6934662B2
JP6934662B2 JP2017162303A JP2017162303A JP6934662B2 JP 6934662 B2 JP6934662 B2 JP 6934662B2 JP 2017162303 A JP2017162303 A JP 2017162303A JP 2017162303 A JP2017162303 A JP 2017162303A JP 6934662 B2 JP6934662 B2 JP 6934662B2
Authority
JP
Japan
Prior art keywords
compound
partial structure
compound design
partial
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017162303A
Other languages
English (en)
Other versions
JP2019040422A (ja
Inventor
石原 司
司 石原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2017162303A priority Critical patent/JP6934662B2/ja
Publication of JP2019040422A publication Critical patent/JP2019040422A/ja
Application granted granted Critical
Publication of JP6934662B2 publication Critical patent/JP6934662B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、化合物を設計するための装置と方法及びプログラムに関するものである。
従来から医薬品を製造するための化合物を探索する医薬品探索においては、創薬化学者の属人的経験に多くを依存しているが、近年においては特許文献1に見られるように、化合物のデータから頻出パターンを抽出する技術も考案されている。
特開2005−63277号公報
しかし、特許文献1に開示された発明は、同文献の段落[0001]に記されているように、「所定の特性を有する複数のオブジェクトの多くに含まれる多頻度部分グラフを抽出する」ものに過ぎないため、上記所定の特性を有する複数のオブジェクトに適用範囲が限られているという問題がある。
本発明は、このような問題を解決するためになされたもので、より広い範囲で効率的な医薬品探索が可能な化合物設計装置と化合物設計方法及び化合物設計プログラムを提供することを目的とする。
上記課題を解決するため、本発明は、化合物データを用いて化合物を設計する装置であって、化合物の任意の部分構造を選定する部分構造選定手段と、化合物データにおいて、部分構造選定手段により選定された部分構造に対して共起する部分構造を検出する部分構造検出手段と、部分構造検出手段により検出された複数の部分構造を対象として、上記共起の度合いを定量化する共起性定量化手段とを備えた化合物設計装置を提供する。
また、上記課題を解決するため、本発明は、化合物データを用いて化合物を設計する方法であって、化合物の任意の部分構造を選定する第一のステップと、化合物データにおいて、第一のステップで選定された部分構造に対して共起する部分構造を検出する第二のステップと、第二のステップで検出された複数の部分構造を対象として、上記共起の度合いを定量化する第三のステップとを有する化合物設計方法を提供する。
また、上記課題を解決するため、本発明は、コンピュータに化合物データを用いて化合物を設計させるためのプログラムであって、上記プログラムは、上記コンピュータに対して、化合物の任意の部分構造を選定させる第一の手順と、化合物データにおいて、第一の手順で選定された部分構造に対して共起する部分構造を検出させる第二の手順と、第二の手順で検出された複数の部分構造を対象として、上記共起の度合いを定量化させる第三の手順とを有する化合物設計プログラムを提供する。
本発明によれば、より広い範囲で効率的な医薬品探索が可能な化合物設計装置と化合物設計方法及び化合物設計プログラムを提供することができる。
本発明の実施の形態に係る化合物設計装置1の構成を示すブロック図である。 本発明の実施の形態に係る化合物設計方法を示すフローチャートである。 図2に示されたステップS2における部分構造の検出方法を説明するための第一の図である。 図2に示されたステップS2における部分構造の検出方法を説明するための第二の図である。 本発明の他の実施の形態に係る化合物設計装置30の構成を示すブロック図である。
以下において、本発明の実施の形態を図面を参照しつつ詳しく説明する。なお、図中同一符号は同一又は相当部分を示す。
図1は、本発明の実施の形態に係る化合物設計装置1の構成を示すブロック図である。図1に示されるように、本発明の実施の形態に係る化合物設計装置1は、入出力端子2と、入出力端子2に接続されたバス3と、それぞれバス3に接続された部分構造選定部4、部分構造検出部5、共起性定量化部6、記憶部7、表示部8、及び操作部9を備える。ここで、部分構造検出部5は、それぞれバス3に接続されたマッチド・モレキュラー・ペア解析部51とマッチド・モレキュラー・シリーズ解析部52を含む。
図2は、本発明の実施の形態に係る化合物設計方法を示すフローチャートである。以下においては、図2を参照しつつ、本化合物設計方法を、図1に示された化合物設計装置1の動作により実現する場合につき説明するが、本化合物設計方法は化合物設計装置1を用いた場合に限られず広く適用できることは言うまでもない。
ステップS1では、部分構造選定部4は、ユーザによる操作部9の操作に応じて、化合物の任意の部分構造を選定する。なお、上記部分構造は具体的には、当該化合物を構成する原子を表す原子記号の文字列により表記されたものであり、以下においても同様である。
次に、ステップS2では、部分構造検出部5は、ユーザによる操作部9の操作に応じて、化合物データにおいて、ステップS1で選定された部分構造に対して共起する部分構造を検出する。なお、共起とは、ある部分構造が化合物中に見出されたとき、当該化合物と基本構造を共通とする他の化合物に別の限られた部分構造が出現する状態を意味する。
ここで、上記化合物データは、入出力端子2に外部接続された化合物データベース、又は記憶部7に格納された化合物データのいずれであっても良い。
なお、本部分構造の検出は、化合物の集合データを対象として、同一基本構造に対して一部の部分構造のみが異なる化合物対を検索する技術であるマッチド・モレキュラー・ペア(Matched Molecular Pair)解析と、それに続くマッチド・モレキュラー・シリーズへの変換によって検出するが、本検出方法については後に詳しく説明する。
次に、ステップS3では、共起性定量化部6は、ユーザによる操作部9の操作に応じて、ステップS2で検出された複数の部分構造を対象として、共起の度合いを定量化する。
上記定量化においては、例えば、頻出する要素間の組み合わせに関する規則を検索する技術である連関規則解析が用いられる。
このとき、大規模データベースに対する連関規則解析では、一般に、膨大な規則が抽出されるため、本実施の形態では例えば、上記連関規則解析により標準的に導出される支持度若しくは確信度を評価指標とし、入力した部分構造と関連性があるとして検出された部分構造が関連性の強い順に順位付けされる。
ここで、検索対象の化合物及び検索対象の部分構造が以下の表1のように選定されたとき、検索対象の部分構造と関連性の強い上位5位までについて、確信度、共起する部分構造、及び設計された化合物をランキングした例が、以下の表2に示される。なお、上記関連性が強いほど、表2における確信度の値が高くなるという関係がある。
Figure 0006934662
Figure 0006934662
このようにして、検索対象の部分構造と強い関連性があるものとして抽出された部分構造を用いて、検索対象の化合物における当該部分構造を代替させることにより、医薬品製造のための新たな化合物を設計することができる。
なお、上記連関規則解析では、例えばアプリオリ(Apriori)アルゴリズムやエクラット(Eclat)アルゴリズムを用いることができるが、これらに限定されるものではない。
また、ステップS3における定量化により得られたデータは記憶部7に保存されるが、ユーザによる操作部9の操作に応じて、表示部8に表示され、又はバス3及び入出力端子2を介して外部へ出力される。
以下において、図3及び図4を参照しつつ、上記ステップS2における部分構造の検出方法を詳しく説明する。
まず、マッチド・モレキュラー・ペア解析部51は、共通の基本構造を有する化合物の組を抽出する機能を有する。なお、抽出された化合物の組は記憶部7、又は、入出力端子2に外部接続されたデータベース等に保存される。以下、具体例を挙げて本機能について説明する。
図3に示された3つの化合物11〜13が化合物データの構成要素であるとき、これらの化合物11〜13は、最左端の置換された環構造が相互に異なる化合物群をなす。従って、これら3つの化合物11〜13においては、共通する基本構造10を有する3組の部分構造対14が挙げられる。
このことから、3つの化合物11〜13からは、基本構造を共通とした化合物の組、すなわちマッチド・モレキュラー・ペアが3組抽出される。
次に、マッチド・モレキュラー・シリーズ解析部52は、上記のようにマッチド・モレキュラー・ペア解析部51により抽出された化合物の組を基に、共起する部分構造の一覧を生成する。すなわち、マッチド・モレキュラー・シリーズ解析部52は、対になる二つの部分構造の要素から構成されるマッチド・モレキュラー・ペアの概念を、二つ以上の部分構造の要素から構成されるマッチド・モレキュラー・シリーズへと拡張する機能を有するが、以下、具体例を挙げて本機能について説明する。
なお、生成された部分構造の一覧は記憶部7、又は、入出力端子2に外部接続されたデータベース等に保存される。
ここで、上記マッチド・モレキュラー・シリーズとは、基本構造が共通な化合物の群と定義され、上記3つの化合物11〜13においては、共起する部分構造の一覧として一つの部分構造シリーズ15が生成されるため、化合物11〜13は一つのマッチド・モレキュラー・シリーズをなすことになる。
従って、マッチド・モレキュラー・シリーズ解析部52による上記拡張機能は、図3に示された3組の部分構造対14(マッチド・モレキュラー・ペア)から一つの部分構造シリーズ15(マッチド・モレキュラー・シリーズ)への変換を意味する。以下において、化合物データの構成要素として、図4に示されるように、化合物11〜13だけでなく化合物21〜23も含まれる場合を例に挙げて、上記変換を具体的に説明する。
図4に示されるように、化合物11〜13から上記のように3組の部分構造対14(若しくはマッチド・モレキュラー・ペア)が得られるが、同様に化合物21〜23から3組の部分構造対24(若しくはマッチド・モレキュラー・ペア)が得られる。ここで、化合物11〜13は同一の基本構造10を有し、化合物21〜23は同一の基本構造20を有する。
そこで、得られたマッチド・モレキュラー・ペアをそれらの基本構造で集約、すなわち同一基本構造をキーとして各マッチド・モレキュラー・ペアをグルーピングすることにより、それぞれ基本構造10に対しては部分構造シリーズ15、基本構造20に対しては部分構造シリーズ25に対応したマッチド・モレキュラー・シリーズを得ることができる。
そして、図2に示されたステップS3において、共起性定量化部6は上記のようにして得られたマッチド・モレキュラー・シリーズを対象として、以下のように、高い頻度で共に出現する部分構造を検出する。
図4に示された部分構造11pは、同一の基本構造10を介して部分構造12pと共起しており、同様に、部分構造13pと共起していることが分かる。一方で、図4に示された部分構造21pは、同一の基本構造20を介して部分構造22pと共起しており、同様に、部分構造23pと共起している。
従って、同一の部分構造11p,21pは、同一の部分構造12p,22pと二度、部分構造13p及び部分構造23pとそれぞれ一度共起していることが分かる。
結果として、部分構造11pに対して相対的に高い頻度で共に出現する部分構造として、部分構造12p,22pを検出することになる。
なお、本発明の実施の形態に係る上記の化合物設計方法は、本方法を実現するアルゴリズムをコンピュータプログラムにより記述した化合物設計プログラムを、例えば、図5に示された入出力端子31及びバス32を介して化合物設計装置30のメモリ34へ格納し、バス32に接続された中央演算処理装置(Central Processing Unit: CPU)33に上記化合物設計プログラムをメモリ34から読み出して実行させることによっても実現することができる。
以上より、本発明の実施の形態に係る化合物設計装置1,30と化合物設計方法及び化合物設計プログラムによれば、マッチド・モレキュラー・ペア解析と連関規則解析を融合することにより、化合物データを対象として検出された共起対の頻度分布を基に一般的構造変換の指針を獲得することができる。
また、上記化合物設計装置1,30と化合物設計方法及び化合物設計プログラムによれば、ユーザが指定する部分構造に対して、探索の過程で高頻度に共起した部分構造を抽出することができるため、広範囲における効率的な医薬品探索を実現することができる。
そして、抽出された上記高頻度に共起した部分構造で、最初に選定された化合物の対応する部分構造を代替させることにより、医薬品製造のための新たな化合物を設計することができる。
また、上記化合物設計装置1,30と化合物設計方法及び化合物設計プログラムによれば、これまで創薬化学者の力量に依存してきた化合物設計の自動化を実現することができることになる。
1,30 化合物設計装置、4 部分構造選定部、5 部分構造検出部、6 共起性定量化部、33 中央演算処理装置(CPU)。

Claims (9)

  1. 化合物データを用いて化合物を設計する装置であって、
    化合物の任意の部分構造を選定する部分構造選定手段と、
    前記化合物データにおいて、前記部分構造選定手段により選定された前記部分構造に対 して共起する部分構造を検出する部分構造検出手段と、
    前記部分構造検出手段により検出された複数の前記部分構造を対象として、連関規則解析により得られる支持度若しくは確信度を算出することにより、前記共起の度合いを定量化する共起性定量化手段とを備えた化合物設計装置。
  2. 前記部分構造検出手段は、
    共通の基本構造を有する化合物の組を抽出するマッチド・モレキュラー・ペア解析手段と、
    前記マッチド・モレキュラー・ペア解析手段により抽出された前記共起する部分構造の一覧を生成するマッチド・モレキュラー・シリーズ解析手段を含む、請求項1に記載の化合物設計装置。
  3. 前記部分構造は、原子記号の文字列として表記されたものである、請求項1に記載の化合物設計装置。
  4. 化合物設計装置が、化合物データを用いて化合物を設計する方法であって、
    前記化合物設計装置に含まれた部分構造選定手段が、前記化合物の任意の部分構造を選定する第一のステップと、
    前記化合物設計装置に含まれた部分構造検出手段が、前記化合物データにおいて、前記第一のステップで選定された前記部分構造に対して共起する部分構造を検出する第二のステップと、
    前記化合物設計装置に含まれた共起性定量化手段が、前記第二のステップで検出された複数の前記部分構造を対象として、連関規則解析により得られる支持度若しくは確信度を算出することにより、前記共起の度合いを定量化する第三のステップとを有する化合物設計方法。
  5. 前記第二のステップは、共通の基本構造を有する化合物の組を抽出するマッチド・モレキュラー・ペア解析ステップと、
    前記マッチド・モレキュラー・ペア解析ステップで抽出された前記共起する部分構造の一覧を生成するマッチド・モレキュラー・シリーズ解析ステップを含む、請求項に記載の化合物設計方法。
  6. 前記部分構造は、原子記号の文字列として表記されたものである、請求項に記載の化合物設計方法。
  7. コンピュータに化合物データを用いて化合物を設計させるためのプログラムであって、前記プログラムは、前記コンピュータに対して、
    化合物の任意の部分構造を選定させる第一の手順と、
    前記化合物データにおいて、前記第一の手順で選定された前記部分構造に対して共起する部分構造を検出させる第二の手順と、
    前記第二の手順で検出された複数の前記部分構造を対象として、連関規則解析により得られる支持度若しくは確信度を算出することにより、前記共起の度合いを定量化させる第三の手順とを有する化合物設計プログラム。
  8. 前記第二の手順は、
    共通の基本構造を有する化合物の組を抽出するマッチド・モレキュラー・ペア解析手順と、
    前記マッチド・モレキュラー・ペア解析手順で抽出された前記共起する部分構造の一覧を生成するマッチド・モレキュラー・シリーズ解析手順を含む、請求項に記載の化合物設計プログラム。
  9. 前記部分構造は、原子記号の文字列として表記されたものである、請求項に記載の化合物設計プログラム。
JP2017162303A 2017-08-25 2017-08-25 化合物設計装置と化合物設計方法及び化合物設計プログラム Active JP6934662B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017162303A JP6934662B2 (ja) 2017-08-25 2017-08-25 化合物設計装置と化合物設計方法及び化合物設計プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017162303A JP6934662B2 (ja) 2017-08-25 2017-08-25 化合物設計装置と化合物設計方法及び化合物設計プログラム

Publications (2)

Publication Number Publication Date
JP2019040422A JP2019040422A (ja) 2019-03-14
JP6934662B2 true JP6934662B2 (ja) 2021-09-15

Family

ID=65725733

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017162303A Active JP6934662B2 (ja) 2017-08-25 2017-08-25 化合物設計装置と化合物設計方法及び化合物設計プログラム

Country Status (1)

Country Link
JP (1) JP6934662B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4261830A1 (en) * 2020-12-09 2023-10-18 Oita University Institute of Advanced Medicine, Inc. Novel peptidomimetic compound and design
CA3203719A1 (en) 2021-01-07 2022-07-14 Hirokazu YARIMIZU Information processing apparatus, information processing method, and information processing program

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007277188A (ja) * 2006-04-10 2007-10-25 Hitachi Ltd 化合物検索支援システム

Also Published As

Publication number Publication date
JP2019040422A (ja) 2019-03-14

Similar Documents

Publication Publication Date Title
JP5316158B2 (ja) 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
US10437845B2 (en) System and method for displaying search results for a trademark query in an interactive graphical representation
JP2005352888A (ja) 表記揺れ対応辞書作成システム
Daub et al. Rfam: annotating families of non-coding RNA sequences
JP2006215936A (ja) 検索システム及び検索方法
JP6934662B2 (ja) 化合物設計装置と化合物設計方法及び化合物設計プログラム
CN111488434B (zh) 输入联想词的推荐方法、装置、存储介质及电子设备
US20180107740A1 (en) Combining catalog search results from multiple package repositories
JP6533876B2 (ja) 商品情報表示システム、商品情報表示方法、及びプログラム
JP5346991B2 (ja) コンテンツ出力方法、コンテンツ出力装置およびコンテンツ出力プログラム
JP2010272006A (ja) 関係抽出装置、関係抽出方法、及びプログラム
JP2008070921A (ja) 文書検索装置及び文書検索プログラム
JP5589009B2 (ja) 推薦クエリ抽出装置及び方法及びプログラム
JP2018072873A (ja) 情報処理装置、情報処理方法、およびプログラム
JP6534454B2 (ja) 情報検索方法及び情報検索装置並びに情報検索システム
JP2009230483A (ja) 情報検索方法、プログラム及び装置
JP2010244341A (ja) 属性表現獲得方法及び装置及びプログラム
JP2011022624A (ja) ウェブページ検索システム、ウェブページ検索方法、ウェブページ検索サーバ及びウェブページ検索プログラム
JP2009271671A (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
TWI746527B (zh) 資料推薦的處理互動方法、裝置及系統
JP2008135057A (ja) 検索処理方法及びプログラム
JP5652519B2 (ja) 情報検索方法、プログラム及び装置
JP5870815B2 (ja) 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム
JP6237334B2 (ja) クエリ生成方法、クエリ生成プログラム、及び、クエリ生成装置
CN115600556B (zh) 一种文档的目录信息推荐方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200604

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210518

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210603

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210630

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210812

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210817

R150 Certificate of patent or registration of utility model

Ref document number: 6934662

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150