JP7176381B2 - 環状分子の構造探索方法、及び構造探索装置、並びにプログラム - Google Patents

環状分子の構造探索方法、及び構造探索装置、並びにプログラム Download PDF

Info

Publication number
JP7176381B2
JP7176381B2 JP2018226351A JP2018226351A JP7176381B2 JP 7176381 B2 JP7176381 B2 JP 7176381B2 JP 2018226351 A JP2018226351 A JP 2018226351A JP 2018226351 A JP2018226351 A JP 2018226351A JP 7176381 B2 JP7176381 B2 JP 7176381B2
Authority
JP
Japan
Prior art keywords
cyclic molecule
group
compound
searching
cyclic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018226351A
Other languages
English (en)
Other versions
JP2020091518A (ja
Inventor
博之 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018226351A priority Critical patent/JP7176381B2/ja
Priority to US16/598,679 priority patent/US20200176074A1/en
Priority to EP19205295.9A priority patent/EP3667673A1/en
Priority to CN201911163080.1A priority patent/CN111261235A/zh
Publication of JP2020091518A publication Critical patent/JP2020091518A/ja
Application granted granted Critical
Publication of JP7176381B2 publication Critical patent/JP7176381B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Peptides Or Proteins (AREA)

Description

本件は、三次元格子空間を用いて環状分子の安定構造を探索する構造探索方法、及び構造探索装置、並びに前記構造探索方法を実行するプログラムに関する。
サイズの大きな分子の安定構造が必要とされる場面は多い。そのような場面としては、例えば、創薬などが挙げられる。しかし、例えば、タンパク質などのサイズの大きな分子は、全ての原子を露わに考慮する計算では、現実的な時間内に安定構造を探索することが困難になる。
そこで、分子の構造を粗く捉える(粗視化する)ことで、計算時間を短縮する技術が研究されている。例えば、タンパク質については、アミノ酸残基の1次元配列情報のみから粗視化構造を探索する、格子タンパク質(Lattice Protein)という技術が研究されている。その一例として、直鎖のタンパク質の単純立方格子構造については、量子アニーリングの技術を用いて、安定構造を高速に探索する技術が報告されている(例えば、非特許文献1参照)。現在の技術では、Lattice Proteinの構造を量子アニーリングなどのアニーリングマシンで高速に探索するための技術は、直鎖構造に限定されている。しかし、創薬分野において標的となるタンパク質に結合する医薬候補化合物を考えると、環状の方が強く結合しやすい。そのため、創薬への応用を考えた場合、環状分子の安定構造探索を可能にすることが必要である。
R. Babbush et.al., Construction of Energy Functions for Lattice Heteropolymer Models: A Case Study in Constraint Satisfaction Programmisng and Adiabatic Quantum Optimization, Advances in Chemical Physics, 155, 201-244
本件は、環状分子の安定構造を探索することができる環状分子の構造探索方法、及び環状分子の構造探索装置、並びに、前記構造探索方法を実行するプログラムを提供することを目的とする。
前記課題を解決するための手段としては、以下の通りである。即ち、
開示の環状分子の構造探索方法は、コンピュータを用いて、n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索方法であって、
格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する工程を含み、
前記環状分子の化合物基の数(n)が奇数の場合、前記作成する工程が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入する処理と、前記結合基を格子点に配置する処理と、前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする処理とを、含む。
開示の環状分子の構造探索装置は、n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索装置であって、
格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する作成部を備え、
前記環状分子の化合物基の数(n)が奇数の場合、前記作成部が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入し、前記結合基を格子点に配置し、かつ前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする。
開示のプログラムは、n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索プログラムであって、
コンピュータに、格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する工程を実行させ、
前記環状分子の化合物基の数(n)が奇数の場合、前記作成する工程が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入する処理と、前記結合基を格子点に配置する処理と、前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする処理とを、含む。
開示の環状分子の構造探索方法によると、従来における前記諸問題を解決し、前記目的を達成することができ、環状分子の安定構造を探索することができる環状分子の構造探索方法を提供できる。
開示の環状分子の構造探索装置によると、従来における前記諸問題を解決し、前記目的を達成することができ、環状分子の安定構造を探索することができる環状分子の構造探索装置を提供できる。
開示のプログラムによると、従来における前記諸問題を解決し、前記目的を達成することができ、環状分子の安定構造を探索することができるプログラムを提供できる。
図1Aは、タンパク質の安定構造を探索するための模式図である(その1)。 図1Bは、タンパク質の安定構造を探索するための模式図である(その2)。 図1Cは、タンパク質の安定構造を探索するための模式図である(その3)。 図2Aは、Diamond encording法を説明するための模式図である(その1)。 図2Bは、Diamond encording法を説明するための模式図である(その2)。 図2Cは、Diamond encording法を説明するための模式図である(その3)。 図2Dは、Diamond encording法を説明するための模式図である(その4)。 図2Eは、Diamond encording法を説明するための模式図である(その5)。 図3Aは、アミノ酸残基の数が8個の環状のタンパク質の場合の配置の一例を表す模式図である。 図3Bは、アミノ酸残基の数が7個の環状のタンパク質の場合の配置の一例を表す模式図である。 図3Cは、アミノ酸残基の数が7個の環状のタンパク質の場合の配置の他の一例を表す模式図である。 図4は、アミノ酸残基の数が7個の環状のタンパク質の場合に結合基Sと追加した一例を表す模式図である。 図5は、アミノ酸残基の数が7個の環状のタンパク質の場合に結合基Sと追加した一例を表す模式図である。 図6は、タンパク質の安定構造を探索する方法を示すフローチャートである。 図7は、半径rにある各格子をSとした場合を表す図である。 図8Aは、アミノ酸残基の移動先の格子点の集合を表す図である(その1)。 図8Bは、アミノ酸残基の移動先の格子点の集合を表す図である(その2)。 図8Cは、アミノ酸残基の移動先の格子点の集合を表す図である(その3)。 図8Dは、アミノ酸残基の移動先の格子点の集合を表す図である(その4)。 図9は、S、S、Sを三次元で表した図である。 図10Aは、各ビットX~Xに空間の情報を割り振る様子の一例である(その1)。 図10Bは、各ビットX~Xに空間の情報を割り振る様子の一例である(その2)。 図10Cは、各ビットX~Xに空間の情報を割り振る様子の一例である(その3)。 図11は、Honeを説明するための図である。 図12は、Hconnを説明するための図である。 図13は、Holapを説明するための図である。 図14Aは、Hpairを説明するための図である(その1)。 図14Bは、Hpairを説明するための図である(その2)。 図15は、重みファイルの一例である。 図16は、焼き鈍し法に用いる最適化装置(演算部)の概念的構成を示す図である。 図17は、遷移制御部の回路レベルのブロック図である。 図18は、遷移制御部の動作フローを示す図である。 図19は、開示の環状分子の構造探索装置の構成例である。 図20は、開示の環状分子の構造探索装置の他の構成例である。 図21は、開示の環状分子の構造探索装置の他の構成例である。
(環状分子の構造探索方法)
開示の環状分子の構造探索方法は、コンピュータを用いて、n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索方法である。
環状分子の構造探索方法は、作成工程を含み、更に必要に応じて、その他の工程を含む。
作成工程においては、格子の集合である三次元格子空間の各格子点にn個の化合物基を順次配置し、三次元格子空間に環状分子の立体構造を作成する。
そして、環状分子の化合物基の数(n)が奇数の場合、作成工程は、以下の処理1~処理3を含む。
処理1:環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入する処理。
処理2:結合基を格子点に配置する処理。
処理3:n番目に配置した化合物基と1番目に配置した化合物基とが、結合基を挟んで対向する位置に配置されないようにする処理。
開示の技術の詳細を説明する前に、タンパク質の折り畳みをDiamond encording法によって求める方法について、説明する。
タンパク質の安定構造の探索は、通常、以下の手順で行われる。
まず、タンパク質の粗視化を行う(図1A)。タンパク質の粗視化は、例えば、タンパク質を構成する原子2を、アミノ酸残基単位1A、1B、1Cに粗視化することで行う。
次に、作成した粗視化モデルを用いて構造探索を行う(図1B)。構造探索は、後述するDiamond encording法によって行う。
次に、粗視化モデルを全原子に戻す(図1C)。
Diamond encording法は、一般的に、鎖状のアミノ酸がどの位置にあるのかをダイアモンド格子上に埋め込んでいく手法であり、三次元の構造体が表現できる。以下では、簡略化のため二次元の場合を例として示す。
直線構造で表した場合に5つのアミノ酸残基が結合した図2Aの構造を持つ直鎖ペンタペプチドを例として、考える。図2A~図2Eにおいて、丸の中の番号は、直鎖ペンタペプチドにおけるアミノ酸残基の番号を表す。
まず、ダイアモンド格子の中心に、番号1のアミノ酸残基を配置すると、図2Aに示すように、番号2のアミノ酸残基の配置可能な場所は、中心に隣接する図2Bに示す場所(番号2が付された場所)に限定される。
次に、番号2のアミノ酸残基に結合する番号3のアミノ酸残基の配置可能な場所は、図2Cにおいて、図2Bにおいて番号2が付された場所に隣接する場所(番号3が付された場所)に限定される。
次に、番号3のアミノ酸残基に結合する番号4のアミノ酸残基の配置可能な場所は、図2Dにおいて、図2Cにおいて番号3が付された場所に隣接する場所(番号4が付された場所)に限定される。
次に、番号4のアミノ酸残基に結合する番号5のアミノ酸残基の配置可能な場所は、図2Eにおいて、図2Dにおいて番号4が付された場所に隣接する場所(番号5が付された場所)に限定される。
このようにして、配置可能な場所をつないでいくことで、三次元の構造体が表現できる。
従来の上記技術を、環状分子である環状のタンパク質に適用した場合、以下のようになる。
アミノ酸残基の数が偶数の環状のタンパク質の場合について、アミノ酸残基の数が8個の環状のタンパク質を、図3Aを用いて説明する。アミノ酸残基の数が8個の環状のタンパク質の場合、配列の1番目(最初)のアミノ酸残基と、配列の8番目(最後)のアミノ酸残基とは、隣り合う格子に配置できるために、ダイアモンド格子に環状構造を再現できる。
一方、アミノ酸残基の数が奇数の環状のタンパク質の場合について、アミノ酸残基の数が7個の環状のタンパク質を、図3Bを用いて説明する。アミノ酸残基の数が7個の環状のタンパク質の場合、配列の1番目(最初)のアミノ酸残基と、配列の7番目(最後)のアミノ酸残基とは、隣り合う格子に配置できないために、ダイアモンド格子に環状構造を再現できない。
そのため、アミノ酸残基の数が奇数の環状のタンパク質の場合については、立体構造を得られないことになる。
しかし、図3Bのような場合、配列の1番目(最初)のアミノ酸残基と、配列の7番目(最後)のアミノ酸残基とは、近い配置ため、実現可能な環状構造と考えることができる。
そこで、本発明者は、図3Bのような場合において、環状のタンパク質の立体構造を得る方法を検討した。
ここで、図3Bにおいて、配列の1番目(最初)のアミノ酸残基と、配列の7番目(最後)のアミノ酸残基とは近い距離にあるため、これらをつなぎ合わせる処理を施すことで、環状のタンパク質を得ることができる。
一方、図3Cに示すような配列の場合、配列の1番目(最初)のアミノ酸残基と、配列の7番目(最後)のアミノ酸残基とは距離が遠いため、これらをつなぎ合わせることは適当ではない。
そこで、本発明者は、アミノ酸残基の数が奇数の環状のタンパク質の場合には、図4に示すように、結合基Sを追加しつつ、最後に配置した化合物基と1番目に配置した化合物基とが、結合基を挟んで対向する位置に配置されないようにした。
そうすることで、結合基Sによって、格子点が環状に繋がり、ダイアモンド格子に環状のタンパク質の立体構造が得られる。更に、最後に配置した化合物基と1番目に配置した化合物基とが、結合基を挟んで対向する位置に配置されないようにすることで、図3Cのように、配列の1番目(最初)のアミノ酸残基と、配列の7番目(最後)のアミノ酸残基とは距離とが遠くなることを避けることができる。
すなわち、本発明者は、n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索方法において、格子の集合である三次元格子空間の各格子点にn個の化合物基を順次配置し、三次元格子空間に環状分子の立体構造を作成する際に、環状分子の化合物基の数(n)が奇数の場合には、環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入する処理と、結合基を格子点に配置する処理と、n番目に配置した化合物基と1番目に配置した化合物基とが、結合基を挟んで対向する位置に配置されないようにする処理と、を行うことで、環状分子の安定構造を求めることができることを見出した。
結合基を挟んで対向する位置に配置されないようにする処理は、結合基に末端基を結合し、末端基が、三次元格子空間において、結合基を挟んで、n番目に配置した化合物基と対向する位置に配置されることにより行われることが好ましい。
例えば、図5に示すように、結合基を挟んで、配列の7番目(最後)のアミノ酸残基と対向する位置に末端基Eを追加する。そうすることにより、得られる環状分子において、図3Cのように、配列の1番目(最初)のアミノ酸残基と、配列の7番目(最後)のアミノ酸残基とは距離とが遠くなることを避けることができる。
なお、結合基、及び末端基は、環状分子には存在しない仮想的な基である。
更に、作成された環状分子の立体構造については、焼き鈍し法を用いた基底状態探索を実行することにより、最小エネルギーを算出することが行われる。
化合物基としては、例えば、アミノ酸残基である。
化合物基がアミノ酸残基の場合、環状分子としては、例えば、環状のタンパク質が挙げられる。
アミノ酸残基の元となるアミノ酸としては、天然アミノ酸であってもよいし、人工アミノ酸であってもよい。天然アミノ酸としては、例えば、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン、β-アラニン、β-フェニルアラニンなどが挙げられる。人工アミノ酸としては、例えば、パラベンゾイルフェニルアラニンなどが挙げられる。
タンパク質におけるアミノ酸残基の数としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、10~30程度であってもよいし、数百であってもよい。
以下、フローチャート等を用いて、開示の技術の一例を説明する。
図6に、タンパク質の安定構造を探索するフローチャートを示す。
<工程S101>
まず、アミノ酸残基の数(n)に基づいて、複数のアミノ酸残基が順次配置される格子の集合である3次元格子空間が定義される(S101)。
ここで、3次元格子空間の定義の一例を説明する。格子空間は三次元であるが、以下では、簡略化のため二次元の場合を例として示す。
まず、ダイアモンド格子空間において半径rにある格子の集合をShellとし、各格子点をSとする。すると、各格子点Sは、図7のように表すことができる。
例えば、1~5個目のアミノ酸残基の移動先の格子点の集合V~Vは図8A~図8Dのようになる。
ここで、図8Aにおいては、V=Sであり、V=Sである。
図8Bにおいて、V=Sである。
図8Cにおいて、V=S、Sである。
図8Dにおいて、V=S、Sである。
なお、S、S、Sを三次元で表すと図9のようになる。図9において、A=Sであり、B=Sであり、C=Sである。
そして、n個のアミノ酸残基を有するタンパク質におけるi番目のアミノ酸残基に必要な空間Vは、以下の式で表される。
Figure 0007176381000001
ここで、i={1,2,3,......n}である。
そして、奇数番目(i=奇数)のアミノ酸残基の場合は、J={1,3,.....i}であり、偶数番目(i=偶数)のアミノ酸残基の場合は、J={2,4,.....i}である。
<工程S102>
次に、アミノ酸残基の数(n)が、偶数か奇数かを判定し、偶数の場合には工程S104に進み、奇数の場合には、工程S103に進む(S102)。
<工程S103>
次に、アミノ酸残基の数(n)が奇数の場合、工程S103では、三次元格子空間に配置される要素に、結合基Sと末端基Eとが追加される。
結合基Sは、環状のタンパク質のn番目に配置したアミノ酸残基と1番目に配置したアミノ酸残基との間に挿入される。末端基Eは結合基Sに結合している。末端基Eには、結合基Sを挟んで、n番目に配置したアミノ酸残基と対向する位置に配置される制約が課される。
<工程S104>
次に、i個目のアミノ酸残基、結合基S、及び末端基Eの移動先の格子点の集合をVとする(S104)。
以上により、アミノ酸残基、結合基S、及び末端基Eが入る空間が定義される。
<工程S105>
次に、各格子点にビットをそれぞれ割り当てる。即ち、各ビットX~Xに空間の情報を割り振ることが行われる(S105)。具体的には、図10A~図10Cに示すように、各アミノ酸残基、結合基、及び末端基の入る空間に対して、その位置にアミノ酸残基、結合基、及び末端基が在ることを1とし、無いことを0として表すビットを割り振る。なお、図10A~図10Cにおいては、各アミノ酸残基2~4に対して複数のXに割当てられているが、実際は、1つのアミノ酸残基に対して、1つのビットXが割り当てられる。
<工程S106>
次に、Hone、Hconn、Holap、Hpair、Hbond、Hendを設定し、各格子点に関する制約条件に基づいて変換したイジングモデルを作成する(S106)。
ここで、Diamond encording法において、全エネルギーは、以下のように表現できる。
以下の式は、アミノ酸残基の数(n)が偶数の場合の全エネルギー式である。
Figure 0007176381000002
以下の式は、アミノ酸残基の数(n)が奇数の場合の全エネルギー式である。
Figure 0007176381000003
ここで、Honeは、1~n番目のアミノ酸残基はそれぞれ一つしかないという制約を表す。
connは、1~n番目のアミノ酸残基はそれぞれ繋がっているという制約を表す。
olapは、1~n番目のアミノ酸残基はそれぞれ重ならないという制約を表す。
pairは、アミノ酸残基同士の相互作用を表す制約を表す。
bondは、結合基Sは1番目のアミノ酸残基とn番目のアミノ酸残基とに隣接するという制約を表す。
endは、末端基Eは結合基Sを挟んでn番目のアミノ酸残基と対向するという制約を表す。
各制約の一例は、以下の通りである。
なお、以下において説明する図11~図14A、図14Bにおいて、Xは、番号1のアミノ酸残基が配置可能な位置を表す。
~Xは、番号2のアミノ酸残基が配置可能な位置を表す。
~X13は、番号3のアミノ酸残基が配置可能な位置を表す。
14~X29は、番号4のアミノ酸残基が配置可能な位置を表す。
oneの一例を以下に示す。
Figure 0007176381000004
上記関数において、X、Xは、1又は0を取る。即ち、Honeは、図11において、X、X、X、Xのうち、いずれか一つだけ1であるため、いずれか二つ以上1になっていた場合エネルギーが上がる関数であり、一つだけ1であった場合は0になるペナルティーの項である。
なお、上記関数において、λoneは、重み付けのための係数である。
connの一例を以下に示す。
Figure 0007176381000005
上記関数において、X、Xは、1又は0を取る。即ち、Hconnは、図12において、Xが1のとき、X13、X、Xのいずれかがが1であればエネルギーが下がる式であり、すべてのアミノ酸残基が連結していると0になるペナルティー項である。
なお、上記関数において、λconnは、重み付けのための係数である。例えば、λone>λconnの関係にある。
olapの一例を以下に示す。
Figure 0007176381000006
上記関数において、X、Xは、1又は0を取る。即ち、Holapは、図13において、Xが1のとき、X14が1になった場合にペナルティーが発生する項である。
なお、上記関数において、λolapは、重み付けのための係数である。
pairの一例を以下に示す。
Figure 0007176381000007
上記関数において、X、Xは、1又は0を取る。即ち、Hpairは、図14A及び図14Bにおいて、Xが1のとき、X15が1になった場合にXのアミノ酸残基とX15のアミノ酸残基との間に相互作用Pω(x1)ω(x15)が働きエネルギーが下がるという関数である。相互作用Pω(x1)ω(x15)は、2つのアミノ酸残基の組み合わせにより決まり、相互作用Pω(x1)ω(x15)は、例えば、miyazawa-jernigan(MJ) matrixなどを参照して決定される。
bondについては、結合基Sは1番目のアミノ酸残基とn番目のアミノ酸残基とに隣接するという制約を満たすように適宜設定される。
endについては、末端基Eは結合基Sを挟んでn番目のアミノ酸残基と対向するという制約を満たすように適宜設定される。
そして、Hone、Hconn、Holap、及びHpair、必要に応じてHbond、及びHendを合成することでHが算出される。
次に、上記各関数における重み係数(λone、λconn、λolap)が抽出される。
次に、抽出された重み係数に対応した重みファイルが作成される。重みファイルは、例えば、行列であり、例えば、2X+4Xの場合、図15のような行列のファイルとなる。
作成した重みファイルを用いることで、以下のイジングモデルのエネルギー式を表現できる。
Figure 0007176381000008
上記関数において、状態Xi、は、0又は1を表し、0は、無いことを意味し、1は、在ることを意味する。右辺の1項目のWijは、重み付けのための係数である。
右辺の1項目は、全ニューロン回路から選択可能な2つのニューロン回路の全組み合わせについて、漏れと重複なく、2つのニューロン回路の状態と重み値との積を積算したものである。
また、右辺の2項目は、全ニューロン回路のそれぞれのバイアス値と状態との積を積算したものである。bは、i番目のニューロン回路のバイアス値を示している。
<工程S107>
次に、アニーリングマシンにおいて、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する(S107)。
アニーリングマシンとしては、イジングモデルで表されるエネルギー関数について基底状態探索を行なうアニーリング方式を採用するコンピュータであれば、量子アニーリングマシンであっても、半導体技術を用いた半導体アニーリングマシンであっても、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)を用いてソフトウェアにより実行されるシミュレーテッド・アニーリング(Simulated Annealing)の何れであっても良い。
以下に、焼き鈍し法、及びアニーリングマシンの一例について説明する。
焼き鈍し法(シミュレーテッド・アニーリング法、SA法)はモンテカルロ法の一種であり、乱数値を用いて確率的に解を求める方法である。以下では最適化したい評価関数の値を最小化する問題を例に説明し、評価関数の値をエネルギーと呼ぶことにする。最大化の場合は、評価関数の符号を変えればよい。
各変数に離散値の1つを代入した初期状態からはじめ、現在の状態(変数の値の組み合わせ)から、それに近い状態(例えば1つの変数だけ変化させた状態)を選び、その状態遷移を考える。その状態遷移に対するエネルギーの変化を計算し、その値に応じてその状態遷移を採択して状態を変化させるか、採択せずに元の状態を保つかを確率的に決める。エネルギーが下がる場合の採択確率をエネルギーが上がる場合より大きく選ぶと、平均的にはエネルギーが下がる方向に状態変化が起こり、時間の経過とともにより適切な状態へ状態遷移することが期待できる。そして、最終的には最適解又は最適値に近いエネルギーを与える近似解を得られる可能性がある。もし、これを決定論的にエネルギーが下がる場合に採択とし、上がる場合に不採択とすれば、エネルギーの変化は時間に対して広義単調減少となるが、局所解に到達したらそれ以上変化が起こらなくなってしまう。上記のように離散最適化問題には非常に多数の局所解が存在するために、状態が、ほとんど確実にあまり最適値に近くない局所解に捕まってしまう。したがって、採択するかどうかを確率的に決定することが重要である。
焼き鈍し法においては、状態遷移の採択(許容)確率を次のように決めれば、時刻(反復回数)無限大の極限で状態が最適解に到達することが証明されている。
(1)状態遷移に伴うエネルギー変化(エネルギー減少)値(-ΔE)に対して、その状態遷移の許容確率pを次の何れかの関数f()により決める。
Figure 0007176381000009
Figure 0007176381000010
Figure 0007176381000011
ここで、Tは、温度値と呼ばれるパラメータで次のように変化させる。
(2)温度値Tを次式で表されるように反復回数tに対数的に減少させる。
Figure 0007176381000012
ここで、Tは、初期温度値であり問題に応じて十分大きくとることが望ましい。
(1)の式で表される許容確率を用いた場合、十分な反復後に定常状態に達したとすると、各状態の占有確率は熱力学における熱平衡状態に対するボルツマン分布にしたがう。
そして、高い温度から徐々に下げていくとエネルギーの低い状態の占有確率が増加するため、十分温度が下がるとエネルギーの低い状態が得られるはずである。この様子が材料を焼き鈍したときの状態変化とよく似ているため、この方法は焼き鈍し法(または、疑似焼き鈍し法)と呼ばれるのである。このとき、エネルギーが上がる状態遷移が確率的に起こることは、物理学における熱励起に相当する。
図16に焼き鈍し法を行う最適化装置(演算部18)の概念的構成を示す。ただし、下記説明では、状態遷移の候補を複数発生させる場合についても述べているが、本来の基本的な焼き鈍し法は遷移候補を1つずつ発生させるものである。
最適化装置100には、まず現在の状態S(複数の状態変数の値)を保持する状態保持部111がある。また、複数の状態変数の値の何れかが変化することによる現在の状態Sからの状態遷移が起こった場合の、各状態遷移のエネルギー変化値{-ΔEi}を計算するエネルギー計算部112がある。そして、最適化装置100には、温度値Tを制御する温度制御部113、状態変化を制御するための遷移制御部114がある。
遷移制御部114は、温度値Tとエネルギー変化値{-ΔEi}と乱数値とに基づいて、エネルギー変化値{-ΔEi}と熱励起エネルギーとの相対関係によって複数の状態遷移の何れかを受け入れるか否かを確率的に決定するものである。
遷移制御部114をさらに細分化すると、遷移制御部114は、状態遷移の候補を発生する候補発生部114a、各候補に対して、そのエネルギー変化値{-ΔEi}と温度値Tとから状態遷移を許可するかどうかを確率的に決定するための可否判定部114bを有する。さらに、可となった候補から採用される候補を決定する遷移決定部114c、及び、確率変数を発生させるための乱数発生部114dを有する。
一回の反復における動作は次のようなものである。まず、候補発生部114aは、状態保持部111に保持された現在の状態Sから次の状態への状態遷移の候補(候補番号{Ni})を1つまたは複数発生する。エネルギー計算部112は、現在の状態Sと状態遷移の候補を用いて候補に挙げられた各状態遷移に対するエネルギー変化値{-ΔEi}を計算する。可否判定部114bは、温度制御部113で発生した温度値Tと乱数発生部114dで生成した確率変数(乱数値)を用い、各状態遷移のエネルギー変化値{-ΔEi}に応じて、上記(1)の式の許容確率でその状態遷移を許容する。そして、可否判定部114bは、各状態遷移の可否{fi}を出力する。許容された状態遷移が複数ある場合には、遷移決定部114cは、乱数値を用いてランダムにそのうちの1つを選択する。そして、遷移決定部114cは、選択した状態遷移の遷移番号Nと、遷移可否fを出力する。許容された状態遷移が存在した場合、採択された状態遷移に応じて状態保持部111に記憶された状態変数の値が更新される。
初期状態から始めて、温度制御部113で温度値を下げながら上記反復を繰り返し、一定の反復回数に達したり、エネルギーが一定の値を下回る等の終了判定条件が満たされたとき、動作が終了する。最適化装置110が出力する答えは終了時の状態である。
図17は、候補を1つずつ発生させる通常の焼き鈍し法における遷移制御部、特に可否判定部のために必要な演算部分の構成例の回路レベルのブロック図である。
遷移制御部114は、乱数発生回路114b1、セレクタ114b2、ノイズテーブル114b3、乗算器114b4、比較器114b5を有する。
セレクタ114b2は、各状態遷移の候補に対して計算されたエネルギー変化値{-ΔEi}のうち、乱数発生回路114b1が生成した乱数値である遷移番号Nに対応するものを選択して出力する。
ノイズテーブル114b3の機能については後述する。ノイズテーブル114b3として、例えば、RAM(Random Access Memory)、フラッシュメモリ等のメモリを用いることができる。
乗算器114b4は、ノイズテーブル114b3が出力する値と、温度値Tとを乗算した積(前述した熱励起エネルギーに相当する)を出力する。
比較器114b5は、乗算器114b4が出力した乗算結果と、セレクタ114b2が選択したエネルギー変化値である-ΔEとを比較した比較結果を遷移可否fとして出力する。
図17に示されている遷移制御部114は、基本的に前述した機能をそのまま実装するものであるが、(1)の式で表される許容確率で状態遷移を許容するメカニズムについてはこれまで説明していないのでこれを補足する。
許容確率pで1を、(1-p)で0を出力する回路は、2つの入力A,Bを持ち、A>Bのとき1を出力し、A<Bのとき0を出力する比較器の入力Aに許容確率pを、入力Bに区間[0,1)の値をとる一様乱数を入力することで実現することができる。したがってこの比較器の入力Aに、エネルギー変化値と温度値Tにより(1)の式を用いて計算される許容確率pの値を入力すれば、上記の機能を実現することができる。
即ちfを(1)の式で用いる関数、uを区間[0,1)の値をとる一様乱数とするとき、f(ΔE/T)がuより大きいとき1を出力する回路で、上記の機能を実現できる。
このままでもよいのであるが、次のような変形を行っても同じ機能が実現できる。2つの数に同じ単調増加関数を作用させても大小関係は変化しない。したがって比較器の2つの入力に同じ単調増加関数を作用させても出力は変わらない。この単調増加関数としてfの逆関数f-1を採用すると、-ΔE/Tがf-1(u)より大きいとき1を出力する回路でよいことがわかる。さらに温度値Tが正であることから-ΔEがTf-1(u)より大きいとき1を出力する回路でよい。図17中のノイズテーブル114b3はこの逆関数f-1(u)を実現するための変換テーブルであり、区間[0,1)を離散化した入力に対して次の関数の値を出力するテーブルである。
Figure 0007176381000013
Figure 0007176381000014
遷移制御部114には、判定結果等を保持するラッチやそのタイミングを発生するステートマシン等も存在するが、図17では図示を簡単にするため省略されている。
図18は、遷移制御部114の動作フローである。動作フローは、1つの状態遷移を候補として選ぶステップ(S0001)、その状態遷移に対するエネルギー変化値と温度値と乱数値の積の比較で状態遷移の可否を決定するステップ(S0002)、状態遷移が可ならばその状態遷移を採用し、否ならば不採用とするステップ(S0003)を有する。
<工程S108>
工程S108では、算出結果を出力する。結果は、タンパク質の立体構造図として出力してもよいし、タンパク質を構成する各アミノ酸残基の座標情報として出力してもよい。
(プログラム)
開示のプログラムは、コンピュータに、開示の環状分子の構造探索方法を実行させるプログラムである。
プログラムにおいて、環状分子の構造探索方法の実行における好適な態様は、開示の環状分子の構造探索方法における好適な態様と同じである。
プログラムは、使用するコンピュータシステムの構成及びオペレーティングシステムの種類・バージョンなどに応じて、公知の各種のプログラム言語を用いて作成することができる。
プログラムは、内蔵ハードディスク、外付けハードディスクなどの記録媒体に記録しておいてもよいし、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、MOディスク(Magneto-Optical disk)、USBメモリ〔USB(Universal Serial Bus) flash drive〕などの記録媒体に記録しておいてもよい。プログラムをCD-ROM、DVD-ROM、MOディスク、USBメモリなどの記録媒体に記録する場合には、必要に応じて随時、コンピュータシステムが有する記録媒体読取装置を通じて、これを直接、又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータ等)にプログラムを記録しておき、必要に応じて随時、外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することもできる。
プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。
(コンピュータが読み取り可能な記録媒体)
開示のコンピュータが読み取り可能な記録媒体は、開示のプログラムを記録してなる。
コンピュータが読み取り可能な記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、CD-ROM、DVD-ROM、MOディスク、USBメモリなどが挙げられる。
記録媒体は、プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。
(環状分子の構造探索装置)
開示の環状分子の構造探索装置は、作成部を少なくとも備え、更に必要に応じて、算出部などのその他の部を備える。
作成部は、格子の集合である三次元格子空間の各格子点にn個の化合物基を順次配置し、三次元格子空間に環状分子の立体構造を作成する。
環状分子の化合物基の数(n)が奇数の場合、作成部は、環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入し、結合基を格子点に配置し、かつn番目に配置した化合物基と1番目に配置した化合物基とが、結合基を挟んで対向する位置に配置されないようにする。
算出部は、作成された環状分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、最小エネルギーを算出する。具体的には、例えば、工程S106、工程S107に記載の方法により行われる。
図19に、開示の環状分子の構造探索装置の構成例を示す。
環状分子の構造探索装置10は、例えば、CPU11、メモリ12、記憶部13、表示部14、入力部15、出力部16、I/Oインターフェース部17等がシステムバス18を介して接続されて構成される。
CPU(Central Processing Unit)11は、演算(四則演算、比較演算等)、ハードウエア及びソフトウエアの動作制御などを行う。
メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)などのメモリである。RAMは、ROM及び記憶部13から読み出されたOS(Operating System)及びアプリケーションプログラムなどを記憶し、CPU11の主メモリ及びワークエリアとして機能する。
記憶部13は、各種プログラム及びデータを記憶する装置であり、例えば、ハードディスクである。記憶部13には、CPU11が実行するプログラム、プログラム実行に必要なデータ、OSなどが格納される。
プログラムは、記憶部13に格納され、メモリ12のRAM(主メモリ)にロードされ、CPU11により実行される。
表示部14は、表示装置であり、例えば、CRTモニタ、液晶パネル等のディスプレイ装置である。
入力部15は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス(例えば、マウス等)などである。
出力部16は、各種データの出力装置であり、例えば、プリンタである。
I/Oインターフェース部17は、各種の外部装置を接続するためのインターフェースである。例えば、CD-ROM、DVD-ROM、MOディスク、USBメモリなどのデータの入出力を可能にする。
図20に、開示の環状分子の構造探索装置の他の構成例を示す。
図20の構成例は、クラウド型の構成例であり、CPU11が、記憶部13等とは独立している。この構成例では、ネットワークインターフェース部19、20を介して、記憶部13等を格納するコンピュータ30と、CPU11を格納するコンピュータ40とが接続される。
ネットワークインターフェース部19、20は、インターネットを利用して、通信を行うハードウェアである。
図21に、開示の環状分子の構造探索装置の他の構成例を示す。
図21の構成例は、クラウド型の構成例であり、記憶部13が、CPU11等とは独立している。この構成例では、ネットワークインターフェース部19、20を介して、CPU11等を格納するコンピュータ30と、記憶部13を格納するコンピュータ40とが接続される。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
コンピュータを用いて、n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索方法であって、
格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する工程を含み、
前記環状分子の化合物基の数(n)が奇数の場合、前記作成する工程が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入する処理と、前記結合基を格子点に配置する処理と、前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする処理とを、含むことを特徴とする環状分子の構造探索方法。
(付記2)
前記結合基を挟んで対向する位置に配置されないようにする処理が、前記結合基に末端基を結合し、前記末端基が、前記三次元格子空間において、前記結合基を挟んで、前記n番目に配置した化合物基と対向する位置に配置されることにより行われる付記1に記載の環状分子の構造探索方法。
(付記3)
作成された前記環状分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、最小エネルギーを算出する工程を含む付記1から2のいずれかに記載の構造探索方法。
(付記4)
前記作成する工程が、前記環状分子の化合物基の数(n)が奇数か偶数かを判定する処理を含む付記1から3のいずれかに記載の構造探索方法。
(付記5)
前記環状分子が、環状のタンパク質である付記1から4のいずれかに記載の環状分子の構造探索方法。
(付記6)
前記化合物基が、アミノ酸残基である付記5に記載の環状分子の構造探索方法。
(付記7)
n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索装置であって、
格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する作成部を備え、
前記環状分子の化合物基の数(n)が奇数の場合、前記作成部が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入し、前記結合基を格子点に配置し、かつ前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする、ことを特徴とする環状分子の構造探索装置。
(付記8)
前記結合基を挟んで対向する位置に配置されないようにすることが、前記結合基に末端基を結合し、前記末端基が、前記三次元格子空間において、前記結合基を挟んで、前記n番目に配置した化合物基と対向する位置に配置されることにより行われる付記7に記載の環状分子の構造探索装置。
(付記9)
作成された前記環状分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、最小エネルギーを算出する算出部を含む付記7から8のいずれかに記載の構造探索装置。
(付記10)
前記作成部が、前記環状分子の化合物基の数(n)が奇数か偶数かを判定する付記7から9のいずれかに記載の構造探索装置。
(付記11)
前記環状分子が、環状のタンパク質である付記7から10のいずれかに記載の環状分子の構造探索装置。
(付記12)
前記化合物基が、アミノ酸残基である付記11に記載の環状分子の構造探索装置。
(付記13)
n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索プログラムであって、
コンピュータに、格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する工程を実行させ、
前記環状分子の化合物基の数(n)が奇数の場合、前記作成する工程が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入する処理と、前記結合基を格子点に配置する処理と、前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする処理とを、含むことを特徴とするプログラム。
(付記14)
前記結合基を挟んで対向する位置に配置されないようにする処理が、前記結合基に末端基を結合し、前記末端基が、前記三次元格子空間において、前記結合基を挟んで、前記n番目に配置した化合物基と対向する位置に配置されることにより行われる付記13に記載の環状分子のプログラム。
(付記15)
コンピュータに、作成された前記環状分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、最小エネルギーを算出させる工程を実行させる付記13から14のいずれかに記載のプログラム。
(付記16)
前記作成する工程が、前記環状分子の化合物基の数(n)が奇数か偶数かを判定する処理を含む付記13から15のいずれかに記載のプログラム。
(付記17)
前記環状分子が、環状のタンパク質である付記13から16のいずれかに記載の環状分子のプログラム。
(付記18)
前記化合物基が、アミノ酸残基である付記17に記載の環状分子のプログラム。
10 環状分子の構造探索装置
11 CPU
12 メモリ
13 記憶部
14 表示部
15 入力部
16 出力部
17 I/Oインターフェース部
18 システムバス
19 ネットワークインターフェース部
20 ネットワークインターフェース部
30 コンピュータ
40 コンピュータ

Claims (8)

  1. コンピュータを用いて、n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索方法であって、
    格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する工程を含み、
    前記環状分子の化合物基の数(n)が奇数の場合、前記作成する工程が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入する処理と、前記結合基を格子点に配置する処理と、前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする処理とを、含むことを特徴とする環状分子の構造探索方法。
  2. 前記結合基を挟んで対向する位置に配置されないようにする処理が、前記結合基に末端基を結合し、前記末端基が、前記三次元格子空間において、前記結合基を挟んで、前記n番目に配置した化合物基と対向する位置に配置されることにより行われる請求項1に記載の環状分子の構造探索方法。
  3. 作成された前記環状分子の立体構造について、焼き鈍し法を用いた基底状態探索を実行することにより、最小エネルギーを算出する工程を含む請求項1から2のいずれかに記載の構造探索方法。
  4. 前記作成する工程が、前記環状分子の化合物基の数(n)が奇数か偶数かを判定する処理を含む請求項1から3のいずれかに記載の構造探索方法。
  5. 前記環状分子が、環状のタンパク質である請求項1から4のいずれかに記載の環状分子の構造探索方法。
  6. 前記化合物基が、アミノ酸残基である請求項5に記載の環状分子の構造探索方法。
  7. n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索装置であって、
    格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する作成部を備え、
    前記環状分子の化合物基の数(n)が奇数の場合、前記作成部が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入し、前記結合基を格子点に配置し、かつ前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする、ことを特徴とする環状分子の構造探索装置。
  8. n個の化合物基が環状に連結した環状分子の安定構造を探索する環状分子の構造探索プログラムであって、
    コンピュータに、格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記環状分子の立体構造を作成する工程を実行させ、
    前記環状分子の化合物基の数(n)が奇数の場合、前記作成する工程が、前記環状分子におけるn番目に配置した化合物基と1番目に配置した化合物基との間に結合基を挿入する処理と、前記結合基を格子点に配置する処理と、前記n番目に配置した化合物基と前記1番目に配置した化合物基とが、前記結合基を挟んで対向する位置に配置されないようにする処理とを、含むことを特徴とするプログラム。
JP2018226351A 2018-12-03 2018-12-03 環状分子の構造探索方法、及び構造探索装置、並びにプログラム Active JP7176381B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2018226351A JP7176381B2 (ja) 2018-12-03 2018-12-03 環状分子の構造探索方法、及び構造探索装置、並びにプログラム
US16/598,679 US20200176074A1 (en) 2018-12-03 2019-10-10 Method and device for searching structure of cyclic molecule, and non-transitory recording medium
EP19205295.9A EP3667673A1 (en) 2018-12-03 2019-10-25 Method and device for searching structure of cyclic molecule, and program
CN201911163080.1A CN111261235A (zh) 2018-12-03 2019-11-22 用于检索环状分子的结构的方法和装置以及记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018226351A JP7176381B2 (ja) 2018-12-03 2018-12-03 環状分子の構造探索方法、及び構造探索装置、並びにプログラム

Publications (2)

Publication Number Publication Date
JP2020091518A JP2020091518A (ja) 2020-06-11
JP7176381B2 true JP7176381B2 (ja) 2022-11-22

Family

ID=68344691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018226351A Active JP7176381B2 (ja) 2018-12-03 2018-12-03 環状分子の構造探索方法、及び構造探索装置、並びにプログラム

Country Status (4)

Country Link
US (1) US20200176074A1 (ja)
EP (1) EP3667673A1 (ja)
JP (1) JP7176381B2 (ja)
CN (1) CN111261235A (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7547799B2 (ja) * 2020-06-05 2024-09-10 富士通株式会社 構造探索方法、構造探索装置、構造探索用プログラム、及び相互作用ポテンシャル特定方法
CN111899807B (zh) * 2020-06-12 2024-05-28 中国石油天然气股份有限公司 一种分子结构生成方法、系统、设备及存储介质
JP2022062322A (ja) * 2020-10-08 2022-04-20 富士通株式会社 構造探索プログラム、構造探索装置、及び構造探索方法
JP2023047726A (ja) 2021-09-27 2023-04-06 富士通株式会社 初期構造生成装置、初期構造生成方法及び初期構造生成プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020062155A1 (en) 1995-12-28 2002-05-23 Akiko Itai Method for creating physiologically active compounds
WO2005081166A1 (ja) 2004-02-24 2005-09-01 In-Silico Sciences, Inc. 相互作用部位予測装置、相互作用部位予測方法、プログラム、および記録媒体
JP2005234699A (ja) 2004-02-17 2005-09-02 Yokohama Tlo Co Ltd セルオートマトンによるタンパク質の立体構造推定装置及び方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080052055A1 (en) * 2006-07-28 2008-02-28 Geordie Rose Systems, methods and apparatus for protein folding simulation
BR112014024537A2 (pt) * 2012-04-02 2017-08-08 Berg Llc métodos para identificar moduladores de um sistema biológico, de um processo de doença, e de angiogênese
CA2999033C (en) * 2015-09-18 2024-01-23 California Institute Of Technology Associative polymers for use in a flow and related compositions, methods and systems
US11138511B2 (en) * 2017-01-13 2021-10-05 D-Wave Systems Inc. Problem solving using quantum annealer, useful for example in sequencing, for instance nucleic acid sequencing
JP6882704B2 (ja) * 2017-02-27 2021-06-02 富士通株式会社 安定立体構造の算出方法、及び算出装置、並びにプログラム
CN107563104B (zh) * 2017-10-18 2020-01-24 安庆师范大学 基于模拟退火优化算法的二元团簇结构优化方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020062155A1 (en) 1995-12-28 2002-05-23 Akiko Itai Method for creating physiologically active compounds
JP2005234699A (ja) 2004-02-17 2005-09-02 Yokohama Tlo Co Ltd セルオートマトンによるタンパク質の立体構造推定装置及び方法
WO2005081166A1 (ja) 2004-02-24 2005-09-01 In-Silico Sciences, Inc. 相互作用部位予測装置、相互作用部位予測方法、プログラム、および記録媒体

Also Published As

Publication number Publication date
JP2020091518A (ja) 2020-06-11
CN111261235A (zh) 2020-06-09
US20200176074A1 (en) 2020-06-04
EP3667673A1 (en) 2020-06-17

Similar Documents

Publication Publication Date Title
JP7176381B2 (ja) 環状分子の構造探索方法、及び構造探索装置、並びにプログラム
JP7251281B2 (ja) 結合構造探索装置、結合構造探索方法、及び結合構造探索プログラム
Grüneis et al. Perspective: Explicitly correlated electronic structure theory for complex systems
JP7139805B2 (ja) 化合物探索装置、化合物探索方法、及び化合物探索プログラム
Bauer et al. Phat–persistent homology algorithms toolbox
Booth et al. Linear-scaling and parallelisable algorithms for stochastic quantum chemistry
MacFarland et al. A new parallel P3M code for very large-scale cosmological simulations
Catanzaro et al. A decomposition for in-place matrix transposition
JP2021082165A (ja) 構造探索方法、構造探索プログラム、及び構造探索装置
Vasiljevic et al. Handling ties in heuristics for the permutation flow shop scheduling problem
Hogg et al. A sparse symmetric indefinite direct solver for GPU architectures
Drozdowski et al. Out-of-core divisible load processing
Horelik et al. Monte Carlo domain decomposition for robust nuclear reactor analysis
JP7219402B2 (ja) 最適化装置、最適化装置の制御方法及び最適化装置の制御プログラム
Aberer et al. Rapid forward-in-time simulation at the chromosome and genome level
JP7268484B2 (ja) 構造探索装置、構造探索方法、及び構造探索プログラム
Dahmani et al. Iterative approaches for solving a multi-objective 2-dimensional vector packing problem
Navarro et al. Competitiveness of a non-linear block-space gpu thread map for simplex domains
JP7112312B2 (ja) 化合物探索装置、化合物探索方法、及び化合物探索プログラム
Tennyson et al. MPI+ OpenCL implementation of a phase-field method incorporating CALPHAD description of Gibbs energies on heterogeneous computing platforms
Li et al. Quasi-Monte-Carlo tree search for 3D bin packing
Yamakov Parallel grand canonical Monte Carlo (paragrandMC) simulation code
JP7547799B2 (ja) 構造探索方法、構造探索装置、構造探索用プログラム、及び相互作用ポテンシャル特定方法
JP6067596B2 (ja) ペアリング演算装置、マルチペアリング演算装置、プログラム
Bhuva et al. Evolutionary algorithms for cardinality-constrained Ising models

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210810

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221024

R150 Certificate of patent or registration of utility model

Ref document number: 7176381

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150