JP2021082165A - 構造探索方法、構造探索プログラム、及び構造探索装置 - Google Patents

構造探索方法、構造探索プログラム、及び構造探索装置 Download PDF

Info

Publication number
JP2021082165A
JP2021082165A JP2019211007A JP2019211007A JP2021082165A JP 2021082165 A JP2021082165 A JP 2021082165A JP 2019211007 A JP2019211007 A JP 2019211007A JP 2019211007 A JP2019211007 A JP 2019211007A JP 2021082165 A JP2021082165 A JP 2021082165A
Authority
JP
Japan
Prior art keywords
constraint
compound
lattice
compound groups
dimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019211007A
Other languages
English (en)
Inventor
佐藤 博之
Hiroyuki Sato
博之 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019211007A priority Critical patent/JP2021082165A/ja
Priority to US17/070,965 priority patent/US20210158891A1/en
Priority to EP20202456.8A priority patent/EP3826022A1/en
Priority to CN202011210162.XA priority patent/CN112837763A/zh
Publication of JP2021082165A publication Critical patent/JP2021082165A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/04Constraint-based CAD

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Geometry (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Complex Calculations (AREA)

Abstract

【課題】効率的に安定構造を探索することができる構造探索方法、構造探索プログラム及び構造探索装置を提供する。【解決手段】n個の化合物基が連結した化合物の安定構造を探索する、コンピュータによる構造探索方法であって、格子の集合である三次元格子空間の各格子点にn個の化合物基を順次配置し、三次元格子空間に前記化合物の立体構造を作成する工程と、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する工程と、を含む。制約条件として、n個の化合物基の夫々は一つしかないという第1制約と、n個の化合物基は前記各格子点において互いに重ならないという第2制約と、n個の化合物基の連結に際して、制約を満たさないときに算出されるイジングモデルのエネルギーを増大させる第3制約と、を有する。【選択図】図8

Description

本件は、構造探索方法、構造探索プログラム、及び構造探索装置に関する。
近年、創薬などの場面においては、計算機(コンピュータ)を用いてサイズの大きな分子の安定構造を求めることが必要となる場合がある。しかし、例えば、タンパク質などのサイズの大きな分子は、全ての原子を露わに考慮する計算では、現実的な時間内に安定構造を探索することが困難になる場合がある。
そこで、分子の構造を粗く捉える(粗視化する)ことで、計算時間を短縮する技術が研究されている。
分子構造の粗視化に関する技術としては、例えば、タンパク質におけるアミノ酸残基の一次元配列情報に基づき、直鎖(一続き)の単純立方格子構造に粗視化して、格子タンパク質(Lattice Protein)として扱う技術が研究されている。Lattice Proteinにおいては、量子アニーリングの技術を用いて、安定構造を高速に探索する技術が報告されている(例えば、非特許文献1参照)。
このようなLattice Proteinにおける安定構造をアニーリングマシンで探索する技術においては、複数の制約条件を同時に満たすことが難しく、効率的に安定構造を探索しにくい。
R. Babbush et.al., Construction of Energy Functions for Lattice Heteropolymer Models: A Case Study in Constraint Satisfaction Programmisng and Adiabatic Quantum Optimization, Advances in Chemical Physics, 155, 201−244
一つの側面では、本件は、効率的に安定構造を探索することができる構造探索方法、構造探索プログラム、及び構造探索装置を提供することを目的とする。
上記の課題を解決するための手段の一つの実施態様は、以下の通りである。
すなわち、一つの実施態様では、構造探索方法は、n個の化合物基が連結した化合物の安定構造を探索する、コンピュータによる構造探索方法であって、格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成する工程と、前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する工程と、を含み、前記制約条件が、前記n個の化合物基のそれぞれは一つしかないという第1制約と、前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、を有する。
また、一つの実施態様では、構造探索プログラムは、n個の化合物基が連結した化合物の安定構造を探索する構造探索プログラムであって、コンピュータに、格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成する工程と、前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する工程と、を実行させることを含み、前記制約条件が、前記n個の化合物基のそれぞれは一つしかないという第1制約と、前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、を有する。
さらに、一つの実施態様では、構造探索装置は、n個の化合物基が連結した化合物の安定構造を探索する構造探索装置であって、格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成するユニットと、前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出するユニットと、を含み、前記制約条件が、前記n個の化合物基のそれぞれは一つしかないという第1制約と、前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、を有する。
一つの側面では、本件は、安定構造を探索する構造探索方法、構造探索プログラム、及び構造探索装置を提供できる。
図1Aは、タンパク質の粗視化して安定構造を探索する際の一例を示す模式図である(その1)。 図1Bは、タンパク質の粗視化して安定構造を探索する際の一例を示す模式図である(その2)。 図1Cは、タンパク質の粗視化して安定構造を探索する際の一例を示す模式図である(その3)。 図2Aは、Diamond encording法の一例を説明するための模式図である(その1)。 図2Bは、Diamond encording法の一例を説明するための模式図である(その2)。 図2Cは、Diamond encording法の一例を説明するための模式図である(その3)。 図2Dは、Diamond encording法の一例を説明するための模式図である(その4)。 図2Eは、Diamond encording法の一例を説明するための模式図である(その5)。 図3は、Honeの一例を説明するための図である。 図4は、Holapの一例を説明するための図である。 図5は、Hconnの一例を説明するための図である。 図6は、Hpairの一例を説明するための図である。 図7は、第3制約の一例を説明するための図である。 図8は、本件で開示する構造探索装置の一例のブロック図を示す。 図9は、本件で開示する構造探索装置の構成例を表す図である。 図10は、本件で開示する構造探索装置の他の構成例を表す図である。 図11は、本件で開示する構造探索装置の他の構成例を表す図である。 図12は、タンパク質の安定構造を探索する方法の一例を示すフローチャートである。 図13は、半径rにある各格子をSとした場合を表す図である。 図14Aは、アミノ酸残基の移動先の格子点の集合を表す図である(その1)。 図14Bは、アミノ酸残基の移動先の格子点の集合を表す図である(その2)。 図14Cは、アミノ酸残基の移動先の格子点の集合を表す図である(その3)。 図14Dは、アミノ酸残基の移動先の格子点の集合を表す図である(その4)。 図15は、S、S、Sを三次元で表した図である。 図16Aは、各ビットX〜Xに空間の情報を割り振る様子の一例である(その1)。 図16Bは、各ビットX〜Xに空間の情報を割り振る様子の一例である(その2)。 図16Cは、各ビットX〜Xに空間の情報を割り振る様子の一例である(その3)。 図17は、Honeを説明するための図である。 図18は、Holapを説明するための図である。 図19Aは、Hpairを説明するための図である(その1)。 図19Bは、Hpairを説明するための図である(その2)。 図20は、重みファイルの一例を示す図である。 図21は、焼き鈍し法に用いる最適化装置(制御部)の機能構成の一例を示す図である。 図22は、遷移制御部の回路レベルの一例を示すブロック図である。 図23は、遷移制御部の動作フローの一例を示す図である。 図24は、構造探索装置の記憶部のデータ構成例である。 図25は、図24のデータ構成例に対応した処理フローである。
まず、本件で開示する技術の詳細を説明する前に、Lattice Proteinを用いた技術の一つであるDiamond encording法によって、タンパク質の折り畳み構造を求める方法について説明する。
Lattice Proteinを用いたタンパク質(又はべプチド)の構造探索を行う際には、まず、タンパク質の粗視化を行う。ここで、タンパク質の粗視化は、例えば、図1Aに示すように、タンパク質を構成する原子2を、アミノ酸残基ごとの単位である粗視化粒子1A、1B、1Cに粗視化して粗視化モデルを作成することにより行う。
次に、作成した粗視化モデルを用いて安定な結合構造の探索を行う。図1Bにおいては、粗視化粒子1Cが矢印の終点に位置する結合構造が安定である場合の例を示す。ここで、安定な結合構造の探索は、後述するDiamond encording法によって行う。
そして、図1Cに示すように、Diamond encording法を用いて探索した安定な結合構造に基づいて、粗視化モデルを全原子のモデルに戻す。
ここで、Diamond encording法は、一般的に、タンパク質を形成する鎖状のアミノ酸を粗視化した粒子(粗視化モデル)を、ダイアモンド格子の格子点に当てはめていく手法であり、三次元のタンパク質の構造を表現可能である。
以下では、説明の簡略化のため、Diamond encording法について、二次元の場合を例として説明する。
図2Aは、5つのアミノ酸残基が結合した直鎖ペンタペプチドが直線構造を有する場合の構造の一例を示す図である。また、図2A〜図2Eにおいて、丸の中の番号は、直鎖ペンタペプチドにおけるアミノ酸残基の番号を表す。
Diamond encording法において、まず、ダイアモンド格子の中心に、番号1のアミノ酸残基を配置すると、図2Aに示すように、番号2のアミノ酸残基の配置可能な場所は、中心に隣接する図2Bに示す場所(番号2が付された場所)に限定される。
続いて、番号2のアミノ酸残基に結合する番号3のアミノ酸残基の配置可能な場所は、図2Cにおいて、図2Bで番号2が付された場所に隣接する場所(番号3が付された場所)に限定される。
そして、番号3のアミノ酸残基に結合する番号4のアミノ酸残基の配置可能な場所は、図2Dにおいて、図2Cで番号3が付された場所に隣接する場所(番号4が付された場所)に限定される。
さらに、番号4のアミノ酸残基に結合する番号5のアミノ酸残基の配置可能な場所は、図2Eにおいて、図2Dで番号4が付された場所に隣接する場所(番号5が付された場所)に限定される。
このようにして特定された配置可能な場所どうしを、アミノ酸残基の番号の順に繋いでいくことにより、粗視化したタンパク質の構造を表現することができる。
そして、粗視化したタンパク質の構造に関し、制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する。そうすることにより、タンパク質の安定構造を求めることができる。
ここで、制約条件としてHone、Holap、Hconn、コスト関数としてHpairを設定すると、Diamond encording法における、全エネルギーは、以下のように表現できる。
Figure 2021082165
ここで、Honeは、1〜n番目のアミノ酸残基はそれぞれ一つしかないという制約を表す。
olapは、1〜n番目のアミノ酸残基はそれぞれ重ならないという制約を表す。
connは、1〜n番目のアミノ酸残基はそれぞれ繋がっているという制約を表す。
pairは、アミノ酸残基同士の相互作用を表すコスト関数を表す。
ハミルトニアン(Hone)に関し、図3に示すように、アミノ酸残基が2つある場合、以下の式(A)で表されるハミルトニアン(Hone)は、正になる。即ち、アミノ酸残基が2つある場合、この制約条件によるハミルトニアン(Hone)は、全エネルギーを増大させる。
Figure 2021082165
ここで、Cは、重み付けのための係数であり、正の整数である。qiは、「1」又は「0」を取る。qは、「1」又は「0」を取る。
ハミルトニアン(Holap)に関し、図4に示すように、あるアミノ酸残基がある格子点で重なる場合、以下の式(B)で表されるハミルトニアン(Holap)は、正になる。即ち、あるアミノ酸残基がある格子点で重なる場合、この制約条件によるハミルトニアン(Holap)は、全エネルギーを増大させる。
Figure 2021082165
ここで、Cは、重み付けのための係数であり、正の整数である。qiは、「1」又は「0」を取る。qは、「1」又は「0」を取る。
ハミルトニアン(Hconn)に関し、図5に示すように、隣接する2つのアミノ酸残基が繋がっている場合、以下の式(C)で表されるハミルトニアン(Hconn)は、負になる。即ち、隣接する2つのアミノ酸残基が繋がっている場合、この制約条件によるハミルトニアン(Hconn)は、全エネルギーを減少させる。
Figure 2021082165
ここで、Cは、重み付けのための係数であり、正の整数である。qiは、「1」又は「0」を取る。qは、「1」又は「0」を取る。
ハミルトニアン(Hpair)に関し、図6に示すように、隣接する2つのアミノ酸残基同士が相互作用している場合、以下の式(D)で表されるハミルトニアン(Hpair)は、正になる。即ち、隣接する2つのアミノ酸残基同士が相互作用している場合、この制約条件によるハミルトニアン(Holap)は、全エネルギーを増大させる。
Figure 2021082165
ここで、E14は、相互作用に関する係数であり、正の整数である。qiは、「1」又は「0」を取る。qは、「1」又は「0」を取る。相互作用は、2つのアミノ酸残基の組み合わせにより決まり、相互作用は、例えば、miyazawa−jernigan(MJ) matrixなどを参照して決定される。
one及びHolapは、それぞれの制約を満たさないと、全エネルギーを増大させる。即ち、Hone及びHolapは、それぞれの制約を満たさないと、タンパク質の構造を不安定化させる制約である。
一方、Hconnは、通常、その制約を満たさないと、全エネルギーを減少させる。即ち、Hconnは、その制約を満たさないと、タンパク質の構造を安定化させる制約である。
したがって、Hone及びHolapと、Hconnとの関係は、非独立であり、一方の制約を満たすと、他方の制約が満たされにくい。その結果、効率的に安定構造を探索しにくい。
そこで開示の技術では、Hone及びHolapと、Hconnとの関係を独立にし、全ての制約が満たされやすくする。即ち、開示の技術を用いると、複数の制約条件を同時に満たしやすくなる。その結果、開示の技術を用いると、効率的に安定構造を探索することができる。
(構造探索方法、及び構造探索装置)
本件で開示する構造探索方法は、n個の化合物基が連結した化合物の安定構造を探索する方法である。
構造探索方法は、コンピュータを用いた方法である。
構造探索方法は、立体構造を作成する工程と、最小エネルギーを算出する工程とを含み、更に必要に応じて、その他の工程を含む。
本件で開示する構造探索装置は、立体構造を作成するユニットと、最小エネルギーを算出するユニットとを備え、更に必要に応じて、その他のユニットを備える。
構造探索装置は、例えば、メモリと、プロセッサとを有し、更に必要に応じて、その他のユニットを有する。
プロセッサは、メモリに結合されている。
プロセッサは、立体構造を作成する工程を実行するように構成されている。
プロセッサは、最小エネルギーを算出する工程を実行するように構成されている。
プロセッサは、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)又はその組み合わせである。
立体構造を作成する工程では、格子の集合である三次元格子空間の各格子点にn個の化合物基を順次配置し、三次元格子空間に化合物の立体構造を作成する。
立体構造を作成するユニットは、格子の集合である三次元格子空間の各格子点にn個の化合物基を順次配置し、三次元格子空間に化合物の立体構造を作成する。
化合物基としては、例えば、アミノ酸残基である。
化合物基がアミノ酸残基の場合、化合物としては、例えば、タンパク質が挙げられる。
アミノ酸残基の元となるアミノ酸としては、天然アミノ酸であってもよいし、人工アミノ酸であってもよい。天然アミノ酸としては、例えば、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン、β−アラニン、β−フェニルアラニンなどが挙げられる。人工アミノ酸としては、例えば、パラベンゾイルフェニルアラニンなどが挙げられる。
タンパク質におけるアミノ酸残基の数としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、10〜30程度であってもよいし、数百であってもよい。
例えば、中分子創薬を対象とするタンパク質であれば、10〜30程度であってもよい。
最小エネルギーを算出する工程では、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する。
最小エネルギーを算出するユニットは、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する。
ここで、制約条件は、第1制約と、第2制約と、第3制約とを有する。
第1制約は、n個の化合物基のそれぞれは一つしかないという制約である。
第2制約は、n個の化合物基は各格子点において互いに重ならないという制約である。
第3制約は、n個の化合物基の連結に関する制約であって、制約を満たさないときに算出されるイジングモデルのエネルギーを増大させる制約である。
第3制約は、例えば、以下の(1)及び(2)で表される制約である。
(1)ある格子点に化合物基がある場合、ある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基がある。
(2)ある格子点に化合物基がない場合、ある格子点に隣接する全ての格子点の中に化合物基がないか、又はある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基がある。
第3制約の一例は、以下の式(E)で表すことができる。なお、この例は、Diamond encording法について、二次元の場合の例である。
Figure 2021082165
式中、Cは、重みづけのための係数であり、正の整数である。q、q、q、q、qは、それぞれ「1」又は「0」を取る。q、q、q、q、qの位置関係は、図7に示す位置関係である。
η(q)は、qに隣接し、連結する化合物基を表現するビットの集合である。
ここで、qが「1」の場合とは、ある格子点に化合物基がある場合である。そして、qが「1」の場合、Qが「1」のときのみ、Hは「0」となる。図7に示す位置関係の場合、Qが「1」になるのは、q+q+q+q=1の場合である。即ち、q、q、q、及びqの一つのみが「1」となる場合である。よって、Qが「1」になるのは、ある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基がある場合である。
また、qが「0」の場合とは、ある格子点に化合物基がない場合である。そして、qが「0」の場合、Qが「0」のとき又はQが「1」のときに、Hは「0」となる。図7に示す位置関係の場合、Qが「0」になるのは、q+q+q+q=0又は1の場合である。即ち、Qが「0」になるのは、q、q、q、及びqの全てが「0」の場合、又はq、q、q、及びqの一つのみが「1」となる場合である。よって、Qが「0」になるのは、ある格子点に隣接する全ての格子点の中に化合物基がない場合か、又はある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基がある場合である。
図8に、開示の構造探索装置の一例のブロック図を示す。
図8の構造探索装置10は、立体構造を作成するユニット51と、最小エネルギーを算出するユニット51とを有する。
図9に、開示の構造探索装置の構成例を示す。
構造探索装置10は、例えば、制御部11、メモリ12、記憶部13、表示部14、入力部15、出力部16、I/Oインターフェース部17等がシステムバス18を介して接続されて構成される。
制御部11は、演算(四則演算、比較演算等)、ハードウエア及びソフトウエアの動作制御などを行う。
メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)などのメモリである。RAMは、ROM及び記憶部13から読み出されたOS(Operating System)及びアプリケーションプログラムなどを記憶し、制御部11の主メモリ及びワークエリアとして機能する。
記憶部13は、各種プログラム及びデータを記憶する装置であり、例えば、ハードディスクである。記憶部13には、制御部11が実行するプログラム、プログラム実行に必要なデータ、OSなどが格納される。
プログラムは、記憶部13に格納され、メモリ12のRAM(主メモリ)にロードされ、制御部11により実行される。
表示部14は、表示装置であり、例えば、CRTモニタ、液晶パネル等のディスプレイ装置である。
入力部15は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス(例えば、マウス等)などである。
出力部16は、各種データの出力装置であり、例えば、プリンタである。
I/Oインターフェース部17は、各種の外部装置を接続するためのインターフェースである。例えば、CD−ROM、DVD−ROM、MOディスク、USBメモリなどのデータの入出力を可能にする。
図10に、開示の構造探索装置の他の構成例を示す。
図10の構成例は、クラウド型の構成例であり、制御部11が、記憶部13等とは独立している。この構成例では、ネットワークインターフェース部19、20を介して、記憶部13等を格納するコンピュータ30と、制御部11を格納するコンピュータ40とが接続される。
ネットワークインターフェース部19、20は、インターネットを利用して、通信を行うハードウェアである。
図11に、開示の構造探索装置の他の構成例を示す。
図11の構成例は、クラウド型の構成例であり、記憶部13が、制御部11等とは独立している。この構成例では、ネットワークインターフェース部19、20を介して、制御部11等を格納するコンピュータ30と、記憶部13を格納するコンピュータ40とが接続される。
以下、フローチャート等を用いて、開示の技術の一例を説明する。
図12に、タンパク質の安定構造を探索するフローチャートを示す。
<工程S101>
まず、アミノ酸残基の数(n)に基づいて、複数のアミノ酸残基が順次配置される格子の集合である3次元格子空間が定義される(S101)。
ここで、3次元格子空間の定義の一例を説明する。格子空間は三次元であるが、以下では、簡略化のため二次元の場合を例として示す。
まず、ダイアモンド格子空間において半径rにある格子の集合をShellとし、各格子点をSとする。すると、各格子点Sは、図13のように表すことができる。
例えば、1〜5個目のアミノ酸残基の移動先の格子点の集合V〜Vは図14A〜図14Dのようになる。
ここで、図14においては、V=Sであり、V=Sである。
図14Bにおいて、V=Sである。
図14Cにおいて、V=S、Sである。
図14Dにおいて、V=S、Sである。
なお、S、S、Sを三次元で表すと図15のようになる。図15において、A=Sであり、B=Sであり、C=Sである。
そして、n個のアミノ酸残基を有するタンパク質におけるi番目のアミノ酸残基に必要な空間Vは、以下の式で表される。
Figure 2021082165
ここで、i={1,2,3,......n}である。
そして、奇数番目(i=奇数)のアミノ酸残基の場合は、J={1,3,.....i}であり、偶数番目(i=偶数)のアミノ酸残基の場合は、J={2,4,.....i}である。
<工程S102>
次に、i個目のアミノ酸残基の移動先の格子点の集合をVとする(S102)。
以上により、アミノ酸残基が入る空間が定義される。
<工程S103>
次に、各格子点にビットをそれぞれ割り当てる。即ち、各ビットX〜Xに空間の情報を割り振ることが行われる(S103)。具体的には、図16A〜図16Cに示すように、各アミノ酸残基の入る空間に対して、その位置にアミノ酸残基が在ることを1とし、無いことを0として表すビットを割り振る。なお、図16A〜図16Cにおいては、各アミノ酸残基2〜4に対して複数のXに割当てられているが、実際は、一つのアミノ酸残基に対して、一つのビットXが割り当てられる。
<工程S104>
次に、Hone、Holap、Hconn、Hpairを設定し、各格子点に関する制約条件に基づいて変換したイジングモデルを作成する(S104)。
ここで、Diamond encording法において、全エネルギーは、以下のように表現できる。
Figure 2021082165

ここで、Honeは、1〜n番目のアミノ酸はそれぞれ一つしかないという制約(第1制約)を表す。
olapは、1〜n番目のアミノ酸はそれぞれ重ならないという制約(第2制約)を表す。
connは、第3制約を表す。
pairは、アミノ酸同士の相互作用を表すコスト関数である。
one、Holap、及びHpairの一例は、以下の通りである。
なお、以下において説明する図17〜図19A、図19Bにおいて、Xは、番号1のアミノ酸残基が配置可能な位置を表す。
〜Xは、番号2のアミノ酸残基が配置可能な位置を表す。
〜X13は、番号3のアミノ酸残基が配置可能な位置を表す。
14〜X29は、番号4のアミノ酸残基が配置可能な位置を表す。
oneの一例を以下に示す。
Figure 2021082165
上記関数において、X、Xは、「1」又は「0」を取る。即ち、Honeは、図17において、X、X、X、Xのうち、いずれか一つだけ「1」であるため、いずれか二つ以上「1」になっていた場合エネルギーが上がる関数であり、一つだけ「1」であった場合は0になるペナルティーの項である。
なお、上記関数において、λoneは、重み付けのための係数である。
olapの一例を以下に示す。
Figure 2021082165
上記関数において、X、Xは、「1」又は「0」を取る。即ち、Holapは、図18において、Xが「1」のとき、X14が「1」になった場合にペナルティーが発生する項である。
なお、上記関数において、λolapは、重み付けのための係数である。
pairの一例を以下に示す。
Figure 2021082165
上記関数において、X、Xは、「1」又は「0」を取る。即ち、Hpairは、図19A及び図19Bにおいて、Xが「1」のとき、X15が「1」になった場合にXのアミノ酸残基とX15のアミノ酸残基との間に相互作用Pω(x1)ω(x15)が働きエネルギーが下がるという関数である。相互作用Pω(x1)ω(x15)は、2つのアミノ酸残基の組み合わせにより決まり、相互作用Pω(x1)ω(x15)は、例えば、miyazawa−jernigan(MJ) matrixなどを参照して決定される。
第3制約(Hconn)は、n個の化合物基の連結に関する制約であって、制約を満たさないときに算出されるイジングモデルのエネルギーを増大させる制約である。
第1制約及び第2制約は、それぞれの制約を満たさないと、全エネルギーを増大させる。即ち、第1制約及び第2制約は、それぞれの制約を満たさないと、タンパク質の構造を不安定化させる制約である。
第3制約は、その制約を満たさないと、全エネルギーを増大させる。第3制約は、その制約を満たさないと、タンパク質の構造を不安定化させる制約である。
もし、第3制約が、その制約を満たさないと、全エネルギーを減少させる制約である場合、第1制約及び第2制約と、第3制約との関係は非独立となり、一方の制約を満たすと、他方の制約が満たされにくい。その結果、効率的に安定構造を探索しにくい。
しかし、開示の技術では、第3制約は、その制約を満たさないと、全エネルギーを増大させる制約である。そのため、第1制約及び第2制約と、第3制約との関係は独立となり、全ての制約が満たされやすくする。即ち、複数の制約条件を同時に満たして、効率的に安定構造を探索することができる。
第3制約は、例えば、例えば、以下の(1)及び(2)で表される制約である。
(1)ある格子点に化合物基がある場合、ある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基がある。
(2)ある格子点に化合物基がない場合、ある格子点に隣接する全ての格子点の中に化合物基がないか、又はある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基がある。
次に、以下のイジングモデルのエネルギー式を用いた計算を通じて抽出され最適化された、上記各関数における重み係数(例えば、λone、λolap、λconn、λpairなど)に対応した重みファイルは、例えば、行列であり、2X+4Xの場合、図20のような行列のファイルとなる。
作成した重みファイルを用いることで、以下のイジングモデルのエネルギー式を表現できる。
Figure 2021082165
上記の関数において、状態Xi、は、「0」又は「1」であり、「0」は、アミノ酸残基が無いことを意味し、「1」は、アミノ酸残基が存在することを意味する。右辺の1項目のWijは、重み付けのための係数である。
右辺の1項目は、全回路から選択可能な2つの回路の全組み合わせについて、漏れと重複なく、2つの回路の状態と重み値との積を積算したものである。
また、右辺の2項目は、全回路のそれぞれのバイアス値と状態との積を積算したものである。bは、i番目の回路のバイアス値を示している。
<工程S105>
次に、アニーリングマシンにおいて、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する(S105)。
アニーリングマシンとしては、イジングモデルで表されるエネルギー関数について基底状態探索を行なうアニーリング方式を採用するコンピュータであれば特に制限はなく、目的に応じて適宜選択することができる。アニーリングマシンとしては、例えば、量子アニーリングマシン、半導体技術を用いた半導体アニーリングマシン、CPUやGPU(Graphics Processing Unit)を用いてソフトウェアにより実行されるシミュレーテッド・アニーリング(Simulated Annealing)を行うマシンなどが挙げられる。また、アニーリングマシンとしては、例えば、デジタルアニーラ(登録商標)を用いてもよい。
以下に、焼き鈍し法及びアニーリングマシンの一例について説明する。
焼き鈍し法は、乱数値や量子ビットの重ね合わせを用いて確率的に解を求める方法である。以下では最適化したい評価関数の値を最小化する問題を例に説明し、評価関数の値をエネルギーと呼ぶことにする。また、評価関数の値を最大化する場合は、評価関数の符号を変えればよい。
まず、各変数に離散値の一つを代入した初期状態からはじめ、現在の状態(変数の値の組み合わせ)から、それに近い状態(例えば、一つの変数だけ変化させた状態)を選び、その状態遷移を考える。その状態遷移に対するエネルギーの変化を計算し、その値に応じてその状態遷移を採択して状態を変化させるか、採択せずに元の状態を保つかを確率的に決める。エネルギーが下がる場合の採択確率をエネルギーが上がる場合より大きく選ぶと、平均的にはエネルギーが下がる方向に状態変化が起こり、時間の経過とともにより適切な状態へ状態遷移することが期待できる。このため、最終的には最適解又は最適値に近いエネルギーを与える近似解を得られる可能性がある。
もし、これを決定論的にエネルギーが下がる場合に採択とし、上がる場合に不採択とすれば、エネルギーの変化は時間に対して広義単調減少となるが、局所解に到達したらそれ以上変化が起こらなくなってしまう。上記のように離散最適化問題には非常に多数の局所解が存在するために、状態が、ほとんど確実にあまり最適値に近くない局所解に捕まってしまう。したがって、離散最適化問題を解く際には、その状態を採択するかどうかを確率的に決定することが重要である。
焼き鈍し法においては、状態遷移の採択(許容)確率を次のように決めれば、時刻(反復回数)無限大の極限で状態が最適解に到達することが証明されている。
以下では、焼き鈍し法を用いて最適解を求める方法について、順序を追って説明する。
(1)状態遷移に伴うエネルギー変化(エネルギー減少)値(−ΔE)に対して、その状態遷移の許容確率pを、次のいずれかの関数f( )により決める。
Figure 2021082165
Figure 2021082165
Figure 2021082165
ここで、Tは、温度値と呼ばれるパラメータであり、例えば、次のように変化させることができる。
(2)温度値Tを次式で表されるように反復回数tに対数的に減少させる。
Figure 2021082165
ここで、Tは、初期温度値であり問題に応じて、十分大きくとることが望ましい。
(1)の式で表される許容確率を用いた場合、十分な反復後に定常状態に達したとすると、各状態の占有確率は熱力学における熱平衡状態に対するボルツマン分布に従う。
そして、高い温度から徐々に下げていくとエネルギーの低い状態の占有確率が増加するため、十分温度が下がるとエネルギーの低い状態が得られると考えられる。この様子が、材料を焼き鈍したときの状態変化とよく似ているため、この方法は焼き鈍し法(または、疑似焼き鈍し法)と称される。なお、エネルギーが上がる状態遷移が確率的に起こることは、物理学における熱励起に相当する。
図21に焼き鈍し法を行う最適化装置の機能構成の一例を示す。ただし、下記説明では、状態遷移の候補を複数発生させる場合についても述べるが、基本的な焼き鈍し法は、遷移候補を一つずつ発生させるものである。
最適化装置100は、現在の状態S(複数の状態変数の値)を保持する状態保持部111を有する。また、最適化装置100は、複数の状態変数の値のいずれかが変化することによる現在の状態Sからの状態遷移が起こった場合における、各状態遷移のエネルギー変化値{−ΔEi}を計算するエネルギー計算部112を有する。さらに、最適化装置100は、温度値Tを制御する温度制御部113、状態変化を制御するための遷移制御部114を有する。
遷移制御部114は、温度値Tとエネルギー変化値{−ΔEi}と乱数値とに基づいて、エネルギー変化値{−ΔEi}と熱励起エネルギーとの相対関係によって複数の状態遷移のいずれかを受け入れるか否かを確率的に決定する。
ここで、遷移制御部114は、状態遷移の候補を発生する候補発生部114a、各候補に対して、そのエネルギー変化値{−ΔEi}と温度値Tとから状態遷移を許可するかどうかを確率的に決定するための可否判定部114bを有する。さらに、遷移制御部114は、可となった候補から採用される候補を決定する遷移決定部114c、及び確率変数を発生させるための乱数発生部114dを有する。
最適化装置100における、一回の反復における動作は次のようなものである。
まず、候補発生部114aは、状態保持部111に保持された現在の状態Sから次の状態への状態遷移の候補(候補番号{Ni})を一つまたは複数発生する。次に、エネルギー計算部112は、現在の状態Sと状態遷移の候補を用いて候補に挙げられた各状態遷移に対するエネルギー変化値{−ΔEi}を計算する。可否判定部114bは、温度制御部113で発生した温度値Tと乱数発生部114dで生成した確率変数(乱数値)を用い、各状態遷移のエネルギー変化値{−ΔEi}に応じて、上記(1)の式の許容確率でその状態遷移を許容する。
そして、可否判定部114bは、各状態遷移の可否{fi}を出力する。許容された状態遷移が複数ある場合には、遷移決定部114cは、乱数値を用いてランダムにそのうちの一つを選択する。そして、遷移決定部114cは、選択した状態遷移の遷移番号Nと、遷移可否fを出力する。許容された状態遷移が存在した場合、採択された状態遷移に応じて状態保持部111に記憶された状態変数の値が更新される。
初期状態から始めて、温度制御部113で温度値を下げながら上記反復を繰り返し、一定の反復回数に達する、又はエネルギーが一定の値を下回る等の終了判定条件が満たされたときに動作が終了する。最適化装置100が出力する答えは、終了時の状態である。
図22は、候補を一つずつ発生させる通常の焼き鈍し法における遷移制御部、特に可否判定部のために必要な演算部分の構成例の回路レベルのブロック図である。
遷移制御部114は、乱数発生回路114b1、セレクタ114b2、ノイズテーブル114b3、乗算器114b4、比較器114b5を有する。
セレクタ114b2は、各状態遷移の候補に対して計算されたエネルギー変化値{−ΔEi}のうち、乱数発生回路114b1が生成した乱数値である遷移番号Nに対応するものを選択して出力する。
ノイズテーブル114b3の機能については後述する。ノイズテーブル114b3として、例えば、RAM、フラッシュメモリ等のメモリを用いることができる。
乗算器114b4は、ノイズテーブル114b3が出力する値と、温度値Tとを乗算した積(前述した熱励起エネルギーに相当する)を出力する。
比較器114b5は、乗算器114b4が出力した乗算結果と、セレクタ114b2が選択したエネルギー変化値である−ΔEとを比較した比較結果を遷移可否fとして出力する。
図22に示されている遷移制御部114は、基本的に前述した機能をそのまま実装するものであるが、(1)の式で表される許容確率で状態遷移を許容するメカニズムについて、更に詳細に説明する。
許容確率pで1を、(1−p)で0を出力する回路は、2つの入力A,Bを持ち、A>Bのとき1を出力し、A<Bのとき0を出力する比較器の入力Aに許容確率pを、入力Bに区間[0,1)の値をとる一様乱数を入力することで実現することができる。したがって、この比較器の入力Aに、エネルギー変化値と温度値Tにより(1)の式を用いて計算される許容確率pの値を入力すれば、上記の機能を実現することができる。
すなわち、fを(1)の式で用いる関数、uを区間[0,1)の値をとる一様乱数とするとき、f(ΔE/T)がuより大きいとき1を出力する回路により、上記の機能を実現できる。
また、次のような変形を行っても、上記の機能と同じ機能が実現できる。
2つの数に同じ単調増加関数を作用させても大小関係は変化しない。したがって、比較器の2つの入力に同じ単調増加関数を作用させても出力は変わらない。この単調増加関数として、fの逆関数f−1を採用すると、−ΔE/Tがf−1(u)より大きいとき1を出力する回路とすることができることがわかる。さらに、温度値Tが正であることから、−ΔEがTf−1(u)より大きいとき1を出力する回路でよいことがわかる。
図22中のノイズテーブル114b3はこの逆関数f−1(u)を実現するための変換テーブルであり、区間[0,1)を離散化した入力に対して次の関数の値を出力するテーブルである。
Figure 2021082165
Figure 2021082165
遷移制御部114には、判定結果等を保持するラッチやそのタイミングを発生するステートマシン等も存在するが、図22では図示を簡単にするため省略されている。
図23は、遷移制御部114の動作フローの一例を示す図である。図23に示す動作フローは、一つの状態遷移を候補として選ぶステップ(S0001)、その状態遷移に対するエネルギー変化値と温度値と乱数値の積の比較で状態遷移の可否を決定するステップ(S0002)、状態遷移が可ならばその状態遷移を採用し、否ならば不採用とするステップ(S0003)を有する。
<工程S106>
工程S106では、算出結果を出力する。結果は、タンパク質の立体構造図として出力してもよいし、タンパク質を構成する各アミノ酸残基の座標情報として出力してもよい。
図24に、構造探索装置の記憶部のデータ構成例を示す。
図25に、データ構成例に対応した処理フローを示す。
図25に示す処理フローでは、まず、S201において、第1制約を構築する。ここでの第1制約は、以下のように表される。
<第1制約>
Figure 2021082165
続いて、S202において、第2制約を構築する。ここでの第2制約は、以下のように表される。
<第2制約>
Figure 2021082165
続いて、S203において、第3制約を構築する。ここでの第3制約は、以下のように表される。
<第3制約>
Figure 2021082165
続いて、S204において、隣接する2つの化合物基の相互作用を踏まえたコスト関数を構築する。ここでのコスト関数は、以下のように表される。
<コスト関数>
Figure 2021082165
続いて、S205において、構築された第1制約、第2制約、第3制約、及びコスト関数を用いて、アニーリングマシンにおいて、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行する。そして、得られたエネルギーを記憶部のEに保存し、得られた構造を記憶部のCPに保存する。
なお、開示の構造探索方法における第3制約に対して、従来技術でのハミルトニアン(Hconn)は、例えば、以下のように表される。
Figure 2021082165
(プログラム)
開示の構造探索プログラムは、コンピュータに、開示の構造探索方法を実行させるプログラムである。
構造探索プログラムにおいて、構造探索方法の実行における態様は、開示の構造探索方法における態様と同じである。
プログラムは、使用するコンピュータシステムの構成及びオペレーティングシステムの種類・バージョンなどに応じて、公知の各種のプログラム言語を用いて作成することができる。
プログラムは、内蔵ハードディスク、外付けハードディスクなどの記録媒体に記録しておいてもよいし、CD−ROM(Compact Disc Read Only Memory)、DVD−ROM(Digital Versatile Disk Read Only Memory)、MOディスク(Magneto−Optical disk)、USBメモリ〔USB(Universal Serial Bus) flash drive〕などの記録媒体に記録しておいてもよい。プログラムをCD−ROM、DVD−ROM、MOディスク、USBメモリなどの記録媒体に記録する場合には、必要に応じて随時、コンピュータシステムが有する記録媒体読取装置を通じて、これを直接、又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータ等)にプログラムを記録しておき、必要に応じて随時、外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することもできる。
プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。
(記録媒体)
開示の記録媒体は、開示の構造探索プログラムを記録してなる。
開示の記録媒体は、コンピュータが読み取り可能である。
開示の記録媒体は、一過性であってもよいし、非一過性であってもよい。
開示の記録媒体は、例えば、開示の構造探索方法をコンピュータに実行させるプログラムを記録した記録媒体である。
記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、CD−ROM、DVD−ROM、MOディスク、USBメモリなどが挙げられる。
記録媒体は、プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。
以下、本発明の具体的な実施例について説明する。なお、本発明は、これらの実施例に限定されるものではない。
(比較例1)
タンパク質Chignolinの粗視化格子モデルの安定構造探索を、図12のフローチャートに従って行った。
制約条件としてHone、olap、Hconn、コスト関数としてHpairを設定した。Diamond encording法における全エネルギーは、以下のように表現できる。
Figure 2021082165
ここで、Honeは、1〜n番目のアミノ酸残基はそれぞれ一つしかないという制約である。
olapは、1〜n番目のアミノ酸残基はそれぞれ重ならないという制約である。
connは、1〜n番目のアミノ酸残基はそれぞれ繋がっているという制約である。
pairは、アミノ酸残基同士の相互作用を表すコスト関数である。
制約条件を決めるパラメータ3個の取り得るパターン(各パラメータが5〜30まで、5の整数倍の値を取る場合)216個のうち、最安定構造を探索できるパターンは2個のみであった。
その2個のパターンのそれぞれについて、アニーリングマシンを用いて、アニーリングのIteration数30万の探索を20回行い、E(x)の最低値を求めた結果、最安定構造に達したものは1回のみであった。
(実施例1)
比較例1において、Hconnを、開示の技術の第3制約に代えた以外は、比較例1と同様にして、タンパク質Chignolinの粗視化格子モデルの安定構造探索を、図12のフローチャートに従って行った。
ここでの第3制約は以下の(1)及び(2)で表される制約である。
(1A)ある格子点にアミノ酸残基がある場合、ある格子点に隣接する全ての格子点の中の一つの格子点のみにアミノ酸残基がある。
(2)ある格子点にアミノ酸残基がない場合、ある格子点に隣接する全ての格子点の中にアミノ酸残基がないか、又はある格子点に隣接する全ての格子点の中の一つの格子点のみにアミノ酸残基がある。
制約条件を決めるパラメータ3個の取り得るパターン(各パラメータが5〜30まで、5の整数倍の値を取る場合)216個の全てで、最安定構造を探索可能であった。
216個のパターンのぞれぞれについて、アニーリングマシンを用いて、アニーリングのIteration数30万の探索を20回行い、E(x)の最低値を求めた結果、全てが最安定構造に達した。
比較例1と実施例1との対比から、開示の技術では、効率的に安定構造を探索できることが確認できた。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
n個の化合物基が連結した化合物の安定構造を探索する、コンピュータによる構造探索方法であって、
格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成する工程と、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する工程と、
を含み、
前記制約条件が、
前記n個の化合物基のそれぞれは一つしかないという第1制約と、
前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、
前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、
を有する、
ことを特徴とする構造探索方法。
(付記2)
前記第3制約が、
前記ある格子点に化合物基がある場合、前記ある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基があり、
前記ある格子点に化合物基がない場合、前記ある格子点に隣接する前記全ての格子点の中に化合物基がないか、又は前記ある格子点に隣接する前記全ての格子点の中の一つの格子点のみに化合物基がある、
という制約である、
付記1に記載の構造探索方法。
(付記3)
前記化合物が、タンパク質であり、前記化合物基が、アミノ酸残基である付記1から2のいずれかに記載の構造探索方法。
(付記4)
n個の化合物基が連結した化合物の安定構造を探索する構造探索プログラムであって、
コンピュータに、
格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成する工程と、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する工程と、
を実行させることを含み、
前記制約条件が、
前記n個の化合物基のそれぞれは一つしかないという第1制約と、
前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、
前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、
を有する、
ことを特徴とする構造探索プログラム。
(付記5)
前記第3制約が、
前記ある格子点に化合物基がある場合、前記ある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基があり、
前記ある格子点に化合物基がない場合、前記ある格子点に隣接する前記全ての格子点の中に化合物基がないか、又は前記ある格子点に隣接する前記全ての格子点の中の一つの格子点のみに化合物基がある、
という制約である、
付記4に記載の構造探索プログラム。
(付記6)
前記化合物が、タンパク質であり、前記化合物基が、アミノ酸残基である付記4から5のいずれかに記載の構造探索プログラム。
(付記7)
n個の化合物基が連結した化合物の安定構造を探索する構造探索装置であって、
格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成するユニットと、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出するユニットと、
を含み、
前記制約条件が、
前記n個の化合物基のそれぞれは一つしかないという第1制約と、
前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、
前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、
を有する、
ことを特徴とする構造探索装置。
(付記8)
前記第3制約が、
前記ある格子点に化合物基がある場合、前記ある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基があり、
前記ある格子点に化合物基がない場合、前記ある格子点に隣接する前記全ての格子点の中に化合物基がないか、又は前記ある格子点に隣接する前記全ての格子点の中の一つの格子点のみに化合物基がある、
という制約である、
付記7に記載の構造探索装置。
(付記9)
前記化合物が、タンパク質であり、前記化合物基が、アミノ酸残基である付記7から8のいずれかに記載の構造探索装置。
10 構造探索装置
11 制御部
12 メモリ
13 記憶部
14 表示部
15 入力部
16 出力部
17 I/Oインターフェース部
18 システムバス
19 ネットワークインターフェース部
20 ネットワークインターフェース部
30 コンピュータ
40 コンピュータ

Claims (5)

  1. n個の化合物基が連結した化合物の安定構造を探索する、コンピュータによる構造探索方法であって、
    格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成する工程と、
    前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する工程と、
    を含み、
    前記制約条件が、
    前記n個の化合物基のそれぞれは一つしかないという第1制約と、
    前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、
    前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、
    を有する、
    ことを特徴とする構造探索方法。
  2. 前記第3制約が、
    前記ある格子点に化合物基がある場合、前記ある格子点に隣接する全ての格子点の中の一つの格子点のみに化合物基があり、
    前記ある格子点に化合物基がない場合、前記ある格子点に隣接する前記全ての格子点の中に化合物基がないか、又は前記ある格子点に隣接する前記全ての格子点の中の一つの格子点のみに化合物基がある、
    という制約である、
    請求項1に記載の構造探索方法。
  3. 前記化合物が、タンパク質であり、前記化合物基が、アミノ酸残基である請求項1から2のいずれかに記載の構造探索方法。
  4. n個の化合物基が連結した化合物の安定構造を探索する構造探索プログラムであって、
    コンピュータに、
    格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成する工程と、
    前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する工程と、
    を実行させることを含み、
    前記制約条件が、
    前記n個の化合物基のそれぞれは一つしかないという第1制約と、
    前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、
    前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、
    を有する、
    ことを特徴とする構造探索プログラム。
  5. n個の化合物基が連結した化合物の安定構造を探索する構造探索装置であって、
    格子の集合である三次元格子空間の各格子点に前記n個の化合物基を順次配置し、前記三次元格子空間に前記化合物の立体構造を作成するユニットと、
    前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出するユニットと、
    を含み、
    前記制約条件が、
    前記n個の化合物基のそれぞれは一つしかないという第1制約と、
    前記n個の化合物基は前記各格子点において互いに重ならないという第2制約と、
    前記n個の化合物基の連結に関する制約であって、前記制約を満たさないときに算出される前記イジングモデルのエネルギーを増大させる第3制約と、
    を有する、
    ことを特徴とする構造探索装置。
JP2019211007A 2019-11-22 2019-11-22 構造探索方法、構造探索プログラム、及び構造探索装置 Pending JP2021082165A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2019211007A JP2021082165A (ja) 2019-11-22 2019-11-22 構造探索方法、構造探索プログラム、及び構造探索装置
US17/070,965 US20210158891A1 (en) 2019-11-22 2020-10-15 Structure search method and structure search apparatus
EP20202456.8A EP3826022A1 (en) 2019-11-22 2020-10-18 Structure search method, structure search apparatus, and program
CN202011210162.XA CN112837763A (zh) 2019-11-22 2020-11-03 结构搜索方法、结构搜索设备和记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019211007A JP2021082165A (ja) 2019-11-22 2019-11-22 構造探索方法、構造探索プログラム、及び構造探索装置

Publications (1)

Publication Number Publication Date
JP2021082165A true JP2021082165A (ja) 2021-05-27

Family

ID=72943907

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019211007A Pending JP2021082165A (ja) 2019-11-22 2019-11-22 構造探索方法、構造探索プログラム、及び構造探索装置

Country Status (4)

Country Link
US (1) US20210158891A1 (ja)
EP (1) EP3826022A1 (ja)
JP (1) JP2021082165A (ja)
CN (1) CN112837763A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4148738A1 (en) 2021-09-13 2023-03-15 Fujitsu Limited Search program, search method, and search device
EP4293674A1 (en) 2022-06-16 2023-12-20 Fujitsu Limited Stable structure search system, stable structure search method, and stable structure search program
WO2023249117A1 (ja) * 2022-06-24 2023-12-28 東芝デジタルソリューションズ株式会社 アロステリック経路予測装置、アロステリック経路予測結果取得方法、アロステリック経路予測方法、及びプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7547799B2 (ja) * 2020-06-05 2024-09-10 富士通株式会社 構造探索方法、構造探索装置、構造探索用プログラム、及び相互作用ポテンシャル特定方法
CN114446391A (zh) * 2022-02-07 2022-05-06 上海图灵智算量子科技有限公司 一种基于量子退火的蛋白质折叠方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6476292B2 (ja) * 2015-06-09 2019-02-27 株式会社日立製作所 情報処理装置及びその制御方法
WO2017186786A1 (en) * 2016-04-27 2017-11-02 Within Technologies Ltd. Method and system for generating lattice recommendations in computer aided design applications
CN107563104B (zh) * 2017-10-18 2020-01-24 安庆师范大学 基于模拟退火优化算法的二元团簇结构优化方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4148738A1 (en) 2021-09-13 2023-03-15 Fujitsu Limited Search program, search method, and search device
EP4293674A1 (en) 2022-06-16 2023-12-20 Fujitsu Limited Stable structure search system, stable structure search method, and stable structure search program
WO2023249117A1 (ja) * 2022-06-24 2023-12-28 東芝デジタルソリューションズ株式会社 アロステリック経路予測装置、アロステリック経路予測結果取得方法、アロステリック経路予測方法、及びプログラム

Also Published As

Publication number Publication date
CN112837763A (zh) 2021-05-25
US20210158891A1 (en) 2021-05-27
EP3826022A1 (en) 2021-05-26

Similar Documents

Publication Publication Date Title
JP2021082165A (ja) 構造探索方法、構造探索プログラム、及び構造探索装置
JP7251281B2 (ja) 結合構造探索装置、結合構造探索方法、及び結合構造探索プログラム
Javadi-Abhari et al. Quantum computing with Qiskit
Khammassi et al. OpenQL: A portable quantum programming framework for quantum accelerators
JP7176381B2 (ja) 環状分子の構造探索方法、及び構造探索装置、並びにプログラム
Tyka et al. Efficient sampling of protein conformational space using fast loop building and batch minimization on highly parallel computers
JP2020194488A (ja) 材料特性予測装置、材料特性予測方法、及び材料特性予測プログラム
JP2020042576A (ja) 化合物探索装置、化合物探索方法、及び化合物探索プログラム
Thompson et al. Exploiting domain knowledge in system-level MPSoC design space exploration
JP7547799B2 (ja) 構造探索方法、構造探索装置、構造探索用プログラム、及び相互作用ポテンシャル特定方法
CN112149269A (zh) 优化设备、优化设备的控制方法和记录介质
Olson et al. Comparison between self‐guided langevin dynamics and molecular dynamics simulations for structure refinement of protein loop conformations
Schmid et al. Computational capabilities and compiler development for neutral atom quantum processors—connecting tool developers and hardware experts
JP2006139427A (ja) データフローグラフの同一サブグラフ検出装置、高位合成装置、データフローグラフの同一サブグラフ検出方法、データフローグラフの同一サブグラフ検出制御プログラムおよび可読記録媒体
De Micheli et al. Advances in quantum computation and quantum technologies: A design automation perspective
Song et al. DeepSpeed4Science Initiative: Enabling Large-Scale Scientific Discovery through Sophisticated AI System Technologies
JP7323796B2 (ja) 最適化装置、最適化方法及び最適化プログラム
Gil et al. Expressive reusable workflow templates
JP7268484B2 (ja) 構造探索装置、構造探索方法、及び構造探索プログラム
Peng et al. PGVL Hub: an integrated desktop tool for medicinal chemists to streamline design and synthesis of chemical libraries and singleton compounds
JP2008158781A (ja) シミュレーションシステム
JP2022062322A (ja) 構造探索プログラム、構造探索装置、及び構造探索方法
Lin et al. A tabu search algorithm for maximum parsimony phylogeny inference
Bhuva et al. Evolutionary algorithms for cardinality-constrained Ising models
JP2021117663A (ja) 類似度計算装置、類似度計算方法、及びプログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220601