JP7139805B2 - 化合物探索装置、化合物探索方法、及び化合物探索プログラム - Google Patents

化合物探索装置、化合物探索方法、及び化合物探索プログラム Download PDF

Info

Publication number
JP7139805B2
JP7139805B2 JP2018169832A JP2018169832A JP7139805B2 JP 7139805 B2 JP7139805 B2 JP 7139805B2 JP 2018169832 A JP2018169832 A JP 2018169832A JP 2018169832 A JP2018169832 A JP 2018169832A JP 7139805 B2 JP7139805 B2 JP 7139805B2
Authority
JP
Japan
Prior art keywords
compound
lattice
lattice space
space
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018169832A
Other languages
English (en)
Other versions
JP2020042576A (ja
Inventor
泰紀 上村
崇之 柴▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018169832A priority Critical patent/JP7139805B2/ja
Priority to US16/534,650 priority patent/US11837323B2/en
Priority to CN201910783431.2A priority patent/CN110890126B/zh
Publication of JP2020042576A publication Critical patent/JP2020042576A/ja
Application granted granted Critical
Publication of JP7139805B2 publication Critical patent/JP7139805B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Physiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Epidemiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Artificial Intelligence (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Description

本発明は、化合物探索装置、化合物探索方法、及び化合物探索プログラムに関する。
タンパク質は、アミノ酸が1次元的に枝分かれすることなくつながった鎖状の高分子である。タンパク質は、その鎖状の高分子が折り畳まれることによって、特定の立体構造(三次元形状)をしている。そして、タンパク質の立体構造は、アミノ酸の配列によって決まる。
タンパク質の立体構造は、タンパク質の機能に深く関連している。タンパク質の分子認識機能は、立体構造中の特定の領域が特定の分子と特異的に結合することによって実現されている。そのため、タンパク質の立体構造を求めることはタンパク質の機能を理解する上で重要である。
タンパク質の立体構造は、例えば、X線結晶解析や、核磁気共鳴(NMR:Nuclear Magnetic Resonance spectroscopy)によって求めることができる。しかし、X線結晶解析やNMRによって一つのタンパク質の立体構造を決定するには長い時間を要する。また、X線結晶解析においては、まず一種類のタンパク質の単結晶を作る必要があるが、この単結晶が作成できない場合、当該タンパク質の立体構造についてX線結晶解析ができない。また、NMRでは結晶化の必要はなく、水溶液中の立体構造を求めることができるが、大きなタンパク質では立体構造に関する多くの情報が得られない。
一方、タンパク質の立体構造が不明であっても、タンパク質のアミノ酸配列は、遺伝子情報から、又はタンパク質自体から、比較的簡単に求めることができる。
そこで、アミノ酸配列からタンパク質の立体構造を予測しようとする試みがなされている。例えば、タンパク質の折り畳みをDiamond encording法によって求める方法がある。この方法は、鎖状のアミノ酸がどの位置にあるのかをダイアモンド格子上に埋め込んでいく手法であり、三次元の構造体(立体構造)が表現できる。この方法を用いて求めた立体構造のエネルギーは、例えば、イジングモデルを用いて算出することができる。そして、イジングモデルを解くには、例えば、アニーリングマシンが用いられる。
R. Babbush et.al., Construction of Energy Functions for Lattice Heteropolymer Models: A Case Study in Constraint Satisfaction Programmisng and Adiabatic Quantum Optimization, Advances in Chemical Physics, 155, 201-244
イジングモデルを解くアニーリングマシンには、ハードウェアの制約により、扱える演算ビット、又は量子ビットの数に制約が存在する。
一方で、タンパク質の折り畳み問題を解くために必要なビット数は、タンパク質の規模(アミノ酸残基の数)に対して、図1のグラフのように指数関数的に増加する。
このように、ハードウェアで扱えるビットの数の制約により解ける問題規模が制限され、アミノ酸の探索対象を広げることができない。
本発明は、所定の化合物の探索に必要な演算ビット又は量子ビットの数を抑制することができ、大きい分子量の化合物の探索が可能となる、化合物探索装置、化合物探索方法、及び化合物探索プログラムを提供することを目的とする。
1つの態様では、開示の化合物探索装置は、
複数の化合物基が連結した化合物を探索する化合物探索装置において、
前記複数の化合物基が順次配置される格子の集合である格子空間を定義する定義部と、
前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成する制限部と、
前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てる割当部と、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する演算部と、
を有する。
他の1つの態様では、開示の化合物探索方法は、
複数の化合物基が連結した化合物を探索する化合物探索方法において、
コンピュータが、
前記複数の化合物基が順次配置される格子の集合である格子空間を定義し、
前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成し、
前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当て、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する。
他の1つの態様では、開示の化合物探索プログラムは、
複数の化合物基が連結した化合物を探索する化合物探索プログラムにおいて、
コンピュータに、
前記複数の化合物基が順次配置される格子の集合である格子空間を定義させ、
前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成させ、
前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てさせ、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出させる。
一つの側面では、所定の化合物の探索に必要な演算ビット又は量子ビットの数を抑制することができ、大きい分子量の化合物の探索が可能となる化合物探索装置を提供できる。
また、一つの側面では、所定の化合物の探索に必要な演算ビット又は量子ビットの数を抑制することができ、大きい分子量の化合物の探索が可能となる化合物探索方法を提供できる。
また、一つの側面では、所定の化合物の探索に必要な演算ビット又は量子ビットの数を抑制することができ、大きい分子量の化合物の探索が可能となる化合物探索プログラムを提供できる。
図1は、アミノ酸残基の数と、必要なbit数との関係を表すグラフである。 図2Aは、タンパク質の安定構造を探索するための模式図である(その1)。 図2Bは、タンパク質の安定構造を探索するための模式図である(その2)。 図2Cは、タンパク質の安定構造を探索するための模式図である(その3)。 図3Aは、Diamond encording法を説明するための模式図である(その1)。 図3Bは、Diamond encording法を説明するための模式図である(その2)。 図3Cは、Diamond encording法を説明するための模式図である(その3)。 図3Dは、Diamond encording法を説明するための模式図である(その4)。 図3Eは、Diamond encording法を説明するための模式図である(その5)。 図4は、開示の技術において格子空間を制限した状態の概念図である。 図5は、開示の化合物探索装置の構成例である。 図6は、図5の化合物探索装置10Aを用いてタンパク質の安定構造を探索する方法を示すフローチャートである。 図7は、半径rにある各格子をSとした場合を表す図である。 図8Aは、制限格子空間を生成しない場合のアミノ酸残基の移動先の格子点の集合を表す図である(その1)。 図8Bは、制限格子空間を生成しない場合のアミノ酸残基の移動先の格子点の集合を表す図である(その2)。 図8Cは、制限格子空間を生成しない場合のアミノ酸残基の移動先の格子点の集合を表す図である(その3)。 図8Dは、制限格子空間を生成しない場合のアミノ酸残基の移動先の格子点の集合を表す図である(その4)。 図9は、S、S、Sを三次元で表した図である。 図10Aは、各ビットX~Xに空間の情報を割り振る様子の一例である(その1)。 図10Bは、各ビットX~Xに空間の情報を割り振る様子の一例である(その2)。 図10Cは、各ビットX~Xに空間の情報を割り振る様子の一例である(その3)。 図11は、Honeを説明するための図である。 図12は、Hconnを説明するための図である。 図13は、Holapを説明するための図である。 図14Aは、Hpairを説明するための図である(その1)。 図14Bは、Hpairを説明するための図である(その2)。 図15は、重みファイルの一例である。 図16は、焼き鈍し法に用いる最適化装置(演算部)の概念的構成を示す図である。 図17は、遷移制御部の回路レベルのブロック図である。 図18は、遷移制御部の動作フローを示す図である。 図19は、開示の化合物探索装置の他の構成例である。 図20は、開示の化合物探索装置の他の構成例である。 図21は、図20の化合物探索装置10Cを用いてタンパク質の安定構造を探索する方法を示すフローチャートである。 図22は、直鎖数制限パラメータMを設定した場合の、アミ酸残基の配列の制限を説明するための図である(その1)。 図23は、直鎖数制限パラメータMを設定した場合の、アミ酸残基の配列の制限を説明するための図である(その2)。 図24は、開示の化合物探索装置の他の構成例である。 図25は、図24の化合物探索装置10Dを用いてタンパク質の安定構造を探索する方法を示すフローチャートである。 図26は、直鎖数制限パラメータMを用いた場合の最大空間を説明するための図である。 図27は、必要なbit数を対比したグラフである。
(化合物探索装置、化合物探索方法、化合物探索プログラム)
開示の化合物探索装置は、複数の化合物基が連結した化合物を探索する化合物探索装置である。
化合物探索装置は、定義部と、制限部と、割当部と、演算部とを少なくとも有する。
定義部は、複数の化合物基が順次配置される格子の集合である格子空間を定義する。
制限部は、複数の化合物基のいずれかを格子空間のいずれかの格子に配置後、次の化合物基を格子空間に配置する場合において、格子空間から次の化合物基を配置すべきでない領域を除外した制限格子空間を生成する。
割当部は、制限格子空間に複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てる。
演算部は、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する。
開示の化合物探索方法は、複数の化合物基が連結した化合物を探索する化合物探索方法である。
化合物探索方法においては、コンピュータが、複数の化合物基が順次配置される格子の集合である格子空間を定義し、複数の化合物基のいずれかを格子空間のいずれかの格子に配置後、次の化合物基を格子空間に配置する場合において、格子空間から次の化合物基を配置すべきでない領域を除外した制限格子空間を生成し、制限格子空間に複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当て、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する。
開示の化合物探索プログラムは、複数の化合物基が連結した化合物を探索する化合物探索プログラムである。
化合物探索プログラムにおいては、コンピュータに、複数の化合物基が順次配置される格子の集合である格子空間を定義させ、複数の化合物基のいずれかを格子空間のいずれかの格子に配置後、次の化合物基を格子空間に配置する場合において、格子空間から次の化合物基を配置すべきでない領域を除外した制限格子空間を生成させ、制限格子空間に複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てさせ、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出させる。
開示の技術の詳細を説明する前に、化合物であるタンパク質の折り畳みをDiamond encording法によって求める方法について、説明する。
タンパク質の安定構造の探索は、通常、以下の手順で行われる。
まず、タンパク質の粗視化を行う(図2A)。タンパク質の粗視化は、例えば、タンパク質を構成する原子2を、アミノ酸残基単位1A、1B、1Cに粗視化することで行う。
次に、作成した粗視化モデルを用いて構造探索を行う(図2B)。構造探索は、後述するDiamond encording法によって行う。
次に、粗視化モデルを全原子に戻す(図2C)。
Diamond encording法は、鎖状のアミノ酸がどの位置にあるのかをダイアモンド格子上に埋め込んでいく手法であり、三次元の構造体が表現できる。以下では、簡略化のため二次元の場合を例として示す。
直線構造で表した場合に、5つのアミノ酸残基が結合した図3Aの構造を持つ直鎖ペンタペプチドを例として、考える。図3A~図3Eにおいて、丸の中の番号は、直鎖ペンタペプチドにおけるアミノ酸残基の番号を表す。
まず、ダイアモンド格子の中心に、番号1のアミノ酸残基を配置すると、図3Aに示すように、番号2のアミノ酸残基の配置可能な場所は、中心に隣接する図3Bに示す場所(番号2が付された場所)に限定される。
次に、番号2のアミノ酸残基に結合する番号3のアミノ酸残基の配置可能な場所は、図3Cにおいて、図3Bにおいて番号2が付された場所に隣接する場所(番号3が付された場所)に限定される。
次に、番号3のアミノ酸残基に結合する番号4のアミノ酸残基の配置可能な場所は、図3Dにおいて、図3Cにおいて番号3が付された場所に隣接する場所(番号4が付された場所)に限定される。
次に、番号4のアミノ酸残基に結合する番号5のアミノ酸残基の配置可能な場所は、図3Eにおいて、図3Dにおいて番号4が付された場所に隣接する場所(番号5が付された場所)に限定される。
このようにして、配置可能な場所をつないでいくことで、三次元の構造体が表現できる。
ここで、アミノ酸残基が直線状に結合していくと、結合させるアミノ酸残基の数(n)に応じて、半径(n)のダイアモンド格子空間を設定する必要がある。
しかし、タンパク質においては、通常、アミノ酸残基同士の相互作用によって、アミノ酸残基が直鎖状に並ぶことはほとんどない。
そのため、図4に示すように、ダイアモンド格子空間の半径rを、アミノ酸残基の数(n)に一致させなくとも、タンパク質の立体構造を求めることができる。
そこで、開示の技術においては、複数の化合物基(例えば、アミノ酸残基)のいずれかを格子空間のいずれかの格子に配置後、次の化合物基を格子空間に配置する場合において、格子空間から次の化合物基を配置すべきでない領域を除外した制限格子空間を生成し、その制限格子空間に複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てる。そうすることで、所定の化合物の探索に必要な演算ビット又は量子ビットの数を抑制することができ、大きい分子量の化合物の探索が可能となる。
化合物基としては、例えば、アミノ酸残基である。
化合物基がアミノ酸残基の場合、化合物としては、例えば、タンパク質が挙げられる。
アミノ酸残基の元となるアミノ酸としては、天然アミノ酸であってもよいし、人工アミノ酸であってもよい。天然アミノ酸としては、例えば、アラニン、アルギニン、アスパラギン、アスパラギン酸、システイン、グルタミン、グルタミン酸、グリシン、ヒスチジン、イソロイシン、ロイシン、リシン、メチオニン、フェニルアラニン、プロリン、セリン、トレオニン、トリプトファン、チロシン、バリン、β-アラニン、β-フェニルアラニンなどが挙げられる。人工アミノ酸としては、例えば、パラベンゾイルフェニルアラニンなどが挙げられる。
タンパク質におけるアミノ酸残基の数としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、10~30程度であってもよいし、数百であってもよい。
例えば、中分子創薬を対象とするタンパク質であれば、10~30程度であってもよい。
以下、装置例、フローチャート等を用いて、開示の技術の一例を説明する。
化合物探索装置の構成例を図5に示す。
図5に示す化合物探索装置10Aは、化合物基数カウント部11と、定義部12と、制限部13と、割当部14と、H生成部15と、重み抽出部16と、重みファイル作成部17と、演算部18と、出力部19とを有する。
図6に、図5の化合物探索装置10Aを用いてタンパク質の安定構造を探索するフローチャートを示す。
まず、化合物基数カウント部11では、入力されたタンパク質(アミノ酸酸残基の配列)を構成するアミノ酸残基(化合物基)の数(n)がカウントされる(S101)。
次に、定義部12では、アミノ酸残基の数(n)に基づいて、複数のアミノ酸残基が順次配置される格子の集合である格子空間が定義される(S102)。
ここで、格子空間の定義の一例を説明する。格子空間は三次元であるが、以下では、簡略化のため二次元の場合を例として示す。
まず、ダイアモンド格子空間において半径rにある格子の集合をShellとし、各格子点をSとする。すると、各格子点Sは、図7のように表すことができる。
ここで、開示の技術と異なり、制限格子空間を生成しない場合、例えば、1~5個目のアミノ酸残基の移動先の格子点の集合V~Vは図8A~図8Dのようになる。
ここで、図8Aにおいては、V=Sであり、V=Sである。
図8Bにおいて、V=Sである。
図8Cにおいて、V=S2、である。
図8Dにおいて、V=S3、である。
なお、S、S、Sを三次元で表すと図9のようになる。図9において、A=S1であり、B=Sであり、C=Sである。
そして、制限格子空間を生成しない場合、n個のアミノ酸残基を有するタンパク質におけるi番目のアミノ酸残基に必要な空間Vは、以下の式で表される。
Figure 0007139805000001
ここで、i={1,2,3,......n}である。
そして、奇数番目(i=奇数)のアミノ酸残基の場合は、J={1,3,.....i}であり、偶数番目(i=偶数)のアミノ酸残基の場合は、J={2,4,.....i}である。
他方、開示の技術においては、制限部13において、複数の化合物基のいずれかを格子空間のいずれかの格子に配置後、次の化合物基を格子空間に配置する場合において、格子空間から次の化合物基を配置すべきでない領域を除外した制限格子空間を生成する。例えば、ダイアモンド格子空間の大きさを表す空間制限パラメータL(L<n)を設定し(S103)、その空間制限パラメータLの制限下で、i個目のアミノ酸残基の移動先の格子点の集合をVとする(S104)。
そうすることで、i番目のアミノ酸残基に必要な空間であるVは、以下の式で表される。
Figure 0007139805000002
ここで、i={1,2,3,......n}である。
そして、空間制限パラメータLが偶数、かつi<Lのとき、
・奇数番目(i=奇数)のアミノ酸残基の場合は、J={1,3,.....i}である。
・偶数番目(i=偶数)のアミノ酸残基の場合は、J={2,4,.....i}である。
空間制限パラメータLが偶数、かつi>Lのとき、
・奇数番目(i=奇数)のアミノ酸残基の場合は、J={1,3,.....L-1}である。
・偶数番目(i=偶数)のアミノ酸残基の場合は、J={2,4,.....L}である。
空間制限パラメータLが奇数、かつi<Lのとき、
・奇数番目(i=奇数)のアミノ酸残基の場合は、J={1,3,.....i}である。
・偶数番目(i=偶数)のアミノ酸残基の場合は、J={2,4,.....i}である。
空間制限パラメータLが奇数、かつi>Lのとき、
・奇数番目(i=奇数)のアミノ酸残基の場合は、J={1,3,.....L}である。
・偶数番目(i=偶数)のアミノ酸残基の場合は、J={2,4,.....L-1}である。
以上により、アミノ酸残基が入る空間が定義される。
次に、割当部14では、制限格子空間に複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てる。即ち、各ビットX~Xに空間の情報を割り振ることが行われる(S105)。具体的には、図10B~図10Eに示すように、各アミノ酸残基の入る空間に対して、その位置にアミノ酸残基が在ることを1とし、無いことを0として表すビットを割り振る。なお、図10A~図10Cにおいては、各アミノ酸残基2~4に対して複数のXに割当てられているが、実際は、1つのアミノ酸残基1つに対して、1つのビットXが割り当てられる。
次に、Hone,Hconn,Holap,Hpairを設定し、各格子点に関する制約条件に基づいて変換したイジングモデルを作成する(S106)。
one,Hconn,Holap,Hpairの設定は、H生成部15のHone生成部15A、Hconn生成部15B、Holap生成部15C、Hpair生成部15Dにおいてそれぞれ行われる。
ここで、Diamond encording法において、全エネルギーは、以下のように表現できる。
Figure 0007139805000003
ここで、Honeは、1~n番目のアミノ酸はそれぞれ一つしかないという制約を表す。
connは、1~n番目のアミノ酸はそれぞれ繋がっているという制約を表す。
olapは、1~n番目のアミノ酸はそれぞれ重ならないという制約を表す。
pairは、アミノ酸同士の相互作用を表す制約を表す。
各制約の一例は、以下の通りである。
なお、以下において説明する図11~図14において、Xは、番号1のアミノ酸残基が配置可能な位置を表す。
~Xは、番号2のアミノ酸残基が配置可能な位置を表す。
~X13は、番号3のアミノ酸残基が配置可能な位置を表す。
14~X29は、番号4のアミノ酸残基が配置可能な位置を表す。
oneの一例を以下に示す。
Figure 0007139805000004
上記関数において、X、Xは、1又は0を取る。即ち、Honeは、図11において、X、X、X、Xのうち、いずれか一つだけ1であるため、いずれか二つ以上1になっていた場合エネルギーが上がる関数であり、一つだけ1であった場合は0になるペナルティーの項である。
なお、上記関数において、λoneは、重み付けのための係数である。
connの一例を以下に示す。
Figure 0007139805000005
上記関数において、X、Xは、1又は0を取る。即ち、Hconnは、図12において、Xが1のとき、X13、X、Xのいずれかがが1であればエネルギーが下がる式であり、すべてのアミノ酸残基が連結していると0になるペナルティー項である。
なお、上記関数において、λconnは、重み付けのための係数である。例えば、λone>λconnの関係にある。
olapの一例を以下に示す。
Figure 0007139805000006
上記関数において、X、Xは、1又は0を取る。即ち、Holapは、図13において、Xが1のとき、X14が1になった場合にペナルティーが発生する項である。
なお、上記関数において、λolapは、重み付けのための係数である。
pairの一例を以下に示す。
Figure 0007139805000007
上記関数において、X、Xは、1又は0を取る。即ち、Hpairは、図14A及び図14Bにおいて、Xが1のとき、X15が1になった場合にXのアミノ酸残基とX15のアミノ酸残基との間に相互作用Pω(x1)ω(x15)が働きエネルギーが下がるという関数である。相互作用Pω(x1)ω(x15)は、2つのアミノ酸残基の組み合わせにより決まり、相互作用Pω(x1)ω(x15)は、例えば、miyazawa-jernigan(MJ) matrixなどを参照して決定される。
次に、合成部15Eにおいて、Hone,Hconn,Holap,及びHpairを合成することでHが算出される。
次に、重み抽出部16において、上記各関数における重み係数(λone、λconn、λolap)が抽出される。
次に、重みファイル作成部17において、抽出された重み係数に対応した重みファイルが作成される。重みファイルは、例えば、行列であり、例えば、2X+4Xの場合、図15のような行列のファイルとなる。
作成した重みファイルを用いることで、以下のイジングモデルのエネルギー式を表現できる。
Figure 0007139805000008
上記関数において、状態Xi、は、0又は1を表し、0は、無いことを意味し、1は、在ることを意味する。右辺の1項目のWijは、重み付けのための係数である。
右辺の1項目は、全ニューロン回路から選択可能な2つのニューロン回路の全組み合わせについて、漏れと重複なく、2つのニューロン回路の状態と重み値との積を積算したものである。
また、右辺の2項目は、全ニューロン回路のそれぞれのバイアス値と状態との積を積算したものである。bは、i番目のニューロン回路のバイアス値を示している。
次に、演算部18(アニーリングマシン)において、各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、イジングモデルの最小エネルギーを算出する(S107)。
演算部18(アニーリングマシン)としては、イジングモデルで表されるエネルギー関数について基底状態探索を行なうアニーリング方式を採用するコンピュータであれば、量子アニーリングマシンであっても、半導体技術を用いた半導体アニーリングマシンであっても、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)を用いてソフトウェアにより実行されるシミュレーテッド・アニーリング(Simulated Annealing)の何れであっても良い。
算出された結果は、出力部19から出力される。結果は、タンパク質の立体構造図として出力してもよいし、タンパク質を構成する各アミノ酸残基の座標情報として出力してもよい。
以下に、焼き鈍し法、及び演算部18(アニーリングマシン)の一例について説明する。
焼き鈍し法(シミュレーテッド・アニーリング法、SA法)はモンテカルロ法の一種であり、乱数値を用いて確率的に解を求める方法である。以下では最適化したい評価関数の値を最小化する問題を例に説明し、評価関数の値をエネルギーと呼ぶことにする。最大化の場合は、評価関数の符号を変えればよい。
各変数に離散値の1つを代入した初期状態からはじめ、現在の状態(変数の値の組み合わせ)から、それに近い状態(例えば1つの変数だけ変化させた状態)を選び、その状態遷移を考える。その状態遷移に対するエネルギーの変化を計算し、その値に応じてその状態遷移を採択して状態を変化させるか、採択せずに元の状態を保つかを確率的に決める。エネルギーが下がる場合の採択確率をエネルギーが上がる場合より大きく選ぶと、平均的にはエネルギーが下がる方向に状態変化が起こり、時間の経過とともにより適切な状態へ状態遷移することが期待できる。そして、最終的には最適解又は最適値に近いエネルギーを与える近似解を得られる可能性がある。もし、これを決定論的にエネルギーが下がる場合に採択とし、上がる場合に不採択とすれば、エネルギーの変化は時間に対して広義単調減少となるが、局所解に到達したらそれ以上変化が起こらなくなってしまう。上記のように離散最適化問題には非常に多数の局所解が存在するために、状態が、ほとんど確実にあまり最適値に近くない局所解に捕まってしまう。したがって、採択するかどうかを確率的に決定することが重要である。
焼き鈍し法においては、状態遷移の採択(許容)確率を次のように決めれば、時刻(反復回数)無限大の極限で状態が最適解に到達することが証明されている。
(1)状態遷移に伴うエネルギー変化(エネルギー減少)値(-ΔE)に対して、その状態遷移の許容確率pを次の何れかの関数f()により決める。
Figure 0007139805000009
Figure 0007139805000010
Figure 0007139805000011
ここで、Tは、温度値と呼ばれるパラメータで次のように変化させる。
(2)温度値Tを次式で表されるように反復回数tに対数的に減少させる。
Figure 0007139805000012
ここで、Tは、初期温度値であり問題に応じて十分大きくとることが望ましい。
(1)の式で表される許容確率を用いた場合、十分な反復後に定常状態に達したとすると、各状態の占有確率は熱力学における熱平衡状態に対するボルツマン分布にしたがう。
そして、高い温度から徐々に下げていくとエネルギーの低い状態の占有確率が増加するため、十分温度が下がるとエネルギーの低い状態が得られるはずである。この様子が材料を焼き鈍したときの状態変化とよく似ているため、この方法は焼き鈍し法(または、疑似焼き鈍し法)と呼ばれるのである。このとき、エネルギーが上がる状態遷移が確率的に起こることは、物理学における熱励起に相当する。
図16に焼き鈍し法を行う最適化装置(演算部18)の概念的構成を示す。ただし、下記説明では、状態遷移の候補を複数発生させる場合についても述べているが、本来の基本的な焼き鈍し法は遷移候補を1つずつ発生させるものである。
最適化装置100には、まず現在の状態S(複数の状態変数の値)を保持する状態保持部111がある。また、複数の状態変数の値の何れかが変化することによる現在の状態Sからの状態遷移が起こった場合の、各状態遷移のエネルギー変化値{-ΔEi}を計算するエネルギー計算部112がある。そして、最適化装置100には、温度値Tを制御する温度制御部113、状態変化を制御するための遷移制御部114がある。
遷移制御部114は、温度値Tとエネルギー変化値{-ΔEi}と乱数値とに基づいて、エネルギー変化値{-ΔEi}と熱励起エネルギーとの相対関係によって複数の状態遷移の何れかを受け入れるか否かを確率的に決定するものである。
遷移制御部114をさらに細分化すると、遷移制御部114は、状態遷移の候補を発生する候補発生部114a、各候補に対して、そのエネルギー変化値{-ΔEi}と温度値Tとから状態遷移を許可するかどうかを確率的に決定するための可否判定部114bを有する。さらに、可となった候補から採用される候補を決定する遷移決定部114c、及び、確率変数を発生させるための乱数発生部114dを有する。
一回の反復における動作は次のようなものである。まず、候補発生部114aは、状態保持部111に保持された現在の状態Sから次の状態への状態遷移の候補(候補番号{Ni})を1つまたは複数発生する。エネルギー計算部112は、現在の状態Sと状態遷移の候補を用いて候補に挙げられた各状態遷移に対するエネルギー変化値{-ΔEi}を計算する。可否判定部114bは、温度制御部113で発生した温度値Tと乱数発生部114dで生成した確率変数(乱数値)を用い、各状態遷移のエネルギー変化値{-ΔEi}に応じて、上記(1)の式の許容確率でその状態遷移を許容する。そして、可否判定部114bは、各状態遷移の可否{fi}を出力する。許容された状態遷移が複数ある場合には、遷移決定部114cは、乱数値を用いてランダムにそのうちの1つを選択する。そして、遷移決定部114cは、選択した状態遷移の遷移番号Nと、遷移可否fを出力する。許容された状態遷移が存在した場合、採択された状態遷移に応じて状態保持部111に記憶された状態変数の値が更新される。
初期状態から始めて、温度制御部113で温度値を下げながら上記反復を繰り返し、一定の反復回数に達したり、エネルギーが一定の値を下回る等の終了判定条件が満たされたとき、動作が終了する。最適化装置110が出力する答えは終了時の状態である。
図17は、候補を1つずつ発生させる通常の焼き鈍し法における遷移制御部、特に可否判定部のために必要な演算部分の構成例の回路レベルのブロック図である。
遷移制御部114は、乱数発生回路114b1、セレクタ114b2、ノイズテーブル114b3、乗算器114b4、比較器114b5を有する。
セレクタ114b2は、各状態遷移の候補に対して計算されたエネルギー変化値{-ΔEi}のうち、乱数発生回路114b1が生成した乱数値である遷移番号Nに対応するものを選択して出力する。
ノイズテーブル114b3の機能については後述する。ノイズテーブル114b3として、例えば、RAM(Random Access Memory)、フラッシュメモリ等のメモリを用いることができる。
乗算器114b4は、ノイズテーブル114b3が出力する値と、温度値Tとを乗算した積(前述した熱励起エネルギーに相当する)を出力する。
比較器114b5は、乗算器114b4が出力した乗算結果と、セレクタ114b2が選択したエネルギー変化値である-ΔEとを比較した比較結果を遷移可否fとして出力する。
図17に示されている遷移制御部114は、基本的に前述した機能をそのまま実装するものであるが、(1)の式で表される許容確率で状態遷移を許容するメカニズムについてはこれまで説明していないのでこれを補足する。
許容確率pで1を、(1-p)で0を出力する回路は、2つの入力A,Bを持ち、A>Bのとき1を出力し、A<Bのとき0を出力する比較器の入力Aに許容確率pを、入力Bに区間[0,1)の値をとる一様乱数を入力することで実現することができる。したがってこの比較器の入力Aに、エネルギー変化値と温度値Tにより(1)の式を用いて計算される許容確率pの値を入力すれば、上記の機能を実現することができる。
即ちfを(1)の式で用いる関数、uを区間[0,1)の値をとる一様乱数とするとき、f(ΔE/T)がuより大きいとき1を出力する回路で、上記の機能を実現できる。
このままでもよいのであるが、次のような変形を行っても同じ機能が実現できる。2つの数に同じ単調増加関数を作用させても大小関係は変化しない。したがって比較器の2つの入力に同じ単調増加関数を作用させても出力は変わらない。この単調増加関数としてfの逆関数f-1を採用すると、-ΔE/Tがf-1(u)より大きいとき1を出力する回路でよいことがわかる。さらに温度値Tが正であることから-ΔEがTf-1(u)より大きいとき1を出力する回路でよい。図17中のノイズテーブル114b3はこの逆関数f-1(u)を実現するための変換テーブルであり、区間[0,1)を離散化した入力に対して次の関数の値を出力するテーブルである。
Figure 0007139805000013
Figure 0007139805000014
遷移制御部114には、判定結果等を保持するラッチやそのタイミングを発生するステートマシン等も存在するが、図17では図示を簡単にするため省略されている。
図18は、遷移制御部114の動作フローである。動作フローは、1つの状態遷移を候補として選ぶステップ(S0001)、その状態遷移に対するエネルギー変化値と温度値と乱数値の積の比較で状態遷移の可否を決定するステップ(S0002)、状態遷移が可ならばその状態遷移を採用し、否ならば不採用とするステップ(S0003)を有する。
なお、図5に示した化合物探索装置10Aは、演算部18が、制限部13等と同一空間的に配置された例であるが、開示の化合物探索装置は、図19に示す化合物探索装置10Bのように、演算部18が、制限部13等と空間的に離れていてもよい。
次に、他の装置例、フローチャート等を用いて、開示の技術の他の一例を説明する。
化合物探索装置の構成例を図20に示す。
図20に示す化合物探索装置10Cは、化合物基数カウント部11と、定義部12と、制限部13と、割当部14と、H生成部15と、重み抽出部16と、重みファイル作成部17と、演算部18と、出力部19とを有する。
図21に、図20の化合物探索装置10Cを用いてタンパク質の安定構造を探索するフローチャートを示す。
制限部13を除いて、図20に示す化合物探索装置10Cの各部は、図5に示す化合物探索装置10Aの各部と同じである。
図21のフローチャートにおいて、工程S201は、図6のフローチャートの工程S101に相当し、工程S202は、工程S102に相当し、工程S204は、工程S104に相当し、工程S205は、工程S105に相当し、工程S206は、工程S106に相当し、工程S207は、工程S107に相当する。
そのため制限部13、及び工程203に着目して説明する。
直鎖で並ぶアミノ酸残基の数の最大数M(直鎖数制限パラメータM)を設定する(S203)ことで、制限部13では、複数の化合物基のいずれかを格子空間のいずれかの格子に配置後、次の化合物基を格子空間に配置する場合において、格子空間から次の化合物基を配置すべきでない領域を除外した制限格子空間を生成する。
前述の通り、タンパク質においては、通常、アミノ酸残基同士の相互作用によって、アミノ酸残基が直鎖状に並ぶことはほとんどない。
そのため、直鎖で並ぶアミノ酸残基の数の最大数M(直鎖数制限パラメータM)を設定し、この制限の下でアミノ酸残基が配置すべきでない領域を除外して制限格子空間を生成することで、演算ビット数又は量子ビットを抑制することができる。ここで、Mは、当然に、アミノ酸残基の数(n)より小さい(M<n)。
例えば、図22に示すように、直鎖数制限パラメータMを5とすると、直鎖で並ぶアミノ酸残基の数は、最大数で5となる。
直鎖数制限パラメータMの設定下では、制限格子空間は、アミノ酸残基の数の増加に伴って、図23に示すように増加する。即ち、n個のアミノ酸残基について、直鎖数制限パラメータMを用いた場合の最大格子空間Kは、以下の式で求められる。
Figure 0007139805000015
ここで、制限格子空間の生成に、空間制限パラメータL(L<n)を併用してもよい。その場合、L≦Kとすることが好ましい。
次に、他の装置例、フローチャート等を用いて、開示の技術の他の一例を説明する。
化合物探索装置の構成例を図24に示す。
図24に示す化合物探索装置10Dは、化合物基数カウント部11と、定義部12と、制限部13と、割当部14と、H生成部15と、重み抽出部16と、重みファイル作成部17と、演算部18と、出力部19とを有する。
図25に、図24の化合物探索装置10Dを用いてタンパク質の安定構造を探索するフローチャートを示す。
制限部13を除いて、図24に示す化合物探索装置10Dの各部は、図20に示す化合物探索装置10Cの各部と同じである。
図25のフローチャートにおいて、工程S301は、図21のフローチャートの工程201に相当し、工程S302は、工程S202に相当し、工程S303は、工程S203に相当し、工程S305は、工程S204に相当し、工程S306は、工程S205に相当し、工程S307は、工程S206に相当し、工程S308は、工程S207に相当する。
そのため制限部13、及び工程304に着目して説明する。
直鎖で並ぶアミノ酸残基の数の最大数M(直鎖数制限パラメータM)を設定しつつ(S303)、更に、i個目のアミノ酸残基の移動先の最大S(i)を定義する(S304)ことで、制限部13では、複数の化合物基のいずれかを格子空間のいずれかの格子に配置後、次の化合物基を格子空間に配置する場合において、格子空間から次の化合物基を配置すべきでない領域を除外した制限格子空間を生成する。
直鎖数制限パラメータMを用いた場合、各アミノ酸残基の空間半径rは、例えば、M=5(K=8)、n=11、L=Kの場合、以下の表1のとおりとなる。
Figure 0007139805000016
これを図で表すと、図26のようになり、最大空間は同じであるが、余剰空間が発生しており、6番目や7番目のアミノ酸残基では、実際には少ない空間でよいことがわかる。
そこで、直鎖数制限パラメータMに加え、直鎖数制限パラメータMを用いた空間パラメータs(x)を導入することによって、次のように空間を制限することができ、精度を落とさずにさらにビット数を抑えることができる。
Figure 0007139805000017
i={1,2,3,......n}
Figure 0007139805000018
そして、空間制限パラメータLが偶数、かつi<Lのとき、
・奇数番目(i=奇数)のアミノ酸残基の場合は、J={s(1),s(3),.....S(i)}である。
・偶数番目(i=偶数)のアミノ酸残基の場合は、J={s(2),s(4),.....S(i)}である。
空間制限パラメータLが偶数、かつi>Lのとき、
・奇数番目(i=奇数)のアミノ酸残基の場合は、J={s(2),s(4),.....S(L-1)}である。
・偶数番目(i=偶数)のアミノ酸残基の場合は、J={s(2),s(4),.....S(L)}である。
空間制限パラメータLが奇数、かつi<Lのとき、
・奇数番目(i=奇数)のアミノ酸残基の場合は、J={s(1),s(3),.....S(i)}である。
・偶数番目(i=偶数)のアミノ酸残基の場合は、J={s(2),s(4),.....S(i)}である。
空間制限パラメータLが奇数、かつi>Lのとき、
・奇数番目(i=奇数)のアミノ酸残基の場合は、J={s(2),s(4),.....S(L)}である。
・偶数番目(i=偶数)のアミノ酸残基の場合は、J={s(2),s(4),.....S(L-1)}}である。
上記において図5、及び図6を用いて説明した開示の技術を実施例1とし、図20、及び図21を用いて説明した開示の技術を実施例2とし、図24、及び図25を用いて説明した開示の技術を実施例3とし、各実施例において、以下のようにパラメータを定めた場合の、必要bit数の変化を図27に示した。
・実施例1:L=15
・実施例2:L=15、M=5
・実施例3:L=15、M=5
・比較例1:制限なし。
いずれの場合も、制限を設けなかった比較例1と比較して、必要なbit数を減らすことができ、問題規模の大きい化合物(例えば、タンパク質)を探索の対象とすることができるようになることが確認できた。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
複数の化合物基が連結した化合物を探索する化合物探索装置において、
前記複数の化合物基が順次配置される格子の集合である格子空間を定義する定義部と、
前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成する制限部と、
前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てる割当部と、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する演算部と、
を有する化合物探索装置。
(付記2)
前記制限格子空間の生成を、直鎖で並ぶ化合物基の数の最大数を設定することにより行う付記1に記載の化合物探索装置。
(付記3)
前記制限格子空間の生成を、直鎖で並ぶ化合物基の数の最大数を設定すること、及び前記最大数を設定して生成する生成格子空間に存在する余剰の格子を除外することにより行う付記1に記載の化合物探索装置。
(付記4)
前記化合物基は、アミノ酸残基である、付記1から3のいずれかに記載の化合物探索装置。
(付記5)
前記化合物は、たんぱく質である、付記4に記載の化合物探索装置。
(付記6)
複数の化合物基が連結した化合物を探索する化合物探索方法において、
コンピュータが、
前記複数の化合物基が順次配置される格子の集合である格子空間を定義し、
前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成し、
前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当て、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する、
化合物探索方法。
(付記7)
前記制限格子空間の生成を、直鎖で並ぶ化合物基の数の最大数を設定することにより行う付記6に記載の化合物探索方法。
(付記8)
前記制限格子空間の生成を、直鎖で並ぶ化合物基の数の最大数を設定すること、及び前記最大数を設定して生成する生成格子空間に存在する余剰の格子を除外することにより行う付記6に記載の化合物探索方法。
(付記9)
前記化合物基は、アミノ酸残基である、付記6から8のいずれかに記載の化合物探索方法。
(付記10)
前記化合物は、たんぱく質である、付記9に記載の化合物探索方法。
(付記11)
複数の化合物基が連結した化合物を探索する化合物探索プログラムにおいて、
コンピュータに、
前記複数の化合物基が順次配置される格子の集合である格子空間を定義させ、
前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成させ、
前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てさせ、
前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出させる、
化合物探索プログラム。
(付記12)
前記制限格子空間の生成を、直鎖で並ぶ化合物基の数の最大数を設定することにより行う付記11に記載の化合物探索プログラム。
(付記13)
前記制限格子空間の生成を、直鎖で並ぶ化合物基の数の最大数を設定すること、及び前記最大数を設定して生成する生成格子空間に存在する余剰の格子を除外することにより行う付記11に記載の化合物探索プログラム。
(付記14)
前記化合物基は、アミノ酸残基である、付記11から13のいずれかに記載の化合物探索プログラム。
(付記15)
前記化合物は、たんぱく質である、付記14に記載の化合物探索プログラム。
10A 化合物探索装置
10B 化合物探索装置
10C 化合物探索装置
10D 化合物探索装置
11 化合物基数カウント部
12 定義部
13 制限部
14 割当部
15 H生成部
16 重み抽出部
17 重みファイル作成部
18 演算部
19 出力部

Claims (7)

  1. 複数の化合物基が連結した化合物を探索する化合物探索装置において、
    前記複数の化合物基が順次配置される格子の集合である格子空間を定義する定義部と、
    前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成する制限部と、
    前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てる割当部と、
    前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する演算部と、
    を有する化合物探索装置。
  2. 前記制限格子空間の生成を、直鎖で並ぶ化合物基の数の最大数を設定することにより行う請求項1に記載の化合物探索装置。
  3. 前記制限格子空間の生成を、直鎖で並ぶ化合物基の数の最大数を設定すること、及び前記最大数を設定して生成する生成格子空間に存在する余剰の格子を除外することにより行う請求項1に記載の化合物探索装置。
  4. 前記化合物基は、アミノ酸残基である、請求項1から3のいずれかに記載の化合物探索装置。
  5. 前記化合物は、たんぱく質である、請求項4に記載の化合物探索装置。
  6. 複数の化合物基が連結した化合物を探索する化合物探索方法において、
    コンピュータが、
    前記複数の化合物基が順次配置される格子の集合である格子空間を定義し、
    前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成し、
    前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当て、
    前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出する、
    化合物探索方法。
  7. 複数の化合物基が連結した化合物を探索する化合物探索プログラムにおいて、
    コンピュータに、
    前記複数の化合物基が順次配置される格子の集合である格子空間を定義させ、
    前記複数の化合物基のいずれかを前記格子空間のいずれかの格子に配置後、次の化合物基を前記格子空間に配置する場合において、前記格子空間から前記次の化合物基を配置すべきでない領域を除外した制限格子空間を生成させ、
    前記制限格子空間に前記複数の化合物基が配置されうる各格子点にビットをそれぞれ割り当てさせ、
    前記各格子点に関する制約条件に基づいて変換したイジングモデルについて、焼き鈍し法を用いた基底状態探索を実行することにより、前記イジングモデルの最小エネルギーを算出させる、
    化合物探索プログラム。
JP2018169832A 2018-09-11 2018-09-11 化合物探索装置、化合物探索方法、及び化合物探索プログラム Active JP7139805B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018169832A JP7139805B2 (ja) 2018-09-11 2018-09-11 化合物探索装置、化合物探索方法、及び化合物探索プログラム
US16/534,650 US11837323B2 (en) 2018-09-11 2019-08-07 Device and method for searching compound
CN201910783431.2A CN110890126B (zh) 2018-09-11 2019-08-23 用于探索化合物的设备和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018169832A JP7139805B2 (ja) 2018-09-11 2018-09-11 化合物探索装置、化合物探索方法、及び化合物探索プログラム

Publications (2)

Publication Number Publication Date
JP2020042576A JP2020042576A (ja) 2020-03-19
JP7139805B2 true JP7139805B2 (ja) 2022-09-21

Family

ID=69719957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018169832A Active JP7139805B2 (ja) 2018-09-11 2018-09-11 化合物探索装置、化合物探索方法、及び化合物探索プログラム

Country Status (3)

Country Link
US (1) US11837323B2 (ja)
JP (1) JP7139805B2 (ja)
CN (1) CN110890126B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11551128B2 (en) * 2019-07-30 2023-01-10 International Business Machines Corporation Branched heteropolymer lattice model for quantum optimization
JP7410394B2 (ja) * 2020-03-26 2024-01-10 富士通株式会社 最適化装置及び最適化方法
JP2021192199A (ja) * 2020-06-05 2021-12-16 富士通株式会社 構造探索方法、構造探索装置、構造探索用プログラム、及び相互作用ポテンシャル特定方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003206246A (ja) 2002-01-07 2003-07-22 Ichiro Yamato 化合物の立体構造探索プログラム、立体構造探索装置、及び立体構造探索方法
US6968275B1 (en) 2002-02-22 2005-11-22 Hewlett-Packard Development Company, L.P. Pipelined digital circuit for determining the conformational energy of a folded protein
JP2006171982A (ja) 2004-12-14 2006-06-29 Fujitsu Ltd タンパク質の立体構造探索方法、立体構造探索用コンピュータプログラムおよび立体構造探索装置
JP2010257297A (ja) 2009-04-27 2010-11-11 Fujitsu Ltd 分子安定構造探索装置、分子安定構造探索プログラム、および分子安定構造探索方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3669704B2 (ja) * 1994-10-31 2005-07-13 昭子 板井 三次元構造データベースから新規リガンド化合物を検索する方法
JP2002536301A (ja) 1999-01-27 2002-10-29 ザ スクリプス リサーチ インスティテュート タンパク質モデリングツール
JP2008146529A (ja) 2006-12-13 2008-06-26 Matsushita Electric Ind Co Ltd タンパク質配列断片エントロピー計算による折り畳み順序予測法
CN103984878B (zh) * 2014-04-08 2017-01-18 浙江工业大学 一种基于树搜索和片段组装的蛋白质结构预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003206246A (ja) 2002-01-07 2003-07-22 Ichiro Yamato 化合物の立体構造探索プログラム、立体構造探索装置、及び立体構造探索方法
US6968275B1 (en) 2002-02-22 2005-11-22 Hewlett-Packard Development Company, L.P. Pipelined digital circuit for determining the conformational energy of a folded protein
JP2006171982A (ja) 2004-12-14 2006-06-29 Fujitsu Ltd タンパク質の立体構造探索方法、立体構造探索用コンピュータプログラムおよび立体構造探索装置
JP2010257297A (ja) 2009-04-27 2010-11-11 Fujitsu Ltd 分子安定構造探索装置、分子安定構造探索プログラム、および分子安定構造探索方法

Also Published As

Publication number Publication date
US11837323B2 (en) 2023-12-05
CN110890126B (zh) 2024-03-26
JP2020042576A (ja) 2020-03-19
US20200082904A1 (en) 2020-03-12
CN110890126A (zh) 2020-03-17

Similar Documents

Publication Publication Date Title
JP7251281B2 (ja) 結合構造探索装置、結合構造探索方法、及び結合構造探索プログラム
Pan et al. An effective hybrid discrete differential evolution algorithm for the flow shop scheduling with intermediate buffers
JP7176381B2 (ja) 環状分子の構造探索方法、及び構造探索装置、並びにプログラム
JP7139805B2 (ja) 化合物探索装置、化合物探索方法、及び化合物探索プログラム
Raventós et al. Cold bosons in optical lattices: a tutorial for exact diagonalization
JP7197789B2 (ja) 最適化装置及び最適化装置の制御方法
JP2021082165A (ja) 構造探索方法、構造探索プログラム、及び構造探索装置
Zohali et al. The economic lot scheduling problem in limited-buffer flexible flow shops: Mathematical models and a discrete fruit fly algorithm
Chang et al. Recent advances in determinant quantum Monte Carlo
JP2020106917A (ja) 最適化装置及び最適化装置の制御方法
JP4165712B2 (ja) データフローグラフの同一サブグラフ検出装置、高位合成装置、データフローグラフの同一サブグラフ検出方法、データフローグラフの同一サブグラフ検出制御プログラムおよび可読記録媒体
Messerly et al. An error analysis toolkit for binned counting experiments
JP7112312B2 (ja) 化合物探索装置、化合物探索方法、及び化合物探索プログラム
Jocksch et al. A bucket sort algorithm for the particle-in-cell method on manycore architectures
JP7268484B2 (ja) 構造探索装置、構造探索方法、及び構造探索プログラム
JP7256378B2 (ja) 最適化システムおよび最適化システムの制御方法
Panagiotopoulos et al. A group-based space-filling design of experiments algorithm
JP2022062322A (ja) 構造探索プログラム、構造探索装置、及び構造探索方法
JP7496952B1 (ja) 最適化装置、最適化方法、及びプログラム
JP2022107518A (ja) 情報処理システム、情報処理方法及び情報処理装置
JP2023108368A (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JPH08314882A (ja) 電源導入順序決定方法
Xiong et al. Quasi-LHD Sequential Sampling Method for Computer Experiments

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180914

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210610

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220822

R150 Certificate of patent or registration of utility model

Ref document number: 7139805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150