JP6832678B2 - 新規物質探索方法および装置 - Google Patents

新規物質探索方法および装置 Download PDF

Info

Publication number
JP6832678B2
JP6832678B2 JP2016215596A JP2016215596A JP6832678B2 JP 6832678 B2 JP6832678 B2 JP 6832678B2 JP 2016215596 A JP2016215596 A JP 2016215596A JP 2016215596 A JP2016215596 A JP 2016215596A JP 6832678 B2 JP6832678 B2 JP 6832678B2
Authority
JP
Japan
Prior art keywords
substance
learning
parameter
new
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016215596A
Other languages
English (en)
Other versions
JP2017091526A (ja
Inventor
志 鎬 ▲ゆ▼
志 鎬 ▲ゆ▼
寧 千 權
寧 千 權
勍 徳 金
勍 徳 金
在 光 申
在 光 申
李 孝 錫
孝 錫 李
倫 碩 崔
倫 碩 崔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017091526A publication Critical patent/JP2017091526A/ja
Application granted granted Critical
Publication of JP6832678B2 publication Critical patent/JP6832678B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2111/00Details relating to CAD techniques
    • G06F2111/08Probabilistic or stochastic CAD
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Computational Linguistics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Feedback Control In General (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、新素材を開発するための新規物質探索方法および装置に関する。
第1原理シミュレーション理論などの素材シミュレーション技術および計算能力を向上させるスーパーコンピュータが、かつて実験にのみ頼っていた新素材の開発過程に適用されている。多数の仮想物質を生成し、コンピュータシミュレーションを通して生成された仮想物質の中から新素材候補物質を選び出すことが可能な高速大量スクリーニング(High Throughput Screening、HTS)が代表的な例である。
HTSにおいて多数の部分構造の組み合わせにより仮想物質が生成されるので、部分構造の個数や部分構造の組み合わせ方法によって、生成された仮想物質の個数が指数的に増加する。通常、1つの仮想物質に対するシミュレーションに、長くは数時間以上要するため、シミュレーションされる仮想物質の個数が多くなると、シミュレーションだけを活用して全ての仮想物質に対する評価を行うことが困難になる。
したがって、シミュレーションだけで全体仮想物質に対するスクリーニングを行うのではなく、機械学習などの方法を適用して、シミュレーションに先立って可能性のある物質群を選別する方式が研究されている。機械学習は、与えられた問題を解くためのモデルを、既知データに基づいて構成する方法論を意味し、機械学習が適用される場合、すでに既知の物性計算(または測定)データを用いて、機械学習モデルを通してシミュレーションなしにシミュレーション結果を速やかに予測できる。したがって、より多数の候補物質に対する評価が可能になる。
しかし、機械学習をHTSに適用する方法も、新素材候補物質を生成するために多数の仮想物質を生成する必要があるので、良くない特性を有する物質まで大量に生成され得ることから、新素材候補物質の探索において非効率的である。なお、新規物質を探索する手法は下記特許文献1に記載されている。
特開2015−109084
一実施形態は、物質の構造情報および物性情報を変数とする確率関数に基づいて新規物質を探索する新規物質探索方法および装置を提供する。
他の実施形態は、物質の構造情報および物性情報を変数とする確率関数に基づいて特定物質の物性を知る新規物質探索方法および装置を提供する。
一実施形態によれば、新規物質を探索する方法が提供される。前記物質の探索方法は、既知物質に基づいてモデリングされた物質モデルに対して学習を行う段階と、学習の結果に目標物性を入力して少なくとも1つの候補物質を決定する段階と、少なくとも1つの候補物質の中から前記新規物質を決定する段階とを含む。
前記物質の探索方法において、学習を行う段階は、既知物質の構造に関する第1構造情報、既知物質の物性に関する第1物性情報、潜在要因に関する情報と、少なくとも1つの学習パラメータとに基づいて物質モデルをモデリングする段階と、少なくとも1つの学習パラメータをアップデートする段階と、学習パラメータのアップデート結果に基づいて学習の終了の有無を決定する段階とを含むことができる。
前記物質の探索方法において、第1構造情報は、物質の分子構造に含まれている部分構造に関する情報を含むことができる。
前記物質の探索方法において、第1構造情報は、物質の分子構造に含まれている原子に関する情報および原子の結合に関する情報を含むことができる。
前記物質の探索方法において、第1構造情報は、物質の分子構造に関する2次元イメージ情報を含むことができる。
前記物質の探索方法において、学習パラメータは、物質の構造に関する基本値パラメータ、物質の物性に関する基本値パラメータ、潜在要因の基本値パラメータ、物質の構造と潜在要因の間の関係パラメータ、物質の物性と潜在要因の間の関係パラメータのうちの少なくとも1つを含み、前記学習を行う段階は、前記モデリングする段階の前に、前記学習パラメータをランダムな値に初期化する段階をさらに含むことができる。
前記物質の探索方法において、モデリングする段階は、第1構造情報、第1物性情報、および学習パラメータに基づいてエネルギー関数をモデリングする段階と、エネルギー関数に基づいて導出された物質モデルの確率関数に基づいて、新規物質の構造に関する第2構造情報および新規物質の物性に関する第2物性情報を生成する段階とを含むことができる。
前記物質の探索方法において、アップデートする段階は、確率関数およびエネルギー関数に基づいて導出された物質モデルの自由エネルギー関数に基づいて、学習パラメータをアップデートする段階を含むことができる。
前記物質の探索方法において、確率関数および自由エネルギー関数に基づいて、学習パラメータをアップデートする段階は、学習パラメータと、自由エネルギー関数で表現された目的関数との差を用いて学習パラメータをアップデートする段階を含むことができる。
前記物質の探索方法において、目的関数は、確率関数の微分表現から導出された関数であるとよい。
前記物質の探索方法において、少なくとも1つの候補物質の中から新規物質を決定する段階は、少なくとも1つの候補物質の物理的妥当性、化学的安定性、または合成容易性のうちの少なくとも1つを検証する段階と、少なくとも1つの候補物質の中から検証が完了した候補物質を新規物質として決定する段階とを含むことができる。
他の実施形態によれば、新規物質を探索する物質の探索装置が提供される。前記物質の探索装置は、既知物質に基づいてモデリングされた物質モデルに対して学習を行う学習実行部と、学習の結果に目標物性を入力して少なくとも1つの候補物質を決定し、少なくとも1つの候補物質の中から新規物質を決定する新規物質決定部とを含む。
前記物質の探索装置において、学習実行部は、既知物質の構造に関する第1構造情報、既知物質の物性に関する第1物性情報、潜在要因に関する情報と、少なくとも1つの学習パラメータとに基づいて物質モデルをモデリングする物質モデリング部と、少なくとも1つの学習パラメータをアップデートするパラメータアップデータと、学習パラメータのアップデート結果に基づいて学習の終了の有無を決定する学習実行終了部とを含むことができる。
前記物質の探索装置において、第1構造情報は、物質の分子構造に含まれている部分構造に関する情報を含むことができる。
前記物質の探索装置において、第1構造情報は、物質の分子構造に含まれている原子に関する情報および原子の結合に関する情報を含むことができる。
前記物質の探索装置において、第1構造情報は、物質の分子構造に関する2次元イメージ情報を含むことができる。
前記物質の探索装置において、学習パラメータは、物質の構造に関する基本値パラメータ、物質の物性に関する基本値パラメータ、潜在要因の基本値パラメータ、物質の構造と潜在要因の間の関係パラメータ、物質の物性と潜在要因の間の関係パラメータのうちの少なくとも1つを含み、前記物質モデリング部は、前記モデリングの前に、前記学習パラメータをランダムな値に初期化することができる。
前記物質の探索装置において、物質モデリング部は、第1構造情報、第1物性情報、および学習パラメータに基づいてエネルギー関数をモデリングし、エネルギー関数に基づいて導出された物質モデルの確率関数に基づいて、新規物質の構造に関する第2構造情報および新規物質の物性に関する第2物性情報を生成することができる。
前記物質の探索装置において、パラメータアップデータは、確率関数およびエネルギー関数に基づいて導出された物質モデルの自由エネルギー関数に基づいて、学習パラメータをアップデートすることができる。
前記物質の探索装置において、パラメータアップデータは、学習パラメータと、自由エネルギー関数で表現された目的関数との差を用いて学習パラメータをアップデートすることができる。
前記物質の探索装置において、目的関数は、確率関数の微分表現から導出された関数であるとよい。
前記物質の探索装置において、新規物質決定部は、少なくとも1つの候補物質の物理的妥当性、化学的安定性、または合成容易性のうちの少なくとも1つを検証し、少なくとも1つの候補物質の中から検証が完了した候補物質を新規物質として決定することができる。
物質の構造情報および物性情報を関連づけられる物質モデルをモデリングし、物質モデルを機械学習を通して学習した後、学習された物質モデルを用いて、目標物性情報から新規物質の構造を探索し、または特定物質の構造情報から特定物質の物性情報を知ることができる。
一実施形態に係る物質の探索装置を示すブロック図である。 一実施形態に係る物質の探索方法を示すフローチャートである。 一実施形態に係る既知の有機物質の構造図である。 一実施形態に係る物質モデルに対する学習方法を示すフローチャートである。 一実施形態に係る物質の探索結果を示すグラフである。 他の実施形態に係る物質の探索装置を示すブロック図である。
以下、添付した図面を参照して、本記載の実施形態について、本発明の属する技術分野における通常の知識を有する者が容易に実施できるように詳細に説明する。しかし、本記載は種々の異なる形態で実現可能であり、ここで説明する実施形態に限定されない。そして、図面において、本記載を明確に説明するために説明上不必要な部分は省略し、明細書全体にわたって類似の部分については類似の図面符号を付した。
図1は、一実施形態に係る物質の探索装置(新規物質探索装置)を示すブロック図である。
図1を参照すれば、一実施形態に係る物質の探索装置100は、物質モデルに対する機械学習を行う学習実行部110と、目標物性に対応する新規物質を決定する新規物質決定部120とを含む。そして、学習実行部110は、物質モデルをモデリングする物質モデリング部111と、物質モデルのモデリングに用いられる学習パラメータをアップデートするパラメータアップデータ112と、学習パラメータのアップデート結果に基づいて学習の終了の有無を決定する学習実行終了部113とを含む。
学習実行部110は、物質モデルに対する学習を行い、この時、物質モデルは、既知物質の構造に関する構造情報x(第1構造情報)、既知の各物質の物性に関する物性情報y(第1物性情報)、および潜在要因を示す潜在変数hと、学習パラメータとに基づいて物質モデリング部111によってモデリングされる。一実施形態において、構造情報は、物質の分子構造に関する2次元イメージ情報を含むことができる。一実施形態において、構造情報は、物質の分子構造内の原子に関する情報と、原子の組み合わせに関する情報を含むことができる。このような実施形態において、物質モデリング部111は、物質の構造情報、物質の物性情報、および潜在要因が学習パラメータを通して関連づけられたエネルギー関数を、物質モデルとしてモデリングすることができる。この時、既知物質の構造情報および物性情報はデータベースに保存されているとよい。
パラメータアップデータ112は、物質モデルの自由エネルギー関数の変化量を計算することによって、物質モデルのモデリングに用いられた学習パラメータをアップデートする。
学習実行終了部113は、物質モデルに対する学習がある程度進行した後、学習の終了を決定する。
新規物質決定部120は、学習された物質モデルに目標物性を代入して新規物質を決定する。あるいは、新規物質決定部は、学習された物質モデルに特定物質の構造に関する構造情報を代入して特定物質の物性情報を知ることができる。
以下、図2〜図4に基づいて、本記載の物質の探索装置が新規物質を探索する方法を詳細に説明する。
図2は、一実施形態に係る物質の探索方法(新規物質探索方法)を示すフローチャートであり、図3は、一実施形態に係る既知の有機物質の構造図であり、図4は、一実施形態に係る物質モデルに対する学習方法を示すフローチャートである。
図2を参照すれば、まず、物質の探索装置は、物質モデルに対して学習を行う(S201)。一実施形態によれば、物質の探索装置は、以下に記載の方法により物質モデルに対する学習を行うことができる。以下、図4を参照して、一実施形態に係る物質モデルに対する学習方法を詳細に説明する。
まず、物質の探索装置は、物質モデルをモデリングする。一実施形態に係る物質の探索装置は、物質モデルをモデリングするために、データベースから既知の物質の構造に関する構造情報xおよび各物質の物性に関する物性情報yを読み込む。
一実施形態において、物質の探索装置は、約50,000個の有機物質のための物質モデルに対して学習を行うことができる。物質の探索装置は、データベースから、既知の50,000個の有機物質の構造に関する構造情報xおよび各有機物質の物性情報に関する物性情報yを読み込む。
一実施形態において、構造情報xは、部分構造の存在/不存在を指示する数字のシーケンスで表現される。部分構造は、既知物質の構造の一部分である。例えば、部分構造グループは、単一六角環(single hexagonal ring)、二重六角環(double hexagonal ring)、三重六角環(triple hexagonal ring)などを含むことができる。部分構造の数字シーケンスは、2進シーケンス(binary sequence)であるとよい。そのため、図3に示された既知の有機物質は[1,1,0]で表現される。例えば、部分構造は、循環指紋方法(circular fingerprint method)を行うソフトウェアまたはハードウェアによって取得される。
一実施形態において、物性情報yは、コンピュータシミュレーションによって取得される。例えば、約50,000個の有機物質に対応する50,000個の受光強度/発光強度情報がコンピュータシミュレーションによって計算される。計算正確度は、物性情報の次元をログスケール(log scale)に変換することによって増加できるが、これは、大部分の有機物質に対する特定物性値がほぼ0で計算され得るからである。
そして、物質の探索装置は、構造情報および物性情報に基づいて物質モデルをモデリングするのに用いられる学習パラメータをランダムな値に初期化する。この時、学習パラメータは、物質の構造に関する基本値パラメータa、物質の物性に関する基本値パラメータb、潜在要因の基本値パラメータc、構造−潜在要因の間の関係パラメータU、そして物性−潜在要因の間の関係パラメータvを含む。つまり、学習パラメータθは、下記数式1のように表現される。
以降、物質の探索装置は、物質の構造情報を示す変数x、物質の物性情報を示す変数y、および潜在要因を示す潜在変数hと、学習パラメータとに基づいてエネルギー関数を模写することによって、物質モデルを生成する(S401)。一実施形態によれば、x、y、およびhを変数として有するエネルギー関数は、数式2のように表現される。
数式2において、xとhはベクトルであり、yは実数である。そして、数式2において、E(x,h)は関係パラメータUによって定義された変数xおよび潜在変数hにより決定されたエネルギーを示し、E(y,h)は関係パラメータvによって定義された変数yおよび潜在変数hにより決定されたエネルギーを示す。この時、λは指定パラメータであって、物質モデルに対する学習正確度および学習速度に関連づけられている。そして、E(x)はパラメータaによって定義された変数xにより決定されたエネルギー、E(y)はパラメータbによって定義された変数yにより決定されたエネルギー、E(c)はパラメータcによって定義された変数hにより決定されたエネルギーを示す。
例えば、データベースに物質の構造情報として物質の分子構造情報が保存されており、物質の物性情報として物質のエネルギーバンドギャップ(energy band−gap)に関する情報が保存されているとする時、分子構造情報が変数xとして活用され、エネルギーバンドギャップ情報が変数yとして活用される。この時、物質の分子構造に含まれている特定部分構造の位置が変数x内で、1で表現される方式が使用される。
この時、物質モデルのエネルギー関数から、物質モデルの確率関数および物質モデルの自由エネルギー関数が導出される。下記数式3は、一実施形態に係る物質モデルの確率関数である。
そして、数式3の確率関数において、潜在要因に関する変数hは観測されない変数を示すので、変数hが数式3で適切に無視されると(marginalized out)、すでに既知のxおよびyに対する物質モデルの確率関数は、下記数式4のように表現される。
数式4において、「softplus」関数は、下記数式5のとおりである。
数式6において、「sigm」関数は、sigmoid関数を意味し、下記数式7のとおりである。
数式10には、一実施形態に係る物質モデルの自由エネルギーの変化量を調べるための目的関数が示されている。
したがって、物質モデルの自由エネルギー関数および物質モデルの確率関数の間の関係は、下記数式12のように表現される。
そして、一実施形態に係る目的関数は、物質モデルの確率関数の微分表現から導出される。一実施形態において、物質モデルに対する学習は、与えられたデータ(xおよびy)に対する可能性(likelihood)を最大化できるように行われる。この時、確率関数にネガティブログ(−log)が取られ、ネガティブログが取られた関数の微分表現でネガティブログが取られた関数に対する最小値が決定されることによって、可能性を最大化できるように学習パラメータがアップデートされる。つまり、ネガティブログが取られた確率関数の学習パラメータに対する微分表現が、自由エネルギーの学習パラメータに対する変化量を計算するための目的関数として用いられる。
一実施形態において、物質モデルの確率関数に基づいて導出された一般目的関数(generative objective function)は、下記数式13のとおりである。
他の実施形態において、物質モデルの条件付き確率関数に基づいて導出された特異目的関数(discriminative objective function)は、下記数式14のとおりである。
そして、数式10の目的関数は、一般目的関数および特異目的関数の線形結合であるハイブリッド目的関数であるとよい。つまり、数式14の特異目的関数に数式13の一般目的関数が重みを示す指定パラメータαを通して線形結合することによって、数式10のハイブリッド目的関数が導出される。
以降、物質の探索装置は、数式15により学習パラメータをアップデートする(S403)。
つまり、
数式15において、εは物質モデルに対する学習速度に関連する指定パラメータである。
以降、物質の探索装置は、学習パラメータに対するアップデート結果に基づいて物質モデルに対する学習の終了の有無を決定する(S404)。一実施形態によれば、予め決定された回数だけ学習パラメータのアップデートが行われ、物質モデルの自由エネルギーの変化量が予め決定された大きさより大きくなくなると(または小さくなると)、物質の探索装置は、物質モデルに対する学習を終了することができる。
上記で説明されたように、物質モデルに対する学習が終了すると、物質の探索装置は、学習された物質モデルに目標物性を代入することによって、少なくとも1つの候補物質を決定する(S202)。
一実施形態によれば、目標物性yに対する、下記数式16による条件付き確率が計算される。
そして、数式16の条件付き確率関数を通して潜在変数hをランダムに生成する。以降、生成された潜在変数hを用いて、数式17のように新規物質の候補物質の構造に関する確率関数を計算する。
以降、数式17のような、候補物質の構造に関する確率関数に基づいて少なくとも1つの候補物質が決定される。この時、一実施形態に係る物質の探索装置は、少なくとも1つの候補物質の物理的妥当性、化学的安定性、および合成容易性などを検証することができる(S203)。最後に、一実施形態に係る物質の探索装置は、少なくとも1つの候補物質の中から検証が完了した候補物質を新規物質として決定する(S204)。
一方、他の実施形態において、物質の探索装置は、特定物質の構造情報を知っている場合、特定物質の既知の構造情報を学習された物質モデルに代入することによって、特定物質の物性を知ることができる。
図5は、一実施形態に係る物質の探索結果を示すグラフである。
一実施形態において、物質モデルの学習が、分子構造および50、000振動子強度データ(oscillator strength data)(すなわち、物理的特性データである)を表す512個のモーガン指紋データに基づいて実行される。図5のグラフにおいて、縦軸は目標振動子強度値を示し、横軸は一実施形態により決定された新規物質の振動子強度値を示す。図5を参照すれば、目標物性と新規物質の物性の間の関係が互いにほぼ一致していることが分かる。つまり、実施形態に係る物質の探索方法により、新規物質を探索するために物質の探索装置に入力した目標物性とほぼ同一の物性を有する新規物質が探索されたことが分かる。
図6は、他の実施形態に係る物質の探索装置を示すブロック図である。
物質の探索装置600は、プロセッサ(processor)610と、メモリ(memory)620とを含む。物質の探索装置600は、他の装置と有無線通信を行うための通信部(communication unit)630を含むことができる。メモリ620は、プロセッサ610に連結され、プロセッサ610を駆動するための多様な情報、またはプロセッサ610によって実行される少なくとも1つのプログラムを保存することができる。通信部630は、プロセッサ610に連結され、無線信号を送受信することができる。プロセッサ610は、本記載の実施形態で提案した機能、過程、または方法を実現することができる。一実施形態に係る物質の探索装置600の動作はプロセッサ610によって実現される。
本記載の実施形態において、メモリは、プロセッサの内部または外部に位置することができ、メモリは、すでに既知の多様な手段を介してプロセッサに連結される。メモリは、多様な形態の揮発性または不揮発性記憶媒体であり、例えば、メモリは、読取専用メモリ(read−only memory、ROM)またはランダムアクセスメモリ(random access memory、RAM)を含むことができる。
以上、本発明の実施形態について詳細に説明したが、本発明の権利範囲はこれに限定されるものではなく、以下の請求の範囲で定義している本発明の基本概念を利用した当業者の様々な変形および改良形態も本発明の権利範囲に属する。
100 物質の探索装置、
110 学習実行部、
111 物質モデリング部、
112 パラメータアップデータ、
113 学習実行終了部、
120 新規物質決定部、
600 物質の探索装置、
610 プロセッサ、
620 メモリ、
630 通信部。

Claims (20)

  1. 新規物質を探索する方法であって、
    既知物質に基づいてモデリングされた物質モデルに対して学習を行う段階と、
    前記学習の結果に目標物性を入力して少なくとも1つの候補物質を決定する段階と、
    前記少なくとも1つの候補物質の中から前記新規物質を決定する段階と、を含み、
    前記学習を行う段階は、
    前記既知物質の構造に関する第1構造情報、前記既知物質の物性に関する第1物性情報、潜在要因に関する情報と、少なくとも1つの学習パラメータと、に基づいて前記物質モデルをモデリングする段階と、
    前記少なくとも1つの学習パラメータをアップデートする段階と、
    前記学習パラメータのアップデートの結果に基づいて前記学習の終了の有無を決定する段階と、
    を含む新規物質探索方法。
  2. 前記第1構造情報は、前記物質の分子構造に含まれている部分構造に関する情報を含む、請求項に記載の新規物質探索方法。
  3. 前記第1構造情報は、前記物質の分子構造に含まれている原子に関する情報および前記原子の結合に関する情報を含む、請求項に記載の新規物質探索方法。
  4. 前記第1構造情報は、前記物質の分子構造に関する2次元イメージ情報を含む、請求項に記載の新規物質探索方法。
  5. 前記学習パラメータは、前記物質の構造に関する基本値パラメータ、前記物質の物性に関する基本値パラメータ、前記潜在要因の基本値パラメータ、前記物質の構造と前記潜在要因との間の関係パラメータ、前記物質の物性と前記潜在要因との間の関係パラメータのうちの少なくとも1つを含み、
    前記学習を行う段階は、
    前記モデリングする段階の前に、前記学習パラメータをランダムな値に初期化する段階をさらに含む、請求項に記載の新規物質探索方法。
  6. 前記モデリングする段階は、
    前記第1構造情報、前記第1物性情報、および前記学習パラメータに基づいてエネルギー関数をモデリングする段階と、
    前記エネルギー関数に基づいて導出された前記物質モデルの確率関数に基づいて、前記新規物質の構造に関する第2構造情報および前記新規物質の物性に関する第2物性情報を生成する段階と、
    を含む、請求項に記載の新規物質探索方法。
  7. 前記アップデートする段階は、
    前記確率関数および前記エネルギー関数に基づいて導出された前記物質モデルの自由エネルギー関数に基づいて、前記学習パラメータをアップデートする段階を含む、請求項に記載の新規物質探索方法。
  8. 前記自由エネルギー関数に基づいて、前記学習パラメータをアップデートする段階は、
    前記学習パラメータと、前記自由エネルギー関数で表現された目的関数との差を用いて前記学習パラメータをアップデートする段階を含む、請求項に記載の新規物質探索方法。
  9. 前記目的関数は、前記確率関数の微分表現から導出された関数である、請求項に記載の新規物質探索方法。
  10. 前記少なくとも1つの候補物質の中から前記新規物質を決定する段階は、
    前記少なくとも1つの候補物質の物理的妥当性、化学的安定性、または合成容易性のうちの少なくとも1つを検証する段階と、
    前記少なくとも1つの候補物質の中から前記検証が完了した候補物質を前記新規物質として決定する段階と、
    を含む、請求項1に記載の新規物質探索方法。
  11. 新規物質を探索する物質の探索装置であって、
    既知物質に基づいてモデリングされた物質モデルに対して学習を行う学習実行部と、
    前記学習の結果に目標物性を入力して少なくとも1つの候補物質を決定し、前記少なくとも1つの候補物質の中から前記新規物質を決定する新規物質決定部と、を含み、
    前記学習実行部は、
    前記既知物質の構造に関する第1構造情報、前記既知物質の物性に関する第1物性情報、潜在要因に関する情報と、少なくとも1つの学習パラメータと、に基づいて前記物質モデルをモデリングする物質モデリング部と、
    前記少なくとも1つの学習パラメータをアップデートするパラメータアップデータと、
    前記学習パラメータのアップデートの結果に基づいて前記学習の終了の有無を決定する学習実行終了部と、
    を含む新規物質探索装置。
  12. 前記第1構造情報は、前記物質の分子構造に含まれている部分構造に関する情報を含む、請求項11に記載の新規物質探索装置。
  13. 前記第1構造情報は、前記物質の分子構造に含まれている原子に関する情報および前記原子の結合に関する情報を含む、請求項11に記載の新規物質探索装置。
  14. 前記第1構造情報は、前記物質の分子構造に関する2次元イメージ情報を含む、請求項11に記載の新規物質探索装置。
  15. 前記学習パラメータは、前記物質の構造に関する基本値パラメータ、前記物質の物性に関する基本値パラメータ、前記潜在要因の基本値パラメータ、前記物質の構造と前記潜在要因との間の関係パラメータ、前記物質の物性と前記潜在要因との間の関係パラメータのうちの少なくとも1つを含み、
    前記物質モデリング部は、前記モデリングの前に、前記学習パラメータをランダムな値に初期化する、請求項11に記載の新規物質探索装置。
  16. 前記物質モデリング部は、
    前記第1構造情報、前記第1物性情報、および前記学習パラメータに基づいてエネルギー関数をモデリングし、前記エネルギー関数に基づいて導出された前記物質モデルの確率関数に基づいて、前記新規物質の構造に関する第2構造情報および前記新規物質の物性に関する第2物性情報を生成する、請求項11に記載の新規物質探索装置。
  17. 前記パラメータアップデータは、
    前記確率関数および前記エネルギー関数に基づいて導出された前記物質モデルの自由エネルギー関数に基づいて、前記学習パラメータをアップデートする、請求項16に記載の新規物質探索装置。
  18. 前記パラメータアップデータは、
    前記学習パラメータと、前記自由エネルギー関数で表現された目的関数との差を用いて前記学習パラメータをアップデートする、請求項17に記載の新規物質探索装置。
  19. 前記目的関数は、前記確率関数の微分表現から導出された関数である、請求項18に記載の新規物質探索装置。
  20. 前記新規物質決定部は、
    前記少なくとも1つの候補物質の物理的妥当性、化学的安定性、または合成容易性のうちの少なくとも1つを検証し、前記少なくとも1つの候補物質の中から前記検証が完了した候補物質を前記新規物質として決定する、請求項11に記載の新規物質探索装置。
JP2016215596A 2015-11-04 2016-11-02 新規物質探索方法および装置 Active JP6832678B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2015-0154676 2015-11-04
KR1020150154676A KR102457974B1 (ko) 2015-11-04 2015-11-04 신규 물질 탐색 방법 및 장치

Publications (2)

Publication Number Publication Date
JP2017091526A JP2017091526A (ja) 2017-05-25
JP6832678B2 true JP6832678B2 (ja) 2021-02-24

Family

ID=57391748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016215596A Active JP6832678B2 (ja) 2015-11-04 2016-11-02 新規物質探索方法および装置

Country Status (5)

Country Link
US (2) US11017314B2 (ja)
EP (1) EP3168765A1 (ja)
JP (1) JP6832678B2 (ja)
KR (1) KR102457974B1 (ja)
CN (1) CN107025318B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230106725A (ko) 2021-12-17 2023-07-13 디아이씨 가부시끼가이샤 노볼락형 페놀 수지의 탐색 방법, 정보 처리 장치,및 비일시적인 컴퓨터 판독 가능 기록 매체
WO2023243543A1 (ja) 2022-06-15 2023-12-21 Dic株式会社 熱硬化性エポキシ樹脂組成物の探索方法、情報処理装置、及びプログラム
WO2023243544A1 (ja) 2022-06-15 2023-12-21 Dic株式会社 熱硬化性エポキシ樹脂組成物の探索方法、情報処理装置、及びプログラム

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10776712B2 (en) 2015-12-02 2020-09-15 Preferred Networks, Inc. Generative machine learning systems for drug design
KR102523472B1 (ko) * 2016-08-01 2023-04-18 삼성전자주식회사 신규 물질의 구조 생성 방법 및 장치
KR101943518B1 (ko) * 2017-08-28 2019-01-30 한국과학기술연구원 소재의 전자 구조를 예측하는 방법 및 전자 장치
CN111051876B (zh) * 2017-09-06 2023-05-09 株式会社半导体能源研究所 物性预测方法及物性预测系统
KR102587959B1 (ko) * 2018-01-17 2023-10-11 삼성전자주식회사 뉴럴 네트워크를 이용하여 화학 구조를 생성하는 장치 및 방법
JP6705570B2 (ja) 2018-03-27 2020-06-10 日本製鉄株式会社 解析システム、解析方法、およびプログラム
JP7116186B2 (ja) * 2018-09-14 2022-08-09 富士フイルム株式会社 化合物探索方法、化合物探索プログラム、記録媒体、及び化合物探索装置
CN112689877A (zh) * 2018-09-14 2021-04-20 富士胶片株式会社 化合物的合成适用性的评价方法、化合物的合成适用性的评价程序及化合物的合成适用性的评价装置
KR20210064344A (ko) * 2018-09-28 2021-06-02 다우 글로벌 테크놀로지스 엘엘씨 코드 분류를 위한 하이브리드 머신러닝 모델
JP7111354B2 (ja) * 2018-10-15 2022-08-02 国立研究開発法人物質・材料研究機構 探索システムおよび探索方法
WO2020090848A1 (ja) * 2018-10-30 2020-05-07 昭和電工株式会社 材料設計装置、材料設計方法、及び材料設計プログラム
US11901045B2 (en) * 2019-01-15 2024-02-13 International Business Machines Corporation Machine learning framework for finding materials with desired properties
JP7252449B2 (ja) 2019-05-16 2023-04-05 富士通株式会社 最適化装置、最適化システム、最適化方法および最適化プログラム
WO2021015134A1 (ja) * 2019-07-23 2021-01-28 昭和電工株式会社 材料設計システム、材料設計方法、及び材料設計プログラム
JPWO2021038362A1 (ja) 2019-08-29 2021-03-04
JP7353874B2 (ja) * 2019-09-03 2023-10-02 株式会社日立製作所 材料特性予測装置および材料特性予測方法
JP7304778B2 (ja) * 2019-09-05 2023-07-07 株式会社日立製作所 材料特性予測システムおよび情報処理方法
JP7267883B2 (ja) * 2019-09-18 2023-05-02 株式会社日立製作所 材料特性予測システムおよび材料特性予測方法
US20210098084A1 (en) * 2019-09-30 2021-04-01 Nissan North America, Inc. Method and System for Material Screening
CN110838346B (zh) * 2019-10-10 2022-04-26 中国建筑材料科学研究总院有限公司 低辐射玻璃中衬底材料的筛选方法及装置
US11854672B2 (en) 2019-10-10 2023-12-26 Samsung Electronics Co., Ltd. Method and apparatus for generating chemical structure
CN111368041B (zh) * 2020-02-12 2023-12-26 北京科技大学 材料的确定方法及装置
JP7303765B2 (ja) * 2020-03-09 2023-07-05 株式会社豊田中央研究所 材料設計プログラム
US20210287137A1 (en) * 2020-03-13 2021-09-16 Korea University Research And Business Foundation System for predicting optical properties of molecules based on machine learning and method thereof
CN115516456A (zh) * 2020-04-30 2022-12-23 松下知识产权经营株式会社 特性显示装置、特性显示方法以及程序
KR102476300B1 (ko) * 2021-08-11 2022-12-13 기초과학연구원 기계 학습을 이용한 이상 탐지를 위한 장치 및 방법
JP7201763B1 (ja) 2021-09-17 2023-01-10 株式会社神戸製鋼所 試作支援システム、及び、量産支援システム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS639385A (ja) 1986-06-30 1988-01-16 Mitsubishi Electric Corp 磁気映像再生装置
JP3256307B2 (ja) * 1993-01-07 2002-02-12 昭子 板井 生理活性を有するリガンドの分子構造を構築する方法
EP0865890A4 (en) * 1996-08-08 1999-05-26 Bridgestone Corp MULTI-COMPONENT MATERIAL DESIGN METHOD, OPTIMIZATION ANALYZER, AND INFORMATION MEDIUM ON WHICH THE MULTI-COMPONENT MATERIAL OPTIMIZATION PROGRAM IS RECORDED
JPH1055348A (ja) 1996-08-08 1998-02-24 Bridgestone Corp 多成分系材料最適化解析装置および方法
US20050089923A9 (en) 2000-01-07 2005-04-28 Levinson Douglas A. Method and system for planning, performing, and assessing high-throughput screening of multicomponent chemical compositions and solid forms of compounds
US6647342B2 (en) 2000-08-07 2003-11-11 Novodynamics, Inc. Knowledge-based process for the development of materials
US7005130B2 (en) 2001-01-05 2006-02-28 Virginia Tech Intellectual Properties, Inc. Avian hepatitis E virus, vaccines and methods of protecting against avian hepatitis-splenomegaly syndrome and mammalian hepatitis E
JP3525345B2 (ja) 2001-07-27 2004-05-10 和俊 西本 材料成分決定システム及び接合条件決定システム
JP2003058579A (ja) 2001-08-21 2003-02-28 Bridgestone Corp 設計・配合の最適化方法
US20040083083A1 (en) * 2002-10-28 2004-04-29 Necip Doganaksoy Systems and methods for designing a new material that best matches an desired set of properties
US7292958B2 (en) 2004-09-22 2007-11-06 Massachusetts Institute Of Technology Systems and methods for predicting materials properties
JP2006323833A (ja) 2005-04-19 2006-11-30 Zoegene Corp 生理活性化合物の設計方法及び設計装置、並びに生理活性化合物の設計プログラム
JP2009007302A (ja) 2007-06-28 2009-01-15 Nec Corp 仮想スクリーニング方法及び装置
WO2009025045A1 (ja) 2007-08-22 2009-02-26 Fujitsu Limited 化合物の物性予測装置、物性予測方法およびその方法を実施するためのプログラム
US8244504B1 (en) * 2007-12-24 2012-08-14 The University Of North Carolina At Charlotte Computer implemented system for quantifying stability and flexibility relationships in macromolecules
JP2010198561A (ja) 2009-02-27 2010-09-09 Hitachi Chem Co Ltd 物質作用配合解析機構
JP5905781B2 (ja) 2012-06-13 2016-04-20 学校法人沖縄科学技術大学院大学学園 相互作用予測装置、相互作用予測方法、および、プログラム
CN102819647B (zh) 2012-08-15 2016-01-13 西安交通大学 一种非均质材料随机微观结构有限元建模方法
JP5749233B2 (ja) 2012-08-31 2015-07-15 株式会社東芝 材料組織の予測方法及び予測システム
GB201302743D0 (en) 2013-02-18 2013-04-03 Rolls Royce Plc Method and system for designing a material
JP6119411B2 (ja) 2013-05-10 2017-04-26 富士通株式会社 特定プログラム、特定装置、および特定方法
KR102224714B1 (ko) 2013-12-03 2021-03-08 삼성전자주식회사 신규 물질 탐색 시스템 및 그 탐색 방법
CN104007243B (zh) 2014-01-13 2016-01-06 上海市长宁区卫生局卫生监督所 应用反向传播神经网络模型评价游泳池水质的方法
US9529006B1 (en) * 2015-10-13 2016-12-27 King Saud University Method for direct detection of lipid binding agents in membrane

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230106725A (ko) 2021-12-17 2023-07-13 디아이씨 가부시끼가이샤 노볼락형 페놀 수지의 탐색 방법, 정보 처리 장치,및 비일시적인 컴퓨터 판독 가능 기록 매체
WO2023243543A1 (ja) 2022-06-15 2023-12-21 Dic株式会社 熱硬化性エポキシ樹脂組成物の探索方法、情報処理装置、及びプログラム
WO2023243544A1 (ja) 2022-06-15 2023-12-21 Dic株式会社 熱硬化性エポキシ樹脂組成物の探索方法、情報処理装置、及びプログラム
JP7416131B2 (ja) 2022-06-15 2024-01-17 Dic株式会社 熱硬化性エポキシ樹脂組成物の探索方法、情報処理装置、及びプログラム

Also Published As

Publication number Publication date
US20170124482A1 (en) 2017-05-04
US20210241176A1 (en) 2021-08-05
JP2017091526A (ja) 2017-05-25
US11017314B2 (en) 2021-05-25
EP3168765A1 (en) 2017-05-17
CN107025318A (zh) 2017-08-08
CN107025318B (zh) 2021-09-14
KR102457974B1 (ko) 2022-10-21
KR20170052344A (ko) 2017-05-12

Similar Documents

Publication Publication Date Title
JP6832678B2 (ja) 新規物質探索方法および装置
JP7157154B2 (ja) 性能予測ニューラルネットワークを使用したニューラルアーキテクチャ探索
KR102523472B1 (ko) 신규 물질의 구조 생성 방법 및 장치
JP2015095212A (ja) 識別器、識別プログラム、及び識別方法
US20180285769A1 (en) Artificial immune system for fuzzy cognitive map learning
CN111160459A (zh) 超参数的优化装置和方法
US20160246576A1 (en) Computer program generation
Bagheri et al. Modeling of epistemic uncertainty in reliability analysis of structures using a robust genetic algorithm
WO2020046273A1 (en) Fast approximate prediction of material properties of lattice structures
Stepney A pattern language for scientific simulations
US20220351808A1 (en) Systems and methods for reinforcement learning molecular modeling
Öztürk Comparing hyperparameter optimization in cross-and within-project defect prediction: A case study
Cekus et al. Identification of parameters of discrete-continuous models
Zembra et al. Use of physics-augmented neural networks for unsupervised learning of material constitutive relations-Comparison of the NN-Euclid and NN-mCRE methods
Goller et al. Efficient model updating of the goce satellite based on experimental modal data
Seabra et al. Ai enhanced data assimilation and uncertainty quantification applied to geological carbon storage
Galinier et al. Genetic algorithm to improve diversity in MDE
Sadr et al. Improving the neural network method for finite element model updating using homogenous distribution of design points
CN117056452B (zh) 知识点学习路径构建方法、装置、设备以及存储介质
Peteinarelis Frei Otto’s Contribution—Legacy to Parametric Design and Material Computation
JP2006323624A (ja) シーケンス図の類似度計算方法、そのプログラム及び装置
JP7490099B2 (ja) 3dマルチスケールモデリングのシステムおよび方法
Leofante et al. Combining static and runtime methods to achieve safe standing-up for humanoid robots
Li et al. Efficient Data-Driven Modeling of Nonlinear Dynamical Systems via Metalearning
JPWO2021111431A5 (ja)

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190711

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200721

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210202

R150 Certificate of patent or registration of utility model

Ref document number: 6832678

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250