JP7388217B2 - 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム - Google Patents

結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム Download PDF

Info

Publication number
JP7388217B2
JP7388217B2 JP2020018085A JP2020018085A JP7388217B2 JP 7388217 B2 JP7388217 B2 JP 7388217B2 JP 2020018085 A JP2020018085 A JP 2020018085A JP 2020018085 A JP2020018085 A JP 2020018085A JP 7388217 B2 JP7388217 B2 JP 7388217B2
Authority
JP
Japan
Prior art keywords
graph
crystal material
unit cell
atom
loop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020018085A
Other languages
English (en)
Other versions
JP2021124964A (ja
Inventor
知周 栗田
真理 大淵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2020018085A priority Critical patent/JP7388217B2/ja
Priority to EP21152198.4A priority patent/EP3863020A1/en
Priority to US17/151,702 priority patent/US20210241858A1/en
Priority to CN202110136866.5A priority patent/CN113223636A/zh
Publication of JP2021124964A publication Critical patent/JP2021124964A/ja
Application granted granted Critical
Publication of JP7388217B2 publication Critical patent/JP7388217B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/80Data visualisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本件は、結晶材料の解析に有用な結晶材料解析装置、結晶材料解析方法、及び結晶構造解析プログラムに関する。
新しい化学物質の設計、既存の化学物質の特性の予測、及び既存の化学物質の新しい用途の探索などに、コンピュータを用いた評価、予測、及び推論などが用いられている。
例えば、有機化学の分野では、分子の構造、すなわち原子と、原子同士の結合関係とは、図29(酢酸)及び図30(酢酸メチル)のようにノード(球)とエッジ(棒)とを用いたグラフにより表される。そして、グラフを利用したグラフ類似性評価により、又はグラフを入力データとした機械学習により、材料探索、又は設計が行われている。
しかし、結晶材料に関しては、単位格子が周期的にほぼ無限に繰り返されている。そのため、通常、結晶構造をグラフにより表そうとしても、グラフの大きさを決めることができない。そのため、結晶材料をグラフにより表し、類似性評価などの解析を行うことは容易ではない。
特開2011-170444号公報
本件は、結晶材料の解析に有用な結晶材料解析装置、結晶材料解析方法、及び結晶構造解析プログラムを提供することを目的とする。
上記の課題を解決するための手段の一つの実施態様は、以下の通りである。
すなわち、一つの実施態様では、結晶材料解析装置は、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成部と、
前記グラフを用いて結晶材料の解析を行う解析部と、
を有する。
また、一つの実施態様では、結晶材料解析方法は、
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成工程と、
前記ループグラフを用いて結晶材料の解析を行う解析工程と、
を行うことを含む。
また、一つの実施態様では、結晶材料解析プログラムは、
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成することと、
前記ループグラフを用いて結晶材料の解析を行うことと、
を行わせることを含む。
また、一つの実施態様では、結晶材料解析装置は、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成するグラフ作成部と、
前記グラフを複製することにより複製グラフを生成するグラフ複製部と、
前記複製グラフを用いて前記結晶材料の解析を行う解析部と、
を有する。
また、一つの実施態様では、結晶材料解析方法は、
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成するグラフ作成工程と、
前記グラフを複製することにより複製グラフを生成するグラフ複製工程と、
前記複製グラフを用いて前記結晶材料の解析を行う解析工程と、
を行うことを含む。
また、一つの実施態様では、結晶材料解析プログラムは、
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成することと、
前記グラフを複製することにより複製グラフを生成することと、
前記複製グラフを用いて前記結晶材料の解析を行うことと、
を行わせることを含む。
また、一つの実施態様では、結晶材料解析装置は、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成するグラフ作成部と、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うグラフ複製部と、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行う解析部と、
を有する。
また、一つの実施態様では、結晶材料解析方法は、
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成するグラフ作成工程と、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うグラフ複製工程と、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行う解析工程と、
を行うことを含む。
また、一つの実施態様では、結晶材料解析プログラムは、
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成することと、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うことと、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行うことと、
を行わせることを含む。
一つの側面では、結晶材料の解析に有用な結晶材料解析装置を提供できる。
また、一つの側面では、結晶材料の解析に有用な結晶材料解析方法を提供できる。
また、一つの側面では、結晶材料の解析に有用な結晶材料解析プログラムを提供できる。
図1は、本件の結晶材料解析装置の構成例を表す図である。 図2は、本件の結晶材料解析装置の他の構成例を表す図である。 図3は、本件の結晶材料解析装置の他の構成例を表す図である。 図4は、本件の結晶材料解析装置の一実施形態としての機能構成例を示す図である。 図5は、本件の結晶材料解析装置の他の実施形態としての機能構成例を示す図である。 図6は、本件の結晶材料解析装置の他の実施形態としての機能構成例を示す図である。 図7は、結晶材料の結晶構造の一例の模式図である。 図8は、単位格子のグラフの一例である。 図9は、結晶材料の結晶構造の他の例の模式図である。 図10は、本件の技術のグラフ化により作成した、図7の結晶構造の単位格子のグラフ(ループグラフ)である。 図11は、本件の技術のグラフ化により作成した、図9の結晶構造の単位格子のグラフ(ループグラフ)である。 図12は、本件で開示する技術の第一の実施形態の一例を用いて結晶構造を解析する際のフローチャートである。 図13Aは、ループグラフの作成方法の一例のフローチャートである(その1)。 図13Bは、ループグラフの作成方法の一例のフローチャートである(その2)。 図13Cは、ループグラフの作成方法の一例のフローチャートである(その3)。 図14Aは、第一の実施形態において、従来のグラフとループグラフとの類似度を比較した一例を説明するための図である(その1)。 図14Bは、第一の実施形態において、従来のグラフとループグラフとの類似度を比較した一例を説明するための図である(その2)。 図14Cは、第一の実施形態において、従来のグラフとループグラフとの類似度を比較した一例を説明するための図である(その3)。 図15Aは、第二の実施形態の一例を簡単に説明するための図である(その1)。 図15Bは、第二の実施形態の一例を簡単に説明するための図である(その2)。 図15Cは、第二の実施形態の一例を簡単に説明するための図である(その3)。 図16Aは、第二の実施形態の利点を説明するための図である(その1)。 図16Bは、第二の実施形態の利点を説明するための図である(その2)。 図17は、本件で開示する技術の第二の実施形態の一例を用いて結晶構造を解析する際のフローチャートである。 図18Aは、第二の実施形態の実施例を説明するための図である(その1)。 図18Bは、第二の実施形態の実施例を説明するための図である(その2)。 図18Cは、第二の実施形態の実施例を説明するための図である(その3)。 図19Aは、第二の実施形態の実施例を説明するための図である(その4)。 図19Bは、第二の実施形態の実施例を説明するための図である(その5)。 図19Cは、第二の実施形態の実施例を説明するための図である(その6)。 図20Aは、第二の実施形態の実施例を説明するための図である(その7)。 図20Bは、第二の実施形態の実施例を説明するための図である(その8)。 図20Cは、第二の実施形態の実施例を説明するための図である(その9)。 図21Aは、第二の実施形態の実施例を説明するための図である(その10)。 図21Bは、第二の実施形態の実施例を説明するための図である(その11)。 図21Cは、第二の実施形態の実施例を説明するための図である(その12)。 図22Aは、第三の実施形態におけるグラフの複製を説明するための模式図である(その1)。 図22Bは、第三の実施形態におけるグラフの複製を説明するための模式図である(その2)。 図23Aは、ホスト格子を作成する際の単位格子を複製する数の決め方の一例を説明するための図である(その1)。 図23Bは、ホスト格子を作成する際の単位格子を複製する数の決め方の一例を説明するための図である(その2)。 図24は、本件で開示する技術の第三の実施形態の一例を用いて結晶構造を解析する際のフローチャートである。 図25Aは、第三の実施形態の実施例を説明するための図である(その1)。 図25Bは、第三の実施形態の実施例を説明するための図である(その2)。 図25Cは、第三の実施形態の実施例を説明するための図である(その3)。 図26は、単位格子Aから形成されるグラフ(単純グラフ、拡張グラフ、ループグラフ)の概念図である。 図27は、単位格子Bから形成されるグラフ(単純グラフ、拡張グラフ、ループグラフ)の概念図である。 図28は、単位格子Aから形成される、拡張ノード間にエッジを有する拡張グラフの概念図である。 図29は、酢酸のグラフである。 図30は、酢酸メチルのグラフである。
(結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム)
本件の結晶材料解析装置は、グラフ作成部と、解析部とを有し、更に必要に応じて、グラフ複製部、グラフデータベースなどを有する。
本件の結晶材料解析方法は、コンピュータが、グラフ作成工程と、解析工程とを行うことを含み、更に必要に応じて、グラフ複製工程などを行うこと含む。
本件の結晶材料解析プログラムは、コンピュータに、グラフ作成と、解析とを行わせ、更に必要に応じて、グラフ複製などを行わせる。
本件の結晶材料解析装置は、例えば、本件の結晶材料解析方法を行う。
本件の結晶材料解析方法は、例えば、本件の結晶材料解析プログラムにより行われる。
結晶材料解析装置は、例えば、メモリと、プロセッサとを有し、更に必要に応じて、その他のユニットを有する。
プロセッサは、メモリに結合されている。
プロセッサは、例えば、グラフ作成工程を実行するように構成されている。
プロセッサは、例えば、グラフ複製工程を実行するように構成されている。
プロセッサは、例えば、解析工程を実行するように構成されている。
プロセッサは、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)又はその組み合わせである。
本件において、グラフは、原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有する。
グラフは、結晶材料の1つの単位格子内の原子を示すノード(以下、「格子内ノード」と称することがある)を有する。
グラフは、単位格子内の原子間の化学結合を示すエッジ(以下、「格子内エッジ」と称することがある)を有する。
グラフは、単位格子内の原子Xと化学結合を有する原子Y’であって単位格子に隣接する隣接単位格子(以下、単に「隣接単位格子」と称することがある)内の原子Y’に対応する単位格子内の原子Yと、単位格子内の原子Xとの仮想的な化学結合を示すエッジ(以下、「ループエッジ」と称することがある)を有することがある。ここで、隣接単位格子内の原子Y’に対応する単位格子内の原子Yとは、隣接単位格子と単位格子とを構成原子が重なるように重ねた際に、隣接単位格子の原子Y’と重なる単位格子内の原子を意味する。
グラフは、単位格子内の原子と化学結合を有する原子であって単位格子に隣接する隣接単位格子内の原子を示すノード(以下、「拡張ノード」と称することがある)を有することがある。
グラフは、格子内ノードに当たる原子と拡張ノードに当たる原子との間の化学結合を示すエッジ(以下、「拡張エッジ」と称することがある)を有することがある。
グラフは、拡張ノードに当たる2つの原子間の化学結合を示すエッジ(以下、「拡張ノード間エッジ」と称することがある)を有していてもよい。
グラフは、例えば、グラフデータベースに格納されている。
グラフ作成部は、グラフを作成する。
グラフ作成工程では、グラフを作成する。
グラフは、原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有する。グラフとは、ノード(頂点)群とノード間の連結関係を表すエッジ(枝)群で構成される抽象データ型である。グラフは、G=(V,E)で表され、Vはノードの集合であり、Eはエッジの集合である。Vは有限の集合であり、EはVから選んだ2つの元からなる集合の集合である。
格子内ノード、及び拡張ノードは、例えば、原子の種類、原子の価数、原子の電荷などのデータを有する。
格子内エッジ、ループエッジ、及び拡張エッジは、例えば、結合の種類、結合の角度、結合の距離、結合次数などのデータを有する。結合の角度、及び結合の距離は、例えば、原子又は化学結合の座標データとして有されている。
格子内エッジ、ループエッジ、及び拡張エッジは、例えば、ノード間のボロノイ分割により作成されることが好ましい。
ボロノイ分割とは、隣り合うノード間を結ぶ直線に垂直二等分線を引き、各ノードの最近隣領域を分割する手法である。
ここで、ボロノイ図及びボロノイ分割について簡単に説明する。
ボロノイ図(Voronoi diagram)は、ある距離空間上の任意の位置に配置された複数個の点(母点)に対して、同一距離空間上の他の点がどの母点に近いかによって領域分けされた図のことである。また、その領域分けをボロノイ分割という。母点の位置のみによって分割パターンが決定される。
結晶材料の単位格子を、化学結合を含めて模式的に表す場合、結晶材料の単位格子の化学結合は、通常、一意に定まるものではない。しかし、ボロノイ分割によりエッジ(格子内エッジ、ループエッジ、拡張エッジ)を作成することで、エッジ(格子内エッジ、ループエッジ、拡張エッジ)を一意に定めることができる。その結果、複数の結晶材料について、一意にエッジを定めることができるため、結晶材料の解析の精度を高めることができる。
また、格子内エッジ、ループエッジ、及び拡張エッジは、例えば、原子の標準イオン半径に基づいて作成されてもよい。例えば、任意の2つのノード間の距離をd、各ノードのイオン半径をr1、r2としたときに、d≦a(r1+r2)+bであれば、ノード間のエッジが作成される、というルールが適用されてもよい。ここで、aは0以上の定数、bは定数である。1.0≦a≦1.2、0Å≦b≦0.4Åが好ましいが、この値に限らない。
格子内エッジ、ループエッジ、及び拡張エッジの作成方法は、上記のボロノイ分割による方法、標準イオン半径を利用する方法の2つから、片方または両方を自由に選択することができる。両方を選択する場合は、例えば、ボロノイ分割により定めることができる格子内エッジ、ループエッジ、及び拡張エッジのうち、原子の標準イオン半径を利用する方法で格子内エッジ、ループエッジ、及び拡張エッジと見なされるもののみを、格子内エッジ、ループエッジ、及び拡張エッジとして作成してもよい。
結晶材料としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、有機化合物、無機化合物、タンパク質、ポリマーなどが挙げられる。
グラフ複製部は、グラフを複製する。
グラフ複製工程では、グラフを複製する。
グラフの複製方法としては、特に制限はなく、目的に応じて適宜選択することができる。
解析部においては、グラフを用いて結晶材料の解析を行う。
解析工程では、グラフを用いて結晶材料の解析を行う。
結晶材料の解析としては、例えば、複数の結晶材料の結晶構造の類似性の分析、結晶材料の特性の予測などが挙げられる。
複数の結晶材料の結晶構造の類似性の分析の方法としては、本件の技術のグラフを用いて、ある結晶材料の結晶構造と他の結晶材料の結晶構造との類似性を分析する方法であれば、特に制限はなく、目的に応じて適宜選択することができ、例えば、類似度のスコアを算出し、スコアが大きいほど類似性が高いと判断する方法などが挙げられる。
類似度のスコアを算出する方法としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、以下の方法(1)及び(2)などが挙げられる。
(1)フィンガープリント法
(2)化合物間において共通する部分構造の探索を、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより化合物の類似性の分析を行う手法(例えば、以下の非特許文献X参照)
非特許文献X:Maritza Hernandez, Arman Zaribafiyan, Maliheh Aramon, Mohammad Naghibi “A Novel Graph-based Approach for Determining Molecular Similarity”. arXiv:1601.06693(https://arxiv.org/pdf/1601.06693.pdf)
フィンガープリント法では、例えば、問い合わせ化合物における部分構造が、比較対象の化合物に含まれているか否かを、0又は1で表して類似度を評価する。
最大独立集合問題とは、グラフ理論において、与えられたグラフG(V,E)に対して、頂点集合V’⊆VのうちV’内の頂点間に枝(エッジ)が存在しないようなもの(独立集合)で大きさが最大のものを求める問題である。
なお、類似度のスコアの算出の方法はこれらの方法に限定されず、例えば、類似度の計算に関するコサイン類似度、相関係数、相関関数、編集距離(レーベンシュタイン距離ともいう)などにより類似度のスコアを算出してもよい。
結晶材料の特性の予測の方法としては、本件の技術のグラフを用いて結晶材料の特性の予測を行う方法であれば、特に制限はなく、目的に応じて適宜選択することができ、例えば、学習モデルを用いた特性の予測などが挙げられる。
学習モデルを用いた特性の予測としては、例えば、機械学習により学習モデルを作成し、当該学習モデルを用いて結晶材料の特性の予測を行う方法などが挙げられる。
機械学習としては、例えば、教師あり学習、教師なし学習などが挙げられる。
機械学習により学習モデルを作成する際の学習の方法としては、特に制限はなく、目的に応じて適宜選択することができる。
機械学習における教師データは、例えば、本件の技術のグラフと、当該グラフに当たる結晶材料の特性のデータとを有する。
特性としては、特に制限はなく、目的に応じて適宜選択することができ、化学的特性であってもよいし、物理的特性であってもよい。特性の具体例としては、例えば、電気伝導性、イオン導電性、放電電位、比誘電率、熱伝導率、比熱などが挙げられる。
教師あり学習の場合、例えば、ある結晶材料のグラフと、その結晶材料の特性をラベルとして有する教師データのデータセットを用い、学習を行う。
また、特性の予測を行う際には、本件の技術のグラフ(グラフ構造のデータ)を加工して用いてもよい。例えば、グラフをテンソルに変換することで、機械学習(例えば、深層学習)技術を用いてグラフ構造のデータを高精度に学習することができる。
ここで、テンソルとは、行列、ベクトルなどの概念を一般化した、多次元の配列で表現したデータを意味する。
本件で開示する結晶材料解析プログラムは、内蔵ハードディスク、外付けハードディスクなどの記録媒体に記録しておいてもよいし、CD-ROM、DVD-ROM、MOディスク、USBメモリなどの記録媒体に記録しておいてもよい。
さらに、本件で開示する結晶材料解析プログラムを、上記の記録媒体に記録する場合には、必要に応じて、コンピュータシステムが有する記録媒体読取装置を通じて、これを直接又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータなど)に本件で開示する結晶材料解析プログラムを記録しておいてもよい。この場合、外部記憶領域に記録された本件の結晶材料解析プログラムは、必要に応じて、外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することができる。
なお、本件の結晶材料解析プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。
本件で開示する記録媒体は、本件の結晶材料解析プログラムを記録してなる。
記録媒体は、コンピュータが読み取り可能である。
記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、CD-ROM、DVD-ROM、MOディスク、USBメモリなどが挙げられる。
また、記録媒体は、本件で開示する結晶材料解析プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。
記録媒体は、一過性であってもよいし、非一過性であってもよい。
図1に、本件の結晶材料解析装置のハードウェア構成例を示す。
結晶材料解析装置10においては、例えば、制御部11、メモリ12、記憶部13、表示部14、入力部15、出力部16、及びI/Oインターフェース部17がシステムバス18を介して接続されている。
制御部11は、演算(四則演算、比較演算、焼き鈍し法の演算等)、ハードウェア及びソフトウェアの動作制御などを行う。
制御部11としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、CPU(Central Processing Unit)であってもよい。
本件で開示する結晶材料解析装置におけるグラフ作成部、グラフ複製部、及び解析部は、例えば、制御部11により実現することができる。
メモリ12は、RAM(Random Access Memory)、ROM(Read Only Memory)などのメモリである。RAMは、ROM及び記憶部13から読み出されたOS(Operating System)及びアプリケーションプログラムなどを記憶し、制御部11の主メモリ及びワークエリアとして機能する。
記憶部13は、各種プログラム及びデータを記憶する装置であり、例えば、ハードディスクである。記憶部13には、制御部11が実行するプログラム、プログラム実行に必要なデータ、OSなどが格納される。例えば、グラフデータベースは、記憶部13に格納される。
また、本件で開示する結晶材料解析プログラムは、例えば、記憶部13に格納され、メモリ12のRAM(主メモリ)にロードされ、制御部11により実行される。
表示部14は、表示装置であり、例えば、CRTモニタ、液晶パネルなどのディスプレイ装置である。
入力部15は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス(例えば、マウス等)などである。
出力部16は、各種データの出力装置であり、例えば、プリンタなどである。
I/Oインターフェース部17は、各種の外部装置を接続するためのインターフェースである。I/Oインターフェース部17は、例えば、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、MOディスク(Magneto-Optical disk)、USBメモリ〔USB(Universal Serial Bus) flash drive〕などのデータの入出力を可能にする。
図2に、本件で開示する結晶材料解析装置の他のハードウェア構成例を示す。
図2に示す結晶材料解析装置は、結晶材料解析装置をクラウド型にした場合の例であり、制御部11が、記憶部13などとは独立している。図2に示す例においては、ネットワークインターフェース部19、20を介して、記憶部13などを格納するコンピュータ30と、制御部11を格納するコンピュータ40とが接続される。
ネットワークインターフェース部19、20は、インターネットを利用して、通信を行うハードウェアである。
図3に、本件で開示する結晶材料解析装置の他のハードウェア構成例を示す。
図3に示す結晶材料解析装置は、結晶材料解析装置をクラウド型にした場合の例であり、記憶部13が、制御部11などとは独立している。図3に示す例においては、ネットワークインターフェース部19、20を介して、制御部11等を格納するコンピュータ30と、記憶部13を格納するコンピュータ40とが接続される。
図4に、本件で開示する結晶材料解析装置の一実施形態としての機能構成例を示す。
図4に示す結晶材料解析装置1Aは、グラフ作成部2、及び解析部4を有する。
図5に、本件で開示する結晶材料解析装置の他の実施形態としての機能構成例を示す。
図5に示す結晶材料解析装置1Bは、グラフ作成部2、解析部4及び、グラフデータベース5を有する。
図6に、本件で開示する結晶材料解析装置の一実施形態としての機能構成例を示す。
図6に示す結晶材料解析装置1Cは、グラフ作成部2、グラフ複製部3、及び解析部4を有する。
<第一の実施形態>
開示の技術の第一の実施形態の結晶材料解析装置は、グラフ作成部と、解析部とを有する。
開示の技術の第一の実施形態の結晶材料解析方法は、コンピュータが、グラフ作成工程と、解析工程とを行うことを含む。
開示の技術の第一の実施形態の結晶材料プログラムは、コンピュータに、グラフ作成と、解析とを行わせることを含む。
グラフ作成部は、格子内ノードと、格子内エッジと、ループエッジとを有するグラフ(以下、「ループグラフ」と称することがある)を作成する。
グラフ作成工程では、ループグラフを作成する。
解析部は、グラフを用いて結晶材料の解析を行う。
解析工程では、グラフを用いて結晶材料の解析を行う。
例えば、グラフ作成では、ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成する。
例えば、解析では、第1ループグラフと第2ループグラフとを用いて、第1結晶材料と第2結晶材料との類似性の分析を行う。
類似性の分析は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む。
コンフリフトグラフは、グラフ化した第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
コンフリクトグラフの最大独立集合の探索は、例えば、最小化することが最大独立集合の探索をすることを意味するハミルトニアンを用いることにより行うことができる。より具体的には、例えば、下記の式(A)に示すハミルトニアン(H)を用いることにより行うことができる。
Figure 0007388217000001
ここで、上記式(A)において、nは、コンフリクトグラフにおけるノードの数であり、biは、i番目のノードに対するバイアスを表す数値である。
さらに、wijは、i番目のノードとj番目のノードとの間にエッジが存在するときは、0ではない正の数であり、i番目のノードとj番目のノードとの間にエッジが存在しないときは、0である。
また、xiは、i番目のノードが0又は1であることを表すバイナリ変数であり、xjは、j番目のノードが0又は1であることを表すバイナリ変数である。
なお、α及びβは、正の数である。
アニーリングマシンとしては、イジングモデルで表されるエネルギー関数について基底状態探索を行なうアニーリング方式を採用するコンピュータであれば特に制限はなく、目的に応じて適宜選択することができる。アニーリングマシンとしては、例えば、量子アニーリングマシン、半導体技術を用いた半導体アニーリングマシン、CPUやGPU(Graphics Processing Unit)を用いてソフトウェアにより実行されるシミュレーテッド・アニーリング(Simulated Annealing)を行うマシンなどが挙げられる。また、アニーリングマシンとしては、例えば、デジタルアニーラ(登録商標)を用いてもよい。
ここで、第一の実施形態の利点を説明する。
図7は、結晶材料の結晶構造の模式図である。図7の結晶材料は、単位格子内に区別可能な9種類の原子(原子A~原子I)を有する。
結晶構造は、単位格子の無限の繰り返しにより構成される。そのため、通常、結晶構造をグラフで表そうとしても、無理であるか、ある程度の大きさに限定したとしても、非常に多くのノード及びエッジが必要になる。
他方、単位格子をグラフで表しても、そのグラフでは、1つの結晶構造のみを表すことができず、複数の結晶構造を含むことになる場合がある。その一例を説明する。
図7において、結晶材料の結晶構造100Xは、原子A~原子Iを含む単位格子100を繰り返し単位として有する。なお、図7において、上下左右の点線は、単位格子100が繰り返されていることを意味する。
もしも、図7の結晶構造100Xの単位格子100をグラフで表すと、通常、図8のようになる。
図8は、単位格子100のグラフの一例である。図8のグラフは、原子Aを示すノード101A(格子内ノード)と、原子Bを示すノード101B(格子内ノード)と、原子Aと原子Bとの化学結合を示すエッジ102(格子内エッジ)とを有する。なお、符号を省略しているが、図8のグラフには、更に、7つの格子内ノードと、11つの格子内エッジとを有する。
ここで、単位格子100を繰り返し単位として有する結晶構造は、図7の結晶構造100Xの他に、図9の結晶構造100Yなどもある。なお、図9において、上下左右の点線は、単位格子100が繰り返されていることを意味する。
そして、図7の結晶構造100Xの単位格子100を図8のグラフで表した方法と同じ方法で図9の結晶構造100Yの単位格子をグラフで表すと、図8となる。
そうすると、図8のグラフでは、1つの結晶構造のみを表したことにはならない。
他方、本件の技術の第一の実施形態で作成されるグラフでは、図7の結晶構造に対応するグラフは、図10のようなループグラフとなる。図10は、図7の結晶構造の単位格子100に関するループグラフである。
図10のループグラフは、単位格子100内の原子Aを示すノード101A(格子内ノード)と、単位格子100内の原子Bを示すノード101B(格子内ノード)と、単位格子100内の原子Cを示すノード101C(格子内ノード)と、更に、符号を付していない6つの格子内ノードを有する。
また、図10のループグラフは、単位格子100内の原子Aと原子Bとの結合関係を示すエッジ102(格子内エッジ)と、更に、符号を付していない11つの格子内エッジを有する。
更に、図10のループグラフは、合計6つのループエッジを有する。その2つがエッジ111、及びエッジ112である。なお、図10のループグラフにおいて、左側のエッジ111と、右側のエッジ111とは、同一のループエッジである。また、図10のループグラフにおいて、上側のエッジ112と、下側のエッジ112とは、同一のループエッジである。
エッジ111(ループエッジ)は、単位格子100内の原子Aと化学結合を有する隣接単位格子内の原子Cに対応する単位格子100内の原子Cと、単位格子100内の原子Aとの仮想的な化学結合を示す。なお、エッジ111は、単位格子100内の原子Cと化学結合を有する隣接単位格子内の原子Aに対応する単位格子100内の原子Aと、単位格子100内の原子Cとの仮想的な化学結合を示すものでもある。
エッジ112(ループエッジ)は、単位格子100内の原子Aと化学結合を有する隣接単位格子内の原子Gに対応する単位格子100内の原子Gと、単位格子100内の原子Aとの仮想的な化学結合を示す。なお、エッジ112は、単位格子100内の原子Gと化学結合を有する隣接単位格子内の原子Aに対応する単位格子100内の原子Aと、単位格子100内の原子Gとの仮想的な化学結合を示すものでもある。
このように、グラフに、ループエッジを設けることで、グラフのノードを増やさずに、単位格子の繰り返し構造の情報(単位格子の並び方の情報)を有するグラフを得ることができる。
一方、本件の技術の第一の実施形態で作成されるグラフでは、図9の結晶構造に対応するグラフは、図11のようなループグラフとなる。図11は、図9の結晶構造の単位格子100に関するループグラフである。
ここで、図11のループグラフにおいては、合計6つのループエッジを有する点は、図10のループグラフと同じである。そして、その2つがエッジ111’、及びエッジ112’である。なお、図11のループグラフにおいて、左側のエッジ111’と、右側のエッジ111’とは、同一のループエッジである。また、図11のループグラフにおいて、上側のエッジ112’と、下側のエッジ112’とは、同一のループエッジである。
エッジ111’(ループエッジ)は、単位格子100内の原子Aと化学結合を有する隣接単位格子内の原子Cに対応する単位格子100内の原子Cと、単位格子100内の原子Aとの仮想的な化学結合を示す。なお、エッジ111’は、単位格子100内の原子Cと化学結合を有する隣接単位格子内の原子Aに対応する単位格子100内の原子Aと、単位格子100内の原子Cとの仮想的な化学結合を示すものでもある。
エッジ112’(ループエッジ)は、単位格子100内の原子Aと化学結合を有する隣接単位格子内の原子Iに対応する単位格子100内の原子Iと、単位格子100内の原子Aとの仮想的な化学結合を示す。なお、エッジ112’は、単位格子100内の原子Iと化学結合を有する隣接単位格子内の原子Aに対応する単位格子100内の原子Aと、単位格子100内の原子Iとの仮想的な化学結合を示すものでもある。
ここで、エッジ111とエッジ111’とは同じエッジであるが、エッジ112とエッジ112’とは異なるエッジである。このエッジ112とエッジ112’との違いにより、図10のループグラフと、図11のループグラフとは異なるグラフとなる。
以上をまとめると、単位格子を図8のようにグラフ化すると、1つの結晶構造のみを表したことにはならない。
一方で、第一の実施形態のグラフ化の技術では、単位格子が同じであるが、結晶構造が異なる2以上の結晶構造を、異なったグラフで表すことができる。
結晶構造が異なる2以上の結晶構造を異なったグラフで表すことができれば、結晶材料の解析(例えば、結晶材料の類似性の分析、及び結晶材料の特性の予測など)において、解析精度を高くすることができる。
また、ノードの数は、計算機のビット数に影響を与えることがあるため、少ない方がよい。他方、エッジの数は、解析の精度に影響を与えることがあるため、多い方がよい。ここで、ループグラフは、ループエッジを含まない一般的なグラフと比べて、ノードの数を増やさずに、エッジの数を増やすことができる。
そのため、ループグラフは、計算機のビット数を増やさずに解析精度を高めることが期待できる。
そのため、第一の実施形態のグラフ化の技術は、コンピュータ技術を用いた結晶材料の解析に有用である。
第一の実施形態における結晶材料解析方法について、図12に示すフローチャートを用いて簡単に説明する。
まず、他のデータベースから結晶構造データを抜き出す(S1)。他のデータベースとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、無機結晶構造データベース(Inorganic Crystal Structure Database:ICSD)などが挙げられる。なお、抜き出す結晶構造データの数、種類としては、特に制限はなく、目的に応じて適宜選択することができる。例えば、ある特定の元素を有する化学物質の結晶構造データのみを抜き出してもよい。
次に、抜き出された結晶構造データを用いて、本件の技術のグラフ化により、ループグラフを作成し、当該ループグラフを有するグラフデータベースを作成する(S2)。ループグラフの作成は、例えば、後述するフローチャートに従って行う。
次に、グラフデータベースのループグラフを用いて結晶構造の解析を行う(S3)。解析としては、例えば、類似性評価が挙げられる。類似性評価は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより行う。当該方法は、例えば、以下の非特許文献を参照して行うことができる。
非特許文献:Maritza Hernandez, Arman Zaribafiyan, Maliheh Aramon, Mohammad Naghibi “A Novel Graph-based Approach for Determining Molecular Similarity”. arXiv:1601.06693(https://arxiv.org/pdf/1601.06693.pdf)
以上により、結晶構造の解析の一つである結晶構造の類似性評価を行うことができる。
ここで、ループグラフの作成方法の一例をフローチャートを用いて説明する。図13A~図13Cは、ループグラフの作成方法の一例のフローチャートである。
まず、結晶材料データを読み込む(S101)。
次に、単一単位格子内の全原子の相対座標を計算する(S102)。そうすることで、全原子の相対的な位置関係を得る。
次に、単一単位格子内の全原子をグラフのノードとする(S103)。このノードは格子内ノードである。
次に、単一単位格子内の全原子のうち、ある原子(原子A)とある原子以外の他の原子(原子B)の2つの原子の組み合わせ(A,B)について、A-B間の距離が結合距離として適切かどうかを判断する(S106)。そして、適切な場合には、ノードA-ノードBを結合する(S107)。即ち、ノードA-ノードB間に相当するエッジを設ける。このエッジは格子内エッジである。その後、ある原子(原子A)と更に他の原子Bとの組み合わせの全てについて、S106を行う(S105、及びS108)。適切ではない場合には、ノードA-ノードB間に相当するエッジを設けることはせず、ある原子(原子A)と更に他の原子Bとの組み合わせの全てについて、S106を行う(S105、及びS108)。
次に、単一単位格子内のある原子(原子A)と、隣接単位格子内の任意の原子B’との間で、結合A-B’と等価な結合が既にあるどうかを判断する(S110)。結合A-B’と等価な結合がまだない場合には、A-B’間の距離が結合距離として適切かどうかを判断する(S111)。A-B’間の距離が結合距離として適切な場合、B’に対応するノードが既に存在するかどうかを判断する(S112)。その後、B’に対応するノードがまだない場合、原子B’を拡張ノードとして追加する(S113)。その後、ノードA-ノードB’を結合する(S114)。即ち、ノードA-ノードB’間に相当するエッジを設ける。S112の判断を行った結果、B’に対応するノードが既に存在する場合、ノードA-ノードB’を結合する(S114)。S110の判断を行った結果、A-B’間の距離が結合距離として適切ではない場合、S111の判断を行った結果、B’に対応するノードが既に存在する場合、及びS114を行った後には、ある原子(原子A)と更に他の原子B’との組み合わせの全てについて、S109及びS115間の工程を行う。
S105~S115までの工程を、単一単位格子内のある原子Aに相当する原子の全てについて行う(S104、及びS116)。
次に、拡張ノードB’と等価な単位格子内ノードA’を見出す(S118)。そして、拡張ノードB’をノードA’とみなす(S119)。そうすると、ノードA-ノードA’間に相当するエッジは、ループエッジとなる。これらの工程を、拡張ノードの全てにおいて行う(S117、及びS120)。
そうすることで、ループグラフが得られる。
ここで、従来のグラフとループグラフとの類似度を比較した一例を、図14A~図14Cを用いて説明する。
図14Aに示すような、A~Lの12種類の区別可能な原子により構成された結晶構造を用いる。この結晶構造から、図14Aに示す単位格子Aと単位格子Bとの2通りの単位格子が認識できる場合を考える。
従来のグラフ化の技術では、単位格子Aについて作成したグラフは、図14Bに示すグラフA-1となり、単位格子Bについて作成したグラフは、図14Bに示すグラフB-1となる。グラフA-1及びグラフB-1について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は、6原子(A,C,F,H,J,L)となり、後述する式(1-1)による類似度は、0.50となった。
他方、第一の実施形態のグラフ化の技術によりループグラフを作成した場合、単位格子Aについて作成したグラフは、図14Cに示すグラフA-2となり、単位格子Bについて作成したグラフは、図14Cに示すグラフB-2となる。グラフA-2及びグラフB-2について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は12原子となり、後述する式(1-1)による類似度は、1.00となった。
単位格子Aと単位格子Bとは、同じ結晶構造の単位格子である。そのため、単位格子Aについて作成したグラフと、単位格子Bについて作成したグラフとでは、類似度が1.00である方が、精度が高い計算結果である。
このように、ループグラフを用いると、解析(例えば、類似度)の精度を高めることができる。
<第二の実施形態>
開示の技術の第二の実施形態の結晶材料解析装置は、グラフ作成部と、グラフ複製部と、解析部とを有する。
開示の技術の第二の実施形態の結晶材料解析方法は、コンピュータが、グラフ作成工程と、グラフ複製工程と、解析工程とを行うことを含む。
開示の技術の第二の実施形態の結晶材料プログラムは、コンピュータに、グラフ作成と、グラフ作成と、解析とを行わせることを含む。
グラフ作成部は、格子内ノードと、格子内エッジとを有するグラフを作成する。
グラフ作成工程では、格子内ノードと、格子内エッジとを有するグラフを作成する。
グラフ作成では、格子内ノードと、格子内エッジと、拡張ノードと、拡張エッジとを有するグラフ(以下、「拡張グラフ」と称することがある)を作成してもよい。拡張グラフは、拡張ノード間エッジを有していてもよい。
グラフ作成では、ループグラフを作成してもよい。
なお、以下において、ノードとして格子内ノードのみを有し、エッジとして格子内エッジのみを有するグラフを「単純グラフ」と称することがある。
グラフ複製部は、グラフを複製することにより複製グラフを生成する。
グラフ複製工程では、グラフを複製することにより複製グラフを生成する。
解析部は、複製グラフを用いて結晶材料の解析を行う。
解析工程では、複製グラフを用いて結晶材料の解析を行う。
例えば、グラフ作成では、グラフとしての第1結晶材料の単位格子の第1グラフと、グラフとしての第2結晶材料の単位格子の第2グラフとを作成する。
例えば、グラフ複製では、第1グラフ及び第2グラフの少なくともいずれかを複製する。
第1グラフ及び第2グラフの少なくともいずれかの複製は、例えば、複製後の複数の第1グラフのノード数の合計と、複製後の複数の第2グラフのノード数の合計との差の絶対値が最小となるように行う。
例えば、解析では、第1グラフ及び第1統合グラフのいずれかと、第2グラフ及び第2統合グラフのいずれかとを用いて、第1結晶材料と第2結晶材料との類似性の分析を行う。
第1統合グラフは、第1グラフを複製することによって生成された複数の第1複製グラフを互いに統合して得られる。
第2統合グラフは、第2グラフを複製することによって生成された複数の第2複製グラフを互いに統合して得られる。
ここで、複製したグラフを統合して得られるグラフ(以下、「統合グラフ」と称することがある)としては、例えば、複製により得られた複数のグラフを単にひとまとめにしたグラフであってもよい。この場合、複数のグラフの間にはエッジはない。
また、複製したグラフを統合して得られるグラフとしては、例えば、複製により得られた複数のグラフをエッジ(以下、「グラフ間エッジ」と称することがある)により結合して得られるグラフであってもよい。この場合、グラフ間エッジは、統合グラフが、結晶材料の構造と一致するように複数のグラフ間に追加されることが好ましい。
類似性の分析は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む。
ここで、第二の実施形態の一例を簡単に説明すると以下の通りである。
以下では、2つの結晶材料のグラフのそれぞれを複製する場合を示すが、片方のグラフのみを複製してもよい。
図15Aに示す2つの単位格子Aと単位格子Bとの解析を行うとする。解析としては類似度の計算を例にとる。ここで、単位格子Aの単純グラフをグラフAとする。単位格子Bの単純グラフをグラフBとする。グラフAのノード数と、グラフBのノード数とが異なる場合、その差に起因して、類似度が低下する。理由は後述する。
そこで、グラフAのノード数と、グラフBのノード数とを近づけるために、グラフA及びグラフBの少なくともいずれかを複製する。複製は、例えば、複製後のグラフAのノード数の合計と、複製後のグラフBのノード数の合計との差の絶対値が最小となるように行う。
例えば、グラフAを4つに複製し、グラフBを9つに複製する。
複製したグラフを統合して得られる統合グラフについては、例えば、図15Bに示すように、各グラフA同士、各グラフB同士を結合させてもよい。ここでの結合とは、各グラフ間(グラフA間、グラフB間)でエッジを設けることを指す。
他方、統合グラフにおいては、各グラフA同士、各グラフB同士は、結合させなくてもよい(図15C)。
そして、このようにしてグラフを複製して得られる統合グラフを用いて、解析を行う。
なお、第二の実施形態の統合グラフとしては、例えば、グラフの構造によって、例えば、以下の組み合わせに分けることができる。
・2-1:統合グラフ内の各グラフ間に結合(グラフ間エッジ)がある(図15B)。
・・2-1-1:統合グラフが単純グラフである。
・・2-1-2:統合グラフが拡張グラフである。
・・2-1-3:統合グラフがループグラフである。
・2-2:統合グラフ内の各グラフ間に結合(グラフ間エッジ)がない(図15C)。
・・2-2-1:統合グラフ内の各グラフが単純グラフである。
・・2-2-2:統合グラフ内の各グラフが拡張グラフである。
・・2-2-3:統合グラフ内の各グラフがループグラフである。
ここで、第二の実施形態の利点を説明する。
図16A及び図16Bは、単位格子の模式図である。
図16Aの単位格子200Aは、区別可能な9種類の原子(原子A~原子I)を有する。
図16Bの単位格子200Bは、区別可能な24種類の原子(原子A~原子X)を有する。
ここで、図16Aの単位格子200Aからなる単純グラフと、図16Bの単位格子200Bからなる単純グラフとを用いて、単位格子200Aと単位格子200Bとの類似度を計算する。最大独立集合を利用した類似度の計算において、類似度は、例えば、一般的に以下の式(1)で求められる。
ここで、上記式(1)において、S(G,G)は、グラフ化した第1結晶材料の単位格子Aとグラフ化した第2結晶材料の単位格子Bとの類似度を表し、0~1で表され、1に近づく程、類似度が高いことを意味する。
また、Vは、グラフ化した単位格子Aにおけるノード原子の総数を表し、V は、グラフ化した単位格子Aにおけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。なお、ノード原子とは、グラフ化した分子における頂点の原子を意味する。
さらに、Vは、グラフ化した単位格子Bにおけるノード原子の総数を表し、V は、グラフ化した単位格子Bにおけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。
δは、0~1の数である。
また、上記式(1)において、max{A,B}は、AとBのうち、値が大きい方を選択することを意味し、min{A,B}は、AとBのうち、値が小さい方を選択することを意味する。
ここで、コンフリフトグラフとは、グラフ化した第1結晶材料の単位格子Aを構成する各ノード原子と、グラフ化した第2結晶材料の単位格子Bを構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されるグラフとして理解されるものである。
上記式(1)を簡略化すると以下の式(1-1)となる。δは0.5である。
Figure 0007388217000003
ここで、ABcommonは、単位格子Aと単位格子Bとの共通部分構造の数を表す。Aallは、単位格子Aのグラフにおけるノードの数を表し、Ballは、単位格子Bのグラフにおけるノードの数を表す。
図16Aの単位格子200A内の全ての原子が、図16Bの単位格子200B内の原子と共通部分構造をなしていた場合、類似度は、最大となるが、その場合の類似度の数値は、式(1-1)により、1/2〔(9/9)+(9/24)〕=0.675となる。これは、2つの単位格子内の原子数(ノード数)の差が類似度を下げていることを意味する。
そこで、第二の実施形態では、グラフ複製によって、2つの結晶材料の単位格子のグラフの少なくともいずれかを複製する。グラフを複製して、対比する2つの単位格子の原子数(ノード数)を近づけることで、原子数(ノード数)の差に起因する類似度の低下を避けることができる。その結果、解析(例えば、類似度)の精度を高めることができる。
そのため、第二の実施形態のグラフ化の技術は、コンピュータ技術を用いた結晶材料の解析に有用である。
第二の実施形態における結晶材料解析方法について、図17に示すフローチャートを用いて簡単に説明する。
まず、他のデータベースから結晶構造データを抜き出す(S11)。他のデータベースとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、無機結晶構造データベース(Inorganic Crystal Structure Database:ICSD)などが挙げられる。なお、抜き出す結晶構造データの数、種類としては、特に制限はなく、目的に応じて適宜選択することができる。例えば、ある特定の元素を有する化学物質の結晶構造データのみを抜き出してもよい。
次に、抜き出された結晶構造データを用いて、本件の技術のグラフ化により、グラフを作成し、当該グラフを有するグラフデータベースを作成する(S12)。
次に、作成したグラフを複製して複製グラフを生成する(S13)。
次に、複製グラフを用いて結晶構造の解析を行う(S14)。解析としては、例えば、類似性評価が挙げられる。類似性評価は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより行う。
以上により、結晶構造の解析の一つである結晶構造の類似性評価を行うことができる。
ここで、第二の実施形態の実施例を、図18A~図18C、図19A~図19C、図20A~図20C、及び図21A~図21Cを用いて説明する。
この実施例では、図18Aに示す単位格子Aで表される結晶材料A及び単位格子Bで表される結晶材料Aの類似度を求めた。単位格子Aで表される結晶材料Aは、図18Bで表されるような、単位格子Aが繰り返される構造を有する。単位格子Bで表される結晶材料Bは、図18Cで表されるような、単位格子Bが繰り返される構造を有する。単位格子A及び単位格子Bは、A~Pの16種類の区別可能な原子により構成されている。
図18Aに示す単位格子Aから作成される単純グラフは、図19Aに示すグラフA-1-1となる。
図18Aに示す単位格子Bから作成される単純グラフは、図19Aに示すグラフB-1となる。
グラフA-1-2及びグラフB-1について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は16原子となり、前述の式(1-1)による類似度は、0.625となった(図19A)。この例は、比較例である。
他方、第二の実施形態の一例として、グラフA-1-1(単純グラフ)を4つに複製して得た統合グラフ(グラフA-1-2、グラフ間エッジなし)を作成する(図19B)。そして、グラフA-1-2及びグラフB-1について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は50原子となり、前述の式(1-1)による類似度は、0.78となった(図19B)。
また、第二の実施形態の一例として、グラフA-1-1(単純グラフ)を4つに複製して得た統合グラフ(グラフA-1-3、グラフ間エッジあり)を作成する(図19C)。この場合、グラフA-1-3とグラフB-1とは同じグラフとなる。そして、グラフA-1-3及びグラフB-1について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は64原子となり、前述の式(1-1)による類似度は、1.00となった(図19C)。
次に、拡張グラフを用いた場合の実施例について説明する。
図18Aに示す単位格子Aから拡張グラフを作成すると、図20Aに示すグラフA-2-1となる。
他方、図18Aに示す単位格子Bから拡張グラフを作成すると、図20Aに示すグラフB-2となる。
そして、グラフA-2-1及びグラフB-2について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は28原子となり、前述の式(1-1)による類似度は、0.583となった(図20A)。この例では、グラフの複製を行っていないため、この例は、第二の実施形態とは異なる例である。
他方、第二の実施形態の一例として、グラフA-2-1(拡張グラフ)を4つに複製して得た統合グラフ(グラフA-2-2、グラフ間エッジなし)を作成する(図20B)。この場合、グラフA-2-1(拡張グラフ)を4つに複製して、統合グラフ(グラフA-2-2)を得てもよいし、グラフA-1-1(単純グラフ)を4つに複製した後に、それらの各々を拡張グラフに変換して、統合グラフ(グラフA-2-2)を得てもよい。そして、グラフA-2-2及びグラフB-2について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は82原子となり、前述の式(1-1)による類似度は、0.75となった(図20B)。
また、第二の実施形態の一例として、グラフA-1-1(単純グラフ)を4つに複製して得た統合グラフ(グラフA-2-3、拡張グラフ、グラフ間エッジあり)を作成する(図20C)。この場合は、例えば、グラフA-1-1(単純グラフ)を4つに複製した後に、各グラフA-1-1を結合し、結合後のグラフを拡張グラフに変換して、統合グラフ(グラフA-2-3)を得る。この場合、グラフA-2-3とグラフB-2とは同じグラフとなる。そして、グラフA-2-3及びグラフB-2について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は96原子となり、前述の式(1-1)による類似度は、1.00となった(図20C)。
次に、ループグラフを用いた場合の実施例について説明する。
図18Aに示す単位格子Aからループグラフを作成すると、図21Aに示すグラフA-3-1となる。
他方、図18Aに示す単位格子Bからループグラフを作成すると、図21Aに示すグラフB-3となる。
そして、グラフA-3-1及びグラフB-3について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は11原子となり、前述の式(1-1)による類似度は、0.42となった(図21A)。この例では、グラフの複製を行っていないため、この例は、第二の実施形態とは異なる例である。
他方、第二の実施形態の一例として、グラフA-3-1(ループグラフ)を4つに複製して得た統合グラフ(グラフA-3-2、グラフ間エッジなし)を作成する。この場合、グラフA-3-1(ループグラフ)を4つに複製して、統合グラフ(グラフA-3-2)を得てもよいし、グラフA-1-1(単純グラフ)を4つに複製した後に、それらをループグラフに変換して、統合グラフ(グラフA-3-2)を得てもよい。そして、グラフA-3-2及びグラフB-3について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は44原子となり、前述の式(1-1)による類似度は、0.68となった(図21B)。
また、第二の実施形態の一例として、グラフA-1-1(単純グラフ)を4つに複製して得た統合グラフ(グラフA-2-3、ループグラフ、グラフ間エッジあり)を作成する。この場合は、例えば、グラフA-1-1(単純グラフ)を4つに複製した後に、各グラフA-1-1を結合し、結合後のグラフをループグラフに変換して、統合グラフ(グラフA-3-3)を得る。この場合、グラフA-3-3とグラフB-3とは同じグラフとなる。そして、グラフA-3-3及びグラフB-3について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は64原子となり、前述の式(1-1)による類似度は、1.00となった(図21C)。
<第三の実施形態>
開示の技術の第三の実施形態の結晶材料解析装置は、グラフ作成部と、グラフ複製部と、解析部とを有する。
開示の技術の第三の実施形態の結晶材料解析方法は、コンピュータが、グラフ作成工程と、グラフ複製工程と、解析工程とを行うことを含む。
開示の技術の第三の実施形態の結晶材料プログラムは、コンピュータに、グラフ作成と、グラフ作成と、解析とを行わせることを含む。
グラフ作成部は、格子内ノードと、格子内エッジとを有するグラフを作成する。
グラフ作成工程では、格子内ノードと、格子内エッジとを有するグラフを作成する。
グラフ作成では、単純グラフを作成してもよい。
グラフ作成では、拡張グラフを作成してもよい。
グラフ作成では、ループグラフを作成してもよい。
グラフ作成では、第1結晶材料及び第2結晶材料それぞれについてグラフを作成する。
グラフ複製部は、第1複製と第2複製との少なくともいずれかの複製を行う。
グラフ複製工程では、第1複製と第2複製との少なくともいずれかの複製を行う。
第1複製では、第1結晶材料の単位格子であるゲスト格子が、第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、第2結晶材料の単位格子のグラフを複製する。
第2複製では、第2結晶材料の単位格子であるゲスト格子が、第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、第1結晶材料の単位格子のグラフを複製する。
第1複製及び第2複製は少なくともいずれかを行えばよく、第1複製のみを行ってもよいし、第2複製のみを行ってもよいし、第1複製及び第2複製の両方を行ってもよい。
ここで、第1結晶材料の単位格子と、第2結晶材料の単位格子との大きさが異なる場合は、第1複製及び第2複製の少なくともいずれかが必要となる。
なお、単位格子の大きさは、例えば、エッジにおけるノード間の結合距離の情報から算出される。
解析部は、結晶材料の解析を行う。
解析工程では、結晶材料の解析を行う。
解析では、第1比較及び第2比較を行う。
第1比較は、第1結晶材料のゲスト格子から構成されるグラフと、第1結晶材料のゲスト格子が収まるホスト格子から構成されるグラフとの比較である。ここでのホスト格子は、第2結晶材料の単位格子の1つ又は複数からなるホスト格子である。
第2比較は、第2結晶材料のゲスト格子から構成されるグラフと、第2結晶材料のゲスト格子が収まるホスト格子から構成されるグラフとの比較である。ここでのホスト格子は、第1結晶材料の単位格子の1つ又は複数からなるホスト格子である。
解析は、例えば、第1結晶材料及び第2結晶材料の類似性の分析である。
複数の単位格子からなるホスト格子に対応するグラフは、例えば、複製したグラフを統合して得られる。複数の単位格子からなるホスト格子に対応するグラフは、例えば、複製により得られた複数のグラフを単にひとまとめにしたグラフであってもよい。この場合、複数のグラフの間にはエッジはない。
また、複製したグラフを統合して得られるグラフとしては、例えば、複製により得られた複数のグラフをグラフ間エッジにより結合して得られるグラフであってもよい。この場合、グラフ間エッジは、統合グラフが、結晶材料の構造と一致するように複数のグラフ間に追加されることが好ましい。
図22A及び図22Bは、第三の実施形態におけるグラフの複製を説明するための模式図である。図22Aは、第1複製を説明するための模式図である。図22Bは、第2複製を説明するための模式図である。
図22A及び図22Bにおいて、Aは、第1結晶材料の単位格子を表す。Bは、第2結晶材料の単位格子を表す。
図22Aに示すように、第1複製では、単位格子Aであるゲスト格子Aが、6つに複製した単位格子Bを繋いでできるホスト格子B’に収まるように、単位格子Bのグラフを6つに複製する。ここで、6つに複製した単位格子B全体がホスト格子B’である。
図22Bに示すように、第2複製では、単位格子Bであるゲスト格子Bが、4つに複製した単位格子Aを繋いでできるホスト格子A’に収まるように、単位格子Aのグラフを4つに複製する。ここで、4つに複製した単位格子A全体がホスト格子A’である。
ここで、ホスト格子を作成する際の単位格子を複製する数の決め方の一例について説明する。ここでは平面の場合で説明するが、3次元でも同様である。
ゲスト格子Aが、単位格子Bを繋いでできるホスト格子B’に収まるように、単位格子Bのグラフを複製する場合を考える。この場合、図23Aに示すように、ゲスト格子Aの対角線のうち最も長いものを直径とした円(3次元の場合は球)が、単位格子Bを繋いでできるホスト格子B’に収まるように、単位格子Bを複製する数を決める。ここで、平面で考える場合、円は、ゲスト格子Aを内包しうる最小の円である。3次元で考える場合、球は、ゲスト格子Aを内包しうる最小の球である。また、平面で考える場合、ホスト格子B’は、円を内包しうる最小のサイズである。3次元で考える場合、ホスト格子B’は、球を内包しうる最小のサイズである。
また、ゲスト格子Bが、単位格子Aを繋いでできるホスト格子A’に収まるように、単位格子Aのグラフを複製する場合を考える。この場合、図23Bに示すように、ゲスト格子Bの対角線のうち最も長いものを直径とした円(3次元の場合は球)が、単位格子Aを繋いでできるホスト格子A’に収まるように、単位格子Aを複製する数を決める。ここで、平面で考える場合、円は、ゲスト格子Bを内包しうる最小の円である。3次元で考える場合、球は、ゲスト格子Bを内包しうる最小の球である。また、平面で考える場合、ホスト格子A’は、円を内包しうる最小のサイズである。3次元で考える場合、ホスト格子A’は、球を内包しうる最小のサイズである。
解析においては、第1結晶材料の単位格子A(ゲスト格子A)のグラフ及び第2結晶材料の単位格子Bの1つ又は複数から構成されるホスト格子B’のグラフの比較を行う。更に、解析においては、第2結晶材料の単位格子B(ゲスト格子B)のグラフ及び第1結晶材料の単位格子Aの1つ又は複数から構成されるホスト格子A’のグラフの比較を行う。
ここで、図22Aの単位格子A(ゲスト格子A)からなるグラフと、図22Aの6つの単位格子Bからなるホスト格子B’のグラフとを用いて、それらの類似度を計算する。
更に、図22Bの単位格子B(ゲスト格子B)からなるグラフと、図22Bの4つの単位格子Aからなるホスト格子A’のグラフとを用いて、それらの類似度を計算する。
ここで、最大独立集合を利用した類似度の計算において、類似度は、例えば、以下の式(2)で求める。
ここで、上記式(2)において、S(G,G)は、グラフ化した第1結晶材料の単位格子Aとグラフ化した第2結晶材料の単位格子Bとの類似度を表し、0~1で表され、1に近づく程、類似度が高いことを意味する。
また、Vは、グラフ化した単位格子Aであるゲスト格子におけるノード原子の総数を表し、V A’は、グラフ化した単位格子Aの1つ又は複製からなるホスト格子A’におけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。なお、ノード原子とは、グラフ化した分子における頂点の原子を意味する。
さらに、Vは、グラフ化した単位格子Bであるゲスト格子におけるノード原子の総数を表し、V は、グラフ化した単位格子Bの1つ又は複数からなるホスト格子B’におけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。
δは、0~1の数である。
また、上記式(2)において、max{A,B}は、AとBのうち、値が大きい方を選択することを意味し、min{A,B}は、AとBのうち、値が小さい方を選択することを意味する。
ここで、コンフリフトグラフは、グラフ化した第1結晶材料の単位格子A又はホスト格子A’を構成する各ノード原子と、グラフ化した第2結晶材料の単位格子B又はホスト格子B’を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
上記式(2)を簡略化すると以下の式(2-1)となる。δは0.5である。
ここで、AB’commonは、ゲスト格子Aとホスト格子B’との共通部分構造の数を表す。A’Bcommonは、ゲスト格子Bとホスト格子A’との共通部分構造の数を表す。Aallは、単位格子Aのグラフにおけるノードの数を表し、Ballは、単位格子Bのグラフにおけるノードの数を表す。
第二の実施形態の場合、グラフを複製して、対比する2つの単位格子の原子数(ノード数)を近づけることで、原子数(ノード数)の差に起因する類似度の低下を避けることができる。しかし、複製後の単位格子の数が一致しない場合、類似度は1にはならない。
一方、第三の実施形態の場合、前述の類似度の計算式(2)又は(2-1)を用いると、単位格子A及び単位格子Bの大きさが異なる場合でも、類似度の最大値は1となる。
そのため、第三の実施形態は、対比する2つの単位格子の原子数(ノード数)の差に起因する類似度の低下を、第二の実施形態よりも更に避けることができる。その結果、解析(例えば、類似度)の精度を第二の実施形態よりも更に高めることができる。
そのため、第三の実施形態のグラフ化の技術は、コンピュータ技術を用いた結晶材料の解析に有用である。
なお、第三の実施形態におけるゲスト格子とホスト格子との組み合わせとしては、例えば、グラフの構造によって、例えば、以下の組み合わせに分けることができる。
・3-1:ゲスト格子のグラフが単純グラフである。
・・3-1-1:ホスト格子のグラフが単純グラフである。
・・3-1-2:ホスト格子のグラフが拡張グラフである。
・・3-1-3:ホスト格子のグラフがループグラフである。
・3-2:ゲスト格子のグラフが拡張グラフである。
・・3-2-1:ホスト格子のグラフが単純グラフである。
・・3-2-2:ホスト格子のグラフが拡張グラフである。
・・3-2-3:ホスト格子のグラフがループグラフである。
・3-3:ゲスト格子のグラフがループグラフである。
・・3-2-1:ホスト格子のグラフが単純グラフである。
・・3-2-2:ホスト格子のグラフが拡張グラフである。
・・3-2-3:ホスト格子のグラフがループグラフである。
第三の実施形態における結晶材料解析方法について、図24に示すフローチャートを用いて簡単に説明する。
まず、他のデータベースから結晶構造データを抜き出す(S21)。他のデータベースとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、無機結晶構造データベース(Inorganic Crystal Structure Database:ICSD)などが挙げられる。なお、抜き出す結晶構造データの数、種類としては、特に制限はなく、目的に応じて適宜選択することができる。例えば、ある特定の元素を有する化学物質の結晶構造データのみを抜き出してもよい。
次に、抜き出された結晶構造データを用いて、本件の技術のグラフ化により、グラフを作成し、当該グラフを有するグラフデータベースを作成する(S22)。
次に、作成したグラフを複製する(S23)。ここでのグラフの複製においては、第1複製及び第2複製の少なくともいずれかを行う。第1複製では、第1結晶材料の単位格子であるゲスト格子が、第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、第2結晶材料の単位格子のグラフを複製する。第2複製では、第2結晶材料の単位格子であるゲスト格子が、第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、第1結晶材料の単位格子のグラフを複製する。
次に、結晶材料の解析を行う(S24)。解析では、第1比較及び第2比較を行う。第1比較は、第1結晶材料のゲスト格子から構成されるグラフと、第1結晶材料のゲスト格子が収まるホスト格子から構成されるグラフとの比較である。ここでのホスト格子は、第2結晶材料の単位格子の1つ又は複数からなるホスト格子である。第2比較は、第2結晶材料のゲスト格子から構成されるグラフと、第2結晶材料のゲスト格子が収まるホスト格子から構成されるグラフとの比較である。ここでのホスト格子は、第1結晶材料の単位格子の1つ又は複数からなるホスト格子である。解析としては、例えば、類似性評価が挙げられる。類似性評価は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより行う。
以上により、結晶構造の解析の一つである結晶構造の類似性評価を行うことができる。
ここで、第三の実施形態の実施例を、図25A~図25Cを用いて説明する。
この実施例では、図25Aに示す単位格子Aで表される結晶材料A及び単位格子Bで表される結晶材料Aの類似度を求めた。単位格子Aで表される結晶材料Aは、図25Bで表されるような、単位格子Aが繰り返される構造を有する。単位格子Bで表される結晶材料Bは、図25Cで表されるような、単位格子Bが繰り返される構造を有する。単位格子A及び単位格子Bは、A~Pの16種類の区別可能な原子により構成されている。
単位格子Aから作成されるグラフ、及び単位格子Bから作成されるグラフを用いて、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解いた。そして、単位格子Aの結晶材料と単位格子Bの結晶材料との類似度を上記式(2-1)により求めると、以下の表1のようになった。
Figure 0007388217000006
なお、ここで、単位格子Aをゲスト格子Aとした場合の、単純グラフ、拡張グラフ、ループグラフを図26に示した。単位格子Bをゲスト格子Bとした場合の単純グラフ、拡張グラフ、ループグラフを図27に示した。
なお、拡張グラフは、拡張ノード間エッジを有してない。
更に、表1記載の態様3-2-1、3-2-2、3-2-3において、単位格子Aから作成されるグラフを、拡張ノード間エッジを有する拡張グラフとした場合(態様3-2’-1、3-2’-2、3-2’-3)について、表1と同様に類似度を求めた結果を表2に示した。なお、単位格子Aから作成されるグラフを、拡張ノード間エッジを有する拡張グラフとした場合の模式図を図28に示した。態様3-2-1と態様3-2’-1との対比、態様3-2-2と態様3-2’-2との対比、及び態様3-2-3と態様3-2’-3との対比において、拡張ノード間エッジを有する拡張グラフを用いた場合の方が、類似度が高くなっていた。
Figure 0007388217000007
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成部と、
前記グラフを用いて結晶材料の解析を行う解析部と、
を有することを特徴とする結晶材料解析装置。
(付記2)
前記グラフ作成部が、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析部が、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記1に記載の結晶材料解析装置。
(付記3)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記2に記載の結晶材料解析装置。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記4)
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成工程と、
前記ループグラフを用いて結晶材料の解析を行う解析工程と、
を行うことを含むことを特徴とする結晶材料解析方法。
(付記5)
前記グラフ作成工程において、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析工程において、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記4に記載の結晶材料解析方法。
(付記6)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記5に記載の結晶材料解析方法。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記7)
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成することと、
前記ループグラフを用いて結晶材料の解析を行うことと、
を行わせることを含むことを特徴とする結晶材料解析プログラム。
(付記8)
前記ループグラフの作成において、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析において、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記7に記載の結晶材料解析プログラム。
(付記9)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記8に記載の結晶材料解析プログラム。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記10)
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成するグラフ作成部と、
前記グラフを複製することにより複製グラフを生成するグラフ複製部と、
前記複製グラフを用いて前記結晶材料の解析を行う解析部と、
を有することを特徴とする結晶材料解析装置。
(付記11)
前記グラフ作成部が、前記グラフとしての第1結晶材料の単位格子の第1グラフと、前記グラフとしての第2結晶材料の単位格子の第2グラフとを作成し、
前記グラフ複製部が、前記第1グラフ及び前記第2グラフの少なくともいずれかを複製し、
前記解析部が、前記第1グラフ及び前記第1グラフを複製することによって生成された複数の第1複製グラフを互いに統合して得られる第1統合グラフのいずれかと、前記第2グラフ及び前記第2グラフを複製することによって生成された複数の第2複製グラフを互いに統合して得られる第2統合グラフのいずれかとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記10に記載の結晶材料解析装置。
(付記12)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記11に記載の結晶材料解析装置。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記13)
前記第1グラフ及び前記第2グラフの少なくともいずれかの複製は、複製後の複数の第1グラフのノード数の合計と、複製後の複数の第2グラフのノード数の合計との差の絶対値が最小となるように行われる、付記11から12のいずれかに記載の結晶材料解析装置。
(付記14)
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成するグラフ作成工程と、
前記グラフを複製することにより複製グラフを生成するグラフ複製工程と、
前記複製グラフを用いて前記結晶材料の解析を行う解析工程と、
を行うことを含むことを特徴とする結晶材料解析方法。
(付記15)
前記グラフ作成工程において、前記グラフとしての第1結晶材料の単位格子の第1グラフと、前記グラフとしての第2結晶材料の単位格子の第2グラフとを作成し、
前記グラフ複製工程において、前記第1グラフ及び前記第2グラフの少なくともいずれかを複製し、
前記解析工程において、前記第1グラフ及び前記第1グラフを複製することによって生成された複数の第1複製グラフを互いに統合して得られる第1統合グラフのいずれかと、前記第2グラフ及び前記第2グラフを複製することによって生成された複数の第2複製グラフを互いに統合して得られる第2統合グラフのいずれかとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記14に記載の結晶材料解析方法。
(付記16)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記15に記載の結晶材料解析方法。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記17)
前記第1グラフ及び前記第2グラフの少なくともいずれかの複製は、複製後の複数の第1グラフのノード数の合計と、複製後の複数の第2グラフのノード数の合計との差の絶対値が最小となるように行われる、付記15から16のいずれかに記載の結晶材料解析方法。
(付記18)
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成することと、
前記グラフを複製することにより複製グラフを生成することと、
前記複製グラフを用いて前記結晶材料の解析を行うことと、
を行わせることを含むことを特徴とする結晶材料解析プログラム。
(付記19)
前記グラフの作成において、前記グラフとしての第1結晶材料の単位格子の第1グラフと、前記グラフとしての第2結晶材料の単位格子の第2グラフとを作成し、
前記グラフの複製において、前記第1グラフ及び前記第2グラフの少なくともいずれかを複製し、
前記解析において、前記第1グラフ及び前記第1グラフを複製することによって生成された複数の第1複製グラフを互いに統合して得られる第1統合グラフのいずれかと、前記第2グラフ及び前記第2グラフを複製することによって生成された複数の第2複製グラフを互いに統合して得られる第2統合グラフのいずれかとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記18に記載の結晶材料解析プログラム。
(付記20)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記19に記載の結晶材料解析プログラム。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記21)
前記第1グラフ及び前記第2グラフの少なくともいずれかの複製は、複製後の複数の第1グラフのノード数の合計と、複製後の複数の第2グラフのノード数の合計との差の絶対値が最小となるように行われる、付記19から20のいずれかに記載の結晶材料解析プログラム。
(付記22)
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成するグラフ作成部と、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うグラフ複製部と、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行う解析部と、
を有することを特徴とする結晶材料解析装置。
(付記23)
前記第1複製が、前記第1結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第2結晶材料の前記単位格子の前記グラフを複製し、
前記第2複製が、前記第2結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第1結晶材料の前記単位格子の前記グラフを複製する、
付記22に記載の結晶材料解析装置。
(付記24)
前記解析部が、前記第1比較と前記第2比較とを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う付記22から23のいずれかに記載の結晶材料解析装置。
(付記25)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記24に記載の結晶材料解析装置。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記26)
前記解析部が、下記式(2)を用いて、探索された前記最大独立集合に基づいて、前記第1結晶材料と前記第2結晶材料との類似度を求める付記25に記載の類似度計算装置。
ただし、前記式(2)において、
前記Gは、前記第1結晶材料を表し、
前記Gは、前記第2結晶材料を表し、
前記S(G,G)は、前記第1結晶材料とグラフ化した前記第2結晶材料との類似度を表し、0~1で表され、1に近づく程、類似度が高いことを意味し、
前記Vは、グラフ化した前記第1結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記V は、グラフ化した前記第1結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記Vは、グラフ化した前記第2結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記V は、グラフ化した前記第2結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記δは、0~1の数である。
(付記27)
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成するグラフ作成工程と、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うグラフ複製工程と、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行う解析工程と、
を行うことを含むことを特徴とする結晶材料解析方法。
(付記28)
前記第1複製が、前記第1結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第2結晶材料の前記単位格子の前記グラフを複製し、
前記第2複製が、前記第2結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第1結晶材料の前記単位格子の前記グラフを複製する、
付記27に記載の結晶材料解析方法。
(付記29)
前記解析工程において、前記第1比較と前記第2比較とを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う付記27から28のいずれかに記載の結晶材料解析方法。
(付記30)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記29に記載の結晶材料解析方法。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記31)
前記解析工程において、下記式(2)を用いて、探索された前記最大独立集合に基づいて、前記第1結晶材料と前記第2結晶材料との類似度を求める付記30に記載の類似度計算方法。
ただし、前記式(2)において、
前記Gは、前記第1結晶材料を表し、
前記Gは、前記第2結晶材料を表し、
前記S(G,G)は、前記第1結晶材料とグラフ化した前記第2結晶材料との類似度を表し、0~1で表され、1に近づく程、類似度が高いことを意味し、
前記Vは、グラフ化した前記第1結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記V は、グラフ化した前記第1結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記Vは、グラフ化した前記第2結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記V は、グラフ化した前記第2結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記δは、0~1の数である。
(付記32)
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成することと、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うことと、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行うことと、
を行わせることを含むことを特徴とする結晶材料解析プログラム。
(付記33)
前記第1複製が、前記第1結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第2結晶材料の前記単位格子の前記グラフを複製し、
前記第2複製が、前記第2結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第1結晶材料の前記単位格子の前記グラフを複製する、
付記32に記載の結晶材料解析プログラム。
(付記34)
前記解析において、前記第1比較と前記第2比較とを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う付記32から33のいずれかに記載の結晶材料解析プログラム。
(付記35)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記34に記載の結晶材料解析プログラム。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記36)
前記解析において、下記式(2)を用いて、探索された前記最大独立集合に基づいて、前記第1結晶材料と前記第2結晶材料との類似度を求める付記35に記載の類似度計算プログラム。
ただし、前記式(2)において、
前記Gは、前記第1結晶材料を表し、
前記Gは、前記第2結晶材料を表し、
前記S(G,G)は、前記第1結晶材料とグラフ化した前記第2結晶材料との類似度を表し、0~1で表され、1に近づく程、類似度が高いことを意味し、
前記Vは、グラフ化した前記第1結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記V は、グラフ化した前記第1結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記Vは、グラフ化した前記第2結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記V は、グラフ化した前記第2結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記δは、0~1の数である。
1A 結晶材料解析装置
1B 結晶材料解析装置
1C 結晶材料解析装置
2 グラフ作成部
3 グラフ複製部
4 解析部
5 グラフデータベース
10 結晶材料解析装置
11 制御部
12 メモリ
13 記憶部
14 表示部
15 入力部
16 出力部
17 I/Oインターフェース部
18 システムバス
19 ネットワークインターフェース部
20 ネットワークインターフェース部
30 コンピュータ
40 コンピュータ

Claims (3)

  1. 結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y'であって前記単位格子に隣接する隣接単位格子内の前記原子Y'に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成部と、
    前記ループグラフを用いて結晶材料の解析を行う解析部と、
    を有する結晶材料解析装置であって、
    前記グラフ作成部が、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
    前記解析部が、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行い、
    前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含み、
    前記コンフリクトグラフが、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されることを特徴とする結晶材料解析装置。
  2. コンピュータが、
    結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y'であって前記単位格子に隣接する隣接単位格子内の前記原子Y'に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成工程と、
    前記ループグラフを用いて結晶材料の解析を行う解析工程と、
    を行うことを含む結晶材料解析方法であって、
    前記グラフ作成工程において、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
    前記解析工程において、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行い、
    前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含み、
    前記コンフリクトグラフが、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されることを特徴とする結晶材料解析方法。
  3. コンピュータに、
    結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y'であって前記単位格子に隣接する隣接単位格子内の前記原子Y'に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成することと、
    前記ループグラフを用いて結晶材料の解析を行うことと、
    を行わせることを含む結晶材料解析プログラムであって、
    前記ループグラフの作成において、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
    前記解析において、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行い、
    前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含み、
    前記コンフリクトグラフが、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されることを特徴とする結晶材料解析プログラム。
JP2020018085A 2020-02-05 2020-02-05 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム Active JP7388217B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2020018085A JP7388217B2 (ja) 2020-02-05 2020-02-05 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム
EP21152198.4A EP3863020A1 (en) 2020-02-05 2021-01-18 Crystalline material analysis device, crystalline material analysis method, and crystalline material analysis program
US17/151,702 US20210241858A1 (en) 2020-02-05 2021-01-19 Information processing device, crystalline material analysis method, and computer-readable recording medium recording crystalline material analysis program
CN202110136866.5A CN113223636A (zh) 2020-02-05 2021-02-01 晶体材料分析装置和方法及计算机可读记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020018085A JP7388217B2 (ja) 2020-02-05 2020-02-05 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム

Publications (2)

Publication Number Publication Date
JP2021124964A JP2021124964A (ja) 2021-08-30
JP7388217B2 true JP7388217B2 (ja) 2023-11-29

Family

ID=74191537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020018085A Active JP7388217B2 (ja) 2020-02-05 2020-02-05 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム

Country Status (4)

Country Link
US (1) US20210241858A1 (ja)
EP (1) EP3863020A1 (ja)
JP (1) JP7388217B2 (ja)
CN (1) CN113223636A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7006297B2 (ja) * 2018-01-19 2022-01-24 富士通株式会社 学習プログラム、学習方法および学習装置
JP2023019899A (ja) 2021-07-30 2023-02-09 三菱重工サーマルシステムズ株式会社 コンバータ装置、空気調和機、コンバータ装置の制御方法およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5235523A (en) * 1989-11-13 1993-08-10 The United States Of America As Represented By The Secretary Of Commerce Apparatus and methods for identifying and comparing lattice structures and determining lattice structure symmetries
JP5484946B2 (ja) 2010-02-16 2014-05-07 学校法人関西文理総合学園 分子間の類似度を評価するための高速グラフマッチ検索装置及び方法
CN110176280B (zh) * 2019-05-10 2023-06-06 北京大学深圳研究生院 一种描述材料晶体结构的方法及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Daniel Schwalbe-Koda, et al.,Graph similarity drives zeolite diffusionless transformations and intergrowth,MIT Open Access Articles [online],2019年11月,Pages.1-8,[検索日:2023年7月31日], <URL:https://dx.doi.org/10.1038/S41563-019-0486-1>
Tian Xie, et al.,Crystal Graph Convolutional Neural Networks for Accurate and Interpretable Prediction of Material Properties,Physical Review Letters [online],2018年06月08日,Vol.120,Pages. 145301-(1-7),[検索日:2023年7月31日], <URL:https//doi.org/10.1103/PhysRevLett.120.145301>

Also Published As

Publication number Publication date
CN113223636A (zh) 2021-08-06
EP3863020A1 (en) 2021-08-11
JP2021124964A (ja) 2021-08-30
US20210241858A1 (en) 2021-08-05

Similar Documents

Publication Publication Date Title
Han et al. A graph-based approach for trajectory similarity computation in spatial networks
Zhong et al. G-tree: An efficient index for knn search on road networks
Armañanzas et al. A review of estimation of distribution algorithms in bioinformatics
dos Santos et al. Hierarchical density-based clustering using MapReduce
Zhang et al. Efficient parallel skyline evaluation using MapReduce
JP7388217B2 (ja) 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム
Wang et al. Imbalance data processing strategy for protein interaction sites prediction
Sarazin et al. SOM clustering using spark-mapreduce
Shafiq et al. A parallel K-medoids algorithm for clustering based on MapReduce
Sriwanna et al. Graph clustering-based discretization of splitting and merging methods (graphs and graphm)
Tripathy et al. A Study of Algorithm Selection in Data Mining using Meta-Learning.
Goswami et al. Approaches and issues in view selection for materialising in data warehouse
Bao et al. Asymmetry label correlation for multi-label learning
Yang et al. Graph Contrastive Learning for Clustering of Multi-layer Networks
Qian et al. Fast pairwise query selection for large-scale active learning to rank
JP7404705B2 (ja) 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム
Banerjee A survey on mining and analysis of uncertain graphs
Krishna et al. Shape Organization for Enhanced Design Optimization in Generative Systems Using Clustering Technology
CN115130663B (zh) 基于图神经网络和注意力机制的异质网络属性补全方法
Zhang et al. A Multi-perspective Model for Protein–Ligand-Binding Affinity Prediction
Chen et al. A non-binary hierarchical tree overlapping community detection based on multi-dimensional similarity
Suresh et al. An ensemble feature selection model using fast convergence ant colony optimization algorithm
Koohi-Var et al. Scientific workflow clustering based on motif discovery
Xu et al. AutoHEnsGNN: Winning solution to AutoGraph challenge for KDD cup 2020
Bagui et al. A review of data mining algorithms on Hadoop's MapReduce

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220601

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231017

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231030

R150 Certificate of patent or registration of utility model

Ref document number: 7388217

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150