JP7388217B2 - 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム - Google Patents
結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム Download PDFInfo
- Publication number
- JP7388217B2 JP7388217B2 JP2020018085A JP2020018085A JP7388217B2 JP 7388217 B2 JP7388217 B2 JP 7388217B2 JP 2020018085 A JP2020018085 A JP 2020018085A JP 2020018085 A JP2020018085 A JP 2020018085A JP 7388217 B2 JP7388217 B2 JP 7388217B2
- Authority
- JP
- Japan
- Prior art keywords
- graph
- crystal material
- unit cell
- atom
- loop
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013078 crystal Substances 0.000 title claims description 480
- 239000000463 material Substances 0.000 title claims description 416
- 238000004458 analytical method Methods 0.000 title claims description 183
- 239000000126 substance Substances 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 49
- 238000000137 annealing Methods 0.000 claims description 37
- 230000005366 Ising model Effects 0.000 claims description 31
- 238000010586 diagram Methods 0.000 description 47
- 239000002178 crystalline material Substances 0.000 description 46
- 230000010076 replication Effects 0.000 description 27
- 238000005516 engineering process Methods 0.000 description 22
- 238000000547 structure data Methods 0.000 description 13
- 238000011156 evaluation Methods 0.000 description 12
- 230000003362 replicative effect Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 230000033458 reproduction Effects 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 2
- KXKVLQRXCPHEJC-UHFFFAOYSA-N acetic acid trimethyl ester Natural products COC(C)=O KXKVLQRXCPHEJC-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000005283 ground state Effects 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/40—Searching chemical structures or physicochemical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C10/00—Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Analytical Chemistry (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Computational Linguistics (AREA)
- Algebra (AREA)
- Mathematical Optimization (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
すなわち、一つの実施態様では、結晶材料解析装置は、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成部と、
前記グラフを用いて結晶材料の解析を行う解析部と、
を有する。
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成工程と、
前記ループグラフを用いて結晶材料の解析を行う解析工程と、
を行うことを含む。
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成することと、
前記ループグラフを用いて結晶材料の解析を行うことと、
を行わせることを含む。
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成するグラフ作成部と、
前記グラフを複製することにより複製グラフを生成するグラフ複製部と、
前記複製グラフを用いて前記結晶材料の解析を行う解析部と、
を有する。
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成するグラフ作成工程と、
前記グラフを複製することにより複製グラフを生成するグラフ複製工程と、
前記複製グラフを用いて前記結晶材料の解析を行う解析工程と、
を行うことを含む。
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成することと、
前記グラフを複製することにより複製グラフを生成することと、
前記複製グラフを用いて前記結晶材料の解析を行うことと、
を行わせることを含む。
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成するグラフ作成部と、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うグラフ複製部と、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行う解析部と、
を有する。
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成するグラフ作成工程と、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うグラフ複製工程と、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行う解析工程と、
を行うことを含む。
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成することと、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うことと、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行うことと、
を行わせることを含む。
また、一つの側面では、結晶材料の解析に有用な結晶材料解析方法を提供できる。
また、一つの側面では、結晶材料の解析に有用な結晶材料解析プログラムを提供できる。
本件の結晶材料解析装置は、グラフ作成部と、解析部とを有し、更に必要に応じて、グラフ複製部、グラフデータベースなどを有する。
本件の結晶材料解析方法は、コンピュータが、グラフ作成工程と、解析工程とを行うことを含み、更に必要に応じて、グラフ複製工程などを行うこと含む。
本件の結晶材料解析プログラムは、コンピュータに、グラフ作成と、解析とを行わせ、更に必要に応じて、グラフ複製などを行わせる。
本件の結晶材料解析装置は、例えば、本件の結晶材料解析方法を行う。
本件の結晶材料解析方法は、例えば、本件の結晶材料解析プログラムにより行われる。
プロセッサは、メモリに結合されている。
プロセッサは、例えば、グラフ作成工程を実行するように構成されている。
プロセッサは、例えば、グラフ複製工程を実行するように構成されている。
プロセッサは、例えば、解析工程を実行するように構成されている。
プロセッサは、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)又はその組み合わせである。
グラフは、結晶材料の1つの単位格子内の原子を示すノード(以下、「格子内ノード」と称することがある)を有する。
グラフは、単位格子内の原子間の化学結合を示すエッジ(以下、「格子内エッジ」と称することがある)を有する。
グラフは、単位格子内の原子Xと化学結合を有する原子Y’であって単位格子に隣接する隣接単位格子(以下、単に「隣接単位格子」と称することがある)内の原子Y’に対応する単位格子内の原子Yと、単位格子内の原子Xとの仮想的な化学結合を示すエッジ(以下、「ループエッジ」と称することがある)を有することがある。ここで、隣接単位格子内の原子Y’に対応する単位格子内の原子Yとは、隣接単位格子と単位格子とを構成原子が重なるように重ねた際に、隣接単位格子の原子Y’と重なる単位格子内の原子を意味する。
グラフは、単位格子内の原子と化学結合を有する原子であって単位格子に隣接する隣接単位格子内の原子を示すノード(以下、「拡張ノード」と称することがある)を有することがある。
グラフは、格子内ノードに当たる原子と拡張ノードに当たる原子との間の化学結合を示すエッジ(以下、「拡張エッジ」と称することがある)を有することがある。
グラフは、拡張ノードに当たる2つの原子間の化学結合を示すエッジ(以下、「拡張ノード間エッジ」と称することがある)を有していてもよい。
グラフ作成工程では、グラフを作成する。
グラフは、原子のデータであるノードと、2つの原子の化学結合のデータであるエッジとを有する。グラフとは、ノード(頂点)群とノード間の連結関係を表すエッジ(枝)群で構成される抽象データ型である。グラフは、G=(V,E)で表され、Vはノードの集合であり、Eはエッジの集合である。Vは有限の集合であり、EはVから選んだ2つの元からなる集合の集合である。
格子内ノード、及び拡張ノードは、例えば、原子の種類、原子の価数、原子の電荷などのデータを有する。
格子内エッジ、ループエッジ、及び拡張エッジは、例えば、結合の種類、結合の角度、結合の距離、結合次数などのデータを有する。結合の角度、及び結合の距離は、例えば、原子又は化学結合の座標データとして有されている。
ボロノイ分割とは、隣り合うノード間を結ぶ直線に垂直二等分線を引き、各ノードの最近隣領域を分割する手法である。
ここで、ボロノイ図及びボロノイ分割について簡単に説明する。
ボロノイ図(Voronoi diagram)は、ある距離空間上の任意の位置に配置された複数個の点(母点)に対して、同一距離空間上の他の点がどの母点に近いかによって領域分けされた図のことである。また、その領域分けをボロノイ分割という。母点の位置のみによって分割パターンが決定される。
結晶材料の単位格子を、化学結合を含めて模式的に表す場合、結晶材料の単位格子の化学結合は、通常、一意に定まるものではない。しかし、ボロノイ分割によりエッジ(格子内エッジ、ループエッジ、拡張エッジ)を作成することで、エッジ(格子内エッジ、ループエッジ、拡張エッジ)を一意に定めることができる。その結果、複数の結晶材料について、一意にエッジを定めることができるため、結晶材料の解析の精度を高めることができる。
格子内エッジ、ループエッジ、及び拡張エッジの作成方法は、上記のボロノイ分割による方法、標準イオン半径を利用する方法の2つから、片方または両方を自由に選択することができる。両方を選択する場合は、例えば、ボロノイ分割により定めることができる格子内エッジ、ループエッジ、及び拡張エッジのうち、原子の標準イオン半径を利用する方法で格子内エッジ、ループエッジ、及び拡張エッジと見なされるもののみを、格子内エッジ、ループエッジ、及び拡張エッジとして作成してもよい。
グラフ複製工程では、グラフを複製する。
グラフの複製方法としては、特に制限はなく、目的に応じて適宜選択することができる。
解析工程では、グラフを用いて結晶材料の解析を行う。
結晶材料の解析としては、例えば、複数の結晶材料の結晶構造の類似性の分析、結晶材料の特性の予測などが挙げられる。
(1)フィンガープリント法
(2)化合物間において共通する部分構造の探索を、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより化合物の類似性の分析を行う手法(例えば、以下の非特許文献X参照)
非特許文献X:Maritza Hernandez, Arman Zaribafiyan, Maliheh Aramon, Mohammad Naghibi “A Novel Graph-based Approach for Determining Molecular Similarity”. arXiv:1601.06693(https://arxiv.org/pdf/1601.06693.pdf)
フィンガープリント法では、例えば、問い合わせ化合物における部分構造が、比較対象の化合物に含まれているか否かを、0又は1で表して類似度を評価する。
最大独立集合問題とは、グラフ理論において、与えられたグラフG(V,E)に対して、頂点集合V’⊆VのうちV’内の頂点間に枝(エッジ)が存在しないようなもの(独立集合)で大きさが最大のものを求める問題である。
なお、類似度のスコアの算出の方法はこれらの方法に限定されず、例えば、類似度の計算に関するコサイン類似度、相関係数、相関関数、編集距離(レーベンシュタイン距離ともいう)などにより類似度のスコアを算出してもよい。
機械学習としては、例えば、教師あり学習、教師なし学習などが挙げられる。
機械学習により学習モデルを作成する際の学習の方法としては、特に制限はなく、目的に応じて適宜選択することができる。
機械学習における教師データは、例えば、本件の技術のグラフと、当該グラフに当たる結晶材料の特性のデータとを有する。
特性としては、特に制限はなく、目的に応じて適宜選択することができ、化学的特性であってもよいし、物理的特性であってもよい。特性の具体例としては、例えば、電気伝導性、イオン導電性、放電電位、比誘電率、熱伝導率、比熱などが挙げられる。
ここで、テンソルとは、行列、ベクトルなどの概念を一般化した、多次元の配列で表現したデータを意味する。
さらに、本件で開示する結晶材料解析プログラムを、上記の記録媒体に記録する場合には、必要に応じて、コンピュータシステムが有する記録媒体読取装置を通じて、これを直接又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域(他のコンピュータなど)に本件で開示する結晶材料解析プログラムを記録しておいてもよい。この場合、外部記憶領域に記録された本件の結晶材料解析プログラムは、必要に応じて、外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することができる。
なお、本件の結晶材料解析プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。
記録媒体は、コンピュータが読み取り可能である。
記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、CD-ROM、DVD-ROM、MOディスク、USBメモリなどが挙げられる。
また、記録媒体は、本件で開示する結晶材料解析プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。
記録媒体は、一過性であってもよいし、非一過性であってもよい。
結晶材料解析装置10においては、例えば、制御部11、メモリ12、記憶部13、表示部14、入力部15、出力部16、及びI/Oインターフェース部17がシステムバス18を介して接続されている。
制御部11としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、CPU(Central Processing Unit)であってもよい。
本件で開示する結晶材料解析装置におけるグラフ作成部、グラフ複製部、及び解析部は、例えば、制御部11により実現することができる。
また、本件で開示する結晶材料解析プログラムは、例えば、記憶部13に格納され、メモリ12のRAM(主メモリ)にロードされ、制御部11により実行される。
入力部15は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス(例えば、マウス等)などである。
出力部16は、各種データの出力装置であり、例えば、プリンタなどである。
I/Oインターフェース部17は、各種の外部装置を接続するためのインターフェースである。I/Oインターフェース部17は、例えば、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disk Read Only Memory)、MOディスク(Magneto-Optical disk)、USBメモリ〔USB(Universal Serial Bus) flash drive〕などのデータの入出力を可能にする。
図2に示す結晶材料解析装置は、結晶材料解析装置をクラウド型にした場合の例であり、制御部11が、記憶部13などとは独立している。図2に示す例においては、ネットワークインターフェース部19、20を介して、記憶部13などを格納するコンピュータ30と、制御部11を格納するコンピュータ40とが接続される。
ネットワークインターフェース部19、20は、インターネットを利用して、通信を行うハードウェアである。
図3に示す結晶材料解析装置は、結晶材料解析装置をクラウド型にした場合の例であり、記憶部13が、制御部11などとは独立している。図3に示す例においては、ネットワークインターフェース部19、20を介して、制御部11等を格納するコンピュータ30と、記憶部13を格納するコンピュータ40とが接続される。
図4に示す結晶材料解析装置1Aは、グラフ作成部2、及び解析部4を有する。
図5に示す結晶材料解析装置1Bは、グラフ作成部2、解析部4及び、グラフデータベース5を有する。
図6に示す結晶材料解析装置1Cは、グラフ作成部2、グラフ複製部3、及び解析部4を有する。
開示の技術の第一の実施形態の結晶材料解析装置は、グラフ作成部と、解析部とを有する。
開示の技術の第一の実施形態の結晶材料解析方法は、コンピュータが、グラフ作成工程と、解析工程とを行うことを含む。
開示の技術の第一の実施形態の結晶材料プログラムは、コンピュータに、グラフ作成と、解析とを行わせることを含む。
グラフ作成工程では、ループグラフを作成する。
解析部は、グラフを用いて結晶材料の解析を行う。
解析工程では、グラフを用いて結晶材料の解析を行う。
コンフリフトグラフは、グラフ化した第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
さらに、wijは、i番目のノードとj番目のノードとの間にエッジが存在するときは、0ではない正の数であり、i番目のノードとj番目のノードとの間にエッジが存在しないときは、0である。
また、xiは、i番目のノードが0又は1であることを表すバイナリ変数であり、xjは、j番目のノードが0又は1であることを表すバイナリ変数である。
なお、α及びβは、正の数である。
図7は、結晶材料の結晶構造の模式図である。図7の結晶材料は、単位格子内に区別可能な9種類の原子(原子A~原子I)を有する。
結晶構造は、単位格子の無限の繰り返しにより構成される。そのため、通常、結晶構造をグラフで表そうとしても、無理であるか、ある程度の大きさに限定したとしても、非常に多くのノード及びエッジが必要になる。
他方、単位格子をグラフで表しても、そのグラフでは、1つの結晶構造のみを表すことができず、複数の結晶構造を含むことになる場合がある。その一例を説明する。
図7において、結晶材料の結晶構造100Xは、原子A~原子Iを含む単位格子100を繰り返し単位として有する。なお、図7において、上下左右の点線は、単位格子100が繰り返されていることを意味する。
もしも、図7の結晶構造100Xの単位格子100をグラフで表すと、通常、図8のようになる。
図8は、単位格子100のグラフの一例である。図8のグラフは、原子Aを示すノード101A(格子内ノード)と、原子Bを示すノード101B(格子内ノード)と、原子Aと原子Bとの化学結合を示すエッジ102(格子内エッジ)とを有する。なお、符号を省略しているが、図8のグラフには、更に、7つの格子内ノードと、11つの格子内エッジとを有する。
ここで、単位格子100を繰り返し単位として有する結晶構造は、図7の結晶構造100Xの他に、図9の結晶構造100Yなどもある。なお、図9において、上下左右の点線は、単位格子100が繰り返されていることを意味する。
そして、図7の結晶構造100Xの単位格子100を図8のグラフで表した方法と同じ方法で図9の結晶構造100Yの単位格子をグラフで表すと、図8となる。
そうすると、図8のグラフでは、1つの結晶構造のみを表したことにはならない。
図10のループグラフは、単位格子100内の原子Aを示すノード101A(格子内ノード)と、単位格子100内の原子Bを示すノード101B(格子内ノード)と、単位格子100内の原子Cを示すノード101C(格子内ノード)と、更に、符号を付していない6つの格子内ノードを有する。
また、図10のループグラフは、単位格子100内の原子Aと原子Bとの結合関係を示すエッジ102(格子内エッジ)と、更に、符号を付していない11つの格子内エッジを有する。
更に、図10のループグラフは、合計6つのループエッジを有する。その2つがエッジ111、及びエッジ112である。なお、図10のループグラフにおいて、左側のエッジ111と、右側のエッジ111とは、同一のループエッジである。また、図10のループグラフにおいて、上側のエッジ112と、下側のエッジ112とは、同一のループエッジである。
エッジ111(ループエッジ)は、単位格子100内の原子Aと化学結合を有する隣接単位格子内の原子Cに対応する単位格子100内の原子Cと、単位格子100内の原子Aとの仮想的な化学結合を示す。なお、エッジ111は、単位格子100内の原子Cと化学結合を有する隣接単位格子内の原子Aに対応する単位格子100内の原子Aと、単位格子100内の原子Cとの仮想的な化学結合を示すものでもある。
エッジ112(ループエッジ)は、単位格子100内の原子Aと化学結合を有する隣接単位格子内の原子Gに対応する単位格子100内の原子Gと、単位格子100内の原子Aとの仮想的な化学結合を示す。なお、エッジ112は、単位格子100内の原子Gと化学結合を有する隣接単位格子内の原子Aに対応する単位格子100内の原子Aと、単位格子100内の原子Gとの仮想的な化学結合を示すものでもある。
このように、グラフに、ループエッジを設けることで、グラフのノードを増やさずに、単位格子の繰り返し構造の情報(単位格子の並び方の情報)を有するグラフを得ることができる。
ここで、図11のループグラフにおいては、合計6つのループエッジを有する点は、図10のループグラフと同じである。そして、その2つがエッジ111’、及びエッジ112’である。なお、図11のループグラフにおいて、左側のエッジ111’と、右側のエッジ111’とは、同一のループエッジである。また、図11のループグラフにおいて、上側のエッジ112’と、下側のエッジ112’とは、同一のループエッジである。
エッジ111’(ループエッジ)は、単位格子100内の原子Aと化学結合を有する隣接単位格子内の原子Cに対応する単位格子100内の原子Cと、単位格子100内の原子Aとの仮想的な化学結合を示す。なお、エッジ111’は、単位格子100内の原子Cと化学結合を有する隣接単位格子内の原子Aに対応する単位格子100内の原子Aと、単位格子100内の原子Cとの仮想的な化学結合を示すものでもある。
エッジ112’(ループエッジ)は、単位格子100内の原子Aと化学結合を有する隣接単位格子内の原子Iに対応する単位格子100内の原子Iと、単位格子100内の原子Aとの仮想的な化学結合を示す。なお、エッジ112’は、単位格子100内の原子Iと化学結合を有する隣接単位格子内の原子Aに対応する単位格子100内の原子Aと、単位格子100内の原子Iとの仮想的な化学結合を示すものでもある。
ここで、エッジ111とエッジ111’とは同じエッジであるが、エッジ112とエッジ112’とは異なるエッジである。このエッジ112とエッジ112’との違いにより、図10のループグラフと、図11のループグラフとは異なるグラフとなる。
一方で、第一の実施形態のグラフ化の技術では、単位格子が同じであるが、結晶構造が異なる2以上の結晶構造を、異なったグラフで表すことができる。
結晶構造が異なる2以上の結晶構造を異なったグラフで表すことができれば、結晶材料の解析(例えば、結晶材料の類似性の分析、及び結晶材料の特性の予測など)において、解析精度を高くすることができる。
そのため、ループグラフは、計算機のビット数を増やさずに解析精度を高めることが期待できる。
まず、他のデータベースから結晶構造データを抜き出す(S1)。他のデータベースとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、無機結晶構造データベース(Inorganic Crystal Structure Database:ICSD)などが挙げられる。なお、抜き出す結晶構造データの数、種類としては、特に制限はなく、目的に応じて適宜選択することができる。例えば、ある特定の元素を有する化学物質の結晶構造データのみを抜き出してもよい。
次に、抜き出された結晶構造データを用いて、本件の技術のグラフ化により、ループグラフを作成し、当該ループグラフを有するグラフデータベースを作成する(S2)。ループグラフの作成は、例えば、後述するフローチャートに従って行う。
次に、グラフデータベースのループグラフを用いて結晶構造の解析を行う(S3)。解析としては、例えば、類似性評価が挙げられる。類似性評価は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより行う。当該方法は、例えば、以下の非特許文献を参照して行うことができる。
非特許文献:Maritza Hernandez, Arman Zaribafiyan, Maliheh Aramon, Mohammad Naghibi “A Novel Graph-based Approach for Determining Molecular Similarity”. arXiv:1601.06693(https://arxiv.org/pdf/1601.06693.pdf)
以上により、結晶構造の解析の一つである結晶構造の類似性評価を行うことができる。
まず、結晶材料データを読み込む(S101)。
次に、単一単位格子内の全原子の相対座標を計算する(S102)。そうすることで、全原子の相対的な位置関係を得る。
次に、単一単位格子内の全原子をグラフのノードとする(S103)。このノードは格子内ノードである。
次に、単一単位格子内の全原子のうち、ある原子(原子A)とある原子以外の他の原子(原子B)の2つの原子の組み合わせ(A,B)について、A-B間の距離が結合距離として適切かどうかを判断する(S106)。そして、適切な場合には、ノードA-ノードBを結合する(S107)。即ち、ノードA-ノードB間に相当するエッジを設ける。このエッジは格子内エッジである。その後、ある原子(原子A)と更に他の原子Bとの組み合わせの全てについて、S106を行う(S105、及びS108)。適切ではない場合には、ノードA-ノードB間に相当するエッジを設けることはせず、ある原子(原子A)と更に他の原子Bとの組み合わせの全てについて、S106を行う(S105、及びS108)。
S105~S115までの工程を、単一単位格子内のある原子Aに相当する原子の全てについて行う(S104、及びS116)。
そうすることで、ループグラフが得られる。
図14Aに示すような、A~Lの12種類の区別可能な原子により構成された結晶構造を用いる。この結晶構造から、図14Aに示す単位格子Aと単位格子Bとの2通りの単位格子が認識できる場合を考える。
従来のグラフ化の技術では、単位格子Aについて作成したグラフは、図14Bに示すグラフA-1となり、単位格子Bについて作成したグラフは、図14Bに示すグラフB-1となる。グラフA-1及びグラフB-1について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は、6原子(A,C,F,H,J,L)となり、後述する式(1-1)による類似度は、0.50となった。
他方、第一の実施形態のグラフ化の技術によりループグラフを作成した場合、単位格子Aについて作成したグラフは、図14Cに示すグラフA-2となり、単位格子Bについて作成したグラフは、図14Cに示すグラフB-2となる。グラフA-2及びグラフB-2について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は12原子となり、後述する式(1-1)による類似度は、1.00となった。
単位格子Aと単位格子Bとは、同じ結晶構造の単位格子である。そのため、単位格子Aについて作成したグラフと、単位格子Bについて作成したグラフとでは、類似度が1.00である方が、精度が高い計算結果である。
このように、ループグラフを用いると、解析(例えば、類似度)の精度を高めることができる。
開示の技術の第二の実施形態の結晶材料解析装置は、グラフ作成部と、グラフ複製部と、解析部とを有する。
開示の技術の第二の実施形態の結晶材料解析方法は、コンピュータが、グラフ作成工程と、グラフ複製工程と、解析工程とを行うことを含む。
開示の技術の第二の実施形態の結晶材料プログラムは、コンピュータに、グラフ作成と、グラフ作成と、解析とを行わせることを含む。
グラフ作成工程では、格子内ノードと、格子内エッジとを有するグラフを作成する。
グラフ作成では、格子内ノードと、格子内エッジと、拡張ノードと、拡張エッジとを有するグラフ(以下、「拡張グラフ」と称することがある)を作成してもよい。拡張グラフは、拡張ノード間エッジを有していてもよい。
グラフ作成では、ループグラフを作成してもよい。
なお、以下において、ノードとして格子内ノードのみを有し、エッジとして格子内エッジのみを有するグラフを「単純グラフ」と称することがある。
グラフ複製工程では、グラフを複製することにより複製グラフを生成する。
解析工程では、複製グラフを用いて結晶材料の解析を行う。
第1グラフ及び第2グラフの少なくともいずれかの複製は、例えば、複製後の複数の第1グラフのノード数の合計と、複製後の複数の第2グラフのノード数の合計との差の絶対値が最小となるように行う。
第1統合グラフは、第1グラフを複製することによって生成された複数の第1複製グラフを互いに統合して得られる。
第2統合グラフは、第2グラフを複製することによって生成された複数の第2複製グラフを互いに統合して得られる。
ここで、複製したグラフを統合して得られるグラフ(以下、「統合グラフ」と称することがある)としては、例えば、複製により得られた複数のグラフを単にひとまとめにしたグラフであってもよい。この場合、複数のグラフの間にはエッジはない。
また、複製したグラフを統合して得られるグラフとしては、例えば、複製により得られた複数のグラフをエッジ(以下、「グラフ間エッジ」と称することがある)により結合して得られるグラフであってもよい。この場合、グラフ間エッジは、統合グラフが、結晶材料の構造と一致するように複数のグラフ間に追加されることが好ましい。
以下では、2つの結晶材料のグラフのそれぞれを複製する場合を示すが、片方のグラフのみを複製してもよい。
図15Aに示す2つの単位格子Aと単位格子Bとの解析を行うとする。解析としては類似度の計算を例にとる。ここで、単位格子Aの単純グラフをグラフAとする。単位格子Bの単純グラフをグラフBとする。グラフAのノード数と、グラフBのノード数とが異なる場合、その差に起因して、類似度が低下する。理由は後述する。
そこで、グラフAのノード数と、グラフBのノード数とを近づけるために、グラフA及びグラフBの少なくともいずれかを複製する。複製は、例えば、複製後のグラフAのノード数の合計と、複製後のグラフBのノード数の合計との差の絶対値が最小となるように行う。
例えば、グラフAを4つに複製し、グラフBを9つに複製する。
複製したグラフを統合して得られる統合グラフについては、例えば、図15Bに示すように、各グラフA同士、各グラフB同士を結合させてもよい。ここでの結合とは、各グラフ間(グラフA間、グラフB間)でエッジを設けることを指す。
他方、統合グラフにおいては、各グラフA同士、各グラフB同士は、結合させなくてもよい(図15C)。
そして、このようにしてグラフを複製して得られる統合グラフを用いて、解析を行う。
・2-1:統合グラフ内の各グラフ間に結合(グラフ間エッジ)がある(図15B)。
・・2-1-1:統合グラフが単純グラフである。
・・2-1-2:統合グラフが拡張グラフである。
・・2-1-3:統合グラフがループグラフである。
・2-2:統合グラフ内の各グラフ間に結合(グラフ間エッジ)がない(図15C)。
・・2-2-1:統合グラフ内の各グラフが単純グラフである。
・・2-2-2:統合グラフ内の各グラフが拡張グラフである。
・・2-2-3:統合グラフ内の各グラフがループグラフである。
図16A及び図16Bは、単位格子の模式図である。
図16Aの単位格子200Aは、区別可能な9種類の原子(原子A~原子I)を有する。
図16Bの単位格子200Bは、区別可能な24種類の原子(原子A~原子X)を有する。
ここで、図16Aの単位格子200Aからなる単純グラフと、図16Bの単位格子200Bからなる単純グラフとを用いて、単位格子200Aと単位格子200Bとの類似度を計算する。最大独立集合を利用した類似度の計算において、類似度は、例えば、一般的に以下の式(1)で求められる。
また、VAは、グラフ化した単位格子Aにおけるノード原子の総数を表し、Vc Aは、グラフ化した単位格子Aにおけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。なお、ノード原子とは、グラフ化した分子における頂点の原子を意味する。
さらに、VBは、グラフ化した単位格子Bにおけるノード原子の総数を表し、Vc Bは、グラフ化した単位格子Bにおけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。
δは、0~1の数である。
また、上記式(1)において、max{A,B}は、AとBのうち、値が大きい方を選択することを意味し、min{A,B}は、AとBのうち、値が小さい方を選択することを意味する。
ここで、コンフリフトグラフとは、グラフ化した第1結晶材料の単位格子Aを構成する各ノード原子と、グラフ化した第2結晶材料の単位格子Bを構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されるグラフとして理解されるものである。
そのため、第二の実施形態のグラフ化の技術は、コンピュータ技術を用いた結晶材料の解析に有用である。
まず、他のデータベースから結晶構造データを抜き出す(S11)。他のデータベースとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、無機結晶構造データベース(Inorganic Crystal Structure Database:ICSD)などが挙げられる。なお、抜き出す結晶構造データの数、種類としては、特に制限はなく、目的に応じて適宜選択することができる。例えば、ある特定の元素を有する化学物質の結晶構造データのみを抜き出してもよい。
次に、抜き出された結晶構造データを用いて、本件の技術のグラフ化により、グラフを作成し、当該グラフを有するグラフデータベースを作成する(S12)。
次に、作成したグラフを複製して複製グラフを生成する(S13)。
次に、複製グラフを用いて結晶構造の解析を行う(S14)。解析としては、例えば、類似性評価が挙げられる。類似性評価は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより行う。
以上により、結晶構造の解析の一つである結晶構造の類似性評価を行うことができる。
この実施例では、図18Aに示す単位格子Aで表される結晶材料A及び単位格子Bで表される結晶材料Aの類似度を求めた。単位格子Aで表される結晶材料Aは、図18Bで表されるような、単位格子Aが繰り返される構造を有する。単位格子Bで表される結晶材料Bは、図18Cで表されるような、単位格子Bが繰り返される構造を有する。単位格子A及び単位格子Bは、A~Pの16種類の区別可能な原子により構成されている。
図18Aに示す単位格子Bから作成される単純グラフは、図19Aに示すグラフB-1となる。
グラフA-1-2及びグラフB-1について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は16原子となり、前述の式(1-1)による類似度は、0.625となった(図19A)。この例は、比較例である。
他方、第二の実施形態の一例として、グラフA-1-1(単純グラフ)を4つに複製して得た統合グラフ(グラフA-1-2、グラフ間エッジなし)を作成する(図19B)。そして、グラフA-1-2及びグラフB-1について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は50原子となり、前述の式(1-1)による類似度は、0.78となった(図19B)。
また、第二の実施形態の一例として、グラフA-1-1(単純グラフ)を4つに複製して得た統合グラフ(グラフA-1-3、グラフ間エッジあり)を作成する(図19C)。この場合、グラフA-1-3とグラフB-1とは同じグラフとなる。そして、グラフA-1-3及びグラフB-1について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は64原子となり、前述の式(1-1)による類似度は、1.00となった(図19C)。
他方、図18Aに示す単位格子Bから拡張グラフを作成すると、図20Aに示すグラフB-2となる。
そして、グラフA-2-1及びグラフB-2について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は28原子となり、前述の式(1-1)による類似度は、0.583となった(図20A)。この例では、グラフの複製を行っていないため、この例は、第二の実施形態とは異なる例である。
他方、第二の実施形態の一例として、グラフA-2-1(拡張グラフ)を4つに複製して得た統合グラフ(グラフA-2-2、グラフ間エッジなし)を作成する(図20B)。この場合、グラフA-2-1(拡張グラフ)を4つに複製して、統合グラフ(グラフA-2-2)を得てもよいし、グラフA-1-1(単純グラフ)を4つに複製した後に、それらの各々を拡張グラフに変換して、統合グラフ(グラフA-2-2)を得てもよい。そして、グラフA-2-2及びグラフB-2について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は82原子となり、前述の式(1-1)による類似度は、0.75となった(図20B)。
また、第二の実施形態の一例として、グラフA-1-1(単純グラフ)を4つに複製して得た統合グラフ(グラフA-2-3、拡張グラフ、グラフ間エッジあり)を作成する(図20C)。この場合は、例えば、グラフA-1-1(単純グラフ)を4つに複製した後に、各グラフA-1-1を結合し、結合後のグラフを拡張グラフに変換して、統合グラフ(グラフA-2-3)を得る。この場合、グラフA-2-3とグラフB-2とは同じグラフとなる。そして、グラフA-2-3及びグラフB-2について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は96原子となり、前述の式(1-1)による類似度は、1.00となった(図20C)。
他方、図18Aに示す単位格子Bからループグラフを作成すると、図21Aに示すグラフB-3となる。
そして、グラフA-3-1及びグラフB-3について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は11原子となり、前述の式(1-1)による類似度は、0.42となった(図21A)。この例では、グラフの複製を行っていないため、この例は、第二の実施形態とは異なる例である。
他方、第二の実施形態の一例として、グラフA-3-1(ループグラフ)を4つに複製して得た統合グラフ(グラフA-3-2、グラフ間エッジなし)を作成する。この場合、グラフA-3-1(ループグラフ)を4つに複製して、統合グラフ(グラフA-3-2)を得てもよいし、グラフA-1-1(単純グラフ)を4つに複製した後に、それらをループグラフに変換して、統合グラフ(グラフA-3-2)を得てもよい。そして、グラフA-3-2及びグラフB-3について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は44原子となり、前述の式(1-1)による類似度は、0.68となった(図21B)。
また、第二の実施形態の一例として、グラフA-1-1(単純グラフ)を4つに複製して得た統合グラフ(グラフA-2-3、ループグラフ、グラフ間エッジあり)を作成する。この場合は、例えば、グラフA-1-1(単純グラフ)を4つに複製した後に、各グラフA-1-1を結合し、結合後のグラフをループグラフに変換して、統合グラフ(グラフA-3-3)を得る。この場合、グラフA-3-3とグラフB-3とは同じグラフとなる。そして、グラフA-3-3及びグラフB-3について、コンフリクトグラフの最大独立集合問題として、イジングモデルの式で表してアニーリングマシンにより解いた。そうすると、共通原子は64原子となり、前述の式(1-1)による類似度は、1.00となった(図21C)。
開示の技術の第三の実施形態の結晶材料解析装置は、グラフ作成部と、グラフ複製部と、解析部とを有する。
開示の技術の第三の実施形態の結晶材料解析方法は、コンピュータが、グラフ作成工程と、グラフ複製工程と、解析工程とを行うことを含む。
開示の技術の第三の実施形態の結晶材料プログラムは、コンピュータに、グラフ作成と、グラフ作成と、解析とを行わせることを含む。
グラフ作成工程では、格子内ノードと、格子内エッジとを有するグラフを作成する。
グラフ作成では、単純グラフを作成してもよい。
グラフ作成では、拡張グラフを作成してもよい。
グラフ作成では、ループグラフを作成してもよい。
グラフ作成では、第1結晶材料及び第2結晶材料それぞれについてグラフを作成する。
グラフ複製工程では、第1複製と第2複製との少なくともいずれかの複製を行う。
第1複製では、第1結晶材料の単位格子であるゲスト格子が、第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、第2結晶材料の単位格子のグラフを複製する。
第2複製では、第2結晶材料の単位格子であるゲスト格子が、第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、第1結晶材料の単位格子のグラフを複製する。
第1複製及び第2複製は少なくともいずれかを行えばよく、第1複製のみを行ってもよいし、第2複製のみを行ってもよいし、第1複製及び第2複製の両方を行ってもよい。
ここで、第1結晶材料の単位格子と、第2結晶材料の単位格子との大きさが異なる場合は、第1複製及び第2複製の少なくともいずれかが必要となる。
なお、単位格子の大きさは、例えば、エッジにおけるノード間の結合距離の情報から算出される。
解析工程では、結晶材料の解析を行う。
解析では、第1比較及び第2比較を行う。
第1比較は、第1結晶材料のゲスト格子から構成されるグラフと、第1結晶材料のゲスト格子が収まるホスト格子から構成されるグラフとの比較である。ここでのホスト格子は、第2結晶材料の単位格子の1つ又は複数からなるホスト格子である。
第2比較は、第2結晶材料のゲスト格子から構成されるグラフと、第2結晶材料のゲスト格子が収まるホスト格子から構成されるグラフとの比較である。ここでのホスト格子は、第1結晶材料の単位格子の1つ又は複数からなるホスト格子である。
解析は、例えば、第1結晶材料及び第2結晶材料の類似性の分析である。
また、複製したグラフを統合して得られるグラフとしては、例えば、複製により得られた複数のグラフをグラフ間エッジにより結合して得られるグラフであってもよい。この場合、グラフ間エッジは、統合グラフが、結晶材料の構造と一致するように複数のグラフ間に追加されることが好ましい。
図22A及び図22Bにおいて、Aは、第1結晶材料の単位格子を表す。Bは、第2結晶材料の単位格子を表す。
図22Aに示すように、第1複製では、単位格子Aであるゲスト格子Aが、6つに複製した単位格子Bを繋いでできるホスト格子B’に収まるように、単位格子Bのグラフを6つに複製する。ここで、6つに複製した単位格子B全体がホスト格子B’である。
図22Bに示すように、第2複製では、単位格子Bであるゲスト格子Bが、4つに複製した単位格子Aを繋いでできるホスト格子A’に収まるように、単位格子Aのグラフを4つに複製する。ここで、4つに複製した単位格子A全体がホスト格子A’である。
ゲスト格子Aが、単位格子Bを繋いでできるホスト格子B’に収まるように、単位格子Bのグラフを複製する場合を考える。この場合、図23Aに示すように、ゲスト格子Aの対角線のうち最も長いものを直径とした円(3次元の場合は球)が、単位格子Bを繋いでできるホスト格子B’に収まるように、単位格子Bを複製する数を決める。ここで、平面で考える場合、円は、ゲスト格子Aを内包しうる最小の円である。3次元で考える場合、球は、ゲスト格子Aを内包しうる最小の球である。また、平面で考える場合、ホスト格子B’は、円を内包しうる最小のサイズである。3次元で考える場合、ホスト格子B’は、球を内包しうる最小のサイズである。
また、ゲスト格子Bが、単位格子Aを繋いでできるホスト格子A’に収まるように、単位格子Aのグラフを複製する場合を考える。この場合、図23Bに示すように、ゲスト格子Bの対角線のうち最も長いものを直径とした円(3次元の場合は球)が、単位格子Aを繋いでできるホスト格子A’に収まるように、単位格子Aを複製する数を決める。ここで、平面で考える場合、円は、ゲスト格子Bを内包しうる最小の円である。3次元で考える場合、球は、ゲスト格子Bを内包しうる最小の球である。また、平面で考える場合、ホスト格子A’は、円を内包しうる最小のサイズである。3次元で考える場合、ホスト格子A’は、球を内包しうる最小のサイズである。
ここで、図22Aの単位格子A(ゲスト格子A)からなるグラフと、図22Aの6つの単位格子Bからなるホスト格子B’のグラフとを用いて、それらの類似度を計算する。
更に、図22Bの単位格子B(ゲスト格子B)からなるグラフと、図22Bの4つの単位格子Aからなるホスト格子A’のグラフとを用いて、それらの類似度を計算する。
ここで、最大独立集合を利用した類似度の計算において、類似度は、例えば、以下の式(2)で求める。
また、VAは、グラフ化した単位格子Aであるゲスト格子におけるノード原子の総数を表し、Vc A’は、グラフ化した単位格子Aの1つ又は複製からなるホスト格子A’におけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。なお、ノード原子とは、グラフ化した分子における頂点の原子を意味する。
さらに、VBは、グラフ化した単位格子Bであるゲスト格子におけるノード原子の総数を表し、Vc Bは、グラフ化した単位格子Bの1つ又は複数からなるホスト格子B’におけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。
δは、0~1の数である。
また、上記式(2)において、max{A,B}は、AとBのうち、値が大きい方を選択することを意味し、min{A,B}は、AとBのうち、値が小さい方を選択することを意味する。
ここで、コンフリフトグラフは、グラフ化した第1結晶材料の単位格子A又はホスト格子A’を構成する各ノード原子と、グラフ化した第2結晶材料の単位格子B又はホスト格子B’を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
第二の実施形態の場合、グラフを複製して、対比する2つの単位格子の原子数(ノード数)を近づけることで、原子数(ノード数)の差に起因する類似度の低下を避けることができる。しかし、複製後の単位格子の数が一致しない場合、類似度は1にはならない。
一方、第三の実施形態の場合、前述の類似度の計算式(2)又は(2-1)を用いると、単位格子A及び単位格子Bの大きさが異なる場合でも、類似度の最大値は1となる。
そのため、第三の実施形態は、対比する2つの単位格子の原子数(ノード数)の差に起因する類似度の低下を、第二の実施形態よりも更に避けることができる。その結果、解析(例えば、類似度)の精度を第二の実施形態よりも更に高めることができる。
そのため、第三の実施形態のグラフ化の技術は、コンピュータ技術を用いた結晶材料の解析に有用である。
・3-1:ゲスト格子のグラフが単純グラフである。
・・3-1-1:ホスト格子のグラフが単純グラフである。
・・3-1-2:ホスト格子のグラフが拡張グラフである。
・・3-1-3:ホスト格子のグラフがループグラフである。
・3-2:ゲスト格子のグラフが拡張グラフである。
・・3-2-1:ホスト格子のグラフが単純グラフである。
・・3-2-2:ホスト格子のグラフが拡張グラフである。
・・3-2-3:ホスト格子のグラフがループグラフである。
・3-3:ゲスト格子のグラフがループグラフである。
・・3-2-1:ホスト格子のグラフが単純グラフである。
・・3-2-2:ホスト格子のグラフが拡張グラフである。
・・3-2-3:ホスト格子のグラフがループグラフである。
まず、他のデータベースから結晶構造データを抜き出す(S21)。他のデータベースとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、無機結晶構造データベース(Inorganic Crystal Structure Database:ICSD)などが挙げられる。なお、抜き出す結晶構造データの数、種類としては、特に制限はなく、目的に応じて適宜選択することができる。例えば、ある特定の元素を有する化学物質の結晶構造データのみを抜き出してもよい。
次に、抜き出された結晶構造データを用いて、本件の技術のグラフ化により、グラフを作成し、当該グラフを有するグラフデータベースを作成する(S22)。
次に、作成したグラフを複製する(S23)。ここでのグラフの複製においては、第1複製及び第2複製の少なくともいずれかを行う。第1複製では、第1結晶材料の単位格子であるゲスト格子が、第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、第2結晶材料の単位格子のグラフを複製する。第2複製では、第2結晶材料の単位格子であるゲスト格子が、第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、第1結晶材料の単位格子のグラフを複製する。
次に、結晶材料の解析を行う(S24)。解析では、第1比較及び第2比較を行う。第1比較は、第1結晶材料のゲスト格子から構成されるグラフと、第1結晶材料のゲスト格子が収まるホスト格子から構成されるグラフとの比較である。ここでのホスト格子は、第2結晶材料の単位格子の1つ又は複数からなるホスト格子である。第2比較は、第2結晶材料のゲスト格子から構成されるグラフと、第2結晶材料のゲスト格子が収まるホスト格子から構成されるグラフとの比較である。ここでのホスト格子は、第1結晶材料の単位格子の1つ又は複数からなるホスト格子である。解析としては、例えば、類似性評価が挙げられる。類似性評価は、例えば、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより行う。
以上により、結晶構造の解析の一つである結晶構造の類似性評価を行うことができる。
この実施例では、図25Aに示す単位格子Aで表される結晶材料A及び単位格子Bで表される結晶材料Aの類似度を求めた。単位格子Aで表される結晶材料Aは、図25Bで表されるような、単位格子Aが繰り返される構造を有する。単位格子Bで表される結晶材料Bは、図25Cで表されるような、単位格子Bが繰り返される構造を有する。単位格子A及び単位格子Bは、A~Pの16種類の区別可能な原子により構成されている。
なお、拡張グラフは、拡張ノード間エッジを有してない。
(付記1)
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成部と、
前記グラフを用いて結晶材料の解析を行う解析部と、
を有することを特徴とする結晶材料解析装置。
(付記2)
前記グラフ作成部が、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析部が、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記1に記載の結晶材料解析装置。
(付記3)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記2に記載の結晶材料解析装置。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記4)
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成工程と、
前記ループグラフを用いて結晶材料の解析を行う解析工程と、
を行うことを含むことを特徴とする結晶材料解析方法。
(付記5)
前記グラフ作成工程において、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析工程において、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記4に記載の結晶材料解析方法。
(付記6)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記5に記載の結晶材料解析方法。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記7)
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y’であって前記単位格子に隣接する隣接単位格子内の前記原子Y’に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成することと、
前記ループグラフを用いて結晶材料の解析を行うことと、
を行わせることを含むことを特徴とする結晶材料解析プログラム。
(付記8)
前記ループグラフの作成において、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析において、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記7に記載の結晶材料解析プログラム。
(付記9)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記8に記載の結晶材料解析プログラム。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記10)
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成するグラフ作成部と、
前記グラフを複製することにより複製グラフを生成するグラフ複製部と、
前記複製グラフを用いて前記結晶材料の解析を行う解析部と、
を有することを特徴とする結晶材料解析装置。
(付記11)
前記グラフ作成部が、前記グラフとしての第1結晶材料の単位格子の第1グラフと、前記グラフとしての第2結晶材料の単位格子の第2グラフとを作成し、
前記グラフ複製部が、前記第1グラフ及び前記第2グラフの少なくともいずれかを複製し、
前記解析部が、前記第1グラフ及び前記第1グラフを複製することによって生成された複数の第1複製グラフを互いに統合して得られる第1統合グラフのいずれかと、前記第2グラフ及び前記第2グラフを複製することによって生成された複数の第2複製グラフを互いに統合して得られる第2統合グラフのいずれかとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記10に記載の結晶材料解析装置。
(付記12)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記11に記載の結晶材料解析装置。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記13)
前記第1グラフ及び前記第2グラフの少なくともいずれかの複製は、複製後の複数の第1グラフのノード数の合計と、複製後の複数の第2グラフのノード数の合計との差の絶対値が最小となるように行われる、付記11から12のいずれかに記載の結晶材料解析装置。
(付記14)
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成するグラフ作成工程と、
前記グラフを複製することにより複製グラフを生成するグラフ複製工程と、
前記複製グラフを用いて前記結晶材料の解析を行う解析工程と、
を行うことを含むことを特徴とする結晶材料解析方法。
(付記15)
前記グラフ作成工程において、前記グラフとしての第1結晶材料の単位格子の第1グラフと、前記グラフとしての第2結晶材料の単位格子の第2グラフとを作成し、
前記グラフ複製工程において、前記第1グラフ及び前記第2グラフの少なくともいずれかを複製し、
前記解析工程において、前記第1グラフ及び前記第1グラフを複製することによって生成された複数の第1複製グラフを互いに統合して得られる第1統合グラフのいずれかと、前記第2グラフ及び前記第2グラフを複製することによって生成された複数の第2複製グラフを互いに統合して得られる第2統合グラフのいずれかとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記14に記載の結晶材料解析方法。
(付記16)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記15に記載の結晶材料解析方法。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記17)
前記第1グラフ及び前記第2グラフの少なくともいずれかの複製は、複製後の複数の第1グラフのノード数の合計と、複製後の複数の第2グラフのノード数の合計との差の絶対値が最小となるように行われる、付記15から16のいずれかに記載の結晶材料解析方法。
(付記18)
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジとを有するグラフを作成することと、
前記グラフを複製することにより複製グラフを生成することと、
前記複製グラフを用いて前記結晶材料の解析を行うことと、
を行わせることを含むことを特徴とする結晶材料解析プログラム。
(付記19)
前記グラフの作成において、前記グラフとしての第1結晶材料の単位格子の第1グラフと、前記グラフとしての第2結晶材料の単位格子の第2グラフとを作成し、
前記グラフの複製において、前記第1グラフ及び前記第2グラフの少なくともいずれかを複製し、
前記解析において、前記第1グラフ及び前記第1グラフを複製することによって生成された複数の第1複製グラフを互いに統合して得られる第1統合グラフのいずれかと、前記第2グラフ及び前記第2グラフを複製することによって生成された複数の第2複製グラフを互いに統合して得られる第2統合グラフのいずれかとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う、付記18に記載の結晶材料解析プログラム。
(付記20)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記19に記載の結晶材料解析プログラム。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記21)
前記第1グラフ及び前記第2グラフの少なくともいずれかの複製は、複製後の複数の第1グラフのノード数の合計と、複製後の複数の第2グラフのノード数の合計との差の絶対値が最小となるように行われる、付記19から20のいずれかに記載の結晶材料解析プログラム。
(付記22)
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成するグラフ作成部と、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うグラフ複製部と、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行う解析部と、
を有することを特徴とする結晶材料解析装置。
(付記23)
前記第1複製が、前記第1結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第2結晶材料の前記単位格子の前記グラフを複製し、
前記第2複製が、前記第2結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第1結晶材料の前記単位格子の前記グラフを複製する、
付記22に記載の結晶材料解析装置。
(付記24)
前記解析部が、前記第1比較と前記第2比較とを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う付記22から23のいずれかに記載の結晶材料解析装置。
(付記25)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記24に記載の結晶材料解析装置。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記26)
前記解析部が、下記式(2)を用いて、探索された前記最大独立集合に基づいて、前記第1結晶材料と前記第2結晶材料との類似度を求める付記25に記載の類似度計算装置。
前記GAは、前記第1結晶材料を表し、
前記GBは、前記第2結晶材料を表し、
前記S(GA,GB)は、前記第1結晶材料とグラフ化した前記第2結晶材料との類似度を表し、0~1で表され、1に近づく程、類似度が高いことを意味し、
前記VAは、グラフ化した前記第1結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記Vc Aは、グラフ化した前記第1結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記VBは、グラフ化した前記第2結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記Vc Bは、グラフ化した前記第2結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記δは、0~1の数である。
(付記27)
コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成するグラフ作成工程と、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うグラフ複製工程と、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行う解析工程と、
を行うことを含むことを特徴とする結晶材料解析方法。
(付記28)
前記第1複製が、前記第1結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第2結晶材料の前記単位格子の前記グラフを複製し、
前記第2複製が、前記第2結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第1結晶材料の前記単位格子の前記グラフを複製する、
付記27に記載の結晶材料解析方法。
(付記29)
前記解析工程において、前記第1比較と前記第2比較とを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う付記27から28のいずれかに記載の結晶材料解析方法。
(付記30)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記29に記載の結晶材料解析方法。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記31)
前記解析工程において、下記式(2)を用いて、探索された前記最大独立集合に基づいて、前記第1結晶材料と前記第2結晶材料との類似度を求める付記30に記載の類似度計算方法。
前記GAは、前記第1結晶材料を表し、
前記GBは、前記第2結晶材料を表し、
前記S(GA,GB)は、前記第1結晶材料とグラフ化した前記第2結晶材料との類似度を表し、0~1で表され、1に近づく程、類似度が高いことを意味し、
前記VAは、グラフ化した前記第1結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記Vc Aは、グラフ化した前記第1結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記VBは、グラフ化した前記第2結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記Vc Bは、グラフ化した前記第2結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記δは、0~1の数である。
(付記32)
コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、を有するグラフを第1結晶材料及び第2結晶材料について作成することと、
前記第1結晶材料の単位格子であるゲスト格子が、前記第2結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第2結晶材料の前記単位格子のグラフを複製する第1複製と、前記第2結晶材料の単位格子であるゲスト格子が、前記第1結晶材料の複数の単位格子を繋いでできるホスト格子に収まるように、前記第1結晶材料の前記単位格子のグラフを複製する第2複製との少なくともいずれかの複製を行うことと、
前記第1結晶材料の前記ゲスト格子から構成されるグラフと、前記第1結晶材料の前記ゲスト格子が収まる前記第2結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第1比較を行い、かつ、前記第2結晶材料の前記ゲスト格子から構成されるグラフと、前記第2結晶材料の前記ゲスト格子が収まる前記第1結晶材料の前記単位格子の1つ又は複数からなるホスト格子から構成されるグラフとの第2比較を行い、結晶材料の解析を行うことと、
を行わせることを含むことを特徴とする結晶材料解析プログラム。
(付記33)
前記第1複製が、前記第1結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第2結晶材料の前記単位格子の前記グラフを複製し、
前記第2複製が、前記第2結晶材料の前記ゲスト格子の対角線のうち最も長いものを直径とした球が、前記ホスト格子に収まるように、前記第1結晶材料の前記単位格子の前記グラフを複製する、
付記32に記載の結晶材料解析プログラム。
(付記34)
前記解析において、前記第1比較と前記第2比較とを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行う付記32から33のいずれかに記載の結晶材料解析プログラム。
(付記35)
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含む付記34に記載の結晶材料解析プログラム。
ここで、前記コンフリフトグラフは、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成される。
(付記36)
前記解析において、下記式(2)を用いて、探索された前記最大独立集合に基づいて、前記第1結晶材料と前記第2結晶材料との類似度を求める付記35に記載の類似度計算プログラム。
前記GAは、前記第1結晶材料を表し、
前記GBは、前記第2結晶材料を表し、
前記S(GA,GB)は、前記第1結晶材料とグラフ化した前記第2結晶材料との類似度を表し、0~1で表され、1に近づく程、類似度が高いことを意味し、
前記VAは、グラフ化した前記第1結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記Vc Aは、グラフ化した前記第1結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記VBは、グラフ化した前記第2結晶材料の前記単位格子である前記ゲスト格子における前記ノード原子の総数を表し、
前記Vc Bは、グラフ化した前記第2結晶材料の前記単位格子の1つ又は複数からなる前記ホスト格子における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記δは、0~1の数である。
1B 結晶材料解析装置
1C 結晶材料解析装置
2 グラフ作成部
3 グラフ複製部
4 解析部
5 グラフデータベース
10 結晶材料解析装置
11 制御部
12 メモリ
13 記憶部
14 表示部
15 入力部
16 出力部
17 I/Oインターフェース部
18 システムバス
19 ネットワークインターフェース部
20 ネットワークインターフェース部
30 コンピュータ
40 コンピュータ
Claims (3)
- 結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y'であって前記単位格子に隣接する隣接単位格子内の前記原子Y'に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成部と、
前記ループグラフを用いて結晶材料の解析を行う解析部と、
を有する結晶材料解析装置であって、
前記グラフ作成部が、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析部が、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行い、
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含み、
前記コンフリクトグラフが、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されることを特徴とする結晶材料解析装置。 - コンピュータが、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y'であって前記単位格子に隣接する隣接単位格子内の前記原子Y'に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成するグラフ作成工程と、
前記ループグラフを用いて結晶材料の解析を行う解析工程と、
を行うことを含む結晶材料解析方法であって、
前記グラフ作成工程において、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析工程において、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行い、
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含み、
前記コンフリクトグラフが、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されることを特徴とする結晶材料解析方法。 - コンピュータに、
結晶材料の1つの単位格子内の原子を示す格子内ノードと、前記単位格子内の原子間の化学結合を示す格子内エッジと、前記単位格子内の原子Xと前記化学結合を有する原子Y'であって前記単位格子に隣接する隣接単位格子内の前記原子Y'に対応する前記単位格子内の原子Yと前記原子Xとの仮想的な前記化学結合を示すループエッジと、を有するループグラフを作成することと、
前記ループグラフを用いて結晶材料の解析を行うことと、
を行わせることを含む結晶材料解析プログラムであって、
前記ループグラフの作成において、前記ループグラフとしての第1結晶材料の単位格子の第1ループグラフと、前記ループグラフとしての第2結晶材料の単位格子の第2ループグラフとを作成し、
前記解析において、前記第1ループグラフと前記第2ループグラフとを用いて、前記第1結晶材料と前記第2結晶材料との類似性の分析を行い、
前記類似性の分析が、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシンで解くことを含み、
前記コンフリクトグラフが、グラフ化した前記第1結晶材料の単位格子を構成する各ノード原子と、グラフ化した前記第2結晶材料の単位格子を構成する各ノード原子との組合せをノードとし、2つのノードどうしを比較して互いに同一でないノード間にはエッジを作成し、2つのノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されることを特徴とする結晶材料解析プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020018085A JP7388217B2 (ja) | 2020-02-05 | 2020-02-05 | 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム |
EP21152198.4A EP3863020A1 (en) | 2020-02-05 | 2021-01-18 | Crystalline material analysis device, crystalline material analysis method, and crystalline material analysis program |
US17/151,702 US20210241858A1 (en) | 2020-02-05 | 2021-01-19 | Information processing device, crystalline material analysis method, and computer-readable recording medium recording crystalline material analysis program |
CN202110136866.5A CN113223636A (zh) | 2020-02-05 | 2021-02-01 | 晶体材料分析装置和方法及计算机可读记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020018085A JP7388217B2 (ja) | 2020-02-05 | 2020-02-05 | 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021124964A JP2021124964A (ja) | 2021-08-30 |
JP7388217B2 true JP7388217B2 (ja) | 2023-11-29 |
Family
ID=74191537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020018085A Active JP7388217B2 (ja) | 2020-02-05 | 2020-02-05 | 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20210241858A1 (ja) |
EP (1) | EP3863020A1 (ja) |
JP (1) | JP7388217B2 (ja) |
CN (1) | CN113223636A (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7006297B2 (ja) * | 2018-01-19 | 2022-01-24 | 富士通株式会社 | 学習プログラム、学習方法および学習装置 |
JP2023019899A (ja) | 2021-07-30 | 2023-02-09 | 三菱重工サーマルシステムズ株式会社 | コンバータ装置、空気調和機、コンバータ装置の制御方法およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5235523A (en) * | 1989-11-13 | 1993-08-10 | The United States Of America As Represented By The Secretary Of Commerce | Apparatus and methods for identifying and comparing lattice structures and determining lattice structure symmetries |
JP5484946B2 (ja) | 2010-02-16 | 2014-05-07 | 学校法人関西文理総合学園 | 分子間の類似度を評価するための高速グラフマッチ検索装置及び方法 |
CN110176280B (zh) * | 2019-05-10 | 2023-06-06 | 北京大学深圳研究生院 | 一种描述材料晶体结构的方法及其应用 |
-
2020
- 2020-02-05 JP JP2020018085A patent/JP7388217B2/ja active Active
-
2021
- 2021-01-18 EP EP21152198.4A patent/EP3863020A1/en not_active Withdrawn
- 2021-01-19 US US17/151,702 patent/US20210241858A1/en not_active Abandoned
- 2021-02-01 CN CN202110136866.5A patent/CN113223636A/zh active Pending
Non-Patent Citations (2)
Title |
---|
Daniel Schwalbe-Koda, et al.,Graph similarity drives zeolite diffusionless transformations and intergrowth,MIT Open Access Articles [online],2019年11月,Pages.1-8,[検索日:2023年7月31日], <URL:https://dx.doi.org/10.1038/S41563-019-0486-1> |
Tian Xie, et al.,Crystal Graph Convolutional Neural Networks for Accurate and Interpretable Prediction of Material Properties,Physical Review Letters [online],2018年06月08日,Vol.120,Pages. 145301-(1-7),[検索日:2023年7月31日], <URL:https//doi.org/10.1103/PhysRevLett.120.145301> |
Also Published As
Publication number | Publication date |
---|---|
CN113223636A (zh) | 2021-08-06 |
EP3863020A1 (en) | 2021-08-11 |
JP2021124964A (ja) | 2021-08-30 |
US20210241858A1 (en) | 2021-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Han et al. | A graph-based approach for trajectory similarity computation in spatial networks | |
Zhong et al. | G-tree: An efficient index for knn search on road networks | |
Armañanzas et al. | A review of estimation of distribution algorithms in bioinformatics | |
dos Santos et al. | Hierarchical density-based clustering using MapReduce | |
Zhang et al. | Efficient parallel skyline evaluation using MapReduce | |
JP7388217B2 (ja) | 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム | |
Wang et al. | Imbalance data processing strategy for protein interaction sites prediction | |
Sarazin et al. | SOM clustering using spark-mapreduce | |
Shafiq et al. | A parallel K-medoids algorithm for clustering based on MapReduce | |
Sriwanna et al. | Graph clustering-based discretization of splitting and merging methods (graphs and graphm) | |
Tripathy et al. | A Study of Algorithm Selection in Data Mining using Meta-Learning. | |
Goswami et al. | Approaches and issues in view selection for materialising in data warehouse | |
Bao et al. | Asymmetry label correlation for multi-label learning | |
Yang et al. | Graph Contrastive Learning for Clustering of Multi-layer Networks | |
Qian et al. | Fast pairwise query selection for large-scale active learning to rank | |
JP7404705B2 (ja) | 結晶材料解析装置、結晶材料解析方法、及び結晶材料解析プログラム | |
Banerjee | A survey on mining and analysis of uncertain graphs | |
Krishna et al. | Shape Organization for Enhanced Design Optimization in Generative Systems Using Clustering Technology | |
CN115130663B (zh) | 基于图神经网络和注意力机制的异质网络属性补全方法 | |
Zhang et al. | A Multi-perspective Model for Protein–Ligand-Binding Affinity Prediction | |
Chen et al. | A non-binary hierarchical tree overlapping community detection based on multi-dimensional similarity | |
Suresh et al. | An ensemble feature selection model using fast convergence ant colony optimization algorithm | |
Koohi-Var et al. | Scientific workflow clustering based on motif discovery | |
Xu et al. | AutoHEnsGNN: Winning solution to AutoGraph challenge for KDD cup 2020 | |
Bagui et al. | A review of data mining algorithms on Hadoop's MapReduce |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20220601 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231002 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231017 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231030 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7388217 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |