JP7302297B2

JP7302297B2 - 材料特性予測装置、材料特性予測方法、及び材料特性予測プログラム

Info

Publication number: JP7302297B2
Application number: JP2019101217A
Authority: JP
Inventors: 秀幸實宝
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-05-30
Filing date: 2019-05-30
Publication date: 2023-07-04
Anticipated expiration: 2039-05-30
Also published as: US11915798B2; US20200381085A1; JP2020194488A

Description

本件は、材料特性予測装置、材料特性予測方法、及び材料特性予測プログラムに関する。

通常、構造が類似する化合物（分子）どうしは、特性（性質）も類似することが期待される。この「類似する化合物は類似する性質を持つ」という類似性質原則は、化合物の性質を予測して、所定の性質を持つ化合物を設計する場合や、化合物のデータベースをスクリーニングして、所定の性質を持つ化合物を探索する場合などにおいて広く用いられている。

類似性質原則を用いると、例えば、既存の化合物を問い合わせ化合物として、データベースから探索された類似化合物（当該問い合わせ化合物と構造が類似する化合物）は、その機能（特性、物性）が問い合わせ化合物と同様であると予測できる。また、新規の化合物を問い合わせ化合物とする場合には、当該問い合わせ化合物と構造が類似する化合物をデータベースから探索することにより、新規化学物質の特性値を予測することもできる。
ここで、構造が互いに類似する化合物の探索は、例えば、化合物どうしにおける構造の類似度を評価し、構造の類似度が高い化合物を類似する化合物として特定することにより行うことができる。
化合物どうしにおける構造の類似度を評価する手法としては、様々な手法が提案されているが、例えば、フィンガープリント法が広く用いられている。フィンガープリント法では、例えば、問い合わせ化合物における部分構造が、比較対象の化合物に含まれているか否かを、０又は１で表して類似度を評価する。

また、構造の類似度を評価する手法として、化合物間において共通する部分構造の探索を、コンフリクトグラフの最大独立集合問題をイジングモデルの式で表してアニーリングマシン等で解くことにより行う手法も提案されている（例えば、非特許文献１参照）。
さらに、化合物の構造をグラフ化して扱う場合などにおいて、グラフの各頂点（化合物における各原子に相当）に、頂点どうしの接続情報（例えば、原子どうしの結合情報など）を加味してラベルを付す技術も知られている（例えば、非特許文献２参照）。

これらの従来技術においては、化合物の構造の情報のみに基づいて、問い合わせ化合物（対象材料）の特性値を予測するため、予測しようとする特性によっては予測の精度が悪くなってしまう場合があった。また、これらの従来技術では、予測する特性ごとに化合物の類似度を算出することができず、所望の特性に着目して類似する化合物を探索することができないという問題があった。

ＭａｒｉｔｚａＨｅｒｎａｎｄｅｚ，ＡｒｍａｎＺａｒｉｂａｆｉｙａｎ，ＭａｌｉｈｅｈＡｒａｍｏｎ，ＭｏｈａｍｍａｄＮａｇｈｉｂｉ "ＡＮｏｖｅｌＧｒａｐｈ－ｂａｓｅｄＡｐｐｒｏａｃｈｆｏｒＤｅｔｅｒｍｉｎｉｎｇＭｏｌｅｃｕｌａｒＳｉｍｉｌａｒｉｔｙ"．ａｒＸｉｖ：１６０１．０６６９３（ｈｔｔｐｓ：／／ａｒｘｉｖ．ｏｒｇ／ｐｄｆ／１６０１．０６６９３．ｐｄｆ）Ｓｈｅｒｖａｓｈｉｄｚｅ，Ｎ．；Ｓｃｈｗｅｉｔｚｅｒ，Ｐ．；ＪａｎｖａｎＬｅｅｕｗｅｎ，Ｅ．；Ｍｅｈｌｈｏｒｎ，Ｋ．；Ｂｏｒｇｗａｒｄｔ，Ｋ．Ｍ．Ｗｅｉｓｆｅｉｌｅｒ－ＬｅｈｍａｎＧｒａｐｈＫｅｒｎｅｌｓ．Ｊ．Ｍａｃｈ．Ｌｅａｒｎ．Ｒｅｓ．２０１１，２５３９－２５６１．

一つの側面では、本件は、対象材料の特性の特性値を、当該特性に応じて高精度に予測できる材料特性予測装置、材料特性予測方法、及び材料特性予測プログラムを提供することを目的とする。

上記の課題を解決するための手段の一つの実施態様は、以下の通りである。
すなわち、一つの実施態様では、材料特性予測装置は、対象材料の特性の特性値を予測する材料特性予測装置であって、対象材料と特性の特性値が第１の値である第１材料との、特性に係る類似度を求めることにより対象材料の特性値を予測する特性予測部を備える。

また、一つの実施態様では、材料特性予測方法は、対象材料の特性の特性値を予測する材料特性予測方法であって、対象材料と特性の特性値が第１の値である第１材料との、特性に係る類似度を求めることにより対象材料の特性値を予測する特性予測工程を含む。

さらに、一つの実施態様では、材料特性予測プログラムは、対象材料の特性の特性値を予測する材料特性予測プログラムであって、対象材料と特性の特性値が第１の値である第１材料との、特性に係る類似度を求めることにより対象材料の特性値を予測する特性予測処理を、コンピュータに行わせる。

一つの側面では、本件は、対象材料の特性の特性値を、当該特性に応じて高精度に予測できる結合構造探索装置、結合構造探索方法、及び結合構造探索プログラムを提供できる。

図１は、酢酸及び酢酸メチルをグラフ化する様子の一例を示す図である。図２は、分子Ａ及びＢにおける同じ元素どうしを組み合わせてコンフリクトグラフのノードをする場合の組み合わせの一例を示す図である。図３は、コンフリクトグラフにおけるエッジ作成のルールの一例を示す図である。図４は、分子Ａと分子Ｂにおけるコンフリクトグラフの一例を示す図である。図５は、グラフにおける最大独立集合の一例を示す図である。図６は、分子Ａと分子Ｂとにおける最大の共通部分構造を、コンフリクトグラフの最大独立集合を求める（最大独立集合問題を解く）ことにより求める場合における流れの一例を示す図である。図７は、ノードの数が６個のグラフにおける最大独立集合を探索する手法の一例を説明するための説明図である。図８は、ノードの数が６個のグラフにおける最大独立集合を探索する手法の一例を説明するための説明図である。図９は、コンフリクトグラフにおける最大独立集合の一例を示す図である。図１０は、Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を行い、ノード原子に対しＷＬラベルを付す際の流れの一例を示す模式図である。図１１は、本件で開示する材料特性予測装置の構成例を表す図である。図１２は、本件で開示する材料特性予測装置の他の構成例を表す図である。図１３は、本件で開示する材料特性予測装置の他の構成例を表す図である。図１４は、本件で開示する材料特性予測装置の一実施形態としての機能構成例を示す図である。図１５は、本件で開示する材料特性予測装置の他の実施形態としての機能構成例を示す図である。図１６は、本件で開示する技術の一例を用いて、特性に係る類似度を求めることにより、対象材料の特性値を予測する際のフローチャートの例である。図１７Ａは、Ｎ－メチルアセトアミドの分子構造の一例を示す図である。図１７Ｂは、図１７Ａに示した分子構造を、ノード原子のラベルを原子の種類（元素）としてグラフ化した場合の一例を示す図である。図１７Ｃは、本件で開示する技術の一例におけるＷＬラベルを付した、Ｎ－メチルアセトアミドの分子構造の一例を示す図である。図１８は、本件で開示する技術の一例を用いて、特性に係る類似度を求めるためのパラメータを更新する際のフローチャートの例である。図１９は、本件で開示する技術の一例を用いて、特性に係る類似度を求めるためのパラメータを更新する際のフローチャートの他の例である。図２０は、焼き鈍し法に用いる最適化装置（制御部）の機能構成の一例を示す図である。図２１は、遷移制御部の回路レベルの一例を示すブロック図である。図２２は、遷移制御部の動作フローの一例を示す図である。図２３は、表２に示した結果に基づいて、類似度と特性に係る特性値（非誘電率）とをプロットし、それらのプロットを線形近似した近似直線を引いたグラフの一例を示す図である。図２４は、比誘電率が近くない材料間の類似度が、従来技術においては高く算出され、本実施形態では低く算出される例における、分子構造及びグラフ化した分子構造の一例を示す図である。図２５は、比誘電率が近い材料間の類似度が、従来技術においては低く算出され、本実施形態では高く算出される例における、分子構造及びグラフ化した分子構造の一例を示す図である。図２６は、本件で開示する技術の一実施形態及び従来技術における、類似度と特性値の関係の一例を示す図である。

（材料特性予測装置）
本件で開示する材料特性予測装置は、対象材料の特性の特性値を予測する装置である。本件で開示する材料特性予測装置は、特性予測部を有し、更に必要に応じてその他の部（手段）を有する。

まず、本件で開示する技術の詳細を説明する前に、従来技術における材料どうしの類似度の算出手法について説明する。ここでは、従来技術における材料どうしの類似度の算出手法の一例として、コンフリクトグラフの最大独立集合問題を解くことにより、比較する材料どうしにおいて共通する部分構造を探索して類似度を算出する手法について説明する。

コンフリクトグラフの最大独立集合問題を解くことにより、化合物どうしの構造の類似度を算出する際には、化合物をグラフ化して扱う。ここで、化合物をグラフ化するとは、例えば、化合物における原子の種類（元素）の情報と各原子の結合状態の情報とを用いて、化合物の構造を表すことを意味する。
化合物の構造は、例えば、ＭＯＬ形式や、ＳＤＦ（ＳｔｒｕｃｔｕｒｅＤａｔａＦｉｌｅ）形式の表現を用いて表すことができる。通常、ＳＤＦ形式とは、ＭＯＬ形式で表現された複数の化合物の構造情報を、一つのファイルにまとめたものを意味する。また、ＳＤＦ形式のファイルにおいては、ＭＯＬ形式の構造情報の他に、化合物ごとの付加情報（例えば、カタログ番号、ＣＡＳ番号、分子量など）を扱うことが可能である。これらの化合物の構造は、例えば、「原子１（の名称）、原子２（の名称）、原子１の元素の情報、原子２の元素の情報、原子１と原子２の結合次数」を１つの行とするＣＳＶ（Ｃｏｍｍａ－ＳｅｐａｒａｔｅｄＶａｌｕｅ）形式としてグラフ化できる。

以下では、コンフリクトグラフの作成方法について、酢酸（ＣＨ_３ＣＯＯＨ）と酢酸メチル（ＣＨ_３ＣＯＯＣＨ_３）とにおけるコンフリクトグラフを作成する場合を例として説明する。
まず、酢酸（以下では、「分子Ａ」と称することがある）と酢酸メチル（以下では、「分子Ｂ」と称することがある）をグラフ化すると、図１のようになる。図１においては、酢酸を形成する原子をＡ１、Ａ２、Ａ３、及びＡ５で示し、酢酸メチルを形成する原子をＢ１からＢ５で示している。また、図１では、Ａ１、Ａ２、Ｂ１、Ｂ２、及びＢ４は炭素を示し、Ａ３、Ａ５、Ｂ３、及びＢ５は酸素を示すとともに、単結合を細い実線で、二重結合を太い実線で示している。なお、図１に示す例においては、水素以外の原子を選択してグラフ化しているが、化合物をグラフ化する際には、水素も含めて全ての原子を選択してグラフ化してもよい。

次に、グラフ化した分子Ａ及びＢにおける頂点（原子）どうしを組み合わせて、コンフリクトグラフの頂点（ノード）を作成する。このとき、例えば、図２に示すように、分子Ａ及びＢにおける同じ元素どうしを組み合わせてコンフリクトグラフのノードとすることが好ましい。図２に示す例においては、炭素を表すＡ１、Ａ２、Ｂ１、Ｂ２、及びＢ４どうしの組み合わせ、並びに、酸素を表すＡ３、Ａ５、Ｂ３、及びＢ５どうしの組み合わせをコンフリクトグラフのノードとする。このように、同じ元素どうしの組み合わせをノードとすることにより、最大独立集合に含まれ得るノードでコンフリクトグラフを作成することができるため、ノードの数を抑制でき、最大独立集合問題を解くために必要とされる計算機のビットの数を少なくできる。
図２の例では、分子Ａの炭素と分子Ｂの炭素との組み合わせにより６個、分子Ａの酸素と分子Ｂの酸素との組み合わせにより４個のノードを作成するため、グラフ化した分子Ａ及びＢから作成されるコンフリクトグラフにおけるノードの数は１０個となる。

続いて、コンフリクトグラフにおけるエッジ（枝、辺）を作成する。このとき、２つのノードを比較して、ノードどうしが異なる状況（例えば、原子番号、結合の有無、結合次数など）にある原子で構成される場合は、その２つのノードの間にエッジを作成する。一方、２つのノードを比較して、ノードどうしが同じ状況にある原子で構成される場合は、その２つのノードの間にはエッジを作成しない。

ここで、図３を参照して、コンフリクトグラフにおけるエッジ作成のルールについて説明する。
まず、図３に示す例において、ノード〔Ａ１Ｂ１〕とノード〔Ａ２Ｂ２〕との間にエッジを作成するか否かについて説明する。図３におけるグラフ化した分子Ａの構造からわかるように、ノード〔Ａ１Ｂ１〕に含まれる分子Ａの炭素Ａ１と、ノード〔Ａ２Ｂ２〕に含まれる分子Ａの炭素Ａ２は、互いに結合（単結合）している。同様に、ノード〔Ａ１Ｂ１〕に含まれる分子Ｂの炭素Ｂ１と、ノード〔Ａ２Ｂ２〕に含まれる分子Ｂの炭素Ｂ２は、互いに結合（単結合）している。すなわち、炭素Ａ１と炭素Ａ２の結合の状況と、炭素Ｂ１と炭素Ｂ２の結合の状況は互いに同一になっている。
このように、図３の例においては、分子Ａにおける炭素Ａ１と炭素Ａ２の状況と、分子Ｂにおける炭素Ｂ１と炭素Ｂ２の状況が互いに同一となっており、ノード〔Ａ１Ｂ１〕とノード〔Ａ２Ｂ２〕は、互いに同一の状況の原子で構成されるノードどうしとなる。このため、図３に示す例では、ノード〔Ａ１Ｂ１〕とノード〔Ａ２Ｂ２〕との間には、エッジを作成しない。

次に、図３に示す例において、ノード〔Ａ１Ｂ４〕とノード〔Ａ２Ｂ２〕との間にエッジを作成するか否かについて説明する。図３におけるグラフ化した分子Ａの構造からわかるように、ノード〔Ａ１Ｂ４〕に含まれる分子Ａの炭素Ａ１と、ノード〔Ａ２Ｂ２〕に含まれる分子Ａの炭素Ａ２は、互いに結合（単結合）している。一方、グラフ化した分子Ｂの構造からわかるように、ノード〔Ａ１Ｂ４〕に含まれる分子Ｂの炭素Ｂ４と、ノード〔Ａ２Ｂ２〕に含まれる分子Ｂの炭素Ｂ２は、間に酸素Ｂ３を挟んでおり、直接は結合していない。すなわち、炭素Ａ１と炭素Ａ２の結合の状況と、炭素Ｂ４と炭素Ｂ２の結合の状況は互いに異なっている。
つまり、図３の例においては、分子Ａにおける炭素Ａ１と炭素Ａ２の状況と、分子Ｂにおける炭素Ｂ４と炭素Ｂ２の状況が互いに異なっており、ノード〔Ａ１Ｂ４〕とノード〔Ａ２Ｂ２〕は、互いに異なる状況の原子で構成されるノードどうしとなる。このため、図３に示す例では、ノード〔Ａ１Ｂ４〕とノード〔Ａ２Ｂ２〕との間に、エッジを作成する。

このように、コンフリクトグラフは、ノードどうしが異なる状況にある原子で構成される場合は、そのノードの間にエッジを作成し、同じ状況にある原子で構成される場合は、そのノードの間にはエッジを作成しないというルールに基づいて作成することができる。
図４は、分子Ａと分子Ｂにおけるコンフリクトグラフの一例を示す図である。図４に示すように、例えば、ノード〔Ａ２Ｂ２〕とノード〔Ａ５Ｂ５〕においては、分子Ａにおける炭素Ａ２と酸素Ａ５の結合の状況と、分子Ｂにおける炭素Ｂ２と炭素Ｂ５の結合の状況は互いに同一になっている。このため、ノード〔Ａ２Ｂ２〕とノード〔Ａ５Ｂ５〕は、互いに同一の状況にある原子で構成されるノードとなるため、ノード〔Ａ２Ｂ２〕とノード〔Ａ５Ｂ５〕との間には、エッジを作成していない。

ここで、コンフリクトグラフのエッジは、例えば、構造の類似度を算出する２つの化合物の化学構造データに基づいて作成することができる。例えば、ＳＤＦ形式のファイルを用いて化合物の化学構造データを入力する場合、ＳＤＦ形式のファイルに含まれる情報に基づいて、コンピュータ等の計算機を用いて計算を行うことで、コンフリクトグラフのエッジを作成（特定）することができる。

次に、非特許文献１に記載されているような従来技術の一例における、作成したコンフリクトグラフの最大独立集合問題を解く方法について説明する。
コンフリクトグラフにおける最大独立集合（ＭａｘｉｍｕｍＩｎｄｅｐｅｎｄｅｎｔＳｅｔ；ＭＩＳ）とは、コンフリクトグラフを構成するノードの集合のうち、ノード間にエッジが存在しないノードが最も多く含まれる集合を意味する。言い換えると、コンフリクトグラフにおける最大独立集合とは、互いのノードの間にエッジが存在しないノードで形成される集合のうち、最大の大きさ（ノード数）を有する集合を意味する。

図５は、グラフにおける最大独立集合の一例を示す図である。図５では、集合に含まれるノードには「１」の符号を、集合に含まれないノードには「０」の符号を付し、ノード間にエッジが存在する箇所は実線で当該ノードどうしを結び、エッジが存在しない箇所は点線で当該ノードどうしを結んでいる。なお、ここでは、図５に示すように、説明の簡略化のため、ノードの数が６個のグラフを例として説明する。
図５に示す例においては、ノード間にエッジが存在しないノードで構成される集合のうち、ノードの数が最大となる集合は３つあり、これらの集合のノード数は３である。すなわち、図５に示す例では、グラフにおける最大独立集合は、一点鎖線で囲んだ３つの集合となる。

ここで、上述したように、コンフリクトグラフは、ノードどうしが異なる状況にある原子で構成される場合は、そのノードの間にエッジを作成し、同じ状況にある原子で構成される場合は、そのノードの間にはエッジを作成しないというルールに基づいて作成される。このため、コンフリクトグラフにおいて、ノード間にエッジが存在しないノードで構成される集合のうち、ノードの数が最大となる集合である最大独立集合を求めることは、２つの分子間において共通する部分構造のうち、最大のものを求めることと同義となる。言い換えると、コンフリクトグラフにおける最大独立集合を求めることにより、２つの分子における最も大きな共通の部分構造を特定することができる。

つまり、２つの分子をグラフ化して、グラフ化した分子の構造に基づいてコンフリクトグラフを作成し、コンフリクトグラフにおける最大独立集合を求めることにより、当該２つの分子における最大の共通部分構造を求めることができる。
図６には、分子Ａ（酢酸）と分子Ｂ（酢酸メチル）とにおける最大の共通部分構造を、コンフリクトグラフの最大独立集合を求める（最大独立集合問題を解く）ことにより求める場合における流れの一例を示す。図６に示すように、分子Ａと分子Ｂをそれぞれグラフ化し、同じ元素どうしを組み合わせてノードとし、ノードを構成する原子の状況に応じてエッジを形成してコンフリクトグラフを作成する。そして、作成したコンフリクトグラフにおける最大独立集合を求めることにより、分子Ａと分子Ｂにおける最大の共通部分構造を求めることができる。

ここで、コンフリクトグラフの最大独立集合を求める（探索する）ための具体的な方法の一例について説明する。
コンフリクトグラフの最大独立集合の探索は、例えば、最小化することが最大独立集合の探索をすることを意味するハミルトニアンを用いることにより行うことができる。より具体的には、例えば、下記の式（１）に示すハミルトニアン（Ｈ）を用いることにより行うことができる。

ここで、上記式（１）において、ｎは、コンフリクトグラフにおけるノードの数であり、ｂ_iは、ｉ番目の前記ノードに対するバイアスを表す数値である。
さらに、ｗ_ijは、ｉ番目のノードとｊ番目のノードとの間にエッジが存在するときは、０ではない正の数であり、ｉ番目のノードとｊ番目のノードとの間にエッジが存在しないときは、０である。
また、ｘ_iは、ｉ番目のノードが０又は１であることを表すバイナリ変数であり、ｘ_jは、ｊ番目のノードが０又は１であることを表すバイナリ変数である。
なお、α及びβは、正の数である。

上記式（１）で表されるハミルトニアンと最大独立集合の探索との関係について、更に詳細に説明する。上記式（１）は、ＱｕａｄｒａｔｉｃＵｎｃｏｎｓｔｒａｉｎｅｄＢｉｎａｒｙＯｐｔｉｍｉｚａｔｉｏｎ（ＱＵＢＯ）形式のイジングモデル式を表すハミルトニアンである。
上記式（１）において、ｘ_iは、１である場合、ｉ番目のノードが最大独立集合の候補となる集合に含まれることを意味し、０である場合、ｉ番目のノードが最大独立集合の候補となる集合に含まれないことを意味する。同様に、上記式（１）において、ｘ_ｊは、１である場合、ｊ番目のノードが最大独立集合の候補となる集合に含まれることを意味し、０である場合、ｊ番目のノードが最大独立集合の候補となる集合に含まれないことを意味する。
このため、上記式（１）について、状態を１とした（ビットを１にした）ノード間にはエッジが存在しないという制約の下で、できるだけ多くのノードの状態が１となる組み合わせを探索することにより、最大独立集合を探索することができる。

ここで、上記式（１）における各項について説明する。
上記式（１）における右辺の一項目（係数が－αの項）は、ｘ_iが１となるｉが多いほど（最大独立集合の候補となる集合に含まれるノードの数が多いほど）、値が小さくなる項である。なお、上記式（１）における右辺の一項目において値が小さくなるとは、大きな負の数になることを意味する。つまり、上記式（１）においては、右辺の一項目の作用により、多くのノードのビットが１となると、ハミルトニアン（Ｈ）の値が小さくなる。

上記式（１）における右辺の二項目（係数がβの項）は、ビットが１になっているノード間にエッジが存在する場合（ｗ_ijが０ではない正の数である場合）に、値が大きくなるペナルティーの項である。言い換えると、上記式（１）における右辺の二項目は、ビットが１になっているノード間においてエッジが存在する箇所がない場合には０となり、それ以外の場合には正の数となる。つまり、上記式（１）においては、右辺の二項目の作用により、ビットが１になっているノード間にエッジが存在すると、ハミルトニアン（Ｈ）の値が大きくなる。

上記式（１）は、上述したように、多くのノードのビットが１となると値が小さくなるとともに、ビットが１になっているノード間にエッジが存在すると値が大きくなるため、上記式（１）を最小化することが最大独立集合の探索をすることを意味するといえる。

ここで、上記式（１）で表されるハミルトニアンと最大独立集合の探索との関係について、図面を参照しながら例を用いて説明する。
ノードの数が６個のグラフにおいて、図７に示す例のように各ノードにビットを設定する場合を考える。図７の例では、図５と同様に、ノード間にエッジが存在する箇所は実線で当該ノードどうしを結び、エッジが存在しない箇所は点線で当該ノードどうしを結んでいる。

図７の例について、上記式（１）におけるｂ_iを１とし、ｉ番目のノードとｊ番目のノードとの間にエッジが存在するときのｗ_ijを１とすると、上記式（１）は次のようになる。

このように、図７の例では、ビットが１になっているノード間においてエッジが存在する箇所がない場合（独立集合として矛盾がない場合）には右辺の二項目は０となり、一項目の値が、そのままハミルトニアンの値となる。

次に、図８に示す例のように各ノードにビットを設定する場合を考える。図７の例と同様に、上記式（１）におけるｂ_iを１とし、ｉ番目のノードとｊ番目のノードとの間にエッジが存在するときのｗ_ijを１とすると、上記式（１）は次のようになる。

このように、図８の例では、ビットが１になっているノード間においてエッジが存在する箇所があるため、右辺の二項目は０とはならず、ハミルトニアンの値は、右辺の２つの項の和となる。ここで、図７及び８に示した例では、例えば、α＞５βとすると、－３α＜－４α＋５βとなるため、図８の例におけるハミルトニアンの値よりも、図７の例におけるハミルトニアンの値の方が小さくなっている。図７の例は、最大独立集合として矛盾のないノードの集合であり、上記式（１）のハミルトニアンの値が小さくなるノードの組み合わせを探索することにより、最大独立集合を探索できることがわかる。

次に、非特許文献１に記載されているような従来技術の一例における、探索した最大独立集合に基づいて、分子どうしの構造の類似度を算出する方法について説明する。
分子どうしの構造の類似度は、例えば、下記の式（２）を用いて算出することができる。

ここで、上記式（２）において、Ｓ（Ｇ_Ａ，Ｇ_Ｂ）は、グラフ化した第一の分子（例えば、分子Ａ）とグラフ化した第二の分子（例えば、分子Ｂ）との類似度を表し、０～１で表され、１に近づく程、類似度が高いことを意味する
また、Ｖ_Ａは、グラフ化した第一の分子におけるノード原子の総数を表し、Ｖ_ｃ ^Ａは、グラフ化した第一の分子におけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。なお、ノード原子とは、グラフ化した分子における頂点の原子を意味する。
さらに、Ｖ_Ｂは、グラフ化した第二の分子におけるノード原子の総数を表し、Ｖ_ｃ ^Ｂは、グラフ化した第二の分子におけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。
δは、０～１の数である。

また、上記式（２）において、ｍａｘ｛Ａ，Ｂ｝は、ＡとＢのうち、値が大きい方を選択することを意味し、ｍｉｎ｛Ａ，Ｂ｝は、ＡとＢのうち、値が小さい方を選択することを意味する。

ここで、図１等と同様に、酢酸（分子Ａ）と酢酸メチル（分子Ｂ）を例として、類似度の算出方法について説明する。
図９に示したコンフリクトグラフにおいて、最大独立集合は、ノード〔Ａ１Ｂ１〕、ノード〔Ａ２Ｂ２〕、ノード〔Ａ３Ｂ３〕、及びノード〔Ａ５Ｂ５〕の４つのノードで構成される。つまり、図９の例においては、｜Ｖ_Ａ｜は４となり、｜Ｖ_ｃ ^Ａ｜は４となり、｜Ｖ_Ｂ｜は５となり、｜Ｖ_ｃ ^Ｂ｜は４となる。また、この例において、δを０．５として、第一の分子と第二の分子の平均を取る（均等に扱う）こととすると、上記式（２）は次のようになる。

このように、図９の例においては、上記式（２）に基づいて、分子どうしの構造の類似度は０．９と算出される。

以上、説明したように、非特許文献１に記載されているような従来技術の一例においては、上記式（１）及び式（２）を用いて、化合物（分子）どうしの構造の類似度を算出する。
しかしながら、このような従来技術においては、化合物の構造の情報のみに基づいて、類似度を算出している。このため、このような従来技術を用いて算出された構造の類似度に基づいて、化合物の特性（物性）の特性値を予測しようとすると、予測する特性によっては予測の精度が悪くなってしまう場合があった。より具体的には、例えば、化合物の比誘電率は、化合物の分極率などに影響される特性であり、化合物の単純な構造の情報のみに基づいて精度良く算出することが難しい場合がある。
さらに、上述したような従来技術では、予測する特性ごとに化合物の類似度を算出することができず、所望の特性に着目して類似する化合物を探索することができないという問題があった。より具体的には、従来技術では、化合物の構造の情報のみに基づいて類似度を算出するため、例えば、沸点を予測する場合と熱伝導率を予測する場合とにおいて、類似度が高い（特性値が近い）と評価される化合物は同一の化合物となる。しかし、実際には、沸点が近い化合物どうしの熱伝導率が近いとは限らない。
このように、従来技術においては、予測する特性に応じて類似する化合物を探索することはできなかった。

そこで、本発明者は、化合物などの対象材料の特性の特性値を、当該特性に応じて高精度に予測できる結合構造探索装置等について鋭意検討を重ね、本件で開示する技術を想到した。すなわち、本発明者は、対象材料の特性の特性値を予測する際に、対象材料と特性の特性値が第１の値である第１材料との、特性に係る類似度を求めることにより対象材料の特性値を予測することで、対象材料の特性値を高精度に予測できることを見出した。
以下では、本件で開示する技術の一例について説明する。

＜対象材料、第１材料＞
本件で開示する技術の一例において、対象材料とは、特性値を予測する対象となる材料を意味する。また、対象材料としては、例えば、予測する特性の特性値が未知のものとすることができる。
対象材料としては、特に制限はなく、目的に応じて適宜選択することができ、分子であってもよいし、分子でなくてもよい。分子以外の対象材料としては、例えば、無機結晶などが挙げられる。
また、コンフリクトグラフにおける最大独立集合問題を解くことにより特性値を予測する場合、対象材料としては、グラフ化可能な材料であれば、特に制限はなく、目的に応じて適宜選択することができる。

本件で開示する技術の一例において、第１材料とは、対象材料における予測する特性の特性値が、第１の値である材料を意味する。ここで、第１の値としては、特に制限はなく、目的に応じて適宜選択でき、例えば、既に既知となっている特性値を用いることができる。言い換えると、第１材料としては、例えば、対象材料における予測する特性の特性値が、特定されている（既知である）材料とすることができる。
第１材料としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、対象材料と同様のものとすることができる。

ここで、本件で開示する技術の一例においては、対象材料の化学構造データは、多数の対象材料の化学構造データ群（データベース）として入力されることが好ましい。言い換えると、本件で開示する技術の一例としての材料特性予測装置が、多数の対象材料の化学構造データ群を有することが好ましい。同様に、本件で開示する技術の一例としての材料特性予測装置が、多数の第１材料の化学構造データ群を有することが好ましい。
対象材料及び第１材料の化学構造データ群の形式（データ構造）としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、上述したＳＤＦ形式などが挙げられる。本件で開示する技術の一例においては、例えば、第１材料の化学構造データ群に含まれる対象材料の特性に関する情報に基づいて、特性に係る類似度を求めることができる。

本件で開示する技術の一例においては、例えば、対象材料の化合物名や慣用名などを受け付けて、対象材料の化学構造データ群と照合することにより、対象材料の構造を特定してもよい。また、本件で開示する技術の一例においては、例えば、対象材料の化学構造データを直接入力することにより、対象材料の構造を特定してもよい。
また、本件で開示する技術の一例においては、必要に応じて、対象材料の化学構造データベースを、新たな化学構造データを追加することにより更新（アップデート）してもよい。同様に、本件で開示する技術の一例においては、必要に応じて、第１材料の化学構造データベースを、新たな化学構造データを追加することにより更新（アップデート）してもよい。

＜材料の特性＞
本件で開示する技術の一例を用いて予測する対象材料の特性としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、比誘電率、沸点、融点、熱伝導率、比熱、粘度、蒸気圧、蒸発潜熱、引火点などが挙げられる。また、第１材料において、特定の物質に対する活性（例えば、結合性、反応性など）が既知である場合には、本件で開示する技術の一例を用いて、このような活性を予測してもよい。

＜特性に係る類似度＞
本件で開示する技術の一例では、特性に係る類似度を求める。例えば、本件で開示する技術の一例としての材料特性予測装置は、対象材料と第１材料との、特性に係る類似度を求めることにより対象材料の特性値を予測する特性予測部を備える。
以下では、本件で開示する技術における、特性に係る類似度を求める手法の一例について説明する。なお、本件で開示する技術の一例としての材料特性予測装置における、特性に係る類似度の算出や対象材料の特性値の予測は、例えば、材料特性予測装置が有する特性予測部により行うことができる。

本件で開示する技術の一例においては、例えば、上記式（１）及び式（２）を用いて対象材料と第１材料との類似度を求める際に、上記式（１）及び式（２）におけるパラメータを、予測する対象材料の特性値の予測精度が高くなるように最適化する。

本件で開示する技術の一例においては、例えば、上述した従来技術と同様に、式（１）を用いて、対象材料及び第１材料の分子構造に基づく最大独立集合の探索をすることにより特性に係る類似度を求めることができる。

ただし、上記式（１）において、Ｈは、Ｈを最小化することが最大独立集合の探索をすることを意味するハミルトニアンである。
ｎは、グラフ化した対象材料及び第１材料のコンフリクトグラフにおけるノードの数として理解されるものである。
また、コンフリクトグラフは、グラフ化した対象材料を構成する各ノード原子と、グラフ化した第１材料を構成する各ノード原子との組合せをノードとし、複数あるノードどうしを比較して互いに同一でないノード間にはエッジを作成し、複数あるノードどうしを比較して互いに同一であるノード間にはエッジを作成しないというルールに基づき作成されるグラフとして理解されるものである。
ｂ_iは、ｉ番目のノードに対するバイアスを表す数値である。
ｗ_ijは、ｉ番目のノードとｊ番目のノードとの間にエッジが存在するときは、０ではない正の数であり、ｉ番目のノードとｊ番目のノードとの間にエッジが存在しないときは、０である。
ｘ_iは、ｉ番目のノードが０又は１であることを表すバイナリ変数であり、ｘ_jは、ｊ番目のノードが０又は１であることを表すバイナリ変数である。
なお、α及びβは、正の数である。

ここで、本件で開示する技術の一例においては、「複数あるノードどうしを比較して互いに同一である」とは、複数あるノードどうしを比較したときに、これらのノードが互いに同一の状況（結合状況）にあるノード原子で構成されることを意味する。同様に、本件で開示する技術の一例においては、「複数あるノードどうしを比較して互いに同一でない」とは、複数あるノードどうしを比較したときに、これらのノードが互いに異なる状況（結合状況）にあるノード原子で構成されることを意味する。

本件で開示する技術の一例において、上記式（１）を用いて最大独立集合の探索を行う場合、グラフ化した対象材料及び第１材料のコンフリクトグラフを作成することは必須ではなく、少なくとも上記式（１）を最小化できればよい。言い換えると、本件で開示する技術の一例においては、対象材料及び第１材料のコンフリクトグラフにおける最大独立集合の探索を、最小化することが最大独立集合の探索をすることを意味するハミルトニアンにおける組み合わせ最適化問題に置き換えて解く。ここで、上記式（１）のようにＱＵＢＯ形式のイジングモデル式で表されるハミルトニアンの最小化は、アニーリングマシンなどを用いて焼き鈍し法（アニーリング）を行うことにより、短時間で実行することができる。
このため、本件で開示する技術は、一つの側面では、上記式（１）を用いることで、アニーリングマシンなどを用いた焼き鈍し法により最大独立集合を探索することができるため、より短時間で対象材料の特性値を予測することができる。言い換えると、本件で開示する技術は、一つの側面では、焼き鈍し法により上記式（１）におけるハミルトニアン（Ｈ）の最小化をすることにより最大独立集合の探索をすることにより、より短時間で対象材料の特性値を予測することができる。なお、焼き鈍し法の詳細については後述する。

また、本件で開示する技術の一例においては、例えば、上述した従来技術と同様に、式（２）を用いて、探索された最大独立集合について特性に係る類似度を求めることができる。

ただし、上記式（２）において、Ｇ_Ａは、グラフ化した対象材料を表し、Ｇ_Ｂは、グラフ化した第１材料を表し、Ｓ（Ｇ_Ａ，Ｇ_Ｂ）は、グラフ化した対象材料とグラフ化した第１材料との類似度を表し、０～１で表され、１に近づく程、類似度が高いことを意味する。
また、Ｖ_Ａは、グラフ化した対象材料におけるノード原子の総数を表し、Ｖ_ｃ ^Ａは、グラフ化した対象材料におけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。
Ｖ_Ｂは、グラフ化した第１材料におけるノード原子の総数を表し、Ｖ_ｃ ^Ｂは、グラフ化した第１材料におけるノード原子の内、コンフリクトグラフの最大独立集合に含まれるノード原子の数を表す。
なお、δは、０～１の数である。

本件で開示する技術は、一つの側面では、上記式（２）を用いて、探索された最大独立集合について特性に係る類似度を求めることにより、上記式（１）により探索された最大独立集合に基づいて、対象材料と第１材料との特性に係る類似度を求めることができる。

次に、本件で開示する技術の一例として、上記式（１）を用いて特性に係る類似度を求める際に、グラフ化した対象材料及び第１材料におけるノード原子に、ノード原子どうしの接続情報を加味してラベルを付す場合について説明する。なお、ノード原子とは、上述したように、グラフ化した対象材料及び第１材料における頂点の原子を意味する。
ノード原子どうしの接続情報を加味してラベルを付す方法としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、非特許文献２などで開示されている、Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続により行うことができる。

Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続とは、例えば、グラフ化した対象材料及び第１材料におけるノード原子に付すラベルを、そのノード原子が接続（結合）している原子ノードのラベルを考慮してリラベリングする（ラベルを振り直す）手続を意味する。なお、以下では、Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を行うことによりノード原子に付したラベルを「ＷＬラベル」と称することがある。
つまり、ノード原子に対しＷｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続によるＷＬラベルを付すことにより、ノード原子のラベルに、当該ノード原子の周囲に存在するノード原子の情報を取り込むことができる。これにより、本件で開示する技術は、一つの側面では、式（１）を用いて特性に係る類似度を求める際に、ノード原子に対しＷＬラベルを付すことにより、当該ノード原子の状況を考慮したラベルを付すことができる。より具体的には、例えば、第１材料における特性値と、対象材料と第１材料の類似度との相関が高くなるように、各ノード原子にＷＬラベルを付して特性に係る類似度を求めることで、対象材料の特性値をより高精度に予測できる。

また、本件で開示する技術の一例において、ノード原子に対してＷｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を行う回数としては、特に制限はなく、目的に応じて適宜選択することができ、１回であってもよいし、複数回であってもよい。Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続においては、リラベリングを行う毎に、より遠くのノード原子の情報をリラベリングしたノード原子に取り込むことができる。

図１０は、Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を行い、ノード原子に対しＷＬラベルを付す際の流れの一例を示す模式図である。図１０に示す例においては、グラフ化したメトキシ酢酸（ＣＨ_３ＯＣＨ_２ＣＯＯＨ）について、Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を行ってＷＬラベルを付す場合に関して説明する。
図１０の左部に示す、水素以外の原子を選択してグラフ化したメトキシ酢酸の構造においては、各ノード原子には、当該ノード原子の種類（元素）をラベルとして付している。このグラフ化したメトキシ酢酸の構造に対して、Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続によりリラベリングを１回行うことでＷＬラベルを付した状態を、図１０の中央部に示す。図１０の中央部の上側に示す例において、例えば、カルボキシ基における炭素に付されるＷＬラベルは〔Ｃ，ＣＯＯ〕となっている。この〔Ｃ，ＣＯＯ〕というＷＬラベルは、当該ＷＬラベルが付されたノード原子が、一つの炭素原子と２つの酸素原子と結合している炭素原子であることを意味するラベルである。
また、図１０の中央部の下側には、図１０の中央部の上側に示すＷＬラベルを、ＷＬラベルの内容の種類ごとに書き換えたものを示す。例えば、図１０の中央部の上側で〔Ｏ，Ｃ〕というＷＬラベルが付されているノード原子のＷＬラベルを、図１０の中央部の下側においては、〔Ｏ１〕というＷＬラベルに書き換えている。このように、ＷＬラベルを書き換えることにより、ＷＬラベルの表記を簡素化することができる。

図１０の右部には、図１０の中央部の下側に示す構造に対して、更にＷｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を行い、２回目のリラベリングにおけるＷＬラベルを付した状態を示す。図１０の右部に示す例において、例えば、〔Ｏ１，Ｃ３〕というＷＬラベルは、当該ＷＬラベルが付されたノード原子が、Ｃ３というノード原子と結合するＯ１というノード原子であることを意味するラベルである。
なお、図１０の例では、ＷＬラベルの表記を書き換える際やＷｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を複数回行う際に、前の状態の情報が失われる場合について説明したが、本件で開示する技術は、これに限られるものではない。すなわち、本件で開示する技術の一例においては、リラベリングを複数回行う際に、前の状態の情報（リラベリングする前のＷＬラベルの情報）が、リラベリング後のＷＬラベルに含まれるようにしてもよい。

ここで、本件で開示する技術の一例においては、ＷＬラベルが、ノード原子における一のノード原子において、当該一のノード原子の情報と、当該一のノード原子が結合する結合ノード原子の情報とに由来するものであることが好ましい。言い換えると、本件で開示する技術の一例においては、Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を１回行うことによりＷＬラベルをノード原子に付すことが好ましい。
こうすることにより、本件で開示する技術は、一つの側面では、各ノード原子のＷＬラベルに、当該ノード原子が結合するノード原子の情報を取り込むことができるため、当該ノード原子の周囲の状況を適切に考慮してＷＬラベルを付すことができる。

また、本件で開示する技術の一例において、ＷＬラベルに含まれる情報としては、特に制限はなく、目的に応じて適宜選択することができる。ＷＬラベルに含まれる情報としては、例えば、上述した例のようにノード原子の種類（元素）としてもよいし、予測する特性の発現に対する寄与値としてもよい。

ここで、本件で開示する技術の一例において、予測する特性の発現に対する寄与値（ΔＢ）は、上記式（１）において、ｉ番目ノードを構成するノード原子に付されたＷＬラベルの情報に含まれる評価指数（Ｂ_ｉ）の値の算定基準となる数値を意味する。
本件で開示する技術の一例において、予測する特性の発現に対する寄与値ΔＢは、例えば、対象材料及び第１材料におけるノード原子の種類（元素）毎に算出する。言い換えると、本件で開示する技術の一例では、評価指数Ｂｉが、対象材料及び第１材料におけるノード原子の種類（元素）毎に算出した、特性の発現に対する寄与値ΔＢの合計を意味する。
また、予測する特性の発現に対する寄与値ΔＢは、例えば、特性に係る類似度と特性に係る特性値との相関係数が大きくなるような数値を選択することが好ましい。寄与値ΔＢを、特性に係る類似度と特性に係る特性値との相関係数が大きくなるような数値とする具体的な手法については後述する。

また、本件で開示する技術の一例においては、上記式（１）を用いて特性に係る類似度を求める際に、ノード原子を、ＷＬラベルの情報に基づき特性の発現に対する評価指数Ｂ_ｉに応じて選択することが好ましい。言い換えると、本件で開示する技術の一例においては、コンフリクトグラフにおける最大独立集合に含まれ得るノードを、評価指数Ｂ_ｉに応じて選択することが好ましい。
こうすることにより、本件で開示する技術は、一つの側面では、特性の発現に寄与している類似度の算出に用いるべきノード原子を適切に選択して、対象材料の特性値をより高精度に予測することができる。

評価指数Ｂ_ｉに応じたノード原子の選択は、例えば、評価指数Ｂ_ｉが閾値を超えたノード原子を選択することにより行うことができる。言い換えると、本件で開示する技術の一例においては、式（１）を用いて特性に係る類似度を求める際に、ノード原子を、評価指数Ｂ_ｉが閾値を超えたときに選択することができる。

なお、ここで、評価指数Ｂ_ｉに対する閾値としては、特に制限はなく、目的に応じて適宜選択することができるが、特性に係る類似度と特性に係る特性値との相関係数が大きくなるような数値とすることが好ましい。言い換えると、本件で開示する技術の一例では、式（１）において、ｉ番目のノードを構成するノード原子に付されたＷＬラベルの情報に含まれる評価指数Ｂ_ｉの閾値を、特性に係る類似度と特性に係る特性値との相関係数が大きくなるような数値とすることが好ましい。評価指数Ｂ_ｉの閾値を、特性に係る類似度と特性に係る特性値との相関係数が大きくなるような数値とする具体的な手法については後述する。

ここで、本件で開示する技術の一例においては、上述した手法などにより選択したノード原子を用いて、コンフリクトグラフのノードを作成してもよい。こうすることにより、本件で開示する技術は、一つの側面では、コンフリクトグラフのノードの数を少なくすることができるため、最大独立集合の探索に必要とされる計算機のビット数を削減することができる。
また、本件で開示する技術の一例においては、対象材料及び第１材料におけるノード原子の全ての組み合わせを含むコンフリクトグラフを作成し、上述した手法などにより選択したノード原子を含むノードが、最大独立集合に含まれ得るようにしてもよい。言い換えると、本件で開示する技術の一例においては、上述した手法などにより選択したノード原子を含むノードを対象として、最大独立集合の探索を行うようにしてもよい。

本件で開示する技術の一例において、上述した手法などにより選択したノード原子を含むノードを対象として、最大独立集合の探索を行う手法としては、特に制限はなく、目的に応じて適宜選択することができる。
選択されたノード原子を含むノードを対象とした最大独立集合の探索は、例えば、上記式（１）におけるｂ_iを、ｉ番目のノードを構成するノード原子に付されたＷＬラベルの情報に含まれる評価指数Ｂ_ｉの大きさに対応した数値とすることにより行うことができる。ここで、上記式（１）におけるｂ_iを評価指数Ｂ_ｉの大きさに対応した数値とすることは、例えば、上記式（１）におけるｂ_iの数値と評価指数Ｂ_ｉの数値との大小関係を対応させることにより行うことができる。具体的には、例えば、評価指数Ｂ_ｉの数値が大きいノードにおけるｂ_iの数値を大きくし、評価指数Ｂ_ｉの数値が小さいノードにおけるｂ_iの数値を小さくすることにより行うことができる。
こうすることにより、本件で開示する技術は、一つの側面では、特性の発現に寄与していると考えられる評価指数Ｂ_ｉが大きいノード原子を有するノードが含まれるように、最大独立集合の探索を行うことができる。これにより、本件で開示する技術は、一つの側面では、特性の発現に寄与している原子を適切に考慮して、特性に係る類似度を求めることができるため、対象材料の特性値をより高精度に予測することができる。

ここで、選択されたノード原子を含むノードを対象とした最大独立集合の探索は、より具体的には、例えば、上記式（１）におけるｂ_iを、以下の条件に従って定めることで行うことができる。
［条件］
ｉ番目のノードを構成するノード原子に付されたＷＬラベルの情報に含まれる評価指数Ｂ_ｉが閾値を超えたときに、正の数とし、ｉ番目のノードを構成するノード原子に付されたＷＬラベルの情報に含まれる評価指数Ｂ_ｉが閾値以下のときに、負の数とする。

上記式（１）において、ｂ_iが正の数（０より大きい数）である場合は、上記式（１）における右辺の一項目（係数が－αの項）は、ｉ番目のノードが独立集合に含まれるとき（ｉ番目のノードのビットが１となるとき）に値が小さくなる。つまり、上記式（１）において、ｂ_iが正の数である場合は、右辺の一項目の作用により、ｉ番目のノードが独立集合に含まれると、ハミルトニアン（Ｈ）の値が小さくなる。これは、ｉ番目のノードが含まれるように最大独立集合を探索することに対応する。
一方、上記式（１）において、ｂ_iが負の数（０より小さい数）である場合は、上記式（１）における右辺の一項目は、ｉ番目のノードが独立集合に含まれるとき（ｉ番目のノードのビットが１となるとき）に値が大きくなる。つまり、上記式（１）において、ｂ_iが負の数である場合は、右辺の一項目の作用により、ｉ番目のノードが独立集合に含まれると、ハミルトニアン（Ｈ）の値が大きくなる。これは、ｉ番目のノードが含まれないように最大独立集合を探索することに対応する。

このように、評価指数Ｂ_ｉの閾値に基づいて、上記式（１）におけるｂ_iの正負を変化させることにより、特性の発現に寄与していると考えられる評価指数Ｂ_ｉが閾値を超えるノード原子を有するノードが含まれるように、最大独立集合の探索を行うことができる。これにより、本件で開示する技術は、一つの側面では、特性の発現に寄与している原子をより適切に考慮して、特性に係る類似度を求めることができるため、対象材料の特性値をより高精度に予測することができる。
なお、上記式（１）におけるｂ_iが正の数である場合の数値の大きさとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、１とすることができる。同様に、上記式（１）におけるｂ_iが負の数である場合の数値の大きさとしては、特に制限はなく、目的に応じて適宜選択することができ、例えば、－１とすることができる。

上述した説明では、本件で開示する技術の一例として、ノード原子の種類（元素）毎の寄与値ΔＢ、評価指数Ｂ_ｉの閾値、特性に係る類似度と特性に係る特性値との相関係数が大きくなるように選択することについては記載した。しかしながら、本件で開示する技術は、これらの形態に限られるものではなく、その他のパラメータなどを、特性に係る類似度と特性に係る特性値との相関係数が大きくなるように選択する（更新する）形態であってもよい。
具体的には、本件で開示する技術の一例においては、一度求めた特性に係る類似度と特性に係る特性値との相関係数が大きくなるように、以下の＜Ａ＞から＜Ｄ＞のパラメータ、及び＜Ｅ＞の類似度評価式Ｓの数式自体の少なくともいずれかの更新をすることが好ましい。
＜Ａ＞上記式（１）において、ｉ番目のノードを構成するノード原子に付されたＷＬラベルの情報に含まれる評価指数Ｂ_ｉの値の算定基準となる、ノード原子の種類（元素）毎の寄与値ΔＢの数値
＜Ｂ＞上記式（１）において、ｉ番目のノードを構成するノード原子に付されたＷＬラベルの情報に含まれる評価指数Ｂ_ｉの閾値
＜Ｃ＞上記式（１）におけるｂ_iの数値
＜Ｄ＞上記式（１）におけるｗ_ijの数値
＜Ｅ＞上記式（２）で表される類似度評価式Ｓ

すなわち、本件で開示する技術の一例においては、求めた特性に係る類似度と特性に係る特性値との相関係数が大きくなるように、上記＜Ａ＞から＜Ｅ＞の少なくともいずれかの更新をし、特性に係る類似度を求め直すことが好ましい。こうすることにより、本件で開示する技術は、一つの側面では、特性に係る類似度を算出するためのパラメータを最適化することができ、対象材料の特性値をより高精度に予測することができる。

ここで、上記＜Ｅ＞の上記式（２）で表される類似度評価式Ｓを更新する場合について説明する。上記＜Ｅ＞の類似度評価式Ｓの更新については、特に制限はなく、目的に応じて適宜選択でき、例えば、複数の類似度評価式Ｓの中から類似度の算出に用いる式を選択すること、類似度評価式Ｓにおけるδの数値を更新することなどが挙げられる。
本件で開示する技術の一例においては、求めた特性に係る類似度と特性に係る特性値との相関係数が大きくなるように、例えば、複数の類似度評価式Ｓの中から下記の式を選択して、上記式（２）で表される類似度評価式Ｓの更新を行ってもよい。

ここで、上記の式において、Ｍ_Ａは、対象材料の分子量を示し、Ｍ_Ｂは、第１材料の分子量を示し、δ_１＋δ_２＋δ_３＝１となっている。

例えば、対象材料における沸点を予測する際において、沸点の予測に分子量が大きく影響する場合に、上記式（２）で表される類似度評価式Ｓを上記の式に更新することにより、沸点の予測精度を向上させることができると考えられる。
さらに、上記の式のδ_１、δ_２、及びδ_３を、求めた特性に係る類似度と特性に係る特性値との相関係数が大きくなるように更新することで、沸点の予測精度をより向上させることができる。沸点の予測に分子量が大きく影響する場合には、上記の式のδ_１、δ_２、及びδ_３を更新して最適化すると、δ_３が、δ_１及びδ_２よりも大きな値となると考えられる。

また、上記＜Ａ＞から＜Ｅ＞のパラメータの少なくともいずれかの更新を行う手法としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、機械学習を利用することができる。具体的な機械学習の手法としては、特に制限はなく、目的に応じて適宜選択することができるが、遺伝的アルゴリズムを用いることが好ましい。
遺伝的アルゴリズムとは、データ（解の候補）を遺伝子で表現した「個体」を複数用意し、適応度の高い個体を優先的に選択して、交叉（組み換え）・突然変異などの操作を繰り返しながら解を探索する手法である。
本件で開示する技術は、一つの側面では、上記＜Ａ＞から＜Ｅ＞のパラメータの少なくともいずれかの更新を、遺伝的アルゴリズムにより行うことで、特性に係る類似度と特性に係る特性値との相関係数を、より効率的に向上させることができる。

さらに、本件で開示する技術の一例においては、求めた特性に係る類似度と特性に係る特性値との相関係数が閾値を超えたときに、対象材料における特性に係る類似度を出力することが好ましい。こうすることにより、本件で開示する技術は、一つの側面では、特性に係る類似度を算出するためのパラメータが最適化された状態における、特性に係る類似度を出力することができる。
なお、求めた特性に係る類似度と特性に係る特性値との相関係数における閾値としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、０．７とすることができる。

加えて、本件で開示する技術の一例においては、求めた特性に係る類似度と特性に係る特性値との相関係数が閾値を超えたときに、対象材料における特性値を予測することが好ましい。こうすることにより、本件で開示する技術は、一つの側面では、特性に係る類似度を算出するためのパラメータが最適化された状態における特性に係る類似度を用いて、対象材料の特性値をより高精度に予測することができる。

以下、装置の構成例やフローチャートなどを用いて、本件で開示する技術の一例を更に詳細に説明する。
図１１に、本件で開示する材料特性予測装置のハードウェア構成例を示す。
材料特性予測装置１０においては、例えば、制御部１１、メモリ１２、記憶部１３、表示部１４、入力部１５、出力部１６、Ｉ／Ｏインターフェース部１７がシステムバス１８を介して接続されている。

制御部１１は、演算（四則演算、比較演算、焼き鈍し法の演算等）、ハードウェア及びソフトウェアの動作制御などを行う。
制御部１１としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）であってもよいし、後述する焼き鈍し法に用いる最適化装置であってもよく、これらの組み合わせでもよい。
本件で開示する材料特性予測装置における特性予測部は、例えば、制御部１１により実現することができる。

メモリ１２は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）などのメモリである。ＲＡＭは、ＲＯＭ及び記憶部１３から読み出されたＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）及びアプリケーションプログラムなどを記憶し、制御部１１の主メモリ及びワークエリアとして機能する。

記憶部１３は、各種プログラム及びデータを記憶する装置であり、例えば、ハードディスクである。記憶部１３には、制御部１１が実行するプログラム、プログラム実行に必要なデータ、ＯＳなどが格納される。
また、本件で開示する材料特性予測プログラムは、例えば、記憶部１３に格納され、メモリ１２のＲＡＭ（主メモリ）にロードされ、制御部１１により実行される。

表示部１４は、表示装置であり、例えば、ＣＲＴモニタ、液晶パネルなどのディスプレイ装置である。
入力部１５は、各種データの入力装置であり、例えば、キーボード、ポインティングデバイス（例えば、マウス等）などである。
出力部１６は、各種データの出力装置であり、例えば、プリンタなどである。
Ｉ／Ｏインターフェース部１７は、各種の外部装置を接続するためのインターフェースである。Ｉ／Ｏインターフェース部１７は、例えば、ＣＤ－ＲＯＭ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＤＶＤ－ＲＯＭ（ＤｉｇｉｔａｌＶｅｒｓａｔｉｌｅＤｉｓｋＲｅａｄＯｎｌｙＭｅｍｏｒｙ）、ＭＯディスク（Ｍａｇｎｅｔｏ－Ｏｐｔｉｃａｌｄｉｓｋ）、ＵＳＢメモリ〔ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）ｆｌａｓｈｄｒｉｖｅ〕などのデータの入出力を可能にする。

図１２に、本件で開示する材料特性予測装置の他のハードウェア構成例を示す。
図１２に示す例は、材料特性予測装置をクラウド型にした場合の例であり、制御部１１が、記憶部１３などとは独立している。図１３に示す例においては、ネットワークインターフェース部１９、２０を介して、記憶部１３などを格納するコンピュータ３０と、制御部１１を格納するコンピュータ４０とが接続される。
ネットワークインターフェース部１９、２０は、インターネットを利用して、通信を行うハードウェアである。

図１３に、本件で開示する材料特性予測装置の他のハードウェア構成例を示す。
図１３に示す例は、結合構造探索装置をクラウド型にした場合の例であり、記憶部１３が、制御部１１などとは独立している。図１３に示す例においては、ネットワークインターフェース部１９、２０を介して、制御部１１等を格納するコンピュータ３０と、記憶部１３を格納するコンピュータ４０とが接続される。

図１４に、本件で開示する材料特性予測装置の一実施形態としての機能構成例を示す。
図１４に示すように、材料特性予測装置１０は、対象材料構造取得部５１と、第１材料構造取得部５２と、類似度計算部５３、特性予測精度評価部５４、及びパラメータ更新部５５を有する特性予測部５６と、を備える。

対象材料構造取得部５１は、入力として特性値が未知の材料（対象材料）の化学構造データ６１０をＳＤＦ等のファイル形式から読み込む。
第１材料構造取得部５２は、入力として特性値が既知の材料群の化学構造データ群６２０をＳＤＦ等のファイル形式から読み込む。
類似度計算部５３では、読み込んだ化学構造データ６１０と化学構造データ群６２０の中の各構造との間でコンフリクトグラフを作成し、式（１）のハミルトニアンをアニーリング等により最小化することで最大独立集合を探索する。そして、類似度計算部５３は、その結果に基づいて式（２）から類似度を算出する。
特性予測精度評価部５４では、類似度と特性に係る特性値との相関係数を算出し、予測精度を評価する。
そして、算出した予測精度がより高くなるように（類似度と特性に係る特性値との相関係数が大きくなるように）、パラメータ更新部５５で上記式（１）中のパラメータを更新する。

材料特性予測装置１０は、類似度計算部５３、特性予測精度評価部５４、パラメータ更新部５５の処理を繰り返し、類似度と特性に係る特性値との相関係数が閾値を超えたときに、化学構造データ６１０の対象材料の特性予測値６１１を出力する。

また、図１５に示すように、対象材料構造取得部５１が、特性値が既知の材料の化学構造データ５１０をＳＤＦ形式のファイルから読み込み、第１材料構造取得部５２が、特性値が未知の材料群の化学構造データ群５２０をＳＤＦ形式のファイルから読み込んでもよい。この形態においては、材料特性予測装置１０は、類似度計算部５３、特性予測精度評価部５４、パラメータ更新部５５の処理を繰り返し、類似度と特性に係る特性値との相関係数が閾値を超えたときに、化学構造データ群５２０の特性予測値リスト５２１を出力する。

図１６に、本件で開示する技術の一例を用いて、特性に係る類似度を求めることにより、対象材料の特性値を予測する際のフローチャートの例を示す。
まず、特性予測部５６は、対象材料及び第１材料の入力を受け付ける（Ｓ１０１）。このとき、特性予測部５６が、対象材料及び第１材料の化学構造データ群（データベース）から、対象材料と第１材料を選択するようにしてもよい。

次に、特性予測部５６は、グラフ化した対象材料及び第１材料におけるノード原子に対しＷｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続によるＷＬラベルを付す（Ｓ１０２）。
続いて、特性予測部５６は、ＷＬラベルが付された対象材料及び第１材料についてのコンフリクトグラフにおける、最大独立集合の探索を行うことが可能な上記式（１）の形式のハミルトニアンを作成する（Ｓ１０３）。言い換えると、Ｓ１０３において、特性予測部５６は、ＷＬラベルが付された対象材料及び第１材料の情報に基づいて、Ｈを最小化することが最大独立集合の探索をすることを意味するハミルトニアンである上記式（１）を作成する。

そして、特性予測部５６は、アニーリングマシンで上記式（１）を最小化することにより最大独立集合を探索する（Ｓ１０４）。言い換えると、Ｓ１０３において、特性予測部５６は、上記式（１）についての焼き鈍し法を用いた基底状態探索を実行することにより、上記式（１）の最小エネルギーを算出することで、最大独立集合を探索する。
アニーリングマシンとしては、イジングモデルで表されるエネルギー関数について基底状態探索を行なうアニーリング方式を採用するコンピュータであれば特に制限はなく、目的に応じて適宜選択することができる。アニーリングマシンとしては、例えば、量子アニーリングマシン、半導体技術を用いた半導体アニーリングマシン、ＣＰＵやＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を用いてソフトウェアにより実行されるシミュレーテッド・アニーリング（ＳｉｍｕｌａｔｅｄＡｎｎｅａｌｉｎｇ）を行うマシンなどが挙げられる。また、アニーリングマシンとしては、例えば、デジタルアニーラ（登録商標）を用いてもよい。

次に、特性予測部５６は、Ｓ１０４で探索した最大独立集合の探索結果に基づき、上記式（２）を用いて特性に係る類似度を算出する（Ｓ１０５）。
続いて、特性予測部５６は、求めた特性に係る類似度と特性に係る特性値の相関係数が閾値を超えたか否かを判定する（Ｓ１０６）。特性予測部５６は、求めた特性に係る類似度と特性に係る特性値の相関係数が閾値以下であると判定した場合は、処理をＳ１０７に移す。一方、特性予測部５６は、求めた特性に係る類似度と特性に係る特性値の相関係数が閾値を超えたと判定した場合は、処理をＳ１０８に移す。

Ｓ１０７では、特性予測部５６は、特性に係る類似度を求めるためのパラメータを、遺伝的アルゴリズムにより、特性に係る類似度と特性に係る特性値との相関係数が大きくなるように更新する。ここで、更新するパラメータとしては、上述した＜Ａ＞から＜Ｄ＞のパラメータ、及び＜Ｅ＞の類似度評価式Ｓの数式自体の少なくともいずれかとすることができる。
特性予測部５６は、Ｓ１０７において、パラメータを更新すると、処理をＳ１０３に戻す。

Ｓ１０８では、特性予測部５６は、特性に係る類似度、及び予測した対象材料の特性を出力する。結果の出力の形式としては、特に制限はなく、目的に応じて適宜選択できる。

図１７Ａから１７Ｃに、Ｎ－メチルアセトアミドを例として、分子構造、グラフ化した分子構造、及び本件で開示する技術の一例におけるＷＬラベルを付した分子構造を示す。
図１７Ａに、Ｎ－メチルアセトアミドの分子構造の一例を示す。図１７Ａに示した分子構造を、ノード原子のラベルを原子の種類（元素）としてグラフ化したものを図１７Ｂに示す。
図１７Ｃに示す、本件で開示する技術の一例におけるＷＬラベルを付した分子構造においては、〔Ｈ，Ｃ〕、〔Ｃ，ＣＨＨＨ〕、〔Ｃ，ＣＯＮ〕、〔Ｏ，Ｃ〕、〔Ｎ，ＣＨＣ〕、〔Ｈ，Ｎ〕のように、最近接ノード（直接つながっているノード）のラベル情報を取り込んだＷＬラベルが付されている。つまり、この例では、Ｗｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続を１回行うことによりＷＬラベルをノード原子に付している。
ここで、図１７Ｃに示す例における、（）の中の数字は、各ノード原子における評価指数Ｂ_ｉの一例を示す数値である。この例においては、各元素の寄与値ΔＢを、ΔＢ（Ｈ）＝１、ΔＢ（Ｃ）＝６、ΔＢ（Ｏ）＝１６、ΔＢ（Ｎ）＝２０とし、各ノード原子における評価指数Ｂ_ｉを当該ノード原子の寄与値ΔＢの合計としている。なお、各元素の寄与値ΔＢは、材料に含まれる元素に基づいて適宜選択することができ、例えば、対象材料又は第１材料に硫黄（Ｓ）が含まれる場合には、寄与値ΔＢの一つとして、ΔＢ（Ｓ）を加えてもよい。

図１８に、本件で開示する技術の一例を用いて、特性に係る類似度を求めるためのパラメータを更新する際のフローチャートの例を示す。図１８を用いて、特性に係る類似度と特性に係る特性値との相関係数が大きくなるように、各ノード原子における評価指数Ｂ_ｉに対する各元素の寄与値ΔＢ、及びの評価指数Ｂｉの閾値Ｂ_ｔｈを最適化する方法について説明する。
まず、特性予測部５６は、初期のパラメータの値として、ΔＢ（Ｈ）＝１、ΔＢ（Ｃ）＝１、ΔＢ（Ｏ）＝１、ΔＢ（Ｎ）＝１、Ｂ_ｔｈ＝１を設定する（Ｓ２０１）。
次に、特性予測部５６は、各ノード原子について、評価指数Ｂ_ｉ＝ΔＢ（Ｈ）＋ΔＢ（Ｃ）＋ΔＢ（Ｏ）＋ΔＢ（Ｎ）という数式に基づいて、評価指数Ｂ_ｉを算出する（Ｓ２０２）。

続いて、特性予測部５６は、ｉ番目のノードを構成するノード原子の評価指数Ｂ_ｉが、両方とも閾値Ｂ_ｔｈを超えているか否かを判定する（Ｓ２０３）。Ｓ２０３では、特性予測部５６は、ｉ番目のノードにおける評価指数Ｂ_ｉが閾値Ｂ_ｔｈを超えたと判定した場合は、処理をＳ２０４に移す。一方、特性予測部５６は、ｉ番目のノードにおける評価指数Ｂ_ｉが閾値Ｂ_ｔｈ以下であると判定した場合は、処理をＳ２０５に移す。

Ｓ２０４では、特性予測部５６は、上記式（１）におけるｂ_iを１に設定する。ここで、上述したように、ｂ_iを１に設定することは、上記式（１）において、ｉ番目のノードが含まれるように最大独立集合を探索することに対応する。
Ｓ２０５では、特性予測部５６は、上記式（１）におけるｂ_iを－１に設定する。ここで、上述したように、ｂ_iを－１に設定することは、上記式（１）において、ｉ番目のノードが含まれないように最大独立集合を探索することに対応する。

全てのノード原子について、Ｓ２０２からＳ２０５までの処理を行うと、特性予測部５６は、上記式（１）及び式（２）を用いて、特性に係る類似度を算出する（Ｓ２０６）。ここで、上記式（１）の最小化（最大独立集合の探索）は、例えば、アニーリングマシンを用いて行う。
続いて、Ｓ２０７では、特性予測部５６は、特性に係る類似度と特性に係る特性値とをプロットしたグラフを線形近似した場合のＲ^２値（相関係数）を算出する。
次に、特性予測部５６は、算出したＲ^２値が、相関係数の閾値（Ｒ^２ _ｔｈ）を超えたか否かを判定する（Ｓ２０８）。Ｓ２０８において、特性予測部５６は、算出したＲ^２値がＲ^２ _ｔｈ以下であると判定すると、処理をＳ２０９に移す。また、Ｓ２０８において、特性予測部５６は、算出したＲ^２値がＲ^２ _ｔｈを超えたと判定すると、パラメータが最適化されたとみなし、処理を終了する。
Ｓ２０９では、特性予測部５６は、遺伝的アルゴリズムにより、ΔＢ（Ｈ）、ΔＢ（Ｃ）、ΔＢ（Ｏ）、ΔＢ（Ｎ）、及びＢ_ｔｈの数値を更新すると、処理をＳ２０２に戻し、各ノード原子について、Ｓ２０２からＳ２０５の処理をもう一度行う。

このように、特性に係る類似度と特性に係る特性値との相関係数が、相関係数の閾値を超えるまでパラメータの更新を繰り返すことで、特性に係る類似度を算出するためのパラメータを最適化することができ、対象材料の特性値をより高精度に予測することができる。

図１９に、本件で開示する技術の一例を用いて、特性に係る類似度を求めるためのパラメータを更新する際のフローチャートの他の例を示す。また、図１９におけるＳ３０１からＳ３０８の処理は、図１８におけるＳ２０１からＳ２０８の処理と同様であるため、説明を省略する。

Ｓ３０９では、特性予測部５６は、遺伝的アルゴリズムにより、上記式（１）におけるｗ_ijの数値及び上記式（２）で表される類似度評価式Ｓの少なくともいずれかを更新すると、処理をＳ３０６に戻す。このように、本件で開示する技術の一例では、上記式（１）及び式（２）のパラメータを更新する形態であってもよい。

以下に、焼き鈍し法及びアニーリングマシンの一例について説明する。
焼き鈍し法は、乱数値や量子ビットの重ね合わせを用いて確率的に解を求める方法である。以下では最適化したい評価関数の値を最小化する問題を例に説明し、評価関数の値をエネルギーと呼ぶことにする。また、評価関数の値を最大化する場合は、評価関数の符号を変えればよい。

まず、各変数に離散値の１つを代入した初期状態からはじめ、現在の状態（変数の値の組み合わせ）から、それに近い状態（例えば、１つの変数だけ変化させた状態）を選び、その状態遷移を考える。その状態遷移に対するエネルギーの変化を計算し、その値に応じてその状態遷移を採択して状態を変化させるか、採択せずに元の状態を保つかを確率的に決める。エネルギーが下がる場合の採択確率をエネルギーが上がる場合より大きく選ぶと、平均的にはエネルギーが下がる方向に状態変化が起こり、時間の経過とともにより適切な状態へ状態遷移することが期待できる。このため、最終的には最適解又は最適値に近いエネルギーを与える近似解を得られる可能性がある。
もし、これを決定論的にエネルギーが下がる場合に採択とし、上がる場合に不採択とすれば、エネルギーの変化は時間に対して広義単調減少となるが、局所解に到達したらそれ以上変化が起こらなくなってしまう。上記のように離散最適化問題には非常に多数の局所解が存在するために、状態が、ほとんど確実にあまり最適値に近くない局所解に捕まってしまう。したがって、離散最適化問題を解く際には、その状態を採択するかどうかを確率的に決定することが重要である。

焼き鈍し法においては、状態遷移の採択（許容）確率を次のように決めれば、時刻（反復回数）無限大の極限で状態が最適解に到達することが証明されている。
以下では、焼き鈍し法を用いて最適解を求める方法について、順序を追って説明する。

（１）状態遷移に伴うエネルギー変化（エネルギー減少）値（－ΔＥ）に対して、その状態遷移の許容確率ｐを、次のいずれかの関数ｆ（）により決める。

ここで、Ｔは、温度値と呼ばれるパラメータであり、例えば、次のように変化させることができる。

（２）温度値Ｔを次式で表されるように反復回数ｔに対数的に減少させる。

ここで、Ｔ_０は、初期温度値であり問題に応じて、十分大きくとることが望ましい。
（１）の式で表される許容確率を用いた場合、十分な反復後に定常状態に達したとすると、各状態の占有確率は熱力学における熱平衡状態に対するボルツマン分布に従う。
そして、高い温度から徐々に下げていくとエネルギーの低い状態の占有確率が増加するため、十分温度が下がるとエネルギーの低い状態が得られると考えられる。この様子が、材料を焼き鈍したときの状態変化とよく似ているため、この方法は焼き鈍し法（または、疑似焼き鈍し法）と称される。なお、エネルギーが上がる状態遷移が確率的に起こることは、物理学における熱励起に相当する。

図２０に焼き鈍し法を行う最適化装置（制御部１１）の機能構成の一例を示す。ただし、下記説明では、状態遷移の候補を複数発生させる場合についても述べるが、基本的な焼き鈍し法は、遷移候補を１つずつ発生させるものである。

最適化装置１００は、現在の状態Ｓ（複数の状態変数の値）を保持する状態保持部１１１を有する。また、最適化装置１００は、複数の状態変数の値のいずれかが変化することによる現在の状態Ｓからの状態遷移が起こった場合における、各状態遷移のエネルギー変化値｛－ΔＥｉ｝を計算するエネルギー計算部１１２を有する。さらに、最適化装置１００は、温度値Ｔを制御する温度制御部１１３、状態変化を制御するための遷移制御部１１４を有する。

遷移制御部１１４は、温度値Ｔとエネルギー変化値｛－ΔＥｉ｝と乱数値とに基づいて、エネルギー変化値｛－ΔＥｉ｝と熱励起エネルギーとの相対関係によって複数の状態遷移のいずれかを受け入れるか否かを確率的に決定する。

ここで、遷移制御部１１４は、状態遷移の候補を発生する候補発生部１１４ａ、各候補に対して、そのエネルギー変化値｛－ΔＥｉ｝と温度値Ｔとから状態遷移を許可するかどうかを確率的に決定するための可否判定部１１４ｂを有する。さらに、遷移制御部１１４は、可となった候補から採用される候補を決定する遷移決定部１１４ｃ、及び確率変数を発生させるための乱数発生部１１４ｄを有する。

最適化装置１００における、一回の反復における動作は次のようなものである。
まず、候補発生部１１４ａは、状態保持部１１１に保持された現在の状態Ｓから次の状態への状態遷移の候補（候補番号｛Ｎｉ｝）を１つまたは複数発生する。次に、エネルギー計算部１１２は、現在の状態Ｓと状態遷移の候補を用いて候補に挙げられた各状態遷移に対するエネルギー変化値｛－ΔＥｉ｝を計算する。可否判定部１１４ｂは、温度制御部１１３で発生した温度値Ｔと乱数発生部１１４ｄで生成した確率変数（乱数値）を用い、各状態遷移のエネルギー変化値｛－ΔＥｉ｝に応じて、上記（１）の式の許容確率でその状態遷移を許容する。
そして、可否判定部１１４ｂは、各状態遷移の可否｛ｆｉ｝を出力する。許容された状態遷移が複数ある場合には、遷移決定部１１４ｃは、乱数値を用いてランダムにそのうちの１つを選択する。そして、遷移決定部１１４ｃは、選択した状態遷移の遷移番号Ｎと、遷移可否ｆを出力する。許容された状態遷移が存在した場合、採択された状態遷移に応じて状態保持部１１１に記憶された状態変数の値が更新される。

初期状態から始めて、温度制御部１１３で温度値を下げながら上記反復を繰り返し、一定の反復回数に達する、又はエネルギーが一定の値を下回る等の終了判定条件が満たされたときに動作が終了する。最適化装置１００が出力する答えは、終了時の状態である。

図２１は、候補を１つずつ発生させる通常の焼き鈍し法における遷移制御部、特に可否判定部のために必要な演算部分の構成例の回路レベルのブロック図である。
遷移制御部１１４は、乱数発生回路１１４ｂ１、セレクタ１１４ｂ２、ノイズテーブル１１４ｂ３、乗算器１１４ｂ４、比較器１１４ｂ５を有する。

セレクタ１１４ｂ２は、各状態遷移の候補に対して計算されたエネルギー変化値｛－ΔＥｉ｝のうち、乱数発生回路１１４ｂ１が生成した乱数値である遷移番号Ｎに対応するものを選択して出力する。

ノイズテーブル１１４ｂ３の機能については後述する。ノイズテーブル１１４ｂ３として、例えば、ＲＡＭ、フラッシュメモリ等のメモリを用いることができる。

乗算器１１４ｂ４は、ノイズテーブル１１４ｂ３が出力する値と、温度値Ｔとを乗算した積（前述した熱励起エネルギーに相当する）を出力する。
比較器１１４ｂ５は、乗算器１１４ｂ４が出力した乗算結果と、セレクタ１１４ｂ２が選択したエネルギー変化値である－ΔＥとを比較した比較結果を遷移可否ｆとして出力する。

図２１に示されている遷移制御部１１４は、基本的に前述した機能をそのまま実装するものであるが、（１）の式で表される許容確率で状態遷移を許容するメカニズムについて、更に詳細に説明する。

許容確率ｐで１を、（１－ｐ）で０を出力する回路は、２つの入力Ａ，Ｂを持ち、Ａ＞Ｂのとき１を出力し、Ａ＜Ｂのとき０を出力する比較器の入力Ａに許容確率ｐを、入力Ｂに区間［０，１）の値をとる一様乱数を入力することで実現することができる。したがって、この比較器の入力Ａに、エネルギー変化値と温度値Ｔにより（１）の式を用いて計算される許容確率ｐの値を入力すれば、上記の機能を実現することができる。

すなわち、ｆを（１）の式で用いる関数、ｕを区間［０，１）の値をとる一様乱数とするとき、ｆ（ΔＥ／Ｔ）がｕより大きいとき１を出力する回路により、上記の機能を実現できる。

また、次のような変形を行っても、上記の機能と同じ機能が実現できる。
２つの数に同じ単調増加関数を作用させても大小関係は変化しない。したがって、比較器の２つの入力に同じ単調増加関数を作用させても出力は変わらない。この単調増加関数として、ｆの逆関数ｆ^－１を採用すると、－ΔＥ／Ｔがｆ^－１（ｕ）より大きいとき１を出力する回路とすることができることがわかる。さらに、温度値Ｔが正であることから、－ΔＥがＴｆ^－１（ｕ）より大きいとき１を出力する回路でよいことがわかる。
図２１中のノイズテーブル１１４ｂ３はこの逆関数ｆ^－１（ｕ）を実現するための変換テーブルであり、区間［０，１）を離散化した入力に対して次の関数の値を出力するテーブルである。

遷移制御部１１４には、判定結果等を保持するラッチやそのタイミングを発生するステートマシン等も存在するが、図２１では図示を簡単にするため省略されている。

図２２は、遷移制御部１１４の動作フローの一例を示す図である。図２２に示す動作フローは、１つの状態遷移を候補として選ぶステップ（Ｓ０００１）、その状態遷移に対するエネルギー変化値と温度値と乱数値の積の比較で状態遷移の可否を決定するステップ（Ｓ０００２）、状態遷移が可ならばその状態遷移を採用し、否ならば不採用とするステップ（Ｓ０００３）を有する。

（材料特性予測方法）
本件で開示する材料特性予測方法は、対象材料の特性の特性値を予測する材料特性予測方法であって、対象材料と特性の特性値が第１の値である第１材料との、特性に係る類似度を求めることにより対象材料の特性値を予測する特性予測工程、を含む。

本件で開示する材料特性予測方法は、例えば、本件で開示する材料特性予測装置により行うことができる。また、本件で開示する材料特性予測方法における好適な態様は、例えば、本件で開示する材料特性予測装置における好適な態様と同様にすることができる。

（材料特性予測プログラム）
本件で開示する材料特性予測プログラムは、対象材料の特性の特性値を予測する材料特性予測プログラムであって、対象材料と特性の特性値が第１の値である第１材料との、特性に係る類似度を求めることにより対象材料の特性値を予測する特性予測処理を、コンピュータに行わせる。

本件で開示する材料特性予測プログラムは、例えば、本件で開示する材料特性予測方法コンピュータを実行させるプログラムとすることができる。また、本件で開示する材料特性予測プログラムにおける好適な態様は、例えば、本件で開示する材料特性予測装置における好適な態様と同様にすることができる。

本件で開示する材料特性予測プログラムは、使用するコンピュータシステムの構成及びオペレーティングシステムの種類・バージョンなどに応じて、公知の各種のプログラム言語を用いて作成することができる。

本件で開示する材料特性予測プログラムは、内蔵ハードディスク、外付けハードディスクなどの記録媒体に記録しておいてもよいし、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＭＯディスク、ＵＳＢメモリなどの記録媒体に記録しておいてもよい。
さらに、本件で開示する材料特性予測プログラムを、上記の記録媒体に記録する場合には、必要に応じて、コンピュータシステムが有する記録媒体読取装置を通じて、これを直接又はハードディスクにインストールして使用することができる。また、コンピュータシステムから情報通信ネットワークを通じてアクセス可能な外部記憶領域（他のコンピュータなど）に本件で開示する材料特性予測プログラムを記録しておいてもよい。この場合、外部記憶領域に記録された本件で開示する材料特性予測プログラムは、必要に応じて、外部記憶領域から情報通信ネットワークを通じてこれを直接、又はハードディスクにインストールして使用することができる。
なお、本件で開示する材料特性予測プログラムは、複数の記録媒体に、任意の処理毎に分割されて記録されていてもよい。

（コンピュータが読み取り可能な記録媒体）
本件で開示するコンピュータが読み取り可能な記録媒体は、本件で開示する材料特性予測プログラムを記録してなる。
本件で開示するコンピュータが読み取り可能な記録媒体としては、特に制限はなく、目的に応じて適宜選択することができ、例えば、内蔵ハードディスク、外付けハードディスク、ＣＤ－ＲＯＭ、ＤＶＤ－ＲＯＭ、ＭＯディスク、ＵＳＢメモリなどが挙げられる。
また、本件で開示するコンピュータが読み取り可能な記録媒体は、本件で開示する材料特性予測プログラムが任意の処理毎に分割されて記録された複数の記録媒体であってもよい。

＜計算例＞
本件で開示する材料特性予測装置の一計算例として、図１６及び１８に示したフローに従って、各元素の寄与値ΔＢ、及びの評価指数Ｂ_ｉの閾値Ｂ_ｔｈを最適化して、特性としての比誘電率に係る類似度を算出した例について説明する。

本計算例においては、図１８に示したように、初期のパラメータの値を、ΔＢ（Ｈ）＝１、ΔＢ（Ｃ）＝１、ΔＢ（Ｏ）＝１、ΔＢ（Ｎ）＝１、Ｂ_ｔｈ＝１とし、相関係数の閾値（Ｒ^２ _ｔｈ）を０．７とした。
下記の表１に示す７個の材料について、Ｎｏ．０のＮ－メチルアセトアミドを問い合わせ材料として、類似度を算出した。

ここで、表１に示す材料について、図１６及び１８に示したフローに従って、各元素の寄与値ΔＢ、及びの評価指数Ｂ_ｉの閾値Ｂ_ｔｈを最適化したところ、相関係数の閾値（Ｒ^２ _ｔｈ）が０．７を超えたときの各パラメータは、以下のようになった。
ΔＢ（Ｈ）＝１、ΔＢ（Ｃ）＝６、ΔＢ（Ｏ）＝１６、ΔＢ（Ｎ）＝２０、Ｂ_ｔｈ＝２０

上記のパラメータを用いて、上記式（１）及び式（２）により算出した、特性（非誘電率）に係る類似度Ｓ１を表２に示す。
また、比較対象として、非特許文献１に記載されている従来技術を用いて、材料の構造のみに基づいた類似度Ｓ０を求めた。結果を表２に示す。

ここで、表２に示した結果に基づいて、類似度と特性に係る特性値（非誘電率）とをプロットし、それらのプロットを線形近似した近似直線を引いたグラフの一例を図２３に示す。
図２３に示すように、本件で開示する技術の一実施形態を用いて算出した類似度Ｓ１と、非誘電率の相関係数は、０．７４７７となった。一方、従来技術を用いて求めた類似度Ｓ０と非誘電率の相関係数は、０．０１３９となった。
このことから、本件で開示する技術の一実施形態において、各元素の寄与値ΔＢ、及びの評価指数Ｂｉの閾値Ｂ_ｔｈを最適化することにより、特性に係る類似度を求めることができることがわかる。

また、図２３に示すグラフにおける類似度Ｓ１の近似直線を用いると、例えば、最適化されたパラメータ用いた計算により、新たな対象材料の類似度Ｓ１が０．５であると求まったとすると、当該対象材料の非誘電率は、７０程度となることが予測できる。
このように、本件で開示する技術の一実施形態においては、特性に係る類似度を求めることにより、対象材料の特性値を、当該特性に応じて高精度に予測できる。

図２４に、比誘電率が近くない材料間の類似度が、従来技術においては高く算出され、本実施形態では低く算出される例における、分子構造及びグラフ化した分子構造の一例を示す。図２４において、丸（実線又は点線）で囲まれているノード原子は、評価指数Ｂ_ｉが閾値Ｂ_ｔｈを超えるノード原子であり、実線の丸で囲まれているノード原子は、最終的に最大独立集合として探索されたノードに含まれるノード原子である。
従来技術では、上記式（２）におけるパラメータは、Ｖ_ｃ ^Ａ＝１１、Ｖ_Ａ＝１２、Ｖ_ｃ ^Ｂ＝１１、Ｖ_Ｂ＝１５であり、本実施形態では、Ｖ_ｃ ^Ａ＝２、Ｖ_Ａ＝４、Ｖ_ｃ ^Ｂ＝２、Ｖ_Ｂ＝３である。したがって、式（２）におけるδを０．５とすると、従来技術では、Ｓ０＝０．５×（１１／１２＋１１／１５）＝０．８２５となるが、本実施形態では、Ｓ１＝０．５×（３／５＋３／５）＝０．６となる。
このように、本実施形態では、比誘電率が近くない材料間の類似度は、従来技術に比べて低く算出され、特性に係る類似度が算出されていることがわかる。

図２５に、比誘電率が近い材料間の類似度が、従来技術においては低く算出され、本実施形態では高く算出される例における、分子構造及びグラフ化した分子構造の一例を示す。
従来技術では、上記式（２）におけるパラメータは、Ｖ_ｃ ^Ａ＝８、Ｖ_Ａ＝１２、Ｖ_ｃ ^Ｂ＝８、Ｖ_Ｂ＝９であり、本実施形態では、Ｖ_ｃ ^Ａ＝４、Ｖ_Ａ＝５、Ｖ_ｃ ^Ｂ＝４、Ｖ_Ｂ＝５である。したがって、式（２）におけるδを０．５とすると、従来技術では、Ｓ０＝０．５×（８／１２＋８／９）＝０．７７７７となるが、本実施形態では、Ｓ１＝０．５×（４／５＋４／５）＝０．８となる。
このように、本実施形態では、比誘電率が近い材料間の類似度は、従来技術に比べて高く算出され、特性に係る類似度が算出されていることがわかる。

図２６は、本件で開示する技術の一実施形態及び従来技術における、類似度と特性値の関係の一例を示す図である。
図２６に示すように、Ｎ－メチルアセトアミドを問い合わせ材料とした場合における、従来技術としての構造のみから算出された類似度は、比誘電率が１８２．４であるＮ－メチルホルムアミドについては、０．７７７７となる。同様に、Ｎ－メチルアセトアミドを問い合わせ材料とした場合における、従来技術としての構造のみから算出された類似度は、比誘電率が３７．７８であるＮ，Ｎ－ジメチルアセトアミドについては、０．８２５となる。
一方、Ｎ－メチルアセトアミドを問い合わせ材料とした場合における、本件で開示する技術の一例における特性に係る類似度は、Ｎ－メチルホルムアミドについては、０．８となる。同様に、Ｎ－メチルアセトアミドを問い合わせ材料とした場合における、本件で開示する技術の一例における特性に係る類似度は、Ｎ，Ｎ－ジメチルアセトアミドについては、０．６となる。

つまり、図２６に示すように、従来技術としての構造のみから算出された類似度の大きさは、比誘電率の大きさと対応しておらず、この類似度を用いて比誘電率を予測することは難しいと考えられる。一方、本件で開示する技術の一例における特性に係る類似度の大きさは、比誘電率の大きさと対応しており、対象材料の特性の特性値を精度よく予測することが可能である。

以上の実施形態に関し、更に以下の付記を開示する。
（付記１）
対象材料の特性の特性値を予測する材料特性予測装置であって、
前記対象材料と前記特性の前記特性値が第１の値である第１材料との、前記特性に係る類似度を求めることにより前記対象材料の前記特性値を予測する特性予測部を備えることを特徴とする材料特性予測装置。
（付記２）
前記特性予測部が、下記式（１）を用いて、前記対象材料及び前記第１材料の分子構造に基づく最大独立集合の探索をすることにより前記特性に係る前記類似度を求める、付記１に記載の材料特性予測装置。

ただし、前記式（１）において、
前記Ｈは、当該Ｈを最小化することが前記最大独立集合の探索をすることを意味するハミルトニアンであり、
前記ｎは、グラフ化した前記対象材料及び前記第１材料のコンフリクトグラフにおけるノードの数として理解されるものであり、
前記コンフリクトグラフは、グラフ化した前記対象材料を構成する各ノード原子と、グラフ化した前記第１材料を構成する各ノード原子との組合せを前記ノードとし、複数ある前記ノードどうしを比較して互いに同一でない前記ノード間にはエッジを作成し、複数ある前記ノードどうしを比較して互いに同一である前記ノード間にはエッジを作成しないというルールに基づき作成されるグラフとして理解されるものであり、
前記ｂ_iは、ｉ番目の前記ノードに対するバイアスを表す数値であり、
前記ｗ_ijは、
前記ｉ番目の前記ノードと前記ｊ番目の前記ノードとの間にエッジが存在するときは、０ではない正の数であり、
前記ｉ番目の前記ノードと前記ｊ番目の前記ノードとの間にエッジが存在しないときは、０であり、
前記ｘ_iは、ｉ番目の前記ノードが０又は１であることを表すバイナリ変数であり、
前記ｘ_jは、ｊ番目の前記ノードが０又は１であることを表すバイナリ変数であり、
前記α及び前記βは、正の数である。
（付記３）
前記特性予測部が、下記式（２）を用いて、探索された最大独立集合について前記特性に係る前記類似度を求める、付記２に記載の材料特性予測装置。

ただし、前記式（２）において、
前記Ｇ_Ａは、グラフ化した前記対象材料を表し、
前記Ｇ_Ｂは、グラフ化した前記第１材料を表し、
前記Ｓ（Ｇ_Ａ，Ｇ_Ｂ）は、グラフ化した前記対象材料とグラフ化した前記第１材料との類似度を表し、０～１で表され、１に近づく程、類似度が高いことを意味し、
前記Ｖ_Ａは、グラフ化した前記対象材料における前記ノード原子の総数を表し、
前記Ｖ_ｃ ^Ａは、グラフ化した前記対象材料における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記Ｖ_Ｂは、グラフ化した前記第１材料における前記ノード原子の総数を表し、
前記Ｖ_ｃ ^Ｂは、グラフ化した前記第１材料における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記δは、０～１の数である。
（付記４）
前記特性予測部が、前記式（１）を用いて前記特性に係る前記類似度を求める際に、
前記ノード原子に対しＷｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続によるＷＬラベルを付す、付記３に記載の材料特性予測装置。
（付記５）
前記ＷＬラベルが、前記ノード原子に付され、前記ノード原子における一のノード原子において、当該一のノード原子の情報と、当該一のノード原子が結合する結合ノード原子の情報とに由来する、付記４に記載の材料特性予測装置。
（付記６）
前記特性予測部が、前記式（１）を用いて前記特性に係る前記類似度を求める際に、
前記ノード原子を、前記ＷＬラベルの情報に基づき前記特性の発現に対する評価指数Ｂ_ｉに応じて選択する、付記４から５のいずれかに記載の材料特性予測装置。
（付記７）
前記評価指数Ｂ_ｉが、前記対象材料及び前記第１材料における前記ノード原子の種類（元素）毎に算出した、前記特性の発現に対する寄与値ΔＢの合計を意味する、付記６に記載の材料特性予測装置。
（付記８）
前記特性予測部が、前記式（１）を用いて前記特性に係る前記類似度を求める際に、
前記式（１）における前記ｂ_iを、
ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉの大きさに対応した数値とする、付記６から７のいずれかに記載の材料特性予測装置。
（付記９）
前記特性予測部が、前記式（１）を用いて前記特性に係る前記類似度を求める際に、
前記式（１）における前記ｂ_iを、
ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉが閾値を超えたときに、正の数とし、
ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉが閾値以下のときに、負の数とする、付記６から８のいずれかに記載の材料特性予測装置。
（付記１０）
前記特性予測部が、焼き鈍し法により前記式（１）におけるハミルトニアン（Ｈ）の最小化をすることにより前記最大独立集合の探索をする、付記２から９のいずれかに記載の材料特性予測装置。
（付記１１）
前記特性予測部が、求めた前記特性に係る前記類似度と前記特性に係る前記特性値との相関係数が大きくなるように、
＜Ａ＞前記式（１）において、ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉの値の算定基準となる、前記ノード原子の種類（元素）毎の寄与値ΔＢの数値、
＜Ｂ＞前記式（１）において、ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉの閾値、
＜Ｃ＞前記式（１）における前記ｂ_iの数値、
＜Ｄ＞前記式（１）における前記ｗ_ijの数値、及び、
＜Ｅ＞前記式（２）で表される類似度評価式Ｓ、
の少なくともいずれかの更新をする、付記６から１０のいずれかに記載の材料特性予測装置。
（付記１２）
前記更新が、遺伝的アルゴリズムにより行われる、付記１１に記載の材料特性予測装置。
（付記１３）
前記特性予測部が、求めた前記特性に係る前記類似度と前記特性に係る前記特性値との相関係数が閾値を超えたときに、前記対象材料の前記特性に係る前記類似度を出力する、付記１から１２のいずれかに記載の材料特性予測装置。
（付記１４）
前記特性予測部が、求めた前記特性に係る前記類似度と前記特性に係る前記特性値との相関係数が閾値を超えたときに、前記対象材料における前記特性値を予測する、付記１から１３のいずれかに記載の材料特性予測装置。
（付記１５）
多数の前記第１材料の化学構造データ群を有する、付記１から１４のいずれかに記載の材料特性予測装置。
（付記１６）
多数の前記対象材料の化学構造データ群を有する、付記１から１５のいずれかに記載の材料特性予測装置。
（付記１７）
対象材料の特性の特性値を予測する材料特性予測方法であって、
前記対象材料と前記特性の前記特性値が第１の値である第１材料との、前記特性に係る類似度を求めることにより前記対象材料の前記特性値を予測する特性予測工程を含むことを特徴とする材料特性予測方法。
（付記１８）
対象材料の特性の特性値を予測する材料特性予測プログラムであって、
前記対象材料と前記特性の前記特性値が第１の値である第１材料との、前記特性に係る類似度を求めることにより前記対象材料の前記特性値を予測する特性予測処理を、コンピュータに行わせることを特徴とする材料特性予測プログラム。

１０材料特性予測装置
１１制御部
１２メモリ
１３記憶部
１４表示部
１５入力部
１６出力部
１７Ｉ／Ｏインターフェース部
１８システムバス
１９ネットワークインターフェース部
２０ネットワークインターフェース部
３０コンピュータ
４０コンピュータ
５１対象材料構造取得部
５２第１材料構造取得部
５３類似度計算部
５４特性予測精度評価部
５５パラメータ更新部５５
５６特性予測部
５１０、６１０化学構造データ
５２０、６２０化学構造データ群

Claims

対象材料の特性の特性値を予測する材料特性予測装置であって、
前記対象材料と前記特性の前記特性値が第１の値である第１材料との、前記特性に係る類似度を求めることにより前記対象材料の前記特性値を予測する特性予測部を備え、
前記特性予測部が、下記式（１）を用いて、前記対象材料及び前記第１材料の分子構造に基づく最大独立集合の探索をすることにより前記特性に係る前記類似度を求め、
前記特性予測部が、求めた前記特性に係る前記類似度と前記特性に係る前記特性値との相関を示す相関係数が閾値を超えたときに、前記対象材料の前記特性に係る前記類似度を出力し、
前記特性予測部が、前記第１の値と前記類似度と前記相関とに基づいて、前記対象材料の前記特性値を予測することを特徴とする材料特性予測装置。

ただし、前記式（１）において、
前記Ｈは、当該Ｈを最小化することが前記最大独立集合の探索をすることを意味するハミルトニアンであり、
前記ｎは、グラフ化した前記対象材料及び前記第１材料のコンフリクトグラフにおけるノードの数として理解されるものであり、
前記コンフリクトグラフは、グラフ化した前記対象材料を構成する各ノード原子と、グラフ化した前記第１材料を構成する各ノード原子との組合せを前記ノードとし、複数ある前記ノードどうしを比較して互いに同一でない前記ノード間にはエッジを作成し、複数ある前記ノードどうしを比較して互いに同一である前記ノード間にはエッジを作成しないというルールに基づき作成されるグラフとして理解されるものであり、
前記ｂ _i は、ｉ番目の前記ノードに対するバイアスを表す数値であり、
前記ｗ _ij は、
前記ｉ番目の前記ノードと前記ｊ番目の前記ノードとの間にエッジが存在するときは、０ではない正の数であり、
前記ｉ番目の前記ノードと前記ｊ番目の前記ノードとの間にエッジが存在しないときは、０であり、
前記ｘ _i は、ｉ番目の前記ノードが０又は１であることを表すバイナリ変数であり、
前記ｘ _j は、ｊ番目の前記ノードが０又は１であることを表すバイナリ変数であり、
前記α及び前記βは、正の数である。
前記特性予測部が、下記式（２）を用いて、探索された最大独立集合について前記特性に係る前記類似度を求める、請求項１に記載の材料特性予測装置。

ただし、前記式（２）において、
前記Ｇ_Ａは、グラフ化した前記対象材料を表し、
前記Ｇ_Ｂは、グラフ化した前記第１材料を表し、
前記Ｓ（Ｇ_Ａ，Ｇ_Ｂ）は、グラフ化した前記対象材料とグラフ化した前記第１材料との類似度を表し、０～１で表され、１に近づく程、類似度が高いことを意味し、
前記Ｖ_Ａは、グラフ化した前記対象材料における前記ノード原子の総数を表し、
前記Ｖ_ｃ ^Ａは、グラフ化した前記対象材料における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記Ｖ_Ｂは、グラフ化した前記第１材料における前記ノード原子の総数を表し、
前記Ｖ_ｃ ^Ｂは、グラフ化した前記第１材料における前記ノード原子の内、前記コンフリクトグラフの最大独立集合に含まれる前記ノード原子の数を表し、
前記δは、０～１の数である。
前記特性予測部が、前記式（１）を用いて前記特性に係る前記類似度を求める際に、
前記ノード原子に対しＷｅｉｓｆｅｉｌｅｒ－Ｌｅｈｍａｎ手続によるＷＬラベルを付す、請求項２に記載の材料特性予測装置。
前記ＷＬラベルが、前記ノード原子に付され、前記ノード原子における一のノード原子において、当該一のノード原子の情報と、当該一のノード原子が結合する結合ノード原子の情報とに由来する、請求項３に記載の材料特性予測装置。
前記特性予測部が、前記式（１）を用いて前記特性に係る前記類似度を求める際に、
前記ノード原子を、前記ＷＬラベルの情報に基づき前記特性の発現に対する評価指数Ｂ_ｉに応じて選択する、請求項３から４のいずれかに記載の材料特性予測装置。
前記評価指数Ｂ_ｉが、前記対象材料及び前記第１材料における前記ノード原子の種類（元素）毎に算出した、前記特性の発現に対する寄与値ΔＢの合計を意味する、請求項５に記載の材料特性予測装置。
前記特性予測部が、前記式（１）を用いて前記特性に係る前記類似度を求める際に、
前記式（１）における前記ｂ_iを、
ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉの大きさに対応した数値とする、請求項５から６のいずれかに記載の材料特性予測装置。
前記特性予測部が、前記式（１）を用いて前記特性に係る前記類似度を求める際に、
前記式（１）における前記ｂ_iを、
ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉが閾値を超えたときに、正の数とし、
ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉが閾値以下のときに、負の数とする、請求項５から７のいずれかに記載の材料特性予測装置。
前記特性予測部が、焼き鈍し法により前記式（１）におけるハミルトニアン（Ｈ）の最小化をすることにより前記最大独立集合の探索をする、請求項５から８のいずれかに記載の材料特性予測装置。
前記特性予測部が、求めた前記特性に係る前記類似度と前記特性に係る前記特性値との相関係数が大きくなるように、
＜Ａ＞前記式（１）において、ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉの値の算定基準となる、前記ノード原子の種類（元素）毎の寄与値ΔＢの数値、
＜Ｂ＞前記式（１）において、ｉ番目の前記ノードを構成する前記ノード原子に付された前記ＷＬラベルの情報に含まれる前記評価指数Ｂ_ｉの閾値、
＜Ｃ＞前記式（１）における前記ｂ_iの数値、
＜Ｄ＞前記式（１）における前記ｗ_ijの数値、及び、
＜Ｅ＞前記式（２）で表される類似度評価式Ｓ、
の少なくともいずれかの更新をする、請求項５から９のいずれかに記載の材料特性予測装置。
前記更新が、遺伝的アルゴリズムにより行われる、請求項１０に記載の材料特性予測装置。
前記特性予測部が、求めた前記特性に係る前記類似度と前記特性に係る前記特性値との相関係数が閾値を超えたときに、前記対象材料における前記特性値を予測する、請求項１から１１のいずれかに記載の材料特性予測装置。
前記特性に係る前記類似度と前記特性に係る前記特性値との相関係数における前記閾値が、０．７である請求項１から１２のいずれかに記載の材料特性予測装置。
多数の前記第１材料の化学構造データ群を有する、請求項１から１３のいずれかに記載の材料特性予測装置。
多数の前記対象材料の化学構造データ群を有する、請求項１から１４のいずれかに記載の材料特性予測装置。
対象材料の特性の特性値を予測する材料特性予測方法であって、
前記対象材料と前記特性の前記特性値が第１の値である第１材料との、前記特性に係る類似度を求めることにより前記対象材料の前記特性値を予測する特性予測工程を含み、
前記特性予測工程が、下記式（１）を用いて、前記対象材料及び前記第１材料の分子構造に基づく最大独立集合の探索をすることにより前記特性に係る前記類似度を求め、
前記特性予測工程が、求めた前記特性に係る前記類似度と前記特性に係る前記特性値との相関を示す相関係数が閾値を超えたときに、前記対象材料の前記特性に係る前記類似度を出力し、
前記特性予測工程が、前記第１の値と前記類似度と前記相関とに基づいて、前記対象材料の前記特性値を予測することを特徴とする材料特性予測方法。

ただし、前記式（１）において、
前記Ｈは、当該Ｈを最小化することが前記最大独立集合の探索をすることを意味するハミルトニアンであり、
前記ｎは、グラフ化した前記対象材料及び前記第１材料のコンフリクトグラフにおけるノードの数として理解されるものであり、
前記コンフリクトグラフは、グラフ化した前記対象材料を構成する各ノード原子と、グラフ化した前記第１材料を構成する各ノード原子との組合せを前記ノードとし、複数ある前記ノードどうしを比較して互いに同一でない前記ノード間にはエッジを作成し、複数ある前記ノードどうしを比較して互いに同一である前記ノード間にはエッジを作成しないというルールに基づき作成されるグラフとして理解されるものであり、
前記ｂ _i は、ｉ番目の前記ノードに対するバイアスを表す数値であり、
前記ｗ _ij は、
前記ｉ番目の前記ノードと前記ｊ番目の前記ノードとの間にエッジが存在するときは、０ではない正の数であり、
前記ｉ番目の前記ノードと前記ｊ番目の前記ノードとの間にエッジが存在しないときは、０であり、
前記ｘ _i は、ｉ番目の前記ノードが０又は１であることを表すバイナリ変数であり、
前記ｘ _j は、ｊ番目の前記ノードが０又は１であることを表すバイナリ変数であり、
前記α及び前記βは、正の数である。
対象材料の特性の特性値を予測する材料特性予測プログラムであって、
前記対象材料と前記特性の前記特性値が第１の値である第１材料との、前記特性に係る類似度を求めることにより前記対象材料の前記特性値を予測する特性予測処理を、コンピュータに行わせ、
前記特性予測処理が、下記式（１）を用いて、前記対象材料及び前記第１材料の分子構造に基づく最大独立集合の探索をすることにより前記特性に係る前記類似度を求め、
前記特性予測処理が、求めた前記特性に係る前記類似度と前記特性に係る前記特性値との相関を示す相関係数が閾値を超えたときに、前記対象材料の前記特性に係る前記類似度を出力し、
前記特性予測処理が、前記第１の値と前記類似度と前記相関とに基づいて、前記対象材料の前記特性値を予測することを特徴とする材料特性予測プログラム。

ただし、前記式（１）において、
前記Ｈは、当該Ｈを最小化することが前記最大独立集合の探索をすることを意味するハミルトニアンであり、
前記ｎは、グラフ化した前記対象材料及び前記第１材料のコンフリクトグラフにおけるノードの数として理解されるものであり、
前記コンフリクトグラフは、グラフ化した前記対象材料を構成する各ノード原子と、グラフ化した前記第１材料を構成する各ノード原子との組合せを前記ノードとし、複数ある前記ノードどうしを比較して互いに同一でない前記ノード間にはエッジを作成し、複数ある前記ノードどうしを比較して互いに同一である前記ノード間にはエッジを作成しないというルールに基づき作成されるグラフとして理解されるものであり、
前記ｂ _i は、ｉ番目の前記ノードに対するバイアスを表す数値であり、
前記ｗ _ij は、
前記ｉ番目の前記ノードと前記ｊ番目の前記ノードとの間にエッジが存在するときは、０ではない正の数であり、
前記ｉ番目の前記ノードと前記ｊ番目の前記ノードとの間にエッジが存在しないときは、０であり、
前記ｘ _i は、ｉ番目の前記ノードが０又は１であることを表すバイナリ変数であり、
前記ｘ _j は、ｊ番目の前記ノードが０又は１であることを表すバイナリ変数であり、
前記α及び前記βは、正の数である。