JP7297348B2

JP7297348B2 - スペクトル汎化システム及び方法、並びに物質同定システム及び方法

Info

Publication number: JP7297348B2
Application number: JP2022504357A
Authority: JP
Inventors: 真史石井
Original assignee: National Institute for Materials Science
Current assignee: National Institute for Materials Science
Priority date: 2020-03-05
Filing date: 2021-03-01
Publication date: 2023-06-26
Anticipated expiration: 2041-03-01
Also published as: JPWO2021177240A1; WO2021177240A1

Description

本発明は、探査用ビームに対する吸収、散乱、反射、回折などのスペクトルから特徴量を抽出する装置及び方法に用いて好適な、スペクトル汎化システム及び方法、並びに物質同定システム及び方法に関する。

計測・分析分野において、中性子、Ｘ線、紫外線、可視光線、赤外線、マイクロ波、超音波など様々な探査用ビームに対する吸収、散乱、反射、回折の強弱を図示するスペクトルから、測定対象の物質を同定し、あるいは特性を決定することが、物理、化学、医学、天文・地学、材料科学、電子工学など幅広い分野で様々な対象に対して行われている。計測スペクトルは、通常それ単体で議論をするよりも、過去の計測で得られ、ライブラリ化・データベース化されている他の標準スペクトルとの比較から議論されることが多い。

しかしながら、スペクトル測定は、計測において不可避な外的攪乱要素を伴う。例えば、バックグラウンドノイズによるスペクトルのうねり、検出器の測定性能に依存するスペクトルの広がりは、どのような測定法であっても、少なからず存在する。したがって、測定により得られたスペクトルと標準スペクトルは完全に一致することはなく、機械的に一致・不一致の判定をすることは困難である。多くの場合、専門家がスペクトルの位置、強度比、広がりなどの様々な要因を総合的に比較し、経験と勘で一致・不一致の判断を下す。この状況を翻って考えると、外的攪乱要素によらないスペクトルの本質的な量（特徴量という）は、経験と勘を使えば見出せるものであり、機械可読化は容易ではないもののスペクトルに内在するといえる。

一般に試料が特徴的であればあるほど先行事例は少なく、従って外的攪乱要素によらないスペクトルの特徴量抽出（フィンガープリント化）が、測定結果とライブラリ・データベースを対等に比較する上で重要となる。またその照合は、実用に耐える速さで行う必要があり、プレスクリーニングなど特徴量抽出処理に工夫を要する。
このような特徴量抽出として、例えば特許文献１～３に開示された深層学習用ニューラルネットワークが用いられる。

特開２０１９－０８７２２１号公報特開２０１９－０２０５９８号公報特表２０１９－５２６８５１号公報

しかしながら、各種計測により得られるスペクトルデータは、同種の材料であっても、試料の作成条件や測定条件の揺らぎによってバックグラウンドなどの擾乱要素が含まれるためスペクトルデータの分布形状が異なる。この外的攪乱要素に阻まれ、スペクトルから機械的に物質を同定することは著しく困難であった。

本発明は上述する課題を解決するもので、様々な外的攪乱要素を持つ計測スペクトルから、その試料の素性を表すスペクトルの本質量（特徴量）を抽出するフィンガープリント化処理の開発と、その成分同定への適用法を提供することを目的とする。

本発明者は、人工知能にスペクトルの局所形状（尖度）を学習させ、その学習済み人工知能を使うことで、攪乱要素に依存しないスペクトルの特徴量（本質量）を抽出するスペクトル汎化システム及び方法、並びに物質同定システム及び方法が得られると考えて、本発明を想到するに至った。

人工知能は学習した内容については統計的に確からしい答えを返す。例えばある材料のスペクトルを与えてその材料を当てるという課題は、事前にその材料とスペクトルを学習していれば実現可能である。本発明は、学習していないスペクトルに対しても正解の材料を与える、人工知能を使った新たな方法である。本発明は、画像化したスペクトルから特徴量を抽出し、当該特徴量を使って既知のスペクトル群からもっと確からしいものを推論する構成であるが、通常の類似度解析と異なり、人工知能がピーク形状の一般的特徴を学習することで、独自の「ピーク判断基準」を作り、それをもとに、あらゆる材料のスペクトルを規格化し、プロセスや計測条件にロバストな判断ができるようになる。

［１］本発明のスペクトル汎化システムは、例えば図１に示すように、デジタル画像化された典型的スペクトル１２を小フレームで走査し、典型的スペクトル１２の画像からピーク周辺の小フレームを切り出す局所ピーク切り出し装置２０と、局所ピーク切り出し装置２０で切り出された小フレームを保存する局所ピークストレージ３０と、局所ピーク切り出し装置２０で切り出された小フレーム内のピークに対応する、ピークを意味する正解のアイコンを与えるｎ×１アイコン生成装置４０と、ｎ×１アイコン生成装置４０で与えられた前記正解のアイコンを格納する正解データストレージ５０と、局所ピークストレージ３０に保存された小フレームに対して、正解データストレージ５０に保存された前記正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化される局所ピーク学習用ニューラルネットワーク６０と、正解データストレージ５０に格納された正解のアイコンと局所ピーク学習用ニューラルネットワーク６０の出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を局所ピーク学習用ニューラルネットワーク６０に出力する学習用比較機７０と、を備える。

［２］本発明のスペクトル汎化システムにおいて、好ましくは、ｎ×１アイコン生成装置４０は、ピーク形状類型の判別パターンに応じた類型別のｎ×１アイコンを与えるとよい。
［３］本発明のスペクトル汎化システムにおいて、好ましくは、ピーク形状類型の判別パターンは、前記ピークに含まれる尖度、歪度、及び尖度と歪度の少なくとも一種類のパラメータに応じた類型別のｎ×１アイコンであるとよい。類型別のｎ×１アイコンは、前記ピークのパラメータを人工知能の一種であるスペクトル汎化システムで用いるパラメータに変換したものである。
［４］本発明のスペクトル汎化システムにおいて、好ましくは、ｎ×１アイコン生成装置４０は、前記正解のアイコンの位置をデジタル画像化された典型的スペクトル１２のピーク位置座標に合わせて画像表示させる情報を含むとよい。
［５］本発明のスペクトル汎化システムにおいて、好ましくは、局所ピーク切り出し装置２０は、デジタル画像化された典型的スペクトル１２を１画素ごと走査し、ピーク周辺の小フレームを切り出す構成とするとよい。学習の場合は、小フレームの中および外周を含む様々な場所に満遍なくなくピークがある画像を使うのが、ピークと傾斜の違いを教える学習法として好ましいからである。
［６］本発明のスペクトル汎化システムにおいて、好ましくは、局所ピーク切り出し装置２０が切り出す小フレームは、例えば典型的スペクトル１２のピーク形状を的確に表現できる解像度が得られる画素数を有するとよい。
［７］本発明のスペクトル汎化システムにおいて、好ましくは、さらに、典型的スペクトル１２をデジタル画像化する数値マトリクス－画像変換装置１０を有するとよい。
［８］本発明のスペクトル汎化システムにおいて、好ましくは、数値マトリクス－画像変換装置１０は、典型的スペクトル１２をデジタル画像化するにあたり、ピークを有するスペクトルに対応する数値マトリクスを、二次元デジタル画像に変換するとよい。
［９］本発明のスペクトル汎化システムにおいて、好ましくは、前記二次元デジタル画像は、典型的スペクトル１２のピーク形状を的確に表現できる解像度が得られる画素数を有するとよい。

［１０］本発明のスペクトル汎化方法は、例えば図２に示すように、デジタル画像化された典型的スペクトル１２を１画素ごとに、又は典型的スペクトル１２の曲線に沿って小フレームで走査し、典型的スペクトル１２の画像からピーク周辺の小フレームを切り出し（Ｓ１１０）、切り出された小フレームを局所ピークストレージに保存し（Ｓ１２０）、切り出された小フレーム内のピークに対して、ピークを意味する正解のアイコンを与え（Ｓ１３０）、与えられた前記正解のアイコンを正解データストレージ５０に格納し（Ｓ１４０）、正解データストレージ５０に格納された前記正解のアイコンと局所ピーク学習用ニューラルネットワーク６０の出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を局所ピーク学習用ニューラルネットワーク６０に出力し（Ｓ１５０）、前記調整量によって、局所ピークストレージ３０に保存された小フレームに対して、正解データストレージ５０に保存された前記正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化される（Ｓ１６０）、工程をコンピュータに実行させるものである。

［１１］本発明の物質同定システムは、例えば図６に示すように、標準スペクトルデータベース１１０に格納されている標準スペクトルの画像を対象として、小フレームの中心をトレースさせる第１のスペクトルトレーサ１３０と、［１］～［９］の何れかのスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワーク１４０であって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する第１の局所ピーク学習済みニューラルネットワーク１４０と、第１の局所ピーク学習済みニューラルネットワーク１４０によって出力されたデータを結合して第１のフィンガープリントを作成する第１のハッシュ結合装置１５０と、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントが格納される標準フィンガープリントストレージ１６０と、
標準スペクトルデータベース１１０に格納されている標準スペクトルの各々に対して作成された前記第１のフィンガープリントについて、類型化して、各類型化された個別の第１のフィンガープリントを識別して、個別の第１のフィンガープリント毎に標準フィンガープリントストレージ１６０に格納する標準フィンガープリント格納管理部１７０と、
小フレームの中心を今回の同定対象となる計測スペクトル２１０の画像についてトレースさせる第２のスペクトルトレーサ２３０と、［１］～［９］の何れかのスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワーク２４０であって、計測スペクトル２１０の逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する第２の局所ピーク学習済みニューラルネットワーク２４０と、第２の局所ピーク学習済みニューラルネットワーク２４０によって出力されたデータを結合して第２のフィンガープリントを作成する第２のハッシュ結合装置２５０と、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントと、第２のハッシュ結合装置２５０で作成された第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する比較機２６０とを備えることを特徴とする。

［１２］本発明の物質同定システムにおいて、好ましくは、比較機２６０の比較アルゴリズムは、分類を行う機械学習を含むアルゴリズムであるとよい。分類を行う機械学習を含むアルゴリズムとしては、位置の一致、コサイン類似度、サポートベクターマシーン、ランダムフォレスト等、各種のものがある。
［１３］本発明の物質同定システムにおいて、好ましくは、さらに、標準スペクトルデータベース１１０に格納されている標準スペクトルを画像化する第１の数値マトリクス―画像変換装置１２０を有するとよい。
［１４］本発明の物質同定システムにおいて、好ましくは、さらに、前記今回の同定対象となる計測スペクトル２１０は、計測スペクトル２１０を画像化する第２の数値マトリクス―画像変換装置２２０により与えられるとよい。
［１５］本発明の物質同定システムにおいて、例えば図１１に示すように、好ましくは、さらに、計測スペクトル２１０が得られた場合は、非負線形回帰処理を用いて、標準フィンガープリントストレージ１６０に格納された複数の第１のフィンガープリントの中から候補となる成分を絞り込む非負線形回帰装置１８０を備え、比較機２６０は、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントに代えて、非負線形回帰装置１８０で選定された候補に対応するフィンガープリントを標準フィンガープリントストレージ１６０から呼び出して、第２のハッシュ結合装置２５０で作成された第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する構成とするとよい。

［１６］本発明の物質同定方法は、例えば図７に示すように、標準スペクトルデータベース１１０に格納されている標準スペクトルの画像を対象として、小フレームの中心のトレースを行い（Ｓ２１０）、［１０］のスペクトル汎化方法を用いて学習した第１の局所ピーク学習済みニューラルネットワーク１４０によって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力し（Ｓ２２０）、第１のハッシュ結合装置１５０により、第１の局所ピーク学習済みニューラルネットワーク１４０によって出力されたデータを結合して、第１のフィンガープリントを作成し（Ｓ２３０）、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントを標準フィンガープリントストレージ１６０に格納し（Ｓ２４０）、標準フィンガープリント格納管理部１７０により、標準スペクトルデータベース１１０に格納されている標準スペクトルの各々に対して作成された第１のフィンガープリントについて類型化し（Ｓ２５０）、各類型化された個別の第１のフィンガープリントを識別して、個別の第１のフィンガープリント毎に標準フィンガープリントストレージ１６０に格納する（Ｓ２６０）。
さらに、本発明の物質同定方法は、例えば図８に示すように、今回の同定対象となる計測スペクトルの画像について、小フレームの中心のトレースを行い（Ｓ３１０）、［１０］のスペクトル汎化方法を用いて学習した第２の局所ピーク学習済みニューラルネットワーク２４０によって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力し（Ｓ３２０）、第２のハッシュ結合装置２５０により、第２の局所ピーク学習済みニューラルネットワーク２４０によって出力されたデータを結合して、第２のフィンガープリントを作成し（Ｓ３３０）、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントと、第２のハッシュ結合装置２５０で作成された第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する（Ｓ３４０）、工程をコンピュータに実行させることを特徴とする。
［１７］本発明の物質同定方法は、例えば図１２に示すように、［１６］の物質同定方法において、さらに、計測スペクトル２１０が得られた場合は、非負線形回帰処理を用いて、標準フィンガープリントストレージ１６０に格納された複数の第１のフィンガープリントの中から候補となる成分を絞り込み（Ｓ３６０）、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントに代えて、前記非負線形回帰処理で選定された候補に対応するフィンガープリントと、第２のハッシュ結合装置２５０で作成された前記第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する（Ｓ３７０）ことを特徴とする。

本発明のスペクトル汎化システム及び方法、並びに物質同定システム及び方法によれば、測定者、測定装置、測定条件、試料の調製法など外的攪乱要素によらず、スペクトルに内在する特徴量を抽出することにより、試料の成分同定に必要な標準スペクトルとの一致・不一致の判定がコンピュータによってできるようになる。従来熟練者の経験と勘に頼っていた成分同定が機械化され、未修練者から熟練者まで、分析の人依存性がなくなり客観解析が可能になる。

本発明の一実施例を示すスペクトル汎化システムの構成ブロック図である。本発明の一実施例を示すスペクトル汎化方法のフローチャートである。本発明の一実施例を示すスペクトル数値列データの二次元デジタル画像変換による、形状情報を含んだ入力信号形成処理の説明図で、（Ａ）は数値列データを通常のプロット、（Ｂ）は変換後の二次元デジタル画像を示している。本発明の一実施例を示す、小フレームを用いることによる外的攪乱要素の最小化処理の説明図である。尖部の有限ビット表示による機械が理解可能な尖度の概念的説明図で、（Ａ）はある小フレームで切り出したスペクトル、（Ｂ）は有限ビット長による尖度の機械可読な概念化の説明図である。本発明の一実施例を示す物質同定システムの構成ブロック図である。本発明の一実施例を示す物質同定方法のフローチャートである。本発明の一実施例を示す物質同定方法のフローチャートで、図７の続きである。（Ａ）は本発明の一実施例を示す小フレームで切り出したスペクトル、（Ｂ）はその尖部の予測結果（ビット表示）人工知能が学習データから構築した尖度概念に基づく予測である。図６に示す本発明の他の一実施例を、スペクトル測定と標準スペクトルを用いた信号処理の観点から説明した構成ブロック図である。本発明の他の実施例を示す物質同定システムの構成ブロック図である。図１１に示す物質同定方法のフローチャートで、図７の続きである。図１１に示す本発明の他の一実施例を、スペクトル測定と標準スペクトルを用いた信号処理の観点から説明した構成ブロック図で、セレクタによるプレスクリーニングとの組み合わせを示している。図１１に示す本発明の他の一実施例を、スペクトル測定と標準スペクトルを用いた信号処理の観点から説明した構成ブロック図で、非負線形回帰（ＮＮＬＳ）によるプレスクリーニングとの組み合わせを示している。本発明の他の実施例を示すもので、スペクトルの形状をトレースすることにより予測を効率的に行う処理過程の説明図である。本発明で用いられる非負線形回帰演算（ＮＮＬＳ）でライブラリデータを使ってＸ線回折の結果を回帰した例である

以下、図面を用いて本発明を説明する。
図１は本発明の一実施例を示すスペクトル汎化システムの構成ブロック図である。図において、スペクトル汎化システムは、数値マトリクス－画像変換装置１０、典型的スペクトル１２、局所ピーク切り出し装置２０、局所ピークストレージ３０、ｎ×１アイコン生成装置４０、正解データストレージ５０、局所ピーク学習用ニューラルネットワーク６０及び学習用比較機７０を備えている。

数値マトリクス－画像変換装置１０は、典型的スペクトル１２の数値マトリクスをデジタル画像化する。実施例では、数値マトリクスは周波数又は波数と信号強度であり、デジタル画像化は、例えば１２０１×１２０１画素のデジタル画像に変換するものである。なお、デジタル画像化の画素数は典型的スペクトル１２のピーク形状を的確に表現できる解像度が得られればよく、他方で計算負荷を低減する立場からは、過度にデジタル画像化の画素数を増やすのは良くない。例えば、５００×５００画素でもよく、また２０００×２０００画素でもよい。
図３は、数値マトリクス－画像変換装置１０で用いられる、本発明の一実施例を示すスペクトル数値列データの二次元デジタル画像変換による、形状情報を含んだ入力信号形成処理の説明図で、（Ａ）は数値列データを通常のプロット、（Ｂ）は変換後の二次元デジタル画像を示している。例えば、図３（Ａ）に示すｆ（ｘ）について、図３（Ｂ）の小フレームで切り出した情報を局所ピーク切り出し装置２０に対する入力信号とすることで、局所ピーク切り出し装置２０によるｆ（ｘ）周辺の情報を含んだ形状認識が可能となる。

局所ピーク切り出し装置２０は、数値マトリクス－画像変換装置１０で画像化された典型的スペクトル１２を１画素ごとに小フレームで走査し、ピーク周辺の小フレームを切り出す構成とする。学習の場合は、小フレームの中の様々な場所に満遍なくなくピークがある画像を使うのが、ピークと傾斜の違いを教える学習法として好ましいからである。小フレームを用いることによって、典型的スペクトル１２に含まれる外的攪乱要素の影響が最小化される。小フレームの画素数は典型的スペクトル１２のピーク形状を的確に表現できる解像度が得られればよく、他方で計算負荷を低減する立場からは、過度に画素数を増やすのは良くない。例えば、１６×１６画素でもよく、また６４×６４画素でもよい。
局所ピークストレージ３０には、局所ピーク切り出し装置２０で切り出された小フレームをすべて保存する。
図４は、本発明の一実施例を示す、小フレームを用いることによる外的攪乱要素の最小化処理の説明図である。局所的なスペクトルの尖度をスペクトルの概念とすることで、大きなスペクトル範囲のうねりの影響などを小さくすることができる。

ｎ×１アイコン生成装置４０は、局所ピーク切り出し装置２０で切り出された小フレーム内のピークに、ピークを意味する正解のアイコンを与えるものである。本明細書におけるアイコンとは、マーク等を広く含む概念とする。アイコンはピーク形状類型の判別パターンに応じた類型別のｎ×１アイコンであるとよい。ピーク形状類型の判別パターンは、前記ピークに含まれる尖度、歪度、及び尖度と歪度の少なくとも一種類のパラメータに応じた類型別のｎ×１アイコンであるとよい。類型別のｎ×１アイコンは、前記ピークのパラメータを人工知能の一種であるスペクトル汎化システムで用いるパラメータに変換したものである。ｎ×１アイコン生成装置４０は、アイコンの位置をデジタル画像化された典型的スペクトルのピーク位置座標に合わせて画像表示させる情報を含むとよい。ここで、ｎは自然数であって、例えば４以上２０以下の画素が好ましく、さらに好ましくは５以上１５以下の画素がよい。また、ピークを意味する正解のアイコンは、縦長の［ｎ個の画素］ｘ［１個の画素］に限定されるものではなく、［ｎ個の画素］ｘ［ｍ個の画素］であってもよい。ここで、ｍは自然数であって、例えば１以上５以下の画素が好ましく、さらに好ましくは１以上２以下の画素がよい。計算負荷を低減する立場からは、ピークを意味する正解のアイコンの画素数は少ないほどよい。他方で、ピーク形状を特徴量で表す場合の表現の自由度を高める立場からは、画素数が大きくてもよい。
図５は、尖部の有限ビット表示による機械が理解可能な尖度の概念的説明図で、（Ａ）はある小フレームで切り出したスペクトル、（Ｂ）は有限ビット長による尖度の機械可読な概念化の説明図である。図５（Ｂ）に示す有限ビット長による尖度の機械可読な概念化は、図５（Ａ）に示すスペクトル画像に対するセマンティックセグメンテーションの正解データに相当する。

正解データストレージ５０には、ｎ×１アイコン生成装置４０の正解のアイコンが格納される。このアイコンは、今回解析の対象となったピークに含まれるパラメータを人工知能の一種であるスペクトル汎化システムや物質同定システムで用いるパラメータに変換したものである。
局所ピーク学習用ニューラルネットワーク６０は、局所ピークストレージ３０に保存された小フレームに対して、正解データストレージ５０に保存された正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化されるべく学習するものである。局所ピーク学習用ニューラルネットワーク６０が学習途上の段階では、学習用比較機７０からパラメータ最適化に必要な調整量が局所ピーク学習用ニューラルネットワーク６０に帰還される。
学習用比較機７０は、正解データストレージ５０に格納された正解のアイコンと局所ピーク学習用ニューラルネットワーク６０の出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を局所ピーク学習用ニューラルネットワーク６０に出力する。

次に、このように構成された装置の動作について説明する。
図２は、本発明の一実施例を示すスペクトル汎化方法のフローチャートである。
数値マトリクス－画像変換装置１０は、典型的スペクトル１２の数値マトリクスをデジタル画像化する（Ｓ１００）。
局所ピーク切り出し装置２０は、デジタル画像化された典型的スペクトルを１画素ごとに、又は典型的スペクトル１２に沿って小フレームで走査し、典型的スペクトル１２の画像からピーク周辺の小フレームを切り出す（Ｓ１１０）。局所ピークストレージ３０は、局所ピーク切り出し装置２０で切り出された小フレームを局所ピークストレージに保存する（Ｓ１２０）。ｎ×１アイコン生成装置４０は、切り出された小フレーム内のピークに対して、ピークを意味する正解のアイコンを与える（Ｓ１３０）。
正解データストレージ５０には、与えられた正解のアイコンが格納される（Ｓ１４０）。学習用比較機７０では、正解データストレージ５０に格納された正解のアイコンと局所ピーク学習用ニューラルネットワーク６０の出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を局所ピーク学習用ニューラルネットワーク６０に出力する（Ｓ１５０）。学習用比較機７０による学習の結果として、局所ピーク学習用ニューラルネットワーク６０では、局所ピークストレージ３０に保存された小フレームに対して、正解データストレージ５０に保存された前記正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化される（Ｓ１６０）。上記処理は、プログラムによりコンピュータに実行させてもよい。

様々な形の小フレームに対して、同じ形状のｎ×１の正解のアイコンを回答させることで、「ピーク」の概念を教え、汎化する。こうして「ピーク概念」のパラメータがニューラルネットワーク（ＮＮ）内でいったん決まると、以後あらゆるピーク入力に対して、「ピークらしさ」のスコアを与えるようになる。そのスコアは、ピークの広がりや非対称性などで決まる。

＜実施例１＞
スペクトル数値列データの二次元デジタル画像変換による、形状情報を含んだ入力信号の形成処理
スペクトルの数値列データを、横軸波数ｃｍ^－１、縦軸信号強度の通常のプロットで表すと図３（Ａ）のようになる。これは横軸ｘに対して、縦軸ｆ（ｘ）をプロットしたものといえる。これを二次元デジタル画像情報Ｂ（ｘ，ｙ）として、次式で表す。
Ｂ（ｘ，ｙ）＝１（０≦ｙ≦ｆ（ｘ））
Ｂ（ｘ，ｙ）＝０（ｙ＞ｆ（ｘ））（１）
上式で表される二次元デジタル画像情報Ｂ（ｘ，ｙ）は、図３（Ｂ）のように１ビット二次元デジタル画像に変換したものである。ここで画像のビット情報として黒を１白を０、または黒を０白を１とする。ここでは１と０で差を表したが、二値化していれば数値は問わない。この変換により、数列ｆ（ｘ）は二次元デジタル情報Ｂ（ｘ，ｙ）に変換される。従って、コンピュータに小フレームでスペクトルを入力することにより、数列情報としてではなく二次元デジタル情報としてｆ（ｘ）周辺の情報を含んだ形状認識が可能となる。

＜実施例２＞
小フレームを用いることによる外的攪乱要素の最小化処理
Ｂ（ｘ，ｙ）に変換されたスペクトルの特徴を表している一部を小フレームで切り出すことで人工知能が学習するトレーニングデータとする（図４）。典型的にはスペクトルの尖った部分となるが、それに限らない。小フレームのサイズは、スペクトル全体のフレームサイズの１／４００程度が好ましい。
この小フレームを使うことで、広い範囲に及ぶスペクトルのうねりの影響を排した機械学習が可能になる。さらに、小フレーム位置を、フレームのサイズをΔｘｆ，Δｙｆとして、フレーム位置を±Δｘｆ／２、±Δｙｆ／２の範囲で変化させることで、スペクトルの特徴をより多くトレーニングすることができる。また、小フレームで切り出したスペクトルを左右反転させるトレーニング量を増やすことも学習効果を高めるのに望ましい。

＜実施例３＞
尖部の有限ビット表示による機械が理解可能な尖度の概念化処理
切り出された小フレームの二次元デジタル情報のうち、尖度を解させるための有限ビット表示Ａ（ｘ，ｙ）を、次式で表す。
Ａ（ｘ，ｙ）＝１（ｘはｄｆ（ｘ）／ｄｘ＝０となるｘ，ｆ（ｘ）－ＢＬ≦ｙ≦ｆ（ｘ））
Ａ（ｘ，ｙ）＝０（ｘはｄｆ（ｘ）／ｄｘ＝０となるｘ，ｙ＜ｆ（ｘ）－ＢＬ，ｙ＞ｆ（ｘ））
Ａ（ｘ，ｙ）＝０（ｘはｄｆ（ｘ）／ｄｘ≠０となるｘ，ｙは任意）（２）
ここでＢＬは有限ビット長であり、Ａ（ｘ，ｙ）を尖った部分という意味を与えるセマンティックセグメントとなる。具体的には図５（Ａ）の小フレームのスペクトルに対して、図５（Ｂ）が正解データなる。この時のＢＬはフレームサイズの１／４から１が好ましい。

図６は、本発明の一実施例を示す物質同定システムの構成ブロック図である。図において、物質同定システムは、標準スペクトルデータベース１１０、第１の数値マトリクス―画像変換装置１２０、第１のスペクトルトレーサ１３０、第１の局所ピーク学習済みニューラルネットワーク１４０、第１のハッシュ結合装置１５０、標準ＦＰ（フィンガープリント）ストレージ１６０、標準フィンガープリント格納管理部１７０を備えている。
本発明の物質同定システムは、更に、非負線形回帰装置１８０、計測スペクトル２１０、第２の数値マトリクス―画像変換装置２２０、第２のスペクトルトレーサ２３０、第２の局所ピーク学習済みニューラルネットワーク２４０、第２のハッシュ結合装置２５０及び比較機２６０を備えている。

第１の数値マトリクス―画像変換装置１２０は、標準スペクトルデータベース１１０に格納されている標準スペクトルを画像化するものである。標準スペクトルは、本発明の物質同定システムで解析対象となるスペクトル、例えばラマン分光分析計、赤外線分光分析計、近赤外分光分析計等がある。機械学習を前提としているので、標準スペクトルの画像データの数は多いほうが好ましく、例えば１０００枚から１００００枚程度を準備するとよい。

第１のスペクトルトレーサ１３０は、標準スペクトルデータベース１１０に格納されている標準スペクトルの画像を対象として、小フレームの中心をトレースさせる。即ち、第１のスペクトルトレーサ１３０は、標準スペクトル全体に対して十分小さい矩形の小フレームの対角線の交点（中心）を、スペクトル形状を示す画面上の線と一致するように移動させることができる。第１の局所ピーク学習済みニューラルネットワーク１４０は、前出のスペクトル汎化システムで学習した局所ピーク学習用ニューラルネットワーク６０によって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する。即ち、第１の局所ピーク学習済みニューラルネットワーク１４０が、標準スペクトル曲線のトレースにより逐次変化する小フレーム内のピークに対して、予測のアイコンを与え、該予測のアイコンを数値化したデータを出力する。ここで、逐次ピーク尤度とは、標準スペクトルに逐次現れるピークに対して、ピーク形状に関する統計モデルの適合度を示す指標である。
ハッシュ化とは、ハッシュ関数を用いて、任意のデータから、別の値を得るための操作をいい、当該別の値は、多くの場合は短い固定長の値である。ハッシュ関数は、主に検索の高速化やデータ比較処理の高速化に使われるもので、例えば、データベース内の項目を探したり、大きなファイル内で重複しているレコードや似ているレコードを検出する場合に利用される。

第１のハッシュ結合装置１５０は、第１の局所ピーク学習済みニューラルネットワーク１４０によって出力されたデータを結合して第１のフィンガープリントを作成する。
標準フィンガープリントストレージ１６０は、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントが格納されるものである。
本発明におけるフィンガープリントは、標準スペクトルに逐次現れるピーク形状について抽出した特徴量をベクトル化したもので、標準スペクトルに用いられた試料の素性の同一性を表すものである。本発明におけるフィンガープリントは、ピーク形状について抽出した特徴量を用いて、測定されたスペクトルの成分の照合に用いられる。

標準フィンガープリント格納管理部１７０は、標準スペクトルデータベース１１０に格納されている標準スペクトルの各々に対して作成された第１のフィンガープリントについて、類型化して、各類型化された個別の第１のフィンガープリントを識別して、個別の第１のフィンガープリント毎に標準フィンガープリントストレージ１６０に格納する。

第２の数値マトリクス―画像変換装置２２０は、今回の同定対象となる計測スペクトルを画像化する。計測スペクトルは、計測スペクトル２１０として、例えばラマン分光分析計、赤外線分光分析計、近赤外分光分析計等から送られる。
第２のスペクトルトレーサ２３０は、小フレームの中心を今回の同定対象となる計測スペクトル２１０の画像についてトレースさせる。
第２の局所ピーク学習済みニューラルネットワーク２４０は、前出のスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワーク２４０によって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する。

第２のハッシュ結合装置２５０は、第２の局所ピーク学習済みニューラルネットワーク２４０により出力されたデータを結合して第２のフィンガープリントを作成する。
比較機２６０は、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントと、第２のハッシュ結合装置２５０で作成された第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する。比較機２６０の比較アルゴリズムは、分類を行う機械学習を含むアルゴリズムであるとよい。分類を行う機械学習を含むアルゴリズムとしては、位置の一致、コサイン類似度、サポートベクターマシーン、ランダムフォレスト等、各種のものがある。

次に、このように構成された装置の動作について説明する。図７は、本発明の一実施例を示す物質同定方法のフローチャートである。
第１の数値マトリクス―画像変換装置１２０は、標準スペクトルデータベース１１０に格納されている標準スペクトルを画像化する（Ｓ２００）。
第１のスペクトルトレーサ１３０は、標準スペクトルデータベース１１０に格納されている標準スペクトルの画像を対象として、小フレームの中心のトレースを行なう（Ｓ２１０）。
続いて、前出のスペクトル汎化方法を用いて学習した第１の局所ピーク学習済みニューラルネットワーク１４０によって、標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する（Ｓ２２０）。第１のハッシュ結合装置１５０により、第１の局所ピーク学習済みニューラルネットワーク１４０によって出力されたデータを結合して、第１のフィンガープリントを作成する（Ｓ２３０）。

そして、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントを標準フィンガープリントストレージ１６０に格納する（Ｓ２４０）。
標準フィンガープリント格納管理部１７０により、標準スペクトルデータベース１１０に格納されている標準スペクトルの各々に対して作成された第１のフィンガープリントについて類型化する（Ｓ２５０）。さらに、標準フィンガープリント格納管理部１７０は、各類型化された個別の第１のフィンガープリントを識別して、個別の第１のフィンガープリント毎に標準フィンガープリントストレージ１６０に格納する（Ｓ２６０）。

図８は、本発明の一実施例を示す物質同定方法のフローチャートで、図７の続きである。
第２の数値マトリクス―画像変換装置２２０は、今回の同定対象となる計測スペクトルの画像化する（Ｓ３００）。
第２のスペクトルトレーサ２３０は、今回の同定対象となる計測スペクトルの画像について、小フレームの中心のトレースを行なう（Ｓ３１０）。
続いて、前出のスペクトル汎化方法を用いて学習した第２の局所ピーク学習済みニューラルネットワーク２４０によって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する（Ｓ３２０）。第２のハッシュ結合装置２５０により、第２の局所ピーク学習済みニューラルネットワーク２４０によって出力されたデータを結合して、第２のフィンガープリントを作成する（Ｓ３３０）。
比較機２６０は、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントと、第２のハッシュ結合装置２５０で作成された第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する（Ｓ３４０）

＜実施例４＞
スペクトルの尖部の予測結果（ビット表示）の一軸射影などによる次元削減とそのフィンガープリント化処理
図５で例示したようなトレーニングデータ（Ａ）と対応する正解データ（Ｂ）を人工知能が学習することにより、例えば小フレームに図９（Ａ）のようなスペクトルが存在する場合に、人工知能は図９（Ｂ）のような推測結果を出力する。

この予測結果は、人工知能がトレーニングデータから得た局所的なスペクトルの概念を基に、新たな入力スペクトルを診断し表現したものであり、形状に固有のものとなる。図９（Ｂ）の予測はピークの二つのピークの重なりを示唆して、二か所に尖度のあると予測している。図３（Ｂ）の全フレームに渡ってこの予測を行うことにより、スペクトル全体が、人工知能が学んだ局所スペクトルの概念を基に機械可読な形式に変換される。この変換結果自体フィンガープリントとなるが、これをスペクトル照合に用いるために、例えば

によって一次元に次元削減を行うことが望ましい。このＦＰ（ｘ）による次元削減されたフィンガープリントの具体例として、図９（Ｂ）の場合、式（３）のようになる。
ＦＰ（ｘ）＝（０，０，０，０，０，４，０，０，０，０，０，０，６，６，０，０，０，０，０，０，０，０，０，０，０，０，０，０，０，０，０，０）（３）

＜実施例５＞
スペクトルのフィンガープリントのライブラリ化と新たな測定結果のフィンガープリントの一致度の導入による成分同定法
実施例４に例示した通りフィンガープリント化した標準スペクトルは、ライブラリとして保存される。このライブラリにあるフィンガープリントＦＰｓｔｄと、測定したスペクトルのフィンガープリントＦＰｍｅａｓの比較（一致度診断）を行い、一致度の高いものから順に確からしい成分として予測結果が出力される。一致度診断には、例えば、次の式（４）で表されるコサイン類似度が有効である。

ここでｎ_ｆはフィンガープリントの次元である。コサイン類似度の他には、例えばサポートベクターマシーンなども有効である。この成分同定法のフローを図１０に示す。

図１０は、図６に示す本発明の他の一実施例を、スペクトル測定と標準スペクトルを用いた信号処理の観点から説明した構成ブロック図である。図１０に示す構成ブロック図のように、標準スペクトルのフィンガープリントのライブラリ化と新たな測定結果のフィンガープリントの一致度診断による成分同定処理が行える。
図１０に示すスペクトル測定と標準スペクトルを用いた信号処理によれば、外的攪乱因子のないフィンガープリント同士の比較による成分同定が可能になる。

図１１は、本発明の他の実施例を示す物質同定システムの構成ブロック図で、図６に示す物質同定システムに非負線形回帰装置１８０を付加したものである。なお、図１１において、図６と同一作用を行うものには同一符号を付して説明を省略する。
図において、非負線形回帰装置１８０は、標準スペクトルデータベース１１０から標準スペクトルと、入力された計測スペクトル２１０とを用いて、非負線形回帰処理によって、候補となる成分を絞り込む。候補となる成分は、被測定物質に含まれる各種の成分に応じたものであり、中性子、Ｘ線、紫外線、可視光線、赤外線、マイクロ波、超音波など様々な電磁波を使い、吸収、散乱、回折現象など各種の現象に応じたスペクトル形状を示すものに対して適合度が高いものである。非負線形回帰処理については、後で説明する。
比較機２６０は、第１のハッシュ結合装置１５０で作成された第１のフィンガープリントに代えて、非負線形回帰装置１８０で選定された候補に対応するフィンガープリントを標準フィンガープリントストレージ１６０から呼び出して、第２のハッシュ結合装置２５０で作成された第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する。

図１２は、図１１に示す物質同定方法のフローチャートで、図７の続きである。なお、図１２において、図７と同一作用を行う工程には同一符号を付して説明を省略する。
Ｓ３３０に続いて、計測スペクトル２１０が得られた場合は、非負線形回帰装置１８０による非負線形回帰処理を用いて、標準フィンガープリントストレージ１６０に格納された複数の第１のフィンガープリントの中から候補となる成分を絞り込む（Ｓ３６０）。
比較機２６０によって、非負線形回帰装置１８０で選定された候補に対応するフィンガープリントを標準フィンガープリントストレージ１６０から呼び出して、第２のハッシュ結合装置２５０で作成された第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する（Ｓ３７０）。

＜実施例６＞
非負線形回帰（ＮＮＬＳ）によるプレスクリーニングとの組み合わせることによる成分同定の改良処理
図１３は、本発明の他の一実施例を示す非負線形回帰（ＮＮＬＳ）によるプレスクリーニングとの組み合わせによる成分同定処理の一例であって、図１０の構成ブロック図で示す装置にプレスクリーニングのセレクタを設けてある。
実施例５ではライブラリにある全標準スペクトルのフィンガープリントを一致度診断に使うため、効率が低い。本発明の物質同定システムに係る成分同定の原理実証には過不足ないが、セレクタとして非負線形回帰処理を組み合わせる事で同定効率を高めることができる。

図１４は、本発明の他の一実施例を示す非負線形回帰（ＮＮＬＳ）処理によるプレスクリーニングとの組み合わせによる成分同定の改良である。非負線形回帰（ＮＮＬＳ）によりライブラリから候補を事前に絞り、予測効率と精度を上げることが可能になる。なお、非負線形回帰（ＮＮＬＳ）処理については、後で説明する。
標準スペクトルライブラリで数百以上ある候補は、ＮＮＬＳにより６乃至１０程度にプレスクリーニングすることができ、検索効率は１０倍以上に改善された。

図１４に示す物質同定システム及び方法による同定の精度は、二成分の混合試料の上位二成分が正解に一致する事例が８５．７％、上位三成分に正解が含まれるものが１００％となった

＜実施例７＞
スペクトルの形状をトレースすることにより予測を効率的に行うシステム及び方法
図１５は、本発明の他の実施例を示すスペクトルの形状をトレースすることにより予測を効率的に行う処理過程の説明図で、図１５（Ａ）は逐次予測のための小フレーム走査の一例、図１５（Ｂ）スペクトル形状ｆ（ｘ）に沿って局所予測する改善事例を示している。
図１５（Ａ）に示す信号処理では、原理的には［（Ｆｘ－Δｘｆ）／Δｘｆ］×［（Ｆｙ－Δｙｆ）／Δｙｆ］回の局所的なフィンガープリントの予測が必要になる。ここで、Ｆｘはスペクトルのｘ軸のピクセル数、Ｆｙはスペクトルのｙ軸のピクセル数、Δｘｆはｘ軸の一ピクセル当たりの周波数又は波数、Δｙｆはｙ軸の一ピクセル当たりの周波数又は波数である。図１５（Ａ）を基準とすると、図１５（Ｂ）に示す処理は（Ｆｙ－Δｙｆ）×Δｘｆ／Δｙｆ倍の予測回数の効率化が図れる。

即ち、小フレームによるセマンティックセグメンテーションを全スペクトル領域に適用する場合、二次元デジタル画像のスペクトルサイズをＦｘ×Ｆｙとすると、原理的には［（Ｆｘ－Δｘｆ）／Δｘｆ］×［（Ｆｙ－Δｙｆ）／Δｙｆ］回の局所的なフィンガープリントの予測が必要になる。その逐次予測のための小フレーム走査の一例を図１５（Ａ）に示す。その多くは、空白部分を走査しており、明らかに無駄な局所フィンガープリントの予測が繰り返される。
これに対して、本実施の形態ではスペクトル形状ｆ（ｘ）に沿って局所予測する改善例である図１５（Ｂ）の場合、Ｆｘ－Δｘｆ回の局所フィンガープリントの予測でスペクトル全体のフィンガープリントが近似的に得られる。図１５（Ａ）と図１５（Ｂ）の予測回数の比は（Ｆｙ－Δｙｆ）×Δｘｆ／Δｙｆとなり、フレームサイズが１０００×１０００程度の典型的なスペクトルの場合＞１０００倍程度の効率化が図れる。ここで、図１５（Ｂ）において間引きｎにより（Ｆｘ－Δｘｆ）／ｎ回の局所フィンガープリントの予測でスペクトル全体のフィンガープリントを近似することで、さらにｎ倍の予測効率の改善が図られる。

本発明の構成要件事項として、赤外吸収分光やＸ線回折等での混合成分解析の問題で取り扱われる数学的概念である、非負線形回帰演算（ＮＮＬＳ）について説明する。

＜非負最小二乗（ＮＮＬＳ、 Non Negative Least Squares）＞
混合成分の問題は、赤外吸収分光に限ったものではない。例えば、光の波長も原理も異なるが、極めて汎用的な結晶構造分析法であるＸ線回折で混合成分を解析した場合、回折パターンが重なり合い、どのピークがどの成分に帰属するか特定することは困難である。本発明の構成要件事項として、Ｘ線回折で良好な解決法となった非負線形回帰演算としての非負線形回帰（ＮＮＬＳ）処理について述べる。

Ｘ線回折での混合成分解析の問題は、市販・実験・公知情報などに基づくライブラリまたはデータベースの中から、最も確からしいデータを選ぶ、という課題に換言できる。

このタスクは、測定結果がライブラリにあるデータの線形和で表されると考えると、次の式（５）における成分ｐ（ドット）を求める数学的問題に帰結できる。

この問題を解く方法としては、例えば特異値分解（ＳＶＤ, Singular Value Decomposition）といった、誤差二乗（フロベニウスノルムFrobenius norm）を最小にする成分を抽出する次元削減などの近似解法が考えられる。例えば、[Christopher J. Gilmore, Gordon Barr and Jonathan Paisley, J. Appl. Cryst. 37, 231 (2004)]参照。

これは一般的に行列Ａ（成分ａ_ｉｊ）のフロベニウスノルムが、次の式（６）となることによる。

ここで、ランク（rank）とは、線型代数学における行列の階数のことで、行列の最も基本的な特性数（characteristic）の一つであって、その行列が表す線型方程式系および線型変換がどのくらい「非退化」であるかを示すものである。行列の階数を定義する方法として、行列Ａの階数ｒａｎｋ（Ａ)は、Ａの列空間（列ベクトルの張るベクトル空間）の次元に等しく、またＡの行空間の次元とも等しい。行列の階数は、対応する線型写像の階数である。

式（６）においては、長方行列のランクまでの適当な範囲で二乗和を打ち切ることで次元削減が実現できる。これを低ランク近似というが、特異値が小さいものを０とすれば、基本的に主成分分析（ＰＣＡ, Principal Component Analysis）と等価である。

しかし、ＳＶＤやＰＣＡの座標変換による直交成分最大を使った成分分離の考え方は、いくつかの主要な成分を決定するには効果的であるが、赤外線分光分析での混合成分解析用のタスクには必ずしも適さない。すなわち、直交成分最大を取ることは、見方を変えると類似ベクトルを縮退させることに対応するために、ライブラリに含まれる、プロセスなどに依存してわずかに異なる（しかしよく似た）同じ材料を過小評価することになる。実際の試料ではよく似た二つ以上の成分が混合していることはよくあり、更に赤外吸収分光ではこうした微小な差が重要であることが多い。従って、微小な差は、本来は削減されずに線形結合により確からしいものとして選ばれることが望まれる。またＳＶＤの次元削減は、根本的に微小成分を過小評価する方向にある点も、分析上は見逃し難い点である。

そこで、式（４）を直交分解（ＱＲ分解）すなわち、最小二乗（ＬＳ, Least Squares）法で解くことを考える。この場合は絶対的な直交空間内で各成分の残差を等しく見積もる反面、数学的に誤差最小をとる傾向が強まり、結果的に競合的な成分を負にすることがよくある。実際、ＳＶＤでも問題になった、よく似たスペクトルを持つ材料でこの傾向は特に著しくなる。こうした物理的に本来あり得ない解は、そのほかの成分の抽出結果にも影響が及ぶため、避ける必要がある。

この解決策として、負の成分を与える基底ベクトルを取り除き回帰を行うＮＮＬＳを考える。ＮＮＬＳは、例えば文献［C. L. Lawson and R. J. Hanson, Solving Least Squares Problems (Society for Industrial and Applied Mathematics, Philadelphia, 1995) 参照］でも記載されている古典的手法ながら、本発明の課題解決には良い結果を与える。非負回帰の手順は、次の手順（あ）～（う）に要約され、主要なものから順次成分ｘを決定することが可能である。
（あ）：基底ベクトルと、それに対応する双対ベクトルλを計算。
（い）：λが最大になる基底ベクトルを選んで、ほかの基底ベクトルと交換。
（う）：（あ）と（い）の処理をすべてのλについて繰り返す。

特に、λ≦０になるまで繰り返すことにすれば、非負の全ての成分による近似が可能になる。この手順によれば、直交成分最大を使うことなく確からしい成分を抽出し、かつ物理的にあり得ない負の成分を除くことができる。
図１６はライブラリにあるＸ線回折の実測値を使って、ＮＮＬＳによってＸ線回折の測定結果（破線）をフィッティングした例（実線）であり、良い一致が得られていることがわかる。

なお、上述した実施例は本発明の説明のための例示であり、制限的に解釈されるべきではない。例えば、本発明のスペクトル汎化システムとして数値マトリクス－画像変換装置１０を用いる場合を示したが、要は波数又は周波数と信号強度からなる数値マトリクスを予め定められた画素密度で画像変換できるものであればよく、このような画像変換された数値マトリクスによるスペクトル画像は、スキャナーや写真などの外部機器を用いて、本発明のスペクトル汎化システムにデータとして供給されてもよい。また、本発明の物質同定システムとして第１の数値マトリクス－画像変換装置１２０や第２の数値マトリクス－画像変換装置２２０を用いる場合を示したが、要は波数又は周波数と信号強度からなる数値マトリクスを予め定められた画素密度で画像変換できるものであればよく、このような画像変換された数値マトリクスによるスペクトル画像は、スキャナーや写真などの外部機器を用いて、本発明の物質同定システムにデータとして供給されてもよい。

本発明のスペクトル汎化システム及び方法、並びに物質同定システム及び方法は、極めて広いスペクトル解析に用いることができる。スペクトル解析は中性子、Ｘ線、紫外線、可視光線、赤外線、マイクロ波、超音波など様々な電磁波を使い、吸収、散乱、回折現象などを基盤としており、その観測スペクトル形状はよく似ているためである。人工知能を用いたこれらのスペクトルの汎化により、ハッシュ化を多様な基準で行えるようになり、分析化学における網羅的な材料の同定や特性の予測に適用可能となる。

スペクトル汎化システムについて
１０数値マトリクス－画像変換装置
１２典型的スペクトル
２０局所ピーク切り出し装置
３０局所ピークストレージ
４０ｎｘ１アイコン生成装置（ピーク形状類型の判別パターン）
５０正解データストレージ
６０局所ピーク学習用ＮＮ（ニューラルネットワーク）
７０学習用比較機
物質同定システムについて
１１０標準スペクトルＤＢ（データベース）
１２０、２２０数値マトリクス－画像変換装置
１３０、２３０スペクトルトレーサ
１４０、２４０局所ピーク学習済ＮＮ（ニューラルネットワーク）
１５０、２５０ハッシュ結合装置
１６０標準ＦＰ（フィンガープリント）ストレージ
１７０標準フィンガープリント格納管理部
１８０非負線形回帰装置
２１０計測スペクトル
２６０比較機

Claims

デジタル画像化された典型的スペクトルを小フレームで走査し、前記典型的スペクトルの画像からピーク周辺の小フレームを切り出す局所ピーク切り出し装置と、
前記局所ピーク切り出し装置で切り出された小フレームを保存する局所ピークストレージと、
前記局所ピーク切り出し装置で切り出された小フレーム内のピークに対応する、ピークを意味する正解のアイコンを与えるｎ×１アイコン生成装置と、
前記ｎ×１アイコン生成装置で与えられた前記正解のアイコンを格納する正解データストレージと、
前記局所ピークストレージに保存された小フレームに対して、前記正解データストレージに保存された前記正解のアイコンを回答するようにニューラルネットワークのパラメータが最適化される局所ピーク学習用ニューラルネットワークと、
前記正解データストレージに格納された前記正解のアイコンと前記局所ピーク学習用ニューラルネットワークの出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を前記局所ピーク学習用ニューラルネットワークに出力する学習用比較機と、
を備え、前記局所ピーク学習用ニューラルネットワークに、様々な形の小フレームに対して、同じ形状のｎ×１のアイコンを回答させることで、ピークの概念を教えてスペクトルを汎化すると共に、前記ｎ×１アイコンはｎを自然数とし、［ｎ個の画素］×［１個の画素］から構成されるｎ×１アイコンであることを特徴とする、スペクトル汎化システム。
前記ｎ×１アイコン生成装置は、ピーク形状類型の判別パターンに応じた類型別のｎ×１アイコンを与えることを特徴とする請求項１に記載のスペクトル汎化システム。
前記ピーク形状類型の判別パターンは、前記ピークの尖度、歪度、及び尖度と歪度の少なくとも一種類に応じた類型別のｎ×１アイコンであることを特徴とする請求項２に記載のスペクトル汎化システム。
前記ｎ×１アイコン生成装置は、前記正解のアイコンの位置をデジタル画像化された前記典型的スペクトルのピーク位置座標に合わせて画像表示させる情報を含むことを特徴とする請求項１乃至３の何れかに記載のスペクトル汎化システム。
前記局所ピーク切り出し装置は、デジタル画像化された前記典型的スペクトルを１画素ごとに走査し、ピーク周辺の小フレームを切り出すことを特徴とする請求項１乃至４の何れかに記載のスペクトル汎化システム。
前記局所ピーク切り出し装置が切り出す小フレームは、前記典型的スペクトルのピーク形状を的確に表現できる解像度が得られる画素数を有することを特徴とする請求項５に記載のスペクトル汎化システム。
さらに、前記典型的スペクトルをデジタル画像化する数値マトリクス－画像変換装置を有することを特徴とする請求項１乃至６の何れかに記載のスペクトル汎化システム。
前記数値マトリクス－画像変換装置は、前記典型的スペクトルをデジタル画像化するにあたり、ピークを有する前記典型的スペクトルに対応する数値マトリクスを、二次元デジタル画像に変換することを特徴とする請求項７に記載のスペクトル汎化システム。
前記二次元デジタル画像は前記典型的スペクトルのピーク形状を的確に表現できる解像度が得られる画素数を有することを特徴とする請求項８に記載のスペクトル汎化システム。
デジタル画像化された典型的スペクトルを１画素ごとに、又は前記典型的スペクトルに沿って小フレームで走査し、前記典型的スペクトルの画像からピーク周辺の小フレームを切り出し、
前記切り出された小フレームを局所ピークストレージに保存し、
前記切り出された小フレーム内のピークに対して、ピークを意味する正解のアイコンを与え、
与えられた前記正解のアイコンを正解データストレージに格納し、
前記正解データストレージに格納された前記正解のアイコンと局所ピーク学習用ニューラルネットワークの出力する予測のアイコンとを比較して、両者が一致するようにパラメータ最適化に必要な調整量を前記局所ピーク学習用ニューラルネットワークに出力し、
前記調整量によって、前記局所ピークストレージに保存された小フレームに対して、前記正解データストレージに保存された前記正解のアイコンを回答するように前記局所ピーク学習用ニューラルネットワークのパラメータが最適化される、
工程をコンピュータに実行させて、前記局所ピーク学習用ニューラルネットワークに、様々な形の小フレームに対して、同じ形状のｎ×１のアイコンを回答させることで、ピークの概念を教えてスペクトルを汎化すると共に、前記ｎ×１アイコンはｎを自然数とし、［ｎ個の画素］×［１個の画素］から構成されるｎ×１アイコンであることを特徴とするスペクトル汎化方法。
標準スペクトルデータベースに格納されている標準スペクトルの画像を対象として、小フレームの中心をトレースさせる第１のスペクトルトレーサと、
請求項１乃至９の何れかに記載のスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワークであって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する第１の局所ピーク学習済みニューラルネットワークと、
前記第１の局所ピーク学習済みニューラルネットワークによって出力されたデータを結合して第１のフィンガープリントを作成する第１のハッシュ結合装置と、
前記第１のハッシュ結合装置で作成された第１のフィンガープリントが格納される標準フィンガープリントストレージと、
前記標準スペクトルデータベースに格納されている標準スペクトルの各々に対して作成された前記第１のフィンガープリントについて、類型化して、各類型化された個別の第１のフィンガープリントを識別して、個別の第１のフィンガープリント毎に前記標準フィンガープリントストレージに格納する標準フィンガープリント格納管理部と、
小フレームの中心を今回の同定対象となる計測スペクトルの画像についてトレースさせる第２のスペクトルトレーサと、
請求項１乃至９の何れかに記載のスペクトル汎化システムで学習した局所ピーク学習済みニューラルネットワークであって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力する第２の局所ピーク学習済みニューラルネットワークと、
前記第２の局所ピーク学習済みニューラルネットワークによって出力されたデータを結合して第２のフィンガープリントを作成する第２のハッシュ結合装置と、
前記第１のハッシュ結合装置で作成された前記第１のフィンガープリントと、前記第２のハッシュ結合装置で作成された前記第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する比較機と、
を備えることを特徴とする物質同定システム。
前記比較機の比較アルゴリズムは、分類を行う機械学習を含むアルゴリズムであることを特徴とする請求項１１に記載の物質同定システム。
さらに、前記標準スペクトルデータベースに格納されている標準スペクトルを画像化する第１の数値マトリクス―画像変換装置を有することを特徴とする請求項１１又は１２に記載の物質同定システム。
さらに、前記今回の同定対象となる計測スペクトルは、前記計測スペクトルを画像化する第２の数値マトリクス―画像変換装置により与えられることを特徴とする請求項１１又は１２に記載の物質同定システム。
請求項１１乃至１４の何れかに記載の物質同定システムにおいて、さらに、
計測スペクトルが得られた場合は、非負線形回帰処理を用いて、前記標準フィンガープリントストレージに格納された複数の前記第１のフィンガープリントの中から候補となる成分を絞り込む非負線形回帰装置を備え、
前記比較機は、前記第１のハッシュ結合装置で作成された前記第１のフィンガープリントに代えて、前記非負線形回帰装置で選定された候補に対応するフィンガープリントを前記標準フィンガープリントストレージから呼び出して、前記第２のハッシュ結合装置で作成された前記第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力することを特徴とする請求項１１に記載の物質同定システム。
標準スペクトルデータベースに格納されている標準スペクトルの画像を対象として、小フレームの中心のトレースを行い、
請求項１０に記載のスペクトル汎化方法を用いて学習した第１の局所ピーク学習済みニューラルネットワークによって、前記標準スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力し、
第１のハッシュ結合装置により、前記第１の局所ピーク学習済みニューラルネットワークによって出力されたデータを結合して、第１のフィンガープリントを作成し、
前記第１のハッシュ結合装置で作成された前記第１のフィンガープリントを標準フィンガープリントストレージに格納し、
標準フィンガープリント格納管理部により、前記標準スペクトルデータベースに格納されている標準スペクトルの各々に対して作成された前記第１のフィンガープリントについて類型化して、各類型化された個別の第１のフィンガープリントを識別して、個別の第１のフィンガープリント毎に前記標準フィンガープリントストレージに格納し、
今回の同定対象となる計測スペクトルの画像について、小フレームの中心のトレースを行い、
請求項１０に記載のスペクトル汎化方法を用いて学習した第２の局所ピーク学習済みニューラルネットワークによって、前記計測スペクトルの逐次ピーク尤度のスコアリングをさせて、ハッシュ化したデータを出力し、
第２のハッシュ結合装置により、前記第２の局所ピーク学習済みニューラルネットワークによって出力されたデータを結合して、第２のフィンガープリントを作成し、
前記第１のハッシュ結合装置で作成された前記第１のフィンガープリントと、前記第２のハッシュ結合装置で作成された前記第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力する、
工程をコンピュータに実行させることを特徴とする物質同定方法。
請求項１６に記載の物質同定方法において、
さらに、計測スペクトルが得られた場合は、非負線形回帰処理を用いて、前記標準フィンガープリントストレージに格納された複数の前記第１のフィンガープリントの中から候補となる成分を絞り込み、
前記第１のハッシュ結合装置で作成された前記第１のフィンガープリントに代えて、前記非負線形回帰処理で選定された候補に対応するフィンガープリントと、前記第２のハッシュ結合装置で作成された前記第２のフィンガープリントを比較し、一致度の高いフィンガープリントを予測結果として出力することを特徴とする物質同定方法。