JP2020201174A - スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム - Google Patents
スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム Download PDFInfo
- Publication number
- JP2020201174A JP2020201174A JP2019109358A JP2019109358A JP2020201174A JP 2020201174 A JP2020201174 A JP 2020201174A JP 2019109358 A JP2019109358 A JP 2019109358A JP 2019109358 A JP2019109358 A JP 2019109358A JP 2020201174 A JP2020201174 A JP 2020201174A
- Authority
- JP
- Japan
- Prior art keywords
- correlation analysis
- canonical correlation
- spectrum data
- standard
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Analysing Materials By The Use Of Radiation (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
【課題】スペクトルの情報から当該サンプルの成分同定できるスペクトル解析装置用の成分同定装置を提供すること。【解決手段】測定スペクトルデータ30及び標準スペクトルデータ34の強度を規格化する前処理手段32と、測定スペクトルデータ30を標準スペクトルデータ34による線形和によって回帰し、対応する回帰係数の演算を行うと共に、この回帰係数が一定の値以上の回帰係数を抽出する非負線形回帰演算部42と、非負線形回帰演算部42で抽出した標準スペクトルデータに対応する標準物質を、被測定試料10の組成として選定する予測物質候補抽出部48とを備える。【選択図】図7
Description
本発明は、赤外線吸収分析計などの分光分析装置を用いた試料(検体)の測定により得られるスペクトルを解析するスペクトル解析装置に関し、特に混合成分の同定を成分数などの事前情報なしに行う場合に用いて好適なスペクトル解析装置用の成分同定装置及びその方法に関する。
赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、及び分光蛍光光度計などの分光分析装置では、試料に光を照射し、該試料と相互作用した後の光(反射光、透過光、又は蛍光など)を検出することにより、分光スペクトルを測定している。分光スペクトルは、例えば横軸が波長・波数・エネルギ又は周波数であり、縦軸が吸光度、反射率、透過率、又は蛍光強度等である。
このうち、赤外分光光度計やラマン分光光度計を用いた赤外線吸収分光は、1970年代から盛んに研究されて学術的理解の基盤を固め、2018年には2万5千件以上の科学技術文献で取り上げられるきわめて汎用的な分析方法となっている。赤外線の光子エネルギは、多くの分子の化学結合の振動や回転運動のエネルギと一致することから、吸収スペクトルには成分分子の構造が反映される。したがってスペクトル分析により、サンプルに含まれる成分を同定できる。特に有機分子は、ほとんど赤外線領域に吸収を持つため高感度に検出でき、化学原料の品質確認、汚染物質の同定や環境モニター、薄膜分析、食品や清浄度が要求される製品への異物混入検査など、現在の社会における安心・安全を保証するツールの一つとして、重要性が広く認知されている。
しかし、測定原理からわかる通り、サンプルに複数の成分が含まれる混合成分系の場合、各成分のスペクトルが重なりあうため成分同定は困難になる。特に、混合成分が同じ化学結合を多く含む場合は、各物質に固有のわずかなスペクトルの違いを見つける必要があるため、分析者には多くの経験と知識が求められる。
これに対して、経験量に依らず誰にでも成分同定ができることを目指した自動解析ソフトが市販されている。しかし、当該自動解析ソフトは、スペクトルライブラリとの単純な比較や、ピーク位置や吸収強度比などの経験的解析ルール(例えば、非特許文献1、2参照)や単純な類似度解析による候補物質の提示を基本としているため、スペクトルのバックグラウンド強度やノイズの影響を受ける。したがって、多くの解析ソフトウェアは、解析前のバックグラウンドやノイズを取り除く機能やピーク分離機能を強化している。こうした前処理に関連しては、例えば特許文献1では干渉ノイズ除去、特許文献2では隣接吸収ピークをノイズと誤判断しない工夫が提案されている。だがこのような前段の処理をしたとしても目的とする後段の成分同定においては、検出器の感度分布、サンプルの調合具合などの測定法固有の不確定要素によって、解析結果が大きく変わる。
従来技術としては、成分数など本来分析者が知りえない情報や、サンプルの来歴から予想される混合物などを仮定して、この不確定要素の影響を低減することが試みられてきた。しかし、このような仮定は、専門家による合理的な推定に依拠する必要がある以上、含有成分を客観的かつ一意に決めることは不可能であった。
George Socrates. Infrared and Raman Characteristic Group Frequencies: Tables and Charts. John Wiley & Sons (2004).
Peter Larkin, Infrared and Raman Spectroscopy: Principles and Spectral Interpretation, Elsevier (2011).
本発明は、サンプルに含まれる成分数など本来分析者が知りえない情報や、サンプルの来歴から予想される混合物候補などを仮定することなく、例えば赤外線吸収スペクトルのような分光スペクトルの情報から当該サンプルの成分同定できるスペクトル解析装置用の成分同定装置を提供することを目的とする。
[1] 本発明のスペクトル解析装置用の成分同定装置は、例えば図7に示すように、被測定試料10の測定スペクトルデータ30を読込む手段と、組成既知の標準物質について、測定スペクトルデータ30の測定領域及び測定態様に対応する標準スペクトルデータ34を読込む手段と、測定スペクトルデータ30の強度を規格化する前処理手段32と、測定スペクトルデータ30を標準スペクトルデータ34による線形和によって回帰し、対応する回帰係数の演算を行うと共に、この回帰係数が一定の値以上の回帰係数を抽出する非負線形回帰演算部42と、非負線形回帰演算部42で抽出した標準スペクトルデータに対応する標準物質を、被測定試料10の組成として選定する予測物質候補抽出部48とを備えるものである。
[2] 本発明のスペクトル解析装置用の成分同定装置は、例えば図11に示すように、被測定試料10のスペクトルデータを読込む手段と、組成既知の標準物質について、測定スペクトルデータ30の測定領域及び測定態様に対応する標準スペクトルデータを読込む手段と、測定スペクトルデータ30及び標準スペクトルデータ34について、正準相関解析から類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する正準相関解析部442と、正準相関解析部442で抽出した標準スペクトルデータに対応する標準物質を、被測定試料10の組成として選定する予測物質候補リスト部47とを備えるものである。
[3] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、正準相関解析部442に代えて、あるいは加えて、測定スペクトルデータ30及び標準スペクトルデータ34について、スペクトル強度の対数について正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する対数正準相関解析部444を備えるとよい。
[4] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、正準相関解析部442に代えて、あるいは加えて、測定スペクトルデータ30及び標準スペクトルデータ34について、部分的に切り出したスペクトルデータについて正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する部分正準相関解析部446を備えるとよい。
[4] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、正準相関解析部442に代えて、あるいは加えて、測定スペクトルデータ30及び標準スペクトルデータ34について、部分的に切り出したスペクトルデータについて正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する部分正準相関解析部446を備えるとよい。
[5] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、前記スペクトルデータの領域は、周波数、波長、波数、又はエネルギによって定義されると共に、前記部分的に切り出したスペクトルデータの領域は、前記スペクトルデータの上限値と下限値によって定められるとよい。
[6] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、測定スペクトルデータ30及び標準スペクトルデータ34の強度は、規格化されているとよい。
[6] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、測定スペクトルデータ30及び標準スペクトルデータ34の強度は、規格化されているとよい。
[7] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、[2]に記載の正準相関解析部442、[3]に記載の対数正準相関解析部444、又は[4]に記載の部分正準相関解析部446の少なくともいずれか一つにおいて、当該類似度の絶対値に基づき抽出される標準スペクトルデータは、所定のしきい値よりも大きな類似度を有するとよい。
[8] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、被測定試料10のスペクトルデータは、分光分析装置、電子線エネルギ損失分光装置(EELS)、エネルギ分散X線分光装置(EDX)を搭載した走査透過電子顕微鏡(STEM)で測定されるとよい。
[9] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、前記分光分析装置は、赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、又は分光蛍光光度計の何れかであることよい。
[8] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、被測定試料10のスペクトルデータは、分光分析装置、電子線エネルギ損失分光装置(EELS)、エネルギ分散X線分光装置(EDX)を搭載した走査透過電子顕微鏡(STEM)で測定されるとよい。
[9] 本発明のスペクトル解析装置用の成分同定装置において、好ましくは、前記分光分析装置は、赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、又は分光蛍光光度計の何れかであることよい。
[10] 本発明のスペクトル解析装置用の成分同定装置は、[1]に記載の非負線形回帰演算部42で選定された予測物質候補に対して、[2]乃至[6]の何れか1項に記載の正準相関解析部442、対数正準相関解析部444、又は部分正準相関解析部446の少なくともいずれか一つで選定される予測物質候補に絞り込むように構成されたものである。
[11] 本発明のスペクトル解析装置用の成分同定装置は、[1]に記載の非負線形回帰演算部42で選定された第1の予測物質候補と、[2]乃至[6]の何れか1項に記載の正準相関解析部442、対数正準相関解析部444、又は部分正準相関解析部446の少なくともいずれか一つで選定される第2の予測物質候補から、当該予測物質候補の選出頻度から、被測定試料10の組成として真の含有物質を推定するように構成されたものである。
[11] 本発明のスペクトル解析装置用の成分同定装置は、[1]に記載の非負線形回帰演算部42で選定された第1の予測物質候補と、[2]乃至[6]の何れか1項に記載の正準相関解析部442、対数正準相関解析部444、又は部分正準相関解析部446の少なくともいずれか一つで選定される第2の予測物質候補から、当該予測物質候補の選出頻度から、被測定試料10の組成として真の含有物質を推定するように構成されたものである。
[12] 本発明のスペクトル解析装置用の成分同定方法は、例えば図8に示すように、被測定試料の測定スペクトルデータを読込む工程(S810)と、組成既知の標準物質について、測定スペクトルデータ30の測定領域及び測定態様に対応する標準スペクトルデータを読込む工程(S815)と、測定スペクトルデータ30の強度を規格化する前処理工程(S820)と、測定スペクトルデータ30を標準スペクトルデータ34による線形和によって回帰し、対応する回帰係数の演算を行うと共に、この回帰係数が一定の値以上の回帰係数を抽出する非負線形回帰演算工程(S825)と、前記非負線形回帰演算工程で抽出した標準スペクトルデータに対応する標準物質を、被測定試料10の組成として予測物質候補リストとして選定する工程とを備えるものである。
好ましくは、S820において、測定スペクトルデータ30を、標準スペクトルデータ34とデータ形式が合うように、変換するとよい。
好ましくは、S820において、測定スペクトルデータ30を、標準スペクトルデータ34とデータ形式が合うように、変換するとよい。
[13] 本発明のスペクトル解析装置用の成分同定方法は、例えば図12に示すように、被測定試料のスペクトルデータを読込む工程(S810)と、組成既知の標準物質について、測定スペクトルデータ30の測定領域及び測定態様に対応する、標準スペクトルデータを読込む工程(S815)と、測定スペクトルデータ30及び標準スペクトルデータ34について、正準相関解析から類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する正準相関解析工程(S845)と、前記正準相関解析工程で抽出した標準スペクトルデータに対応する標準物質を、被測定試料10の組成として選定する予測物質候補リスト工程(S850)とを備えるものである。
好ましくは、S815とS845の間に、測定スペクトルデータ30を、標準スペクトルデータ34とデータ形式が合うように、変換する前処理工程(S820)を設けると良い。
好ましくは、S815とS845の間に、測定スペクトルデータ30を、標準スペクトルデータ34とデータ形式が合うように、変換する前処理工程(S820)を設けると良い。
[14] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、前記正準相関解析工程に代えて、あるいは加えて、測定スペクトルデータ30及び標準スペクトルデータ34について、スペクトル強度の対数について正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する対数正準相関解析工程を備えるとよい。
[15] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、前記正準相関解析工程に代えて、あるいは加えて、測定スペクトルデータ30及び標準スペクトルデータ34について、部分的に切り出したスペクトルデータについて正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する部分正準相関解析工程を備えるとよい。
[16] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、前記スペクトルデータの領域は、周波数、波長、波数、又はエネルギによって定義されると共に、
前記部分的に切り出したスペクトルデータの領域は、前記スペクトルデータの上限値と下限値によって定められるとよい。
[17] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、測定スペクトルデータ30及び標準スペクトルデータ34の強度は、規格化されているとよい。
[15] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、前記正準相関解析工程に代えて、あるいは加えて、測定スペクトルデータ30及び標準スペクトルデータ34について、部分的に切り出したスペクトルデータについて正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する部分正準相関解析工程を備えるとよい。
[16] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、前記スペクトルデータの領域は、周波数、波長、波数、又はエネルギによって定義されると共に、
前記部分的に切り出したスペクトルデータの領域は、前記スペクトルデータの上限値と下限値によって定められるとよい。
[17] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、測定スペクトルデータ30及び標準スペクトルデータ34の強度は、規格化されているとよい。
[18] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、[13]に記載の正準相関解析工程、[14]に記載の対数正準相関解析工程、または[15]に記載の部分正準相関解析工程において、当該類似度の絶対値に基づき抽出される標準スペクトルデータは、所定のしきい値よりも大きな類似度を有するとよい。
[19] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、被測定試料10のスペクトルデータは、分光分析装置、電子線エネルギ損失分光装置(EELS)、エネルギ分散X線分光装置(EDX)を搭載した走査透過電子顕微鏡(STEM)で測定されるとよい。
[20] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、前記分光分析装置は、赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、又は分光蛍光光度計の何れかであるとよい。
[19] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、被測定試料10のスペクトルデータは、分光分析装置、電子線エネルギ損失分光装置(EELS)、エネルギ分散X線分光装置(EDX)を搭載した走査透過電子顕微鏡(STEM)で測定されるとよい。
[20] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、前記分光分析装置は、赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、又は分光蛍光光度計の何れかであるとよい。
[21] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、さらに、[12]に記載の非負線形回帰演算工程で選定された予測物質候補に対して、[13]乃至[17]の何れか1項に記載の正準相関解析工程、対数正準相関解析工程、又は部分正準相関解析工程の少なくともいずれか一つで選定される予測物質候補に絞り込む工程を有するとよい。
[22] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、さらに、[12]に記載の非負線形回帰演算工程で選定された第1の予測物質候補と、[13]乃至[17]の何れか1項に記載の正準相関解析工程、対数正準相関解析工程、又は部分正準相関解析工程の少なくともいずれか一つで選定される第2の予測物質候補から、当該予測物質候補の選出頻度から、被測定試料10の組成として真の含有物質を推定する工程を有するとよい。
[22] 本発明のスペクトル解析装置用の成分同定方法において、好ましくは、さらに、[12]に記載の非負線形回帰演算工程で選定された第1の予測物質候補と、[13]乃至[17]の何れか1項に記載の正準相関解析工程、対数正準相関解析工程、又は部分正準相関解析工程の少なくともいずれか一つで選定される第2の予測物質候補から、当該予測物質候補の選出頻度から、被測定試料10の組成として真の含有物質を推定する工程を有するとよい。
[23] 本発明のスペクトル解析装置用の成分同定プログラムは、[12]乃至[22]の何れか1項に記載のスペクトル解析装置用の成分同定方法を、コンピュータに実行させるものである。
本発明のスペクトル解析装置用の成分同定装置では、以下の効果がある。
(あ)回帰分析を用いるために、被測定試料の組成として、微小成分を含めた候補物質の選出が可能になる。更に同物質のスペクトルが標準スペクトルデータのライブラリに存在したとしても、より確からしい候補物質を数理的に選出することができる。
(い)[2]に記載の正準相関解析部、[3]に記載の対数正準相関解析部を併用する場合は、スペクトルの線形・対数をとり、それぞれに正準相関を算出することによって、強い吸収ピークと弱いピークの両面から類似度が評価でき、主成分と微小成分の双方の候補を選出できる。
(う)[4]に記載の部分正準相関解析部を用いる場合は、正準相関を算出する周波数、波長、波数、又はエネルギの領域を適宜に選ぶことによって、特異的な吸収ピークに対する候補物質を選出できる。
(え) (あ)から(う)に示す複合かつ総合的な指標により、客観的に候補物質を選出できる。
混合成分の同定に必要な技量(経験)を低減し、赤外吸収分光の能力を向上させた。
(あ)回帰分析を用いるために、被測定試料の組成として、微小成分を含めた候補物質の選出が可能になる。更に同物質のスペクトルが標準スペクトルデータのライブラリに存在したとしても、より確からしい候補物質を数理的に選出することができる。
(い)[2]に記載の正準相関解析部、[3]に記載の対数正準相関解析部を併用する場合は、スペクトルの線形・対数をとり、それぞれに正準相関を算出することによって、強い吸収ピークと弱いピークの両面から類似度が評価でき、主成分と微小成分の双方の候補を選出できる。
(う)[4]に記載の部分正準相関解析部を用いる場合は、正準相関を算出する周波数、波長、波数、又はエネルギの領域を適宜に選ぶことによって、特異的な吸収ピークに対する候補物質を選出できる。
(え) (あ)から(う)に示す複合かつ総合的な指標により、客観的に候補物質を選出できる。
混合成分の同定に必要な技量(経験)を低減し、赤外吸収分光の能力を向上させた。
本発明の構成要件事項として、赤外吸収分光やX線回折等での混合成分解析の問題で取り扱われる数学的概念である、非負線形回帰演算(NNLS)、正準相関解析(CCA)、対数正準相関解析(L−CCA)、部分正準相関解析(P−CCA)について説明し、更にこれらを組み合わせた成分分離アルゴリズムについて説明する。
<非負最小二乗(NNLS、 Non Negative Least Squares)>
混合成分の問題は、赤外吸収分光に限ったものではない。例えば、光の波長も原理も異なるが、極めて汎用的な結晶構造分析法であるX線回折で混合成分を解析した場合、回折パターンが重なり合い、どのピークがどの成分に帰属するか特定することは困難である。本発明の構成要件事項として、X線回折で良好な解決法となった非負線形回帰演算としての非負最小二乗(NNLS)について述べる。
混合成分の問題は、赤外吸収分光に限ったものではない。例えば、光の波長も原理も異なるが、極めて汎用的な結晶構造分析法であるX線回折で混合成分を解析した場合、回折パターンが重なり合い、どのピークがどの成分に帰属するか特定することは困難である。本発明の構成要件事項として、X線回折で良好な解決法となった非負線形回帰演算としての非負最小二乗(NNLS)について述べる。
X線回折での混合成分解析の問題は、市販・実験・公知情報などに基づくライブラリまたはデータベースの中から、最も確からしいデータを選ぶ、というタスクに換言できる。
ここで、タスクとは、多重プログラムを扱うオペレーティングシステム(OS)からみたとき、コンピュータで処理する一つの仕事の単位をいう。OSのもとでユーザープログラムはジョブとして扱われ、このジョブはいくつかのジョブステップに分割される。そしてジョブステップのそれぞれは並列処理可能なタスクに分解され、これを非同期的に実行して、あとでつなぎ合せることが行われる。タスクの生成、消滅、スケジューリング、中央処理装置割当て、主記憶装置の割当てと管理、タスク間の同期、種々の周辺装置などの共用資源の割当てと管理など、種々の複雑な仕事があり、これをタスク管理(task management)と呼んでいる。
ここで、タスクとは、多重プログラムを扱うオペレーティングシステム(OS)からみたとき、コンピュータで処理する一つの仕事の単位をいう。OSのもとでユーザープログラムはジョブとして扱われ、このジョブはいくつかのジョブステップに分割される。そしてジョブステップのそれぞれは並列処理可能なタスクに分解され、これを非同期的に実行して、あとでつなぎ合せることが行われる。タスクの生成、消滅、スケジューリング、中央処理装置割当て、主記憶装置の割当てと管理、タスク間の同期、種々の周辺装置などの共用資源の割当てと管理など、種々の複雑な仕事があり、これをタスク管理(task management)と呼んでいる。
このタスクは、測定結果がライブラリにあるデータの線形和で表されると考えると、次の式(1)における成分p(ドット)を求める数学的問題に帰結できる。
この問題を解く方法としては、例えば特異値分解(SVD, Singular Value Decomposition)といった、誤差二乗(フロベニウスノルムFrobenius norm)を最小にする成分を抽出する次元削減などの近似解法が考えられる。例えば、[Christopher J. Gilmore, Gordon Barr and Jonathan Paisley, J. Appl. Cryst. 37, 231 (2004) 参照]。
この問題を解く方法としては、例えば特異値分解(SVD, Singular Value Decomposition)といった、誤差二乗(フロベニウスノルムFrobenius norm)を最小にする成分を抽出する次元削減などの近似解法が考えられる。例えば、[Christopher J. Gilmore, Gordon Barr and Jonathan Paisley, J. Appl. Cryst. 37, 231 (2004) 参照]。
これは一般的に行列A(成分aij)のフロベニウスノルムが、次の式(2)となることによる。
ここで、ランク(rank)とは、線型代数学における行列の階数のことで、行列の最も基本的な特性数(characteristic)の一つであって、その行列が表す線型方程式系および線型変換がどのくらい「非退化」であるかを示すものである。行列の階数を定義する方法として、行列Aの階数rank(A)は、Aの列空間(列ベクトルの張るベクトル空間)の次元に等しく、またAの行空間の次元とも等しい。行列の階数は、対応する線型写像の階数である。
式(2)においては、長方行列のランクまでの適当な範囲で二乗和を打ち切ることで次元削減が実現できる。これを低ランク近似というが、特異値が小さいものを0とすれば、基本的に主成分分析(PCA, Principal Component Analysis)と等価である。
しかし、SVDやPCAの座標変換による直交成分最大を使った成分分離の考え方は、いくつかの主要な成分を決定するには効果的であるが、赤外線分光分析での混合成分解析用のタスクには必ずしも適さない。すなわち、直交成分最大を取ることは、見方を変えると類似ベクトルを縮退させることに対応するために、ライブラリに含まれる、プロセスなどに依存してわずかに異なる(しかしよく似た)同じ材料を過小評価することになる。実際の試料ではよく似た二つ以上の成分が混合していることはよくあり、更に赤外吸収分光ではこうした微小な差が重要であることが多い。従って、微小な差は、本来は削減されずに線形結合により確からしいものとして選ばれることが望まれる。またSVDの次元削減は、根本的に微小成分を過小評価する方向にある点も、分析上は見逃し難い点である。
そこで、式(1)を直交分解(QR分解)すなわち、最小二乗(LS, Least Squares)法で解くことを考える。この場合は絶対的な直交空間内で各成分の残差を等しく見積もる反面、数学的に誤差最小をとる傾向が強まり、結果的に競合的な成分を負にすることがよくある。実際、SVDでも問題になった、よく似たスペクトルを持つ材料でこの傾向は特に著しくなる。こうした物理的に本来あり得ない解は、そのほかの成分の抽出結果にも影響が及ぶため、避ける必要がある。
この解決策として、負の成分を与える基底ベクトルを取り除き回帰を行うNNLSを考える。NNLSは、例えば文献[C. L. Lawson and R. J. Hanson, Solving Least Squares Problems (Society for Industrial and Applied Mathematics, Philadelphia, 1995) 参照]でも記載されている古典的手法ながら、本発明の課題解決には良い結果を与える。非負回帰の手順は、次の手順(あ)〜(う)に要約され、主要なものから順次成分xを決定することが可能である。
(あ):基底ベクトルと、それに対応する双対ベクトルλを計算。
(い):λが最大になる基底ベクトルを選んで、ほかの基底ベクトルと交換。
(う):(あ)と(い)の処理をすべてのλについて繰り返す。
(あ):基底ベクトルと、それに対応する双対ベクトルλを計算。
(い):λが最大になる基底ベクトルを選んで、ほかの基底ベクトルと交換。
(う):(あ)と(い)の処理をすべてのλについて繰り返す。
特に、λ≦0になるまで繰り返すことにすれば、非負の全ての成分による近似が可能になる。この手順によれば、直交成分最大を使うことなく確からしい成分を抽出し、かつ物理的にあり得ない負の成分を除くことができる。
図1はライブラリにあるX線回折の実測値を使って、NNLSによってX線回折の測定結果(破線)をフィッティングした例(実線)であり、良い一致が得られていることがわかる。
図1はライブラリにあるX線回折の実測値を使って、NNLSによってX線回折の測定結果(破線)をフィッティングした例(実線)であり、良い一致が得られていることがわかる。
<正準相関解析(CCA、 Canonical Correlation Analysis)>
非負最小二乗(NNLS)の項では、ライブラリからの確からしいデータ抽出にSVDやPCAが限定的ながら役立つことを述べた。NNLSを含め、成分候補が非負の条件の下で選び出される状況にあって、こうした分散的手法と相補的に相関解析を行う方法が考えられる。すなわち、ライブラリの中のデータと測定データをベクトルとして扱い、様々な距離空間で方向の一致度(主にはコサイン距離)から類似性を議論することが回帰の妥当性を考える上で有用になる。正準相関解析を図2に概念的に示す。
非負最小二乗(NNLS)の項では、ライブラリからの確からしいデータ抽出にSVDやPCAが限定的ながら役立つことを述べた。NNLSを含め、成分候補が非負の条件の下で選び出される状況にあって、こうした分散的手法と相補的に相関解析を行う方法が考えられる。すなわち、ライブラリの中のデータと測定データをベクトルとして扱い、様々な距離空間で方向の一致度(主にはコサイン距離)から類似性を議論することが回帰の妥当性を考える上で有用になる。正準相関解析を図2に概念的に示す。
ベクトルxとベクトルyの相関を考えるとき、単純に距離を計算することは、従来の赤外吸収分光解析ソフトを含めて多くの場合でみられる。しかし、様々なベクトルxを含むベクトル群x(ドット)に対する相関を考え、比較をすることを考えると距離の計算に汎化が必要になる。つまり多くの汎用スペクトル測定の信号強度は相対値であるため、何らかの基準を設定しなくてはならない。これが、本タスクにおける正準相関(カノニカルな類似度)の導入の動機である。すなわちライブラリのデータ源は様々であるから、絶対的な基準を設定することはできない。そこで、代替として、ベクトルxとベクトルyをそれぞれベクトルuとベクトルvに写像し、ベクトルuとベクトルvの相関が最大になるように写像を決める(図2)。
正準相関解析(CCA)のタスクは、次のように数学的に定式化できる。
を最大化することを意味し、この式と等価なコサイン類似度との類推からわかるように写像後のベクトルのなす角を最小にすることになる。この考え方は、まさに非負最小二乗(NNLS)の直行成分最大の考え方と相補的であり、本発明において正準相関解析(CCA)を非負最小二乗(NNLS)とは別指標として導入した数理的な説明となる。
を最大化することを意味し、この式と等価なコサイン類似度との類推からわかるように写像後のベクトルのなす角を最小にすることになる。この考え方は、まさに非負最小二乗(NNLS)の直行成分最大の考え方と相補的であり、本発明において正準相関解析(CCA)を非負最小二乗(NNLS)とは別指標として導入した数理的な説明となる。
<対数正準相関解析(L−CCA、 Logarithmic CCA)>
正準相関解析(CCA)の項では線形写像を想定したが、より一般的にはカーネルを用いた非線形写像[例えば、赤穂昭太郎、カーネル多変量解析―非線形データ解析の新しい展開―岩波書店(2008)参照]もあり得る。本研究ではこうしたカーネル多変量解析までは行わないが、xとyの対数を取った後に線形写像する、広い意味での非線形写像を行う(図3)。このカーネルを用いない非線形写像は、カーネル多変量解析においてよく見られる過学習を避けることができ、通常その回避策として用いられている正則化項を省くことができる。これにより、ハイパーパラメータに左右されることなく相関解析が可能になる。そもそも対数をとることは、より相関性を高めるという目的ではなく、線形の場合より微細ピークを拡大し、微小な混合成分を強調可視化する効果を狙ったためで、正則化項を入れるほどの過学習の要素にならないという効果がある。
正準相関解析(CCA)の項では線形写像を想定したが、より一般的にはカーネルを用いた非線形写像[例えば、赤穂昭太郎、カーネル多変量解析―非線形データ解析の新しい展開―岩波書店(2008)参照]もあり得る。本研究ではこうしたカーネル多変量解析までは行わないが、xとyの対数を取った後に線形写像する、広い意味での非線形写像を行う(図3)。このカーネルを用いない非線形写像は、カーネル多変量解析においてよく見られる過学習を避けることができ、通常その回避策として用いられている正則化項を省くことができる。これにより、ハイパーパラメータに左右されることなく相関解析が可能になる。そもそも対数をとることは、より相関性を高めるという目的ではなく、線形の場合より微細ピークを拡大し、微小な混合成分を強調可視化する効果を狙ったためで、正則化項を入れるほどの過学習の要素にならないという効果がある。
<部分正準相関解析(P−CCA, Partial CCA)>
赤外吸収分光においては、特に注目すべき波数領域を選択的にみる、あるいは検出器の感度効率の違いやサンプルの自己吸収などにより特別な波数領域を補正する必要がある場合が多い。こうした、実際的な現象に対応するために、特定の波数を切り出すROI(Region of Interest)を行い、ROI範囲内と外に別々に正準相関解析を行うP−CCAを導入する。図4に示す通り、(x、y)と(x’、y’)領域に分けて、それぞれについて線形写像を行う。ここで、結果的に式(6)のρは一つのスペクトルに対して複数出てくるため、見かけ上は類似度の指標が増えることになる。今回の場合は領域を二分する為、指標は二つになる(図4右側参照)。
ここで、指標(character)とは、数学、特に群論に用いられる概念に類似するものであるが、直交性が保証されていない点で、厳密には群論の指標と相違している。群の表現の指標は,群の各元に対応する行列のトレースを対応させる写像である。指標は表現の本質的な情報をより凝縮された形で持っている。Vを体F上の有限次元ベクトル空間とし,ρ:G→GL(V)を群GのV上の表現とする。ρの指標(character)とは、次の式(7)で表される関数である。
ただしTrはトレースである。
赤外吸収分光においては、特に注目すべき波数領域を選択的にみる、あるいは検出器の感度効率の違いやサンプルの自己吸収などにより特別な波数領域を補正する必要がある場合が多い。こうした、実際的な現象に対応するために、特定の波数を切り出すROI(Region of Interest)を行い、ROI範囲内と外に別々に正準相関解析を行うP−CCAを導入する。図4に示す通り、(x、y)と(x’、y’)領域に分けて、それぞれについて線形写像を行う。ここで、結果的に式(6)のρは一つのスペクトルに対して複数出てくるため、見かけ上は類似度の指標が増えることになる。今回の場合は領域を二分する為、指標は二つになる(図4右側参照)。
ここで、指標(character)とは、数学、特に群論に用いられる概念に類似するものであるが、直交性が保証されていない点で、厳密には群論の指標と相違している。群の表現の指標は,群の各元に対応する行列のトレースを対応させる写像である。指標は表現の本質的な情報をより凝縮された形で持っている。Vを体F上の有限次元ベクトル空間とし,ρ:G→GL(V)を群GのV上の表現とする。ρの指標(character)とは、次の式(7)で表される関数である。
ただしTrはトレースである。
<成分分離アルゴリズム>
以上説明した4つの指標(NNLS、CCA、L−CCA、P−CCA)を使って、赤外線吸収スペクトルの成分分離を行うアルゴリズムを提唱する。非負最小二乗(NNLS)と正準相関解析(CCA)の項で説明した通り、NNLSとCCAが相補的であることを考慮すると、大きく分けるとCCA、L−CCA、P−CCAは正準相関系にグルーピングできる。NNLSが絶対直交空間での分散最小であるのに対し、正準相関系が相対直交成分の分散最小となる。この二系列を並列処理する方法(図5)と直列処理する方法(図6)の二つを考える。
以上説明した4つの指標(NNLS、CCA、L−CCA、P−CCA)を使って、赤外線吸収スペクトルの成分分離を行うアルゴリズムを提唱する。非負最小二乗(NNLS)と正準相関解析(CCA)の項で説明した通り、NNLSとCCAが相補的であることを考慮すると、大きく分けるとCCA、L−CCA、P−CCAは正準相関系にグルーピングできる。NNLSが絶対直交空間での分散最小であるのに対し、正準相関系が相対直交成分の分散最小となる。この二系列を並列処理する方法(図5)と直列処理する方法(図6)の二つを考える。
図5の並列処理では、以下の処理を行う。
(か)NNLSによって成分候補を抽出する。ここで有効な成分候補は、例えば3%以上の回帰係数を持つものとする。この回帰係数のしきい値はX線回折の事例検討から定めたもので、好ましくは1%、2%、又は5%以上の回帰係数を持つものであってもよい。
(き)並行して正準相関系の評価を行う。確からしい候補として、CCA、L−CCA、P−CCAの各指標で確からしい上位3位までを各々求め、合計12個の候補を選び出す。なお、確からしい候補の選定数は、この数値例に限定されるものではなく、例えばCCA、L−CCA、P−CCAの各指標で確からしい上位2位までや4位までを各々求め、合計8個又は16個の候補を選び出してもよい。
(く)正準相関系については、例えばバックグラウンドの強度分布がよく似ている場合に候補と誤認識する傾向があり、こうしたものはスクリーニングする。
(け)NNLSとスクリーニングされた正準相関系の候補を照らし合わせ、両方に含まれるものを抽出する。
(こ)上記(か)〜(け)によって選別されたものを予測結果とする。
(か)NNLSによって成分候補を抽出する。ここで有効な成分候補は、例えば3%以上の回帰係数を持つものとする。この回帰係数のしきい値はX線回折の事例検討から定めたもので、好ましくは1%、2%、又は5%以上の回帰係数を持つものであってもよい。
(き)並行して正準相関系の評価を行う。確からしい候補として、CCA、L−CCA、P−CCAの各指標で確からしい上位3位までを各々求め、合計12個の候補を選び出す。なお、確からしい候補の選定数は、この数値例に限定されるものではなく、例えばCCA、L−CCA、P−CCAの各指標で確からしい上位2位までや4位までを各々求め、合計8個又は16個の候補を選び出してもよい。
(く)正準相関系については、例えばバックグラウンドの強度分布がよく似ている場合に候補と誤認識する傾向があり、こうしたものはスクリーニングする。
(け)NNLSとスクリーニングされた正準相関系の候補を照らし合わせ、両方に含まれるものを抽出する。
(こ)上記(か)〜(け)によって選別されたものを予測結果とする。
一方で、図6の直列処理では、以下の処理を行う。
(さ)並列処理の(か)と同様に、NNLSによって成分候補を抽出する。ここで有効な成分候補は、例えば3%以上の回帰係数を持つものとする。
(し)NNLSによって得られた成分候補を、正準相関系のいずれかで評価し、並列の場合と同様に、明らかに誤認識しているものをスクリーニングする。
(す)上記(さ)〜(し)によって選別されたものを予測結果とする。
直列処理の場合は、正準相関系は単にスクリーニングのしやすさのための処理であり、成分候補抽出の主要な役割はNNLSが担う。
(さ)並列処理の(か)と同様に、NNLSによって成分候補を抽出する。ここで有効な成分候補は、例えば3%以上の回帰係数を持つものとする。
(し)NNLSによって得られた成分候補を、正準相関系のいずれかで評価し、並列の場合と同様に、明らかに誤認識しているものをスクリーニングする。
(す)上記(さ)〜(し)によって選別されたものを予測結果とする。
直列処理の場合は、正準相関系は単にスクリーニングのしやすさのための処理であり、成分候補抽出の主要な役割はNNLSが担う。
以下、図面を用いて本発明を説明する。
図7は、本発明の一実施例を示す赤外線吸収分光装置用の成分同定装置の説明図で、非負線形回帰と正準相関解析を並列に処理する場合を示している。
赤外線吸収分光装置用の成分同定装置は、測定対象となる試料10、赤外線分光光度計20、測定データ前処理部32、成分同定演算装置40で構成されている。また、赤外線分光光度計20で測定されたスペクトル測定データ30と、校正や成分同定に必要な標準物質組成のスペクトルライブラリ34を有している。ここで、スペクトル測定データ30やスペクトルライブラリ34は、赤外線分光光度計20のスペクトル測定領域に応じて、周波数、波長、波数、又はエネルギによって定義される。
図7は、本発明の一実施例を示す赤外線吸収分光装置用の成分同定装置の説明図で、非負線形回帰と正準相関解析を並列に処理する場合を示している。
赤外線吸収分光装置用の成分同定装置は、測定対象となる試料10、赤外線分光光度計20、測定データ前処理部32、成分同定演算装置40で構成されている。また、赤外線分光光度計20で測定されたスペクトル測定データ30と、校正や成分同定に必要な標準物質組成のスペクトルライブラリ34を有している。ここで、スペクトル測定データ30やスペクトルライブラリ34は、赤外線分光光度計20のスペクトル測定領域に応じて、周波数、波長、波数、又はエネルギによって定義される。
試料10は、成分同定の対象となる被測定試料で、典型的には液体溶媒に溶ける固体や粉体、液体溶媒と混和する液体、および気体がある。成分同定の対象となる組成物質として、特に有機分子は、ほとんど赤外線領域に吸収を持つため赤外線吸収分光装置で高感度に検出できる。そこで、被測定試料の成分同定は、化学原料の品質確認、汚染物質の同定や環境モニター、薄膜分析、食品や清浄度が要求される製品への異物混入検査として重要である。
赤外線分光光度計20は、赤外線光源22、試料収容部24、分光器26、検出器28で構成される。赤外線分光光度計20には、回折格子を用いた分散型赤外分光光度計やフーリエ変換型赤外分光(FT−IR:Fourier transform infrared spectrometer)がある。FTIR分光計は、中赤外および近赤外領域の測定に主に使用される。
赤外線光源22は、遠赤外線、中赤外線及び近赤外線の3領域に応じて使い分けられる。遠赤外線、特に50μm(200cm−1)を超える波長では、水銀放電ランプが用いられる。中赤外領域は、2〜25μm(5000〜400cm−1)の波長領域で、最も一般的な光源は約1200Kに加熱された炭化ケイ素(SiC)を用いたグローバ光源である。グローバ光源は黒体輻射に近いスペクトル分布を有している。近赤外領域は、1〜2.5μm(10000〜4000cm−1)の短波長領域で、例えばタングステンハロゲンランプが用いられる。
赤外線光源22は、遠赤外線、中赤外線及び近赤外線の3領域に応じて使い分けられる。遠赤外線、特に50μm(200cm−1)を超える波長では、水銀放電ランプが用いられる。中赤外領域は、2〜25μm(5000〜400cm−1)の波長領域で、最も一般的な光源は約1200Kに加熱された炭化ケイ素(SiC)を用いたグローバ光源である。グローバ光源は黒体輻射に近いスペクトル分布を有している。近赤外領域は、1〜2.5μm(10000〜4000cm−1)の短波長領域で、例えばタングステンハロゲンランプが用いられる。
試料収容部24は、被測定試料20を収容するもので、被測定試料20は液体溶媒に溶けるか混和されるが、これに限定されるものではない。試料収容部24に、赤外線光源22から放射される赤外線を透過する測定窓部25を設けると良い。また、参照試料収容部を試料収容部24と並列に設けて、赤外線光源22から放射される赤外線をビームスピリッタで2分割して、赤外線光源22から放射される赤外線のドリフトの影響を控除するとよい。
分光器26は、分散型赤外分光光度計に用いられるもので、例えば回折格子を用いる。分散型赤外分光光度計では、試料10を透過した後の光を回折格子により分散させ、各波長を順次検出器28で検出する。一般的には参照試料収容部を設けたダブルビーム方式になっており、リアルタイムでバックグラウンド補正する。これに対して、フーリエ変換型赤外分光では、分光器に代えて干渉計を使用し、検出器により干渉パターン(インターフェログラム)を観測する。インターフェログラムについて、コンピュータ上でフーリエ変換を行い、各波長成分を計算する。
検出器28は、主として半導体型のテルル化カドミウム水銀(HgCdTe)検出器または焦電型の硫酸トリグリシン(Triglycine sulfate)検出器が用いられる。テルル化カドミウム水銀検出器は暗い赤外光(5000〜650cm−1)を高感度に検出するのに適しており、液体窒素温度で動作する。一方、硫酸トリグリシン検出器は室温で動作し、明るい赤外光を大きなダイナミックレンジで測定(7800〜350cm−1)するのに適している。このため、透過率や反射率の高い試料を測定するには硫酸トリグリシン検出器が向いており、逆に外部反射法や多重反射型減衰全反射法(attenuated total reflection, ATR)の測定にはテルル化カドミウム水銀検出器が適していることが多い。
また近赤外光にはInGaAsやPbSeなどの検出器が対応しており、12500〜3800cm−1を検出する。
また近赤外光にはInGaAsやPbSeなどの検出器が対応しており、12500〜3800cm−1を検出する。
スペクトル測定データ30は、赤外線分光光度計20によって測定された試料10に対するスペクトル測定データである。
スペクトルライブラリ34は、組成元素や化合物の組成が既知の標準物質に対する赤外線分光光度計20によって測定される領域の標準スペクトルデータが記憶されたものである。
測定データ前処理部32は、測定スペクトルデータ30の強度を規格化する。規格化とは、測定スペクトルデータの回帰演算や相関解析において、演算データが発散したり、データの桁数不足からアンダーフローするのを防止するために行う。併せて、測定データ前処理部32は、測定スペクトルデータ30を、標準スペクトルデータ34とデータ形式が合うように、変換している。
スペクトルライブラリ34は、組成元素や化合物の組成が既知の標準物質に対する赤外線分光光度計20によって測定される領域の標準スペクトルデータが記憶されたものである。
測定データ前処理部32は、測定スペクトルデータ30の強度を規格化する。規格化とは、測定スペクトルデータの回帰演算や相関解析において、演算データが発散したり、データの桁数不足からアンダーフローするのを防止するために行う。併せて、測定データ前処理部32は、測定スペクトルデータ30を、標準スペクトルデータ34とデータ形式が合うように、変換している。
成分同定演算装置40は、非負線形回帰演算部42、統括正準相関解析部44、しきい値設定部46、予測物質候補抽出部48を有している。成分同定演算装置40は、赤外線分光光度計20で収集した測定スペクトルデータから、被測定対象物10の組成元素や化合物を推定する機能を有するもので、例えば、コンピューティング装置が用いられると共に、そのコンピュータプログラム製品であるソフトウェアによって、成分同定演算装置40の機能が実現される。このコンピューティング装置やコンピュータプログラム製品の詳細は、後で説明する。
非負線形回帰演算部42は、測定スペクトルデータ30を標準スペクトルデータ34による線形和によって回帰し、対応する回帰係数の演算を行うと共に、この回帰係数が一定の値以上の回帰係数を抽出する。具体的な演算内容は、非負線形回帰演算としての非負最小二乗(NNLS)の項で説明した通りである。
第1候補リスト432は、正準相関解析部442で抽出された標準スペクトルデータを被測定対象物10の組成元素や化合物の候補物質として掲載したものである。
第1候補リスト432は、正準相関解析部442で抽出された標準スペクトルデータを被測定対象物10の組成元素や化合物の候補物質として掲載したものである。
統括正準相関解析部44は、正準相関解析部442、対数正準相関解析部444、部分正準相関解析部446を有している。正準相関解析部442は、測定スペクトルデータ30及び標準スペクトルデータ34について、正準相関解析から類似度を計算して、当該類似度の絶対値が大きな値の標準スペクトルデータを抽出する。具体的な演算内容は、正準相関解析(CCA)の項で説明した通りである。
対数正準相関解析部444は、測定スペクトルデータ30及び標準スペクトルデータ34について、スペクトル強度の対数について正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する。具体的な演算内容は、対数正準相関解析(L−CCA)の項で説明した通りである。
対数正準相関解析部444は、測定スペクトルデータ30及び標準スペクトルデータ34について、スペクトル強度の対数について正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する。具体的な演算内容は、対数正準相関解析(L−CCA)の項で説明した通りである。
部分正準相関解析部446は、測定スペクトルデータ30及び標準スペクトルデータ34について、部分的に切り出したスペクトルデータについて正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する。具体的な演算内容は、部分正準相関解析(P−CCA)の項で説明した通りである。当該類似度の絶対値に基づきとは、例えば類似度の絶対値が大きな値の標準スペクトルデータを大きい順に抽出してもよく、また相関性の低いノイズデータを排除するためのしきい値を超えるものに限定してもよい。
部分的に切り出したスペクトルデータの領域は、スペクトルデータの上限値と下限値によって定められるとよい。ここで、スペクトルデータの領域は、周波数、波長、波数、又はエネルギによって定義されるので、この定義に応じて上限値と下限値を定めるとよい。
部分的に切り出したスペクトルデータの領域は、スペクトルデータの上限値と下限値によって定められるとよい。ここで、スペクトルデータの領域は、周波数、波長、波数、又はエネルギによって定義されるので、この定義に応じて上限値と下限値を定めるとよい。
しきい値設定部46は、正準相関解析部442、対数正準相関解析部444、又は部分正準相関解析部446において、第2候補リスト448に掲載する基準となる候補物質に対する第2のしきい値を設定する。抽出される当該類似度の絶対値が大きな値の標準スペクトルデータは、第2のしきい値よりも大きな類似度を有するとよい。第2のしきい値よりも小さな類似度を有する標準スペクトルデータに対応する候補物質は、試料10の組成物質である蓋然性は低くなる。なお、しきい値設定部46に設定される第2のしきい値は、正準相関解析から計算される類似度の値でもよく、また第2候補リスト448に掲載される候補物質の上限数でもよい。この上限数は、例えば3個以内とするが、例えば5個以内の適宜の数量でもよい。
第2候補リスト448では、しきい値設定部46で設定された第2のしきい値に従って、正準相関解析部442、対数正準相関解析部444、又は部分正準相関解析部446において類似度の計算された標準物質について、類似度の高い順に試料10の組成物質である蓋然性が高い標準物質として掲載される。この場合、第2候補リスト448では、正準相関解析部442、対数正準相関解析部444、及び部分正準相関解析部446の3類型について区分けして候補物質を掲載してもよく、また正準相関解析部442、対数正準相関解析部444、及び部分正準相関解析部446のうち任意の2類型を抽出して、区分けして候補物質を掲載してもよい。また、任意の1類型を抽出して、候補物質を掲載してもよい。
予測物質候補抽出部48は、第1候補リスト432と第2候補リスト448に掲載された候補物質の中から、当該予測物質候補の選出頻度から、被測定試料10の組成として真の含有物質を推定する。この場合、第2候補リスト448が、正準相関解析部442、対数正準相関解析部444、及び部分正準相関解析部446の3類型について類似度を計算し、第2のしきい値を上回る候補物質をこの3類型について各々掲載している場合は、当該予測物質候補の選出頻度は最大4回となる。
なお、測定スペクトルデータ30と特定の標準スペクトルデータ34についての回帰係数や計算された類似度が非常に高く、当該特定標準物質が試料10の組成物質である蓋然性が非常に高い場合もあり得る。そこで、成分同定演算装置40では、予測物質候補抽出部48に掲載する予測物質候補として、第1候補リスト432又は第2候補リスト448に掲載された予測物質候補をそのまま予測物質候補としてもよい。このように構成すると、第1候補リスト432又は第2候補リスト448の一方のみを作成すれば足りるので、成分同定演算装置40の演算負荷が少なくて済む。
なお、測定スペクトルデータ30と特定の標準スペクトルデータ34についての回帰係数や計算された類似度が非常に高く、当該特定標準物質が試料10の組成物質である蓋然性が非常に高い場合もあり得る。そこで、成分同定演算装置40では、予測物質候補抽出部48に掲載する予測物質候補として、第1候補リスト432又は第2候補リスト448に掲載された予測物質候補をそのまま予測物質候補としてもよい。このように構成すると、第1候補リスト432又は第2候補リスト448の一方のみを作成すれば足りるので、成分同定演算装置40の演算負荷が少なくて済む。
このように構成された赤外線吸収分光装置用の成分同定装置の動作を説明する。図8は、図7に示す装置の成分同定アルゴリズムの説明図である。ここでは、赤外線分光光度計20で測定したデータをリアルタイムで成分同定装置により同定する場合を示しているが、測定作業と同定演算作業はオフラインとして、バッチ処理してもよいことは言うまでもない。
まず、赤外線分光光度計20の試料収容部24に、被測定対象試料10をセットする(S800)。次に、赤外線分光光度計20の光源部22から赤外線を試料収容部24に照射し、透過光又は反射光が分光器26(又は干渉計)をへて検出器28にはいり、被測定対象試料10の赤外線スペクトルが、測定スペクトルデータ30として、測定される(S805)。
成分同定装置は、測定された赤外線スペクトルデータを、測定スペクトルデータ30として、読込む(S810)。また、スペクトルライブラリにアクセスして、組成既知の標準物質について、標準スペクトルデータ34を読込む(S815)。
成分同定装置は、測定された赤外線スペクトルデータを、測定スペクトルデータ30として、読込む(S810)。また、スペクトルライブラリにアクセスして、組成既知の標準物質について、標準スペクトルデータ34を読込む(S815)。
成分同定装置は、測定スペクトルデータ30について、測定データ前処理部32で前処理を行い、成分同定演算装置40で統計処理しやすい態様に変換する(S820)。好ましくは、測定データ前処理部32で、測定スペクトルデータ30を、標準スペクトルデータ34とデータ形式が合うように、変換するとよい。
成分同定演算装置40では、非負線形回帰演算部42において、測定スペクトルデータ30を標準スペクトルデータ34について非負線形回帰演算をし、第1の予測物質候補リストとしての第1候補リスト432を作成する(S825)。また、成分同定演算装置40では、正準相関解析部442において、測定スペクトルデータ30と標準スペクトルデータ34についての正準相関解析をし、第2の予測物質候補リストとしての第2候補リスト448を作成する(S830)。正準相関解析部442による正準相関解析に代えて、対数相関解析部444による対数正準相関解析や部分正準相関解析部446による部分正準相関解析を用いてもよく、また対数正準相関解析及又は部分正準相関解析の少なくともいずれか一つを重畳して行って、類似度を計算してもよい。
成分同定演算装置40では、非負線形回帰演算部42において、測定スペクトルデータ30を標準スペクトルデータ34について非負線形回帰演算をし、第1の予測物質候補リストとしての第1候補リスト432を作成する(S825)。また、成分同定演算装置40では、正準相関解析部442において、測定スペクトルデータ30と標準スペクトルデータ34についての正準相関解析をし、第2の予測物質候補リストとしての第2候補リスト448を作成する(S830)。正準相関解析部442による正準相関解析に代えて、対数相関解析部444による対数正準相関解析や部分正準相関解析部446による部分正準相関解析を用いてもよく、また対数正準相関解析及又は部分正準相関解析の少なくともいずれか一つを重畳して行って、類似度を計算してもよい。
成分同定演算装置40では、第1候補リスト432と第2候補リスト448に掲げられた予測物質候補から、被測定試料の組成として真の含有物質を推定する(S835)。推定の方法のひとつとして、候補リストに出てくる頻度が多いものを真の含有物質とする方法が好ましい。推定態様としては、非負線形回帰演算、正準相関解析、対数正準相関解析、及び部分正準相関解の全てを演算する場合は、予測物質候補の選出頻度から、被測定試料10の組成として真の含有物質を推定するとよい。
正準相関解析、対数正準相関解析、及び部分正準相関解のうち一部を演算する場合は、非負線形回帰演算も含めた予測物質候補の選出頻度から、被測定試料10の組成として真の含有物質を推定してもよい。また、第1候補リスト432に掲載された予測物質候補のうち最大の回帰係数を有する候補物質と、第2候補リスト448に掲げられた予測物質候補のうち最大の類似度を有する候補物質を総合的に考慮して、被測定試料の組成として真の含有物質448を推定してもよい。
また、演算負荷を軽減する目的や、測定スペクトルデータ30と特定の標準スペクトルデータ34についての回帰係数や計算された類似度が非常に高く、当該特定標準物質が試料10の組成物質である蓋然性が非常に高い場合には、第1候補リスト432に掲載された予測物質候補のうち最大の回帰係数を有する候補物質、又は第2候補リスト448に掲げられた予測物質候補のうち最大の類似度を有する候補物質を被測定試料の組成として真の含有物質448を推定してもよい。
正準相関解析、対数正準相関解析、及び部分正準相関解のうち一部を演算する場合は、非負線形回帰演算も含めた予測物質候補の選出頻度から、被測定試料10の組成として真の含有物質を推定してもよい。また、第1候補リスト432に掲載された予測物質候補のうち最大の回帰係数を有する候補物質と、第2候補リスト448に掲げられた予測物質候補のうち最大の類似度を有する候補物質を総合的に考慮して、被測定試料の組成として真の含有物質448を推定してもよい。
また、演算負荷を軽減する目的や、測定スペクトルデータ30と特定の標準スペクトルデータ34についての回帰係数や計算された類似度が非常に高く、当該特定標準物質が試料10の組成物質である蓋然性が非常に高い場合には、第1候補リスト432に掲載された予測物質候補のうち最大の回帰係数を有する候補物質、又は第2候補リスト448に掲げられた予測物質候補のうち最大の類似度を有する候補物質を被測定試料の組成として真の含有物質448を推定してもよい。
図9は、図7に示す装置の成分同定演算処理部をコンピュータを用いて構成する場合の例示的なコンピューティング装置900を示すブロック図である。図7の成分同定演算装置40は、コンピューティング装置900の全部または一部を使用して実施することができる。
非常に基本的な構成901では、コンピューティング装置900は通常、1つまたは複数のプロセッサ910とシステムメモリ920とを含む。メモリバス930は、プロセッサ910とシステムメモリ920との間の通信に使用され得る。
非常に基本的な構成901では、コンピューティング装置900は通常、1つまたは複数のプロセッサ910とシステムメモリ920とを含む。メモリバス930は、プロセッサ910とシステムメモリ920との間の通信に使用され得る。
所望の構成に応じて、プロセッサ910は、マイクロプロセッサ(μP)、マイクロコントローラ(μC)、デジタル信号プロセッサ(DSP)、またはそれらの組み合わせを含むがこれらに限定されない任意のタイプのものであり得る。プロセッサ910は、レベル1キャッシュ911およびレベル2キャッシュ912などのもう1つのレベルのキャッシング、プロセッサコア913、およびレジスタ914を含むことができる。例示的なプロセッサコア913は、算術論理演算装置(ALU)、浮動小数点ユニット(FPU)、デジタル信号処理コア(DSPコア)、またはそれらの任意の組み合わせなどを含むことができる。例示的なメモリ制御部915もプロセッサ910と共に使用することができ、またはいくつかの実装形態では、メモリ制御部915はプロセッサ910の内部部分とすることができる。
所望の構成に応じて、システムメモリ920は、揮発性メモリ(RAMなど)、不揮発性メモリ(ROM、フラッシュメモリなど)、またはそれらの任意の組み合わせを含むが、これらに限定されない任意のタイプのものとすることができる。システムメモリ920は、オペレーティングシステム921、1つまたは複数のアプリケーション922、およびプログラムデータ932を含み得る。アプリケーション922は、非負線形回帰演算部42の例に従って非負線形回帰係数を計算するように構成された非負線形回帰解析923、正準相関解析部442の例に従って類似度を計算するように構成された正準相関解析部924、対数正準相関解析部444の例に従って類似度を計算するように構成された対数正準相関解析部925、及び部分正準相関解析部446の例に従って類似度を計算するように構成された部分正準相関解析部926を含み得る。
プログラムデータ932は、赤外線分光光度計20から送られた測定スペクトルデータ933、組成既知の標準物質についての標準スペクトルデータを記憶したスペクトルライブラリ934、第1候補リスト935、第2候補リスト936、予測物質候補937を含み得る。第1候補リスト935は、第1候補リスト432の項で説明した試料10の候補物質のリストである。第2候補リスト936は、第2候補リスト448の項で説明した試料10の候補物質のリストである。予測物質候補937は、予測物質候補抽出部48の項で説明した機能によって、作成された試料10の予測物質候補リストである。
コンピューティング装置900は、追加の特徴または機能性、および基本構成901と任意の必要な装置およびインターフェースとの間の通信を容易にするための追加のインターフェースを有することができる。例えば、バス/インターフェース制御部940を使用して、ストレージインターフェースバス941を介した基本構成901と1つまたは複数のデータ記憶装置950との間の通信を容易にすることができる。データ記憶装置950は、取り外し可能な記憶装置951、取り外しができない記憶装置952、またはそれらの組み合わせである。取り外し可能な記憶装置および取り外しができない記憶装置の例には、フレキシブルディスクドライブおよびハードディスクドライブ(HOD)などの磁気ディスク装置、コンパクトディスク(CD)ドライブまたはデジタル多用途ディスク(DVD)ドライブなどの光ディスクドライブ、ソリッドステートドライブ(SSD)、テープドライブが含まれる。例示的なコンピュータ記憶媒体は、コンピュータ可読命令、データ構造、プログラムモジュール、または他のデータなどの情報を記憶するための任意の方法または技術で実施される揮発性および不揮発性、取り外し可能および固定の媒体を含み得る。
システムメモリ920、取外し可能記憶装置951、および固定記憶装置952はすべてコンピュータ記憶媒体の例である。コンピュータ記憶媒体は、RAM、ROM、EEPROM、フラッシュメモリまたは他のメモリ技術、CDROM、デジタル多用途ディスク(DVD)または他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置を含むがこれらに限定されない。所望の情報を格納するために使用され得、かつコンピューティング装置900によってアクセスされ得る任意のそのようなコンピュータ記憶媒体は、デバイス900の一部であり得る。
また、コンピューティング装置900はバス/インターフェース制御部940を介して様々なインターフェース装置(例えば、出力インターフェース、周辺インターフェース、および通信インターフェース)から基本構成901への通信を容易にするためのインターフェースバス942を含むことができる。
出力デバイス960では、画像処理ユニット961および音声処理ユニット962が、1つまたは複数のAVポート963を介して表示装置992またはスピーカなどの様々な外部装置と通信するように構成され得る。
出力デバイス960では、画像処理ユニット961および音声処理ユニット962が、1つまたは複数のAVポート963を介して表示装置992またはスピーカなどの様々な外部装置と通信するように構成され得る。
例示的な周辺インターフェース970は、入力装置(例えば、キーボード、マウス、ペン、音声入力装置、タッチ入力装置など)のような外部装置と通信するように構成され得るシリアルインターフェース制御部971またはパラレルインターフェース制御部972を含む。周辺インターフェース970は、I/Oポート973を介して赤外線分光光度計20と通信するように構成され得る。
例示的な通信装置980は、ネットワーク制御部981を含み、ネットワーク制御部981は、1つまたは複数の通信ポート982を介したネットワーク通信リンクを介して、1つまたは複数の他のコンピューティング装置990との通信を容易にするように構成されてもよい。
例示的な通信装置980は、ネットワーク制御部981を含み、ネットワーク制御部981は、1つまたは複数の通信ポート982を介したネットワーク通信リンクを介して、1つまたは複数の他のコンピューティング装置990との通信を容易にするように構成されてもよい。
ネットワーク通信リンクは、通信媒体の一例であり得る。 通信媒体は、通常、コンピュータ可読命令、データ構造、プログラムモジュール、または搬送波もしくは他の搬送機構などの変調データ信号内の他のデータによって具現化することができ、任意の情報配信媒体を含むことができる。「変調データ信号」は、信号内に情報を符号化するような方法で設定または変更されたその特性のうちの1つまたは複数を有する信号であり得る。限定ではなく例として、通信媒体は、有線ネットワークまたは直接配線接続などの有線媒体、ならびに音響、無線周波数(RF)、マイクロ波、赤外線(IR)および他の無線媒体などの無線媒体を含み得る。本明細書で使用されるコンピュータ可読媒体という用語は、記憶媒体と通信媒体の両方を含み得る。
コンピューティング装置900は、携帯電話、パーソナルデータアシスタント(PDA)、パーソナルメディアプレーヤデバイス、ワイヤレスウェブウォッチデバイス、パーソナルコンピュータなどのスモールフォームファクタポータブル(またはモバイル)電子デバイス、上記の機能のいずれかを含むヘッドセットデバイス、特定用途向けデバイス、またはハイブリッドデバイスの一部として実装され得る。コンピューティング装置900はまた、ラップトップコンピュータ構成および非ラップトップコンピュータ構成の両方を含むパーソナルコンピュータとして実装され得る。
図10は図9に示す機能ブロックを有するコンピュータのためのソフトウェアの機能ブロック図で、例示的なコンピュータプログラム製品1000を示している。プログラム担持媒体1002は、コンピュータ読取可能媒体1006、記録可能媒体1008、通信媒体1009、またはそれらの組み合わせとして実装することができるもので、処理ユニットのすべてまたは一部の処理を実行するように構成することができるプログラム命令格納部1004を有する。
プログラム命令格納部1004に格納されたプログラム命令は、例えば、被測定試料10の測定スペクトルデータ30を読込む機能(1010)、組成既知の標準物質について、スペクトル分析装置で測定するスペクトルデータに対応する態様の、標準スペクトルデータ34を読込む機能(1020)、測定スペクトルデータ30の強度を規格化する前処理部(1025)を有する。更に、測定スペクトルデータ30を標準スペクトルデータ34について線形和によって回帰し、対応する回帰係数の演算を行う非負線形回帰演算部(1030)を有する。非負線形回帰演算部(1030)では、この回帰係数が非負であって、絶対値が一定値以上の回帰係数をもつ標準スペクトルを抽出する。
また、プログラム命令格納部1004に格納されたプログラム命令は、例えば、測定スペクトルデータ30及び標準スペクトルデータ34について、正準相関解析から類似度を計算して、当該類似度の絶対値が大きな値の標準スペクトルデータを抽出する正準相関解析部(1035)を有する。正準相関解析に代えて、対数正準相関解析や部分正準相関解析でもよく、また正準相関解析、対数正準相関解析、又は部分正準相関解析の少なくともいずれか一つを重畳して行ってもよい。そして、非負線形回帰演算部と正準相関解析部で抽出した予測物質候補リストから、被測定試料の組成として選定する機能(1040)を有する。
図11は、本発明の他の実施例を示す赤外線吸収分光装置用の成分同定装置の説明図で、非負線形回帰と正準相関解析を直列に処理する場合を示している。なお、図11において、前出の図7の構成要素と同一作用をするものには同一符号を付して、説明を省略する。図11では、図7の第1候補リスト432に代えて予備的候補リスト43、図7の第2候補リスト448と予測物質候補抽出部48に代えて予測物質候補リスト47が設けられている。この実施例では、非負線形回帰演算部42で選定された予測物質候補に対して、正準相関解析部442、対数正準相関解析部444、又は部分正準相関解析部446の少なくともいずれか一つで選定される予測物質候補に絞り込むように構成されたものである。
なお、図7で示したしきい値設定部46は、図11では非負線形回帰と正準相関解析を直列に処理する構成としているので、図11の成分同定装置では設けていない。
なお、図7で示したしきい値設定部46は、図11では非負線形回帰と正準相関解析を直列に処理する構成としているので、図11の成分同定装置では設けていない。
予備的候補リスト43は、非負線形回帰演算部42で抽出された、測定スペクトルデータ30及び標準スペクトルデータ34についての非負回帰係数を有する標準スペクトルデータに対応する標準物質が掲載されたものである。この予備的候補リスト43に掲載される候補物質の数は、例えば3個以内とするが、例えば5個以内の適宜の数量でもよい。また掲載基準となる第1のしきい値を定めて、この第1のしきい値以上の回帰係数を有する標準スペクトルデータを、第1候補リスト432に掲載してもよい。
予測物質候補リスト47は、予備的候補リスト43に掲載された予測物質候補に対して、正準相関解析部442、対数正準相関解析部444、又は部分正準相関解析部446の少なくともいずれか一つで選定される予測物質候補に絞り込んで、掲載したものである。
予測物質候補リスト47は、予備的候補リスト43に掲載された予測物質候補に対して、正準相関解析部442、対数正準相関解析部444、又は部分正準相関解析部446の少なくともいずれか一つで選定される予測物質候補に絞り込んで、掲載したものである。
図12は、図11に示す装置の成分同定アルゴリズムの説明図である。なお、図12において、前出の図8の成分同定アルゴリズムの機能ブロックと同一作用をするものには同一符号を付して、説明を省略する。
成分同定演算装置40では、非負線形回帰演算部42において、赤外線スペクトルデータ30を標準スペクトルデータ34について非負線形回帰演算をし、予備的候補リスト43を作成する(S840)。
成分同定演算装置40では、非負線形回帰演算部42において、赤外線スペクトルデータ30を標準スペクトルデータ34について非負線形回帰演算をし、予備的候補リスト43を作成する(S840)。
次に、正準相関解析部442において、赤外線スペクトルデータ30と標準スペクトルデータ34についての正準相関解析をし、当該類似度の絶対値に基づき標準スペクトルデータを抽出する(S845)。正準相関解析部442による正準相関解析に代えて、対数相関解析部444による対数正準相関解析や部分正準相関解析部446による部分正準相関解析を用いてもよく、また対数正準相関解析及又は部分正準相関解析の少なくともいずれか一つを重畳して行って、類似度を計算してもよい。
予測物質候補リスト工程では、絞り込んだ結果をもとに予測物質候補を絞りこみ、予測物質候補リスト47を作成して、被測定試料の組成として推定される真の含有物質とする(S850)。これによって、成分同定演算装置40では、予測物質候補リスト47で予測物質候補をスクリーニングし、予備的候補リスト43から被測定試料10の組成として真の含有物質を推定する。推定の方法のひとつとして、計算された類似度が高いものを優先して真の含有物質と推定する方法がある。
予測物質候補リスト工程では、絞り込んだ結果をもとに予測物質候補を絞りこみ、予測物質候補リスト47を作成して、被測定試料の組成として推定される真の含有物質とする(S850)。これによって、成分同定演算装置40では、予測物質候補リスト47で予測物質候補をスクリーニングし、予備的候補リスト43から被測定試料10の組成として真の含有物質を推定する。推定の方法のひとつとして、計算された類似度が高いものを優先して真の含有物質と推定する方法がある。
図13は、図11に示す装置の成分同定演算処理部を、コンピュータを用いて構成する場合の機能ブロック図である。なお、図13において、前出の図9の構成要素と同一作用をするものには同一符号を付して、説明を省略する。
図13においては、プログラムデータ932は、予備的候補リスト938、予測物質候補リスト939を有している。予備的候補リスト938は、予測物質候補リスト47に相当するものである。予測物質候補リスト939は、正準相関解析部442による正準相関解析、対数相関解析部444による対数正準相関解析や部分正準相関解析部446による部分正準相関解析によって、計算された類似度から、標準スペクトルデータ34のある標準物質から、被測定試料10の組成として真の含有物質となりうる標準物質を候補物質としてスクリーニングされたものである。
図13においては、プログラムデータ932は、予備的候補リスト938、予測物質候補リスト939を有している。予備的候補リスト938は、予測物質候補リスト47に相当するものである。予測物質候補リスト939は、正準相関解析部442による正準相関解析、対数相関解析部444による対数正準相関解析や部分正準相関解析部446による部分正準相関解析によって、計算された類似度から、標準スペクトルデータ34のある標準物質から、被測定試料10の組成として真の含有物質となりうる標準物質を候補物質としてスクリーニングされたものである。
図14は、図13に示す機能ブロックを有するコンピュータのためのソフトウェアの機能ブロック図である。なお、図14において、前出の図10の機能ブロックと同一作用をするものには同一符号を付して、説明を省略する。
プログラム命令格納部1004に格納されたプログラム命令は、例えば、測定スペクトルデータ30及び標準スペクトルデータ34について、正準相関解析部442による正準相関解析から類似度を計算して、当該類似度の絶対値が大きな値の標準スペクトルデータを抽出する正準相関解析(1045)を有する。正準相関解析に代えて、対数正準相関解析や部分正準相関解析でもよく、また正準相関解析、対数正準相関解析、又は部分正準相関解析の少なくともいずれか一つを重畳して行ってもよい。これによって、非負線形回帰演算部42で抽出した予備的候補リスト938から、正準相関解析部442でスクリーニングして、予測物質候補リスト939に掲載された候補物質を被測定試料10の組成として選定する。
プログラム命令格納部1004に格納されたプログラム命令は、例えば、測定スペクトルデータ30及び標準スペクトルデータ34について、正準相関解析部442による正準相関解析から類似度を計算して、当該類似度の絶対値が大きな値の標準スペクトルデータを抽出する正準相関解析(1045)を有する。正準相関解析に代えて、対数正準相関解析や部分正準相関解析でもよく、また正準相関解析、対数正準相関解析、又は部分正準相関解析の少なくともいずれか一つを重畳して行ってもよい。これによって、非負線形回帰演算部42で抽出した予備的候補リスト938から、正準相関解析部442でスクリーニングして、予測物質候補リスト939に掲載された候補物質を被測定試料10の組成として選定する。
このように構成された赤外線吸収分光装置用の成分同定装置及びその方法の測定例として、図15に示す測定例がある。
赤外線吸収分光装置用の成分同定装置及びその方法に対する本発明の適用分野として、被測定試料の有機化合物の成分同定がある。有機化合物のうちNylon系は、スペクトル形状が似ているため、その成分同定が困難である。しかし、本発明のうち、赤外線吸収分光装置用の成分同定装置及びその方法では、非負線形回帰演算と正準相関解析の関係について、直列型又は並列型に依らず、良い成分同定結果を得ている。
赤外線吸収分光装置用の成分同定装置及びその方法に対する本発明の適用分野として、被測定試料の有機化合物の成分同定がある。有機化合物のうちNylon系は、スペクトル形状が似ているため、その成分同定が困難である。しかし、本発明のうち、赤外線吸収分光装置用の成分同定装置及びその方法では、非負線形回帰演算と正準相関解析の関係について、直列型又は並列型に依らず、良い成分同定結果を得ている。
評価した試料は、Nylon系試料であり、その成分と成分比を図15の第二列と三列にまとめた。これらの試料のスペクトルが、式(1)などで言うところのy(ドット)となる。市販のライブラリ、本出願人にて測定したATRまたは透過スペクトルをまとめた256スペクトルをx(ドット)とする。そして前述のアルゴリズムの下で成分を予測した。
その結果、正しく成分を予測できたものを「正」、予測できなかったものを「誤」と表記して、図15の第四列目に並列処理型(P, Parallel processing prediction)、第五列目に直列処理型(T, Tandem processing prediction)の成績をまとめる。ここにまとめたように、並列処理型では85.7%、直列処理型では85.7%が正解した。
即ち、二種類の試料(Nylon6/Nylon12=0.5/0.5、ポリカーボネート(polycarbonate)/Nylon6=0.2/0.8)について予想が外れたが、それ以外のNylon系試料では正解している。それ以外の材料を含め、同様の試験測定を繰り返し、結果をまとめたものが図15である。この表に示す通り、正答率は直列型・並列型とも86.7%であった。またNylon系を含む試料に限った正解率でも75%であった。
即ち、二種類の試料(Nylon6/Nylon12=0.5/0.5、ポリカーボネート(polycarbonate)/Nylon6=0.2/0.8)について予想が外れたが、それ以外のNylon系試料では正解している。それ以外の材料を含め、同様の試験測定を繰り返し、結果をまとめたものが図15である。この表に示す通り、正答率は直列型・並列型とも86.7%であった。またNylon系を含む試料に限った正解率でも75%であった。
他方で、市販のソフトウェアは、そもそも成分を自動で選ぶ機能がそろっていないため、単純な比較はできないが、図15よりも緩い正誤判断基準を適用した場合、例えば「含まれる候補として挙げられた上位三成分の中に、正しい二成分が含まれている割合」は25%にとどまり、本発明のアルゴリズムの正答率が極めて高いことが明らかになった。
比較例のソフトウェアの正解率が25%程度であることを考えると、きわめて良い性能が達成されたといえる。更に、本発明のアルゴリズムでは、成分数など本来分析者が知りえない情報や、サンプルの来歴から予想される混合物などを仮定していない点で、従来法の本質的改善を実現したと言える。
以上、詳細に本発明を説明したが、本発明は上記の実施例に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、当業者に自明な範囲で適宜に実施できるものである。
例えば、本実施例においては、赤外線吸収分光装置で測定する被測定試料のスペクトルデータの場合を示したが、本発明は適用対象がこれに限定されるものではなく、被測定試料のスペクトルデータが測定できるものであれば、分光分析装置、電子線エネルギ損失分光装置(EELS)、エネルギ分散X線分光装置(EDX)を搭載した走査透過電子顕微鏡(STEM)でもよい。また、分光分析装置としては、赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、又は分光蛍光光度計赤外線吸収分光装置などがある。
例えば、本実施例においては、赤外線吸収分光装置で測定する被測定試料のスペクトルデータの場合を示したが、本発明は適用対象がこれに限定されるものではなく、被測定試料のスペクトルデータが測定できるものであれば、分光分析装置、電子線エネルギ損失分光装置(EELS)、エネルギ分散X線分光装置(EDX)を搭載した走査透過電子顕微鏡(STEM)でもよい。また、分光分析装置としては、赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、又は分光蛍光光度計赤外線吸収分光装置などがある。
本発明のスペクトル解析装置用の成分同定装置及びその方法によれば、成分数など本来分析者が知りえない情報や、サンプルの来歴から予想される混合物などを仮定することなく、ほぼ正確に成分同定が可能になる。
本発明のスペクトル解析装置用の成分同定装置及びその方法のうち、特に被測定試料の有機化合物の成分同定は、化学原料の品質確認、汚染物質の同定や環境モニター、薄膜分析、食品や清浄度が要求される製品への異物混入検査として重要である。
本発明のスペクトル解析装置用の成分同定装置及びその方法のうち、特に被測定試料の有機化合物の成分同定は、化学原料の品質確認、汚染物質の同定や環境モニター、薄膜分析、食品や清浄度が要求される製品への異物混入検査として重要である。
10 被測定試料
20 赤外線分光光度計
30 測定スペクトルデータ
32 測定データ前処理部
34 スペクトルライブラリ(標準スペクトルデータ)
40 成分同定演算装置
42 非負線形回帰演算部
43 予備的候補リスト
432 第1候補リスト
44 統括正準相関解析部
442 正準相関解析部
444 対数相関解析部
446 部分正準相関解析部
448 第2候補リスト
46 しきい値設定部
47 予測物質候補リスト
48 予測物質候補抽出部
20 赤外線分光光度計
30 測定スペクトルデータ
32 測定データ前処理部
34 スペクトルライブラリ(標準スペクトルデータ)
40 成分同定演算装置
42 非負線形回帰演算部
43 予備的候補リスト
432 第1候補リスト
44 統括正準相関解析部
442 正準相関解析部
444 対数相関解析部
446 部分正準相関解析部
448 第2候補リスト
46 しきい値設定部
47 予測物質候補リスト
48 予測物質候補抽出部
Claims (23)
- 被測定試料のスペクトルデータを読込む手段と、
組成既知の標準物質について、測定スペクトルデータの測定領域及び測定態様に対応する、標準スペクトルデータを読込む手段と、
前記測定スペクトルデータの強度を規格化する前処理手段と、
前記測定スペクトルデータ及び前記標準スペクトルデータについて、スペクトルの線形和によって回帰し、対応する回帰係数の演算を行うと共に、この回帰係数が一定の値以上の回帰係数を抽出する非負線形回帰演算部と、
前記非負線形回帰演算部で抽出した標準スペクトルデータに対応する標準物質を、前記被測定試料の組成として選定する予測物質候補リスト部と、
を備えるスペクトル解析装置用の成分同定装置。 - 被測定試料のスペクトルデータを読込む手段と、
組成既知の標準物質について、測定スペクトルデータの測定領域及び測定態様に対応する、標準スペクトルデータを読込む手段と、
前記測定スペクトルデータ及び前記標準スペクトルデータについて、正準相関解析から類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する正準相関解析部と、
前記正準相関解析部で抽出した標準スペクトルデータに対応する標準物質を、前記被測定試料の組成として選定する予測物質候補リスト部と、
を備えるスペクトル解析装置用の成分同定装置。 - 前記正準相関解析部に代えて、あるいは加えて、前記測定スペクトルデータ及び前記標準スペクトルデータについて、スペクトル強度の対数について正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する対数正準相関解析部を備える請求項2に記載のスペクトル解析装置用の成分同定装置。
- 前記正準相関解析部に代えて、あるいは加えて、前記測定スペクトルデータ及び前記標準スペクトルデータについて、部分的に切り出したスペクトルデータについて正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する部分正準相関解析部を備える請求項2に記載のスペクトル解析装置用の成分同定装置。
- 前記スペクトルデータの領域は、周波数、波長、波数、又はエネルギによって定義されると共に、
前記部分的に切り出したスペクトルデータの領域は、前記スペクトルデータの上限値と下限値によって定められる請求項4に記載のスペクトル解析装置用の成分同定装置。 - 前記測定スペクトルデータ及び前記標準スペクトルデータの強度は、規格化されていることを特徴とする請求項2乃至4の何れか1項に記載のスペクトル解析装置用の成分同定装置。
- 請求項2に記載の正準相関解析部、請求項3に記載の対数正準相関解析部、または請求項4に記載の部分正準相関解析部において、当該類似度の絶対値に基づき抽出される標準スペクトルデータは、所定のしきい値よりも大きな類似度を有することを特徴とする請求項2乃至6の何れか1項に記載のスペクトル解析装置用の成分同定装置。
- 前記被測定試料のスペクトルデータは、分光分析装置、電子線エネルギ損失分光装置(EELS)、エネルギ分散X線分光装置(EDX)を搭載した走査透過電子顕微鏡(STEM)で測定されることを特徴とする請求項1乃至7の何れか1項に記載のスペクトル解析装置用の成分同定装置。
- 前記分光分析装置は、赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、又は分光蛍光光度計の何れかであることを特徴とする請求項8に記載のスペクトル解析装置用の成分同定装置。
- 請求項1に記載の非負線形回帰演算部で選定された予測物質候補に対して、請求項2乃至6の何れか1項に記載の正準相関解析部、対数正準相関解析部、または部分正準相関解析部の少なくともいずれか一つで選定される予測物質候補で絞り込むように構成されたことを特徴とするスペクトル解析装置用の成分同定装置。
- 請求項1に記載の非負線形回帰演算部で選定された第1の予測物質候補と、請求項2乃至6の何れか1項に記載の正準相関解析部、対数正準相関解析部、または部分正準相関解析部の少なくともいずれか一つで選定される第2の予測物質候補から、当該予測物質候補の選出頻度から、前記被測定試料の組成として真の含有物質を推定するように構成されたことを特徴とするスペクトル解析装置用の成分同定装置。
- 被測定試料のスペクトルデータを読込む工程と、
組成既知の標準物質について、測定スペクトルデータの測定領域及び測定態様に対応する、標準スペクトルデータを読込む工程と、
前記測定スペクトルデータの強度を規格化する前処理工程と、
前記測定スペクトルデータ及び前記標準スペクトルデータについて、スペクトルの線形和によって回帰し、対応する回帰係数の演算を行うと共に、この回帰係数が一定の値以上の回帰係数を抽出する非負線形回帰演算工程と、
前記非負線形回帰演算工程で抽出した標準スペクトルデータに対応する標準物質を、前記被測定試料の組成として予測物質候補リストとして選定する工程と、
を備えるスペクトル解析装置用の成分同定方法。 - 被測定試料のスペクトルデータを読込む工程と、
組成既知の標準物質について、測定スペクトルデータの測定領域及び測定態様に対応する、標準スペクトルデータを読込む工程と、
前記測定スペクトルデータ及び前記標準スペクトルデータについて、正準相関解析から類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する正準相関解析工程と、
前記正準相関解析工程で抽出した標準スペクトルデータに対応する標準物質を、前記被測定試料の組成として選定する予測物質候補リスト部と、
を備えるスペクトル解析装置用の成分同定方法。 - 前記正準相関解析工程に代えて、あるいは加えて、前記測定スペクトルデータ及び前記標準スペクトルデータについて、スペクトル強度の対数について正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する対数正準相関解析工程を備える請求項13に記載のスペクトル解析装置用の成分同定方法。
- 前記正準相関解析工程に代えて、あるいは加えて、前記測定スペクトルデータ及び前記標準スペクトルデータについて、部分的に切り出したスペクトルデータについて正準相関解析を用いて類似度を計算して、当該類似度の絶対値に基づき標準スペクトルデータを抽出する部分正準相関解析工程を備える請求項13に記載のスペクトル解析装置用の成分同定方法。
- 前記スペクトルデータの領域は、周波数、波長、波数、又はエネルギによって定義されると共に、
前記部分的に切り出したスペクトルデータの領域は、前記スペクトルデータの上限値と下限値によって定められる請求項15に記載のスペクトル解析装置用の成分同定方法。 - 前記測定スペクトルデータ及び前記標準スペクトルデータの強度は、規格化されていることを特徴とする請求項13乃至15の何れか1項に記載のスペクトル解析装置用の成分同定方法。
- 請求項13に記載の正準相関解析工程、請求項14に記載の対数正準相関解析工程、または請求項15に記載の部分正準相関解析工程において、当該類似度の絶対値に基づき抽出される標準スペクトルデータは、所定のしきい値よりも大きな類似度を有することを特徴とする請求項13乃至17の何れか1項に記載のスペクトル解析装置用の成分同定方法。
- 前記被測定試料のスペクトルデータは、分光分析装置、電子線エネルギ損失分光装置(EELS)、エネルギ分散X線分光装置(EDX)を搭載した走査透過電子顕微鏡(STEM)で測定されることを特徴とする請求項12乃至18の何れか1項に記載のスペクトル解析装置用の成分同定方法。
- 前記分光分析装置は、赤外分光光度計、ラマン分光光度計、紫外可視分光光度計、紫外可視近赤外分光光度計、原子吸光分光光度計、又は分光蛍光光度計の何れかであることを特徴とする請求項19に記載のスペクトル解析装置用の成分同定方法。
- さらに、請求項12に記載の非負線形回帰演算工程で選定された予測物質候補に対して、請求項13乃至17の何れか1項に記載の正準相関解析工程、対数正準相関解析工程、または部分正準相関解析工程の少なくともいずれか一つで選定される予測物質候補に絞り込む工程を有するスペクトル解析装置用の成分同定方法。
- さらに、請求項12に記載の非負線形回帰演算工程で選定された第1の予測物質候補と、請求項13乃至17の何れか1項に記載の正準相関解析工程、対数正準相関解析工程、または部分正準相関解析工程の少なくともいずれか一つで選定される第2の予測物質候補から、当該予測物質候補の選出頻度から、前記被測定試料の組成として真の含有物質を推定する工程を有するスペクトル解析装置用の成分同定方法。
- 請求項12乃至22の何れか1項に記載のスペクトル解析装置用の成分同定方法を、コンピュータに実行させるための、スペクトル解析装置用の成分同定プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019109358A JP2020201174A (ja) | 2019-06-12 | 2019-06-12 | スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム |
JP2023002084A JP7350274B2 (ja) | 2019-06-12 | 2023-01-11 | スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019109358A JP2020201174A (ja) | 2019-06-12 | 2019-06-12 | スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023002084A Division JP7350274B2 (ja) | 2019-06-12 | 2023-01-11 | スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020201174A true JP2020201174A (ja) | 2020-12-17 |
Family
ID=73744265
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019109358A Pending JP2020201174A (ja) | 2019-06-12 | 2019-06-12 | スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム |
JP2023002084A Active JP7350274B2 (ja) | 2019-06-12 | 2023-01-11 | スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023002084A Active JP7350274B2 (ja) | 2019-06-12 | 2023-01-11 | スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP2020201174A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392176A (zh) * | 2020-09-28 | 2021-09-14 | 腾讯科技(深圳)有限公司 | 文本相似性的确定方法、装置、设备及介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005512051A (ja) * | 2001-11-30 | 2005-04-28 | エクソンモービル リサーチ アンド エンジニアリング カンパニー | 特定の分析データに一致するように計算された既知物質のブレンドとして未知物質を分析し、計算されたブレンドに基づいて未知物質の特性を予測する方法 |
JP2008020386A (ja) * | 2006-07-14 | 2008-01-31 | Jeol Ltd | オージェ電子分光による化学状態分析法及び装置 |
JP2014532187A (ja) * | 2011-10-17 | 2014-12-04 | サーモ エレクトロン サイエンティフィック インストルメンツ リミテッド ライアビリティ カンパニー | 時および/または空間系列ファイルの多成分回帰/多成分分析 |
JP2015519579A (ja) * | 2012-06-15 | 2015-07-09 | デ ビアーズ センテナリー アーゲー | ダイヤモンドの赤外分析 |
JP2017502286A (ja) * | 2013-12-31 | 2017-01-19 | ベンタナ メディカル システムズ, インコーポレイテッド | ピクセルグループ化を使用して微視的画像をスペクトル純化するためのシステムおよび方法 |
CN108398416A (zh) * | 2018-01-30 | 2018-08-14 | 上海化工研究院有限公司 | 一种基于激光拉曼光谱的混合物成分测定方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3749321B2 (ja) * | 1996-10-28 | 2006-02-22 | 株式会社日立製作所 | 自動分析装置 |
EP2811300A1 (en) * | 2013-06-07 | 2014-12-10 | Roche Diagniostics GmbH | Calibration for multi-component assays |
JP6319820B2 (ja) * | 2014-03-28 | 2018-05-09 | Necソリューションイノベータ株式会社 | 属性要因分析方法、装置、およびプログラム |
CN109001181B (zh) * | 2018-08-24 | 2020-11-03 | 武汉轻工大学 | 一种拉曼光谱典型相关分析融合的食用油种类快速鉴别方法 |
-
2019
- 2019-06-12 JP JP2019109358A patent/JP2020201174A/ja active Pending
-
2023
- 2023-01-11 JP JP2023002084A patent/JP7350274B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005512051A (ja) * | 2001-11-30 | 2005-04-28 | エクソンモービル リサーチ アンド エンジニアリング カンパニー | 特定の分析データに一致するように計算された既知物質のブレンドとして未知物質を分析し、計算されたブレンドに基づいて未知物質の特性を予測する方法 |
JP2008020386A (ja) * | 2006-07-14 | 2008-01-31 | Jeol Ltd | オージェ電子分光による化学状態分析法及び装置 |
JP2014532187A (ja) * | 2011-10-17 | 2014-12-04 | サーモ エレクトロン サイエンティフィック インストルメンツ リミテッド ライアビリティ カンパニー | 時および/または空間系列ファイルの多成分回帰/多成分分析 |
JP2015519579A (ja) * | 2012-06-15 | 2015-07-09 | デ ビアーズ センテナリー アーゲー | ダイヤモンドの赤外分析 |
JP2017502286A (ja) * | 2013-12-31 | 2017-01-19 | ベンタナ メディカル システムズ, インコーポレイテッド | ピクセルグループ化を使用して微視的画像をスペクトル純化するためのシステムおよび方法 |
CN108398416A (zh) * | 2018-01-30 | 2018-08-14 | 上海化工研究院有限公司 | 一种基于激光拉曼光谱的混合物成分测定方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113392176A (zh) * | 2020-09-28 | 2021-09-14 | 腾讯科技(深圳)有限公司 | 文本相似性的确定方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
JP7350274B2 (ja) | 2023-09-26 |
JP2023033398A (ja) | 2023-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Deiss et al. | Tuning support vector machines regression models improves prediction accuracy of soil properties in MIR spectroscopy | |
JP6089345B2 (ja) | 時および/または空間系列ファイルの多成分回帰/多成分分析 | |
Huber et al. | Stability of person-specific blood-based infrared molecular fingerprints opens up prospects for health monitoring | |
Shi et al. | Soil organic carbon content estimation with laboratory-based visible–near-infrared reflectance spectroscopy: Feature selection | |
Yang et al. | Two-dimensional hetero-spectral mid-infrared and near-infrared correlation spectroscopy for discrimination adulterated milk | |
CN105008898A (zh) | 用于组合的libs和ir吸收光谱法研究的系统和方法 | |
Yang et al. | Multivariate methods for the identification of adulterated milk based on two-dimensional infrared correlation spectroscopy | |
Mishra et al. | FRUITNIR-GUI: A graphical user interface for correcting external influences in multi-batch near infrared experiments related to fruit quality prediction | |
JP7350274B2 (ja) | スペクトル解析装置用の成分同定装置及びその方法、コンピュータプログラム | |
Zhang et al. | Mixture analysis using reverse searching and non-negative least squares | |
Eliaerts et al. | Comparison of spectroscopic techniques combined with chemometrics for cocaine powder analysis | |
Zeng et al. | Mixture analysis using non‐negative elastic net for Raman spectroscopy | |
Moros et al. | New cut-off criterion for uninformative variable elimination in multivariate calibration of near-infrared spectra for the determination of heroin in illicit street drugs | |
Cappozzo et al. | Robust variable selection in the framework of classification with label noise and outliers: Applications to spectroscopic data in agri-food | |
Tan et al. | Mutual information-induced interval selection combined with kernel partial least squares for near-infrared spectral calibration | |
Zhang et al. | Transfer of a calibration model for the prediction of lignin in pulpwood among four portable near infrared spectrometers | |
Féraud et al. | Two data pre-processing workflows to facilitate the discovery of biomarkers by 2D NMR metabolomics | |
Banas et al. | Influence of spectral resolution, spectral range and signal-to-noise ratio of Fourier transform infra-red spectra on identification of high explosive substances | |
Livanos et al. | Deconvolution of petroleum mixtures using mid-FTIR analysis and non-negative matrix factorization | |
Pomerantsev et al. | Nonlinear multivariate curve resolution alternating least squares (NL‐MCR‐ALS) | |
US20180232500A1 (en) | Tiered classification and quantitation scheme for multivariate analytical data | |
Monakhova et al. | Multicomponent quantitative spectroscopic analysis without reference substances based on ICA modelling | |
Yu et al. | A weighted ensemble method based on wavelength selection for near-infrared spectroscopic calibration | |
Perez-Guaita et al. | Improving the performance of hollow waveguide-based infrared gas sensors via tailored chemometrics | |
US20220252516A1 (en) | Spectroscopic apparatus and methods for determining components present in a sample |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220318 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221129 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230530 |