JP2023149303A - Compound identification method and compound identification device - Google Patents

Compound identification method and compound identification device Download PDF

Info

Publication number
JP2023149303A
JP2023149303A JP2022057807A JP2022057807A JP2023149303A JP 2023149303 A JP2023149303 A JP 2023149303A JP 2022057807 A JP2022057807 A JP 2022057807A JP 2022057807 A JP2022057807 A JP 2022057807A JP 2023149303 A JP2023149303 A JP 2023149303A
Authority
JP
Japan
Prior art keywords
factor
sample
score
compound
decision tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022057807A
Other languages
Japanese (ja)
Inventor
勝成 藤本
Masanari Fujimoto
裕海 横田
Hiromi Yokota
雄太 阿部
Yuta Abe
智彦 川上
Tomohiko Kawakami
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kaken Co Ltd
Japan Atomic Energy Agency
Fukushima University NUC
Original Assignee
Kaken Co Ltd
Japan Atomic Energy Agency
Fukushima University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kaken Co Ltd, Japan Atomic Energy Agency, Fukushima University NUC filed Critical Kaken Co Ltd
Priority to JP2022057807A priority Critical patent/JP2023149303A/en
Publication of JP2023149303A publication Critical patent/JP2023149303A/en
Pending legal-status Critical Current

Links

Abstract

To provide a method for classifying and estimating metal elements and compounds included in an unknown sample.SOLUTION: A compound identification method of the present invention performs factorization of spectral data for a standard sample of a compound species to be assumed to derive a factor and a factor score representing the degree of influence of the factor, and learning and setting in advance a score threshold for classifying the compound species according to the factor score in a decision tree and a factor application order to apply the factor score to the decision tree, calculates a factor score in an unknown sample by using a factor of the standard sample to spectral data of the unknown sample, and classifying the factor score of the unknown sample in the decision tree by using the score threshold according to the factor application order to identify the compound species included in the unknown sample.SELECTED DRAWING: Figure 1

Description

特許法第30条第2項適用申請有り 第7回次世代イニシアティブ廃炉技術カンファレンス(NDEC-7) 2022年3月11日開催Patent Law Article 30, Paragraph 2 application filed 7th Next Generation Initiative Decommissioning Technology Conference (NDEC-7) to be held on March 11, 2022

本発明は、未知試料に含まれる金属元素や化合物を分類・推定する方法に関する。 The present invention relates to a method for classifying and estimating metal elements and compounds contained in an unknown sample.

原子力発電所の廃炉に向けて、汚染水対策、使用済燃料プールからの燃料取出し、燃料デブリ取出し、廃棄物対策などが必要である。炉心溶融した原子炉では、溶解した燃料、制御棒などが混ざり合って燃料デブリとして固化していると考えられる。制御材に炭化ホウ素(BC)を用いている原子炉では、酸化物の約2倍の硬度を持つホウ化物が生成されているため、金属、酸化物及びホウ化物を判別しながら燃料デブリを取り出すのが効率的である。なお、ホウ化物には、含有されているホウ素濃度と硬度に相関があることも確認されている。燃料デブリ取出方法の検討のため、未知試料の材料特定、材料硬度特定が必要である。また、未知試料内の材料分布、硬度分布の作成も検討されている。 In preparation for the decommissioning of nuclear power plants, countermeasures for contaminated water, fuel removal from spent fuel pools, fuel debris removal, and waste management are necessary. In a nuclear reactor with a melted core, melted fuel, control rods, etc. are thought to be mixed together and solidified as fuel debris. In nuclear reactors that use boron carbide (B 4 C) as a control material, borides are produced that are approximately twice as hard as oxides, so fuel debris can be separated while distinguishing between metals, oxides, and borides. It is efficient to take out the It has also been confirmed that there is a correlation between the concentration of boron contained in boride and the hardness. In order to study the fuel debris retrieval method, it is necessary to identify the material and material hardness of the unknown sample. In addition, the creation of material distribution and hardness distribution within unknown samples is also being considered.

試料中の元素の定性・定量分析を行う方法として、誘導結合プラズマ発光分析(ICP-AES)や、レーザーアブレーション誘導結合プラズマ質量分析(LA-ICP-MS)がある。試料に外部から何らかのエネルギーを与えると、試料に含まれる元素は、元素固有の波長の光を放出するので、放出された光の波長と量を測定することで元素分析する。ICP-AESでは、干渉により正確に分析できないことがある。なお、特許文献1に記載されているように、試料に含まれる異物を正確かつ容易に解析することができる異物解析装置の発明も開示されている。 Methods for qualitative and quantitative analysis of elements in a sample include inductively coupled plasma optical emission spectrometry (ICP-AES) and laser ablation inductively coupled plasma mass spectrometry (LA-ICP-MS). When some energy is applied to a sample from the outside, the elements contained in the sample emit light with a wavelength unique to the element, so elemental analysis is performed by measuring the wavelength and amount of emitted light. With ICP-AES, accurate analysis may not be possible due to interference. Note that, as described in Patent Document 1, an invention of a foreign matter analysis device that can accurately and easily analyze foreign matter contained in a sample is also disclosed.

また、固体、液体、気体等の状態に関わらず元素分析をする方法として、レーザー誘起ブレークダウン分光法(LIBS)がある。LIBSは、高エネルギーのパルスレーザーを励起源とする原子発光分析法であり、複雑な前処理の工程を経ずに短時間で分析可能で、軽元素(ホウ素、酸素)から重元素(金属)まで同時計測が可能であることから、高レベル廃棄物の元素情報取得、硬度計測、ホウ素分布情報を基にした臨界管理等に応用が期待されている。なお、特許文献2に記載されているように、金属を主成分とする材料中の酸素やホウ素の組成や材料の硬度を算出する方法の発明も開示されている。 Further, there is laser-induced breakdown spectroscopy (LIBS) as a method for elemental analysis regardless of the state of solid, liquid, gas, etc. LIBS is an atomic emission spectrometry method that uses a high-energy pulsed laser as an excitation source. It can be analyzed in a short time without complicated pretreatment steps, and can analyze light elements (boron, oxygen) to heavy elements (metals). Since it is possible to simultaneously measure up to 100% of waste, it is expected to be applied to obtaining elemental information on high-level waste, measuring hardness, and criticality control based on boron distribution information. Note that, as described in Patent Document 2, an invention of a method for calculating the composition of oxygen and boron in a material containing metal as a main component and the hardness of the material is also disclosed.

LIBSでは、ナノ秒以下のパルス幅を持つピークパワーの高いレーザーを測定対象に照射すると数万℃のプラズマが瞬時形成される。この際、測定対象物はプラズマ化により原子化・励起され、プラズマ消失と共に励起された原子は基底状態へ緩和され、元素固有の蛍光発光を伴う。これを計測し、測定対象元素の同定と定量を行う。レーザー出力の変動や測定対象を構成する元素により生成されるプラズマが、時間・空間的に微小に変動を伴うため、結果として測定値にも変動が生じてしまう。 In LIBS, when a measurement target is irradiated with a high peak power laser with a pulse width of nanoseconds or less, plasma at tens of thousands of degrees Celsius is instantaneously formed. At this time, the object to be measured is atomized and excited by plasma formation, and as the plasma disappears, the excited atoms are relaxed to the ground state, accompanied by fluorescence emission unique to the element. This is measured to identify and quantify the element to be measured. Fluctuations in laser output and plasma generated by the elements constituting the measurement target cause minute fluctuations in time and space, resulting in fluctuations in measured values.

LIBSであれば、プラズマ状態(時間・空間等)によるバックグラウンド、エネルギー弁別処理であれば、放射線と物質との相互作用により生じる散乱成分等が、計測値に大きく影響を与える。レーザー、X線や中性子等の放射線をプローブとして用いる分光計測においては、その各種要因や影響の大小はあるものの、それらをキャンセル又は補正する機能が、精度の高い計測をするために望まれている。 In the case of LIBS, the background based on the plasma state (time, space, etc.), and in the case of energy discrimination processing, the scattered components caused by the interaction between radiation and matter greatly influence the measured values. In spectroscopic measurements that use radiation such as lasers, X-rays, and neutrons as probes, although there are various factors and effects, a function to cancel or correct them is desired in order to perform highly accurate measurements. .

特許第6507757号公報Patent No. 6507757 特開2020-067337号公報JP2020-067337A

しかしながら、未知の固体試料を分析する際に、多くの元素を含む合金や溶融物では、多くの発光波長を有するスペクトルデータが得られ、元素や化合物を判別することが困難な場合がある。例えば、鉄(Fe)やジルコニウム(Zr)の発光線は、非常に多く重なり合うと定量分析に支障をきたすことがある。 However, when analyzing an unknown solid sample, for alloys or melts containing many elements, spectral data with many emission wavelengths are obtained, and it may be difficult to distinguish between elements and compounds. For example, if a large number of emission lines of iron (Fe) or zirconium (Zr) overlap, quantitative analysis may be hindered.

また、レーザーのみならず、X線や中性子等の分光器を用いた計測では、分光器を閉止した条件で暗電流の計測を行い、その影響を除去している。測定環境(空気環境下や不活性環境下等)を除去するために、ブランクデータ(サンプルの無い状態での計測)を基に、その影響を除去しているものもある。しかし、これらの影響は装置機能に付加されていなかったり、類似したサンプルが存在しなかったりする場合などには適用できない。 Furthermore, when measuring not only lasers but also X-rays, neutrons, etc. using a spectrometer, dark current is measured with the spectrometer closed to eliminate its influence. In order to eliminate the measurement environment (air environment, inert environment, etc.), some methods use blank data (measurement without a sample) to remove the influence. However, these effects cannot be applied if they are not added to the device functions or if similar samples do not exist.

加えて、レーザーを用いた発光分析法(LIBSやLA-ICP-MS)や自己遮蔽を持つ中性子等では、試料固有の誤差を評価する必要があるが、中性子やプラズマ発光に関しては、照射エネルギーがコントロールできない場合が多い。 In addition, for optical emission spectroscopy using lasers (LIBS and LA-ICP-MS) and for neutrons with self-shielding, it is necessary to evaluate the error inherent in the sample, but for neutrons and plasma emission, the irradiation energy is Often cannot be controlled.

特に、LIBS測定では、雰囲気ガスによりスペクトルのベースライン(バックグラウンドと思われる点を繋いでいき、それを連続したラインとして示したもの)が変動することがある。例えば、アルゴン(Ar)雰囲気では発光感度が高く、ベースラインが広範囲の波長域でブロードになるホワイトノイズが発生する場合がある。また、190nmから900nmまでの波長の光を検出するため、複数の検出器を用いることになるが、光学系の特性で検出できる波長域が変わるため、検出器が切り替わる波長でベースラインにズレが生じてしまう。 In particular, in LIBS measurements, the baseline of the spectrum (connecting points thought to be background and showing it as a continuous line) may fluctuate depending on the atmospheric gas. For example, in an argon (Ar) atmosphere, the luminescence sensitivity is high and white noise may occur where the baseline is broad over a wide range of wavelengths. In addition, multiple detectors are used to detect light with wavelengths from 190 nm to 900 nm, but since the detectable wavelength range changes depending on the characteristics of the optical system, the baseline may shift at the wavelength at which the detector switches. It will happen.

このように、分光分析、放射線分析等のスペクトル分析におけるバックグラウンドノイズ成分(分光器の暗電流等の変動誤差)の軽減、各種分析における被測定対象物に対する光や放射線によるプローブ条件の適正化(被測定物に対するプローブによる損傷の緩和)、各種化合物(金属やセラミックス等を含む)の同定などが求められている。 In this way, it is possible to reduce background noise components (fluctuation errors such as spectrometer dark current) in spectral analyzes such as spectroscopic analysis and radiation analysis, and to optimize the probe conditions using light and radiation for the object to be measured in various analyses. There is a need for the mitigation of damage caused by probes to objects to be measured) and the identification of various compounds (including metals, ceramics, etc.).

そこで、本発明は、未知試料に含まれる金属元素や化合物を分類・推定する方法を提供することを目的とする。また、金属元素や化合物を分類・推定するに際して、試料固有の誤差を評価し、予め補正しておくことを別の目的とする。 Therefore, an object of the present invention is to provide a method for classifying and estimating metal elements and compounds contained in an unknown sample. Another purpose is to evaluate and correct errors inherent in samples when classifying and estimating metal elements and compounds.

上記の課題を解決するために、本発明である化合物同定方法は、想定される化合物種の標準試料についてスペクトルデータを因子分解して因子及び前記因子の影響度を表す因子スコアを導出し、前記化合物種を決定木において前記因子スコアで分類するためのスコア閾値及び前記因子スコアを前記決定木にかける因子適用順を予め学習・設定しておき、未知試料のスペクトルデータに対して前記標準試料の因子を用いて前記未知試料における因子スコアを算出し、前記因子適用順にしたがって前記決定木で前記未知試料の因子スコアを前記スコア閾値によって分類していくことにより、前記未知試料に含まれる化合物種を同定する、ことを特徴とする。 In order to solve the above problems, the compound identification method of the present invention decomposes spectral data of standard samples of assumed compound types into factors to derive factors and factor scores representing the degree of influence of the factors. The score threshold for classifying compound types using the factor scores in the decision tree and the order of application of the factors to apply the factor scores to the decision tree are learned and set in advance, and the spectral data of the unknown sample is applied to the standard sample. By calculating the factor score of the unknown sample using a factor, and classifying the factor score of the unknown sample using the decision tree according to the order of application of the factors using the score threshold, the compound species contained in the unknown sample can be determined. It is characterized by identifying.

前記化合物同定方法において、前記スペクトルデータは、測定値が推定値を上回ったときより下回ったときに誤差が厳しく評価されるように罰則項付き非対称最小二乗法で近似させたベースラインに補正される、ことを特徴とする。 In the compound identification method, the spectral data is corrected to a baseline approximated by an asymmetric least squares method with a penalty term so that the error is evaluated more strictly when the measured value is below the estimated value than when it is above the estimated value. , is characterized by.

前記化合物同定方法において、前記因子分解は、前記スペクトルデータの波長の標本数(波長次元)Kと試料数NからなるK行N列の行列Yを、指定されたM個の非負値基底ベクトルで分解して得られた前記因子の影響度を前記因子スコアとして導出する、ことを特徴とする。 In the compound identification method, the factorization is performed by converting a K-by-N matrix Y consisting of the number of wavelength samples (wavelength dimension) K of the spectral data and the number of samples N using specified M non-negative basis vectors. The method is characterized in that the degree of influence of the factor obtained by decomposition is derived as the factor score.

前記化合物同定方法において、前記決定木は、前記化合物種を分類するときに、不純度を用いたコスト関数が最小値となるような因子とスコア閾値を導出しておく、ことを特徴とする。 In the compound identification method, the decision tree is characterized in that factors and score thresholds are derived such that a cost function using impurity has a minimum value when classifying the compound type.

前記化合物同定方法において、前記因子スコアをマッピングし、前記未知試料の成分や組成比を推定する、ことを特徴とする。 The compound identification method is characterized in that the factor scores are mapped to estimate components and composition ratios of the unknown sample.

また、本発明である化合物同定装置は、前記試料にレーザーを照射する照射装置と、前記レーザーが照射された前記試料から放出された光を分解する分光器と、前記分光器で生成されたスペクトルデータを所定の範囲の波長ごとに分けて取得する複数の検出器と、を有し、前記検出器から入力されたスペクトルデータを用いて前記試料に含まれる化合物を同定する、ことを特徴とする。 Further, the compound identification device of the present invention includes an irradiation device that irradiates the sample with a laser, a spectrometer that decomposes light emitted from the sample irradiated with the laser, and a spectrum generated by the spectrometer. A plurality of detectors that acquire data separately for each wavelength in a predetermined range, and the compound contained in the sample is identified using spectrum data input from the detectors. .

本発明によれば、未知試料に含まれる金属元素や化合物を分類・推定することができる。事前に既知物質のスペクトルデータを複数の因子に分解し、決定木により元素や化合物の分類方法を学習させておくことで、未知試料の成分の分類に利用することができる。 According to the present invention, metal elements and compounds contained in an unknown sample can be classified and estimated. By decomposing the spectrum data of known substances into multiple factors in advance and learning how to classify elements and compounds using a decision tree, the system can be used to classify the components of unknown samples.

また、試料固有の誤差を評価し、予め補正しておくことで、金属元素や化合物を精度良く分類・推定することができる。なお、後付けで補正することが可能で、ホワイトノイズも含め誤差を除去することができる。 Furthermore, by evaluating errors inherent in the sample and correcting them in advance, metal elements and compounds can be classified and estimated with high accuracy. Note that this can be corrected afterward, and errors including white noise can be removed.

本発明である化合物同定方法における測定装置の概観図である。FIG. 1 is a schematic diagram of a measuring device in the compound identification method of the present invention. 本発明である化合物同定方法の前処理段階および学習段階の流れを示すフローチャートである。1 is a flowchart showing the flow of a preprocessing stage and a learning stage of the compound identification method of the present invention. 本発明である化合物同定方法におけるスペクトルデータの補正を説明する図である。FIG. 3 is a diagram illustrating correction of spectral data in the compound identification method of the present invention. 本発明である化合物同定方法におけるスペクトルデータの補正を説明する図である。FIG. 3 is a diagram illustrating correction of spectral data in the compound identification method of the present invention. 本発明である化合物同定方法におけるスペクトルデータの因子分解を説明する図である。FIG. 2 is a diagram illustrating factorization of spectral data in the compound identification method of the present invention. 本発明である化合物同定方法におけるスペクトルデータの因子分解を説明する図である。FIG. 2 is a diagram illustrating factorization of spectral data in the compound identification method of the present invention. 本発明である化合物同定方法における決定木による分類を説明する図である。FIG. 2 is a diagram illustrating classification using a decision tree in the compound identification method of the present invention. 本発明である化合物同定方法における決定木による分類を説明する図である。FIG. 2 is a diagram illustrating classification using a decision tree in the compound identification method of the present invention. 本発明である化合物同定方法における決定木による分類を説明する図である。FIG. 2 is a diagram illustrating classification using a decision tree in the compound identification method of the present invention. 本発明である化合物同定方法の運用段階の流れを示すフローチャート図である。FIG. 2 is a flowchart showing the flow of operational steps of the compound identification method of the present invention. 本発明である化合物同定方法で分類した結果を示す図である。FIG. 2 is a diagram showing the results of classification using the compound identification method of the present invention.

以下に、本発明の実施形態について図面を参照して詳細に説明する。なお、同一機能を有するものは同一符号を付け、その繰り返しの説明は省略する場合がある。 Embodiments of the present invention will be described in detail below with reference to the drawings. Components having the same functions are designated by the same reference numerals, and repeated explanations may be omitted.

本発明は、可視光-赤外光やX線・ガンマ線・中性子等の放射線等を用いる分光分析の計測系に関して、計測系の安定性に起因するバックグラウンド変動の低減処理、計測対象のスペクトル同定処理の2つの処理を対象としたアルゴリズムに関するものである。本アルゴリズムは、計測データ(予測データを含む)を学習データとする機械学習方法およびその結果がもたらすデータ処理系の構成からなり、実施により計測精度やロバスト性の向上が期待される。また、ソフトウェア処理として実施可能なため、既存の分光分析装置に具備される解析プログラムへの実装性が高い。 The present invention relates to a measurement system for spectroscopic analysis that uses radiation such as visible light-infrared light, This relates to an algorithm that targets two types of processing. This algorithm consists of a machine learning method that uses measured data (including predicted data) as learning data, and the configuration of a data processing system resulting from this method, and is expected to improve measurement accuracy and robustness as it is implemented. Furthermore, since it can be implemented as software processing, it is highly easy to implement into analysis programs included in existing spectroscopic analyzers.

LIBS(レーザー誘起ブレークダウン分光法)による元素の同定及び定量化の分析精度を高度化するために、元素発光スペクトルに加えてプラズマ状態(時間・空間等)を特徴付けるパラメータ(参照パラメータ)を同時に計測し、双方の相関性を補正処理に用いる。具体的には、測定対象とする原子発光スペクトルの強度や形状と強く相関している参照パラメータを設定する。従来は、習熟経験が高い測定者が変動成分や特性を把握した上で設定していた。高い分析精度を得るためには、スペクトルの変動メカニズムを理解した評価が必要である。 In order to improve the analytical accuracy of element identification and quantification using LIBS (laser-induced breakdown spectroscopy), we simultaneously measure parameters (reference parameters) that characterize the plasma state (time, space, etc.) in addition to elemental emission spectra. Then, the correlation between the two is used for correction processing. Specifically, reference parameters that are strongly correlated with the intensity and shape of the atomic emission spectrum to be measured are set. In the past, measurements were made by an experienced measurer who understood the fluctuation components and characteristics. In order to obtain high analytical accuracy, it is necessary to conduct evaluations that understand the spectral variation mechanism.

参照パラメータの設定には、機械学習を使う。従来手法では、測定対象のスペクトルを一定の幅を有するピークとしてサーチするのに対し、本発明では、人間では取扱いが困難なビッグデータ(各種分析装置等から得られた波長-カウント値(光強度値)がセットとなった全スペクトル成分)に機械学習手法(NMF:非負値行列因子分解)を適用し、参照パラメータを構築する。シグナルピークではなく、全スペクトル成分を用いることで、未知試料の同定の際に、スペクトルの強度や形状等も含む評価が可能である。 Machine learning is used to set reference parameters. In the conventional method, the spectrum of the measurement target is searched as a peak with a certain width, but in the present invention, it is difficult to handle big data (wavelength-count value (light intensity) obtained from various analytical devices etc.). A machine learning method (NMF: non-negative matrix factorization) is applied to a set of all spectral components (values) to construct reference parameters. By using all spectral components rather than signal peaks, it is possible to evaluate the spectrum including its intensity and shape when identifying an unknown sample.

本発明は、オーケストラの中からバイオリンやビオラ等の特定音を抽出する手法や、雑踏の中から特定の個人を抽出する手法に着想を得て、測定装置に展開したものである。本発明のアルゴリズムとしては、前処理段階(プレプロセッシングフェーズ)で加工した標準試料のスペクトルデータを、学習段階(トレーニングフェーズ)でNMF及び決定木を用いて学習させ、運用段階(運用フェーズ)で未知試料に適用している。 The present invention was inspired by a method for extracting a specific sound such as a violin or viola from an orchestra, or a method for extracting a specific individual from a crowd, and was developed into a measuring device. In the algorithm of the present invention, the spectral data of the standard sample processed in the preprocessing phase is trained using NMF and decision trees in the learning phase, and unknown data is learned in the operation phase. Applied to samples.

図1は、本発明である化合物同定方法における測定装置の概観図である。測定装置100は、チャンバー200、照射装置300、分光器400、検出器410、及び制御装置220などを備え、LIBS測定を行う。 FIG. 1 is an overview diagram of a measuring device in the compound identification method of the present invention. The measurement device 100 includes a chamber 200, an irradiation device 300, a spectrometer 400, a detector 410, a control device 220, and the like, and performs LIBS measurement.

チャンバー200は、真空容器などであり、真空ポンプ210を用いて減圧された内部に試料110が載置される。試料110としては、主に、学習段階においては、標準試料110aなどの既知試料が使用され、運用段階においては、測定・分析対象の未知試料110bが使用される。標準試料110aは、金属元素や化合物など予め組成が判明しているもの、未知試料110bは、原子力発電所から運び込まれた燃料デブリなど組成が不明なものである。 The chamber 200 is a vacuum container or the like, and the sample 110 is placed inside the chamber 200, which is depressurized using a vacuum pump 210. As the sample 110, a known sample such as a standard sample 110a is mainly used in the learning stage, and an unknown sample 110b to be measured and analyzed is used in the operational stage. The standard sample 110a is a sample whose composition is known in advance, such as a metal element or a compound, and the unknown sample 110b is a sample whose composition is unknown, such as fuel debris brought in from a nuclear power plant.

照射装置300は、レーザー発振器を備えたレーザーヘッド等であり、チャンバー200内の試料110にパルスレーザー等の照射光310を照射する。照射光310としては、YAG(イットリウム、アルミニウム、ガーネット)にNd(ネオジム)を添加した結晶を媒体として用いた波長1064nmのNd:YAGレーザー等を使用する。 The irradiation device 300 is a laser head or the like equipped with a laser oscillator, and irradiates the sample 110 in the chamber 200 with irradiation light 310 such as a pulsed laser. As the irradiation light 310, a Nd:YAG laser with a wavelength of 1064 nm is used, which uses a crystal in which Nd (neodymium) is added to YAG (yttrium, aluminum, garnet) as a medium.

照射光310を照射することにより試料110の表面をプラズマ化し、それが基底状態に戻る際に放出された放出光320を検出する。放出光320をコリメーター等で平行にした上で分光器400に入射させる。分光器400は、プリズムや回折格子などであり、光を波長ごとに分解し、強度分布を表したスペクトルデータ420を複数の検出器410を並置して所定の範囲の波長ごとに分けて取得させ、制御装置220に送る。 By irradiating the irradiation light 310, the surface of the sample 110 is turned into plasma, and when the surface returns to the ground state, the emitted light 320 is detected. The emitted light 320 is made parallel using a collimator or the like, and then enters the spectroscope 400. The spectrometer 400 is a prism, a diffraction grating, or the like, and separates light into wavelengths, and obtains spectrum data 420 representing the intensity distribution by arranging a plurality of detectors 410 in parallel for each wavelength in a predetermined range. , to the control device 220.

制御装置220は、コンピュータ等であり、各装置を制御するとともに、取得したスペクトルデータ420から試料110の分類・分析を行う。その他、必要に応じて、シーケンサ230、電動のステージ240、冷却水循環設備などを備えても良い。 The control device 220 is a computer or the like, and controls each device, as well as classifying and analyzing the sample 110 from the acquired spectrum data 420. In addition, a sequencer 230, an electric stage 240, cooling water circulation equipment, etc. may be provided as necessary.

例えば、試料110を載せたステージ240をシーケンサ230の制御で移動させて多地点を走査させる。ステージ240の位置情報(X-Y-Z軸の座標情報)からレーザーの照射位置を取得するとともに、変位計で試料110の形状情報(高さ情報)を取得し、制御装置220で座標をマッピングして立体的に形状と強度情報を可視化する。 For example, the stage 240 on which the sample 110 is placed is moved under the control of the sequencer 230 to scan multiple points. The laser irradiation position is obtained from the position information (XYZ axis coordinate information) of the stage 240, and the shape information (height information) of the sample 110 is obtained using the displacement meter, and the coordinates are mapped by the control device 220. to visualize shape and intensity information in three dimensions.

図2は、化合物同定方法の前処理段階および学習段階の流れを示すフローチャートである。前処理段階として、標準試料準備(標準試料の化合物種の設定)L1、スペクトルデータ取得(ベースライン推定)L2、学習段階として、NMF実行(標準試料の因子と因子スコアの取得)L3、及び決定木ルール生成(スコア閾値と因子適用順の設定)L4のステップを有する。 FIG. 2 is a flowchart showing the flow of the preprocessing stage and learning stage of the compound identification method. The preprocessing stage includes standard sample preparation (setting the compound type of the standard sample) L1, spectrum data acquisition (baseline estimation) L2, and the learning stage includes NMF execution (obtaining the factors and factor scores of the standard sample) L3, and determination. Tree rule generation (setting of score threshold and factor application order) has step L4.

前処理段階及び学習段階においては、想定される化合物種を設定して標準試料110aを準備し、取得した標準試料110aのスペクトルデータ420を因子分解して標準試料110aの因子及び因子スコアを導出し、化合物種を決定木において因子スコアで分類するためのスコア閾値と、因子を決定木にかける因子適用順を、決定木のルールとして学習し、予め設定しておく。 In the preprocessing stage and the learning stage, a standard sample 110a is prepared by setting the assumed compound type, and the acquired spectrum data 420 of the standard sample 110a is decomposed into factors to derive the factors and factor scores of the standard sample 110a. , a score threshold for classifying compound species by factor score in a decision tree, and the order in which factors are applied to the decision tree are learned and set in advance as rules of the decision tree.

前処理段階に係る工程は、図2の標準試料準備L1、スペクトルデータ取得L2からなる。標準試料準備L1ステップでは、測定対象の未知試料110bの成分として想定される金属元素や化合物などの化合物種を設定しておき、その金属元素や化合物を標準試料110aとして準備する。標準試料110aは、未知試料110bに含まれる化合物種を同定する際に、どの因子がどの程度の影響を及ぼしているかを見るために予め用意しておくデータとなる。 The steps related to the pre-processing stage consist of standard sample preparation L1 and spectrum data acquisition L2 shown in FIG. In the standard sample preparation L1 step, compound types such as metal elements and compounds assumed to be components of the unknown sample 110b to be measured are set, and the metal elements and compounds are prepared as the standard sample 110a. The standard sample 110a serves as data prepared in advance in order to see which factor has what degree of influence when identifying the compound species contained in the unknown sample 110b.

スペクトルデータ取得L2ステップでは、検出器410から送られてきたスペクトルデータ420(事前に記憶装置等に保存していたものを含む)を制御装置220に入力する。スペクトルデータ420にはノイズ等が含まれ、ベースライン430(基線)が乱れているので、制御装置220においてベースライン推定を行う。ベースライン推定では、ベースライン430が平滑となるようにスペクトルデータ420を補正する。 In the spectrum data acquisition L2 step, spectrum data 420 sent from the detector 410 (including data stored in advance in a storage device, etc.) is input to the control device 220. Since the spectrum data 420 includes noise and the like and the baseline 430 (baseline) is disturbed, the control device 220 performs baseline estimation. In the baseline estimation, the spectral data 420 is corrected so that the baseline 430 becomes smooth.

次に、上述した前処理段階に係る工程について、LIBS測定を行って得た実例を図3から図4を参照して説明する。図3及び図4は、化合物同定方法におけるスペクトルデータの補正を説明する図である。 Next, an example of the process related to the above-mentioned pretreatment stage obtained by performing LIBS measurement will be described with reference to FIGS. 3 to 4. 3 and 4 are diagrams illustrating correction of spectral data in the compound identification method.

図3(a)は、LIBS測定系において複数の測定波長範囲を分割し、各々に感度が高い分光器を用い広帯域化(190nmから900nm)を図り、取得したスペクトルである。図3(a)に示すように、検出器410の波長範囲の境界でベースライン430にズレを生じていることが分かる。ズレを生じることで、検出器410の感度や暗電流に起因するベースライン430に不連続性が発生することになる。 FIG. 3(a) is a spectrum obtained by dividing a plurality of measurement wavelength ranges in the LIBS measurement system and using a highly sensitive spectrometer for each to achieve a wide band (from 190 nm to 900 nm). As shown in FIG. 3A, it can be seen that the baseline 430 deviates at the boundary of the wavelength range of the detector 410. The deviation causes discontinuity in the baseline 430 due to the sensitivity of the detector 410 and dark current.

不連続性が発生した波長域では、計測結果に不確かな要因を多く含み、結果の信頼性が得られない。また、不連続部分にスペクトルがある対象の場合、正確な面積を算出することができず、場合によってはスペクトルの判別ができなくなる。 In the wavelength range where discontinuity occurs, the measurement results include many uncertain factors, making the results unreliable. Furthermore, in the case of an object with a spectrum in a discontinuous portion, it is not possible to accurately calculate the area, and in some cases, the spectrum cannot be distinguished.

また、図3(b)は、図3(a)のスペクトルデータ420の一部を拡大したスペクトルである。図3(b)に示すように、ディテクタの分解能に対して最適なスムージングを適用しない限り、必要以上に調整されたベースラインになってしまう。 Moreover, FIG. 3(b) is a spectrum obtained by enlarging a part of the spectrum data 420 of FIG. 3(a). As shown in FIG. 3(b), unless optimal smoothing is applied to the resolution of the detector, the baseline will be adjusted more than necessary.

そこで、発明者らは、図3(c)に示す、非対称重みペナルティ最小二乗スムージング(罰則項付き非対称最小二乗法)により、複数の検出器410の波長範囲の境界におけるベースライン430のズレ(不連続性)を補正することを考案した。罰則項付き非対称最小二乗法は、測定値yに対するベースライン430の推定値zの好ましさ(良さ)を、測定値と推定値の差が最小とするだけでなく、平滑となるように評価関数を最小化することにより、好ましいベースライン430を導出するものである。 Therefore, the inventors used asymmetric weight penalty least squares smoothing (asymmetric least squares method with penalty term) as shown in FIG. Continuity). The asymmetric least squares method with penalty term determines the desirability (goodness) of the estimated value z i of the baseline 430 with respect to the measured value y i so that the difference between the measured value and the estimated value is not only minimized but also smoothed. A preferable baseline 430 is derived by minimizing the evaluation function.

評価の観点としては、まず、二乗誤差Σ(y-zの観点から、y≦zの際には誤差を非常に厳しくし、y>zの際には誤差を非常に甘くする非対称な評価を行い、さらに、zの変動の観点から、変動の変化に対して厳しい評価を行う。wは、非対称重みであり、y>zならばpとなり、y≦zならば(1-p)となる。p(p∈[0,1]:pは非常に小さい値)は、測定値が推定値を上回ったかどうかでwを変える役割を持つ。μは、正則化パラメータであり、推定値の変動(非平滑度)Σ(Δが罰則項となる。なお、Δは2階微分演算子を表し、w、μは設計者が経験的に定めるハイパーパラメータである。パラメータを変化させ、最適解を探っていけば良い。 From the viewpoint of evaluation, first, from the viewpoint of the squared error Σ i (y i −z i ) 2 , when y i ≦z i , the error is made very strict, and when y i >z i , the error is An asymmetrical evaluation is performed in which the value of z i is made very lenient, and furthermore, from the perspective of the fluctuation of z i , a strict evaluation is performed on changes in the fluctuation. w i is an asymmetric weight, which is p if y i >z i and (1-p) if y i ≦z i . p (p∈[0,1]: p is a very small value) has the role of changing w i depending on whether the measured value exceeds the estimated value. μ is a regularization parameter, and the variation (non-smoothness) of the estimated value Σ i2 z i ) 2 is a penalty term. Note that Δ 2 represents a second-order differential operator, and w i and μ are hyperparameters determined empirically by the designer. All you have to do is change the parameters and find the optimal solution.

これにより、スペクトルデータ420は、測定値が推定値を上回ったときよりも、測定値が推定値を下回ったときに誤差が厳しく評価されるように罰則項付き非対称最小二乗法で近似させたベースライン430に補正される。 As a result, the spectral data 420 is based on a base approximated by the asymmetric least squares method with a penalty term so that the error is evaluated more strictly when the measured value is less than the estimated value than when the measured value exceeds the estimated value. Corrected to line 430.

図4は、図3(c)の補正により、図3のスペクトルデータ420を補正したスペクトルである。なお、図4(a)は、図3(a)のスペクトルデータ420を補正したスペクトルであり、図4(b)は、図4(a)のスペクトルデータ420の一部を拡大したスペクトルである。 FIG. 4 shows a spectrum obtained by correcting the spectrum data 420 in FIG. 3 by the correction shown in FIG. 3(c). Note that FIG. 4(a) is a spectrum obtained by correcting the spectral data 420 in FIG. 3(a), and FIG. 4(b) is a spectrum obtained by enlarging a part of the spectral data 420 in FIG. 4(a). .

図4(a)に示すように、補正後の平滑化されたベースライン430により、図3(a)のスペクトルの不連続性が解消され、バックグラウンド除去によりスペクトルデータ420の形状や強度を識別することが容易になることが分かる。これにより、元素同定及び定量性の観点で分析精度が向上し、今まで困難であったスペクトル評価が可能となる。なお、本実施例であるLIBS測定に限られず、分光器400を使う全ての測定装置に適用可能である。 As shown in FIG. 4(a), the smoothed baseline 430 after correction eliminates the spectral discontinuity in FIG. 3(a), and background removal identifies the shape and intensity of the spectral data 420. You will find it easier to do so. This improves analytical accuracy in terms of element identification and quantitative performance, and enables spectrum evaluation, which has been difficult until now. Note that this embodiment is not limited to the LIBS measurement of this embodiment, and is applicable to all measurement devices that use the spectrometer 400.

また、非対称重みペナルティ最小二乗スムージングだけでなく、サンプルが無い条件でのベースライン430からパターン認識による除去等を適用することで、各種分析装置固有の性能向上やサンプル依存性の低減を図る。ラマン分光法やLA-ICP-MS等のレーザー光源を用いた分析手法のみならず、分光器400を使う全ての測定装置100に適用可能である。 Furthermore, by applying not only asymmetric weight penalty least squares smoothing but also pattern recognition based removal from the baseline 430 under the condition of no sample, it is possible to improve the performance specific to various analytical devices and reduce sample dependence. It is applicable not only to analysis methods using a laser light source such as Raman spectroscopy and LA-ICP-MS, but also to all measurement devices 100 that use the spectrometer 400.

パターン認識による除去の例としては、試料が無い条件(空打ち)で測定環境のみを測定した際に得られたスペクトルをパターン認識させ、ベースラインで削除するものがある。一般的には、試料が無い条件を単純に差し引くことで行っているが、パターン認識を駆使すると測定毎に上下するベースラインに合わせた補正が可能である。 As an example of removal by pattern recognition, there is a method in which a spectrum obtained when only the measurement environment is measured without a sample (dry shot) is pattern recognized and removed as a baseline. Generally, this is done by simply subtracting the condition where there is no sample, but by making full use of pattern recognition, it is possible to make corrections that match the baseline that moves up and down with each measurement.

図5及び図6は、化合物同定方法におけるスペクトルデータの因子分解を説明する図である。NMF実行L3ステップでは、制御装置220において、補正後のスペクトルデータ420に対して、非負値行列因子分解(NMF)を行う。 FIGS. 5 and 6 are diagrams illustrating factor decomposition of spectral data in the compound identification method. In the NMF execution L3 step, the controller 220 performs non-negative matrix factorization (NMF) on the corrected spectral data 420.

NMFでは、機械学習により重なり合った発光スペクトルデータ全体を指定した因子数の因子に分解し、因子スコアと物質名のペアで表現されているサンプルデータ群に対して、決定木でどの因子に注目してどんな閾値によって峻別していけば、正しく物質の分類ができるのかを探し出すアルゴリズムを使用し、関連する因子に分けることで未知試料110bから元素や化合物を分類する。 NMF uses machine learning to decompose the entire overlapped emission spectrum data into a specified number of factors, and uses a decision tree to determine which factors to focus on for the sample data group expressed as a pair of factor score and substance name. An algorithm is used to find out what threshold value can be used to accurately classify substances, and by classifying them into related factors, elements and compounds are classified from the unknown sample 110b.

事前に既知物質のスペクトルデータ420を次元削減手法により、低次元の因子スコアベクトルにスペクトルを変換し、決定木により元素や化合物などを分類するアルゴリズムを学習させておくことで、未知試料110bの中の成分を推定する。 By converting the spectrum data 420 of the known substance into a low-dimensional factor score vector using a dimension reduction method in advance, and training an algorithm that classifies elements and compounds using a decision tree, it is possible to Estimate the components of.

学習段階では、図5(a)に示すスペクトルデータ420(K次元のベクトル群)を一纏めにし、NMFを使ってM個の因子440に分けて、決定木で扱いやすいように低次元化する。NMFは、スペクトルデータが0と正の値の行列表現ができれば、データの種類によらず適用可能である。 In the learning stage, the spectral data 420 (K-dimensional vector group) shown in FIG. 5(a) is grouped together, divided into M factors 440 using NMF, and reduced in dimension so that it can be easily handled by a decision tree. NMF is applicable regardless of the type of data as long as the spectrum data can be expressed as a matrix of 0 and positive values.

図5(b)に示すように、N個の測定データY(y~y)を近似的に因子Hと因子スコアUに分解する。測定データyは、K次元(例えば、K=11562種類の波長)のベクトルデータ(強度)であり、K×N(K行N列)の行列で表される。因子Hは、K次元のベクトルデータに共通する何らかの因子を、M個(例えば、M=3個の因子)の基底ベクトルとして表したものであり、K×M(K行M列)の行列で表される。因子スコアUは、N個の測定データYとM個の因子Hに関する結合係数であり、M×N(M行N列)の行列で表される。なお、Mはハイパーパラメータである。 As shown in FIG. 5(b), N pieces of measurement data Y (y 1 to y N ) are approximately decomposed into factors H and factor scores U. The measurement data y i is vector data (intensity) of K dimensions (for example, K=11562 types of wavelengths), and is represented by a K×N (K rows and N columns) matrix. Factor H is a factor common to K-dimensional vector data expressed as M (for example, M = 3 factors) basis vectors, and is a K×M (K rows and M columns) matrix. expressed. The factor score U is a coupling coefficient regarding N measurement data Y and M factors H, and is represented by an M×N (M rows and N columns) matrix. Note that M is a hyperparameter.

標準試料110aの場合、スペクトルデータ420の波長の標本数(波長次元)と試料数からなる行列を非負値で因子分解し、得られた因子(例えば、第1因子~第3因子)をそれぞれ標準試料110aの因子440とし、標準試料110aにおける各因子440の影響度を表す係数がそれぞれ因子スコア450として導出される。因子スコア450は、測定データがどの因子440の影響を大きく受けているかを示すものである。 In the case of the standard sample 110a, a matrix consisting of the number of wavelength samples (wavelength dimension) of the spectrum data 420 and the number of samples is factorized using non-negative values, and the obtained factors (for example, the first to third factors) are each used as the standard. The factor 440 of the sample 110a is assumed to be a factor 440, and a coefficient representing the degree of influence of each factor 440 in the standard sample 110a is derived as a factor score 450. The factor score 450 indicates which factor 440 greatly influences the measurement data.

LIBSを用いた例として、ホウ化物を中心に4種類の化合物種を設定し、標準試料110aとしてそれぞれ37個(N=37×4)のスペクトルデータ420を抽出し、高次元(各スペクトルの波長次元数k=11562)のサンプルとした。それをNMFにより低次元化(参照パラメータとして特徴量の異なる3つの因子440と因子スコア450)した結果を示す。図6に示すように、各因子440に因子スコア450の影響を考慮した上で、3つの因子の線形和により、測定したスペクトルデータ(図5(a))を表現可能である。 As an example using LIBS, four types of compounds, mainly borides, are set, and 37 (N = 37 x 4) spectral data 420 are extracted from each as the standard sample 110a. The number of dimensions was k=11562). The results of reducing the dimension using NMF (three factors 440 with different feature amounts and a factor score 450 as reference parameters) are shown. As shown in FIG. 6, after considering the influence of the factor score 450 on each factor 440, the measured spectrum data (FIG. 5(a)) can be expressed by a linear sum of three factors.

なお、因子440は、波長ごとの強度のスケールを揃えるために、平均値と標準偏差でスペクトルデータ420を標準化しても良い。標準化しない場合は、そのステップを省略しても良い。なお、レーザー照射によるサンプルの壊れやすさや放射線計測におけるサンプル特有の自己遮へいがあるので、標準化することでこれらを緩和することができる。 Note that the factor 440 may standardize the spectrum data 420 using an average value and a standard deviation in order to equalize the intensity scale for each wavelength. If standardization is not desired, this step may be omitted. Note that there are fragility of samples due to laser irradiation and self-shielding peculiar to samples during radiation measurement, so standardization can alleviate these problems.

図7~図9は、化合物同定方法における決定木による分類を説明する図である。決定木ルール生成L4ステップでは、制御装置220において、標準試料110aの因子スコア450を特徴量として決定木500を作成し、標準試料110aの因子440を適用するときに因子スコア450によって分類するためのスコア閾値460と、標準試料110aのどの因子440から適用して決定木500で分類していくか因子適用順を設定する。 7 to 9 are diagrams illustrating classification using a decision tree in the compound identification method. In the decision tree rule generation L4 step, the control device 220 creates a decision tree 500 using the factor score 450 of the standard sample 110a as a feature, and creates a decision tree 500 for classification based on the factor score 450 when applying the factor 440 of the standard sample 110a. The score threshold 460 and the order in which factors are applied are set to determine which factor 440 of the standard sample 110a is applied for classification using the decision tree 500.

決定木500は、NMFで得た参照パラメータを元に「True」又は「False」を判断する分類方法であり、学習データに対して、着目した因子440(参照パラメータ)とその判断に用いる因子スコア450のスコア閾値460を用いて、物質を正しく分類する探索アルゴリズムである。 The decision tree 500 is a classification method that determines "True" or "False" based on reference parameters obtained by NMF, and for learning data, the focused factor 440 (reference parameter) and the factor score used for the determination are This is a search algorithm that uses a score threshold of 460 of 450 to correctly classify substances.

学習段階にあるNMFと決定木500の組合せは、動的光散乱や誘導結合プラズマ質量分析装置(ICP-MS)等のスペクトルデータ420がある解析手法はもちろん、「0」と「正の値」の行列表現記載ができれば、データの種類によらず適用することができる。TEM(透過電子顕微鏡)やSEM(走査電子顕微鏡)及びそれに付随したEDX(エネルギー分散型X線分析)等の画像データ等にも展開が期待できる。 The combination of NMF and decision tree 500 in the learning stage can be used not only for analysis methods that have spectral data 420 such as dynamic light scattering and inductively coupled plasma mass spectrometry (ICP-MS), but also for "0" and "positive values". If a matrix representation can be written, it can be applied regardless of the type of data. It can also be expected to be applied to image data such as TEM (transmission electron microscope), SEM (scanning electron microscope), and accompanying EDX (energy dispersive X-ray analysis).

図7(a)に示すように、決定木500で条件分岐させるために、標準試料110aの因子スコア450について不純度を計算するコスト関数Jを使用し、コスト関数Jが最小となるようなスコア閾値t(1≦k≦m)を導出する。なお、コスト関数Jはジニ不純度などを用いて算出しており、kは因子番号、mは因子440の数、mleftは一方に分ける因子(左サブセット)の数、mrightは他方に分ける因子(右サブセット)の数、Gleftは左サブセットの不純度、Grightは右サブセットの不純度である。 As shown in FIG. 7(a), in order to make a conditional branch in the decision tree 500, a cost function J that calculates impurity for the factor score 450 of the standard sample 110a is used, and a score that minimizes the cost function J is used. A threshold value t k (1≦k≦m) is derived. The cost function J is calculated using Gini impurity, etc., where k is the factor number, m is the number of factors 440, m left is the number of factors (left subset) divided into one, and m right is divided into the other. The number of factors (right subset), G left is the impurity of the left subset, and G right is the impurity of the right subset.

なお、サブセット中に存在する化合物が1種類だけであれば、純粋なサブセット、複数種類の化合物が混合されていれば、不純なサブセットとなる。このとき、サブセットの不純度は、サブセット中に含まれる各化合物の比率に基づく、ジニ不純度や交差エントロピーによって表される。 Note that if only one type of compound exists in the subset, it is a pure subset, and if multiple types of compounds are mixed, it is an impure subset. At this time, the impurity of the subset is expressed by Gini impurity or cross entropy based on the ratio of each compound contained in the subset.

図7(b)に示すように、化合物種(雰囲気)がArとNの場合に、横軸側の因子440について因子スコア450のスコア閾値460(例えば、114.155)が導出され、決定木500において、因子スコア450がスコア閾値460より小さければ因子440は左サブセット(Nと推定)に分類され、因子スコア450がスコア閾値460より大きければ因子440は右サブセット(Arと推定)に分類される。 As shown in FIG. 7(b), when the compound type (atmosphere) is Ar and N2 , a score threshold 460 (for example, 114.155) of the factor score 450 is derived and determined for the factor 440 on the horizontal axis side. In the tree 500, if the factor score 450 is less than the score threshold 460, the factor 440 is classified into the left subset (estimated as N2 ), and if the factor score 450 is greater than the score threshold 460, the factor 440 is classified into the right subset (estimated as Ar). being classified.

図8(a)は、LIBSで測定したホウ化物スペクトル(CrB系、FeB系、NiB系、ZrB系の4つの化合物種)に対して、因子440に分解し、特徴量(因子スコア450)を抽出して決定木500を作成する例を示す。因子440の因子適用順は、第2因子、第3因子、第1因子の順になったとする。 Figure 8(a) shows that the boride spectrum (four compound types: CrB, FeB, NiB, and ZrB) measured by LIBS is decomposed into factors of 440, and the feature values (factor score of 450) are calculated. An example of extracting and creating a decision tree 500 will be shown. It is assumed that the order of application of the factor 440 is the second factor, the third factor, and the first factor.

決定木500のノードN1では、第2因子における因子スコア450のスコア閾値460が108.615と導出され、図8(b)に示すように、スコア閾値460より大きいものがCrとBを含む化合物として分類され、それ以外はノードN2で分類される。 In the node N1 of the decision tree 500, the score threshold 460 of the factor score 450 in the second factor is derived as 108.615, and as shown in FIG. 8(b), those larger than the score threshold 460 are compounds containing Cr and B. , and the others are classified as node N2.

決定木500のノードN2では、第3因子における因子スコア450のスコア閾値460が65.837と導出され、図9(a)に示すように、スコア閾値460より大きいものがNiとBを含む化合物として分類され、それ以外はノードN3で分類される。 In the node N2 of the decision tree 500, the score threshold 460 of the factor score 450 in the third factor is derived as 65.837, and as shown in FIG. 9(a), those larger than the score threshold 460 are compounds containing Ni and B. , and the others are classified as node N3.

決定木500のノードN3では、第1因子における因子スコア450のスコア閾値460が117.886と導出され、図9(b)に示すように、スコア閾値460より大きいものがZrとBを含む化合物として分類され、それ以外はFeとBを含む化合物として分類される。 At node N3 of the decision tree 500, the score threshold 460 of the factor score 450 in the first factor is derived as 117.886, and as shown in FIG. 9(b), the score threshold 460 is greater than the compound containing Zr and B. Others are classified as compounds containing Fe and B.

比較的スペクトルの多いジルコニウム(Zr)や鉄(Fe)よりもクロム(Cr)が決定木500の始めに分類されており、決定木500では人間の予想とは異なり、より正確に分類されている。これは、ZrやFeが干渉の影響を伴うピークを多数含むことも影響していると考えられる(従来手法のように、単純に干渉の無いシグナルピークによる分類だけだと正答率は低下する)。 Chromium (Cr) is classified earlier in decision tree 500 than zirconium (Zr) and iron (Fe), which have a relatively rich spectrum, and is classified more accurately in decision tree 500, contrary to human expectations. . This is thought to be due to the fact that Zr and Fe contain many peaks that are affected by interference (if the classification is simply based on signal peaks without interference, as in the conventional method, the correct answer rate will decrease) .

制御装置220において、標準試料110aから得られた因子440と因子スコア450、さらに決定木500のルールとして因子スコア450のスコア閾値と因子440の因子適用順をデータベース等の記憶装置に蓄積し、化合物同定指標を作成する。学習段階では、どのような標準試料110aからのデータか、因子スコア450がそれぞれの因子440でどのようになっているかを把握し、運用段階において、未知試料110bを分類する際の化合物同定指標として利用する。 In the control device 220, the factor 440 and the factor score 450 obtained from the standard sample 110a, as well as the score threshold of the factor score 450 and the factor application order of the factor 440 as rules for the decision tree 500 are stored in a storage device such as a database, and the compound Create an identification index. In the learning stage, we understand what kind of standard sample 110a the data is from and how the factor score 450 is for each factor 440, and in the operational stage, we use it as a compound identification index when classifying the unknown sample 110b. Make use of it.

図10は、化合物同定方法の運用段階の流れを示すフローチャート図である。運用段階として、未知試料測定S1、スペクトルデータ補正S2、因子分解処理S3、決定木分類処理S4のステップを有する。標準試料110aの各因子440とその因子スコア450が予め化合物同定指標として用意されており、未知試料110bの各因子440についての因子スコア450で振り分けることにより、未知試料110bをクラス分けする。 FIG. 10 is a flowchart showing the flow of the operational steps of the compound identification method. The operation stage includes steps of unknown sample measurement S1, spectral data correction S2, factorization processing S3, and decision tree classification processing S4. Each factor 440 and its factor score 450 of the standard sample 110a are prepared in advance as a compound identification index, and the unknown sample 110b is divided into classes by sorting by the factor score 450 of each factor 440 of the unknown sample 110b.

運用段階においては、未知試料110bのスペクトルデータ420に対して、標準試料110aの因子440を用いて未知試料110bにおける因子スコア450を算出し、因子440の因子適用順にしたがって決定木500で未知試料110bの因子スコア450をスコア閾値460によって分けていき、未知試料110bのクラスを推定することで、未知試料110bに含まれる化合物種を同定する。 In the operation stage, a factor score 450 for the unknown sample 110b is calculated using the factor 440 of the standard sample 110a for the spectrum data 420 of the unknown sample 110b, and a decision tree 500 is used to calculate the unknown sample 110b according to the order of application of the factors 440. The class of the unknown sample 110b is estimated by dividing the factor score 450 by the score threshold 460, thereby identifying the compound species contained in the unknown sample 110b.

未知試料測定S1ステップでは、測定装置100において未知試料110bにレーザーを照射し、検出器410から送られてきたスペクトルデータ420を制御装置220に入力する。 In the unknown sample measurement S1 step, the unknown sample 110b is irradiated with a laser in the measurement device 100, and the spectrum data 420 sent from the detector 410 is input to the control device 220.

スペクトルデータ補正S2ステップでは、制御装置220において、未知試料110bのスペクトルデータ420に対しても、スペクトルデータ取得L2ステップと同様にベースライン補正を行う。 In the spectral data correction step S2, the control device 220 performs baseline correction on the spectral data 420 of the unknown sample 110b as well as in the spectral data acquisition L2 step.

因子分解処理S3ステップでは、制御装置220において、未知試料110bの補正済みのスペクトルデータ420に対して、標準試料110aの因子440を用いてNMFによる因子分解を行い、未知試料110bの因子スコア450を算出する。なお、必要に応じて標準化処理を施しても良い。 In step S3 of the factorization process, the controller 220 performs factorization using NMF on the corrected spectrum data 420 of the unknown sample 110b using the factor 440 of the standard sample 110a, and calculates the factor score 450 of the unknown sample 110b. calculate. Note that standardization processing may be performed as necessary.

決定木分類処理S4ステップでは、制御装置220において、未知試料110bの因子スコア450を決定木500のルール(学習させたアルゴリズム)に基づき因子440をクラス分けする。決定木500において、因子440の因子適用順にしたがって未知試料110bの因子スコア450をスコア閾値460によってクラス分けし、未知試料が属するクラスを推定していくことにより、未知試料110bに含まれる化合物種を同定する。 In step S4 of the decision tree classification process, the control device 220 classifies the factor scores 450 of the unknown sample 110b into the factors 440 based on the rules (learned algorithm) of the decision tree 500. In the decision tree 500, the factor score 450 of the unknown sample 110b is divided into classes according to the score threshold 460 according to the order of application of the factors 440, and the class to which the unknown sample belongs is estimated, thereby determining the compound species contained in the unknown sample 110b. identify

決定木500に掛けることにより、因子スコア450と化合物種が対応付けられる。標準試料群の全てのスペクトルデータ420から、その共通する因子440(第1因子~第m因子)が導出され、各因子を通して各スペクトルデータ420は因子スコア450に変換される。そして、決定木500を通して化合物種にクラス分けされる。 By multiplying the decision tree 500, the factor scores 450 and compound types are associated. Common factors 440 (first to mth factors) are derived from all the spectral data 420 of the standard sample group, and each spectral data 420 is converted into a factor score 450 through each factor. Then, the compounds are classified into compound types through the decision tree 500.

実際に、未知試料110bとして、ステンレス鋼(SUS)と炭化ホウ素(BC)の共晶化合物等を対象として測定したところ、テストデータ4種類×8個で正答率は100%の結果を得た。 In fact, when we measured a eutectic compound of stainless steel (SUS) and boron carbide (B 4 C) as unknown sample 110b, we obtained a 100% correct answer rate with 4 types of test data x 8 pieces. Ta.

図11は、化合物同定方法で分類した結果を示す図である。因子スコア450をマッピングし、未知試料110bの成分や組成比を推定しても良い。図11(a)に示すように、模擬試料がある化合物に含まれる要素を含んでいるか成分を推定することもできる。また、図11(b)に示すように、CrBが多く含まれているか否か組成比を推定することもできる。 FIG. 11 is a diagram showing the results of classification by the compound identification method. The factor score 450 may be mapped to estimate the components and composition ratio of the unknown sample 110b. As shown in FIG. 11(a), it is also possible to estimate whether or not the simulated sample contains elements contained in a certain compound. Furthermore, as shown in FIG. 11(b), it is also possible to estimate the composition ratio to determine whether a large amount of CrB 2 is contained.

X軸とY軸の2軸座標の制御と、変位計によりステージと変位計の間に載せた試料の距離を計測することで、高さZ軸の情報を取得し、試料形状を把握する。座標の制御は、電動ステージを用いると容易である。X-Y-Z軸を既知とした試料の位置をピンポイントでLIBS計測することにより、LIBS測定結果が得られる。LIBS測定結果から特徴的な元素の発光スペクトルの範囲を選択し、面積値や高さを算出する。二次元上元素のマッピング情報を表示するには、X座標とY座標情報を2軸に設定し、選択した元素発光スペクトルの強度をカラーで示すことで選択した元素をマッピングすれば良い。 By controlling the two-axis coordinates of the X-axis and Y-axis and measuring the distance of the sample placed between the stage and the displacement meter using a displacement meter, information on the height Z-axis is obtained and the shape of the sample is grasped. Coordinate control is easy using an electric stage. LIBS measurement results are obtained by pinpoint LIBS measurement of the position of the sample with the XYZ axes known. A range of emission spectra of characteristic elements is selected from the LIBS measurement results, and area values and heights are calculated. In order to display the mapping information of two-dimensional elements, the selected element may be mapped by setting the X-coordinate and Y-coordinate information on two axes and showing the intensity of the selected element's emission spectrum in color.

本発明によれば、未知試料に含まれる金属元素や化合物を分類・推定することができる。事前に既知物質のスペクトルデータを複数の因子に分解し、決定木により元素や化合物の分類方法を学習させておくことで、未知試料の成分の分類に利用することができる。 According to the present invention, metal elements and compounds contained in an unknown sample can be classified and estimated. By decomposing the spectrum data of known substances into multiple factors in advance and learning how to classify elements and compounds using a decision tree, the system can be used to classify the components of unknown samples.

また、試料固有の誤差を評価し、予め補正しておくことで、金属元素や化合物を精度良く分類・推定することができる。なお、後付けで補正することが可能で、ホワイトノイズも含め誤差を除去することができる。 Furthermore, by evaluating errors inherent in the sample and correcting them in advance, metal elements and compounds can be classified and estimated with high accuracy. Note that this can be corrected afterward, and errors including white noise can be removed.

本発明では、プラズマ状態(時間・空間等)を特徴付ける参照パラメータにより測定対象とする原子発光スペクトルの採用・棄却を決める。また、参照パラメータの設定に機械学習を使っている。従来手法では、測定対象のスペクトルを一定の幅を有するピークとしてサーチするのに対し、本発明では、人間では取り扱うのが困難なビッグデータ(各種分析装置等から得られた全スペクトル成分)をNMFにより機械学習させ、参照パラメータを構築する。これにより、従来方法で行っていたシグナルピークによる処理ではなく、全スペクトル成分を対象に処理することで、評価に用いるデータ量が10まで増大し、その結果、今まで難しかったスペクトルの強度や形状等も含む評価ができるようになり、高い分析精度を確立する見通しも得られた。 In the present invention, adoption or rejection of an atomic emission spectrum to be measured is determined based on reference parameters that characterize the plasma state (time, space, etc.). Machine learning is also used to set reference parameters. In the conventional method, the spectrum of the measurement target is searched as a peak with a certain width, whereas in the present invention, big data (all spectral components obtained from various analytical devices) that is difficult for humans to handle is searched using NMF. Build reference parameters using machine learning. As a result, the amount of data used for evaluation increases to 103 by processing all spectral components instead of processing based on signal peaks, which was done in the conventional method.As a result, the amount of data used for evaluation increases to 10 3 It has become possible to perform evaluations that include shapes, etc., and there is also the prospect of establishing high analytical accuracy.

前処理で用いているベースライン補正は、その種類によって、非対称重みペナルティ最小二乗スムージング法のような関数や、パターン認識のような機械学習を行うことで、スペクトル毎に適用できる。学習データとして公的研究機関等のデータベースや既知試料の計測ができる環境があれば、後付けで既に所有している各種分析装置固有の性能向上(ラマン散乱やLA-ICP-MS等のレーザー光源を用いた分析手法のみならず、分光器を使う全ての測定器)やサンプル依存性の低減が可能である。 Depending on the type of baseline correction used in preprocessing, it can be applied to each spectrum by using a function such as the asymmetric weight penalty least squares smoothing method or machine learning such as pattern recognition. If you have a database from a public research institution or an environment where you can measure known samples as learning data, you can improve the performance of various analyzers you already own by retrofitting them (laser light sources such as Raman scattering and LA-ICP-MS). It is possible to reduce dependence not only on the analysis method used, but also on all measuring instruments that use a spectrometer) and on the sample.

学習データとして公的研究機関等のデータベース(分光や放射線スペクトル情報)や材料組成が既知である標準試料の計測をすれば良く、装置の解析ソフトウェアに実装するなどハードウェア改修することなく、簡便に各種分析装置固有の性能向上やサンプル依存性の低減が可能である。レーザー、X線や中性子等の光源をプローブに用いる分光計測のみならず、分光機能としてエネルギー分散型X線分析(EDX)が付加された電子顕微鏡(透過電子顕微鏡:TEM-EDX、走査電子顕微鏡:SEM-EDX)、電子プローブマイクロアナライザー(EPMA)等で分光データを面情報として画像化するものまで多種多様な応用が期待される。 All you need to do as learning data is to measure databases from public research institutes (spectral and radiation spectrum information) and standard samples whose material compositions are known, and you can easily use it without modifying the hardware by implementing it in the analysis software of the device. It is possible to improve the performance specific to various analytical devices and reduce sample dependence. In addition to spectroscopic measurements using light sources such as lasers, X-rays, and neutrons as probes, electron microscopes (transmission electron microscopes: TEM-EDX, scanning electron microscopes: A wide variety of applications are expected, including SEM-EDX), electron probe microanalyzer (EPMA), etc., to convert spectral data into images as surface information.

以上、本発明の実施例を述べたが、これらに限定されるものではない。例えば、NMFは、オーケストラの音からバイオリンやビオラ等の因子に分ける機械学習に使われる手法で、バイオリンやビオラの特徴音(参照パラメータ)を作成し分類することができる。このように、様々なビッグデータに対し、本発明を応用することができる。 Although the embodiments of the present invention have been described above, the present invention is not limited thereto. For example, NMF is a method used in machine learning that divides orchestral sounds into factors such as violin and viola, and can create and classify characteristic sounds (reference parameters) of violin and viola. In this way, the present invention can be applied to various types of big data.

また、未知試料内の材料分布や硬度分布を作成しても良いし、多変量解析に応用しても良い。 Furthermore, material distribution and hardness distribution within an unknown sample may be created, or may be applied to multivariate analysis.

100:測定装置
110:試料
110a:標準試料
110b:未知試料
200:チャンバー
210:真空ポンプ
220:制御装置
230:シーケンサ
240:ステージ
300:照射装置
310:照射光
320:放出光
400:分光器
410:検出器
420:スペクトルデータ
430:ベースライン
440:因子
450:因子スコア
460:スコア閾値
500:決定木
100: Measuring device 110: Sample 110a: Standard sample 110b: Unknown sample 200: Chamber 210: Vacuum pump 220: Control device 230: Sequencer 240: Stage 300: Irradiation device 310: Irradiation light 320: Emitted light 400: Spectrometer 410: Detector 420: Spectral data 430: Baseline 440: Factor 450: Factor score 460: Score threshold 500: Decision tree

Claims (6)

想定される化合物種の標準試料についてスペクトルデータを因子分解して因子及び前記因子の影響度を表す因子スコアを導出し、前記化合物種を決定木において前記因子スコアで分類するためのスコア閾値及び前記因子スコアを前記決定木にかける因子適用順を予め学習・設定しておき、
未知試料のスペクトルデータに対して前記標準試料の因子を用いて前記未知試料における因子スコアを算出し、前記因子適用順にしたがって前記決定木で前記未知試料の因子スコアを前記スコア閾値によって分類していくことにより、前記未知試料に含まれる化合物種を同定する、
ことを特徴とする化合物同定方法。
A score threshold for classifying the compound type by the factor score in a decision tree by decomposing the spectral data of a standard sample of the assumed compound type into factors to derive a factor and a factor score representing the degree of influence of the factor. The order in which factors are applied to apply the factor scores to the decision tree is learned and set in advance,
A factor score of the unknown sample is calculated using the factors of the standard sample for the spectral data of the unknown sample, and the factor scores of the unknown sample are classified by the score threshold using the decision tree in accordance with the order of application of the factors. By identifying the compound species contained in the unknown sample,
A compound identification method characterized by:
前記スペクトルデータは、測定値が推定値を上回ったときより下回ったときに誤差が厳しく評価されるように罰則項付き非対称最小二乗法で近似させたベースラインに補正される、
ことを特徴とする請求項1に記載の化合物同定方法。
The spectral data is corrected to a baseline approximated by an asymmetric least squares method with a penalty term so that the error is evaluated more strictly when the measured value is below the estimated value than when it is above the estimated value.
The compound identification method according to claim 1, characterized in that:
前記因子分解は、前記スペクトルデータの波長次元Kと試料数NからなるK行N列の行列を、指定されたM個の非負値基底ベクトルで分解して得られた前記因子の影響度を前記因子スコアとして導出する、
ことを特徴とする請求項1又は2に記載の化合物同定方法。
The factor decomposition is performed by decomposing the K-by-N matrix consisting of the wavelength dimension K and the number of samples N of the spectral data using specified M non-negative basis vectors, and calculating the degree of influence of the factor as described above. derived as a factor score,
The compound identification method according to claim 1 or 2, characterized in that:
前記決定木は、前記化合物種を分類するときに、不純度を用いたコスト関数が最小値となるような因子とスコア閾値を導出しておく、
ことを特徴とする請求項1乃至3の何れか一に記載の化合物同定方法。
The decision tree derives factors and score thresholds such that a cost function using impurity has a minimum value when classifying the compound type.
The compound identification method according to any one of claims 1 to 3, characterized in that:
請求項1乃至4の何れか一に記載の化合物同定方法を実行する、
ことを特徴とする化合物同定装置。
carrying out the compound identification method according to any one of claims 1 to 4,
A compound identification device characterized by:
前記試料にレーザーを照射する照射装置と、
前記レーザーが照射された前記試料から放出された光を分解する分光器と、
前記分光器で生成されたスペクトルデータを取得する検出器と、を有し、
前記検出器から入力されたスペクトルデータを用いて前記試料に含まれる化合物を同定する、
ことを特徴とする請求項5に記載の化合物同定装置。
an irradiation device that irradiates the sample with a laser;
a spectrometer that decomposes light emitted from the sample irradiated with the laser;
a detector for acquiring spectral data generated by the spectrometer;
identifying compounds contained in the sample using spectral data input from the detector;
The compound identification device according to claim 5, characterized in that:
JP2022057807A 2022-03-31 2022-03-31 Compound identification method and compound identification device Pending JP2023149303A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022057807A JP2023149303A (en) 2022-03-31 2022-03-31 Compound identification method and compound identification device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022057807A JP2023149303A (en) 2022-03-31 2022-03-31 Compound identification method and compound identification device

Publications (1)

Publication Number Publication Date
JP2023149303A true JP2023149303A (en) 2023-10-13

Family

ID=88287966

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022057807A Pending JP2023149303A (en) 2022-03-31 2022-03-31 Compound identification method and compound identification device

Country Status (1)

Country Link
JP (1) JP2023149303A (en)

Similar Documents

Publication Publication Date Title
CN113155809B (en) Novel spectral detection method for ore classification and real-time quantitative analysis
JP4247559B2 (en) X-ray fluorescence analyzer and program used therefor
AU2012201146B2 (en) Method of material analysis by means of a focused electron beam using characteristic X-rays and back-scattered electrons and the equipment to perform it
JP6242291B2 (en) Phase analyzer, phase analysis method, and surface analyzer
US10309831B2 (en) Dynamic calibration method for echelle spectrometer in laser-induced breakdown spectroscopy
CN107220625B (en) LIBS spectrum automatic identification and classification method for sample
Motto-Ros et al. Investigation of signal extraction in the frame of laser induced breakdown spectroscopy imaging
Henderson et al. A comparison of PCA and MAF for ToF‐SIMS image interpretation
Müller et al. Enhanced spectral analysis of C-TOF Aerosol Mass Spectrometer data: Iterative residual analysis and cumulative peak fitting
Klus et al. Effect of experimental parameters and resulting analytical signal statistics in laser-induced breakdown spectroscopy
Dai et al. Quantitative determination of Al–Cu–Mg–Fe–Ni aluminum alloy using laser-induced breakdown spectroscopy combined with LASSO–LSSVM regression
CN112834485B (en) Non-calibration method for quantitative analysis of laser-induced breakdown spectroscopy elements
Pagnin et al. Multivariate analysis and laser-induced breakdown spectroscopy (LIBS): a new approach for the spatially resolved classification of modern art materials
JP6868468B2 (en) Image processing equipment, surface analyzer, and image processing method
JP2010060389A (en) Particle analyzer, data analyzer, x-ray analyzer, particle analysis method and computer program
JPH06174663A (en) Analyzing method of contaminant element
CN114813709B (en) Soil component detection method, equipment and system
EP3757557B1 (en) X-ray analysis system and x-ray analysis method
JP2023149303A (en) Compound identification method and compound identification device
JP6588362B2 (en) Phase analyzer, phase analysis method, and surface analyzer
JP2928688B2 (en) Pollution element analysis method and device
Jochum et al. Material Analysis in Fast Industrial Processes by LIBS: Technical and analytical solutions for inline process monitoring
CN113588597A (en) Method for improving analysis precision of furnace slag
US11674913B2 (en) Sample analysis apparatus and method
US11703468B2 (en) Method and system for determining sample composition from spectral data

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20220331