JP2023047736A - データ処理方法及びデータ処理システム - Google Patents

データ処理方法及びデータ処理システム Download PDF

Info

Publication number
JP2023047736A
JP2023047736A JP2021156832A JP2021156832A JP2023047736A JP 2023047736 A JP2023047736 A JP 2023047736A JP 2021156832 A JP2021156832 A JP 2021156832A JP 2021156832 A JP2021156832 A JP 2021156832A JP 2023047736 A JP2023047736 A JP 2023047736A
Authority
JP
Japan
Prior art keywords
data
chromatogram
similarity
components
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2021156832A
Other languages
English (en)
Other versions
JP7517295B2 (ja
Inventor
雄一郎 藤田
Yuichiro Fujita
顕 西尾
Akira Nishio
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2021156832A priority Critical patent/JP7517295B2/ja
Priority to CN202210789952.0A priority patent/CN115856180A/zh
Priority to US17/888,806 priority patent/US20230097148A1/en
Publication of JP2023047736A publication Critical patent/JP2023047736A/ja
Application granted granted Critical
Publication of JP7517295B2 publication Critical patent/JP7517295B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8644Data segmentation, e.g. time windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2133Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on naturality criteria, e.g. with non-negative factorisation or negative correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/74Optical detectors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

【課題】クロマトグラム上で重なった複数成分のピークを行列分解によって分離する。【解決手段】3次元クロマトグラムの実データ、及び実データのクロマトグラム上で互いのピークが重なっている試料中の複数成分のそれぞれのスペクトルデータを準備するデータ準備ステップと、データ準備ステップで準備した複数成分のそれぞれのスペクトルデータの互いに対応する波長領域同士の類似度を、波長領域を変化させながら波長領域ごとに計算する類似度計算ステップと、類似度計算ステップでの計算結果に基づき、類似度が最も低くなる波長領域を対象範囲として設定する対象範囲設定ステップと、複数成分のそれぞれのスペクトルデータを用いて対象範囲設定ステップで設定した対象範囲において実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を備えている。【選択図】図1

Description

本発明は、3次元クロマトグラムのデータ処理方法及びデータ処理システムに関するものである。
フォトダイオードアレイ(PDA)検出器等のマルチチャネル型検出器を用いた液体クロマトグラフ(LC)では、分析カラムから溶出する試料の吸光スペクトルを連続的に取得することによって、時間、波長、及び信号強度(吸光度)の3つの次元を有する3次元クロマトグラムデータを得ることができる。
液体クロマトグラフを用いて試料中の目的成分の定量を行なう場合、目的成分の吸光度が最も大きい波長を用いてクロマトグラムを作成し、そのクロマトグラム上で目的成分のピークの面積値を求めて定量を行なうことが一般的である。しかし、試料に目的成分以外の不純物が含まれることがあり、クロマトグラム上でその不純物のピークが目的成分のピークと重なる場合がある。そのような場合、複数のピークが重なったままでは目的成分や不純物のピーク面積値を求めることができず定量結果が得られないため、クロマトグラム上でピークが重なっている複数の成分を互いに分離する必要がある。
互いに重なった複数成分のピークを分離するための手法として、EMG(Exponential Modified Gaussian)関数等のモデル関数(ピークモデル)を実際のクロマトグラムの波形に当てはめることによって各成分のそれぞれのクロマトグラムを推定する手法(特許文献1参照)の他に、元の3次元クロマトグラムデータを行列分解することで各成分のクロマトグラムを数学的に推定する手法がある。
国際公開第2016/035167号
行列分解によるピークの分離は、元の3次元クロマトグラムデータを指定された数に数学的に分離するだけであるため、分離後の各ピークの形状が実際のピーク形状とは全く異なったものとなり得る。一方で、分離後の各成分のクロマトグラムの波形がピークモデルに依存しないため自由度が高く、ピークモデルの当てはめによる手法よりも高い分離精度が得られる可能性もある。
本発明は、クロマトグラム上で互いに重なった複数成分のピークを行列分解によって高精度に分離できるようにすることを目的とするものである。
本発明者らは、行列分解を用いてクロマトグラム上で重なっている複数成分のピークを分離する前に、それらの複数成分のそれぞれのスペクトルデータを何らかの手法で取得し、それらのスペクトルデータを行列分解の基礎として使用するとの発想に至った。ただし、分離対象の複数成分のスペクトルの全体的な波形が互いに似ている場合、それらのスペクトルデータを単純に行列分解に利用しただけでは、ピークの分離を高精度に行なうことは難しい。ここで、本発明者らは、分離対象の複数成分のスペクトルデータの互いに対応する波長領域同士の類似度を網羅的に評価し、互いの類似度が低い波長領域でスペクトルデータを用いた行列分解を実行することにより、行列分解によるピーク分離の精度を向上させることができるとの知見を得た。本発明はこのような知見に基づいてなされている。
本発明に係るデータ処理方法は、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを準備するデータ準備ステップと、前記データ準備ステップで準備した前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、前記類似度計算ステップでの計算結果に基づき、前記複数成分のそれぞれの前記スペクトルデータ同士の全体の類似度よりも低い前記類似度の波長領域を探索して対象範囲を設定する対象範囲設定ステップと、前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を備えている。
本発明に係るデータ処理システムは、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び、前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを記憶するデータ記憶部と、前記データ記憶部に記憶されている前記実データと前記スペクトルデータとを用いて前記試料中における前記複数成分のピークの分離処理を行なうように構成されたデータ処理部と、を備えている。そして、前記データ処理部は、前記データ記憶部に記憶されている前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、前記類似度計算ステップでの計算結果に基づき、前記複数成分のそれぞれの前記スペクトルデータ同士の全体の類似度よりも低い前記類似度の波長領域を探索して対象範囲を設定する対象範囲設定ステップと、前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を実行するように構成されている。
本発明に係るデータ処理方法及びデータ処理システムによれば、試料についての3次元クロマトグラムの実データとともにクロマトグラム上で互いのピークが重なっている複数成分のそれぞれのスペクトルデータを準備し、前記複数成分のスペクトルデータの互いに対応する波長領域同士の類似度を、波長領域を網羅的に変えながら波長領域について計算し、その計算結果に基づいて類似度の低い波長領域を探索し、その探索結果に基づいて対象範囲を設定し、設定した対象範囲内でスペクトルデータを用いた実データの行列分解を実行するので、前記複数成分のピークを高精度に分離することができる。
データ処理方法の一実施例を概略的に示すフローチャートである。 同データ処理方法を実行するデータ処理システムの一実施例を概略的に示すブロック図である。 同データ処理システムによるデータ処理の一例を示すフローチャートである。 ピークモデルの当てはめによるピーク分離の一例を示す図であり、(A)は実データのある波長におけるクロマトグラムを示し、(B)は同クロマトグラムにピークモデルが当てはめられている状態を示している。 同データ処理方法における類似度の計算結果のヒートマップの一例を示す図である。
以下、本発明に係るクロマトグラムのデータ処理方法及びデータ処理システムの実施例について、図面を参照しながら説明する。
図1にデータ処理方法の一実施例を概略的に示す。
この実施例のデータ処理方法は、試料をクロマトグラフィ分析することにより取得されたスペクトルとクロマトグラムからなる3次元クロマトグラムデータを用い、クロマトグラム上で互いに重なっている複数成分のピークを分離するための方法である。
この方法では、まず、試料についての3次元クロマトグラムの実データを準備するとともに、その実データのクロマトグラム上で互いのピークが重なっている複数成分のそれぞれのスペクトルデータを準備する(ステップ101)。分離対象の前記複数成分のそれぞれのスペクトルデータはどのような手法によって取得されたものであってもよい。前記複数成分が既知である場合には、それらの成分を個別に分析してそれぞれのスペクトルデータを取得することができる。分離対象の前記複数成分が未知である場合は、試料の3次元クロマトグラムの実データに対してピークモデルの当てはめによるピーク分離を実行することでスペクトルの推定データを作成し、その推定データを各成分のスペクトルデータとして用いることができる。ピークモデルの当てはめによるピーク分離のアルゴリズムとしては、例えば特許文献1(国際公開第2016/035167号)に開示されているものが挙げられる。
次に、分離対象の前記複数成分のそれぞれのスペクトルデータ間で互いに対応する波長領域同士の類似度を、波長領域を網羅的に変えながら波長領域ごとに計算する(ステップ102)。その後、類似度の計算結果に基づいて、各成分のスペクトルデータ全体としての互いの類似度よりも類似度が低い波長領域(例えば、類似度を計算した波長領域のうちで類似度が最も低くなる波長領域)を探索し、その波長領域を行列分解の対象範囲として設定する(ステップ103)。そして、設定した対象範囲において各成分のスペクトルデータを基礎とした3次元クロマトグラムの行列分解を実行し、各成分のクロマトグラムデータを作成する(ステップ104)。行列分解として、NMF(非負値行列因子分解)などを用いることができる。行列分解は、作成した各成分のクロマトグラムデータの合成結果が実データに対して一定の近似度をもつまで繰り返し実行することができる。
上述のデータ処理方法を実行するためのデータ処理システムの一実施例を図2に示す。
データ処理システム1は、データ記憶部2、及びデータ処理部4を備えている。データ処理システム1には分析装置100で取得された分析データが取り込まれる。分析装置100は、試料について液体クロマトグラフィ分析を実施して一定時間ごとの吸光度スペクトルを取得するように構成されている。すなわち、分析装置1には、分析装置100からクロマトグラムとスペクトルからなる3次元クロマトグラムデータが取り込まれる。
データ記憶部2は、分析装置100から取り込まれた3次元クロマトグラムの実データ、及び分離対象の複数成分のそれぞれのスペクトルデータを記憶しておく記憶領域である。データ記憶部2は、不揮発性メモリ、又はハードディスクドライブなどによって実現することができる。
データ処理部4は、ピークモデル当てはめによるピーク分離アルゴリズムを用いて、実データのクロマトグラム上で互いのピークが重なっている複数成分のそれぞれのクロマトグラムの推定データとスペクトルの推定データを作成する第1の機能と、その第1の機能によって作成した各成分のクロマトグラムの推定データ及びスペクトルの推定データを、行列分解アルゴリズムを用いて調整する第2の機能と、を備えている。データ処理部4は、CPU(中央演算処理装置)を備えたコンピュータ回路においてプログラムが実行されることによって実現される機能である。
データ記憶部2は、データ処理部4の第1の機能によって作成された各成分のスペクトルの推定データを各成分のそれぞれのスペクトルデータとして記憶することができる。データ処理部4の第2の機能では、データ記憶部2に記憶された各成分のスペクトルの推定データを用いて行列分解の対象範囲を限定し、限定した対象範囲において行列分解を実行することができる。
データ処理システム1において実行されるピーク分離処理の一例について図3のフローチャートを用いて説明する。
ピーク分離処理が開始されると、データ処理部4は、予め準備されたデータベース上で実データのクロマトグラムの波形を近似するために必要なピークモデルを探索し、該当のクロマトグラムにピークモデルに当てはめる(ステップ201)。そして、クロマトグラムに当てはめたピークモデルに基づいて複数成分のそれぞれのピーク形状を推定することにより、複数成分のピークを互いに分離する(ステップ202)。例えば、実データにおけるある波長でのクロマトグラムの波形が図4(A)に示されるものであった場合、図4(B)に示されているように、この波形を近似するために3つのピークモデルが当てはめられる。その結果、このクロマトグラムの波形が3つのピークP1~P3の重なりによって形成されたものであると推定され、3つのピークP1~P3に分離される。
データ処理部4は、ピークモデルの当てはめによるピークの分離結果に基づき、複数成分のそれぞれについてのクロマトグラム及びスペクトルの推定データを作成する(ステップ203)。ここまでのステップ201~203は、データ処理部4の第1の機能によるものである。
次に、データ処理部4は、ステップ203で作成した各成分のスペクトルの推定データの互いに対応する波長領域同士の類似度を、波長領域を網羅的に変化させながら波長領域ごとに計算する(ステップ204)。類似度としてはcos類似度を用いることができる。このステップ204において波長領域を網羅的に変化させる方法は特に限定されないが、一例として、波長領域の最小波長と幅(類似度を求める範囲)をそれぞれ変化させていく方法が挙げられる。図5は、波長領域の最小波長と幅をそれぞれ変化させながら類似度を計算することにより作成されたヒートマップの一例である。ヒートマップの横軸は波長領域の最小波長、縦軸は波長領域の幅である。ヒートマップの右上のハッチングされた三角形の領域は、波長領域の幅が実際のデータ領域を超えるために類似度が計算できない領域である。例えば最小波長が250nmで波長領域の幅が70nmの場合、波長領域の最大波長が320nmとなり、300nmを超えるため計算することができない。データ処理部4は、このようなヒートマップを作成してディスプレイ(図示は省略)に表示する機能を備えていてもよい。なお、ヒートマップは必ずしも作成される必要はない。
上記ステップ204が終了した後、データ処理部4は、ステップ204での計算結果に基づいて類似度が最も低い波長領域を特定し、その波長領域を行列分解の対象範囲として設定する(ステップ205)。なお、波長領域の幅が極端に狭い場合は類似度を正しく評価することができないため、一定幅(例えば25nm)以上の波長領域を対象範囲として設定することが望ましい。なお、ステップ204において、類似度を計算する波長領域の幅を一定値(例えば25nm)以上に限定してもよい。なお、ここでは、データ処理部4が行列分解の対象範囲を自動的に設定するように説明されているが、本発明はこれに限定されない。データ処理部4は、ステップ204において波長領域ごとの類似度を計算して図5のような計算結果をユーザに対して示し、ユーザに対象範囲を設定させるようにしてもよい。
対象範囲を設定した後、データ処理部4は、ステップ203で作成した各成分のクロマトグラム及びスペクトルの推定データを合成して3次元クロマトグラムの疑似データを作成し(ステップ206)、実データに対する疑似データの類似度を計算する(ステップ207)。ここでの「類似度」は、疑似データが実データにどれだけ類似しているかを数値で表すものであればよい。そのため、類似度の計算方法は特に限定されないが、例えば3次元クロマトグラムの各点における疑似データの数値と実データの数値との差分の二乗の合計値を類似度とすることができる。
データ処理部4は、ステップ207で求めた類似度が良化するように、すなわち、疑似データがより実データに近づくように、行列分解を用いて各成分の推定データのパラメータを調整する(ステップ209)。その後、データ処理部4は、調整後の推定データに基づいて3次元クロマトグラムの疑似データを作成し(ステップ206)、作成した疑似データの実データに対する類似度を評価する(ステップ207、208)。このように、ステップ206~209を繰り返し、実データに対する疑似データの類似度が所定条件を満たしたときに、推定データの調整を終了する(ステップ208:Yes)。所定条件としては、類似度が予め設定されたしきい値を下回る(若しくは上回る)こと、又は、推定データの調整後の疑似データの実データに対する類似度が一定の値に収束すること、が挙げられる。ステップ204~209が、データ処理部4の第2の機能によるものである。
データ処理部4の第2の機能による上記ステップ204~209により、第1の機能によって作成された各成分のクロマトグラム及びスペクトルの推定データが、各スペクトルデータ間の類似度が低い波長領域のデータを用いて、ピークモデルによる形状の制約を受けずに調整される。分離対象の複数成分のそれぞれのスペクトルデータが全体的に見ると互いに似ている場合、それらのスペクトルデータを用いて行列分解を実行しても、各成分のクロマトグラムを正確に推定することは難しい。しかし、複数成分のそれぞれのスペクトルデータのうち互いの類似度がスペクトルデータ全体で評価するよりも低い領域、すなわち、各成分の吸光度特性の違いが現れている領域、に解析対象範囲を絞って行列分解を実行することで、各成分のクロマトグラムの推定精度を向上させることができる。
以上において説明した実施例は、本発明に係るデータ処理方法及びデータ処理システムの実施形態を例示したに過ぎない。本発明に係るデータ処理方法及びデータ処理システムの実施形態は以下に示すとおりである。
本発明に係るデータ処理方法の一実施形態では、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを準備するデータ準備ステップと、
前記データ準備ステップで準備した前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、
前記類似度計算ステップでの計算結果に基づき、前記類似度が最も低くなる波長領域を対象範囲として設定する対象範囲設定ステップと、
前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を備えている。
データ処理方法の上記一実施形態の第1局面では、データ準備ステップにおいて、予め準備されたピークモデルを当てはめることによって前記実データの前記クロマトグラムの波形を近似し、前記クロマトグラムに当てはめた前記ピークモデルを用いて前記複数成分のそれぞれのスペクトルの推定データとクロマトグラムの推定データを作成する。そして、前記類似度計算ステップ及び前記ピーク分離ステップにおいて使用する前記スペクトルデータは前記データ準備ステップで作成された前記スペクトルの推定データであり、前記ピーク分離ステップにより作成する前記クロマトグラムデータは、前記データ準備ステップで作成した前記クロマトグラムの推定データに基づくものである。このような態様によれば、ピークモデルの当てはめによるピーク分離アルゴリズムを利用して作成した各成分のクロマトグラムとスペクトルの推定データを、ピークモデルの制約を受けない行列分解アルゴリズムを利用して調整することができ、高いピーク分離精度が得られる。
データ処理方法の上記一実施形態の第2局面では、前記行列分解として非負値行列因子分解を用いる。この第2局面は上記第1局面と組み合わせることができる。
データ処理方法の上記一実施形態の第3局面では、前記類似度計算ステップにおいて、前記波長領域の最小波長と波長幅を変化させながら前記類似度を計算する。この第3局面は上記第1局面及び/又は第2局面と組み合わせることができる。
本発明に係るデータ処理システムの一実施形態では、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び、前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを記憶するデータ記憶部(2)と、
前記データ記憶部(2)に記憶されている前記実データと前記スペクトルデータとを用いて前記試料中における前記複数成分のピークの分離処理を行なうように構成されたデータ処理部(4)と、を備え、
前記データ処理部(4)は、
前記データ記憶部(2)に記憶されている前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、
前記類似度計算ステップでの計算結果に基づき、前記類似度が最も低くなる前記波長領域を対象範囲として設定する対象範囲設定ステップと、
前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を実行するように構成されている。
データ処理システムの上記一実施形態の第1局面では、前記データ処理部(4)は、前記類似度計算ステップの前に、予め準備されたピークモデルを当てはめることによって前記実データの前記クロマトグラムの波形を近似し、前記クロマトグラムに当てはめた前記ピークモデルを用いて前記複数成分のそれぞれのスペクトルの推定データとクロマトグラムの推定データを作成するデータ準備ステップを実行し、前記類似度計算ステップ及び前記ピーク分離ステップにおいて、前記データ準備ステップで作成した前記スペクトルの推定データを前記スペクトルデータとして使用し、前記ピーク分離ステップにおいて、前記データ準備ステップで作成した前記クロマトグラムの推定データに基づいて前記クロマトグラムデータを作成するように構成されている。このような態様によれば、ピークモデルの当てはめによるピーク分離アルゴリズムを利用して作成した各成分のクロマトグラムとスペクトルの推定データを、ピークモデルの制約を受けない行列分解アルゴリズムを利用して調整することができ、高いピーク分離精度が得られる。
データ処理システムの上記一実施形態の第2局面では、前記行列分解として非負値行列因子分解を用いる。この第2局面は上記第1局面と組み合わせることができる。
データ処理システムの上記一実施形態の第3局面では、前記データ処理部(4)は、前記類似度計算ステップにおいて、前記波長領域の最小波長と波長幅を変化させながら前記類似度を計算するように構成されている。この第3局面は上記第1局面及び/又は第2局面と組み合わせることができる。
1 データ処理システム
2 実データ記憶部
4 データ処理部
100 分析装置

Claims (8)

  1. 複数の成分が含まれる試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを準備するデータ準備ステップと、
    前記データ準備ステップで準備した前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、
    前記類似度計算ステップでの計算結果に基づき、前記複数成分のそれぞれの前記スペクトルデータ同士の全体の類似度よりも低い前記類似度の波長領域を探索して対象範囲を設定する対象範囲設定ステップと、
    前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を備えているデータ処理方法。
  2. 前記データ準備ステップでは、予め準備されたピークモデルを当てはめることによって前記実データの前記クロマトグラムの波形を近似し、前記クロマトグラムに当てはめた前記ピークモデルを用いて前記複数成分のそれぞれのスペクトルの推定データとクロマトグラムの推定データを作成し、
    前記類似度計算ステップ及び前記ピーク分離ステップにおいて使用する前記スペクトルデータは前記データ準備ステップで作成された前記スペクトルの推定データであり、
    前記ピーク分離ステップにより作成する前記クロマトグラムデータは、前記データ準備ステップで作成した前記クロマトグラムの推定データに基づくものである、請求項1に記載のデータ処理方法。
  3. 前記行列分解は非負値行列因子分解である、請求項1又は2に記載のデータ処理方法。
  4. 前記類似度計算ステップでは、前記波長領域の最小波長と波長幅を変化させながら前記類似度を計算する、請求項1から3のいずれか一項に記載のデータ処理方法。
  5. 試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び、前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを記憶するデータ記憶部と、
    前記データ記憶部に記憶されている前記実データと前記スペクトルデータとを用いて前記試料中における前記複数成分のピークの分離処理を行なうように構成されたデータ処理部と、を備え、
    前記データ処理部は、
    前記データ記憶部に記憶されている前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、
    前記類似度計算ステップでの計算結果に基づき、前記複数成分のそれぞれの前記スペクトルデータ同士の全体の類似度よりも低い前記類似度の波長領域を探索して対象範囲を設定する対象範囲設定ステップと、
    前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を実行するように構成されている、データ処理システム。
  6. 前記データ処理部は、前記類似度計算ステップの前に、予め準備されたピークモデルを当てはめることによって前記実データの前記クロマトグラムの波形を近似し、前記クロマトグラムに当てはめた前記ピークモデルを用いて前記複数成分のそれぞれのスペクトルの推定データとクロマトグラムの推定データを作成するデータ準備ステップを実行し、前記類似度計算ステップ及び前記ピーク分離ステップにおいて、前記データ準備ステップで作成した前記スペクトルの推定データを前記スペクトルデータとして使用し、前記ピーク分離ステップにおいて、前記データ準備ステップで作成した前記クロマトグラムの推定データに基づいて前記クロマトグラムデータを作成するように構成されている、請求項5に記載のデータ処理システム。
  7. 前記行列分解は非負値行列因子分解である、請求項5又は6に記載のデータ処理システム。
  8. 前記データ処理部は、前記類似度計算ステップにおいて、前記波長領域の最小波長と波長幅を変化させながら前記類似度を計算するように構成されている、請求項5から7のいずれか一項に記載のデータ処理システム。
JP2021156832A 2021-09-27 2021-09-27 データ処理方法及びデータ処理システム Active JP7517295B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021156832A JP7517295B2 (ja) 2021-09-27 2021-09-27 データ処理方法及びデータ処理システム
CN202210789952.0A CN115856180A (zh) 2021-09-27 2022-07-05 数据处理方法及数据处理系统
US17/888,806 US20230097148A1 (en) 2021-09-27 2022-08-16 Data processing method and data processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021156832A JP7517295B2 (ja) 2021-09-27 2021-09-27 データ処理方法及びデータ処理システム

Publications (2)

Publication Number Publication Date
JP2023047736A true JP2023047736A (ja) 2023-04-06
JP7517295B2 JP7517295B2 (ja) 2024-07-17

Family

ID=85660220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021156832A Active JP7517295B2 (ja) 2021-09-27 2021-09-27 データ処理方法及びデータ処理システム

Country Status (3)

Country Link
US (1) US20230097148A1 (ja)
JP (1) JP7517295B2 (ja)
CN (1) CN115856180A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117907511B (zh) * 2024-03-20 2024-06-14 浙江灵析精仪科技发展有限公司 一种多组分重叠峰的自动化解析方法、装置及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005091068A (ja) 2003-09-16 2005-04-07 Sumitomo Chemical Co Ltd 着色試料の分析方法および分析装置
JP6260709B2 (ja) 2014-09-03 2018-01-17 株式会社島津製作所 クロマトグラムデータ処理方法及び装置

Also Published As

Publication number Publication date
CN115856180A (zh) 2023-03-28
JP7517295B2 (ja) 2024-07-17
US20230097148A1 (en) 2023-03-30

Similar Documents

Publication Publication Date Title
US6393368B1 (en) Method and apparatus for analyzing multi-channel chromatogram
JP6065981B2 (ja) クロマトグラフ用データ処理装置及び方法
EP2705338B1 (en) Estimation of background radiation in spectral data by polynomial fitting
WO2014064447A1 (en) Spectroscopic apparatus and methods
US20140046630A1 (en) Spectroscopic apparatus and methods
WO2018025361A1 (ja) 分析データ処理方法及び分析データ処理装置
Rutledge Comparison of principal components analysis, independent components analysis and common components analysis
JPWO2017119086A1 (ja) クロマトグラムデータ処理方法及び装置
JP7517295B2 (ja) データ処理方法及びデータ処理システム
EP2520914A1 (en) Estimation of background radiation in spectral data by polynomial fitting
JP7018321B2 (ja) スペクトル処理装置及び方法
Tesser et al. Selecting efficient VM types to train deep learning models on Amazon SageMaker
CN114364971B (zh) 用于确定样品中存在的组分的光谱装置和方法
US10802095B2 (en) Apparatus and method for processing spectrum
US20230132326A1 (en) Data processing method, data processing system, and computer program
US20230112812A1 (en) Data processing method and data processing system
US20230280318A1 (en) Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
US11946916B2 (en) Waveform processing assistance device and waveform processing assistance method
US20230280316A1 (en) Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
Murphy et al. Package ‘likelihood’
CN106649606B (zh) 优化搜索结果的方法及装置
JP6269803B2 (ja) クロマトグラフ用データ処理装置及び方法
JP2023092883A (ja) スペクトル解析方法、装置およびシステム
JPH05149935A (ja) Gc/msデータ処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231219

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20231219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240116

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240617

R150 Certificate of patent or registration of utility model

Ref document number: 7517295

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150