JPWO2016035167A1 - クロマトグラムデータ処理方法及び装置 - Google Patents

クロマトグラムデータ処理方法及び装置 Download PDF

Info

Publication number
JPWO2016035167A1
JPWO2016035167A1 JP2016546242A JP2016546242A JPWO2016035167A1 JP WO2016035167 A1 JPWO2016035167 A1 JP WO2016035167A1 JP 2016546242 A JP2016546242 A JP 2016546242A JP 2016546242 A JP2016546242 A JP 2016546242A JP WO2016035167 A1 JPWO2016035167 A1 JP WO2016035167A1
Authority
JP
Japan
Prior art keywords
chromatogram
waveform
peak
data
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016546242A
Other languages
English (en)
Other versions
JP6260709B2 (ja
Inventor
陽 野田
陽 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of JPWO2016035167A1 publication Critical patent/JPWO2016035167A1/ja
Application granted granted Critical
Publication of JP6260709B2 publication Critical patent/JP6260709B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8675Evaluation, i.e. decoding of the signal into analytical information
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/26Conditioning of the fluid carrier; Flow patterns
    • G01N30/38Flow patterns
    • G01N30/46Flow patterns using more than one column
    • G01N30/461Flow patterns using more than one column with serial coupling of separation columns
    • G01N30/463Flow patterns using more than one column with serial coupling of separation columns for multidimensional chromatography

Landscapes

  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Treatment Of Liquids With Adsorbents In General (AREA)

Abstract

クロマトグラム上で重なったピークの分離に混合ガウス分布のEMアルゴリズムを応用する。ただし、ここではモデル数、つまり重なっている成分数自体が不明であるため、モデル数を適当に設定して(S1)EMアルゴリズムにより、実測信号を各モデルに適切に分配しながらモデルパラメータの当てはめを行う(S2、S3)。そして、解が収束したならば(S4でYes)、分配されなかった残渣信号にピーク状波形があるか否かを判定し(S5)、ピーク状波形があればピークモデルを追加して(S6)再びEMアルゴリズムを実行する。Mステップでは、単純なガウス関数だけでなく、テーリングを想定した変形ガウス関数を用いた最適化も行う。また、Mステップでは、クロマトグラムを仮定したスペクトルの推定と、スペクトルを仮定したクロマトグラムの推定とを繰り返し行うことで、クロマトグラム波形とスペクトル波形両方の最適化を行う。

Description

本発明は、フォトダイオードアレイ(PDA)検出器等のマルチチャンネル型検出器や質量分析計を検出器として用いた液体クロマトグラフ(LC)若しくはガスクロマトグラフ(GC)、又は、包括的2次元ガスクロマトグラフ(「GC×GC」とも呼ばれる)、包括的2次元液体クロマトグラフ(「LC×LC」とも呼ばれる)などの分析装置により収集されたクロマトグラムデータを処理するクロマトグラムデータ処理方法及び装置に関し、さらに詳しくは、クロマトグラム上やスペクトル上で重なっている異なる成分由来のピークを分離するためのクロマトグラムデータ処理方法及び装置に関する。
PDA検出器等のマルチチャンネル型検出器を用いた液体クロマトグラフでは、移動相への試料の注入時点を基点とし、カラム出口から溶出する試料液に対して吸光スペクトルを繰り返し取得することで、時間、波長、及び吸光度(信号強度)という三つのディメンジョンを持つ3次元クロマトグラムデータを得ることができる。また、検出器として質量分析計を用いた液体クロマトグラフやガスクロマトグラフ、つまり液体クロマトグラフ質量分析計やガスクロマトグラフ質量分析計では、質量分析計において所定の質量電荷比範囲のスキャン測定を繰り返すことで、時間、質量電荷比、及び信号強度(イオン強度)という三つのディメンジョンを持つ3次元クロマトグラムデータを得ることができる。さらにまた、包括的2次元ガスクロマトグラフや包括的2次元液体クロマトグラフでは、互いに分離特性が相違する1次元目カラム及び2次元目カラムにおけるそれぞれの保持時間、及び信号強度という、実質的に三つのディメンジョンを持つ3次元クロマトグラムデータを得ることができる。
以下の説明では、3次元クロマトグラムデータを得られる分析装置としてPDA検出器を用いた液体クロマトグラフ(以下、特に明記しない限り、PDA検出器を用いた液体クロマトグラフを単に「液体クロマトグラフ」という)を例に挙げるが、液体クロマトグラフ質量分析計、ガスクロマトグラフ質量分析計、包括的2次元液体クロマトグラフ、包括的2次元ガスクロマトグラフにおいても事情は同様である。
図13(a)は、上述した液体クロマトグラフにより得られる3次元クロマトグラムデータの概念図である。この3次元クロマトグラムデータから特定の波長(例えばλ0)における時間方向の吸光度データを抽出することで、その特定の波長λ0における測定時刻(つまりは保持時間)と吸光度との関係を示す、同図(b)に示すような波長クロマトグラム(以下、単に「クロマトグラム」という)を作成することができる。また、3次元クロマトグラムデータから特定の時点(測定時刻)における波長方向の吸光度を示すデータを抽出することで、該時点における波長と吸光度との関係を示す吸光スペクトル(以下、単に「スペクトル」という)を作成することができる。即ち、図13(a)に示すような3次元クロマトグラムデータは、波長方向にスペクトル情報を、時間方向にクロマトグラム情報を有しているということができる。
こうした液体クロマトグラフを用いて試料に含まれる既知の目的成分の定量を行う場合には、通常、その目的成分による光の吸収が最も大きく現れる吸収波長におけるクロマトグラムを作成する。そして、そのクロマトグラム上で目的成分由来のピークの始点Ts及び終点Teを見つけてピークの面積値を計算し、そのピーク面積値を予め求めておいた検量線に照らして定量値を算出するのが一般的である。
このようにして試料中の目的成分を定量する際に、作成したクロマトグラムに現れているピークが目的成分のみに由来するものであれば問題ないが、ピークは必ずしも単一成分(目的成分)によるものとは限らず、分析者が意図しない不純物(広く言えば目的成分以外の成分)由来の信号が重なっている場合がよくある。こうしたことに分析者が気付かずに定量計算を行うと、定量精度を損なうことになる。そこで、通常、定量計算に先立って、クロマトグラムに現れているピークが目的成分のみに由来するのか、或いは他の成分を含んでいるのか、の判定、いわゆるピーク純度判定が行われる。そして、着目しているピークに目的成分以外の成分由来のピークの重なりがある場合には、目的成分由来のピークと他の成分由来のピークとを分離するピーク分離処理を実行し、目的成分のみに由来する純度の高いピークを求め、該ピークに基づき定量計算を行うようにしている。
上記ピーク純度判定処理やピーク分離処理として、従来から様々な手法が知られ実用に供されている。
例えば特許文献1に記載のピーク分離処理では、目的成分の吸収波長を分析者が指定すると、時間方向に並んだ各スペクトル上でそれぞれ吸収波長付近における波長方向の微分値が計算され、その微分値を時間方向に並べた微分クロマトグラムが生成される。スペクトル上の上記吸収波長の位置に現れるピークに他の成分の重なりがある場合、微分クロマトグラムは平坦にならずにピークが現れる。そこで、この微分クロマトグラム上のピークの有無に応じて他の成分の重なりの有無を判定するとともに、この微分クロマトグラム上のピークの波形形状等を利用してスペクトル上やクロマトグラム上で複数の成分のピークを分離する。
しかしながら、こうした手法では、分析者自身が目的成分特有の吸収波長を指定する必要があり、そのためには或る程度の経験や熟練が分析者に必要である。即ち、分析作業に或る程度熟練した分析者による手作業が必要となる。また、このピーク分離処理手法では、二つの成分が重なったピークは分離できても、3以上の成分が重なったピークをそれぞれ分離するのは困難である。
ピーク分離処理の他の手法としてよく知られているのは、デコンボリューションを用いた手法である。例えば特許文献2に記載の手法では、得られたクロマトグラムに対し、おおまかなクロマトグラム波形形状としてガウス関数を利用したデコンボリューション処理や多変量解析処理(因子分析)などを行い、その結果から、成分の重なりのないスペクトル波形をまず求める。そして、得られたスペクトルに基づいてクロマトグラム波形を推定することにより、クロマトグラム上のピークを分離している。
しかしながら、このようにデコンボリューション処理を用いてスペクトルを先行的に推定し、そのあとに推定したスペクトル波形を用いて今度はクロマトグラム波形を推定するという手法の場合、クロマトグラムピークのテーリングにショルダーピークが存在すると原理的に解くことができず、適切なピーク分離が行えないという問題がある。図14(a)〜(d)により、一例を説明する。
図14(a)は、横軸の時間をxとしたときに、exp(−x2)+0.1*exp(−(x−3)2)で示される、ショルダーピークを含む関数である。この波形に、図14(b)に示されるexp(−x)のインパルス応答を乗じた結果が図14(c)に示した波形である。この波形をガウス関数を用いて理想的にデコンボリューション処理すると、図14(d)に示すような波形が得られる。この図14(d)に示す波形は単純な減衰曲線とはなっていない。これは、デコンボリューション処理を行ってもショルダーピークに対応する保持時間におけるスペクトルに、主たるピークの成分が混入してしまうことを示している。
また、特許文献2に記載の手法では、重なっている他の成分を排して純度の高いスペクトルを推定する際に、そのスペクトルの要素が正値に限られるといった非負制限が課される。しかしながら、一般にPDA検出器で得られるスペクトルは多次元ベクトルとして見たときに、互いに従属な成分を多分に含んでいるため、単純な非負制限などの条件を課しただけでは異なる成分由来のスペクトル同士を分離することは困難である。即ち、クロマトグラム波形形状が自然なものとなる(クロマトグラムらしい波形となる)といった非負制限以外の制限を課すことなく、ショルダーピークのトップに対応する保持時間において観測されるスペクトルから、主たるピーク由来のスペクトル成分だけを引き去ることは困難である。
こうしたことから、特許文献2に記載の手法に限らず、まず純粋なスペクトルを推定した後にクロマトグラム波形形状を求めるという手順を採る全ての手法は、或るピークのテーリングに生じたショルダーピークを適切に扱うことができず、こうした波形形状のクロマトグラムピークの分離には適さないといえる。
国際公開第2013/035639号 特開平8−15247号公報
マクラクラン(Geoffrey J. McLachlan)、ほか1名、「ザ・イーエム・アルゴリズム・アンド・イクステンションズ(The EM Algorithm and Extensions)」、ウィレイ・シリーズ・イン・プロバビリティ・アンド・スタティスティクス(Wiley Series in Probability and Statistics)、2008年 ビルメス(J. A. Bilmes)、「ア・ジェントル・チュートリアル・オブ・ジ・イーエム・アルゴリズム・アンド・イッツ・アプリケイション・トゥー・パラメータ・エスティメイション・フォー・ガウシアン・ミクスチャ・アンド・ヒドゥン・、マルコフ・モデルズ(A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models)」、テクニカル・レポート(Technical Report) TR-97-021、インターナショナル・コンピュータ・サイエンス・インスティチュート・アンド・コンピュータ・サイエンス・ディビジョン(International Computer Science Institute and Computer Science Division)、ユニバーシティ・オブ・カリフォルニア・アット・バークレー(University of California at Berkeley)、1998年
本発明は上記課題を解決するために成されたものであり、その目的とするところは、上述したような3次元クロマトグラムデータに基づいて、3以上の複数のピークが重なっているピークや、テーリングにショルダーピークがあるピークに対しても自動的に、つまり分析者による面倒な判断を伴う入力等を要することなく、適切に各試料成分由来のピークを分離したクロマトグラムやスペクトルを得ることができるクロマトグラムデータ処理方法及び装置を提供することである。
一般に、クロマトグラムやスペクトルにおいて、純粋である(つまり他の成分の重なりのない)或る一つの成分に由来して現れるピークの形状は、ガウス関数で以て近似的に表すことができる。したがって、通常、クロマトグラム、スペクトルのいずれにおいても、複数の成分由来のピークが重なっているピークの形状は、複数のガウス関数を線形結合した混合ガウス分布(GMM=Gaussian Mixture Model)であるとみなすことができる。
或る信号波形が与えられたとき、尤もらしい混合ガウス分布を導出する手法として、混合ガウス分布の期待値最大化(EM:Expectation Maximization、以下、慣用に従って「EM」と称す)アルゴリズムがよく知られている。
EMアルゴリズムは反復法の一種であり、尤度関数の条件付き確率に関する期待値を計算する期待値(E)ステップと、期待値を最大化する解を求める最大化(M)ステップと、の二つのステップを繰り返すことで最尤推定解を求める手法であり、非特許文献1、2など各種文献に詳細に記載されている。混合ガウス分布のEMアルゴリズムでは、通常、最適なモデル数が予め計算条件の一つとして与えられる。それに対し、ここで問題としているピーク分離処理の場合、3次元クロマトグラムデータのうちの一方の2次元方向はクロマトグラム情報であり別の2次元方向はスペクトル情報であってそれらは全く別の種類の情報であるといったデータ形式上の特徴に加え、混合ガウス分布のモデル数、つまり重なっているピークの数自体が不明であるという特徴があり、一般的な混合ガウス分布のEMアルゴリズムをそのまま適用することはできない。
そこで本発明者は、ここで取り扱うデータの特徴や目的に対応するように混合ガウス分布のEMアルゴリズムを改良・変形し、クロマトグラム上で時間的に重なっている複数の成分由来のそれぞれの純粋なクロマトグラムを高い確度で推定し、ピークを良好に分離できるようにした。
即ち、上記課題を解決するために成された本発明は、測定対象である試料に対して収集された、時間、信号強度、及び第3のディメンジョンを有する3次元クロマトグラムデータを処理するクロマトグラムデータ処理方法であり、例えば混合ガウス分布のEM(期待値最大化)アルゴリズムのように、ピークモデル関数の当てはめを2段階のステップに分けて行うことにより、時間と信号強度とをそれぞれ軸とするクロマトグラム上で重なっている、前記試料に含まれる複数の成分に由来するピークを分離するクロマトグラムデータ処理方法において、
a)時間と信号強度とをそれぞれ軸とするクロマトグラムの波形形状及び第3のディメンジョンと信号強度とをそれぞれ軸とするスペクトルの波形形状についての、予め与えられた推定結果又は後記当てはめ実行ステップによる推定結果のいずれかである波形形状モデルに基づいて、与えられた3次元クロマトグラムデータを1又は複数の成分に分配し、成分毎の3次元クロマトグラムデータを求めるデータ分配ステップと、
b)前記データ分配ステップにより得られた成分毎の3次元クロマトグラムデータから求まるクロマトグラム及びスペクトルに対し、クロマトグラム波形形状及びスペクトル波形形状の当てはめをそれぞれ行うことで、各成分に対応する波形形状モデルのパラメータを修正する当てはめ実行ステップであって、クロマトグラム波形形状が正しいとの仮定の下にスペクトル波形を最小二乗法により求める第1ステップと、スペクトル波形形状が正しいとの仮定の下にクロマトグラム波形を最小二乗法により求める第2ステップとを繰り返し実行することで当てはめの尤もらしさを高める当てはめ実行ステップと、
c)前記データ分配ステップ及び前記当てはめ実行ステップを規定回数だけ又は解が収束したとみなせるまで繰り返し実行したあと、その時点で得られる各成分に対応するスペクトルと直交するスペクトル成分を抽出する又は強調するように、与えられた3次元クロマトグラムデータをフィルタリング処理し、そのフィルタリング後のデータに現れるピーク状波形の高さに基づいて、さらに別の成分が前記試料に含まれているか否かを判定する含有成分判定ステップと、
を有することを特徴としている。
即ち、本発明に係るクロマトグラムデータ処理方法において、データ分配ステップはEMアルゴリズムにおけるE(期待値)ステップに相当し、当てはめ実行ステップはEMアルゴリズムにおけるM(最大化)ステップに相当する。
クロマトグラフのカラムにより時間方向に分離された各種成分を含む試料に対し、PDA検出器などの検出器により吸光スペクトルや蛍光スペクトルなどを繰り返し取得することで3次元クロマトグラムデータを収集する場合には、上記「第3のディメンジョン」とは波長である。
クロマトグラフのカラムにより時間方向に分離された各種成分を含む試料に対し、質量分析計によりマススペクトルを繰り返し取得することで3次元クロマトグラムデータを収集する場合には、上記「第3のディメンジョン」とは質量電荷比m/zである。
さらにまた、包括的2次元クロマトグラフにより3次元クロマトグラムデータを収集する場合には、上記「第3のディメンジョン」とは時間(保持時間)である。この場合、三つのディメンジョンのうち二つが時間であり、その一方の時間は時間刻みが大きい第1の保持時間であり、他方の時間は第1の保持時間の一つの時間刻みの中の細かい時間刻みを表す第2の保持時間である。
また、ここでいう「3次元クロマトグラムデータ」は、クロマトグラフのカラムを経て成分分離された試料の代わりに、フローインジェクション分析(FIA=Flow Injection Analysis)法によって、成分分離されることなく導入された試料に対してPDA検出器などのマルチチャンネル型検出器や質量分析計により得られたデータであってもよい。即ち、単一成分のみが含まれている場合に、時間経過に伴ってガウス関数として近似可能である山形状に成分濃度が変化するデータでありさえすれば、本発明に係るクロマトグラムデータ処理方法及び装置において処理対象とすることができる。
本発明に係るクロマトグラムデータ処理方法では、当てはめ実行ステップにおけるピークモデルの推定とデータ分配ステップにおけるピークモデルの混合比の推定とを繰り返し行うことで、入力された3次元クロマトグラムデータに基づいてクロマトグラムピーク形状とスペクトル形状とを共に推定し、その推定結果に基づいてピーク分離を行う。その際に、当てはめ実行ステップにおいて、クロマトグラム波形の推定とスペクトル波形の推定とを交互に繰り返すことで、それぞれの波形形状の精度を向上させることができる。それによって、テーリングを含むショルダーピークも適切にピーク分離することができる。
当てはめ実行ステップとデータ分配ステップとの適宜の繰り返しによって、そのときのピークモデルの仮定の下でのピークモデルの混合比が決まると、含有成分判定ステップにおいて、与えられた3次元クロマトグラムデータに対する残渣が得られる。もし、ピークモデル波形の仮定が適切であって入力データの分配も適切であれば、残渣はほぼ一定になる筈である。これに対し、残渣にピーク状波形が観測される場合には、ピークモデル波形の仮定が適切でないと推定され、それはそのときのモデル数の仮定が適切でない可能性が高いとみなせるから、さらに別の成分が含まれていると推断する。そして、ピークモデル数を増やした条件の下で、再び、当てはめ実行ステップにおけるピークモデルの推定とデータ分配ステップにおけるピークモデルの混合比の推定とを繰り返し行う。
こうして残渣に基づく判断に応じてピークモデル数を増加させつつEMアルゴリズムを実行することで、ピーク分離についての解を最適解に近づけることができる。その結果、重なっている成分の数が不明であっても、また3以上の多数の成分が重なっている場合でも、適切なピーク分離を行うことが可能となる。
また本発明に係るクロマトグラムデータ処理方法において、好ましくは、上記含有成分判定ステップは、別の成分が前記試料に含まれていると判定されたとき、前記フィルタリング後のデータに現れるピーク状波形を、追加すべき該別の成分のクロマトグラム波形形状の初期値として前記データ分配ステップによる処理に供するようにするとよい。
これにより、ピークモデル数を増加させて再びEMアルゴリズムを実行するときに、該アルゴリズムをより適切な初期状態から開始することができる。その結果、解の収束性が向上し、より少ない繰り返し回数で以て適切なピーク分離が行える。
また、本発明に係るクロマトグラムデータ処理方法において、
上記データ分配ステップでは、上記推定結果である各クロマトグラム波形及び各スペクトル波形に基づいて計算される信号強度の理論値を与えられた3次元クロマトグラムデータから差し引いて求めた残渣信号を各測定点の理論値の強度比に応じて分配する比例分配と、該残渣信号を各成分に等しく分配する均等分配とを、ピーク分離処理のためのステップの繰り返し回数又は解の収束度合いに応じて切り替えるようにするとよい。
具体的には、EMアルゴリズムの繰り返し回数が少ないときには均等分配を用い、繰り返し回数が或る程度大きくなったならば比例分配を用いるとよい。
また、本発明に係るクロマトグラムデータ処理方法において、
上記データ分配ステップでは、上記推定結果である各クロマトグラム波形及び各スペクトル波形に基づいて計算される信号強度の理論値を与えられた3次元クロマトグラムデータから差し引いて求めた残渣信号を、各成分に対するスペクトルの線形和による最小二乗近似に応じて分配するようにしてもよい。
なお、最小二乗近似を行う際に、各成分のスペクトルに対して与えられる重みを、残渣信号の大きさ若しくは各成分における前記信号強度の理論値の大きさ、又はその両方を用いて制限するようにしてもよい。
この分配方法は上記均等分配や比例分配に比べて精度の高い分配が行える可能性が高いものの、残渣信号の全てが分配されるわけではない。そこで、こうした分配方法を用いる場合でも、上記均等分配や比例分配を併用することが望ましい。
また本発明に係るクロマトグラムデータ処理方法では、
各成分のクロマトグラム波形を任意の比率で加算したクロマトグラム波形を求め、該クロマトグラム波形上の強度と前記信号強度の理論値との差異に基づいて、EMアルゴリズムによる解の安定性を推定するようにするとよい。
また本発明に係るクロマトグラムデータ処理方法において、当てはめ実行ステップでは、クロマトグラムモデル波形としてごく一般的なEMG(Exponential Modified Gaussian)等のモデル関数を用いてもよいが、より好ましくは、ピーク幅やピーク高さなどを正規化したクロマトグラム波形が収録されたデータベースを利用し、該データベースから最適なクロマトグラム波形を選択して用いるようにするとよい。
これにより、より現実的なクロマトグラム波形をピークモデルとして使用することができるので、当てはめの精度が一層向上する。
また特にPDA検出器では、成分濃度が高い場合に直線性が低下し、その影響でスペクトル形状が僅かながら変化することがある。この変化のために、実際にはピークモデル数が適切であるにも拘わらず、含有成分判定ステップにおいてピークモデル数が誤判定されることがある。
そこで、本発明に係るクロマトグラムデータ処理方法では、
残渣信号にピーク状波形があった場合に、該残渣信号を行列として主成分分析して得られる固有値の各要素の大きさの比率に基づいて、前記ピーク状波形が検出器の直線性劣化に起因するものであるか否かを判定し、直線性劣化に起因するものであると推定されるときには追加すべき成分はないと結論付けるようにするとよい。これによって、過剰なピーク分離を避けることができる。
また本発明に係るクロマトグラムデータ処理装置は、上記本発明に係るクロマトグラムデータ処理方法を実施する装置であって、測定対象である試料に対して収集された、時間、信号強度、及び第3のディメンジョンを有する3次元クロマトグラムデータを処理するクロマトグラムデータ処理装置であり、例えば混合ガウス分布のEMアルゴリズムのように、ピークモデル関数の当てはめを2段階のステップに分けて行うことにより、時間と信号強度とをそれぞれ軸とするクロマトグラム上で重なっている、前記試料に含まれる複数の成分に由来するピークを分離するクロマトグラムデータ処理装置において、
a)時間と信号強度とをそれぞれ軸とするクロマトグラムの波形形状及び第3のディメンジョンと信号強度とをそれぞれ軸とするスペクトルの波形形状についての、予め与えられた推定結果又は後記当てはめ実行部による推定結果のいずれかである波形形状モデルに基づいて、与えられた3次元クロマトグラムデータを1又は複数の成分に分配し、成分毎の3次元クロマトグラムデータを求めるデータ分配部と、
b)前記データ分配部により得られた成分毎の3次元クロマトグラムデータから求まるクロマトグラム及びスペクトルに対し、クロマトグラム波形形状及びスペクトル波形形状の当てはめをそれぞれ行うことで、各成分に対応する波形形状モデルのパラメータを修正する当てはめ実行部であって、クロマトグラム波形形状が正しいとの仮定の下にスペクトル波形を最小二乗法により求める第1ステップと、スペクトル波形形状が正しいとの仮定の下にクロマトグラム波形を最小二乗法により求める第2ステップとを繰り返し実行することで当てはめの尤もらしさを高める当てはめ実行部と、
c)前記データ分配部による処理及び前記当てはめ実行部による処理を規定回数だけ又は解が収束したとみなせるまで繰り返し実行したあと、その時点で得られる各成分に対応するスペクトルと直交するスペクトル成分を抽出する又は強調するように、与えられた3次元クロマトグラムデータをフィルタリング処理し、そのフィルタリング後のデータに現れるピーク状波形の高さに基づいて、さらに別の成分が前記試料に含まれているか否かを判定する含有成分判定部と、
を備えることを特徴としている。
本発明に係るクロマトグラムデータ処理方法及び装置によれば、例えば、検出器としてPDA検出器等のマルチチャンネル型検出器や質量分析計を用いたクロマトグラフにより収集された3次元クロマトグラムデータに基づいて作成されるクロマトグラムやスペクトルに現れるピークが、3以上の複数の成分由来のピークが重なったものであっても、或いは、テーリングにショルダーピークが存在するようなピークであっても、重なっているピークを的確に分離することができる。それによって、例えばクロマトグラフの分離性能が良好でないような場合であっても、試料に含まれる複数の成分の定量を高い精度で行うことができる。
本発明に係るクロマトグラムデータ処理方法を実施するクロマトグラムデータ処理装置を備えた液体クロマトグラフ装置の一実施例の概略構成図。 本発明の一実施例であるピーク分離処理の基本的な手順を示すフローチャート。 混合ガウス分布(ピークが2個の場合)によるクロマトグラム波形の一例を示す図。 ピークモデルのパラメータ推定処理のフローチャート。 ピークの幅の推定処理の説明図。 ピーク状波形がある場合のスペクトル残渣クロマトグラムの一例を示す図。 或る入力信号に対して主成分分析を行ったときの主成分と固有値との関係を示すグラフ。 テーリング上の不純物ピークの状況を示す図。 他の実施例におけるピーク分離処理を示すフローチャート。 図9中のPCA次元でのEM追加ステップにおける処理手順を示すフローチャート。 図9中のPCA次元でのEMステップにおける処理手順を示すフローチャート。 図9中の実次元でのEMステップにおける処理手順を示すフローチャート。 液体クロマトグラフにより得られる3次元クロマトグラムデータの概念図(a)及び波長クロマトグラムの一例を示す図(b)。 テーリング上にショルダーピークがある場合におけるデコンボリューション処理の一例を示す図であり、元のピーク波形(a)、インパルス応答波形(b)、(a)のピーク波形に(b)のインパルス応答波形を乗じた波形(c)、及び、(c)のピーク波形をガウス関数を用いて理想的にデコンボリューション処理した結果の波形(d)をそれぞれ示す図。
まず、本発明に係るクロマトグラムデータ処理方法の一実施例について、添付図面を参照して説明する。
このクロマトグラムデータ処理方法は、既に説明した図13(a)に示したような3次元クロマトグラムデータに対してピーク分離処理を実施し、試料に含まれる成分毎のクロマトグラム波形及びスペクトル波形を推定するものである。図2はこのピーク分離処理の基本的なフローチャートである。
一般に知られているように、クロマトグラムやスペクトルに現れる純粋なピークの形状は、ガウス関数で以て近似的に表される。そのため、通常、クロマトグラム、スペクトルのいずれにおいても、複数の成分由来のピークの重なりは複数のガウス関数を線形結合した混合ガウス分布であるとみなせる。そこで、ここでは、クロマトグラム上やスペクトル上でのピーク分離に、混合ガウス分布(GMM)のEMアルゴリズムを利用する。EMアルゴリズムは一般に、確率変数に対する確率密度関数を表す確率モデルのパラメータを最適化するステップ(つまりMステップ)と、その確率モデルに基づく信号分離を最適化するステップ(つまりEステップ)を繰り返し実行するアルゴリズムである。ここでは、各確率モデルがそれぞれ一つの成分に対応する3次元クロマトグラムデータからなる一つのピークを示しており、該データはクロマトグラム波形情報とスペクトル波形情報とを持つ。そして、複数の確率モデルがそれぞれの濃度で以て混合されたものが観測信号であるとしてモデル化している。図3は二つの確率モデル(モデル1、2)とそれを混合した波形の例を示している。
GMMのEMアルゴリズム自体は従来、様々な分野で用いられている。一般に、GMMのEMアルゴリズムでは、適切な確率モデル数やおおよその初期値を与えた状態で処理を実行しないと、局地解に陥ることが知られている。しかしながら、ピーク分離処理の場合、クロマトグラム情報に加えてスペクトル情報を持つといったデータ形式上の特徴に加え、確率モデルの数、つまり重なっているクロマトグラムピークの数がそもそも不明である、という特徴がある。そこで、最適な確率モデルの数が不明であるという問題を解決するべく、GMMのEMアルゴリズムを基本として、以下に説明するような様々な特徴や変形を加えることで、良好なピーク分離処理が行えるようにした。
なお、上述したように、GMMのEMアルゴリズム及びその計算方法については、非特許文献1、2をはじめ、各種文献に詳細に記載されているので、ここではその詳しい説明は省略する。
上述したように、ここでは同じ保持時間範囲及び同じ波長範囲に重なっている成分の数、つまりピーク分離処理後のピークモデル数は、処理前には未知である。そこで、ピーク数が1であると仮定してピークモデル数=1から処理を開始する。また、その一つのピークのモデルパラメータを適当に設定する(ステップS1)。
なお、ピーク数の初期値を1とするのではなく、既存手法によるピーク分離やクロマトグラムの信号処理で一般に行われている直線によるピーク分割を行うことで得られた結果をピーク数の初期値としてもよい。即ち、ピーク数が或る値以下でないことが高い確率で分かっている場合には、その値を初期値とすれば、より効率良く(つまりは短い処理時間で)最終的な結果に辿り着くことができる。
次に、EMアルゴリズムのEステップとして、設定されているモデルパラメータに従ったピークモデルに基づいて、入力されたクロマトグラム信号を分配する(ステップS2)。ただし、ピーク数が1である状態でステップS2が実行されるときには、信号分配の必要はないのでステップS2は実質的にスルーされる。
このEステップでは、理想的には、入力されたクロマトグラム信号に、ピークモデルパラメータで表されるスペクトルを乗じたものが分配された信号となるが、ここではさらに、各ピークモデルによるスペクトルの高さを誤差最小二乗基準で以て最適化している。一般的なGMMであれば、その最適化後に分配されずに残った残渣信号を各ピークモデルに与えられた重みに比例して分配する。ここでは、そのようにしてもよいが、より好ましくは、理想的な信号分配を行った後の残渣信号に対し、次に述べる比例分配、均等分配、スペクトル分配の3種類の異なる方法による信号分配を適宜行うようにするとよい。
(1)比例分配
比例分配は、一般のGMMと同様の処理を波長毎に行うものである。即ち、ピークモデルと入力信号とに基づいて得られた残渣信号を、ピークモデル波形上の強度に比例して分配する。
(2)均等分配
均等分配は、入力信号に対する残渣信号を全てのピークモデルに均等に分配するものである。これはEMステップの初期段階など、推定されるピークモデルと真値との乖離が大きい場合に特に有効である。
(3)スペクトル分配
スペクトル分配では、各保持時間において、残渣信号が各ピークモデルのスペクトルの合成値であるとみなし、それぞれのスペクトルの大きさを最小二乗法によって求める。ただし、過適応を回避するため、各スペクトル成分の重みは残渣スペクトルと各ピークモデルのスペクトルとの内積又はそれに近い所定値以下であるという制限を加えた、制限付き最小二乗法を用いる。スペクトル分配はかなり有効な信号分配方法であるものの、残渣信号を全て分配することはできない。そこで、スペクトル分配を行うことで残った残渣信号を、さらに比例分配や均等分配により分配する必要がある。
各ピークモデルに信号が分配されたならば、次に、EMアルゴリズムのMステップとして、各ピークモデルに分配された信号に対しピークモデルの当てはめを実行して尤度が向上するようにモデルパラメータを修正する(ステップS3)。
一般に、理想的な液体クロマトグラフによって得られるクロマトグラムデータでは、成分濃度等に依らずに、各ピークモデルに固有のスペクトルを示す。そこでここでは、各ピークモデルが必ず固有のスペクトルをもつというスペクトル情報による制約を前提として、改良した処理を実行する。
即ち、ステップS3では、ピーク形状が単純なガウス関数であると仮定したガウス分布Mステップと、予めテーリングがあると仮定したm−ガウス分布(変形ガウス分布)Mステップと、を併用する。
通常のガウス関数はテーリングを表現することができないため、ガウス分布Mステップによるパラメータの最適化は精度の点で劣る。一方、パラメータの数が少なくて済むため、過適応により局地解に陥るおそれは小さいという利点がある。これに対し、m−ガウス分布Mステップでは、理想的なガウス関数でなく、EMG(Exponential Modified Gaussian)関数等のテーリングモデル関数や、実測により得られたピーク波形等に基づいて作成された波形群を用いた当てはめを行うことでピークモデル波形を求める。そのため、ガウス分布Mステップに比べて、ピークモデル波形近似を高精度に行うことができる。その反面、自由度が高い分、過適応による局地解に陥りやすいという欠点がある。そこで、ここでは、ステップS2、S3を繰り返すEMアルゴリズムの初期には、精度よりも処理の安定性を重視した通常のガウス分布Mステップを用い、EMアルゴリズムの後期には、精度を重視したm−ガウス分布Mステップを用いる。これによって、処理の安定性とピーク波形推定の精度とを両立させることができる。
各Mステップの詳細は次のとおりである。
(1)ガウス分布Mステップ
通常、GMMでは確率密度関数に対してガウス分布のフィッティングを行うが、ここでは確率密度関数の代わりに、各保持時間におけるスペクトル(つまりは波長と信号強度との関係を示す波形)を用いる。
図4は、このときのピークモデルのパラメータ推定処理のフローチャートである。
即ち、まず最初に、適当に初期スペクトルを設定した(ステップS11)あと、スペクトルが既知であるとの仮定の下に、該スペクトルと分配信号との内積を入力とし、各波長において共通である最適なクロマトグラムピークのモデルパラメータを算出する(ステップS12)。それによってクロマトグラム波形が一旦決まるから、引き続いて、クロマトグラム波形のモデルパラメータが既知であるとの仮定の下に、該クロマトグラム波形と分配信号との内積を計算し、これを最適なスペクトルとして定める(ステップS13)。こうして、ピークモデルのパラメータとして、クロマトグラム上のピークの幅及び位置とを推定するとともに、スペクトルも推定する。なお、ここでは、クロマトグラムやスペクトルにベースラインノイズが含まれているため、一般的な確率分布を対象としたGMMで用いられている、分布のモーメントからモデルパラメータを求める方法は使用できない。そこで、最小二乗法を用いることで、ピークの位置及び幅の推定を行っている。
(2)m−ガウス分布Mステップ
テーリングを含む変形要素を組み入れた変形ガウス分布をモデル関数として用いることを除き、このMステップの目的は上述したガウス分布Mステップと同じである。
クロマトグラム上のピークの幅及び位置やテーリング形状を求めるに当たっては、そのピークの位置及び幅を求めた後に、様々な変形ガウス分布モデル波形を収録したデータベースとの照合を行う。
ピークの位置の推定は、時間方向にサブサンプリング単位でミーンシフトを行い、ピークトップを推定することにより行われる。一方、ピークの幅の推定は、図5に示すように、ピーク高さの最大値を1として、幅内の信号平均高さが0.72となるように幅を決めることによって行われる。これにより、高精度で且つ半値幅よりもロバストにピーク幅を求めることができる。もちろん、平均高さは0.72以外の値を用いてもよい。
また、テーリング形状については、上記データベースとの照合によって、形状の類似性が最も高い(相関度が高い)波形を抽出すればよい。このデータベースは、モデル関数から妥当な範囲でパラメータを調整することにより作成してもよいし、実測した波形をクラスタリングすることで求めてもよい。上記処理は、一つのピークを前半(リーディング)部と後半(テーリング)部とに切り分けてそれぞれ実施するようにしてもよいが、こうした切り分けを行わずに前半部及び後半部をセットにしたデータに対して処理を行うようにしてもよい。
上記ステップS2、S3の処理が終了したならば、解が収束したか否かを判定する。また、仮に解が収束していなくても、ステップS2、S3の処理の繰り返しを規定の回数実行したか否かを判定する(ステップS4)。そして、解が収束しておらず処理の繰り返しも規定回数に達していなければ、ステップS2へと戻る。したがって、ステップS4からS2へと戻った場合には、ステップS3(Mステップ)において修正されたモデルパラメータを用いてステップS2(Eステップ)が実行されることになる。
ステップS4でYesと判定されたならば、EMアルゴリズムを実施することによって残った残渣信号を求め、この残渣信号のピーク状波形の有無を判定することにより、ピークモデルを追加すべきか否かを判断する(ステップS5)。
具体的には、入力されたクロマトグラム信号から各ピークモデルのスペクトルに直交するスペクトルを残渣信号として抽出し、各保持時間において、その残渣信号の2次ノルムを計算する。そして、その残渣信号の2次ノルムを時系列順に並べた、スペクトル残渣クロマトグラムを作成する。少なくとも着目しているクロマトグラム上のピークに重なっている複数の成分それぞれについてピークモデルが定められている場合には、残渣信号がほぼゼロになるか、或いはバックグラウンドノイズなどの影響でゼロにはならないにしても、残渣信号に時間的な大きな変動はない。したがって、スペクトル残渣クロマトグラム中にピーク状波形が観測されれば、残渣信号に未だ別の成分が残っていると考えられる。この場合には、新たにピークモデルを追加する必要がある。図6はピーク状波形がある場合のスペクトル残渣クロマトグラムの一例である。
スペクトル残渣クロマトグラムにおいてピーク状波形の有無を判定するには、既知の各種のピーク検出方法を用いることができるが、ここでは、次のようにしてピーク状波形の有無を判定する。
即ち、スペクトル残渣クロマトグラムに対してピーク検出を実施し、最大値を含む半値幅(ここでは信号強度が最大値の60%である幅)を確定する。そして、その半値幅内の信号強度の5次微分を計算してそれをノイズレベルとし、半値幅内での信号の最大値と最小値との差をノイズレベルと比較し、ノイズレベルに比べて十分に大きければ(例えばノイズレベルの所定倍以上であれば)、それがピーク状波形であると判定する。
上述したようにステップS5において残渣信号にピーク状波形ありと判定されたならば、別の成分の重なりがあると推定し、そのピーク状波形に基づいて適当なモデル初期値を設定したうえでモデルピークを追加し(ステップS6)、ステップS2へ戻る。一方、ステップS5において残渣信号にピーク状波形なしと判定されたならば、モデルピークの追加不要と判断して処理を終了する。
ただし、残渣信号にピーク状波形が存在しても、そのピーク高さが残渣信号全体のSN比レベル以下である場合には、そのピークは実はノイズ変動である可能性が高い。そこで、波長毎に残渣信号を正規化し、各波長においてピーク状波形の最大値部分での残渣信号のスペクトルが上記ノイズレベル以下である場合には、例外的にモデルピークの追加なしとして処理を終了する。
ステップS6からS2へと戻った場合には、ピークモデルが一つ増加した状態で再び上記ステップS2〜S4によるEMアルゴリズムの繰り返しが実行される。そして、着目しているピークに重なっている成分がほかには無いとみなせる状態になると、ステップS5においてNoと判定されて処理が終了し、各成分に対応付けられるクロマトグラム及びスペクトルが確定する。
ただし、検出器としてPDA検出器が使用される場合には、ノイズ以外に、検出器のリニアリティの劣化に伴う偽のピーク状波形の発生も考慮することが望ましい。
即ち、一般的にPDA検出器は、高濃度の試料に対する検出のリニアリティが劣化する傾向にある。そのため、成分濃度が高くなるに伴いスペクトルのピーク状波形が変化してしまい、同一試料成分に対するスペクトルの形状が不変であることを前提とする本データ処理方法では、上記ピーク状波形の変化が残渣信号上で想定外のピーク状波形として現れることがある。
入力されたクロマトグラム信号が理想的である場合、該信号に対して主成分分析(PCA)を行うと、重なっているピークの数だけ大きな固有値を持つ要素が現れ、残りの固有値にはノイズが含まれる。図7は或る入力信号に対して主成分分析を行ったときの主成分と固有値との関係を示すグラフである。図7中にAで示すように、検出器のリニアリティ劣化がなく且つ重なるピークが一つのみである場合には、第1主成分の固有値が突出して大きくなる。それに対し、重なっているピークが一つのみではない信号の場合には、図7中にBに示すように、第1主成分の固有値の大きさは第2主成分の固有値等に比べて突出する程大きいわけではない。
一方、図7中のC、Dは検出器のリニアリティ劣化がある場合の例であり、Cはリニアリティ劣化が小さい場合、Dはリニアリティ劣化が大きい場合の固有値である。これら結果から、リニアリティ劣化が殆どない場合の固有値に比べて、第2及び3主成分が大きく、リニアリティ劣化の程度が大きいほど第2及び3主成分も大きくなることが分かる。このことから、入力された信号に対する主成分分析における第1〜第3主成分の固有値を判定することによって、残渣信号の中で検出器のリニアリティ劣化による要素が大部分を占めるか否かを判断可能であることが分かる。
そこで、本実施例のデータ処理方法では、経験的に以下のような方法を採用するとよい。即ち、入力クロマトグラム信号に対し15次元の主成分分析を行い、残渣の第1主成分の固有値をZ1、第n〜m主成分の固有値の2次ノルムをZn-mとして、同様に入力信号に対する固有値に関する変数をSとしたとき、以下の式で求められる指標値を用いる。当然のことながら、モーメント等の分布広がりを示す特徴量を用いて、第1〜第3主成分の固有値の大きさを求めることも可能である。
ZR1=sqrt{(Z1 2−Z12-15 2)/(Z2-5 2−Z12-15 2)}
ZR2=sqrt{(Z1 2−Z12-15 2)/(Z6-8 2−Z12-15 2)}
SR1=sqrt{(S1 2−S12-15 2)/(S2-5 2−S12-15 2)}
SR2=sqrt{(S1 2−S12-15 2)/(S6-8 2−S12-15 2)}
ZR1/SR1<0.5、且つ、ZR2/SR2<0.01であるとき劣化ありと判定
上記のようにしてリニアリティ劣化ありと結論付けられたならば、スペクトル残渣クロマトグラムにピーク状波形が観測されたとしても、その原因は検出器のリニアリティ劣化にある可能性が高い。そこで、その場合には、ステップS6におけるピークモデル追加を行うことなく、処理を終了するとよい。
また、上述したように、本実施例のデータ処理方法では、ピークのテーリングを扱うために、特定の条件においては解が一意に求まらず不安定となる。例えばEMG関数等のテーリングは複数のガウス関数で以て近似することができる。そのため、この複数のガウス関数のうち一つと不純物ピークの形状とがほぼ一致する場合には、テーリング度合いを調整することによって不純物ピークに主成分ピークのスペクトルを足し合わせても自然な結果の解となる(図8参照)。
この主成分ピークのスペクトルを不純物ピークに足し合わせても波形形状が自然であるという条件は、クロマトグラムの時間軸で考えると不純物ピークを多少足しても、主成分のクロマトグラムはテーリングが変わる程度で自然にフィッティングできるということを示している。そこで、好ましくは、主成分のクロマトグラムのピークモデル波形に不純物成分のクロマトグラムのピークモデル波形を足し合わせた際に、モデル当てはめステップにおける二乗誤差の増加がどの程度であるのかに基づいて解の安定性を判断するステップ、を加えるようにするとよい。
また、クロマトグラム上の或るピークが大きなピークと小さなピークとの合成ピークである場合、解の安定性のうえで問題となるのは小さなピークの変動である。そこで、各ピークモデルの高さとしてスペクトルの2次ノルムを用い、小さいほうのクロマトグラムのピークを一定割合(例えば±10%程度)変動させた場合を想定して、モデル当てはめステップにおける二乗誤差の変動量を求め、この変動量に基づいて不安定解の判定を行うようにしてもよい。
また、上記のような解の安定性の判定や不安定解の判定を行った結果、著しく不安定である解が存在するとの結果が得られ、且つ、スペクトルの相関が一定以上ある場合には、本来一つであるピークが過剰な数のピークに分配されてしまっている可能性がある。そこで、こうしたことを判定する処理を加え、過剰な分配が確認された場合には、複数のピークモデルを統合する統合処理を行ってピークモデルの数を減らすようにしてもよい。
さらにまた、純品検査などの特定の用途においては、上述したように不安定解であると判定された場合に、どの程度の範囲で解が不安定であるのかを知りたい場合がある。これは例えば、不純物のピーク面積に対するピーク面積が1.5以下ならば合格であるとの合否判定基準が設定されているときに、不純物のピーク面積が1であると算出され、且つそれが不安定解であると判定されたような場合である。この場合、不安定解が1.5倍以上になり得るか否かの判断が重要である。
こうしたことに対応するためには、例えば、ピーク高さやピーク面積などが同じになるように正規化したクロマトグラム波形を用いて解が不安定となる範囲を調べた後に、スペクトルにおける各波長の信号強度に比例させて各波長における解の範囲をそれぞれ求めるようにするとよい。
次に、上記実施例のクロマトグラムデータ処理方法を基本としつつ、処理の高速化を図り、且つ、上述したような付加的な処理を盛り込んだ、他の実施例によるクロマトグラムデータ処理方法を、図9〜図12に示したフローチャートを参照しつつ説明する。
このクロマトグラムデータ処理方法では、3次元クロマトグラムデータについて各スペクトルを主成分分析により次元圧縮する(ステップS21)。これは、処理対象のデータ量を圧縮するためである。そして、図2中のステップS1と同様のステップS22の初期設定を実施したあとに、PCA次元でのEM追加ステップ処理を実行する(ステップS23)。
この処理は図10に示すように、Mステップから始まるが、これはピークモデル数が1であるときにEステップは実質的に行われないためであり、図2においてステップS1→S2→S3と進む処理と何ら変わりはない。そして、図10中のステップS232、S233は図2中のステップS5、S6と実質的に同じであり、図10において、ステップS233でYesと判定されたときにステップS234に進む処理は、図2においてステップS5でYesと判定されたときにステップS6を経てS2へと戻る処理と同じである。
ここでは、ステップS234のEステップにおいて、理想的な信号分配を行った後の残渣 信号についての信号分配として、上述した三つの方法のうち、均等分配と比例分配を利用している。即ち、ステップS234〜S237の繰り返し回数をiとしたときに、iが10未満で奇数である場合には均等分配による信号分配を行い、iが10未満で偶数である場合及びiが10以上である場合には比例分配による信号分配を行う(ステップS235)。そして、そのあとのステップS236のMステップでは、上記繰り返し回数iが20未満であればガウス分布Mステップの処理を実行し、iが20以上であればm−ガウス分布Mステップの処理を実行する(ステップS236)。Mステップの実行後、EMステップの繰り返し回数iが所定数に達したか否かを判定し(ステップS237)、所定数に達していなければステップS234へ戻る。ここで、所定数は例えば50とすればよい。そして、ステップS237でYesと判定されたならば、図2においてステップS4からS5へと進むのと同様に、S237からS232へと戻る。そして、新たにピークモデルを追加する必要がなくなれば、ステップS233でNoと判定され、このPCA次元でのEM追加ステップの処理を終了する。
引き続き、PCA次元でのEMステップ処理を実行する(ステップS24)。即ち、図11に示すように、Eステップでは繰り返し回数に応じて均等分配による信号分配と比例分配による信号分配とが選択的に実行され(ステップS241〜S243)、Mステップではm−ガウス分布Mステップの処理が実行される(ステップS244)。そして、推定されたスペクトルが収束しているか否かを判定し(ステップS245)、収束していると判定された場合には、例えば上述したように、著しく不安定である解が存在し、且つ、スペクトルの相関が一定以上あるか否かを判定することで、過剰な分配があるか否かを判定する(ステップS246)。過剰な分配があると判定された場合には、複数のピークモデルを統合する統合処理を行ってピークモデルの数を減らし(ステップS247)、ステップS241へと戻る。一方、ステップS246において過剰な分配がないと判定された場合には、モデル統合の必要はないので処理を終了する。
こうしてPCA次元上で解が得られたならば、PCAの次元圧縮を解除することで解を実次元上のスペクトルに展開する(ステップS25)。そして、実次元において再度、図11に示したフローチャートと同様の図12に示すようなフローチャートに従ったEMステップによるピーク分離を実行する(ステップS26)。実次元ではピークモデルの追加は行われず、単純なEMステップの繰り返しとピークモデルの統合が行われるだけである。このため、実次元でのEMステップの実行にはそれほど時間を掛けずに、ピーク分離の精度を向上させることができる。
もちろん、上記実施例のようにPCA次元上の処理と実次元上の処理とを組み合わせるのではなく、PCA次元上の処理のみでピーク分離を行ってもよいし、逆に、実次元上の処理のみでピーク分離を行ってもよい。前者は処理時間を短縮するのに有効であり、後者はPCA次元圧縮・解除を実施しないことによる実装の簡便さやピーク分離の精度の点で有利である。
続いて、図2を参照しつつ説明したクロマトグラムデータ処理方法を実施するクロマトグラムデータ処理装置を含むLC分析装置の一実施例について説明する。図1はこのLC分析装置の概略構成図である。このLC分析装置の構成と概略動作を説明する。
このLC分析装置は、LC部1とデータ処理部2とを含む。LC部1において、送液ポンプ12は移動相容器11から移動相を吸引して一定流量でインジェクタ13へと送給する。インジェクタ13は所定のタイミングで試料液を移動相中に注入する。注入された試料液は移動相に押されてカラム14に導入され、カラム14を通過する間に試料液中の各成分が時間方向に分離されてカラム14出口から溶出する。カラム14出口に配置されたPDA検出器15は、時間経過に伴って順次導入される溶出液に対して所定波長範囲の吸光度分布を繰り返し測定する。この測定によって得られた信号はアナログデジタル(A/D)変換器16によりデジタル信号に変換され、3次元クロマトグラムデータとしてデータ処理部2へと入力される。
データ処理部2は、3次元クロマトグラムデータを格納するクロマトグラムデータ記憶部21、各種の変形ガウス分布モデル波形などを収録したモデル関数データベース22、3次元クロマトグラムデータに対して上述したようなGMMのEMアルゴリズムを基本としたピーク分離処理を実行するピーク分離処理部23、成分毎に分離されたクロマトグラムピークに基づいて定量計算を行う定量演算部24、などの機能ブロックを備える。また、データ処理部2には、例えばデータ処理に必要な各種のパラメータを分析者が指定するための入力部3と、ピーク分離結果や定量演算結果などを表示するための表示部4とが接続されている。
本実施例のLC分析装置では、一つの試料に対してLC部1で収集された3次元クロマトグラムデータが一つのデータファイルとしてクロマトグラムデータ記憶部21に一旦格納され、分析者が入力部3において処理対象のデータファイルを指定したうえでピーク分離処理等の実行開始を指示すると、ピーク分離処理部23はモデル関数データベース22を用いつつ、上述した処理を行うことで成分毎に分離したクロマトグラム波形とスペクトル波形とをそれぞれ推定する。定量演算部24は推定されたクロマトグラム波形上のピークの面積を計算し、その面積値に基づいて定量値を算出する。
本実施例のLC分析装置では、目的成分と他の成分とがLC部1において十分に分離されない場合であっても、データ処理部2において目的成分のクロマトグラムピークの波形が高い精度で求まるので、該目的成分の濃度を正確に算出することができる。
なお、上記実施例のクロマトグラムデータ処理方法やLC分析装置は本発明の一例であり、本発明の趣旨の範囲で適宜変形、追加、修正を加えても本願特許請求の範囲に包含されることは明らかである。
例えば、本発明において処理対象である3次元クロマトグラムデータを取得するクロマトグラフの検出器は、上述したようなPDA検出器等のマルチチャンネル型検出器でなくてもよく、高速の波長走査が可能である紫外可視分光光度計、赤外分光光度計、近赤外分光光度計、蛍光分光光度計、などであってもよい。また、質量分析計を検出器とした液体クロマトグラフ質量分析装置やガスクロマトグラフ質量分析装置でもよい。
また、カラムを通した分析ではなく、フローインジェクション分析(FIA=Flow Injection Analysis)法により導入された試料をPDA検出器等で検出する場合に得られるデータも、時間、波長、及び吸光度という三つのディメンジョンを持つ3次元データとなり、液体クロマトグラフにより収集される3次元クロマトグラムデータと実質的に同じである。したがって、こうしたデータを処理する装置にも本発明を適用できることは明らかである。
1…LC部
11…移動相容器
12…送液ポンプ
13…インジェクタ
14…カラム
15…PDA検出器
16…アナログデジタル変換器
2…データ処理部
21…クロマトグラムデータ記憶部
22…モデル関数データベース
23…ピーク分離処理部
24…定量演算部
3…入力部
4…表示部

Claims (9)

  1. 測定対象である試料に対して収集された、時間、信号強度、及び第3のディメンジョンを有する3次元クロマトグラムデータを処理するクロマトグラムデータ処理方法であり、ピークモデル関数の当てはめを2段階のステップに分けて行うことにより、時間と信号強度とをそれぞれ軸とするクロマトグラム上で重なっている、前記試料に含まれる複数の成分に由来するピークを分離するクロマトグラムデータ処理方法において、
    a)時間と信号強度とをそれぞれ軸とするクロマトグラムの波形形状及び第3のディメンジョンと信号強度とをそれぞれ軸とするスペクトルの波形形状についての、予め与えられた推定結果又は後記当てはめ実行ステップによる推定結果のいずれかである波形形状モデルに基づいて、与えられた3次元クロマトグラムデータを1又は複数の成分に分配し、成分毎の3次元クロマトグラムデータを求めるデータ分配ステップと、
    b)前記データ分配ステップにより得られた成分毎の3次元クロマトグラムデータから求まるクロマトグラム及びスペクトルに対し、クロマトグラム波形形状及びスペクトル波形形状の当てはめをそれぞれ行うことで、各成分に対応する波形形状モデルのパラメータを修正する当てはめ実行ステップであって、クロマトグラム波形形状が正しいとの仮定の下にスペクトル波形を最小二乗法により求める第1ステップと、スペクトル波形形状が正しいとの仮定の下にクロマトグラム波形を最小二乗法により求める第2ステップとを繰り返し実行することで当てはめの尤もらしさを高める当てはめ実行ステップと、
    c)前記データ分配ステップ及び前記当てはめ実行ステップを規定回数だけ又は解が収束したとみなせるまで繰り返し実行したあと、その時点で得られる各成分に対応するスペクトルと直交するスペクトル成分を抽出する又は強調するように、与えられた3次元クロマトグラムデータをフィルタリング処理し、そのフィルタリング後のデータに現れるピーク状波形の高さに基づいて、さらに別の成分が前記試料に含まれているか否かを判定する含有成分判定ステップと、
    を有することを特徴とするクロマトグラムデータ処理方法。
  2. 請求項1に記載のクロマトグラムデータ処理方法であって、
    前記含有成分判定ステップは、別の成分が前記試料に含まれていると判定されたとき、前記フィルタリング後のデータに現れるピーク状波形を、追加すべき該別の成分のクロマトグラム波形形状の初期値として前記データ分配ステップによる処理に供することを特徴とするクロマトグラムデータ処理方法。
  3. 請求項1又は2に記載のクロマトグラムデータ処理方法であって、
    前記データ分配ステップでは、各クロマトグラム波形及び各スペクトル波形に基づいて計算される信号強度の理論値を与えられた3次元クロマトグラムデータから差し引いて求めた残渣信号を各測定点の理論値の強度比に応じて分配する比例分配と、該残渣信号を各成分に等しく分配する均等分配とを、ピーク分離処理のためのステップの繰り返し回数又は解の収束度合いに応じて切り替えることを特徴とするクロマトグラムデータ処理方法。
  4. 請求項1〜3のいずれかに記載のクロマトグラムデータ処理方法であって、
    前記データ分配ステップでは、各クロマトグラム波形及び各スペクトル波形に基づいて計算される信号強度の理論値を与えられた3次元クロマトグラムデータから差し引いて求めた残渣信号を、各成分に対するスペクトルの線形和による最小二乗近似に応じて分配することを特徴とするクロマトグラムデータ処理方法。
  5. 請求項4に記載のクロマトグラムデータ処理方法であって、
    最小二乗近似を行う際に、各成分のスペクトルに対して与えられる重みを、残渣信号の大きさ若しくは各成分における信号強度の理論値の大きさ、又はその両方を用いて制限することを特徴とするクロマトグラムデータ処理方法。
  6. 請求項1〜5のいずれかに記載のクロマトグラムデータ処理方法であって、
    各成分のクロマトグラム波形を任意の比率で加算したクロマトグラム波形を求め、該クロマトグラム波形上の強度と信号強度の理論値との差異に基づいて、EMアルゴリズムによる解の安定性を推定することを特徴とするクロマトグラムデータ処理方法。
  7. 請求項1〜6のいずれかに記載のクロマトグラムデータ処理方法であって、
    前記当てはめ実行ステップでは、ピーク幅やピーク高さを正規化したクロマトグラム波形が収録されたデータベースを利用し、該データベースから最適なクロマトグラム波形を選択して用いることを特徴とするクロマトグラムデータ処理方法。
  8. 請求項1〜7のいずれかに記載のクロマトグラムデータ処理方法であって、
    前記フィルタリング後の残渣信号にピーク状波形があった場合に、該残渣信号を行列として主成分分析して得られる固有値の各要素の大きさの比率に基づいて、前記ピーク状波形が検出器の直線性劣化に起因するものであるか否かを判定し、直線性劣化に起因するものであると推定されるときには追加すべき成分はないと結論付けることを特徴とするクロマトグラムデータ処理方法。
  9. 請求項1〜8のいずれかに記載のクロマトグラムデータ処理方法を実行するための装置であって、測定対象である試料に対して収集された、時間、信号強度、及び第3のディメンジョンを有する3次元クロマトグラムデータを処理するクロマトグラムデータ処理装置であり、ピークモデル関数の当てはめを2段階のステップに分けて行うことにより、時間と信号強度とをそれぞれ軸とするクロマトグラム上で重なっている、前記試料に含まれる複数の成分に由来するピークを分離するクロマトグラムデータ処理装置において、
    a)時間と信号強度とをそれぞれ軸とするクロマトグラムの波形形状及び第3のディメンジョンと信号強度とをそれぞれ軸とするスペクトルの波形形状についての、予め与えられた推定結果又は後記当てはめ実行部による推定結果のいずれかである波形形状モデルに基づいて、与えられた3次元クロマトグラムデータを1又は複数の成分に分配し、成分毎の3次元クロマトグラムデータを求めるデータ分配部と、
    b)前記データ分配部により得られた成分毎の3次元クロマトグラムデータから求まるクロマトグラム及びスペクトルに対し、クロマトグラム波形形状及びスペクトル波形形状の当てはめをそれぞれ行うことで、各成分に対応する波形形状モデルのパラメータを修正する当てはめ実行部であって、クロマトグラム波形形状が正しいとの仮定の下にスペクトル波形を最小二乗法により求める第1ステップと、スペクトル波形形状が正しいとの仮定の下にクロマトグラム波形を最小二乗法により求める第2ステップとを繰り返し実行することで当てはめの尤もらしさを高める当てはめ実行部と、
    c)前記データ分配部による処理及び前記当てはめ実行部による処理を規定回数だけ又は解が収束したとみなせるまで繰り返し実行したあと、その時点で得られる各成分に対応するスペクトルと直交するスペクトル成分を抽出する又は強調するように、与えられた3次元クロマトグラムデータをフィルタリング処理し、そのフィルタリング後のデータに現れるピーク状波形の高さに基づいて、さらに別の成分が前記試料に含まれているか否かを判定する含有成分判定部と、
    を備えることを特徴とするクロマトグラムデータ処理装置。
JP2016546242A 2014-09-03 2014-09-03 クロマトグラムデータ処理方法及び装置 Active JP6260709B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/073196 WO2016035167A1 (ja) 2014-09-03 2014-09-03 クロマトグラムデータ処理方法及び装置

Publications (2)

Publication Number Publication Date
JPWO2016035167A1 true JPWO2016035167A1 (ja) 2017-06-08
JP6260709B2 JP6260709B2 (ja) 2018-01-17

Family

ID=55439268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016546242A Active JP6260709B2 (ja) 2014-09-03 2014-09-03 クロマトグラムデータ処理方法及び装置

Country Status (4)

Country Link
US (1) US10416134B2 (ja)
JP (1) JP6260709B2 (ja)
CN (1) CN107076712B (ja)
WO (1) WO2016035167A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015198385A1 (ja) * 2014-06-24 2015-12-30 株式会社島津製作所 包括的2次元クロマトグラフ用データ処理装置
JP6380555B2 (ja) * 2014-12-25 2018-08-29 株式会社島津製作所 分析装置
EP3260858A1 (en) * 2015-02-16 2017-12-27 Shimadzu Corporation Noise level estimation method, measurement data processing device, and program for measurement data processing
JP6711453B2 (ja) * 2017-03-29 2020-06-17 日本電気株式会社 電気泳動解析装置、電気泳動解析方法及びプログラム
CN110741254B (zh) * 2017-06-12 2022-08-19 株式会社日立高新技术 色谱质谱分析方法及色谱质谱分析装置
WO2019161382A1 (en) * 2018-02-19 2019-08-22 Cerno Bioscience Llc Reliable and automatic mass spectral analysis
GB2586710B (en) * 2018-03-14 2022-05-25 Hitachi High Tech Corp Chromatography mass spectrometry and chromatography mass spectrometer
WO2020070786A1 (ja) * 2018-10-02 2020-04-09 株式会社島津製作所 識別器の生成方法
JP2020101524A (ja) * 2018-11-19 2020-07-02 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法
JP7235298B2 (ja) * 2019-03-20 2023-03-08 株式会社日立ハイテクサイエンス クロマトグラフのデータ処理装置、データ処理方法、およびクロマトグラフ
CN110441420B (zh) * 2019-08-02 2022-04-22 长园深瑞监测技术有限公司 一种在线监测油中溶解气体气相色谱峰自动识别方法
WO2021064924A1 (ja) * 2019-10-02 2021-04-08 株式会社島津製作所 波形解析方法及び波形解析装置
CN111337606B (zh) * 2020-03-19 2023-03-31 南通乐尔环保科技有限公司 一种应用于色谱分析的重叠峰处理方法
US20230160862A1 (en) * 2020-04-17 2023-05-25 Shimadzu Corporation Waveform information inference method and device, and peak waveform processing method and device
WO2021240922A1 (ja) * 2020-05-28 2021-12-02 株式会社島津製作所 ピークトラッキング装置、ピークトラッキング方法およびピークトラッキングプログラム
JP7332045B2 (ja) * 2020-05-29 2023-08-23 株式会社島津製作所 データ処理装置、データ処理方法、データ処理プログラムおよび分析装置
DE112021005391T5 (de) * 2020-10-12 2023-07-20 Leco Corporation Unaufgelöste komplexe Gemisch Trennung von Daten, die in der zweidimensionalen Gaschromatographie erhoben wurden
JP7472775B2 (ja) * 2020-12-21 2024-04-23 株式会社島津製作所 波形処理支援装置および波形処理支援方法
CN113419020A (zh) * 2021-06-30 2021-09-21 成都师范学院 糖化血红蛋白重叠峰识别方法、装置、系统、设备及介质
CN113659961B (zh) * 2021-07-19 2024-01-30 广东迈能欣科技有限公司 一种应用于二氧化碳传感器的滤波算法
CN113607867A (zh) * 2021-07-23 2021-11-05 清华大学合肥公共安全研究院 一种基于峰体映射的双重叠谱峰解析方法
CN116136518B (zh) * 2023-04-20 2023-08-01 杭州泽天春来科技有限公司 色谱仪
CN116242954A (zh) * 2023-05-06 2023-06-09 精智未来(广州)智能科技有限公司 一种呼气分子分析气相色谱数据的自动化分析方法与系统
CN117907511A (zh) * 2024-03-20 2024-04-19 浙江灵析精仪科技发展有限公司 一种多组分重叠峰的自动化解析方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07270387A (ja) * 1994-03-28 1995-10-20 Hitachi Ltd マルチチャンネルクロマトグラム解析方法及び装置
JPH0815247A (ja) * 1994-04-28 1996-01-19 Hitachi Ltd マルチチャンネルクロマトグラムの解析方法及びデータ処理装置
JP2010181350A (ja) * 2009-02-09 2010-08-19 Shimadzu Corp クロマトグラフ用データ処理装置
JP2011153966A (ja) * 2010-01-28 2011-08-11 Shimadzu Corp 三次元クロマトグラム用データ処理方法及びデータ処理装置
JP2011185743A (ja) * 2010-03-09 2011-09-22 Shimadzu Corp クロマトグラムピーク純度判定装置
WO2013035639A1 (ja) * 2011-09-05 2013-03-14 株式会社島津製作所 クロマトグラムデータ処理装置及び処理方法
WO2014108992A1 (ja) * 2013-01-08 2014-07-17 株式会社島津製作所 クロマトグラフ質量分析用データ処理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5644503A (en) * 1994-03-28 1997-07-01 Hitachi, Ltd. Methods and apparatuses for analyzing multichannel chromatogram
JP4185933B2 (ja) * 2003-03-31 2008-11-26 株式会社メディカル・プロテオスコープ 試料解析方法及び試料解析プログラム
CA2636025A1 (en) * 2006-02-08 2007-08-16 Thermo Finnigan Llc A two-step method to align three dimensional lc-ms chromatographic surfaces
CN102590406B (zh) * 2012-01-16 2013-12-18 湖南中烟工业有限责任公司 基于气相色谱-质谱分析数据的三维信息对比分析方法
CN102590407B (zh) * 2012-01-16 2013-12-18 湖南中烟工业有限责任公司 基于气相色谱-质谱分析的共流出峰解析及谱库检索方法
JP5742749B2 (ja) * 2012-02-23 2015-07-01 株式会社島津製作所 クロマトグラフ用データ処理装置及びデータ処理方法
EP3029459A4 (en) * 2013-09-09 2017-04-12 Shimadzu Corporation Peak detection method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07270387A (ja) * 1994-03-28 1995-10-20 Hitachi Ltd マルチチャンネルクロマトグラム解析方法及び装置
JPH0815247A (ja) * 1994-04-28 1996-01-19 Hitachi Ltd マルチチャンネルクロマトグラムの解析方法及びデータ処理装置
JP2010181350A (ja) * 2009-02-09 2010-08-19 Shimadzu Corp クロマトグラフ用データ処理装置
JP2011153966A (ja) * 2010-01-28 2011-08-11 Shimadzu Corp 三次元クロマトグラム用データ処理方法及びデータ処理装置
JP2011185743A (ja) * 2010-03-09 2011-09-22 Shimadzu Corp クロマトグラムピーク純度判定装置
WO2013035639A1 (ja) * 2011-09-05 2013-03-14 株式会社島津製作所 クロマトグラムデータ処理装置及び処理方法
WO2014108992A1 (ja) * 2013-01-08 2014-07-17 株式会社島津製作所 クロマトグラフ質量分析用データ処理装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ICHIRO SAKUMA ET AL.: "Resolution of unresolved peaks containing unknown components by high-performance liquid chromatograp", JOURNAL OF CHROMATOGRAPHY, vol. Vol.506, JPN6014051737, 1990, pages 223 - 243, XP026477027, DOI: doi:10.1016/S0021-9673(01)91580-8 *

Also Published As

Publication number Publication date
CN107076712A (zh) 2017-08-18
US20170336370A1 (en) 2017-11-23
US10416134B2 (en) 2019-09-17
CN107076712B (zh) 2019-01-11
JP6260709B2 (ja) 2018-01-17
WO2016035167A1 (ja) 2016-03-10

Similar Documents

Publication Publication Date Title
JP6260709B2 (ja) クロマトグラムデータ処理方法及び装置
JP6065981B2 (ja) クロマトグラフ用データ処理装置及び方法
US10429365B2 (en) Chromatogram data processing system
US10121643B2 (en) Chromatography/mass spectrometry data processing device
EP2728350B1 (en) Method and system for processing analysis data
US7391016B2 (en) Method for quantitative analysis of mixtures of compounds
JP6620894B2 (ja) クロマトグラフ質量分析用データ解析装置
JP6583433B2 (ja) クロマトグラムデータ処理方法及び装置
US9348787B2 (en) Method and system for processing analysis data
US11209406B2 (en) Data processing device
JP6048590B2 (ja) 包括的2次元クロマトグラフ用データ処理装置
JP5742749B2 (ja) クロマトグラフ用データ処理装置及びデータ処理方法
Hao et al. Determining the number of principal factors by eigenvector comparison of the original bi-linear data matrix and the one reconstructed from key variables
US10732156B2 (en) Multi-trace quantitation
JP2016017941A5 (ja)
CN115398226B (zh) 波形信息估计方法及装置以及峰波形处理方法及装置
JP6269803B2 (ja) クロマトグラフ用データ処理装置及び方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171127

R151 Written notification of patent or utility model registration

Ref document number: 6260709

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151