JP6260709B2

JP6260709B2 - クロマトグラムデータ処理方法及び装置

Info

Publication number: JP6260709B2
Application number: JP2016546242A
Authority: JP
Inventors: 陽野田
Original assignee: Shimadzu Corp
Current assignee: Shimadzu Corp
Priority date: 2014-09-03
Filing date: 2014-09-03
Publication date: 2018-01-17
Anticipated expiration: 2034-09-03
Also published as: CN107076712B; JPWO2016035167A1; CN107076712A; US20170336370A1; US10416134B2; WO2016035167A1

Description

本発明は、フォトダイオードアレイ（ＰＤＡ）検出器等のマルチチャンネル型検出器や質量分析計を検出器として用いた液体クロマトグラフ（ＬＣ）若しくはガスクロマトグラフ（ＧＣ）、又は、包括的２次元ガスクロマトグラフ（「ＧＣ×ＧＣ」とも呼ばれる）、包括的２次元液体クロマトグラフ（「ＬＣ×ＬＣ」とも呼ばれる）などの分析装置により収集されたクロマトグラムデータを処理するクロマトグラムデータ処理方法及び装置に関し、さらに詳しくは、クロマトグラム上やスペクトル上で重なっている異なる成分由来のピークを分離するためのクロマトグラムデータ処理方法及び装置に関する。

ＰＤＡ検出器等のマルチチャンネル型検出器を用いた液体クロマトグラフでは、移動相への試料の注入時点を基点とし、カラム出口から溶出する試料液に対して吸光スペクトルを繰り返し取得することで、時間、波長、及び吸光度（信号強度）という三つのディメンジョンを持つ３次元クロマトグラムデータを得ることができる。また、検出器として質量分析計を用いた液体クロマトグラフやガスクロマトグラフ、つまり液体クロマトグラフ質量分析計やガスクロマトグラフ質量分析計では、質量分析計において所定の質量電荷比範囲のスキャン測定を繰り返すことで、時間、質量電荷比、及び信号強度（イオン強度）という三つのディメンジョンを持つ３次元クロマトグラムデータを得ることができる。さらにまた、包括的２次元ガスクロマトグラフや包括的２次元液体クロマトグラフでは、互いに分離特性が相違する１次元目カラム及び２次元目カラムにおけるそれぞれの保持時間、及び信号強度という、実質的に三つのディメンジョンを持つ３次元クロマトグラムデータを得ることができる。

以下の説明では、３次元クロマトグラムデータを得られる分析装置としてＰＤＡ検出器を用いた液体クロマトグラフ（以下、特に明記しない限り、ＰＤＡ検出器を用いた液体クロマトグラフを単に「液体クロマトグラフ」という）を例に挙げるが、液体クロマトグラフ質量分析計、ガスクロマトグラフ質量分析計、包括的２次元液体クロマトグラフ、包括的２次元ガスクロマトグラフにおいても事情は同様である。

図１３（ａ）は、上述した液体クロマトグラフにより得られる３次元クロマトグラムデータの概念図である。この３次元クロマトグラムデータから特定の波長（例えばλ0）における時間方向の吸光度データを抽出することで、その特定の波長λ0における測定時刻（つまりは保持時間）と吸光度との関係を示す、同図（ｂ）に示すような波長クロマトグラム（以下、単に「クロマトグラム」という）を作成することができる。また、３次元クロマトグラムデータから特定の時点（測定時刻）における波長方向の吸光度を示すデータを抽出することで、該時点における波長と吸光度との関係を示す吸光スペクトル（以下、単に「スペクトル」という）を作成することができる。即ち、図１３（ａ）に示すような３次元クロマトグラムデータは、波長方向にスペクトル情報を、時間方向にクロマトグラム情報を有しているということができる。

こうした液体クロマトグラフを用いて試料に含まれる既知の目的成分の定量を行う場合には、通常、その目的成分による光の吸収が最も大きく現れる吸収波長におけるクロマトグラムを作成する。そして、そのクロマトグラム上で目的成分由来のピークの始点Ｔs及び終点Ｔeを見つけてピークの面積値を計算し、そのピーク面積値を予め求めておいた検量線に照らして定量値を算出するのが一般的である。

このようにして試料中の目的成分を定量する際に、作成したクロマトグラムに現れているピークが目的成分のみに由来するものであれば問題ないが、ピークは必ずしも単一成分（目的成分）によるものとは限らず、分析者が意図しない不純物（広く言えば目的成分以外の成分）由来の信号が重なっている場合がよくある。こうしたことに分析者が気付かずに定量計算を行うと、定量精度を損なうことになる。そこで、通常、定量計算に先立って、クロマトグラムに現れているピークが目的成分のみに由来するのか、或いは他の成分を含んでいるのか、の判定、いわゆるピーク純度判定が行われる。そして、着目しているピークに目的成分以外の成分由来のピークの重なりがある場合には、目的成分由来のピークと他の成分由来のピークとを分離するピーク分離処理を実行し、目的成分のみに由来する純度の高いピークを求め、該ピークに基づき定量計算を行うようにしている。

上記ピーク純度判定処理やピーク分離処理として、従来から様々な手法が知られ実用に供されている。
例えば特許文献１に記載のピーク分離処理では、目的成分の吸収波長を分析者が指定すると、時間方向に並んだ各スペクトル上でそれぞれ吸収波長付近における波長方向の微分値が計算され、その微分値を時間方向に並べた微分クロマトグラムが生成される。スペクトル上の上記吸収波長の位置に現れるピークに他の成分の重なりがある場合、微分クロマトグラムは平坦にならずにピークが現れる。そこで、この微分クロマトグラム上のピークの有無に応じて他の成分の重なりの有無を判定するとともに、この微分クロマトグラム上のピークの波形形状等を利用してスペクトル上やクロマトグラム上で複数の成分のピークを分離する。

しかしながら、こうした手法では、分析者自身が目的成分特有の吸収波長を指定する必要があり、そのためには或る程度の経験や熟練が分析者に必要である。即ち、分析作業に或る程度熟練した分析者による手作業が必要となる。また、このピーク分離処理手法では、二つの成分が重なったピークは分離できても、３以上の成分が重なったピークをそれぞれ分離するのは困難である。

ピーク分離処理の他の手法としてよく知られているのは、デコンボリューションを用いた手法である。例えば特許文献２に記載の手法では、得られたクロマトグラムに対し、おおまかなクロマトグラム波形形状としてガウス関数を利用したデコンボリューション処理や多変量解析処理（因子分析）などを行い、その結果から、成分の重なりのないスペクトル波形をまず求める。そして、得られたスペクトルに基づいてクロマトグラム波形を推定することにより、クロマトグラム上のピークを分離している。

しかしながら、このようにデコンボリューション処理を用いてスペクトルを先行的に推定し、そのあとに推定したスペクトル波形を用いて今度はクロマトグラム波形を推定するという手法の場合、クロマトグラムピークのテーリングにショルダーピークが存在すると原理的に解くことができず、適切なピーク分離が行えないという問題がある。図１４（ａ）〜（ｄ）により、一例を説明する。

図１４（ａ）は、横軸の時間をｘとしたときに、exp（−ｘ²）＋０．１＊exp（−（ｘ−３）²）で示される、ショルダーピークを含む関数である。この波形に、図１４（ｂ）に示されるexp（−ｘ）のインパルス応答を乗じた結果が図１４（ｃ）に示した波形である。この波形をガウス関数を用いて理想的にデコンボリューション処理すると、図１４（ｄ）に示すような波形が得られる。この図１４（ｄ）に示す波形は単純な減衰曲線とはなっていない。これは、デコンボリューション処理を行ってもショルダーピークに対応する保持時間におけるスペクトルに、主たるピークの成分が混入してしまうことを示している。

また、特許文献２に記載の手法では、重なっている他の成分を排して純度の高いスペクトルを推定する際に、そのスペクトルの要素が正値に限られるといった非負制限が課される。しかしながら、一般にＰＤＡ検出器で得られるスペクトルは多次元ベクトルとして見たときに、互いに従属な成分を多分に含んでいるため、単純な非負制限などの条件を課しただけでは異なる成分由来のスペクトル同士を分離することは困難である。即ち、クロマトグラム波形形状が自然なものとなる（クロマトグラムらしい波形となる）といった非負制限以外の制限を課すことなく、ショルダーピークのトップに対応する保持時間において観測されるスペクトルから、主たるピーク由来のスペクトル成分だけを引き去ることは困難である。

こうしたことから、特許文献２に記載の手法に限らず、まず純粋なスペクトルを推定した後にクロマトグラム波形形状を求めるという手順を採る全ての手法は、或るピークのテーリングに生じたショルダーピークを適切に扱うことができず、こうした波形形状のクロマトグラムピークの分離には適さないといえる。

国際公開第２０１３／０３５６３９号特開平８−１５２４７号公報

マクラクラン（Geoffrey J. McLachlan）、ほか１名、「ザ・イーエム・アルゴリズム・アンド・イクステンションズ（The EM Algorithm and Extensions）」、ウィレイ・シリーズ・イン・プロバビリティ・アンド・スタティスティクス（Wiley Series in Probability and Statistics）、2008年ビルメス（J. A. Bilmes）、「ア・ジェントル・チュートリアル・オブ・ジ・イーエム・アルゴリズム・アンド・イッツ・アプリケイション・トゥー・パラメータ・エスティメイション・フォー・ガウシアン・ミクスチャ・アンド・ヒドゥン・、マルコフ・モデルズ（A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models）」、テクニカル・レポート（Technical Report） TR-97-021、インターナショナル・コンピュータ・サイエンス・インスティチュート・アンド・コンピュータ・サイエンス・ディビジョン（International Computer Science Institute and Computer Science Division）、ユニバーシティ・オブ・カリフォルニア・アット・バークレー（University of California at Berkeley）、1998年

本発明は上記課題を解決するために成されたものであり、その目的とするところは、上述したような３次元クロマトグラムデータに基づいて、３以上の複数のピークが重なっているピークや、テーリングにショルダーピークがあるピークに対しても自動的に、つまり分析者による面倒な判断を伴う入力等を要することなく、適切に各試料成分由来のピークを分離したクロマトグラムやスペクトルを得ることができるクロマトグラムデータ処理方法及び装置を提供することである。

一般に、クロマトグラムやスペクトルにおいて、純粋である（つまり他の成分の重なりのない）或る一つの成分に由来して現れるピークの形状は、ガウス関数で以て近似的に表すことができる。したがって、通常、クロマトグラム、スペクトルのいずれにおいても、複数の成分由来のピークが重なっているピークの形状は、複数のガウス関数を線形結合した混合ガウス分布（ＧＭＭ＝Gaussian Mixture Model）であるとみなすことができる。

或る信号波形が与えられたとき、尤もらしい混合ガウス分布を導出する手法として、混合ガウス分布の期待値最大化（ＥＭ：Expectation Maximization、以下、慣用に従って「ＥＭ」と称す）アルゴリズムがよく知られている。
ＥＭアルゴリズムは反復法の一種であり、尤度関数の条件付き確率に関する期待値を計算する期待値（Ｅ）ステップと、期待値を最大化する解を求める最大化（Ｍ）ステップと、の二つのステップを繰り返すことで最尤推定解を求める手法であり、非特許文献１、２など各種文献に詳細に記載されている。混合ガウス分布のＥＭアルゴリズムでは、通常、最適なモデル数が予め計算条件の一つとして与えられる。それに対し、ここで問題としているピーク分離処理の場合、３次元クロマトグラムデータのうちの一方の２次元方向はクロマトグラム情報であり別の２次元方向はスペクトル情報であってそれらは全く別の種類の情報であるといったデータ形式上の特徴に加え、混合ガウス分布のモデル数、つまり重なっているピークの数自体が不明であるという特徴があり、一般的な混合ガウス分布のＥＭアルゴリズムをそのまま適用することはできない。

そこで本発明者は、ここで取り扱うデータの特徴や目的に対応するように混合ガウス分布のＥＭアルゴリズムを改良・変形し、クロマトグラム上で時間的に重なっている複数の成分由来のそれぞれの純粋なクロマトグラムを高い確度で推定し、ピークを良好に分離できるようにした。

即ち、上記課題を解決するために成された本発明は、測定対象である試料に対して収集された、時間、信号強度、及び第３のディメンジョンを有する３次元クロマトグラムデータを処理するクロマトグラムデータ処理方法であり、例えば混合ガウス分布のＥＭ（期待値最大化）アルゴリズムのように、ピークモデル関数の当てはめを２段階のステップに分けて行うことにより、時間と信号強度とをそれぞれ軸とするクロマトグラム上で重なっている、前記試料に含まれる複数の成分に由来するピークを分離するクロマトグラムデータ処理方法において、
a)時間と信号強度とをそれぞれ軸とするクロマトグラムの波形形状及び第３のディメンジョンと信号強度とをそれぞれ軸とするスペクトルの波形形状についての、予め与えられた推定結果又は後記当てはめ実行ステップによる推定結果のいずれかである波形形状モデルに基づいて、与えられた３次元クロマトグラムデータを１又は複数の成分に分配し、成分毎の３次元クロマトグラムデータを求めるデータ分配ステップと、
b)前記データ分配ステップにより得られた成分毎の３次元クロマトグラムデータから求まるクロマトグラム及びスペクトルに対し、クロマトグラム波形形状及びスペクトル波形形状の当てはめをそれぞれ行うことで、各成分に対応する波形形状モデルのパラメータを修正する当てはめ実行ステップであって、クロマトグラム波形形状が正しいとの仮定の下にスペクトル波形を最小二乗法により求める第１ステップと、スペクトル波形形状が正しいとの仮定の下にクロマトグラム波形を最小二乗法により求める第２ステップとを繰り返し実行することで当てはめの尤もらしさを高める当てはめ実行ステップと、
c)前記データ分配ステップ及び前記当てはめ実行ステップを規定回数だけ又は解が収束したとみなせるまで繰り返し実行したあと、その時点で得られる各成分に対応するスペクトルと直交するスペクトル成分を抽出する又は強調するように、与えられた３次元クロマトグラムデータをフィルタリング処理し、そのフィルタリング後のデータに現れるピーク状波形の高さに基づいて、さらに別の成分が前記試料に含まれているか否かを判定する含有成分判定ステップと、
を有することを特徴としている。
即ち、本発明に係るクロマトグラムデータ処理方法において、データ分配ステップはＥＭアルゴリズムにおけるＥ（期待値）ステップに相当し、当てはめ実行ステップはＥＭアルゴリズムにおけるＭ（最大化）ステップに相当する。

クロマトグラフのカラムにより時間方向に分離された各種成分を含む試料に対し、ＰＤＡ検出器などの検出器により吸光スペクトルや蛍光スペクトルなどを繰り返し取得することで３次元クロマトグラムデータを収集する場合には、上記「第３のディメンジョン」とは波長である。

クロマトグラフのカラムにより時間方向に分離された各種成分を含む試料に対し、質量分析計によりマススペクトルを繰り返し取得することで３次元クロマトグラムデータを収集する場合には、上記「第３のディメンジョン」とは質量電荷比m/zである。

さらにまた、包括的２次元クロマトグラフにより３次元クロマトグラムデータを収集する場合には、上記「第３のディメンジョン」とは時間（保持時間）である。この場合、三つのディメンジョンのうち二つが時間であり、その一方の時間は時間刻みが大きい第１の保持時間であり、他方の時間は第１の保持時間の一つの時間刻みの中の細かい時間刻みを表す第２の保持時間である。

また、ここでいう「３次元クロマトグラムデータ」は、クロマトグラフのカラムを経て成分分離された試料の代わりに、フローインジェクション分析（ＦＩＡ＝Flow Injection Analysis）法によって、成分分離されることなく導入された試料に対してＰＤＡ検出器などのマルチチャンネル型検出器や質量分析計により得られたデータであってもよい。即ち、単一成分のみが含まれている場合に、時間経過に伴ってガウス関数として近似可能である山形状に成分濃度が変化するデータでありさえすれば、本発明に係るクロマトグラムデータ処理方法及び装置において処理対象とすることができる。

本発明に係るクロマトグラムデータ処理方法では、当てはめ実行ステップにおけるピークモデルの推定とデータ分配ステップにおけるピークモデルの混合比の推定とを繰り返し行うことで、入力された３次元クロマトグラムデータに基づいてクロマトグラムピーク形状とスペクトル形状とを共に推定し、その推定結果に基づいてピーク分離を行う。その際に、当てはめ実行ステップにおいて、クロマトグラム波形の推定とスペクトル波形の推定とを交互に繰り返すことで、それぞれの波形形状の精度を向上させることができる。それによって、テーリングを含むショルダーピークも適切にピーク分離することができる。

当てはめ実行ステップとデータ分配ステップとの適宜の繰り返しによって、そのときのピークモデルの仮定の下でのピークモデルの混合比が決まると、含有成分判定ステップにおいて、与えられた３次元クロマトグラムデータに対する残渣が得られる。もし、ピークモデル波形の仮定が適切であって入力データの分配も適切であれば、残渣はほぼ一定になる筈である。これに対し、残渣にピーク状波形が観測される場合には、ピークモデル波形の仮定が適切でないと推定され、それはそのときのモデル数の仮定が適切でない可能性が高いとみなせるから、さらに別の成分が含まれていると推断する。そして、ピークモデル数を増やした条件の下で、再び、当てはめ実行ステップにおけるピークモデルの推定とデータ分配ステップにおけるピークモデルの混合比の推定とを繰り返し行う。

こうして残渣に基づく判断に応じてピークモデル数を増加させつつＥＭアルゴリズムを実行することで、ピーク分離についての解を最適解に近づけることができる。その結果、重なっている成分の数が不明であっても、また３以上の多数の成分が重なっている場合でも、適切なピーク分離を行うことが可能となる。

また本発明に係るクロマトグラムデータ処理方法において、好ましくは、上記含有成分判定ステップは、別の成分が前記試料に含まれていると判定されたとき、前記フィルタリング後のデータに現れるピーク状波形を、追加すべき該別の成分のクロマトグラム波形形状の初期値として前記データ分配ステップによる処理に供するようにするとよい。

これにより、ピークモデル数を増加させて再びＥＭアルゴリズムを実行するときに、該アルゴリズムをより適切な初期状態から開始することができる。その結果、解の収束性が向上し、より少ない繰り返し回数で以て適切なピーク分離が行える。

また、本発明に係るクロマトグラムデータ処理方法において、
上記データ分配ステップでは、上記推定結果である各クロマトグラム波形及び各スペクトル波形に基づいて計算される信号強度の理論値を与えられた３次元クロマトグラムデータから差し引いて求めた残渣信号を各測定点の理論値の強度比に応じて分配する比例分配と、該残渣信号を各成分に等しく分配する均等分配とを、ピーク分離処理のためのステップの繰り返し回数又は解の収束度合いに応じて切り替えるようにするとよい。
具体的には、ＥＭアルゴリズムの繰り返し回数が少ないときには均等分配を用い、繰り返し回数が或る程度大きくなったならば比例分配を用いるとよい。

また、本発明に係るクロマトグラムデータ処理方法において、
上記データ分配ステップでは、上記推定結果である各クロマトグラム波形及び各スペクトル波形に基づいて計算される信号強度の理論値を与えられた３次元クロマトグラムデータから差し引いて求めた残渣信号を、各成分に対するスペクトルの線形和による最小二乗近似に応じて分配するようにしてもよい。
なお、最小二乗近似を行う際に、各成分のスペクトルに対して与えられる重みを、残渣信号の大きさ若しくは各成分における前記信号強度の理論値の大きさ、又はその両方を用いて制限するようにしてもよい。

この分配方法は上記均等分配や比例分配に比べて精度の高い分配が行える可能性が高いものの、残渣信号の全てが分配されるわけではない。そこで、こうした分配方法を用いる場合でも、上記均等分配や比例分配を併用することが望ましい。

また本発明に係るクロマトグラムデータ処理方法では、
各成分のクロマトグラム波形を任意の比率で加算したクロマトグラム波形を求め、該クロマトグラム波形上の強度と前記信号強度の理論値との差異に基づいて、ＥＭアルゴリズムによる解の安定性を推定するようにするとよい。

また本発明に係るクロマトグラムデータ処理方法において、当てはめ実行ステップでは、クロマトグラムモデル波形としてごく一般的なＥＭＧ（Exponential Modified Gaussian）等のモデル関数を用いてもよいが、より好ましくは、ピーク幅やピーク高さなどを正規化したクロマトグラム波形が収録されたデータベースを利用し、該データベースから最適なクロマトグラム波形を選択して用いるようにするとよい。

これにより、より現実的なクロマトグラム波形をピークモデルとして使用することができるので、当てはめの精度が一層向上する。

また特にＰＤＡ検出器では、成分濃度が高い場合に直線性が低下し、その影響でスペクトル形状が僅かながら変化することがある。この変化のために、実際にはピークモデル数が適切であるにも拘わらず、含有成分判定ステップにおいてピークモデル数が誤判定されることがある。

そこで、本発明に係るクロマトグラムデータ処理方法では、
残渣信号にピーク状波形があった場合に、該残渣信号を行列として主成分分析して得られる固有値の各要素の大きさの比率に基づいて、前記ピーク状波形が検出器の直線性劣化に起因するものであるか否かを判定し、直線性劣化に起因するものであると推定されるときには追加すべき成分はないと結論付けるようにするとよい。これによって、過剰なピーク分離を避けることができる。

また本発明に係るクロマトグラムデータ処理装置は、上記本発明に係るクロマトグラムデータ処理方法を実施する装置であって、測定対象である試料に対して収集された、時間、信号強度、及び第３のディメンジョンを有する３次元クロマトグラムデータを処理するクロマトグラムデータ処理装置であり、例えば混合ガウス分布のＥＭアルゴリズムのように、ピークモデル関数の当てはめを２段階のステップに分けて行うことにより、時間と信号強度とをそれぞれ軸とするクロマトグラム上で重なっている、前記試料に含まれる複数の成分に由来するピークを分離するクロマトグラムデータ処理装置において、
a)時間と信号強度とをそれぞれ軸とするクロマトグラムの波形形状及び第３のディメンジョンと信号強度とをそれぞれ軸とするスペクトルの波形形状についての、予め与えられた推定結果又は後記当てはめ実行部による推定結果のいずれかである波形形状モデルに基づいて、与えられた３次元クロマトグラムデータを１又は複数の成分に分配し、成分毎の３次元クロマトグラムデータを求めるデータ分配部と、
b)前記データ分配部により得られた成分毎の３次元クロマトグラムデータから求まるクロマトグラム及びスペクトルに対し、クロマトグラム波形形状及びスペクトル波形形状の当てはめをそれぞれ行うことで、各成分に対応する波形形状モデルのパラメータを修正する当てはめ実行部であって、クロマトグラム波形形状が正しいとの仮定の下にスペクトル波形を最小二乗法により求める第１ステップと、スペクトル波形形状が正しいとの仮定の下にクロマトグラム波形を最小二乗法により求める第２ステップとを繰り返し実行することで当てはめの尤もらしさを高める当てはめ実行部と、
c)前記データ分配部による処理及び前記当てはめ実行部による処理を規定回数だけ又は解が収束したとみなせるまで繰り返し実行したあと、その時点で得られる各成分に対応するスペクトルと直交するスペクトル成分を抽出する又は強調するように、与えられた３次元クロマトグラムデータをフィルタリング処理し、そのフィルタリング後のデータに現れるピーク状波形の高さに基づいて、さらに別の成分が前記試料に含まれているか否かを判定する含有成分判定部と、
を備えることを特徴としている。

本発明に係るクロマトグラムデータ処理方法及び装置によれば、例えば、検出器としてＰＤＡ検出器等のマルチチャンネル型検出器や質量分析計を用いたクロマトグラフにより収集された３次元クロマトグラムデータに基づいて作成されるクロマトグラムやスペクトルに現れるピークが、３以上の複数の成分由来のピークが重なったものであっても、或いは、テーリングにショルダーピークが存在するようなピークであっても、重なっているピークを的確に分離することができる。それによって、例えばクロマトグラフの分離性能が良好でないような場合であっても、試料に含まれる複数の成分の定量を高い精度で行うことができる。

本発明に係るクロマトグラムデータ処理方法を実施するクロマトグラムデータ処理装置を備えた液体クロマトグラフ装置の一実施例の概略構成図。本発明の一実施例であるピーク分離処理の基本的な手順を示すフローチャート。混合ガウス分布（ピークが２個の場合）によるクロマトグラム波形の一例を示す図。ピークモデルのパラメータ推定処理のフローチャート。ピークの幅の推定処理の説明図。ピーク状波形がある場合のスペクトル残渣クロマトグラムの一例を示す図。或る入力信号に対して主成分分析を行ったときの主成分と固有値との関係を示すグラフ。テーリング上の不純物ピークの状況を示す図。他の実施例におけるピーク分離処理を示すフローチャート。図９中のＰＣＡ次元でのＥＭ追加ステップにおける処理手順を示すフローチャート。図９中のＰＣＡ次元でのＥＭステップにおける処理手順を示すフローチャート。図９中の実次元でのＥＭステップにおける処理手順を示すフローチャート。液体クロマトグラフにより得られる３次元クロマトグラムデータの概念図（ａ）及び波長クロマトグラムの一例を示す図（ｂ）。テーリング上にショルダーピークがある場合におけるデコンボリューション処理の一例を示す図であり、元のピーク波形（ａ）、インパルス応答波形（ｂ）、（ａ）のピーク波形に（ｂ）のインパルス応答波形を乗じた波形（ｃ）、及び、（ｃ）のピーク波形をガウス関数を用いて理想的にデコンボリューション処理した結果の波形（ｄ）をそれぞれ示す図。

まず、本発明に係るクロマトグラムデータ処理方法の一実施例について、添付図面を参照して説明する。
このクロマトグラムデータ処理方法は、既に説明した図１３（ａ）に示したような３次元クロマトグラムデータに対してピーク分離処理を実施し、試料に含まれる成分毎のクロマトグラム波形及びスペクトル波形を推定するものである。図２はこのピーク分離処理の基本的なフローチャートである。

一般に知られているように、クロマトグラムやスペクトルに現れる純粋なピークの形状は、ガウス関数で以て近似的に表される。そのため、通常、クロマトグラム、スペクトルのいずれにおいても、複数の成分由来のピークの重なりは複数のガウス関数を線形結合した混合ガウス分布であるとみなせる。そこで、ここでは、クロマトグラム上やスペクトル上でのピーク分離に、混合ガウス分布（ＧＭＭ）のＥＭアルゴリズムを利用する。ＥＭアルゴリズムは一般に、確率変数に対する確率密度関数を表す確率モデルのパラメータを最適化するステップ（つまりＭステップ）と、その確率モデルに基づく信号分離を最適化するステップ（つまりＥステップ）を繰り返し実行するアルゴリズムである。ここでは、各確率モデルがそれぞれ一つの成分に対応する３次元クロマトグラムデータからなる一つのピークを示しており、該データはクロマトグラム波形情報とスペクトル波形情報とを持つ。そして、複数の確率モデルがそれぞれの濃度で以て混合されたものが観測信号であるとしてモデル化している。図３は二つの確率モデル（モデル１、２）とそれを混合した波形の例を示している。

ＧＭＭのＥＭアルゴリズム自体は従来、様々な分野で用いられている。一般に、ＧＭＭのＥＭアルゴリズムでは、適切な確率モデル数やおおよその初期値を与えた状態で処理を実行しないと、局地解に陥ることが知られている。しかしながら、ピーク分離処理の場合、クロマトグラム情報に加えてスペクトル情報を持つといったデータ形式上の特徴に加え、確率モデルの数、つまり重なっているクロマトグラムピークの数がそもそも不明である、という特徴がある。そこで、最適な確率モデルの数が不明であるという問題を解決するべく、ＧＭＭのＥＭアルゴリズムを基本として、以下に説明するような様々な特徴や変形を加えることで、良好なピーク分離処理が行えるようにした。
なお、上述したように、ＧＭＭのＥＭアルゴリズム及びその計算方法については、非特許文献１、２をはじめ、各種文献に詳細に記載されているので、ここではその詳しい説明は省略する。

上述したように、ここでは同じ保持時間範囲及び同じ波長範囲に重なっている成分の数、つまりピーク分離処理後のピークモデル数は、処理前には未知である。そこで、ピーク数が１であると仮定してピークモデル数＝１から処理を開始する。また、その一つのピークのモデルパラメータを適当に設定する（ステップＳ１）。
なお、ピーク数の初期値を１とするのではなく、既存手法によるピーク分離やクロマトグラムの信号処理で一般に行われている直線によるピーク分割を行うことで得られた結果をピーク数の初期値としてもよい。即ち、ピーク数が或る値以下でないことが高い確率で分かっている場合には、その値を初期値とすれば、より効率良く（つまりは短い処理時間で）最終的な結果に辿り着くことができる。

次に、ＥＭアルゴリズムのＥステップとして、設定されているモデルパラメータに従ったピークモデルに基づいて、入力されたクロマトグラム信号を分配する（ステップＳ２）。ただし、ピーク数が１である状態でステップＳ２が実行されるときには、信号分配の必要はないのでステップＳ２は実質的にスルーされる。

このＥステップでは、理想的には、入力されたクロマトグラム信号に、ピークモデルパラメータで表されるスペクトルを乗じたものが分配された信号となるが、ここではさらに、各ピークモデルによるスペクトルの高さを誤差最小二乗基準で以て最適化している。一般的なＧＭＭであれば、その最適化後に分配されずに残った残渣信号を各ピークモデルに与えられた重みに比例して分配する。ここでは、そのようにしてもよいが、より好ましくは、理想的な信号分配を行った後の残渣信号に対し、次に述べる比例分配、均等分配、スペクトル分配の３種類の異なる方法による信号分配を適宜行うようにするとよい。

（１）比例分配
比例分配は、一般のＧＭＭと同様の処理を波長毎に行うものである。即ち、ピークモデルと入力信号とに基づいて得られた残渣信号を、ピークモデル波形上の強度に比例して分配する。

（２）均等分配
均等分配は、入力信号に対する残渣信号を全てのピークモデルに均等に分配するものである。これはＥＭステップの初期段階など、推定されるピークモデルと真値との乖離が大きい場合に特に有効である。

（３）スペクトル分配
スペクトル分配では、各保持時間において、残渣信号が各ピークモデルのスペクトルの合成値であるとみなし、それぞれのスペクトルの大きさを最小二乗法によって求める。ただし、過適応を回避するため、各スペクトル成分の重みは残渣スペクトルと各ピークモデルのスペクトルとの内積又はそれに近い所定値以下であるという制限を加えた、制限付き最小二乗法を用いる。スペクトル分配はかなり有効な信号分配方法であるものの、残渣信号を全て分配することはできない。そこで、スペクトル分配を行うことで残った残渣信号を、さらに比例分配や均等分配により分配する必要がある。

各ピークモデルに信号が分配されたならば、次に、ＥＭアルゴリズムのＭステップとして、各ピークモデルに分配された信号に対しピークモデルの当てはめを実行して尤度が向上するようにモデルパラメータを修正する（ステップＳ３）。
一般に、理想的な液体クロマトグラフによって得られるクロマトグラムデータでは、成分濃度等に依らずに、各ピークモデルに固有のスペクトルを示す。そこでここでは、各ピークモデルが必ず固有のスペクトルをもつというスペクトル情報による制約を前提として、改良した処理を実行する。

即ち、ステップＳ３では、ピーク形状が単純なガウス関数であると仮定したガウス分布Ｍステップと、予めテーリングがあると仮定したｍ−ガウス分布（変形ガウス分布）Ｍステップと、を併用する。
通常のガウス関数はテーリングを表現することができないため、ガウス分布Ｍステップによるパラメータの最適化は精度の点で劣る。一方、パラメータの数が少なくて済むため、過適応により局地解に陥るおそれは小さいという利点がある。これに対し、ｍ−ガウス分布Ｍステップでは、理想的なガウス関数でなく、ＥＭＧ（Exponential Modified Gaussian）関数等のテーリングモデル関数や、実測により得られたピーク波形等に基づいて作成された波形群を用いた当てはめを行うことでピークモデル波形を求める。そのため、ガウス分布Ｍステップに比べて、ピークモデル波形近似を高精度に行うことができる。その反面、自由度が高い分、過適応による局地解に陥りやすいという欠点がある。そこで、ここでは、ステップＳ２、Ｓ３を繰り返すＥＭアルゴリズムの初期には、精度よりも処理の安定性を重視した通常のガウス分布Ｍステップを用い、ＥＭアルゴリズムの後期には、精度を重視したｍ−ガウス分布Ｍステップを用いる。これによって、処理の安定性とピーク波形推定の精度とを両立させることができる。
各Ｍステップの詳細は次のとおりである。

（１）ガウス分布Ｍステップ
通常、ＧＭＭでは確率密度関数に対してガウス分布のフィッティングを行うが、ここでは確率密度関数の代わりに、各保持時間におけるスペクトル（つまりは波長と信号強度との関係を示す波形）を用いる。
図４は、このときのピークモデルのパラメータ推定処理のフローチャートである。

即ち、まず最初に、適当に初期スペクトルを設定した（ステップＳ１１）あと、スペクトルが既知であるとの仮定の下に、該スペクトルと分配信号との内積を入力とし、各波長において共通である最適なクロマトグラムピークのモデルパラメータを算出する（ステップＳ１２）。それによってクロマトグラム波形が一旦決まるから、引き続いて、クロマトグラム波形のモデルパラメータが既知であるとの仮定の下に、該クロマトグラム波形と分配信号との内積を計算し、これを最適なスペクトルとして定める（ステップＳ１３）。こうして、ピークモデルのパラメータとして、クロマトグラム上のピークの幅及び位置とを推定するとともに、スペクトルも推定する。なお、ここでは、クロマトグラムやスペクトルにベースラインノイズが含まれているため、一般的な確率分布を対象としたＧＭＭで用いられている、分布のモーメントからモデルパラメータを求める方法は使用できない。そこで、最小二乗法を用いることで、ピークの位置及び幅の推定を行っている。

（２）ｍ−ガウス分布Ｍステップ
テーリングを含む変形要素を組み入れた変形ガウス分布をモデル関数として用いることを除き、このＭステップの目的は上述したガウス分布Ｍステップと同じである。
クロマトグラム上のピークの幅及び位置やテーリング形状を求めるに当たっては、そのピークの位置及び幅を求めた後に、様々な変形ガウス分布モデル波形を収録したデータベースとの照合を行う。

ピークの位置の推定は、時間方向にサブサンプリング単位でミーンシフトを行い、ピークトップを推定することにより行われる。一方、ピークの幅の推定は、図５に示すように、ピーク高さの最大値を１として、幅内の信号平均高さが０．７２となるように幅を決めることによって行われる。これにより、高精度で且つ半値幅よりもロバストにピーク幅を求めることができる。もちろん、平均高さは０．７２以外の値を用いてもよい。
また、テーリング形状については、上記データベースとの照合によって、形状の類似性が最も高い（相関度が高い）波形を抽出すればよい。このデータベースは、モデル関数から妥当な範囲でパラメータを調整することにより作成してもよいし、実測した波形をクラスタリングすることで求めてもよい。上記処理は、一つのピークを前半（リーディング）部と後半（テーリング）部とに切り分けてそれぞれ実施するようにしてもよいが、こうした切り分けを行わずに前半部及び後半部をセットにしたデータに対して処理を行うようにしてもよい。

上記ステップＳ２、Ｓ３の処理が終了したならば、解が収束したか否かを判定する。また、仮に解が収束していなくても、ステップＳ２、Ｓ３の処理の繰り返しを規定の回数実行したか否かを判定する（ステップＳ４）。そして、解が収束しておらず処理の繰り返しも規定回数に達していなければ、ステップＳ２へと戻る。したがって、ステップＳ４からＳ２へと戻った場合には、ステップＳ３（Ｍステップ）において修正されたモデルパラメータを用いてステップＳ２（Ｅステップ）が実行されることになる。

ステップＳ４でＹｅｓと判定されたならば、ＥＭアルゴリズムを実施することによって残った残渣信号を求め、この残渣信号のピーク状波形の有無を判定することにより、ピークモデルを追加すべきか否かを判断する（ステップＳ５）。

具体的には、入力されたクロマトグラム信号から各ピークモデルのスペクトルに直交するスペクトルを残渣信号として抽出し、各保持時間において、その残渣信号の２次ノルムを計算する。そして、その残渣信号の２次ノルムを時系列順に並べた、スペクトル残渣クロマトグラムを作成する。少なくとも着目しているクロマトグラム上のピークに重なっている複数の成分それぞれについてピークモデルが定められている場合には、残渣信号がほぼゼロになるか、或いはバックグラウンドノイズなどの影響でゼロにはならないにしても、残渣信号に時間的な大きな変動はない。したがって、スペクトル残渣クロマトグラム中にピーク状波形が観測されれば、残渣信号に未だ別の成分が残っていると考えられる。この場合には、新たにピークモデルを追加する必要がある。図６はピーク状波形がある場合のスペクトル残渣クロマトグラムの一例である。

スペクトル残渣クロマトグラムにおいてピーク状波形の有無を判定するには、既知の各種のピーク検出方法を用いることができるが、ここでは、次のようにしてピーク状波形の有無を判定する。
即ち、スペクトル残渣クロマトグラムに対してピーク検出を実施し、最大値を含む半値幅（ここでは信号強度が最大値の６０％である幅）を確定する。そして、その半値幅内の信号強度の５次微分を計算してそれをノイズレベルとし、半値幅内での信号の最大値と最小値との差をノイズレベルと比較し、ノイズレベルに比べて十分に大きければ（例えばノイズレベルの所定倍以上であれば）、それがピーク状波形であると判定する。

上述したようにステップＳ５において残渣信号にピーク状波形ありと判定されたならば、別の成分の重なりがあると推定し、そのピーク状波形に基づいて適当なモデル初期値を設定したうえでモデルピークを追加し（ステップＳ６）、ステップＳ２へ戻る。一方、ステップＳ５において残渣信号にピーク状波形なしと判定されたならば、モデルピークの追加不要と判断して処理を終了する。
ただし、残渣信号にピーク状波形が存在しても、そのピーク高さが残渣信号全体のＳＮ比レベル以下である場合には、そのピークは実はノイズ変動である可能性が高い。そこで、波長毎に残渣信号を正規化し、各波長においてピーク状波形の最大値部分での残渣信号のスペクトルが上記ノイズレベル以下である場合には、例外的にモデルピークの追加なしとして処理を終了する。

ステップＳ６からＳ２へと戻った場合には、ピークモデルが一つ増加した状態で再び上記ステップＳ２〜Ｓ４によるＥＭアルゴリズムの繰り返しが実行される。そして、着目しているピークに重なっている成分がほかには無いとみなせる状態になると、ステップＳ５においてＮｏと判定されて処理が終了し、各成分に対応付けられるクロマトグラム及びスペクトルが確定する。

ただし、検出器としてＰＤＡ検出器が使用される場合には、ノイズ以外に、検出器のリニアリティの劣化に伴う偽のピーク状波形の発生も考慮することが望ましい。
即ち、一般的にＰＤＡ検出器は、高濃度の試料に対する検出のリニアリティが劣化する傾向にある。そのため、成分濃度が高くなるに伴いスペクトルのピーク状波形が変化してしまい、同一試料成分に対するスペクトルの形状が不変であることを前提とする本データ処理方法では、上記ピーク状波形の変化が残渣信号上で想定外のピーク状波形として現れることがある。

入力されたクロマトグラム信号が理想的である場合、該信号に対して主成分分析（ＰＣＡ）を行うと、重なっているピークの数だけ大きな固有値を持つ要素が現れ、残りの固有値にはノイズが含まれる。図７は或る入力信号に対して主成分分析を行ったときの主成分と固有値との関係を示すグラフである。図７中にＡで示すように、検出器のリニアリティ劣化がなく且つ重なるピークが一つのみである場合には、第１主成分の固有値が突出して大きくなる。それに対し、重なっているピークが一つのみではない信号の場合には、図７中にＢに示すように、第１主成分の固有値の大きさは第２主成分の固有値等に比べて突出する程大きいわけではない。
一方、図７中のＣ、Ｄは検出器のリニアリティ劣化がある場合の例であり、Ｃはリニアリティ劣化が小さい場合、Ｄはリニアリティ劣化が大きい場合の固有値である。これら結果から、リニアリティ劣化が殆どない場合の固有値に比べて、第２及び３主成分が大きく、リニアリティ劣化の程度が大きいほど第２及び３主成分も大きくなることが分かる。このことから、入力された信号に対する主成分分析における第１〜第３主成分の固有値を判定することによって、残渣信号の中で検出器のリニアリティ劣化による要素が大部分を占めるか否かを判断可能であることが分かる。

そこで、本実施例のデータ処理方法では、経験的に以下のような方法を採用するとよい。即ち、入力クロマトグラム信号に対し１５次元の主成分分析を行い、残渣の第１主成分の固有値をＺ₁、第ｎ〜ｍ主成分の固有値の２次ノルムをＺ_n-mとして、同様に入力信号に対する固有値に関する変数をＳとしたとき、以下の式で求められる指標値を用いる。当然のことながら、モーメント等の分布広がりを示す特徴量を用いて、第１〜第３主成分の固有値の大きさを求めることも可能である。
ＺＲ₁＝sqrt{(Ｚ₁ ²−Ｚ_12-15 ²)／(Ｚ_2-5 ²−Ｚ_12-15 ²)}
ＺＲ₂＝sqrt{(Ｚ₁ ²−Ｚ_12-15 ²)／(Ｚ_6-8 ²−Ｚ_12-15 ²)}
ＳＲ₁＝sqrt{(Ｓ₁ ²−Ｓ_12-15 ²)／(Ｓ_2-5 ²−Ｓ_12-15 ²)}
ＳＲ₂＝sqrt{(Ｓ₁ ²−Ｓ_12-15 ²)／(Ｓ_6-8 ²−Ｓ_12-15 ²)}
ＺＲ₁／ＳＲ₁＜０．５、且つ、ＺＲ₂／ＳＲ₂＜０．０１であるとき劣化ありと判定

上記のようにしてリニアリティ劣化ありと結論付けられたならば、スペクトル残渣クロマトグラムにピーク状波形が観測されたとしても、その原因は検出器のリニアリティ劣化にある可能性が高い。そこで、その場合には、ステップＳ６におけるピークモデル追加を行うことなく、処理を終了するとよい。

また、上述したように、本実施例のデータ処理方法では、ピークのテーリングを扱うために、特定の条件においては解が一意に求まらず不安定となる。例えばＥＭＧ関数等のテーリングは複数のガウス関数で以て近似することができる。そのため、この複数のガウス関数のうち一つと不純物ピークの形状とがほぼ一致する場合には、テーリング度合いを調整することによって不純物ピークに主成分ピークのスペクトルを足し合わせても自然な結果の解となる（図８参照）。
この主成分ピークのスペクトルを不純物ピークに足し合わせても波形形状が自然であるという条件は、クロマトグラムの時間軸で考えると不純物ピークを多少足しても、主成分のクロマトグラムはテーリングが変わる程度で自然にフィッティングできるということを示している。そこで、好ましくは、主成分のクロマトグラムのピークモデル波形に不純物成分のクロマトグラムのピークモデル波形を足し合わせた際に、モデル当てはめステップにおける二乗誤差の増加がどの程度であるのかに基づいて解の安定性を判断するステップ、を加えるようにするとよい。

また、クロマトグラム上の或るピークが大きなピークと小さなピークとの合成ピークである場合、解の安定性のうえで問題となるのは小さなピークの変動である。そこで、各ピークモデルの高さとしてスペクトルの２次ノルムを用い、小さいほうのクロマトグラムのピークを一定割合（例えば±１０％程度）変動させた場合を想定して、モデル当てはめステップにおける二乗誤差の変動量を求め、この変動量に基づいて不安定解の判定を行うようにしてもよい。

また、上記のような解の安定性の判定や不安定解の判定を行った結果、著しく不安定である解が存在するとの結果が得られ、且つ、スペクトルの相関が一定以上ある場合には、本来一つであるピークが過剰な数のピークに分配されてしまっている可能性がある。そこで、こうしたことを判定する処理を加え、過剰な分配が確認された場合には、複数のピークモデルを統合する統合処理を行ってピークモデルの数を減らすようにしてもよい。

さらにまた、純品検査などの特定の用途においては、上述したように不安定解であると判定された場合に、どの程度の範囲で解が不安定であるのかを知りたい場合がある。これは例えば、不純物のピーク面積に対するピーク面積が１．５以下ならば合格であるとの合否判定基準が設定されているときに、不純物のピーク面積が１であると算出され、且つそれが不安定解であると判定されたような場合である。この場合、不安定解が１．５倍以上になり得るか否かの判断が重要である。
こうしたことに対応するためには、例えば、ピーク高さやピーク面積などが同じになるように正規化したクロマトグラム波形を用いて解が不安定となる範囲を調べた後に、スペクトルにおける各波長の信号強度に比例させて各波長における解の範囲をそれぞれ求めるようにするとよい。

次に、上記実施例のクロマトグラムデータ処理方法を基本としつつ、処理の高速化を図り、且つ、上述したような付加的な処理を盛り込んだ、他の実施例によるクロマトグラムデータ処理方法を、図９〜図１２に示したフローチャートを参照しつつ説明する。
このクロマトグラムデータ処理方法では、３次元クロマトグラムデータについて各スペクトルを主成分分析により次元圧縮する（ステップＳ２１）。これは、処理対象のデータ量を圧縮するためである。そして、図２中のステップＳ１と同様のステップＳ２２の初期設定を実施したあとに、ＰＣＡ次元でのＥＭ追加ステップ処理を実行する（ステップＳ２３）。

この処理は図１０に示すように、Ｍステップから始まるが、これはピークモデル数が１であるときにＥステップは実質的に行われないためであり、図２においてステップＳ１→Ｓ２→Ｓ３と進む処理と何ら変わりはない。そして、図１０中のステップＳ２３２、Ｓ２３３は図２中のステップＳ５、Ｓ６と実質的に同じであり、図１０において、ステップＳ２３３でＹｅｓと判定されたときにステップＳ２３４に進む処理は、図２においてステップＳ５でＹｅｓと判定されたときにステップＳ６を経てＳ２へと戻る処理と同じである。

ここでは、ステップＳ２３４のＥステップにおいて、理想的な信号分配を行った後の残渣信号についての信号分配として、上述した三つの方法のうち、均等分配と比例分配を利用している。即ち、ステップＳ２３４〜Ｓ２３７の繰り返し回数をｉとしたときに、ｉが１０未満で奇数である場合には均等分配による信号分配を行い、ｉが１０未満で偶数である場合及びｉが１０以上である場合には比例分配による信号分配を行う（ステップＳ２３５）。そして、そのあとのステップＳ２３６のＭステップでは、上記繰り返し回数ｉが２０未満であればガウス分布Ｍステップの処理を実行し、ｉが２０以上であればｍ−ガウス分布Ｍステップの処理を実行する（ステップＳ２３６）。Ｍステップの実行後、ＥＭステップの繰り返し回数ｉが所定数に達したか否かを判定し（ステップＳ２３７）、所定数に達していなければステップＳ２３４へ戻る。ここで、所定数は例えば５０とすればよい。そして、ステップＳ２３７でＹｅｓと判定されたならば、図２においてステップＳ４からＳ５へと進むのと同様に、Ｓ２３７からＳ２３２へと戻る。そして、新たにピークモデルを追加する必要がなくなれば、ステップＳ２３３でＮｏと判定され、このＰＣＡ次元でのＥＭ追加ステップの処理を終了する。

引き続き、ＰＣＡ次元でのＥＭステップ処理を実行する（ステップＳ２４）。即ち、図１１に示すように、Ｅステップでは繰り返し回数に応じて均等分配による信号分配と比例分配による信号分配とが選択的に実行され（ステップＳ２４１〜Ｓ２４３）、Ｍステップではｍ−ガウス分布Ｍステップの処理が実行される（ステップＳ２４４）。そして、推定されたスペクトルが収束しているか否かを判定し（ステップＳ２４５）、収束していると判定された場合には、例えば上述したように、著しく不安定である解が存在し、且つ、スペクトルの相関が一定以上あるか否かを判定することで、過剰な分配があるか否かを判定する（ステップＳ２４６）。過剰な分配があると判定された場合には、複数のピークモデルを統合する統合処理を行ってピークモデルの数を減らし（ステップＳ２４７）、ステップＳ２４１へと戻る。一方、ステップＳ２４６において過剰な分配がないと判定された場合には、モデル統合の必要はないので処理を終了する。

こうしてＰＣＡ次元上で解が得られたならば、ＰＣＡの次元圧縮を解除することで解を実次元上のスペクトルに展開する（ステップＳ２５）。そして、実次元において再度、図１１に示したフローチャートと同様の図１２に示すようなフローチャートに従ったＥＭステップによるピーク分離を実行する（ステップＳ２６）。実次元ではピークモデルの追加は行われず、単純なＥＭステップの繰り返しとピークモデルの統合が行われるだけである。このため、実次元でのＥＭステップの実行にはそれほど時間を掛けずに、ピーク分離の精度を向上させることができる。

もちろん、上記実施例のようにＰＣＡ次元上の処理と実次元上の処理とを組み合わせるのではなく、ＰＣＡ次元上の処理のみでピーク分離を行ってもよいし、逆に、実次元上の処理のみでピーク分離を行ってもよい。前者は処理時間を短縮するのに有効であり、後者はＰＣＡ次元圧縮・解除を実施しないことによる実装の簡便さやピーク分離の精度の点で有利である。

続いて、図２を参照しつつ説明したクロマトグラムデータ処理方法を実施するクロマトグラムデータ処理装置を含むＬＣ分析装置の一実施例について説明する。図１はこのＬＣ分析装置の概略構成図である。このＬＣ分析装置の構成と概略動作を説明する。

このＬＣ分析装置は、ＬＣ部１とデータ処理部２とを含む。ＬＣ部１において、送液ポンプ１２は移動相容器１１から移動相を吸引して一定流量でインジェクタ１３へと送給する。インジェクタ１３は所定のタイミングで試料液を移動相中に注入する。注入された試料液は移動相に押されてカラム１４に導入され、カラム１４を通過する間に試料液中の各成分が時間方向に分離されてカラム１４出口から溶出する。カラム１４出口に配置されたＰＤＡ検出器１５は、時間経過に伴って順次導入される溶出液に対して所定波長範囲の吸光度分布を繰り返し測定する。この測定によって得られた信号はアナログデジタル（Ａ／Ｄ）変換器１６によりデジタル信号に変換され、３次元クロマトグラムデータとしてデータ処理部２へと入力される。

データ処理部２は、３次元クロマトグラムデータを格納するクロマトグラムデータ記憶部２１、各種の変形ガウス分布モデル波形などを収録したモデル関数データベース２２、３次元クロマトグラムデータに対して上述したようなＧＭＭのＥＭアルゴリズムを基本としたピーク分離処理を実行するピーク分離処理部２３、成分毎に分離されたクロマトグラムピークに基づいて定量計算を行う定量演算部２４、などの機能ブロックを備える。また、データ処理部２には、例えばデータ処理に必要な各種のパラメータを分析者が指定するための入力部３と、ピーク分離結果や定量演算結果などを表示するための表示部４とが接続されている。

本実施例のＬＣ分析装置では、一つの試料に対してＬＣ部１で収集された３次元クロマトグラムデータが一つのデータファイルとしてクロマトグラムデータ記憶部２１に一旦格納され、分析者が入力部３において処理対象のデータファイルを指定したうえでピーク分離処理等の実行開始を指示すると、ピーク分離処理部２３はモデル関数データベース２２を用いつつ、上述した処理を行うことで成分毎に分離したクロマトグラム波形とスペクトル波形とをそれぞれ推定する。定量演算部２４は推定されたクロマトグラム波形上のピークの面積を計算し、その面積値に基づいて定量値を算出する。
本実施例のＬＣ分析装置では、目的成分と他の成分とがＬＣ部１において十分に分離されない場合であっても、データ処理部２において目的成分のクロマトグラムピークの波形が高い精度で求まるので、該目的成分の濃度を正確に算出することができる。

なお、上記実施例のクロマトグラムデータ処理方法やＬＣ分析装置は本発明の一例であり、本発明の趣旨の範囲で適宜変形、追加、修正を加えても本願特許請求の範囲に包含されることは明らかである。

例えば、本発明において処理対象である３次元クロマトグラムデータを取得するクロマトグラフの検出器は、上述したようなＰＤＡ検出器等のマルチチャンネル型検出器でなくてもよく、高速の波長走査が可能である紫外可視分光光度計、赤外分光光度計、近赤外分光光度計、蛍光分光光度計、などであってもよい。また、質量分析計を検出器とした液体クロマトグラフ質量分析装置やガスクロマトグラフ質量分析装置でもよい。

また、カラムを通した分析ではなく、フローインジェクション分析（ＦＩＡ＝Flow Injection Analysis）法により導入された試料をＰＤＡ検出器等で検出する場合に得られるデータも、時間、波長、及び吸光度という三つのディメンジョンを持つ３次元データとなり、液体クロマトグラフにより収集される３次元クロマトグラムデータと実質的に同じである。したがって、こうしたデータを処理する装置にも本発明を適用できることは明らかである。

１…ＬＣ部
１１…移動相容器
１２…送液ポンプ
１３…インジェクタ
１４…カラム
１５…ＰＤＡ検出器
１６…アナログデジタル変換器
２…データ処理部
２１…クロマトグラムデータ記憶部
２２…モデル関数データベース
２３…ピーク分離処理部
２４…定量演算部
３…入力部
４…表示部

Claims

測定対象である試料に対して収集された、時間、信号強度、及び第３のディメンジョンを有する３次元クロマトグラムデータを処理するクロマトグラムデータ処理方法であり、ピークモデル関数の当てはめを２段階のステップに分けて行うことにより、時間と信号強度とをそれぞれ軸とするクロマトグラム上で重なっている、前記試料に含まれる複数の成分に由来するピークを分離するクロマトグラムデータ処理方法において、
a)時間と信号強度とをそれぞれ軸とするクロマトグラムの波形形状及び第３のディメンジョンと信号強度とをそれぞれ軸とするスペクトルの波形形状についての、予め与えられた推定結果又は後記当てはめ実行ステップによる推定結果のいずれかである波形形状モデルに基づいて、与えられた３次元クロマトグラムデータを１又は複数の成分に分配し、成分毎の３次元クロマトグラムデータを求めるデータ分配ステップと、
b)前記データ分配ステップにより得られた成分毎の３次元クロマトグラムデータから求まるクロマトグラム及びスペクトルに対し、クロマトグラム波形形状及びスペクトル波形形状の当てはめをそれぞれ行うことで、各成分に対応する波形形状モデルのパラメータを修正する当てはめ実行ステップであって、クロマトグラム波形形状が正しいとの仮定の下にスペクトル波形を最小二乗法により求める第１ステップと、スペクトル波形形状が正しいとの仮定の下にクロマトグラム波形を最小二乗法により求める第２ステップとを繰り返し実行することで当てはめの尤もらしさを高める当てはめ実行ステップと、
c)前記データ分配ステップ及び前記当てはめ実行ステップを規定回数だけ又は解が収束したとみなせるまで繰り返し実行したあと、その時点で得られる各成分に対応するスペクトルと直交するスペクトル成分を抽出する又は強調するように、与えられた３次元クロマトグラムデータをフィルタリング処理し、そのフィルタリング後のデータに現れるピーク状波形の高さに基づいて、さらに別の成分が前記試料に含まれているか否かを判定する含有成分判定ステップと、
を有することを特徴とするクロマトグラムデータ処理方法。
請求項１に記載のクロマトグラムデータ処理方法であって、
前記含有成分判定ステップは、別の成分が前記試料に含まれていると判定されたとき、前記フィルタリング後のデータに現れるピーク状波形を、追加すべき該別の成分のクロマトグラム波形形状の初期値として前記データ分配ステップによる処理に供することを特徴とするクロマトグラムデータ処理方法。
請求項１又は２に記載のクロマトグラムデータ処理方法であって、
前記データ分配ステップでは、各クロマトグラム波形及び各スペクトル波形に基づいて計算される信号強度の理論値を与えられた３次元クロマトグラムデータから差し引いて求めた残渣信号を各測定点の理論値の強度比に応じて分配する比例分配と、該残渣信号を各成分に等しく分配する均等分配とを、ピーク分離処理のためのステップの繰り返し回数又は解の収束度合いに応じて切り替えることを特徴とするクロマトグラムデータ処理方法。
請求項１〜３のいずれかに記載のクロマトグラムデータ処理方法であって、
前記データ分配ステップでは、各クロマトグラム波形及び各スペクトル波形に基づいて計算される信号強度の理論値を与えられた３次元クロマトグラムデータから差し引いて求めた残渣信号を、各成分に対するスペクトルの線形和による最小二乗近似に応じて分配することを特徴とするクロマトグラムデータ処理方法。
請求項４に記載のクロマトグラムデータ処理方法であって、
最小二乗近似を行う際に、各成分のスペクトルに対して与えられる重みを、残渣信号の大きさ若しくは各成分における信号強度の理論値の大きさ、又はその両方を用いて制限することを特徴とするクロマトグラムデータ処理方法。
請求項１〜５のいずれかに記載のクロマトグラムデータ処理方法であって、
各成分のクロマトグラム波形を任意の比率で加算したクロマトグラム波形を求め、該クロマトグラム波形上の強度と信号強度の理論値との差異に基づいて、ＥＭアルゴリズムによる解の安定性を推定することを特徴とするクロマトグラムデータ処理方法。
請求項１〜６のいずれかに記載のクロマトグラムデータ処理方法であって、
前記当てはめ実行ステップでは、ピーク幅やピーク高さを正規化したクロマトグラム波形が収録されたデータベースを利用し、該データベースから最適なクロマトグラム波形を選択して用いることを特徴とするクロマトグラムデータ処理方法。
請求項１〜７のいずれかに記載のクロマトグラムデータ処理方法であって、
前記フィルタリング後の残渣信号にピーク状波形があった場合に、該残渣信号を行列として主成分分析して得られる固有値の各要素の大きさの比率に基づいて、前記ピーク状波形が検出器の直線性劣化に起因するものであるか否かを判定し、直線性劣化に起因するものであると推定されるときには追加すべき成分はないと結論付けることを特徴とするクロマトグラムデータ処理方法。
請求項１〜８のいずれかに記載のクロマトグラムデータ処理方法を実行するための装置であって、測定対象である試料に対して収集された、時間、信号強度、及び第３のディメンジョンを有する３次元クロマトグラムデータを処理するクロマトグラムデータ処理装置であり、ピークモデル関数の当てはめを２段階のステップに分けて行うことにより、時間と信号強度とをそれぞれ軸とするクロマトグラム上で重なっている、前記試料に含まれる複数の成分に由来するピークを分離するクロマトグラムデータ処理装置において、
a)時間と信号強度とをそれぞれ軸とするクロマトグラムの波形形状及び第３のディメンジョンと信号強度とをそれぞれ軸とするスペクトルの波形形状についての、予め与えられた推定結果又は後記当てはめ実行部による推定結果のいずれかである波形形状モデルに基づいて、与えられた３次元クロマトグラムデータを１又は複数の成分に分配し、成分毎の３次元クロマトグラムデータを求めるデータ分配部と、
b)前記データ分配部により得られた成分毎の３次元クロマトグラムデータから求まるクロマトグラム及びスペクトルに対し、クロマトグラム波形形状及びスペクトル波形形状の当てはめをそれぞれ行うことで、各成分に対応する波形形状モデルのパラメータを修正する当てはめ実行部であって、クロマトグラム波形形状が正しいとの仮定の下にスペクトル波形を最小二乗法により求める第１ステップと、スペクトル波形形状が正しいとの仮定の下にクロマトグラム波形を最小二乗法により求める第２ステップとを繰り返し実行することで当てはめの尤もらしさを高める当てはめ実行部と、
c)前記データ分配部による処理及び前記当てはめ実行部による処理を規定回数だけ又は解が収束したとみなせるまで繰り返し実行したあと、その時点で得られる各成分に対応するスペクトルと直交するスペクトル成分を抽出する又は強調するように、与えられた３次元クロマトグラムデータをフィルタリング処理し、そのフィルタリング後のデータに現れるピーク状波形の高さに基づいて、さらに別の成分が前記試料に含まれているか否かを判定する含有成分判定部と、
を備えることを特徴とするクロマトグラムデータ処理装置。