JP5333329B2 - Chromatogram data processing method and apparatus - Google Patents

Chromatogram data processing method and apparatus Download PDF

Info

Publication number
JP5333329B2
JP5333329B2 JP2010091908A JP2010091908A JP5333329B2 JP 5333329 B2 JP5333329 B2 JP 5333329B2 JP 2010091908 A JP2010091908 A JP 2010091908A JP 2010091908 A JP2010091908 A JP 2010091908A JP 5333329 B2 JP5333329 B2 JP 5333329B2
Authority
JP
Japan
Prior art keywords
chromatogram
time
target
peak
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010091908A
Other languages
Japanese (ja)
Other versions
JP2011220907A (en
Inventor
陽 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2010091908A priority Critical patent/JP5333329B2/en
Publication of JP2011220907A publication Critical patent/JP2011220907A/en
Application granted granted Critical
Publication of JP5333329B2 publication Critical patent/JP5333329B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Description

本発明は、ガスクロマトグラフ(GC)、液体クロマトグラフ(LC)等のクロマトグラフ分析により得られたクロマトグラムデータを処理するクロマトグラムデータ処理方法及び装置に関し、さらに詳しくは、クロマトグラムに出現するピークの保持時間を補正するためのデータ処理方法及び装置に関する。   The present invention relates to a chromatogram data processing method and apparatus for processing chromatogram data obtained by chromatographic analysis such as gas chromatograph (GC) and liquid chromatograph (LC), and more specifically, a peak appearing in a chromatogram. The present invention relates to a data processing method and apparatus for correcting the holding time of the data.

GC分析においては、同一装置で且つ同一条件の下で分析を実施しても、キャリアガス流量の時間的変動やカラムの劣化等の様々な要因によって、同一成分に対する保持時間がずれてしまう場合がある。そのため、複数のクロマトグラムを比較するためには、その比較に先立って同一成分に対する保持時間がほぼ同一に揃うように時間軸を補正する作業が必要である。保持時間のずれが完全に線形であれば時間軸補正は容易であるが、一般的に保持時間のずれは少なからず非線形性を有している。こうした非線形の保持時間ずれに対応した時間軸補正手法の一つとして、従来、動的計画法(Dynamic Programming、以下「DP」と略す)に基づくアルゴリズムが提案されている(非特許文献1、特許文献1参照)。   In the GC analysis, even if the analysis is performed with the same apparatus and under the same conditions, the retention time for the same component may be shifted due to various factors such as time variation of the carrier gas flow rate and column deterioration. is there. Therefore, in order to compare a plurality of chromatograms, it is necessary to correct the time axis so that the retention times for the same component are substantially the same prior to the comparison. If the hold time shift is completely linear, the time axis correction is easy, but generally the hold time shift is not small and has non-linearity. An algorithm based on dynamic programming (hereinafter referred to as “DP”) has been proposed as one of the time axis correction methods corresponding to such nonlinear holding time deviation (Non-Patent Document 1, Patent). Reference 1).

従来一般に用いられているDPアルゴリズムは、基準となる参照信号(参照クロマトグラム信号)と時間軸が非線形に歪められた対象信号(対象クロマトグラム信号)とを対応付け、その時間の歪み具合と対応点の強度の一致具合とをコスト関数とし、計算されたコストを最小にするような参照信号と対象信号との対応関係を探索する、という手法である。この対応関係が求まれば、それを利用して対象信号の時間軸を非線形に伸縮させ、保持時間ずれを補正することができる。   The DP algorithm generally used in the past associates a reference signal (reference chromatogram signal) serving as a reference with a target signal (target chromatogram signal) whose time axis is distorted nonlinearly, and corresponds to the degree of distortion of the time. This is a method of searching for a correspondence relationship between the reference signal and the target signal that minimizes the calculated cost using the point intensity matching degree as a cost function. If this correspondence is obtained, the time axis of the target signal can be nonlinearly expanded / contracted by using this correspondence to correct the holding time shift.

ここで説明のために、参照信号をAとし、その参照信号Aの各時間におけるサンプル点をA(n)で表すこととする(但し、nは正の整数)。同様に、対象信号をBとし、その対象信号Bの各時間におけるサンプル点をB(n)で表すこととする。一般的なDPにおける最適な(最もマッチングの良好な)対応関係の探索方法は以下の通りである(図8参照)。
[1]参照信号Aのサンプル点A(1)に対応する対象信号Bのサンプル点は、常識的な(種々の変動の最大値を考慮した)時間変動の範囲を考えて、例えば「対応点なし」から対象信号B(1)〜B(3)に対応する可能性がある。
[2]参照信号Aのサンプル点A(1)に対応する対象信号Bのサンプル点が上記範囲内のいずれになるかによって、参照信号Aの次のサンプル点A(2)が対応可能な対象信号Bのサンプル点群はそれぞれ異なる。例えば、参照信号Aのサンプル点A(1)に対応する対象信号Bのサンプル点がB(1)であれば、次のサンプル点A(2)が対応可能な対象信号Bのサンプル点群は「対応点なし」又は対象信号B(2)〜B(4)となるし、参照信号Aのサンプル点A(1)に対応する対象信号Bのサンプル点がB(2)であれば、次のサンプル点A(2)が対応可能な対象信号Bのサンプル点群は「対応点なし」又は対象信号B(3)〜B(5)となる。
したがって、図8に示すように、サンプル点A(n)のnが増加するに伴い、つまり時間経過に伴い、樹形図状に対応可能なサンプル点が増えることになる。
Here, for the sake of explanation, it is assumed that the reference signal is A, and the sample point at each time of the reference signal A is represented by A (n) (where n is a positive integer). Similarly, the target signal is B, and the sample point at each time of the target signal B is represented by B (n). The search method for the optimal (best matching) correspondence in general DP is as follows (see FIG. 8).
[1] The sampling point of the target signal B corresponding to the sampling point A (1) of the reference signal A is, for example, “corresponding point” in consideration of a time-variable range (considering the maximum value of various variations). “None” may correspond to the target signals B (1) to B (3).
[2] Target to which the next sample point A (2) of the reference signal A can correspond depending on which of the above-mentioned range the sample point of the target signal B corresponding to the sample point A (1) of the reference signal A Each sample point group of the signal B is different. For example, if the sample point of the target signal B corresponding to the sample point A (1) of the reference signal A is B (1), the sample point group of the target signal B to which the next sample point A (2) can correspond is If there is no corresponding point or the target signal B (2) to B (4) and the sample point of the target signal B corresponding to the sample point A (1) of the reference signal A is B (2), then The sample point group of the target signal B to which the sample point A (2) can correspond is “no corresponding point” or the target signals B (3) to B (5).
Therefore, as shown in FIG. 8, as the number n of sample points A (n) increases, that is, as time elapses, the number of sample points that can correspond to the tree diagram increases.

以上のように最適な対応関係を探索する際に常識的に対応可能な候補がそれぞれのサンプル点でm個存在すると仮定すると(図8の例の場合にはm=4)、クロマトグラムが全部でn個のサンプル点のデータからなるものであるならば、ほぼmのn乗の数の経路(つまりはクロマトグラム全体の対応関係の候補)が導出されることになる。したがって、参照信号Aと対象信号Bとの対応関係の候補数のオーダはO(m)であり、そのそれぞれについてコストを計算して最小コストの候補を選択する必要がある。 Assuming that there are m candidates that can be dealt with in common sense when searching for the optimum correspondence as described above (m = 4 in the example of FIG. 8), all the chromatograms are obtained. If the data consists of data of n sample points, paths of approximately m to the power of n (that is, candidates for correspondences of the entire chromatogram) are derived. Therefore, the order of the number of candidates for the correspondence relationship between the reference signal A and the target signal B is O (m n ), and it is necessary to calculate a cost for each of them and select a candidate with the minimum cost.

しかしながら、計算に使用するコンピュータの性能や計算時間の制約から処理可能な計算量には制約があるので、上記のような膨大な数の候補の全てを探索しコスト計算を行うのは現実的ではない。そこで、通常、各探索段階において上位x個の候補のみを残し、それ以外のデータを削除することで最終的な候補数をx個に抑えるような手法が採られる。このような手法は一般にビーム幅xのビーム制限と呼ばれる。ビーム幅xを狭めるほど処理時間は短くて済むものの、ビーム幅xを必要以上に狭くすると、探索の前半部のみでのマッチングがよく後半部ではマッチングが乏しい局所解に陥る可能性が高くなり、一般にノイズ等に弱くなる。逆に、こうしたノイズに対する耐性(ロバスト性)を持たせるには、膨大な演算処理の時間を許容する必要がある。   However, because there are restrictions on the amount of computation that can be processed due to the performance of the computer used for computation and the computation time, it is not realistic to search for all of the enormous number of candidates as described above and calculate the cost. Absent. Therefore, generally, a technique is adopted in which only the top x candidates are left in each search stage and the final number of candidates is reduced to x by deleting other data. Such a method is generally called beam limitation of the beam width x. The narrower the beam width x, the shorter the processing time is. However, if the beam width x is narrowed more than necessary, the matching in the first half of the search is good and the possibility of falling into a local solution with poor matching in the second half increases. Generally weakened by noise. On the other hand, in order to have resistance against such noise (robustness), it is necessary to allow a huge amount of time for arithmetic processing.

即ち、非特許文献1、特許文献1に記載のような一般的なDPアルゴリズムをクロマトグラムの時間軸補正に適用する場合、含有成分が多くクロマトグラムに出現するピーク数が多い、取得される信号のS/Nが悪く偽のピークも多い、或いは、時間変動が極端に大きい、といった悪条件の下では、現実的な演算処理時間では対象信号を参照信号に適切にマッチングさせることができず、誤った時間軸補正を行ってしまうおそれがある。特に、GC分析のカラム交換に伴う時間変動が大きい場合やガソリン・香料等、膨大な数の成分を含む試料を分析する場合、正確な時間軸補正が行えない可能性がかなり高くなる。   That is, when a general DP algorithm as described in Non-Patent Document 1 and Patent Document 1 is applied to time axis correction of a chromatogram, an acquired signal with many contained components and a large number of peaks appearing in the chromatogram. Under bad conditions such as poor S / N and many false peaks or extremely large time fluctuations, the target signal cannot be properly matched with the reference signal in a realistic calculation processing time. There is a risk of incorrect time base correction. In particular, when the time variation accompanying the column exchange of GC analysis is large, or when analyzing a sample containing an enormous number of components such as gasoline and fragrance, the possibility that accurate time axis correction cannot be performed becomes considerably high.

国際公開第2004/090526号パンフレットInternational Publication No. 2004/090526 Pamphlet 特開平5−181498号公報JP-A-5-181498

プラブドバ(V.Pravdova)ほか2名、「ア・コンパリソン・オブ・トゥー・アルゴリズムズ・フォー・ワーピング・オブ・アナリティカル・シグナルズ(A comparison on two algorithms for warping of analytical signals)」、アナリティカル・キミカ・アクタ(Analytical Chimica Acta)、456、2002年、p.77−92Pravdova and two others, "A comparison on two algorithms for warping of analytical signals", Analytical Kimika -Acta (Analytical Chimica Acta), 456, 2002, p. 77-92 宮崎洋光ほか2名、「粗密DPに基づく画像の弾性マッチングアルゴリズム」、 画像の認識・理解シンポジウム (MIRU2004)予稿集、2004年7月Hiromitsu Miyazaki and two others, "Elastic matching algorithm for images based on dense DP", Image Recognition and Understanding Symposium (MIRU2004) Proceedings, July 2004

本発明は上記課題を解決するためになされたものであり、その主たる目的は、含有成分数(ピーク数)が多い、ノイズが多い、時間変動が大きい、といった悪条件の下でも、妥当な処理時間内でクロマトグラムの時間軸を高い精度で以て補正することができるクロマトグラムデータ処理方法及び装置を提供することにある。なお、ここで言う「クロマトグラム」は、クロマトグラフ質量分析装置で得られる全イオン電流クロマトグラムや抽出イオンクロマトグラム(マスクロマトグラム)を含むものとする。   The present invention has been made in order to solve the above-mentioned problems, and its main purpose is to perform appropriate processing even under adverse conditions such as a large number of contained components (peak number), a lot of noise, and a large time fluctuation. An object of the present invention is to provide a chromatogram data processing method and apparatus capable of correcting a time axis of a chromatogram with high accuracy within a time. The “chromatogram” mentioned here includes a total ion current chromatogram and an extracted ion chromatogram (mass chromatogram) obtained by a chromatograph mass spectrometer.

DPにおける高速化の代表的な手法として、DPのアルゴリズム処理を大まかな候補探索と細かな候補探索との二段階に分けることにより、候補数O(m)におけるnとmとを共に減らすようにした粗密DPが知られている。例えば特許文献2には、音声認識に粗密DPを利用した手法が開示されている。また非特許文献2には、変形を伴う画像パターン認識に粗密DPを利用することが提案されている。一般に、音声信号や画像信号の場合、或る位置における信号値とそれに時間的又は空間的に近接する位置における信号値との相関が高いという特性がある。そのため、粗密DPを適用することは比較的容易である。これに対し、クロマトグラム信号の場合、或るピークとそれに時間的に近い他のピークとの相関性は殆どなく、上記のような音声用や画像用の粗密DPをそのまま利用することはできない。そこで、本願発明者はクロマトグラムの時間軸補正に粗密DPの手法を導入しつつ、クロマトグラム信号の特性を利用してDPの計算量をできるだけ低減するような処理を加えることにより、本願発明に想到するに至った。 As a typical method for speeding up DP, the algorithm processing of DP is divided into two stages, a rough candidate search and a fine candidate search, so that both n and m in the number of candidates O (m n ) are reduced. Dense and dense DP is known. For example, Patent Document 2 discloses a technique using coarse / dense DP for speech recognition. Further, Non-Patent Document 2 proposes using coarse / dense DP for image pattern recognition involving deformation. In general, an audio signal or an image signal has a characteristic that a signal value at a certain position is highly correlated with a signal value at a position close in time or space. Therefore, it is relatively easy to apply the dense DP. On the other hand, in the case of a chromatogram signal, there is almost no correlation between a certain peak and other peaks that are close in time to it, and the above-described dense DP for voice or image cannot be used as it is. Therefore, the inventor of the present application introduced the method of coarse / dense DP to the time axis correction of the chromatogram, and applied the processing to reduce the calculation amount of DP as much as possible by using the characteristics of the chromatogram signal, to the present invention. I came up with an idea.

即ち、上記課題を解決するために成された第1発明は、試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフ装置により得られたクロマトグラムデータについて、基準となる参照クロマトグラムの時間軸に対し対象クロマトグラムの時間軸を合わせるように該時間軸を補正するクロマトグラムデータ処理方法であって、
a)参照クロマトグラム上及び対象クロマトグラム上で検出されたピークを利用して、対象クロマトグラムから線形性を有する時間変動を除去する線形補正ステップと、
b)前記線形補正ステップによる線形補正後の対象クロマトグラムと前記参照クロマトグラムでそれぞれ検出されたピークの強度に基づいて、その参照クロマトグラム及び対象クロマトグラムのそれぞれについてピークを選別し、その選別されたピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して粗段階での参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する粗探索ステップと、
c)前記粗探索ステップで抽出された粗段階での対応関係の候補について、該ステップで排除されたピークを加えた上で、ピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して密段階での参照クロマトグラムと対象クロマトグラムとの対応関係を探索する密探索ステップと、
d)前記密探索ステップで抽出された参照クロマトグラムと対象クロマトグラムとの対応関係に基づいて、対象クロマトグラムの時間軸を補正する補正処理ステップと、
を有することを特徴としている。
That is, the first invention made to solve the above problems is obtained by a chromatographic apparatus including a separation unit that separates various components contained in a sample in a time direction and a detector that detects the sample from which the components are separated. A chromatogram data processing method for correcting the time axis so that the time axis of the target chromatogram is aligned with the time axis of the reference chromatogram as a reference for the obtained chromatogram data,
a) using a peak detected on the reference chromatogram and the target chromatogram, and a linear correction step for removing a time variation having linearity from the target chromatogram;
b) Based on the intensity of the peak detected in the target chromatogram after the linear correction in the linear correction step and the reference chromatogram, the peak is selected for each of the reference chromatogram and the target chromatogram, A coarse search step for searching for candidates for the correspondence relationship between the reference chromatogram and the target chromatogram in the coarse stage by performing matching by a dynamic programming algorithm for the retention time of the peak,
c) For the candidate for the correspondence relationship in the coarse stage extracted in the coarse search step, after adding the peak excluded in the step, matching is performed by the dynamic programming algorithm for the peak retention time. A dense search step for searching for a correspondence relationship between the reference chromatogram and the target chromatogram in the dense stage;
d) a correction processing step for correcting the time axis of the target chromatogram based on the correspondence relationship between the reference chromatogram extracted in the dense search step and the target chromatogram;
It is characterized by having.

また第2発明は上記第1発明に係るクロマトグラムデータ処理方法を実施するための装置であって、試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフ装置により得られたクロマトグラムデータについて、基準となる参照クロマトグラムの時間軸に対し対象クロマトグラムの時間軸を合わせるように該時間軸を補正するクロマトグラムデータ処理装置において、
a)参照クロマトグラム上及び対象クロマトグラム上で検出されたピークを利用して、対象クロマトグラムから線形性を有する時間変動を除去する線形補正手段と、
b)前記線形補正手段による線形補正後の対象クロマトグラムと前記参照クロマトグラムでそれぞれ検出されたピークの強度に基づいて、その参照クロマトグラム及び対象クロマトグラムのそれぞれについてピークを選別し、その選別されたピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して粗段階での参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する粗探索手段と、
c)前記粗探索手段で抽出された粗段階での対応関係の候補について、該手段で排除されたピークを加えた上で、ピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して密段階での参照クロマトグラムと対象クロマトグラムとの対応関係を探索する密探索手段と、
d)前記密探索手段で抽出された参照クロマトグラムと対象クロマトグラムとの対応関係に基づいて、対象クロマトグラムの時間軸を補正する補正処理手段と、
を備えることを特徴としている。
The second invention is an apparatus for carrying out the chromatogram data processing method according to the first invention, and a detection part for separating the components separated in the time direction and a detection for detecting the sample from which the components are separated. In the chromatogram data processing apparatus for correcting the time axis of the chromatogram data obtained by the chromatograph apparatus including the vessel so as to match the time axis of the target chromatogram with the time axis of the reference chromatogram serving as a reference,
a) linear correction means for removing time fluctuation having linearity from the target chromatogram using the peaks detected on the reference chromatogram and the target chromatogram;
b) Based on the intensity of the peak detected in the target chromatogram after the linear correction by the linear correction means and the reference chromatogram, the peak is selected for each of the reference chromatogram and the target chromatogram, A coarse search means for searching for a candidate for a correspondence relationship between a reference chromatogram and a target chromatogram in a rough stage by performing matching by a dynamic programming algorithm for holding the peak retention time;
c) For the candidates for the correspondence relationship in the coarse stage extracted by the coarse search means, after adding the peaks excluded by the means, matching is performed by a dynamic programming algorithm for the peak retention time. A dense search means for searching for a correspondence relationship between the reference chromatogram and the target chromatogram in the dense stage,
d) correction processing means for correcting the time axis of the target chromatogram based on the correspondence between the reference chromatogram extracted by the dense search means and the target chromatogram;
It is characterized by having.

クロマトグラムに生じる保持時間ずれの最も大きな要因の一つはカラム劣化であるが、この要因による保持時間ずれは多少の揺らぎはあるもののほぼ時間的に線形のずれである。即ち、対象クロマトグラムの時間軸が参照クロマトグラムの時間軸に対し全体的にp倍に伸び(又は1/pに縮小し)、さらに全体にqだけシフトしている、といったずれである。本発明に係るクロマトグラムデータ処理方法及び装置では、粗密DPを実行する前に、予め線形補正ステップにおける線形補正処理により、上述した線形の時間ずれを低減しておく。これにより、引き続いて実施される粗密DPでは非線形の保持時間ずれのみを対象とすればよく、限られたビーム幅であっても、つまり探索空間を狭くしても十分なロバスト性でマッチングさせることが可能となる。   One of the biggest causes of the retention time shift that occurs in the chromatogram is column deterioration. The retention time shift due to this factor is a linear shift in time with some fluctuations. That is, the time axis of the target chromatogram is extended p times (or reduced to 1 / p) as a whole with respect to the time axis of the reference chromatogram, and further shifted by q overall. In the chromatogram data processing method and apparatus according to the present invention, the linear time lag described above is reduced in advance by the linear correction process in the linear correction step before executing the coarse / dense DP. As a result, in the subsequent dense / dense DP, it is only necessary to target non-linear holding time shifts, and even if the beam width is limited, that is, the search space is narrowed, matching is performed with sufficient robustness. Is possible.

前述した一般的な粗密DPでは、まず計測データを再サンプリングすることにより低時間分解能のデータを生成し、これを入力データとしてデータ点数(n)を減らした粗段階DPを行う。その後、低時間分解能の下で得られた最適な対応関係(マッチング)に著しく反しないという制限をかけることでmを減らした上で、元の(再サンプリングする前の)時間分解能で密段階のDP処理を行う。しかしながら、クロマトグラム信号の場合、単純な再サンプリングでは元の信号が持つ情報自体が失われることになる。クロマトグラム信号では、情報として重要であるのはピークのピークトップの位置(時間)であるから、検出されたピークの位置(時間)をDPの入力データとする。   In the above-described general coarse / dense DP, first, measurement data is resampled to generate data with low time resolution, and this is used as input data to perform coarse-stage DP with a reduced number of data points (n). After that, m is reduced by applying the restriction that the optimum correspondence (matching) obtained under the low time resolution is not significantly violated, and then the original time resolution (before re-sampling) Perform DP processing. However, in the case of a chromatogram signal, the information itself of the original signal is lost by simple resampling. In the chromatogram signal, since the position (time) of the peak top of the peak is important as information, the detected peak position (time) is used as DP input data.

ただし、含有成分の数が多い場合にはピークの数も多くなるし、ノイズ由来のピークもクロマトグラムに出現する。そこで、粗探索ステップでは、特に補正に有用である可能性が高いピークのみを例えば強度順に選別して粗段階のDPの入力データとすることにより、処理対象のデータ数を減らすと同時にノイズの影響を軽減する。なお、このピーク抽出に用いられるピークの強度とは、ピークの高さ、ピーク面積、又はその両方を利用することができる。上記粗探索ステップにより、参照クロマトグラム上の抽出された各ピークと対象クロマトグラム上の抽出された各ピークとの対応関係の候補が探索される。即ち、参照クロマトグラム上の抽出されたピーク毎に、対応付けられる対象クロマトグラム上のピークの候補が1乃至複数挙げられる。   However, when the number of contained components is large, the number of peaks also increases, and noise-derived peaks also appear in the chromatogram. Therefore, in the coarse search step, only the peaks that are likely to be particularly useful for correction are selected, for example, in order of intensity, and used as input data for the coarse DP, thereby reducing the number of data to be processed and simultaneously affecting the influence of noise. Reduce. Note that the peak height, peak area, or both can be used as the peak intensity used for peak extraction. Through the rough search step, candidates for correspondence between each extracted peak on the reference chromatogram and each peak extracted on the target chromatogram are searched. That is, for each extracted peak on the reference chromatogram, one or more peak candidates on the target chromatogram to be associated are listed.

次に、密探索ステップでは、強度が低いために先に除外されたピークを含め、粗探索ステップで求まった候補に基づいたマッチングを実行することにより対応関係の候補を絞る。例えば、粗探索ステップにおいて対応するピークの候補が少なくとも1つ挙げられた参照クロマトグラム上のピークについては、密探索ステップでその候補の中の1つが候補として挙げられれば、それが最適解であるとして他の候補を破棄する。一方、粗探索ステップにおいて対応するピークの候補がない参照クロマトグラム上のピークについては、最も時間的に近い位置の候補を直線補間することで求めた仮の位置(時間)を利用して密探索のコスト計算を行えばよい。   Next, in the dense search step, matching candidates are narrowed down by executing matching based on the candidates obtained in the coarse search step, including peaks that have been previously excluded due to low intensity. For example, for a peak on the reference chromatogram in which at least one corresponding peak candidate is listed in the coarse search step, if one of the candidates is listed as a candidate in the dense search step, that is the optimal solution. Discard other candidates as On the other hand, for the peak on the reference chromatogram for which there is no corresponding peak candidate in the coarse search step, the fine search is performed using the temporary position (time) obtained by linear interpolation of the candidate at the closest position in time. Cost calculation.

以上のような粗密の2段階のDPにより、参照クロマトグラム上の各ピークと対象クロマトグラム上の各ピークとの最も確からしい対応関係を求めることができる。その後、補正処理ステップにおいて、上記対応関係に基づいて対象クロマトグラムの時間軸を補正する。これにより、ピークトップの位置のみならず、対象クロマトグラムの信号波形全体が参照クロマトグラムを基準として補正される。   The most probable correspondence between each peak on the reference chromatogram and each peak on the target chromatogram can be obtained by the two-stage DP of coarse and dense as described above. Thereafter, in the correction processing step, the time axis of the target chromatogram is corrected based on the correspondence relationship. Thereby, not only the position of the peak top but also the entire signal waveform of the target chromatogram is corrected based on the reference chromatogram.

第1発明に係るクロマトグラムデータ処理方法では、好ましくは、前記粗探索ステップの実行後で前記密探索ステップの実行前に、マッチング全体の傾向を評価基準として該評価基準に適合しないマッチング結果を除去するフィルタリングステップを有するようにするとよい。マッチング全体の傾向としては、全体的な変動量の統計値を用いればよく、例えば変動量の標準偏差を求め、この標準偏差を評価基準とすることができる。   In the chromatogram data processing method according to the first aspect of the present invention, preferably, after execution of the coarse search step and before execution of the fine search step, a matching result that does not match the evaluation criterion is removed using the tendency of the entire matching as an evaluation criterion. It is preferable to have a filtering step. As a tendency of the entire matching, a statistical value of the entire variation amount may be used. For example, a standard deviation of the variation amount is obtained, and this standard deviation can be used as an evaluation criterion.

これによれば、粗探索ステップにおいて挙げられたピークの対応付けの候補のうち、全体の傾向からみて妥当でないものを予め除去することができる。そのため、効果的に対応関係の候補数を削減し、計算量を減らすことができるとともに密段階のDPにおける探索の精度を高めることができる。   According to this, it is possible to remove in advance those candidates that are not appropriate in view of the overall tendency from among the candidates for peak correspondence cited in the rough search step. Therefore, the number of correspondence candidates can be effectively reduced, the amount of calculation can be reduced, and the search accuracy in the dense DP can be increased.

また第1発明に係るクロマトグラムデータ処理方法の一態様として、前記線形補正ステップは、時間的に近接する複数のピークの強度の相関及び時間の関係を利用して参照クロマトグラムと対象クロマトグラムとで対応する時間範囲を抽出し、その時間範囲の組み合わせを仮定して線形補正を行ったときのピークの一致の程度を調べ、最良の一致を示す時間範囲の組み合わせを選ぶことで線形補正のための係数を求めるようにすることができる。ここで、好ましくは、参照クロマトグラムと対象クロマトグラムとの先頭部分と末尾部分とでそれぞれ対応する時間範囲を抽出するとよい。   Moreover, as one aspect of the chromatogram data processing method according to the first aspect of the present invention, the linear correction step uses a correlation between the intensity of a plurality of peaks that are close in time and a time relationship to generate a reference chromatogram and a target chromatogram. For the linear correction by extracting the corresponding time range and checking the degree of matching of the peaks when performing linear correction assuming the combination of the time ranges and selecting the time range combination that shows the best match The coefficient can be obtained. Here, it is preferable to extract the time ranges corresponding to the first and last portions of the reference chromatogram and the target chromatogram, respectively.

また、前記線形補正ステップにおけるピークの一致の度合を示す尺度として、参照クロマトグラム上の各ピークについて、該参照クロマトグラム上の1本のピークと前記仮定の下で線形補正が行われた後の対象クロマトグラム上で前記参照クロマトグラム上のピークの強度に対し一定の強度比の範囲に収まり最も近傍に位置するピークとの時間差の絶対値の総和を用いるようにすることができる。これにより、比較的簡単な演算によって精度の高い線形補正を行うことができる。   In addition, as a measure indicating the degree of coincidence of peaks in the linear correction step, for each peak on the reference chromatogram, one peak on the reference chromatogram and after linear correction is performed under the above assumption. On the target chromatogram, the sum of absolute values of time differences from the peak located closest to the peak intensity on the reference chromatogram and within the constant intensity ratio range can be used. Thereby, highly accurate linear correction can be performed by a comparatively simple calculation.

本発明に係るクロマトグラムデータ処理方法及び装置によれば、クロマトグラムの時間軸補正のために、クロマトグラム信号の特性や時間変動の発現態様に適合するように改良した粗密DPを用いると共に該粗密DPの前に線形性の時間ずれを除去する補正を行うようにしたので、対応関係の候補数を効率良く減らしながら、対象クロマトグラムを参照クロマトグラムに対して十分にマッチングさせることができる。その結果、例えば試料の含有成分が多くピーク本数が多い、信号のS/Nが悪い、時間変動が大きい、といった悪条件の下でも、実用的に十分に短い時間内で、精度の高い時間軸補正を行うことができる。それにより、例えば複数のクロマトグラムの比較を精度良く行うことが可能となる。   According to the chromatogram data processing method and apparatus of the present invention, a coarse / dense DP improved so as to be suitable for the characteristics of chromatogram signals and the mode of expression of time fluctuations is used for correcting the time axis of the chromatogram, and Since correction for removing the linear time lag is performed before DP, the target chromatogram can be sufficiently matched with the reference chromatogram while efficiently reducing the number of correspondence candidates. As a result, for example, a highly accurate time axis within a practically sufficiently short time even under adverse conditions such as a large amount of components contained in the sample, a large number of peaks, a poor signal S / N, and a large time fluctuation. Correction can be performed. Thereby, for example, a plurality of chromatograms can be compared with high accuracy.

また、データ処理が十分なロバスト性を持つので、粗密DPの際のコスト関数の重みやビーム幅等のデータ処理に必要なパラメータを試料の種類や分析条件などに応じて変更することなく、様々な試料から得られたデータを処理することができる。そのため、データ処理に際してのオペレータの負担が軽減され、処理のスループット向上も図れる。   In addition, since the data processing is sufficiently robust, various parameters can be used without changing parameters necessary for data processing such as weight of the cost function and beam width in the case of coarse / dense DP according to the type of sample and analysis conditions. Data obtained from various samples can be processed. Therefore, the burden on the operator during data processing is reduced, and the processing throughput can be improved.

本発明に係るクロマトグラムデータ処理装置を適用したGC装置の全体構成図。1 is an overall configuration diagram of a GC apparatus to which a chromatogram data processing apparatus according to the present invention is applied. 本発明に特徴的な時間軸補正方法の処理手順を示すフローチャート。The flowchart which shows the process sequence of the time-axis correction method characteristic of this invention. 図2中の簡易線形補正のフローチャート。The flowchart of the simple linear correction | amendment in FIG. 簡易線形補正の概念の説明図。Explanatory drawing of the concept of simple linear correction. 簡易線形補正の処理の説明図。Explanatory drawing of the process of simple linear correction. 図2中の粗段階DPのフローチャート。3 is a flowchart of a rough stage DP in FIG. 図2中の誤候補フィルタリング処理の概念の説明図。Explanatory drawing of the concept of the error candidate filtering process in FIG. 一般的なDPの説明図。Explanatory drawing of general DP. 本発明に特徴的な時間軸補正方法の効果を検証するためのシミュレーション結果を示す図。The figure which shows the simulation result for verifying the effect of the time-axis correction method characteristic of this invention.

本発明に係るクロマトグラムデータ処理方法を実施するクロマトグラムデータ処理装置を用いたガスクロマトグラフ(GC)装置の一実施例について、添付図面を参照して説明する。   An embodiment of a gas chromatograph (GC) apparatus using a chromatogram data processing apparatus for performing a chromatogram data processing method according to the present invention will be described with reference to the accompanying drawings.

図1は本実施例のGC装置の概略構成図である。図1において、試料気化室等を含む試料導入部1からカラム2には一定流量でキャリアガスが供給され、試料導入部1に試料が注入されると、該試料はキャリアガス流に乗ってカラム2に導入される。カラム2を通過する間に試料中の各種成分は時間方向に分離され、順にカラム2出口から溶出して検出器3に導入される。検出器3は例えば水素炎イオン化検出器(FID)や質量分析計などであり、導入された試料成分の量に応じた検出信号を時々刻々と出力する。この信号はA/D変換器4でデジタル値に変換されてデータ処理部5に入力される。データ処理部5はクロマトグラムデータ格納部51、時間軸補正演算処理部52、クロマトグラム作成・描画部53などを含み、作成されたクロマグラムは表示部6に表示される。   FIG. 1 is a schematic configuration diagram of a GC apparatus according to the present embodiment. In FIG. 1, when a carrier gas is supplied at a constant flow rate from a sample introduction unit 1 including a sample vaporization chamber to a column 2, and the sample is injected into the sample introduction unit 1, the sample rides on the carrier gas flow to the column. 2 is introduced. Various components in the sample are separated in the time direction while passing through the column 2, and are sequentially eluted from the outlet of the column 2 and introduced into the detector 3. The detector 3 is, for example, a flame ionization detector (FID), a mass spectrometer, or the like, and outputs a detection signal corresponding to the amount of the introduced sample component every moment. This signal is converted into a digital value by the A / D converter 4 and input to the data processing unit 5. The data processing unit 5 includes a chromatogram data storage unit 51, a time axis correction calculation processing unit 52, a chromatogram creation / drawing unit 53, and the created chromagram is displayed on the display unit 6.

なお、データ処理部5の実体はパーソナルコンピュータであり、該コンピュータに予めインストールされた専用のデータ処理ソフトウエアを動作させることにより、上記各部の機能を実現することができる。   The entity of the data processing unit 5 is a personal computer, and the functions of the above-described units can be realized by operating dedicated data processing software installed in advance in the computer.

このGC装置を用いて同一の分析条件の下で同一試料のGC分析を実行してクロマトグラムデータを取得した場合、理想的には同一試料成分に対する保持時間は常に同一である。しかしながら、実際には、カラム2の経時的な劣化による試料成分とカラム2内壁との相互作用の変化、試料導入部1よりカラム2に供給されるキャリアガス流速の時間的変動、カラム2が収納されたカラムオーブン(図示せず)の昇温速度の時間的変動など、様々な要因によって時間軸変動が生じ、同一試料成分に対する保持時間は一定とはならないことが多い。これは特に、複数のクロマトグラムを比較する際に問題となる。そこで、本実施例のGC装置では、GC分析により取得されたクロマトグラムの時間軸を次のような時間軸補正処理により補正するようにしている。   When GC analysis of the same sample is performed under the same analysis conditions using this GC apparatus and chromatogram data is acquired, ideally, the retention time for the same sample component is always the same. However, in practice, the change in the interaction between the sample component and the inner wall of the column 2 due to the deterioration of the column 2 over time, the temporal fluctuation of the flow rate of the carrier gas supplied from the sample introduction unit 1 to the column 2, The time axis fluctuates due to various factors such as the temporal fluctuation of the heating rate of the column oven (not shown), and the holding time for the same sample component is often not constant. This is particularly a problem when comparing multiple chromatograms. Therefore, in the GC apparatus of this embodiment, the time axis of the chromatogram acquired by GC analysis is corrected by the following time axis correction process.

図2は時間軸補正演算処理部52で実行される時間軸補正処理の概略的な手順を示すフローチャートである。ここでの時間軸補正処理とは、クロマトグラムデータ格納部51に格納されている参照クロマトグラムを基準として、GC分析して得られた対象クロマトグラムの時間軸を参照クロマトグラムの時間軸に合わせるように補正する処理である。基本的には、参照クロマトグラムと対象クロマトグラムとは同一種類の試料を分析して得られたものである。   FIG. 2 is a flowchart showing a schematic procedure of time axis correction processing executed by the time axis correction calculation processing unit 52. The time axis correction processing here is based on the reference chromatogram stored in the chromatogram data storage unit 51, and the time axis of the target chromatogram obtained by GC analysis is matched with the time axis of the reference chromatogram. It is the process which correct | amends as follows. Basically, the reference chromatogram and the target chromatogram are obtained by analyzing the same type of sample.

補正処理の手順としては、まず最初に、参照クロマトグラムと対象クロマトグラムとのそれぞれについてピーク検出を行い、ピークトップの位置(時間)と強度(高さ、面積又はその両方)をピーク情報として取得する(ステップS1)。ここで検出されたピークの時間情報が後述する粗密DPにおける入力データとなる。   As a procedure for correction processing, first, peak detection is performed for each of the reference chromatogram and the target chromatogram, and the peak top position (time) and intensity (height, area, or both) are acquired as peak information. (Step S1). The time information of the peak detected here becomes input data in the coarse / dense DP described later.

次に、対象クロマトグラムに含まれる線形の保持時間ずれを除去するために、簡易的な線形補正処理を実行する(ステップS2)。この簡易線形補正により、対象クロマトグラムにおいて、時間軸方向におけるp倍の伸縮、及び、時間qのシフトといった線形成分がほぼ除去され、非線形性を持つ保持時間ずれが残る。実際には、対象クロマトグラム上の各ピークに対し線形補正を実施し、それらピークの時間情報を修正すればよい。もちろん、粗密DPにおいて線形性の時間ずれを補正することも可能であるが、通常、線形性の時間ずれは非線形性の時間ずれに比べてかなり大きいので、線形性と非線形性の時間ずれが混在した(重畳された)状態であると、DPの際の探索空間がかなり大きくなる。これに対し、予め線形性の時間ずれを除去しておくことにより、探索空間を狭めることができる。   Next, in order to remove the linear holding time shift included in the target chromatogram, a simple linear correction process is executed (step S2). By this simple linear correction, linear components such as p-fold expansion and contraction in the time axis direction and time q shift are almost removed from the target chromatogram, and a retention time shift having nonlinearity remains. In practice, linear correction is performed on each peak on the target chromatogram, and the time information of those peaks may be corrected. Of course, it is possible to correct the linearity time lag in the coarse / dense DP, but usually the linearity time lag is much larger than the non-linear time lag, so both linearity and non-linear time lag are mixed. In the (superimposed) state, the search space for DP is considerably large. On the other hand, the search space can be narrowed by removing the linearity time shift in advance.

簡易線形補正の後、参照クロマトグラム及び対象クロマトグラムのそれぞれにおいて、各ピークの強度情報に基づいてピークを選別して所定個数に減らす。そして、この選別により元々のピーク数に比べて大幅に数を減らしたピークの時間情報(対象クロマトグラムについては線形補正後の時間情報)を入力データとし、粗段階のDPアルゴリズムに基づくマッチングを行うことにより、参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する(ステップS3)。   After the simple linear correction, in each of the reference chromatogram and the target chromatogram, the peaks are selected based on the intensity information of each peak and reduced to a predetermined number. Then, the peak time information (the time information after linear correction for the target chromatogram) whose number is greatly reduced compared to the original number of peaks by this selection is used as input data, and matching based on the coarse DP algorithm is performed. Thus, a candidate for the correspondence relationship between the reference chromatogram and the target chromatogram is searched (step S3).

粗段階DPによる候補探索を終了した後、次の密段階DPによる探索を行う前に、フィルタリング処理によって粗段階の探索で挙げられた候補の中で、全体の傾向からみた補正の妥当性を基準として、明らかに誤っていると推定されるマッチングを除去する(ステップS4)。誤りであるか否かの判断基準には、例えば時間ずれの全体的な変動量の統計値を用いることができる。このフィルタリング処理により、探索候補を減らすことができる。   After the candidate search by the coarse-stage DP is completed, before the next search by the fine-stage DP, the validity of the correction in terms of the overall tendency is selected among the candidates listed in the coarse-stage search by the filtering process. Then, matching that is estimated to be clearly wrong is removed (step S4). For example, a statistical value of the overall variation in time lag can be used as a criterion for determining whether or not there is an error. This filtering process can reduce search candidates.

その後に、粗段階DPによるマッチング結果を利用しつつ、上記のピーク選別で選別されなかった、つまりは粗段階DPでは考慮されなかったピークを加えて、密段階のDPアルゴリズムに基づくマッチングを行うことにより、粗段階DPで挙げられた対応関係の候補を最終的に1つに絞る(ステップS5)。粗密DPに基づく候補の探索により参照クロマトグラムに対する対象クロマトグラムの最適な、つまり最小コストを与える対応関係が見い出されたならば、その結果に基づいたワープ処理により、対象クロマトグラムの各サンプル点を移動させた、つまり時間軸補正がなされた信号を求める(ステップS6)。それにより、対象クロマトグラムに含まれる保持時間ずれが補正されたクロマトグラムデータが得られる。   After that, using the matching result by the coarse stage DP, adding the peaks that were not selected by the above peak selection, that is, not considered in the coarse stage DP, and performing matching based on the dense DP algorithm As a result, the candidates for the correspondences listed in the rough stage DP are finally narrowed down to one (step S5). If an optimal correspondence of the target chromatogram with respect to the reference chromatogram, that is, the minimum cost is found by searching for candidates based on the dense DP, each sample point of the target chromatogram is obtained by warping based on the result. A signal that has been moved, that is, subjected to time axis correction is obtained (step S6). Thereby, chromatogram data in which the retention time deviation included in the target chromatogram is corrected is obtained.

上記の一連の処理について本発明に特徴的な処理を中心に詳細に述べる。   The above series of processes will be described in detail focusing on the processes characteristic of the present invention.

[ステップS2]簡易線形補正
クロマトグラムの保持時間ずれの主たる要因はカラム2の劣化であり、これによる保持時間ずれは多少の揺らぎはあるもののほぼ線形である。即ち、参照クロマトグラムに対する対象クロマトグラムの時間ずれの概略的傾向は直線的である。そのため、DPによる時間軸補正を試みる前に、線形の保持時間ずれを除去しておくことにより、DPによる補正の負荷を軽くし補正精度を向上させることができる。図3は簡易線形補正処理の手順を示すフローチャート、図4は簡易線形補正の概念の説明図、図5は簡易線形補正の処理の説明図である。
[Step S2] Simplified linear correction The main cause of the retention time shift of the chromatogram is the deterioration of the column 2, and the retention time shift due to this is almost linear with some fluctuations. That is, the general tendency of the time shift of the target chromatogram with respect to the reference chromatogram is linear. Therefore, by removing the linear holding time deviation before attempting the time axis correction by DP, the correction load by DP can be reduced and the correction accuracy can be improved. FIG. 3 is a flowchart showing the procedure of the simple linear correction process, FIG. 4 is an explanatory diagram of the concept of the simple linear correction, and FIG. 5 is an explanatory diagram of the process of the simple linear correction.

図4に示すように、通常、クロマトグラムにおける時間ずれは線形成分と非線形成分とが重畳したものであるが、線形成分が支配的であることが多い。線形成分を除去しない場合、粗密DPで補正が必要となるずれ量はd2であるが、線形成分を除去すれば、粗密DPで補正が必要となるずれ量はd1で済むことが分かる。   As shown in FIG. 4, the time lag in the chromatogram is usually a superposition of a linear component and a nonlinear component, but the linear component is often dominant. When the linear component is not removed, the deviation amount that needs to be corrected by the coarse / dense DP is d2. However, if the linear component is removed, the deviation amount that needs to be corrected by the coarse / dense DP is only d1.

時間ずれの線形成分はクロマトグラム上でピークが存在する区間の始点及び終点から計算することができるが、そのためにはノイズ等に対する耐性の高い始点・終点検出が必要となる。ここでは、時間的に近接して出現している複数のピークを1つの群として参照クロマトグラムと対象クロマトグラムとの間での類似性の評価を行うことにより、その2つのクロマトグラムにおけるピーク存在区間の始点と終点とを検出する。そして、対象クロマトグラムのピーク存在区間の始点・終点が参照クロマトグラムのピーク存在区間の始点・終点に一致するように、対象クロマトグラムのピーク存在区間を伸縮するとともに時間軸方向にシフトさせる。   The linear component of the time lag can be calculated from the start point and end point of the section where the peak exists on the chromatogram. For this purpose, it is necessary to detect the start point and end point with high resistance to noise and the like. Here, by evaluating the similarity between the reference chromatogram and the target chromatogram with a plurality of peaks appearing close in time as one group, the presence of peaks in the two chromatograms Detect the start and end points of the section. Then, the peak existing section of the target chromatogram is expanded and shifted in the time axis direction so that the start point / end point of the peak existing section of the target chromatogram matches the start point / end point of the peak existing section of the reference chromatogram.

即ち、まず参照クロマトグラムと対象クロマトグラムとのそれぞれにおいて、ピーク存在区間の始点付近の所定範囲と終点付近の所定範囲とでそれぞれ先端、末尾の候補を抽出する(ステップS21)。具体的には、図5に示すように、時間的に連続する3つのピーク(三連ピーク)を抽出し、その3本のピークの強度の相関係数α、及び、1本目のピークと2本目のピークとの時間間隔T1と2本目のピークと3本目のピークとの時間間隔T2との比β=T1/T2、を求める。相関係数αと時間間隔比βとが、参照クロマトグラム上の三連ピークと対象クロマトグラム上の三連ピークとの一致性(類似性)を判断するパラメータである。そして、参照クロマトグラム上の始点側の三連ピークと対象クロマトグラム上の始点側の三連ピークとについて、相関係数α及び時間間隔比βを用いて一致性の評価を行い一致している可能性が高いものを選び先端の候補とする。また、参照クロマトグラム上の終点側の三連ピークと対象クロマトグラム上の終点側の三連ピークとについても同様に、一致している可能性が高いものを選び末尾の候補とする。   That is, first, in each of the reference chromatogram and the target chromatogram, leading and trailing candidates are extracted in a predetermined range near the start point and a predetermined range near the end point of the peak existing section (step S21). Specifically, as shown in FIG. 5, three temporally continuous peaks (triple peaks) are extracted, the correlation coefficient α of the intensity of the three peaks, the first peak and 2 A ratio β = T1 / T2 between the time interval T1 between the first peak and the time interval T2 between the second peak and the third peak is obtained. The correlation coefficient α and the time interval ratio β are parameters for determining the coincidence (similarity) between the triple peak on the reference chromatogram and the triple peak on the target chromatogram. And, the coincidence is evaluated by using the correlation coefficient α and the time interval ratio β for the triple peak on the reference chromatogram on the start point side and the triple peak on the target chromatogram to match. Select the one with the highest possibility as the tip candidate. Similarly, for the triple peak on the end point side on the reference chromatogram and the triple peak on the end point side on the target chromatogram, the one that is highly likely to match is selected as the last candidate.

次に、上記ステップS21で抽出された先端の候補(三連ピーク)と末尾の候補(三連ピーク)を1つずつ選び、実際にその条件で対象クロマトグラムに対する線形補正を試行し、その後の対象クロマトグラムと参照クロマトグラムとにおいてピークの一致度合を判定する(ステップS22)。両クロマトグラムのピークの一致度合を推し量る指標は、参照クロマトグラムに現れる各ピークについて、該ピークの強度との比が一定範囲内に収まるような強度を有し、時間的に最も近い位置に存在する対象クロマトグラム上のピークとの間の距離(時間)の総和を評価関数として用いる。全ての候補の組合せについて同じ評価関数を用いてピーク一致性の評価を実行し(ステップS3)、この評価関数が最小になるような先端と末尾の候補の組合せを選択する(ステップS24)。実際には計算を簡単にするため、上述した一致度合の評価関数と先頭・末尾であることの度合を示す評価関数とを加算した評価関数を用いるようにすればよい。   Next, one tip candidate (triple peak) and one tail candidate (triple peak) extracted in step S21 are selected one by one, and a linear correction is actually performed on the target chromatogram under the conditions. The degree of coincidence of peaks is determined in the target chromatogram and the reference chromatogram (step S22). The index for estimating the degree of coincidence between the peaks of both chromatograms is such that each peak appearing in the reference chromatogram has an intensity such that the ratio to the intensity of the peak falls within a certain range and is present at the closest position in time. The sum of distances (time) between the peaks on the target chromatogram to be used is used as an evaluation function. Peak matching evaluation is executed using the same evaluation function for all candidate combinations (step S3), and a combination of leading and trailing candidates that minimizes this evaluation function is selected (step S24). Actually, in order to simplify the calculation, an evaluation function obtained by adding the above-described evaluation function of the degree of coincidence and the evaluation function indicating the degree of beginning / end may be used.

上記処理により参照クロマトグラム及び対象クロマトグラムにおいてピーク存在区間の始点と終点とが確定するから、それにより線形補正のためのパラメータ(具体的には伸縮率pとシフト量q)を算出し(ステップS25)、そのパラメータに従って対象クロマトグラム上の各ピークの位置を修正する(ステップS26)。これにより、対象クロマトグラムに含まれる時間ずれの線形成分がほぼ除去される。   With the above processing, the start point and end point of the peak existing section are determined in the reference chromatogram and the target chromatogram, and thereby parameters for linear correction (specifically, the expansion / contraction rate p and the shift amount q) are calculated (step S25), the position of each peak on the target chromatogram is corrected according to the parameter (step S26). Thereby, the linear component of the time shift included in the target chromatogram is almost removed.

[ステップS3]粗段階DPによる探索
図6は粗段階DPの処理手順を示すフローチャートである。粗段階DPでは、処理対象のデータを減らすために、まず、単純にピーク強度順に一定割合で間引きを行うとともに、強度が一定の相対強度以下であるピークはノイズである可能性が高いとみなし除去する処理を行う。これにより、補正に有意であると推側し得るピークを選別して、ピーク数を所定数に抑える(ステップS31)。そして、参照クロマトグラム及び対象クロマトグラムのピークの時間を入力データとし、DPアルゴリズムに基づくマッチングを実行する。即ち、参照クロマトグラム上で抽出されたピークについて時間の早いものから順に、対象クロマトグラム上で抽出されたピークとの対応付けの候補を挙げ、複数の候補が挙げられたときにはその各候補について次のピークの対応付けの候補を挙げるという探索を繰り返す。したがって、図8に示したように樹形状に候補が拡がる(ステップS32)。
[Step S3] Search by Coarse Stage DP FIG. 6 is a flowchart showing a processing procedure of the coarse stage DP. In the coarse stage DP, in order to reduce the data to be processed, first, thinning is simply performed at a constant rate in order of peak intensity, and peaks whose intensity is below a certain relative intensity are considered to be likely to be noise and removed. Perform the process. As a result, the peaks that can be estimated to be significant for the correction are selected, and the number of peaks is suppressed to a predetermined number (step S31). Then, matching based on the DP algorithm is executed using the peak time of the reference chromatogram and the target chromatogram as input data. That is, with respect to the peak extracted on the reference chromatogram, the candidates for association with the peak extracted on the target chromatogram are listed in order from the earliest time, and when a plurality of candidates are listed, The search is repeated to list candidates for peak matching. Therefore, as shown in FIG. 8, candidates expand into a tree shape (step S32).

なお、このときに、想定される非線形の時間ずれの最大値を考慮した時間範囲に候補の拡がりを抑えることで、各ピーク点で挙げる候補の数を制限する。上述したように、予め線形性の時間ずれが除去されているため、この制限を厳しくしても(ビーム幅を狭くしても)正当な候補が除外される事態を避けることができる。   At this time, the number of candidates listed at each peak point is limited by suppressing the spread of candidates to a time range that takes into consideration the maximum value of the assumed nonlinear time shift. As described above, since the linearity time lag has been removed in advance, even if this restriction is tightened (even if the beam width is narrowed), a situation where a valid candidate is excluded can be avoided.

次いで、探索された対応関係の候補について、それぞれコストを計算する(ステップS33)。粗段階DPでのコスト関数は以下のようにする。
(1)対応付けるピークの強度比の対数に一定の定数を乗じたもの。ただし、対応付けるピークが存在しない場合には、スキップされたピーク毎に、ピーク強度に一定定数を加算したものとする。
(2)時間変動量:参照クロマトグラム上のピークと対象クロマトグラム上のピークの時間差の絶対値
(3) 時間変動量の差分:大部分の時間変動は緩やかに起きるため、時間変動量の差分はゼロに近い値をとる筈である。そこで、時間変動量の平均に相当するものとして、時間変動量にローパスフィルタを掛けた値と現在の対応ピークでの時間変動の差の絶対値を用いる。
(4)強度比の差分:マッチング後の参照クロマトグラムと対象クロマトグラムの各ピークの強度には非常に強い相関があり、理想的には強度比は一定となる。そこで、強度比の対数の平均に相当するものとして、その強度比の対数値にローパスフィルタを掛けた値と現在の対応ピークでの強度比の対数の差の絶対値を用いる。
実際には、上記(1)〜(4)の各項目に所定のガンマ補正を施した上で定数を乗じ、コスト関数としている。
Next, the cost is calculated for each of the searched correspondence candidates (step S33). The cost function at the coarse stage DP is as follows.
(1) Multiplying the logarithm of the intensity ratio of the corresponding peak by a constant. However, if there is no corresponding peak, it is assumed that a constant constant is added to the peak intensity for each skipped peak.
(2) Time variation: Absolute value of the time difference between the peak on the reference chromatogram and the peak on the target chromatogram (3) Difference in time variation: Most of the time variation occurs slowly, so the difference in time variation Should be close to zero. Therefore, as a value corresponding to the average of the time fluctuation amount, a value obtained by multiplying the time fluctuation amount by a low-pass filter and an absolute value of the difference in time fluctuation at the current corresponding peak are used.
(4) Difference in intensity ratio: There is a very strong correlation between the intensity of each peak in the reference chromatogram after matching and the target chromatogram, and the intensity ratio is ideally constant. Therefore, as a value corresponding to the logarithmic average of the intensity ratio, a value obtained by multiplying the logarithm of the intensity ratio by a low-pass filter and the absolute value of the logarithm of the intensity ratio at the current corresponding peak are used.
In practice, each of the items (1) to (4) is subjected to predetermined gamma correction and then multiplied by a constant to obtain a cost function.

参照クロマトグラムと対象クロマトグラムとの対応関係の全ての候補についてコスト計算が終了したならば、コストが最小の候補を選択し、これを粗段階DPの最適マッチングとして決定する(ステップS34)。   If the cost calculation has been completed for all candidates of the correspondence relationship between the reference chromatogram and the target chromatogram, the candidate with the lowest cost is selected and determined as the optimum matching of the rough stage DP (step S34).

[ステップS4]フィルタリング処理
DPは局所的なマッチングには優れているが、クロマトグラム全体の傾向からみた補正の妥当性からは逸脱したマッチングを行う場合がある。そこで、図7に示すように、最適マッチングとして決定された対応関係について、各ピーク点での時間ずれの標準偏差を計算し、その標準偏差から外れるようなずれがある場合には、当該ピークのマッチングを削除する。
[Step S4] Filtering Process Although DP is excellent for local matching, matching that deviates from the validity of correction in view of the tendency of the entire chromatogram may be performed. Therefore, as shown in FIG. 7, for the correspondence determined as the optimum matching, the standard deviation of the time deviation at each peak point is calculated, and if there is a deviation that deviates from the standard deviation, Remove matching.

[ステップS5]密段階DPによる探索
次に、粗段階DPで得られたマッチング結果を利用し探索空間を絞った上で、粗段階DPの際には除外されたピークも含めてDPアルゴリズムによるマッチングを実行する。この際には、密段階DPでの時間変動は粗段階DPで求めた時間変動に近い値をとるので、粗段階DPの結果のコスト関数にかけるガンマ補正及び定数を変更し、さらに以下のように粗段階DPでのマッチング結果との乖離度合いコストを加算する。
(1)粗段階DPでマッチングがある参照クロマトグラム上のピークについては、密段階DPにおいてマッチングが一致しなければコスト無限大とみなし、その候補を破棄する。
(2)粗段階DPでマッチングがない参照クロマトグラム上のピークについては、粗段階DPでマッチングした結果(時間的に近接したピーク)を線形補間した時間との時間ずれの絶対値を乖離度合いコストとする。
[Step S5] Search by dense stage DP Next, after narrowing the search space using the matching result obtained in coarse stage DP, matching by DP algorithm including peaks excluded in coarse stage DP is also performed. Execute. At this time, since the time fluctuation in the fine stage DP takes a value close to the time fluctuation obtained in the coarse stage DP, the gamma correction and the constant applied to the cost function of the result of the coarse stage DP are changed. And the cost of the degree of divergence from the matching result at the coarse stage DP.
(1) For a peak on the reference chromatogram having a matching in the coarse stage DP, if the matching does not match in the dense stage DP, the cost is considered infinite, and the candidate is discarded.
(2) For peaks on the reference chromatogram that do not match in the coarse stage DP, the absolute value of the time lag with the time obtained by linear interpolation of the results matched in the coarse stage DP (peaks close in time) is the divergence degree cost. And

これにより、粗段階DPでマッチングしているピークの対応付けは正しいものとして、粗段階DPでは用いられなかったピークについても適切な対応付けが行われ、結果的に、最終クロマトグラムと対象クロマトグラムとの最適な対応関係を求めることができる。   As a result, it is assumed that the matching of the peaks matched in the coarse stage DP is correct, and the peaks that are not used in the coarse stage DP are also appropriately matched. As a result, the final chromatogram and the target chromatogram are obtained. It is possible to obtain the optimum correspondence with

図9は本発明に係るクロマトグラムデータ処理方法で時間軸補正を実行したときの処理結果を示す図である。この図に示すように、補正後の対象クロマトグラムは参照クロマトグラムとよく一致していることが分かる。   FIG. 9 is a diagram showing a processing result when time axis correction is executed by the chromatogram data processing method according to the present invention. As shown in this figure, it can be seen that the corrected target chromatogram is in good agreement with the reference chromatogram.

なお、上記実施例はいずれも本発明の一例にすぎず、本発明の趣旨の範囲で適宜、変更、修正、追加を行っても本願特許請求の範囲に包含されることは当然である。   The above-described embodiments are merely examples of the present invention, and it is a matter of course that changes, modifications, and additions are appropriately included in the scope of the claims of the present application within the scope of the present invention.

1…試料導入部
2…カラム
3…検出器
4…A/D変換器
5…データ処理部
51…クロマトグラムデータ格納部
52…時間軸補正演算処理部
53…クロマトグラム作成・描画部
6…表示部
DESCRIPTION OF SYMBOLS 1 ... Sample introduction part 2 ... Column 3 ... Detector 4 ... A / D converter 5 ... Data processing part 51 ... Chromatogram data storage part 52 ... Time-axis correction arithmetic processing part 53 ... Chromatogram preparation and drawing part 6 ... Display Part

Claims (5)

試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフ装置により得られたクロマトグラムデータについて、基準となる参照クロマトグラムの時間軸に対し対象クロマトグラムの時間軸を合わせるように該時間軸を補正するクロマトグラムデータ処理方法であって、
a)参照クロマトグラム上及び対象クロマトグラム上で検出されたピークを利用して、対象クロマトグラムから線形性を有する時間変動を除去する線形補正ステップと、
b)前記線形補正ステップによる線形補正後の対象クロマトグラムと前記参照クロマトグラムでそれぞれ検出されたピークの強度に基づいて、その参照クロマトグラム及び対象クロマトグラムのそれぞれについてピークを選別し、その選別されたピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して粗段階での参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する粗探索ステップと、
c)前記粗探索ステップで抽出された粗段階での対応関係の候補について、該ステップで排除されたピークを加えた上で、ピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して密段階での参照クロマトグラムと対象クロマトグラムとの対応関係を探索する密探索ステップと、
d)前記密探索ステップで抽出された参照クロマトグラムと対象クロマトグラムとの対応関係に基づいて、対象クロマトグラムの時間軸を補正する補正処理ステップと、
を有することを特徴とするクロマトグラムデータ処理方法。
Chromatogram data obtained by a chromatograph that includes a separation unit that separates various components contained in the sample in the time direction and a detector that detects the sample from which the components have been separated is displayed on the time axis of the reference reference chromatogram. A chromatogram data processing method for correcting the time axis so as to match the time axis of the target chromatogram,
a) using a peak detected on the reference chromatogram and the target chromatogram, and a linear correction step for removing a time variation having linearity from the target chromatogram;
b) Based on the intensity of the peak detected in the target chromatogram after the linear correction in the linear correction step and the reference chromatogram, the peak is selected for each of the reference chromatogram and the target chromatogram, A coarse search step for searching for candidates for the correspondence relationship between the reference chromatogram and the target chromatogram in the coarse stage by performing matching by a dynamic programming algorithm for the retention time of the peak,
c) For the candidate for the correspondence relationship in the coarse stage extracted in the coarse search step, after adding the peak excluded in the step, matching is performed by the dynamic programming algorithm for the peak retention time. A dense search step for searching for a correspondence relationship between the reference chromatogram and the target chromatogram in the dense stage;
d) a correction processing step for correcting the time axis of the target chromatogram based on the correspondence relationship between the reference chromatogram extracted in the dense search step and the target chromatogram;
A method for processing chromatogram data, comprising:
請求項1に記載のクロマトグラムデータ処理方法であって、
前記粗探索ステップの実行後で前記密探索ステップの実行前に、マッチング全体の傾向を評価基準として該評価基準に適合しないマッチング結果を除去するフィルタリングステップを有することを特徴とするクロマトグラムデータ処理方法。
The chromatogram data processing method according to claim 1,
A chromatogram data processing method comprising: a filtering step for removing matching results that do not conform to the evaluation criteria after the rough search step and before the dense search step as an evaluation criterion .
請求項1又は2に記載のクロマトグラムデータ処理方法であって、
前記線形補正ステップは、時間的に近接する複数のピークの強度の相関及び時間の関係を利用して参照クロマトグラムと対象クロマトグラムとで対応する時間範囲を抽出し、その時間範囲の組み合わせを仮定して線形補正を行ったときのピークの一致の程度を調べ、最良の一致を示す時間範囲の組み合わせを選ぶことで線形補正のための係数を求めることを特徴とするクロマトグラムデータ処理方法。
The chromatogram data processing method according to claim 1 or 2,
In the linear correction step, a time range corresponding to the reference chromatogram and the target chromatogram is extracted using the correlation between the intensities of a plurality of peaks that are close in time and the time relationship, and a combination of the time ranges is assumed. Then, the degree of coincidence of peaks when linear correction is performed is determined, and a coefficient for linear correction is obtained by selecting a combination of time ranges showing the best match.
請求項3に記載のクロマトグラムデータ処理方法であって、
前記線形補正ステップにおけるピークの一致の度合を示す尺度として、参照クロマトグラム上の各ピークについて、該参照クロマトグラム上の1本のピークと前記仮定の下で線形補正が行われた後の対象クロマトグラム上で前記参照クロマトグラム上のピークの強度に対し一定の強度比の範囲に収まり最も近傍に位置するピークとの時間差の絶対値の総和を用いることを特徴とするクロマトグラムデータ処理方法。
The chromatogram data processing method according to claim 3,
As a measure indicating the degree of coincidence of peaks in the linear correction step, for each peak on the reference chromatogram, the target chromatogram after linear correction is performed under the assumption of one peak on the reference chromatogram. A chromatogram data processing method characterized by using a sum of absolute values of time differences with respect to a peak located within a certain intensity ratio range with respect to the peak intensity on the reference chromatogram on the gram.
試料に含まれる各種成分を時間方向に分離する分離部と成分分離された試料を検出する検出器とを含むクロマトグラフ装置により得られたクロマトグラムデータについて、基準となる参照クロマトグラムの時間軸に対し対象クロマトグラムの時間軸を合わせるように該時間軸を補正するクロマトグラムデータ処理装置において、
a)参照クロマトグラム上及び対象クロマトグラム上で検出されたピークを利用して、対象クロマトグラムから線形性を有する時間変動を除去する線形補正手段と、
b)前記線形補正手段による線形補正後の対象クロマトグラムと前記参照クロマトグラムでそれぞれ検出されたピークの強度に基づいて、その参照クロマトグラム及び対象クロマトグラムのそれぞれについてピークを選別し、その選別されたピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して粗段階での参照クロマトグラムと対象クロマトグラムとの対応関係の候補を探索する粗探索手段と、
c)前記粗探索手段で抽出された粗段階での対応関係の候補について、該手段で排除されたピークを加えた上で、ピークの保持時間を対象とする動的計画法アルゴリズムによるマッチングを実行して密段階での参照クロマトグラムと対象クロマトグラムとの対応関係を探索する密探索手段と、
d)前記密探索手段で抽出された参照クロマトグラムと対象クロマトグラムとの対応関係に基づいて、対象クロマトグラムの時間軸を補正する補正処理手段と、
を備えることを特徴とするクロマトグラムデータ処理装置。
Chromatogram data obtained by a chromatograph that includes a separation unit that separates various components contained in the sample in the time direction and a detector that detects the sample from which the components have been separated is displayed on the time axis of the reference reference chromatogram. In the chromatogram data processing apparatus for correcting the time axis so as to match the time axis of the target chromatogram,
a) linear correction means for removing time fluctuation having linearity from the target chromatogram using the peaks detected on the reference chromatogram and the target chromatogram;
b) Based on the intensity of the peak detected in the target chromatogram after the linear correction by the linear correction means and the reference chromatogram, the peak is selected for each of the reference chromatogram and the target chromatogram, A coarse search means for searching for a candidate for a correspondence relationship between a reference chromatogram and a target chromatogram in a rough stage by performing matching by a dynamic programming algorithm for holding the peak retention time;
c) For the candidates for the correspondence relationship in the coarse stage extracted by the coarse search means, after adding the peaks excluded by the means, matching is performed by a dynamic programming algorithm for the peak retention time. A dense search means for searching for a correspondence relationship between the reference chromatogram and the target chromatogram in the dense stage,
d) correction processing means for correcting the time axis of the target chromatogram based on the correspondence between the reference chromatogram extracted by the dense search means and the target chromatogram;
A chromatogram data processing apparatus comprising:
JP2010091908A 2010-04-13 2010-04-13 Chromatogram data processing method and apparatus Active JP5333329B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010091908A JP5333329B2 (en) 2010-04-13 2010-04-13 Chromatogram data processing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010091908A JP5333329B2 (en) 2010-04-13 2010-04-13 Chromatogram data processing method and apparatus

Publications (2)

Publication Number Publication Date
JP2011220907A JP2011220907A (en) 2011-11-04
JP5333329B2 true JP5333329B2 (en) 2013-11-06

Family

ID=45038068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010091908A Active JP5333329B2 (en) 2010-04-13 2010-04-13 Chromatogram data processing method and apparatus

Country Status (1)

Country Link
JP (1) JP5333329B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7423180B2 (en) * 2018-06-26 2024-01-29 公益財団法人鉄道総合技術研究所 High-precision position correction method and system for waveform data
JP7081385B2 (en) * 2018-08-03 2022-06-07 東ソー株式会社 How to calculate the similarity of chromatograms
JP7463944B2 (en) * 2020-11-09 2024-04-09 株式会社島津製作所 Waveform processing support device and waveform processing support method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0664478B2 (en) * 1992-06-05 1994-08-22 カシオ計算機株式会社 Pattern recognizer
US20060194329A1 (en) * 2003-03-31 2006-08-31 Atsushi Ogiwara Sample analyzing method and sample analyzing program
JP2006330852A (en) * 2005-05-23 2006-12-07 Nikkan Kagaku Kk Compound organic substance quality comparing device and system using biopattern sensing, and recording medium
JP2007147459A (en) * 2005-11-28 2007-06-14 Kazusa Dna Kenkyusho Data processor, program and computer-readable recording medium

Also Published As

Publication number Publication date
JP2011220907A (en) 2011-11-04

Similar Documents

Publication Publication Date Title
JP6610678B2 (en) Peak detection method and data processing apparatus
US9500629B2 (en) Chromatogram data processing method and device
JP5375411B2 (en) Chromatograph mass spectrometry data analysis method and apparatus
US10121643B2 (en) Chromatography/mass spectrometry data processing device
US7488935B2 (en) Apparatus and method for processing of mass spectrometry data
JP6409983B2 (en) Chromatograph mass spectrometry data processing method and processing apparatus
JP5333329B2 (en) Chromatogram data processing method and apparatus
JP5211753B2 (en) Chromatographic data processor
JP6658884B2 (en) Data processor for chromatograph mass spectrometry
WO2012039061A1 (en) Data processing method and device
US11222209B2 (en) Comparing video sequences using fingerprints
JP6060793B2 (en) Peak detector
EP2153219A2 (en) Method and system for detecting peptide peaks in hplc-ms signals
JP6493076B2 (en) Peak waveform processing device
JP6256162B2 (en) Signal waveform data processing device
JP7334788B2 (en) WAVEFORM ANALYSIS METHOD AND WAVEFORM ANALYSIS DEVICE
JP4826579B2 (en) Chromatographic data processor
US10236167B1 (en) Peak waveform processing device
KR102133126B1 (en) Frequency estimation apparatus and method
JP5747839B2 (en) Data processing equipment for chromatographic mass spectrometry
JP3687203B2 (en) Data processing equipment for chromatographic mass spectrometry
WO2018037487A1 (en) Data processing method and device
JP3985671B2 (en) Chromatographic data processor
JP2008002895A (en) Data processor for chromatograph mass analysis
JPH10185873A (en) Mass spectrometric device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120802

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130527

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130702

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130715

R151 Written notification of patent or utility model registration

Ref document number: 5333329

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151