WO2022265110A1

WO2022265110A1 - モデル関数フィッティング装置およびモデル関数フィッティング方法

Info

Publication number: WO2022265110A1
Application number: PCT/JP2022/024399
Authority: WO
Inventors: 陽野田
Original assignee: 株式会社島津製作所
Priority date: 2021-06-18
Filing date: 2022-06-17
Publication date: 2022-12-22
Also published as: JPWO2022265110A1; CN117501117A

Abstract

モデル関数フィッティング装置は、クロマトグラムを取得する取得部と、モデル関数に対して、モデル関数の対数関数が２次関数で近似できる第１部と、第１部の両側に位置し１次関数で近似できる第２部とを有するという制約を与えた上で、クロマトグラムにモデル関数をフィッティングするフィッティング部とを備える。

Description

モデル関数フィッティング装置およびモデル関数フィッティング方法

　本発明は、クロマトグラムにモデル関数をフィッティングするモデル関数フィッティング装置およびモデル関数フィッティング方法に関する。

　クロマトグラフにより計測した波形の定量・定性を行うために、非特許文献１に示すような様々なモデル関数が提案されている。ピーク分離アルゴリズムへの適用において、モデル関数に対しては、実測波形に対して高精度にフィッティングできることと、任意のパラメータに対してクロマトグラムのピーク波形とは異なる形状を取る可能性が低いことが要求される。これらの要求に応えるために、例えば、非特許文献２に示すＥＭＧ関数やＢＥＭＧ関数が用いられている。

「ピークフィット」、株式会社ヒューリンクス、［２０２１年６月４日検索］、＜ＵＲＬ：https://www.hulinks.co.jp/software/da_visual/peakfit/functions#chorom＞「Ｎｅｗ　Ｄａｔａ　Ｐｒｏｃｅｓｓｉｎｇ　Ｍｅｔｈｏｄ　ｆｏｒ　Ｐｈｏｔｏｄｉｏｄｅ　Ａｒｒａｙ　Ｄｅｔｅｃｔｏｒｓ」、株式会社島津製作所、［２０２１年６月４日検索］、＜ＵＲＬ：https://www.shimadzu.com/an/sites/shimadzu.com.an/files/pim/pim_document_file/technical/technical_reports/13438/jpl217011.pdf＞

　ＥＭＧ関数やＢＥＭＧ関数を用いることにより、多くの実測波形に対してはピーク分離が可能である。しかし、さらに精度の高いフィッティングが可能なモデル関数が存在すれば、利用者にとって利便性が高い。

　本発明の目的は、精度の高いフィッティングが可能なモデル関数を提供することである。

　本発明の一局面に従うモデル関数フィッティング装置は、クロマトグラムを取得する取得部と、モデル関数に対して、モデル関数の対数関数が２次関数で近似できる第１部と、第１部の両側に位置し１次関数で近似できる第２部とを有するという制約を与えた上で、クロマトグラムにモデル関数をフィッティングするフィッティング部とを備える。

　本発明によれば、精度の高いフィッティングが可能なモデル関数を提供することができる。

図１は本実施の形態に係るモデル関数フィッティング装置の構成図である。図２は本実施の形態に係るモデル関数フィッティング装置の機能ブロック図である。図３はクロマトグラムを示す図である。図４はクロマトグラムの対数を示す図である。図５はクロマトグラムへの一般化加法モデルのフィッティングを示す図である。図６は第１の実施の形態に係るモデル関数フィッティングのシミュレーションによる残差を示す図である。図７はＢＥＭＧ関数フィッティングのシミュレーションによる残差を示す図である。図８は第１の実施の形態に係るモデル関数と、単峰制限によりフィッティングされたモデル関数とを比較する図である。図９はシミュレーションデータにフィッティングされたモデル関数を示す図である。図１０は第２の実施の形態に係るモデル関数とＢＥＭＧ関数とのシミュレーション結果を比較した図である。図１１は第２の実施の形態に係るモデル関数とＥＭＧ関数・ＢＥＭＧ関数とのシミュレーション結果を比較した図である。図１２は第３の実施の形態の対象となるクロマトグラムＣ２を示す図である。図１３はクロマトグラムＣ２の対数ＬＣ２を示す図である。図１４は変換関数により変換されたクロマトグラムＣ３を示す図である。図１５はクロマトグラムＣ３の対数ＬＣ３を示す図である。図１６は変換関数により変換されたクロマトグラムＣ５を示す図である。図１７はクロマトグラムＣ５の対数ＬＣ５を示す図である。図１８は変換関数により変換されたクロマトグラムＣ７を示す図である。図１９はクロマトグラムＣ７の対数ＬＣ７を示す図である。図２０は対数クロマトグラムＬＣ９を示す図である。図２１はＧＡＭで使用されるスプライン群を示す図である。図２２は対数クロマトグラムＬＣ９に適用されたＧＡＭモデルを示す図である。図２３は時間歪み関数に適用されたＧＡＭモデルを示す図である。図２４はフィッティングによる係数の振動を示す図である。図２５は実施の形態の係るモデル関数フィッティング方法を示すフローチャートである。図２６は実施の形態の係るモデル関数フィッティング方法を示すフローチャートである。

　次に、添付の図面を参照しながら本発明の実施の形態に係るモデル関数フィッティング装置およびモデル関数フィッティング方法について説明する。

　（１）モデル関数フィッティング装置の構成
　図１は、実施の形態に係るモデル関数フィッティング装置１の構成図である。本実施の形態のモデル関数フィッティング装置１は、液体クロマトグラフまたはガスクロマトグラフなどにおいて得られた試料の測定データＭＤを取得する。

　本実施の形態のモデル関数フィッティング装置１は、パーソナルコンピュータにより構成される。モデル関数フィッティング装置１は、図１に示すように、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）１１、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１２、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１３、操作部１４、ディスプレイ１５、記憶装置１６、通信インタフェース（Ｉ／Ｆ）１７、デバイスインタフェース（Ｉ／Ｆ）１８を備える。

　ＣＰＵ１１は、モデル関数フィッティング装置１の全体制御を行う。ＲＡＭ１２は、ＣＰＵ１１がプログラムを実行するときにワークエリアとして使用される。ＲＯＭ１３には、各種データ、プログラムなどが記憶される。操作部１４は、ユーザによる入力操作を受け付ける。操作部１４は、キーボードおよびマウスなどを含む。ディスプレイ１５は、フィッティング結果などの情報を表示する。記憶装置１６は、ハードディスクなどの記憶媒体である。記憶装置１６には、プログラムＰ１および測定データＭＤが記憶される。プログラムＰ１は、クロマトグラムを取得する処理、クロマトグラムにモデル関数をフィッティングする処理を実行する。通信インタフェース１７は、他のコンピュータとの間で有線または無線による通信を行うインタフェースである。デバイスインタフェース１８は、ＣＤ、ＤＶＤ、半導体メモリなどの記憶媒体１９にアクセスするインタフェースである。

　（２）モデル関数フィッティング装置の機能構成
　図２は、モデル関数フィッティング装置１の機能構成を示すブロック図である。図２において、制御部２０は、ＣＰＵ１１がＲＡＭ１２をワークエリアとして使用しつつ、プログラムＰ１を実行することにより実現される機能部である。制御部２０は、取得部２１、フィッティング部２２および出力部２３を備える。つまり、取得部２１、フィッティング部２２および出力部２３は、プログラムＰ１の実行により実現される機能部である。言い換えると、各機能部２１～２３は、ＣＰＵ１１が備える機能部とも言える。

　取得部２１は、測定データＭＤを入力する。取得部２１は、例えば、通信インタフェース１７を介して他のコンピュータや分析装置などから測定データＭＤを入力する。あるいは、取得部２１は、デバイスインタフェース１８を介して、記憶媒体１９に保存された測定データＭＤを入力する。

　フィッティング部２２は、クロマトグラムにモデル関数をフィッティングする処理を実行する。本実施の形態のフィッティング部２２は、モデル関数に対して、モデル関数の対数関数が２次関数で近似できる第１部と、第１部の両側に位置し、１次関数で近似できる第２部とを有するという制約を与えた上で、クロマトグラムにモデル関数をフィッティングする。

　出力部２４は、フィッティング部２２により実行されたフィッティング結果やフィッティングされたモデル関数に関する情報などをディスプレイ１５に表示させる。

　プログラムＰ１は、記憶装置１６に保存されている場合を例として説明する。他の実施の形態として、プログラムＰ１は、記憶媒体１９に保存されて提供されてもよい。ＣＰＵ１１は、デバイスインタフェース１８を介して記憶媒体１９にアクセスし、記憶媒体１９に保存されたプログラムＰ１を、記憶装置１６またはＲＯＭ１３に保存するようにしてもよい。あるいは、ＣＰＵ１１は、デバイスインタフェース１８を介して記憶媒体１９にアクセスし、記憶媒体１９に保存されたプログラムＰ１を実行するようにしてもよい。

　（３）第１の実施の形態
　次に、第１の実施の形態に係るモデル関数フィッティング方法について説明する。図３は、取得部２１が取得する測定データＭＤを示す図である。測定データＭＤは、分析対象の試料のクロマトグラムＣ１を示す。図３において横軸は時間、縦軸は強度（検出値）である。図に示すように、時間Ｔ１においてクロマトグラムＣ１のピークが検出されている。ピーク高さは強度１００に正規化されている。

　図４は、図３に示すクロマトグラムＣ１の対数ＬＣを示す図である。図４に示すように、クロマトグラムＣ１の対数ＬＣは、２次関数に近似できる第１部Ａ１を有している。第１部Ａ１は、時間Ｔ１を含む領域である。そして、対数ＬＣは、第１部Ａ１の両側に１次関数に近似できる第２部Ａ２，Ａ２を有している。そこで、フィッティング部２２は、モデル関数の対数関数として、２次差分（２次微分）が非正である数列Ｌ［ｔ］（ｔは時間）を用いる。つまり、モデル関数の対数関数が上に凸であるという特徴をモデル関数の制約として利用する。これにより、モデル関数のパラメータが変化した場合にも、モデル関数がクロマトグラムらしくない形状を取る可能性を低減させることができる。

　モデル関数の対数関数として、２次差分が非正であるという数列Ｌ［ｔ］を考えることにより、モデル関数に有効な制約を与えることができるが、数列Ｌ［ｔ］はパラメータの数が多い。つまり、モデル関数として数列Ｌ［ｔ］を用いる場合、「モデル関数のパラメータ数」＝「測定データＭＤのデータ点数」となるため、最適化計算の安定性が低くなる。また、モデル関数として数列［ｔ］を用いる場合、モデル関数が測定データＭＤに過適応することにより、クロマトグラムらしくない形状を取る可能性がある。

　そこで、好ましくは、フィッティング部２２は、一般化加法モデル（ＧＡＭ：Ｇｅｎｅｒａｌｉｚｅｄ　Ａｄｄｉｔｉｖｅ　Ｍｏｄｅｌｓ）を用いることにより、クロマトグラムＣ１にモデル関数をフィッティングする。本実施の形態においては、一般化加法モデルとして、平滑化スプラインモデルを用いる。つまり、モデル関数の対数関数として、２次差分が非正であるという数列Ｌ［ｔ］を適用するとともに、モデル関数に対しては、平滑化スプラインにより一般化加法モデルを適用する。２次差分が非正であるという制約に、一般化加法モデルを適用させた手法を、本明細書において、ＤＧＡＭと呼ぶことにする。

　図５は、クロマトグラムＣ１に平滑化スプラインを用いた一般化加法モデルをフィッティングさせた例を示す。図５では、ピーク半値幅の１／３程度の間隔を開けて、４次のスプラインＳＰ１，ＳＰ２，ＳＰ３を配置した様子を示している。スプラインＳＰ１の左側の領域およびスプラインＳＰ３の右側の領域に配置されたスプラインは図示省略している。スプラインを配置する間隔は特に限定されない。この例では経験的に近似精度が高くなるピーク半値幅の１／３程度をスプライン間隔とした。また、スプライン間隔は配列される複数のスプラインにおいて同一でなくてもよい。ピークから外れる領域はスプライン間隔を広くすることでパラメータ数を減らすことができる。また、ピークがテーリングしている場合には、テーリングしていない側、すなわちより急峻な変化がある側で求めた半値幅を用いてスプライン間隔を決める方がよい。

　このように、本実施の形態において、フィッティング部２２は、一般化加法モデルを利用してクロマトグラムにモデル関数をフィッティングする。一般化加法モデルは、時系列順にパラメータが並ぶが、そのパラメータの２次差分が非正となる制約を与えることで、平滑化を掛けながら、凸関数の制限を加えることができる。また、上記のように、モデル関数として数列Ｌ［ｔ］を用いる場合と比べて、パラメータ数を削減することができ、計算量を削減することができる。平滑化スプラインモデルを利用した場合、パラメータ数をスプラインのピークの数にまで削減することができる。最小二乗法を用いる場合であれば、パラメータ数は大きな問題とならないが、マルコフ連鎖モンテカルロ法（ＭＣＭＣ：Ｍａｒｋｏｖ　ｃｈａｉｎ　Ｍｏｎｔｅ　Ｃａｒｌｏ　ｍｅｔｈｏｄｓ）を用いたベイズ推定による回帰を行う場合はパラメータ数の削減は計算上大きなメリットとなる。

　図６は、ＤＧＡＭを用いたフィッティングのシミュレーション結果を示す図である。図６は、クロマトグラムのシミュレーションデータとＤＧＡＭにより算出したモデル関数との残差を示す図である。図７は、比較例として、ＢＥＭＧを用いたフィッティングのシミュレーション結果を示す図である。図７は、図６と同じシミュレーションデータとＢＥＭＧにより算出したモデル関数との残差を示す図である。ＢＥＭＧでは、０．０８％程度の誤差が生じているのに対して、ＤＧＡＭでは、０．００５％程度の誤差に抑えられていることが分かる。ＤＧＡＭにおいては、誤差量とスプライン間隔・次数とがトレードオフの関係にあるため、スプライン間隔・次数を調整することで、目標とする誤差量を実現することができる。このように、ＤＧＡＭでは、必要最小限のパラメータ数でモデル関数の近似を実現することができる。

　モデル関数のフィッティングにおいては、誤差を抑える制限方法として、ＭＣＲ－ＡＬＳ等のピーク分離アルゴリズムに単峰制限が用いられている。本実施の形態におけるＤＧＡＭは、単峰制限と比べてもモデル関数に強い制約を与えることができる。図８は、ＤＧＡＭと単峰制限によるフィッティング結果を比較した図である。図８では、同じ測定データＭＤに対して、ＤＧＡＭと単峰制限を利用してフィッティングさせたモデル関数を示す。図において、Ｍ１は、ＤＧＡＭを用いてフィッティングさせたモデル関数であり、Ｍ２は、単峰制限を利用してフィッティングさせたモデル関数である。このように、単峰制限と比較してもＤＧＡＭのフィッティング精度が高いことが分かる。

　本実施の形態のＤＧＡＭを、クロマトグラムに含まれる１つまたは複数のピークの面積算出に用いることで、試料の定量・定性を精度よく行うことができる。モデル関数をクロマトグラム分離アルゴリズムに用いる場合、その近似精度が重要である。医薬品の不純物管理の場合であれば、主成分ピークに比べて非常に微小な量（例えば０．０５％）の不純物ピークを管理する必要がある。このような用途においては、当然ながらフィッティングに用いるモデル関数の誤差は０．０５％よりも小さい必要がある。しかし、ＢＥＭＧ等のモデル関数は、図７を用いて説明したように０．１％程度の誤差を有する。この誤差は、Ｒａｄｋｅ－Ｐｒａｕｓｎｉｔｚ吸着等温線モデルなどを用いたクロマトグラムシミュレーションにおいても確認される。これに対して、本実施の形態の手法であるＤＧＡＭは、図６を用いて説明したように、フィッティングの誤差は０，０５％よりも小さい。これにより、ＤＧＡＭを用いることにより、微小な不純物を管理する医薬品の分野においてもクロマトグラム分離アルゴリズムに利用可能である。

　（４）第２の実施の形態
　次に、第２の実施の形態に係るモデル関数フィッティング方法について説明する。数１式は、第２の実施の形態に係るモデル関数ｅｘｐ（ｇ（ｘ，ａ，ｂ））を示す式である。なお、数１式において、ｘは、ピーク位置とピーク幅を正規化した保持時間である。つまり、ピーク位置をｕ、ピーク幅をｓとすると、ｘには、（ｘ－ｕ）／ｓが入力される。また、数１式において、ａ，ｂはテーリングパラメータである。

　数１式において、ｇ（ｘ，ａ，ｂ）は、図４で示したように、２次関数に近似できる第１部Ａ１と、第１部Ａ１の両側に１次関数に近似できる第２部Ａ２，Ａ２を有している。つまり、モデル関数であるｅｘｐ（ｇ（ｘ，ａ，ｂ））の対数関数は、２次関数に近似できる第１部Ａ１と、第１部Ａ１の両側に１次関数に近似できる第２部Ａ２，Ａ２を有している。このように、第２の実施の形態のモデル関数も、モデル関数の対数関数が上に凸であるという制約を有している。このような制約を有する本実施の形態のモデル関数ｅｘｐ（ｇ（ｘ，ａ，ｂ））を、本明細書において、ＥＭＬＣ（Ｅｘｐｏｎｅｎｔｉａｌ　ｏｆ　Ｍｏｄｉｆｉｅｄ　Ｌｏｇ　Ｃｏｓｈ）関数と呼ぶことにする。

　さらに、ピーク位置、ピーク高さおよびピーク幅に関して正規化したモデル関数ｅｘｐ（ｈ（ｘ，ａ，ｂ））を数２式に示す。数２式において、βはベータ関数である。

　本実施の形態のＥＭＬＣ関数は、パラメータの共線性が少なく、ベイズ推定や最適化の効率を高くすることができる。図９は、測定データＭＤとしてシミュレーションデータを用いて、ＥＭＬＣ関数をベイズ推定により推定した結果を示す。図９において、ＳＤは、シミュレーションデータであり、Ｍ３は、ベイズ推定により推定されてモデル関数（ＥＭＬＣ関数）を示す。なお、このシミュレーションでは、上述したピーク位置ｕ、ピーク幅ｓ、テーリングパラメータａ，ｂに加えて、ピーク高さＨをパラメータとして追加してベイズ推定を行っている。

　図９に示すシミュレーションは、ベイズ推定ソフトウェアｓｔａｎを用いて行った。シミュレーションデータには、０を中心とした正規分布のノイズを付加している。ベイズ推定は、２０００イテレーション、１２チェインで実行した。図１０は、ｓｔａｎにより実行したベイズ推定のシミュレーション結果を示す。比較例として、同じシミュレーションデータＳＤに対してＢＥＭＧをモデル関数として用いてベイズ推定した結果も示す。図１０に示すように、ＥＭＬＣにおいては、Ｒｈａｔ（収束判定指標）が１．０に近い値となっており、ＢＥＭＧに比べて推定の精度が高いことが分かる。また、サンプリングが効率的に実行されたことを示す指標ｎ＿ｅｆｆ（有効サンプル数）についても、ＢＥＭＧに比べてＥＭＬＣは値が大きく、推定の精度が高いことが分かる。また、ｓｅ－ｍｅａｎは標準誤差であり、ＢＥＭＧに比べてＥＭＬＣは値が小さくなっている。このように、ＭＣＭＣサンプリングによるベイズ推定など、関数の微分を利用する計算においては、ＥＭＬＣが有利であることが分かる。

　図１１は、実際に測定された測定データＭＤに対して、ＥＭＬＣをモデル関数とした場合、および、比較例としてＥＭＧ・ＢＥＭＧをモデル関数とした場合で、フィッティング結果を比較した図である。測定データＭＤは、一次代謝物の標品に関するクロマトグラムであり、図１１は、標品の面積定量（最大ピーク高さを１とする。）と、各モデル関数の面積定量との平均二乗誤差示すヒストグラムである。図１１に示すように、二乗誤差が０に近い領域で、ＥＭＬＣのヒストグラムは高い値を示している。このように、ＥＭＬＣが、ＥＭＧ・ＢＥＭＧと比べて高い精度でフィッティングができていることが分かる。

　数１式で示すＥＭＬＣ関数および数２式で示す正規化されたＥＭＬＣ関数の求め方について説明する。数３式に示すｆ（ｘ，ａ，ｂ）は、シグモイド関数を定数倍した式に、定数が加算されている。

　数３式で示すｆ（ｘ，ａ，ｂ）を積分した結果は、数４式に示すｇ（ｘ，ａ，ｂ）となる。つまり、数４式は、数１式中のｇ（ｘ，ａ，ｂ）を示す。つまり、ｇ（ｘ，ａ，ｂ）は、ＥＭＬＣ関数の対数関数であり、上に凸の形状を有している。

　より好ましくは、テーリング・リーディングパラメータがピーク位置・高さ・面積・幅などのピーク特徴量に大きな影響を与えない方がよい。このような条件は、標準的なテーリング・リーディング形状を有するクロマトグラムへのフィッティングにおいて共線性を小さくする。そこで、ｅｘｐ（ｇ（ｘ，ａ，ｂ））のピーク位置・高さが解析的に求まることから、それらを正規化した関数ｇｇ（ｘ，ａ，ｂ）を用いることが望ましい。数５式は、ｇ（ｘ，ａ，ｂ）を正規化した関数ｇｇ（ｘ，ａ，ｂ）を示す。ピーク位置・高さの代わりに、重心などの別のピーク特徴量を用いて正規化してもよい。

　関数ｇｇ（ｘ，ａ，ｂ）の面積Ｎｓ（ａ，ｂ）は、数６式で近似されることが経験的に求められる。

　数５式において、ｘをＮｓ（ａ，ｂ）倍する補正をすることで、面積を一定にするようにピーク幅を補正してピーク形状を正規化する。正規化後の関数は、数７式となる。なお、面積の代わりに、半値幅に関して経験的に求められる式、あるいは機械学習により得られる式により補正を行ってもよい。数７式は、数２式中のｈ（ｘ，ａ，ｂ）を示す。より、好ましくは、浮動小数点演算時の桁落ちを防ぐために、数６式で示したように、ベータ関数βを変形したｌｏｇβを用いることができる。

　ＥＭＧ，ＢＥＭＧなどのモデル関数が、関数最適化またはベイズ推定に用いられる場合、例えばテーリングパラメータの大きさによってピーク位置やピーク幅が変動する。これらのモデル関数では、パラメータ間の関係が強いため、二乗誤差の変化量は小さいにも関わらず、複数のパラメータを大きく変化させなければ目的となる形状に関数をフィットさせることができないという問題がある。特に、パラメータの関係性の強さが、パラメータの状態によって異なる場合は、勾配法ベースの最適化におけるモーメンタム項の設定等が困難になる。クロマトグラムの２つのピークが隣接している場合、あるいは、ノイズが大きい場合などにおいて、ＢＥＭＧ関数に対して、関数最適化またはベイズ推定等のモデル関数の微分を用いる手法が用いられる場合、局所解に落ちやすくなることが経験的に知られている。これに対して、本実施の形態におけるＥＭＬＣ関数は、パラメータ間の共線性が抑制されており、関数最適化またはベイズ推定に都合がよい。

　また、ＥＭＧ，ＢＥＭＧなどのモデル関数は、ピーク位置、半値幅といった人間が解釈し易い態様でパラメータが表現されていないため、利用者にとってモデル関数の理解が難しいという問題がある。これに対して、本実施の形態のＥＭＬＣ関数は、正規化により、利用者にとって理解し易い形式に変形される。また、ＥＭＧ，ＢＥＭＧなどのモデル関数は、ｅｘｐとｅｒｆｃとの乗算があり、ピーク裾部分の演算では０に近い値と∞に近い値が乗算され、微小な値が結果として得られる。このため、桁落ち等の精度低下が生じるため、裾部分では別途関数を用意する必要があり、計算が困難である。これに対して本実施の形態のＥＭＬＣ関数は、上述したように正規化により計算による桁落ちを防ぐことができる。

　（５）第３の実施の形態
　次に、第３の実施の形態に係るモデル関数フィッティング方法について説明する。図１２は、第３の実施の形態および第４の実施の形態において対象とされるクロマトグラムＣ２を示す。図１２において横軸は時間、縦軸は強度（検出値）である。図に示すように、ピーク高さは強度１．０に正規化されている。クロマトグラムＣ２には、テーリングが発生している。図１３は、図１２に示すクロマトグラムＣ２の対数ＬＣ２を示す図である。図１３に示すように、クロマトグラムＣ２の対数ＬＣ２は、２次関数に近似できる第１部Ａ１と、第１部Ａ１の両側に１次関数に近似できる第２部Ａ２，Ａ２を有している。ただし、対数ＬＣ２には、第２部Ａ２の外側の領域に、２次微分が正となる領域である第３部Ａ３が存在している。第３部Ａ３は、クロマトグラムＣ２に生じているテーリングに起因する。このように、第３の実施の形態のモデル関数は、モデル関数の対数関数が多くの部分において上に凸であるという制約を有しているが、一部の領域について、その制約からの逸脱が許容される。

　このようなクロマトグラムＣ２に対しては、第１および第２の実施の形態において説明した手法では、精度のよいフィッティングが難しい。そこで、フィッティング部２２は、２次差分が非正である関数（以下、元関数と呼ぶ）に対して、指数関数よりも滑らかな変換関数を適用させることにより得られる関数をモデル関数として、クロマトグラムＣ２にフィッティングする。

　（５－１）ガンマ補正関数を用いた変換関数
　フィッティング部２２は、元関数に適用させる変換関数として、例えば、指数関数とガンマ補正関数の合成関数を用いる。元関数をＢ（ｔ）、ガンマ補正関数をＧ、指数関数をｅｘｐとすると、変換関数は、ｅｘｐ（Ｇ（＊））で表される。数８式は、変換関数に用いられるガンマ補正関数の例である。

　数８式において、パラメータｑは、０以上の定数である。パラメータｑの値が大きい程、クロマトグラム強度が微小な範囲でのみガンマ補正の効果が得られる。パラメータｐは、通常１以下の値をとり、逸脱を許す正の値の範囲が設定される。パラメータｒは、ピーク幅を調整するためのパラメータである。

　図１４において、実線は、元関数Ｂ（ｔ）に変換関数ｅｘｐ（Ｇ（＊））が適用されたクロマトグラムＣ３を示す。変換関数ｅｘｐ（Ｇ（＊））には、数８式において、ｐ＝０．５，ｑ＝１，ｒ＝４としたガンマ補正関数Ｇが用いられている。図１４において、破線は、変換関数を適用せず、元関数に指数関数を適用させたクロマトグラムＣ４を示す。クロマトグラムＣ３，Ｃ４では、同じ元関数が用いられている。つまり、クロマトグラムＣ３は、ｅｘｐ（Ｇ（Ｂ（ｔ）））で表され、クロマトグラムＣ４はｅｘｐ（Ｂ（ｔ））で表される。図１５において、実線は、クロマトグラムＣ３の対数ＬＣ３を示し、破線は、クロマトグラムＣ４の対数ＬＣ４を示す。対数ＬＣ４が、２次微分が非正であるという制約下にあるのに対して、対数ＬＣ３では、ピークから離れる領域において２次微分が非正であるという制約から逸脱していることが分かる。このように、第３の実施の形態のモデル関数は、その対数関数の一部の領域について、２次微分が非正であるという制約からの逸脱が許容される。これにより、リーディング、テーリングが生じているようなクロマトグラムに対しても高精度なフィッティングが可能である。

　（５－２）多項式を用いた変換関数
　変換関数の別の例として、多項式を用いることもできる。数９式は、変換関数Ｑとして多項式を用いた例である。数９式のｘには、元関数の値が入力される。例えば、元関数がＢ（ｔ）＝－ｔ＾２である場合、数９式のｘには、－ｔ＾２を入力することで、変換関数が適用されたクロマトグラムが得られる。

　図１６において、実線は、元関数に数９式で示す変換関数が適用されたクロマトグラムＣ５を示す。図１６において、破線は、変換関数を適用せず、元関数に指数関数を適用させたクロマトグラムＣ６を示す。クロマトグラムＣ５，Ｃ６では、同じ元関数が用いられている。図１７において、実線は、クロマトグラムＣ５の対数ＬＣ５を示し、破線は、クロマトグラムＣ６の対数ＬＣ６を示す。対数ＬＣ６が、２次微分が非正であるという制約下にあるのに対して、対数ＬＣ５では、ピークから離れる領域において２次微分が非正であるという制約から逸脱していることが分かる。

　多項式を用いた変換関数Ｑ（ｘ）は、例えば、数１０式に示すような一般式を用いることができる。つまり、変換関数Ｑ（ｘ）は、分母にｎ次の多項式を含む関数によって表される。

　（５－３）ｃｏｓｈ関数を用いた変換関数
　変換関数の別の例として、ｃｏｓｈ関数を用いることもできる。数１１式は、変換関数Ｑとして、ｃｏｓｈ関数を用いた例である。数１１式において、ｕは、ピーク幅調整用のパラメータである。このように、変換関数Ｑ（ｘ）は、分母にｃｏｓｈ関数を含む関数で表される。

　図１８において、実線は、元関数に数１１式で示す変換関数が適用されたクロマトグラムＣ７を示す。図１８で示すクロマトグラムは、数１１式において、ｕ＝１．５とした図である。図１８において、破線は、変換関数を適用せず、元関数に指数関数を適用させたクロマトグラムＣ８を示す。クロマトグラムＣ７，Ｃ８では、同じ元関数が用いられている。図１９において、実線は、クロマトグラムＣ７の対数ＬＣ７を示し、破線は、クロマトグラムＣ８の対数ＬＣ８を示す。対数ＬＣ８が、２次微分が非正であるという制約下にあるのに対して、対数ＬＣ７では、ピークから離れる領域において２次微分が非正であるという制約から逸脱していることが分かる。

　以上変換関数の例として、ガンマ補正関数、多項式またはｃｏｓｈ関数を利用する場合を例に説明した。これら関数は例示であり、変換関数としては、指数関数よりも緩やかな傾きを有する単調な関数を用いることができる。

　（６）第４の実施の形態
　次に、第４の実施の形態に係るモデル関数フィッティング方法について説明する。第４の実施の形態のモデル関数も、第３の実施の形態と同様、モデル関数の対数関数が多くの部分において上に凸であるという制約を有しているが、一部の領域について、その制約からの逸脱が許容される。第４の実施の形態においては、時間を歪ませることにより、この制約からの逸脱を許容する。フィッティング部２２は、時間歪み関数に対してＧＡＭモデルを適用させることにより、クロマトグラムにモデル関数をフィッティングする。

　時間ｔを歪ませる関数をｍ（ｔ）で表す。例えば、ｅｘｐ（－ｔ＾２）で表されるクロマトグラムに対して、ｍ（ｔ）による時間歪みを適用させると、そのクロマトグラムは、ｅｘｐ（－ｍ（ｔ）＾２）で表される。例えば、図２０で示されるような対数クロマトグラムＬＣ９を考える。図２０において、実線は、対数クロマトグラムＬＣ９のシミュレーションデータである。対数クロマトグラムＬＣ９に対して、図２１で示されるようなスプラインをＧＡＭによりフィッティングさせた場合、各特徴点の強度は、図２２のようになる。これに対して、時間歪み関数ｍ（ｔ）にスプラインをフィッティングさせた場合、各特徴点の強度値は、図２３のようになる。時間歪み関数ｍ（ｔ）は、直線に近い形状であるので、ＧＡＭとの相性がよい。図２３に示すように、時間歪み関数ｍ（ｔ）は、ｍ（ｔ）＝ｔと比べると、ピークから離れた領域において、その傾きが緩やかとなっている。図２３の例では、ピークに対する右側のテーリング部分の時間を歪ませた例である。逆にピークに対する左側のリーディング部分の時間を歪ませる場合には、時間歪み関数ｍ（ｔ）は、リーディング部分に対応する時間の傾きが緩やかとなるよう歪まされる。時間歪み関数ｍ（ｔ）にＧＡＭを適用させた結果のフィッティング結果を、図２０の破線で示す。

　ここで、２次微分が非正であるという制約は、時間歪み関数ｍ（ｔ）が適用された対数クロマトグラムに対して与えてもよいし、時間歪み関数ｍ（ｔ）に適用させてもよい。例えば、ｅｘｐ（－ｔ＾２）で表されるクロマトグラムに対して、時間歪み関数ｍ（ｔ）を適用させる場合を考える。このとき対数クロマトグラムは、－ｍ（ｔ）＾２となる。対数クロマトグラム－ｍ（ｔ）＾２の２次微分が非正であるとの制約は、数１２式で表される。

　数１２式で表される制約を最適化アルゴリズムとして実装させてもよいが、計算量が多くなる。そこで、計算量を削減するためには、時間歪み関数ｍ（ｔ）に制約を与えることを考える。時間歪み関数ｍ（ｔ）は、ピーク中心から離れるほど傾きが小さくなる、つまり、ｍ（ｔ）の１次微分の値が小さくなる。この制約を用いることにより、単蜂制限と同等の制約を与えることができる。この制約は、連続に並ぶ特徴点をｔｎとして、数１３式で表される。

　数１３式では、下限が０となっているが、実際のクロマトグラムのモデル関数や、２次微分が非正であるＧＡＭモデルを満たす関数は、下限が０となることはなく、経験的にある値の範囲となる。そこで、下限を０より大きく、１より小さい経験的に得られる値に設定してもよい。また、ＧＡＭモデルを用いる場合、スプラインで規定される関数しか表現できないため、微細な系統誤差が残る。そのため、テーリングのない波形に単純にフィッティングした場合であっても、図２４に示すような係数の振動が起きる場合がある。このような係数の振動を許容するために、数１３式において、上限が１を超える場合も許容してもよい。この許容範囲は、モデル関数の系統誤差とＧＡＭを用いるピーク幅（特徴点数・スプライン次元）によって経験的に求めることが望ましい。経験的に求められる下限をＣａ、上限をＣｂとすると、数１３式の制約は、数１４式のように表される。

　このように、第４の実施の形態のモデル関数は、モデル関数の対数関数が多くの部分において上に凸であるという制約を有しているが、元関数の時間を歪ませることにより、一部の領域について、その制約からの逸脱が許容される。これにより、より精度の高いモデル関数のフィッティングが可能となる。

　（７）プログラムの処理の流れ
　図２５は、プログラムＰ１により実行される第１および第２の実施の形態のモデル関数フィッティング方法を示すフローチャートである。つまり、図１２は、ＣＰＵ１１により実行されるフローチャートである。まず、ステップＳ１において、取得部２１が、測定データＭＤを取得する。測定データＭＤは、例えば液体クロマトグラフにより取得されたクロマトグラムである。

　次に、ステップＳ２において、フィッティング部２２は、モデル関数に対して、モデル関数の対数関数が２次関数で近似できる第１部と、第１部の両側に位置し１次関数で近似できる第２部とを有するという制約を与えた上で、クロマトグラムにモデル関数をフィッティングする。ステップＳ２において、第１の実施の形態では、２次差分が非正であるという制約を与えたモデル関数を用いる。ステップＳ２において、第２の実施の形態では、シグモイド関数を定数倍したものに定数加算したものを積分した関数を、モデル関数の対数関数として用いる。

　図２６は、プログラムＰ１により実行される第３および第４の実施の形態のモデル関数フィッティング方法を示すフローチャートである。つまり、図２６は、ＣＰＵ１１により実行されるフローチャートである。まず、ステップＳ１１において、取得部２１が、測定データＭＤを取得する。測定データＭＤは、例えば液体クロマトグラフにより取得されたクロマトグラムである。

　次に、ステップＳ１２において、フィッティング部２２は、モデル関数に対して、モデル関数の対数関数が２次関数で近似できる第１部と、第１部の両側に位置し１次関数で近似できる第２部とを有するという制約を与えた上で、クロマトグラムにモデル関数をフィッティングする。ステップＳ１２において、第３の実施の形態では、フィッティング部２２は、２次差分が非正である元関数に対して、指数関数よりも滑らかな変換関数を適用させることにより得られるモデル関数をクロマトグラムにフィッティングする。ステップＳ２において、第４の実施の形態では、フィッティング部２２は、２次差分が非正である元関数に対して、時間を歪ませることにより、２次差分が非正である制約からの逸脱を許容させたモデル関数をクロマトグラムにフィッティングする。

　（８）変形例
　第１の実施の形態において、一般化加法モデルとして平滑化スプラインモデルを利用した。第１の実施の形態の変形例として、スプライン以外にもベジエやガウス関数などを利用することもできる。

　第１の実施の形態では、２次差分が非正であるという制約に、一般化加法モデルを適用させた手法（ＤＧＡＭ）を用いた。変形例として、ＤＧＡＭを用いるときの初期値として第２の実施の形態におけるＥＭＬＣ関数を用いてもよい。ＤＧＡＭは、パラメータ数が比較的多いが、ＥＭＬＣ関数を初期値として利用することで、初期状態から有効な制約を与えることができる。

　第３の実施の形態においては、変換関数として、ガンマ補正関数を用いる例、多項式を用いる例、ｃｏｓｈ関数を用いる例を説明したが、変換関数としては、これら関数の和、積または合成関数が用いられてもよい。第３および第４の実施の形態においては、対数クロマトグラムの２次微分が非正という制約に対して、一部の逸脱を許可する方法を説明した。別の方法として、この制約を直接的に経験的な方法により緩和させてもよい。例えば、ユーザが逸脱を許可するパラメータを経験的に設定してもよいし、最適化問題を解くにあたって正となる値の和もしくはその累乗をペナルティ項として設定してもよい。

　（９）態様
　上述した複数の例示的な実施の形態は、以下の態様の具体例であることが当業者により理解される。

（第１項）
　一態様に係るモデル関数フィッティング装置は、
　クロマトグラムを取得する取得部と、
　モデル関数に対して、前記モデル関数の対数関数が２次関数で近似できる第１部と、前記第１部の両側に位置し１次関数で近似できる第２部とを有するという制約を与えた上で、前記クロマトグラムに前記モデル関数をフィッティングするフィッティング部と、を備える。

　精度の高いフィッティングが可能である。

（第２項）
　第１項に記載のモデル関数フィッティング装置において、
　前記フィッティング部は、前記モデル関数に前記対数関数の２次差分が非正であるという制約を与えてもよい。

　モデル関数のパラメータ数が多い場合であっても、モデル関数に有効な制約を与えることができる。

（第３項）
　第２項に記載のモデル関数フィッティング装置において、
　前記フィッティング部は、一般化加法モデルを用いることにより前記クロマトグラムに前記モデル関数をフィッティングしてもよい。

　モデル関数のパラメータ数の削減を行い、最適化計算の安定性を高くすることができる。

（第４項）
　第２項または第３項に記載のモデル関数フィッティング装置において、
　１つのピークまたは複数のピークの面積算出に用いられてもよい。

　測定データに対して精度の高い定量・定性を行うことができる。

（第５項）
　第２項または第３項に記載のモデル関数フィッティング装置において、
　前記モデル関数の初期値として、前記モデル関数の前記対数関数が、シグモイド関数を定数倍したものに定数加算したものを積分した関数を用いてもよい。

　モデル関数のパラメータ数が多い場合であっても、初期値として有効な制約を与えることができる。

（第６項）
　第１項に記載のモデル関数フィッティング装置において、
　前記フィッティング部は、前記モデル関数の前記対数関数が、シグモイド関数を定数倍したものに定数加算したものを積分した関数を用いてもよい。

　モデル関数にクロマトグラムにフィッティングさせるための有効な制約を与えることができる。

（第７項）
　第６項に記載のモデル関数フィッティング装置において、
　前記モデル関数は、さらに、ピーク高さおよびピーク位置を正規化した関数であってもよい。

　利用者にとって解釈のし易い形式となり、モデル関数が扱い易い。

（第８項）
　第７項に記載のモデル関数フィッティング装置において、
　前記モデル関数は、さらに、ピーク幅をベータ関数および指数関数を含む式で補正した関数であってもよい。

（第９項）
　第１項に記載のモデル関数フィッティング装置において、
　前記フィッティング部は、２次差分が非正である元関数に対して、指数関数よりも緩やかな傾きを有する変換関数を適用させることにより得られる前記モデル関数を前記クロマトグラムにフィッティングしてもよい。

　対数クロマトグラムの２次微分が非正であるという制約を一部において逸脱させることで、高精度なフィッティングが可能である。

（第１０項）
　第９項に記載のモデル関数フィッティング装置において、
　前記変換関数は、ガンマ補正関数と指数関数との合成関数を含んでもよい。

　ガンマ補正関数により、２次微分が非正であるという制約に対する逸脱を許すことができる。

（第１１項）
　第９項に記載のモデル関数フィッティング装置において、
　前記変換関数は、分母にｎ次の多項式を有する関数を含んでもよい。

　多項式を含む変換関数により、２次微分が非正であるという制約に対する逸脱を許すことができる。

（第１２項）
　第９項に記載のモデル関数フィッティング装置において、
　前記変換関数は、分母にｃｏｓｈ関数を有する関数を含んでもよい。

　ｃｏｓｈ関数を含む変換関数により、２次微分が非正であるという制約に対する逸脱を許すことができる。

（第１３項）
　第１項に記載のモデル関数フィッティング装置において、
　前記フィッティング部は、２次差分が非正である元関数に対して、時間を歪ませることにより、２次差分が非正である制約からの逸脱を許容させた前記モデル関数を前記クロマトグラムにフィッティングしてもよい。

（第１４項）
　他の態様に係るモデル関数フィッティング方法は、
　クロマトグラムを取得する工程と、
　モデル関数に対して、前記モデル関数の対数関数が２次関数で近似できる第１部と、前記第１部の両側に位置し１次関数で近似できる第２部とを有するという制約を与えた上で、前記クロマトグラムに前記モデル関数をフィッティングする工程と、を備える。

　精度の高いフィッティングが可能である。

（第１５項）
　第１４項に記載のモデル関数フィッティング方法において、
　前記フィッティングする工程は、前記モデル関数に前記対数関数の２次差分が非正であるという制約を与えてもよい。

（第１６項）
　第１４項に記載のモデル関数フィッティング方法において、
　前記フィッティングする工程は、前記モデル関数の前記対数関数が、シグモイド関数を定数倍したものに定数加算したものを積分した関数を用いてもよい。

（第１７項）
　第１４項に記載のモデル関数フィッティング方法において、
　前記フィッティングする工程は、２次差分が非正である元関数に対して、指数関数よりも緩やかな傾きを有する変換関数を適用させることにより得られる前記モデル関数を前記クロマトグラムにフィッティングしてもよい。

（第１８項）
　第１４項に記載のモデル関数フィッティング方法において、
　前記フィッティングする工程は、２次差分が非正である元関数に対して、時間を歪ませることにより、２次差分が非正である制約からの逸脱を許容させた前記モデル関数を前記クロマトグラムにフィッティングしてもよい。

Claims

クロマトグラムを取得する取得部と、
　モデル関数に対して、前記モデル関数の対数関数が２次関数で近似できる第１部と、前記第１部の両側に位置し１次関数で近似できる第２部とを有するという制約を与えた上で、前記クロマトグラムに前記モデル関数をフィッティングするフィッティング部と、を備えるモデル関数フィッティング装置。
前記フィッティング部は、前記モデル関数に前記対数関数の２次差分が非正であるという制約を与える、請求項１に記載のモデル関数フィッティング装置。
　前記フィッティング部は、一般化加法モデルを用いることにより前記クロマトグラムに前記モデル関数をフィッティングする、請求項２に記載のモデル関数フィッティング装置。
１つのピークまたは複数のピークの面積算出に用いられる、請求項２または請求項３に記載のモデル関数フィッティング装置。
前記モデル関数の初期値として、前記モデル関数の前記対数関数が、シグモイド関数を定数倍したものに定数加算したものを積分した関数を用いる、請求項２または請求項３に記載のモデル関数フィッティング装置。
前記フィッティング部は、前記モデル関数の前記対数関数が、シグモイド関数を定数倍したものに定数加算したものを積分した関数を用いる、請求項１に記載のモデル関数フィッティング装置。
前記モデル関数は、さらに、ピーク高さおよびピーク位置を正規化した関数である、請求項６に記載のモデル関数フィッティング装置。
前記モデル関数は、さらに、ピーク幅をベータ関数および指数関数を含む式で補正した関数である、請求項７に記載のモデル関数フィッティング装置。
前記フィッティング部は、２次差分が非正である元関数に対して、指数関数よりも緩やかな傾きを有する変換関数を適用させることにより得られる前記モデル関数を前記クロマトグラムにフィッティングする、請求項１に記載のモデル関数フィッティング装置。
前記変換関数は、ガンマ補正関数と指数関数との合成関数を含む、請求項９に記載のモデル関数フィッティング装置。
前記変換関数は、分母にｎ次の多項式を有する関数を含む、請求項９に記載のモデル関数フィッティング装置。
前記変換関数は、分母にｃｏｓｈ関数を有する関数を含む、請求項９に記載のモデル関数フィッティング装置。
前記フィッティング部は、２次差分が非正である元関数に対して、時間を歪ませることにより、２次差分が非正である制約からの逸脱を許容させた前記モデル関数を前記クロマトグラムにフィッティングする、請求項１に記載のモデル関数フィッティング装置。
クロマトグラムを取得する工程と、
　モデル関数に対して、前記モデル関数の対数関数が２次関数で近似できる第１部と、前記第１部の両側に位置し１次関数で近似できる第２部とを有するという制約を与えた上で、前記クロマトグラムに前記モデル関数をフィッティングする工程と、を備えるモデル関数フィッティング方法。
前記フィッティングする工程は、前記モデル関数に前記対数関数の２次差分が非正であるという制約を与える、請求項１４に記載のモデル関数フィッティング方法。
前記フィッティングする工程は、前記モデル関数の前記対数関数が、シグモイド関数を定数倍したものに定数加算したものを積分した関数を用いる、請求項１４に記載のモデル関数フィッティング方法。
前記フィッティングする工程は、２次差分が非正である元関数に対して、指数関数よりも緩やかな傾きを有する変換関数を適用させることにより得られる前記モデル関数を前記クロマトグラムにフィッティングする、請求項１４に記載のモデル関数フィッティング方法。
前記フィッティングする工程は、２次差分が非正である元関数に対して、時間を歪ませることにより、２次差分が非正である制約からの逸脱を許容させた前記モデル関数を前記クロマトグラムにフィッティングする、請求項１４に記載のモデル関数フィッティング方法。