JP2000508771A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2000508771A5 JP2000508771A5 JP1997537268A JP53726897A JP2000508771A5 JP 2000508771 A5 JP2000508771 A5 JP 2000508771A5 JP 1997537268 A JP1997537268 A JP 1997537268A JP 53726897 A JP53726897 A JP 53726897A JP 2000508771 A5 JP2000508771 A5 JP 2000508771A5
- Authority
- JP
- Japan
- Prior art keywords
- chromatogram
- standard
- sample
- chromatograms
- variation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000203 mixture Substances 0.000 description 62
- 238000004587 chromatography analysis Methods 0.000 description 26
- 239000011159 matrix material Substances 0.000 description 23
- 230000014759 maintenance of location Effects 0.000 description 22
- 230000000875 corresponding Effects 0.000 description 14
- 238000010828 elution Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 238000002835 absorbance Methods 0.000 description 10
- 239000003643 water by type Substances 0.000 description 10
- 239000007787 solid Substances 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 238000000034 method Methods 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- 238000000513 principal component analysis Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000010192 crystallographic characterization Methods 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000004451 qualitative analysis Methods 0.000 description 3
- 238000003908 quality control method Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000002253 acid Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000002708 enhancing Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006011 modification reaction Methods 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 150000007523 nucleic acids Chemical class 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000002104 routine Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000010959 steel Substances 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 230000003442 weekly Effects 0.000 description 1
Description
【発明の詳細な説明】
【0001】
【著作権について】
【0002】
本特許文書の開示内容の一部は、著作権保護の対象となる。しかし、著作権者は、米国特許商標庁の特許ファイル又は特許記録に存在しているままの形態であるならば、本特許文書または本特許開示内容のファクシミリによる複製を認める。
【0003】
【発明の分野】
本発明は、一般にはクロマトグラムの分析に関する。さらに詳細には、本発明は、これに限定されるのではないが、クロマトグラフィ分析の精度を向上させるためにクロマトグラフ変動(chromatographic variability)を決定することに関する。
【0004】
【発明の背景】
クロマトグラフィは、多成分物質の分析に広く使用されている手法である。クロマトグラフィでは、既知が組成又は未知である液体やガスがクロマトグラフに注入され、クロマトグラフからは、二次元グラフの形状を有するクロマトグラムが生じる。このクロマトグラムでは、注入した液体の吸光率、注入したガスの導電率又はそれ以外の物理的応答が時間に対してプロットされる。液体又はガスがクロマトグラフを通るときの時間経過に対する液体の吸光率又はガスの導電率の変化が、液体混合物又はガス混合物の組成を表している。
【0005】
クロマトグラフィの通常の用途としては、製造された物質を分析して組成を確認するという品質管理、および未知物質からのクロマトグラムを生成させて該物質の組成を分析・決定するという定性分析と定量分析がある。品質管理での用途においては、既知物質と所望物質のクロマトグラムを生成させ、これらを製造物質のクロマトグラムと比較する。定性・定量分析での用途においては、未知物質の1つ以上のクロマトグラムを生成させ、成分の同定を行うか、あるいは物質中の各成分の量を定量する。
【0006】
上記用途のいずれも、クロマトグラムを解析して、他のクロマトグラムとの類似性又は相違性を決定しなければならない。一般にこのような解析では、あるクロマトグラムと他のクロマトグラムとの間で、ピークの保持時間、高さ、及び面積を含めて、ピークを解析・比較する必要がある。このような比較を行うためには、比較しようとするピークを識別する方法を開発して最適化しなければならず、次いでクロマトグラムのピークおよび上記の他の識別状況を比較する方法を開発しなければならない。主成分分析(Principal Component Analysis; PCA)はこのような方法の1つであり、G. MalmquistとR. Danielssonによる「Alignment of Chromatographic Profiles for Principal Component Analysis: A Prerequisite for Fingerprinting Methods”,Journal of Chromatography A,687(1994)71-88」に記載されている。MalmquistとDanielssonが説明しているように、対応するクロマトグラムを整列させるのに、選定されたピークの保持時間が使用されている。クロマトグラムが整列したら、吸光度を比較する。他の方法が、J.P.Masonらによる「“A Novel Algorithm for Chromatogram Matching in Qualitative Analysis”,Journal of High Resolution Chromatography,v. 15,pp. 539-547(August 1992)」に記載されており、ピークの高さ、面積、及び保持時間だけを比較する自動化されたクロマトグラフィマッチング法(chromatographic matching technique)が説明されている。
【0007】
更に、クロマトグラフィ分析では、クロマトグラフによって生じる変動(例えば、ベースラインのドリフト、保持時間の変動、濃度の変化など)を考慮しなければならない。クロマトグラフによって生じるこうした変動は、クロマトグラフによって生成されるクロマトグラムにおける変動として現れ、このような幾つかの変動を考慮した解析が必要となるために分析をより複雑にする。MalmquistとDanielssonによる上記報文においては、PCAによるクロマトグラフィ分析を強化するというやり方でクロマトグラフ変動を補償する方法が説明されている。
【0008】
クロマトグラフィ分析の公知の方法(例えば、MalmquistとDanielssonによって説明されている方法)は一般に、比較しようとするピークを識別する方法を規定する工程、ピークの種々のアスペクトを比較する方法を規定する工程、そしてクロマトグラフ変動の影響を考慮しつつ実際に比較を行う工程を必要とする。コンピューター化された方法(例えば、Masonにより説明されている方法)はこのような作業を行うのに有効であるが、公知の多くの方法は、依然として時間がかかりすぎであり、場合によっては単調で退屈であり、高度に訓練した作業者の技能を必要とする。
【0009】
従って、本発明の目的は、クロマトグラフ変動を補償する際に、従来の方法で必要とされたピークやそれ以外の外形の特徴付けを必要とせずにクロマトグラフィ分析を行うシステムを提供することである。
【0010】
【発明の概要】
本発明の主要な目的によれば、クロマトグラフィ分析システムは、クロマトグラフ変動を特徴付けるクロマトグラム整合手順(chromatogram alignment procedure)を使用する。本発明の他の目的によれば、クロマトグラフィ分析システムは、特徴付けされたクロマトグラフ変動をクロマトグラムの比較において用いる。本発明のクロマトグラフィ分析システムは、複数のクロマトグラムをパターンとして比較するのであって、ピークの特徴付けや付随しているピークのリフトオフポイント(lift-off point)やピークのタッチダウンポイント(touch down points)の識別を必要としない。さらに、ピークの高さ、面積、又は保持時間を算出する必要がない。本明細書で言う「特徴付け」とは、問題としているピークのリフトポイントやタッチダウンポイントの識別によってベースラインを明確化すること、および実際にピークの積分を行うこと、を必要とするピーク積分のプロセスを表しているものとする。本発明のクロマトグラフィパターン分析システムは、アイソクラチッククロマトグラフィ分離又は勾配クロマトグラフィ分離によって得られるクロマトグラムに適用することができる。アイソクラチッククロマトグラフィでは、クロマトグラフィ分離の全体にわたって溶媒の組成を一定に保持する。勾配クロマトグラフィでは、化合物の保持時間に対する制御を高めるために、溶媒の組成を所定の仕方にしたがって変化させる。
【0011】
本発明の原理にしたがって機能するクロマトグラフィ分析システムは、第1の態様においては、標準クロマトグラムとサンプルクロマトグラムとの差を決定する。標準クロマトグラムは、選定された溶離時間範囲にわたる標準クロマトグラムを示している一組の標準データポイントによって表され、またサンプルクロマトグラムは、同じ溶離時間範囲又は一定量の分だけオフセットされた溶離時間範囲にわたるサンプルクロマトグラムを示している一組のサンプルデータポイントによって表される。標準データポイントとサンプルデータポイントとは、それぞれが、個々のクロマトグラムを一定の割合でサンプリングすることによって得られる。本発明のクロマトグラフィ分析システムは、次に、標準データポイントから複数組のクロマトグラフ変動データポイントを生成する。クロマトグラフ変動データポイントの各組は、標準クロマトグラムに及ぼす所定のクロマトグラフ変動源の影響を示す。更に、本発明のシステムは、修正された標準データポイントの組を生成するのであるが、この修正された標準データポイントは、クロマトグラフ変動データポイントの関数として修正された標準データポイントに対応し、前記クロマトグラムを生成するクロマトグラフのクロマトグラフ変動をモデル化するものである。
【0012】
本発明によるシステムでは、同じ混合物から得られた標準クロマトグラムとサンプルクロマトグラムとを使用して、クロマトグラフ変動を決定することができる。さらに、本発明のシステムを使用して、別の又は未知の混合物からの標準クロマトグラムとサンプルクロマトグラムとの間の類似性又は相違性を決定することができる。このような比較をしやすくするために、本発明のシステムは、第2に態様において、標準クロマトグラムとサンプルクロマトグラムとの間の相違を示す残差値(residue values)を生成する。同じ混合物の標準クロマトグラムとサンプルクロマトグラムとの比較から得られる残差値を、異なった混合物の標準クロマトグラムとサンプルクロマトグラムとの比較から得られる残差値と比較して、サンプルクロマトグラムに対応する混合物と標準クロマトグラムに対応する混合物が同じ混合物であるか又は異なった混合物であるかを決定することができる。
【0013】
標準クロマトグラムから得られるクロマトグラフ変動データポイントにより、クロマトグラフ変動の影響によってのみ標準クロマトグラムとは異なる可能なクロマトグラムの広い範囲を示すよう、標準クロマトグラムを修正することができる。
【0014】
本発明のシステムは、サンプルクロマトグラムに最もよく整合するモデルクロマトグラムを見いだすのに、標準クロマトグラムから誘導されるクロマトグラフ変動データポイントを使用する。この意味において、本発明のシステムは、標準クロマトグラムを修正することによってサンプルに現れるクロマトグラフィ一変動性を測定する。
【0015】
クロマトグラフ変動データポイントの関数として生成されるスケールファクター(この「最良適合(best-fit)」モデルクロマトグラムを表している)は、標準クロマトグラムとサンプルクロマトグラムとの間のクロマトグラフ変動の1つの尺度である。モデルクロマトグラムとサンプルクロマトグラムとの間の差違がもう一つの尺度である。これらはいずれも、サンプルクロマトグラムと整合する標準クロマトグラムに基づいてモデルクロマトグラムを得るのに、標準クロマトグラムにどの程度の変動性を加えるべきか(クロマトグラフ変動データポイントを使用することにより)を本発明のシステムが決定する、という意味においてクロマトグラフ変動の好ましい尺度である。
【0016】
標準クロマトグラムから誘導されるクロマトグラフ変動データポイントは、各標準クロマトグラムに対して1回だけ生成させればよく、標準クロマトグラムと複数のサンプルクロマトグラムとの間の変動性を決定する際に、繰り返し使用することができる。
【0017】
上記にて要約されている原理にしたがって機能する実施態様は、該クロマトグラムの特定のピーク又は他の特徴を識別あるいは特性表示する必要なく、クロマトグラフ変動の正確な決定を有利な形でもたらす。クロマトグラムが同一又は類似の混合物からのものである場合は、ベースラインのドリフトによるクロマトグラフ変動、保持時間の変動、および濃度変化を測定し、該クロマトグラムの特定の特徴に関係なく、またクロマトグラフのさらなるキャリブレーションや、該混合物への基準化合物の付加を行わずに除外する。好ましい実施態様においては、本発明のクロマトグラフィ分析システムは、濃度の変化、保持時間の片寄り、保持時間の伸び、ベースラインの片寄り、およびベースラインの勾配によるクロマトグラフ変動を除去する。他の実施態様においては、本発明のシステムは、上記変動源の異なったサブセットのクロマトグラフ変動において、上記変動源のうちの1つのみによるクロマトグラフ変動を除去する。
【0018】
本発明のこれらの特徴と利点および他の特徴と利点は、本発明の特定の好ましい実施態様についての下記の詳細な説明を考察することによって、より理解を深めることができる。下記の説明においては、添付の図面を参照しつつ説明する。
【0019】
【詳細な説明】
図1は、高圧液体クロマトグラフィ(HPLC)システム102からのデータを受け取るように結合された好適なクロマトグラフィパターン分析システム(CPAS)100の概略図を示している。このようなシステムは、米国マサチューセッツ州ミルフォード01757のウォーターズ・コーポレーション(Waters Corporation)から市販されており、ウォーターズ626(WatersTM 626)という商品名のポンプを含み、このポンプは、インジェクタとカラムと検出器とを通して溶媒を廃棄ボトルに継続的にポンプ送りする。このようなシステムは、高分解能のタンパク質精製、ヘプチドのマッピング、核酸の単離、オリゴ糖類の精製と分析、マイコバクテリアからのミコール酸の分析などの種々の応用に対して適用可能である。インジェクタにより、カラムによって分離しようとするサンプル混合物を、ポンプによって生成される溶媒流れの中に注入する。インジェクタは、サンプルを自動的に加え、ミキシングし、そして注入するための自動化ルーチンを含めた種々の機能を果たすために、下記のクロマトグラフィマネジャを介してプログラム化できるオートサンプラ(Autosampler)とウォーターズ717(WatersTM717)との組合せという形態をとるのが好ましい。注入された混合物の成分を分離するクロマトグラフィカラムの1つが、ウォーターズ・コーポレーションからウォーターズ(登録表象)デルタ・パック(Delta-Pak)(登録商標)C18スチールカラムの商品名で入手可能である。このようなカラムは、3.9mmの内径と150mmの長さを有し、300オングストロームの孔サイズを有する5ミクロンサイズのビーズが充填されている。検出器が、カラムを出る流出液流れの吸光率(absorptivity)を測定し、測定された吸光度(absorbance)を数字表示する。このような検出器も、ウォーターズ・コーポレーションからウォーターズ(登録商標)486チューナブルUV吸光度検出器という商品名で市販されており、190〜600ナノメートル(nm)の検出範囲、±2nmの精度での8nmのバンド幅、および±0.25nmの再現性をもたらす。CPAS100は、HPLC102の操作を制御し、検出器のデジタル化出力を受け取るデータ・ステーションにより機能を果たすのが好ましい。このようなデータ・ステーションは、ワシントン州レッドモンドのマイクロソフト社から市販のウインドウズ3.1オペレーティングシステム、およびウインドウズ3.1に適合したアプリケーションプログラム(機器によってなされた分析から誘導される結果をプログラム化し、詳細に記録し、そしてリンクさせる能力も含めて、HPLC機器の作動の制御を可能にするようにクロマトグラフィデータマネージメントシステムを実行するミレニアム2010クロマトグラフィマネジャ(Millennium 2010Chromatography Manager)を含む)を実行するよう設計されたPCベースのコンピューターの形態をとるのが好ましい。このようなクロマトグラフィ・マネジャは、データの取得や他のシステム作動機能を制御するためのグラフィカル・ユーザ・インターフェースとHPLC102によって結果の系統化、記憶、および検索を容易にするリレーショナルデータベースを提供する。
【0020】
他のタイプの液体クロマトグラフやガスクロマトグラフも含めて、他のタイプのクロマトグラフィ機器をCPAS100と組み合わせて使用することができる。CPAS100は、クロマトグラムをアナログ電圧信号の形で表したデータ(このとき一般には、1ボルトが1吸光度単位(AU)に等しい)、あるいはデジタル信号の形で表したデータを必要とする。信号は通常、1秒間に1つの割合でサンプリングされ、デジタル化される。クロマトグラフィのピークは一般に、隔離されたピークのリフトオフポイントからタッチダウンポイントまで測定したときに30〜60秒の幅である。
【0021】
図1に図解されているように、CPAS100は、それぞれのサンプルクロマトグラムについて、標準クロマトグラムと比較することにより、クロマトグラフ変動測定モジュール104を介して、残差値S2を生成する。図1に示されるように、標準クロマトグラムとサンプルクロマトグラム1とは、それぞれ、同一の混合物から得られたクロマトグラムである。そして、別の混合物2,3,...,Nからは、複数のクロマトグラム(図1では、サンプルクロマトグラム2,3,..,Nとして示されている)が追加的に得られ、CPAS100のクロマトグラフィ識別モジュール106に送られて、これら複数のサンプルクロマトグラムと標準クロマトグラムとの間の類似または差異が判断される。CPAS100は、様々な目的に用いることができる。その一例として、混合物2,3,...,Nに対応するサンプルクロマトグラム2,3,...,Nを標準クロマトグラムと比較することにより、製造された混合物2,3,...,Nと所望の組成を有する混合物を表す混合物1との差を決定する品質管理がある。更に、CPAS100は、ミコール酸分析やトリプシンマッピング(tryptic mapping)を含む他の多くの応用にも使用することができる。
【0022】
図2は、図1の標準クロマトグラムとサンプルクロマトグラム1とを示しており、好適実施例の動作を図解するのに用いる。図2では、標準クロマトグラムは実線202で、サンプルクロマトグラム1は点線202で、示されている。以下の説明では、標準クロマトグラム202の上の種々のポイントは偶数の参照番号204−210で、サンプルクロマトグラム202の上のポイントは奇数の参照番号205−211で示される。図2から明らかなように、標準クロマトグラム202とサンプルクロマトグラム202とは、それぞれ、複数のピーク204−211を含んでいる。さらに図2からわかるように、標準クロマトグラムとサンプルクロマトグラムとは、同一の混合物から得られているにもかかわらず、多くの点で異なっている。例えば、クロマトグラム203のピークは、時間経過と共に、クロマトグラム202の対応するピークからシフトし、拡大(ストレッチ)している。さらに、クロマトグラム203のベースラインも、クロマトグラム202から上方向へシフトされ傾斜が付けられている。また、クロマトグラム203のピークの高さは、対応するクロマトグラム202のピークの高さと異なっている。周知のように、このような差異は、クロマトグラフ自体の特性が、同じ混合物が注入される場合であってもわずかに異なるために生じる。例えば、クロマトグラフにおける溶媒流量が日によってあるいは機器ごとに変わり、ベースラインがドリフトすることがある。下記の表1には、クロマトグラムに影響を及ぼす一般的な機器変動を5つ挙げている。表1においては、最も左の欄に変動が、次いで右に向かって順に、変動の大きさを測定するモデル値、モデル値の単位、そして個々の欄に記載されている変動の物理的原因が表記されている。
【0023】
【表1】
【0024】
CPAS100は、上記モデル値のそれぞれを、標準クロマトグラムとサンプルクロマトグラム1との比較により評価する。最初に、クロマトグラフ変動に起因するこれら2つのクロマトグラム間の差異を説明するために、5つのモデル値を決定する(「モデル変動」(model variability)と称する)。モデル変動がない場合、モデル値はs=1、r=0、to=0、bl=0、bo=0である。いったんモデル変動が決定されると、残りの差異(「残差変動」(residual variability)と称する)が決定される。この明細書では、「残差変動」という用語は、表1で定義されているモデルによって記述されるクロマトグラフ変動からは生じない2つのクロマトグラム間の差異を表す。従って、モデル変動と残差変動とを用いて、異なった混合物からのクロマトグラムの分析精度を高める。
【0025】
クロマトグラム202または202を表すデータをCPAS100に提供して分析する前に、標準クロマトグラムの溶離時間範囲を選択しなければならない。溶離時間範囲は、比較範囲とも称され、図2のグラフの横軸によって表される。溶離時間範囲は、比較しようとする標準クロマトグラムとサンプルクロマトグラムとの関心対象となるピークを含むように選択される。溶離時間範囲が少なくとも2つのピークを含む限りは、溶離時間範囲の長さに対して制約を設けないのが好ましい。さらに、溶離時間範囲内のピークが既知化合物のものであるか、未知化合物のものであるかどうかについても制約はない。例えば、CPAS100が機能するためには、基準化合物からのピークが溶離時間範囲に含まれる必要はない。2つ以上のピークがあれば、相対的な保持時間のシフトと広がり、そしてベースラインのモデル値と濃度変化を決定することができる。ただ1つのピークだけの場合には、保持時間の拡大(ストレッチ)を決定することができない。従って、システムを適切に動作させるためには、比較範囲に少なくとも2つのピークを含む必要がある。
【0026】
図2の例では、選択された比較範囲は、ポイント21から始まってポイント420で終わる400ポイントを含む。以下の説明では、比較範囲はインデクスiNによって示され、このときistartは比較範囲における最初のポイント(ポイント21)を、そしてistopは比較範囲における最後のポイント(ポイント420)を示す。この例では、比較範囲はN=400個のポイントを含む。なお、以下の説明においては、ベクトルや行列はボールドで示す(この日本語明細書では、その都度指摘することにする)。
【0027】
比較範囲の他に、オフセット範囲(パラメータKによってサンプリングインデクスの単位で表示)を選択しなければならない。オフセット範囲は、可能性のある最大の保持時間オフセットを示し、標準クロマトグラムとサンプルクロマトグラムとの間の比較が変動する−Kから+Kまでの範囲を特定する。従って、標準クロマトグラムは、サンプルクロマトグラムの(2K+1)個の、重複する、N個のポイントを有する区域と比較する。オフセット範囲内のある特定のオフセットは、オフセット・インデクスと称される値kによって特定される。現実には、値(2K+1)は、クロマトグラムのピークの幅と同等であることが多い。下記の例においては、K=10であり、したがって、オフセットはk=+10からk=−10インデクスの範囲にある。
【0028】
図3は、好適実施例によって実行され標準クロマトグラム202とサンプルクロマトグラム202とからクロマトグラフ変動を決定するステップを示すフローチャートである。図3では、標準クロマトグラム202からのデータを用いて、5つのクロマトグラフ変動曲線を生じさせる。これらの曲線は、それぞれ、対応するデータの組(本明細書では「クロマトグラフ変動データポイント」と呼ぶ)によって具体化され、302においてグラフの形で示され、より詳細には、図4(a)から4(e)に示されている。前記の表1に記載の対応するモデル値が、各曲線と関連している。これらのクロマトグラフ変動曲線が、一組のクロマトグラフ変動データポイントの概念を具体的に表現している。
【0029】
図4(a)に示されているデータポイントは、選択された溶離時間範囲の中で測定された最小吸光度を標準クロマトグラムから減算することによって得られる。選択された溶離時間範囲の中で測定された最小吸光度は、その時間範囲の中から全ての吸光度値を集めてソートし、そしてこのソートされた組から最も低い値を取り出すことによって見いだすことができる。こうして得られた図4(a)の曲線は、初期モデルクロマトグラム(IMC)と称され、これに関連したスケーリングパラメータは、sと称され、sは、標準クロマトグラムの濃度変化をモデル化するように作用する。IMCのN個の成分は、pi(ただし、i=1,...,N)と示すことにする。
【0030】
図4(b)に示されているデータポイントは、IMCの一次導関数を求めることによって得られる。この演算は、Abraham Savitzky and Marcel J.E.GolayによるSmoothing and Differentiation of Data by Simplified Least Squares Procedures”, Analytical Chemistry,v.36,pp. 1627-1639(July 1964)に記載されたサビツキ・ゴーレイ(Savitzky-Golay)フィルタを使用して行うのが好ましい。
【0031】
図4(b)の曲線のN個の成分は、p’iで示すことにする。この曲線に関連したスケーリングパラメータはδである。図4(b)の曲線のスケールリングされた成分をIMCに加算することにより、IMCのピーク保持におけるto=δ/sに等しい時間分のシフトがモデル化される。
【0032】
図4(c)のデータポイントは、図4(b)の曲線と、勾配が1(単位勾配)で平均がゼロの直線とを成分ごとに乗算することによって得られる。具体例で説明しよう。溶離時間範囲内にN個のポイントがある場合を考え、hをh=(N−1)/2であるとすると、ti=-h,...,-1,0,1,...,hが、勾配が1で平均がゼロの曲線を定義する。この曲線に関連するスケーリングパラメータはrである。図4(c)の曲線のスケーリングされた成分をIMCに加算することにより、IMCの中点の周りのIMCピークの保持時間の拡大をモデル化することができる。ピークの保持時間は、保持時間と比較範囲の中点との差のr倍に比例する。
【0033】
図4(d)のグラフは、勾配がゼロで値が1の直線である。このグラフに関連するスケーリングパラメータはboである。図4(d)のグラフのスケーリングされた成分をIMCに加算すると、IMCのベースラインをboだけ変化させたものがモデル化される。図4(e)のグラフは、勾配が1で平均がゼロの直線である。このグラフの成分は、上述したポイントtiである。このグラフに関連するスケーリングパラメータはblである。図4(e)の曲線のスケーリングされた成分をIMCに加算すると、IMCのベースライン勾配をblだけ変化させた状態のモデル化が得られる。
【0034】
いったんクロマトグラフ変動曲線が得られると、CPASは、ステップ304で、N行5列のデザイン行列を生成する。したがって、この例では、デザイン行列の成分は、400行5列で構成されている。iを1≦i≦400、jを1≦j≦5とすると、デザイン行列の成分は、Dijによって表すことができる(国際公開では、Dはゴシック)。また、デザイン行列の各列は、1つのスケーリングパラメータに対応する。デザイン行列の各成分は、クロマトグラフ変動曲線の中の1つの曲線に沿った1つの点である。この同じデザイン行列を標準クロマトグラムと関連づけ、上述したインデクス・オフセットを特定するkの全ての値に対して用いることが好ましい。
【0035】
デザイン行列Dからは、下記の数式1の関係を用いて、フィルタ行列Fが得られる。
【0036】
【数1】
【0037】
フィルタ行列Fは、5行N列の行列である。フィルタ行列Fの各行は、個々のクロマトグラフ変動曲線に関連した射影ベクトルとして作用する、N個の成分を有する行ベクトルである。なお、上記の数式(1)では、プライム(「ダッシュ」とも称する)は行列の転置(transposition、行と列とを入れ替えた行列)を意味し、−1は逆行列(乗算して単位行列になる行列)を意味する。この技術分野の当業者であるならば理解するはずであるが、上記の数式(1)は、サンプルデータをデザイン行列のスケーリングされた列(scaled column)にあてはめる線形最小二乗問題への解を与える。換言すれば、上記の数式(1)で表される関係を、下記の数式(2)、(3)および(5)に示される関係と組み合わせると、Sk 2の最小値を与える5つのスケーリングパラメータ(s,δ,r,bo,bl)に対する一組の値が得られる。あるいは、これらの値を、5次元空間でサーチを行うことにより、または、やはり5次元空間で何らかの逐次的手段を用いることにより、求めることができる。
【0038】
フィルタ行列Fが得られた後で、オフセット範囲Kに対する値が選択され、それぞれのインデクスオフセットの値kに対し、ブロック307の中に示されている機能が実行される。それぞれのインデクスオフセットkに対し、ブロック307の中の機能により、当該インデクスオフセットkに対する標準クロマトグラムとサンプルクロマトグラムとの差を示す量が得られる。
【0039】
ステップ308では、最適(ベスト・フィット)なスケーリングパラメータが、フィルタ行列、サンプルクロマトグラム、およびオフセット・インデクスkの関数として生成される。オフセット・インデクスkに対する最適なパラメータは、オフセット・インデクスkだけずれた(オフセットした)比較範囲に対応するサンプルクロマトグラムからの吸光度を選択することによって生成させるのが好ましい。従って、比較範囲がistartからistopまでの範囲でにあるインデクスからのものである場合には、サンプルクロマトグラムは(istart+k)から(istop+k)までの成分を含むことになり、これを成分qで表すことにする。ブロック308において、我々は、次の数式(2)の量を最小化するベクトルckを見つける最小二乗問題を解くことになる。
【0040】
【数2】
【0041】
積Dckは、ベクトルckの5つの成分を用いて行列Dの列に重み付け(weighting)するという作用を有する。この例では、ckは5つの成分から構成される列ベクトルであり、これら5つの値はスケーリング・ファクタである。積Dckは、クロマトグラフ変動曲線に基づくクロマトグラフ・データqkに対するモデルである。ベクトルqkはサンプル吸光度qk jを含む。数式(2)で与えられる量を最小化するベクトルckを求めることが、この数式への最小2乗解を得ることであり、kだけずれたサンプルクロマトグラフ・データに最もよく当てはまるモデルが得られる。上記の量を最小化するベクトルckを与えるよく知られた解が、次の数式(3)で表される関係を用いて、フィルタ行列Fから得られる。
【0042】
【数3】
【0043】
このよく知られている式と最小二乗問題に対する解とは、Gilbert Strangによる「Introduction to Applied Mathematics published by Wellesley-Cambridge Press,Wellesley,MA 02182 USA(1986),p. 37」に説明がある。列ベクトルckの5つの成分は、スケーリングパラメータ(s,δ,r,bl,bo)のそれぞれの最小二乗評価であり、次の数式(4)により関係付けられる。
【0044】
【数4】
【0045】
次に、ステップ310で、選択されたインデクスkに対する最適モデルが、数式(5)を用いて、比較範囲の中にあるポイントの数(この例では、400個)と長さが等しい列ベクトルmiを生成させることによって得られる。
【0046】
【数5】
【0047】
数式(5)の右辺にある行列Dとベクトルckとの乗算は、パラメータ値ckを用いて行列Dijの列に重み付けを行い、その結果を加算するという効果を有する。こうして結果的に得られる和は、kだけずれたサンプルクロマトグラムに最もよく当てはまるモデルクロマトグラムを具体化する400個のポイントの組を構成するモデルmkである。
【0048】
ステップ312では、2つの曲線の間の差を取ることにより、モデルクロマトグラム(mi)とサンプルクロマトグラム(qi k)とを比較し、残差曲線(ri=mi−qi)を得る。量riは、モデルクロマトグラムとサンプルクロマトグラムとのポイントごとの差である。ステップ314では、残差曲線から、残差の2乗の和(S2)が数式(6)に従って、計算される。この残差の2乗の和は、残差値とも称され、モデルクロマトグラムに対するサンプルクロマトグラムのあてはめの精度の尺度となる。
【0049】
【数6】
【0050】
数式(6)の右辺は、数式(2)と数式(5)との組合せに等しい。
S2 kの値は、下記の数式(7)に示される関係を用いて正規化できる。正規化されたRkは、モデル・クロマトグラムとサンプルクロマトグラムとの間の百分率偏差(percentage deviation)として、S2 kを表している。
【0051】
【数7】
【0052】
ステップ314でいったん残差値が得られると、ステップ316でオフセット・インデクスをインクリメントさせ、その範囲にある各オフセット・インデクスに対してステップ308からステップ314までを繰り返す。最初にオフセット・インデクスを−kに選択し、次いで、各オフセット・インデクス値に対するS2値が生成されるまで、ステップ308、310、312および314を通過するそれ以後のパスのために、オフセット・インデクスを順にインクリメントさせる。図3ではインクリメントによってオフセット・インデクス値を変化させているが、値を変化させるのは、(kからデクリメントさせるなど)他の方法でもかまわない。ステップ318では、各オフセット・インデクスについて得られたSk 2の値の最小値(この明細書ではS2またはminS2と称する)が選択される。こうして得られた最小値が、最適のk*の値と、k*に関連するパラメータとを与えることになる。
【0053】
クロマトグラムが同一の混合物からのものであるときのS2の挙動のため、このようなS2の測定方法には意味がある。S2は、濃度変化とクロマトグラフ変動との影響を除去した後で差を測定しているので、S2およびシステムの残差誤差に特徴的なものに対して低い値が得られる。
【0054】
図6(a)から6(d)には、オフセット・インデクスk=0の場合の最適モデルの例が示されている。図6(a)には、k=0だけずれたIMC(実線)とサンプルクロマトグラム(点線)との点が示されている。図6(b)には、k=0だけずれたIMC(実線)とサンプルに最適に当てはまる最適モデル(点線)との点が示されている。図6(c)は、最適モデル(点線)とサンプルクロマトグラム(実線)を示している。これら2つの曲線から、Rd=15.8%という相対偏差(Rd)が得られる。図6(d)は、図6(c)のサンプルクロマトグラムとモデルクロマトグラムとの間のポイントごとの差であるある残差のプロットを示している。図6(d)における値の2乗の総和により、S2に対する値が得られる。
【0055】
図7(a)から(d)は図6(a)から(d)に類似しているが、オフセット・インデクスk=0の最適モデルの例を示している。IMC(実線)とサンプルクロマトグラム(点線)とが図7(a)に示されており、IMC(実線)と最適モデルのクロマトグラム(点線)とが図7(b)に示されている。図7(c)は、最良適合モデルのクロマトグラム(実線)とサンプルクロマトグラム(点線)とを示している。これら2つの曲線から、R4=4%という相対偏差が得られる。言うまでもなく、k=4の方が、k=0よりも良好な当てはめを生じさせる。図7(d)は残差値のプロットを示している。図6(d)の場合もそうであるが、このプロットにおける値の2乗の総和がS2の値を与える。
【0056】
また、値minS2は、2つのクロマトグラムの間の差の目安を与える。その際、これら2つのクロマトグラムが同一の混合物から得られたか異なる混合物から得られたかは問わない。同一のまたは類似する混合物から得られた複数のクロマトグラムを相互に比較することを通じてクロマトグラフ変動がいったん決定されると、異なる混合物からのクロマトグラムを標準クロマトグラムと比較することにより、ある異なる混合物が、標準クロマトグラムを生じさせた混合物と同一か異なるかを判断することができる。標準クロマトグラムを生じさせた標準混合物は基準標準または黄金標準と称されるが、多くの場合、この標準混合物を慎重に保管しておき、ごく少量ずつ、比較の際の基準物の一部として、週1回ベースで用いられる。分析担当者は、この基準となる混合物から1又は複数のクロマトグラムを得ておいて、新たに製造される混合物との比較に用いる。最も単純なケースでは、既に図1〜3を参照しながら論じたように、基準となる混合物から2つのクロマトグラム(標準クロマトグラムとサンプルクロマトグラム)を得ることになる。しかし、多くの場合は、図5に示されているように、基準となる混合物から複数(N種類)のクロマトグラムを得ておく。図5の場合には、基準となる混合物である混合物1から複数の標準クロマトグラム(標準クロマトグラム1,2,...,M)を得ている。1つの混合物からM個のクロマトグラムを得ることで、S2の値の統計的に有意な分布が得られ、偏差が大きなをクロマトグラムを分布値から除去することができる。データをこれ以外の方法を用いて収集することも可能である。例えば、臨床試験の場合、混合物が生物学的な供給源からのものであるときは、基準となる混合物を多く用いることがあり得る。一般に、ある値が分布の一部であるかどうかを決定する問題は、統計学でよく知られた問題である。この問題に対する可能な解法は、J. C. Miller and J. M. Millerによる「Statistics for Analytical Chemistry, published by Halsted Press:a division of John Wiley & Sons,New York(1988)」に記載されている。
【0057】
図1およびそれに付随する説明でわかるように、未知のすなわちサンプルとなる混合物は、任意の数を用いることが可能である。最も単純なシナリオでは、図1に示されているように、基準となる混合物をただ1つだけ(混合物1)使用し、混合物1から2つのクロマトグラム(標準クロマトグラムとサンプルクロマトグラム1)を得て、そして複数の未知の混合物(混合物2,3,...N)からそれぞれ1つのクロマトグラムを得る(サンプロクロマトグラム2,3,...N)。このようなシナリオにおいては、図2および図3に記載のように、標準クロマトグラムと複数のサンプルクロマトグラムとの比較から、5つの変動曲線、5つのスケーリング・パラメータ、整数であるオフセット、および残差値が得られる。残差値minS2が記憶され、以下の説明においては基準残差(reference residual)と呼ぶ。応用例に適した手法を用いて、この基準残差から、標準からの最大許容偏差を示す閾値を生成する。この閾値は、例えば、基準残差の整数倍であったり、固定された値であったりする。閾値は、また、同一の混合物から得られた複数のサンプルクロマトグラムと標準クロマトグラムとの比較から得られる基準残差の分布を分析して求めることもできる。
【0058】
次いで、標準クロマトグラムと複数の未知のサンプルクロマトグラムの中の1つとを比較する。標準クロマトグラムから得られた5つの変動曲線から、新たな5つのスケーリングパラメータ、新たな整数オフセット、新たな残差曲線、および新たな残差値minS2が各サンプルに対して得られる。最後に、各サンプルに対して得られる残差値(未知の残差)を閾値と比較する。未知残差が閾値より大きければ、その残差に対応する混合物は標準混合物とは異なる、と決定される。未知残差が閾値より小さければ、その未知混合物は標準混合物と同一である(あるいは、厳密に言えば、標準混合物とは、認識できるほどには異なっていない)と判断される。
【0059】
以上の議論では、1つの混合物から得られた1つのクロマトグラム比較領域を考察する場合の説明に重点をおいたが、既に示唆しておいた別の場合も存在する。例えば、上記の手法は、各クロマトグラムからのデータの比較範囲または比較部分が、重畳的でも非重畳的でもかまわないが、複数個ある場合にも適用可能である。トリプシンマップ(tryptic maps)を比較する際に有用であることが判明している比較方式として、ピーク幅が約5個または6個分の幅を有する1つの比較範囲を選択し、1つのピーク幅に相当する部分ごとの複数個の比較範囲を用いて比較を実行する方法がある。例えば、150個のポイントを含む1つの比較範囲を選択し、この比較範囲を約1〜5個のポイント分だけ移動させると、データの各ポイントは、約30個〜150個の連続的な比較範囲に含まれることになる。本明細書で「移動ウインドウ比較(moving window comparison)」と称するこのような比較方法では、残差値を各比較範囲の中心位置の関数としてプロットできる。また、複数の残差値を組み合わせて1つの複合値を構成することもできる。さらに、それぞれが個別の比較から導かれた1又は複数のスケール値(scale value)を、各比較範囲の中心点の関数としてプロットすることもできる。
【0060】
以上で説明した場合とは異なり、5つの変動曲線に反映された5つ未満の変動パラメータと5つのスケーリングパラメータとを用いる場合がある。一般に、5つの変動パラメータの一部としてその部分集合だけを用いる利点は、R及びS2に対する残差曲線(residual difference curve)と残差値(residual difference value)との、サンプルクロマトグラムに反映されるサンプル混合物の変化に対する感度が向上することである。また、それぞれの比較に要する計算時間が短縮される利点もある。計算時間の短縮は、計算集約的である上述した移動ウインドウ比較法の場合に有用である。もちろん、存在するクロマトグラフ変動の複数の成分を適切にモデル化するには、十分な数のパラメータを用いなければならない。例えば、比較領域が狭く、わずかに数ピーク分の幅にすぎないときには、対応する3つの変動曲線及び3つのスケーリングパラメータと共に、変動パラメータを3つだけ含むモデルを使用することが可能であろう。好ましい選択は、sによってパラメータ化されるスケールファクタ、δによってパラメータ化される保持時間オフセット、およびboによってパラメータ化されるベースラインオフセットである。狭い比較領域であれば、残りの2つの変動である保持時間の伸び(rによってパラメータ化される)と、ベースラインの勾配(blによってパラメータ化される)とは、有意的でない程度に小さいことがありうる。保持時間の伸びとベースラインの勾配とのいずれか一方を、第4の変数として考慮することもできるが、それは、第4の変数の追加が、クロマトグラフによって生じるこれらの効果に起因する変動によって正当化される場合である。
【0061】
追加的な部分集合は、ただ1つの変動パラメータであるスケールsで構成される。この部分集合が適切であるためには、ベースラインオフセットと勾配とは、それぞれの比較領域についてほぼ同じでなければならず、また、保持時間の伸びはほとんどゼロかまたはゼロでなければならない。この方法は、上述した3パラメータモデルや4パラメータモデルや、5パラメータモデルほどには効果的でない場合がある。特に、この方法は、サンプルピリオド(sample period)またはインデクスオフセットの整数に等しい保持時間オフセットの値をもたらす。しかし、この方法は、ピークの識別または特性付けを必要とすることなく、保持時間オフセットを測定できるという利点を有する。この方法は、さらに、濃度の比に対する値(スケール変化s、残差曲線、および残差値S2によって表される)を与えるという利点を有する。前記の1パラメータ法の欠点は、保持時間のシフトが、一般にはサンプルピリオドまたはインデクスオフセットの整数に対応しないという点である。我々は、パラメータδと保持時間シフトに関連した対応する曲線とを加えることによって、1つの変動パラメータsを使用する上記方法を改良することができる。この2パラメータ法では、サンプリングユニットの整数以外だけオフセットされる複数の曲線を比較するときには、インテグラルインデクスオフセット間で内挿され、これによって保持時間のシフトが正確に測定される。さらに、この2パラメータ法は、残差曲線とS2に対する値を生成するという利点を依然として有している。要するに、5個のパラメータを要素とする集合{s,δ,bo,r,bl}の有用な部分集合は、{s}、{s,δ}、{s,δ,bo}、{s,δ,bo,r}、{s,δ,bo,r,bl}である。
【0062】
図1、2および3を参照して説明した実施例は、汎用コンピュータ上で動作するプログラムとして実施するのが好ましい。マトラブ(MATLAB)プログラミング言語を用いた好ましい実装例のコードリストを以下に記載する。下記のリストは、米国マサチューセッツ州ネーティック01760のマス・ワークス社(The Math Works, Inc.)から市販されているマトラブ(MATLAB)プログラミング言語用の適当なインタープリタを用いた解釈によって実行可能な形に変換できる。
【0063】
【表2−A】
【0064】
【表2−B】
【0065】
【表2−C】
【0066】
言うまでもないことであるが、説明してきた特定のメカニズムと方法は、本発明の原理の1つの応用例を単に例示したにすぎない。本発明の真の精神と範囲を逸脱することなく、本発明の方法と装置に対する種々の改良形が可能である。
【0001】
【著作権について】
【0002】
本特許文書の開示内容の一部は、著作権保護の対象となる。しかし、著作権者は、米国特許商標庁の特許ファイル又は特許記録に存在しているままの形態であるならば、本特許文書または本特許開示内容のファクシミリによる複製を認める。
【0003】
【発明の分野】
本発明は、一般にはクロマトグラムの分析に関する。さらに詳細には、本発明は、これに限定されるのではないが、クロマトグラフィ分析の精度を向上させるためにクロマトグラフ変動(chromatographic variability)を決定することに関する。
【0004】
【発明の背景】
クロマトグラフィは、多成分物質の分析に広く使用されている手法である。クロマトグラフィでは、既知が組成又は未知である液体やガスがクロマトグラフに注入され、クロマトグラフからは、二次元グラフの形状を有するクロマトグラムが生じる。このクロマトグラムでは、注入した液体の吸光率、注入したガスの導電率又はそれ以外の物理的応答が時間に対してプロットされる。液体又はガスがクロマトグラフを通るときの時間経過に対する液体の吸光率又はガスの導電率の変化が、液体混合物又はガス混合物の組成を表している。
【0005】
クロマトグラフィの通常の用途としては、製造された物質を分析して組成を確認するという品質管理、および未知物質からのクロマトグラムを生成させて該物質の組成を分析・決定するという定性分析と定量分析がある。品質管理での用途においては、既知物質と所望物質のクロマトグラムを生成させ、これらを製造物質のクロマトグラムと比較する。定性・定量分析での用途においては、未知物質の1つ以上のクロマトグラムを生成させ、成分の同定を行うか、あるいは物質中の各成分の量を定量する。
【0006】
上記用途のいずれも、クロマトグラムを解析して、他のクロマトグラムとの類似性又は相違性を決定しなければならない。一般にこのような解析では、あるクロマトグラムと他のクロマトグラムとの間で、ピークの保持時間、高さ、及び面積を含めて、ピークを解析・比較する必要がある。このような比較を行うためには、比較しようとするピークを識別する方法を開発して最適化しなければならず、次いでクロマトグラムのピークおよび上記の他の識別状況を比較する方法を開発しなければならない。主成分分析(Principal Component Analysis; PCA)はこのような方法の1つであり、G. MalmquistとR. Danielssonによる「Alignment of Chromatographic Profiles for Principal Component Analysis: A Prerequisite for Fingerprinting Methods”,Journal of Chromatography A,687(1994)71-88」に記載されている。MalmquistとDanielssonが説明しているように、対応するクロマトグラムを整列させるのに、選定されたピークの保持時間が使用されている。クロマトグラムが整列したら、吸光度を比較する。他の方法が、J.P.Masonらによる「“A Novel Algorithm for Chromatogram Matching in Qualitative Analysis”,Journal of High Resolution Chromatography,v. 15,pp. 539-547(August 1992)」に記載されており、ピークの高さ、面積、及び保持時間だけを比較する自動化されたクロマトグラフィマッチング法(chromatographic matching technique)が説明されている。
【0007】
更に、クロマトグラフィ分析では、クロマトグラフによって生じる変動(例えば、ベースラインのドリフト、保持時間の変動、濃度の変化など)を考慮しなければならない。クロマトグラフによって生じるこうした変動は、クロマトグラフによって生成されるクロマトグラムにおける変動として現れ、このような幾つかの変動を考慮した解析が必要となるために分析をより複雑にする。MalmquistとDanielssonによる上記報文においては、PCAによるクロマトグラフィ分析を強化するというやり方でクロマトグラフ変動を補償する方法が説明されている。
【0008】
クロマトグラフィ分析の公知の方法(例えば、MalmquistとDanielssonによって説明されている方法)は一般に、比較しようとするピークを識別する方法を規定する工程、ピークの種々のアスペクトを比較する方法を規定する工程、そしてクロマトグラフ変動の影響を考慮しつつ実際に比較を行う工程を必要とする。コンピューター化された方法(例えば、Masonにより説明されている方法)はこのような作業を行うのに有効であるが、公知の多くの方法は、依然として時間がかかりすぎであり、場合によっては単調で退屈であり、高度に訓練した作業者の技能を必要とする。
【0009】
従って、本発明の目的は、クロマトグラフ変動を補償する際に、従来の方法で必要とされたピークやそれ以外の外形の特徴付けを必要とせずにクロマトグラフィ分析を行うシステムを提供することである。
【0010】
【発明の概要】
本発明の主要な目的によれば、クロマトグラフィ分析システムは、クロマトグラフ変動を特徴付けるクロマトグラム整合手順(chromatogram alignment procedure)を使用する。本発明の他の目的によれば、クロマトグラフィ分析システムは、特徴付けされたクロマトグラフ変動をクロマトグラムの比較において用いる。本発明のクロマトグラフィ分析システムは、複数のクロマトグラムをパターンとして比較するのであって、ピークの特徴付けや付随しているピークのリフトオフポイント(lift-off point)やピークのタッチダウンポイント(touch down points)の識別を必要としない。さらに、ピークの高さ、面積、又は保持時間を算出する必要がない。本明細書で言う「特徴付け」とは、問題としているピークのリフトポイントやタッチダウンポイントの識別によってベースラインを明確化すること、および実際にピークの積分を行うこと、を必要とするピーク積分のプロセスを表しているものとする。本発明のクロマトグラフィパターン分析システムは、アイソクラチッククロマトグラフィ分離又は勾配クロマトグラフィ分離によって得られるクロマトグラムに適用することができる。アイソクラチッククロマトグラフィでは、クロマトグラフィ分離の全体にわたって溶媒の組成を一定に保持する。勾配クロマトグラフィでは、化合物の保持時間に対する制御を高めるために、溶媒の組成を所定の仕方にしたがって変化させる。
【0011】
本発明の原理にしたがって機能するクロマトグラフィ分析システムは、第1の態様においては、標準クロマトグラムとサンプルクロマトグラムとの差を決定する。標準クロマトグラムは、選定された溶離時間範囲にわたる標準クロマトグラムを示している一組の標準データポイントによって表され、またサンプルクロマトグラムは、同じ溶離時間範囲又は一定量の分だけオフセットされた溶離時間範囲にわたるサンプルクロマトグラムを示している一組のサンプルデータポイントによって表される。標準データポイントとサンプルデータポイントとは、それぞれが、個々のクロマトグラムを一定の割合でサンプリングすることによって得られる。本発明のクロマトグラフィ分析システムは、次に、標準データポイントから複数組のクロマトグラフ変動データポイントを生成する。クロマトグラフ変動データポイントの各組は、標準クロマトグラムに及ぼす所定のクロマトグラフ変動源の影響を示す。更に、本発明のシステムは、修正された標準データポイントの組を生成するのであるが、この修正された標準データポイントは、クロマトグラフ変動データポイントの関数として修正された標準データポイントに対応し、前記クロマトグラムを生成するクロマトグラフのクロマトグラフ変動をモデル化するものである。
【0012】
本発明によるシステムでは、同じ混合物から得られた標準クロマトグラムとサンプルクロマトグラムとを使用して、クロマトグラフ変動を決定することができる。さらに、本発明のシステムを使用して、別の又は未知の混合物からの標準クロマトグラムとサンプルクロマトグラムとの間の類似性又は相違性を決定することができる。このような比較をしやすくするために、本発明のシステムは、第2に態様において、標準クロマトグラムとサンプルクロマトグラムとの間の相違を示す残差値(residue values)を生成する。同じ混合物の標準クロマトグラムとサンプルクロマトグラムとの比較から得られる残差値を、異なった混合物の標準クロマトグラムとサンプルクロマトグラムとの比較から得られる残差値と比較して、サンプルクロマトグラムに対応する混合物と標準クロマトグラムに対応する混合物が同じ混合物であるか又は異なった混合物であるかを決定することができる。
【0013】
標準クロマトグラムから得られるクロマトグラフ変動データポイントにより、クロマトグラフ変動の影響によってのみ標準クロマトグラムとは異なる可能なクロマトグラムの広い範囲を示すよう、標準クロマトグラムを修正することができる。
【0014】
本発明のシステムは、サンプルクロマトグラムに最もよく整合するモデルクロマトグラムを見いだすのに、標準クロマトグラムから誘導されるクロマトグラフ変動データポイントを使用する。この意味において、本発明のシステムは、標準クロマトグラムを修正することによってサンプルに現れるクロマトグラフィ一変動性を測定する。
【0015】
クロマトグラフ変動データポイントの関数として生成されるスケールファクター(この「最良適合(best-fit)」モデルクロマトグラムを表している)は、標準クロマトグラムとサンプルクロマトグラムとの間のクロマトグラフ変動の1つの尺度である。モデルクロマトグラムとサンプルクロマトグラムとの間の差違がもう一つの尺度である。これらはいずれも、サンプルクロマトグラムと整合する標準クロマトグラムに基づいてモデルクロマトグラムを得るのに、標準クロマトグラムにどの程度の変動性を加えるべきか(クロマトグラフ変動データポイントを使用することにより)を本発明のシステムが決定する、という意味においてクロマトグラフ変動の好ましい尺度である。
【0016】
標準クロマトグラムから誘導されるクロマトグラフ変動データポイントは、各標準クロマトグラムに対して1回だけ生成させればよく、標準クロマトグラムと複数のサンプルクロマトグラムとの間の変動性を決定する際に、繰り返し使用することができる。
【0017】
上記にて要約されている原理にしたがって機能する実施態様は、該クロマトグラムの特定のピーク又は他の特徴を識別あるいは特性表示する必要なく、クロマトグラフ変動の正確な決定を有利な形でもたらす。クロマトグラムが同一又は類似の混合物からのものである場合は、ベースラインのドリフトによるクロマトグラフ変動、保持時間の変動、および濃度変化を測定し、該クロマトグラムの特定の特徴に関係なく、またクロマトグラフのさらなるキャリブレーションや、該混合物への基準化合物の付加を行わずに除外する。好ましい実施態様においては、本発明のクロマトグラフィ分析システムは、濃度の変化、保持時間の片寄り、保持時間の伸び、ベースラインの片寄り、およびベースラインの勾配によるクロマトグラフ変動を除去する。他の実施態様においては、本発明のシステムは、上記変動源の異なったサブセットのクロマトグラフ変動において、上記変動源のうちの1つのみによるクロマトグラフ変動を除去する。
【0018】
本発明のこれらの特徴と利点および他の特徴と利点は、本発明の特定の好ましい実施態様についての下記の詳細な説明を考察することによって、より理解を深めることができる。下記の説明においては、添付の図面を参照しつつ説明する。
【0019】
【詳細な説明】
図1は、高圧液体クロマトグラフィ(HPLC)システム102からのデータを受け取るように結合された好適なクロマトグラフィパターン分析システム(CPAS)100の概略図を示している。このようなシステムは、米国マサチューセッツ州ミルフォード01757のウォーターズ・コーポレーション(Waters Corporation)から市販されており、ウォーターズ626(WatersTM 626)という商品名のポンプを含み、このポンプは、インジェクタとカラムと検出器とを通して溶媒を廃棄ボトルに継続的にポンプ送りする。このようなシステムは、高分解能のタンパク質精製、ヘプチドのマッピング、核酸の単離、オリゴ糖類の精製と分析、マイコバクテリアからのミコール酸の分析などの種々の応用に対して適用可能である。インジェクタにより、カラムによって分離しようとするサンプル混合物を、ポンプによって生成される溶媒流れの中に注入する。インジェクタは、サンプルを自動的に加え、ミキシングし、そして注入するための自動化ルーチンを含めた種々の機能を果たすために、下記のクロマトグラフィマネジャを介してプログラム化できるオートサンプラ(Autosampler)とウォーターズ717(WatersTM717)との組合せという形態をとるのが好ましい。注入された混合物の成分を分離するクロマトグラフィカラムの1つが、ウォーターズ・コーポレーションからウォーターズ(登録表象)デルタ・パック(Delta-Pak)(登録商標)C18スチールカラムの商品名で入手可能である。このようなカラムは、3.9mmの内径と150mmの長さを有し、300オングストロームの孔サイズを有する5ミクロンサイズのビーズが充填されている。検出器が、カラムを出る流出液流れの吸光率(absorptivity)を測定し、測定された吸光度(absorbance)を数字表示する。このような検出器も、ウォーターズ・コーポレーションからウォーターズ(登録商標)486チューナブルUV吸光度検出器という商品名で市販されており、190〜600ナノメートル(nm)の検出範囲、±2nmの精度での8nmのバンド幅、および±0.25nmの再現性をもたらす。CPAS100は、HPLC102の操作を制御し、検出器のデジタル化出力を受け取るデータ・ステーションにより機能を果たすのが好ましい。このようなデータ・ステーションは、ワシントン州レッドモンドのマイクロソフト社から市販のウインドウズ3.1オペレーティングシステム、およびウインドウズ3.1に適合したアプリケーションプログラム(機器によってなされた分析から誘導される結果をプログラム化し、詳細に記録し、そしてリンクさせる能力も含めて、HPLC機器の作動の制御を可能にするようにクロマトグラフィデータマネージメントシステムを実行するミレニアム2010クロマトグラフィマネジャ(Millennium 2010Chromatography Manager)を含む)を実行するよう設計されたPCベースのコンピューターの形態をとるのが好ましい。このようなクロマトグラフィ・マネジャは、データの取得や他のシステム作動機能を制御するためのグラフィカル・ユーザ・インターフェースとHPLC102によって結果の系統化、記憶、および検索を容易にするリレーショナルデータベースを提供する。
【0020】
他のタイプの液体クロマトグラフやガスクロマトグラフも含めて、他のタイプのクロマトグラフィ機器をCPAS100と組み合わせて使用することができる。CPAS100は、クロマトグラムをアナログ電圧信号の形で表したデータ(このとき一般には、1ボルトが1吸光度単位(AU)に等しい)、あるいはデジタル信号の形で表したデータを必要とする。信号は通常、1秒間に1つの割合でサンプリングされ、デジタル化される。クロマトグラフィのピークは一般に、隔離されたピークのリフトオフポイントからタッチダウンポイントまで測定したときに30〜60秒の幅である。
【0021】
図1に図解されているように、CPAS100は、それぞれのサンプルクロマトグラムについて、標準クロマトグラムと比較することにより、クロマトグラフ変動測定モジュール104を介して、残差値S2を生成する。図1に示されるように、標準クロマトグラムとサンプルクロマトグラム1とは、それぞれ、同一の混合物から得られたクロマトグラムである。そして、別の混合物2,3,...,Nからは、複数のクロマトグラム(図1では、サンプルクロマトグラム2,3,..,Nとして示されている)が追加的に得られ、CPAS100のクロマトグラフィ識別モジュール106に送られて、これら複数のサンプルクロマトグラムと標準クロマトグラムとの間の類似または差異が判断される。CPAS100は、様々な目的に用いることができる。その一例として、混合物2,3,...,Nに対応するサンプルクロマトグラム2,3,...,Nを標準クロマトグラムと比較することにより、製造された混合物2,3,...,Nと所望の組成を有する混合物を表す混合物1との差を決定する品質管理がある。更に、CPAS100は、ミコール酸分析やトリプシンマッピング(tryptic mapping)を含む他の多くの応用にも使用することができる。
【0022】
図2は、図1の標準クロマトグラムとサンプルクロマトグラム1とを示しており、好適実施例の動作を図解するのに用いる。図2では、標準クロマトグラムは実線202で、サンプルクロマトグラム1は点線202で、示されている。以下の説明では、標準クロマトグラム202の上の種々のポイントは偶数の参照番号204−210で、サンプルクロマトグラム202の上のポイントは奇数の参照番号205−211で示される。図2から明らかなように、標準クロマトグラム202とサンプルクロマトグラム202とは、それぞれ、複数のピーク204−211を含んでいる。さらに図2からわかるように、標準クロマトグラムとサンプルクロマトグラムとは、同一の混合物から得られているにもかかわらず、多くの点で異なっている。例えば、クロマトグラム203のピークは、時間経過と共に、クロマトグラム202の対応するピークからシフトし、拡大(ストレッチ)している。さらに、クロマトグラム203のベースラインも、クロマトグラム202から上方向へシフトされ傾斜が付けられている。また、クロマトグラム203のピークの高さは、対応するクロマトグラム202のピークの高さと異なっている。周知のように、このような差異は、クロマトグラフ自体の特性が、同じ混合物が注入される場合であってもわずかに異なるために生じる。例えば、クロマトグラフにおける溶媒流量が日によってあるいは機器ごとに変わり、ベースラインがドリフトすることがある。下記の表1には、クロマトグラムに影響を及ぼす一般的な機器変動を5つ挙げている。表1においては、最も左の欄に変動が、次いで右に向かって順に、変動の大きさを測定するモデル値、モデル値の単位、そして個々の欄に記載されている変動の物理的原因が表記されている。
【0023】
【表1】
【0024】
CPAS100は、上記モデル値のそれぞれを、標準クロマトグラムとサンプルクロマトグラム1との比較により評価する。最初に、クロマトグラフ変動に起因するこれら2つのクロマトグラム間の差異を説明するために、5つのモデル値を決定する(「モデル変動」(model variability)と称する)。モデル変動がない場合、モデル値はs=1、r=0、to=0、bl=0、bo=0である。いったんモデル変動が決定されると、残りの差異(「残差変動」(residual variability)と称する)が決定される。この明細書では、「残差変動」という用語は、表1で定義されているモデルによって記述されるクロマトグラフ変動からは生じない2つのクロマトグラム間の差異を表す。従って、モデル変動と残差変動とを用いて、異なった混合物からのクロマトグラムの分析精度を高める。
【0025】
クロマトグラム202または202を表すデータをCPAS100に提供して分析する前に、標準クロマトグラムの溶離時間範囲を選択しなければならない。溶離時間範囲は、比較範囲とも称され、図2のグラフの横軸によって表される。溶離時間範囲は、比較しようとする標準クロマトグラムとサンプルクロマトグラムとの関心対象となるピークを含むように選択される。溶離時間範囲が少なくとも2つのピークを含む限りは、溶離時間範囲の長さに対して制約を設けないのが好ましい。さらに、溶離時間範囲内のピークが既知化合物のものであるか、未知化合物のものであるかどうかについても制約はない。例えば、CPAS100が機能するためには、基準化合物からのピークが溶離時間範囲に含まれる必要はない。2つ以上のピークがあれば、相対的な保持時間のシフトと広がり、そしてベースラインのモデル値と濃度変化を決定することができる。ただ1つのピークだけの場合には、保持時間の拡大(ストレッチ)を決定することができない。従って、システムを適切に動作させるためには、比較範囲に少なくとも2つのピークを含む必要がある。
【0026】
図2の例では、選択された比較範囲は、ポイント21から始まってポイント420で終わる400ポイントを含む。以下の説明では、比較範囲はインデクスiNによって示され、このときistartは比較範囲における最初のポイント(ポイント21)を、そしてistopは比較範囲における最後のポイント(ポイント420)を示す。この例では、比較範囲はN=400個のポイントを含む。なお、以下の説明においては、ベクトルや行列はボールドで示す(この日本語明細書では、その都度指摘することにする)。
【0027】
比較範囲の他に、オフセット範囲(パラメータKによってサンプリングインデクスの単位で表示)を選択しなければならない。オフセット範囲は、可能性のある最大の保持時間オフセットを示し、標準クロマトグラムとサンプルクロマトグラムとの間の比較が変動する−Kから+Kまでの範囲を特定する。従って、標準クロマトグラムは、サンプルクロマトグラムの(2K+1)個の、重複する、N個のポイントを有する区域と比較する。オフセット範囲内のある特定のオフセットは、オフセット・インデクスと称される値kによって特定される。現実には、値(2K+1)は、クロマトグラムのピークの幅と同等であることが多い。下記の例においては、K=10であり、したがって、オフセットはk=+10からk=−10インデクスの範囲にある。
【0028】
図3は、好適実施例によって実行され標準クロマトグラム202とサンプルクロマトグラム202とからクロマトグラフ変動を決定するステップを示すフローチャートである。図3では、標準クロマトグラム202からのデータを用いて、5つのクロマトグラフ変動曲線を生じさせる。これらの曲線は、それぞれ、対応するデータの組(本明細書では「クロマトグラフ変動データポイント」と呼ぶ)によって具体化され、302においてグラフの形で示され、より詳細には、図4(a)から4(e)に示されている。前記の表1に記載の対応するモデル値が、各曲線と関連している。これらのクロマトグラフ変動曲線が、一組のクロマトグラフ変動データポイントの概念を具体的に表現している。
【0029】
図4(a)に示されているデータポイントは、選択された溶離時間範囲の中で測定された最小吸光度を標準クロマトグラムから減算することによって得られる。選択された溶離時間範囲の中で測定された最小吸光度は、その時間範囲の中から全ての吸光度値を集めてソートし、そしてこのソートされた組から最も低い値を取り出すことによって見いだすことができる。こうして得られた図4(a)の曲線は、初期モデルクロマトグラム(IMC)と称され、これに関連したスケーリングパラメータは、sと称され、sは、標準クロマトグラムの濃度変化をモデル化するように作用する。IMCのN個の成分は、pi(ただし、i=1,...,N)と示すことにする。
【0030】
図4(b)に示されているデータポイントは、IMCの一次導関数を求めることによって得られる。この演算は、Abraham Savitzky and Marcel J.E.GolayによるSmoothing and Differentiation of Data by Simplified Least Squares Procedures”, Analytical Chemistry,v.36,pp. 1627-1639(July 1964)に記載されたサビツキ・ゴーレイ(Savitzky-Golay)フィルタを使用して行うのが好ましい。
【0031】
図4(b)の曲線のN個の成分は、p’iで示すことにする。この曲線に関連したスケーリングパラメータはδである。図4(b)の曲線のスケールリングされた成分をIMCに加算することにより、IMCのピーク保持におけるto=δ/sに等しい時間分のシフトがモデル化される。
【0032】
図4(c)のデータポイントは、図4(b)の曲線と、勾配が1(単位勾配)で平均がゼロの直線とを成分ごとに乗算することによって得られる。具体例で説明しよう。溶離時間範囲内にN個のポイントがある場合を考え、hをh=(N−1)/2であるとすると、ti=-h,...,-1,0,1,...,hが、勾配が1で平均がゼロの曲線を定義する。この曲線に関連するスケーリングパラメータはrである。図4(c)の曲線のスケーリングされた成分をIMCに加算することにより、IMCの中点の周りのIMCピークの保持時間の拡大をモデル化することができる。ピークの保持時間は、保持時間と比較範囲の中点との差のr倍に比例する。
【0033】
図4(d)のグラフは、勾配がゼロで値が1の直線である。このグラフに関連するスケーリングパラメータはboである。図4(d)のグラフのスケーリングされた成分をIMCに加算すると、IMCのベースラインをboだけ変化させたものがモデル化される。図4(e)のグラフは、勾配が1で平均がゼロの直線である。このグラフの成分は、上述したポイントtiである。このグラフに関連するスケーリングパラメータはblである。図4(e)の曲線のスケーリングされた成分をIMCに加算すると、IMCのベースライン勾配をblだけ変化させた状態のモデル化が得られる。
【0034】
いったんクロマトグラフ変動曲線が得られると、CPASは、ステップ304で、N行5列のデザイン行列を生成する。したがって、この例では、デザイン行列の成分は、400行5列で構成されている。iを1≦i≦400、jを1≦j≦5とすると、デザイン行列の成分は、Dijによって表すことができる(国際公開では、Dはゴシック)。また、デザイン行列の各列は、1つのスケーリングパラメータに対応する。デザイン行列の各成分は、クロマトグラフ変動曲線の中の1つの曲線に沿った1つの点である。この同じデザイン行列を標準クロマトグラムと関連づけ、上述したインデクス・オフセットを特定するkの全ての値に対して用いることが好ましい。
【0035】
デザイン行列Dからは、下記の数式1の関係を用いて、フィルタ行列Fが得られる。
【0036】
【数1】
【0037】
フィルタ行列Fは、5行N列の行列である。フィルタ行列Fの各行は、個々のクロマトグラフ変動曲線に関連した射影ベクトルとして作用する、N個の成分を有する行ベクトルである。なお、上記の数式(1)では、プライム(「ダッシュ」とも称する)は行列の転置(transposition、行と列とを入れ替えた行列)を意味し、−1は逆行列(乗算して単位行列になる行列)を意味する。この技術分野の当業者であるならば理解するはずであるが、上記の数式(1)は、サンプルデータをデザイン行列のスケーリングされた列(scaled column)にあてはめる線形最小二乗問題への解を与える。換言すれば、上記の数式(1)で表される関係を、下記の数式(2)、(3)および(5)に示される関係と組み合わせると、Sk 2の最小値を与える5つのスケーリングパラメータ(s,δ,r,bo,bl)に対する一組の値が得られる。あるいは、これらの値を、5次元空間でサーチを行うことにより、または、やはり5次元空間で何らかの逐次的手段を用いることにより、求めることができる。
【0038】
フィルタ行列Fが得られた後で、オフセット範囲Kに対する値が選択され、それぞれのインデクスオフセットの値kに対し、ブロック307の中に示されている機能が実行される。それぞれのインデクスオフセットkに対し、ブロック307の中の機能により、当該インデクスオフセットkに対する標準クロマトグラムとサンプルクロマトグラムとの差を示す量が得られる。
【0039】
ステップ308では、最適(ベスト・フィット)なスケーリングパラメータが、フィルタ行列、サンプルクロマトグラム、およびオフセット・インデクスkの関数として生成される。オフセット・インデクスkに対する最適なパラメータは、オフセット・インデクスkだけずれた(オフセットした)比較範囲に対応するサンプルクロマトグラムからの吸光度を選択することによって生成させるのが好ましい。従って、比較範囲がistartからistopまでの範囲でにあるインデクスからのものである場合には、サンプルクロマトグラムは(istart+k)から(istop+k)までの成分を含むことになり、これを成分qで表すことにする。ブロック308において、我々は、次の数式(2)の量を最小化するベクトルckを見つける最小二乗問題を解くことになる。
【0040】
【数2】
【0041】
積Dckは、ベクトルckの5つの成分を用いて行列Dの列に重み付け(weighting)するという作用を有する。この例では、ckは5つの成分から構成される列ベクトルであり、これら5つの値はスケーリング・ファクタである。積Dckは、クロマトグラフ変動曲線に基づくクロマトグラフ・データqkに対するモデルである。ベクトルqkはサンプル吸光度qk jを含む。数式(2)で与えられる量を最小化するベクトルckを求めることが、この数式への最小2乗解を得ることであり、kだけずれたサンプルクロマトグラフ・データに最もよく当てはまるモデルが得られる。上記の量を最小化するベクトルckを与えるよく知られた解が、次の数式(3)で表される関係を用いて、フィルタ行列Fから得られる。
【0042】
【数3】
【0043】
このよく知られている式と最小二乗問題に対する解とは、Gilbert Strangによる「Introduction to Applied Mathematics published by Wellesley-Cambridge Press,Wellesley,MA 02182 USA(1986),p. 37」に説明がある。列ベクトルckの5つの成分は、スケーリングパラメータ(s,δ,r,bl,bo)のそれぞれの最小二乗評価であり、次の数式(4)により関係付けられる。
【0044】
【数4】
【0045】
次に、ステップ310で、選択されたインデクスkに対する最適モデルが、数式(5)を用いて、比較範囲の中にあるポイントの数(この例では、400個)と長さが等しい列ベクトルmiを生成させることによって得られる。
【0046】
【数5】
【0047】
数式(5)の右辺にある行列Dとベクトルckとの乗算は、パラメータ値ckを用いて行列Dijの列に重み付けを行い、その結果を加算するという効果を有する。こうして結果的に得られる和は、kだけずれたサンプルクロマトグラムに最もよく当てはまるモデルクロマトグラムを具体化する400個のポイントの組を構成するモデルmkである。
【0048】
ステップ312では、2つの曲線の間の差を取ることにより、モデルクロマトグラム(mi)とサンプルクロマトグラム(qi k)とを比較し、残差曲線(ri=mi−qi)を得る。量riは、モデルクロマトグラムとサンプルクロマトグラムとのポイントごとの差である。ステップ314では、残差曲線から、残差の2乗の和(S2)が数式(6)に従って、計算される。この残差の2乗の和は、残差値とも称され、モデルクロマトグラムに対するサンプルクロマトグラムのあてはめの精度の尺度となる。
【0049】
【数6】
【0050】
数式(6)の右辺は、数式(2)と数式(5)との組合せに等しい。
S2 kの値は、下記の数式(7)に示される関係を用いて正規化できる。正規化されたRkは、モデル・クロマトグラムとサンプルクロマトグラムとの間の百分率偏差(percentage deviation)として、S2 kを表している。
【0051】
【数7】
【0052】
ステップ314でいったん残差値が得られると、ステップ316でオフセット・インデクスをインクリメントさせ、その範囲にある各オフセット・インデクスに対してステップ308からステップ314までを繰り返す。最初にオフセット・インデクスを−kに選択し、次いで、各オフセット・インデクス値に対するS2値が生成されるまで、ステップ308、310、312および314を通過するそれ以後のパスのために、オフセット・インデクスを順にインクリメントさせる。図3ではインクリメントによってオフセット・インデクス値を変化させているが、値を変化させるのは、(kからデクリメントさせるなど)他の方法でもかまわない。ステップ318では、各オフセット・インデクスについて得られたSk 2の値の最小値(この明細書ではS2またはminS2と称する)が選択される。こうして得られた最小値が、最適のk*の値と、k*に関連するパラメータとを与えることになる。
【0053】
クロマトグラムが同一の混合物からのものであるときのS2の挙動のため、このようなS2の測定方法には意味がある。S2は、濃度変化とクロマトグラフ変動との影響を除去した後で差を測定しているので、S2およびシステムの残差誤差に特徴的なものに対して低い値が得られる。
【0054】
図6(a)から6(d)には、オフセット・インデクスk=0の場合の最適モデルの例が示されている。図6(a)には、k=0だけずれたIMC(実線)とサンプルクロマトグラム(点線)との点が示されている。図6(b)には、k=0だけずれたIMC(実線)とサンプルに最適に当てはまる最適モデル(点線)との点が示されている。図6(c)は、最適モデル(点線)とサンプルクロマトグラム(実線)を示している。これら2つの曲線から、Rd=15.8%という相対偏差(Rd)が得られる。図6(d)は、図6(c)のサンプルクロマトグラムとモデルクロマトグラムとの間のポイントごとの差であるある残差のプロットを示している。図6(d)における値の2乗の総和により、S2に対する値が得られる。
【0055】
図7(a)から(d)は図6(a)から(d)に類似しているが、オフセット・インデクスk=0の最適モデルの例を示している。IMC(実線)とサンプルクロマトグラム(点線)とが図7(a)に示されており、IMC(実線)と最適モデルのクロマトグラム(点線)とが図7(b)に示されている。図7(c)は、最良適合モデルのクロマトグラム(実線)とサンプルクロマトグラム(点線)とを示している。これら2つの曲線から、R4=4%という相対偏差が得られる。言うまでもなく、k=4の方が、k=0よりも良好な当てはめを生じさせる。図7(d)は残差値のプロットを示している。図6(d)の場合もそうであるが、このプロットにおける値の2乗の総和がS2の値を与える。
【0056】
また、値minS2は、2つのクロマトグラムの間の差の目安を与える。その際、これら2つのクロマトグラムが同一の混合物から得られたか異なる混合物から得られたかは問わない。同一のまたは類似する混合物から得られた複数のクロマトグラムを相互に比較することを通じてクロマトグラフ変動がいったん決定されると、異なる混合物からのクロマトグラムを標準クロマトグラムと比較することにより、ある異なる混合物が、標準クロマトグラムを生じさせた混合物と同一か異なるかを判断することができる。標準クロマトグラムを生じさせた標準混合物は基準標準または黄金標準と称されるが、多くの場合、この標準混合物を慎重に保管しておき、ごく少量ずつ、比較の際の基準物の一部として、週1回ベースで用いられる。分析担当者は、この基準となる混合物から1又は複数のクロマトグラムを得ておいて、新たに製造される混合物との比較に用いる。最も単純なケースでは、既に図1〜3を参照しながら論じたように、基準となる混合物から2つのクロマトグラム(標準クロマトグラムとサンプルクロマトグラム)を得ることになる。しかし、多くの場合は、図5に示されているように、基準となる混合物から複数(N種類)のクロマトグラムを得ておく。図5の場合には、基準となる混合物である混合物1から複数の標準クロマトグラム(標準クロマトグラム1,2,...,M)を得ている。1つの混合物からM個のクロマトグラムを得ることで、S2の値の統計的に有意な分布が得られ、偏差が大きなをクロマトグラムを分布値から除去することができる。データをこれ以外の方法を用いて収集することも可能である。例えば、臨床試験の場合、混合物が生物学的な供給源からのものであるときは、基準となる混合物を多く用いることがあり得る。一般に、ある値が分布の一部であるかどうかを決定する問題は、統計学でよく知られた問題である。この問題に対する可能な解法は、J. C. Miller and J. M. Millerによる「Statistics for Analytical Chemistry, published by Halsted Press:a division of John Wiley & Sons,New York(1988)」に記載されている。
【0057】
図1およびそれに付随する説明でわかるように、未知のすなわちサンプルとなる混合物は、任意の数を用いることが可能である。最も単純なシナリオでは、図1に示されているように、基準となる混合物をただ1つだけ(混合物1)使用し、混合物1から2つのクロマトグラム(標準クロマトグラムとサンプルクロマトグラム1)を得て、そして複数の未知の混合物(混合物2,3,...N)からそれぞれ1つのクロマトグラムを得る(サンプロクロマトグラム2,3,...N)。このようなシナリオにおいては、図2および図3に記載のように、標準クロマトグラムと複数のサンプルクロマトグラムとの比較から、5つの変動曲線、5つのスケーリング・パラメータ、整数であるオフセット、および残差値が得られる。残差値minS2が記憶され、以下の説明においては基準残差(reference residual)と呼ぶ。応用例に適した手法を用いて、この基準残差から、標準からの最大許容偏差を示す閾値を生成する。この閾値は、例えば、基準残差の整数倍であったり、固定された値であったりする。閾値は、また、同一の混合物から得られた複数のサンプルクロマトグラムと標準クロマトグラムとの比較から得られる基準残差の分布を分析して求めることもできる。
【0058】
次いで、標準クロマトグラムと複数の未知のサンプルクロマトグラムの中の1つとを比較する。標準クロマトグラムから得られた5つの変動曲線から、新たな5つのスケーリングパラメータ、新たな整数オフセット、新たな残差曲線、および新たな残差値minS2が各サンプルに対して得られる。最後に、各サンプルに対して得られる残差値(未知の残差)を閾値と比較する。未知残差が閾値より大きければ、その残差に対応する混合物は標準混合物とは異なる、と決定される。未知残差が閾値より小さければ、その未知混合物は標準混合物と同一である(あるいは、厳密に言えば、標準混合物とは、認識できるほどには異なっていない)と判断される。
【0059】
以上の議論では、1つの混合物から得られた1つのクロマトグラム比較領域を考察する場合の説明に重点をおいたが、既に示唆しておいた別の場合も存在する。例えば、上記の手法は、各クロマトグラムからのデータの比較範囲または比較部分が、重畳的でも非重畳的でもかまわないが、複数個ある場合にも適用可能である。トリプシンマップ(tryptic maps)を比較する際に有用であることが判明している比較方式として、ピーク幅が約5個または6個分の幅を有する1つの比較範囲を選択し、1つのピーク幅に相当する部分ごとの複数個の比較範囲を用いて比較を実行する方法がある。例えば、150個のポイントを含む1つの比較範囲を選択し、この比較範囲を約1〜5個のポイント分だけ移動させると、データの各ポイントは、約30個〜150個の連続的な比較範囲に含まれることになる。本明細書で「移動ウインドウ比較(moving window comparison)」と称するこのような比較方法では、残差値を各比較範囲の中心位置の関数としてプロットできる。また、複数の残差値を組み合わせて1つの複合値を構成することもできる。さらに、それぞれが個別の比較から導かれた1又は複数のスケール値(scale value)を、各比較範囲の中心点の関数としてプロットすることもできる。
【0060】
以上で説明した場合とは異なり、5つの変動曲線に反映された5つ未満の変動パラメータと5つのスケーリングパラメータとを用いる場合がある。一般に、5つの変動パラメータの一部としてその部分集合だけを用いる利点は、R及びS2に対する残差曲線(residual difference curve)と残差値(residual difference value)との、サンプルクロマトグラムに反映されるサンプル混合物の変化に対する感度が向上することである。また、それぞれの比較に要する計算時間が短縮される利点もある。計算時間の短縮は、計算集約的である上述した移動ウインドウ比較法の場合に有用である。もちろん、存在するクロマトグラフ変動の複数の成分を適切にモデル化するには、十分な数のパラメータを用いなければならない。例えば、比較領域が狭く、わずかに数ピーク分の幅にすぎないときには、対応する3つの変動曲線及び3つのスケーリングパラメータと共に、変動パラメータを3つだけ含むモデルを使用することが可能であろう。好ましい選択は、sによってパラメータ化されるスケールファクタ、δによってパラメータ化される保持時間オフセット、およびboによってパラメータ化されるベースラインオフセットである。狭い比較領域であれば、残りの2つの変動である保持時間の伸び(rによってパラメータ化される)と、ベースラインの勾配(blによってパラメータ化される)とは、有意的でない程度に小さいことがありうる。保持時間の伸びとベースラインの勾配とのいずれか一方を、第4の変数として考慮することもできるが、それは、第4の変数の追加が、クロマトグラフによって生じるこれらの効果に起因する変動によって正当化される場合である。
【0061】
追加的な部分集合は、ただ1つの変動パラメータであるスケールsで構成される。この部分集合が適切であるためには、ベースラインオフセットと勾配とは、それぞれの比較領域についてほぼ同じでなければならず、また、保持時間の伸びはほとんどゼロかまたはゼロでなければならない。この方法は、上述した3パラメータモデルや4パラメータモデルや、5パラメータモデルほどには効果的でない場合がある。特に、この方法は、サンプルピリオド(sample period)またはインデクスオフセットの整数に等しい保持時間オフセットの値をもたらす。しかし、この方法は、ピークの識別または特性付けを必要とすることなく、保持時間オフセットを測定できるという利点を有する。この方法は、さらに、濃度の比に対する値(スケール変化s、残差曲線、および残差値S2によって表される)を与えるという利点を有する。前記の1パラメータ法の欠点は、保持時間のシフトが、一般にはサンプルピリオドまたはインデクスオフセットの整数に対応しないという点である。我々は、パラメータδと保持時間シフトに関連した対応する曲線とを加えることによって、1つの変動パラメータsを使用する上記方法を改良することができる。この2パラメータ法では、サンプリングユニットの整数以外だけオフセットされる複数の曲線を比較するときには、インテグラルインデクスオフセット間で内挿され、これによって保持時間のシフトが正確に測定される。さらに、この2パラメータ法は、残差曲線とS2に対する値を生成するという利点を依然として有している。要するに、5個のパラメータを要素とする集合{s,δ,bo,r,bl}の有用な部分集合は、{s}、{s,δ}、{s,δ,bo}、{s,δ,bo,r}、{s,δ,bo,r,bl}である。
【0062】
図1、2および3を参照して説明した実施例は、汎用コンピュータ上で動作するプログラムとして実施するのが好ましい。マトラブ(MATLAB)プログラミング言語を用いた好ましい実装例のコードリストを以下に記載する。下記のリストは、米国マサチューセッツ州ネーティック01760のマス・ワークス社(The Math Works, Inc.)から市販されているマトラブ(MATLAB)プログラミング言語用の適当なインタープリタを用いた解釈によって実行可能な形に変換できる。
【0063】
【表2−A】
【0064】
【表2−B】
【0065】
【表2−C】
【0066】
言うまでもないことであるが、説明してきた特定のメカニズムと方法は、本発明の原理の1つの応用例を単に例示したにすぎない。本発明の真の精神と範囲を逸脱することなく、本発明の方法と装置に対する種々の改良形が可能である。
【図面の簡単な説明】
【図1】
HPLC機器に連結した好ましいクロマトグラフィ分析システムのブロック図である。
【図2】
好ましい実施態様の操作を示すためのインプットとして使用される標準クロマトグラムとサンプルクロマトグラムを示しているグラフである。
【図3】
好ましい実施態様の操作を示しているフローチャートである。
【図4】
図4(a)ないし4(e)は、好ましい実施態様によって生成されるクロマトグラフ変動データポイントを図2の標準クロマトグラムの関数として示しているグラフである。
【図5】
図1のシステムの別の使用状態を示しているブロック図である。
【図6】
図6(a)ないし6(d)は、異なったオフセット値に対する好ましい実施態様の操作を示しているグラフである。
【図7】
図7(a)ないし7(d)は、異なったオフセット値に対する好ましい実施態様の操作を示しているグラフである。
【図1】
HPLC機器に連結した好ましいクロマトグラフィ分析システムのブロック図である。
【図2】
好ましい実施態様の操作を示すためのインプットとして使用される標準クロマトグラムとサンプルクロマトグラムを示しているグラフである。
【図3】
好ましい実施態様の操作を示しているフローチャートである。
【図4】
図4(a)ないし4(e)は、好ましい実施態様によって生成されるクロマトグラフ変動データポイントを図2の標準クロマトグラムの関数として示しているグラフである。
【図5】
図1のシステムの別の使用状態を示しているブロック図である。
【図6】
図6(a)ないし6(d)は、異なったオフセット値に対する好ましい実施態様の操作を示しているグラフである。
【図7】
図7(a)ないし7(d)は、異なったオフセット値に対する好ましい実施態様の操作を示しているグラフである。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63144696A | 1996-04-12 | 1996-04-12 | |
US08/631,446 | 1996-04-12 | ||
PCT/US1997/006135 WO1997039347A1 (en) | 1996-04-12 | 1997-04-14 | Chromatographic pattern analysis system employing chromatographic variability characterization |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000508771A JP2000508771A (ja) | 2000-07-11 |
JP2000508771A5 true JP2000508771A5 (ja) | 2008-05-15 |
Family
ID=24531243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9537268A Pending JP2000508771A (ja) | 1996-04-12 | 1997-04-14 | クロマトグラフィー変動性の特性表示を利用するクロマトグラフィーパターン分析システム |
Country Status (6)
Country | Link |
---|---|
US (2) | US5969228A (ja) |
EP (1) | EP1015882B1 (ja) |
JP (1) | JP2000508771A (ja) |
AU (1) | AU2666897A (ja) |
DE (1) | DE69738773D1 (ja) |
WO (1) | WO1997039347A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6177559B1 (en) | 1998-04-24 | 2001-01-23 | Transgenomic, Inc. | Process for separation of polynucleotide fragments |
US6218153B1 (en) | 1997-10-31 | 2001-04-17 | Transgenomic, Inc. | Target DNA amplification by MIPC and PCR |
US6265168B1 (en) | 1998-10-06 | 2001-07-24 | Transgenomic, Inc. | Apparatus and method for separating and purifying polynucleotides |
US7225079B2 (en) * | 1998-08-04 | 2007-05-29 | Transgenomic, Inc. | System and method for automated matched ion polynucleotide chromatography |
US6455692B1 (en) | 1998-08-04 | 2002-09-24 | Transgenomic, Inc. | Method of concentrating polynucleotides using MIPC |
MXPA03000569A (es) * | 2000-07-20 | 2005-10-18 | Dow Chemical Co | Composiciones de acidos nucleicos que confieren fenotipo de enanismo. |
US6694265B2 (en) | 2000-09-08 | 2004-02-17 | Waters Investments Limited | Method and apparatus for determining the boundaries of a detector response profile and for controlling processes |
GB0305796D0 (en) | 2002-07-24 | 2003-04-16 | Micromass Ltd | Method of mass spectrometry and a mass spectrometer |
EP1586107A2 (en) * | 2002-11-22 | 2005-10-19 | Caprion Pharmaceuticals, Inc. | Constellation mapping and uses thereof |
WO2005079261A2 (en) | 2004-02-13 | 2005-09-01 | Waters Investments Limited | System and method for tracking and quatitating chemical entites |
JP2008507033A (ja) * | 2004-07-13 | 2008-03-06 | ウオーターズ・インベストメンツ・リミテツド | 高圧ポンプコントローラ |
JP5177949B2 (ja) * | 2005-11-11 | 2013-04-10 | アングルトライ株式会社 | スペクトル波形パターンのピーク位置補正方法およびプログラム |
WO2007104160A1 (en) * | 2006-03-14 | 2007-09-20 | Caprion Pharmaceuticals Inc. | Identification of biomolecules through expression patterns in mass spectrometry |
JP4985153B2 (ja) * | 2007-07-03 | 2012-07-25 | 株式会社島津製作所 | クロマトグラフ質量分析装置 |
EP2322922B1 (en) | 2009-08-26 | 2015-02-25 | Thermo Fisher Scientific (Bremen) GmbH | Method of improving the resolution of compounds eluted from a chromatography device |
US20120242489A1 (en) * | 2011-03-25 | 2012-09-27 | Siemens Aktiengesellschaft | Method and Computer Program Product for Processing Chromatograms Obtained by a Process Gas Chromatograph |
WO2012164955A1 (ja) | 2011-06-01 | 2012-12-06 | 株式会社ツムラ | パターンの評価方法、多成分物質の評価方法、評価プログラム、及び評価装置 |
US11576972B2 (en) | 2011-06-01 | 2023-02-14 | Tsumura & Co. | Method of formulating a multicomponent drug using bases evaluated by Mahalanobis Taguchi method |
KR101492895B1 (ko) * | 2011-06-01 | 2015-02-12 | 가부시키가이샤 쓰무라 | 패턴의 평가방법, 다성분 물질의 평가방법, 평가프로그램, 및 평가장치 |
US10527595B2 (en) | 2011-06-01 | 2020-01-07 | Tsumura & Co. | Method of and apparatus for formulating multicomponent drug |
US10802000B2 (en) | 2013-03-15 | 2020-10-13 | Dionex Corporation | Method of calibrating a chromatography system |
CN104007212B (zh) * | 2014-06-23 | 2016-07-06 | 华中科技大学 | 一种基于局部相似性匹配的色谱特征峰波段提取与分析方法 |
US9804136B2 (en) | 2014-09-18 | 2017-10-31 | Dionex Corporation | Automated method of calibrating a chromatography system and analysis of a sample |
JP6583433B2 (ja) | 2016-01-06 | 2019-10-02 | 株式会社島津製作所 | クロマトグラムデータ処理方法及び装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4353242A (en) * | 1980-12-16 | 1982-10-12 | University Of Utah Research Foundation | Multichannel detection and resolution of chromatographic peaks |
JPH0718853B2 (ja) * | 1984-05-15 | 1995-03-06 | 住友化学工業株式会社 | クロマトグラフイ−におけるデ−タ処理方法 |
US4835708A (en) * | 1987-07-06 | 1989-05-30 | Spectra Physics, Inc. | Method and apparatus for analysis of chromatograms using cross-correlation and moment analysis |
US5446575A (en) * | 1991-06-28 | 1995-08-29 | Digital Equipment Corp. | System for constructing and loading a table data structure based on an associated configuration data |
EP0636261A4 (en) * | 1992-04-16 | 1998-03-25 | Dow Chemical Co | IMPROVED METHOD FOR INTERPRETATION OF COMPLEX DATA AND FOR DETECTION OF DEFECTS IN AN INSTRUMENT OR PROCESS. |
US5528366A (en) * | 1994-01-27 | 1996-06-18 | Wyatt Technology Corporation | Precision determination for molecular weights |
-
1997
- 1997-04-14 AU AU26668/97A patent/AU2666897A/en not_active Abandoned
- 1997-04-14 JP JP9537268A patent/JP2000508771A/ja active Pending
- 1997-04-14 DE DE69738773T patent/DE69738773D1/de not_active Expired - Lifetime
- 1997-04-14 WO PCT/US1997/006135 patent/WO1997039347A1/en active Application Filing
- 1997-04-14 EP EP97918598A patent/EP1015882B1/en not_active Expired - Lifetime
- 1997-09-23 US US08/936,168 patent/US5969228A/en not_active Expired - Lifetime
-
1999
- 1999-06-07 US US09/326,933 patent/US6312575B1/en not_active Expired - Lifetime
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000508771A5 (ja) | ||
US5969228A (en) | Method and devices for chromatographic pattern analysis employing chromatographic variability characterization | |
Ricci et al. | Acquisition and processing of data for isotope-ratio-monitoring mass spectrometry | |
Rizzo et al. | Quantitative NMR in synthetic and combinatorial chemistry | |
EP0437829B1 (en) | Method for distinguishing mixtures of chemical compounds | |
EP0296781B1 (en) | Quantitation of chromatographic information | |
DE69124199T2 (de) | Fraktionsreinheitsmessvorrichtung für Chromatogrammpeak | |
EP0161672B1 (en) | Data processing system for chromatography | |
US20060255257A1 (en) | Method for quantitative analysis of mixtures of compounds | |
EP1669753B1 (en) | Peak pattern calibration | |
US4852017A (en) | Determination of peptide sequences | |
US5229298A (en) | Method of analyzing marker dye concentrations in liquids | |
JP2021148776A (ja) | ピーク解析方法及び波形処理装置 | |
JP2006292652A (ja) | ガスクロマトグラフ装置 | |
JP3550479B2 (ja) | クロマトグラフィ分析方法及びクロマトグラフィ分析装置 | |
Fasanmade et al. | Computer-aided time domain differentiation in high-performance liquid chromatography | |
JPS60104238A (ja) | 多波長同時検出による定量分析方法 | |
Castledine et al. | Strategies for peak-purity assessment in liquid chromatography | |
Weismüller et al. | Quantitative multicomponent analysis of complex mixtures by means of Full Spectrum quantitation and principal component analysis | |
JP2666838B2 (ja) | ガスクロマトグラフイ質量分析計を用いた定量分析方法 | |
JPH02300660A (ja) | 液体クロマトグラフィー | |
JPH08129002A (ja) | Sim法を用いたクロマトグラフ質量分析装置 | |
Clarkson et al. | Determination of ethanol in beer by direct injection gas chromatography: a comparison of six identical systems | |
US4181006A (en) | Quantitative chromatographic analysis without calibration | |
Crilly | Evaluation of Jansson's method for resolving overlapped gas chromatographic peaks |