JP3323512B2 - ディスタンス・アウトライア検知を使用した生物学的流体分析 - Google Patents

ディスタンス・アウトライア検知を使用した生物学的流体分析

Info

Publication number
JP3323512B2
JP3323512B2 JP50854897A JP50854897A JP3323512B2 JP 3323512 B2 JP3323512 B2 JP 3323512B2 JP 50854897 A JP50854897 A JP 50854897A JP 50854897 A JP50854897 A JP 50854897A JP 3323512 B2 JP3323512 B2 JP 3323512B2
Authority
JP
Japan
Prior art keywords
calibration
sample
data
collection
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP50854897A
Other languages
English (en)
Other versions
JPH11510604A (ja
Inventor
プライス,ジョン,エフ.
ロング,ジェームズ,アール
Original Assignee
ロシュ ダイアグノスティックス コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/587,017 external-priority patent/US5606164A/en
Application filed by ロシュ ダイアグノスティックス コーポレーション filed Critical ロシュ ダイアグノスティックス コーポレーション
Publication of JPH11510604A publication Critical patent/JPH11510604A/ja
Application granted granted Critical
Publication of JP3323512B2 publication Critical patent/JP3323512B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/27Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
    • G01N21/274Calibration, base line adjustment, drift correction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J3/00Spectrometry; Spectrophotometry; Monochromators; Measuring colours
    • G01J3/28Investigating the spectrum
    • G01J2003/2866Markers; Calibrating of scan

Landscapes

  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Description

【発明の詳細な説明】 仮出願への参照 出願人の先願の同時継続仮出願第60/001.950号に関す
る利益を主張する。
発明の背景 スペクトル分析は、材料のサンプルにおける分析対象
物を特定し計量することに広く利用されている。スペク
トル分析の一つの形式は、サンプルにより吸収される電
磁放射の量を計測するものである。例えば、赤外線分光
測光器は赤外線の放射をサンプルに指向させた上で、赤
外線波長の範囲にわたってサンプルによって吸収された
放射量を測定する。吸収スペクトルはプロットされ、波
長の関数としてサンプルの吸収を示す。ピークにおける
吸収の相対的大きさと波長を含む吸収スペクトルの形状
は、サンプル中の特定の分析対象物の特徴的な「指紋」
としての役目を果たしている。
吸収スペクトルは、サンプルに存在する分析対象物を
特定するのに使用される情報を提供することができる。
さらに、吸収スペクトルは、そのサンプルにおける個別
の分析対象物の濃度の定量分析に使用することも可能で
ある。多くの場合において、サンプル中の分析対象物の
吸収は、そのサンプル中の分析対象物の濃度に略比例す
る。吸収スペクトルがサンプル中の一つの分析対象物の
吸収を示すこれらの場合には、分析対象物の濃度はその
サンプルの吸収と濃度が判っている分析対象物を含む基
準サンプルの吸収を同じ波長で比較することにより決定
することができる。
血中ブドウ糖値のような生物学的流体分析対象物の濃
度測定のためにおこなう近赤外線分光法の一つの基本的
目的は、質の高いデータを収集することである。一貫し
たサンプルの準備とデータの取得により、信頼性のある
測定が確保されるように多大なる注意が払われるとはい
え、あらゆるデータを同様に器具の使用と臨床的な参照
実験によって生じたデータは、無数の原因からの誤差が
加わることによりその影響を受ける。データの大きな集
合においては、一般にアウトライア(outlier)と称す
る測定値の予測分布から極端にかい離している測定値が
多く含まれているのは希なことではない。アウトライア
が統計的誤差の結果であれ、系統的誤差の結果であれ、
アウトライアの検知は十分な確実性をもってそのような
誤差を含むサンプルを特定するので、そのようなサンプ
ルは、サンプリングの対象となった母集団に関しては特
異であると考えることができる。一組の測定値の中に少
数のアウトライアが含まれると、測定によって得られる
はずのキャリブレーションのモデルの等級を落とし台無
しにする可能性がある。
本願発明の方法と装置では、血中ブドウ糖値の測定値
のような生物学的分析対象物の測定のための化学計量分
析における誤差に少なくとも4つの潜在的原因が存在す
る。
第1の誤差原因は、サンプルの準備に関するものであ
る。血清のサンプルには、化学計量分析の前に大掛かり
な準備が必要である。この準備の間に、多くの要因がサ
ンプルに影響を与える。例えば、血液のサンプルが凝固
するのに許された時間は、含まれるフィブリノゲンにつ
いては、サンプルの連続性に影響する。凝固の程度は、
また遠心分離の質と最終的には血清の傾瀉に強く影響す
る。臨床試験のために用意されたサンプルは、基準とキ
ャリブレーションのために使用されるデータの質を決定
する。このデータは、最終的には予測能力の限界を設定
するものであるので、サンプルについては十分な注意を
払わねばならない。
誤差の第2の原因は、スペクトル測定過程に由来する
ことがある。例えば、データ収集中のサンプル含有物の
フローセルの使用は、基準となる食塩水のキャリオーバ
ーからの希釈効果と共に光路中の気泡のような問題を受
けることがある。これらの希釈効果は通常無視できる
が、光路中の気泡は珍しいことではないのでデータの質
に重大な影響を及ぼす。加えて、分析機器内で起こる機
械的又は電子的問題により生じる誤差はデータの質に重
大な影響を与えることがある。
第3の誤差原因もまた、基準テストに関連する。臨床
試験中の設計仕様書外の機器の制御と、少量のサンプル
による誤差は、上記のサンプルの準備に関連した誤差に
類似の影響がある。
第4の誤差原因は、おそらく最も特定と制御が困難な
ものでありサンプルの収集源、すなわち、生物学的な流
体を提供する個人に関連するものである。
個人から収集したサンプルは、まず第1に事前にサンプ
リングした母集団に対して極めて特異であるように見え
るが、実際はより大きなサンプリング母集団を考慮する
と通常のサンプルであるかも知れない。すなわち、想定
される特異なサンプルは、アンダーサンプリングの人工
的産物にすぎないかも知れないのである。
全てこれら誤差は、単独でも組み合わせでも、同じ個
人から略同じ時に収集したサンプルからの測定値に対し
て大きく矛盾する生物学的流体分析対象物の計算値に導
くことがある。これらの極端にかい離した値は、予測し
た平均値より大きな又は小さなオーダーの大きさである
が、生物学的流体分析対象物の濃度を予測するためのモ
デルを構築する前に特定されるべきアウトライアであ
る。
一組のデータからアウトライアを除去することは、寸
法が小さいとき、すなわち、各測定に関連したデータポ
イントの数が小さい場合は、プロットされたデータをグ
ラフで検査することで定量的で主観的な感覚で行うこと
が可能である。しかし、各測定に関連したデータポイン
トの数が大きい場合は、アウトライアの検知は残差分析
(residual analysis)のような多くの自動化可能な手
法により迅速で効率的に行うことが可能である。しか
し、そのような手法は、しばしば多くの誤差を生じ少な
くとも機器、特に、類型上、多要素な化学的測定に関連
した比較的高次元な機器における誤差を生じ易い。
発明の概略 正確で一貫した結果を確保するために、生物学的流体
分析対象物の測定、例えばブドウ糖濃度の測定のよう
な、化学的測定への応用は一定の期間にわたる多数の個
別テスト項目から得た多くの測定値が必要である。しか
しながら、一貫したサンプルの準備とデータの収集をも
ってしても、サンプルにおける自然の変化と予期せぬ誤
差は結果の精度を減じてしまうことになる可能性があ
る。さらに、これらの誤差は、経済的に収集しテストさ
れた比較的少量の生物学的流体サンプルによって拡大さ
れるのである。研究段階と最終的な使用にあたって取得
された全てのサンプルの適合性を評価するために、アウ
トライア検知の自動化技術が必要である。臨床研究中の
データの質は、キャリブレーションのモデルと結果に依
存したその後の研究の推進の方向を決定する。最終的な
使用において、取得したデータの目視検知は可能かもし
れないし、不可能かもしれない。たとえ、データの検知
が可能であっても、独立した客観性のある決定方法が必
要であり、これらは主観的な偏見を受けない。
本願発明の理解を助けるために、必須の事項を要約す
ると、本願発明は一般化したディスタンスに基づくアウ
トライア特定と除去を利用した生物学的流体分析対象物
の濃度を測定するための方法と装置に関するものであ
る。本願発明は、アウトライア値を特定し、データから
アウトライアの特定と除去をキャリブレーションのモデ
ル形成の前に行い、生物学的流体分析対象物の濃度決定
の精度を改良するものである。
本願発明は、生物学的流体のサンプル中の分析対象物
の濃度がサンプルに照射された電磁的な照射のスペクト
ル分析により調査される方法と装置に関するものであ
り、キャリブレーションデータを収集し、該キャリブレ
ーションデータを分析してキャリブレーションモデルを
使用してアウトライアを特定し除去し、キャリブレーシ
ョンモデルを構築し、未知のサンプルデータを収集し、
アウトライアを特定し除去するために該未知のサンプル
データを分析し、キャリブレーションモデルを使用して
未知のサンプルデータ内の非アウトライアの分析対象物
濃度を予測することを含む。
キャリブレーションデータの集合体の分析はデータの
前処理と、重複データの除去のためのデータの分解と、
一般化したディスタンス法を使用してアウトライアを特
定しクラスメンバーシップの可能性が低いとして除去す
ることを含む。
キャリブレーションモデルの構築は、主成分回帰、部
分最小2乗法、多重線形回帰、又は人工ニューラルネッ
トワークを使用することができ、これによりキャリブレ
ーションデータ集合体は主成分分析か、又は部分最小2
乗法を使用する有効な要素に帰することができ、回帰係
数と人工ニューラルネットワークのウェートの計算が可
能となる。
未知のサンプルデータは、データ前処理を使用して分
析され、その後にキャリブレーションモデルにより画定
された空間に投影されて、未知のサンプルデータ中のア
ウトライアの特定と、そのクラスメンバーシップの可能
性が低いとして除去することがこれに続く。未知のサン
プルの分析対象物の予測は未知のサンプルからのデータ
をキャリブレーションモデルにより画定された空間に投
影することを含み、これにより分析対象物濃度の決定が
可能となる。
本願発明の装置の第1の実施例はサンプルを導入する
ポンプを含み、該ポンプは管系統を循環してフローセル
を充填するので、該ポンプは還流停止又は還流継続運転
の両方が可能である。フローセルと検出器を収納するサ
ンプル区画ハウジングは、温度制御ユニットにより温度
が制御されている。比較的広い帯域幅の近赤外線源から
の光は、チョッパーホイールを通過するように指向さ
れ、該チョッパーホイールは検出器に関してチョッパー
同期ユニットにより同期されるので、本願発明の装置は
明暗両方の測定ができ、電子的なノイズが略除去され
る。変調された光線は、それからモノクロメータを通過
し、適宜な範囲にわたる連続的な放射波長の変動を許容
する。単色光は、フローセルを通過して検出器に当た
り、それによりサンプルを通して伝播した光の量が測定
される。測定データは、汎用マイクロプロセッサを有し
プログラム可能な汎用コンピュータに記憶され、本願発
明のその後の処理に使用される。加えて、コンピュータ
はポンプ、温度制御ユニット、チョッパー同期ユニッ
ト、チョッパーホイール、及びモノクロメータの作動を
制御もできる。
本願発明の装置の第2の実施例では、比較的広い帯域
幅の光源からの光はチョッパーホイールを通過し、しか
る後に変調された光がフィルターホイールを通過し、そ
れにより放射線の離散的な波長が選択されてフローセル
に伝達される。
本願発明の装置の第3の実施例では、複数のレーザー
ダイオードのような複数の狭い帯域幅の近赤外線源が設
けられており、予め選ばれた複数の波長で近赤外線を発
生させている。選ばれた狭い帯域幅の近赤外線源からの
光線が、ドライバにより検出器に同期してパルスの形で
送られ、フローセル106に入るように指向される。選ば
れた狭い帯域幅の近赤外線源と検出器の同期によって装
置は明暗双方の測定を行い、それにより重大な電子ノイ
ズは実質的に除去される。フローセルへ伝達するために
光線を発する狭い帯域幅の近赤外線源の各組の選択は好
適な順序、例えば、狭い帯域幅の近赤外線源の各組に連
続的にパルスを与えるようにコンピュータを設定して波
長を増やしたり減らしたりさせる順序で行うことができ
る。
本願発明の方法と装置のコンピュータによる実施は、
波長の関数としての伝達光線の強さの変化が検出器でデ
ジタル信号に変換され、該デジタル信号の大きさは、そ
の特定の信号に割り当てられた波長の透過放射線の強度
によって決定される。しかる後、デジタル信号は、処理
のために以下に説明するようにコンピュータの記憶装置
に保存される。
本願発明の方法のステップは、最初のステップとし
て、キャリブレーションモデルを構築するために使用す
るデータを収集することを含む。キャリブレーションデ
ータが収集された後に、スキャタリング(増加的)効
果、ベースラインシフト、器具ノイズ等のスペクトルア
ーティファクトを除去又は補償するためにデータ前処理
を施す。キャリブレーションデータの前処理は第nスペ
クトルデータ導関数、増加的スキャタリング補正、nポ
イントスムージング、ミーンセンタリング、バリアンス
スケーリングを計算することを含む技術と、レシオメト
リック法のグループから選択できる。
もし一旦データ前処理が生のキャリブレーションデー
タに施されると、キャリブレーションモデルが形成され
る。近赤外線スペクトルデータ変数は高度な相互関連付
けが行われ存在する重複情報のレベルを降下させるの
で、近赤外線スペクトルキャリブレーションデータはそ
れぞれがpの波長で測定されたn個のサンプルをあらわ
すn×pマトリックスに形成される。n×pマトリック
スは、主成分分析でn×nスコアトリックスに形成され
た一組のn、n次元スコアベクトルと、n×pローディ
ングマトリックスに形成された一組のn,p次元ローディ
ングベクトルに分解される。スコアベクトルは直交して
おり、nスペクトルサンプルがローディングベクトルと
変化の主たる源により画定された空間への投影を表す。
主成分分析は、一組のn固有ベクトルと一組のn固有
値、λ≧λ≧...≧λを発生させる。固有値は関
連する固有ベクトルにより説明された分散を表し、二つ
の組に分割できる。最初のq個の固有値が主固有値、λ
≧λ≧...≧λ、であり、データ内の分散の重大
な源の原因である。残りのn−q個の二次的な(誤差)
固有値、λq+1≧λq+2≧...≧λは、残りの分散と測
定ノイズを説明する。
主固有値qの数は、Fテストを介してq番めの固有値
の分散をプールされた誤差の固有値の分散と比較する反
復法によって決定される。さらに、減少した固有値は、
使用されると関連する固有ベクトルにより説明される情
報に比例した量で固有値に加重される。各サンプルのq
スコア値は、アウトライア検知の間に元のデータを表す
ために使用され、元のスペクトルはマトリックスをロー
ディングすることにより画定されたn×q次元の主成分
のサブ空間に投影される。アウトライアは、マハロノビ
スディスタンス(Mahalanobis distance)又はロバスト
ディスタンス(Robust distance)のような一般化され
たディスタンスを使用して特定することができる。サン
プルと一組のサンプルにより定義された重心の間の一般
化されたディスタンスは、その一組のサンプルの分散/
共分散マトリックスを使用して決定することができる。
真の分散/共分散マトリックスとサンプルの完全な組の
真の重心が未知の場合、完全な一組のサブ集合がおよそ
の分散/共分散マトリックスとおよその重心を形成する
のに使用される。さらに、各サンプルのスペクトルデー
タを表すために主成分スコアを使用して、情報内容を最
大化する独立の変数を得ることができ、反転可能なおよ
その分散/共分散マトリックスを確保する。マハタノビ
スディスタンスに対して、およその重心は、キャリブレ
ーションサンプルの集合の多変数の通常の分布と、キャ
リブレーションサンプルの集合のおよその分散/共分散
マトリックスの重心として決定することができる。これ
により重心と各キャリブレーションサンプルの間で測定
された標準偏差のユニットにおけるマハラノビスディス
タンスが見つけられる。ロバストディスタンスに対して
は、最小体積楕円面エスティメータ(MVE)を使用する
ことで、およその分散/共分散マトリックスとおよその
重心のロバスト評価値が得られる。あるいは、各キャリ
ブレーションサンプル用のロバストディスタンスを決定
するために投影アルゴリズムを使用してもよい。
キャリブレーションサンプルのための一般化したディ
スタンスを決定した後で、クラスメンバーシップの可能
性はカイ二乗分布関数又はホテリングのT統計(Hotell
ing's T−statistics)を利用した評価を含む多くの手
法で決定することができる。アウトライアは、比較的大
きな一般化したディスタンスで、結果的にメンバーシッ
プ可能性が比較的低いものとして特定される。およそ3
−5σより大なる信頼レベルで排除されるクラスメンバ
ーシップのサンプルは、アウトライアとして考えられ
る。特定した後に、キャリブレーションサンプル内のア
ウトライアを除去することができる。キャリブレーショ
ンサンプルから除去されたアウトライアの一般化された
ディスタンスは検査されて、追加的データ前処理が必要
であるか否か決定される。比較的多数のアウトライアが
非常に大きな一般化されたディスタンスを有する場合
は、キャリブレーションデータのさらなる前処理が表示
される。そのような追加的前処理の後にキャリブレーシ
ョンデータは再び分析に付される。一方、比較的多数の
アウトライアが非常に大きな一般化されたディスタンス
を有していない場合は、追加的データ前処理は不適当で
ある。
キャリブレーションモデルは、主成分回帰(PCR)、
部分最小二乗法(PLS)、多重線形回帰(MLR)及び人工
ニューラルネットワーク(ANN)を含む多くの手法のい
ずれを使用しても構築することができる。キャリブレー
ションモデルは、それぞれp波長で測定されたnサンプ
ルの吸収値を表す一組の独立変数を、nサンプルのそれ
ぞれの中の分析対象物の濃度を表す一組の従属又は応答
変数とをp次元回帰係数ベクトルを使用して相互に関連
付けることを目標とするものである。キャリブレーショ
ンモデルは回帰係数ベクトルを決定し、p波長での吸収
率のみを与えられた状態で、他のサンプル中の分析対象
物の濃度を予測するのに使用される。
上記のように、近赤外線スペクトルデータ変数は、相
互に極めて関連しており、測定波長を慎重に選択すると
特異性の問題を最小限に抑えることができるが、問題と
しているスペクトル領域は深刻な重複を受け、多成分系
をモデルするには極めて多数の波長が必要である。回帰
係数ベクトルを決定することと、同一の直線上にあると
いう問題に取り組むためにデータ圧縮を使用することで
重複するデータを重要な要素にまで減少することができ
る。主成分回帰法は、データ圧縮法を使用する一つの手
法である。部分最小二乗法も、又、重複データの問題に
取り組むのに使用される。
主成分回帰と部分最小2乗法の双方に関して、スコア
ベクトル、すなわち、キャリブレーションデータを十分
に表すキャリブレーションモデルに含まれる要素の適当
な数が決定される。最適な数の回帰の要素を選択する目
的は、豊富な予測能力を有する倹約型のモデルを得るこ
とである。含まれる要素が少なすぎるとキャリブレーシ
ョンの間の情報不足でモデルの性能が落ちるが、あまり
多すぎても良くない。主成分は、通常各主成分により説
明された変化量が単調に減少するように仕分けられる。
後順位の小さな固有値に関連した主成分は、測定ノイズ
を含むと考えられる。最初のq因子のみを使用し、残り
の因子を省略することにより、一種のノイズ排除が主成
分回帰内に導入される。回帰ステップ中に使用するため
の主成分分析又は部分最小2乗スコア又は因子の数は、
予測の標準誤差、予測の各集合に関連した誤差の測定を
使用して決定する。予測の各集合において使用される因
子の数に対して予測の標準誤差をプロットして、一個一
個を連続したグラフ表示が得られ、保持すべき因子の数
を決定するのに使用される。因子選別の一つの基準は、
最初の部分最小値を決定することである。因子選別の他
の技術は異なる数の因子を使用してモデルから予測の標
準的誤差を比較するためにFテストを使用している。
ある例では、分析されているデータは、容易にはキャ
リブレーション、練習用集合、実証、試験用集合に分割
されない。理由は使用できるサンプルの数が限られてい
るためか、あるいはデータを二つの集合に分割すること
により、その結果得た一つ又は双方の集合が十分にサン
プルの母集団を表さないからである。そのような状況で
は、一個を削除するクロスバリデーション(leave one
cut cross validation)の反復技術が使用され、そこで
は繰り返しの度にサンプルがキャリブレーション集合か
ら除外されてテストサンプルとして使用される。キャリ
ブレーションサンプルから決定された因子を使用した予
測モデルは、それからテストサンプル予測をするために
使用される。テストサンプルは、それからキャリブレー
ション母集団へと戻され、もう一つのサンプルが除外さ
れる。同様のプロセスがキャリブレーション母集団から
全てのサンプルが除外されてキャリブレーションサンプ
ルにより生じたモデルにより予測されるまで繰り返され
る。全ての予測は、蓄積されて評価の標準誤差を提供す
る。
有効因子の数を決定した後は、キャリブレーションモ
デルのためのデータの集合は有効因子に戻されて、キャ
リブレーションモデルのための回帰係数が決定される。
キャリブレーションモデルを構築した後には、キャリ
ブレーションモデルは問題の分析対象物の濃度が未知で
あるサンプルから収集したデータに応用することができ
る。未知のサンプルデータは、適当に前処理されてキャ
リブレーションモデルにより画定された主成分空間に投
影される。次に、未知のサンプルデータ集団のための一
般化されたディスタンスは、例えば、キャリブレーショ
ンデータに対して使用されるメハラノビス又はロバスト
ディスタンスを使用することで求められる。クラスメン
バーシップの可能性は、カイ二乗分布関数の評価とホテ
リングのT統計を利用する上記の手法を用いて見積もら
れる。そして、未知のサンプルデータ中のアウトライア
は約3−5σより大きい信頼レベルでクラスメンバーシ
ップを排除することを基礎にして特定される。本願発明
の最後のステップとして、未知のサンプルがアウトライ
アでない場合には、サンプルはキャリブレーションモデ
ルにより画定された空間に投影されて分析対象物の濃度
予測が行われる。一方、もし未知のサンプルがアウトラ
イアであった場合は、その未知のサンプルは排除され分
析対象物の濃度の予測は行われないが、もし可能であれ
ば、その未知のサンプルの再測定を行ってそのサンプル
がアウトライアであることをの確認を行う。
本願発明の装置に対して、方法についてこれまで記載
したステップは、そのような各ステップに従ってコンピ
ュータプログラムのコードセグメントを使用すること
で、コンピュータの汎用マイクロプロセッサに形成する
ことができる。
当業者が理解できるように、本願発明は図面を参照し
以降に行う発明の好適例の詳細説明により、さらに理解
できる実施例の範囲を包含するものであり限定するもの
ではない。
図面の簡単な説明 図1は、本願発明を示す生物学的流体分析対象物濃度
の測定のための装置の第1の好適例のブロック線図であ
る。
図2は、本願発明を示す生物学的流体分析対象物濃度
の測定のための装置の第2の好適例のブロック線図であ
る。
図3は、本願発明を示す生物学的流体分析対象物濃度
の測定のための装置の第3の好適例のブロック線図であ
る。
図4は、本願発明を表す生物学的流体分析対象物濃度
測定方法の最初のステップを表すフローチャートであ
る。
図5は、本願発明を表す生物学的流体分析対象物濃度
測定方法の中間のステップを表すフローチャートであ
る。
図6は、本願発明を表す生物学的流体分析対象物濃度
測定方法の最後のステップを表すフローチャートであ
る。
図7は、1580nmから1848nmの範囲で血中ブドウ糖のサ
ンプル111例から得た近赤外線スペクトルの主成分1に
対する主成分2の散布図である。
図8は、2030nmから2398nmの範囲で血中ブドウ糖のサ
ンプル111例から得た近赤外線スペクトルの主成分1に
対する主成分2の散布図である。
図9は、2030nmから2398nmの範囲で血中ブドウ糖のサ
ンプル111例から得た近赤外線スペクトルの主成分2に
対する主成分3の散布図である。
図10は、図7乃至図9に示されたデータから得た1100
nmから2398nmの範囲で、血中ブドウ糖のサンプル103例
のためのマハラノビスディスタンス計算値の棒グラフで
ある。
図11は、実際の血中ブドウ糖濃度に対する64.10mg/dL
の実証値の標準誤差を得る12の因子で最適化した部分最
小二乗法モデルから発生した2030nmから2398nmから得た
データを使用したサンプル103例から得た予測血中ブド
ウ糖濃度の散布図である。
図12は、実際の血中ブドウ糖濃度に対する27.43mg/dL
の実証値の標準誤差を得る8の因子で最適化した部分最
小二乗法モデルから発生した2030nmから2398nmから得た
データを使用したサンプル100例から得た予測血中ブド
ウ糖濃度の散布図である。
図13は、図7乃至図9に図示されたデータから得た15
80nmから1848nmの範囲の血中ブドウ糖のサンプル100例
のためのマハラノビスディスタンスの計算値の棒グラフ
である。
図14は、図7乃至図9に図示されたデータから得た20
30nmから2398nmの範囲の血中ブドウ糖のサンプル100例
のためのマハラノビスディスタンスの計算値の棒グラフ
である。
図15は、実際の血中ブドウ糖濃度に対する26.97mg/dL
の実証値の標準誤差を得る8の因子で最適化した部分最
小二乗法モデルから発生した2030nmから2398nmから得た
データを使用したサンプル95例から得た予測血中ブドウ
糖濃度の散布図である。
図16は、本願発明を使用したスペクトル範囲1580nmか
ら1848nmと2030nmから2398nmにわたる血中ブドウ糖111
例のためのアウトライア検知結果の要約を表すサンプル
の誤差原因を示す表である。
図17は、回帰の間に使用された因子の数に対する標準
予測誤差のグラフである。
好適例の説明 本明細書の以下の部分は、図面を参照して本願発明の
好適例を記述するものである。ここに記載された発明の
実施例は、商業的環境で発明を実施するために発明者が
考案したベストモードであるが、本願発明のパラメータ
の範囲で種々の改変例が可能であることを理解された
い。
本発明の詳細な説明のために図面を参照すると、まず
図1は生物学的流体分析対象物濃度測定のための装置の
第1の好適例を示すものである。装置100において、生
物学的流体サンプルはチューブ104を介してフローセル1
06に充填するためにポンプ102に導入される。ポンプ102
は、停止フロー(stopped flow)と連続フローの両方の
作動が可能である。サンプル用区画108には、フローセ
ル106と検出器110が設けられて温度制御ユニット112で
温度制御されている。比較的広い帯域幅の近赤外線源11
4からの光線はチョッパーホイール116を通過するように
指向される。チョッパーホイール116はチョッパー同期
ユニット118で検出器116に対して同期され、装置100が
明暗両方の測定を行うのを可能として電子的なノイズを
略除去している。変調された光線は、モノクロメータ12
0を通過し、適当な範囲にわたり放射線の波長の連続的
な変動を許容している。単色光は、フローセル106を通
過して検出器110に当たる。検出器110は、サンプルを等
化した光線の量を測定する。測定データは、汎用のマイ
クロプロセッサを有する汎用のプログラム可能なコンピ
ュータ124に保存されそこでデータは以下の説明のよう
にさらに処理されるために使用される。さらに、コンピ
ュータ124は、ポンプ102、温度制御ユニット112、チョ
ッパー同期ユニット118、チョッパーホイール116、及び
モノクロメータ120の動作も制御する。
図2に示す装置100の第2の実施例においては、比較
的広い帯域幅源114からの光線はチョッパーホイール116
を通過するように指向され、その後に変調された光線は
フィルターホイール130を通過して、それにより放射線
の離散的な波長が選択されてフローセル106に伝達され
る。
図3に示される本願発明の装置100の第3の実施例に
おいて、複数のレーザーダイオードのような狭い帯域幅
の複数の近赤外線源134は、予め選ばれた複数の波長で
近赤外線を放射するように設けられている。選ばれた狭
い帯域幅の近赤外線源134からの光線は、ドライバ138で
検出器110と同期してパルス化されてフローセル106に導
かれる。この選ばれた狭い帯域幅の近赤外線源134と検
出器110の同期は、装置100が明暗両方の測定を行うこと
を可能とし、電子的なノイズを略除去する。フローセル
106へ伝達されるべき光線を放出する狭い帯域幅の近赤
外線源134の集合体のそれぞれの選択は、適宜な順序、
例えば狭い帯域幅の近赤外線源の集合体のそれぞれを順
番にパルス化するようにコンピュータ124をプログラム
することにより波長の増加あるいは減少の順序で行うこ
とができる。
図1乃至図3において、本願発明の装置と方法のコン
ピュータの利用においては、帯域幅の関数として伝達さ
れた光線の強度の変化は検出器によりでデジタル信号に
変換され、該デジタル信号の大きさはその特定の信号に
割り当てられた波長で伝達された放射線の強度により決
定される。しかる後に、該デジタル信号はコンピュータ
124のメモリに保存されて以降に説明される処理に供さ
れる。
本願発明の方法におけるステップ1は、図4に符号で
表したようにキャリブレーションに使用するデータを収
集し、その後でキャリブレーションモデルを構築するこ
とに関するものである。キャリブレーションデータが収
集された後に、スキャタリング(増大)効果やベースラ
インシフトや機器ノイズのようなスペクトルアーティフ
ァクトの除去や補償を行うためにデータ分析やキャリブ
レーションモデル構築の前に生のスペクトルデータを前
処理する必要がしばしばあるので、ステップ2のデータ
前処理が行われる。キャリブレーションデータの前処理
は、スペクトルデータの第n導関数、増大するスキャタ
の補正、nポイントのスムージング、ミーンセンタリン
グ、バリアンススケーリング(variance scaling)、及
びレーショメトリック法の計算を含む手法のグループか
ら選択することができる。
何らかのデータ前処理が、一旦、生のキャリブレーシ
ョンデータに行われた場合は、キャリブレーションモデ
ルの形成に向かうステップが実行される。図4に示され
るようにステップ3を参照すると、近赤外線スペクトル
データ変数は高度な相互関連付けが行われる。存在する
重複情報のレベルを減少させるために、近赤外線スペク
トルキャリブレーションデータはそれぞれp波長でnサ
ンプルを表すn×pマトリックスXに形成され、主成分
分析で分解されてn×pスコアマトリックスTに形成さ
れた一組のn次元スコアベクトルとn×pローディング
マトリックスLに形成された一組のp次元ローディング
ベクトルになる。ここで、 X=TLt (1) ほとんどの分光学的技術の応用において、p>nであ
る。従って、分解はランクnのマトリックスXを分解し
てnランク1マトリックスの和にすることと考えらる。
スコアベクトルは、ローディングベクトルによって定め
られる空間へのXにおけるnスペクトルサンプルの投影
を表す。スコアマトリックスTは、Xの内部で発見され
た変動の主たる源を表しており、Tにおける列ベクトル
は直交している。
図4に示されたステップ4と5に関し、主成分の分析
は一組のn固有ベクトルと一組のn固有値、λ≧λ
≧...f≧λを発生させる。固有値は、関連した固有ベ
クトルで説明された分散を表す。固有値は二つの集合に
分割される。最初のqの固有値、λ≧λ≧...≧λ
は主固有値でデータ中の変化量の有効源を示す。残り
のn−qの2次的の又は誤差の固有値、λq+1≧λ
q+2≧...≧λは残りの変化量又は測定ノイズを示す。
図4のステップ6と7に関し、1次的固有値qの数
は、q番目の固有値をFテストを介してプールされた誤
差固有値の変化量を比較する反復法により決定される。
さらに、関連する固有ベクトルによって説明された情報
に比例した量によって固有値に加重する減少した固有値
が使用され、減少した固有値は として定義され、その結果、方程式2は として表現される。
主成分のサブ空間内のi番目のサンプルはtiのqのス
コア値により表現される。各サンプルのqのスコア値
は、アウトライア検知の間に元のデータを表現するため
に使用される。そうするにあたり、元のスペクトルがロ
ーディングマトリックスLにより画定されたn×q次元
の主成分サブ空間に投影される。
図4のステップ8と9にシンボリックに表されている
ように、アウトライアはマハラノビスディスタンス、又
はロバストディスタンスのような一般化されたディスタ
ンスを使用することにより特定される。一組のサンプル
の重心μとi番目のサンプルXiの間の一般化されたディ
スタンスは Di=[(xi−μ)Σ-1(xi−μ)1/2 (5) から決定される。式中Σは、サンプルの集合の分散−共
分散マトリックスである。真の分散−共分散マトリック
スとサンプルの完全な集合体の真の重心が決定できない
場合は、サンプルの完全な集合のサブ集合が適当な分散
−共分散マトリックスと適当な重心を形成するために使
用される。さらに、各サンプルのためのスペクトルデー
タを表すために主成分スコアを使用することにより、独
立の変数は直交するので情報は最大となり、不可逆な概
算分散−共分散マトリックスが確保される。
一般化されたディスタンスは、図4のステップ10aに
記載されたマハラノビスディスタンスでもよく、およそ
の重心はキャリブレーションサンプルの集合の多変数
の通常の分布の図心とキャリブレーションサンプルSの
集合のおよその分散−共分散マトリックスとして決定さ
れる。図心とi番目のキャリブレーションサンプルxi
間で測定された標準偏差のユニットにおけるおよそのマ
ハラノビスディスタンスMDiは MDi=[(xi−)S-1(xi−)1/2 (6) から決定される。式中、 である。
図4のステップ10bに示されたロバストディスタンス
に関し、最小体積楕円面エスティメータ(MVE)を使用
することにより、およその分散−共分散マトリックスS
Robustとおよその図心Robustのロバスト評価値が得ら
れ、i番目のキャリブレーションサンプルのためのロバ
ストディスタンスRDiから決定される。
あるいは、投影アルゴリズムが からのi番目のキャリブレーションサンプルのためのロ
バストディスタンスRDiを決定するために使用される。
ここでg=1,…,nであり、最小体積楕円面のスケールが により与えられ、最小体積楕円面の場所は により与えられるが、ここでxiはi番目のキャリブレー
ションサンプルを表すp次元ベクトルであり、vgは vg=xg−M (12) により定義されるg番目のキャリブレーションサンプル
を表すp次元ベクトルであり、ここでMは、Mのi番目
の成分はnベクトルxjのそれぞれのi番目の成分により
形成された集合の中央値によって与えられるようにされ
たp次元ベクトルである。g=1,…,nの各値に対して、
方程式10と11に使用された指数jは から決定され、ここでx1vg≦x2vg≦x3vg≦...≦xnvg
ある。
キャリブレーションサンプルのために一般化されたデ
ィスタンスを決定した後は、図4のステップ11において
クラスメンバーシップの可能性がカイ二乗分布関数の評
価やホテリングのT統計を使用した多くの手法で決定す
ることができる。ステップ12に示すように、アウトライ
アはクラスメンバーシップの比較的低い可能性をもたら
す結果となる比較的大きな一般化されたディスタンスを
有するとして特定される。一般的には、クラスメンバー
シップがおよそ3−5σの範囲での信頼レベルで排除さ
れる可能性のあるサンプルはアウトライアと考えられ
る。特定の後は、キャリブレーションサンプルのアウト
ライアはステップ13で示されたように除去される。さら
に、ステップ14で示されるように、キャリブレーション
サンプルから除去されたアウトライアの一般化されたデ
ィスタンスは、追加的データ前処理が必要かどうか決定
するために検査される。比較的多数のアウトライアが非
常に多くの一般化されたディスタンスを有する場合は、
キャリブレーションデータのさらなる前処理が示され
る。そのようなキャリブレーションデータのさらなる前
処理が示されると、その前処理の後でキャリブレーショ
ンデータはその前にステップ2で開始すると記載された
ステップに再び付される。一方、もし比較的大きな数の
アウトライアが非常に大きなディスタンスを有しない場
合は追加的データ前処理は適当でない。
その後、図5でのステップ15に示すように、主成分回
帰(PCR)、部分最小二乗法(PLS)、多重線形回帰(ML
R)、人工ニューラルネットワーク(ANN)を含む多くの
手法のいずれを使用してもキャリブレーションモデルは
構築できる。キャリブレーションモデルは、n×pマト
リックスXにより符号で表現されたpの波長で測定され
たnのサンプルの吸収値を表す一組の独立変数を、ベク
トルyにより符号で表現されたnのサンプルのそれぞれ
の中の分析対象物の濃度を表す一組の従属、又は応答変
数と関連付けることを求める。yはn次元ベクトルであ
るか、又はn×1マトリックスと考えられる。xとyに
ミーンセンタリングを施した後に、xとyの関係が y=Xb+ε (14) で表される。ここでbはp次元回帰係数ベクトル(p×
1マトリックス)であり、εはyにおける誤差を表すn
次元ベクトル(n×1マトリックス)である。キャリブ
レーションモデルは b=(XtX)-1Xty (15) を使用してベクトルbを決定する。
bに関する知識は、pの波長のそれぞれで吸収率のみを
与えられたうえで未知のサンプルにおける分析対象物y
の濃度を予測するのに使用される。
ステップ16において、分光学的データにおいて共線性
は固有のものであるから(XtX)-1の決定は困難であ
る。記述のごとく、近赤外線スペクトルデータ変数は高
度に相互関連している。測定波長を慎重に選択すれば特
異性の問題を最小限にすることができるが、問題のスペ
クトル領域は厳格な重複を受け、多成分系をモデル化す
るのには無数の波長が必要となる。データ圧縮は回帰係
数ベクトルbへの共線性の問題に取り組むのに使用で
き、重複データを有効因子に絞ることができる。
主成分回帰は、データ圧縮法を使用したベクトルbを
決定するための一つの技術である。主成分回帰における
最初のステップは、マトリックスXに形成されたキャリ
ブレーションデータに対して主成分分析をおこなうこと
である。スコアマトリックスTは、X中に存在する主な
変動源を表し、Tにおける列ベクトルは直交する。その
結果、主成分回帰における次のステップではTがXに代
わって使用され、およその値bが b=(TtT)-1Tty (16) を使用して求められる。ここで、(TTt)は反転可能(i
nvertible)である。
部分最小二乗法の手法は、重複データの問題に取り組
むためにも使用できる。部分最小二乗法と主成分回帰の
間の一つの相違は、スコアマトリックスTとローディン
グマトリックスLが生成される態様である。記載の通
り、非線形反復の部分最小二乗法(NIPALS)を使用した
主成分回帰においては、ローディングベクトルはXにお
ける変動への貢献の順序で一度に抽出される。各ローデ
ィングベクトルが決定される際には、それがXから除外
され、次のローディングベクトルが決定される。このプ
ロセスは、nのローディングが決定するまで繰り返され
る。部分最小二乗法においては、濃度yブロック情報
は、Xの繰り返しの分解中に使用される。Lに導入され
た濃度情報では、Tの値は濃度に関連していると共に、
有用な予測情報を主成分分析より先行する因子に当てら
れる。
主成分回帰と部分最小二乗法の双方に関して、キャリ
ブレーションデータを十分に表すキャリブレーションモ
デルに含まれるべきスコアベクトル又は因子の適当な数
について決定をしなければならない。回帰のための適正
数の因子を選択する目的は、ロバスト予測能力を有する
最小限モデルを得ることである。因子が少なすぎるとモ
デルの性能がキャリブレーションの間の情報不足で損な
われる。また、因子が多すぎても性能の質は低下する。
主成分は通常各主成分によって説明される変動量が単調
に減少するように順序立てて分類される。小さな固有値
に関連した後順位の主成分は、測定ノイズを含むと考え
られている。最初のqの因子のみを使用し残りの因子を
省略することにより、ある種類のノイズ拒絶は主成分分
析内に導入される。回帰ステップ中に使用する主成分分
析、又は部分最小二乗法のスコア若しくは因子の数q
は、次のようにして決定される。ランクnを有するマト
リックスXの場合には、nの予備的キャリブレーション
モデルが構築される。各予備的キャリブレーションモデ
ルは、1からnのスコアベクトルの範囲から選択された
異なる数のスコアベクトルを使用する。そして、予測手
法の標準誤差を使用してnの予備的キャリブレーション
モデルから予測が行われる。標準予備誤差(SEP)は予
測の各集合に関連した誤差の尺度であり、 により与えられる。ここで、テスト用集合サンプルの数
はnと =+(XLi)bi. (18) により与えられる。
kと符号をつけられそれぞれの組みの予測において使
用された因子(スコアベクトル)の数に対して予測の標
準誤差をプロットすることにより、図17のような一つ一
つ連続的なグラフ表示が得られ、保持すべき因子の数を
決定するために使用される。因子選択の一つの基準は、
最初のローカルミニマムを決定することである。図17に
図表化されたデータに対して最初のローカルミニマムを
適用することで、8の因子がキャリブレーションモデル
に選択される。図17の一般的な解釈は、有効な情報が1
から6の因子においてキャリブレーションモデルに導入
されているということである。7と8の因子が含まれる
ので、データに緻密さが含まれている。9乃至15の因子
については、キャリブレーション集合に特定の変動や測
定誤差がモデル化され、従って誤差が増える。因子選定
のもう一つの手法は、異なる数の因子を使用したモデル
からの予測の標準偏差を比較するためのFテストを使用
するものである。Fテストの因子最適化で、8因子モデ
ルの予測の標準偏差は6因子モデルの予測の標準偏差と
大差ないことがわかり、6モデル因子が最適であると思
われる。
ある例では、分析中のデータはキャリブレーション、
練習用集合と評価、試験用集合に分割されやすくない。
その理由は、限られた数の使用可能なサンプルにある
か、又はデータを二つの集合に分割して結果得た集合の
一つか双方が十分サンプルの母集団を表さないことにあ
る。そのような状況では、一個を削除するクロスバリデ
ーションの手法(technique of leaving one cut cross
validation)が使用され得る。一個を削除するクロス
バリデーションは繰り返しの手法であり、各繰り返しの
間で、一つのサンプルがキャリブレーション集合から除
外されてテストサンプルとして使用される。n−1のキ
ャリブレーションサンプルから決定された1乃至n−1
の因子を使用した予測モデルは、それからテストサンプ
ルの予測をするために使用される。それからテストサン
プルは、キャリブレーション集合に戻されて別のサンプ
ルが除外される。同じプロセスがすべてのnのサンプル
がキャリブレーション集合から除外され、n−1のキャ
リブレーションサンプルにより生成されたモデルにより
予測されるまで繰り返される。すべての予測が蓄積され
ると により与えられた評価の標準誤差(SEV)が得られる。
ここで下付き文字(i)は、i番目のサンプルを削除す
るリーブワンアウト反復を表すものである。そして評価
の標準誤差は標準予測誤差として処理される。
ステップ17に関して、図5に示されるように、有効因
子の数を決定した後に、キャリブレーションモデルのた
めのデータは有効因子に絞られ、キャリブレーションモ
デルのための回帰係数が決定される。
構築後は、上記のキャリブレーションモデルはサンプ
ルから収集されたデータに適用され、そこでは問題の分
析対象物の濃度が未知であり、図6でステップ18として
符号で示されている。未知のサンプルデータは、ステッ
プ19と図6で符号で示されているように、キャリブレー
ションデータに使用可能な前処理の手法に関して上記の
ものと類似の手法により適当に前処理される。前処理の
完了後、サンプルデータは、ステップ20において示され
た通り、キャリブレーションモデルによって既に画定さ
れている主成分空間に投影される。ステップ21において
は、未知のサンプルの一般化されたディスタンスは、マ
ハラノビス、又はロバストディスタンスのような一般化
されたディスタンスを使用しており、キャリブレーショ
ンデータに関して使用されたものである。クラスメンバ
ーシップの可能性は、カイ二乗分布関数、又はホテリン
グのT統計を使用することを含む上記の手法を用いて評
価される。次にステップ22を参照すると、未知のサンプ
ルアウトライアは、そこでおよそ3−5σの範囲内での
信頼レベルでのクラスメンバーシップの排除に基づいて
特定される。未知のサンプルがアウトライアでない場合
は、ステップ23aにおけるように、その未知のサンプル
がキャリブレーションモデルによって画定された空間に
投影されて、分析対象物の濃度の予測が行われる。しか
し、もし未知のサンプルがアウトライアであると、ステ
ップ23bにおけるようにその未知のサンプルは排除され
ねばならず分析対象物の予測は行われないが、もし可能
であればその未知のサンプルの再測定が行われて、真に
アウトライアであるかを確認する てめに再び分析される。
本願発明の装置に関して、本願発明の方法について記
述されたステップがコンピュータ124の汎用マイクロプ
ロセッサ上でそのような各ステップに従ったコンピュー
タプログラムのコードセグメントを用いてプログラムさ
れる。
使用に際しては、本願発明の方法と装置は、111人の
個人から得たサンプルからの血中ブドウ糖濃度データに
応用された。そのうち6のサンプルは近赤外線スペクト
ルを収集するための十分な血清を有しておらず、データ
操作の間に、連番の一体性を維持するために、データマ
トリックス内での位置を占めるためにゼロベクトルが使
用された。6のサンプルと関連する参考テストは、将来
の分析から省略された。他の2のサンプルは、参考テス
トの誤差と関連があり省略されデータ集合体には103の
サンプルが残った。
潜在的なアウトライアは、主成分スコアの2次元と3
次元のスキャタープロットの目視検査を通じて特定され
た。図7乃至図9は実行済みの二つのスペクトル領域の
別個の主成分分析を示すものである。ゼロのベクトル
は、参照符号200で示され、予測したようにデータの主
なグループから離れて存在している。参照番号23、67、
83で示すように、3のサンプルの近赤外線スペクトル
は、フローセルの光路中の気泡に起因する干渉を示して
いる。図7乃至図9に示されるように、そのような干渉
は主なグループからのサンプル23、67、85のディスタン
スにより示されたように使用されたスペクトルを横切っ
て存在する。図7においては、サンプル28と44は図8の
サンプル3と4がそうであるように、潜在的なアウトラ
イアと考えられる。図9においては、サンプル3、4、
44が潜在的なアウトライアである。
マハラノビスディスタンスは、図10に示すように、10
3のサンプルについて計算され、サンプル23、67、83が
他のサンプルよりはるかに大きなマハラノビスディスタ
ンスを有していると考えられる。さらに、図10、13、14
において省略されたサンプルはマハラノビスディスタン
スがゼロであるとして示されている。図10ではサンプル
3、4、44を含み、多くのその他のサンプルがアウトラ
イアの予備軍として現れている。以下に記述するよう
に、省略されたサンプル23、67、83についてデータがさ
らに分析に付され、データの集合体の中で100のサンプ
ルが残された。
一つのデータ集合体の中にアウトライアサンプルを含
めることの有害な影響は、図11と図12に示されている。
図11は、64.10mg/dLの標準評価誤差を獲得する12の因子
で最適化した部分最小二乗法モデルから生成された2030
nmから2398nmから派生したデータを使用した103のサン
プルからの予測血中ブドウ糖濃度を実際の血中ブドウ糖
濃度と対比させたスキャタープロットを示している。除
外されたサンプル23、67、83について、図12は、27.43m
g/dLの標準評価誤差を獲得する、8の因子で最適化され
た部分最小二乗法モデルから生成された、2030nmから23
98nmから派生したデータを使用した100のサンプルから
の予測血中ブドウ糖濃度を実際の血中ブドウ糖濃度と対
比したスキャタープロットを示している。全体のアウト
ライアが除去されると、本願発明の方法に使用される部
分最小二乗法の手法は、予測を改善しより簡単なモデ
ル、すなわち、因子の少ないモデルを使用できる。図11
に示されたサンプルは、およそ750mg/dLの予測値を有し
ており符号83で示されたサンプルに対応した。もし図11
のサンプル83が無視されて、図11の残りのサンプルが図
12のものと対比されると、図11の同定ラインの回りのデ
ータの広がりが大になることは明らかである。これらの
結果は、比較的少数のアウトライアの影響によってキャ
リブレーションモデルの全体の性能が著しく損なわれる
ことを示している。
100のサンプルの二つのスペクトル領域が、図13と図1
4に示される領域の各々について、マハラノビスディス
タンスでアウトライアごとに別個にテストされた。9の
サンプルが1580nmから1848nmの領域でのアウトライアと
なりうるとして印され、2030nmから2398nmの領域では6
のサンプルがアウトライアとなりうるとして印された。
図13と図14の対比から明らかなように、印を付けられた
サンプルは二つのスペクトル領域で異なっている。アウ
トライアは、3−5σの範囲であるとして選択された信
頼レベルで、いずれか又は両方のスペクトル範囲でのク
ラスメンバーシップから除外された印付きサンプルとし
て選択される。図7乃至図9に示すように、排除された
サンプルのうち、4例もまた主成分スコアプロットから
のアウトライアとなり得るとして特定された。5番目の
サンプルの特定は、マハラノビスディスタンスに関連し
た、より高次元の空間での検査を必要とした。
図16は、本願発明の方法及び装置を使用して検査され
た双方の主要スペクトル領域を表す95のサンプルの要約
を記載しており、95と100のサンプルデータの集合体及
び同じスペクトル領域を使用した血中ブドウ糖濃度の予
測は非常に類似した結果を生じさせた。図12に示された
100のサンプル集合体に対して26.97mg/dLのSEVに対する
予測誤差のわずかな減少は、2030nmから2398nmの領域に
対して、図15に示された95サンプルの集合体に対する結
果として生じたが、その相違は略1%の誤差減少を表し
ている。95%の信頼レベルでのFテストはこれを有効な
相違としなかった。多様な形態のデータ予備プロセッシ
ングによる他のスペクトル領域からの部分最小二乗法に
よる結果の比較は、類似の発見をもたらした。
もしマハラノビスディスタンスの閾値3.0がアウトラ
イアを決定するのに使用されると、89のサンプルの集合
体が結果としてできる。部分最小二乗法を使用すること
で、89のサンプルの集合体にリーブワンアウト(一つを
削除する)バリデーションは27.95mg/dLのSEVを結果と
して示し、これは100と95のサンプル集合体に対してや
や増加している。別個に、95サンプル集合体に関して89
のサンプル集合体において省略された6のサンプルが、
高いトリグルセリド濃度、又は高い合計蛋白値、又はそ
の両方を有するサンプルに対応すると決定された。6の
アウトライアの存在は、アンダーサンプリングのアーテ
ィファクトを構成した。すなわち、もし高いトリグルセ
リド濃度又は高い合計蛋白濃度を有するサンプルが元の
サンプルの集合体に存在すると、高いトリグルセリド濃
度又は高い合計蛋白濃度を有するサンプルはアウトライ
アとして印を付けられる可能性は減少する。
しかし、スペクトル応答に影響するトリグルセリド又
はその他の如何なる分析対象物へのアウトライア検知の
感度は有効である。高いトリグルセリドのサンプルが第
1のキャリブレーション集合体を形成する一方で、低い
トリグルセリドのサンプルが第2のキャリブレーション
集合体を形成するように、スペクトルデータは仕切られ
る。この結果として、新しいサンプルが本願発明の方法
及び装置でテストされて第1又は第2のキャリブレーシ
ョン集合体が新しいサンプルを表し、「類似の」キャリ
ブレーションスペクトルから決定される予測モデルの選
定が許容される。
本願発明は好適例で記載されたが、当業者の能力の範
囲内で発明の才を発揮することなく数多くの改変例又は
実施例が可能であることは明らかである。当業者によっ
て理解されるように、本願発明は光線の反射率と、光線
の透過を用いて得た生物学的流体分析対象物濃度を含む
代替の生物学的流体分析対象物の測定技術、その他侵入
的、非侵入的及び生体内の生物学的流体分析対象物測定
技術に関連して使用する手法を包含する。加えて、生物
学的流体分析対象物の測定は、本願発明の方法と装置を
使用したアウトライア検知によるトリグルセリド、コレ
ステロール、及び血清蛋白を含むものである。
フロントページの続き (72)発明者 ロング,ジェームズ,アール アメリカ合衆国 46038 インディアナ 州,フィッシャーズ,ファウンテンビュ ー レーン 11208 (56)参考文献 特開 平8−29332(JP,A) 特表 昭60−502269(JP,A) (58)調査した分野(Int.Cl.7,DB名) G01N 21/00 - 21/01 G01N 21/17 - 21/61 EUROPAT(QUESTEL) WPI/L(QUESTEL) 実用ファイル(PATOLIS) 特許ファイル(PATOLIS)

Claims (42)

    (57)【特許請求の範囲】
  1. 【請求項1】哺乳類の生物学的流体の分析対象物の濃度
    を決定するために使用するキャリブレーションモデルを
    形成する改良された方法において 複数の生物学的流体源からキャリブレーションサンプル
    の集合体を収集し、 複数の波長を有する近赤外線電磁放射線を発生させ、 該放射線の各波長の部分が前記キャリブレーションサン
    プルの各々を透過するように前記キャリブレーションサ
    ンプルの各々に前記放射線を照射し、 前記各波長で前記キャリブレーションサンプルの各々を
    透過させられた前記放射線の強度を測定してキャリブレ
    ーションデータの集合体を形成し、 前記キャリブレーションサンプルの集合体をnがキャリ
    ブレーションサンプルの数でありpが透過させられた放
    射線の強度が測定される波長の数である空間を画定する
    n×pマトリックスに形成し、前記キャリブレーション
    サンプルの集合体内の比較的大である変動の源が表され
    る空間のサブ空間を形成し、前記キャリブレーションデ
    ータの集合体を前記サブ空間に投影し、各キャリブレー
    ションサンプルとキャリブレーションサンプルの集合体
    により形成された分布の図心の間で前記サブ空間内に一
    般化されたディスタンスを決定し、予め選択された大き
    さより大なる一般化されたディスタンスを有するこれら
    のキャリブレーションサンプルとしてキャリブレーショ
    ンアウトライアを特定し、キャリブレーションアウトラ
    イアの除去の後に残るキャリブレーションサンプルから
    キャリブレーションサンプルの減少した集合体を形成す
    ることを含む、前記キャリブレーションデータの集合体
    の処理を施し、 キャリブレーションサンプルの減少した集合体からキャ
    リブレーションモデルを構築して生物学的流体の未知の
    サンプルの中の分析対象物の濃度を予測するステップを
    含むことを特徴とする方法。
  2. 【請求項2】請求項1に記載の方法において、前記サブ
    空間を形成するステップは、主成分分析によりマトリッ
    クスをn×n次元のスコアマトリックスとn×p次元の
    ローディングマトリックスに分解し、主成分分析でnの
    固有ベクトルの集合体と該固有ベクトルに関連し、大き
    さの減少する順序で配列したnの固有値の集合体を生成
    させ、前記固有値の集合体をqのより大の主固有値の集
    合体とn−qのより小の誤差固有値の集合体に分解し
    て、前記主固有値は前記キャリブレーションデータの集
    合体の内部で比較的より重要な変動源に関連し、前記誤
    差固有値はキャリブレーションデータの集合体の内部で
    比較的重要でない変動源に関連するようにし、前記ロー
    ディングマトリックスにより画定された前記空間から、
    n×q次元の主成分サブ空間として前記サブ空間を生成
    させることを含み、 前記キャリブレーションモデルを構築するステップは、
    前記キャリブレーションサンプルの減少した集合体を前
    記キャリブレーションサンプルの減少した集合体の中の
    分析対象物の濃度と相互に関連させる回帰係数マトリッ
    クスを形成し、該回帰係数マトリックスが各波長におい
    て透過させられた放射線の強度を与えられた生物学的流
    体の未知のサンプル内の分析対象物の濃度を予測するこ
    とに使用されることを含むことを特徴とする方法。
  3. 【請求項3】請求項1又は2に記載の方法において、前
    記一般化されたディスタンスの各々は下記の関係から決
    定されるマハラノビスディスタンスであり、 MDi=[(xi−)S-1(xi−)1/2 ここでMDiはi番目のキャリブレーションサンプルxi
    キャリブレーションサンプルの集合体の図心の間のマ
    ハラノビスディスタンスであり、S-1は前記キャリブレ
    ーションデータの集合体の反転させた(inverted)分散
    −共分散マトリックスであり、(xi−)は(xi
    )の転置行列であることを特徴とする方法。
  4. 【請求項4】請求項1又は2に記載の方法において、各
    一般化されたディスタンスは、最小体積楕円面エスティ
    メータと投影アルゴリズムからなるグループから選ばれ
    たアルゴリズムを使用して決定したロバストディスタン
    スであることを特徴とする請求項1又は2に記載の方
    法。
  5. 【請求項5】請求項1又は2に記載の方法において、前
    記キャリブレーションデータの集合体を処理する前記ス
    テップに先立ち、スペクトルアーティファクトを除去し
    補償するために前記キャリブレーションデータの集合体
    を前処理するステップをさらに含むことを特徴とする方
    法。
  6. 【請求項6】請求項5に記載の方法において、前記キャ
    リブレーションデータの集合体を前処理するステップ
    は、n次導関数、増大するスキャター補正、nポイント
    スムージング、メーンセンタリング、バリアンススケー
    リング及びレシオメトリック法からなるグループから選
    ばれたアルゴリズムを使用して行われることを特徴とす
    る方法。
  7. 【請求項7】請求項1又は2に記載の方法において、キ
    ャリブレーションサンプルの数に対するキャリブレーシ
    ョンアウトライアの数の割合を生成し、 前記割合は予め選択された割合より大であるか否かを決
    定し、 もし前記割合が予め選択された割合を越えている場合に
    はキャリブレーションデータの集合体を処理するステッ
    プに先立ちスペクトルアーティファクトを除去し、補償
    するために前記キャリブレーションデータの集合体を前
    処理するステップをさらに含むことを特徴とする方法。
  8. 【請求項8】請求項1又は2に記載の方法において、前
    記キャリブレーションアウトライアを特定するステップ
    は、キャリブレーションサンプルの集合体の各メンバー
    が予め選択された可能性分布関数により定義されたクラ
    スに属する可能性を決定することにより大きさを選択
    し、それによりクラスメンバーシップが予め選択された
    レベルより大なる信頼レベルで排除されるキャリブレー
    ションサンプルとしてキャリブレーションアウトライア
    が特定されることを特徴とする方法。
  9. 【請求項9】請求項8に記載の方法において、前記可能
    性分布関数は、カイ二乗法分布関数評価とホテリングの
    T統計評価からなるグループから選ばれたアルゴリズム
    を使用して形成されることを特徴とする方法。
  10. 【請求項10】請求項8項に記載の方法において、前記
    予め選択されたレベルは、可能性分布関数により定義さ
    れたおよそ3乃至5の標準偏差の範囲にあることを特徴
    とする方法。
  11. 【請求項11】哺乳類の生物学的流体の分析対象物の濃
    度を決定する改良された方法において、 複数の生物学的流体源からキャリブレーションサンプル
    の集合体と、生物学的流体の未知の源から未知のサンプ
    ルを収集し、 複数の波長を有する近赤外線電磁放射線を発生させ、 キャリブレーションサンプルと未知のサンプルの各々を
    前記放射線で照射して、放射能の各波長の部分がキャリ
    ブレーションサンプルと未知のサンプルを透過させ、 各波長で前記キャリブレーションサンプルの各々を透過
    した放射線の強度を測定してキャリブレーションデータ
    の集合体を形成し、未知のサンプルを透過した放射線の
    強度を測定してサンプルデータの集合体を形成し、 前記キャリブレーションデータの集合体を、nがキャリ
    ブレーションサンプルの数でpが透過させられた放射線
    の強度を測定する波長の数である空間を画定するn×p
    マトリックスにキャリブレーションデータの集合体を形
    成し、前記キャリブレーションデータの集合体の中の比
    較的大な変動源が表されている空間のサブ空間を形成
    し、該サブ空間内に前記キャリブレーションデータの集
    合体を投影し、各キャリブレーションサンプルと前記キ
    ャリブレーションサンプルの集合体によって形成された
    分布の図心の間でサブ空間内に一般化されたディスタン
    スを決定し、予め選択された大きさより大である一般化
    されたディスタンスを有するそれらのキャリブレーショ
    ンサンプルとしてキャリブレーションアウトライアを特
    定し、キャリブレーションアウトライアの除去の後に残
    るキャリブレーションサンプルからのキャリブレーショ
    ンサンプルの減少した集合体を形成することを含んで前
    記キャリブレーションデータの集合体を処理し、 未知のサンプル内の分析対象物の濃度を予測するために
    キャリブレーションサンプルの前記減少した集合体から
    キャリブレーションモデルを構築し、 前記モデルにより画定された空間内にサンプルデータの
    集合体を投影し、モデルに従って未知のサンプルに対す
    る一般化されたディスタンスを決定し、未知のサンプル
    の一般化されたディスタンスが前記予め選択された大き
    さより大である場合に、サンプルアウトライアとして前
    記未知のサンプルを特定し、未知のサンプルの一般化さ
    れたディスタンスが予め選択された大きさよりも大でな
    い場合には、前記モデルに従って前記未知のサンプル内
    の前記分析対象物の濃度を予測することを含んで、前記
    サンプルデータの集合体に前記キャリブレーションモデ
    ルを適用すること含むことを特徴とする方法。
  12. 【請求項12】請求の範囲11に記載の方法において、前
    記サブ空間を形成するステップが、主成分分析によりマ
    トリックスをn×n次元スコアマトリックスと、n×p
    次元ローディングマトリックスに分解し、主成分分析に
    よりnの固有ベクトルの集合体と該固有ベクトルに関連
    し減少する大きさの順序に配列されたnの固有値の集合
    体を生成させ、前記固有値の集合体をqのより大きな主
    固有値の集合体とn−qのより小さな誤差固有値の集合
    体に分割し、主固有値は前記キャリブレーションデータ
    の集合体の中で比較的より重要な変動源に関連し誤差固
    有値は前記キャリブレーションデータの集合体の中で比
    較的より重要でない変動源に関連しており、前記サブ空
    間をローディングマトリックスにより画定される空間か
    らn×q次元主成分サブ空間として生成させることを含
    み、 キャリブレーションモデルを構築する前記ステップが、
    キャリブレーションサンプルの減少した集合体を前記キ
    ャリブレーションサンプルの減少した集合体の中の分析
    対象物の濃度に関連させる回帰係数マトリックスを形成
    し、それにより各波長において透過した放射線の強度
    を、与えられた生物学的流体の未知のサンプル中の前記
    分析対象物の濃度を予測するのに前記回帰係数マトリッ
    クスが使用できることを特徴とする方法。
  13. 【請求項13】請求項11又は12に記載の方法において、
    キャリブレーションサンプルの集合体の一般化されたデ
    ィスタンスの各々は次の関係から決定したマハラノビス
    ディスタンスであり、 MDi=[(xi−)S-1(xi−)1/2 ここでMDiは、i番目のキャリブレーションサンプルxi
    とキャリブレーションサンプルの集合体の図心の間の
    マハラノビスディスタンスであり、S-1は前記キャリブ
    レーションデータの集合体の分散−共分散トリックスで
    あり、(xi−)は(xi−)の転置行列であり、モ
    デルによる未知のサンプルの一般化したディスタンスは
    次の関係から決定されるマハラノビスディスタンスであ
    り、 MDsample=[(xsamplemodel)S-1(xsample
    model1/2 ここでMDsampleは未知のサンプルとモデルの図心
    model の間のマハラノビスディスタンスであり、S-1 modelはモ
    デルの反転した分散−共分散マトリックスであり、(x
    sanplemodelは(xsanplemodel)の転置行
    列である方法。
  14. 【請求項14】請求項11又は12に記載の方法において、
    前記キャリブレーションデータの集合体の前記一般化さ
    れたディスタンスの各々は、最小体積楕円面エスティメ
    ータと、投影アルゴリズムからなるグループから選ばれ
    たアルゴリズムを使用して決定されたロバストディスタ
    ンスであることを特徴とする方法。
  15. 【請求項15】請求項11又は12に記載の方法において、
    キャリブレーションサンプルの数に対するキャリブレー
    ションアウトライアの数の割合を生成し、前記割合が予
    め選択された割合より大であるかを決定し、 前記割合が前記予め選択された割合を超える場合には、
    前記キャリブレーションデータの集合体を処理するステ
    ップに先立ち、スペクトルアーティファクトを除去し補
    償するためにキャリブレーションデータの集合体を前処
    理し、 前記割合が前記予め選択された割合を超える場合には、
    前記サンプルデータに対して前記キャリブレーションモ
    デルを適用するステップに先立ち、スペクトルアーティ
    ファクトを除去し補償するためにサンプルデータを前処
    理するステップをさらに含むことを特徴とする方法。
  16. 【請求項16】請求項11又は12に記載の方法において、
    前記キャリブレーションデータを処理するステップに先
    立ち、前記スペクトルアーティファクトを除去し補償す
    るためにキャリブレーションデータの集合体を前処理
    し、 前記キャリブレーションデータに対して前記キャリブレ
    ーションモデルを適用するステップに先立ち、前記スペ
    クトルアーティファクトを除去し補償するためにサンプ
    ルデータを前処理するステップをさらに含むことを特徴
    とする方法。
  17. 【請求項17】請求項16に記載の方法において、前記サ
    ンプルデータの集合体を前処理し、キャリブレーション
    データの集合体を前処理するステップは、第n次導関数
    と、増加的スキャタリング補正、nポイントスムージン
    グ、ミーンセンタリング、バリアンススケーリング、レ
    シオメトリック法からなるグループから選ばれたアルゴ
    リズムを使用して行うことを特徴とする方法。
  18. 【請求項18】請求項11又は12に記載の方法において、
    前記キャリブレーションアウトライアを特定するステッ
    プは、キャリブレーションサンプルの集合体の各メンバ
    ー予め選択された可能性分布関数により定義されたクラ
    スに属する可能性を決定することにより大きさを選択す
    ることを含み、それによりクラスメンバーシップが予め
    選択されたレベルより大である信頼レベルで排除される
    キャリブレーションサンプルとして特定され、サンプル
    アウトライアを特定するステップは、未知のサンプルの
    クラスメンバーシップの可能性が前記モデルにより予め
    選択されたレベルより大である信頼レベルで排除される
    かを決定することを含むことを特徴とする方法。
  19. 【請求項19】請求項18に記載の方法において、前記可
    能性分布関数は、カイ二乗分布関数評価とホテリングの
    T統計評価からなるグループから選ばれたアルゴリズム
    を使用して生成されることを特徴とする方法。
  20. 【請求項20】請求項18に記載の方法において、前記予
    め選択されたレベルが、可能性分布関数により定義され
    たおよそ3乃至5の標準偏差の範囲であることを特徴と
    する方法。
  21. 【請求項21】請求項12に記載の方法において、前記未
    知のサンプルと前記キャリブレーションサンプルの各々
    は、予め選択された範囲内の濃度を有する第2の分析対
    象物を含むことを特徴とする方法。
  22. 【請求項22】請求項21に記載の方法において、前記第
    2の分析対象物がトリグリセライドであることを特徴と
    する方法。
  23. 【請求項23】請求項22に記載の方法において、前記第
    2の分析対象物が全蛋白質であることを特徴とする方
    法。
  24. 【請求項24】請求項1、2、11又は12に記載の方法に
    おいて、キャリブレーションモデルを構築するステップ
    が、キャリブレーションサンプルの減少した集合体に対
    応するデータから重複するデータを除去することを含む
    ことを特徴とする方法。
  25. 【請求項25】請求項1、2、11又は12に記載の方法に
    おいて、キャリブレーションモデルを構築するステップ
    が、主成分回帰、部分最小二乗法、多重線形回帰及び人
    工ニューラルネットワークからなるグループから選ばれ
    たアルゴリズムを使用して行われることを特徴とする方
    法。
  26. 【請求項26】請求項1、2、11又は12に記載の方法に
    おいて、キャリブレーションモデルを構築するステップ
    が、主成分回帰、部分最小二乗法、多重線形回帰からな
    るグループから選ばれたアルゴリズムを使用して行わ
    れ、キャリブレーションモデルにて使用する最適数のス
    コアベクトルを選択し、それによりキャリブレーション
    サンプルの減少した集合体に対応するデータから重複す
    るデータを除去することを特徴とする方法。
  27. 【請求項27】請求項26に記載の方法において、スコア
    ベクトルの最適数を選択するステップが、 nの予備的キャリブレーションモデルを構築し、各予備
    的キャリブレーションモデルは1からnの範囲から選択
    された異なる数のスコアベクトルを使用しており、 予備的キャリブレーションモデルの各々のための予測の
    標準誤差を決定し、 スコアベクトルの最適数を決定するために予備的モデル
    のための予測の標準誤差を比較することを含むことを特
    徴とする方法。
  28. 【請求項28】請求項27に記載の方法において、予測の
    標準誤差の比較が、Fテストとローカルミニマムデター
    ミネーションからなるグループから選ばれたアルゴリズ
    ムを使用して行われることを特徴とする方法。
  29. 【請求項29】請求項2又は12に記載の方法において、
    前記固有値の集合体を分割するステップが、Fテストを
    使用して、q番目の固有値の分散をプールした誤差固有
    値の分散と比較する繰り返し法により前記主固有値qの
    数を決定することを含むことを特徴とする方法。
  30. 【請求項30】請求項29に記載の前記主固有値qの数を
    決定するステップが、関連固有ベクトルで説明された情
    報に比例した量で固有値を加重して、減少した固有値の
    集合体を生成することを含むことを特徴とする方法。
  31. 【請求項31】哺乳類の生物学的流体の未知のサンプル
    中の分析対象物の濃度を決定する装置であって、 未知のサンプルと複数の収集源から収集した生物学的流
    体のキャリブレーションサンプルの集合体を連続的に位
    置決めすることができる位置決めユニットと、 各波長の放射線を連続的にキャリブレーションサンプル
    と未知のサンプルの各々に対して指向させ部分的に透過
    させるように位置決めされ、予め選択さた波長で近赤外
    線を放射することのできる放射線エミッターと、 各波長で前記キャリブレーションサンプルの各々を透過
    した放射線を連続的に受けて強度を測定してキャリブレ
    ーションデータの集合体を生成し、未知のサンプルを透
    過した放射線を連続的に受けて強度を測定してサンプル
    データの集合体を生成するための近赤外線電磁放射検出
    器と、 前記検出器にコンピュータプログラムコードでプログラ
    ムした汎用マイクロプロッセサー有するコンピュータを
    接続して空間を画定するマトリックスに前記キャリブレ
    ーションデータの集合体を形成し、前記キャリブレーシ
    ョンデータ集合体内の比較的大きな変動の源が表される
    前記空間のサブ空間を形成し、該サブ空間に前記キャリ
    ブレーションデータの集合体を投影し、各キャリブレー
    ションサンプルと前記キャリブレーションサンプルの集
    合体によって生成された分布により定義された図心の間
    で前記サブ空間内の一般化されたディスタンスを決定
    し、キャリブレーションアウトライアを予め選択された
    大きさより大なる一般化されたディスタンスを有するそ
    れらのキャリブレーションサンプルとして特定し、キャ
    リブレーションアウトライアの除去の後に残るキャリブ
    レーションサンプルからキャリブレーションサンプルの
    減少した集合体を生成し、該キャリブレーションサンプ
    ルの減少した集合体からキャリブレーションモデルを構
    築して未知のサンプル中の分析対象物の濃度を予測し、
    前記モデルにより画定された空間にサンプルデータの集
    合体を投影し、モデルに従って未知のサンプルのための
    一般化したディスタンスを決定し、未知のサンプルの前
    記一般化されたディスタンスが前記予め選択した大きさ
    より大なる場合にサンプルアウトライアとして前記未知
    のサンプルを特定し、前記未知のサンプルの一般化した
    ディスタンスが予め選択した大きさより大でない場合は
    モデルに従って前記未知のサンプル中の前記分析対象物
    の濃度を予測することを特徴とする装置。
  32. 【請求項32】請求項31に記載の装置において、前記位
    置決めユニットは、 入力オリフィスと出力オリフィスを有するフローセル
    と、 前記入力オリフィスと出力オリフィスの間の流体接続部
    に配置されたポンプを含み、キャリブレーションサンプ
    ルの集合体と未知のサンプルの各々が、連続的に前記フ
    ローセルを通じて循環することを特徴とする装置。
  33. 【請求項33】請求項31に記載の装置において、前記位
    置決めユニットと前記検出器の温度を制御することがで
    きる温度制御ユニットをさらに含むことを特徴とする装
    置。
  34. 【請求項34】請求項31の装置において、前記一般化さ
    れたディスタンスの各々が次の関係から決定されるマハ
    ラノビスディスタンスであり、 MDi=[(xi−)S-1(xi−)1/2 ここでMDiはi番目のキャリブレーションサンプルとキ
    ャリブレーションサンプルの集合体の図心の間のマハ
    ラノビスディスタンスであり、S-1はキャリブレーショ
    ンデータの集合体の反転された(inverted)分散−共分
    散マトリックスであり、(xi−)は(xi−)の転
    置行列であることを特徴とする装置。
  35. 【請求項35】請求項31に記載の装置において、各一般
    化されたディスタンスは、最小体積楕円面エスティメー
    タと投影アルゴリズムからなるグループから選ばれたア
    ルゴリズムを使用して決定されたロバストディスタンス
    であることを特徴とする装置。
  36. 【請求項36】請求項31の装置において、前記放射線エ
    ミッターと前記検出器に連結されたノイズレデューサを
    さらに含み、前記キャリブレーションサンプルと前記未
    知のサンプルの各々を透過した放射線の部分の強度の測
    定においてノイズを減少させることができることを特徴
    とする装置。
  37. 【請求項37】哺乳類の生物学的流体の未知のサンプル
    中の分析対象物の濃度を決定する装置であって、 未知のサンプルと、複数の収集源から収集した生物学的
    流体のキャリブレーションサンプルの集合体を連続的に
    位置決めすることができる位置決めユニットを設け、該
    位置決めユニットは入力オリフィスと出力オリフィスを
    有するフローセルと、前記入力オリフィスと出力オリフ
    ィスの間の流体接続部に配置されたポンプを含み、前記
    キャリブレーションサンプルの集合体と前記未知のサン
    プルの各々が連続的に前記フローセルを通じて循環する
    ようにし、 予め選択さた波長で近赤外線を放射することのできる放
    射線エミッターを設け、該放射線エミッターは、各波長
    の放射線を連続的にキャリブレーションサンプルと未知
    のサンプルの各々に対して指向させ、部分的に透過させ
    るように位置決めされ、 各波長で前記キャリブレーションサンプルの各々を透過
    した放射線を連続的に受けて強度を測定してキャリブレ
    ーションデータの集合体を生成し、未知のサンプルを透
    過した放射線を連続的に受けて強度を測定してサンプル
    データの集合体を生成するために近赤外線電磁放射検出
    器を設け、 前記位置決め装置と前記検出器の温度を制御することが
    できる温度制御ユニットをさらに設け、 前記放射線エミッターと前記検出器に連結されたノイズ
    レデューサを含み、キャリブレーションサンプルと未知
    のサンプルの各々を透過した放射線の部分の強度の測定
    においてノイズを減少させ、 前記検出器にコンピュータプログラムコードでプログラ
    ムした汎用マイクロプロッセサー有するコンピュータを
    接続して、空間を画定するマトリックスに前記キャリブ
    レーションデータの集合体を形成し、キャリブレーショ
    ンデータ集合体内の比較的大きな変動の源が表される空
    間のサブ空間を形成し、該サブ空間にキャリブレーショ
    ンデータの集合体を投影し、各キャリブレーションサン
    プルと前記キャリブレーションサンプルの集合体によっ
    て生成された分布により定義された図心の間でサブ空間
    内の一般化されたディスタンスを決定し、キャリブレー
    ションアウトライアを予め選択された大きさより大なる
    一般化されたディスタンスを有するそれらのキャリブレ
    ーションサンプルとして特定し、キャリブレーションア
    ウトライアの除去の後に残るキャリブレーションサンプ
    ルからキャリブレーションサンプルの減少した集合体を
    生成し、該キャリブレーションサンプルの減少した集合
    体からキャリブレーションモデルを構築して未知のサン
    プル中の分析対象物の濃度を予測し、前記モデルにより
    画定された空間に前記サンプルデータの集合体を投影
    し、前記モデルに従って未知のサンプルのための一般化
    したディスタンスを決定し、未知のサンプルの一般化さ
    れたディスタンスが予め選択した大きさより大なる場合
    にサンプルアウトライアとして未知のサンプルを特定
    し、未知のサンプルの一般化したディスタンスが予め選
    択した大きさより大でない場合は前記モデルに従って前
    記未知のサンプル中の前記分析対象物の濃度を予測する
    ことを特徴とする装置。
  38. 【請求項38】請求項37に記載の装置において、一般化
    されたディスタンスの各々は次の関係から決定したマハ
    ラノビスディスタンスで、 MDi=[(xi−)S-1(xi−)1/2 ここでMDiはi番目のキャリブレーションサンプルxi
    キャリブレーションサンプルの集合体の図心の間のマ
    ハラノビスディスタンスであり、S-1はキャリブレーシ
    ョンデータの集合体の反転した(inverted)分散−共分
    散トリックスであり、(xi−)は(xi−)の転置
    行列であることを特徴とする装置。
  39. 【請求項39】請求項37に記載の装置において、各一般
    化されたディスタンスは、最小体積楕円面エスティメー
    タと投影アルゴリズムからなるグループから選ばれたア
    ルゴリズムを使用して決定したロバストディスタンスで
    あることを特徴とする装置。
  40. 【請求項40】請求項36、38又は39に記載の装置におい
    て、前記放射線エミッターは、比較的広い帯域幅の近赤
    外線電磁放射線源と前記放射線源と前記位置決めユニッ
    トの間に配置されたモノクロメータを含み、 前記ノイズレデューサは、前記放射線源と前記モノクロ
    メータの間に配置されたチョッパーと、前記チョッパー
    と前記検出器に動作可能に接続されたシンクロナイザー
    とをを含み、これにより前記放射線源からの放射線は前
    記モノクロメータへの透過を交互にブロックされ、それ
    により前記放射線源からの放射が前記チョッパーによっ
    てブロックされた時に前記検出器に発生した信号が前記
    放射線源からの放射線が前記チョッパーによってブロッ
    クされない時に前記検出器に発生した信号から差し引か
    れることを特徴とする装置。
  41. 【請求項41】請求項36、38及び39に記載の装置におい
    て、前記放射線エミッターは比較的広い帯域幅の近赤外
    線電磁放射線源と前記放射線源と前記位置決めユニット
    の間に配置されたフィルターホイールを含み、 前記ノイズレデューサは、前記放射線源からの放射線の
    前記モノクロメータへの透過が硬度にブロックされるよ
    うに、前記放射線源と前記モノクロメータの間に配置さ
    れたチョッパーと、前記放射線源からの放射線が前記チ
    ョッパーによりブロックされた時に前記検出器内に発生
    した信号が前記放射線源からの放射線が前記チョッパー
    にブロックされない時に前記検出器に発生した信号から
    差し引かれるように、前記チョッパーと前記検出器に動
    作可能に接続されたシンクロナイザーを含むことを特徴
    とする装置。
  42. 【請求項42】請求項36、38又は39に記載の装置におい
    て、前記放射線エミッターは、前記放射線源が予め選択
    された順番に動作されるように、前記コンピュータに接
    続された複数の比較的狭い帯域幅の近赤外線電磁放射線
    源を含み、 前記ノイズレデューサは、前記放射線源の集合体からの
    放射線が、前記ドライバーによりパルス化されない時
    に、前記ドライバーに発生した信号が前記放射線源から
    の放射線が前記ドライバーによりパルス化されない時に
    前記検出器に発生した信号から差し引かれるように、前
    記放射線源と前記検出器の各々に動作可能に接続された
    パルスドライバーを含むことを特徴とする装置。
JP50854897A 1995-08-07 1996-08-02 ディスタンス・アウトライア検知を使用した生物学的流体分析 Expired - Fee Related JP3323512B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US195095P 1995-08-07 1995-08-07
US08/587,017 US5606164A (en) 1996-01-16 1996-01-16 Method and apparatus for biological fluid analyte concentration measurement using generalized distance outlier detection
US60/001,950 1996-01-16
US08/587,017 1996-01-16
PCT/US1996/012625 WO1997006418A1 (en) 1995-08-07 1996-08-02 Biological fluid analysis using distance outlier detection

Publications (2)

Publication Number Publication Date
JPH11510604A JPH11510604A (ja) 1999-09-14
JP3323512B2 true JP3323512B2 (ja) 2002-09-09

Family

ID=26669720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50854897A Expired - Fee Related JP3323512B2 (ja) 1995-08-07 1996-08-02 ディスタンス・アウトライア検知を使用した生物学的流体分析

Country Status (5)

Country Link
EP (1) EP0846253A4 (ja)
JP (1) JP3323512B2 (ja)
AU (1) AU711324B2 (ja)
CA (1) CA2228844C (ja)
WO (1) WO1997006418A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822219A (en) * 1996-05-13 1998-10-13 Foss Nirsystems, Inc. System for identifying materials by NIR spectrometry
US6115673A (en) * 1997-08-14 2000-09-05 Instrumentation Metrics, Inc. Method and apparatus for generating basis sets for use in spectroscopic analysis
US7383069B2 (en) 1997-08-14 2008-06-03 Sensys Medical, Inc. Method of sample control and calibration adjustment for use with a noninvasive analyzer
DE19810917A1 (de) * 1998-03-13 1999-09-16 Buehler Ag Automatisches Kalibrationsverfahren
SE512540C2 (sv) * 1998-06-22 2000-04-03 Umetri Ab Metod och anordning för kalibrering av indata
EP1214579B1 (en) * 1999-08-31 2006-10-18 NIR Diagnostics Inc. Method of calibrating a spectroscopic device
JP4054853B2 (ja) * 2000-10-17 2008-03-05 独立行政法人農業・食品産業技術総合研究機構 近赤外分光法を用いた血液分析法
EP1488237B1 (en) * 2002-03-27 2011-05-11 GE Healthcare Bio-Sciences AB Method, system and computer program for detecting molecular binding interactions comprising response curve quality control
WO2003083757A2 (en) * 2002-03-28 2003-10-09 Epigenomics Ag Methods and computer program products for the quality control of nucleic acid assays
EP1668363A1 (en) * 2003-09-24 2006-06-14 Biacore AB Method and system for molecular interaction analysis
US8260556B2 (en) * 2008-08-21 2012-09-04 Bio-Rad Laboratories, Inc. Calibration surface method for determination on of analyte ratios
JP5206251B2 (ja) * 2008-09-05 2013-06-12 株式会社ニコン 利用対象推薦装置、利用対象推薦方法およびプログラム
CN102353643A (zh) * 2011-06-22 2012-02-15 中国林业科学研究院林产化学工业研究所 一种近红外漫反射光谱(nirs)快速测定油茶籽含油率的方法
US9606055B2 (en) * 2013-01-09 2017-03-28 Ppg Industries Ohio, Inc. Systems and methods for statistical measurement control of spectrophotometric data
WO2018060967A1 (en) * 2016-09-29 2018-04-05 Inesc Tec - Instituto De Engenharia De Sistemas E Computadores, Tecnologia E Ciência Big data self-learning methodology for the accurate quantification and classification of spectral information under complex varlability and multi-scale interference
CN106596465A (zh) * 2017-03-03 2017-04-26 东北农业大学 一种近红外光谱分析中的异常样本识别方法
US12001949B2 (en) 2018-09-05 2024-06-04 Sartorius Stedim Data Analytics Ab Computer-implemented method, computer program product and system for data analysis
EP3620983B1 (en) * 2018-09-05 2023-10-25 Sartorius Stedim Data Analytics AB Computer-implemented method, computer program product and system for data analysis
DE102019135877B4 (de) * 2019-12-30 2021-09-30 TRUMPF Venture GmbH System zur Messung des Vorhandenseins und/oder der Konzentration einer in Körperflüssigkeit gelösten Analysesubstanz
CN111967742B (zh) * 2020-08-05 2024-01-23 中国矿业大学(北京) 一种矿井突水水源级次快速判别技术方法
CN112229863A (zh) * 2020-09-30 2021-01-15 上海海关工业品与原材料检测技术中心 一种铁矿石的原产国或品牌的鉴别方法
CN113702317B (zh) * 2021-08-30 2023-10-27 中国农业科学院农业信息研究所 一种流域面源污染组分传感器、监测系统及方法
US20240109063A1 (en) * 2022-09-29 2024-04-04 Illumina, Inc. Dynamic optical system calibration

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5121338A (en) * 1988-03-10 1992-06-09 Indiana University Foundation Method for detecting subpopulations in spectral analysis
US4975581A (en) * 1989-06-21 1990-12-04 University Of New Mexico Method of and apparatus for determining the similarity of a biological analyte from a model constructed from known biological fluids
JPH05209826A (ja) * 1991-10-04 1993-08-20 Perkin Elmer Corp:The スペクトル比較方法および装置

Also Published As

Publication number Publication date
CA2228844A1 (en) 1997-02-20
EP0846253A4 (en) 2009-11-11
CA2228844C (en) 2006-03-14
EP0846253A1 (en) 1998-06-10
AU6644896A (en) 1997-03-05
AU711324B2 (en) 1999-10-14
WO1997006418A1 (en) 1997-02-20
JPH11510604A (ja) 1999-09-14
MX9801056A (es) 1998-05-31

Similar Documents

Publication Publication Date Title
JP3323512B2 (ja) ディスタンス・アウトライア検知を使用した生物学的流体分析
US5606164A (en) Method and apparatus for biological fluid analyte concentration measurement using generalized distance outlier detection
JP3130931B2 (ja) 試験サンプルの特性または組成あるいはその両方を推定する方法
CN101430276B (zh) 光谱分析中波长变量优选的方法
JP4216077B2 (ja) 非侵襲血液検体の予測のための限定された較正モデルを実行する多段階方法
EP0552300B1 (en) Spectral data measurement and correction
US6280381B1 (en) Intelligent system for noninvasive blood analyte prediction
JP3213307B2 (ja) 近赤外スペクトル解析による生物学的材料の特性予知法
US20070211247A1 (en) Visible/Near-Infrared Spectrometry And Its Device
WO2000042907A1 (en) System and method for noninvasive blood analyte measurements
JP3248905B2 (ja) 水分含量を有する生物学的物質の分析方法
EP2128599A1 (en) Analysing spectral data for the selection of a calibration model
WO2020105566A1 (ja) 情報処理装置、情報処理装置の制御方法、プログラム、算出装置、及び算出方法
Chen et al. A novel variable selection method based on stability and variable permutation for multivariate calibration
Wang et al. SVM classification method of waxy corn seeds with different vitality levels based on hyperspectral imaging
CN106960091B (zh) 一种鲜肉新鲜度K值的THz光谱快速无损检测方法
Chia et al. Neural network and extreme gradient boosting in near infrared spectroscopy
Liu et al. Optical properties combined with convolutional neural networks to predict soluble solids content of peach
Diaz-Olivares et al. Near-infrared spatially-resolved spectroscopy for milk quality analysis
JP2002506991A (ja) 自動較正方法
US11742059B1 (en) System and method for non-invasive quantification of blood biomarkers
Tencate et al. Penalty processes for combining roughness and smoothness in spectral multivariate calibration
EP4339602A1 (en) Method of performing machine learning of a small angle x-ray scattering measurement data analysis model
Cohen et al. Artificial neural network in predicting cancer based on infrared spectroscopy
MXPA98001056A (en) Analysis of a biological fluid using the detection of results in aisla intervals

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080628

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090628

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090628

Year of fee payment: 7

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090628

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100628

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100628

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110628

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110628

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120628

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees