JP2002541556A - 指標データの特性を識別する方法 - Google Patents

指標データの特性を識別する方法

Info

Publication number
JP2002541556A
JP2002541556A JP2000609916A JP2000609916A JP2002541556A JP 2002541556 A JP2002541556 A JP 2002541556A JP 2000609916 A JP2000609916 A JP 2000609916A JP 2000609916 A JP2000609916 A JP 2000609916A JP 2002541556 A JP2002541556 A JP 2002541556A
Authority
JP
Japan
Prior art keywords
index
data
response
peak
variance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000609916A
Other languages
English (en)
Inventor
ジャーマン,クリスティン・エイチ
ダリー,ドン・サイモン
アンダーソン,ケビン・ケイ
ワール,カレン・エル
Original Assignee
バッテル・メモリアル・インスティチュート
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by バッテル・メモリアル・インスティチュート filed Critical バッテル・メモリアル・インスティチュート
Publication of JP2002541556A publication Critical patent/JP2002541556A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/02Preprocessing
    • G06F2218/04Denoising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Operations Research (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Complex Calculations (AREA)
  • Nuclear Medicine (AREA)
  • Dc Digital Transmission (AREA)

Abstract

(57)【要約】 本発明は、指標データにおける特性を識別する方法、特に、複数の順位対として提供されるデータにおけるノイズから信号を区別するために有用な方法である。各順位対は、指標及びレスポンスを有する。本方法は、(a)第1の指標上に位置づけられた第1の窓端部を有し、第2の窓端部まで複数の指標を横切って延在する指標ウィンドウを提供する工程と、(b)指標ウィンドウ内の複数の指標に対応するレスポンスを選択して、レスポンスの分散度数をコンピュータで計算する工程と、(c)分散度数を分散臨界値と比較する工程と、を有する。本発明の利点は、信号対ノイズ比、信号ドリフト、ベースライン信号の変動性、及びこれらの組合せを最小化することである。

Description

【発明の詳細な説明】
【0001】
【発明の分野】
本発明は、指標データにおける特性を識別及び/又は特徴づける方法に関する
。本発明は、スペクトルデータにおける特性を識別して抽出するために、例えば
、ノイズから信号を区別するために、特に有用である。
【0002】 本明細書において、「指標データ」とは、レスポンスと呼ばれる計測値のセッ
トを意味する。各レスポンスは、1以上の隣接する要素に関連する。この関連性
は、例えば、カテゴリ的なもの、空間的なもの又は時間的なものであってもよく
、レスポンスデータのタイプを知ることによって及び/又はいかにしてレスポン
スデータが得られたかを知ることによって、明示的に述べるものでも又は黙示的
に理解されるものでもよい。各レスポンスに対して特異な指標が割り当てられる
場合には、データは指標化されたと考えられる。特異な指標は、一次元でも多次
元でもよい。順序列(指標値、レスポンス)のデータとして、一次元指標データ
を規定してもよい。この場合、指標値は、時間、距離、頻度、又はカテゴリなど
の物理的パラメータ値を示し、レスポンスは、制限されるものではないが信号強
度、粒子数又はアイテム数、又は濃度測定値を示す。多次元指標データセットの
例としては、各レスポンスについて特異な列アドレスと行アドレスとを有するマ
トリックスがある。
【0003】
【発明の背景】
顕著な又は有用な特性の識別及び/又は特徴付けは、指標データの分析におけ
る昔からの課題である。しばしば、この課題は、望ましくないノイズから所望の
信号を分離することで減少する。一過性の特性、特にピークが、対象になること
が多い。指標データにとって、連続した指標上のレスポンスにおいて、例えば上
昇及び低下などの偏差としてピークは現れる。しかし、バックグランドノイズの
現れも、指標データに対するレスポンスの偏差として生じる。
【0004】 伝統的には、閾値を下回るレスポンスを排斥することに基づくピーク検出が用
いられている。手動であろうが自動であろうが、未だに、閾値の選択は、任意且
つ主観的なオペレータ/分析者依存型の決定を必要とする。伝統的なピーク検出
の有効性は、ノイズに対する信号の比率、信号ドリフト、及びベースライン信号
変動によって影響を受ける。したがって、オペレータ又は分析者は、できるだけ
適合した信号を捕らえるために、指標の異なる領域におけるレスポンスに対して
、いくつかの閾値を適用しなければならないであろう。これは、再現が困難で、
実質的な信号損失を引き起こし、オペレータ/分析者を躊躇させる。
【0005】 例えば、MALDI-MS(マトリックス補助レーザー脱着/イオン化−マススペクト
ロメトリー:matrix-assisted laser desorption/ionization-mass spectrometr
y)に対する統計的分析方法の開発において、現行のピーク検出及び特徴付けア
ルゴリズムは、不適切である。MALDI-MSプロセスは、サンプルプレート上に置い
て、被験物をマトリックスと混合することで始まる。マトリックスは、所定のレ
ーザーにより放射される波長の光を吸収するように選択された化合物である。次
いで、レーザー光をサンプルに向けて、マトリックスは光エネルギを吸収し、イ
オン化するようになる。マトリックスのイオン化の結果、分析物を連続的にイオ
ン化し、分析物イオン100とする(図1)。検出器104にて電荷が印加され、印加
された電荷は分析物イオン100を飛行管(flight tube)102を通して検出器104に
引き寄せる。検出器104は、短時間間隔で到達したイオン類のアバンダンスを計
測する。時間ごとのイオン類のアバンダンスは、質量/電荷(m/z)比の関数と
してイオン類のアバンダンスに変換される。イオン類100は、検出器104の多重サ
ンプリングインターバルに広がる1分散パケットで検出器104に到達する。結果
として、イオン類100は、図2に示すような幾つかのm/z単位にわたってカウント
されるように束にされる。現行のアルゴリズムは、ユーザーに、検出閾値200を
特定化することを要求し、この閾値を超えるピーク202だけが検出され特徴づけ
られる。検出閾値手順は、概念形成的にアピールしており、イオン類が存在しな
い場合のm/z値をゼロ相対アバンダンスと読み、イオン類が存在する場合のm/z値
をピークとして表す。その機関(the instrument)によって作られたMALDI-MSピ
ークのリストは、あるユーザーがとある日に検出閾値200をどのように設定した
かに依存する。この人間の介在の必要性が、完全な自動化を不可能にし、MALDI-
MSスペクトルの正確な統計学的特性を作ることを困難にする多重性を誘発する。
【0006】 オペレータ、機械的及び実験的不確定性は、MALDI-MSスペクトルにノイズを付
加し、現行のピーク検出アルゴリズムの有効性をさらに減少させる。ユーザー規
定型閾値200を非常に低く設定すると、ノイズを誤ってピークとして特徴づけて
しまうことがある。しかし、ユーザー規定型閾値200を非常に高く設定すると、
小さなピークを誤ってノイズとして識別してしまうことがある。
【0007】 ノイズから信号を区別する問題に関しては、信号の不確定性を結びつけること
である。サンプルの繰り返し分析が、しばしば、わずかに異なる指標データを生
じさせることはよく知られている。
【0008】 よって、指標データ収集及び分析の分野において、スペクトル特性の識別/特
徴付けにおける多くの信頼性を提供し、及び/又は信号損失が少ない状態で、つ
まりロバスト(robust)で、低い信号対ノイズ比、信号ドリフト、ベースライン
信号変動及びこれらの組合せの不利な効果を最小化し、ノイズから信号を分離す
る場合における多くの信頼性を提供する指標データ処理方法が必要とされている
。加えて、信号の多次元不確定性を特徴づける方法も必要とされている。
【0009】
【発明の概要】
本発明は、従来の方法とは基本的に異なる指標データにおける特性を識別する
方法である。従来の方法は、レスポンスをレスポンス閾値と比較することに焦点
が向けられていたが、本発明は、指標との組合せとしてレスポンスを用いる。特
に、本発明は、指標のヒストグラムとしてレスポンスを考え、このヒストグラム
コンセプトを指標の分散度数を構築するために用いる。各指標に関連するレスポ
ンスを指標分散度数のヒストグラム頻度として用いる。指標分散を分散臨界値と
比較することで、顕著な又は有用な特性を決定する。よって、本発明の方法は、 (a)開始指標と終了指標とを有する指標のサブセットを選択し、 (b)指標のサブセットに対応するレスポンスのサブセットをヒストグラム頻度
として用いて、指標のサブセットの分散度数をコンピュータで計算し、 (c)分散度数を分散臨界値と比較する 各工程を含む。
【0010】 MALDI-MSの実施例において、指標値は質量(マス)/電荷比であり、レスポン
スは対応する強度である。各指標値は、質量/電荷比の物理的計測値を示し、そ
の対応する強度測定値は、その質量/電荷比において観察されるイオン類の相対
アバンダンスを示す。こうして、MALDI-MSスペクトルを質量/電荷比のヒストグ
ラム(すなわち、質量/電荷比の関数としてのイオン類の相対アバンダンス)と
して考えることができる。
【0011】 このヒストグラムコンセプトから、ヒストグラムの特性と、仮説ノイズに対す
る対応する特性と、を分布だけで比較することによって、特性を識別し特徴づけ
ることができる。本発明の好ましい実施形態において、ノイズに起因するスペク
トル特性から、信号に起因するスペクトル特性を区別するための臨界として、分
散を用いる。特に、ノイズだけが存在する場合には、指標値の分散は、幾らか小
さく、データの連続領域は、均一分布の分散を示すべきであり、各指標値の相対
アバンダンスは、対象領域を越えて一定であると予測される。一方、信号に起因
する特性が存在する場合には、データの小さな領域における指標値の分散は、均
一な分布に起因する分散とは、非常に異なるであろう。特性を識別してしまえば
、指標値の統計学的モーメントの種々の測定値を用いて、同様の態様で特徴付け
られる。
【0012】 したがって、本発明の目的は、指標の分散度数を用いて、指標データにおける
特性を識別する方法を提供することにある。 本発明の利点は、信号対ノイズ比、信号ドリフト、ベースライン信号の変動及
びこれらの組合せの効果を最小化することを含む。加えて、本発明は、閾値のユ
ーザー選択に対する必要性を最小化又は排除することによって、データ編集の自
動化を促進する。
【0013】 本発明の要旨は、特に特許請求の範囲において指摘されている。しかし、作用
機序及び操作方法は、さらなる利点及び目的と共に、添付図面を参照しながら、
以下の詳細な説明を参照することによって最もよく理解されるであろう。なお、
図面中、同様の要旨には同じ参照符合を付して示す。
【0014】
【好ましい実施形態の記述】
本発明は、指標データにおける特性を識別する方法である。指標データは、制
限されるものではないが、マススペクトロメトリー(MS)、ガスクロマトグラフ
ィー、及び核磁気共鳴分光分析、オージェ分光分析、及び/又は赤外線分光分析
及びラマン分光分析を含むプロセスから得られたスペクトルデータにより与えら
れるものでもよい。本発明は、さらに、他の形態のデータに適用することもでき
る。かようなデータとしては、制限されるものではないが、フーリエ波変換;財
務ストック(financial stock)又は債権市場(bond market)時系列などの時系
列データ;音響変換器又は他のセンサの出力;及び自動車交通量モニタリング又
は他のカウントプロセスを含む。
【0015】 指標は、制限されるものではないが、時間、距離、周波数、位置などの物理的
パラメータ、例えば人口データなどの識別パラメータ、指標数及びこれらの組合
せであってもよい。指標データは、制限されるものではないが、順序列(指標、
レスポンス)のセットを含む。指標データは、制限されるものではないが、2次
元マススペクトロメトリー(MS-MS)、2次元ガスクロマトグラフィー(GC-GC)
、2次元フーリエ変換、及びこれらの組合せを含む多次元分析からのデータを含
む。
【0016】 本発明の特に有用な用途は、スペクトルピークの決定又は識別/特徴付けであ
る。この用途において、ピークは、比較的小さい信号強度に起因するピーク誤差
(peak missed)を最小化する完全自動化客観的態様で、ノイズから抽出される
【0017】 ピークは、移動ウィンドウ方法(moving window method)を用いて、各指標値
における指標分散度数を計算することによって抽出される。すなわち、各指標値
について指標分散度数は、連続するサブセット、指標及び対応するレスポンスの
又は隣接するウィンドウを用いて計算される。本発明の好ましい実施形態におい
て、指標分散度数は、各指標値上で中心決めされたウィンドウに対して計算され
る。しかし、第3又は第4の指標値ごとなど少ない指標値に対して指標分散度数
を計算することも、本発明の範囲内である。ウィンドウは、信号ピークの幅であ
ることが好ましい。ウィンドウの幅は、対象の特性に依存して変えることができ
る。
【0018】 分散度数は、制限されるものではないが、平方偏差(variance)、平均二乗誤
差、歪度、尖度、絶対偏差、トリムド(trimmed)、重みつき、及びこれらの組
合せを含むモーメント推定である。
【0019】 スペクトルピークは、分散臨界値の上又は下(基準(reference datum)と選
択された分散度数とに依存する)の分散値によって認定され又は識別される。よ
って、ノイズが分散臨界値を上回る分散を有する際に、ノイズは信号強度から分
離され得る。数百から数千のデータポイントを有する好ましい操作において、ピ
ークは、均一な分散についての予測分散度数に対する指標分散度数の比を用いて
、好ましく識別される。特に、ピークは、連続して比率が分散臨界値を下回る位
置にあるものとして、つまり、複数の重みつき度数が分散臨界値を下回る位置に
あるものとして、決定される。分散臨界値は、種々の方法を用いて選択すること
ができる。かような方法としては、制限されるものではないが、ユーザーによる
優先選択、すべてのデータベースに対して定数として、又は分散度数を特徴づけ
てピークが存在するか否かに対して臨界値を構築することに基づく統計学的技術
を含む。好ましい実施形態において、分散臨界値は、データセットのノイズレベ
ル、及びピークが存在しないウィンドウでの分散度数の変動により決定される。
特に、分散臨界値は、以下のように自動化された態様での各データセットに対し
て決定される。分散σにおける変動は、すべてのウィンドウを横切る分散度数の
平方偏差のロバスト推定(robust estimate)を用いて特徴づけられる。ロバス
ト推定は、分散の推定平方偏差値がピークにより影響されように用いられる。分
散臨界値は、1-kσ(ここで、kは正の数、通常は2.5〜3である)として決定さ
れる。1-kσを下回る均一な分布についての分散に対する指標分散の連続比率は
、ピークを含むものとして決定される。このアプローチは、信号対ノイズ比、信
号ドリフト、ベースライン信号変動及びこれらの組合せに不感応性である。
【0020】 本発明の制限されない例示は、MALDI-MSピークに対する適用である。MALDI-MS
ピークに対するモデルは、マトリックス及び分析物のレーザーによるイオン化の
後、始まる。本発明のコンセプトは、イオン類の大部分が中心付近で緻密に塊に
なっているある確率分布に従って分散しているイオン類のパケットを考慮するこ
とによって、適用される。イオン類のアバンダンスは、イオンパケットのm/z値
の周りに緻密に集中して、ピークを形成するであろう。1パケット内のイオン類
がランダムに分散しているので、パケットが広がっている部分(すなわちピーク
幅)でのm/z値の数はもまたランダムに変動可能であり、機器の検出器特性に依
存する。ピークの幅、分布形状又はタイプ、並びにピーク高は、すべて所定のピ
ークの特徴付けに寄与する。よって、伝統的な閾値検出方法のように単にピーク
高を考慮するのではなく、本発明は、重みとしてピーク高を用いて、指標に対す
る分散度数を得る。したがって、検出器により報告されたイオン類のアバンダン
ス(レスポンス)対時間(指標)は、ヒストグラム(図3:m/z単位の関数とし
てm/z単位の粒子の相対数)として考えることができ、これから分散度数を得る
ことができる。各m/z値に対する粒子寄与は、ポアソンランダム変数であり、一
方、ノイズ寄与は、化学的ノイズ(ポアソンランダム変数)及び熱電気(ジョン
ソン)ノイズ(通常のランダム変数)の組合せである。
【0021】 操作において、ウィンドウはスペクトル上に位置づけられる。ウィンドウは、
対応する測定レスポンス(例えば強度)を有する連続指標値(例えばm/z値)の
小さな範囲を有する。ウィンドウ内にピークが存在しない場合には、量の分布は
、そのウィンドウに亘って比較的フラットになり、粒子が均一にランダムに到達
し、ノイズだけが存在することを示す。この場合、検出器に到達する粒子は、均
一な分布を有する。MALDIスペクトルのヒストグラムとしてのモデル化によって
、分散は、このウィンドウ内部で、
【0022】
【数1】
【0023】 (ここで、Ikはポイントkにおけるスペクトルの強度であり、mkはポイントk
におけるm/z値であり、μはウィンドウ内の中央m/z値である。) によりコンピュータで計算されるm/z値の平方偏差となるであろう。ピークが存
在しない場合には、この平方偏差は、均一な分布の平方偏差と同じとなるべきで
ある。一方、ウィンドウ内にピークが存在する場合には、粒子はイオンパケット
のm/z値の周囲に非常に凝集するであろう。この場合には、ウィンドウ内部のm/z
値の平方偏差は、均一な分布の平方偏差よりも小さくなる(なぜなら、粒子は、
ウィンドウ全体に均一に分散するよりもむしろウィンドウの中央に、より緻密に
集中するからである。) 当業者には理解されるように、本発明は、(1)で与えられたような分散を用 いる特性の検出及び特徴付けに限定されない。特に、絶対偏差などの分散のロバ スト度を用いてもよい。加えて、対象の特性の他の特徴を用いて、制限されるも のではないが質量中心(centoroid)及び第3の又はより高いモーメントを含む
特性、あるいは対象のロバスト推定を検出してもよい。
【0024】 この観察は、ピーク検出及び特徴付けアルゴリズムに対する基準を提供する。
特に、小さな範囲のm/z値を含むウィンドウが生じて、このウィンドウ内部のm/z
値の平方偏差がコンピュータで計算される。コンピュータで計算された平方偏差
は、均一な分布に対する対応する平方偏差によって分割される。この平方偏差比
が非常に小さなものである場合には、アルゴリズムは、ウィンドウ内にピークが
存在することを決定する。次に、ウィンドウを右又は左に少しだけ移動させて、
プロセスを繰り返す。ピークが存在しない場合には、平方偏差比は1に近い。ピ
ークがウィンドウから出ると、ウィンドウの最外端部におけるm/z値の高い集中
ゆえに、平方偏差比は増加する。ピークが、ウィンドウの中心を通って移動する
と、平方偏差は臨界閾値よりも下がり、平方偏差が均一な分布に対して予想され
るよりもはるかに小さいことを示す。最後に、ピークがウィンドウを去ると、ウ
ィンドウのより低い最外端部におけるm/z値の高い集中ゆえに、平方偏差比は再
び増加する。
【0025】 ピークが検出されてしまうと、残っているすべては、高さ及び位置等のピーク
特性を推定するようになる。実際、ピーク位置は、典型的に質量中心(centroid
)を用いて推定される。本発明の方法において、質量中心は、単に全指標(例え
ばm/z値)の平均である。質量中心が非対称ピーク形状により有利に影響され得
るので、ピークの中央に近い値だけを用いてピーク位置を推定することが好まし
い。ヒストグラムのテールにおけるポイントの推定は、統計学的にはトリミング
(trimming)と呼ばれ、より高いロバスト(robust)、再現可能な結果を生じさ
せ得るので、本発明において好ましい。ピーク高は、典型的には、最大強度又は
ピーク下の面積のいずれかを用いて推定される。最大強度を用いることにより、
結果的に、ノイズ感応性で所定のm/z値の存在するイオン類の相対数を必ずしも
反映しないピーク高を与える。一方、ピーク下の面積は、存在するイオン類の相
対数をより良好に反映するが、傾斜したピークに感応できない。本発明にとって
、ピーク高に対する2種の推定を構築することが好ましい。(1)平滑化された
(smoothed)最大強度、及び(2)トリムドピーク下面積。ピーク高に対して平
滑化された最大強度を用いる場合には、ノイズ感応性は、ピーク中心に近い強度
の加重平均全体を通して減少する。トリムドピーク下面積を用いる場合には、傾
斜したピークに対する感応性が減少する。実施例1 本発明の実用性を示すために実験を行った。図4は、Bacillus. Cereus及びPa
ntoea agglomeransの混合物に対する未処理MALDIマススペクトルを示す。図5は
、スペクトル全体に亘ってすべてのウィンドウに対する指標分散度数を示す。約
0.98での直線は、分散臨界閾値を示す。この閾値よりも下がっている複数の指標
分散度数は、ピークが識別された領域を示す。図6は、このアルゴリズムによっ
て選択されたピークを示す。ここで、ピーク高は、ピーク下面積として推定され
、ピーク位置は、トリムド手段を用いて推定された。追試データセット 本発明の別の側面は、1サンプルについて少なくとも2回の追試のデータセッ
トを分析するために特に有用である。追試データセットから、(1)レスポンス
の予測値の推定、及び(2)指標の予測値の推定が得られる。指標値及び計測さ
れたレスポンスの両者に対する少なくとも2回の追試からのデータの不確定性又
は平方偏差もまた得られる。予測値の推定及び不確定性の推定を一緒に示すこと
で、分析者は追試データ及びこれらの間の関係を非常に容易に理解することがで
きる。
【0026】 特に、レスポンスの予測値に対応する長さの垂直棒は、レスポンスに対応する
各指標の予測値に位置づけられる。加えて、各垂直棒の頂部に中心決めされた不
確定性領域は、推定ピーク位置及び高さにおける結合された不確定性を示す。各
ピークにとって、不確定領域のサイズ及び形状は、可視化されているスペクトル
の内在する確率論的性質及び得られるプロットを使用する目的(intended usage
)に依存する。ディスプレイは、ディスプレイの水平軸に沿って立っている(st
anding on end)不規則に間隔の空いた種々のサイズのロリポップの集まりに似
ている。
【0027】 好ましい実施形態は、追試の平均及び追試スペクトルにおける大半の変動を囲
包する不確定性領域を用いる。特に、各スペクトルピークに対する不確定性領域
は、独立に構築されてもよく、追試ピーク高及び追試ピーク位置の標準偏差由来
で正規分布と考えられるピーク位置及びピーク高の95%以下を包囲してもよい。
したがって、不確定性領域のサイズを試験することによって、分析者は、再現性
を決定する際に重要な考慮事項である一つ目の試験から次の試験まで追試がどの
程度変化したかを可視化することができる。
【0028】 当業者には、異なる不確定性の統計学的推定を用いてもよいことが理解される
であろう。特に、ピーク高及びピーク位置の95%変動領域を可視化することに代
えて、信頼区間を推定されたピーク高及びピーク位置の正確さを可視化するため
に用いてもよい。不確定性区間は、ピーク高及びピーク位置を独立に考慮しても
よく、ピーク高及びピーク位置の両者を組み入れた結合不確定性領域を用いても
よい。ピーク高とピーク位置との間の統計学的修正は、不確定性区間に組み入れ
られてもよい。最後に、追試ピークの存在における不確定性は、各ピークの基部
に、ピークが現れた追試の部分をディスプレイすることによって可視化されても
よい。実施例2 実施例1の手順に従って、Bacillus cereusのMADLI-MSを3回の追試でピーク
を識別して、図7a、7b及び7cに示した。6000〜7000m/z単位の間の追試ピ
ークに対する相対ピーク高(レスポンス)及び相対ピーク位置(指標)を平均化
して、図8にプロットした。加えて、ピーク高及びピーク位置が独立で正規分布
しているとの仮定を用いて、ピークの相対高及び相対位置のt-分布及び標準偏差
を用いて、ピーク高及びピーク位置に対する95%変動区間を推定した。次に、不
確定性領域を各ピーク推定の頂部を矩形中心決めしたものとして示した。同様の
条件下で収集したすべての追試の95%のピーク推定は、不確定性領域に現れると
予測される。
【0029】
【むすび】
本発明の好ましい実施形態を示し、記載してきたが、本発明の広い側面から逸
脱しない限りに置いて、多数の変更及び変形がなされてもよいことが、当業者に
は明らかであろう。したがって、特許請求の範囲は、発明の範囲内にある限りか
ような変更及び変形を含むものである。
【図面の簡単な説明】
【図1】 図1は、MALDI-MS機器(従来技術)の断面図である。
【図2】 図2は、ピーク検出閾値を有するMALDI-MSスペクトル強度対質量/電荷比であ
る(従来技術)。
【図3】 図3は、本発明による強度対種々の質量/電荷比のヒストグラムである。
【図4】 図4は、微生物の混合物のMALDI-MSスペクトルである(実施例1)。
【図5】 図5は、分散臨界値と一緒の図4のスペクトルに対する分散度数である。
【図6】 図6は、本発明の方法から識別されたピークのグラフである。
【図7】 図7aは、細菌サンプル上で実施した第1のMALDI-MSランからのピークを示す
。 図7bは、図7aで用いたと同じ細菌サンプル上で実施した第2のMALDI-MSラ
ンからのピークを示す。 図7cは、図7aで用いたと同じ細菌サンプル上で実施した第3のMALDI-MSラ
ンからのピークを示す。
【図8】 図8は、垂直棒の頂部に中心決めされた不確定性領域を伴う図7a、7b及び
7cからのピークの合成平均としてのピーク(ロリポッププロット)を示す。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,TZ,UG,ZW ),EA(AM,AZ,BY,KG,KZ,MD,RU, TJ,TM),AE,AL,AM,AT,AU,AZ, BA,BB,BG,BR,BY,CA,CH,CN,C R,CU,CZ,DE,DK,DM,EE,ES,FI ,GB,GD,GE,GH,GM,HR,HU,ID, IL,IN,IS,JP,KE,KG,KP,KR,K Z,LC,LK,LR,LS,LT,LU,LV,MA ,MD,MG,MK,MN,MW,MX,NO,NZ, PL,PT,RO,RU,SD,SE,SG,SI,S K,SL,TJ,TM,TR,TT,TZ,UA,UG ,UZ,VN,YU,ZA,ZW (72)発明者 ダリー,ドン・サイモン アメリカ合衆国ワシントン州99352,リッ チランド,ハウエル 2050 (72)発明者 アンダーソン,ケビン・ケイ アメリカ合衆国ワシントン州99352,リッ チランド,レイクビュー・コート 312 (72)発明者 ワール,カレン・エル アメリカ合衆国ワシントン州99352,リッ チランド,ベイ・コート 2449 Fターム(参考) 5B056 BB64 BB66 HH01

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 レスポンスの指標データの特性を識別する方法であって、 (a)開始指標及び終了指標を有する指標のサブセットを選択し、 (b)上記指標のサブセットに対応する上記レスポンスのサブセットをヒストグ
    ラム頻度として用いて、上記指標のサブセットの分散度数(a measure of dispe
    rsion)をコンピュータで計算し、 (c)上記分散度数を分散臨界値と比較する 各工程を含むことを特徴とする方法。
  2. 【請求項2】 請求項1に記載の方法であって、前記開始指標及び終了指標は
    、第2の分散度数をコンピュータで計算するための少なくとも1個の指標として
    次に進められることを特徴とする方法。
  3. 【請求項3】 請求項2に記載の方法であって、前記分散臨界値は、分散バッ
    クグラウンド値を越えることを特徴とする方法。
  4. 【請求項4】 請求項3に記載の方法であって、ノイズは前記分散臨界値を上
    回る重みづけ度(weighted measure)に対応するデータとして識別され、信号は
    前記分散臨界値を下回る重みづけ度に対応するデータとして識別されることを特
    徴とする方法。
  5. 【請求項5】 請求項4に記載の方法であって、前記分散臨界値を下回る前記
    重みづけ度は、連続指標を有する複数の重みづけ度であることを特徴とする方法
  6. 【請求項6】 請求項1に記載の方法であって、1サンプルに対して、少なく
    とも2回の追試データセットを繰り返すことを特徴とする方法。
  7. 【請求項7】 請求項6に記載の方法であって、さらに、指標及び指標に対応
    するレスポンスの両者について少なくとも2回の追試からのデータの期待値の推
    定と不確定性の推定とを得る工程を含むことを特徴とする方法。
  8. 【請求項8】 請求項7に記載の方法であって、さらに、前記期待値の推定と
    、前記不確定性の推定とを一緒にディスプレイする工程を含むことを特徴とする
    方法。
  9. 【請求項9】 請求項1に記載の方法であって、前記データは、スペクトルデ
    ータ、クロマトグラフデータ、時系列データ(time series data)、及びこれら
    の組合せからなる群より選択されることを特徴とする方法。
  10. 【請求項10】 請求項1に記載の方法であって、さらに、特性を特徴づける
    ための指標の加重統計データをコンピュータで計算する工程を含むことを特徴と
    する方法。
  11. 【請求項11】 1サンプルからの少なくとも2回の追試データセットであっ
    て、各データセットは指標に相関したレスポンスを有するデータセットを報告す
    る方法であって、 上記指標及び上記レスポンスの両者に対する少なくとも2回の追試スペクトル
    データセットからのデータの期待値の推定と不確定性の推定とを得て、 各指標の期待値に位置づけられた垂直棒として各レスポンスの期待値を、上記
    垂直棒の頂部に中心決めされた不確定性領域と一緒に、ディスプレイする 各工程を含むことを特徴とする方法。
JP2000609916A 1999-04-07 2000-04-04 指標データの特性を識別する方法 Pending JP2002541556A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/288,758 US6253162B1 (en) 1999-04-07 1999-04-07 Method of identifying features in indexed data
US09/288,758 1999-04-07
PCT/US2000/009096 WO2000060493A2 (en) 1999-04-07 2000-04-04 A method of identifying features in indexed data

Publications (1)

Publication Number Publication Date
JP2002541556A true JP2002541556A (ja) 2002-12-03

Family

ID=23108522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000609916A Pending JP2002541556A (ja) 1999-04-07 2000-04-04 指標データの特性を識別する方法

Country Status (6)

Country Link
US (2) US6253162B1 (ja)
EP (1) EP1175649A2 (ja)
JP (1) JP2002541556A (ja)
AU (1) AU4202700A (ja)
CA (1) CA2368762A1 (ja)
WO (1) WO2000060493A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006170710A (ja) * 2004-12-14 2006-06-29 Mitsui Knowledge Industry Kk ピークの抽出方法および該方法を実行するためのプログラム
JP2017511882A (ja) * 2014-02-14 2017-04-27 パーキンエルマー・ヘルス・サイエンシーズ・インコーポレイテッドPerkinelmer Health Sciences, Inc. 単一粒子誘導結合プラズマ質量分析における出力および類似データセットの自動化された分析のためのシステムおよび方法
US10181394B2 (en) 2014-02-14 2019-01-15 Perkinelmer Health Sciences, Inc. Systems and methods for automated optimization of a multi-mode inductively coupled plasma mass spectrometer

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6690464B1 (en) 1999-02-19 2004-02-10 Spectral Dimensions, Inc. High-volume on-line spectroscopic composition testing of manufactured pharmaceutical dosage units
US6487523B2 (en) * 1999-04-07 2002-11-26 Battelle Memorial Institute Model for spectral and chromatographic data
US6937330B2 (en) 1999-04-23 2005-08-30 Ppd Biomarker Discovery Sciences, Llc Disposable optical cuvette cartridge with low fluorescence material
US6334099B1 (en) * 1999-05-25 2001-12-25 Digital Gene Technologies, Inc. Methods for normalization of experimental data
US6687395B1 (en) * 1999-07-21 2004-02-03 Surromed, Inc. System for microvolume laser scanning cytometry
US7091479B2 (en) * 2000-05-30 2006-08-15 The Johns Hopkins University Threat identification in time of flight mass spectrometry using maximum likelihood
EP1285457A2 (en) * 2000-05-30 2003-02-26 The Johns Hopkins University Threat identification for mass spectrometer system
US6787761B2 (en) * 2000-11-27 2004-09-07 Surromed, Inc. Median filter for liquid chromatography-mass spectrometry data
WO2002044715A1 (en) * 2000-11-28 2002-06-06 Surromed, Inc. Methods for efficiently minig broad data sets for biological markers
US20020198857A1 (en) * 2001-06-21 2002-12-26 Tradeharbor, Inc. Normalized detector scaling
US6873915B2 (en) * 2001-08-24 2005-03-29 Surromed, Inc. Peak selection in multidimensional data
US6693557B2 (en) * 2001-09-27 2004-02-17 Wavetronix Llc Vehicular traffic sensor
US6835927B2 (en) * 2001-10-15 2004-12-28 Surromed, Inc. Mass spectrometric quantification of chemical mixture components
AU2002361858A1 (en) * 2001-12-21 2003-07-30 Spectral Dimensions, Inc. Spectrometric process monitoring
US6763322B2 (en) 2002-01-09 2004-07-13 General Electric Company Method for enhancement in screening throughput
DE10206173B4 (de) * 2002-02-14 2006-08-31 Bruker Daltonik Gmbh Hochauflösende Detektion für Flugzeitmassenspektrometer
WO2003095978A2 (en) * 2002-05-09 2003-11-20 Surromed, Inc. Methods for time-alignment of liquid chromatography-mass spectrometry data
US7426450B2 (en) * 2003-01-10 2008-09-16 Wavetronix, Llc Systems and methods for monitoring speed
US7521257B2 (en) * 2003-02-11 2009-04-21 The Board Of Regents Of The Nevada System Of Higher Education On Behalf Of The University Of Nevada, Reno Chemical sensor with oscillating cantilevered probe and mechanical stop
US7260980B2 (en) 2003-03-11 2007-08-28 Adams Jesse D Liquid cell and passivated probe for atomic force microscopy and chemical sensing
WO2004097352A2 (en) * 2003-04-25 2004-11-11 Griffin Analytical Technologies, Inc. Instrumentation, articles of manufacture, and analysis methods
CA2466792A1 (en) * 2003-05-16 2004-11-16 Affinium Pharmaceuticals, Inc. Evaluation of spectra
US20050267689A1 (en) * 2003-07-07 2005-12-01 Maxim Tsypin Method to automatically identify peak and monoisotopic peaks in mass spectral data for biomolecular applications
US7672834B2 (en) * 2003-07-23 2010-03-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for detecting and temporally relating components in non-stationary signals
US20070213940A1 (en) * 2003-09-04 2007-09-13 Brent Rardin Analysis Device Operational Methods and Analysis Device Programming Methods
US20060257286A1 (en) * 2003-10-17 2006-11-16 Adams Jesse D Self-sensing array of microcantilevers for chemical detection
EP1680650A4 (en) * 2003-10-22 2012-04-25 Sigmed Inc SYSTEM AND METHOD FOR SPECTRAL ANALYSIS
JP2007523323A (ja) * 2004-01-30 2007-08-16 サイファージェン バイオシステムズ インコーポレイテッド スペクトルにおけるシグナルをクラスタにする方法
US7248360B2 (en) * 2004-04-02 2007-07-24 Ppd Biomarker Discovery Sciences, Llc Polychronic laser scanning system and method of use
WO2006002027A2 (en) * 2004-06-15 2006-01-05 Griffin Analytical Technologies, Inc. Portable mass spectrometer configured to perform multidimensional mass analysis
GB2437753B8 (en) 2004-10-01 2009-05-20 Nevada System Of Higher Education Cantilevered probe detector with piezoelectric element
US8680461B2 (en) * 2005-04-25 2014-03-25 Griffin Analytical Technologies, L.L.C. Analytical instrumentation, apparatuses, and methods
US8665113B2 (en) 2005-10-31 2014-03-04 Wavetronix Llc Detecting roadway targets across beams including filtering computed positions
US8248272B2 (en) * 2005-10-31 2012-08-21 Wavetronix Detecting targets in roadway intersections
DE102005061819B3 (de) * 2005-12-23 2007-08-23 Wozny, Manfred, Dr. Verfahren zur Reduktion eines Datensatzes
US7736905B2 (en) * 2006-03-31 2010-06-15 Biodesix, Inc. Method and system for determining whether a drug will be effective on a patient with a disease
US7992424B1 (en) 2006-09-14 2011-08-09 Griffin Analytical Technologies, L.L.C. Analytical instrumentation and sample analysis methods
US7499807B1 (en) * 2006-09-19 2009-03-03 Battelle Memorial Institute Methods for recalibration of mass spectrometry data
US7860335B2 (en) * 2006-12-04 2010-12-28 The Boeing Company Method and apparatus for smart signal averaging
US7653509B2 (en) * 2007-08-29 2010-01-26 Verity Software House Probability state models
US8067728B2 (en) * 2008-02-22 2011-11-29 Dh Technologies Development Pte. Ltd. Method of improving signal-to-noise for quantitation by mass spectrometry
US8645090B2 (en) * 2009-05-14 2014-02-04 Agilent Technologies, Inc. Automated baseline removal of signal
KR101556726B1 (ko) * 2010-02-24 2015-10-02 바이오디식스, 인크. 질량스펙트럼 분석을 이용한 치료제 투여를 위한 암 환자 선별
US11599892B1 (en) 2011-11-14 2023-03-07 Economic Alchemy Inc. Methods and systems to extract signals from large and imperfect datasets
GB201205805D0 (en) * 2012-03-30 2012-05-16 Micromass Ltd Mass spectrometer
US9412271B2 (en) 2013-01-30 2016-08-09 Wavetronix Llc Traffic flow through an intersection by reducing platoon interference
US9754774B2 (en) 2014-02-14 2017-09-05 Perkinelmer Health Sciences, Inc. Systems and methods for automated analysis of output in single particle inductively coupled plasma mass spectrometry and similar data sets
EP3721794B1 (en) 2014-02-27 2022-02-23 Zoll Medical Corporation Vcg vector loop bifurcation
US11094015B2 (en) 2014-07-11 2021-08-17 BMLL Technologies, Ltd. Data access and processing system
WO2016205732A2 (en) * 2015-06-19 2016-12-22 Apple Inc. Measurement denoising
EP3324205B1 (en) * 2016-11-22 2023-01-11 Nxp B.V. Decentralised radar system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1236580A (en) * 1984-05-15 1988-05-10 Andrew L. Martin Characterisation of digital radio signals
JPH0718853B2 (ja) * 1984-05-15 1995-03-06 住友化学工業株式会社 クロマトグラフイ−におけるデ−タ処理方法
US5440119A (en) * 1992-06-02 1995-08-08 Labowsky; Michael J. Method for eliminating noise and artifact peaks in the deconvolution of multiply charged mass spectra
US5774378A (en) * 1993-04-21 1998-06-30 The Foxboro Company Self-validating sensors
DE19727897A1 (de) * 1996-09-19 1998-03-26 Ingbuero Dr Schmidt & Partner Computersicherheitsschrank
DE19727879A1 (de) * 1997-06-30 1999-02-04 Gsf Forschungszentrum Umwelt Verfahren zur Bestimmung der Anzahl von Komponenten in Peaks, Banden und Signalen von Chromatogrammen, Elektrogrammen und Spektrogrammen aller Art

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006170710A (ja) * 2004-12-14 2006-06-29 Mitsui Knowledge Industry Kk ピークの抽出方法および該方法を実行するためのプログラム
JP4621491B2 (ja) * 2004-12-14 2011-01-26 三井情報株式会社 ピークの抽出方法および該方法を実行するためのプログラム
JP2017511882A (ja) * 2014-02-14 2017-04-27 パーキンエルマー・ヘルス・サイエンシーズ・インコーポレイテッドPerkinelmer Health Sciences, Inc. 単一粒子誘導結合プラズマ質量分析における出力および類似データセットの自動化された分析のためのシステムおよび方法
JP2018141811A (ja) * 2014-02-14 2018-09-13 パーキンエルマー・ヘルス・サイエンシーズ・インコーポレイテッドPerkinelmer Health Sciences, Inc. 単一粒子誘導結合プラズマ質量分析における出力および類似データセットの自動化された分析のためのシステムおよび方法
US10181394B2 (en) 2014-02-14 2019-01-15 Perkinelmer Health Sciences, Inc. Systems and methods for automated optimization of a multi-mode inductively coupled plasma mass spectrometer

Also Published As

Publication number Publication date
AU4202700A (en) 2000-10-23
WO2000060493A3 (en) 2001-08-23
EP1175649A2 (en) 2002-01-30
US6253162B1 (en) 2001-06-26
CA2368762A1 (en) 2000-10-12
WO2000060493A2 (en) 2000-10-12
US6366870B2 (en) 2002-04-02
US20010027382A1 (en) 2001-10-04

Similar Documents

Publication Publication Date Title
JP2002541556A (ja) 指標データの特性を識別する方法
WO2018010352A1 (zh) 一种定性定量相结合的近红外定量模型构建方法
US20020035449A1 (en) Model for spectral and chromatographic data
US7283659B1 (en) Apparatus and methods for searching through and analyzing defect images and wafer maps
EP3407375A1 (en) Mass spectrometric data analyzer and program for analyzing mass spectrometric data
CN101918826B (zh) 质量分析系统
US7860685B2 (en) Method for clustering signals in spectra
CN103134850A (zh) 一种基于特征香气的茶叶品质快速检测装置及检测方法
CN109375204A (zh) 基于雷达的目标检测方法、系统、设备及介质
US8386404B2 (en) Methods for automated eddy current non-destructive testing analysis
CN109557165B (zh) 用于监控质谱成像制备工作流程的质量的方法
CN109343062B (zh) 一种径向干扰回波和降水回波的识别方法及系统
CN114186596A (zh) 一种谱图峰的多窗口识别方法、装置以及电子设备
CN108663334B (zh) 基于多分类器融合寻找土壤养分光谱特征波长的方法
Brennan et al. Retrospective assessment of environments in the determination of an objective strategy for the evaluation of the relative yield of wheat cultivars
CN107728121B (zh) 一种基于可变窗的局部拟合优度检验方法
DE102019114771A1 (de) Vorläuferionen-auswahl für eine datenabhängige tandem-massenspektrometrie
JP6565801B2 (ja) 質量分析データ処理装置、質量分析装置、質量分析データ処理方法、及び質量分析データ処理用プログラム
JP4393206B2 (ja) 質量分析装置用データ処理装置
CN107506824B (zh) 一种配电网的不良观测数据检测方法及装置
CN113011296A (zh) 快速鉴别小麦品种纯度的方法和系统
US12040169B2 (en) Processing of spatially resolved, ion-spectrometric measurement signal data to determine molecular content scores in two-dimensional samples
US20210335588A1 (en) Processing of spatially resolved, ion-spectrometric measurement signal data to determine molecular content scores in two-dimensional samples
CN117408734B (zh) 基于物联网设备的客户信息智能管理系统
US20240230605A1 (en) Improvements to peak integration by integration parameter iteration