JP2004522980A - 質量スペクトルを分析する方法 - Google Patents

質量スペクトルを分析する方法 Download PDF

Info

Publication number
JP2004522980A
JP2004522980A JP2003534055A JP2003534055A JP2004522980A JP 2004522980 A JP2004522980 A JP 2004522980A JP 2003534055 A JP2003534055 A JP 2003534055A JP 2003534055 A JP2003534055 A JP 2003534055A JP 2004522980 A JP2004522980 A JP 2004522980A
Authority
JP
Japan
Prior art keywords
mass
class
data
sample
mass spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003534055A
Other languages
English (en)
Other versions
JP2004522980A5 (ja
Inventor
エドワード ジェイ. ガビン,
レオニッド ブラギンスキー,
ウィリアム イー. リッチ,
エリック ティー. ファング,
ジュニア ジョージ エル. ライト,
Original Assignee
シファーゲン バイオシステムズ, インコーポレイテッド
イースタン バージニア メディカル スクール
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シファーゲン バイオシステムズ, インコーポレイテッド, イースタン バージニア メディカル スクール filed Critical シファーゲン バイオシステムズ, インコーポレイテッド
Publication of JP2004522980A publication Critical patent/JP2004522980A/ja
Publication of JP2004522980A5 publication Critical patent/JP2004522980A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Signal Processing (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

デジタルコンピュータを用いて質量スペクトルを分析する方法が開示される。この方法は、複数のサンプルからの質量スペクトルによって得られたデータセット(27)をデジタルコンピュータに入力する工程を含む。各サンプルは、二つ以上のクラス(30)を有するクラスセット内のクラスであるか、または割り当てられ、各クラスは、異なる生物学的状態によって特徴付けられる。次に、分類モデル(54)が形成される。この分類モデルは、クラスセットのクラスを区別する。
【選択図】図7

Description

【0001】
(関連出願)
本出願は、米国特許仮出願第60/249,835号(2000年11月16日出願)および第60/254,746号(2000年12月11日出願)の利益を主張する。これらの米国特許仮出願は、参考のため、その全体を本明細書中ですべての目的のために援用する。
【0002】
(発明の分野)
本発明の実施形態は、質量スペクトルを分析する方法に関する。
【0003】
(本発明の背景)
ゲノムの研究における最近の進歩は、種々の疾患と関連する多数の遺伝子を識別することにつながっている。しかしながら、ゲノムの研究が遺伝的に疾患にかかり易い素因と関連する遺伝子を識別し得る一方で、依然としてタンパク質等のマーカを特徴付けおよび識別する必要がある。「マーカ」は、通常、ポリペプチド、またはある生物学的状態と別の生物学的状態とを区別する特定の他の分子に関する。タンパク質および他のマーカは、疾患状態における重要なファクタである。例えば、タンパク質は、疾患等の生物学的状態の変化と関連して変化し得る。タンパク質は、さらに、疾患、毒性または他の刺激に対して細胞反応を発し得る。疾患に冒されると、いくつかのタンパク質は不活性状態になる一方で、他のタンパク質は活性になる。前立腺特異抗原(PSA)は、例えば、循環血清タンパク質であり、これは高まると前立腺癌と関係する。タンパク質レベルの変化が迅速に検出され得る場合、内科医は疾患を早期に診断し、かつ治療を向上し得る。
【0004】
新しいマーカを識別することは、診断および薬物発見プロセスにおける最も早期かつ最も困難なステップの一つである。物質が疾患のマーカであるか否かを発見する一つの方法は、これらの物質が、その疾患を有しない患者からのサンプルと比較して、その疾患を示す患者からの生物学的サンプルにおける「表現に差がある(differentially expressed)」か否かを判定することによる。例えば、図1Aは、18人の疾患の患者からなる一つのグループからのサンプルの複数の重なった質量スペクトルのグラフ100を示す。疾患の患者は、例えば、前立腺癌を有し得る。別のグラフ102は、図1Bに示され、18人の普通の患者のグループからのサンプルの重なった質量スペクトルを示す。グラフ100、102の各々において、信号強度が質量電荷比の関数としてプロットされる。グラフ100、102に示される信号の強度は、サンプル内の質量電荷比Aに関連する分子量を有するマーカの濃度と比例する。グラフ100、102に示されるように、質量電荷比Aにおいて、複数の信号が、両方の複数の質量スペクトルにおいて存在する。信号は、質量電荷比Aと関連する分子量を有する潜在的マーカを表すピークを含む。
【0005】
グラフ100、102における信号を一括して見ると、質量電荷比Aの信号の平均強度は、普通の患者からのサンプルよりも疾患の患者からのサンプルにおけるほうが高いことが明らかである。質量電荷比Aのマーカは、疾患の患者において「表現に差がある」といわれる。なぜなら、このマーカの濃度は、普通の患者からのサンプルにおけるよりも疾患の患者からのサンプルにおけるほうが平均して大きいからである。
【0006】
図1Aおよび1Bに示されるデータを参照して、疾患の患者からのサンプルは、普通の患者からのサンプルよりも、質量電荷比Aを有するマーカが高い濃度を有することが結論され得る。マーカの濃度は、通常、疾患の患者からのサンプルにおけるほうが普通の患者からのサンプルにおけるよりも大きいので、マーカは、さらに、疾患に対して「上昇するようにレギューレートされている(up−regulated)」と特徴付けられ得る。マーカの濃度が、通常、疾患の患者からのサンプルにおいて、普通の患者からのサンプルにおけるよりも小さい場合、タンパク質は「減少するようにレギューレートされている(down−regulated)」と特徴付けられ得る。
【0007】
一旦マーカが発見されると、これらのマーカは、診断用ツールとして用いられ得る。例えば、上述の例を参照して、試験患者からの未知のサンプルは、質量分析器を用いて分析され得、質量スペクトルが生成され得る。質量スペクトルが分析され得、質量電荷比Aの信号の強度は、試験患者の質量スペクトルにおいて決定され得る。信号強度は、疾患の患者および普通の患者の質量電荷比Aの平均信号強度と比較され得る。従って、未知のサンプルが、試験患者が癌を有しているか、または癌になるかの予測がなされ得る。例えば、未知のサンプルにおける質量電荷比Aの信号強度が、普通の患者スペクトルのものよりも疾患の患者スペクトルの質量電荷比Aの平均信号強度にはるかに近い場合、その試験患者は、おそらくその疾患になるかまたはその疾患を有するという予測がなされ得る。
【0008】
上述の差分表現分析は有用である一方で、複数の改善がなされ得る。例えば、患者の生物学的サンプルにおけるPSA等の単一のマーカの量を分析することは、しばしば、疾患のプロセスをモニタリングするための十分に高い信頼性を有しない。PSAは、現在利用可能な最良の前立腺癌マーカのうちの一つであると考えられる。しかしながら、このマーカは、良性と悪性前立腺疾患とを必ずしも正しく区別するとは限らない。生物学的サンプルにおけるPSA等のマーカの濃度は、試験患者が疾患を有するか否かを予測する特定の能力を提供するが、一方で、より大きい程度の信頼性を有する分析方法が所望される。
【0009】
さらに、多数の生物学的サンプルの大量の質量スペクトルが分析される場合、疾患状態と非疾患状態との間を区別し得るマーカを表す信号がどれなのかは容易にわからない。生物学的サンプルの典型的な質量スペクトルは、多数の潜在的マーカ信号(例えば、200より多い)およびかなりの量の雑音を有する。これは、潜在的に重要な信号の識別および平均信号差の識別を困難にし得る。従って、潜在的マーカを識別および定量化することは困難である。潜在的マーカが強力な上昇レギュレーションまたは強力な減少レギュレーションを示さない場合、疾患の患者からのサンプルと普通の患者からのサンプルとの間の平均信号差は容易に見分けられ得ない。例えば、あるグループの質量スペクトルにおける所与の質量値の信号のクラスタが、別のグループの質量スペクトルからの信号のクラスタよりも大きいかまたは小さい平均信号強度を有することを視覚的に決定することは多くの場合困難である。さらに、複数の潜在的に重要な信号は、小さい強度値を有し得る。スペクトルにおける雑音は、これらの多くの潜在的に重要な信号を不明瞭にし得る。信号は、発見されなくなり得、差分表現分析からうっかり漏れ得る。
【0010】
質量スペクトルを分析するより良好な方法を有することが所望される。例えば、潜在的に有用なマーカを発見するためのより正確な方法を提供することが所望される。未知のサンプルが、特定の生物学的状態と関連するか否かを予測するために用いられ得る改善された分類モデルを提供することもまた所望される。
【0011】
本発明の実施形態は、これらおよび他の問題に取り組む。
【0012】
(発明の要旨)
本発明の実施形態は、質量スペクトルを分析する方法に関する。本発明の実施形態において、デジタルコンピュータは、異なる生物学的状態に関連したサンプルのクラスを区別するために用いられ得る分類モデルを形成する。分類モデルは、予測のための診断ツールとして用いられてもよい。また、分類モデルは、生物学的状態に関連した潜在的マーカを識別するために用いられてもよい。さらに、分類モデルは、例えば、神経回路網解析などのプロセスを用いて形成されてもよい。
【0013】
本発明の一実施形態は、デジタルコンピュータを用いる質量スペクトルを分析する方法に向けられている。該方法は、a)複数のサンプルからの質量スペクトルから得られるデータセットをデジタルコンピュータに入力する工程であって、各サンプルは、二つ以上のクラスを含むクラスセット内のクラスにあるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、質量電荷比、または質量電荷比から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、工程と、b)該クラスセットの該クラスを区別する分類モデルを形成する工程であって、該形成する工程は、分類プロセスを実現するコードを実行することによって該データセットを分析する工程を含む、工程とを包含する。
【0014】
本発明の別の実施形態は、デジタルコンピュータを用いる質量スペクトルを分析する方法に向けられる。該方法は、a)複数のサンプルからの質量スペクトルから得られるデータセットをデジタルコンピュータに入力する工程であって、各サンプルは、二つ以上のクラスを含むクラスセット内のクラスにあるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、飛行時間、または飛行時間から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、工程と、b)該クラスセットの該クラスを区別する分類モデルを形成する工程であって、該形成する工程は、分類プロセスを実現するコードを実行することによって該データセットを分析する工程を含む、工程とを包含する。
【0015】
別の実施形態は、コンピュータ読み出し可能媒体に向けられる。該コンピュータ読み出し可能媒体は、a)複数のサンプルからの質量スペクトルから導出されたデータを入力するためのコードであって、各サンプルは、二つ以上のクラスのクラスセット内のクラスであるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、飛行時間、質量電荷比、あるいは飛行時間または質量電荷比から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、コードと、b)分類プロセスを用いて分類モデルを形成するためのコードであって、該分類モデルは、該クラスセットにおいて該クラスを区別する、コードとを含む。
【0016】
本発明の別の実施形態は、デジタルコンピュータを用いて生物学的状態によって特徴付けられたクラスに未知のサンプルを分類する方法に向けられる。該方法は、a)該未知のサンプルの質量スペクトルから得られたデータを該デジタルコンピュータに入力する工程と、b)請求項1の方法によって形成された分類モデルを用いて該質量スペクトルを処理して、該生物学的状態によって特徴付けられたクラスに該未知のサンプルを分類する工程とを包含する。
【0017】
本発明の別の実施形態は、未知のサンプルが、デジタルコンピュータを用いて生物学的状態によって特徴付けられるクラスに属するように正確に分類される尤度を推定する方法に向けられる。該方法は、a)該未知のサンプルの質量スペクトルから得られたデータをデジタルコンピュータに入力する工程と、b)請求項1の方法によって形成された前記分類モデルを用いて該質量スペクトルデータを処理して、該未知のサンプルが生物学的状態によって特徴付けられるクラスに正確に分類される尤度を推定する工程とを包含する。
【0018】
本発明の実施形態において、分析される質量スペクトルは、例えば、分類モデルが形成される以前に、うまく作成され得た既存の質量スペクトルになり得る。あるいは、質量スペクトルデータは、分類モデルの形成と実質的に同時に作成され得る。
【0019】
本発明のこれらの実施形態および他の実施形態は、図面および詳細な説明を参照して記載される。
【0020】
(詳細な説明)
本発明の実施形態において、質量スペクトルから取得されたデータセットは、デジタルコンピュータに入力されて、分類モデルを形成する。質量スペクトルは、好適には、既知の特性を有する生物学的サンプルから取得される。好適な実施形態において、分類モデルを形成するために用いられるデータセットは、「既知」のデータセットと特徴付けられる。なぜなら、生物学的サンプルと関連する生物学的状態は、分類モデルを形成するためにデータセットが用いられる前に、知られているからである。比較して、「未知の」データセットは、サンプルの質量スペクトルから取得されるデータを含み、ここで、そのサンプルは、質量スペクトルが形成される場合、分類モデルによって区別される生物学的状態と関連するか否かは不明である。未知のデータは、分類モデルを用いて診断されるべき試験患者からの生物学的サンプルから派生され得る。いくつかの環境において、既知のデータセットは「トレーニングデータ」と呼ばれる。
【0021】
図示する目的で、後述される例の多くは、既知のデータセットを用いて分類モデルを形成することに関する。しかしながら、本発明のいくつかの実施形態において、分類モデルを形成するために用いられるデータセットは、未知のデータセットであり得る。例えば、クラスタ分析において、未知の生物学的サンプルの質量スペクトルが類似のパターンを有する場合、これらはグループ化され得る。各グループに対応するサンプルは、共通のある生物学的状態を有するか否かを見出すたに分析され得る。共通のある生物学的状態を有する場合、そのグループにおけるこれらのサンプルは、生物学的状態と関連するクラスに割り当てられ得る。例えば、共通のパターンを有する質量スペクトルのグループを形成した後、そのグループ内のすべてのスペクトルは、全部が放射線に曝された生物学的サンプルから取得されたと決定され得る。そのグループ内のサンプルは、その後、状態「放射線に曝された(radiation exposed)」と関連付けられるクラスに割り当てられ得る。他のグループ分けにおけるサンプルは、それぞれのグループ分けにおけるサンプルと共通の他の生物学的状態によって特徴付けられるクラスに割り当てられ得る。従って、分類モデルが形成され得、未知のスペクトルが、形成された分類モデルを用いて分類され得る。
【0022】
本発明の実施形態において、用いられる各サンプルは、二つ以上のクラスのセットのうちの一つのクラスに割り当てられるかまたは割り当てられることになっており、各クラスは、異なった生物学的状態によって特徴付けられる。例えば、サンプルの第1のクラスは、疾患状態等の生物学的状態と関連付けられ得る。サンプルの質量スペクトルの第2のクラスは、非疾患状態等の生物学的状態と関連付けられ得る。第1および第2のクラスのサンプルは、クラスセットを形成し得る。それぞれのクラスの各々からの質量スペクトルは、第1および第2のクラスを区別するデータを含み得る。
【0023】
本発明の実施形態において、分析される質量スペクトルにおける各質量スペクトルは、飛行時間、飛行時間から導き出された値(例えば、質量電荷比、分子量等)の関数、質量電荷比、または質量電荷比から導き出された値(例えば、分子量)として信号強度データを含み得る。当業者に公知のように、飛行時間質量分析器から取得される質量電荷比値は飛行時間値から導き出される。質量電荷比は、別の方法で取得され得る。例えば、飛行時間質量分析器を用いて質量電荷比を決定する代わりに、四重極分析器および磁気質量分析器を用いる質量分析器が用いられて質量電荷比を決定し得る。
【0024】
好適な実施形態において、各質量スペクトルは、質量電荷比の関数としての信号強度データを含む。典型的なスペクトルビュータイプの質量スペクトルにおいて、信号強度データは、質量電荷比の関数として信号強度のグラフ上に「ピーク」の形態にて存在し得る。各ピークは、基部と頂点とを有し得る。ここで、ピーク幅は基部から頂点に向かって狭くなる。ピークと関連する質量電荷比は、通常、ピークの頂点と対応する。ピークの強度は、さらに、通常、ピークの頂点と関連する。
【0025】
通常、質量電荷比は、潜在的マーカの分子量と関連する。例えば、潜在的マーカが+1の電荷を有する場合、質量電荷比は、信号によって表される潜在的マーカの分子量と等しい。従って、特定の質量スペクトルが、分子量の関数として信号強度を示し得、他方、分子量パラメータは、実際に、質量電荷比から導き出される。
【0026】
本明細書中で説明される本発明の複数の特定の実施形態は、質量電荷比の使用に関するが、飛行時間値、または飛行時間値から導き出された他の値は、具体的に述べられた例示の実施形態のいずれかにおける質量電荷比値の代わりに用いられ得ることが理解される。
【0027】
分析される質量スペクトルにおける各質量スペクトルが、飛行時間の関数としての信号強度データを含み得るが、信号強度データを質量電荷比の関数として用いる質量スペクトルの使用が、一般に望ましい。イオンの飛行時間値は機器に依存する。これに対して、質量電荷比値は機器に依存しない。例えば、飛行時間質量分析プロセスにおいて、イオンについて取得される飛行時間値は、用いられる特定の質量分析器における自由飛行チューブ(free flight tube)の長さに依存し得る。異なった自由飛行チューブの長さを有する異なった質量分析器は、同じイオンに対して異なった飛行時間値を生成し得る。これは、質量電荷比には当てはまらない。なぜなら、質量電荷比は、単に、イオン電荷に対するイオンの質量の比だからである。質量電荷比値を用いて生成された分類モデルは、さらに、これらを生成するために用いられる特定の質量分析器に依存し得ない。
【0028】
データセットは、任意の適切なデータを含み得、かつ自動的または手動にてデジタルコンピュータに入力され得る。このデータは、デジタルコンピュータ上で分類プロセスを実行することによって処理される前には、生のままかまたは前処理されている状態であり得る。例えば、質量スペクトルにおける所定の質量電荷比の信号の生の強度は、データセットとして用いられ得る。あるいは、生のデータは、分類モデルが形成される前に前処理される。例えば、いくつかの実施形態において、質量スペクトルにおける信号の強度の対数値(例えば、底2)が、データセットを形成するために用いられ得る。
【0029】
データセットは、デジタルコンピュータに入力される。分類プロセスを具体化するコンピュータコードは、データセットを用いて分類モデルを形成する。例示的分類プロセスは、分類および回帰ツリー(regression tree)プロセス等の階層的分類プロセス、クラスタ分析等の多変量統計分析、および神経回路網解析等の非線形プロセスを含む。好適な実施形態において、データセットは、分類および回帰ツリープロセスを用いて処理され、分類および回帰ツリー等の分類モデルを生成する。これらおよび他の分類プロセスおよび分類モデルは、かなり詳細に後述される。
【0030】
生成される分類モデルは、予測的または記述的であり得る。例えば、このモデルは、未知の試験生物学的サンプルが、特定の生物学的状態と関連するかしないかを予測するために用いられ得る。代替的または追加的に、分類モデルは、分析される生物学的状態(単数または複数)を区別するデータにおける特徴を識別するように問合わせられ得る。ある特徴は、分析されている特定のクラスを区別し得る質量スペクトルデータの任意の局面を含む。識別され得る適切な特徴は、一つ以上の質量電荷比の信号強度または信号強度範囲、信号の形状(例えば、ピークの形状)、信号領域(例えば、ピーク領域)、信号幅(例えば、ピークの底部等のピーク幅)、各質量スペクトルにおける信号の数等を含み得るが、これらに限定されない。典型的な例において、分類モデルは、所与の質量電荷比の特定の信号強度などの特徴が、疾患サンプルと非疾患サンプルとを区別することを示し得る。さらに別の例において、分類モデルは、特徴の組み合わせが、疾患サンプルと非疾患サンプルとを区別することを示し得る。例えば、異なった質量電荷比の二つ以上の信号の信号強度範囲は、疾患状態と非疾患状態とを区別し得る。
【0031】
別の例において、異なったサンプルクラスを区別するとして識別され得る適切な特徴は、クラス内で特定の質量電荷比にて信号が生じる頻度であり得る。例えば、100個のサンプルを有する疾患クラスおよび100個のサンプルを有する普通のクラスについて、質量電荷比Xの信号強度Yは、90個の疾患クラスのサンプルの質量スペクトルにおいて存在し得るが、普通のクラスのサンプルからの10個のサンプルにのみ存在し得る。信号の平均強度は、疾患クラスおよび普通のクラスの両方において同じである(すなわち、Yの平均強度)が、癌患者クラスにおける信号の出現数の多さは、その特徴が、疾患クラスと普通のクラスとを区別することを示す。この特徴のような、頻度の特徴は、分類モデルを用いて識別され得る。
【0032】
任意の適切な生物学的サンプルが、本発明の実施形態において用いられ得る。生物学的サンプルは、組織(例えば、バイオプシーから)、血液、血清、プラズマ、乳頭吸引液、尿、涙、唾液、細胞、軟組織および硬組織、器官、精液、便、尿等を含む。生物学的サンプルは、真核生物、原核生物、またはウイルス性生物を含む任意の適切な有機体から取得され得る。
【0033】
生物学的サンプルは、ポリペプチド、タンパク質、核酸、酵素、DNA、RNA、ポリヌクレオチド、オリゴヌクレオチド、核酸、炭水化物、オリゴ糖、多糖類等の高分子、核酸フラグメント、ペプチドフラグメント、およびタンパク質フラグメント等の、上述の生物学的高分子のフラグメント、核酸複合体、タンパク質−DNA複合体、レセプタリガンド複合体、酵素基板、酵素阻害因子、ペプチド複合体、タンパク質複合体、炭水化物複合体および多糖類複合体等の上述の生物学的高分子複合体、アミノ酸、ヌクレオチド、ヌクレオシド、糖、ステロイド、脂質、金属イオン、薬剤、ホルモン、アミド、アミン、カルボン酸、ビタミンおよび助酵素、アルコール、アルデヒド、ケトン、脂肪酸、ポリフィリン、カロチノイド、植物成長レギュレータ、リン酸エステル、およびヌクレオシドジホスホ糖、薬事的または治療的に有効なエージェント等の合成の小分子、モノマー、ペプチド類似体、ステロイド類似体、抑制因子、突然変異原、発癌物質、抗有糸分割薬、抗生物質、イオノフォア、代謝拮抗物質、アミノ酸類似体、抗菌剤、輸送抑制因子、界面活性剤(サーファクタント)、ミトコンドリアおよび葉緑体機能抑制因子、電子供与体、担体および受容体、プロテアーゼの合成基板、ホスファターゼの基板、エステラーゼおよびリパーゼの基板、およびタンパク質改良試薬等の小さい生物学的分子、ならびに合成ポリマー、オリゴマー、ならびに共重合体を含み得る。具体的に挙げられた上記の物質の任意の適切な混合または組み合わせもまた生物学的サンプルに含まれ得る。
【0034】
上述のように、データセットが生成される生物学的サンプルは、二つ以上のクラスのセットにおけるクラスに割り当てられる。各クラスは、異なった生物学的状態によって特徴付けられる。好適には、二つのクラスおよび二つの生物学的状態のみが存在し、すなわち、二つのクラスの各々に対して一つずつである。例えば、一方のクラスは、疾患状態等の生物学的状態を有し得、他方の生物学的状態は、非疾患状態等の状態を有し得る。
【0035】
本明細書中で用いられるように、サンプルの「生物学的状態」は、サンプルまたは有機体またはサンプルが派生される源の生物学的状態を特徴付ける任意の特性に関する。特性は、遺伝子型素質(trait)または表現型素質等の生物学的素質であり得る。特性は、感染性の疾患を含む、特定の疾患の有無などの生理学的または疾患素質であり得る。特性は、さらに、サンプルが曝された条件であり得る(環境、社会的、心理学的、時間依存性等)。
【0036】
遺伝子型素質は、特定の遺伝子または遺伝子の多形、あるいは遺伝子の組み合わせの有無を含み得る。遺伝的素質は、表現型素質として発現し得るか、または、特定の疾患に対する感受性等、それらの発現に対する感受性として存在する(例えば、癌または心臓疾患の特定のタイプの性向)。
【0037】
表現型性質は、例えば、外観、生理的素質、物理的素質、神経的状況、心理的状況、反応素質、例えば、特定の薬剤に対する反応または反応の欠如を含む。表現型素質は、疾患素質を含むいわゆる「正常(normal)」素質または「病理学的(pathological)」素質の有無を含み得る。別の状態は、特定の疾患の有無である。状態は、さらに、特定の人、または、例えば、異なった個人、異なった家族、異なった年齢状態、異なった種および異なった組織タイプ等のグループに属する状態であり得る。
【0038】
いくつかの実施形態において、生物学的状態は、例えば、以下の状態の一つ以上の任意の適切な組み合わせであり得る。これらは、疾患状態、正常状態、病的状態、薬剤状態、非薬剤状態、薬剤応答状態、非薬剤応答状態、および良性状態である。薬剤状態は、薬剤を摂取した患者の状態を含み得、他方、非薬剤状態は、患者が薬剤を摂取していない状態を含み得る。薬剤応答状態は、薬剤の使用に応答する生物学的サンプルの状態である。疾患状態の特定の例は、例えば、癌、心臓疾患、自己免疫疾患、ウイルス性感染、アルツハイマー疾患および糖尿病等を含む。より具体的な癌状態は、例えば、前立腺癌、膀胱癌、乳癌、結腸癌、および卵巣癌等を含む。生物学的状態は、さらに、初期状態、中期状態および末期状態を含み得る。例えば、異なった生物学的状態は、癌等の疾患の初期状態、中期状態および末期状態を含み得る。
【0039】
他の状態は、異なったサンプルのクラスが影響を受ける異なった環境と関連し得る。例示的環境は、熱、電磁放射、運動、ダイエット、地理的位置等に曝すことによる治療等の一つ以上の条件を含む。例えば、生物学的サンプル(例えば、すべての血液サンプル)のクラスは、放射線に曝された患者のグループからであり得、生物学的サンプルの別のクラスは、放射線に曝されなかった患者のグループからであり得る。放射線源は、X線機器等の目的に合わせた放射線源であり得るか、または移動電話等の意図されない放射線源であり得る。別の例において、ある人のグループは、特定の食事制限中であり得、別のグループは、別の食事制限中であり得る。
【0040】
本発明の他の実施形態において、異なった生物学的状態は、それぞれ異なった薬剤または薬剤タイプと関連するサンプルに対応し得る。例示において、既知の効果の薬剤を用いて治療された人からのサンプルの質量スペクトルが生成される。既知の効果の薬剤と関連する質量スペクトルは、既知の効果の薬剤と同じタイプの薬剤を表し得る。例えば、既知の効果の薬剤と関連する質量スペクトルは、同じか類似の特性、構造、または既知の効果の薬剤と同じ基本的効果を有する薬剤を表し得る。複数の異なった鎮痛性錯体の全部が、例えば、人に痛みの緩和を提供し得る。既知の効果の薬剤および同じかまたは類似のタイプの薬剤の全部が、人の体内の同じ生化学的経路をレギューレートし得、人に同じ効果を生成する。生物学的経路の特性(例えば、上昇または減少するようにレギューレートされたタンパク質)は、質量スペクトルに反映され得る。
【0041】
分類モデルは、既知の効果の薬剤と関連する質量スペクトル、異なった薬剤および異なった薬剤タイプと関連する質量スペクトル、あるいは薬剤と全く関連しない質量スペクトルを用いて生成され得る。一旦分類モデルが生成されると、未知の効果の候補薬剤と関連する候補サンプルについて質量スペクトルが生成され得る。分類モデルを用いて、候補サンプルと関連する質量スペクトルが分類される。分類モデルは、候補サンプルが既知の効果の薬剤と関連するか、異なったタイプの別の薬剤と関連するかを決定し得る。例えば、分類モデルが候補サンプルを、既知の効果の薬剤と関連するとして分類する場合、この候補薬剤は、既知の効果の薬剤と同じ効果を身体に及ぼす可能性がある。従って、本発明の実施形態は、特に、薬剤を発見および/または特徴付けるために用いられ得る。
【0042】
(I.質量スペクトルの取得)
質量スペクトルは、任意の適切なプロセスによって取得され得る。例えば、質量スペクトルは、質量スペクトルの一つ以上のデータベースへのアクセスを有するローカルまたはリモートサーバコンピュータから取り出され得る(すなわち、ダウンロードされる)。データベースは、異なった生物学的状態と関連する異なった生物学的サンプルの質量スペクトルのライブラリを含み得る。あるいは、質量スペクトルは、生物学的サンプルから生成され得る。これらの生物学的サンプルが取得される方法と関係無く、分類モデルを生成するために用いられる質量スペクトルおよびサンプルは、好適には、同様の条件の下で処理されて、スペクトルの任意の変更はサンプルそれ自体に基づくものであり、処理の相違が原因ではないことを確実にする。質量スペクトルは、特に特定の分類プロセスを想定して生成され得るか、またはデータに対して用いられる特定の分類プロセスに関係なく生成され得る。
【0043】
本発明の実施形態において、気相イオン質量分析器が質量スペクトルを生成するために用いられ得る。「気相イオンスペクトロメータ(gas phase ion spectrometer)」とは、サンプルがイオン化されて気相になるときに形成されるイオンの質量電荷比に変換され得るパラメータを測定する装置のことである。これは、例えば、質量スペクトロメータ、イオン移動度スペクトロメータまたは全イオン電流測定デバイスを含む。
【0044】
質量スペクトロメータは、任意の適切なイオン化技術を用い得る。イオン化技術は、例えば、電子イオン化、高速原子/イオン衝突、マトリックス支援レーザ脱離/イオン化(MALDI)、表面活性化レーザ脱離/イオン化(SELDI)またはエレクトロスプレーイオン化を含み得る。
【0045】
いくつかの実施形態において、イオン移動度分析計は、マーカを検出および特徴付けるために用いられ得る。イオン移動度分析計の原理は、イオンの異なった移動度に基づく。特に、イオン化によって生成されるサンプルのイオンは、例えば、質量、電荷、または形状の相違に基づいて電場の影響下にあるチューブを通って異なった速度で移動する。イオン(通常電流の形態)は、検出器にて記憶され、従って、検出器の出力がサンプル中のマーカまたは他の物質を識別するために用いられ得る。イオン移動度分析計の一つの利点は、この分析計が大気圧にて実行され得ることである。
【0046】
好適な実施形態において、レーザ脱離飛行時間質量分析器が質量スペクトルを生成するために用いられる。レーザ脱離分析計は、タンパク質等の高分子量物質を分析するために特に適切である。例えば、MALDIまたは表面活性化レーザ脱離/イオン化プロセスの実際の質量範囲は、300,000ダルトン以上であり得る。さらに、レーザ脱離プロセスが複合混合物を分析し、かつ高感度を有するために用いられ得る。さらに、タンパク質のフラグメンテーション(fragmentation)の可能性は、MALDIまたは表面活性化レーザ脱離/イオン化プロセス等のレーザ脱離プロセスにおける尤度が他の多くの質量分析プロセスにおけるよりも低い。従って、レーザ脱離プロセスは、タンパク質などの高分子量物質を正確に特徴付けおよび定量化するために用いられ得る。
【0047】
質量スペクトルを生成するための典型的なプロセスにおいて、マーカを有するプローブは、質量分析器のインレットシステム(inlet system)に導入される。マーカは、その後、イオン化される。マーカイオンが生成された後、生成されたイオンは、イオン光学アセンブリによって収集され、その後、質量分析器が、通過するイオンを拡散させ、かつ分析する。質量分析器を出るイオンは、検出器によって検出される。飛行時間質量分析器において、イオンは、短い高電圧場を通って加速され、高真空チャンバ内に流れ込む。高真空チャンバの遠端にて、加速されたイオンは、異なった時間に高感度検出器面を打つ。イオンの飛行時間がイオンの質量電荷比の関数であるので、イオン化と衝撃との間の経過時間が特定の質量電荷比の分子の有無を識別するために用いられ得る。
【0048】
飛行時間データは、その後、質量電荷比に変換され得、質量電荷比の関数としてのマーカの信号強度を示すスペクトルを生成する。図2は、飛行時間に基づく質量スペクトルを質量電荷比データに変換するための例示的方法を図示するフローチャートを示す。最初に、飛行時間スペクトルが収集される(工程16)。その後、平滑フィルタがその飛行時間スペクトルに適用される(工程18)。通常、最初に生成されたスペクトルにおいてかなりの量の高周波数雑音が存在する。種々のフィルタが適用されて、基本となる信号を乱すことなく雑音を低減する。その後、ベースラインが計算される(工程20)。これは、例えば、MALDIまたは表面活性化レーザ脱離/イオン化プロセスに特性であり得る上方向シフトの特性を除去する。
【0049】
「表面活性化(surface enhanced)」脱離/イオン化プロセスとは、サンプルがエネルギー源に提供されるその基板が脱離/イオン化プロセスにおいて積極的な役割を果たすプロセスのことである。これらの方法において、プローブ等の基板は、サンプルを提供するための単なる受動的ステージではない。表面活性化基板のいくつかのタイプは、表面活性化脱離/イオン化プロセスにおいて用いられ得る。一例において、表面は、好適には、特定の分子のクラスと結合するアニオン交換基または親水基(例えば、シリコン酸化物)等の親和性材料を含む。このような親和性材料の例は、例えば、シラノール(親水性)、C8またはC16アルキル(疎水性)、固定化金属キレート(配位共有)、アニオン、カチオン交換体(イオンの)または抗体(生物種)を含む。サンプルは、基板結合吸着剤に曝され、従って、特定の引力に従って検体分子を結合する。通常、非結合分子は洗浄除去される。検体が生物分子である場合、エネルギー吸収材料、例えば、マトリックスが、通常、結合サンプルと関連する。その後、レーザが用いられて、検体を脱着およびイオン化する。これらの検体は、検出器を用いて検出される。
【0050】
別のバージョンにおいて、基板表面は、エネルギー吸収分子の結合層を含み、MALDIにおけるように、サンプルをマトリックス材料と混合する必要をなくす。表面活性化脱離/イオン化法は、例えば、米国特許第5,719,060号(HutchensおよびYip)およびWO98/59360号(HutchensおよびYip)(米国特許第6,255,047号)に記載される。レーザが、エネルギー吸収材料を含むマトリックスを脱離する場合、マトリックス材料のいくつかもまた、分析されるサンプル材料と共に電離され得る。ベースライン計算は、脱離マトリックス材料に基づいて、信号の存在を考慮するようにスペクトルを調整する。一旦ベースラインが計算されると、飛行時間から質量への変換が行われる(工程22)。この工程において、飛行時間データは、質量電荷比に変換される。次に局所的雑音値が計算される(工程24)。低質量電荷比にて、脱離されたマトリックス材料が原因で、かなりの量の雑音が生成される。イオン化脱離プロセスにおいて、マトリックス材料の脱離は、より低い質量電荷比よりも、より高い質量電荷比において可能性が低い。従って、雑音は、より高い質量電荷比よりも、より低い質量電荷比において可能性が高い。スペクトルへの適合が、この効果を修正するためになされ得る。これらの修正がなされた後、スペクトル更新が完了される(工程26)。図2に示される方法に従って質量スペクトルを処理することによって、質量スペクトルの信号対雑音比が改善され、潜在的マーカのより良好な定量化および比較を可能にする。
【0051】
マーカの脱離および検出により生成される質量スペクトルデータは、質量スペクトルのプロットが生成前後にデジタルコンピュータを用いて前処理され得る。データ分析は、検出されたマーカの信号強度(例えば、信号の大きさ)を決定する工程、および「外れ値(outlier)」(所定の統計的分布からのデータのずれ)を除去する工程を包含し得る。例えば、観察された信号は正規化され得る。正規化は、特定の基準と関連する各信号の大きさが計算される。例えば、基準は、目盛りをゼロにセットする機器および化学薬品(例えば、エネルギー吸収分子)により生成されるバックグラウンドノイズであり得る。従って、各マーカまたは他の物質について検出された信号強度は、所望の目盛りの相対強度の形態で表示され得る(例えば、100)。あるいは、サンプルの標準が認められ得、その標準からの信号が、検出される各マーカまたは他のマーカについて観察された信号の相対強度を計算するための基準として用いられ得る。
【0052】
デジタルコンピュータは、表示するために、生じたデータを種々の形式に変換し得る。「スペクトルビューまたは残留マップ(retentate map)」と呼ばれる一つの形式において、標準スペクトルビューが表示され得る。スペクトルビューは、各特定の分子量にて検出器に到達するマーカの量を示す。「ピークマップ」と呼ばれる別の形式において、ピークの高さおよび質量情報のみがスペクトルビューによって保持され、より鮮明な像をもたらし、かつほぼ同じ分子量を有するマーカを表す信号がより容易に見出されることを可能にする。「ゲルビュー」と呼ばれるさらに別の形式において、ピークビューからの各質量は、各ピークの高度に基づいたグレイスケール像に変換され、電気泳動ゲルの帯と同様の外観が生じる。「3Dオーバーレイ(3−D overlays)」と呼ばれるさらに別の形式において、相対ピーク高度の微妙な変化を研究するためにいくつかのスペクトルが重ね合わされ得る。「差マップビュー(difference map view)」と呼ばれるさらに別の形式において、二つ以上のスペクトルが比較され得、便利に強調表示されるマーカを表す信号、およびサンプル間で上昇または減少するようにレギューレートされるマーカを表す。任意の二つのサンプルからのマーカプロファイル(スペクトル)は、一つのプロットの上で視覚的に比較され得る。データセットを形成するために用いられ得るデータは、これらおよび他のスペクトル表示形式から取得され得る。
【0053】
(II.データセットの形成)
一旦質量スペクトルが取得されると、既知のデータセット等のデータセットが形成される。データセットは、生物学的サンプルのクラスセットの質量スペクトルから取得されるデータを含む。データセットを形成する質量スペクトルデータは生、未処理のデータであり得る。例えば、質量スペクトルからの識別された質量値の生信号強度値は、データセットを形成するために用いられ得る。別の例において、質量スペクトルからの生信号パターンがデータセットを形成するために用いられ得る。
【0054】
代替的実施形態において、データは、分類モデルを形成するために用いられる前に前処理され得る。質量スペクトルは、その後、分類モデルを形成するために用いられる前に、任意の適切な態様にて処理され得る。例えば、質量スペクトルにおける信号は、信号強度の対数値をとり、外れ値を除去し、潜在的マーカと関連する可能性が少ない信号を除去し、小さい強度を有する信号を除去すること等によって処理され得る。
【0055】
いくつかの実施形態において、データセットは、各質量スペクトルの特定のパターンと関連する生または未処理のパターンデータを含み得る。例えば、複数の信号ピークを含む質量スペクトルについて、信号ピークのパターンは、質量スペクトルを生成するために用いられる生物学的サンプルの指紋を構成し得る。分類プロセスは、分類モデルによって区別された、それぞれ異なったクラスにおけるスペクトルに共通であり得るパターンまたはパターンセグメントに従って、異なったスペクトルを分類し得る。神経回路網プログラム等のコンピュータプログラムは、例えば、既知の生物学的状態と関連する既知のサンプルの複数の質量スペクトルを受け取り得る。神経回路網は、質量スペクトルデータを用いて訓練され得、従って、それぞれ異なったクラスに属する質量スペクトルパターン間を区別し得る。訓練された神経回路網は、その後、質量スペクトルにおけるパターンに基づいて、未知のサンプルと関連する質量スペクトルを分類するために用いられ得る。
【0056】
他の実施形態において、データセットは、質量スペクトルにおける信号の強度に関するデータを含む。これらの実施形態において、各質量スペクトルにおける信号のいくつかおよびすべては、データセットを形成するために用いられ得る。例えば、スペクトルビュータイプの質量スペクトルにおけるすべての信号(例えば、ピーク)よりも小さい強度がデータセットを形成するために用いられ得る。好適な実施形態において、質量電荷比が識別され、この識別された質量電荷比は、質量スペクトルから信号を選択するために用いられる。これらの選択された信号の強度は、データセットを形成するために用いられ得る。各質量スペクトルにおけるすべての信号よりも少ない信号からのデータを用いることによって、処理されるデータポイントの数が低減されて、データ処理がより迅速になる。許容できるマーカを表す可能性が低い信号のデータは、データセットから排除され得る。
【0057】
質量電荷比は、任意の数の方法にて識別され得る。例えば、質量電荷比は、異なった生物学的状態を有する異なったクラスの質量スペクトルを比較することによって識別され得る。クラスが選択され得る可能性のある信号の質量電荷比が選択され得る。この比較は、手動で実行され得るか(例えば、目視比較)、またはデジタルコンピュータを用いて自動で行われ得る。例えば、サンプルの異なったクラスと関連する質量スペクトルは、互いに目視比較され得、一つのサンプルクラスからの質量スペクトルにおける質量電荷比の信号の強度が、異なったサンプルクラスからの質量スペクトルにおける同じ質量電荷比の信号よりも大きいかまたは小さいかを決定し、従って、潜在的に異なった表現を示す。これらの信号の差が生じるところで質量電荷比が選択され得る。
【0058】
図3は、例えば、識別されたピーククラスタに対する正規化強度の対数値(底2)を示す。このプロットは、底2のログ表示の正規化強度値を示す。ピーククラスタにおける各強度値は、ゼロ値が平均強度値に変化を表さないように、その部分が引かれる。y軸の各単位は、クラスタ平均との2倍の差異を表す。著しく上昇および減少するようにレギューレートされたタンパク質は、図3に示されているようなプロットを用いて識別され得る。図3は、異なった信号クラスタの関数としての正規化強度の対数表示のグラフを示す。二つの異なったグループのサンプルからの質量スペクトルからの信号強度がこのグラフに示される。例えば、図3におけるピーククラスタ22(x軸上)は、グループAおよびグループBからのデータポイント間の大幅なばらつきを示す。これは、ピーククラスタ22に関連する質量電荷比が、候補マーカ位置として識別され得ることを示す。
【0059】
代替的または追加的に、特定の所定の基準が、最初に特定の信号または信号クラスタを選択するために提供され得る。選択される信号クラスタは、その後、特定の質量電荷比を識別するために用いられ得る。例えば、特定の信号強度閾値より大きいかまたは小さい信号強度または平均信号強度を有する信号または信号クラスタが自動的に選択され得る。これらの選択された信号または信号クラスタと関連する質量電荷比は、その後、識別され得る。
【0060】
質量スペクトルデータを収集すること、データを前処理すること、および前処理された質量スペクトルデータを処理して分類モデルを形成することを包含する好適な方法は、図4および図5を参照して説明され得る。図4を参照して、異なった生物学的状態と関連するサンプルの質量スペクトルが収集される(工程27)。収集されたサンプルの数は、好適には大きい方がよい。例えば、本発明の実施形態において、収集されたサンプルの数は、約100〜約1000であり得る(またはこれらの値以上または以下)。好適には、スペクトルを生成するために用いられるすべてのサンプルは、同様の条件下で生成され、従って、サンプル間の差がスペクトルに反映される。
【0061】
潜在的マーカの存在に対応する信号は、各スペクトルにて識別される。このような各信号に質量値が割り当てられる。質量スペクトルの第1のグループにおける各質量スペクトルにおける所定の信号対雑音比より大きい信号がその後検出される(工程28)。典型的な例において、信号対雑音比が値Sよりも大きい信号が検出され得る。値Sは、絶対値または相対値であり得る。その後、質量スペクトルにおける質量電荷比の信号がクラスタ化される(工程30)。所定の基準を満たす信号クラスタがその後選択される。例えば、一実施形態において、所定の数の信号を有する信号クラスタが選択され得る(工程32)。所定の数よりも少ない数を有するクラスタが廃棄される。典型的な例において、クラスタにおける信号の数が質量スペクトルの数の50%未満である場合、信号クラスタは、廃棄され得る。いくつかの実施形態において、選択プロセスの結果、選択された信号クラスタの、わずか約20〜約200個いずれかになる。一旦信号クラスタが選択されると、これらの信号のクラスタの質量電荷比が識別され得る(工程34)。
【0062】
一旦質量電荷比が識別されると、質量電荷比の「欠落信号(missing signals)」が決定され得る。質量スペクトルのいくつかは、識別された質量電荷比の信号を有し得ない。質量スペクトルのグループまたはこの質量スペクトルと関連するサンプルは再分析され得、信号が、識別された質量電荷比にて実際に存在するかどうかを決定する(工程36)。推定値が任意の欠落信号に対して付加される。信号がクラスタ内に見出されないスペクトルについて、強度値がトレースの高さまたは雑音値から推定される。推定された強度値は、ユーザによる選択が可能であり得る。
【0063】
図5を参照して、一旦質量電荷比が識別されると、強度値は、すべての質量スペクトルの識別された質量値の各信号について決定される(工程46)。信号値の各々の強度値は、0〜100に正規化されて、絶対値の大きさの影響を除去する(工程48)。その後、この対数(例えば、底2)が、各正規化された信号強度についてとられる。信号強度の対数をとることは、測定値からスキューを除去する。
【0064】
正規化されたデータセットの対数表示は、その後、分類プロセスによって処理される(工程52)。このプロセスは、デジタルコンピュータによって実行されるコードによって具体化される。このコードがデジタルコンピュータによって実行された後、分類モデルが形成される(工程54)。分類モデルの形成に関するさらなる詳細は、以下に提供される。
【0065】
(III.分類モデルの形成)
デジタルコンピュータによって実行されるコードによって具体化される分類プロセスは、データセットを処理し得る。このコードは、デジタルコンピュータによって実行され得、分類モデルを生成する。コードは、任意の適切なコンピュータの読み出し可能な媒体に格納され得る。コンピュータによって読み出し可能な媒体の例は、磁気、電子、または光学ディスク、テープ、スティック、チップ等を含む。コードは、さらに、C、C++等を含む任意の適切なコンピュータプログラミング言語で書き込まれ得る。
【0066】
デジタルコンピュータは、Windows(R)ベースのオペレーティングシステム等の、任意の標準規格または専用オペレーティングシステムを用いるマイクロ、ミニまたは大型のフレームコンピュータであり得る。他の実施形態において、デジタルコンピュータは、単に、一つ以上のマイクロプロセッサであり得る。デジタルコンピュータは、質量スペクトルを生成するために用いられる質量分析器から物理的に分離され得る。あるいは、デジタルコンピュータは、質量分析器と結合されるかまたは物理的に組み込まれ得る。質量スペクトルデータは、質量分析器からデジタルコンピュータに手動または自動で伝送され得る。例えば、一実施形態において、既知のデータセットは、まず、複数の質量スペクトルから取得され得る。既知のデータセットは、その後、分類プロセスを具体化するコードを実行するデジタルコンピュータに手動で入力され得る。別の実施形態において、質量スペクトルデータの生成および/または収集、データの前処理、および分類プロセスによる前処理されたデータの処理が、同じ物理的計算装置を用いて実行され得る。
【0067】
いくつかの実施形態において、既知のデータセットは、トレーニングセットとして特徴付けられ得る。このトレーニングセットは、前駆データを「訓練」して、分類モデルまたは予め形成された分類モデルにし得る。分類モデルは、訓練され得、形成されて学習する。例えば、神経回路網において、既知のデータセットは、神経回路網に入力されるデータのクラス間の差を認識するように神経回路網を訓練するために用いられ得る。最初の分類モデルが形成された後、分類モデルをさらに訓練および洗練するためにより大きい数のサンプルが用いられ得る。
【0068】
本発明の実施形態において、さらなるデータが、分類モデルを形成するために用いられ得る。さらなるデータは、質量スペクトルと関連し得るか、または関連し得ない。例えば、いくつかの実施形態において、既存のマーカデータは、既知のデータセットに加えて用いられ得、分類モデルを形成する。例えば、前立腺癌患者のサンプルのクラスおよび非前立腺癌の患者のサンプルのクラスの質量スペクトルが取得され得る。既知のデータセットは、質量スペクトルを用いて形成され得る。分類モデルは、既存のPSA診断データ(例えば、PSA臨床試験)等、既知のデータセットおよび既存のマーカデータを用いて形成され得る。さらなる既存のPSA診断データは、分類モデルを形成する質量スペクトルを区別することを支援するために用いられ得る。例えば、各質量スペクトルは、PSAに対応する質量電荷比の信号が、前立腺癌の信号強度特性または非前立腺癌の信号強度特性と、より密接に関連するか否かを見出すように評価され得る。この情報は、質量スペクトルおよびその対応するサンプルを前立腺癌または非前立腺癌クラスに割り当てることを支援するために用いられ得る。他の実施形態において、生物学的サンプルが採取された人の性別、年齢等の非質量スペクトルデータもまた分類モデルを形成するために用いられ得る。例えば、特定の疾患を有する可能性が女性よりも男性のほうが高い場合、この情報は、サンプルを分類して、分類モデルを形成することを支援するためにもまた用いられ得る。
【0069】
任意の適切な分類プロセスが本発明の実施形態において用いられ得る。例えば、分類プロセスは、分類ツリーおよび回帰ツリープロセスまたは多変量統計的分析等の階層的分類プロセスであり得る。多変量統計的分析は、いくつかの変数間の関係のパターンを同時に調べる。多変量統計分析の例は、判別関数分析およびクラスタ分析等の周知のプロセスを含む。判別関数分析は、各グループの過去の観察に基づいてグループに観察を割り当てる統計的方法である。クラスタ分析は、データの多変量変化を一連のセットとして表す分析の方法である。生物学において、例えば、このセットは、多くの場合、階層的態様で構成され、系統樹と呼ばれる樹木のような形状で示される。クラスタ分析および他の分類プロセスのいくつかのタイプは、Jainらによる文献「Statistical Pattern Recognition: A Review」IEEE Transactions on Pattern Analysis and Machine Intelligence、Vol.22、No.1(2000年1月)に記載される。この文献は、参考のため、その全体を本明細書中に援用する。
【0070】
あるいは、分類プロセスは、人工神経回路網解析等の非線形分類プロセスを用い得る。人工神経回路網は、既知のデータセットを用いて訓練され得る。一般に、人工神経回路網解析は、これに影響を及ぼし得るいくつかの他の入力変数からの入力に基づく出力変数の値を予測し得る。この予測は、既知のパターンのセットから、特定の状況に最も適切であると思われる一つを選択することによってなされる。人工神経回路網は、概念上、いくつかの神経エレメント(単位)、およびこれらのエレメント間の接続を有する。これらの単位は、これらの機能によって三つの異なった層またはグループにカテゴリー分類される。第1のグループは、システムに入力されるデータを受信する入力層を形成する。第2のグループは、出力パターンを表す出力データを送達する出力層を形成する。第3のグループは、入力パターンを出力に変換するかくれ層としても知られる多数の中間層を含む。
【0071】
例示的に、神経回路網は、疾患状態と非疾患状態とに関連するレーザ脱離質量スペクトル間の区別をするように訓練され得る。その後、試験生物学的サンプルの質量スペクトルは、レーザ脱離プロセスによって生成され得、この質量スペクトルに関するデータは、訓練された神経回路網に入力され得る。訓練された神経回路網は、試験生物学的サンプルが疾患状態と非疾患状態のどちらに関連するかを決定し得る。
【0072】
本発明の実施形態において、分類プロセスは、好適には、分類および回帰ツリープロセス等の階層的、再帰的分割プロセスを含む。本発明の実施形態において、分類および回帰ツリープロセスは、デジタルコンピュータによって実行され得るコンピュータコードによって具体化される。例示的分類および回帰ツリープログラムは、Salford Systems,Inc.(www.salford−systems.com)から市販されるCART4.0である。
【0073】
一つの特定の分類および回帰ツリープロセスは、二進再帰的分割プロセスである。このプロセスは、二進である。なぜなら、親ノードは、常に、正確に二つの子ノードに分割されるからであり、このプロセスは、各子ノードを親として扱うことによって繰返され得るため再帰的である。既知のデータセットを分割するために、既知のデータセットに問合わせされる。本発明の実施形態において、分割されるデータは、生物学的サンプルのクラスセットに対応する質量スペクトルである。各質量スペクトルは、分類されるべき「事例」と考えられ得る。事例を分割するために用いられ得る例示の問合わせは、「質量電荷比の信号の信号強度XはYよりも大きいか否か」であり得る。各問合わせは、既知のデータセットをより均一な構成の二つのグループに細分する。一旦最良の分割が見出されると、分類および回帰ツリープロセスは、各子ノードを検索するプロセスを繰返し、さらなる分割が不可能になるまで再帰的に継続または停止される。分割は、特定のノードに一つのケースのみが残るか、またはそのノードにおけるすべてのノードが同じタイプである場合不可能である。
【0074】
データセットについての問合わせは、ユーザによって決定され得るか、またはデジタルコンピュータによって自動的に決定され得る。いくつかの実施形態において、この問合わせは、デジタルコンピュータによって任意に生成され得、分割されるデータの質は、問合わせが容認され得るか否かを決定する。例えば、問合わせは、データに関して行われ得る。このパーティショニングが統計的に重要な事例の分割を生じさせた場合、この問合わせは、分類および回帰ツリーを形成するために保持されかつ用いられ得る。分類および回帰ツリープロセスは、データを分類するために必要とされる最適な数の問合わせを識別し、各サンプル観察におけるランダムエラーの影響を補償する。
【0075】
分類および回帰ツリープロセスは、分析に含まれるすべての予測変数について可能なすべての分割を考察する。例えば、215個の事例および19個の予測変数を有するデータセットについて、プロセスは、全部で4085回の可能な分割のために215×19の分割を考慮する。通常、すべてのこのような分割は、分類および回帰ツリーを形成する場合に考えられる。従って、形成された分類および回帰ツリープロセスは、分類モデルを形成する際に異なった予測変数を考慮に入れる。例えば、典型的な実施形態において、クラスセットのすべての質量スペクトルにおける100を超える質量電荷比における信号のデータは、分類モデルを形成する場合に考慮に入れられる。比較して、すでに説明された差分表現分析(differential expression analysis)は、ただ一つの予測変数を考慮に入れる。従って、分類および回帰ツリーの実施形態は、他の分類法よりも正確な分類精度を提供し得る。なぜなら、各質量スペクトルからのより多くのデータが分類モデルを形成するために用いられるからである。
【0076】
モデルの精度を点検するために、分類および回帰ツリープロセスは、相互検証(cross validation)と呼ばれるコンピュータを駆使した技術を用い得る。通常の相互検証プロセスにおいて、大きいツリーが成長し、その後、余分のものを取り除かれる(pruned back)。データセットは、10個のほぼ等しい部分に分割される。これらの各々は、分析される生物学的状態について同様の分布を含む。データの最初の9個の部分は可能な最大のツリーを構成するために用いられる。データの残りの1部分は、選択されたサブツリーのエラーレートの最初の推定を取得するために用いられる。同じプロセスが、その後、別の9/10のデータに対して繰返され(可能な最大のツリーを成長させる)、異なった1/10部分は試験サンプルとして用いられる。プロセスは、データの各パートが試験サンプルとして1度蓄えられるまで継続する。10回の小試験サンプルの結果は、その後、各可能な大きさのツリーのエラーレートを形成するために組合される。これらのエラーレートは、全体のデータセットに基づくツリーに適用される。相互検証は、ツリーの独立した予測精度のかなり信頼できる推定を提供する。独立した試験サンプルが利用可能でない場合であっても、このツリーが新しいデータ(例えば、複数の未知のサンプルからのデータ)を完全に分類し得る精度の程度に関して予測がなされ得る。
【0077】
生成される分類および回帰ツリーは、予測変数(存在する場合)がサンプルグループ間の相違を決めるもとになる表現を提供する。分類および回帰ツリーは、分類のために用いられ得(どのグループにケースが属するかを予測する)、さらに回帰のために用いられ得る(特定の値を予測すること)。これはさらに、分析されるクラス間の判別において重要であり得る特徴を識別するために用いられ得る。例えば、分類モデルは、特定の質量電荷比の一つ以上の信号強度値(単独または組み合わせで)が、分析されるクラスを区別する重要な特徴であることを示し得る。
【0078】
分類および回帰ツリーは、データにおいて見出される関係をグラフィックで表示する。分類および回帰ツリープロセスの一つの主要な出力は、ツリーそれ自体である。ツリーは、ユーザによって視覚的に分析され得る分類モデルの1局面として利用され得る。神経回路網解析等の非線形技術と異なって、ツリーによって提供される視覚的プレゼンテーションは、分類分析を非常に容易に理解および習得させる。その結果、ユーザは、訓練された神経回路網に特徴的であるような「ブラックボックス」分類よりも決定ツリーの結果を信用する傾向がある。これは、分類および回帰ツリーを、種々の健康管理と規制職員(例えば、食品医薬品局)、および分類モデルを生成するために用いられる分析を詳細に理解することを所望し得る患者のために所望の分類モデルにする。このツリーは、分析されているデータと生物学的状態との間の未知の関係を前もって発見するためにもまた用いられ得る。
【0079】
分類および回帰ツリープロセスは、神経回路網解析等の分類プロセスと比較して他の利点を有する。例えば、分類および回帰ツリープログラムは、通常、多数の、時には数千にものぼるトレーニングセットデータの経路を必要とする神経回路網よりも効率的である。しかしながら、決定ツリーを構築することが必要とされる経路の数は、ツリーにおけるレベルの数を超えることはない。ツリーにおけるレベルの数には所定の制限はないが、ツリーの深さおよび幅広さによって判定されるように、通常、予測変数の数が上昇すると、ツリーの複雑性は増加する。
【0080】
さらに、分類および回帰ツリーモデルを用いて、クラス間を判別し得る特徴が識別され得る。データ内で識別された特徴は、分析されている生物学的状態(単数および複数)の特徴であり得る。例えば、分類モデルは、特徴の組み合わせが、特定の生物学的状態と関連付けられることを示し得る。例えば、モデルは、異なった質量電荷比の特定の信号強度が、疾患状態と非疾患状態とを区別することを示し得る。従来の差分分析プロセスと比較して、本発明の実施形態において、多くの異なった変数が分析され得る。分類モデルは、単一の予測変数を識別し得るか、または分析されている生物学的状態を区別し得る複数の予測変数を識別し得る。
【0081】
(IV.分類モデルの使用)
分類モデルは、未知のサンプルを生物学的状態に分類するために用いられ得る。この方法において、試験サンプルの質量スペクトルは、そのサンプルがその生物学的状態と適切に分類され得るか否かを決定するために特定の生物学的状態と関連する分類モデルと比較され得る。未知の生物学的サンプルの質量スペクトルが取得され得、その未知のサンプルの質量スペクトルから取得されるデータはデジタルコンピュータに入力され得る。入力されたデータは、分類モデルを用いて処理され得る。分類モデルは、その後、未知のサンプルを特定のクラスに分類し得る。クラスは、これと関連する特定の生物学的状態を有し、その人は特定の生物学的状態を有すると診断され得る。
【0082】
この方法は、臨床的用途に対して特定の使用を有する。例えば、薬剤発見のプロセスにおいて、候補分子が、生物学的システムにおいて特定の薬剤または薬剤のクラス(例えば、セラトニン再摂取阻害物質のクラス(seratonin re−uptake inhibitors))と生理学的に同じ結果を生成するか否かを決定することが所望される。薬剤または目的の薬剤のクラスに曝すことに基づいて、生物学的システムを判別する(例えば、人または試験用動物)分類モデルが最初に開発される。その後、生物学的システムは、試験分子に曝され、そしてシステムからのサンプルの質量スペクトルが生成される。このスペクトルは、その後、スペクトルが試験されている既知の薬剤または薬剤のグループの分類に属するか、または属さないと分類される。候補分子が、このクラスに割り当てられる場合、この情報は、薬剤に関するさらなる研究を実行するか否かを決定する際に有用である。
【0083】
別の用途において、種々の毒性および非毒性の種々の生物学的状態を区別する分類モデルが開発される。毒性状態は、例えば、薬剤または薬剤のクラスに曝すことから生じ得る。すなわち、分類モデルは、薬剤または薬剤のクラスが生物学的システムにおいて毒性反応を生成するか否かを示す分類モデルが開発され得る(例えば、肝毒性(liver toxicity)を含むインビボまたはインビトロのモデルシステム)。その後、開発中または臨床試験中の薬剤がシステムにおいて試験され得、このシステムからのサンプルのスペクトルは、毒性かそうでないか分類され得るか否かを決定する。この情報は、さらに、薬剤を開発する間の毒性の研究において有用である。
【0084】
別の用途において、特定の薬剤に対して反応する人か、または反応しない人かを判別する分類モデルが開発される。その後、反応者か非反応者かが知られていない人に薬剤を与える前に、その人からのサンプルが、質量分析器によって試験され、かつその薬剤に対する反応者か非反応者のクラスに割り当てられる。
【0085】
別の用途において、疾患を有する人と、その疾患を有しない人とを区別する分類モデルが開発される。その後、診断テストを受ける人は、分類を、疾患を有する状態および疾患を有しない状態に分類するためにサンプルを提供し得る。従って、この方法は、臨床診断のために有用である。
【0086】
一実施形態は、癌を分析するために向けられる。病理学者は、組織の外観によって癌を等級分けする。軽度の癌の特徴は、核/細胞質の比率の穏やかな増加、少数の有糸分割、穏やかな細胞の異質性、および概して正常な細胞構築の残留を有する拡大された核を含む。重度の癌の特徴は、高い核/細胞質の比率を有する拡大された奇妙な様相の核、有糸分割の数の増加(そのうちのいくつかは異型で現れ得る)、および正常な細胞構造とのわずかな類似または類似の欠如を含む。非疾患、軽度癌および重度癌の生物学的サンプルを区別する分類モデルを開発することは有用である。なぜなら、この診断は、多くの場合、治療的決定を指示し、かつ診断を予測し得るからである。サンプルは、固体組織バイオプシまたは疑われる病巣の細い針による吸引液であり得る。しかしながら、別の実施形態において、サンプルは、例えば、尿、血液または他の体液等、試験される個人のグループから比較的容易に収集される源から取り出され得る。これは、膀胱癌、前立腺癌および乳癌等の、これらの流体内に、細胞またはタンパク質を分泌する癌に特に有用である。これらの状態の分類モデルが構築されると、このモデルは、診断テストを受ける人からのサンプルを分類するために用いられ得る。別の用途において、病的でない特定の物理的または生理的素質を有する個人のクラス間を区別する分類モデルが開発される。その後、その素質を有することが知られていない個人は、その個人からのサンプルを試験することによって、およびスペクトルをその素質を有するクラスか、またはその素質を有するクラス外に分類することによって分類され得る。
【0087】
分類モデルは、さらに、未知のサンプルが、生物学的状態によって特徴付けられるクラスに属するものとして正確に分類される尤度を推定するためにも用いられ得る。例えば、分類および回帰ツリーにおいて、潜在的誤分類の尤度が決定され得る。例示的に、疾患状態と非疾患状態とを区別する分類および回帰ツリーモデルは、患者からの未知のサンプルを分類する。このモデルは、誤分類の尤度を評価し得る。例えば、疾患の誤分類の尤度が10%未満である場合、患者は、自分が疾患を有する可能性が90%であることを知らされ得る。
【0088】
(V.コンピュータにより読み出し可能な媒体を含むシステム)
本発明のいくつかの実施形態は、コンピュータによって読み出し可能な媒体を含むシステムに向けられる。コンピュータによって読み出し可能な媒体およびデジタルコンピュータを組み込む例示的システムのブロック図が図6に示される。システム70は、デジタルコンピュータ74に結合される質量分析器72を備える。ビデオディスプレイなどのディスプレイ76およびコンピュータによって読み出し可能な媒体78は、デジタルコンピュータ74に操作可能に結合され得る。ディスプレイ76は、デジタルコンピュータ74によって生成される出力を表示するために用いられ得る。コンピュータによって読み出し可能な媒体78は、デジタルコンピュータ74によって実行されるべき命令を格納するために用いられ得る。
【0089】
質量分析器は、デジタルコンピュータ74と操作上関連し得るが、このデジタルコンピュータ74と物理的または電気的に結合されない。例えば、質量分析器からのデータが取得され得(上述のように)、その後、このデータは、ヒューマンオペレータによって手動または自動でデジタルコンピュータ74に入力され得る。他の実施形態において、質量分析器72は、デジタルコンピュータ74にデータを自動的に送信し得、そこで、データは処理され得る。例えば、質量分析器72は、一つ以上の生物学的サンプルから生データを生成し得る(例えば、飛行時間データ)。このデータは、その後、デジタルコンピュータ74に送信され得、ここで、データは、前処理されるか、または処理され得る。データを処理するための命令は、コンピュータによって読み出し可能な媒体78から取得され得る。質量分析器からのデータが処理された後、出力が生成され、ディスプレイ76上に表示され得る。
【0090】
コンピュータによって読み出し可能な媒体78は、質量分析器72からのデータを処理するための任意の適切な命令を含み得る。例えば、コンピュータによって読み出し可能な媒体78は、未知の生物学的サンプルの質量スペクトルから取得されたデータをデジタルコンピュータ74に入力するためのコンピュータコードを含み得る。データは、その後、分類モデルを用いて処理され得る。分類モデルは、未知のサンプルが生物学的状態によって特徴付けられるクラスに正確に分類される尤度を推定し得る。
【0091】
ブロック図は、個別のブロックで、質量分析器72、デジタルコンピュータ74、ディスプレイ76およびコンピュータ読み出し可能媒体78を示すが、これらのコンポーネントの一つ以上は、同じかまたは異なったハウジング内に存在し得ることが理解される。例えば、いくつかの実施形態において、デジタルコンピュータ74およびコンピュータ読み出し可能媒体76は、同じハウジング内に存在し得るが、他方、質量分析器72およびディスプレイ76は、異なったハウジング内にある。さらに他の実施形態において、コンポーネントのすべて72、74、76、78は、単一ユニットに形成され得る。
【0092】
(例)
複数の質量スペクトルは、生物学的サンプルのセットの中の生物学的サンプルから発生する。そのセットは、普通の患者からの血清の第一クラスおよび前立腺癌を有する患者からの血清の第二クラスを含む。それぞれの患者からの血清サンプルは、California州FremontのCiphergen Biosystems Inc.で商業的に入手可能な表面活性化レーザ吸収イオン化システムを介して取得される。Ciphergen BiosystemのProteinChip(R)技術もまた、この例において使用される。ProteinChip(R)についてのさらなる詳細は、ウェブサイトwww.ciphergen.comで見つけられ得る。それぞれのサンプルの出力の結果は、質量電荷比に対する信号強度の質量スペクトルプロットである。ディスクリートなピークは質量スペクトルの信号を表わしている。
【0093】
特定の質量電荷比での信号強度は、特定の質量電荷比を有するタンパク質の量に対応する。例えば、高い信号強度は、タンパク質が高濃度であることを示す。それぞれの質量スペクトルでの信号は、配置され、定量化され、そして選択される。この例において、質量スペクトルの部分が、周囲のノイズレベルの少なくとも二倍の強度値を有する場合、これらは、受け入れ可能な信号と考えられる。ほぼ同じ質量電荷比における質量スペクトルでの信号は、全ての質量スペクトルにおいてクラスタ化される。クラスタ化された後、およそ250個の信号クラスタは識別され、P1からP250と名付けられる。それぞれの信号クラスタ、P1からP250は、特定の質量電荷比に対応し、「予測変数(predictor variable)」として特性を示す。
【0094】
それぞれの質量スペクトルに対する識別された質量電荷比での信号強度は、既知のデータセットを形成する。これらの信号強度は、Salford System,Inc(www.salford‐systems.com)で商業的に入手可能な、分類ツリーおよび回帰ツリープログラム、CART4.0に入力される。そのプログラムはデジタルコンピュータによって実行される。そのデジタルコンピュータは、分類ツリーおよび回帰ツリーを形成する。そのデータを使用することにより、それぞれのサンプルは、普通または癌として分類される。
【0095】
質量スペクトルデータが入力された後、デジタルコンピュータは図6に示されるようなツリーを生成する。この例において、クラス0が正常でクラス1が癌である。それぞれの質量スペクトルは、そのツリーで分類される「事例」として特徴付けられ得る。
【0096】
ツリー内のそれぞれのボックスは、「ノード」を表わす。頂上のノード、ノード1は、ルートノードと呼ばれる。決定ツリーは、ルートノードから成長し、新しいノードを形成するために、それぞれのレベルにデータを分割する。枝は新しいノードに結合する。それ以上分割しないノードは、端末ノード(terminal nodes)と名付けられる。図6に示されたツリーの端末ノードは、端末ノード1〜7と名付けられる。以下にさらに詳細に説明されるように、端末ノード1〜7は、未知のサンプルを分類するために使用され、従って、予測のために使用され得る。
【0097】
それぞれのノードにおいて、全体のノードに対し、過半数が、その分類として確定される。例えば、端末ノード1は、4人の患者を有する。これらの4人の患者は、全員癌を持っている。端末ノード1は、それ故、癌ノードとして特徴づけられる。全ての事例は、同じ値(癌)を有するため、このノードは、「純粋」として特徴付けられ、もはや分割されない。この端末ノード1が3人の癌患者および1人の普通の患者を含む場合、そのノードは、患者の過半数が癌患者であるので、やはり癌ノードとして特徴付けられる。この例において、1人の普通の患者は、間違って分類されたと考えられる。
【0098】
図6において、それぞれのノードは、そのノードに対する事例の数および生物学的なの状態(癌)の分布についての情報を含む。ルートノード(ノード1)での事例は、質量スペクトルデータセットの全事例である。ノード1は、194個の事例を含み、そのうちの96個が普通で、98個が癌である。ノード1は二つの新しいノード(ノード2およびノード5)に分けられる。その分割されるデータは、クラスタP127に対する信号強度の平均が、3.2946以下であるかどうかを判定し、決定される。平均信号強度およびその値3.2946が相対的な大きさである。この問い合わせに対する答えがイエスの場合、続いて対応する事例がノード2に配置される。この問い合わせに対する答えがノーならば、続いて、対応する事例がノード5に配置される。この例において、85人の癌患者および11人の普通の患者の質量スペクトルは、予測変数P127と関連する質量電荷比において、3.2946以下の信号強度を有し、ノード2に配置される。85人の普通の患者および13人の癌患者の質量スペクトルは、予測変数P127と関連する質量電荷比において3.2946以上の信号強度を有し、ノード5に配置される。ツリーを形成するために、異なる分割基準を用いて同様に分類することが、他のノードにて起こる。
【0099】
分類ツリーおよび回帰ツリーのプリデクタ動作は、表1および表2を参照することにより示され得る。
【0100】
【表1】
Figure 2004522980
分類ツリーおよび回帰ツリープログラムは、既知のデータセットを二つのグループに分ける。データのおよそ90%が、学習セットとして使用され、およそ10%が試験セットとして使用される。分類ツリーおよび回帰ツリーは初期に学習セットデータを使用して形成される。ツリーが形成された後、どのように分類ツリーおよび回帰ツリーが、正確にデータを分類するかを見るために、残りの10%の試験データで試験される。表1を参照することにより、全ての学習セットデータは、形成された分類ツリーおよび回帰ツリーを使用して正しく分類される。表2を参照することで、普通のケースおよび癌のケースの試験データを分類するための百分率エラー比は、それぞれ9.38%および11.22%である。逆に、分類成功比率は、普通の場合と癌の場合に対し、それぞれ90.62%および88.78%である。
【0101】
これらのような分類成功比率は、分類ツリーおよび回帰ツリーが未知の生物学的サンプルを分類するためのかなり正確なモデルである。その分類プロセスにおいて、複数の予測変数は、分類スキームで考察される。試験患者を分類するために一つの質量電荷比における信号強度の平均を使用するのみである既に記述した差分分析手続きに比べて、より多数のデータが、質量スペクトルと関連するサンプルを分類するために質量スペクトルから使用され得る。従って、分類モデルは、試験患者を分類する中で多くの従来の分類モデルよりもより正確になり得る。
【0102】
一度成長すれば、そのツリーは、ツリーのルート(頂上)にて始まり、そして端末ノードに出会うまで、枝にしたがって経路を下り続けることによって、未知のサンプルを分類することに使用される。その経路は、未知のサンプルの質量スペクトルに対し、予測変数の値に依存する分割規則を課すことによって判定される。例えば、試験患者からの未知の血清のサンプルの質量スペクトルが、それぞれプリデクタ値P127,P193およびP187の質量電荷比にて1.0,0.05および0.9の強度の信号を有する場合、その試験患者は、ノード1、ノード2、ノード3および最後の端末ノード1に分類される。端末ノード1は、癌ノードであり、その患者は癌患者であるとして分類される。
【0103】
図7は、予測変数(例えば、信号クラスタ)のいくつかの各々に対する変数の重要性における表である。その変数の重要性における表は、それらが分類ツリーおよび回帰ツリーを構築するために、どのように役に立つかによって予測変数を評価する。特定の予測変数が質量スペクトルデータを厳しく識別する場合、それは、分類ツリーを構築することにおいて、重要である。重要度変数スコアを計算するために、CARTは、主要な分割の代理としての役割であるそれぞれの変数に起因する改良尺度を見る。これらの改良の値は、それぞれのノードおよび全てにわたって加算され、かつ合計され、そして、最も良く実行される変数に関連してスケール変換される。改良の最も高い合計値を有する変数は、スコア100であり、全ての他の変数は、ゼロに向かって下の方の範囲の低いスコアを有する。
【0104】
図7において、分類モデルは、予測変数P36、P127およびP90が、分類ツリーおよび回帰ツリーを形成することにおいて他の予測変数よりもより重要であるということを示す。結果としてそれらはクラス間(癌および非癌)での識別において他の予測変数よりも重要である。これらの予測変数に関連する質量電荷比はまた、非前立腺癌サンプルから、前立腺癌サンプルを識別する潜在性マーカに対応する。従って、分類モデルは、分析されているクラス間を識別し得る一つ以上のマーカを識別するために利用され得る。
【0105】
ツリーモデルの有効性は、図8および図9を参照することにより確認され得る。図8の図は、ゲルビュー(gel view)で、一方、図9の図はトレースビューである。そのスペクトルは、5075ダルトン(電荷=+1)の質量電荷比にてP127を意味する信号を拡大表示したものである。図8および図9は、6人の前立腺癌の患者および6人の非前立腺癌の患者からのサンプルのマーカが予測変数P127に対応する5075個のダルトンの質量値にて、区別をつけて表わされたものである。図6のツリーを示すことにより、予測変数P127は、ほとんどの他の予測変数よりも、サンプルの非前立腺癌患者クラスからサンプルの前立腺癌クラスを識別することが、より効率的になることが示される。
【0106】
上述は、本発明の特定の好ましい実施形態を方向付けるものであるが、本発明の他のおよびさらなる実施形態は、本発明の基本的な範囲から逸脱することなし派生される。そのように代替の実施形態は、本発明の範囲に含まれることが意図される。さらに、本発明の一つ以上の実施形態の特徴は、本発明の範囲から逸脱することなしに本発明の他の実施形態の一つ以上の特徴と組み合わされ得る。
【0107】
本願で引用された全ての公報(例えば、ウェブサイト)および特許書類は、それぞれの個々の公報または特許書類個々に示されているのと同じ程度に全ての目的に対して参考として援用される。本明細書における様々な文献の引用によっても出願人は、任意の特定の文献が本発明に対する「従来技術」であることを認めるものではない。
【図面の簡単な説明】
【図1A】
図1Aは、疾患患者からのサンプルの重なり合った質量スペクトルを示す。
【図1B】
図1Bは、正常の患者からのサンプルの重なり合った質量スペクトルを示す。
【図2】
図2は、本発明の実施形態による質量スペクトルを作成する方法のフロー図を示す。
【図3】
図3は、識別されたピーククラスタの関数として正規化された強度の対数のグラフを示す。サンプルの二つの異なる群からの質量スペクトルによる信号強度は、グラフの中で示される。
【図4】
図4は、本発明の実施形態によるいくつかの好適な質量スペクトルの前処理の手続を示すフロー図を示す。
【図5】
図5は、本発明の実施形態によるいくつかの好適な質量スペクトルの前処理手続、および分類モデルの形成手続を示すフロー図を示す。
【図6】
図6は、本発明の実施形態によるシステムのブロック図を示す。
【図7】
図7は、本発明の実施形態による分類および回帰ツリーを示す。
【図8】
図8は、異なる予測変数の重要度変数を示す表を示す。
【図9】
図9は、癌患者および正常の患者からの異なるサンプルによって得られたゲルビューを示す。
【図10】
図10は、癌患者および正常の患者からの異なるサンプルによって得られたスペクトルデータを示す。

Claims (39)

  1. デジタルコンピュータを用いる質量スペクトルを分析する方法であって、該方法は、
    a)複数のサンプルからの質量スペクトルから得られるデータセットをデジタルコンピュータに入力する工程であって、各サンプルは、二つ以上のクラスを含むクラスセット内のクラスにあるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、飛行時間、質量電荷比、あるいは飛行時間または質量電荷比から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、工程と、
    b)該クラスセットの該クラスを区別する分類モデルを形成する工程であって、該形成する工程は、分類プロセスを実現するコードを実行することによって該データセットを分析する工程を含む、工程と
    を包含する、方法。
  2. 前記質量分析は、MALDIスペクトル、表面を活性化するレーザ脱離基/イオン化スペクトル、およびエレクトロスプレーイオン化スペクトルからなる群から選択される、請求項1に記載の方法。
  3. 前記クラスセットは、正確に、二つのクラスからなる、請求項1に記載の方法。
  4. 前記サンプルは、ポリペプチドおよび核酸からなる群から選択される生体分子を含む、請求項1に記載の方法。
  5. 前記サンプルは、真核生物、原核生物、またはウイルスから派生する、請求項1に記載の方法。
  6. 前記異なる生物学的状態は、正常状態および病理学的状態を含む、請求項1に記載の方法。
  7. 前記異なる生物学的状態は、非疾患軽度の癌および重度の癌を含む、請求項1に記載の方法。
  8. 前記異なる生物学的状態は、薬物療法の状態および非薬物療法の状態を含む、請求項1に記載の方法。
  9. 前記異なる生物学的状態は、薬物反応状態および薬物無反応状態を含む、請求項1に記載の方法。
  10. 前記異なる生物学的状態は、中毒状態および非中毒状態を含む、請求項1に記載の方法。
  11. 前記中毒状態は、薬物に曝すことから生じる、請求項10に記載の方法。
  12. 前記データセットは、既知のデータセットであり、各サンプルは、該データセットが前記デジタルコンピュータに入力される以前に前記クラスの一つに割り当てられる、請求項1に記載の方法。
  13. 前記分類モデルを形成する工程は、該分類モデルを形成するために既存のマーカを用いる工程を含む、請求項1に記載の方法。
  14. 前記データセットが、 前記質量スペクトルの信号を検出する工程であって、各質量スペクトルは、前記質量電荷比の関数として信号強度を表すデータを含む、工程と、
    類似の質量電荷比を有する該信号を信号クラスタにクラスタ化する工程と、
    所定の値以上の信号強度を有する少なくとも所定数の信号を有する信号クラスタを選択する工程と、
    該選択された信号クラスタに対応する該質量電荷比を識別する工程と、
    該識別された質量電荷比における信号強度を用いて該データセットを形成する工程と
    によって形成される、請求項1に記載の方法。
  15. 前記分類モデルを形成する工程は、前記異なる生物学的状態を区別する特徴を識別する工程、および学習する工程の少なくとも一つを含む、請求項1に記載の方法。
  16. 前記分類プロセスは、神経回路網解析を含む、請求項1に記載の方法。
  17. c)一つ以上の特徴が前記異なる生物学的状態を区別するかどうかを判別するために前記分類モデルに問い合わす工程をさらに含む、請求項1に記載の方法。
  18. c)さらに大量のサンプルを用いてa)およびb)を繰り返す工程をさらに含む、請求項1に記載の方法。
  19. 前記分類プロセスはクラスタ分析である、請求項1に記載の方法。
  20. 前記データセットを形成する工程をさらに含み、該データセットを形成する工程は、前記質量スペクトルから生データを取得する工程と、次に、該データセットを形成するために該生の質量スペクトルデータを前処理する工程とを包含する、請求項1に記載の方法。
  21. 前記異なるクラスは、薬物に曝すこと、一つのクラスの中の一つの薬物に曝すこと、および薬物または一つのクラスの中の一つの薬物に曝す不足から選択される、請求項1に記載の方法。
  22. 前記各質量スペクトルは質量電荷比の関数または質量電荷比から導出された値としての信号強度を表すデータを含む、請求項1に記載の方法。
  23. デジタルコンピュータを用いて生物学的状態によって特徴付けられたクラスに未知のサンプルを分類する方法であって、該方法は、
    a)該未知のサンプルの質量スペクトルから得られたデータを該デジタルコンピュータに入力する工程と、
    b)請求項1の方法によって形成された分類モデルを用いて該質量スペクトルを処理して、該生物学的状態によって特徴付けられたクラスに該未知のサンプルを分類する工程と
    を包含する、方法。
  24. 前記クラスは、疾患状態によって特徴付けられる、請求項23に記載の方法。
  25. 前記異なる生物学的状態は、非疾患の軽度の癌および重度の癌を含む、請求項23に記載の方法。
  26. 前記クラスは、一つのクラスの薬物のうちの一つの薬物を投与することによって特徴付けられる、請求項23に記載の方法。
  27. 前記クラスは、薬物反応によって特徴付けられる、請求項23に記載の方法。
  28. 前記クラスは、中毒状態によって特徴付けられる、請求項23に記載の方法。
  29. 未知のサンプルが、デジタルコンピュータを用いて生物学的状態によって特徴付けられるクラスに属するように正確に分類される尤度を推定する方法であって、該方法は、
    a)該未知のサンプルの質量スペクトルから得られたデータをデジタルコンピュータに入力する工程と、
    b)請求項1の方法によって形成された前記分類モデルを用いて該質量スペクトルデータを処理して、該未知のサンプルが生物学的状態によって特徴付けられるクラスに正確に分類される尤度を推定する工程と
    を包含する、方法。
  30. コンピュータ読み出し可能媒体であって、
    a)未知のサンプルの質量スペクトルから得られたデータをデジタルコンピュータに入力するためのコードと、
    b)請求項1の方法によって形成された前記分類モデルを用いて該質量スペクトルを処理して、生物学的状態によって特徴付けられたクラスに該未知のサンプルを分類するためのコードと を含む、コンピュータ読み出し可能媒体。
  31. 気相イオン分析器と、 該気相イオン分析器からのデータを処理するように適応されたデジタルコンピュータと、
    該デジタルコンピュータと操作上関連する、請求項29のコンピュータ読み出し可能媒体と
    を含む、システム。
  32. 前記気相イオン分析器は、レーザ脱離イオン化プロセスを実行するように適応される、請求項30に記載のシステム。
  33. コンピュータ読み出し可能媒体であって、
    a)未知のサンプルの質量スペクトルから得られたデータをデジタルコンピュータに入力するためのコードと、
    b)請求項1の方法によって形成された前記分類モデルを用いて該質量スペクトルデータを処理して、該未知のサンプルが生物学的状態によって特徴付けられるクラスに正確に分類される尤度を推定するためのコードと
    を含む、コンピュータ読み出し可能媒体。
  34. 気相イオン分析器と、 該気相イオン分析器からのデータを処理するように適応されたデジタルコンピュータと、
    該デジタルコンピュータと操作上関連する、請求項32のコンピュータ読み出し可能媒体と
    を含む、システム。
  35. 前記気相イオン分析器は、レーザ脱離イオン化プロセスを実行するように適応される、請求項33に記載のシステム。
  36. コンピュータ読み出し可能媒体であって、
    a)複数のサンプルからの質量スペクトルから導出されたデータを入力するためのコードであって、各サンプルは、二つ以上のクラスのクラスセット内のクラスであるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、飛行時間、質量電荷比、あるいは飛行時間または質量電荷比から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、コードと、
    b)分類プロセスを用いて分類モデルを形成するためのコードであって、該分類モデルは、該クラスセットにおいて該クラスを区別する、コードと
    を含むコンピュータ読み出し可能媒体。
  37. 前記分類プロセスは、神経回路網解析を含む、請求項35に記載のコンピュータ読み出し可能媒体。
  38. 気相イオン分析器と、 該気相イオン分析器からのデータを処理するように適応されたデジタルコンピュータと、 該デジタルコンピュータと操作上関連する、請求項35のコンピュータ読み出し可能媒体と
    を含む、システム。
  39. 前記気相イオン分析器は、レーザ脱離イオン化プロセスを実行するように適応される、請求項37に記載のシステム。
JP2003534055A 2000-11-16 2001-11-15 質量スペクトルを分析する方法 Pending JP2004522980A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US24983500P 2000-11-16 2000-11-16
US25474600P 2000-12-11 2000-12-11
PCT/US2001/044972 WO2003031031A1 (en) 2000-11-16 2001-11-15 Method for analyzing mass spectra

Publications (2)

Publication Number Publication Date
JP2004522980A true JP2004522980A (ja) 2004-07-29
JP2004522980A5 JP2004522980A5 (ja) 2005-04-07

Family

ID=26940382

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002544625A Pending JP2004536276A (ja) 2000-11-16 2001-11-15 質量スペクトルを分析する方法
JP2003534055A Pending JP2004522980A (ja) 2000-11-16 2001-11-15 質量スペクトルを分析する方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2002544625A Pending JP2004536276A (ja) 2000-11-16 2001-11-15 質量スペクトルを分析する方法

Country Status (8)

Country Link
US (2) US6675104B2 (ja)
EP (2) EP1355727A4 (ja)
JP (2) JP2004536276A (ja)
CN (2) CN1623091A (ja)
AT (1) ATE540421T1 (ja)
AU (3) AU2002245043B2 (ja)
CA (2) CA2429633A1 (ja)
WO (2) WO2002042733A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7316931B2 (en) 2000-10-19 2008-01-08 Target Discovery, Inc. Mass defect labeling for the determination of oligomer sequences
JP2016224031A (ja) * 2015-04-22 2016-12-28 ザ・ボーイング・カンパニーThe Boeing Company フォービエイテッド圧縮投影を用いたハイパースペクトルデミキシング
JP2017224283A (ja) * 2016-06-09 2017-12-21 株式会社島津製作所 ビッグデータ解析方法及び該解析方法を利用した質量分析システム

Families Citing this family (210)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7617163B2 (en) * 1998-05-01 2009-11-10 Health Discovery Corporation Kernels and kernel methods for spectral data
US11026768B2 (en) 1998-10-08 2021-06-08 Align Technology, Inc. Dental appliance reinforcement
WO2001099043A1 (en) 2000-06-19 2001-12-27 Correlogic Systems, Inc. Heuristic method of classification
KR101054732B1 (ko) * 2000-07-18 2011-08-05 더 유나이티드 스테이츠 오브 아메리카 애즈 리프리젠티드 바이 더 세크레터리 오브 더 디파트먼트 오브 헬쓰 앤드 휴먼 써비시즈 생물학적 데이터의 숨겨진 패턴에 근거한 생물학적 상태의 식별 방법
US8463718B2 (en) * 2000-08-07 2013-06-11 Health Discovery Corporation Support vector machine-based method for analysis of spectral data
US6539102B1 (en) * 2000-09-01 2003-03-25 Large Scale Proteomics Reference database
US6980674B2 (en) * 2000-09-01 2005-12-27 Large Scale Proteomics Corp. Reference database
US20050009120A1 (en) * 2000-09-07 2005-01-13 The Brigham And Women's Hospital, Inc. Methods of detecting ovarian cancer based on osteopontin
US6846642B2 (en) * 2000-09-07 2005-01-25 The Brigham And Women's Hospital, Inc. Methods of detecting cancer based on prostasin
CA2429633A1 (en) * 2000-11-16 2002-05-30 Ciphergen Biosystems, Inc. Method for analyzing mass spectra
US20020115056A1 (en) * 2000-12-26 2002-08-22 Goodlett David R. Rapid and quantitative proteome analysis and related methods
US20030009293A1 (en) * 2001-01-09 2003-01-09 Anderson Norman G. Reference database
US20020155587A1 (en) * 2001-04-20 2002-10-24 Sequenom, Inc. System and method for testing a biological sample
US20020184569A1 (en) * 2001-04-25 2002-12-05 O'neill Michael System and method for using neural nets for analyzing micro-arrays
US20040198950A1 (en) * 2001-04-30 2004-10-07 George Jackowski Biopolymer marker indicative of disease state having a molecular weight of 1518 daltons
US20050170372A1 (en) * 2001-08-13 2005-08-04 Afeyan Noubar B. Methods and systems for profiling biological systems
IL160324A0 (en) * 2001-08-13 2004-07-25 Beyond Genomics Inc Method and system for profiling biological systems
US20050106624A1 (en) * 2001-09-25 2005-05-19 Kazuki Sasaki Search for cancer markers by a novel screening method
US20020193950A1 (en) * 2002-02-25 2002-12-19 Gavin Edward J. Method for analyzing mass spectra
US20050164197A1 (en) * 2002-04-19 2005-07-28 In-San Kim Method for measuring the amount of betaig-h3 protein and diagnostic kit using the same
US20030204507A1 (en) * 2002-04-25 2003-10-30 Li Jonathan Qiang Classification of rare events with high reliability
JP2005526972A (ja) * 2002-05-02 2005-09-08 シファーゲン バイオシステムズ, インコーポレイテッド 多糖系ヒドロゲルをコーティングした表面を有するバイオチップ
US20040052412A1 (en) * 2002-05-10 2004-03-18 Large Scale Biology Corporation Satellite image enhancement and feature identification using information theory radial-basis bio-marker filter
GB0305796D0 (en) * 2002-07-24 2003-04-16 Micromass Ltd Method of mass spectrometry and a mass spectrometer
AU2003268031A1 (en) * 2002-07-29 2004-02-16 Correlogic Systems, Inc. Quality assurance/quality control for electrospray ionization processes
DK1540010T3 (da) 2002-08-06 2010-07-26 Univ Johns Hopkins Anvendelse af biomarkører til påvisning af ovariecancer
MXPA05005031A (es) 2002-11-12 2005-11-17 Becton Dickinson Co Diagnostico de la sepsis o sirs usando perfiles de biomarcadores.
MXPA05005073A (es) * 2002-11-12 2005-11-17 Becton Dickinson Co Diagnostico de la sepsis o sirs usando perfiles de biomarcadores.
CA2505843A1 (en) * 2002-11-12 2004-05-27 Becton, Dickinson And Company Diagnosis of sepsis or sirs using biomarker profiles
EP1573044A4 (en) 2002-12-18 2006-07-05 Ciphergen Biosystems Inc SERUM BIOMARKERS OF LUNG CANCER
US8010296B2 (en) * 2002-12-19 2011-08-30 Drexel University Apparatus and method for removing non-discriminatory indices of an indexed dataset
US7288383B2 (en) * 2003-01-15 2007-10-30 The Brigham And Women's Hospital, Inc. Eosinophil-derived neurotoxin as a marker for ovarian cancer
US20040162712A1 (en) * 2003-01-24 2004-08-19 Icagen, Inc. Method for screening compounds using consensus selection
US6909981B2 (en) * 2003-01-27 2005-06-21 Ciphergen Biosystems, Inc. Data management system and method for processing signals from sample spots
DE10304106A1 (de) * 2003-01-31 2004-08-26 Mosaiques Diagnostics And Therapeutics Ag Verfahren und Vorrichtung zur qualitativen und/oder quantitativen Bestimmung eines Protein- und/oder Peptidmusters einer Flüssigkeitsprobe, die dem menschlichen oder tierischen Körper entnommen wird
US20050085740A1 (en) * 2003-04-01 2005-04-21 Davis Cristina E. Non-invasive breath analysis using field asymmetric ion mobility spectrometry
US7470898B2 (en) * 2003-04-01 2008-12-30 The Charles Stark Draper Laboratory, Inc. Monitoring drinking water quality using differential mobility spectrometry
US6906320B2 (en) * 2003-04-02 2005-06-14 Merck & Co., Inc. Mass spectrometry data analysis techniques
US6977370B1 (en) 2003-04-07 2005-12-20 Ciphergen Biosystems, Inc. Off-resonance mid-IR laser desorption ionization
US20040236603A1 (en) * 2003-05-22 2004-11-25 Biospect, Inc. System of analyzing complex mixtures of biological and other fluids to identify biological state information
US7425700B2 (en) 2003-05-22 2008-09-16 Stults John T Systems and methods for discovery and analysis of markers
US20050255606A1 (en) * 2004-05-13 2005-11-17 Biospect, Inc., A California Corporation Methods for accurate component intensity extraction from separations-mass spectrometry data
WO2004111609A2 (en) * 2003-06-12 2004-12-23 Predicant Biosciences, Inc. Methods for accurate component intensity extraction from separations-mass spectrometry data
US7072772B2 (en) * 2003-06-12 2006-07-04 Predicant Bioscience, Inc. Method and apparatus for modeling mass spectrometer lineshapes
CN1304843C (zh) * 2003-07-02 2007-03-14 许洋 用于生物样品分析的蛋白指纹法
WO2005008247A2 (en) * 2003-07-11 2005-01-27 Science & Technology Corporation @ Unm. Detection of endometrial pathology
US20050048547A1 (en) * 2003-07-17 2005-03-03 Hongyu Zhao Classification of disease states using mass spectrometry data
AU2004261222A1 (en) * 2003-08-01 2005-02-10 Correlogic Systems, Inc. Multiple high-resolution serum proteomic features for ovarian cancer detection
US7858071B2 (en) * 2003-10-23 2010-12-28 University of Pittsburgh—of the Commonwealth System of Higher Education Biomarkers for amyotrophic lateral sclerosis
EP2369348A1 (en) 2003-11-07 2011-09-28 Ciphergen Biosystems, Inc. Biomarkers for Alzheimer's disease
KR20070012320A (ko) * 2003-11-12 2007-01-25 리 마오 상부 호흡소화관암 예측법
ATE525478T1 (de) 2003-12-05 2011-10-15 Univ Mcgill Serumbiomarker für morbus chagas
US7761239B2 (en) * 2003-12-11 2010-07-20 Correlogic Systems, Inc. Method of diagnosing biological states through the use of a centralized, adaptive model, and remote sample processing
US8012693B2 (en) 2003-12-16 2011-09-06 3M Innovative Properties Company Analysis of chemically crosslinked cellular samples
JP4069867B2 (ja) * 2004-01-05 2008-04-02 セイコーエプソン株式会社 部材の接合方法
JP2007523323A (ja) 2004-01-30 2007-08-16 サイファージェン バイオシステムズ インコーポレイテッド スペクトルにおけるシグナルをクラスタにする方法
US20070087448A1 (en) * 2004-02-16 2007-04-19 Nelsestuen Gary L Biological profiles and methods of use
US9492245B2 (en) 2004-02-27 2016-11-15 Align Technology, Inc. Method and system for providing dynamic orthodontic assessment and treatment profiles
US7987099B2 (en) * 2004-02-27 2011-07-26 Align Technology, Inc. Dental data mining
US8874452B2 (en) 2004-02-27 2014-10-28 Align Technology, Inc. Method and system for providing dynamic orthodontic assessment and treatment profiles
US7904308B2 (en) 2006-04-18 2011-03-08 Align Technology, Inc. Method and system for providing indexing and cataloguing of orthodontic related treatment profiles and options
US11298209B2 (en) 2004-02-27 2022-04-12 Align Technology, Inc. Method and system for providing dynamic orthodontic assessment and treatment profiles
WO2005098446A2 (en) 2004-03-31 2005-10-20 The Johns Hopkins University Biomarkers for ovarian cancer
EP2189802B1 (en) 2004-04-01 2014-05-14 Liposcience, Inc. NMR clinical analyzers and related methods, systems, modules and computer program products for clinical evaluation biosamples
AU2005236075A1 (en) 2004-04-26 2005-11-03 Children's Medical Center Corporation Platelet biomarkers for the detection of disease
US20050244973A1 (en) * 2004-04-29 2005-11-03 Predicant Biosciences, Inc. Biological patterns for diagnosis and treatment of cancer
US20050269508A1 (en) * 2004-06-03 2005-12-08 Lippa Timothy P Apparatus and methods for detecting compounds using mass spectra
US20060003204A1 (en) * 2004-07-01 2006-01-05 Callahan Christopher W Controlling fuel cell fuel purge in response to recycle fuel blower operating conditions
US7430479B1 (en) * 2004-08-17 2008-09-30 Science Applications International Corporation System and method for analyzing content data
WO2006027321A1 (en) * 2004-09-09 2006-03-16 Universite De Liege Identification and use of biomarkers for the diagnosis and the prognosis of inflammatory diseases.
US7197402B2 (en) * 2004-10-14 2007-03-27 Highchem, Ltd. Determination of molecular structures using tandem mass spectrometry
WO2006071469A2 (en) * 2004-12-02 2006-07-06 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Modulation of the neuroendocrine system as a therapy for amyotrophic lateral sclerosis
US20060121619A1 (en) * 2004-12-02 2006-06-08 University Of Pittsburgh Of The Commonwealth System Of Higher Education Protein biomarkers and therapeutic targets in an animal model for amyotrophic lateral sclerosis
EP1838867B1 (en) * 2005-01-06 2011-03-09 Eastern Virginia Medical School Apolipoprotein a-ii isoform as a biomarker for prostate cancer
US7356521B2 (en) * 2005-01-14 2008-04-08 Siemens Medical Solutions Usa, Inc. System and method for automatic molecular diagnosis of ALS based on boosting classification
US20060157647A1 (en) * 2005-01-18 2006-07-20 Becton, Dickinson And Company Multidimensional liquid chromatography/spectrometry
WO2006083853A2 (en) * 2005-01-31 2006-08-10 Insilicos, Llc Methods of identification of biomarkers with mass spectrometry techniques
WO2007053170A2 (en) * 2005-02-09 2007-05-10 Correlogic Systems, Inc. Identification of bacteria and spores
CA2605143A1 (en) 2005-04-15 2006-10-26 Becton, Dickinson And Company Diagnosis of sepsis
US20080312514A1 (en) * 2005-05-12 2008-12-18 Mansfield Brian C Serum Patterns Predictive of Breast Cancer
US7161147B1 (en) * 2005-05-20 2007-01-09 Academia Sinica Biological whole cell mass spectrometer
WO2006130983A1 (en) * 2005-06-08 2006-12-14 Mds Inc. Doing Business Through Its Mds Sciex Division Dynamic background signal exclusion in chromatography/mass spectrometry data-dependent data acquisition
US20110177492A1 (en) * 2005-06-16 2011-07-21 3M Innovative Properties Company Method of classifying chemically crosslinked cellular samples using mass spectra
EP1896493A1 (en) 2005-06-17 2008-03-12 North Carolina A & T State University A device including a proteinaceous factor, a recombinant proteinaceous factor, and a nucleotide sequence encoding the proteinaceous factor
EP1904852A2 (en) 2005-06-24 2008-04-02 Ciphergen Biosystems, Inc. Biomarkers for ovarian cancer: beta-2 microglobulin
GB0514553D0 (en) * 2005-07-15 2005-08-24 Nonlinear Dynamics Ltd A method of analysing a representation of a separation pattern
GB0514555D0 (en) 2005-07-15 2005-08-24 Nonlinear Dynamics Ltd A method of analysing separation patterns
US20090215086A1 (en) * 2005-12-12 2009-08-27 Momar Ndao Biomarkers for Babesia
US7867719B2 (en) 2006-03-11 2011-01-11 Vermillion, Inc. Beta-2 microglobulin as a biomarker for peripheral artery disease
US7756646B2 (en) * 2006-03-31 2010-07-13 Battelle Memorial Institute Method for predicting peptide detection in mass spectrometry
US7736905B2 (en) * 2006-03-31 2010-06-15 Biodesix, Inc. Method and system for determining whether a drug will be effective on a patient with a disease
US8518926B2 (en) * 2006-04-10 2013-08-27 Knopp Neurosciences, Inc. Compositions and methods of using (R)-pramipexole
ATE537826T1 (de) 2006-05-16 2012-01-15 Knopp Neurosciences Inc Zusammensetzungen aus r(+)- und s(-)-pramipexol sowie verfahren zu ihrer anwendung
WO2007140327A2 (en) * 2006-05-26 2007-12-06 Waters Investments Limited Ion detection and parameter estimation for n-dimensional data
US7702689B2 (en) * 2006-07-13 2010-04-20 Sap Ag Systems and methods for querying metamodel data
US8524695B2 (en) * 2006-12-14 2013-09-03 Knopp Neurosciences, Inc. Modified release formulations of (6R)-4,5,6,7-tetrahydro-N6-propyl-2,6-benzothiazole-diamine and methods of using the same
WO2008100941A2 (en) * 2007-02-12 2008-08-21 Correlogic Systems Inc. A method for calibrating an analytical instrument
US8519148B2 (en) 2007-03-14 2013-08-27 Knopp Neurosciences, Inc. Synthesis of chirally purified substituted benzothiazole diamines
JP2010522882A (ja) 2007-03-27 2010-07-08 ヴァーミリオン インコーポレイテッド 卵巣癌のバイオマーカー
WO2008141275A1 (en) 2007-05-11 2008-11-20 The Johns Hopkins University Biomarkers for melanoma
US7878805B2 (en) 2007-05-25 2011-02-01 Align Technology, Inc. Tabbed dental appliance
MY150234A (en) 2007-06-29 2013-12-31 Ahn Gook Pharmaceutical Company Ltd Predictive markers for ovarian cancer
WO2009058331A2 (en) 2007-10-29 2009-05-07 Vermilllion, Inc. Biomarkers for the detection of early stage ovarian cancer
US8738394B2 (en) 2007-11-08 2014-05-27 Eric E. Kuo Clinical data file
US8108189B2 (en) 2008-03-25 2012-01-31 Align Technologies, Inc. Reconstruction of non-visible part of tooth
JP5072682B2 (ja) * 2008-03-28 2012-11-14 富士フイルム株式会社 質量分析用デバイス、これを用いる質量分析装置および質量分析方法
WO2009123737A2 (en) 2008-04-03 2009-10-08 Becton, Dickinson And Company Advanced detection of sepsis
US7776522B2 (en) 2008-04-24 2010-08-17 Becton, Dickinson And Company Methods for diagnosing oncogenic human papillomavirus (HPV)
US8092215B2 (en) 2008-05-23 2012-01-10 Align Technology, Inc. Smile designer
US9492243B2 (en) 2008-05-23 2016-11-15 Align Technology, Inc. Dental implant positioning
US8172569B2 (en) 2008-06-12 2012-05-08 Align Technology, Inc. Dental appliance
US20110190356A1 (en) * 2008-08-19 2011-08-04 Knopp Neurosciences Inc. Compositions and Methods of Using (R)- Pramipexole
US8152518B2 (en) 2008-10-08 2012-04-10 Align Technology, Inc. Dental positioning appliance having metallic portion
US20110251099A1 (en) 2008-12-30 2011-10-13 Sudha Visvanathan SERUM MARKERS PREDICTING CLINICAL RESPONSE TO ANTI-TNFa ANTIBODIES IN PATIENTS WITH ANKYLOSING SPONDYLITIS
US8292617B2 (en) 2009-03-19 2012-10-23 Align Technology, Inc. Dental wire attachment
US8765031B2 (en) 2009-08-13 2014-07-01 Align Technology, Inc. Method of forming a dental appliance
KR101556726B1 (ko) * 2010-02-24 2015-10-02 바이오디식스, 인크. 질량스펙트럼 분석을 이용한 치료제 투여를 위한 암 환자 선별
US9211166B2 (en) 2010-04-30 2015-12-15 Align Technology, Inc. Individualized orthodontic treatment index
US9241774B2 (en) 2010-04-30 2016-01-26 Align Technology, Inc. Patterned dental positioning appliance
EP2628013B1 (en) 2010-10-14 2019-06-12 The Johns Hopkins University Biomarkers of brain injury
CN102103079B (zh) * 2010-12-31 2013-12-11 聚光科技(杭州)股份有限公司 一种光谱分析方法
JP5673348B2 (ja) * 2011-05-25 2015-02-18 株式会社島津製作所 質量分析データ解析方法及び解析装置
US9403238B2 (en) 2011-09-21 2016-08-02 Align Technology, Inc. Laser cutting
RU2475766C1 (ru) * 2011-11-07 2013-02-20 Марина Витальевна Самойленко Способ определения передаточной функции линейной радиоэлектронной системы
WO2013096816A1 (en) 2011-12-22 2013-06-27 Biogen Idec Ma Inc. Improved synthesis of amine substituted 4,5,6,7-tetrahydrobenzothiazole compounds
US9375300B2 (en) 2012-02-02 2016-06-28 Align Technology, Inc. Identifying forces on a tooth
US9220580B2 (en) 2012-03-01 2015-12-29 Align Technology, Inc. Determining a dental treatment difficulty
WO2013134771A1 (en) * 2012-03-09 2013-09-12 Torion Technologies, Inc. Deconvolution and identification algorithms for use on spectroscopic data
NL2009015C2 (en) * 2012-04-10 2013-10-15 Biosparq B V Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system.
JP6377054B2 (ja) 2012-05-11 2018-08-22 リセット セラピューティークス, インコーポレイテッド クリプトクロム調節薬としてのカルバゾール含有スルホンアミド
US9414897B2 (en) 2012-05-22 2016-08-16 Align Technology, Inc. Adjustment of tooth position in a virtual dental model
US10288626B2 (en) 2012-09-14 2019-05-14 University Of Kentucky Research Foundation Secreted tumor-associated cytochrome as a blood-based biomarker for cancer
EP2914752B1 (en) 2012-11-02 2022-03-09 The Johns Hopkins University Dna methylation biomarkers of post-partum depression risk
US9662313B2 (en) 2013-02-28 2017-05-30 Knopp Biosciences Llc Compositions and methods for treating amyotrophic lateral sclerosis in responders
CN105051526B (zh) * 2013-03-26 2018-04-06 株式会社岛津制作所 质量分析装置
CA2914918C (en) 2013-05-10 2023-10-10 Johns Hopkins University Compositions and methods for ovarian cancer assessment having improved specificity
CA2918054C (en) 2013-07-11 2022-12-13 The Johns Hopkins University A dna methylation and genotype specific biomarker of suicide attempt and/or suicide ideation
PT3019167T (pt) 2013-07-12 2021-03-04 Knopp Biosciences Llc Tratamento de níveis elevados de eosinófilos e/ou basófilos
US9468630B2 (en) 2013-07-12 2016-10-18 Knopp Biosciences Llc Compositions and methods for treating conditions related to increased eosinophils
EP3022322A4 (en) 2013-07-17 2017-05-17 The Johns Hopkins University A multi-protein biomarker assay for brain injury detection and outcome
AU2014306597B2 (en) 2013-08-13 2018-05-17 Knopp Biosciences Llc Compositions and methods for treating chronic urticaria
US9642840B2 (en) 2013-08-13 2017-05-09 Knopp Biosciences, Llc Compositions and methods for treating plasma cell disorders and B-cell prolymphocytic disorders
WO2015120382A1 (en) 2014-02-07 2015-08-13 The Johns Hopkins University Predicting response to epigenetic drug therapy
CN103995042B (zh) * 2014-03-28 2016-09-28 深圳华大基因研究院 一种建立蛋白样品swath离子库的方法
TWI690521B (zh) 2014-04-07 2020-04-11 美商同步製藥公司 作為隱花色素調節劑之含有咔唑之醯胺類、胺基甲酸酯類及脲類
WO2015175685A1 (en) * 2014-05-13 2015-11-19 University Of Houston System System and method for maldi-tof mass spectrometry
WO2016044697A1 (en) 2014-09-19 2016-03-24 The Johns Hopkins University Biomarkers of cognitive dysfunction
US9610141B2 (en) 2014-09-19 2017-04-04 Align Technology, Inc. Arch expanding appliance
US10449016B2 (en) 2014-09-19 2019-10-22 Align Technology, Inc. Arch adjustment appliance
WO2016057485A1 (en) 2014-10-06 2016-04-14 The Johns Hopkins University A dna methylation and genotype specific biomarker for predicting post-traumatic stress disorder
US10016159B2 (en) 2014-10-24 2018-07-10 Koninklijke Philips N.V. Determination of TGF-β pathway activity using unique combination of target genes
AU2015334841B2 (en) 2014-10-24 2022-02-03 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
CA2965408C (en) 2014-10-24 2023-10-24 Koninklijke Philips N.V. Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities
US9744001B2 (en) 2014-11-13 2017-08-29 Align Technology, Inc. Dental appliance with cavity for an unerupted or erupting tooth
US10504386B2 (en) 2015-01-27 2019-12-10 Align Technology, Inc. Training method and system for oral-cavity-imaging-and-modeling equipment
WO2016134365A1 (en) 2015-02-20 2016-08-25 The Johns Hopkins University Biomarkers of myocardial injury
BR112018002848A2 (pt) 2015-08-14 2018-11-06 Koninklijke Philips Nv método, aparelho, mídia de armazenamento não transitório, programa de computador, kit para medir níveis de expressão de seis ou mais genes-alvo da via de sinalização celular
US11931222B2 (en) 2015-11-12 2024-03-19 Align Technology, Inc. Dental attachment formation structures
US11554000B2 (en) 2015-11-12 2023-01-17 Align Technology, Inc. Dental attachment formation structure
US11103330B2 (en) 2015-12-09 2021-08-31 Align Technology, Inc. Dental attachment placement structure
US11596502B2 (en) 2015-12-09 2023-03-07 Align Technology, Inc. Dental attachment placement structure
EP3471599A4 (en) 2016-06-17 2020-01-08 Align Technology, Inc. INTRAORAL DEVICES WITH SENSOR
EP3988048B1 (en) 2016-06-17 2024-01-17 Align Technology, Inc. Orthodontic appliance performance monitor
KR102595753B1 (ko) 2016-07-27 2023-10-30 얼라인 테크널러지, 인크. 치아 진단 기능이 있는 구강 내 스캐너
US10390913B2 (en) 2018-01-26 2019-08-27 Align Technology, Inc. Diagnostic intraoral scanning
CA3035743A1 (en) 2016-09-02 2018-03-08 Board Of Regents, The University Of Texas System Collection probe and methods for the use thereof
WO2018045208A1 (en) * 2016-09-02 2018-03-08 Board Of Regents, The University Of Texas System Collection probe and methods for the use thereof
CN113648088B (zh) 2016-11-04 2023-08-22 阿莱恩技术有限公司 用于牙齿图像的方法和装置
US11376101B2 (en) 2016-12-02 2022-07-05 Align Technology, Inc. Force control, stop mechanism, regulating structure of removable arch adjustment appliance
ES2845198T3 (es) 2016-12-02 2021-07-26 Align Technology Inc Expansor palatino
CN113440273A (zh) 2016-12-02 2021-09-28 阿莱恩技术有限公司 一系列腭扩张器及其形成方法和形成设备
WO2018102702A1 (en) 2016-12-02 2018-06-07 Align Technology, Inc. Dental appliance features for speech enhancement
US10548700B2 (en) 2016-12-16 2020-02-04 Align Technology, Inc. Dental appliance etch template
US10779718B2 (en) 2017-02-13 2020-09-22 Align Technology, Inc. Cheek retractor and mobile device holder
US10613515B2 (en) 2017-03-31 2020-04-07 Align Technology, Inc. Orthodontic appliances including at least partially un-erupted teeth and method of forming them
US11045283B2 (en) 2017-06-09 2021-06-29 Align Technology, Inc. Palatal expander with skeletal anchorage devices
CN110769777B (zh) 2017-06-16 2023-08-11 阿莱恩技术有限公司 牙齿类型和萌出状态的自动检测
WO2018236120A1 (ko) * 2017-06-23 2018-12-27 주식회사 에이엠아이티 네거티브 마커를 이용한 유사 종 식별 방법 및 장치
WO2019005808A1 (en) 2017-06-26 2019-01-03 Align Technology, Inc. BIOCAPTOR PERFORMANCE INDICATOR FOR INTRABUCCAL DEVICES
US10885521B2 (en) 2017-07-17 2021-01-05 Align Technology, Inc. Method and apparatuses for interactive ordering of dental aligners
WO2019018784A1 (en) 2017-07-21 2019-01-24 Align Technology, Inc. ANCHOR OF CONTOUR PALATIN
EP3658067B1 (en) 2017-07-27 2023-10-25 Align Technology, Inc. System and methods for processing an orthodontic aligner by means of an optical coherence tomography
EP3658070A1 (en) 2017-07-27 2020-06-03 Align Technology, Inc. Tooth shading, transparency and glazing
US11116605B2 (en) 2017-08-15 2021-09-14 Align Technology, Inc. Buccal corridor assessment and computation
US11123156B2 (en) 2017-08-17 2021-09-21 Align Technology, Inc. Dental appliance compliance monitoring
EP3461915A1 (en) 2017-10-02 2019-04-03 Koninklijke Philips N.V. Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression
US10813720B2 (en) 2017-10-05 2020-10-27 Align Technology, Inc. Interproximal reduction templates
CN114939001A (zh) 2017-10-27 2022-08-26 阿莱恩技术有限公司 替代咬合调整结构
CN116602778A (zh) 2017-10-31 2023-08-18 阿莱恩技术有限公司 具有选择性牙合负荷和受控牙尖交错的牙科器具
WO2019089989A2 (en) 2017-11-01 2019-05-09 Align Technology, Inc. Automatic treatment planning
WO2019094507A1 (en) * 2017-11-10 2019-05-16 Pataigin, Llc Method for data analysis
US11534974B2 (en) 2017-11-17 2022-12-27 Align Technology, Inc. Customized fabrication of orthodontic retainers based on patient anatomy
SG11202004568UA (en) 2017-11-27 2020-06-29 Univ Texas Minimally invasive collection probe and methods for the use thereof
EP3716885B1 (en) 2017-11-30 2023-08-30 Align Technology, Inc. Orthodontic intraoral appliances comprising sensors
WO2019118876A1 (en) 2017-12-15 2019-06-20 Align Technology, Inc. Closed loop adaptive orthodontic treatment methods and apparatuses
EP3502279A1 (en) 2017-12-20 2019-06-26 Koninklijke Philips N.V. Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression
US10980613B2 (en) 2017-12-29 2021-04-20 Align Technology, Inc. Augmented reality enhancements for dental practitioners
US20190383832A1 (en) 2017-12-29 2019-12-19 Abbott Laboratories Novel biomarkers and methods for diagnosing and evaluating traumatic brain injury
US11937991B2 (en) 2018-03-27 2024-03-26 Align Technology, Inc. Dental attachment placement structure
EP3773320B1 (en) 2018-04-11 2024-05-15 Align Technology, Inc. Releasable palatal expanders
EP3788377A1 (en) 2018-05-04 2021-03-10 Abbott Laboratories Hbv diagnostic, prognostic, and therapeutic methods and products
US10957523B2 (en) 2018-06-08 2021-03-23 Thermo Finnigan Llc 3D mass spectrometry predictive classification
CN110895799B (zh) * 2018-09-13 2023-05-09 岛津分析技术研发(上海)有限公司 提高质谱谱图质量的方法、计算机存储介质、以及电子终端
EP3931565A4 (en) 2019-02-27 2023-04-12 Epiaxis Therapeutics Pty Ltd METHODS AND AGENTS FOR ASSESSING T LYMPHOCYTE FUNCTION AND PREDICTING RESPONSE TO THERAPY
WO2021026172A1 (en) 2019-08-05 2021-02-11 Seer, Inc. Systems and methods for sample preparation, data generation, and protein corona analysis
CN111292291B (zh) * 2020-01-15 2024-02-02 李东航 一种基于pca或m波段小波域的癌症ct图像判断装置
CN113484400B (zh) * 2021-07-01 2022-11-22 上海交通大学 基于机器学习的质谱图分子式计算方法
CN113567605A (zh) * 2021-08-16 2021-10-29 苏恺明 质量色谱图的自动化解释模型构建方法、装置和电子设备
WO2023122723A1 (en) 2021-12-23 2023-06-29 The Broad Institute, Inc. Panels and methods for diagnosing and treating lung cancer
WO2024044578A1 (en) 2022-08-22 2024-02-29 University Of Virginia Dna methylation biomarkers of premenstrual dysphoric disorder and perimenopausal depression

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4075475A (en) * 1976-05-03 1978-02-21 Chemetron Corporation Programmed thermal degradation-mass spectrometry analysis method facilitating identification of a biological specimen
US5697369A (en) 1988-12-22 1997-12-16 Biofield Corp. Method and apparatus for disease, injury and bodily condition screening or sensing
AU7563191A (en) 1990-03-28 1991-10-21 John R. Koza Non-linear genetic algorithms for solving problems by finding a fit composition of functions
US5790761A (en) 1992-12-11 1998-08-04 Heseltine; Gary L. Method and apparatus for the diagnosis of colorectal cancer
US6025128A (en) 1994-09-29 2000-02-15 The University Of Tulsa Prediction of prostate cancer progression by analysis of selected predictive parameters
WO1996037777A1 (en) * 1995-05-23 1996-11-28 Nelson Randall W Mass spectrometric immunoassay
GB2301897B (en) 1995-06-08 1999-05-26 Univ Wales Aberystwyth The Composition analysis
US5716825A (en) * 1995-11-01 1998-02-10 Hewlett Packard Company Integrated nucleic acid analysis system for MALDI-TOF MS
US5687716A (en) 1995-11-15 1997-11-18 Kaufmann; Peter Selective differentiating diagnostic process based on broad data bases
US5839438A (en) 1996-09-10 1998-11-24 Neuralmed, Inc. Computer-based neural network system and method for medical diagnosis and interpretation
US6157921A (en) 1998-05-01 2000-12-05 Barnhill Technologies, Llc Enhancing knowledge discovery using support vector machines in a distributed network environment
AU7137798A (en) 1997-04-17 1998-11-11 Glaxo Group Limited Statistical deconvoluting of mixtures
US6674070B2 (en) * 1997-05-23 2004-01-06 Northeastern University On-line and off-line deposition of liquid samples for matrix assisted laser desorption ionization-time of flight (MALDI-TOF) mass spectroscopy
JP2002502543A (ja) * 1997-05-23 2002-01-22 ノースイースタン ユニバーシティ マトリクス支援レーザ離脱イオン化−飛翔時間(maldi−tof)質量分光用のオンライン液体試料析出インターフェース
US6825463B2 (en) * 1997-05-23 2004-11-30 Northeastern University On-line and off-line deposition of liquid samples for matrix assisted laser desorption ionization-time of flight (MALDI-TOF) mass spectroscopy
US5905258A (en) * 1997-06-02 1999-05-18 Advanced Research & Techology Institute Hybrid ion mobility and mass spectrometer
US6723564B2 (en) * 1998-05-07 2004-04-20 Sequenom, Inc. IR MALDI mass spectrometry of nucleic acids using liquid matrices
US6289287B1 (en) * 1999-01-29 2001-09-11 Agilent Technologies, Inc. Identification of sample component using a mass sensor system
US20020009394A1 (en) 1999-04-02 2002-01-24 Hubert Koster Automated process line
US6647343B1 (en) * 1999-04-29 2003-11-11 Agilent Technologies, Inc. Temporal profile analysis of mass data in a mass sensor system
US6391649B1 (en) * 1999-05-04 2002-05-21 The Rockefeller University Method for the comparative quantitative analysis of proteins and other biological material by isotopic labeling and mass spectroscopy
US6329652B1 (en) * 1999-07-28 2001-12-11 Eastman Kodak Company Method for comparison of similar samples in liquid chromatography/mass spectrometry
WO2001020043A1 (en) 1999-09-17 2001-03-22 Affymetrix, Inc. Method of cluster analysis of gene expression profiles
EP1236173A2 (en) 1999-10-27 2002-09-04 Biowulf Technologies, LLC Methods and devices for identifying patterns in biological systems
WO2001031579A2 (en) 1999-10-27 2001-05-03 Barnhill Technologies, Llc Methods and devices for identifying patterns in biological patterns
DE10021737C2 (de) * 2000-05-04 2002-10-17 Hermann Haller Verfahren und Vorrichtung zur qualitativen und/oder quantitativen Bestimmung eines Protein- und/oder Peptidmusters einer Flüssigkeitsprobe, die dem menschlichen oder tierischen Körper entnommen wird
US7158862B2 (en) * 2000-06-12 2007-01-02 The Arizona Board Of Regents On Behalf Of The University Of Arizona Method and system for mining mass spectral data
WO2001099043A1 (en) 2000-06-19 2001-12-27 Correlogic Systems, Inc. Heuristic method of classification
KR101054732B1 (ko) 2000-07-18 2011-08-05 더 유나이티드 스테이츠 오브 아메리카 애즈 리프리젠티드 바이 더 세크레터리 오브 더 디파트먼트 오브 헬쓰 앤드 휴먼 써비시즈 생물학적 데이터의 숨겨진 패턴에 근거한 생물학적 상태의 식별 방법
CA2429633A1 (en) * 2000-11-16 2002-05-30 Ciphergen Biosystems, Inc. Method for analyzing mass spectra
ATE496343T1 (de) 2001-01-24 2011-02-15 Health Discovery Corp Verfahren zum identifizieren von mustern in biologischen systemen und deren anwendungen
US20020160420A1 (en) 2001-04-30 2002-10-31 George Jackowski Process for diagnosis of physiological conditions by characterization of proteomic materials
US20020193950A1 (en) 2002-02-25 2002-12-19 Gavin Edward J. Method for analyzing mass spectra

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7316931B2 (en) 2000-10-19 2008-01-08 Target Discovery, Inc. Mass defect labeling for the determination of oligomer sequences
US8352193B2 (en) 2000-10-19 2013-01-08 Target Discovery, Inc. Methods for deriving a cumulative ranking
JP2016224031A (ja) * 2015-04-22 2016-12-28 ザ・ボーイング・カンパニーThe Boeing Company フォービエイテッド圧縮投影を用いたハイパースペクトルデミキシング
JP2017224283A (ja) * 2016-06-09 2017-12-21 株式会社島津製作所 ビッグデータ解析方法及び該解析方法を利用した質量分析システム
JP7057913B2 (ja) 2016-06-09 2022-04-21 株式会社島津製作所 ビッグデータ解析方法及び該解析方法を利用した質量分析システム
US11315774B2 (en) 2016-06-09 2022-04-26 Shimadzu Corporation Big-data analyzing Method and mass spectrometric system using the same method

Also Published As

Publication number Publication date
US7027933B2 (en) 2006-04-11
US20040059530A1 (en) 2004-03-25
JP2004536276A (ja) 2004-12-02
ATE540421T1 (de) 2012-01-15
EP1337845A4 (en) 2007-04-11
WO2003031031A1 (en) 2003-04-17
AU2002245043B2 (en) 2006-10-26
AU2002241535C1 (en) 2002-06-03
US20020138208A1 (en) 2002-09-26
US6675104B2 (en) 2004-01-06
CA2429633A1 (en) 2002-05-30
AU4153502A (en) 2002-06-03
WO2002042733A2 (en) 2002-05-30
WO2002042733A3 (en) 2003-02-27
CN1262337C (zh) 2006-07-05
CN1623091A (zh) 2005-06-01
AU2002241535B2 (en) 2006-05-18
CA2429327A1 (en) 2003-04-17
EP1355727A1 (en) 2003-10-29
CN1500000A (zh) 2004-05-26
WO2002042733A9 (en) 2003-04-24
AU2002245043A1 (en) 2003-04-22
EP1337845A2 (en) 2003-08-27
EP1337845B1 (en) 2012-01-04
EP1355727A4 (en) 2007-04-11

Similar Documents

Publication Publication Date Title
JP2004522980A (ja) 質量スペクトルを分析する方法
US20020193950A1 (en) Method for analyzing mass spectra
AU2002241535A1 (en) Method for analyzing mass spectra
US11315774B2 (en) Big-data analyzing Method and mass spectrometric system using the same method
US8478534B2 (en) Method for detecting discriminatory data patterns in multiple sets of data and diagnosing disease
KR101054732B1 (ko) 생물학적 데이터의 숨겨진 패턴에 근거한 생물학적 상태의 식별 방법
US20060064253A1 (en) Multiple high-resolution serum proteomic features for ovarian cancer detection
CN110139702A (zh) 利用基质辅助激光解吸/离子化飞行时间质谱仪进行分类数据操控
Sun et al. Recent advances in computational analysis of mass spectrometry for proteomic profiling
JP2007523323A (ja) スペクトルにおけるシグナルをクラスタにする方法
JP7207171B2 (ja) マーカ物質の探索支援方法、探索支援プログラムおよび探索支援装置
CN115831369A (zh) 早筛数据处理、构建早筛模型的方法、装置、设备及介质
CN101354734A (zh) 质谱分析方法
CN116364294A (zh) 一种数据库系统的建立及其应用
CN116106398A (zh) 用于诊断ckd的标志物
Wang Pattern detection and discrimination in proteomic mass spectrometry analysis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060921

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20061219

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061219

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20061220

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20061222

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070320

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071211

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080213

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080314

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090507

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090512