JP2004522980A - 質量スペクトルを分析する方法 - Google Patents
質量スペクトルを分析する方法 Download PDFInfo
- Publication number
- JP2004522980A JP2004522980A JP2003534055A JP2003534055A JP2004522980A JP 2004522980 A JP2004522980 A JP 2004522980A JP 2003534055 A JP2003534055 A JP 2003534055A JP 2003534055 A JP2003534055 A JP 2003534055A JP 2004522980 A JP2004522980 A JP 2004522980A
- Authority
- JP
- Japan
- Prior art keywords
- mass
- class
- data
- sample
- mass spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Bioethics (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Signal Processing (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
【選択図】図7
Description
(関連出願)
本出願は、米国特許仮出願第60/249,835号(2000年11月16日出願)および第60/254,746号(2000年12月11日出願)の利益を主張する。これらの米国特許仮出願は、参考のため、その全体を本明細書中ですべての目的のために援用する。
【0002】
(発明の分野)
本発明の実施形態は、質量スペクトルを分析する方法に関する。
【0003】
(本発明の背景)
ゲノムの研究における最近の進歩は、種々の疾患と関連する多数の遺伝子を識別することにつながっている。しかしながら、ゲノムの研究が遺伝的に疾患にかかり易い素因と関連する遺伝子を識別し得る一方で、依然としてタンパク質等のマーカを特徴付けおよび識別する必要がある。「マーカ」は、通常、ポリペプチド、またはある生物学的状態と別の生物学的状態とを区別する特定の他の分子に関する。タンパク質および他のマーカは、疾患状態における重要なファクタである。例えば、タンパク質は、疾患等の生物学的状態の変化と関連して変化し得る。タンパク質は、さらに、疾患、毒性または他の刺激に対して細胞反応を発し得る。疾患に冒されると、いくつかのタンパク質は不活性状態になる一方で、他のタンパク質は活性になる。前立腺特異抗原(PSA)は、例えば、循環血清タンパク質であり、これは高まると前立腺癌と関係する。タンパク質レベルの変化が迅速に検出され得る場合、内科医は疾患を早期に診断し、かつ治療を向上し得る。
【0004】
新しいマーカを識別することは、診断および薬物発見プロセスにおける最も早期かつ最も困難なステップの一つである。物質が疾患のマーカであるか否かを発見する一つの方法は、これらの物質が、その疾患を有しない患者からのサンプルと比較して、その疾患を示す患者からの生物学的サンプルにおける「表現に差がある(differentially expressed)」か否かを判定することによる。例えば、図1Aは、18人の疾患の患者からなる一つのグループからのサンプルの複数の重なった質量スペクトルのグラフ100を示す。疾患の患者は、例えば、前立腺癌を有し得る。別のグラフ102は、図1Bに示され、18人の普通の患者のグループからのサンプルの重なった質量スペクトルを示す。グラフ100、102の各々において、信号強度が質量電荷比の関数としてプロットされる。グラフ100、102に示される信号の強度は、サンプル内の質量電荷比Aに関連する分子量を有するマーカの濃度と比例する。グラフ100、102に示されるように、質量電荷比Aにおいて、複数の信号が、両方の複数の質量スペクトルにおいて存在する。信号は、質量電荷比Aと関連する分子量を有する潜在的マーカを表すピークを含む。
【0005】
グラフ100、102における信号を一括して見ると、質量電荷比Aの信号の平均強度は、普通の患者からのサンプルよりも疾患の患者からのサンプルにおけるほうが高いことが明らかである。質量電荷比Aのマーカは、疾患の患者において「表現に差がある」といわれる。なぜなら、このマーカの濃度は、普通の患者からのサンプルにおけるよりも疾患の患者からのサンプルにおけるほうが平均して大きいからである。
【0006】
図1Aおよび1Bに示されるデータを参照して、疾患の患者からのサンプルは、普通の患者からのサンプルよりも、質量電荷比Aを有するマーカが高い濃度を有することが結論され得る。マーカの濃度は、通常、疾患の患者からのサンプルにおけるほうが普通の患者からのサンプルにおけるよりも大きいので、マーカは、さらに、疾患に対して「上昇するようにレギューレートされている(up−regulated)」と特徴付けられ得る。マーカの濃度が、通常、疾患の患者からのサンプルにおいて、普通の患者からのサンプルにおけるよりも小さい場合、タンパク質は「減少するようにレギューレートされている(down−regulated)」と特徴付けられ得る。
【0007】
一旦マーカが発見されると、これらのマーカは、診断用ツールとして用いられ得る。例えば、上述の例を参照して、試験患者からの未知のサンプルは、質量分析器を用いて分析され得、質量スペクトルが生成され得る。質量スペクトルが分析され得、質量電荷比Aの信号の強度は、試験患者の質量スペクトルにおいて決定され得る。信号強度は、疾患の患者および普通の患者の質量電荷比Aの平均信号強度と比較され得る。従って、未知のサンプルが、試験患者が癌を有しているか、または癌になるかの予測がなされ得る。例えば、未知のサンプルにおける質量電荷比Aの信号強度が、普通の患者スペクトルのものよりも疾患の患者スペクトルの質量電荷比Aの平均信号強度にはるかに近い場合、その試験患者は、おそらくその疾患になるかまたはその疾患を有するという予測がなされ得る。
【0008】
上述の差分表現分析は有用である一方で、複数の改善がなされ得る。例えば、患者の生物学的サンプルにおけるPSA等の単一のマーカの量を分析することは、しばしば、疾患のプロセスをモニタリングするための十分に高い信頼性を有しない。PSAは、現在利用可能な最良の前立腺癌マーカのうちの一つであると考えられる。しかしながら、このマーカは、良性と悪性前立腺疾患とを必ずしも正しく区別するとは限らない。生物学的サンプルにおけるPSA等のマーカの濃度は、試験患者が疾患を有するか否かを予測する特定の能力を提供するが、一方で、より大きい程度の信頼性を有する分析方法が所望される。
【0009】
さらに、多数の生物学的サンプルの大量の質量スペクトルが分析される場合、疾患状態と非疾患状態との間を区別し得るマーカを表す信号がどれなのかは容易にわからない。生物学的サンプルの典型的な質量スペクトルは、多数の潜在的マーカ信号(例えば、200より多い)およびかなりの量の雑音を有する。これは、潜在的に重要な信号の識別および平均信号差の識別を困難にし得る。従って、潜在的マーカを識別および定量化することは困難である。潜在的マーカが強力な上昇レギュレーションまたは強力な減少レギュレーションを示さない場合、疾患の患者からのサンプルと普通の患者からのサンプルとの間の平均信号差は容易に見分けられ得ない。例えば、あるグループの質量スペクトルにおける所与の質量値の信号のクラスタが、別のグループの質量スペクトルからの信号のクラスタよりも大きいかまたは小さい平均信号強度を有することを視覚的に決定することは多くの場合困難である。さらに、複数の潜在的に重要な信号は、小さい強度値を有し得る。スペクトルにおける雑音は、これらの多くの潜在的に重要な信号を不明瞭にし得る。信号は、発見されなくなり得、差分表現分析からうっかり漏れ得る。
【0010】
質量スペクトルを分析するより良好な方法を有することが所望される。例えば、潜在的に有用なマーカを発見するためのより正確な方法を提供することが所望される。未知のサンプルが、特定の生物学的状態と関連するか否かを予測するために用いられ得る改善された分類モデルを提供することもまた所望される。
【0011】
本発明の実施形態は、これらおよび他の問題に取り組む。
【0012】
(発明の要旨)
本発明の実施形態は、質量スペクトルを分析する方法に関する。本発明の実施形態において、デジタルコンピュータは、異なる生物学的状態に関連したサンプルのクラスを区別するために用いられ得る分類モデルを形成する。分類モデルは、予測のための診断ツールとして用いられてもよい。また、分類モデルは、生物学的状態に関連した潜在的マーカを識別するために用いられてもよい。さらに、分類モデルは、例えば、神経回路網解析などのプロセスを用いて形成されてもよい。
【0013】
本発明の一実施形態は、デジタルコンピュータを用いる質量スペクトルを分析する方法に向けられている。該方法は、a)複数のサンプルからの質量スペクトルから得られるデータセットをデジタルコンピュータに入力する工程であって、各サンプルは、二つ以上のクラスを含むクラスセット内のクラスにあるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、質量電荷比、または質量電荷比から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、工程と、b)該クラスセットの該クラスを区別する分類モデルを形成する工程であって、該形成する工程は、分類プロセスを実現するコードを実行することによって該データセットを分析する工程を含む、工程とを包含する。
【0014】
本発明の別の実施形態は、デジタルコンピュータを用いる質量スペクトルを分析する方法に向けられる。該方法は、a)複数のサンプルからの質量スペクトルから得られるデータセットをデジタルコンピュータに入力する工程であって、各サンプルは、二つ以上のクラスを含むクラスセット内のクラスにあるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、飛行時間、または飛行時間から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、工程と、b)該クラスセットの該クラスを区別する分類モデルを形成する工程であって、該形成する工程は、分類プロセスを実現するコードを実行することによって該データセットを分析する工程を含む、工程とを包含する。
【0015】
別の実施形態は、コンピュータ読み出し可能媒体に向けられる。該コンピュータ読み出し可能媒体は、a)複数のサンプルからの質量スペクトルから導出されたデータを入力するためのコードであって、各サンプルは、二つ以上のクラスのクラスセット内のクラスであるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、飛行時間、質量電荷比、あるいは飛行時間または質量電荷比から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、コードと、b)分類プロセスを用いて分類モデルを形成するためのコードであって、該分類モデルは、該クラスセットにおいて該クラスを区別する、コードとを含む。
【0016】
本発明の別の実施形態は、デジタルコンピュータを用いて生物学的状態によって特徴付けられたクラスに未知のサンプルを分類する方法に向けられる。該方法は、a)該未知のサンプルの質量スペクトルから得られたデータを該デジタルコンピュータに入力する工程と、b)請求項1の方法によって形成された分類モデルを用いて該質量スペクトルを処理して、該生物学的状態によって特徴付けられたクラスに該未知のサンプルを分類する工程とを包含する。
【0017】
本発明の別の実施形態は、未知のサンプルが、デジタルコンピュータを用いて生物学的状態によって特徴付けられるクラスに属するように正確に分類される尤度を推定する方法に向けられる。該方法は、a)該未知のサンプルの質量スペクトルから得られたデータをデジタルコンピュータに入力する工程と、b)請求項1の方法によって形成された前記分類モデルを用いて該質量スペクトルデータを処理して、該未知のサンプルが生物学的状態によって特徴付けられるクラスに正確に分類される尤度を推定する工程とを包含する。
【0018】
本発明の実施形態において、分析される質量スペクトルは、例えば、分類モデルが形成される以前に、うまく作成され得た既存の質量スペクトルになり得る。あるいは、質量スペクトルデータは、分類モデルの形成と実質的に同時に作成され得る。
【0019】
本発明のこれらの実施形態および他の実施形態は、図面および詳細な説明を参照して記載される。
【0020】
(詳細な説明)
本発明の実施形態において、質量スペクトルから取得されたデータセットは、デジタルコンピュータに入力されて、分類モデルを形成する。質量スペクトルは、好適には、既知の特性を有する生物学的サンプルから取得される。好適な実施形態において、分類モデルを形成するために用いられるデータセットは、「既知」のデータセットと特徴付けられる。なぜなら、生物学的サンプルと関連する生物学的状態は、分類モデルを形成するためにデータセットが用いられる前に、知られているからである。比較して、「未知の」データセットは、サンプルの質量スペクトルから取得されるデータを含み、ここで、そのサンプルは、質量スペクトルが形成される場合、分類モデルによって区別される生物学的状態と関連するか否かは不明である。未知のデータは、分類モデルを用いて診断されるべき試験患者からの生物学的サンプルから派生され得る。いくつかの環境において、既知のデータセットは「トレーニングデータ」と呼ばれる。
【0021】
図示する目的で、後述される例の多くは、既知のデータセットを用いて分類モデルを形成することに関する。しかしながら、本発明のいくつかの実施形態において、分類モデルを形成するために用いられるデータセットは、未知のデータセットであり得る。例えば、クラスタ分析において、未知の生物学的サンプルの質量スペクトルが類似のパターンを有する場合、これらはグループ化され得る。各グループに対応するサンプルは、共通のある生物学的状態を有するか否かを見出すたに分析され得る。共通のある生物学的状態を有する場合、そのグループにおけるこれらのサンプルは、生物学的状態と関連するクラスに割り当てられ得る。例えば、共通のパターンを有する質量スペクトルのグループを形成した後、そのグループ内のすべてのスペクトルは、全部が放射線に曝された生物学的サンプルから取得されたと決定され得る。そのグループ内のサンプルは、その後、状態「放射線に曝された(radiation exposed)」と関連付けられるクラスに割り当てられ得る。他のグループ分けにおけるサンプルは、それぞれのグループ分けにおけるサンプルと共通の他の生物学的状態によって特徴付けられるクラスに割り当てられ得る。従って、分類モデルが形成され得、未知のスペクトルが、形成された分類モデルを用いて分類され得る。
【0022】
本発明の実施形態において、用いられる各サンプルは、二つ以上のクラスのセットのうちの一つのクラスに割り当てられるかまたは割り当てられることになっており、各クラスは、異なった生物学的状態によって特徴付けられる。例えば、サンプルの第1のクラスは、疾患状態等の生物学的状態と関連付けられ得る。サンプルの質量スペクトルの第2のクラスは、非疾患状態等の生物学的状態と関連付けられ得る。第1および第2のクラスのサンプルは、クラスセットを形成し得る。それぞれのクラスの各々からの質量スペクトルは、第1および第2のクラスを区別するデータを含み得る。
【0023】
本発明の実施形態において、分析される質量スペクトルにおける各質量スペクトルは、飛行時間、飛行時間から導き出された値(例えば、質量電荷比、分子量等)の関数、質量電荷比、または質量電荷比から導き出された値(例えば、分子量)として信号強度データを含み得る。当業者に公知のように、飛行時間質量分析器から取得される質量電荷比値は飛行時間値から導き出される。質量電荷比は、別の方法で取得され得る。例えば、飛行時間質量分析器を用いて質量電荷比を決定する代わりに、四重極分析器および磁気質量分析器を用いる質量分析器が用いられて質量電荷比を決定し得る。
【0024】
好適な実施形態において、各質量スペクトルは、質量電荷比の関数としての信号強度データを含む。典型的なスペクトルビュータイプの質量スペクトルにおいて、信号強度データは、質量電荷比の関数として信号強度のグラフ上に「ピーク」の形態にて存在し得る。各ピークは、基部と頂点とを有し得る。ここで、ピーク幅は基部から頂点に向かって狭くなる。ピークと関連する質量電荷比は、通常、ピークの頂点と対応する。ピークの強度は、さらに、通常、ピークの頂点と関連する。
【0025】
通常、質量電荷比は、潜在的マーカの分子量と関連する。例えば、潜在的マーカが+1の電荷を有する場合、質量電荷比は、信号によって表される潜在的マーカの分子量と等しい。従って、特定の質量スペクトルが、分子量の関数として信号強度を示し得、他方、分子量パラメータは、実際に、質量電荷比から導き出される。
【0026】
本明細書中で説明される本発明の複数の特定の実施形態は、質量電荷比の使用に関するが、飛行時間値、または飛行時間値から導き出された他の値は、具体的に述べられた例示の実施形態のいずれかにおける質量電荷比値の代わりに用いられ得ることが理解される。
【0027】
分析される質量スペクトルにおける各質量スペクトルが、飛行時間の関数としての信号強度データを含み得るが、信号強度データを質量電荷比の関数として用いる質量スペクトルの使用が、一般に望ましい。イオンの飛行時間値は機器に依存する。これに対して、質量電荷比値は機器に依存しない。例えば、飛行時間質量分析プロセスにおいて、イオンについて取得される飛行時間値は、用いられる特定の質量分析器における自由飛行チューブ(free flight tube)の長さに依存し得る。異なった自由飛行チューブの長さを有する異なった質量分析器は、同じイオンに対して異なった飛行時間値を生成し得る。これは、質量電荷比には当てはまらない。なぜなら、質量電荷比は、単に、イオン電荷に対するイオンの質量の比だからである。質量電荷比値を用いて生成された分類モデルは、さらに、これらを生成するために用いられる特定の質量分析器に依存し得ない。
【0028】
データセットは、任意の適切なデータを含み得、かつ自動的または手動にてデジタルコンピュータに入力され得る。このデータは、デジタルコンピュータ上で分類プロセスを実行することによって処理される前には、生のままかまたは前処理されている状態であり得る。例えば、質量スペクトルにおける所定の質量電荷比の信号の生の強度は、データセットとして用いられ得る。あるいは、生のデータは、分類モデルが形成される前に前処理される。例えば、いくつかの実施形態において、質量スペクトルにおける信号の強度の対数値(例えば、底2)が、データセットを形成するために用いられ得る。
【0029】
データセットは、デジタルコンピュータに入力される。分類プロセスを具体化するコンピュータコードは、データセットを用いて分類モデルを形成する。例示的分類プロセスは、分類および回帰ツリー(regression tree)プロセス等の階層的分類プロセス、クラスタ分析等の多変量統計分析、および神経回路網解析等の非線形プロセスを含む。好適な実施形態において、データセットは、分類および回帰ツリープロセスを用いて処理され、分類および回帰ツリー等の分類モデルを生成する。これらおよび他の分類プロセスおよび分類モデルは、かなり詳細に後述される。
【0030】
生成される分類モデルは、予測的または記述的であり得る。例えば、このモデルは、未知の試験生物学的サンプルが、特定の生物学的状態と関連するかしないかを予測するために用いられ得る。代替的または追加的に、分類モデルは、分析される生物学的状態(単数または複数)を区別するデータにおける特徴を識別するように問合わせられ得る。ある特徴は、分析されている特定のクラスを区別し得る質量スペクトルデータの任意の局面を含む。識別され得る適切な特徴は、一つ以上の質量電荷比の信号強度または信号強度範囲、信号の形状(例えば、ピークの形状)、信号領域(例えば、ピーク領域)、信号幅(例えば、ピークの底部等のピーク幅)、各質量スペクトルにおける信号の数等を含み得るが、これらに限定されない。典型的な例において、分類モデルは、所与の質量電荷比の特定の信号強度などの特徴が、疾患サンプルと非疾患サンプルとを区別することを示し得る。さらに別の例において、分類モデルは、特徴の組み合わせが、疾患サンプルと非疾患サンプルとを区別することを示し得る。例えば、異なった質量電荷比の二つ以上の信号の信号強度範囲は、疾患状態と非疾患状態とを区別し得る。
【0031】
別の例において、異なったサンプルクラスを区別するとして識別され得る適切な特徴は、クラス内で特定の質量電荷比にて信号が生じる頻度であり得る。例えば、100個のサンプルを有する疾患クラスおよび100個のサンプルを有する普通のクラスについて、質量電荷比Xの信号強度Yは、90個の疾患クラスのサンプルの質量スペクトルにおいて存在し得るが、普通のクラスのサンプルからの10個のサンプルにのみ存在し得る。信号の平均強度は、疾患クラスおよび普通のクラスの両方において同じである(すなわち、Yの平均強度)が、癌患者クラスにおける信号の出現数の多さは、その特徴が、疾患クラスと普通のクラスとを区別することを示す。この特徴のような、頻度の特徴は、分類モデルを用いて識別され得る。
【0032】
任意の適切な生物学的サンプルが、本発明の実施形態において用いられ得る。生物学的サンプルは、組織(例えば、バイオプシーから)、血液、血清、プラズマ、乳頭吸引液、尿、涙、唾液、細胞、軟組織および硬組織、器官、精液、便、尿等を含む。生物学的サンプルは、真核生物、原核生物、またはウイルス性生物を含む任意の適切な有機体から取得され得る。
【0033】
生物学的サンプルは、ポリペプチド、タンパク質、核酸、酵素、DNA、RNA、ポリヌクレオチド、オリゴヌクレオチド、核酸、炭水化物、オリゴ糖、多糖類等の高分子、核酸フラグメント、ペプチドフラグメント、およびタンパク質フラグメント等の、上述の生物学的高分子のフラグメント、核酸複合体、タンパク質−DNA複合体、レセプタリガンド複合体、酵素基板、酵素阻害因子、ペプチド複合体、タンパク質複合体、炭水化物複合体および多糖類複合体等の上述の生物学的高分子複合体、アミノ酸、ヌクレオチド、ヌクレオシド、糖、ステロイド、脂質、金属イオン、薬剤、ホルモン、アミド、アミン、カルボン酸、ビタミンおよび助酵素、アルコール、アルデヒド、ケトン、脂肪酸、ポリフィリン、カロチノイド、植物成長レギュレータ、リン酸エステル、およびヌクレオシドジホスホ糖、薬事的または治療的に有効なエージェント等の合成の小分子、モノマー、ペプチド類似体、ステロイド類似体、抑制因子、突然変異原、発癌物質、抗有糸分割薬、抗生物質、イオノフォア、代謝拮抗物質、アミノ酸類似体、抗菌剤、輸送抑制因子、界面活性剤(サーファクタント)、ミトコンドリアおよび葉緑体機能抑制因子、電子供与体、担体および受容体、プロテアーゼの合成基板、ホスファターゼの基板、エステラーゼおよびリパーゼの基板、およびタンパク質改良試薬等の小さい生物学的分子、ならびに合成ポリマー、オリゴマー、ならびに共重合体を含み得る。具体的に挙げられた上記の物質の任意の適切な混合または組み合わせもまた生物学的サンプルに含まれ得る。
【0034】
上述のように、データセットが生成される生物学的サンプルは、二つ以上のクラスのセットにおけるクラスに割り当てられる。各クラスは、異なった生物学的状態によって特徴付けられる。好適には、二つのクラスおよび二つの生物学的状態のみが存在し、すなわち、二つのクラスの各々に対して一つずつである。例えば、一方のクラスは、疾患状態等の生物学的状態を有し得、他方の生物学的状態は、非疾患状態等の状態を有し得る。
【0035】
本明細書中で用いられるように、サンプルの「生物学的状態」は、サンプルまたは有機体またはサンプルが派生される源の生物学的状態を特徴付ける任意の特性に関する。特性は、遺伝子型素質(trait)または表現型素質等の生物学的素質であり得る。特性は、感染性の疾患を含む、特定の疾患の有無などの生理学的または疾患素質であり得る。特性は、さらに、サンプルが曝された条件であり得る(環境、社会的、心理学的、時間依存性等)。
【0036】
遺伝子型素質は、特定の遺伝子または遺伝子の多形、あるいは遺伝子の組み合わせの有無を含み得る。遺伝的素質は、表現型素質として発現し得るか、または、特定の疾患に対する感受性等、それらの発現に対する感受性として存在する(例えば、癌または心臓疾患の特定のタイプの性向)。
【0037】
表現型性質は、例えば、外観、生理的素質、物理的素質、神経的状況、心理的状況、反応素質、例えば、特定の薬剤に対する反応または反応の欠如を含む。表現型素質は、疾患素質を含むいわゆる「正常(normal)」素質または「病理学的(pathological)」素質の有無を含み得る。別の状態は、特定の疾患の有無である。状態は、さらに、特定の人、または、例えば、異なった個人、異なった家族、異なった年齢状態、異なった種および異なった組織タイプ等のグループに属する状態であり得る。
【0038】
いくつかの実施形態において、生物学的状態は、例えば、以下の状態の一つ以上の任意の適切な組み合わせであり得る。これらは、疾患状態、正常状態、病的状態、薬剤状態、非薬剤状態、薬剤応答状態、非薬剤応答状態、および良性状態である。薬剤状態は、薬剤を摂取した患者の状態を含み得、他方、非薬剤状態は、患者が薬剤を摂取していない状態を含み得る。薬剤応答状態は、薬剤の使用に応答する生物学的サンプルの状態である。疾患状態の特定の例は、例えば、癌、心臓疾患、自己免疫疾患、ウイルス性感染、アルツハイマー疾患および糖尿病等を含む。より具体的な癌状態は、例えば、前立腺癌、膀胱癌、乳癌、結腸癌、および卵巣癌等を含む。生物学的状態は、さらに、初期状態、中期状態および末期状態を含み得る。例えば、異なった生物学的状態は、癌等の疾患の初期状態、中期状態および末期状態を含み得る。
【0039】
他の状態は、異なったサンプルのクラスが影響を受ける異なった環境と関連し得る。例示的環境は、熱、電磁放射、運動、ダイエット、地理的位置等に曝すことによる治療等の一つ以上の条件を含む。例えば、生物学的サンプル(例えば、すべての血液サンプル)のクラスは、放射線に曝された患者のグループからであり得、生物学的サンプルの別のクラスは、放射線に曝されなかった患者のグループからであり得る。放射線源は、X線機器等の目的に合わせた放射線源であり得るか、または移動電話等の意図されない放射線源であり得る。別の例において、ある人のグループは、特定の食事制限中であり得、別のグループは、別の食事制限中であり得る。
【0040】
本発明の他の実施形態において、異なった生物学的状態は、それぞれ異なった薬剤または薬剤タイプと関連するサンプルに対応し得る。例示において、既知の効果の薬剤を用いて治療された人からのサンプルの質量スペクトルが生成される。既知の効果の薬剤と関連する質量スペクトルは、既知の効果の薬剤と同じタイプの薬剤を表し得る。例えば、既知の効果の薬剤と関連する質量スペクトルは、同じか類似の特性、構造、または既知の効果の薬剤と同じ基本的効果を有する薬剤を表し得る。複数の異なった鎮痛性錯体の全部が、例えば、人に痛みの緩和を提供し得る。既知の効果の薬剤および同じかまたは類似のタイプの薬剤の全部が、人の体内の同じ生化学的経路をレギューレートし得、人に同じ効果を生成する。生物学的経路の特性(例えば、上昇または減少するようにレギューレートされたタンパク質)は、質量スペクトルに反映され得る。
【0041】
分類モデルは、既知の効果の薬剤と関連する質量スペクトル、異なった薬剤および異なった薬剤タイプと関連する質量スペクトル、あるいは薬剤と全く関連しない質量スペクトルを用いて生成され得る。一旦分類モデルが生成されると、未知の効果の候補薬剤と関連する候補サンプルについて質量スペクトルが生成され得る。分類モデルを用いて、候補サンプルと関連する質量スペクトルが分類される。分類モデルは、候補サンプルが既知の効果の薬剤と関連するか、異なったタイプの別の薬剤と関連するかを決定し得る。例えば、分類モデルが候補サンプルを、既知の効果の薬剤と関連するとして分類する場合、この候補薬剤は、既知の効果の薬剤と同じ効果を身体に及ぼす可能性がある。従って、本発明の実施形態は、特に、薬剤を発見および/または特徴付けるために用いられ得る。
【0042】
(I.質量スペクトルの取得)
質量スペクトルは、任意の適切なプロセスによって取得され得る。例えば、質量スペクトルは、質量スペクトルの一つ以上のデータベースへのアクセスを有するローカルまたはリモートサーバコンピュータから取り出され得る(すなわち、ダウンロードされる)。データベースは、異なった生物学的状態と関連する異なった生物学的サンプルの質量スペクトルのライブラリを含み得る。あるいは、質量スペクトルは、生物学的サンプルから生成され得る。これらの生物学的サンプルが取得される方法と関係無く、分類モデルを生成するために用いられる質量スペクトルおよびサンプルは、好適には、同様の条件の下で処理されて、スペクトルの任意の変更はサンプルそれ自体に基づくものであり、処理の相違が原因ではないことを確実にする。質量スペクトルは、特に特定の分類プロセスを想定して生成され得るか、またはデータに対して用いられる特定の分類プロセスに関係なく生成され得る。
【0043】
本発明の実施形態において、気相イオン質量分析器が質量スペクトルを生成するために用いられ得る。「気相イオンスペクトロメータ(gas phase ion spectrometer)」とは、サンプルがイオン化されて気相になるときに形成されるイオンの質量電荷比に変換され得るパラメータを測定する装置のことである。これは、例えば、質量スペクトロメータ、イオン移動度スペクトロメータまたは全イオン電流測定デバイスを含む。
【0044】
質量スペクトロメータは、任意の適切なイオン化技術を用い得る。イオン化技術は、例えば、電子イオン化、高速原子/イオン衝突、マトリックス支援レーザ脱離/イオン化(MALDI)、表面活性化レーザ脱離/イオン化(SELDI)またはエレクトロスプレーイオン化を含み得る。
【0045】
いくつかの実施形態において、イオン移動度分析計は、マーカを検出および特徴付けるために用いられ得る。イオン移動度分析計の原理は、イオンの異なった移動度に基づく。特に、イオン化によって生成されるサンプルのイオンは、例えば、質量、電荷、または形状の相違に基づいて電場の影響下にあるチューブを通って異なった速度で移動する。イオン(通常電流の形態)は、検出器にて記憶され、従って、検出器の出力がサンプル中のマーカまたは他の物質を識別するために用いられ得る。イオン移動度分析計の一つの利点は、この分析計が大気圧にて実行され得ることである。
【0046】
好適な実施形態において、レーザ脱離飛行時間質量分析器が質量スペクトルを生成するために用いられる。レーザ脱離分析計は、タンパク質等の高分子量物質を分析するために特に適切である。例えば、MALDIまたは表面活性化レーザ脱離/イオン化プロセスの実際の質量範囲は、300,000ダルトン以上であり得る。さらに、レーザ脱離プロセスが複合混合物を分析し、かつ高感度を有するために用いられ得る。さらに、タンパク質のフラグメンテーション(fragmentation)の可能性は、MALDIまたは表面活性化レーザ脱離/イオン化プロセス等のレーザ脱離プロセスにおける尤度が他の多くの質量分析プロセスにおけるよりも低い。従って、レーザ脱離プロセスは、タンパク質などの高分子量物質を正確に特徴付けおよび定量化するために用いられ得る。
【0047】
質量スペクトルを生成するための典型的なプロセスにおいて、マーカを有するプローブは、質量分析器のインレットシステム(inlet system)に導入される。マーカは、その後、イオン化される。マーカイオンが生成された後、生成されたイオンは、イオン光学アセンブリによって収集され、その後、質量分析器が、通過するイオンを拡散させ、かつ分析する。質量分析器を出るイオンは、検出器によって検出される。飛行時間質量分析器において、イオンは、短い高電圧場を通って加速され、高真空チャンバ内に流れ込む。高真空チャンバの遠端にて、加速されたイオンは、異なった時間に高感度検出器面を打つ。イオンの飛行時間がイオンの質量電荷比の関数であるので、イオン化と衝撃との間の経過時間が特定の質量電荷比の分子の有無を識別するために用いられ得る。
【0048】
飛行時間データは、その後、質量電荷比に変換され得、質量電荷比の関数としてのマーカの信号強度を示すスペクトルを生成する。図2は、飛行時間に基づく質量スペクトルを質量電荷比データに変換するための例示的方法を図示するフローチャートを示す。最初に、飛行時間スペクトルが収集される(工程16)。その後、平滑フィルタがその飛行時間スペクトルに適用される(工程18)。通常、最初に生成されたスペクトルにおいてかなりの量の高周波数雑音が存在する。種々のフィルタが適用されて、基本となる信号を乱すことなく雑音を低減する。その後、ベースラインが計算される(工程20)。これは、例えば、MALDIまたは表面活性化レーザ脱離/イオン化プロセスに特性であり得る上方向シフトの特性を除去する。
【0049】
「表面活性化(surface enhanced)」脱離/イオン化プロセスとは、サンプルがエネルギー源に提供されるその基板が脱離/イオン化プロセスにおいて積極的な役割を果たすプロセスのことである。これらの方法において、プローブ等の基板は、サンプルを提供するための単なる受動的ステージではない。表面活性化基板のいくつかのタイプは、表面活性化脱離/イオン化プロセスにおいて用いられ得る。一例において、表面は、好適には、特定の分子のクラスと結合するアニオン交換基または親水基(例えば、シリコン酸化物)等の親和性材料を含む。このような親和性材料の例は、例えば、シラノール(親水性)、C8またはC16アルキル(疎水性)、固定化金属キレート(配位共有)、アニオン、カチオン交換体(イオンの)または抗体(生物種)を含む。サンプルは、基板結合吸着剤に曝され、従って、特定の引力に従って検体分子を結合する。通常、非結合分子は洗浄除去される。検体が生物分子である場合、エネルギー吸収材料、例えば、マトリックスが、通常、結合サンプルと関連する。その後、レーザが用いられて、検体を脱着およびイオン化する。これらの検体は、検出器を用いて検出される。
【0050】
別のバージョンにおいて、基板表面は、エネルギー吸収分子の結合層を含み、MALDIにおけるように、サンプルをマトリックス材料と混合する必要をなくす。表面活性化脱離/イオン化法は、例えば、米国特許第5,719,060号(HutchensおよびYip)およびWO98/59360号(HutchensおよびYip)(米国特許第6,255,047号)に記載される。レーザが、エネルギー吸収材料を含むマトリックスを脱離する場合、マトリックス材料のいくつかもまた、分析されるサンプル材料と共に電離され得る。ベースライン計算は、脱離マトリックス材料に基づいて、信号の存在を考慮するようにスペクトルを調整する。一旦ベースラインが計算されると、飛行時間から質量への変換が行われる(工程22)。この工程において、飛行時間データは、質量電荷比に変換される。次に局所的雑音値が計算される(工程24)。低質量電荷比にて、脱離されたマトリックス材料が原因で、かなりの量の雑音が生成される。イオン化脱離プロセスにおいて、マトリックス材料の脱離は、より低い質量電荷比よりも、より高い質量電荷比において可能性が低い。従って、雑音は、より高い質量電荷比よりも、より低い質量電荷比において可能性が高い。スペクトルへの適合が、この効果を修正するためになされ得る。これらの修正がなされた後、スペクトル更新が完了される(工程26)。図2に示される方法に従って質量スペクトルを処理することによって、質量スペクトルの信号対雑音比が改善され、潜在的マーカのより良好な定量化および比較を可能にする。
【0051】
マーカの脱離および検出により生成される質量スペクトルデータは、質量スペクトルのプロットが生成前後にデジタルコンピュータを用いて前処理され得る。データ分析は、検出されたマーカの信号強度(例えば、信号の大きさ)を決定する工程、および「外れ値(outlier)」(所定の統計的分布からのデータのずれ)を除去する工程を包含し得る。例えば、観察された信号は正規化され得る。正規化は、特定の基準と関連する各信号の大きさが計算される。例えば、基準は、目盛りをゼロにセットする機器および化学薬品(例えば、エネルギー吸収分子)により生成されるバックグラウンドノイズであり得る。従って、各マーカまたは他の物質について検出された信号強度は、所望の目盛りの相対強度の形態で表示され得る(例えば、100)。あるいは、サンプルの標準が認められ得、その標準からの信号が、検出される各マーカまたは他のマーカについて観察された信号の相対強度を計算するための基準として用いられ得る。
【0052】
デジタルコンピュータは、表示するために、生じたデータを種々の形式に変換し得る。「スペクトルビューまたは残留マップ(retentate map)」と呼ばれる一つの形式において、標準スペクトルビューが表示され得る。スペクトルビューは、各特定の分子量にて検出器に到達するマーカの量を示す。「ピークマップ」と呼ばれる別の形式において、ピークの高さおよび質量情報のみがスペクトルビューによって保持され、より鮮明な像をもたらし、かつほぼ同じ分子量を有するマーカを表す信号がより容易に見出されることを可能にする。「ゲルビュー」と呼ばれるさらに別の形式において、ピークビューからの各質量は、各ピークの高度に基づいたグレイスケール像に変換され、電気泳動ゲルの帯と同様の外観が生じる。「3Dオーバーレイ(3−D overlays)」と呼ばれるさらに別の形式において、相対ピーク高度の微妙な変化を研究するためにいくつかのスペクトルが重ね合わされ得る。「差マップビュー(difference map view)」と呼ばれるさらに別の形式において、二つ以上のスペクトルが比較され得、便利に強調表示されるマーカを表す信号、およびサンプル間で上昇または減少するようにレギューレートされるマーカを表す。任意の二つのサンプルからのマーカプロファイル(スペクトル)は、一つのプロットの上で視覚的に比較され得る。データセットを形成するために用いられ得るデータは、これらおよび他のスペクトル表示形式から取得され得る。
【0053】
(II.データセットの形成)
一旦質量スペクトルが取得されると、既知のデータセット等のデータセットが形成される。データセットは、生物学的サンプルのクラスセットの質量スペクトルから取得されるデータを含む。データセットを形成する質量スペクトルデータは生、未処理のデータであり得る。例えば、質量スペクトルからの識別された質量値の生信号強度値は、データセットを形成するために用いられ得る。別の例において、質量スペクトルからの生信号パターンがデータセットを形成するために用いられ得る。
【0054】
代替的実施形態において、データは、分類モデルを形成するために用いられる前に前処理され得る。質量スペクトルは、その後、分類モデルを形成するために用いられる前に、任意の適切な態様にて処理され得る。例えば、質量スペクトルにおける信号は、信号強度の対数値をとり、外れ値を除去し、潜在的マーカと関連する可能性が少ない信号を除去し、小さい強度を有する信号を除去すること等によって処理され得る。
【0055】
いくつかの実施形態において、データセットは、各質量スペクトルの特定のパターンと関連する生または未処理のパターンデータを含み得る。例えば、複数の信号ピークを含む質量スペクトルについて、信号ピークのパターンは、質量スペクトルを生成するために用いられる生物学的サンプルの指紋を構成し得る。分類プロセスは、分類モデルによって区別された、それぞれ異なったクラスにおけるスペクトルに共通であり得るパターンまたはパターンセグメントに従って、異なったスペクトルを分類し得る。神経回路網プログラム等のコンピュータプログラムは、例えば、既知の生物学的状態と関連する既知のサンプルの複数の質量スペクトルを受け取り得る。神経回路網は、質量スペクトルデータを用いて訓練され得、従って、それぞれ異なったクラスに属する質量スペクトルパターン間を区別し得る。訓練された神経回路網は、その後、質量スペクトルにおけるパターンに基づいて、未知のサンプルと関連する質量スペクトルを分類するために用いられ得る。
【0056】
他の実施形態において、データセットは、質量スペクトルにおける信号の強度に関するデータを含む。これらの実施形態において、各質量スペクトルにおける信号のいくつかおよびすべては、データセットを形成するために用いられ得る。例えば、スペクトルビュータイプの質量スペクトルにおけるすべての信号(例えば、ピーク)よりも小さい強度がデータセットを形成するために用いられ得る。好適な実施形態において、質量電荷比が識別され、この識別された質量電荷比は、質量スペクトルから信号を選択するために用いられる。これらの選択された信号の強度は、データセットを形成するために用いられ得る。各質量スペクトルにおけるすべての信号よりも少ない信号からのデータを用いることによって、処理されるデータポイントの数が低減されて、データ処理がより迅速になる。許容できるマーカを表す可能性が低い信号のデータは、データセットから排除され得る。
【0057】
質量電荷比は、任意の数の方法にて識別され得る。例えば、質量電荷比は、異なった生物学的状態を有する異なったクラスの質量スペクトルを比較することによって識別され得る。クラスが選択され得る可能性のある信号の質量電荷比が選択され得る。この比較は、手動で実行され得るか(例えば、目視比較)、またはデジタルコンピュータを用いて自動で行われ得る。例えば、サンプルの異なったクラスと関連する質量スペクトルは、互いに目視比較され得、一つのサンプルクラスからの質量スペクトルにおける質量電荷比の信号の強度が、異なったサンプルクラスからの質量スペクトルにおける同じ質量電荷比の信号よりも大きいかまたは小さいかを決定し、従って、潜在的に異なった表現を示す。これらの信号の差が生じるところで質量電荷比が選択され得る。
【0058】
図3は、例えば、識別されたピーククラスタに対する正規化強度の対数値(底2)を示す。このプロットは、底2のログ表示の正規化強度値を示す。ピーククラスタにおける各強度値は、ゼロ値が平均強度値に変化を表さないように、その部分が引かれる。y軸の各単位は、クラスタ平均との2倍の差異を表す。著しく上昇および減少するようにレギューレートされたタンパク質は、図3に示されているようなプロットを用いて識別され得る。図3は、異なった信号クラスタの関数としての正規化強度の対数表示のグラフを示す。二つの異なったグループのサンプルからの質量スペクトルからの信号強度がこのグラフに示される。例えば、図3におけるピーククラスタ22(x軸上)は、グループAおよびグループBからのデータポイント間の大幅なばらつきを示す。これは、ピーククラスタ22に関連する質量電荷比が、候補マーカ位置として識別され得ることを示す。
【0059】
代替的または追加的に、特定の所定の基準が、最初に特定の信号または信号クラスタを選択するために提供され得る。選択される信号クラスタは、その後、特定の質量電荷比を識別するために用いられ得る。例えば、特定の信号強度閾値より大きいかまたは小さい信号強度または平均信号強度を有する信号または信号クラスタが自動的に選択され得る。これらの選択された信号または信号クラスタと関連する質量電荷比は、その後、識別され得る。
【0060】
質量スペクトルデータを収集すること、データを前処理すること、および前処理された質量スペクトルデータを処理して分類モデルを形成することを包含する好適な方法は、図4および図5を参照して説明され得る。図4を参照して、異なった生物学的状態と関連するサンプルの質量スペクトルが収集される(工程27)。収集されたサンプルの数は、好適には大きい方がよい。例えば、本発明の実施形態において、収集されたサンプルの数は、約100〜約1000であり得る(またはこれらの値以上または以下)。好適には、スペクトルを生成するために用いられるすべてのサンプルは、同様の条件下で生成され、従って、サンプル間の差がスペクトルに反映される。
【0061】
潜在的マーカの存在に対応する信号は、各スペクトルにて識別される。このような各信号に質量値が割り当てられる。質量スペクトルの第1のグループにおける各質量スペクトルにおける所定の信号対雑音比より大きい信号がその後検出される(工程28)。典型的な例において、信号対雑音比が値Sよりも大きい信号が検出され得る。値Sは、絶対値または相対値であり得る。その後、質量スペクトルにおける質量電荷比の信号がクラスタ化される(工程30)。所定の基準を満たす信号クラスタがその後選択される。例えば、一実施形態において、所定の数の信号を有する信号クラスタが選択され得る(工程32)。所定の数よりも少ない数を有するクラスタが廃棄される。典型的な例において、クラスタにおける信号の数が質量スペクトルの数の50%未満である場合、信号クラスタは、廃棄され得る。いくつかの実施形態において、選択プロセスの結果、選択された信号クラスタの、わずか約20〜約200個いずれかになる。一旦信号クラスタが選択されると、これらの信号のクラスタの質量電荷比が識別され得る(工程34)。
【0062】
一旦質量電荷比が識別されると、質量電荷比の「欠落信号(missing signals)」が決定され得る。質量スペクトルのいくつかは、識別された質量電荷比の信号を有し得ない。質量スペクトルのグループまたはこの質量スペクトルと関連するサンプルは再分析され得、信号が、識別された質量電荷比にて実際に存在するかどうかを決定する(工程36)。推定値が任意の欠落信号に対して付加される。信号がクラスタ内に見出されないスペクトルについて、強度値がトレースの高さまたは雑音値から推定される。推定された強度値は、ユーザによる選択が可能であり得る。
【0063】
図5を参照して、一旦質量電荷比が識別されると、強度値は、すべての質量スペクトルの識別された質量値の各信号について決定される(工程46)。信号値の各々の強度値は、0〜100に正規化されて、絶対値の大きさの影響を除去する(工程48)。その後、この対数(例えば、底2)が、各正規化された信号強度についてとられる。信号強度の対数をとることは、測定値からスキューを除去する。
【0064】
正規化されたデータセットの対数表示は、その後、分類プロセスによって処理される(工程52)。このプロセスは、デジタルコンピュータによって実行されるコードによって具体化される。このコードがデジタルコンピュータによって実行された後、分類モデルが形成される(工程54)。分類モデルの形成に関するさらなる詳細は、以下に提供される。
【0065】
(III.分類モデルの形成)
デジタルコンピュータによって実行されるコードによって具体化される分類プロセスは、データセットを処理し得る。このコードは、デジタルコンピュータによって実行され得、分類モデルを生成する。コードは、任意の適切なコンピュータの読み出し可能な媒体に格納され得る。コンピュータによって読み出し可能な媒体の例は、磁気、電子、または光学ディスク、テープ、スティック、チップ等を含む。コードは、さらに、C、C++等を含む任意の適切なコンピュータプログラミング言語で書き込まれ得る。
【0066】
デジタルコンピュータは、Windows(R)ベースのオペレーティングシステム等の、任意の標準規格または専用オペレーティングシステムを用いるマイクロ、ミニまたは大型のフレームコンピュータであり得る。他の実施形態において、デジタルコンピュータは、単に、一つ以上のマイクロプロセッサであり得る。デジタルコンピュータは、質量スペクトルを生成するために用いられる質量分析器から物理的に分離され得る。あるいは、デジタルコンピュータは、質量分析器と結合されるかまたは物理的に組み込まれ得る。質量スペクトルデータは、質量分析器からデジタルコンピュータに手動または自動で伝送され得る。例えば、一実施形態において、既知のデータセットは、まず、複数の質量スペクトルから取得され得る。既知のデータセットは、その後、分類プロセスを具体化するコードを実行するデジタルコンピュータに手動で入力され得る。別の実施形態において、質量スペクトルデータの生成および/または収集、データの前処理、および分類プロセスによる前処理されたデータの処理が、同じ物理的計算装置を用いて実行され得る。
【0067】
いくつかの実施形態において、既知のデータセットは、トレーニングセットとして特徴付けられ得る。このトレーニングセットは、前駆データを「訓練」して、分類モデルまたは予め形成された分類モデルにし得る。分類モデルは、訓練され得、形成されて学習する。例えば、神経回路網において、既知のデータセットは、神経回路網に入力されるデータのクラス間の差を認識するように神経回路網を訓練するために用いられ得る。最初の分類モデルが形成された後、分類モデルをさらに訓練および洗練するためにより大きい数のサンプルが用いられ得る。
【0068】
本発明の実施形態において、さらなるデータが、分類モデルを形成するために用いられ得る。さらなるデータは、質量スペクトルと関連し得るか、または関連し得ない。例えば、いくつかの実施形態において、既存のマーカデータは、既知のデータセットに加えて用いられ得、分類モデルを形成する。例えば、前立腺癌患者のサンプルのクラスおよび非前立腺癌の患者のサンプルのクラスの質量スペクトルが取得され得る。既知のデータセットは、質量スペクトルを用いて形成され得る。分類モデルは、既存のPSA診断データ(例えば、PSA臨床試験)等、既知のデータセットおよび既存のマーカデータを用いて形成され得る。さらなる既存のPSA診断データは、分類モデルを形成する質量スペクトルを区別することを支援するために用いられ得る。例えば、各質量スペクトルは、PSAに対応する質量電荷比の信号が、前立腺癌の信号強度特性または非前立腺癌の信号強度特性と、より密接に関連するか否かを見出すように評価され得る。この情報は、質量スペクトルおよびその対応するサンプルを前立腺癌または非前立腺癌クラスに割り当てることを支援するために用いられ得る。他の実施形態において、生物学的サンプルが採取された人の性別、年齢等の非質量スペクトルデータもまた分類モデルを形成するために用いられ得る。例えば、特定の疾患を有する可能性が女性よりも男性のほうが高い場合、この情報は、サンプルを分類して、分類モデルを形成することを支援するためにもまた用いられ得る。
【0069】
任意の適切な分類プロセスが本発明の実施形態において用いられ得る。例えば、分類プロセスは、分類ツリーおよび回帰ツリープロセスまたは多変量統計的分析等の階層的分類プロセスであり得る。多変量統計的分析は、いくつかの変数間の関係のパターンを同時に調べる。多変量統計分析の例は、判別関数分析およびクラスタ分析等の周知のプロセスを含む。判別関数分析は、各グループの過去の観察に基づいてグループに観察を割り当てる統計的方法である。クラスタ分析は、データの多変量変化を一連のセットとして表す分析の方法である。生物学において、例えば、このセットは、多くの場合、階層的態様で構成され、系統樹と呼ばれる樹木のような形状で示される。クラスタ分析および他の分類プロセスのいくつかのタイプは、Jainらによる文献「Statistical Pattern Recognition: A Review」IEEE Transactions on Pattern Analysis and Machine Intelligence、Vol.22、No.1(2000年1月)に記載される。この文献は、参考のため、その全体を本明細書中に援用する。
【0070】
あるいは、分類プロセスは、人工神経回路網解析等の非線形分類プロセスを用い得る。人工神経回路網は、既知のデータセットを用いて訓練され得る。一般に、人工神経回路網解析は、これに影響を及ぼし得るいくつかの他の入力変数からの入力に基づく出力変数の値を予測し得る。この予測は、既知のパターンのセットから、特定の状況に最も適切であると思われる一つを選択することによってなされる。人工神経回路網は、概念上、いくつかの神経エレメント(単位)、およびこれらのエレメント間の接続を有する。これらの単位は、これらの機能によって三つの異なった層またはグループにカテゴリー分類される。第1のグループは、システムに入力されるデータを受信する入力層を形成する。第2のグループは、出力パターンを表す出力データを送達する出力層を形成する。第3のグループは、入力パターンを出力に変換するかくれ層としても知られる多数の中間層を含む。
【0071】
例示的に、神経回路網は、疾患状態と非疾患状態とに関連するレーザ脱離質量スペクトル間の区別をするように訓練され得る。その後、試験生物学的サンプルの質量スペクトルは、レーザ脱離プロセスによって生成され得、この質量スペクトルに関するデータは、訓練された神経回路網に入力され得る。訓練された神経回路網は、試験生物学的サンプルが疾患状態と非疾患状態のどちらに関連するかを決定し得る。
【0072】
本発明の実施形態において、分類プロセスは、好適には、分類および回帰ツリープロセス等の階層的、再帰的分割プロセスを含む。本発明の実施形態において、分類および回帰ツリープロセスは、デジタルコンピュータによって実行され得るコンピュータコードによって具体化される。例示的分類および回帰ツリープログラムは、Salford Systems,Inc.(www.salford−systems.com)から市販されるCART4.0である。
【0073】
一つの特定の分類および回帰ツリープロセスは、二進再帰的分割プロセスである。このプロセスは、二進である。なぜなら、親ノードは、常に、正確に二つの子ノードに分割されるからであり、このプロセスは、各子ノードを親として扱うことによって繰返され得るため再帰的である。既知のデータセットを分割するために、既知のデータセットに問合わせされる。本発明の実施形態において、分割されるデータは、生物学的サンプルのクラスセットに対応する質量スペクトルである。各質量スペクトルは、分類されるべき「事例」と考えられ得る。事例を分割するために用いられ得る例示の問合わせは、「質量電荷比の信号の信号強度XはYよりも大きいか否か」であり得る。各問合わせは、既知のデータセットをより均一な構成の二つのグループに細分する。一旦最良の分割が見出されると、分類および回帰ツリープロセスは、各子ノードを検索するプロセスを繰返し、さらなる分割が不可能になるまで再帰的に継続または停止される。分割は、特定のノードに一つのケースのみが残るか、またはそのノードにおけるすべてのノードが同じタイプである場合不可能である。
【0074】
データセットについての問合わせは、ユーザによって決定され得るか、またはデジタルコンピュータによって自動的に決定され得る。いくつかの実施形態において、この問合わせは、デジタルコンピュータによって任意に生成され得、分割されるデータの質は、問合わせが容認され得るか否かを決定する。例えば、問合わせは、データに関して行われ得る。このパーティショニングが統計的に重要な事例の分割を生じさせた場合、この問合わせは、分類および回帰ツリーを形成するために保持されかつ用いられ得る。分類および回帰ツリープロセスは、データを分類するために必要とされる最適な数の問合わせを識別し、各サンプル観察におけるランダムエラーの影響を補償する。
【0075】
分類および回帰ツリープロセスは、分析に含まれるすべての予測変数について可能なすべての分割を考察する。例えば、215個の事例および19個の予測変数を有するデータセットについて、プロセスは、全部で4085回の可能な分割のために215×19の分割を考慮する。通常、すべてのこのような分割は、分類および回帰ツリーを形成する場合に考えられる。従って、形成された分類および回帰ツリープロセスは、分類モデルを形成する際に異なった予測変数を考慮に入れる。例えば、典型的な実施形態において、クラスセットのすべての質量スペクトルにおける100を超える質量電荷比における信号のデータは、分類モデルを形成する場合に考慮に入れられる。比較して、すでに説明された差分表現分析(differential expression analysis)は、ただ一つの予測変数を考慮に入れる。従って、分類および回帰ツリーの実施形態は、他の分類法よりも正確な分類精度を提供し得る。なぜなら、各質量スペクトルからのより多くのデータが分類モデルを形成するために用いられるからである。
【0076】
モデルの精度を点検するために、分類および回帰ツリープロセスは、相互検証(cross validation)と呼ばれるコンピュータを駆使した技術を用い得る。通常の相互検証プロセスにおいて、大きいツリーが成長し、その後、余分のものを取り除かれる(pruned back)。データセットは、10個のほぼ等しい部分に分割される。これらの各々は、分析される生物学的状態について同様の分布を含む。データの最初の9個の部分は可能な最大のツリーを構成するために用いられる。データの残りの1部分は、選択されたサブツリーのエラーレートの最初の推定を取得するために用いられる。同じプロセスが、その後、別の9/10のデータに対して繰返され(可能な最大のツリーを成長させる)、異なった1/10部分は試験サンプルとして用いられる。プロセスは、データの各パートが試験サンプルとして1度蓄えられるまで継続する。10回の小試験サンプルの結果は、その後、各可能な大きさのツリーのエラーレートを形成するために組合される。これらのエラーレートは、全体のデータセットに基づくツリーに適用される。相互検証は、ツリーの独立した予測精度のかなり信頼できる推定を提供する。独立した試験サンプルが利用可能でない場合であっても、このツリーが新しいデータ(例えば、複数の未知のサンプルからのデータ)を完全に分類し得る精度の程度に関して予測がなされ得る。
【0077】
生成される分類および回帰ツリーは、予測変数(存在する場合)がサンプルグループ間の相違を決めるもとになる表現を提供する。分類および回帰ツリーは、分類のために用いられ得(どのグループにケースが属するかを予測する)、さらに回帰のために用いられ得る(特定の値を予測すること)。これはさらに、分析されるクラス間の判別において重要であり得る特徴を識別するために用いられ得る。例えば、分類モデルは、特定の質量電荷比の一つ以上の信号強度値(単独または組み合わせで)が、分析されるクラスを区別する重要な特徴であることを示し得る。
【0078】
分類および回帰ツリーは、データにおいて見出される関係をグラフィックで表示する。分類および回帰ツリープロセスの一つの主要な出力は、ツリーそれ自体である。ツリーは、ユーザによって視覚的に分析され得る分類モデルの1局面として利用され得る。神経回路網解析等の非線形技術と異なって、ツリーによって提供される視覚的プレゼンテーションは、分類分析を非常に容易に理解および習得させる。その結果、ユーザは、訓練された神経回路網に特徴的であるような「ブラックボックス」分類よりも決定ツリーの結果を信用する傾向がある。これは、分類および回帰ツリーを、種々の健康管理と規制職員(例えば、食品医薬品局)、および分類モデルを生成するために用いられる分析を詳細に理解することを所望し得る患者のために所望の分類モデルにする。このツリーは、分析されているデータと生物学的状態との間の未知の関係を前もって発見するためにもまた用いられ得る。
【0079】
分類および回帰ツリープロセスは、神経回路網解析等の分類プロセスと比較して他の利点を有する。例えば、分類および回帰ツリープログラムは、通常、多数の、時には数千にものぼるトレーニングセットデータの経路を必要とする神経回路網よりも効率的である。しかしながら、決定ツリーを構築することが必要とされる経路の数は、ツリーにおけるレベルの数を超えることはない。ツリーにおけるレベルの数には所定の制限はないが、ツリーの深さおよび幅広さによって判定されるように、通常、予測変数の数が上昇すると、ツリーの複雑性は増加する。
【0080】
さらに、分類および回帰ツリーモデルを用いて、クラス間を判別し得る特徴が識別され得る。データ内で識別された特徴は、分析されている生物学的状態(単数および複数)の特徴であり得る。例えば、分類モデルは、特徴の組み合わせが、特定の生物学的状態と関連付けられることを示し得る。例えば、モデルは、異なった質量電荷比の特定の信号強度が、疾患状態と非疾患状態とを区別することを示し得る。従来の差分分析プロセスと比較して、本発明の実施形態において、多くの異なった変数が分析され得る。分類モデルは、単一の予測変数を識別し得るか、または分析されている生物学的状態を区別し得る複数の予測変数を識別し得る。
【0081】
(IV.分類モデルの使用)
分類モデルは、未知のサンプルを生物学的状態に分類するために用いられ得る。この方法において、試験サンプルの質量スペクトルは、そのサンプルがその生物学的状態と適切に分類され得るか否かを決定するために特定の生物学的状態と関連する分類モデルと比較され得る。未知の生物学的サンプルの質量スペクトルが取得され得、その未知のサンプルの質量スペクトルから取得されるデータはデジタルコンピュータに入力され得る。入力されたデータは、分類モデルを用いて処理され得る。分類モデルは、その後、未知のサンプルを特定のクラスに分類し得る。クラスは、これと関連する特定の生物学的状態を有し、その人は特定の生物学的状態を有すると診断され得る。
【0082】
この方法は、臨床的用途に対して特定の使用を有する。例えば、薬剤発見のプロセスにおいて、候補分子が、生物学的システムにおいて特定の薬剤または薬剤のクラス(例えば、セラトニン再摂取阻害物質のクラス(seratonin re−uptake inhibitors))と生理学的に同じ結果を生成するか否かを決定することが所望される。薬剤または目的の薬剤のクラスに曝すことに基づいて、生物学的システムを判別する(例えば、人または試験用動物)分類モデルが最初に開発される。その後、生物学的システムは、試験分子に曝され、そしてシステムからのサンプルの質量スペクトルが生成される。このスペクトルは、その後、スペクトルが試験されている既知の薬剤または薬剤のグループの分類に属するか、または属さないと分類される。候補分子が、このクラスに割り当てられる場合、この情報は、薬剤に関するさらなる研究を実行するか否かを決定する際に有用である。
【0083】
別の用途において、種々の毒性および非毒性の種々の生物学的状態を区別する分類モデルが開発される。毒性状態は、例えば、薬剤または薬剤のクラスに曝すことから生じ得る。すなわち、分類モデルは、薬剤または薬剤のクラスが生物学的システムにおいて毒性反応を生成するか否かを示す分類モデルが開発され得る(例えば、肝毒性(liver toxicity)を含むインビボまたはインビトロのモデルシステム)。その後、開発中または臨床試験中の薬剤がシステムにおいて試験され得、このシステムからのサンプルのスペクトルは、毒性かそうでないか分類され得るか否かを決定する。この情報は、さらに、薬剤を開発する間の毒性の研究において有用である。
【0084】
別の用途において、特定の薬剤に対して反応する人か、または反応しない人かを判別する分類モデルが開発される。その後、反応者か非反応者かが知られていない人に薬剤を与える前に、その人からのサンプルが、質量分析器によって試験され、かつその薬剤に対する反応者か非反応者のクラスに割り当てられる。
【0085】
別の用途において、疾患を有する人と、その疾患を有しない人とを区別する分類モデルが開発される。その後、診断テストを受ける人は、分類を、疾患を有する状態および疾患を有しない状態に分類するためにサンプルを提供し得る。従って、この方法は、臨床診断のために有用である。
【0086】
一実施形態は、癌を分析するために向けられる。病理学者は、組織の外観によって癌を等級分けする。軽度の癌の特徴は、核/細胞質の比率の穏やかな増加、少数の有糸分割、穏やかな細胞の異質性、および概して正常な細胞構築の残留を有する拡大された核を含む。重度の癌の特徴は、高い核/細胞質の比率を有する拡大された奇妙な様相の核、有糸分割の数の増加(そのうちのいくつかは異型で現れ得る)、および正常な細胞構造とのわずかな類似または類似の欠如を含む。非疾患、軽度癌および重度癌の生物学的サンプルを区別する分類モデルを開発することは有用である。なぜなら、この診断は、多くの場合、治療的決定を指示し、かつ診断を予測し得るからである。サンプルは、固体組織バイオプシまたは疑われる病巣の細い針による吸引液であり得る。しかしながら、別の実施形態において、サンプルは、例えば、尿、血液または他の体液等、試験される個人のグループから比較的容易に収集される源から取り出され得る。これは、膀胱癌、前立腺癌および乳癌等の、これらの流体内に、細胞またはタンパク質を分泌する癌に特に有用である。これらの状態の分類モデルが構築されると、このモデルは、診断テストを受ける人からのサンプルを分類するために用いられ得る。別の用途において、病的でない特定の物理的または生理的素質を有する個人のクラス間を区別する分類モデルが開発される。その後、その素質を有することが知られていない個人は、その個人からのサンプルを試験することによって、およびスペクトルをその素質を有するクラスか、またはその素質を有するクラス外に分類することによって分類され得る。
【0087】
分類モデルは、さらに、未知のサンプルが、生物学的状態によって特徴付けられるクラスに属するものとして正確に分類される尤度を推定するためにも用いられ得る。例えば、分類および回帰ツリーにおいて、潜在的誤分類の尤度が決定され得る。例示的に、疾患状態と非疾患状態とを区別する分類および回帰ツリーモデルは、患者からの未知のサンプルを分類する。このモデルは、誤分類の尤度を評価し得る。例えば、疾患の誤分類の尤度が10%未満である場合、患者は、自分が疾患を有する可能性が90%であることを知らされ得る。
【0088】
(V.コンピュータにより読み出し可能な媒体を含むシステム)
本発明のいくつかの実施形態は、コンピュータによって読み出し可能な媒体を含むシステムに向けられる。コンピュータによって読み出し可能な媒体およびデジタルコンピュータを組み込む例示的システムのブロック図が図6に示される。システム70は、デジタルコンピュータ74に結合される質量分析器72を備える。ビデオディスプレイなどのディスプレイ76およびコンピュータによって読み出し可能な媒体78は、デジタルコンピュータ74に操作可能に結合され得る。ディスプレイ76は、デジタルコンピュータ74によって生成される出力を表示するために用いられ得る。コンピュータによって読み出し可能な媒体78は、デジタルコンピュータ74によって実行されるべき命令を格納するために用いられ得る。
【0089】
質量分析器は、デジタルコンピュータ74と操作上関連し得るが、このデジタルコンピュータ74と物理的または電気的に結合されない。例えば、質量分析器からのデータが取得され得(上述のように)、その後、このデータは、ヒューマンオペレータによって手動または自動でデジタルコンピュータ74に入力され得る。他の実施形態において、質量分析器72は、デジタルコンピュータ74にデータを自動的に送信し得、そこで、データは処理され得る。例えば、質量分析器72は、一つ以上の生物学的サンプルから生データを生成し得る(例えば、飛行時間データ)。このデータは、その後、デジタルコンピュータ74に送信され得、ここで、データは、前処理されるか、または処理され得る。データを処理するための命令は、コンピュータによって読み出し可能な媒体78から取得され得る。質量分析器からのデータが処理された後、出力が生成され、ディスプレイ76上に表示され得る。
【0090】
コンピュータによって読み出し可能な媒体78は、質量分析器72からのデータを処理するための任意の適切な命令を含み得る。例えば、コンピュータによって読み出し可能な媒体78は、未知の生物学的サンプルの質量スペクトルから取得されたデータをデジタルコンピュータ74に入力するためのコンピュータコードを含み得る。データは、その後、分類モデルを用いて処理され得る。分類モデルは、未知のサンプルが生物学的状態によって特徴付けられるクラスに正確に分類される尤度を推定し得る。
【0091】
ブロック図は、個別のブロックで、質量分析器72、デジタルコンピュータ74、ディスプレイ76およびコンピュータ読み出し可能媒体78を示すが、これらのコンポーネントの一つ以上は、同じかまたは異なったハウジング内に存在し得ることが理解される。例えば、いくつかの実施形態において、デジタルコンピュータ74およびコンピュータ読み出し可能媒体76は、同じハウジング内に存在し得るが、他方、質量分析器72およびディスプレイ76は、異なったハウジング内にある。さらに他の実施形態において、コンポーネントのすべて72、74、76、78は、単一ユニットに形成され得る。
【0092】
(例)
複数の質量スペクトルは、生物学的サンプルのセットの中の生物学的サンプルから発生する。そのセットは、普通の患者からの血清の第一クラスおよび前立腺癌を有する患者からの血清の第二クラスを含む。それぞれの患者からの血清サンプルは、California州FremontのCiphergen Biosystems Inc.で商業的に入手可能な表面活性化レーザ吸収イオン化システムを介して取得される。Ciphergen BiosystemのProteinChip(R)技術もまた、この例において使用される。ProteinChip(R)についてのさらなる詳細は、ウェブサイトwww.ciphergen.comで見つけられ得る。それぞれのサンプルの出力の結果は、質量電荷比に対する信号強度の質量スペクトルプロットである。ディスクリートなピークは質量スペクトルの信号を表わしている。
【0093】
特定の質量電荷比での信号強度は、特定の質量電荷比を有するタンパク質の量に対応する。例えば、高い信号強度は、タンパク質が高濃度であることを示す。それぞれの質量スペクトルでの信号は、配置され、定量化され、そして選択される。この例において、質量スペクトルの部分が、周囲のノイズレベルの少なくとも二倍の強度値を有する場合、これらは、受け入れ可能な信号と考えられる。ほぼ同じ質量電荷比における質量スペクトルでの信号は、全ての質量スペクトルにおいてクラスタ化される。クラスタ化された後、およそ250個の信号クラスタは識別され、P1からP250と名付けられる。それぞれの信号クラスタ、P1からP250は、特定の質量電荷比に対応し、「予測変数(predictor variable)」として特性を示す。
【0094】
それぞれの質量スペクトルに対する識別された質量電荷比での信号強度は、既知のデータセットを形成する。これらの信号強度は、Salford System,Inc(www.salford‐systems.com)で商業的に入手可能な、分類ツリーおよび回帰ツリープログラム、CART4.0に入力される。そのプログラムはデジタルコンピュータによって実行される。そのデジタルコンピュータは、分類ツリーおよび回帰ツリーを形成する。そのデータを使用することにより、それぞれのサンプルは、普通または癌として分類される。
【0095】
質量スペクトルデータが入力された後、デジタルコンピュータは図6に示されるようなツリーを生成する。この例において、クラス0が正常でクラス1が癌である。それぞれの質量スペクトルは、そのツリーで分類される「事例」として特徴付けられ得る。
【0096】
ツリー内のそれぞれのボックスは、「ノード」を表わす。頂上のノード、ノード1は、ルートノードと呼ばれる。決定ツリーは、ルートノードから成長し、新しいノードを形成するために、それぞれのレベルにデータを分割する。枝は新しいノードに結合する。それ以上分割しないノードは、端末ノード(terminal nodes)と名付けられる。図6に示されたツリーの端末ノードは、端末ノード1〜7と名付けられる。以下にさらに詳細に説明されるように、端末ノード1〜7は、未知のサンプルを分類するために使用され、従って、予測のために使用され得る。
【0097】
それぞれのノードにおいて、全体のノードに対し、過半数が、その分類として確定される。例えば、端末ノード1は、4人の患者を有する。これらの4人の患者は、全員癌を持っている。端末ノード1は、それ故、癌ノードとして特徴づけられる。全ての事例は、同じ値(癌)を有するため、このノードは、「純粋」として特徴付けられ、もはや分割されない。この端末ノード1が3人の癌患者および1人の普通の患者を含む場合、そのノードは、患者の過半数が癌患者であるので、やはり癌ノードとして特徴付けられる。この例において、1人の普通の患者は、間違って分類されたと考えられる。
【0098】
図6において、それぞれのノードは、そのノードに対する事例の数および生物学的なの状態(癌)の分布についての情報を含む。ルートノード(ノード1)での事例は、質量スペクトルデータセットの全事例である。ノード1は、194個の事例を含み、そのうちの96個が普通で、98個が癌である。ノード1は二つの新しいノード(ノード2およびノード5)に分けられる。その分割されるデータは、クラスタP127に対する信号強度の平均が、3.2946以下であるかどうかを判定し、決定される。平均信号強度およびその値3.2946が相対的な大きさである。この問い合わせに対する答えがイエスの場合、続いて対応する事例がノード2に配置される。この問い合わせに対する答えがノーならば、続いて、対応する事例がノード5に配置される。この例において、85人の癌患者および11人の普通の患者の質量スペクトルは、予測変数P127と関連する質量電荷比において、3.2946以下の信号強度を有し、ノード2に配置される。85人の普通の患者および13人の癌患者の質量スペクトルは、予測変数P127と関連する質量電荷比において3.2946以上の信号強度を有し、ノード5に配置される。ツリーを形成するために、異なる分割基準を用いて同様に分類することが、他のノードにて起こる。
【0099】
分類ツリーおよび回帰ツリーのプリデクタ動作は、表1および表2を参照することにより示され得る。
【0100】
【表1】
分類ツリーおよび回帰ツリープログラムは、既知のデータセットを二つのグループに分ける。データのおよそ90%が、学習セットとして使用され、およそ10%が試験セットとして使用される。分類ツリーおよび回帰ツリーは初期に学習セットデータを使用して形成される。ツリーが形成された後、どのように分類ツリーおよび回帰ツリーが、正確にデータを分類するかを見るために、残りの10%の試験データで試験される。表1を参照することにより、全ての学習セットデータは、形成された分類ツリーおよび回帰ツリーを使用して正しく分類される。表2を参照することで、普通のケースおよび癌のケースの試験データを分類するための百分率エラー比は、それぞれ9.38%および11.22%である。逆に、分類成功比率は、普通の場合と癌の場合に対し、それぞれ90.62%および88.78%である。
【0101】
これらのような分類成功比率は、分類ツリーおよび回帰ツリーが未知の生物学的サンプルを分類するためのかなり正確なモデルである。その分類プロセスにおいて、複数の予測変数は、分類スキームで考察される。試験患者を分類するために一つの質量電荷比における信号強度の平均を使用するのみである既に記述した差分分析手続きに比べて、より多数のデータが、質量スペクトルと関連するサンプルを分類するために質量スペクトルから使用され得る。従って、分類モデルは、試験患者を分類する中で多くの従来の分類モデルよりもより正確になり得る。
【0102】
一度成長すれば、そのツリーは、ツリーのルート(頂上)にて始まり、そして端末ノードに出会うまで、枝にしたがって経路を下り続けることによって、未知のサンプルを分類することに使用される。その経路は、未知のサンプルの質量スペクトルに対し、予測変数の値に依存する分割規則を課すことによって判定される。例えば、試験患者からの未知の血清のサンプルの質量スペクトルが、それぞれプリデクタ値P127,P193およびP187の質量電荷比にて1.0,0.05および0.9の強度の信号を有する場合、その試験患者は、ノード1、ノード2、ノード3および最後の端末ノード1に分類される。端末ノード1は、癌ノードであり、その患者は癌患者であるとして分類される。
【0103】
図7は、予測変数(例えば、信号クラスタ)のいくつかの各々に対する変数の重要性における表である。その変数の重要性における表は、それらが分類ツリーおよび回帰ツリーを構築するために、どのように役に立つかによって予測変数を評価する。特定の予測変数が質量スペクトルデータを厳しく識別する場合、それは、分類ツリーを構築することにおいて、重要である。重要度変数スコアを計算するために、CARTは、主要な分割の代理としての役割であるそれぞれの変数に起因する改良尺度を見る。これらの改良の値は、それぞれのノードおよび全てにわたって加算され、かつ合計され、そして、最も良く実行される変数に関連してスケール変換される。改良の最も高い合計値を有する変数は、スコア100であり、全ての他の変数は、ゼロに向かって下の方の範囲の低いスコアを有する。
【0104】
図7において、分類モデルは、予測変数P36、P127およびP90が、分類ツリーおよび回帰ツリーを形成することにおいて他の予測変数よりもより重要であるということを示す。結果としてそれらはクラス間(癌および非癌)での識別において他の予測変数よりも重要である。これらの予測変数に関連する質量電荷比はまた、非前立腺癌サンプルから、前立腺癌サンプルを識別する潜在性マーカに対応する。従って、分類モデルは、分析されているクラス間を識別し得る一つ以上のマーカを識別するために利用され得る。
【0105】
ツリーモデルの有効性は、図8および図9を参照することにより確認され得る。図8の図は、ゲルビュー(gel view)で、一方、図9の図はトレースビューである。そのスペクトルは、5075ダルトン(電荷=+1)の質量電荷比にてP127を意味する信号を拡大表示したものである。図8および図9は、6人の前立腺癌の患者および6人の非前立腺癌の患者からのサンプルのマーカが予測変数P127に対応する5075個のダルトンの質量値にて、区別をつけて表わされたものである。図6のツリーを示すことにより、予測変数P127は、ほとんどの他の予測変数よりも、サンプルの非前立腺癌患者クラスからサンプルの前立腺癌クラスを識別することが、より効率的になることが示される。
【0106】
上述は、本発明の特定の好ましい実施形態を方向付けるものであるが、本発明の他のおよびさらなる実施形態は、本発明の基本的な範囲から逸脱することなし派生される。そのように代替の実施形態は、本発明の範囲に含まれることが意図される。さらに、本発明の一つ以上の実施形態の特徴は、本発明の範囲から逸脱することなしに本発明の他の実施形態の一つ以上の特徴と組み合わされ得る。
【0107】
本願で引用された全ての公報(例えば、ウェブサイト)および特許書類は、それぞれの個々の公報または特許書類個々に示されているのと同じ程度に全ての目的に対して参考として援用される。本明細書における様々な文献の引用によっても出願人は、任意の特定の文献が本発明に対する「従来技術」であることを認めるものではない。
【図面の簡単な説明】
【図1A】
図1Aは、疾患患者からのサンプルの重なり合った質量スペクトルを示す。
【図1B】
図1Bは、正常の患者からのサンプルの重なり合った質量スペクトルを示す。
【図2】
図2は、本発明の実施形態による質量スペクトルを作成する方法のフロー図を示す。
【図3】
図3は、識別されたピーククラスタの関数として正規化された強度の対数のグラフを示す。サンプルの二つの異なる群からの質量スペクトルによる信号強度は、グラフの中で示される。
【図4】
図4は、本発明の実施形態によるいくつかの好適な質量スペクトルの前処理の手続を示すフロー図を示す。
【図5】
図5は、本発明の実施形態によるいくつかの好適な質量スペクトルの前処理手続、および分類モデルの形成手続を示すフロー図を示す。
【図6】
図6は、本発明の実施形態によるシステムのブロック図を示す。
【図7】
図7は、本発明の実施形態による分類および回帰ツリーを示す。
【図8】
図8は、異なる予測変数の重要度変数を示す表を示す。
【図9】
図9は、癌患者および正常の患者からの異なるサンプルによって得られたゲルビューを示す。
【図10】
図10は、癌患者および正常の患者からの異なるサンプルによって得られたスペクトルデータを示す。
Claims (39)
- デジタルコンピュータを用いる質量スペクトルを分析する方法であって、該方法は、
a)複数のサンプルからの質量スペクトルから得られるデータセットをデジタルコンピュータに入力する工程であって、各サンプルは、二つ以上のクラスを含むクラスセット内のクラスにあるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、飛行時間、質量電荷比、あるいは飛行時間または質量電荷比から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、工程と、
b)該クラスセットの該クラスを区別する分類モデルを形成する工程であって、該形成する工程は、分類プロセスを実現するコードを実行することによって該データセットを分析する工程を含む、工程と
を包含する、方法。 - 前記質量分析は、MALDIスペクトル、表面を活性化するレーザ脱離基/イオン化スペクトル、およびエレクトロスプレーイオン化スペクトルからなる群から選択される、請求項1に記載の方法。
- 前記クラスセットは、正確に、二つのクラスからなる、請求項1に記載の方法。
- 前記サンプルは、ポリペプチドおよび核酸からなる群から選択される生体分子を含む、請求項1に記載の方法。
- 前記サンプルは、真核生物、原核生物、またはウイルスから派生する、請求項1に記載の方法。
- 前記異なる生物学的状態は、正常状態および病理学的状態を含む、請求項1に記載の方法。
- 前記異なる生物学的状態は、非疾患軽度の癌および重度の癌を含む、請求項1に記載の方法。
- 前記異なる生物学的状態は、薬物療法の状態および非薬物療法の状態を含む、請求項1に記載の方法。
- 前記異なる生物学的状態は、薬物反応状態および薬物無反応状態を含む、請求項1に記載の方法。
- 前記異なる生物学的状態は、中毒状態および非中毒状態を含む、請求項1に記載の方法。
- 前記中毒状態は、薬物に曝すことから生じる、請求項10に記載の方法。
- 前記データセットは、既知のデータセットであり、各サンプルは、該データセットが前記デジタルコンピュータに入力される以前に前記クラスの一つに割り当てられる、請求項1に記載の方法。
- 前記分類モデルを形成する工程は、該分類モデルを形成するために既存のマーカを用いる工程を含む、請求項1に記載の方法。
- 前記データセットが、 前記質量スペクトルの信号を検出する工程であって、各質量スペクトルは、前記質量電荷比の関数として信号強度を表すデータを含む、工程と、
類似の質量電荷比を有する該信号を信号クラスタにクラスタ化する工程と、
所定の値以上の信号強度を有する少なくとも所定数の信号を有する信号クラスタを選択する工程と、
該選択された信号クラスタに対応する該質量電荷比を識別する工程と、
該識別された質量電荷比における信号強度を用いて該データセットを形成する工程と
によって形成される、請求項1に記載の方法。 - 前記分類モデルを形成する工程は、前記異なる生物学的状態を区別する特徴を識別する工程、および学習する工程の少なくとも一つを含む、請求項1に記載の方法。
- 前記分類プロセスは、神経回路網解析を含む、請求項1に記載の方法。
- c)一つ以上の特徴が前記異なる生物学的状態を区別するかどうかを判別するために前記分類モデルに問い合わす工程をさらに含む、請求項1に記載の方法。
- c)さらに大量のサンプルを用いてa)およびb)を繰り返す工程をさらに含む、請求項1に記載の方法。
- 前記分類プロセスはクラスタ分析である、請求項1に記載の方法。
- 前記データセットを形成する工程をさらに含み、該データセットを形成する工程は、前記質量スペクトルから生データを取得する工程と、次に、該データセットを形成するために該生の質量スペクトルデータを前処理する工程とを包含する、請求項1に記載の方法。
- 前記異なるクラスは、薬物に曝すこと、一つのクラスの中の一つの薬物に曝すこと、および薬物または一つのクラスの中の一つの薬物に曝す不足から選択される、請求項1に記載の方法。
- 前記各質量スペクトルは質量電荷比の関数または質量電荷比から導出された値としての信号強度を表すデータを含む、請求項1に記載の方法。
- デジタルコンピュータを用いて生物学的状態によって特徴付けられたクラスに未知のサンプルを分類する方法であって、該方法は、
a)該未知のサンプルの質量スペクトルから得られたデータを該デジタルコンピュータに入力する工程と、
b)請求項1の方法によって形成された分類モデルを用いて該質量スペクトルを処理して、該生物学的状態によって特徴付けられたクラスに該未知のサンプルを分類する工程と
を包含する、方法。 - 前記クラスは、疾患状態によって特徴付けられる、請求項23に記載の方法。
- 前記異なる生物学的状態は、非疾患の軽度の癌および重度の癌を含む、請求項23に記載の方法。
- 前記クラスは、一つのクラスの薬物のうちの一つの薬物を投与することによって特徴付けられる、請求項23に記載の方法。
- 前記クラスは、薬物反応によって特徴付けられる、請求項23に記載の方法。
- 前記クラスは、中毒状態によって特徴付けられる、請求項23に記載の方法。
- 未知のサンプルが、デジタルコンピュータを用いて生物学的状態によって特徴付けられるクラスに属するように正確に分類される尤度を推定する方法であって、該方法は、
a)該未知のサンプルの質量スペクトルから得られたデータをデジタルコンピュータに入力する工程と、
b)請求項1の方法によって形成された前記分類モデルを用いて該質量スペクトルデータを処理して、該未知のサンプルが生物学的状態によって特徴付けられるクラスに正確に分類される尤度を推定する工程と
を包含する、方法。 - コンピュータ読み出し可能媒体であって、
a)未知のサンプルの質量スペクトルから得られたデータをデジタルコンピュータに入力するためのコードと、
b)請求項1の方法によって形成された前記分類モデルを用いて該質量スペクトルを処理して、生物学的状態によって特徴付けられたクラスに該未知のサンプルを分類するためのコードと を含む、コンピュータ読み出し可能媒体。 - 気相イオン分析器と、 該気相イオン分析器からのデータを処理するように適応されたデジタルコンピュータと、
該デジタルコンピュータと操作上関連する、請求項29のコンピュータ読み出し可能媒体と
を含む、システム。 - 前記気相イオン分析器は、レーザ脱離イオン化プロセスを実行するように適応される、請求項30に記載のシステム。
- コンピュータ読み出し可能媒体であって、
a)未知のサンプルの質量スペクトルから得られたデータをデジタルコンピュータに入力するためのコードと、
b)請求項1の方法によって形成された前記分類モデルを用いて該質量スペクトルデータを処理して、該未知のサンプルが生物学的状態によって特徴付けられるクラスに正確に分類される尤度を推定するためのコードと
を含む、コンピュータ読み出し可能媒体。 - 気相イオン分析器と、 該気相イオン分析器からのデータを処理するように適応されたデジタルコンピュータと、
該デジタルコンピュータと操作上関連する、請求項32のコンピュータ読み出し可能媒体と
を含む、システム。 - 前記気相イオン分析器は、レーザ脱離イオン化プロセスを実行するように適応される、請求項33に記載のシステム。
- コンピュータ読み出し可能媒体であって、
a)複数のサンプルからの質量スペクトルから導出されたデータを入力するためのコードであって、各サンプルは、二つ以上のクラスのクラスセット内のクラスであるか、または割り当てられ、各クラスは異なる生物学的状態によって特徴付けられ、各質量スペクトルは、飛行時間、質量電荷比、あるいは飛行時間または質量電荷比から導出された値の関数として信号強度を表すデータを含み、レーザイオン化脱離プロセスを用いて生成される、コードと、
b)分類プロセスを用いて分類モデルを形成するためのコードであって、該分類モデルは、該クラスセットにおいて該クラスを区別する、コードと
を含むコンピュータ読み出し可能媒体。 - 前記分類プロセスは、神経回路網解析を含む、請求項35に記載のコンピュータ読み出し可能媒体。
- 気相イオン分析器と、 該気相イオン分析器からのデータを処理するように適応されたデジタルコンピュータと、 該デジタルコンピュータと操作上関連する、請求項35のコンピュータ読み出し可能媒体と
を含む、システム。 - 前記気相イオン分析器は、レーザ脱離イオン化プロセスを実行するように適応される、請求項37に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US24983500P | 2000-11-16 | 2000-11-16 | |
US25474600P | 2000-12-11 | 2000-12-11 | |
PCT/US2001/044972 WO2003031031A1 (en) | 2000-11-16 | 2001-11-15 | Method for analyzing mass spectra |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004522980A true JP2004522980A (ja) | 2004-07-29 |
JP2004522980A5 JP2004522980A5 (ja) | 2005-04-07 |
Family
ID=26940382
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002544625A Pending JP2004536276A (ja) | 2000-11-16 | 2001-11-15 | 質量スペクトルを分析する方法 |
JP2003534055A Pending JP2004522980A (ja) | 2000-11-16 | 2001-11-15 | 質量スペクトルを分析する方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002544625A Pending JP2004536276A (ja) | 2000-11-16 | 2001-11-15 | 質量スペクトルを分析する方法 |
Country Status (8)
Country | Link |
---|---|
US (2) | US6675104B2 (ja) |
EP (2) | EP1355727A4 (ja) |
JP (2) | JP2004536276A (ja) |
CN (2) | CN1623091A (ja) |
AT (1) | ATE540421T1 (ja) |
AU (3) | AU2002245043B2 (ja) |
CA (2) | CA2429633A1 (ja) |
WO (2) | WO2002042733A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7316931B2 (en) | 2000-10-19 | 2008-01-08 | Target Discovery, Inc. | Mass defect labeling for the determination of oligomer sequences |
JP2016224031A (ja) * | 2015-04-22 | 2016-12-28 | ザ・ボーイング・カンパニーThe Boeing Company | フォービエイテッド圧縮投影を用いたハイパースペクトルデミキシング |
JP2017224283A (ja) * | 2016-06-09 | 2017-12-21 | 株式会社島津製作所 | ビッグデータ解析方法及び該解析方法を利用した質量分析システム |
Families Citing this family (210)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7617163B2 (en) * | 1998-05-01 | 2009-11-10 | Health Discovery Corporation | Kernels and kernel methods for spectral data |
US11026768B2 (en) | 1998-10-08 | 2021-06-08 | Align Technology, Inc. | Dental appliance reinforcement |
WO2001099043A1 (en) | 2000-06-19 | 2001-12-27 | Correlogic Systems, Inc. | Heuristic method of classification |
KR101054732B1 (ko) * | 2000-07-18 | 2011-08-05 | 더 유나이티드 스테이츠 오브 아메리카 애즈 리프리젠티드 바이 더 세크레터리 오브 더 디파트먼트 오브 헬쓰 앤드 휴먼 써비시즈 | 생물학적 데이터의 숨겨진 패턴에 근거한 생물학적 상태의 식별 방법 |
US8463718B2 (en) * | 2000-08-07 | 2013-06-11 | Health Discovery Corporation | Support vector machine-based method for analysis of spectral data |
US6539102B1 (en) * | 2000-09-01 | 2003-03-25 | Large Scale Proteomics | Reference database |
US6980674B2 (en) * | 2000-09-01 | 2005-12-27 | Large Scale Proteomics Corp. | Reference database |
US20050009120A1 (en) * | 2000-09-07 | 2005-01-13 | The Brigham And Women's Hospital, Inc. | Methods of detecting ovarian cancer based on osteopontin |
US6846642B2 (en) * | 2000-09-07 | 2005-01-25 | The Brigham And Women's Hospital, Inc. | Methods of detecting cancer based on prostasin |
CA2429633A1 (en) * | 2000-11-16 | 2002-05-30 | Ciphergen Biosystems, Inc. | Method for analyzing mass spectra |
US20020115056A1 (en) * | 2000-12-26 | 2002-08-22 | Goodlett David R. | Rapid and quantitative proteome analysis and related methods |
US20030009293A1 (en) * | 2001-01-09 | 2003-01-09 | Anderson Norman G. | Reference database |
US20020155587A1 (en) * | 2001-04-20 | 2002-10-24 | Sequenom, Inc. | System and method for testing a biological sample |
US20020184569A1 (en) * | 2001-04-25 | 2002-12-05 | O'neill Michael | System and method for using neural nets for analyzing micro-arrays |
US20040198950A1 (en) * | 2001-04-30 | 2004-10-07 | George Jackowski | Biopolymer marker indicative of disease state having a molecular weight of 1518 daltons |
US20050170372A1 (en) * | 2001-08-13 | 2005-08-04 | Afeyan Noubar B. | Methods and systems for profiling biological systems |
IL160324A0 (en) * | 2001-08-13 | 2004-07-25 | Beyond Genomics Inc | Method and system for profiling biological systems |
US20050106624A1 (en) * | 2001-09-25 | 2005-05-19 | Kazuki Sasaki | Search for cancer markers by a novel screening method |
US20020193950A1 (en) * | 2002-02-25 | 2002-12-19 | Gavin Edward J. | Method for analyzing mass spectra |
US20050164197A1 (en) * | 2002-04-19 | 2005-07-28 | In-San Kim | Method for measuring the amount of betaig-h3 protein and diagnostic kit using the same |
US20030204507A1 (en) * | 2002-04-25 | 2003-10-30 | Li Jonathan Qiang | Classification of rare events with high reliability |
JP2005526972A (ja) * | 2002-05-02 | 2005-09-08 | シファーゲン バイオシステムズ, インコーポレイテッド | 多糖系ヒドロゲルをコーティングした表面を有するバイオチップ |
US20040052412A1 (en) * | 2002-05-10 | 2004-03-18 | Large Scale Biology Corporation | Satellite image enhancement and feature identification using information theory radial-basis bio-marker filter |
GB0305796D0 (en) * | 2002-07-24 | 2003-04-16 | Micromass Ltd | Method of mass spectrometry and a mass spectrometer |
AU2003268031A1 (en) * | 2002-07-29 | 2004-02-16 | Correlogic Systems, Inc. | Quality assurance/quality control for electrospray ionization processes |
DK1540010T3 (da) | 2002-08-06 | 2010-07-26 | Univ Johns Hopkins | Anvendelse af biomarkører til påvisning af ovariecancer |
MXPA05005031A (es) | 2002-11-12 | 2005-11-17 | Becton Dickinson Co | Diagnostico de la sepsis o sirs usando perfiles de biomarcadores. |
MXPA05005073A (es) * | 2002-11-12 | 2005-11-17 | Becton Dickinson Co | Diagnostico de la sepsis o sirs usando perfiles de biomarcadores. |
CA2505843A1 (en) * | 2002-11-12 | 2004-05-27 | Becton, Dickinson And Company | Diagnosis of sepsis or sirs using biomarker profiles |
EP1573044A4 (en) | 2002-12-18 | 2006-07-05 | Ciphergen Biosystems Inc | SERUM BIOMARKERS OF LUNG CANCER |
US8010296B2 (en) * | 2002-12-19 | 2011-08-30 | Drexel University | Apparatus and method for removing non-discriminatory indices of an indexed dataset |
US7288383B2 (en) * | 2003-01-15 | 2007-10-30 | The Brigham And Women's Hospital, Inc. | Eosinophil-derived neurotoxin as a marker for ovarian cancer |
US20040162712A1 (en) * | 2003-01-24 | 2004-08-19 | Icagen, Inc. | Method for screening compounds using consensus selection |
US6909981B2 (en) * | 2003-01-27 | 2005-06-21 | Ciphergen Biosystems, Inc. | Data management system and method for processing signals from sample spots |
DE10304106A1 (de) * | 2003-01-31 | 2004-08-26 | Mosaiques Diagnostics And Therapeutics Ag | Verfahren und Vorrichtung zur qualitativen und/oder quantitativen Bestimmung eines Protein- und/oder Peptidmusters einer Flüssigkeitsprobe, die dem menschlichen oder tierischen Körper entnommen wird |
US20050085740A1 (en) * | 2003-04-01 | 2005-04-21 | Davis Cristina E. | Non-invasive breath analysis using field asymmetric ion mobility spectrometry |
US7470898B2 (en) * | 2003-04-01 | 2008-12-30 | The Charles Stark Draper Laboratory, Inc. | Monitoring drinking water quality using differential mobility spectrometry |
US6906320B2 (en) * | 2003-04-02 | 2005-06-14 | Merck & Co., Inc. | Mass spectrometry data analysis techniques |
US6977370B1 (en) | 2003-04-07 | 2005-12-20 | Ciphergen Biosystems, Inc. | Off-resonance mid-IR laser desorption ionization |
US20040236603A1 (en) * | 2003-05-22 | 2004-11-25 | Biospect, Inc. | System of analyzing complex mixtures of biological and other fluids to identify biological state information |
US7425700B2 (en) | 2003-05-22 | 2008-09-16 | Stults John T | Systems and methods for discovery and analysis of markers |
US20050255606A1 (en) * | 2004-05-13 | 2005-11-17 | Biospect, Inc., A California Corporation | Methods for accurate component intensity extraction from separations-mass spectrometry data |
WO2004111609A2 (en) * | 2003-06-12 | 2004-12-23 | Predicant Biosciences, Inc. | Methods for accurate component intensity extraction from separations-mass spectrometry data |
US7072772B2 (en) * | 2003-06-12 | 2006-07-04 | Predicant Bioscience, Inc. | Method and apparatus for modeling mass spectrometer lineshapes |
CN1304843C (zh) * | 2003-07-02 | 2007-03-14 | 许洋 | 用于生物样品分析的蛋白指纹法 |
WO2005008247A2 (en) * | 2003-07-11 | 2005-01-27 | Science & Technology Corporation @ Unm. | Detection of endometrial pathology |
US20050048547A1 (en) * | 2003-07-17 | 2005-03-03 | Hongyu Zhao | Classification of disease states using mass spectrometry data |
AU2004261222A1 (en) * | 2003-08-01 | 2005-02-10 | Correlogic Systems, Inc. | Multiple high-resolution serum proteomic features for ovarian cancer detection |
US7858071B2 (en) * | 2003-10-23 | 2010-12-28 | University of Pittsburgh—of the Commonwealth System of Higher Education | Biomarkers for amyotrophic lateral sclerosis |
EP2369348A1 (en) | 2003-11-07 | 2011-09-28 | Ciphergen Biosystems, Inc. | Biomarkers for Alzheimer's disease |
KR20070012320A (ko) * | 2003-11-12 | 2007-01-25 | 리 마오 | 상부 호흡소화관암 예측법 |
ATE525478T1 (de) | 2003-12-05 | 2011-10-15 | Univ Mcgill | Serumbiomarker für morbus chagas |
US7761239B2 (en) * | 2003-12-11 | 2010-07-20 | Correlogic Systems, Inc. | Method of diagnosing biological states through the use of a centralized, adaptive model, and remote sample processing |
US8012693B2 (en) | 2003-12-16 | 2011-09-06 | 3M Innovative Properties Company | Analysis of chemically crosslinked cellular samples |
JP4069867B2 (ja) * | 2004-01-05 | 2008-04-02 | セイコーエプソン株式会社 | 部材の接合方法 |
JP2007523323A (ja) | 2004-01-30 | 2007-08-16 | サイファージェン バイオシステムズ インコーポレイテッド | スペクトルにおけるシグナルをクラスタにする方法 |
US20070087448A1 (en) * | 2004-02-16 | 2007-04-19 | Nelsestuen Gary L | Biological profiles and methods of use |
US9492245B2 (en) | 2004-02-27 | 2016-11-15 | Align Technology, Inc. | Method and system for providing dynamic orthodontic assessment and treatment profiles |
US7987099B2 (en) * | 2004-02-27 | 2011-07-26 | Align Technology, Inc. | Dental data mining |
US8874452B2 (en) | 2004-02-27 | 2014-10-28 | Align Technology, Inc. | Method and system for providing dynamic orthodontic assessment and treatment profiles |
US7904308B2 (en) | 2006-04-18 | 2011-03-08 | Align Technology, Inc. | Method and system for providing indexing and cataloguing of orthodontic related treatment profiles and options |
US11298209B2 (en) | 2004-02-27 | 2022-04-12 | Align Technology, Inc. | Method and system for providing dynamic orthodontic assessment and treatment profiles |
WO2005098446A2 (en) | 2004-03-31 | 2005-10-20 | The Johns Hopkins University | Biomarkers for ovarian cancer |
EP2189802B1 (en) | 2004-04-01 | 2014-05-14 | Liposcience, Inc. | NMR clinical analyzers and related methods, systems, modules and computer program products for clinical evaluation biosamples |
AU2005236075A1 (en) | 2004-04-26 | 2005-11-03 | Children's Medical Center Corporation | Platelet biomarkers for the detection of disease |
US20050244973A1 (en) * | 2004-04-29 | 2005-11-03 | Predicant Biosciences, Inc. | Biological patterns for diagnosis and treatment of cancer |
US20050269508A1 (en) * | 2004-06-03 | 2005-12-08 | Lippa Timothy P | Apparatus and methods for detecting compounds using mass spectra |
US20060003204A1 (en) * | 2004-07-01 | 2006-01-05 | Callahan Christopher W | Controlling fuel cell fuel purge in response to recycle fuel blower operating conditions |
US7430479B1 (en) * | 2004-08-17 | 2008-09-30 | Science Applications International Corporation | System and method for analyzing content data |
WO2006027321A1 (en) * | 2004-09-09 | 2006-03-16 | Universite De Liege | Identification and use of biomarkers for the diagnosis and the prognosis of inflammatory diseases. |
US7197402B2 (en) * | 2004-10-14 | 2007-03-27 | Highchem, Ltd. | Determination of molecular structures using tandem mass spectrometry |
WO2006071469A2 (en) * | 2004-12-02 | 2006-07-06 | University Of Pittsburgh-Of The Commonwealth System Of Higher Education | Modulation of the neuroendocrine system as a therapy for amyotrophic lateral sclerosis |
US20060121619A1 (en) * | 2004-12-02 | 2006-06-08 | University Of Pittsburgh Of The Commonwealth System Of Higher Education | Protein biomarkers and therapeutic targets in an animal model for amyotrophic lateral sclerosis |
EP1838867B1 (en) * | 2005-01-06 | 2011-03-09 | Eastern Virginia Medical School | Apolipoprotein a-ii isoform as a biomarker for prostate cancer |
US7356521B2 (en) * | 2005-01-14 | 2008-04-08 | Siemens Medical Solutions Usa, Inc. | System and method for automatic molecular diagnosis of ALS based on boosting classification |
US20060157647A1 (en) * | 2005-01-18 | 2006-07-20 | Becton, Dickinson And Company | Multidimensional liquid chromatography/spectrometry |
WO2006083853A2 (en) * | 2005-01-31 | 2006-08-10 | Insilicos, Llc | Methods of identification of biomarkers with mass spectrometry techniques |
WO2007053170A2 (en) * | 2005-02-09 | 2007-05-10 | Correlogic Systems, Inc. | Identification of bacteria and spores |
CA2605143A1 (en) | 2005-04-15 | 2006-10-26 | Becton, Dickinson And Company | Diagnosis of sepsis |
US20080312514A1 (en) * | 2005-05-12 | 2008-12-18 | Mansfield Brian C | Serum Patterns Predictive of Breast Cancer |
US7161147B1 (en) * | 2005-05-20 | 2007-01-09 | Academia Sinica | Biological whole cell mass spectrometer |
WO2006130983A1 (en) * | 2005-06-08 | 2006-12-14 | Mds Inc. Doing Business Through Its Mds Sciex Division | Dynamic background signal exclusion in chromatography/mass spectrometry data-dependent data acquisition |
US20110177492A1 (en) * | 2005-06-16 | 2011-07-21 | 3M Innovative Properties Company | Method of classifying chemically crosslinked cellular samples using mass spectra |
EP1896493A1 (en) | 2005-06-17 | 2008-03-12 | North Carolina A & T State University | A device including a proteinaceous factor, a recombinant proteinaceous factor, and a nucleotide sequence encoding the proteinaceous factor |
EP1904852A2 (en) | 2005-06-24 | 2008-04-02 | Ciphergen Biosystems, Inc. | Biomarkers for ovarian cancer: beta-2 microglobulin |
GB0514553D0 (en) * | 2005-07-15 | 2005-08-24 | Nonlinear Dynamics Ltd | A method of analysing a representation of a separation pattern |
GB0514555D0 (en) | 2005-07-15 | 2005-08-24 | Nonlinear Dynamics Ltd | A method of analysing separation patterns |
US20090215086A1 (en) * | 2005-12-12 | 2009-08-27 | Momar Ndao | Biomarkers for Babesia |
US7867719B2 (en) | 2006-03-11 | 2011-01-11 | Vermillion, Inc. | Beta-2 microglobulin as a biomarker for peripheral artery disease |
US7756646B2 (en) * | 2006-03-31 | 2010-07-13 | Battelle Memorial Institute | Method for predicting peptide detection in mass spectrometry |
US7736905B2 (en) * | 2006-03-31 | 2010-06-15 | Biodesix, Inc. | Method and system for determining whether a drug will be effective on a patient with a disease |
US8518926B2 (en) * | 2006-04-10 | 2013-08-27 | Knopp Neurosciences, Inc. | Compositions and methods of using (R)-pramipexole |
ATE537826T1 (de) | 2006-05-16 | 2012-01-15 | Knopp Neurosciences Inc | Zusammensetzungen aus r(+)- und s(-)-pramipexol sowie verfahren zu ihrer anwendung |
WO2007140327A2 (en) * | 2006-05-26 | 2007-12-06 | Waters Investments Limited | Ion detection and parameter estimation for n-dimensional data |
US7702689B2 (en) * | 2006-07-13 | 2010-04-20 | Sap Ag | Systems and methods for querying metamodel data |
US8524695B2 (en) * | 2006-12-14 | 2013-09-03 | Knopp Neurosciences, Inc. | Modified release formulations of (6R)-4,5,6,7-tetrahydro-N6-propyl-2,6-benzothiazole-diamine and methods of using the same |
WO2008100941A2 (en) * | 2007-02-12 | 2008-08-21 | Correlogic Systems Inc. | A method for calibrating an analytical instrument |
US8519148B2 (en) | 2007-03-14 | 2013-08-27 | Knopp Neurosciences, Inc. | Synthesis of chirally purified substituted benzothiazole diamines |
JP2010522882A (ja) | 2007-03-27 | 2010-07-08 | ヴァーミリオン インコーポレイテッド | 卵巣癌のバイオマーカー |
WO2008141275A1 (en) | 2007-05-11 | 2008-11-20 | The Johns Hopkins University | Biomarkers for melanoma |
US7878805B2 (en) | 2007-05-25 | 2011-02-01 | Align Technology, Inc. | Tabbed dental appliance |
MY150234A (en) | 2007-06-29 | 2013-12-31 | Ahn Gook Pharmaceutical Company Ltd | Predictive markers for ovarian cancer |
WO2009058331A2 (en) | 2007-10-29 | 2009-05-07 | Vermilllion, Inc. | Biomarkers for the detection of early stage ovarian cancer |
US8738394B2 (en) | 2007-11-08 | 2014-05-27 | Eric E. Kuo | Clinical data file |
US8108189B2 (en) | 2008-03-25 | 2012-01-31 | Align Technologies, Inc. | Reconstruction of non-visible part of tooth |
JP5072682B2 (ja) * | 2008-03-28 | 2012-11-14 | 富士フイルム株式会社 | 質量分析用デバイス、これを用いる質量分析装置および質量分析方法 |
WO2009123737A2 (en) | 2008-04-03 | 2009-10-08 | Becton, Dickinson And Company | Advanced detection of sepsis |
US7776522B2 (en) | 2008-04-24 | 2010-08-17 | Becton, Dickinson And Company | Methods for diagnosing oncogenic human papillomavirus (HPV) |
US8092215B2 (en) | 2008-05-23 | 2012-01-10 | Align Technology, Inc. | Smile designer |
US9492243B2 (en) | 2008-05-23 | 2016-11-15 | Align Technology, Inc. | Dental implant positioning |
US8172569B2 (en) | 2008-06-12 | 2012-05-08 | Align Technology, Inc. | Dental appliance |
US20110190356A1 (en) * | 2008-08-19 | 2011-08-04 | Knopp Neurosciences Inc. | Compositions and Methods of Using (R)- Pramipexole |
US8152518B2 (en) | 2008-10-08 | 2012-04-10 | Align Technology, Inc. | Dental positioning appliance having metallic portion |
US20110251099A1 (en) | 2008-12-30 | 2011-10-13 | Sudha Visvanathan | SERUM MARKERS PREDICTING CLINICAL RESPONSE TO ANTI-TNFa ANTIBODIES IN PATIENTS WITH ANKYLOSING SPONDYLITIS |
US8292617B2 (en) | 2009-03-19 | 2012-10-23 | Align Technology, Inc. | Dental wire attachment |
US8765031B2 (en) | 2009-08-13 | 2014-07-01 | Align Technology, Inc. | Method of forming a dental appliance |
KR101556726B1 (ko) * | 2010-02-24 | 2015-10-02 | 바이오디식스, 인크. | 질량스펙트럼 분석을 이용한 치료제 투여를 위한 암 환자 선별 |
US9211166B2 (en) | 2010-04-30 | 2015-12-15 | Align Technology, Inc. | Individualized orthodontic treatment index |
US9241774B2 (en) | 2010-04-30 | 2016-01-26 | Align Technology, Inc. | Patterned dental positioning appliance |
EP2628013B1 (en) | 2010-10-14 | 2019-06-12 | The Johns Hopkins University | Biomarkers of brain injury |
CN102103079B (zh) * | 2010-12-31 | 2013-12-11 | 聚光科技(杭州)股份有限公司 | 一种光谱分析方法 |
JP5673348B2 (ja) * | 2011-05-25 | 2015-02-18 | 株式会社島津製作所 | 質量分析データ解析方法及び解析装置 |
US9403238B2 (en) | 2011-09-21 | 2016-08-02 | Align Technology, Inc. | Laser cutting |
RU2475766C1 (ru) * | 2011-11-07 | 2013-02-20 | Марина Витальевна Самойленко | Способ определения передаточной функции линейной радиоэлектронной системы |
WO2013096816A1 (en) | 2011-12-22 | 2013-06-27 | Biogen Idec Ma Inc. | Improved synthesis of amine substituted 4,5,6,7-tetrahydrobenzothiazole compounds |
US9375300B2 (en) | 2012-02-02 | 2016-06-28 | Align Technology, Inc. | Identifying forces on a tooth |
US9220580B2 (en) | 2012-03-01 | 2015-12-29 | Align Technology, Inc. | Determining a dental treatment difficulty |
WO2013134771A1 (en) * | 2012-03-09 | 2013-09-12 | Torion Technologies, Inc. | Deconvolution and identification algorithms for use on spectroscopic data |
NL2009015C2 (en) * | 2012-04-10 | 2013-10-15 | Biosparq B V | Method for classification of a sample on the basis of spectral data, method for creating a database and method for using this database, and corresponding computer program, data storage medium and system. |
JP6377054B2 (ja) | 2012-05-11 | 2018-08-22 | リセット セラピューティークス, インコーポレイテッド | クリプトクロム調節薬としてのカルバゾール含有スルホンアミド |
US9414897B2 (en) | 2012-05-22 | 2016-08-16 | Align Technology, Inc. | Adjustment of tooth position in a virtual dental model |
US10288626B2 (en) | 2012-09-14 | 2019-05-14 | University Of Kentucky Research Foundation | Secreted tumor-associated cytochrome as a blood-based biomarker for cancer |
EP2914752B1 (en) | 2012-11-02 | 2022-03-09 | The Johns Hopkins University | Dna methylation biomarkers of post-partum depression risk |
US9662313B2 (en) | 2013-02-28 | 2017-05-30 | Knopp Biosciences Llc | Compositions and methods for treating amyotrophic lateral sclerosis in responders |
CN105051526B (zh) * | 2013-03-26 | 2018-04-06 | 株式会社岛津制作所 | 质量分析装置 |
CA2914918C (en) | 2013-05-10 | 2023-10-10 | Johns Hopkins University | Compositions and methods for ovarian cancer assessment having improved specificity |
CA2918054C (en) | 2013-07-11 | 2022-12-13 | The Johns Hopkins University | A dna methylation and genotype specific biomarker of suicide attempt and/or suicide ideation |
PT3019167T (pt) | 2013-07-12 | 2021-03-04 | Knopp Biosciences Llc | Tratamento de níveis elevados de eosinófilos e/ou basófilos |
US9468630B2 (en) | 2013-07-12 | 2016-10-18 | Knopp Biosciences Llc | Compositions and methods for treating conditions related to increased eosinophils |
EP3022322A4 (en) | 2013-07-17 | 2017-05-17 | The Johns Hopkins University | A multi-protein biomarker assay for brain injury detection and outcome |
AU2014306597B2 (en) | 2013-08-13 | 2018-05-17 | Knopp Biosciences Llc | Compositions and methods for treating chronic urticaria |
US9642840B2 (en) | 2013-08-13 | 2017-05-09 | Knopp Biosciences, Llc | Compositions and methods for treating plasma cell disorders and B-cell prolymphocytic disorders |
WO2015120382A1 (en) | 2014-02-07 | 2015-08-13 | The Johns Hopkins University | Predicting response to epigenetic drug therapy |
CN103995042B (zh) * | 2014-03-28 | 2016-09-28 | 深圳华大基因研究院 | 一种建立蛋白样品swath离子库的方法 |
TWI690521B (zh) | 2014-04-07 | 2020-04-11 | 美商同步製藥公司 | 作為隱花色素調節劑之含有咔唑之醯胺類、胺基甲酸酯類及脲類 |
WO2015175685A1 (en) * | 2014-05-13 | 2015-11-19 | University Of Houston System | System and method for maldi-tof mass spectrometry |
WO2016044697A1 (en) | 2014-09-19 | 2016-03-24 | The Johns Hopkins University | Biomarkers of cognitive dysfunction |
US9610141B2 (en) | 2014-09-19 | 2017-04-04 | Align Technology, Inc. | Arch expanding appliance |
US10449016B2 (en) | 2014-09-19 | 2019-10-22 | Align Technology, Inc. | Arch adjustment appliance |
WO2016057485A1 (en) | 2014-10-06 | 2016-04-14 | The Johns Hopkins University | A dna methylation and genotype specific biomarker for predicting post-traumatic stress disorder |
US10016159B2 (en) | 2014-10-24 | 2018-07-10 | Koninklijke Philips N.V. | Determination of TGF-β pathway activity using unique combination of target genes |
AU2015334841B2 (en) | 2014-10-24 | 2022-02-03 | Koninklijke Philips N.V. | Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities |
CA2965408C (en) | 2014-10-24 | 2023-10-24 | Koninklijke Philips N.V. | Medical prognosis and prediction of treatment response using multiple cellular signaling pathway activities |
US9744001B2 (en) | 2014-11-13 | 2017-08-29 | Align Technology, Inc. | Dental appliance with cavity for an unerupted or erupting tooth |
US10504386B2 (en) | 2015-01-27 | 2019-12-10 | Align Technology, Inc. | Training method and system for oral-cavity-imaging-and-modeling equipment |
WO2016134365A1 (en) | 2015-02-20 | 2016-08-25 | The Johns Hopkins University | Biomarkers of myocardial injury |
BR112018002848A2 (pt) | 2015-08-14 | 2018-11-06 | Koninklijke Philips Nv | método, aparelho, mídia de armazenamento não transitório, programa de computador, kit para medir níveis de expressão de seis ou mais genes-alvo da via de sinalização celular |
US11931222B2 (en) | 2015-11-12 | 2024-03-19 | Align Technology, Inc. | Dental attachment formation structures |
US11554000B2 (en) | 2015-11-12 | 2023-01-17 | Align Technology, Inc. | Dental attachment formation structure |
US11103330B2 (en) | 2015-12-09 | 2021-08-31 | Align Technology, Inc. | Dental attachment placement structure |
US11596502B2 (en) | 2015-12-09 | 2023-03-07 | Align Technology, Inc. | Dental attachment placement structure |
EP3471599A4 (en) | 2016-06-17 | 2020-01-08 | Align Technology, Inc. | INTRAORAL DEVICES WITH SENSOR |
EP3988048B1 (en) | 2016-06-17 | 2024-01-17 | Align Technology, Inc. | Orthodontic appliance performance monitor |
KR102595753B1 (ko) | 2016-07-27 | 2023-10-30 | 얼라인 테크널러지, 인크. | 치아 진단 기능이 있는 구강 내 스캐너 |
US10390913B2 (en) | 2018-01-26 | 2019-08-27 | Align Technology, Inc. | Diagnostic intraoral scanning |
CA3035743A1 (en) | 2016-09-02 | 2018-03-08 | Board Of Regents, The University Of Texas System | Collection probe and methods for the use thereof |
WO2018045208A1 (en) * | 2016-09-02 | 2018-03-08 | Board Of Regents, The University Of Texas System | Collection probe and methods for the use thereof |
CN113648088B (zh) | 2016-11-04 | 2023-08-22 | 阿莱恩技术有限公司 | 用于牙齿图像的方法和装置 |
US11376101B2 (en) | 2016-12-02 | 2022-07-05 | Align Technology, Inc. | Force control, stop mechanism, regulating structure of removable arch adjustment appliance |
ES2845198T3 (es) | 2016-12-02 | 2021-07-26 | Align Technology Inc | Expansor palatino |
CN113440273A (zh) | 2016-12-02 | 2021-09-28 | 阿莱恩技术有限公司 | 一系列腭扩张器及其形成方法和形成设备 |
WO2018102702A1 (en) | 2016-12-02 | 2018-06-07 | Align Technology, Inc. | Dental appliance features for speech enhancement |
US10548700B2 (en) | 2016-12-16 | 2020-02-04 | Align Technology, Inc. | Dental appliance etch template |
US10779718B2 (en) | 2017-02-13 | 2020-09-22 | Align Technology, Inc. | Cheek retractor and mobile device holder |
US10613515B2 (en) | 2017-03-31 | 2020-04-07 | Align Technology, Inc. | Orthodontic appliances including at least partially un-erupted teeth and method of forming them |
US11045283B2 (en) | 2017-06-09 | 2021-06-29 | Align Technology, Inc. | Palatal expander with skeletal anchorage devices |
CN110769777B (zh) | 2017-06-16 | 2023-08-11 | 阿莱恩技术有限公司 | 牙齿类型和萌出状态的自动检测 |
WO2018236120A1 (ko) * | 2017-06-23 | 2018-12-27 | 주식회사 에이엠아이티 | 네거티브 마커를 이용한 유사 종 식별 방법 및 장치 |
WO2019005808A1 (en) | 2017-06-26 | 2019-01-03 | Align Technology, Inc. | BIOCAPTOR PERFORMANCE INDICATOR FOR INTRABUCCAL DEVICES |
US10885521B2 (en) | 2017-07-17 | 2021-01-05 | Align Technology, Inc. | Method and apparatuses for interactive ordering of dental aligners |
WO2019018784A1 (en) | 2017-07-21 | 2019-01-24 | Align Technology, Inc. | ANCHOR OF CONTOUR PALATIN |
EP3658067B1 (en) | 2017-07-27 | 2023-10-25 | Align Technology, Inc. | System and methods for processing an orthodontic aligner by means of an optical coherence tomography |
EP3658070A1 (en) | 2017-07-27 | 2020-06-03 | Align Technology, Inc. | Tooth shading, transparency and glazing |
US11116605B2 (en) | 2017-08-15 | 2021-09-14 | Align Technology, Inc. | Buccal corridor assessment and computation |
US11123156B2 (en) | 2017-08-17 | 2021-09-21 | Align Technology, Inc. | Dental appliance compliance monitoring |
EP3461915A1 (en) | 2017-10-02 | 2019-04-03 | Koninklijke Philips N.V. | Assessment of jak-stat1/2 cellular signaling pathway activity using mathematical modelling of target gene expression |
US10813720B2 (en) | 2017-10-05 | 2020-10-27 | Align Technology, Inc. | Interproximal reduction templates |
CN114939001A (zh) | 2017-10-27 | 2022-08-26 | 阿莱恩技术有限公司 | 替代咬合调整结构 |
CN116602778A (zh) | 2017-10-31 | 2023-08-18 | 阿莱恩技术有限公司 | 具有选择性牙合负荷和受控牙尖交错的牙科器具 |
WO2019089989A2 (en) | 2017-11-01 | 2019-05-09 | Align Technology, Inc. | Automatic treatment planning |
WO2019094507A1 (en) * | 2017-11-10 | 2019-05-16 | Pataigin, Llc | Method for data analysis |
US11534974B2 (en) | 2017-11-17 | 2022-12-27 | Align Technology, Inc. | Customized fabrication of orthodontic retainers based on patient anatomy |
SG11202004568UA (en) | 2017-11-27 | 2020-06-29 | Univ Texas | Minimally invasive collection probe and methods for the use thereof |
EP3716885B1 (en) | 2017-11-30 | 2023-08-30 | Align Technology, Inc. | Orthodontic intraoral appliances comprising sensors |
WO2019118876A1 (en) | 2017-12-15 | 2019-06-20 | Align Technology, Inc. | Closed loop adaptive orthodontic treatment methods and apparatuses |
EP3502279A1 (en) | 2017-12-20 | 2019-06-26 | Koninklijke Philips N.V. | Assessment of mapk-ap 1 cellular signaling pathway activity using mathematical modelling of target gene expression |
US10980613B2 (en) | 2017-12-29 | 2021-04-20 | Align Technology, Inc. | Augmented reality enhancements for dental practitioners |
US20190383832A1 (en) | 2017-12-29 | 2019-12-19 | Abbott Laboratories | Novel biomarkers and methods for diagnosing and evaluating traumatic brain injury |
US11937991B2 (en) | 2018-03-27 | 2024-03-26 | Align Technology, Inc. | Dental attachment placement structure |
EP3773320B1 (en) | 2018-04-11 | 2024-05-15 | Align Technology, Inc. | Releasable palatal expanders |
EP3788377A1 (en) | 2018-05-04 | 2021-03-10 | Abbott Laboratories | Hbv diagnostic, prognostic, and therapeutic methods and products |
US10957523B2 (en) | 2018-06-08 | 2021-03-23 | Thermo Finnigan Llc | 3D mass spectrometry predictive classification |
CN110895799B (zh) * | 2018-09-13 | 2023-05-09 | 岛津分析技术研发(上海)有限公司 | 提高质谱谱图质量的方法、计算机存储介质、以及电子终端 |
EP3931565A4 (en) | 2019-02-27 | 2023-04-12 | Epiaxis Therapeutics Pty Ltd | METHODS AND AGENTS FOR ASSESSING T LYMPHOCYTE FUNCTION AND PREDICTING RESPONSE TO THERAPY |
WO2021026172A1 (en) | 2019-08-05 | 2021-02-11 | Seer, Inc. | Systems and methods for sample preparation, data generation, and protein corona analysis |
CN111292291B (zh) * | 2020-01-15 | 2024-02-02 | 李东航 | 一种基于pca或m波段小波域的癌症ct图像判断装置 |
CN113484400B (zh) * | 2021-07-01 | 2022-11-22 | 上海交通大学 | 基于机器学习的质谱图分子式计算方法 |
CN113567605A (zh) * | 2021-08-16 | 2021-10-29 | 苏恺明 | 质量色谱图的自动化解释模型构建方法、装置和电子设备 |
WO2023122723A1 (en) | 2021-12-23 | 2023-06-29 | The Broad Institute, Inc. | Panels and methods for diagnosing and treating lung cancer |
WO2024044578A1 (en) | 2022-08-22 | 2024-02-29 | University Of Virginia | Dna methylation biomarkers of premenstrual dysphoric disorder and perimenopausal depression |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4075475A (en) * | 1976-05-03 | 1978-02-21 | Chemetron Corporation | Programmed thermal degradation-mass spectrometry analysis method facilitating identification of a biological specimen |
US5697369A (en) | 1988-12-22 | 1997-12-16 | Biofield Corp. | Method and apparatus for disease, injury and bodily condition screening or sensing |
AU7563191A (en) | 1990-03-28 | 1991-10-21 | John R. Koza | Non-linear genetic algorithms for solving problems by finding a fit composition of functions |
US5790761A (en) | 1992-12-11 | 1998-08-04 | Heseltine; Gary L. | Method and apparatus for the diagnosis of colorectal cancer |
US6025128A (en) | 1994-09-29 | 2000-02-15 | The University Of Tulsa | Prediction of prostate cancer progression by analysis of selected predictive parameters |
WO1996037777A1 (en) * | 1995-05-23 | 1996-11-28 | Nelson Randall W | Mass spectrometric immunoassay |
GB2301897B (en) | 1995-06-08 | 1999-05-26 | Univ Wales Aberystwyth The | Composition analysis |
US5716825A (en) * | 1995-11-01 | 1998-02-10 | Hewlett Packard Company | Integrated nucleic acid analysis system for MALDI-TOF MS |
US5687716A (en) | 1995-11-15 | 1997-11-18 | Kaufmann; Peter | Selective differentiating diagnostic process based on broad data bases |
US5839438A (en) | 1996-09-10 | 1998-11-24 | Neuralmed, Inc. | Computer-based neural network system and method for medical diagnosis and interpretation |
US6157921A (en) | 1998-05-01 | 2000-12-05 | Barnhill Technologies, Llc | Enhancing knowledge discovery using support vector machines in a distributed network environment |
AU7137798A (en) | 1997-04-17 | 1998-11-11 | Glaxo Group Limited | Statistical deconvoluting of mixtures |
US6674070B2 (en) * | 1997-05-23 | 2004-01-06 | Northeastern University | On-line and off-line deposition of liquid samples for matrix assisted laser desorption ionization-time of flight (MALDI-TOF) mass spectroscopy |
JP2002502543A (ja) * | 1997-05-23 | 2002-01-22 | ノースイースタン ユニバーシティ | マトリクス支援レーザ離脱イオン化−飛翔時間(maldi−tof)質量分光用のオンライン液体試料析出インターフェース |
US6825463B2 (en) * | 1997-05-23 | 2004-11-30 | Northeastern University | On-line and off-line deposition of liquid samples for matrix assisted laser desorption ionization-time of flight (MALDI-TOF) mass spectroscopy |
US5905258A (en) * | 1997-06-02 | 1999-05-18 | Advanced Research & Techology Institute | Hybrid ion mobility and mass spectrometer |
US6723564B2 (en) * | 1998-05-07 | 2004-04-20 | Sequenom, Inc. | IR MALDI mass spectrometry of nucleic acids using liquid matrices |
US6289287B1 (en) * | 1999-01-29 | 2001-09-11 | Agilent Technologies, Inc. | Identification of sample component using a mass sensor system |
US20020009394A1 (en) | 1999-04-02 | 2002-01-24 | Hubert Koster | Automated process line |
US6647343B1 (en) * | 1999-04-29 | 2003-11-11 | Agilent Technologies, Inc. | Temporal profile analysis of mass data in a mass sensor system |
US6391649B1 (en) * | 1999-05-04 | 2002-05-21 | The Rockefeller University | Method for the comparative quantitative analysis of proteins and other biological material by isotopic labeling and mass spectroscopy |
US6329652B1 (en) * | 1999-07-28 | 2001-12-11 | Eastman Kodak Company | Method for comparison of similar samples in liquid chromatography/mass spectrometry |
WO2001020043A1 (en) | 1999-09-17 | 2001-03-22 | Affymetrix, Inc. | Method of cluster analysis of gene expression profiles |
EP1236173A2 (en) | 1999-10-27 | 2002-09-04 | Biowulf Technologies, LLC | Methods and devices for identifying patterns in biological systems |
WO2001031579A2 (en) | 1999-10-27 | 2001-05-03 | Barnhill Technologies, Llc | Methods and devices for identifying patterns in biological patterns |
DE10021737C2 (de) * | 2000-05-04 | 2002-10-17 | Hermann Haller | Verfahren und Vorrichtung zur qualitativen und/oder quantitativen Bestimmung eines Protein- und/oder Peptidmusters einer Flüssigkeitsprobe, die dem menschlichen oder tierischen Körper entnommen wird |
US7158862B2 (en) * | 2000-06-12 | 2007-01-02 | The Arizona Board Of Regents On Behalf Of The University Of Arizona | Method and system for mining mass spectral data |
WO2001099043A1 (en) | 2000-06-19 | 2001-12-27 | Correlogic Systems, Inc. | Heuristic method of classification |
KR101054732B1 (ko) | 2000-07-18 | 2011-08-05 | 더 유나이티드 스테이츠 오브 아메리카 애즈 리프리젠티드 바이 더 세크레터리 오브 더 디파트먼트 오브 헬쓰 앤드 휴먼 써비시즈 | 생물학적 데이터의 숨겨진 패턴에 근거한 생물학적 상태의 식별 방법 |
CA2429633A1 (en) * | 2000-11-16 | 2002-05-30 | Ciphergen Biosystems, Inc. | Method for analyzing mass spectra |
ATE496343T1 (de) | 2001-01-24 | 2011-02-15 | Health Discovery Corp | Verfahren zum identifizieren von mustern in biologischen systemen und deren anwendungen |
US20020160420A1 (en) | 2001-04-30 | 2002-10-31 | George Jackowski | Process for diagnosis of physiological conditions by characterization of proteomic materials |
US20020193950A1 (en) | 2002-02-25 | 2002-12-19 | Gavin Edward J. | Method for analyzing mass spectra |
-
2001
- 2001-11-15 CA CA002429633A patent/CA2429633A1/en not_active Abandoned
- 2001-11-15 CN CNA018220509A patent/CN1623091A/zh active Pending
- 2001-11-15 CA CA002429327A patent/CA2429327A1/en not_active Abandoned
- 2001-11-15 EP EP01993185A patent/EP1355727A4/en not_active Withdrawn
- 2001-11-15 EP EP01988205A patent/EP1337845B1/en not_active Expired - Lifetime
- 2001-11-15 AU AU2002245043A patent/AU2002245043B2/en not_active Ceased
- 2001-11-15 JP JP2002544625A patent/JP2004536276A/ja active Pending
- 2001-11-15 AU AU2002241535A patent/AU2002241535B2/en not_active Ceased
- 2001-11-15 AU AU4153502A patent/AU4153502A/xx active Pending
- 2001-11-15 AT AT01988205T patent/ATE540421T1/de active
- 2001-11-15 JP JP2003534055A patent/JP2004522980A/ja active Pending
- 2001-11-15 WO PCT/US2001/044843 patent/WO2002042733A2/en active Application Filing
- 2001-11-15 CN CNB018220487A patent/CN1262337C/zh not_active Expired - Lifetime
- 2001-11-15 WO PCT/US2001/044972 patent/WO2003031031A1/en active Search and Examination
- 2001-11-15 US US09/999,081 patent/US6675104B2/en not_active Expired - Fee Related
-
2003
- 2003-09-23 US US10/669,499 patent/US7027933B2/en not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7316931B2 (en) | 2000-10-19 | 2008-01-08 | Target Discovery, Inc. | Mass defect labeling for the determination of oligomer sequences |
US8352193B2 (en) | 2000-10-19 | 2013-01-08 | Target Discovery, Inc. | Methods for deriving a cumulative ranking |
JP2016224031A (ja) * | 2015-04-22 | 2016-12-28 | ザ・ボーイング・カンパニーThe Boeing Company | フォービエイテッド圧縮投影を用いたハイパースペクトルデミキシング |
JP2017224283A (ja) * | 2016-06-09 | 2017-12-21 | 株式会社島津製作所 | ビッグデータ解析方法及び該解析方法を利用した質量分析システム |
JP7057913B2 (ja) | 2016-06-09 | 2022-04-21 | 株式会社島津製作所 | ビッグデータ解析方法及び該解析方法を利用した質量分析システム |
US11315774B2 (en) | 2016-06-09 | 2022-04-26 | Shimadzu Corporation | Big-data analyzing Method and mass spectrometric system using the same method |
Also Published As
Publication number | Publication date |
---|---|
US7027933B2 (en) | 2006-04-11 |
US20040059530A1 (en) | 2004-03-25 |
JP2004536276A (ja) | 2004-12-02 |
ATE540421T1 (de) | 2012-01-15 |
EP1337845A4 (en) | 2007-04-11 |
WO2003031031A1 (en) | 2003-04-17 |
AU2002245043B2 (en) | 2006-10-26 |
AU2002241535C1 (en) | 2002-06-03 |
US20020138208A1 (en) | 2002-09-26 |
US6675104B2 (en) | 2004-01-06 |
CA2429633A1 (en) | 2002-05-30 |
AU4153502A (en) | 2002-06-03 |
WO2002042733A2 (en) | 2002-05-30 |
WO2002042733A3 (en) | 2003-02-27 |
CN1262337C (zh) | 2006-07-05 |
CN1623091A (zh) | 2005-06-01 |
AU2002241535B2 (en) | 2006-05-18 |
CA2429327A1 (en) | 2003-04-17 |
EP1355727A1 (en) | 2003-10-29 |
CN1500000A (zh) | 2004-05-26 |
WO2002042733A9 (en) | 2003-04-24 |
AU2002245043A1 (en) | 2003-04-22 |
EP1337845A2 (en) | 2003-08-27 |
EP1337845B1 (en) | 2012-01-04 |
EP1355727A4 (en) | 2007-04-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004522980A (ja) | 質量スペクトルを分析する方法 | |
US20020193950A1 (en) | Method for analyzing mass spectra | |
AU2002241535A1 (en) | Method for analyzing mass spectra | |
US11315774B2 (en) | Big-data analyzing Method and mass spectrometric system using the same method | |
US8478534B2 (en) | Method for detecting discriminatory data patterns in multiple sets of data and diagnosing disease | |
KR101054732B1 (ko) | 생물학적 데이터의 숨겨진 패턴에 근거한 생물학적 상태의 식별 방법 | |
US20060064253A1 (en) | Multiple high-resolution serum proteomic features for ovarian cancer detection | |
CN110139702A (zh) | 利用基质辅助激光解吸/离子化飞行时间质谱仪进行分类数据操控 | |
Sun et al. | Recent advances in computational analysis of mass spectrometry for proteomic profiling | |
JP2007523323A (ja) | スペクトルにおけるシグナルをクラスタにする方法 | |
JP7207171B2 (ja) | マーカ物質の探索支援方法、探索支援プログラムおよび探索支援装置 | |
CN115831369A (zh) | 早筛数据处理、构建早筛模型的方法、装置、设备及介质 | |
CN101354734A (zh) | 质谱分析方法 | |
CN116364294A (zh) | 一种数据库系统的建立及其应用 | |
CN116106398A (zh) | 用于诊断ckd的标志物 | |
Wang | Pattern detection and discrimination in proteomic mass spectrometry analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060921 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20061219 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061219 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20061219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20061222 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070320 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070814 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071211 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080213 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20080314 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090507 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090512 |