JP2006515929A

JP2006515929A - サンプルスポットからのプロセシング信号についてのデータ管理システムおよびデータ管理方法

Info

Publication number: JP2006515929A
Application number: JP2006502862A
Authority: JP
Inventors: エドワードジェイ．ガビン，; シンシアエンダーウィック，; パトリックホ，; ニールズカークトムセン，
Original assignee: サイファージェンバイオシステムズインコーポレイテッド
Priority date: 2003-01-27
Filing date: 2004-01-15
Publication date: 2006-06-08
Also published as: US20040159783A1; US6909981B2; EP1588192A2; WO2004070523A2; WO2004070523A3

Abstract

本発明の一実施形態は複数のスペクトルを処理する方法を対象にする。この方法は１個以上のサンプルチップ（１０ａ，１０ｂ）上のサンプルスポット（１４ａ−１４ｄ）と関連した値を受信するステップを含み、これらの値は、グラフィカルユーザインタフェースに表示された、サンプルスポット（１４ａ，１４ｂ）を表現するグラフィック要素を使用して入力された。複数の信号を表現するデータが受信される。複数の信号中の各信号は、その信号を生成するため用いられたサンプルスポットと関連した値の組でアノテートされる。

Description

（関連出願の相互参照）
本願は、２００３年１月２７日に出願され、参照によって全体が本明細書に組み込まれた米国仮出願第６０／４４３，０７１号の本出願であり、この仮出願の優先権を主張する。

（発明の背景）
プロテイン及び他のマーカーは疾病状態の重要な因子である。「マーカー」は典型的にポリペプチドのような分子を表し、単独で、又は、他のマーカーと組み合わせて、ある生物学的状態と別の生物学的状態を区別する。たとえば、タンパク質は疾病のような生物学的状態の変化に関連して変化する。疾病が発症するとき、一部のタンパク質は休止状態になり、それ以外は活性状態になる。たとえば、前立腺特異抗原（ＰＳＡ）は循環している血清タンパク質であり、濃度上昇中に存在するとき、前立腺癌と相関関係がある。ＰＳＡのようなマーカーが同定されるとき、それらは診断ツールとして使用可能であり、又は、マーカーと関連した疾病を取り扱うため使用可能である。

表面増強レーザー脱離／イオン化プロセスはバイオマーカーを同定するため使用される。「表面増強レーザー脱離／イオン化」すなわち「ＳＥＬＤＩ」は、検体（たとえば、タンパク質など）が気相イオン分光分析計のプローブインタフェースとかみ合うＳＥＬＤＩプローブのサンプルスポットで捕捉される脱離／イオン化気相イオン分光分析（たとえば、質量分析）の方法を表す。「ＳＥＬＤＩＭＳ」では、気相イオン分光分析計は質量分析計である。ＳＥＬＤＩ技術は、たとえば、米国特許第５，７１９，０６０号明細書（ＨｕｔｃｈｅｎｓとＹｉｐ）、及び、米国特許第６，２２５，０４７号（ＨｕｔｃｈｅｎｓとＹｉｐ）に記載されている。レーザーは、捕捉された検体（たとえば、タンパク質）をプローブの表面から脱離し、脱離された検体が検出器で受け取られる。「ＥＡＭ」すなわちエネルギー吸収材と呼ばれる材料はサンプルスポットにあり、脱離プロセス中にレーザーエネルギーの一部を吸収する。

検出後、脱離された検体の飛行時間（ＴＯＦ）が決定される。各飛行時間値は質量電荷比、すなわち、Ｍ／Ｚに変換される。ＴＯＦからＭ／Ｚへの変換は、飛行時間を質量電荷比（Ｍ／Ｚ）へ変換するアルゴリズムの適用を含む。このステップにおいて、信号は時間領域から質量領域へ変換される。タンパク質が脱離され検出され、Ｍ／Ｚが決定された後、図１に示されるような質量スペクトルが質量分析計によって生成される。

図１に示されるように、ｙ軸は信号強度の指標であり、ｘ軸は特有の質量電荷比を表す。特定の質量電荷比における高い信号強度はその質量電荷比をもつ物質が高濃度であることを示す。図１において、およそ２７０００におけるピークはその質量電荷比をもつ特定の物質を表す。

類似した処理条件下で作成されるスペクトルは、別々に分類され、分析される。たとえば、二つの質量スペクトルが同じレーザーエネルギーと洗浄条件を使用して作成されるが、それぞれ疾病サンプル及び非疾病サンプルに由来する。二つの質量スペクトルは、所与の質量電荷比での信号強度（又は「ピーク」）が異なる。特有の質量電荷比の物質は、２個のサンプルにおいて「発現量が異なる」ものとしてみなされ、その特定の物質は調査対象である特定の疾病状態のマーカーである。

表面増強レーザー脱離／イオン化データは多次元であり、使用されるエネルギー吸収材料（ＥＡＭ）のタイプ、使用される特定のレーザーエネルギー、使用される吸収材のタイプなどのような特定のプロセシング値を含む。表面増強レーザー脱離／イオン化プロセスの利点の一つには、サンプルを分析することにより、多種多様な界面化学と異なるサンプル準備ステップを用いてタンパク質のようなマーカーを同定し得る能力が含まれる。

自動化処理の使用が増加すると共に、ユーザによって手動で組織化され、処理され、分析されるスペクトルよりも多数のスペクトルが作成可能である。このような多次元表面増強レーザー脱離／イオン化データの高スループットの収集及び分析は現在利用可能であるデータ管理システムよりも優れたデータ管理システムを必要とする。

本発明の実施形態は上記及びその他の問題を解決する。

（発明の要旨）
本発明の実施形態はスペクトルを処理するシステム及び方法に関係する。

本発明の別の実施形態は、（ａ）グラフィカルユーザインタフェース上にサンプルスポットを表現するグラフィック要素を使用して入力され、１個以上のサンプルチップ上の複数のサンプルスポットと関連した値を受信するステップと、（ｂ）サンプルスポットから生成された複数の信号を表現するデータを受信するステップと、（ｃ）信号を生成するため用いられたサンプルスポットと関連した値の組で複数の信号中の各信号に自動的にアノテートするステップと、を含む複数の信号を処理する方法を対象にする。

本発明の別の実施形態は、（ａ）グラフィカルユーザインタフェース上にサンプルスポットを表現するグラフィック要素を使用して入力され、１個以上のサンプルチップ上の複数のサンプルスポットと関連した値を受信するコードと、（ｂ）サンプルスポットから生成された複数の信号を表現するデータを受信するコードと、（ｃ）信号を生成するため用いられたサンプルスポットと関連した値の組で複数の信号中の各信号に自動的にアノテートするコードと、を含むコンピュータ読み取り可能な媒体を対象にする。

本発明の別の実施形態は、（ａ）分析装置と、（ｂ）分析装置からデータを受信し、コンピュータ読み取り可能な媒体を備えたデジタルコンピュータと、を具備し、コンピュータ読み取り可能な媒体が、（ｉ）グラフィカルユーザインタフェース上にサンプルスポットを表現するグラフィック要素を使用して入力され、１個以上のサンプルチップ上の複数のサンプルスポットと関連した値を受信するコードと、（ｉｉ）サンプルスポットから生成された複数の信号を表現するデータを受信するコードと、（ｉｉｉ）信号を生成するため用いられたサンプルスポットと関連した値の組で複数の信号中の各信号に自動的にアノテートするコードと、を含む、質量スペクトルを処理するシステムを対象にする。

本発明の上記及びその他の実施形態は以下に詳述される。

（詳細な説明）
本発明の実施形態は、未加工のスペクトルデータ、又は、処理済みのスペクトルデータを組織化し、実験が最初に計画されたときから実験の結果が分析されるときまでサンプル及び処理パラメータを追跡することが可能である。各スペクトルは、そのスペクトルが由来するサンプルスポットに関連した値で自動的にアノテートされる。これは後のスペクトル分析の速度と精度を高める。分析モジュールは、最新式データハンドリングを行い、潜在的なバイオマーカーを同定するため、複数の条件下で複数の実験の高速自動化分析を可能にさせる強力なデータマイニング及び分析能力を含む。本発明の実施形態はさらに、実験結果を精緻化し、リポートを生成し、調査結果を公開するために使用される。

クライアントサーバ型のリレーショナルデータベースアーキテクチャは本発明の実施形態で使用される。クライアントサーバアーキテクチャは、ネットワーク上の各コンピュータ又はプロセッサがクライアント又はサーバのいずれかであるネットワークアーキテクチャである。サーバコンピュータは、典型的に、ディスクドライブ管理専用（ファイルサーバ）、プリンタ制御専用（プリントサーバ）又はネットワークトラフィック管理専用（ネットワークサーバ）である強力なコンピュータである。クライアントコンピュータには、ユーザがアプリケーションを動かすＰＣ（パーソナルコンピュータ）又はワークステーションが含まれる。クライアントコンピュータは、ファイル、デバイス、さらには処理パワーのようなリソースのためのサーバコンピュータに依存する。本発明の一部の実施形態では、サーバコンピュータはデータベース機能のすべてを取り扱う。クライアントコンピュータは、質量スペクトルのソート、正規化及び印刷のようなフロントエンドデータ管理のすべてを取り扱うソフトウェアを載せることができる。クライアントコンピュータはさらにユーザからのデータ入力を受信可能である。

本発明の実施形態で使用されるデジタルコンピュータ（たとえば、クライアントコンピュータ、サーバコンピュータ）は、Ｗｉｎｄｏｗｓ^ＴＭ又はＬｉｎｕｘ^ＴＭに基づくオペレーティングシステムのような標準又は専用オペレーティングシステムを使用する１台以上の超小型、小型又は大型のフレームコンピュータを含む。

本明細書に記載されたいずれかの機能を行うコードはデジタルコンピュータによって実行され、適当なコンピュータ読み取り可能な媒体に記憶される。コンピュータ読み取り可能な媒体の実施例には、磁気ディスク、電磁ディスク、光ディスク、テープ、スティック、チップなどが含まれる。本明細書に記載されたいずれかの機能を実行するコートは、たとえば、フォートラン、Ｃ、Ｃ＋＋などを含む適当なコンピュータプログラミング言語で記述される。グラフィカルユーザインタフェースと、グラフィカルユーザインタフェースの基礎にある機能は、Ｊａｖａ（登録商標）のようなオブジェクト指向プログラミング言語を使用して作成される。

本発明の一実施形態による複数の信号を処理する方法は、（１）グラフィカルユーザインタフェース上にサンプルスポットを表現するグラフィック要素を使用して入力され、１個以上のサンプルチップ上の複数のサンプルスポットと関連した値を受信するステップと、（２）サンプルスポットから生成された複数の信号を表現するデータを受信するステップと、を含む。複数のサンプルスポットと関連した値と複数の信号を表現するデータはクライアントコンピュータ又はサーバコンピュータのようなデジタルコンピュータで受信される。複数の信号を表現するデータと、同じスポットに関連した値がデジタルコンピュータによって受信された後、（３）デジタルコンピュータは、信号を生成するため用いられたサンプルスポットと関連した値の組で複数の信号中の各信号に自動的にアノテートする。本明細書で使用されるように「受信する」は、デジタルコンピュータ、マイクロプロセッサ、又は、その他の計算装置によるデータの受信を含む。

上記のステップ（１）−（３）は様々な方法で実行される。たとえば、値は、グラフィック要素を備えたグラフィカルユーザインタフェースを使用してパーソナルコンピュータに入力され、ステップ（１）−（３）は同じパーソナルコンピュータ内のマイクロプロセッサによって実行される。或いは、サンプルスポットに対する値は、グラフィカル要素を使用してクライアントコンピュータのような第１のコンピュータへ入力される。値がクライアントコンピュータへ入力された後、その値はサーバコンピュータへ送信される。サーバコンピュータは次にステップ（１）−（３）を実行する。

各サンプルスポットはそれに関連した「特性」の１個以上の「値」をもつ。「特性」及び「特性」の「値」はそのサンプルスポットに関係する情報を含む。適当な特性と、それらの特性に関連した値（括弧内）は、ウェット実験室処理パラメータ（たとえば、洗浄溶液Ａ、洗浄溶液Ｂ）、エネルギー吸収材（たとえば、シナピン酸）、フラクション（たとえば、フラクションＡ、フラクションＢ）、吸着材（たとえば、吸着材Ａ、吸着材Ｂ）、サンプルタイプ（たとえば、血液、唾液）、サンプルグループ（たとえば、疾病、非疾病）、レーザーエネルギー（たとえば、レーザーエネルギーＡ、レーザーエネルギーＢ）、サンプルチップタイプ（たとえば、チップ番号１、チップ番号２）などを含むが、これらに限定されない。本発明の実施形態において、「フラクション」は、クロマトグラフィーのようなプロセスによって得られたサンプルの特別な部分である。異なるサンプル部分は、特定の分子量、サイズ、又は、電荷範囲内に収まる成分により構成される。たとえば、血液のようなサンプルは、クロマトグラフィーカラムを通して処理されるので、血液は異なる部分、すなわち、「フラクション」に分離される。各フラクションは、特定の分子量の範囲に収まる血液成分を含有する。

適当な分析装置及び方法が同じスポットに関連した信号を生成するため使用される。それらは、たとえば、気相イオン分光分析方法及び装置、光学的方法及び装置、電気機械的方法及び装置、並びに、原子間力顕微鏡と無線周波数による方法及び装置を含む。その中でも特に関心があるのは、質量分析、特に、ＳＥＬＤＩの使用である。光学的方法には、たとえば、蛍光、発光、化学発光、吸光度、反射率、透過率、複屈折率、又は、屈折率（たとえば、表面プラスモン共鳴、偏光解析、共振ミラー法、グレーティングカップラ導波法又は干渉分光法）が含まれる。光学的方法には、顕微鏡法（共焦点と非共焦点の両方）、イメージング法及び非イメージング法が含まれる。種々のフォーマットによる免疫測定（たとえば、ＥＬＩＳＡ）は、固相に捕捉されたタンパク質のような検体を検出するよく知られた方法である。電気機械的方法には、ボルタメトリー法及びアンペロメトリー法が含まれる。無線周波法には、多極共鳴分光法が含まれる。

一部の実施形態では、信号はスペクトルである。本発明の実施形態において生成され、操作され、分析されたスペクトルは、好ましくは、質量スペクトルである。生成された各質量スペクトルは、信号強度対質量電荷比のプロットでもよい。或いは、各質量スペクトルは単に信号強度値とそれらの対応するＭ／Ｚ値のテーブルによって構成される。「質量スペクトル」は以下の実施例に詳述されているが、飛行時間スペクトルのような他のタイプのスペクトルが本発明の実施形態においてアノテートされ、処理される。

本発明の実施形態による特定の典型的な方法は図２及び３を参照して説明される。

図２は本発明の一実施形態によるシステムを表す。図２は質量分光計４２と通信するクライアントコンピュータ４４を表す。クライアントコンピュータ４４は質量分光計４２と構造的に一体化してもよく、又は、質量分光計４２に接続されたパーソナルコンピュータのような別個の端末でもよい。１台のクライアントコンピュータ４４が説明図を明瞭にするため表されている。本発明の他の実施形態では、多数のクライアントコンピュータが存在し、各クライアントコンピュータは質量分光計に接続されても、接続されなくてもよい。

図２において、オートローダ４０が質量分光計に接続され、複数のサンプルチップ１０（ａ）、１０（ｂ）を質量分光計４２へ自動的に装填するため使用される。各サンプルチップ１０（ａ）、１０（ｂ）は、１個以上のサンプルスポット１４（ａ）−１４（ｄ）、１４（ａ）’−１４（ｄ）’と、バーコードＢＣ１、ＢＣ２のような識別子を含む。サンプルチップ１０（ａ）、１０（ｂ）はホルダー８に固定される。ホルダー８とサンプルチップ１０（ａ）、１０（ｂ）の組み合わせ、又は、ホルダー８自体は、「バイオプロセッサー」２００と呼ばれる。多数のバイオプロセッサー及び多数のサンプルチップが、サンプルスポット１４（ａ）−１４（ｄ）、１４（ａ）’−１４（ｄ）’の一つずつに少なくとも１個の質量スペクトルを生成するため、オートローダ４０を用いて質量分光計４２へ自動的に装填される。

バイオプロセッサー２００は任意の個数のサンプルチップを含み、各サンプルチップは適当な個数のサンプルスポットを含む。本明細書で使用されるように、「バイオプロセッサー」は、１個以上のサンプルチップを保持するホルダーを含み、各サンプルチップは１個以上のサンプルスポットを含む。一部の実施形態では、バイオプロセッサー２００は、サンプルチップ１個当たりに８個のサンプルスポットを備えた１２個のサンプルチップを保持し、バイオプロセッサー１台当たりのサンプルスポットは合計で９６個である。バイオプロセッサー２００のサンプルスポット構造は、多重アッセイを実行するための標準フォーマットである９６−ウェルプレートの構造に類似している。９６−ウェルプレートのような標準フォーマットに類似しているバイオプロセッサーは、市販されている自動機器と共に使用することができるので便利である。たとえば、Ｂｉｏｍｅｋ２０００液体ハンドリングロボット（カリフォルニア州フリーモントのＣｉｐｈｅｒｇｅｎＢｉｏｓｙｓｔｅｍｓ，Ｉｎｃ．から入手可能）は、９６−ウェルプレートのウェル内、又は、バイオプロセッサー内にあるサンプルスポット上の液体サンプルをピペットで採取できる。

サーバコンピュータ４６はイントラネット又はインターネットのようなデータネットワークを介してクライアントコンピュータ４４と通信する。サーバコンピュータ４６は、クライアントコンピュータ４４及びその他のクライアントコンピュータとの間でデータを送受信する１台以上の計算装置を含む。サーバコンピュータ４６はＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓ^ＴＭ２０００のようなオペレーティングシステムを動かし、インテルベースのマイクロプロセッサ（たとえば、１ＧＨｚ以上のＩｎｔｅｌＰｅｎｔｉｕｍ^ＴＭＩＩＩ）のようなマイクロプロセッサを使用し、プログラムインストール用のＣＤＲＯＭとデータ入出力用の入力及び出力とを有する。サーバコンピュータは、最小限の特性、すなわち、１ＧＢＲＡＭ以上の記憶容量、及び、プログラム記憶用の１０ＧＢ以上の記憶容量をもつ。

クライアントコンピュータ４４はデジタルコンピュータでもよい。クライアントコンピュータ４４は、Ｗｉｎｄｏｗｓ（登録商標）２０００又はＷｉｎｄｏｗｓ（登録商標）ＸＰオペレーティングシステムの上で動き、１ＧＨｚ以上のＩｎｔｅｌＰｅｎｔｉｕｍ（登録商標）ＩＩプロセッサを有する。それは、プログラムインストール用のＣＤＲＯＭと、データ入力用のマウス、キーボード、トラックボール、若しくは、その他の適当な入力装置と、データ出力用の視覚的及び聴覚的な出力装置とをさらに有する。それは、最小限の特性、すなわち、２５６ＭＢＲＡＭと、プログラムデータ用の１０ＭＢのディスクスペースと、データ記憶用の少なくとも１ＧＢの空きディスクスペースとを有する。サーバコンピュータ４６及びクライアントコンピュータ４４のデータ要件は、処理速度とメモリ記憶容量がコンピュータテクノロジーにおける技術的進歩に応じて増加するのに伴って変化する。

サーバコンピュータ４６は、スペクトル、サンプルスポットに関連した値、又は、スペクトル若しくはスペクトルを形成するためのプロセスに関連したその他のデータを格納し得るデータベース４８と通信する。データベース４８は、Ｏｒａｃｌｅ又はＭｙＳＱＬから市販されているリレーショナルデータベースでもよい。リレーショナルデータベースは関連テーブルの形式でデータを格納する。リレーショナルデータベースは、データがどのように関係しているか、或いは、データがどのようにデータベースから抽出されるかに関して僅かな仮定しか必要としないので強力である。その結果として、同じデータベースは多数の異なる方法で見ることができる。リレーショナルデータベースの有用な特徴は、複数のテーブルに亘って分散させ得る点である。任意の数のユーザが格納されたスペクトル（アノテートされるか、若しくは、アノテートされない）、又は、サンプルスポットに関連した値を取り出すため、データベース４８にアクセスする。

質量分析計４２はスペクトルを作成するため適当なイオン化技術を使用する。イオン化技術には、たとえば、電子イオン化、高速原子／イオン衝突、マトリックス支援レーザー脱離／イオン化、表面増強レーザー脱離／イオン化（ＳＥＬＤＩ）、又は、電子スプレーイオン化プロセスが含まれる。

一部の実施形態では、イオン移動度スペクトロメータが使用される。イオン移動度分光分析の原理は、イオンの移動度の差に基づいている。特に、イオン化によって生成されたサンプルのイオンは、電界の影響下の管の中を、たとえば、それらの質量、電荷、若しくは形状の差が原因となって異なる速度で移動する。イオンは検出器で受け取られ、検出器の出力が、サンプル内のマーカー又はその他の物質を同定するため使用される。イオン移動度分光分析の一つの利点は常圧で実行できることである。

好ましい一実施例では、レーザー脱離飛行時間質量分析計が質量スペクトルを作成するため使用される。レーザー脱離分光分析は、特に、タンパク質のような高分子量物質を分析するため適している。たとえば、ＭＡＬＤＩ又は表面増強レーザー脱離／イオン化プロセスの実際的な質量範囲は最大で３０００００ダルトン以上に達する。その上、レーザー脱離プロセスは複雑な混合物を分析するため使用され、高感度を有する。さらに、タンパク質フラグメンテーションの可能性は、ＭＡＬＤＩ又は表面増強レーザー脱離／イオン化プロセスのようなレーザー脱離プロセスにおいては、他の質量分析プロセスの場合よりも低い。したがって、レーザー脱離プロセスは、タンパク質のような高分子量物質を正確に特徴付け、定量するため使用される。

図３は本発明の一実施形態による方法のフローチャートを表す。最初に、ユーザは１個以上のサンプルチップ上のサンプルスポットに関連した値を、サンプルチップ上のサンプルスポットを表現するグラフィック要素を含むグラフィカルユーザインタフェースを用いて、クライアントコンピュータへ入力する（ステップ２２）。それらがクライアントコンピュータへ入力された後、これらのサンプルスポットに関連した値がクライアントコンピュータからサーバコンピュータへ送信される（ステップ２４）。サーバコンピュータは受信された値をデータベースに格納する。１個以上のサンプルチップ上のサンプルスポットはユーザによって予め入力された値に応じて準備される。質量スペクトルを作成する前又は後に、サンプルスポットに対する値がサーバコンピュータから取り出され（ステップ２６）、そのクライアントコンピュータ（又は、別のクライアントコンピュータ）で受信される。質量分析計はサンプルスポット上のサンプルを分析し、スペクトルデータがクライアントコンピュータによって作成され、又は、受信される（ステップ２８）。クライアントコンピュータは、各質量スペクトルに、質量スペクトルを作成するため用いられたサンプルストップの値で自動的にアノテートする（ステップ３０）。質量スペクトルがアノテートされると、予め入力された値の組をもつ質量スペクトルのグループが選択される（ステップ３２）。このプロセスのあらゆる時点で、（アノテートされた形式又はアノテートされていない形式の）スペクトルは保存又は処理のためサーバコンピュータへ返信される。選択された質量スペクトルのグループは次に分析モジュールを使用して分析される（ステップ３４）。分析モジュールはクライアントコンピュータ又はサーバコンピュータに存在し、選択されたスペクトルを分析する。たとえば、分析モジュールは、選択された質量スペクトルのグループに関して、たとえば、発現差解析、又は、再帰的分割解析を実行する。これらのステップのそれぞれは図２乃至１７を参照してさらに詳細に説明される。

ユーザは１個以上のサンプルスポットに対する異なる値をデジタルコンピュータへ入力することにより実験を計画する。図２及び３を参照すると、１個以上のサンプルチップ１０（ａ）、１０（ｂ）上のサンプルスポット１４（ａ）−１４（ｄ）、１４（ａ）’−１４（ｄ）’のそれぞれに対する値はクライアントコンピュータ４４へ入力される（ステップ２２）。各サンプルスポット１４（ａ）−１４（ｄ）、１４（ａ）’−１４（ｄ）’は、０個、１個、又は、２個以上の値が関連付けられる。たとえば、各サンプルスポットは、異なる洗浄条件、異なるサンプル、及び、異なるレーザーエネルギーが関連付けられる。各サンプルスポット１４（ａ）−１４（ｄ）、１４（ａ）’−１４（ｄ）’は１個以上のスペクトルを生成するためさらに使用される。１台のバイオプロセッサーが全部で９６個のサンプルスポットを収容するならば、少なくとも９６個のスペクトルがこれらの９６個のスポットからそれぞれに生成される。実際には、多数のサンプルチップを備えた多数のバイオプロセッサーが存在し、各サンプルチップが多数の異なるサンプルスポットを有する。多数のスペクトルを生成できるので、より効率的で、かつ、役に立つスペクトルデータ管理システム及び方法が必要である。

各サンプルスポットは生物学的サンプルを収容する。適当な生物学的サンプルが本発明の実施形態で使用される。生物学的サンプルには、（たとえば、生体からの）組織、血液、血清、血漿、乳頭吸引、尿、涙液、唾液、細胞、軟組織及び硬組織、器官、精液、糞、尿などが含まれる。生物学的サンプルは、真核生物、原核生物、又は、ウィルス生物を含む適当な生物から取得される。

生物学的サンプルには、ポリペプチド、タンパク質、核酸、酵素、ＤＮＡ、ＲＮＡ、ポリヌクレオチド、オリゴヌクレオチド、核酸、炭水化物、オリゴ糖、多糖のような巨大分子と、核酸フラグメント、ペプチドフラグメント、及び、タンパク質フラグメントのような上記の生物学的巨大分子のフラグメントと、核酸複合体、タンパク質−ＤＮＡ複合体、受容体−配位子複合体、酵素−基質、酵素阻害剤、ペプチド複合体、タンパク質複合体、炭水化物複合体、及び、多糖複合体のような上記の生物学的巨大分子の複合体と、アミノ酸、ヌクレオチド、ヌクレオシド、糖、ステロイド、脂質、金属イオン、薬物、ホルモン、アミド類、アミン類、カルボン酸、ビタミン及び補酵素、アルコール、アルデヒド、ケトン、脂肪酸、ポルフィリン、カロチノイド、植物成長調整剤、リン酸エステル及びヌクレオシド２リン酸糖のような生物学的小分子と、を含む生物学的分子と、薬物的又は治療的に効果のある物質、モノマー、ペプチド類似物質、ステロイド類似物質、阻害剤、突然変異誘発性物質、発癌性物質、細胞分裂抑制薬、抗生物質、イオノフォア、代謝拮抗物質、アミノ酸類似物質、抗菌剤、転移抑制剤、表面活性剤（界面活性剤）、ミトコンドリア及び葉緑体機能阻害剤、電子供与体、電子伝達体、電子受容体、プロテアーゼのための合成基質、ホスファターゼのための合成基質、エステラーゼ及びリパーゼのための基質、ならびに、タンパク質変性試薬のような合成小分子と、合成ポリマーと、合成オリゴマーと、合成コポリマーとが含まれる。上記の具体的に列挙された物質の適当な混合物又は合成物もまた生物学的サンプルに含まれる。

図４はクライアントコンピュータ上に表示可能であるグラフィカルユーザインタフェースを表す。グラフィカルユーザインタフェースは、システムに記憶されているデータをブラウズするため使用されるツリーを表示するウィンドウ１０４を含む。ツリーのリーフを表現する複数の一般的なエンティティが存在する。「フォルダ」は、スペクトル、仮想ノートブック及びスタディのための一般的な入れ物でもよい。フォルダはブランチとしての役目を果たすことが可能であり、他のフォルダを収容可能である。多数のフォルダ、スタディ及び仮想ノートブックが各フォルダに存在し得る。「仮想ノートブック」は、サンプルプロパティ情報と、サンプルチップ又はバイオプロセッサーの構造を収容する。仮想ノートブックは以下で詳述される。「解析フォルダ」は解析データを収容できる。スペクトルは問い合わせツールによって解析フォルダに挿入できる。「インポート済みスペクトルフォルダ」は、カリフォルニア州フリーモントのＣｉｐｈｅｒｇｅｎＢｉｏｓｙｓｔｅｍｓ，Ｉｎｃから販売されているＰｒｏｔｅｉｎＣｈｉｐＳｏｆｔｗａｒｅ３．１．１（又はそれ以降のバージョン）のような外部ソースから獲得されたスペクトルデータを受け付ける。「削除済みスペクトルフォルダ」は削除されたスペクトルを保持する。

本発明の実施形態において、ユーザは、サンプルスポットに関連した値をクライアントコンピュータへ入力するため、「仮想ノートブック」を使用する。「仮想ノートブック」は、ユーザがサンプル名、詳細なサンプルタイプ、使用される詳細なＥＡＭ、詳細なフラクション、詳細なバインド及び洗浄条件などのようなサンプルスポット値を追跡記録し入力できる実験ノートブックの電子又は「仮想」表現である。それは、サンプルチップ上又はバイオプロセッサー内のサンプルスポットのグラフィカル表現であるグラフィック要素を備えたグラフィカルユーザインタフェースを含む。グラフィカルユーザインタフェースは、ユーザが少数のステップにおいてサンプルスポット値の組を１個以上のサンプルチップ又は１台以上のバイオプロセッサー上の多数のサンプルスポットに適用することを可能にさせる。ウェット実験室処理条件のような特性の値はサンプルスポットの表現に「仮想的に」適用される。

ユーザが仮想ノートブックを使用するとき、一連のタブが存在し、ユーザは、特定の実験手順に従って、１個以上のサンプルチップ、又は、サンプルチップを収容するバイオプロセッサーを「構成」するためにその一連のタブから選択を行う。ユーザが選択を行うことができるタブはグラフィカルユーザインタフェース上に与えられる。各タブは予め構成されたバイオプロセッサーの要素のリストを表現する。たとえば、タブは、バイオプロセッサー、アレイ、サンプル、ＥＡＭ、フラクション、並びに、洗浄及びバインドプロトコルに対応する。各タブは、バイオプロセッサーで使用するため仮想ノートブックに追加された、予め構成された要素のリスト（もしあれば）を収容する。たとえば、ＥＡＭタブは、より多数のＥＡＭを入力するか、又は、不要なＥＡＭを削除するためのボタンと共に特有のＥＡＭのリストを収容する。同様に、これらの要素はシステム内の他の仮想ノートブックからコピーアンドペーストされる。

図４に表されたウィンドウの右側に示されたデータテーブル１０２は、クライアントコンピュータ４４へ入力することができる様々なサンプル情報を表す。サンプル情報は、「サンプル」タブを選択することによりクライアントコンピュータ４４へ入力される。サンプル情報は、たとえば、サンプルと関連した外部参照コード、名前（たとえば、癌１）、患者（たとえば、ＣＡ−００１）、サンプルタイプ（たとえば、血清）、及び、特定グループ（たとえば、疾患、対照）を含む。

典型的な一実施例では、仮想ノートブックに追跡記録されているサンプルスポットから生成された新しいスペクトルは、それに関連した特有の値の組を有する。質量スペクトルはサンプルスポットに対する値で自動的にアノテートされる。たとえば、新しい質量スペクトルは、疾患患者からの血液サンプル及びシナピン酸ＥＡＭを含有するチップタイプＸ上のサンプルスポットから、レーザーエネルギーＹを使用して作成された。サンプルスポットの値（すなわち、チップタイプＸ、血液、疾病、シナピン酸、レーザーエネルギー＝Ｙ）は新しい質量スペクトルにアノテートされる。仮想ノートブックでは、各値はその固有データテーブルの範囲内で追跡記録されるので、各値は異なるサンプルチップ及びバイオプロセッサー上の異なるサンプルスポットに適用される。仮想ノートブックは、ユーザが複数のアレイ上の多数のサンプルスポットを同時に特徴付けることを可能にさせることにより、１個以上のサンプルスポットアレイを構成するための手続きを簡素化する。

多数のＷｉｎｄｏｗｓ^ＴＭ環境で普及しているような「ウィザード」は、仮想ノートブック内でサンプルチップ及びバイオプロセッサーのサンプルスポットを構成するユーザに指示し、ガイドするため設けられる。ウィザードは最初にバイオプロセッサー又はサンプルチップに関する情報を要求する。ウィザードは、ユーザがサンプルスポットアレイと、サンプル、フラクション、バインド及び洗浄、並びに、各サンプルスポットへのＥＡＭのようなサンプルスポット特性に関する値とを追加することを可能にさせる。サンプルスポットは、構成される実際のバイオプロセッサー又はサンプルチップ内のサンプルスポットのレイアウトに一致させるため配置されたマップを形成する。たとえば、簡単なテーブルは最大で１２個のアレイの情報を保持するように見える。テーブルの各列はサンプルチップのアレイを表現する。サンプルスポットは、使用される実際のバイオプロセッサー又はサンプルチップに並べられた順序と同じ順序で表される。ユーザは、特有の値をポイントアンドクリックするためマウス又はその他の入力装置を使用し、次に、これらの値がサンプルスポットの表現に適用される。同じサンプルスポットは、サンプルスポットに適用されるサンプルの種々のサンプルグループに応じて色分けしてもよい。

実例として、仮想ノートブックは図５に表されるようなグラフィカルユーザインタフェースを含む。１個以上のサンプルチップ上の種々のサンプルスポットの値は図５に表されたようなグラフィカルユーザインタフェースを使用してクライアントコンピュータ４４へ入力される。図５は、複数のサンプルチップ上の複数のサンプルスポットのグラフィカル表現であるグラフィック要素１０６を表す。本実施例では、１から１２までのラベルが付された１２台のサンプルチップの表現があり、各サンプルチップはサンプルスポットＡ−Ｈを有する。例示された１２台のサンプルチップは１台のバイオプロセッサー内の１２台のサンプルチップを表現する。バイオプロセッサーはホルダーと１２台のチップとを具備することがある。本実施例では、バイオプロセッサーはそれぞれが８個のサンプルスポットを備えた１２台のチップを有し、サンプルスポットの合計は９６個である。９６個のサンプルスポットは９６−ウェルプレートに類似した構造である。

本実施例では、グラフィック要素１０６は、バイオプロセッサー内のサンプルチップ上のサンプルスポットと全体的な外観が類似した丸い円によって図式的に表現される。しかし、他の実施形態ではグラフィック表現は異なる。たとえば、グラフィカル表現は、他の実施形態では、数字、文字、又は、その他の記号でもよい。

再度図２を参照すると、各サンプルチップ１０（ａ）、１０（ｂ）及び／又はバイオプロセッサー２００はバーコードＢＣ１、ＢＣ２又はその他の識別子を用いてクライアントコンピュータ４４に確認される。ユーザは、サンプルチップ識別子をクライアントコンピュータ及びシステムへ入力するため、バーコード番号をタイプ入力するか、又は、バーコードスキャナを使用する。図５を参照すると、データテーブル１００に表されるように、各サンプルチップはバーコード番号１０８が関連付けられる。

スポット数、チップタイプ、及び、ロット番号のような他の情報がデータテーブル１１０へ入力される。或いは、スポット数及びチップタイプは、バーコードの最初の３桁をチップタイプ及びフォーマット（サンプルチップの物理的レイアウトとスポット数）と関連付けるルックアップテーブルに基づいて、自動的に記入される。ボタン１１２は、ユーザがブランクを追加し、チップを追加し、選択された条件をチップに適用し、又は、チップを取り除くことができるように設けられる。したがって、バイオプロセッサーを構成するとき、バイオプロセッサーで使用されるサンプルスポットの個数とこれらのサンプルスポットに関連した値が変更される。

図６を参照すると、サンプルは選択されたサンプルスポットのグループ１０６に適用される。サンプルを選択されたサンプルスポットのグループに加えるため、「サンプル付加」ボタンが選択される。たとえば、サンプルテーブル１２８に表されたサンプルの一つが選択され、サンプルスポットに適用される。サンプルテーブル１２８は６個のサンプルを表し、ユーザはその中から選択することができる。たとえば、ユーザはマウス又はキーボードのような入力装置を使用してサンプル「３」を選択し、ユーザはサンプルチップ１−１２のそれぞれの位置「Ｃ」にあるサンプルスポットをハイライトさせる。ユーザは次に、サンプル３をバイオプロセッサー内の各サンプルチップ上のサンプルスポットＣに加えるため、「サンプル付加」ボタンを選択する。サンプル３はサンプルスポットＣへ「仮想的に」加えられる。後で、サンプル３をバイオプロセッサー内のサンプルチップ１−１２のサンプルスポットＣへ加える命令が、サンプル３を実際のバイオプロセッサー内のサンプルスポットＣへ加える多チャンネルピペットツールのような自動サンプルハンドリング装置によって実行される。

「サンプルオーバービュー」ボタン１０７が図６にさらに示されている。「サンプルオーバービュー」ボタン１０７を選択した後、図７に示されたウィンドウ１３２のようなウィンドウがユーザに向けて表示される。これは、ユーザがバイオプロセッサー内の種々のサンプルスポットへ加えられた種々のサンプルを調べることを可能にさせる。図示された実施例では、３個の癌サンプルと３個の正常サンプルが存在し、これらのサンプルがバイオプロセッサー内の異なるチップ上の異なるサンプルスポットに加えられる。

図８に示されるように、ＥＡＭ及びサンプルフラクション値は、種々のサンプルのそれぞれに関して、上記と同じ方法でサンプルスポットに加えられる。

図９はバイオプロセッサーオーバービュー画面を表す。この画面は、表形式の、一見してわかるようなバイオプロセッサーの実験レイアウトの図を与える。この図は参考のため印刷してもよい。バイオプロセッサーが構成された後、ユーザは、バイオプロセッサータブ（図４を参照）を選択し、関心のあるバイオプロセッサーを選択し、次に、「オーバービュー」ボタンを選択することにより、バイオプロセッサーの概要を表示させる。このボタンを選択した後、バイオプロセッサーの概要はテーブル又はチャート形式で提示される。図９に示されるように、バイオプロセッサー内の種々のサンプルスポットの特性の値がユーザのため一覧表にされる。

有利的には、本発明の実施形態を使用して、質量スペクトルを作成する前に、実験が容易に計画される。図９の実験レイアウトにあるデータのような実験データは、自動処理機器を使用して複数のサンプルチップのサンプルスポットへ自動的に加えられ、質量スペクトルが（たとえば、自動ピペットツール、自動チップ又はバイオプロセッサーハンドラ、及び、自動質量分析計を使用して）自動的に生成される。サンプルスポットに対する値は、サンプルスポットから形成される質量スペクトルを後でアノテーションするため保存される。さらに、上記のデータ入力プロセスは、生成された質量スペクトルごとに手動でアノテートするよりもユーザにとってより直観的に理解しやすいことが明白である。本発明の実施形態は、したがって、ユーザにとって従来のアノテーションプロセスよりも簡単に使用できる。

図２−３を再度参照すると、サンプルチップ上のサンプルスポットの値がクライアントコンピュータ４４へ入力された後、サンプルスポットの値はサーバコンピュータ４６へ送信される（ステップ２４）。入力された値は次に、サーバコンピュータ４６からアクセス可能であるデータベース４８に保存される。たとえば、図９に表された実験レイアウトに示されたデータはサーバコンピュータ４６へ送信され、データベース４８に保存される。データベース４８は、最終的に生成されたアノテートされた質量スペクトルと共に、未加工又は処理済みの質量スペクトルデータを同様に保存する。

入力されたサンプルスポット値とアノテートされた質量スペクトル及びアノテートされていない質量スペクトルとを保存するため集中サーバコンピュータ４６及びデータベース４８を使用することは有利である。たとえば、何百或いは何千もの質量スペクトルが自動処理技術を使用して直ちに生成される。膨大な数の質量スペクトルは非常にデータ集約的であり、典型的なクライアントコンピュータを使用して処理し解析することは困難である。したがって、使用されるデータネットワーク内にある多数のクライアントコンピュータの所要メモリ量を減少させるため、質量スペクトル、及び、質量スペクトルに関連した値を大規模なデータ記憶容量をもつ集中データベース４８に保存することが望ましい。さらに、集中サーバコンピュータ４６及びデータベース４８を使用することにより、それ以外のものは、各ユーザが自分専用のクライアントコンピュータを使用して質量スペクトルデータを処理し保存する場合よりも簡単に質量スペクトル情報を共有する。

サンプルチップ１０（ａ）、１０（ｂ）が質量分析計４２によって処理する準備ができているとき、クライアントコンピュータ４４、質量分析計４２、及び／又は、オートローダ４０に接続されたスキャナ（図示せず）は、サンプルチップ１０（ａ）、１０（ｂ）上のバーコードＢＣ１、ＢＣ２又はその他の識別子を自動的に読む。

バーコードＢＣ１、ＢＣ２を使用して、サンプルチップ１０（ａ）、１０（ｂ）上のサンプルスポット１４（ａ）−１４（ｄ）、１４（ａ）’−１４（ｄ）’に対する特定の値がサーバコンピュータ４６を使用して取り出される（ステップ２６）。取得前に、質量分析計を制御するソフトウェアはサンプルチップ１０（ａ）、１０（ｂ）上のバーコードＢＣ１、ＢＣ２を読む。クライアントコンピュータ４４上のソフトウェアは、バーコード情報ＢＣ１、ＢＣ２と共にＳＯＡＰ要求のような要求をサーバコンピュータ４６へ送信する。（ＳＯＡＰはシンプルオブジェクトアクセスプロトコルを表し、ベーストランスポートとしてＨＴＴＰを使用し、プラットフォームに依存せずにサービス、オブジェクト及びサーバにアクセスするため呼び出し要求及び応答を符号化する方法としてＸＭＬを使用するメッセージングプロトコルである。）サーバコンピュータ４６は、サンプルスポット１４（ａ）−１４（ｄ）、１４（ａ）’−１４（ｄ）’のそれぞれに対して予め入力されたサンプル値をクライアントコンピュータ４４へ返信する。

値がサーバコンピュータ４６から取り出される前後に、質量分析計４２は、サンプルスポット１４（ａ）−１４（ｄ）、１４（ａ）’−１４（ｄ）’上にあるサンプルから質量スペクトルを作成する（ステップ２８）。質量スペクトルを作成する典型的なプロセスにおいて、サンプルチップは質量分析計の注入系統へ導入される。サンプルチップ上のサンプル中のタンパク質のような物質が次にイオン化される。イオンが発生された後、発生されたイオンはイオン光学組立体によって収集され、次に、質量分析装置が通過するイオンを分散させ、分析する。質量分析装置を出るイオンは検出器によって検出される。飛行時間質量分析装置において、イオンは短い高電圧場の中で加速され、高真空チャンバに流れ込む。高真空チャンバの遠端で、加速されたイオンは様々な時間に高感度検出器表面に衝突する。イオンの飛行時間はイオンの質量電荷比の関数であるため、イオン化と衝突との間の経過時間は特有の質量電荷比の分子の有無を識別するため使用される。

質量スペクトルが質量分析計４２によって生成された後、それらは、質量分析計４２に接続されたクライアントコンピュータ４４内の適切なソフトウェアによって自動的に処理される。スペクトル処理方法は、ベースラインサブトラクション、フィルタリング、ピーク検出、スポット補正キャリブレーション、及び、オプションとしての正規化を含む。これらのプロセスは以下に詳述される。

さらに、質量干渉計４２が質量スペクトルを作成した後、クライアントコンピュータ４４は、各質量スペクトルを、その質量スペクトルが作成されたサンプルスポットに関連した値でアノテートする（ステップ３２）。アノテートされると、アノテートされた各質量スペクトルは、データベース４８に記憶するため、又は、クライアントコンピュータ４４内の記憶装置に記憶するため、サーバコンピュータ４６へ返信される。

質量スペクトルを「アノテート」することは、その質量スペクトルを作成するため使用されたサンプルスポットに対する値を質量スペクトルデータと相関させることを意味する。質量スペクトルデータは、（信号強度対Ｍ／Ｚのプロットにおけるような）グラフィカル形式でもよく、又は、表形式でもよい。たとえば、ＥＡＭ＝シナピン酸、サンプル＝癌１、及び、チップタイプ＝Ｘのような値は、これらの値を有するサンプルスポットから取り出された質量スペクトルデータにリンクされる。

取得後、各スペクトルは、サーバコンピュータ４６から受信され記憶された値すべてを格納するＸＭＬファイルフォーマットで保存される。このことによって、各質量スペクトルは、その質量スペクトルが発生させられたサーバコンピュータを含む任意のサーバコンピュータへロードする準備ができたその自体のエンティティになる。質量スペクトルＸＭＬファイルは、未加工のＴＯＦデータ、（前のステップでセットアップされたパラメータに応じて）正規化されていない（又は正規化された）処理済みデータ、較正され（スポット補正が可能であるならば）スポット補正された質量、サンプルプロパティ情報、フィルタリング及びベースラインパラメータのような処理パラメータ、及び、取得情報を収容する。チェックサムは、ＴＯＦデータがクライアントコンピュータとサーバコンピュータとの間データの受け渡し中に変更されなかったことを保証するため、未加工のＴＯＦデータ、処理済みのデータ、及び、ファイルの全部に対して計算される。スポット補正ファクタもまたファイルに保存される。

アノテートされたスペクトルは次にサーバコンピュータ４６によってデータベース４８へロードされる。スペクトルファイルはデータベース４８の特定のフォルダへ保存される。スペクトルを手動でロードするとき、スペクトルが属するフォルダを指定することができる。自動ローディングのとき、スペクトルはデータベース４８のデフォルトフォルダに保存される。スペクトルを（たとえば、ｈｔｔｐｐｏｓｔを用いて）サーバコンピュータへ自動送信するとき、フォルダ名は、スペクトルがデータベース４８に保存されるべきであるかどうかを示すためポストと共に送信される。たとえば、文字列「ＢＤＣｐｒｏｊｅｃｔ＼Ｑ１０３＼Ｒｅｐｌｉｃａｔｅａｎａｌｙｓｉｓ」はｈｔｔｐｐｏｓｔと共に送信されるならば、フォルダの階層がデータベース４８に作成される。フォルダ「ＢＤＣｐｒｏｊｅｃｔ」は「Ｒｅｐｌｉｃａｔｅａｎａｌｙｓｉｓ」を格納する「Ｑ０１３］を収容する。

質量スペクトルがアノテートされた後、各質量スペクトルはさらに処理される。たとえば、何らかの方法で質量スペクトルを改善するか、又は、関心のあるピークを同定するアルゴリズムが質量スペクトルに適用される。このようなアルゴリズムは、ＴＩＣ（全イオン電流）正規化、キャリブレーション、ピーク同定、ベースラインサブトラクション、及び、フィルタリングを実行する。

正規化は、条件の差を原因とするスペクトル間の変動を説明し、引き続く数値計算の精度を改善するためデータセット内の数を線形スケーリングするプロセスである。全イオン電流による正規化は、異なる日、又は、異なる機器で生成されたスペクトルを調査するときに役立つ。正規化プロセスは全てのサンプルスポットに対して使用された全電流イオンを利用し、強度を平均化し、表示されるデータが同じスケールであるように全てのサンプルスポットに対して強度スケールを調整する。

キャリブレーションプロセスは質量分析プロセスにおける系統誤差を較正する。キャリブレーションは内部的にも外部的にも実行される。内部キャリブレーションでは、分析されるサンプルはＭ／Ｚが既知である１個以上のサンプルを含む。既知サンプルに対して得られたＭ／Ｚの差は未知サンプルのＭ／Ｚを補正するため使用される。外部キャリブレーションでは、上記の内部キャリブレーションによって作成されたような飛行時間をＭ／Ｚ比に変換する関数が、内部キャリブレーションを用いることなく、飛行時間スペクトルに適用される。典型的なキャリブレーション方法は、２００２年７月１１に出願された米国特許出願第１０／１９４，４５２号明細書、発明の名称“ＭｅｔｈｏｄｓｆｏｒＣａｌｉｂｒａｔｉｎｇａＭａｓｓＳｐｅｃｔｒｏｍｅｔｅｒ”に記載されている。

ＣｉｐｈｅｒｇｅｎのＰｒｏｔｅｉｎＣｈｉｐ（登録商標）ソフトウェアで使用されるようなピーク同定プロセスはピークの検出を自動化し、本発明の実施形態で使用可能である。一般に、このソフトウェアは、選択されたスレッショルドよりも高い信号対雑音比を有する信号を識別し、ピーク信号の中心のピークの質量にラベルを付けることにより機能する。一つの有用なアプリケーションでは、多数のスペクトルが質量スペクトルのある選択されたパーセンテージに存在する同一のピークを識別するため比較される。このソフトウェアのあるバージョンは、定義された質量範囲内の種々のスペクトルに現れる全てのピークを分類し、質量（Ｍ／Ｚ）を質量（Ｍ／Ｚ）クラスタの中間点付近にある全てのピークに割り当てる。典型的なピーク同定方法は、発明の名称がどちらも“ＭｅｔｈｏｄＦｏｒＡｎａｌｙｚｉｎｇＭａｓｓＳｐｅｃｔｒａ”である２００１年１１月１５日に出願された米国特許出願第１０／０８４，５８７号明細書、及び、２００１年１１月１５日に出願された米国特許出願第０９／９９９，０８１号明細書に記載される。

ベースラインサブトラクションプロセスは同じ質量スペクトルデータに対して実行される。ベースラインサブトラクションプロセスは、スペクトルを乱す人工的な、再現可能な機器オフセットを除去することによりデータ定量化を改善する。それは、ピーク幅のようなパラメータを組み込むアルゴリズムを使用するスペクトルベースラインの計算と、質量スペクトルからのベースラインの減算とを伴う。

質量スペクトルデータはさらにフィルタ処理される。高周波雑音信号は平滑化関数の適用によって除去される。典型的な平滑化関数は、移動平均関数を時間に依存したビンに適用する。改良バージョンでは、移動平均フィルタは、フィルタの帯域幅が、たとえば、一般的に、飛行時間の増加に伴って広くなるピーク帯域幅の関数として変化する可変幅デジタルフィルタである。国際公開第００／７０６４８号パンフレット、２０００年１１月２３日（Ｇａｖｉｎ外、“ＶａｒｉａｂｌｅＷｉｄｔｈＤｉｇｉｔａｌＦｉｌｔｅｒｆｏｒＴｉｍｅ−ｏｆ−ｆｌｉｇｈｔＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ”）を参照のこと。

一部の実施形態では、スペクトルは、質量スペクトルを（たとえば、自動的に）分析するため、問い合わせ条件を満たすスペクトルをデータベースに問い合わせることにより、一体的にスタディに集められる。本明細書で使用されるように、「分析」は、スペクトルから有用な情報を得るため、又は、得ることを試みるため質量スペクトルを適当な方法で分析又は処理することを含む。たとえば、質量スペクトルは潜在的なマーカーを発見するため分析される。別の実施例では、質量スペクトルは分類モデルを形成するため分析され、及び／又は、特有のクラス（たとえば、疾患又は正常）に従ってスペクトル（及びそれらに対応するサンプル）を分類するため分析される。たとえば、これらの条件は、フォルダ、取得の時間、ユーザ、アレイタイプ、サンプルタイプ、患者、グループなどに基づく。類似した処理条件下でスペクトルを比較するため、質量スペクトルのグループは所定の値の組で選択される（図３のステップ３２）。図１０に示されるように、ユーザは、多数の異なるデータフィールド１６２から共通の特性を選択し、これらの選択された特性がウィンドウ１６４に表示される。ウィンドウ１６６に表されているように、チップタイプ「ＩＭＡＣ３」と、ＥＡＭ（エネルギー吸収材）ＳＰＡ（シナピン酸）を使用して作成された８個のスペクトルは一つのグループに集められる。

図２−３を再度参照すると、所定の値の組をもつ質量スペクトルのグループを選択した後、グループ化されたスペクトルが分析される（ステップ３４）。たとえば、グループ化されたスペクトルは、スペクトルと関連した様々なサンプルグループを区別する潜在的なバイオマーカーを明らかにするかどうかを決定するため、統計的プロセスを使用して分析される。これらのステップを実行するコードは、クライアントコンピュータ４４又はサーバコンピュータ４６にある分析モジュールに存在する。

一部の実施形態では、分析モジュールは選択されグループ化された質量スペクトルデータに分析アルゴリズムを適用する。分析モジュールは、階層クラスタリング、ｐ値プロット、及び、マルチコンディションビジュアライゼーションのような分析プロセスを使用する。

再帰的分割解析のような統計的プロセスは同様にスペクトルを分類するため使用される。一体的にグループ化されたスペクトルは、分類モデルを使用するパターン認識プロセスを使用して分類可能である。一般に、スペクトルは、分類アルゴリズムが求められた少なくとも２種類のグループからのサンプルを表す。たとえば、グループは、疾患対非疾患（たとえば、癌対非癌）、薬物反応者対薬物非反応者、毒性反応対毒性非反応、疾病進行対疾病非進行、形質コンディション有り対形質コンディション無しである。

一部の実施形態では、「既知サンプル」のようなサンプルを使用して発生させられたスペクトル（たとえば、質量スペクトル又は飛行時間スペクトル）から導出されたデータは、次に、分類モデルを「訓練」するため使用される。「既知サンプル」は予め分類されたサンプルである。スペクトルから導出され、分類モデルを形成するため使用されるデータは、「訓練データセット」と呼ばれる。一旦訓練されると、分類モデルは未知サンプルを使用して発生させられたスペクトルから導出されたデータ中のパターンを認識できる。分類モデルはその後未知サンプルをクラスに分類するため使用できる。これは、たとえば、特定の生物学的サンプルがある種の生物学的条件（たとえば、疾病対非疾病）に関連しているかどうかを予測する際に役立つ。

分類モデルを形成するため使用される訓練データセットは未加工データ又は前処理済みデータを含む。一部の実施形態では、未加工データは飛行時間スペクトル又は質量スペクトルから直接的に得られ、上記のようにオプション的に「前処理」される。

分類モデルは、多数のデータを、データに存在する客観的パラメータに基づいて、クラスに分離しようとする適当な統計的分類（又は「学習」）方法を使用して形成される。分類方法は教師付きでも教師無しでもよい。教師付き分類プロセス及び教師無し分類プロセスの実施例は、参照によってその全体がここに組み込まれたＪａｉｎ，“ＳｔａｔｉｓｔｉｃａｌＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉｏｎ：ＡＲｅｖｉｅｗ”，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＰａｔｔｅｒｎＡｎａｌｙｓｉｓａｎｄＭａｃｈｉｎｅＩｎｔｅｌｌｉｇｅｎｃｅ，Ｖｏｌ．２２，Ｎｏ．１，Ｊａｎｕａｒｙ２０００に記載されている。

教師付き分類では、既知カテゴリーの例を収容する訓練データは学習機械に提示され、学習機械は既知クラスのそれぞれを定義する１組以上の関係を学習する。新しいデータが次に学習機械に適用され、学習機械は学習した関係を使用して新しいデータを分類する。教師付き分類プロセスの実施例には、線形回帰プロセス（たとえば、多重線形回帰（ＭＬＲ）、部分最小自乗（ＰＬＳ）回帰、及び、主成分回帰（ＰＣＲ））と、二分決定木（たとえば、ＣＡＲＴ−分類及び回帰木のような再帰的分割プロセス）と、バックプロパゲーションネットワークのような人工神経回路網と、判別分析（たとえば、ベイズ分類器又はフィッシャー分析）と、ロジスティック分類と、サポートベクトル分類器（サポートベクトル機械）とが含まれる。

好ましい教師付き分類方法は再帰的分割プロセスである。再帰的分割プロセスは未知サンプルから得られたスペクトルを分類するため再帰的分割木を使用する。再帰的分割プロセスに関するより詳細は、２０００年１１月１６日に出願された米国仮特許出願第６０／２４９，８３５号明細書、２０００年１２月１１日に出願された米国仮特許出願第６０／２５４，７４６号明細書、２００１年１１月１５日に出願された米国特許出願第０９／９９９，０８１号明細書、及び、２００２年２月２５日に出願された米国特許出願第１０／０８４，５８７号明細書にある。これらの米国仮特許出願及び特許出願のすべては、あらゆる目的のためその全体が参照によって本明細書に組み込まれる。

他の実施形態では、作成された分類方法は教師無し学習方法を使用して形成される。教師無し分類は、訓練データセットが得られたスペクトルを予め分類することなく、訓練データセット内の類似性に基づいて分類を学習することを試みる。教師無し学習方法はクラスタ分析を含む。クラスタ分析は、データを、理想的には互いに非常に類似し、他のクラスタのメンバーとは非常に異なるメンバーを有するべきである「クラスタ」、すなわち、グループに分割しようとする。類似性は、データ項目間の距離を測定し、互いに接近したデータ項目を一緒に集めるある種の距離メトリックを使用して測定される。クラスタリング技術は、ＭａｃＱｕｅｅｎのＫ平均アルゴリズムとコホーネンの自己組織化マップアルゴリズムを含む。

他の信号処理ステップは、グループ化された質量スペクトル内の関心のあるピークの同定を助けるため、信号処理モジュールによってグループ化された質量スペクトルに関して実行される。たとえば、図１１は、ユーザがファーストパス信号対雑音比、最小ピークスレッショルド％、クラスタ質量ウィンドウ％、セカンドパスＳ／Ｎ比、又は、特定のＭ／Ｚ範囲を入力できるグラフィカルユーザインタフェースを表す。それは同様に、ユーザがクラスタを完成するため推定ピークを追加することを可能にさせる。「ファーストパスＳ／Ｎ」は、ユーザがピーク検出の第１パスの感度を指定することを可能にさせる。この数が高いほど、検出されるピークの数は小さい。「最小ピークスレッショルド％」は、ユーザがクラスタを形成するためにピークが出現しなければならないスペクトルのパーセンテージを指定することを可能にさせる。「クラスタ質量ウィンドウ％」は、ユーザがクラスタ質量ウィンドウの幅を指定することを可能にさせる。「セカンドパスＳ／Ｎ」は、より小さいピークが既存クラスタへ追加され得るように、ユーザがピーク検出の第２パスを起動することを可能にさせる。第２パスの感度は最小信号対雑音値を変更することによって調整される。「Ｍ／Ｚ範囲下限」は、ユーザが第２パスの開始質量を指定することを可能にさせる。「Ｍ／Ｚ範囲上限」は、ユーザが第２パスの終了質量を指定することを可能にさせる。「クラスタを完成するため推定ピークを追加」はユーザが推定ピークを、所与のクラスタ内にまだピークをもたないスペクトルに追加することを可能にさせる。

図１２は、ｐ値又はＭ／Ｚ値のような列によってソートされたスペクトルのクラスタ化されたピークのリストを表すグラフィカルユーザインタフェースを示す。クラスタマップ及びヒートマップのような他の視覚化ツールはスペクトルのクラスタ間の類似性又は非類似性を表す。ハートマップ４０３及び樹状図（又はクラスタマップ）４０１の実施例は図１７に示されている。樹状図４０１において、隣接した一対のラインの長さはスペクトルの類似性又は非類似性の程度を表す。たとえば、一部の実施形態では、一対の隣接したラインが長くなると、スペクトルの非類似性が大きくなる。樹状図ボタン４０５は、ユーザが（たとえば、バイオプロセッサーにおいて）列又は行によりスペクトルを分類できるようにするためユーザによって選択される。

階層クラスタリング及びヒートマップ視覚化技術は、Ｅｉｓｅｎ外，“ＣｌｕｓｔｅｒＡｎａｌｙｓｉｓａｎｄＤｉｓｐｌａｙｏｆＧｅｎｏｍｅ−ＷｉｄｅＥｘｐｒｅｓｓｉｏｎＰａｔｔｅｒｎ”，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，Ｖｏｌ．９５，ｐｐ．１４８６３−１４８５８，Ｄｅｃｅｍｂｅｒ１９９８に記載されている。この論文に記載されたアルゴリズムは、しかし、本発明の実施形態で使用されるアルゴリズムとは異なる。本発明の実施形態では、ヒートマップの各列はスペクトルに対応し、各行はクラスタ（又は潜在的なマーカー）に対応し、各セルはピークに対応する。各セルの色及び強度は対応するピークの対数正規化強度によって決定され、それは、次の式、
対数正規化強度＝対数強度−対数平均強度
によって定義される。対数正規化強度はマップ内の最大絶対値対数正規化強度によってさらに除算される。その商は最終的にＲＧＢ（赤、緑、及び、青）値に変換され、正値は赤に割り付けられ、負値は緑に割り付けられる。

分析モジュールは発現差解析を実行するコードを含む。たとえば、図１３に示されたグラフィカルユーザインタフェースでは、第１のウィンドウ１７６は、スペクトルの二つのグループにおいてＭ／Ｚ値が約６９５８．１４５のときにピーククラスタ１１内のピークを表す。グループ１は、１００フェムトモル（ｆｍ）のグループを表現し、６９６９．４６の周辺に３個のピークを有し、グループ２は、３００フェムトモル（ｆｍ）のグループを表現し、６９５７．０４４の周辺に５個のピークを有する。８個のピークに関係するデータがウィンドウ１７４内のテーブルに一覧表示される。データは、ピークが推定ピークであるかどうか、ピーク数、グループインデックス、クラスタインデックス、Ｍ／Ｚ値、電荷、イオン質量、及び、信号対雑音比（Ｓ／Ｎ）を含む。ウィンドウ１７２内のグラフは、１００ｆｍと３００ｆｍにおけるピーククラスタを表すため使用される。ウィンドウ１７２に表されるように、ピークは１００ｆｍサンプルと３００ｆｍサンプルに対して別々に集まるので、約６９５８．１４５のＭ／Ｚ値と関連した物質が二つのサンプルグループを区別することを示す。

図１４は、ユーザが質量スペクトルの特定のグループを見つけることを可能にする問い合わせツールを表す。図１４のウィンドウ１８２に示されるように、ユーザは、エネルギー吸収材としての「ＳＰＡ」と、チップタイプとしての「ＷＣＸ２」のような特有の情報を入力し、これらの値を有するスペクトルを検索する。問い合わせの結果は図１４のウィンドウ１８４に示される。ウィンドウ１８４に示されるように、ＷＣＸ２とＳＰＡに関連した質量スペクトルだけが一覧表示される。

図１５は、スペクトルのグループ、及び、スペクトルがシステム内でどのように操作できるかを示すグラフィカルユーザインタフェースを表す。図からわかるように、ユーザは、図示されたドロップダウンメニュー内の適切な項目を選択することにより、スペクトルを切り取り、スペクトルをコピーし、スペクトルを貼り付け、スペクトルを選択し、変更を更新し、スペクトルを削除し、スペクトルをエクスポートし、スペクトルのピークを取得し、未加工のスペクトルを取得し、レポートを作成し、スペクトルプロパティを獲得し、スペクトルを正規化する。

ユーザはまた各個別のスペクトルのプロパティを閲覧する。たとえば、図１６は、特定の質量スペクトルの特定のプロパティを含むグラフィカルユーザインタフェースを表す。図からわかるように、質量スペクトルデータは、グループ、フラクション名などのような情報でアノテートされる。

本発明の一部の実施形態では、上記の種々のテーブル及び画面は、様々なタイプのユーザのため「動的に変更」される。たとえば、図４は、ユーザがサンプルデータを入力するテーブル１０２を含むグラフィカルユーザインタフェースのスクリーンショットを表す。図からわかるように、テーブル１０２は列を含む。各列は、リレーショナルデータベースのようなデータベースで見つけられる種々の情報を含む。たとえば、図からわかるように、「患者」列は患者を識別する情報を含む。テーブル１０２は人間の生物学的サンプルを分析したいと思うユーザの役に立つが、テーブル１０２は植物の生物学的サンプルに関係するデータをシステムへ入力したいと思うユーザの役に立たない。

従来、図４に表されるようなスクリーンショットを表示するグラフィカルユーザインタフェースを生成するため、リレーショナルデータベース要素間のマッピングと、プログラミングオブジェクトと、グラフィカルユーザインタフェース（ＧＵＩ）のためのコードがソースコードにハードコード化される。したがって、異なるユーザのためにテーブル１０２のデータビューを変更したい場合、テーブルに対応するオブジェクト及びＧＵＩのコードを含むソースコードは、そのテーブルのためコンパイルされるべきであろう。このソースコードは同様に、再コンパイルされ、テストされ、ソフトウェアを使用する全てのエンティティに配置されるべきであろう。

本発明の一部の実施形態では、ＧＵＩ要素をデータベース内のデータオブジェクトに割り付けるマッピングフレームワークを含む外部コンフィギュレーションファイルが設けられる。データオブジェクトは、汎用的であり、動的拡張可能である。オブジェクトのためのデータはオブジェクトのマッピングに基づいて検索され、ＧＵＩはＧＵＩ要素及び検索されたデータを使用して表示される。

データは、データベースに常駐する汎用的な動的拡張可能オブジェクトの内部で１個以上のアレイに格納される。コンフィギュレーションファイル内のマッピングフレームワークはデータベースからデータを取り出すため使用される。たとえば、データベース内のテーブルは、「患者名」の列及び「血液型」の列を有する。データテーブルは２行を有する。第１行は「患者名」の下のエントリーとして「患者Ａ」を、「血液型」のエントリーとして「Ｂ型Ｒｈマイナス」を有する。第２行は「患者名」のエントリーとして「患者Ｂ」を、「血液型」のエントリーとして「Ｂ型Ｒｈプラス」を有する。「患者Ａ」及び「Ｂ型Ｒｈマイナス」を含むテーブル内の水平行のデータは「オブジェクト」を構成する。

上記のように、多重多様なユーザのために適合するように図４に表されたテーブルを変更したい場合がある。たとえば、列に表示されたデータを追加、削除、又は、変更したい場合がある。この場合、異なるデータで変更された列及び新しいテーブルは、マッピングフレームワークの再コンパイルや変更を必要とすることなく、そのマッピングフレームワークを使用して生成される。たとえば、図４に示されたテーブル１０２を参照すると、コンフィギュレーションファイルは、テーブル１０２を生成するためマッピングフレームワークを含む。テーブルは「患者」列のためのエントリーを含む。このエントリーは、データベースの汎用オブジェクトの内部アレイに記憶された患者データへのマッピングを含む。生物学的な植物名のため様々な植物名を表示したい場合には、「患者」を「植物名」で置き換えたエントリーがコンフィギュレーションファイルに包含され、そのエントリーはデータベース内の種々の植物データへのマッピングリファレンスを含む。種々のデータは既にデータベースに収容されていることが仮定されている。もしそうでなければ、種々のデータはデータベースに追加できるか、又は、マッピングフレームワークからアクセス可能である。上記のように、マッピングフレームワークは汎用オブジェクトを読み、汎用オブジェクトをＧＵＩ要素へ割り付けるため構成される。したがって、汎用オブジェクトが変更されるとしても、フレームワークは依然として変更されたオブジェクトを適切なＧＵＩ要素へ割り付けることが可能である。種々のデータはＧＵＩ要素へ割り付けられ、表示される。再コンパイルは不要であり、マッピングフレームワークは実質的な様態で変更される必要がない。

ハッシュテーブルもまたデータを記憶し検索するためのメカニズムとして使用される。ハッシュテーブルは本発明の実施形態で使用可能であるが、ハッシュテーブルは、本明細書で説明されたマッピングフレームワークよりも多くのメモリを必要とし、速度が遅い。マッピングフレームワークはそれにもかかわらず、コマンドをアレイ内の値を取得又は設定するコマンドに変換することにより、汎用オブジェクトのデータのアレイ内のデータにアクセスするため、ｇｅｔＶａｌｕｅ（キー文字列）、及び、ｓｅｔＶａｌｕｅ（キー文字列、オブジェクト値）のような典型的にハッシュテーブルにアクセスするため使用されるコマンドを使用する。

以上の説明は本発明の一部の好ましい実施形態を対象にしているが、本発明のその他及びさらなる実施形態が本発明の基本的な範囲から逸脱することなく考え出される。このような代替的な実施形態は本発明の範囲に包含されることが意図される。さらに、本発明の一つ以上の実施形態の特徴は、本発明の範囲を逸脱することなく本発明の他の実施形態の一つ以上の実施形態と組み合わされる。

本願において引用された全ての刊行物及び特許文献は、個々の刊行物又は特許文献が個別に表示されるのと同じ程度に、あらゆる目的のためその全体が参照によって組み込まれる。本明細書に種々の参考文献を引用しているが、出願人は特定の参考文献が本発明に対して「先行技術」であることを認めるものではない。

質量スペクトルを表す図である。本発明の一実施形態によるシステムを表す図である。本発明の一実施形態による方法を表すフローチャートである。ユーザがサンプルデータを入力可能なグラフィカルユーザインタフェースを表す図である。バイオプロセッサー内のチップ上の複数のサンプルポイントを表現するグラフィック要素のアレイを示すグラフィカルユーザインタフェースを表す図である。グラフィック要素のアレイ及びサンプルデータを示すグラフィカルユーザインタフェースを表す図である。サンプルタイプのアレイを示す別のウィンドウと共に図６に示されたグラフィカルユーザインタフェースを表す図である。グラフィック要素のアレイ及び選択できるＥＡＭを含む第１のウィンドウと、グラフィック要素のアレイ及び選択できるフラクションを含む第２のウィンドウを表す図である。サンプルスポットのアレイ中の種々のサンプルスポットと関連した異なる値を示すデータアレイを表す図である。ユーザが選択された値に応じてスペクトルを分類することを可能にさせるグラフィカルユーザインタフェースを表す図である。ユーザが所定の規準に従って複数の質量スペクトル内のピークのクラスタを選択するため使用することができるユーザインタフェースを表す図である。ユーザが分類されたスペクトルを分析することができるウィンドウを表す図である。発現差解析プロセスに従って処理されたスペクトルのグループを表す図である。ユーザが所定の値に従ってスペクトルを検索することができるウィンドウを表す図である。個別のスペクトルがより詳細に表示され得るウィンドウを表す図である。特定の質量スペクトルと関連した値を含むウィンドウを表す図である。ヒートマップ及び樹状図を示すスクリーンショットを表す図である。

Claims

（ａ）１個以上のサンプルチップ上の複数のサンプルスポットと関連した値であって、グラフィカルユーザインタフェース上に前記サンプルスポットを表現するグラフィック要素を使用して入力された値を受信するステップと、
（ｂ）前記サンプルスポットから生成される複数の信号を表現するデータを受信するステップと、
（ｃ）前記複数の信号中の各信号を、前記信号が生成された前記サンプルスポットと関連した値の組で自動的にアノテートするステップと、
を含む、複数の信号を処理する方法。
前記信号が質量スペクトルである、請求項１記載の方法。
ステップ（ａ）の前に、
前記複数のサンプルスポットと関連した前記値をクライアントコンピュータへ入力するステップと、
前記複数のサンプルスポットと関連した前記入力された値を前記クライアントコンピュータからサーバコンピュータへ送信するステップと、
前記クライアントコンピュータで前記サーバコンピュータから前記入力された値を受信するステップと、
をさらに含む、請求項１記載の方法。
前記複数のサンプルスポットと関連した前記値が、サンプル同定情報、特定のサンプルタイプ、特有のエネルギー吸収マトリックス材料、特有の洗浄条件、及び、特有のクロマトグラフィーフラクションよりなる群から選択された少なくとも一つを含む、請求項１記載の方法。
前記信号がスペクトルであり、
ステップ（ｃ）の後に、
（ｄ）前記値の組を選択するステップと、
（ｅ）前記選択された値の組を有するスペクトルのグループを選択するステップと、
（ｆ）ステップ（ｅ）で選択された前記選択されたスペクトルのグループを分析するステップと、
をさらに含む、請求項１記載の方法。
前記選択されたスペクトルのグループを分析するステップ（ｆ）が前記選択されたスペクトルのグループに統計的分析プロセスを実行するステップを含む、請求項５記載の方法。
前記選択されたスペクトルのグループを分析するステップ（ｆ）が発現差解析又は再帰的分割プロセスを実行するステップを含む、請求項５記載の方法。
前記信号が質量スペクトルであり、
（ｄ）複数の質量スペクトルを発生させるステップをさらに含む、
請求項１記載の方法。
前記信号が質量スペクトルであり、
（ｄ）表面増強レーザー脱離イオン化プロセスを使用して複数の質量スペクトルを発生させるステップをさらに含む、
請求項１記載の方法。
前記信号が質量スペクトルであり、
ステップ（ａ）の前に、
（ｄ）前記グラフィカルユーザインタフェース上の前記グラフィック要素を使用して前記値を入力するステップと、
（ｅ）ステップ（ｄ）で入力された前記値を使用して前記１個以上のサンプルチップに前記複数のサンプルスポットを準備するステップと、
（ｅ）表面増強レーザー脱離イオン化プロセスを使用し、ステップ（ｄ）で入力された前記値を使用し、複数の質量スペクトルを発生させるステップと、
をさらに含む、請求項１記載の方法。
前記信号が質量スペクトルであり、
ステップ（ａ）の前に、
（ｄ）前記グラフィカルユーザインタフェース上の前記グラフィック要素を使用して前記値を入力するステップと、
（ｅ）ステップ（ｄ）で入力された前記値を使用して前記１個以上のサンプルチップに前記複数のサンプルスポットを準備するステップと、
（ｅ）表面増強レーザー脱離イオン化プロセスを使用し、ステップ（ｄ）で入力された前記値を使用し、複数の質量スペクトルを発生させるステップと、
をさらに含み、
ステップ（ｄ）−（ｅ）が自動的に実行される、
請求項１記載の方法。
（ａ）１個以上のサンプルチップ上の複数のサンプルスポットと関連した値であって、グラフィカルユーザインタフェース上に前記サンプルスポットを表現するグラフィック要素を使用して入力された値を受信するコードと、
（ｂ）前記サンプルスポットから生成された複数の信号を表現するデータを受信するコードと、
（ｃ）前記複数の信号中の各信号を、前記信号が生成された前記サンプルスポットと関連した値の組で自動的にアノテートするコードと、
を含むコンピュータ読み取り可能な媒体。
前記信号が質量スペクトルである、請求項１２記載のコンピュータ読み取り可能な媒体。
前記複数のサンプルスポットと関連した前記値をクライアントコンピュータへ入力するコードと、
前記複数のサンプルスポットと関連した前記入力された値を前記クライアントコンピュータからサーバコンピュータへ送信するコードと、
前記クライアントコンピュータで前記サーバコンピュータから前記入力された値を受信するコードと、
をさらに含む、請求項１２記載のコンピュータ読み取り可能な媒体。
前記複数のサンプルスポットと関連した前記値が、サンプル同定情報、特有のサンプルタイプ、特有のエネルギー吸収マトリックス材料、特有の洗浄条件、及び、特有のクロマトグラフィーフラクションよりなる群から選択された少なくとも一つを含む、請求項１２記載のコンピュータ読み取り可能な媒体。
前記信号がスペクトルであり、
（ｄ）前記値の組を選択するコードと、
（ｅ）前記選択された値の組を有するスペクトルのグループを選択するコードと、
（ｆ）コード（ｅ）で選択された前記選択されたスペクトルのグループを分析するコードと、
をさらに含む、請求項１２記載のコンピュータ読み取り可能な媒体。
前記選択されたスペクトルのグループを分析するコード（ｆ）が前記選択されたスペクトルのグループに統計的分析プロセスを実行するコードを含む、請求項１６記載のコンピュータ読み取り可能な媒体。
前記選択されたスペクトルのグループを分析するコード（ｆ）が発現差解析又は再帰的分割プロセスを実行するコードを含む、請求項１６記載のコンピュータ読み取り可能な媒体。
（ｄ）前記グラフィカルユーザインタフェース上の前記グラフィック要素を使用して前記値を入力するコードと、
（ｅ）コード（ｄ）で入力された前記値を使用して前記１個以上のサンプルチップに前記複数のサンプルスポットを準備するコードと、
（ｅ）表面増強レーザー脱離イオン化プロセスを使用し、コード（ｄ）で入力された前記値を使用し、複数の質量スペクトルを発生させるコードと、
をさらに含む、請求項１２記載のコンピュータ読み取り可能な媒体。
（ａ）分析装置と、
（ｂ）前記分析装置からデータを受信し、コンピュータ読み取り可能な媒体を備えたデジタルコンピュータと、
を具備し、
前記コンピュータ読み取り可能な媒体が、
（ｉ）１個以上のサンプルチップ上の複数のサンプルスポットと関連した値であって、グラフィカルユーザインタフェース上に前記サンプルスポットを表現するグラフィック要素を使用して入力された値を受信するコードと、
（ｉｉ）前記サンプルスポットから生成された複数の信号を表現するデータを受信するコードと、
（ｉｉｉ）前記複数の信号中の各信号を、前記信号が生成された前記サンプルスポットと関連した値の組で自動的にアノテートするコードと、
を含む、
質量スペクトルを処理するシステム。
前記デジタルコンピュータがクライアントコンピュータであり、
（ｃ）前記クライアントコンピュータと通信するサーバコンピュータをさらに具備する、請求項２０記載のシステム。
前記信号が質量スペクトルである、請求項２０記載のシステム。
前記値が、サンプル同定情報、特定のサンプルタイプ、特定のエネルギー吸収マトリックス材料、特有の洗浄条件、及び、特有のクロマトグラフィーフラクションよりなる群から選択された少なくとも一つを含む、請求項２０記載のシステム。
前記デジタルコンピュータと通信するデータベースをさらに具備し、
前記コンピュータ読み取り可能な媒体が、異なるデータが前記データベースから取り出されるようにユーザがコンフィギュレーションファイルを変更することを可能にさせるコードをさらに含み、
前記異なるデータが前記グラフィカルユーザインタフェースを変更する、
請求項２０記載のシステム。
前記デジタルコンピュータと通信するデータベースをさらに具備し、
前記コンピュータ読み取り可能な媒体が、
（ｄ）前記グラフィカルユーザインタフェース上の前記グラフィック要素を使用して前記値を入力するコードと、
（ｅ）コード（ｄ）で入力された前記値を使用して前記１個以上のサンプルチップに前記複数のサンプルスポットを準備するコードと、
（ｅ）表面増強レーザー脱離イオン化プロセスを使用し、コード（ｄ）で入力された前記値を使用し、複数の質量スペクトルを発生させるコードと、
をさらに含む、
請求項２０記載のシステム。