JP2006515929A - サンプルスポットからのプロセシング信号についてのデータ管理システムおよびデータ管理方法 - Google Patents
サンプルスポットからのプロセシング信号についてのデータ管理システムおよびデータ管理方法 Download PDFInfo
- Publication number
- JP2006515929A JP2006515929A JP2006502862A JP2006502862A JP2006515929A JP 2006515929 A JP2006515929 A JP 2006515929A JP 2006502862 A JP2006502862 A JP 2006502862A JP 2006502862 A JP2006502862 A JP 2006502862A JP 2006515929 A JP2006515929 A JP 2006515929A
- Authority
- JP
- Japan
- Prior art keywords
- sample
- code
- computer
- spectra
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Biotechnology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioethics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
- Spectrometry And Color Measurement (AREA)
Abstract
本発明の一実施形態は複数のスペクトルを処理する方法を対象にする。この方法は1個以上のサンプルチップ(10a,10b)上のサンプルスポット(14a−14d)と関連した値を受信するステップを含み、これらの値は、グラフィカルユーザインタフェースに表示された、サンプルスポット(14a,14b)を表現するグラフィック要素を使用して入力された。複数の信号を表現するデータが受信される。複数の信号中の各信号は、その信号を生成するため用いられたサンプルスポットと関連した値の組でアノテートされる。
Description
(関連出願の相互参照)
本願は、2003年1月27日に出願され、参照によって全体が本明細書に組み込まれた米国仮出願第60/443,071号の本出願であり、この仮出願の優先権を主張する。
本願は、2003年1月27日に出願され、参照によって全体が本明細書に組み込まれた米国仮出願第60/443,071号の本出願であり、この仮出願の優先権を主張する。
(発明の背景)
プロテイン及び他のマーカーは疾病状態の重要な因子である。「マーカー」は典型的にポリペプチドのような分子を表し、単独で、又は、他のマーカーと組み合わせて、ある生物学的状態と別の生物学的状態を区別する。たとえば、タンパク質は疾病のような生物学的状態の変化に関連して変化する。疾病が発症するとき、一部のタンパク質は休止状態になり、それ以外は活性状態になる。たとえば、前立腺特異抗原(PSA)は循環している血清タンパク質であり、濃度上昇中に存在するとき、前立腺癌と相関関係がある。PSAのようなマーカーが同定されるとき、それらは診断ツールとして使用可能であり、又は、マーカーと関連した疾病を取り扱うため使用可能である。
プロテイン及び他のマーカーは疾病状態の重要な因子である。「マーカー」は典型的にポリペプチドのような分子を表し、単独で、又は、他のマーカーと組み合わせて、ある生物学的状態と別の生物学的状態を区別する。たとえば、タンパク質は疾病のような生物学的状態の変化に関連して変化する。疾病が発症するとき、一部のタンパク質は休止状態になり、それ以外は活性状態になる。たとえば、前立腺特異抗原(PSA)は循環している血清タンパク質であり、濃度上昇中に存在するとき、前立腺癌と相関関係がある。PSAのようなマーカーが同定されるとき、それらは診断ツールとして使用可能であり、又は、マーカーと関連した疾病を取り扱うため使用可能である。
表面増強レーザー脱離/イオン化プロセスはバイオマーカーを同定するため使用される。「表面増強レーザー脱離/イオン化」すなわち「SELDI」は、検体(たとえば、タンパク質など)が気相イオン分光分析計のプローブインタフェースとかみ合うSELDIプローブのサンプルスポットで捕捉される脱離/イオン化気相イオン分光分析(たとえば、質量分析)の方法を表す。「SELDI MS」では、気相イオン分光分析計は質量分析計である。SELDI技術は、たとえば、米国特許第5,719,060号明細書(HutchensとYip)、及び、米国特許第6,225,047号(HutchensとYip)に記載されている。レーザーは、捕捉された検体(たとえば、タンパク質)をプローブの表面から脱離し、脱離された検体が検出器で受け取られる。「EAM」すなわちエネルギー吸収材と呼ばれる材料はサンプルスポットにあり、脱離プロセス中にレーザーエネルギーの一部を吸収する。
検出後、脱離された検体の飛行時間(TOF)が決定される。各飛行時間値は質量電荷比、すなわち、M/Zに変換される。TOFからM/Zへの変換は、飛行時間を質量電荷比(M/Z)へ変換するアルゴリズムの適用を含む。このステップにおいて、信号は時間領域から質量領域へ変換される。タンパク質が脱離され検出され、M/Zが決定された後、図1に示されるような質量スペクトルが質量分析計によって生成される。
図1に示されるように、y軸は信号強度の指標であり、x軸は特有の質量電荷比を表す。特定の質量電荷比における高い信号強度はその質量電荷比をもつ物質が高濃度であることを示す。図1において、およそ27000におけるピークはその質量電荷比をもつ特定の物質を表す。
類似した処理条件下で作成されるスペクトルは、別々に分類され、分析される。たとえば、二つの質量スペクトルが同じレーザーエネルギーと洗浄条件を使用して作成されるが、それぞれ疾病サンプル及び非疾病サンプルに由来する。二つの質量スペクトルは、所与の質量電荷比での信号強度(又は「ピーク」)が異なる。特有の質量電荷比の物質は、2個のサンプルにおいて「発現量が異なる」ものとしてみなされ、その特定の物質は調査対象である特定の疾病状態のマーカーである。
表面増強レーザー脱離/イオン化データは多次元であり、使用されるエネルギー吸収材料(EAM)のタイプ、使用される特定のレーザーエネルギー、使用される吸収材のタイプなどのような特定のプロセシング値を含む。表面増強レーザー脱離/イオン化プロセスの利点の一つには、サンプルを分析することにより、多種多様な界面化学と異なるサンプル準備ステップを用いてタンパク質のようなマーカーを同定し得る能力が含まれる。
自動化処理の使用が増加すると共に、ユーザによって手動で組織化され、処理され、分析されるスペクトルよりも多数のスペクトルが作成可能である。このような多次元表面増強レーザー脱離/イオン化データの高スループットの収集及び分析は現在利用可能であるデータ管理システムよりも優れたデータ管理システムを必要とする。
本発明の実施形態は上記及びその他の問題を解決する。
(発明の要旨)
本発明の実施形態はスペクトルを処理するシステム及び方法に関係する。
本発明の実施形態はスペクトルを処理するシステム及び方法に関係する。
本発明の別の実施形態は、(a)グラフィカルユーザインタフェース上にサンプルスポットを表現するグラフィック要素を使用して入力され、1個以上のサンプルチップ上の複数のサンプルスポットと関連した値を受信するステップと、(b)サンプルスポットから生成された複数の信号を表現するデータを受信するステップと、(c)信号を生成するため用いられたサンプルスポットと関連した値の組で複数の信号中の各信号に自動的にアノテートするステップと、を含む複数の信号を処理する方法を対象にする。
本発明の別の実施形態は、(a)グラフィカルユーザインタフェース上にサンプルスポットを表現するグラフィック要素を使用して入力され、1個以上のサンプルチップ上の複数のサンプルスポットと関連した値を受信するコードと、(b)サンプルスポットから生成された複数の信号を表現するデータを受信するコードと、(c)信号を生成するため用いられたサンプルスポットと関連した値の組で複数の信号中の各信号に自動的にアノテートするコードと、を含むコンピュータ読み取り可能な媒体を対象にする。
本発明の別の実施形態は、(a)分析装置と、(b)分析装置からデータを受信し、コンピュータ読み取り可能な媒体を備えたデジタルコンピュータと、を具備し、コンピュータ読み取り可能な媒体が、(i)グラフィカルユーザインタフェース上にサンプルスポットを表現するグラフィック要素を使用して入力され、1個以上のサンプルチップ上の複数のサンプルスポットと関連した値を受信するコードと、(ii)サンプルスポットから生成された複数の信号を表現するデータを受信するコードと、(iii)信号を生成するため用いられたサンプルスポットと関連した値の組で複数の信号中の各信号に自動的にアノテートするコードと、を含む、質量スペクトルを処理するシステムを対象にする。
本発明の上記及びその他の実施形態は以下に詳述される。
(詳細な説明)
本発明の実施形態は、未加工のスペクトルデータ、又は、処理済みのスペクトルデータを組織化し、実験が最初に計画されたときから実験の結果が分析されるときまでサンプル及び処理パラメータを追跡することが可能である。各スペクトルは、そのスペクトルが由来するサンプルスポットに関連した値で自動的にアノテートされる。これは後のスペクトル分析の速度と精度を高める。分析モジュールは、最新式データハンドリングを行い、潜在的なバイオマーカーを同定するため、複数の条件下で複数の実験の高速自動化分析を可能にさせる強力なデータマイニング及び分析能力を含む。本発明の実施形態はさらに、実験結果を精緻化し、リポートを生成し、調査結果を公開するために使用される。
本発明の実施形態は、未加工のスペクトルデータ、又は、処理済みのスペクトルデータを組織化し、実験が最初に計画されたときから実験の結果が分析されるときまでサンプル及び処理パラメータを追跡することが可能である。各スペクトルは、そのスペクトルが由来するサンプルスポットに関連した値で自動的にアノテートされる。これは後のスペクトル分析の速度と精度を高める。分析モジュールは、最新式データハンドリングを行い、潜在的なバイオマーカーを同定するため、複数の条件下で複数の実験の高速自動化分析を可能にさせる強力なデータマイニング及び分析能力を含む。本発明の実施形態はさらに、実験結果を精緻化し、リポートを生成し、調査結果を公開するために使用される。
クライアントサーバ型のリレーショナルデータベースアーキテクチャは本発明の実施形態で使用される。クライアントサーバアーキテクチャは、ネットワーク上の各コンピュータ又はプロセッサがクライアント又はサーバのいずれかであるネットワークアーキテクチャである。サーバコンピュータは、典型的に、ディスクドライブ管理専用(ファイルサーバ)、プリンタ制御専用(プリントサーバ)又はネットワークトラフィック管理専用(ネットワークサーバ)である強力なコンピュータである。クライアントコンピュータには、ユーザがアプリケーションを動かすPC(パーソナルコンピュータ)又はワークステーションが含まれる。クライアントコンピュータは、ファイル、デバイス、さらには処理パワーのようなリソースのためのサーバコンピュータに依存する。本発明の一部の実施形態では、サーバコンピュータはデータベース機能のすべてを取り扱う。クライアントコンピュータは、質量スペクトルのソート、正規化及び印刷のようなフロントエンドデータ管理のすべてを取り扱うソフトウェアを載せることができる。クライアントコンピュータはさらにユーザからのデータ入力を受信可能である。
本発明の実施形態で使用されるデジタルコンピュータ(たとえば、クライアントコンピュータ、サーバコンピュータ)は、WindowsTM又はLinuxTMに基づくオペレーティングシステムのような標準又は専用オペレーティングシステムを使用する1台以上の超小型、小型又は大型のフレームコンピュータを含む。
本明細書に記載されたいずれかの機能を行うコードはデジタルコンピュータによって実行され、適当なコンピュータ読み取り可能な媒体に記憶される。コンピュータ読み取り可能な媒体の実施例には、磁気ディスク、電磁ディスク、光ディスク、テープ、スティック、チップなどが含まれる。本明細書に記載されたいずれかの機能を実行するコートは、たとえば、フォートラン、C、C++などを含む適当なコンピュータプログラミング言語で記述される。グラフィカルユーザインタフェースと、グラフィカルユーザインタフェースの基礎にある機能は、Java(登録商標)のようなオブジェクト指向プログラミング言語を使用して作成される。
本発明の一実施形態による複数の信号を処理する方法は、(1)グラフィカルユーザインタフェース上にサンプルスポットを表現するグラフィック要素を使用して入力され、1個以上のサンプルチップ上の複数のサンプルスポットと関連した値を受信するステップと、(2)サンプルスポットから生成された複数の信号を表現するデータを受信するステップと、を含む。複数のサンプルスポットと関連した値と複数の信号を表現するデータはクライアントコンピュータ又はサーバコンピュータのようなデジタルコンピュータで受信される。複数の信号を表現するデータと、同じスポットに関連した値がデジタルコンピュータによって受信された後、(3)デジタルコンピュータは、信号を生成するため用いられたサンプルスポットと関連した値の組で複数の信号中の各信号に自動的にアノテートする。本明細書で使用されるように「受信する」は、デジタルコンピュータ、マイクロプロセッサ、又は、その他の計算装置によるデータの受信を含む。
上記のステップ(1)−(3)は様々な方法で実行される。たとえば、値は、グラフィック要素を備えたグラフィカルユーザインタフェースを使用してパーソナルコンピュータに入力され、ステップ(1)−(3)は同じパーソナルコンピュータ内のマイクロプロセッサによって実行される。或いは、サンプルスポットに対する値は、グラフィカル要素を使用してクライアントコンピュータのような第1のコンピュータへ入力される。値がクライアントコンピュータへ入力された後、その値はサーバコンピュータへ送信される。サーバコンピュータは次にステップ(1)−(3)を実行する。
各サンプルスポットはそれに関連した「特性」の1個以上の「値」をもつ。「特性」及び「特性」の「値」はそのサンプルスポットに関係する情報を含む。適当な特性と、それらの特性に関連した値(括弧内)は、ウェット実験室処理パラメータ(たとえば、洗浄溶液A、洗浄溶液B)、エネルギー吸収材(たとえば、シナピン酸)、フラクション(たとえば、フラクションA、フラクションB)、吸着材(たとえば、吸着材A、吸着材B)、サンプルタイプ(たとえば、血液、唾液)、サンプルグループ(たとえば、疾病、非疾病)、レーザーエネルギー(たとえば、レーザーエネルギーA、レーザーエネルギーB)、サンプルチップタイプ(たとえば、チップ番号1、チップ番号2)などを含むが、これらに限定されない。本発明の実施形態において、「フラクション」は、クロマトグラフィーのようなプロセスによって得られたサンプルの特別な部分である。異なるサンプル部分は、特定の分子量、サイズ、又は、電荷範囲内に収まる成分により構成される。たとえば、血液のようなサンプルは、クロマトグラフィーカラムを通して処理されるので、血液は異なる部分、すなわち、「フラクション」に分離される。各フラクションは、特定の分子量の範囲に収まる血液成分を含有する。
適当な分析装置及び方法が同じスポットに関連した信号を生成するため使用される。それらは、たとえば、気相イオン分光分析方法及び装置、光学的方法及び装置、電気機械的方法及び装置、並びに、原子間力顕微鏡と無線周波数による方法及び装置を含む。その中でも特に関心があるのは、質量分析、特に、SELDIの使用である。光学的方法には、たとえば、蛍光、発光、化学発光、吸光度、反射率、透過率、複屈折率、又は、屈折率(たとえば、表面プラスモン共鳴、偏光解析、共振ミラー法、グレーティングカップラ導波法又は干渉分光法)が含まれる。光学的方法には、顕微鏡法(共焦点と非共焦点の両方)、イメージング法及び非イメージング法が含まれる。種々のフォーマットによる免疫測定(たとえば、ELISA)は、固相に捕捉されたタンパク質のような検体を検出するよく知られた方法である。電気機械的方法には、ボルタメトリー法及びアンペロメトリー法が含まれる。無線周波法には、多極共鳴分光法が含まれる。
一部の実施形態では、信号はスペクトルである。本発明の実施形態において生成され、操作され、分析されたスペクトルは、好ましくは、質量スペクトルである。生成された各質量スペクトルは、信号強度対質量電荷比のプロットでもよい。或いは、各質量スペクトルは単に信号強度値とそれらの対応するM/Z値のテーブルによって構成される。「質量スペクトル」は以下の実施例に詳述されているが、飛行時間スペクトルのような他のタイプのスペクトルが本発明の実施形態においてアノテートされ、処理される。
本発明の実施形態による特定の典型的な方法は図2及び3を参照して説明される。
図2は本発明の一実施形態によるシステムを表す。図2は質量分光計42と通信するクライアントコンピュータ44を表す。クライアントコンピュータ44は質量分光計42と構造的に一体化してもよく、又は、質量分光計42に接続されたパーソナルコンピュータのような別個の端末でもよい。1台のクライアントコンピュータ44が説明図を明瞭にするため表されている。本発明の他の実施形態では、多数のクライアントコンピュータが存在し、各クライアントコンピュータは質量分光計に接続されても、接続されなくてもよい。
図2において、オートローダ40が質量分光計に接続され、複数のサンプルチップ10(a)、10(b)を質量分光計42へ自動的に装填するため使用される。各サンプルチップ10(a)、10(b)は、1個以上のサンプルスポット14(a)−14(d)、14(a)’−14(d)’と、バーコードBC1、BC2のような識別子を含む。サンプルチップ10(a)、10(b)はホルダー8に固定される。ホルダー8とサンプルチップ10(a)、10(b)の組み合わせ、又は、ホルダー8自体は、「バイオプロセッサー」200と呼ばれる。多数のバイオプロセッサー及び多数のサンプルチップが、サンプルスポット14(a)−14(d)、14(a)’−14(d)’の一つずつに少なくとも1個の質量スペクトルを生成するため、オートローダ40を用いて質量分光計42へ自動的に装填される。
バイオプロセッサー200は任意の個数のサンプルチップを含み、各サンプルチップは適当な個数のサンプルスポットを含む。本明細書で使用されるように、「バイオプロセッサー」は、1個以上のサンプルチップを保持するホルダーを含み、各サンプルチップは1個以上のサンプルスポットを含む。一部の実施形態では、バイオプロセッサー200は、サンプルチップ1個当たりに8個のサンプルスポットを備えた12個のサンプルチップを保持し、バイオプロセッサー1台当たりのサンプルスポットは合計で96個である。バイオプロセッサー200のサンプルスポット構造は、多重アッセイを実行するための標準フォーマットである96−ウェルプレートの構造に類似している。96−ウェルプレートのような標準フォーマットに類似しているバイオプロセッサーは、市販されている自動機器と共に使用することができるので便利である。たとえば、Biomek 2000液体ハンドリングロボット(カリフォルニア州フリーモントのCiphergen Biosystems,Inc.から入手可能)は、96−ウェルプレートのウェル内、又は、バイオプロセッサー内にあるサンプルスポット上の液体サンプルをピペットで採取できる。
サーバコンピュータ46はイントラネット又はインターネットのようなデータネットワークを介してクライアントコンピュータ44と通信する。サーバコンピュータ46は、クライアントコンピュータ44及びその他のクライアントコンピュータとの間でデータを送受信する1台以上の計算装置を含む。サーバコンピュータ46はMicrosoft WindowsTM2000のようなオペレーティングシステムを動かし、インテルベースのマイクロプロセッサ(たとえば、1GHz以上のIntel PentiumTM III)のようなマイクロプロセッサを使用し、プログラムインストール用のCD ROMとデータ入出力用の入力及び出力とを有する。サーバコンピュータは、最小限の特性、すなわち、1GB RAM以上の記憶容量、及び、プログラム記憶用の10GB以上の記憶容量をもつ。
クライアントコンピュータ44はデジタルコンピュータでもよい。クライアントコンピュータ44は、Windows(登録商標) 2000又はWindows(登録商標) XPオペレーティングシステムの上で動き、1GHz以上のIntel Pentium(登録商標) IIプロセッサを有する。それは、プログラムインストール用のCD ROMと、データ入力用のマウス、キーボード、トラックボール、若しくは、その他の適当な入力装置と、データ出力用の視覚的及び聴覚的な出力装置とをさらに有する。それは、最小限の特性、すなわち、256MB RAMと、プログラムデータ用の10MBのディスクスペースと、データ記憶用の少なくとも1GBの空きディスクスペースとを有する。サーバコンピュータ46及びクライアントコンピュータ44のデータ要件は、処理速度とメモリ記憶容量がコンピュータテクノロジーにおける技術的進歩に応じて増加するのに伴って変化する。
サーバコンピュータ46は、スペクトル、サンプルスポットに関連した値、又は、スペクトル若しくはスペクトルを形成するためのプロセスに関連したその他のデータを格納し得るデータベース48と通信する。データベース48は、Oracle又はMySQLから市販されているリレーショナルデータベースでもよい。リレーショナルデータベースは関連テーブルの形式でデータを格納する。リレーショナルデータベースは、データがどのように関係しているか、或いは、データがどのようにデータベースから抽出されるかに関して僅かな仮定しか必要としないので強力である。その結果として、同じデータベースは多数の異なる方法で見ることができる。リレーショナルデータベースの有用な特徴は、複数のテーブルに亘って分散させ得る点である。任意の数のユーザが格納されたスペクトル(アノテートされるか、若しくは、アノテートされない)、又は、サンプルスポットに関連した値を取り出すため、データベース48にアクセスする。
質量分析計42はスペクトルを作成するため適当なイオン化技術を使用する。イオン化技術には、たとえば、電子イオン化、高速原子/イオン衝突、マトリックス支援レーザー脱離/イオン化、表面増強レーザー脱離/イオン化(SELDI)、又は、電子スプレーイオン化プロセスが含まれる。
一部の実施形態では、イオン移動度スペクトロメータが使用される。イオン移動度分光分析の原理は、イオンの移動度の差に基づいている。特に、イオン化によって生成されたサンプルのイオンは、電界の影響下の管の中を、たとえば、それらの質量、電荷、若しくは形状の差が原因となって異なる速度で移動する。イオンは検出器で受け取られ、検出器の出力が、サンプル内のマーカー又はその他の物質を同定するため使用される。イオン移動度分光分析の一つの利点は常圧で実行できることである。
好ましい一実施例では、レーザー脱離飛行時間質量分析計が質量スペクトルを作成するため使用される。レーザー脱離分光分析は、特に、タンパク質のような高分子量物質を分析するため適している。たとえば、MALDI又は表面増強レーザー脱離/イオン化プロセスの実際的な質量範囲は最大で300000ダルトン以上に達する。その上、レーザー脱離プロセスは複雑な混合物を分析するため使用され、高感度を有する。さらに、タンパク質フラグメンテーションの可能性は、MALDI又は表面増強レーザー脱離/イオン化プロセスのようなレーザー脱離プロセスにおいては、他の質量分析プロセスの場合よりも低い。したがって、レーザー脱離プロセスは、タンパク質のような高分子量物質を正確に特徴付け、定量するため使用される。
図3は本発明の一実施形態による方法のフローチャートを表す。最初に、ユーザは1個以上のサンプルチップ上のサンプルスポットに関連した値を、サンプルチップ上のサンプルスポットを表現するグラフィック要素を含むグラフィカルユーザインタフェースを用いて、クライアントコンピュータへ入力する(ステップ22)。それらがクライアントコンピュータへ入力された後、これらのサンプルスポットに関連した値がクライアントコンピュータからサーバコンピュータへ送信される(ステップ24)。サーバコンピュータは受信された値をデータベースに格納する。1個以上のサンプルチップ上のサンプルスポットはユーザによって予め入力された値に応じて準備される。質量スペクトルを作成する前又は後に、サンプルスポットに対する値がサーバコンピュータから取り出され(ステップ26)、そのクライアントコンピュータ(又は、別のクライアントコンピュータ)で受信される。質量分析計はサンプルスポット上のサンプルを分析し、スペクトルデータがクライアントコンピュータによって作成され、又は、受信される(ステップ28)。クライアントコンピュータは、各質量スペクトルに、質量スペクトルを作成するため用いられたサンプルストップの値で自動的にアノテートする(ステップ30)。質量スペクトルがアノテートされると、予め入力された値の組をもつ質量スペクトルのグループが選択される(ステップ32)。このプロセスのあらゆる時点で、(アノテートされた形式又はアノテートされていない形式の)スペクトルは保存又は処理のためサーバコンピュータへ返信される。選択された質量スペクトルのグループは次に分析モジュールを使用して分析される(ステップ34)。分析モジュールはクライアントコンピュータ又はサーバコンピュータに存在し、選択されたスペクトルを分析する。たとえば、分析モジュールは、選択された質量スペクトルのグループに関して、たとえば、発現差解析、又は、再帰的分割解析を実行する。これらのステップのそれぞれは図2乃至17を参照してさらに詳細に説明される。
ユーザは1個以上のサンプルスポットに対する異なる値をデジタルコンピュータへ入力することにより実験を計画する。図2及び3を参照すると、1個以上のサンプルチップ10(a)、10(b)上のサンプルスポット14(a)−14(d)、14(a)’−14(d)’のそれぞれに対する値はクライアントコンピュータ44へ入力される(ステップ22)。各サンプルスポット14(a)−14(d)、14(a)’−14(d)’は、0個、1個、又は、2個以上の値が関連付けられる。たとえば、各サンプルスポットは、異なる洗浄条件、異なるサンプル、及び、異なるレーザーエネルギーが関連付けられる。各サンプルスポット14(a)−14(d)、14(a)’−14(d)’は1個以上のスペクトルを生成するためさらに使用される。1台のバイオプロセッサーが全部で96個のサンプルスポットを収容するならば、少なくとも96個のスペクトルがこれらの96個のスポットからそれぞれに生成される。実際には、多数のサンプルチップを備えた多数のバイオプロセッサーが存在し、各サンプルチップが多数の異なるサンプルスポットを有する。多数のスペクトルを生成できるので、より効率的で、かつ、役に立つスペクトルデータ管理システム及び方法が必要である。
各サンプルスポットは生物学的サンプルを収容する。適当な生物学的サンプルが本発明の実施形態で使用される。生物学的サンプルには、(たとえば、生体からの)組織、血液、血清、血漿、乳頭吸引、尿、涙液、唾液、細胞、軟組織及び硬組織、器官、精液、糞、尿などが含まれる。生物学的サンプルは、真核生物、原核生物、又は、ウィルス生物を含む適当な生物から取得される。
生物学的サンプルには、ポリペプチド、タンパク質、核酸、酵素、DNA、RNA、ポリヌクレオチド、オリゴヌクレオチド、核酸、炭水化物、オリゴ糖、多糖のような巨大分子と、核酸フラグメント、ペプチドフラグメント、及び、タンパク質フラグメントのような上記の生物学的巨大分子のフラグメントと、核酸複合体、タンパク質−DNA複合体、受容体−配位子複合体、酵素−基質、酵素阻害剤、ペプチド複合体、タンパク質複合体、炭水化物複合体、及び、多糖複合体のような上記の生物学的巨大分子の複合体と、アミノ酸、ヌクレオチド、ヌクレオシド、糖、ステロイド、脂質、金属イオン、薬物、ホルモン、アミド類、アミン類、カルボン酸、ビタミン及び補酵素、アルコール、アルデヒド、ケトン、脂肪酸、ポルフィリン、カロチノイド、植物成長調整剤、リン酸エステル及びヌクレオシド2リン酸糖のような生物学的小分子と、を含む生物学的分子と、薬物的又は治療的に効果のある物質、モノマー、ペプチド類似物質、ステロイド類似物質、阻害剤、突然変異誘発性物質、発癌性物質、細胞分裂抑制薬、抗生物質、イオノフォア、代謝拮抗物質、アミノ酸類似物質、抗菌剤、転移抑制剤、表面活性剤(界面活性剤)、ミトコンドリア及び葉緑体機能阻害剤、電子供与体、電子伝達体、電子受容体、プロテアーゼのための合成基質、ホスファターゼのための合成基質、エステラーゼ及びリパーゼのための基質、ならびに、タンパク質変性試薬のような合成小分子と、合成ポリマーと、合成オリゴマーと、合成コポリマーとが含まれる。上記の具体的に列挙された物質の適当な混合物又は合成物もまた生物学的サンプルに含まれる。
図4はクライアントコンピュータ上に表示可能であるグラフィカルユーザインタフェースを表す。グラフィカルユーザインタフェースは、システムに記憶されているデータをブラウズするため使用されるツリーを表示するウィンドウ104を含む。ツリーのリーフを表現する複数の一般的なエンティティが存在する。「フォルダ」は、スペクトル、仮想ノートブック及びスタディのための一般的な入れ物でもよい。フォルダはブランチとしての役目を果たすことが可能であり、他のフォルダを収容可能である。多数のフォルダ、スタディ及び仮想ノートブックが各フォルダに存在し得る。「仮想ノートブック」は、サンプルプロパティ情報と、サンプルチップ又はバイオプロセッサーの構造を収容する。仮想ノートブックは以下で詳述される。「解析フォルダ」は解析データを収容できる。スペクトルは問い合わせツールによって解析フォルダに挿入できる。「インポート済みスペクトルフォルダ」は、カリフォルニア州フリーモントのCiphergen Biosystems,Incから販売されているProteinChip Software 3.1.1(又はそれ以降のバージョン)のような外部ソースから獲得されたスペクトルデータを受け付ける。「削除済みスペクトルフォルダ」は削除されたスペクトルを保持する。
本発明の実施形態において、ユーザは、サンプルスポットに関連した値をクライアントコンピュータへ入力するため、「仮想ノートブック」を使用する。「仮想ノートブック」は、ユーザがサンプル名、詳細なサンプルタイプ、使用される詳細なEAM、詳細なフラクション、詳細なバインド及び洗浄条件などのようなサンプルスポット値を追跡記録し入力できる実験ノートブックの電子又は「仮想」表現である。それは、サンプルチップ上又はバイオプロセッサー内のサンプルスポットのグラフィカル表現であるグラフィック要素を備えたグラフィカルユーザインタフェースを含む。グラフィカルユーザインタフェースは、ユーザが少数のステップにおいてサンプルスポット値の組を1個以上のサンプルチップ又は1台以上のバイオプロセッサー上の多数のサンプルスポットに適用することを可能にさせる。ウェット実験室処理条件のような特性の値はサンプルスポットの表現に「仮想的に」適用される。
ユーザが仮想ノートブックを使用するとき、一連のタブが存在し、ユーザは、特定の実験手順に従って、1個以上のサンプルチップ、又は、サンプルチップを収容するバイオプロセッサーを「構成」するためにその一連のタブから選択を行う。ユーザが選択を行うことができるタブはグラフィカルユーザインタフェース上に与えられる。各タブは予め構成されたバイオプロセッサーの要素のリストを表現する。たとえば、タブは、バイオプロセッサー、アレイ、サンプル、EAM、フラクション、並びに、洗浄及びバインドプロトコルに対応する。各タブは、バイオプロセッサーで使用するため仮想ノートブックに追加された、予め構成された要素のリスト(もしあれば)を収容する。たとえば、EAMタブは、より多数のEAMを入力するか、又は、不要なEAMを削除するためのボタンと共に特有のEAMのリストを収容する。同様に、これらの要素はシステム内の他の仮想ノートブックからコピーアンドペーストされる。
図4に表されたウィンドウの右側に示されたデータテーブル102は、クライアントコンピュータ44へ入力することができる様々なサンプル情報を表す。サンプル情報は、「サンプル」タブを選択することによりクライアントコンピュータ44へ入力される。サンプル情報は、たとえば、サンプルと関連した外部参照コード、名前(たとえば、癌1)、患者(たとえば、CA−001)、サンプルタイプ(たとえば、血清)、及び、特定グループ(たとえば、疾患、対照)を含む。
典型的な一実施例では、仮想ノートブックに追跡記録されているサンプルスポットから生成された新しいスペクトルは、それに関連した特有の値の組を有する。質量スペクトルはサンプルスポットに対する値で自動的にアノテートされる。たとえば、新しい質量スペクトルは、疾患患者からの血液サンプル及びシナピン酸EAMを含有するチップタイプX上のサンプルスポットから、レーザーエネルギーYを使用して作成された。サンプルスポットの値(すなわち、チップタイプX、血液、疾病、シナピン酸、レーザーエネルギー=Y)は新しい質量スペクトルにアノテートされる。仮想ノートブックでは、各値はその固有データテーブルの範囲内で追跡記録されるので、各値は異なるサンプルチップ及びバイオプロセッサー上の異なるサンプルスポットに適用される。仮想ノートブックは、ユーザが複数のアレイ上の多数のサンプルスポットを同時に特徴付けることを可能にさせることにより、1個以上のサンプルスポットアレイを構成するための手続きを簡素化する。
多数のWindowsTM環境で普及しているような「ウィザード」は、仮想ノートブック内でサンプルチップ及びバイオプロセッサーのサンプルスポットを構成するユーザに指示し、ガイドするため設けられる。ウィザードは最初にバイオプロセッサー又はサンプルチップに関する情報を要求する。ウィザードは、ユーザがサンプルスポットアレイと、サンプル、フラクション、バインド及び洗浄、並びに、各サンプルスポットへのEAMのようなサンプルスポット特性に関する値とを追加することを可能にさせる。サンプルスポットは、構成される実際のバイオプロセッサー又はサンプルチップ内のサンプルスポットのレイアウトに一致させるため配置されたマップを形成する。たとえば、簡単なテーブルは最大で12個のアレイの情報を保持するように見える。テーブルの各列はサンプルチップのアレイを表現する。サンプルスポットは、使用される実際のバイオプロセッサー又はサンプルチップに並べられた順序と同じ順序で表される。ユーザは、特有の値をポイントアンドクリックするためマウス又はその他の入力装置を使用し、次に、これらの値がサンプルスポットの表現に適用される。同じサンプルスポットは、サンプルスポットに適用されるサンプルの種々のサンプルグループに応じて色分けしてもよい。
実例として、仮想ノートブックは図5に表されるようなグラフィカルユーザインタフェースを含む。1個以上のサンプルチップ上の種々のサンプルスポットの値は図5に表されたようなグラフィカルユーザインタフェースを使用してクライアントコンピュータ44へ入力される。図5は、複数のサンプルチップ上の複数のサンプルスポットのグラフィカル表現であるグラフィック要素106を表す。本実施例では、1から12までのラベルが付された12台のサンプルチップの表現があり、各サンプルチップはサンプルスポットA−Hを有する。例示された12台のサンプルチップは1台のバイオプロセッサー内の12台のサンプルチップを表現する。バイオプロセッサーはホルダーと12台のチップとを具備することがある。本実施例では、バイオプロセッサーはそれぞれが8個のサンプルスポットを備えた12台のチップを有し、サンプルスポットの合計は96個である。96個のサンプルスポットは96−ウェルプレートに類似した構造である。
本実施例では、グラフィック要素106は、バイオプロセッサー内のサンプルチップ上のサンプルスポットと全体的な外観が類似した丸い円によって図式的に表現される。しかし、他の実施形態ではグラフィック表現は異なる。たとえば、グラフィカル表現は、他の実施形態では、数字、文字、又は、その他の記号でもよい。
再度図2を参照すると、各サンプルチップ10(a)、10(b)及び/又はバイオプロセッサー200はバーコードBC1、BC2又はその他の識別子を用いてクライアントコンピュータ44に確認される。ユーザは、サンプルチップ識別子をクライアントコンピュータ及びシステムへ入力するため、バーコード番号をタイプ入力するか、又は、バーコードスキャナを使用する。図5を参照すると、データテーブル100に表されるように、各サンプルチップはバーコード番号108が関連付けられる。
スポット数、チップタイプ、及び、ロット番号のような他の情報がデータテーブル110へ入力される。或いは、スポット数及びチップタイプは、バーコードの最初の3桁をチップタイプ及びフォーマット(サンプルチップの物理的レイアウトとスポット数)と関連付けるルックアップテーブルに基づいて、自動的に記入される。ボタン112は、ユーザがブランクを追加し、チップを追加し、選択された条件をチップに適用し、又は、チップを取り除くことができるように設けられる。したがって、バイオプロセッサーを構成するとき、バイオプロセッサーで使用されるサンプルスポットの個数とこれらのサンプルスポットに関連した値が変更される。
図6を参照すると、サンプルは選択されたサンプルスポットのグループ106に適用される。サンプルを選択されたサンプルスポットのグループに加えるため、「サンプル付加」ボタンが選択される。たとえば、サンプルテーブル128に表されたサンプルの一つが選択され、サンプルスポットに適用される。サンプルテーブル128は6個のサンプルを表し、ユーザはその中から選択することができる。たとえば、ユーザはマウス又はキーボードのような入力装置を使用してサンプル「3」を選択し、ユーザはサンプルチップ1−12のそれぞれの位置「C」にあるサンプルスポットをハイライトさせる。ユーザは次に、サンプル3をバイオプロセッサー内の各サンプルチップ上のサンプルスポットCに加えるため、「サンプル付加」ボタンを選択する。サンプル3はサンプルスポットCへ「仮想的に」加えられる。後で、サンプル3をバイオプロセッサー内のサンプルチップ1−12のサンプルスポットCへ加える命令が、サンプル3を実際のバイオプロセッサー内のサンプルスポットCへ加える多チャンネルピペットツールのような自動サンプルハンドリング装置によって実行される。
「サンプルオーバービュー」ボタン107が図6にさらに示されている。「サンプルオーバービュー」ボタン107を選択した後、図7に示されたウィンドウ132のようなウィンドウがユーザに向けて表示される。これは、ユーザがバイオプロセッサー内の種々のサンプルスポットへ加えられた種々のサンプルを調べることを可能にさせる。図示された実施例では、3個の癌サンプルと3個の正常サンプルが存在し、これらのサンプルがバイオプロセッサー内の異なるチップ上の異なるサンプルスポットに加えられる。
図8に示されるように、EAM及びサンプルフラクション値は、種々のサンプルのそれぞれに関して、上記と同じ方法でサンプルスポットに加えられる。
図9はバイオプロセッサーオーバービュー画面を表す。この画面は、表形式の、一見してわかるようなバイオプロセッサーの実験レイアウトの図を与える。この図は参考のため印刷してもよい。バイオプロセッサーが構成された後、ユーザは、バイオプロセッサータブ(図4を参照)を選択し、関心のあるバイオプロセッサーを選択し、次に、「オーバービュー」ボタンを選択することにより、バイオプロセッサーの概要を表示させる。このボタンを選択した後、バイオプロセッサーの概要はテーブル又はチャート形式で提示される。図9に示されるように、バイオプロセッサー内の種々のサンプルスポットの特性の値がユーザのため一覧表にされる。
有利的には、本発明の実施形態を使用して、質量スペクトルを作成する前に、実験が容易に計画される。図9の実験レイアウトにあるデータのような実験データは、自動処理機器を使用して複数のサンプルチップのサンプルスポットへ自動的に加えられ、質量スペクトルが(たとえば、自動ピペットツール、自動チップ又はバイオプロセッサーハンドラ、及び、自動質量分析計を使用して)自動的に生成される。サンプルスポットに対する値は、サンプルスポットから形成される質量スペクトルを後でアノテーションするため保存される。さらに、上記のデータ入力プロセスは、生成された質量スペクトルごとに手動でアノテートするよりもユーザにとってより直観的に理解しやすいことが明白である。本発明の実施形態は、したがって、ユーザにとって従来のアノテーションプロセスよりも簡単に使用できる。
図2−3を再度参照すると、サンプルチップ上のサンプルスポットの値がクライアントコンピュータ44へ入力された後、サンプルスポットの値はサーバコンピュータ46へ送信される(ステップ24)。入力された値は次に、サーバコンピュータ46からアクセス可能であるデータベース48に保存される。たとえば、図9に表された実験レイアウトに示されたデータはサーバコンピュータ46へ送信され、データベース48に保存される。データベース48は、最終的に生成されたアノテートされた質量スペクトルと共に、未加工又は処理済みの質量スペクトルデータを同様に保存する。
入力されたサンプルスポット値とアノテートされた質量スペクトル及びアノテートされていない質量スペクトルとを保存するため集中サーバコンピュータ46及びデータベース48を使用することは有利である。たとえば、何百或いは何千もの質量スペクトルが自動処理技術を使用して直ちに生成される。膨大な数の質量スペクトルは非常にデータ集約的であり、典型的なクライアントコンピュータを使用して処理し解析することは困難である。したがって、使用されるデータネットワーク内にある多数のクライアントコンピュータの所要メモリ量を減少させるため、質量スペクトル、及び、質量スペクトルに関連した値を大規模なデータ記憶容量をもつ集中データベース48に保存することが望ましい。さらに、集中サーバコンピュータ46及びデータベース48を使用することにより、それ以外のものは、各ユーザが自分専用のクライアントコンピュータを使用して質量スペクトルデータを処理し保存する場合よりも簡単に質量スペクトル情報を共有する。
サンプルチップ10(a)、10(b)が質量分析計42によって処理する準備ができているとき、クライアントコンピュータ44、質量分析計42、及び/又は、オートローダ40に接続されたスキャナ(図示せず)は、サンプルチップ10(a)、10(b)上のバーコードBC1、BC2又はその他の識別子を自動的に読む。
バーコードBC1、BC2を使用して、サンプルチップ10(a)、10(b)上のサンプルスポット14(a)−14(d)、14(a)’−14(d)’に対する特定の値がサーバコンピュータ46を使用して取り出される(ステップ26)。取得前に、質量分析計を制御するソフトウェアはサンプルチップ10(a)、10(b)上のバーコードBC1、BC2を読む。クライアントコンピュータ44上のソフトウェアは、バーコード情報BC1、BC2と共にSOAP要求のような要求をサーバコンピュータ46へ送信する。(SOAPはシンプルオブジェクトアクセスプロトコルを表し、ベーストランスポートとしてHTTPを使用し、プラットフォームに依存せずにサービス、オブジェクト及びサーバにアクセスするため呼び出し要求及び応答を符号化する方法としてXMLを使用するメッセージングプロトコルである。)サーバコンピュータ46は、サンプルスポット14(a)−14(d)、14(a)’−14(d)’のそれぞれに対して予め入力されたサンプル値をクライアントコンピュータ44へ返信する。
値がサーバコンピュータ46から取り出される前後に、質量分析計42は、サンプルスポット14(a)−14(d)、14(a)’−14(d)’上にあるサンプルから質量スペクトルを作成する(ステップ28)。質量スペクトルを作成する典型的なプロセスにおいて、サンプルチップは質量分析計の注入系統へ導入される。サンプルチップ上のサンプル中のタンパク質のような物質が次にイオン化される。イオンが発生された後、発生されたイオンはイオン光学組立体によって収集され、次に、質量分析装置が通過するイオンを分散させ、分析する。質量分析装置を出るイオンは検出器によって検出される。飛行時間質量分析装置において、イオンは短い高電圧場の中で加速され、高真空チャンバに流れ込む。高真空チャンバの遠端で、加速されたイオンは様々な時間に高感度検出器表面に衝突する。イオンの飛行時間はイオンの質量電荷比の関数であるため、イオン化と衝突との間の経過時間は特有の質量電荷比の分子の有無を識別するため使用される。
質量スペクトルが質量分析計42によって生成された後、それらは、質量分析計42に接続されたクライアントコンピュータ44内の適切なソフトウェアによって自動的に処理される。スペクトル処理方法は、ベースラインサブトラクション、フィルタリング、ピーク検出、スポット補正キャリブレーション、及び、オプションとしての正規化を含む。これらのプロセスは以下に詳述される。
さらに、質量干渉計42が質量スペクトルを作成した後、クライアントコンピュータ44は、各質量スペクトルを、その質量スペクトルが作成されたサンプルスポットに関連した値でアノテートする(ステップ32)。アノテートされると、アノテートされた各質量スペクトルは、データベース48に記憶するため、又は、クライアントコンピュータ44内の記憶装置に記憶するため、サーバコンピュータ46へ返信される。
質量スペクトルを「アノテート」することは、その質量スペクトルを作成するため使用されたサンプルスポットに対する値を質量スペクトルデータと相関させることを意味する。質量スペクトルデータは、(信号強度対M/Zのプロットにおけるような)グラフィカル形式でもよく、又は、表形式でもよい。たとえば、EAM=シナピン酸、サンプル=癌1、及び、チップタイプ=Xのような値は、これらの値を有するサンプルスポットから取り出された質量スペクトルデータにリンクされる。
取得後、各スペクトルは、サーバコンピュータ46から受信され記憶された値すべてを格納するXMLファイルフォーマットで保存される。このことによって、各質量スペクトルは、その質量スペクトルが発生させられたサーバコンピュータを含む任意のサーバコンピュータへロードする準備ができたその自体のエンティティになる。質量スペクトルXMLファイルは、未加工のTOFデータ、(前のステップでセットアップされたパラメータに応じて)正規化されていない(又は正規化された)処理済みデータ、較正され(スポット補正が可能であるならば)スポット補正された質量、サンプルプロパティ情報、フィルタリング及びベースラインパラメータのような処理パラメータ、及び、取得情報を収容する。チェックサムは、TOFデータがクライアントコンピュータとサーバコンピュータとの間データの受け渡し中に変更されなかったことを保証するため、未加工のTOFデータ、処理済みのデータ、及び、ファイルの全部に対して計算される。スポット補正ファクタもまたファイルに保存される。
アノテートされたスペクトルは次にサーバコンピュータ46によってデータベース48へロードされる。スペクトルファイルはデータベース48の特定のフォルダへ保存される。スペクトルを手動でロードするとき、スペクトルが属するフォルダを指定することができる。自動ローディングのとき、スペクトルはデータベース48のデフォルトフォルダに保存される。スペクトルを(たとえば、http postを用いて)サーバコンピュータへ自動送信するとき、フォルダ名は、スペクトルがデータベース48に保存されるべきであるかどうかを示すためポストと共に送信される。たとえば、文字列「BDCproject\Q103\Replicate analysis」はhttp postと共に送信されるならば、フォルダの階層がデータベース48に作成される。フォルダ「BDCproject」は「Replicate analysis」を格納する「Q013]を収容する。
質量スペクトルがアノテートされた後、各質量スペクトルはさらに処理される。たとえば、何らかの方法で質量スペクトルを改善するか、又は、関心のあるピークを同定するアルゴリズムが質量スペクトルに適用される。このようなアルゴリズムは、TIC(全イオン電流)正規化、キャリブレーション、ピーク同定、ベースラインサブトラクション、及び、フィルタリングを実行する。
正規化は、条件の差を原因とするスペクトル間の変動を説明し、引き続く数値計算の精度を改善するためデータセット内の数を線形スケーリングするプロセスである。全イオン電流による正規化は、異なる日、又は、異なる機器で生成されたスペクトルを調査するときに役立つ。正規化プロセスは全てのサンプルスポットに対して使用された全電流イオンを利用し、強度を平均化し、表示されるデータが同じスケールであるように全てのサンプルスポットに対して強度スケールを調整する。
キャリブレーションプロセスは質量分析プロセスにおける系統誤差を較正する。キャリブレーションは内部的にも外部的にも実行される。内部キャリブレーションでは、分析されるサンプルはM/Zが既知である1個以上のサンプルを含む。既知サンプルに対して得られたM/Zの差は未知サンプルのM/Zを補正するため使用される。外部キャリブレーションでは、上記の内部キャリブレーションによって作成されたような飛行時間をM/Z比に変換する関数が、内部キャリブレーションを用いることなく、飛行時間スペクトルに適用される。典型的なキャリブレーション方法は、2002年7月11に出願された米国特許出願第10/194,452号明細書、発明の名称“Methods for Calibrating a Mass Spectrometer”に記載されている。
CiphergenのProteinChip(登録商標)ソフトウェアで使用されるようなピーク同定プロセスはピークの検出を自動化し、本発明の実施形態で使用可能である。一般に、このソフトウェアは、選択されたスレッショルドよりも高い信号対雑音比を有する信号を識別し、ピーク信号の中心のピークの質量にラベルを付けることにより機能する。一つの有用なアプリケーションでは、多数のスペクトルが質量スペクトルのある選択されたパーセンテージに存在する同一のピークを識別するため比較される。このソフトウェアのあるバージョンは、定義された質量範囲内の種々のスペクトルに現れる全てのピークを分類し、質量(M/Z)を質量(M/Z)クラスタの中間点付近にある全てのピークに割り当てる。典型的なピーク同定方法は、発明の名称がどちらも“Method For Analyzing Mass Spectra”である2001年11月15日に出願された米国特許出願第10/084,587号明細書、及び、2001年11月15日に出願された米国特許出願第09/999,081号明細書に記載される。
ベースラインサブトラクションプロセスは同じ質量スペクトルデータに対して実行される。ベースラインサブトラクションプロセスは、スペクトルを乱す人工的な、再現可能な機器オフセットを除去することによりデータ定量化を改善する。それは、ピーク幅のようなパラメータを組み込むアルゴリズムを使用するスペクトルベースラインの計算と、質量スペクトルからのベースラインの減算とを伴う。
質量スペクトルデータはさらにフィルタ処理される。高周波雑音信号は平滑化関数の適用によって除去される。典型的な平滑化関数は、移動平均関数を時間に依存したビンに適用する。改良バージョンでは、移動平均フィルタは、フィルタの帯域幅が、たとえば、一般的に、飛行時間の増加に伴って広くなるピーク帯域幅の関数として変化する可変幅デジタルフィルタである。国際公開第00/70648号パンフレット、2000年11月23日(Gavin外、“Variable Width Digital Filter for Time−of−flight Mass Spectrometry”)を参照のこと。
一部の実施形態では、スペクトルは、質量スペクトルを(たとえば、自動的に)分析するため、問い合わせ条件を満たすスペクトルをデータベースに問い合わせることにより、一体的にスタディに集められる。本明細書で使用されるように、「分析」は、スペクトルから有用な情報を得るため、又は、得ることを試みるため質量スペクトルを適当な方法で分析又は処理することを含む。たとえば、質量スペクトルは潜在的なマーカーを発見するため分析される。別の実施例では、質量スペクトルは分類モデルを形成するため分析され、及び/又は、特有のクラス(たとえば、疾患又は正常)に従ってスペクトル(及びそれらに対応するサンプル)を分類するため分析される。たとえば、これらの条件は、フォルダ、取得の時間、ユーザ、アレイタイプ、サンプルタイプ、患者、グループなどに基づく。類似した処理条件下でスペクトルを比較するため、質量スペクトルのグループは所定の値の組で選択される(図3のステップ32)。図10に示されるように、ユーザは、多数の異なるデータフィールド162から共通の特性を選択し、これらの選択された特性がウィンドウ164に表示される。ウィンドウ166に表されているように、チップタイプ「IMAC3」と、EAM(エネルギー吸収材)SPA(シナピン酸)を使用して作成された8個のスペクトルは一つのグループに集められる。
図2−3を再度参照すると、所定の値の組をもつ質量スペクトルのグループを選択した後、グループ化されたスペクトルが分析される(ステップ34)。たとえば、グループ化されたスペクトルは、スペクトルと関連した様々なサンプルグループを区別する潜在的なバイオマーカーを明らかにするかどうかを決定するため、統計的プロセスを使用して分析される。これらのステップを実行するコードは、クライアントコンピュータ44又はサーバコンピュータ46にある分析モジュールに存在する。
一部の実施形態では、分析モジュールは選択されグループ化された質量スペクトルデータに分析アルゴリズムを適用する。分析モジュールは、階層クラスタリング、p値プロット、及び、マルチコンディションビジュアライゼーションのような分析プロセスを使用する。
再帰的分割解析のような統計的プロセスは同様にスペクトルを分類するため使用される。一体的にグループ化されたスペクトルは、分類モデルを使用するパターン認識プロセスを使用して分類可能である。一般に、スペクトルは、分類アルゴリズムが求められた少なくとも2種類のグループからのサンプルを表す。たとえば、グループは、疾患対非疾患(たとえば、癌対非癌)、薬物反応者対薬物非反応者、毒性反応対毒性非反応、疾病進行対疾病非進行、形質コンディション有り対形質コンディション無しである。
一部の実施形態では、「既知サンプル」のようなサンプルを使用して発生させられたスペクトル(たとえば、質量スペクトル又は飛行時間スペクトル)から導出されたデータは、次に、分類モデルを「訓練」するため使用される。「既知サンプル」は予め分類されたサンプルである。スペクトルから導出され、分類モデルを形成するため使用されるデータは、「訓練データセット」と呼ばれる。一旦訓練されると、分類モデルは未知サンプルを使用して発生させられたスペクトルから導出されたデータ中のパターンを認識できる。分類モデルはその後未知サンプルをクラスに分類するため使用できる。これは、たとえば、特定の生物学的サンプルがある種の生物学的条件(たとえば、疾病対非疾病)に関連しているかどうかを予測する際に役立つ。
分類モデルを形成するため使用される訓練データセットは未加工データ又は前処理済みデータを含む。一部の実施形態では、未加工データは飛行時間スペクトル又は質量スペクトルから直接的に得られ、上記のようにオプション的に「前処理」される。
分類モデルは、多数のデータを、データに存在する客観的パラメータに基づいて、クラスに分離しようとする適当な統計的分類(又は「学習」)方法を使用して形成される。分類方法は教師付きでも教師無しでもよい。教師付き分類プロセス及び教師無し分類プロセスの実施例は、参照によってその全体がここに組み込まれたJain,“Statistical Pattern Recognition: A Review”,IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.22, No.1, January 2000に記載されている。
教師付き分類では、既知カテゴリーの例を収容する訓練データは学習機械に提示され、学習機械は既知クラスのそれぞれを定義する1組以上の関係を学習する。新しいデータが次に学習機械に適用され、学習機械は学習した関係を使用して新しいデータを分類する。教師付き分類プロセスの実施例には、線形回帰プロセス(たとえば、多重線形回帰(MLR)、部分最小自乗(PLS)回帰、及び、主成分回帰(PCR))と、二分決定木(たとえば、CART−分類及び回帰木のような再帰的分割プロセス)と、バックプロパゲーションネットワークのような人工神経回路網と、判別分析(たとえば、ベイズ分類器又はフィッシャー分析)と、ロジスティック分類と、サポートベクトル分類器(サポートベクトル機械)とが含まれる。
好ましい教師付き分類方法は再帰的分割プロセスである。再帰的分割プロセスは未知サンプルから得られたスペクトルを分類するため再帰的分割木を使用する。再帰的分割プロセスに関するより詳細は、2000年11月16日に出願された米国仮特許出願第60/249,835号明細書、2000年12月11日に出願された米国仮特許出願第60/254,746号明細書、2001年11月15日に出願された米国特許出願第09/999,081号明細書、及び、2002年2月25日に出願された米国特許出願第10/084,587号明細書にある。これらの米国仮特許出願及び特許出願のすべては、あらゆる目的のためその全体が参照によって本明細書に組み込まれる。
他の実施形態では、作成された分類方法は教師無し学習方法を使用して形成される。教師無し分類は、訓練データセットが得られたスペクトルを予め分類することなく、訓練データセット内の類似性に基づいて分類を学習することを試みる。教師無し学習方法はクラスタ分析を含む。クラスタ分析は、データを、理想的には互いに非常に類似し、他のクラスタのメンバーとは非常に異なるメンバーを有するべきである「クラスタ」、すなわち、グループに分割しようとする。類似性は、データ項目間の距離を測定し、互いに接近したデータ項目を一緒に集めるある種の距離メトリックを使用して測定される。クラスタリング技術は、MacQueenのK平均アルゴリズムとコホーネンの自己組織化マップアルゴリズムを含む。
他の信号処理ステップは、グループ化された質量スペクトル内の関心のあるピークの同定を助けるため、信号処理モジュールによってグループ化された質量スペクトルに関して実行される。たとえば、図11は、ユーザがファーストパス信号対雑音比、最小ピークスレッショルド%、クラスタ質量ウィンドウ%、セカンドパスS/N比、又は、特定のM/Z範囲を入力できるグラフィカルユーザインタフェースを表す。それは同様に、ユーザがクラスタを完成するため推定ピークを追加することを可能にさせる。「ファーストパスS/N」は、ユーザがピーク検出の第1パスの感度を指定することを可能にさせる。この数が高いほど、検出されるピークの数は小さい。「最小ピークスレッショルド%」は、ユーザがクラスタを形成するためにピークが出現しなければならないスペクトルのパーセンテージを指定することを可能にさせる。「クラスタ質量ウィンドウ%」は、ユーザがクラスタ質量ウィンドウの幅を指定することを可能にさせる。「セカンドパスS/N」は、より小さいピークが既存クラスタへ追加され得るように、ユーザがピーク検出の第2パスを起動することを可能にさせる。第2パスの感度は最小信号対雑音値を変更することによって調整される。「M/Z範囲下限」は、ユーザが第2パスの開始質量を指定することを可能にさせる。「M/Z範囲上限」は、ユーザが第2パスの終了質量を指定することを可能にさせる。「クラスタを完成するため推定ピークを追加」はユーザが推定ピークを、所与のクラスタ内にまだピークをもたないスペクトルに追加することを可能にさせる。
図12は、p値又はM/Z値のような列によってソートされたスペクトルのクラスタ化されたピークのリストを表すグラフィカルユーザインタフェースを示す。クラスタマップ及びヒートマップのような他の視覚化ツールはスペクトルのクラスタ間の類似性又は非類似性を表す。ハートマップ403及び樹状図(又はクラスタマップ)401の実施例は図17に示されている。樹状図401において、隣接した一対のラインの長さはスペクトルの類似性又は非類似性の程度を表す。たとえば、一部の実施形態では、一対の隣接したラインが長くなると、スペクトルの非類似性が大きくなる。樹状図ボタン405は、ユーザが(たとえば、バイオプロセッサーにおいて)列又は行によりスペクトルを分類できるようにするためユーザによって選択される。
階層クラスタリング及びヒートマップ視覚化技術は、Eisen外,“Cluster Analysis and Display of Genome−Wide Expression Pattern”, Proc. Natl. Acad. Sci. USA, Vol.95, pp.14863−14858, December 1998に記載されている。この論文に記載されたアルゴリズムは、しかし、本発明の実施形態で使用されるアルゴリズムとは異なる。本発明の実施形態では、ヒートマップの各列はスペクトルに対応し、各行はクラスタ(又は潜在的なマーカー)に対応し、各セルはピークに対応する。各セルの色及び強度は対応するピークの対数正規化強度によって決定され、それは、次の式、
対数正規化強度=対数強度−対数平均強度
によって定義される。対数正規化強度はマップ内の最大絶対値対数正規化強度によってさらに除算される。その商は最終的にRGB(赤、緑、及び、青)値に変換され、正値は赤に割り付けられ、負値は緑に割り付けられる。
対数正規化強度=対数強度−対数平均強度
によって定義される。対数正規化強度はマップ内の最大絶対値対数正規化強度によってさらに除算される。その商は最終的にRGB(赤、緑、及び、青)値に変換され、正値は赤に割り付けられ、負値は緑に割り付けられる。
分析モジュールは発現差解析を実行するコードを含む。たとえば、図13に示されたグラフィカルユーザインタフェースでは、第1のウィンドウ176は、スペクトルの二つのグループにおいてM/Z値が約6958.145のときにピーククラスタ11内のピークを表す。グループ1は、100フェムトモル(fm)のグループを表現し、6969.46の周辺に3個のピークを有し、グループ2は、300フェムトモル(fm)のグループを表現し、6957.044の周辺に5個のピークを有する。8個のピークに関係するデータがウィンドウ174内のテーブルに一覧表示される。データは、ピークが推定ピークであるかどうか、ピーク数、グループインデックス、クラスタインデックス、M/Z値、電荷、イオン質量、及び、信号対雑音比(S/N)を含む。ウィンドウ172内のグラフは、100fmと300fmにおけるピーククラスタを表すため使用される。ウィンドウ172に表されるように、ピークは100fmサンプルと300fmサンプルに対して別々に集まるので、約6958.145のM/Z値と関連した物質が二つのサンプルグループを区別することを示す。
図14は、ユーザが質量スペクトルの特定のグループを見つけることを可能にする問い合わせツールを表す。図14のウィンドウ182に示されるように、ユーザは、エネルギー吸収材としての「SPA」と、チップタイプとしての「WCX2」のような特有の情報を入力し、これらの値を有するスペクトルを検索する。問い合わせの結果は図14のウィンドウ184に示される。ウィンドウ184に示されるように、WCX2とSPAに関連した質量スペクトルだけが一覧表示される。
図15は、スペクトルのグループ、及び、スペクトルがシステム内でどのように操作できるかを示すグラフィカルユーザインタフェースを表す。図からわかるように、ユーザは、図示されたドロップダウンメニュー内の適切な項目を選択することにより、スペクトルを切り取り、スペクトルをコピーし、スペクトルを貼り付け、スペクトルを選択し、変更を更新し、スペクトルを削除し、スペクトルをエクスポートし、スペクトルのピークを取得し、未加工のスペクトルを取得し、レポートを作成し、スペクトルプロパティを獲得し、スペクトルを正規化する。
ユーザはまた各個別のスペクトルのプロパティを閲覧する。たとえば、図16は、特定の質量スペクトルの特定のプロパティを含むグラフィカルユーザインタフェースを表す。図からわかるように、質量スペクトルデータは、グループ、フラクション名などのような情報でアノテートされる。
本発明の一部の実施形態では、上記の種々のテーブル及び画面は、様々なタイプのユーザのため「動的に変更」される。たとえば、図4は、ユーザがサンプルデータを入力するテーブル102を含むグラフィカルユーザインタフェースのスクリーンショットを表す。図からわかるように、テーブル102は列を含む。各列は、リレーショナルデータベースのようなデータベースで見つけられる種々の情報を含む。たとえば、図からわかるように、「患者」列は患者を識別する情報を含む。テーブル102は人間の生物学的サンプルを分析したいと思うユーザの役に立つが、テーブル102は植物の生物学的サンプルに関係するデータをシステムへ入力したいと思うユーザの役に立たない。
従来、図4に表されるようなスクリーンショットを表示するグラフィカルユーザインタフェースを生成するため、リレーショナルデータベース要素間のマッピングと、プログラミングオブジェクトと、グラフィカルユーザインタフェース(GUI)のためのコードがソースコードにハードコード化される。したがって、異なるユーザのためにテーブル102のデータビューを変更したい場合、テーブルに対応するオブジェクト及びGUIのコードを含むソースコードは、そのテーブルのためコンパイルされるべきであろう。このソースコードは同様に、再コンパイルされ、テストされ、ソフトウェアを使用する全てのエンティティに配置されるべきであろう。
本発明の一部の実施形態では、GUI要素をデータベース内のデータオブジェクトに割り付けるマッピングフレームワークを含む外部コンフィギュレーションファイルが設けられる。データオブジェクトは、汎用的であり、動的拡張可能である。オブジェクトのためのデータはオブジェクトのマッピングに基づいて検索され、GUIはGUI要素及び検索されたデータを使用して表示される。
データは、データベースに常駐する汎用的な動的拡張可能オブジェクトの内部で1個以上のアレイに格納される。コンフィギュレーションファイル内のマッピングフレームワークはデータベースからデータを取り出すため使用される。たとえば、データベース内のテーブルは、「患者名」の列及び「血液型」の列を有する。データテーブルは2行を有する。第1行は「患者名」の下のエントリーとして「患者A」を、「血液型」のエントリーとして「B型Rhマイナス」を有する。第2行は「患者名」のエントリーとして「患者B」を、「血液型」のエントリーとして「B型Rhプラス」を有する。「患者A」及び「B型Rhマイナス」を含むテーブル内の水平行のデータは「オブジェクト」を構成する。
上記のように、多重多様なユーザのために適合するように図4に表されたテーブルを変更したい場合がある。たとえば、列に表示されたデータを追加、削除、又は、変更したい場合がある。この場合、異なるデータで変更された列及び新しいテーブルは、マッピングフレームワークの再コンパイルや変更を必要とすることなく、そのマッピングフレームワークを使用して生成される。たとえば、図4に示されたテーブル102を参照すると、コンフィギュレーションファイルは、テーブル102を生成するためマッピングフレームワークを含む。テーブルは「患者」列のためのエントリーを含む。このエントリーは、データベースの汎用オブジェクトの内部アレイに記憶された患者データへのマッピングを含む。生物学的な植物名のため様々な植物名を表示したい場合には、「患者」を「植物名」で置き換えたエントリーがコンフィギュレーションファイルに包含され、そのエントリーはデータベース内の種々の植物データへのマッピングリファレンスを含む。種々のデータは既にデータベースに収容されていることが仮定されている。もしそうでなければ、種々のデータはデータベースに追加できるか、又は、マッピングフレームワークからアクセス可能である。上記のように、マッピングフレームワークは汎用オブジェクトを読み、汎用オブジェクトをGUI要素へ割り付けるため構成される。したがって、汎用オブジェクトが変更されるとしても、フレームワークは依然として変更されたオブジェクトを適切なGUI要素へ割り付けることが可能である。種々のデータはGUI要素へ割り付けられ、表示される。再コンパイルは不要であり、マッピングフレームワークは実質的な様態で変更される必要がない。
ハッシュテーブルもまたデータを記憶し検索するためのメカニズムとして使用される。ハッシュテーブルは本発明の実施形態で使用可能であるが、ハッシュテーブルは、本明細書で説明されたマッピングフレームワークよりも多くのメモリを必要とし、速度が遅い。マッピングフレームワークはそれにもかかわらず、コマンドをアレイ内の値を取得又は設定するコマンドに変換することにより、汎用オブジェクトのデータのアレイ内のデータにアクセスするため、getValue(キー文字列)、及び、setValue(キー文字列、オブジェクト値)のような典型的にハッシュテーブルにアクセスするため使用されるコマンドを使用する。
以上の説明は本発明の一部の好ましい実施形態を対象にしているが、本発明のその他及びさらなる実施形態が本発明の基本的な範囲から逸脱することなく考え出される。このような代替的な実施形態は本発明の範囲に包含されることが意図される。さらに、本発明の一つ以上の実施形態の特徴は、本発明の範囲を逸脱することなく本発明の他の実施形態の一つ以上の実施形態と組み合わされる。
本願において引用された全ての刊行物及び特許文献は、個々の刊行物又は特許文献が個別に表示されるのと同じ程度に、あらゆる目的のためその全体が参照によって組み込まれる。本明細書に種々の参考文献を引用しているが、出願人は特定の参考文献が本発明に対して「先行技術」であることを認めるものではない。
Claims (25)
- (a)1個以上のサンプルチップ上の複数のサンプルスポットと関連した値であって、グラフィカルユーザインタフェース上に前記サンプルスポットを表現するグラフィック要素を使用して入力された値を受信するステップと、
(b)前記サンプルスポットから生成される複数の信号を表現するデータを受信するステップと、
(c)前記複数の信号中の各信号を、前記信号が生成された前記サンプルスポットと関連した値の組で自動的にアノテートするステップと、
を含む、複数の信号を処理する方法。 - 前記信号が質量スペクトルである、請求項1記載の方法。
- ステップ(a)の前に、
前記複数のサンプルスポットと関連した前記値をクライアントコンピュータへ入力するステップと、
前記複数のサンプルスポットと関連した前記入力された値を前記クライアントコンピュータからサーバコンピュータへ送信するステップと、
前記クライアントコンピュータで前記サーバコンピュータから前記入力された値を受信するステップと、
をさらに含む、請求項1記載の方法。 - 前記複数のサンプルスポットと関連した前記値が、サンプル同定情報、特定のサンプルタイプ、特有のエネルギー吸収マトリックス材料、特有の洗浄条件、及び、特有のクロマトグラフィーフラクションよりなる群から選択された少なくとも一つを含む、請求項1記載の方法。
- 前記信号がスペクトルであり、
ステップ(c)の後に、
(d)前記値の組を選択するステップと、
(e)前記選択された値の組を有するスペクトルのグループを選択するステップと、
(f)ステップ(e)で選択された前記選択されたスペクトルのグループを分析するステップと、
をさらに含む、請求項1記載の方法。 - 前記選択されたスペクトルのグループを分析するステップ(f)が前記選択されたスペクトルのグループに統計的分析プロセスを実行するステップを含む、請求項5記載の方法。
- 前記選択されたスペクトルのグループを分析するステップ(f)が発現差解析又は再帰的分割プロセスを実行するステップを含む、請求項5記載の方法。
- 前記信号が質量スペクトルであり、
(d)複数の質量スペクトルを発生させるステップをさらに含む、
請求項1記載の方法。 - 前記信号が質量スペクトルであり、
(d)表面増強レーザー脱離イオン化プロセスを使用して複数の質量スペクトルを発生させるステップをさらに含む、
請求項1記載の方法。 - 前記信号が質量スペクトルであり、
ステップ(a)の前に、
(d)前記グラフィカルユーザインタフェース上の前記グラフィック要素を使用して前記値を入力するステップと、
(e)ステップ(d)で入力された前記値を使用して前記1個以上のサンプルチップに前記複数のサンプルスポットを準備するステップと、
(e)表面増強レーザー脱離イオン化プロセスを使用し、ステップ(d)で入力された前記値を使用し、複数の質量スペクトルを発生させるステップと、
をさらに含む、請求項1記載の方法。 - 前記信号が質量スペクトルであり、
ステップ(a)の前に、
(d)前記グラフィカルユーザインタフェース上の前記グラフィック要素を使用して前記値を入力するステップと、
(e)ステップ(d)で入力された前記値を使用して前記1個以上のサンプルチップに前記複数のサンプルスポットを準備するステップと、
(e)表面増強レーザー脱離イオン化プロセスを使用し、ステップ(d)で入力された前記値を使用し、複数の質量スペクトルを発生させるステップと、
をさらに含み、
ステップ(d)−(e)が自動的に実行される、
請求項1記載の方法。 - (a)1個以上のサンプルチップ上の複数のサンプルスポットと関連した値であって、グラフィカルユーザインタフェース上に前記サンプルスポットを表現するグラフィック要素を使用して入力された値を受信するコードと、
(b)前記サンプルスポットから生成された複数の信号を表現するデータを受信するコードと、
(c)前記複数の信号中の各信号を、前記信号が生成された前記サンプルスポットと関連した値の組で自動的にアノテートするコードと、
を含むコンピュータ読み取り可能な媒体。 - 前記信号が質量スペクトルである、請求項12記載のコンピュータ読み取り可能な媒体。
- 前記複数のサンプルスポットと関連した前記値をクライアントコンピュータへ入力するコードと、
前記複数のサンプルスポットと関連した前記入力された値を前記クライアントコンピュータからサーバコンピュータへ送信するコードと、
前記クライアントコンピュータで前記サーバコンピュータから前記入力された値を受信するコードと、
をさらに含む、請求項12記載のコンピュータ読み取り可能な媒体。 - 前記複数のサンプルスポットと関連した前記値が、サンプル同定情報、特有のサンプルタイプ、特有のエネルギー吸収マトリックス材料、特有の洗浄条件、及び、特有のクロマトグラフィーフラクションよりなる群から選択された少なくとも一つを含む、請求項12記載のコンピュータ読み取り可能な媒体。
- 前記信号がスペクトルであり、
(d)前記値の組を選択するコードと、
(e)前記選択された値の組を有するスペクトルのグループを選択するコードと、
(f)コード(e)で選択された前記選択されたスペクトルのグループを分析するコードと、
をさらに含む、請求項12記載のコンピュータ読み取り可能な媒体。 - 前記選択されたスペクトルのグループを分析するコード(f)が前記選択されたスペクトルのグループに統計的分析プロセスを実行するコードを含む、請求項16記載のコンピュータ読み取り可能な媒体。
- 前記選択されたスペクトルのグループを分析するコード(f)が発現差解析又は再帰的分割プロセスを実行するコードを含む、請求項16記載のコンピュータ読み取り可能な媒体。
- (d)前記グラフィカルユーザインタフェース上の前記グラフィック要素を使用して前記値を入力するコードと、
(e)コード(d)で入力された前記値を使用して前記1個以上のサンプルチップに前記複数のサンプルスポットを準備するコードと、
(e)表面増強レーザー脱離イオン化プロセスを使用し、コード(d)で入力された前記値を使用し、複数の質量スペクトルを発生させるコードと、
をさらに含む、請求項12記載のコンピュータ読み取り可能な媒体。 - (a)分析装置と、
(b)前記分析装置からデータを受信し、コンピュータ読み取り可能な媒体を備えたデジタルコンピュータと、
を具備し、
前記コンピュータ読み取り可能な媒体が、
(i)1個以上のサンプルチップ上の複数のサンプルスポットと関連した値であって、グラフィカルユーザインタフェース上に前記サンプルスポットを表現するグラフィック要素を使用して入力された値を受信するコードと、
(ii)前記サンプルスポットから生成された複数の信号を表現するデータを受信するコードと、
(iii)前記複数の信号中の各信号を、前記信号が生成された前記サンプルスポットと関連した値の組で自動的にアノテートするコードと、
を含む、
質量スペクトルを処理するシステム。 - 前記デジタルコンピュータがクライアントコンピュータであり、
(c)前記クライアントコンピュータと通信するサーバコンピュータをさらに具備する、請求項20記載のシステム。 - 前記信号が質量スペクトルである、請求項20記載のシステム。
- 前記値が、サンプル同定情報、特定のサンプルタイプ、特定のエネルギー吸収マトリックス材料、特有の洗浄条件、及び、特有のクロマトグラフィーフラクションよりなる群から選択された少なくとも一つを含む、請求項20記載のシステム。
- 前記デジタルコンピュータと通信するデータベースをさらに具備し、
前記コンピュータ読み取り可能な媒体が、異なるデータが前記データベースから取り出されるようにユーザがコンフィギュレーションファイルを変更することを可能にさせるコードをさらに含み、
前記異なるデータが前記グラフィカルユーザインタフェースを変更する、
請求項20記載のシステム。 - 前記デジタルコンピュータと通信するデータベースをさらに具備し、
前記コンピュータ読み取り可能な媒体が、
(d)前記グラフィカルユーザインタフェース上の前記グラフィック要素を使用して前記値を入力するコードと、
(e)コード(d)で入力された前記値を使用して前記1個以上のサンプルチップに前記複数のサンプルスポットを準備するコードと、
(e)表面増強レーザー脱離イオン化プロセスを使用し、コード(d)で入力された前記値を使用し、複数の質量スペクトルを発生させるコードと、
をさらに含む、
請求項20記載のシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US44307103P | 2003-01-27 | 2003-01-27 | |
PCT/US2004/001149 WO2004070523A2 (en) | 2003-01-27 | 2004-01-15 | Data management system and method for processing signals from sample spots |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006515929A true JP2006515929A (ja) | 2006-06-08 |
Family
ID=32850768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006502862A Pending JP2006515929A (ja) | 2003-01-27 | 2004-01-15 | サンプルスポットからのプロセシング信号についてのデータ管理システムおよびデータ管理方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6909981B2 (ja) |
EP (1) | EP1588192A2 (ja) |
JP (1) | JP2006515929A (ja) |
WO (1) | WO2004070523A2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008053924A1 (fr) * | 2006-10-31 | 2008-05-08 | Keio University | Procédé de classement de paires de protéines/composés |
JPWO2008081524A1 (ja) * | 2006-12-27 | 2010-04-30 | 株式会社インテリジェントセンサーテクノロジー | 味認識装置及びそれを用いる味認識システム |
JP2012127817A (ja) * | 2010-12-15 | 2012-07-05 | Shimadzu Corp | 液体クロマトグラフ質量分析装置 |
JP2012243667A (ja) * | 2011-05-23 | 2012-12-10 | Jeol Ltd | 飛行時間質量分析装置及び飛行時間質量分析方法 |
JP2019521329A (ja) * | 2016-05-24 | 2019-07-25 | マイクロサイク システムズ パブリック リミテッド カンパニー | 多価種の低分解能質量電荷比スペクトルから質量情報を抽出する方法 |
Families Citing this family (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6803568B2 (en) * | 2001-09-19 | 2004-10-12 | Predicant Biosciences, Inc. | Multi-channel microfluidic chip for electrospray ionization |
US7105810B2 (en) * | 2001-12-21 | 2006-09-12 | Cornell Research Foundation, Inc. | Electrospray emitter for microfluidic channel |
US6900431B2 (en) * | 2003-03-21 | 2005-05-31 | Predicant Biosciences, Inc. | Multiplexed orthogonal time-of-flight mass spectrometer |
US7537807B2 (en) | 2003-09-26 | 2009-05-26 | Cornell University | Scanned source oriented nanofiber formation |
US20050133712A1 (en) * | 2003-12-18 | 2005-06-23 | Predicant Biosciences, Inc. | Scan pipelining for sensitivity improvement of orthogonal time-of-flight mass spectrometers |
US7254593B2 (en) * | 2004-01-16 | 2007-08-07 | International Business Machines Corporation | System and method for tracking annotations of data sources |
US7022980B2 (en) * | 2004-02-02 | 2006-04-04 | Agilent Technologies, Inc. | Spectral axis transform |
US6958473B2 (en) * | 2004-03-25 | 2005-10-25 | Predicant Biosciences, Inc. | A-priori biomarker knowledge based mass filtering for enhanced biomarker detection |
US20060022130A1 (en) * | 2004-07-29 | 2006-02-02 | Predicant Biosciences, Inc., A Delaware Corporation | Microfluidic devices and methods with integrated electrical contact |
US7591883B2 (en) * | 2004-09-27 | 2009-09-22 | Cornell Research Foundation, Inc. | Microfiber supported nanofiber membrane |
EP1647873A1 (en) * | 2004-10-12 | 2006-04-19 | Waters GmbH | Generic electronic laboratory notebook |
WO2006128306A1 (en) * | 2005-06-03 | 2006-12-07 | Mds Inc. Doing Business Through Its Mds Sciex Divison | System and method for data collection in recursive mass analysis |
US8031348B2 (en) | 2005-06-08 | 2011-10-04 | Ricoh Company, Ltd. | Approach for securely printing electronic documents |
US8116983B2 (en) * | 2005-06-30 | 2012-02-14 | Biocrates Life Sciences Ag | Device for quantitative analysis of a drug or metabolite profile |
WO2007065266A1 (en) * | 2005-12-07 | 2007-06-14 | Mds Inc., Doing Business Through Its Mds Sciex Division | Automated analysis of complex matrices using mass spectrometer |
US7548818B2 (en) * | 2005-12-07 | 2009-06-16 | Mds Analytical Technologies | Automated analysis of complex matrices using mass spectrometer |
US8785848B2 (en) * | 2007-07-11 | 2014-07-22 | Excellims Corporation | Parallel ion mass and ion mobility analysis |
JP5624881B2 (ja) * | 2007-04-17 | 2014-11-12 | イー・エム・デイー・ミリポア・コーポレイシヨン | 位置特有のマルチパラメータデータセットを分析し比較するグラフィックユーザインターフェイス |
US8115951B2 (en) | 2007-04-20 | 2012-02-14 | Ricoh Company, Ltd. | Approach for implementing locked printing with unlock via a user input device |
CN102077095B (zh) * | 2008-04-24 | 2014-12-10 | 泰肯贸易股份公司 | 在计算机控制的液体处理工作站中的直接移液 |
US8228538B2 (en) * | 2008-06-23 | 2012-07-24 | Ricoh Company, Ltd. | Performance of a locked print architecture |
US9411956B2 (en) | 2008-07-02 | 2016-08-09 | Ricoh Company, Ltd. | Locked print with intruder detection and management |
US8463743B2 (en) * | 2009-02-17 | 2013-06-11 | Microsoft Corporation | Shared composite data representations and interfaces |
US8738584B2 (en) * | 2009-02-17 | 2014-05-27 | Microsoft Corporation | Context-aware management of shared composite data |
US20100253968A1 (en) * | 2009-04-03 | 2010-10-07 | Jayasimha Nuggehalli | Approach for displaying cost data for locked print data at printing devices |
US20110078194A1 (en) * | 2009-09-28 | 2011-03-31 | Oracle International Corporation | Sequential information retrieval |
US10552710B2 (en) * | 2009-09-28 | 2020-02-04 | Oracle International Corporation | Hierarchical sequential clustering |
US10013641B2 (en) * | 2009-09-28 | 2018-07-03 | Oracle International Corporation | Interactive dendrogram controls |
DE102010046731B4 (de) * | 2010-09-28 | 2015-07-02 | Bruker Daltonik Gmbh | Kalibrierfunktion für Flugzeitmassenspektrometer höchster Massengenauigkeit |
US8428889B2 (en) | 2010-10-07 | 2013-04-23 | Thermo Finnigan Llc | Methods of automated spectral peak detection and quantification having learning mode |
TW201426620A (zh) | 2012-12-19 | 2014-07-01 | Ind Tech Res Inst | 健康檢查路徑評估指標建構系統、方法、運用此方法之裝置及電腦程式產品 |
EP3058580A4 (en) * | 2013-10-16 | 2017-04-19 | DH Technologies Development PTE. Ltd. | Multiplexed precursor isolation for mass spectrometry |
JP6719309B2 (ja) * | 2016-07-14 | 2020-07-08 | 株式会社日立製作所 | 運用支援装置及び運用支援方法 |
US11681778B2 (en) * | 2016-08-03 | 2023-06-20 | Shimadzu Corporation | Analysis data processing method and analysis data processing device |
JP7225743B2 (ja) * | 2018-12-05 | 2023-02-21 | 株式会社島津製作所 | スペクトル演算処理装置、スペクトル演算処理方法、スペクトル演算処理プログラム、イオントラップ質量分析システムおよびイオントラップ質量分析方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001002595A (ja) * | 1999-06-23 | 2001-01-09 | Shimadzu Corp | 自動合成装置 |
JP2002005859A (ja) * | 2000-06-20 | 2002-01-09 | Rigaku Industrial Co | 試料情報設定方法および分析システム |
WO2002086794A1 (en) * | 2001-04-20 | 2002-10-31 | Sequenom, Inc. | Systems and methods for testing a biological sample |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NZ516848A (en) * | 1997-06-20 | 2004-03-26 | Ciphergen Biosystems Inc | Retentate chromatography apparatus with applications in biology and medicine |
US6366690B1 (en) * | 1998-07-07 | 2002-04-02 | Applied Materials, Inc. | Pixel based machine for patterned wafers |
ATE540421T1 (de) * | 2000-11-16 | 2012-01-15 | Bio Rad Laboratories | Methode zum analysieren von massenspektren |
US20020072982A1 (en) * | 2000-12-12 | 2002-06-13 | Shazam Entertainment Ltd. | Method and system for interacting with a user in an experiential environment |
US6584413B1 (en) * | 2001-06-01 | 2003-06-24 | Sandia Corporation | Apparatus and system for multivariate spectral analysis |
-
2004
- 2004-01-08 US US10/754,461 patent/US6909981B2/en not_active Expired - Lifetime
- 2004-01-15 JP JP2006502862A patent/JP2006515929A/ja active Pending
- 2004-01-15 WO PCT/US2004/001149 patent/WO2004070523A2/en active Application Filing
- 2004-01-15 EP EP04702572A patent/EP1588192A2/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001002595A (ja) * | 1999-06-23 | 2001-01-09 | Shimadzu Corp | 自動合成装置 |
JP2002005859A (ja) * | 2000-06-20 | 2002-01-09 | Rigaku Industrial Co | 試料情報設定方法および分析システム |
WO2002086794A1 (en) * | 2001-04-20 | 2002-10-31 | Sequenom, Inc. | Systems and methods for testing a biological sample |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008053924A1 (fr) * | 2006-10-31 | 2008-05-08 | Keio University | Procédé de classement de paires de protéines/composés |
JP5211347B2 (ja) * | 2006-10-31 | 2013-06-12 | 学校法人慶應義塾 | タンパク質−化合物間相互作用予測方法 |
JPWO2008081524A1 (ja) * | 2006-12-27 | 2010-04-30 | 株式会社インテリジェントセンサーテクノロジー | 味認識装置及びそれを用いる味認識システム |
US7858036B2 (en) | 2006-12-27 | 2010-12-28 | Intelligent Sensor Technology, Inc. | Taste recognition apparatus and taste recognition system using the same |
JP4789952B2 (ja) * | 2006-12-27 | 2011-10-12 | 株式会社インテリジェントセンサーテクノロジー | 味認識装置及びそれを用いる味認識システム |
JP2012127817A (ja) * | 2010-12-15 | 2012-07-05 | Shimadzu Corp | 液体クロマトグラフ質量分析装置 |
JP2012243667A (ja) * | 2011-05-23 | 2012-12-10 | Jeol Ltd | 飛行時間質量分析装置及び飛行時間質量分析方法 |
JP2019521329A (ja) * | 2016-05-24 | 2019-07-25 | マイクロサイク システムズ パブリック リミテッド カンパニー | 多価種の低分解能質量電荷比スペクトルから質量情報を抽出する方法 |
JP7065039B2 (ja) | 2016-05-24 | 2022-05-11 | マイクロサイク システムズ パブリック リミテッド カンパニー | 多価種の低分解能質量電荷比スペクトルから質量情報を抽出する方法 |
Also Published As
Publication number | Publication date |
---|---|
US20040159783A1 (en) | 2004-08-19 |
US6909981B2 (en) | 2005-06-21 |
EP1588192A2 (en) | 2005-10-26 |
WO2004070523A2 (en) | 2004-08-19 |
WO2004070523A3 (en) | 2005-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6909981B2 (en) | Data management system and method for processing signals from sample spots | |
Petricoin et al. | SELDI-TOF-based serum proteomic pattern diagnostics for early detection of cancer | |
López-Fernández et al. | Mass-Up: an all-in-one open software application for MALDI-TOF mass spectrometry knowledge discovery | |
Monroe et al. | VIPER: an advanced software package to support high-throughput LC-MS peptide identification | |
JP4768189B2 (ja) | 非標的化複雑試料分析の方法 | |
EP1337845B1 (en) | Method for analyzing mass spectra | |
Bowler et al. | Proteomics in pulmonary medicine | |
Vestal | The future of biological mass spectrometry | |
David et al. | SpecOMS: a full open modification search method performing all-to-all spectra comparisons within minutes | |
JP4704034B2 (ja) | クロマトグラフィ/分光測定データの解析でデータビンニングを用いる方法 | |
Carvalho et al. | Analyzing shotgun proteomic data with PatternLab for proteomics | |
CN106415558B (zh) | 数据处理装置、质谱法装备和用于质谱法数据的评估的方法 | |
CN110838340A (zh) | 一种不依赖数据库搜索的蛋白质生物标志物鉴定方法 | |
JP2007523323A (ja) | スペクトルにおけるシグナルをクラスタにする方法 | |
Villanueva et al. | Data analysis of assorted serum peptidome profiles | |
JP2006120143A (ja) | 異種の生物学的データをオントロジー的に統合させる方法及びシステム | |
Codrea et al. | Tools for computational processing of LC–MS datasets: a user's perspective | |
Shankar et al. | MassExplorer: a computational tool for analyzing desorption electrospray ionization mass spectrometry data | |
Wang et al. | Best-first search guided multistage mass spectrometry-based glycan identification | |
Randolph et al. | Mass spectrometry-based single-cell lipidomics: Advancements, challenges, and the path forward | |
Veit | Efficient workflows for analyzing high-performance liquid chromatography mass spectrometry-based proteomics data | |
Cowen | Untangling the Complexities of Single Cell Protein Analysis | |
Codrea et al. | Robust peak detection and alignment of nanoLC-FT mass spectrometry data | |
Talele et al. | TECHNOLOGIES ASSOCIATED WITH PROTEOMICS | |
Bokor et al. | Network-centric analysis of co-fractionated protein complex profiles using SECAT |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070109 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100308 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100319 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100811 |