JP2010048825A

JP2010048825A - 迅速かつ定量的なプロテオーム解析および関連した方法

Info

Publication number: JP2010048825A
Application number: JP2009272972A
Authority: JP
Inventors: David R Goodlett; アール．グッドレットデイビッド; Rudolf H Aebersold; エイチ．エーバーソルドルドルフ
Original assignee: INST FOR SYSTEMS BIOLOGY; INST SYSTEMS BIOLOGY; University of Washington
Current assignee: INST FOR SYSTEMS BIOLOGY; INST SYSTEMS BIOLOGY; University of Washington
Priority date: 2000-12-26
Filing date: 2009-11-30
Publication date: 2010-03-04
Also published as: DE60142650D1; CA2433281A1; EP1739424A1; EP1356281B1; EP1710577B1; EP1739424B1; EP1356281A4; EP1710577A1; CA2433281C; EP1356281A1; DE60119580D1; WO2002052259A1; DE60119580T2; JP4672614B2; JP4672615B2; JP2004528533A; JP4048115B2; JP2006317468A; ATE521890T1; ATE475092T1

Abstract

【課題】プロテオーム解析のための迅速で、効率的でかつ費用効率的な方法の提供。
【解決手段】ポリペプチドを同定する方法であって、以下：（ａ）ポリペプチドの集団由来の親ポリペプチドのサブセットの質量と該親ポリペプチドのサブセットのフラグメントの質量を同時に決定する工程；（ｂ）注釈されたポリペプチドインデックスと該決定された質量を比較する工程；および（ｃ）該決定された質量を有する該注釈されたポリペプチドインデックスの１つ以上のポリペプチドを同定する工程、を包含する方法など。
【選択図】なし

Description

本発明は、国立衛生研究所での国立癌研究所によって授与された助成金番号Ｒ３３ＣＡ８４６９８−０１のもとで、政府支援によってなされた。米国政府は、本発明において特定の権利を有する。

（発明の背景）
本発明は、一般に、プロテオーム解析、ならびにより詳細には、タンパクの質混合物中に含まれるタンパク質を同定および／または定量する方法に関する。

生物学的プロセスを研究するための古典的な生化学的アプローチは、プロセスを構成する特定の活性の経時的分画およびアッセイサイクルによる均質性までの精製、各単離された成分の詳細な構造分析、機能分析および調節分析、ならびに単離された成分からのプロセスの再構成に基づいている。ヒトゲノムプロジェクトおよび他のゲノム配列決定プログラムは、特定の種の完全なゲノム配列、従って、基本的には、これらの種によって潜在的にコードされる全てのタンパク質のアミノ酸配列を次々に明らかにしている。生物学の歴史の中で前例のないこの情報源は、従来の研究法を増強し、そして、基本的に異なる研究概念における発展を触媒することが予想され、この情報源の１つがプロテオミクスである。

多くの他の種のゲノムとともに、ヒトゲノム全体を配列決定する努力は、特別に成功している。多数の微生物種のゲノム（ＴＩＧＲ微生物データベース；ｗｗｗ．ｔｉｇｒ．ｏｒｇ）は完全になり、そして、１２０を超える他の微生物種のゲノムが、配列決定の過程にある。さらに、真核生物のより複雑なゲノム、特に、遺伝子的によく特徴付けられている単細胞生物のＳａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ、ならびに多細胞種のＣａｅｎｏｒｈａｂｄｉｔｉｓｅｌｅｇａｎｓおよびＤｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒのゲノムは、完全に配列決定されている。さらに、イネゲノムの「ドラフト配列」が公表されており、そして、ヒトゲノムおよびＡｒａｂｉｄｏｐｓｉｓゲノムの完了は目前に迫っている。完全なゲノム配列がないにしても、豊富なＤＮＡ配列データベースは、公然に利用可能であり、このデータベースは、２１０万を超えるヒト発現配列タグ（ＥＳＴ）および１２０万を超えるマウス発現配列タグ（ＥＳＴ）を含む。

ＥＳＴは、ｃＤＮＡライブラリー中のクローンの系統的な単一通過（ｓｉｎｇｌｅｐａｓｓ）の配列決定により生成されている部分的遺伝子配列を表す、約３００〜約５００の連続ヌクレオチド配列の伸長である。大半の生物学的プロセスの時間尺度において、顕著な進化の例外を除いては、ゲノムＤＮＡ配列は、静的なものと見なされ得、ゆえに、ゲノム配列データベースは、ライブラリーに類似の情報供給源を表す。配列データベース中の個々の配列に「機能」を割り当てるために、集中的な努力が進行中である。これは、既知の機能を有する配列のファミリーに対して、ある配列の統計学的に有意な類似性を示す、直鎖状配列モチーフまたは高次構造モチーフのコンピューター分析、または他の方法（例えば、種にわたる相同タンパク質機能の比較）によって試行される。他の方法をまた使用して、個々の配列の機能を決定し、これら方法は、アンチセンスヌクレオチド技術を使用する遺伝子ノックアウトおよび遺伝子発現の抑制のような実験的方法を含み、これらの方法は時間がかかり、ある場合においては、配列によりコードされるポリペプチドへの生物学的機能の割当を可能とするのになお十分ではない。

プロテオームは、ゲノムにより発現されるタンパク質補体として定義されている。このいくらか制限的な定義は、プロテオームの静的な性質を示唆する。実際には、プロテオームは、発現されたタンパク質の型、それらの存在比、改変の状態および亜細胞の位置が、細胞または組織の生理学的状態に依存するので、非常に動的である。ゆえに、プロテオームは、細胞状態または細胞が遭遇する外部的条件を反映し得、そして、プロテオーム解析は、細胞状態を区別および研究するため、そして、これらを制御する分子機構を決定するためのゲノム全体にわたるアッセイとして見なされ得る。分化した細胞のプロテオームが、少なくとも５桁の大きさの発現の推定動的範囲で、数千〜数万のタンパク質の異なる型からなると推定されることを考えると、プロテオーム解析の見通しは険しいようである。しかし、実際に発現されるタンパク質を同定し得る技術における急速な発展と組合せると、潜在的に発現されるあらゆるタンパク質の配列を列挙するＤＮＡデータベースの利用性は、プロテオミクスを実際的な提案にする。質量分析器は、現在のプロテオミクス技術が基づく不可欠な段階の１つである。

定量的プロテオミクスは、細胞または組織によって発現された全てのタンパク質の定量および同定に関して、これらの系統的分析である。所定の時間での細胞、組織、生物学的液体またはタンパク質複合体で発現されたタンパク質は、その時点での細胞、組織の状態を正確に定義する。異なる状態における同一細胞型のタンパク質プロフィール間の定量的および定性的差異を使用して、各状態間での移行を理解し得る。従来は、プロテオーム解析は、タンパク質を分離するための高分離能のあるゲル電気泳動（特に、２次元ゲル電気泳動）と、タンパク質を同定するための質量分析器との組合せを使用して、実施された。このアプローチは、経時的かつ単調であるが、より重要には、タンパク質の生物学的に重要なクラスが基本的に検出不可能という点で、基本的に制限される。

従って、迅速で、効率的でかつ費用効率的な方法がプロテオーム解析に必要である。本発明は、この必要性を満足させ、そして、同様に関連した利点を提供する。

本発明によって以下が提供される：
（項目１）ポリペプチドを同定する方法であって、以下：
（ａ）ポリペプチドの集団由来の親ポリペプチドのサブセットの質量と該親ポリペプチドのサブセットのフラグメントの質量を同時に決定する工程；
（ｂ）注釈されたポリペプチドインデックスと該決定された質量を比較する工程；および（ｃ）該決定された質量を有する該注釈されたポリペプチドインデックスの１つ以上のポリペプチドを同定する工程、
を包含する方法。
（項目２）項目１に記載の方法であって、以下：
（ｄ）１つ以上の前記親ポリペプチドと関連する１つ以上のさらなる特徴を決定する工程；
（ｅ）工程（ａ）および工程（ｄ）において決定された特徴と前記注釈されたポリペプチドインデックスとを比較する工程；ならびに
（ｆ）必要に応じて工程（ｄ）および（ｅ）を１度以上繰り返す工程であって、ここで親ポリペプチドを、該注釈されたポリペプチドインデックスにおいて単一のポリペプチドとして同定する１セットの特徴が決定される、工程、
をさらに包含する方法。
（項目３）前記ポリペプチドを含むサンプル中で、前記同定されたポリペプチドの量を定量化する工程をさらに包含する、項目１に記載の方法。
（項目４）２つ以上の親ポリペプチドを、前記注釈されたポリペプチドインデックスにおいて単一のポリペプチドとして同定する１セットの特徴が決定される、項目２に記載の方法。
（項目５）前記親ポリペプチドの各々を、前記親ポリペプチドのサブセットにおいて同定する１セットの特徴が決定される、項目４に記載の方法。
（項目６）前記フラグメント質量が、フラグメントイオンを生成するためのイオン選択を行わない質量分析によって決定される、項目１に記載の方法。
（項目７）前記フラグメント質量が、１ｐｐｍより大きいｐｐｍ精度で決定される、項目１に記載の方法。
（項目８）前記フラグメント質量が、２．５ｐｐｍ以上のｐｐｍ精度で決定される、項目１に記載の方法。
（項目９）前記フラグメント質量が、５ｐｐｍ以上のｐｐｍ精度で決定される、項目１に記載の方法。
（項目１０）前記フラグメント質量が、１０ｐｐｍ以上のｐｐｍ精度で決定される、項目１に記載の方法。
（項目１１）前記フラグメント質量が、１００ｐｐｍ以上のｐｐｍ精度で決定される、項目１に記載の方法。
（項目１２）項目１３に記載の方法であって、前記特徴が、ポリペプチド質量、アミノ酸組成、ｐＩ、およびクロマトグラフィー媒体における溶出の順からなる群から選択される、方法。
（項目１３）ポリペプチドを同定する方法であって、以下：
（ａ）ポリペプチドの集団由来の親ポリペプチドのサブセットの質量と該親ポリペプチドのサブセットのフラグメントの質量を同時に決定する工程；
（ｂ）注釈されたポリペプチドインデックスと該決定された質量を比較する工程；
（ｃ）該決定された質量を有する該注釈されたポリペプチドインデックスの１つ以上のポリペプチドを同定する工程、
（ｄ）該ポリペプチドを含むサンプル中で該同定されたポリペプチドの量を定量化する工程、
を包含する、方法。
（項目１４）項目１３に記載の方法であって、以下：
（ｅ）１つ以上の前記親ペプチドと関連する１つ以上のさらなる特徴を決定する工程；
（ｆ）工程（ａ）および工程（ｅ）において決定された特徴と前記注釈されたポリペプチドインデックスとを比較する工程；および
（ｇ）必要に応じて、工程（ｅ）および（ｆ）を１度以上繰り返す工程であって、ここで、該注釈されたポリペプチドインデックスにおいて、単一のポリペプチドとして親ポリペプチドを同定する１セットの特徴が決定される、工程、
をさらに包含する方法。
（項目１５）２つ以上の親ポリペプチドを、前記注釈されたポリペプチドインデックスにおいて単一のポリペプチドとして同定する１セットの特徴が決定される、項目１４に記載の方法。
（項目１６）前記親ポリペプチドの各々を、前記親ポリペプチドのサブセットにおいて同定する１セットの特徴が決定される、項目１５に記載の方法。
（項目１７）前記フラグメント質量が、フラグメントイオンを生成するためのイオン選択を行わない質量分析によって決定される、項目１３に記載の方法。
（項目１８）前記フラグメント質量が、１ｐｐｍよりも大きいｐｐｍ精度で決定される、項目１３に記載の方法。
（項目１９）前記フラグメント質量が、２．５ｐｐｍ以上のｐｐｍ精度で決定される、項目１３に記載の方法。
（項目２０）前記フラグメント質量が、５ｐｐｍ以上のｐｐｍ精度で決定される、項目１３に記載の方法。
（項目２１）前記フラグメント質量が、１０ｐｐｍ以上のｐｐｍ精度で決定される、項目１３に記載の方法。
（項目２２）前記フラグメント質量が、１００ｐｐｍ以上のｐｐｍ精度で決定される、項目１３に記載の方法。
（項目２３）項目１３に記載の方法であって、前記特徴が、ポリペプチド質量、アミノ酸組成、ｐＩ、およびクロマトグラフィー媒体における溶出の順からなる群から選択される、方法。
（項目２４）ポリペプチドを同定する方法であって、以下：
（ａ）該ポリペプチド、またはそのフラグメントと関連する２つ以上の特徴を決定する工程であって、該特徴の１つは、該ポリペプチドのフラグメントの質量であり、該フラグメント質量は、フラグメントイオンを産生するためのイオン選択を行わない質量分析によって決定される、工程；
（ｂ）該ポリペプチドと関連する該特徴を、ポリペプチド識別インデックスと比較する工程；および
（ｃ）該特徴を有する該ポリペプチド識別インデックスにおいて１つ以上のポリペプチドを同定する工程、
を包含する方法。
（項目２５）項目２４に記載の方法であって、以下：
（ｄ）前記ポリペプチドと関連する１つ以上のさらなる特徴を決定する工程；および
（ｅ）工程（ａ）および工程（ｄ）において決定される前記特徴と前記ポリペプチド識別インデックスを比較する工程、
をさらに包含する方法。
（項目２６）前記ポリペプチドを含むサンプルにおいて、前記同定されたポリペプチドの量を定量化する工程をさらに包含する、項目２４に記載の方法。
（項目２７）前記ポリペプチド識別インデックスが、注釈されたペプチドインデックスである、項目２４に記載の方法。
（項目２８）前記フラグメント質量が、１ｐｐｍ以上のｐｐｍ精度で決定される、項目２４に記載の方法。
（項目２９）前記フラグメント質量が、２．５ｐｐｍ以上のｐｐｍ精度で決定される、項目２４に記載の方法。
（項目３０）前記フラグメント質量が、５ｐｐｍ以上のｐｐｍ精度で決定される、項目２４に記載の方法。
（項目３１）前記フラグメント質量が、１０ｐｐｍ以上のｐｐｍ精度で決定される項目２４に記載の、方法。
（項目３２）前記フラグメント質量が、１００ｐｐｍ以上のｐｐｍ精度で決定される、項目２４に記載の方法。
（項目３３）前記ポリペプチドの３つ以上の特徴が決定される、項目２４に記載の方法。
（項目３４）前記ポリペプチドの４つ以上の特徴が決定される、項目２４に記載の方法。
（項目３５）前記ポリペプチドの５つ以上の特徴が決定される、項目２４に記載の方法。
（項目３６）項目２４に記載の方法であって、前記特徴が、ポリペプチド質量、アミノ酸組成、ｐＩ、およびクロマトグラフィー媒体における溶出の順からなる群から選択される、方法。
（項目３７）ポリペプチドを同定する方法であって、以下：
（ａ）該ポリペプチド、またはそのフラグメント、と関連する２つ以上の特徴を決定する工程であって、該特徴の１つは、該ポリペプチドのフラグメントの質量であり、該フラグメント質量は、２．５ｐｐｍより大きいｐｐｍ精度で質量分析によって決定される、工程；
（ｂ）該ポリペプチドと関連する該特徴を、ポリペプチド識別インデックスと比較する工程；および（ｃ）該特徴を有する該ポリペプチド識別インデックスにおいて１つ以上のポリペプチドを同定する工程、
を包含する方法。
（項目３８）項目３７に記載の方法であって、以下：
（ｄ）前記ポリペプチドと関連する１つ以上のさらなる特徴を決定する工程；および
（ｅ）工程（ａ）および工程（ｄ）において決定される前記特徴と前記ポリペプチド識別インデックスを比較する工程、
をさらに包含する方法。
（項目３９）前記ポリペプチドを含むサンプルにおいて、前記同定されたポリペプチドの量を定量化する工程をさらに包含する、項目３７に記載の方法。
（項目４０）前記ポリペプチド識別インデックスが、注釈されたペプチドインデックスである、項目３７に記載の方法。
（項目４１）前記フラグメント質量が、５ｐｐｍ以上のｐｐｍ精度で決定される、項目３７に記載の方法。
（項目４２）前記フラグメント質量が、１０ｐｐｍ以上のｐｐｍ精度で決定される、項目３７に記載の方法。
（項目４３）前記フラグメント質量が、１００ｐｐｍ以上のｐｐｍ精度で決定される、項目３７に記載の方法。
（項目４４）前記ポリペプチドの３つ以上の特徴が決定される、項目３７に記載の方法。
（項目４５）前記ポリペプチドの４つ以上の特徴が決定される、項目３７に記載の方法。
（項目４６）前記ポリペプチドの５つ以上の特徴が決定される、項目３７に記載の方法。
（項目４７）項目３７に記載の方法であって、前記特徴が、ポリペプチド質量、アミノ酸組成、ｐＩ、およびクロマトグラフィー媒体における溶出の順からなる群から選択される、方法。
（項目４８）ポリペプチドを同定する方法であって、以下：
（ａ）該ポリペプチド、またはそのフラグメント、と関連する２つ以上の特徴を決定する工程であって、該特徴の１つは、該ポリペプチドのフラグメントの質量であり、該フラグメント質量は、質量分析によって決定される、工程；
（ｂ）該ポリペプチドと関連する該特徴を、注釈されたポリペプチドインデックスと比較する工程；および
（ｃ）該特徴を有する該注釈されたポリペプチドインデックスにおいて１つ以上のポリペプチドを同定する工程、
を包含する方法。
（項目４９）項目４８に記載の方法であって、以下：
（ｄ）前記ポリペプチドと関連する１つ以上のさらなる特徴を決定する工程；および
（ｅ）工程（ａ）および工程（ｄ）において決定される前記特徴と前記注釈されたポリペプチドインデックスを比較する工程；および
（ｆ）必要に応じて、工程（ｄ）および（ｅ）を１度以上繰り返す工程であって、ここで、該注釈されたポリペプチドインデックスにおいて、単一のポリペプチドを同定する１セットの特徴が決定される、工程、
をさらに包含する方法。
（項目５０）前記ポリペプチドを含むサンプルにおいて、前記同定されたポリペプチドの量を定量化する工程をさらに包含する項目４８に記載の方法。
（項目５１）前記フラグメント質量が、１ｐｐｍ以上のｐｐｍ精度で決定される、項目４８に記載の方法。
（項目５２）前記フラグメント質量が、２．５ｐｐｍ以上のｐｐｍ精度で決定される、項目４８に記載の方法。
（項目５３）前記フラグメント質量が、５ｐｐｍ以上のｐｐｍ精度で決定される、項目４８に記載の方法。
（項目５４）前記フラグメント質量が、１０ｐｐｍ以上のｐｐｍ精度で決定される、項目４８に記載の方法。
（項目５５）前記フラグメント質量が、１００ｐｐｍ以上のｐｐｍ精度で決定される、項目４８に記載の方法。
（項目５６）前記ポリペプチドの３つ以上の特徴が決定される、項目４８に記載の方法。
（項目５７）前記ポリペプチドの４つ以上の特徴が決定される、項目４８に記載の方法。
（項目５８）前記ポリペプチドの５つ以上の特徴が決定される、項目４８に記載の方法。
（項目５９）項目４８に記載の方法であって、前記特徴が、ポリペプチド質量、アミノ酸組成、ｐＩ、およびクロマトグラフィー媒体における溶出の順からなる群から選択される、方法。
（項目６０）ポリペプチドを同定する方法であって、以下：
（ａ）該ポリペプチド、またはそのフラグメントと関連する２つ以上の特徴を決定する工程であって、該特徴の１つは、該ポリペプチドのフラグメントの質量であり、該フラグメント質量は、質量分析によって決定される、工程；
（ｂ）該ポリペプチドと関連する特徴を、注釈されたポリペプチドインデックスと比較する工程；
（ｃ）該特徴を有する該注釈されたポリペプチドインデックスにおいて１つ以上のポリペプチドを同定する工程；および
（ｄ）該ポリペプチドを含むサンプル中で、前記同定されたポリペプチドの量を定量化する工程、
を包含する、方法。
（項目６１）項目６０に記載の方法であって、以下：
（ｅ）前記ポリペプチドと関連する１つ以上のさらなる特徴を決定する工程；および
（ｆ）工程（ａ）および工程（ｅ）において決定された前記特徴と、前記注釈されたポリペプチドインデックスとを比較する工程；および
（ｇ）必要に応じて、工程（ｅ）および（ｆ）を１度以上繰り返す工程であって、ここで、該注釈されたポリペプチドにおいて単一のポリペプチドを同定する１セットの特徴が決定される、工程、
をさらに包含する、方法。
（項目６２）前記フラグメント質量が、１ｐｐｍ以上のｐｐｍ精度で決定される、項目６０に記載の方法。
（項目６３）前記フラグメント質量が、２．５ｐｐｍ以上のｐｐｍ精度で決定される、項目６０に記載の方法。
（項目６４）前記フラグメント質量が、５ｐｐｍ以上のｐｐｍ精度で決定される、項目６０に記載の方法。
（項目６５）前記フラグメント質量が、１０ｐｐｍ以上のｐｐｍ精度で決定される項目６０に記載の、方法。
（項目６６）前記フラグメント質量が、１００ｐｐｍ以上のｐｐｍ精度で決定される、項目６０に記載の方法。
（項目６７）前記ポリペプチドの３つ以上の特徴が決定される、項目６０に記載の方法。
（項目６８）前記ポリペプチドの４つ以上の特徴が決定される、項目６０に記載の方法。
（項目６９）前記ポリペプチドの５つ以上の特徴が決定される、項目６０に記載の方法。
（項目７０）項目６０に記載の方法であって、前記特徴が、ポリペプチド質量、アミノ酸組成、ｐＩ、およびクロマトグラフィー媒体における溶出の順からなる群から選択される、方法。
（項目７１）ポリペプチド識別インデックスを産生するための方法であって、以下：
（ａ）前記ポリペプチド、またはそのフラグメントと関連する２つ以上の特徴のセットを決定する工程であって、該特徴の１つは、該ポリペプチドのフラグメントの質量であり、該フラグメント質量は、質量分析によって決定される、工程；
（ｂ）第２のポリペプチドのために、工程（ａ）を繰り返す工程；
（ｃ）必要に応じて、該第１のポリペプチドおよび第２のポリペプチドと関連する１つ以上のさらなる特徴を決定する工程であって、ここで該決定される特徴は、該第１のポリペプチドと第２のポリペプチドとを区別するのに十分であり、それによって該第１のポリペプチドおよび第２のポリペプチドについてのポリペプチド識別インデックスを生成する、工程、
を包含する、方法。
（項目７２）項目７１に記載の方法であって、異なるポリペプチドに対して、工程（ａ）〜（ｃ）を１度以上繰り返す工程であって、ここで、前記決定された特徴は、該ポリペプチドの各々を区別するのに十分であり、それによって該ポリペプチドの各々に対するポリペプチド識別インデックスを生成する工程をさらに包含する、方法。
（項目７３）前記フラグメント質量が、１ｐｐｍ以上のｐｐｍ精度で決定される、項目７１に記載の方法。
（項目７４）前記フラグメント質量が、２．５ｐｐｍ以上のｐｐｍ精度で決定される、項目７１に記載の方法。
（項目７５）前記フラグメント質量が、５ｐｐｍ以上のｐｐｍ精度で決定される、項目７１に記載の方法。
（項目７６）前記フラグメント質量が、１０ｐｐｍ以上のｐｐｍ精度で決定される、項目７１に記載の方法。
（項目７７）前記フラグメント質量が、１００ｐｐｍ以上のｐｐｍ精度で決定される、項目７１に記載の方法。
（項目７８）項目７１に記載の方法であって、前記特徴が、ポリペプチド質量、アミノ酸組成、ｐＩ、およびクロマトグラフィー媒体における溶出の順からなる群から選択される、方法。
（項目７９）ポリペプチドを同定する方法であって、以下：
（ａ）該ポリペプチド、またはそのフラグメントと関連する１セットの特徴を決定する工程であって、該特徴の１つは、該ポリペプチドのフラグメントの質量であり、該フラグメント質量は、質量分析によって決定される、工程；
（ｂ）項目２４に記載の方法により生成されるポリペプチド識別インデックスと該決定された特徴とを比較する工程；および
（ｃ）該特徴を有する該ポリペプチド識別インデックスの１つ以上のポリペプチドを同定する工程、
を包含する、方法。
（項目８０）項目７９に記載の方法であって、以下：
（ｄ）前記ポリペプチドと関連する１つ以上のさらなる特徴を決定する工程；
（ｅ）工程（ａ）および工程（ｄ）において決定される前記特徴と前記ポリペプチド識別インデックスを比較する工程；および
（ｆ）必要に応じて、工程（ｄ）および（ｅ）を１度以上繰り返す工程であって、ここで、該注釈されたポリペプチド識別インデックスにおいて、単一のポリペプチドとして親ポリペプチドを同定する１セットの特徴が決定される、工程、
をさらに包含する方法。
（項目８１）前記ポリペプチドを含むサンプルにおいて、前記同定されたポリペプチドの量を定量化する工程をさらに包含する、項目７９に記載の方法。
（項目８２）前記フラグメント質量が、１ｐｐｍ以上のｐｐｍ精度で決定される、項目７９に記載の方法。
（項目８３）前記フラグメント質量が、２．５ｐｐｍ以上のｐｐｍ精度で決定される、項目７９に記載の方法。
（項目８４）前記フラグメント質量が、５ｐｐｍ以上のｐｐｍ精度で決定される、項目７９に記載の方法。
（項目８５）前記フラグメント質量が、１０ｐｐｍ以上のｐｐｍ精度で決定される、項目７９に記載の方法。
（項目８６）前記フラグメント質量が、１００ｐｐｍ以上のｐｐｍ精度で決定される、項目７９に記載の方法。
（項目８７）前記ポリペプチドの３つ以上の特徴が決定される、項目７９に記載の方法。
（項目８８）前記ポリペプチドの４つ以上の特徴が決定される、項目７９に記載の方法。
（項目８９）前記ポリペプチドの５つ以上の特徴が決定される、項目７９に記載の方法。
（項目９０）項目７９に記載の方法であって、前記特徴が、ポリペプチド質量、アミノ酸組成、ｐＩ、およびクロマトグラフィー媒体における溶出の順からなる群から選択される、方法。
（発明の要旨）
本発明は、ポリペプチドを同定する方法を提供する。本方法は、ポリペプチド集団からの親ポリペプチドのサブセットの質量と、親ポリペプチドのサブセットのフラグメントの質量を同時に決定する工程；決定された質量と注釈されたポリペプチドインデックスを比較する工程；および決定された質量を有する注釈されたポリペプチドインデックスの１つ以上のポリペプチドを同定する工程を含み得る。本発明はまた、ポリペプチドもしくはそのフラグメントに関連する２つ以上の特徴を決定する工程に（この特徴の１つはポリペプチドのフラグメントの質量であり、このフラグメント質量は、質量分析器によって決定される）；ポリペプチドに関連する特徴と注釈されたポリペプチドインデックスを比較する方法；および、この特徴を有する注釈されたポリペプチドインデックス中の１つ以上のポリペプチドを同定することよってポリペプチドを同定する方法を提供する。本方法はさらに、このポリペプチドを含むサンプル中の同定されたポリペプチドの量を定量する工程を包含する。

図１は、質量分析器（ＭＳ）測定、およびタンデム質量分析器（ＭＳ／ＭＳ）測定に基づくタンパク質同定ストラテジーの概略図を示す。図２は、親イオンの同定に特徴的なペプチドイオンから選択されたフラグメントイオンを生成するための２つの異なる方法を示す。図２Ａは、親イオンの選択を示し（Ｑ１において）、この親イオンは、衝突セル中でフラグメント化される（Ｑ２）。このフラグメントの質量スペクトルが決定される（Ｑ３において）。図２Ｂは、単一の親イオンの選択に代わって、多数の親イオン（「供給源領域」中に示される）は、イオン化後領域または衝突セルにおいて、同時にフラグメント化されることを示す。次いで、このフラグメントイオンは、Ｑ１または他の質量分析器中で分析され、その結果、多数の親イオンからのフラグメントイオンからなる質量スペクトルを生じる。図３は、注釈されたペプチドタグのポリペプチド識別インデックスを使用して、２つのポリペプチド集団を比較し、そして定量するための方法の工程を示す。図４Ａおよび図４Ｂは、質量分析器（ＭＳ）を使用したポリペプチドの同定を示す。図４Ａおよび図４Ｂは、ＥＳＩ−ＴＯＦを使用して得た２つのポリペプチドの質量スペクトル（Ｐ１、ＡＳＨＬＧＬＡＲ（配列番号１）；およびＰ２、ＲＰＲＧＦＳＰＲ（配列番号２））を示す。スペクトルは、低Ｖ_{ノズル−スキマー}（１０Ｖ）（図４Ａ）および高Ｖ_{ノズル−スキマー}（２４０Ｖ）（図４Ｂ）で取得される。図４Ｃは、質量分析器（ＭＳ）を使用したポリペプチドの同定を示す。図４Ｃは、Ｐ１（各々、配列番号３〜１２、２、１３および１４）およびＰ２（配列番号１５〜２４、１および２５）についての、各々、１２の可能なポリペプチド同定物および１３の可能なポリペプチド同定物を示す。図５は、Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ抽出物のクロマトグラフィー分析を示す。矢印で示されたペプチドは、非断片的ＭＳ分析および断片的ＭＳ分析によって解析された。図６は、図５中の矢印によって示されたペプチドの非断片的ＭＳ分析を示す（ＹＲＰＮＣＰＩＩＬＶＴＲ；配列番号２６）。図７は、図５中の矢印によって示されたペプチドの断片的ＭＳ分析を示す（ＹＲＰＮＣＰＩＩＬＶＴＲ；配列番号２６）。図８は、クロマトグラフィー分析を示す。図８Ａは、基準ピーククロマトグラムを示す。図８は、クロマトグラフィー分析を示す。図８Ｂは、４９６．２６ｍ／ｚ［Ｍ_１＋３Ｈ］での選択されたイオンクロマトグラムを示す。図８は、クロマトグラフィー分析を示す。図８Ｃは、５８６．３０ｍ／ｚ［Ｍ_２＋３Ｈ］での選択されたイオンクロマトグラムを示す。図９は、非断片化ＭＳ分析を示す。図１０は、断片化ＭＳを示す。

（発明の詳細な説明）
本発明は、ポリペプチドもしくはそのペプチドフラグメントに関連する特徴を決定すること、決定された特徴とポリペプチド識別インデックス（ｉｄｅｎｔｉｆｉｃａｔｉｏｎｉｎｄｅｘ）とを比較すること、そして同一の特徴を有するポリペプチド識別インデックス中の１つ以上のポリペプチドを同定することによりポリペプチド集団からポリペプチドを同定する方法を提供する。本発明の方法は、プロテオーム解析に適用可能であり、そして、複雑なサンプル中の１つ以上のポリヌクレオチドの迅速かつ効率的な同定を可能にする。本方法は、ポリペプチド識別インデックスを生成する工程に基づき、このインデックスは、ポリペプチドに関連する特徴のデータベースである。このポリペプチド識別インデックスは、ポリペプチドの同定のために、サンプルからのこのポリペプチドに関連すると決定された特徴を比較するために使用され得る。さらに、本方法は、ポリペプチドを同定するためだけでなく、サンプル中の特定のタンパク質の量を定量するために適用され得る。

ポリペプチドを同定するための本発明の方法は、サンプルポリペプチドの同定および定量の両方を含む、定量的プロテオーム解析、またはポリペプチド集団間の比較の実施に適用可能である。このような定量分析は、所望される場合、都合のよいことには、２つの別々のステージで実施され得る。第１の工程としては、試験されるサンプルに代表的な参照ポリペプチドインデックスが、例えば、本明細書中に記載されるように、研究中の種、細胞型または組織型から生成され得る。第２の工程は、未知のポリペプチドに関連する特徴と、参照ポリペプチドインデックス、または以前に生成されたインデックスとを比較することである。参照ポリペプチドインデックスは、特定のサンプル（例えば、細胞、亜細胞（ｓｕｂｃｅｌｌｕｌａｒ）画分、組織、器官または生物）のポリペプチドを表す、ポリペプチド同定コードのデータベースである。サンプル中のかなり多数のポリペプチドの代表であるポリペプチド識別インデックスが、生成され得、これは本質的に、サンプル中で潜在的に発現される全てのポリペプチドを含む。従って、本発明の方法は、サンプルの特定の生理学的状態（例えば、疾患状態）に関連するか、またはそれを定義するサンプル中のポリペプチドの決定を、有利に可能にする。さらに、いったんポリペプチド識別インデックスが生成されると、このインデックスを繰り返し使用して、サンプル（例えば、潜在的に疾患を有する個体由来のサンプル）中の１つ以上のポリペプチドを同定し得る。

サンプル中のポリペプチドの定量のために、ポリペプチドは、同位体標識（例えば、^１２Ｃに対して^１３Ｃ、水素に対して重水素、または^１６Ｏに対して^１８Ｏ）される、化学的に同一の分子と比較される。かなり多数の差次的な同位体は、本明細書中に開示されるように、ＭＳによって区別される質量に十分な差異がある限り、組み込まれ得る。分子は、同位体的な差異以外は化学的に同一なので、これらの分子は、物理化学的には同じ挙動である。さらに、所望される場合、２つより多いサンプルは、十分な数の同位体標識（例えば、ｄ０、ｄ４、ｄ８、ｄ１２）が利用可能である場合に比較され、その結果、複数のサンプルが比較され得、そして、ＭＳによって区別され得る。定量は、安定な同位体希釈に基づく。サンプルを定量するための１つの方法は、化学的に同一であるが同位体的に異なる内部標準を有するサンプルをスパイクすることである。検量線は、サンプル中の分子の量を推定するために、同位体の希釈を用いて生成され得る。このような場合、スパイクされた分子は同一でなければならなく、ゆえに、サンプル中の分子は、既知でなければならない。

サンプル中のポリペプチドを定量するための別の簡便な方法は、ＩＣＡＴ^ＴＭのような試薬を使用することである（Ｇｙｇｉら、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌ．１７：９９４〜９９９（１９９９）；ＷＯ００／１１２０８）。ＩＣＡＴ^ＴＭ型試薬（以下により詳細に記載する）は、アフィニティータグ、１つ以上の安定な同位体が組み込まれ得るリンカー部分、および、ポリペプチド中のアミノ側鎖（例えば、システイン）に共有結合し得る反応基を含む。ＩＣＡＴ^ＴＭ型試薬を使用する定量のために、類似のサンプルは、ＩＣＡＴ^ＴＭ型試薬の異なる同位体バージョンで処理される。サンプルは標識され得、そして、例えば、定量のための参照サンプルまたはコントロールサンプルを正規化するために、類似の標識化サンプルと比較され得る。サンプル中のポリペプチドを同定および定量するためのＩＣＡＴ^ＴＭ型試薬の使用は、図３中に図示される。ＩＣＡＴ^ＴＭ型試薬の異なる同位体バージョンで標識されたペプチドは、物理化学的に同一の挙動をするので、２つのサンプル中の同一のポリペプチドは、同時に精製するが、ＩＣＡＴ^ＴＭ型標識中の同位体差異に起因して、ＭＳでなお区別可能である。従って、同一ポリペプチドの相対量は、容易に比較され得、そして定量され得る（Ｇｙｇｉら、前述、１９９９）。全ての他の走査は、フラグメント化、次いで、溶出ペプチドについての配列情報（ＭＳ／ＭＳスペクトル）の記録に充てられる。このペプチドの由来である親ポリペプチドは、記録されたＭＳ／ＭＳスペクトルを用いて配列データベースを検索することによって、同定され得る。従って、この手順は、単一の解析で、タンパク質混合物の成分の相対量および同定を提供する。このような比較は、例えば、疾患を有するかまたは疾患を有すると疑われる個体由来のサンプル中の発現レベルと、健康な個体由来のサンプル中の発現レベルを比較することによる、参照サンプルに関連するポリペプチドの発現レベルの定量に、または法医学的目的に有用であり得る。

ポリペプチドの定量に有用であることに加えて、ＩＣＡＴ^ＴＭ型試薬はまた、この系の複雑性に対する制約として機能し、すなわち、ＩＣＡＴ^ＴＭ型試薬に反応性であるアミノ酸を含むポリペプチドまたはこのフラグメントのみが、このポリペプチドがアフィニティー単離されるか、または異なる同位体標識されたサンプルと一緒に比較される場合、標識され、そして特徴付けられる（Ｇｙｇｉら、前述、１９９９）。従って、ＩＣＡＴ^ＴＭ型試薬の使用は、このサンプルの複雑性の軽減を提供し得る。さらに、ＩＣＡＴ^ＴＭ型試薬で標識されるポリペプチドまたはこのフラグメントの能力（すなわち、このペプチドが反応性アミノ酸を含むかどうか）は、さらなる特徴と組合せて、このポリペプチドを同定するのに有用なポリペプチドに関連する特徴である。

ＩＣＡＴ^ＴＭ型試薬の使用のさらなる利点は、サンプル中のポリペプチドの正体が、分析前に既知でなくてもよいことである。上記したように、同位体希釈（ここで、内部標準がサンプルにスパイクされる）は、差次的な同位体標識される化学的に同一の分子がサンプル中にスパイクされることを必要とし、ゆえに、定量されるポリペプチドまたはこのフラグメントが既知であることを必要とし、その結果、化学的に同一の同位体標識された分子が添加される。ＩＣＡＴ^ＴＭ型試薬を用いると、正確なポリペプチドまたはフラグメントの前もった知識は必要ない。さらに、サンプル中の様々なポリペプチドを特徴付けるために、様々な同位体標識された分子を合成する必要はない。

親和性標識を組み込む標識試薬（例えば、ＩＣＡＴ^ＴＭ型試薬）を使用することに加えて、他の標識試薬が、ポリペプチドを含む２つの異なるサンプルを差次的に同位体標識するために使用され得る。例えば、異なる同位体を含む化学的に同一である２つの試薬が、２つのポリペプチドサンプルを共有結合により改変するために使用され得、ここで、これらの試薬は、親和性タグを含まない。従って、ＩＣＡＴ^ＴＭ型タグに関連する親和性単離工程を使用する代わりに、所望される場合は、他の単離工程が使用され得る。それにも関わらず、その差次的に同位体標識されたポリペプチドサンプルは、定量的分析のために比較され得る。例えば、ｄ３を含む（３つの重水素を含む）メタノールでのエステル化を介するポリペプチドのメチル化に対するｄ０を含む（重水素を含まない）メタノールでのエステル化を介するポリペプチドのメチル化が、２つのポリペプチドサンプルを差次的に同位体標識するために使用され得る。同様に、ポリペプチド中の側鎖アミノ酸を改変するための周知の方法のいずれかが、差次的に標識される同位体（例えば、水素について重水素、Ｃ^１２についてＣ^１３、Ｏ^１６についてＯ^１８）（例えば、Ｇｌａｚｅｒら、ＬａｂｏｒａｔｏｒｙＴｅｃｈｎｉｑｕｅｓｉｎＢｉｏｃｈｅｍｉｓｔｒｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ：ＣｈｅｍｉｃａｌＭｏｄｉｆｉｃａｔｉｏｎｏｆＰｒｏｔｅｉｎｓ，Ｃｈａｐｔｅｒ３，ｐｐ．６８−１２０，ＥｌｓｅｖｉｅｒＢｉｏｍｅｄｉｃａｌＰｒｅｓｓ，ＮｅｗＹｏｒｋ（１９７５）；ＰｉｅｒｃｅＣａｔａｌｏｇ（１９９４），Ｐｉｅｒｃｅ，Ｒｏｃｋｆｏｒｄ，ＩＬを参照のこと）とともに、同様に使用され得る。並行標識されるポリペプチドが、ＭＳにより検出されるに十分な質量の差異を含む限り、多数のこの差次的な同位体が、組み込まれ得る。上記のようなポリペプチドの化学的改変に加えて、２つのポリペプチドサンプルが、Ｏ^１８標識Ｈ_２Ｏに対するＯ^１６標識Ｈ_２Ｏの存在下で、プロテアーゼ（例えば、トリプシンなど）で消化され得る。このプロテアーゼ消化反応は、切断されたペプチドに水を付加するので、同位体により差次的に標識されたＨ_２Ｏの存在下での切断が、差次的な標識を別個のポリペプチドサンプル中に組み込むために使用され得る。比較されるサンプルが、生じる標識されたポリペプチドが、差次的な同位体標識によってのみ本質的に異なるように、化学的に類似した様式で処理される限り、２つのポリペプチドサンプルを差次的に標識するために同位体標識を組み込むために有用な任意の方法が、本発明の方法において、特に定量的方法のために使用され得ることが、理解される。

サンプルを定量するためのなお別の方法は、同位体の存在下でサンプルをインキュベートすることまたは天然に存在する同位体の除去を生じる培地中でインキュベートすること（例えば、Ｏｄａら、Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９６：６５９１−６５９６（１９９９）を参照のこと）によって、比較のために２つのサンプル中に同位体を代謝組み込み可能にする条件下でサンプルをインキュベートすることである。このような方法は、従来のように培養されたサンプル（例えば、微生物サンプル、または個体から得られた細胞の初代培養物）に特に有用である。従って、インビトロ方法およびインビボ方法の両方が、比較および／または定量のために、２つのサンプルを差次的に同位体標識するために使用され得る。

本発明の方法は、ポリペプチドの特徴の決定に基づき、この決定は、所定の物理化学的特徴に基づいてそのポリペプチドの同定を可能にする。ポリペプチドを同定するように機能し得る物理化学的特徴の集合は、本質的には、そのポリペプチドについての「バーコード」であり、すなわち、ポリペプチド識別インデックスとして機能する参照データベースとその特徴を相関付けることに基づいてポリペプチドを独自に同定するに十分な、特徴の集合である。これらの方法は、多くの異なるポリペプチドを含む複合サンプルの迅速かつ効率的な分析のために特に有利である。このような複合サンプルは、他の方法を使用すると、時間がかかり、かつ非効率的である。従って、本発明の方法は、多数の異なるポリペプチドを含む複合サンプルを分析するために適用され得、そしてプロテオミクス適用において特に有用である。従って、本発明の方法は、そのプロテオームのポリペプチドを同定するために有利に使用され得る。このプロテオームは、細胞の代謝状態と関連付けられる、ポリペプチド発現および翻訳後修飾を反映するので、この方法はまた、正常なポリペプチド発現または疾患と関連する異常なポリペプチド発現を決定するため、診断適用において使用され得る。従って、本発明の方法は、疾患または状態を診断するために、臨床適用において使用され得る。

本発明の方法は、異なるポリペプチドの複合混合物からの１つのポリペプチドの同定を可能にする、拘束（ｃｏｎｓｔｒａｉｎｉｎｇ）パラメーターを有利に使用する。この拘束は、ポリペプチドの同定を単純にするために使用され得る。拘束は、例えば、ポリペプチドと関連する１つ以上のさらなる特徴を含むこと、複合混合物からのポリペプチドサブセットの同定、またはポリペプチドの複合混合物の分析を単純にするために使用され得る任意の型の拘束であり得る。従って、本発明の方法は、複合混合物（多数のポリペプチドを含む）中のポリペプチドのより効率的同定を提供し、この方法は、プロテオーム分析に特に有用である。

ポリペプチド識別インデックスの作製および使用は、いくつかの利点を提供する。第１に、この方法は、特定の構造特徴を含むポリペプチドフラグメントの選択的単離を伴って使用され得、このことは、特定の化学試薬でのタグ化により利用され得る。「タグ化」フラグメントの親和性選択は、そのポリペプチド混合物を単純にし、その混合物を、タンパク質の単離および取扱いに使用され得る高度な変性条件／可溶化条件と適合性にする。フラグメントの選択的単離はまた、データベース検索を拘束する。例えば、本明細書中に開示される選択的システインタグ化は、そのペプチド混合物の複雑性を、約１０分の１に減少する。

本発明の方法の第２の利点は、これらの方法が、種々の実験室状況において容易に使用され得ることである。例えば、質量測定は、絶対的であり、そしてクロマトグラフパラメーターは、容易に標準化され得る。従って、本発明の方法により決定されるポリペプチド識別インデックスは、実験室間で容易に移転可能であり、そして異なる実験室により作成されたデータが、類似の条件下で作成されたポリペプチド識別インデックスと容易に比較され得る。この方法を、ネットワークを介して（例えば、Ｗｅｂベースの検索ツールの構築を介して）、アクセス可能にすることによって、この利点はさらに利用され得る。第３の利点は、これらの方法が、単一工程質量分析とともに実施され得る。この単一工程質量分析は、迅速で、単純で、かつ感度が良い。第４の利点は、これらの方法が、複合ポリペプチドサンプル中に存在する各ポリペプチドの比を正確に測定するために使用され得、但し、そのサンプルは、安定な同位体標識で改変されていることである。最後に、これらの方法は、本質的に無制限のサンプルキャパシティを有し、これにより、非常に量が少ないポリペプチドを分析する可能性を確実にする。そしてこれらの方法は、高いピークキャパシティを有し、これにより、非常に複雑なサンプルの分析を可能にする。

本明細書中に開示されるように、フラグメント化の前に個々の親イオンを単離することに加えて、複数のイオンが、単一イオン選択を伴うことなく、並行してフラグメント化され得る（図２を参照のこと）。従って、このような方法の重要な利点は、ＭＳ／ＭＳによるタンパク質同定の場合と同様に、各ペプチドについて別個にではなく、複数のポリペプチドについて並行して、パラメーターが容易に決定され得ることである。

本発明の１つの実施形態において、ポリペプチド識別インデックスは、１つのポリペプチドと関連する特徴（特に、親イオン選択を用いてかまたは用いずに作成されたＭＳ／ＭＳによるフラグメントイオン質量測定（図２））を決定すること、そして必要に応じて、クロマトグラフ工程を含めることによって、作成される。これらの質量決定は、高い精度である必要はない。正確な質量は、所望される場合は、計算され得、そして特定のポリペプチドと関連する他の特徴を伴うインデックスへと編集され得る。十分な数の特徴が、このインデックスにおいてポリペプチドの同定を可能にするために決定される。これらの方法は、サンプルの生理学的状態に関するさらなる情報を提供するための定量とともに、必要に応じて有利に使用され得る。しかし、より単純な系の場合、例えば、微生物ゲノムまたはウイルスゲノム、または個体由来のより少ない数のポリペプチドを含む検体（例えば、脊髄液）の場合、サンプル中のポリペプチドの複雑性は、サンプル中のポリペプチドの定量分析が特定の適用のために十分であるに十分なほど、小さくあり得る。このように、サンプル中のポリペプチドの発現の定量決定が、特定の状態（例えば、疾患状態）と相関付けるに十分である場合、本発明の方法が、サンプル中のポリペプチドの定量的同定のために適用され得る。

例示的ポリペプチド識別インデックスまたはデータベースが、実施例ＩＶに記載される。質量分析法ベースのプロテオミクスの成長する領域は、細胞状態の調査からタンパク質を迅速に同定する新規な方法を組み込むことを必要とする。この目的のために、サンプル単純化方法（システイン含有ペプチド精製（Ｇｙｇｉら、Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．１７：９９４−９９９（１９９９））を含む）が、首尾良く使用されている。このことから天然に存在する拘束を使用して、混合物中のペプチド候補の可能な数が、高い質量正確性（約０．１〜１ｐｐｍ）がペプチドおよびその親タンパク質をまとめて同定し得る点（Ｇｏｏｄｌｅｔｔら、ＡｎａｌＣｈｅｍ．７２：１１１２−１１１８（２０００））にまで、減少され得る。システイン拘束を使用することなく、ペプチドおよびそのペプチド由来のほんのわずかなフラグメントイオンの高い質量正確性が、共溶出するペプチドの存在下でさえ、同じ結果を達成し得ることが、示されている（Ｍａｓｓｅｌｏｎら、ＡｎａｌＣｈｅｍ．７３：１９１８−１９２４（２０００））。本明細書中に開示される場合、ＦＴ−ＩＣＲ質量分析計でなくＴＯＦを使用するこれらの概念の組み合わせが、Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅの抽出物について試験された（実施例ＩＶを参照のこと）。これは、データベースの複雑性およびインソース（ｉｎ−ｓｏｕｒｃｅ）ＣＩＤを減少させてフラグメントイオンを生成するための、システイン拘束の組み合わせによって行われた。この方法は、ペプチドが共溶出する場合でさえ、有効であることが示された。このプロセスは、共溶出するペプチドの配列決定を反映するためのショットガン配列決定を可能にする。

例えば、図２に示されるように、本発明の方法は、単一イオン選択の非存在下または供給源領域におけるイオン選択の非存在下で、実施され得る。例えば、Ｑ_１、Ｑ_２、Ｑ_３などと示される領域は、四重極を指す。これらは、ｍ／ｚに基づいて選択されたイオンを分離するための物理的手段である。しかし、選択されたイオンを分離するために適切な任意の適切な方法が、四重極の使用に加えて、本発明の方法において使用され得ることが、理解される。

本明細書中で使用される場合、用語「特徴」とは、ポリペプチドに関して使用される場合は、ポリペプチドの物理化学的特性を指す。物理化学的特性は、親ポリペプチドの物理化学的特性（例えば、分子量、アミノ酸組成、ｐＩなど）、ならびにポリペプチドフラグメント（フラグメントイオンを含む）の物理化学的特性（これは、ポリペプチドと相関付けられ得、従って、親ポリペプチドと関連する特徴であると考えられる）を包含する。ポリペプチドの物理化学的特性はまた、その特定の物理化学的特性から生じるポリペプチドの測定可能な挙動を包含する。例えば、物理化学的特性としては、規定された条件下で特定のクロマトグラフ媒体に対して溶出する順序、および規定された条件下でポリアクリルアミドゲルにおいてポリペプチドが移動する位置が挙げられる。これらの特徴は、経験的に決定され得るか、またはそのポリペプチドに関する既知の情報（例えば、配列情報）に基づいて、推定され得る。

本明細書中で使用される場合、用語「ポリペプチドに関連する特徴」とは、ポリペプチドおよび／またはそのポリペプチドの任意のフラグメントの、物理化学的特性を指す。このように、ポリペプチドに関連する特徴は、親ポリペプチドの特定の特徴、ならびにその親ポリペプチドのフラグメントの特徴を包含する。このフラグメントは、そのポリペプチドに関連し得るので、このフラグメントの特徴は、親ポリペプチドと関連した特徴であると考えられる。このような特徴は、例えば、ポリペプチド識別インデックスとの比較によって、ポリペプチドを同定するために使用され得る。

本明細書中で使用される場合、用語「ポリペプチド」とは、２つ以上のアミノ酸からなる、ペプチドまたはポリペプチドを指す。ポリペプチドはまた、天然に存在する改変（例えば、翻訳後修飾（リン酸化、脂質化、プレニル化、硫酸化、ヒドロキシル化、アセチル化、糖質付加、補欠分子族付加もしくは補因子付加、ジスルフィド結合の形成、タンパク質分解、高分子複合体へのアセンブリなどを含む））によって、改変され得る。

ポリペプチド（特に、リガンドポリペプチド）の改変はまた、天然に存在しない誘導体、化学合成により生成されたそのアナログおよび模倣物も包含し得、但し、そのようなポリペプチド改変は、親ポリペプチドと比較して類似する機能的活性を提示する。例えば、誘導体は、そのポリペプチドの化学的改変（例えば、アルキル化、アシル化、カルバミル化、ヨウ素化、またはそのポリペプチドを誘導体化する任意の改変）を包含し得る。そのような誘導体化分子としては、例えば、遊離アミノ酸が、塩酸アミン、ｐ−トルエンスルホニル基、カルボベンズオキシ基、ｔ−ブチルオキシカルボニル基、クロロアセチル基、またはホルミル基を形成するように誘導体化された、分子が挙げられる。遊離カルボキシル基は、塩、メチルエステルおよびエチルエステル、もしくは他の型のエステル、またはヒドラジドを形成するように、誘導体化され得る。遊離ヒドロキシル基は、Ｏ−アシル誘導体またはＯ−アルキル誘導体を形成するように、誘導体化され得る。ヒスチジンのイミダゾール窒素が、Ｎ−ｉｍ−ベンジルヒスチジンを形成するように誘導体化され得る。標準的な２０個のアミノ酸の１つ以上の天然に存在するアミノ酸誘導体（例えば、４−ヒドロキシプロリン、５−ヒドロキシリジン、３−メチルヒスチジン、ホモセリン、オルニチン、またはカルボキシグルタメート）を含むポリペプチド、およびペプチド結合により連結されていないアミノ酸を含み得るポリペプチドもまた、誘導体またはアナログとして含まれ得る。

特に有用なポリペプチド誘導体としては、スルフヒドリル基の改変（例えば、親和性試薬（例えば、ＩＣＡＴ^ＴＭ型試薬）を結合するためのスルフヒドリル基の改変）が挙げられる。ポリペプチドの特に有用な改変としては、安定な同位体を有する部分を用いる、サンプル中のポリペプチドの改変が挙げられる。例えば、２つの異なるポリペプチドサンプルが、同位体的に異なる部分で別個に標識され得、そのような差次的に標識されたサンプルが、比較され得る。安定な同位体によるポリペプチドの改変は、サンプル中の個々のポリペプチドの相対量を定量するために特に有用である。

本明細書中で使用される場合、「フラグメント」とは、親ポリペプチドの、任意の短縮形態（カルボキシ末端、アミノ末端、またはその両方）を指す。従って、カルボキシ末端またはアミノ末端からの単一アミノ酸の欠失は、親ポリペプチドのフラグメントと考えられる。フラグメントとは、一般的に、Ｎ末端および／またはＣ末端でのアミノ酸の欠失を指すが、側鎖が除去されているがペプチド結合が残っている改変も包含する。フラグメントは、例えば、化学試薬、酵素、またはエネルギー投入を使用するポリペプチド切断によって生成された、短縮型ポリペプチドを包含する。フラグメントは、配列特異的切断事象または配列非依存性切断事象から生じ得る。ポリペプチドを切断するために一般的に使用される試薬の例としては、本明細書中に開示されるような、酵素（例えば、プロテアーゼ（例えば、トロンビン、トリプシン、キモトリプシンなど））、および化学物質（例えば、臭化シアン、酸、塩基、およびｏ−ヨード安息香酸）が、挙げられる。フラグメントはまた、質量分析法により生成され得る。さらに、フラグメントはまた、１つの切断事象から生じる短縮型ポリペプチドが、さらなる切断事象によりさらに短縮され得るように、複数の切断事象から生じ得る。

本明細書中で使用される場合、用語「ポリペプチド識別インデックス」とは、そのインデックスにおいて、他のポリペプチドを同定および識別するに十分な、ポリペプチドに関連する特徴の集合を指す。従って、ポリペプチド識別インデックスは、そのポリペプチドまたはそのフラグメントの特徴に基づいてポリペプチドを同定するための、ポリペプチド識別コードの集合である。ポリペプチド識別インデックスは、ポリペプチドに関連する推定された特徴（例えば、配列情報（例えば、ゲノム配列、ｃＤＮＡ配列、またはＥＳＴデータベース）に基づいて推定された特徴）に基づき得る。ポリペプチド識別インデックスはまた、経験的に決定された特徴、または推定された特徴と経験的に決定された特徴との組み合わせに基づき得る。「注釈されたポリペプチド（ＡＰ）インデックス」とは、そのインデックスにおいて、そのポリペプチドの各々について経験的に決定された少なくとも１つの特徴を含むポリペプチド識別インデックスを指し、これは、例えば、本明細書中に開示される方法によって、決定され得る。所望される場合、ＡＰインデックスは、経験的に決定された特徴、または推定された特徴と経験的に決定された特徴との組み合わせに基づき得る。注釈されたポリペプチドインデックスの使用は、翻訳後修飾により改変されたポリペプチドを同定するために特に有用であり、このようなポリペプチドは、配列データベースのみからの推定に基づいて推定不可能である特徴を有し得る。

「ポリペプチド識別サブインデックス（ｓｕｂｉｎｄｅｘ）」とは、ポリペプチド識別インデックスのポリペプチド識別コードのうちの全部よりは少なくしか含まない、ポリペプチド識別インデックスのサブセットを指す。サブインデックスは、例えば、１０個のポリペプチド識別コードのポリペプチド識別インデックス（これは、インデックス全体のサブセットである）からの５個のポリペプチド識別コードを含み得る。サブインデックスの同定は、例えば、ポリペプチド識別インデックスの検索の複雑性を減少するために有用であり得、このことは、本明細書中に開示される分画方法によりポリペプチドサンプルに適用され得る複雑性の減少と類似する。従って、サブインデックスの検索は、インデックス全体を検索するために必要とされるよりも少ないコンピュータの時間しか必要としないという点で、有利であり得る。

本明細書中で使用される場合、用語「識別コード」は、ポリペプチドの同一性を決定し、そしてポリペプチドをポリペプチド識別インデックス中の他のポリペプチドと区別するのに十分な、ポリペプチドに関する特徴のセットをいう。識別コードは、基本的にポリペプチドを識別するために使用され得る注釈されたペプチドタグ、または「バーコード」である。

本発明は、ポリペプチドを同定するための方法を提供する。この方法は、ポリペプチドまたはそのフラグメントに関する２つ以上の特徴を決定する工程（特徴の１つは、ポチペプチドのフラグメントの質量であり、ここで、フラグメントの質量は、質量分析計によって決定される）；ポリペプチド識別インデックス（例えば、注釈されたポリペプチド指標）とポリペプチドに関する特徴とを比較する工程；および決定された特徴を有するポリペプチド識別インデックス中の１つ以上のポリペプチドを同定する工程、を包含する。このフラグメントは、１ｐｐｍよりも大きいｐｐｍでの精度か、またはより低い精度（より高いｐｐｍ）で決定され得る。この方法は、ポリペプチドに関する１つ以上のさらなる特徴を決定する工程、およびポリペプチド識別インデックスと各工程において決定された特徴とを比較する工程、をさらに包含し得る。必要に応じて、ポリペプチドに関する１つ以上のさらなる特徴を決定する工程、およびポリペプチド識別インデックスと各工程において決定された特徴とを比較する工程は、１回以上繰り返され得、ここで、ポリペプチド識別インデックス中の単一のポチペプチドを同定する特徴のセットが決定される。上記の方法、および本発明の他の方法は、サンプル中のポリペプチドの量を定量する工程をさらに包含し得る。さらに、この方法は、この方法は、ポリペプチドの２つ以上の異なる集団における相対的な存在量（すなわちポリペプチド混合物（例えば、異なるサンプル中のポリペプチドの集団））を測定するために使用され得る。

ポリペプチドを同定するための本発明の方法は、ポリペプチド、またはポリペプチドのフラグメントに関する特徴を決定する工程を包含する。ポリペプチドを同定するために有用なポリペプチドに関する特徴は、再現可能に決定され得る特徴である。ポリペプチドまたはフラグメントの物理化学的特性としては、例えば、原子量、アミノ酸組成、部分アミノ酸配列、みかけの分子量、ＰＩ、および規定の条件下での特定のクロマトグラフィーの媒体における溶出の順序が挙げられる。ポリペプチドに関して決定されるこのような特徴は、ポリペプチドの同定のために使用される。ポリペプチドに関する特徴を決定するための方法は、以下により詳細に記載される。

本発明の方法において特に有用な特徴の１つは、ポリペプチドまたはフラグメント、またはこれらのフラグメントの質量である。ポリペプチドのフラグメントは、質量分析計による質量決定プロセスの前または質量決定プロセスの間に生成され得る。それ故、ポリペプチドフラグメントの質量は、ポリペプチドサンプルの調製の間に生成されたポリペプチドのフラグメントの質量であり得るか、または質量分析計の間に生じるポリペプチド切断によって生成されるフラグメントの質量であり得る。

本発明の方法において、ポリペプチドフラグメントの質量は、質量分析計によって決定され、そしてフラグメントイオンを生成するためのイオン選択の非存在下で有利に決定され得る。本発明の方法は、ポリペプチドまたはそのフラグメントの配列決定の必要なしでポリペプチドの同定を可能にする。ポリペプチドフラグメントの質量は、本明細書中に記載されるような、当該分野において公知の種々の質量分析法を用いて決定され得る。

種々の質量分析計システムが、ポリペプチドを同定するために本発明の方法において用いられ得る。高い質量精度、高い感度および高い分解能を有する質量分析器としては以下が挙げられるが、それらに限定されない：マトリクスアシスティドレーザー脱離飛行時間型（ＭＡＬＤＩ−ＴＯＦ）質量分析計、ＥＳＩ−ＴＯＦ質量分析計、およびフーリエ変換イオンサイクロトロン質量分析器（ＦＴ−ＩＣＲ−ＭＳ）。ＭＳの他の方法としては、ＭＳおよびイオントラップを有するエレクトロスプレープロセスが挙げられる。イオントラップＭＳにおいて、フラグメントは、エレクトロスプレーまたはＭＡＬＤＩによってイオン化され、次いで、イオントラップに置かれる。次いで、トラップされたイオンは、イオントラップからの選択的放出においてＭＳによって別々に分析され得る。フラグメントはまた、イオントラップにおいて生成され得、そして分析され得る。本発明の方法において使用され得るＩＣＡＴ^ＴＭ型試薬標識ポリペプチドは、例えば、ＭＬＤＩ−ＴＯＦシステムまたはＥＳＩ−ＴＯＦシステムを用いる一段階質量分析によって分析され得る。プロテオミクス適用のための質量分析計法が、記載されている（ＡｅｂｅｒｓｏｌｄおよびＧｏｏｄｌｅｔｔ，Ｃｈｅｍ．Ｒｅｖ．１０１：２６９〜２９５（２００１）を参照のこと）。所望される場合、ＭＳ法は、例えば、本明細書中に記載されるようなＩＣＡＴ^ＴＭ型試薬またはＩＤＥｎＴ型試薬を用いて、親和性タグ化ペプチドの検出を可能にするように修飾され得る。

所望される場合、異なるＭＳ分析が、未知のポリペプチドの特徴を決定するためよりもポリペプチド識別インデックスを生成するために適用され得る。例えば、ＬＣ−ＭＳ／ＭＳは、識別子についてのデータを収集するために使用され得、そしてＬＣ−ＥＳＩ−ＴＯＦは、未知のポリペプチドの特徴の測定のために使用され得る。任意のＭＳ法および任意のＭＳ法の組み合わせは、サンプルが実質的に同様の様式で処置される限り、かつＭＳ法が、異なる方法によって測定された質量の比較に適合する限り、使用され得る。

本発明の方法は、ポリペプチド分離工程に続く質量分析工程を含み得る。ポリペプチド分離工程および質量分析工程は、独立して実行され得るか、または「オンライン」分析方法と組み合わされ得る。ポリペプチド分離技術の種々の様式は、質量分析器と組み合わされ得る。例えば、ポリペプチドは、マイクロキャピラリーＨＰＬＣを用いたクロマトグラフィー、質量分析器と組み合わされ得る固相抽出キャピラリー電気泳動システム、またはゲル電気泳動法によって分離され得る。組み合わせられたポリペプチド分離法および質量分析法の具体的な例としては、イオントラップＭＳにおける動的排除と共に適用されるＥＳＩ−ＭＳ／ＭＳシステムと組み合わされたマイクロキャピラリーＨＰＬＣがある。

異なる型の質量分析計は、本発明の異なる適用方法について使用され得る。特定の適用（例えば、ポリペプチド識別インデックスを生成するためのポリペプチドフラグメントの質量決定）について、ある方法は高い精度（例えば、１ｐｐｍ未満の精度）を提供する。しかし、本発明の方法は、低い精度（すなわち、より高いｐｐｍの分解能）のＭＳにおいて有利であり、より高い精度の決定を必要とするより高価な装置を必要とせずに、都合よく使用され得る。ポリペプチドの集団の高処理能力の分析を含む適用について、より低い精度の質量決定で十分であり得る。より低い精度の質量決定は、一般に質量決定のためにわずかな時間しか必要とされないため、より高いサンプル処理量を提供する。

質量決定を含む、本発明の方法は、より低い精度で都合よく実行され得る。例えば、高い精度の装置（例えば、ＦＴＭＳまたはＦＴＩＣＲＭＳ）が、０．２ｐｐｍでの精度で決定するために使用され得る（Ｇｏｏｄｌｅｔｔら、Ａｎａｌ．Ｃｈｅｍ．７２：１１１２〜１１１８（２０００）；Ｍａｓｓｅｌｏｎら、Ａｎａｌ．Ｃｈｅｍ．７２：１９１８〜１９２４（２０００））。非常に高い質量精度（例えば、０．１ｐｐｍ）の使用は、制限として作用する。しかし、本発明の方法は、ポリペプチドに関するいくつかの特徴が、決定され得る点において有利である。さらなる特徴と組み合わされる場合、質量は、より低い精度（すなわち、より高いｐｐｍ）で決定され得る。より低い精度での質量の決定は、ＦＴＭＳよりもより広範に利用可能であるより安価なＭＳ装置の使用を可能にする。質量決定は、１ｐｐｍまたは１ｐｐｍよりも大きいｐｐｍの精度で決定され得、そして２．５ｐｐｍ以上、約５ｐｐｍ以上、約１０ｐｐｍ以上、約５０ｐｐｍ以上、約１００ｐｐｍ以上、約２００ｐｐｍ以上、約５００ｐｐｍ以上、またはさらに約１０００ｐｐｍ以上のｐｐｍでの精度で決定され得、これらの各々は、低い精度のＭＳ装置を必要とする。本発明の方法は、サンプル中のポリペプチドを同定するために、本明細書中に記載されるように、他の物理化学的特徴と組み合わせたより低い精度のＭＳ分析の使用を有利に可能にする。特定の適用のためのＭＳ測定の精度は、例えば、使用されるサンプルおよび／または指標の複雑さに依存して、当業者によって容易に決定され得る。

ポリペプチドを同定するための本発明の方法としては、１ｐｐｍより大きい精度でポリペプチドフラグメントの質量を決定する工程が挙げられ得る。それ故、本方法は、高い精度を有するＭＳ法を必要としない。従って、低費用のＭＳシステムが、ポリペプチドを同定する方法において用いられ得る。高い処理能力形式（例えば、９６ウェルプレートもしくは３８４スポットプレート形式）、またはアンアテンデッドオペレーションを可能にする自動注入システムに対する任意の質量分析計の適応は、サンプル処理能力を増大させるための利点である。

本発明の方法において、ポリペプチドまたはそのフラグメントの質量は、フラグメントイオンを生成するためのイオン選択の非存在下で決定され得る。タンパク質同定法のストラテジーの概観は、図１に示される。ポリペプチドは、例えば、ポリアクリルアミドゲル電気泳動を用いて必要に応じて分画化され、そしてポリペプチドは、ペプチドにさらにフラグメント化され得る。このペプチドは、必要に応じてクロマトグラフィーによってさらに分画され得る。クロマトグラフィーの画分、またはビン（図１において「＊」によって示される）は、ＭＳに供される。伝統的に、イオンまたは優先イオンは、衝突誘導性解離（ＣＩＤ）のための衝突セルにおいて選択される。単一イオンの選択は、図１のＱ１に描写される。イオンは、図１のＱ３に示されるように、選択され、次いでフラグメント化される。イオン選択の非存在下で、単一のイオンが選択される代わりに、何のイオン選択も適用されず、むしろ全てのイオンがフラグメント化され、多くのペプチドフラグメントを導く。このペプチドフラグメントは、特定の親ポリペプチドに対応するペプチドを決定するためにデコンヴォルーションされ、そしてポリペプチドのフラグメントの質量におけるこのような情報は、ポリペプチドに関する特徴となる（図４を参照のこと）。図１の下方に示されるように、フラグメントの質量は、任意の数のさらなる特徴と組み合わされ得、そしてタンパク質識別子（例えば、配列データベース、または注釈されたポリペプチド指標）と比較され得、そしてこのポリペプチドは、これらの決定された特徴に基づいて同定される。

ポリペプチドに関する決定された特徴の１セットは、ポリペプチド識別インデックスにおいてポリペプチドに関する特徴と比較される。ポリペプチド識別インデックスは、指標で注釈された他のポリペプチドからポリペプチドを独自に同定および区別する、個々のポリペプチドに関する特徴の収集物である。ポリペプチドに関する決定された特徴のセットを、ポリペプチド識別インデックスと比較することによって、同じ特徴を共有するポリペプチド識別インデックスにおける１つ以上の識別子が、同定され得る。１つより多いポリペプチドが、同じ特徴を有すると決定される場合、さらなる制限（例えば、１つ以上のさらなる特徴の決定）が含まれ得る。ポリペプチド識別インデックスは、ポリペプチドの推定の特徴（例えば、遺伝子配列データベースから推定される１つ以上の特徴）に基づき得るか、または本明細書中に記載される注釈されたペプチドタグ指標を用いる場合、経験的に決定され得る。

注釈されたペプチド指標を生成する１つの例示的な方法としては、以下がある：タンパク質を収集する；同位体コード親和性タグ（ＩＣＡＴ^ＴＭ）型試薬をコードする同位体を用いてタンパク質を標識する；分子量によりタンパク質を分画する；タンパク質をペプチドへと（例えば、トリプシンを用いて）消化する；イオン交換によりペプチドを分離する；アフィニティークロマトグラフィーにより各イオン交換画分を精製する；ＬＣ／ＭＳ／ＭＳ（またはＣＥ／ＭＳ／ＭＳ）により各アフィニティークロマトグラフィー画分を分析する；個々のＭＳ／ＭＳペプチドスペクトルのデータベース検索を介して全ての発現タンパク質を同定する；測定された物理化学的特性に基づく個々のペプチドおよび従ってそのペプチドの親タンパク質についての固有のバーコードを構築する注釈されたペプチドタグのデータベースを作成する。上記の方法、これらの工程の組合せ、これらの修飾体、またはポリペプチドに関する特徴の決定を可能にするのに適切な任意の方法が、本明細書中に記載されるように、少なくとも１つの経験的に測定された特徴を含むポリペプチド識別インデックスを作製するために使用され得ることが、理解される。

本発明の方法は、ポリペプチド識別インデックスとの比較のためにポリペプチドに関する１つ以上のさらなる特徴を決定する工程をさらに包含し得る。ポリペプチドに関する１つ以上のさらなる特徴を決定するプロセスに続いて、ポリペプチド識別インデックスを比較するプロセスは、単一のポリペプチドが、ポリペプチド識別インデックスから独自に同定されるまで、繰り返され得る。従って、さらなる制限が適用可能である場合、これらの制限は、ポリペプチド識別インデックスに対する比較によってポリペプチドを同定するために含まれ得る（図４Ｃを参照のこと）。

ポリペプリドを同定するために十分な特徴の数は、決定された特徴のセットを、ポリペプチド識別インデックスと比較することにより当業者によって容易に決定され得る。ポリペプチド識別インデックス中の単一のポリペプチドの同定は、ポリペプチドをポリペプチド識別インデックス中の別のポリペプチドから区別するのに十分な特徴のセットを決定する工程いう。例えば、２つの決定された特徴が、ポリペプチド識別インデックス中の単一のポリペプチドと一致する場合、２つの特徴は、単一のポリペプチドを同定するために十分である、同様に異なるポリペプチドについて、３つの決定された特徴が、指標中のポリぺプチドを独自に同定するために必要とされ得る。従って、ポリペプチドについて決定された特徴に基づいて、比較は、ポリペプチド識別インデックスを作成する。単一のポリペプチドが、同定される場合に、十分な数の特徴が決定されている。１つより多いポリペプチドが同定される場合、１つ以上のさらなる特徴が、単一のポリペプチドが決定された特徴と独自に一致するまで決定され得、これによってポリペプチドの同定を可能にする。それ故、特定のポリペプチド識別インデックスとの比較に基づいて、十分な数の特徴が、ポリペプチド識別インデックス中の特有のポリペプチドの同定を可能にするポリペプチドについて決定されている場合、当業者は、容易に決定し得る。

本発明の方法は、より効率的なポリペプチドの同定、特に多数の異なるポリペプチドを含む複雑なサンプルにおける同定を可能にする、選択された制限を含むことに有利に基づく。この方法はまた、複雑なサンプルから複数のポリペプチドを同時に同定するために有利に使用され得る。従って、異なるポリペプチドに関する多数の特徴を決定するよりもむしろ、この方法は、繰り返しの様式で実行され得、所望される場合、ポリペプチド識別インデックス中の単一のポリペプチドを同定するために必要とされるさらなる制限を含むことを伴う。

例えば、相同なポリペプチドは、高い配列同一性のセグメントを一般に有する。このようなポリペプチドは、例えば、類似の機能を有するポリペプチド、同じ核酸のスプライス改変体などから生じ得る。高い配列同一性のセグメントを有するポリペプチドは、通常いくつかの物理化学的特徴、特にポリペプチドの相同フラグメントに関する特徴を有し得る。それ故、高い程度の類似性を共有するポリペプチドは、類似または同一の関連する特徴のセットを有し得る。このような類似のポリペプチドについて、２つの異なるポリペプチドを区別するのに十分な所定の特徴のセットは、ポリペプチドが、類似の領域を有する場合に、ポリペプチド識別インデックス中の単一のポリペプチドを同定するために不十分であり得る。このような場合において、ポリペプチドに関する１つ以上のさらなる特徴が、決定され得、そしてさらなる特徴の決定が、対象のポリペプチドが、ポリペプチド識別インデックス中のポリペプチドと互いに区別され得るまで、繰り返され得る。ポリペプチドに関する特徴のセットを決定する方法、ポリペプチド識別インデックスと比較する方法、およびポリペプチド識別インデックス中の単一のポリペプチドが同定されるまで、さらなる特徴を決定する方法は、１つ以上のポリペプチドに適用され得る。

従って、ポリペプチドを同定するために必要な場合、さらなる容器が考慮され得る。例えば、ポリペプチド識別インデックス中の１より多いポリペプチドが、所定のセットの特徴を有する場合、このポリペプチド識別インデックスの選択されたポリペプチドの同定、すなわち、インデックスまたはインデックスのサブインデックス中のポリペプチドのサブセットは、実質的に制約として機能する。従って、ポリペプチド識別インデックスに対する後の比較は、このサブインデックスに対してなされ得、これは、所望の場合、計算時間を減少させ得、そしてより効率的な比較を提供し得る。次いで、さらなる制約（例えば、さらなる特徴）が考慮され得、そしてサブインデックスと比較され得、これは、決定された特徴の全てを有するポリペプチドの数を減少させ得る。このような工程は、ポリペプチド識別インデックス中の単一のポリペプチドが同定されるまで、必要に応じて繰り返され得る。このようなアプローチは、複数のポリペプチドの同定を同時に決定する場合、有利である。なぜなら、ポリペプチドを同定するに十分な特徴だけが、決定される必要があるからである。従って、これらの方法は、不要なデータ取得に対して資源を無駄にすることなく、種々のポリペプチドの同定およびプロテオミクス分析に伴う複雑性の決定を容易に提供し得る。

ポリペプチド識別インデックスを作製するための本発明の方法は、２つ以上のポリペプチドについて、ポリペプチドを同定するために使用され得る特徴のセットを決定する工程を包含する。ポリペプチド識別インデックス中のポリペプチドを独自に同定する特徴のセットは、ポリペプチド同定コードまたはポリペプチドについての「バーコード」を規定する。ポリペプチド識別インデックスは、インデックス付けされたポリペプチドに関連する種々の特徴を含み得る。ポリペプチド識別インデックスに含まれるポリペプチド特徴は、ポリペプチド質量、アミノ酸組成、部分的アミノ酸組成（例えば、特定のアミノ酸の存在）、ｐＩ、特定のクロマトグラフィー媒体での溶出の順番、および１以上のポリペプチドフラグメントの質量を含み得る。ポリペプチド識別インデックスは、さらに、ポリペプチドの同定のために適切な、アミノ酸配列、関連ポリペプチドに対する参照、データベース登録または文献、ならびに他の情報を含み得る。使用者は、どの型の情報がポリペプチドインデックスに有用であり、そして任意の生理学的特性またはポリペプチドに関連する情報を含み得るかを知っている。種々のポリペプチドについて多数の同定コードを含むポリペプチド識別インデックスは、複合サンプル中のポリペプチドを同定するために特に有用である。

ポリペプチドを同定することに関する本発明の方法は、ポリペプチド識別インデックスとポリペプチドについて決定した特徴とを比較することに基づく。ポリペプチド識別インデックスは、市販または公に利用可能なデータベース（例えば、ＧｅｎＢａｎｋ（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＧｅｎＢａｎｋ）であり得、ここで、ポリペプチドの１以上の特徴（例えば、アミノ酸組成、ポリペプチドもしくはそのフラグメントの質量など）が予測される。さらに、ポリペプチド識別インデックスは、本明細書中に記載される方法によって決定される、実験的に決定された特徴に基づき得る。例えば、ポリペプチド識別インデックスは、実験的に決定された特徴、または予測された特徴および実験的に決定された特徴の組み合わせであり得る。例えば、本明細書に開示される注釈付ポリペプチド（ＡＰ）インデックスはまた、注釈付ペプチドタグ（ＡＰＴ）インデックスとして言及される。

実験的に決定されたポリペプチドに関連する特徴のセットは、種々の方法を使用して実験的に決定され得る。ポリペプチドの同定のための例示的方法および／またはポリペプチド識別インデックスを作製するための特徴を決定するための例示的方法は、図１に示され、そして以下に記載される。この方法は、ポリペプチド同定コードを規定するために有用である。なぜなら、この方法は、ポリペプチドに関連する特徴の決定を可能にする一連の工程を包含し、最後の工程は、ポリペプチドまたはフラグメントの質量を決定することである。この方法は、以下を包含し得る：（ｉ）ポリペプチドサンプル調製；（ｉｉ）ポリペプチドタグ化；（ｉｉｉ）任意のポリペプチド分画；（ｉｖ）ポリペプチドフラグメント化；（ｖ）ポリペプチドフラグメント分離；（ｖｉ）タグ化ポリペプチドフラグメントの親和性単離；（ｖｉｉ）高分解ポリペプチドフラグメント分離；（ｖｉｉｉ）データベース検索；および（ｉｘ）ポリペプチド識別インデックス構築（実施例Ｉを参照のこと）。

ポリペプチドサンプル調製について、定量的プロテオーム分析が実行されるポリペプチドサンプルは、ポリペプチドの可溶性を維持するための標準的なプロトコールを使用して、それぞれの供給源から単離される。ポリペプチドサンプルおよびポリペプチドサンプルの調製は、以下により詳細に議論される。

ポリペプチドタグ化について、サンプル中のポリペプチドは、変性され得、必要に応じて還元され得、そしてポリペプチドの化学的に反応性の基は、化学的改変試薬を用いて共有結合的に誘導体化され得る。例示的な反応性の基は、還元されたシステイン残基の側鎖を示す、スルフヒドリル基であり、これは、試薬（例えば、ＩＣＡＴ^ＴＭ（Ｇｙｇｉら、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌ．１７：９９４−９９９（１９９９））またはＩＤＥｎＴ試薬（Ｇｏｏｄｌｅｔｔら、Ａｎａｌ．Ｃｈｅｍ．７２：１１１２−１１１８（２０００））によって誘導体化され得る。他の有用な反応性の基としては、ポリペプチドのアミノ基もしくはヒドロキシル基または特定の翻訳後修飾（ホスフェート、炭水化物または脂質）が挙げられる。ポリペプチド中の化学基についての特異性を有する任意の化学反応が、この工程において適用され得る。ＩＣＡＴ^ＴＭ型試薬およびＩＤＥｎＴ試薬ならびに使用方法は、以下により詳細に記載される。

任意のポリペプチド分画について、タグ化ポリペプチドの混合物は、任意のポリペプチド分離手順を使用して分画され得る。本発明の方法において有用な分画手順は、再現性があり、ポリペプチドを可溶性のままにし、そして高いサンプルおよびピーク容量を有する。任意の分画手順のいずれかは、低量のタンパク質について富化するため、および／または混合物の複雑性を減少させるために実行され得、そして相対的な量は維持され得る。例示的な分画方法としては、例えば、本明細書中に開示されるような、ドデシル硫酸ナトリウム−ポリアクリルアミドゲル電気泳動（ＳＤＳ−ＰＡＧＥ）、クロマトグラフィー法（例えば、サイズ排除、イオン交換、疎水性など）が挙げられる。ポリペプチド分画方法は、以下により詳細に記載される。

ポリペプチド分画について、サンプル混合物中のポリペプチド、または任意のサンプル画分が使用される場合には各画分中に含まれるポリペプチドは、配列特異的な切断（例えば、トリプシンによる切断）に供され得る。配列特異的切断の使用は、特に有用であり得る。なぜなら、配列特異的な方法によって切断されたペプチドの末端は、制約として作用し得るからである。しかし、フラグメントを作製するために使用される切断方法は、所望の場合、配列特異的である必要はないことが理解される。配列特異的な様式でポリペプチドを切断するために有用な方法は、以下により詳細に記載される。

ポリペプチドフラグメント分離について、得られたポリペプチドフラグメント混合物は、必要に応じて、１次元ペプチド分離に供され得る。高いサンプル容量を有する分離方法、少なくとも中程度の分解能および高度に再現性のある分離パターンが、この工程において有用である。１次元分離方法の例としては、アニオンおよびカチオンのイオン交換クロマトグラフィーが挙げられる。これらおよび他のクロマトグラフィー方法は、以下により詳細に記載される。ポリペプチドフラグメント分離は、必要に応じて実行され得るが、この方法は有利に使用され得、その結果、ペプチドフラグメントの特徴は「バルク」で測定される、すなわち、この方法は、ペプチドフラグメントを均質にまで精製することを必要としない。

タグ化ポリペプチドフラグメントの親和性単離について、ポリペプチドフラグメントは、このポリペプチドタグに結合する親和性試薬を使用して、各クロマトグラフィー画分から単離され得る。例えば、本明細書中に例示されるＩＣＡＴ^ＴＭ試薬を用いてタグ化されたポリペプチドフラグメントは、アビジンまたはストレプトアビジン親和性クロマトグラフィーを使用して単離され得る。ＩＣＡＴ^ＴＭ標識されたポリペプチドフラグメントの単離のために有用な親和性媒体の例は、ポリマービーズ上に固定化されたモノマーアビジンである。ビオチンとは異なる親和性タグと共にＩＣＡＴ^ＴＭ型試薬を使用する場合、親和性タグに結合する、対応する親和性媒体が使用される。本明細書中に開示されるように、親和性単離分離は、例えば、ビーズが通過するのを防ぐ膜、フリットまたは他のデバイスを含む上側のチャンバのウェル中に親和性ビーズを有するマイクロタイタープレートを使用して、並行して実施される得る。サンプルは、上側のチャンバに添加され、そして親和性ビーズと共にインキュベートされ、洗浄されて非特異的結合を除去し、次いで特異的結合剤が、固体の底を有する第二のマイクロタイタープレート中に溶出する。

高分解ポリペプチドフラグメント分離について、液体クロマトグラフィーＥＳＩ−ＭＳ／ＭＳが使用され得る。親和性クロマトグラフィーカラムから溶出されたポリペプチドフラグメント混合物は、分離方法としてキャピラリー逆相クロマトグラフィー（Ｙａｔｅｓら、ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．１１２：５５３−５６９（１９９９））を使用し、そして質量分析法として動的排除を用いるデータ依存的ＣＩＤ（Ｇｏｏｄｌｅｔｔら、前出、２０００）を使用する自動化ＬＣ−ＭＳ／ＭＳによって、個々に分析され得る。

全ての親和性画分の同時の高スループット分析について、高分解分離が並行して実行され得る。このためのデバイスは、並行分離キャピラリー（各々、圧電ポンプで終わるＣＥ、ＳＰＥ−ＣＥ、ＨＰＬＣが挙げられるが、これらに限定されない）、またはＭＡＬＤＩ
ＭＳサンプリングプレート上で迅速にサンプリングし得る他のデバイスからなる。各圧電ポンプまたは類似のデバイスは、分離からの分解を維持し、そして非常に小さいスポットでサンプルを堆積させることによって、ＭＡＬＤＩ−ＴＯＦの感度の増大を提供する、迅速なサンプリングを行い得る。各分離からの溶出物は、ＭＡＬＤＩ標的上に同時に堆積し得るか、またはマイクロタイタープレート中にも堆積され得る。

データベース検索について、適切なＣＩＤスペクトルが得られたポリペプチドフラグメントの配列は、調査中の種由来の配列データベースを検索することによって決定される。配列データベース検索プログラム（例えば、ＳＥＱＵＥＳＴ（Ｅｎｇ，Ｊ．ら、Ｊ．Ａｍ．Ｓｏｃ．Ｍａｓｓ．Ｓｐｅｃｔｒｏｍ．５：９７６−９８９（１９９４））または類似の能力を有するプログラムは、データベースを検索するために有利に使用され得る。

ポリペプチド識別インデックスの構築について、上記の手順によって同定された全てのペプチドの配列は、データベースに登録され得、そして上記工程の間に生じた特徴と共に注釈付けされ得る。これらの属性としては、例えば、部分的アミノ酸組成、親ポリペプチドの近似分子量（これは、例えば、任意の分画工程によって決定され得る）、第一のクロマトグラフィー工程からの溶出の順序、第二のクロマトグラフィー工程からの溶出の順序などが挙げられ得る。

集合的に、ポリペプチド識別インデックス中の各ポリペプチドフラグメントを識別する、十分な数の特徴が決定され得る。ポリペプチドを独自に同定する特徴の収集は、「バーコード」またはポリペプチド同定コードを示す。未知のポリペプチドに関連する特徴は、引き続いて決定され得、そして以前に作製されたポリペプチド識別インデックスと比較され得る。あるいは、ポリペプチド識別インデックスは、未知のポリペプチドと共に決定され得る。しかし、ポリペプチドに関連する特徴およびインデックス中の収集に関する情報の蓄積は、サンプルを分析する時点での必要な実験工程を最小にするために便利である。従って、引き続く実験において作製されたポリペプチドのフラグメントについて決定されたポリペプチド同定コードは、未知のポリペプチドについて新たに作製されたポリペプチド同定コードをポリペプチド識別インデックスと相関させて、未知のポリペプチドを同定することによって、サンプル中のポリペプチドを同定するために使用され得る。

ポリペプチド識別インデックスとの比較によるポリペプチドの同定について、ポリペプチドに関連する特徴のセットは、ポリペプチド識別インデックスを作製するために本明細書に記載されるように一般に決定され得るか、あるいは等価な方法、改変方法もしくは省略方法、またはポリペプチドに関連する特徴の決定を可能にする任意の方法を使用して、決定され得る。ポリペプチドを独自に同定するために十分な特徴の数は、本明細書に開示されるように、当業者によって容易に決定され得る。これらの方法は、一般に、２以上の特徴の同定を含み、そしてインデックス中の各ポリペプチドを識別する十分な数の特徴が決定される限り、３以上、４以上、５以上、６以上、７以上、８以上、９以上、１０以上、１５以上、２０以上、３０以上またはなお５０以上の特徴、あるいは任意の数の特徴を含み得る。ポリペプチド識別インデックス中に含める特徴の数は、インデックスの特定の使用および分析されるサンプルの複雑性に依存する。

ポリペプチド識別インデックスを作製する際に、配列データベースを検索することによってポリペプチド配列を得るために、ポリペプチドに関連する特徴を使用し得る。例えば、必要に応じて質量分析によって決定されるポリペプチドまたはフラグメントの部分的アミノ酸配列を、ポリペプチドまたは翻訳された核酸配列データベースを検索するために容易に使用して、ポリペプチドを独自に記載する名前または配列同定数（例えば、登録番号）を同定し得る。従って、ポリペプチド識別インデックスは、ポリペプチド特徴（例えば、一般名称、公に利用可能なデータベースからの数字の同定コードもしくは英数字の同定コード、またはポリペプチド識別インデックス中のポリペプチド同定コードを同定するために選択された任意の他の同定コード）を含み得る。

データベース中に親ポリペプチド配列も核酸配列も有さないか、または同定を困難にする予期しない翻訳後修飾を含むポリペプチドから配列情報を獲得するために、新規配列決定が実行され得る。同定されたアミノ酸配列を使用して、上記のようにポリペプチド配列または核酸配列のデータベースを検索し得る。新規配列決定は、種々の方法を使用して実行され得る。新規配列決定の特に有用な方法は、ポリペプチド同定のために作製されたＭＳデータセットを使用することを含む。質量分析を使用してポリペプチドを配列決定するための方法は、当業者に周知である（例えば、ＫｉｎｔｅｒおよびＳｈｅｒｍａｎ、ＰｒｏｔｅｉｎＳｅｑｕｅｎｃｉｎｇａｎｄＩｄｅｎｔｉｆｉｃａｔｉｏｎＵｓｉｎｇＴａｎｄｅｍＭａｓｓＳｐｅｃｔｒｏｍｅｔｒｙ、ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ、ＮｅｗＹｏｒｋ（２０００）を参照のこと）。

例えば、ＣＩＤのような方法によって決定されるポリペプチドまたはその部分に関する配列情報は、ポリペプチド識別インデックス中の特徴として含まれ得るが、本発明の方法は、ポリペプチドを同定するために未知のポリペプチドを配列決定する必要性を除外し、一方、配列情報は、所望の場合、ポリペプチド識別インデックスを作製する際に含まれ得る。従って、ポリペプチド識別インデックスは、ポリペプチドを同定するために十分な特徴に加えて、ポリペプチドに関連する特徴についての情報（例えば、配列情報）を含み得る。インデックス中のポリペプチドに関連する特徴に関する情報を蓄積することによって、ポリペプチドの同定は、未知のポリペプチドについての配列情報を得ることなく容易に決定され得る。

クロマトグラフィー分離を使用して、ポリペプチドの特徴を決定し得る。なぜなら、ポリペプチドの物理化学的特性は、クロマトグラフィー媒体上でのポリペプチドの挙動に反映されるからである。例えば、高度に荷電したポリペプチドは、非荷電であるかまたは反対に荷電したポリペプチドが溶出するｐＨおよび／または塩条件とは異なる特定のｐＨおよび／または塩条件下で、アニオン交換カラムまたはカチオン交換カラムから溶出される。従って、ポリペプチドに関連する特徴は、ポリペプチドがクロマトグラフィーカラムから溶出される、特定のｐＨおよび／または塩条件であり得る。同様に、ポリペプチドが任意の型のクロマトグラフィーカラムから溶出する条件が決定され得る。ポリペプチドがカラムから溶出される溶出の順番および緩衝液条件は、ポリペプチドインデックス中で注釈を付けられるか、またはポリペプチドインデックス中の対応する値と比較するために使用される値を割り当てられ得る。例えば、値は、規定された条件下の溶出プロフィール中の相対位置、所定のセットの条件下および流速での溶出時間、外部標準画分数もしくは内部標準に対する溶出の相対的な時間または順番、塩濃度、ｐＨ、あるいは再現性を伴って決定され得る特定のクロマトグラフィーカラム上でのポリペプチドの挙動を説明する任意のパラメータであり得る。代替的方法としては、ゲル電気泳動（例えば、等電点電気泳動法（ＩＥＦ））または他の分析的電気泳動方法が挙げられる。例えば、ＩＥＦは、ポリペプチドを同定するためのバーコードの作製に有用な特徴であることが示された（実施例ＶＩを参照のこと）。ポリペプチドを分画するための方法は、当業者に周知である（Ｓｃｏｐｅｓ、ＰｒｏｔｅｉｎＰｕｒｉｆｉｃａｔｉｏｎ：ＰｒｉｎｃｉｐｌｅｓａｎｄＰｒａｃｔｉｃｅ、第３版、ＳｐｒｉｎｇｅｒＶｅｒｌａｇ、ＮｅｗＹｏｒｋ（１９９３））。クロマトグラフィー方法は、従来のクロマトグラフィー形式で使用され得るか、または（例えば、バルクまたはマルチウェル形式で）バッチ結合および溶出法として使用され得る。

タンパク質分画工程は、ポリペプチドまたはそのフラグメントの質量分析の前のポリペプチドサンプルの複雑さの軽減およびポリペプチドに関連する特性の決定の両方のために本発明の方法において有用である。上記のクロマトグラフィーによる分画に加えて、任意の周知の分画工程が、サンプルの複雑さを軽減するために使用され得、そして／またはポリペプチドに関連する決定された特性として役立つ。例示的な分画工程として、硫酸アンモニウムのような塩析またはポリエチレングリコールもしくはポリエチレンイミンのような化学物質を用いる析出、細胞成分分画、組織分画、免疫沈降、などが挙げられる（Ｓｃｏｐｅｓ、前出、１９９３を参照のこと）。分画工程は、ポリペプチド群の複雑さを軽減するために使用され得る。例えば、複雑さの軽減は、特定のアミノ酸で標識されたポリペプチドを含むポリペプチドの亜群の単離において使用され得る。組織サンプルの場合、分画は、１つ以上の特定の細胞型の単離（例えば、遠心分離技術または免疫選択によって）を包含し得る。さらに、細胞成分分画のような、他の分画工程はまた、サンプルの複雑さを軽減するためにおよび／またはポリペプチドの識別のために有用な特性を提供するために適用され得る。この分画工程は、ポリペプチドについての生物学的に重要な情報を、強力に提供し得る（例えば、ポリペプチドが、細胞小器官に位置付けられるかあるいは核タンパク質、膜タンパク質、および／またはシグナル伝達複合体の一部など）。ポリペプチドの群の複雑さを有利に軽減する任意の分画工程が、本発明の方法において適用され得る。

ポリペプチド分画工程は、ポリペプチドに関連する特性を決定するための本発明の方法において有用である。例えば、分子量に基づくタンパク質分画方法は、ポリペプチドの分子量を決定するために使用され得る。ＳＤＳ−ＰＡＧＥ（市販のゲル溶出または分取細胞システム（ＢＩＯ−ＲＡＤ））およびサイズ排除クロマトグラフィーのような方法は、ポリペプチドまたはフラグメントの見かけの分子量を決定するために使用され得る。ポリペプチドおよび／またはフラグメントの分子量は、ポリペプチド識別インデックスの中に包含され得る特徴である。

ポリペプチド識別インデックスの作成においてかまたはポリペプチドの識別のために、ポリペプチドについて決定された特定の一連の特性は、使用者により選択され得、そして、ポリペプチドサンプル、ポリペプチドサンプルを調製するために使用される方法、使用される質量分析の方法および使用者の好みに依存する。ポリペプチドの特性は、任意の一時的な指示（ｏｒｄｅｒ）において得られ得る。例えば、ポリペプチドの特性は、時間効率または利便性を提供する指示により集結され得るか、またはサンプル処理のために選択された特定の方法による命令として集結され得る。

ポリペプチド指標の作成において、配列情報（例えば、ＣＩＤによって決定される）ならびにポリペプチドの他の特性が、使用され得、そしてこの配列情報は、ポリペプチドを識別するための特定の配列を有するポリペプチドの他の特性と関連するために、特に有用である。しかし、一旦、ポリペプチド識別インデックスが、作成されると、ポリペプチドについて獲得される配列情報は、必要とされないという点でこの方法は、好都合である。代わりに、ポリペプチドを識別するために十分な他の特性（例えば、質量および／またはペプチドの間の比率ならびに他の特性の間の比率）が、決定され得、そしてそれ自体が配列情報を含むポリペプチド識別インデックスと比較され、それによってポリペプチドを識別するために、ポリペプチドを配列決定する必要性を排除する。

ポリペプチド識別インデックスを作成するための本発明の方法は、第１および第２のポリペプチドと関連する一連の特性を決定する工程を包含し、ここで決定された特性は、第１および第２のポリペプチドを識別するために十分である。第１および第２のポリペプチドを識別するために十分な特性とは、一意的にポリペプチドに起因され得る一連の特性のことをいい、これによってポリペプチドの同一性は、ポリペプチド識別インデックスを用いて明瞭に決定され得る。一連の特性が、１つ以上のポリペプチドによって共有される場合、ポリペプチドを別のポリペプチドから識別するためのさらなる特性が、決定される。従って、ポリペプチド識別インデックスにおいて示されるポリペプチドは、各ポリペプチドを識別する一連の特性によって、互いに区別され得る。

ポリペプチドを識別するための本発明の方法は、ポリペプチドの群に適用され得、ここで、２つ以上のポリペプチドが、識別され、そして所望の場合、サンプルにおいて同時に、多数のポリペプチドを識別するために都合よく使用され得る。従って、この方法は、単純なまたは複雑なポリペプチドサンプルに対して使用され得る。単純なポリペプチドサンプルは、例えば、１から数種のポリペプチドを含む精製されたポリペプチドサンプルであり得る。複雑なサンプルは、例えば、数個から数百のポリペプチドまたは数千または数万個のポリペプチドを含む細胞または組織溶解産物あるいは分画であり得る。本明細書中に記載した方法を使用する、ポリペプチド特性の決定は、一連の工程（例えば、一連のクロマトグラフィー分離）から得られる実験データの収集を必要とし得る。

複雑なポリペプチドサンプルの分析の間に得られたデータを体系化するために有用な例示的プロセスは、情報の理論的な「容器（ｂｉｎ）」への分配工程を包含する。例えば、ポリペプチドのＩＣＡＴ^ＴＭ型標識化混合物は、大きさによって特定の番号の容器に分離され得る。この容器は、クロマトグラフィーカラム（例えば、サイズ排除、イオン交換、など）またはＳＤＳポリアクリルアミドゲルのセグメントから溶出する分画であり得る。各容器の中のポリペプチドは、配列特異的切断法によって断片化され得る。あるいは、サンプル中におけるポリペプチドの分析は、分画なしにポリペプチドの識別が可能となるようなサンプルの複雑さが十分に軽減されている限り、ポリペプチドを分画することなく実施され得る。容器の中に分画されるペプチド混合物は、さらに種々の方法によって分画され得、このような方法として、例えば、イオン交換クロマトグラフィー、ＩＣＡＴ^ＴＭ型標識化ペプチドの単離に伴って使用されるような親和性クロマトグラフィー、逆相液体クロマトグラフィー、または他のクロマトグラフィー技術が挙げられる。次いで、各容器のペプチドは、イオン交換クロマトグラフィーのようなさらなる分画工程によってさらに容器に入れられ、そしてもう一度、特定の番号の容器にさらに分けられる。これらの容器の各々は、逆相クロマトグラフィーのような別の分画工程によってさらに分離され得、そしてさらに特定の番号の容器に分けられ、これらの容器の各々は、質量分析機によって分析され得る。そのため、このような方法によって分析される各々のペプチドは、５つの関連する特性を有し、これらは、例えば、システイン含量、大きさ、電荷、疎水性、および質量に基づく、５桁のポリペプチド識別コードまたは「バーコード」として、示され得る。

多数のポリペプチドに関連する特性を指標化するための本発明の方法は、コンピュータのメモリを多量に（すなわち配列の長さの２乗）、使用する。高度なデータ構造（例えば、接尾辞木（ｓｕｆｆｉｘｔｒｅｅ）のような）は、コンピュータメモリの必要量を減らすために使用され得る（Ｇｕｓｆｉｅｌｄ，ＡｌｇｏｒｉｔｈｍｓｏｎＳｔｒｉｎｇｓ，ＴｒｅｅｓａｎｄＳｅｑｕｅｎｃｅｓ：ＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＣｏｍｐｕｔａｔｉｏｎａｌＢｉｏｌｏｇｙ，ＣａｍｂｒｉｄｇｅＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ（１９９７））。接尾辞木は、配列のデータベースにおける全ての接尾辞のための小型のデータ表示法である。その純粋な形態において、これらは、２乗のメモリに代わって、比例的な時間をかけて構築され得そして比例的に保存される。接尾辞木アルゴリズムについての種々の改変およびトラバーサル（ｔｒａｖｅｒｓａｌ）アルゴリズムは、計算時間の最適化およびポリペプチド識別インデックスの検索と関連するコンピュータメモリの使用のために使用され得る。

ポリペプチドに関連する一連の決定された特性は、ポリペプチド識別インデックスと比較される。種々の検索アルゴリズムは、特性を決定するために割り当てられた値を指標において注釈付けられた値と整合させるために、使用され得る。データベース検索の有効性を増加するために役立つストラテジーは、データベースの狭小化または「束縛化」である。ポリペプチド識別インデックスと関連して使用される場合、用語「束縛化」は、特性（これは、識別されるポリペプチドの１つ以上の特性と一致する）を有するポリペプチドに対応するポリペプチド識別コードの一部を含むサブインデックスを得るための、ポリペプチド識別インデックスに適用される限定のことをいう。サブインデックスは、共通の特性を有するポリペプチドの群が、ポリペプチド識別インデックス以外から選択される場合、または、ポリペプチド識別コードに含まれる特定の特質が、指標から１つ以上のポリペプチドを除外するために使用される場合、作成され得る。共通の特性は、明確な物理化学的な特質（例えば、部分的アミノ酸配列または値の範囲内に設定された任意の他の決定された特質）であり得る。例えば、質量決定における誤差を説明する値の範囲として表わされるポリペプチドフラグメントの質量は、特定の質量のポリペプチドまたはフラグメントの部分集合を選択するための束縛として役立ち得る。

ポリペプチドに関連する１つの特質（これは、データベースを束縛するために使用され得る）は、部分的なアミノ酸組成である。ポリペプチドの部分的アミノ酸組成物は、特定のポリペプチドまたはそのフラグメントに存在する少なくとも単一のアミノ酸の識別を包含する。部分的なアミノ酸配列は、例えば、ポリペプチドまたはそのフラグメントを試薬で処置することによって、得られ得、その結果、１つ以上の規定されたアミノ酸を含むポリペプチドまたはフラグメントを生成を導く。例えば、配列特異的ポリペプチド切断法は、１つ以上の既知のアミノ酸残基をフラグメントのカルボキシル末端またはアミノ末端に有するフラグメントを産生する。しかし、特定のアミノ酸残基が、ポリペプチドのカルボキシル末端フラグメントまたはアミノ末端フラグメントに位置するかを知ることは、必要ではない。従って、配列特異的プロテアーゼを用いるポリペプチドの切断は、ポリペプチドまたはそのペプチドフラグメント中に対応するアミノ酸および／または配列の存在を示す。同様に、試薬は、ポリペプチドまたはフラグメントの１つ以上の特定のアミノ酸残基を特異的に修飾または標識するために使用され得る。そのような改変または標識を含むポリペプチドまたはフラグメントは、特定のアミノ酸を含むことが知られている。一部のアミノ酸組成は、ポリペプチドに関連する特性を示し、これは、ポリペプチド識別サブインデックスを作成するためのポリペプチド識別インデックスを束縛するために有用であり得る。

従って、一連の決定された特性とポリペプチド識別インデックスとの比較は、ポリペプチドの決定された特性により束縛される一連の検索を包含する。例えば、親ポリペプチドの質量またはフラグメントの質量の初期の検索を、実施し、ポリペプチドおよびフラグメントの質量値を含むポリペプチド識別サブインデックスを作成し得、このポリペプチド識別サブインデックスは、機器の誤差範囲内において、同定されるポリペプチドまたはそのフラグメントの値に類似する。作成されるポリペプチド識別サブインデックスを背景として検索される第２の特性（例えば、識別されるポリペプチド中のシステイン残基の存在）は、さらなる束縛を提供し、そしてさらなるポリペプチド識別サブインデックスを作成するために使用され得る。

ポリペプチドまたはフラグメントの決定された質量は、広大なデータベース検索の効率を増加させる上記のデータベース検索を、束縛するために有利に使用され得る特性である。例えば、タンデム型ＭＳスペクトルは、ＳＥＱＵＥＳＴ^ＴＭのようなソフトウェアを使用して分析され得、ここで、このソフトウェアは、データベースにおける未知のペプチドの分子量と一致するペプチドのリストを生成し、これを用いてＣＩＤが実施され、次いで、観測される未知のＣＩＤスペクトルを、全ての可能な等質量物（ｉｓｏｂａｒ）と比較する（Ｅｎｇ，Ｊ．ら、Ｊ．Ａｍ．Ｓｏｃ．Ｍａｓｓ．Ｓｐｅｃｔｒｏｍ．５：９７６−９８９，（１９９４））。従って、この型の検索によって生成される、分析されるポリペプチドフラグメントと類似する分子量を有する一連のペプチドは、ペプチドフラグメントによって示される、可能な親ポリペプチドの部分集合を提供する。次いで、この部分集合は、例えば、親ペプチドを同定するために、部分的アミノ酸組成を使用して、検索され得る。当業者は、ＳＥＱＵＥＳＴ^ＴＭのようなソフトウェアアプリケーションを使用する特定の検索についての適切な相関スコアパラメータを、知っているかまたは容易に決定し得る。

２つ以上のポリペプチド群を比較する方法は、２つのポリペプチド群を定量的に区別する方法（本明細書中に記載されるような、ＩＣＡＴ^ＴＭ型試薬を使用する方法、これは図３に図示される）を使用する。２つまたはいくつかの化学的に同一だが、差次的に同位体により標識されたＩＣＡＴ^ＴＭ型試薬は、この工程において使用され得る。従って、図３は、２つのサンプルを描くが、複数のサンプルが、本明細書中に記載される方法を使用して比較され得る。図３の中に描かれるサンプルは、互いに増殖条件が異なる同一のサンプル型から収集されたポリペプチド群を含む。例示的な異なる増殖条件として、異なる代謝条件の下での増殖または異なる代謝条件にある細胞、正常サンプルおよび疾患サンプル（例えば、腫瘍サンプル）の比較、薬物学的試薬で処理されていない細胞と処理された細胞の比較などが挙げられる。

図３に示されるように、サンプルは、ＩＣＡＴ^ＴＭ型試薬を使用して独立に標識され、組み合わされ、そして本明細書中に記載されるように、ポリペプチドおよび対応するフラグメントの特性が決定される。このプロセスの間に生成されるポリペプチドおよびフラグメントは、所望の場合、サンプルの処理量および感度を増大するために、ＭＳ／ＭＳではなく、単一工程の質量分析を使用して分析され得る（Ｇｏｏｄｌｅｔｔら、上記、２０００）。ポリペプチドおよびフラグメントについて決定された特性は、本明細書中に記載されるように、ポリペプチドの同一性を決定するために使用される。次いで、質量スペクトルにより、ペプチドイオンのペアについて調べられ得、ここで、このペプチドイオンのペアは、プロセスを通してともに分画され、そしてＩＣＡＴ^ＴＭ型試薬においてコードされた質量の相違に正確に対応する質量の相違を有する。２つのピークの相対的なシグナル強度は、フラグメントポリペプチドの相対存在量を示し、そして従って、サンプル中にはじめに存在する対応する親ポリペプチドの相対存在量を示す。従って、２つのポリペプチドサンプル中に含まれるポリペプチドを比較するための方法は、２つの参照ポリペプチド指標の生成に関連し得、ここで、この参照ポリペプチド指標は、ポリペプチド識別コードに加えて、識別された各ポリペプチドに対する、ポリペプチドの量の定量的な決定を含む。

２つ以上のポリペプチド群を比較するための代替法は、１つ以上のポリペプチドサンプルと前もって決定されたポリペプチド参照インデックスとの比較である。ポリペプチドサンプルにおける１つ以上のポリペプチドの一連の特性は、識別され得そして、１つ以上のポリペプチドの同一性および識別されたポリペプチドの相対量を決定するために、参照ポリペプチド識別インデックスと比較され得る。所望の場合、未知のサンプルは、ポリペプチドの相対発現レベルを決定するために上記の定量法を使用する参照サンプルと比較され得る。参照サンプルは、例えば、健康な個体に由来のサンプルであり得るかまたは疾患サンプルのような別のサンプルの生理学的条件と比較するために有用なコントロール条件由来のサンプルであり得る。

ポリペプチドの量の定量測定を含む、ポリペプチド識別インデックスは、識別インデックスを作成するために使用される特定のサンプルの「ポリペプチドプロフィール」であると考えられる。本明細書中で使用されるポリペプチドプロフィールは、ポリペプチド量を含む、特定のサンプルを生成するための、一連のポリペプチド識別コードである。

ポリペプチドプロフィールは、プロテオミクスの方法において有用である。なぜなら、このようなプロフィールは、細胞、組織、器官および生物の間の異なる条件または状態を識別するために使用され得るからである。細胞または組織によって特定の時期に発現されるポリペプチドは、測定の時点での細胞または組織の条件を規定するために使用され得る。従って、異なる状態における同一の細胞型のポリペプチドプロフィールの間の定量的および定性的な相違は、それぞれの状態を診断するために使用され得る。このような比較についての例として、正常細胞に対する腫瘍細胞、異なる代謝条件にある細胞および特定の薬理学的試薬で処置されていない細胞に対する特定の薬理学的試薬で処理された細胞が挙げられる。２つのポリペプチドプロフィールの間の相違は、「差次的ポリペプチドプロフィール」として記載され得る。差次的ポリペプチドプロフィールは、異なる細胞型（例えば、癌性細胞および正常細胞、刺激された細胞および刺激されていない細胞）、または臨床目的の異なる組織サンプル）に由来するサンプル中に含まれるポリペプチドにおける定量的な変化を分析するために有用である。

差次的なポリペプチドプロフィールを生成するための本発明の方法は、体液のようなサンプル中のポリペプチドプロフィールにおける変化を分析するために適用可能である。差次的なポリペプチドプロフィールは、２つの標本のポリペプチドプロフィール（例えば、正常ポリペプチドプロフィールと疾患関連ポリペプチドプロフィール）を比較することによって決定される。例えば、正常な標本状態にある代表的なポリペプチドプロフィールが、生成されそして、異常な状態または疾患状態にあることが疑われる標本と比較され得る。もしくは、疾患状態を代表する参照ポリペプチドプロフィールは、特定の疾患状態を有するかまたは有することが疑われる個体由来の標本と比較され得る。正常状態または疾患状態を代表する参照ポリペプチドプロフィールは、特定の個体または個体群由来の標本を使用して決定され得る。

所望であれば、分析は、個体よりむしろ集団、特に参照集団またはコントロール集団に対して実施され得る。このような参照集団は、未知のサンプルの比較のために用いられ得る。当業者は、本発明の方法の詳細な適用を基に適切な参照集団を決定し得る。本発明の方法は、２つのサンプル、例えば、正常状態および疾患状態の間のポリペプチド発現における差異を同定する差次的ポリペプチドプロフィールを生成するために用いられ得る。参照集団のサイズは、参照個体を選択するために用いられる基準に依存する。選択基準および本発明の方法の詳細な適用に依存して、参照集団は、比較的少数から、何千もの個体を含む多数の個体までであり得る。

詳細に診断された疾患を有するか、疾患の兆候または症状を示す患者からのサンプルの大規模分析は、個々の状態に対する臨床的マーカーまたはマーカーの一団を同定するために有用である。疾患を有する個体からのサンプルを用いて、その疾患に対する定性および／または定量的ポリペプチド識別インデックスを生成し得る。同様に、治療的処置を受けている患者からのサンプルに含まれるポリペプチドの比較分析を用いて、この処置の成功または失敗を示す診断マーカーまたはマーカーの一団を同定し得る。この方法はまた、特定の臨床状態に対する個体の素因を示すために有用なマーカーまたはマーカーの一団の発見またはスクリーニングのために、系統的な、集団−広範囲スケールの、このようなサンプルの分析に適用可能である。

本発明は、ポリペプチド識別インデックスを生成するための方法をさらに提供する。この方法は、（ａ）第１のポリペプチド、またはそのペプチドフラグメントにともなう２つ以上の特徴のセットを決定する工程であって、これら特徴の１つが、このポリペプチドのポリペプチドフラグメントの質量であって、このペプチドフラグメントの質量が質量分析により決定される工程；（ｂ）第２のポリペプチドについて工程（ａ）を繰り返す工程；（ｃ）必要に応じて、上記第１および第２のポリペプチドにともなう１つ以上のさらなる特徴を決定する工程であって、ここで、この決定された特徴が、上記第１および第２のポリペプチドを区別するに十分であり、それによって、第１および第２のポリペプチドに対するポリペプチド識別インデックスを生成する工程を包含する。この方法はさらに、異なるポリペプチドについて、上記工程（ａ）から（ｃ）を１回以上繰り返す工程を包含し得、ここで、上記決定された特徴は、上記ポリペプチドの各々を区別するに十分であり、それによって上記ポリペプチドの各々に対するポリペプチド識別インデックスを生成する。ポリペプチドの特徴を決定することについて、上記ポリペプチド識別インデックスは、本明細書に開示の任意の方法、またはポリペプチドにともなう特徴を決定するための周知の方法のいずれかを用いて決定され得る。このポリペプチド識別インデックスは、必要に応じて、イオン選択の非存在下で質量を決定することにより得られ得る。

ポリペプチド識別インデックスを生成するための本発明の方法は、フラグメントイオンを生成するためにイオン選択の非存在下のポリペプチドまたはフラグメントの質量決定を含み得、そしてさらに、１ｐｐｍより大きい精度（または、所望であれば、なおより低い精度（より高いｐｐｍ））でのフラグメント質量の決定を含み得る。ポリペプチド識別インデックスは、ポリペプチドアミノ酸配列を含み得るが、ポリペプチド識別インデックスを生成するため、またはポリペプチド識別インデックスを用いてポリペプチドを同定するための本発明の方法を実施するために、ポリペプチドまたはフラグメントが配列決定される必要はない。

本発明はさらに、ポリペプチドを同定する方法を提供する。この方法は、（ａ）ポリペプチドの集団から親ポリペプチドのサブセットの質量、および親ポリペプチドのサブセットのペプチドフラグメントの質量を同時に決定する工程；（ｂ）決定された質量をポリペプチド識別インデックスに対して比較する工程；および（ｃ）測定された質量を有するポリペプチド識別インデックスの１つ以上のポリペプチドを同定する工程を包含する。このポリペプチド識別インデックスは、注釈されたポリペプチドインデックスであり得る。この方法はさらに、（ｄ）１つ以上の親ポリペプチドにと関連する１つ以上のさらなる特徴を決定する工程；（ｅ）上記ポリペプチド識別インデックスに対して工程（ａ）および工程（ｄ）で測定された特徴を比較する工程；および（ｆ）必要に応じて、工程（ｄ）および（ｅ）を１回以上繰り返す工程であって、ここで、上記ポリペプチド識別インデックス中の単一ポリペプチドとして親ポリペプチドを同定する特徴のセットが決定される工程を包含し得る。この方法はさらに、ポリペプチドを含むサンプル中の同定されたポリペプチドの量を定量する工程を包含し得る。本明細書に開示されるように、本発明の上記の方法およびその他の方法は、特別の質量精度で実施され得る。ポリペプチド識別インデックス中の単一ポリペプチドとしての親ポリペプチドの同定は、十分な数の特徴を決定することをいい、その結果、上記ポリペプチド識別インデックス中の特定のポリペプチドが、上記決定された特徴に一致、すなわち、ポリペプチドが同定される。

ポリペプチドを同定するための本発明の方法は、ポリペプチドの集団から親ポリペプチドのサブセットの質量、および親ポリペプチドのサブセットのポリペプチドフラグメントの質量を同時に決定する工程を包含する（実施例ＩＩＩを参照のこと）。親ポリペプチドのサブセットの質量の同時決定は、ポリペプチド集団を含む単一サンプルからの親ポリペプチド質量値のサブセットの獲得をいう。用語「同時」は、親ポリペプチドおよびポリペプチドフラグメントの質量を、用いたＭＳ法が、親質量およびフラグメント質量が同じサブセットのポリペプチドに関連付けられ得るに十分な時間フレームで親ポリペプチドおよび対応するフラグメントの質量を獲得し得るように同時に決定されることを意図する。例えば、ＭＳ法でサンプリングされるポリペプチドは、カラムの流速により指示されるように、異なるサブセットのポリペプチドが、クロマトグラフィーカラムから溶出するので、経時的に変動する。同時決定は、特定のサブセットのポリペプチドが、さらなるポリペプチドの導入またはオンラインサンプリング法の結果として生じるポリペプチドサブセットのポリペプチドの損失に起因して改変される前の時間の間に生じる。

ポリペプチドのサブセットの質量の同時決定は、例えば、質量決定のための単一イオンの選択の非存在下で実施され得る。例えば、単一イオンよりむしろ、いくつかのポリペプチドが選択され得る（Ｍａｓｓｅｌｏｎら、Ａｎａｌ．Ｃｈｅｍ．７２：１９１８−１９２４（２０００））。好ましくは、本発明の方法では、５より多いイオン、例えば、６イオン、７イオン、８イオン、９イオン、１０イオン、またはそれより多い数のイオンが選択される。このような場合、好ましくは、上記ポリペプチド識別インデックスは、注釈されたポリペプチドインデックスである。

あるいは、ポリペプチドのサブセットの質量の同時決定は、単一イオン選択の非存在下または供給源領域中のイオン選択の非存在下で実施され得る（図２を参照のこと）。このような場合、得られるフラグメントイオンが解析されて、どのイオンが特定の親ポリペプチドにともない、そしてそれ故、親ポリペプチドと関連する特徴として有用であるかを決定する。このような方法は、標準的なＭＳ法におけるフラグメント化について選択されないあまり豊富でないイオンの検出および同定に有用であり得る。

ポリペプチド質量およびポリペプチドフラグメント質量を同時に得るために有用な質量分析法は、ＥＳＩ−ＴＯＦでのイン−ソースＣＩＤである。この方法は、親イオンとイン−ソースＣＩＤ走査との間を連続的に交互することを含む。イン−ソースＣＩＤ走査は、複数にフラグメント化された親イオンの存在下でさえ、所定の親イオンに追跡し得る特定のフラグメントイオンを提供する。親フラグメントイオン系統は、適切なソフトウェアを用いて質量分析法データの解析により決定され得る。より低い精度の測定を提供するＭＳ器具（例えば、ＥＳＩ−ＴＯＦ）は、ポリペプチド同定のために特有の制限を提供するために有利に用いられ得る。

本発明はさらに、ポリペプチドを同定するための方法を提供する。この方法は、（ａ）このポリペプチド、またはそのフラグメントと関連する２つ以上の特徴を決定する工程であって、これら特徴の１つはこのポリペプチドのフラグメントの質量であり、このフラグメント質量が、フラグメントイオンを生成するためのイオン選択の非存在下で質量分析法により決定される工程；（ｂ）このポリペプチドと関連する特徴を、ポリペプチド識別インデックスに対して比較する工程；および（ｃ）これら特徴を有するポリペプチド識別インデックスにおける１つ以上のポリペプチドを同定する工程を包含する。この方法はさらに、（ｄ）このポリペプチドと関連する１つ以上のさらなる特徴を決定する工程；ならびに（ｅ）工程（ａ）および工程（ｄ）で決定された特徴を、上記ポリペプチド識別インデックスに対して比較する工程を包含し得る。本発明のその他の方法のように、この方法は、サンプル中の同定されたポリペプチドの量を定量する工程を包含し得る。これら方法はまた、特定の質量精度で実施され得る。

従って、本発明はまた、ポリペプチドを同定する方法を提供する。この方法は、（ａ）このポリペプチド、またはそのフラグメントと関連する２つ以上の特徴を決定する工程であって、これら特徴の１つはこのポリペプチドのフラグメントの質量であり、このフラグメント質量が、２．５ｐｐｍより大きいｐｐｍの精度で質量分析法により決定される工程；（ｂ）このポリペプチドと関連する特徴を、ポリペプチド識別インデックスに対して比較する工程；および（ｃ）これらの特徴を有するポリペプチド識別インデックスにおいて１つ以上のポリペプチドを同定する工程を包含する。この方法はさらに、（ｄ）このポリペプチドと関連する１つ以上のさらなる特徴を決定する工程；および（ｅ）工程（ａ）および工程（ｄ）で決定された特徴を、上記ポリペプチド識別インデックスに対して比較する工程を包含する。この方法はまた、より低い精度（より高いｐｐｍ）で実施され得る。

本明細書中に開示されるように、親タンパク質は、（１）システイン含量、（２）正確なペプチド質量および（３）特定イオンの選択なしの正確なペプチドフラグメント質量の組合せから同定された（実施例ＩＶを参照のこと）。この特定の例ではシステイン含量が用いられたが、システイン含量が決定される特徴である必要はない。伝統的なタンデムＭＳとは対照的に、ＭＳに一緒に入るすべてのペプチドは、個々のイオンの選択なしにフラグメント化された。同時にフラグメント化された２つのペプチドのすべてのフラグメントイオンが、タンデムＭＳ（ここでは、フラグメントイオンが、一度に単一ペプチドについて測定される）とは対照的に、一緒に測定された。

本発明の方法は、ポリペプチドと関連する特徴を決定する工程を包含する。ポリペプチドを含むサンプルは、ポリペプチドを含む単離されたポリペプチド混合物のように単純、または生物中で発現されたポリペプチドの本質的にすべてを含むサンプルのような複雑であり得る。さらに、サンプルは、所望であれば、本明細書に開示の方法を用いて分画され得る。

ポリペプチドは、種々の供給源から単離されたサンプル中に存在し得る。例えば、ポリペプチドサンプルは、任意の生物学的流体、細胞、組織、器官もしくはその部分、または任意の種の生物から調製され得る。サンプルは、個体中に存在し得るか、または個体から得られ得るかそれに由来し得る。例えば、サンプルは、生検により得られた標本の組織学的切片、または組織培養中に配置されるか、もしくはそれに適合されている個体から単離された細胞であり得る。サンプルはさらに、亜細胞画分または抽出物であり得る。サンプルは、本明細書に記載の方法のような、ポリペプチド溶解性を維持するために適切な当該分野で公知の方法により調製され得る。

標本は、特に、個体から得られるサンプルをいう。標本は、流体または組織標本とし個体から得られ得る。例えば、組織標本は、皮膚生検、組織生検または腫瘍生検のような生検として得られ得る。流体標本は、血液、血清、尿、唾液、脳脊髄液またはその他の体液であり得る。流体標本は、本発明の方法では特に有用である。なぜなら、流体標本は、個体から容易に得られ得るからである。標本の収集の方法は、当業者に周知である（例えば、ＹｏｕｎｇおよびＢｅｒｍｅｓ、ＴｉｅｔｚＴｅｘｔｂｏｏｋｏｆＣｌｉｎｉｃａｌＣｈｅｍｉｓｔｒｙ、第３版、ＢｕｒｔｉｓおよびＡｓｈｗｏｏｄ編、Ｗ．Ｂ．Ｓａｕｎｄｅｒｓ、Ｐｈｉｌａｄｅｌｐｈｉａ、第２章、４２−７２頁（１９９９）を参照のこと）。

本発明の方法において用いられるポリペプチドは、細胞、組織、器官または生物のような供給源から得られ得る。細胞を溶解するために種々の方法が当該分野で公知である。例えば、細胞は、変性剤、凍結および融解の１つ以上のサイクル、音波処理などにより溶解され得る。溶解の後、ポリペプチド混合物を、画分工程に供し得、例えば、核酸または脂質を除去するか、またはインタクトな亜細胞画分またはオルガネラを除去する。細胞を溶解および分画する方法は、当業者に周知である（Ｓｃｏｐｅｓ、前述、１９９３を参照のこと）。

ポリペプチドの同定には、サンプルまたは標本は、例えば、ドデシル硫酸ナトリウム（ＳＤＳ）のような変性剤を含む界面活性剤を含む緩衝液のような、ポリペプチドの溶解性を維持するために適切な緩衝液中に含まれ得る。ポリペプチド可溶化に有用な変性剤は、例えば、グアニジン−ＨＣｌ、グアニジン−イソチオシアナート、尿素などを含む。グアニジン−イソチオシアナートの場合、ポリペプチドの共有結合を改変し得る任意の試薬を用いた処理でのように、このような試薬は、サンプルが比較されるポリペプチド同定標識が、同じポリペプチドの比較のために十分なサンプルと実質的に同じ様式で調製されている限り、用いられ得る。当該分野で周知であるその他の変性剤が、ポリペプチドを可溶化するために同様に用いられ得る。さらに、ジチオスレイトール（ＤＴＴ）、ジチオエリスリトール（ＤＴＥ）、またはメルカプトエタノールのような還元剤が含まれ得る。

必要に応じて、本発明の方法は、タンパク質分画工程を包含し得る。タンパク質分画は、ポリペプチド集団から１つ以上のポリペプチドを除去するために有用な任意の方法をいう。分画は、例えば、不溶性成分から可溶性成分を分離する遠心分離工程、電気泳動の方法、クロマトグラフィーの方法、または開示された任意の方法を包含し得る。クロマトグラフィー分離には、当該分野で周知の広範な種類のクロマトグラフィー媒体を用いて、ポリペプチド集団を分離し得る。例えば、ポリペプチドは、クロマトグラフィー媒体に関連する、サイズ、電荷、疎水性、特定の色素および（親和性リガンドを含む）その他の成分への結合に基づいて分離され得る。サイズ排除、ゲル濾過およびゲル透過樹脂は、サイズに基づくポリペプチド分離に有用である。電荷ベースの分離のためのクロマトグラフィー媒体の例は、強および弱アニオン交換、ならびに強および弱カチオン交換樹脂である。疎水性または逆相クロマトグラフィーもまた用いられ得る。

アフィニティークロマトグラフィーもまた、用いることができ、例えば、Ｃｉｂａｃｒｏｎｂｌｕｅのような色素結合樹脂、ＡＴＰ、ＮＡＤなどのようなコファクターのアナログを含む基質アナログ、リガンド、ポリクローナルまたはモノクローナルいずれかの特異的抗体などを含む。例示のアフィニティー樹脂は、本明細書に開示のような、ポリペプチド上のビオチンタグに結合するアビジン樹脂のようなポリペプチド中に取り込まれ得る特異的部分に結合する親和性樹脂を含む。特定のクロマトグラフィー媒体の解像度および能力は、当該分野で公知であり、そして当業者によって決定され得る。同様に、特定の適用のための特定のクロマトグラフィー分離の有用性は、当業者により評価され得る。

当業者は、特定のサンプルサイズまたは組成物について適切なクロマトグラフィー条件を決定し得、そして規定された緩衝液、カラム寸法、流速、温度、およびその他の条件下で、クロマトグラフィー分離のための再現性ある結果を得る方法を知っている。必要に応じて、タンパク質分画法は、例えば、特定のクロマトグラフィー適用またはその他の分画工程の再現性を評価するために、内部標準の使用を含み得る。適切な内部標準は、クロマトグラフィー媒体または分画工程に依存して変化する。当業者は、クロマトグラフィーまたは分画工程の方法に適用可能な内部標準を決定し得る。

ポリペプチドタグ化は、ポリペプチドサンプルの複雑性を減少させ、データベース検索の拘束を提供し、そしてポリペプチドの定量的な比較を可能にするための本発明の方法に有用である。ポリペプチドサンプルの複雑性は、そのタグを含むポリペプチドの部分集団を単離するために使用され得る親和性タグでポリペプチドをタグ化することによって減少され得る。例えば、ポリペプチドおよびフラグメントの集団は、比較的まれなアミノ酸（例えば、システイン）上で標識され得るか、または翻訳後修飾に基づいて標識され得、そしてこのタグを含むポリペプチドおよびフラグメントの部分集団が、単離され得る。従って、特定のアミノ酸を標識することにより単離されたポリペプチドおよびフラグメントの部分集団は、既知のアミノ酸を有する。本明細書中に記載されるように、既知のアミノ酸は、データベース検索の拘束に有用な部分的アミノ酸組成を構成する。定量的なポリペプチドの比較は、２つのポリペプチドまたはポリペプチド集団を差次的に標識することによって、実施され得る。ポリペプチドタグ化の任意の他の方法が、ポリペプチドの比較のために同様に適用され得るが、ＩＣＡＴ^ＴＭ型親和性試薬またはＩＤＥｎＴ型試薬（以下により詳細に記載される）が、この目的のために特に有用である。

ポリペプチドタグ化は、当該分野において公知の種々の方法を用いて実施され得る。ポリペプチドタグ化またはポリペプチド修飾のための試薬は、リンカー領域により隔てられた種々の成分を含み得る。ポリペプチドタグ化試薬の成分は、ポリペプチド特定の化学基を改変する反応基、（例えば、質量分析によって）検出され得る部分、およびポリペプチド単離のために使用される親和性タグを含み得る。ポリペプチドタグ化試薬の２つの例（ＩＣＡＴ^ＴＭ型およびＩＤＥｎＴ）は、以下に詳細に記載されるが、所望される場合、任意の型のポリペプチドタグが使用され得る。

２つのポリペプチド集団を定量的に比較するための本発明の方法は、同位体コード親和性タグ（ＩＣＡＴ^ＴＭ）法（Ｇｙｇｉら、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌ．１７：９９４−９９９（１９９９）；ＷＯ００／１１２０８（これらの各々は、本明細書中に参考として援用される））の使用を包含し得る。ＩＣＡＴ^ＴＭ型試薬は、さらに、定量的比較を含まないポリペプチドタグ化適用に有用であり得る。ＩＣＡＴ^ＴＭ型試薬法は、質量分析を用いて容易に識別される同位体（例えば、水素および重水素）を用いて差次的に標識され得る親和性タグを使用する。ＩＣＡＴ^ＴＭ型親和性試薬は、３つの要素（親和性タグ、リンカー、および反応基）からなる。

ＩＣＡＴ^ＴＭ型親和性試薬の１つの要素は、この親和性タグの同種の結合パートナーに結合することによって親和性試薬にカップリングしたペプチドの単離を可能にする親和性タグである。特に有用な親和性タグは、ビオチンであり、ビオチンは、その同種の結合パートナーであるアビジン、または関連する分子（例えば、ストレプトアビジン）に高い親和性で結合し、従って、さらなる生化学的操作に対して安定である。このＩＣＡＴ^ＴＭ型親和性試薬にカップリングしたペプチドの単離を可能にするのに十分な、その同種の結合パートナーへの結合親和性を提供する限り、任意の親和性タグが、使用され得る。親和性タグはまた、磁性ビーズまたは磁性親和性タグの単離に適する他の磁性形式を用いて、タグ化されたペプチドを単離するために使用され得る。ＩＣＡＴ^ＴＭ型親和性試薬法、またはペプチドを親和性タグ化する他の任意の方法において、共有結合トラッピングの使用が、所望される場合、タグ化されたペプチドを固体支持体に結合させるために使用され得る。

ＩＣＡＴ^ＴＭ型親和性試薬の第２の要素は、リンカーであり、このリンカーは、安定な同位体を組み込み得る。このリンカーは、検体ポリペプチドへの反応基の結合および同種の結合パートナーへの親和性タグの結合を可能とするのに十分な長さを有する。このリンカーはまた、１つ以上の元素での安定な同位体の組み込みを可能とするのに適切な組成を有する。特に有用で安定な同位体の対は、水素および重水素であり、これらは、質量分析を用いて、各々、軽形態（ｌｉｇｈｔｆｏｒｍ）および重形態（ｈｅａｖｙｆｏｒｍ）として容易に識別され得る。この重形態および軽形態が、質量分析を用いて容易に識別され得る限り、多数の同位体元素のいずれもが、このリンカーへと組み込まれ得る。例示的なリンカーとしては、４，７，１０−トリオキサ−１，１３−トリデカンジアミンベースのリンカーおよびその関連する重水素化形態である２，２’，３，３’，１１，１１’，１２，１２’−オクタジュウテリオ−４，７，１０−トリオキサ−１，１３−トリデカンジアミン（Ｇｙｇｉら、（前出、１９９９）により記載される）が挙げられる。当業者は、上記の基準を満たす、ＩＣＡＴ^ＴＭ型親和性試薬中で有用な多数の適切なリンカーのいずれかを容易に決定し得る。

ＩＣＡＴ^ＴＭ型親和性試薬の第３の要素は、反応基であり、この反応基は、検体中のポリペプチドに共有結合し得る。ポリペプチド中の側鎖アミノ酸を改変する方法は、当業者に周知である（例えば、Ｇｌａｚｅｒら、ＬａｂｏｒａｔｏｒｙＴｅｃｈｎｉｑｕｅｓｉｎＢｉｏｃｈｅｍｉｓｔｒｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ：ＣｈｅｍｉｃａｌＭｏｄｉｆｉｃａｔｉｏｎｏｆＰｒｏｔｅｉｎｓ、Ｃｈａｐｔｅｒ３、ｐｐ．６８−１２０、ＥｌｓｅｖｉｅｒＢｉｏｍｅｄｉｃａｌＰｒｅｓｓ、ＮｅｗＹｏｒｋ（１９７５）；ＰｉｅｒｃｅＣａｔａｌｏｇ（１９９４）、Ｐｉｅｒｃｅ、ＲｏｃｋｆｏｒｄＩＬを参照のこと）。この反応基が、ポリペプチドに共有結合する限り、種々の反応基のいずれもが、ＩＣＡＴ^ＴＭ型親和性試薬に組み込まれ得る。例えば、ポリペプチドは、スルフヒドリル反応基を介してＩＣＡＴ^ＴＭ型親和性試薬に結合し得る（この試薬は、ポリペプチド中のシステインの遊離のスルフヒドリルまたは還元されたシステインと反応し得る）。例示的なスルフヒドリル反応基としては、Ｇｙｇｉら（前出、１９９９）に記載されるようなヨードアセトアミド基が挙げられる。他の例示的なスルフヒドリル反応基としては、マレイミド、アルキルハライドおよびアリールハライド、α−ハロアシルならびにピリジルジスルフィドが挙げられる。所望される場合、このポリペプチドは、ＩＣＡＴ^ＴＭ型親和性試薬と反応する前に、還元され得る。このことは、そのＩＣＡＴ^ＴＭ型親和性試薬がスルフヒドリル反応基を含む場合に、特に有用である。

反応基はまた、Ｌｙｓのようなアミン、例えば、イミドエステル、およびＮ−ヒドロキシスクシンイミジルエステルと反応し得る。反応基はまた、ＡｓｐもしくはＧｌｕ中に見出されるカルボキシル基と反応し得るか、または、この反応基は、他のアミノ酸（例えば、Ｈｉｓ、Ｔｙｒ、Ａｒｇ、およびＭｅｔ）と反応し得る。反応基はまた、ホスホペプチドの選択的な標識のためのリン酸基、または他の共有結合的改変されたペプチド（糖ペプチド、リポペプチド、または本明細書中に開示される任意の共有結合的ポリペプチド改変体（ｍｏｄｉｆｉｃａｔｉｏｎ）のいずれかを含む）と反応し得る。当業者は、本発明の方法に用いるための検体分子の修飾に最適な条件を得るために、種々の試薬、インキュベーション条件およびインキュベーション時間を用いることによって、検体分子を修飾するための条件を容易に決定し得る。

ＩＣＡＴ^ＴＭ型試薬法は、ＩＣＡＴ^ＴＭ型親和性試薬を用いた、ポリペプチドのような検体分子の誘導体化に基づく。２つのサンプルの比較および／または定量のために、コントロール参照検体および試験される個体由来の検体が、ＩＣＡＴ^ＴＭ型親和性試薬の軽形態および重形態を用いて差次的に標識される。この誘導体化された検体は、合わせられ、そしてこの誘導体化分子は、切断されて、フラグメントを生じる。例えば、ポリペプチド分子は、１つ以上のプロテアーゼを用いて、ペプチドフラグメントへと酵素的に切断され得る。ポリペプチドの切断に有用な例示的プロテアーゼとしては、トリプシン、キモトリプシン、ペプシン、パパイン、Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ（Ｖ８）プロテアーゼなどが挙げられる。ポリペプチドはまた、例えば、ＣＮＢｒ、酸または他の化学試薬を用いて化学的に切断され得る。

一旦フラグメントに切断されると、ＩＣＡＴ^ＴＭ型親和性試薬を用いて誘導体化されたタグ化フラグメントは、親和性タグを介して単離される（例えば、ビオチン化フラグメントは、固体相中またはクロマトグラフ形式中のアビジンに結合することによって単離され得る）。所望される場合、この単離されたタグ化フラグメントは、１つ以上の代替的な分離技術（イオン交換クロマトグラフィー、逆相クロマトグラフィー、サイズ排除アフィニティークロマトグラフィーなどを含む）または電気泳動技術（等電集束法を含む）を用いてさらに分画され得る。例えば、この単離されたタグ化フラグメントは、高速液体クロマトグラフィー（ＨＰＬＣ）（マイクロキャピラリーＨＰＬＣを含む）によって分画され得る。

これらのフラグメントは、質量分析（ＭＳ）を用いて分析される。これらの検体分子は、軽親和性タグおよび重親和性タグを用いて差次的に標識されているので、これらのペプチドフラグメントは、ＭＳで識別され得、コントロール参照検体および試験検体由来の各々のペプチドフラグメントの相対量の並行（ｓｉｄｅ−ｂｙ−ｓｉｄｅ）比較が可能である。所望される場合、ＭＳはまた、対応する標識されたペプチドを配列決定するために使用され得、このことは、このタグ化ペプチドフラグメントに対応する分子の同定を可能にする。

ＩＣＡＴ^ＴＭ型試薬法の利点は、軽ＩＣＡＴ^ＴＭ型試薬および重ＩＣＡＴ^ＴＭ型試薬でタグ化したペプチドの対が、化学的に同一であり、したがって、正確な定量のための相互内部標準としての役割を果たす（Ｇｙｇｉら、前出、１９９９）ことである。ＭＳを用いて、重タグ化フラグメントおよび軽タグ化フラグメントの対のうちの低い方の質量成分と高い方の質量成分との間の強度の比は、これらのペプチドフラグメントの相対量の正確な尺度を提供する。従って、このＩＣＡＴ^ＴＭ型試薬法は、所望される場合、差次的に発現されるポリペプチドを同定するために簡便に使用され得る。

ＩＤＥｎＴ試薬は、特定のタンパク質の官能基に同位体タグを導入することによりポリペプチドを修飾するために、使用され得る。例示的なＩＤＥｎＴ試薬は、Ｇｏｏｄｌｅｔｔら、前出、２０００に記載される。ＩＤＥｎＴ試薬は、質量分析計において特有の信号を生じる同位体分布を有する少なくとも１つの要素を含む。例えば、ＩＤＥｎＴ試薬は、塩素、重水素、または別の要素（放射性の要素を含む）を含み得る。ＩＤＥｎＴ試薬は、ポリペプチド中の少量のアミノ酸（例えば、システイン）に結合するように設計され得る。ＩＤＥｎＴタグを用いたポリペプチドの標識は、ポリペプチドフラグメント質量を用いてポリペプチド識別インデックスを検索するための拘束を提供することによって、本発明の方法に適用され得る。

タンパク質切断またはタンパク質フラグメント化は、データベース検索のための拘束を提供するための本発明の方法に有用である。ポリペプチドフラグメント化は、配列特異的または配列非特異的であり得る。配列特異的ポリペプチド切断は、既知のアミノ酸を含むポリペプチドフラグメントを得るという利点を提供し、この配列特異的ポリペプチド切断は、データベース検索を拘束するために用いられ得る。非特異的ポリペプチド切断を実施するために有用な試薬の例は、パパイン、ペプシン、およびプロテアーゼＳｇである。これらのプロテアーゼは、その反応条件を変化させることにより、所望される程度のタンパク質フラグメント化（例えば、１つのポリペプチドからの約２〜４つのポリペプチドフラグメントの生成）を達成するために用いられ得る。これらのプロテアーゼを用いるための条件は、当該分野において周知である。配列特異的なポリペプチド切断を実施するために有用な試薬の例は、トリプシン、Ｖ−８プロテアーゼ、ｏ−ヨードソ（ｉｏｄｏｓｏ）安息香酸、臭化シアン、および酸である。

本発明はまた、ポリペプチドの集団から１つのポリペプチドを同定するためのポリペプチド識別インデックスを提供する。このインデックスは、このインデックス中にポリペプチドに関連する注釈された特徴のセットを含み、これらの特徴のうちの１つは、このポリペプチドのフラグメントの質量であり、このフラグメントの質量は、フラグメントイオンを生成するためのイオンの選択をすることなく、質量分析により決定される。これらの特徴は、このインデックス中の他のポリペプチドからこのポリペプチドの１つを区別するのに十分である。ポリペプチド識別インデックスは、２つ以上のポリペプチド、３つ以上のポリペプチド、５つ以上のポリペプチド、１０以上のポリペプチド、２０以上のポリペプチド、５０以上のポリペプチド、１００以上のポリペプチド、１５０以上のポリペプチド、２００以上のポリペプチド、５００以上のポリペプチド、１０００以上のポリペプチド、２０００以上のポリペプチド、５０００以上のポリペプチド、または１０，０００以上のポリペプチドについての特徴さえも含み得る。ポリペプチド識別インデックスはまた、サンプル中のポリペプチドの実質的に全てを含み得る。例えば、ポリペプチド識別インデックスは、ゲノム（例えば、ウイルスゲノム、細菌ゲノム、植物ゲノム、または動物ゲノム（ヒト、非ヒト霊長類、マウス、ラット、ウシ、ヤギ、ウサギ、または他の哺乳動物種のような哺乳動物のゲノムを含む））中で発現されるポリペプチドの実質的に全てを含み得る。ポリペプチド識別インデックス中のポリペプチドの数は、ユーザーの必要性に依存し、そしてポリペプチドを同定するために用いられるサンプル供給源およびサンプル中のポリペプチド発現の複雑性に依存して変化する。Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒについてのポリペプチド識別インデックスの作成の例が、本明細書中に開示される（実施例Ｖを参照のこと）。

このポリペプチド識別インデックスは、生物全体または生物中の特定の組織もしくは細胞に関し得るか、または所望される場合、特定の亜細胞画分（例えば、オルガネラ）に関し得る。従って、試験されるサンプルに適用される複雑性の減少と同様に、特定の標的（例えば、生物、組織、細胞、または亜細胞画分）に関するポリペプチド識別インデックスは、特定の適用における特定のポリペプチドの同定のための検索の単純化に有用であり得る。例えば、特定のポリペプチドもしくはポリペプチドの群の発現、またはこのポリペプチドの発現の量が、特定の状態（例えば、疾患状態）に相関している特定の診断適用において、関連する標的に関するポリペプチド識別インデックスの使用が、用いられ得る。例えば、一群の核タンパク質が、癌細胞中で過剰発現されることが公知である場合、核タンパク質に関連するポリペプチド識別インデックスの使用が、本明細書中に開示される定量方法を用いて、個体由来のサンプル中の核タンパク質の過剰発現について試験するために、用いられ得る。さらに、標的化ポリペプチド識別インデックスの作成および関連する疾患サンプルに対する比較が、異常に発現されるポリペプチドを同定するために用いられ得、これらは、次いで、本明細書中に開示されるような診断適用に用いられ得る。

本発明は、そのインデックスのポリペプチド（またはそれらのフラグメント）に関連する２つ以上の特徴を含む、そのインデックスのポリペプチドに関連する注釈された特徴のセットを含むポリペプチド識別インデックスをさらに提供し、これらの特徴のうちの１つは、このポリペプチドのフラグメントの質量であり、このフラグメント質量は、フラグメントイオンを生成するためのイオンの選択をすることなく質量分析によって決定され、ここでこの質量は、１ｐｐｍより大きいｐｐｍで正確に決定される。

所望される場合、ポリペプチド識別インデックスは、コンピューター読み取り可能な媒体に簡便に保存され得る。従って、本発明は、本発明のポリペプチド識別インデックス（例えば、注釈されたポリペプチドインデックス）を含む、コンピューター読み取り可能な媒体を提供する。ポリペプチド識別インデックスを含むこのようなコンピューター読み取り可能な媒体は、ポリペプチドの特徴と、このポリペプチド識別インデックスとの比較に有用であり、この比較は、コンピューター装置上で簡便に実施され得る。ポリペプチド識別インデックスが簡便に保存され得、かつサンプル中のポリペプチドの特徴および／またはサンプル中のポリペプチドの定量的量に対する比較のためにアクセスされ得るので、コンピューター装置の使用は、簡便である。ポリペプチド識別インデックスは、適切なハードウェア、ソフトウェア、および／またはネットワークを用いて（例えば、ネットワーク（インターネットを含む）に接続されたハードウェアを用いて）簡便にアクセスされ得る。

種々のハードウェア、ソフトウェア、およびネットワークの組み合わせを使用することによって、ポリペプチドについて決定された特徴をポリペプチド識別インデックスに対して比較する工程を含む本発明の方法は、種々のコンフィギュレーションで簡便に実施され得る。従って、本発明は、本発明の工程に対応するコンピューター実行可能な工程を実施するためのコンピューター装置をさらに提供する。例えば、単一のコンピューター装置は、ポリペプチドについて決定された特徴をポリペプチド識別インデックスに対して比較するコンピューター実行可能な工程を実施するための指示、ポリペプチド識別インデックス、およびこのポリペプチドについて決定された特徴が、このポリペプチド識別インデックスにおける１つ以上のポリペプチドに対応するか否かを決定するための指示を含み得る。

あるいは、このコンピューター装置は、このポリペプチド識別インデックスが、別個の媒体に保存されている一方で、本発明の方法の工程を実行するための指示を含み得る。さらに、ポリペプチドが、このポリペプチド識別インデックスにおける１つ以上のポリペプチドに対応するか否かを決定するための指示は、別個のコンピューター装置もしくは別個の媒体に含まれ得るか、または本方法のコンピューター実行可能な工程を含むコンピューター装置および／もしくは別個の媒体のデータベースと組み合わせられ得る。このような別個のコンピューター読み取り可能な媒体は、別のコンピューター装置、保存媒体（例えば、フレキシブルディスク、Ｚｉｐディスク）またはサーバー（例えば、ファイルサーバー）であり得、これらは、搬送波（例えば、電磁搬送波）によってアクセス可能であり得る。従って、ポリペプチド識別インデックスを含むコンピューター装置またはこのポリペプチド識別インデックスが保存されるファイルサーバーは、インターネットのようなネットワークを介して遠隔でアクセス可能である。当業者は、本発明のコンピューター装置の相互接続を可能にする適切なハードウェア、ソフトウェア、またはネットワークインターフェースを知っているか、またはそれらを容易に決定し得る。

所望される場合、ポリペプチド識別インデックスを用いてポリペプチドを同定する効率を最適化および増加させるために、アルゴリズムが用いられ得る。例えば、上記のように、ポリペプチド識別インデックスのサブインデックスが決定され得、そしてこのサブインデックスは、比較されるデータベースのサイズを減少させることによって、ポリペプチドをさらに同定するために使用され得る。サブインデックスを用いることによるこのような減少は、データベース検索のためのコンピューターの時間を減少させ得る拘束を提供する。当業者は、データベース検索の効率を増加させるための種々の方法を認識する。

アルゴリズムを用いて、質量スペクトルデータの分析効率を改善し得る。例えば、タンデム質量スペクトルにおける相補的イオンの存在を用いて、親イオンの質量をより正確に計算するアルゴリズムを開発し得る。これは、スコア付けを改善し、そしてペプチド質量許容範囲を、アイソバリックデータベースペプチドのより小さなサブセットへと狭めることによって検索時間を低減する。プロテオーム適用範囲を増大させるために、イオントラップにおけるＥＳＩ−ＭＳ／ＭＳは、明白なペプチド電荷状態の決定が除外されて、全てのペプチドのタンデム質量スペクトルを［Ｍ＋２Ｈ］２＋および［Ｍ＋３Ｈ］３＋として２回検索させるように行われ得る。最良のスコアを生じる電荷状態が保持され、他のものは捨てられる。データベース検索の前に電荷状態を決定するアルゴリズムを用いて、処理量を増大させ得る。スペクトルの品質を測定するルーチンを用いて、データベース検索の前および後でのスペクトルのカタログ化を可能にし得る。これは、検索前に乏しいスペクトルを捨てることによって処理量を増大させ、そしておそらく予想外の翻訳後修飾に起因して、本明細書中に開示されるように、良好なデータベース一致を生じることができない「良好な品質」のスペクトルについての分析の追跡を可能にする。

本発明の種々の実施形態の活性に実質的に影響を与えない改変もまた、本明細書中に提供される本発明の定義内に含まれることが理解される。従って、以下の実施例は、本発明を例示することを意図するが、本発明を限定することは意図しない。

（実施例Ｉ：注釈されたポリペプチドインデックスの作成）
本実施例は、注釈されたポリペプチドインデックスの作成およびサンプル中のポリペプチドを同定するための注釈されたポリペプチドインデックスの使用を記載する。

注釈されたポリペプチド（ＡＰ）インデックス（注釈されたペプチドタグ（ＡＰＴ）インデックスまたはデータベースとも呼ばれる）の構成要素は、調査している種、細胞または組織によって産生されるタンパク質の配列特異的な化学的または酵素的断片化によって作成される特異的な構造の特徴を有する、本質的に全てのペプチドまたは選択されたペプチドの配列である。各ペプチドは、実験によって容易に決定され、そして注釈されたペプチドとこのペプチドを誘導したタンパク質との間の明白な相関を可能にする、属性または特徴について注釈が付けられる。

例示的なＡＰインデックスの作成は、以下の特定の工程を含み得る：タンパク質を回収する工程；タンパク質を、同位体コード化アフィニティータグ（ＩＣＡＴ^ＴＭ）型試薬で標識する工程；タンパク質を分子量によって分画する工程；タンパク質を、プロテアーゼ（例えば、トリプシン）で消化してペプチドを作製する工程；ペプチドを、クロマトグラフィー（例えば、イオン交換クロマトグラフィー）によって分離する工程；各イオン交換画分を、（例えば、ＩＣＡＴ^ＴＭ型アフィニティータグに基づく）アフィニティークロマトグラフィーによって精製する工程；各アフィニティークロマトグラフィー画分を、ＬＣ／ＭＳ／ＭＳまたはＣＥ／ＭＳ／ＭＳによって分析する工程；個々のＭＳ／ＭＳペプチドスペクトルのデータベース検索を介する、発現された本質的に全てのタンパク質を同定する工程；および測定した物理化学的特性に基づいて、個々のペプチドについての、従って、そのペプチドの親タンパク質についての独特のバーコードを構成する注釈されたペプチドタグのデータベースを作製する工程。

ＡＰインデックスを、以下の通りに作成し得る：（ｉ）タンパク質サンプルの調製；（ｉｉ）タンパク質タグ化；（ｉｉｉ）任意のタンパク質分画；（ｉｖ）タンパク質断片化；（ｖ）ペプチド分離；（ｖｉ）タグ化ペプチドのアフィニティー単離；（ｖｉｉ）高分解能ペプチド分離；（ｖｉｉｉ）データベース検索；（ｉｘ）ＡＰインデックス（ＡＰＴデータベース）構築。

（ｉ）タンパク質サンプル調製。定量的プロテオーム分析が実施されるべきであるタンパク質サンプル（例えば、細胞、組織、細胞画分、体液、細胞分泌物など）を、タンパク質の可溶性を維持するために、標準的プロトコルを用いてそれぞれの供給源から単離する。

（ｉｉ）タンパク質タグ化。サンプル中のタンパク質を、完全に変性させ、還元し、そして還元されたシステイン残基の側鎖を示す全てのスルフヒドリル基を、それぞれ、以前（Ｇｙｇｉら，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌ．１７：９９４−９９９（１９９９））に記載された条件を用いて、軽い形態または重い形態のスルフヒドリル特異的ＩＣＡＴ^ＴＭ型試薬で共有結合的に誘導体化する（図３を参照のこと）。システインタグ化は、この方法の特に有用な実施であるが、タンパク質中の化学基について特異性を有する任意の他の化学的反応もまた適用され得る。

（ｉｉｉ）任意のタンパク質分画。タグ化タンパク質の混合物を、既知の標準的なタンパク質分離手順のうちのいずれか１つを用いて分画する。適用される手順は、再現性があり、タンパク質を溶液中に維持し、そして高いサンプル容量を有する。特に有用な方法は、調製的ドデシル硫酸ナトリウム−ポリアクリルアミドゲル電気泳動（ＳＤＳ−ＰＡＧＥ）である。

（ｉｖ）タンパク質断片化。サンプル混合物中のタンパク質、または任意のサンプル画分が用いられる場合、各画分に含まれるタンパク質を、配列特異的切断に供する。特に有用な方法は、（例えば、トリプシンを用いた）プロテアーゼ切断である。

（ｖ）ペプチド分離。得られるペプチド混合物を、一次元ペプチド分離に供する。このペプチド分離方法は、適用したサンプルの複雑さにかかわらず、少なくとも中程度の分解能で、高いサンプル容量を有し、そして非常に再現性の高い分離パターンを生じる。特に有用な一次元分離方法は、イオン交換クロマトグラフィー（例えば、陽イオン交換または陰イオン交換）である。

（ｖｉ）タグ化ペプチドのアフィニティー単離。ＩＣＡＴ^ＴＭ型試薬でタグ化したペプチド（例えば、システイン含有ペプチドまたはアフィニティー標識され得る他のアミノ酸もしくは翻訳後修飾を含有するペプチド）を、アビジンまたはストレプトアビジンアフィニティークロマトグラフィーを用いて各クロマトグラフィー画分から単離する。特に有用なアフィニティー媒体は、ポリマービーズに固定されたモノマーアビジンである。ビオチンとは異なるアフィニティータグを有するＩＣＡＴ^ＴＭ型試薬を用いる場合、このタグに相補的なアフィニティー媒体を用いる。

（ｖｉｉ）高分解能ペプチド分離。高分解能ペプチド分離について特に有用な方法は、液体クロマトグラフィーＥＳＩ−ＭＳ／ＭＳである。アフィニティークロマトグラフィーカラムから溶出したペプチド混合物を、自動化ＬＣ−ＭＳ／ＭＳによって、分離方法としてのキャピラリー逆相クロマトグラフィー（Ｙａｔｅｓら，ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．１１２：５５３−５６９（１９９９））および質量分析法としての動的排除を伴うデータ依存性ＣＩＤ（Ｇｏｏｄｌｅｔｔら，Ａｎａｌ．Ｃｈｅｍ．１５：１１１２−１１１８（２０００））を用いて個々に分析する。

（ｖｉｉｉ）データベース検索。適切なＣＩＤスペクトルが得られる全てのペプチドの配列を、調査している種からの配列データベースを検索することによって決定する。特に有用な配列データベースは、試験している種によって潜在的に発現され得る本質的に全ての完全タンパク質配列を含むデータベースである。用いられ得る配列データベース検索プログラムは、ＳＥＱＵＥＳＴ^ＴＭプログラム（Ｅｎｇ，Ｊ．ら，Ｊ．Ａｍ．Ｓｏｃ．Ｍａｓｓ．Ｓｐｅｃｔｒｏｍ．５：９７６−９８９，（１９９４））または類似の能力を有するプログラムである。

（ｉｘ）ＡＰインデックス（ＡＰＴデータベース）構築。上記の手順によって同定された全てのペプチドの配列を、データベースに入力し、そして上記の工程（ｉ）〜（ｖｉｉｉ）の間に作製された特徴（すなわち、属性）を用いて注釈を付ける。これらの特徴（すなわち、属性）としては、以下が挙げられるがこれらに限定されない：部分的アミノ酸組成（例えば、各選択されたペプチド中のシステイン残基の存在；Ｇｏｏｄｌｅｔｔら，前出，２０００を参照のこと）；親タンパク質のおよその分子量（任意のＳＤＳ−ＰＡＧＥ分画によって決定した場合）；イオン交換カラムからの溶出順序または溶出時間；逆相カラムからの溶出時間、および決定された任意の他の特徴。集合的に、これらの属性は、各ペプチドについてのバーコードと同様に、データベース中のあらゆるペプチドに関して独特である。それゆえ、同じバーコードが、その後の実験において生成されたペプチドから決定される場合、これらは、この実験によって生成されたバーコードを、ＡＰ検索（ＡＰＴデータベース）中に存在するバーコードと単に相関させることによって、この実験によって生成されたペプチドを独特に同定する。

ポリペプチドの、ＡＰインデックス（ＡＰＴデータベース）との相関に関して、上記の方法によって定量的プロテオーム分析のために生成されたペプチドサンプルを、以下の例外以外は、ＡＰインデックス（ＡＰＴデータベース）について生成されたペプチドと同様に、作製し、処理し、そして正確に加工する。（ｉ）比較されるべき２（以上の）サンプル中のタンパク質を、示差的に同位体標識されたＩＣＡＴ^ＴＭ型試薬で標識する。化学的に同一であるが、示差的に同位体標識された、２またはいくつかのＩＣＡＴ^ＴＭ型試薬が、この工程で使用され得る。（ｉｉ）生成されたペプチドを、ＭＳ／ＭＳによってではなく、１段階質量分析のみによって分析する。質量分析器は一般に、高質量精度、高感度および高質量分解を有する。これらの特徴を有する機器としては、以下が挙げられるがこれらに限定されない：ＭＡＬＤＩ−ＴＯＦ質量分析器、ＥＳＩ−ＴＯＦ質量分析器およびフーリエ変換イオンサイクロトロン質量分析器（ＦＴ−ＩＣＲ−ＭＳ）。このプロセスによって各ペプチドから決定される属性（上記の通りに決定される全ての属性またはそれらの選択物）を、各ペプチドについてのバーコードに変換し、そして実験的に決定されたバーコードを、ＡＰインデックス（ＡＰＴデータベース）からのバーコードと相関させて、ペプチドを、それゆえ、そのペプチドの起源であるタンパク質の明白な同定を得る。続いて、質量スペクトルを、このプロセスを通じて共に分画され、かつ用いられるＩＣＡＴ^ＴＭ型試薬にコードされる質量差に正確に対応する質量差を有する、ペプチドイオン対について調べる。２つのピークの相対シグナル強度は、これらのペプチドの相対量を、それゆえ、サンプル中に最初に存在した対応するタンパク質の相対量を示す。従って、実験的に決定されたデータの、ＡＰインデックス（ＡＰＴデータベース）との相関は、分析したサンプル中のタンパク質の定量および同定を可能にする。

（実施例ＩＩ：酵母の注釈されたポリペプチドインデックスの作成）
本実施例は、酵母についての注釈されたポリペプチドインデックスの作成を記載する。

現在の質量分析器の感度では、ＬＣ／ＬＣ／ＭＳ／ＭＳ法（Ｇｙｇｉら，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９７：９３９０−９３９５（２０００））を用いて、量の少ないタンパク質を検出するために少なくとも５ｍｇの総タンパク質が必要とされることが見積もられ、そしてこの量を、本質的に実験的に確認した。Ｇｙｇｉら，前出，２０００はまた、量の少ないタンパク質の検出に「開始」プロセスが適切であり、そして比較的多量の総サンプルに順応させるに充分なサンプル容量を有することを実証した。

このデータベースの構築に関して、以下の手順を用いる。タンパク質標識に関して、タンパク質サンプルを、０．５％ＳＤＳ、５０ｍＭＴｒｉｓ（ｐＨ８．３）、５ｍＭエチレンジアミン四酢酸（ＥＤＴＡ）中に５ｍｇ／ｍｌのタンパク質濃度で作製する。計２５ｍｇの総酵母タンパク質を用いる。一旦タンパク質が溶解したら、サンプルを水で１：１０希釈し、そしてＥＤＴＡを添加して５ｍＭＥＤＴＡ濃度を維持することによってＳＤＳ濃度を低下させる。最終濃度は、０．０５％ＳＤＳ、５ｍＭＴｒｉｓ、５ｍＭＥＤＴＡである。次いで、このサンプルを１００℃で３〜５分間煮沸し、次いで冷凍する。ジスルフィド結合の還元を、充分なトリブチルホスフィン（ＴＢＰ）を添加してサンプル溶液中で５ｍＭを達成することによって達成する。これに続いて、サンプルを３７℃で３０分間インキュベートする。還元したサンプルに、アルキル化試薬（例えば、ＩＣＡＴ^ＴＭ型試薬）を、サンプル中に存在するＳＨ基の見積もり５×モル濃度過剰で添加する。アルキル化反応を、暗所で９０分間進行させる。

タンパク質分離に関して、還元してアルキル化したサンプルに、０．２容量の５×ＳＤＳゲルサンプル緩衝液を添加し、そして５分間煮沸する。次いで、冷却したサンプルを、２０ｃｍ×２０ｃｍ×１．５ｍｍの寸法の調製用ＳＤＳゲルに適用する。電気泳動後、ゲルを、電気泳動の次元に対して垂直方向に、等しいサイズの１０枚のストリップにスライスする。これらのストリップは、インタクトなタンパク質についての１０個のサイズビンを表す。次いで、ゲルストリップ中のタンパク質を、標準的なプロトコルを用いたゲル内消化に供する。

ペプチド分離に関して、ゲルスライスから抽出されたペプチドを、３連続クロマトグラフィー分離に供する。最初に、これらを、陽イオン交換クロマトグラフィーによって分離する。第二に、ビオチン化ペプチドを、アビジンクロマトグラフィーによって単離する。第三に、ペプチドを、キャピラリー逆相クロマトグラフィーによってさらに分画する。

陽イオン交換クロマトグラフィーに関して、陽イオン交換ＨＰＬＣカラムを用いる（ＰｏｌｙＬＣＩｎｃ．，ＣｏｌｕｍｂｉａＭＤ；２．１ｍｍ×２０ｃｍ、５μｍ粒子、３００Å孔径、ポリスルホエチルＡ強陽イオン交換物質）。以下の緩衝液を用いる：緩衝液Ａ（１０ｍＭＫＨ_２ＰＯ_４、２５％ＣＨ_３ＣＮ（ｐＨ３．０））；緩衝液Ｂ（１０ｍＭＫＨ_２ＰＯ_４、２５％ＣＨ_３ＣＮ、３５０ｍＭＫＣ１（ｐＨ３．０））。以下の勾配を行う：
時間（分）％Ｂ
００
３０２５
５０１００。

流速は、１分間当たり２００μＬである。画分を、１分間〜２分間の間隔で収集する。約２００μｇ〜約５ｍｇのどこかでの、消化したＩＣＡＴ^ＴＭ標識総タンパク質を、通常、２ｍＭのサンプルループを用いてこのカラムにロードする。陽イオン交換カラムにロードする前にサンプルをｐＨ３．０以下まで酸性にすることが重要である。なぜなら、ペプチドは、より高いｐＨ値では完全には荷電せず、そしておそらくカラムに粘着しないかもしれないからである。示した勾配を、できるだけ多くの二重荷電ペプチドの溶出を広げるように設計し、これらのペプチドは通常、約８〜９分に始まって約１５〜１６分まで泳動中に溶出し、その後、三重荷電ペプチドが溶出し始める。３０個の画分を、勾配の持続時間の間収集する。

アビジンアフィニティークロマトグラフィーに関して、ＵｌｔｒａｌｉｎｋＭｏｎｏｍｅｒｉｃＡｖｉｄｉｎ（Ｐｉｅｒｃｅカタログ番号５３１４６）を用いる。ガラスウールの小片を、ガラスピペットチューブの頸部に充填する。４００μｌのアビジンクロマトグラフィー材料を、このチューブ中に充填する（スラリーは、５０％希釈なので、８００μｌの５０％スラリーを、４００μｌのアビジンクロマトグラフィー材料を得るために添加する）。ビーズを沈澱させ、そしてカラムを２×ＰＢＳで洗浄し、ビーズをチューブの側面に沈降させる。充填したカラムを、フロースルーのｐＨが約１まで変化するまで、０．４％トリフルオロ酢酸（ＴＦＡ）を含む３０％アセトニトリル（ＡＣＮ）で洗い流し、次いでさらに１カラム容量のＡＣＮ／ＴＦＡで洗い流す。この酸性工程は、ビーズに結合したポリマーを除去するためである。このカラムを、ｐＨが約７．２になるまで２×ＰＢＳ（ｐＨ７．２）で洗浄する。その後、カラムを、さらに３カラム容積（１２００μｌ）の同じ緩衝液で洗い流す。

カラムを、３〜４カラム容量のビオチンブロッキング緩衝液（ＰＢＳ中２ｍＭｄ−ビオチン）で洗浄する。このビオチンは、カラム中のより多くの残存アビジン部位をブロックして、後の残りの結合部位からのサンプルの回収を確実にする。

ゆるく結合したビオチンを、フロースルーのｐＨが約２．８に変化するまで、約６カラム容量（２，４００μｌ）の再生緩衝液（１００ｍＭグリシン、ｐＨ２．８）で洗い流す。このグリシン溶液を、使用前にオートクレーブすることによって滅菌し、そして４℃で保存し、４℃では、これは、１週間持続する。

カラムを、６カラム容量の２×ＰＢＳで洗浄して、カラムを適切なｐＨ（約７．２）に戻す。フロースルーのｐＨをモニタリングする。次いで、個々のまたはプールしたイオン交換カラム画分からなるペプチドサンプルをカラムに適用し、そして約２０分間にわたってカラム中でインキュベートする。次いで、結合していない物質を、５カラム容量の２×ＰＢＳ（ｐＨ７．２）を適用することによってカラムから洗浄し、そして画分を収集する。カラムを、画分の収集を続けながら、５×カラム容量の１×ＰＢＳ（この工程は、塩濃度を低下させるためである）および２０％メタノール（ＭｅＯＨ）を含む６カラム容量の５０ｍＭＡＭＢＩＣ（重炭酸アンモニウム）（ｐＨ８．３）でさらに洗い流す（５０ｍＭＡＭＢＩＣは、塩濃度を低下させるためであり；ＭｅＯＨは、疎水性ペプチドを除去するためである）。ビオチン化ペプチドを、溶出緩衝液（３０％ＡＣＮ／０．４％ＴＦＡ）で溶出させ、そして手動でガラス管中に収集する。これらのサンプルを、キャピラリー逆相クロマトグラフィーによってさらに分離する。

逆相クロマトグラフィーに関して、精製したビオチン化ペプチドを、標準的なプロトコルを用いた逆相キャピラリークロマトグラフィーによって分離する。ペプチドが６０分間かかって溶出するように溶媒勾配を選択する。１分間の画分を収集して質量分析器で分析する場合、６０個のビンがこの手順によって作製される。

質量分析および塩基配列決定のために、ＲＰ−カラムから溶出されたビオチン化ペプチドを、データベースの作成に対してはＥＳＩ−ＭＳ／ＭＳにより、そしてデータベース検索についてはＥＳＩ−ＭＳにより分析する。データベース構築に関しては、イオントラップ質量分析計を、約１質量単位の質量精度で使用する。データベース検索のための質量測定に関しては、ＥＳＩ−ＴＯＦ質量分析計を、５０ｐｐｍを越える質量精度および１０．０００を越える解像度で使用する。これは、１０００質量単位のペプチドを、１０００．１質量単位のペプチドと区別し得ることを意味する。代表的なペプチドの質量範囲が、５００質量単位と３０００質量単位との間であると仮定する場合、その性能での質量分析計は、２５，０００ビンを生じる。

酵母Ｓ．ｃｅｒｅｖｉｓｉａｅのプロテオーム分析の場合、この生物のゲノムは、約６２００のオープンリーディングフレーム（ＯＲＦ’ｓ）を含む。従って、この酵母のプロテオームは、差次的に改変された同タンパク質の形態を無視して、約６２００個の異なるタンパク質であると予想される。トリプシンに対する、経験に由来する特異性の規則が適用される場合、酵母プロテオームの代表的な消化は、約３５０，０００ペプチドを生じる。システイン含有ペプチドのみが溶出される場合、このサンプルの複雑性は、ＩＣＡＴ^ＴＭ型試薬を用いた化学誘導体化に基づき、約３５，０００ペプチドまで減少する。上記の手順から利用可能なビンの総数は、１０×３０×６０×２５，０００＝４．５×１０^８であり、従って、全ての酵母プロテオーム分析から予想されるペプチドの数を遙かに上回る。従って、複雑な酵母抽出物のサンプルに関するデータベース検索データの作成についての手順が、単純化され得ることが期待される。例として、タンパク質についてのゲル電気泳動サイズ分類（ｓｉｚｉｎｇ）工程は、必要に応じて排除される。

データベースに入力されるデータの作成手順も、データベースを検索するためのデータの作成手順も、固定されない。従って、最適化のために、サンプルの複雑性の程度に依存して、利用可能なビンの数は、容易に調整され得る。概して、データベースの作成に対して選択されるビンの数は、高く、一方、データベース検索データを作成するためのビンの数は、サンプルの処理能力を最大化するために、できるだけ低く選択される。利用可能なビンの数は、種々の方法において、容易に適応され得る。第１に、さらなる直交分離次元の包含は、タンパク質またはペプチドについて、考慮され得る。タンパク質分離については、等電点電気泳動、イオン交換クロマトグラフィー、ハイドロキシアパタイトクロマトグラフィー、または類似の電気泳動技術もしくはクロマトグラフ技術が含まれ得る。ペプチド分離については、ペプチドサイズに基づく分離またはキャピラリー電気泳動法が含まれ得る。

第２に、上記の分離方法の分離範囲は、拡大され得る。タンパク質サイズ分類は、拡大された分離範囲を有する勾配ゲルまたはより長いゲルを使用することにより拡大され得る。ペプチドのクロマトグラフ分離法について、ビンの数は、拡大された、より浅い勾配を作り出すことによって、および／またはより頻回なサンプリングにより、容易に拡大され得る。最後に、ビンの数は、使用される質量分析計の解像度および質量精度に依存する。より高度な性能を有する質量分析計が加わることは、その手順において使用される分離方法によって提供されるビンの数を減少させる。

（実施例ＩＩＩ）
（複合体サンプルのＭＳ分析のためのＥＳＩ−ＴＯＦの使用）
本実施例は、ＥＳＩ−ＴＯＦにより決定されるポリペプチドフラグメントの質量を用いて、ポリペプチド同定のサブインデックスを決定するための方法を記載する。

１組のポリペプチド、またはそのフラグメントの質量を、複合体ゲノムとの使用のためのポリペプチド同定サブインデックスを生じるための質量値によってポリペプチド識別インデックスを制限するために、ＥＳＩ−ＴＯＦを用いて決定した。２つのペプチド（ＡＳＨＬＡＧＡＲ（Ｐｌ）およびＲＰＰＧＦＳＰＲ（Ｐ２）を、ＥＳＩ−ＴＯＦ中に一緒に注入した。この混合物を、ＨＰＬＣ分離中に、ペプチドの共溶出をシミュレートすることを意図した。スペクトルを、低いＶ_{Ｎｏｚｚｌｅ−Ｓｋｉｍｍｅｒ}（図４Ａ）および高いＶ_{Ｎｏｚｚｌｅ−Ｓｋｉｍｍｅｒ}（図４Ｂ）で得た。

図４Ｂにおいて見られ得るように、ペプチド両方について、多数のフラグメントイオンが存在する。フラグメントイオンがＰｌ１＋イオン上に現れず、それゆえこのｍ／ｚ範囲を、図４Ｂから除外した。親イオンおよびフラグメントイオンの混合物を単一の質量スペクトル中に逆重畳するために、アルゴリズムを書いた（図４Ｂ）。６０，８８４個のヒトポリペプチドのデータベースからの可能性のあるトリプシンペプチド全ての一覧表にＰ１配列およびＰ２配列を配置した。６０，８８４個のポリペプチドからの可能性のあるトリプシンペプチド全てとの、Ｐ１の観察された質量とＰ２の観察された質量との比較（図４Ａ）は、それぞれ、５７個の同重体および１２４個の同重体を生じた。次いで、１０ｐｐｍまで算出された全同重体由来のｂ−イオンフラグメントおよびｙ−イオンフラグメントの一覧を、図４Ｂにおいて５００ｍ／ｚと８２５ｍ／ｚとの間で観察されたフラグメントイオンと比較した。このプロセスは、図４Ｃにおいて示されるように、Ｐ１およびＰ２について、それぞれ１２個および１３個の可能性のあるポリペプチド同定の一覧を生じた。本方法は、例えば、複合体ゲノムとの使用のためのポリペプチド同定サブインデックスを生ずるために、ポリペプチド識別インデックスに対する制限を適用するのに有用である。ペプチド上のインソース（ｉｎ−ｓｏｕｒｃｅ）ＣＩＤは、ＥＳＩ−ＴＯＦによる連続的交代様式において、容易かつ迅速に、そしてＭＡＬＤＩ−ＴＯＦでのインソース分解により潜在的に入手され得る。さらに、本方法は、タンデムなＭＳを用いて行われる場合、結果としてデータの喪失を生じず、ここで、選択されたイオンのＣＩＤ中に共溶出するイオンは、分析から必然的に除外される。ペプチドの存在量が少ない場合（すなわち、Ｓ／Ｎ（ｓｉｇｎａｌ−ｔｏ−ｎｏｉｓｅ）が低い場合）、それらのペプチドは、データ依存性（ＤＤ）タンデムＭＳプロセスによって、ＣＩＤについて選択されない。これは、スタンダードＤＤプロセスが、第１に基準ピーク（すなわち、１ｍ／ｚウィンドー当たりの最も強いイオン）を調査し，そのピーク上でＣＩＤを実行し、さらなる考察から動的にそのピークを除外し、そして次の最大量のイオンに進むからである。

図４Ｃに示されるペプチドは、６０，０００個を越える、可能性のあるポリペプチドから約１２個または１３個のポリペプチドまでの複雑性の減少を示す。親ポリペプチドまたはその１つ以上のさらなるペプチドフラグメントについて、さらなる特性、例えば、原子質量、アミノ酸組成、部分アミノ酸配列、見かけの分子量、ｐＩ、および規定された条件下での特定のクロマトグラフ媒体による溶出の順序などが決定される。ポリペプチドを分画するための方法は、以前に述べられている（例えば、Ｓｃｏｐｅｓ，ＰｒｏｔｅｉｎＰｕｒｉｆｉｃａｔｉｏｎ：ＰｒｉｎｃｉｐｌｅｓａｎｄＰｒａｃｔｉｃｅ，第３版、ＳｐｒｉｎｇｅｒＶｅｒｌａｇ，ＮｅｗＹｏｒｋ（１９９３））。ポリペプチド識別インデックス中の単一のポリペプチドが同定されるように、十分量の特性が決定される。

（実施例ＩＶ）
（ポリペプチド識別インデックスを作成するためのショットガン（Ｓｈｏｔｇｕｎ）ペプチド塩基配列決定）
本実施例は、高い質量精度を用いるペプチドの塩基配列決定を記載する。

ＥＳＩ−ＴＯＦＬＣ／ＭＳシステムにおける高い質量精度（５０ｐｐｍまたはより良く）の親イオンおよびフラグメントイオンを用いて、ペプチドを塩基配列決定するための方法を開発した。本方法は、交互の高いイオン供給源勾配電位または低いイオン供給源勾配電位での精製されたタンパク質消化サンプルの導入に関し、ここで、ペプチド由来の断片化データは、記録され、そしてデータベース検索を介したペプチド配列および親タンパク質の確実な同定についての非断片化データと組み合わされ得る。システイン含有量は、この特定の実施例において使用されたが、システイン含有量が、決定された特性である必要はない。従来のタンデムなＭＳとは対照的に、ＭＳに一緒に入るペプチド全てが、別個のイオンで選択されることなく断片化される。タンデムなＭＳとは対照的に、同時に断片化された２つのペプチドについてのフラグメントイオンの全てを、一緒に測定し、ここで、フラグメントイオンは、単一のペプチドについて同時に測定される。

簡単に、Ｓａｃｃｈａｒｏｍｙｃｅｓｃｅｒｅｖｉｓｉａｅ（ＢＷＧ１−７Ａ）をＹＰＤ培地中で３のＯＤ_６００（対数期の直後）まで増殖させた。スフェロプラストを、細胞溶解性（ｌｙｔｉｃａｓｅ）消化により生成し、そして続いて機械的に溶解した。遠心分離（１３，０００ｒｐｍで３０分間）によって核を単離し、そして硫酸アンモニウムの添加により溶解した。不溶性物質をスピンアウト（２８，０００ｒｐｍで９０分間）し、そして上清を抽出した。タンパク質を硫酸アンモニウムで沈殿させた。その沈殿物を再懸濁して、２０ｍＭのＨｅｐｅｓ、２０％のグリセロール、１０ｍＭのＭｇＳＯ_４、１ｍＭのＥＧＴＡ、および７５ｍＭの硫酸アンモニウムに対して透析した。

タンパク質抽出物（５．６ｍｇ）を、Ｓｐｅｅｄｖａｃ（ＳａｖａｎｔＩｎｓｔｒｕｍｅｎｔｓ；ＨｏｌｂｒｏｏｋＮＹ）中で乾燥し、そして０．５％のＳＤＳ、５０ｍＭのＴｒｉｓ、１ｍＭのＥＤＴＡ中に再懸濁し、そして３分間煮沸することにより変性させた。ジチオスレイトール（ＤＴＴ；５ｍＭ）を加え、そしてそのサンプルを５０℃で３０分間インキュベートした。タンパク質を、冷やしたアセトン／エタノール（ＥｔＯＨ）（５０：５０ｖ：ｖ）中で沈殿させた。そのペレットを洗浄し、そして０．０５％のＳＤＳ、６Ｍの尿素、５０ｍＭのＴｒｉｓ、ｐＨ８．３、および１ｍＭのＥＤＴＡ中に再懸濁し、そして３ｍｇのＥＺ−Ｌｉｎｋ^ＴＭＰＥＯ−ＩｏｄｏａｃｅｔｙｌＢｉｏｔｉｎ（Ｐｉｅｒｃｅカタログ番号２１３３４；ＰｉｅｒｃｅＣｈｅｍｉｃａｌＣｏ．；ＲｏｃｋｆｏｒｄＩＬ）を加えた。このサンプルを暗所で攪拌しながら９０分間インキュベートした。等容量の２０ｍＭＤＴＴを加えてビオチン化反応をクエンチした。次いで、このサンプルを６倍容量で５０ｍＭのＴｒｉｓ、１ｍＭのＥＤＴＡで希釈した。２００μｇのトリプシンを加え、そしてそのサンプルを３７℃で一晩インキュベートした。

約２ｍｇのトリプシンで消化された溶液をＰｏｌｙｓｕｌｆｏｅｔｈｙｌＡの強いカチオン交換カラム（ＰｏｌｙＬＣ番号２０２ＳＥ０５０３、２．１ｍｍ×２００ｍｍ、３００Ａ、５μｍ）（１０ｍＭのＫ_２ＰＯ_４、２５％のアセトニトリル（ＡＣＮ）中３００ｍＭのＫＣｌ（ｐＨ３．０）を２００μｌ／分で、３０分間にわたり勾配＝０％〜２５％、２０分間にわたり２５％〜１００％）、分画を５分ごとに回収した。各分画を、ＡＢＩアフィニティーカートリッジ、カートリッジホルダー、および付随する緩衝系（ＡＢＩ番号４３２６７４０および番号４３２６６８８−９０；ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ；ＦｏｓｔｅｒＣｉｔｙＣＡ）を用いて、ビオチン化システイニルペプチドについて精製した。精製した分画容量（０．１カチオン交換吸光度単位を２１４ｎｍのＵＶトレースから示す）をＳｐｅｅｄｖａｃ中で完全に乾燥させ、そして５μｌ容量までの０．２％の酢酸（ＨＯＡｃ）中に再懸濁した。

乾燥サンプルを、オートサンプラー／μＨＰＬＣシステムを１００μｍ×１０ｃｍの溶融シリカを手で充填したＣ−１８（ＭｉｃｈｒｏｍＭａｇｉｃＣ１８）カラムと連結して統合したＬＣＰａｃｋｉｎｇ（ＳａｎＦｒａｎｃｉｓｃｏＣＡ）によって、１分につき約７００ｎｌで６０分にわたり、５％〜５０％のＡＣＮ（溶媒Ｂ）の直線勾配を用いて逆相で分離した。溶媒Ａは、０．２％のＨＯＡｃ／０．００１％のへプタフルオロ酪酸である。この溶融シリカのキャピラリーカラムを、４０００ＶＤＣ（直流電圧）を適用するステンレス鋼の０．１５ｍｍのボア微小容量のＶａｌｃｏｕｎｉｏｎ（ＭＵ１ＸＣＳ６）を介して、７５〜３０μｍのテーパーチップ溶融シリカ針（ＮｅｗＯｂｊｅｃｔｉｖｅ、ＦＳ３６０−７５−３０−Ｎ）と連結させた。ＡＢＩＭａｒｉｎｅｒＢｉｏｓｐｅｃｔｒｏｍｅｔｒｙＷｏｒｋｓｔａｔｉｏｎＥＳＩ−ＴＯＦ質量分析計を使用するμＬＣ／ＭＳにより、最初に７０／２５ＶＤＣの電位でノズル／スキマー（Ｖ_ＮＺ）を用いて、次いで２００／２５ＶＤＣのＶ_ＮＺ電位を用いての再作動により、そのビオチン化ペプチドを２回分析した。

断片化されていない潜在的ペプチドの一覧を、クロマトグラフ作動全てを手動で試験して作成した。同定可能な二重に、三重におよび四重に荷電したｍ／ｚ一同位体値（ｍｏｎｏｉｓｏｔｏｐｉｃｖａｌｕｅ）をスプレッドシート中に掲載し、そして逆重畳した。逆重畳した質量を、単一のデータベース検索プログラムに提供した。このデータベース検索プログラムは、以下の規準に適合するペプチドの一覧を与えた：３０ｐｐｍの精度を有する質量、システイニル残基の存在を含むペプチド、両端にトリプシン部位を含むペプチド、可能性のある２つのトリプシン切断部位が欠落し得る、４１４．１９３１Ｄａ（ＰＥＯ−ヨードアセチル化）によって改変されたシステイン。次いで、各可能性ペプチド配列をｉｎｓｉｌｉｃｏで断片化し、可能なフラグメントイオンのｍ／ｚ値の一覧を作成した。次いで、断片化したクロマトグラフ作動を、実験的にセットしたｍ／ｚ範囲内にあるそれらの可能性フラグメントの存在または非存在について、手動で調べた。次いで、各可能性ペプチドの候補を、４０ｐｐｍまでの誤差範囲内で質量分析データからの実際のフラグメントとの一致として、評価した。さらに、生じたフラグメントおよび前駆物質の質量を手動でＳＥＱＵＥＳＴ^ＴＭに入力し、そして同データベースに対して検索し、イオントラップデータと比較するために、交差相関（ＸＣｏｒｒ）スコアおよびデルタ相関（ｄＣｎ）スコアを作成した。最後に、同サンプルを、ＴｈｅｒｍｏＦｉｎｎｉｇａｎＬＣＱイオントラップＬＣ／ＭＳ（ＭＳ）設定上で、類似の逆相分離スキームを用いて作動した。その結果を、ＳＥＱＵＥＳＴ^ＴＭ（Ｅｎｇら、前出、１９９４）を使用して自動データベース分析のために提示し、ＥＳＩ−ＴＯＦ結果を検証した。

図５に示したこのクロマトグラフ領域のスキャンを、非断片化作動および断片化作動の両方について要約し、そして、それぞれ、図６および図７に示す。６２０．３４３６ｍ／ｚでの三重に荷電したピークおよび９３０．０２５８ｍ／ｚでの二重に荷電したピークを、［Ｍ＋Ｈ］＝１８５９．０３に逆重畳した。酵母のオープンリーディングフレームデータベースを、３０ｐｐｍの逆重畳質量内で、この［Ｍ＋Ｈ］での、完全にトリプシンから生じたシステイン含有ペプチド（２つの潜在的に失った切断を含む）について検索した。図５において、矢印は、ペプチドＹＲＰＮＣＰＩＩＬＶＴＲ（配列番号２６）を指し、クロマトグラフィー上での単一のシグナルペプチドとして分離された。ＭＳの間に、イオン選択を実施しなかったが、ペプチドはなお明確に同定された。この結果を表１に示し、ここで、配列がＹＲＰＮＣＰＩＩＬＶＴＲ（配列番号２６）であるペプチドは、示される３３個のイオンのうち２２個により、明確に同定された（表１で、それぞれ、配列番号２７〜３３、２６および３４〜３８）。

表２は、実験的なｍ／ｚ範囲（３００〜１５００ｍ／ｚ）内に位置する各フラグメントの理論的質量を示し、整合性ピークは「＊」で示され、それらの添付のｐｐｍエラーと共に示される。この質量を手動でＳＥＱＵＥＳＴ^ＴＭに入力し、表１に示される相互相関スコアおよびδ相関スコアを得た。最後に、このペプチドをまた、同じサンプルからのイオントラップデータを検索する場合、３．７５のＸＣｏｒｒおよび０．３２５のδ相関スコアで、ＳＥＱＵＥＳＴ^ＴＭによって見出した。

さらに複雑なサンプルにおいて、２つのペプチドがクロマトグラフィーで共溶出した（図８を参照のこと）。共溶出ペプチドを、イオン選択を用いずに起源領域において断片化した。ＭＳをイオン選択を用いずに行ったが、２つの共溶出ペプチドを同定した。

図９に示されるような非断片的質量を、上記で使用したデータベース検索プログラムに入力した。潜在的ペプチドをインシリコで断片化し、そして得られたフラグメント質量を図１０に示される断片的スペクトルｍ／ｚ値と比較した。表３は、［Ｍ１＋Ｈ］＝１４８６．７６の候補ペプチドおよび整合化イオンの数を示す。ペプチド配列をＶＣＳＳＨＴＧＬＩＲ（配列番号４４）であることを決定した（表３、それぞれ、配列番号３９〜４９）。

表４は、［Ｍ２＋Ｈ］＝１７５８．８４の候補ペプチドおよび整合化イオンの数を示す。ペプチド配列を、ＧＨＮＩＰＣＴＳＴＩＳＧＲ（配列番号６０）であることを決定した（表４、それぞれ、配列番号５０〜６３）。

両方のペプチド（［Ｍ１＋Ｈ］＝１４８６．７６および［Ｍ２＋Ｈ］＝１７５８．８４）の場合において、フラグメントｍ／ｚ値を、手動でＳＥＱＵＥＳＴ^ＴＭに入力し、そしてＸＣｏｒｒ値およびｄＣｎ値を得た。これらを、それぞれ表３および表４に列挙する。

表５および表６は、整合化されたフラグメントイオン（「＊」）、フラグメントの理論的ｍ／ｚ、および実際のｍ／ｚ値のｐｐｍエラーを示す。最後に、これらのペプチドをまた、同じサンプルからのイオントラップデータを検索する場合、［Ｍ１＋Ｈ］＝１４８６．７６について、２．８４のＸＣｏｒｒおよび０．１９８のδ相関スコア、ならびに［Ｍ２＋Ｈ］＝１７５８．８４について、３．１８のＸＣｏｒｒおよび０．２９９のδ相関スコアで、ＳＥＱＵＥＳＴ^ＴＭによって見出した。

これらの結果は、ペプチド配列のポジティブ同定が、純粋な形態または他のペプチドと同時に（すなわち、それぞれ単一または複数の溶出ペプチド）、ペプチドについて得られることを示す。共溶出ペプチドを、一段式ＥＳＩ−ＴＯＦ質量分析計で起源内ＣＩＤを用いて「ショットガン」配列決定した。タンデムＭＳを介して従来のペプチド配列決定に関係して、親イオンは連続して選択され、システイン制約の組み合わせ、高い質量正確度および高い質量分解能は、ペプチドが同時にショットガン配列決定されることを可能にする。この方法はまた、１つの分析におけるＩＣＡＴ標識化ペプチドの分析のためのＩＣＡＴ（Ｇｙｇｉら、ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌ．１７：９９４−９９９（１９９９））で使用され得る。

これらの結果は、親タンパク質が決定された特徴の組み合わせから同定され得ることを示す。この実施例において、決定された特徴は、（１）システイン含量、（２）正確なペプチド質量および（３）特定のイオンの選択なしでの正確なペプチドフラグメント質量、である。

（実施例Ｖ）
（ポリペプチド識別インデックスとしてのＤｒｏｓｏｐｈｉｌａデータベースの作製）
この実施例は、Ｄｒｏｓｏｐｈｉｌａタンパク質を同定するためのデータベースの作製を記載する。

Ｄｒｏｓｏｐｈｉｌａを、完全なゲノム配列が決定され、そしてゲノム配列が多くのエクソンを含む種の代表的なモデル生物として選択した。実験の目的は、完全なゲノム配列が決定されている種由来のペプチドおよびタンパク質の大きなセットの作製、多次元クロマトグラフィーによってペプチドを分離すること、ＣＩＤスペクトルおよび配列データベース検索の作製を介してペプチドを同定すること、および分画／同定プロセスの間、得られた情報のバーコードでそれぞれの同定したペプチドに注釈を付けることである。

Ｄｒｏｓｏｐｈｉｌａｍｅｌａｎｏｇａｓｔｅｒ由来のシュナイダー（Ｓ２）細胞（１０^９）を、適切な組織培養培地での培養によって調製した。細胞を溶解し、そして得られた溶解物を、核画分、細胞質画分およびミクロソーム画分への差次的遠心分離によって分画した。それぞれの画分を、２つの等量に分け、そしてそれぞれのサンプル中に含まれるタンパク質を、同位体的に通常ＩＣＡＴ試薬（ｄ０）または同位体的に重いＩＣＡＴ試薬（ｄ８）のいずれかで標的化した。次いで、同じ細胞成分分画を表す標的化サンプルを合わせ、１：１の同位体的標的化タンパク質のタンパク質混合物を生成し、そしてトリプシン処理した。得られたペプチドを、実施例ＩＩに記載されたように陽イオン交換クロマトグラフィー、次にタグ化ペプチドの選択的単離のためにアビジンクロマトグラフィー、および逆相クロマトグラフィーによって分画した。分離したペプチドを分析し、そしてＬＣＱイオントラップ質量分析計中のＣＩＤに供した。得られたペプチドＣＩＤスペクトルを、ハエゲノム検索コンソーシアムおよびＳｅｑｕｅｓｔ^ＴＭ検索アルゴリズムからのハエ配列データベースを用いて配列データベース検索に供した。

ペプチドＣＩＤスペクトルを用いた配列データベース検索によってタンパク質を同定するために、以下の検索パラメータを使用した：最低１つのシステイン残基を含むダブルトリプシンペプチドのみを考えた。０．１より大きいδ相関因子を必要とし、そして２．０より大きいＸ−相関係数を、二重に荷電した前駆体イオンのために必要とした（単一に荷電したペプチドに対して、Ｘ−ｃｏｒｒ．＞１．５；三重に荷電したペプチドに対して、Ｘ−ｃｏｒｒ．＞２．５）。

核画分に対して、１４７０のタンパク質を同定した。細胞質画分に対して、９６７のタンパク質を同定した。ミクロソーム画分に対して、１５００をこえるタンパク質を同定した。従って、この分析において、約４０００のタンパク質を同定した。従ってこれらのデータは、多次元クロマトグラフィー、タンデム質量分析および特定の組織、細胞または種の注釈されたペプチドデータベースを確立するための配列データベース検索の使用を補助する。

これらの結果は、多数のポリペプチドの同定のために使用され得るポリペプチド識別インデックスが作製され得ることを示す。

（実施例ＶＩ）
（ポリペプチド同定の識別特徴としての等電点の使用）
この実施例は、ペプチドの同定のための特徴として等電点（ｐＩ）の使用を記載する。

ペプチドの等電点を、ペプチドバーコードに有用な識別成分として試験した。バーコードの成分としてｐＩを用いる利点を挙げる：ｉ）ｐＩは、ペプチドのアミノ酸配列から容易にそして正確に予測可能である；ｉｉ）ｐＩは、ＩＥＦによって正確に測定され得る；そしてｉｉｉ）ペプチドは、ＩＥＦゲルから効率的に回収され得る。

実施例Ｖに記載されたハエペプチドサンプルのイオン交換画分を、固定化ｐＨ勾配（ＩＰＧ−ＩＥＦ）を用いてポリアクリルアミドゲルでの等電集束法によってさらに分離した。約ｐＩ６．８〜７．０のセグメントに集束するペプチドを切りだし、そしてこの画分に含まれるペプチドを抽出し、そしてＬＣ−ＭＳ／ＭＳによって分析した。得られたＣＩＤスペクトルを、実施例Ｖに記載されるように配列データベース検索に供し、そしてそれぞれの同定されたペプチドのｐＩをまた、最良の配列データベースに整合する配列を用いて計算した。表７は、この方法の例示としての結果の部分的リスト（配列番号６４から１１７）を示す。ほとんど同定されたペプチドのｐＩは、狭いｐＩ範囲付近にかたまり、ｐＩは配列から正確に計算され得ることを示した。

データは、最良の整合がゲルから抽出された範囲の外側のｐＩを生じる、（少ない）数のペプチドが存在することをさらに示した。検索スコアが、辺縁性であり、ペプチドが高比率の欠損トリプシン切断部位を通常含み、そしてこのペプチドの多くは非トリプシンであるため、これらのペプチドのより密接な試験は、配列データベース整合が、抽出されたゲル領域のｐＩ範囲の外側のこれらのペプチドに対してほとんど確実に誤っていたことを示唆した。集団的に、これらのデータは、ポリペプチド識別インデックスからポリペプチドを同定するためのバーコードの成分としてペプチドｐＩを用いるの能力を示す。

これらの結果は、ｐＩがポリペプチド識別インデックスを用いて、ポリペプチド同定するためのポリペプチドの特徴として使用され得ることを示す。

この出願の全体にわたって、種々の刊行物が参照されている。この刊行物の開示は、その全体が、本発明に属する当該分野の状況をより十分に記述するために、この出願において本明細書中で参考として援用される。本発明は開示された実施形態を参考として記載しているが、当業者は、特定の詳細な試験は本発明の例示のみであることを容易に認識する。種々の改変は、本発明の意図からそれることなく行なわれ得ることが理解されるべきである。

Claims

本明細書に記載の発明。