JP2005519284A

JP2005519284A - アミノ酸鎖に対する、化学修飾のセットの適合性の決定

Info

Publication number: JP2005519284A
Application number: JP2003573415A
Authority: JP
Inventors: シーンケーティング，; ハインツブリュー，
Original assignee: アプレラコーポレイション
Priority date: 2002-03-01
Filing date: 2003-03-03
Publication date: 2005-06-30
Also published as: AU2003216495A1; EP1481245A1; EP1481245A4; CA2477621A1; WO2003075006A1; US20030200032A1

Abstract

ペプチド質量マッピングは、タンパク質消化の質量分析から決定された質量が、アミノ酸配列として特定された参照タンパク質由来の理論的ペプチドの質量と比較される技術である。いくつかの場合、実験的質量と理論的質量との間の差異は、しばしば、翻訳後修飾（ＰＴＭ）の結果としての、参照に対して実際のタンパク質の化学修飾によって、説明され得る。代表的に、このような修飾は、特定のセットのアミノ酸残基に適用可能である。従って、これらの質量差異の分析は、ＰＴＭの同定を導き得る。種々の場合、このような分析は、一般に、ペプチドがいくつかの異なるＰＴＭを有する可能性を可能にすることが所望され、さらに、種々の場合、ペプチド配列とのＰＴＭの推定の組み合わせの化学的適合性が確認されることが所望される。本明細書中に記載される実施例において、適合性の確認は、グラフ理論における問題として公式化される。

Description

（分野）
本教示は、アミノ酸鎖に対する、化学修飾の適合性を決定および検証するためのシステムおよび方法に関する。

（参考文献）
ＢｏｏｓｔＧｒａｐｈＬｉｂｒａｒｙ（ｈｔｔｐ：／／ｗｗｗ．ｂｏｏｓｔ．ｏｒｇ／ｌｉｂｓ／ｇｒａｐｈ／ｄｏｃ／ｉｎｄｅｘ．ｈｔｍｌ）
ＰａｐａｄｉｍｉｔｒｉｏｕおよびＳｔｅｉｇｌｉｔｚ（１９８４），ＣｏｍｂｉｎａｔｏｒｉａｌＯｐｔｉｍｉｚａｔｉｏｎ：ＡｌｇｏｒｉｔｈｍｓａｎｄＣｏｍｐｌｅｘｉｔｙ
Ｓｅｄｇｅｗｉｃｋ，Ｒ．（１９８８），Ａｌｇｏｒｉｔｈｍｓ
Ｓｋｉｅｎａ，Ｓ．Ｓ．（１９９８），ＴｈｅＡｌｇｏｒｉｔｈｍＤｅｓｉｇｎＭａｎｕａｌ。

（導入）
ペプチド質量マッピングは、タンパク質消化物の質量分析から決定される質量が、参照タンパク質から誘導される理論的なペプチドの質量と比較され、アミノ酸配列として特定される、技術である。幾つかの状況において、実験での質量と理論的な質量との間の差は、理論に対する実際のタンパク質の化学修飾で説明され得る。これらの修飾はしばしば、１つ以上の翻訳後修飾（ＰＴＭ）の結果である。代表的に、このような修飾は、特定のアミノ酸残基またはアミノ酸残基のセットに適用可能である。これらの質量差の分析は、それゆえに、特定のペプチドに適合し得る潜在的なＰＴＭの同定を導き得る。従って、一般的に、このような分析により、幾つかの異なるＰＴＭを有するペプチドの可能性を許容することが望ましく、そしてさらに、推定ＰＴＭセットとペプチド配列とが、化学的に適合性であることを検証することが、望ましい。

（要旨）
本教示の種々の実施形態は、生体高分子（例えば、アミノ酸鎖）に対する、化学修飾の適合性を決定および検証するためのシステムおよび方法を提供する。

種々の実施形態に従って、適合性の検証は、グラフ理論における問題として公式化（ｆｏｒｍｕｌａｔｅ）される。解決法の理論および実施が、本明細書に考察および記載される。

本教示の種々の実施形態は、グラフ理論（例えば、二部グラフにおける最大カージナリティー一致（ｍａｘｉｍｕｍｃａｒｄｉｎａｌｉｔｙｍａｔｃｈｉｎｇ））を適用して、化学修飾のセットとのアミノ酸鎖の化学的適合性を決定するシステムを提供する。

他の実施形態は、翻訳後修飾を同定するためのペプチド質量マッピングにおける使用についての方法を包含し、この方法は、ペプチドフラグメントの分子量を測定する工程、この測定された分子量と、同じ配列を有する非修飾フラグメントについて予想される分子量とを比較し、それによって、未修飾フラグメントからの差異を確認する工程、およびグラフ理論公式化（ｇｒａｐｈｔｈｅｏｒｙｆｏｒｍｕｌａｔｉｏｎ）を適用して、測定された分子量と可能な翻訳後修飾のセットとの間の適合性を決定する工程を包含する。

なお他の実施形態は、グラフ理論公式化が、二部グラフにおいて最大カージナリティー一致を含む方法を包含する。

他の実施形態は、実験的に確かめられた分子量を有するアミノ酸残基鎖と既知のアミノ酸配列と、翻訳後修飾のセットとの間の適合性を決定するための方法を包含し、この方法は、各残基についての頂点、各修飾についての頂点、および各適合性の対についての辺を含む二部グラフを構築する工程；ならびに辺のセットを含む最大カージナリティー一致を探す工程を包含し、（ｉ）ここで、２つの辺は、頂点を共有せず、そして（ｉｉ）ここで、全ての修飾が、残基と対にされる。

さらなる実施形態は、化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定するための方法を包含し、この方法は、グラフを構築する工程、最大カージナリティー一致を見出す工程、およびこのカージナリティーが修飾の数に等しいか否かを決定する工程を包含する。

種々の局面はまた、グラフ理論公式化を適用して、化学修飾のセットに対する、アミノ酸残基鎖の化学的適合性を決定するための方法に関する。特定の実施形態において、グラフ理論公式化は、二部グラフにおける最大カージナリティー一致を含む。

さらなる局面は、可能性のある化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定するプロセスに関する。種々の実施形態において、このプロセスは、各残基についての頂点、各修飾についての頂点、および各適合性対についての辺を有する二部グラフを構築する工程を包含する。次いで、このプロセスは、辺のセットの最大カージナリティー一致を探し、ここで、（ｉ）２つの辺は、頂点を共有せず、そして（ｉｉ）全ての修飾は、残基と対にする。

さらなる局面は、化学修飾のセットとの、アミノ酸残基鎖の化学的適合性を決定するための方法に関し、この方法は、以下の工程を包含する：グラフを構築する工程、最大カージナリティー一致を見出す工程、およびこのカージナリティー（辺の数）が修飾の数に等しいか否かを決定する工程。特定の実施形態において、最大カージナリティー一致は、任意の一致（空の一致は、妥当であり、かつ簡便である）を選択し、増分路（ａｕｇｍｅｎｔｉｎｇｐａｔｈ）を見出し、次いで、この路を使用して新しい一致を規定することによって見出される。このプロセスは、次いで、さらなる路が見出され得なくなるまで繰り返される。

種々の局面は、ペプチド分析のための方法に関し、この方法は、分析物ペプチドの測定された質量と参照タンパク質から誘導される理論的ペプチドの質量とを比較する工程、およびグラフ理論公式化を適用して、理論的ペプチドとの翻訳後修飾（ＰＴＭ）の選択されたセットの化学的適合性を決定する工程を包含し、それにより、候補ペプチドのセットは、１つ以上のペプチドを有するように展開（ｄｅｖｅｌｏｐ）され、この候補ペプチドのセットは、１つ以上のＰＴＭを保有し、上記分析物ペプチドと類似する質量を有する１つ以上のペプチドを含む。

種々の実施形態に従って、分析物ペプチドの測定された質量は、タンパク質消化物の質量分析によって決定される。さらなる局面は、機械によって読み取り可能なプログラム格納デバイスに関し、このデバイスは、機械によって実行可能な指示のプラグラムを具体化して、ペプチド分析物に関する方法工程を実施する。種々の実施形態において、この方法工程は、（ｉ）分析物ペプチドの測定された質量と参照タンパク質から誘導される理論的ペプチドの質量とを比較する工程、および（ｉｉ）グラフ理論公式化を適用して、選択されたセットの翻訳後修飾の、理論的ペプチドとの化学的適合性を決定する工程を包含し、それにより、候補ペプチドのセットは、1つ以上のペプチドを有するように展開され、この候補ペプチドのセットは、1つ以上のＰＴＭを保有し、上記分析物ペプチドと類似する質量を有する１つ以上のペプチドを含む。

種々の実施形態において、グラフ理論公式化は、二部グラフにおいて最大カージナリティー一致を含む。

さらなる局面は、機械によって読み取り可能な、機械によって実行可能な指示のプログラムを実施してペプチド分析において使用するための方法工程を実行する、プログラム格納デバイスに関する。種々の実施形態において、この方法工程は、グラフ理論の公式化を適用して、アミノ酸残基鎖の、化学修飾のセットとの化学的適合性を決定する工程を包含する。

特定の実施形態において、グラフ理論公式化は、二部グラフにおける最大カージナリティー一致を包含する。

種々の実施形態によれば、化学修飾としては、翻訳後修飾が挙げられる。

種々の実施形態に従って、この方法工程は、測定されたペプチド質量を、何らかの化学修飾または化学修飾のセットを有する理論的ペプチドと関連付ける出力を提供する工程をさらに包含する。

種々の実施形態は、分析物ペプチドと理論的ペプチドとの間の測定されたパラメータの差異に基づいて、翻訳後修飾の候補セットのセットを選択するコンピュータシステムを包含する。

さらなる局面は、分析物ペプチドを分析するためのコンピュータシステムにおける方法に関し、この方法は、分析物ペプチドの測定された質量を有する入力を受信する工程、複数の翻訳後修飾（ＰＴＭ）を含むリストをユーザに提示する工程、複数のＰＴＭから選択された、ユーザにより選択されるセットを、ユーザから受信する工程、および１つ以上の理論的ペプチドをユーザに提示する工程であって、この理論的ペプチドは、理論的ペプチドとの化学的適合性についてチェックされた、ユーザにより選択されるセット由来の１つ以上のＰＴＭを保有し、規定された質量許容内で、分析物ペプチドの質量と同じかまたは類似の質量を有する、工程を包含する。

特定の実施形態に従って、マッピングは、データファイル（例えば、質量分光写真由来）において見出されるピークの分子量を、既知のタンパク質（これは、本教示によれば、適合性をチェックされた化学修飾を含み得る）の配列から推定されるペプチドの分子量に一致させる。分子量が質量許容内で一致する場合、その研究において使用されるタンパク質の正体が確認され得る。種々の実施形態において、質量許容は、ユーザによって選択され得る。例えば、±５の質量単位、±１０の質量単位、±２５の質量単位、±５０の質量単位、±１００の質量単位、±５００の質量単位、または他の数が、ユーザによって選択され得る。

（定義）
分析物ペプチド−分析物ペプチドとは、同定および特徴付けを受けているペプチドである。同定としては、その質量、配列、その起源のタンパク質、およびそれが受け得た任意の修飾の決定が挙げられ得るが、これらに限定されない。

二部グラフ−２種類のみの頂点を有し、そして辺が異なる種類の節の間でのみ可能であるグラフ。

化学的適合性−ペプチドおよび翻訳後修飾のセットの文脈において使用される場合、この用語は、翻訳後修飾のセットにおける各翻訳後修飾が、ペプチドフラグメントにおける異なるアミノ酸配列に割り当てられ得、その結果、アミノ酸が受け得る修飾を特定する化学的適合性規則が満足されることを示す。単一の翻訳後修飾および単一のアミノ酸の文脈において使用される場合、この用語は、問題のアミノ酸が、問題の修飾を受け得ることを示す。

対応−２つのペプチドフラグメントの文脈において使用される場合、参照ペプチドフラグメントが、目的のペプチドフラグメントと同じアミノ酸配列を有することを示す。

適合性（化学的適合性を参照のこと）。

ペプチド（質量）フィンガープリンティング（ＰＭＦ）−質量分析によるタンパク質同定のために最も一般的に使用されるストラテジーは、ペプチド質量フィンガープリンティングである。標的タンパク質が、タンパク質分解酵素（例えば、トリプシン）で消化され、そして質量分光計が、この消化から誘導される少数のペプチドの正確な質量を測定する。これらの質量は、既知のタンパク質配列のデータベースから計算されたペプチドフラグメントの理論的リストと比較される。約４〜５ペプチドの質量が、既知のアミノ酸配列のタンパク質を明瞭に同定するために、一般に十分である。しかし、既知のタンパク質配列のデータベースが大きくなるにつれて、特定のタンパク質を同定するために必要とされるデータの量が増加する。従って、ペプチド質量フィンガープリンティングによる信頼性のある同定は、ペプチド質量の数の増加、および非常に正確な質量測定の両方を必要とする。同様に、ＰＭＦは、ペプチドおよびそれらに関連する任意の翻訳後修飾の、非常に正確な同定を必要とする。

ペプチド（質量）マッピング−分析物ペプチドを理論的ペプチドと一致させるためのアルゴリズムを使用して、分析物ペプチドを同定する方法。一致は、一般に、分子量に基づいてなされるが、生物分子の他の特徴が使用され得る。しばしば、一致は接近しているが、正確ではなく、そして他の方法が、差異の源を同定するために使用される。翻訳後修飾は、しばしば、分子量の不一致を生じる。

翻訳後修飾（ＰＴＭ）−ＰＴＭは、翻訳の間または翻訳後にポリペプチドまたはタンパク質に影響を与える、任意の修飾を包含する。

参照ペプチド−理論的ペプチドと同じ。

理論的ペプチド−理論的ペプチドとは、分析物ペプチドと比較するために使用されるペプチドである。これはしばしば、分子量および配列組成に基づいて、分析物ペプチドと比較される。参照ペプチドは、参照タンパク質を起源とし得るか、またはタンパク質への会合なしでそれら自体での実体であり得る。所定のタンパク質に対する理論的ペプチドは、タンパク質のインシリコでの消化によって生成し得る。

（種々の実施形態の説明）
タンパク質は、大部分の細胞の乾燥重量の５０％より多くを占め、そして細胞が行うほとんど全てのことに貢献する。例えば、タンパク質は、構造支持、貯蔵、輸送、シグナル伝達、運動、および防御のために使用される。さらに、酵素のように、タンパク質は、細胞において必要な化学反応を選択的に加速する。

それらの広範な機能とは対照的に、タンパク質は、細胞において、最も構造的に複雑な高分子である。タンパク質は、構造が広範に変化し、独特の三次元形状を有する各型のタンパク質が、それらの特定の機能に対応する。タンパク質は個々に異なるが、これらは全て、同じセットのアミノ酸（タンパク質の普遍のモノマー）から構成されるポリマーである。

タンパク質合成または翻訳は、脱水合成によってアミノ酸を連結し、ペプチド結合を形成することを包含する。アミノ酸の鎖はまた、ポリペプチドとして公知である。翻訳中および翻訳後に、ポリペプチド鎖はコイルになり始め、そして同時に折り畳まれ始めて、特定の三次元コンホメーションの機能的タンパク質を形成する。いくつかのタンパク質は、１つのみのポリペプチド鎖を含み、一方で他のタンパク質（例えば、ヘモグロビン）は、一緒に組み合わさったいくつかのポリペプチド鎖を含む。各ポリペプチドまたはタンパク質におけるアミノ酸の配列は、そのタンパク質に対して独特であり、従って、各タンパク質が、その独自の、独特の三次元形状を有する。

ほとんどのタンパク質について、タンパク質がその特定の仕事を行い得る前に、さらなる工程を必要とする。従って、ポリペプチドまたはタンパク質の特定のアミノ酸が、翻訳中または翻訳後に化学的に修飾され得る。本明細書中において使用される場合、用語「翻訳後修飾」（ＰＴＭ）は、翻訳中または翻訳後のポリペプチドまたはタンパク質に影響を与える、任意の修飾を包含する。多くの型のＰＴＭが存在する。ＰＴＭとしては、例えば、タンパク質分解切断、グリコシル化、アシル化、メチル化、リン酸化、硫酸化、プレニル化、ヒドロキシル化、カルボキシル化などが挙げられる。

特定の一般的規則が、ＰＴＭに適用され得る。何よりもまず、任意の所定の修飾が、特別に規定されたアミノ酸残基またはアミノ酸配列にのみ影響を与え得る点で、特別である。例えば、修飾Ｏ−リン鎖化は、ＯＨ側鎖を有するアミノ酸残基（セリン、スレオニン、およびチロシン（Ｓ、Ｔ、Ｙ））にのみ適用され得る。さらに、一旦、アミノ酸残基が修飾されると、これは、別の修飾を受け入れないようである。さらに、各特定の修飾が、そのアミノ酸配列の分子量に有効な変化を生じる。任意の所定のＰＴＭの分子量は、それが当該分野において公知でない場合には、容易に計算され得る。図５は、アミノ酸残基セリン（Ｓ）のＯ−リン酸化の結果を示す。この特定の修飾は、アミノ酸の分子量を約８０ダルトン増加させる。

当業者は、ペプチドの翻訳後修飾（ＰＴＭ）の根底にある機構をより完全に理解し、そしてプロテオミクスの一般的な分野は、大いに進歩している。特に、当業者は、タンパク質合成およびその機能との関係について、より大きい洞察力を有する。

一般に、本明細書中に記載される合成および方法の種々の実施形態は、アミノ酸残基の所定の配列が、特定のセットのＰＴＭを受容し得るか否かを決定することに関する。いくつかの限定された場合において、この問題は、困難ではない。例えば、１「種類」のみの修飾が考慮される場合、１つの解決法は、単に、この種の修飾に適合する十分なアミノ酸残基が存在するか否かを確かめることである。例えば、アミノ酸残基Ｓ、Ｔ、およびＹに適用可能なＯ−リン酸化（Ｐｈ）のみに興味があり、そして選択されるＰＴＭセットが｛Ｐｈ，Ｐｈ｝である場合、当業者は、配列ＹＩＰＧＴＫがこれを受容し得ることを、調査によって容易に検証し得る。（この特定の配列は、Ｐｈ修飾の各々を受容するために利用可能な２つのアミノ酸残基（ＴおよびＹ）を有する）。

ＰＴＭセットにおけるいずれの修飾も、その配列中のいずれの残基に対しても適用され得ない場合、または利用可能な残基より多い修飾が存在する場合、ＰＴＭセットは適合性ではない。一般的な問題を説明する例として、ＴＰＭセット｛Ｐｈ，Ｓｕ｝を考える。ここで、Ｓｕは、アミノ酸残基Ｙのみを修飾し得るＯ−スルホン化を表し、そしてＰｈは、アミノ酸残基Ｓ、Ｔ、およびＹのみを修飾し得るＯ−リン酸化を表す。さらに、実施者が、このＰＴＭセット｛Ｐｈ，Ｓｕ｝がアミノ酸残基配列ＹＩＰＧＴＫと適合性であるか否かを検証したいとする。Ｐｈがまず考慮され、そしてＹと一致する場合、Ｓｕに対して利用可能な一致は存在しない。あるいは、Ｓｕがまず考慮され、これがＹと一致し、次いでＰｈがＴと一致し得る場合、ＰＴＭセット｛Ｐｈ，Ｓｕ｝およびアミノ酸配列ＹＩＰＧＴＫが実際に適合性であるという正しい結論を導く。

全ての可能な一致を単純に数値化することは、多くの場合において受容不可能に遅いようであるので、上記例は、可能な一致の系統的分析に対する必要性を説明する。従って、本明細書中の種々の実施形態は、グラフ理論に基づく、構成的な、時間効率的な解決法を提供する。

ここで、本教示の種々の実施形態が参照される。本教示は、種々の実施形態の組み合わせで記載されるが、これらは限定することを意図されないことが、理解される。逆に、本教示は、本教示に含まれ得る代替物、改変物、および均等物を網羅すると意図される。

図１は、種々の実施形態に従う、分析システム１００の概略を示し、これは、実際に消化されるペプチドフラグメントの分子量を、対応する理論的ペプチドフラグメントと比較し、任意の質量差の原因となる潜在的なＰＴＭセットを選択し、そして選択されたＰＴＭセットの、理論的ペプチドフラグメントとの適合性を検証するために使用される。

分析システム１００は、代表的なコンピュータ装置であり得、そして例えば、マザーボード、コンピュータハードウェア、およびソフトウェアを備え得る。マザーボードは、中央処理装置（ＣＰＵ）、ベーシック入出力システム（ＢＩＯＳ）、１つ以上のＲＡＭメモリデバイス、１つ以上のＲＯＭメモリデバイス、磁気格納デバイスまたは光学格納デバイス（例えば、ハードディスク格納）に接続された大容量格納装置インターフェース、１つ以上のフロッピー（登録商標）ドライブまたはリムーバブルドライブ（例えば、ＣＤまたはＤＶＤ）を備え得る。システム１００はまた、例えば、シリアルポート、パラレルポート、ＵＳＢポート、ＩＥＥＥ１３９４ポートおよび拡張スロットを備え得る。分析システム１００のモジュールおよびデータベースは、データフローおよび分析を管理するマイクロプロセッサ１１０とともに作動する。任意の利用可能なマイクロプロセッサが、本明細書中で使用され得、例えば、ＩｎｔｅｌＰｅｎｔｉｕｍ（登録商標）、ＩｎｔｅｌＣｅｌｅｒｏｎ（登録商標）またはＡＭＤ（登録商標）マイクロプロセッサが挙げられる。

分析システム１００は、種々の操作システム（ＭＳ−ＤＯＳ（登録商標）、Ｍｉｃｒｏｓｏｆｔ（登録商標）、Ｗｉｎｄｏｗｓ（登録商標）、Ｌｉｎｕｘ（登録商標）またはＬｉｎｄｏｗｓ（登録商標）が挙げられる）のいずれかを実行する、ＩＢＭ適合性のパーソナルコンピュータであり得る。あるいは、モジュールは、他のコンピュータ環境（ＵＮＩＸ（登録商標）およびＶＭＳ（登録商標）のようなメインフレームシステム、またはＭａｃｉｎｔｏｓｈ（登録商標）パーソナルコンピュータ環境が挙げられる）上で実行し得る。

当業者は、これらの要素が、必ずしも単一のユニット（例えば、パーソナルコンピュータまたはメインフレーム）において接続される必要がなく、ネットワークにわたり得るか、または電気通信リンクを介し得ることを認識する。上記コンピュータハードウェアは、独立システムとして作動し得るか、またはローカルエリアネットワークの一部であり得るか、または中央システムに接続される一連の端末を備え得る。

分析システム１００は、ユーザインターフェース１８０と相互作用する、１つ以上のモジュールおよびデータベースを備え得る。種々の実施形態において、ユーザインターフェース１８０は、例えば、ディスプレイモニタ、プリンタ、キーボード、および／またはマウスもしくはトラックボール（図示せず）を備え得る。ユーザインターフェース１８０は、ユーザが、分析システム１００内のモジュールおよびデータベースを制御および改変することを可能にする。さらに、ユーザインターフェース１８０は、分析システム１００からデータ出力を受信し、ユーザが分析を受信することを可能にする。

質量分析計１４０は、分析システム１００に接続され、そしてタンパク質由来の消化されたペプチドフラグメントの分析後に、質量スペクトルデータを分析システム１００に送信する。一般に、分光計１４０は、分子のフラグメントを、これらを電場および磁場を介してイオン形態で通すことによって、質量に従って分離する機器である。分光計１４０は、これらの場を検出し、そしてデータを質量スペクトルに変換し、このスペクトルが、特定のペプチドの化学式、化学構造、および分子量を見出すために使用され得る。任意の型の質量分析計が、本明細書中に記載される方法およびシステムとともに使用され得、液体クロマトグラフィー−質量分析計（ＬＣ／ＭＳ）、液体クロマトグラフィー−タンデム質量分析計（ＬＣ／ＭＳ／ＭＳ）、ガスクロマトグラフィー−質量分析計（ＧＣ／ＭＳ）、およびガスクロマトグラフィー−タンデム質量分析計（ＧＭ／ＭＳ／ＭＳ）が挙げられるが、これらに限定されない。本明細書中の教示と組み合わせて有用な例示的な分光計としては、とりわけ、ＡＰＩ１５０、ＡＰＩ２０００、ＡＰＩ３０００、ＡＰＩ４０００、ＡＰＩＱＳＴＡＲ、ＱＴＲＡＰ、Ｖｏｙａｇｅｒ、およびＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ４７００（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ（ＦｏｓｔｅｒＣｉｔｙ，ＣＡ）から入手可能）が挙げられる。

分析システム１００におけるペプチド分析モジュール１２０は、スペクトル分析が可能なソフトウェアを備える。より具体的には、このソフトウェアは、配列決定、ペプチドマッピングおよびペプチド質量フラグメント化を実施し得、そして他の生物学的に関連する計算を行い得る。ペプチド分析モジュールは、ペプチドの同定および特徴付けのための一体化されたセットのデータ処理ツールを形成するように構成され得る。

いくつかの実施形態において、ペプチド分析モジュールは、さらに、ペプチドフラグメントの分子量を計算するユーティリティを一体化し得る。他の実施形態において、ペプチド分析モジュールは、データディクショナリにアクセスし得る。このようなディクショナリは、元素、アミノ酸、修飾、消化剤および核酸のような化学的情報を含み、そして修飾、付加、および切断剤をユーザが容易に規定することを可能にする。当業者は、データディクショナリが、しばしば、データベースに格納されることに留意する。なお他の実施形態は、ユーティリティおよびデータディクショナリを完全に一体化し、そしてまずペプチドの分子量を決定し、次いで一体化されたマッピング、配列決定、およびフィンガープリンティングツールを発動して、タンパク質を同定し、タンパク質を配列決定し、そしてペプチドおよび部分配列タグを同定することによって、データ分析を自動化する。この分析の結果は、結果表にまとめられ得、そして再構築されたスペクトルに関連付けられ得、これが次いで、より高次の分析（例えば、タンパク質同定のためのさらなる証拠を提供する、より洗練された形態のペプチドマッピングおよび配列決定）のために使用され得る。

種々の実施形態において、ペプチド分析モジュール１２０は、複数の上記特徴を組み込まれ得る。１つ以上のこのような特徴を含む例示的なソフトウェアとしては、とりわけ、ＰｅｐＭＡＰＰＥＲ（ＵＭＩＳＴ，ＵＫから入手可能）、ＢｉｏＡｎａｌｙｓｔ^ＴＭソフトウェア（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡから入手可能）、Ｍａｓｃｏｔ^ＴＭ（ＭａｔｒｉｘＳｃｉｅｎｃｅ，Ｌｏｎｄｏｎから入手可能）、ＰｅｐＳｅａ^ＴＭ（Ｐｒｏｔａｎａ，Ｄｅｎｍａｒｋから入手可能）、またはＰｅｐｔｉｄｅＳｅａｒｃｈ（ＥＭＢＬ，Ｈｅｉｄｅｌｂｅｒｇから入手可能）が挙げられるが、これらに限定されない。上に列挙したソフトウェアならびにタンパク質およびペプチドフラグメントを特徴付ける際に有用な他の関連するソフトウェアは、本明細書中に提供される方法およびシステムに従って、使用され得る。種々の実施形態において、本教示の１つ以上が、ちょうど上に列挙されたようなソフトウェアプログラムにおいて実施される。

ペプチドフラグメントについての質量分析データを、分光計１４０から受信した後に、ペプチド分析モジュール１２０は、そのペプチドフラグメントの重量を計算する。この分析の後に、ペプチド分析モジュール１２０は、ペプチドフラグメントの質量と、関連する参照ペプチドの質量との間の対応を探す。用語「対応」とは、２つのペプチドフラグメントの文脈で使用される場合、参照ペプチドフラグメントが、目的のペプチドフラグメントと同じアミノ酸配列を有することを示す。理論的ペプチドの質量、および入手可能である場合、これらが起源とする対応する参照タンパク質の配列は、タンパク質配列のデータベース１５０に格納される。このデータベースは、多くのこのような参照ペプチドおよびこれらの対応する理論的ペプチドを含む。タンパク質配列のデータベース１５０は、分析物ペプチドフラグメントとの比較のために、ペプチド分析モジュール１２０によって使用され得る、参照タンパク質およびペプチド配列のライブラリーを含む、格納部位である。種々の実施形態において、タンパク質配列のデータベース１５０はまた、データディクショナリを備え、これは、先に述べたように、生物学的に関連する計算の決定のために有用な化学的情報を含む。

対応する参照ペプチドフラグメントについてのデータを、タンパク質配列のデータベース１５０から受信した後に、ペプチド分析モジュール１２０は、分析物ペプチドフラグメントと理論的ペプチドフラグメントとの間の分子量差を計算する。分子量差が計算された後に、ペプチド分析モジュール１２０は、このデータを格納部位１６０に送信する。

格納部位１６０は、分子量差のデータをペプチド分析モジュール１２０から受信する。格納部位１６０は、例えば、電子的メモリ（例えば、ＲＡＭ）を保持し得る任意の部位であり得る。

グラフ作成モジュール１３０は、分析物ペプチドフラグメントと理論的ペプチドフラグメントとの間の重量差についてのデータを、格納部位１６０から選択および受信し得るソフトウェアを備え得る。種々の実施形態において、さらに、グラフ作成モジュールは、理論的ペプチドフラグメントの配列を示す情報を受信し得る。また、グラフ作成モジュール１３０におけるソフトウェアは、潜在的なＰＴＭセットを、翻訳後修飾データベース１７０から、格納部位１６０から受信された重量差に基づいて選択および受信し得る。分析物ペプチドと理論的ペプチドとの間の質量の差の原因となり得る、１つより多くのＰＴＭセットが存在し得るので、ＰＴＭセットのリストは、最初にユーザに、どのＰＴＭが考慮されるべきかを特定させることによって、形成され得る。種々の実施形態において、このことは、図８に示されるようなユーザインターフェースによって達成され得る。いくつかの実施形態において、このリストのメンバー（左上の角に示される）は、目的のアミノ酸鎖（例えば、ペプチド）のアミノ酸との化学的適合性について、予めスクリーニングされていない、一般的なリストを含み得る。他の種々の実施形態において、このリストは、メンバーが、目的のアミノ酸鎖（例えば、ペプチド）のアミノ酸と化学的に適合性であることが既知であるように、予めスクリーニングされ得る。次いで、グラフ作成モジュールは、質量の差の原因となり得る、１つ以上のＰＴＭセットを形成し得る。

種々の実施形態において、グラフ作成モジュール１３０は、グラフを構築し、そして最大カージナリティー一致を決定し得るソフトウェアを備える。グラフ作成モジュール１３０は、グラフ理論を使用して、選択された翻訳後修飾セットが理論的ペプチドフラグメントのアミノ酸配列と適合性であるか否かを決定し得る。当業者は、最大カージナリティー一致を実施するいくつかの方法が存在し、これらの１つは、増分路アルゴリズムを使用することを理解する。ＰＴＭセットが理論的ペプチドのアミノ酸配列と適合性である場合、そのデータは、格納部位１６０に送信され得、この格納部位は、ユーザインターフェース１８０によってアクセスされ得る。ＰＴＭセットが理論的ペプチドのアミノ酸配列と適合性ではない場合、グラフ作成モジュール１３０は、別の潜在的なＰＴＭセットを、翻訳後修飾データベース１７０から選択および受信し得る。

図２は、実験的ペプチドフラグメントの分子量を、対応する参照ペプチドフラグメントと比較し、任意の重量差の原因となる潜在的なＰＴＭセットを選択し、そしてこのＰＴＭセットの、参照ペプチドフラグメントとの適合性を検証するための、種々の実施形態に従う方法の概略を示すフローチャートである。プロセス２００は、開始段階２０２において開始し、そして段階２０４に進行し、ここで、消化されたタンパク質由来のペプチドフラグメントの分子量が決定される。この消化されたタンパク質は、消化前に既知であり得るか、またはその同定がペプチド質量フィンガープリンティングを介して確認され得るかの、いずれかであり得る。

段階２０４は、適切な手段（例えば、プロテアーゼ（例えば、トリプシンまたはペプシンまたは他のプロテアーゼ））によって、タンパク質を消化する工程を包含する。図３は、プロテアーゼトリプシンを使用する、タンパク質消化の例を示す。次いで、消化されたペプチドフラグメントは、分光計１４０において、質量分析を受ける。種々の実施形態によれば、質量分析の一般的なプロセスは、以下のうちの１つ以上を包含し得る。ペプチドフラグメントが、まず気化およびイオン化される；そのイオンが電場によって加速され、次いで磁場によって、湾曲した軌道（これは、これらのイオンの質量および電荷に依存する）に偏向される。次いで、これらのイオンは、質量スペクトルとして、写真的または電気的に検出される。質量スペクトルは、一連のピークを含み、各々が、異なるイオンに対応する。従って、ペプチドフラグメントの質量スペクトルは、次いで、その式、化学構造、および分子量を見出すために使用され得る。任意の型の質量分光計が、本明細書中に記載される方法およびシステムとともに使用され得、これには、液体クロマトグラフィー−質量分析計（ＬＣ／ＭＳ）、液体クロマトグラフィー−タンデム質量分析計（ＬＣ／ＭＳ／ＭＳ）、ガスクロマトグラフィー−質量分析計（ＧＣ／ＭＳ）、およびガスクロマトグラフィー−タンデム質量分析計（ＧＭ／ＭＳ／ＭＳ）が挙げられるが、これらに限定されない。

なお、段階２０４において、ペプチド分析モジュール１２０は、得られる質量スペクトルデータを受信し、そしてソフトウェアを利用して、スペクトル分析を受け、分析物ペプチドフラグメントの分子量を決定する。このようなことが可能な例示的な市販のプログラムは、Ａｎａｌｙｓｔ（登録商標）ＱＳ（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡから入手可能）、およびＭｉｌｌｅｎｉｕｍ（登録商標）３２（Ｗａｔｅｒｓ，Ｍｉｌｆｏｒｄ，ＭＡから入手可能）である。種々の実施形態において、ユーティリティは、元素組成およびアミノ酸組成を質量に変換し得、そして逆もまた可能である。この機能は、例えば、アミノ酸置換を比較して、観察された質量差を説明するため、および複数の荷電イオン系列または同位体分布から質量を計算するために有用であり得る。顕著なことには、このようなユーティリティは、翻訳後修飾の分子量を計算し得る。分析物ペプチドフラグメントの分子量が計算された後に、プロセス２００は、段階２０８に進み、ここで、対応する参照ペプチドフラグメントが、ペプチド分析モジュール１２０において、例示的なペプチドフラグメントにマッピングされる。一般に、単純なペプチドマッピングは、分析物タンパク質の消化についての質量分析によって決定された分子量を、理論的な参照タンパク質からの可能なペプチド質量と比較する工程を包含する。図４は、ペプチドマッピングの１つの方法の広範な概略を提供する。

ペプチドマッピングを実施するために、ペプチド分析モジュール１２０は、分析物ペプチドフラグメントと同じアミノ酸配列を有する理論的ペプチドフラグメントを、タンパク質配列のデータベース１５０から選択する。この決定は、例えば、分子量の比較に基づいてなされ得る。１つの実施形態において、消化された既知の分析物タンパク質の構造に対応する理論的タンパク質が選択され、そして実際の消化において使用されたプロテアーゼの消化パターンに基づいて、仮想的な消化を受ける。別の実施形態において、タンパク質は既知ではないかもしれず、そしてペプチド質量フィンガープリンティングを介して同定されることになっている。理論的なタンパク質は、化学的に修飾され得る、実際に試験されるタンパク質に関して、標準的なアミノ酸残基の配列として特定され得る。これらの修飾は、通常、翻訳中または翻訳後のいずれかに起こる。いくつかの実施形態において、変異がその配列における消化パターンをまた変化させ得ることに注意して、配列変異もまた、修飾としてモデル化され得る。

種々の実施形態において、ソフトウェアにおいて実施されるペプチドマッピング機能は、質量スペクトルデータから誘導された分析物ペプチドの分子量を、仮想的タンパク質消化から誘導された対応する理論的なペプチド質量に相関付ける。他の実施形態において、マッピングソフトウェアは、ペプチドの分子量を自動的に決定し、次いで、一体化されたマッピングおよび配列決定ツールを利用して、修飾、配列、または部分的な配列タグを見出す。質量フィンガープリンティングのなお他の実施形態において、複数のタンパク質が、単に迅速にデータセットにマッピングされ、そしてデータディクショナリからの修飾が、付加または欠失され得る。いくつかの実施形態において、ソフトウェアは、生スペクトルおよびデコンボリューションされた（ｄｅｃｏｎｖｏｌｕｔｅｄ）スペクトルをマッピングおよび表示し、そしてマッピングおよび／またはフィンガープリンティングの結果を、表にまとめる。ペプチド質量フィンガープリンティングは、種々の利用可能なソフトウェアを使用して達成され得、これらには、例えば、ＰｅｐＭＡＰＰＥＲ（ＵＭＩＳＴ，ＵＫから入手可能）、Ｍａｓｃｏｔ^ＴＭ（ＭａｔｒｉｘＳｃｉｅｎｃｅＬｔｄ．，Ｌｏｎｄｏｎから入手可能）、ＢｉｏＡｎａｌｙｓｔ^ＴＭソフトウェア（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ，ＦｏｓｔｅｒＣｉｔｙ，ＣＡから入手可能）、ＰｅｐＳｅａ^ＴＭ（Ｐｒｏｔａｎａ，Ｄｅｎｍａｒｋから入手可能）、またはＰｅｐｔｉｄｅＳｅａｒｃｈ（ＥＭＢＬ，Ｈｅｉｄｅｌｂｅｒｇから入手可能）が挙げられる。

分析物ペプチドフラグメントと理論的ペプチドフラグメントとの間の分子量の差異を計算した後に、プロセス２００は、決定段階２１６に達する。決定段階２１６において、ペプチド分析モジュール１２０は、実際のペプチドおよび理論的なペプチドが、同じ分子量を有するか否かを決定する。これらのペプチドが同じ分子量を有する場合、プロセス２００は、決定段階２１６から別の決定段階２２０へと進み、タンパク質消化から分析されるさらなる分析物ペプチドフラグメントが存在するか否かを決定する。あるいは、ペプチド分析モジュール１２０が、決定段階２１６において、実際のペプチドフラグメントおよび理論的ペプチドフラグメントが異なる分子量を有することを決定する場合、プロセス２００は、段階２２８に進む。

理論的ペプチドフラグメントと分析物ペプチドフラグメントとの両方が同じ分子量を有する状況をまず記載すると、ペプチド分析モジュール１２０は、決定段階２２０において、分析物ペプチドフラグメントからの、さらなる質量スペクトルデータが存在するか否かを決定する。利用可能なさらなる質量スペクトルデータが存在しない場合、プロセス２００は、終了段階２５６に進む。あるいは、ペプチド分析モジュール１２０が、さらなる分析物ペプチドフラグメントについてのさらなる質量スペクトルデータが存在することを決定する場合、プロセス２００は段階２２４に進み、ここで、次の分析物ペプチドについての質量スペクトルデータが、ペプチド分析モジュール１２０によって選択される。一旦選択されると、プロセス２００は段階２０４に戻り、ここで、ペプチド分析モジュール１２０は、質量スペクトルデータに基づいて、分析物ペプチドフラグメントを配列決定し、そしてこのフラグメントの分子量を決定する。

決定段階２１６に戻って、ペプチド分析モジュール１２０が、理論的ペプチドフラグメントおよび分析物ペプチドフラグメントが異なる分子量を有することを決定する場合、プロセス２００は段階２２８に進み、ここで、理論的ペプチドフラグメントの分子量の差異およびアミノ酸配列が、格納部位１６０に転送される。グラフ作成モジュール１３０は、理論的なペプチドフラグメントのアミノ酸配列および分子量の差異の計算についてのデータを、格納部位１６０から選択し、そして受信する。

このデータを受信した後に、グラフ作成モジュール１３０は、第一の翻訳後修飾（ＰＴＭ）セットを、ＰＴＭデータベース１７０から選択し、そして受信する。ＰＴＭデータベース１７０は、多数の潜在的なペプチドの翻訳後修飾およびこれらの対応する分子量についてのデータを含む、格納部位である。格納部位１６０から受信された分子量の差異のデータに基づいて、グラフ作成モジュール１３０は、理論的ペプチドフラグメントと分析物ペプチドフラグメントとの間の重量差の原因となり得る、潜在的なＰＴＭセットをＰＴＭデータベース１７０から選択する。

ペプチドフラグメントに対する任意の特定のＰＴＭは、そのペプチドの質量分布における、予測可能なシフトを引き起こす。従って、観察されるシフトを使用して、ＰＴＭのセットの可能な存在を推論し得る。代表的に、修飾は、特定の要件に合うアミノ酸（例えば、特定の側鎖化学または特定の配列位置を有する）においてのみ起こる。従って、選択されたＰＴＭセットの、アミノ酸配列との適合性を確認することが望ましくあり得る。本明細書中に記載される実施形態によれば、グラフ理論を使用して、適合性を検証し得る。

従って、適切なＰＴＭセットが選択された後に、プロセス２００は、段階２３２に進む。段階２３２において、グラフ作成モジュール１３０がソフトウェアを使用して、２つの頂点の群を有する二部グラフを構築する。１つの頂点の群（Ｕ）は、選択されたＰＴＭセットの各修飾を含み、そして他方の頂点の群（Ｖ）は、理論的なペプチドフラグメントの各アミノ酸を含む。あるいは、Ｖ頂点は、理論的ペプチドフラグメントから、選択されたＰＴＭセットからの少なくとも１つの修飾を受容し得るアミノ酸のみを含むように、構築され得る。非限定的な例において、図６は、ＰＴＭセット｛Ｐｈ，Ｓｕ｝がアミノ酸配列ＹＩＰＧＴＫ（チロシン、イソロイシン、プロリン、グリシン、スレオニン、リジン）と適合性であるか否かを検証するために使用され得る二部グラフを示す。修飾を接続する線は、辺を示す。本明細書中の目的で、辺は、群Ｖからの頂点を群Ｕにおける頂点に接続することのみを可能にされる。

段階２３２から、プロセス２００は段階２３６に進み、ここで、グラフ作成モジュール１３０は、構築されたグラフにおいて最大カージナリティー一致を見出す。本質的に、これは、グラフ作成モジュール１３０が、頂点のＵ群由来の各修飾を、Ｖ群の頂点由来の適合性の共有されていないアミノ酸と一致させることを試みる。このことは、全ての受容可能な残基修飾対形成についての辺を構築することによって達成される。辺を構築する際に、グラフ作成モジュール１３０は、対形成規則を固守する。このような規則としては、例えば、どのアミノ酸残基も、１つより多くの修飾を受容し得ないこと、および各修飾が、特定のセットのアミノ酸残基のみに対して適用され得ることが挙げられる。

グラフ作成モジュール１３０における一致とは、構築された辺の各々が、１つのみの修飾および１つのみのアミノ酸残基に結び付けられることを示す。換言すれば、各アミノ酸残基は、１つより多くの修飾と対形成されず、そして各修飾は、１つより多くのアミノ酸残基と対形成されない。最大カージナリティー一致は、さらなる辺が一致に追加され得ない場合に達成される。換言すれば、修飾と一致される、利用可能な対になっていないさらなる適合性アミノ酸残基が存在しない。

当業者は、最大カージナリティー一致を見出すために利用可能な、多数のアルゴリズムが存在することを理解する。例えば、増分路検索方法を使用する一致アルゴリズムは、Ｐａｐａｄｉｍｉｔｕｒｏｕ＆ＳｔｅｉｇｌｉｔｚＣｏｍｂｉｎａｔｏｒｉａｌＯｐｔｉｍｉｚａｔｉｏｎ：ＡｌｇｏｒｉｔｈｍｓａｎｄＣｏｍｐｌｅｘｉｔｙ（１９８４）に見出され得る。「路」とは、連続した辺の配列（（ｖ_１，ｖ_２）、（ｖ_２，ｖ_３）、・・・、（ｖ_ｋ，ｖ_ｋ＋１））である。すなわち、辺の全ての隣接する対ｉ，ｉ＋１が頂点を共有するような、辺１・・・ｋの配列である。「増分路」とは、一致Ｍに関して規定され、そして（ｎ＋１）個の奇数の辺１，３、・・・、２ｎ＋１がＭ中になく、一方でｎ個の偶数の辺２，４、・・・、２ｎがＭ中にあり、そして最初の頂点および最後の頂点が、Ｍ中のいずれの辺にも生じないような、連続する辺１、・・・２ｎ＋１の配列である。この路は、Ｍ中のｎ個の辺およびＭ中でないｎ＋１個の辺を含むことに留意のこと。

増分路を考慮して、Ｍの全ての偶数辺からなる新たな辺セットが構築され得る。この新たなセットはまた、妥当な一致である。なぜなら、構築により、頂点が共有されず；さらに、１つの余分の辺を含むからである。従って、増分路は、１つ大きいカージナリティーとの新たな一致が構築されることを可能にする。新たな一致が構築された後に、グラフ作成モジュールは、別の増分路が新たな一致を可能にするためのグラフを検索する。一般に、増分路は、以下のように記載され得る。このグラフは、任意の一致Ｍ（通常、いずれの辺もないグラフ）で開始する。次に、このグラフは、Ｍに関する増分路について検索される。見出される場合、Ｍが増加され（別の辺が描かれ）、そしてこのグラフが、別の増分路のために再度検索される。このプロセスが、さらなる増分路が見出され得なくなるまで続く。

図７は、増分路を使用して最大カージナリティー一致を見出す上記方法を示す。左側の二部グラフを参照すると、このアルゴリズムは、修飾｛Ｐｈ，Ｓｕ｝を、ペプチドＹＩＰＧＴＫ由来の受容可能なアミノ酸に結びつける。この結びつけは、辺の連続的な路を形成する。修飾Ｐｈをアミノ酸残基Ｙに結びつける黒い辺は、偶数辺（２番目の辺）であり、従って、第一の一致（Ｍ_ｏｌｄ）に含まれる。対照的に、ＳｕをＹに結びつけ、そしてＰｈをＴに結びつける細い辺は、奇数辺（１番目および３番目の辺）であり、従って、最初の一致（Ｍ_ｏｌｄ）から排除される。

ここで、図７の右側のグラフ（Ｍ_ｎｅｗ）を参照する。増分路が見出された後に、このグラフはここで、２つの辺を含み、これらの辺はＳｕをＹに結びつけ、そしてＰｈをＴに結びつける、黒い辺によって示される。このグラフはなお一致を表すことが理解される。なぜなら、構築された各辺は、１つのみの修飾および１つのみのアミノ酸残基に結び付けられているからである。これは、最大カージナリティー一致であることが、さらに理解される。なぜなら、さらなる辺が一致に追加され得ないからである。さらに、最大カージナリティー一致において２つの辺が存在し、そして修飾セット｛Ｐｈ，Ｓｕ｝において２つの修飾が存在するので、このセットは、ペプチドに適合性である。

種々の実施形態において、増分路に基づき、そしてコンピュータプログラムに実装されるアルゴリズムは、最大カージナリティー一致を見出すために使用され得る。当業者は、他のアルゴリズム（これは、増加より速くあり得る）が、最大カージナリティー一致を見出すために使用され得ることを理解する。種々の実施形態において、Ｐａｐａｄｉｍｉｔｕｒｏｕ＆Ｓｔｅｉｇｌｉｔｚ（１９８４）によって記載される、漸近的により速いアルゴリズムが、段階２３６において最大カージナリティー一致を見出すために使用され得る。最大カージナリティー一致が達成された後に、プロセス２００は、決定段階２４０に進む。決定段階２４０において、グラフ作成モジュール１３０は、そのグラフにおける辺の数が、選択されたＰＴＭセットにおける修飾の数と等しいことを検証するために、チェックされる。決定段階２４０において、グラフ作成モジュール１３０の計算が、修飾より少ない辺が存在することを示す場合、このＰＴＭセットは、理論的ペプチドフラグメントと適合性ではない。従って、プロセス２００は、決定段階２４４に進み、ここで、グラフ作成モジュール１３０は、ＰＴＭデータベース１７０由来の、理論的ペプチドフラグメントと分析ペプチドフラグメントとの間の分子量の差異の原因となり得るさらなる潜在的なＰＴＭセットが存在するか否かを評価する。さらなるＰＴＭセットが、理論的ペプチドフラグメントと分析物ペプチドフラグメントとの間の分子量の差異の原因となり得ない場合、プロセス２００は、終了段階２５６に進む。しかし、分子量の差異を説明するために利用可能なさらなるＰＴＭセットが存在する場合、グラフ作成モジュール１３０は、段階２４８において、新たなＰＴＭセットをＰＴＭデータベース１７０から選択する。新たなＰＴＭセットを選択した後に、プロセス２００は段階２３２に戻り、ここで、グラフ作成モジュール１３０は、新たなグラフを構築する。

あるいは、決定段階２４０において、グラフ作成モジュール１３０が、辺の数が修飾の数と等しいと計算する場合、選択されたＰＴＭセットは、特定の理論的ペプチドフラグメントと適合性である。一旦、適合性がチェックされると、プロセス２００は段階２５２に進み、ここで、ＰＴＭセットが、適合性の理論的ペプチドフラグメントについてのデータとともに、格納部位１６０に送信される。段階１６０から、このプロセスは、決定段階２４４に進み、ここで、グラフ作成モジュール１３０は、ＰＴＭデータベース１７０由来の、理論的ペプチドフラグメントと分析物ペプチドフラグメントとの間の分子量の差異の原因となり得るさらなる潜在的なＰＴＭが存在するか否かを評価する。この機能は、実際のペプチドフラグメントと理論的ペプチドフラグメントとの間の重量差の原因となり得る複数の潜在的ＰＴＭセットが存在する場合に、特に有用である。ユーザは、任意の型の質量フィンガープリンティング結果またはペプチドマッピング結果を、ユーザインターフェース１８０から観察し得る。フィンガープリンティング結果およびマッピング結果は、例えば、タンパク質配列ファイルの名称、消化剤に対するＮ末端規則およびＣ末端規則と一致するペプチド、連結した配列についての消化結果からのペプチド数、マッピングされたペプチドの配列における位置、マッピングされたペプチドの計算された分子量、計算された分子量と分析表における質量との間の差異、マッピングされたタンパク質の配列、分析物ペプチドフラグメントの配列、翻訳後修飾およびＰＴＭの位置を含み得る。

当業者は、グラフ作成モジュールおよびその機能１３０が、ペプチド分析モジュール１２０に組み込まれ得、これによって、ペプチド質量フィンガープリンティングおよびペプチド質量マッピングのための、非常に一体化されたシステムを形成することを理解する。

種々の利点のうちでも、本明細書中の教示は、可能な化学修飾の適合性をチェックするための、タンパク質およびペプチドについての質量分析計データから判断される、系統的な、可撓性の、そしてコンピュータにより効率的な様式を提供し得ることが理解される。

本明細書中で参照される全ての刊行物および特許出願は、各個々の刊行物または特許出願が、具体的にかつ個々に、参考として援用されることが示されていると同程度まで、本明細書中に参考として援用される。

当業者は、上記実施形態において、その教示から逸脱することなく多くの改変が可能であることを明らかに理解する。このような全ての改変は、本明細書に包含されることが意図される。

図１は、本教示の種々の実施形態に従って、実際の消化されたペプチドフラグメントの分子量を、対応する理論的ペプチドフラグメントと比較し、任意の重量差の原因となる潜在的なＰＴＭセットを選択し、そして選択されたＰＴＭセットの、理論的ペプチドフラグメントとの適合性を検証するために使用される分析システムの概略を示すブロック図である。図２は、本教示の種々の実施形態に従って、実際の消化されたペプチドフラグメントの分子量を、対応する理論的ペプチドフラグメントと比較し、任意の重量差の原因となる潜在的なＰＴＭセットを選択し、そしてこのＰＴＭセットの、理論的ペプチドフラグメントとの適合性を検証するための方法の概略を示すフローチャートである。図３は、プロテアーゼトリプシンを使用するタンパク質消化の例を示す。図４は、ペプチドマッピングの１つの方法の広範な概略を示す。図５は、アミノ酸残基セリン（Ｓ）のＯ−リン酸化の結果を示す。図６は、ＰＴＭセット｛Ｐｈ、Ｓｕ｝がアミノ酸配列：チロシン、イソロイシン、プロリン、グリシン、スレオニン、リジン（ＹＩＰＧＴＫ）と適合性であるか否かを検証するために使用される、二部グラフを示す。図７は、本教示の種々の実施形態に従って、増分路を使用して最大カージナリティー一致を見出す方法を示す。図８は、翻訳後修飾の、ユーザによって規定されるセットを選択するためのユーザインターフェースを示す。

Claims

翻訳後修飾を同定するためのペプチド質量マッピングにおける使用のための方法であって、以下：
ペプチドフラグメントの分子量を測定する工程；
該測定した分子量を、同じ配列を有する未修飾フラグメントについて予測された分子量と比較し、それによって、該未修飾フラグメントからの差異を確認する工程；
該ペプチドフラグメントおよび該修飾フラグメントの測定された分子量における差異を説明し得る、翻訳後修飾の１つ以上のセットを決定する工程；ならびに
グラフ理論公式化を適用して、該測定された分子量と可能な翻訳後修飾のセットとの間の化学的適合性を決定する工程、
を包含する、方法。
前記グラフ理論公式化が、二部グラフ中の最大カージナリティー一致を含む、請求項１に記載の方法。
実験的に確認された分子量を有するアミノ酸残基鎖と、既知のアミノ酸配列鎖と、翻訳後の化学修飾のセットとの間の適合性を決定するための方法であって、該方法は、以下：
各残基についての頂点、各修飾についての頂点および各適合性対についての辺を含む二部グラフを構築する工程；ならびに
（ｉ）２つの辺が１つの頂点を共有せず、そして（ｉｉ）全ての修飾が残基と対にされる、辺のセットを含む、最大カージナリティー一致を探す工程、
を包含する、方法。
化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定するための方法であって、該方法は、以下：
グラフを構築する工程；
最大カージナリティー一致を見出す工程；および
該カージナリティーが修飾の数と等しいか否かを決定する工程、
を包含する、方法。
前記最大カージナリティー一致が、
任意の一致を選択する工程、
増分路を見出す工程、
これを使用して新たな一致を規定する工程、および
このプロセスを、さらなる路が見出され得なくなるまで繰り返す工程、
によって見出される、請求項４に記載の方法。
ペプチド分析のための方法であって、該方法は、以下：
参照タンパク質から導出された理論的ペプチドの質量に対して、分析物ペプチドの測定された質量を比較する工程；および
グラフ理論公式化を適用して、該理論的ペプチドとの、翻訳後修飾（ＰＴＭ）の選択されたセット間の化学的適合性を決定する工程、
を包含し、それにより、１つ以上のペプチドを含み、１つ以上のＰＴＭを有する１つ以上のペプチドを含み、該分析物ペプチドの質量と一致する質量を有する、候補ペプチドのセットが展開される、方法。
前記分析物ペプチドの測定された質量が、タンパク質消化の質量分析によって決定される、請求項６に記載の方法。
機械により読み取り可能なプログラム格納デバイスであって、該デバイスは、ペプチド分析についての方法工程を実施するための、該機械によって実行可能な指示のプログラムを具体化し、該方法工程は、以下：
（ｉ）参照タンパク質から導出された理論的ペプチドの質量に対して、分析物ペプチドの測定された質量を比較する工程；および
（ｉｉ）グラフ理論公式化を適用して、該理論的ペプチドとの、翻訳後修飾（ＰＴＭ）の選択されたセットの化学的適合性を決定する工程、
を包含し、それにより、１つ以上のペプチドを含み、１つ以上のＰＴＭを有する１つ以上のペプチドを含み、該分析物ペプチドの質量と一致する質量を有する、候補ペプチドのセットが展開される、デバイス。
前記グラフ理論公式化が、二部グラフにおける最大カージナリティー一致を含む、請求項８に記載のデバイス。
機械により読み取り可能なプログラム格納デバイスであって、該デバイスは、ペプチド分析において使用するための方法工程を実施するための、該機械によって実行可能な指示のプログラムを具体化し、該方法工程は、以下：
グラフ理論公式化を適用して、化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定する工程、
を包含する、デバイス。
前記グラフ理論公式化が、二部グラフにおける最大カージナリティー一致を含む、請求項１０に記載のデバイス。
前記化学修飾が、翻訳後修飾を含む、請求項１０に記載のデバイス。
前記方法工程が、以下：
測定されたペプチド質量を、いくつかの化学修飾または化学修飾のセットを有する理論的ペプチドと関連付ける出力を提供する工程、
をさらに包含する、請求項１０に記載のデバイス。
分析物ペプチドの分析のためのコンピュータシステムにおける方法であって、該方法は、以下：
分析物ペプチドの質量を含む入力を受信する工程；
複数の翻訳後修飾（ＰＴＭ）を含むリストを、ユーザに提示する工程；ならびに
該複数のＰＴＭから導出された、ユーザにより選択されたセットを、該ユーザから受信する工程、
を包含する、方法。
翻訳後修飾の１つ以上のセットを決定する工程をさらに包含し、ここで、各セットが１つ以上の翻訳後修飾を含み、そして各セットが、規定された許容質量内の質量差を説明し得る、請求項１４に記載の方法。
前記理論的ペプチドとの化学的適合性についてチェックされた、前記ユーザにより選択されたセット由来の１つ以上のＰＴＭを有し、規定された許容質量内の前記分析物ペプチドの質量と一致する質量を有する、１つ以上の理論的ペプチドを前記ユーザに提示する工程、をさらに包含する、請求項１５に記載の方法。
前記化学的適合性チェックが、グラフ理論公式化による、請求項１４に記載の方法。
図式的ユーザインターフェースにおいて、ユーザが候補翻訳後修飾のセットを選択することを可能にする方法であって、該方法は、以下：
複数の翻訳後修飾（ＰＴＭ）を含むリストを、ユーザに提示する工程；および
該複数のＰＴＭから導出された、ユーザにより選択されたセットを、該ユーザから受信する工程、
を包含する、方法。
分析物ペプチドと理論的ペプチドとの間の、測定されたパラメータの差異に基づいて、候補翻訳後修飾のセットを選択するための方法であって、該方法は、以下：
分析物ペプチドのパラメータを測定する工程；
対応する理論的ペプチドについての以前の工程と同じパラメータを計算する工程；
該分析物ペプチドの測定されたパラメータと、該理論的ペプチドの計算されたパラメータとの間の差異を計算する工程；
翻訳後修飾のデータベースから、該差異を説明し得る１つ以上の翻訳後修飾を選択する工程；ならびに
該セットを報告する工程、
を包含する、方法。
前記測定されたパラメータが質量である、請求項１６に記載の方法。
機械により読み取り可能なプログラム格納デバイスであって、該デバイスは、候補翻訳後修飾のセットを選択する際に使用するための方法工程を実施するための、該機械によって実行可能な指示のプログラムを具体化し、該方法工程は、以下：
分析物ペプチドのパラメータを測定する工程；
対応する理論的ペプチドについて、以前の工程と同じパラメータを計算する工程；
該分析物ペプチドの測定されたパラメータと該理論的ペプチドの測定されたパラメータとの間の差異を計算する工程；
該ペプチドフラグメントおよび該未修飾フラグメントの測定された分子量における差異を説明し得る翻訳後修飾の１つ以上のセットを決定する工程；ならびに
該１つ以上のセットを報告する工程、
を包含する、デバイス。
前記測定されたパラメータが質量である、請求項２１に記載のデバイス。
ペプチド質量マッピングにおいて使用するための方法であって、グラフ理論公式化を適用して、化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定する工程を包含する、方法。
前記グラフ理論公式化が、二部グラフにおける最大カージナリティー一致を含む、請求項２３に記載の方法。
タンパク質またはペプチドを分析するためのシステムであって、以下：
ペプチド質量データを受信するための入力部分；
タンパク質配列のデータベース；
該入力部分および該タンパク質配列のデータベースと連絡するために適合された、ペプチド分析モジュール；
該ペプチド分析モジュールと連絡するために適合された、マイクロプロセッサ；
翻訳後修飾のデータベース；
該マイクロプロセッサおよび該翻訳後修飾のデータベースと連絡するために適合された、グラフ作成モジュール；ならびに
該グラフ作成モジュールと連絡するために適合された、出力部分、
を備える、システム。
前記出力部分と連絡するために適合されたユーザインターフェースをさらに備える、請求項２５に記載のシステム。
前記入力部分と連絡するために適合された質量分析計をさらに備える、請求項２５に記載のシステム。
前記マイクロプロセッサと連絡するために適合された格納構成要素をさらに備える、請求項２５に記載のシステム。
前記グラフ作成モジュールが、グラフ理論公式化を適用して、化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定するように構成されている、請求項２５に記載のシステム。