JP2005519284A - アミノ酸鎖に対する、化学修飾のセットの適合性の決定 - Google Patents
アミノ酸鎖に対する、化学修飾のセットの適合性の決定 Download PDFInfo
- Publication number
- JP2005519284A JP2005519284A JP2003573415A JP2003573415A JP2005519284A JP 2005519284 A JP2005519284 A JP 2005519284A JP 2003573415 A JP2003573415 A JP 2003573415A JP 2003573415 A JP2003573415 A JP 2003573415A JP 2005519284 A JP2005519284 A JP 2005519284A
- Authority
- JP
- Japan
- Prior art keywords
- peptide
- mass
- post
- theoretical
- modifications
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/0027—Methods for using particle spectrometers
- H01J49/0036—Step by step routines describing the handling of the data generated during a measurement
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Hematology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Urology & Nephrology (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Cell Biology (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
Abstract
ペプチド質量マッピングは、タンパク質消化の質量分析から決定された質量が、アミノ酸配列として特定された参照タンパク質由来の理論的ペプチドの質量と比較される技術である。いくつかの場合、実験的質量と理論的質量との間の差異は、しばしば、翻訳後修飾(PTM)の結果としての、参照に対して実際のタンパク質の化学修飾によって、説明され得る。代表的に、このような修飾は、特定のセットのアミノ酸残基に適用可能である。従って、これらの質量差異の分析は、PTMの同定を導き得る。種々の場合、このような分析は、一般に、ペプチドがいくつかの異なるPTMを有する可能性を可能にすることが所望され、さらに、種々の場合、ペプチド配列とのPTMの推定の組み合わせの化学的適合性が確認されることが所望される。本明細書中に記載される実施例において、適合性の確認は、グラフ理論における問題として公式化される。
Description
(分野)
本教示は、アミノ酸鎖に対する、化学修飾の適合性を決定および検証するためのシステムおよび方法に関する。
本教示は、アミノ酸鎖に対する、化学修飾の適合性を決定および検証するためのシステムおよび方法に関する。
(参考文献)
Boost Graph Library(http://www.boost.org/libs/graph/doc/index.html)
PapadimitriouおよびSteiglitz(1984),Combinatorial Optimization: Algorithms and Complexity
Sedgewick,R.(1988),Algorithms
Skiena,S.S.(1998),The Algorithm Design Manual。
Boost Graph Library(http://www.boost.org/libs/graph/doc/index.html)
PapadimitriouおよびSteiglitz(1984),Combinatorial Optimization: Algorithms and Complexity
Sedgewick,R.(1988),Algorithms
Skiena,S.S.(1998),The Algorithm Design Manual。
(導入)
ペプチド質量マッピングは、タンパク質消化物の質量分析から決定される質量が、参照タンパク質から誘導される理論的なペプチドの質量と比較され、アミノ酸配列として特定される、技術である。幾つかの状況において、実験での質量と理論的な質量との間の差は、理論に対する実際のタンパク質の化学修飾で説明され得る。これらの修飾はしばしば、1つ以上の翻訳後修飾(PTM)の結果である。代表的に、このような修飾は、特定のアミノ酸残基またはアミノ酸残基のセットに適用可能である。これらの質量差の分析は、それゆえに、特定のペプチドに適合し得る潜在的なPTMの同定を導き得る。従って、一般的に、このような分析により、幾つかの異なるPTMを有するペプチドの可能性を許容することが望ましく、そしてさらに、推定PTMセットとペプチド配列とが、化学的に適合性であることを検証することが、望ましい。
ペプチド質量マッピングは、タンパク質消化物の質量分析から決定される質量が、参照タンパク質から誘導される理論的なペプチドの質量と比較され、アミノ酸配列として特定される、技術である。幾つかの状況において、実験での質量と理論的な質量との間の差は、理論に対する実際のタンパク質の化学修飾で説明され得る。これらの修飾はしばしば、1つ以上の翻訳後修飾(PTM)の結果である。代表的に、このような修飾は、特定のアミノ酸残基またはアミノ酸残基のセットに適用可能である。これらの質量差の分析は、それゆえに、特定のペプチドに適合し得る潜在的なPTMの同定を導き得る。従って、一般的に、このような分析により、幾つかの異なるPTMを有するペプチドの可能性を許容することが望ましく、そしてさらに、推定PTMセットとペプチド配列とが、化学的に適合性であることを検証することが、望ましい。
(要旨)
本教示の種々の実施形態は、生体高分子(例えば、アミノ酸鎖)に対する、化学修飾の適合性を決定および検証するためのシステムおよび方法を提供する。
本教示の種々の実施形態は、生体高分子(例えば、アミノ酸鎖)に対する、化学修飾の適合性を決定および検証するためのシステムおよび方法を提供する。
種々の実施形態に従って、適合性の検証は、グラフ理論における問題として公式化(formulate)される。解決法の理論および実施が、本明細書に考察および記載される。
本教示の種々の実施形態は、グラフ理論(例えば、二部グラフにおける最大カージナリティー一致(maximum cardinality matching))を適用して、化学修飾のセットとのアミノ酸鎖の化学的適合性を決定するシステムを提供する。
他の実施形態は、翻訳後修飾を同定するためのペプチド質量マッピングにおける使用についての方法を包含し、この方法は、ペプチドフラグメントの分子量を測定する工程、この測定された分子量と、同じ配列を有する非修飾フラグメントについて予想される分子量とを比較し、それによって、未修飾フラグメントからの差異を確認する工程、およびグラフ理論公式化(graph theory formulation)を適用して、測定された分子量と可能な翻訳後修飾のセットとの間の適合性を決定する工程を包含する。
なお他の実施形態は、グラフ理論公式化が、二部グラフにおいて最大カージナリティー一致を含む方法を包含する。
他の実施形態は、実験的に確かめられた分子量を有するアミノ酸残基鎖と既知のアミノ酸配列と、翻訳後修飾のセットとの間の適合性を決定するための方法を包含し、この方法は、各残基についての頂点、各修飾についての頂点、および各適合性の対についての辺を含む二部グラフを構築する工程;ならびに辺のセットを含む最大カージナリティー一致を探す工程を包含し、(i)ここで、2つの辺は、頂点を共有せず、そして(ii)ここで、全ての修飾が、残基と対にされる。
さらなる実施形態は、化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定するための方法を包含し、この方法は、グラフを構築する工程、最大カージナリティー一致を見出す工程、およびこのカージナリティーが修飾の数に等しいか否かを決定する工程を包含する。
種々の局面はまた、グラフ理論公式化を適用して、化学修飾のセットに対する、アミノ酸残基鎖の化学的適合性を決定するための方法に関する。特定の実施形態において、グラフ理論公式化は、二部グラフにおける最大カージナリティー一致を含む。
さらなる局面は、可能性のある化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定するプロセスに関する。種々の実施形態において、このプロセスは、各残基についての頂点、各修飾についての頂点、および各適合性対についての辺を有する二部グラフを構築する工程を包含する。次いで、このプロセスは、辺のセットの最大カージナリティー一致を探し、ここで、(i)2つの辺は、頂点を共有せず、そして(ii)全ての修飾は、残基と対にする。
さらなる局面は、化学修飾のセットとの、アミノ酸残基鎖の化学的適合性を決定するための方法に関し、この方法は、以下の工程を包含する:グラフを構築する工程、最大カージナリティー一致を見出す工程、およびこのカージナリティー(辺の数)が修飾の数に等しいか否かを決定する工程。特定の実施形態において、最大カージナリティー一致は、任意の一致(空の一致は、妥当であり、かつ簡便である)を選択し、増分路(augmenting path)を見出し、次いで、この路を使用して新しい一致を規定することによって見出される。このプロセスは、次いで、さらなる路が見出され得なくなるまで繰り返される。
種々の局面は、ペプチド分析のための方法に関し、この方法は、分析物ペプチドの測定された質量と参照タンパク質から誘導される理論的ペプチドの質量とを比較する工程、およびグラフ理論公式化を適用して、理論的ペプチドとの翻訳後修飾(PTM)の選択されたセットの化学的適合性を決定する工程を包含し、それにより、候補ペプチドのセットは、1つ以上のペプチドを有するように展開(develop)され、この候補ペプチドのセットは、1つ以上のPTMを保有し、上記分析物ペプチドと類似する質量を有する1つ以上のペプチドを含む。
種々の実施形態に従って、分析物ペプチドの測定された質量は、タンパク質消化物の質量分析によって決定される。さらなる局面は、機械によって読み取り可能なプログラム格納デバイスに関し、このデバイスは、機械によって実行可能な指示のプラグラムを具体化して、ペプチド分析物に関する方法工程を実施する。種々の実施形態において、この方法工程は、(i)分析物ペプチドの測定された質量と参照タンパク質から誘導される理論的ペプチドの質量とを比較する工程、および(ii)グラフ理論公式化を適用して、選択されたセットの翻訳後修飾の、理論的ペプチドとの化学的適合性を決定する工程を包含し、それにより、候補ペプチドのセットは、1つ以上のペプチドを有するように展開され、この候補ペプチドのセットは、1つ以上のPTMを保有し、上記分析物ペプチドと類似する質量を有する1つ以上のペプチドを含む。
種々の実施形態において、グラフ理論公式化は、二部グラフにおいて最大カージナリティー一致を含む。
さらなる局面は、機械によって読み取り可能な、機械によって実行可能な指示のプログラムを実施してペプチド分析において使用するための方法工程を実行する、プログラム格納デバイスに関する。種々の実施形態において、この方法工程は、グラフ理論の公式化を適用して、アミノ酸残基鎖の、化学修飾のセットとの化学的適合性を決定する工程を包含する。
特定の実施形態において、グラフ理論公式化は、二部グラフにおける最大カージナリティー一致を包含する。
種々の実施形態によれば、化学修飾としては、翻訳後修飾が挙げられる。
種々の実施形態に従って、この方法工程は、測定されたペプチド質量を、何らかの化学修飾または化学修飾のセットを有する理論的ペプチドと関連付ける出力を提供する工程をさらに包含する。
種々の実施形態は、分析物ペプチドと理論的ペプチドとの間の測定されたパラメータの差異に基づいて、翻訳後修飾の候補セットのセットを選択するコンピュータシステムを包含する。
さらなる局面は、分析物ペプチドを分析するためのコンピュータシステムにおける方法に関し、この方法は、分析物ペプチドの測定された質量を有する入力を受信する工程、複数の翻訳後修飾(PTM)を含むリストをユーザに提示する工程、複数のPTMから選択された、ユーザにより選択されるセットを、ユーザから受信する工程、および1つ以上の理論的ペプチドをユーザに提示する工程であって、この理論的ペプチドは、理論的ペプチドとの化学的適合性についてチェックされた、ユーザにより選択されるセット由来の1つ以上のPTMを保有し、規定された質量許容内で、分析物ペプチドの質量と同じかまたは類似の質量を有する、工程を包含する。
特定の実施形態に従って、マッピングは、データファイル(例えば、質量分光写真由来)において見出されるピークの分子量を、既知のタンパク質(これは、本教示によれば、適合性をチェックされた化学修飾を含み得る)の配列から推定されるペプチドの分子量に一致させる。分子量が質量許容内で一致する場合、その研究において使用されるタンパク質の正体が確認され得る。種々の実施形態において、質量許容は、ユーザによって選択され得る。例えば、±5の質量単位、±10の質量単位、±25の質量単位、±50の質量単位、±100の質量単位、±500の質量単位、または他の数が、ユーザによって選択され得る。
(定義)
分析物ペプチド−分析物ペプチドとは、同定および特徴付けを受けているペプチドである。同定としては、その質量、配列、その起源のタンパク質、およびそれが受け得た任意の修飾の決定が挙げられ得るが、これらに限定されない。
分析物ペプチド−分析物ペプチドとは、同定および特徴付けを受けているペプチドである。同定としては、その質量、配列、その起源のタンパク質、およびそれが受け得た任意の修飾の決定が挙げられ得るが、これらに限定されない。
二部グラフ−2種類のみの頂点を有し、そして辺が異なる種類の節の間でのみ可能であるグラフ。
化学的適合性−ペプチドおよび翻訳後修飾のセットの文脈において使用される場合、この用語は、翻訳後修飾のセットにおける各翻訳後修飾が、ペプチドフラグメントにおける異なるアミノ酸配列に割り当てられ得、その結果、アミノ酸が受け得る修飾を特定する化学的適合性規則が満足されることを示す。単一の翻訳後修飾および単一のアミノ酸の文脈において使用される場合、この用語は、問題のアミノ酸が、問題の修飾を受け得ることを示す。
対応−2つのペプチドフラグメントの文脈において使用される場合、参照ペプチドフラグメントが、目的のペプチドフラグメントと同じアミノ酸配列を有することを示す。
適合性(化学的適合性を参照のこと)。
ペプチド(質量)フィンガープリンティング(PMF)−質量分析によるタンパク質同定のために最も一般的に使用されるストラテジーは、ペプチド質量フィンガープリンティングである。標的タンパク質が、タンパク質分解酵素(例えば、トリプシン)で消化され、そして質量分光計が、この消化から誘導される少数のペプチドの正確な質量を測定する。これらの質量は、既知のタンパク質配列のデータベースから計算されたペプチドフラグメントの理論的リストと比較される。約4〜5ペプチドの質量が、既知のアミノ酸配列のタンパク質を明瞭に同定するために、一般に十分である。しかし、既知のタンパク質配列のデータベースが大きくなるにつれて、特定のタンパク質を同定するために必要とされるデータの量が増加する。従って、ペプチド質量フィンガープリンティングによる信頼性のある同定は、ペプチド質量の数の増加、および非常に正確な質量測定の両方を必要とする。同様に、PMFは、ペプチドおよびそれらに関連する任意の翻訳後修飾の、非常に正確な同定を必要とする。
ペプチド(質量)マッピング−分析物ペプチドを理論的ペプチドと一致させるためのアルゴリズムを使用して、分析物ペプチドを同定する方法。一致は、一般に、分子量に基づいてなされるが、生物分子の他の特徴が使用され得る。しばしば、一致は接近しているが、正確ではなく、そして他の方法が、差異の源を同定するために使用される。翻訳後修飾は、しばしば、分子量の不一致を生じる。
翻訳後修飾(PTM)−PTMは、翻訳の間または翻訳後にポリペプチドまたはタンパク質に影響を与える、任意の修飾を包含する。
参照ペプチド−理論的ペプチドと同じ。
理論的ペプチド−理論的ペプチドとは、分析物ペプチドと比較するために使用されるペプチドである。これはしばしば、分子量および配列組成に基づいて、分析物ペプチドと比較される。参照ペプチドは、参照タンパク質を起源とし得るか、またはタンパク質への会合なしでそれら自体での実体であり得る。所定のタンパク質に対する理論的ペプチドは、タンパク質のインシリコでの消化によって生成し得る。
(種々の実施形態の説明)
タンパク質は、大部分の細胞の乾燥重量の50%より多くを占め、そして細胞が行うほとんど全てのことに貢献する。例えば、タンパク質は、構造支持、貯蔵、輸送、シグナル伝達、運動、および防御のために使用される。さらに、酵素のように、タンパク質は、細胞において必要な化学反応を選択的に加速する。
タンパク質は、大部分の細胞の乾燥重量の50%より多くを占め、そして細胞が行うほとんど全てのことに貢献する。例えば、タンパク質は、構造支持、貯蔵、輸送、シグナル伝達、運動、および防御のために使用される。さらに、酵素のように、タンパク質は、細胞において必要な化学反応を選択的に加速する。
それらの広範な機能とは対照的に、タンパク質は、細胞において、最も構造的に複雑な高分子である。タンパク質は、構造が広範に変化し、独特の三次元形状を有する各型のタンパク質が、それらの特定の機能に対応する。タンパク質は個々に異なるが、これらは全て、同じセットのアミノ酸(タンパク質の普遍のモノマー)から構成されるポリマーである。
タンパク質合成または翻訳は、脱水合成によってアミノ酸を連結し、ペプチド結合を形成することを包含する。アミノ酸の鎖はまた、ポリペプチドとして公知である。翻訳中および翻訳後に、ポリペプチド鎖はコイルになり始め、そして同時に折り畳まれ始めて、特定の三次元コンホメーションの機能的タンパク質を形成する。いくつかのタンパク質は、1つのみのポリペプチド鎖を含み、一方で他のタンパク質(例えば、ヘモグロビン)は、一緒に組み合わさったいくつかのポリペプチド鎖を含む。各ポリペプチドまたはタンパク質におけるアミノ酸の配列は、そのタンパク質に対して独特であり、従って、各タンパク質が、その独自の、独特の三次元形状を有する。
ほとんどのタンパク質について、タンパク質がその特定の仕事を行い得る前に、さらなる工程を必要とする。従って、ポリペプチドまたはタンパク質の特定のアミノ酸が、翻訳中または翻訳後に化学的に修飾され得る。本明細書中において使用される場合、用語「翻訳後修飾」(PTM)は、翻訳中または翻訳後のポリペプチドまたはタンパク質に影響を与える、任意の修飾を包含する。多くの型のPTMが存在する。PTMとしては、例えば、タンパク質分解切断、グリコシル化、アシル化、メチル化、リン酸化、硫酸化、プレニル化、ヒドロキシル化、カルボキシル化などが挙げられる。
特定の一般的規則が、PTMに適用され得る。何よりもまず、任意の所定の修飾が、特別に規定されたアミノ酸残基またはアミノ酸配列にのみ影響を与え得る点で、特別である。例えば、修飾O−リン鎖化は、OH側鎖を有するアミノ酸残基(セリン、スレオニン、およびチロシン(S、T、Y))にのみ適用され得る。さらに、一旦、アミノ酸残基が修飾されると、これは、別の修飾を受け入れないようである。さらに、各特定の修飾が、そのアミノ酸配列の分子量に有効な変化を生じる。任意の所定のPTMの分子量は、それが当該分野において公知でない場合には、容易に計算され得る。図5は、アミノ酸残基セリン(S)のO−リン酸化の結果を示す。この特定の修飾は、アミノ酸の分子量を約80ダルトン増加させる。
当業者は、ペプチドの翻訳後修飾(PTM)の根底にある機構をより完全に理解し、そしてプロテオミクスの一般的な分野は、大いに進歩している。特に、当業者は、タンパク質合成およびその機能との関係について、より大きい洞察力を有する。
一般に、本明細書中に記載される合成および方法の種々の実施形態は、アミノ酸残基の所定の配列が、特定のセットのPTMを受容し得るか否かを決定することに関する。いくつかの限定された場合において、この問題は、困難ではない。例えば、1「種類」のみの修飾が考慮される場合、1つの解決法は、単に、この種の修飾に適合する十分なアミノ酸残基が存在するか否かを確かめることである。例えば、アミノ酸残基S、T、およびYに適用可能なO−リン酸化(Ph)のみに興味があり、そして選択されるPTMセットが{Ph,Ph}である場合、当業者は、配列YIPGTKがこれを受容し得ることを、調査によって容易に検証し得る。(この特定の配列は、Ph修飾の各々を受容するために利用可能な2つのアミノ酸残基(TおよびY)を有する)。
PTMセットにおけるいずれの修飾も、その配列中のいずれの残基に対しても適用され得ない場合、または利用可能な残基より多い修飾が存在する場合、PTMセットは適合性ではない。一般的な問題を説明する例として、TPMセット{Ph,Su}を考える。ここで、Suは、アミノ酸残基Yのみを修飾し得るO−スルホン化を表し、そしてPhは、アミノ酸残基S、T、およびYのみを修飾し得るO−リン酸化を表す。さらに、実施者が、このPTMセット{Ph,Su}がアミノ酸残基配列YIPGTKと適合性であるか否かを検証したいとする。Phがまず考慮され、そしてYと一致する場合、Suに対して利用可能な一致は存在しない。あるいは、Suがまず考慮され、これがYと一致し、次いでPhがTと一致し得る場合、PTMセット{Ph,Su}およびアミノ酸配列YIPGTKが実際に適合性であるという正しい結論を導く。
全ての可能な一致を単純に数値化することは、多くの場合において受容不可能に遅いようであるので、上記例は、可能な一致の系統的分析に対する必要性を説明する。従って、本明細書中の種々の実施形態は、グラフ理論に基づく、構成的な、時間効率的な解決法を提供する。
ここで、本教示の種々の実施形態が参照される。本教示は、種々の実施形態の組み合わせで記載されるが、これらは限定することを意図されないことが、理解される。逆に、本教示は、本教示に含まれ得る代替物、改変物、および均等物を網羅すると意図される。
図1は、種々の実施形態に従う、分析システム100の概略を示し、これは、実際に消化されるペプチドフラグメントの分子量を、対応する理論的ペプチドフラグメントと比較し、任意の質量差の原因となる潜在的なPTMセットを選択し、そして選択されたPTMセットの、理論的ペプチドフラグメントとの適合性を検証するために使用される。
分析システム100は、代表的なコンピュータ装置であり得、そして例えば、マザーボード、コンピュータハードウェア、およびソフトウェアを備え得る。マザーボードは、中央処理装置(CPU)、ベーシック入出力システム(BIOS)、1つ以上のRAMメモリデバイス、1つ以上のROMメモリデバイス、磁気格納デバイスまたは光学格納デバイス(例えば、ハードディスク格納)に接続された大容量格納装置インターフェース、1つ以上のフロッピー(登録商標)ドライブまたはリムーバブルドライブ(例えば、CDまたはDVD)を備え得る。システム100はまた、例えば、シリアルポート、パラレルポート、USBポート、IEEE 1394ポートおよび拡張スロットを備え得る。分析システム100のモジュールおよびデータベースは、データフローおよび分析を管理するマイクロプロセッサ110とともに作動する。任意の利用可能なマイクロプロセッサが、本明細書中で使用され得、例えば、Intel Pentium(登録商標)、Intel Celeron(登録商標)またはAMD(登録商標)マイクロプロセッサが挙げられる。
分析システム100は、種々の操作システム(MS−DOS(登録商標)、Microsoft(登録商標)、Windows(登録商標)、Linux(登録商標)またはLindows(登録商標)が挙げられる)のいずれかを実行する、IBM適合性のパーソナルコンピュータであり得る。あるいは、モジュールは、他のコンピュータ環境(UNIX(登録商標)およびVMS(登録商標)のようなメインフレームシステム、またはMacintosh(登録商標)パーソナルコンピュータ環境が挙げられる)上で実行し得る。
当業者は、これらの要素が、必ずしも単一のユニット(例えば、パーソナルコンピュータまたはメインフレーム)において接続される必要がなく、ネットワークにわたり得るか、または電気通信リンクを介し得ることを認識する。上記コンピュータハードウェアは、独立システムとして作動し得るか、またはローカルエリアネットワークの一部であり得るか、または中央システムに接続される一連の端末を備え得る。
分析システム100は、ユーザインターフェース180と相互作用する、1つ以上のモジュールおよびデータベースを備え得る。種々の実施形態において、ユーザインターフェース180は、例えば、ディスプレイモニタ、プリンタ、キーボード、および/またはマウスもしくはトラックボール(図示せず)を備え得る。ユーザインターフェース180は、ユーザが、分析システム100内のモジュールおよびデータベースを制御および改変することを可能にする。さらに、ユーザインターフェース180は、分析システム100からデータ出力を受信し、ユーザが分析を受信することを可能にする。
質量分析計140は、分析システム100に接続され、そしてタンパク質由来の消化されたペプチドフラグメントの分析後に、質量スペクトルデータを分析システム100に送信する。一般に、分光計140は、分子のフラグメントを、これらを電場および磁場を介してイオン形態で通すことによって、質量に従って分離する機器である。分光計140は、これらの場を検出し、そしてデータを質量スペクトルに変換し、このスペクトルが、特定のペプチドの化学式、化学構造、および分子量を見出すために使用され得る。任意の型の質量分析計が、本明細書中に記載される方法およびシステムとともに使用され得、液体クロマトグラフィー−質量分析計(LC/MS)、液体クロマトグラフィー−タンデム質量分析計(LC/MS/MS)、ガスクロマトグラフィー−質量分析計(GC/MS)、およびガスクロマトグラフィー−タンデム質量分析計(GM/MS/MS)が挙げられるが、これらに限定されない。本明細書中の教示と組み合わせて有用な例示的な分光計としては、とりわけ、API 150、API 2000、API 3000、API 4000、API QSTAR、Q TRAP、Voyager、およびApplied Biosystems 4700(Applied Biosystems(Foster City,CA)から入手可能)が挙げられる。
分析システム100におけるペプチド分析モジュール120は、スペクトル分析が可能なソフトウェアを備える。より具体的には、このソフトウェアは、配列決定、ペプチドマッピングおよびペプチド質量フラグメント化を実施し得、そして他の生物学的に関連する計算を行い得る。ペプチド分析モジュールは、ペプチドの同定および特徴付けのための一体化されたセットのデータ処理ツールを形成するように構成され得る。
いくつかの実施形態において、ペプチド分析モジュールは、さらに、ペプチドフラグメントの分子量を計算するユーティリティを一体化し得る。他の実施形態において、ペプチド分析モジュールは、データディクショナリにアクセスし得る。このようなディクショナリは、元素、アミノ酸、修飾、消化剤および核酸のような化学的情報を含み、そして修飾、付加、および切断剤をユーザが容易に規定することを可能にする。当業者は、データディクショナリが、しばしば、データベースに格納されることに留意する。なお他の実施形態は、ユーティリティおよびデータディクショナリを完全に一体化し、そしてまずペプチドの分子量を決定し、次いで一体化されたマッピング、配列決定、およびフィンガープリンティングツールを発動して、タンパク質を同定し、タンパク質を配列決定し、そしてペプチドおよび部分配列タグを同定することによって、データ分析を自動化する。この分析の結果は、結果表にまとめられ得、そして再構築されたスペクトルに関連付けられ得、これが次いで、より高次の分析(例えば、タンパク質同定のためのさらなる証拠を提供する、より洗練された形態のペプチドマッピングおよび配列決定)のために使用され得る。
種々の実施形態において、ペプチド分析モジュール120は、複数の上記特徴を組み込まれ得る。1つ以上のこのような特徴を含む例示的なソフトウェアとしては、とりわけ、PepMAPPER(UMIST,UKから入手可能)、BioAnalystTMソフトウェア(Applied Biosystems,Foster City,CAから入手可能)、MascotTM(Matrix Science,Londonから入手可能)、PepSeaTM(Protana,Denmarkから入手可能)、またはPeptideSearch(EMBL,Heidelbergから入手可能)が挙げられるが、これらに限定されない。上に列挙したソフトウェアならびにタンパク質およびペプチドフラグメントを特徴付ける際に有用な他の関連するソフトウェアは、本明細書中に提供される方法およびシステムに従って、使用され得る。種々の実施形態において、本教示の1つ以上が、ちょうど上に列挙されたようなソフトウェアプログラムにおいて実施される。
ペプチドフラグメントについての質量分析データを、分光計140から受信した後に、ペプチド分析モジュール120は、そのペプチドフラグメントの重量を計算する。この分析の後に、ペプチド分析モジュール120は、ペプチドフラグメントの質量と、関連する参照ペプチドの質量との間の対応を探す。用語「対応」とは、2つのペプチドフラグメントの文脈で使用される場合、参照ペプチドフラグメントが、目的のペプチドフラグメントと同じアミノ酸配列を有することを示す。理論的ペプチドの質量、および入手可能である場合、これらが起源とする対応する参照タンパク質の配列は、タンパク質配列のデータベース150に格納される。このデータベースは、多くのこのような参照ペプチドおよびこれらの対応する理論的ペプチドを含む。タンパク質配列のデータベース150は、分析物ペプチドフラグメントとの比較のために、ペプチド分析モジュール120によって使用され得る、参照タンパク質およびペプチド配列のライブラリーを含む、格納部位である。種々の実施形態において、タンパク質配列のデータベース150はまた、データディクショナリを備え、これは、先に述べたように、生物学的に関連する計算の決定のために有用な化学的情報を含む。
対応する参照ペプチドフラグメントについてのデータを、タンパク質配列のデータベース150から受信した後に、ペプチド分析モジュール120は、分析物ペプチドフラグメントと理論的ペプチドフラグメントとの間の分子量差を計算する。分子量差が計算された後に、ペプチド分析モジュール120は、このデータを格納部位160に送信する。
格納部位160は、分子量差のデータをペプチド分析モジュール120から受信する。格納部位160は、例えば、電子的メモリ(例えば、RAM)を保持し得る任意の部位であり得る。
グラフ作成モジュール130は、分析物ペプチドフラグメントと理論的ペプチドフラグメントとの間の重量差についてのデータを、格納部位160から選択および受信し得るソフトウェアを備え得る。種々の実施形態において、さらに、グラフ作成モジュールは、理論的ペプチドフラグメントの配列を示す情報を受信し得る。また、グラフ作成モジュール130におけるソフトウェアは、潜在的なPTMセットを、翻訳後修飾データベース170から、格納部位160から受信された重量差に基づいて選択および受信し得る。分析物ペプチドと理論的ペプチドとの間の質量の差の原因となり得る、1つより多くのPTMセットが存在し得るので、PTMセットのリストは、最初にユーザに、どのPTMが考慮されるべきかを特定させることによって、形成され得る。種々の実施形態において、このことは、図8に示されるようなユーザインターフェースによって達成され得る。いくつかの実施形態において、このリストのメンバー(左上の角に示される)は、目的のアミノ酸鎖(例えば、ペプチド)のアミノ酸との化学的適合性について、予めスクリーニングされていない、一般的なリストを含み得る。他の種々の実施形態において、このリストは、メンバーが、目的のアミノ酸鎖(例えば、ペプチド)のアミノ酸と化学的に適合性であることが既知であるように、予めスクリーニングされ得る。次いで、グラフ作成モジュールは、質量の差の原因となり得る、1つ以上のPTMセットを形成し得る。
種々の実施形態において、グラフ作成モジュール130は、グラフを構築し、そして最大カージナリティー一致を決定し得るソフトウェアを備える。グラフ作成モジュール130は、グラフ理論を使用して、選択された翻訳後修飾セットが理論的ペプチドフラグメントのアミノ酸配列と適合性であるか否かを決定し得る。当業者は、最大カージナリティー一致を実施するいくつかの方法が存在し、これらの1つは、増分路アルゴリズムを使用することを理解する。PTMセットが理論的ペプチドのアミノ酸配列と適合性である場合、そのデータは、格納部位160に送信され得、この格納部位は、ユーザインターフェース180によってアクセスされ得る。PTMセットが理論的ペプチドのアミノ酸配列と適合性ではない場合、グラフ作成モジュール130は、別の潜在的なPTMセットを、翻訳後修飾データベース170から選択および受信し得る。
図2は、実験的ペプチドフラグメントの分子量を、対応する参照ペプチドフラグメントと比較し、任意の重量差の原因となる潜在的なPTMセットを選択し、そしてこのPTMセットの、参照ペプチドフラグメントとの適合性を検証するための、種々の実施形態に従う方法の概略を示すフローチャートである。プロセス200は、開始段階202において開始し、そして段階204に進行し、ここで、消化されたタンパク質由来のペプチドフラグメントの分子量が決定される。この消化されたタンパク質は、消化前に既知であり得るか、またはその同定がペプチド質量フィンガープリンティングを介して確認され得るかの、いずれかであり得る。
段階204は、適切な手段(例えば、プロテアーゼ(例えば、トリプシンまたはペプシンまたは他のプロテアーゼ))によって、タンパク質を消化する工程を包含する。図3は、プロテアーゼトリプシンを使用する、タンパク質消化の例を示す。次いで、消化されたペプチドフラグメントは、分光計140において、質量分析を受ける。種々の実施形態によれば、質量分析の一般的なプロセスは、以下のうちの1つ以上を包含し得る。ペプチドフラグメントが、まず気化およびイオン化される;そのイオンが電場によって加速され、次いで磁場によって、湾曲した軌道(これは、これらのイオンの質量および電荷に依存する)に偏向される。次いで、これらのイオンは、質量スペクトルとして、写真的または電気的に検出される。質量スペクトルは、一連のピークを含み、各々が、異なるイオンに対応する。従って、ペプチドフラグメントの質量スペクトルは、次いで、その式、化学構造、および分子量を見出すために使用され得る。任意の型の質量分光計が、本明細書中に記載される方法およびシステムとともに使用され得、これには、液体クロマトグラフィー−質量分析計(LC/MS)、液体クロマトグラフィー−タンデム質量分析計(LC/MS/MS)、ガスクロマトグラフィー−質量分析計(GC/MS)、およびガスクロマトグラフィー−タンデム質量分析計(GM/MS/MS)が挙げられるが、これらに限定されない。
なお、段階204において、ペプチド分析モジュール120は、得られる質量スペクトルデータを受信し、そしてソフトウェアを利用して、スペクトル分析を受け、分析物ペプチドフラグメントの分子量を決定する。このようなことが可能な例示的な市販のプログラムは、Analyst(登録商標)QS(Applied Biosystems,Foster City,CAから入手可能)、およびMillenium(登録商標)32(Waters,Milford,MAから入手可能)である。種々の実施形態において、ユーティリティは、元素組成およびアミノ酸組成を質量に変換し得、そして逆もまた可能である。この機能は、例えば、アミノ酸置換を比較して、観察された質量差を説明するため、および複数の荷電イオン系列または同位体分布から質量を計算するために有用であり得る。顕著なことには、このようなユーティリティは、翻訳後修飾の分子量を計算し得る。分析物ペプチドフラグメントの分子量が計算された後に、プロセス200は、段階208に進み、ここで、対応する参照ペプチドフラグメントが、ペプチド分析モジュール120において、例示的なペプチドフラグメントにマッピングされる。一般に、単純なペプチドマッピングは、分析物タンパク質の消化についての質量分析によって決定された分子量を、理論的な参照タンパク質からの可能なペプチド質量と比較する工程を包含する。図4は、ペプチドマッピングの1つの方法の広範な概略を提供する。
ペプチドマッピングを実施するために、ペプチド分析モジュール120は、分析物ペプチドフラグメントと同じアミノ酸配列を有する理論的ペプチドフラグメントを、タンパク質配列のデータベース150から選択する。この決定は、例えば、分子量の比較に基づいてなされ得る。1つの実施形態において、消化された既知の分析物タンパク質の構造に対応する理論的タンパク質が選択され、そして実際の消化において使用されたプロテアーゼの消化パターンに基づいて、仮想的な消化を受ける。別の実施形態において、タンパク質は既知ではないかもしれず、そしてペプチド質量フィンガープリンティングを介して同定されることになっている。理論的なタンパク質は、化学的に修飾され得る、実際に試験されるタンパク質に関して、標準的なアミノ酸残基の配列として特定され得る。これらの修飾は、通常、翻訳中または翻訳後のいずれかに起こる。いくつかの実施形態において、変異がその配列における消化パターンをまた変化させ得ることに注意して、配列変異もまた、修飾としてモデル化され得る。
種々の実施形態において、ソフトウェアにおいて実施されるペプチドマッピング機能は、質量スペクトルデータから誘導された分析物ペプチドの分子量を、仮想的タンパク質消化から誘導された対応する理論的なペプチド質量に相関付ける。他の実施形態において、マッピングソフトウェアは、ペプチドの分子量を自動的に決定し、次いで、一体化されたマッピングおよび配列決定ツールを利用して、修飾、配列、または部分的な配列タグを見出す。質量フィンガープリンティングのなお他の実施形態において、複数のタンパク質が、単に迅速にデータセットにマッピングされ、そしてデータディクショナリからの修飾が、付加または欠失され得る。いくつかの実施形態において、ソフトウェアは、生スペクトルおよびデコンボリューションされた(deconvoluted)スペクトルをマッピングおよび表示し、そしてマッピングおよび/またはフィンガープリンティングの結果を、表にまとめる。ペプチド質量フィンガープリンティングは、種々の利用可能なソフトウェアを使用して達成され得、これらには、例えば、PepMAPPER(UMIST,UKから入手可能)、MascotTM(Matrix Science Ltd.,Londonから入手可能)、BioAnalystTMソフトウェア(Applied Biosystems,Foster City,CAから入手可能)、PepSeaTM(Protana,Denmarkから入手可能)、またはPeptideSearch(EMBL,Heidelbergから入手可能)が挙げられる。
分析物ペプチドフラグメントと理論的ペプチドフラグメントとの間の分子量の差異を計算した後に、プロセス200は、決定段階216に達する。決定段階216において、ペプチド分析モジュール120は、実際のペプチドおよび理論的なペプチドが、同じ分子量を有するか否かを決定する。これらのペプチドが同じ分子量を有する場合、プロセス200は、決定段階216から別の決定段階220へと進み、タンパク質消化から分析されるさらなる分析物ペプチドフラグメントが存在するか否かを決定する。あるいは、ペプチド分析モジュール120が、決定段階216において、実際のペプチドフラグメントおよび理論的ペプチドフラグメントが異なる分子量を有することを決定する場合、プロセス200は、段階228に進む。
理論的ペプチドフラグメントと分析物ペプチドフラグメントとの両方が同じ分子量を有する状況をまず記載すると、ペプチド分析モジュール120は、決定段階220において、分析物ペプチドフラグメントからの、さらなる質量スペクトルデータが存在するか否かを決定する。利用可能なさらなる質量スペクトルデータが存在しない場合、プロセス200は、終了段階256に進む。あるいは、ペプチド分析モジュール120が、さらなる分析物ペプチドフラグメントについてのさらなる質量スペクトルデータが存在することを決定する場合、プロセス200は段階224に進み、ここで、次の分析物ペプチドについての質量スペクトルデータが、ペプチド分析モジュール120によって選択される。一旦選択されると、プロセス200は段階204に戻り、ここで、ペプチド分析モジュール120は、質量スペクトルデータに基づいて、分析物ペプチドフラグメントを配列決定し、そしてこのフラグメントの分子量を決定する。
決定段階216に戻って、ペプチド分析モジュール120が、理論的ペプチドフラグメントおよび分析物ペプチドフラグメントが異なる分子量を有することを決定する場合、プロセス200は段階228に進み、ここで、理論的ペプチドフラグメントの分子量の差異およびアミノ酸配列が、格納部位160に転送される。グラフ作成モジュール130は、理論的なペプチドフラグメントのアミノ酸配列および分子量の差異の計算についてのデータを、格納部位160から選択し、そして受信する。
このデータを受信した後に、グラフ作成モジュール130は、第一の翻訳後修飾(PTM)セットを、PTMデータベース170から選択し、そして受信する。PTMデータベース170は、多数の潜在的なペプチドの翻訳後修飾およびこれらの対応する分子量についてのデータを含む、格納部位である。格納部位160から受信された分子量の差異のデータに基づいて、グラフ作成モジュール130は、理論的ペプチドフラグメントと分析物ペプチドフラグメントとの間の重量差の原因となり得る、潜在的なPTMセットをPTMデータベース170から選択する。
ペプチドフラグメントに対する任意の特定のPTMは、そのペプチドの質量分布における、予測可能なシフトを引き起こす。従って、観察されるシフトを使用して、PTMのセットの可能な存在を推論し得る。代表的に、修飾は、特定の要件に合うアミノ酸(例えば、特定の側鎖化学または特定の配列位置を有する)においてのみ起こる。従って、選択されたPTMセットの、アミノ酸配列との適合性を確認することが望ましくあり得る。本明細書中に記載される実施形態によれば、グラフ理論を使用して、適合性を検証し得る。
従って、適切なPTMセットが選択された後に、プロセス200は、段階232に進む。段階232において、グラフ作成モジュール130がソフトウェアを使用して、2つの頂点の群を有する二部グラフを構築する。1つの頂点の群(U)は、選択されたPTMセットの各修飾を含み、そして他方の頂点の群(V)は、理論的なペプチドフラグメントの各アミノ酸を含む。あるいは、V頂点は、理論的ペプチドフラグメントから、選択されたPTMセットからの少なくとも1つの修飾を受容し得るアミノ酸のみを含むように、構築され得る。非限定的な例において、図6は、PTMセット{Ph,Su}がアミノ酸配列YIPGTK(チロシン、イソロイシン、プロリン、グリシン、スレオニン、リジン)と適合性であるか否かを検証するために使用され得る二部グラフを示す。修飾を接続する線は、辺を示す。本明細書中の目的で、辺は、群Vからの頂点を群Uにおける頂点に接続することのみを可能にされる。
段階232から、プロセス200は段階236に進み、ここで、グラフ作成モジュール130は、構築されたグラフにおいて最大カージナリティー一致を見出す。本質的に、これは、グラフ作成モジュール130が、頂点のU群由来の各修飾を、V群の頂点由来の適合性の共有されていないアミノ酸と一致させることを試みる。このことは、全ての受容可能な残基修飾対形成についての辺を構築することによって達成される。辺を構築する際に、グラフ作成モジュール130は、対形成規則を固守する。このような規則としては、例えば、どのアミノ酸残基も、1つより多くの修飾を受容し得ないこと、および各修飾が、特定のセットのアミノ酸残基のみに対して適用され得ることが挙げられる。
グラフ作成モジュール130における一致とは、構築された辺の各々が、1つのみの修飾および1つのみのアミノ酸残基に結び付けられることを示す。換言すれば、各アミノ酸残基は、1つより多くの修飾と対形成されず、そして各修飾は、1つより多くのアミノ酸残基と対形成されない。最大カージナリティー一致は、さらなる辺が一致に追加され得ない場合に達成される。換言すれば、修飾と一致される、利用可能な対になっていないさらなる適合性アミノ酸残基が存在しない。
当業者は、最大カージナリティー一致を見出すために利用可能な、多数のアルゴリズムが存在することを理解する。例えば、増分路検索方法を使用する一致アルゴリズムは、Papadimiturou & Steiglitz Combinatorial Optimization:Algorithms and Complexity(1984)に見出され得る。「路」とは、連続した辺の配列((v1,v2)、(v2,v3)、・・・、(vk,vk+1))である。すなわち、辺の全ての隣接する対i,i+1が頂点を共有するような、辺1・・・kの配列である。「増分路」とは、一致Mに関して規定され、そして(n+1)個の奇数の辺1,3、・・・、2n+1がM中になく、一方でn個の偶数の辺2,4、・・・、2nがM中にあり、そして最初の頂点および最後の頂点が、M中のいずれの辺にも生じないような、連続する辺1、・・・2n+1の配列である。この路は、M中のn個の辺およびM中でないn+1個の辺を含むことに留意のこと。
増分路を考慮して、Mの全ての偶数辺からなる新たな辺セットが構築され得る。この新たなセットはまた、妥当な一致である。なぜなら、構築により、頂点が共有されず;さらに、1つの余分の辺を含むからである。従って、増分路は、1つ大きいカージナリティーとの新たな一致が構築されることを可能にする。新たな一致が構築された後に、グラフ作成モジュールは、別の増分路が新たな一致を可能にするためのグラフを検索する。一般に、増分路は、以下のように記載され得る。このグラフは、任意の一致M(通常、いずれの辺もないグラフ)で開始する。次に、このグラフは、Mに関する増分路について検索される。見出される場合、Mが増加され(別の辺が描かれ)、そしてこのグラフが、別の増分路のために再度検索される。このプロセスが、さらなる増分路が見出され得なくなるまで続く。
図7は、増分路を使用して最大カージナリティー一致を見出す上記方法を示す。左側の二部グラフを参照すると、このアルゴリズムは、修飾{Ph,Su}を、ペプチドYIPGTK由来の受容可能なアミノ酸に結びつける。この結びつけは、辺の連続的な路を形成する。修飾Phをアミノ酸残基Yに結びつける黒い辺は、偶数辺(2番目の辺)であり、従って、第一の一致(Mold)に含まれる。対照的に、SuをYに結びつけ、そしてPhをTに結びつける細い辺は、奇数辺(1番目および3番目の辺)であり、従って、最初の一致(Mold)から排除される。
ここで、図7の右側のグラフ(Mnew)を参照する。増分路が見出された後に、このグラフはここで、2つの辺を含み、これらの辺はSuをYに結びつけ、そしてPhをTに結びつける、黒い辺によって示される。このグラフはなお一致を表すことが理解される。なぜなら、構築された各辺は、1つのみの修飾および1つのみのアミノ酸残基に結び付けられているからである。これは、最大カージナリティー一致であることが、さらに理解される。なぜなら、さらなる辺が一致に追加され得ないからである。さらに、最大カージナリティー一致において2つの辺が存在し、そして修飾セット{Ph,Su}において2つの修飾が存在するので、このセットは、ペプチドに適合性である。
種々の実施形態において、増分路に基づき、そしてコンピュータプログラムに実装されるアルゴリズムは、最大カージナリティー一致を見出すために使用され得る。当業者は、他のアルゴリズム(これは、増加より速くあり得る)が、最大カージナリティー一致を見出すために使用され得ることを理解する。種々の実施形態において、Papadimiturou & Steiglitz(1984)によって記載される、漸近的により速いアルゴリズムが、段階236において最大カージナリティー一致を見出すために使用され得る。最大カージナリティー一致が達成された後に、プロセス200は、決定段階240に進む。決定段階240において、グラフ作成モジュール130は、そのグラフにおける辺の数が、選択されたPTMセットにおける修飾の数と等しいことを検証するために、チェックされる。決定段階240において、グラフ作成モジュール130の計算が、修飾より少ない辺が存在することを示す場合、このPTMセットは、理論的ペプチドフラグメントと適合性ではない。従って、プロセス200は、決定段階244に進み、ここで、グラフ作成モジュール130は、PTMデータベース170由来の、理論的ペプチドフラグメントと分析ペプチドフラグメントとの間の分子量の差異の原因となり得るさらなる潜在的なPTMセットが存在するか否かを評価する。さらなるPTMセットが、理論的ペプチドフラグメントと分析物ペプチドフラグメントとの間の分子量の差異の原因となり得ない場合、プロセス200は、終了段階256に進む。しかし、分子量の差異を説明するために利用可能なさらなるPTMセットが存在する場合、グラフ作成モジュール130は、段階248において、新たなPTMセットをPTMデータベース170から選択する。新たなPTMセットを選択した後に、プロセス200は段階232に戻り、ここで、グラフ作成モジュール130は、新たなグラフを構築する。
あるいは、決定段階240において、グラフ作成モジュール130が、辺の数が修飾の数と等しいと計算する場合、選択されたPTMセットは、特定の理論的ペプチドフラグメントと適合性である。一旦、適合性がチェックされると、プロセス200は段階252に進み、ここで、PTMセットが、適合性の理論的ペプチドフラグメントについてのデータとともに、格納部位160に送信される。段階160から、このプロセスは、決定段階244に進み、ここで、グラフ作成モジュール130は、PTMデータベース170由来の、理論的ペプチドフラグメントと分析物ペプチドフラグメントとの間の分子量の差異の原因となり得るさらなる潜在的なPTMが存在するか否かを評価する。この機能は、実際のペプチドフラグメントと理論的ペプチドフラグメントとの間の重量差の原因となり得る複数の潜在的PTMセットが存在する場合に、特に有用である。ユーザは、任意の型の質量フィンガープリンティング結果またはペプチドマッピング結果を、ユーザインターフェース180から観察し得る。フィンガープリンティング結果およびマッピング結果は、例えば、タンパク質配列ファイルの名称、消化剤に対するN末端規則およびC末端規則と一致するペプチド、連結した配列についての消化結果からのペプチド数、マッピングされたペプチドの配列における位置、マッピングされたペプチドの計算された分子量、計算された分子量と分析表における質量との間の差異、マッピングされたタンパク質の配列、分析物ペプチドフラグメントの配列、翻訳後修飾およびPTMの位置を含み得る。
当業者は、グラフ作成モジュールおよびその機能130が、ペプチド分析モジュール120に組み込まれ得、これによって、ペプチド質量フィンガープリンティングおよびペプチド質量マッピングのための、非常に一体化されたシステムを形成することを理解する。
種々の利点のうちでも、本明細書中の教示は、可能な化学修飾の適合性をチェックするための、タンパク質およびペプチドについての質量分析計データから判断される、系統的な、可撓性の、そしてコンピュータにより効率的な様式を提供し得ることが理解される。
本明細書中で参照される全ての刊行物および特許出願は、各個々の刊行物または特許出願が、具体的にかつ個々に、参考として援用されることが示されていると同程度まで、本明細書中に参考として援用される。
当業者は、上記実施形態において、その教示から逸脱することなく多くの改変が可能であることを明らかに理解する。このような全ての改変は、本明細書に包含されることが意図される。
Claims (29)
- 翻訳後修飾を同定するためのペプチド質量マッピングにおける使用のための方法であって、以下:
ペプチドフラグメントの分子量を測定する工程;
該測定した分子量を、同じ配列を有する未修飾フラグメントについて予測された分子量と比較し、それによって、該未修飾フラグメントからの差異を確認する工程;
該ペプチドフラグメントおよび該修飾フラグメントの測定された分子量における差異を説明し得る、翻訳後修飾の1つ以上のセットを決定する工程;ならびに
グラフ理論公式化を適用して、該測定された分子量と可能な翻訳後修飾のセットとの間の化学的適合性を決定する工程、
を包含する、方法。 - 前記グラフ理論公式化が、二部グラフ中の最大カージナリティー一致を含む、請求項1に記載の方法。
- 実験的に確認された分子量を有するアミノ酸残基鎖と、既知のアミノ酸配列鎖と、翻訳後の化学修飾のセットとの間の適合性を決定するための方法であって、該方法は、以下:
各残基についての頂点、各修飾についての頂点および各適合性対についての辺を含む二部グラフを構築する工程;ならびに
(i)2つの辺が1つの頂点を共有せず、そして(ii)全ての修飾が残基と対にされる、辺のセットを含む、最大カージナリティー一致を探す工程、
を包含する、方法。 - 化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定するための方法であって、該方法は、以下:
グラフを構築する工程;
最大カージナリティー一致を見出す工程;および
該カージナリティーが修飾の数と等しいか否かを決定する工程、
を包含する、方法。 - 前記最大カージナリティー一致が、
任意の一致を選択する工程、
増分路を見出す工程、
これを使用して新たな一致を規定する工程、および
このプロセスを、さらなる路が見出され得なくなるまで繰り返す工程、
によって見出される、請求項4に記載の方法。 - ペプチド分析のための方法であって、該方法は、以下:
参照タンパク質から導出された理論的ペプチドの質量に対して、分析物ペプチドの測定された質量を比較する工程;および
グラフ理論公式化を適用して、該理論的ペプチドとの、翻訳後修飾(PTM)の選択されたセット間の化学的適合性を決定する工程、
を包含し、それにより、1つ以上のペプチドを含み、1つ以上のPTMを有する1つ以上のペプチドを含み、該分析物ペプチドの質量と一致する質量を有する、候補ペプチドのセットが展開される、方法。 - 前記分析物ペプチドの測定された質量が、タンパク質消化の質量分析によって決定される、請求項6に記載の方法。
- 機械により読み取り可能なプログラム格納デバイスであって、該デバイスは、ペプチド分析についての方法工程を実施するための、該機械によって実行可能な指示のプログラムを具体化し、該方法工程は、以下:
(i)参照タンパク質から導出された理論的ペプチドの質量に対して、分析物ペプチドの測定された質量を比較する工程;および
(ii)グラフ理論公式化を適用して、該理論的ペプチドとの、翻訳後修飾(PTM)の選択されたセットの化学的適合性を決定する工程、
を包含し、それにより、1つ以上のペプチドを含み、1つ以上のPTMを有する1つ以上のペプチドを含み、該分析物ペプチドの質量と一致する質量を有する、候補ペプチドのセットが展開される、デバイス。 - 前記グラフ理論公式化が、二部グラフにおける最大カージナリティー一致を含む、請求項8に記載のデバイス。
- 機械により読み取り可能なプログラム格納デバイスであって、該デバイスは、ペプチド分析において使用するための方法工程を実施するための、該機械によって実行可能な指示のプログラムを具体化し、該方法工程は、以下:
グラフ理論公式化を適用して、化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定する工程、
を包含する、デバイス。 - 前記グラフ理論公式化が、二部グラフにおける最大カージナリティー一致を含む、請求項10に記載のデバイス。
- 前記化学修飾が、翻訳後修飾を含む、請求項10に記載のデバイス。
- 前記方法工程が、以下:
測定されたペプチド質量を、いくつかの化学修飾または化学修飾のセットを有する理論的ペプチドと関連付ける出力を提供する工程、
をさらに包含する、請求項10に記載のデバイス。 - 分析物ペプチドの分析のためのコンピュータシステムにおける方法であって、該方法は、以下:
分析物ペプチドの質量を含む入力を受信する工程;
複数の翻訳後修飾(PTM)を含むリストを、ユーザに提示する工程;ならびに
該複数のPTMから導出された、ユーザにより選択されたセットを、該ユーザから受信する工程、
を包含する、方法。 - 翻訳後修飾の1つ以上のセットを決定する工程をさらに包含し、ここで、各セットが1つ以上の翻訳後修飾を含み、そして各セットが、規定された許容質量内の質量差を説明し得る、請求項14に記載の方法。
- 前記理論的ペプチドとの化学的適合性についてチェックされた、前記ユーザにより選択されたセット由来の1つ以上のPTMを有し、規定された許容質量内の前記分析物ペプチドの質量と一致する質量を有する、1つ以上の理論的ペプチドを前記ユーザに提示する工程、をさらに包含する、請求項15に記載の方法。
- 前記化学的適合性チェックが、グラフ理論公式化による、請求項14に記載の方法。
- 図式的ユーザインターフェースにおいて、ユーザが候補翻訳後修飾のセットを選択することを可能にする方法であって、該方法は、以下:
複数の翻訳後修飾(PTM)を含むリストを、ユーザに提示する工程;および
該複数のPTMから導出された、ユーザにより選択されたセットを、該ユーザから受信する工程、
を包含する、方法。 - 分析物ペプチドと理論的ペプチドとの間の、測定されたパラメータの差異に基づいて、候補翻訳後修飾のセットを選択するための方法であって、該方法は、以下:
分析物ペプチドのパラメータを測定する工程;
対応する理論的ペプチドについての以前の工程と同じパラメータを計算する工程;
該分析物ペプチドの測定されたパラメータと、該理論的ペプチドの計算されたパラメータとの間の差異を計算する工程;
翻訳後修飾のデータベースから、該差異を説明し得る1つ以上の翻訳後修飾を選択する工程;ならびに
該セットを報告する工程、
を包含する、方法。 - 前記測定されたパラメータが質量である、請求項16に記載の方法。
- 機械により読み取り可能なプログラム格納デバイスであって、該デバイスは、候補翻訳後修飾のセットを選択する際に使用するための方法工程を実施するための、該機械によって実行可能な指示のプログラムを具体化し、該方法工程は、以下:
分析物ペプチドのパラメータを測定する工程;
対応する理論的ペプチドについて、以前の工程と同じパラメータを計算する工程;
該分析物ペプチドの測定されたパラメータと該理論的ペプチドの測定されたパラメータとの間の差異を計算する工程;
該ペプチドフラグメントおよび該未修飾フラグメントの測定された分子量における差異を説明し得る翻訳後修飾の1つ以上のセットを決定する工程;ならびに
該1つ以上のセットを報告する工程、
を包含する、デバイス。 - 前記測定されたパラメータが質量である、請求項21に記載のデバイス。
- ペプチド質量マッピングにおいて使用するための方法であって、グラフ理論公式化を適用して、化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定する工程を包含する、方法。
- 前記グラフ理論公式化が、二部グラフにおける最大カージナリティー一致を含む、請求項23に記載の方法。
- タンパク質またはペプチドを分析するためのシステムであって、以下:
ペプチド質量データを受信するための入力部分;
タンパク質配列のデータベース;
該入力部分および該タンパク質配列のデータベースと連絡するために適合された、ペプチド分析モジュール;
該ペプチド分析モジュールと連絡するために適合された、マイクロプロセッサ;
翻訳後修飾のデータベース;
該マイクロプロセッサおよび該翻訳後修飾のデータベースと連絡するために適合された、グラフ作成モジュール;ならびに
該グラフ作成モジュールと連絡するために適合された、出力部分、
を備える、システム。 - 前記出力部分と連絡するために適合されたユーザインターフェースをさらに備える、請求項25に記載のシステム。
- 前記入力部分と連絡するために適合された質量分析計をさらに備える、請求項25に記載のシステム。
- 前記マイクロプロセッサと連絡するために適合された格納構成要素をさらに備える、請求項25に記載のシステム。
- 前記グラフ作成モジュールが、グラフ理論公式化を適用して、化学修飾のセットとのアミノ酸残基鎖の化学的適合性を決定するように構成されている、請求項25に記載のシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US36122202P | 2002-03-01 | 2002-03-01 | |
US36179102P | 2002-03-04 | 2002-03-04 | |
PCT/US2003/006508 WO2003075006A1 (en) | 2002-03-01 | 2003-03-03 | Determination of compatibility of a set of chemical modifications with an amino-acid chain |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005519284A true JP2005519284A (ja) | 2005-06-30 |
JP2005519284A5 JP2005519284A5 (ja) | 2006-01-05 |
Family
ID=27791666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003573415A Withdrawn JP2005519284A (ja) | 2002-03-01 | 2003-03-03 | アミノ酸鎖に対する、化学修飾のセットの適合性の決定 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20030200032A1 (ja) |
EP (1) | EP1481245A4 (ja) |
JP (1) | JP2005519284A (ja) |
AU (1) | AU2003216495A1 (ja) |
CA (1) | CA2477621A1 (ja) |
WO (1) | WO2003075006A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010038664A (ja) * | 2008-08-04 | 2010-02-18 | Shimadzu Corp | 質量分析データ解析装置 |
JP2012515902A (ja) * | 2009-01-21 | 2012-07-12 | ボッカー,セバスチアン | マススペクトロメトリーにより特に未知物質を同定するための方法 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002014867A2 (en) * | 2000-08-11 | 2002-02-21 | Agilix Corporation | Ultra-sensitive detection systems |
GB0322356D0 (en) * | 2003-09-24 | 2003-10-22 | Micromass Ltd | Mass spectrometer |
JP4543929B2 (ja) * | 2005-01-04 | 2010-09-15 | 日本電気株式会社 | タンパク質の解析方法 |
JP4720254B2 (ja) * | 2005-03-31 | 2011-07-13 | 日本電気株式会社 | 分析方法、分析システム、及び分析プログラム |
US7356418B2 (en) * | 2005-06-30 | 2008-04-08 | Applera Corporation | Scientist domain-centric user interface and enabling “soft” translation |
US20080015113A1 (en) * | 2006-06-29 | 2008-01-17 | Applera Corporation | Method for storage of gene expression results |
US20100280759A1 (en) * | 2008-05-30 | 2010-11-04 | Cell Biosciences | Mass spectrometer output analysis tool for identification of proteins |
US10215765B2 (en) | 2010-09-15 | 2019-02-26 | Quest Diagnostics Investments Incorporated | Detection of vitamins A and E by tandem mass spectrometry |
US9007377B2 (en) | 2011-05-27 | 2015-04-14 | Molecular Devices, Llc | System and method for displaying parameter independence in a data analysis system |
CA2896539C (en) | 2012-12-26 | 2018-07-03 | Quest Diagnostics Investments Incorporated | C peptide detection by mass spectrometry |
US10319573B2 (en) | 2017-01-26 | 2019-06-11 | Protein Metrics Inc. | Methods and apparatuses for determining the intact mass of large molecules from mass spectrographic data |
US10546736B2 (en) | 2017-08-01 | 2020-01-28 | Protein Metrics Inc. | Interactive analysis of mass spectrometry data including peak selection and dynamic labeling |
US11626274B2 (en) * | 2017-08-01 | 2023-04-11 | Protein Metrics, Llc | Interactive analysis of mass spectrometry data including peak selection and dynamic labeling |
US10510521B2 (en) | 2017-09-29 | 2019-12-17 | Protein Metrics Inc. | Interactive analysis of mass spectrometry data |
US11640901B2 (en) | 2018-09-05 | 2023-05-02 | Protein Metrics, Llc | Methods and apparatuses for deconvolution of mass spectrometry data |
US11346844B2 (en) | 2019-04-26 | 2022-05-31 | Protein Metrics Inc. | Intact mass reconstruction from peptide level data and facilitated comparison with experimental intact observation |
EP4204948A1 (en) | 2020-08-31 | 2023-07-05 | Protein Metrics, LLC | Data compression for multidimensional time series data |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6057091A (en) * | 1994-12-02 | 2000-05-02 | The Johns Hopkins University School Of Medicine | Method of identifying compounds affecting hedgehog cholesterol transfer |
US5786180A (en) * | 1995-02-14 | 1998-07-28 | Bayer Corporation | Monoclonal antibody 369.2B specific for β A4 peptide |
US6083693A (en) * | 1996-06-14 | 2000-07-04 | Curagen Corporation | Identification and comparison of protein-protein interactions that occur in populations |
US6446010B1 (en) * | 1999-06-15 | 2002-09-03 | The Rockefeller University | Method for assessing significance of protein identification |
WO2001075121A2 (en) * | 2000-03-31 | 2001-10-11 | Millennium Pharmaceuticals, Inc. | 16836, a human phospholipase c family member and uses thereof |
US6829539B2 (en) * | 2001-04-13 | 2004-12-07 | The Institute For Systems Biology | Methods for quantification and de novo polypeptide sequencing by mass spectrometry |
-
2003
- 2003-03-03 WO PCT/US2003/006508 patent/WO2003075006A1/en active Application Filing
- 2003-03-03 AU AU2003216495A patent/AU2003216495A1/en not_active Abandoned
- 2003-03-03 EP EP03743745A patent/EP1481245A4/en not_active Withdrawn
- 2003-03-03 US US10/378,694 patent/US20030200032A1/en not_active Abandoned
- 2003-03-03 JP JP2003573415A patent/JP2005519284A/ja not_active Withdrawn
- 2003-03-03 CA CA002477621A patent/CA2477621A1/en not_active Abandoned
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010038664A (ja) * | 2008-08-04 | 2010-02-18 | Shimadzu Corp | 質量分析データ解析装置 |
JP2012515902A (ja) * | 2009-01-21 | 2012-07-12 | ボッカー,セバスチアン | マススペクトロメトリーにより特に未知物質を同定するための方法 |
Also Published As
Publication number | Publication date |
---|---|
AU2003216495A1 (en) | 2003-09-16 |
EP1481245A1 (en) | 2004-12-01 |
EP1481245A4 (en) | 2007-06-13 |
CA2477621A1 (en) | 2003-09-12 |
WO2003075006A1 (en) | 2003-09-12 |
US20030200032A1 (en) | 2003-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2005519284A (ja) | アミノ酸鎖に対する、化学修飾のセットの適合性の決定 | |
JP3195358B2 (ja) | 質量分析法によるヌクレオチド、アミノ酸又は炭水化物の同定 | |
Cagney et al. | In silico proteome analysis to facilitate proteomics experiments using mass spectrometry | |
US6393367B1 (en) | Method for evaluating the quality of comparisons between experimental and theoretical mass data | |
Chalkley et al. | In-depth analysis of tandem mass spectrometry data from disparate instrument types | |
Higdon et al. | Randomized sequence databases for tandem mass spectrometry peptide and protein identification | |
Kapp et al. | Overview of tandem mass spectrometry (MS/MS) database search algorithms | |
Ahrné et al. | QuickMod: A tool for open modification spectrum library searches | |
Shadforth et al. | Protein and peptide identification algorithms using MS for use in high‐throughput, automated pipelines | |
US20070282537A1 (en) | Rapid characterization of post-translationally modified proteins from tandem mass spectra | |
Anderson et al. | Informatics strategies for large-scale novel cross-linking analysis | |
Eriksson et al. | A model of random mass‐matching and its use for automated significance testing in mass spectrometric proteome analysis | |
Cerqueira et al. | MUDE: a new approach for optimizing sensitivity in the target-decoy search strategy for large-scale peptide/protein identification | |
Shipman et al. | DecoyDeveloper: An on-demand, de novo decoy glycopeptide generator | |
JP4209334B2 (ja) | 3次元分子構造の最適モデルを構築する方法及びシステム | |
Kertész-Farkas et al. | Database searching in mass spectrometry based proteomics | |
Dong et al. | Prediction of peptide fragment ion mass spectra by data mining techniques | |
Bruce et al. | Probabilistic enrichment of phosphopeptides by their mass defect | |
JP7218019B2 (ja) | 質量スペクトルからの存在物の同定の方法 | |
Martens | Bioinformatics challenges in mass spectrometry-driven proteomics | |
Wan et al. | ComplexQuant: high-throughput computational pipeline for the global quantitative analysis of endogenous soluble protein complexes using high resolution protein HPLC and precision label-free LC/MS/MS | |
Kirik et al. | Improving peptide-spectrum matching by fragmentation prediction using Hidden Markov Models | |
Burke et al. | False discovery rate estimation for hybrid mass spectral library search identifications in bottom-up proteomics | |
Spivak et al. | Learning score function parameters for improved spectrum identification in tandem mass spectrometry experiments | |
Lotan et al. | Approximation of protein structure for fast similarity measures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060509 |