JP2005510732A - System and method for automatic protein sequencing by mass spectrometry - Google Patents

System and method for automatic protein sequencing by mass spectrometry Download PDF

Info

Publication number
JP2005510732A
JP2005510732A JP2003547965A JP2003547965A JP2005510732A JP 2005510732 A JP2005510732 A JP 2005510732A JP 2003547965 A JP2003547965 A JP 2003547965A JP 2003547965 A JP2003547965 A JP 2003547965A JP 2005510732 A JP2005510732 A JP 2005510732A
Authority
JP
Japan
Prior art keywords
peak
mass
peptide
spectrum
isotope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003547965A
Other languages
Japanese (ja)
Inventor
ヴィルム,マッティアス
ニューバウアー,ジット,ジャッキー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Europaisches Laboratorium fuer Molekularbiologie EMBL
Original Assignee
Europaisches Laboratorium fuer Molekularbiologie EMBL
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Europaisches Laboratorium fuer Molekularbiologie EMBL filed Critical Europaisches Laboratorium fuer Molekularbiologie EMBL
Publication of JP2005510732A publication Critical patent/JP2005510732A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/02Details
    • H01J49/04Arrangements for introducing or extracting samples to be analysed, e.g. vacuum locks; Arrangements for external adjustment of electron- or ion-optical components
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • G01N2458/15Non-radioactive isotope labels, e.g. for detection by mass spectrometry

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Urology & Nephrology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

タンデム質量分析法によるデータを分析することによってタンパク質の配列を推定する方法。タンパク質は、非天然存在度のH2 1sOを含む水混合物中で、酵素消化によって部分的な同位体標識化にかける。この消化処理から得られたペプチド・フラグメントに示差走査質量分析を適用する。スペクトル中のピークを分析して、それらのピークが同位体標識したフラグメントから生じたものかどうかを確認する。yイオンからのピークだけを含むフィルタ処理されたスペクトルを計算する。隣接するyイオン・ピーク間の質量差を計算することによって、このペプチドの配列を推定する。A method for estimating protein sequences by analyzing data obtained by tandem mass spectrometry. The protein is subjected to partial isotope labeling by enzymatic digestion in an aqueous mixture containing non-natural abundance H 2 1s O. Differential scanning mass spectrometry is applied to the peptide fragments obtained from this digestion process. Analyze the peaks in the spectrum to see if they originated from isotopically labeled fragments. Compute a filtered spectrum containing only peaks from y ions. The sequence of this peptide is deduced by calculating the mass difference between adjacent y-ion peaks.

Description

本発明は、一般に、タンパク質のアミノ酸配列を、このタンパク質の同位体標識されたC末端ペプチド・フラグメントの質量スペクトルを自動的に解釈することによって決定する、コンピュータにより実施される方法に関する。   The present invention relates generally to computer-implemented methods for determining the amino acid sequence of a protein by automatically interpreting the mass spectrum of the isotopically labeled C-terminal peptide fragment of the protein.

タンパク質中のアミノ酸の直線配置は、タンパク質の配列決定によって明らかになる。タンパク質の配列を知ることは、分子生物学的な技術に不可欠である。例えば、タンパク質配列情報は、DNAクローニングを行うための必要条件であり、オリゴヌクレオチド・プローブおよびPCR(ポリメラーゼ連鎖反応)プライマーを作製するための情報を提供する。さらに、タンパク質の配列決定により、抗体の産生に用いるペプチドを合成することができ、問題のタンパク質を同定することができ、組換え産物を特徴づける助けになる。   The linear arrangement of amino acids in a protein is revealed by protein sequencing. Knowing protein sequences is essential for molecular biology techniques. For example, protein sequence information is a prerequisite for performing DNA cloning and provides information for creating oligonucleotide probes and PCR (polymerase chain reaction) primers. In addition, protein sequencing can synthesize peptides used to produce antibodies, identify proteins of interest, and help characterize recombinant products.

ペプチド・サンプルの配列が、既知の関連するペプチド配列などの追加情報なしで推定される場合、その手法はデノボ配列決定として呼ばれている。ゲノムDNA配列決定の発展にも拘わらず、依然として生物学的な研究環境におけるタンパク質およびペプチドのデノボ配列決定が必要とされる。というのは、配列決定されていないゲノムを有する生体内で多くの実験が実施されるからである。   If the sequence of a peptide sample is deduced without additional information, such as a known related peptide sequence, the approach is called de novo sequencing. Despite the development of genomic DNA sequencing, de novo sequencing of proteins and peptides in a biological research environment is still required. This is because many experiments are performed in vivo with unsequenced genomes.

タンパク質の配列決定の基本的な方法は、N末端開裂に基づく3ステップの化学プロセスであるエドマン分解である(Ward、Simpson、「Proteins and Peptides, Isolation for Sequence Analysis of」、Molecular Biology and Biotechnology、Robert A. Meyers監修、VCH Publishers社、(1995)、767頁)。現在では、ラボラトリ・オートメーションによりエドマン法の実施が非常に効率的になったが、非タンパク質汚染物質に対する感度を含めていくつかの欠点がある(例えば、Keen、Findlay、「Protein Sequencing Techniques」、Molecular Biology and Biotechnology、Robert A. Meyers監修、VCH Publishers社、(1995)参照)。   The basic method of protein sequencing is Edman degradation, a three-step chemical process based on N-terminal cleavage (Ward, Simpson, Proteins and Peptides, Isolation for Sequence Analysis of, Molecular Biology and Biotechnology, Robert Supervised by A. Meyers, VCH Publishers (1995), p. 767). Today, laboratory automation has made the implementation of the Edman method very efficient, but has several drawbacks including sensitivity to non-protein contaminants (e.g. Keen, Findlay, Protein Sequencing Techniques, Molecular Biology and Biotechnology, supervised by Robert A. Meyers, VCH Publishers, (1995)).

タンパク質のC末端の化学的な配列決定は、チオシアネート法によって実現することができる(Schlack、Kumpf、Physiol. Chem.、(1926) 154、125〜170頁)。N末端がブロックされたタンパク質およびペプチドの配列決定に有用であるが、この方法も、反応条件の厳密性およびタンパク質を固体支持体に結合させる必要性を含めて欠点がある(Bailey、J. Chromatog. A、(1995) 705、47〜65頁)。   Chemical sequencing of the C-terminus of the protein can be achieved by the thiocyanate method (Schlack, Kumpf, Physiol. Chem., (1926) 154, 125-170). Although useful for sequencing N-terminally blocked proteins and peptides, this method also has drawbacks, including the stringency of the reaction conditions and the need to attach the protein to a solid support (Bailey, J. Chromatog A, (1995) 705, pp. 47-65).

最終的には、MS(質量分析法)が、化学的な方法に対する魅力的な代替方法として登場し、タンパク質化学の従来技術では簡単に処理できない配列決定問題を解決するのに用いられている(例えば、Carr、Annan、「Overview of Peptide and Protein Analysis by Mass Spectrometry」、Current Protocols in Molecular Biology、Ausubelら監修、John Wiley&Sons社、(1997)、10.21参照)。質量分析法では、完全な状態の中性分子から形成された気相イオンの分子量を、このイオンのm/z(質量対電荷比)に基づいて分離することによって決定する。   Eventually, MS (mass spectrometry) has emerged as an attractive alternative to chemical methods and is used to solve sequencing problems that cannot be easily handled by the prior art of protein chemistry ( For example, Carr, Annan, “Overview of Peptide and Protein Analysis by Mass Spectrometry”, supervised by Current Protocols in Molecular Biology, Ausubel et al., John Wiley & Sons, (1997), 10.21). In mass spectrometry, the molecular weight of gas phase ions formed from intact neutral molecules is determined by separating them based on the m / z (mass to charge ratio) of the ions.

タンパク質の配列決定を行う1つの効果的な方法は、タンパク質の分解消化から生じるものなど、混合物状態のペプチドの分子量を、質量分析法を用いて決定することである。例えばトリプシンなどの特定の酵素でタンパク質を消化すると、特定の部位でタンパク質が開裂する。この部位の位置は、このタンパク質のアミノ酸配列で決まる。その結果、しばしば「フィンガープリント」と呼ばれるシグネチャ質量スペクトルを生じさせるペプチドの集合体が得られる。m/z値の測定精度が0.01%よりも良好なときには、ペプチド・フラグメントのアミノ酸組成を高い信頼性で推定することができる。そのため、フィンガープリントを利用して、タンパク質を明確に同定することもできるし、翻訳産物を既知のタンパク質のペプチド・フィンガープリントのデータベースに含まれる情報と比較することによってこの翻訳産物を検証することもできる。   One effective way to sequence proteins is to determine the molecular weight of a mixture of peptides, such as those resulting from proteolytic digestion, using mass spectrometry. For example, digestion of a protein with a specific enzyme such as trypsin cleaves the protein at a specific site. The position of this site is determined by the amino acid sequence of this protein. The result is a collection of peptides that give rise to a signature mass spectrum, often called a “fingerprint”. When the measurement accuracy of the m / z value is better than 0.01%, the amino acid composition of the peptide fragment can be estimated with high reliability. Therefore, the fingerprint can be used to clearly identify the protein, or it can be verified by comparing the translation product with information contained in the peptide fingerprint database of known proteins. it can.

質量分析法は、単一化学種の質量の測定に限定されず、MS/MS(タンデム質量分析法)技術によって、ペプチド配列を含めて構造情報を明らかにすることもできる。多くの質量分析システムでは、気相イオンは、自発的に、あるいはいわゆるCID(「衝突誘起解離」)でガス分子の衝突によってさらにフラグメント化される。生成されたサブフラグメントも、m/z比によって互いに分離することができる。   Mass spectrometry is not limited to the measurement of the mass of a single chemical species, and structural information including peptide sequences can also be revealed by MS / MS (tandem mass spectrometry) technology. In many mass spectrometry systems, gas phase ions are further fragmented either spontaneously or by collisions of gas molecules with so-called CID (“collision induced dissociation”). The generated subfragments can also be separated from each other by the m / z ratio.

タンデム質量分析法特有の利点は、ピコモルまたはフェムトモル・レベルでペプチドのアミノ酸配列情報を提供できることである。この応用例では、タンデム質量分析法は、一般に第1の質量分析器を用いて特定のペプチド・イオンを選別し、それによって、それらのイオンを例えばCIDによるフラグメント化にかけて、親ペプチドまたはペプチド・フラグメントのサブフラグメント・イオンを生成することができる。この技術では、第2の質量分析器も用いて、最初にペプチドのイオン化およびイオン選別を行った後で、サブフラグメント・イオンを分離し分析する。得られた質量スペクトルは、これらのサブフラグメントのm/z比を含む。   A unique advantage of tandem mass spectrometry is the ability to provide peptide amino acid sequence information at the picomolar or femtomole level. In this application, tandem mass spectrometry generally uses a first mass analyzer to screen for specific peptide ions, thereby subjecting those ions to fragmentation, for example with CID, to obtain the parent peptide or peptide fragment. Of subfragment ions can be generated. In this technique, a second mass analyzer is also used to first isolate and analyze the subfragment ions after peptide ionization and ion sorting. The resulting mass spectrum contains the m / z ratio of these subfragments.

例えばCID中に有機分子が受けるフラグメント化の機序はよく研究されている。したがって、親化学種およびそれらのサブフラグメントの質量をともに分析することによって、重要な構造上の情報を明らかにすることができる。具体的には、分子は、弱い化学結合部から先に開裂する傾向があるが、多くの官能基は、フラグメント化プロセス中、完全な状態のままである。ペプチドのアミド結合は、MS/MSで用いられる条件下で特に開裂しやすいことがわかっている。その結果、ペプチドのタンデム質量スペクトルは、単一のアミノ酸残基が互いに異なるサブフラグメントに対応するピークを含み、したがって、配列決定の助けとなり得る(例えば、Huntら、(1986)、Proc. Natl. Acad. Sci. USA、83、6233〜6237頁参照)。   For example, the mechanism of fragmentation that organic molecules undergo in CID is well studied. Thus, by analyzing the masses of the parent species and their subfragments together, important structural information can be revealed. Specifically, molecules tend to cleave first from weak chemical bonds, but many functional groups remain intact during the fragmentation process. It has been found that the amide bond of the peptide is particularly susceptible to cleavage under the conditions used in MS / MS. As a result, the tandem mass spectrum of a peptide contains peaks corresponding to subfragments in which a single amino acid residue differs from one another, and thus can aid in sequencing (e.g., Hunt et al. (1986) Proc. Natl. Acad. Sci. USA, 83, 6233-6237).

それでも、タンデム質量スペクトルの分析についての問題は、いくつかの理由から依然として厄介なままである。第1に、ペプチド結合のところで開裂すると、1対のフラグメントが生じる。一方はN末端を含み、他方はC末端を含む。フラグメント化の後で、これらのフラグメントのどちらが電荷を担持しているかは予測不可能であり、そのため、ほとんどのスペクトルは、yイオンとして知られる(Y"イオンとも呼ぶ)C末端を含むものと、bイオンとして知られる(Bイオンとも呼ぶ)N末端を含むものの2系列のフラグメントを含む。質量分析法によるデノボ配列決定の主要な挑戦課題は、1系列のフラグメントのイオンを、普通なら複雑なスペクトル中で、高い信頼性で認識することである。   Nevertheless, problems with the analysis of tandem mass spectra remain cumbersome for several reasons. First, cleavage at the peptide bond yields a pair of fragments. One contains the N-terminus and the other contains the C-terminus. After fragmentation, it is unpredictable which of these fragments carries a charge, so most spectra contain a C-terminus known as the y ion (also called the Y "ion) It contains two series of fragments of the N-terminus, also known as b ions (also called B ions), the main challenge of de novo sequencing by mass spectrometry is to identify ions of one series of fragments, usually complex spectra It is to recognize with high reliability.

第2に、このフラグメント化プロセスは理想的なものではない。一部のアミド結合は、CID中に開裂せず、そのため、MS/MSスペクトル中でいくつかのピーク間の差は、単一のアミノ酸残基の質量ではなく、2つ以上の残基に対応する。同様に、ある種のフラグメント化がアミノ酸残基中で生じ、質量が、他のサブフラグメントの質量とアミノ酸残基の数だけ正確に異ならないサブフラグメントが生成される。   Second, this fragmentation process is not ideal. Some amide bonds do not cleave during CID, so the difference between several peaks in the MS / MS spectrum corresponds to more than one residue, not the mass of a single amino acid residue To do. Similarly, certain types of fragmentation occur in amino acid residues, producing subfragments whose mass does not differ exactly from the mass of other subfragments by the number of amino acid residues.

第3に、ペプチド・サンプルがイオン化される条件では、しばしば多価イオンが生じる。したがって、スペクトル中に、異なる電荷を担持する同じフラグメントのイオンに対応するピーク系列があり得る。このような状況では、単一のアミノ酸残基が異なるフラグメントに対応するピークは、この残基の質量の何分の一かのm/z値だけ異なることになる。   Third, multivalent ions often occur in conditions where the peptide sample is ionized. Thus, there can be a series of peaks in the spectrum that correspond to ions of the same fragment carrying different charges. In such a situation, the peak corresponding to a fragment where a single amino acid residue is different will differ by a fraction of the m / z value of the mass of this residue.

最後に、使用する機器の分解能によって決まる別の問題は、同じフラグメントの異なる同位体で置換された形態に対応する近接して並ぶピークを分解できないことがあることである。   Finally, another problem, which depends on the resolution of the instrument used, is that it may not be possible to resolve closely aligned peaks corresponding to differently substituted forms of the same fragment.

したがって、一般に、ポリペプチドの典型的なデノボMS/MS分析の結果得られるスペクトルは、その解釈が単純明快とは程遠いものであり、そのため、一般にペプチド配列の一部の構成要素は同定されない。   Thus, in general, the spectrum obtained as a result of a typical de novo MS / MS analysis of a polypeptide is far from simple and straightforward to interpret, so that in general, some components of the peptide sequence are not identified.

これまで、デノボMS/MSペプチド・スペクトルを解釈する計算的な方法は、部分的にしか成功していない。この理由の一部は、スペクトル自体が、完全な分析を可能にするのに十分な感度または分解能をもっていないことである。別の理由は、用いられるアルゴリズムが、時間がかかり過ぎて現実的でないか、あるいは、精度が十分でなく有用でないことである。例えば、初期の一手法では、同じ開裂特異性を用いて、酵素による消化後のペプチド・フラグメントの質量の測定値を、データベース中の各配列エントリからの理論的なペプチド質量と比較する。この比較によりあるスコアが得られ、このスコアにより一致度の良さを定量化する(例えば、Cottrell、Pept. Res.、(1994)、7、115〜124頁、Matsuiら、Electrophoresis、(1997)、18、409〜417頁を参照)。   To date, computational methods for interpreting de novo MS / MS peptide spectra have been only partially successful. Part of this is that the spectrum itself does not have sufficient sensitivity or resolution to allow complete analysis. Another reason is that the algorithm used is too time consuming and impractical, or is not accurate enough and useful. For example, one initial approach uses the same cleavage specificity to compare the mass measurements of peptide fragments after enzymatic digestion with the theoretical peptide mass from each sequence entry in the database. This comparison yields a score that quantifies the goodness of agreement (e.g., Cottrell, Pept. Res., (1994), 7, 115-124, Matsui et al., Electrophoresis, (1997), 18, see pages 409-417).

別の手法では、多くの可能な配列の理論的なスペクトルを実際のスペクトルに合わせ、これを良好な一致が得られるまで続ける(Eng, J.K.ら、「An Approach to Correlate Tandem Mass Spectral Data of Peptides with Amino Acid Sequences in a Protein Database」、Journal of the American Society of Mass Spectrometry、5、976〜989頁、(1994))。この手法の欠点は、アミノ酸残基の多くの可能な配列を、あるスペクトルを生じさせる組に合わせようと試みることに関連して組合せ上膨大な数があり得ることである。必然的に生じるこのような組合せ上の膨大な数を制限するために近似を用いると、しばしば正しい配列が排除されることがある。   Another approach is to fit the theoretical spectrum of many possible sequences to the actual spectrum and continue this until a good match is obtained (Eng, JK et al., “An Approach to Correlate Tandem Mass Spectral Data of Peptides with Amino Acid Sequences in a Protein Database, Journal of the American Society of Mass Spectrometry, 5, 976-989, (1994)). The disadvantage of this approach is that there can be a huge number of combinations in connection with attempting to match the many possible sequences of amino acid residues into a set that produces a spectrum. The use of approximations to limit the vast number of such combinations that inevitably occur can often eliminate the correct sequence.

問題のタンパク質が既知の配列を有するタンパク質と高い相同性を有し得る状況では、最近、質量分析法によって得られた部分的な配列データと、大量の配列データベースを探索する効率的な方法とを組み合わせることによって、迅速なタンパク質の同定が行われた(Neubauerら、Proc. Natl. Acad. Sci. USA、(1997)、94、385〜390頁、Neubauerら、Nature Genetics、(1998)、20、46〜50頁)。同様に、大型のタンパク質複合体の直接分析が、コンピュータ・アルゴリズムを用いて、取得されたペプチド・フラグメントの質量スペクトルを、翻訳されたゲノム・データベース中の予想アミノ酸配列に相関させることによって実現された(Linkら、Nature Biotechnology、(1999)、17、676〜682頁)。   In situations where the protein in question can be highly homologous to a protein with a known sequence, recently we have developed partial sequence data obtained by mass spectrometry and an efficient way to search large amounts of sequence databases. In combination, rapid protein identification was performed (Neubauer et al., Proc. Natl. Acad. Sci. USA, (1997), 94, 385-390, Neubauer et al., Nature Genetics, (1998), 20, 46-50). Similarly, direct analysis of large protein complexes was achieved by using computer algorithms to correlate the acquired peptide fragment mass spectrum with the predicted amino acid sequence in the translated genomic database. (Link et al., Nature Biotechnology, (1999), 17, 676-682).

ただし、上記技術は、既存の配列データに依存するので、常にデノボ配列決定に影響を及ぼすとは限らない。質量分析法によってデノボ配列決定を行う初期の手法では、スペクトル中の連続した隣接ピーク間の質量差をアミノ酸の質量と順次比較し、一致するものが見つかるまで行われた。ピーク強度に関連するスコアに基づいて配列が推定された(Yatesら、「Computer aided Interpreation of Low Enery MS/MS/Mass Spectra of Peptides」、Techniques In Protein Chemistry II、J.J. Villafranca監修、(1991)、Academic Press社、477頁)。   However, since the above technique relies on existing sequence data, it does not always affect de novo sequencing. The initial approach to de novo sequencing by mass spectrometry was to sequentially compare the mass difference between consecutive adjacent peaks in the spectrum with the amino acid mass until a match was found. Sequences were estimated based on scores related to peak intensities (Yates et al., `` Computer aided Interpreation of Low Enery MS / MS / Mass Spectra of Peptides '', Techniques In Protein Chemistry II, supervised by JJ Villafranca, (1991), Academic Press, page 477).

デノボ配列決定を行う別の手法では、各ピークに頂点を割り当て、アミノ酸残基の質量分だけ質量が異なる頂点の対の間に稜を形成することによって、測定されたスペクトルからいわゆる「スペクトル・グラフ」を導出する(Dancikら、J. Comp. Biol.、(1999)、6、327〜342頁)。スペクトルからノイズが効率的に除去される場合に限り、このグラフの最長経路から正しい配列を推測することができる。しかし、この方法は、それぞれ関連するスコア確率を伴う多数の配列候補を生成し、グラフによる理論的な技術である逆対称最長経路問題を実施することによるものであり、ペプチド長が長くなるとほとんどそれに対応できない。   Another technique for de novo sequencing is to assign a vertex to each peak and form a ridge between pairs of vertices that differ in mass by the mass of the amino acid residue, thereby measuring the so-called "spectral graph" from the measured spectrum. (Dancik et al., J. Comp. Biol., (1999), 6, 327-342). Only if the noise is efficiently removed from the spectrum can the correct sequence be inferred from the longest path of this graph. However, this method is based on the generation of a large number of sequence candidates, each with associated score probabilities, and the implementation of the inverse symmetric longest path problem, which is a theoretical technique based on graphs. I can not cope.

質量分析法によりタンパク質の配列決定を行う最近の実験的な手法は、ペプチド配列の標識化またはタグ付けを利用している。例えば、メチルエステルの形成によってC末端残基をメチル標識する化学的な方法では、標識したサンプルと標識していないサンプルに関するスペクトルを比較することにより、スペクトル中の特徴的なピーク間隔から配列データを得ることができる(Huntら、Proc. Natl. Acad. Sci. USA、(1986)、83、6233〜6237頁)。化学的な標識化の一般的な欠点は、化学反応ステップを必要とすることと、2つの異なるサンプルについてスペクトルを得る必要があることである。   Recent experimental techniques for sequencing proteins by mass spectrometry use labeling or tagging of peptide sequences. For example, in a chemical method in which the C-terminal residue is methyl-labeled by the formation of a methyl ester, the sequence data is derived from the characteristic peak intervals in the spectrum by comparing the spectra for the labeled and unlabeled samples. (Hunt et al., Proc. Natl. Acad. Sci. USA, (1986), 83, 6233-6237). The general disadvantage of chemical labeling is that it requires a chemical reaction step and that it is necessary to obtain spectra for two different samples.

標識による別の方法では、ペプチド配列に沿って重水素を酸性水素に置換する(Sepetovら、Rapid Commun. In Mass Spect.、(1993)、7、58〜62頁)。この方法により、bイオンとyイオン系列のピーク間ですぐに差をとることができるが、この技術は、短いペプチド配列(10個残基未満)にしか効果的でなく、酸性側鎖を伴う残基に関する追加的な配列情報しか得られない。   Another method by labeling replaces deuterium with acidic hydrogen along the peptide sequence (Sepetov et al., Rapid Commun. In Mass Spect. (1993) 7, pages 58-62). Although this method can quickly differentiate between peaks in the b and y ion series, this technique is only effective for short peptide sequences (less than 10 residues) and involves acidic side chains. Only additional sequence information about the residues is available.

MS/MS分析の前に、重水素以外の標識でペプチド配列を同位体標識することは、ある期間望ましい技術であったが、タンデム質量分析法では実現することが難しい感度を必要とし、通常、2つのサンプルに関してスペクトルを比較する必要がある。単一スペクトルから情報を得ることができる技術の例が、Gygiら、「Quantitative analysis of complex protein mixtures using isotope-coded affinity tags」、Nature Biotech.、17、994〜999頁、(1999)に記載されている。この技術では、スルフヒドリル基に対して親和性を有するヨードアセトアミドなどの試薬でタンパク質を標識する。1つのサンプルからのタンパク質を通常の試薬で標識し、別のサンプルからのタンパク質を8個の重水素で置換した試薬で標識する。両方のサンプルを組み合わせて、質量分析法による分析の前にビオチン親和性タグでさらに標識する。これら2つのサンプルからのピークを8質量単位だけ分離する。この方法の欠点は、これらのタンパク質サンプルにシステイン残基を必要とすることである。   Prior to MS / MS analysis, isotopic labeling of peptide sequences with labels other than deuterium has been a desirable technique for some time, but requires sensitivity that is difficult to achieve with tandem mass spectrometry, and usually The spectra need to be compared for two samples. An example of a technique that can obtain information from a single spectrum is described in Gygi et al., “Quantitative analysis of complex protein combination using isotope-coded affinity tags”, Nature Biotech., 17, 994-999, (1999). ing. In this technique, proteins are labeled with a reagent such as iodoacetamide that has an affinity for sulfhydryl groups. The protein from one sample is labeled with a normal reagent and the protein from another sample is labeled with a reagent substituted with 8 deuterium. Both samples are combined and further labeled with a biotin affinity tag prior to analysis by mass spectrometry. The peaks from these two samples are separated by 8 mass units. The disadvantage of this method is that these protein samples require cysteine residues.

4セクタ型タンデム質量分析器を用いて単一サンプルに対して2つのスペクトルが得られる18O標識の応用例が報告されているが(Takaoら、Anal. Chem.、(1993)、65、2394〜2399頁)、この分析方法は、スペクトルの単純な比較であり、この方法は、報告されているもの(約10個の残基)よりも長い配列に対して急激に実用的でなくなる。したがって、質量分析法によるタンパク質のデノボ配列決定は、かなりの期間、挑戦課題であった。 Although an application of 18 O labeling has been reported (Takao et al., Anal. Chem., (1993), 65, 2394) where two spectra are obtained for a single sample using a 4-sector tandem mass spectrometer. ˜2399), this analytical method is a simple comparison of the spectra and this method suddenly becomes impractical for sequences longer than those reported (about 10 residues). Therefore, de novo sequencing of proteins by mass spectrometry has been a challenging task for quite some time.

しかし、最近、同位体標識したペプチドのデノボ配列決定を行うのに必要な感度が、ナノ・エレクトロスプレー・イオン源と4重極飛行時間タンデム質量分析器を組み合わせることによって達成された。この手法は、他のタイプの質量分析器よりも高い感度および分解能が得られる4重極飛行時間装置の固有の特徴を利用する(Shevchenkoら、Rapid Communications in Mass Spectrometry、(1997)、11、1015〜1024頁)。例えば、1:1の16O/18O水中におけるタンパク質の酵素消化によりC末端ペプチド・フラグメントを同位体標識することで、これらのフラグメントに関する特徴的で容易に同定することができる同位体分布が得られる(Schnolzerら、Electrophoresis、(1996)、17、945〜953頁)。この方法の原理は、タンデム質量分析にかける前であって、ペプチドのC末端の50%を18O同位体で、50%を16O同位体で標識したときに得られる、それらの1:1の16O/18O同位体パターンによって、1つのスペクトル中でこのペプチドのC末端フラグメント・イオンを同定することである。2つのスペクトルが必要とされるが、それらはともに同じサンプルから得られる。これら2つのスペクトルの差、すなわち減算結果を分析することは、感度が増強された状態で測定を行うことができ、同位体標識したサブフラグメントからの一連のピークが同定されることを意味する。これらのピークは、1アミノ酸分だけ質量が異なるC末端イオンから生じ、このことから、このアミノ酸配列を明らかにすることができる。 Recently, however, the sensitivity required to perform de novo sequencing of isotopically labeled peptides has been achieved by combining a nanoelectrospray ion source with a quadrupole time-of-flight tandem mass spectrometer. This approach takes advantage of the unique features of a quadrupole time-of-flight device that provides higher sensitivity and resolution than other types of mass analyzers (Shevchenko et al., Rapid Communications in Mass Spectrometry, (1997), 11, 1015 ~ 1024). For example, isotopically labeling C-terminal peptide fragments by enzymatic digestion of proteins in 1: 1 16 O / 18 O water provides a characteristic and easily identifiable isotopic distribution for these fragments. (Schnolzer et al., Electrophoresis, (1996), 17, 945-953). The principle of this method is that they were obtained before tandem mass spectrometry, and when they were labeled 50% of the C-terminus with 18 O isotopes and 50% with 16 O isotopes Is to identify the C-terminal fragment ion of this peptide in one spectrum by its 16 O / 18 O isotope pattern. Two spectra are required, both from the same sample. Analyzing the difference between these two spectra, the subtraction result, means that measurements can be taken with enhanced sensitivity and a series of peaks from isotopically labeled subfragments are identified. These peaks arise from the C-terminal ions that differ in mass by one amino acid, from which this amino acid sequence can be revealed.

それでも、同位体標識したスペクトルの分析は、いくつかの理由から依然として複雑なままである。既知の割合の18Oを有する水中でタンパク質を消化する際に得られるものなど、特徴的な同位体分布によるC末端ペプチドの同定は、とりわけ13Cおよび15Nなどの同位体の天然の同位体存在度によって難しくなる。例えば、これらの天然同位体存在度のために、ペプチド質量スペクトル中で2Da(ダルトン)だけ分離された2つのピークが、C末端で16O原子または18O原子を有するペプチド・サブフラグメント・イオン若しくはC末端で16O原子、または1つの13C原子と1つの15N原子、または2つの13C原子、または2つの15N原子を有するペプチド・サブフラグメント・イオンから生じ得る。ペプチドがより大になるにつれ、それほど多くの13Cおよび15N同位体が組み込まれない可能性がより高くなり、C末端ピークを同定してアミノ酸の配列決定を行うことについての問題がますます難しくなる。 Nevertheless, analysis of isotopically labeled spectra remains complex for several reasons. Identification of C-terminal peptides with a characteristic isotope distribution, such as those obtained when digesting proteins in water with a known proportion of 18 O, is a natural isotope of isotopes such as 13 C and 15 N, among others It becomes difficult by the presence. For example, due to their natural isotope abundance, two peaks separated by 2 Da (Dalton) in the peptide mass spectrum may result in peptide subfragment ions having 16 or 18 O atoms at the C-terminus or It can result from peptide subfragment ions having 16 O atoms at the C-terminus, or one 13 C atom and one 15 N atom, or two 13 C atoms, or two 15 N atoms. As peptides get larger, the more likely 13 C and 15 N isotopes are not incorporated, the more difficult it becomes to identify C-terminal peaks and sequence amino acids Become.

まとめると、デノボ・タンパク質配列決定を行う既存の方法はどれも欠点を有する。質量分析法は、タンパク質の配列決定を行うための比較的有望な技術である。というのは、必要なサンプル量がピコモルでよく、あるいはフェムトモルでさえ可能であり、極めて正確なスペクトルが得られるからである。しかし、比較的大型のペプチドおよびタンパク質ではスペクトル解釈上の難点がかなり大きい。したがって、現行技術では、質量スペクトルから大型のペプチドの配列を推定することができる分析技術が求められている。   In summary, all existing methods for de novo protein sequencing have drawbacks. Mass spectrometry is a relatively promising technique for protein sequencing. This is because the amount of sample required can be picomolar or even femtomole and a very accurate spectrum can be obtained. However, comparatively large peptides and proteins have considerable spectral interpretation difficulties. Therefore, in the current technique, there is a demand for an analysis technique that can estimate the sequence of a large peptide from a mass spectrum.

本明細書で参照文献を引用しても、このような参照文献が本発明に対する従来技術であることを示すと解釈すべきではない。   Citation of a reference herein shall not be construed as indicating that such reference is prior art to the present invention.

本発明は、示差走査質量分析法のデータを自動的に分析することによってタンパク質またはペプチドのアミノ酸残基配列を導出することを含む。具体的には、本発明が扱うペプチド配列分析の態様は、質量分析データ中のC末端またはyイオンのピークを自動的に同定することである。yイオンのピークが同定されると、隣接するyイオン・ピーク間の質量差を計算し、各質量差を特定のアミノ酸残基に起因すると考えることによってペプチド配列を推定することができる。ペプチドの質量スペクトルは多数のピークからなるので、1対のスペクトル間の単純な差を人間が検査することによってペプチド配列を導出することは、通常は簡単ではなく、迅速に行えることはまれである。   The present invention involves deriving the amino acid residue sequence of a protein or peptide by automatically analyzing differential scanning mass spectrometry data. Specifically, an embodiment of peptide sequence analysis addressed by the present invention is to automatically identify C-terminal or y-ion peaks in mass spectrometry data. Once y-ion peaks are identified, the peptide sequence can be deduced by calculating the mass difference between adjacent y-ion peaks and considering each mass difference to be due to a specific amino acid residue. Since a peptide's mass spectrum consists of many peaks, it is usually not easy and rarely quick to derive a peptide sequence by human inspection of a simple difference between a pair of spectra. .

したがって、本発明の主題は、部分的に同位体標識したサンプルに対して得られる1対のMS/MSスペクトルからペプチドのペプチド配列を推定するコンピュータ・アルゴリズムである。このアルゴリズムでは、C末端の組のサブフラグメント(yイオン系列)だけを含む「フィルタ処理された」スペクトルを計算しようとするものである。その結果からアミノ酸配列を正確に推定することが可能である。   The subject of the present invention is therefore a computer algorithm that estimates the peptide sequence of a peptide from a pair of MS / MS spectra obtained for a partially isotopically labeled sample. This algorithm seeks to compute a “filtered” spectrum that includes only the C-terminal set of subfragments (y ion series). The amino acid sequence can be accurately estimated from the result.

本発明は、ペプチドのアミノ酸残基配列を決定する機器を含む。この機器は、同位体標識が、その天然存在度とは実質的に異なる割合で存在するペプチド・サンプルに示差走査質量分析法を適用することによって得られた質量分析データを受け取るように構成された入力装置と、この質量分析データに対して数学的演算を実行するように構成されたプロセッサと、このプロセッサに接続されたメモリとを備える。このメモリは、質量分析データ中のピークごとに繰り返し実行され、質量分析データ中のピークがペプチドのyイオン・サブフラグメントから得られる確率を生成するようにプロセッサに指示する第1組の命令と、このペプチドのフィルタ処理された質量スペクトルを生成するようにプロセッサに指示し、このフィルタ処理された質量スペクトル中で閾値よりも大きい強度を有する各ピークを、このペプチドのyイオン・サブフラグメントに対応するように予測する第2組の命令と、このフィルタ処理された質量スペクトルからこのペプチドのアミノ酸残基配列を導出し、それをメモリ中に記憶するようにプロセッサに指示する第3組の命令とを記憶する。好ましい実施形態では、同位体標識は18Oであり、その割合は50%である。 The present invention includes an instrument for determining the amino acid residue sequence of a peptide. The instrument was configured to receive mass spectrometry data obtained by applying differential scanning mass spectrometry to a peptide sample in which the isotope label is present at a rate that is substantially different from its natural abundance. An input device, a processor configured to perform mathematical operations on the mass spectrometry data, and a memory connected to the processor. This memory is executed repeatedly for each peak in the mass spectrometry data, and a first set of instructions instructing the processor to generate a probability that the peak in the mass spectrometry data is derived from the y-ion subfragment of the peptide; Instructs the processor to generate a filtered mass spectrum of the peptide, and each peak in the filtered mass spectrum having an intensity greater than a threshold corresponds to a y ion subfragment of the peptide A second set of instructions to predict and a third set of instructions to instruct the processor to derive the amino acid residue sequence of the peptide from the filtered mass spectrum and store it in memory Remember. In a preferred embodiment, the isotope label is 18 O and the proportion is 50%.

示差走査質量分析法の技術によれば、質量分析データは、同位体標識が存在する場合と存在しない場合のサブフラグメント・イオンからの信号を有する第1質量スペクトルと、同位体標識が存在しないサブフラグメント・イオンからの信号が実質的に抑圧された第2質量スペクトルとを含む。好ましい実施形態では、前記確率は、第1スコア値と第2スコア値の積から計算される。この第1スコア値は、同位体標識が存在しないサブフラグメント・イオンからの信号と、さらに同位体標識が前記割合で存在するサブフラグメント・イオンからの信号とを含む同位体クラスタから、第1質量スペクトル中のピークが生じる尤度(likelihood)に比例する。第2スコア値は、同位体標識が前記割合で存在するサブフラグメント・イオンからのピークを含む同位体クラスタであって、かつ同位体標識が存在しないサブフラグメント・イオンからのピークが第1質量スペクトルと比較して効果的に抑圧される同位体クラスタから、第2質量スペクトル中のピークが生じる尤度に比例する。   According to the differential scanning mass spectrometry technique, the mass spectrometry data includes a first mass spectrum with signals from subfragment ions in the presence and absence of isotope labels, and subcarriers without isotope labels. And a second mass spectrum in which the signal from the fragment ions is substantially suppressed. In a preferred embodiment, the probability is calculated from the product of the first score value and the second score value. This first score value is derived from the first mass from an isotope cluster that includes a signal from a sub-fragment ion that does not have an isotope label and a signal from a sub-fragment ion that has an isotope label in that proportion. It is proportional to the likelihood that a peak in the spectrum will occur. The second score value is an isotope cluster that includes peaks from subfragment ions in which isotope labels are present in the above proportions, and peaks from subfragment ions that do not have isotope labels are in the first mass spectrum. Is proportional to the likelihood that a peak in the second mass spectrum will occur from an isotope cluster that is effectively suppressed compared to.

本発明は、ペプチドのアミノ酸残基配列を決定する方法をさらに含む。この方法は、同位体標識が、その天然存在度と実質的に異なる割合で存在するペプチド・サンプルに示差走査質量分析法を適用することによって得られた質量分析データを受け取ることと、第1組の命令が質量分析データ中の各ピークごとに繰り返し実行され、質量分析データ中のピークがペプチドのyイオン・サブフラグメントから得られる確率を生成することと、このペプチドのフィルタ処理された質量スペクトルを生成し、このフィルタ処理された質量スペクトル中で閾値よりも大きい強度を有する各ピークを、このペプチドのyイオン・サブフラグメントに対応するように予測することと、このフィルタ処理された質量スペクトルからこのペプチドのアミノ酸残基配列を導出することとを含む。本発明の好ましい実施形態によれば、ペプチドのアミノ酸残基配列を決定する方法は、プログラムの制御下でコンピュータによって実行される。このコンピュータは、このプログラムを記憶するメモリと、質量分析データを受け取るように構成された入力装置と、前記質量分析データに対して数学的演算を実行するように構成されたプロセッサとを含む。   The present invention further includes a method for determining the amino acid residue sequence of a peptide. The method includes receiving mass spectrometry data obtained by applying differential scanning mass spectrometry to a peptide sample in which an isotope label is present in a proportion substantially different from its natural abundance, and a first set. Is repeated for each peak in the mass spectrometry data to generate a probability that the peak in the mass spectrometry data is derived from the y-ion subfragment of the peptide, and the filtered mass spectrum of this peptide Generating and predicting each peak in the filtered mass spectrum that has an intensity greater than a threshold to correspond to the y-ion subfragment of the peptide, and from the filtered mass spectrum Deriving the amino acid residue sequence of the peptide. According to a preferred embodiment of the invention, the method for determining the amino acid residue sequence of a peptide is performed by a computer under the control of a program. The computer includes a memory for storing the program, an input device configured to receive mass spectrometry data, and a processor configured to perform mathematical operations on the mass spectrometry data.

本発明の他の利点は、以下の詳細な説明を読み、図面を参照すれば明らかであろう。   Other advantages of the present invention will become apparent upon reading the following detailed description and upon reference to the drawings in which:

序論
タンデム質量スペクトル中でタンパク質のyイオンのピークを同定する方法を説明する。本明細書では、「タンパク質」という用語は広い意味で用いられ、ペプチド、ポリペプチドおよびオリゴペプチド、ならびにそれらの誘導体、例えば、糖タンパク質、リポタンパク質およびリンタンパク質、ならびに金属タンパク質を含むが、これらには必要に応じて変更が加えられる。このような化学種を識別する主要な特徴は、「タンパク質」が1つまたは複数のペプチド結合(-N(-H)C(=O)-)を含むことである。
Introduction Describes how to identify protein y-ion peaks in tandem mass spectra. As used herein, the term “protein” is used in a broad sense and includes peptides, polypeptides and oligopeptides, and derivatives thereof such as glycoproteins, lipoproteins and phosphoproteins, and metalloproteins. Will be modified as needed. A key feature that distinguishes such chemical species is that the “protein” contains one or more peptide bonds (—N (—H) C (═O) —).

この方法の目標は、可能性のあるペプチド配列を提案することができるように、MS/MSスペクトルの分析を簡略化し、かつ自動化することである。この方法は、コンピュータ・アルゴリズムの形で実施される。このアルゴリズムは、既知の割合のH2 18OおよびH2 16Oを含む水混合物中で酵素により消化されたタンパク質サンプルから、ペプチドのフラグメント・イオン・スペクトルを1つだけではなく2つ取得することに基づいている。この水混合物は、H2 18Oの部分組成がH2 18Oの天然存在度よりも実質的に多くなるようにし、その条件は、ペプチド・フラグメントに、そのC末端のところで、この水混合物中に存在するのと同じ割合で18O標識が組み込まれるというものである。このペプチドの16O/18O同位体混合物全体を選別してフラグメント化させることによって、1つのスペクトルが得られ、18Oで標識したペプチド・イオンだけがフラグメント化された第2スペクトルが得られる。 The goal of this method is to simplify and automate the analysis of MS / MS spectra so that potential peptide sequences can be proposed. This method is implemented in the form of a computer algorithm. This algorithm obtains two peptide fragment ion spectra instead of just one from a protein sample that has been enzymatically digested in a water mixture containing known proportions of H 2 18 O and H 2 16 O. Based on. The water mixture, as part composition of H 2 18 O is substantially greater than the natural abundance of H 2 18 O, the conditions, the peptide fragment, at its C-terminus, the water mixture 18 O label is incorporated at the same rate as is present in By sorting and fragmenting the entire 16 O / 18 O isotopic mixture of this peptide, one spectrum is obtained, and a second spectrum is obtained in which only peptide ions labeled with 18 O are fragmented.

16O/18Oおよび18Oの質量スペクトルを取得した後で、本発明のコンピュータ・プログラム製品および方法を用いてデータを分析して、yイオンから生じるピークを同定する。2つの基準を用いてこれら2つのスペクトルを比較すると、C末端ペプチド・サブフラグメントに対応するピークを同定することができる。第1の基準は、通常、視覚的な検査で明確に認識するのが難しいか、あるいは不可能である第1スペクトル中のC末端ペプチド・サブフラグメントの16O/18O同位体分布である。第2の基準は、第1スペクトルと第2スペクトルを比較したときのC末端サブフラグメント・イオン・ピークの同位体分布の変化である。C末端イオンは、第1スペクトル中では完全な16O/18O同位体分布からのピークを含むが、第2スペクトル中では18O同位体からのピークのみを含むことによって同定される。非C末端イオンは、いずれのスペクトル中でも同位体による表現が同じである。というのは、どちらのスペクトルも、酵素消化によって導入された割合では18O同位体を含んでいないからである。 After obtaining the mass spectra of 16 O / 18 O and 18 O, the data is analyzed using the computer program products and methods of the present invention to identify peaks arising from y ions. When these two spectra are compared using two criteria, the peak corresponding to the C-terminal peptide subfragment can be identified. The first criterion is the 16 O / 18 O isotopic distribution of the C-terminal peptide subfragment in the first spectrum, which is usually difficult or impossible to clearly recognize by visual inspection. The second criterion is a change in the isotope distribution of the C-terminal subfragment ion peak when the first spectrum and the second spectrum are compared. The C-terminal ion is identified by including a peak from the complete 16 O / 18 O isotope distribution in the first spectrum but only a peak from the 18 O isotope in the second spectrum. Non-C-terminal ions have the same isotope representation in any spectrum. This is because neither spectrum contains 18 O isotopes at the rate introduced by enzymatic digestion.

すべてのC末端フラグメント・イオンが同定されると、隣接フラグメント間の質量差を計算することによって、かつこのスペクトル中でのこれらのフラグメントの順序からこのペプチド配列を推定することができる。本発明の方法およびコンピュータ・プログラム製品は、減算された質量スペクトルかつフィルタ処理された質量スペクトルの計算をさらに含んでいてもよい。   Once all C-terminal fragment ions have been identified, the peptide sequence can be deduced by calculating the mass difference between adjacent fragments and from the order of these fragments in the spectrum. The method and computer program product of the present invention may further include calculation of the subtracted mass spectrum and the filtered mass spectrum.

本発明の方法は、機械が、良好に分解された質量スペクトルを得ることができる分解能を有し、特に、異なる同位体を分解することができる場合に限り、任意の長さのタンパク質またはペプチドに適用することができる。読み取ることができるアミノ酸の数は配列に依存し、そのため、例えば20アミノ酸長のペプチドがあり、そのうち5つのアミノ酸しか読み取れないこともあり、25アミノ酸長の他のペプチドがあり、その25個の残基すべてを読み取れることもある。一般に、ペプチドがあるサイズよりも長くなると、読取り可能な配列は短くなる傾向が見られる。それでも、3kDaのサイズ(残基数約30個)までのペプチドを十分な長さまで配列決定することができる(すなわち、30個のアミノ酸のうち20個を読み取ることが可能である)ことがわかっている。配列決定にはこれより下限は存在しない。   The method of the present invention has a resolution that allows the machine to obtain a well resolved mass spectrum, especially for proteins or peptides of any length only if it can resolve different isotopes. Can be applied. The number of amino acids that can be read depends on the sequence, so for example, there are peptides that are 20 amino acids long, of which only 5 amino acids can be read, other peptides that are 25 amino acids long, Sometimes the whole group can be read. In general, as the peptide becomes longer than a certain size, the readable sequence tends to be shorter. Still, it turns out that peptides up to 3 kDa in size (about 30 residues) can be sequenced to a sufficient length (i.e. 20 of 30 amino acids can be read). Yes. There is no lower limit for sequencing.

機器
本発明は、図1に示すように、質量分析器130から得られる質量分析データからペプチド配列を推定するためのシステム100を備える。システム100は、プロセッサ102、一般に、高速ランダム・アクセス・メモリおよび不揮発性メモリ(1つまたは複数の磁気ディスク・ドライブなど)をともに含むことになるメモリ領域104、ユーザ固有のパラメータを入力するキーボード、マウスおよび/またはタッチ・スクリーン・ディスプレイを含み得る入力装置106、タンパク質またはペプチドの配列を印刷または表示する出力装置108、ならびに、プロセッサ102、メモリ104、入力装置106および出力装置108を接続する少なくとも1つのバス110を備える。図1には示さないが、システム100は、他のコンピュータおよび他の装置と通信するためのネットワークその他の通信インターフェースも備えることが好ましい。
Instrument The present invention comprises a system 100 for estimating peptide sequences from mass spectrometry data obtained from a mass analyzer 130, as shown in FIG. The system 100 includes a processor 102, generally a memory region 104 that will include both high-speed random access memory and non-volatile memory (such as one or more magnetic disk drives), a keyboard for entering user-specific parameters, Input device 106, which may include a mouse and / or touch screen display, output device 108 for printing or displaying a sequence of proteins or peptides, and at least one connecting processor 102, memory 104, input device 106 and output device 108 Two buses 110 are provided. Although not shown in FIG. 1, system 100 also preferably includes a network or other communication interface for communicating with other computers and other devices.

好ましくは、このメモリは、基本的なシステム・サービスを提供するオペレーティング・システム120、ファイル・システム122、質量分析データを分析するように構成された分析モジュール128、キャッシュ126および任意選択でGUI(グラフィカル・ユーザ・インターフェース)124を格納する。   Preferably, this memory includes an operating system 120 that provides basic system services, a file system 122, an analysis module 128 configured to analyze mass spectrometry data, a cache 126, and optionally a GUI (graphical). (User interface) 124 is stored.

好ましくは、システム100は、質量分析器130からデータ・チャネル132を介して質量分析データを取得する。本発明の一実施形態では、質量分析器130は、3連4重極質量分析器である。   Preferably, the system 100 acquires mass spectrometry data from the mass analyzer 130 via the data channel 132. In one embodiment of the invention, the mass analyzer 130 is a triple quadrupole mass analyzer.

分析モジュール128は、質量分析データからペプチドまたはタンパク質の配列を推定するように要求を受け取ると、質量分析データ中のどのピークがyイオン系列中のペプチド・サブフラグメントに対応するかを十分な確率で同定することができる命令を実行する。yイオンが同定されると、隣接するyイオン・ピーク間の質量差を計算することによって、アミノ酸配列が決定する。各質量差は、1つのアミノ酸残基の質量に対応する。互いに同じ質量を有するロイシンおよびイソロイシンを除き、ペプチド鎖中のすべてのアミノ酸を区別することができる。当業者に周知の原理を用いて、異なるペプチド・フラグメントのスペクトルから決定された別々のペプチド配列を連結するか、あるいは重ね合わせることによって、タンパク質の配列全体を決定することができる。   When analysis module 128 receives a request to infer the sequence of a peptide or protein from mass spectrometry data, it has a sufficient probability that which peak in the mass spectrometry data corresponds to a peptide subfragment in the y ion series. Execute instructions that can be identified. Once the y ion is identified, the amino acid sequence is determined by calculating the mass difference between adjacent y ion peaks. Each mass difference corresponds to the mass of one amino acid residue. All amino acids in the peptide chain can be distinguished except for leucine and isoleucine, which have the same mass. Using the principles well known to those skilled in the art, the entire sequence of a protein can be determined by linking or overlapping separate peptide sequences determined from spectra of different peptide fragments.

このシステムは、質量分析データとともに実験室環境で操作すると、タンパク質またはペプチドのアミノ酸残基配列を推定する効率的で有用な方法を提供することができる。   When operated in a laboratory environment with mass spectrometry data, this system can provide an efficient and useful method for deducing the amino acid residue sequence of a protein or peptide.

装置構成
質量分析器は、イオンを、その質量mと電荷zの比であるm/z比に従って分離する。第1段階では、サンプルを、例えば電子衝撃によってイオン化し、後続の段階で、均質でない電磁場によって検出器に向かって加速させるイオンを生成する。一実施形態では、この電磁場により、イオンの軌跡が、そのm/z比に従って摂動する。質量が小さいイオンは、より速く移動し、より重いイオンよりも簡単には摂動を受けない。電荷数が小さいイオンは、電荷数が大きいものよりも大きく摂動することになる。実際、生成されたほとんどのイオンは単一の正電荷しか担持しないが、一部のイオン化技術では、多価イオンが容易に生じ得る。いくつかの理由により、同じサンプルから異なるm/zのイオンが生成される。すなわち、イオン化条件により分子が解離することがあり、イオン自体が後で転移し解離することがあり、また、所与のサンプルの分子中には常に多くの異なる同位体置換基があるからである。
Apparatus Configuration The mass analyzer separates ions according to the m / z ratio, which is the ratio of their mass m to charge z. In the first stage, the sample is ionized, for example by electron impact, and in subsequent stages, ions are generated that are accelerated towards the detector by a non-homogeneous electromagnetic field. In one embodiment, this electromagnetic field causes the ion trajectory to perturb according to its m / z ratio. Ions with lower mass move faster and are less easily perturbed than heavier ions. Ions with a small charge number will perturb more than those with a large charge number. In fact, most of the ions produced carry only a single positive charge, but some ionization techniques can easily generate multivalent ions. For several reasons, different m / z ions are produced from the same sample. That is, molecules may dissociate depending on ionization conditions, ions themselves may later transfer and dissociate, and there are always many different isotope substituents in a given sample molecule. .

一実施形態では、3連4重極質量分析器を使用して、ペプチド・サブフラグメント・データを取得する。このような機械の例は、PE-Sciex(Perkin Elmer Sciex)社のAPI IIIである。この実施形態では、3つの4重極をイオン・ガイド、質量フィルタおよび衝突セルとして用いる。このような質量分析器300の典型的な配置を図3に示すが、このような質量分析器のコンポーネントの変形形態が、本発明の方法とともに実施することが想定されていることを理解されたい。   In one embodiment, a triple quadrupole mass analyzer is used to acquire peptide subfragment data. An example of such a machine is API III from PE-Sciex (Perkin Elmer Sciex). In this embodiment, three quadrupoles are used as the ion guide, mass filter and collision cell. Although a typical arrangement of such a mass analyzer 300 is shown in FIG. 3, it should be understood that variations of such mass analyzer components are envisioned to be implemented with the method of the present invention. .

タンデム質量分析法では、2段階の質量分析を用いる。第1段階では、イオン化源304から前駆イオンを生成する。好ましい実施形態では、エレクトロスプレー・イオン化法を用いてこれらの前駆イオンを生成する。これらの前駆イオンは、任意選択で、イオン・ガイドとして働く第1の4重極306を通過する。通常、このイオン・ガイドは質量選択性4重極ではなく、通常は、3連4重極型の機械にしか存在しない。前駆イオンは、特定の値のm/z比を有する前駆イオン、あるいは、より一般には、ある狭い範囲の値をとるm/z比の前駆イオンを選別する質量フィルタ310を通過する。現在、最大の感度が得られる質量フィルタ310は、4重極質量フィルタであることがわかっている。あるいは、イオン・トラップを別法として用いることができる。本発明の好ましい実施形態では、質量フィルタ310は、4重極質量フィルタである。4重極質量フィルタが透過させるm/z比の範囲は、透過ウインドウとして知られている。   Tandem mass spectrometry uses two-stage mass spectrometry. In the first stage, precursor ions are generated from the ionization source 304. In a preferred embodiment, electrospray ionization is used to generate these precursor ions. These precursor ions optionally pass through a first quadrupole 306 that serves as an ion guide. This ion guide is usually not a mass selective quadrupole and is usually only present in triple quadrupole machines. The precursor ions pass through a mass filter 310 that sorts out precursor ions having a specific value of m / z ratio, or more generally, m / z ratio that takes a narrow range of values. Currently, it is known that the mass filter 310 that provides maximum sensitivity is a quadrupole mass filter. Alternatively, an ion trap can be used as an alternative. In a preferred embodiment of the present invention, the mass filter 310 is a quadrupole mass filter. The range of m / z ratios that the quadrupole mass filter transmits is known as the transmission window.

好ましい実施形態では、ペプチド・サブフラグメント・データを取得するのに用いる質量分析器300は、「Q-TOF」(4重極飛行時間)質量分析器である。このような機械の例は、英国所在のMicromass社の「Q-Tof2」である。このような機械は、2つの4重極を使用する。4重極312は、前駆イオン選別用の質量フィルタとして用いられ、4重極322は、前駆イオンがさらにフラグメント化されてサブフラグメントになる衝突セル310内で用いられる。「TOF」(飛行時間)質量分析器340を使用して、これらのサブフラグメント・イオンを検査する。図8として、本発明を実施するための代表的な質量分析器設計も示す。   In a preferred embodiment, the mass analyzer 300 used to acquire peptide subfragment data is a “Q-TOF” (quadrupole time of flight) mass analyzer. An example of such a machine is the “Q-Tof2” from Micromass in the UK. Such a machine uses two quadrupoles. The quadrupole 312 is used as a mass filter for precursor ion sorting, and the quadrupole 322 is used in a collision cell 310 where the precursor ions are further fragmented into subfragments. A “TOF” (time of flight) mass analyzer 340 is used to examine these subfragment ions. FIG. 8 also shows a representative mass analyzer design for practicing the present invention.

イオン化技術
質量分析法の分析用前駆イオンを生成するのに用いられるイオン化技術には、複数のものがある。これらには、電子イオン化法、化学イオン化法、電界イオン化法、電界脱離法、高速原子衝撃法、プラズマ脱離法、レーザ脱離法およびエレクトロスプレー・イオン化法が含まれるが、これらに限定されるものではない。生体分子分析に最も一般的に用いられる2つのイオン化技術は、「MALDI」(マトリックス支援レーザ脱離イオン化法)および「ESI」(エレクトロスプレー・イオン化法)である。本発明の方法は、用いられるイオン化技術に無関係である。
Ionization techniques There are several ionization techniques that can be used to generate precursor ions for mass spectrometry analysis. These include, but are not limited to, electron ionization, chemical ionization, field ionization, field desorption, fast atom bombardment, plasma desorption, laser desorption, and electrospray ionization. It is not something. The two most commonly used ionization techniques for biomolecular analysis are “MALDI” (matrix-assisted laser desorption ionization) and “ESI” (electrospray ionization). The method of the present invention is independent of the ionization technique used.

本発明とともに使用する質量分析器の一実施形態では、MALDIを用いる。MALDIは、生体分子を、モル数が大きく過剰な小型紫外光放射吸収有機酸(マトリックス)とともに結晶化させる特定のタイプのレーザ脱離法である。紫外レーザで共結晶を照射すると、マトリックス分子および生体分子は気相になり、そこで陽子がマトリックス分子から生体分子に移動して、分析用の生体分子前駆イオンが形成される。通常、MALDIにより、1価の前駆イオンが生じ、その後、これを「PSD」(ポスト・ソース分解)にかけてフラグメント・イオンを生成する。したがって、通常は、MALDIとともに衝突誘起解離を用いる必要はない。しばしば、MALDI法は、飛行時間型質量分析器とともに用いられ、したがって、本発明の方法とともに用いることができる。   One embodiment of a mass analyzer for use with the present invention uses MALDI. MALDI is a specific type of laser desorption method in which a biomolecule is crystallized with a large number of excess small ultraviolet radiation absorbing organic acids (matrix). When the co-crystal is irradiated with an ultraviolet laser, the matrix molecules and biomolecules are in the gas phase, where protons move from the matrix molecules to the biomolecules to form biomolecule precursor ions for analysis. Usually, MALDI produces a monovalent precursor ion, which is then subjected to “PSD” (post-source decomposition) to produce fragment ions. Therefore, it is usually not necessary to use collision-induced dissociation with MALDI. Often, the MALDI method is used with a time-of-flight mass analyzer and can therefore be used with the method of the present invention.

本発明で用いる好ましい実施形態では、イオン化源304はESIによって前駆イオンを生成し、それに従って、微細金属キャピラリの先端から生体分子の希釈溶液を大気圧で吹き付けることによってイオンが形成される。この吹付けにより、微細ミストの液滴が生成され、高電界中で強く帯電する。これらの液滴が蒸発すると、生体分子は、溶媒から1つまたは複数の陽子を受け取って、1つまたは複数の正電荷を有するイオンを形成する。これらの液滴が収縮すると、電荷の反発力により、これらのイオンが液滴表面から蒸発し、次いで、質量分析器中で分析される。本発明とともに用いられる質量分析器の好ましい実施形態では、ESIを用いて前駆イオンを生成する。MALDIでは、サンプルおよび前駆イオンが広範囲にフラグメント化され得るが、ESIでは、ほとんど、あるいは全くフラグメント化が起こらない。さらに、ESI用のサンプルは溶液の状態なので、この技術は、HPLCなどの精製技術を供給させるのに最適である。   In a preferred embodiment for use with the present invention, the ionization source 304 generates precursor ions by ESI, and ions are accordingly formed by blowing a dilute solution of biomolecules from the tip of a fine metal capillary at atmospheric pressure. By this spraying, fine mist droplets are generated and charged strongly in a high electric field. As these droplets evaporate, the biomolecules receive one or more protons from the solvent and form one or more positively charged ions. As these droplets shrink, the repulsive force of the charges causes these ions to evaporate from the droplet surface and then analyzed in a mass analyzer. In a preferred embodiment of the mass analyzer used with the present invention, ESI is used to generate precursor ions. In MALDI, sample and precursor ions can be extensively fragmented, while in ESI, little or no fragmentation occurs. Furthermore, since the sample for ESI is in solution, this technique is ideal for supplying purification techniques such as HPLC.

質量フィルタ
本発明とともに用いる質量分析器の好ましい実施形態では、4重極質量フィルタ310を用いて前駆イオンを選別する。4重極質量フィルタは、2対の正確に平行に配置された金属ロッドからなる4重極312を備え、対向するロッドは電気的に接続される。「DC」(直流電位)からなる電圧および「RF」(交流高周波)成分が各対のロッドに印加される。この4重極を通過するイオンは、交互にこれらのロッドに引きつけられ、それらから反発して離れるので、これらのイオンは揺動軌跡をとり、ある範囲の運動エネルギーを有するイオンだけが、これらのロッド間を通過し反対側に出る。他のすべてのイオンは、ロッドに衝突する。所与のイオンの運動エネルギーは、そのイオンの質量に比例するので、イオンの選別は質量に依存する。この4重極を通過するイオンが、4重極の透過ウインドウを識別する。DCおよびRFの振幅を、それらの比であるDC/RFを一定に保ちながら一緒に変化させれば、透過ウインドウの中心を他のm/z値にシフトすることができ、異なる質量を有するイオンを「フィルタ処理」して通し、分析にかけることができる。
Mass Filter In a preferred embodiment of a mass analyzer for use with the present invention, a quadrupole mass filter 310 is used to sort precursor ions. The quadrupole mass filter comprises a quadrupole 312 consisting of two pairs of precisely parallel metal rods, the opposing rods being electrically connected. A voltage consisting of “DC” (direct current potential) and an “RF” (AC high frequency) component are applied to each pair of rods. Ions passing through this quadrupole are alternately attracted to these rods and repel away from them, so these ions take a swing trajectory and only ions with a range of kinetic energy are Pass between the rods and exit on the other side. All other ions strike the rod. Since the kinetic energy of a given ion is proportional to the mass of that ion, the selection of ions is mass dependent. The ions passing through the quadrupole identify the quadrupole transmission window. If the DC and RF amplitudes are changed together while keeping their ratio DC / RF constant, the center of the transmission window can be shifted to other m / z values, and ions with different masses. Can be "filtered" through for analysis.

サブフラグメント・イオンの生成
本発明とともに用いる質量分析器の一実施形態では、特定のm/zを有するフィルタ処理された前駆イオンは、衝突セル320に送られる。3連4重極質量分析器では、衝突セルは第3の4重極を含む。ToFの機械では、一般に、衝突セルは、2つの4重極のうち第2のものを含む。本発明に適合する多くの機械が、4重極を備える衝突セルを使用することを理解されたい。イオン・トラップを利用する機械では、イオン・トラップ自体が衝突セルである。というのは、イオンがイオン・トラップ内部で残りのガス原子と衝突し得るからである。
Generation of Subfragment Ions In one embodiment of a mass analyzer used with the present invention, filtered precursor ions having a specific m / z are sent to the collision cell 320. In a triple quadrupole mass analyzer, the collision cell includes a third quadrupole. In ToF machines, the collision cell typically includes the second of two quadrupoles. It should be understood that many machines that are compatible with the present invention use collision cells with quadrupoles. In machines that use ion traps, the ion trap itself is the collision cell. This is because ions can collide with the remaining gas atoms inside the ion trap.

衝突セル320では、フィルタ処理された前駆イオンが、供給源314から送り込まれたアルゴンまたはキセノンあるいは二窒素などの帯電していないガス分子と衝突する。これらの前駆イオンの運動エネルギーは振動エネルギーに部分的に変換され、それによって、前駆イオンの主要な弱い化学結合が切断される。ペプチドの前駆イオンが、それらのペプチド・アミド結合のところから先にフラグメント化して、ペプチド・サブフラグメントが生成される。得られたサブフラグメント・イオンを、質量分析器340によって分析する。   In the collision cell 320, the filtered precursor ions collide with uncharged gas molecules such as argon or xenon or dinitrogen fed from the source 314. The kinetic energy of these precursor ions is partially converted into vibrational energy, thereby breaking the main weak chemical bonds of the precursor ions. Peptide precursor ions are fragmented first from their peptide-amide bond to produce peptide subfragments. The resulting subfragment ions are analyzed by mass analyzer 340.

質量分析器
好ましい実施形態では、用いられる質量分析器は、「TOF」(飛行時間)質量分析器である。このタイプの質量分析器では、サブフラグメント・イオンは、加速プレート342によって加速され、ドリフト・チューブ344として知られる外部電界が存在しない領域中に入る。このドリフト・チューブに入るすべてのサブフラグメント・イオンが、質量m、速度vのイオンに対して1/2mv2で与えられる同じ運動エネルギーを有する場合、速度は質量の平方根に反比例するので、比較的大きな質量を有するサブフラグメント346は、より小さい質量を有するサブフラグメント348よりもゆっくりと移動することになる。したがって、より重いサブフラグメント・イオンは、より軽いサブフラグメント・イオンよりも、ドリフト・チューブの端部にある検出器350に達する時間は遅くなる。TOF分析器は、しばしばMALDI法とともに用いられる。TOF分析器は、事実上質量の範囲の制限がなく、走査速度が高速であるという点で有利である。
Mass Analyzer In a preferred embodiment, the mass analyzer used is a “TOF” (Time of Flight) mass analyzer. In this type of mass analyzer, subfragment ions are accelerated by an acceleration plate 342 and enter a region where there is no external electric field known as drift tube 344. If all subfragment ions entering this drift tube have the same kinetic energy given by 1/2 mv 2 for ions of mass m and velocity v, the velocity is inversely proportional to the square root of the mass, so A subfragment 346 having a large mass will move more slowly than a subfragment 348 having a smaller mass. Thus, heavier subfragment ions have a slower time to reach the detector 350 at the end of the drift tube than lighter subfragment ions. TOF analyzers are often used with the MALDI method. TOF analyzers are advantageous in that they have virtually no mass range limitations and high scanning speeds.

好ましい実施形態では、検出器350は、質量スペクトルが効果的に瞬時に表示される電子増倍管である。検出器350は、質量データを送信チャネル132を介してコンピュータ・システム100に送信する。   In the preferred embodiment, detector 350 is an electron multiplier that effectively displays the mass spectrum instantaneously. Detector 350 transmits mass data to computer system 100 via transmission channel 132.

TOF分析器の制限は、同じサブフラグメント・イオンの集合体の構成要素すべてが同じ運動エネルギーを有するわけではないので、ピークが広がることである。初期エネルギーの広がりは質量で決まるので、より重いサブフラグメント・イオンからのピークはより広くなる。当業者には周知のように、ドリフト・チューブに入るサブフラグメント・イオンの初期運動エネルギー分布は、最終加速電圧を大きくすることによって減少させることができる。ドリフト・チューブの長さを長くすることによって、TOF分析器の分解能も上げることができる。こうすると、異なるm/zのイオンの到着時間差が大きくなるが、同じm/zを有するイオンの到着時間の広がりも大きくなる。本発明とともに用いる質量分析器の別の実施形態では、TOF分析器は、イオンが湾曲した経路をたどる「リフレクトロン」タイプである。リフレクトロン型TOF分析器では、イオンの速度を遅くし、それらを検出器に方向づける前に方向転換させる。イオンが方向転換すると、比較的遅いイオンがより速いイオンに追いつく。   The limitation of TOF analyzers is that the peaks are broadened because not all members of the same subfragment ion assembly have the same kinetic energy. Since the initial energy spread is determined by mass, the peaks from heavier subfragment ions become wider. As is well known to those skilled in the art, the initial kinetic energy distribution of subfragment ions entering the drift tube can be reduced by increasing the final acceleration voltage. By increasing the length of the drift tube, the resolution of the TOF analyzer can be increased. This increases the arrival time difference between ions of different m / z, but also increases the arrival time spread of ions having the same m / z. In another embodiment of a mass analyzer for use with the present invention, the TOF analyzer is of the “reflectron” type in which ions follow a curved path. In a reflectron TOF analyzer, ions are slowed and redirected before they are directed to the detector. As ions change direction, relatively slow ions catch up with faster ions.

質量分析データ
質量分析データは複数の元素を含み、各元素は、あるm/z値に対して強度値Iを有する。このデータは、ある範囲のm/z値の全域で元素を含む。m/z値に広く用いられる単位名は、Th(「トムソン」)である。トムソンで表したある範囲の強度値を含むデータの集合体を、しばしば「質量スペクトル」と呼ぶ。一般に、質量スペクトル中のm/z値は、0.02Thだけ互いに分離されるが、分解能によっては、0.01Thまたは0.05Thだけ互いに分離され得る。
Mass Spectrometry Data Mass spectrometric data includes a plurality of elements, each element having an intensity value I for a certain m / z value. This data includes elements across a range of m / z values. A widely used unit name for the m / z value is Th (“Thomson”). A collection of data containing a range of intensity values expressed in Thomson is often referred to as a “mass spectrum”. In general, m / z values in a mass spectrum are separated from each other by 0.02Th, but can be separated from each other by 0.01Th or 0.05Th depending on the resolution.

質量スペクトル中の「ピーク」は、隣接する元素の集合体によって定義され、ピークでは、各強度値は強度閾値よりも大きい。一般に、質量分析データは、バックグラウンド強度と、しばしばノイズと呼ばれる、多くの低強度のデータ片も含む。この強度閾値は、分析中に検討対象からノイズが除去されるように選択する。通常、ピーク強度は、ピークの高さに比例するが、より複雑なスペクトルでは、特に比較的重いイオンでは、この近似は成り立たないこともある。   A “peak” in a mass spectrum is defined by a collection of adjacent elements, where each intensity value is greater than an intensity threshold. In general, mass spectrometry data also includes a number of low intensity data pieces, often referred to as background intensity and noise. This intensity threshold is selected so that noise is removed from the consideration during analysis. Usually, peak intensity is proportional to peak height, but this approximation may not hold for more complex spectra, especially for relatively heavy ions.

厳密には、ピークの全体的強度は、ピーク下の面積を計算することによって得られる。一実施形態では、この計算は重心法によって実現される。重心処理では、「FWHM」(半値全幅)で求めた幅が少なくとも0.04Thである任意のピークに対して、幅0.08Thのウインドウ内のデータをこのピークに合わせ加算する。一般に、重心処理は、別のピークが誤って合成され得るため、本発明で必要とされる精度を得るのに十分に満足できるものではない。したがって、好ましい実施形態では、積分法を用いてピーク強度を計算する。好ましくは、この方法は、約±0.02Thのウインドウ内でピークの周りに存在するすべての強度を加算する。同じスペクトル中の異なるサブフラグメント・イオンは異なる電荷数を有し得るで、サブフラグメント・イオンの電荷数に従って異なるウインドウを選択すべきである。したがって、1価のフラグメントでは、好ましくはこのウインドウは0.04Thであり、2価のフラグメントでは、好ましくはこのウインドウは0.02Thである。ピークの積分を実行する際に他のウインドウを選択することは本発明の方法と適合する。実際、異なる領域の質量スペクトルに対して異なるサイズのウインドウを選択することも可能である。   Strictly speaking, the overall intensity of the peak is obtained by calculating the area under the peak. In one embodiment, this calculation is accomplished by a centroid method. In the center-of-gravity process, data in a window having a width of 0.08Th is added to an arbitrary peak having a width obtained by “FWHM” (full width at half maximum) of at least 0.04Th and added to this peak. In general, centroid processing is not fully satisfactory to obtain the accuracy required by the present invention because another peak can be erroneously synthesized. Therefore, in a preferred embodiment, the peak intensity is calculated using an integration method. Preferably, the method adds all intensities that exist around the peak within a window of about ± 0.02 Th. Different subfragment ions in the same spectrum may have different charge numbers, and different windows should be selected according to the charge number of the subfragment ions. Thus, for monovalent fragments, this window is preferably 0.04Th, and for divalent fragments, this window is preferably 0.02Th. Selecting another window when performing peak integration is compatible with the method of the present invention. In fact, it is possible to select different sized windows for different regions of the mass spectrum.

有機分子を構成するほとんどの化学元素は、天然に存在する2つ以上の同位体を有する。下記の表1を参照されたい。質量スペクトルは、多数のイオンによって生成される信号からなるので、このスペクトルは、天然に存在する同位体すべてを統計的にサンプリングすることを含む。分子がより大型になると、1つまたは複数のより重い同位体の原子を有する分子の集合体の割合も大きくなる。その結果、所与のサブフラグメント・イオンは、(人為的に同位体の純度が得られるようにした場合を除いて)スペクトル中で単一の先鋭なピークとして現れなくなる。その代わり、質量スペクトルの所与のイオンのm/z値の周りの部分は複数のピークを含む。というのは、このイオン中に存在する各元素が、それ自体の分布の同位体を天然に有するからである。

Figure 2005510732
Most chemical elements that make up organic molecules have two or more isotopes that occur in nature. See Table 1 below. Since a mass spectrum consists of signals generated by a large number of ions, this spectrum involves statistical sampling of all naturally occurring isotopes. The larger the molecule, the greater the proportion of molecular assemblies that have one or more heavier isotope atoms. As a result, a given subfragment ion will not appear as a single sharp peak in the spectrum (unless an artificial isotope purity is obtained). Instead, the portion of the mass spectrum around the m / z value for a given ion contains multiple peaks. This is because each element present in this ion naturally has its own distribution of isotopes.
Figure 2005510732

したがって、所与のペプチド・サブフラグメントの質量スペクトルは、複数の近接した分離ピークを含むことになる。これらのピークはそれぞれ、このペプチド・サブフラグメントの原子の中でも特定の分布の同位体に対応する。このペプチド・サブフラグメントが、イオン化中に単一の電荷を得る場合、このサブフラグメントに関する近接した分離ピークはそれぞれ、約1m/z単位だけ分離される。同位体の偏差分だけ互いに異なるフラグメントに対応するピークの集合体をクラスタと呼ぶ。質量数が12.0000原子質量単位になるように定義される12Cを除いて、整数の質量数を有する同位体はない。1つの13C原子を伴うペプチド分子の質量は、1つの17O原子を伴うが13C原子を伴わない同じペプチド分子の質量と厳密には同じではない。したがって、クラスタ内のピークは、きれいに分解されず、大きく重なり合うことがある。 Thus, the mass spectrum of a given peptide subfragment will contain multiple closely separated peaks. Each of these peaks corresponds to a specific distribution of isotopes among the atoms of this peptide subfragment. If the peptide subfragment acquires a single charge during ionization, each adjacent separation peak for the subfragment is separated by approximately 1 m / z units. A cluster of peaks corresponding to fragments different from each other by the isotope deviation is called a cluster. There is no isotope with an integer mass number except 12 C, which is defined to have a mass number of 12.0000 atomic mass units. Mass peptide molecule with one 13 C atoms, which involves one 17 O atom that is not the same as the exact mass of the same peptide molecule without the 13 C atoms. Therefore, the peaks in the cluster are not neatly resolved and may overlap significantly.

原子がどれも最も多く存在する同位体として存在する分子の質量を「モノアイソトピック質量」と呼ぶ。分子のモノアイソトピック質量は、すべての原子に対して最も多く存在する同位体の正確な質量を合計したものである。一般に、このモノアイソトピック質量に対応するピークは最小質量のものである。というのは、タンパク質またはペプチド中に存在する各元素の最も多く存在する同位体は、すべての同位体の中で最小の質量を有するからである。ただし、このピークは、常に最も強度が大きいとは限らない。   The mass of a molecule that exists as an isotope in which all atoms are the most present is called “monoisotopic mass”. The monoisotopic mass of a molecule is the sum of the exact masses of the most abundant isotopes for all atoms. In general, the peak corresponding to this monoisotopic mass is of the minimum mass. This is because the most abundant isotope of each element present in a protein or peptide has the smallest mass among all isotopes. However, this peak is not always the strongest.

クラスタ内のピークの強度分布を、しばしば「エンベロープ」と呼び、その形状は、多くの寄与ファクタの結果である。極めて大型の分子では、モノアイソトピック質量に対応するピークは、必ずしも強度が最大とは限らない。生体分子の同位体ピーク・パターンに最も大きく寄与するものは13Cである。酸素、窒素および硫黄の重い同位体の存在も、同位体エンベロープに寄与する。炭素は、天然に存在する2つの主要な同位体を有する。すなわち、質量が12.000000であり、天然存在度が98.9%の12Cと、質量が13.003355であり、天然存在度が1.1%の13Cである。ペプチドのサイズに拘わらず、同位体クラスタを分解して得られた第1ピークは、すべての12C含有イオンから生じる。質量が約1,800ダルトン未満のペプチド(約100個の炭素原子を含むペプチドに対応する)では、これが最大強度のピークになる。しかし、質量が約1,800ダルトンよりも大きいペプチド(含まれる炭素原子の数が約100個よりも多いペプチドに対応する)では、この同位体クラスタ中の第1ピークは、最大強度のピークではなくなる。というのは、すべての12C含有イオンが、もはや最も多く存在するものではなく、すなわち、このサンプル中の分子はどれも、平均して少なくとも1つの13C原子を含むことになるからである。このような場合、最大強度のピークを検討し、それを「平均質量」と称するのがより有用となり得る。 The intensity distribution of the peaks in the cluster is often referred to as the “envelope”, and its shape is the result of many contributing factors. For very large molecules, the peak corresponding to the monoisotopic mass does not necessarily have the maximum intensity. 13 C contributes the most to the isotope peak pattern of biomolecules. The presence of heavy isotopes of oxygen, nitrogen and sulfur also contribute to the isotope envelope. Carbon has two major isotopes that occur in nature. That is, the mass is 12.000000, the natural abundance is 12 C of 98.9%, the mass is 13.003355, and the natural abundance is 13 % of 1.1%. Regardless of the size of the peptide, the first peak obtained by resolving the isotopic cluster arises from all 12 C-containing ions. For peptides with a mass less than about 1,800 daltons (corresponding to peptides containing about 100 carbon atoms) this is the peak of maximum intensity. However, for peptides with a mass greater than about 1,800 daltons (corresponding to peptides containing more than about 100 carbon atoms), the first peak in this isotope cluster is not the peak of maximum intensity. This is because all 12 C-containing ions are no longer the most abundant, ie, every molecule in this sample will contain on average at least one 13 C atom. In such cases, it may be more useful to consider the peak of maximum intensity and call it “average mass”.

データの操作
本発明の特徴は、同じサンプルから得られた2つの質量スペクトルを比較することである。これら2つのスペクトルは、透過ウインドウの中心値分だけ互いに異なる。単純な減算によって同じサンプルに対する2つのスペクトル間の差が簡単に得られることはほとんどなく、いくつかのデータ処理操作を実行すべきである。1つの問題は、位相の不整合のために、減算によりマイナスのピークが生じ得ることである。例として、これら2つのスペクトルのいずれにも、123のm/z値に相当するピークがあり得る。第1スペクトル中で、このピークは、122.85で始まり、123.15で終わるが、第2スペクトル中では、これに対応するピークは、122.88で始まり、123.18で終わる。減算が効果的になるように、これらのスペクトルを正確に位置合わせする必要がある。これは、位相の不整合がこれらのスペクトルの全範囲にわたって一定でない場合、難しくなり得る手順である。実際には、この問題は、「部分的な重心処理」によって対処するのが好ましい。ビン幅を選択するが、これは一般に、0.05Thであり、機器の質量分解能によっては0.02Thという小さい値になることがある。これらのスペクトルを、このビン幅の規則的な間隔に分離する。2つのデータ点がこのビン幅内にある場合には、これらの強度を加算する。
Data Manipulation A feature of the present invention is to compare two mass spectra obtained from the same sample. These two spectra differ from each other by the center value of the transmission window. Simple subtraction rarely gives the difference between two spectra for the same sample, and several data processing operations should be performed. One problem is that subtraction can cause negative peaks due to phase mismatch. As an example, any of these two spectra may have a peak corresponding to an m / z value of 123. In the first spectrum, this peak starts at 122.85 and ends at 123.15, while in the second spectrum, the corresponding peak starts at 122.88 and ends at 123.18. These spectra need to be accurately aligned for subtraction to be effective. This is a procedure that can be difficult if the phase mismatch is not constant over the full range of these spectra. In practice, this problem is preferably addressed by “partial centroid processing”. The bin width is selected, which is generally 0.05Th and can be as low as 0.02Th depending on the mass resolution of the instrument. These spectra are separated into regular intervals of this bin width. If two data points are within this bin width, add their intensities.

スペクトル減算における第2の複雑さは、(2つの異なるスペクトルで必然的に生じる)わずかに異なる動作条件下では、両方のスペクトルに共通な1対のピークが、必ずしも同じ強度をもたないことである。そのため、位相が揃っているときでさえ、一方のピークを他方のピークから減算しても基線値が得られず、そのため、小さなプラスまたはマイナスのピークが生じる。これらのスペクトルの倍率を変更して互いにピークの高さを合わせることができるが、必要な倍率は、スペクトル範囲全体にわたって変わり得る。好ましい実施形態では、18O含有ペプチド・サブフラグメントのスペクトルの倍率を変更して、16O/18Oスペクトルと重ね合わせる。これらのスペクトルを、典型的には幅20Thのウインドウに分割する。この幅は他の値でもよく、より大きくても小さくてもともに本発明の方法に適合する。このような各ウインドウにおいて、16O/18Oスペクトル中の最大ピークが決定され、例えば、m/z値mp、強度I1とする。(mp-1,mp+2)の範囲内の18Oスペクトルにおいて最大ピークが決定され、その強度をI2とする。18Oスペクトルの20Th幅のウインドウを、係数I1/I2で倍率変更する。最後に、倍率変更されたスペクトルを倍率変更されていないスペクトルから減算した後で、得られたスペクトルにノイズ・フィルタ処理を適用する。ある閾値、例えば0.05Thよりも幅が小さいピークは除外される。 The second complexity in spectral subtraction is that under slightly different operating conditions (which inevitably occurs in two different spectra), a pair of peaks common to both spectra do not necessarily have the same intensity. is there. Therefore, even when the phases are aligned, subtracting one peak from the other does not yield a baseline value, thus producing a small positive or negative peak. Although the magnification of these spectra can be changed to match the peak heights with each other, the required magnification can vary over the entire spectral range. In a preferred embodiment, the spectral magnification of the 18 O-containing peptide subfragment is altered and superimposed with the 16 O / 18 O spectrum. These spectra are typically divided into 20 Th wide windows. This width may be other values, both larger and smaller, and fits the method of the present invention. In each such window, the maximum peak in the 16 O / 18 O spectrum is determined, for example, m / z value m p and intensity I1. The maximum peak is determined in the 18 O spectrum within the range of (m p -1, m p +2), and its intensity is I2. Change the magnification of the 20 Th width window of the 18 O spectrum by the coefficient I1 / I2. Finally, after subtracting the scaled spectrum from the unscaled spectrum, noise filtering is applied to the resulting spectrum. A peak having a width smaller than a certain threshold, for example, 0.05 Th is excluded.

ペプチドの部分的同位体標識
好ましい実施形態では、本発明のコンピュータ・プログラム製品および方法は、タンパク質のペプチド・フラグメントの部分的同位体標識および示差走査質量分析技術とともに用いられる。ペプチド・フラグメントのC末端の部分的な同位体標識は、当業者に周知の方法によって実現することができる。本発明とともに用いる好ましい実施形態を図3に示す。ペプチドは、とりわけトリプシン、キモトリプシンまたはパパイン、好ましくはトリプシンを用いて、バルク溶媒水中でタンパク質200の酵素消化によって標識する。既知の割合のこのバルク溶媒水は、18Oで標識した水、すなわちH2 18Oである(ステップ202)。
Peptide Partial Isotope Labeling In a preferred embodiment, the computer program products and methods of the present invention are used in conjunction with partial isotope labeling of peptide fragments of proteins and differential scanning mass spectrometry techniques. Partial isotope labeling of the C-terminus of peptide fragments can be achieved by methods well known to those skilled in the art. A preferred embodiment for use with the present invention is shown in FIG. Peptides are labeled by enzymatic digestion of protein 200 in bulk solvent water, especially using trypsin, chymotrypsin or papain, preferably trypsin. A known proportion of this bulk solvent water is water labeled with 18 O, ie H 2 18 O (step 202).

この既知の割合の標識した水は、天然に見られる標識の割合と実質的に異なる。好ましくは、実質的に異なるという意味は、質量分析測定を行う際に、天然存在度の同位体からの寄与を無意味とする量で存在するということであり、かつ、この標識した水から標識を組み込んだペプチドからの信号が容易に区別されるように質量スペクトルの自動分析を容易にする量で存在するということである。本発明の一実施形態では、このタンパク質は、30体積%の18Oで標識した水の存在下で、好ましくは33体積%の18Oで標識した水、より好ましくは40体積%の18Oで標識した水、最も好ましくは50体積%の18Oで標識した水の存在下で消化される。一般に、約30体積%〜約75体積%の既知の割合の18Oで標識した水が、本発明の方法を行うのに適している。約30%〜約75%の18Oで標識した水の体積比は、18Oで標識された水の天然存在度と実質的に異なる。 This known proportion of labeled water is substantially different from the proportion of label found in nature. Preferably, substantially different means that when performing a mass spectrometric measurement, it is present in an amount that makes no contribution from the natural abundance isotopes, and is labeled from this labeled water. Is present in an amount that facilitates automatic analysis of the mass spectrum so that signals from peptides incorporating can be easily distinguished. In one embodiment of the present invention, the protein in the presence of labeled water 30% by volume of 18 O, preferably water were labeled with 33 vol% of the 18 O, more preferably 18 O 40 vol% Digestion is carried out in the presence of labeled water, most preferably water labeled with 50% by volume 18 O. In general, water labeled with a known proportion of 18 O from about 30% to about 75% by volume is suitable for carrying out the method of the invention. The volume ratio of water labeled with about 30% to about 75% 18 O is substantially different from the natural abundance of water labeled with 18 O.

例えば、50%H2 18Oおよび50%H2 16O中でのタンパク質の酵素消化により、多くのペプチド・フラグメントが生成されることが当業者には理解されよう。消化後、これらのペプチド・フラグメントを、例えばゲル電気泳動またはHPLCによって精製し分離する(ステップ204)。生成されたペプチド・フラグメント206を、質量分析法によって分析する。したがって、以下では、ペプチドという用語は、ある種の比較的長いペプチドのフラグメント化によって生成されたペプチドであると理解すれば、ペプチド・フラグメントという用語も含むことになる。 One skilled in the art will appreciate that many peptide fragments are generated, for example, by enzymatic digestion of proteins in 50% H 2 18 O and 50% H 2 16 O. After digestion, these peptide fragments are purified and separated by, for example, gel electrophoresis or HPLC (step 204). The generated peptide fragment 206 is analyzed by mass spectrometry. Therefore, in the following, the term peptide will also include the term peptide fragment if it is understood that it is a peptide produced by fragmentation of certain relatively long peptides.

酵素がタンパク質を消化するとき、酵素はペプチドのアミド結合を開裂し、それによって、遊離アミノ基(N末端)を伴う少なくとも1つのペプチド・フラグメントと、付随したカルボニル基(C末端)を伴う対応するペプチド・フラグメントとが残る。バルク溶媒水からの水分子がC末端基に付着して、カルボン酸基が生成される。既知の割合の18Oで標識した水の存在のために、既知の割合の開裂したペプチド・フラグメントがC末端で18Oをもつことになる。好ましくは、C末端に18Oを伴う開裂したペプチド・フラグメントの割合は、バルク溶媒水中の18Oで標識した水の体積比とほぼ同じである。 When an enzyme digests a protein, the enzyme cleaves the amide bond of the peptide, thereby corresponding to at least one peptide fragment with a free amino group (N-terminus) and an associated carbonyl group (C-terminus) Peptide fragments remain. Water molecules from the bulk solvent water are attached to the C-terminal group, producing carboxylic acid groups. Due to the presence of 18 O-labeled water of known proportions, cleaved peptide fragments of known proportion will have 18 O at the C-terminus. Preferably, the proportion of cleaved peptide fragments with 18 O at the C-terminus is approximately the same as the volume ratio of 18 O labeled water in bulk solvent water.

好ましい実施形態では、18Oで標識した水の既知の割合は、50体積%である。50体積%が18Oで標識した水であるバルク溶媒水中で消化された特定のペプチドでは、C末端に組み込まれた16O原子を伴う質量mのペプチド・フラグメント分子1個につき、C末端に18O原子が組み込まれているのでm+2の質量を有する約1個のペプチド・フラグメント分子があることになる。したがって、C末端を含むペプチド・フラグメントおよびペプチド・フラグメントの各サブフラグメントは、質量スペクトル中で特徴的な1:1 16O/18O同位体分布を有することになり、それらは、2質量単位だけ分離された類似の強度の2つのピークとして区別可能なはずである。比較的低い分解能では、このような1対のピークは、単一の分裂したピークに見えることがある。そのため、このようなサンプルのM/Sにおけるyイオンは、分裂したピーク、または類似の強度のピーク対として見えるはずである。遺憾ながら、大半の場合、ペプチド・フラグメントの質量スペクトル中で、1:1 16O/18O同位体パターンを視覚的に見分けることは不可能である。他のイオンにより、このピーク対に似たものが生じるか、あるいはピークの分布を分割することがあり、類似の質量を有する重なり合ったサブフラグメント・イオンがこのパターンを歪めることがある。例えば、すでに述べたように、十分に長いペプチド配列では、1つの13C置換分を伴う分子のために、m+1におけるピークは、13C置換分がない分子に対応するmにおけるピークと少なくとも同じくらい大きい。このようにしてyイオンのピークを識別することが単純明快であれば、同位体混合物の質量スペクトルを検査することによるペプチドの配列決定は実現可能であろう。 In a preferred embodiment, the known percentage of water labeled with 18 O is 50% by volume. For certain peptides digested in bulk solvent water, where 50% by volume is water labeled with 18 O, for each peptide fragment molecule of mass m with 16 O atoms incorporated at the C-terminus, 18 at the C-terminus. There will be about one peptide fragment molecule with a mass of m + 2 since the O atom is incorporated. Thus, the peptide fragment containing the C-terminus and each sub-fragment of the peptide fragment will have a characteristic 1: 1 16 O / 18 O isotopic distribution in the mass spectrum, which is only 2 mass units It should be distinguishable as two peaks of similar intensity separated. At a relatively low resolution, such a pair of peaks may appear as a single split peak. Therefore, the y ion in the M / S of such a sample should appear as a split peak, or a pair of similar intensity peaks. Unfortunately, in most cases, in the mass spectrum of the peptide fragment, 1: 1 16O / 18 O isotopic pattern visually distinguish things is impossible. Other ions may produce something similar to this peak pair, or split the distribution of peaks, and overlapping subfragment ions with similar masses may distort this pattern. For example, as already mentioned, it is sufficiently long peptide sequences for molecules with one 13 C substituent, peak at m + 1 is the peak of m corresponding to the absence of 13 C substituent molecule at least Just as big. If it is straightforward to identify the y-ion peak in this way, peptide sequencing by examining the mass spectrum of the isotope mixture would be feasible.

本明細書では、H2 16OおよびH2 18O中でのトリプシンによる消化を利用して16Oおよび18OでC末端を標識したペプチドを用いて、本発明の好ましい実施形態を説明してきたが、本発明を、例えば17Oなどの他の同位体で部分的に標識したペプチド・フラグメントとともに用いることもできるし、本発明でペプチド標識技術の別法を用いることもできることは当業者には理解されよう。他の同位体標識では、組み込むべき標識の量が、18Oに好ましい量と異なることがあるが、当業者なら、本発明の方法を実施するために用いるべき、天然存在度と異なる標識の量を決定できることを理解されたい。 Herein, preferred embodiments of the present invention have been described using peptides labeled at the C-terminus with 16 O and 18 O utilizing trypsin digestion in H 2 16 O and H 2 18 O. However, it will be appreciated by those skilled in the art that the present invention can be used with peptide fragments that are partially labeled with other isotopes, such as 17 O, or that the present invention can use alternative methods of peptide labeling techniques. It will be understood. For other isotope labels, the amount of label to be incorporated may differ from the preferred amount for 18 O, but those skilled in the art will recognize that the amount of label different from the natural abundance to be used to practice the method of the invention It should be understood that can be determined.

さらに、原理的には、bイオンに関して類似の標識方式がある。このような実施形態では、好ましくは、N末端に対して標識を行う。N末端における同位体標識は、酵素による消化と同じ時点で容易に実現されるC末端における同位体標識ほど単純明快ではない。15Nベースの標識方式は理想的なものではない。というのは、ペプチドにこのような同位体標識を導入することができる実用的な反応がほとんどないからである。そのため、好ましくは、N末端における標識化は、例えばアセチル化によって人為的に実現する。アセチル化反応により、N末端でCH3-C(=O)-基が導入される(例えば、Pfeifer, T.、Rucknagel, P.、Kuellertz, G.、Schierhorn, A.、「A strategy for rapid and efficient sequencing of Lys-C peptides by matrix-assisted laser desorption/ionisation time-of-flight mass spectrometry post-source decay」、Rapid Commun. Mass Spectrom.、13(5)、362〜9頁、(1999)参照)。試薬の混合物とのアセチル化反応を実行すると、一方は通常の同位体、他方はより重い同位体を含むので、N末端における同位体の混合物を導入することができるはずである。このアセチル化反応は、このような方式で実施される追加の反応なので、通常、同位体標識化は、配列決定用のペプチド・フラグメントを生成するために一般に必要とされる酵素消化中に行われるC末端標識化の場合と同じ効率で実現することができない。さらに、好ましくは、同位体により標識する成分は、CH3-C(=18O)-または13CH3-13C(=O)(いずれも2Daの質量シフトを与える)であり、これらは、容易に購入することができるH2 18Oよりも高価である。 Furthermore, in principle there are similar labeling schemes for b ions. In such embodiments, preferably the N-terminus is labeled. Isotopic labeling at the N-terminus is not as straightforward as isotope labeling at the C-terminus, which is easily realized at the same time as enzymatic digestion. 15 N-based signage is not ideal. This is because there are few practical reactions that can introduce such isotope labels into peptides. Therefore, preferably, labeling at the N-terminus is achieved artificially, for example, by acetylation. The acetylation reaction introduces a CH 3 -C (= O)-group at the N-terminus (e.g. Pfeifer, T., Rucknagel, P., Kuellertz, G., Schierhorn, A., `` A strategy for rapid and efficient sequencing of Lys-C peptides by matrix-assisted laser desorption / ionisation time-of-flight mass spectrometry post-source decay '', Rapid Commun. Mass Spectrom., 13 (5), pages 362-9, (1999). ). When performing an acetylation reaction with a mixture of reagents, it should be possible to introduce a mixture of isotopes at the N-terminus, one containing the normal isotope and the other containing the heavier isotope. Since this acetylation reaction is an additional reaction carried out in this manner, isotope labeling is usually performed during the enzymatic digestion that is generally required to generate peptide fragments for sequencing. It cannot be realized with the same efficiency as in the case of C-terminal labeling. Further, preferably, component labeled with isotopes, CH 3 -C (= 18 O ) - or 13 CH 3 - 13 a C (= O) (both give mass shift of 2Da), these, More expensive than H 2 18 O, which can be easily purchased.

本発明の方法は、タンパク質の酵素消化によって得られるペプチド・フラグメントの配列決定に限定されるものではない。本発明の方法によって、部分的な同位体標識化にかけられた任意のペプチドの配列を決定することができる。   The method of the present invention is not limited to sequencing peptide fragments obtained by enzymatic digestion of proteins. By the method of the present invention, the sequence of any peptide that has been subjected to partial isotope labeling can be determined.

示差走査質量分析法
示差走査質量分析法では、図4に概略を示すように、所与のペプチド・フラグメント400に関する2つのMS/MSスペクトルが得られる。16Oおよび18O含有ペプチドおよびそれらのそれぞれのサブフラグメントの混合物に関して、SP1で示す第1スペクトルが得られる(ステップ402)。18O含有ペプチドおよびそのサブフラグメントだけに関して、SP2で示す第2スペクトルが得られる(ステップ406)。そのため、SP2では、16O含有ペプチドおよびそのサブフラグメントに関する信号が実質的に抑圧される。好ましい実施形態では、同じペプチド・サンプルに対してこれら2つのスペクトルを収集する。第1および第2スペクトルは、任意の順序で得ることができるが、透過ウインドウのセンタリングをし直すステップ(ステップ404)によって分離される。これら2つのスペクトルの計算分析(ステップ408)では、16O含有ペプチド・サブフラグメントのC末端系列に関する実質的にきれいなスペクトルを生成することができる。非C末端サブフラグメントから生じるピークは、(酵素消化による18O標識化に拘わらず)常にそれらの正規の同位体分布を有し、したがって、これら2つのスペクトルが互いに減算されるときに、これらのピークはなくなるはずである。この分析からペプチド配列410を得ることができる。
Differential Scanning Mass Spectroscopy Differential scanning mass spectrometry provides two MS / MS spectra for a given peptide fragment 400 as outlined in FIG. A first spectrum denoted SP1 is obtained for a mixture of 16 O and 18 O containing peptides and their respective subfragments (step 402). For only the 18 O-containing peptide and its subfragments, a second spectrum denoted SP2 is obtained (step 406). Thus, SP2 substantially suppresses signals related to 16 O-containing peptides and subfragments thereof. In a preferred embodiment, these two spectra are collected for the same peptide sample. The first and second spectra can be obtained in any order, but are separated by the step of re-centering the transmission window (step 404). Computational analysis of these two spectra (step 408) can produce a substantially clean spectrum for the C-terminal series of 16 O-containing peptide subfragments. The peaks that result from non-C-terminal subfragments always have their normal isotope distribution (regardless of 18 O labeling by enzymatic digestion), so when these two spectra are subtracted from each other these The peak should disappear. From this analysis, the peptide sequence 410 can be obtained.

通常、ペプチド・サンプルは、例えば、酵素消化から生じる異なるペプチド・フラグメント、あるいは、異なる同位体により置換された形態の特定のペプチドまたはペプチド・フラグメントなど、多くの異なる化学種を含む。好ましい実施形態では、異なる同位体により置換された形態の特定のペプチドまたはペプチド・フラグメントにより、質量分析器内に導入されるサンプルが構成される。したがって、透過ウインドウを適切に調節することによって1つまたは複数の前駆イオンを選別すると、特定の化学種またはその化学種すべての限定されたサブセットの分析を行うことができる。   Peptide samples typically contain many different chemical species, for example, different peptide fragments resulting from enzymatic digestion, or specific peptides or peptide fragments in a form that is replaced by different isotopes. In a preferred embodiment, a particular peptide or peptide fragment in a form substituted by a different isotope constitutes a sample that is introduced into the mass analyzer. Thus, selection of one or more precursor ions by appropriately adjusting the transmission window allows analysis of a specific species or a limited subset of all of its species.

4重極質量フィルタにより前駆イオンの選別を実施するには、必然的に分解能と感度の妥協をすることになる。分解能は、透過ウインドウの幅によって決まる。ウインドウの幅を最も狭くすると最高の分解能が得られるが、分解能を最高にすると、感度も最高にする必要がある。したがって、単一の同位体を選別するように4重極質量フィルタを動作させると、前駆イオンの透過が不十分になり、正確な分析ができなくなる。すなわち、可能な最高の分解能では、用いられる感度レベルで有用なスペクトルを得るのに十分なサンプルが透過しない。ただし、透過ウインドウは均一ではない。すなわち、透過ウインドウ内の値をとるm/z比を有するイオンは、等しい強度で透過しない。質量フィルタの透過ウインドウ全体にわたって強度を変化させる方法を透過曲線と呼ぶ。   The selection of precursor ions with a quadrupole mass filter inevitably compromises resolution and sensitivity. The resolution depends on the width of the transmission window. The narrowest window width provides the highest resolution, but the highest resolution requires the highest sensitivity. Therefore, if the quadrupole mass filter is operated so as to select a single isotope, the precursor ions are insufficiently transmitted and accurate analysis cannot be performed. That is, at the highest possible resolution, not enough sample is transmitted to obtain a useful spectrum at the sensitivity level used. However, the transmission window is not uniform. That is, ions having an m / z ratio that takes a value within the transmission window do not transmit with equal intensity. The method of changing the intensity over the entire transmission window of the mass filter is called a transmission curve.

示差走査質量分析法は、4重極質量フィルタの透過曲線の形状のために、イオンが効果的に排除され、それに伴って感度が低くならないように透過ウインドウを選択することができるという、本出願人らの意外な発見に部分的に基づいている。特定の理論に拘泥することなく、4重極質量フィルタの透過曲線の形状は、選択されたm/zの付近で対称ではなく、(m/zが小さくなる方向に)鋭く立ち上がる側部と、(m/zが大きくなる方向に)延びた比較的長いテールとを有する。この特徴のために、一定幅の透過ウインドウの中心をセンタリングし直すと、すなわち、1つのm/zからわずかに大きいm/zに移動すると、より小さいm/zは透過しない。そのため、このウインドウをより大きい値に移動させることによって、より軽い16O同位体はこの透過ウインドウ内に入らず、18O同位体はそれに入る。この透過ウインドウは、そのm/zの範囲の下側端部で鋭い遮断「境界線(edge)」を有するように振る舞う。 The differential scanning mass spectrometry method of the present application states that due to the shape of the transmission curve of the quadrupole mass filter, the transmission window can be selected so that ions are effectively excluded and the sensitivity is not reduced accordingly. Based in part on people's unexpected discoveries. Without being bound by a particular theory, the shape of the transmission curve of a quadrupole mass filter is not symmetrical around the selected m / z, and the side that rises sharply (in the direction of decreasing m / z), and a relatively long tail (in the direction of increasing m / z). Because of this feature, recentering the center of a constant width transmission window, ie moving from one m / z to a slightly larger m / z, does not transmit smaller m / z. Therefore, by moving this window to a larger value, the lighter 16 O isotope does not enter this transmission window and the 18 O isotope enters it. This transmissive window behaves as having a sharp intercept “edge” at the lower edge of its m / z range.

4重極質量フィルタは、例えば3Daに相当する透過ウインドウを選択できるようにする。透過ウインドウが、モノアイソトピック質量に対応するm/z値でセンタリングされる場合、透過ウインドウは、特定のペプチドの16Oおよび18O含有イオンをともに透過させ、それによって第1スペクトルSP1が得られる。次いで、この透過ウインドウを、その幅を変更せずに、1質量単位だけ大きい値に対応するm/z値の第2位置付近でセンタリングし直し、それによって、信号対雑音比を小さくせずに第2スペクトルSP2が得られる。この透過ウインドウの第2位置では、透過ウインドウにより、18O含有イオンの透過に影響を及ぼさずに、16O含有イオンの透過が効果的に妨げられる。したがって、C末端でより分子量が小さい酸素の同位体を含むペプチドの透過が、第2スペクトルSP2中では本質的に完全に抑圧される。透過ウインドウの第2位置により、モノアイソトピック質量よりも2質量単位分大きい質量を有するイオンを透過させることができる。このような化学種は、16Oを含む化学種の正規の同位体変形物(例えば、2つの13C原子を含むイオン)を含むが、それらの寄与は、酵素消化によって天然の割合でない18Oを取り込んだペプチド・イオンからの寄与によって重要なものでなくなる。代替実施形態では、この透過ウインドウを、第1位置の前に第2位置でセンタリングすることができる。 The quadrupole mass filter makes it possible to select a transmission window corresponding to 3 Da, for example. When the transmission window is centered at an m / z value corresponding to the monoisotopic mass, the transmission window transmits both the 16 O and 18 O containing ions of a particular peptide, thereby obtaining the first spectrum SP1 . This transmission window is then re-centered near the second position of the m / z value corresponding to a value larger by 1 mass unit without changing its width, thereby reducing the signal-to-noise ratio. A second spectrum SP2 is obtained. At the second position of the transmission window, the transmission window effectively prevents the transmission of 16 O-containing ions without affecting the transmission of 18 O-containing ions. Thus, the transmission of peptides containing oxygen isotopes of lower molecular weight at the C-terminus is essentially completely suppressed in the second spectrum SP2. The second position of the transmission window allows ions having a mass 2 mass units greater than the monoisotopic mass to be transmitted. Such species include regular isotope variants of species that include 16 O (e.g., ions that include two 13 C atoms), but their contribution is not a natural proportion of 18 O due to enzymatic digestion. It is no longer important due to the contribution from peptide ions that incorporate In an alternative embodiment, the transmissive window can be centered at the second position before the first position.

図2に示すように、その後、選別された前駆イオンは衝突セル320中に入り、これらの前駆イオンがフラグメント化されて「サブフラグメント」になる。本明細書では、サブフラグメントも「ペプチド・サブフラグメント」または「サブフラグメント・イオン」として同定される。質量分析の第2段階で、前駆イオンから生成されたサブフラグメント・イオンが質量分析器340内に入り、その後、検出器350に至る。   As shown in FIG. 2, the sorted precursor ions then enter the collision cell 320 and these precursor ions are fragmented into “subfragments”. As used herein, subfragments are also identified as “peptide subfragments” or “subfragment ions”. In the second stage of mass analysis, subfragment ions generated from precursor ions enter mass analyzer 340 and then to detector 350.

スペクトル中でm/z値から質量を正確に割り当てるために、一般に、質量分析器を較正することが好ましい。当業者には周知のように、較正は、質量が正確にわかっているサンプルに関するスペクトルを記録する形態をとることができる。   In general, it is preferable to calibrate a mass analyzer in order to accurately assign mass from m / z values in the spectrum. As is well known to those skilled in the art, calibration can take the form of recording a spectrum for a sample whose mass is accurately known.

3Daの透過ウインドウは、得られたスペクトル中で許容できない感度の損失が生じるほど狭くはない。したがって、50%H2 18Oおよび50%H2 16O中で消化された、16Oを含む形態の質量がmであるC末端ペプチドの所与のフラグメントにより、第1スペクトル中でほぼ同じ強度の2つのピークが生じ、第2スペクトル中では1つのピークだけが生じることになる。第1スペクトルSP1中のこれら2つのピークは、mおよびm+2の質量を有するフラグメントに対応し、第2スペクトルSP2中の単一のピークは、m+2の質量を有するフラグメント・イオンに対応する。 The 3Da transmission window is not so narrow that unacceptable loss of sensitivity occurs in the resulting spectrum. Thus, for a given fragment of a C-terminal peptide digested in 50% H 2 18 O and 50% H 2 16 O, the mass of the 16 O containing form is m, approximately the same intensity in the first spectrum Will result in only one peak in the second spectrum. These two peaks in the first spectrum SP1 correspond to fragments with masses m and m + 2, and a single peak in the second spectrum SP2 corresponds to fragment ions with mass m + 2. To do.

質量分解能は、しばしば比m/Δmとして表される。ただし、mおよびm+Δmは、質量スペクトル中で分解されてほぼ等しい強度の2つの隣接するピークの質量である。示差走査技術では、質量分析器340および検出器350が、分子量がせいぜい約1または2ダルトンだけ異なるサブフラグメント・イオンについての信号を分解することができる必要がある。具体的には、C末端で16O原子を有する質量mのペプチド・サブフラグメントと、C末端の18O原子のために、質量m+2を有する同じペプチド・サブフラグメントはどちらも同じ電荷を有し、それら2つのサブフラグメントから生じるピークがスペクトル中で分解可能でなければならない。ペプチドが大であるほど、サブフラグメント・イオンの質量は大きくなる。したがって、mおよびm+2のピークを分解可能にするためには、分析器の分解能は、比較的大型のペプチドに対してはより高くなければならない。 Mass resolution is often expressed as the ratio m / Δm. Where m and m + Δm are the masses of two adjacent peaks resolved in the mass spectrum and of approximately equal intensity. Differential scanning techniques require that mass analyzer 340 and detector 350 be able to resolve signals for subfragment ions that differ in molecular weight by no more than about 1 or 2 daltons. Specifically, a mass m peptide subfragment with a 16 O atom at the C-terminus and the same peptide subfragment with a mass m + 2 due to the C-terminal 18 O atom both have the same charge. However, the peaks arising from these two subfragments must be resolvable in the spectrum. The larger the peptide, the greater the mass of subfragment ions. Therefore, in order to be able to resolve the m and m + 2 peaks, the resolution of the analyzer must be higher for relatively large peptides.

エレクトロスプレー・イオン化法によって生成された前駆イオンは、しばしば複数の電荷を有し、その結果、それらのm/z値はそれらの質量の何分の一かになる。2価のサブフラグメント・イオンは、m/z値においてはその質量の半分に見えるが、1m/z単位だけ分離された質量mおよびm+2のサブフラグメント・イオンについてのピークを分解することが必要になろう。   Precursor ions generated by electrospray ionization often have multiple charges, so that their m / z values are a fraction of their mass. A divalent subfragment ion appears to be half its mass at m / z values, but can resolve peaks for mass m and m + 2 subfragment ions separated by 1 m / z units. I will need it.

データを収集するのに用いる機器の分解能は、C末端イオンを正確に同定するのに影響を及ぼすことになることが当業者には理解されよう。本発明の方法は、3連4重極などの低分解能の機械で実施することができるが、高分解能の機械で実施することが好ましい。   One skilled in the art will appreciate that the resolution of the instrument used to collect the data will affect the accurate identification of the C-terminal ion. The method of the present invention can be performed on a low-resolution machine such as a triple quadrupole, but is preferably performed on a high-resolution machine.

16O/18Oスペクトル中のmおよびm+2の2重の特徴的な見かけによって、かつ、18Oスペクトル中の対応する16Oピークの抑圧によって、すべてのC末端ペプチド・サブフラグメント・イオンを同定することができる場合、原理上、C末端系列中の連続したピーク間のm/zの差に注目することによって、このスペクトルからペプチドまたはタンパク質の配列216を「読み取る」ことができる。互いに同じ質量を有するロイシンおよびイソロイシンを除くすべてのアミノ酸は、それらの特徴的な質量、したがってm/z値によって互いに区別可能である。 All the C-terminal peptide subfragment ions are identified by the dual characteristic appearance of m and m + 2 in the 16 O / 18 O spectrum and by suppression of the corresponding 16 O peak in the 18 O spectrum. If identifiable, in principle, the peptide or protein sequence 216 can be “read” from this spectrum by noting the m / z difference between successive peaks in the C-terminal series. All amino acids except leucine and isoleucine, which have the same mass as each other, are distinguishable from each other by their characteristic mass and hence m / z value.

ただし、実際には、示差走査質量分析法を用いたペプチドの配列決定は、スペクトルの単純な比較よりも難しい。通常、C末端ペプチド・サブフラグメント・イオンから生じるピークの同定は、特に比較的長いペプチドでは、視覚的な検査によって実現することができない。本発明のコンピュータ・プログラム製品および方法により、この難点が軽減され、示差走査技術を利用して取得した質量スペクトルの高速で正確な解釈を行うことができ、それによって、以前は未知であったタンパク質のアミノ酸配列が高速かつ正確に決定される。   However, in practice, peptide sequencing using differential scanning mass spectrometry is more difficult than simple spectral comparisons. Usually, identification of peaks arising from C-terminal peptide subfragment ions cannot be achieved by visual inspection, especially for relatively long peptides. The computer program product and method of the present invention alleviates this difficulty and allows for fast and accurate interpretation of mass spectra acquired using differential scanning techniques, thereby enabling previously unknown proteins. The amino acid sequence is determined quickly and accurately.

C末端ペプチド・サブフラグメント・イオンの同定用アルゴリズム
本発明のアルゴリズムが対処する主要な問題は、ペプチドの質量スペクトル中のyイオンの同定である。その全体的な原理は、このペプチドに関するフィルタ処理されたスペクトルSSを計算することである。図5を参照されたい。mp16O含有ペプチドのyイオンに対応する場合、このフィルタ処理されたスペクトルが、m/z値mpでピークを含むシミュレーションされたスペクトルであると効果的である。フィルタ処理されたスペクトル中のピークの高さは、測定されたスペクトル中の強度に類似するものであるが、このピークがyイオンに対応する尤度を示すファクタの累積的な乗算によって計算される。フィルタ処理されたスペクトルの利点は、このスペクトルが視覚的に満足できるものであり、解釈が簡単なことである。
Algorithm for identification of C-terminal peptide subfragment ions The main problem addressed by the algorithm of the present invention is the identification of y ions in the mass spectrum of peptides. Its overall principle is to calculate the filtered spectrum SS for this peptide. See FIG. If m p corresponds to the y ion of a 16 O-containing peptide, it is advantageous if this filtered spectrum is a simulated spectrum containing a peak with an m / z value m p . The height of the peak in the filtered spectrum is similar to the intensity in the measured spectrum, but this peak is calculated by cumulative multiplication of a factor indicating the likelihood corresponding to the y ion . The advantage of a filtered spectrum is that it is visually satisfactory and easy to interpret.

図5を参照すると、フィルタ処理されたスペクトルSSの生成に先立つステップは、以下のようになる。スペクトルを生じさせるペプチドの電荷数を確認することが好ましい。開始点は、16O/18Oの質量スペクトルSP1 500および18OのスペクトルSP2 502である。これらから、サブフラグメント・イオンの電荷数を推定する(ステップ504)。その後、各サブフラグメントごとに、16O/18Oの質量スペクトル中のピークを分析して、そのピークが18Oで標識したイオンに対応するかどうかを調べ(ステップ506)、各ピークごとにスコア値S1 508を推定する。18Oの質量スペクトル中のピークも分析して、これらのピークが、18Oの質量スペクトル中では16O/18Oの質量スペクトルと比較して存在が抑圧されている16O含有ペプチド・サブフラグメントを示しているかどうか調べ、それによって、スコア値S2 512が生成される。本発明の範囲を逸脱することなく、ステップ506および510の順序を逆にすることができることを理解されたい。最後に、スコア値S1およびS2を合成してフィルタ処理されたスペクトルSS514を生成する。次に、前記各ステップをより詳細に説明する。 Referring to FIG. 5, the steps prior to generating the filtered spectrum SS are as follows. It is preferable to confirm the number of charges of the peptide that gives rise to the spectrum. The starting points are the 16 O / 18 O mass spectrum SP1 500 and the 18 O spectrum SP2 502. From these, the number of charges of subfragment ions is estimated (step 504). Then, for each subfragment, analyze the peaks in the 16 O / 18 O mass spectrum to see if the peaks correspond to ions labeled with 18 O (step 506) and score for each peak. Estimate the value S1 508. 18 O peak in the mass spectrum of be analyzed, these peaks, 18 O 16 O / 18 O Mass spectrum 16 O-containing peptide subfragments present is suppressed as compared to in the mass spectrum of , Thereby generating a score value S2 512. It should be understood that the order of steps 506 and 510 can be reversed without departing from the scope of the present invention. Finally, the score values S1 and S2 are combined to generate a filtered spectrum SS514. Next, each step will be described in more detail.

このアルゴリズムは、16O/18OのスペクトルSP1および18OだけのスペクトルSP2に関するデータを利用する。このアルゴリズムの主要なタスクは、16O/18Oスペクトル中の各ピークに、そのピークが16O含有ペプチド・サブフラグメントのyイオンである確率値を割り当てるスコア・データセットSDを生成することである。次いで、式(1)に従って各mp値ごとに、フィルタ処理されたスペクトルSSを計算する。 This algorithm utilizes data on the 16 O / 18 O spectrum SP1 and the 18 O only spectrum SP2. The main task of this algorithm is to generate a score data set SD that assigns each peak in the 16 O / 18 O spectrum a probability value that the peak is the y ion of a 16 O-containing peptide subfragment. . Then, for each m p values in accordance with equation (1) to calculate the filtered spectrum SS.

SS(mp)=SD(mp)*SP1(mp) (1)
このアルゴリズムの最終結果は、16Oのyイオンについて、他のすべてのイオンは除外して計算されたm/z値を含むフィルタ処理されたスペクトルを生成することである。本発明の方法は、測定スペクトルのある部分またはある範囲だけに対応するフィルタ処理されたスペクトルの計算に等しく適用可能であることを理解されたい。本発明の方法は、透過ウインドウのいずれかの位置に対して測定されたスペクトル全体を含むフィルタ処理されたスペクトル、スコア・データ・セットまたはスコア値の計算に限定されると解釈すべきではない。
SS (m p ) = SD (m p ) * SP1 (m p ) (1)
The net result of this algorithm is to generate a filtered spectrum that includes the calculated m / z value for 16 O y ions, excluding all other ions. It should be understood that the method of the present invention is equally applicable to the calculation of filtered spectra that correspond only to a portion or range of the measured spectrum. The method of the present invention should not be construed as limited to the computation of filtered spectra, score data sets or score values that include the entire spectrum measured for any position in the transmission window.

示差走査質量分析法とともに、本発明のコンピュータ・プログラム製品および方法を用いて、スペクトル中のyイオンの2つの本質的な特徴を認識することによって、yイオンの同定が容易になる。第1に、yイオンは、16O/18OスペクトルSP1中で16O/18O同位体分布を有する。第2に、yイオンの16Oのピークは、18OスペクトルSP2中で抑圧される。これら2つの特徴を用いて、16O/18Oスペクトル中の各ピークごとに全体的なスコア値を計算し、その値がスコア・データセットSDの一部を形成する。 In conjunction with differential scanning mass spectrometry, the computer program products and methods of the present invention are used to facilitate identification of y ions by recognizing two essential features of y ions in the spectrum. First, the y ion has a 16 O / 18 O isotope distribution in the 16 O / 18 O spectrum SP1. Second, the 16 O peak of the y ion is suppressed in the 18 O spectrum SP2. Using these two features, an overall score value is calculated for each peak in the 16 O / 18 O spectrum, and that value forms part of the score data set SD.

第1ステップは、位置mpでピークを生じさせるフラグメントの質量値mを推定することである。これを実現する方法は、Uttenweiler-Joseph, S.、Neubauer, G.、Christoforidis, S.、Zerial, M.、Wilm, M.、「Automated de novo sequencing of proteins using the differential scanning technique」、Proteomics、1(5)、668〜682頁、(2001)から得られる。これを参照により本明細書に組み込む。用いられるイオン化法のタイプによっては、mpでピークを生じさせるサブフラグメント・イオンは多重に帯電し得る。一般に、エレクトロスプレー・イオン化法では多価イオンが生じる。電荷数を推定する方法は、当業者には周知である。多価イオンを識別する最も単純明快な方法は、隣接するアイソタイプに関連するピークの間隔を調べることである。例えば、このようなピークが0.5m/z単位離れている場合、これらは2価イオンである。これらのピークが0.33または0.25m/z単位離れている場合、これらはそれぞれ3価イオンまたは4価イオンである。多価イオンの質量スペクトルを解釈するより高度な方法には、Zhouの米国特許第5,072,115号に記載されているものが含まれる。これを参照により本明細書に組み込む。 The first step is to estimate the mass value m of fragments produces a peak at the position m p. To achieve this, Uttenweiler-Joseph, S., Neubauer, G., Christoforidis, S., Zerial, M., Wilm, M., `` Automated de novo sequencing of proteins using the differential scanning technique '', Proteomics, 1 (5), 668-682, (2001). This is incorporated herein by reference. Depending on the type of ionization method used, the subfragment ions that give rise to a peak at m p can be multiply charged. In general, the electrospray ionization method generates multivalent ions. Methods for estimating the number of charges are well known to those skilled in the art. The simplest and clearest way to identify multiply charged ions is to examine the spacing of peaks associated with adjacent isotypes. For example, if such peaks are separated by 0.5 m / z units, they are divalent ions. When these peaks are separated by 0.33 or 0.25 m / z units, they are trivalent ions or tetravalent ions, respectively. More sophisticated methods for interpreting the mass spectra of multiply charged ions include those described in Zhou US Pat. No. 5,072,115. This is incorporated herein by reference.

mpにおけるピークについての全体的なスコア値SD(mp)により、このピークが、部分的に標識したペプチド・サブフラグメントから生じる二重線の第1ピークである全体的が確率を求められる。スコア値SD(mp)は、式(2)の2つのファクタの積から計算する。 The overall score value SD (m p ) for the peak at m p gives the overall probability that this peak is the first peak of a doublet resulting from a partially labeled peptide subfragment. The score value SD (m p ) is calculated from the product of the two factors in Equation (2).

SD(mp)=S1(mp)*S2(mp) (2)
S1(mp)は、16O/18Oスペクトル中のmpにおけるピークの周りのエンベロープ中のピークの分布および強度を、天然の同位体存在度を用いて同じ質量のペプチドについて予想したピークの分布および強度と比較することによって計算された確率である第1スコア値である。したがって、S1(mp)は、mpにおけるピークが、50%H2 18Oおよび50%H2 16O中で、あるいは、別の実施形態においては、なんらかの他の割合のH2 18Oを含む水混合物中での酵素消化から得られた16O/18O比のフラグメントから生じる確率を示す。
SD (m p ) = S1 (m p ) * S2 (m p ) (2)
S1 (m p ) is the peak distribution in the envelope around the peak at m p in the 16 O / 18 O spectrum and the intensity of the peak predicted for peptides of the same mass using natural isotopic abundance. The first score value, which is the probability calculated by comparing with the distribution and intensity. Thus, S1 (m p ) has a peak at m p in 50% H 2 18 O and 50% H 2 16 O, or in another embodiment, some other proportion of H 2 18 O. The probabilities arising from fragments of the 16 O / 18 O ratio obtained from enzymatic digestion in a water mixture containing are shown.

S2(mp)は、16O/18OスペクトルSP1中のmpにおけるピークの強度を、18OスペクトルSP2中のmpにおけるピークの強度と比較し、第2スペクトル中でのこのピークの抑圧の度合いを求めることによって計算された確率である第2スコア値である。したがって、S2(mp)は、mpにおけるピークが、ペプチドの16O含有yイオンに対応する確率を示す。 S2 (m p ) compares the intensity of the peak at m p in the 16 O / 18 O spectrum SP1 with the intensity of the peak at m p in the 18 O spectrum SP2, and suppresses this peak in the second spectrum The second score value is the probability calculated by obtaining the degree of. S2 (m p ) thus indicates the probability that the peak at m p corresponds to the 16 O-containing y ion of the peptide.

予想された同位体分布および観察された同位体分布に基づく第1スコア値S1の計算
本発明の方法における第1ステップでは、位置mpにおける特定のピークが、スペクトルSP1中で16O/18O同位体クラスタの第1同位体から生じる第1確率を計算する。この第1確率は第1スコア値として知られている。モノアイソトピック質量がm0であるペプチドでは、観察された同位体エンベロープは、質量が約m0+1、m0+2、m0+3などのイオンからの寄与を含む。これらのモノアイソトピック化学種がmpで強度I0のピークを生じさせる場合、このエンベロープは、それぞれ強度I1の(mp+1)、強度I2の(mp+2)、強度I3の(mp+3)などで示す連続したピークを含むことになる。このクラスタに寄与するこれらのイオンが単一の電荷を有する場合、このエンベロープ中の連続したピークは、約1m/z単位だけ分離される。通常検討される最大質量は、m0の値に依存する。というのは、比較的大のペプチドは、比較的多数の重い同位体を組み込むと予想され、したがって、この同位体エンベロープ中でより大きなピークを有することになるからである。この同位体エンベロープのピーク強度の観察値I0、I1、I2などは、通常、天然の同位体存在度によって決まる。炭素、窒素、酸素および硫黄の天然の同位体分布(表1)は、ペプチド質量スペクトルの解釈を複雑にした要因であったが、本発明ではそれをいくらか有利に用いることができる。天然存在度は既知なので、この存在度が、例えば、50%H2 18Oおよび50%H2 16Oの混合物中の酵素消化から生じる人為的な16O/18O比によって乱れる時点を識別し、この存在度が乱れる程度を定量化するのは単純明快である。
Calculation of the first score value S1 based on the expected and observed isotope distribution In the first step in the method of the invention, a specific peak at position m p is 16 O / 18 O in the spectrum SP1. Calculate the first probability arising from the first isotope of the isotope cluster. This first probability is known as the first score value. For peptides with a monoisotopic mass of m 0 , the observed isotope envelope includes contributions from ions with masses of about m 0 +1, m 0 +2, m 0 +3, etc. If these monoisotopic species cause peak intensity I 0 at m p, this envelope, each intensity I 1 (m p +1), the intensity I 2 (m p +2), intensity I It will include a continuous peak indicated by such as 3 (m p +3). If these ions that contribute to the cluster have a single charge, the continuous peaks in the envelope are separated by about 1 m / z units. The maximum mass that is usually considered depends on the value of m 0 . This is because relatively large peptides are expected to incorporate a relatively large number of heavy isotopes and thus will have larger peaks in this isotope envelope. The observed values I 0 , I 1 , I 2, etc. of the peak intensity of this isotope envelope are usually determined by the natural abundance. The natural isotopic distribution of carbon, nitrogen, oxygen and sulfur (Table 1) was a factor that complicated the interpretation of peptide mass spectra, but it can be used somewhat advantageously in the present invention. Since the natural abundance is known, identify when this abundance is disturbed by an artificial 16 O / 18 O ratio resulting from, for example, enzymatic digestion in a mixture of 50% H 2 18 O and 50% H 2 16 O. Quantifying the degree to which this abundance is disturbed is straightforward.

ペプチド・サブフラグメントの同位体エンベロープの理論的な見かけは、存在度で重みづけした各元素の同位体の合計を計算する多項式を解くことによって正確に分子イオン・クラスタにモデル化することができる(Yergey、(1983)、J. Mass Spectrom. Ion Process、52、337〜349頁)。このアルゴリズムが用いる式の例には以下の式が含まれるが、これらに限定されるものではない。

Figure 2005510732
Figure 2005510732
The theoretical appearance of the peptide subfragment isotope envelope can be accurately modeled into a molecular ion cluster by solving a polynomial that calculates the total isotope of each element weighted by abundance ( Yergey, (1983), J. Mass Spectrom. Ion Process, 52, 337-349). Examples of equations used by this algorithm include, but are not limited to:
Figure 2005510732
Figure 2005510732

これらの式では、質量Mpepのフラグメントは、その同位体クラスタ中に質量Mpep+nのフラグメントを有する。このエンベロープ中のフラグメントMpep+nの強度Inは、項δnを加えることによって計算することができる。すべてのInの初期値は、I0を除きゼロである。I0は1に設定されるので計算は行われない。I0は、この分子のモノアイソトピック化学種の強度である。Inは、第1番目以降のn番目同位体の強度(n+1番目の同位体を合わせた)である。 In these equations, a fragment of mass M pep has a fragment of mass M pep + n in its isotopic cluster. Intensity I n fragment M pep + n in the envelope can be calculated by adding the term [delta] n. The initial value of all I n is zero except for I 0. Since I 0 is set to 1, no calculation is performed. I 0 is the intensity of the monoisotopic species of this molecule. I n is the intensity of the first and subsequent nth isotopes (including the (n + 1) th isotope).

これらの式の適用例を示すために、最初のもの以降の第3同位体を考える。上記で論じたように、どの同位体質量にも2つ以上の寄与があり得る。他の元素からの同位体置換基を有する16O含有ペプチドからの寄与があり、そのため、δ3を考慮して寄与を計算する。ただし、18O含有ペプチドからの寄与もある。18Oのペプチドは2Daだけ重いので、18Oで標識したペプチドでは最初のもの以降の第1同位体も同じ質量である。したがって、18Oで標識したペプチドのピークI3への寄与に関しては、δ1を考慮してその寄与を計算しなければならない。この場合、したがって、I3はδ1およびδ3だけ増加する。 To illustrate the application of these equations, consider the first and subsequent third isotopes. As discussed above, there can be more than one contribution to any isotope mass. There are contributions from 16 O-containing peptides with isotope substituents from other elements, so the contribution is calculated taking into account δ 3 . However, there is also a contribution from 18 O-containing peptides. Since the peptide of 18 O is only 2 Da heavy, the first isotope after the first has the same mass in the peptide labeled with 18 O. Therefore, regarding the contribution of the peptide labeled with 18 O to the peak I 3 , the contribution must be calculated considering δ 1 . In this case, therefore, I 3 increases by δ 1 and δ 3 .

これらの式の例は、フラグメントの質量だけによって決まり、元素のタイプ、化学組成または電荷数に依存しない。したがって、このような式を適用する前に、フラグメントの電荷数を推定しなければならず、それによって、その質量を求めることができる。これらの式は、現在知られているペプチド配列の中の平均存在度から得られた近似式である。これらの式を導出するのに適したペプチド配列の最新の編纂物の例には、例えば、EBI(欧州バイオインフォマティクス研究所)によって常に更新されている「非冗長」データベースが含まれる。例えば、http://www.ebi.ac.ukを参照されたい。これは、ftp://ftp.embl-heidelberg.de/pub/databases/nrdbからも利用可能である。NCB1によって編纂された別の類似のデータベースは、http://ncbi.nlm.nih.gov/で得られる。   Examples of these formulas depend solely on the mass of the fragment and do not depend on element type, chemical composition or charge number. Therefore, before applying such an equation, the number of charges on the fragment must be estimated, whereby its mass can be determined. These equations are approximate equations obtained from the average abundance in currently known peptide sequences. Examples of the latest compilation of peptide sequences suitable for deriving these equations include, for example, “non-redundant” databases that are constantly updated by the EBI (European Bioinformatics Institute). For example, see http://www.ebi.ac.uk. This is also available from ftp://ftp.embl-heidelberg.de/pub/databases/nrdb. Another similar database compiled by NCB1 is available at http://ncbi.nlm.nih.gov/.

ペプチド・サブフラグメント・イオンが重くなるほど、エンベロープ中でより多くのピークが大きな強度を有することに留意されたい。モノアイソトピック質量が1100であるペプチド・サブフラグメントのエンベロープは、例えば、強度が第1式によって計算され、質量が1101のフラグメントと、強度が第2式によって計算され、質量が1102のフラグメントとを有することがわかる。質量1100のペプチド・サブフラグメントでは、1103以降の寄与は無視できるほど小さい。   Note that the heavier the peptide subfragment ions, the greater the intensity of the more peaks in the envelope. The envelope of a peptide subfragment with a monoisotopic mass of 1100 is, for example, the fragment whose intensity is calculated by the first equation and the mass is 1101, and the fragment whose intensity is calculated by the second equation and whose mass is 1102. You can see that For peptide subfragments with a mass of 1100, the contribution after 1103 is negligibly small.

示差走査技術では、yイオンの同位体エンベロープは、18Oによる部分的な標識化からの特徴的な同位体分布によって乱れる。例えば、mpにおけるピークが、yイオンの16O/18O同位体クラスタ中の第1ピークである場合、ピーク(mp+2)、(mp+3)などの強度の観察値は、天然に存在する酸素含有量のサブフラグメントの強度と異なるものになる。16O/18O同位体クラスタおよび18O含有イオンの同位体エンベロープの特徴的な二重線は、16O含有イオンの同位体エンベロープ上に重ねられることになる。対照的に、非yイオンの同位体エンベロープは、単に予想された天然に存在する形態に従うことになる。その結果、yイオンから生じるペプチド質量スペクトル中でピークを視覚的に割り当てることは極めて難しいが、これらのピークの同位体エンベロープが、天然に存在する同位体分布に関して予想されたエンベロープと大きく異なることを計算で利用することができる。 In the differential scanning technique, the isotope envelope of the y ion is disturbed by the characteristic isotope distribution from partial labeling with 18 O. For example, the peak at m p is the case of the first peak in 16 O / 18 O isotopic clusters of y ion peak (m p +2), observations of strength such as (m p +3), the It differs from the strength of naturally occurring subfragments of oxygen content. The characteristic double line of the 16 O / 18 O isotope cluster and the isotope envelope of the 18 O containing ion will be superimposed on the isotope envelope of the 16 O containing ion. In contrast, non-y ion isotopic envelopes simply follow the expected naturally occurring form. As a result, it is extremely difficult to visually assign peaks in the peptide mass spectrum resulting from y ions, but the isotopic envelope of these peaks is very different from the expected envelope for the naturally occurring isotopic distribution. Can be used in calculations.

天然の同位体存在度に基づく16O含有yイオンについての理論的に予想されたピーク強度を、上記で示したタイプの多項式を用いて計算することができ、それらをI1 *、I2 *、I3 *などで示す。強度の観察値および計算値をそれぞれI0およびI0 *に対して正規化し、それによって定量的な比較を行うことができる。スコア値S1は、式3に示すように、同位体エンベロープ中の各ピークごとの強度の観察値と計算値の差の関数である。

Figure 2005510732
The theoretically predicted peak intensities for 16 O-containing y ions based on natural isotope abundances can be calculated using polynomials of the type shown above, and they are calculated as I 1 * , I 2 * , I 3 * etc. The observed and calculated intensity values can be normalized to I 0 and I 0 * , respectively, so that a quantitative comparison can be made. The score value S1 is a function of the difference between the observed value of the intensity for each peak in the isotope envelope and the calculated value, as shown in Equation 3.
Figure 2005510732

ただし、

Figure 2005510732
However,
Figure 2005510732

強度の差の絶対値Δnは、ピーク(mp+n)についての強度の観察値であるInと、mpにおけるピークが16O含有yイオンから生じることを仮定してピーク(mp+n)について計算された強度であるIn *とから計算される。式(3)中のS1n(mp)は、(mp+n)におけるピークの強度から、mpにおけるピークのスコア値S1への寄与である。普遍定数e(〜=2.71828...)は自然対数の底である。 The absolute value delta n of the difference in intensity, the peak (m p + n) is an observation value of the intensity of I n and a peak on the assumption that the peak occurs from 16 O-containing y ions in m p (m p Calculated from I n * , the intensity calculated for + n). S1 n (m p ) in the formula (3) is a contribution from the peak intensity at (m p + n) to the peak score value S 1 at m p . The universal constant e (~ = 2.71828 ...) is the base of the natural logarithm.

式(3)には2つのパラメータがあり、それらは下記の効果を有する。λは「強さ」である。すなわち、スコア値に与えられる重みであり、この判定基準がどのくらい重要になるかに従って調整可能である。σは「鋭さ」のパラメータであり、Δnの増加に応じてどのくらい速くS1nがゼロに落ちるかに影響を及ぼす。式(3)の形を図6(a)に示す。ただし、λ=5、σ=0.25である。Δはx軸上の値であり、S1はy軸上の値である。 Equation (3) has two parameters, which have the following effects. λ is “strength”. That is, the weight given to the score value, which can be adjusted according to how important this criterion is. σ is a parameter of the "sharpness", how fast S1 n in accordance with an increase of delta n affects or drops to zero. The form of equation (3) is shown in FIG. 6 (a). However, λ = 5 and σ = 0.25. Δ is a value on the x-axis, and S1 is a value on the y-axis.

鋭さのパラメータσにより、どのくらい速くこれらのスコア値が0.001*λに落ちるかが決まる。好ましくは、σは固定するのではなく、データ自体から計算する。スコア関数の目的は、式(3)の好ましい形に従って、18O同位体を有するピークにスコア強さλを掛け、この同位体をもたないピークに極めて小さな値である0.001*λを掛けることである。ほとんどのピークは18O同位体をもたないので(C末端フラグメントしかそれをもたない)、平均ピークには、0.001*λに近い極めて小さな値を掛けるべきである。そのため、σは、平均ピークに約0.003*λが掛けられるように選択するのが好ましい。すなわち、数学的には以下のようになる。

Figure 2005510732
The sharpness parameter σ determines how fast these score values fall to 0.001 * λ. Preferably, σ is not fixed but is calculated from the data itself. The purpose of the score function is to multiply the peak with 18 O isotope by the score strength λ and multiply the peak without this isotope by a very small value of 0.001 * λ according to the preferred form of equation (3). It is. Since most peaks have no 18 O isotope (only the C-terminal fragment has it), the average peak should be multiplied by a very small value close to 0.001 * λ. Therefore, σ is preferably selected so that the average peak is multiplied by about 0.003 * λ. That is, mathematically, it is as follows.
Figure 2005510732

ただし、Δavgは、このスペクトルから決定されたすべての値の平均である。 Where Δ avg is the average of all values determined from this spectrum.

本発明の好ましい実施形態では、λは値10.0に固定する。σおよびλの値は、用いられる機械およびデータの質の影響を受ける。当業者なら、用いられるサンプルおよび機械に応じて、ここで与えられる値と異なるλおよびσの値を選択して、よりよい結果を得ることができよう。   In the preferred embodiment of the invention, λ is fixed at a value of 10.0. The values of σ and λ are affected by the machine used and the quality of the data. A person skilled in the art will be able to select better values for λ and σ than those given here, depending on the sample and machine used.

式(3)中の指数項により、強度の観察値および計算値の差(Δn)が大きいと、それが自乗されたときに、S1nの値が確実に小さくなる。スペクトルはともにI0=I0 *=1に対して正規化されるので、

Figure 2005510732
If the difference (Δ n ) between the observed intensity value and the calculated value is large due to the exponent term in Equation (3), the value of S1 n is reliably reduced when it is squared. Both spectra are normalized to I 0 = I 0 * = 1, so
Figure 2005510732

となることに留意されたい。別の実施形態としては、式(3)中のこれら2つの項の相対的な寄与を、これらの合計が1.0に近いままに維持しながら、これらの係数の値を別々に変更することによって調整することができる。 Note that In another embodiment, the relative contributions of these two terms in Equation (3) are adjusted by changing the values of these coefficients separately while keeping their sum close to 1.0. can do.

本発明の原理から逸脱することなく、式(3)の他の形が可能である。   Other forms of equation (3) are possible without departing from the principles of the present invention.

サンプル中のフラグメントの実際の同位体存在度も完全には求めることができないことに留意されたい。これについての2つの大きな理由は、所与のピークは、少数のイオンからの信号しか含まず、そのため、統計的にすべての同位体の置換基の存在度を完全に実現することができないことと、所与のピークは、しばしば他のイオンからの信号によって成長し、それによって予測できない歪みが生じることである。   Note that the actual isotopic abundance of the fragments in the sample cannot also be determined completely. Two major reasons for this are that a given peak only contains signals from a small number of ions, so statistically the abundance of all isotopic substituents cannot be fully realized. , A given peak is often grown by signals from other ions, which results in unpredictable distortion.

スペクトル中のクラスタごとに、ペプチド・サブフラグメント・イオンの質量に応じて、寄与S1n(mp)がピーク(mp+n)に対して計算され、それによって、同位体エンベロープが得られる。標識されていないフラグメントの場合、300<m0<1000では(mp+1)だけを考慮し、1000<m0<1800ではピーク(mp+1)および(mp+2)を考慮する。潜在的に18Oで標識したフラグメントを考慮すると、質量m0+2の同位体も考慮する。そのため、300<Mp<1000では、ピーク(mp+1)、(mp+2)および(mp+3)が含まれる。スペクトル中のあるサブセットのクラスタ全体にわたってS1を計算することによって、本発明の方法を実施することもできることを理解されたい。 For each cluster in the spectrum, depending on the mass of the peptide subfragment ion, the contribution S1 n (m p ) is calculated for the peak (m p + n), thereby obtaining an isotopic envelope. For unlabeled fragments, consider only (m p +1) if 300 <m 0 <1000, consider peaks (m p +1) and (m p +2) if 1000 <m 0 <1800 . Considering a potentially 18 O labeled fragment, the mass m 0 +2 isotope is also considered. Therefore, when 300 <M p <1000, peaks (m p +1), (m p +2) and (m p +3) are included. It should be understood that the method of the present invention can also be implemented by calculating S1 across a subset of clusters in the spectrum.

このように、第1スコア値S1(mp)は、mpにおける所与のピークの周りの同位体エンベロープ中のピーク強度の観察値と、mpにおけるピークが、SP1中の16O/18O同位体クラスタ内の第1同位体であると仮定してこれらのピークについて計算した強度との類似性の尺度である。このスコア値は、yイオンの標識化の度合いだけでなく、同位体の天然存在度も考慮に入れる。従来は、こうすると、大のペプチドの質量スペクトルを複雑にしていた。強度の観察値と計算値の小さな差が、大きなスコア値の形で反映される。スコア値が大きいと、mpにおけるピークが、16O含有yイオン、すなわちモノアイソトピック化学種のためである確率が大きいことを示す。 Thus, the first score value S1 (m p) is the observed value of the peak intensity in the isotope envelope around the given peak at m p, a peak at m p is 16 in SP1 O / 18 It is a measure of similarity to the intensity calculated for these peaks, assuming it is the first isotope within the O isotope cluster. This score value takes into account not only the degree of y ion labeling, but also the natural abundance of the isotope. In the past, this has complicated the mass spectrum of large peptides. A small difference between the observed intensity value and the calculated value is reflected in the form of a large score value. A large score value, indicating peak at m p is, 16 O content y ions, i.e. the probability is for monoisotopic species is large.

最後のステップで、好ましくは、ピークmpごとにS1関数を計算した後で、S1関数全体をその最大値で割ることによって、S1の値を1に正規化する。このステップにより、これらのスコア値が確率に効果的に変換される。 In the last step, preferably, after calculating the S1 function for each peak m p , the value of S1 is normalized to 1 by dividing the entire S1 function by its maximum value. This step effectively converts these score values into probabilities.

第2スペクトル中のピークの抑圧の度合いに基づく第2スコア値の計算
本発明の方法における第2の手順は、スペクトルSP2中で抑圧される16O同位体を有する16O/18O同位体クラスタの第1同位体から、mpにおける特定のピークが生じる第2確率を計算することである。この第2確率は第2スコア値S2として知られている。この計算は、2つのスペクトルSP1およびSP2を比較し、それによって、SP2中でのピークの抑圧量を決定することによって実現される。
The second step in the method of calculating the present invention of the second score value based on the degree of suppression of the peak in the second spectrum, 16 O / 18 O isotopic clusters having 16 O isotope is suppressed in the spectrum SP2 Is to calculate the second probability that a specific peak at m p occurs. This second probability is known as the second score value S2. This calculation is realized by comparing the two spectra SP1 and SP2, thereby determining the amount of peak suppression in SP2.

上記で説明したように、4重極質量フィルタの透過ウインドウを、その幅を狭めることなく、より大きなm/z値にセンタリングし直すことができ、それによって、比較的軽い同位体の透過が効果的に妨げられる。透過ウインドウの幅を一定にして用いると、感度が確実に一定になる。こうすると、特定のペプチドの同位体混合物からのSP1と、重い同位体を含むペプチドだけからのSP2の2つの異なるスペクトルは、類似の信号対雑音比を有する。   As explained above, the transmission window of a quadrupole mass filter can be re-centered to a larger m / z value without reducing its width, which is effective for relatively light isotope transmission. Is disturbed. If the width of the transmission window is constant, the sensitivity is surely constant. In this way, two different spectra, SP1 from an isotopic mixture of a particular peptide and SP2 from a peptide containing only a heavy isotope, have similar signal-to-noise ratios.

スペクトルSP1中のmpにおけるピークおよび強度I0は、4重極透過ウインドウが16Oおよび18Oを含むフラグメントに関する信号を含むときに収集されるが、このmpにおけるピークおよび強度I0により、それぞれ強度Inを有し、(mp+n)で示す追加のピークが生じる。これは、天然に分布する同位体および置換されたフラグメントの混合物に起因するものである。同様に、第2スペクトル中で、4重極透過ウインドウが、C末端で18O同位体を含むフラグメント付近でセンタリングされるときに収集されるmpにおけるピークはK0で示す強度を有し、同じエンベロープ中のピーク(mp+n)はKnで示す強度を有する。 The peak and intensity I 0 at m p in spectrum SP1 is collected when the quadrupole transmission window contains signals for fragments containing 16 O and 18 O, but due to this peak and intensity I 0 at m p , An additional peak is generated, each having an intensity In and denoted by (m p + n). This is due to a mixture of naturally distributed isotopes and substituted fragments. Similarly, in the second spectrum in, quadrupole transmission window, the peak at m p collected when it is centered around the fragment containing the 18 O isotope in the C-terminal has a strength indicated by K 0, peaks in the same envelope (m p + n) has an intensity represented by K n.

まず、mpにおけるピークから生じるSP1中のピークの強度をI0に対して正規化し、mpにおけるピークから生じるSP2中のピークの強度をK0に対して正規化する。mpにおけるピークが、16O/18O同位体クラスタ中の第1同位体から生じる場合、このピークは第2スペクトル中で抑圧されるので、K0<<I<SUB>0になる。K0=1とすることによって、他のピークの強度K1、K2などは人為的に高い値に設定される。 First, the intensity of the peak in SP1 resulting from the peak at m p is normalized to I 0 , and the intensity of the peak in SP2 arising from the peak at m p is normalized to K 0 . peak at m p is, 16 O / 18 if O resulting from isotope first isotope in the cluster, this peak is suppressed in a second spectrum, the K 0 << I <SUB> 0 . By setting K 0 = 1, the intensities K 1 and K 2 of other peaks are artificially set to high values.

第2スコア値の計算では、18Oで標識することができるはずのフラグメント・イオンの大量に存在する同位体を平均化することが望ましい。m0が1,400Da未満のペプチド・フラグメントでは、ピークmpおよび(mp+2)を考慮する。標識されていない場合、m0の第1同位体だけが多く存在する。標識されている場合、同位体m0およびm0+2がともに多く存在する。1,400Daよりも大きいm0では、ピークmp、(mp+1)、(mp+2)および(mp+3)を考慮する。標識されていない場合、第1同位体だけが多く存在する。18Oで標識されている場合、m0からm0+4までのすべての同位体が多く存在する。これは、上記で説明したように、比較的重いペプチド・イオンでは、複数の同位体置換基を含むサブフラグメントの寄与が増加するからである。1,400Daを選択することは決まっているわけではなく、本発明の趣旨から逸脱することなく、約1,400Daの領域内で他の値を選択することができる。 In calculating the second score value, it is desirable to average the abundant isotopes of fragment ions that should be able to be labeled with 18 O. For peptide fragments with m 0 less than 1,400 Da, the peaks m p and (m p +2) are considered. If unlabeled, only the first isotope of m 0 is present. When labeled, there are many isotopes m 0 and m 0 +2. For m 0 greater than 1,400 Da, the peaks m p , (m p +1), (m p +2) and (m p +3) are considered. If not labeled, only the first isotope is present. 18 if it is labeled with O, all isotopes from m 0 to m 0 +4 there are many. This is because, as explained above, relatively heavy peptide ions increase the contribution of subfragments containing multiple isotopic substituents. The selection of 1,400 Da is not fixed, and other values can be selected within the region of about 1,400 Da without departing from the spirit of the present invention.

各スペクトルに対して、考慮するすべてのピークの強度の平均をとることによって、同位体の平均相対強度を計算する。質量m0を有する特定のイオンに対して、これらの平均値は、スペクトルSP1およびSP2に関してそれぞれI(ave)およびK(ave)である。そのため、m0<1,400DAでは、I(AVE)=(I<SUB>0+I2)/2になり、m0>1,400Daでは、I(ave)=(I0+I2+I3+I4)/4になる。 For each spectrum, the average relative intensity of the isotopes is calculated by averaging the intensities of all peaks considered. For a particular ion with mass m 0 , these average values are I (ave) and K (ave) for spectra SP1 and SP2, respectively. Therefore, for m 0 <1,400DA, I (AVE) = (I <SUB> 0 + I 2 ) / 2, and for m 0 > 1,400 Da, I (ave) = (I 0 + I 2 + I 3 + I 4 ) / 4.

mpにおけるピークが、16O/18O同位体クラスタ中の第1同位体である場合、このピークは第2スペクトル中で抑圧され、K(ave)>I(ave)になる。mpにおけるピークが非yイオンの第1同位体である場合、K(ave)〜=I(ave)になる。 peak at m p is, if a first isotope in the 16 O / 18 O isotopic cluster, the peaks is suppressed in the second spectrum, the K (ave)> I (ave ). If peak at m p is first isotope non y ions will K (ave) ~ = I ( ave).

第2スペクトル中のmpにおけるピークの抑圧の度合いを求める第2スコア値S2についての式を式6で示す。

Figure 2005510732
An expression for the second score value S2 for obtaining the degree of suppression of the peak at m p in the second spectrum is shown by Expression 6.
Figure 2005510732

ただし、パラメータλ2は、S2(mp)に与えられるスコア処理の重みであり、Δnは、これら2つのスペクトルのピーク強度の差、すなわちピークの抑圧である。好ましい実施形態では、このスコア処理の重みパラメータには値5が与えられる。図6(b)に、λ2=5、σ2=0.25についての例を示す。図6(b)では、Δはx軸上の値であり、S2はy軸上の値である。 However, the parameter λ 2 is the weight of the score processing given to S2 (m p ), and Δ n is the difference in peak intensity between these two spectra, that is, peak suppression. In the preferred embodiment, the scoring weight parameter is given the value 5. FIG. 6 (b) shows an example for λ 2 = 5 and σ 2 = 0.25. In FIG. 6 (b), Δ is a value on the x-axis, and S2 is a value on the y-axis.

この抑圧がマイナスの場合、すなわち、第2スペクトル中の所与の同位体の強度が、第1スペクトル中のものよりも大きい場合、Δを(S2=0、すなわち抑圧なしに相当する)ゼロに設定する。S1に関する式の場合と同様に、σ2は鋭さのパラメータである。というのは、σ2により、抑圧がない(すなわち、Δnが小さい)場合には、どのくらい速くスコア値がゼロに落ちるかが決まるからである。 If this suppression is negative, i.e. if the intensity of a given isotope in the second spectrum is greater than that in the first spectrum, then Δ is zero (S2 = 0, corresponding to no suppression). Set. As with the equation for S1, σ 2 is a sharpness parameter. Since, by sigma 2, there is no suppression in the case (i.e., delta n is small) is how fast the score value is from or fall to zero is determined.

このスコア処理関数は、18Oで標識したピークについてはλ2の値を有するはずである。このようなピークは、第2スペクトル中では抑圧される。ほとんどのピークが標識されていないので、平均ピークは18Oで標識されているものではない。平均ピーク値については、スコア処理値は、例えば好ましい実施形態における0.002*λ2といった極めて小さくなるはずである。さらに、好ましくは、平均ピーク値に0.002*λ2などの小さな係数を掛けるようにσ2を選択する。これは、数学的には、σが以下の形の関数として表現され得ることを意味する。

Figure 2005510732
This scoring function should have a value of λ 2 for the peak labeled with 18 O. Such a peak is suppressed in the second spectrum. Since most of the peaks are not labeled, the average peak is not labeled with 18 O. For the average peak value, the score processing value should be very small, for example 0.002 * λ 2 in the preferred embodiment. Furthermore, σ 2 is preferably selected so that the average peak value is multiplied by a small coefficient such as 0.002 * λ 2 . This mathematically means that σ can be expressed as a function of the form
Figure 2005510732

Δavgは、このスペクトルから決まるすべての値の平均であり、β2は、好ましくは0.002になるように選択されるパラメータである。もちろん、σに対する他の多くの数学的な形が、本発明の方法と適合する。 Δ avg is the average of all values determined from this spectrum, and β 2 is a parameter that is preferably chosen to be 0.002. Of course, many other mathematical forms for σ are compatible with the method of the present invention.

I(ave)>K(ave)の場合、S2(mp)には値ゼロが与えられる。これは第2スペクトル中でmpにおけるピークの抑圧がなく、したがって、このピークは、16O/18O同位体クラスタ中の第1ピークではないことを示す。 If I (ave)> K (ave), the value zero is given to S2 (m p ). This is not suppression of the peak at m p in the second spectrum, therefore, this peak indicates that it is not a first peak in 16 O / 18 O isotopic clusters.

S2(mp)の値が大きいと、このピークがyイオンから生じる確率が高いことを示す。 A large value of S2 (m p ) indicates that there is a high probability that this peak will originate from y ions.

S2の値を確率に変換するために、すべてのS2の値を計算した後で、これらのスコア値をその最大値で割る。   In order to convert S2 values into probabilities, after calculating all S2 values, divide these score values by their maximum values.

最後に、フィルタ処理されたスペクトルSSを、式(2)を式(1)に代入することによって得られた式8を用いて計算して、mpの各値におけるピークについての強度を計算することができる。 Finally, the filtered spectrum SS is calculated using Equation 8 obtained by substituting Equation (2) into Equation (1) to calculate the intensity for the peak at each value of m p be able to.

SS(mp)=SP1(mp)*S1(mp)*S2(mp) (8)
ここで説明した手順は、両方のスペクトル中の各ピークごとに、あるいは、対象となるピークとして選択した数に応じて繰り返すことが好ましい。
SS (m p ) = SP1 (m p ) * S1 (m p ) * S2 (m p ) (8)
The procedure described here is preferably repeated for each peak in both spectra or according to the number selected as the peak of interest.

上記で示したように、各ピークのスコア関数は、(18Oで標識したピークについての抑圧および予想同位体分布からの偏差などの)ピーク固有のパラメータと、すべての抑圧およびすべての偏差が既知である(すなわち、平均値Δavgが得られる)場合にのみ計算し得るパラメータとによって決まる。したがって、好ましい実施形態では、フィルタ処理されたスペクトルの計算は、ピークごとに、すべての偏差および抑圧が計算されるようにすることから開始する。その後、すべてのピークについてのスコア値を計算し、次いで、このスペクトルに、これら2つのスコア関数を掛ける。したがって、どのピークのクラスタも省かないことが好ましい。すべての計算は、すべてのピークについて、各ピークをその特徴に関して、そのピークが16O/18Oクラスタの第1ピークであり得るかどうか常に評価しながら行う。ある1つのピークを第1同位体とすることができるはずの場合でも、このクラスタに属するすべてのピークを省くことは早計である。というのは、第1ピークとすでに評価したものが、同じ目的で他のピークを評価する前に本当に第1のピークであると推測的に断定することはできないからである。例えば、第2または第3のピークがはるかに適切な16O/18Oクラスタの第1ピークになる可能性がある。 As shown above, the score function for each peak is known for peak-specific parameters (such as suppression for 18 O-labeled peaks and deviations from the expected isotope distribution) and for all suppressions and all deviations. (That is, a parameter that can be calculated only when an average value Δ avg is obtained). Thus, in the preferred embodiment, the calculation of the filtered spectrum begins with every deviation and suppression being calculated for each peak. The score values for all peaks are then calculated and the spectrum is then multiplied by these two score functions. Therefore, it is preferable not to omit any peak clusters. All calculations are performed for every peak, always evaluating each peak with respect to its characteristics, whether that peak can be the first peak of a 16 O / 18 O cluster. Even if one peak should be able to be the first isotope, it is premature to omit all peaks belonging to this cluster. This is because what has already been evaluated as the first peak cannot be speculatively determined to be the first peak before evaluating other peaks for the same purpose. For example, the second or third peak can be the first peak of a much more suitable 16 O / 18 O cluster.

アミノ酸配列の決定
ペプチドの質量スペクトル中の一連のyイオンが同定されると、このスペクトル中の隣接するyイオン・ピーク間の質量差を検討することによって、このペプチドの配列を推定することが可能になる。
Determining the amino acid sequence Once a series of y ions in the mass spectrum of a peptide has been identified, the sequence of this peptide can be deduced by examining the mass difference between adjacent y ion peaks in the spectrum become.

本発明のアルゴリズムとともに示差走査法により、この系列のyイオン・サブフラグメントに対応する質量スペクトル中のピークを同定することができる。この系列中の各イオンは、このペプチドのC末端を含む。ペプチドのアミド結合から先に開裂する衝突誘起解離の理想的な条件では、各yイオンは、正確な数のアミノ酸残基を含むペプチド・サブフラグメントに対応する。したがって、衝突チャンバ内で各ペプチドのアミド結合が開裂する場合、この系列中の各yイオンは、最も近接したyイオンと、アミノ酸残基の質量だけ質量が異なる。同じ質量を有するロイシンおよびイソロイシンを除き、すべてのアミノ酸残基は固有の質量を有するので、隣接するyイオンのピーク間の質量差を計算することによって、比較的重いフラグメントから、より軽いフラグメントを生成するために開裂させたアミノ酸残基そのものを同定するか、あるいは、それがロイシンまたはイソロイシンのはずであることを示すことが可能である。   The differential scanning method along with the algorithm of the present invention can identify peaks in the mass spectrum corresponding to this series of y ion subfragments. Each ion in this series contains the C-terminus of this peptide. Under ideal conditions of collision-induced dissociation that cleaves first from the peptide amide bond, each y ion corresponds to a peptide subfragment containing the exact number of amino acid residues. Thus, when the amide bond of each peptide is cleaved in the collision chamber, each y ion in this series differs in mass by the mass of the amino acid residue from the closest y ion. Except for leucine and isoleucine with the same mass, all amino acid residues have a unique mass, so lighter fragments are generated from relatively heavy fragments by calculating the mass difference between adjacent y-ion peaks It is possible to identify the amino acid residue itself that has been cleaved to show that it should be leucine or isoleucine.

本発明の一実施形態では、1対の隣接したyイオンのピークについて質量差が計算されると、この質量差を、天然に存在する20個の各アミノ酸残基の質量と順次比較し、一致するものが見つかるまでこの比較を行う。この質量差が、これらのアミノ酸残基の1つの質量と同じ場合、このアミノ酸残基に、ペプチド配列中の対応する位置が割り当てられる。質量スペクトル中で隣接する対のyイオン・ピークごとにこの手順を繰り返す。本発明の好ましい実施形態では、2つの隣接するyイオン・ピーク間の質量差が、20個の天然に存在するアミノ酸の1つの質量と対応しない場合、この質量差を、アミノ酸残基のすべての対の質量の合計と比較して、一致するものを探索する。1対のアミノ酸の質量と一致するものが見つかった場合、これら2つのアミノ酸残基をこの配列中に配置する。この対のアミノ酸間のペプチド・アミド結合は、衝突チャンバ内で、この対のそれぞれの残基を含む別のサブフラグメントが生成されるほど十分容易には開裂しなかったものである。この場合、例えば、他の重なり合うフラグメントに関する他の情報が利用可能でない限り、この対のアミノ酸が形成される順序を推測することは不可能である。   In one embodiment of the present invention, once the mass difference is calculated for a pair of adjacent y-ion peaks, the mass difference is sequentially compared with the mass of each of the 20 naturally occurring amino acid residues and matched. Do this comparison until you find what you want. If this mass difference is the same as the mass of one of these amino acid residues, this amino acid residue is assigned a corresponding position in the peptide sequence. Repeat this procedure for each adjacent pair of y ion peaks in the mass spectrum. In a preferred embodiment of the present invention, if the mass difference between two adjacent y-ion peaks does not correspond to the mass of one of the 20 naturally occurring amino acids, this mass difference is calculated for all amino acid residues. Search for a match compared to the sum of the masses of the pair. If one is found that matches the mass of a pair of amino acids, these two amino acid residues are placed in this sequence. The peptide-amide bond between this pair of amino acids was not cleaved easily enough in the collision chamber to produce another subfragment containing each residue of this pair. In this case, for example, it is impossible to infer the order in which this pair of amino acids is formed unless other information about other overlapping fragments is available.

本発明の好ましい実施形態では、タンパク質の酵素消化によって生成された別個のペプチドまたはペプチド・フラグメントごとに、隣接するyイオン・ピーク間の質量差を一致させる手順を繰り返す。各ペプチドまたはペプチド・フラグメントの配列が推定され、当業者に周知の方法に従って、各フラグメントの配列を結合または重ね合わせることによって、このタンパク質の配列が推定される(例えば、Mann, M.、「A shortcut to interesting human genes: peptide sequence tags, expressed-sequence tags and computers」、Trends in Biological Science、(1996)、21、494〜495頁参照)。   In a preferred embodiment of the invention, the procedure for matching the mass difference between adjacent y ion peaks is repeated for each distinct peptide or peptide fragment produced by enzymatic digestion of the protein. The sequence of each peptide or peptide fragment is deduced and the sequence of this protein is deduced by combining or overlaying the sequences of each fragment according to methods well known to those skilled in the art (e.g., Mann, M., `` A shortcut to interesting human genes: peptide sequence tags, expressed-sequence tags and computers ", Trends in Biological Science, (1996) 21, pp. 494-495).

引用参照文献
本明細書で引用したすべての参照文献を、個々の刊行物あるいは特許または特許出願が、具体的かつ個々に参照により事実上それら全体が組み込まれるように示されるのと同じ程度で、参照により事実上それら全体を本明細書に組み込む。
Cited references All references cited herein are to the same extent as if each individual publication or patent or patent application was shown to be specifically and individually incorporated by reference in its entirety. Incorporated herein in their entirety by reference.

理解しやすいように図示および例によって上記発明をある程度詳細に説明してきたが、添付の特許請求の範囲の趣旨または範囲から逸脱することなく、本発明にある種の変更および改変を加えることができることが、本発明の教示に照らして当業者には容易に明らかであろう。   Although the foregoing invention has been described in some detail by way of illustration and example for purposes of clarity of understanding, certain changes and modifications may be made to the invention without departing from the spirit or scope of the appended claims. However, it will be readily apparent to those skilled in the art in light of the teachings of the present invention.

本発明の趣旨および範囲から逸脱することなく、本発明の多くの改変および変形を行うことができることが当業者には明らかであろう。本明細書で説明した特定の実施形態は、単なる例として示したものであり、本発明は、添付の特許請求の範囲の文言およびこのような特許請求の範囲が権利を有する均等物の全範囲によってのみ限定されるものとする。   It will be apparent to those skilled in the art that many modifications and variations can be made in the present invention without departing from the spirit and scope of the invention. The specific embodiments described herein are provided by way of illustration only and the present invention is intended to cover the full scope of equivalents to which such claims are entitled. It shall be limited only by.

別の実施形態
本発明は、コンピュータ可読記憶媒体中に埋め込まれたコンピュータ・プログラム手順を含むコンピュータ・プログラム製品として実施することができる。例えば、このコンピュータ・プログラム製品は、CD-ROM、磁気ディスク記憶製品その他の任意のコンピュータ可読データまたはプログラム記憶製品に記憶させ得る複数の別々のプログラム・モジュールを含むことができるはずである。コンピュータ・プログラム製品中のこれらのソフトウエア・モジュールは、インターネットその他の手段で、搬送波上で(これらのソフトウエア・モジュールが埋め込まれた)コンピュータ・データ信号を送信することによって電子的に配信することもできる。
Alternative Embodiments The present invention can be implemented as a computer program product that includes a computer program procedure embedded in a computer readable storage medium. For example, the computer program product could include multiple separate program modules that could be stored on a CD-ROM, magnetic disk storage product or any other computer readable data or program storage product. These software modules in a computer program product are distributed electronically by transmitting computer data signals (embedded with these software modules) on a carrier wave over the Internet or other means You can also.

いくつかの特定の実施形態を参照して本発明を説明してきたが、この説明は、本発明を例示するためのものであり、本発明を限定すると解釈すべきではない。添付の特許請求の範囲によって定義される本発明の真の趣旨および範囲から逸脱することなく、当業者なら様々な改変形態を想起しよう。   Although the invention has been described with reference to several specific embodiments, the description is illustrative of the invention and is not to be construed as limiting the invention. Various modifications will occur to those skilled in the art without departing from the true spirit and scope of the invention as defined by the appended claims.

本発明によるコンピュータ・システムを示す図である。FIG. 2 illustrates a computer system according to the present invention. 本発明の好ましい実施形態で使用する4重極飛行時間型質量分析器を示す図である。FIG. 2 is a diagram showing a quadrupole time-of-flight mass analyzer used in a preferred embodiment of the present invention. 本発明の好ましい実施形態とともに用いる部分的な同位体標識処理を示すフローチャートである。4 is a flowchart illustrating a partial isotope labeling process used with a preferred embodiment of the present invention. 示差走査法を示すフローチャートである。It is a flowchart which shows the differential scanning method. 本発明によるアルゴリズムを示すフローチャートである。3 is a flowchart illustrating an algorithm according to the present invention. 図6Aは、式3を用いて計算したΔnの関数としてのスコア値S1nの代表的な形を示す図であり、図6Bは、式6を用いて計算したΔnの関数としてのスコア値S2nの代表的な形を示す図である。6A is a diagram showing a typical shape of the score values S1 n as a function of the calculated delta n using Equation 3, FIG. 6B, the score as a function of delta n calculated using Equation 6 It is a figure which shows the typical form of value S2 n . フィルタ処理していないペプチド・サブフラグメント・イオン質量スペクトルと、フィルタ処理したペプチド・サブフラグメント・イオン質量スペクトルとの比較を示すスペクトルを示す図である。FIG. 6 is a spectrum showing a comparison between an unfiltered peptide / subfragment / ion mass spectrum and a filtered peptide / subfragment / ion mass spectrum. 本発明を実施する代表的な質量分析器を示す図である。1 is a diagram illustrating a representative mass analyzer embodying the present invention.

【配列表】

Figure 2005510732
[Sequence Listing]
Figure 2005510732

Claims (26)

同位体標識がその天然存在度と異なる割合で存在する前記ペプチドのサンプルに、示差走査質量分析法を適用することによって得られた質量分析データを受け取るように構成された入力装置と、
前記質量分析データに対して数学的演算を実行するように構成されたプロセッサと、
前記プロセッサに接続され、前記質量分析データ中のピークごとに繰り返し実行され、前記質量分析データ中のピークが、前記ペプチドのyイオン・サブフラグメントから得られる確率を生成するように前記プロセッサに指示する第1組の命令と、前記ペプチドのフィルタ処理された質量スペクトルを生成するように前記プロセッサに指示し、前記フィルタ処理された質量スペクトル中で閾値よりも大きい強度を有する各ピークと、前記ペプチドのyイオン・サブフラグメントに対応するように予測する第2組の命令と、前記フィルタ処理された質量スペクトルから前記ペプチドのアミノ酸残基配列を導出し、前記配列を前記メモリ中に記憶するように前記プロセッサに指示する第3組の命令とを記憶するメモリと
を備えるペプチドのアミノ酸残基配列を決定する装置。
An input device configured to receive mass spectrometry data obtained by applying differential scanning mass spectrometry to a sample of the peptide in which an isotope label is present at a different rate than its natural abundance;
A processor configured to perform mathematical operations on the mass spectrometry data;
Connected to the processor and executed repeatedly for each peak in the mass spectrometry data, instructing the processor to generate a probability that the peak in the mass spectrometry data is derived from a y-ion subfragment of the peptide A first set of instructions, instructing the processor to generate a filtered mass spectrum of the peptide, each peak having an intensity greater than a threshold in the filtered mass spectrum; and A second set of instructions that predict to correspond to y ion subfragments and the amino acid residue sequence of the peptide from the filtered mass spectrum and store the sequence in the memory An amino acid residue of the peptide comprising: a memory for storing a third set of instructions for instructing the processor Apparatus for determining the column.
前記質量分析データが、前記同位体標識が存在するサブフラグメント・イオンからの信号と、前記同位体標識が存在しないサブフラグメント・イオンからの信号とを有する第1質量スペクトルと、前記同位体標識が存在しないサブフラグメント・イオンからの信号が実質的に抑制された第2質量スペクトルとを含む、請求項1に記載の装置。   The mass spectrometry data includes a first mass spectrum having a signal from a subfragment ion in which the isotope label is present and a signal from a subfragment ion in which the isotope label is not present; and 2. The apparatus of claim 1, comprising a second mass spectrum in which signals from non-existent subfragment ions are substantially suppressed. 前記同位体標識が18Oである、請求項1に記載の装置。 The apparatus of claim 1, wherein the isotope label is 18 O. 前記割合が50%である、請求項3に記載の装置。   4. The device according to claim 3, wherein the proportion is 50%. 前記割合が33%である、請求項3に記載の装置。   4. The apparatus of claim 3, wherein the percentage is 33%. 前記確率が第1スコア値S1と第2スコア値S2の積から計算され、
(i)前記同位体標識が存在しないサブフラグメント・イオンからの信号を含む同位体クラスタから、前記第1質量スペクトル中のピークが生じる尤度と(ii)前記同位体標識が前記割合で存在するサブフラグメント・イオンからの信号とに前記第1スコア値が比例し、
前記同位体標識が前記割合で存在するサブフラグメント・イオンからのピークを含み、かつ前記同位体標識が存在しないサブフラグメント・イオンからのピークが前記第1質量スペクトルと比較して効果的に抑圧された同位体クラスタから、前記第2質量スペクトル中のピークが生じる尤度に前記第2スコア値が比例する、請求項2に記載の装置。
The probability is calculated from the product of the first score value S1 and the second score value S2,
(i) the likelihood that a peak in the first mass spectrum will occur from an isotope cluster containing a signal from a subfragment ion where the isotope label is not present, and (ii) the isotope label is present in the proportion The first score value is proportional to the signal from the subfragment ions,
The isotope label includes a peak from a subfragment ion present in the proportion, and a peak from a subfragment ion without the isotopic label is effectively suppressed compared to the first mass spectrum. 3. The apparatus according to claim 2, wherein the second score value is proportional to the likelihood that a peak in the second mass spectrum is generated from the isotope cluster.
前記第1スコア値S1が、mpにおけるピークについて下記関係式から計算され、
Figure 2005510732
ただし、λおよびσはユーザが定義するパラメータであり、
Figure 2005510732
ただし、Inは、前記第1スペクトル中にピークmpが生じる同位体クラスタ中のn番目のピークの強度であり、In *は、天然の同位体存在度によるスペクトル中にピークmpが生じる同位体クラスタ中のn番目のピークの強度の計算値である、請求項6に記載の装置。
Wherein the first score value S1 is the peak at m p is calculated from the following equation,
Figure 2005510732
Where λ and σ are user defined parameters,
Figure 2005510732
However, I n is the n th peak intensity in the first isotopic cluster peak m p occurs in the spectrum, I n * is a peak m p in the spectrum due to the natural isotopic abundance 7. The apparatus of claim 6, which is a calculated value of the intensity of the nth peak in the resulting isotope cluster.
λの値が10.0である、請求項7に記載の装置。   8. The apparatus according to claim 7, wherein the value of λ is 10.0. σが、
Figure 2005510732
で与えられる、請求項7に記載の装置。
σ is
Figure 2005510732
The device of claim 7, wherein
前記第2スコア値S2が、mpにおけるピークについて下記関係式から計算され、
Figure 2005510732
ただし、λ2およびσ2はユーザが定義するパラメータであり、
Figure 2005510732
ただし、Inは、前記第1スペクトル中にピークmpが生じる同位体クラスタ中のn番目のピークの強度であり、In *は、天然の同位体存在度によるスペクトル中にピークmpが生じる同位体クラスタ中のn番目のピークの強度の計算値である、請求項7に記載の装置。
The second score value S2 is the peak at m p is calculated from the following equation,
Figure 2005510732
Where λ 2 and σ 2 are user-defined parameters,
Figure 2005510732
However, I n is the n th peak intensity in the first isotopic cluster peak m p occurs in the spectrum, I n * is a peak m p in the spectrum due to the natural isotopic abundance 8. The apparatus of claim 7, which is a calculated value of the intensity of the nth peak in the resulting isotope cluster.
λ2の値が5である、請求項10に記載の装置。 The apparatus of claim 10, wherein the value of λ 2 is 5. σ2が、β2をパラメータとする
Figure 2005510732
で与えられる、請求項10に記載の装置。
σ 2 has β 2 as a parameter
Figure 2005510732
The device of claim 10, wherein
前記第3組の命令が、前記フィルタ処理された質量スペクトル中の1対のピーク間の質量差を計算し、前記質量差を天然に存在する20個の各アミノ酸の残基の質量と比較する命令を含む、請求項2に記載の装置。   The third set of instructions calculates the mass difference between a pair of peaks in the filtered mass spectrum and compares the mass difference with the mass of each of the 20 naturally occurring amino acids. The apparatus of claim 2 comprising instructions. 同位体標識がその天然存在度と異なる割合で存在する前記ペプチドのサンプルに示差走査質量分析法を適用することによって得られた質量分析データを受け取ることと、
前記第1組の命令が前記質量分析データ中のピークごとに繰り返し実行され、前記質量分析データ中のピークが、前記ペプチドのyイオン・サブフラグメントから得られる確率を生成することと、
前記ペプチドのフィルタ処理された質量スペクトルを生成し、前記フィルタ処理された質量スペクトル中で閾値よりも大きい強度を有する各ピークが、前記ペプチドのyイオン・サブフラグメントに対応するように予測することと、
前記フィルタ処理された質量スペクトルから前記ペプチドのアミノ酸残基配列を導出することと
を含むペプチドのアミノ酸残基配列を決定する方法。
Receiving mass spectrometry data obtained by applying differential scanning mass spectrometry to a sample of said peptide in which an isotope label is present at a different rate than its natural abundance;
The first set of instructions is repeatedly executed for each peak in the mass spectrometry data to generate a probability that a peak in the mass spectrometry data is obtained from a y-ion subfragment of the peptide;
Generating a filtered mass spectrum of the peptide, and predicting that each peak having an intensity greater than a threshold in the filtered mass spectrum corresponds to a y-ion subfragment of the peptide; ,
Deriving the amino acid residue sequence of the peptide from the filtered mass spectrum.
前記質量分析データが、前記同位体標識が存在する場合のサブフラグメント・イオンからの信号と、前記同位体標識が存在しない場合のサブフラグメント・イオンからの信号とを有する第1質量スペクトルと、前記同位体標識が存在しないサブフラグメント・イオンからの信号が大きく抑圧された第2質量スペクトルとを含む、請求項14に記載の方法。   The mass spectrometry data includes a first mass spectrum having a signal from a subfragment ion when the isotope label is present and a signal from a subfragment ion when the isotope label is not present; 15. A method according to claim 14, comprising a second mass spectrum in which signals from subfragment ions without an isotopic label are greatly suppressed. 前記同位体標識が18Oである、請求項15に記載の方法。 The isotope label is a 18 O, The method of claim 15. 前記割合が50%である、請求項15に記載の方法。   16. The method of claim 15, wherein the percentage is 50%. 前記割合が33%である、請求項15に記載の方法。   16. The method of claim 15, wherein the percentage is 33%. 前記確率を第1スコア値S1と第2スコア値S2の積から計算し、
(i)前記同位体標識が存在しないサブフラグメント・イオンからの信号を含む同位体クラスタから、前記第1質量スペクトル中のピークが生じる尤度と(ii)前記同位体標識が前記割合で存在するサブフラグメント・イオンからの信号とに前記第1スコア値が比例し、
前記同位体標識が前記割合で存在するサブフラグメント・イオンからのピークを含み、かつ前記同位体標識が存在しないサブフラグメント・イオンからのピークが前記第1質量スペクトルと比較して効果的に抑圧される同位体クラスタから、前記第2質量スペクトル中のピークが生じる尤度に前記第2スコア値が比例する、請求項15に記載の方法。
The probability is calculated from the product of the first score value S1 and the second score value S2,
(i) the likelihood that a peak in the first mass spectrum will occur from an isotope cluster containing a signal from a subfragment ion where the isotope label is not present, and (ii) the isotope label is present in the proportion The first score value is proportional to the signal from the subfragment ions,
The isotope label includes a peak from a subfragment ion present in the proportion, and a peak from a subfragment ion without the isotopic label is effectively suppressed compared to the first mass spectrum. 16. The method of claim 15, wherein the second score value is proportional to the likelihood that a peak in the second mass spectrum will occur from an isotope cluster.
前記第1係数S1が、ピークmpについて下記関係式から計算され、
Figure 2005510732
ただし、λおよびσはユーザが定義するパラメータであり、
Figure 2005510732
ただし、Inは、前記第1スペクトル中にピークmpが生じる同位体クラスタ中のn番目のピークの強度であり、In *は、天然の同位体存在度に従って計算されたスペクトル中にピークmpが生じる同位体クラスタ中のn番目のピークの強度である、請求項19に記載の方法。
The first coefficient S1 is calculated from the following relational expression for the peak m p :
Figure 2005510732
Where λ and σ are user defined parameters,
Figure 2005510732
However, I n, said first spectral peak m p in an n-th peak intensity of the isotope in the cluster occurring, I n * is a peak in the spectrum which is calculated according to the natural isotopic abundance m p a n-th peak intensity in the isotopic clusters occurring the method of claim 19.
λの値が10.0である、請求項20に記載の方法。   21. The method of claim 20, wherein the value of [lambda] is 10.0. 前記第2スコア値S2が、mpにおけるピークについて下記関係式から計算され、
Figure 2005510732
ただし、λ2およびσ2はユーザが定義するパラメータであり、
Figure 2005510732
ただし、Inは、前記第1スペクトル中にピークmpが生じる同位体クラスタ中のn番目のピークの強度であり、In *は、天然の同位体存在度によるスペクトル中にピークmpが生じる同位体クラスタ中のn番目のピークの強度の計算値である、請求項20に記載の方法。
The second score value S2 is the peak at m p is calculated from the following equation,
Figure 2005510732
Where λ 2 and σ 2 are user-defined parameters,
Figure 2005510732
However, I n is the n th peak intensity in the first isotopic cluster peak m p occurs in the spectrum, I n * is a peak m p in the spectrum due to the natural isotopic abundance 21. The method of claim 20, which is a calculated value of the intensity of the nth peak in the resulting isotope cluster.
λ2の値が5である、請求項22に記載の方法。 23. The method of claim 22, wherein the value of [lambda] 2 is 5. σ2が、β2をパラメータとする
Figure 2005510732
で与えられる、請求項22に記載の方法。
σ 2 has β 2 as a parameter
Figure 2005510732
23. The method of claim 22, wherein
前記ペプチドについてフィルタ処理された質量スペクトルを生成するステップが、前記フィルタ処理された質量スペクトル中の1対のピーク間の質量差を計算することと、前記質量差を、天然に存在する20個のアミノ酸の各残基の質量と比較することとを含む、請求項15に記載の方法。   Generating a filtered mass spectrum for the peptide, calculating a mass difference between a pair of peaks in the filtered mass spectrum; and calculating the mass difference between 20 naturally occurring 16. The method of claim 15, comprising comparing the mass of each residue of the amino acid. プログラムの制御下でコンピュータによって実行され、前記コンピュータが、前記プログラムを記憶するメモリと、質量分析データを受け取るように構成された入力装置と、前記質量分析データに対して数学的演算を実行するように構成されたプロセッサとを含む、請求項14から25のいずれか一項に記載の方法。   Executed by a computer under the control of a program, wherein the computer performs a mathematical operation on the mass spectrometry data, a memory storing the program, an input device configured to receive mass spectrometry data 26. A method according to any one of claims 14 to 25, comprising: a processor configured for:
JP2003547965A 2001-11-30 2001-11-30 System and method for automatic protein sequencing by mass spectrometry Pending JP2005510732A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2001/014041 WO2003046577A1 (en) 2001-11-30 2001-11-30 A system and method for automatic protein sequencing by mass spectrometry

Publications (1)

Publication Number Publication Date
JP2005510732A true JP2005510732A (en) 2005-04-21

Family

ID=8164706

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003547965A Pending JP2005510732A (en) 2001-11-30 2001-11-30 System and method for automatic protein sequencing by mass spectrometry

Country Status (4)

Country Link
JP (1) JP2005510732A (en)
AU (1) AU2002218321A1 (en)
CA (1) CA2468689A1 (en)
WO (1) WO2003046577A1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006120928A1 (en) * 2005-05-13 2006-11-16 Shimadzu Corporation Mass analysis data analysis device and program
JP2006317457A (en) * 2005-05-05 2006-11-24 Palo Alto Research Center Inc Automatic detection of quality spectrum
JP2008145221A (en) * 2006-12-08 2008-06-26 Shimadzu Corp Method, apparatus, and program for analyzing amino acid sequence using mass spectrometry and recording medium recording this program
JP2009522558A (en) * 2006-01-05 2009-06-11 エムディーエス アナリティカル テクノロジーズ, ア ビジネス ユニット オブ エムディーエス インコーポレイテッド, ドゥーイング ビジネス スルー イッツ サイエックス ディビジョン Information-dependent collection triggered by mass defect
JP2012247198A (en) * 2011-05-25 2012-12-13 Shimadzu Corp Mass spectrometric data analysis method and analysis apparatus
JP2013519099A (en) * 2010-02-18 2013-05-23 エフ.ホフマン−ラ ロシュ アーゲー Method for determining sequence variants of polypeptides

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4720254B2 (en) * 2005-03-31 2011-07-13 日本電気株式会社 Analysis method, analysis system, and analysis program
DE102005028944A1 (en) * 2005-06-22 2007-01-04 Christine Bettendorf Identifying chemical structures comprises correlating differential mass spectra with heat of formation or fragmentation activation energy values calculated by quantum chemical methods
US11378581B2 (en) 2016-10-20 2022-07-05 Vito Nv Monoisotopic mass determination of macromolecules via mass spectrometry
CN111307921B (en) * 2019-11-26 2022-11-25 中国工程物理研究院材料研究所 Absolute measurement quadrupole mass spectrum hydrogen isotope gas abundance analysis method and device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU4228499A (en) * 1998-06-03 1999-12-20 Millennium Pharmaceuticals, Inc. Protein sequencing using tandem mass spectroscopy

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006317457A (en) * 2005-05-05 2006-11-24 Palo Alto Research Center Inc Automatic detection of quality spectrum
JP4679438B2 (en) * 2005-05-05 2011-04-27 パロ アルト リサーチ センター インコーポレイテッド Automatic detection of quality spectrum
WO2006120928A1 (en) * 2005-05-13 2006-11-16 Shimadzu Corporation Mass analysis data analysis device and program
JPWO2006120928A1 (en) * 2005-05-13 2008-12-18 株式会社島津製作所 Mass spectrometry data analysis apparatus and program
JP4502009B2 (en) * 2005-05-13 2010-07-14 株式会社島津製作所 Mass spectrometry data analysis apparatus and program
US8067729B2 (en) 2005-05-13 2011-11-29 Shimadzu Corporation Mass analysis data analyzing apparatus and program thereof
JP2009522558A (en) * 2006-01-05 2009-06-11 エムディーエス アナリティカル テクノロジーズ, ア ビジネス ユニット オブ エムディーエス インコーポレイテッド, ドゥーイング ビジネス スルー イッツ サイエックス ディビジョン Information-dependent collection triggered by mass defect
JP2008145221A (en) * 2006-12-08 2008-06-26 Shimadzu Corp Method, apparatus, and program for analyzing amino acid sequence using mass spectrometry and recording medium recording this program
JP2013519099A (en) * 2010-02-18 2013-05-23 エフ.ホフマン−ラ ロシュ アーゲー Method for determining sequence variants of polypeptides
JP2012247198A (en) * 2011-05-25 2012-12-13 Shimadzu Corp Mass spectrometric data analysis method and analysis apparatus

Also Published As

Publication number Publication date
WO2003046577A1 (en) 2003-06-05
CA2468689A1 (en) 2003-06-05
AU2002218321A1 (en) 2003-06-10

Similar Documents

Publication Publication Date Title
JP4818270B2 (en) System and method for grouping precursor and fragment ions using selected ion chromatograms
Xu et al. MassMatrix: a database search program for rapid characterization of proteins and peptides from tandem mass spectrometry data
US7781729B2 (en) Analyzing mass spectral data
JP4515819B2 (en) Mass spectrometry system
JP4988884B2 (en) Mass spectrometry system
US8278115B2 (en) Methods for processing tandem mass spectral data for protein sequence analysis
US7626162B2 (en) Mass spectrometry system and mass spectrometry method
JP2011520129A (en) MS / MS data processing
EP3775928B1 (en) Analysis method for glycoproteins
WO2013138131A1 (en) Probability-based mass spectrometry data acquisition method for increased peptide and protein identifications
JP4857000B2 (en) Mass spectrometry system
CN112824894B (en) Glycopeptide analyzer
JP4821400B2 (en) Structural analysis system
JP2005510732A (en) System and method for automatic protein sequencing by mass spectrometry
JP4801455B2 (en) Mass spectrometry system
JP4058449B2 (en) Mass spectrometry method and mass spectrometer
US20050159902A1 (en) Apparatus for library searches in mass spectrometry
JP2004279424A (en) Method of identifying biopolymers using mass spectroscopy and program product used for the same
JP6079587B2 (en) Glycopeptide analyzer
JP2008039608A (en) Mass spectrometry system
JP2008170346A (en) Mass analyzing system
Li et al. Fragment correlation mass spectrometry: determining the structures of biopolymers in a complex mixture without isolating individual components
Takao et al. Accurate peptide sequencing by mass spectrometry
JP2021025946A (en) Sugar peptide analyzer
BESADA et al. T. TAKAO¹, W. MO¹, J. FERNANDEZ-DE-COSSIO², J. GONZALEZ²