JP2015230262A - Mass analysis data analysis method and device - Google Patents

Mass analysis data analysis method and device Download PDF

Info

Publication number
JP2015230262A
JP2015230262A JP2014117016A JP2014117016A JP2015230262A JP 2015230262 A JP2015230262 A JP 2015230262A JP 2014117016 A JP2014117016 A JP 2014117016A JP 2014117016 A JP2014117016 A JP 2014117016A JP 2015230262 A JP2015230262 A JP 2015230262A
Authority
JP
Japan
Prior art keywords
tag
amino acid
search
peptide
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014117016A
Other languages
Japanese (ja)
Inventor
雅樹 村瀬
Masaki Murase
雅樹 村瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2014117016A priority Critical patent/JP2015230262A/en
Publication of JP2015230262A publication Critical patent/JP2015230262A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Electron Tubes For Measurement (AREA)

Abstract

PROBLEM TO BE SOLVED: To identify a peptide and a modification site with high accuracy even for a peptide that is subjected to posttranslational modification that cannot easily be identified in an ordinary database retrieval.SOLUTION: De novo sequencing is executed on a MSspectrum derived from a target peptide in a low m/z direction using as the origin a plurality of peaks where ion intensity is relative large, and a plurality of tag candidates are extracted by estimating an amino acid sequence (S1-S3). The tag candidates whose peaks as the origin differ are compared, those having an amino acid sequence in common are detected assuming that their reliability is high, and a sequence tag based on the amino acid sequence is created (S4). A posttranslational modification molecule is estimated from a difference between the start m/z's and between the finish m/z's of the amino acid sequence in the plurality of detected tag candidates (S5). A target peptide is identified by executing a sequence tag search using the sequence tag and modification molecule information as search conditions (S6-S7).

Description

本発明は、ペプチド等の生体由来の高分子化合物に対してMSn分析を実行して収集されたデータを解析処理し上記高分子化合物を同定する質量分析データ解析方法及び装置に関し、特に、翻訳後修飾を受けたペプチドやタンパク質を同定するための質量分析データ解析方法及び装置に関する。 The present invention relates to a mass spectrometry data analysis method and apparatus for performing analysis processing on data collected by performing MS n analysis on biological compounds such as peptides and identifying the polymer compounds, and in particular, translation The present invention relates to a mass spectrometry data analysis method and apparatus for identifying a post-modification peptide or protein.

近年、タンパク質を網羅的に解析するプロテオーム解析の手法は広く用いられており、その技術的な進歩には著しいものがある。プロテオーム解析分野において、MALDI−IT−TOFMS(マトリクス支援レーザ脱離イオン化イオントラップ飛行時間型質量分析装置)を始めとする質量分析装置を用いたペプチドの解析手法として、データベース検索法がよく知られている。データベース検索法では、MSn分析により取得されたMSnスペクトルに現れるピークの質量電荷比を列挙したピークリストと、データベースに登録されたタンパク質より算出される質量電荷比とを照合し、その一致度を手がかりとしてペプチドのアミノ酸配列を決定する。また、データベース検索に際して、ペプチドの受けた修飾の種類を検索条件としてユーザが指定することにより、蓋然性の高いペプチドとその修飾部位とを同定する手法も開発されている。 In recent years, proteome analysis methods for comprehensive analysis of proteins have been widely used, and there are significant technological advances. In the field of proteome analysis, database search methods are well known as peptide analysis methods using mass spectrometers such as MALDI-IT-TOFMS (Matrix Assisted Laser Desorption / Ionization Ion Trap Time-of-Flight Mass Spectrometer). Yes. In the database search method, the peak list that lists the mass-to-charge ratios of the peaks that appear in the MS n spectrum obtained by MS n analysis is checked against the mass-to-charge ratio calculated from the protein registered in the database, and the degree of coincidence The amino acid sequence of the peptide is determined using as a clue. In addition, a method has been developed for identifying a highly probable peptide and its modification site by specifying the type of modification received by the peptide as a search condition when searching the database.

例えば英国マトリクス・サイエンス社が提供するマスコット(Mascot)にはMS/MSイオンサーチと名付けられた検索エンジンが含まれており、検索パラメータとして、タンパク質の分解に使用した消化酵素の種類(エンザイム:Enzyme)、修飾の種類(モディフィケイション:modification)、質量分析の精度の許容値(MS/MS tol.)などをユーザが入力設定できるようになっている(非特許文献1参照)。MS/MSイオンサーチ法では、複数のMS/MS(MSn)スペクトルに対して検索条件に従ったデータベース検索を行い、一致度(スコア)が高いペプチドがリストアップされる。 For example, Mascot provided by Matrix Science, Inc., UK, includes a search engine named MS / MS ion search. As a search parameter, the type of digestive enzyme used for protein degradation (Enzyme) ), The type of modification (modification), the allowable value of accuracy of mass spectrometry (MS / MS tol.), And the like can be input and set by the user (see Non-Patent Document 1). In the MS / MS ion search method, a database search according to a search condition is performed on a plurality of MS / MS (MS n ) spectra, and peptides having a high matching score (score) are listed.

上述したように従来のデータベース検索法では検索条件の1つとして翻訳後修飾の種類などを指定できるようになってはいるものの、実際には、タンパク質特有の翻訳後修飾を受けたペプチドについて上記MS/MSイオンサーチ法などによるデータベース検索の手法を適用しても、妥当なスコアでペプチドや修飾部位を同定することはかなり困難である。その主な理由は、MALDI−IT−TOFMSを用いたMSn分析により得られるMSnスペクトルは、修飾を受けたプロダクトイオンと修飾分子が脱離したプロダクトイオン(ニュートラルロス)とが混在したものとなり、ピークリストがかなり複雑になるためである。 As described above, in the conventional database search method, the type of post-translational modification can be specified as one of the search conditions. Even if a database search technique such as the / MS ion search method is applied, it is quite difficult to identify a peptide or modification site with a reasonable score. The main reason is that the MS n spectrum obtained by MS n analysis using MALDI-IT-TOFMS is a mixture of modified product ions and product ions (neutral loss) from which modified molecules are eliminated. This is because the peak list becomes quite complicated.

一例として、糖鎖断片であるHexNAc1個による修飾を受けたヒトトランスフェリン由来のペプチドイオンをプリカーサイオンとするMS2スペクトルに基づいて作成したピークリストに対し、MS/MSイオンサーチ法を用いてデータベース検索した結果を図6に示す。図6に示すように、この例では妥当なスコアでペプチド及び修飾部位を同定することはできなかった。図7は図6の検索の元となったMS3スペクトルとその帰属結果を示す図である。図8は図7に示したMS3スペクトルとヒトトランスフェリンペプチドの理論プロダクトイオンとの一致度を示す図である。 As an example, database search using MS / MS ion search method for peak list created based on MS 2 spectrum with peptide ion derived from human transferrin modified with one HexNAc sugar chain fragment as precursor ion The results are shown in FIG. As shown in FIG. 6, in this example, the peptide and modification site could not be identified with a reasonable score. FIG. 7 is a diagram showing the MS 3 spectrum that is the basis of the search of FIG. 6 and the attribution result. FIG. 8 is a diagram showing the degree of coincidence between the MS 3 spectrum shown in FIG. 7 and the theoretical product ion of human transferrin peptide.

図7において、yn+■は、糖鎖が1個付加されているという条件の下での帰属結果である。図7に示すように、HexNAc付加体イオン(図中で■が付いたyイオン)とHexNAcのニュートラルロスにより生じたイオン(yイオン)とが混在していることが分かる。図7と図8とを比較すると、HexNAcのニュートラルロスで生じた強度の比較的大きなイオン、例えばy(8)、y(11)などはデータベース検索の際にプロダクトイオンとして帰属されていないことが分かる。こうしたイオンのピークはノイズとして処理されてしまったと考えられ、それによって同定スコアが低くなってしまったと予想される。 In FIG. 7, y n + ■ is an assignment result under the condition that one sugar chain is added. As shown in FIG. 7, it can be seen that HexNAc adduct ions (y ions with a black square in the figure) and ions (y ions) generated by the neutral loss of HexNAc are mixed. When FIG. 7 and FIG. 8 are compared, it can be seen that ions having relatively large intensity, such as y (8), y (11), etc. generated by the HexNAc neutral loss are not assigned as product ions at the time of database search. I understand. These ion peaks are considered to have been treated as noise, and it is expected that the identification score will be lowered.

一方、ペプチド同定のためのデータベース検索の一手法としてシーケンスタグサーチ(Sequence Tag search)と呼ばれる方法がある。シーケンスタグサーチでは、ペプチド又はタンパク質に存在し得る連続のアミノ酸配列を示すタグ(シーケンスタグ)を利用して、MS/MSイオンサーチと同様に、データベースに登録されているタンパク質の仮想CIDスペクトルとの照合によりペプチド同定を試みる。シーケンスタグサーチを実行するツールとしては例えば英国マトリクスサイエンス社が提供する「Mascot Sequence Query」がよく知られている(非特許文献2参照)。この「Mascot Sequence Query」におけるデータベース検索設定画面は「Mascot MS/MS ion search」と同様の検索設定画面であるが、MS2スペクトルから収集されるピークリストの代わりにシーケンスタグをデータとして入力する点が相違する(非特許文献3参照)。 On the other hand, there is a method called sequence tag search as one method of database search for peptide identification. In sequence tag search, a tag indicating a continuous amino acid sequence that may exist in a peptide or protein (sequence tag) is used, and in the same way as MS / MS ion search, a virtual CID spectrum of a protein registered in a database is searched. Attempt peptide identification by matching. As a tool for executing a sequence tag search, for example, “Mascot Sequence Query” provided by Matrix Science, UK is well known (see Non-Patent Document 2). The database search setting screen in “Mascot Sequence Query” is the same search setting screen as in “Mascot MS / MS ion search”, except that the sequence tag is input as data instead of the peak list collected from the MS 2 spectrum. Are different (see Non-Patent Document 3).

シーケンスタグサーチは、与えられるシーケンスタグが正確であって該当ペプチドがデータベースに登録されていれば、正解であるペプチドを一意に同定できるという特徴がある。それ故に、シーケンスタグサーチを利用する場合には精度の高いシーケンスタグを取得することが非常に重要である。MSnスペクトルからシーケンスタグを探索するために一般的にはデノボ(de novo)シーケンシングが利用されるが、上述したように翻訳後修飾を受けたペプチドに対するMSnスペクトルはかなり複雑になるため、単にデノボシーケンシングを実行しても精度のよいシーケンスタグを見いだすのは困難である。 The sequence tag search has a feature that a correct peptide can be uniquely identified if the given sequence tag is accurate and the corresponding peptide is registered in the database. Therefore, when using a sequence tag search, it is very important to obtain a sequence tag with high accuracy. Since it is generally to search for sequence tags from MS n spectrum de novo (de novo) sequencing is utilized, MS n spectra for peptides that have undergone post-translational as described above modification is quite complicated, It is difficult to find an accurate sequence tag by simply executing de novo sequencing.

特開2012−220365号公報JP 2012-220365 A

「マトリクス・サイエンス マスコット MS/MS・イオン・サーチ(Matrix Science Mascot MS/MS Ions Search)」、[online]、英国マトリクス・サイエンス社(Matrix Science Ltd.)、[平成26年5月23日検索]、インターネット<URL : http://www.matrixscience.com/cgi/search_form.pl?FORMVER=2&SEARCH=MIS>"Matrix Science Mascot MS / MS Ions Search", [online], UK Matrix Science Ltd., [May 23, 2014 search] , Internet <URL: http://www.matrixscience.com/cgi/search_form.pl?FORMVER=2&SEARCH=MIS> 「シーケンス・クエリ(Sequence Query)」、[online]、英国マトリクス・サイエンス社(Matrix Science Ltd.)、[平成26年5月23日検索]、インターネット<URL: http://www.matrixscience.com/help/sq_help.html>"Sequence Query", [online], Matrix Science Ltd., UK [Search May 23, 2014], Internet <URL: http://www.matrixscience.com /help/sq_help.html> 「蛋白質同定システム MASCOT Server Version 2.2 チュートリアル」、[online]、英国マトリクス・サイエンス社(Matrix Science Ltd.)、[平成26年5月23日検索]、インターネット<URL: http://www.matrixscience.jp/pdf/jap_2.2_tutorial.pdf>"Protein Identification System MASCOT Server Version 2.2 Tutorial", [online], Matrix Science Ltd., UK (searched on May 23, 2014), Internet <URL: http: //www.matrixscience. jp / pdf / jap_2.2_tutorial.pdf>

本発明は上記課題に鑑みて成されたものであり、その目的とするところは、ニュートラルロスのために従来のデータベース検索法では十分な信頼度で以て同定できないような翻訳後修飾を受けたペプチドのMSnスペクトルを用いて、高い精度で以て、翻訳後修飾の種類や修飾部位及びペプチドのアミノ酸配列を同定することができる質量分析データ解析方法及び装置を提供することである。 The present invention has been made in view of the above problems, and the object of the present invention is to receive post-translational modifications that cannot be identified with sufficient reliability by conventional database search methods due to neutral loss. To provide a mass spectrometric data analysis method and apparatus capable of identifying the type and site of post-translational modification and the amino acid sequence of a peptide with high accuracy using the MS n spectrum of the peptide.

上記課題を解決するために成された第1発明は、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料に含まれる翻訳後修飾を受けたペプチドを同定する質量分析データ解析方法であって、
a)目的ペプチド由来のイオンをプリカーサイオンとしたMSn分析(nは2以上の整数)を実行することで得られたMSnスペクトルに対して、複数の異なるイオンピークを起点として同一質量電荷比軸方向にデノボシーケンシングを実行し、異なる複数のイオン系列についての部分的なアミノ酸配列をそれぞれ求めてタグ候補とするタグ候補抽出ステップと、
b)前記タグ候補抽出ステップにおいて得られたイオン系列毎の1又は複数のタグ候補について、異なるイオン系列に対して同一質量電荷比軸方向に共通のアミノ酸配列を含むタグを見いだして、信頼性の高いタグとしてシーケンスタグを生成するタグ選択ステップと、
c)タンパク質のアミノ酸配列情報が格納されたデータベースを用い、前記タグ選択ステップにおいて生成されたシーケンスタグを検索条件としたシーケンスタグサーチを実行するデータベース検索ステップと、
を有することを特徴としている。
A first invention made to solve the above problems uses a data collected by performing mass spectrometry on a test sample, and uses a peptide subjected to post-translational modification contained in the test sample. A mass spectrometry data analysis method for identifying,
a) Same mass-to-charge ratio starting from multiple different ion peaks for MS n spectra obtained by performing MS n analysis (n is an integer of 2 or more) using ions derived from the target peptide as precursor ions A tag candidate extraction step in which de novo sequencing is performed in the axial direction, and partial amino acid sequences for different ion series are respectively determined as tag candidates;
b) For one or a plurality of tag candidates for each ion series obtained in the tag candidate extraction step, a tag including a common amino acid sequence in the same mass-to-charge ratio axis direction with respect to different ion series is found. A tag selection step for generating a sequence tag as a high tag;
c) a database search step for performing a sequence tag search using a database in which amino acid sequence information of proteins is stored and using the sequence tag generated in the tag selection step as a search condition;
It is characterized by having.

また上記課題を解決するために成された第2発明は、上記第1発明に係る質量分析データ解析方法を実施する装置であって、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料に含まれる翻訳後修飾を受けたペプチドを同定する質量分析データ解析装置において、
a)目的ペプチド由来のイオンをプリカーサイオンとしたMSn分析(nは2以上の整数)を実行することで得られたMSnスペクトルに対して、複数の異なるイオンピークを起点として同一質量電荷比軸方向にデノボシーケンシングを実行し、異なる複数のイオン系列についての部分的なアミノ酸配列をそれぞれ求めてタグ候補とするタグ候補抽出手段と、
b)前記タグ候補抽出手段により得られたイオン系列毎の1又は複数のタグ候補について、異なるイオン系列に対して同一質量電荷比軸方向に共通のアミノ酸配列を含むタグを見いだして、信頼性の高いタグとしてシーケンスタグを生成するタグ選択手段と、
c)タンパク質のアミノ酸配列情報が格納されたデータベースと、
d)前記データベースを用い前記タグ選択手段により生成されたシーケンスタグを検索条件としたシーケンスタグサーチを実行するデータベース検索手段と、
を備えることを特徴としている。
A second invention made to solve the above problems is an apparatus for performing the mass spectrometry data analysis method according to the first invention, which is collected by executing mass analysis on a test sample. In a mass spectrometry data analysis apparatus for identifying a peptide having undergone post-translational modification contained in the test sample,
a) Same mass-to-charge ratio starting from multiple different ion peaks for MS n spectra obtained by performing MS n analysis (n is an integer of 2 or more) using ions derived from the target peptide as precursor ions Tag candidate extraction means for performing de novo sequencing in the axial direction and obtaining partial amino acid sequences for different ion sequences as tag candidates,
b) For one or a plurality of tag candidates for each ion series obtained by the tag candidate extraction means, a tag including a common amino acid sequence in the same mass-to-charge ratio axis direction with respect to different ion series is found and reliable. Tag selection means for generating a sequence tag as a high tag,
c) a database storing protein amino acid sequence information;
d) database search means for performing a sequence tag search using the database and the sequence tag generated by the tag selection means as a search condition;
It is characterized by having.

ここでは、ペプチドのN末端由来のb系列イオンとC末端由来のy系列イオンとを別のイオン系列として扱うのみならず、例えばb系列イオンでも翻訳後修飾が付加したイオンと該修飾が脱離したイオンとは別のイオン系列として扱う。   Here, not only treats b-series ions derived from the N-terminus of peptides and y-series ions derived from the C-terminus as different ion sequences, but also ions with post-translational modifications added to, for example, b-series ions are eliminated. It is treated as an ion series different from the selected ion.

例えば修飾分子が脱離したb系列(又はy系列)フラグメントイオンと修飾分子が付加している(残っている)b系列(又はy系列)フラグメントイオンとでは、後者が修飾分子に相当する質量分だけ大きな質量電荷比を有する筈である。即ち、MSnスペクトルにおいて、後者に由来するフラグメントイオンピークは前者に由来するフラグメントイオンピークよりも修飾分子に相当する質量分だけ質量電荷比軸上でシフトした位置に現れる筈である。そのため、修飾分子が脱離したb系列(又はy系列)フラグメントイオンと修飾分子が付加しているb系列(又はy系列)フラグメントイオンとをそれぞれ起点として同一質量電荷比軸方向にデノボシーケンシングを実行すると、少なくともその起点から或る位置(後者において修飾分子が含まれる最小のイオンの位置)までのアミノ酸配列は同一になる。換言すれば、デノボシーケンシングを実行する起点のイオン系列が不明であっても、或る2つの異なる起点からそれぞれデノボシーケンシングを実行して得られたアミノ酸配列が一致していれば、そのアミノ酸配列の推定結果は正しいものとみなすことができる。 For example, in the b-series (or y-series) fragment ion from which the modifying molecule is detached and the b-series (or y-series) fragment ion to which the modifying molecule is added (remaining), the latter is a mass fraction corresponding to the modifying molecule. Should have a large mass-to-charge ratio. That is, in the MS n spectrum, the fragment ion peak derived from the latter should appear at a position shifted on the mass-to-charge ratio axis by a mass corresponding to the modifying molecule from the fragment ion peak derived from the former. Therefore, de novo sequencing is performed in the same mass-to-charge ratio axis direction starting from the b-series (or y-series) fragment ion from which the modifying molecule is detached and the b-series (or y-series) fragment ion to which the modifying molecule is added. When executed, the amino acid sequences at least from the origin to a certain position (the position of the smallest ion in which the modifying molecule is included in the latter) are identical. In other words, even if the ion sequence of the starting point for performing de novo sequencing is unknown, if the amino acid sequences obtained by executing de novo sequencing from two different starting points match, The sequence estimation result can be regarded as correct.

そこで、第1発明に係る質量分析データ解析方法では、被検試料由来のMSnスペクトルが得られると、まずタグ候補抽出ステップにおいてMSnスペクトル中の、例えば相対的に強度が大きな複数のピークを起点として同一質量電荷比軸方向にデノボシーケンシングがそれぞれ実行される。それにより、異なる複数のイオン系列についての部分的なアミノ酸配列がそれぞれ1又は複数求まる。タグ選択ステップにおいては、イオン系列毎の1又は複数のタグ候補について、異なるイオン系列に対して同一質量電荷比軸方向に共通のアミノ酸配列を含むタグを検出する。上述したように、検出されたタグは信頼性が高いとみなせるから、これに基づいてシーケンスタグを生成する。そして、データベース検索ステップにおいては、タンパク質のアミノ酸配列情報が格納されたデータベースを用いて、上記シーケンスタグを検索条件としたシーケンスタグサーチを実行することにより、目的とするペプチドを同定する。 Therefore, in the mass spectrometry data analysis method according to the first invention, the MS n spectrum from test sample is obtained, first, in the tag candidate extracting step in MS n spectra, for example, a large plurality of peaks relatively intensity As a starting point, de novo sequencing is performed in the same mass-to-charge ratio axis direction. Thereby, one or a plurality of partial amino acid sequences are obtained for a plurality of different ion series. In the tag selection step, for one or a plurality of tag candidates for each ion series, a tag including an amino acid sequence common in the same mass-to-charge ratio axis direction for different ion series is detected. As described above, since the detected tag can be regarded as having high reliability, the sequence tag is generated based on this. In the database search step, a target peptide is identified by executing a sequence tag search using the above sequence tag as a search condition using a database storing protein amino acid sequence information.

シーケンスタグサーチを行う際には、翻訳後修飾分子の種類や修飾部位或いは修飾分子の質量などを検索条件の1つとして与える必要がある。修飾分子の種類などが既知である場合にはそうした既知の情報を検索条件として与えればよい。一方、翻訳後修飾分子の種類などが未知である場合でも、上述したように求めた高い信頼性を有するタグ候補から容易に推定することが可能である。   When performing a sequence tag search, it is necessary to provide the post-translational modification molecule type, modification site, modification molecule mass, and the like as one of the search conditions. If the type of modifying molecule is known, such known information may be given as a search condition. On the other hand, even when the type of post-translational modification molecule is unknown, it can be easily estimated from the tag candidates having high reliability obtained as described above.

即ち、第1発明に係る質量分析データ解析方法では、好ましくは、前記タグ選択ステップにおいて共通のアミノ酸配列を含むことが確認された異なるイオン系列に対する複数のタグを比較することにより、目的ペプチドの翻訳後修飾分子を推定する修飾推定ステップをさらに有し、前記データベース検索ステップにおいて前記修飾推定ステップで推定された翻訳後修飾分子を検索条件の1つとするとよい。これにより、目的ペプチドが受けている翻訳後修飾の種類等が不明であっても、目的ペプチドを同定することが可能となる。   That is, in the mass spectrometric data analysis method according to the first aspect of the invention, it is preferable that the target peptide is translated by comparing a plurality of tags for different ion series confirmed to contain a common amino acid sequence in the tag selection step. A modification estimation step for estimating a post-modification molecule may be further included, and the post-translational modification molecule estimated in the modification estimation step in the database search step may be one of the search conditions. This makes it possible to identify the target peptide even if the type of post-translational modification received by the target peptide is unknown.

なお、シーケンスタグサーチを実行するデータベース検索手段としては、前述した「Mascot Sequence Query」のような既知のソフトウエアを利用することが可能である。   As a database search means for executing a sequence tag search, known software such as “Mascot Sequence Query” described above can be used.

第1発明に係る質量分析データ解析方法及び第2発明に係る質量分析データ解析装置によれば、翻訳後修飾を受けたペプチド由来の複雑なMSnスペクトルから信頼性の高いシーケンスタグを求めることができるので、従来のデータベース検索を利用しながら、従来は困難であった、翻訳後修飾されたペプチドのアミノ酸配列と修飾部位の同定とを高い信頼性を以て行うことができる。 According to the mass spectrometry data analysis method according to the first invention and the mass spectrometry data analysis apparatus according to the second invention, a highly reliable sequence tag can be obtained from a complex MS n spectrum derived from a peptide subjected to post-translational modification. As a result, it is possible to identify the amino acid sequence of the post-translationally modified peptide and the modified site with high reliability while using a conventional database search.

本発明に係る質量分析データ解析装置を含むペプチド解析システムの一実施例の全体構成図。BRIEF DESCRIPTION OF THE DRAWINGS The whole block diagram of one Example of the peptide analysis system containing the mass spectrometry data analyzer which concerns on this invention. 本実施例のペプチド解析システムにおいて実施されるデータ解析処理手順の一例を示すフローチャート。The flowchart which shows an example of the data analysis process procedure implemented in the peptide analysis system of a present Example. アクリルアミド標識されたヒトトランスフェリンの二分枝糖鎖結合糖ペプチドから実測により得られた1価のHexNAc付加ペプチドイオン(m/z 1694)の擬似MS3スペクトルを示す図。It shows a pseudo MS 3 spectra of acrylamide labeled monovalent HexNAc additional peptide ions obtained by actual measurement from two-branched sugar chain binding glycopeptides of human transferrin (m / z 1694). 図3の擬似MS3スペクトル上のイオン強度が高いピークを起点としてデノボシーケシングを実行してアミノ酸配列を推定した結果を示す図。Figure pseudo MS 3 ionic strength on the spectrum of Figure 3 is running de novo sequencer sequencing starting high peak shows the result of estimating the amino acid sequence. シーケンスタグ(EA[IL][PV|VP]、開始m/z 741.4、終了m/z 1250.6)を用いてシーケンスタグサーチを実施した結果を示す図。The figure which shows the result of having performed the sequence tag search using the sequence tag (EA [IL] [PV | VP], start m / z 741.4, end m / z 1250.6). ヒトトランスフェリン由来のペプチドイオンをプリカーサイオンとするMS2スペクトルに対しMS/MSイオンサーチ法によるデータベース検索した結果を示す図。It shows the results of a database search by MS / MS ion search method to MS 2 spectra of peptide ions derived from the human transferrin and precursor ion. 図6の検索の元となったMS3スペクトルとその帰属結果を示す図。It shows the assignment result and the search for the original 6 since MS 3 spectrum. 図7に示したMS3スペクトルとヒトトランスフェリンペプチドの理論プロダクトイオンとの一致度を示す図。FIG. 8 is a diagram showing the degree of agreement between the MS 3 spectrum shown in FIG. 7 and the theoretical product ion of human transferrin peptide.

以下、本発明に係る質量分析データ解析装置を含むペプチド解析システムの一実施例について、添付図面を参照して説明する。図1は本実施例のペプチド解析システムの全体構成図である。   Hereinafter, an embodiment of a peptide analysis system including a mass spectrometry data analysis apparatus according to the present invention will be described with reference to the accompanying drawings. FIG. 1 is an overall configuration diagram of the peptide analysis system of this example.

本実施例のペプチド解析システムは、大別して、質量分析部1と、コンピュータを中心に構成される制御・処理部2と、から成る。質量分析部1はマトリクス支援レーザ脱離イオン化四重極イオントラップ飛行時間型質量分析装置(MALDI−QIT−TOFMS)であり、被検試料中の分子や原子をイオン化するMALDI法によるイオン化部10と、発生したイオンを一時的に捕捉し、質量電荷比m/zに応じたイオンの選別とCIDによるイオンの開裂とを実行可能な3次元四重極型のイオントラップ11と、イオントラップ11から出射された各種イオンを質量電荷比に応じて分離して検出する飛行時間型質量分析器12と、を備える。飛行時間型質量分析器12は、リフレクトロン電極により発生する電場によりイオンを折返し飛行させる飛行空間13と、該飛行空間13を飛行する間に質量電荷比に応じて時間的に分離されたイオンを順次検出するイオン検出器14と、を含む。   The peptide analysis system according to the present embodiment is roughly divided into a mass analysis unit 1 and a control / processing unit 2 configured mainly by a computer. The mass spectrometer 1 is a matrix-assisted laser desorption ionization quadrupole ion trap time-of-flight mass spectrometer (MALDI-QIT-TOFMS). A three-dimensional quadrupole ion trap 11 capable of temporarily capturing generated ions and performing ion selection according to the mass-to-charge ratio m / z and ion cleavage by CID; A time-of-flight mass analyzer 12 that separates and detects the various emitted ions according to the mass-to-charge ratio. The time-of-flight mass analyzer 12 is a flight space 13 in which ions are turned back by an electric field generated by a reflectron electrode, and ions temporally separated according to a mass-to-charge ratio while flying in the flight space 13. And an ion detector 14 for detecting sequentially.

制御・処理部2は、質量分析部1の各部を制御する分析制御部28、イオン検出器14から得られる検出信号をデジタル化して内部の記憶部に格納するデータ収集部21、収集されたデータからMSスペクトルやMSnスペクトルを作成するスペクトル解析部22、MSnスペクトルデータに対してデノボシーケンシングを実行してタグ候補である部分的なアミノ酸配列を求めるタグ候補抽出部23、同一MSnスペクトルを基に得られた複数のタグ候補に基づいて信頼性の高いシーケンスタグを生成するタグ選択部24、信頼性の高いタグに基づいて翻訳後修飾分子等を求める修飾物判定部25、シーケンスタグや修飾分子の種類などを検索条件に設定してデータベース検索により被検試料中の目的ペプチドを同定するシーケンスタグサーチ実行部26、及び、タンパク質(ペプチド)のアミノ酸配列を推定するための同定用情報が予め登録された同定用データベース(DB)27、を備える。シーケンスタグサーチ実行部26の機能は、例えば上述した「Mascot Sequence Query」などの既存の検索エンジンソフトウエアを利用することができる。 The control / processing unit 2 includes an analysis control unit 28 that controls each unit of the mass analysis unit 1, a data collection unit 21 that digitizes detection signals obtained from the ion detector 14 and stores them in an internal storage unit, and collected data Analysis unit 22 for generating MS spectrum and MS n spectrum from the same, tag candidate extraction unit 23 for performing partial de novo sequencing on MS n spectrum data to obtain partial amino acid sequences as tag candidates, identical MS n spectrum A tag selection unit 24 that generates a highly reliable sequence tag based on a plurality of tag candidates obtained based on the tag, a modified product determination unit 25 that obtains a post-translationally modified molecule based on a highly reliable tag, a sequence tag Sequence tag search that identifies target peptides in a test sample by database search by setting search conditions such as the type of molecule or modified molecule Line unit 26, and comprises a identification database (DB) 27 which has been previously registered identification information for estimating the amino acid sequence of the protein (peptide). For the function of the sequence tag search execution unit 26, for example, existing search engine software such as “Mascot Sequence Query” described above can be used.

制御・処理部2の実体はコンピュータであって、該コンピュータにインストールされた専用の制御・処理ソフトウエアが動作することにより、前述の各種機能が達成される。制御・処理部2に接続された入力部3は具体的には、コンピュータに接続されるキーボードやマウス等のポインティングデバイスであり、ユーザが検索条件を入力設定したりスペクトル解析のために必要な各種操作を行ったりするためのものである。また、同様に制御・処理部2に接続された表示部4は具体的にはモニタディスプレイであり、検索条件入力設定画面を表示したり同定結果を表示したりするためのものである。   The entity of the control / processing unit 2 is a computer, and the above-described various functions are achieved by the operation of dedicated control / processing software installed in the computer. Specifically, the input unit 3 connected to the control / processing unit 2 is a pointing device such as a keyboard and a mouse connected to the computer, and various kinds of input necessary for the user to input and set search conditions and for spectrum analysis. It is for performing operations. Similarly, the display unit 4 connected to the control / processing unit 2 is specifically a monitor display for displaying a search condition input setting screen or displaying an identification result.

図2に示したペプチド同定の処理手順を示すフローチャートを参照して、本実施例のペプチド解析システムにおける特徴的なデータ解析処理を説明する。   A characteristic data analysis process in the peptide analysis system of the present embodiment will be described with reference to the flowchart showing the peptide identification process procedure shown in FIG.

分析者は目的とするタンパク質を適宜の酵素(例えばトリプシン酵素)により消化して、翻訳後修飾を受けたペプチド(被修飾ペプチド)を含む被検試料を調製する。分析制御部28の制御の下に、質量分析部1により上記被検試料に対するMS1分析が実行されると、スペクトル解析部22はデータ収集部21により収集されたデータに基づいてMS1スペクトルを作成する。スペクトル解析部22は、このMS1スペクトルから目的ペプチドに由来するイオンピークを抽出し、MS2分析のプリカーサイオンとして選択する(ステップS1)。 The analyst prepares a test sample containing a peptide (modified peptide) subjected to post-translational modification by digesting the target protein with an appropriate enzyme (for example, trypsin enzyme). When MS 1 analysis is performed on the test sample by the mass analysis unit 1 under the control of the analysis control unit 28, the spectrum analysis unit 22 calculates the MS 1 spectrum based on the data collected by the data collection unit 21. create. The spectrum analysis unit 22 extracts an ion peak derived from the target peptide from the MS 1 spectrum and selects it as a precursor ion for MS 2 analysis (step S1).

引き続き、分析制御部28の制御の下に質量分析部1は、被検試料に対して上記プリカーサイオンについてのMS2分析を実行する。より詳しく述べると、イオン化部10においてレーザ光の照射により被検試料から生成された各種イオンは一旦イオントラップ11に捕捉され、イオントラップ11においてプリカーサイオンの質量電荷比を持つイオンのみが選別された後にCIDによる解離が行われる。この際に、目的とする単一ペプチドのアミノ酸配列の結合が様々な部位で切れ、各種アミノ酸残基がプロダクトイオンとしてイオントラップ11に捕捉される。このプロダクトイオンはイオントラップ11から一斉に出射されて飛行時間型質量分析器12により質量分析され、データ収集部21はMS2分析により得られたデータを収集し、スペクトル解析部22は収集されたデータに基づいてMS2スペクトルを作成する(ステップS2)。 Subsequently, under the control of the analysis control unit 28, the mass analysis unit 1 performs MS 2 analysis on the precursor ion on the test sample. More specifically, various ions generated from the test sample by laser light irradiation in the ionization unit 10 are once captured by the ion trap 11, and only ions having a mass-to-charge ratio of precursor ions are selected in the ion trap 11. Later, dissociation by CID is performed. At this time, the binding of the amino acid sequence of the target single peptide is broken at various sites, and various amino acid residues are captured by the ion trap 11 as product ions. The product ions are simultaneously emitted from the ion trap 11 and subjected to mass analysis by the time-of-flight mass analyzer 12. The data collection unit 21 collects data obtained by MS 2 analysis, and the spectrum analysis unit 22 collects the data. An MS 2 spectrum is created based on the data (step S2).

なお、上記ステップS2では、MS2スペクトル上のイオンピークの中からプリカーサイオンを選択してMS3分析を実行するという操作を1又は複数回繰り返し、nが3以上のMSnスペクトルを作成してもよい。後述の処理を実行するためには、翻訳後修飾が脱離したプロダクトイオンと翻訳後修飾が脱離していないプロダクトイオンとがMSnスペクトルで観測される必要があるから、翻訳後修飾分子が脱離し易いものである場合にはn=2(ただし、後述するように実際に実行しているのはMS2分析であるが、擬似的なMS3分析であるといえる)でもよく、翻訳後修飾分子が脱離しにくいものである場合にはnを3以上にすることが望ましい。 In step S2, the operation of selecting a precursor ion from ion peaks on the MS 2 spectrum and executing MS 3 analysis is repeated one or more times to create an MS n spectrum where n is 3 or more. Also good. In order to execute the processing described later, product ions from which post-translational modifications are desorbed and product ions from which post-translational modifications are not desorbed must be observed in the MS n spectrum. If it is easy to release, it may be n = 2 (however, it is MS 2 analysis that is actually executed as described later, but it can be said that it is a pseudo MS 3 analysis). When the molecule is difficult to desorb, it is desirable that n is 3 or more.

次に、タグ候補抽出部23はMS2スペクトル(又はMSnスペクトル)においてイオン強度が比較的大きいピークを複数選出し、各ピークを起点とし低質量電荷比側に向かってデノボシーケンシングを実行する。即ち、起点となるピークから低質量電荷比側に向かって、既知のアミノ酸の質量と一致するピークを順に探索することでアミノ酸配列を推定する。そして、得られたアミノ酸配列をシーケンスタグの候補として抽出する(ステップS3)。被修飾ペプチド由来のイオンを開裂させると、MSnスペクトルには、翻訳後修飾分子が脱離したイオン系列のプロダクトイオンピークと翻訳後修飾分子が付加されているイオン系列のプロダクトイオンピークとが混在して現れるため、かなり複雑になる。そのため、後述の例で示すように、或る1つのピークを起点としてデノボシーケンシングを試みると、複数の異なるアミノ酸配列が挙げられ、複数のシーケンスタグ候補が抽出される。 Next, the tag candidate extraction unit 23 selects a plurality of peaks having relatively high ionic strength in the MS 2 spectrum (or MS n spectrum), and executes de novo sequencing from each peak toward the low mass-to-charge ratio side. . That is, the amino acid sequence is estimated by sequentially searching for a peak that matches the mass of a known amino acid from the starting peak toward the low mass to charge ratio side. Then, the obtained amino acid sequence is extracted as a sequence tag candidate (step S3). When cleaved ions derived from the modified peptide, the MS n spectrum contains a mixture of product ion peaks of the ion series from which the post-translationally modified molecule is eliminated and product ion peaks of the ion series to which the post-translationally modified molecule is added. It appears quite complicated. Therefore, as shown in an example described later, when de novo sequencing is attempted from a certain peak, a plurality of different amino acid sequences are listed, and a plurality of sequence tag candidates are extracted.

続いてタグ選択部24は、異なるピークを起点とした同一質量電荷比方向のデノボシーケンシングにより得られたシーケンスタグ候補のアミノ酸配列を比較し、共通のアミノ酸配列を有するタグを抽出する。一般的に、デノボシーケンシングの起点とされるイオン強度の大きなピークはそれぞれ異なるイオン系列(ここでは、同じb系列イオン、y系列イオンでも翻訳後修飾分子がある場合とない場合とで別の系列とする)に属するイオンピークであると考えられる。また、同一イオン系列に属するイオンピークを正確にデノボシーケンシングした場合、例えば翻訳後修飾分子ありのb系列イオンに対して得られるアミノ酸配列と翻訳後修飾分子なしのb系列イオンに対して得られるアミノ酸配列とはほぼ一致する筈である。そこで、或る程度長い(アミノ酸残基が4程度以上)アミノ酸配列が共通である部分の信頼性は高いと考えられる。そこで、最も長いアミノ酸配列が共通しているタグ候補を選択し、その共通のアミノ酸配列に基づいて検索に使用するシーケンスタグを作成する(ステップS4)。   Subsequently, the tag selection unit 24 compares the amino acid sequences of the sequence tag candidates obtained by de novo sequencing in the same mass-to-charge ratio direction starting from different peaks, and extracts tags having a common amino acid sequence. In general, the peak of high ionic strength, which is the starting point of de novo sequencing, has different ion series (here, the same b-series ion and y-series ion are different series depending on whether or not there is a post-translationally modified molecule. )). When ion peaks belonging to the same ion series are accurately de novo sequenced, for example, the amino acid sequence obtained for b-series ions with post-translational modification molecules and b-series ions without post-translational modification molecules are obtained. The amino acid sequence should be almost identical. Therefore, it is considered that the reliability of the portion having a certain amino acid sequence in common (amino acid residues of about 4 or more) is high. Therefore, a tag candidate having the longest amino acid sequence in common is selected, and a sequence tag used for the search is created based on the common amino acid sequence (step S4).

ステップS4で選択されたタグ候補における共通のアミノ酸配列の開始質量電荷比の差及び終了質量電荷比の差は、翻訳後修飾分子の質量である可能性が高い。そこで、修飾物判定部25は上記差から翻訳後修飾分子の質量を求め、これに対応した翻訳後修飾分子の種類を求める(ステップS5)。   The difference in the start mass-to-charge ratio and the end mass-to-charge ratio of the common amino acid sequences in the tag candidates selected in step S4 is likely to be the mass of the post-translationally modified molecule. Therefore, the modified product determination unit 25 obtains the mass of the post-translational modification molecule from the above difference and obtains the type of post-translational modification molecule corresponding to this (step S5).

次に、シーケンスタグサーチ実行部26は、ステップS4で得られた信頼性の高いシーケンスタグとステップS5で求まった翻訳後修飾分子の種類とに基づき検索条件を設定する(ステップS6)。そして該シーケンスタグで示されている情報(アミノ酸配列、開始質量電荷比、終了質量電荷比)と同定用データベース27に登録されているタンパク質のアミノ酸配列や質量などの情報とを照合するシーケンスタグサーチを実行することにより、目的のペプチドを同定する。例えばシーケンスタグサーチ実行部26として上述した「Mascot Sequence Query」を用いる場合、検索によりヒットしたペプチドにはその検索の信頼度を表すスコアや期待値などの信頼度指標値が付される。そこで、複数のペプチドがヒットした場合でも或る1つのペプチドの信頼度指標値が他のペプチドの信頼度指標値に比べて有意に高い場合には、そのペプチドのみを同定したペプチドとして挙げればよい。一方、唯一のペプチドを同定できない場合には、可能性のある複数のペプチドを上記信頼度指標値とともに候補として選出すればよい。そうして同定したペプチド又はペプチド候補を表示部4に表示して分析者に知らせる(ステップS7)。   Next, the sequence tag search execution unit 26 sets search conditions based on the highly reliable sequence tag obtained in step S4 and the type of post-translationally modified molecule obtained in step S5 (step S6). A sequence tag search for collating the information (amino acid sequence, starting mass-to-charge ratio, ending mass-to-charge ratio) indicated by the sequence tag with information such as the amino acid sequence and mass of the protein registered in the identification database 27 To identify the peptide of interest. For example, when the above-described “Mascot Sequence Query” is used as the sequence tag search execution unit 26, a confidence index value such as a score or an expected value indicating the reliability of the search is attached to the peptide hit by the search. Therefore, even when a plurality of peptides are hit, if the reliability index value of one peptide is significantly higher than the reliability index values of other peptides, only that peptide may be listed as an identified peptide. . On the other hand, if a unique peptide cannot be identified, a plurality of possible peptides may be selected as candidates together with the reliability index value. The peptide or peptide candidate thus identified is displayed on the display unit 4 to inform the analyst (step S7).

シーケンスタグサーチでは、同定用データベース27に目的のタンパク質が登録されており、且つ与えられるシーケンスタグが正確であれば、正解であるペプチドが含まれる検索結果が導出される。即ち、同定用データベース27に正解があるにも拘わらずそれが含まれない検索結果が得られるということは起こらない。上述した手順によって得られるシーケンスタグの信頼性は高いため、これに基づいて求まるペプチド同定結果も信頼性の高いものとなることが保証される。   In the sequence tag search, if the target protein is registered in the identification database 27 and the given sequence tag is accurate, a search result including a correct peptide is derived. That is, it does not occur that a search result that does not include a correct answer in the identification database 27 is obtained. Since the sequence tag obtained by the above-described procedure is highly reliable, it is guaranteed that the peptide identification result obtained based on the sequence tag is also highly reliable.

上述の特徴的な質量分析データ解析方法によるペプチド同定の具体例を説明する。   A specific example of peptide identification by the above-described characteristic mass spectrometry data analysis method will be described.

図3はアクリルアミド標識されたヒトトランスフェリン(Human Transferrin)の二分岐糖鎖結合糖ペプチドから得られた1価のHexNAc付加ペプチドイオン(m/z 1694)の擬似MS3スペクトルである。N-結合型糖ペプチドは糖鎖が脱離し易い。このため、糖ペプチドをMS1分析すると、MS2分析対象となる糖ペプチドイオン(又はシアル酸脱離糖ペプチドイオン)以外に、全ての糖鎖が脱離したペプチドイオン、糖HexNAcの環開裂により生じた0,2X(83Da)付加ペプチドイオン、及びHexNAc付加ペプチドイオンに相当する3つのピーク(トリプレットピーク)がMS1スペクトル上に観測されることがある。そこで、MS1スペクトルに現れるトリプレットピークが、MS2分析対象イオンをMS2分析して得られたMS2スペクトル上で観測されたトリプレットピークと同じ質量電荷比を持つ場合には、このトリプレットピークのいずれか1個以上を擬似MS3分析のプリカーサイオンとして選定し、該プリカーサイオンについてのMS2分析を実行する。これにより、実際にはMS2分析を行いながら、擬似MS3スペクトルを取得することができる。 FIG. 3 is a pseudo MS 3 spectrum of a monovalent HexNAc-added peptide ion (m / z 1694) obtained from a bi-branched sugar chain-linked glycopeptide of acrylamide-labeled human transferrin. In the N-linked glycopeptide, sugar chains are easily detached. For this reason, when MS 1 analysis of glycopeptides is performed, by ring cleavage of the peptide HexNAc, which is a peptide ion from which all sugar chains have been removed, in addition to the glycopeptide ions (or sialic acid-desorbed glycopeptide ions) to be analyzed by MS 2 The resulting 0,2 X (83 Da) -added peptide ion and three peaks (triplet peaks) corresponding to the HexNAc-added peptide ion may be observed on the MS 1 spectrum. Therefore, MS triplet peaks appearing in 1 spectrum, when the MS 2 analyte ions having the same mass-to-charge ratio and the observed triplet peaks on MS 2 spectra obtained by MS 2 analysis of the triplet peaks Any one or more are selected as precursor ions for pseudo MS 3 analysis, and MS 2 analysis is performed on the precursor ions. Thereby, a pseudo MS 3 spectrum can be acquired while actually performing MS 2 analysis.

なお、上述のようにMS1スペクトル上のトリプレットピークとMS2スペクトル上のトリプレットピークとの質量電荷比を比較する際に、トリプレットイオンの価数が異なる場合には、価数が同一になるように質量電荷比を補正した上で質量電荷比を比較する必要がある。特許文献1に記載されているように、N末端にグルタミン、グルタミン酸、カルバミドメチル化システインなど特定のアミノ酸残基が位置するN-結合型糖ペプチドでは、CIDの過程でN末端の特定アミノ酸残基の環化が優先的に生じ、そのためにNH3やH2Oのニュートラルロスが発生し易い。こうした場合には、MS2スペクトル上のイオンピークは上記ニュートラルロスによる質量シフトが生じている可能性があるから、そうした質量シフトが検出された場合には、MS2スペクトル上のイオンピークについて質量シフトを補正した上でトリプレットピーク同士の質量電荷比を比較する。 As described above, when comparing the mass-to-charge ratio between the triplet peak on the MS 1 spectrum and the triplet peak on the MS 2 spectrum, the valences are the same if the valences of the triplet ions are different. It is necessary to compare the mass to charge ratio after correcting the mass to charge ratio. As described in Patent Document 1, in an N-linked glycopeptide in which a specific amino acid residue such as glutamine, glutamic acid, carbamidomethylated cysteine or the like is located at the N-terminus, the N-terminal specific amino acid residue in the process of CID Is preferentially generated, and therefore, neutral loss of NH 3 and H 2 O is likely to occur. In such a case, the ion peak on the MS 2 spectrum may have a mass shift due to the above neutral loss. Therefore, when such a mass shift is detected, the mass shift is performed on the ion peak on the MS 2 spectrum. The mass-to-charge ratio between the triplet peaks is compared.

図3に示した擬似MS3スペクトルには、HexNAcが付加したb系列イオン、HexNAcが付加したy系列イオンともに、HexNAcのニュートラルロスにより生じたイオンピークがプロダクトイオンとして現れている。この擬似MS3スペクトルから得られたピークリストに対し、従来のMS/MSイオンサーチ法を用いてデータベース検索を試みたところ、HexNAc付加ペプチドに対する相同性は得られたものの、ペプチド及び修飾部位を同定できるほどの高いスコアは得られなかった(具体的にはスコア:20、期待値(Expect):0.86)。 In the pseudo MS 3 spectrum shown in FIG. 3, an ion peak caused by the neutral loss of HexNAc appears as a product ion for both the b-series ion added with HexNAc and the y-series ion added with HexNAc. A database search using the conventional MS / MS ion search method was performed on the peak list obtained from this pseudo MS 3 spectrum, but homology to the HexNAc-added peptide was obtained, but the peptide and modification site were identified. A score as high as possible could not be obtained (specifically, score: 20, Expected value: 0.86).

図4は、図3に示した擬似MS3スペクトルに対して上述したステップS3の処理、つまりデノボシーケシングによるアミノ酸配列推定を実行した結果を示す図である。擬似MS3スペクトル中の最大強度のイオンピーク(m/z 1491.1)を起点とした場合には適切なシーケシングができなかったが、2番目に強い強度のイオンピーク(m/z 1250.6)を起点とすると図4(a)に示すような5種類のアミノ酸配列推定結果が得られた。これらが、m/z 1250.6であるイオンピークを起点として得られたタグ候補である。一方、3番目に強い強度のイオンピーク(m/z 1047.4)を起点とすると図4(b)に示すような5種類のアミノ酸配列推定結果が得られた。これらが、m/z 1047.4であるイオンピークを起点として得られたタグ候補である。この図4(a)と(b)の両方に共通するアミノ酸配列を探索すると、アミノ酸配列EA「I/L」「PV|VP」が見いだされた(図4中に1点鎖線で囲んだアミノ酸配列)。共通のアミノ酸配列のアミノ酸残基数は4以上であり、その信頼性は高いと考えられる。そこで、そのアミノ酸配列とHexNAc付加ペプチドのイオン系列における該アミノ酸配列の両端の質量電荷比から、シーケンスタグ(アミノ酸配列:EA[IL][PV|VP]、開始質量電荷比 741.4、終了質量電荷比 1250.6)を作成する。 FIG. 4 is a diagram illustrating a result of performing the above-described processing of step S3 on the pseudo MS 3 spectrum illustrated in FIG. 3, that is, the amino acid sequence estimation by de novo sequencing. When the maximum intensity ion peak (m / z 1491.1) in the pseudo MS 3 spectrum was used as the starting point, proper sequencing was not possible, but the second strongest ion peak (m / z 1250.6) was used as the starting point. Then, five types of amino acid sequence estimation results as shown in FIG. 4 (a) were obtained. These are tag candidates obtained starting from the ion peak at m / z 1250.6. On the other hand, when the ion peak with the third strongest intensity (m / z 1047.4) is used as the starting point, five types of amino acid sequence estimation results as shown in FIG. 4B were obtained. These are tag candidates obtained starting from an ion peak at m / z 1047.4. When an amino acid sequence common to both FIG. 4 (a) and FIG. 4 (b) was searched, amino acid sequences EA “I / L” and “PV | VP” were found (in FIG. 4, amino acids surrounded by a one-dot chain line). Array). The number of amino acid residues in the common amino acid sequence is 4 or more, and its reliability is considered high. Therefore, from the mass-to-charge ratio of both ends of the amino acid sequence and the HexNAc-added peptide ion sequence, a sequence tag (amino acid sequence: EA [IL] [PV | VP], start mass-to-charge ratio 741.4, end mass-to-charge ratio) 1250.6).

また、この共通のアミノ酸配列の開始質量電荷比及び終了質量電荷比を比較すると、HexNAc(203Da)に相当する差があることが分かる。これから、解析中である擬似MS3スペクトルはHexNAcによる修飾を受けたペプチドのスペクトルである蓋然性が高いことが確認できる。 Moreover, when the start mass-to-charge ratio and end mass-to-charge ratio of this common amino acid sequence are compared, it can be seen that there is a difference corresponding to HexNAc (203 Da). From this, it can be confirmed that the pseudo MS 3 spectrum being analyzed is highly likely to be a spectrum of a peptide modified with HexNAc.

上記のシーケンスタグと翻訳後修飾分子情報とを検索条件に設定して「Mascot Sequence Query」によるシーケンスタグサーチを実施した結果が図5である。図5に示すように、目的とするペプチドとHexNAc修飾部位とが高いスコア(スコア:62)及び低い期待値(Expect:8.3×10-6)で同定されている。これは上述した従来法によるスコアや期待値に比べて格段によい結果であり、本発明に係るデータ解析方法が翻訳後修飾を受けたペプチドの同定に有用であることが確認できる。 FIG. 5 shows the result of performing a sequence tag search by “Mascot Sequence Query” with the sequence tag and post-translationally modified molecule information set as search conditions. As shown in FIG. 5, the target peptide and the HexNAc modification site are identified with a high score (score: 62) and a low expected value (Expect: 8.3 × 10 −6 ). This is a much better result than the score and expected value obtained by the conventional method described above, and it can be confirmed that the data analysis method according to the present invention is useful for identifying a peptide having undergone post-translational modification.

なお、上記実施例では目的ペプチド由来の1つのMSnスペクトル(上記例ではMS3擬似スペクトル)から得られるデノボシーケンシング結果に基づいて信頼性の高いシーケンスタグを作成したが、1つの目的ペプチドから複数のMSnスペクトルが得られる場合には、その複数のMSnスペクトル)から得られるデノボシーケンシング結果に基づいて信頼性の高いシーケンスタグを作成してもよい。 In the above example, a highly reliable sequence tag was created based on the de novo sequencing result obtained from one MS n spectrum derived from the target peptide (MS 3 pseudo spectrum in the above example). When a plurality of MS n spectra are obtained, a highly reliable sequence tag may be created based on a de novo sequencing result obtained from the plurality of MS n spectra).

また、ピーク強度や質量差の精度などの情報に基づいてシーケンスタグの信頼性を定量化してもよい。それにより、例えば共通のアミノ酸配列が複数種類存在した場合に、定量化されたシーケンスタグの信頼性指標値に基づいてシーケンスタグサーチに用いるタグを決定することができる。   Further, the reliability of the sequence tag may be quantified based on information such as peak intensity and mass difference accuracy. Thereby, for example, when there are a plurality of types of common amino acid sequences, the tag used for the sequence tag search can be determined based on the quantified reliability index value of the sequence tag.

また、上記実施例は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。   Further, the above-described embodiment is merely an example of the present invention, and it is obvious that the present invention is encompassed in the scope of the claims of the present application even if appropriate modifications, corrections, additions, etc. are made within the scope of the present invention.

1…質量分析部
10…イオン化部
11…イオントラップ
12…飛行時間型質量分析器
13…飛行空間
14…イオン検出器
2…制御・処理部
20…分析制御部
21…データ収集部
22…スペクトル解析部
23…タグ候補抽出部
24…タグ選択部
25…修飾物判定部
26…シーケンスタグサーチ実行部
27…同定用データベース
28…分析制御部
3…入力部
4…表示部
DESCRIPTION OF SYMBOLS 1 ... Mass analysis part 10 ... Ionization part 11 ... Ion trap 12 ... Time-of-flight mass analyzer 13 ... Flight space 14 ... Ion detector 2 ... Control and processing part 20 ... Analysis control part 21 ... Data collection part 22 ... Spectral analysis Unit 23 ... Tag candidate extraction unit 24 ... Tag selection unit 25 ... Modified product determination unit 26 ... Sequence tag search execution unit 27 ... Identification database 28 ... Analysis control unit 3 ... Input unit 4 ... Display unit

Claims (4)

被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料に含まれる翻訳後修飾を受けたペプチドを同定する質量分析データ解析方法であって、
a)目的ペプチド由来のイオンをプリカーサイオンとしたMSn分析(nは2以上の整数)を実行することで得られたMSnスペクトルに対して、複数の異なるイオンピークを起点として同一質量電荷比軸方向にデノボシーケンシングを実行し、異なる複数のイオン系列についての部分的なアミノ酸配列をそれぞれ求めてタグ候補とするタグ候補抽出ステップと、
b)前記タグ候補抽出ステップにおいて得られたイオン系列毎の1又は複数のタグ候補について、異なるイオン系列に対して同一質量電荷比軸方向に共通のアミノ酸配列を含むタグを見いだして、信頼性の高いタグとしてシーケンスタグを生成するタグ選択ステップと、
c)タンパク質のアミノ酸配列情報が格納されたデータベースを用い、前記タグ選択ステップにおいて生成されたシーケンスタグを検索条件としたシーケンスタグサーチを実行するデータベース検索ステップと、
を有することを特徴とする質量分析データ解析方法。
A mass spectrometry data analysis method for identifying a peptide subjected to post-translational modification contained in a test sample using data collected by performing mass spectrometry on the test sample,
a) Same mass-to-charge ratio starting from multiple different ion peaks for MS n spectra obtained by performing MS n analysis (n is an integer of 2 or more) using ions derived from the target peptide as precursor ions A tag candidate extraction step in which de novo sequencing is performed in the axial direction, and partial amino acid sequences for different ion series are respectively determined as tag candidates;
b) For one or a plurality of tag candidates for each ion series obtained in the tag candidate extraction step, a tag including a common amino acid sequence in the same mass-to-charge ratio axis direction with respect to different ion series is found. A tag selection step for generating a sequence tag as a high tag;
c) a database search step for performing a sequence tag search using a database in which amino acid sequence information of proteins is stored and using the sequence tag generated in the tag selection step as a search condition;
A method for analyzing mass spectrometry data, comprising:
請求項1に記載の質量分析データ解析方法であって、
前記タグ選択ステップにおいて共通のアミノ酸配列を含むことが確認された異なるイオン系列に対する複数のタグを比較することにより、目的ペプチドの翻訳後修飾分子を推定する修飾推定ステップをさらに有し、前記データベース検索ステップにおいて前記修飾推定ステップで推定された翻訳後修飾分子を検索条件の1つとすることを特徴とする質量分析データ解析方法。
The mass spectrometry data analysis method according to claim 1,
The database search further comprises a modification estimation step of estimating post-translational modified molecules of the target peptide by comparing a plurality of tags for different ion series confirmed to contain a common amino acid sequence in the tag selection step In the step, the post-translationally modified molecule estimated in the modification estimation step is used as one of the search conditions.
被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料に含まれる翻訳後修飾を受けたペプチドを同定する質量分析データ解析装置において、
a)目的ペプチド由来のイオンをプリカーサイオンとしたMSn分析(nは2以上の整数)を実行することで得られたMSnスペクトルに対して、複数の異なるイオンピークを起点として同一質量電荷比軸方向にデノボシーケンシングを実行し、異なる複数のイオン系列についての部分的なアミノ酸配列をそれぞれ求めてタグ候補とするタグ候補抽出手段と、
b)前記タグ候補抽出手段により得られたイオン系列毎の1又は複数のタグ候補について、異なるイオン系列に対して同一質量電荷比軸方向に共通のアミノ酸配列を含むタグを見いだして、信頼性の高いタグとしてシーケンスタグを生成するタグ選択手段と、
c)タンパク質のアミノ酸配列情報が格納されたデータベースと、
d)前記データベースを用い前記タグ選択手段により生成されたシーケンスタグを検索条件としたシーケンスタグサーチを実行するデータベース検索手段と、
を備えることを特徴とする質量分析データ解析装置。
In a mass spectrometry data analyzer for identifying a peptide subjected to post-translational modification contained in the test sample, using data collected by performing mass spectrometry on the test sample,
a) Same mass-to-charge ratio starting from multiple different ion peaks for MS n spectra obtained by performing MS n analysis (n is an integer of 2 or more) using ions derived from the target peptide as precursor ions Tag candidate extraction means for performing de novo sequencing in the axial direction and obtaining partial amino acid sequences for different ion sequences as tag candidates,
b) For one or a plurality of tag candidates for each ion series obtained by the tag candidate extraction means, a tag including a common amino acid sequence in the same mass-to-charge ratio axis direction with respect to different ion series is found and reliable. Tag selection means for generating a sequence tag as a high tag,
c) a database storing protein amino acid sequence information;
d) database search means for performing a sequence tag search using the database and the sequence tag generated by the tag selection means as a search condition;
A mass spectrometry data analysis device comprising:
請求項3に記載の質量分析データ解析装置であって、
前記タグ選択手段により共通のアミノ酸配列を含むことが確認された異なるイオン系列に対する複数のタグを比較することによって、目的ペプチドの翻訳後修飾分子を推定する修飾推定手段をさらに備え、前記データベース検索手段は前記修飾推定手段により推定された翻訳後修飾分子を検索条件の1つとすることを特徴とする質量分析データ解析装置。
The mass spectrometry data analysis device according to claim 3,
The database search means further comprises modification estimation means for estimating post-translationally modified molecules of the target peptide by comparing a plurality of tags for different ion series confirmed to contain a common amino acid sequence by the tag selection means. Is a post-translationally modified molecule estimated by the modification estimating means as one of the search conditions.
JP2014117016A 2014-06-05 2014-06-05 Mass analysis data analysis method and device Pending JP2015230262A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014117016A JP2015230262A (en) 2014-06-05 2014-06-05 Mass analysis data analysis method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014117016A JP2015230262A (en) 2014-06-05 2014-06-05 Mass analysis data analysis method and device

Publications (1)

Publication Number Publication Date
JP2015230262A true JP2015230262A (en) 2015-12-21

Family

ID=54887095

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014117016A Pending JP2015230262A (en) 2014-06-05 2014-06-05 Mass analysis data analysis method and device

Country Status (1)

Country Link
JP (1) JP2015230262A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106770605A (en) * 2016-11-14 2017-05-31 中国科学院计算技术研究所 De novo sequencing method and device
WO2018042605A1 (en) * 2016-09-01 2018-03-08 株式会社島津製作所 Mass spectrometry data processing device
CN116465992A (en) * 2023-04-19 2023-07-21 上海快序生物科技有限公司 Method for detecting amino acid sequence at tail end of protein

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018042605A1 (en) * 2016-09-01 2018-03-08 株式会社島津製作所 Mass spectrometry data processing device
JPWO2018042605A1 (en) * 2016-09-01 2019-02-28 株式会社島津製作所 Mass spectrometry data processor
CN106770605A (en) * 2016-11-14 2017-05-31 中国科学院计算技术研究所 De novo sequencing method and device
CN106770605B (en) * 2016-11-14 2019-03-26 中国科学院计算技术研究所 De novo sequencing method and device
CN116465992A (en) * 2023-04-19 2023-07-21 上海快序生物科技有限公司 Method for detecting amino acid sequence at tail end of protein
CN116465992B (en) * 2023-04-19 2024-02-09 上海快序生物科技有限公司 Method for detecting amino acid sequence at tail end of protein

Similar Documents

Publication Publication Date Title
US6917037B2 (en) Mass spectrum analyzing system
US20080001079A1 (en) Analyzing mass spectral data
JP5299060B2 (en) Glycopeptide structure analysis method and apparatus
US10796784B2 (en) Mass spectrometric data analyzing apparatus and analyzing method
CN112824894B (en) Glycopeptide analyzer
JP2012220365A (en) Sugar peptide analysis method and analysis apparatus
JP5655758B2 (en) Mass spectrometer
JP2015230262A (en) Mass analysis data analysis method and device
JP5776443B2 (en) Modified protein identification method and identification apparatus using mass spectrometry
US9702882B2 (en) Method and system for analyzing mass spectrometry data
JP2014215172A (en) Mass analysis data analyzer for peptide structural analysis
WO2017047580A1 (en) Peptide assignment method and peptide assignment system
JP6079587B2 (en) Glycopeptide analyzer
JP5696592B2 (en) Mass spectrometry data analysis method and analysis apparatus
JP2015230261A (en) Sugar peptide analysis method and analysis device
JP2007010509A (en) Analysis supporting system and method
JP5983371B2 (en) Peptide structure analysis method and apparatus
JP2008039608A (en) Mass spectrometry system
JP6003842B2 (en) Protein identification method and identification apparatus
JP6996451B2 (en) Analysis support device and analysis support method
JP2017096668A (en) Identification support method and identification support device for living matter derived substance
Li et al. Informatics for Mass Spectrometry-Based Protein Characterization
JP6962273B2 (en) A method for creating a spectrum library for identifying an endogenous peptide, a method for identifying an endogenous peptide, and a device for identifying an endogenous peptide.
US20160275237A1 (en) Amino acid sequence analyzing method and system
JP2009168695A (en) Three-dimensional structure prediction method, three-dimensional structure prediction program, and mass spectroscope