JP2005257483A - Differential method of analyzing proteome - Google Patents

Differential method of analyzing proteome Download PDF

Info

Publication number
JP2005257483A
JP2005257483A JP2004069833A JP2004069833A JP2005257483A JP 2005257483 A JP2005257483 A JP 2005257483A JP 2004069833 A JP2004069833 A JP 2004069833A JP 2004069833 A JP2004069833 A JP 2004069833A JP 2005257483 A JP2005257483 A JP 2005257483A
Authority
JP
Japan
Prior art keywords
peak
peaks
effective
molecular weight
retention time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004069833A
Other languages
Japanese (ja)
Inventor
Chihiro Higuchi
千洋 樋口
Toshiyuki Mikami
寿幸 三上
Jun Sakai
順 左海
Shinichi Kojima
深一 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sumitomo Pharmaceuticals Co Ltd
Sumitomo Chemical Co Ltd
Original Assignee
Sumitomo Pharmaceuticals Co Ltd
Sumitomo Chemical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sumitomo Pharmaceuticals Co Ltd, Sumitomo Chemical Co Ltd filed Critical Sumitomo Pharmaceuticals Co Ltd
Priority to JP2004069833A priority Critical patent/JP2005257483A/en
Publication of JP2005257483A publication Critical patent/JP2005257483A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To directly analyze the measured result of the LC/MS analysis of a mixture material, obtained by proteome experiment or the like or a protein sample which is low in purity or the like. <P>SOLUTION: The differential method of analyzing proteome includes a process (1) Z-SCORE (Zscore) calculated from the peak of the mass analysis data of liquid chromatograph purified protein or the average value is set as a criterion to select an effective peak and a process (2) of intensifying the effective peak value selected in the process (1) to a range divided by the constant range of a molecular weight and the constant range of a holding time, to make it display the same as an image or as a numerical value. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、プロテオームのディファレンシャル解析において、液体クロマトグラフ精製蛋白の質量分析で検出された測定結果について、統計手法を用いることで有効なピーク値のみを選抜し、定性的または定量的な変化を検出可能とする方法、装置およびプログラムに関する。
詳しくは、液体クロマトグラフ精製蛋白の質量分析データの全ピークからZスコアを判定基準として有効ピークを選別し、分子量と保持時間を軸にして区分けして先に選別したピーク値を集約させて目的のペプチドを同定する方法に関する。
In the differential analysis of the proteome, the present invention selects only effective peak values by using a statistical method and detects qualitative or quantitative changes in the measurement results detected by mass spectrometry of liquid chromatographed proteins. The present invention relates to a method, an apparatus, and a program that can be used.
Specifically, effective peaks are selected from all peaks in the mass spectrometry data of liquid chromatograph purified protein using the Z score as a criterion, and the peak values selected earlier are aggregated by dividing them by molecular weight and retention time. The present invention relates to a method for identifying the peptide.

ゲノムの遺伝子が産生するタンパク質の完全なセットで、生体内で機能するタンパク質の総称をプロテオームと称している。
プロテオーム研究は、ゲノム情報とそれによって作られるタンパク質の関連を生命活動に照らし合わせて包括的に行う研究で、具体的には、発見された遺伝子の機能解析、作られるタンパク質の調節機構の解析、タンパク質同士間の相互作用の研究、病気・病態とタンパク質の働きの関連性などの解明が課題とされている。
なかでも、2以上の試料間で発現が変化している蛋白質を見つけるディファレンシャル解析は、数千の蛋白質から原因遺伝子を同定することが容易になり、創薬の標的として適当な分子を選定するターゲットバリデーションの分野において有用な探索技術として注目されている。
ディファレンシャル解析には例えば、同位体ラベリング法、サブトラクティブ法などが挙げられ、例えば二次元電気泳動法や質量分析法(以下MSと略) 、液体クロマトグラフ精製蛋白の質量分析(以下LC/MSと略)などの測定結果を用いて解析されている。特にLC/MS解析は高度に精製された蛋白質資料を液体クロマトグラフでさらに精製し、資料の分子量を同定する優れた技術である
A complete set of proteins produced by genomic genes, the generic term for proteins that function in vivo is called the proteome.
Proteome research is a comprehensive study of the relationship between genomic information and the protein produced by it, in light of life activity. Specifically, it analyzes the function of the discovered gene, analyzes the regulatory mechanism of the produced protein, Research on the interaction between proteins and elucidation of the relationship between diseases and pathological conditions and the function of proteins are the issues.
Among these, differential analysis that finds proteins whose expression changes between two or more samples makes it easy to identify the causative gene from thousands of proteins, and targets that select appropriate molecules as targets for drug discovery It is attracting attention as a useful search technique in the field of validation.
Examples of differential analysis include isotope labeling and subtractive methods, such as two-dimensional electrophoresis and mass spectrometry (hereinafter abbreviated as MS), mass spectrometry (hereinafter referred to as LC / MS) of liquid chromatographed proteins. It is analyzed using measurement results such as (omitted). In particular, LC / MS analysis is an excellent technique for further purifying highly purified protein materials by liquid chromatography and identifying the molecular weight of the materials.

Washbum P. M. et al., Anal. chem. 2002, 74, 1650-1657Washbum P. M. et al., Anal. Chem. 2002, 74, 1650-1657 Chelius D. et al., J. of Proteome Research 2002, 1, 317-323Chelius D. et al., J. of Proteome Research 2002, 1, 317-323

LC/MS解析は分離精製度が極めて高い蛋白質試料の分析においては有用であるが、プロテオーム実験等で得られた混合物を資料として解析すると、数多くのペプチドがピークとして出現し、それ以上のベースノイズが出現するため、標準で機器に提供されているソフトウェアでは、視覚化による個々のペプチドの同定は非常に困難であった。
先述の問題に加え、LC/MS測定結果では個々のピークは非常にシャープであるため、二次元電気泳動法などによるプロテオームのディファレンシャル解析は単純な引き算で処理では困難であった。
また、蛋白質試料の分離精製度を高めるためには、多くの時間と経費を費やす必要があるため、粗精製試料を容易に分析しかつ、精度の高い解析結果が得られることが望まれている。
LC / MS analysis is useful for the analysis of protein samples with extremely high levels of separation and purification. However, when a mixture obtained in a proteome experiment or the like is analyzed as data, many peptides appear as peaks, and base noise beyond that appears. As a result, the identification of individual peptides by visualization has been very difficult with the standard software provided on the instrument.
In addition to the problems described above, the individual peaks in the LC / MS measurement results are very sharp, so that the differential analysis of the proteome by two-dimensional electrophoresis or the like is a simple subtraction and difficult to process.
In addition, in order to increase the degree of separation and purification of protein samples, it is necessary to spend a lot of time and money. Therefore, it is desirable to easily analyze a crudely purified sample and obtain a highly accurate analysis result. .

本発明の課題は、プロテオーム実験等で得られた混合物資料または、純度の低い蛋白質試料等のLC/MS解析の測定結果を直接解析することと可能とするため、(1)データのノイズ処理を行い有効なピークを選別する、(2)ピークの鋭敏さによるディファレンシャル処理の困難さを補う、(3)視覚的判定に頼らず、数値処理をおこない客観的は判定を可能とする事が挙げられる。
においては多くのノイズがみられ直接解析するには困難で、プロテオーム実験等で得られた混合物資料または、純度の低い蛋白質試料等の測定結果からディファレンシャルの挙動が直接解析できるようにすることで、ディファレンシャル処理の挙動解析をする、結果の数多く出現するペプチドがピークとして出現し、それ以上のベースノイズが出現するため、標準で機器に提供されているソフトウェアでは、単純な視覚化による個々のペプチドの同定は非常に困難であった。
The object of the present invention is to directly analyze the measurement results of LC / MS analysis of a mixture material obtained by proteome experiments or the like, or a protein sample of low purity, etc. (1) Data noise processing To select effective peaks, (2) make up for the difficulty of differential processing due to peak sensitivity, (3) perform numerical processing without relying on visual judgment, and enable objective judgment. .
In Japan, it is difficult to analyze directly because of a lot of noise. By making it possible to directly analyze the behavior of the differential from the mixture data obtained by proteomic experiments or the measurement results of low-purity protein samples, As a result of analyzing the behavior of differential processing, many peptides appearing as a result appear as peaks, and more base noise appears, so the software provided as standard in the instrument allows individual peptides to be visualized by simple visualization. Identification was very difficult.

本発明者らは鋭意検討の結果LC/MS 測定結果の直接比較を試み、統計手法を用いることで、膨大なピークの中から大幅にノイズを軽減させ有効なピークのみを選抜し、一定範囲の分子量と保持時間で区分けされた範囲での定性的または定量的な変化を検出可能とした。
さらに、有効なピークの直接比較によって、混合物中のペプチドを限定して、ディファレンシャル解析で目的のペプチドを同定を可能とした。
即ち本発明の要旨は以下のとおりである。
[1] 下の手順を含むプロテオームのディファレンシャル解析方法;
(1)液体クロマトグラフ精製蛋白の質量分析データのピークから算出したZスコア(Zscore)または、平均値を判定基準として有効ピークを選別し、
(2)一定範囲の分子量および一定範囲の保持時間で区分けされた範囲に(1)で選別した有効ピーク値を集約して画像表示または数値表示させる。
[2] Zスコアまたは、平均値の判定基準が負値のピークを除いて自然対数を算出し、処理結果が正値のピークを有効ピークとして選別する請求項1記載のプロテオームのディファレンシャル解析方法。
[3] 以下の手順を含むプロテオームのディファレンシャル解析方法;
(1)液体クロマトグラフ精製蛋白の質量分析で検出された全ピークから各ピーク強度のZスコア(Zscore)を算出し、Zスコアが負値のピークを除いて自然対数を算出し、処理結果が正値のピークを有効ピークとして選別する、
(2)(1)で選別した有効なピークを対象に、以下の(i)から(iv)の手順を含むグループ化
方法でピーク値をグループ化する、
(i)全有効ピークリストからピークを一つ選択し1つの群とする、
(ii)(i)で形成した群に属する最小保持時間のピークの隣に等しい一定誤差範囲の
分子量(m/z)のピークがあるまたは、最大保持時間のピークの隣に等しい一定
誤差範囲の分子量(m/z)のピークがあればそれらのピークを(i)で形成した群に加える、
(iii)(ii)の操作を繰り返し、該当するピークがなければ(i)に戻る、
(iv)グループに属さないピークがなければ終了とする、
(3)(2)でグループ化したピーク群の保持時間が、10分〜300分のものを選抜し、
有効なピーク値とする、
(4)(3)で選抜した有効なピーク値において異なる二つのピークデータを比較し、共通な
ピークデータを抽出する、
(4)(1)〜(4)で処理をしたディファレンシャル解析をおこなう試料のピーク値の測定結果を
分子量と保持時間を軸にして区分けして表示し重ね合わせ、共通部分を抽出する。
(6) 上記の手順で得た有効ピークの強度を用いてディファレンシャル解析を行う。
[4] 一定誤差範囲の分子量が±0.5Da〜±0.1Daである請求項3記載の方法。
[5] 分子量が50〜2000である請求項1〜3いずれかに記載の方法。
[6] 保持時間が30分〜300分である請求項1〜3いずれかに記載の方法。
[7] ディファレンシャル解析方法が、同位体ラベリング法または、サブトラクティブ法である請求項1〜3いずれかに記載の方法。
[8] 請求項1〜7に記載された方法をコンピュータに実行させることを特徴とするコンピュータ読み取り可能なプログラム。
[9] 以下の手順を含むステップを実施するためのプロテオームのディファレンシャル解析装置;
(1)液体クロマトグラフ精製蛋白の質量分析データのピークから算出したZスコアまたは、平均値をを判定基準として有効ピークを選別するステップ、
(2)一定範囲の分子量および一定範囲の保持時間で区分けされた範囲に(1)で選別した有効ピーク値を集約して画像表示または数値表示させるステップ。
[10] Zスコアの判定基準が負値のピークを除いて自然対数を算出し、処理結果が正値のピークを有効ピークとして選別する請求項7記載のプロテオームのディファレンシャル解析装置。
[11] 以下の手順を含むステップを実施するためのプロテオームのディファレンシャル解析装置;
(1)液体クロマトグラフ精製蛋白の質量分析で検出された全ピークから各ピーク強度のZスコア(Zscore)を算出し、Zスコアが負値のピークを除いて自然対数を算出し、処理結果が正値のピークを有効ピークとして選別するステップ、
(2)(1)で選別した有効なピークを対象に、以下の(i)から(iv)の手順を含むグループ化
方法でピーク値をグループ化するステップ、
(i)全有効ピークリストからピークを一つ選択し1つの群とするステッ、
(ii)(i)で形成した群に属する最小保持時間のピークの隣に等しい一定誤差範囲の
分子量(m/z)のピークがあるまたは、最大保持時間のピークの隣に等しい一定
誤差範囲の分子量(m/z)のピークがあればそれらのピークを(i)で形成した群に加える、
(iii)(ii)の操作を繰り返し、該当するピークがなければ(i)に戻るステップ、
(iv)グループに属さないピークがなければ終了とするステッ、
(3)(2)でグループ化したピーク群の保持時間が、10分〜300分のものを選抜し、
有効なピーク値とするステップ、
(4)(3)で選抜した有効なピーク値において異なる二つのピークデータを比較し、共通な
ピークデータを抽出するステップ、
(1)〜(4)で処理をしたディファレンシャル解析をおこなう試料のピーク値の測定結果を
分子量と保持時間を軸にして区分けして表示し重ね合わせ、共通部分を抽出するステップ、
(5) 上記の手順で得た有効ピークの強度を用いてディファレンシャル解析を行うステップ。
[12] 一定誤差範囲の分子量が±0.5Da〜±0.1Daである請求項11記載の装置。
[13] 分子量が50〜2000である請求項9〜11いずれかに記載の装置。
[14] 保持時間が30分〜300分である請求項9〜11いずれかに記載の装置。
[15] ディファレンシャル解析方法が、同位体ラベリング法または、サブトラクティブ法である請求項9〜11いずれかに記載の装置。
[16]
As a result of intensive studies, the present inventors tried to directly compare LC / MS measurement results, and by using statistical methods, the noise was greatly reduced from a huge number of peaks, and only effective peaks were selected. Qualitative or quantitative changes within the range divided by molecular weight and retention time can be detected.
Furthermore, by direct comparison of effective peaks, the peptides in the mixture were limited, and the target peptide could be identified by differential analysis.
That is, the gist of the present invention is as follows.
[1] Proteome differential analysis method including the following steps;
(1) The effective peak is selected based on the Z score (Zscore) calculated from the peak of the mass spectrometry data of the liquid chromatograph purified protein or the average value as a criterion,
(2) The effective peak values selected in (1) are aggregated and displayed as an image or numerical value in a range divided by a certain range of molecular weight and a certain range of retention time.
[2] The differential analysis method for proteome according to claim 1, wherein a natural logarithm is calculated by excluding a peak having a negative score of the Z score or the average value, and a peak having a positive result of processing is selected as an effective peak.
[3] A proteome differential analysis method including the following procedures;
(1) The Z score (Zscore) of each peak intensity is calculated from all the peaks detected by mass spectrometry of the liquid chromatograph purified protein, the natural logarithm is calculated except for the negative peak of the Z score, and the processing result is Select positive peaks as effective peaks,
(2) Using the grouping method including the following steps (i) to (iv) for the effective peaks selected in (1), the peak values are grouped.
(i) Select one peak from the list of all effective peaks to make one group.
(ii) There is a molecular weight (m / z) peak with a constant error range next to the minimum retention time peak belonging to the group formed in (i), or a constant error range equal to the peak next to the maximum retention time. If there are peaks of molecular weight (m / z), add those peaks to the group formed in (i),
(iii) Repeat the operation of (ii), and if there is no corresponding peak, return to (i).
(iv) Terminate if there are no peaks that do not belong to the group,
(3) A peak group having a retention time of 10 minutes to 300 minutes selected in (2) is selected,
A valid peak value,
(4) Compare two different peak data in the effective peak values selected in (3), and extract common peak data.
(4) The measurement results of the peak value of the sample subjected to differential analysis processed in (1) to (4) are divided and displayed with the molecular weight and retention time as axes, and the common part is extracted.
(6) A differential analysis is performed using the intensity of the effective peak obtained by the above procedure.
[4] The method according to claim 3, wherein the molecular weight within a certain error range is ± 0.5 Da to ± 0.1 Da.
[5] The method according to any one of claims 1 to 3, wherein the molecular weight is 50 to 2000.
[6] The method according to any one of claims 1 to 3, wherein the holding time is 30 minutes to 300 minutes.
[7] The method according to any one of claims 1 to 3, wherein the differential analysis method is an isotope labeling method or a subtractive method.
[8] A computer-readable program that causes a computer to execute the method according to any one of claims 1 to 7.
[9] A proteome differential analyzer for performing steps including the following procedures;
(1) a step of selecting an effective peak using a Z score or an average value calculated from a peak of mass spectrometry data of liquid chromatograph purified protein as a criterion,
(2) The step of aggregating the effective peak values selected in (1) in a range divided by a certain range of molecular weight and a certain range of retention time and displaying the image or numerical value.
[10] The differential analysis device for proteome according to claim 7, wherein a natural logarithm is calculated except for a peak having a negative value of Z score, and a peak having a positive result of processing is selected as an effective peak.
[11] A proteome differential analyzer for carrying out steps including the following procedures;
(1) The Z score (Zscore) of each peak intensity is calculated from all the peaks detected by mass spectrometry of the liquid chromatograph purified protein, the natural logarithm is calculated except for the negative peak of the Z score, and the processing result is Selecting positive peaks as effective peaks,
(2) Grouping peak values using the grouping method including the following steps (i) to (iv) for the effective peaks selected in (1):
(i) Select one peak from the list of all effective peaks and make it a group.
(ii) There is a molecular weight (m / z) peak with a constant error range next to the minimum retention time peak belonging to the group formed in (i), or a constant error range equal to the peak next to the maximum retention time. If there are peaks of molecular weight (m / z), add those peaks to the group formed in (i),
(iii) repeating the operation of (ii) and returning to (i) if there is no corresponding peak,
(iv) The step that ends if there is no peak that does not belong to the group,
(3) A peak group having a retention time of 10 minutes to 300 minutes selected in (2) is selected,
A step for a valid peak value,
(4) comparing two different peak data in the effective peak values selected in (3), and extracting common peak data;
A step of extracting and displaying a common part by dividing and displaying the measurement result of the peak value of the sample subjected to the differential analysis processed in (1) to (4) with the molecular weight and the retention time as axes.
(5) A step of performing a differential analysis using the effective peak intensity obtained by the above procedure.
[12] The apparatus according to claim 11, wherein the molecular weight within a certain error range is ± 0.5 Da to ± 0.1 Da.
[13] The apparatus according to any one of claims 9 to 11, having a molecular weight of 50 to 2000.
[14] The apparatus according to any one of [9] to [11], wherein the holding time is 30 minutes to 300 minutes.
[15] The apparatus according to any one of claims 9 to 11, wherein the differential analysis method is an isotope labeling method or a subtractive method.
[16]

本発明によりLC/MS測定結果のデータから直接有効なピークを選別することが可能となった結果、視覚化が容易な緩やかな強度増減の面を得ることができた。また、ピークの鋭敏さによるディファレンシャル処理の困難さを補うことが可能となり、ディファレンシャルによる明確な差異を検出できるようになった。本発明により、ディファレンシャル処理の大まかな挙動を速やかに検出でき、HTS でプロテオーム処理をする場合のマーカー検出の有用な技術となった。   According to the present invention, it became possible to select effective peaks directly from the LC / MS measurement result data. As a result, it was possible to obtain a gentle intensity increase / decrease surface that was easy to visualize. In addition, the difficulty of differential processing due to peak sharpness can be compensated, and a clear difference due to the differential can be detected. According to the present invention, the rough behavior of the differential processing can be detected quickly, and it has become a useful technique for marker detection in the case of proteomic processing with HTS.

以下に、本発明における請求項中記載の語句の定義について説明する。
「液体クロマトグラフ精製蛋白の質量分析(LC/MS)」とは、蛋白質の質量分析機と液体クロマトグラフ(以下、LC)を連結させたものなどの装置を使用して蛋白質の質量を測定することをいう。質量分析(以下、MS)とは、分析する試料をイオン化させて導入し,電気力や磁気力により質量ごとの差をつくり、イオンの質量を分析することである。上記分析を行う装置である質量分析計を含め、MSには、イオントラップ型MS、フーリエ変換イオンサイクロトロン共鳴質量分析(FT-ICR/MS)MS、イオンスキャン法MS、 Q-TOF型MSなどが挙げられる。これらは、1方法だけで分析しても複数のMS(以下、MS/MS)と液体クロマトグラフを連結させて分析(以下、LC/MS/MS解析)させても良い。。
「Zスコア」とは、一般的に統計的解析指標の一つであるZスコアをいう。二つの単語の共起関係(相互の結びつき)の強さを表す指標の一つで、値が大きいほど結びつきが強いことを示す。Zスコアの計算式は例えば、以下のように表せる。
Below, the definition of the phrase as described in the claim in this invention is demonstrated.
"Liquid chromatograph purified protein mass spectrometry (LC / MS)" means measuring protein mass using a device such as a protein mass spectrometer coupled to a liquid chromatograph (LC). That means. Mass spectrometry (hereinafter referred to as MS) is to analyze a mass of ions by introducing a sample to be analyzed by ionization, creating a difference for each mass by an electric force or a magnetic force. The MS, including the mass spectrometer, which performs the above analysis, includes ion trap MS, Fourier transform ion cyclotron resonance mass spectrometry (FT-ICR / MS) MS, ion scan MS, Q-TOF MS, etc. Can be mentioned. These may be analyzed by only one method, or may be analyzed by connecting a plurality of MSs (hereinafter, MS / MS) and a liquid chromatograph (hereinafter, LC / MS / MS analysis). .
The “Z score” generally refers to a Z score that is one of statistical analysis indices. One of the indicators of the strength of the co-occurrence relationship (mutual connection) between two words. The larger the value, the stronger the connection. The formula for calculating the Z score can be expressed as follows, for example.

Figure 2005257483
「一定誤差範囲の分子量」とは、質量分析器の検出感度を考慮した検出ピークの許容範囲をいう。分析機によって検出感度はが異なるり、例えば、イオントラップ型質量分析器の場合は±0.5Da、四重極飛行時間ハイブリッド型質量分析器の場合は±0.1Da等が挙げあられる。
「保持時間」とは、分子量(m/z)のピークが検出されるために所有する時間をいう。10分以下のものはノイズピークと考えられるので、本発明では10分以上ピーク検出に所有されたピーク値について解析に用いる。好ましくは、30〜300分の保持時間が挙げられる。
Figure 2005257483
“Molecular weight within a certain error range” refers to an allowable range of detection peaks in consideration of detection sensitivity of a mass analyzer. The detection sensitivity varies depending on the analyzer, for example, ± 0.5 Da for an ion trap mass analyzer, ± 0.1 Da for a quadrupole time-of-flight hybrid mass analyzer, and the like.
“Retention time” refers to the time possessed in order to detect the peak of molecular weight (m / z). Since a peak of 10 minutes or less is considered as a noise peak, in the present invention, a peak value owned by peak detection for 10 minutes or more is used for analysis. Preferably, the holding time of 30 to 300 minutes is mentioned.

本発明の第一の態様はプロテオームのディファレンシャル解析方法に関する。
本発明の解析方法は、LC/MS測定結果から統計的手法によってノイズ処理を行うことで有効なピークを選別し、視覚化を行ったことにより、ディファレンシャル処理の困難さを補うことが可能となったこと、さらにディファレンシャルによる明確な差異を検出できるようになったことが特徴である。。
本発明の解析方法に使用される汎用ソフトウェアで出力されるデータは、テキストファイルであればよく、例えばプロテオーム解析などで使用されているMascot、Sonar MS/MS、LC/MS等のデータが挙げられる。以下に、本発明の方法を図1〜図6を参照して説明する。
A first aspect of the present invention relates to a proteome differential analysis method.
The analysis method of the present invention makes it possible to compensate for the difficulty of differential processing by selecting effective peaks by performing noise processing from the LC / MS measurement results by statistical methods and performing visualization. In addition, it is possible to detect a clear difference due to the differential. .
The data output by the general-purpose software used in the analysis method of the present invention may be a text file, for example, data such as Mascot, Sonar MS / MS, LC / MS used in proteome analysis and the like. . Hereinafter, the method of the present invention will be described with reference to FIGS.

図1は本発明の請求項1の方法を説明するためのフローチャートである。請求項1記載の方法で、LC/MSの測定結果の直接比較データの膨大なピークの中からZスコア(z-score)又は、平均値の判定結果を用いて大幅にノイズを軽減させ有効なピークのみを選抜し、一定範囲の分子量と保持時間で区分けされた範囲での定性的な変化を検出することができた。
101で液体クロマトグラフ精製蛋白の質量分析で検出された全ピークから各ピーク強度のZスコアまたは平均値を算出し、102にてZスコアが負値のピークを除いて自然対数を算出し、103でピークデータを統計的に判断し、104で、103の処理結果が正値のピークを有効ピークとして選別する。
105で、101〜104の方法で選別された各ピークを、任意に定めた一定範囲の分子量および保持時間で区分けされた範囲で104で選別した有効ピーク値を集約する。
106で、105で集約させた群を比較する。
106にて集約した有効ピーク群は、テキストデータ、画像データ等で記述され、視覚的に容易なように表示する。表示方法は例えば、表形式、グラフなどが挙げられ、好ましくはグラフ表示が挙げられる。また、ピークの集約毎に色調を変化させて表示させることにより、容易に視覚判断でき、ディファレンシャルによる明確な差異を検出できる。また、その格子を選択することで拡大させることができ、さらに詳細な違いを調べることが可能になった。表示例を図2に示す。
FIG. 1 is a flowchart for explaining the method of claim 1 of the present invention. The method according to claim 1 is effective in significantly reducing noise by using a Z-score or average value judgment result from a huge number of peaks in direct comparison data of LC / MS measurement results. Only peaks were selected, and qualitative changes in a range divided by a certain range of molecular weight and retention time could be detected.
101, the Z score or average value of each peak intensity is calculated from all the peaks detected by mass spectrometry of the liquid chromatograph purified protein, and the natural logarithm is calculated except for the negative Z score peak at 102, 103 In step 104, the peak data is statistically determined. In step 104, a peak whose processing result is a positive value is selected as an effective peak.
In 105, the effective peak values selected in 104 in the range divided by the arbitrarily determined molecular weight and retention time of the peaks selected by the methods 101 to 104 are collected.
At 106, the groups aggregated at 105 are compared.
The effective peak group collected in 106 is described by text data, image data, etc., and is displayed so as to be visually easy. Examples of the display method include a table format and a graph, and a graph display is preferable. In addition, by changing the color tone for each peak aggregation and displaying it, it is possible to easily make a visual judgment and detect a clear difference due to a differential. In addition, by selecting the grid, it was possible to enlarge it, and it became possible to investigate more detailed differences. A display example is shown in FIG.

さらに、106で集約した有効ピーク群の解析を視覚的判定に頼らず、数値処理による集約を検討した。本発明者らは、質量分析器の分子量測定精度は非常に高いため誤差は小さいが、液体クロマトグラフィの保持時間は、状況により多少の変化が発生する知見を得、107で、106にてふるいわけした有効なピークを対象に 例えば、イオントラップ型 や 四重極飛行時間ハイブリッド型 などの質量分析器の精度にあわせ任意に定めたの一定範囲の分子量を有し、かつ任意に定めた一定の保持時間範囲内に収まる各ピークを一つの群として集約させることで、群を簡略化させることができた。
前記の群を比較することによって、二つのスペクトルの違いを迅速に判定することが可能になり、プロテオーム実験でのディファレンシャル解析に応用させることが可能になった。
また、LC/MS 測定結果の膨大なピークの中から大幅にノイズを軽減させ有効なピークのみを選抜し、一定範囲の分子量と保持時間で区分けされた範囲での定性的な変化を検出することで、LC/MS 測定結果の直接比較が可能であることが示唆された。
本発明で用いた「ディファレンシャル解析」の方法は、例えば同位体ラベリング法または、サブトラクティブ法等が挙げられる。同位体ラベリング法は、同一試料中で、ラベル化したペプチド中に含まれる同位体の存在により、検出される分子量(m/z)に差が生じることを用いて、両者のピーク面積を比較する手法である。例えば、18Oラベリングの場合は、分子量(m/z)が一価で検出されたなら両者の間隔は4Da、二価で検出されたなら両者のそれは2Daの差が生じることを用いて比較する。
サブトラクティブ法は、異なる試料同士で、保持時間と分子量(m/z)が近接したピークを対としてピーク面積を比較する方法である。
Further, the analysis of the effective peak group aggregated at 106 was examined without regard to visual judgment, and aggregation by numerical processing was examined. The present inventors have found that the accuracy of the molecular weight measurement of the mass spectrometer is very high, so the error is small. However, the retention time of liquid chromatography has been found to vary slightly depending on the situation. For example, an ion trap type or a quadrupole time-of-flight hybrid type has a molecular weight in a certain range according to the accuracy of the mass analyzer, and a certain constant retention. By consolidating the peaks that fall within the time range into one group, the group could be simplified.
By comparing the groups, it is possible to quickly determine the difference between the two spectra and to apply the differential analysis in a proteomic experiment.
In addition, noise is greatly reduced from the huge peaks of LC / MS measurement results, and only effective peaks are selected to detect qualitative changes in a range divided by a certain range of molecular weight and retention time. This suggests that direct comparison of LC / MS measurement results is possible.
Examples of the “differential analysis” method used in the present invention include an isotope labeling method and a subtractive method. The isotope labeling method compares the peak areas of the two using the difference in the detected molecular weight (m / z) due to the presence of isotopes in the labeled peptide in the same sample. It is a technique. For example, in the case of 18 O labeling, if the molecular weight (m / z) is detected as monovalent, the distance between the two is 4 Da, and if it is detected as bivalent, it is compared using the difference of 2 Da. .
The subtractive method is a method in which peak areas are compared between different samples by using a pair of peaks whose retention time and molecular weight (m / z) are close to each other.

次に、図3〜図5を用いて本発明の請求項3記載の方法を説明する。請求項3記載の方法では、ノイズを除去し選抜された有効なピーク値をさらに保持時間の大きさでピークを比較し目的のピークの検出を行うことにより、混合物中のペプチドを限定して、ディファレンシャル解析で目的のペプチドの同定または、定量性が見出せることが示唆された。
先ず、図1の101〜104の方法でノイズピークを除去し選別した有効なピーク(301a)を対象に有効なピークは数秒間出現すると仮定して、複数の実験結果の共通部を取得しピーク値をグループ化した。
図3の301で301aのピークデータから一つを選別し、
302で保持時間一定の分子量(m/z)範囲にある隣接ピークを一群としてグループ化する。一定の保持時間は10分以上であれば良く、好ましくは30分〜300分の範囲が上げられる。
目的のピークは数分の保持時間を伴って複数箇所にわたって検出されるピークの示す分子量が一定の誤差範囲にあり隣接して存在すれば、それらのピークは一つの大きなピーク群としてグループ化した。一定の分子量範囲は、10〜2000が上げられ、好ましくは、50〜2000の範囲が上げられる。
303で、302でグループ化したピーク群について一定時間に出現していないピーク値を除外し、それ以外のピーク値で近接しているピーク値を一群としてグループ化する(301b)。
302〜303の操作を繰り返し、該当するピークがなければ301に戻り、全ピーク群のグループ化が完了するまで301〜303を繰り返し、グループ化されたピーク群を305とする。グループに属さないピークがなければ終了とする。
図4の401で、図3の305でグループ化したピークデータの保持時間を分析する。
402で保持時間が、10分以上のものを選抜し、有効なピーク値とする(403)。保持時間は10分以上であれば良く、好ましくは10分〜300分の範囲が挙げられ、より好ましくは30分〜300分の範囲が挙げられる。
全てのピークを分析するまで401〜403の手順を繰り返す。
図5は図4の403で得られた有効ピーク値について保持時間一定の分子量(m/z)範囲にある隣接ピーク値を比較(501)しさらにグループ化して共通ピークを抽出し、(502)有効ピークとする(503)。503にて得た有効ピーク群は、テキストデータ、画像データ等で記述され、視覚的に容易なように表示する。
上記の方法で処理をしたディファレンシャル解析をおこなう。
表示方法は例えば、表形式、グラフなどが挙げられ、好ましくはグラフ表示が挙げられる。また、ピークのグループ化毎に色調を変化させて表示させることにより、容易に視覚判断でき、ディファレンシャルによる明確な差異を検出できる。表示例を図6に示す。
Next, the method according to claim 3 of the present invention will be described with reference to FIGS. In the method according to claim 3, the effective peak value selected by removing noise is further compared with the peak by the retention time, and the target peak is detected, thereby limiting the peptides in the mixture, It was suggested that the differential peptide can be used to identify or quantify the target peptide.
First, assuming that an effective peak (301a) obtained by removing and selecting noise peaks by the method 101 to 104 in FIG. 1 appears for several seconds, a common part of a plurality of experimental results is acquired and the peak is obtained. Grouped values.
In 301 of FIG. 3, one is selected from the peak data of 301a,
At 302, adjacent peaks in a molecular weight (m / z) range with a constant retention time are grouped as a group. The fixed holding time may be 10 minutes or more, and the range is preferably 30 minutes to 300 minutes.
The target peaks were grouped as one large peak group if the molecular weights of the peaks detected over a plurality of locations with a retention time of several minutes were within a certain error range and were adjacent to each other. The fixed molecular weight range is 10 to 2000, preferably 50 to 2000.
In 303, the peak values that do not appear in a certain period of time are excluded from the peak group grouped in 302, and the peak values that are close to each other in the other peak values are grouped as a group (301b).
If the operation of 302-303 is repeated and there is no applicable peak, it will return to 301, and 301-303 will be repeated until grouping of all the peak groups is completed, and let the grouped peak group be 305. If there is no peak that does not belong to the group, the process ends.
In 401 of FIG. 4, the retention time of the peak data grouped in 305 of FIG. 3 is analyzed.
At 402, a sample having a retention time of 10 minutes or more is selected and set as an effective peak value (403). The holding time should just be 10 minutes or more, Preferably the range of 10 minutes-300 minutes is mentioned, More preferably, the range of 30 minutes-300 minutes is mentioned.
Repeat steps 401-403 until all peaks have been analyzed.
FIG. 5 compares adjacent peak values in the molecular weight (m / z) range having a constant retention time for the effective peak value obtained in 403 in FIG. 4 (501), and further groups to extract a common peak, (502) An effective peak is set (503). The effective peak group obtained in 503 is described by text data, image data, etc., and is displayed so as to be visually easy.
The differential analysis processed by the above method is performed.
Examples of the display method include a table format and a graph, and a graph display is preferable. Further, by displaying the color tone changed for each grouping of peaks, it is possible to easily make a visual judgment and detect a clear difference due to the differential. A display example is shown in FIG.

表示例図6は、301〜503の手順で、数種類のペプチドからなる混合物のLC/MS測定結果を直接比較することにより、目的のペプチドを同定できるか検討した結果である。
これらの結果により、LC/MSディファレンシャル解析において、分子量についての誤差は僅少だが保持時間は大きく異なるという前提条件でピークを比較することで、目的の候補ピーク対の検出が可能であることが示唆された。
Display Example FIG. 6 is a result of examining whether or not a target peptide can be identified by directly comparing LC / MS measurement results of a mixture of several kinds of peptides by the procedures of 301 to 503.
These results suggest that, in LC / MS differential analysis, it is possible to detect the target candidate peak pair by comparing the peaks on the premise that the molecular weight error is small but the retention time is significantly different. It was.

本発明の第2の態様は、本発明の解析方法を実行させる装置である。
本発明解析方法を実行させる装置を図7に示す。701は、本発明の解析方法に使用される汎用ソフトウェアで出力されるデータを入力するための装置である。この装置は、電子計算機であればよく、サーバーでも、パーソナルコンピュータ(以下PC)等が挙げられ、計算機の能力は制限しない。本発明解析方法を実行させるプログラムを動作させるオペレーションシステムも汎用ソフトウェア(例えば、マイクロソフトウインドウズ(登録商標)シリーズ等)でよい。
702の装置で、701で入力されたデータをz-SCOREの判定をおこない、702で、701の判定結果に基づいて有効ピークを抽出する。703の装置で図3の301〜305の判定に基づき、有効ピーク値をグループ化し、704に出力する。
705で、704で出力されたデータ図4の402〜403の判定基準で選別し、有効なピークデータを抽出する。
706の装置で図5の501〜502のデータ分析を行い、707の装置で701の装置〜206の装置で実行した実行結果をを出力する。
出力結果は707の装置で表示することもでき、紙などの記録媒体に印刷することもでき、FD,MO,CD−RW,DVD−RW等の磁気または、磁気光ディスク、光ディスク等の記録媒体に出力することもできる。
701〜707の装置は、全てが一体した装置でも、各が分離した装置でも、一部が一体化した装置またそれらを組み合わせた装置であってもよい。
本発明の第3の態様は、本発明の解析方法をコンピュータで読みとり可能なプログラムである。
図1〜図5のフローチャートの101〜502の解析方法を実行させるプログラムで、これらは、図1〜図5に示したアルゴリズムの手順にそって1つのモジュールであっても、それぞれのパート事に書かれたモジュールを組み合わせて使用してもよい。これらは磁気ディスク等の記録媒体に記録されている。
以下、本発明解析方法の実施例を挙げる。但し、本実施例によって本発明を限定するものではない。
The second aspect of the present invention is an apparatus for executing the analysis method of the present invention.
An apparatus for executing the analysis method of the present invention is shown in FIG. Reference numeral 701 denotes an apparatus for inputting data output by general-purpose software used in the analysis method of the present invention. The apparatus may be an electronic computer, and may be a server, such as a personal computer (hereinafter referred to as a PC), and the capacity of the computer is not limited. The operation system for operating the program for executing the analysis method of the present invention may also be general-purpose software (for example, Microsoft Windows (registered trademark) series).
In the apparatus 702, z-SCORE is determined for the data input in 701, and in 702, an effective peak is extracted based on the determination result in 701. Based on the determinations 301 to 305 in FIG. 3 by the apparatus 703, the effective peak values are grouped and output to 704.
In 705, the data output in 704 is selected according to the determination criteria 402 to 403 in FIG.
The apparatus 706 performs the data analysis of 501 to 502 in FIG. 5, and outputs the execution results executed by the apparatuses 701 to 206 of the apparatus 707.
The output result can be displayed on the apparatus 707 and can be printed on a recording medium such as paper, and can be printed on a magnetic medium such as FD, MO, CD-RW, and DVD-RW, or on a recording medium such as a magnetic optical disk and an optical disk. It can also be output.
The devices 701 to 707 may be all integrated devices, separated devices, partially integrated devices, or a combination thereof.
A third aspect of the present invention is a program that can be read by a computer for the analysis method of the present invention.
A program for executing the analysis methods 101 to 502 in the flowcharts of FIGS. 1 to 5, which may be a module according to the algorithm procedure shown in FIGS. A combination of written modules may be used. These are recorded on a recording medium such as a magnetic disk.
Examples of the analysis method of the present invention will be given below. However, the present invention is not limited to the present embodiment.

1) HGH + βカゼイントリプシン消化系での結果の再比較
HGH + βカゼイントリプシン消化系の直接比較を行なう前に、有効ピークのグルーピングを行なった。これは、目的のピークは数分の保持時間を伴って複数箇所にわたって検出されると想定し、検出されたピークの示す分子量が一定の誤差範囲にあり隣接して存在すれば、それらのピークは一つの大きなピークとしてまとめた。この変換データを元にして、両者を比較をした。そして、どの程度の許容範囲を与えれば両者のピークを差し引けるかを調べた。
HGHをトリプシン消化したものを図8に、HGH + βカゼインをトリプシン消化したものを図9に、図8、図9を重ね合わせたものを図10として表示する。図10を見ると、いくつかの個所でパターンの類似性が認められ、保持時間の許容度を1分前後にし、分子量のそれを1Daと与えることで合致させることが可能と考えた。
1) Recomparison of results with the HGH + β casein trypsin digestion system
Effective peaks were grouped before a direct comparison of the HGH + β casein trypsin digestion system. This assumes that the target peak is detected in multiple locations with a retention time of several minutes, and if the molecular weight indicated by the detected peak is within a certain error range and is adjacent, these peaks will be Combined as one large peak. Based on this conversion data, both were compared. Then, it was investigated how much tolerance could be given to subtract both peaks.
FIG. 8 shows a result of tryptic digestion of HGH, FIG. 9 shows a result of trypsin digestion of HGH + β casein, and FIG. 10 shows a result of superimposing FIGS. Looking at FIG. 10, pattern similarity was observed at several points, and it was thought that it was possible to match by setting the tolerance of retention time around 1 minute and giving that of molecular weight as 1 Da.

数種のペプチドの混合系での比較
本プログラムの検証には、HGH + βカゼイントリプシン消化系は複雑すぎて不適当であるため、より簡略化した系ということで、7種類のペプチド混合系の LCQ を測定し、その結果の比較解析を試みた。
Bradykinin、Dynorphin、Substance P、Renin Substrate、Angiotensin、Leu-enkepharin、Fibrinopeptideの7種類のペプチドが混合したMS(LCQ)結果をノイズ処理してプロットした結果を図11に示す。ここで、保持時間が10分までと43分以降に現れるピークの多くは、ブランクでも出現するノイズである。ノイズ処理後の数値データから、目的の7つのペプチドを帰属したのが図12である。
Fibrinopeptideはちょうど44分あたりに出現し、本測定系固有のノイズと重なるため、Fibrinopeptideの検出は困難であると判断した。また、ノイズについては、目的のペプチドは少なくとも3スキャンにわたって出現するが10分以上にはならないと仮定することにより大幅に除去することができた(図13)。
Comparison of several types of peptides in a mixed system The HGH + β casein trypsin digestion system is too complex and inappropriate for the verification of this program. We measured LCQ and tried comparative analysis of the results.
FIG. 11 shows the results of plotting the MS (LCQ) results obtained by mixing seven types of peptides, Bradykinin, Dynarphin, Substance P, Renin Substrate, Angiotensin, Leu-enkepharin, and Fibrinopeptide, with noise treatment. Here, most of the peaks appearing after the retention time of up to 10 minutes and after 43 minutes are noise that appears even in the blank. FIG. 12 shows that the intended seven peptides are assigned from the numerical data after the noise processing.
Fibrinopeptide appeared just around 44 minutes and overlapped with the noise inherent in this measurement system, so it was judged that detection of Fibrinopeptide was difficult. In addition, the noise could be largely eliminated by assuming that the peptide of interest appeared over at least 3 scans but not longer than 10 minutes (FIG. 13).

18 O の混合系での定量性比較
前処理した18O混合系 LCQ ピークデータを対象に、Mascot の検索結果から同定されたペプチド情報をもとに、目的のピーク対を選抜し定量性を調べた。
18OのLCQ測定結果をノイズ処理してプロットしたのが図14である。同試料のMascot解析した結果から16Oと18Oの同位体の対を抽出したのが図15である。
Quantitative comparison in 18 O mixed system The target peak pair was selected based on the peptide information identified from the Mascot search results for the pre-processed 18O mixed LCQ peak data, and the quantitative performance was examined. .
FIG. 14 is a plot of the 18 O LCQ measurement results after noise processing. FIG. 15 shows the 16O and 18O isotope pairs extracted from the Mascot analysis of the sample.

本発明によりLC/MS測定結果のデータから直接有効なピークを選別することが可能となった結果、視覚化が容易な緩やかな強度増減の面を得ることができた。また、ピークの鋭敏さによるディファレンシャル処理の困難さを補うことが可能となり、ディファレンシャルによる明確な差異を検出できるようになった。本発明により、ディファレンシャル処理の大まかな挙動を速やかに検出でき、HTS でプロテオーム処理をする場合のマーカー検出の有用な技術となった。   According to the present invention, it became possible to select effective peaks directly from the LC / MS measurement result data. As a result, it was possible to obtain a gentle intensity increase / decrease surface that was easy to visualize. In addition, the difficulty of differential processing due to peak sharpness can be compensated, and a clear difference due to the differential can be detected. According to the present invention, the rough behavior of the differential processing can be detected quickly, and it has become a useful technique for marker detection in the case of proteomic processing with HTS.

図1は本発明の解析方法の手順を示したフローチャートである。FIG. 1 is a flowchart showing the procedure of the analysis method of the present invention. 図2は汎用ソフトでの解析結果を表示した画面のハードコピーFigure 2 shows a hard copy of the screen displaying the analysis results of general-purpose software 図3は本発明請求項3の解析方法のグループ化手順を示したフローチャートである。FIG. 3 is a flowchart showing the grouping procedure of the analysis method of claim 3 of the present invention. 図4は本発明請求項3の解析方法の有効ピーク値の選別手順を示したフローチャートである。FIG. 4 is a flowchart showing a procedure for selecting effective peak values in the analysis method of claim 3 of the present invention. 図5は本発明請求項3の解析方法の有効ピーク値の選別手順を示したフローチャート手順である。FIG. 5 is a flowchart showing the effective peak value selection procedure of the analysis method of claim 3 of the present invention. 図6は本発明方法で解析した結果を表示させた図である。FIG. 6 is a view showing the result of analysis by the method of the present invention. 図7は本発明の解析方法を実行するための装置の構成を示した図である。FIG. 7 is a diagram showing the configuration of an apparatus for executing the analysis method of the present invention. 図8は実施例1でHGH をトリプシン消化した系を解析し表示した図である。FIG. 8 shows the analysis and display of the system in which tryptic digestion of HGH in Example 1 was performed. 図9は実施例1HGH + βカゼインをトリプシン消化した系を解析し表示した図である。FIG. 9 is a diagram showing an analysis and display of a system in which trypsin digests HGH + β casein in Example 1. 図10は図8と図9を重ね合わせたものである。FIG. 10 is a superposition of FIGS. 8 and 9. 図11は実施例2の7種のペプチド混合物のLC/MS結果である。FIG. 11 shows LC / MS results of the seven peptide mixtures of Example 2. 図12は実施例2の7種のペプチドの帰属を表示した結果である。FIG. 12 shows the result of displaying the attribution of the seven peptides of Example 2. 図13は実施例2のノイズ処理後の7種ペプチド混合物のLC/MSプロット図である。FIG. 13 is an LC / MS plot of the seven-peptide mixture after noise treatment in Example 2. 図14は実施例3の18O測定結果のプロットである。FIG. 14 is a plot of the 18O measurement results of Example 3. 図15はMascotの結果で16Oと18Oのペプチド対を帰属をプロットしたものである。FIG. 15 is a plot of the attribution of 16O and 18O peptide pairs as Mascot results.

Claims (15)

以下の手順を含むプロテオームのディファレンシャル解析方法;
(1)液体クロマトグラフ精製蛋白の質量分析データの全ピークから算出したZスコア(Zscore)または、平均値を判定基準として有効ピークを選別し、
(2)一定範囲の分子量および一定範囲の保持時間で区分けされた範囲に(1)で選別した有効ピーク値を集約して画像表示または数値表示させる。
Proteome differential analysis method including the following steps;
(1) Select an effective peak using a Z score (Zscore) calculated from all peaks of mass spectrometry data of liquid chromatograph purified protein or an average value as a criterion,
(2) The effective peak values selected in (1) are aggregated and displayed as an image or numerical value in a range divided by a certain range of molecular weight and a certain range of retention time.
Zスコアの判定基準が負値のピークを除いて自然対数を算出し、処理結果が正値のピークを有効ピークとして選別する請求項1記載のプロテオームのディファレンシャル解析方法。   The differential analysis method for a proteome according to claim 1, wherein a natural logarithm is calculated except for a peak having a negative value as a determination criterion for a Z score, and a peak having a positive value as a processing result is selected as an effective peak. 以下の手順を含むプロテオームのディファレンシャル解析方法;
(1)液体クロマトグラフ精製蛋白の質量分析で検出された全ピークから各ピーク強度のZスコア(Zscore)を算出し、Zスコアが負値のピークを除いて自然対数を算出し、処理結果が正値のピークを有効ピークとして選別する、
(2)(1)で選別した有効なピークを対象に、以下の(i)から(iv)の手順を含むグループ化する
方法でピーク値をグループ化する、
(i)全有効ピークリストからピークを一つ選択し1つの群とする、
(ii)(i)で形成した群に属する最小保持時間のピークの隣に等しい一定誤差範囲の
分子量(m/z)のピークがあるまたは、最大保持時間のピークの隣に等しい一定
誤差範囲の分子量(m/z)のピークがあればそれらのピークを(i)で形成した群に加える、
(iii)(ii)の操作を繰り返し、該当するピークがなければ(i)に戻る、
(iv)グループに属さないピークがなければ終了とする、
(3)(2)でグループ化したピーク群の保持時間が、10分〜300分のものを選抜し、
有効なピーク値とする、
(4)(3)で選抜した有効なピーク値において異なる二つのピークデータを比較し、共通な
ピークデータを抽出する、
(5)(1)〜(4)で処理をしたディファレンシャル解析をおこなう試料のピーク値の測定結果を
分子量と保持時間を軸にして区分けして表示し重ね合わせ、共通部分を抽出する、
(6) 上記の手順で得た有効ピークの強度を用いてディファレンシャル解析を行う。
Proteome differential analysis method including the following steps;
(1) The Z score (Zscore) of each peak intensity is calculated from all the peaks detected by mass spectrometry of the liquid chromatograph purified protein, the natural logarithm is calculated except for the negative peak of the Z score, and the processing result is Select positive peaks as effective peaks,
(2) For the effective peaks selected in (1), the peak values are grouped by the grouping method including the following steps (i) to (iv).
(i) Select one peak from the list of all effective peaks to make one group.
(ii) There is a molecular weight (m / z) peak with a constant error range next to the minimum retention time peak belonging to the group formed in (i), or a constant error range equal to the peak next to the maximum retention time. If there are peaks of molecular weight (m / z), add those peaks to the group formed in (i),
(iii) Repeat the operation of (ii), and if there is no corresponding peak, return to (i).
(iv) Terminate if there are no peaks that do not belong to the group,
(3) A peak group having a retention time of 10 minutes to 300 minutes selected in (2) is selected,
A valid peak value,
(4) Compare two different peak data in the effective peak values selected in (3), and extract common peak data.
(5) The peak value measurement results of the sample subjected to differential analysis processed in (1) to (4) are divided and displayed with the molecular weight and retention time as axes, and the common part is extracted.
(6) A differential analysis is performed using the intensity of the effective peak obtained by the above procedure.
一定誤差範囲の分子量が±0.5Da〜±0.1Daである請求項3記載の方法。   The method according to claim 3, wherein the molecular weight within a certain error range is ± 0.5 Da to ± 0.1 Da. 分子量が50〜2000である請求項1〜3いずれかに記載の方法。 The method according to any one of claims 1 to 3, wherein the molecular weight is 50 to 2000. 保持時間が30分〜300分である請求項1〜3いずれかに記載の方法。 The method according to any one of claims 1 to 3, wherein the holding time is 30 minutes to 300 minutes. ディファレンシャル解析方法が、同位体ラベリング法または、サブトラクティブ法である請求項1〜3いずれかに記載の方法。 The method according to claim 1, wherein the differential analysis method is an isotope labeling method or a subtractive method. 請求項1〜7に記載された方法をコンピュータに実行させることを特徴とするコンピュータ読み取り可能なプログラム。   A computer-readable program for causing a computer to execute the method according to claim 1. 以下の手順を含んだステップを実施するためのプロテオームのディファレンシャル解析装置;
(1)液体クロマトグラフ精製蛋白の質量分析データのピークから算出したZスコアを判定基準として有効ピークを選別するステップ、
(2)一定範囲の分子量および一定範囲の保持時間で区分けされた範囲に(1)で選別した有効ピーク値を集約して画像表示または数値表示させるステップ。
Proteome differential analyzer for performing steps including the following procedures;
(1) a step of selecting an effective peak using a Z score calculated from a peak of mass spectrometry data of a liquid chromatograph purified protein as a criterion;
(2) The step of aggregating the effective peak values selected in (1) in a range divided by a certain range of molecular weight and a certain range of retention time and displaying the image or numerical value.
Zスコアの判定基準が負値のピークを除いて自然対数を算出し、処理結果が正値のピークを有効ピークとして選別する請求項9記載のプロテオームのディファレンシャル解析装置。   10. The differential analysis apparatus for proteome according to claim 9, wherein a natural logarithm is calculated by excluding a peak having a negative value as a determination criterion of a Z score, and a peak having a positive result of processing is selected as an effective peak. 以下の手順を含んだステップを実施するためのプロテオームのディファレンシャル解析装置;
(1)液体クロマトグラフ精製蛋白の質量分析で検出された全ピークから各ピーク強度のZスコア(Zscore)を算出し、Zスコアが負値のピークを除いて自然対数を算出し、処理結果が正値のピークを有効ピークとして選別するステップ、
(2)(1)で選別した有効なピークを対象に、以下の(i)から(iv)の手順を含むグループ化する方法でピーク値をグループ化するステップ、
(i)全有効ピークリストからピークを一つ選択し1つの群とするステップ、
(ii)(i)で形成した群に属する最小保持時間のピークの隣に等しい一定誤差範囲の
分子量(m/z)のピークがあるまたは、最大保持時間のピークの隣に等しい一定
誤差範囲の分子量(m/z)のピークがあればそれらのピークを(i)で形成した群に加えるステップ、
(iii)(ii)の操作を繰り返し、該当するピークがなければ(i)に戻るステップ、
(iv)グループに属さないピークがなければ終了とするステップ、
(3)(2)でグループ化したピーク群の保持時間が、10分〜300分のものを選抜し、
有効なピーク値とするステップ、
(4)(3)で選抜した有効なピーク値において異なる二つのピークデータを比較し、共通な
ピークデータを抽出するステップ、
(1)〜(4)で処理をしたディファレンシャル解析をおこなう試料のピーク値の測定結果を
分子量と保持時間を軸にして区分けして表示し重ね合わせ、共通部分を抽出するステップ、
(5) 上記の手順で得た有効ピークの強度を用いてディファレンシャル解析を行うステップ。
Proteome differential analyzer for performing steps including the following procedures;
(1) The Z score (Zscore) of each peak intensity is calculated from all the peaks detected by mass spectrometry of the liquid chromatograph purified protein, the natural logarithm is calculated except for the negative peak of the Z score, and the processing result is Selecting positive peaks as effective peaks,
(2) Grouping the peak values by the grouping method including the following steps (i) to (iv) for the effective peaks selected in (1):
(i) selecting one peak from the list of all effective peaks to form one group;
(ii) There is a molecular weight (m / z) peak with a constant error range next to the minimum retention time peak belonging to the group formed in (i), or a constant error range equal to the peak next to the maximum retention time. Adding any peaks of molecular weight (m / z) to the group formed in (i), if any.
(iii) repeating the operation of (ii) and returning to (i) if there is no corresponding peak,
(iv) a step that ends if there is no peak that does not belong to the group;
(3) A peak group having a retention time of 10 minutes to 300 minutes selected in (2) is selected,
A step for a valid peak value,
(4) comparing two different peak data in the effective peak values selected in (3), and extracting common peak data;
A step of extracting and displaying a common part by dividing and displaying the measurement result of the peak value of the sample subjected to the differential analysis processed in (1) to (4) with the molecular weight and the retention time as axes.
(5) A step of performing a differential analysis using the effective peak intensity obtained by the above procedure.
一定誤差範囲の分子量が±0.5Da〜±0.1Daである請求項11記載の装置。 The apparatus according to claim 11, wherein the molecular weight within a certain error range is ± 0.5 Da to ± 0.1 Da. 分子量が50〜2000である請求項9〜11いずれかに記載の装置。 The apparatus according to any one of claims 9 to 11, having a molecular weight of 50 to 2,000. 保持時間が30分〜300分である請求項9〜11いずれかに記載の装置。 The apparatus according to any one of claims 9 to 11, wherein the holding time is 30 minutes to 300 minutes. ディファレンシャル解析方法が、同位体ラベリング法または、サブトラクティブ法である請求項9〜11いずれかに記載の装置。
The apparatus according to any one of claims 9 to 11, wherein the differential analysis method is an isotope labeling method or a subtractive method.
JP2004069833A 2004-03-11 2004-03-11 Differential method of analyzing proteome Pending JP2005257483A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004069833A JP2005257483A (en) 2004-03-11 2004-03-11 Differential method of analyzing proteome

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004069833A JP2005257483A (en) 2004-03-11 2004-03-11 Differential method of analyzing proteome

Publications (1)

Publication Number Publication Date
JP2005257483A true JP2005257483A (en) 2005-09-22

Family

ID=35083342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004069833A Pending JP2005257483A (en) 2004-03-11 2004-03-11 Differential method of analyzing proteome

Country Status (1)

Country Link
JP (1) JP2005257483A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009080010A (en) * 2007-09-26 2009-04-16 Hitachi High-Technologies Corp Mass analyzing system
WO2011058883A1 (en) * 2009-11-13 2011-05-19 株式会社日立ハイテクノロジーズ Liquid chromatography/mass spectrometry device and analysis method using liquid chromatography/mass spectrometry device
JP2014112068A (en) * 2012-04-27 2014-06-19 Shimadzu Corp Peak detection method for mass spectrometry and system therefor
CN111539588A (en) * 2020-07-08 2020-08-14 江西理工大学南昌校区 Method for predicting learning result by correcting short answer question score
US11211150B2 (en) 2019-08-28 2021-12-28 Jeol Ltd. Mass spectrum processing apparatus and model generation method
CN115469046A (en) * 2021-06-10 2022-12-13 萨默费尼根有限公司 Automatic outlier injection identification

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009080010A (en) * 2007-09-26 2009-04-16 Hitachi High-Technologies Corp Mass analyzing system
WO2011058883A1 (en) * 2009-11-13 2011-05-19 株式会社日立ハイテクノロジーズ Liquid chromatography/mass spectrometry device and analysis method using liquid chromatography/mass spectrometry device
JP2014112068A (en) * 2012-04-27 2014-06-19 Shimadzu Corp Peak detection method for mass spectrometry and system therefor
US9613786B2 (en) 2012-04-27 2017-04-04 Shimadzu Corporation Peak detection method for mass spectrometry and system therefor
US11211150B2 (en) 2019-08-28 2021-12-28 Jeol Ltd. Mass spectrum processing apparatus and model generation method
CN111539588A (en) * 2020-07-08 2020-08-14 江西理工大学南昌校区 Method for predicting learning result by correcting short answer question score
CN115469046A (en) * 2021-06-10 2022-12-13 萨默费尼根有限公司 Automatic outlier injection identification

Similar Documents

Publication Publication Date Title
Ketterlinus et al. Fishing for biomarkers: analyzing mass spectrometry data with the new ClinProTools™ software
AU2002241535C1 (en) Method for analyzing mass spectra
JP5348029B2 (en) Mass spectrometry data processing method and apparatus
EP2558982B1 (en) Intensity normalization in imaging mass spectrometry
McDonnell et al. Mass spectrometry image correlation: quantifying colocalization
Barla et al. Machine learning methods for predictive proteomics
US20020193950A1 (en) Method for analyzing mass spectra
JP2017224283A (en) Big data analytical method and mass analytical system using the same
DeHaven et al. Software techniques for enabling high-throughput analysis of metabolomic datasets
JP2011180134A (en) Method and apparatus for reducing noise in mass signal
CN103776891A (en) Method for detecting differentially-expressed protein
JP2009057337A (en) Metabolome data analysis method and metabolism-related marker
JP2016180599A (en) Data analysis device
JPWO2011058883A1 (en) Liquid chromatography mass spectrometer and analysis method using liquid chromatography mass spectrometer
Noy et al. Improved model-based, platform-independent feature extraction for mass spectrometry
Lieb et al. Peak detection for MALDI mass spectrometry imaging data using sparse frame multipliers
JP2005257483A (en) Differential method of analyzing proteome
Morris Statistical methods for proteomic biomarker discovery based on feature extraction or functional modeling approaches
WO2006129401A1 (en) Screening method for specific protein in proteome comprehensive analysis
CN112798678A (en) Novel rapid detection method for coronavirus infection based on serum
KR20120124767A (en) New Bioinformatics Platform for High-Throughput Profiling of N-Glycans
US11380532B2 (en) Method for imaging mass spectrometry and imaging mass spectrometer
KR20190054994A (en) Apparatus and method for distinguishing antibiotics resistance by maldi-tof ms analysis
CN115206420A (en) Method for constructing schizophrenia abnormal gene-metabolism regulation network and application
WO2017073968A1 (en) Apparatus, method and computer program for spectrum analysis

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20051026