WO2004113905A1 - 質量分析方法および質量分析装置 - Google Patents

質量分析方法および質量分析装置 Download PDF

Info

Publication number
WO2004113905A1
WO2004113905A1 PCT/JP2003/007923 JP0307923W WO2004113905A1 WO 2004113905 A1 WO2004113905 A1 WO 2004113905A1 JP 0307923 W JP0307923 W JP 0307923W WO 2004113905 A1 WO2004113905 A1 WO 2004113905A1
Authority
WO
WIPO (PCT)
Prior art keywords
mass
spectrum
protein
analysis
information
Prior art date
Application number
PCT/JP2003/007923
Other languages
English (en)
French (fr)
Inventor
Hiromichi Yamashita
Yoshiaki Kato
Original Assignee
Hitachi High-Technologies Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi High-Technologies Corporation filed Critical Hitachi High-Technologies Corporation
Priority to JP2005500921A priority Critical patent/JP4058449B2/ja
Priority to PCT/JP2003/007923 priority patent/WO2004113905A1/ja
Priority to US10/561,771 priority patent/US7691643B2/en
Publication of WO2004113905A1 publication Critical patent/WO2004113905A1/ja

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/24Nuclear magnetic resonance, electron spin resonance or other spin effects or mass spectrometry

Definitions

  • the present invention relates to an apparatus and a method for using a mass spectrometer, particularly for improving the accuracy of protein identification and shortening the processing time.
  • a mass spectrum is predicted from a publicly available database that collects amino acid sequence information of proteins and peptides, and is compared with the mass spectrum of a sample obtained by actual measurement. It is disclosed that identification is performed based on the degree of coincidence.
  • the conventional method has the following problems.
  • Many peptides may correspond to the ion mass obtained by measurement in a database that integrates protein amino acid sequences. There was sex. In such a case, it is difficult to identify the protein from the peptide because of the large number of proteins containing the peptide.
  • Identification of proteins and peptides is performed as data processing after measurement. If a database of amino acid sequence information on proteins and peptides is used, changes in the contents of the database directly affect identification accuracy. For example, even if the measurement data is the same, it may be possible to identify the previously unknown peptide II protein by applying the latest database. In such a case, it is necessary to perform the identification process every time the database is updated. In a situation where the contents of database registrations increase dramatically and the measurement data increases steadily, the processing time required for identification will increase dramatically. Therefore, a method that can reduce the time required for the identification process is strongly desired.
  • the amount of protein present in living cells varies from abundant to very small amounts. If the purpose is to identify very small amounts of proteins, then we need to ensure a measurable amount. However, many species and tissues are difficult to obtain and expensive.
  • LCZMS liquid chromatograph mass spectrometer
  • MAL DI-MS matrix-assisted laser desorption / ionization mass spectrometer
  • the M S Z M S spectrum is generally used. If the resulting mass spectrum is constantly changing or appears only for a very short time, it may not be possible to obtain the MS / MS spectrum for all ions at once. In particular, when the target protein or peptide has only a trace amount, it is impossible to obtain a mass spectrum by repeatedly introducing a sample many times. Therefore, there is a demand for a method capable of performing identification processing using the MS / MS spectrum even when there are only a few samples.
  • a specific protein can be selected based on the function and structural characteristics of the protein, localization information within the cell, expression pattern, association with a specific disease, and the like. Rather than randomly identifying protein peptides, it is important to increase the selectivity of those proteins and increase the probability of identifying them.
  • An object of the present invention is to provide a mass spectrometry method and apparatus capable of performing high-speed and high-accuracy identification when identifying proteins and peptides using a mass spectrometer.
  • the feature of the present invention to achieve the above object is to ionize a sample, JP2003 / 007923
  • a mass spectrometry method in which a protein is analyzed using an analyzer, predetermined information is selected from a database storing information on protein peptides, the mass of the selected component is estimated, and The mass information is calculated by analyzing the sample with a mass spectrometer, and the mass to be used for identification is selected based on the obtained mass spectrum and the frequency information. It is to perform mass spectrometry using the mass spectrum of the mass as a precursor ion and to perform an identification process using the obtained mass spectrum.
  • FIG. 1 is a diagram depicting a processing flow of the first embodiment
  • FIG. 2 is a graph showing frequency information accumulated in the first embodiment.
  • FIG. 3 is an example of an apparatus configuration of the present invention.
  • FIG. 4 is an example of a condition setting screen.
  • FIG. 5 is an example of a display screen of the result of selection of precursor ions.
  • FIG. 6 is a diagram showing a processing flow of the second embodiment.
  • FIG. 7 is a graph showing frequency information accumulated in the second embodiment.
  • FIG. 8 is a diagram showing a processing flow of the third embodiment.
  • FIG. 9 is a graph showing frequency information accumulated in the second embodiment.
  • FIG. 3 shows the structure of the mass spectrometer and the data processing device to which the present invention is applied. 3007923
  • a chromatographic apparatus 10 for separating a sample, a mass spectrometer main body 11, a control unit 15 thereof, and a data processing unit 17 are connected by a signal line 16. Things.
  • the mass spectrometer main body 11 is composed of an ion source 12 for ionizing a sample, a mass spectrometer 13, and a detector 14.
  • the data processing unit 17 includes a keyboard 18 and a display device 19.
  • the data processing device 17 can be connected to an external public line such as the Internet, so that it can access a database connected on the network and obtain necessary information.
  • the information of the database may be obtained using a recording medium such as a CD-ROM.
  • a chromatographic apparatus and an ion trap type mass spectrometer are shown.
  • the mass spectrometer is required to select a precursor ion by MS 1 analysis and perform MS 2 analysis (so-called MS / MS analysis). All mass spectrometers capable of) are applicable.
  • the ion source an ion source that can be ionized so as not to damage proteins and peptides is preferable.
  • an Electrospray Ionization (ESI) can be used.
  • ESI Electrospray Ionization
  • a chromatographic device is not always necessary, and the present invention can be applied to a mass spectrometer using a matrix assisted laser desorption ionization (MA LDI).
  • MA LDI matrix assisted laser desorption ionization
  • FIG. 1 shows the basic processing of this embodiment.
  • peptides produced by enzymatic digestion of protein with a predetermined digestive enzyme were subjected to mass spectrometry, and each peak of the obtained mass spectrum was analyzed.
  • the mass spectrum obtained by further cleavage and mass spectrometry shall be used.
  • FIG. 1 shows a method for selecting a precursor ion for MS / MS analysis.
  • NR Non-redundant protein database
  • NCBI National Center for Biotechnology Information
  • amino acid sequence of the protein suitable for the purpose of measurement is collected from the database of (a) above.
  • the protein accumulated by (b) above is fermented by a predetermined digestive enzyme.
  • the amino acid sequence of the peptide produced after elementary digestion is determined.
  • the obtained sequences are arranged for each protein.
  • the type of digestive enzyme to be applied is specified in advance.
  • the value of the mass is assumed to be rounded to the nearest whole number and converted to an integer. In addition, 1 is given when one peptide exists for each mass, and 0 when no peptide exists. When there are a plurality of peptides having the same mass, the number of matching peptides is given to the value of the vertical axis of the mass.
  • the data for each protein obtained in (d) above is collected for each mass and collected as a relationship between mass and frequency.
  • the integer mass is m
  • the frequency is F
  • the value of F corresponding to m is Fm.
  • FIG. 2 shows the frequency for each mass obtained assuming that human-derived sequences of nr-force, et al. Swiss-prot, obtained in January 2002, were digested with trypsin. As is clear from this figure, large variations are observed in the frequency values for each mass. In other words, it indicates that the number of the corresponding peptides differs greatly depending on the mass.
  • weight patterns are created. Each emphasizes the less frequent pattern and the more frequent pattern.
  • MS 1 MS 1 is obtained by the analysis spectrum can be obtained as a general mass-related charge ratio and intensity.
  • the ions observed here are candidates for precursor ions.
  • the mass information is extracted from the MS 1 spectrum obtained in (h) above. More specifically, for each mass, 1 is given if a peak exceeding a predetermined threshold value exists in the MS 1 spectrum, and 0 is given if it does not exist. That is, the presence or absence of a peak corresponding to the relevant mass is indicated by two values, 0 and 1.
  • an integer mass is adopted.
  • a pseudo spectrum is generated from the presence or absence of the peak obtained in (i) and the weight pattern obtained in (f). Assuming that the weight pattern is W m and the presence or absence of the peak is E m , the intensity I m of the pseudo spectrum can be obtained by the following equation.
  • the intensity of the pseudo peak reflects the value of the weight pattern.
  • two types of weight patterns are also created. That is, the weight pattern 1 is reflected in the pseudo spectrum 1, and the weight pattern 2 is reflected in the pseudo spectrum 2.
  • a precursor ion to be subjected to MS 2 analysis is selected by focusing on the intensity of the pseudo spectrum obtained in (j).
  • examples of selecting precursor ions using pseudo spectra 1 and 2 and both will be described separately for methods 1, 2, and 3.
  • precursor ions are selected using pseudo spectrum 1. That is, paying attention to the intensity of the pseudo spectrum 1, it is adopted as a precursor ion in descending order of the value.
  • pseudo-spectrum 1 employs weight pattern 1 that emphasizes low-frequency mass. That is, the mass of the precursor ion selected here appears infrequently in the amino acid sequence of the peptide after the enzyme digestion obtained in (c) above.
  • the masses of the precursor ions are determined in the order of 3-5-1-4-2, and MS / MS analysis is performed.
  • the mass with intensity 1 should be excluded.
  • the frequency is high, the intensity of the pseudo spectrum is close to zero. In this case, the meaning of paying attention to the low-frequency mass is lost.
  • the range of the intensity is important. Therefore, it is necessary to specify in advance the range of the intensity of the pseudo spectrum, and to select from the larger ones in that range. If the mass at which the intensity of the pseudospectrum is 1 (frequency is 0) is selected as the precursor, the peptide derived from an unknown protein that does not meet the calculation conditions for obtaining the mass in (c) above is used. There is a possibility.
  • the mass may be increased or decreased due to post-translational modification.
  • the target of the precursor ion is limited to the one in which the intensity of the pseudo spectrum is one.
  • Method 2 selects precursor ions from pseudo-spectrum 2, which emphasizes high-frequency mass. Also in this case, precursor ions are selected in descending order of strength.
  • a precursor ion is selected by this method, its mass is determined by the amino acid sequence of the peptide after enzyme digestion obtained in (c) above. Appears frequently. That is, it is suitable for a case where a wide range of proteins to be selected is desired in the identification of a protein after measurement.
  • precursor ions are selected in the order of (2), (4), (5), (6), (7), and the MSZMS analysis is performed.
  • Method 3 employs precursor ions that are ordered by Method 1 and Method 2 alternately.
  • the selection result of method 1 is prioritized, and the order of 3 ⁇ 5—4—1 is obtained.
  • the identification of the protein after measurement is improved, and it is suitable for the case where a wide selection of proteins is desired.
  • not all peaks in the mass spectrum obtained by mass analysis of the actual sample are used as precursor ions, but the starting masses of the ranked masses are used as precursor ions. It has a function to set in advance.
  • the number of precursor ions to be selected should be as large as possible within the range that can be measured during that time, taking into account the time when peaks that are candidate precursor ions will be observed. Set the value.
  • L CZM S, etc. it is necessary to complete the analysis within the time when the precursor ion candidate is observed, so select it as the precursor ion after considering the time required for MS analysis and MS ZMS analysis. Set the number.
  • identification processing is performed using the MSZMS vector of the precursor ion selected in step (k) above.
  • the identification process is performed using the data accumulated in the step (c) and the MS / MS spectrum obtained by analyzing the precursor ions.
  • the processing from the amino acid sequence accumulation of the specific protein to the weight calculation for each mass in FIG. 1 is transferred to the control unit 15 before the analysis of the sample is started.
  • the control unit 15 performs MS 1 analysis of the sample, and obtains an MS 1 spectrum. Therefore, mass extraction, pseudo-spectrum creation, and precursor ion selection are performed.
  • the control unit 15 performs MS 2 analysis on the selected precursor ion to obtain an MS 2 spectrum. In some cases, MS 2 Repeat the process of acquiring the vector.
  • the above is the basic flow when the method of FIG. 1 is applied to the device configuration of FIG.
  • the data processing unit 17 is in charge of the selection of the precursor ions instead of the control unit 15.
  • a method of switching the designation of the precursor ion depending on the time from the start of the measurement can be applied.
  • Fig. 4 shows a screen for setting various conditions performed before measuring the sample. Basically, it is assumed that this is realized by the display device 19 and the keyboard 18 in the data processing unit 17 in FIG. 2 according to the method shown in FIG.
  • the database and species are selected from the list, and keywords corresponding to the desired functions are set.
  • “Swiss-pro” is selected as the base and “homo sapiens” (human) is selected as the species, and "zinc finger” is entered as the keyword.
  • Zinc Finger is a protein that binds to DNA.
  • proteins having such functional sites may be involved in the transcription function from DNA to mRNA. That is, it is designated to accumulate those related to zinc finger from Swiss-prot human-derived proteins.
  • the conditions for calculating the frequency information corresponding to the mass are set. First, select the corresponding modification type and digestive enzyme. Next, select an ionization method that affects the molecular ion mass. It also specifies the mass accuracy for calculating the frequency, the calculation range, and the definition of the mass.
  • the specified calculation results from frequency, weight pattern 1, and weight pattern 2 are displayed in a graph. It is desirable that the graph can be enlarged or reduced as needed.
  • a mass range for limiting the mass of the precursor ion is input, and a threshold value of the ion intensity in the MS 1 mass spectrum is set.
  • the intensity range when selecting a precursor ion from the pseudo spectrum is specified for low frequency and high frequency cases.
  • the selection conditions for Select from “from frequency”, “from high frequency”, “alternate from high to low”, “alternate from low to high”, and specify the number of precursor ions to be selected from the number of times and time it is possible to specify a numerical value and a unit as the repetition condition of the MSMS analysis.The unit can be specified from the pull-down menu.If the number of times is specified, the numerical value means the number of times the MS / MS analysis is performed.
  • Fig. 5 shows a graph and table of the precursor ion selection results.
  • the frequency information obtained from the information extracted from the database in advance and the mass spectrum obtained by actually analyzing the sample are overlapped and displayed. Also, ions selected as precursor ions are distinguished by placing a mark at the top of the peak, and unselected ones are marked with a ⁇ . It is desirable that this graph can be enlarged or reduced as needed.
  • the table display shows the mass of the mass spectrum, ionic strength, frequency, and whether or not selection is possible.
  • a table is displayed that is sorted and displayed in order from low frequency, making it easier to focus on frequency. Show.
  • the data processing unit 17 simultaneously displays the precursor ion selected from the mass spectrum and the candidate precursor ion and the applied frequency information on the display device 19, so that the specified Precursor on condition It can be verified whether an ion has been selected.
  • the mass and frequency of each protein are arranged based on the amino acid sequence of the protein accumulated in advance.
  • This embodiment basically has the same flow as the method shown in FIG. However, the part from the amino acid sequence of the accumulated specific protein to the accumulation as mass and frequency differs. (Unlike Fig. 1, the amino acid sequence of the peptide after enzyme digestion is not calculated.) Fig. 6 shows this part.
  • amino acid sequence corresponding to the target protein is collected from the protein database by specifying the species.
  • Fig. 7 shows a collection of human-derived proteins from Swiss-prot, further described as "Zinc Finger", organized as frequency information.
  • this figure shows the molecular weight distribution of the accumulated protein Since many proteins have very large molecular weights, it is difficult to measure them with a general quadrupole mass spectrometer or an ion trap type mass spectrometer. Identification is performed on the assumption that the peptide is enzymatically digested as in the example. On the other hand, in this embodiment, it is assumed that a mass spectrometer capable of measuring the protein itself (for example, a time-of-flight mass spectrometer (TOF-MS)) is used.
  • TOF-MS time-of-flight mass spectrometer
  • Fig. 8 shows the outline.
  • the flow up to the mass and frequency accumulation in Fig. 1 is multiplexed, and the frequency difference is obtained from those results.
  • Fig. 9 shows a graph as an example of frequency calculation.
  • amino acid sequence corresponding to the target protein is collected from the protein database by specifying the species.
  • the graph (A) in FIG. 9 is an example of the processing results under the protein selection condition 1. This indicates the frequency of Swiss-prot human protein accumulation and digestion with trypsin.
  • the conditions for selecting a protein are different from the processing under the protein selection condition 1 in (b) above.
  • the graph (B) in Fig. 9 is an example of the processing result under the protein selection condition 2. This is based on the assumption that human-derived proteins of Swiss-prot were further collected with "Zinc Finger” and digested with trypsin.
  • Graph (C) in Fig. 9 is shown as an example of calculating the frequency difference.
  • the fin is obtained by subtracting graph (A) from graph (B) for each mass.
  • the ratio was adjusted by multiplying the ratio of the total number of peptides in each graph to the side of daraf (B).
  • the selectivity of the Zinc Finger-related protein can be improved.
  • the amino acid sequence of the protein registered in the database is applied as it is.
  • the amino acid sequence of a protein is frequently repeated. Therefore, in some cases, measures such as ignoring such repetitive sequences are desirable.
  • tyrosine phosphorylation is important. Therefore, it is considered that a technique that improves the selectivity for tyrosine-phosphorylated peptide fragments in the protein of interest is useful. If frequency information is generated for unmodified proteins, the modification will result in a mass difference, and selecting a less frequent mass will increase the selectivity of the modified peptide. In addition, techniques to rigorously determine the difference in frequency information between unmodified and modified may be significant.

Abstract

本発明は、質量分析装置を用いてタンパク質やペプチドの同定を行う場合に、より高速且つ高確度に同定を行うことが可能な質量分析方法および装置を提供する。具体的には、試料をイオン化し、質量分析装置を用いてタンパク質の分析を行う質量分析方法において、タンパク質やペプチドの情報が格納されたデータベースより、所定の情報を選出し、当該選出された成分の質量を推測し、質量ごとの頻度情報を算出し、試料を質量分析装置によって分析してマススペクトルを得、当該得られたマススペクトルと前記頻度情報に基づいて同定に用いるべき質量を選出し、当該選出された質量のマススペクトルを前駆イオンとして質量分析し、得られたマススペクトルを用いて同定処理を行う。これにより、分析の目的に合致した頻度情報を用いて同定処理に必要なMS/MSスペクトルを得るための前駆イオンを効率良く選択することができる。

Description

P2003/007923
技術分野
本発明は質量分析装置を用いて、 特にタンパク質の同定精度の向上や 処理時間の短縮を図るための装置および方法に関するものである。 背景技術
タンパク質やペプチドを同定する場合、 ェドマン分解法や質量分析法 を用いた方法が一般的に知られている。
質量分析装置を用いてタンパク質の同定を行うものの例として特表平
9 一 5 1 0 7 8 0号公報がある。 この例は、 タンパク質やペプチドのァ ミノ酸配列情報を集積した一般に公開されているデータベースからマス スペク トルを予測し、 さらに、 実際に測定を行って得られた試料のマス スペク トルと比較を行い、 一致度を元に同定を行うことが開示されてい る。
また、 質量分析装置のデータ処理において、 測定結果を一般のデータ ベースを用いて解析する例として、 特開平 5— 1 6 4 7 5 1号公報があ る。 発明の開示
従来の方法においては、 次に挙げる問題があった。
( a ) 未知試料におけるタンパク質の同定精度
測定によって得られたイオンの質量には、 タンパク質のアミノ酸配列 を集積したデ一タベースにおいて、 多くのぺプチドが対応している可能 性があった。 このような場合、 そのペプチドを含むタンパク質の数が多 いため、 タンパク質をそのぺプチドから特定することは困難である。
( b ) 同定処理の時間
タンパク質やペプチドの同定は、 測定後のデータ処理として実施され る。 もし、 タンパク質やペプチドのアミノ酸配列情報のデ一夕べ一スを 利用する場合、 データベースの内容の変化によって、 同定精度は直接影 響を受ける。 例えば、 測定データは同じでも、 最新のデータベースを適 用することによって、 それまで未知であつたべプチドゃタンパク質が同 定できる場合がある。 そのような場合を想定すると、 データベースが更 新されるごとに同定処理を行う必要がある。 データベースの登録内容が 激増し、 測定データも着実に増える状況においては、 同定に要する処理 時間は飛躍的に増大してしまう。 したがって、 同定処理に要する時間を 短縮できる手法が強く望まれている。
( c ) 同定に必要な試料量
生体の細胞内に存在する夕ンパク質は多量に存在するものから、 ごく 微量のものまで様々である。 もし、 ごく微量に存在するタンパク質の同 定が目的であれば、 測定が可能な量を確保しなければならない。 しかし、 生物種や組織によっては入手困難かつ高価なものが多い。
また、 質量分析装置を用いてタンパク質の同定を行うためには、 液体 クロマトグラフ質量分析装置 (L CZM S) やマトリクス支援レーザ脱 離イオン化質量分析装置 (MAL D I — MS ) を用いる場合が多いが、 L C/MSでは、 L Cから溶出された試料が連続的に M Sへ導入され、 測定されるマススぺク トルが時々刻々と変化する。 MAL D I 一 M Sで は、 予め前処理した試料をマイクロプレート等に配置してレーザを照射 しイオン化するため、 試料が微量である場合には、 出現するイオンも極 僅かであり、 マススぺク トルとして検出できる時間も非常に限られてい る。
質量分析装置を用いてタンパク質の同定を行う場合は、 より詳細なマ ススペク トルを得るために、一度取得したイオンを開裂させて得る所謂、
M S Z M Sスぺク トルを一般に用いる。 得られるマススぺク トルが常に 変化する場合、 或いは非常に極僅かの時間しか出現しない場合は、 全て のイオンにおいて一度に M S / M Sスペク トルを得ることが出来ない場 合がある。 特に、 目的のタンパク質やべプチドが極微量しかない場合は、 何度も繰り返し試料を導入してマススぺク トルを得ることは不可能であ る。 従って、 より極僅かな試料しかない状態でも M S / M Sスペク トル を用いて同定処理が可能な手法が望まれている。
( d ) 特定のタンパク質の選択性
質量分析装置によってタンパク質やべプチドを測定する場合、 特定の タンパク質に着目して同定したい場合がある。 例えば、 タンパク質の機 能や構造上の特性, 細胞内での局在情報, 発現パターン, 特定の疾患と の関連などによって特定のタンパク質を選択することができる。 無作為 にタンパク質ゃぺプチドを同定するのではなく、 それらのタンパク質の 選択性を高め、 それらを同定する確率を向上させることは重要である。
また、 特定のタンパク質以外の選択性を高めることができれば、 結果 的に夾雑物や翻訳後修飾されたべプチドの同定確率の向上に結びつく と 考えられる。
本発明の目的は、 質量分析装置を用いてタンパク質やべプチドの同定 を行う場合に、 より高速且つ高確度に同定を行うことが可能な質量分析 方法および装置を提供することである。
上記目的を達成するための本発明の特徴は、 試料をイオン化し、 質量 JP2003/007923
4
分析装置を用いてタンパク質の分析を行う質量分析方法において、 タン パク質ゃぺプチドの情報が格納されたデータベースより、 所定の情報を 選出し、 当該選出された成分の質量を推測し、 質量ごとの頻度情報を算 出し、 試料を質量分析装置によって分析してマススペク トルを得、 当該 得られたマススぺク トルと前記頻度情報に基づいて同定に用いるべき質 量を選出し、 当該選出された質量のマススぺク トルを前駆イオンとして 質量分析し、 得られたマススぺク トルを用いて同定処理を行うことであ る。 図面の簡単な説明
第 1図は、 第 1の実施例の処理フローを示す図である。
第 2図は、第 1の実施例において集積した頻度情報を示すグラフである。 第 3図は、 本発明の装置構成例である。
第 4図は、 条件設定画面の例である。
第 5図は、 前駆イオンの選択結果表示画面例である。
第 6図は、 第 2の実施例の処理フローを示す図である。
第 7図は、第 2の実施例において集積した頻度情報を示すグラフである。 第 8図は、 第 3の実施例の処理フロ一を示す図である。
第 9図は、第 2の実施例において集積した頻度情報を示すグラフである。 発明を実施するための最良の形態
以下、 本発明の実施例について説明する。
◎第 1の実施例
〇装置構成
第 3図に、 本発明が適用される質量分析計およびデータ処理装置の構 3007923
5
成を示す。
本実施例の装置構成は、試料の分離のためのクロマトグラフ装置 1 0, 質量分析装置本体 1 1, その制御部 1 5、 およびデ一夕処理部 1 7を、 信号線 1 6で結んだものである。 質量分析装置本体 1 1は、 試料をィォ ン化するためのイオン源 1 2, 質量分析部 1 3、 および検出部 1 4から 構成されている。 また、 データ処理部 1 7には、 キーボード 1 8 と、 表 示装置 1 9が具備されている。
データ処理装置 1 7は、 インターネッ ト等の外部の公衆回線に接続可 能であり、 これにより、 ネッ ト上に接続されたデータべ一スにアクセス し、 必要な情報を入手することが出来る。 また、 データべ一スの情報は、 CD— ROM等の記録メディアを用いて入手しても良い。
またこの実施例では、 クロマトグラフ装置とイオントラップ型の質量 分析計を図示したが、 質量分析計には、 MS 1分析によって前駆イオン を選択し M S 2分析を行うこと (所謂、 M S /M S分析) が可能な全て の質量分析計が適用可能である。 イオン源には、 タンパク質やペプチド をなるベく壊さないようにイオン化できるイオン源が好ましく、 例えば エレク トロスプレイイオン源 ( E S I : ElectroSpray Ionization) を 用いることが出来る。 また、 クロマトグラフ装置は必ずしも必要ではな く、 マ ト リ クス支援レーザー脱離イオン化法 (MA L D I : Matrix Assisted Laser Desorpt ion Ionization) なとを用レ る質量分析計であ つても応用できる。
〇処理内容
第 1図において本実施例の基本的な処理を示す。 尚、 本実施例におけ るタンパク質の同定には、 夕ンパク質を所定の消化酵素で酵素消化して 生成したペプチドを質量分析し、 得られたマススペク トルの各ピークを 更に開裂し質量分析して (MS/MS分析) 得られるマススペク トルを 用いるものとする。 第 1図では、 M S /M S分析のための前駆イオンの 選択手法について示している。
また、 ここでは酵素消化されたヒト由来タンパク質を試料として想定 している。
以下、 第 1図の流れに沿って説明する。
( a) タンパク質のデ一夕べ一ス
まず、 比較対照のタンパク質のデ一夕べ一スとして、 アミノ酸配列が 登録されているものを選定する。 なお、 ヒト由来のタンパク質に着目す るのであれば、 少なく とも生物種に関する情報が含まれているデータべ ースを選定する必要がある。
一例として、 米国 N C B I (National Center for Biotechnology Information) が公開してレ る、 n r (Non-redundant protein database) などが該当する。 これは、 各種のタンパク質のデータベースから、 タン パク質のアミノ酸配列を収集したものである。
(b) 特定タンパク質のアミノ酸配列集積
上記 ( a) のデータベースから測定の目的に合うタンパク質のァミノ 酸配列を集積する。
例えば、 N C B I の n r に登録されているものから、 スイス S I B (Swiss Institute of Bioinf or at ics) およひ E B I ( The European Bioinformatics Institute) が作成したタンパク質のデ一夕べ一ス (Swiss-Prot) 由来のものを抽出する。 さらにその中から、 生物種を ヒトに限定しアミノ酸配列を集積する。
( c ) 酵素消化後のペプチドのアミノ酸配列導出
上記 (b) によって集積したタンパク質を所定の消化酵素によって酵 素消化された後に生成されるべプチドのアミノ酸配列を求める。 求めた 配列はタンパク質ごとに整理する。 なお、 適用する消化酵素の種類は、 事前に指定する。
(d) ペプチドの分子イオンの質量計算
上記 ( c ) で求めた各タンパク質のペプチドが質量分析計において分 子イオンとして観測される際の質量を計算する。
なお、 質量の値は少数点以下を四捨五入し、 整数化したものを想定す る。 また、 個々の質量に対するペプチドが 1個存在する場合 1、 存在し ない場合 0を与える。 同一の質量を有するペプチドが複数ある場合、 そ の質量の縦軸の値には一致するべプチドの個数を与える。
( e ) 質量と頻度集積
上記 (d) で求めた各タンパク質のデータを質量ごとに集積し、 質量 と頻度の関係として集積する。 なお、 以下の説明では、 整数質量を m、 頻度を Fとし、 mに対応する Fの値を Fmと表す。
第 2図は、 2 0 0 2年 1 2月に取得した n r力、ら Swiss— prot のヒト 由来配列を抽出し、 さらにトリプシンで消化することを想定して求めた 質量ごとの頻度である。 この図でも明らかなように、 質量ごとの頻度の 値には大きなばらつきが認められる。 すなわち、 質量によって該当する ぺプチドの数が大きく異なることを示している。
( f ) 質量ごとの重み計算
上記 ( e ) で求めた質量ごとの頻度重みのパターンを計算する。 ここ では次の二つのパターンを想定している。
整数質量 (m) ごとの重みを Wmとすると、 その値は次のようにして 求めることができる。
Wm= 1 / (Fm+ 1 ) … ( 1 ) この ( 1 ) 式では、 頻度が 0に近いほど重みが大きくなる。 結果を重みパターン 1 とする。
続いて、 次の式によって重みパターン 2を求める。
Figure imgf000010_0001
この場合、 重みパターン 1 とは反対に、 頻度の値が大きいほど重みも 大きくなる。
このように、 本実施例では、 2種類の重みパターンを作成している。 それぞれは、 頻度が小さいものを強調するパターンと、 頻度が大きいも のを強調するものである。
これまでの処理は、 質量分析計による測定に先立ち、 事前に準備して おく。 ( g) 以降は、 実際の試料に対して行うものである。
( g) M S 1分析
ヒト由来の試料を上記 ( c ) と同一条件で酵素消化し、 M S 1分析を 行う。
( h ) MS 1スペク トル
M S 1分析によって得られる M S 1スぺク トルは、 一般に質量対電荷 比と強度の関係として求めることができる。 ここで観測されるイオンが 前駆イオンの候補となる。
( i ) 質量抽出
上記 (h) で得られた M S 1スペク トルから、 質量の情報を抽出する。 具体的には、 各質量において M S 1スぺク トルにあらかじめ指定した閾 値以上のピークが存在すれば 1、 存在しなければ 0を与える。 すなわち、 該当する質量に対応するピークの有無を 0 , 1の 2値で示す。 なお、 こ こでは重みパターンと整合性を保っため、 整数化した質量を採用する。
2値化された値を Eとすると、 整数質量 (m) ごとの Eの値は Emと表 すことができる。
( j ) 擬似スぺク トル作成
上記 ( i ) で得たピークの有無と、 ( f ) で求めた重みパターンから、 擬似スペク トルを生成する。 重みパターンを Wm、 ピークの有無を Em とすると、 擬似スぺク トルの強度 I mは次式で求めることができる。
I m = WraXEm … ( 3 ) この式では、 擬似ピークの強度は重みパターンの値を反映したものと なる。 また、 2種類の重みパターンを採用する場合、 擬似スぺク トルも 2種類作成する。 すなわち、 重みパターン 1は擬似スペク トル 1 に、 重 みパターン 2は擬似スぺク トル 2に反映される。
( k) 前駆イオン選択と M S ZMS分析
M S 2分析を行うべき前駆イオンを、 ( j ) で求めた擬似スペク トル の強度に着目して選択する。 ここでは、 擬似スペク トル 1, 2および両 方を利用し前駆イオンを選択する例を方式 1, 2 , 3に分けて説明する。 方式 1では、 擬似スペク トル 1 を利用して前駆イオンを選択する。 す なわち、 擬似スペク トル 1の強度に着目し、 その値の大きい順に前駆ィ オンとして採用する。 ここで、 擬似スペク トル 1は低頻度の質量を強調 した重みパターン 1が採用されている。 すなわち、 ここで選択した前駆 イオンの質量は、 上記 ( c ) で求めた酵素消化後のペプチドのアミノ酸 配列において低頻度に出現するものである。
第 1図に示した例では、 ③—⑤—①—④—②の順に前駆イオンの質量 が決定され、 M S /M S分析が実施される。
また、 方式 1においては、 頻度が 0の場合、 擬似スペク トルの強度が 1 となる。 これは、 データべ一ス内に対応するペプチドの情報が存在し ないことを意味する。 測定後のタンパク質の同定処理を想定した場合、 3
1 0
最低でも一つのぺプチドが対応していることが望ましいので、 強度 1 と なる質量は除外すべきである。 また、 頻度が大きい場合、 擬似スぺク ト ルの強度は 0に近い値になる。 この場合は、 低頻度の質量に着目する意 味が薄れてしまう。 このように、 前駆イオンの選択においては、 強度の 範囲が重要となる。 そこで、 事前に擬似スペク トルの強度の範囲を指定 しておき、その範囲において大きいものから選択することが必要である。 もし、 擬似スペク トルの強度が 1 (頻度が 0 ) となる質量を前駆ィォ ンとして選択した場合、 上記 ( c ) で質量を求めた計算条件に該当しな い未知のタンパク質由来のペプチドである可能性がある。 また、 該当す る場合でも、 翻訳後修飾により質量が増減している場合なども考えられ る。 逆に、 そのようなものを優先して取得したい場合には、 前駆イオン の対象を擬似スぺク トルの強度が 1のものに限定する。
また、 擬似スペク トルの強度が 1 (頻度が 0 ) となる質量を除外した 上で擬似スぺク トルの強度が高いものから前駆イオンを選択した場合、 該当するぺプチドの情報がデータべ一ス中に存在し、 その数が比較的少 ないことを示している。 これは、 測定後の後処理においてペプチドや夕 ンパク質を同定する際に、 少ない候補から絞り込むことができることを 意味する。 すなわち、 ペプチドやタンパク質の同定精度の向上に寄与す る。 目的の成分を同定するまで測定を繰り返すような場合には、 試料の 量の低減に直接寄与することができる。 さらに、 候補となるペプチドが 少ないことより、 絞り込みに要する時間の低減にも寄与できる。
方式 2は、 高頻度の質量を強調した擬似スペク トル 2から前駆イオン を選択するものである。 この場合も、 強度の大きなものから順に前駆ィ オンを選択する。 この方式によって前駆イオンを選択した場合、 その質 量は上記 ( c ) で求めた酵素消化後のペプチドのアミノ酸配列において 高頻度に出現する。 すなわち、 測定後のタンパク質の同定において、 該 当するタンパク質を幅広く選択したい場合に向いている。
なお、 第 1図の例では、 ② ④—① ③の順番で前駆イオンが選 択され、 M S Z M S分析が実施される。
方式 2の場合、 同じ配列情報を有するタンパク質群として、 異なる生 物種において共通する祖先を持つオルソロガス遺伝子由来のタンパク質, 種内で遺伝子重複後に変異が蓄積されたパラロガス遺伝子由来夕ンパク 質、 およびゲノム上の同じ遺伝子領域から異なる m R N Aが生成される スプライス · バリアント由来のタンパク質などについての情報を得る可 能性が高まる。
方式 3は、 方式 1 と方式 2のそれぞれで順序付けられた前駆イオンを 交互に採用するものである。 第 1図の例では、 方式 1の選択結果を優先 し、 ③→ →⑤—④—①の順番を得ている。 この場合は、 低頻度と高頻 度の質量を順に指定することにより、 測定後のタンパク質の同定におい て、 タンパク質の同定精度を上げるとともに、 幅広くタンパク質を選択 したい場合などに向いている。
上記の方式 1〜 3の方式のどれを採用するか、 また方式 3において高 頻度を優先するか低頻度を優先するかなどの設定は、 測定に先立ち指定 しておく。 尚、 上記の説明においてはアイソ トープ (同位体) 並びに多 価イオンの影響を省略している。
また、 本実施例では、 実試料を質量分析して得られたマススペク トル 中の全てのピークを前駆ィオンとするのではなく、 順位付けした質量の 先頭から何番目の質量までを前駆イオンとするのかについて予め設定す る機能を備える。 L C Z M Sで分析を行う場合や M A L D I—M Sなど で極微量の試料を分析する際は、 ①〜⑤のような前駆イオンの候補とな るピークが観測される時間は限られているため、 全てのマススぺク トル のピークについて M S /U S分析を行うための時間が取れない場合が多 い。 このような場合に本実施例のように有効と思われる質量から順序付 けを行い、 前駆イオンとする手法は非常に有効である。
すなわち、 MA L D I — MSなどの場合には前駆イオンの候補となる ピークが観測されるであろう時間を勘案し、 前駆イオンとして選択する 数として、 その時間中に測定可能な範囲内でなるべく大きい値を設定す る。 L CZM Sなどの場合、 前駆イオンの候補が観測される時間内に分 析を終える必要があることから、 MS分析ならびに M S ZM S分析に要 する時間を考慮した上で、 前駆イオンとして選択する数を設定する。
( 1 ) M S ZM Sスペク トルを用いた同定処理
最後に、 上記 (k) のステップで選択した前駆イオンの M SZMSス ベク トルを用いて同定処理を行う。 同定処理に関しては、 上記 ( c ) の ステツプで集積したデータと、 前駆イオンを分析して得られた M S / MSスぺク トルとを用いて行う。
以上が一連の処理の流れである。
ここで、 第 3図に示した装置構成と、 第 1図に示す処理内容との対応 を次に示す。 第 1図における特定タンパク質のアミノ酸配列集積から質 量ごとの重み計算までをデ一夕処理部 1 7において実施する。 ここで作 成された重みパ夕一ン 1 と 2を、 試料の分析が開始される前に制御部 1 5に転送しておく。 測定に際しては、 制御部 1 5において試料の MS1 分析が行われ、 M S 1スペク トルが取得される。 そこで、 質量抽出, 擬 似スペク トル作成、 および前駆イオン選択の各処理を行う。 制御部 1 5 では、 選択された前駆イオンに対し M S 2分析を行い、 M S 2スぺク ト ルを取得する。 場合によっては、 さらに次の前駆イオンから M S 2スぺ ク トルを取得する工程を繰り返す。 以上が、 第 1図の手法を第 3図の装 置構成に適用した場合の基本的な流れとなる。
以上のように、 本実施例においては、 1回の試料導入によって M S 1 分析と MS 2分析を行うことを前提としている。 もし、 同じ試料を複数 回に分けて導入できる場合、 1回目の測定において全ての MS 1スぺク トルを求めた後で、 一括して本手法による前駆イオンの選択を行い、 2 回目以降の測定を行うこともできる。 その場合は、 前駆イオンの選択を 制御部 1 5で行うのではなく、 データ処理部 1 7が担当する。
また、 測定に際しては、 前駆イオンの指定を測定開始からの時間など に依存して切り替える手法が適用できる。
〇測定条件設定画面
試料を測定する前に実施する各種条件の設定画面を第 4図に示す。 な お、 基本的には第 1図に示す方法に則り、 第 2図のデータ処理部 1 7に おける表示装置 1 9およびキーボード 1 8によって実現することを想定 している。
第 4図に示す画面において、 タンパク質選択条件, 頻度および重みパ ターンの計算条件と結果、 および前駆イオン選択および M S/M S分析 条件の設定等を可能としている。 以下に、 それぞれの概要を示す。
( a) タンパク質選択条件
この部分では、 夕ンパク質のデータベースから特定のタンパク質のァ ミノ酸配列を集積するための条件として、 データベースおよび生物種を リストから選択し、 目的の機能などに相当するキ一ワードを設定する。 この例では、デ一夕ベースとして " Swiss— pro 'を、 生物種として" homo sapiens" (ヒト) を選択している。また、キーワードには、 "zinc finger" を入力している。 なお、 Zinc Finger とは、 D NAに結合するタンパク 4
質に見られる機能部位である。 そのような機能部位を有するタンパク質 は、 DN Aから mRN Aへの転写機能に関わっている可能性があるとさ れている。 すなわち、 Swiss— prot のヒト由来のタンパク質から、 zinc fingerに関するものを集積するよう指定したものである。
(b) 頻度および重みパターン計算条件
この部分では、 上記 ( a) によって指定された特定のタンパク質のァ ミノ酸配列を集積した後、 質量に対応する頻度情報を計算するための条 件を設定する。 まず、 対応する修飾の種類、 および消化酵素を選択する。 続いて、 分子イオンの質量に影響を及ぼすイオン化方法を選ぶ。 さらに 頻度を計算するための質量精度と、 計算範囲、 および質量の定義を指定 している。
なお、 修飾の設定においては詳細を省略しているが、 その部位や修飾 される確率などの指定も重要となる。 さらに、 消化酵素についても、 消 化が不十分な場合についての指定などが考えられるが、 ここでは省略し た。
( c ) 頻度および重みパターン計算結果
この部分では、 頻度, 重みパターン 1, 重みパターン 2の中から、 指 定された計算結果をグラフ表示する。 なお、 グラフは、 必要に応じて拡 大, 縮小できることが望ましい。
(d) 前駆イオン選択および MS/MS分析条件
ここでは、 前駆イオンを選択するための各種条件を設定する。
まず、 前駆イオンの質量を限定するための質量範囲の入力、 および M S 1のマススぺク トルにおけるイオン強度の閾値を設定する。 続いて、 擬似スぺク トルから前駆イオンを選択する際の強度範囲を、 低頻度と高 頻度の場合について指定する。 さらに、 前駆イオンの選択条件を、 "低 頻度から" , "高頻度から" , "高→低を交互に" , "低→高を交互に" の中から選択する。 また、 前駆イオンとして選択すべき数を回数や時間 などから指定できるよう、 M S M S分析の繰り返し条件として、 数値 と単位の指定を可能とした。単位はプルダウンメニューから指定できる。 回数を指定した場合、 数値は M S / M S分析を行う回数を意味する。 即 ち、 「前駆イオン」 の項目で指定された方式で順序付けられたイオンの 内、 優先度の高いものから何番目までのイオンを前駆イオンとするかの 指定である。 時間を指定した場合には、 M S分析によって前駆イオンを 選択してから、最後の M S / M S分析が終わるまでの時間を示している。 すなわち、 ここで設定された時間を超えた場合、 次の候補のイオンは M S Z M S分析を行わないものとする。
〇測定結果の表示
第 5図に前駆イオン選択結果のグラフとテーブルを示す。
グラフには予めデータべ一スから抽出した情報から得られる頻度情報 と、 実際に試料を分析して得られるマススぺク トルをオーバーラップさ せて表示する。 また、 前駆イオンとして選択したイオンはピーク トップ に ·印を、 非選択のものは♦印を付け区別した。 このグラフも必要に応 じて拡大, 縮小できることが望ましい。
テーブル表示においては、 マススぺク トルの質量, イオン強度, 頻度、 および選択の可否を示している。 ここでは、 第 4図で前駆イオンの選択 が "低頻度から" と設定されていることに合わせて、 頻度の低いものか ら順にソ一トして表示し、 頻度に着目しやすく したテーブルを示す。 この表示画面によれば、 測定後にデータ処理部 1 7において、 マスス ぺク トルから選択した前駆イオンと前駆イオンの候補、 および適用した 頻度情報が表示装置 1 9に同時に表示されるため、 指定した条件で前駆 イオンが選択されたかどうかを検証することができる。
◎第 2の実施例
本実施例は、 あらかじめ集積したタンパク質のアミノ酸配列から、 そ れぞれのタンパク質の質量と頻度として整理するものである。
この実施例も、 基本的には第 1図に示す手法と同様の流れになる。 た だし、 集積された特定タンパク質のアミノ酸配列から質量と頻度として 集積するまでの部分が異なる。 (第 1図と異なり、 酵素消化後のぺプチ ドのアミノ酸配列を算出しない。 ) 第 6図にその部分を示す。
第 6図の基本的な流れに沿って説明する。
( a) 特定タンパク質のアミノ酸配列
第 1図に示す特定タンパク質のアミノ酸配列と同様に、 タンパク質の データベースから生物種などの指定によって目的のタンパク質に対応す るアミノ酸配列を集積する。
(b) タンパク質の分子イオンの質量計算
上記 ( a) で集積した各タンパク質が分子イオンとして観測される際 の質量を計算する。 なお、 質量の値は少数点以下を四捨五入し、 整数化 したものを想定する。個々の質量に対する分子イオンが存在する場合 1、 存在しない場合 0を与える。
( c ) 質量と頻度集積
上記 (b) で求めた各タンパク質のデータを集積し、 質量ごとの頻度 として集積する。
第 7図は Swiss— prot のヒ ト由来タンパク質から、 さ らに "Zinc Finger" と記載されたものを集積し、 頻度情報として整理したものであ る。 すなわち、 この図は集積されたタンパク質の分子量分布を示してい る タンパク質は、 分子量が非常に大きいものが多いため、 一般的な四重 極質量分析計やイオントラップ型の質量分析計では測定が困難であり、 このような装置を用いる場合は、 第 1の実施例のようにべプチドに酵素 消化したものを前提に同定を行う。 これに対して本実施例においては、 タンパク質そのものを測定できる質量分析装置 (例えば、 飛行時間型質 量分析計 (TO F— M S) ) を用いることを想定したものであり、 この ような装置を用いて本実施例のような頻度情報を適用することによって、 ぺプチドに酵素消化せずに、 特定の質量のタンパク質を選択的に分析す ることが可能となる。
◎第 3の実施例
本実施例では、 特定のタンパク質に対する選択性を向上させる例を示 す。 特に、 ここでは、 遺伝子の発現に関わると考えられている "Zinc Finger" と称する機能部位を有するタンパク質に着目した。 なお、 この 実施例は、 第 1図の実施例を拡張したものである。
第 8図に概要を示す。 この例では第 1図における質量と頻度集積まで の流れを多重化し、 それらの結果から頻度差を求めている。 また、 第 9 図に頻度の計算例としてグラフを挙げた。
以下、 第 8図の流れに従い概要を説明する。
( a) タンパク質のデータベース
第 1図に示す特定タンパク質のアミノ酸配列と同様に、 タンパク質の データベースから生物種などの指定によって目的のタンパク質に対応す るアミノ酸配列を集積する。
(b) タンパク質の選択条件 1による処理
上記 ( a) のタンパク質のデータベースから、 選択条件 1によって特 定のタンパク質を選択し、 アミノ酸配列の集積, 酵素消化後のペプチド 8
のアミノ酸配列の導出, ペプチドの分子イオンの質量計算, 質量と頻度 の集積の各処理を行う。 この流れは、 第 1図に示すそれぞれの処理と同 じものである。
第 9図のグラフ (A) は、 タンパク質の選択条件 1による処理結果の 例である。 これは、 Swiss— prot のヒト由来タンパク質を集積し、 トリ プシンで消化した場合の頻度を示している。
( c ) タンパク質の選択条件 2による処理
上記 ( a) のタンパク質のデータベースから、 選択条件 2によって特 定のタンパク質を選択し、 アミノ酸配列の集積, 酵素消化後のペプチド のアミノ酸配列の導出, ペプチドの分子イオンの質量計算, 質量と頻度 の集積の各処理を行う。 この流れは、 第 1図に示すそれぞれの処理と同 じものである。
上記 (b) のタンパク質の選択条件 1による処理とは、 タンパク質を 選択する際の条件が異なっている。 第 9図のグラフ (B) は、 タンパク 質の選択条件 2による処理結果の例である。 これは、 Swiss— prot のヒ ト由来タンパク質から、 さらに "Zinc Finger" の記載があるものを集 積し、 それをトリプシンで消化した場合を想定した。
( d) 頻度差の計算
上記 ( 2 ) および ( 3 ) で求めた質量と頻度の関係を質量ごとに減算 し、 その差を求める。 なお、 双方の頻度の総数が異なる場合、 その比を 乗じて是正するなどの処理を行う。
頻度差の計算例として、 第 9図のグラフ (C) を示す。 ヒれはグラフ (B) からグラフ (A) を質量ごとに減算したものである。 ただし、 グ ラフ (A) と (B) では、 ペプチドの総数が異なるため、 ここではダラ フ (B) の側にそれぞれのグラフのぺプチド総数の比を乗じて調整した。 9
このグラフ ( C ) において、 例えば 6 6 7や 1 0 7 2などの質量が突出 している。 これらの質量には、 多くの Zinc Fingerに共通するペプチド が対応している可能性がある。 ちなみに、 1 0 7 2に対応するペプチド (IHTGEKPYK; アミノ酸の 1文字表記)は Zinc Finger によく見られるも のであ り、 このペプチドを前駆イオンとして選択する ことは、 Zinc Fingerの同定において非常に重要となる。
すなわち、 グラフ (C) の頻度情報を活用し、 頻度の数値の大きい質 量を前駆イオンとして選択した場合、 Zinc Finger 関連のタンパク質の 選択性を向上させることができる。
この例では、 データベースに登録されているタンパク質のアミノ酸配 列をそのまま適用している。 しかし、 タンパク質のアミノ酸配列には、 高頻度に繰り返されるものが知られている。 従って、 場合によっては、 このような繰り返し配列を無視するなどの処置が望ましい。
その他の応用として、 生物種, タンパク質の機能, 構造上の特性, 細 胞内での局在部位, 発現パターン, 特定の疾患, データの出処などを考 慮し、 タンパク質の選択条件を決定することにより、 それらのタンパク 質由来のぺプチドの選択性を向上できる可能性がある。
また、 シグナル伝達などの研究分野においては、 チロシンのリン酸化 が重要な意味を持つ。 そこで、 着目するタンパク質において、 チロシン がリン酸化されたべプチド断片に対する選択性を向上させる手法は有用 と考える。 非修飾のタンパク質において頻度情報を作成した場合、 修飾 によって質量差が生じるため、 低頻度の質量を選択することによって修 飾されたペプチドの選択性が高まる。 さらに、 厳密に非修飾と修飾につ いて頻度情報の差を求める手法も有意である可能性がある。
生体組織に微量に存在する夕ンパク質を精製することは困難である。 特に、 夾雑物となるタンパク質やべプチドを同定する必要がある場合、 目的のもの以外の選択性を高めることは有用となる。 この場合も、 目的 のタンパク質について頻度情報を作成し、 低頻度の質量に着目して前駆 イオンを選択することにより、夾雑物の選択性が向上すると考えられる。
以上に示す通り、 本発明は、 分析の目的に合致した頻度情報を用いて 同定処理に必要な M S Z M Sスぺク トルを得るための前駆イオンを効率 良く選択することができ、 同定精度の向上や処理時間の短縮を図ること が可能となる。

Claims

請 求 の 範 囲
1 . 試料をイオン化し、 質量分析装置を用いてタンパク質の分析を行う 質量分析方法において、
タンパク質ゃぺプチドの情報が格納されたデータベースより、 所定の 情報を選出し、 当該選出された成分の質量を推測し、 質量ごとの頻度情 報を算出し、
試料を質量分析装置によって分析してマススぺク トルを得、 当該得ら れたマススぺク トルと前記頻度情報に基づいて同定に用いるべき質量を 選出し、 当該選出された質量のマススぺク トルを前駆イオンとして質量 分析し、 得られたマススペク トルを用いて同定処理を行うことを特徴と する質量分析方法。
2 . 請求項 1 において、
前記データベースから入手した成分情報の質量を推定する際に、 各夕 ンパク質を所定の消化酵素によって酵素消化した後のぺプチドを推定し、 ぺプチド毎に質量を推定することを特徴とする質量分析方法。
3 . 請求項 1 において、
前記前駆イオンとして選択する数を予め設定することを特徴とする質 量分析方法。
4 . 試料をイオン化し、 質量分析装置を用いてタンパク質の分析を行う 質量分析方法において、
( A ) 夕ンパク質に関する情報を格納した外部のデータベースから複数 のタンパク質の情報を入手するステップと、
( B ) 上記入手したタンパク質ごとに質量を推定するステツプと、
( C ) 前記推定した質量が存在すれば 1、 存在しなければ 0 として正規 化し、 全てのタンパク質の推定結果を合計して質量ごとの頻度とし て求め、 重みパターンを算出するステップと、
(D) 試料を測定し、 質量スペク トルを得るステップと、
(E) 試料のスペク トルに対し、 質量が存在すれば 1、 存在しなければ 0 として正規化するステツプと、
(F) 前記重みパターンに対して前記正規化した実試料のスぺク トルを 重畳し、 擬似スぺク トルを作成するステツプと、
(G) 前記作成された擬似スペク トルに基づき、 前記試料のマススぺク トルの中から M S/M S分析すべき前駆イオンを選択するステツプ とを有することを特徴とする質量分析方法。
5. 請求項 4において、
前記重みパターンを算出する際に、 前記頻度が高い順に重み付けを行 う第 1のパターンと、 前記頻度の低い順に重み付けを行う第 2のパタ一 ンを作成することを特徴とする質量分析方法。
6. 請求項 5において、
前記第 2のパターンにおいて、 重み付けの値が最高値を示す質量は、 前記 M S /M S分析すべき前駆イオンを選択する際に、 除外されること を特徴とする質量分析方法。
7. 請求項 4において、
上記データベースから情報を入手する際の条件を複数設定し、 各条件 設定によって得られたそれぞれの入手情報に対して上記 (B ) および (C) のステップを行い、 各条件設定の重みパターンの頻度における差 分を求め、 新たな重みパターンを得ることを特徴とする質量分析方法。
8. 試料をイオン化するイオン化部, 質量分析を行う質量分析部, 分析 条件の設定や分析結果のデータ処理を行うデータ処理部を備えた質量分 析装置において、 前記データ処理部は、
予め設定された条件に従って、 夕ンパク質に関する情報を格納したデ 一夕ベースから情報を入手し、 入手したタンパク質に対してピークが存 在する質量の数をカウントして頻度情報として纏める事前準備処理と、 実試料を質量分析して得たマススぺク トルに対応させ、 前記頻度情報 で得た頻度に応じて M S / M S分析すべき前駆イオンを選択する前駆ィ オン選択処理を行うことを特徴とする質量分析装置。
9 . 請求項 8において、
前記データ処理部は、 表示部を有し、
当該表示部に、 前記質量ごとの頻度情報を表示し、 且つ当該表示内容 に前記実試料を質量分析して得られたマススぺク トルを重畳表示するこ とを特徴とする質量分析装置。
1 0 . 請求項 8において、
前記実試料を質量分析して得られたマススぺク トル中の各ピークに対 して、 前駆イオンとして選択されたか否かを表示することを特徴とする 質量分析装置。
PCT/JP2003/007923 2003-06-23 2003-06-23 質量分析方法および質量分析装置 WO2004113905A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005500921A JP4058449B2 (ja) 2003-06-23 2003-06-23 質量分析方法および質量分析装置
PCT/JP2003/007923 WO2004113905A1 (ja) 2003-06-23 2003-06-23 質量分析方法および質量分析装置
US10/561,771 US7691643B2 (en) 2003-06-23 2003-06-23 Mass analysis method and mass analysis apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2003/007923 WO2004113905A1 (ja) 2003-06-23 2003-06-23 質量分析方法および質量分析装置

Publications (1)

Publication Number Publication Date
WO2004113905A1 true WO2004113905A1 (ja) 2004-12-29

Family

ID=33524182

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/007923 WO2004113905A1 (ja) 2003-06-23 2003-06-23 質量分析方法および質量分析装置

Country Status (3)

Country Link
US (1) US7691643B2 (ja)
JP (1) JP4058449B2 (ja)
WO (1) WO2004113905A1 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006170710A (ja) * 2004-12-14 2006-06-29 Mitsui Knowledge Industry Kk ピークの抽出方法および該方法を実行するためのプログラム
JP2006329881A (ja) * 2005-05-27 2006-12-07 Hitachi High-Technologies Corp 質量分析システムおよび質量分析方法
JP2006329896A (ja) * 2005-05-30 2006-12-07 Hitachi High-Technologies Corp 質量分析方法及び質量分析装置
JP2008039608A (ja) * 2006-08-07 2008-02-21 Hitachi High-Technologies Corp 質量分析システム
JP2008541021A (ja) * 2005-05-04 2008-11-20 アイトゲネーシッシュ テヒニッシュ ホッホシュレ チューリッヒ 質量分析法
WO2010116409A1 (ja) * 2009-04-07 2010-10-14 株式会社島津製作所 質量分析データ処理方法及び装置
JP2012225862A (ja) * 2011-04-22 2012-11-15 Shimadzu Corp 質量分析データ処理装置
JP2015508497A (ja) * 2011-12-28 2015-03-19 メディマス・クタトー・エッフェーイェーッシュテー・エッシュ・エッゾガルタトー・ケーエフティー 液相試料の急速蒸発イオン化を行うためのシステムおよび方法
CN110146353A (zh) * 2019-04-29 2019-08-20 中国科学院动物研究所 生化样品原位处理装置及磷酸化蛋白的质谱成像方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4985153B2 (ja) * 2007-07-03 2012-07-25 株式会社島津製作所 クロマトグラフ質量分析装置
US8492073B2 (en) * 2008-03-31 2013-07-23 E I Du Pont De Nemours And Company Method for thermal development with a conformable support
US9659146B2 (en) 2011-05-02 2017-05-23 Tyler Stuart Bray Method for quantitative analysis of complex proteomic data
KR20140009641A (ko) * 2012-07-12 2014-01-23 서울대학교산학협력단 일정한 온도에서 생성된 이온들의 질량 스펙트럼을 측정하는 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05164751A (ja) * 1991-12-19 1993-06-29 Shimadzu Corp クロマトグラフ/質量分析計用データ処理装置
WO1995025281A1 (en) * 1994-03-14 1995-09-21 University Of Washington Identification of nucleotides, amino acids, or carbohydrates by mass spectrometry
JPH08124519A (ja) * 1994-10-21 1996-05-17 Shimadzu Corp Ms/ms質量分析装置用データ処理装置
JPH10274640A (ja) * 1997-03-31 1998-10-13 Hitachi Ltd 質量分析方法及び装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05164751A (ja) * 1991-12-19 1993-06-29 Shimadzu Corp クロマトグラフ/質量分析計用データ処理装置
WO1995025281A1 (en) * 1994-03-14 1995-09-21 University Of Washington Identification of nucleotides, amino acids, or carbohydrates by mass spectrometry
JPH08124519A (ja) * 1994-10-21 1996-05-17 Shimadzu Corp Ms/ms質量分析装置用データ処理装置
JPH10274640A (ja) * 1997-03-31 1998-10-13 Hitachi Ltd 質量分析方法及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SPAHR C.S. ET AL.: "Simplification of complex peptide mixtures for proteomic analysis: Reversible biotinylation of cysteinyl peptides", ELECTROPHORESIS, vol. 21, no. 9, May 2000 (2000-05-01), pages 1635 - 1650, XP008009368 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4621491B2 (ja) * 2004-12-14 2011-01-26 三井情報株式会社 ピークの抽出方法および該方法を実行するためのプログラム
JP2006170710A (ja) * 2004-12-14 2006-06-29 Mitsui Knowledge Industry Kk ピークの抽出方法および該方法を実行するためのプログラム
JP2008541021A (ja) * 2005-05-04 2008-11-20 アイトゲネーシッシュ テヒニッシュ ホッホシュレ チューリッヒ 質量分析法
JP2006329881A (ja) * 2005-05-27 2006-12-07 Hitachi High-Technologies Corp 質量分析システムおよび質量分析方法
JP4523488B2 (ja) * 2005-05-27 2010-08-11 株式会社日立ハイテクノロジーズ 質量分析システムおよび質量分析方法
JP2006329896A (ja) * 2005-05-30 2006-12-07 Hitachi High-Technologies Corp 質量分析方法及び質量分析装置
JP4522910B2 (ja) * 2005-05-30 2010-08-11 株式会社日立ハイテクノロジーズ 質量分析方法及び質量分析装置
JP2008039608A (ja) * 2006-08-07 2008-02-21 Hitachi High-Technologies Corp 質量分析システム
WO2010116409A1 (ja) * 2009-04-07 2010-10-14 株式会社島津製作所 質量分析データ処理方法及び装置
JP5293809B2 (ja) * 2009-04-07 2013-09-18 株式会社島津製作所 質量分析データ処理方法及び装置
US9305755B2 (en) 2009-04-07 2016-04-05 Shimadzu Corporation Mass analysis data processing method and mass analysis data processing apparatus
JP2012225862A (ja) * 2011-04-22 2012-11-15 Shimadzu Corp 質量分析データ処理装置
JP2015508497A (ja) * 2011-12-28 2015-03-19 メディマス・クタトー・エッフェーイェーッシュテー・エッシュ・エッゾガルタトー・ケーエフティー 液相試料の急速蒸発イオン化を行うためのシステムおよび方法
US9805922B2 (en) 2011-12-28 2017-10-31 Micromass Uk Limited System and method for rapid evaporative ionization of liquid phase samples
CN110146353A (zh) * 2019-04-29 2019-08-20 中国科学院动物研究所 生化样品原位处理装置及磷酸化蛋白的质谱成像方法

Also Published As

Publication number Publication date
JP4058449B2 (ja) 2008-03-12
JPWO2004113905A1 (ja) 2006-07-20
US7691643B2 (en) 2010-04-06
US20070059842A1 (en) 2007-03-15

Similar Documents

Publication Publication Date Title
US11646185B2 (en) System and method of data-dependent acquisition by mass spectrometry
Kapp et al. An evaluation, comparison, and accurate benchmarking of several publicly available MS/MS search algorithms: sensitivity and specificity analysis
JP5008564B2 (ja) 混合物中のタンパク質を同定する方法および装置
Lam et al. Development and validation of a spectral library searching method for peptide identification from MS/MS
EP0750747B1 (en) Identification of amino acids by mass spectrometry
Xu et al. MassMatrix: a database search program for rapid characterization of proteins and peptides from tandem mass spectrometry data
US8987662B2 (en) System and method for performing tandem mass spectrometry analysis
Blueggel et al. Bioinformatics in proteomics
US20100288917A1 (en) System and method for analyzing contents of sample based on quality of mass spectra
JP5750676B2 (ja) 細胞識別装置及びプログラム
WO2009073505A2 (en) Methods for processing tandem mass spectral data for protein sequence analysis
WO2004113905A1 (ja) 質量分析方法および質量分析装置
CN110692118A (zh) 质谱仪碰撞能量的自动测定
WO2006129401A1 (ja) プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法
US9702882B2 (en) Method and system for analyzing mass spectrometry data
EP1820133A2 (en) Method and system for identifying polypeptides
JP6489224B2 (ja) ペプチド帰属方法及びペプチド帰属システム
Khatun et al. Incorporating sequence information into the scoring function: a hidden Markov model for improved peptide identification
JP4393206B2 (ja) 質量分析装置用データ処理装置
Del Boccio et al. Homo sapiens proteomics: clinical perspectives
WO2004086281A1 (en) Method for comparing proteomes
JP4286075B2 (ja) タンパク質同定処理方法
Xue et al. Protein probabilities in shotgun proteomics: Evaluating different estimation methods using a semi‐random sampling model
Li et al. Informatics for Mass Spectrometry-Based Protein Characterization
Wu et al. Peptide identification via tandem mass spectrometry

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2005500921

Country of ref document: JP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007059842

Country of ref document: US

Ref document number: 10561771

Country of ref document: US

122 Ep: pct application non-entry in european phase
WWP Wipo information: published in national office

Ref document number: 10561771

Country of ref document: US