JP5810983B2 - Compound identification method and compound identification system using mass spectrometry - Google Patents

Compound identification method and compound identification system using mass spectrometry Download PDF

Info

Publication number
JP5810983B2
JP5810983B2 JP2012054570A JP2012054570A JP5810983B2 JP 5810983 B2 JP5810983 B2 JP 5810983B2 JP 2012054570 A JP2012054570 A JP 2012054570A JP 2012054570 A JP2012054570 A JP 2012054570A JP 5810983 B2 JP5810983 B2 JP 5810983B2
Authority
JP
Japan
Prior art keywords
compound
candidate
composition
mass
formula candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012054570A
Other languages
Japanese (ja)
Other versions
JP2013190216A (en
Inventor
泰郎 小倉
泰郎 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to JP2012054570A priority Critical patent/JP5810983B2/en
Publication of JP2013190216A publication Critical patent/JP2013190216A/en
Application granted granted Critical
Publication of JP5810983B2 publication Critical patent/JP5810983B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions

Description

本発明は、質量分析装置、特にMSn(nは2以上の整数)分析可能な質量分析装置により得られる情報を利用して化合物の同定や構造解析を行う化合物同定方法及び化合物同定システムに関する。 The present invention relates to a compound identification method and a compound identification system for performing compound identification and structural analysis using information obtained by a mass spectrometer, particularly a mass spectrometer capable of analyzing MS n (n is an integer of 2 or more).

イオントラップ型質量分析装置などを用いた質量分析においてはMS/MS分析(タンデム分析)という手法が知られている。一般的なMS/MS(=MS2)分析では、まず分析対象である化合物由来の各種イオンから特定の質量電荷比m/zを有するイオンをプリカーサイオンとして選別し、その選別したイオンをCID(Collision Induced Dissociation:衝突誘起解離)によって解離させ、質量電荷比が小さなプロダクトイオンを生成する。このときの解離の態様は元の化合物の構造に依存する。そこで、解離によって生じたプロダクトイオンを質量分析してMS2スペクトルを取得し、これを解析することにより目的とする化合物を同定したりその化学構造を把握したりする。また、分子量が大きな化合物や開裂しにくい化合物等、一段階のCID操作では充分に小さな質量電荷比のイオンまで解離しない場合には、CID操作を複数回繰り返し、最終的に生じたプロダクトイオンを質量分析するMSn分析が行われることもある。 In mass spectrometry using an ion trap mass spectrometer or the like, a technique called MS / MS analysis (tandem analysis) is known. In general MS / MS (= MS 2 ) analysis, first, ions having a specific mass-to-charge ratio m / z are selected as precursor ions from various ions derived from the compound to be analyzed, and the selected ions are identified by CID ( Collision Induced Dissociation) to produce product ions with a small mass-to-charge ratio. The mode of dissociation at this time depends on the structure of the original compound. Therefore, mass spectrometry is performed on product ions generated by dissociation to obtain an MS 2 spectrum, and by analyzing this, the target compound is identified and its chemical structure is grasped. Also, if the compound with a large molecular weight or a compound that is difficult to cleave, etc., does not dissociate into ions with a sufficiently small mass-to-charge ratio by one-step CID operation, the CID operation is repeated a plurality of times, and the final product ions are massed. An MS n analysis to analyze may be performed.

質量分析(MSn分析を含む)により得られたデータから試料に含まれる未知の化合物を同定する場合、取得されたデータを、化合物の名前、組成式、分子量、構造式などが収録された化合物データベースと照合するデータベース検索法が広く利用されている(特許文献1など参照)。こうした方法に使用される化合物データベースに収録される既知の化合物の数は年々増加し、現在では数千万もの化合物が収録されている。そのため、質量分析により得られる目的化合物由来のイオンの質量電荷比情報や推定組成式などを入力してデータベース検索を行うと、数百程度の候補化合物が抽出されるのが一般的である。このような膨大な数の候補化合物の全てについて、MSnスペクトル上のピークの帰属を確認することはきわめて困難である。その結果として、化合物同定は困難を極め、同定が可能である場合でも非常に時間が掛かることになる。 When identifying an unknown compound contained in a sample from data obtained by mass spectrometry (including MS n analysis), the acquired data is a compound that contains the compound name, composition formula, molecular weight, structural formula, etc. A database search method for collating with a database is widely used (see Patent Document 1). The number of known compounds recorded in the compound database used for such methods has been increasing year by year, and now tens of millions of compounds are recorded. For this reason, when a database search is performed by inputting mass-to-charge ratio information of an ion derived from a target compound obtained by mass spectrometry, an estimated composition formula, or the like, about several hundred candidate compounds are generally extracted. It is extremely difficult to confirm the assignment of peaks on the MS n spectrum for all of such a large number of candidate compounds. As a result, compound identification is extremely difficult, and even if identification is possible, it takes a very long time.

こうした課題に対し、非特許文献1では、組成式が利用可能である場合にサイファインダー(SciFinder)を利用したウェブベースのデータベース検索が好適であることが開示されている。また非特許文献2には、論文引用報告数などを利用して化合物を絞り込む方法が提案されている。しかしながら、こうしたいずれの方法によっても、広範な化合物を対象にして質量分析結果から化合物を予測する必要があり、MSnスペクトル上のピークの帰属を確認可能な程度の数まで候補を絞り込むのは容易ではない。 To deal with such problems, Non-Patent Document 1 discloses that web-based database search using a SciFinder is suitable when the composition formula is available. Non-Patent Document 2 proposes a method of narrowing down compounds using the number of paper citation reports. However, in any of these methods, it is necessary to predict compounds from mass spectrometry results for a wide range of compounds, and it is easy to narrow down candidates to a number that can confirm the assignment of peaks on the MS n spectrum. is not.

また、異なるアプローチによる化合物同定として、化合物由来のMSnスペクトル上の各ピークの質量電荷比の実測値を収録したデータベースを用い、未知化合物に対する質量分析結果との相同性を判断して該未知化合物を予測する方法も提案されている(非特許文献3参照)。しかしながら、こうしたデータベースは未だ充分に整備されておらず、収録されている化合物数は通常の化合物データベースと比べて格段に少ない(2011年12月現在14238個)。そのため、化合物を同定できない可能性も高い。 In addition, as a compound identification by a different approach, a database containing the measured values of the mass-to-charge ratio of each peak on the MS n spectrum derived from the compound is used to determine the homology with the result of mass spectrometry for the unknown compound. A method for predicting the above has also been proposed (see Non-Patent Document 3). However, such a database has not been sufficiently prepared, and the number of recorded compounds is much smaller than that of a normal compound database (14238 as of December 2011). Therefore, there is a high possibility that the compound cannot be identified.

米国特許第7197402号明細書US Patent No. 797402

ジェームス・エル・リトル(James L. Little)ほか2名、「アイデンティフィケイション・オブ・『ノウン・アンノウンズ』・ユーティライジング・アキュレイト・マス・データ・アンド・ケミカル・アブストラクツ・サービス・データベーシズ(Identification of “Known Unknowns” Utilizing Accurate Mass Data and Chemical Abstracts Service Databases)」、ジャーナル・オブ・ジ・アメリカン・ソサイエティ・フォー・マス・スペクトロメトリ(Journal of the American Society for Mass Spectrometry)、2011年、22、p.348-359James L. Little and two others, “Identification of“ Known Unknown ”Utilityizing Accurate Mass Data and Chemical Abstracts Service Databases ( Identification of “Known Unknowns” Utilizing Accurate Mass Data and Chemical Abstracts Service Databases ”, Journal of the American Society for Mass Spectrometry, 2011, 22, p.348-359 ウェンタ・リャオ(Wenta Liao)ほか2名、「アイデンティフィケイション・オブ・アンノウンズ・イン・アトモスフェリック・プレッシャ・イオナイゼイション・マス・スペクトロメトリ・ユージング・ア・マス・トゥー・ストラクチャ・サーチ・エンジン(Identification of Unknowns in Atmospheric Pressure Ionization Mass Spectrometry Using a Mass to Structure Search Engine)」、アナリティカル・ケミストリ(Analytical Chemistry)、2008年、80(20)、p.7765-7777Wenta Liao and two others, “Identification of Unknowns in Atmospheric Pressure Ionization Mass Spectrometry Using a Mass to Structure Search・ Engine (Identification of Unknowns in Atmospheric Pressure Ionization Mass Spectrometry Using a Mass to Structure Search Engine) ”, Analytical Chemistry, 2008, 80 (20), p.7765-7777 ホーライ(Horai H.)ほか34名、「マス・バンク:ア・パブリック・リポージトリ・フォー・シェアリング・マス・スペクトラル・データ・フォー・ライフ・サイエンシズ(MassBank: a public repository for sharing mass spectral data for life sciences)」、ジャーナル・オブ・マス・スペクトロメトリ(Journal of Mass Spectrometry)、2010年、45、p.703-714Horai H. and 34 others, “MassBank: a public repository for sharing mass spectral data for life sciences), Journal of Mass Spectrometry, 2010, 45, pp.703-714

本発明は上記課題を解決するために成されたものであり、その目的とするところは、質量分析により収集されたデータに基づいて化合物の同定や構造解析を効率的に且つ高い精度で行うことができる化合物同定方法及び化合物同定システムを提供することにある。   The present invention has been made to solve the above-mentioned problems, and the object of the present invention is to perform compound identification and structural analysis efficiently and with high accuracy based on data collected by mass spectrometry. It is an object of the present invention to provide a compound identification method and a compound identification system.

上記課題を解決するために成された第1発明は、測定対象の物質に由来するイオンをn−1(nは2以上の整数)段階に解離させるMSn分析を実行してMSnスペクトルを取得可能な質量分析装置を用い、未知化合物の同定や構造解析を行う化合物同定方法であって、
a)未知化合物に対する質量分析により得られたマススペクトルから求まる該未知化合物の分子量に基づいて組成式候補を求める組成式候補抽出ステップと、
b)前記組成式候補抽出ステップにより抽出された組成式候補毎に、分子量の理論値と実測値との一致性を示す組成スコアを算出する組成スコア計算ステップと、
c)化学構造情報が収録された化合物データベースに対するデータベース検索を利用して、前記組成式候補抽出ステップで抽出された各組成式候補に対応した構造式をそれぞれ推定して構造式候補を抽出する構造式候補抽出ステップと、
d)前記構造式候補抽出ステップにより抽出された構造式候補毎に、未知化合物に対する質量分析により得られたMSm(ただしmは2〜nの範囲の整数で任意の数の整数)スペクトル上のピークの質量電荷比とその構造式候補の部分構造との一致性を示す部分構造スコアを算出する部分構造スコア計算ステップと、
e)各組成式候補の組成スコアと各構造式候補の部分構造スコアとに基づいて、未知化合物に該当する化合物の候補を絞り込む化合物推定ステップと、
を有することを特徴としている。
The first invention made to solve the above problem is to perform MS n analysis for dissociating ions derived from a substance to be measured into n-1 (n is an integer of 2 or more) stage, and obtain an MS n spectrum. A compound identification method for identifying unknown compounds and structural analysis using an acquirable mass spectrometer,
a) a composition formula candidate extraction step for obtaining a composition formula candidate based on the molecular weight of the unknown compound obtained from a mass spectrum obtained by mass spectrometry of the unknown compound;
b) a composition score calculation step for calculating a composition score indicating the coincidence between the theoretical value and the actual measurement value of the molecular weight for each composition formula candidate extracted by the composition formula candidate extraction step;
c) A structure in which a structural formula candidate is extracted by estimating a structural formula corresponding to each composition formula candidate extracted in the composition formula candidate extraction step using a database search for a compound database in which chemical structure information is recorded. An expression candidate extraction step;
d) For each structural formula candidate extracted by the structural formula candidate extraction step, on the spectrum of MS m (where m is an integer in the range of 2 to n and an arbitrary number) obtained by mass spectrometry for unknown compounds. A partial structure score calculating step for calculating a partial structure score indicating the coincidence between the mass-to-charge ratio of the peak and the partial structure of the structural formula candidate;
e) a compound estimation step for narrowing down candidate compounds corresponding to unknown compounds based on the composition score of each composition formula candidate and the partial structure score of each structural formula candidate;
It is characterized by having.

また上記課題を解決するために成された第2発明は、上記第1発明に係る化合物同定方法を実施するためのシステムであって、測定対象の物質に由来するイオンをn−1(nは2以上の整数)段階に解離させるMSn分析を実行してMSnスペクトルを取得可能な質量分析装置を用い、未知化合物の同定や構造解析を行う化合物同定システムであって、
a)未知化合物に対する質量分析により得られたマススペクトルから求まる該未知化合物の分子量に基づいて組成式候補を求める組成式候補抽出手段と、
b)前記組成式候補抽出手段により抽出された組成式候補毎に、分子量の理論値と実測値との一致性を示す組成スコアを算出する組成スコア計算手段と、
c)化学構造情報が収録された化合物データベースに対するデータベース検索を利用して、前記組成式候補抽出手段で抽出された各組成式候補に対応した構造式をそれぞれ推定して構造式候補を抽出する構造式候補抽出手段と、
d)前記構造式候補抽出手段により抽出された構造式候補毎に、未知化合物に対する質量分析により得られたMSm(ただしmは2〜nの範囲の整数で任意の数の整数)スペクトル上のピークの質量電荷比とその構造式候補の部分構造との一致性を示す部分構造スコアを算出する部分構造スコア計算手段と、
e)各組成式候補の組成スコアと各構造式候補の部分構造スコアとに基づいて、未知化合物に該当する化合物の候補を絞り込む化合物推定手段と、
を備えることを特徴としている。
A second invention made to solve the above problems is a system for carrying out the compound identification method according to the first invention, wherein ions derived from the substance to be measured are expressed as n-1 (n is A compound identification system that performs identification and structural analysis of unknown compounds using a mass spectrometer capable of acquiring MS n spectra by performing MS n analysis to be dissociated in an integer of 2 or more)
a) a composition formula candidate extracting means for obtaining a composition formula candidate based on the molecular weight of the unknown compound obtained from a mass spectrum obtained by mass spectrometry of the unknown compound;
b) a composition score calculation means for calculating a composition score indicating the coincidence between the theoretical value and the actual measurement value of the molecular weight for each composition formula candidate extracted by the composition formula candidate extraction means;
c) A structure in which a structural formula candidate is extracted by estimating a structural formula corresponding to each composition formula candidate extracted by the composition formula candidate extraction means using a database search for a compound database in which chemical structure information is recorded. Expression candidate extraction means;
d) For each structural formula candidate extracted by the structural formula candidate extracting means, on the spectrum of MS m (where m is an integer in the range of 2 to n and an arbitrary number) obtained by mass spectrometry for unknown compounds. A partial structure score calculating means for calculating a partial structure score indicating consistency between the peak mass-to-charge ratio and the partial structure of the structural formula candidate;
e) Compound estimating means for narrowing down candidate compounds corresponding to unknown compounds based on the composition score of each composition formula candidate and the partial structure score of each structural formula candidate;
It is characterized by having.

第1発明に係る化合物同定方法を実施する第2発明に係る化合物同定システムにおいて、組成式候補抽出手段は、マススペクトルから求まる該未知化合物の精密な分子量に基づいて、各種元素の理論質量を利用して組成式候補を複数求める。実測の分子量の精度が高いほど、つまりは質量分析における質量精度が高いほど、組成式候補の数を絞り込むことができる。したがって、質量精度の高い質量分析装置を用いることが好ましい。また、未知化合物の組成式を推定する際に、該未知化合物に含まれる元素の情報や逆に含まれない元素の情報が分かっていれば、組成式候補の絞り込みは容易になる。そこで、例えば、MSnスペクトル上のピークとMSn-1スペクトル上のピークとの質量電荷比差を調べ、特定の部分構造(例えば水酸基)などに特有の質量電荷比差の存在が確認できた場合には、その特定の部分構造が含まれると推定すればよい。 In the compound identification system according to the second invention for carrying out the compound identification method according to the first invention, the composition formula candidate extracting means uses the theoretical mass of various elements based on the precise molecular weight of the unknown compound obtained from the mass spectrum. Thus, a plurality of composition formula candidates are obtained. The higher the accuracy of the actually measured molecular weight, that is, the higher the mass accuracy in mass spectrometry, the narrower the number of composition formula candidates. Therefore, it is preferable to use a mass spectrometer with high mass accuracy. In addition, when estimating the composition formula of an unknown compound, if information on elements included in the unknown compound and information on elements not included are known, it is easy to narrow down composition formula candidates. Therefore, for example, the mass-to-charge ratio difference between the peak on the MS n spectrum and the peak on the MS n-1 spectrum was examined, and the existence of a mass-to-charge ratio difference peculiar to a specific partial structure (for example, hydroxyl group) could be confirmed. In such a case, it may be estimated that the specific partial structure is included.

組成スコア計算手段は、抽出された組成式候補毎に、分子量の理論値と実測値との一致性が高いほど大きくなるように所定のアルゴリズムに従って組成スコアを算出する。構造式候補抽出手段は、例えば組成式候補をそれぞれ検索条件の1つとしてデータベース検索を実行することにより、各組成式候補に対応した構造式をそれぞれ推定する。通常、1つの組成式候補に対して複数の構造式がヒットするから、組成式候補毎にそれぞれ複数の構造式候補が挙げられる。化合物データベースは様々な機関から提供されている既存のデータベースを利用できるほか、ユーザが作成したデータベースを利用することもできる。   The composition score calculation means calculates a composition score for each extracted composition formula candidate according to a predetermined algorithm so as to increase as the coincidence between the theoretical value and the actual measurement value of the molecular weight increases. The structural formula candidate extraction means estimates a structural formula corresponding to each composition formula candidate by performing a database search using each of the composition formula candidates as one of the search conditions. Usually, since a plurality of structural formulas are hit with respect to one composition formula candidate, there are a plurality of structural formula candidates for each composition formula candidate. As the compound database, existing databases provided by various organizations can be used, and databases created by users can also be used.

なお、検索の効率としては組成式候補を検索条件の1つとして供するほうがよいが、分子量のみを検索条件として多数の構造式候補を求めたあとに、その構造式候補が組成式候補に対応付け可能であるか否かを調べ、対応付け可能であるものを残すようにして構造式候補を求めてもよい。   Although it is better to use the composition formula candidate as one of the search conditions for the efficiency of the search, after obtaining a large number of structural formula candidates using only the molecular weight as the search condition, the structural formula candidates are associated with the composition formula candidates. It may be determined whether or not it is possible, and structural formula candidates may be obtained by leaving those that can be matched.

部分構造スコア計算手段は、得られた構造式候補毎に、未知化合物に対する質量分析により得られたMSmスペクトル上のピークの質量電荷比とその構造式候補の部分構造との一致の程度を調べ、即ち、MSmスペクトル上のピークがその構造式候補の部分構造に帰属可能であるか否かを調べ、その帰属結果に基づいて部分構造スコアを算出する。ここで、mが2〜nの範囲の1つの整数である場合には、例えばMS2スペクトル、MS3スペクトルなど1種類のプロダクトイオンスペクトルを用いることになる。また、mが2〜nの範囲の複数の整数である場合には、例えばMS2スペクトル、MS3スペクトルなど複数のプロダクトイオンスペクトルからそれぞれ収集した全てのピークを含むプロダクトイオンスペクトルを作成し、これを用いればよい。 For each obtained structural formula candidate, the partial structure score calculation means examines the degree of coincidence between the mass-to-charge ratio of the peak on the MS m spectrum obtained by mass spectrometry for the unknown compound and the partial structure of the structural formula candidate. That is, it is examined whether or not the peak on the MS m spectrum can be assigned to the partial structure of the structural formula candidate, and the partial structure score is calculated based on the assignment result. Here, when m is one integer in the range of 2 to n, one type of product ion spectrum such as an MS 2 spectrum or an MS 3 spectrum is used. When m is a plurality of integers in the range of 2 to n, a product ion spectrum including all peaks collected from a plurality of product ion spectra such as MS 2 spectrum and MS 3 spectrum, for example, is created. May be used.

上記部分構造スコアには帰属できたピークの強度情報が反映されることが望ましい。そこで、部分構造スコア計算手段は例えば、MSmスペクトル上のピークのうちの帰属できたピークの強度の総和を計算し、MSmスペクトル上の全ピークの強度の総和に対する比を一致度として部分構造スコアを求める構成とすることができる。また、全ての質量電荷比を公平に扱うのではなく、例えば質量電荷比が大きいピークの強度情報が相対的に重視されるように重み付けを行ってもよい。これは、特に質量電荷比が大きなイオンの検出効率が低い場合に有効である。また、強度が小さなピークの強度情報が相対的に軽視されるように重み付けを行ってもよい。これは、特にノイズが多いような状況下でノイズピークを抑制する際に有効である。 The partial structure score preferably reflects the intensity information of the assigned peak. Therefore, the partial structure score calculation means calculates, for example, the sum of the intensities of the peaks that can be assigned among the peaks on the MS m spectrum, and uses the ratio of the sum of the intensities of all the peaks on the MS m spectrum as the degree of agreement. It can be set as the structure which calculates | requires a score. Further, instead of treating all mass-to-charge ratios fairly, weighting may be performed so that, for example, intensity information of a peak with a large mass-to-charge ratio is relatively emphasized. This is particularly effective when the detection efficiency of ions having a large mass-to-charge ratio is low. Further, weighting may be performed so that intensity information of a peak having a small intensity is relatively neglected. This is effective in suppressing the noise peak particularly in a situation where there is a lot of noise.

そして、化合物推定手段は例えば、組成式候補毎に求められた構造式候補毎に、各組成式候補の組成スコアと各構造式候補の部分構造スコアとに基づく最終的なスコアを計算し、このスコアに従って未知化合物に該当する化合物の候補を絞り込む。組成スコアと部分構造スコアとから最終スコアを求める際には、例えば相加平均や相乗平均などの平均値を利用することができる。   Then, for example, for each structural formula candidate obtained for each composition formula candidate, the compound estimation means calculates a final score based on the composition score of each composition formula candidate and the partial structure score of each structural formula candidate, Narrow down candidate compounds corresponding to unknown compounds according to the score. When obtaining the final score from the composition score and the partial structure score, for example, an average value such as an arithmetic mean or a geometric mean can be used.

本発明に係る化合物同定方法及び化合物同定システムによれば、膨大な数の化合物が収録されている化合物データベースから求まる多数の化合物候補について、解析対象の化合物に対して得られた質量電荷比情報から推定される組成式候補の信頼度を示す組成スコアと、その組成式候補それぞれに対してデータベース検索により抽出される構造式候補の信頼度を示す部分構造スコアとの両方に基づいて、効率的に化合物の絞り込みを行うことができる。それにより、化合物候補が比較的少数に絞り込まれるので、最終的に分析者が未知化合物を同定したり構造解析を行ったりすることが容易になる。また、データベース検索に利用されるデータベース自体は化合物が充実したものを利用できるので、該当する化合物がデータベースに存在せずに同定不可となる状況を少なくすることができる。   According to the compound identification method and the compound identification system according to the present invention, for a large number of compound candidates obtained from a compound database in which a huge number of compounds are recorded, from mass-to-charge ratio information obtained for the compound to be analyzed Efficiently based on both the composition score indicating the reliability of the estimated composition formula candidate and the partial structure score indicating the reliability of the structure formula candidate extracted by database search for each of the composition formula candidates The compound can be narrowed down. Thereby, since the compound candidates are narrowed down to a relatively small number, it becomes easy for an analyst to finally identify an unknown compound or perform a structural analysis. Moreover, since the database itself used for the database search can use a rich compound, it is possible to reduce the situation where the corresponding compound does not exist in the database and cannot be identified.

本発明の一実施例による化合物同定システムの概略構成図。1 is a schematic configuration diagram of a compound identification system according to an embodiment of the present invention. 本実施例による化合物同定システムにおける化合物同定手順を示すフローチャート。The flowchart which shows the compound identification procedure in the compound identification system by a present Example. 図2のフローチャートに従った化合物同定処理を説明するための模式図。The schematic diagram for demonstrating the compound identification process according to the flowchart of FIG.

以下、本発明に係る化合物同定方法を実施するための化合物同定システムの一実施例について、添付図面を参照して説明する。図1はこの化合物同定システムの概略構成図である。   Hereinafter, an example of a compound identification system for carrying out the compound identification method according to the present invention will be described with reference to the accompanying drawings. FIG. 1 is a schematic configuration diagram of this compound identification system.

本実施例の化合物同定システムにおいて、質量分析部1は、大気圧下で液体試料中の物質をイオン化するESI(エレクトロスプレイイオン化)イオン源10と、生成されたイオン流に混じる溶媒を除去するとともにイオンを真空室(図示せず)内へと導く加熱キャピラリ管11と、イオンを収束させつつ後段へと送るイオン輸送光学系12と、3次元四重極型のイオントラップ13と、該イオントラップ13から放出された各種イオンをその飛行時間によって質量分離する飛行時間型質量分析器(TOFMS)14と、TOFMS14により質量分離されたイオンを検出する検出器15と、を含む。ESIイオン源10の入口には通常の液体試料を導入することができるほか、液体クロマトグラフ(LC)のカラム出口を接続してLCで成分分離された液体試料を連続的に導入することもできる。   In the compound identification system of the present embodiment, the mass spectrometer 1 removes an ESI (electrospray ionization) ion source 10 that ionizes a substance in a liquid sample under atmospheric pressure and a solvent mixed in the generated ion stream. A heated capillary tube 11 for introducing ions into a vacuum chamber (not shown), an ion transport optical system 12 for converging the ions to the subsequent stage, a three-dimensional quadrupole ion trap 13, and the ion trap 13 includes a time-of-flight mass analyzer (TOFMS) 14 that mass-separates various ions emitted from 13 according to the time of flight, and a detector 15 that detects ions mass-separated by the TOFMS 14. A normal liquid sample can be introduced into the inlet of the ESI ion source 10, and a liquid sample separated by LC can be continuously introduced by connecting a column outlet of a liquid chromatograph (LC). .

上記検出器15による検出信号は処理・制御部2に入力され、図示しないA/D変換器でデジタルデータに変換された後に所定のデータ処理が実行される。処理・制御部2は、データ収集処理部20、データ格納部21、マススペクトル作成部22、組成推定部23、組成スコア算出部24、構造推定部25、化合物データベース(DB)26、部分構造スコア算出部27、化合物推定部28などの機能ブロックを含むほか、質量分析部1の各部を制御する分析制御部31、プリカーサイオン自動選択部32を含む。処理・制御部2には、ユーザインターフェイスとしての入力部4や表示部5が接続されている。なお、処理・制御部2の機能の大部分は、専用の制御・処理ソフトウエアを搭載したパーソナルコンピュータにより具現化することができる。   A detection signal from the detector 15 is input to the processing / control unit 2 and converted into digital data by an A / D converter (not shown), and then predetermined data processing is executed. The processing / control unit 2 includes a data collection processing unit 20, a data storage unit 21, a mass spectrum creation unit 22, a composition estimation unit 23, a composition score calculation unit 24, a structure estimation unit 25, a compound database (DB) 26, a partial structure score. In addition to including functional blocks such as a calculation unit 27 and a compound estimation unit 28, an analysis control unit 31 and a precursor ion automatic selection unit 32 that control each unit of the mass analysis unit 1 are included. The processing / control unit 2 is connected to an input unit 4 and a display unit 5 as user interfaces. Note that most of the functions of the processing / control unit 2 can be realized by a personal computer equipped with dedicated control / processing software.

また、図示しないが、イオントラップ13には外部からCIDガスを導入可能であり、イオントラップ13内に特定の質量電荷比を持つイオンを選択的に捕捉した後にCIDガスを導入し、上記捕捉したイオンを高周波電場により共鳴励起させることによって、該イオンをCIDガスに衝突させて開裂させることが可能である。さらに、イオンの選択とCID操作とを繰り返すことにより、イオンを複数段に開裂させて小さな断片とすることができる。即ち、この質量分析装置はMSn分析が可能な質量分析装置である。 Although not shown, CID gas can be introduced into the ion trap 13 from the outside, and after selectively capturing ions having a specific mass-to-charge ratio in the ion trap 13, the CID gas is introduced and captured. When ions are resonantly excited by a high-frequency electric field, the ions can collide with CID gas and be cleaved. Further, by repeating the selection of ions and the CID operation, the ions can be cleaved into a plurality of stages to form small fragments. That is, this mass spectrometer is a mass spectrometer capable of MS n analysis.

化合物データベース26は、様々な化合物の化合物名、分子量、組成式、化学構造式などが収録されたものであり、例えば、米国の国立生物工学情報センターが管理するPubChem(インターネット<http://pubchem.ncbi.nlm.nih.gov/>参照)等を用いることができる。もちろん、化合物データベース26はこれに限るものではなく、一般に提供されているもののほか、ユーザ自身が構築したものでもよく、既存のデータベースとユーザデータベースとを組み合わせたものでもよい。   The compound database 26 includes compound names, molecular weights, composition formulas, chemical structural formulas, and the like of various compounds. For example, PubChem (Internet <http: // pubchem) managed by the National Center for Biotechnology Information in the United States. .ncbi.nlm.nih.gov />) can be used. Of course, the compound database 26 is not limited to this. In addition to those provided in general, the compound database 26 may be constructed by the user himself or a combination of an existing database and a user database.

次に、本実施例の化合物同定システムにおいて質量分析部1を中心に実行される、目的試料に対する質量分析動作及び該分析により得られたデータ収集動作について説明する。   Next, the mass analysis operation on the target sample and the data collection operation obtained by the analysis performed mainly by the mass analysis unit 1 in the compound identification system of this example will be described.

入力部4を通して分析者から分析開始が指示されると、分析制御部31の制御の下に、質量分析部1では未知化合物を含む被検試料に対する質量分析(MS1分析)が略一定時間間隔で実行され、必要に応じてさらにMS2分析〜MS4分析が実行される。データ収集処理部20はこれら質量分析で得られたデータをデータ格納部21に格納する。より詳しく説明すると、質量分析部1では被検試料に対する所定質量電荷比範囲のMS1分析がまず実行され、マススペクトル作成部22はこのときに得られたデータに基づいてマス(MS1)スペクトルを作成する。 When an analysis start is instructed by the analyst through the input unit 4, under the control of the analysis control unit 31, the mass analysis unit 1 performs mass analysis (MS 1 analysis) on a test sample containing an unknown compound at substantially constant time intervals. And MS 2 analysis to MS 4 analysis are further performed as necessary. The data collection processing unit 20 stores the data obtained by mass spectrometry in the data storage unit 21. More specifically, the mass analyzer 1 first performs MS 1 analysis of a predetermined mass-to-charge ratio range on the test sample, and the mass spectrum generator 22 calculates the mass (MS 1 ) spectrum based on the data obtained at this time. Create

プリカーサイオン自動選択部32はマススペクトル上で予め指定された所定条件を満たすピークを検出し、分析制御部31の制御の下に質量分析部1は、このピークに対応したイオンをプリカーサイオンに設定したCID操作を伴うMS2分析を、先のMS1分析に引き続いて実行する。ESIイオン化やAPCIイオン化はいわゆるソフトなイオン化であるため、分子にプロトンが付加した又はプロトンが脱離したイオンが最も多く生成される傾向にある。このため、通常、或る化合物由来のイオンピークの中で分子イオンピークの信号強度が最大である。したがって、例えば信号強度が所定の閾値以上であり、その信号強度が最大であるピークを検出し、プリカーサイオンとすればよい。 The precursor ion automatic selection unit 32 detects a peak that satisfies a predetermined condition on the mass spectrum, and under the control of the analysis control unit 31, the mass analysis unit 1 sets an ion corresponding to this peak as a precursor ion. The MS 2 analysis with the CID operation performed is performed following the previous MS 1 analysis. Since ESI ionization and APCI ionization are so-called soft ionization, ions with protons added or desorbed from molecules tend to be generated most. For this reason, the signal intensity of the molecular ion peak is usually the highest among the ion peaks derived from a certain compound. Therefore, for example, a peak whose signal intensity is equal to or higher than a predetermined threshold and whose signal intensity is maximum may be detected and used as a precursor ion.

マススペクトル作成部22は、上記MS2分析により得られた検出信号に基づいてMS2スペクトルを作成する。さらに、プリカーサイオン自動選択部32はMS2スペクトル上で予め指定された所定条件を満たすピークを検出し、分析制御部31の制御の下に質量分析部1は、このピークに対応したイオンを2段目のプリカーサイオンに設定した2段階のCID操作を伴うMS3分析を実行する。そして、マススペクトル作成部22はMS3分析により得られた検出信号に基づいてMS3スペクトルを作成し、上記MS2分析時と同様にプリカーサイオンに対応したピークを検出する。そして、質量分析部1はMS4分析を実行する。 The mass spectrum creation unit 22 creates an MS 2 spectrum based on the detection signal obtained by the MS 2 analysis. Further, the precursor ion automatic selection unit 32 detects a peak that satisfies a predetermined condition on the MS 2 spectrum, and under the control of the analysis control unit 31, the mass analysis unit 1 selects ions corresponding to the peak as 2 MS 3 analysis is performed with a two-stage CID operation set to the precursor ion of the stage. Then, the mass spectrum creation unit 22 creates an MS 3 spectrum based on the detection signal obtained by the MS 3 analysis, and detects a peak corresponding to the precursor ion as in the MS 2 analysis. Then, the mass spectrometer 1 performs MS 4 analysis.

以上のようにして、試料中に有意な化合物の存在が検出されると、該化合物由来のイオンに対するマススペクトルデータやMS2〜MS4スペクトルデータが収集され、これら全てのデータがデータ格納部21に格納される。なお、ここでは、MS4分析まで実行しているが、時間が許せばMS5以上の分析を実行してもよい。また、化合物の分子量が比較的小さい場合や解離し易い化合物である場合には、MS4分析まで行う必要はなくMS3まで又はMS2のみを実行してもよい。 As described above, when the presence of a significant compound is detected in the sample, mass spectrum data and MS 2 to MS 4 spectrum data for ions derived from the compound are collected, and all these data are stored in the data storage unit 21. Stored in In this example, the analysis up to MS 4 is executed. However, if time permits, an analysis of MS 5 or more may be executed. Further, when the molecular weight of the compound is relatively small or the compound is easily dissociated, it is not necessary to perform the MS 4 analysis, and up to MS 3 or only MS 2 may be executed.

次に、上述したような分析の実行によって目的試料に対する質量分析データがデータ格納部21に格納されている状態で実施される、特徴的な未知化合物の同定方法について、図2及び図3に従って説明する。図2は化合物同定手順を示すフローチャート、図3は図2のフローチャートに従った化合物同定処理を説明するための模式図である。   Next, a characteristic unknown compound identification method performed in a state where mass analysis data for a target sample is stored in the data storage unit 21 by performing the analysis as described above will be described with reference to FIGS. To do. FIG. 2 is a flowchart showing a compound identification procedure, and FIG. 3 is a schematic diagram for explaining a compound identification process according to the flowchart of FIG.

分析者は例えば目的試料についてのトータルイオンクロマトグラムを表示部5の画面上で確認して、同定したい未知化合物を入力部4により指定した上で同定実行を指示する。すると、この指示を受けたマススペクトル作成部22はデータ格納部21から指定された未知化合物に対応したMS1〜MS4スペクトルデータを読み出し、それぞれマススペクトルを作成する(ステップS1)。 For example, the analyst confirms the total ion chromatogram of the target sample on the screen of the display unit 5, specifies an unknown compound to be identified by the input unit 4, and instructs the identification execution. Then, the mass spectrum creation unit 22 that has received this instruction reads the MS 1 to MS 4 spectrum data corresponding to the specified unknown compound from the data storage unit 21, and creates a mass spectrum for each (step S1).

上述したように、通常、MS1スペクトル上には未知である目的化合物の分子イオンピークが明瞭に現れる。そこで組成推定部23は、MS1スペクトル上の目的化合物の分子イオンピークの質量電荷比の精密値から、目的化合物の実測分子量を算出する(ステップS2)。次いで組成推定部23は、各種元素の既知である理論質量を利用し、目的化合物の実測分子量に対して所定の許容誤差を見込んだ分子量範囲に収まるような、元素種類及び元素数の組み合わせを探索することにより、目的化合物の組成式候補を抽出する(ステップS3)。図3の例では、炭素C、水素Hなどの元素の組み合わせにより、A、B、Cなる3つの組成式候補が抽出されている。 As described above, the molecular ion peak of the target compound that is unknown usually appears clearly on the MS 1 spectrum. Therefore, the composition estimation unit 23 calculates the measured molecular weight of the target compound from the precise value of the mass to charge ratio of the molecular ion peak of the target compound on the MS 1 spectrum (step S2). Next, the composition estimation unit 23 uses a known theoretical mass of each element to search for a combination of the element type and the number of elements within a molecular weight range that allows for a predetermined allowable error with respect to the measured molecular weight of the target compound. Thus, a composition formula candidate of the target compound is extracted (step S3). In the example of FIG. 3, three composition formula candidates A, B, and C are extracted by a combination of elements such as carbon C and hydrogen H.

組成式推定にあたっては基本的には分子量のみを手掛かりにすればよいが、他の情報を付加的に利用することにより、組成式推定が容易になったり(つまりは短時間で行えたり)組成式候補の数を少なくしたりすることができる場合がある。具体的には、例えばMS2スペクトル上において目的化合物由来の脱水イオンが検出されれば、目的化合物は水酸基(−OH)を含んでいることが分かるから、例えば酸素、水素をそれぞれ1個も含まないような組成式ははじめから除外することができる。それ以外にも、既知である特徴的な部分構造が脱離したイオンが検出されれば、その部分構造を構成する元素が必ず含まれるものとして組成式候補を限定することができる。なお、当然のことながら、組成式推定の際には、各元素の同位体も考慮に入れることが望ましい。 Basically, it is only necessary to use the molecular weight as a clue to estimate the composition formula. However, the composition formula can be estimated easily (that is, it can be done in a short time) by using other information additionally. In some cases, the number of candidates can be reduced. Specifically, for example, if dehydrated ions derived from the target compound are detected on the MS 2 spectrum, it can be seen that the target compound includes a hydroxyl group (—OH), and thus includes, for example, one each of oxygen and hydrogen. Such a composition formula can be excluded from the beginning. In addition to this, if ions from which a known characteristic partial structure is desorbed are detected, the composition formula candidates can be limited to elements that necessarily include the partial structure. As a matter of course, it is desirable to take into account the isotopes of each element when estimating the composition formula.

次に組成スコア算出部24は、ステップS3で抽出された複数の組成式候補のそれぞれについて、その組成式に含まれる元素の理論質量から計算される理論質量値と目的化合物の実測分子量との差を求め、その差に基づいて理論質量値と実測質量値との一致度合いを示す組成スコアを計算する(ステップS4)。理論質量値と実測質量値との一致度が高いほど、つまり両者の差が小さいほど、組成スコアが大きな値となるように、組成スコア算出式は定められている。図3の例では、互いに異なる組成式候補A、B、Cに対しそれぞれ組成スコアP1、P2、P3が得られている。この組成スコアがこの化合物同定で利用される1つの指標値である。   Next, for each of the plurality of composition formula candidates extracted in step S3, the composition score calculation unit 24 calculates the difference between the theoretical mass value calculated from the theoretical mass of the element included in the composition formula and the measured molecular weight of the target compound. And a composition score indicating the degree of coincidence between the theoretical mass value and the actually measured mass value is calculated based on the difference (step S4). The composition score calculation formula is determined such that the higher the degree of coincidence between the theoretical mass value and the actually measured mass value, that is, the smaller the difference between the two, the larger the composition score. In the example of FIG. 3, composition scores P1, P2, and P3 are obtained for the different composition formula candidates A, B, and C, respectively. This composition score is one index value used in this compound identification.

次に構造推定部25は、ステップS3で抽出された複数の組成式候補のそれぞれについて、目的化合物の分子量(これは全ての組成式候補に共通)や組成式を検索条件に設定して化合物データベース26に対するデータベース検索を実行することにより、化学構造式の候補を抽出する(ステップS5)。一般に、化合物には多くの異性体が存在するから、分子量や組成式が決まっても、データベース検索により導出される化学構造式は複数存在する。図3の例では、組成式候補Aに対しA1、A2、A3なる3つの構造式候補が抽出され、組成式候補Bに対しB1、B2、B3なる3つの構造式候補が抽出され、組成式候補Cに対しC1、C2、C3なる3つの構造式候補が抽出されている。   Next, the structure estimation unit 25 sets the molecular weight of the target compound (this is common to all composition formula candidates) and the composition formula as search conditions for each of the plurality of composition formula candidates extracted in step S3, and is a compound database. A candidate for a chemical structural formula is extracted by performing a database search for 26 (step S5). In general, since a compound has many isomers, there are a plurality of chemical structural formulas derived by database search even if the molecular weight or composition formula is determined. In the example of FIG. 3, three structural formula candidates A1, A2, and A3 are extracted for the composition formula candidate A, and three structural formula candidates B1, B2, and B3 are extracted for the composition formula candidate B. Three structural formula candidates C1, C2, and C3 are extracted for the candidate C.

続いて、部分構造スコア算出部27は、ステップS5で組成式候補毎にそれぞれ複数抽出された化学構造式候補それぞれについて、MS2〜MS4スペクトル上のピークの帰属を試行し、その帰属結果に基づいて、その化学構造式と実測で観測されたプロダクトイオンとの一致の度合いを示す部分構造スコアを計算する(ステップS6)。 Subsequently, the partial structure score calculation unit 27 attempts to assign peaks on the MS 2 to MS 4 spectra for each of the chemical structural formula candidates extracted for each of the composition formula candidates in step S5. Based on this, a partial structure score indicating the degree of coincidence between the chemical structural formula and the actually observed product ion is calculated (step S6).

具体的には、例えば次のようなデータ処理を実行する。まず、MS2〜MS4スペクトル上でそれぞれ観測されるピークの情報(ピークの質量電荷比及び信号強度)を収集し、それらを統合した統合マススペクトルを作成する。例えば、MS2〜MS4スペクトル上で同じ質量電荷比にピークが観測される場合には、その同一質量電荷比に対する複数のピークの強度を加算して統合マススペクトル上の該ピークの強度とすればよい。そして、統合マススペクトル上に存在する各ピーク、つまりはプロダクトイオンが、与えられた化学構造式中の部分構造に帰属可能であるか否かを調べる。この帰属の可否は、各ピークの質量電荷比と化学構造式から得られる部分構造の質量との差が所定の許容誤差の範囲に収まるか否かで判定すればよい。 Specifically, for example, the following data processing is executed. First, information (peak mass-to-charge ratio and signal intensity) of peaks observed on each of the MS 2 to MS 4 spectra is collected, and an integrated mass spectrum is created by integrating them. For example, when peaks are observed at the same mass-to-charge ratio on the MS 2 to MS 4 spectra, the intensities of a plurality of peaks corresponding to the same mass-to-charge ratio are added to obtain the intensity of the peak on the integrated mass spectrum. That's fine. Then, it is examined whether each peak existing on the integrated mass spectrum, that is, a product ion, can be assigned to a partial structure in a given chemical structural formula. Whether or not this assignment is possible may be determined by whether or not the difference between the mass-to-charge ratio of each peak and the mass of the partial structure obtained from the chemical structural formula falls within a predetermined allowable error range.

そして、統合マススペクトル上の全てのピークについて帰属の可否が判定されたならば、帰属できたピークの強度を合算した帰属可ピーク合算値Iidentを求めるとともに、帰属の可否に依らない統合マススペクトル上の全てのピークの強度を合算した全ピーク合算値Itotalを求める。そして、帰属可ピーク合算値と全ピーク合算値との比、つまりはIident/Itotalを化学構造式と実測で観測されたプロダクトイオンとの一致度と定義し、この一致度に所定定数を乗じることで部分構造スコアを求める。図3の例では、構造式A1、A2、…に対して部分構造スコアQ1、Q2、…が得られている。この部分構造スコアがこの化合物同定で利用される他の1つの指標値である。   If it is determined whether or not all peaks on the integrated mass spectrum are assigned, the assigned peak sum value Iident obtained by adding up the intensities of the assigned peaks is obtained, and on the integrated mass spectrum regardless of whether or not the assignment is possible. The total peak value Itotal obtained by adding the intensities of all the peaks is obtained. Then, the ratio of the sum of the assignable peaks and the sum of all peaks, that is, Iident / Itotal is defined as the degree of coincidence between the chemical structural formula and the actually observed product ion, and this degree of coincidence is multiplied by a predetermined constant. To find the partial structure score. In the example of FIG. 3, partial structure scores Q1, Q2,... Are obtained for the structural formulas A1, A2,. This partial structure score is another index value used in this compound identification.

前述したように、部分構造スコアを求める際には帰属できたピークの信号強度を用いるが、帰属できた全てのピークを公平に扱うのではなく、質量電荷比の大小や強度の高低に基づいた重み付けを行うことで一部のピークを偏重してもよい。例えば、一般に、分子量が大きなイオンと分子量が小さなイオンとを比べると前者はイオン源10から検出器15までのイオンの通過効率が相対的に低いため、マススペクトル上で信号強度が低くなる傾向にある。そのため、全ての質量電荷比のピークを公平に扱うと、質量電荷比が大きなプロダクトイオンの寄与が小さくなる。そこで、質量電荷比が大きなピークほど大きな重みを付与するように重み付けを行うとよい。また、強度が小さなピークに対して小さな重みを付与するように重み付けを行うことで、強度が小さなノイズピークを実質的に除去する効果が得られる。   As described above, when calculating the partial structure score, the signal intensity of the assigned peak is used, but not all the assigned peaks are treated fairly, but based on the magnitude of the mass-to-charge ratio and the intensity level. Some peaks may be biased by weighting. For example, in general, when comparing ions having a large molecular weight with ions having a small molecular weight, the former has a relatively low passage efficiency of ions from the ion source 10 to the detector 15, and therefore the signal intensity tends to be low on the mass spectrum. is there. Therefore, if all the mass-to-charge peak is treated fairly, the contribution of product ions having a large mass-to-charge ratio is reduced. Therefore, weighting may be performed so that a peak having a larger mass-to-charge ratio is given a greater weight. Further, by performing weighting so that a small weight is given to a peak having a small intensity, an effect of substantially removing a noise peak having a small intensity can be obtained.

即ち、ステップS1〜S6の処理では、目的化合物に対する質量分析結果に基づいて推定された複数の組成式候補に対しそれぞれ組成スコアが算出され、さらに各組成式候補についてそれぞれ推定された化学構造式候補に対しそれぞれ部分構造スコアが算出される。図3の例では、例えば、組成式候補Aに対して推定された化学構造式候補がA1である化合物候補の組成スコアはP1、部分構造スコアはQ1である。   That is, in the processing of steps S1 to S6, composition scores are calculated for each of a plurality of composition formula candidates estimated based on the mass analysis results for the target compound, and further, chemical structural formula candidates estimated for each composition formula candidate. For each, a partial structure score is calculated. In the example of FIG. 3, for example, the composition score of a compound candidate whose chemical structural formula candidate estimated for the composition formula candidate A is A1 is P1, and the partial structure score is Q1.

化合物推定部28は、或る1つの組成式候補から求まる1つの化学構造式候補について、ステップS4で得られた組成スコアとステップS6で得られた部分構造スコアとを取得し、その相加平均又は相乗平均による平均値を計算してこれを総合スコアとする。そして、全ての化学構造式候補に対して、つまりは化合物候補に対して同様に総合スコアを再計算する(ステップS7)。   The compound estimation unit 28 obtains the composition score obtained in step S4 and the partial structure score obtained in step S6 for one chemical structural formula candidate obtained from a certain composition formula candidate, and the arithmetic average thereof. Or the average value by a geometric mean is calculated and this is made into a total score. Then, the total score is recalculated in the same manner for all chemical structural formula candidates, that is, for the compound candidates (step S7).

化合物推定部28はこの総合スコアを利用して化合物候補を絞り込む。即ち、例えば総合スコアに予め閾値を設定しておき、該閾値よりも総合スコアが低い化合物候補を除外した上で、残った化合物候補を総合スコアに従って順位付けする(ステップS8)。そして、順位付けされた化合物候補を表示部5の画面上に総合スコアと共に表示する(ステップS9)。総合スコアで有意な差がつかない場合には、必ずしも総合スコアが高い化合物候補が正解であるとは限らない。そこで、分析者は表示部5の画面上に表示された化合物候補及び総合スコアを確認し、他の要素を勘案して目的化合物を同定する。もちろん、複数の化合物候補が残っても、総合スコアで圧倒的に高い値を示す候補があれば、その候補が目的化合物であるとして確定的に表示するようにしてもよい。   The compound estimation unit 28 narrows down the compound candidates using this total score. That is, for example, a threshold is set in advance for the total score, and compound candidates having a lower total score than the threshold are excluded, and the remaining compound candidates are ranked according to the total score (step S8). Then, the ranked compound candidates are displayed on the screen of the display unit 5 together with the total score (step S9). If there is no significant difference in the overall score, a compound candidate with a high overall score is not necessarily correct. Therefore, the analyst confirms the compound candidate and the total score displayed on the screen of the display unit 5, and identifies the target compound in consideration of other factors. Of course, even if a plurality of compound candidates remain, if there is a candidate that shows an overwhelmingly high value in the overall score, the candidate may be definitely displayed as the target compound.

以上のように、本実施例の化合物同定システムでは、推定された組成式候補に与えられた組成式スコアと、組成式候補に対応して推定された化学構造式候補に与えられた部分構造スコアとの両方を用いることで、化合物候補を効率良く絞り込むとともに、漏れのない正確性の高い化合物同定が可能である。   As described above, in the compound identification system of this example, the composition formula score given to the estimated composition formula candidate and the partial structure score given to the chemical structure formula candidate estimated corresponding to the composition formula candidate By using both of these, it is possible to efficiently narrow down compound candidates and identify compounds with high accuracy without leakage.

なお、上記実施例では、ステップS5において組成式候補を検索条件の1つとしてデータベース検索を行うことで、組成式候補に該当しない化合物候補がヒットすることを回避している。しかしながら、ステップS5では別の手法により、組成式候補に対応した化学構造式候補(化合物候補)のみを抽出することができる。例えば、化合物データベース26に対するデータベース検索の際には、組成式を検索条件とせずに例えば目的化合物の分子量のみを検索条件とすることで、組成式候補に対応しないものも含む多数の化学構造式候補を一旦抽出する。その後に、抽出された化学構造式候補と組成式候補との対応付けを試み、いずれの組成式候補にも該当しない化学構造式候補を除外してゆくことで絞り込む。こうした処理によっても最終的に上記実施例と同じ化学構造式候補を抽出することが可能である。   In the above embodiment, the database search is performed using the composition formula candidate as one of the search conditions in step S5, thereby avoiding hitting a compound candidate that does not correspond to the composition formula candidate. However, in step S5, only chemical structural formula candidates (compound candidates) corresponding to the composition formula candidates can be extracted by another method. For example, when searching the database for the compound database 26, a number of chemical structural formula candidates including those that do not correspond to the composition formula candidates can be obtained by using only the molecular weight of the target compound as a search condition without using the composition formula as a search condition. Is extracted once. After that, it tries to associate the extracted chemical structural formula candidates with the composition formula candidates, and narrows down by excluding the chemical structural formula candidates that do not correspond to any of the composition formula candidates. By such a process, it is possible to finally extract the same chemical structural formula candidates as in the above embodiment.

また、上記実施例は本発明の一例であって、上記記載の各種変形例のほかに、本発明の趣旨の範囲で適宜に修正、変更、追加などを行っても本願特許請求の範囲に包含されることは明らかである。   Further, the above embodiment is an example of the present invention, and in addition to the above-described various modifications, any modifications, changes, additions, etc. as appropriate within the spirit of the present invention are included in the scope of the claims of the present application. Obviously it will be done.

1…質量分析部
10…ESIイオン源
11…加熱キャピラリ管
12…イオン輸送光学系
13…イオントラップ
14…TOFMS
15…検出器
2…処理・制御部
20…データ収集処理部
21…データ格納部
22…マススペクトル作成部
23…組成推定部
24…組成スコア算出部
25…構造推定部
26…化合物データベース
27…部分構造スコア算出部
28…化合物推定部
31…分析制御部
32…プリカーサイオン自動選択部
4…入力部
5…表示部
DESCRIPTION OF SYMBOLS 1 ... Mass spectrometer 10 ... ESI ion source 11 ... Heating capillary tube 12 ... Ion transport optical system 13 ... Ion trap 14 ... TOFMS
DESCRIPTION OF SYMBOLS 15 ... Detector 2 ... Processing / control part 20 ... Data collection processing part 21 ... Data storage part 22 ... Mass spectrum preparation part 23 ... Composition estimation part 24 ... Composition score calculation part 25 ... Structure estimation part 26 ... Compound database 27 ... Part Structure score calculation unit 28 ... Compound estimation unit 31 ... Analysis control unit 32 ... Precursor ion automatic selection unit 4 ... Input unit 5 ... Display unit

Claims (2)

測定対象の物質に由来するイオンをn−1(nは2以上の整数)段階に解離させるMSn分析を実行してMSnスペクトルを取得可能な質量分析装置を用い、未知化合物の同定や構造解析を行う化合物同定方法であって、
a)未知化合物に対する質量分析により得られたマススペクトルから求まる該未知化合物の分子量に基づいて組成式候補を求める組成式候補抽出ステップと、
b)前記組成式候補抽出ステップにより抽出された組成式候補毎に、分子量の理論値と実測値との一致性を示す組成スコアを算出する組成スコア計算ステップと、
c)化学構造情報が収録された化合物データベースに対するデータベース検索を利用して、前記組成式候補抽出ステップで抽出された各組成式候補に対応した構造式をそれぞれ推定して構造式候補を抽出する構造式候補抽出ステップと、
d)前記構造式候補抽出ステップにより抽出された構造式候補毎に、未知化合物に対する質量分析により得られたMSm(ただしmは2〜nの範囲の整数で任意の数の整数)スペクトル上のピークの質量電荷比とその構造式候補の部分構造との一致性を示す部分構造スコアを算出する部分構造スコア計算ステップと、
e)各組成式候補の組成スコアと各構造式候補の部分構造スコアとに基づいて、未知化合物に該当する化合物の候補を絞り込む化合物推定ステップと、
を有することを特徴とする化合物同定方法。
Identification and structure of unknown compounds using a mass spectrometer capable of performing MS n analysis to dissociate ions derived from the substance to be measured in n-1 (n is an integer of 2 or more) stage to obtain MS n spectra A compound identification method for performing analysis,
a) a composition formula candidate extraction step for obtaining a composition formula candidate based on the molecular weight of the unknown compound obtained from a mass spectrum obtained by mass spectrometry of the unknown compound;
b) a composition score calculation step for calculating a composition score indicating the coincidence between the theoretical value and the actual measurement value of the molecular weight for each composition formula candidate extracted by the composition formula candidate extraction step;
c) A structure in which a structural formula candidate is extracted by estimating a structural formula corresponding to each composition formula candidate extracted in the composition formula candidate extraction step using a database search for a compound database in which chemical structure information is recorded. An expression candidate extraction step;
d) For each structural formula candidate extracted by the structural formula candidate extraction step, on the spectrum of MS m (where m is an integer in the range of 2 to n and an arbitrary number) obtained by mass spectrometry for unknown compounds. A partial structure score calculating step for calculating a partial structure score indicating the coincidence between the mass-to-charge ratio of the peak and the partial structure of the structural formula candidate;
e) a compound estimation step for narrowing down candidate compounds corresponding to unknown compounds based on the composition score of each composition formula candidate and the partial structure score of each structural formula candidate;
The compound identification method characterized by having.
測定対象の物質に由来するイオンをn−1(nは2以上の整数)段階に解離させるMSn分析を実行してMSnスペクトルを取得可能な質量分析装置を用い、未知化合物の同定や構造解析を行う化合物同定システムであって、
a)未知化合物に対する質量分析により得られたマススペクトルから求まる該未知化合物の分子量に基づいて組成式候補を求める組成式候補抽出手段と、
b)前記組成式候補抽出手段により抽出された組成式候補毎に、分子量の理論値と実測値との一致性を示す組成スコアを算出する組成スコア計算手段と、
c)化学構造情報が収録された化合物データベースに対するデータベース検索を利用して、前記組成式候補抽出手段で抽出された各組成式候補に対応した構造式をそれぞれ推定して構造式候補を抽出する構造式候補抽出手段と、
d)前記構造式候補抽出手段により抽出された構造式候補毎に、未知化合物に対する質量分析により得られたMSm(ただしmは2〜nの範囲の整数で任意の数の整数)スペクトル上のピークの質量電荷比とその構造式候補の部分構造との一致性を示す部分構造スコアを算出する部分構造スコア計算手段と、
e)各組成式候補の組成スコアと各構造式候補の部分構造スコアとに基づいて、未知化合物に該当する化合物の候補を絞り込む化合物推定手段と、
を備えることを特徴とする化合物同定システム。
Identification and structure of unknown compounds using a mass spectrometer capable of performing MS n analysis to dissociate ions derived from the substance to be measured in n-1 (n is an integer of 2 or more) stage to obtain MS n spectra A compound identification system for performing analysis,
a) a composition formula candidate extracting means for obtaining a composition formula candidate based on the molecular weight of the unknown compound obtained from a mass spectrum obtained by mass spectrometry of the unknown compound;
b) a composition score calculation means for calculating a composition score indicating the coincidence between the theoretical value and the actual measurement value of the molecular weight for each composition formula candidate extracted by the composition formula candidate extraction means;
c) A structure in which a structural formula candidate is extracted by estimating a structural formula corresponding to each composition formula candidate extracted by the composition formula candidate extraction means using a database search for a compound database in which chemical structure information is recorded. Expression candidate extraction means;
d) For each structural formula candidate extracted by the structural formula candidate extracting means, on the spectrum of MS m (where m is an integer in the range of 2 to n and an arbitrary number) obtained by mass spectrometry for unknown compounds. A partial structure score calculating means for calculating a partial structure score indicating consistency between the peak mass-to-charge ratio and the partial structure of the structural formula candidate;
e) Compound estimating means for narrowing down candidate compounds corresponding to unknown compounds based on the composition score of each composition formula candidate and the partial structure score of each structural formula candidate;
A compound identification system comprising:
JP2012054570A 2012-03-12 2012-03-12 Compound identification method and compound identification system using mass spectrometry Active JP5810983B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012054570A JP5810983B2 (en) 2012-03-12 2012-03-12 Compound identification method and compound identification system using mass spectrometry

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012054570A JP5810983B2 (en) 2012-03-12 2012-03-12 Compound identification method and compound identification system using mass spectrometry

Publications (2)

Publication Number Publication Date
JP2013190216A JP2013190216A (en) 2013-09-26
JP5810983B2 true JP5810983B2 (en) 2015-11-11

Family

ID=49390654

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012054570A Active JP5810983B2 (en) 2012-03-12 2012-03-12 Compound identification method and compound identification system using mass spectrometry

Country Status (1)

Country Link
JP (1) JP5810983B2 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2950859A1 (en) * 2014-06-02 2015-12-10 Dh Technologies Development Pte. Ltd. Method for converting mass spectral libraries into accurate mass spectral libraries
JP6149810B2 (en) * 2014-06-13 2017-06-21 株式会社島津製作所 Metabolite analysis system and metabolite analysis method
JP6994921B2 (en) 2017-12-05 2022-01-14 日本電子株式会社 Mass spectrometric data processing device and mass spectrometric data processing method
JP7184522B2 (en) * 2018-01-31 2022-12-06 一般財団法人石油エネルギー技術センター Methods for estimating properties of multicomponent mixtures
JP7122699B2 (en) * 2018-08-23 2022-08-22 パナソニックIpマネジメント株式会社 Material information output method, material information output device, material information output system, and program
JP7266997B2 (en) * 2018-11-30 2023-05-01 日本電子株式会社 Apparatus and method for chemical structure estimation
JP7114527B2 (en) * 2019-06-10 2022-08-08 日本電子株式会社 Composition estimation device and method
JP2021063752A (en) * 2019-10-16 2021-04-22 株式会社島津製作所 Analyzer of data obtained by mass analysis, mass spectrometer, analysis method for data obtained by mass analysis, and analysis program
WO2021240710A1 (en) * 2020-05-28 2021-12-02 株式会社島津製作所 Chromatography–mass spectrometry data processing method, chromatography–mass spectrometry device, and chromatography–mass spectrometry data processing program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007287531A (en) * 2006-04-18 2007-11-01 Shimadzu Corp Mass spectrometry data analysis method
WO2008035419A1 (en) * 2006-09-21 2008-03-27 Shimadzu Corporation Mass spectrometry method
JP4788773B2 (en) * 2006-11-27 2011-10-05 株式会社島津製作所 Mass spectrometry data analyzer
US8987662B2 (en) * 2009-05-14 2015-03-24 Agilent Technologies, Inc. System and method for performing tandem mass spectrometry analysis
JP5510011B2 (en) * 2010-04-07 2014-06-04 株式会社島津製作所 Mass spectrometry method and mass spectrometer

Also Published As

Publication number Publication date
JP2013190216A (en) 2013-09-26

Similar Documents

Publication Publication Date Title
JP5810983B2 (en) Compound identification method and compound identification system using mass spectrometry
JP5590156B2 (en) Mass spectrometry method and apparatus
US11145498B2 (en) Tandem mass spectrometry data processing system
JP6149810B2 (en) Metabolite analysis system and metabolite analysis method
JP2007287531A (en) Mass spectrometry data analysis method
JP6004080B2 (en) Data processing apparatus and data processing method
JP6191773B2 (en) Mass spectrometry data processor
JP6595922B2 (en) Mass spectrum analyzer, mass spectrum analysis method, mass spectrometer, and program
WO2008035419A1 (en) Mass spectrometry method
US9595426B2 (en) Method and system for mass spectrometry data analysis
US7529630B2 (en) Method of analyzing mass analysis data and apparatus for the method
JP2011220773A (en) Mass analysis method and mass analysis apparatus
JP6222277B2 (en) Tandem mass spectrometry data processor
JP6571770B2 (en) Determining the identity of modifying compounds
JP2014215172A (en) Mass analysis data analyzer for peptide structural analysis
US9989505B2 (en) Mass spectrometry (MS) identification algorithm
JPWO2004113905A1 (en) Mass spectrometry method and mass spectrometer
US11094399B2 (en) Method, system and program for analyzing mass spectrometoric data
JP6027436B2 (en) Mass spectrometry data analysis method
JP5660218B2 (en) Mass spectrometry data analysis method and apparatus
JP2014115087A (en) Peptide structure analysis method and device
WO2015104844A1 (en) Mass-spectrometry-data processing method and mass-spectrometry-data processing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140707

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150818

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150831

R151 Written notification of patent or utility model registration

Ref document number: 5810983

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151