WO2019240289A1 - 化合物の構造を同定するための方法およびシステム - Google Patents

化合物の構造を同定するための方法およびシステム Download PDF

Info

Publication number
WO2019240289A1
WO2019240289A1 PCT/JP2019/023780 JP2019023780W WO2019240289A1 WO 2019240289 A1 WO2019240289 A1 WO 2019240289A1 JP 2019023780 W JP2019023780 W JP 2019023780W WO 2019240289 A1 WO2019240289 A1 WO 2019240289A1
Authority
WO
WIPO (PCT)
Prior art keywords
compound
mass
database
fragment
candidate
Prior art date
Application number
PCT/JP2019/023780
Other languages
English (en)
French (fr)
Inventor
英介 早川
Original Assignee
学校法人沖縄科学技術大学院大学学園
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 学校法人沖縄科学技術大学院大学学園 filed Critical 学校法人沖縄科学技術大学院大学学園
Priority to JP2020525704A priority Critical patent/JPWO2019240289A1/ja
Priority to US17/251,523 priority patent/US11573201B2/en
Publication of WO2019240289A1 publication Critical patent/WO2019240289A1/ja
Priority to US18/165,013 priority patent/US20230251224A1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/622Ion mobility spectrometry
    • G01N27/623Ion mobility spectrometry combined with mass spectrometry
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/004Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn
    • H01J49/0045Combinations of spectrometers, tandem spectrometers, e.g. MS/MS, MSn characterised by the fragmentation or other specific reaction

Definitions

  • the present invention relates to a method and system for identifying the structure of a compound.
  • Identification of the structure of a compound for example, a low molecular compound: metabolite, natural product, drug, pollutant, etc. is important in various fields such as physiology, medicine, food, environment and the like. Identification of the structure of such a compound makes it possible to identify useful natural products, identify pollutants, develop biomarkers, and the like.
  • Mass spectrometry is used for structural identification of compounds in the fields of analytical chemistry, biomedicine, environmental research / industrial. In mass spectrometry, for example, first, a compound contained in a sample is separated by liquid chromatography, and the separated compound is ionized to obtain a mass spectrum.
  • mass spectrometry information on the mass-to-charge ratio of the precursor ion of the compound to be analyzed and the fragment ion generated by cleaving it may be used to estimate the structure of the compound.
  • the number of fragment ions observed is often small, it is difficult to estimate the cleavage site in the structure, and there are a large number of candidate structures that must be considered. It was difficult to identify the structure of the compound.
  • an object of the present invention is to provide a structure identification method and system that can identify the structures of various compounds.
  • the first method for identifying the structure of the compounds of the invention is: Spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ion of the compound to be analyzed and the collision cross section (CCS) is obtained from the structure information of the fragment ion of the standard substance and the mass-to-charge ratio of the fragment ion. And matching the spectral data in the reference spectral database combined with the collision cross section.
  • a second method for identifying the structure of a compound of the invention is: Estimating the mass and / or elemental composition of the compound to be analyzed from the mass-to-charge ratio (m / z) of the fragment ions and precursor ions of the compound to be analyzed; Based on the estimated mass and / or elemental composition of the compound to be analyzed, search from the chemical structure contained in the chemical structure database, or generate a theoretically existing structure based on the elemental composition.
  • CCS collisional cross section
  • a third method for identifying the structure of a compound of the invention is: Reference spectrum database that combines the measured mass-to-charge ratio (m / z) and collision cross-section (CCS) of the fragment ion of the compound to be analyzed with the structure of the fragment ion of the standard substance, the mass-to-charge ratio, and the collision cross-section.
  • a system for identifying the structure of the compounds of the present invention comprises: Spectral data generating means for generating spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ions of the analysis target compound and the collision cross section (CCS) from the mass analysis result of the analysis target compound; , A reference spectrum database including reference spectrum data combining the fragment ion structure of the standard substance with the mass-to-charge ratio and collision cross section of the fragment ion; A theoretical spectral database containing the structure of fragment ions and a theoretically calculated CCS; A matching means for matching spectral data with data in a reference spectral database and a theoretical spectral database; Candidate information generating means for generating a candidate structure from structure information in the reference spectrum database and the theoretical spectrum database; Output means for outputting the result of the matching means, Spectral data generation means and output means are connected to a reference spectrum database, theoretical spectrum database, candidate information generation means, and matching means via a communication network outside the system.
  • FIG. 1 is a flowchart showing an example of an analysis procedure by mass spectrometry and ion mobility spectrometry of a compound to be analyzed.
  • FIG. 2 is a photograph showing an example of fragment ion spectral data.
  • FIG. 3 is a flowchart showing an example of an analysis procedure when an analysis sample containing a plurality of compounds is analyzed.
  • FIG. 4 is a diagram illustrating an example of a procedure for constructing a reference spectrum database.
  • FIG. 5 is a diagram showing an outline of an example (embodiment 1) of the method of the present invention.
  • FIG. 6 is a diagram illustrating an example of a procedure for constructing a theoretical spectrum database.
  • FIG. 1 is a flowchart showing an example of an analysis procedure by mass spectrometry and ion mobility spectrometry of a compound to be analyzed.
  • FIG. 2 is a photograph showing an example of fragment ion spectral data.
  • FIG. 3 is a flowchart showing
  • FIG. 7 is a diagram showing an outline of another example (embodiment 2) of the method of the present invention.
  • FIG. 8 is a diagram illustrating an example of a procedure for predicting a collision cross-section using a machine learning model.
  • FIG. 9 is a diagram showing an outline of an example (embodiment 3) of the method of the present invention.
  • FIG. 10 is a diagram showing an outline of another example of the third embodiment.
  • FIG. 11 is a diagram showing an outline of still another example of the third embodiment.
  • FIG. 12 is a block diagram showing an example (embodiment 4) of the system of the present invention.
  • FIG. 13 is a block diagram showing an example (embodiment 5) of the apparatus of the present invention.
  • FIG. 14 is a diagram showing another example of the method of the present invention (Embodiment 1).
  • FIG. 15 shows another example of the reference spectrum database.
  • FIG. 16 is a diagram illustrating another example of the second embodiment.
  • FIG. 17 is a diagram illustrating a more specific example of the second embodiment.
  • FIG. 18 is a diagram illustrating another example of the third embodiment.
  • FIG. 19 is a diagram illustrating a more specific example of the third embodiment.
  • Item 1 A method for identifying the structure of a compound comprising: Spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ion of the compound to be analyzed and the collision cross section (CCS) is obtained from the structure information of the fragment ion of the standard substance and the mass-to-charge ratio of the fragment ion. And a step of matching with the spectral data in the reference spectral database that combines the collision cross section (matching step), Method.
  • Item 2. The method according to Item 1, further comprising the step of constructing a database including structural information of the fragment ions of the standard substance and data of mass to charge ratio and collision cross section.
  • Item 3. Item 3.
  • the method according to Item 1 or 2 further comprising a step of generating spectral data by performing mass spectrometry and ion mobility analysis on a fragment ion of a compound to be analyzed (spectral data generation step).
  • spectral data generation step a step of generating spectral data by performing mass spectrometry and ion mobility analysis on a fragment ion of a compound to be analyzed.
  • the compound spectrum data obtained by combining the measured m / z of the precursor ion of the compound to be analyzed and the CCS is combined with the structure of the precursor ion of the standard substance, the m / z of the precursor ion, and the CCS.
  • Item 4. The method according to any one of Items 1 to 3, further comprising the step of matching with the precursor ion reference spectrum data.
  • Item 5. Item 5.
  • Item 6 In the matching step, from among the fragment ions of the standard substance, those having a mass that matches the observed mass-to-charge ratio of the fragment ion of the compound to be analyzed are searched from the reference spectrum data as candidates, and for each candidate, Matches both the mass-to-charge ratio and the collision cross section in the target compound's spectral data and the reference spectral database with a given tolerance, calculates the matching score, and selects the candidate that shows the top score as a fragment of the target compound Item 6.
  • the method according to any one of Items 1 to 5, which is determined as an actual structure of ions.
  • Item 7 A method for identifying the structure of a compound comprising: A step of estimating the mass and / or element composition of the compound to be analyzed from the mass-to-charge ratio (m / z) of the fragment ion and precursor ion of the compound to be analyzed (mass / element composition estimation step); Based on the estimated mass and / or elemental composition of the compound to be analyzed, search from the chemical structure contained in the chemical structure database, or generate a theoretically existing structure based on the elemental composition.
  • (Candidate structure acquisition step) Obtaining a structure of a predicted fragment ion of a candidate structure by a systematic bond breaking or fragmentation prediction model (estimated fragment ion structure obtaining step); Theory including the collisional cross section (CCS) of the estimated fragment ion, the structure of the fragment ion of the reference material, the reference spectrum database combining the mass to charge ratio and the collision cross section, and the structure of the fragment ion and the CCS calculated theoretically Obtaining by searching a spectral database or by calculation and prediction based on the structure of an estimated fragment ion (estimated fragment ion collision cross section acquisition step); Matching the measured m / z and CCS of the fragment ion of the compound to be analyzed with the acquired m / z and CCS of the predicted fragment ion of the candidate structure (matching step), Method.
  • CCS collisional cross section
  • Item 8 In the candidate structure acquisition process, instead of or in addition to acquiring candidate structures from the chemical structures included in the chemical structure database, theoretically, based on the estimated elemental composition of the compound to be analyzed Item 8.
  • the measured m / z and CCS of the fragment ions of the compound to be analyzed are matched with the m / z of the estimated fragment ions of the candidate structure and the obtained CCS, and for each candidate structure, the mass charge A matching score is calculated based on the number of matched pairs of the ratio and collision cross section and the peak intensity of the fragment ion, and the candidate showing the top score is determined as the actual structure of the fragment ion of the compound to be analyzed.
  • a method for identifying the structure of a compound comprising: Reference spectrum database that combines the measured mass-to-charge ratio (m / z) and collision cross-section (CCS) of the fragment ion of the compound to be analyzed with the structure of the fragment ion of the standard substance, the mass-to-charge ratio, and the collision cross-section.
  • first matching step Obtaining a registered structure of fragment ions matched with a predetermined tolerance as a partial structure that can be taken by the compound to be analyzed (partial structure obtaining step); A process of obtaining a candidate structure of a compound to be analyzed by searching a chemical structure database for a chemical structure having a partial structure (candidate structure acquisition process); Generating a candidate structure that can theoretically exist based on the partial structure and elemental composition (candidate structure generating step); Obtaining a structure of a predicted fragment ion of a candidate structure by a systematic bond breaking or fragmentation prediction model (estimated fragment ion structure obtaining step); Search CCS of the estimated fragment ion, the reference spectrum database combining the fragment ion structure of the standard material, mass-charge ratio and collision cross section, and the theoretical spectrum database including the fragment ion structure and the theoretically calculated CCS Or a step of obtaining by calculation and prediction
  • the candidate structure acquisition step instead of acquiring a candidate structure by searching a chemical structure database for a chemical structure having a partial structure, the mass-to-charge ratio and the collision cross section of the observed fragment ions are determined using the fragment of the standard substance.
  • the candidate partial structure is obtained by matching the reference spectrum database combining the structure of the ion, the mass-to-charge ratio and the collision cross section, and the theoretical spectrum database including the structure of the fragment ion and the theoretically calculated CCS, Item 10.
  • the candidate structure is obtained from the chemical structure generated by the molecular structure generation algorithm for generating a theoretically possible structure based on the partial structure and the estimated elemental composition of the compound to be analyzed. the method of. Item 12.
  • the first matching step among the fragment ions of the standard substance, those having a mass that matches the observed mass-to-charge ratio of the fragment ions of the compound to be analyzed are searched as candidates from the reference spectrum data, For a candidate, both the spectral data of the compound to be analyzed and the mass-to-charge ratio and collision cross section in the reference spectrum database are matched with a predetermined tolerance, a matching score is calculated, and the candidate showing the top score is Determine the actual structure of the fragment ion of the compound, In the second matching step, the measured m / z and CCS of the fragment ion of the compound to be analyzed are matched with the m / z of the estimated fragment ion of the candidate structure and the obtained CCS, and for each candidate structure Calculate the matching score based on the number of matched pairs of mass-to-charge ratio and collision cross section and the peak intensity of the fragment ion, determine the candidate that shows the top score, and determine the actual structure of the fragment ion of the compound to be analyzed Item
  • a system for identifying the structure of a compound Spectral data generating means for generating spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ions of the analysis target compound and the collision cross section (CCS) from the mass analysis result of the analysis target compound; , A reference spectrum database including reference spectrum data combining the fragment ion structure of the standard substance with the mass-to-charge ratio and collision cross section of the fragment ion; A theoretical spectral database containing the structure of fragment ions and a theoretically calculated CCS; A matching means for matching spectral data with data in a reference spectral database and a theoretical spectral database; Means for generating candidate structures from structure information in the reference spectrum database and the theoretical spectrum database; Output means for outputting the result of the matching means,
  • the spectrum data generation means and the output means are connected to the reference spectrum database, the theoretical spectrum database, the candidate information generation means and the matching means via a communication line network outside the system.
  • the matching means searches the reference spectrum data for candidates that have a mass that matches the observed mass-to-charge ratio of the fragment ions of the compound to be analyzed, among the fragment ions of the standard substance, and for each candidate, Matches both the mass-to-charge ratio and the collision cross section in the target compound's spectral data and the reference spectral database with a given tolerance, calculates the matching score, and selects the candidate that shows the top score as a fragment of the target compound Item 14.
  • a system for identifying the structure of a compound Spectral data generating means for generating spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ions of the analysis target compound and the collision cross section (CCS) from the mass analysis result of the analysis target compound; , A mass / element composition estimation means for estimating the mass and / or elemental composition of the compound to be analyzed from the mass-to-charge ratio (m / z) of the fragment ion and precursor ion of the compound to be analyzed; A chemical structure database; Candidate structure acquisition means for acquiring a candidate structure from the chemical structures included in the chemical structure database based on the estimated mass and / or elemental composition of the compound to be analyzed; A putative fragment ion structure obtaining means for obtaining a structure of a putative fragment ion of a candidate structure by a systematic bond breaking or fragmentation prediction model; A theoretical spectral database containing the structure of fragment ions and a theoretically calculated CCS; An estimated fragment
  • a matching means matches the measured m / z and CCS of the fragment ions of the compound to be analyzed with the m / z of the estimated fragment ions of the candidate structure and the obtained CCS, and for each candidate structure, the mass charge
  • a matching score is calculated based on the number of matched pairs of the ratio and the collision cross section and the peak intensity of the fragment ion, and the candidate indicating the top score is determined as the actual structure of the fragment ion of the compound to be analyzed. 15.
  • a system for identifying the structure of a compound Spectral data generating means for generating spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ions of the analysis target compound and the collision cross section (CCS) from the mass analysis result of the analysis target compound; , A first matching means for matching the measured mass to charge ratio (m / z) and collision cross section (CCS) of the fragment ion of the compound to be analyzed with the mass to charge ratio and collision cross section of the fragment ion of the standard substance; , A partial structure acquisition means for acquiring a registered structure of a fragment ion of a standard substance matched with a predetermined tolerance as a partial structure that can be taken by the compound to be analyzed; A chemical structure database; Candidate structure acquisition means for acquiring a candidate structure of a compound to be analyzed by searching a chemical structure database for a chemical structure having a partial structure; A putative fragment ion structure obtaining means for obtaining a structure of a putative fragment
  • the first matching means searches the reference spectrum data for candidates that have a mass that matches the observed mass-to-charge ratio of the fragment ions of the compound to be analyzed from among the fragment ions of the standard substance, For a candidate, both the spectral data of the compound to be analyzed and the mass-to-charge ratio and collision cross section in the reference spectrum database are matched with a predetermined tolerance, a matching score is calculated, and the candidate showing the top score is Judged as the actual structure of the fragment ion of the compound, A second match matches the measured m / z and CCS of the fragment ions of the compound to be analyzed with the m / z and estimated CCS of the predicted fragment ions of the candidate structure, and for each candidate structure, A matching score is calculated based on the number of matched pairs of the mass-to-charge ratio and the collision cross section and the peak intensity of the fragment ion, and the candidate indicating the top score is determined as the actual structure of the fragment ion of the compound to be analyzed.
  • Item 18 The system according to Item 17.
  • Item 19 An apparatus for identifying the structure of a compound, Means for generating spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ion of the compound to be analyzed and the collision cross section (CCS) from the mass analysis result of the compound to be analyzed;
  • a reference spectrum database including reference spectrum data combining the fragment ion structure of the standard substance with the mass-to-charge ratio and collision cross section of the fragment ion;
  • Item 20 Means for identifying the structure of a compound, Means for generating spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ion of the compound to be analyzed and the collision cross section (CCS) from the mass analysis result of the compound to be analyzed.
  • a reference spectrum database including reference spectrum data combining the fragment ion structure
  • a method for identifying the structure of a compound comprising: Generating spectral data combining the measured mass-to-charge ratio (m / z) of the fragment ions of the analyte compound and the collision cross section (CCS) from the mass analysis result of the analyte compound; Matching the spectral data with reference spectral data contained in a database including reference spectral data combining the fragment ion structure of the standard material with the mass to charge ratio and collision cross section of the fragment ions, Method.
  • the first embodiment of the present invention is a method for identifying the structure of the aforementioned compound, and the subject of the method is a person.
  • a procedure that can be interpreted as being executed on a computer can be interpreted as, for example, a person executing a procedure corresponding to the computer.
  • This embodiment includes the above-described reference spectrum data generation process theoretically generated from the reference substance-derived reference spectrum data and a known compound structure, and the calculation and matching process of the mass-to-charge ratio and collision cross section from the fragment structure, including.
  • Compound spectral data generation step 1-1 Measurement of Mass-to-Charge Ratio and Collision Cross Section
  • precursor ions and fragment ions of ionized compounds are measured by mass spectrometry and ion mobility-spectrometry to generate spectral data.
  • the mass-to-charge ratio and the collision cross section of the fragment ion of the compound to be analyzed are measured.
  • the compound to be analyzed is analyzed by mass spectrometry and ion mobility spectrometry (FIGS. 1 and 2).
  • the mass-to-charge ratio of the precursor ions and the collision cross-section are usually measured together with the measurement of the mass-to-charge ratio and collision cross-section of the fragment ions.
  • mass spectrometry and ion mobility spectrometry are performed.
  • a compound to be analyzed is ionized by an ion source on a mass spectrometer.
  • Ion sources can include, but are not limited to, for example, electrospray ionization, atmospheric pressure photoionization, electron impact ionization, desorption electrospray ionization, matrix-assisted laser desorption ionization, and other related methods.
  • the mass to charge ratio is measured by a mass spectrometer, for example, Fourier transform ion cyclotron resonance, time of flight, orbitrap or other analyzer.
  • the collision cross section is obtained by measuring the drift time by separating the precursor ions of the compound with an ion mobility spectrometry measuring device, for example, a drift tube, traveling wave, high field asymmetric waveform device.
  • the collision cross section is obtained by calibrating using the standard compound calibration curve drift time with known collision cross section.
  • FIG. 2 shows an example of fragment ion spectrum data.
  • a precursor ion of a compound to be analyzed is isolated by applying a mass filter, for example, a quadrupole or ion trap device provided in a mass spectrometer. Then, fragmentation of the precursor ions of the compound to be analyzed is caused by using a fragmentation device such as collision induced dissociation, high energy collision induced dissociation, electron capture dissociation or electron transfer dissociation.
  • a fragmentation device such as collision induced dissociation, high energy collision induced dissociation, electron capture dissociation or electron transfer dissociation.
  • these compounds are separated by a chromatography method, for example, liquid chromatography, capillary electrophoresis or supercritical fluid chromatography (left side of FIG. 3).
  • a chromatography method for example, liquid chromatography, capillary electrophoresis or supercritical fluid chromatography (left side of FIG. 3).
  • the precursor ions of the compound detected in each scan are then measured as described above.
  • the analytical sample is separated using gas chromatography, the mass-to-charge ratio and collision cross section of fragment ions from each compound are generated by deconvolution of the fragment ions.
  • the fragment ion of the compound to be analyzed is converted to data such as SWATH. Acquired by the dependency acquisition method (right side of FIG. 3).
  • a data-independent acquisition method precursor ions of the compound to be analyzed within a narrow mass window are separated and subjected to fragmentation. This series of processes is repeated over the entire mass range and proceeds in stages. Fragment ions derived from precursor compounds can be obtained by deconvolution of fragment ion data-independent acquisition data (Tsugawa et al., Nat Methods. 12: 523-6 (2015)).
  • Reference Spectrum Database The spectrum data (reference spectrum data) of the aforementioned standard substance is included in, for example, a reference spectrum database.
  • This database is used for structure identification of the compound to be analyzed.
  • This database may be stored in the auxiliary storage device of each user's client terminal, for example, or may be stored on a server.
  • the user may use a reference spectrum database that has been built in advance, or may construct and use a reference spectrum database, or the spectrum of the compound to be analyzed previously generated. Data may be included in the reference spectrum database to update the reference spectrum database.
  • Reference Spectrum Database As described above, for example, a reference spectrum database including reference spectrum data of a standard substance having a known structure can be constructed.
  • the reference spectrum database is used to measure the mass-to-charge ratio and collision cross section of the fragment ion of the standard substance in the same manner as the measurement of the mass to charge ratio and collision cross section of the compound to be analyzed, and Can be constructed by generating reference spectrum data in combination with (FIG. 4).
  • Reference materials include, for example, chemically synthesized standard compounds, and compounds isolated from standard samples (eg, animal and plant tissue extracts, environmental and medical samples) and present And compounds whose structures have already been described in the literature.
  • a compound whose spectrum data has been previously generated and whose structure has been identified can also be used as a standard substance.
  • the mass-to-charge ratio and collision cross section of precursor ions of those compounds are measured, and these values are stored in a database together with the structures of those compounds.
  • the precursor ions of the aforementioned compounds are then fragmented, the mass-to-charge ratio and collision cross section of the fragment ions are measured, and these values are stored in a database.
  • the measured fragment ion structure of the standard substance as follows. Specifically, for example, the theoretical and possible fragment ion structure was calculated by systematically breaking covalent bonds in the structure of the standard (precursor ion of the compound), and this calculation From the structure, the mass to charge ratio for this structure is calculated. If the calculated mass to charge ratio matches the observed fragment ion value, then register the matched fragment ion structure as a possible structure of the fragment ion, along with the measured mass to charge ratio and collision cross section .
  • a fragmentation model and the accompanying structural rearrangement are applied to the molecular structure of the standard substance.
  • This structure estimation is performed by, for example, a fragmentation prediction tool CFM-predict (Allen et al., Nucleic Acids Res. 42: W94-9 (2014), which is a machine learning model trained with fragmentation spectrum data and molecular structure as input. )) And the like can be achieved by fragment prediction.
  • CFM-predict Allen et al., Nucleic Acids Res. 42: W94-9 (2014), which is a machine learning model trained with fragmentation spectrum data and molecular structure as input.
  • fragment prediction In order to predict the structure of fragment ions, fragmentation rules and mechanisms collected from published literature are applied to the chemical structure of a standard substance (a precursor ion of a compound).
  • This prediction can be achieved, for example, by scanning the partial structure by SMARTS pattern matching using the partial structure library RDKit.
  • a tool that predicts a fragment structure by applying a fragment rule such as MassFrontier (Thermo Fisher Science) is also used to generate a fragment structure by applying the fragmentation rule.
  • a fragmented structure having a mass to charge ratio that matches the peak of the measured fragment spectrum is added to the compound entry along with the observed mass to charge ratio and collision cross section.
  • this step since the reference spectrum data included in the reference spectrum database is used, this method may be referred to as a reference spectrum database dependent method.
  • this method since the reference spectrum data included in the reference spectrum database is used, this method may be referred to as a reference spectrum database dependent method.
  • the system explained in full detail below is an illustration, and does not limit this invention at all.
  • This step is achieved by comparing the spectral data of the compound to be analyzed with reference spectral data.
  • FIG. 5 shows an example of this embodiment.
  • For each candidate a comparison of the mass and ion mobility peaks in the spectral data of the compound to be analyzed and the reference spectral database is performed by matching both the mass to charge ratio and the collision cross section with a predetermined tolerance.
  • the following score function is used.
  • m is the number of fragment ions in the reference spectrum data of the candidate compound.
  • the structures of various compounds can be identified.
  • the collision cross-section information of precursor ions does not have sufficient resolution to identify the compound, and there are cases where multiple compounds have the same collision cross-section. Since it can exist, it is practically impossible to identify the structure from a huge number of candidate structures.
  • the resolution of the ion mobility analyzer is sufficient even if the candidate structure is enormous. The structure can be identified with high accuracy even if it is not.
  • FIG. 14 shows another example of the method of the present embodiment.
  • specific compounds are exemplified for the reference spectrum data, but the present invention is not limited to this, and reference spectrum data of a wide variety of compounds can be used to construct a reference spectrum database.
  • FIG. 15 shows another example of the reference spectrum database. This figure shows detailed data of mass (mass-to-charge ratio) and ion mobility of fragment ions (partial structures) of the standard substance.
  • the spectral data of the fragment ions of the compound to be analyzed is matched with the reference spectral data as shown in this figure, that is, the mass (mass-to-charge ratio) and the ion mobility are matched. It becomes possible to identify the compound.
  • specific compounds are illustrated for the reference spectrum data, but the present invention is not limited to this, and reference spectrum data of a wide variety of compounds can be used to construct a reference spectrum database.
  • the second embodiment of the present invention is a method for identifying the structure of the aforementioned compound to be analyzed, and the subject of this method is a person.
  • a procedure that can be interpreted as being executed on a computer can be interpreted as, for example, a person executing a procedure corresponding to the computer.
  • This embodiment is a method for identifying the chemical structure of a compound to be analyzed when it is not registered in the reference spectrum database of the aforementioned standard substance.
  • This embodiment includes the aforementioned mass / element composition estimation step, candidate structure acquisition step, estimated fragment ion structure acquisition step, estimated fragment ion collision cross section acquisition step, and matching step.
  • FIG. 7 shows an outline of an example of this embodiment.
  • Mass / element composition estimation step In this step, first, as described in “1-1. Measurement of Mass-to-Charge Ratio (m / z) and Collision Cross Section (CCS)” in Embodiment 1 described above, the analysis target The mass-to-charge ratio and the collision cross section of the precursor ion and fragment ion of the compound are measured. From this measurement result, the mass and / or elemental composition of the compound to be analyzed is estimated. The elemental composition of the compound to be analyzed is estimated in consideration of the type of ionized adduct and measurement error, and then filtered by the valence rule and element ratio. A candidate molecular structure is estimated based on the candidate element composition and further selected by applying the same process to the fragment ions of the compound to be analyzed.
  • this process is performed by both the chemical structure database dependent method and the independent method. Note that this step is not necessarily performed by both the chemical structure database-dependent method and the independent method.
  • the chemical structure database-dependent method may be performed, or only the chemical structure database-independent method may be performed. Good.
  • candidate structures are searched by the chemical structure database dependent method as described below, and candidate structures are generated by the chemical structure database independent method.
  • Chemical Structure Database Dependent Methods Chemical structure databases include, but are not limited to, PubChem and ChEBI, for example.
  • determining the structure by searching for a true structure from a list of candidate chemical structures in the chemical structure database match the mass of the analyte compound based on the measured mass-to-charge ratio of the analyte compound And a candidate structure is selected ("chemical structure DB dependence" in FIG. 7).
  • the adduct type such as [M + H] + and [M + Na] + is taken into consideration and matched to the mass of the candidate structure.
  • the anion adduct type such as [MH]-.
  • the candidate structure is generated by a molecular structure generation algorithm.
  • a theoretical molecular structure generation tool for example, Open Molecular Generator (Peironcel et al., J. Chemmoinfo. (2012) 4:21) or MOLGEN is used to estimate the compound to be analyzed.
  • Candidate structures that can theoretically exist are generated based on the determined elemental composition.
  • the virtual fragment ion collision cross section is acquired by searching the above-described reference spectrum database and the later-described theoretical fragment database. In this step, it is not always necessary to search the reference spectrum database, and only the theoretical spectrum database may be searched. As a result of this search, when a fragment ion having the same structure as the virtual fragment ion is found, the collision cross section registered for the fragment ion is searched. If no fragment ion having the same structure as the virtual fragment ion is found, the collision cross section of these virtual fragments is calculated based on the structure of the virtual fragment by the method described later. For example, the collision cross section of the virtual fragment obtained by this calculation can be registered in the theoretical database together with the structure of the virtual fragment. As a result, the fragment structure covered by the theoretical database becomes richer.
  • Theoretical Spectral Database includes fragment ion mass to charge ratios and theoretically calculated collision cross sections.
  • a database can be constructed as follows. That is, first, the two-dimensional structure of the compound is obtained as a chemical structure resource, for example, a chemical structure database, for example, a text chemical structure identifier such as InChI or SMILES, or a file, for example, SDF. Subsequently, these identifiers or files are converted into a 2D structure by using a chemoinformatics library, for example, RDKit, and the structure of the fragment ion of the compound is converted into the “2-2.
  • a chemoinformatics library for example, RDKit
  • the theoretical collision cross section is calculated as follows. That is, first, a 2D structure of a compound described as a chemical identifier, for example, InChI or SMILES or a file, for example, SDF, is obtained from a chemical structure database, for example, PubChem. For most acidic or basic amino acids, estimate using pKa calculation tools such as Marvin pKa plug-in (ChemAxon) or chemoinformatics library to predict protonation, deprotonation and other addition sites To do. The ionic form of the compound is generated by attaching an adduct such as proton or sodium to the most basic atom. In the case of an anion, hydrogen bonded to the most acidic atom is removed to produce an anion structure.
  • pKa calculation tools such as Marvin pKa plug-in (ChemAxon) or chemoinformatics library to predict protonation, deprotonation and other addition sites To do.
  • the ionic form of the compound is
  • 100 conformers for the precursor ions of a compound are generated and their structure is optimized by applying a MMFF94 molecular force field using a chemoinformatics toolkit, eg, RDKit.
  • the conformation with the lowest energy is selected and the electron distribution is calculated by density functional theory with B3LYP exchange correlation function and 6-31g * basis set using computational chemistry tools such as Gaussian.
  • Collision cross sections are calculated by the Trajectory method or Exact Hard Sphere method using MOBCAL software, modified for the buffer gases used for ion mobility analysis (eg, N 2 and CO 2 ).
  • the molecular descriptor and fingerprint for the estimated structure of each fragment ion in the reference spectrum database are calculated as follows.
  • a molecular descriptor generator eg, PaDEL-Descriptor, is used to generate molecular descriptors (constitutive, WHIM, topological, fingerprint).
  • a circular ECFP fingerprint is generated by a chemoinformatics toolkit, eg, RDKit.
  • candidate conformers are determined for each compound precursor ion and its fragment ion. Generate for structure.
  • a spherical extended 3D fingerprint (E3FP) is generated by the E3FP algorithm.
  • 3D conformer-related values such as volume and molecular surface area are calculated from the optimized 3D conformer described in “4-2. Calculation of theoretical collision cross section” of this embodiment.
  • Matching step In this step, candidate fragments (virtual fragment ions) are searched by searching the same structure against the reference spectrum database and the theoretical spectrum database for each structure of the predicted fragment ions for each candidate structure of the compound to be analyzed. ) Obtain the mass to charge ratio and collision cross section of the structure. If the candidate fragment structure is not found in these databases, the collision cross section is calculated and predicted according to the above 4-2 and 4-3. At this time, the database can be expanded by registering the calculated collision cross section of fragment ions in the theoretical spectrum database. The matching is performed as follows, for example.
  • the mass-to-charge ratio and collision cross-section of these standard substance-derived or virtual fragment ions are matched with the mass-to-charge ratio and collision cross-section in the spectrum data of the fragment ions of the compound to be analyzed.
  • each compound candidate is evaluated by the scoring function shown below based on the number of matched pairs of the mass-to-charge ratio and the collision cross section and the peak intensity of the fragment ions.
  • m is the number of fragment ions in the measured spectral data of the compound to be analyzed.
  • P i 1 if the mass to charge ratio and collision cross section of the virtual fragment ion match the measured fragment ion mass to charge ratio and collision cross section.
  • FIG. 16 shows another example of the method of the present embodiment.
  • FIG. 16 illustrates specific compounds for chemical structure database and molecular structure generation.
  • the present invention is not limited to this, and can be used for chemical structure database and molecular structure generation of a wide variety of compounds.
  • FIG. 17 shows a more specific example of the method of the present embodiment.
  • this invention is not limited to this, According to this invention, the structure of a wide variety of compounds can be identified.
  • the first embodiment of the present invention is a method for identifying the structure of the aforementioned compound to be analyzed, and the subject of the method is a person.
  • a procedure that can be interpreted as being executed on a computer can be interpreted as, for example, a person executing a procedure corresponding to the computer.
  • the method of this embodiment is sometimes referred to as a spectral similarity method. 9 to 11 show examples of the method of this embodiment.
  • First Matching Step This step can be performed in the same manner as “2. Matching step” in the first embodiment. That is, the measured spectrum data of the fragment ions of the compound to be analyzed is searched against the reference spectrum database (FIGS. 9 to 11).
  • Substructure acquisition step If the fragment ions of the compound to be analyzed have a plurality of fragment ions whose mass-to-charge ratio and collision cross section are found to match with a given tolerance in this reference spectrum data, those fragments Get the registered structure of an ion.
  • the structures of these fragment ions can be regarded as candidates for the partial structure of the compound to be analyzed. This is because these fragment ions have the same unique combination of mass to charge ratio and collision cross section. That is, it can be considered that such a standard substance and a compound to be analyzed have a high possibility of having their fragment ions as a common partial structure.
  • the search for the candidate structure of the compound to be analyzed can be performed by, for example, “2-1.
  • the retrieved candidate structure is further inspected to have a partial structure retrieved from the reference spectrum database (FIGS. 9 and 11).
  • the candidate structures can be obtained by, for example, “2-2. As described in the “independent method”, it is generated by an algorithm for generating a molecular structure (FIG. 10). In addition, starting from the structure or structure group of fragment ions obtained from the reference spectrum database, all theoretically possible structures that satisfy the composition formula of the observed compound to be analyzed are generated from them as candidate structures. Also do.
  • a candidate structure generation can be performed by, for example, a theoretical chemical structure generation algorithm such as Open Molecular Generator (Peironcel et al., J. Cheminfo. (2012) 4:21) or RetroPath2 (Delepine et al. Metabolic Engineering (18). , 45: 158-170.).
  • Estimated fragment ion structure acquisition step This step can be performed in the same manner as in “3. Estimated (virtual) fragment ion structure acquisition step” in Embodiment 2 described above (FIGS. 9 to 11).
  • Estimated (virtual) fragment ion collision cross-sectional area acquisition step This step can be performed in the same manner as “4. Estimated (virtual) fragment ion collision cross-sectional area acquisition step” in the above-described embodiment 2 (FIGS. 9 to 11).
  • Second Matching Step This step can be performed in the same manner as “5. Matching step” in the second embodiment (FIGS. 9 to 11).
  • FIG. 18 shows another example of the method of the present embodiment.
  • the spectral similarity is evaluated between the spectral data of the compound to be analyzed and the reference spectral database.
  • a common partial structure can be clearly detected by matching “mass (mass-to-charge ratio) and ion mobility” of both spectrum data, and as a result, a candidate structure can be generated.
  • specific compounds are illustrated for the reference spectrum data.
  • the present invention is not limited to this, and reference spectrum data of a wide variety of compounds can be used to construct a reference spectrum database.
  • FIG. 19 shows a more specific example of the method of the present embodiment.
  • this invention is not limited to this, According to this invention, the structure of a wide variety of compounds can be identified.
  • a fourth embodiment of the present invention is a system for identifying the structure of a compound, and includes a spectrum data generating means, a reference spectrum database, a matching means, and an output means as described above, and a spectrum.
  • the data generation means and the output means are connected to the reference spectrum database and the matching means via a communication line network outside the system.
  • FIG. 12 shows the configuration of an example of the system according to this embodiment.
  • the system 100 includes a spectrum data generation unit 110, an output unit 130, a communication interface 150, and a server 170.
  • the spectrum data generation unit 110 and the output unit 130 are electrically connected to the communication interface 150.
  • the communication interface 150 and the server 170 are connected via the line network 160.
  • the spectrum data generation unit 110 is a CPU of the client terminal 112 connected to the mass spectrometer 111, for example.
  • the server 170 side has matching means, and the server 170 stores a reference spectrum database.
  • the spectrum data generated by the spectrum data generation unit 110 is transmitted to the server 170, and the server 170 matches the spectrum data with the reference spectrum data as described above.
  • the matching result is output by the output means 130.
  • the server since the server has a matching means, it is possible to perform advanced arithmetic processing required for matching in the server. As a result, for example, the structure of the compound is identified at a higher speed. be able to.
  • the database update frequency can be increased compared to the case where the reference spectrum database is stored in each client terminal. As a result, for example, more The structure of various compounds can be identified.
  • the system of this embodiment may be, for example, a system corresponding to any of Embodiments 1 to 3 described above, and can execute each process described in Embodiments 1 to 3.
  • the server may include various databases such as the aforementioned chemical structure database and theoretical spectrum database.
  • the spectrum data generation unit is the CPU of the client terminal.
  • the present invention is not limited to this, and for example, the server may have the spectrum data generation unit. .
  • the structure of the compound can be identified at a higher speed.
  • the fifth embodiment of the present invention is an apparatus for identifying the structure of a compound, and includes a spectrum data generating means, a reference spectrum database, and a matching means as described above.
  • FIG. 13 shows a configuration of an example of an apparatus according to this embodiment.
  • the apparatus 200 includes a spectrum data generation unit 110, an output unit 130, a matching unit 140, and a reference spectrum database 180.
  • the spectrum data generation unit 110 is electrically connected to the output unit 130 and the matching unit 140.
  • the matching unit 140 is electrically connected to the output unit 130 and the reference spectrum database 180.
  • the spectrum data generation unit 110 and the matching unit 140 are, for example, a CPU.
  • the output unit 130 is, for example, a display, for example, a liquid crystal display.
  • the output unit 130 can output the matching result by the matching unit 140, and can output the spectrum data generated by the spectrum data generation unit 110, for example.
  • the reference spectrum database 180 is, for example, an auxiliary storage device, and the reference spectrum data is data stored in the auxiliary storage device.
  • the spectrum data generation unit 110 is connected to a mass spectrometer, for example.
  • the structure of the compound to be analyzed can be identified with a single device even when not in a communication environment.
  • the reference spectrum database may be updated in a communication environment.
  • the apparatus according to the present embodiment may be, for example, an apparatus corresponding to any of the first to third embodiments described above, and can execute the steps described in the first to third embodiments.
  • the apparatus may include various databases such as the aforementioned chemical structure database and theoretical spectrum database. These databases may also be updated in a communication environment, for example.
  • the sixth embodiment of the present invention is a method for identifying the structure of a compound, and each step of the method is executed by a computer.
  • This embodiment includes the above-described and matching steps.
  • the method of the present embodiment may be executed by, for example, the system described in the above-described embodiment 4 or the apparatus described in the above-described embodiment 5, and each process described in the above-described embodiments 1-3.
  • the part which a computer performs among these can be performed.
  • the seventh embodiment of the present invention is a program capable of executing the above-described compound identification method on a computer.
  • This embodiment may be recorded on a recording medium, for example.
  • the recording medium include a random access memory (RAM), a read only memory (ROM), a hard disk (HD), a USB memory, an optical disk, a floppy (registered trademark) disk (FD), and the like.
  • the present invention it is possible to provide a method and system for identifying the structure of a compound that can identify the structure of various compounds. For this reason, the present invention can be applied to various fields such as fields such as physiology, medicine, food, environment and the like.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Electrochemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本発明は、分析対象の化合物のフラグメントイオンの質量電荷比および衝突断面積を使用して、広い各種の低分子化合物の化学構造を同定するための方法に関する。分析対象の化合物をイオン化し、フラグメント化し、フラグメントイオンを、イオンモビリティスペクトロメトリー測定装置を備えた質量分析装置により測定する。本方法によれば、化合物クラス特異的特性または構造的特徴に何ら依存しないため、特定の化合物クラスに限定されず、低分子化合物の決定が可能である。本発明は、共通のデータ構造およびデータ処理方法を共有する3つの方法からなる。

Description

化合物の構造を同定するための方法およびシステム
 本発明は、化合物の構造を同定するための方法およびシステムに関する。
 化合物、例えば、低分子化合物:代謝産物、天然物、薬物、汚染物質等の構造を同定することは、各種の分野、例えば、生理学、医学、食品、環境等の分野において重要である。このような化合物の構造の同定により、例えば、有用な天然物の同定、汚染物質の特定、バイオマーカー開発等が可能となる。
 化合物の構造を同定するための技術としては、例えば、質量分析法が挙げられる。質量分析法は、分析化学、生物医薬、環境調査/工業の分野において、化合物の構造同定に使用されている。質量分析法では、例えば、まず、液体クロマトグラフィーにより、試料中に含まれる化合物を分離し、分離された化合物をイオン化し、質量スペクトルを取得する。
 質量分析においては分析対象の化合物の前駆体イオンおよびこれを開裂させることにより生じるフラグメントイオンの質量電荷比情報を取得し、これを化合物の構造の推定に利用することがあるが、特に低分子化合物の場合観測されるフラグメントイオン数が少ないことが多く、また構造中の開裂部位を推定することが困難であり、さらに、考慮しなければならない候補構造が膨大であるため、質量分析のみの情報で化合物の構造を同定するのは困難であった。
 近年では、質量分析とイオンモビリティスペクトロメトリーとが統合された分析装置が存在し、そのような装置で測定された分析対象の化合物の前駆体イオンの衝突断面積についての情報を、あらかじめ標準物質を測定して得た質量電荷比および衝突断面積の値をデータベース化した情報にマッチングさせる例もある(特許文献1)が、この方法では、構造決定できる化合物は標準物質に依存してしまう問題がある。
特表2018-517905号公報
 そこで、本発明は、多様な化合物の構造を同定することができる、構造同定の方法およびシステムを提供することを目的とする。
 本発明の化合物の構造を同定するための第1の方法は、
 分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを、標準物質のフラグメントイオンの構造情報と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータベース内のスペクトルデータとマッチさせる工程を含む。
 本発明の化合物の構造を同定するための第2の方法は、
 分析対象の化合物のフラグメントイオンおよび前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する工程と、
 推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から検索、もしくは元素組成に基づいて理論的に存在する構造を生成することで候補構造を取得する工程と、
 候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程と、
 推定フラグメントイオンの衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程と、
 分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンの取得されたm/zおよびCCSとマッチさせる工程とを含む。
 本発明の化合物の構造を同定するための第3の方法は、
 分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)および衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースにマッチさせる工程と、
 所定の許容度でマッチしたフラグメントイオンの登録された構造を、分析対象の化合物のとり得る部分構造として取得する工程と、
 部分構造を有する化学構造を化学構造データベースにおいて検索することにより、分析対象の化合物の候補構造を取得する工程と、
 候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程と、
 推定フラグメントイオンのCCSを、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよび、フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程と、
 分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせる工程とを含む。
 本発明の化合物の構造を同定するためのシステムは、
 分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
 標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むリファレンススペクトルデータベースと、
 フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
 スペクトルデータを、リファレンススペクトルデータベースおよび理論スペクトルデータベース内のデータとマッチさせるマッチング手段と、
 リファレンススペクトルデータベースおよび理論スペクトルデータベース内の構造情報から候補構造を生成する候補情報生成手段と、
 マッチング手段による結果を出力する出力手段とを含み、
 スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、リファレンススペクトルデータベース、理論スペクトルデータベース、候補情報生成手段およびマッチング手段と接続されている。
 本発明によれば、多様な化合物の構造を同定することができる、化合物の構造を同定するための方法およびシステムを提供することができる。
図1は、分析対象の化合物の質量分析とイオンモビリティスペクトロメトリーとによる分析手順の一例を示すフロー図である。 図2は、フラグメントイオンのスペクトルデータの一例を示す写真である。 図3は、複数の化合物を含有する分析試料を分析する場合の、分析手順の一例を示すフロー図である。 図4は、リファレンススペクトルデータベースを構築する手順の一例を示す図である。 図5は、本発明の方法の一例(実施態様1)の概要を示す図である。 図6は、理論スペクトルデータベースを構築する手順の一例を示す図である。 図7は、本発明の方法の他の例(実施態様2)の概要を示す図である。 図8は、機械学習モデルにより衝突断面積を予測する手順の一例を示す図である。 図9は、本発明の方法の一例(実施態様3)の概要を示す図である。 図10は、実施態様3の他の例の概要を示す図である。 図11は、実施態様3のさらに他の例の概要を示す図である。 図12は、本発明のシステムの一例(実施態様4)を示すブロック図である。 図13は、本発明の装置の一例(実施態様5)を示すブロック図である。 図14は、本発明の方法(実施態様1)の他の例を示す図である。 図15は、リファレンススペクトルデータベースの別の例を示す。 図16は、実施態様2の他の例を示す図である。 図17は、実施態様2のより具体的な例を示す図である。 図18は、実施態様3の他の例を示す図である。 図19は、実施態様3のより具体的な例を示す図である。
項1.化合物の構造を同定するための方法であって、
 分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを、標準物質のフラグメントイオンの構造情報と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータベース内のスペクトルデータとマッチさせる工程(マッチング工程)を含む、
 方法。
項2.さらに、標準物質のフラグメントイオンの構造情報と質量電荷比および衝突断面積のデータを含むデータベースを構築する工程を含む、項1記載の方法。
項3.さらに、分析対象の化合物のフラグメントイオンを質量分析およびイオンモビリティ分析して、スペクトルデータを生成する工程(スペクトルデータ生成工程)を含む、項1または2記載の方法。
項4.さらに、分析対象の化合物の前駆体イオンの測定されたm/zとCCSとを組み合わせた化合物スペクトルデータを、標準物質の前駆体イオンの構造と同前駆体イオンのm/zおよびCCSとを組み合わせた前駆体イオンリファレンススペクトルデータとマッチさせる工程を含む、項1~3のいずれか一項記載の方法。
項5.さらに、分析対象の化合物の前駆体イオンを質量分析およびイオンモビリティ分析して、前駆体イオンスペクトルデータを生成する工程を含む、項4記載の方法。
項6.マッチング工程において、標準物質のフラグメントイオンの中から、分析対象の化合物のフラグメントイオンの観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量電荷比および衝突断面積の両方を所定の許容差でマッチさせて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と決定する、項1~5のいずれか一項記載の方法。
項7.化合物の構造を同定するための方法であって、
 分析対象の化合物のフラグメントイオンおよび前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する工程(質量・元素組成推定工程)と、
 推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から検索、もしくは元素組成に基づいて理論的に存在する構造を生成することで候補構造を取得する工程(候補構造取得工程)と、
 候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程(推定フラグメントイオン構造取得工程)と、
 推定フラグメントイオンの衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程(推定フラグメントイオン衝突断面積取得工程)と、
 分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンの取得されたm/zおよびCCSとマッチさせる工程(マッチング工程)とを含む、
 方法。
項8.候補構造取得工程において、化学構造データベースに含まれる化学構造の中から候補構造を取得するのに代えて、または、同取得に加えて、分析対象の化合物の推定される元素組成に基づいて理論的にとり得る構造を生成するための分子構造生成のアルゴリズムにより生成された化学構造の中から候補構造を取得する、項7記載の方法。
項9.マッチング工程において、分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせ、各候補構造に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と決定する、項7または8記載の方法。
項10.化合物の構造を同定するための方法であって、
 分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)および衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースにマッチさせる工程(第1のマッチング工程)と、
 所定の許容度でマッチしたフラグメントイオンの登録された構造を、分析対象の化合物のとり得る部分構造として取得する工程(部分構造取得工程)と、
 部分構造を有する化学構造を化学構造データベースにおいて検索することにより、分析対象の化合物の候補構造を取得する工程(候補構造取得工程)と、
 部分構造と元素組成をもとに理論的に存在し得る候補構造を生成する工程(候補構造生成工程)と、
 候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程(推定フラグメントイオン構造取得工程)と、
 推定フラグメントイオンのCCSを、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよび、フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程(推定フラグメントイオン衝突断面積取得工程)と、
 分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせる工程(第2のマッチング工程)とを含む、
 方法。
項11.候補構造取得工程において、部分構造を有する化学構造を化学構造データベースにおいて検索することにより候補構造を取得するのに代えて、観測されたフラグメントイオンの質量電荷比および衝突断面積を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよび、フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースにマッチさせることで、候補部分構造を取得し、この部分構造と分析対象の化合物の推定される元素組成に基づいて理論的にとり得る構造を生成するための分子構造生成のアルゴリズムにより生成された化学構造の中から候補構造を取得する、項10記載の方法。
項12.第1のマッチング工程において、標準物質のフラグメントイオンの中から、分析対象の化合物のフラグメントイオンの観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量電荷比および衝突断面積の両方を所定の許容差でマッチさせて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と決定し、
 第2のマッチング工程において、分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせ、各候補構造に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と決定する、項10または11記載の方法。
項13.化合物の構造を同定するためのシステムであって、
 分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
 標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むリファレンススペクトルデータベースと、
 フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
 スペクトルデータを、リファレンススペクトルデータベースおよび理論スペクトルデータベース内のデータとマッチさせるマッチング手段と、
 リファレンススペクトルデータベースおよび理論スペクトルデータベース内の構造情報から候補構造を生成する手段と、
 マッチング手段による結果を出力する出力手段とを含み、
 スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、リファレンススペクトルデータベース、理論スペクトルデータベース、候補情報生成手段およびマッチング手段と接続されている、
 システム。
項14.マッチング手段が、標準物質のフラグメントイオンの中から、分析対象の化合物のフラグメントイオンの観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量電荷比および衝突断面積の両方を所定の許容差でマッチさせて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と判定する、項13記載のシステム。
項15.化合物の構造を同定するためのシステムであって、
 分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
 分析対象の化合物のフラグメントイオンおよび前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する質量・元素組成推定手段と、
 化学構造データベースと、
 推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から候補構造を取得する候補構造取得手段と、
 候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する推定フラグメントイオン構造取得手段と、
 フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
 推定フラグメントイオンの衝突断面積(CCS)を、理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する推定フラグメントイオン衝突断面積取得手段と、
 分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせるマッチング手段と、
 マッチング手段による結果を出力する出力手段とを含み、
 スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、質量・元素組成推定手段、化学構造データベース、候補構造取得手段、推定フラグメントイオン構造取得手段、理論スペクトルデータベース、推定フラグメントイオン衝突断面積取得手段およびマッチング手段と接続されている、
 システム。
項16.マッチング手段が、分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせ、各候補構造に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と判定する、項15記載のシステム。
項17.化合物の構造を同定するためのシステムであって、
 分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
 分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)および衝突断面積(CCS)を、標準物質のフラグメントイオンの質量電荷比および衝突断面積とマッチさせる第1のマッチング手段と、
 所定の許容度でマッチした標準物質のフラグメントイオンの登録された構造を、分析対象の化合物のとり得る部分構造として取得する部分構造取得手段と、
 化学構造データベースと、
 部分構造を有する化学構造を化学構造データベースにおいて検索することにより、分析対象の化合物の候補構造を取得する候補構造取得手段と、
 候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する推定フラグメントイオン構造取得手段と、
 フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
 推定フラグメントイオンのCCSを、理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する推定フラグメントイオン衝突断面積取得手段と、
 分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせる第2のマッチング手段と、
 第2のマッチング手段による結果を出力する出力手段とを含み、
 スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、第1のマッチング手段、部分構造取得手段、化学構造データベース、候補構造取得手段、推定フラグメントイオン構造取得手段、理論スペクトルデータベース、推定フラグメントイオン衝突断面積取得手段および第2のマッチング手段と接続されている、
 システム。
項18.第1のマッチング手段が、標準物質のフラグメントイオンの中から、分析対象の化合物のフラグメントイオンの観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量電荷比および衝突断面積の両方を所定の許容差でマッチさせて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と判定し、
 第2のマッチングが、分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせ、各候補構造に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、マッチングスコアを計算し、トップスコアを示す候補を、分析対象の化合物のフラグメントイオンの実際の構造と判定する、項17記載のシステム。
項19.化合物の構造を同定するための装置であって、
 分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成する手段と、
 標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むリファレンススペクトルデータベースと、
 スペクトルデータを、リファレンススペクトルデータとマッチさせる手段と、
 マッチさせた結果を出力する手段とを含む、
 装置。
項20.化合物の構造を同定するための方法であって、
 分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成する工程と、
 スペクトルデータを、標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むデータベース中に含まれるリファレンススペクトルデータとマッチさせる工程とを含む、
 方法。
 つぎに、本発明の実施態様について説明する。なお、本発明は、下記実施態様により何ら限定および制限されない。図1~19において、「DB」という略称が使用されている場合があり、これは、「データベース」の略称である。
(第1の実施態様)
 本発明の第1の実施態様は、前述の化合物の構造を同定するための方法であり、同方法の主体は、人である。本実施態様において、人が行う手順のうち、コンピュータ上で実行されていると解釈することもできる手順は、例えば、人がコンピュータに該当する手順を実行させていると解釈することもできる。本実施態様は、前述の、標準物質由来のリファレンススペクトルデータおよび既知の化合物構造から理論的に生成するリファレンススペクトルデータ生成工程と、フラグメント構造からの質量電荷比および衝突断面積の計算とマッチング工程とを含む。
1.化合物のスペクトルデータ生成工程
1-1.質量電荷比および衝突断面積の測定
 本工程において、イオン化した化合物の前駆体イオンおよびフラグメントイオンを質量分析法およびイオンモビリティ―スペクトロメトリーにより測定し、スペクトルデータを生成する。同データを生成するために、まず、分析対象の化合物のフラグメントイオンの質量電荷比および衝突断面積を測定する。具体的には、例えば、分析対象の化合物を、質量分析とイオンモビリティスペクトロメトリーとにより分析する(図1および2)。この場合、通常、フラグメントイオンの質量電荷比および衝突断面積の測定と併せて、前駆体イオンの質量電荷比および衝突断面積の測定も行う。具体的には、例えば、図1の左側(化合物の前駆体イオン)および右側(フラグメントイオン)に示されたように、質量分析とイオンモビリティスペクトロメトリーとを行う。まず、分析対象の化合物を、質量分析装置上のイオン源によりイオン化する。イオン源としては、例えば、エレクトロスプレーイオン化、大気圧光イオン化、電子衝撃イオン化、脱着エレクトロスプレーイオン化、マトリックス支援レーザー脱着イオン化および他の関連する方法を挙げることができるが、これらに限定されない。質量電荷比を、質量分析装置、例えば、フーリエ変換イオンサイクロトロン共鳴、飛行時間、オービトラップまたは他の分析器により測定する。衝突断面積を、イオンモビリティスペクトロメトリー測定装置、例えば、ドリフトチューブ、トラベリングウェーブ、高フィールド非対称波形装置によって化合物の前駆体イオンを分離することでドリフトタイムを測定することにより取得する。衝突断面積を、衝突断面積が既知である標準化合物の検量線のドリフトタイムを用いてキャリブレーションすることにより取得する。図2に、フラグメントイオンのスペクトルデータの一例を示す。
 分析対象の化合物のフラグメントイオン情報を、以下のように取得する。まず、質量フィルタ、例えば、質量分析装置に備わった四重極またはイオントラップ装置を適用することにより、分析対象の化合物の前駆体イオンを単離する。ついで、フラグメント化装置、例えば、衝突誘起解離、高エネルギー衝突誘起解離、電子捕捉解離または電子移動解離等を使用することにより、分析対象の化合物の前駆体イオンのフラグメント化を引き起こす。また、分析対象の化合物をガスクロマトグラフィーにより測定する場合、電子移動解離が生じるため、フラグメントイオンを取得することができる。
 複数の化合物を含有する試料について分析を行う場合、まず、これらの化合物を、クロマトグラフィー法、例えば、液体クロマトグラフィー、キャピラリー電気泳動または超臨界流体クロマトグラフィーにより分離する(図3左側)。ついで、各スキャンにおいて検出された化合物の前駆体イオンを、上記のように測定する。分析試料を、ガスクロマトグラフィーを使用して分離する場合、各化合物由来のフラグメントイオンの質量電荷比および衝突断面積は、フラグメントイオンのデコンボリューションにより生成する。
 あるいは、質量分析装置を化合物分離機器、例えば、液体クロマトグラフィー、キャピラリー電気泳動または超臨界流体クロマトグラフィーに連結することにより分析を行う場合、分析対象の化合物のフラグメントイオンを、SWATHのようなデータ非依存取得法により取得する(図3右側)。データ非依存取得法では、狭い質量ウィンドウ内の分析対象の化合物の前駆体イオンを分離し、これをフラグメンテーションに供する。この一連のプロセスを、全質量範囲にわたって繰り返し、段階的に進める。前駆体化合物に由来するフラグメントイオンを、フラグメントイオンデータ非依存取得データのデコンボリューションにより取得することができる(Tsugawa et al.,Nat Methods.12:523-6(2015))。
2.マッチング工程
 本工程において、分析対象の化合物のフラグメントイオンの測定された質量電荷比と衝突断面積とを組み合わせたスペクトルデータを、標準物質を測定することで得られたフラグメントイオンの質量電荷比および衝突断面積の値とフラグメントイオンの推定構造を記載したリファレンススペクトルデータとマッチさせる。マッチングの方法については、後述する。
2-1.リファレンススペクトルデータベース
 前述の標準物質のスペクトルデータ(リファレンススペクトルデータ)は、例えば、リファレンススペクトルデータベースに含まれる。このデータベースを、分析対象の化合物の構造同定に使用する。このデータベースは、例えば、各ユーザのクライアント端末の補助記憶装置に記憶されていてもよいし、サーバ上に記憶されていてもよい。本発明において、ユーザは、例えば、予め構築されているリファレンススペクトルデータベースを利用してもよいし、リファレンススペクトルデータベースを構築し、利用してもよいし、先に生成された分析対象の化合物のスペクトルデータをリファレンススペクトルデータベースに含ませて、リファレンススペクトルデータベースを更新してもよい。
2-2.リファレンススペクトルデータベースの構築
 前述のように、例えば、構造が既知の標準物質のリファレンススペクトルデータを含むリファレンススペクトルデータベースを構築することができる。例えば、リファレンススペクトルデータベースを、標準物質のフラグメントイオンの質量電荷比および衝突断面積を前述の分析対象の化合物の質量電荷比および衝突断面積の測定と同様に測定し、標準物質のフラグメントイオンの構造と組み合わせてリファレンススペクトルデータを生成することにより構築することができる(図4)。標準物質としては、例えば、化学的に合成された標準化合物が挙げられ、また、標準試料(例えば、動物および植物組織抽出物、環境および医療試料)から単離された化合物であって、その存在および構造が既に文献に記載されている化合物も挙げられる。また、本発明において、先にスペクトルデータが生成され、構造が同定された化合物も、標準物質として利用可能である。
 まず、標準物質または標準試料について、それらの化合物の前駆体イオンの質量電荷比および衝突断面積を測定し、これらの値を、それらの化合物の構造と共にデータベースに記憶させる。ついで、前述の化合物の前駆体イオンをフラグメント化し、フラグメントイオンの質量電荷比および衝突断面積を測定し、これらの値をデータベースに記憶させる。
 標準物質の測定されたフラグメントイオンの構造を、下記のように推定する。具体的には、例えば、理論的および可能性のあるフラグメントイオンの構造を、標準物質(化合物の前駆体イオン)の構造中の共有結合を系統的に切断することにより計算し、この計算された構造から、この構造についての質量電荷比を計算する。計算された質量電荷比が観察されたフラグメントイオンの値と一致する場合、一致したフラグメントイオンの構造を、測定された質量電荷比および衝突断面積と共に、フラグメントイオンの可能性のある構造として登録する。
 あるいは、標準物質の観察されたフラグメントイオンの構造を推定するために、例えば、フラグメント化のモデルおよびそれに伴う構造の再編成を、標準物質の分子構造に適用する。この構造推定は、例えば、入力としてフラグメント化スペクトルデータおよび分子構造により訓練された機械学習モデルであるフラグメント化予測ツールCFM-predict(Allen et al.,Nucleic Acids Re.s 42:W94-9(2014))等の、フラグメント予測により達成され得る。また、フラグメントイオンの構造を予測するために、公開された文献から収集されたフラグメント化規則およびメカニズムを、標準物質(化合物の前駆体イオン)の化学構造に適用する。この予測は、例えば、部分構造ライブラリRDKitを使用するSMARTSパターンマッチングによって部分構造をスキャンすることにより達成され得る。また、MassFrontier(Thermo Fisher Science)等のフラグメントルールを適用することによりフラグメント構造を予測するツールも、フラグメント化規則を適用し、フラグメント化構造を生成するのに使用される。測定されたフラグメントスペクトルのピークに一致する質量電荷比を有するフラグメント化構造を、観測された質量電荷比および衝突断面積と共に化合物のエントリに加える。
 以下に、前述のマッチング工程を詳述する。本工程では、リファレンススペクトルデータベースに含まれるリファレンススペクトルデータを利用するため、本方法を、リファレンススペクトルデータベース依存法ということがある。なお、以下で詳述する方式は例示であり、本発明を何ら限定するものではない。
 分析対象の化合物のスペクトルデータを、リファレンススペクトルデータと比較することにより、本工程を達成する。図5に、本実施態様の一例を示す。まず、標準物質のフラグメントイオンのうち、観察された質量電荷比にマッチする質量を有するものを、候補としてリファレンススペクトルデータ内から検索し、化合物エントリとする。各候補について、分析対象の化合物のスペクトルデータおよびリファレンススペクトルデータベースにおける質量およびイオンモビリティピークの比較を、質量電荷比および衝突断面積の両方を所定の許容差でマッチさせることにより行う。候補を評価するために、下記のようなスコア関数を利用する。
Figure JPOXMLDOC01-appb-M000001

 式中、mは、候補化合物のリファレンススペクトルデータ中のフラグメントイオン数である。リファレンススペクトルデータ中のフラグメントイオンの質量電荷比および衝突断面積が分析対象の化合物の測定されたフラグメントイオンの質量電荷比および衝突断面積とマッチする場合、P=1である。リファレンススペクトルデータ中のフラグメントイオンの質量電荷比および衝突断面積が分析対象の化合物の測定されたフラグメントイオンの質量電荷比または衝突断面積とマッチしない場合、P=0である。Iは、測定されたスペクトルにおけるピーク強度である。得られたスコアを使用して、候補を比較し、トップスコアを示す候補を、分析対象の化合物の実際の構造と決定する。なお、候補の評価には、厳密に上記関数を利用するのみではなく、同様なマッチしたフラグメントイオンの数とそのシグナル強度を考慮した関数を利用することもできる。
 以上のように、分析対象の化合物のスペクトルデータを、リファレンススペクトルデータベースとマッチングさせることにより、本実施態様の方法によれば、多様な化合物の構造を同定することができる。
 従来技術では、化合物自体(前駆体イオン)のイオンモビリティのみを利用しており、フラグメントイオンのイオンモビリティを利用していない。したがって、構造同定が可能であるのはすでに同一の化合物での実測データがある化合物に限定される。そして、現在のイオンモビリティ分析装置では前駆体イオンの衝突断面積情報は、化合物を同定するのに十分な解像能を有さないうえに、複数の化合物が同一の衝突断面積を有するケースも存在しうるため、膨大な候補構造の中から構造同定を行うことは事実上不可能である。一方、本実施態様の方法によれば、化合物由来の複数のフラグメントイオンの固有の構造を反映した衝突断面積を用いるため、候補構造が膨大であっても、またイオンモビリティ分析装置の解像度が十分でなくとも高精度で構造同定が可能である。
 図14に、本実施形態の方法の他の例を示す。図14では、リファレンススペクトルデータについて具体的な化合物が例示されているが、本発明は、これには限定されず、多種多様な化合物のリファレンススペクトルデータをリファレンススペクトルデータベースの構築に利用できる。また、図15に、リファレンススペクトルデータベースの別の例を示す。この図では、標準物質のフラグメントイオン(部分構造)の質量(質量電荷比)およびイオンモビリティの詳細なデータを示す。本発明では、分析対象の化合物のフラグメントイオンのスペクトルデータを、この図に示されたようなリファレンススペクトルデータとマッチングさせることにより、すなわち、質量(質量電荷比)およびイオンモビリティのマッチングにより、分析対象の化合物の同定が可能となる。なお、この図において、リファレンススペクトルデータについて具体的な化合物が例示されているが、本発明は、これには限定されず、多種多様な化合物のリファレンススペクトルデータをリファレンススペクトルデータベースの構築に利用できる。
(第2の実施態様)
 本発明の第2の実施態様は、前述の分析対象の化合物の構造を同定するための方法であり、同方法の主体は、人である。本実施態様において、人が行う手順のうち、コンピュータ上で実行されていると解釈することもできる手順は、例えば、人がコンピュータに該当する手順を実行させていると解釈することもできる。本実施態様は、分析対象の化合物が前述の標準物質によるリファレンススペクトルデータベースに登録されていない場合において、その化学構造を同定するための方法である。本実施態様は、前述の、質量・元素組成推定工程と、候補構造取得工程と、推定フラグメントイオン構造取得工程と、推定フラグメントイオン衝突断面積取得工程と、マッチング工程とを含む。図7に、本実施形態の一例の概要を示す。
1.質量・元素組成推定工程
 本工程において、まず、前述の実施態様1の「1-1.質量電荷比(m/z)および衝突断面積(CCS)の測定」に記載されたように、分析対象の化合物の前駆体イオンおよびフラグメントイオンの質量電荷比および衝突断面積を測定する。この測定結果から、分析対象の化合物の質量および/または元素組成を推定する。分析対象の化合物の元素組成を、イオン化付加体の種類および測定誤差を考慮して推定し、ついで、原子価規則および元素比でフィルタリングする。候補元素組成に基づき候補分子構造を推定し、分析対象の化合物のフラグメントイオンに同じプロセスを適用することによりさらに選択する。
2.候補構造取得工程
 本実施態様では、本工程を化学構造データベース依存法および非依存法の両方により行う。なお、本工程は、必ずしも化学構造データベース依存法および非依存法の両方により行う必要はなく、例えば、化学構造データベース依存法のみで行ってもよいし、化学構造データベース非依存法のみにより行ってもよい。本実施態様では、化学構造データベース依存法により下記のように候補構造を検索し、化学構造データベース非依存法により候補構造を生成する。
2-1.化学構造データベース依存法
 化学構造データベースとしては、例えば、PubChemおよびChEBIが挙げられるが、これらに限定されない。化学構造データベースにおける候補化学構造のリストの中から真の構造を検索することにより構造決定を行う場合、分析対象の化合物の測定された質量電荷比に基づいて分析対象の化合物の質量をマッチさせることにより検索し、候補構造を選択する(図7における「化学構造DB依存」)。分析対象の化合物を陽イオンモードで測定した場合、[M+H]+および[M+Na]+等の陽イオン付加体タイプを考慮し、候補構造の質量にマッチさせる。分析対象の化合物を陰イオンモードで測定した場合、[M-H]-等の陰イオン付加体タイプを考慮し、候補構造の質量にマッチさせる。
2-2.化学構造データベース非依存法
 候補情報、例えば、化学構造データベースを何ら使用せずに候補構造決定を行う場合、候補構造を、分子構造生成アルゴリズムにより生成する。具体的には、例えば、理論的分子構造生成ツール、例えば、Open Molecular Generator(Peironcely et al.,J.Cehmoinfo.(2012)4:21)またはMOLGEN等を使用して、分析対象の化合物の推定された元素組成に基づいて理論的に存在し得る候補構造を生成する。
3.推定(仮想)フラグメントイオン構造取得工程
 上記化学構造データベース依存法により候補構造を検索・選択し、上記化学構造データベース非依存法により候補構造を生成した後に、これらの分析対象の化合物の候補構造から、前述の実施態様1の「2-2.リファレンススペクトルデータベースの構築」において記載されたのと同様に、系統的切断ならびに/またはフラグメント化モデルおよびフラグメント化による構造の再編成を考慮し、分析対象の化合物の候補構造の推定(仮想)フラグメントイオンを生成(予測)する。
4.推定(仮想)フラグメントイオン衝突断面積取得工程
 仮想フラグメントイオンの衝突断面積を、前述のリファレンススペクトルデータベースおよび後述の理論フラグメントデータベースを検索することにより取得する。なお、本工程において、必ずしも、リファレンススペクトルデータベースを検索する必要はなく、理論スペクトルデータベースのみを検索してもよい。この検索の結果、仮想フラグメントイオンと同一の構造を有するフラグメントイオンが見出された場合、そのフラグメントイオンについて登録された衝突断面積を検索する。仮想フラグメントイオンと同一の構造を有するフラグメントイオンが見出されなかった場合、これらの仮想フラグメントの衝突断面積を、後述の方法により仮想フラグメントの構造に基づいて計算する。例えば、この計算により求められた仮想フラグメントの衝突断面積を、同仮想フラグメントの構造と共に、理論データベースに登録することができる。これにより、理論データベースのカバーするフラグメント構造がより豊富になる。
4-1.理論スペクトルデータベース
 前述の理論スペクトルデータベースは、フラグメントイオンの質量電荷比と理論的に計算された衝突断面積を含む。このようなデータベースを、以下のように構築することができる。すなわち、まず、化合物の二次元構造を、化学構造のリソース、例えば、化学構造データベース、例えば、InChIやSMILESのようなテキスト化学構造識別子またはファイル、例えば、SDFとして取得する。ついで、これらの識別子またはファイルを、ケモインフォマティクスライブラリ、例えば、RDKitを使用することにより2D構造に変換し、化合物のフラグメントイオンの構造を、前述の第1の実施態様の「2-2.リファレンススペクトルデータベースの構築」に記載されているように、フラグメント化モデルおよび規則を適用することにより推定する。ついで、生成されたフラグメント構造を使用して、それらの質量電荷比および衝突断面積を計算する。衝突断面積の計算は、以下に詳述する。フラグメントイオンの構造を、その計算された質量電荷比および衝突断面積と共に理論スペクトルデータベースに登録し、計算方法とタグ付けする(図6)。
4-2.理論衝突断面積の計算
 理論衝突断面積を、下記のように計算する。すなわち、まず、化学識別子、例えば、InChIもしくはSMILESまたはファイル、例えば、SDFとして記載される化合物の2D構造を、化学構造データベース、例えば、PubChemから取得する。ほとんどの酸性または塩基性アミノ酸については、プロトン化、脱プロトン化および他の付加部位を予測するために、pKa計算ツール、例えば、Marvin pKaプラグイン(ChemAxon)またはケモインフォマティクスライブラリ等を使用して推定する。化合物のイオン形態を、プロトンまたはナトリウム等の付加物を最も塩基性の原子に付着させることにより生成する。陰イオンの場合、最も酸性の原子に結合している水素を除去して、陰イオン構造を生成する。
 例えば、化合物の前駆体イオンについての100個のコンフォーマを生成し、それらの構造を、ケモインフォマティクスツールキット、例えば、RDKitを使用してMMFF94分子力場を適用することにより最適化する。最低エネルギーを有するコンフォーメーションを選択し、計算化学ツール、例えば、Gaussianを使用して、B3LYP交換相関関数および6-31g基底集合による密度関数理論により電子分布を計算する。衝突断面積を、イオンモビリティ解析に使用される緩衝気体(例えば、NおよびCO)用に修正された、MOBCALソフトウェアを使用するTrajectory法またはExact Hard Sphere法により計算する。
4-3.機械学習モデルによる衝突断面積の予測
 このアプローチでは、化合物の前駆体イオンおよびフラグメントイオンの衝突断面積を、統計学的および機械学習アプローチにより予測する(図8)。
 リファレンススペクトルデータベースにおける各フラグメントイオンの推定構造について、分子記述子およびフィンガープリントを、下記のように計算する。分子記述子生成器、例えば、PaDEL-Descriptorを使用して、分子記述子(構成的、WHIM、トポロジー的、フィンガープリント)を生成する。円形ECFPフィンガープリントを、ケモインフォマティックスツールキット、例えば、RDKitにより生成する。3Dコンフォーマフィンガープリントおよび記述子について、まず、コンフォーマ候補を、本実施態様の「4-2.理論衝突断面積の計算」に記載されているように、各化合物前駆体イオンおよびそのフラグメントイオン構造について生成する。球面拡張3Dフィンガープリント(E3FP)を、E3FPアルゴリズムにより生成する。体積、分子表面積等の3Dコンフォーマ関連値を、本実施態様の「4-2.理論衝突断面積の計算」に記載されている最適化された3Dコンフォーマから計算する。
 観測された分子記述子およびフィンガープリントを、訓練データセットとして使用し、機械学習ライブラリ、例えば、Scikit-learnを使用して、衝突断面積を予測するサポートベクトル回帰モデルを構築する。2つのパラメータ:制約違反のコストおよびガンマの組み合わせを、交差検証試験により訓練データを使用して評価する。予測のための最良の最小平均二乗誤差を与えるパラメータペアを、予測モデルのために選択する。
5.マッチング工程
 本工程において、分析対象の化合物の各候補構造に関する予測されたフラグメントイオンの各構造について、リファレンススペクトルデータベースおよび理論スペクトルデータベースに対して同一の構造を検索することにより、候補フラグメント(仮想フラグメントイオン)構造の質量電荷比および衝突断面積を得る。候補フラグメント構造がこれらデータベースに見出されなかった場合は、上記4-2および4-3により衝突断面積の計算および予測を行う。なお、この際、計算されたフラグメントイオンの衝突断面積を理論スペクトルデータベースに登録されることでデータベースを拡充することができる。マッチングを、例えば、以下のように行う。すなわち、まず、これらの標準物質由来もしくは仮想のフラグメントイオンの質量電荷比および衝突断面積を、分析対象の化合物のフラグメントイオンのスペクトルデータにおける質量電荷比および衝突断面積とマッチさせる。このようにして、各化合物候補に対して、質量電荷比と衝突断面積とのマッチペアの数とフラグメントイオンのピーク強度とに基づいて、以下に示されるスコアリング関数により評価する。
Figure JPOXMLDOC01-appb-M000002

 式中、mは、測定された分析対象の化合物のスペクトルデータ中のフラグメントイオン数である。仮想フラグメントイオンの質量電荷比および衝突断面積が測定されたフラグメントイオンの質量電荷比および衝突断面積とマッチする場合、P=1である。仮想フラグメントイオンの質量電荷比および衝突断面積が測定されたフラグメントイオンの質量電荷比および衝突断面積とマッチしない場合、P=0である。Iは、測定されたフラグメントイオンのピーク強度である。Wは、重み係数である。衝突断面積をリファレンススペクトルデータベースから取得する場合、W=1である。衝突断面積を、「4-2.理論衝突断面積の計算」または「4-3.機械学習モデルによる衝突断面積の予測」により導出する場合、それぞれW=0.8と0.6である。得られたスコアを使用して、候補を比較し、トップスコアを示す候補を、分析対象の化合物の実際の構造と決定する。なお、候補の評価には、厳密に上記関数を利用するのみではなく、同様なマッチしたフラグメントイオンの数とそのシグナル強度を考慮した関数を利用することもできる。
 以上のようにマッチングさせることにより、本実施態様の方法によれば、標準物質または標準試料のリファレンススペクトルデータベース中に該当するものが登録されていない化合物についても、その化合物の構造を同定することができる。
 図16に、本実施形態の方法の他の例を示す。図16では、化学構造データベースおよび分子構造生成について具体的な化合物が例示されているが、本発明は、これには限定されず、多種多様な化合物の化学構造データベースおよび分子構造生成に利用できる。
 図17に、本実施形態の方法のより具体的な例を示す。なお、図17には、具体的な化合物が例示されているが、本発明は、これには限定されず、本発明によれば、多種多様な化合物の構造を同定することができる。
(第3の実施態様)
 本発明の第1の実施態様は、前述の分析対象の化合物の構造を同定するための方法であり、同方法の主体は、人である。本実施態様において、人が行う手順のうち、コンピュータ上で実行されていると解釈することもできる手順は、例えば、人がコンピュータに該当する手順を実行させていると解釈することもできる。本実施態様は、前述の、第1のマッチング工程と、部分構造取得工程と、候補構造取得工程と、推定フラグメントイオン構造取得工程と、推定(仮想)フラグメントイオン衝突断面積取得工程と、第2のマッチング工程とを含む。本実施態様の方法を、スペクトル類似度法ということがある。図9~11に、本実施態様の方法の例を示す。
1.第1のマッチング工程
 本工程を、前述の実施態様1の「2.マッチング工程」と同様に行うことができる。すなわち、分析対象の化合物のフラグメントイオンの測定されたスペクトルデータを、リファレンススペクトルデータベースに対して検索する(図9~11)。
2.部分構造取得工程
 分析対象の化合物のフラグメントイオンが、このリファレンススペクトルデータにおいて質量電荷比および衝突断面積が所定の許容度でマッチすることが見出された複数のフラグメントイオンを有する場合、それらのフラグメントイオンの登録された構造を取得する。ここで、これらのフラグメントイオンの構造を、分析対象の化合物の部分構造の候補と見なすことができる。これらのフラグメントイオンは、質量電荷比と衝突断面積との同じ固有の組み合わせを有するためである。すなわち、このような標準物質と分析対象の化合物とは、共通の部分構造としてそれらのフラグメントイオンを有する可能性が高いとみなすことができる。
 分析対象の化合物の候補構造の検索を、例えば、前述の実施態様2の「2-1.化学構造データベース依存法」により行うことができる。ついで、検索された候補構造について、リファレンススペクトルデータベースから検索された部分構造を有するか、さらに検査する(図9および11)。
 候補構造決定を予め選ばれた構造候補なし(すなわち、化学構造データベースを何ら使用せず)に達成する場合、それらの候補構造を、例えば、前述の実施態様2の「2-2.化学構造データベース非依存法」に記載されたように、分子構造生成のアルゴリズムにより生成する(図10)。また、リファレンススペクトルデータベースから得られたフラグメントイオンの構造または構造群を出発点として、そこから、観測された分析対象の化合物の組成式を満たす、理論的にとり得る構造を全て生成して候補構造とすることも行う。このような候補構造生成を、例えば、Open Molecular Generator(Peironcely et al.,J.Cheminfo.(2012)4:21)のような理論化学構造生成アルゴリズムまたはRetroPath2(Delepine et al.Metabolic Engineering(2018),45:158-170.)のような仮想化学反応ツールで行うことができる。
3.推定フラグメントイオン構造取得工程
 本工程を、前述の実施態様2の「3.推定(仮想)フラグメントイオン構造取得工程」と同様に行うことができる(図9~11)。
4.推定(仮想)フラグメントイオン衝突断面積取得工程
 本工程を、前述の実施態様2の「4.推定(仮想)フラグメントイオン衝突断面積取得工程」と同様に行うことができる(図9~11)。
5.第2のマッチング工程
 本工程を、前述の実施態様2の「5.マッチング工程」と同様に行うことができる(図9~11)。
 以上のようにマッチングさせることにより、種々のデータベースおよび理論を組み合わせることにより、さらに多様な化合物の構造を同定することができる。
 図18に、本実施形態の方法の他の例を示す。この図に示されたように、本実施形態の他の例では、分析対象の化合物のスペクトルデータとリファレンススペクトルデータベースとの間でスペクトル類似度を評価する。そして、両スペクトルデータの「質量(質量電荷比)およびイオンモビリティ」のマッチングにより、共通の部分構造を明確に検出し、その結果として、候補構造を生成することができる。なお、図18では、リファレンススペクトルデータについて具体的な化合物が例示されているが、本発明は、これには限定されず、多種多様な化合物のリファレンススペクトルデータをリファレンススペクトルデータベースの構築に利用できる。
 図19に、本実施形態の方法のより具体的な例を示す。なお、図19には、具体的な化合物が例示されているが、本発明は、これには限定されず、本発明によれば、多種多様な化合物の構造を同定することができる。
(第4の実施態様)
 本発明の第4の実施態様は、化合物の構造を同定するためのシステムであって、前述のように、スペクトルデータ生成手段と、リファレンススペクトルデータベースと、マッチング手段と、出力手段とを含み、スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、リファレンススペクトルデータベースおよびマッチング手段と接続されている。図12に、本実施態様のシステムの一例の構成を示す。図12に示されたとおり、このシステム100は、スペクトルデータ生成手段110と、出力手段130と、通信インターフェース150と、サーバ170とを備える。スペクトルデータ生成手段110および出力手段130は、通信インターフェース150に電気的に接続されている。そして、通信インターフェース150とサーバ170とが、回線網160を介して接続されている。スペクトルデータ生成手段110は、具体的には、例えば、質量分析装置111に接続されているクライアント端末112のCPUである。
 このシステムでは、サーバ170側に、マッチング手段を有し、サーバ170にリファレンススペクトルデータベースが記憶されている。例えば、スペクトルデータ生成手段110により生成されたスペクトルデータを、サーバ170に送信し、サーバ170側で、前述のように、スペクトルデータを、リファレンススペクトルデータとマッチさせる。また、マッチング結果を、出力手段130により出力する。
 本実施態様によれば、サーバがマッチング手段を有しているため、マッチングに必要となる高度な演算処理をサーバで行うことができ、その結果として、例えば、より高速に化合物の構造を同定することができる。また、リファレンススペクトルデータベースがサーバに記憶されているため、リファレンススペクトルデータベースが個々のクライアント端末に記憶されている場合と比較して、データベースの更新頻度を高めることができ、その結果として、例えば、より多様な化合物の構造の同定が可能になる。
 本実施態様のシステムは、例えば、前述の実施態様1~3のいずれかに対応するシステムでもよく、前述の実施態様1~3で説明された各工程を実行することができる。例えば、サーバは、前述の化学構造データベースおよび理論スペクトルデータベース等の各種データベースを含んでもよい。また、本実施形態のシステムでは、スペクトルデータ生成手段は、クライアント端末のCPUであるが、本発明は、これには限定されず、例えば、サーバが、スペクトルデータ生成手段を有していてもよい。このような態様であれば、例えば、スペクトルデータの生成も、サーバ側で行うことができるため、例えば、更に高速に化合物の構造を同定することができる。
(第5の実施態様)
 本発明の第5の実施態様は、化合物の構造を同定するための装置であって、前述のように、スペクトルデータ生成手段と、リファレンススペクトルデータベースと、マッチング手段とを含む。図13に、本実施態様の装置の一例の構成を示す。図13に示されたとおり、この装置200は、スペクトルデータ生成手段110と、出力手段130と、マッチング手段140と、リファレンススペクトルデータベース180とを備える。スペクトルデータ生成手段110は、出力手段130およびマッチング手段140に電気的に接続されている。マッチング手段140は、出力手段130およびリファレンススペクトルデータベース180に電気的に接続されている。スペクトルデータ生成手段110およびマッチング手段140は、例えば、CPUである。出力手段130は、例えば、ディスプレイ、例えば、液晶ディスプレイである。出力手段130は、マッチング手段140によるマッチング結果を出力し、また、例えば、スペクトルデータ生成手段110により生成されたスペクトルデータを出力することができる。リファレンススペクトルデータベース180は、例えば、補助記憶装置であり、リファレンススペクトルデータは、同補助記憶装置に記憶されているデータである。スペクトルデータ生成手段110は、例えば、質量分析装置に接続されている。
 本実施態様によれば、例えば、通信環境下に無い場合でも、単独の装置において分析対象の化合物の構造を同定することができる。また、例えば、リファレンススペクトルデータベースを、通信環境下で更新してもよい。
 本実施態様の装置は、例えば、前述の実施態様1~3のいずれかに対応する装置でもよく、前述の実施態様1~3で説明された各工程を実行することができる。例えば、本装置は、前述の化学構造データベースおよび理論スペクトルデータベース等の各種データベースを含んでもよい。これらのデータベースも、例えば、通信環境下で更新してもよい。
(第6の実施態様)
 本発明の第6の実施態様は、化合物の構造を同定するための方法であり、同方法の各工程は、コンピュータにより実行される。本実施態様は、前述の、と、マッチング工程とを含む。本実施態様の方法は、例えば、前述の実施態様4に記載されたシステムまたは前述の実施態様5に記載された装置により実行されてもよく、前述の実施態様1~3で説明された各工程のうちコンピュータが実行する部分を実行することができる。
(第7の実施態様)
 本発明の第7の実施態様は、前述の化合物同定方法を、コンピュータ上で実行可能なプログラムである。本実施態様は、例えば、記録媒体に記録されていてもよい。記録媒体としては、例えば、ランダムアクセスメモリ(RAM)、読出し専用メモリ(ROM)、ハードディスク(HD)、USBメモリ、光ディスク、フロッピー(登録商標)ディスク(FD)等が挙げられる。
 以上、実施態様を参照して本発明を説明したが、本発明は、上記実施態様に限定されるものではない。本発明の構成および詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 以上のように、本発明によれば、多様な化合物の構造を同定することができる、化合物の構造を同定するための方法およびシステムを提供することができる。このため、本発明は、各種の分野、例えば、生理学、医学、食品、環境等の分野等の広い分野に適用することができる。
100  システム(実施態様4)
110  スペクトルデータ生成手段
111  質量分析装置
112  クライアント端末
130  出力手段
140  マッチング手段
150  通信インターフェース
160  回線網
170  サーバ
180  リファレンススペクトルデータベース
200  装置(実施態様5)
[規則26に基づく補充 17.07.2019] (削除)
[規則26に基づく補充 17.07.2019] (削除)
[規則26に基づく補充 17.07.2019] (削除)
[規則26に基づく補充 17.07.2019] (削除)
[規則26に基づく補充 17.07.2019] (削除)

Claims (7)

  1.  化合物の構造を同定するための方法であって、
     分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを、標準物質のフラグメントイオンの構造情報と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータベース内のスペクトルデータとマッチさせる工程を含む、
     方法。
  2.  さらに、標準物質のフラグメントイオンの構造情報と質量電荷比および衝突断面積のデータを含むデータベースを構築する工程を含む、請求項1記載の方法。
  3.  化合物の構造を同定するための方法であって、
     分析対象の化合物のフラグメントイオンおよび前駆体イオンの質量電荷比(m/z)から分析対象の化合物の質量および/または元素組成を推定する工程と、
     推定された分析対象の化合物の質量および/または元素組成に基づいて、化学構造データベースに含まれる化学構造の中から検索、もしくは元素組成に基づいて理論的に存在する構造を生成することで候補構造を取得する工程と、
     候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程と、
     推定フラグメントイオンの衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程と、
     分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンの取得されたm/zおよびCCSとマッチさせる工程とを含む、
     方法。
  4.  候補構造取得工程において、化学構造データベースに含まれる化学構造の中から候補構造を取得するのに代えて、または、同取得に加えて、分析対象の化合物の推定される元素組成に基づいて理論的にとり得る構造を生成するための分子構造生成のアルゴリズムにより生成された化学構造の中から候補構造を取得する、請求項3記載の方法。
  5.  化合物の構造を同定するための方法であって、
     分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)および衝突断面積(CCS)を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよびフラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースにマッチさせる工程と、
     所定の許容度でマッチしたフラグメントイオンの登録された構造を、分析対象の化合物のとり得る部分構造として取得する工程と、
     部分構造を有する化学構造を化学構造データベースにおいて検索することにより、分析対象の化合物の候補構造を取得する工程と、
     候補構造の推定フラグメントイオンの構造を、系統的結合切断またはフラグメント化予測モデルにより取得する工程と、
     推定フラグメントイオンのCCSを、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよび、フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースを検索することにより、または、推定フラグメントイオンの構造に基づく計算および予測により取得する工程と、
     分析対象の化合物のフラグメントイオンの測定されたm/zおよびCCSを、候補構造の推定フラグメントイオンのm/zおよび取得されたCCSとマッチさせる工程とを含む、
     方法。
  6.  候補構造取得工程において、部分構造を有する化学構造を化学構造データベースにおいて検索することにより候補構造を取得するのに代えて、観測されたフラグメントイオンの質量電荷比および衝突断面積を、標準物質のフラグメントイオンの構造、質量電荷比と衝突断面積とを組み合わせたリファレンススペクトルデータベースおよび、フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースにマッチさせることで、候補部分構造を取得し、この部分構造と分析対象の化合物の推定される元素組成に基づいて理論的にとり得る構造を生成するための分子構造生成のアルゴリズムにより生成された化学構造の中から候補構造を取得する、請求項5記載の方法。
  7.  化合物の構造を同定するためのシステムであって、
     分析対象の化合物の質量分析結果から、分析対象の化合物のフラグメントイオンの測定された質量電荷比(m/z)と衝突断面積(CCS)とを組み合わせたスペクトルデータを生成するスペクトルデータ生成手段と、
     標準物質のフラグメントイオンの構造と同フラグメントイオンの質量電荷比および衝突断面積とを組み合わせたリファレンススペクトルデータを含むリファレンススペクトルデータベースと、
     フラグメントイオンの構造と理論的に計算されたCCSを含む理論スペクトルデータベースと、
     スペクトルデータを、リファレンススペクトルデータベースおよび理論スペクトルデータベース内のデータとマッチさせるマッチング手段と、
     リファレンススペクトルデータベースおよび理論スペクトルデータベース内の構造情報から候補構造を生成する手段と、
     マッチング手段による結果を出力する出力手段とを含み、
     スペクトルデータ生成手段および出力手段が、システム外の通信回線網を介して、リファレンススペクトルデータベース、理論スペクトルデータベース、候補情報生成手段およびマッチング手段と接続されている、
     システム。
PCT/JP2019/023780 2018-06-15 2019-06-14 化合物の構造を同定するための方法およびシステム WO2019240289A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2020525704A JPWO2019240289A1 (ja) 2018-06-15 2019-06-14 化合物の構造を同定するための方法およびシステム
US17/251,523 US11573201B2 (en) 2018-06-15 2019-06-14 Method and system for identifying structure of compound
US18/165,013 US20230251224A1 (en) 2018-06-15 2023-02-06 Method and system for identifying structure of compound

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2018-114216 2018-06-15
JP2018114216 2018-06-15

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US17/251,523 A-371-Of-International US11573201B2 (en) 2018-06-15 2019-06-14 Method and system for identifying structure of compound
US18/165,013 Continuation-In-Part US20230251224A1 (en) 2018-06-15 2023-02-06 Method and system for identifying structure of compound

Publications (1)

Publication Number Publication Date
WO2019240289A1 true WO2019240289A1 (ja) 2019-12-19

Family

ID=68842232

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/023780 WO2019240289A1 (ja) 2018-06-15 2019-06-14 化合物の構造を同定するための方法およびシステム

Country Status (3)

Country Link
US (1) US11573201B2 (ja)
JP (1) JPWO2019240289A1 (ja)
WO (1) WO2019240289A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021063752A (ja) * 2019-10-16 2021-04-22 株式会社島津製作所 質量分析で得られたデータの解析装置、質量分析装置、質量分析で得られたデータの解析方法および解析プログラム
GB2593286A (en) * 2020-01-29 2021-09-22 Waters Technologies Ireland Ltd Techniques for sample analysis using product ion collision-cross section information
WO2022070274A1 (ja) * 2020-09-29 2022-04-07 株式会社島津製作所 分析データの処理装置、分析装置、分析データの処理方法および解析プログラム
WO2023204029A1 (ja) * 2022-04-21 2023-10-26 パナソニックIpマネジメント株式会社 情報処理方法、情報処理システム、及びプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220101276A1 (en) * 2020-09-30 2022-03-31 X Development Llc Techniques for predicting the spectra of materials using molecular metadata
WO2023164518A2 (en) * 2022-02-23 2023-08-31 Enveda Therapeutics, Inc. Predicting chemical structure and properties based on mass spectra

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150160231A1 (en) * 2013-12-06 2015-06-11 Premier Biosoft Identification of metabolites from tandem mass spectrometry data using databases of precursor and product ion data
WO2017036545A1 (en) * 2015-09-03 2017-03-09 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Method for determining carbohydrates structure
US20180088094A1 (en) * 2016-09-27 2018-03-29 Waters Technologies Corporation Multiple attribute monitoring methodologies for complex samples

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6831337B2 (ja) 2015-05-29 2021-02-17 ウオーターズ・テクノロジーズ・コーポレイシヨン 質量スペクトルデータを処理する技術

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150160231A1 (en) * 2013-12-06 2015-06-11 Premier Biosoft Identification of metabolites from tandem mass spectrometry data using databases of precursor and product ion data
WO2017036545A1 (en) * 2015-09-03 2017-03-09 MAX-PLANCK-Gesellschaft zur Förderung der Wissenschaften e.V. Method for determining carbohydrates structure
US20180088094A1 (en) * 2016-09-27 2018-03-29 Waters Technologies Corporation Multiple attribute monitoring methodologies for complex samples

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
PAGLIA, GIUSEPPE ET AL.: "Ion Mobility Derived Collision Cross Sections to Support Metabolomics Applications", ANALYTICAL CHEMISTRY, vol. 86, 2014, pages 3985 - 3993, XP055216209, DOI: 10.1021/ac500405x *
PEIRONCELY, JULIO E: "OMG: Open Molecule Generator", JOURNAL OF CHEMINFORMATICS, vol. 4, no. 21, 2012, pages 1 - 13, XP021138027 *
TSUGAWA, HIROSHI ET AL.: "The Guide for Metabolite Annotation/Identification in Untargeted Metabolomics", J.MASS SPECTROM. SOC. JPN., 2017, pages 203 - 209 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021063752A (ja) * 2019-10-16 2021-04-22 株式会社島津製作所 質量分析で得られたデータの解析装置、質量分析装置、質量分析で得られたデータの解析方法および解析プログラム
GB2593286A (en) * 2020-01-29 2021-09-22 Waters Technologies Ireland Ltd Techniques for sample analysis using product ion collision-cross section information
GB2593286B (en) * 2020-01-29 2022-11-02 Waters Technologies Ireland Ltd Techniques for sample analysis using product ion collision-cross section information
WO2022070274A1 (ja) * 2020-09-29 2022-04-07 株式会社島津製作所 分析データの処理装置、分析装置、分析データの処理方法および解析プログラム
WO2023204029A1 (ja) * 2022-04-21 2023-10-26 パナソニックIpマネジメント株式会社 情報処理方法、情報処理システム、及びプログラム

Also Published As

Publication number Publication date
US11573201B2 (en) 2023-02-07
JPWO2019240289A1 (ja) 2021-07-15
US20210247360A1 (en) 2021-08-12

Similar Documents

Publication Publication Date Title
WO2019240289A1 (ja) 化合物の構造を同定するための方法およびシステム
Bonner et al. SWATH data independent acquisition mass spectrometry for metabolomics
Sadygov et al. Large-scale database searching using tandem mass spectra: looking up the answer in the back of the book
JP2022066231A (ja) 生成イオンスペクトルのデータ独立取得および参照スペクトルライブラリ照合
Kenar et al. Automated label-free quantification of metabolites from liquid chromatography–mass spectrometry data
JP5590156B2 (ja) 質量分析方法及び装置
CA2523975C (en) Computational method and system for mass spectral analysis
Wang et al. Mass spectrometry-based protein identification by integrating de novo sequencing with database searching
Lu et al. A suffix tree approach to the interpretation of tandem mass spectra: applications to peptides of non-specific digestion and post-translational modifications
CA2564279A1 (en) Mass spectrometer
EP3544016A2 (en) Methods for combining predicted and observed mass spectral fragmentation data
Godzien et al. Metabolite annotation and identification
US20230251224A1 (en) Method and system for identifying structure of compound
JP2005083952A (ja) 液体クロマトグラフ質量分析装置
Yates III Mass spectrometry as an emerging tool for systems biology
JP2021536567A (ja) 複合試料内の関連化合物の同定およびスコア化
EP4078600B1 (en) Method and system for the identification of compounds in complex biological or environmental samples
GB2572319A (en) Methods and systems for analysis
Ramachandran et al. A frequency-based approach to predict the low-energy collision-induced dissociation fragmentation spectra
You et al. Unsupervised Reconstruction of Analyte-Specific Mass Spectra Based on Time-Domain Morphology with a Modified Cross-Correlation Approach
Yerlekar et al. A review on mass spectrometry: Technique and tools
Miller et al. Artificial neural network for charge prediction in metabolite identification by mass spectrometry
JP4855780B2 (ja) 質量分析を用いたペプチド同定方法及び同定装置
Wang et al. GPA: An algorithm for LC/MS based glycan profile annotation
JP2018119897A (ja) 質量分析を用いた物質同定方法及び質量分析データ処理装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19819655

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020525704

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19819655

Country of ref document: EP

Kind code of ref document: A1