WO2024004033A1 - サーバ、apiおよびコンピュータプログラム - Google Patents

サーバ、apiおよびコンピュータプログラム Download PDF

Info

Publication number
WO2024004033A1
WO2024004033A1 PCT/JP2022/025763 JP2022025763W WO2024004033A1 WO 2024004033 A1 WO2024004033 A1 WO 2024004033A1 JP 2022025763 W JP2022025763 W JP 2022025763W WO 2024004033 A1 WO2024004033 A1 WO 2024004033A1
Authority
WO
WIPO (PCT)
Prior art keywords
sugar chain
data
input data
api
chain structure
Prior art date
Application number
PCT/JP2022/025763
Other languages
English (en)
French (fr)
Inventor
崚 星野
佑太 大泉
俊治 長束
正幸 高橋
裕史 矢野
Original Assignee
株式会社メビウス
国立大学法人新潟大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社メビウス, 国立大学法人新潟大学 filed Critical 株式会社メビウス
Priority to PCT/JP2022/025763 priority Critical patent/WO2024004033A1/ja
Priority to JP2022540627A priority patent/JP7394362B1/ja
Publication of WO2024004033A1 publication Critical patent/WO2024004033A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Definitions

  • the present invention relates to a server, an API, and a computer program that output sugar chain structures narrowed down from input data.
  • Patent Document 1 a method has been proposed in which positively charged ions are added to sugar chains and mass spectrometry is performed using a time-of-flight mass spectrometer to analyze the structure of sugar chains in glycoproteins and the like (for example, Patent Document 1).
  • Patent Document 1 can determine the sugar chain sequence, it is not possible to automatically determine the branched structure in the sugar chain, and there are also problems with the means for obtaining narrowed down sugar chain structures. was there.
  • the present invention has been made in view of these circumstances, and provides a server, an API, and a computer program that can output narrowed-down sugar chain structures simply by inputting input data.
  • the present invention provides a server equipped with an application programming interface (API) for narrowing down sugar chain structures from input data, wherein the API includes an input data acquisition step for acquiring the input data, and an input data acquisition step for acquiring the input data;
  • API application programming interface
  • a server is provided that is configured to execute a sugar chain structure narrowing down step of narrowing down the sugar chain structures from data and an outputting step of outputting the narrowed down sugar chain structures.
  • the input data may be an LC analysis result, an MS analysis result, and/or an MS/MS analysis result.
  • the API further executes an input information processing step of processing the input data after the input data acquisition step, and in the input information processing step, a glucose unit value (GU value) and/or Alternatively, the reverse phase scale value may be calculated, the mass may be calculated from the MS analysis result, and the fragment mass and the peak intensity ratio of the MS/MS spectrum may be calculated from the MS/MS analysis result.
  • a glucose unit value (GU value) and/or Alternatively, the reverse phase scale value may be calculated, the mass may be calculated from the MS analysis result, and the fragment mass and the peak intensity ratio of the MS/MS spectrum may be calculated from the MS/MS analysis result.
  • the server compares the processed data processed in the input information processing step with master data that is a database of the processed data and sugar chain structures corresponding to the processed data.
  • the sugar chain structures may be narrowed down based on the processed data.
  • the server compares the processed data processed in the input information processing step with the master data, and if there is no sugar chain structure that matches the master data, the machine learning model It is also possible to narrow down the sugar chain structures by
  • the present invention also provides an application programming interface (API) for narrowing down the sugar chain structures from input data, wherein the API includes an input data acquisition step for acquiring the input data, and a sugar chain structure for narrowing down the sugar chain structures from the input data.
  • API application programming interface
  • An API configured to execute a chain structure narrowing down step and an output step of outputting the narrowed down sugar chain structure is provided.
  • the input data may be an LC analysis result, an MS analysis result, and/or an MS/MS analysis result.
  • the API further executes an input information processing step of processing the input data after the input data acquisition step, and in the input information processing step, glucose unit values (GU values) and/or Alternatively, the reverse phase scale value may be calculated, the mass may be calculated from the MS analysis result, and the fragment mass and the peak intensity ratio of the MS/MS spectrum may be calculated from the MS/MS analysis result.
  • glucose unit values GUI values
  • the reverse phase scale value may be calculated, the mass may be calculated from the MS analysis result, and the fragment mass and the peak intensity ratio of the MS/MS spectrum may be calculated from the MS/MS analysis result.
  • the processed data processed in the input information processing step is compared with the master data, which is a database of the processed data and sugar chain structures corresponding to the processed data. In this way, sugar chain structures may be narrowed down from the processed data.
  • the processed data processed in the input information processing step is compared with master data, and if there is no sugar chain structure that matches the master data, a machine learning model is used. It is also possible to narrow down the sugar chain structures.
  • the present invention also provides a computer program that causes a computer to execute the API.
  • FIG. 1 is a block diagram showing an overall configuration including a server according to a preferred embodiment of the present invention.
  • FIG. 2 is a block diagram showing the configuration of an API according to a preferred embodiment of the present invention.
  • FIG. 3 is a diagram showing an example of the configuration of master data according to a preferred embodiment of the present invention. It is a graph diagram showing an example of HPLC analysis results. It is a graph diagram showing an example of MS analysis results. It is a graph diagram showing an example of MS/MS analysis results.
  • FIG. 2 is an explanatory diagram showing a schematic configuration of a neural network in a neural network model. 2 is a flowchart showing the flow of API execution by a server according to a preferred embodiment of the present invention.
  • FIG. 1 is a block diagram showing the overall configuration of a system including a server 1 according to a preferred embodiment of the present invention.
  • the server 1 is a server equipped with an API 4 that narrows down sugar chain structures from input data.
  • an input information processing step a sugar chain structure narrowing step in which the sugar chain structure narrowing section 43 narrows down the sugar chain structures from the input data
  • an output step in which the output section 44 outputs the narrowed down sugar chain structures. configured to run. If the input data is processed before input to the API 4, the input information processing step can be omitted.
  • a computer program is installed to cause the computer 11 to function as the server 1 of this embodiment.
  • the server 1 is realized, for example, by installing a computer program (software) 14 in a storage unit 13 consisting of an HDD (hard disk drive) in a computer 11 having a CPU (central processing unit) 12, for example.
  • the functions of the server 1 are realized by the cooperation of the hardware resources of the computer 11 and the software of the computer program 14.
  • the computer program 14 not only controls communications, etc., but also causes the computer to execute an API 4 that executes the process of narrowing down sugar chain structures.
  • the storage unit 13 stores the refined sugar chain structure 21, master data 22 and a machine learning model 23, which will be described later.
  • the source code of the computer program 14 may be recorded on a recording medium (not shown) readable by the computer 11. Thereby, it is possible to provide a portable recording medium on which a computer program for executing the API 4 of this embodiment is recorded.
  • the recording medium include magnetic tapes, magnetic disks such as FDs and HDDs, optical disks such as CD-ROMs, MOs, and DVDs, and recording media using semiconductor memories such as USB memories.
  • the CPU 12 executes various calculation processes based on the computer program 14.
  • the computer program 14 may be loaded into the storage unit 13 from the above-mentioned portable recording medium, or may be loaded into the storage unit 13 from a computer network such as a communication network 3 such as a LAN (Local Area Network) or the Internet.
  • the CPU 12 and the storage section 13 are interconnected by a bus 15, for example.
  • a communication interface 16 and a buffer section 17 are further connected to the bus 15.
  • the communication interface 16 is an interface for communicating with the terminal device 2 by connecting to the communication network 3 such as the Internet by wire or wirelessly.
  • the buffer unit 17 is formed of, for example, a RAM, and temporarily stores data necessary for the calculation processing of the computer program 14.
  • the buffer unit 17 stores input data received from the terminal device 2 and processed data obtained by processing the input information, and these input data and processed data are used for arithmetic processing by the computer program 14. Note that the input data and processing data may be stored in the storage unit 13.
  • the terminal device 2 is, for example, a desktop PC, a notebook PC, a tablet, a smartphone, etc., and particularly if it is capable of communicating with the server 1 via a communication network 3 such as the Internet and can call the API 4. Not limited.
  • the user accesses the server 1 using the terminal device 2, calls the API 4, inputs input data, and obtains an output of sugar chain structures narrowed down by the API 4.
  • Input data can be input using, for example, an input device (not shown) such as a keyboard, mouse, or touch panel.
  • the narrowed down sugar chain structure output can be displayed on a display device (not shown) such as a display, for example.
  • Mass spectrometry includes two methods: ionizing a sample and analyzing it directly (MS), and mass-selecting a specific sample ion (parent ion) and dissociating it to generate dissociated ions. There is tandem mass spectrometry (MS/MS).
  • MS/MS tandem mass spectrometry
  • a mass spectrometer is a device that adds charges to sample molecules to ionize them, separates the generated ions into mass-to-charge ratios using an electric or magnetic field, and measures the amount as a current value with a detector.
  • LC/MS Liquid chromatography/mass spectrometry
  • LC liquid chromatograph
  • HPLC high performance liquid chromatograph
  • MS/MS molecular ions are taken into a mass spectrometer, molecular ions with a specific mass-to-charge ratio are selected, and some of the bonds in the molecular ions are destroyed by causing collisions between the selected molecular ions and neutral molecules. and measure the ions with broken bonds.
  • Collision induced dissociation CID is one of the methods of breaking bonds between molecular ions by colliding with neutral molecules. It is called MS 2 , MS 3 , etc. depending on the number of repetitions of a series of operations of ion selection and collision-induced dissociation.
  • Bonds between atoms in a molecule have different bond energies depending on their structure and type of bond, so locations with lower bond energy tend to be more easily broken by collision-induced dissociation.
  • a molecular ion collides with a neutral molecule, by imparting sufficient kinetic energy to the molecular ion to break bonds, unique fragment ions are preferentially generated, allowing the structure of the molecular ion to be determined.
  • ions are selectively cleaved, noise in the mass-to-charge ratio region of ions after cleavage is small, and the signal intensity to noise ratio (S/N ratio) is improved.
  • MS/MS mass separation is performed after ion selection and collision-induced dissociation are performed one or more times.
  • MS spectrum obtained by the above MS differs depending on the mass of the sample to be measured, and information on the components and amounts of the sample can be obtained from the MS spectrum.
  • MS/MS spectral patterns obtained by MS/MS often differ depending on the branching structure and binding mode of sugar chains.
  • the master data 22 is a database of sugar chain structures that is referred to when narrowing down sugar chain structures or used as training data for machine learning to narrow down sugar chain structures.
  • FIG. 3 shows an example of the configuration of the master data 22.
  • the master data 22 includes at least a mass value, a glucose unit value (GU value) and/or a reverse phase scale value, composition information, and structure information.
  • the composition information includes information on the types of sugars and substituents and the number of sugars and substituents.
  • the structural information includes information on the type of sugar and substituents and the number of sugars and substituents, as well as information on sugar isomers, bonding modes, and branched structures.
  • Glycan structural data consists of composition information and structural information.
  • FIG. 4 is a graph diagram showing an example of the HPLC analysis results. Multiple peaks can be seen depending on the elution time.
  • FIG. 5 is a graph diagram showing an example of the MS analysis results.
  • the GU value is obtained by standardizing the elution time in LC using the glucose unit method, and is a value obtained by comparing the detection time of each peak with the detection time of glucose oligomer. Since the GU value is a unique value depending on the sugar chain structure, the sugar chain structure can be estimated by comparing it with a database. Although the coefficients of the quantitative calculation formula for calculating the GU value vary slightly from measurement to measurement, the quantitative calculation formula is a function of the elution time. In this way, the GU value can be calculated from the LC analysis results.
  • the reversed phase scale value is the standardization of the elution time in LC using the reversed phase scale method, and like the GU value, it is a unique value depending on the sugar chain structure. Since the negative phase scale value has less fluctuation than the GU value, the accuracy of structure identification is high.
  • the sugar chain structure is determined by comparing the calculated mass, GU value, and/or reversed phase scale value with a database. Therefore, when constructing a learning model to narrow down glycan structures, it is recommended to use mass values, GU values and/or reversed phase scale values as input data, and glycan structure data as output data as training data. Can be done.
  • Master data 22 may further include fragment masses.
  • the fragment mass is calculated from the sugar chain structure that is the origin of the fragment and the mass-to-charge ratio based on the MS/MS analysis results (see FIG. 6). For example, when the fragment mass is large, sugar chain structures with large masses are more likely to be selected as candidates.
  • the master data 22 may further include the peak intensity ratio of the MS/MS spectrum.
  • the peak intensity ratio is used to quantify the tendency of peaks and determine the ranking of peaks, and is calculated by dividing the peak intensity by the sum of the peak intensities of all peaks for each peak in the MS/MS spectrum. be done. That is, the peak intensity ratio is calculated from the MS/MS analysis results. Since the peak order information depends on the priority when the sugar chain structure is fragmented, the original sugar chain structure can be estimated from this information. When a certain bond within a sugar chain structure is weak, that bond is preferentially broken and fragmentation is likely to occur, so the peak intensity of that fragment increases and the corresponding peak ranks higher. This relationship paradoxically infers the binding position of the sugar chain structure. For example, the branched structure of the sugar chain structure can be estimated to some extent based on information such as a small peak intensity ratio (high peak intensity).
  • the input data includes fragment mass values, peak intensity ratios, and glycan structure data narrowed down using a machine learning model.
  • sugar chain structure data can be used as output data.
  • the sugar chain structure narrowing down section 43 uses the LC analysis results, the MS analysis results, and/or the MS/MS analysis results as input data, so that the input information processing section 42 can By processing the input information and comparing the processed data with the master data 22, it is possible to narrow down the sugar chain structures.
  • the processed data is the GU value and/or the reversed phase scale value calculated from the LC analysis result, and/or the mass calculated from the MS analysis result, and/or the fragment calculated from the MS/MS analysis result. Mass and peak intensity ratio.
  • the user can obtain an output of narrowed down sugar chain structures simply by inputting the LC analysis results, the MS analysis results, and/or the MS/MS analysis results.
  • the user may input the above processing data.
  • the input data is the GU value and/or the negative phase scale value calculated from the LC analysis result, the mass calculated from the MS analysis result, and/or the mass calculated from the MS/MS analysis result. Fragment mass and peak intensity ratio.
  • the processed data processed in the input information processing step is compared with the master data 22, and if there is no sugar chain structure that matches the master data 22, the sugar chain structure narrowing section 43
  • the sugar chain structures may be narrowed down using the learning model 23.
  • the machine learning model 23 will be explained below.
  • the machine learning model 23 includes two learning models: a first learning model and a second learning model.
  • the first learning model is a machine learning model for narrowing down the sugar chain structures to, for example, several dozen structures.
  • input data are mass values, GU values, and/or antiphase scale values.
  • the mass value as input data of the teacher data, the GU value and/or the reversed phase scale value Learn the correlation between the training data and the sugar chain structure data as output data.
  • the sugar chain structure data as the output data of the teaching data for constructing the first learning model is obtained by comparing the input data with the master data 22, which is a database of input data and sugar chain structures corresponding to the input data. , it is preferable to use a sugar chain structure narrowed down from input data.
  • the input data here are the mass value, the GU value, and/or the negative phase scale value.
  • the second learning model is a machine learning model for further narrowing down to about 1 to 5 sugar chain structures from among the multiple sugar chain structures narrowed down using the first learning model.
  • the input data is the fragment mass value, the peak intensity ratio of the MS/MS spectrum, and the sugar chain structure narrowed down by the first learning model.
  • the sugar chain structure can be estimated from the fragment mass value and the peak intensity ratio of the MS/MS spectrum. The peak intensity ratio and the correlation between the sugar chain structures narrowed down by the first learning model and the sugar chain structure data 5 as output data of the teacher data are learned.
  • the sugar chain structure data as the output data of the teaching data for constructing the second learning model is obtained by comparing the input data with the master data 22, which is a database of input data and sugar chain structures corresponding to the input data. , it is preferable to use a sugar chain structure narrowed down from input data.
  • the input data here are the fragment mass value, the peak intensity ratio of the MS/MS spectrum, and the sugar chain structure narrowed down by the first learning model.
  • Machine learning performs supervised learning using input data and sugar chain structure data corresponding to the input data as output data.
  • Supervised learning can be performed by well-known machine learning in addition to machine learning using a neural network model, for example.
  • machine learning using a neural network model will be described with reference to FIG.
  • the neural network in the neural network model shown in FIG. 7 consists of n neurons (X 00 to X 0n ) in the input layer and n ⁇ n neurons (Y 00 to Y nn ) in the first to n-th intermediate layers. , and n neurons (Z 00 to Z 0n ) in the output layer.
  • the first to nth intermediate layers are also called hidden layers, and the neural network may have only the first intermediate layer as a hidden layer.
  • there are a plurality of output layers but if the sugar chain structure as output data is uniquely determined, there may be only one output layer.
  • input data is associated with neurons in the input layer
  • values of neurons in the output layer are calculated using a general neural network output value calculation method.
  • it is calculated as the sum of a sequence of multiplication values of the value of the input side neuron connected to the neuron and the weight associated with the node connecting the output side neuron and the input side neuron.
  • the value of the neuron on the output side is calculated by using the method applied to all neurons other than those in the input layer.
  • n neurons X 01 to X 0n in the input layer and the calculated values of n neurons Z 01 to Z 0n in the output layer that is, in this embodiment, the sugar chains of input data and teacher data
  • Each piece of structural data is compared to determine an error, and the weight associated with each node is adjusted (backprovacation) so that the determined error is reduced.
  • a predetermined condition such as repeating the above series of steps a predetermined number of times or the error is smaller than a tolerance value
  • learning is completed and the neural network, i.e., the node Let all the weights associated with each of them be a learning model.
  • FIG. 8 is a flowchart showing the flow of execution of the API 4 by the server 1 according to the preferred embodiment of the present invention.
  • step S11 the user operates the terminal device 2, and the API 4 is called.
  • step S12 the input data acquisition unit 41 acquires input data (input data acquisition step).
  • the input data here is the LC analysis result, the MS analysis result, and/or the MS/MS analysis result.
  • the input information processing unit 42 processes the input data and creates processed data (input information processing step).
  • the processed data here is the GU value and/or the reversed phase scale value calculated from the LC analysis result, the mass calculated from the MS analysis result, and/or the mass calculated from the MS/MS analysis result. Fragment mass and peak intensity ratio.
  • step S13 can be omitted.
  • the input data is the GU value and/or the negative phase scale value calculated from the LC analysis result, and/or the mass calculated from the MS analysis result, and/or the mass calculated from the MS/MS analysis result. Fragment mass and peak intensity ratio.
  • step S14 the sugar chain structure narrowing down section 43 narrows down the sugar chain structures based on the processed data (sugar chain structure narrowing down step).
  • the sugar chain structure narrowing down unit 43 first compares the processed data with the master data 22, which is a database of processed data and sugar chain structures corresponding to the processed data, and determines whether there is a sugar chain structure that matches the conditions. . If there is a sugar chain structure that matches the conditions, the output unit 44 outputs the narrowing-down results in step S15 (output step).
  • the sugar chain structure narrowing down section 43 may narrow down the sugar chain structures using the machine learning model 23.
  • the output unit 44 outputs the sugar chain structure obtained by the machine learning model 23 in step S15 (output step).
  • step S16 the terminal device 2 acquires the sugar chain structure data narrowed down by the API 4 from the server 1.
  • the user can obtain the output of narrowed down sugar chain structures simply by executing the API 4 on the terminal device 2 and inputting the input data.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Food Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Electrochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Databases & Information Systems (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Stored Programmes (AREA)

Abstract

入力データを入力するだけで絞り込まれた糖鎖構造の出力を得られるサーバ、APIおよびコンピュータプログラムを提供する。サーバ1は、入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)を備えたサーバであって、APIが、入力データ取得部により入力データを取得する入力データ取得ステップと、糖鎖構造絞込部により入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、出力部により絞り込んだ糖鎖構造を出力する出力ステップと、を実行するように構成される。

Description

サーバ、APIおよびコンピュータプログラム
 本発明は、入力データから絞り込んだ糖鎖構造を出力するサーバ、APIおよびコンピュータプログラムに関する。
 従来、糖鎖にプラスチャージイオンを付加して飛行時間型質量分析装置による質量分析を行い、糖タンパク質等における糖鎖構造を解析する方法が提案されている(例えば、特許文献1)。
特開2005-300420号公報
 しかしながら、特許文献1の解析方法では、糖鎖シーケンスを求めることはできるが、糖鎖における分岐構造を自動的に決定することができず、また、絞り込まれた糖鎖構造を得る手段についても課題があった。
 本発明は、このような事情に鑑みてなされたものであり、入力データを入力するだけで絞り込まれた糖鎖構造の出力を得られるサーバ、APIおよびコンピュータプログラムを提供する。
 本発明はかかる課題を解決するため、入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)を備えたサーバであって、前記APIが、前記入力データを取得する入力データ取得ステップと、前記入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、絞り込んだ前記糖鎖構造を出力する出力ステップと、を実行するように構成される、サーバを提供する。
 前記サーバでは、前記入力データが、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果である、としてもよい。
 前記サーバでは、前記APIが前記入力データ取得ステップの後に前記入力データを処理する入力情報処理ステップをさらに実行し、前記入力情報処理ステップにおいて、前記LC解析結果からグルコースユニット値(GU値)および/または逆相スケール値を算出し、前記MS解析結果から質量を算出し、前記MS/MS解析結果から断片質量およびMS/MSスペクトルのピーク強度比を算出する、としてもよい。
 前記サーバでは、前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データを、前記処理データと前記処理データに対応する糖鎖構造とのデータベースであるマスタデータと照合することにより、前記処理データから糖鎖構造の絞込を行う、としてもよい。
 前記サーバでは、前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データと前記マスタデータとを照合し、前記マスタデータに一致する糖鎖構造がない場合に、機械学習モデルによる糖鎖構造の絞込を行う、としてもよい。
 また本発明は、入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)であって、前記APIが、前記入力データを取得する入力データ取得ステップと、前記入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、絞り込んだ前記糖鎖構造を出力する出力ステップと、を実行するように構成される、APIを提供する。
 前記APIでは、前記入力データが、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果である、としてもよい。
 前記APIでは、前記APIが前記入力データ取得ステップの後に前記入力データを処理する入力情報処理ステップをさらに実行し、前記入力情報処理ステップにおいて、前記LC解析結果からグルコースユニット値(GU値)および/または逆相スケール値を算出し、前記MS解析結果から質量を算出し、前記MS/MS解析結果から断片質量およびMS/MSスペクトルのピーク強度比を算出する、としてもよい。
 前記APIでは、前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データを、前記処理データと前記処理データに対応する糖鎖構造とのデータベースである前記マスタデータと照合することにより、前記処理データから糖鎖構造の絞込を行う、としてもよい。
 前記APIでは、前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データとマスタデータとを照合し、前記マスタデータに一致する糖鎖構造がない場合に、機械学習モデルによる糖鎖構造の絞込を行う、としてもよい。
 また本発明は、コンピュータに、前記APIを実行させるコンピュータプログラムを提供する。
 本発明のサーバ、APIおよびコンピュータプログラムによれば、入力データを入力するだけで、絞り込まれた糖鎖構造の出力を得ることができる。
本発明の好適な実施形態に係るサーバを含む全体構成を示すブロック図である。 本発明の好適な実施形態に係るAPIの構成を示すブロック図である。 本発明の好適な実施形態に係るマスタデータの構成の一例を示す図である。 HPLC解析結果の一例を示すグラフ図である。 MS解析結果の一例を示すグラフ図である。 MS/MS解析結果の一例を示すグラフ図である。 ニューラルネットワークモデルにおけるニューラルネットワークの概略構成を示す説明図である。 本発明の好適な実施形態に係るサーバによるAPIの実行の流れを示すフローチャートである。
 以下、図面を参照して、本発明のサーバ、APIおよびコンピュータプログラムの好適な実施形態について説明する。ただし、本発明は、以下の記載に限定されるものではなく、特許請求の範囲に記載され、または、発明を実施するための形態に開示された発明の要旨に基づき、当業者において様々な変形や変更が可能である。そのような変形や変更もまた、本発明の範囲に含まれる。
<全体構成>
(サーバ)
 図1は、本発明の好適な実施形態に係るサーバ1を含むシステムの全体構成を示すブロック図である。まず、サーバ1の構成について、図2のアプリケーションプログラミングインターフェース(API)4の構成と併せて説明する。サーバ1は、入力データから糖鎖構造を絞り込むAPI4を備えたサーバであって、API4が、入力データ取得部41により入力データを取得する入力データ取得ステップと、入力情報処理部42により入力データを処理する入力情報処理ステップと、糖鎖構造絞込部43により入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、出力部44により絞り込んだ糖鎖構造を出力する出力ステップと、を実行するように構成される。API4への入力の前に入力データを処理する場合、入力情報処理ステップは省略することができる。
 サーバ1では、コンピュータプログラムをインストールして、コンピュータ11を本実施形態のサーバ1として機能させる。当該サーバ1は、例えばCPU(中央演算装置)12を有するコンピュータ11において、例えばHDD(ハードディスク駆動装置)からなる記憶部13に、コンピュータプログラム(ソフトウェア)14をインストールすることによって実現される。サーバ1の機能は、コンピュータ11のハードウェア資源とコンピュータプログラム14のソフトウェアとが協働して実現される。コンピュータプログラム14は、通信等の制御を行う他、糖鎖構造を絞り込む工程を実行するAPI4をコンピュータに実行させる。記憶部13は、絞り込まれた糖鎖構造21、後述するマスタデータ22および機械学習モデル23を保存する。
 コンピュータプログラム14のソースコードを、コンピュータ11で読み取り可能な記録媒体(図示せず)に記録する構成とすることもできる。これにより、本実施形態のAPI4を実行するためのコンピュータプログラムを記録した、持ち運び自在な記録媒体を提供することができる。記録媒体としては、例えば、磁気テープ、または、FDやHDD等の磁気ディスク、CD-ROMやMO、DVD等の光ディスク、USBメモリ等の半導体メモリを用いた記録媒体等が挙げられる。
 CPU12は、コンピュータプログラム14に基づき様々な演算処理を実行する。コンピュータプログラム14は、上記の可搬性の記録媒体から記憶部13に取り込まれてもよく、LAN(Local Area Network)やインターネット等の通信網3といったコンピュータネットワークから記憶部13に取り込まれてもよい。CPU12と記憶部13とは例えばバス15で相互に接続される。バス15には、さらに通信インターフェース16およびバッファ部17が接続される。
 通信インターフェース16は、有線または無線でインターネット等の通信網3と接続して端末装置2と通信を行うためのインターフェースである。
 バッファ部17は、例えばRAMにより構成され、コンピュータプログラム14の演算処理に必要なデータを一時的に格納する。例えば、バッファ部17には、端末装置2から受信した入力データや、入力情報処理を行った処理データを格納し、これらの入力データや処理データは、コンピュータプログラム14による演算処理に使用される。なお、入力データや処理データは、記憶部13に保存するようにしてもよい。
(端末装置)
 端末装置2は、例えば、デスクトップPCや、ノートPC、タブレット、スマートフォン等であり、インターネット等の通信網3を介してサーバ1と通信可能であってAPI4を呼び出すことができるものであれば、特に限定されない。ユーザは、端末装置2を使用してサーバ1にアクセスし、API4を呼び出して入力データを入力し、API4により絞り込まれた糖鎖構造の出力を得る。入力データの入力は、例えばキーボードやマウス、タッチパネル等の入力装置(図示せず)を用いて行うことができる。絞り込まれた糖鎖構造の出力は、例えばディスプレイ等の表示装置(図示せず)に表示させることができる。
<質量分析>
 質量分析法(Mass Spectrometry)には、試料をイオン化してそのまま分析する方法(MS)と、さらに特定の試料イオン(親イオン)を質量選択し、それを解離させて生成した解離イオンを質量分析するタンデム質量分析法(MS/MS)とがある。質量分析装置は、試料分子に電荷を付加してイオン化を行い、生成したイオンを電場または磁場により質量電荷比に分離し、その量を検出器にて電流値として計測する機器である。質量分析装置の前に液体クロマトグラフ(LC:Liquid Chromatograph)部を連結した液体クロマトグラフィー/質量分析法(LC/MS)は、混合物をLCで分離しながら、MSにより質量を測定する方法である。LC部には高速液体クロマトグラフ(HPLC:High Performance Liquid Chromatograph)が使用される。特定のイオンを選別して、開裂後さらに断片イオンの質量を測定するMS/MSや、その過程を繰り返す多段階MS(MS)を行うと、さらに構造情報が得られる。
 MS/MSでは、分子イオンを質量分析装置に取り込み、特定質量電荷比の分子イオンを選択し、選択した分子イオンと中性分子との衝突を起こすことにより、分子イオンの一部の結合を破壊し、結合の切れたイオンを測定する。この中性分子と衝突させ分子イオンの結合を切る方法の一つに衝突誘起解離(CID:Collision Induced Dissociation)がある。イオン選択、衝突誘起解離の一連の操作の繰返し回数によってMSやMS等と呼ぶ。分子中の原子間の結合はその構造や結合の種類によって結合エネルギーが異なるため、結合エネルギーが低い箇所ほど衝突誘起解離によって切断されやすい傾向にある。分子イオンと中性分子との衝突時に、結合を切断するのに十分な運動エネルギーを分子イオンに与えることにより、特有のフラグメントイオンが優先して生成し、分子イオンの構造を知ることができる。さらに、イオンを選択して開裂することから、開裂後のイオンの質量電荷比領域におけるノイズが小さく、信号強度とノイズの比(S/N比)が向上する。MS/MSでは、イオン選択および衝突誘起解離を1回以上行った後、質量分離を行う。
 上記のMSで得られるMSスペクトルは、測定する試料の質量によって異なり、そのMSスペクトルから試料の成分や量の情報を得ることができる。MS/MSで得られるMS/MSスペクトルパターンは、糖鎖の分岐構造や結合様式により異なる場合が多い。
<マスタデータ>
 マスタデータ22は、糖鎖構造を絞り込む際に参照したり、糖鎖構造を絞り込むための機械学習の教師データに使用したりする糖鎖構造のデータベースである。図3にマスタデータ22の構成の一例を示す。マスタデータ22は、少なくとも質量の値と、グルコースユニット値(GU値)および/または逆相スケール値と、組成情報と、構造情報とを含む。組成情報は、糖と置換基の種類および糖と置換基の数の情報を含むものである。構造情報は、糖と置換基の種類および糖と置換基の数の情報に、糖のアイソマー情報と、結合様式と、分岐構造の情報を加えたものである。糖鎖構造データは、組成情報および構造情報で構成される。
 図4は、HPLC解析結果の一例を示すグラフ図である。溶出時間に対して、複数のピークが見られる。図5は、MS解析結果の一例を示すグラフ図である。
(質量)
 図5のMSスペクトルの大きいピーク中、最も左に位置するモノアイソトピック・ピークの質量電荷比を確認する。当該モノアイソトピック・ピークと、当該ピークに近接する同位体ピークとの差分から、イオン価数を算出する。質量電荷比と価数を掛け合わせた値から、付加イオンの質量を差し引くことで、質量が算出される。このように、MS解析結果から、質量を算出することができる。
(GU値および逆相スケール値)
 GU値は、グルコースユニット法によりLCにおける溶出時間の標準化行ったものであって、各ピークの検出時間とグルコースオリゴマーの検出時間とを比較することで得られる値である。GU値は、糖鎖構造によって固有の値であるため、データベースと照合することで糖鎖構造を推定することができる。GU値を算出する定量計算式の係数は測定ごとに若干変動するが、定量計算式は溶出時間の関数となる。このように、LC解析結果から、GU値を算出することができる。
 逆相スケール値は、逆相スケール法によりLCにおける溶出時間の標準化を行ったものであって、GU値と同様に糖鎖構造によって固有の値である。逆相スケール値は、GU値に比べて変動が少ないので、構造特定の精度が高い。
 HPLC解析結果において、糖鎖構造を推定するピークに対して、GU値および/または逆相スケール値を計算する。上記のMSスペクトルから算出する質量、および、GU値および/または逆相スケール値のそれぞれから糖鎖構造を絞り込むこともできるが、質量と、GU値および/または逆相スケール値とを組み合わせることで、より精度よく糖鎖構造を絞り込むことができる。例えば、算出した質量、ならびに、GU値および/または逆相スケール値をデータベースと照合することで、糖鎖構造が決定される。したがって、糖鎖構造を絞り込むための学習モデルを構築する際には、教師データとして、入力データに質量の値と、GU値および/または逆相スケール値、出力データに糖鎖構造データを用いることができる。
 算出した質量、ならびに、GU値および/または逆相スケール値をデータベースと照合して、該当する糖鎖構造がない場合には、酵素消化等の他の方法で分岐構造と結合様式を決定して、糖鎖構造を決定する。決定の際には、周知の糖鎖の生合成経路の知見を合わせるようにしてもよい。
(断片質量)
 マスタデータ22は、さらに断片質量を含んでもよい。断片質量は、MS/MS解析結果(図6を参照)に基づいて、断片の元になった糖鎖構造と質量電荷比とから算出される。例えば断片質量が大きい場合、質量が大きい糖鎖構造が候補として選ばれやすくなる。
(ピーク強度比)
 マスタデータ22は、さらにMS/MSスペクトルのピーク強度比を含んでもよい。ピーク強度比は、ピークの傾向を定量化してピークの順位を決定するためのものであり、MS/MSスペクトルの各ピークに対し、ピーク強度をピーク全てのピーク強度の合算値で除算して算出される。すなわち、ピーク強度比は、MS/MS解析結果から、算出される。ピークの順位情報は、糖鎖構造が断片化する際の優先順位に依存するので、その情報から元の糖鎖構造を推定することができる。糖鎖構造内のある結合が弱いと、その結合が優先的に切れて断片化しやすいので、その断片のピーク強度は大きくなり、該当するピークの順位は高くなる。この関係により、逆説的に糖鎖構造の結合位置を推定する。例えばピーク強度比が小さい(ピーク強度が大きい)等の情報により、糖鎖構造の分岐構造をある程度推定することができる。
 上記の断片質量のみ、またはピーク強度比のみで糖鎖構造を推定するのではなく、断片質量とピーク強度比との組み合わせで糖鎖構造を推定すると、より精度よく糖鎖構造を絞り込むことができる。したがって、糖鎖構造を絞り込むための学習モデルを構築する際には、教師データとして、入力データに断片質量の値と、ピーク強度比と、機械学習モデルを使用して絞り込まれた糖鎖構造データ、出力データに糖鎖構造データを用いることができる。
 以上のことから、糖鎖構造絞込部43は、入力データとして、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果を用いることにより、入力情報処理部42により入力情報処理を行って、入力情報処理された処理データをマスタデータ22と照合することにより、糖鎖構造を絞り込むことができる。ここで処理データは、LC解析結果から算出されたGU値および/または逆相スケール値、および/または、MS解析結果から算出された質量、および/または、MS/MS解析結果から算出された断片質量およびピーク強度比である。これにより、ユーザは、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果を入力するだけで、絞り込んだ糖鎖構造の出力を得ることができる。なお、ユーザは、上記の処理データを入力するようにしてもよい。この場合、入力データが、LC解析結果から算出されたGU値および/または逆相スケール値、および/または、MS解析結果から算出された質量、および/または、MS/MS解析結果から算出された断片質量およびピーク強度比となる。
<機械学習>
 糖鎖構造絞込ステップにおいて、入力情報処理ステップで処理された処理データとマスタデータ22とを照合し、マスタデータ22に一致する糖鎖構造がない場合に、糖鎖構造絞込部43が機械学習モデル23による糖鎖構造の絞込を行うようにしてもよい。以下、機械学習モデル23について説明する。機械学習モデル23は、第1学習モデルおよび第2学習モデルの2つの学習モデルを用意することが好ましい。
(第1学習モデル)
 第1学習モデルは、糖鎖構造を例えば数十件程度に絞り込むための機械学習モデルである。第1学習モデルの構築において、入力データは、質量の値と、GU値および/または逆相スケール値である。上記のように、質量とGU値および/または逆相スケール値とから糖鎖構造を推定できるので、教師データの入力データとしての質量の値、ならびに、GU値および/または逆相スケール値と、教師データの出力データとしての糖鎖構造データとの相関関係を学習する。
 第1学習モデルを構築するための教師データの出力データとしての糖鎖構造データは、入力データを、入力データと入力データに対応する糖鎖構造とのデータベースであるマスタデータ22と照合することにより、入力データから絞り込まれた糖鎖構造とすることが好ましい。ここでの入力データは、質量の値と、GU値および/または逆相スケール値である。
(第2学習モデル)
 第2学習モデルは、第1学習モデルを使用して絞り込んだ複数の糖鎖構造の中から、さらに1~5件程度の糖鎖構造に絞り込むための機械学習モデルである。第2学習モデルの構築において、入力データは、断片質量の値と、MS/MSスペクトルのピーク強度比と、第1学習モデルで絞り込んだ糖鎖構造である。上記のように、断片質量の値と、MS/MSスペクトルのピーク強度比とから糖鎖構造を推定できるので、教師データの入力データとしての入力データである断片質量の値、MS/MSスペクトルのピーク強度比、および、第1学習モデルで絞り込んだ糖鎖構造と、教師データの出力データとしての糖鎖構造データ5との相関関係を学習する。
 第2学習モデルを構築するための教師データの出力データとしての糖鎖構造データは、入力データを、入力データと入力データに対応する糖鎖構造とのデータベースであるマスタデータ22と照合することにより、入力データから絞り込まれた糖鎖構造とすることが好ましい。ここでの入力データは、断片質量の値と、MS/MSスペクトルのピーク強度比と、第1学習モデルで絞り込んだ糖鎖構造である。
(教師あり学習)
 機械学習は、入力データと、出力データとして入力データに対応する糖鎖構造データを使用して、教師あり学習を行う。教師あり学習は、例えばニューラルネットワークモデルによる機械学習の他、周知の機械学習により行うことができる。教師あり学習の一例として、ニューラルネットワークモデルによる機械学習について、図7を参照しながら説明する。
 図7に示すニューラルネットワークモデルにおけるニューラルネットワークは、入力層にあるn個のニューロン(X00~X0n)、第1~第n中間層にあるn×n個のニューロン(Y00~Ynn)、および、出力層にあるn個のニューロン(Z00~Z0n)から構成されている。第1~第n中間層は、隠れ層とも呼ばれており、ニューラルネットワークとしては、第1中間層のみを隠れ層とするものであってもよい。なお、図7では、出力層が複数個となっているが、出力データとしての糖鎖構造が一義に決まる場合、1個のみとすることもできる。
 入力層と第1中間層との間、第1~第n中間層の各々、第n中間層と出力層との間には、層間のニューロンを接続するノードが張られており、それぞれのノードには、重みが対応付けられている。
 本実施形態のニューラルネットワークモデルにおけるニューラルネットワークでは、入力データが入力層のニューロンに対応付けられ、出力層にあるニューロンの値を、一般的なニューラルネットワークの出力値の算出方法で算出する。すなわち、当該ニューロンに接続される入力側のニューロンの値と、出力側のニューロンと入力側のニューロンとを接続するノードに対応付けられた重みとの乗算値の数列の和として算出することを、入力層にあるニューロン以外の全てのニューロンに対して行う方法を用いることで、出力側のニューロンの値を算出する。
 入力層にあるn個のニューロンX01~X0nの値と、算出された出力層にあるn個のニューロンZ01~Z0nの値、すなわち、本実施形態では入力データと教師データの糖鎖構造データの各々とを、それぞれ比較して誤差を求め、求められた誤差が小さくなるように、各ノードに対応付けられた重みを調整する(バックプロバケーション)ことを反復する。
 上述した一連の工程を所定回数反復実施すること、あるいは上記の誤差が許容値より小さくなること等の所定の条件が満たされた場合には、学習を終了して、そのニューラルネットワーク、すなわち、ノードのそれぞれに対応付けられた全ての重みを、学習モデルとする。
<全体の流れ>
 図8は、本発明の好適な実施形態に係るサーバ1によるAPI4の実行の流れを示すフローチャートである。
 まず、ステップS11で、ユーザは端末装置2の操作を行い、API4の呼び出しが行われる。
 次に、ステップS12で、入力データ取得部41が、入力データを取得する(入力データ取得ステップ)。ここでの入力データは、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果である。
 次に、ステップS13で、入力情報処理部42が、入力データの処理を行い、処理データを作成する(入力情報処理ステップ)。ここでの処理データは、LC解析結果から算出されたGU値および/または逆相スケール値、および/または、MS解析結果から算出された質量、および/または、MS/MS解析結果から算出された断片質量およびピーク強度比である。
 なお、ユーザは、上記の処理データをAPI4の指示にしたがって入力するようにしてもよく、この場合、ステップS13を省略することができる。この場合、入力データは、LC解析結果から算出されたGU値および/または逆相スケール値、および/または、MS解析結果から算出された質量、および/または、MS/MS解析結果から算出された断片質量およびピーク強度比となる。
 次に、ステップS14で、糖鎖構造絞込部43が、処理データに基づき、糖鎖構造の絞込を行う(糖鎖構造絞込ステップ)。糖鎖構造絞込部43は、まず、処理データを処理データと処理データに対応する糖鎖構造とのデータベースであるマスタデータ22と照合し、条件に一致する糖鎖構造がないか判定を行う。条件に一致する糖鎖構造がある場合、出力部44が、ステップS15で絞込結果を出力する(出力ステップ)。
 条件に一致する糖鎖構造がない場合、糖鎖構造絞込部43が、機械学習モデル23による糖鎖構造の絞込を行うようにしてもよい。絞込が完了したら、機械学習モデル23により得られた糖鎖構造を、出力部44が、ステップS15で出力する(出力ステップ)。
 最後に、ステップS16で、端末装置2は、サーバ1からAPI4により絞り込まれた糖鎖構造のデータを取得する。
 以上のようにして、ユーザは、端末装置2でAPI4を実行し、入力データを入力するだけで、絞り込まれた糖鎖構造の出力を得ることができる。
 1 サーバ
 2 端末装置
 3 通信網
 14 コンピュータプログラム
 21 糖鎖構造
 22 マスタデータ
 23 機械学習モデル
 41 入力データ取得部
 42 入力情報処理部
 43 糖鎖構造絞込部
 44 出力部

 

Claims (11)

  1.  入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)を備えたサーバであって、
     前記APIが、
     前記入力データを取得する入力データ取得ステップと、
     前記入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、
     絞り込んだ前記糖鎖構造を出力する出力ステップと、
     を実行するように構成される、サーバ。
  2.  前記入力データが、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果である、請求項1に記載のサーバ。
  3.  前記APIが前記入力データ取得ステップの後に前記入力データを処理する入力情報処理ステップをさらに実行し、前記入力情報処理ステップにおいて、
     前記LC解析結果からグルコースユニット値(GU値)および/または逆相スケール値を算出し、
     前記MS解析結果から質量を算出し、
     前記MS/MS解析結果から断片質量およびMS/MSスペクトルのピーク強度比を算出する、請求項2に記載のサーバ。
  4.  前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データを、前記処理データと前記処理データに対応する糖鎖構造とのデータベースであるマスタデータと照合することにより、前記処理データから糖鎖構造の絞込を行う、請求項3に記載のサーバ。
  5.  前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データと前記マスタデータとを照合し、前記マスタデータに一致する糖鎖構造がない場合に、機械学習モデルによる糖鎖構造の絞込を行う、請求項4に記載のサーバ。
  6.  入力データから糖鎖構造を絞り込むアプリケーションプログラミングインターフェース(API)であって、
     前記APIが、
     前記入力データを取得する入力データ取得ステップと、
     前記入力データから前記糖鎖構造を絞り込む糖鎖構造絞込ステップと、
     絞り込んだ前記糖鎖構造を出力する出力ステップと、
     を実行するように構成される、API。
  7.  前記入力データが、LC解析結果、および/または、MS解析結果、および/または、MS/MS解析結果である、請求項6に記載のAPI。
  8.  前記APIが前記入力データ取得ステップの後に前記入力データを処理する入力情報処理ステップをさらに実行し、前記入力情報処理ステップにおいて、
     前記LC解析結果からグルコースユニット値(GU値)および/または逆相スケール値を算出し、
     前記MS解析結果から質量を算出し、
     前記MS/MS解析結果から断片質量およびMS/MSスペクトルのピーク強度比を算出する、請求項7に記載のAPI。
  9.  前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データを、前記処理データと前記処理データに対応する糖鎖構造とのデータベースであるマスタデータと照合することにより、前記処理データから糖鎖構造の絞込を行う、請求項8に記載のAPI。
  10.  前記糖鎖構造絞込ステップにおいて、前記入力情報処理ステップで処理された処理データと前記マスタデータとを照合し、前記マスタデータに一致する糖鎖構造がない場合に、機械学習モデルによる糖鎖構造の絞込を行う、請求項9に記載のAPI。
  11.  コンピュータに、請求項6~10のいずれか1項に記載のAPIを実行させるコンピュータプログラム。

     
PCT/JP2022/025763 2022-06-28 2022-06-28 サーバ、apiおよびコンピュータプログラム WO2024004033A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2022/025763 WO2024004033A1 (ja) 2022-06-28 2022-06-28 サーバ、apiおよびコンピュータプログラム
JP2022540627A JP7394362B1 (ja) 2022-06-28 2022-06-28 サーバ、apiおよびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/025763 WO2024004033A1 (ja) 2022-06-28 2022-06-28 サーバ、apiおよびコンピュータプログラム

Publications (1)

Publication Number Publication Date
WO2024004033A1 true WO2024004033A1 (ja) 2024-01-04

Family

ID=89030183

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/025763 WO2024004033A1 (ja) 2022-06-28 2022-06-28 サーバ、apiおよびコンピュータプログラム

Country Status (2)

Country Link
JP (1) JP7394362B1 (ja)
WO (1) WO2024004033A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011137754A (ja) * 2009-12-28 2011-07-14 Noguchi Institute 前立腺癌を判定する方法
WO2020013097A1 (ja) * 2018-07-11 2020-01-16 公益財団法人がん研究会 前立腺がんに特異的な糖鎖、及びこれを用いた検査方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6065652B2 (ja) 2013-03-01 2017-01-25 株式会社島津製作所 糖鎖構造解析方法及び装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011137754A (ja) * 2009-12-28 2011-07-14 Noguchi Institute 前立腺癌を判定する方法
WO2020013097A1 (ja) * 2018-07-11 2020-01-16 公益財団法人がん研究会 前立腺がんに特異的な糖鎖、及びこれを用いた検査方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KUMOZAKI SHOTARO, KENGO SATO, YASUFUMI SAKAKIBARA: "Development of Carbohydrate Structure Inference Method from Mass Spectrum Data Using Machine Learning", IPSJ SIG TECHNICAL REPORT (BIOINFORMATICS), vol. 2013-BIO-34, no. 30, 28 March 2016 (2016-03-28), pages 1 - 2, XP093119312 *

Also Published As

Publication number Publication date
JPWO2024004033A1 (ja) 2024-01-04
JP7394362B1 (ja) 2023-12-08

Similar Documents

Publication Publication Date Title
JP2017044708A (ja) 滞留時間の決定または確認のための窓処理質量分析データの使用
US6957159B2 (en) System for analyzing compound structure
Kuschner et al. A Bayesian network approach to feature selection in mass spectrometry data
Lundgren et al. Protein identification using Sorcerer 2 and SEQUEST
US9947519B2 (en) Computational method and system for deducing sugar chains using tandem MSn spectrometry data
JP7394362B1 (ja) サーバ、apiおよびコンピュータプログラム
US20050159902A1 (en) Apparatus for library searches in mass spectrometry
US11650208B2 (en) Deconvolving isobaric reporter ion ratios
Chen et al. Mass spectrometry-based protein quantification
JP7360644B1 (ja) 機械学習装置、機械学習方法、糖鎖構造絞込装置およびコンピュータプログラム
JP5664667B2 (ja) 質量分析データ解析方法、質量分析データ解析装置、及び質量分析データ解析用プログラム
JP7386234B2 (ja) 複合試料内の関連化合物の同定およびスコア化
Mehnert et al. Expert Algorithm for Substance Identification Using Mass Spectrometry: Application to the Identification of Cocaine on Different Instruments Using Binary Classification Models
US10170290B2 (en) Systems and methods for grouping MS/MS transitions
US20230410947A1 (en) Systems and methods for rapid microbial identification
US11513105B2 (en) Composition estimating apparatus and method
Zhou Computational analysis of LC-MS/MS data for metabolite identification
EP3002696A1 (en) Methods for generating, searching and statistically validating a peptide fragment ion library
US20210175060A1 (en) Mass Spectrum Processing Apparatus and Method
EP4102509A1 (en) Method and apparatus for identifying molecular species in a mass spectrum
JP5933032B2 (ja) クロマトグラフィーピークを処理しグループ化するシステム及び方法
Lihtamo Computational methods for annotation of metabolites in untargeted LC-MS analysis
Tapper Early SUSY searches at LHC
Evian Early SUSY searches at the LHC
Evian PoS (HCP2009) 038 Early SUSY searches at the LHC

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22949310

Country of ref document: EP

Kind code of ref document: A1