JP7360644B1 - 機械学習装置、機械学習方法、糖鎖構造絞込装置およびコンピュータプログラム - Google Patents
機械学習装置、機械学習方法、糖鎖構造絞込装置およびコンピュータプログラム Download PDFInfo
- Publication number
- JP7360644B1 JP7360644B1 JP2022540628A JP2022540628A JP7360644B1 JP 7360644 B1 JP7360644 B1 JP 7360644B1 JP 2022540628 A JP2022540628 A JP 2022540628A JP 2022540628 A JP2022540628 A JP 2022540628A JP 7360644 B1 JP7360644 B1 JP 7360644B1
- Authority
- JP
- Japan
- Prior art keywords
- sugar chain
- chain structure
- input data
- data
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 235000000346 sugar Nutrition 0.000 title claims abstract description 197
- 238000010801 machine learning Methods 0.000 title claims abstract description 70
- 238000004590 computer program Methods 0.000 title claims abstract description 35
- 238000000547 structure data Methods 0.000 claims abstract description 65
- 238000012549 training Methods 0.000 claims abstract description 11
- 239000012634 fragment Substances 0.000 claims description 22
- 238000004885 tandem mass spectrometry Methods 0.000 claims description 22
- 238000001228 spectrum Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 16
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims description 7
- 150000004676 glycans Chemical group 0.000 abstract description 14
- 150000002500 ions Chemical class 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 14
- 210000002569 neuron Anatomy 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 8
- 150000001793 charged compounds Chemical class 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 6
- 238000001360 collision-induced dissociation Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010828 elution Methods 0.000 description 4
- 238000004128 high performance liquid chromatography Methods 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 125000001424 substituent group Chemical group 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 3
- 150000008163 sugars Chemical class 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 230000006696 biosynthetic metabolic pathway Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 238000004811 liquid chromatography Methods 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biochemistry (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Electrochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Feedback Control In General (AREA)
- Complex Calculations (AREA)
Abstract
Description
図1は、本発明の好適な実施形態に係る機械学習装置1および糖鎖構造絞込装置2の概略構成を示すブロック図である。機械学習装置1は、糖鎖構造を特定するための入力データ3を取得する入力データ取得部4と、入力データ3に対応する既知の糖鎖構造である糖鎖構造データ5を取得する糖鎖構造データ取得部6と、入力データ取得部4が取得した入力データ3および糖鎖構造データ取得部6が取得した糖鎖構造データ5の組を教師データとして教師あり学習を行うことにより、糖鎖構造の絞込を行うための学習モデルを構築する学習部7と、を備える。
糖鎖構造絞込装置2は、入力データ3を取得する入力部9と、入力部9で取得した入力データ3について、機械学習装置1によって構築された学習モデルを用いて、糖鎖構造の絞込を行う糖鎖構造絞込部10と、を備える。糖鎖構造絞込装置2で使用する入力データ3は、機械学習装置1で使用する入力データ3と区別せずに、同じ入力データ3として説明する。
質量分析法(Mass Spectrometry)には、試料をイオン化してそのまま分析する方法(MS)と、特定の試料イオン(親イオン)を質量選択し、それを解離させて生成した解離イオンを質量分析するタンデム質量分析法(MS/MS)とがある。質量分析装置は、試料分子に電荷を付加してイオン化を行い、生成したイオンを電場または磁場により質量電荷比に分離し、その量を検出器にて電流値として計測する機器である。質量分析装置の前に液体クロマトグラフ(LC:Liquid Chromatograph)部を連結した液体クロマトグラフィー/質量分析法(LC/MS)は、混合物をLCで分離しながら、MSにより質量を測定する方法である。LC部には、高速液体クロマトグラフ(HPLC:High Performance Liquid Chromatograph)が使用される。特定のイオンを選別して、開裂後さらに断片イオンの質量を測定するMS/MSや、その過程を繰り返す多段階MS(MSn)を行うと、さらに構造情報が得られる。
マスタデータ33は、教師データに使用したり、糖鎖構造を絞り込む際に参照したりする糖鎖構造のデータベースである。図4にマスタデータ33の構成の一例を示す。マスタデータ33は、少なくとも質量の値と、グルコースユニット値(GU値)および/または逆相スケール値と、組成情報と、構造情報とを含む。組成情報は、糖と置換基の種類および糖と置換基の数の情報を含むものである。構造情報は、糖と置換基の種類および糖と置換基の数の情報に、糖のアイソマー情報と、結合様式と、分岐構造の情報を加えたものである。糖鎖構造データ5は、組成情報および構造情報で構成される。
図6のMSスペクトルの大きいピーク中、最も左に位置するモノアイソトピック・ピークの質量電荷比を確認する。当該モノアイソトピック・ピークと、当該ピークに近接する同位体ピークとの差分から、イオン価数を算出する。質量電荷比と価数を掛け合わせた値から、付加イオンの質量を差し引くことで、質量が算出される。
GU値は、グルコースユニット法によりLCにおける溶出時間の標準化を行ったものであって、各ピークの検出時間とグルコースオリゴマーの検出時間とを比較することで得られる値である。GU値は、糖鎖構造によって固有の値であるため、データベースと照合することで糖鎖構造を推定することができる。GU値を算出する定量計算式の係数は測定ごとに若干変動するが、定量計算式は溶出時間の関数となる。
マスタデータ33は、さらに断片質量を含んでもよい。断片質量は、MS/MS解析結果(図7を参照)に基づいて、断片の元になった糖鎖構造と質量電荷比とから算出される。例えば断片質量が大きい場合、質量が大きい糖鎖構造が候補として選ばれやすくなる。
マスタデータ33は、さらにMS/MSスペクトルのピーク強度比を含んでもよい。ピーク強度比は、ピークの傾向を定量化してピークの順位を決定するためのものであり、MS/MSスペクトルの各ピークに対し、ピーク強度をピーク全てのピーク強度の合算値で除算して算出される。ピークの順位情報は、糖鎖構造が断片化する際の優先順位に依存するので、その情報から元の糖鎖構造を推定することができる。糖鎖構造内のある結合が弱いと、その結合が優先的に切れて断片化しやすいので、その断片のピーク強度は大きくなり、該当するピークの順位は高くなる。この関係により、逆説的に糖鎖構造の結合位置を推定する。例えばピーク強度比が小さい(ピーク強度が大きい)等の情報により、糖鎖構造の分岐構造をある程度推定することができる。
第1学習モデル31は、糖鎖構造を例えば数十件程度に絞り込むための機械学習モデルである。第1学習モデル31の構築において、入力データ3は、質量の値と、GU値および/または逆相スケール値である。上記のように、質量とGU値および/または逆相スケール値とから糖鎖構造を推定できるので、教師データの入力データとしての入力データ3である質量の値、ならびに、GU値および/または逆相スケール値と、教師データの出力データとしての糖鎖構造データ5との相関関係を学習する。
第2学習モデル32は、第1学習モデル31を使用して絞り込んだ複数の糖鎖構造の中から、さらに1~5件程度の糖鎖構造に絞り込むための機械学習モデルである。第2学習モデル32の構築において、入力データ3は、断片質量の値と、MS/MSスペクトルのピーク強度比と、第1学習モデル31で絞り込んだ糖鎖構造34である。上記のように、断片質量の値と、MS/MSスペクトルのピーク強度比とから糖鎖構造を推定できるので、教師データの入力データとしての入力データ3である断片質量の値、MS/MSスペクトルのピーク強度比、および、第1学習モデル31で絞り込んだ糖鎖構造34と、教師データの出力データとしての糖鎖構造データ5との相関関係を学習する。
機械学習装置1は、入力データとして入力データ3、出力データとして糖鎖構造データ5を使用して、教師あり学習を行う。教師あり学習は、例えばニューラルネットワークモデルによる機械学習の他、周知の機械学習により行うことができる。教師あり学習の一例として、ニューラルネットワークモデルによる機械学習について、図8を参照しながら説明する。
図9は、本発明の好適な実施形態に係る学習モデルの構築の流れを示すフローチャートである。第1学習モデル31および第2学習モデル32の構築は、使用する教師データが異なるだけで、以下に示す同様の流れで行われる。
図10は、本発明の好適な実施形態に係る糖鎖構造絞込装置2の動作を示すフローチャートである。
2 糖鎖構造絞込装置
3 入力データ
4 入力データ取得部
5 糖鎖構造データ
6 糖鎖構造データ取得部
7 学習部
8 学習モデル記憶部
9 入力部
10 糖鎖構造絞込部
14 コンピュータプログラム
24 コンピュータプログラム
31 第1学習モデル
32 第2学習モデル
33 マスタデータ
34 糖鎖構造
Claims (6)
- 糖鎖構造を特定するための入力データを取得する入力データ取得部と、
前記入力データに対応する既知の糖鎖構造である糖鎖構造データを取得する糖鎖構造データ取得部と、
前記入力データ取得部が取得した前記入力データおよび前記糖鎖構造データ取得部が取得した前記糖鎖構造データの組を教師データとして教師あり学習を行うことにより、糖鎖構造の絞込を行うための学習モデルを構築する学習部と、
を備え、
前記入力データを、質量の値と、グルコースユニット値(GU値)および/または逆相スケール値として、前記学習部が糖鎖構造の絞込を行うための前記学習モデルとして第1学習モデルを構築し、
前記入力データを、断片質量の値と、MS/MSスペクトルのピーク強度比と、前記第1学習モデルを使用して絞り込まれた糖鎖構造の糖鎖構造データとして、前記学習部が糖鎖構造の絞込を行うための前記学習モデルとして第2学習モデルを構築する、機械学習装置。 - 前記糖鎖構造データが、前記入力データを、前記入力データと前記入力データに対応する糖鎖構造とのデータベースであるマスタデータと照合することにより、前記入力データから絞り込まれた糖鎖構造である、請求項1に記載の機械学習装置。
- 機械学習装置が行う機械学習方法であって、
糖鎖構造を特定するための第1入力データとして質量の値と、グルコースユニット値(GU値)および/または逆相スケール値とを取得する第1入力データ取得ステップと、
前記第1入力データに対応する既知の糖鎖構造である第1糖鎖構造データを取得する第1糖鎖構造データ取得ステップと、
前記第1入力データ取得ステップで取得した前記第1入力データおよび前記第1糖鎖構造データ取得ステップで取得した前記第1糖鎖構造データの組を教師データとして教師あり学習を行うことにより、糖鎖構造の特定を行うための第1学習モデルを構築する第1学習ステップと、
糖鎖構造を特定するための第2入力データとして断片質量の値と、MS/MSスペクトルのピーク強度比と、前記第1学習モデルを使用して絞り込まれた糖鎖構造の糖鎖構造データとを取得する第2入力データ取得ステップと、
前記第2入力データに対応する既知の糖鎖構造である第2糖鎖構造データを取得する第2糖鎖構造データ取得ステップと、
前記第2入力データ取得ステップで取得した前記第2入力データおよび前記第2糖鎖構造データ取得ステップで取得した前記第2糖鎖構造データの組を教師データとして教師あり学習を行うことにより、糖鎖構造の特定を行うための第2学習モデルを構築する第2学習ステップと、
を含む機械学習方法。 - 前記第1および第2糖鎖構造データが、前記第1および第2入力データを、前記第1および第2入力データと前記第1および第2入力データに対応する糖鎖構造とのデータベースであるマスタデータと照合することにより、前記第1および第2入力データから絞り込まれた糖鎖構造である、請求項3に記載の機械学習方法。
- 入力データを取得する入力部と、
前記入力部で取得した前記入力データについて、請求項1または2に記載の機械学習装置によって構築された学習モデルを使用して、糖鎖構造の絞込を行う糖鎖構造絞込部と、
を備える糖鎖構造絞込装置。 - コンピュータを、請求項1または2に記載の機械学習装置として機能させるコンピュータプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2022/025757 WO2024004032A1 (ja) | 2022-06-28 | 2022-06-28 | 機械学習装置、機械学習方法、糖鎖構造絞込装置およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7360644B1 true JP7360644B1 (ja) | 2023-10-13 |
JPWO2024004032A1 JPWO2024004032A1 (ja) | 2024-01-04 |
Family
ID=88242113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022540628A Active JP7360644B1 (ja) | 2022-06-28 | 2022-06-28 | 機械学習装置、機械学習方法、糖鎖構造絞込装置およびコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7360644B1 (ja) |
WO (1) | WO2024004032A1 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014169879A (ja) | 2013-03-01 | 2014-09-18 | Shimadzu Corp | 糖鎖構造解析方法及び装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06249841A (ja) * | 1993-02-24 | 1994-09-09 | Nakano Vinegar Co Ltd | 糖鎖解析装置 |
-
2022
- 2022-06-28 WO PCT/JP2022/025757 patent/WO2024004032A1/ja unknown
- 2022-06-28 JP JP2022540628A patent/JP7360644B1/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014169879A (ja) | 2013-03-01 | 2014-09-18 | Shimadzu Corp | 糖鎖構造解析方法及び装置 |
Non-Patent Citations (1)
Title |
---|
雲崎 翔太郎,機械学習を用いたマススペクトルデータからの糖鎖構造推定法の開発,電子情報通信学会技術研究報告 Vol.113 No.111,日本,一般社団法人電子情報通信学会,2013年06月20日,157-158頁 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2024004032A1 (ja) | 2024-01-04 |
WO2024004032A1 (ja) | 2024-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7026148B2 (ja) | 生成イオンスペクトルのデータ独立取得および参照スペクトルライブラリ照合 | |
JP6494588B2 (ja) | 滞留時間の決定または確認のための窓処理質量分析データの使用 | |
CN101871945B (zh) | 一种利用质谱图库鉴定蛋白质及其修饰的方法 | |
JP2007287531A (ja) | 質量分析データ解析方法 | |
US8631057B2 (en) | Alignment of multiple liquid chromatography-mass spectrometry runs | |
US9947519B2 (en) | Computational method and system for deducing sugar chains using tandem MSn spectrometry data | |
WO2013051148A1 (ja) | 質量分析データ解析方法及び装置 | |
US20050159902A1 (en) | Apparatus for library searches in mass spectrometry | |
JP7360644B1 (ja) | 機械学習装置、機械学習方法、糖鎖構造絞込装置およびコンピュータプログラム | |
US11650208B2 (en) | Deconvolving isobaric reporter ion ratios | |
JP7394362B1 (ja) | サーバ、apiおよびコンピュータプログラム | |
EP3844507B1 (en) | Identification and scoring of related compounds in complex samples | |
JP5664667B2 (ja) | 質量分析データ解析方法、質量分析データ解析装置、及び質量分析データ解析用プログラム | |
JP6027436B2 (ja) | 質量分析データ解析方法 | |
EP3341737B1 (en) | Rapid scoring of lc-ms/ms peptide data | |
EP3002696B1 (en) | Methods for generating, searching and statistically validating a peptide fragment ion library | |
Zhou | Computational analysis of LC-MS/MS data for metabolite identification | |
US20210175060A1 (en) | Mass Spectrum Processing Apparatus and Method | |
US20240038513A1 (en) | Sample Analyzing Apparatus and Method | |
EP4102509A1 (en) | Method and apparatus for identifying molecular species in a mass spectrum | |
WO2018174858A1 (en) | Clinical method for the population screening of adult metabolic disorder associated with chronic human disease | |
CN118176540A (zh) | 用于未知化合物检测和识别的化学峰寻找器模型 | |
CN118120041A (zh) | 用于定性和定量分析工作流程的三维化学峰寻找器 | |
WO2022074583A1 (en) | Automated modeling of lc peak shape | |
CN117242527A (zh) | 通过积分参数迭代改进峰积分 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230704 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230818 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230829 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7360644 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |