JP2021036202A - 質量分析データ処理方法、質量分析データ処理システム、及びプログラム - Google Patents
質量分析データ処理方法、質量分析データ処理システム、及びプログラム Download PDFInfo
- Publication number
- JP2021036202A JP2021036202A JP2019157607A JP2019157607A JP2021036202A JP 2021036202 A JP2021036202 A JP 2021036202A JP 2019157607 A JP2019157607 A JP 2019157607A JP 2019157607 A JP2019157607 A JP 2019157607A JP 2021036202 A JP2021036202 A JP 2021036202A
- Authority
- JP
- Japan
- Prior art keywords
- data
- sample data
- marker
- values
- marker protein
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
それぞれが互いに異なる既知微生物に関する複数のマーカータンパク質のm/z値を含んだデータである複数の既知サンプルデータを取得し、
前記複数の既知サンプルデータに含まれる、前記複数のマーカータンパク質のうちの同じマーカータンパク質のm/z値同士を比較し、両者の差が予め定められた許容誤差範囲に含まれるm/z値同士を同一グループに分類することによって、該マーカータンパク質に関するm/z値を一つ以上のグループに分割し、
前記複数の既知サンプルデータの各々に含まれる前記マーカータンパク質のm/z値を、前記一つ以上のグループのうちの、該m/z値が分類されたグループに固有の識別子であるグループ識別子に置換することによって学習データを作成し、
前記複数のマーカータンパク質のうちの同種のマーカータンパク質については、互いに異なるグループ識別子間の距離はいずれも等価であるとして前記学習データを用いた機械学習を行うことによって判別モデルを作成するものである。
それぞれが互いに異なる既知微生物に関する複数のマーカータンパク質のm/z値を含んだデータである複数の既知サンプルデータを取得する既知サンプルデータ取得部と、
前記複数の既知サンプルデータに含まれる、前記複数のマーカータンパク質のうちの同種のマーカータンパク質のm/z値同士を比較し、両者の差が予め定められた許容誤差範囲に含まれるm/z値同士を同一グループに分類することによって、該マーカータンパク質に関するm/z値を一つ以上のグループに分割するグループ化部と、
前記複数の既知サンプルデータの各々に含まれる前記マーカータンパク質のm/z値を、前記一つ以上のグループのうちの、該m/z値が分類されたグループに固有の識別子であるグループ識別子に置換することによって学習データを作成する学習データ生成部と、
前記複数のマーカータンパク質のうちの同種のマーカータンパク質については、互いに異なるグループ識別子間の距離はいずれも等価であるとして前記学習データを用いた機械学習を行うことによって判別モデルを作成する判別モデル生成部と、を備えるものである。
上述した例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。
それぞれが互いに異なる既知微生物に関する複数のマーカータンパク質のm/z値を含んだデータである複数の既知サンプルデータを取得し、
前記複数の既知サンプルデータに含まれる、前記複数のマーカータンパク質のうちの同じマーカータンパク質のm/z値同士を比較し、両者の差が予め定められた許容誤差範囲に含まれるm/z値同士を同一グループに分類することによって、該マーカータンパク質に関するm/z値を一つ以上のグループに分割し、
前記複数の既知サンプルデータの各々に含まれる前記マーカータンパク質のm/z値を、前記一つ以上のグループのうちの、該m/z値が分類されたグループに固有の識別子であるグループ識別子に置換することによって学習データを作成し、
前記複数のマーカータンパク質のうちの同種のマーカータンパク質については、互いに異なるグループ識別子間の距離はいずれも等価であるとして前記学習データを用いた機械学習を行うことによって判別モデルを作成するものである。
前記既知微生物が、タイプが既知であるアクネ菌であり、
前記複数のマーカータンパク質が、少なくともリボソームタンパク質S8、L13、L15、L23、L27、L6、L7/L12、並びにAntitoxinを含むものであって、
前記判別モデルがアクネ菌のタイプを判別するものであってもよい。
それぞれが互いに異なる既知微生物に関する複数のマーカータンパク質のm/z値を含んだデータである複数の既知サンプルデータを取得する既知サンプルデータ取得部と、
前記複数の既知サンプルデータに含まれる、前記複数のマーカータンパク質のうちの同種のマーカータンパク質のm/z値同士を比較し、両者の差が予め定められた許容誤差範囲に含まれるm/z値同士を同一グループに分類することによって、該マーカータンパク質に関するm/z値を一つ以上のグループに分割するグループ化部と、
前記複数の既知サンプルデータの各々に含まれる前記マーカータンパク質のm/z値を、前記一つ以上のグループのうちの、該m/z値が分類されたグループに固有の識別子であるグループ識別子に置換することによって学習データを作成する学習データ生成部と、
前記複数のマーカータンパク質のうちの同種のマーカータンパク質については、互いに異なるグループ識別子間の距離はいずれも等価であるとして前記学習データを用いた機械学習を行うことによって判別モデルを作成する判別モデル生成部とを備えている。
前記既知微生物が、タイプが既知であるアクネ菌であり、
前記複数のマーカータンパク質が、少なくともリボソームタンパク質S8、L13、L15、L23、L27、L6、L7/L12、並びにAntitoxinを含むものであって、
前記判別モデルがアクネ菌のタイプを判別するものであってもよい。
20…前処理部
21…既知サンプルデータ取得部
22…グループ化部
23…学習データ生成部
30…判別モデル生成部
40…判別部
41…未知サンプルデータ取得部
42…判別対象データ生成部
43…判別実行部
50…データ記憶部
60…入力部
70…表示部
Claims (5)
- それぞれが互いに異なる既知微生物に関する複数のマーカータンパク質のm/z値を含んだデータである複数の既知サンプルデータを取得し、
前記複数の既知サンプルデータに含まれる、前記複数のマーカータンパク質のうちの同じマーカータンパク質のm/z値同士を比較し、両者の差が予め定められた許容誤差範囲に含まれるm/z値同士を同一グループに分類することによって、該マーカータンパク質に関するm/z値を一つ以上のグループに分割し、
前記複数の既知サンプルデータの各々に含まれる前記マーカータンパク質のm/z値を、前記一つ以上のグループのうちの、該m/z値が分類されたグループに固有の識別子であるグループ識別子に置換することによって学習データを作成し、
前記複数のマーカータンパク質のうちの同種のマーカータンパク質については、互いに異なるグループ識別子間の距離はいずれも等価であるとして前記学習データを用いた機械学習を行うことによって判別モデルを作成する質量分析データ処理方法。 - 前記既知微生物が、タイプが既知であるアクネ菌であり、
前記複数のマーカータンパク質が、少なくともリボソームタンパク質S8、L13、L15、L23、L27、L6、L7/L12、並びにAntitoxinを含むものであって、
前記判別モデルがアクネ菌のタイプを判別するものである請求項1に記載の質量分析データ処理方法。 - それぞれが互いに異なる既知微生物に関する複数のマーカータンパク質のm/z値を含んだデータである複数の既知サンプルデータを取得する既知サンプルデータ取得部と、
前記複数の既知サンプルデータに含まれる、前記複数のマーカータンパク質のうちの同種のマーカータンパク質のm/z値同士を比較し、両者の差が予め定められた許容誤差範囲に含まれるm/z値同士を同一グループに分類することによって、該マーカータンパク質に関するm/z値を一つ以上のグループに分割するグループ化部と、
前記複数の既知サンプルデータの各々に含まれる前記マーカータンパク質のm/z値を、前記一つ以上のグループのうちの、該m/z値が分類されたグループに固有の識別子であるグループ識別子に置換することによって学習データを作成する学習データ生成部と、
前記複数のマーカータンパク質のうちの同種のマーカータンパク質については、互いに異なるグループ識別子間の距離はいずれも等価であるとして前記学習データを用いた機械学習を行うことによって判別モデルを作成する判別モデル生成部と、
を備える質量分析データ処理システム。 - 前記既知微生物が、タイプが既知であるアクネ菌であり、
前記複数のマーカータンパク質が、少なくともリボソームタンパク質S8、L13、L15、L23、L27、L6、L7/L12、並びにAntitoxinを含むものであって、
前記判別モデルがアクネ菌のタイプを判別するものである請求項3に記載の質量分析データ処理システム。 - コンピュータを、請求項3又は請求項4に記載の質量分析データ処理システムの各部として機能させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019157607A JP7156213B2 (ja) | 2019-08-30 | 2019-08-30 | 質量分析データ処理方法、質量分析データ処理システム、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019157607A JP7156213B2 (ja) | 2019-08-30 | 2019-08-30 | 質量分析データ処理方法、質量分析データ処理システム、及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021036202A true JP2021036202A (ja) | 2021-03-04 |
JP2021036202A5 JP2021036202A5 (ja) | 2022-01-06 |
JP7156213B2 JP7156213B2 (ja) | 2022-10-19 |
Family
ID=74716809
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019157607A Active JP7156213B2 (ja) | 2019-08-30 | 2019-08-30 | 質量分析データ処理方法、質量分析データ処理システム、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7156213B2 (ja) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006522340A (ja) * | 2003-04-02 | 2006-09-28 | メルク エンド カムパニー インコーポレーテッド | 質量分析データの分析法 |
JP2007523323A (ja) * | 2004-01-30 | 2007-08-16 | サイファージェン バイオシステムズ インコーポレイテッド | スペクトルにおけるシグナルをクラスタにする方法 |
JP2007316063A (ja) * | 2006-04-28 | 2007-12-06 | National Institute Of Advanced Industrial & Technology | 細胞の迅速識別方法及び識別装置 |
JP2015184020A (ja) * | 2014-03-20 | 2015-10-22 | 株式会社島津製作所 | 微生物の識別方法 |
JP2017211762A (ja) * | 2016-05-24 | 2017-11-30 | 富士通株式会社 | データ分類方法、データ分類装置およびデータ分類プログラム |
JP2018155522A (ja) * | 2017-03-16 | 2018-10-04 | 株式会社島津製作所 | データ解析装置 |
JP2020153933A (ja) * | 2019-03-22 | 2020-09-24 | 株式会社島津製作所 | 微生物の識別方法 |
-
2019
- 2019-08-30 JP JP2019157607A patent/JP7156213B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006522340A (ja) * | 2003-04-02 | 2006-09-28 | メルク エンド カムパニー インコーポレーテッド | 質量分析データの分析法 |
JP2007523323A (ja) * | 2004-01-30 | 2007-08-16 | サイファージェン バイオシステムズ インコーポレイテッド | スペクトルにおけるシグナルをクラスタにする方法 |
JP2007316063A (ja) * | 2006-04-28 | 2007-12-06 | National Institute Of Advanced Industrial & Technology | 細胞の迅速識別方法及び識別装置 |
JP2015184020A (ja) * | 2014-03-20 | 2015-10-22 | 株式会社島津製作所 | 微生物の識別方法 |
JP2017211762A (ja) * | 2016-05-24 | 2017-11-30 | 富士通株式会社 | データ分類方法、データ分類装置およびデータ分類プログラム |
JP2018155522A (ja) * | 2017-03-16 | 2018-10-04 | 株式会社島津製作所 | データ解析装置 |
JP2020153933A (ja) * | 2019-03-22 | 2020-09-24 | 株式会社島津製作所 | 微生物の識別方法 |
Also Published As
Publication number | Publication date |
---|---|
JP7156213B2 (ja) | 2022-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Steinegger et al. | Protein-level assembly increases protein sequence recovery from metagenomic samples manyfold | |
Tibbs Cortes et al. | Status and prospects of genome‐wide association studies in plants | |
Girard et al. | Identification and typing of the emerging pathogen Candida auris by matrix‐assisted laser desorption ionisation time of flight mass spectrometry | |
Brady et al. | Phymm and PhymmBL: metagenomic phylogenetic classification with interpolated Markov models | |
Lewis et al. | Support vector machine learning from heterogeneous data: an empirical analysis using protein sequence and structure | |
Fedorko et al. | Identification of clinical isolates of anaerobic bacteria using matrix-assisted laser desorption ionization-time of flight mass spectrometry | |
Meng et al. | Logparse: Making log parsing adaptive through word classification | |
CN113836038B (zh) | 测试数据构造方法、装置、设备及存储介质 | |
CN114420212B (zh) | 一种大肠杆菌菌株鉴定方法和系统 | |
CN112529114B (zh) | 基于gan的目标信息识别方法、电子设备和介质 | |
Tomachewski et al. | Ribopeaks: a web tool for bacterial classification through m/z data from ribosomal proteins | |
Umbarkar et al. | Analysis of heuristic based feature reduction method in intrusion detection system | |
CN116107834A (zh) | 日志异常检测方法、装置、设备及存储介质 | |
CN115618355A (zh) | 注入攻击结果判定方法、装置、设备及存储介质 | |
Lall et al. | sc-REnF: An entropy guided robust feature selection for single-cell RNA-seq data | |
Johnson et al. | Reference-free plant disease detection using machine learning and long-read metagenomic sequencing | |
Shih et al. | Rapid identification of haloarchaea and methanoarchaea using the matrix assisted laser desorption/ionization time-of-flight mass spectrometry | |
Vervier et al. | MetaVW: Large-scale machine learning for metagenomics sequence classification | |
JP7156213B2 (ja) | 質量分析データ処理方法、質量分析データ処理システム、及びプログラム | |
Jan et al. | Semi-supervised labeling: a proposed methodology for labeling the twitter datasets | |
Gkanogiannis et al. | A scalable assembly-free variable selection algorithm for biomarker discovery from metagenomes | |
JP7334549B2 (ja) | 微生物判別方法、微生物判別システム、及び微生物判別プログラム | |
Zoun et al. | Streaming FDR calculation for protein identification | |
JP2021025953A (ja) | 質量分析データ処理方法、質量分析データ処理システム、及び質量分析データ処理プログラム | |
US11990327B2 (en) | Method, system and program for processing mass spectrometry data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20190925 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211129 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220906 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220914 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220919 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7156213 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |