JPWO2018134952A1 - 分析データ解析方法および分析データ解析装置 - Google Patents

分析データ解析方法および分析データ解析装置 Download PDF

Info

Publication number
JPWO2018134952A1
JPWO2018134952A1 JP2018562813A JP2018562813A JPWO2018134952A1 JP WO2018134952 A1 JPWO2018134952 A1 JP WO2018134952A1 JP 2018562813 A JP2018562813 A JP 2018562813A JP 2018562813 A JP2018562813 A JP 2018562813A JP WO2018134952 A1 JPWO2018134952 A1 JP WO2018134952A1
Authority
JP
Japan
Prior art keywords
data
analysis
generated
machine learning
mass spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018562813A
Other languages
English (en)
Other versions
JP6813033B2 (ja
Inventor
雄介 玉井
茂樹 梶原
真 藤田
亮太 愛須
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Publication of JPWO2018134952A1 publication Critical patent/JPWO2018134952A1/ja
Application granted granted Critical
Publication of JP6813033B2 publication Critical patent/JP6813033B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/0027Methods for using particle spectrometers
    • H01J49/0036Step by step routines describing the handling of the data generated during a measurement
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0033Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/478Contour-based spectral representations or scale-space representations, e.g. by Fourier analysis, wavelet analysis or curvature scale-space [CSS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • G06F2218/10Feature extraction by analysing the shape of a waveform, e.g. extracting parameters relating to peaks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Radiology & Medical Imaging (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Quality & Reliability (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

この分析データ解析方法は、分析装置(1)によって計測された分析結果データ(31)の機械学習を用いた解析方法であって、分析結果データ(31)に対し、識別に影響を与えない範囲でデータ変動を加えた模擬データ(32)を生成するステップと、生成した模擬データ(32)を用いて機械学習を行うステップと、機械学習により得られた判別基準(23b)を用いて判別を行うステップとを備える。

Description

この発明は、分析データ解析方法に関し、特に、機械学習を用いた分析データ解析方法および分析データ解析装置に関する。
従来、機械学習を用いた分析データ解析方法が知られている。このような分析データ解析方法は、たとえば、特開2016−28229号公報に開示されている。
上記特開2016−28229号公報には、機械学習を用いてスペクトルデータを解析する分析データ解析方法が開示されている。機械学習では、多数のデータ(多数のパターン)によって学習させる必要がある。上記特開2016−28229号公報では、スペクトルデータからスペクトル成分を間引いて個々の学習用データのデータ量を低減している。
特開2016−28229号公報
しかしながら、上記特開2016−28229号公報に開示されている機械学習を用いた分析データ解析方法などの機械学習を用いた分析データ解析方法では、機械学習に適したデータ(判別対象の典型的なデータ)を多数取得することが難しい。たとえば、生体試料の分析結果データなどを数千単位で取得することは困難である。機械学習に用いるデータ数が少ない場合、データ変動によって容易に機械学習の精度が低下するなどの問題点がある。
この発明は、上記のような課題を解決するためになされたものであり、この発明の1つの目的は、判別対象の典型的なデータを多数取得するのが困難な分析データの判別を機械学習を用いて行う場合でも、機械学習の精度を向上させることが可能な分析データ解析方法およびデータ解析装置を提供することである。
上記目的を達成するために、この発明の第1の局面における分析データ解析方法は、分析装置によって計測された分析結果データの機械学習を用いた解析方法であって、複数の分析結果データに対し、識別に影響を与えない範囲でデータ変動を加えた複数の模擬データを生成するステップと、生成した複数の模擬データを用いて機械学習を行うステップと、機械学習により得られた判別基準を用いて判別を行うステップとを備える。なお、本発明において、「識別に影響を与えない範囲」とは、データ変動を加えた際に、判別の結果が逆転しない範囲のこととする。
この発明の第1の局面による分析データ解析方法では、上記のように識別に影響を与えない範囲でデータ変動を加えて複数の模擬データを生成するステップと、生成した複数の模擬データを用いて機械学習を行うステップと、機械学習により得られた判別基準を用いて判別を行うステップとを備えている。これにより、識別に影響しない範囲で変動を加えた複数の模擬データを生成することができる。その結果、機械学習に用いるデータを増加させることができるので、機械学習の精度を向上させることができる。
ここで、画像認識の分野では、取得した画像に変換を加えることによりデータ数を増やすことは容易であるが、科学分析のデータの場合、データ変動可能な範囲を見極めることが困難であり、単にデータを増やすのみでは、訓練データに対して学習されているが、未知のデータ(判別したいデータ)に対して適合できていない(汎化できていない)状態である過剰適合により判別精度が低下する恐れもある。そこで、上記第1の局面による分析データ解析方法において、好ましくは、識別に影響を与えない範囲は、分析装置による計測に伴う特定の変動要因に対応する範囲である。これにより、分析装置の計測に伴って各種要因により生じるデータのバラつきやかたよりなどの変動を模擬データ化して学習させることができる。その結果、分析装置の計測に伴う変動要因に起因する機械学習の精度の低下を抑制することができる。
この場合、好ましくは、複数の分析結果データは、分析装置により得られるスペクトルであって、特定の変動要因は、分析装置を用いてスペクトルを得る際に発生する、分析装置または試料に起因する変動要因である。これにより、単なる数値データではなく、分布を有していために変動可能な範囲を評価しにくいスペクトルに対して、実際の計測に伴って発生する変動を加えて生成した多数の模擬データを学習させることができる。その結果、実際の計測に伴って発生する、分析装置または試料に起因する変動要因に起因する機械学習の精度の低下を抑制することができる。
上記識別に影響を与えない範囲が分析装置による計測に伴う特定の変動要因に対応する範囲である分析データ解析方法において、好ましくは、複数の模擬データは、特定の変動要因に起因する複数の分析結果データの変動の範囲内でデータ変動を加えることにより生成される。これにより、分析装置による計測に伴う変動を加えて生成した複数の模擬データを用いて学習させることができる。その結果、分析装置による計測に伴う複数の変動要因に起因する機械学習の精度の低下を抑制することができる。
この場合、好ましくは、特定の変動要因に起因する複数の分析結果データの変動を取得するステップと、取得した特定の変動要因に起因する複数の分析結果データの変動を加えることにより複数の模擬データを生成するステップとを備える。これにより、実際の計測に伴って発生する変動要因に対応した模擬データを用いて学習させることができるとともに、計測に伴わないデータ変動を加えた模擬データによって学習させることを抑制することができる。その結果、過剰適合を抑制することが可能となるので、機械学習の精度が低下することを抑制することができる。
上記複数の分析結果データに、特定の変動要因に起因する変動の範囲内でデータ変動を加える分析データ解析方法において、好ましくは、複数の模擬データを生成するステップにおいて、試料によるスペクトルの強度変化の割合に応じて、スペクトルの強度値を変動させることにより複数の模擬データを生成する。これにより、計測に伴う変動要因の1つとしての試料ごとに異なるスペクトルの強度変化の割合(データのかたより)に対応した模擬データを用いて学習させることができる。その結果、試料ごとに異なるスペクトルの強度変化の割合に起因する機械学習の精度の低下を抑制することができる。
上記複数の分析結果データに、特定の変動要因に起因する変動の範囲内でデータ変動を加える分析データ解析方法において、好ましくは、試料によるスペクトルの強度変化の割合は、試料の質量または試料が吸収する波長の増加に伴い、略一定の割合で増加または減少し、強度変化の割合をスペクトルの強度値に乗算することにより、複数の模擬データを生成する。これにより、試料の質量または試料が吸収する波長の値に応じたスペクトルの強度変化の割合を反映した模擬データを用いて学習させることができる。その結果、試料の質量または試料が吸収する波長の値に応じたスペクトルの強度変化の割合に起因する機械学習の精度の低下を抑制することができる。
上記複数の分析結果データに、特定の変動要因に起因する変動の範囲内でデータ変動を加える分析データ解析方法において、好ましくは、複数の模擬データを生成するステップにおいて、スペクトルのベースラインに、分析データ測定時に生じるベースラインの変動に対応する変動を与えることにより複数の模擬データを生成する。これにより、計測に伴う変動要因の1つとしての測定環境の違いに対応した模擬データを用いて学習させることができる。その結果、測定環境の違いに起因する機械学習の精度の低下を抑制することができる。
上記複数の分析結果データに、特定の変動要因に起因する変動の範囲内でデータ変動を加える分析データ解析方法において、好ましくは、複数の模擬データを生成するステップにおいて、複数の分析装置の個体差データの差分を加えて複数の模擬データを生成する。これにより、計測に伴う変動要因の1つとしての分析装置間でのスペクトルの検出感度の誤差に対応した模擬データを用いて学習させることができる。その結果、分析装置間の検出感度の誤差による機械学習の精度の低下を抑制することができる。
上記複数の分析結果データに、特定の変動要因に起因する変動の範囲内でデータ変動を加える分析データ解析方法において、好ましくは、複数の模擬データを生成するステップにおいて、複数の分析結果データに対して識別に影響を与えない範囲で乱数を加えることにより複数の模擬データを生成する。これにより、計測に伴う変動要因の1つとしてのランダムノイズに対応した模擬データを用いて学習させることができる。その結果、計測時にノイズが混入した場合に、機械学習の精度が低下することを抑制することができる。
上記複数の分析結果データに、特定の変動要因に起因する変動の範囲内でデータ変動を加える分析データ解析方法において、好ましくは、複数の模擬データを生成するステップにおいて、分析装置による計測時に検出される不純物に応じて、スペクトルに不純物のピークを加えることにより複数の模擬データを生成する。これにより、計測に伴う変動要因の1つとしての不純物の混入に対応した模擬データを用いて学習させることができる。その結果、不純物が混入した際に機械学習の精度が低下することを抑制することができる。
上記特定の変動要因は、分析装置を用いてスペクトルを得る際に発生する分析装置または試料に起因する変動要因である分析データ解析方法において、好ましくは、分析装置としてのマススペクトルを生成する質量分析装置によって計測された複数の分析結果データに対して、複数の模擬データを用いて機械学習を行う。これにより、得られたマススペクトルに対して、質量分析装置の計測に伴う変動を加えた複数の模擬データを生成し機械学習に用いることができる。その結果、質量分析装置の計測に伴う特定要因に起因する機械学習の精度の低下を抑制することができる。
この場合、好ましくは、複数の分析結果データは、被検者から採取された生体試料のマススペクトルを含み、判別を行うステップにおいて、判別基準を用いて、試料の複数の分析結果データに対するがんの判別を行う。これにより、多数入手することが困難な生体試料を用いたマススペクトルのデータを機械学習によって生成した判別基準によって判別することにより、がん判別を行うことができる。
この発明の第2の局面による分析データ解析装置は、分析装置で得られる分析結果データを取得するデータ入力部と、分析結果データに識別に影響を与えない範囲でデータ変動を加えて生成された模擬データを用いて機械学習により生成された判別基準および機械学習の判別アルゴリズムが記憶された記憶部と、判別基準を用いて、判別アルゴリズムに従いデータ入力部により取得された分析結果データの判別を行う演算部とを備える。
この発明の第2の局面による分析データ解析装置では、上記のように、分析結果データを取得するデータ入力部と、分析結果データに識別に影響を与えない範囲でデータ変動を加えて生成された模擬データを用いた機械学習により生成された判別基準および機械学習の判別アルゴリズムが記憶された記憶部と、判断基準を用いて取得された分析結果データの判別を行う演算部とを備える。これにより、識別に影響しない範囲で変動を加えた複数の模擬データを生成することができる。その結果、機械学習に用いるデータを増加させることができるので、機械学習の精度を向上させることができる。
本発明によれば、上記のように、判別対象の典型的なデータを多数取得するのが困難な分析データの判別を機械学習を用いて行う場合でも、機械学習の精度を向上させることが可能な分析データ解析方法およびデータ解析装置を提供することができる。
本発明の第1〜第5実施形態による分析データ解析装置の概略を示したブロック図である。 本発明の第1実施形態の学習時フロー(A)および判別時フロー(B)を示すフローチャートである。 本発明の第1実施形態による試料の強度比を表すグラフである。 本発明の第1実施形態に用いる分析結果データ(A)および生成される模擬データ(B)を示すスペクトル図である。 本発明の第1実施形態の判別結果を説明するための表である。 本発明の第2実施形態に用いる分析結果データ(A)および生成される模擬データ(B)を示すスペクトル図である。 本発明の第3実施形態による装置間の感度プロファイルの違いによる強度比を示すグラフである。 本発明の第3実施形態に用いる分析結果データ(A)および生成される模擬データ(B)を示すスペクトル図である。 本発明の第4実施形態に用いる分析結果データ(A)および生成される模擬データ(B)を示すスペクトル図である。 本発明の第5実施形態に用いる分析結果データ(A)および生成される模擬データ(B)を示すスペクトル図である。 本発明の第6実施形態による分析データ解析装置の概略を示したブロック図である。
以下、本発明を具体化した実施形態を図面に基づいて説明する。
[第1実施形態]
まず、図1〜図5を参照して、第1実施形態による分析データ解析装置100の構成について説明する。
図1に示すように、分析データ解析装置100は、データ処理部2を備えている。また、分析データ解析装置100と分析装置1とで、分析データ解析システムが構築されている。また、分析データ解析装置100は、分析装置1の制御装置としても機能する。
分析データ解析装置100は、生成したマススペクトル32(図4(B)参照)を用いて機械学習を行い、その結果得られた判別基準23bを用いて、試料3の判別を行う。判別は、たとえば、試料3が生体試料の場合、がんなどの判別である。また、たとえば、試料3が非生体試料の場合、材質判別などである。
分析装置1は、測定試料3の科学分析を行う装置である。分析装置1は、たとえば、分析結果データとしてスペクトルを生成する。スペクトルを生成する分析装置であればどのような装置でもよいが、たとえば、マススペクトルを生成する質量分析装置である。第1実施形態では、分析装置としてのマススペクトルを生成する分析装置1によって計測された複数の分析結果データに対して、複数の模擬データを用いて機械学習を行うように構成されている。
分析装置1は、どのようなタイプでもよいが、たとえば、マトリックス支援レーザ分離イオン化四重極イオントラップ飛行時間型質量分析装置(MALDI−QIT−TOFMS)である。
分析装置1は、イオン化部10と、イオントラップ11と飛行時間型質量分析部12と備えている。
分析装置1は、イオン化部10において、MALDI法により試料3をイオン化させ、イオントラップ11により、発生したイオンを一時的に捕捉し、質量電荷比(m/z)に応じたイオンの選別を行う。イオントラップ11から出射されたイオンは飛行時間型質量分析部12に備えられたリフレクトロン電極13により発生する電場によって折り返され、イオン検出器14によって検出される。
データ処理部2は、分析制御部21と、スペクトル作成部22と、記憶部23と、演算部24とを含む。記憶部23には、判別に用いる判別アルゴリズム23aおよび機械学習によって生成された判別基準23bが記憶されている。判別基準23bは、機械学習によって生成された判別に用いるパラメータである。機械学習の例としては、たとえば、SVM(サポートベクトルマシン)を用いる。また、判別は、たとえば、がんの判別である。
分析制御部21は、イオン化部10と、イオントラップ11と、飛行時間型質量分析部12とを制御する。また、スペクトル作成部22は、イオン検出器14において検出された値を基に、マススペクトルを生成し、生成したマススペクトルのデータを演算部24へ送る。演算部24は、記憶部23に記憶されている判別アルゴリズム23aおよび判別基準23bを用いて、入力されたマススペクトルの判別を行う。
入力部5は、たとえば、キーボード、マウス、タッチパネルなどであり、データ処理部2に接続してスペクトル解析の開始などの操作を行う。また、表示部4は、たとえば、データ処理部2に接続される液晶ディスプレイなどのモニタであり、判別結果等を表示する。
また、第1実施形態では、測定試料3は、生体試料である。たとえば、被検者から採取した尿や血液である。また、第1実施形態では、分析結果データは、被検者から採取された生体試料3のマススペクトルを含み、判別を行うステップにおいて、判別基準23bを用いて、試料3の複数の分析結果データに対するがんの判別を行うように構成されている。
次に、図2を参照して、第1実施形態による学習時のフローおよび判別時のフローについて説明する。
まず、図2(A)を参照して、学習時のフローについて説明する。学習は、データ処理部2とは別の学習装置(たとえば、コンピュータ)によって、試料3のマススペクトルの判別を行う前に実施される。図2(A)は、学習時のフローを示したフローチャートである。ステップS1において、試料3のマススペクトルを取得する。次に、ステップS2において、計測に伴って発生する変動要因を加えた複数の模擬データを生成する。次に、ステップS3において、取得したマススペクトルおよび生成した複数の模擬データを用いて機械学習を行い、判別基準23bを生成する。
次に、図2(B)を参照して、判別時のフローについて説明する。判別は、データ処理部2の演算部24によって行われる。図2(B)は、学習時のフローを示したフローチャートである。ステップS4において、試料3のマススペクトルを取得する。次に、ステップS5において、ステップS3で生成した判別基準23bを用いて、がん判別を行う。
次に図3および図4を参照して、本発明の第1実施形態による、模擬データを生成するステップを説明する。
図3は、試料3のスペクトルの質量電荷比と得られるスペクトルの強度変化の割合との関係を表すグラフ30であり、横軸が質量電荷比(m/z)、縦軸が得られるスペクトルの強度変化の割合を示す。質量分析では、計測する試料によって、得られるスペクトルの強度が実際の値と異なることがある。第1実施形態では、試料3のマススペクトルは、質量電荷比の小さい範囲において得られる検出強度は、実際の値よりも大きくなり、反対に質量電荷比の大きい範囲においては、検出強度比が実際の値よりも小さくなる。直線30aは、試料3のマススペクトルが、実際の値と比較した場合の割合を示しており、質量電荷比が増加するにしたがって、略一定の割合で強度変化の割合が増加している。
図4(A)は、試料3の分析結果データのマススペクトル31であり、図4(B)は、マススペクトル31に対し識別に影響を与えない範囲でデータ変動を加えて生成した模擬データのマススペクトル32である。なお、識別に影響を与えない範囲とは、分析装置1による計測に伴う特定の変動要因に対応する範囲であり、第1実施形態では、これらの変動要因のうち、分析装置1を用いて試料3のマススペクトル31を得る際の試料3に起因する変動要因に起因する変動を加えて模擬データを生成する例について説明する。すなわち、マススペクトル32は、試料3の強度変化の割合に起因するマススペクトル31の変動の範囲内でデータ変動を加えることにより生成される。また、マススペクトル31およびマススペクトル32は、特許請求の範囲の「複数の分析結果データ」および「複数の模擬データ」の一例である。
第1実施形態では、特定の変動要因に起因する複数の分析結果データの変動を取得するステップと、取得した特定の変動要因に起因する複数の分析結果データの変動を加えることにより複数の模擬データを生成するステップとを備える。具体的には、模擬データであるマススペクトル32は、試料3の分析結果データであるマススペクトル31の強度変化の割合を取得し、取得した強度変化の割合をマススペクトル31に乗算することにより生成される。図3のグラフに示すように、質量電荷比が400以下の範囲では、強度比の値が1.0以下となっているので、生成したマススペクトル32の領域32aのスペクトルの検出強度は、マススペクトル31の領域31aの検出強度よりも小さくなっている。また、質量電荷比が400より大きい範囲では、強度比の値が1.0よりも大きくなっているので、生成したマススペクトル32の領域32bの検出強度が、マススペクトル31の領域31bの検出強度よりも大きくなっている。
第1実施形態では、図3のグラフ30に示した直線30aの割合の範囲内で変動を加えた複数の模擬データを生成し、機械学習を行う。
図5は、正解(がん)データおよび不正解(非がん)データそれぞれのデータ数が予め収集された分析結果データの3倍および5倍になるように模擬データを生成し、機械学習させて生成した判別基準23bを用いて試料3の判別を行った結果を示す表である。判別一致度および特異度は、データ量が増加するに伴い、精度が向上している。また、感度はデータ数を3倍から5倍に増加させた場合、若干精度が低下しているが、これは、判別一致度が向上したことにより、感度が真の値に近づいたためであると考えられる。ここで、3倍および5倍のデータ数とは、分析結果データと、模擬データとの合計数が分析結果データの3倍および5倍になるデータ数のことである。なお本明細書において、「感度」とは、たとえば、がん判別の場合、がんをがんであると判定した割合のことであり、「特異度」とは、非がんを非がんであると判定した割合のことである。
(第1実施形態の効果)
第1実施形態では、以下のような効果を得ることができる。
第1実施形態では、上記のように、分析データ解析装置100は、分析装置1のイオン検出器14よって検出された試料3のイオン強度に基づいて、データ処理部2のスペクトル作成部22がマススペクトル31を生成する。スペクトル作成部22で生成したマススペクトル31は、演算部24に送られる。演算部24は、記憶部23に記憶されている判別アルゴリズム23aおよび判別基準23bを用いて、入力されたマススペクトル31の判別を行うように構成されている。また、第1実施形態では、試料3の質量電荷比ごとの強度変化の割合をマススペクトル31に乗算することによりマススペクトル32を生成するステップを備える。これにより、判別に影響しない範囲で変動を加えた模擬データ(マススペクトル32)を生成することができる。その結果、機械学習に用いるデータを増加させることができるので、機械学習の精度を向上させることができる。
また、第1実施形態では、上記のように、識別に影響を与えない範囲は、分析装置1による計測に伴う特定の変動要因に対応する範囲である。これにより、分析装置1の計測に伴う変動要因に対応したデータを学習させることができるので、分析装置1の計測に伴う変動要因に起因する機械学習の精度の低下を抑制することができる。
また、第1実施形態では、上記のように、分析結果データは、分析装置1により得られるマススペクトル31であって、特定の変動要因は、分析装置1を用いてマススペクトル31を得る際に発生する、試料3に起因する変動要因である。これにより、マススペクトル31を得る際の試料3に起因する変動要因に対応したマススペクトル32を学習させることができるので、試料3に起因する変動要因に起因する機械学習の精度の低下を抑制することができる。
また、第1実施形態では、上記のように、マススペクトル32は、試料3の強度変化の割合に起因するマススペクトル31の変動の範囲内でデータ変動を加えることにより生成される。これにより、分析装置1による計測に伴う変動を加えて生成したマススペクトル32を用いて学習させることができる。その結果、分析装置1による計測に伴う複数の変動要因に起因する機械学習の精度の低下を抑制することができる。
また、第1実施形態では、上記のように、試料3の強度変化の割合に起因するマススペクトル31の変動を取得するステップと、取得した試料3の強度変化の割合に起因するマススペクトル31の変動を加えることによりマススペクトル32を生成するステップとを備える。これにより、計測に伴う試料3の強度変化の割合に対応したマススペクトル32を用いて学習させることができるとともに、計測に伴わないデータ変動によって学習させることを抑制することができる。その結果、過剰適合を抑制することが可能となるので、機械学習の精度が低下することを抑制することができる。
また、第1実施形態では、上記のように、模擬データを生成するステップにおいて、試料3によるマススペクトル31の強度変化の割合に応じて、マススペクトル31の強度値を変動させることによりマススペクトル32を生成する。これにより、試料3ごとに異なるマススペクトル31の強度変化の割合に対応したマススペクトル32を用いて学習させることができる。その結果、試料3ごとに異なるマススペクトル31の強度変化の割合に起因する機械学習の精度の低下を抑制することができる。
また、第1実施形態では、上記のように、試料3によるマススペクトル31の強度変化の割合は、試料3の質量の増加に伴い、略一定の割合で増加し、強度変化の割合をマススペクトル31の強度値に乗算することにより、マススペクトル32を生成する。これにより、試料3の質量に応じたマススペクトル31の強度変化の割合を反映したマススペクトル32を用いて学習させることができる。その結果、試料3の質量の値に応じたマススペクトル31の強度変化の割合に起因する機械学習の精度の低下を抑制することができる。
また、第1実施形態では、上記のように、分析装置としてのマススペクトルを生成する分析装置1によって計測されたマススペクトル31に対して、マススペクトル32を用いて機械学習を行う。これにより、得られたマススペクトル31に対して、分析装置1の計測に伴う変動を加えたマススペクトル32を生成し機械学習に用いることができる。その結果、分析装置1の計測に伴う特定要因に起因する機械学習の精度の低下を抑制することができる。
また、第1実施形態では、上記のように、分析結果データは、被検者から採取された生体試料3のマススペクトル31を含み、判別を行うステップにおいて、判別基準23bを用いて、試料3のマススペクトル31に対するがんの判別を行う。これにより、マススペクトル31のデータを機械学習によって判別することにより、がん判別を行うことができる。なお、生体試料3は、たとえば、被検者から採取した血液や尿である。
[第2実施形態]
次に、図1および図6を参照して、第2実施形態による分析データ解析装置200の構成について説明する。第2実施形態では、計測に伴う特定の変動要因のうち、試料3のマススペクトルのベースラインの変動に起因する変動を加えて模擬データを作成する例を説明する。
図6は、試料3のマススペクトル40およびマススペクトル40の測定時に生じるベースラインの変動に対応する変動を与えることにより生成したマススペクトル41である。マススペクトル40のベースラインの高さh1と比較して、マススペクトル41のベースラインの高さh2が小さくなっている。なお、マススペクトル40およびマススペクトル41は、特許請求の範囲の「複数の分析結果データ」および「複数の模擬データ」の一例である。
第2実施形態による分析データ解析装置200では、模擬データを生成するステップにおいて、試料3のマススペクトル31の強度変化の割合に対応したマススペクトル32を生成した第1実施形態とは異なり、試料3のマススペクトル40のベースラインの変動に対応した模擬データを生成する。なお、上記第1実施形態と同様の構成については、同じ符号を付してその説明を省略する。
図6に示すように、第2実施形態による分析データ解析装置200では、模擬データを生成するステップにおいて、試料3のマススペクトル40のベースラインに、マススペクトル40の測定時に生じるベースラインの変動に対応する変動を与えることによりマススペクトル41を生成する。そして、生成したマススペクトル41を用いて学習させ、判別基準23bを生成し、生成した判別基準23bを用いて判別を行う。第2実施形態では、試料3のマススペクトル40のベースラインの上昇または下降の範囲内において、マススペクトル40のベースラインを下降または上昇させることにより複数の模擬データを作成し、機械学習を行う。
また、第2実施形態による分析データ解析装置200のその他の構成は、第1実施形態による分析データ解析装置100と同様である。
(第2実施形態の効果)
第2実施形態では、以下のような効果を得ることができる。
第2実施形態では、上記のように、試料3のマススペクトル40のベースラインに、マススペクトル40測定時に生じるベースラインの変動に対応する変動を与えることによりマススペクトル41を生成する。これにより、測定環境の違いに対応したマススペクトル41を用いて学習させることができる。その結果、測定環境の違いに起因する機械学習の精度の低下を抑制することができる。
また、第2実施形態による分析データ解析装置200のその他の効果は、第1実施形態による分析データ解析装置100と同様である。
[第3実施形態]
次に、図1、図7および図8を参照して、第3実施形態による分析データ解析装置300の構成について説明する。第3実施形態では、計測に伴う特定の変動要因のうち、分析装置1の個体差データの差分に起因する変動を加えて模擬データを作成する例を説明する。
図7は、分析装置1の個体差データの差分を示すグラフ50である。横軸は質量電荷比であり、縦軸は検出強度比である。ここで、個体差データとは、分析装置1ごとに、質量電荷比に対する検出感度が少しずつ異なる個体差に相当する。共通の基準で感度の分布を求めたものが感度プロファイルであり、個体ごとの感度プロファイルの差分は、模擬データのもとになった分析結果データを別の分析装置1で測定した場合に発生するデータのバラつきである。図7の例では、質量電荷比が200以下では、強度比が1.0より小さく、200より大きい範囲では、強度比の値が1.0よりも大きくなっている。また、図8は、試料3のマススペクトル51およびマススペクトル51に分析装置1の検出感度の個体差データの差分を反映したマススペクトル52である。
図7のグラフに示すように、質量電荷比が200以下の範囲では、強度比の値が1.0以下となっているので、生成したマススペクトル52の領域52aのスペクトルの検出強度は、マススペクトル51の領域51aの検出強度よりも小さくなっている。また、質量電荷比が200より大きい範囲では、強度比の値が1.0よりも大きくなっているので、生成したマススペクトル52の領域52bの検出強度が、マススペクトル51の領域51bの検出強度よりも大きくなっている。なお、マススペクトル51およびマススペクトル52は、特許請求の範囲の「複数の分析結果データ」および「複数の模擬データ」の一例である。
第3実施形態による分析データ解析装置300では、模擬データを生成するステップにおいて、試料3のマススペクトル31の強度変化の割合に対応したマススペクトル32を生成する第1実施形態とは異なり、分析装置1の個体差データの差分を加えてマススペクトル52を生成する。なお、第3実施形態では、図7の検出強度比以下の範囲で分析結果データ(マススペクトル31)に変動を加えて複数の模擬データを作成し、機械学習を行う。また、上記第1実施形態と同様の構成については、同じ符号を付してその説明を省略する。
第3実施形態による分析データ解析装置300では、模擬データを生成するステップにおいて、試料3のマススペクトル51に、分析装置1の個体差データの差分(グラフ50)を加えて、マススペクトル52を生成する。そして、生成したマススペクトル52を用いて学習させ、判別基準23bを生成し、生成した判別基準23bを用いて判別を行う。
また、第3実施形態による分析データ解析装置300のその他の構成は、第1実施形態による分析データ解析装置100と同様である。
(第3実施形態の効果)
第3実施形態では、以下のような効果を得ることができる。
第3実施形態では、上記のように、試料3のマススペクトル51に、分析装置1の個体差データの差分を加えてマススペクトル52を生成し、生成したマススペクトル52を用いて学習を行い、得られた判別基準23bを用いて判別を行う。これにより、分析装置1間でのスペクトルの検出感度の誤差に対応したマススペクトル52を用いて学習させることができる。その結果、分析装置1間の検出感度の誤差による機械学習の精度の低下を抑制することができる。
また、第3実施形態による分析データ解析装置300のその他の効果は、第1実施形態による分析データ解析装置100と同様である。
[第4実施形態]
次に、図1および図9を参照して、第4実施形態による分析データ解析装置400の構成について説明する。第4実施形態では、計測に伴う特定の変動要因のうち、計測時に混入し得るランダムノイズ変動に起因する変動を加えて模擬データを作成する例を説明する。
図9(A)は、試料3のマススペクトル60であり、図9(B)は、マススペクトル60に対して、識別に影響を与えない範囲で乱数を加えたマススペクトル61である。乱数を加えたので、マススペクトル61には、全体的にピークが増えている。なお。本実施形態において、「識別に影響を与えない範囲」とは、実際にデータ収集を行う過程で生じる範囲に基づく標準試料の計測を繰り返し行うことによって得られる範囲のことである。また、本実施形態において、「乱数」とは、測定時に不可避的に混入することのあるランダムノイズによるデータ変動に対応する変動である。また、マススペクトル60およびマススペクトル61は、特許請求の範囲の「複数の分析結果データ」および「複数の模擬データ」の一例である。
第4実施形態による分析データ解析装置400では、模擬データを生成するステップにおいて、試料3のマススペクトル31の強度変化の割合に対応したマススペクトル32を生成する第1実施形態とは異なり、試料3のマススペクトル60に対して識別に影響を与えない範囲で乱数を加えることによりマススペクトル61を生成する。なお、上記第1実施形態と同様の構成については、同じ符号を付してその説明を省略する。
第4実施形態による分析データ解析装置400では、模擬データを生成するステップにおいて、マススペクトル60に対して識別に影響を与えない範囲で乱数を加えることによりマススペクトル61を生成する。そして、生成したマススペクトル61を学習に用いた結果生成される判別基準23bを用いて判別を行う。
また、第4実施形態による分析データ解析装置400のその他の構成は、第1実施形態による分析データ解析装置100と同様である。
(第4実施形態の効果)
第4実施形態では、以下のような効果を得ることができる。
第4実施形態では、上記のように、模擬データを生成するステップにおいて、マススペクトル60に対して識別に影響を与えない範囲で乱数を加えることによりマススペクトル61を生成する。これにより、ランダムノイズに対応したマススペクトル61を用いて学習させることができる。その結果、計測時にノイズが混入した場合に、機械学習の精度が低下することを抑制することができる。
また、第4実施形態による分析データ解析装置400のその他の効果は、第1実施形態による分析データ解析装置100と同様である。
[第5実施形態]
次に、図1および図10を参照して、第5実施形態による分析データ解析装置500の構成について説明する。第5実施形態では、計測に伴う特定の変動要因のうち、計測時に混入し得る不純物に起因する変動を加えて模擬データを作成する例を説明する。
図10(A)は、試料3のマススペクトル70であり、図10(B)は、マススペクトル70に不純物のピークを加えることにより生成したマススペクトル71である。なお、マススペクトル70およびマススペクトル71は、特許請求の範囲の「複数の分析結果データ」および「複数の模擬データ」の一例である。
第5実施形態による分析データ解析装置500では、模擬データを生成するステップにおいて、試料3のマススペクトル31の強度変化の割合に対応したマススペクトル32を生成する第1実施形態とは異なり、分析装置1による計測時に検出される不純物に応じて、マススペクトル70に不純物のピークを加えることにより模擬データを生成する。マススペクトル70の領域70aに見られなかった不純物のピークが、マススペクトル71の領域71aに確認することができる。なお、不純物としては、たとえば、試料3を取り扱う場合に作業者の手指に付着しているケラチンなどが考えられる。試料3に応じて混入する可能性のある不純物は異なるため、混入し得る不純物のデータを取得しておけばよい。また、上記第1実施形態と同様の構成については、同じ符号を付してその説明を省略する。
第5実施形態による分析データ解析装置500では、模擬データを生成するステップにおいて、分析装置1による計測時に検出される不純物に応じて、マススペクトル70に不純物のピークを加えることによりマススペクトル71を生成する。生成したマススペクトル71を学習に用いた結果生成される判別基準23bを用いて判別を行う。第5実施形態では、不純物のピークの高さを変えることにより、複数の模擬データを作成し、機械学習に用いる。
また、第5実施形態による分析データ解析装置500のその他の構成は、第1実施形態による分析データ解析装置100と同様である。
(第5実施形態の効果)
第5実施形態では、以下のような効果を得ることができる。
第5実施形態では、上記のように、分析装置1による計測時に検出される不純物に応じて、マススペクトル70に不純物のピークを加えることによりマススペクトル71を生成する。これにより、不純物の混入に対応したマススペクトル71を用いて学習させることができる。その結果、不純物が混入した際に機械学習の精度が低下することを抑制することができる。
[第6実施形態]
次に、図11を参照して、第6実施形態による分析データ解析装置600の構成について説明する。第6実施形態による分析データ解析装置600では、分析装置1で生成されたマススペクトル31を用いて判別を行う第1実施形態とは異なり、データ入力部7において、別の分析装置で生成された分析結果データ6を取得し、取得した分析結果データ6を用いて判別を行うように構成されている。
図11に示すように、第6実施形態による分析データ解析装置600は、別の分析装置で生成された分析結果データ6を取得するデータ入力部7と、分析結果データ6に識別に影響を与えない範囲でデータ変動を加えて生成された模擬データを用いた機械学習により生成された判別基準23bおよび機械学習の判別アルゴリズム23aが記憶された記憶部23と、判断基準23bを用いて取得された分析結果データ6の判別を行う演算部24とを備える。
第6実施形態による分析データ解析装置600は、ハードディスクやUSBメモリーといった外部保存媒体や、インターネットを介して入手した分析結果データの解析を行う。
(第6実施形態の効果)
第6実施形態では、以下のような効果を得ることができる。
第6実施形態では、上記のように、分析データ解析装置600は、分析結果データ6を取得するデータ入力部7と、分析結果データ6に識別に影響を与えない範囲でデータ変動を加えて生成された模擬データを用いた機械学習により生成された判別基準23bおよび機械学習の判別アルゴリズム23aが記憶された記憶部23と、判断基準23bを用いて取得された分析結果データ6の判別を行う演算部24とを備える。これにより、判別に影響しない範囲で変動を加えた複数の模擬データを生成することができる。その結果、機械学習に用いるデータを増加させることができるので、機械学習の精度を向上させることができる。
[変形例]
なお、今回開示された実施形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記した実施形態の説明ではなく特許請求の範囲によって示され、さらに特許請求の範囲と均等の意味および範囲内でのすべての変更(変形例)が含まれる。
たとえば、上記第1〜第5実施形態では、分析結果データとして、マススペクトルを得る例を示したが、本発明はこれに限られない。スペクトルでないデータを分析結果データとしてもよい。
また、上記第1〜5実施形態では、イオン化部10のイオン化方法として、MALDI法を用いる例を示したが、本発明はこれに限られない。たとえば、イオン化の方法として、ESI(エレクトロスプレー法)などを用いてもよい。
また、上記第1〜第5実施形態では、分析装置として、質量分析装置を備えるように構成する例を示したが、本発明はこれに限られない。本発明では、分析結果データとしてスペクトルを得ることができ、得られたスペクトルに対して検出に伴う変動が加わる分析装置であればよい。たとえば、FT−IR(フーリエ変換赤外分光光度計)を用いてもよく、クロマトグラフを用いてもよい。
また、上記第1〜第5実施形態では、それぞれ、計測に伴って発生する変動要因に対応する変動を加えた模擬データを作成して学習を行う例を示したが、本発明はこれに限られない。本発明では、第1〜第5実施形態で作成した模擬データを組み合わせて機械学習を行ってもよいし、すべての模擬データを用いて機械学習を行ってもよい。このように構成すれば、機械学習に用いるデータ数(データのパターン)を増加させることが可能になるので、機械学習の精度をより向上させることができる。
また、上記第1〜第6実施形態では、機械学習の手法として、SVM(サポートベクトルマシン)を用いて判別基準23bを生成する例を示したが、本発明はこれに限られない。たとえば、ニューラルネットワークを用いてもよく、アダブースト(AdaBoost)を用いてもよい。これら以外の機械学習でもよい。
また、上記第1実施形態では、がんの判別に用いる例を示したが、本発明はこれに限られない。たとえば、がん以外の疾病の判別に用いてもよい。
1 分析装置
6、31、40、51、60、70 分析結果データ
7 データ入力部
23 記憶部
23a 判別アルゴリズム
23b 判別基準
24 演算部
30 試料の質量による強度比(分析装置による計測の伴う特定の変動要因)
32、41、52、61、71 模擬データ
100、200、300、400、500、600 分析データ解析装置
上記目的を達成するために、この発明の第1の局面における分析データ解析方法は、分析装置によって計測された分析結果データの機械学習を用いた解析方法であって、複数の分析結果データに対し、識別に影響を与えない範囲でデータ変動を加えた複数の模擬データを生成するステップと、複数の分析結果データと、生成した複数の模擬データを用いて機械学習を行うステップと、機械学習により得られた判別基準を用いて判別を行うステップとを備える。なお、本発明において、「識別に影響を与えない範囲」とは、データ変動を加えた際に、判別の結果が逆転しない範囲のこととする。
この発明の第1の局面による分析データ解析方法では、上記のように識別に影響を与えない範囲でデータ変動を加えて複数の模擬データを生成するステップと、複数の分析結果データと、生成した複数の模擬データを用いて機械学習を行うステップと、機械学習により得られた判別基準を用いて判別を行うステップとを備えている。これにより、識別に影響しない範囲で変動を加えた複数の模擬データを生成することができる。その結果、機械学習に用いるデータを増加させることができるので、機械学習の精度を向上させることができる。
この発明の第2の局面による分析データ解析装置は、分析装置で得られる分析結果データを取得するデータ入力部と、分析結果データに識別に影響を与えない範囲でデータ変動を加えて生成された模擬データと、分析結果データとを用いて機械学習により生成された判別基準および機械学習の判別アルゴリズムが記憶された記憶部と、判別基準を用いて、判別アルゴリズムに従いデータ入力部により取得された分析結果データの判別を行う演算部とを備える。
この発明の第2の局面による分析データ解析装置では、上記のように、分析結果データを取得するデータ入力部と、分析結果データに識別に影響を与えない範囲でデータ変動を加えて生成された模擬データと、分析結果データとを用いた機械学習により生成された判別基準および機械学習の判別アルゴリズムが記憶された記憶部と、判断基準を用いて取得された分析結果データの判別を行う演算部とを備える。これにより、識別に影響しない範囲で変動を加えた複数の模擬データを生成することができる。その結果、機械学習に用いるデータを増加させることができるので、機械学習の精度を向上させることができる。

Claims (14)

  1. 分析装置によって計測された分析結果データの機械学習を用いた解析方法であって、
    複数の分析結果データに対し、識別に影響を与えない範囲でデータ変動を加えた複数の模擬データを生成するステップと、
    生成した前記複数の模擬データを用いて前記機械学習を行うステップと、
    前記機械学習により得られた判別基準を用いて判別を行うステップとを備える、分析データ解析方法。
  2. 前記識別に影響を与えない範囲は、分析装置による計測に伴う特定の変動要因に対応する範囲である、請求項1に記載の分析データ解析方法。
  3. 前記複数の分析結果データは、分析装置により得られるスペクトルであって、
    前記特定の変動要因は、前記分析装置を用いて前記スペクトルを得る際に発生する、前記分析装置または試料に起因する変動要因である、請求項2に記載の分析データ解析方法。
  4. 前記複数の模擬データは、前記特定の変動要因に起因する前記複数の分析結果データの変動の範囲内でデータ変動を加えることにより生成される、請求項2または3に記載の分析データ解析方法。
  5. 前記特定の変動要因に起因する前記複数の分析結果データの変動を取得するステップと、
    取得した前記特定の変動要因に起因する前記複数の分析結果データの変動を加えることにより前記複数の模擬データを生成するステップとを備える、請求項4に記載の分析データ解析方法。
  6. 前記複数の模擬データを生成するステップにおいて、前記試料による前記スペクトルの強度変化の割合に応じて、前記スペクトルの強度値を変動させることにより前記複数の模擬データを生成する、請求項3に記載の分析データ解析方法。
  7. 前記試料による前記スペクトルの強度変化の割合は、前記試料の質量または前記試料が吸収する波長の増加に伴い、略一定の割合で増加または減少し、前記強度変化の割合を前記スペクトルの強度値に乗算することにより、前記複数の模擬データを生成する、請求項3に記載の分析データ解析方法。
  8. 前記複数の模擬データを生成するステップにおいて、前記スペクトルのベースラインに、前記複数の分析結果データ測定時に生じる前記ベースラインの変動に対応する変動を与えることにより前記複数の模擬データを生成する、請求項3に記載の分析データ解析方法。
  9. 前記複数の模擬データを生成するステップにおいて、複数の分析装置の個体差データの差分を加えて前記複数の模擬データを生成する、請求項3に記載の分析データ解析方法。
  10. 前記複数の模擬データを生成するステップにおいて、前記複数の分析結果データに対して前記識別に影響を与えない範囲で乱数を加えることにより前記複数の模擬データを生成する、請求項3に記載の分析データ解析方法。
  11. 前記複数の模擬データを生成するステップにおいて、前記分析装置による計測時に検出される不純物に応じて、前記スペクトルに前記不純物のピークを加えることにより前記複数の模擬データを生成する、請求項3に記載の分析データ解析方法。
  12. 前記分析装置としてのマススペクトルを生成する質量分析装置によって計測された複数の分析結果データに対して、前記複数の模擬データを用いて前記機械学習を行う、請求項3に記載の分析データ解析方法。
  13. 前記複数の分析結果データは、被検者から採取された生体試料のマススペクトルを含み、前記判別を行うステップにおいて、前記判別基準を用いて、前記試料の前記複数の分析結果データに対するがんの判別を行う、請求項12に記載の分析データ解析方法。
  14. 分析装置で得られる分析結果データを取得するデータ入力部と、
    前記分析結果データに識別に影響を与えない範囲でデータ変動を加えて生成された模擬データを用いて機械学習により生成された判別基準および機械学習の判別アルゴリズムが記憶された記憶部と、
    前記判別基準を用いて、前記判別アルゴリズムに従い前記データ入力部により取得された分析結果データの判別を行う演算部とを備える、分析データ解析装置。
JP2018562813A 2017-01-19 2017-01-19 分析データ解析方法および分析データ解析装置 Active JP6813033B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/001793 WO2018134952A1 (ja) 2017-01-19 2017-01-19 分析データ解析方法および分析データ解析装置

Publications (2)

Publication Number Publication Date
JPWO2018134952A1 true JPWO2018134952A1 (ja) 2019-11-07
JP6813033B2 JP6813033B2 (ja) 2021-01-13

Family

ID=62909062

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018562813A Active JP6813033B2 (ja) 2017-01-19 2017-01-19 分析データ解析方法および分析データ解析装置

Country Status (5)

Country Link
US (1) US11423331B2 (ja)
EP (1) EP3572805A4 (ja)
JP (1) JP6813033B2 (ja)
CN (1) CN110214271B (ja)
WO (1) WO2018134952A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11651207B2 (en) 2018-06-28 2023-05-16 Applied Materials, Inc. Training spectrum generation for machine learning system for spectrographic monitoring
JP7304901B2 (ja) * 2018-09-04 2023-07-07 深▲セン▼先進技術研究院 不整脈検出方法、装置、電子装置およびコンピュータ記憶媒体
US20220128532A1 (en) * 2018-10-02 2022-04-28 Shimadzu Corporation Method for creating discriminator
CN113056672A (zh) * 2018-11-19 2021-06-29 佳能株式会社 信息处理装置、信息处理装置的控制方法、程序、计算装置和计算方法
JP6915005B2 (ja) * 2019-08-28 2021-08-04 日本電子株式会社 マススペクトル処理装置及びモデル生成方法
CN114631029A (zh) * 2019-11-01 2022-06-14 佳能株式会社 信息处理装置和信息处理装置的控制方法
WO2023053216A1 (ja) * 2021-09-28 2023-04-06 富士通株式会社 機械学習プログラム、機械学習方法および機械学習装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006313124A (ja) * 2005-05-09 2006-11-16 Denso Corp 液面検出装置
JP2011145179A (ja) * 2010-01-15 2011-07-28 Panasonic Corp 官能検査装置及び官能検査方法
JP5200246B2 (ja) * 2005-03-14 2013-06-05 財団法人ヒューマンサイエンス振興財団 膵臓癌診断用マーカータンパク質
JP2014044110A (ja) * 2012-08-27 2014-03-13 Shimadzu Corp 質量分析装置、及び該装置を用いた癌診断装置
WO2014085826A2 (en) * 2012-11-30 2014-06-05 Applied Proteomics, Inc. Method for evaluation of presence of or risk of colon tumors
JP2014521055A (ja) * 2011-07-04 2014-08-25 サーモ フィッシャー サイエンティフィック (ブレーメン) ゲーエムベーハー 試料の同定のための方法および装置
JP2014178229A (ja) * 2013-03-15 2014-09-25 Dainippon Screen Mfg Co Ltd 教師データ作成方法、画像分類方法および画像分類装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5559728A (en) * 1990-10-09 1996-09-24 University Of Washington Calibration transfer for second order analytical instruments
US8463718B2 (en) * 2000-08-07 2013-06-11 Health Discovery Corporation Support vector machine-based method for analysis of spectral data
CN1185477C (zh) 2002-11-22 2005-01-19 中国人民解放军第二军医大学 分析混合物的化学信息修饰法和按该法工作的光谱分析仪
CN100343655C (zh) * 2004-06-18 2007-10-17 中国科学院上海有机化学研究所 一种基于电荷耦合装置的在线自校正激光诱导荧光检测方法
US20070231916A1 (en) * 2006-03-29 2007-10-04 Cangen Biotechnologies, Inc. Apparatus and method for filtration to enhance the detection of peaks
CN101094031A (zh) * 2006-06-21 2007-12-26 株式会社Ntt都科摩 一种数据传输方法及装置
JP5103089B2 (ja) * 2006-10-13 2012-12-19 株式会社日立ハイテクノロジーズ 質量分析装置を用いた定量分析方法
WO2008094087A1 (en) * 2007-01-30 2008-08-07 Telefonaktiebolaget Lm Ericsson (Publ) Sbas correction information in ms based agps system
CN101141425A (zh) * 2007-07-04 2008-03-12 中兴通讯股份有限公司 基于时分导频段的移动通信系统的信道估计方法
CN101520421B (zh) * 2009-04-08 2011-06-22 北京农产品质量检测与农田环境监测技术研究中心 一种土壤重金属含量检测模型的建模方法及其应用
JP5375411B2 (ja) * 2009-07-29 2013-12-25 株式会社島津製作所 クロマトグラフ質量分析データ解析方法及び装置
JP5348029B2 (ja) * 2010-03-16 2013-11-20 株式会社島津製作所 質量分析データ処理方法及び装置
CN102175750A (zh) * 2011-02-25 2011-09-07 中国科学院上海有机化学研究所 生物体样品基质辅助激光解吸离子化-傅立叶变换离子回旋共振质谱分析方法
ITMI20110535A1 (it) * 2011-03-31 2012-10-01 Simone Cristoni Sistema di analisi per l'analisi chimica quantitativa di campioni, in particolare in ambito medico, con calibrazione della risposta strumentale della strumentazione utilizzata per rilevare i dati quantitativi degli analiti presenti nei campioni anali
JP2012220365A (ja) * 2011-04-11 2012-11-12 Shimadzu Corp 糖ペプチド解析方法及び解析装置
CN102252992B (zh) * 2011-04-28 2014-03-19 天津红日药业股份有限公司 一种对中药提取过程进行近红外在线检测方法
US8948487B2 (en) * 2011-09-28 2015-02-03 Siemens Aktiengesellschaft Non-rigid 2D/3D registration of coronary artery models with live fluoroscopy images
JP2013210207A (ja) * 2012-03-30 2013-10-10 Nec Corp レーダ画像の目標識別装置、目標識別方法、及び目標識別プログラム
GB2502604B (en) * 2012-05-31 2014-04-30 Broadcom Corp Determination of receiver path delay
US10535507B2 (en) * 2013-02-22 2020-01-14 Shimadzu Corporation Data processing device and data processing method
US20150170536A1 (en) * 2013-12-18 2015-06-18 William Marsh Rice University Time-Varying Learning and Content Analytics Via Sparse Factor Analysis
JP2016028229A (ja) 2014-07-08 2016-02-25 キヤノン株式会社 データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体
CN104572910A (zh) * 2014-12-26 2015-04-29 天津大学 一种基于向量模型的气相色谱质谱谱图检索方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5200246B2 (ja) * 2005-03-14 2013-06-05 財団法人ヒューマンサイエンス振興財団 膵臓癌診断用マーカータンパク質
JP2006313124A (ja) * 2005-05-09 2006-11-16 Denso Corp 液面検出装置
JP2011145179A (ja) * 2010-01-15 2011-07-28 Panasonic Corp 官能検査装置及び官能検査方法
JP2014521055A (ja) * 2011-07-04 2014-08-25 サーモ フィッシャー サイエンティフィック (ブレーメン) ゲーエムベーハー 試料の同定のための方法および装置
JP2014044110A (ja) * 2012-08-27 2014-03-13 Shimadzu Corp 質量分析装置、及び該装置を用いた癌診断装置
WO2014085826A2 (en) * 2012-11-30 2014-06-05 Applied Proteomics, Inc. Method for evaluation of presence of or risk of colon tumors
JP2014178229A (ja) * 2013-03-15 2014-09-25 Dainippon Screen Mfg Co Ltd 教師データ作成方法、画像分類方法および画像分類装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CONLIN, A.K. ET AL.: "Data augmentation: an alternative approach to the analysis of spectroscopic data", CHEMOMETRICS AND INTELLIGENT LABORATORY SYSTEMS, vol. 44, JPN6020042887, 1998, pages 161 - 173, XP004152691, ISSN: 0004385432, DOI: 10.1016/S0169-7439(98)00071-9 *
ISIDRO CORTES-CIRIANO ET AL.: "Improved Chemical Structure−Activity Modeling Through Data Augmentation", JOURNAL OF CHEMICAL INFORMATION AND MODELING, vol. 55, no. 12, JPN6020042893, 2015, pages 2682 - 2692, XP055721000, ISSN: 0004385434, DOI: 10.1021/acs.jcim.5b00570 *
SAIZ-ABAJO, M. J. ET AL.: "Ensemble methods and data augmentation by noise addition applied to the analysis of spectroscopic da", ANALYTICA CHIMICA ACTA, vol. 533, no. 2, JPN6020042890, 2005, pages 147 - 159, XP004807246, ISSN: 0004385433, DOI: 10.1016/j.aca.2004.10.086 *
川上 尚慶 NAOMICHI KAWAKAMI: "少量学習データによる参考文献書誌情報抽出精度の向上 Improvement in Accuracy for Bibliography Extract", 情報処理学会 論文誌(トランザクション) データベース(TOD) [電子情報通信学会データ工学研究専, vol. 第8巻, JPN6020023629, JP, ISSN: 0004300112 *

Also Published As

Publication number Publication date
CN110214271A (zh) 2019-09-06
US11423331B2 (en) 2022-08-23
US20200065699A1 (en) 2020-02-27
EP3572805A1 (en) 2019-11-27
WO2018134952A1 (ja) 2018-07-26
JP6813033B2 (ja) 2021-01-13
CN110214271B (zh) 2022-11-15
EP3572805A4 (en) 2020-09-16

Similar Documents

Publication Publication Date Title
JP6813033B2 (ja) 分析データ解析方法および分析データ解析装置
JP6760380B2 (ja) 分析データ処理方法及び分析データ処理装置
Sinkov et al. Cluster resolution: a metric for automated, objective and optimized feature selection in chemometric modeling
CN108982729A (zh) 用于提取质量迹线的系统和方法
US10957523B2 (en) 3D mass spectrometry predictive classification
JP5947567B2 (ja) 質量分析システム
US20210333251A1 (en) Methods, mediums, and systems to compare data within and between cohorts
JP2023159214A (ja) 波形解析方法及び波形解析装置
CN109964300B (zh) 用于实时同位素识别的系统和方法
WO2020044435A1 (ja) データ解析方法、データ解析装置、及びデータ解析用の学習モデル作成方法
JP6295910B2 (ja) 質量分析データ処理装置
JP7268530B2 (ja) 質量分析データ処理方法、質量分析データ処理システム、及び質量分析データ処理プログラム
JP2018009845A (ja) 質量分析方法
US20240087871A1 (en) Analysing a field of a mass spectrometer
JP6695087B2 (ja) 一組のガスに対応する一組の質量電荷比を求めるためのシステムおよび方法
US11990327B2 (en) Method, system and program for processing mass spectrometry data
US20230280316A1 (en) Learning data producing method, waveform analysis device, waveform analysis method, and recording medium
JP2023032197A (ja) スペクトル推定装置、スペクトル推定システム、コンピュータプログラム及びスペクトル推定方法
JP2024526079A (ja) 質量スペクトル中の分子種を同定するための方法及び装置
CN117461087A (zh) 用于鉴别质谱中的分子种类的方法和装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190522

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190522

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200707

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201130

R151 Written notification of patent or utility model registration

Ref document number: 6813033

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151