JP2016028229A - データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体 - Google Patents
データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体 Download PDFInfo
- Publication number
- JP2016028229A JP2016028229A JP2015093572A JP2015093572A JP2016028229A JP 2016028229 A JP2016028229 A JP 2016028229A JP 2015093572 A JP2015093572 A JP 2015093572A JP 2015093572 A JP2015093572 A JP 2015093572A JP 2016028229 A JP2016028229 A JP 2016028229A
- Authority
- JP
- Japan
- Prior art keywords
- data
- spectral
- spectrum
- machine learning
- components
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/27—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands using photo-electric detection ; circuits for computing concentration
- G01N21/274—Calibration, base line adjustment, drift correction
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/06—Illumination; Optics
- G01N2201/061—Sources
- G01N2201/06113—Coherent sources; lasers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1293—Using chemometrical methods resolving multicomponent spectra
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
- G01N2201/129—Using chemometrical methods
- G01N2201/1296—Using chemometrical methods using neural networks
Abstract
【課題】 識別精度を保持しつつ、識別器の生成に要する時間を短縮する。
【解決手段】 複数のスペクトル成分のそれぞれに対して強度値が格納されたスペクトルデータを処理するデータ処理装置1は、スペクトルデータの有する複数のスペクトル成分から、複数のスペクトルデータの間のマハラノビス距離またはスペクトル形状の違いに基づいて機械学習用スペクトル成分を選択するスペクトル成分選択部11と、選択部11で選択した複数の機械学習用スペクトル成分を用いて機械学習を行い、スペクトルデータを識別する識別器を生成する識別器生成部13と、を有する。
【選択図】 図1
【解決手段】 複数のスペクトル成分のそれぞれに対して強度値が格納されたスペクトルデータを処理するデータ処理装置1は、スペクトルデータの有する複数のスペクトル成分から、複数のスペクトルデータの間のマハラノビス距離またはスペクトル形状の違いに基づいて機械学習用スペクトル成分を選択するスペクトル成分選択部11と、選択部11で選択した複数の機械学習用スペクトル成分を用いて機械学習を行い、スペクトルデータを識別する識別器を生成する識別器生成部13と、を有する。
【選択図】 図1
Description
本発明は、スペクトルデータを処理するデータ処理装置、及びそれを有する試料情報取得システム、データ処理方法等に関する。
生体試料等の試料を観察対象として顕微鏡等で観察を行い、試料の構成成分の分布を可視化することが行われている。かかる可視化を行う方法として、例えば質量分析法やラマン分光法等の分光法を利用した質量イメージングや分光イメージングがある。これらの方法では、観察対象である試料中に複数の計測点を設定し、それぞれの計測点からスペクトルデータを取得する。このスペクトルデータを計測点ごとに分析してそれぞれのスペクトルデータを構成成分に帰属することで、試料の構成成分の分布情報を取得することができる。
スペクトルデータを分析し、スペクトルデータを試料中の構成成分に帰属するための方法の一例として、機械学習を用いる方法がある。「機械学習」とは、以前に取得されたデータを学習することで得られた識別器などの学習結果を基に、新たに取得したデータを解釈する手法である。
特許文献1には、予め機械学習により識別器を生成し、これを試料から取得したスペクトルデータに適用する技術が記載されている。なお、ここで言う「識別器」とは、以前に取得されたデータと、そのデータに対応する生体情報等との関係を学習することにより生成される判断基準情報である。
従来、機械学習を用いてスペクトルデータを分析する際には、スペクトルデータ中の全てのスペクトル成分を用いて処理を行っていた。しかし、スペクトルデータ1つあたりのスペクトル成分の数が多い場合や、分析の対象となるスペクトルデータの数が多い場合には、処理するデータ量が膨大となり、処理に要する時間が増大するという課題があった。
一方、スペクトル成分をランダムに選択してスペクトルデータごとにスペクトル成分を間引き、データ量を削減することで、処理を高速化することが可能である。しかし、スペクトル成分をランダムに選択すると、分析に必要な情報を欠落させてしまう可能性がある。その結果、機械学習によって生成される識別器の識別精度が低下してしまうという課題があった。
そこで本発明は上述の課題に鑑み、識別精度を保持しつつ、識別器の生成に要する時間を短縮することを目的とする。
本発明に係るデータ処理装置は、複数のスペクトル成分のそれぞれに対して強度値が格納されたスペクトルデータを処理するデータ処理装置であって、前記スペクトルデータの有する複数の前記スペクトル成分から、複数の前記スペクトルデータの間のマハラノビス距離またはスペクトル形状の違いに基づいて機械学習用スペクトル成分を複数選択するスペクトル成分選択部と、前記スペクトル成分選択部が選択した複数の前記機械学習用スペクトル成分を用いて機械学習を行い、スペクトルデータを識別する識別器を生成する識別器生成部と、を有することを特徴とする。
本発明の一側面としてのデータ処理装置によれば、識別精度を保持しつつ、識別器の生成に要する時間を短縮することができる。
以下、本発明を実施するための形態について、図面を参照しながら具体的に説明する。なお、以下で説明する具体例は本発明に係る最良の実施形態の一例ではあるが、本発明はこれらの具体例に限定されるものではない。
(構成)
まず、本実施形態に係るデータ処理装置1(以下、「処理装置1」と称する)の構成について図1を用いて説明する。図1は、本実施形態に係る処理装置1を含む試料情報取得システムの構成を示すブロック図である。
まず、本実施形態に係るデータ処理装置1(以下、「処理装置1」と称する)の構成について図1を用いて説明する。図1は、本実施形態に係る処理装置1を含む試料情報取得システムの構成を示すブロック図である。
本実施形態に係る試料情報取得システム100(以下、「システム100」と称する)は、処理装置1と、計測装置2と、表示部3と、外部記憶部4とを有する。処理装置1と、計測装置2と、表示部3と、外部記憶部4と、は部分的に又は全体的にネットワークを介して接続されていても良い。なお、ネットワークはLAN(Local Area Network)及びインターネットを含む。
計測装置2は、計測部21と、制御部22と、を有する。計測部21は、制御部22によって制御され、不図示の試料からスペクトルを計測しスペクトルデータを取得する部分である。
スペクトルデータは、複数のスペクトル成分のそれぞれに対して、該スペクトル成分の強度値(「スペクトル強度」と称する)が格納されたデータであれば、特に限定はされない。スペクトルデータとしては、例えば、試料に対して刺激を与えた際に生じる応答について、その応答強度(スペクトル強度に対応する)を計測パラメータ(スペクトル成分に対応する)に対して格納したデータを用いることができる。ここで言う「刺激」とは、電磁波や音、電磁場、温度、湿度を含む。
スペクトルデータとしては、具体的には、紫外又は可視又は赤外域の分光スペクトルデータ、ラマン分光スペクトルデータ、NMRスペクトルデータ、質量スペクトルデータ、液体クロマトグラム、ガスクロマトグラム、音の周波数スペクトルデータ等が挙げられる。ラマン分光スペクトルデータとしては、自発ラマン散乱分光スペクトルデータ、非線形ラマン散乱分光スペクトルデータを含む。非線形ラマン散乱分光としては、誘導ラマン散乱(Stimulated Raman Scattering:SRS)分光、コヒーレントアンチストークスラマン散乱(Coherent Anti−stokes Raman Scattering:CARS)分光、コヒーレントストークスラマン散乱(Coherent Stokes Raman Scattering:CSRS)分光を含む。スペクトルデータは、紫外又は可視又は赤外域の分光スペクトルデータ、ラマン分光スペクトルデータ、質量スペクトルデータのいずれか1つを含むことが好ましい。
スペクトルデータが紫外又は可視又は赤外域の分光スペクトルデータ、ラマン分光スペクトルデータである場合には、スペクトル成分は波長や波数とすることができる。また、スペクトルデータが質量スペクトルデータである場合には、スペクトル成分は質量電荷比や質量数とすることができる。
スペクトルデータは、試料中に含まれる複数の構成成分に対応する群のいずれかに属する。スペクトル成分およびスペクトル強度は、スペクトルデータを取得した計測領域に含まれる、試料中の構成成分のそれぞれに応じて異なる。そのため、スペクトルデータを解析することで、スペクトルデータが属する群を識別し、それぞれのスペクトルデータを各構成成分に帰属することができる。
表示部3は、処理装置1の処理結果を表示する部分である。表示部3としては、例えばフラットパネルディスプレイなどの画像表示装置を用いることができる。表示部3は、処理装置1から送信される画像データ等を表示することができる。
外部記憶部4は、各種データを記憶する装置である。外部記憶部4には、計測装置2によって取得したスペクトルデータや、後述する識別器生成部13によって生成した識別器等の各種データ、等を記憶することができる。あるいは、処理装置1による処理結果を記憶しても良い。
外部記憶部4に記憶した各種データは、必要に応じて読み出し、表示部3に表示することができる。また、処理装置1は外部記憶部4に記憶した識別器やスペクトルデータを用いて処理を行っても良い。あるいは、他の装置で計測し生成されたスペクトルデータを外部記憶部4にあらかじめ記憶しておき、処理装置1でそれらのスペクトルデータの処理を行っても良い。
処理装置1は、機械学習を用いてスペクトルデータを処理する装置である。処理装置1は、スペクトル成分選択部11と、データセット取得部12と、識別器生成部13と、内部記憶部14と、識別部15と、を有する。
スペクトル成分選択部11(以下、「選択部11」と称する)は、スペクトルデータの有する複数のスペクトル成分から、後述する識別器生成部13における機械学習に用いる機械学習用スペクトル成分を複数選択する部分である。
データセット取得部12(以下、「取得部12」と称する)は、選択部11が選択した機械学習用スペクトル成分からなる機械学習用スペクトルデータを複数取得する部分である。以下、複数の機械学習用スペクトルデータを含むデータセットを、機械学習用データセットと称する。後述するように、取得部12は、外部記憶部4または内部記憶部14に記憶された複数のスペクトルデータからそれぞれ機械学習用スペクトル成分を抽出することで、機械学習用データセットを取得することができる。あるいは、計測装置2を用いて選択部11が選択した機械学習用スペクトル成分についての計測を行うことで、機械学習用スペクトルデータを取得しても良い。
機械学習用スペクトルデータは、元のスペクトルデータに比べてデータ量が小さい。すなわち、元のスペクトルデータ中のスペクトル成分の総数をN、選択部11が選択した機械学習用スペクトル成分の数をMとすると、スペクトルデータ1つあたりのデータ量をM/N倍に縮小することができる。そのため、後述する識別器生成部13における機械学習の処理を高速に行うことができるようになり、識別器を生成するのに要する時間を短縮することができる。
識別器生成部13(以下、「生成部13」と称する)は、取得部12によって取得された機械学習用データセットを用いて機械学習を行い、スペクトルデータを識別する識別器を生成する部分である。すなわち、生成部13は識別器選択部11が選択した複数の機械学習用スペクトル成分を用いて機械学習を行い、スペクトルデータを識別する識別器を生成する。
なお、本実施形態では取得部12は機械学習用データセットに含まれる各機械学習用スペクトルデータが属する構成成分に関する情報(いわゆるラベル情報)を併せて取得することが好ましい。そして生成部13はラベル情報付き機械学習用データセットを用いて機械学習を行う。すなわち生成部13は、教師あり機械学習を行って識別器を生成する。
内部記憶部14は、計測装置2で取得したスペクトルデータや、選択部11、取得部12、生成部13、識別部15で生成された各種データを記憶する部分である。
識別部15は、生成部13が生成した識別器を用いて、計測装置2または外部記憶部4又は内部記憶部14から取得した、未識別の新たなスペクトルデータの識別を行う部分である。識別部15は、識別器を用いてスペクトルデータの識別を行い、スペクトルデータを試料における各構成成分に帰属することができる。
(動作)
次に、本実施形態に係る処理装置1を含む試料情報取得システムの動作方法について、図2から図7を用いて説明する。
次に、本実施形態に係る処理装置1を含む試料情報取得システムの動作方法について、図2から図7を用いて説明する。
図2は、本実施形態に係る処理装置1の動作を表すフローチャートである。以下、このフローチャートの順に、適宜他の図面を参照しながら説明する。
本実施形態では、まず、処理装置1が複数のスペクトルデータからなるデータセットを計測装置2または外部記憶部4から取得する(S201)。
スペクトルデータを取得する空間が2次元平面(XY平面)であれば、処理装置1が取得するデータセットは、XY平面上の各画素にスペクトルデータがそれぞれ格納されたデータとなる。すなわち、スペクトルデータを取得した計測点の2次元平面内における位置情報(X、Y)に基づく画素のそれぞれに、スペクトルデータのスペクトル成分とその強度(A、B)が格納された、(X、Y、A、B)で表現される4次元のデータとなる。
本実施形態に係る処理装置1を用いて処理するデータセットの次元は、特に限定はされない。上述したようなデータセットだけでなく、例えば3次元空間内でスペクトルデータを取得して得られたデータセットを処理することもできる。すなわち処理装置1が処理するデータセットは、3次元空間内での位置情報(X、Y、Z)に基づく画素のそれぞれに、スペクトルデータ(A、B)が格納された、(X、Y、Z、A、B)で表現される5次元のデータセットであっても良い。
なお、以下においては、説明の簡略化のため2次元平面内でスペクトルを計測して取得した4次元のデータセットの処理について詳細に説明するが、Z方向の情報を加えた5次元のデータセットの処理についても同様に実施することができる。
次に、処理装置1は取得したデータセットの規格化およびデジタル化を行う(S202)。なお、規格化およびデジタル化の処理は、既知の処理方法を用いて行うことができる。
スペクトルデータとしてラマン分光スペクトルデータ等の分光スペクトルデータを用いた場合、スペクトルデータは図3(b)のように連続的なスペクトルデータとなることが多い。この場合は、該スペクトルデータを離散化し、図3(c)のように離散化したスペクトルデータを用いると良い。なお、このようにスペクトルデータを等間隔あるいは不等間隔で抽出し、離散化したスペクトルデータを得ることを「サンプリング」と呼ぶ。
一方、スペクトルデータとして例えば質量分析法による質量スペクトルデータ等の、図3(a)に示すような離散的なスペクトルデータを用いる場合には、そのスペクトルデータをそのまま用いても良い。図3(a)に示すような離散的なスペクトルデータを用いる場合であっても、スペクトルデータに対してさらにサンプリングを施しても良い。
なお、サンプリングを行う場合は、スペクトルデータのスペクトル形状の変化率に基づいたサンプリング間隔でサンプリングを行うことが好ましい。すなわち、図4に示すように、スペクトル形状の変化率の大きな部分では密に、変化率の小さな部分では疎に、サンプリング間隔を決定することが好ましい。
このようにスペクトル形状の変化率に応じてサンプリング間隔を決定してサンプリングを行うことで、スペクトルデータの形状をある程度保持したまま、スペクトルデータのスペクトル成分の数を削減し、離散化することができる。なお、ここでいうスペクトル形状とは、スペクトル強度をスペクトル成分の関数として表現したときのグラフ形状である。したがって、スペクトル形状の変化率は、この関数をスペクトル成分で二階微分することで得られる二次導関数によって定量的に扱うことができる。
なお、それぞれの構成成分に対応するスペクトル形状の変化率が大きく異なる場合は、それぞれの構成成分に対応するスペクトル形状の変化率をそれぞれ計算してもよい。そして、それぞれのスペクトルデータについて変化率の大きさに応じてスペクトル成分をそれぞれ選択し、それらを併合することでサンプリング間隔を決定してもよい。
[機械学習用スペクトル成分を選択する工程]
次に、選択部11は取得したデータセットを元に、生成部13における機械学習で用いる機械学習用スペクトル成分の選択を行う(S2031)。本工程において選択した機械学習用スペクトル成分を用いて識別器を生成することで、識別器生成に要する時間を短縮することができる。ただし、機械学習用スペクトル成分をランダムに選択すると、識別器生成に要する時間は短縮できるものの、生成される識別器の識別精度が低下してしまう。
次に、選択部11は取得したデータセットを元に、生成部13における機械学習で用いる機械学習用スペクトル成分の選択を行う(S2031)。本工程において選択した機械学習用スペクトル成分を用いて識別器を生成することで、識別器生成に要する時間を短縮することができる。ただし、機械学習用スペクトル成分をランダムに選択すると、識別器生成に要する時間は短縮できるものの、生成される識別器の識別精度が低下してしまう。
そこで本実施形態に係るスペクトル成分選択工程においては、(1)マハラノビス距離を利用する方法、(2)スペクトル形状の違いを利用する方法によって機械学習用スペクトル成分を選択する。以下、それぞれの方法について説明する。
(1)マハラノビス距離を利用する方法
マハラノビス距離は、試料中の各構成成分に対応する群に属する複数のスペクトルデータを、スペクトル成分ごとに特徴空間に射影したときの、それぞれの群における群間分散と群内分散との比(群間分散/群内分散)として定義される。
マハラノビス距離は、試料中の各構成成分に対応する群に属する複数のスペクトルデータを、スペクトル成分ごとに特徴空間に射影したときの、それぞれの群における群間分散と群内分散との比(群間分散/群内分散)として定義される。
群内分散は図5(b)のように、複数の群のそれぞれについて、群内での分散を計算することで取得することができる。なおこのとき、各群に含まれる複数のスペクトルデータのそれぞれについて、スペクトル強度を射影軸としてスペクトル成分ごとに射影を行って群内分散を計算する。一方群間分散は図5(a)のように、上記の射影を行った結果について、複数の群のそれぞれについて重心を求め、群と群の間で重心間の距離を計算することで取得することができる。
群間分散が大きいほど、群と群との間の距離が大きくなるため、それぞれの群同士を明確に区別することができる。また、群内分散が小さいほど、群と群との間の重なりが小さくなるため、それぞれの群同士を明確に区別することができる。すなわち、(群間分散/群内分散)で定義されるマハラノビス距離が大きいスペクトル成分ほど、機械学習を行う際に各スペクトルデータを効率よく分離し識別することができる。したがって、マハラノビス距離が大きいスペクトル成分を選択して機械学習を行うことで、識別精度を保持しつつ従来よりも高速に識別器を生成することができる。
マハラノビス距離に基づいて機械学習用スペクトル成分を選択する方法としては、図6(a)に示すように、マハラノビス距離の大きさの順にスペクトル成分を選択する方法がある。これにより、効率的に識別できると推測されるスペクトル成分を選択することができる。なお、識別を行いたい群が3つ以上存在し、その中から2つ群を選択した際の異なる組み合わせにおいてマハラノビス距離の大きなスペクトル成分が異なる場合もある。その場合には、それぞれの組み合わせの群間において、マハラノビス距離の大きさの順に任意の数だけスペクトル成分をそれぞれ選択し、それらを併合することで、機械学習用スペクトル成分の選択を行っても良い。
あるいは、機械学習用スペクトル成分を選択する際には図6(b)に示すように、マハラノビス距離の大きな部分では密に、マハラノビス距離の小さな部分では疎に、スペクトル成分全体から選択しても良い。マハラノビス距離の小さいスペクトル成分の中にも識別に有効なスペクトル成分が存在する可能性もある。そのためこの方法によれば、マハラノビス距離の大きさの順にスペクトル成分を選択した場合よりさらに、機械学習による識別精度を向上させることができる可能性がある。その結果、識別精度のより高い識別器を生成することができる可能性がある。
機械学習用スペクトル成分を選択する際にマハラノビス距離を利用する方法は、各群のスペクトルデータのスペクトル形状が類似している場合であっても、各スペクトルデータを効率よく分離し識別できるスペクトル成分を選択することができる。例えば生体試料から取得される分光スペクトルデータの場合には、構成成分ごとにスペクトル形状が類似したスペクトルデータが取得される場合がある。このような場合にはマハラノビス距離に基づいて機械学習用スペクトル成分を選択することが好ましい。また、マハラノビス距離を利用して機械学習スペクトル成分を選択する方法は、各群のスペクトルデータのスペクトル形状が異なる場合であっても使用することができる。
(2)スペクトル形状の違いを利用する方法
各群のスペクトルデータのスペクトル形状が大きく異なる場合には、スペクトル形状の違いに基づいて機械学習用スペクトル成分を選択することもできる。例えば、複数の群において、特定の群についてのみスペクトル強度が大きなスペクトル成分がある場合、そのスペクトル成分は該特定の群に対応する試料中の構成成分に特有な物質等に由来するスペクトル成分であることがある。このようなスペクトル成分を機械学習用スペクトル成分として選択すると、識別精度を保持しつつ従来よりも高速に識別器を生成することができる。すなわち、スペクトル形状の違いの大きなスペクトル成分を機械学習用スペクトル成分として選択することで、機械学習による識別に有効なスペクトル成分を選択することができる。
各群のスペクトルデータのスペクトル形状が大きく異なる場合には、スペクトル形状の違いに基づいて機械学習用スペクトル成分を選択することもできる。例えば、複数の群において、特定の群についてのみスペクトル強度が大きなスペクトル成分がある場合、そのスペクトル成分は該特定の群に対応する試料中の構成成分に特有な物質等に由来するスペクトル成分であることがある。このようなスペクトル成分を機械学習用スペクトル成分として選択すると、識別精度を保持しつつ従来よりも高速に識別器を生成することができる。すなわち、スペクトル形状の違いの大きなスペクトル成分を機械学習用スペクトル成分として選択することで、機械学習による識別に有効なスペクトル成分を選択することができる。
なお、機械学習用スペクトル成分を選択する際には、マハラノビス距離を利用する方法とスペクトル形状の違いを利用する方法とを併用してもよい。また、本工程(S2031)においては、外部記憶部4や内部記憶部14に予め記憶した特定のスペクトル成分を選択部11が読み出して、機械学習用スペクトル成分として選択しても良い。すなわち、機械学習によって識別を行いたい試料中の構成成分や組織ごとに、適切な機械学習用スペクトル成分を予め決定して蓄積しておき、適宜それを読み出して用いることで、より高速に機械学習用スペクトル成分を選択することができる。
[機械学習用データセットを取得する工程]
次に取得部12は、ステップS2031で選択した機械学習用スペクトル成分からなる機械学習用スペクトルデータを複数含む機械学習用データセットを取得する。
次に取得部12は、ステップS2031で選択した機械学習用スペクトル成分からなる機械学習用スペクトルデータを複数含む機械学習用データセットを取得する。
このとき、既に取得されているデータセット中の各スペクトルデータから機械学習用スペクトル成分のみをそれぞれ抽出して機械学習用スペクトルデータを生成することで、機械学習用データセットを取得してもよい(S2032)。
あるいは、ステップS2031で選択した機械学習用スペクトル成分に基づいて、計測装置2で改めて計測を行って機械学習用スペクトルデータを複数取得し、機械学習用データセットを取得してもよい(S2033)。すなわち、選択した機械学習用スペクトル成分のみについて計測装置2で計測を行うことで、新規に機械学習用スペクトルデータの取得を行ってもよい。
図7は、事前に計測したデータセットに基づいて機械学習用スペクトル成分を選択し、選択した機械学習用スペクトル成分について計測を行うことによって新たに機械学習用データセットを取得する工程を模式的に表す図である。
図7(a)〜(c)の場合、まず、計測装置2によって全てのスペクトル成分について、全領域における計測を行い、データセットを取得する(図7(a))。次に、取得したデータセットに含まれるスペクトルデータを元に、選択部12が機械学習用スペクトル成分を選択する(図7(b))。そして、取得部13は選択した機械学習用スペクトル成分のみについて、全領域における新たな計測を計測装置2によって行い、機械学習用データセットを取得する(図7(c))。
一方、図7(d)〜(f)の場合、まず、計測装置2によって全てのスペクトル成分について、一部領域における計測を行い、データセットを取得する(図7(d))。次に、取得したデータセットに含まれるスペクトルデータを元に、選択部12が機械学習用スペクトル成分を選択する(図7(e))。そして、取得部13は選択した機械学習用スペクトル成分のみについて、全領域における新たな計測を計測装置2によって行い、機械学習用データセットを取得する(図7(f))。このように事前の計測を一部領域のみに限定しておいて行うことによって、計測に要する時間を削減することができる。
なお、機械学習用データセットを用いて機械学習を行う前に、機械学習用データセットに対して平均化処理を施してもよい。該平均化処理は、スペクトル成分ごとに行うことが好ましい。スペクトル成分の平均化の際には、識別対象となる群ごとの群内分散の大きさに応じて、群ごとにそれぞれ各スペクトル成分の平均化処理を行うことが好ましい。
例えば図12に示す様に、群内分散の大きなスペクトル成分1では、スペクトル成分2の場合よりも、隣接するスペクトル成分との平均をより広い範囲でとることによって、再計算されたスペクトル成分の群内分散を小さくすることができる。なお、図12においては、灰色で示した部分が平均化処理を行う範囲である。一般に平均化処理はスペクトル成分の分解能の低下を伴う。そのため、群内分散の小さなスペクトル成分についても広い範囲で平均化処理を施すことは好ましくない。そこでこの様に、例えば群内分散の大きさに比例して平均化処理を行う範囲を広げることによって、不必要な分解能の低下を抑えることができる。この結果、識別対象群間のマハラノビス距離を大きくすることができ(図13(c))、識別精度を向上させることができる。
なお、平均化処理の際には群内分散の大きなスペクトル成分を選択して、選択したスペクトル成分のスペクトル強度を、それぞれの群ごとに平均化しても良い。たとえば図13(b)のように、スペクトル成分1について群内分散が大きい場合にはスペクトル成分1についてスペクトル強度を平均化することで、図13(c)のように群間の分離および識別を容易にすることができる。
[識別器を生成する工程]
次に生成部13は、S2032またはS2033で取得した機械学習用データセットを用いて機械学習を行い、識別器を生成する(S2041)。本実施形態に係る機械学習は教師あり機械学習であることが好ましい。具体的には、Fisherの線形判別法や、SVM(Support Vector Machine)、決定木学習、またはそのアンサンブル平均を考えたランダムフォレスト法等を利用できる。なお、本実施形態に係る機械学習はこれらに限定されるものではなく、教師つき機械学習であってもよいし、半教師つき機械学習であってもよい。
次に生成部13は、S2032またはS2033で取得した機械学習用データセットを用いて機械学習を行い、識別器を生成する(S2041)。本実施形態に係る機械学習は教師あり機械学習であることが好ましい。具体的には、Fisherの線形判別法や、SVM(Support Vector Machine)、決定木学習、またはそのアンサンブル平均を考えたランダムフォレスト法等を利用できる。なお、本実施形態に係る機械学習はこれらに限定されるものではなく、教師つき機械学習であってもよいし、半教師つき機械学習であってもよい。
本工程においては、機械学習用データセット中のスペクトル成分やスペクトル強度(これを「特徴量」と称する)を多次元空間(これを「特徴空間」と称する)に射影し、前述の各種機械学習手法により判断基準情報である識別器を生成する。
このとき、生成部13は機械学習用データセットを用いた計算処理を行うことで、識別器の生成を行う。そのため、生成部13が処理する機械学習用データセットのデータ量が大きいと、識別器の生成に時間がかかる。例えば、Fisherの線形判別法を行う場合には、機械学習用スペクトルデータの数と、それぞれの機械学習用スペクトルデータの有する機械学習用スペクトル成分の数との積のサイズを有する標本分散共分散行列の演算を行う必要がある。そのため、機械学習スペクトルデータの数または機械学習用スペクトル成分の数が大きいと、識別器の生成に膨大な時間がかかってしまう。
一方、本実施形態に係る処理装置1は、選択部11によって機械学習用スペクトル成分を選択し、生成部13によってその機械学習用スペクトル成分を用いて識別器を生成する。そのため、機械学習用スペクトル成分を減らすことができ、生成部13における演算量を大幅に削減することができる。これにより、識別器の生成に要する時間を短縮することができる。また、本実施形態に係る選択部11は上述のように機械学習スペクトル成分を選択することで、生成部13における機械学習の識別精度を保持しつつ、識別器の生成に要する時間を短縮することができる。
[スペクトルデータを識別する工程]
次に識別部15は、生成部13が生成した識別器を用いてスペクトルデータの識別を行う。識別部15はスペクトルデータを識別し、それぞれのスペクトルデータを試料中の構成成分に帰属する。
次に識別部15は、生成部13が生成した識別器を用いてスペクトルデータの識別を行う。識別部15はスペクトルデータを識別し、それぞれのスペクトルデータを試料中の構成成分に帰属する。
識別を行うスペクトルデータは、計測装置2で計測を行い新たに取得したスペクトルデータであってもよいし、外部記憶部4または内部記憶部14に記憶された、事前に取得済みのスペクトルデータであってもよい。また、識別を行うスペクトルデータの有するスペクトル成分は特に限定はされないが、選択部11が選択した機械学習用スペクトル成分からなるスペクトルデータであることが好ましい。
識別を行うスペクトルデータを、選択部11が選択した機械学習用スペクトル成分からなるスペクトルデータとすることで、本工程でスペクトルデータを識別するのに要する時間を短縮することができる。すなわち、本実施形態によれば識別器の生成に要する時間を短縮することに加えて、その識別器を用いて識別を行う際の識別処理に要する時間を短縮することもできる。また本実施形態によれば、識別を行うスペクトルデータを計測する場合には機械学習用スペクトル成分についてのみ計測を行えば良いので、計測に要する時間も短縮することができる。
識別部15による識別結果の形態は特に限定はされない。例えば処理装置1が、画素ごとにスペクトルデータがそれぞれ格納された画像データを処理する場合は、識別部15は画素ごとに格納されたスペクトルデータのそれぞれを、各構成成分に帰属し、各スペクトルデータにラベルデータを付加する。そして識別部15は、そのラベルデータに基づいて、各スペクトルデータの格納された画素を色分けして表示する二次元画像データまたは三次元画像データを生成してもよい。生成した二次元画像データまたは三次元画像データは、表示部3で画像表示してもよい。以上の工程により、試料の構成成分の分布を可視化することができる。
(その他の実施形態)
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
以上、本発明の好ましい実施形態について説明したが、本発明はこれらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
本発明は例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。本実施形態では本発明を、処理装置1と、計測装置2と、表示部3と、を備える試料情報取得システムに適用した。しかし本発明は、他の複数の機器の組み合わせから構成されるシステムに適用しても良いし、一つの機器からなる装置に適用しても良い。例えば、本発明は処理装置1と、処理装置1の処理結果を表示する表示部3とを備えるデータ表示システムに適用しても良い。
また、本発明を適用する複数の機器の組み合わせから構成されるシステムにおいては、それぞれの機器は部分的又は全体的に、インターネットを含むネットワークで接続されていても良い。例えば、取得したデータをネットワークに接続されたサーバに送信し、サーバ上で本発明の処理を行い、得られた結果をサーバから受信して画像表示等を行う構成としても良い。
また、本発明はソフトウェアのプログラムをシステム或いは装置に直接或いは遠隔から供給し、そのシステム或いは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによって前述した実施形態の機能が達成される場合を含む。この場合、供給されるプログラムは実施形態で図に示したフローチャートに対応したコンピュータプログラムである。従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。
つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含む。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OS(Operating System)に供給するスクリプトデータ等の形態であっても良い。
コンピュータプログラムを供給するためのコンピュータ読み取り可能な記憶媒体は、例えば、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ等でも良い。また、不揮発性のメモリカード、ROM、DVD(DVD−ROM、DVD−R)等でも良い。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムをハードディスク等の記憶媒体にダウンロードすることが挙げられる。この場合、ダウンロードされるプログラムは、圧縮され自動インストール機能を含むファイルであっても良い。また、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
(実施例1)
以下、本発明を適用した実施例1について説明する。以下の実施例においては、誘導ラマン散乱を用いた顕微鏡を用いてマウスの肝臓組織の計測を行った。光源として用いたTiSレーザーのパワーは111mW、Ybファイバーレーザーの強度は対物レンズに入射する前で127mWであった。試料のマウスの肝臓組織は、ホルマリン固定を行い、100マイクロメートルの厚さに薄切化したものを用いた。この組織切片をガラス中にPBSバッファーとともに包埋した状態で計測を行った。計測範囲は160マイクロメートル四方とした。また、計測の際の波数範囲は2800cm−1〜3100cm−1とし、該波数範囲を91段階に等分するようにして計測を行った。計測は10回行い、取得した計測データは積算した。計測に要した時間は30秒であった。
以下、本発明を適用した実施例1について説明する。以下の実施例においては、誘導ラマン散乱を用いた顕微鏡を用いてマウスの肝臓組織の計測を行った。光源として用いたTiSレーザーのパワーは111mW、Ybファイバーレーザーの強度は対物レンズに入射する前で127mWであった。試料のマウスの肝臓組織は、ホルマリン固定を行い、100マイクロメートルの厚さに薄切化したものを用いた。この組織切片をガラス中にPBSバッファーとともに包埋した状態で計測を行った。計測範囲は160マイクロメートル四方とした。また、計測の際の波数範囲は2800cm−1〜3100cm−1とし、該波数範囲を91段階に等分するようにして計測を行った。計測は10回行い、取得した計測データは積算した。計測に要した時間は30秒であった。
取得した分光画像データは500ピクセル四方の画像データとなった。なお、取得した分光画像データには、計測画素ごとに、該計測画素の位置情報であるXY座標情報(X、Y)と、該計測画素におけるスペクトルデータ(A、B)と、が格納されている。
図8(a)は、計測を行った全スペクトル成分について得られたスペクトルデータの信号を合算して画像化したものである。図8(b)は、試料中の細胞核、細胞質、赤血球に対応する部分のスペクトルデータをピックアップしてグラフ化したものである。なお、横軸は波数に対応し、縦軸はスペクトル強度に対応している。なお、図8(b)における横軸の数値は波数を区別するためのインデックスであり、以下ではこのインデックスを参照する。図8(b)に示すように、組織ごとに少しずつ異なるスペクトルデータが得られていることがわかった。
図9(a)は、細胞核(群1)と細胞質(群2)との間のマハラノビス距離を、波数ごとに算出したものである。図9(a)から、インデックス7およびインデックス8において、マハラノビス距離が大きくなっていることがわかった。図9(b)は、インデックス7およびインデックス8に対応するスペクトル成分を特徴量として、学習データの一部を2次元の特徴空間にプロットした図である。図9(b)から、群1と群2とを、明確に区別できていることがわかる。
図9(c)は、細胞質(群2)と赤血球(群3)との間のマハラノビス距離を、波数ごとに算出したものである。図9(c)から、インデックス15〜インデックス17において、マハラノビス距離が大きくなっていることがわかった。図9(d)は、インデックス15およびインデックス16に対応するスペクトル成分を特徴量として、学習データの一部を2次元の特徴空間にプロットしたものである。図9(d)から、図9(b)よりも群2と群3とを明確に区別できていることがわかった。しかし一方で、群1と群2については図9(b)より区別しにくくなっていることがわかった。
この様な場合には、それぞれの群間の組み合わせごとに識別に適したスペクトル成分を全て利用し、それらを特徴空間に射影することで複数の成分間の識別を明確に行なうことができる。例えば、それぞれの群間ごとにマハラノビス距離の大きさの順にスペクトル成分を選択し、選択したスペクトル成分を合わせて、機械学習用スペクトル成分として利用すれば良い。たとえば、群1と群2を明確に識別できるインデックス7および8と、群2と群3とを明確に識別できるインデックス15および16と、を含むようにインデックスを選択しても良い。そしてそれぞれのインデックスに対応するスペクトル成分を特徴量とし、多次元の特徴空間に射影し、各群の識別を行えば良い。
図10(a)は、各群間のマハラノビス距離が大きなインデックスに対応するスペクトル成分の強度を2次元の特徴空間にプロットしたものである。ここでは、インデックス7とインデックス15に対応するスペクトル成分を選択した。一方、図10(b)は、各群間のスペクトル強度の差が大きなインデックスに対応するスペクトル成分の強度を2次元の特徴空間にプロットしたものである。ここでは、インデックス10とインデックス11に対応するスペクトル成分を選択した。
図10(a)と図10(b)とを比較すると、マハラノビス距離が大きなスペクトル成分を選択した方が、特徴空間において各群同士を明確に分離できることがわかる。すなわち、マハラノビス距離の大きさに基づいてスペクトル成分を選択することで、より少ないスペクトル成分で、識別精度の高い機械学習が可能となる。
次に、スペクトル成分を選択した上で機械学習によって組織を識別し、画像データの再構成を行った。なお、機械学習の手法としてはFisherの線形判別法を用いた。また、細胞核(群1)は黒色、細胞質(群2)は灰色、赤血球(群3)は白色として色分けして画像データを再構成した。
図11(a)は、本実施例における画像再構成結果であり、前述したそれぞれの群間ごとにマハラノビス距離の大きさの順にスペクトル成分を選択した場合の画像再構成結果である。なお、ここではそれぞれの群間ごとにスペクトル成分を5個ずつ、合計10個選択し、細胞核と細胞質と赤血球の識別を行った。
また、図11(b)は、比較例における画像再構成結果であり、全てのスペクトル成分の中からランダムにスペクトル成分を選択した場合の画像再構成結果である。なお、比較例では全てのスペクトル成分(90個)の中から10個のスペクトル成分をランダムに選択した。また、スペクトル成分の選択方法以外については、実施例1と同様に処理を行った。
全てのスペクトル成分を用いて機械学習を行ったところ、処理に要する時間は9秒程度であった。しかし、それらのスペクトル成分の中から10個のスペクトル成分のみを選択し、機械学習に用いるスペクトルデータ群のデータ量を削減することで、処理に要する時間を約1秒程度に短縮することができた。このように、スペクトル成分を選択して機械学習に用いるスペクトルデータ群のデータ量を削減することで、識別器の生成に要する時間および識別処理に要する時間を短縮することができた。
図11(a)、図11(b)のどちらも、各組織を概ね識別できていることがわかる。しかし図11(a)と図11(b)とを比較すると、図11(a)の方が、すなわちマハラノビス距離に基づいてスペクトル成分を選択した場合の方が、各組織をより明確に識別し、色分けできていることがわかった。
したがって、マハラノビス距離の大きさに基づいてスペクトル成分を選択し、機械学習に用いるスペクトルデータ群のデータ量を削減することで、識別精度を保持しつつ高速に機械学習を行うことができることがわかった。
また、このようにして選択した10個のスペクトル成分を用いて、別の計測領域または別の試料を計測し、試料中の組織や成分の識別を行うこともできる。この場合、選択した10個のスペクトル成分についてのみ計測を行うことで、30秒を要していた計測時間を、約3秒程度に短縮することができた。このように、あらかじめ選択したスペクトル成分のみを計測することで計測を高速化することができた。
(実施例2)
以下、本発明の実施例2について説明する。以下の実施例においては、計測装置、計測条件は、実施例1の場合と同様である。
以下、本発明の実施例2について説明する。以下の実施例においては、計測装置、計測条件は、実施例1の場合と同様である。
図13は、図10(a)のデータのうち、インデックス15に対応するスペクトル成分に対して、隣接するスペクトル成分との平均化処理を施すことによって再計算されたデータを、図10(a)と同様にプロットしたものである。図13と図10(a)とを比較すると、本実施例によれば群1と群2の横軸方向の群内分散を縮小できたことがわかった。
図14(a)に、本実施例による画像再構成結果の一部を拡大して示す。本実施例においては、インデックス7とインデックス15に対応するスペクトル成分の2個を用いて、細胞核と細胞質と赤血球の識別を行った。参考として、図14(b)に、実施例1における画像再構成結果を拡大して示す。図14(a)と図14(b)を比較すると、本実施例の方が、例えば画像の中央部の細胞核の輪郭をみればわかる様に、各識別対象の輪郭がはっきりした再構成画像が得られることがわかる。すなわち本実施例によれば、平均化処理によって識別精度のさらに高い識別器を生成することができた。
1 データ処理装置
11 スペクトル成分選択部
13 識別器生成部
11 スペクトル成分選択部
13 識別器生成部
Claims (19)
- 複数のスペクトル成分のそれぞれに対して強度値が格納されたスペクトルデータを処理するデータ処理装置であって、
前記スペクトルデータの有する複数の前記スペクトル成分から、複数の前記スペクトルデータの間のマハラノビス距離またはスペクトル形状の違いに基づいて機械学習用スペクトル成分を複数選択するスペクトル成分選択部と、
前記スペクトル成分選択部が選択した複数の前記機械学習用スペクトル成分を用いて機械学習を行い、スペクトルデータを識別する識別器を生成する識別器生成部と、を有することを特徴とするデータ処理装置。 - 前記スペクトル成分選択部が、前記マハラノビス距離の大きさの順に前記機械学習用スペクトル成分を複数選択することを特徴とする請求項1に記載のデータ処理装置。
- 前記スペクトル成分選択部が、前記識別器が識別する前記成分間の複数の組み合わせについて、前記マハラノビス距離の大きさの順に前記機械学習用スペクトル成分をそれぞれ選択することを特徴とする請求項1または請求項2に記載のデータ処理装置。
- 前記スペクトル成分選択部が、前記マハラノビス距離の大きな部分では密に、前記マハラノビス距離の小さな部分では疎に、前記機械学習用スペクトル成分を複数選択することを特徴とする請求項1乃至請求項3のいずれか一項に記載のデータ処理装置。
- 前記スペクトル成分選択部が、前記スペクトル形状の違いの大きな部分では密に、前記スペクトル形状の違いの小さな部分では疎に、前記機械学習用スペクトル成分を複数選択することを特徴とする請求項1乃至請求項4のいずれか一項に記載のデータ処理装置。
- 前記スペクトルデータが、画素ごとにスペクトルデータが格納された画像データであることを特徴とする請求項1乃至請求項5のいずれか一項に記載のデータ処理装置。
- 前記識別器生成部が、複数の前記機械学習用スペクトル成分のそれぞれについて、複数の前記スペクトルデータにおける群内分散の大きさに応じて前記強度値の平均化処理を行い、前記機械学習を行うことを特徴とする請求項1乃至6のいずれか一項に記載のデータ処理装置。
- 前記スペクトルデータが、紫外または可視または赤外域の分光スペクトルデータ、ラマン分光スペクトルデータ、質量スペクトルデータのいずれか1つを含むスペクトルデータであることを特徴とする請求項1乃至請求項7のいずれか一項に記載のデータ処理装置。
- 前記スペクトル成分が、波数または質量電荷比であることを特徴とする請求項1乃至請求項8のいずれか一項に記載のデータ処理装置。
- 前記識別器生成部が生成した前記識別器を用いて、スペクトルデータを識別する識別部をさらに有することを特徴とする請求項1乃至請求項9のいずれか一項に記載のデータ処理装置。
- 前記識別部による識別結果に基づいて、それぞれの前記スペクトルデータが格納された前記画素を区別して表示する二次元画像データを生成することを特徴とする請求項1乃至請求項10のいずれか一項に記載のデータ処理装置。
- 請求項1乃至請求項11のいずれか一項に記載のデータ処理装置と、
前記データ処理装置の処理結果を表示する表示部と、
を有することを特徴とするデータ表示システム。 - 前記表示部が、前記識別部による識別結果に応じて、前記成分を識別して表示することを特徴とする請求項12に記載のデータ表示システム。
- 請求項1乃至請求項11のいずれか一項に記載のデータ処理装置と、
試料から前記スペクトルデータを計測するための計測部と、
を有する試料情報取得システム。 - 前記計測部が、前記スペクトル成分選択部が選択した前記機械学習用スペクトル成分に基づいてスペクトルデータを計測することを特徴とする請求項14に記載の試料情報取得システム。
- 複数のスペクトル成分のそれぞれに対して強度値が格納されたスペクトルデータを処理するデータ処理方法であって、
前記スペクトルデータの有する複数の前記スペクトル成分から、複数の前記スペクトルデータの間のマハラノビス距離またはスペクトル形状の違いに基づいて機械学習用スペクトル成分を複数選択するスペクトル成分選択工程と、
前記スペクトル成分選択工程で選択した複数の前記機械学習用スペクトル成分を用いて機械学習を行い、スペクトルデータを識別する識別器を生成する識別器生成工程と、
を有することを特徴とするデータ処理方法。 - 前記識別器生成工程で生成した前記識別器を用いて、スペクトルデータを識別する識別工程をさらに有することを特徴とする請求項16に記載のデータ処理方法。
- コンピュータに、
複数のスペクトル成分のそれぞれに対して強度値が格納されたスペクトルデータの有する複数の前記スペクトル成分から、複数の前記スペクトルデータの間のマハラノビス距離またはスペクトル形状の違いに基づいて機械学習用スペクトル成分を複数選択するスペクトル成分選択工程と、
前記スペクトル成分選択工程で選択した複数の前記機械学習用スペクトル成分を用いて機械学習を行い、スペクトルデータを識別する識別器を生成する識別器生成工程と、
を実行させるためのプログラム。 - コンピュータに、
複数のスペクトル成分のそれぞれに対して強度値が格納されたスペクトルデータの有する複数の前記スペクトル成分から、複数の前記スペクトルデータの間のマハラノビス距離またはスペクトル形状の違いに基づいて機械学習用スペクトル成分を複数選択するスペクトル成分選択工程と、
前記スペクトル成分選択工程で選択した複数の前記機械学習用スペクトル成分を用いて機械学習を行い、スペクトルデータを識別する識別器を生成する識別器生成工程と、
を実行させるためのプログラムを記憶したコンピュータ読み取り可能な記憶媒体。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015093572A JP2016028229A (ja) | 2014-07-08 | 2015-04-30 | データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体 |
EP15819263.3A EP3167275A4 (en) | 2014-07-08 | 2015-06-30 | Data processing apparatus, data display system including the same, sample information obtaining system including the same, data processing method, program, and storage medium |
PCT/JP2015/003295 WO2016006203A1 (en) | 2014-07-08 | 2015-06-30 | Data processing apparatus, data display system including the same, sample information obtaining system including the same, data processing method, program, and storage medium |
US15/322,693 US20170140299A1 (en) | 2014-07-08 | 2015-06-30 | Data processing apparatus, data display system including the same, sample information obtaining system including the same, data processing method, program, and storage medium |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014140908 | 2014-07-08 | ||
JP2014140908 | 2014-07-08 | ||
JP2015093572A JP2016028229A (ja) | 2014-07-08 | 2015-04-30 | データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019162440A Division JP2019219419A (ja) | 2014-07-08 | 2019-09-05 | 試料情報取得システム、及びそれを有するデータ表示システム、試料情報取得方法、プログラム、記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016028229A true JP2016028229A (ja) | 2016-02-25 |
Family
ID=55063856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015093572A Pending JP2016028229A (ja) | 2014-07-08 | 2015-04-30 | データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20170140299A1 (ja) |
EP (1) | EP3167275A4 (ja) |
JP (1) | JP2016028229A (ja) |
WO (1) | WO2016006203A1 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018077059A (ja) * | 2016-11-07 | 2018-05-17 | 株式会社日立製作所 | 光学装置、光学測定方法 |
WO2018134952A1 (ja) | 2017-01-19 | 2018-07-26 | 株式会社島津製作所 | 分析データ解析方法および分析データ解析装置 |
JP2018155522A (ja) * | 2017-03-16 | 2018-10-04 | 株式会社島津製作所 | データ解析装置 |
WO2018198586A1 (ja) * | 2017-04-24 | 2018-11-01 | ソニー株式会社 | 情報処理装置、微粒子分取システム、プログラム及び微粒子分取方法 |
JP2020165666A (ja) * | 2019-03-28 | 2020-10-08 | セイコーエプソン株式会社 | 分光検査方法および分光検査装置 |
WO2021064924A1 (ja) * | 2019-10-02 | 2021-04-08 | 株式会社島津製作所 | 波形解析方法及び波形解析装置 |
JP2021520264A (ja) * | 2018-04-11 | 2021-08-19 | ザ ユニバーシティ オブ リバプールThe University Of Liverpool | 分光分析方法 |
JP7362337B2 (ja) | 2019-07-30 | 2023-10-17 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102016011348A1 (de) * | 2016-09-16 | 2018-03-22 | Technische Universität Dresden | Verfahren zur Klassifizierung von Spektren von Objekten mit komplexem Informationsgehalt |
EP3737940B1 (en) | 2018-01-09 | 2024-04-03 | Atonarp Inc. | System and method for optimizing peak shapes |
CN109115692B (zh) * | 2018-07-04 | 2021-06-25 | 北京格致同德科技有限公司 | 一种光谱数据分析方法及装置 |
WO2020070786A1 (ja) * | 2018-10-02 | 2020-04-09 | 株式会社島津製作所 | 識別器の生成方法 |
JP7124648B2 (ja) * | 2018-11-06 | 2022-08-24 | 株式会社島津製作所 | データ処理装置及びデータ処理プログラム |
US11237111B2 (en) * | 2020-01-30 | 2022-02-01 | Trustees Of Boston University | High-speed delay scanning and deep learning techniques for spectroscopic SRS imaging |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11508689A (ja) * | 1995-07-06 | 1999-07-27 | ディーエスエム エヌ.ブイ. | 手持ち赤外分光器を用いてリサイクル可能なカーペットを同定する方法 |
WO2003044498A1 (fr) * | 2001-11-22 | 2003-05-30 | Japan Science And Technology Corporation | Procede de mesure de concentrations de substances chimiques, procede de mesure de concentrations d'especes ioniques, et capteur utilise a cet effet |
JP2007024697A (ja) * | 2005-07-15 | 2007-02-01 | Omron Corp | 知識作成装置および知識作成方法 |
JP2007531883A (ja) * | 2004-03-31 | 2007-11-08 | ザ・ジョンズ・ホプキンス・ユニバーシティ | 卵巣がんのためのバイオマーカー |
JP2008108250A (ja) * | 2007-10-12 | 2008-05-08 | Tokyu Car Corp | 移動体の異常検出システム、及び移動体の異常検出方法 |
JP2011203239A (ja) * | 2010-03-05 | 2011-10-13 | Shimadzu Corp | 質量分析データ処理方法及び装置 |
JP2012181561A (ja) * | 2012-06-27 | 2012-09-20 | Toshiba Corp | 信号処理装置 |
JP2013257282A (ja) * | 2012-06-14 | 2013-12-26 | Canon Inc | 画像処理方法および装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY107650A (en) * | 1990-10-12 | 1996-05-30 | Exxon Res & Engineering Company | Method of estimating property and / or composition data of a test sample |
US6411838B1 (en) * | 1998-12-23 | 2002-06-25 | Medispectra, Inc. | Systems and methods for optical examination of samples |
US20050228295A1 (en) * | 2004-04-01 | 2005-10-13 | Infraredx, Inc. | Method and system for dual domain discrimination of vulnerable plaque |
US20060281068A1 (en) * | 2005-06-09 | 2006-12-14 | Chemimage Corp. | Cytological methods for detecting a disease condition such as malignancy by Raman spectroscopic imaging |
-
2015
- 2015-04-30 JP JP2015093572A patent/JP2016028229A/ja active Pending
- 2015-06-30 WO PCT/JP2015/003295 patent/WO2016006203A1/en active Application Filing
- 2015-06-30 EP EP15819263.3A patent/EP3167275A4/en not_active Withdrawn
- 2015-06-30 US US15/322,693 patent/US20170140299A1/en not_active Abandoned
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11508689A (ja) * | 1995-07-06 | 1999-07-27 | ディーエスエム エヌ.ブイ. | 手持ち赤外分光器を用いてリサイクル可能なカーペットを同定する方法 |
WO2003044498A1 (fr) * | 2001-11-22 | 2003-05-30 | Japan Science And Technology Corporation | Procede de mesure de concentrations de substances chimiques, procede de mesure de concentrations d'especes ioniques, et capteur utilise a cet effet |
JP2007531883A (ja) * | 2004-03-31 | 2007-11-08 | ザ・ジョンズ・ホプキンス・ユニバーシティ | 卵巣がんのためのバイオマーカー |
JP2007024697A (ja) * | 2005-07-15 | 2007-02-01 | Omron Corp | 知識作成装置および知識作成方法 |
JP2008108250A (ja) * | 2007-10-12 | 2008-05-08 | Tokyu Car Corp | 移動体の異常検出システム、及び移動体の異常検出方法 |
JP2011203239A (ja) * | 2010-03-05 | 2011-10-13 | Shimadzu Corp | 質量分析データ処理方法及び装置 |
JP2013257282A (ja) * | 2012-06-14 | 2013-12-26 | Canon Inc | 画像処理方法および装置 |
JP2012181561A (ja) * | 2012-06-27 | 2012-09-20 | Toshiba Corp | 信号処理装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018077059A (ja) * | 2016-11-07 | 2018-05-17 | 株式会社日立製作所 | 光学装置、光学測定方法 |
WO2018134952A1 (ja) | 2017-01-19 | 2018-07-26 | 株式会社島津製作所 | 分析データ解析方法および分析データ解析装置 |
US11423331B2 (en) | 2017-01-19 | 2022-08-23 | Shimadzu Corporation | Analytical data analysis method and analytical data analyzer |
JP2018155522A (ja) * | 2017-03-16 | 2018-10-04 | 株式会社島津製作所 | データ解析装置 |
CN110691964A (zh) * | 2017-04-24 | 2020-01-14 | 索尼公司 | 信息处理设备、粒子分选系统、程序和粒子分选方法 |
JPWO2018198586A1 (ja) * | 2017-04-24 | 2020-02-27 | ソニー株式会社 | 情報処理装置、微粒子分取システム、プログラム及び微粒子分取方法 |
US11137338B2 (en) | 2017-04-24 | 2021-10-05 | Sony Corporation | Information processing apparatus, particle sorting system, program, and particle sorting method |
WO2018198586A1 (ja) * | 2017-04-24 | 2018-11-01 | ソニー株式会社 | 情報処理装置、微粒子分取システム、プログラム及び微粒子分取方法 |
CN110691964B (zh) * | 2017-04-24 | 2023-08-22 | 索尼公司 | 信息处理设备、粒子分选系统、程序和粒子分选方法 |
JP2021520264A (ja) * | 2018-04-11 | 2021-08-19 | ザ ユニバーシティ オブ リバプールThe University Of Liverpool | 分光分析方法 |
US11340157B2 (en) | 2018-04-11 | 2022-05-24 | The University Of Liverpool | Methods of spectroscopic analysis |
JP7241425B2 (ja) | 2018-04-11 | 2023-03-17 | ザ ユニバーシティ オブ リバプール | 分光分析方法 |
JP2020165666A (ja) * | 2019-03-28 | 2020-10-08 | セイコーエプソン株式会社 | 分光検査方法および分光検査装置 |
JP7362337B2 (ja) | 2019-07-30 | 2023-10-17 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
WO2021064924A1 (ja) * | 2019-10-02 | 2021-04-08 | 株式会社島津製作所 | 波形解析方法及び波形解析装置 |
JPWO2021064924A1 (ja) * | 2019-10-02 | 2021-04-08 | ||
JP7334788B2 (ja) | 2019-10-02 | 2023-08-29 | 株式会社島津製作所 | 波形解析方法及び波形解析装置 |
Also Published As
Publication number | Publication date |
---|---|
EP3167275A4 (en) | 2018-03-21 |
US20170140299A1 (en) | 2017-05-18 |
WO2016006203A1 (en) | 2016-01-14 |
EP3167275A1 (en) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2016028229A (ja) | データ処理装置、及びそれを有するデータ表示システム、試料情報取得システム、データ処理方法、プログラム、記憶媒体 | |
JP6063447B2 (ja) | 細胞におけるバイオマーカーの発現のクラスターによる解析 | |
US20200134822A1 (en) | Reconstruction method of biological tissue image, apparatus therefor, and image display apparatus using the biological tissue image | |
US9501687B2 (en) | Predictive modeling relating molecular imaging modalities | |
JP6144915B2 (ja) | 生体組織画像の再構成方法、取得方法及び装置 | |
US10565474B2 (en) | Data processing apparatus, data display system, sample data obtaining system, method for processing data, and computer-readable storage medium | |
JP6144916B2 (ja) | 生体組織画像のノイズ低減処理方法及び装置 | |
JP6676743B2 (ja) | 分光画像データ処理装置および2次元分光装置 | |
CN112129741A (zh) | 绝缘油老化分析方法、装置、计算机设备和存储介质 | |
Archer et al. | Quantifying differences in hominin flaking technologies with 3D shape analysis | |
US10184885B2 (en) | Information processing device to process spectral information, and information processing method | |
JP2019219419A (ja) | 試料情報取得システム、及びそれを有するデータ表示システム、試料情報取得方法、プログラム、記憶媒体 | |
CN112771510A (zh) | 信息处理设备、信息处理方法和程序 | |
Xiang et al. | Multivariate analysis of Brillouin imaging data by supervised and unsupervised learning | |
JP2014038044A (ja) | 分光スペクトル解析方法 | |
WO2018042752A1 (ja) | 信号分析装置、信号分析方法、コンピュータプログラム、測定装置及び測定方法 | |
JP2019200211A (ja) | データ処理装置、データ表示システム、試料データ取得システム、及びデータ処理方法 | |
US9696203B2 (en) | Spectral data processing apparatus, spectral data processing method, and recording medium | |
JP2015007621A (ja) | データの処理方法及び装置 | |
US20230410488A1 (en) | Predictor creation device and predictor creation method | |
WO2015128946A1 (ja) | 分光スペクトル解析方法 | |
JP2023092883A (ja) | スペクトル解析方法、装置およびシステム | |
Sevost’yanov et al. | Analysis of Ageing of Synthetic Filaments by Methods of Computer Simulation | |
CN117043585A (zh) | 用于化合物的基于拉曼光谱的鉴定的方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190208 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190611 |