JP2019039773A - 機械学習を用いた未知化合物の分類方法 - Google Patents

機械学習を用いた未知化合物の分類方法 Download PDF

Info

Publication number
JP2019039773A
JP2019039773A JP2017161341A JP2017161341A JP2019039773A JP 2019039773 A JP2019039773 A JP 2019039773A JP 2017161341 A JP2017161341 A JP 2017161341A JP 2017161341 A JP2017161341 A JP 2017161341A JP 2019039773 A JP2019039773 A JP 2019039773A
Authority
JP
Japan
Prior art keywords
spectrum
unknown
compound
spectra
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017161341A
Other languages
English (en)
Other versions
JP6438549B1 (ja
Inventor
広介 水野
Kosuke Mizuno
広介 水野
美幸 菅野
Miyuki Sugano
美幸 菅野
浩司 永森
Koji Nagamori
浩司 永森
赤尾 賢一
Kenichi Akao
賢一 赤尾
央 真砂
Hiroshi Masago
央 真砂
利之 名越
Toshiyuki Nagoshi
利之 名越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jasco Corp
Original Assignee
Jasco Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jasco Corp filed Critical Jasco Corp
Priority to JP2017161341A priority Critical patent/JP6438549B1/ja
Priority to CN201880054678.4A priority patent/CN111033230A/zh
Priority to JP2019528587A priority patent/JP6863625B2/ja
Priority to US16/640,757 priority patent/US11913877B2/en
Priority to PCT/JP2018/030028 priority patent/WO2019039313A1/ja
Application granted granted Critical
Publication of JP6438549B1 publication Critical patent/JP6438549B1/ja
Publication of JP2019039773A publication Critical patent/JP2019039773A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/62Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
    • G01N21/63Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
    • G01N21/65Raman scattering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/06Illumination; Optics
    • G01N2201/063Illuminating optical parts
    • G01N2201/0636Reflectors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/06Illumination; Optics
    • G01N2201/064Stray light conditioning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2201/00Features of devices classified in G01N21/00
    • G01N2201/12Circuits of general importance; Signal processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

【課題】機械学習を利用した未知スペクトルの分類方法であって、単独のニューラルネットワーク(NN)を用いても適切に分類でき、かつ、実用的な化合物グループへの分類が可能な方法を提供すること。
【解決手段】この分類方法は、(1)経験則に従って、複数の化合物グループを設定するとともに、化合物グループの各々に属する複数の既知化合物のスペクトルデータを既知スペクトルとして準備するステップと、(2)コンピュータ装置上のNNが、前記ステップで準備された既知スペクトルおよび化合物グループの情報を読み取って、同一の化合物グループに属する複数の既知スペクトルに共通する特徴を学習するステップと、(3)学習済みのNNが、未知化合物のスペクトルデータを未知スペクトルとして読み取って、共通する特徴の有無に基づいて、未知スペクトルが属する化合物グループを回答するステップと、を備える。
【選択図】 図1

Description

本発明は、ニューラルネットワークの機械学習を用いて、未知化合物のスペクトルデータを、実用的な化合物のグループに分類する方法、つまり、機械学習を用いた未知化合物の分類方法に関する。
ニューラルネットワーク(NNと略すこともある)の機械学習を利用したスペクトル解析の研究が過去に行われている。例えば、特許文献1の「赤外スペクトル同定方法」は、ニューラルネットワーク(NN)の機械学習を利用して未知化合物を同定する方法であり、まず、NNに既知化合物のスペクトルデータを大量に機械学習させるステップがあり、次に、学習済みNNに未知化合物のスペクトルを読み取らせてその化合物名を回答させるステップがある。
特許文献1の図2が示すように、複数のNNが、初段NN、中段NNおよび終段NNと順々に分岐した各階層に配置され、全体として多層構造の複合NNを構成し、各NNが個々に機械学習する。初段NNは、既知化合物のスペクトルから無作為に10個の代表を選択し、10個の既知スペクトルが各々異なるカテゴリーに属することを学習する。そして、学習済みの初段NNによって、残りの既知スペクトルがカテゴリーに分類される。さらに、初段NNは、分類された既知スペクトルについても追加的に学習する。つまり、初段NNは、全ての既知スペクトルを学習するとともに、これらの既知スペクトルをカテゴリーに分類する。結果、各カテゴリーには類似した既知スペクトルが集合する。
初段NNにおけるカテゴリーの設定は、既知スペクトルから「無作為に」選択された10個の代表に基づくものであり、特許文献1で設定されるカテゴリーに特定の意味はない。
初段NNでいずれかのカテゴリーに分類された既知スペクトルの集合は、そのカテゴリーに応じた中段NNに読み取られる。中段NNは、初段NNと同様、読み取った既知スペクトルから無作為に10個の代表を選択し、10個の既知スペクトルが各々異なるカテゴリーに属することを学習する。学習済みの中段NNは、残りの既知スペクトルをカテゴリーに分類するとともに、分類された既知スペクトルについても追加的に学習する。結果、中段NNでは、初段NNよりも細かい10個のカテゴリーに、類似した既知スペクトルが集合する。中段NNでカテゴリーに分類された既知スペクトルは、そのカテゴリーに応じた次段のNNに読み取られ、同様に処理される。
最下層にある終段NNは、上層で分類された既知スペクトルを読み取って、既知スペクトルを1つ1つ化合物ごとに識別することを学習する。
学習を終えた複合NNは、未知化合物を次の手順で同定する。複合NNは、未知化合物のスペクトルを未知スペクトルのデータとして読み取り、初段NNおよび中段NNで未知スペクトルを順々に分類する。初段NN、中段NNと進むに連れて、未知スペクトルは、より小さい集合であるカテゴリーに分類される。最終的に、いずれかの終段NNが選択されて、その終段NNが既知スペクトルの化合物を同定する。
単一のNNに対し、一度に全ての既知スペクトルを読み取らせてしまうと、そのNNが個々の化合物レベルで識別できるように機械学習を実行するのは難しい。そこで、特許文献1では、初段NNや中段NNからなる多層の分岐構造を採用し、多数の既知スペクトルを初段NNで幾つかの大集合に分類し、さらに、中段NNで幾つかの中集合に分類する。また、初段NNや中段NNにおいて分類された既知スペクトルの集合が、何らかの類似点をもったスペクトルの集合になるように、個々のNNを機械学習させている。この結果、終段NNでは少ない数の既知スペクトルを化合物ごとに識別するだけで済むので、個々の化合物レベルの識別能力について何らかの効果があるだろうというものと言える。
特開平3‐262944号公報(図2)
しかしながら、特許文献1の複合NNには改善すべき点が認められる。
一点目として、複数のニューラルネットワーク(NN)からなる多層構造において、前段NNと次段NNの間に分岐点が存在するため、終段NNでの化合物の識別をいくら適正に行わせようとしても、その上流のいずれかのNNでの分類に誤りが発生すると、下流のNNではその誤りを修正することができず、最終的には間違った答えを導いてしまう、というリスクがある。分岐点を有する多層構造であるため、終段NNの回答が、必ずしも全体の中での最大値に基づく回答とは言えず、限られた範囲での極大値を回答しているに過ぎないからである。
二点目として、発明者らは、NNの機械学習を用いて、未知化合物のスペクトルデータを、実用的な化合物グループに分類できる手法の開発に取り組んできた。例えば、「カルボン酸」という化合物グループには多数の化合物(ギ酸、酢酸、酪酸など)が含まれる。いずれかのサンプルを未知化合物として分析する場合、具体的な化合物名(酪酸)まで識別することも大事ではあるが、状況によっては、ある程度の「ざっくり」としたカテゴリーである化合物グループ(カルボン酸)が判断できればよい、と言うケースもある。
これに関し、特許文献1の複合NNでの処理は、初段NNや中段NNにおいて未知スペクトルを数個のカテゴリーに分類する過程を含んでいる。しかし、これらのカテゴリーには特定の意味が存在しない。なぜなら、初段NNや中段NNでのカテゴリーは、無作為に選ばれた既知スペクトルの代表に基づいて設定されるからである。カテゴリー設定が機械(各NN)に任されていて、特定の基準を用いたカテゴリーの設定ではない。特許文献1には、初段NNや中段NNによって分類されたカテゴリーには何らかの類似点をもった既知スペクトルが集合する、と説明されているが、そのスペクトルの集合に特定の意味は認められず、とりあえず何らか似たようなスペクトルを集めているに過ぎない。
従って、特許文献1の複合NNの開示内容に基づいても、未知化合物のスペクトルデータを、実用的な化合物グループに分類する手法を得ることは難しい。
本発明の目的は、機械学習を利用した未知スペクトルの分類方法において、単独のNNを用いても未知スペクトルを適切に分類できて、また、実用的な化合物グループに分類できる方法を提供することである。
すなわち、本発明に係る機械学習を用いた未知化合物の分類方法は、
経験則に従って、複数の化合物グループを設定するとともに、前記化合物グループの各々に属する複数の既知化合物のスペクトルデータを既知スペクトルとして準備するステップと、
コンピュータ装置上のニューラルネットワークが、前記ステップで準備された前記既知スペクトルおよび前記化合物グループの情報を読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通する特徴を学習するステップと、
学習済みの前記ニューラルネットワークが、未知化合物のスペクトルデータを未知スペクトルとして読み取って、前記共通する特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を備えることを特徴とする。
ここで、前記ニューラルネットワークは、少なくとも1層の畳み込み層と、前記畳み込み層に続く全結合層と、を備え、
前記ニューラルネットワークが個々の前記既知スペクトルを学習するステップは、
前記畳み込み層が、前記既知スペクトルに含まれるスペクトル形状の特徴を強調するための畳み込みフィルタを2以上用いて、前記既知スペクトルを前処理するステップと、
前記全結合層が、前処理された2以上の前記既知スペクトルを1セットとして読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通するスペクトル形状の特徴を学習するステップと、を含むことが好ましい。
また、学習済みの前記ニューラルネットワークが化合物グループを回答するステップは、
前記畳み込み層が、2以上の前記畳み込みフィルタを用いて、前記未知スペクトルを前処理するステップと、
前記全結合層が、前処理された2以上の前記未知スペクトルを1セットとして読み取って、共通するスペクトル形状の特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を含むことが好ましい。
なお、前記既知スペクトルを準備するステップは、
前記既知スペクトルから派生した別の既知スペクトルを形成して、学習に用いる既知スペクトルを拡充させるステップを含むことが好ましい。
また、学習済みの前記ニューラルネットワークが化合物グループを回答するステップは、
学習済みの前記ニューラルネットワークが、スペクトル積算途中の前記未知化合物のスペクトルデータを未知スペクトルとして繰返し読み取るステップと、
前記ステップで読み取った積算途中の未知スペクトルに対する前記ニューラルネットワークの出力値が一定レベルに達した段階で化合物グループを回答するステップと、を含むことが好ましい。
本発明の分類方法で用いるニューラルネットワーク(NN)は単独であるから、従来のような複数のNNの分岐点が存在せず、そのNNの出力の最大値を回答することにより、適切な分類結果を提供することができる。
また、本発明の分類方法では、NNの学習段階において、スペクトル分析上で蓄積された経験則に基づく化合物グループが設定される。重要なことは、学習用の既知化合物のスペクトルに対して、その1つ1つに経験則に基づいた適切な化合物グループを割り当てることである。
ここで、スペクトル分析上の経験則とは、ある化合物グループに属することが知られている複数の既知化合物がある場合に、これらのスペクトルデータに共通するスペクトル形状の特徴のことを指す。1点1点は数値データに過ぎないが、コンピュータ装置であれば、このような一連のデータ列(数値の並び)を二次元平面にプロットされた形状的な情報として捉えることも可能である。例えば、特定の波長域に生じる部分的なスペクトル形状のことであってもよいし、2つのピーク間に見られるスペクトル形状の相対的な関係のことであってもよい。既知スペクトルに対してこのようなグループ分けを経験則に基づいて行っておけば、NNが、特徴となるスペクトル形状を画像認識に類似した方法で捉えて学習することができる。
ただし、共通するスペクトル形状が存在していれば、どのようなスペクトル形状であっても良いという訳ではなく、優先すべき共通のスペクトル形状と、無視すべき共通のスペクトル形状とがある。例えば、熟練の分析者であれば、あるサンプルのスペクトルデータを見た場合に、そこに含まれている特定のスペクトル形状の存在(または不存在)を確認するだけで、どの化合物グループに属するサンプルであるのか、あるいはどの化合物グループには属さないサンプルであるかを的確に判断することができる。
機械であるニューラルネットワーク(NN)自身は、特許文献1のように無作為に選んだ代表によってカテゴリーを設定することは得意であるが、特定の意味をもったカテゴリーを設定することは容易にはできない。そこで、本発明の分類方法には、上記のような経験則を用いて、学習用の既知スペクトルの1つ1つに対して予め適切な化合物グループをカテゴリーとして付与する手順が含まれている。そして、NNは、同じ化合物グループに属する複数の既知スペクトルに基づいて、同じグループのスペクトルに共通したスペクトル形状の存在を捉えるとともに、他のグループのスペクトルに共通したスペクトル形状の不存在を捉えて、これらの既知スペクトルが特定の化合物グループに属していることを機械学習する。従って、学習済みのNNは、既知化合物のデータベースには含まれていない未知化合物であっても、その未知化合物のスペクトルデータを、ある程度の「ざっくり」とした、実用的な化合物グループに分類することが可能になり、熟練の分析者と同レベルのグループ分けを実行できるようになった。
従って、本発明の分類方法を用いれば、単独のNNを用いても未知スペクトルを適切に分類でき、かつ、実用的な化合物グループに分類できる方法を提供することができる。
本発明の一実施形態に係る未知化合物の分類方法を表す概念図であり、(A)は学習済みNNが未知スペクトルの化合物グループを回答するステップを示し、(B)はNNが既知スペクトルを学習するステップを示す。 CNNの学習ステップを示す図である。 化合物グループ「カルボン酸」に属する複数の既知化合物のスペクトルに共通する形状についての説明図である。なお、波数域(横軸)の取り方はどのスペクトルにおいても共通になっている。 実施例1に用いる教師データ一覧およびテストデータ一覧である。 実施例1に用いるCNNモデルの構成図である。 実施例1の試験内容および結果の一覧である。 実施例2に用いる教師データ一覧である。 実施例2の試験内容および結果の一覧である。
本発明の一実施形態に係るスペクトル分析装置は、図1(A)に示すようなニューラルネットワーク(NN)を構築するコンピュータ装置からなる。コンピュータ装置は、分析プログラムを実行し、学習済みNNに、未知化合物のスペクトルデータ(以下、未知スペクトル。)を読み取らせ、その未知化合物が属する化合物グループを回答させる。同図(A)参照。
学習済みNNは、本発明に特徴的な機械学習を完了した状態のNNである。コンピュータ装置は、機械学習プログラムを実行し、NNに既知化合物のスペクトルデータ(以下、既知スペクトル。)を順々に学習させる。図1(B)の教師データ一覧100に示すような化合物グループ毎に分類された多数の既知スペクトルデータが、NNの学習対象である。一覧には各化合物グループに属する既知スペクトルのデータ数が示されている。
NNに学習を命じる者は、その準備段階として、スペクトル分類上の経験則に従ってカテゴリーを設定しておく。カテゴリーとは、例えば、「カルボン酸」、「カルボン酸塩」、「タンパク質・ポリアミド」などの化合物グループを指す。また、各々の化合物グループに属することが経験的に認められた既知化合物のサンプルを収集し、そのスペクトルデータを選定しておく。上記の化合物グループ「カルボン酸」には、例えば、ギ酸、酢酸、酪酸などのサンプルから収集した複数の既知スペクトルのデータを準備する。
なお、化合物グループの種類を設定する際は、スペクトル分析の用途を考慮するとよい。例えば、水道水や食品中の異物分析の用途などでは、設定すべき化合物グループの種類が経験的に確立されていることもあるので、それに従って化合物グループを設定してもよい。
コンピュータ装置は、機械学習プログラムを実行して、既知スペクトルおよび該既知化合物が属する化合物グループの各情報をNNに読み取らせるとともに、読み取った既知スペクトルおよび化合物グループの各情報をNNに機械学習させる。
以降、ニューラルネットワークとして、畳み込みニューラルネットワーク(CNN)を用いた場合の機械学習を例示するが、この他の形式のニューラルネットワークにも本発明の分類方法を適用することができる。CNNの機械学習の手順の一例を図2に示す。ここでのCNNは、1層以上の畳み込み層10と全結合層20とを組み合わせたモデルになっている。
既知スペクトルのデータ101は、例えば、1cm‐1毎の測定波数での光強度データのデータ列としてもよい。測定波数帯域が例えば700〜3899cm‐1であれば、1つの既知スペクトルは、概ね2000〜4000個のデータ列になる。
畳み込み層10には、N個の畳み込みフィルタ(フィルタ1、2、・・・、N)が設定されている。Nは2以上の自然数とする。これらのフィルタは、既知スペクトルに含まれるスペクトル形状の特徴を強調するためのもので、例えば、「鋭角なピーク形状を抽出するフィルタ」、「スペクトルの変化を円滑にするフィルタ」など様々なフィルタからなる。従って、CNNは、後段の全結合層20において、強調されたスペクトル形状の特徴を示すデータと、その既知スペクトルが属する化合物グループとの関連性を学習することになる。
全結合層20は、入力層、中間層(隠れ層)および出力層の多層構造を有し、入力層のデータ数は、畳み込み層10からのフィルタ後の1セットの既知スペクトルのデータ数に対応している。中間層のデータ数は適宜定められる。出力層のデータ数は、設定された化合物グループの数に対応している。全結合層20では、入力層の各データに重み付けパラメータを与えて足し合わせた数値が中間層のデータになる。また、中間層の各データに重み付けパラメータを与えて足し合わせた数値が出力層のデータになる。
コンピュータ装置は、機械学習プログラムを実行して、まず、N個の畳み込みフィルタ(フィルタ1、2、・・・、N)を用いて、畳み込み層10に既知スペクトル101を前処理させる。畳み込み層10には、フィルタ後のN個の既知スペクトルのデータが形成される。このような前処理ステップを、学習用スペクトル一覧100内の全ての既知スペクトルに対して実行する。
次に、コンピュータ装置は、機械学習プログラムを実行して、N通りに前処理された既知スペクトルのデータの集合、つまり、フィルタ後の1セットの既知スペクトルのデータ201を全結合層20に学習させる。具体的には、入力層に1セットの既知スペクトルのデータ201が入力される。そして、出力層からの出力値の中で、当該既知スペクトルの化合物グループに対応づけられた出力値が最大値を示すように、全結合層の重み付けパラメータが調整される。
全ての既知スペクトルについて全結合層20での学習が実行されることによって、全結合層20の重み付けパラメータが最適化され、どの既知スペクトルに対しても、それが属している化合物グループを正しく出力できるようになる。最適化された重み付けパラメータは、コンピュータ装置の記憶部に記憶される。
以上のような学習を終えた状態のCNNを用いて、コンピュータ装置が分析プログラムを実行して、未知化合物を分類する手順は、次のようになる。
まず、コンピュータ装置は、N個の畳み込みフィルタ(フィルタ1、2、・・・、N)を用いて、畳み込み層10での未知スペクトルの前処理を実行する。これによって、畳み込み層10には、フィルタ後のN個の未知スペクトルのデータが形成される。
続けて、コンピュータ装置は、全結合層20の入力層に、フィルタ後の1セットの未知スペクトルを読み取らせる。そして、全結合層20の出力層からの出力値の中で、最大値を示すものに基づいて、当該未知スペクトルが属する化合物グループを回答する。
なお、本実施形態の分類方法は、赤外スペクトル、ラマンスペクトル、紫外スペクトル、蛍光X線スペクトルなどの各種スペクトルデータに適用できる。特に、赤外スペクトルは、測定波数範囲に渡って幅広いピークが重なった状態のスペクトルであることが多く、測定波数範囲の全点の強度データ(フルスペクトル)を有している。スペクトル形状を捉えてグループ分けする本実施形態の方法では、このような赤外スペクトルデータの分類に特に適していると言える。
本実施形態の方法による効果
本実施形態の未知化合物の分類方法によって、分子構造の違いや官能基の有無といった基礎的な情報に基づく化合物の同定方法とは異なり、スペクトル分析上の経験則に基づいた、ある程度「ざっくり」ではあるが実用的な化合物グループへの分類を可能にした。
これを可能にした理由は、まず、学習用の既知スペクトルに対し、その1つ1つにスペクトル分析上の経験則に基づいた化合物グループを割り当てたことにある。化合物グループの割り当ては、同じグループに属する既知スペクトルに共通したスペクトル形状の特徴点に基づいて行われる。次に、CNNが複数の畳み込みフィルタを用いて、既知スペクトルに含まれるスペクトル形状の特徴点を強調するための前処理を実施するようにしたことにある。
これらの方法によって、CNNは、同じグループに共通するスペクトル形状の特徴点を使って、既知スペクトルとそれが属する化合物グループとの関連性を効率的に学習することが可能になり、未知化合物を実用的な化合物グループに適切に分類することができるようになった。しかも、既知化合物のデータベースには含まれていない未知化合物であっても、どのグループに属するかの分類が可能であり、CNNの学習に必要な既知スペクトルの数は、既存のデータベース検索などに比べて、非常に少なくて済む。
また、機械学習させるCNNは単独のニューラルネットワークであり、複数のニューラルネットワークが分岐するような階層構造ではないため、学習ステップおよび分類ステップをスピーディーかつ正確に実行することができる。
また、ユーザーは、CNNの分類結果に基づいて、未知化合物に関する措置を早急に実行したり、未知化合物をより高いレベルの分析機器に送って分析を継続したり、といった柔軟な対応をとることができる。
化合物グループに属する既知スペクトルの選定について
以下に、具体例を挙げて説明する。
例えば、分析の現場では、熟練者が「ポリスチレン」の化合物グループに入る可能性のあるスペクトル形状を見た際に、「少しカルボキシル基のピークが入っているが、この程度のピーク強度であれば、ポリスチレンに入れるべきだ」と判断するケースがある。逆に、「カルボキシル基のピーク強度が比較的大きいので、ポリスチレンというよりはカルボン酸に入れるべきだ」と判断するケースもある。
本実施形態の分類方法は、カルボキシル基を示すピークの有無をピンポイントで調べて、判断を下すというものではない。教師データ一覧に含める既知スペクトルの選定において、上記のように、ポリスチレンのスペクトル形状と、カルボキシル基のスペクトル形状(ピーク)と、を併せ持つような既知スペクトルのサンプルを積極的に採用する。両者のスペクトル形状を相対的に見て、ポリスチレンのスペクトル形状に対するカルボキシル基のピークの相対的な大きさが強いサンプルを「カルボン酸」グループに含めて、弱いサンプルを「ポリスチレン」グループに含める、というスペクトル分析上の経験則に従った選別を行うとよい。
このように選別された教師データ一覧を学習することによって、学習済みのCNNは、複数の化合物グループに入る可能性があるサンプルに対しても、熟練者がそのスペクトル形状をみて判断するのと同じように、いずれかのグループへの適切な分類ができるようになる。
なお、ポリマーでないと判断されるサンプルの中から、カルボキシル基のピークの存在が認められる既知スペクトルについては、迷わず「カルボン酸」グループとして学習させればよい。
別の選別方法として、ポリスチレンにも該当し、カルボン酸にも該当するようなサンプルについては、「カルボン酸」グループには入れないで、一律的に「ポリスチレン」グループに入れるようにしてもよい。
また、例えば、カテゴリーに「セルロース・糖」グループを含めて、学習用の既知スペクトルとして砂糖やブトウ糖などのスペクトルデータを準備する。そして、学習済みのCNNは、これらの既知化合物(砂糖・ブドウ糖など)について学習を終えているとする。本実施形態の分類方法であれば、上記のように比較的簡単な構造のスペクトルデータのみが学習対象になっている場合に、学習対象外の、より複雑な構造のトレハロースなどの化合物を、砂糖・ブドウ糖などと同グループであると見分けて正しく分類することができる。
図3に「カルボン酸」グループに属する3つの既知スペクトルのデータを例示する。図3は、横軸に400〜4000cm‐1の波数軸を取り、酢酸(A)、パルミチン酸(B)およびラウリン酸(C)の各スペクトルデータを表わしている。
仮に、3つの既知スペクトルが同じグループに属するという情報を与えず、ニューラルネットワーク(NN)自身が、これらに共通するスペクトル形状を機械的に捉えて、グループ分けを行うとする。例えば、1700cm‐1付近の比較的大きなピーク“1”が共通して存在していることを、NN自体が認識するだろう。しかし、図3(B),(C)では、3100cm‐1付近の複数のピーク“2”がよく目立っているのに対して、図3(A)にはそのような複数のピークが存在しない。そうすると、NN自体は、これらの情報を総合判断して、図3(B),(C)を同じグループと判断し、図3(A)を別のグループと判断する可能性がある。NNのような機械自身は、1つのスペクトルに含まれる個々のスペクトル形状を分け隔てなく処理するために、上記のような望ましくないグループ分けをする場合が生じるのである。
本実施形態では、カルボキシル基(−COOH)に含まれる代表的な振動(OH、C=O、C−O)に起因するピーク形状に基づいて、予め、学習用の既知スペクトルをグループに分ける。図3(A)〜(C)の既知スペクトルでは、例えば、1700cm‐1付近(C=O)のピーク“1”、および、1400cm‐1付近(C−O)のピーク“3”が共通して存在していることから、これら3つを同じグループにする。ピークがシフトしている可能性もあるので、ピーク“1”、“3”の相対的な位置関係や強度関係が共通していれば、同じグループにするとよい。
なお、既存の既知スペクトルのデータから派生した別の既知スペクトルを形成して、学習用の既知スペクトルのデータ数を拡充させすることが好ましい。派生した既知スペクトルの形成方法として以下の手法を採用し得る。
1.既知化合物のサンプルを異なる測定条件でスペクトル測定したものを既知スペクトルにする。例えば、積算回数、分解能、アポダイズ関数、S/N、ベースライン、水・CO濃度などの測定条件を変更すればよい。
2.既知スペクトルに大気ノイズを付与して別の既知スペクトルにする。
3.コンピューターグラフィックス(CG)を利用して既知スペクトルを作成する。
4.既知スペクトルの一部波数域の値をゼロにしたり、誤差成分を加算したりする方法で、別の既知スペクトルを作成する。
この手法を用いれば、非常に簡単な方法で、学習用の既知スペクトルのデータ数を実質的に増加させることができ、学習済みCNNの正解率を向上させることができる。
また、未知スペクトルの分類において、学習済みのCNNが、スペクトル積算途中の未知化合物のスペクトルデータを繰返し読み取るとよい。そして、読み取った積算途中の未知スペクトルについて、CNNの出力値が一定レベルに達したならば、その出力値に応じた化合物グループを回答するとよい。
このような手順を用いれば、未知化合物のスペクトルの積算を進めながら、積算結果が一定レベルに達したと同時に、該当する化合物グループを取得することができる。よって、積算回数を必要最低限に抑えることができて、分析時間の短縮化を図ることができる。
[実施例1]
図4は、実施例1に係る教師データの一覧表、および、正解率を評価するためのテストデータの一覧表である。設定した化合物グループは13種類(0.カルボン酸塩、1.アクリル、2.タンパク質・ポリアミド、3.ポリエステル系、4.カルボン酸、5.セルロース・糖、6.SiO、7.カルボン酸アルキル、8.カルボン酸エステル、9.ポリオレフィン、10.シリコンオイル、11.炭酸塩、12.ポリスチレン)である。なお、各実施例で用いるCNNは、試験段階のものに過ぎず、設定したグループ数も学習用の既知スペクトルも、まだまだ少ない。グループ毎のデータ数にもバラツキがある。教師データは合計891本であり、テストデータは合計83本である。
図5は、実施例1で用いるCNNモデルを示す。畳み込み層およびプーリング層からなる第一層と、全結合層と、を組み合わせたCNNモデルを用いる。3200個の数値のデータ列である1本の既知スペクトルをCNNに学習させる手順を説明しながら、CNNモデルの構成を説明する。ここで、1本の既知スペクトルのデータ列の3200個の数値というのは、スペクトルの波数領域(例:700〜3899cm‐1)を1cm‐1間隔でサンプリングして得られるスペクトルデータの点数に相当する。
畳み込み層に、幅300の畳み込みフィルタを32枚設ける。既知スペクトルを1本毎に、32通りのフィルタ処理がなされ、スペクトル形状が各フィルタの特性に応じて様々に強調される。1本の既知スペクトルにつき、32本のフィルタ後のスペクトルデータが形成される。
プーリング層には、スペクトル中の微細な変動をならすための幅10のプーリングフィルタを設ける。プーリングフィルタは、畳み込み層からの既知スペクトルに対して、フィルタ内の10個のデータ内の最大値を抽出する。また、プーリングフィルタは、既知スペクトル上を1データずつ移動(ステップ量:1)し、各位置においてそれぞれ最大値のデータを抽出する。このようにして、32本の既知スペクトルがプーリングされる。
続いて、プーリング層の既知スペクトルをベクトル化して1本の長いデータ列を形成する。データ列の大きさは3200×32になる。全結合層の入力層は、このベクトル化されたデータ列を読み取るため、入力層のデータ数を3200×32にする。また、全結合層の出力層のデータ数を化合物のグループ数と同じ13にして、出力層からの13の出力値に化合物グループを1つずつ割り当てておく。
CNNの全結合層では、入力層に1本の既知スペクトルのデータ列(3200×32)が入力された際に、中間層を経て出力層から得られる出力値(データ数:13)の中で、当該既知スペクトルの化合物グループを割り当てられている1つの出力値が最大になるように、全結合層の個々の重み付けパラメータを調整する。
以上のような学習を全ての既知スペクトルについて実行することで、全結合層20の重み付けパラメータが最適化されて、機械学習が完了する。
図6は、実施例1の試験結果である。実施例1では、CNNに対して、図4の教師データ一覧の既知スペクトルのデータ列に基づいて、機械学習を実行させた。また、学習済みのCNNに対して、図4のテストデータ一覧の未知スペクトルのデータ列を用いて、分類テストを行った。
未知スペクトルは、既知スペクトルと同様に畳み込み層およびプーリング層で各々のフィルタ処理を受けて、ベクトル化されたデータ列として、全結合層の入力層に読み取られる。そして、全結合層20の出力層からの出力値の中で最大値を示すものに基づいて、その出力値に割り当てられている化合物グループを回答する。
実施例1の学習済みのCNNは、テストデータに対して74%の正解率が得られた。試験段階であるため教師データの数に制限があったが、限られた教師データの学習だけで良好な正解率が得られた。
[実施例2]
図7は、実施例2に係る教師データの一覧表である。設定した化合物グループを24種類(0.カルボン酸、1.カルボン酸塩、2.カルボン酸エステル、3.タンパク質・ポリアミド、4.セルロース・糖、5.炭化水素系、6.ポリエステル系、7.アクリル系、8.シリコーン系、9.エポキシ、10.ポリエーテル系、11.フッ素系、12.スチレン系、13.ポリカーボネート、14.ニトリル系、15.ロジン系、16.フェノール樹脂、17.ポリビニル、18.ウレタン、19炭化水素系ゴム、20.シリカ系、21.炭酸塩、22.タルク、23.硫酸塩)に増やした。教師データは合計2421本である。
図8に、実施例2に用いるCNNの構成と、このCNNを用いた試験結果を示す。実施例2で用いるCNNモデルには、畳み込み層およびプーリング層からなる層を3層(第1層から第3層)設けて、これと全結合層とを組み合わせた。
第1層では、畳み込み層に、幅50のフィルタを16枚設ける。また、プーリング層に、幅10のプーリングフィルタを設けて最大値を抽出する。プーリングフィルタのステップ量を1とする。第1層までの前処理によって、1本の既知スペクトルから16本のデータ列が形成される。
第2層では、畳み込み層に、幅25のフィルタを32枚設ける。また、プーリング層に、幅10のプーリングフィルタを設けて最大値を抽出する。プーリングフィルタのステップ量を2とする。第2層までの前処理によって、1本の既知スペクトルから16×32本のデータ列が形成される。
第3層では、畳み込み層に、幅20のフィルタを32枚設ける。また、プーリング層に、幅10のプーリングフィルタを設けて最大値を抽出する。プーリングフィルタのステップ量を4とする。第3層までの前処理によって、1本の既知スペクトルから32×32本のデータ列が形成される。
このように3層の前処理を実行することで、1層だけでの前処理では強調し切れなかった既知スペクトルのスペクトル形状についても確実に強調することができる。
続いて、第3層のプーリング層の既知スペクトルをベクトル化して1本の長いデータ列を形成する。データ列の大きさは1600×32になる。全結合層は、入力層、2段階の中間層、および出力層で構成されている。入力層が読み取ったデータ列(データ数:1600×32)は、1段目の中間層(1024)、2段目の中間層(512)を経て、出力層からの出力されるデータ数は24になる。出力層の24の出力値には、化合物グループが1つずつ割り当てられている。
以上の構成のCNNに対して、図7の教師データ一覧の既知スペクトルを学習させることで、全結合層の重み付けパラメータが最適化されて、機械学習が完了する。
図8の実施例2では、CNNに対して、図7の教師データ一覧の既知スペクトルのデータ列に基づいて、機械学習を実行させた。また、学習済みのCNNに対して、未知スペクトルのデータ列をテストデータとして用いて、分類テストを行った。
実施例2の結果、学習済みのCNNは、テストデータに対して約90%の正解率が得られた。試験段階であるため教師データの数に制限があったが、グループ数を24種類まで増やしても良好な正解率を確保できることが分かった。
さらに、教師データについては、グループ毎のデータ数にバラツキがある。中には、教師データが数本のものがあるにも関わらず、約90%の正解率が得られたことは驚きである。
前処理における畳み込みフィルタ適用後のスペクトルデータをモニター表示して可視化したところ、フィルタの中には、ピークを上手く抽出できているものや、全体を平滑化しているものなどがあり、中にはスペクトル情報をなくす(全てゼロ)にしているものがある。これらのことから、各層のフィルタの特性に応じて、スペクトル形状が様々に強調されていることが分かる。なお、実施例2では第1層と第2層との間に際立った差は確認されなかったが、このような段階的にフィルタを適用する際のスペクトルの形状の過程を視覚化させることで、CNNの設計の最適化を図れる可能性がある。
実施例1および2での化合物グループの設定は、食品中の異物分析や水道水中の異物分析を長年実施してきた実績に基づいている。分析対象の異物は、水に溶けていない状態、つまり、目視(顕微鏡を用いる場合を含む)して認識できる状態であることが好ましい。これらの実施例より、本発明の方法がこれらの異物分析の用途に特に適していることが分かる。
10 畳み込み層
20 全結合層
100 教師データ一覧
200 フィルタ後の1セットの既知スペクトル
101 既知スペクトルのデータ列(既知化合物のスペクトルデータ)
201 畳み込みフィルタ後の1セットの既知スペクトルのデータ列
すなわち、本発明に係る機械学習を用いた未知化合物の分類方法は、
経験則に従って、複数の化合物グループを設定するとともに、前記化合物グループの各々に属する複数の既知化合物の分光スペクトルデータを既知スペクトルとして準備する準備ステップと、
コンピュータ装置上のニューラルネットワークが、前記ステップで準備された前記既知スペクトルおよび前記化合物グループの情報を読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通するスペクトル形状の特徴を学習する学習ステップと、
学習済みの前記ニューラルネットワークが、未知化合物の分光スペクトルデータを未知スペクトルとして読み取って、前記共通するスペクトル形状の特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答する分類ステップと、を備えることを特徴とする。
ここで、前記準備ステップでは、複数の前記化合物グループに属し得るそれぞれの前記化合物グループの前記スペクトル形状の特徴を併せ持った分光スペクトルデータに、経験則によりいずれかの前記化合物グループへの属性を定めて、前記既知スペクトルとする。
また、前記ニューラルネットワークは、少なくとも1層の畳み込み層と、前記畳み込み層に続く全結合層と、を備え、
前記学習ステップは、
前記畳み込み層が、個々の前記既知スペクトルに対し、当該既知スペクトルに含まれるスペクトル形状の特徴を強調するための畳み込みフィルタを2以上用いて、前記既知スペクトルを前処理するステップと、
前記全結合層が、前処理された前記既知スペクトルを1セットとして、当該既知スペクトルに対応する前記化合物グループの情報とともに読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通する前記スペクトル形状の特徴を学習するステップと、を含むことが好ましい。
また、前記分類ステップは、
前記畳み込み層が、2以上の前記畳み込みフィルタを用いて、前記未知スペクトルを前処理するステップと、
前記全結合層が、前処理された前記未知スペクトルを1セットとして読み取って、共通する前記スペクトル形状の特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を含むことが好ましい。
また、前記分類ステップは、
学習済みの前記ニューラルネットワークが、スペクトル積算途中の前記未知化合物のスペクトルデータを未知スペクトルとして繰返し読み取るステップと、
前記ステップで読み取った積算途中の未知スペクトルに対する前記ニューラルネットワークの出力値が一定レベルに達した段階で化合物グループを回答するステップと、を含むことが好ましい。
本発明に係る学習済みのニューラルネットワークの製造方法は、
同じ化合物グループの既知の分光スペクトルデータに共通するスペクトル形状の特徴の有無に基づいて、未知スペクトルをいずれかの化合物グループに分類することができるように学習済みのニューラルネットワークを製造する方法であって、
経験則に従って、複数の化合物グループを設定するとともに、前記化合物グループの各々に属する複数の既知化合物の分光スペクトルデータを既知スペクトルとして準備する準備ステップと、
コンピュータ装置上のニューラルネットワークが、前記ステップで準備された前記既知スペクトルおよび前記化合物グループの情報を読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通するスペクトル形状の特徴を学習する学習ステップと、を含み、
前記準備ステップでは、複数の前記化合物グループに属し得るそれぞれの前記化合物グループの前記スペクトル形状の特徴を併せ持った分光スペクトルデータに、経験則によりいずれかの前記化合物グループへの属性を定めて、前記既知スペクトルとし、
前記学習ステップには、少なくとも1層の畳み込み層と前記畳み込み層に続く全結合層とを有する前記ニューラルネットワークを用いて、
前記畳み込み層が、個々の前記既知スペクトルに対し、当該既知スペクトルに含まれるスペクトル形状の特徴を強調するための畳み込みフィルタを2以上用いて、前記既知スペクトルを前処理するステップと、
前記全結合層が、前処理された前記既知スペクトルを1セットとして、当該既知スペクトルに対応する前記化合物グループの情報とともに読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通する前記スペクトル形状の特徴を学習するステップと、が含まれることを特徴とする。

Claims (5)

  1. 経験則に従って、複数の化合物グループを設定するとともに、前記化合物グループの各々に属する複数の既知化合物のスペクトルデータを既知スペクトルとして準備するステップと、
    コンピュータ装置上のニューラルネットワークが、前記ステップで準備された前記既知スペクトルおよび前記化合物グループの情報を読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通する特徴を学習するステップと、
    学習済みの前記ニューラルネットワークが、未知化合物のスペクトルデータを未知スペクトルとして読み取って、前記共通する特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を備える、
    ことを特徴とする機械学習を用いた未知化合物の分類方法。
  2. 請求項1記載の方法において、
    前記ニューラルネットワークは、少なくとも1層の畳み込み層と前記畳み込み層に続く全結合層とを備え、
    前記ニューラルネットワークが個々の前記既知スペクトルを学習するステップは、
    前記畳み込み層が、前記既知スペクトルに含まれるスペクトル形状の特徴を強調するための畳み込みフィルタを2以上用いて、前記既知スペクトルを前処理するステップと、
    前記全結合層が、前処理された2以上の前記既知スペクトルを1セットとして読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通するスペクトル形状の特徴を学習するステップと、を含む、
    ことを特徴とする機械学習を用いた未知化合物の分類方法。
  3. 請求項2記載の方法において、
    学習済みの前記ニューラルネットワークが化合物グループを回答するステップは、
    前記畳み込み層が、2以上の前記畳み込みフィルタを用いて、前記未知スペクトルを前処理するステップと、
    前記全結合層が、前処理された2以上の前記未知スペクトルを1セットとして読み取って、共通するスペクトル形状の特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を含む、
    ことを特徴とする機械学習を用いた未知化合物の分類方法。
  4. 請求項1から3のいずれかに記載の方法において、
    前記既知スペクトルを準備するステップは、前記既知スペクトルから派生した別の既知スペクトルを形成して、学習に用いる既知スペクトルを拡充させるステップを含む、
    ことを特徴とする機械学習を用いた未知化合物の分類方法。
  5. 請求項1から4のいずれかに記載の方法において、
    学習済みの前記ニューラルネットワークが化合物グループを回答するステップは、
    学習済みの前記ニューラルネットワークが、スペクトル積算途中の前記未知化合物のスペクトルデータを未知スペクトルとして繰返し読み取るステップと、
    前記ステップで読み取った積算途中の未知スペクトルに対する前記ニューラルネットワークの出力値が一定レベルに達した段階で化合物グループを回答するステップと、を含む、
    ことを特徴とする機械学習を用いた未知化合物の分類方法。
JP2017161341A 2017-08-24 2017-08-24 機械学習を用いた未知化合物の分類方法 Active JP6438549B1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2017161341A JP6438549B1 (ja) 2017-08-24 2017-08-24 機械学習を用いた未知化合物の分類方法
CN201880054678.4A CN111033230A (zh) 2017-08-24 2018-08-10 利用光谱的高速分类进行的实时光谱解析
JP2019528587A JP6863625B2 (ja) 2017-08-24 2018-08-10 スペクトルの高速分類を利用したリアルタイムスペクトル解析
US16/640,757 US11913877B2 (en) 2017-08-24 2018-08-10 Real-time spectral analysis through high-speed spectral classification
PCT/JP2018/030028 WO2019039313A1 (ja) 2017-08-24 2018-08-10 スペクトルの高速分類を利用したリアルタイムスペクトル解析

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017161341A JP6438549B1 (ja) 2017-08-24 2017-08-24 機械学習を用いた未知化合物の分類方法

Publications (2)

Publication Number Publication Date
JP6438549B1 JP6438549B1 (ja) 2018-12-12
JP2019039773A true JP2019039773A (ja) 2019-03-14

Family

ID=64655889

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2017161341A Active JP6438549B1 (ja) 2017-08-24 2017-08-24 機械学習を用いた未知化合物の分類方法
JP2019528587A Active JP6863625B2 (ja) 2017-08-24 2018-08-10 スペクトルの高速分類を利用したリアルタイムスペクトル解析

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2019528587A Active JP6863625B2 (ja) 2017-08-24 2018-08-10 スペクトルの高速分類を利用したリアルタイムスペクトル解析

Country Status (4)

Country Link
US (1) US11913877B2 (ja)
JP (2) JP6438549B1 (ja)
CN (1) CN111033230A (ja)
WO (1) WO2019039313A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021047049A (ja) * 2019-09-17 2021-03-25 株式会社Nttドコモ 情報処理装置、情報処理方法及び情報処理プログラム
JP2021521463A (ja) * 2018-04-06 2021-08-26 ブラスケム アメリカ インコーポレイテッドBraskem America,Inc. ラマン分光法、および品質管理のための機械学習
WO2022038852A1 (ja) * 2020-08-18 2022-02-24 株式会社島津製作所 データ解析装置、データ解析方法、学習済みモデルの生成方法、システム、及びプログラム

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7158320B2 (ja) 2019-03-15 2022-10-21 浜松ホトニクス株式会社 畳み込みニューラルネットワーク判断根拠抽出方法および装置
JP6778451B1 (ja) * 2020-01-10 2020-11-04 日本分光株式会社 異物分析方法、異物分析プログラムおよび異物分析装置
JP7297348B2 (ja) * 2020-03-05 2023-06-26 国立研究開発法人物質・材料研究機構 スペクトル汎化システム及び方法、並びに物質同定システム及び方法
JP7130267B2 (ja) 2020-09-03 2022-09-05 株式会社リガク 全反射蛍光x線分析装置及び推定方法
EP4239536A1 (en) * 2020-10-27 2023-09-06 Konica Minolta, Inc. Information processing device, information processing system, and learned model
EP4053556A1 (en) * 2021-03-05 2022-09-07 Sysmex Corporation Measurement sample preparation method, analysis method, reagent, and reagent kit

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000003353A (ja) * 1998-06-12 2000-01-07 Toyo Electric Mfg Co Ltd 配水量予測方法
JP2003140708A (ja) * 2001-11-05 2003-05-16 Denso Corp 学習制御空調装置の教師データ作成方法
US20030184730A1 (en) * 2002-01-23 2003-10-02 The Regents Of The University Of California Fast 3D cytometry for information in tissue engineering
JP2008033424A (ja) * 2006-07-26 2008-02-14 Canon Inc 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2015191334A (ja) * 2014-03-27 2015-11-02 キヤノン株式会社 情報処理装置、情報処理方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8017910B2 (en) * 2008-10-20 2011-09-13 Nalco Company Method for predicting hydrocarbon process stream stability using near infrared spectra
WO2013059310A1 (en) * 2011-10-17 2013-04-25 Thermo Electron Scientific Instruments Llc Multi -component regression/multi - component analysis of time and/or space series files
US9110001B2 (en) 2012-07-02 2015-08-18 Thermo Scientific Portable Analytical Instruments Inc. Method for tagging reference materials of interest in spectroscopic searching applications
JP2016528496A (ja) 2013-08-02 2016-09-15 ベリフード, リミテッドVerifood, Ltd. 分光器システムおよび方法、分光分析デバイスおよび方法
JP7129909B2 (ja) * 2016-02-18 2022-09-02 オプトフルイディクス インコーポレイテッド 流体試料中の粒子を特徴付けるためのシステム及び方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000003353A (ja) * 1998-06-12 2000-01-07 Toyo Electric Mfg Co Ltd 配水量予測方法
JP2003140708A (ja) * 2001-11-05 2003-05-16 Denso Corp 学習制御空調装置の教師データ作成方法
US20030184730A1 (en) * 2002-01-23 2003-10-02 The Regents Of The University Of California Fast 3D cytometry for information in tissue engineering
JP2008033424A (ja) * 2006-07-26 2008-02-14 Canon Inc 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2015191334A (ja) * 2014-03-27 2015-11-02 キヤノン株式会社 情報処理装置、情報処理方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ACQUARELLI J , ET AL: "Convolutional neural networks for vibrational spectroscopic data analysis", ANALYTICA CHIMICA ACTA, vol. 954, JPN6017044297, 27 December 2016 (2016-12-27), pages 22 - 31, XP029879096, ISSN: 0003767547, DOI: 10.1016/j.aca.2016.12.010 *
CHEN S S , ET AL: "Convolutional Neural Network for Classification of Solar Radio Spectrum", PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO WORKSHOPS (ICMEW) 2017, vol. 2017, JPN6017044296, 10 July 2017 (2017-07-10), pages 198 - 201, XP033148293, ISSN: 0003767546, DOI: 10.1109/ICMEW.2017.8026227 *
LIU J , ET AL.: "Deep Convolutional Neural Networks for Raman Spectrum Recognition : A Unified Solution", ARXIV, vol. arXiv:1708.09022v1, JPN6018010724, 18 August 2017 (2017-08-18), pages 1 - 14, ISSN: 0003767548 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021521463A (ja) * 2018-04-06 2021-08-26 ブラスケム アメリカ インコーポレイテッドBraskem America,Inc. ラマン分光法、および品質管理のための機械学習
JP7053946B2 (ja) 2018-04-06 2022-04-12 ブラスケム アメリカ インコーポレイテッド ラマン分光法、および品質管理のための機械学習
JP2021047049A (ja) * 2019-09-17 2021-03-25 株式会社Nttドコモ 情報処理装置、情報処理方法及び情報処理プログラム
JP7264375B2 (ja) 2019-09-17 2023-04-25 株式会社Nttドコモ 情報処理装置、情報処理方法及び情報処理プログラム
WO2022038852A1 (ja) * 2020-08-18 2022-02-24 株式会社島津製作所 データ解析装置、データ解析方法、学習済みモデルの生成方法、システム、及びプログラム
JP7452667B2 (ja) 2020-08-18 2024-03-19 株式会社島津製作所 データ解析装置、データ解析方法、学習済みモデルの生成方法、システム、及びプログラム

Also Published As

Publication number Publication date
WO2019039313A1 (ja) 2019-02-28
JP6863625B2 (ja) 2021-04-21
JPWO2019039313A1 (ja) 2019-11-07
US11913877B2 (en) 2024-02-27
US20210055211A1 (en) 2021-02-25
CN111033230A (zh) 2020-04-17
JP6438549B1 (ja) 2018-12-12

Similar Documents

Publication Publication Date Title
JP6438549B1 (ja) 機械学習を用いた未知化合物の分類方法
CN114549522A (zh) 基于目标检测的纺织品质量检测方法
Kaur et al. Quality detection of fruits by using ANN technique
Ma et al. Automated arrival-time picking using a pixel-level network
CN107563364A (zh) 基于汗腺的指纹真伪辨别方法以及指纹识别方法
CN106355579A (zh) 烟条表面褶皱的缺陷检测方法
CN111134664A (zh) 一种基于胶囊网络的癫痫放电识别方法、系统和存储介质
CN111160451A (zh) 一种柔性材料检测方法及其储存介质
CN112733884A (zh) 焊接缺陷识别模型训练方法、装置和计算机终端
CN106372111A (zh) 局部特征点筛选方法及系统
CN107563427A (zh) 用于油画的著作权鉴定的方法以及相应的使用
CN111986195A (zh) 一种外观缺陷检测方法及系统
CN112674771A (zh) 基于图像注视差异的抑郁人群鉴别方法及装置
Nazulan et al. Detection of sweetness level for fruits (watermelon) with machine learning
CN116434206A (zh) 一种基于机器视觉技术的棉花质量性状检测方法
CN113838524B (zh) S-亚硝基化位点预测方法、模型训练方法及存储介质
Kähler et al. Anomaly detection for industrial surface inspection: Application in maintenance of aircraft components
CN109685756A (zh) 影像特征自动辨识装置、系统及方法
CN109145685A (zh) 基于集成学习的果蔬高光谱品质检测方法
Gajanan et al. Detection of leaf disease using feature extraction for Android based system
TW201822121A (zh) 水果成熟度與品質優劣辨識系統及方法
CN108827925A (zh) 基于光纤式荧光光谱技术的食用植物油真伪快速检测方法和检测装置
Kaur et al. ANN based technique for vegetable quality detection
CN113284563A (zh) 一种蛋白质质谱定量分析结果的筛选方法及系统
CN112614113A (zh) 一种基于深度学习的带钢缺陷检测方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181116

R150 Certificate of patent or registration of utility model

Ref document number: 6438549

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250