JP2019039773A - 機械学習を用いた未知化合物の分類方法 - Google Patents
機械学習を用いた未知化合物の分類方法 Download PDFInfo
- Publication number
- JP2019039773A JP2019039773A JP2017161341A JP2017161341A JP2019039773A JP 2019039773 A JP2019039773 A JP 2019039773A JP 2017161341 A JP2017161341 A JP 2017161341A JP 2017161341 A JP2017161341 A JP 2017161341A JP 2019039773 A JP2019039773 A JP 2019039773A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- unknown
- compound
- spectra
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 150000001875 compounds Chemical class 0.000 title claims abstract description 166
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000010801 machine learning Methods 0.000 title claims description 25
- 238000001228 spectrum Methods 0.000 claims abstract description 254
- 238000013528 artificial neural network Methods 0.000 claims abstract description 124
- 230000003595 spectral effect Effects 0.000 claims description 44
- 230000008878 coupling Effects 0.000 claims description 28
- 238000010168 coupling process Methods 0.000 claims description 28
- 238000005859 coupling reaction Methods 0.000 claims description 28
- 230000010354 integration Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 description 35
- 238000011176 pooling Methods 0.000 description 18
- 238000012360 testing method Methods 0.000 description 16
- 150000001735 carboxylic acids Chemical class 0.000 description 13
- 238000007781 pre-processing Methods 0.000 description 10
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 9
- 239000004793 Polystyrene Substances 0.000 description 9
- 229920002223 polystyrene Polymers 0.000 description 9
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000010183 spectrum analysis Methods 0.000 description 7
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 6
- 239000002131 composite material Substances 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- BDAGIHXWWSANSR-UHFFFAOYSA-N methanoic acid Natural products OC=O BDAGIHXWWSANSR-UHFFFAOYSA-N 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 239000004952 Polyamide Substances 0.000 description 3
- 150000007942 carboxylates Chemical class 0.000 description 3
- 239000001913 cellulose Substances 0.000 description 3
- 229920002678 cellulose Polymers 0.000 description 3
- 238000002329 infrared spectrum Methods 0.000 description 3
- 229920002647 polyamide Polymers 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- OSWFIVFLDKOXQC-UHFFFAOYSA-N 4-(3-methoxyphenyl)aniline Chemical compound COC1=CC=CC(C=2C=CC(N)=CC=2)=C1 OSWFIVFLDKOXQC-UHFFFAOYSA-N 0.000 description 2
- 239000004215 Carbon black (E152) Substances 0.000 description 2
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 2
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- POULHZVOKOAJMA-UHFFFAOYSA-N dodecanoic acid Chemical compound CCCCCCCCCCCC(O)=O POULHZVOKOAJMA-UHFFFAOYSA-N 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 235000019253 formic acid Nutrition 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- IPCSVZSSVZVIGE-UHFFFAOYSA-N hexadecanoic acid Chemical compound CCCCCCCCCCCCCCCC(O)=O IPCSVZSSVZVIGE-UHFFFAOYSA-N 0.000 description 2
- 229930195733 hydrocarbon Natural products 0.000 description 2
- 150000002430 hydrocarbons Chemical class 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 229920000728 polyester Polymers 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 235000020679 tap water Nutrition 0.000 description 2
- 239000008399 tap water Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- -1 “carboxylic acid” Chemical class 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- KXGFMDJXCMQABM-UHFFFAOYSA-N 2-methoxy-6-methylphenol Chemical compound [CH]OC1=CC=CC([CH])=C1O KXGFMDJXCMQABM-UHFFFAOYSA-N 0.000 description 1
- RSWGJHLUYNHPMX-UHFFFAOYSA-N Abietic-Saeure Natural products C12CCC(C(C)C)=CC2=CCC2C1(C)CCCC2(C)C(O)=O RSWGJHLUYNHPMX-UHFFFAOYSA-N 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- JOYRKODLDBILNP-UHFFFAOYSA-N Ethyl urethane Chemical compound CCOC(N)=O JOYRKODLDBILNP-UHFFFAOYSA-N 0.000 description 1
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 1
- 239000005639 Lauric acid Substances 0.000 description 1
- 235000021314 Palmitic acid Nutrition 0.000 description 1
- 239000004721 Polyphenylene oxide Substances 0.000 description 1
- 238000001237 Raman spectrum Methods 0.000 description 1
- KHPCPRHQVVSZAH-HUOMCSJISA-N Rosin Natural products O(C/C=C/c1ccccc1)[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KHPCPRHQVVSZAH-HUOMCSJISA-N 0.000 description 1
- 229910004298 SiO 2 Inorganic materials 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- 238000002083 X-ray spectrum Methods 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 125000003262 carboxylic acid ester group Chemical class [H]C([H])([*:2])OC(=O)C([H])([H])[*:1] 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229920001971 elastomer Polymers 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000009975 flexible effect Effects 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- WQEPLUUGTLDZJY-UHFFFAOYSA-N n-Pentadecanoic acid Natural products CCCCCCCCCCCCCCC(O)=O WQEPLUUGTLDZJY-UHFFFAOYSA-N 0.000 description 1
- 150000002825 nitriles Chemical class 0.000 description 1
- 229920001568 phenolic resin Polymers 0.000 description 1
- 239000005011 phenolic resin Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000570 polyether Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920000098 polyolefin Polymers 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 229920002545 silicone oil Polymers 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- KHPCPRHQVVSZAH-UHFFFAOYSA-N trans-cinnamyl beta-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OCC=CC1=CC=CC=C1 KHPCPRHQVVSZAH-UHFFFAOYSA-N 0.000 description 1
- 238000002211 ultraviolet spectrum Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/65—Raman scattering
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/06—Illumination; Optics
- G01N2201/063—Illuminating optical parts
- G01N2201/0636—Reflectors
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/06—Illumination; Optics
- G01N2201/064—Stray light conditioning
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2201/00—Features of devices classified in G01N21/00
- G01N2201/12—Circuits of general importance; Signal processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
Abstract
【解決手段】この分類方法は、(1)経験則に従って、複数の化合物グループを設定するとともに、化合物グループの各々に属する複数の既知化合物のスペクトルデータを既知スペクトルとして準備するステップと、(2)コンピュータ装置上のNNが、前記ステップで準備された既知スペクトルおよび化合物グループの情報を読み取って、同一の化合物グループに属する複数の既知スペクトルに共通する特徴を学習するステップと、(3)学習済みのNNが、未知化合物のスペクトルデータを未知スペクトルとして読み取って、共通する特徴の有無に基づいて、未知スペクトルが属する化合物グループを回答するステップと、を備える。
【選択図】 図1
Description
経験則に従って、複数の化合物グループを設定するとともに、前記化合物グループの各々に属する複数の既知化合物のスペクトルデータを既知スペクトルとして準備するステップと、
コンピュータ装置上のニューラルネットワークが、前記ステップで準備された前記既知スペクトルおよび前記化合物グループの情報を読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通する特徴を学習するステップと、
学習済みの前記ニューラルネットワークが、未知化合物のスペクトルデータを未知スペクトルとして読み取って、前記共通する特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を備えることを特徴とする。
前記ニューラルネットワークが個々の前記既知スペクトルを学習するステップは、
前記畳み込み層が、前記既知スペクトルに含まれるスペクトル形状の特徴を強調するための畳み込みフィルタを2以上用いて、前記既知スペクトルを前処理するステップと、
前記全結合層が、前処理された2以上の前記既知スペクトルを1セットとして読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通するスペクトル形状の特徴を学習するステップと、を含むことが好ましい。
前記畳み込み層が、2以上の前記畳み込みフィルタを用いて、前記未知スペクトルを前処理するステップと、
前記全結合層が、前処理された2以上の前記未知スペクトルを1セットとして読み取って、共通するスペクトル形状の特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を含むことが好ましい。
前記既知スペクトルから派生した別の既知スペクトルを形成して、学習に用いる既知スペクトルを拡充させるステップを含むことが好ましい。
学習済みの前記ニューラルネットワークが、スペクトル積算途中の前記未知化合物のスペクトルデータを未知スペクトルとして繰返し読み取るステップと、
前記ステップで読み取った積算途中の未知スペクトルに対する前記ニューラルネットワークの出力値が一定レベルに達した段階で化合物グループを回答するステップと、を含むことが好ましい。
ここで、スペクトル分析上の経験則とは、ある化合物グループに属することが知られている複数の既知化合物がある場合に、これらのスペクトルデータに共通するスペクトル形状の特徴のことを指す。1点1点は数値データに過ぎないが、コンピュータ装置であれば、このような一連のデータ列(数値の並び)を二次元平面にプロットされた形状的な情報として捉えることも可能である。例えば、特定の波長域に生じる部分的なスペクトル形状のことであってもよいし、2つのピーク間に見られるスペクトル形状の相対的な関係のことであってもよい。既知スペクトルに対してこのようなグループ分けを経験則に基づいて行っておけば、NNが、特徴となるスペクトル形状を画像認識に類似した方法で捉えて学習することができる。
機械であるニューラルネットワーク(NN)自身は、特許文献1のように無作為に選んだ代表によってカテゴリーを設定することは得意であるが、特定の意味をもったカテゴリーを設定することは容易にはできない。そこで、本発明の分類方法には、上記のような経験則を用いて、学習用の既知スペクトルの1つ1つに対して予め適切な化合物グループをカテゴリーとして付与する手順が含まれている。そして、NNは、同じ化合物グループに属する複数の既知スペクトルに基づいて、同じグループのスペクトルに共通したスペクトル形状の存在を捉えるとともに、他のグループのスペクトルに共通したスペクトル形状の不存在を捉えて、これらの既知スペクトルが特定の化合物グループに属していることを機械学習する。従って、学習済みのNNは、既知化合物のデータベースには含まれていない未知化合物であっても、その未知化合物のスペクトルデータを、ある程度の「ざっくり」とした、実用的な化合物グループに分類することが可能になり、熟練の分析者と同レベルのグループ分けを実行できるようになった。
まず、コンピュータ装置は、N個の畳み込みフィルタ(フィルタ1、2、・・・、N)を用いて、畳み込み層10での未知スペクトルの前処理を実行する。これによって、畳み込み層10には、フィルタ後のN個の未知スペクトルのデータが形成される。
続けて、コンピュータ装置は、全結合層20の入力層に、フィルタ後の1セットの未知スペクトルを読み取らせる。そして、全結合層20の出力層からの出力値の中で、最大値を示すものに基づいて、当該未知スペクトルが属する化合物グループを回答する。
本実施形態の未知化合物の分類方法によって、分子構造の違いや官能基の有無といった基礎的な情報に基づく化合物の同定方法とは異なり、スペクトル分析上の経験則に基づいた、ある程度「ざっくり」ではあるが実用的な化合物グループへの分類を可能にした。
以下に、具体例を挙げて説明する。
例えば、分析の現場では、熟練者が「ポリスチレン」の化合物グループに入る可能性のあるスペクトル形状を見た際に、「少しカルボキシル基のピークが入っているが、この程度のピーク強度であれば、ポリスチレンに入れるべきだ」と判断するケースがある。逆に、「カルボキシル基のピーク強度が比較的大きいので、ポリスチレンというよりはカルボン酸に入れるべきだ」と判断するケースもある。
1.既知化合物のサンプルを異なる測定条件でスペクトル測定したものを既知スペクトルにする。例えば、積算回数、分解能、アポダイズ関数、S/N、ベースライン、水・CO2濃度などの測定条件を変更すればよい。
2.既知スペクトルに大気ノイズを付与して別の既知スペクトルにする。
3.コンピューターグラフィックス(CG)を利用して既知スペクトルを作成する。
4.既知スペクトルの一部波数域の値をゼロにしたり、誤差成分を加算したりする方法で、別の既知スペクトルを作成する。
この手法を用いれば、非常に簡単な方法で、学習用の既知スペクトルのデータ数を実質的に増加させることができ、学習済みCNNの正解率を向上させることができる。
図4は、実施例1に係る教師データの一覧表、および、正解率を評価するためのテストデータの一覧表である。設定した化合物グループは13種類(0.カルボン酸塩、1.アクリル、2.タンパク質・ポリアミド、3.ポリエステル系、4.カルボン酸、5.セルロース・糖、6.SiO2、7.カルボン酸アルキル、8.カルボン酸エステル、9.ポリオレフィン、10.シリコンオイル、11.炭酸塩、12.ポリスチレン)である。なお、各実施例で用いるCNNは、試験段階のものに過ぎず、設定したグループ数も学習用の既知スペクトルも、まだまだ少ない。グループ毎のデータ数にもバラツキがある。教師データは合計891本であり、テストデータは合計83本である。
図7は、実施例2に係る教師データの一覧表である。設定した化合物グループを24種類(0.カルボン酸、1.カルボン酸塩、2.カルボン酸エステル、3.タンパク質・ポリアミド、4.セルロース・糖、5.炭化水素系、6.ポリエステル系、7.アクリル系、8.シリコーン系、9.エポキシ、10.ポリエーテル系、11.フッ素系、12.スチレン系、13.ポリカーボネート、14.ニトリル系、15.ロジン系、16.フェノール樹脂、17.ポリビニル、18.ウレタン、19炭化水素系ゴム、20.シリカ系、21.炭酸塩、22.タルク、23.硫酸塩)に増やした。教師データは合計2421本である。
第2層では、畳み込み層に、幅25のフィルタを32枚設ける。また、プーリング層に、幅10のプーリングフィルタを設けて最大値を抽出する。プーリングフィルタのステップ量を2とする。第2層までの前処理によって、1本の既知スペクトルから16×32本のデータ列が形成される。
このように3層の前処理を実行することで、1層だけでの前処理では強調し切れなかった既知スペクトルのスペクトル形状についても確実に強調することができる。
以上の構成のCNNに対して、図7の教師データ一覧の既知スペクトルを学習させることで、全結合層の重み付けパラメータが最適化されて、機械学習が完了する。
さらに、教師データについては、グループ毎のデータ数にバラツキがある。中には、教師データが数本のものがあるにも関わらず、約90%の正解率が得られたことは驚きである。
20 全結合層
100 教師データ一覧
200 フィルタ後の1セットの既知スペクトル
101 既知スペクトルのデータ列(既知化合物のスペクトルデータ)
201 畳み込みフィルタ後の1セットの既知スペクトルのデータ列
経験則に従って、複数の化合物グループを設定するとともに、前記化合物グループの各々に属する複数の既知化合物の分光スペクトルデータを既知スペクトルとして準備する準備ステップと、
コンピュータ装置上のニューラルネットワークが、前記ステップで準備された前記既知スペクトルおよび前記化合物グループの情報を読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通するスペクトル形状の特徴を学習する学習ステップと、
学習済みの前記ニューラルネットワークが、未知化合物の分光スペクトルデータを未知スペクトルとして読み取って、前記共通するスペクトル形状の特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答する分類ステップと、を備えることを特徴とする。
また、前記ニューラルネットワークは、少なくとも1層の畳み込み層と、前記畳み込み層に続く全結合層と、を備え、
前記学習ステップは、
前記畳み込み層が、個々の前記既知スペクトルに対し、当該既知スペクトルに含まれるスペクトル形状の特徴を強調するための畳み込みフィルタを2以上用いて、前記既知スペクトルを前処理するステップと、
前記全結合層が、前処理された前記既知スペクトルを1セットとして、当該既知スペクトルに対応する前記化合物グループの情報とともに読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通する前記スペクトル形状の特徴を学習するステップと、を含むことが好ましい。
前記畳み込み層が、2以上の前記畳み込みフィルタを用いて、前記未知スペクトルを前処理するステップと、
前記全結合層が、前処理された前記未知スペクトルを1セットとして読み取って、共通する前記スペクトル形状の特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を含むことが好ましい。
学習済みの前記ニューラルネットワークが、スペクトル積算途中の前記未知化合物のスペクトルデータを未知スペクトルとして繰返し読み取るステップと、
前記ステップで読み取った積算途中の未知スペクトルに対する前記ニューラルネットワークの出力値が一定レベルに達した段階で化合物グループを回答するステップと、を含むことが好ましい。
本発明に係る学習済みのニューラルネットワークの製造方法は、
同じ化合物グループの既知の分光スペクトルデータに共通するスペクトル形状の特徴の有無に基づいて、未知スペクトルをいずれかの化合物グループに分類することができるように学習済みのニューラルネットワークを製造する方法であって、
経験則に従って、複数の化合物グループを設定するとともに、前記化合物グループの各々に属する複数の既知化合物の分光スペクトルデータを既知スペクトルとして準備する準備ステップと、
コンピュータ装置上のニューラルネットワークが、前記ステップで準備された前記既知スペクトルおよび前記化合物グループの情報を読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通するスペクトル形状の特徴を学習する学習ステップと、を含み、
前記準備ステップでは、複数の前記化合物グループに属し得るそれぞれの前記化合物グループの前記スペクトル形状の特徴を併せ持った分光スペクトルデータに、経験則によりいずれかの前記化合物グループへの属性を定めて、前記既知スペクトルとし、
前記学習ステップには、少なくとも1層の畳み込み層と前記畳み込み層に続く全結合層とを有する前記ニューラルネットワークを用いて、
前記畳み込み層が、個々の前記既知スペクトルに対し、当該既知スペクトルに含まれるスペクトル形状の特徴を強調するための畳み込みフィルタを2以上用いて、前記既知スペクトルを前処理するステップと、
前記全結合層が、前処理された前記既知スペクトルを1セットとして、当該既知スペクトルに対応する前記化合物グループの情報とともに読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通する前記スペクトル形状の特徴を学習するステップと、が含まれることを特徴とする。
Claims (5)
- 経験則に従って、複数の化合物グループを設定するとともに、前記化合物グループの各々に属する複数の既知化合物のスペクトルデータを既知スペクトルとして準備するステップと、
コンピュータ装置上のニューラルネットワークが、前記ステップで準備された前記既知スペクトルおよび前記化合物グループの情報を読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通する特徴を学習するステップと、
学習済みの前記ニューラルネットワークが、未知化合物のスペクトルデータを未知スペクトルとして読み取って、前記共通する特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を備える、
ことを特徴とする機械学習を用いた未知化合物の分類方法。 - 請求項1記載の方法において、
前記ニューラルネットワークは、少なくとも1層の畳み込み層と前記畳み込み層に続く全結合層とを備え、
前記ニューラルネットワークが個々の前記既知スペクトルを学習するステップは、
前記畳み込み層が、前記既知スペクトルに含まれるスペクトル形状の特徴を強調するための畳み込みフィルタを2以上用いて、前記既知スペクトルを前処理するステップと、
前記全結合層が、前処理された2以上の前記既知スペクトルを1セットとして読み取って、同一の前記化合物グループに属する複数の前記既知スペクトルに共通するスペクトル形状の特徴を学習するステップと、を含む、
ことを特徴とする機械学習を用いた未知化合物の分類方法。 - 請求項2記載の方法において、
学習済みの前記ニューラルネットワークが化合物グループを回答するステップは、
前記畳み込み層が、2以上の前記畳み込みフィルタを用いて、前記未知スペクトルを前処理するステップと、
前記全結合層が、前処理された2以上の前記未知スペクトルを1セットとして読み取って、共通するスペクトル形状の特徴の有無に基づいて、前記未知スペクトルが属する化合物グループを回答するステップと、を含む、
ことを特徴とする機械学習を用いた未知化合物の分類方法。 - 請求項1から3のいずれかに記載の方法において、
前記既知スペクトルを準備するステップは、前記既知スペクトルから派生した別の既知スペクトルを形成して、学習に用いる既知スペクトルを拡充させるステップを含む、
ことを特徴とする機械学習を用いた未知化合物の分類方法。 - 請求項1から4のいずれかに記載の方法において、
学習済みの前記ニューラルネットワークが化合物グループを回答するステップは、
学習済みの前記ニューラルネットワークが、スペクトル積算途中の前記未知化合物のスペクトルデータを未知スペクトルとして繰返し読み取るステップと、
前記ステップで読み取った積算途中の未知スペクトルに対する前記ニューラルネットワークの出力値が一定レベルに達した段階で化合物グループを回答するステップと、を含む、
ことを特徴とする機械学習を用いた未知化合物の分類方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017161341A JP6438549B1 (ja) | 2017-08-24 | 2017-08-24 | 機械学習を用いた未知化合物の分類方法 |
CN201880054678.4A CN111033230A (zh) | 2017-08-24 | 2018-08-10 | 利用光谱的高速分类进行的实时光谱解析 |
JP2019528587A JP6863625B2 (ja) | 2017-08-24 | 2018-08-10 | スペクトルの高速分類を利用したリアルタイムスペクトル解析 |
US16/640,757 US11913877B2 (en) | 2017-08-24 | 2018-08-10 | Real-time spectral analysis through high-speed spectral classification |
PCT/JP2018/030028 WO2019039313A1 (ja) | 2017-08-24 | 2018-08-10 | スペクトルの高速分類を利用したリアルタイムスペクトル解析 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017161341A JP6438549B1 (ja) | 2017-08-24 | 2017-08-24 | 機械学習を用いた未知化合物の分類方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6438549B1 JP6438549B1 (ja) | 2018-12-12 |
JP2019039773A true JP2019039773A (ja) | 2019-03-14 |
Family
ID=64655889
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017161341A Active JP6438549B1 (ja) | 2017-08-24 | 2017-08-24 | 機械学習を用いた未知化合物の分類方法 |
JP2019528587A Active JP6863625B2 (ja) | 2017-08-24 | 2018-08-10 | スペクトルの高速分類を利用したリアルタイムスペクトル解析 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019528587A Active JP6863625B2 (ja) | 2017-08-24 | 2018-08-10 | スペクトルの高速分類を利用したリアルタイムスペクトル解析 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11913877B2 (ja) |
JP (2) | JP6438549B1 (ja) |
CN (1) | CN111033230A (ja) |
WO (1) | WO2019039313A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021047049A (ja) * | 2019-09-17 | 2021-03-25 | 株式会社Nttドコモ | 情報処理装置、情報処理方法及び情報処理プログラム |
JP2021521463A (ja) * | 2018-04-06 | 2021-08-26 | ブラスケム アメリカ インコーポレイテッドBraskem America,Inc. | ラマン分光法、および品質管理のための機械学習 |
WO2022038852A1 (ja) * | 2020-08-18 | 2022-02-24 | 株式会社島津製作所 | データ解析装置、データ解析方法、学習済みモデルの生成方法、システム、及びプログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7158320B2 (ja) | 2019-03-15 | 2022-10-21 | 浜松ホトニクス株式会社 | 畳み込みニューラルネットワーク判断根拠抽出方法および装置 |
JP6778451B1 (ja) * | 2020-01-10 | 2020-11-04 | 日本分光株式会社 | 異物分析方法、異物分析プログラムおよび異物分析装置 |
JP7297348B2 (ja) * | 2020-03-05 | 2023-06-26 | 国立研究開発法人物質・材料研究機構 | スペクトル汎化システム及び方法、並びに物質同定システム及び方法 |
JP7130267B2 (ja) | 2020-09-03 | 2022-09-05 | 株式会社リガク | 全反射蛍光x線分析装置及び推定方法 |
EP4239536A1 (en) * | 2020-10-27 | 2023-09-06 | Konica Minolta, Inc. | Information processing device, information processing system, and learned model |
EP4053556A1 (en) * | 2021-03-05 | 2022-09-07 | Sysmex Corporation | Measurement sample preparation method, analysis method, reagent, and reagent kit |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000003353A (ja) * | 1998-06-12 | 2000-01-07 | Toyo Electric Mfg Co Ltd | 配水量予測方法 |
JP2003140708A (ja) * | 2001-11-05 | 2003-05-16 | Denso Corp | 学習制御空調装置の教師データ作成方法 |
US20030184730A1 (en) * | 2002-01-23 | 2003-10-02 | The Regents Of The University Of California | Fast 3D cytometry for information in tissue engineering |
JP2008033424A (ja) * | 2006-07-26 | 2008-02-14 | Canon Inc | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
JP2015191334A (ja) * | 2014-03-27 | 2015-11-02 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8017910B2 (en) * | 2008-10-20 | 2011-09-13 | Nalco Company | Method for predicting hydrocarbon process stream stability using near infrared spectra |
WO2013059310A1 (en) * | 2011-10-17 | 2013-04-25 | Thermo Electron Scientific Instruments Llc | Multi -component regression/multi - component analysis of time and/or space series files |
US9110001B2 (en) | 2012-07-02 | 2015-08-18 | Thermo Scientific Portable Analytical Instruments Inc. | Method for tagging reference materials of interest in spectroscopic searching applications |
JP2016528496A (ja) | 2013-08-02 | 2016-09-15 | ベリフード, リミテッドVerifood, Ltd. | 分光器システムおよび方法、分光分析デバイスおよび方法 |
JP7129909B2 (ja) * | 2016-02-18 | 2022-09-02 | オプトフルイディクス インコーポレイテッド | 流体試料中の粒子を特徴付けるためのシステム及び方法 |
-
2017
- 2017-08-24 JP JP2017161341A patent/JP6438549B1/ja active Active
-
2018
- 2018-08-10 JP JP2019528587A patent/JP6863625B2/ja active Active
- 2018-08-10 US US16/640,757 patent/US11913877B2/en active Active
- 2018-08-10 CN CN201880054678.4A patent/CN111033230A/zh active Pending
- 2018-08-10 WO PCT/JP2018/030028 patent/WO2019039313A1/ja active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000003353A (ja) * | 1998-06-12 | 2000-01-07 | Toyo Electric Mfg Co Ltd | 配水量予測方法 |
JP2003140708A (ja) * | 2001-11-05 | 2003-05-16 | Denso Corp | 学習制御空調装置の教師データ作成方法 |
US20030184730A1 (en) * | 2002-01-23 | 2003-10-02 | The Regents Of The University Of California | Fast 3D cytometry for information in tissue engineering |
JP2008033424A (ja) * | 2006-07-26 | 2008-02-14 | Canon Inc | 画像処理装置、画像処理方法、プログラム及び記憶媒体 |
JP2015191334A (ja) * | 2014-03-27 | 2015-11-02 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
Non-Patent Citations (3)
Title |
---|
ACQUARELLI J , ET AL: "Convolutional neural networks for vibrational spectroscopic data analysis", ANALYTICA CHIMICA ACTA, vol. 954, JPN6017044297, 27 December 2016 (2016-12-27), pages 22 - 31, XP029879096, ISSN: 0003767547, DOI: 10.1016/j.aca.2016.12.010 * |
CHEN S S , ET AL: "Convolutional Neural Network for Classification of Solar Radio Spectrum", PROCEEDINGS OF THE IEEE INTERNATIONAL CONFERENCE ON MULTIMEDIA AND EXPO WORKSHOPS (ICMEW) 2017, vol. 2017, JPN6017044296, 10 July 2017 (2017-07-10), pages 198 - 201, XP033148293, ISSN: 0003767546, DOI: 10.1109/ICMEW.2017.8026227 * |
LIU J , ET AL.: "Deep Convolutional Neural Networks for Raman Spectrum Recognition : A Unified Solution", ARXIV, vol. arXiv:1708.09022v1, JPN6018010724, 18 August 2017 (2017-08-18), pages 1 - 14, ISSN: 0003767548 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021521463A (ja) * | 2018-04-06 | 2021-08-26 | ブラスケム アメリカ インコーポレイテッドBraskem America,Inc. | ラマン分光法、および品質管理のための機械学習 |
JP7053946B2 (ja) | 2018-04-06 | 2022-04-12 | ブラスケム アメリカ インコーポレイテッド | ラマン分光法、および品質管理のための機械学習 |
JP2021047049A (ja) * | 2019-09-17 | 2021-03-25 | 株式会社Nttドコモ | 情報処理装置、情報処理方法及び情報処理プログラム |
JP7264375B2 (ja) | 2019-09-17 | 2023-04-25 | 株式会社Nttドコモ | 情報処理装置、情報処理方法及び情報処理プログラム |
WO2022038852A1 (ja) * | 2020-08-18 | 2022-02-24 | 株式会社島津製作所 | データ解析装置、データ解析方法、学習済みモデルの生成方法、システム、及びプログラム |
JP7452667B2 (ja) | 2020-08-18 | 2024-03-19 | 株式会社島津製作所 | データ解析装置、データ解析方法、学習済みモデルの生成方法、システム、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2019039313A1 (ja) | 2019-02-28 |
JP6863625B2 (ja) | 2021-04-21 |
JPWO2019039313A1 (ja) | 2019-11-07 |
US11913877B2 (en) | 2024-02-27 |
US20210055211A1 (en) | 2021-02-25 |
CN111033230A (zh) | 2020-04-17 |
JP6438549B1 (ja) | 2018-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6438549B1 (ja) | 機械学習を用いた未知化合物の分類方法 | |
CN114549522A (zh) | 基于目标检测的纺织品质量检测方法 | |
Kaur et al. | Quality detection of fruits by using ANN technique | |
Ma et al. | Automated arrival-time picking using a pixel-level network | |
CN107563364A (zh) | 基于汗腺的指纹真伪辨别方法以及指纹识别方法 | |
CN106355579A (zh) | 烟条表面褶皱的缺陷检测方法 | |
CN111134664A (zh) | 一种基于胶囊网络的癫痫放电识别方法、系统和存储介质 | |
CN111160451A (zh) | 一种柔性材料检测方法及其储存介质 | |
CN112733884A (zh) | 焊接缺陷识别模型训练方法、装置和计算机终端 | |
CN106372111A (zh) | 局部特征点筛选方法及系统 | |
CN107563427A (zh) | 用于油画的著作权鉴定的方法以及相应的使用 | |
CN111986195A (zh) | 一种外观缺陷检测方法及系统 | |
CN112674771A (zh) | 基于图像注视差异的抑郁人群鉴别方法及装置 | |
Nazulan et al. | Detection of sweetness level for fruits (watermelon) with machine learning | |
CN116434206A (zh) | 一种基于机器视觉技术的棉花质量性状检测方法 | |
CN113838524B (zh) | S-亚硝基化位点预测方法、模型训练方法及存储介质 | |
Kähler et al. | Anomaly detection for industrial surface inspection: Application in maintenance of aircraft components | |
CN109685756A (zh) | 影像特征自动辨识装置、系统及方法 | |
CN109145685A (zh) | 基于集成学习的果蔬高光谱品质检测方法 | |
Gajanan et al. | Detection of leaf disease using feature extraction for Android based system | |
TW201822121A (zh) | 水果成熟度與品質優劣辨識系統及方法 | |
CN108827925A (zh) | 基于光纤式荧光光谱技术的食用植物油真伪快速检测方法和检测装置 | |
Kaur et al. | ANN based technique for vegetable quality detection | |
CN113284563A (zh) | 一种蛋白质质谱定量分析结果的筛选方法及系统 | |
CN112614113A (zh) | 一种基于深度学习的带钢缺陷检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181106 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6438549 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |