JP7188373B2 - データ解析システム及びデータ解析方法 - Google Patents

データ解析システム及びデータ解析方法 Download PDF

Info

Publication number
JP7188373B2
JP7188373B2 JP2019223756A JP2019223756A JP7188373B2 JP 7188373 B2 JP7188373 B2 JP 7188373B2 JP 2019223756 A JP2019223756 A JP 2019223756A JP 2019223756 A JP2019223756 A JP 2019223756A JP 7188373 B2 JP7188373 B2 JP 7188373B2
Authority
JP
Japan
Prior art keywords
data
measurement data
analysis
feature amount
analysis result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019223756A
Other languages
English (en)
Other versions
JP2021092467A (ja
Inventor
正雄 矢野
哲也 庄司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2019223756A priority Critical patent/JP7188373B2/ja
Priority to EP20203000.3A priority patent/EP3835766B1/en
Priority to US17/084,096 priority patent/US20210182734A1/en
Priority to CN202011386666.7A priority patent/CN112951342B/zh
Publication of JP2021092467A publication Critical patent/JP2021092467A/ja
Application granted granted Critical
Publication of JP7188373B2 publication Critical patent/JP7188373B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/20Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2223/00Investigating materials by wave or particle radiation
    • G01N2223/30Accessories, mechanical or electrical features
    • G01N2223/303Accessories, mechanical or electrical features calibrating, standardising

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Description

本発明はデータ解析システム及びデータ解析方法に関する。
特許文献1には、従来の試料分析方法として、X線回折法での定量分析を行うにあたり、X線源のターゲットと同一材料からなる標準化試料を用いて回折X線の強度を較正するものが開示されている。
特開2011-298206号公報
しかしながら、前述した従来の試料分析方法では、X線回折装置によって計測された材料(試料)の計測データを解析する段階で、人の解析者による判断が必要な部分があるため、解析結果が解析者の直感や経験等に依存して解析結果がばらつくおそれがあり、また解析者の解析結果に対する評価が行われないために解析精度を確保することができないおそれがある。
本発明はこのような問題点に着目してなされたものであり、計測データの解析結果のばらつきを抑制しつつ、解析精度を向上させることを目的とする。
上記課題を解決するために、本発明のある態様によるデータ解析システムは、演算装置と、演算装置に接続される記憶装置と、演算装置に接続されて外部の端末と通信可能な通信部と、を備える。演算装置は、通信部を介して受信した、材料を分析した計測データを取得する計測データ取得部と、学習済みの機械学習モデルを用いて計測データを処理し、計測データの解析結果を出力するデータ解析部と、計測データと、計測データを処理した処理結果と、を含むデータセットを解析結果データセットとして記憶装置の解析結果データベースに格納する格納処理部と、通信部を介して受信した、解析結果データセットに基づいて外部で行われた計測データの処理結果に対する評価結果を含む、学習用データセットを取得する学習用データセット取得部と、学習用データセットに基づいて、機械学習モデルを再学習させる学習部と、を備える。
また本発明のある態様によるデータ解析方法は、演算装置と、演算装置に接続される記憶装置と、演算装置に接続されて外部の端末と通信可能な通信部と、を備えるデータ解析システムによるデータ解析方法であって、通信部を介して受信した、材料を分析した計測データを取得する計測データ取得工程と、学習済みの機械学習モデルを用いて計測データを処理し、計測データの解析結果を出力するデータ解析工程と、計測データと、計測データを処理した処理結果と、を含むデータセットを解析結果データセットとして記憶装置の解析結果データベースに格納する格納処理工程と、通信部を介して受信した、解析結果データセットに基づいて外部で行われた計測データの処理結果に対する評価結果を含む、学習用データセットを取得する学習用データセット取得工程と、学習用データセットに基づいて、機械学習モデルを再学習させる学習工程と、を備える。
本発明のこれらの態様によれば、学習済みの機械学習モデルを用いて計測データが処理されるため、計測データの解析結果が、計測データを解析する解析者の直感や経験等に依存してばらついてしまうのを抑制できる。また計測データの処理結果に対する評価の結果を含む学習用データセットに基づいて、機械学習モデルの再学習が行われるため、計測データの解析が行われて解析結果データセットが蓄積され、その結果として学習用データセットの点数が増大していくにつれて、機械学習モデルの性能を向上させて、計測データの解析精度を向上させることができる。
図1は、本発明の一実施形態によるデータ解析システムを備える材料情報取得システムの概略構成図である。 図2は、材料情報システムの動作シーケンスの一例を示す図である。
以下、図面を参照して本発明の実施形態について詳細に説明する。なお、以下の説明では、同様な構成要素には同一の参照番号を付す。
図1は、本発明の一実施形態によるデータ解析システム1を備える材料情報取得システム100の概略構成図である。
材料情報取得システム100は、データ解析システム1と、データ解析システム1とネットワークを介して接続され、データ解析システム1と互いに通信可能に構成されたユーザ用端末2及び評価者用端末3と、を備える。
材料情報取得システム100は、材料情報取得システム100を利用する一又は複数のユーザが、ユーザ用端末2を操作してデータ解析システム1に入力した、材料分析用の計測装置等によって計測された計測データ(入力データ)を、学習済みの機械学習モデルを用いたデータ解析システム1によって解析し、計測データの解析結果である材料の構成成分や、化学状態、化学構造、物性などに関する情報(以下「材料情報」という。)を、計測データを入力したユーザのユーザ用端末2に出力データとして出力することができるように構成される。
また材料情報取得システム100は、データ解析システム1によって解析された計測データの解析結果を評価する評価者が、評価者用端末3を操作してデータ解析システム1に入力した後述する学習用データセットに基づいて、データ解析に用いられている機械学習モデルを再学習させることができるように構成される。
以下、図1を参照して、材料情報取得システム100を構成するデータ解析システム1、ユーザ用端末2及び評価者用端末3のハードウェア構成について説明する。
ユーザ用端末2は、ネットワークを介して、データ解析システム1と、材料情報取得システム100を利用する一又は複数のユーザと、の間で情報のやり取りを行うための装置である。ユーザ用端末2は、例えば、ユーザ側に設けられた、キーボードやディスプレイなどを備えるコンピュータである。なおユーザ用端末2は、材料情報取得システム100を利用するユーザが複数存在する場合は、ユーザ毎に設けることができる。
評価者用端末3は、ネットワークを介して、データ解析システム1と、データ解析システム1によって解析された計測データの解析結果を評価する評価者と、の間で情報のやり取りを行うための装置である。評価者は、例えば計測データの解析を専門とする人間の専門家である。評価者用端末3は、例えば、評価者側に設けられた、キーボードやディスプレイなどを備えるコンピュータである。なお本実施形態では、材料情報取得システム100をユーザに提供するシステム提供者側の人間を評価者としているが、ユーザ側の人間を評価者としてもよい。
データ解析システム1は、通信部10と、演算装置20と、記憶装置30と、を備える。
通信部10は、データ解析システム1を、ネットワークを介してユーザ用端末2及び評価者用端末3のそれぞれと接続し、データ解析システム1と各端末2、3との間で相互に通信を行うことができるようにするための通信インタフェース回路である。
演算装置20は、記憶装置30に格納された各種のプログラムを実行する装置であって、例えばCPU(Central Processing Unit)等である。演算装置20は、プログラムに従って処理を実行することによって、計測データ取得部21、データ解析部22(前処理部23、特徴量抽出処理部24及び特徴量解析処理部25)、解析結果送信部26、解析データ格納処理部27、学習用データセット取得部28、及び学習部29として機能し、所定の機能を実現する機能部(モジュール)として動作する。以下の説明では、各機能部を主語に処理を説明する場合、演算装置20が当該機能部を実現するプログラムを実行していることを示す。各機能部21~29の詳細については後述する。
記憶装置30は、演算装置20が実行するプログラム及びプログラムの実行時に使用されるデータを格納する装置であり、例えば、メモリ、HDD(Hard Disk Drive)、SSD(Solid State DRIVE)、RAM(Random Access Memory)及びROM(Read Only Memory)等である。記憶装置30の各データベース、すなわち、特徴量データベース31、解析結果データベース32及び学習用データベース33に格納されるデータの詳細については後述する。
続いて、引き続き図1を参照して、材料情報取得システム100の動作について説明する。
ユーザは、ユーザ側において取得した材料の計測データを、ユーザ用端末2を介してデータ解析システム1に入力することで、データ解析システム1によって解析された当該計測データの解析結果、すなわち材料情報を、ユーザ用端末2を介して出力として得ることができる。計測データとしては、材料を分析するための計測によって得られた種々のデータ、例えばX線や中性子線、電子線を材料に照射することにより得られるデータ(具体的には、X線回折(XRD)やX線吸収微細構造解析(XAFS)、X線光電子分光(XPS)、X線吸収分光(XAS)、X線吸収円二色性、小角散乱(SAS)、中性子回折(SANS)、中性子反射率、非弾性散乱、電子線回折などによる計測データ)や、顕微鏡等によって観察された材料の画像データ(具体的には、X線顕微鏡、光学顕微鏡、電子間顕微鏡、原子力間顕微鏡、コンピュータ断層撮影、透過電子線イメージング、走査電子線イメージングなどによる画像データ)などを用いることができる。
本実施形態では、計測データとして、X線回折装置によって材料(試料)を分析したときの計測データがユーザによって入力される。
データ解析システム1は、ユーザ用端末2を介してユーザによって計測データが入力されると、当該計測データの特徴量を抽出すると共に抽出した特徴量に基づいて材料の解析を行う。本実施形態では、X線回折装置によって分析された材料の計測データの特徴量として、回折ピーク位置や強度、結晶相、相分率、ピーク幅などの回折パターンが抽出され、抽出された回折パターンに基づいて材料の解析(相同定等)が行われる。
以下、データ解析システム1において実施される具体的な処理の内容について説明する。すなわち、演算装置20がプログラムに従って処理を実行することによって実現される各機能部21~29の内容について説明する。
計測データ取得部21は、ユーザによって入力された計測データを取得し、データ解析部22及び解析データ格納処理部27に出力する。
データ解析部22としての前処理部23、特徴量抽出処理部24及び特徴量解析処理部25は、それぞれ学習済みの機械学習モデルを用いて計測データを処理し、解析結果としての材料情報を最終的な出力データとして出力する。データ解析部22において用いられる機械学習モデルは特に限られるものではなく、ニューラルネットワークやサポートベクトルマシン、ランダムフォレストなど、各種の機械学習モデルを使用することができる。
前処理部23には、計測データ取得部21によって取得された計測データが入力される。前処理部23は、入力された計測データに対して、例えば平滑化(スムージング)やバックグラウンド除去などの、計測データのノイズを減らすための前処理、すなわち信号雑音比(signal-noise ratio)を高めるための前処理を施し、前処理を施した計測データ(以下「前処理済みの計測データ」という。)を特徴量抽出処理部24及び解析データ格納処理部27に出力する。
前処理部23は、入力された計測データに応じて、適切な平滑化やバックグラウンドの除去を行うことができるように予め学習される。例えば前処理部23において、計測データに対してカーネル密度推定法による平滑化を行う場合には、平滑化のための平滑化パラメータ(バンド幅)の値を例えばデータ点数等に応じて適切な値に設定する必要があるため、前処理部23は、入力された計測データに応じて適切な平滑化パラメータの値を設定して計測データの平滑化を行うことができるように予め学習される。
特徴量抽出処理部24には、前処理済みの計測データが入力される。特徴量抽出処理部24は、入力された前処理済みの計測データに応じて、計測データの特徴量を抽出することができるように予め学習されており、抽出した特徴量を特徴量解析処理部25及び解析データ格納処理部27に出力する。本実施形態では、前述したように、回折ピーク位置や強度、結晶相、相分率、ピーク幅などの回折パターンが計測データの特徴量として抽出される。なお抽出される特徴量は、これらに限られるものではなく、計測データに応じて、例えば材料の粒子径分布を特徴量として抽出したり、また計測データが画像である場合には、画像の中の幾何学的な特徴を特徴量として抽出したりしてもよい。
特徴量解析処理部25には、計測データの特徴量が入力される。特徴量解析処理部25は、入力された計測データの特徴量に基づいて材料の解析を行い、その解析結果を解析結果送信部26及び解析データ格納処理部27に出力する。本実施形態では特徴量解析処理部25は、計測データの特徴量として入力された回折パターンを、特徴量データベース31に格納された既知の材料の特徴量に関するデータ、すなわち既知の材料の回折パターンと照合し、既知の材料の回折パターンの中から類似度の高い回折パターンを選別することができるように予め学習されており、選別された回折パターンから特定された材料情報を、解析結果として解析結果送信部26及び解析データ格納処理部27に出力する。
従来、例えば平滑化パラメータの値の設定は、データ点数等に応じて解析者の直感や経験等によって行われており、また計測データの特徴量の抽出や抽出した特徴量に基づく材料の解析等も同様に、解析者の直感や経験等によって行われていた。これに対して本実施形態では、学習済みの機械学習モデルを用いて計測データが処理される。そのため、平滑化パラメータの設定や計測データの特徴量の抽出、特徴量に基づく材料の解析が、従来のように解析者に依存してしまうのを抑制することができる。
解析結果送信部26は、入力された解析結果、すなわち材料情報を、ユーザが入力した計測データの解析結果としてユーザ用端末2に送信する。
解析データ格納処理部27は、解析データ格納処理部27に入力された各データ、すなわち計測データと、当該計測データに対して前処理を施した前処理済みの計測データと、当該計測データから抽出された特徴量と、当該計測データの解析結果(材料情報)と、を関連付けて、それらを解析結果データセットとして解析結果データベース32に格納する。
評価者は、評価者用端末3を操作して解析結果データベース32にアクセスすることで、解析結果データセットを取得し、入力データと出力データとの関係性を分析して入力データから得られた出力データの良し悪しに応じた評価スコアを決定する。そして評価者は、評価者用端末3を操作して、入力データ、出力データ及び評価スコアを関連付けた学習用データセットを、データ解析システム1に入力する。
本実施形態では評価者は、計測データと、当該計測データに対して前処理を施した前処理済みの計測データと、を参照し、例えば、平滑化パラメータとして適切な値が設定されているかなど、計測データに対して適切な前処理が行われているかを評価し、評価結果に応じた評価スコアを、前処理済みの計測データに対して付与する。この際、計測データに対して適切な前処理が行われてれば、高い評価スコアが付与される。
また評価者は、計測データ(又は前処理済みの計測データ)と、当該計測データから抽出された特徴量と、を参照し、例えば、ノイズをピークとして抽出していないかなど、計測データから適切に特徴量が抽出されているかを評価し、評価結果に応じた評価スコアを、計測データから抽出された特徴量に付与する。この際、計測データから適切に特徴量が抽出されていれば、高い評価スコアが付与される。
さらに評価者は、計測データから抽出された特徴量と、当該特徴量に基づく当該計測データの解析結果と、を参照し、例えば、特徴量として入力された回折パターンと回折ピーク位置やその本数などが一致又は類似する類似度の高い回折パターンが特徴量データベース31から適切に選別されているかなど、計測データから抽出された特徴量に基づいて適切に解析が行われているかを評価し、評価結果に応じた評価スコアを、計測データの解析結果に対して付与する。この際、計測データから抽出された特徴量に基づいて適切に解析が行われていれば、高い評価スコアが付与される。
そして評価者は、計測データと、当該計測データに対して前処理を施した前処理済みの計測データと、当該計測データから抽出された特徴量と、当該計測データの解析結果と、前処理済みの計測データに対して付与された評価スコアと、特徴量に対して付与された評価スコアと、解析結果に対して付与された評価スコアと、を関連付けて、学習用データセットとしてデータ解析システム1に入力する。
このようにしてデータ解析システム1に入力された学習用データセットは、学習用データセット取得部28によって取得され、記憶装置30の学習用データベース33に格納される。すなわち学習用データセット取得部28は、評価者によって入力された学習用データセットを取得し、取得した学習用データセットを学習用データベース33に格納する。
学習部29は、学習用データベース33に格納された学習用データセットに基づいて、データ解析部22の機械学習モデルの再学習を行って、機械学習モデルを最適化する。例えば学習部29は、学習用データベース33に新たに格納された学習用データセットのデータ点数が所定数以上となったときに、データ解析部22の機械学習モデルの再学習を行って、機械学習モデルに使用される各関数の係数の値を更新し、機械学習モデルを最適化する。
本実施形態では学習部29は、前処理部23を学習するための学習用データセットとして、計測データと、計測データに対して前処理を施した前処理済みの計測データと、前処理済みの計測データに対して付与された評価スコアと、を学習用データベース33から取得し、これらに基づいて、新たな計測データが入力されたときの前処理済みの計測データの評価スコアが最大化されるように、前処理部23において使用される機械学習モデルを最適化する。これにより、例えば本実施形態では、カーネル密度推定の際に使用する平滑化パラメータの値を算出するためのモデルの各種パラメータが最適化されることになる。
また学習部29は、特徴量抽出処理部24を学習するための学習用データセットとして、計測データ(又は前処理済みの計測データ)と、計測データから抽出された特徴量と、特徴量に対して付与された評価スコアと、を学習用データベース33から取得し、これらに基づいて、新たな計測データが入力されたときの特徴量の評価スコアが最大化されるように、特徴量抽出処理部24において使用される機械学習モデルを最適化する。
また学習部29は、特徴量解析処理部25を学習するための学習用データセットとして、計測データから抽出された特徴量と、特徴量に基づく計測データの解析結果と、解析結果に対して付与された評価スコアと、を学習用データベース33から取得し、これらに基づいて、新たな特徴量が入力されたときのその特徴量に基づく計測データの解析結果の評価スコアが最大化されるように、特徴量解析処理部25において使用される機械学習モデルを最適化する。
このように本実施形態では、前処理部23、特徴量抽出処理部24及び特徴量解析処理部25の各機械学習モデルの性能が評価者によって評価され、その評価結果がデータ解析システム1に入力される。そして入力された評価結果を利用して、前処理部23、特徴量抽出処理部24及び特徴量解析処理部25の各機械学習モデルを再学習させることができる。これにより、データ解析システム1による計測データの解析が行われ、その解析結果の評価結果を利用して各機械学習モデルが再学習されるごとに、各機械学習モデルの性能を向上させることができる。
図2は、材料情報取得システム100の動作シーケンスの一例を示す図である。
ステップS1において、ユーザがユーザ用端末2を操作して計測データを入力すると、計測データがネットワークを介してデータ解析システム1に送信される。
ステップS2において、データ解析システム1は、通信部10を介して受信した計測データを取得する。
ステップS3において、データ解析システム1は、取得した計測データを解析し、解析結果としての材料情報を出力する。
ステップS4において、データ解析システム1は、解析結果としての材料情報を、通信部10を介して計測データを入力したユーザのユーザ用端末2に送信する。
ステップS5において、データ解析システム1は、解析結果データセットを解析結果データベース32に格納する。
ステップS6において、評価者は、評価者用端末3を操作して、ネットワークを介して解析結果データベース32に格納された解析結果データセットを取得する。
ステップS7において、評価者は、解析結果データセットに基づいて、データ解析システム1による計測データの解析結果を評価し、学習用データセットを作成する。
ステップS8において、評価者が評価者用端末3を操作して学習用データセットを入力すると、学習用データセットがネットワークを介してデータ解析システム1に送信される。
ステップS9において、データ解析システム1は、通信部10を介して受信した学習用データセットを取得し、学習用データベース33に格納する。
ステップS10において、データ解析システム1は、学習用データベース33に格納された学習用データセットに基づいて、計測データの解析に用いる機械学習モデルの再学習を行う。
以上説明した本実施形態によるデータ解析システム1は、演算装置20と、演算装置20に接続される記憶装置30と、演算装置20に接続されて外部の端末2,3と通信可能な通信部10と、を備える。演算装置20は、通信部10を介して受信した、材料を分析した計測データを取得する計測データ取得部21と、学習済みの機械学習モデルを用いて計測データを処理し、計測データの解析結果を出力するデータ解析部22と、計測データと、計測データを処理した処理結果と、を含むデータセットを解析結果データセットとして記憶装置30に格納する解析データ格納処理部27(格納処理部)と、通信部10を介して受信した、解析結果データセットに基づいて外部で行われた計測データの処理結果に対する評価結果を含む学習用データセットを取得する学習用データセット取得部28と、学習用データセットに基づいて、機械学習モデルを再学習させる学習部29と、を備える。
このように本実施形態によるデータ解析システム1は、学習済みの機械学習モデルを用いて計測データが処理されるため、計測データの解析結果が、計測データを解析する解析者の直感や経験等に依存してばらついてしまうのを抑制することができる。また、解析結果データセットに基づいて外部で行われた計測データの処理結果に対する評価の結果を含む学習用データセットに基づいて、機械学習モデルの再学習が行われるため、計測データの解析が行われて解析結果データセットが蓄積され、その結果として学習用データセットの点数が増大していくにつれて、機械学習モデルの性能を向上させて、計測データの解析精度を向上させることができる。
また本実施形態では、演算装置20は、計測データの解析結果を、計測データの送信元となる外部のユーザ用端末2に送信する解析結果送信部26をさらに備える。そのため、ユーザは、計測データを入力するだけで、当該計測データの解析結果を出力データとして取得することができる。
また本実施形態によるデータ解析部22は、計測データに基づいて、計測データの特徴量を抽出して出力するように予め学習された特徴量抽出処理部24と、計測データの特徴量に基づいて、特徴量に応じた計測データの解析結果を出力するように予め学習された特徴量解析処理部25と、を備える。そしてデータ解析部22は、計測データ取得部21によって取得された計測データに対して信号雑音比を高めるための処理を施し、前処理済みの計測データを出力するように予め学習された前処理部23をさらに備え、前処理済みの計測データを、入力データとして特徴量抽出処理部24に入力するように構成される。
これにより、信号雑音比を高めた計測データ、すなわち計測データからノイズが除去された前処理済みの計測データに基づいて、特徴量の抽出を行うことができるため、計測データの解析精度を一層向上させることができる。
また本実施形態では、解析データ格納処理部27は、解析結果データセットとして、計測データと、前処理部23から出力された前処理済みの計測データと、特徴量抽出処理部24から出力された計測データの特徴量と、特徴量解析処理部25から出力された計測データの解析結果と、を記憶装置30に格納するように構成される。そして学習用データセットには、前処理部23、特徴量抽出処理部24及び特徴量解析処理部25から出力された各出力データの良し悪しに応じて数値化されて各出力データに付与された評価スコアが、計測データの処理結果に対する評価結果として含まれており、学習部29は、計測データと、前処理部23から出力された前処理済みの計測データと、その前処理済みの計測データに対して付与された評価スコアと、に基づいて、前処理部23を再学習させ、計測データと、特徴量抽出処理部24から出力された計測データの特徴量と、その特徴量に対して付与された評価スコアと、に基づいて、特徴量抽出処理部24を再学習させ、計測データと、特徴量解析処理部25から出力された計測データの解析結果と、その解析結果に対して付与された評価スコアと、に基づいて、特徴量解析処理部25を再学習させるように構成される。
これにより、前処理部23、特徴量抽出処理部24及び特徴量解析処理部25を、それぞれの処理結果に応じて再学習させることができる。そのため、各処理部23~25の機械学習モデルの性能を向上させ、計測データの解析精度を向上させることができる。
また本実施形態による材料情報取得システム100は、データ解析システム1を備えると共に、データ解析システム1と通信可能な外部の端末として、データ解析システムを利用するユーザが計測データをデータ解析システム1に入力すると共に、計測データの解析結果を出力データとして受け取るためのユーザ用端末2(第1端末)と、記憶装置30から解析結果データセットを取得すると共に、取得した解析結果データセットに基づいて行われた計測データの処理結果に対する評価結果を含む学習用データセットをデータ解析システム1に入力するための評価者用端末(第2端末)と、を備える。
これにより、ユーザは、計測データをユーザ用端末2に入力するだけで、その計測データの解析結果としての材料情報を容易に取得することができる。また必要に応じて評価者が評価者用端末3を操作して解析結果データセットを取得して、その解析結果の評価結果を学習用データセットして入力するだけで、データ解析システム1の解析性能を容易に向上させていくことができる。
以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一部を示したに過ぎず、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。
例えば上記の実施形態では、データ解析部22は前処理部23を備えていたが、計測データに対して前処理が不要な場合は、前処理部23に関しては省略してもよい。なお、その場合には、解析データ格納処理部27は、解析結果データセットとして、計測データと、特徴量抽出処理部24から出力された計測データの特徴量と、特徴量解析処理部25から出力された計測データの解析結果と、を記憶装置30に格納するように構成される。そして学習用データセットには、特徴量抽出処理部24及び特徴量解析処理部25から出力された各出力データの良し悪しに応じて数値化されて各出力データに付与された評価スコアが、計測データの処理結果に対する評価結果として含まれており、学習部29は、計測データと、特徴量抽出処理部24から出力された計測データの特徴量と、その特徴量に対して付与された評価スコアと、に基づいて、特徴量抽出処理部24を再学習させ、計測データと、特徴量解析処理部25から出力された計測データの解析結果と、その解析結果に対して付与された評価スコアと、に基づいて、特徴量解析処理部25を再学習させるように構成される。
また上記の実施形態では、評価者は人間の専門家であったが、評価自体を例えば機械学習モデル等によって機械的に評価して、その評価結果をデータ解析システム1に入力すえることができるようにしてもよい。
1 データ解析システム
2 ユーザ用端末
3 評価者用端末
10 通信部
20 演算装置
21 計測データ取得部
22 データ解析部
23 前処理部
24 特徴量抽出処理部
25 特徴量解析処理部
26 解析結果送信部
27 解析データ格納処理部(格納処理部)
28 学習用データセット取得部
29 学習部
30 記憶装置
100 材料情報取得システム

Claims (8)

  1. 演算装置と、
    前記演算装置に接続される記憶装置と、
    前記演算装置に接続されて外部の端末と通信可能な通信部と、
    を備えるデータ解析システムであって、
    前記演算装置は、
    前記通信部を介して受信した、材料を分析した計測データを取得する計測データ取得部と、
    学習済みの機械学習モデルを用いて前記計測データを処理し、前記計測データの解析結果を出力するデータ解析部と、
    前記計測データと、前記計測データの解析結果と、を含むデータセットを解析結果データセットとして前記記憶装置の解析結果データベースに格納する格納処理部と、
    前記通信部を介して受信した、前記解析結果データセットに基づいて外部で行われた前記計測データの解析結果に対する評価結果を含む、学習用データセットを取得する学習用データセット取得部と、
    前記学習用データセットに基づいて、前記機械学習モデルを再学習させる学習部と、
    を備えるデータ解析システム。
  2. 前記演算装置は、
    前記計測データの解析結果を、前記計測データの送信元となる外部の前記端末に送信する解析結果送信部をさらに備える、
    請求項1に記載のデータ解析システム。
  3. 前記データ解析部は、
    前記計測データに基づいて、前記計測データの特徴量を抽出して出力するように予め学習された特徴量抽出処理部と、
    前記計測データの特徴量に基づいて、特徴量に応じた前記計測データの解析結果を出力するように予め学習された特徴量解析処理部と、
    を備える請求項1又は請求項2に記載のデータ解析システム。
  4. 前記データ解析部は
    前記計測データ取得部によって取得された前記計測データに対して信号雑音比を高めるための処理を施し、前処理済みの計測データを出力するように予め学習された前処理部をさらに備え、
    前記前処理済みの計測データを、入力データとして前記特徴量抽出処理部に入力する、
    請求項3に記載のデータ解析システム。
  5. 前記格納処理部は、
    前記解析結果データセットとして、前記計測データと、前記特徴量抽出処理部から出力された前記計測データの特徴量と、前記特徴量解析処理部から出力された前記計測データの解析結果と、を前記解析結果データベースに格納し、
    前記学習用データセットには、前記特徴量抽出処理部及び前記特徴量解析処理部から出力された各出力データの良し悪しに応じて数値化されて各出力データに付与された評価スコアが、前記計測データの解析結果に対する評価結果として含まれており、
    前記学習部は、
    前記計測データと、前記特徴量抽出処理部から出力された前記計測データの特徴量と、その特徴量に対して付与された評価スコアと、に基づいて、前記特徴量抽出処理部を再学習させ、
    前記計測データと、前記特徴量解析処理部から出力された前記計測データの解析結果と、その解析結果に対して付与された評価スコアと、に基づいて、前記特徴量解析処理部を再学習させる、
    請求項3に記載のデータ解析システム。
  6. 前記格納処理部は、
    前記解析結果データセットとして、前記計測データと、前記前処理部から出力された前処理済みの計測データと、前記特徴量抽出処理部から出力された前記計測データの特徴量と、前記特徴量解析処理部から出力された前記計測データの解析結果と、を前記解析結果データベースに格納し、
    前記学習用データセットには、前記前処理部、前記特徴量抽出処理部及び前記特徴量解析処理部から出力された各出力データの良し悪しに応じて数値化されて各出力データに付与された評価スコアが、前記計測データの解析結果に対する評価結果として含まれており、
    前記学習部は、
    前記計測データと、前記前処理部から出力された前記前処理済みの計測データと、その前処理済みの計測データに対して付与された評価スコアと、に基づいて、前記前処理を再学習させ、
    前記計測データと、前記特徴量抽出処理部から出力された前記計測データの特徴量と、その特徴量に対して付与された評価スコアと、に基づいて、前記特徴量抽出処理部を再学習させ、
    前記計測データと、前記特徴量解析処理部から出力された前記計測データの解析結果と、その解析結果に対して付与された評価スコアと、に基づいて、前記特徴量解析処理部を再学習させる、
    請求項4に記載のデータ解析システム。
  7. 請求項1から請求項6までのいずれか1項に記載のデータ解析システムを備える材料情報取得システムであって、
    外部の前記端末として、
    前記データ解析システムを利用するユーザが前記計測データを前記データ解析システムに入力すると共に、前記計測データの解析結果を出力データとして受け取るための第1端末と、
    前記解析結果データベースから前記解析結果データセットを取得すると共に、取得した前記解析結果データセットに基づいて行われた前記計測データの解析結果に対する評価結果を含む前記学習用データセットを前記データ解析システムに入力するための第2端末と、
    を備える材料情報取得システム。
  8. 演算装置と、前記演算装置に接続される記憶装置と、前記演算装置に接続されて外部の端末と通信可能な通信部と、を備えるデータ解析システムによるデータ解析方法であって、
    前記通信部を介して受信した、材料を分析した計測データを取得する計測データ取得工程と、
    学習済みの機械学習モデルを用いて前記計測データを処理し、前記計測データの解析結果を出力するデータ解析工程と、
    前記計測データと、前記計測データの解析結果と、を含むデータセットを解析結果データセットとして前記記憶装置の解析結果データベースに格納する格納処理工程と、
    前記通信部を介して受信した、前記解析結果データセットに基づいて外部で行われた前記計測データの解析結果に対する評価結果を含む、学習用データセットを取得する学習用データセット取得工程と、
    前記学習用データセットに基づいて、前記機械学習モデルを再学習させる学習工程と、
    を備えるデータ解析方法。
JP2019223756A 2019-12-11 2019-12-11 データ解析システム及びデータ解析方法 Active JP7188373B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2019223756A JP7188373B2 (ja) 2019-12-11 2019-12-11 データ解析システム及びデータ解析方法
EP20203000.3A EP3835766B1 (en) 2019-12-11 2020-10-21 Data analysis method
US17/084,096 US20210182734A1 (en) 2019-12-11 2020-10-29 Data analysis system and data analysis method
CN202011386666.7A CN112951342B (zh) 2019-12-11 2020-12-02 数据解析系统以及数据解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019223756A JP7188373B2 (ja) 2019-12-11 2019-12-11 データ解析システム及びデータ解析方法

Publications (2)

Publication Number Publication Date
JP2021092467A JP2021092467A (ja) 2021-06-17
JP7188373B2 true JP7188373B2 (ja) 2022-12-13

Family

ID=73037707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019223756A Active JP7188373B2 (ja) 2019-12-11 2019-12-11 データ解析システム及びデータ解析方法

Country Status (4)

Country Link
US (1) US20210182734A1 (ja)
EP (1) EP3835766B1 (ja)
JP (1) JP7188373B2 (ja)
CN (1) CN112951342B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11703468B2 (en) * 2021-07-01 2023-07-18 Fei Company Method and system for determining sample composition from spectral data
CN113936183A (zh) * 2021-09-10 2022-01-14 南方电网深圳数字电网研究院有限公司 基于模型训练的数据预测方法及装置
CN116010507B (zh) * 2023-03-24 2023-06-23 厚普环保科技(苏州)有限公司 一种基于大数据的水污染监测方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018025618A1 (ja) 2016-07-30 2018-02-08 株式会社リガク 物質構造の探索方法とそれに用いるx線構造解析システム
WO2018207524A1 (ja) 2017-05-07 2018-11-15 国立大学法人大阪大学 識別方法、分類分析方法、識別装置、分類分析装置および記憶媒体
WO2019060490A1 (en) 2017-09-22 2019-03-28 Saudi Arabian Oil Company THERMOGRAPHIC IMAGE PROCESSING USING NEURAL NETWORKS TO IDENTIFY CORROSION UNDER INSULATION (CUI)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6118850A (en) * 1997-02-28 2000-09-12 Rutgers, The State University Analysis methods for energy dispersive X-ray diffraction patterns
JP3593478B2 (ja) 1999-10-20 2004-11-24 株式会社リガク X線回折法におけるx線強度の較正方法
KR100979071B1 (ko) * 2002-02-22 2010-08-31 에이저 시스템즈 인크 이중 배향 다결정성 재료의 화학 기계적 연마
JP4423617B2 (ja) * 2007-01-10 2010-03-03 株式会社日立製作所 プラント制御装置
CN106127506B (zh) * 2016-06-13 2019-12-17 浙江大学 一种基于主动学习解决商品冷启动问题的推荐方法
JP6489529B2 (ja) * 2016-08-31 2019-03-27 株式会社日産アーク 構造複合体の状態推定方法及びシステム
US20180307979A1 (en) * 2017-04-19 2018-10-25 David Lee Selinger Distributed deep learning using a distributed deep neural network
CN109376061A (zh) * 2018-09-03 2019-02-22 杭州东方通信软件技术有限公司 一种信息处理方法及系统
WO2020075782A1 (ja) * 2018-10-09 2020-04-16 株式会社スカイマティクス 診断支援システム及びその方法
CN109801256B (zh) * 2018-12-15 2023-05-26 华南理工大学 一种基于感兴趣区域和全局特征的图像美学质量评估方法
CN109766930B (zh) * 2018-12-24 2020-02-07 太原理工大学 一种基于dcnn模型的矿井机械设备的剩余寿命预测方法
CN110113638A (zh) * 2019-05-10 2019-08-09 北京奇艺世纪科技有限公司 一种预测方法、装置及电子设备
CN110188331B (zh) * 2019-06-03 2023-05-26 腾讯科技(深圳)有限公司 模型训练方法、对话系统评价方法、装置、设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018025618A1 (ja) 2016-07-30 2018-02-08 株式会社リガク 物質構造の探索方法とそれに用いるx線構造解析システム
WO2018207524A1 (ja) 2017-05-07 2018-11-15 国立大学法人大阪大学 識別方法、分類分析方法、識別装置、分類分析装置および記憶媒体
WO2019060490A1 (en) 2017-09-22 2019-03-28 Saudi Arabian Oil Company THERMOGRAPHIC IMAGE PROCESSING USING NEURAL NETWORKS TO IDENTIFY CORROSION UNDER INSULATION (CUI)

Also Published As

Publication number Publication date
CN112951342A (zh) 2021-06-11
US20210182734A1 (en) 2021-06-17
EP3835766A1 (en) 2021-06-16
JP2021092467A (ja) 2021-06-17
CN112951342B (zh) 2024-04-16
EP3835766B1 (en) 2024-05-01

Similar Documents

Publication Publication Date Title
JP7188373B2 (ja) データ解析システム及びデータ解析方法
Pradhan et al. Deep learning a boon for biophotonics?
Merdietio Boedi et al. Effect of lower third molar segmentations on automated tooth development staging using a convolutional neural network
CN105590020B (zh) 改进的数据比较方法
CN115326783B (zh) 拉曼光谱预处理模型生成方法、系统、终端及存储介质
CN116560895B (zh) 用于机械装备的故障诊断方法
Janik et al. Interpretability of a deep learning model in the application of cardiac MRI segmentation with an ACDC challenge dataset
CN113077456B (zh) 基于功能性磁共振成像构建网络模型的训练方法和装置
US20220301689A1 (en) Anomaly detection in medical imaging data
EP3989126B1 (en) Method for the automatic identification and quantification of radioisotopes in gamma spectra
CN110648763A (zh) 利用人工智能进行光谱分析以进行肿瘤评估的方法及设备
US20200279148A1 (en) Material structure analysis method and material structure analyzer
Varalakshmi et al. Detection of Osteoporosis with DEXA Scan Images using Deep Learning Models
EP4127662A1 (en) Systems and methods for interpreting high energy interactions
Hahn et al. Disentangling latent factors of variational auto-encoder with whitening
CN115277205B (zh) 模型训练方法及装置、端口的风险识别方法
Zou et al. Automatic diagnosis of melanoma based on EfficientNet and Patch Strategy
Yang et al. Recognition of the hardness of licorice seeds using a semi-supervised learning method and near-infrared spectral data
Mosci et al. Dimensionality reduction and generalization
Likhitha et al. Skin cancer classification using CNN in comparison with support vector machine for better accuracy
Magalhães et al. Hyperspectral image synthesis from sparse RGB data: a comparative study combining linear regression, multilayer perceptron, and clustering
CN110473161A (zh) 创建图像链的方法
Altuntaş et al. Categorization of breast carcinoma histopathology images by utilizing region-based convolutional neural networks
Cattelan et al. How to fix a broken confidence estimator: Evaluating post-hoc methods for selective classification with deep neural networks
Kaya et al. eFis: A Fuzzy Inference Method for Predicting Malignancy of Small Pulmonary Nodules

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211216

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220824

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221020

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221114

R151 Written notification of patent or utility model registration

Ref document number: 7188373

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151