JP6925655B2 - 物質の分析装置 - Google Patents

物質の分析装置 Download PDF

Info

Publication number
JP6925655B2
JP6925655B2 JP2019221081A JP2019221081A JP6925655B2 JP 6925655 B2 JP6925655 B2 JP 6925655B2 JP 2019221081 A JP2019221081 A JP 2019221081A JP 2019221081 A JP2019221081 A JP 2019221081A JP 6925655 B2 JP6925655 B2 JP 6925655B2
Authority
JP
Japan
Prior art keywords
data
analysis
compounds
compound
substance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019221081A
Other languages
English (en)
Other versions
JP2020091872A (ja
Inventor
ソン,キ−ソン
イ,ジン−ウン
Original Assignee
インダストリー アカデミー コーオペレーション ファウンデーション オブ セジョン ユニバーシティー
インダストリー アカデミー コーオペレーション ファウンデーション オブ セジョン ユニバーシティー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020190150069A external-priority patent/KR102235934B1/ko
Application filed by インダストリー アカデミー コーオペレーション ファウンデーション オブ セジョン ユニバーシティー, インダストリー アカデミー コーオペレーション ファウンデーション オブ セジョン ユニバーシティー filed Critical インダストリー アカデミー コーオペレーション ファウンデーション オブ セジョン ユニバーシティー
Publication of JP2020091872A publication Critical patent/JP2020091872A/ja
Application granted granted Critical
Publication of JP6925655B2 publication Critical patent/JP6925655B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0418Architecture, e.g. interconnection topology using chaos or fractal principles
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Description

本発明は無機物および有機物などの多様な物質に含まれた元素、相(phase)、組成などの判別および分析を効率的に遂行できるようにする方法に関する。
粉末分析技術に基づいた物質の発見過程で最も頻繁に直面する状況の一つは知られていない多相化合物の識別および定量化と関連がある。
一般的に物質に含まれた元素、相(phase)、成分などの分析には、XRD、XPS、EDSなどの多様な分析装備が使われている。ところが、前記分析装備を通じて収得した分析結果は、該当技術分野に専門的な知識と多くの経験を有する人が相当な時間をかけないと、正確な分析結果を得られない場合が多い。
物質分析時間を短縮するために、開発されている多様な分析ソフトウェアがある。例えば、理論結晶学的理論を基盤とするアルゴリズムを通じての分析があるが、十分な正確度を提供できない。また、機械学習方法を利用することも、訓練データセットが小規模であり、理論的な知識に基づいた過度なフィーチャーエンジニアリングを使うため、既存の規則基盤の分析ソフトウェアと大差ない結果を提供する。
また、既存の分析ソフトウェアは、該当物質を含む製造工程ラインでリアルタイムで製造されている物質に関する情報を正確に導き出せるものは殆どないと言える。
大韓民国公開特許公報第10−2018−0073819号
本発明の課題は、無機物および有機物などの多様な物質に含まれた元素、相(phase)または含量などの判別と分析を、短時間内に高精度で行うことができるようにする、物質の判別および分析方法を提供するところにある。
前記課題を解決するために本発明は、(a)2以上の元素を選択する段階;(b)前記2以上の元素で生成可能なものと分析された複数の化合物のデータを収集する段階;(c)前記収集された複数の化合物のそれぞれに関するイメージまたはスペクトル形態の分析データを準備する段階;(d)前記複数の化合物のうち、2種以上の化合物を選択して所定の混合比率で混合し、前記それぞれのイメージまたはスペクトルデータを前記所定の混合比率に合わせて混合加工したものを含めて訓練データを作る段階;(e)前記訓練データを使って機械学習を遂行する段階;および(f)実際物質から得たイメージまたはスペクトル形態の分析データを前記機械学習を通じて収得したモデルを使って判別および/または分析する段階を含む、物質の判別および分析方法を提供する。
前記方法において、前記2以上の元素を選択する段階において、好ましい元素の数は2〜10であり、より好ましい元素の数は3〜8である。
前記方法において、前記複数の化合物のデータは現在まで遂行されている化学分析、物質分析データを利用することができる。例えば、無機物の場合、ICSDに登録された化合物を使うことができる。
前記方法において、前記複数の化合物に関してそれぞれのイメージまたはスペクトル形態の分析データを準備する段階は、実際に分析された結果を使ったり、それぞれの化合物に関する物質情報を利用してプログラムを使って該当分析イメージまたはスペクトルを計算したものを使ってもよい。
前記方法において、前記所定の混合比率は例えば、A化合物、B化合物、C化合物の3種の化合物が存在する場合、前記3種の化合物の含量が質量%で0.5%単位で変更されるようにし、それに合わせてイメージまたはスペクトルデータを加工する形態であり得るが、分析する物質の特性および備えられるデータの事情に合わせて調節され得、必ずしもこれに制限されるものではない。
前記方法において、前記イメージまたはスペクトル形態の分析データは機械学習が可能な形態であれば特に制限されず、例えば、XRDデータ、XPSデータ、IRデータ、透過電子顕微鏡回折パターンなどが使われ得る。
前記方法において、前記機械学習は多様な形態のアルゴリズムが適用され得、例えばCNN(Convolutional Neural Network)を通じて遂行され得る。
本発明によると、任意の元素からなる成分システムを設定し、このシステムで可能であると知られているすべての化合物の分析データを利用して、前記すべての化合物の混合比率をあらかじめ想定してイメージまたはスペクトルデータを加工して訓練データセットで機械学習をした後、機械学習の結果物である予測モデルを通じて、実際物質の判別および/または分析が行われるので、短時間内に正確な分析結果を導き出すことができる。例えば、鉄鋼工場ラインで、XRDデータ結果を本発明で収得したフィッティング結果を使う場合、リアルタイムで相(phase)分析が可能であるため不良発生の有無を確認できるようになる。
また、本発明に係る物質の判別および/または分析方法は、従来開発された理論基盤のソフトウェア方式などと比べ、多様な成分が混合されている実際物質の相分析および相分率の分析を高精度で遂行できるようにする。
本発明の実施例に係る物質の判別方法に関するフローチャートである。 本発明の実施例で使われた化合物を示したものである。 本発明の一実施形態により、ICSD結晶構造データからXRD構成パラメーターを利用して特定化合物のXRDデータを計算して導き出す段階を説明する図面である。 分析しようとする成分を含む無機化合物であるAl、LiO、SrOおよびSrAlの実際に分析したXRDパターンと、前記方法を通じてシミュレーションされたXRDパターンとを比較したものである。 各化合物の混合データを導き出す過程を示したものである。 図5で導き出された混合比率に合わせてXRDデータを加工する過程を示したものである。 混合XRDデータを導き出す具体的な条件を示したものである。 本発明の実施例でディープランニングに使った第1CNNアーキテクチャーを示したものである(aはCNN2、bはCNN3)。 本発明の実施例でディープランニングに使った第2CNNアーキテクチャーを示したものである。 「Dataset_800k_org」を使った場合、学習コストおよび正確度を示したものである。 「Dataset_800k_rand」および「Dataset_180k_rand」を使った場合、学習コストおよび正確度を示したものである。
以下、本発明の実施例について添付された図面を参照してその構成および作用を説明する。下記の本発明の説明において、関連した公知の機能または構成についての具体的な説明が本発明の要旨を不要に曖昧にさせ得ると判断される場合にはその詳細な説明を省略する。また、ある部分がある構成要素を「含む」とする時、これは特に反対の記載がない限り、他の構成要素を除くものではなく他の構成要素をさらに含むことができることを意味する。
図1は、本発明の実施例に係る物質の判別方法に関するフローチャートである。図1に図示されたように、本発明の実施例に係る物質の判別方法は、分析しようとする物質を構成する元素を選定する段階と、選定された元素で可能な化合物に関する情報を抽出する段階と、抽出された各化合物に対するXRDデータをシミュレーションする段階と、シミュレーションされたXRDデータを所定比率で混合して機械学習用ビッグデータを製造する段階と、CNNアーキテクチャーを通じて機械学習を遂行する段階を含んで構成される。
[元素の選定および化合物データの収集]
本発明の実施例では、分析しようとする物質に含まれる元素として、無機発光物質の典型的な成分であるストロンチウム(Sr)、アルミニウム(Al)、リチウム(Li)および酸素(O)を選定した。
次いで、前記4つの元素を含む化合物情報を無機結晶構造データ(ICSD、Inorganic Cryatal Structure Data)を通じて確認した結果、総174個が登載されており、このうち、5個は誤ったものであるため除外した。ここに2018年ICSDバージョンには含まれていないが、最近発見された4元系化合物であってLED用発光材料で有望なSrLiAlOを追加した。
このような過程を通じて、ストロンチウム(Sr)、アルミニウム(Al)、リチウム(Li)および酸素(O)を含む総170個の化合物情報を抽出したし、抽出された無機化合物を図2に示した。
本発明の実施例では分析しようとする物質を無機物に選定してICSDデータを利用したが、異なる形態の物質の場合、異なる形態のデータを使用できることは言うまでもない。
[化合物分析のためのXRDデータシミュレーション]
以上のような化合物の分析には多様な分析方法が使われ得るため、化合物の分析に適用しようとする分析方法を選択し、関連データの確保が必要である。物質の分析にはXRDデータ、XPSデータ、またはIRデータなどの多様なデータが使われ得るが、本発明の実施例では、無機物の相(phase)を判別する分析に一般的に使われているXRDを物質判別用分析データとして選択した。
次に、170個の化合物に関するXRDデータがある場合、該当XRDデータを使ってもよいが、本発明の実施例では十分なXRDデータがなくても、機械学習に十分な効果を具現できるように、シミュレーション方法を通じてXRDデータを準備した。
図3は、ICSD結晶構造データから特定化合物のXRDデータをシミュレーションする過程を示したものである。
本発明の実施例ではバックグラウンドシミュレーションのための総6個の無作為パラメーターを選択し、ピーク状のシミュレーションのためには総5個の無作為パラメーターを使用し、ランダムノイズデータを付与する方法を通じて、実際と非常に類似するシミュレーションされたXRDパターンデータを導き出した。この時、ICSD結晶情報からXRDパターンを導き出す時に格子定数を無作為で変形させてより多くの数のXRDパターンを導き出せるようにした。
シミュレーションされたXRDパターンは、ICSDから得た構造ファクター(structural factor)および熱的ファクター(thermal factor)と、多重度(multiplicity)、ローレンツポラリゼーションファクター(Lorentz and polarization factor)、吸収度(absorption)および優先方向(preferred orientation)を固定変数に使用し、同時にピークプロファイル(Cagliotiおよびミキシング媒介変数)、背景およびホワイトノイズのような調整可能な媒介変数を使って得た。
具体的には、ICSDに提示されたシンメトリー(symmetry)データから多重度を得、入射ビームに黒鉛モノクロメーターが装着されたブラッグブレンターノ(Bragg−Brantano)ジオメトリーを使って一般実験用XRDにポラリゼーション補正が適用されたし、優先配向は存在しないと見なした。また、実験室規模のX線回折計によく現れるパラメーター値を参照して調整可能な変数(parameter)を無作為で割り当てた。
図4は、分析しようとする成分を含む無機化合物であるAl、LiO、SrOおよびSrAlの実際に分析したXRDパターンと、前記方法を通じてシミュレーションされたXRDパターンとを比較したものである。図4で上に表示されたパターン(緑色)は実際の実験を通じて分析された結果を示したものであり、下に表示されたパターン(茶色)は前記方法でシミュレーションされたXRDパターンを示したものである。図4に示したように、シミュレーションされたXRDパターンと実際のXRDパターン間には差を区分することが難しいほど非常に類似する形態を示した。これを通じて、本発明の実施例によりシミュレーションされたXRDパターンは機械学習用訓練データに適用できると思われ、これはシミュレーションXRDパターンを利用した機械学習を通じて樹立したモデルを使って実際物質の正確な判別につながる結果を通じても確認される。
以上のような過程を通じて、総170個の化合物に対する多様なシミュレーションXRDパターンを導き出した。
[訓練データセット作成]
図5は、各化合物の混合データを導き出す過程を示したものであり、図6は図5で導き出された混合比率に合わせてXRDデータを加工する過程を示したものであり、図7は混合データを導き出す具体的な条件を示したものである。
図5に図示されたように、A化合物、B化合物、C化合物を利用した1種(unary)、2種(binary)、3種(ternary)の混合物に対する組成の選択と混合比率の割当を通じて多様な成分と混合比率を有する混合物が導き出されるようにした。
2種および3種の混合は、図2に示したグループに基づいて、170個ではなく38個のクラスで構成された組み合わせに基づいて生成した。その後、クラスを選択するたびに各構成要素に170個の変形物のうち一つを無作為で割り当てた。例えば、Alが関心混合物の成分として選択された時、74個の変形のうち一つをAlに無作為で割り当てた。これを通じてAlは74個の変形が少なくとも一度は現れるようにした。また、38×21+38×9+38(183,521)の異なる混合物に対して、3種混合物は21個の固定された組成を有し、2種混合物は9個の固定された組成を有する。すなわち、混合物当たり平均4倍反復を招き得るが、多くの変形がある一部の混合物についてのみ反復的な選択を採択したため、全体データセットから同じ混合物(すなわち、同一成分および同一分率)をほとんど見出すことができなかった。このような方式でデータの準備をしないと、38個のクラスのそれぞれが同じ選択機会を有するため、例えば変形相がないLiに比べて74個の変形相があるAlの各相が選択される可能性がはるかに少なくなる問題が発生する可能性がある。
以上のような過程を通じて混合比率が導き出されると、図6に図示された方法を通じて、混合物のXRDパターンを導き出す。図6に図示された通り、A化合物でシミュレーションされたXRDパターンとB化合物でシミュレーションされたXRDパターンとC化合物でシミュレーションされたXRDパターンを、混合物の混合比率に合わせてXRDパターンを足す方法を通じて、混合物のXRDパターンを導き出した。
混合物のシミュレーションされたXRDパターンは、2種または3種混合物組み合わせを構成するために、170個のエントリーから2〜3個の化合物を選択するたびに、ピークプロファイルが無作為で選択されるようにして総800,942個のXRDパターンの間に同じものが存在しないようにした。この過程で使われた具体的な条件は図7に示した。この時、同一クラス(class)に属するエントリーで構成された2種または3種混合物組み合わせはすべて除外した。また、任意に選択された背景および白色雑音が各混合物に適用された。
また、導き出されたXRDパターンは、無作為で訓練用データセット(600,942パターン)、有効性検査用データセット(100,000パターン)およびテストデータセット(100,000パターン)にそれぞれ分割された。
また、データ類似性がないようにランダム組成選択および反復選択がない条件で、前記した方法に比べて縮小されたデータセットを別途に準備したし、この縮小されたデータセットの混合物数は38×21+38×9+38(183,521)に減った。
以上のような過程を通じて3種類のデータセットが準備された。図5の上に示したように、A化合物、B化合物、C化合物の3種21個、2種9個を等間隔で分け、図2に示した物質のうちICSD個数が多く含まれている混合物は図7に示した条件により反復して生成した800,942個のXRDパターンデータを「Dataset_800k_org」という。
図5の下に示したように、A化合物、B化合物、C化合物の3種21個、2種9個をランダムに分けて、図2に示した物質のうちICSD個数が多く含まれている混合物は図7と同じ条件により反復して生成した800,942個のXRDパターンデータを「Dataset_800k_Rand」という。
A化合物、B化合物、C化合物の3種21個、2種9個をランダムに分け、反復回数なしに生成された183,521個のXRDパターンデータを「Dataset_180k_Rand」という。
[CNNを適用したディープランニング]
本発明の実施例ではデータセットの大きさが大きく、多相XRDパターンを扱うため、この分析に適合したCNNを適用して機械学習を遂行した。
図8および図9は、本発明の実施例でディープランニングに使った二つのCNNアーキテクチャーを示したものである。
図8および図9に示したように、CNNアーキテクチャーは、複数のコンボリューションレイヤ(convolution layer)とプーリングレイヤ(pooling layer)と3個の連続的に連結された全結合層(fully connected layer)で構成される。
具体的には、図8に図示されたように、2個のコンボリューションレイヤがるアーキテクチャーを「CNN_2」といい、図9に図示されたように、3個のコンボリューションレイヤがあるアーキテクチャーを「CNN_3」という。この二つのアーキテクチャーにおいて、フィルタ数、カーネルの大きさ、プーリング大きさ、ストライドの構成は図8および図9に図示された通りである。
一方、図8に示されたように、本発明の実施例では、ストライドがコンボリューションレイヤのうち一つのプーリング大きさより広いものを採択したが、このような構成は既存のプーリングより顕著に早い収束を提供した。一方、CNN2およびCNN3のプーリング大きさと同じストライドでもテストした結果、収束は相対的に遅いが正確度は実質的に同じ水準と示された。
また、コンボリューションレイヤのための活性化関数と全結合層のための線形関数として整流線形ユニット(Relu)が採択されたし、ドロップアウトは全結合層に対してのみ具現された。全結合層に対する最終活性化機能はシグモイド機能であり、それによるコスト(または損失)機能は交差エントロピー機能であった。入力は4501×1ベクトルを、出力は38×1ベクトルにした。また、Adamオプティマイザーを使った。相の識別のためのすべてのエポック(epoch)に対して実行速度は0.001に固定された。
以上のようなCNNアーキテクチャーで訓練データセットを使って予測モデルを導き出した。
一方、本発明の実施例で適用したCNNアーキテクチャーは多様に変形され得、本実施例で提示したアーキテクチャーに制限されない。さらに、必ずしもCNNのみを利用する必要もなく、例えば循環神経網(Recurrent Neural Network、RNN)を使ってもよく、特にシミュレーションで導き出されたXRDパターンの実測XRDパターンとの差を補完するためには、生成的敵対神経網(Generative Adversarial Network、GAN)技術が適用されてもよい。
[CNN予測モデルを利用した相判別結果]
以上で説明した訓練データセットを使ってCNN2およびCNN3アーキテクチャーを通じての学習結果を通じて導き出された予測モデルを使用して、相判別(phase identification)が可能であるかをテストした。
(1)Dataset_800k_org
図10は「Dataset_800k_org」を使った場合、学習コストおよび正確度を示したものである。図9で確認されるように、CNN2アーキテクチャーやCNN3アーキテクチャーはいずれも有効性検査結果の正確度がほとんど100%に到達したし、CNN2およびCNN3に対して有効性検証コストがそれぞれ0.007および0.0018に減少した。
「Dataset_800k_org」を使って訓練したCNN2およびCNN3のテストのために、訓練データセットと重ならないように100,000個のシミュレーションXRDパターンを準備したし、また、3種の化合物LiO−SrO−AlとSrAl−SrO−Alを多様な分率で乾式混合してそれぞれ50個の混合物サンプルを製造して、実際のXRDパターンを獲得して相判別テストに使った。
下記の表1は前記二つのテストデータセットを使ってテストした結果を示したものである。
Figure 0006925655
前記表1に示されたように、シミュレーションされたテストデータセットはCNN2およびCNN3アーキテクチャーにいずれもテスト正確度がほぼ完ぺきな水準と示された。また、LiO−SrO−Alデータセットのテスト結果もCNN2およびCNN3のすべてに対して正確度が100%であって完ぺきに一致した。
一方、SrAl−SrO−Alデータセットの場合、テスト正確度が多少低下する結果を示すが、これは混合原料として使われたSrAl(SAO)粉末に一定量の不純物相が含まれたことによるものと確認されたし、これは若干の誤予測された結果がCNNモデルのエラーではないという点を意味する。
このようなテスト結果から、本発明の実施例に係る方法が、多様な物質が混合された多成分系物質に含まれた相(phase)の判別において、非常に高い正確度を提供できるということが分かる。
(2)Dataset_800k_rand/Dataset_180k_randによる相識別
データセット「Dataset_800k_rand」と「Dataset_180k_rand」は前記データセットとは異なって、2種および3種混合物の設定において任意的な方法を使ったものであって、訓練データセットを準備する時、混合物データを生成する時にブレンディング方法の差による影響を比較するためのものである。
図11に示されたように、Dataset_800k_orgを使ってCNNを遂行した場合と実質的に同じコストおよび正確度が達成された。
下記の表2は前記したテストデータセットを利用してテストした結果を示したものである。
Figure 0006925655
表2のように、シミュレーションされたテストデータセットと実際のLiO−SrO−Alテストデータセットは、「Dataset_800k_rand」で訓練する時にほぼ100%の正確度を示した。一方、「Dataset_180k_rand」で訓練すると、シミュレーションされたテストデータセットと実際のテストデータセットでいずれもテスト正確度が多少低下する傾向を示すが、これは訓練データセットの大きさが相対的に小さいことに起因すると思われる。
以上のような結果から、訓練データセットを準備する時に混合物のブレンディング方法の差による影響は殆どなく、データセットの大きさにより正確度に若干の差が存在し得ることが分かる。

Claims (5)

  1. (a)2以上の元素を選択し、
    (b)前記2以上の元素で生成可能なものと分析された複数の化合物のデータを収集し、
    (c)前記収集された複数の化合物のそれぞれに関するイメージまたはスペクトル形態の分析データを準備し、
    (d)前記複数の化合物のうち、2種以上の化合物を選択して、前記それぞれのイメージまたはスペクトルデータを所定の混合比率に合わせて混合加工したものを含めて訓練データを作り、
    (e)前記訓練データを使って機械学習を遂行し、;
    (f)実際物質から得たイメージまたはスペクトル形態の分析データを前記機械学習を通じて収得したモデルを使って、2種以上の化合物に含まれている化合物および相分率を分析する、物質の分析装置
  2. 前記複数の化合物の分析データは、既に分析されている化学分析、物質分析データを利用する、請求項1に記載の物質の分装置
  3. 前記(c)においては、実際に分析された結果を使ったり、それぞれの化合物に関する物質情報を利用してプログラムを使って該当分析イメージまたはスペクトルをシミュレーションして獲得する、請求項1に記載の物質の分装置
  4. 前記イメージまたはスペクトル形態の分析データは、XRDデータ、XPSデータ、IRデータまたは透過電子顕微鏡回折パターンである、請求項1に記載の物質の分装置
  5. 前記機械学習はCNN(Convolutional Neural Network)を通じて遂行される、請求項1に記載の物質の分装置
JP2019221081A 2018-12-06 2019-12-06 物質の分析装置 Active JP6925655B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2018-0156028 2018-12-06
KR20180156028 2018-12-06
KR10-2019-0150069 2019-11-21
KR1020190150069A KR102235934B1 (ko) 2018-12-06 2019-11-21 물질의 판별 및 분석 방법

Publications (2)

Publication Number Publication Date
JP2020091872A JP2020091872A (ja) 2020-06-11
JP6925655B2 true JP6925655B2 (ja) 2021-08-25

Family

ID=70971922

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019221081A Active JP6925655B2 (ja) 2018-12-06 2019-12-06 物質の分析装置

Country Status (2)

Country Link
US (1) US11449708B2 (ja)
JP (1) JP6925655B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112710614B (zh) * 2020-12-18 2021-10-22 江苏省苏力环境科技有限责任公司 用于生态环保的多源卫星数据处理方法、系统及存储介质
CN116609366A (zh) * 2022-02-08 2023-08-18 中国石油天然气股份有限公司 一种基于计算机图像识别技术的矿物含量分析方法
EP4537097A1 (en) * 2022-06-06 2025-04-16 The Regents Of The University Of California Methods for electrochemical mechanistic analysis of cyclic voltammograms
US12587274B2 (en) 2023-03-28 2026-03-24 Quantum Generative Materials Llc Satellite optimization management system based on natural language input and artificial intelligence
JP7417823B1 (ja) 2023-06-08 2024-01-19 合同会社Technology On Demand 仮想x線回折プロファイルデータ作成装置、仮想x線回折プロファイルデータ作成方法、プログラム、及び仮想x線回折プロファイルデータ
US12368503B2 (en) 2023-12-27 2025-07-22 Quantum Generative Materials Llc Intent-based satellite transmit management based on preexisting historical location and machine learning

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0512945D0 (en) * 2005-06-24 2005-08-03 Oxford Instr Analytical Ltd Method and apparatus for material identification
EP1967846A1 (en) * 2007-03-05 2008-09-10 National University of Ireland Galway En ensemble method and apparatus for classifying materials and quantifying the composition of mixtures
EP1992939A1 (en) * 2007-05-16 2008-11-19 National University of Ireland, Galway A kernel-based method and apparatus for classifying materials or chemicals and for quantifying the properties of materials or chemicals in mixtures using spectroscopic data.
JPWO2018025618A1 (ja) * 2016-07-30 2019-09-19 株式会社リガク 物質構造の探索方法とそれに用いるx線構造解析システム
KR20180073819A (ko) 2016-12-23 2018-07-03 (주)지플러스 웹 기반 실험 대상 물질의 정량적 구조 활성 관계 분석 시뮬레이션 시스템 및 그 제공 방법

Also Published As

Publication number Publication date
JP2020091872A (ja) 2020-06-11
US11449708B2 (en) 2022-09-20
US20200184266A1 (en) 2020-06-11

Similar Documents

Publication Publication Date Title
JP6925655B2 (ja) 物質の分析装置
Risum et al. Using deep learning to evaluate peaks in chromatographic data
JP5071475B2 (ja) 重回帰分析による予測モデルの作成方法、作成装置、作成プログラム
Kiratidis et al. Lattice baryon spectroscopy with multiparticle interpolators
US20100153323A1 (en) ensemble method and apparatus for classifying materials and quantifying the composition of mixtures
DE112012004324T5 (de) Multikomponentenregression/Multikomponentenanalyse von Zeit- und/oder Raumreihendateien
KR102226225B1 (ko) 다양화 및 결함 발견을 위한 동적 비닝
CN107727676A (zh) 一种基于向前间隔偏最小二乘算法的土壤重金属含量建模方法
WO2023212804A1 (en) Producing an augmented dataset to improve performance of a machine learning model
EP3671553A1 (en) Method of identification and analysis for materials
JP5598926B2 (ja) X線回折測定データの解析方法
KR102235934B1 (ko) 물질의 판별 및 분석 방법
Muzellec et al. Saliency strikes back: How filtering out high frequencies improves white-box explanations
JP6807319B2 (ja) 自動定量的回帰
CN108681697A (zh) 特征选择方法及装置
CN105899937B (zh) 识别物质的存在
JP4315975B2 (ja) ノイズ成分除去方法
JP2016110626A5 (ja)
Zaritsky et al. Globular cluster populations: first results from s4g early-type galaxies
Kansy et al. Study of defect structure with new software for numerical analysis of PAL spectra
Bonnett et al. Redshift distributions of galaxies in the DES Science Verification shear catalogue and implications for weak lensing
KR20250125403A (ko) 이미지에 기반한, 폴리머 조성물의 연성-취성 전이온도 예측
KR20200084376A (ko) 물질의 판별 및 분석 방법
JP2024157277A (ja) 演算プログラム、演算方法、および情報処理装置
Lavrukhina et al. The largest ground-based catalogue of M-dwarf flares

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210728

R150 Certificate of patent or registration of utility model

Ref document number: 6925655

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250