JP7477859B2 - 計算機、計算方法及びプログラム - Google Patents
計算機、計算方法及びプログラム Download PDFInfo
- Publication number
- JP7477859B2 JP7477859B2 JP2020044786A JP2020044786A JP7477859B2 JP 7477859 B2 JP7477859 B2 JP 7477859B2 JP 2020044786 A JP2020044786 A JP 2020044786A JP 2020044786 A JP2020044786 A JP 2020044786A JP 7477859 B2 JP7477859 B2 JP 7477859B2
- Authority
- JP
- Japan
- Prior art keywords
- feature vector
- calculation unit
- likelihood
- class
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004364 calculation method Methods 0.000 title claims description 106
- 230000000295 complement effect Effects 0.000 claims description 84
- 238000009826 distribution Methods 0.000 claims description 83
- 238000012887 quadratic function Methods 0.000 claims description 40
- 230000006870 function Effects 0.000 claims description 36
- 238000000034 method Methods 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 12
- 238000005315 distribution function Methods 0.000 claims description 12
- 238000013178 mathematical model Methods 0.000 description 43
- 238000011156 evaluation Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 8
- 239000000203 mixture Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 230000015654 memory Effects 0.000 description 6
- 238000010200 validation analysis Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
本開示の目的は、制約の少ないモデルにより、想定しないクラスに属する事後確率の推定を可能とするための計算機、計算方法及びプログラムを提供することにある。
《クラス識別システム1》
以下、図面を参照しながら実施形態について詳しく説明する。
図1は、第1の実施形態に係るクラス識別システム1の構成を示す概略ブロック図である。クラス識別システム1は、複数のクラスの中から入力信号が属するクラスを識別するためのシステムである。クラス識別システム1は、学習段階において設定された複数の既知クラスと、当該複数の既知クラスのいずれにも属しないことを示す余事象クラスについて、入力信号の尤度を計算する。
第1の実施形態に係る数理モデルについて説明する。
第1の実施形態に係るクラス識別システム1は、混合正規分布モデル(Gaussian Mixture Model:GMM)によって既知クラスの分布を表し、以下に示す混合余事象分布モデル(Complementary Gaussian Mixture Model:CGMM)によって余事象クラスの分布を表す。
既知クラスの数がK個である場合、各既知クラスは、GMMにより、以下の式(1)によって表される。すなわち、第1の実施形態において、信号xnの既知クラスkにおける生起確率f(xn)は、以下の式(1)によって表される。
g(xn:μ(k,m),Σ(k,m))は、式(2)で表される正規分布コンポーネントを示す。μ(k,m)は、既知クラスkのm番目の正規分布コンポーネントの平均値ベクトルを示し、Σ(k,m)は、既知クラスkのm番目の正規分布コンポーネントの共分散行列を示す。
また、式(2)のq(xn)は、既知クラスkのm番目の正規分布コンポーネントにおける信号xnの偏差を変数とする二次関数を示す。
発明者らは、既知クラスの数がK個である場合における余事象クラスを、以下の式(6)として定義した。すなわち、第1の実施形態において、信号xnがいずれの既知クラスkにも属しない確率fc(xn)は、以下の式(6)によって表される。
図2は、第1の実施形態に係る余事象分布関数の例を示すグラフである。図2の横軸は信号xnの値であり、縦軸は生起確率を示す。図2に示すように、正規分布関数g(x)に二次関数q(x)を乗算することで、既知クラスkのm番目の正規分布コンポーネントの周りに信号が分布するドーナツ状の分布を表すことができる。
これらを総合し、信号xnのK個の既知クラスおよび1個の余事象クラスにおける生起確率F(xn)は、以下の式(8)によって表される。以下、余事象クラスをk=0のクラスとして表す。
ここで、上記のパラメータθの制約を緩和するため、上記のCGMMを対数線形化する。既知クラスのGMMを構成する複数の正規分布コンポーネントの対数をYn (k,m)とおくと、当該関数Yn (k,m)は、以下の式(10)のように表される。
以下、式(18)に示される事後確率を表す数理モデルの構成について説明する。図3は、第1の実施形態に係る数理モデルの構造を示す図である。図3に示すように、数理モデル90は、5層のフィードフォワード型ネットワークである。つまり、数理モデル90は、第1層91、第2層92、第3層93、第4層94および第5層95を備える。
ここで、図1に示すクラス識別システム1が備える学習装置20の構成について説明する。学習装置20は、数理モデル90を訓練し、各ノードのパラメータの値を決定する。
図4は、第1の実施形態に係る学習装置20の構成を示す概略ブロック図である。学習装置20は、モデル記憶部21、データセット受付部22、分割部23、変換部24、第1学習部25、評価部26、第2学習部27、出力部28を備える。
データセット受付部22は、数理モデル90の訓練に用いる複数のデータセットの入力を受け付ける。データセットは、信号xnを入力サンプルとし、当該信号xnが属するクラスのラベルを出力サンプルとする。
第2学習部27は、評価値PRecallと、新たな事前確率を適用した場合の評価値との差が所定の終了判定閾値以下である場合に、学習処理を終了すると判定する。
図5は、第1の実施形態に係る学習装置20の動作を示すフローチャートである。
学習装置20のデータセット受付部22が複数のデータセットの入力を受け付けると(ステップS1)、分割部23は、複数のデータセットを、学習用データセットと検証用データセットに分割する(ステップS2)。
他方、評価値PRecallが許容閾値以下となった場合(ステップS7:YES)、出力部28は、学習処理を終了した数理モデル90の学習済みモデルを、識別装置10に出力する(ステップS9)。
ここで、図1に示すクラス識別システム1が備える識別装置10の構成について説明する。識別装置10は、学習装置20によって訓練された学習済みの数理モデル90を用いて、入力データのクラスを識別する。
図6は、第1の実施形態に係る識別装置10の構成を示す概略ブロック図である。識別装置10は、モデル取得部11、モデル記憶部12、データ入力部13、変換部14、識別部15、出力部16を備える。
モデル記憶部12は、モデル取得部11が取得した学習済みの数理モデル90を記憶する。
データ入力部13は、クラスの識別対象となる入力データの入力を受け付ける。
変換部14は、式(11)に従って、入力データxnを非線形変換し、信号Xnを得る。
識別部15は、変換部14が変換した信号Xnをモデル記憶部12が記憶する学習済みモデルに入力することで、当該信号Xnの複数のクラスの尤度を算出し、当該尤度に基づいて、入力データが属するクラスを評価する。つまり、識別部15は、数理モデル90に従って計算をすることで、正規分布計算部92A、二次関数計算部92B、対数計算部93A、余事象対数計算部93B、クラスコンポーネント計算部94A、余事象コンポーネント計算部94B、既知クラス尤度計算部95A、および余事象尤度計算部95Bとして機能する。
出力部16は、識別部15による評価結果を出力する。
図7は、第1の実施形態に係る識別装置10の動作を示すフローチャートである。なお、以下の説明では、学習装置20による学習済みの数理モデル90は、モデル記憶部12に既に記憶されているものとする。
このように、第1の実施形態に係るクラス識別システム1によれば、識別装置10は、K個のクラスに係る分布を表す複数の正規分布の確率密度関数とに基づいて第1中間ベクトルを生成する正規分布計算部92Aと、正規分布に係る係数に基づく複数の二次関数とに基づいて第2中間ベクトルを生成する二次関数計算部92Bと、第1中間ベクトルと第2中間ベクトルとの積に基づいて、入力データがK個のクラスのいずれにも属しないことの尤度である余事象尤度を算出する余事象尤度計算部95Bと、を備える数理モデル90を用いた演算を行う。
このように、識別装置10は、正規分布と二次関数の積によって余事象尤度を表すため、計算に用いるパラメータの制約を少なくすることができる。
また、上述の実施形態においては、クラス識別システム1が機械学習を用いてクラス識別を行うが、これに限られない。例えば、他の実施形態においては、機械学習によらず、数理モデル90を用いた計算を行ってもよい。
また、上述のクラス識別システム1は、学習段階のステップS2においてデータセットを学習用データセットと検証用データセットとに分割し、検証用データセットを用いて評価値を算出するが、これに限られない。例えば、他の実施形態においては、すべてのデータセットを学習用に用い、同じデータセットを用いて評価値を算出してもよい。
図8は、少なくとも1つの実施形態に係るコンピュータの構成を示す概略ブロック図である。
コンピュータ100は、プロセッサ110、メインメモリ130、ストレージ150、インタフェース170を備える。
上述の識別装置10および学習装置20は、コンピュータ100に実装される。そして、上述した各処理部の動作は、プログラムの形式でストレージ150に記憶されている。プロセッサ110は、プログラムをストレージ150から読み出してメインメモリ130に展開し、当該プログラムに従って上記処理を実行する。また、プロセッサ110は、プログラムに従って、上述した各記憶部に対応する記憶領域をメインメモリ130に確保する。プロセッサ110の例としては、CPU(Central Processing Unit)、GPU(Graphic Processing Unit)、マイクロプロセッサなどが挙げられる。
10 識別装置
11 モデル取得部
12 モデル記憶部
13 データ入力部
14 変換部
15 識別部
16 出力部
20 学習装置
21 モデル記憶部
22 データセット受付部
23 分割部
24 変換部
25 第1学習部
26 評価部
27 第2学習部
28 出力部
90 数理モデル
91 第1層
92 第2層
92A 正規分布計算部
92B 二次関数計算部
93 第3層
93A 対数計算部
93B 余事象対数計算部
94 第4層
94A クラスコンポーネント計算部
94B 余事象コンポーネント計算部
95 第5層
95A 既知クラス尤度計算部
95B 余事象尤度計算部
100 コンピュータ
110 プロセッサ
130 メインメモリ
150 ストレージ
170 インタフェース
Claims (10)
- 特徴ベクトルと、複数のクラスに係る分布を表す複数の正規分布の確率密度関数とに基づいて第1中間ベクトルを生成する正規分布計算部と、
前記特徴ベクトルと、前記正規分布に係る係数に基づく複数の二次関数とに基づいて第2中間ベクトルを生成する二次関数計算部と、
前記第1中間ベクトルと前記第2中間ベクトルとの積に基づいて、前記特徴ベクトルが前記複数のクラスのいずれにも属しないことの尤度である余事象尤度を算出する余事象尤度計算部と、
を備える計算機。 - 前記第1中間ベクトルに基づいて、前記複数のクラスそれぞれについて前記特徴ベクトルが属することの尤度であるクラス尤度を算出するクラス尤度計算部
を備える請求項1に記載の計算機。 - 前記余事象尤度計算部は、前記第1中間ベクトルと前記第2中間ベクトルとの積と、前記特徴ベクトルが前記複数のクラスのいずれにも属しないことの事前確率とに基づいて、前記余事象尤度を算出し、
前記クラス尤度計算部は、前記第1中間ベクトルと、前記事前確率の補確率とに基づいて、前記クラス尤度を算出する
請求項2に記載の計算機。 - 前記特徴ベクトルの次元数を拡張した変換特徴ベクトルを生成する変換部と、
前記正規分布計算部は、前記複数の正規分布の確率密度関数の対数を取った関数に、前記変換特徴ベクトルを代入することで、前記第1中間ベクトルを生成し、
前記二次関数計算部は、前記複数の二次関数の対数を取った関数に、前記変換特徴ベクトルを代入することで、前記第2中間ベクトルを生成する
請求項1から請求項3の何れか1項に記載の計算機。 - 特徴ベクトルと、前記複数のクラスのうち当該特徴ベクトルが属するクラスとの組み合わせからなる学習用データセットを用いて、前記複数の確率密度関数に係る係数を学習する学習部
を備え、
前記複数の二次関数は、学習された前記係数を用いて表される
請求項1から請求項4の何れか1項に記載の計算機。 - 特徴ベクトルと、前記複数のクラスのうち当該特徴ベクトルが属するクラスとの組み合わせからなる学習用データセットを用いて、前記複数の確率密度関数に係る係数を学習する第1学習部と、
前記事前確率を、前記学習用データセットに係る特徴ベクトルを、基前記クラス尤度計算部が正しく識別できた確率に基づいて決定する第2学習部と
を備え、
前記複数の二次関数は、学習された前記係数を用いて表される
請求項3に記載の計算機。 - 複数のクラスに係る分布を表す複数の正規分布の確率密度関数を算出するクラス分布特定部と、
前記複数の確率密度関数のそれぞれと、当該確率密度関数に係る係数に基づく二次関数との積によって表される複数の余事象分布関数によって、前記複数のクラスのいずれにも属しないアイテムの分布を示す混合余事象分布関数を生成する余事象分布特定部と
を備える計算機。 - 計算機が、特徴ベクトルと、複数のクラスに係る分布を表す複数の正規分布の確率密度関数とに基づいて第1中間ベクトルを生成するステップと、
前記計算機が、前記特徴ベクトルと、前記正規分布に係る係数に基づく複数の二次関数とに基づいて第2中間ベクトルを生成するステップと、
前記計算機が、前記第1中間ベクトルと前記第2中間ベクトルとの積に基づいて、前記特徴ベクトルが前記複数のクラスのいずれにも属しないことの尤度である余事象尤度を算出するステップと、
を備える計算方法。 - 計算機に、
特徴ベクトルと、複数のクラスに係る分布を表す複数の正規分布の確率密度関数とに基づいて第1中間ベクトルを生成するステップと、
前記特徴ベクトルと、前記正規分布に係る係数に基づく複数の二次関数とに基づいて第2中間ベクトルを生成するステップと、
前記第1中間ベクトルと前記第2中間ベクトルとの積に基づいて、前記特徴ベクトルが前記複数のクラスのいずれにも属しないことの尤度である余事象尤度を算出するステップと、
を実行させるためのプログラム。 - 特徴ベクトルと、複数のクラスに係る分布を表す複数の正規分布の確率密度関数とに基づいて第1中間ベクトルを生成する正規分布計算部と、
前記特徴ベクトルと、前記正規分布に係る係数に基づく複数の二次関数とに基づいて第2中間ベクトルを生成する二次関数計算部と、
前記第1中間ベクトルと前記第2中間ベクトルとの積に基づいて、前記特徴ベクトルが前記複数のクラスのいずれにも属しないことの尤度である余事象尤度を算出する余事象尤度計算部と、
のそれぞれをハードウェアとして構成させるコンフィグレーションの処理をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020044786A JP7477859B2 (ja) | 2020-03-13 | 2020-03-13 | 計算機、計算方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020044786A JP7477859B2 (ja) | 2020-03-13 | 2020-03-13 | 計算機、計算方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021144659A JP2021144659A (ja) | 2021-09-24 |
JP7477859B2 true JP7477859B2 (ja) | 2024-05-02 |
Family
ID=77766900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020044786A Active JP7477859B2 (ja) | 2020-03-13 | 2020-03-13 | 計算機、計算方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7477859B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115456220B (zh) * | 2022-09-29 | 2024-03-15 | 江苏佩捷纺织智能科技有限公司 | 基于数字化模型的智能工厂架构方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019023801A (ja) | 2017-07-24 | 2019-02-14 | 日本電信電話株式会社 | 画像認識装置、画像認識方法、及び画像認識プログラム |
-
2020
- 2020-03-13 JP JP2020044786A patent/JP7477859B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019023801A (ja) | 2017-07-24 | 2019-02-14 | 日本電信電話株式会社 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Non-Patent Citations (1)
Title |
---|
迎田 隆幸 ほか,未分類状態を考慮した隠れセミマルコフモデルによる時系列パターン解析,電気学会研究会資料 システム研究会 ST-18-039~054・056~078・080~084,日本,一般社団法人電気学会,2018年09月26日,pp. 89-93 |
Also Published As
Publication number | Publication date |
---|---|
JP2021144659A (ja) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hušková et al. | Bootstrapping sequential change-point tests for linear regression | |
Chan et al. | Bayesian poisson regression for crowd counting | |
Young et al. | Mixtures of regressions with predictor-dependent mixing proportions | |
Raihan et al. | Particle Gaussian mixture filters-I | |
CN113837205B (zh) | 用于图像特征表示生成的方法、设备、装置和介质 | |
US11176672B1 (en) | Machine learning method, machine learning device, and machine learning program | |
CN113496247A (zh) | 估计生成对抗网络的隐含似然 | |
CN109002794B (zh) | 一种非线性非负矩阵分解人脸识别构建方法、系统及存储介质 | |
US20210042613A1 (en) | Techniques for understanding how trained neural networks operate | |
JP7477859B2 (ja) | 計算機、計算方法及びプログラム | |
CN113763535A (zh) | 一种特征潜码提取方法、计算机设备及存储介质 | |
Ciarelli et al. | An incremental neural network with a reduced architecture | |
CN114830137A (zh) | 用于生成预测模型的方法和系统 | |
Kuleshov et al. | Cognitive technologies in adaptive models of complex plants | |
Shaikh et al. | Wavelet Decomposition Impacts on Traditional Forecasting Time Series Models. | |
Chouzenoux et al. | Sparse graphical linear dynamical systems | |
JP2019075003A (ja) | 近似計算装置、近似計算方法及びプログラム | |
JP7047665B2 (ja) | 学習装置、学習方法及び学習プログラム | |
Shalova et al. | Deep Representation Learning for Dynamical Systems Modeling | |
Hyvärinen et al. | Connection between multilayer perceptrons and regression using independent component analysis | |
Zhuk et al. | Exponentially convergent data assimilation algorithm for Navier-Stokes equations | |
Chau et al. | An efficient particle-based method for maximum likelihood estimation in nonlinear state-space models | |
CN116391193A (zh) | 以基于能量的潜变量模型为基础的神经网络的方法和设备 | |
CN113222100A (zh) | 神经网络模型的训练方法和装置 | |
Xu et al. | Modeling and predicting chaotic circuit data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240327 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240412 |