WO2024062626A1

WO2024062626A1 - 演算装置、集積回路、機械学習装置、判別装置、制御方法、及び、制御装置

Info

Publication number: WO2024062626A1
Application number: PCT/JP2022/035492
Authority: WO
Inventors: 富美男大庭
Original assignee: 富美男大庭
Priority date: 2022-09-22
Filing date: 2022-09-22
Publication date: 2024-03-28

Abstract

べき指数により表現される現象の取り扱いを可能とするとともに、当該現象において入力と出力との間に成り立つ相関関係を精度良く導出することを可能とする演算装置を提供する。演算装置は、入力層及び出力層を少なくとも含むニューラルネットワーク構造を用いて、前記入力層に入力される複数の入力データ（Ｄ０,Ｄ１,…,ＤＮ）に対して前記出力層から出力値を出力する。入力層は、複数の入力データにそれぞれ対応付けられて、複数の入力データをそれぞれべき乗する複数のべき指数（ｐ０,ｐ１,…,ｐＮ）を、学習パラメータとして有する。出力層は、入力層に入力された複数の入力データが複数のべき指数によりそれぞれべき乗された複数のべき乗値（Ｄ０ｐ０,Ｄ１ｐ１,…,ＤＮｐＮ）の積（ＹＹ０＝Ｄ０ｐ０＊Ｄ１ｐ１＊…＊ＤＮｐＮ）に基づいて、出力値（ｙ＝ｆ（ＹＹ０））を出力する。

Description

演算装置、集積回路、機械学習装置、判別装置、制御方法、及び、制御装置

　本発明は、演算装置、集積回路、機械学習装置、判別装置、制御方法、及び、制御装置に関する。

　近年、機械学習は様々な分野に適用され、特に、ニューラルネットワーク構造は回帰問題及び分類問題のいずれにも幅広く応用されている。このようなニューラルネットワーク構造では、入力層に入力された複数の入力データに対して重み係数がそれぞれ乗算され、それらの総和を算出した結果に基づく出力値が出力層から出力される（例えば、特許文献１、特許文献２等参照）。

特開平７－１２９５３５号公報特開平７－１４１３１５号公報

　上記の特許文献１、特許文献２等に記載されたような従来のニューラルネットワーク構造は、重み係数を調節することで機械学習が行われるが、複数の入力データに対する「べき指数」は、例えば、「１」等のように固定されている。そのため、ニューラルネットワーク構造が適用される現象として、入力データに対するべき指数が事前に判明し、その値に固定されているのであれば、機械学習時にその現象を適切に規定するような重み係数に収束すると考えられる。

　しかしながら、自然現象、経済現象、社会現象等の様々な現象において、複数の入力データに対するべき指数が事前に判明していない場合や、複数の入力データがべき指数によりべき乗されたべき乗値の積に応じて出力値が算出される場合も当然に想定される。このような場合、従来のニューラルネットワーク構造では、特定の入力データの組み合わせに対してはその現象を規定する重み係数に近似できたとしても、別の入力データの組み合わせに対しては出力データの誤差が大きくなるため、機械学習にて適切な重み係数に収束させることが難しいという構造的な問題点があった。換言すると、従来のニューラルネットワーク構造では、モデル化の対象として取り扱う現象が、入力データに対するべき乗値の積を含む場合、入力（入力データ）と出力（出力値）との間に成り立つ相関関係を精度良く導出することができないという問題点があった。

　本発明は、上述した課題に鑑み、べき指数により表現される現象の取り扱いを可能とするとともに、当該現象において入力と出力との間に成り立つ相関関係を精度良く導出することを可能とする演算装置、集積回路、機械学習装置、判別装置、制御方法、及び、制御装置を提供することを目的とする。

　上記目的を達成するために、本発明の一態様に係る演算装置は、
　入力層及び出力層を少なくとも含むニューラルネットワーク構造を用いて、前記入力層に入力される複数の入力データ（Ｄ０,Ｄ１,…,ＤＮ）に対して前記出力層から出力値を出力する演算装置であって、
　前記入力層は、
　　複数の前記入力データにそれぞれ対応付けられて、複数の前記入力データをそれぞれべき乗する複数のべき指数（ｐ０,ｐ１,…,ｐＮ）を、前記ニューラルネットワーク構造の学習パラメータとして有し、
　前記出力層は、
　　前記入力層に入力された複数の前記入力データが複数の前記べき指数によりそれぞれべき乗された複数のべき乗値（Ｄ０^ｐ０,Ｄ１^ｐ１,…,ＤＮ^ｐＮ）の積（ＹＹ０＝Ｄ０^ｐ０＊Ｄ１^ｐ１＊…＊ＤＮ^ｐＮ）に基づいて、前記出力値（ｙ＝ｆ（ＹＹ０））を出力する。

　本発明の一態様に係る演算装置が用いるニューラルネットワーク構造によれば、入力層が、複数の入力データをそれぞれべき乗する複数のべき指数を、ニューラルネットワーク構造の学習パラメータとして有し、出力層が、入力層に入力された複数の入力データが複数のべき指数によりそれぞれべき乗された複数のべき乗値の積に基づいて出力値を出力する。したがって、演算装置は、べき指数により表現される現象の取り扱いを可能とするとともに、当該現象において入力と出力との間に成り立つ相関関係を精度良く導出することができる。

　上記以外の課題、構成及び効果は、後述する発明を実施するための形態にて明らかにされる。

本発明の第１の基本形態に係る演算装置により用いられるニューラルネットワーク構造１００Ａ及びその基本原理を説明する図である。本発明の第１の基本形態に係る演算装置により用いられるニューラルネットワーク構造１００Ｂ及びその基本原理を説明する図である。本発明の第３の基本形態に係る演算装置により用いられるニューラルネットワーク構造１００Ｃ及びその基本原理を説明する図である。本発明の第１乃至第３の基本形態に係るニューラルネットワーク構造を用いた演算装置１の構成を示すブロック図である。本発明の第１の実施形態に係るニューラルネットワークの構造を示す図である。本発明の第１の実施形態に係るべき指数追加加算型ニューラルネットワークの構造を示す図である。本発明の第１の実施形態に係るニューラルネットワーク装置による、べき指数の最適解を探索する方法を示すフローチャートである。本発明の第１の実施形態に係る多層型のニューラルネットワークの構造を示す図である。本発明の第２の実施形態に係る差分マトリックス、積入力マトリックスの構成を示す図である。本発明の第２の実施形態に係る差分探索法を用いて最適解を探索する方法を示すフローチャートである。本発明の実施例１に係る９つの惑星名と２つの測定データ（太陽からの平均距離、公転周期）を一覧にした表である。本発明の実施例１に係る変動係数を出力値に、横軸にＤ０のべき指数ｐ０、縦軸にＤ１のべき指数ｐ１として（ｐ０、ｐ１）を座標とした出力図である。本発明の実施例１に係る変動係数の出力値をｌｏｇ値（常用対数）に変換した３次元のワイヤフレームプロット図である。本発明の実施例１に係る９つの惑星とＹＹ／Ｗの値を一覧にした表である。本発明の実施例１に係るＹＹ／Ｗ＝Ｄ０＾（－５）＊Ｄ１＾（３）の式が答えとなるデータに変えたときの変動係数の出力値をｌｏｇ値（常用対数）に変換した３次元のワイヤフレームプロット図である。本発明の実施例２に係るヘロンの公式の発見に適用する１０個の３角形の絵の図である。本発明の実施例２に係る１０個の３角形の三辺の寸法と面積を一覧にした表である。本発明の実施例２に係る積入力要素である３辺計算式を一覧にした表である。本発明の実施例２に係る、べき乗探索法に入力する５次元入力データテーブルを一覧にした表である。本発明の実施例２に係る１０個の３角形（ＳＮ列）とＹＹ／Ｗの値を一覧にした表である。本発明の実施例２に係る１０個の３角形の偶数番号の面積Ｓを１．０倍、奇数番号の面積を０．９倍の値にし、それぞれ群Ａ、群Ｂと２分類にした表である。本発明の実施例２に係るニューラルネットワークの出力値Ｚ－Ａｃｔの３角形番号順のグラフを表す図である。本発明の実施例２に係るＹＹ／Ｗの３角形番号順のグラフを表す図である。本発明の実施例４に係るＣａｒｔＰｏｌｅ倒立振子の図である。本発明の実施例４に係るＣａｒｔＰｏｌｅ倒立振子の出力を一覧にした表である。本発明の実施例４に係るＣａｒｔＰｏｌｅ倒立振子の状態変数からとりうる行動を一覧にした表である。本発明の実施例４に係る従来型ニューラルネットワークの構造を示す図である。本発明の実施例４に係るｔエピソード目の終了時に与える報酬を一覧にした表である。本発明の実施例４に係る従来型の方策勾配法を用いたフローチャートである。本発明の実施例４に係る従来型の方策勾配法をＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装した結果のステップ数推移グラフを表す図である。本発明の実施例４に係る従来型の方策勾配法をＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装し、棒が倒れずに耐えることができた重み付けパラメータの５例を一覧にした表である。本発明の実施例４に係る、べき乗探索法を用いて制御する強化学習アルゴリズムのフローチャートである。本発明の実施例４に係る、べき指数を更新させる更新量Δｐｎを偏差Ｎの配列に設定した表である。本発明の実施例４に係る、べき乗探索法をＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装した結果のステップ数推移グラフを表す図である。本発明の実施例４に係る、べき乗探索法をＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装し、棒が倒れずに耐えることができた、べき指数値の５例を一覧にした表である。本発明の実施例４に係る、ＹＹ／ＷのステップＮｏ．順（台車を押した時系列順）のグラフを表す図である。本発明の実施例４に係る、閾値Ａの値を変化させたときの台車の動作を纏めた表である。本発明の実施例４に係る、入力データを棒（Ｐｏｌｅ）の角度と角速度に絞り、べき乗探索法をＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装し、棒が倒れずに耐えることができた、べき指数値の３例を一覧にした表である。本発明の実施例４に係る、台車（Ｃａｒｔ）を左右に動かす制御式をＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装し、応用動作させた絵である。本発明の実施例５に係る、２入力排他論理和（ＥＸＯＲ）の真理値表である。本発明の実施例５に係る、３入力排他論理和（ＥＸＯＲ）の真理値表である。本発明の実施例５に係る、３入力排他論理和（ＥＸＯＲ）のべき指数追加加算型ニューラルネットワークを用いた判別学習結果の表である。本発明の実施例５に係る、２進数と１０進数の関係を表す表である。本発明の実施例５に係る、２進数と１０進数に成り立つ関係式をべき指数追加加算型ニューラルネットワークを用いて数式探索した結果の表である。

　以下、本発明の基本原理を示す「基本形態」と、その基本原理を応用して本発明を実施するための「実施形態」とに分けて、図面を参照しつつ説明する。以下では、本発明の目的を達成するための説明に必要な範囲を模式的に示し、本発明の該当部分の説明に必要な範囲を主に説明することとし、説明を省略する箇所については公知技術によるものとする。

（第１の基本形態）
　図１は、本発明の第１の基本形態に係る演算装置により用いられるニューラルネットワーク構造１００Ａ及びその基本原理を説明する図である。

　演算装置は、入力層１１０Ａ及び出力層１２０Ａを少なくとも含むニューラルネットワーク構造１００Ａを用いて、入力層１１０Ａに入力される複数の入力データＤｎ＝（Ｄ０,Ｄ１,…,ＤＮ）に対して出力層１２０Ａから出力値ｙを出力する装置である。

　図１に示すニューラルネットワーク構造１００Ａは、Ｎ＋１次元（Ｎは１以上の自然数）のニューロン（ノード）を有する入力層１１０Ａと、１個のニューロン（ノード）と有する出力層１２０Ａとから構成される。入力層１１０ＡのＮ個のニューロンと、出力層１２０Ａの１個のニューロンとの間は、Ｎ＋１次元のシナプス（エッジ）によりそれぞれ接続される。なお、各シナプスには、Ｎ＋１次元の重み付けパラメータｗｎ＝（ｗ０，ｗ１，ｗ２，…，ｗＮ）がそれぞれ対応付けられていてもよく、本基本形態では、Ｎ＋１次元の重みｗｎが１である場合について説明する。

　入力層１１０ＡのＮ個のニューロンは、Ｎ＋１次元の入力データＤｎにそれぞれ対応付けられて、Ｎ＋１次元の入力データＤｎがそれぞれ入力される。また、入力層１１０Ａは、Ｎ＋１次元の入力データＤｎをそれぞれべき乗するＮ＋１次元のべき指数ｐｎ＝（ｐ０,ｐ１,…,ｐＮ）を、ニューラルネットワーク構造１００Ａの学習パラメータとして有する。なお、Ｎ＋１次元の入力データＤｎの少なくとも１つは、複素数で表されるデータでもよい。

　出力層１２０Ａは、入力層１１０Ａに入力されたＮ＋１次元の入力データＤｎがＮ＋１次元のべき指数ｐｎによりそれぞれべき乗されたＮ＋１次元のべき乗値Ｄｎ^ｐｎ＝（Ｄ０^ｐ０,Ｄ１^ｐ１,…,ＤＮ^ｐＮ）の積ＹＹ０（＝Ｄ０^ｐ０＊Ｄ１^ｐ１＊…＊ＤＮ^ｐＮ）に基づいて、出力値ｙ（＝ｆ（ＹＹ０））を出力する。したがって、出力層１２０Ａは、下記の（数１－１）、（数１－２）で示すように、出力値ｙを出力する。なお、「＊」は、積の記号を表す。

（数１－１）
　ＹＹ０＝Ｄ０^ｐ０＊Ｄ１^ｐ１＊…＊ＤＮ^ｐＮ
（数１－２）
　ｙ＝ｆ（ＹＹ０）
　ただし、上記の式における各パラメータは、下記の通りである。
　　Ｄｎ（ｎ＝０，１,…,Ｎ）　：入力データ
　　ｐｎ（ｎ＝０，１,…,Ｎ）　：べき指数（学習パラメータ）
　　Ｄｎ^ｐｎ（ｎ＝０，１,…,Ｎ）：べき乗値
　　ＹＹ０　　　　　　　　　　：べき乗値の積
　　ｙ　　　　　　　　　　　　：出力値

　学習パラメータとしてのＮ＋１次元のべき指数ｐｎは、Ｎ＋１次元の入力データＤｎと、そのＮ＋１次元の入力データＤｎに対応付けられた教師データＴとを含む学習データを複数組用いることで学習されるパラメータである。

　Ｎ＋１次元のべき指数ｐｎは、学習データに含まれるＮ＋１次元の入力データＤｎを入力層１１０Ａに入力したときに出力層１２０Ａから出力される出力値ｙと、学習データに含まれる教師データＴとの間の差分（誤差）が小さくなるように調整される。

　演算装置は、上記のように、学習データにより学習パラメータを調整（探索）する一連の工程を所定の回数だけ反復実施したときや上記の差分が所定の許容値より小さくなったときに、所定の学習終了条件が満たされたと判定し、学習パラメータに対する学習を終了する。これにより、学習パラメータとしてのＮ＋１次元のべき指数ｐｎを有する学習済みのニューラルネットワーク構造１００Ａが実現される。演算装置は、出力値が未知のＮ＋１次元の入力データＤｎを学習済みのニューラルネットワーク構造１００Ａの入力層１１０Ａに入力することで、当該Ｎ＋１次元の入力データＤｎに対する出力値ｙを出力層１２０Ａから出力する。

　なお、演算装置は、入力層１１０Ａに入力する前の入力データに対して所定の前処理（正規化、標準化、ワンホットエンコーディング等）を施してもよいし、出力層１２０Ａから出力された後の出力データに対して所定の後処理を施してもよい。

　本基本形態に係る演算装置が用いるニューラルネットワーク構造１００Ａによれば、入力層１１０Ａが、複数の入力データをそれぞれべき乗する複数のべき指数を、ニューラルネットワーク構造１００Ａの学習パラメータとして有し、出力層１２０Ａが、入力層１１０Ａに入力された複数の入力データが複数のべき指数によりそれぞれべき乗された複数のべき乗値の積に基づいて出力値を出力する。したがって、演算装置は、べき指数により表現される現象の取り扱いを可能とするとともに、当該現象において入力と出力との間に成り立つ相関関係を精度良く導出することができる。

（第２の基本形態）
　図２は、本発明の第１の基本形態に係る演算装置により用いられるニューラルネットワーク構造１００Ｂ及びその基本原理を説明する図である。

　第２の基本形態に係るニューラルネットワーク構造１００Ｂ（図２）は、第１の基本形態（図１）と同様に、入力層１１０Ｂ及び出力層１２０Ｂを少なくとも含むものであるが、入力層１１０Ｂにて対数計算を行い、出力層１２０Ｂにて真数（逆対数）計算を行う点で第１の基本形態と相違する。以下、第２の基本形態に係るニューラルネットワーク構造１００Ｂの特徴部分を中心に説明する。

　入力層１１０ＢのＮ個のニューロンは、第１の基本形態と同様に、Ｎ＋１次元の入力データＤｎ＝（Ｄ０,Ｄ１,…,ＤＮ）にそれぞれ対応付けられて、Ｎ＋１次元の入力データＤｎがそれぞれ入力される。また、入力層１１０Ｂは、Ｎ＋１次元の入力データＤｎをそれぞれべき乗するＮ＋１次元のべき指数ｐｎ＝（ｐ０,ｐ１,…,ｐＮ）を、ニューラルネットワーク構造１００Ｂの学習パラメータとして有する。そして、入力層１１０Ｂは、Ｎ＋１次元の入力データＤｎを対数ｄｎ＝（ｄ０,ｄ１,…,ｄＮ）にそれぞれ変換し、Ｎ＋１次元の入力データの対数ｄｎとＮ＋１次元のべき指数ｐｎとをそれぞれ乗算したＮ＋１次元の乗算値ｄｎ＊ｐｎ＝（ｄ０＊ｐ０，ｄ１＊ｐ１，…，ｄＮ＊ｐＮ）を出力層１２０Ｂに出力する。なお、Ｎ＋１次元の入力データＤｎの少なくとも１つは、複素数で表されるデータでもよい。

　出力層１２０Ｂは、Ｎ＋１次元の乗算値ｄｎ＊ｐｎに対する総和（ｄ０＊ｐ０＋ｄ１＊ｐ１＋…＋ｄＮ＊ｐＮ）を真数（ｂａｓｅ^{ｄ０＊ｐ０＋ｄ１＊ｐ１＋…＋ｄＮ＊ｐＮ}）に変換し、その真数を、Ｎ＋１次元のべき乗値の積として、出力値ｙ（＝ｆ（ＹＹ０））を出力する。したがって、出力層１２０Ｂは、下記の（数２－１）、（数２－２）で示すように、出力値ｙを出力する。

（数２－１）
　ＹＹ０＝ｂａｓｅ^{ｄ０＊ｐ０＋ｄ１＊ｐ１＋…＋ｄＮ＊ｐＮ}
　　　（＝Ｄ０^ｐ０＊Ｄ１^ｐ１＊…＊ＤＮ^ｐＮ）
（数２－２）
　　　ｙ＝ｆ（ＹＹ０）
　ただし、上記の式における各パラメータは、下記の通りである。
　　ｂａｓｅは、１を除く正の数
　　Ｄｎ＝ｂａｓｅ^ｄｎ（ｎ＝０，１,…,Ｎ）：入力データ
　　ｐｎ（ｎ＝０，１,…,Ｎ）　　　　　　：べき指数（学習パラメータ）
　　Ｄｎ^ｐｎ（ｎ＝０，１,…,Ｎ）　　　　　：べき乗値
　　ＹＹ０　　　　　　　　　　　　　　　：べき乗値の積
　　ｙ　　　　　　　　　　　　　　　　　：出力値

　学習パラメータとしてのＮ＋１次元のべき指数ｐｎは、第１の基本形態と同様に、Ｎ＋１次元の入力データＤｎと、そのＮ＋１次元の入力データＤｎに対応付けられた教師データＴとを含む学習データを複数組用いることで学習されるパラメータである。

　Ｎ＋１次元のべき指数ｐｎは、学習データに含まれるＮ＋１次元の入力データＤｎを入力層１１０Ｂに入力したときに出力層１２０Ｂから出力される出力値ｙと、学習データに含まれる教師データＴとの間の差分（誤差）が小さくなるように調整される。

　演算装置は、上記のように、学習データにより学習パラメータを調整（探索）する一連の工程を所定の回数だけ反復実施したときや上記の差分が所定の許容値より小さくなったときに、所定の学習終了条件が満たされたと判定し、学習パラメータに対する学習を終了する。これにより、学習パラメータとしてのＮ＋１次元のべき指数ｐｎを有する学習済みのニューラルネットワーク構造１００Ｂが実現される。演算装置は、出力値が未知のＮ＋１次元の入力データＤｎを学習済みのニューラルネットワーク構造１００Ｂの入力層１１０Ｂに入力することで、当該Ｎ＋１次元の入力データＤｎに対する出力値ｙを出力層１２０Ｂから出力する。

　本基本形態に係る演算装置が用いるニューラルネットワーク構造１００Ｂによれば、入力層１１０Ｂは、複数の入力データを対数にそれぞれ変換し、その変換後の複数の対数と複数のべき指数とをそれぞれ乗算した複数の乗算値を出力層１２０Ｂに出力し、出力層１２０Ｂは、複数の乗算値に対する総和を真数に変換し、その変換後の真数に基づいて出力値を出力する。したがって、演算装置は、べき指数により表現される現象の取り扱いを可能とするとともに、当該現象において入力と出力との間に成り立つ相関関係を精度良く導出することができる。

（第３の基本形態）
　図３は、本発明の第３の基本形態に係る演算装置により用いられるニューラルネットワーク構造１００Ｃ及びその基本原理を説明する図である。

　第３の基本形態に係るニューラルネットワーク構造１００Ｃ（図３）は、第１の基本形態（図１）と同様に、入力層１１０Ｃ及び出力層１２０Ｃを含むものであるが、入力層１１０Ｃと出力層１２０Ｃとの間に隠れ層１３０をさらに含む点で第１の基本施形態と相違する。以下、第３の基本形態に係るニューラルネットワーク構造１００Ｃの特徴部分を中心に説明する。

　入力層１１０ＣのＮ個のニューロンは、第１の基本形態と同様に、Ｎ＋１次元の入力データＤｎ＝（Ｄ０,Ｄ１,…,ＤＮ）にそれぞれ対応付けられて、Ｎ＋１次元の入力データＤｎがそれぞれ入力される。また、入力層１１０Ｃは、Ｎ＋１次元の入力データＤｎをそれぞれべき乗するＮ＋１次元のべき指数ｐｎ＝（ｐ０,ｐ１,…,ｐＮ）を、ニューラルネットワーク構造１００Ｃの学習パラメータとして有する。なお、Ｎ＋１次元の入力データＤｎの少なくとも１つは、複素数で表されるデータでもよい。

　隠れ層１３０は、Ｎ＋１次元の入力データＤｎが学習パラメータとしてのＮ＋１次元の重み付けパラメータｗｎ＝（ｗ０，ｗ１，…,ｗＮ）を介してそれぞれ入力されて、下記の式（数３－１）で規定される目標値ＹＹ１を出力層１２０Ａに出力する第１の隠れノード１３１と、Ｎ＋１次元の入力データＤｎがＮ＋１次元の重み付けパラメータｗｎを介してそれぞれ入力されるともに、学習パラメータとしてのバイアスパラメータｂが入力されて、下記の式（数３－２）で規定される加算型演算出力ＢＹＡを前記出力層１２０Ａに出力する第２の隠れノード１３２とを有する。

　出力層１２０Ｃは、目標値ＹＹ１と加算型演算出力ＢＹＡとに基づいて、出力値ｙ（＝ｆ（ＹＹ１，ＢＹＡ））を出力する。

（数３－１）
　ＹＹ１＝Ｄ０^ｐ０＊Ｄ１^ｐ１＊…＊ＤＮ^ｐＮ＊Ｗ０＊Ｗ１＊…＊ＷＮ
（数３－２）
　ＢＹＡ＝Ｂ＊（ｂａｓｅ）^{（ＳＩＧＭＡ［ｎ＝０→Ｎ］（ｗｎ＊ｐｎ＊ｄｎ））}
　ただし、上記の式における各パラメータは、下記の通りである。
　また、ＳＩＧＭＡの表記は数学記号における総和を意味するギリシャ文字を表している。
　　ｂａｓｅは、１を除く正の数
　　Ｄｎ＝ｂａｓｅ^ｄｎ（ｎ＝０，１,…,Ｎ）：入力データ
　　ｐｎ（ｐ０，ｐ１，…，ｐＮ）　　　　　：べき指数
　　Ｄｎ^ｐｎ　　　　　　　　　　　　　　　：べき乗値
　　ｗｎ＝ｌｏｇ_ｂａｓｅＷｎ（ｎ＝０，１,…,Ｎ）：重み付けパラメータ
　（Ｗｎ＝ｂａｓｅ^ｗｎ）
　　ｂ＝ｌｏｇ_ｂａｓｅＢ　　　　　　　　　　：バイアスパラメータ
　（Ｂ＝ｂａｓｅ^ｂ）
　　ＹＹ１　　　　　　　　　　　　　　　　：目標値
　　ＢＹＡ　　　　　　　　　　　　　　　　：加算型演算出力
　　ｙ　　　　　　　　　　　　　　　　　　：出力値

　学習パラメータとしてのＮ＋１次元のべき指数ｐｎ、Ｎ＋１次元の重み付けパラメータｗｎ、及び、バイアスパラメータｂは、複数の入力データＤｎを学習データとして複数用いることで学習されるパラメータである。

　Ｎ＋１次元のべき指数ｐｎ、Ｎ＋１次元の重み付けパラメータｗｎ、及び、バイアスパラメータｂは、学習データとしてのＮ＋１次元の入力データＤｎを入力層１１０Ｃに入力したときに第１の隠れノード１３１から出力される目標値ＹＹ１と第２の隠れノード１３２から出力される加算型演算出力ＢＹＡとの間の差分（｜ＹＹ１－ＢＹＡ｜）が小さくなるように調整される。

　演算装置は、上記のように、学習データにより学習パラメータを調整（探索）する一連の工程を所定の回数だけ反復実施したときや上記の差分が所定の許容値より小さくなったときに、所定の学習終了条件が満たされたと判定し、学習パラメータに対する学習を終了する。これにより、学習パラメータとしてのＮ＋１次元のべき指数ｐｎ、Ｎ＋１次元の重み付けパラメータｗｎ、及び、バイアスパラメータｂを有する学習済みのニューラルネットワーク構造１００Ｃが実現される。演算装置は、出力値が未知のＮ＋１次元の入力データＤｎを学習済みのニューラルネットワーク構造１００Ｃの入力層１１０Ｃに入力することで、当該Ｎ＋１次元の入力データＤｎに対する出力値ｙを出力層１２０Ｃから出力する。

　本基本形態に係る演算装置が用いるニューラルネットワーク構造１００Ｃによれば、隠れ層１３０が、複数の入力データが複数の重み付けパラメータを介してそれぞれ入力されて、上記の式（数３－１）で規定される目標値を出力層に出力する第１の隠れノードと、複数の入力データが複数の重み付けパラメータを介してそれぞれ入力されるともに、バイアスパラメータが入力されて、上記の式（数３－２）で規定される加算型演算出力を出力層に出力する第２の隠れノードとを有し、出力層１２０Ｃが、目標値と加算型演算出力とに基づいて、出力値を出力する。したがって、演算装置は、べき指数により表現される現象の取り扱いを可能とするとともに、当該現象において入力と出力との間に成り立つ相関関係を精度良く導出することができる。

（基本形態の装置構成）
　図４は、本発明の第１乃至第３の基本形態に係るニューラルネットワーク構造を用いた演算装置１の構成を示すブロック図である。

　演算装置１は、第１乃至第３の基本形態のいずれかに相当するニューラルネットワーク構造１００Ａ～１００Ｃを有する学習モデルを生成する機械学習装置１Ａと、機械学習装置１Ａにより生成された学習モデルを用いて判別対象の判別データＢＢに対する判別結果ＡＡを出力する判別装置１Ｂとして機能する。機械学習装置１Ａは、学習フェーズにて用いられ、判別装置１Ｂは、判別フェーズ（推論フェーズ）にて用いられる。

　演算装置１は、その構成要素として、判別器学習部２、学習パラメータ記憶部３、学習データ記憶部４、学習データ処理部５、判別結果処理部６、及び、判別データ取得部７を備えて構成される。

　判別器学習部２は、ニューラルネットワーク構造１００Ａ～１００Ｃを有する学習モデルを用いて学習パラメータの学習を行う学習部２０と、学習中又は学習済みの学習パラメータを反映させた学習モデルを用いて判別データに対する判別結果を出力する判別処理部２１とを備える。第１及び第２の基本形態に係る学習パラメータは、Ｎ＋１次元のべき指数ｐｎである。第３の基本形態に係る学習パラメータは、Ｎ＋１次元のべき指数ｐｎ、Ｎ＋１次元の重み付けパラメータｗｎ、及び、バイアスパラメータｂである。

　学習パラメータ記憶部３は、学習フェーズにおいて学習部２０により学習が行われた学習結果として、学習パラメータを記憶する。学習パラメータ記憶部３には、学習パラメータの初期化処理により学習パラメータの初期値が記憶され、学習部２０で学習が繰り返し行われることにより学習パラメータが逐次更新される。そして、学習パラメータ記憶部３には、学習部２０による学習が終了したときの学習パラメータが記憶され、判別フェーズ（推論フェーズ）にて判別処理部２１により読み出される。

　学習データ記憶部４は、複数の入力データを少なくとも含む学習データを複数組記憶する。第１及び第２の基本形態に係る学習データは、入力データと、その入力データに対応付けられた教師データとを含む。第３の基本形態に係る学習データは、入力データのみを含む。教師データは、例えば、判別結果に対応するデータであり、判別結果として、例えば、正常を「０」及び異常を「１」で表す場合には、「０」か「１」が設定される。　　

　学習部２０は、学習データ記憶部４に記憶された学習データを、学習データ処理部５を介して学習モデルに入力し、例えば、損失関数が最小となるように学習パラメータの学習を行う。すなわち、学習部２０は、判別処理部２１から出力された判別結果と、学習データ処理部５から読み出した学習データとが入力されて、これらのデータを用いて学習を行い、学習パラメータ記憶部３に学習パラメータを記憶する。

　判別処理部２１は、学習フェーズにて、学習データ処理部５により取得された学習データを、初期値又は学習中の学習パラメータを反映させた学習モデルに入力することで、当該学習モデルからの出力値に基づいて判別結果を学習部２０及び判別結果処理部６に出力する。

　また、判別処理部２１は、判別フェーズ（推論フェーズ）にて、判別データ取得部７により取得された判別データを、学習済みの学習パラメータを反映させた学習モデルに入力することで、当該学習モデルからの出力値（例えば、特徴量等）を判別結果処理部６に出力する。

　学習データ処理部５は、学習フェーズにて、学習データ記憶部４から学習データを読み出して所定の前処理を施した後、その学習データを学習部２０及び判別処理部２１に送る。その際、学習データ処理部５は、判別結果処理部６からの要求に応じて、学習データを学習部２０及び判別処理部２１に送る。

　判別結果処理部６は、判別処理部２１から出力された出力値を受け取り、判別結果ＡＡとして、例えば、ディスプレイ等の所定の出力装置に出力する。また、判別結果処理部６は、学習フェーズにて、判別結果に基づいて変動係数や判別率等を計算し、その計算結果に応じて、学習データを学習部２０及び判別処理部２１にさらに送るように、学習データ処理部５に要求する。

　判別データ取得部７は、判別フェーズ（推論フェーズ）にて、所定の入力装置から判別データＢＢを受け付けて所定の前処理を施した後、その判別データＢＢを判別処理部２１に送る。

　上記構成を有する演算装置１は、汎用又は専用のコンピュータにより構成される。なお、機械学習装置１Ａ及び判別装置１Ｂは、別々のコンピュータにより構成されていてもよい。その場合、機械学習装置１Ａは、学習データ記憶部４、学習部２０及び学習パラメータ記憶部３を少なくとも備えていれればよい。また、判別装置１Ｂは、判別データ取得部７及び判別処理部２１を少なくとも備えていれればよい。

　演算装置１の構成要素のうち、学習パラメータ記憶部３、及び、学習データ記憶部４は、ハードディスクドライブ（ＨＤＤ）、ソリッドステートドライブ（ＳＳＤ）等の記憶装置（内蔵型、外付け型、ネットワーク接続型等）で構成されてもよいし、ＵＳＢメモリ、記憶メディア再生装置で再生可能な記憶メディア（ＣＤ、ＤＶＤ、ＢＤ）等で構成されてもよい。また、演算装置１の構成要素のうち、判別器学習部２、学習データ処理部５、判別結果処理部６及び判別データ取得部７は、例えば、１又は複数のプロセッサ（ＣＰＵ、ＭＰＵ、ＧＰＵ等）を有する演算装置で構成される。

(プログラム)
　演算装置１は、各種の記憶装置や記憶メディアに記憶されたプログラムや外部からネットワークを介してダウンロードにより取得されたプログラムを実行することで、判別器学習部２、学習データ処理部５、判別結果処理部６及び判別データ取得部７として機能するものでもよい。

(集積回路)
　第１乃至第３のいずれかの相当するニューラルネットワーク構造１００Ａ～１００Ｃは、集積回路により構成されてもよい。その場合、集積回路は、入力層及び出力層を構成する入出力部と、学習パラメータを記憶する記憶部と、入力層に入力される複数の入力データ及び記憶部に記憶された学習パラメータに基づいて、出力層から前記出力値を出力するための演算を行う演算部とを備える。集積回路は、例えば、ＦＰＧＡ、ＡＳＩＣ等により構成され、これら以外のハードウェアが用いられてもよい。

（第１の実施形態）
　最初に、本発明に用いるニューラルネットワークの基本構造（以下、加算型ニューラルネットワークと呼ぶ）について図面を参照して説明する。図５は加算型ニューラルネットワークの基本構造を示す図である。加算型ニューラルネットワークは入力層、隠れ層及び出力層によって構成され、各層は複数のノードを有している。また、加算型ニューラルネットワークは、入力層と中間層とのノード間および、隠れ層と出力層とのノード間に任意の重みを設定してノード間の結合状態を調整することにより様々な問題（分類問題あるいは回帰問題）を解くことができる判別器として機能する。

　ここで、図５の隠れ層の演算式ＹＹ（目標値）、ＢＹＡ（加算型演算出力）について説明する。但し、図５は便宜上４次元入力であるが、説明はＮ次元入力として説明する。隠れ層のＹＹ、ＢＹＡは下記式（数１）、（数２）、（数３）で表すことができる。ただし、第１の特徴量ｗｎ、第２の特徴量ｂの底（ｂａｓｅ）のべき乗をそれぞれＷｎ，Ｂとし、Ｎ次元の入力データ要素Ｄｎ＝（Ｄ０，Ｄ１，・・，Ｄｎ，・・，Ｄ（Ｎ－１））のｌｏｇ値をｄｎ＝（ｄ０，ｄ１，・・，ｄｎ，・・，ｄ（Ｎ－１））とする。損失関数ＬをＹＹ（目標値）とＢＹＡ（加算型演算出力）の差分式｜ＹＹ－ＢＹＡ｜とおくと、前記損失関数Ｌを最小化する演算により、前記重み付けパラメータｗｎと前記バイアスパラメータｂの値を抽出すること、を特徴とする加算型ニューラルネットワーク演算方法を提供できる。ここで、べき乗を表す記号は　＾　、積の記号は　＊　を用いた。
（数１）
ＹＹ＝Ｄ０＊Ｄ１＊・・・＊Ｄ（Ｎ－１）＊Ｗ０＊Ｗ１＊・・・＊Ｗ（Ｎ－１）
（数２）
ＢＹＡ＝（ｂａｓｅ）＾（ＳＩＧＭＡ［ｎ＝０→Ｎ－１］（ｗｎ＊ｄｎ＋ｂ））
（数３）
ＢＹＡ＝Ｂ＊（ｂａｓｅ）＾（ＳＩＧＭＡ［ｎ＝０→Ｎ－１］（ｗｎ＊ｄｎ））

　続いて、関係式を探索し発見する方法の発明である第１の実施形態について説明する。図６はこの発明に用いる、べき指数追加加算型ニューラルネットワークの基本構造を示す図である。前述、図５との違いは、入力に１次元追加したＮ＋１次元にしたことと、第３の特徴量として、べき指数Ｐｎ＝（ｐ０，ｐ１，・・，ｐｎ，・・，ｐ（Ｎ－１），ｐＮ）を新たに設けて入力データ要素に繋いだところにあり、次にその演算方法について説明する。

　Ｎ＋１次元のデータをＤｎ＝（Ｄ０，Ｄ１，・・，Ｄｎ，・・，Ｄ（Ｎ－１），ＤＮ）と表現し、べき指数Ｐｎ＝（ｐ０，ｐ１，・・，ｐｎ，・・，ｐ（Ｎ－１），ｐＮ）を乗じてＤｎ＾Ｐｎ＝（Ｄ０＾ｐｏ，Ｄ１＾ｐ１，・・，Ｄｎ＾ｐｎ，・・，Ｄ（Ｎ－１）＾ｐ（Ｎ－１），ＤＮ＾ｐＮ）と表現する。また、Ｗ＝Ｗ０＊Ｗ１＊・・・＊ＷＮとおくと、前述の（数１）、（数３）式から（数４）及び、（数５）、（数６）式が導かれる。（数５）式ＹＹ／Ｗは入力データ要素Ｄｎをべき指数Ｐｎでべき乗した各要素どうしの積で表されることから、「べき乗値の積」と表現する。また、データの属する群が共通の特徴量ｗｎを持つとき、それらのべき乗積であるＷの値も共通であることから、ＹＹ／Ｗ（べき乗値の積）が定数に近似できるとき、ＹＹ（目標値）もまた定数に近似される。従って、ＹＹ（目標値）が定数に近似できる値を探索することは、損失量｜ＹＹ－ＢＹＡ｜が最小となる特徴量ｗｎ、ｂ及び、べき指数Ｐｎを探索することに等しく、得られたべき指数から最適な関係式を得ることができる。
（数４）
ＹＹ＝Ｄ０＊Ｄ１＊・・・＊Ｄ（Ｎ）＊Ｗ０＊Ｗ１＊・・・＊ＷＮ
（数５）
ＹＹ／Ｗ＝Ｄ０＾ｐ０＊Ｄ１＾ｐ１＊・・・＊ＤＮ＾ｐＮ
（数６）
ＢＹＡ＝Ｂ＊（ｂａｓｅ）＾（ＳＩＧＭＡ［ｎ＝０→Ｎ］（ｗｎ＊ｐｎ＊ｄｎ））

　ここで、べき指数Ｐｎ＝（ｐ０，ｐ１，・・，ｐｎ，・・，ｐ（Ｎ－１），ｐＮ）をパラメータに振って探索するとき、出力値がどの程度、所定の目標に近づいたかを表す評価関数に、べき指数毎の損失量｜ＹＹ－ＢＹＡ｜を用いて比較すると、損失量の大きさは、べき指数の値で大きく変化してしまう問題がある。対策として、評価関数は標準偏差を平均値で規格化した変動係数を用いて、べき指数をパラメータとしたそれぞれの平均値に対する相対的なばらつきの大きさを評価することで防止できる。

　また、評価関数に判別率を用いて、２群以上に分けた分類問題として解くことができる。

　続いて、前述のべき指数追加加算型ニューラルネットワークを用いて、べき指数の最適解を導く方法（以下、べき乗探索法と呼ぶ）について図４を参照して説明する。

　判別器学習部２は、ニューラルネットワークを学習し、学習したニューラルネットワークを用いた判別を行う。その構成として、判別学習部２は、学習部２０、判別処理部２１を備える。

　学習部２０は、損失関数が最小となるようにニューラルネットワークを学習する。すなわち、学習部２０は判別処理部２１から出力された判別結果と学習データ処理部５から読み出した学習データを入力すると、これらのデータを用いて学習を行い、学習データ記憶部３に学習パラメータを記憶する。

　判別処理部２１は、学習パラメータ記憶部３から重みとバイアス、学習データを入力すると、これらを用いた判別結果を判別結果処理部６へ送る。

　判別結果処理部６は判別処理部２１から出力された判別結果を受け取ると、べき指数をパラメータとした学習データの入力を学習データ処理部５へ要求する。受け取った判別結果は変動係数の最小順または、判別率の最大順に並べ替える等、装置外部のディスプレイなどの所定の出力装置へ出力する。

　学習データ記憶部３は、ニューラルネットワークにおけるノード間の重みとバイアス及び学習データ処理部５の学習データを記憶する記憶部である。学習データ記憶部３には、重みの初期化処理時には、ニューラルネットワークの全てのノード間の重みとバイアスの初期値が記憶され、学習データ処理部５から送られた学習データを用いて学習部２０でニューラルネットワークを学習したノード間の重みとバイアス及び学習データを記憶する。

　学習データ記憶部４は、学習データを記憶する記憶部である。学習データとは、予め正常と異常が判別された状態情報及び特徴量を示すテスト用のデータである。また、判別データＢＢは判別対象のデータであり判別データ取得部７へ送られ、所定の前処理を施した後、判別処理部２１へ送られる。

　学習データ処理部５は、学習データ記憶部４を入力し、べき指数をパラメータとした所定の学習データの型へ変換処理する。変換処理された学習データは、判別結果処理部６の要求に応じて、重み学習部２０へ送られる。

　なお、判別器学習部２、学習データ処理部５と判別結果処理部６及び判別データ取得部７は、例えば、この実施の形態に特有な処理が記述されたプログラムをマイクロコンピュータが実行することで、ハードウェアとソフトウェアが協働した具体的な手段として実現することができる。

　また、図４に示した学習機能を有するべき指数追加加算型ニューラルネットワーク装置の構成である判別器学習部２、学習パラメータ記憶部３、学習データ記憶部４、学習データ処理部５、判別結果処理部６、判別データ取得部７を組み合わせた集積回路にして小型化、高速化、低消費電力、安価に提供することができる。

　続いて、上記した図４のニューラルネットワーク装置の構成により、べき指数をパラメータとした重み学習処理を行い、変動係数あるいは判別率を計算し、べき指数の最適解を探索する方法について図７のフローチャートに沿って説明する。

　まず、学習データ処理部５は、学習データ記憶部４の学習データをニューラルネットワーク演算を行う判別器学習部２にある学習部２０への入力形式へ変換する。学習データ記憶部４の学習データは、Ｎ次元の入力データと１次元の出力データで構成される。学習データ処理部５はＮ次元の入力データと１次元の出力データを繋いだＮ＋１次元のデータを、Ｄｎ＝（Ｄ０，Ｄ１，・・，Ｄｎ，・・，Ｄ（Ｎ－１），ＤＮ）として結合させる（ステップＳＰ１）。

　次に、べき指数Ｐｎの探索方法を設定する（ステップＳＰ２）。例えば、｜ｐｎ｜≦５の整数とした総当たり探索にする。また、ｐｎは実数を扱い、任意の刻みの範囲を設定することもできる。但し、コンピュータのメモリ及び演算能力の制約範囲内にとどめる。

　次に、べき指数探索値Ｐｎ＝（ｐ０，ｐ１，・・，ｐｎ，・・，ｐ（Ｎ－１），ｐＮ）の初期値を設定する（ステップＳＰ３）。例えば、｜ｐｎ｜≦５の整数とした場合の総当たり探索（しらみつぶし探索とも呼ぶ）では、探索初期値を、探索ラベルＮｏ．０とし、べき指数Ｐ０＝（－５、－５、、、－５）とする。

　次に、べき指数探索値Ｐｎ＝（ｐ０，ｐ１，・・，ｐｎ，・・，ｐ（Ｎ－１），ｐＮ）の探索終了条件を設定する（ステップＳＰ４）。例えば、探索ラベルＮｏ．０とし、べき指数Ｐ０＝（－５、－５、、、－５）、次の探索ラベルをＮｏ．１にＰ１＝（－５、－５、、、－４）のように連番にして探索終了条件は、探索終了値（５、５、、、５）に設定できる。また、探索終了条件は予め、所定の探索回数、探索ラベル、あるいは閾値を設定してもよい。

　次に、データＤｎ、べき指数Ｐｎの探索テーブルを作成する（ステップＳＰ５）。例えば、探索ラベルＮｏ．０とし、べき指数Ｐ０＝（－５、－５、、、－５）、次の探索ラベルをＮｏ．１にＰ１＝（－５、－５、、、－４）のように連番にして、探索終了値（５、５、、、５）とした探索テーブルを作ることができる。

　次に、データＤｎ、べき指数Ｐｎを探索テーブルから、探索ラベル順に取り出す（ステップＳＰ６）。

　次に、Ｄｎ＾Ｐｎをニューラルネットワークの入力に再定義する（ステップＳＰ７）。ここで、学習データ処理部５は、ステップＳＰ６で受け取った、データＤｎと、べき指数Ｐｎを用いたＤｎ＾Ｐｎ＝（Ｄ０＾ｐｏ，Ｄ１＾ｐ１，・・，Ｄｎ＾ｐｎ，・・，Ｄ（Ｎ－１）＾ｐ（Ｎ－１），ＤＮ＾ｐＮ）の式から、Ｄｎ＾ＰｎをＤｎに再定義し、加算型ニューラルネットワークの入力に設定する。

　以上までは、ニューラルネットワークの入力データＤｎを作成する手順であり、図５のステップＳＰ１～ＳＰ７までを説明した。

　次に、ステップＳＰ７で作成されたＮ＋１次元の入力データＤｎ＝（Ｄ０＾ｐｏ，Ｄ１＾ｐ１，・・，Ｄｎ＾ｐｎ，・・，Ｄ（Ｎ－１）＾ｐ（Ｎ－１），ＤＮ＾ｐＮ）は、判別器学習部２の学習部２０へ送られステップＳＴ１～ＳＴ８を通して、重み学習処理を行う。以下、学習部２０の詳細を説明する。

　まず、学習部２０は、ニューラルネットワークの特徴量である重みとバイアスを初期化する（ステップＳＴ１）。具体的には、初期値に０を与える。

　ここで、隠れ層の演算式ＹＹ（目標値）、ＢＹＡ（加算型演算出力）は、前記の通り、（数１）、（数２）、（数３）で表すことができ、学習部２０は、損失関数Ｌで表す損失量｜ＹＹ－ＢＹＡ｜の初期値を計算する（ステップＳＴ３）。

　次に、学習部２０は、バイアス（パラメータｂ）を少しプラス方向に設定量だけ更新する（ステップＳＴ４）。

　続いて、学習部２０は、損失量の値が小さくなるように、重み（重み付けパラメータｗｎ）修正量（適度なシフト量Δｗｎ）を算出する（ステップＳＴ５）。

　この後、学習部２０は、ＳＴ５で求めた修正量で重みの値を従前の値から更新する（ステップＳＴ６）。

　さらに、学習部２０は、ＳＴ５～ＳＴ６のステップを設定回数分のループを廻し重み量を更新する（ステップＳＴ７）。

　　この後、学習部２０は重み学習の終了条件を満たしたか否かを確認する（ステップＳＴ８）。ここで終了条件は損失量が減少から増加に転じた一つ前の最小値がよい。また、学習回数が設定回数以上となった場合でもよい。

　終了条件を満たすと、学習部２０は、抽出した損失量｜ＹＹ－ＢＹＡ｜を最小にする特徴量を、学習パラメータ記憶部３に記憶し判別処理部２１へ送る。

　次に、判別処理部２１は得られた特徴量を判別結果処理部６へ送る。

　次に、判別結果処理部６は、特徴量から変動係数、判別率を計算し、結果を記憶する（ステップＳＰ８）。

　次に、判別結果処理部６は、探索テーブルの探索ラベルを、従前の値から更新する（ステップＳＰ９）。例えば、総当たり探索を設定した場合、探索ラベルを一つ進める。ここで、幅優先探索法や、よりヒューリスティックな探索法を用いて、現在までのステップで計算された変動係数あるいは判別率から、より小さくする変動係数、または、より高い判別率に、従前の探索順より速く到達する可能性を予測できるアルゴリズムを仕込み、効率よい探索順ラベルに更新してもよい。

　次に、ステップＳＰ９を通して探索ラベルを更新した後、は探索終了条件を満たしたか否かを確認する（ステップＳＰ１０）。終了条件を満たしていない場合、ステップＳＰ６に戻り、繰り返す。

　このようにして得られた、べき指数Ｐｎ＝（ｐ０，ｐ１，・・，ｐｎ，・・，ｐ（Ｎ－１），ｐＮ）が最適な関係式を与える。具体的なＮ＋１次元のデータ、関係式の型、及び評価関数として用いる変動係数と判別率の詳細な説明は（実施例１）、（実施例２）を通して後述する。

　上記した第１の実施形態では、隠れ層が１段の場合の例を挙げて説明したが、複数段の隠れ層にも適用することができる。図８は、多層型のべき指数追加加算型ニューラルネットワークの基本構造を示す図である。ここで、１段目の隠れ層ノードｎ１，ｎ２の出力を受け取る２段目の隠れ層として、２つの重みｈ０、ｈ１を紐づけた２段目の目標値ＺＺのノードｎ３，加算型出力ＢＺＡののノードをｎ４とする２つのノードを挿入し拡張し、１次元出力Ｚ－Ａｃｔを得る。このような２段の隠れ層を持つニューラルネットワークを用いることで、より複雑な問題に対して精度を向上できる。

（第２の実施形態）
　続いて、本発明の第２の実施形態について説明する。本発明の第２の実施形態は、入力データ要素間の和や差を含めて、第１の実施形態の、べき乗探索法への入力データ要素にする前処理を行い、その入力データ要素を、べき乗探索法へ入力して演算を行い、加減乗除から成り立つ関係式を発見する学習方法である。

　第１の実施形態は、べき乗探索法へのＮ次元の入力データの単位が異なる場合、あるいは入力データ間の和や差を必要としないとき、最適な関係式が得られる。一方、入力データ間の和や差を用いた関係式がある。例えば三角形の３辺の長さ（ａ，ｂ，ｃ）を元データとして、答えである面積Ｓを求めるヘロンの公式（数７）は、辺の差分の積を利用した方程式である。このような類の方程式を盲目的に解くには、元データである３辺の和や差を、べき乗探索法への入力データに加える前処理を行い、べき乗探索法への入力テーブルを作り、順に、べき乗探索を行う。
（数７）
１６＝（ａ＋ｂ＋ｃ）＊（－ａ＋ｂ＋ｃ）＊（ａ－ｂ＋ｃ）＊（ａ＋ｂ－ｃ）／（Ｓ＾２）
（数８）
１６＝Ｄ０＾ｐ０＊Ｄ１＾ｐ１＊Ｄ２＾ｐ２＊Ｄ３＾ｐ３＊Ｄ４＾ｐ４

　ヘロンの公式（数７）に倣うと、三角形の元データである３辺の長さ（ａ，ｂ，ｃ）の和と差を用いた入力データは、Ｄ０＝（ａ＋ｂ＋ｃ）、Ｄ１＝（－ａ＋ｂ＋ｃ）、Ｄ２＝（ａ＋ｂ－ｃ）の値であり、その３次元の入力データ要素（Ｄ０、Ｄ１、Ｄ２）を組み合わせて構成する所定の関係を有する答えデータＤ３は面積Ｓである。４次元の入力データ要素Ｄｎ＝（Ｄ０、Ｄ１、Ｄ２、Ｄ３）を作り、４次元のべき指数Ｐｎ＝（ｐ０、ｐ１、ｐ２、ｐ３）を用いてべき乗探索を行うと、べき指数Ｐｎの解は、（ｐ０、ｐ１、ｐ２、ｐ３）＝（１、１、１、－２）が得られる。

　次に、測定対象物の元データに和や差を施す前処理を行い、べき乗探索法への入力テーブルを作る方法について説明する。

　単位が同じで差分可能なＭ行（Ｍ次元）及び学習サンプル数（ＳＮ）を列とする元データをａｍ＝（ａ０，ａ１，，，ａ（Ｍ－１））とする。また、差分要素マトリックスＣｍ及び、元データａｍの要素に掛け合わせる係数ｋを定義する。差分要素マトリックスＣｍは、元データａｍの各要素に係数ｋ倍して得られる全ての組み合わせのマトリックスと定義し図９に例示する。図９は、係数ｋを－１，０，１の整数、Ｍ＝３次元のときの差分要素マトリックスＣｍの例であり、２７行３列のマトリックスの行列で表すことができる。

　ここで係数ｋの値は、データ間の差はｋ＝－１、和は、ｋ＝１、不要な係数はｋ＝０として表せる。さらに、係数ｋ＝－２、－１，０，１，２のように順に整数を設定し、多様な整数倍に対応することができる。また、係数ｋ＝－１，－０．５，０，０．５，１のように実数を設定することもできる。

　さらに係数ｋは虚数単位ｉを用いることができる。例えば円の方程式、１＝ｘ＾２＋ｙ＾２は、虚数単位ｉを用いた因数分解を利用し、１＝（ｘ＋ｉ＊ｙ）＊（ｘ－ｉ＊ｙ）に等しく、元データｘ、ｙから円の方程式を導くことができる。

　次に、べき乗探索法の入力データＤｎの各要素となる積入力要素マトリックスＬｎＳを定義する。積入力要素マトリックスＬｎＳは（数９）に示すように、Ｃｍとａｍの内積で表す。図９に積入力要素マトリックスＬｎＳを例示する。図９は、係数ｋを－１，０，１の整数、Ｍ＝３次元のときの積入力要素マトリックスＬｎＳの例であり、２７行ＳＮ列のマトリックスの行列テーブルで表すことができる。また、積入力要素マトリックスＬｎＳのｎ行目ＳＮ列の要素を積入力要素Ｌｎと定義する。
（数９）
ＬｎＳ＝Ｃｍ・ａｍ

　次に、積入力要素マトリックスＬｎＳに含まれる全ての要素を探索目的とするには、不必要な積入力要素Ｌｎを含んでいる場合、制約条件を設定して、不必要な積入力要素Ｌｎを省いたＬｎＳテーブルにする。制約条件がない場合、そのままの積入力要素マトリックスＬｎＳをＬｎＳテーブルとする。

　次に、ＬｎＳテーブルの積入力要素Ｌｎの中から、べき乗探索法へ入力する入力データ要素の個数ＮＹを設定する。例えば、（数８）の場合、入力データは（Ｄ０、Ｄ１、Ｄ２、Ｄ３、Ｄ４）の５次元要素の積でありＮＹ＝５である。

　次に、ＬｎＳテーブルの行から、（ＮＹ－１）行を抽出し組み合わせた（ＮＹ－１）行（次元）のＤｎＬテーブルを作成する。

　さらに、前記、ＤｎＬテーブルの最後尾に１次元の答えデータを連結させて、べき乗探索法へ入力するＮＹ行（次元）のＤｎＬテーブルにする。

　このＤｎＬテーブルの順に従い、ＮＹ行（次元）のデータを、べき乗探索法へ入力し最適解を導く方法を差分探索法と呼ぶ。以下、差分探索法を用いて最適解を探索する方法について、図１０のフローチャートに沿って説明する。

　最初に、測定対象物の元データａｍに加減算が可能な要素があるかどうかをチェックする（ステップＳＳ１）。加減算が可能な要素があれば、加減算を行う要素を設定する。（ステップＳＳ２）。

　次に、前記した係数ｋ、及び学習サンプル数ＳＮを設定し、差分要素マトリックスＣｍを生成する（ステップＳＳ３）。

　次に、入力データａｍの各要素間の和と差に制約条件がある場合、その制約条件を設定する（ステップＳＳ４）。例えば、上記ヘロンの公式において、辺の差分が正値であること、つまり（±ａ±ｂ±ｃ）＞０の条件のみを利用する場合、その条件を設定し、正値以外の値を省く。

　次に、積入力要素マトリックスＬｎＳを（数９）式から計算し、ステップＳＳ４で設定した制約条件を満足するＬｎＳテーブルを作成する（ステップＳＳ５）。

　次に、べき乗探索法へ入力する入力データ要素の個数ＮＹを設定する。（ステップＳＳ６）

　次に、ＬｎＳテーブルの行から、（ＮＹ－１）行を抽出し組み合わせた（ＮＹ－１）行（次元）のＤｎＬテーブルを作成する（ステップＳＳ７）。

　次に、前記ＤｎＬテーブルの最後尾の行に１次元の答えデータを連結する。（ステップＳＳ８）。

　次に、ＤｎＬテーブルから先頭データＤｎ行を取得する（ステップＳＰ１）。その後のステップＳＰ２～ＳＰ１０、及びＳＴ１～ＳＴ８までは、べき乗探索法と同じであり説明を省略する。

　次のステップＳＳ９でデータＤｎ行をＤｎＬテーブルの順番に従い次のデータに更新する。次のステップＳＳ１０で、データＤｎ行が最終データで無ければステップＳＰ２に戻り繰り返す。ＤｎＬテーブルの最終順が完了すると終了する。あるいは、変動係数、あるいは判別率に閾値を設けて途中終了させてもよい。

（実施例１）
　第１の実施例として、第１の実施形態をケプラーの第３法則の発見に適用する。ケプラーの第３法則は「各惑星の公転周期Ｔの２乗は、太陽からの平均距離ｒの３乗に比例する。」であり、物理法則に基づくべき乗則が成り立っている。図１１に、９つの惑星名と２つの測定データ（太陽からの平均距離ｒ［ｋｍ］と公転周期Ｔ［ｄａｙ］）を明記した。ここでは２次元の入力データ要素Ｄ０＝ｒ／１Ｅ８、Ｄ１＝Ｔ／１Ｅ２を用いて、本発明のべき乗探索法により、法則を発見する方法について説明する。法則の関数形態は、単位が異なるため加減算を除く除算と乗算で構成されると第一に推定できる。

　前記の２次元の入力データ要素（Ｄ０、Ｄ１）を組み合わせて構成する関数は、ｆ（Ｄ０，Ｄ１）＝１と表すことができる。発見したい左項の何らかの関数をｆ（Ｄ０，Ｄ１）としたとき、右項は、所定の関係を有する答えデータをＤ２とすると、１である。従って、べき乗探索法への３次元の入力データ要素は（Ｄ０、Ｄ１、１）であり、ＹＹ／Ｗ（べき乗値の積）は（数５）から（数１０）の関数で与えられる。
（数１０）
ＹＹ／Ｗ＝Ｄ０＾ｐ０＊Ｄ１＾ｐ１

　次に、図７のフローチャートに従い、べき乗探索法を使って、最適な関係式を導く方法を説明する。

　最初に、３次元の入力テーブル（Ｄ０、Ｄ１、１）を図８から作成する（ステップＳＰ１）。べき指数の探索方法は、べき指数を｜ｐｎ｜≦７の整数とする総当たり探索とし、探索初期値をＮｏ．０、べき指数Ｐ０＝（－７、－７）、Ｎｏ．１、Ｐ１＝（－７、－６）のように連番にして、探索終了値を（７，７）に設定した探索テーブルを作成する。また、評価関数には変動係数を用いる（ステップＳＰ２～ＳＰ５）。探索初期値を設定した後は、探索終了まで、探索テーブル順に従ったニューラルネットワーク演算を行う（ステップＳＰ６～ＳＰ１０）。ステップＳＰ７では、初期値Ｄｎ＾Ｐｎ＝（Ｄ０＾ｐ０、Ｄ１＾ｐ１、１）で演算される行を入力項に設定する。次にニューラルネットワーク演算の重みとバイアスを初期化する（ステップＳＴ１）。

　ここで、特徴量抽出のための初期設定について述べる。図７のフローチャートに示す重み学習を進めるにあたり、ループを行うバイアス更新回数、重み更新回数、及び重み修正量（Δｗｎ）及びバイアス更新量を適度な値に初期設定する。本事例では、隠れ層１のバイアス更新回数を５０、重み更新回数を１０回に設定した。バイアスの更新量はＹＹ（数１）より、重みＷｎ＝１（ｗｎ＝０）のときは、データ積の項のみに単純化できることから、そのデータ積の平均値を５０で割った値を、５０回刻みの分割量とし、その分割量の１０％をバイアス更新量の設定値とした。重み修正量（Δｗｎ）は、損失量の０．１％を設定値とした。目的に応じ、初期設定値を細かくしたり、または荒く可変してもよい。ｂａｓｅ（低）の設定値は０．９とした。本事例の入力データｄ１の値は最大値９１５を扱っており、例えば１０をｂａｓｅ（底）の設定値とおくと、容易にコンピュータの上限計算限界に至ってしまう。本特許では小数をｂａｓｅ（底）に設定できるため、計算限界を回避できる。

　次に、隠れ層演算式ＹＹ（数１）、ＢＹＡ（数３）の初期値、及び損失量｜ＹＹ－ＢＹＡ｜の初期値を算出する（ステップＳＴ２～ＳＴ３）。

　次に、ステップＳＴ４～ＳＴ８のパラメータ学習ループを通して、損失量｜ＹＹ－ＢＹＡ｜の最小値を計算し、パラメータ学習結果をステップＳＰ８に送り変動係数を計算し、結果を記憶する。

　ここで、本事例に用いる評価関数である変動係数について説明する。変動係数は（数７）のＹＹ／Ｗ（べき乗値の積）の標準偏差ｓｉｇｍａ（以下標準偏差のギリシャ文字の記号をｓｉｇｍａと表記する）をＹＹ／Ｗ（べき乗値の積）の平均値で割った値である。

　次の、ステップＳＰ９は、得られた変動係数を用いてヒューリステックな探索方法を導入し探索順を初期値の探索ラベルから入れ替えたい場合に設定する、本事例では総当たり探索のため、順送りである。

　次の、ステップＳＰ１０は、探索テーブルの探索終了値（７，７）完了後、変動係数の最小となったべき指数Ｐｎ、及び、べき指数Ｐｎと変動係数の対応リスト、グラフ等を出力し終了する。グラフ例を図１２、図１３に示す。また、探索終了値（７，７）に届いていない場合、ステップＳＰ６に戻り、繰り返す。

　図１２は、変動係数を出力値に、横軸にＤ０のべき指数ｐ０、縦軸にＤ１のべき指数ｐ１として（ｐ０、ｐ１）を座標とした本事例の出力図である。変動係数は、べき指数（ｐ０、ｐ１）の座標位置、（－６、４）、（－３、２）、（０，０）、（３、－２）、（６、－４）の点で０～０．０００５と小さくなっていることが判る。但し、便宜上０．０００１より小さい値を０と表示している。図１３は、図１２のｌｏｇ値（常用対数）を３次元のワイヤフレームプロットにしたものである。図１３には、球（●）を表示し、ワイヤフレームの傾斜に沿って、最小点へ流れる様子を模擬した。（数１０）式に（ｐ０、ｐ１）＝（－３、２）を代入すると、ＹＹ／Ｗ＝Ｄ０＾（－３）＊Ｄ１＾（２）≒４（一定）　が導かれ図１４の表に示した。この結果から、最初にｆ（Ｄ０，Ｄ１）＝１と表したｆ（Ｄ０，Ｄ１）の最適な関数は、ｆ（Ｄ０，Ｄ１）＝Ｄ０＾（－３）＊Ｄ１＾（２）／４と得ることができた。つまり、９つの惑星名と２つの測定データ（Ｄ０は太陽からの平均距離ｒ、Ｄ１は公転周期Ｔ）から、次の法則が導かれている。「各惑星の公転周期Ｔの２乗は、太陽からの平均距離ｒの３乗に比例する。」

　評価関数に変動係数を用いて総当たり探索を行いケプラーの第３法則を導く方法を前述した。変動係数を図１２及び、図１３にグラフ表示すると、最小値となる極小値が複数存在し、規則的に与えられていることが判り、この例では、探索法に変動係数の小さくなる方向へ移動する付近値探索法を用いて最小値となる極小値へ素早く探索できる。しかし、損失量が最小値とならない極小値が複数存在する関数は多く、ニューラルネットワークの勾配消失を引き起こす問題点の一つである。従来のニューラルネットワークの解決策として、全てのデータを用いずにサンプリングした荒いデータ（ミニバッチサイズと呼ぶ）を用いて故意に精度を下げた勾配計算を行い極小値を避ける方法がある。しかし、この方法では、どこに極小値があるのかわからず、ミニバッチサイズの大きさの変更、乱数を取り入れる等の試行錯誤が必要となる課題が残る。本特許では、べき指数座標を軸としたグラフを用いて効率的な付近値探索法を検討できる。

　例えば、損失量が最小値とならない極小値が複数存在する関数例として、ケプラーの第３法則を「各惑星の公転周期Ｔの３乗は、太陽からの平均距離ｒの５乗に比例する。」と変えたデータを作成し関係式を総当たり探索を行うと、最小値のべき数値は（－５，３）、（５、－３）が与えられ、ＹＹ／Ｗ＝Ｄ０＾（－５）＊Ｄ１＾（３）の式が得られる、図１５にそのワイヤフレームプロット図を示した。この図から最小値のべき数値は（－５，３）、（５、－３）の間に（－３、２）、（－２、１）、（３、－２）、（２，－１）の極小値が規則的に存在することが判る。従って、探索法に評価関数の小さくなる、あるいは大きくなる方向へ移動する付近値探索法を用いる場合は、探索初期値の選び方によっては特異点（０，０）、あるいは極小値、極大値へ流れてしまい正解が得られない不都合が生じてしまう。これを避けるために探索初期値の座標位置は複数の象限へ設定する注意が必要なこと、規則性を考慮した複数の極値に近い位置へ初期値を設定すると探索時間を短くできることが図１２及び、図１３、図１５のグラフから理解できる。

　このように、べき指数を座標軸にして評価関数を変動係数で表現するグラフを用いて、より速く正解に辿り着くためのヒューリステックな探索方法を構築することができる。

　また、（数１０）の方程式の解は、特徴量パラメータを固定することで速く求めることができる。（数３）のバイアスＢ＝０（ｂ＝０）で固定し、重み学習のループを廻さない、つまりｗｎ＝０の初期値で計算したＷ＝１、ＢＹＡ＝１とした損失量｜ＹＹ－ＢＹＡ｜＝｜ＹＹ－１｜に単純化することで演算を速くすることができる。この手法は、データにノイズ（外乱）が少ないと判断できる探索、特に、べき指数だけの関係式を評価したいときに有効である。

（実施例２）
　第２の実施例として、第２の実施形態をヘロンの公式の発見に適用する。図１６は１０個の番号（１）～（１０）の種々の３角形の絵であり、図１７に、その３辺の長さａ，ｂ，ｃ及び面積Ｓを小数第一位までを有効桁とした表である。３辺の長さは、単位がｃｍと共通であることから、３辺の長さａ，ｂ，ｃ及び面積Ｓをダイレクトにべき乗探索法の入力に用いても、答えに辿りつけない懸念がある。この解決策として、３辺の長さの加減算の値を含めてべき乗探索法の入力とする方法を、図１０のフローチャートを用いて具体的に説明する。

　最初に、測定対象物の元データａｍを３辺の長さ（ａ０，ａ１，ａ２）とし、これを加減算可能な３次元データａｍ＝（ａ０，ａ１，ａ２）として設定する（ステップＳＳ１～ＳＳ２）。

　次に、元データａｍのサンプル数（ＳＮ）は三角形１０個であり、ＳＮ＝１０を設定する（ステップＳＳ３）。

　次に、元データａｍの要素に掛け合わせる係数ｍを設定する。３辺（ａ０，ａ１，ａ２）間の和及び差を用いるとき、係数ｍは－１，０，１である。これらを用いて差分要素マトリックスＣｍを生成すると、前記した図９のように２７行３列の差分要素マトリックスＣｍが自動生成される（ステップＳＳ３）。

　次に、入力データａｍの各要素間の和と差に、制約条件がある場合、その制約条件を設定する。３角形のように３辺の長さの加減算から構成される積入力要素は負値あるいは零を持たないと容易に推測できることから、辺の差分が正値である条件、（±ａ±ｂ±ｃ）＞０を設定する（ステップＳＳ４）。

　次に、積入力要素マトリックスＬｎＳを（数９）式から計算し、ステップＳＳ４で設定された制約条件を満足するＬｎＳテーブルを作成する（ステップＳＳ５）。図１８に制約条件を満足して生成された１０行１０列のＬｎＳテーブルを示す。積入力要素の１０行をＬ０～Ｌ９として、３辺の差及び和の式で与えられる１０行Ｌ０～Ｌ９と、三角形（１）～（１０）の、それらの式の３辺の差及び和の値である１０列の要素で構成される。

　次に、べき乗探索法へ入力する入力データ要素の個数ＮＹを設定する。３角形の面積を求める元データは、３辺（ａ０，ａ１，ａ２）であり、（数５）で表されるＹＹ／Ｗ（べき乗値の積）の式は、答えである面積Ｓを含めた４要素以上の積で構成されることから、ＮＹを、ＮＹ＝４、次にＮＹ＝５、さらにＮＹ＝６と最適解が得られるまで増加させてループを廻す。但し、べき乗探索回数は増大してしまうことから、コンピュータの性能及び計算時間制約の範囲内に上限を設定する。ここでは、便宜上ＮＹ＝５に固定した例を用いて説明する（ステップＳＳ６）。

　次に、ＬｎＳテーブルの行から、（ＮＹ－１）の４行を抽出し組み合わせた４行１０列のＤｎＬテーブルを作成する（ステップＳＳ７）。

　次に、前記ＤｎＬテーブルの最後尾に、三角形（１）～（１０）答えデータである１行１０列の面積Ｓを連結する。（ステップＳＳ８）。図１９に生成されたＤｎＬテーブルを示す。このように、べき乗探索に入力される５次元データ（Ｄ０、Ｄ１、Ｄ２、Ｄ３、Ｄ４）は、（Ｄ０、Ｄ１、Ｄ２、Ｄ３）へ、ＬｎＳテーブルの積入力要素Ｌ０～Ｌ９から抽出された４要素の組み合わせを配置し、Ｄ４へ面積Ｓを配置し、２１０個（Ｎｏ．０～２０９）のインデックスを付したテーブルで構成される。

　次に、ＤｎＬテーブルから、最初の５次元入力データＤｎ行を取得する（ステップＳＰ１）。図１９を参照すると、ＤｎＬテーブルの先頭インデックスＤｎ行Ｎｏ．０の（Ｄ０、Ｄ１、Ｄ２、Ｄ３、Ｄ４）＝（Ｌ０、Ｌ１、Ｌ２、Ｌ３、Ｓ）である。

　次に、べき指数Ｐｎの探索方法を設定する（ステップＳＰ２）。べき数値を｜ｐｎ｜≦４の整数とする総当たり探索とする。

　次に、べき指数Ｐｎの初期値を設定する（ステップＳＰ３）。べき数値を｜ｐｎ｜≦４の整数とする総当たり探索のとき、探索初期値である探索ラベルＮｏ．０は、べき指数（－４、－４、－４、－４、－４）である。

　次に、べき指数Ｐｎの探索終了条件を設定する（ステップＳＰ４）。探索終了値を、入力データ要素の先頭Ｄ０の正のべき数は、負のべき数の逆数の解であり、重複するため不要とし、（－１、４、４、４、４）に設定する。

　次に、データＤｎ行、べき指数Ｐｎの探索テーブルを作成する（ステップＳＰ５）。例えば、探索ラベルＮｏ．０とし、べき指数Ｐ０＝（－４、－４、－４、－４、－４）、次の探索ラベルをＮｏ．１にＰ１＝（－４、－４、－４、－４、－３）のように連番にして、探索終了値（－１、４、４、４、４）とした探索テーブルを作る。

　次に、データＤｎ行、べき指数Ｐｎを探索テーブルから、探索ラベル順に取り出す（ステップＳＰ６）。

　次に、Ｄｎ＾Ｐｎをニューラルネットワークの入力に再定義する（ステップＳＰ７）。ステップＳＰ６で受け取った、データＤｎ行と、べき指数Ｐｎを用いたＤｎ＾Ｐｎ＝（Ｄ０＾ｐｏ，Ｄ１＾ｐ１，Ｄ２＾ｐ２，Ｄ３＾ｐ３，Ｄ４＾ｐ４）の式から、Ｄｎ＾ＰｎをＤｎに再定義し、加算型ニューラルネットワークの入力に設定する。

　その後のステップＳＴ１～ＳＴ８は、前記した、第１の実施例と同じ加算型ニューラルネットワーク演算の手順であり、説明は省略する。但しｂａｓｅ（低）の設定値は０．９９を用いた。

　次の、ステップＳＰ９は、総当たり探索のため、データＤｎ、べき指数Ｐｎの探索ラベルに従い、順送りする。

　次の、ステップＳＰ１０は、探索テーブルの探索終了値（－１、－４、－４、－４、－４）のとき、ステップＳＳ９に進む。また、探索終了値（－１、－４、－４、－４、－４）で無ければステップＳＰ６に戻り、繰り返す。

　次のステップＳＳ９で、データＤｎをＤｎＬテーブルのインデックス順に従い次のデータに更新する。

　次のステップＳＳ１０で、ＤｎＬテーブルの最終インデックスのデータＤｎ（Ｌ６、Ｌ７、Ｌ８、Ｌ９、Ｓ）であれば終了する。最終インデックスで無ければ、ステップＳＰ２に戻り、繰り返す。

　５次元のＤｎＬテーブルの最終インデックスの終了後、変動係数を最小にする積入力要素Ｌｍ（Ｌ０～Ｌ９）の組み合わせは、５次元入力データＤｎ＝（Ｌ０、Ｌ４、Ｌ７、Ｌ９、Ｓ）のときに、べき指数Ｐｎ＝（－１－１、－１、－１，２）が得られる。図２０にべき指数Ｐｎ＝（－１－１、－１、－１，２）における、ＹＹ／Ｗ（べき乗値の積）の計算値の表を示した。ＹＹ／Ｗ（べき乗値の積）はほぼ一定値（１／１６＝０．０６２５）に収束している。この出力結果から、ヘロンの公式が導かれていることが判る。

　前述の例は、べき乗探索法の評価関数に変動係数を用いた例である。本発明は、評価関数に判別率を適用することができる。以下、ヘロンの公式を例にして評価関数に判別率を用いて、ヘロンの公式を導く方法について説明する。

　三角形の面積Ｓを２等分し判別に用いる。例えば、１０個のサンプルＮｏ．ＳＮ列の偶数番号の面積Ｓを１．０倍、奇数番号の面積を０．９倍の値にし、それぞれ群Ａ、群Ｂと２分類にする。よって、答えは三角形の面積Ｓでは無く、判別結果である群Ａまたは群Ｂである。判別結果の一覧表を図２１に示した。

　例えば、三角形の形態を持つ製造物の３辺を測定器で測長し、面積を画像により測定することで、角が欠けて面積が小さい等、異常な外観の物を除きたい検査工程を想定する。正常な物は論理的なルールに従い、所定の閾値により良品判定され、それ以外のものは不良判定される。

　この判別の答えは、群Ａ，群Ｂというラベルであり数値化しないと演算ができない問題が生じる。本発明は、答えがラベルである場合、答えの数値を定数にして扱うことができる。具体的には、三角形の面積Ｓを入力に追加し、答えは定数１にして演算を進めることができる。

　評価関数に判別率と変動係数を用いた例とのフローチャート図１０での違いは、探索方法に判別率を設定（ステップＳＰ２）し、それに従い判別率の計算処理を行う（ステップＳＰ８）ところであり、その他は同じで説明を省略する。

　ここで、評価関数に判別率を用いた計算方法、及び、べき指数Ｐｎの探索方法について説明する。

　（数５）の式、ＹＹ／Ｗ（べき乗値の積）は５次元入力の場合、（数１１）の関数で与えられ、最後尾のＤ４は面積Ｓを表すものとする。
（数１１）
ＹＹ／Ｗ＝Ｄ０＾ｐ０＊Ｄ１＾ｐ１＊Ｄ０＾ｐ２＊Ｄ３＊＾ｐ３＊Ｄ４＾ｐ４

　（数１１）のＹＹ／Ｗ（べき乗値の積）を定数に近似できたとき、右項の値は、最後尾のＤ４にサンプルＮｏ．ＳＮ列の偶数番号の１．０倍、奇数番号を０．９倍の値にした面積Ｓの値を用いているため、１．０倍のＡ群の定数、及び、０．９倍したＢ群の定数の２つの分布に分かれる。これを利用し加算型ニューラルネットワークに５次元の入力を行い、加算型ニューラルネットワークの１次元出力値を用いて、Ａ群とＢ群を最大に区別する閾値を自動計算し判別率を算出する。ここでは、図８に示した隠れ層２段のべき指数追加加算型ニューラルネットワークの１次元出力値Ｚ－Ａｃｔを用いて判別率を最大にする５次元入力データＤｎのべき指数Ｐｎを探索した。

　５次元のリストＤｎＬの最終インデックスが終了すると（ステップＳＳ１０）、判別率を最大にする積入力要素Ｌｎ（Ｌ０～Ｌ９）の組み合わせは、５次元入力データＤｎ＝（Ｌ０、Ｌ４、Ｌ７、Ｌ９、Ｓ）のときに、判別率１００％、べき指数Ｐｎ＝（－１、－１、－１、－１、２）の結果が得られる。

　次に、評価関数に判別率を用いて得られる出力グラフについての特徴を述べる。評価関数に判別率を用いて得られた出力値は、人に判りやすく視覚化することができる。図２２は、加算型ニューラルネットワークの出力値Ｚ－Ａｃｔの３角形番号順のグラフであり、図２３はＹＹ／Ｗ（べき乗値の積）の３角形番号順のグラフである。このグラフから出力値Ｚ－Ａｃｔは群Ａ及び群Ｂに２分され、ＹＹ／Ｗ（べき乗値の積）は傾きのない２つの定数線であることが視覚的に判る。

　例に用いたヘロンの公式は、面積Ｓを小数第２位で４捨５入した誤差以外に、ノイズ要素は無い（データの粒がよい）。しかし、測定対象物から得られるデータに成り立つ関係式の多くは、解を求めるには不明なパラメータを含んでいたり、複雑な関数形態、あるいはノイズの多いデータから最適な関係式を推測する。このような場合、評価関数に判別率を用いる方法が有効であり、あらゆる分野に応用できる。

　例えば、医療の大勢の検診データから、健康な人と、少数ではあるが、ある疾患を持っている人をＡ群とＢ群に分け、検診データの項目に何らかの最適な関係式が存在するか、の調査（探索）に利用できる。本発明のニューラルネットワークを用いて精度の高い関係式を見出し、その対策にあたる医療の発展に貢献することができる。

　さらに、前述したＳＮ列の偶数番号の面積Ｓを故意に１．０倍、奇数番号の面積を０．９倍の値にし、それぞれ群Ａ、群Ｂと故意に２分類したＹＹ／Ｗ（べき乗値の積）の３角形番号順のグラフを示す図２３に着目すると次のことが解る。群Ａの領域と群Ｂの領域の間には、群Ａ（バンドＡと呼ぶ）とも群Ｂ（バンドＢと呼ぶ）ともいえないグレイゾーンの空白領域（バンドＣと呼ぶ）が広く形成される。このグレイゾーンの空白領域（バンドＣ）を積極的に利用することでシステム制御に応用することができる。

（実施例３）
　第３の実施例として、第２の実施形態を次数２のフェルマー曲線を表す円の方程式、１＝ｘ＾２＋ｙ＾２に適用する。１＝ｘ＾２＋ｙ＾２は、１＝（ｘ＋ｉ＊ｙ）＊（ｘ－ｉ＊ｙ）に因数分解できる。従って、元データを右項のｘとｙの数値を複数個用意し、答えデータを定数１として、係数ｋ＝－ｉ、－１，０，１，ｉを予め設定することにより、±１及び虚数単位ｉの係数を掛け合わせた差及び和を含む組み合わせで構成されるＬｎＳテーブルを自動作成する。そのＬｎＳテーブルから２次元の入力データ要素を抽出し組み合わせたＤｎＬテーブルを自動作成し、１次元の答えデータである１を連結させた３次元のＤｎＬテーブルを作る前処理が行われ、順にニューラルネットワークへ入力されて最適な関係式である円の方程式が導かれる。

　このように本発明のニューラルネットワークは、円あるいは楕円の曲線を方程式で認識でき、直線の認識より困難な曲線対象物の判別に利用できる。例えば、回転運動する機械の軸と軸受けの外観や非破壊検査データの良否の特徴を学習し、関係式と閾値を見つけて設計値との差異、変形、傷、ヒビ、摩耗他欠陥を判別できる。

（実施例４）
　第４の実施例として、ＣａｒｔＰｏｌｅ倒立振子装置の２次元シミュレーションを用いて、棒が倒れない安定制御できる制御式を導き出す。本事例では、４次元の入力データをリアルタイムに受け取り、Ｃａｒｔを右に押すか、左に押すかの出力を返してＣａｒｔ上のＰｏｌｅを倒さない制御式をべき乗探索法を用いた強化学習を行い、いち速く制御式を探索し、棒（Ｐｏｌｅ）を倒さず安定化させることを目的とする。

　ＣａｒｔＰｏｌｅ倒立振子のアルゴリズムの性能評価のプラットフォームは、Ｏｐｅｎ　Ｇｙｍより提供されており、これに、べき乗探索法を用いた強化学習のアルゴリズムを実装し最短で安定化させる制御式を探索する。また、従来のニューラルネットワークを用いた強化学習法の一つである方策勾配法と比較する。

　ＣａｒｔＰｏｌｅ倒立振子は、図２４のように、台座（Ｃａｒｔ）の上に連結されている棒（Ｐｏｌｅ）を最初、横軸ｘ＝０に垂直に立てると、重力とゆらぎを模擬した力が働き左右どちらかに倒れようとする、これを倒さないように台座（Ｃａｒｔ）を左右に均等な力で押し、所定時間倒さないようにするシミュレーションであり、所定時間内に一定の角度以上、棒（Ｐｏｌｅ）が倒れてしまうと終了となる。

　最初に、棒（Ｐｏｌｅ）が倒れないようにするアルゴリズムの一つである従来型の方策勾配法を用いて所定時間倒さないようにする方法を説明する。ＣａｒｔＰｏｌｅ倒立振子の出力として得られる情報は、図２４に図示、及び図２５の表に示すように、その都度の状態を台座（Ｃａｒｔ）の位置、速度、棒（Ｐｏｌｅ）の角度、角速度の４つが状態変数（ｄ０、ｄ１、ｄ２、ｄ３）として台座（Ｃａｒｔ）を押したときに返される。また、ある状態の状態変数からとりうる行動は図２６のように、台座（Ｃａｒｔ）を同じ力で右に押すか左に押すかの２つである。

　従来型のニューラルネットワークは、図２７のように４入力のシンプルな単層構造を使い、重み付けパラメータｗｎ＝（ｗ０、ｗ１、ｗ２、ｗ３）及びバイアスｂを学習し更新する。バイアスｂは使わずｂ＝０とすると、その出力値ｘは下記（数１２）で表される。また、方策勾配法には報酬関数（Ｒｔ）を設定し、報酬関数の値を最大化するように学習させていく方法を用いる。重み付けパラメータの更新方法は、従来ネットワークの学習率η及び偏微分を用いて下記（数１３）のように表される。
（数１２）
ｘ＝ｄ０＊ｗ０＋ｄ１＊ｗ１＋ｄ２＊ｗ２＋ｄ３＊ｗ３
（数１３）
ｗｎ←ｗｎ＋η（∂Ｒｔ）／（∂ｗｎ）

　方策勾配法は、いくつかのエピソードごとを一つの評価範囲に設定しパラメータを更新していく方法である。このシミュレーションでは、１エピソードを台座（Ｃａｒｔ）を１回押す作業を１ステップと定義して、棒（Ｐｏｌｅ）が倒れる（終了）までのステップ数が動作の回数を表し、１エピソードとする。また所定時間倒れないときの最大ステップ数は２００として打ち切り、そのエピソードを終了する。従って、１エピソードの最大ステップ数は２００に設定し、いくつかのエピソードの平均ステップ数は、棒（Ｐｏｌｅ）が倒れずに耐えることができたステップ数の平均である。ここでは、評価範囲を過去１００エピソード毎に設定し、その平均ステップ数を記録し、学習の進行具合をモニターするとともに、報酬関数の更新パラメータに用いる。

　報酬関数の与え方は、ｔエピソード目の報酬をＲｔとすると図２８のように、２００ステップ倒れずに終了すると（－１）の値、２００ステップ内で倒れると（ステップ数－２００）の値を与える。

　重み付けパラメータｗｎの学習を進めるうえで初期値を０に設定、あるいは何らかの値を設定し開始するが、重み付けパラメータｗｎの初期値及び更新状況によっては、いつまで学習しても目標ステップ数２００へ到達しない問題が発生する。従来型の方策勾配法の解決策として、重み付けパラメータｗの初期値に乱数値を設け、さらに途中に、ある程度ランダムな行動を起こすことを目的とした適度な乱数値Ｎを加えてパラメータｗを更新し報酬を最大化する手法が提案されており、ε－ｇｒｅｅｄｙアルゴリズムとして知られている。具体的には（数１３）式を基本にして１０エピソード毎（バッチ数毎）にパラメータｗｎに標準偏差ｓｉｇｍａの振れ幅を持つ１０個の乱数値Ｎ［ｉ］を再構成し、エピソードの進行ｉ＝０～９の順に乱数値Ｎ［ｉ］を加え、さらに報酬の偏微分∂Ｒｔ／∂ｗｎを加えて更新しランダムに次の行動を選択する（数１４）式を採用している。以上に説明した従来型の方策勾配法のフローチャートを図２９に示した。ここで、初期値パラメータとして重み付けｗｎを変動させる学習率η及び振れ幅の標準偏差ｓｉｇｍａの値をη＝０．２、ｓｉｇｍａ＝０．０５に設定している。
（数１４）
ｗｎ←ｗｎ＋Ｎ［ｉ］＋η（∂Ｒｔ）／（∂ｗｎ）

　前述の従来型の方策勾配法をＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装した結果例を図３０に示した。図３０は横軸にエピソード数、縦軸に棒（Ｐｏｌｅ）が倒れずに耐えることができた過去１００エピソード毎の平均ステップ数のグラフである。このグラフから１５００エピソードで平均ステップ数１９５に到達し終了している。また、平均ステップ数１９５を達成したときの重み付けパラメータは（ｗ０、ｗ１、ｗ２、ｗ３）＝（－０．５３２、０．６１０、１．２５４，１．４２１）であった。

　図３１の表は、棒（Ｐｏｌｅ）が倒れずに耐えることができた過去１００エピソード毎の平均ステップ数≧１９５を満足する重み付けパラメータ例であり、前記の（ｗ０、ｗ１、ｗ２、ｗ３）＝（－０．５３２、０．６１０、１．２５４，１．４２１）のみでなく、ＣａｒｔＰｏｌｅ倒立振子シミュレーションを繰り返すと多数存在し、その５例を示した。図３１にある５例の重み付けパラメータを用いたプログラムをＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装すると、どれも最初から２００ステップ数以上、棒（Ｐｏｌｅ）を倒さずに立たせておくことができる。しかし、従来型の方策勾配法から得られた５例の重み付けパラメータを見ても、棒（Ｐｏｌｅ）を倒さずに立たせておくことができる概念を理解するには、極めて困難な欠点がある。

　前述のように、ＣａｒｔＰｏｌｅ倒立振子の安定化制御に従来型の方策勾配法を用いて、棒（Ｐｏｌｅ）を一定時間倒れない制御式を導く方法について説明した。しかし、得られた制御式を分析し理解し応用へ発展させることは困難である。例えば棒（Ｐｏｌｅ）を垂直に立たせた状態から、右あるいは左にコントロールし動かすような制御方法を見出すには至らない。本発明の、べき乗探索法を用いた強化学習のアルゴリズムは、得られた関係式を人が理解できるように分析、視覚化することができ、棒（Ｐｏｌｅ）を垂直に立たせた状態から、右あるいは左にコントロールし動かす制御方法を直感できる。さらに、目的とする制御に必要な状態パラメータ（入力データ）のみを抽出し不必要（余剰）な状態パラメータ（入力データ）を削除することができる。

　本発明の、べき乗探索法を用いた強化学習について説明する。ＣａｒｔＰｏｌｅ倒立振子の棒（Ｐｏｌｅ）及び台車（Ｃａｒｔ）の動きは前述と同じであり、棒（Ｐｏｌｅ）が倒れないように制御する強化学習アルゴリズムについて図３２のフローチャートに沿って詳細に説明する。

　べき乗探索法をＣａｒｔＰｏｌｅ倒立振子に適用するにあたり、４次元の状態変数（ｄ０、ｄ１、ｄ２、ｄ３）の（ｂａｓｅ）べき乗値を（Ｄ０、Ｄ１、Ｄ２、Ｄ３）とし、べき指数をＰｎ＝（ｐ０、ｐ１、ｐ２、ｐ３）とする。ここで、４次元の状態変数を組み合わせて構成する所定の関係を有する答えデータをＤ４とおく。Ｄ４の期待値は定数である１にできる。従って５次元の入力要素は（Ｄ０、Ｄ１、Ｄ２、Ｄ３、１）と置くことができる。ＹＹ／Ｗ（べき乗値の積）は（数５）から（数１５）の関数で与えられる。ここでＷ＝１に単純化すると目標値ＹＹは（数１６）に表すことができる。次に（数１６）の両辺をｌｏｇ値の式にすると（数１７）が得られる。（数１７）式の右辺は、（数１１）式の重み付けｗｎをべき指数数Ｐｎに置き換えた式に等しく、左辺ｌｏｇ（ＹＹ）は目標値ＹＹ＝１のとき、ｌｏｇ（ＹＹ）＝０である。ここで、ｌｏｇ（ＹＹ）＝ｘとおくと、前述の従来型の方策勾配法に用いた重み付けｗｎをべき指数Ｐｎに置き換えた（数１２）式に等しく、アルゴリズムの比較説明に都合がよい。
（数１５）
ＹＹ／Ｗ＝Ｄ０＾ｐ０＊Ｄ１＾ｐ１＊Ｄ０＾ｐ２＊Ｄ３＾ｐ３
（数１６）
ＹＹ＝Ｄ０＾ｐ０＊Ｄ１＾ｐ１＊Ｄ０＾ｐ２＊Ｄ３＾ｐ３
（数１７）
ｌｏｇ（ＹＹ）＝ｄ０＊ｐ０＋ｄ１＊ｐ１＋ｄ２＊ｐ２＋ｄ３＾ｐ３

　最初に初期設定を行う（ステップＳＳ１）。説明の便宜上、従来型の方策勾配法に倣い、１エピソード内の最大ステップ数２００、平均値評価に用いるエピソード数を１００、べき指数Ｐｎを更新させる偏差Ｎの配列のバッチ数を１０に設定する。ここで、４次元の偏差Ｎの設定値は、従来型の方策勾配法では乱数値の初期値０を設定したが、べき乗探索法に用いる偏差は、べき数を更新させる更新量Δｐｎを設定する。本事例では更新量Δｐｎは±１として図３３の表に示した。バッチ数１０に相当する１０個（ｉ＝０～９）の偏差Ｎ［ｉ］を４次元配列（Δｐ０、Δｐ１、Δｐ２、Δｐ３）の各項に順次１、－１の整数値を設定する。但しｉ＝８及び９においては、０を設定した。４次元の場合８個の更新量Δｐｎでよいのでｉ＝８及び９の設定は余剰であるが、従来型の方策勾配法との比較説明の便宜上２個は更新量Δｐｎを０設定とし偏差Ｎを更新しない余剰部分として残した。次に、報酬Ｒｔ及び報酬Ｒｔを正規化した変数Ｒｔａの初期値を０に設定する。

　次に、バッチ数１０回分のループ初期値ｉ＝０を設定（ステップＳＳ２）したあとに、べき指数Ｐｎを更新する。べき指数Ｐｎの更新方法は、（数１８）式で表され、偏差Ｎ［ｉ］と報酬の偏微分∂Ｒｔ／∂Ｐｎを加えて更新する（ステップＳＳ３）。
（数１８）
Ｐｎ←Ｐｎ＋Ｎ［ｉ］＋η（∂Ｒｔ）／（∂Ｐｎ）

　次に、ＣａｒｔＰｏｌｅの動作の回数を表すステップ数を初期値ｓｔｅｐ＝０に設定したあと、状態変数（ｄ０、ｄ１、ｄ２、ｄ３）を０にリセットし初期状態にする（ステップＳＳ４）。

　次に、ＣａｒｔＰｏｌｅを初期状態（棒の垂直に立っている状態）からリリースする（ステップＳＳ５）。

　最初に台車を左へ一回押す（ステップＳＳ６）。

　台車を押すことにより、ＣａｒｔＰｏｌｅから状態変数（ｄ０、ｄ１、ｄ２、ｄ３）が出力され、記憶する（ステップＳＳ７）。

　ニューラルネットワークの出力値ｘを（数１１）式から計算する（ステップＳＳ８）。

　次に、出力値ｘに基づき、ｘ＞０のとき、台車を右に押す。ｘ≦０のとき、台車を左に押す（ステップＳＳ９）。

　台車を押すことにより、ＣａｒｔＰｏｌｅから状態変数（ｄ０、ｄ１、ｄ２、ｄ３）及び、棒が倒れて終了したかどうかの信号が出力され、記憶する（ステップＳＳ１０）。

　棒が倒れて終了したら報酬Ｒｔ＝ｓｔｅｐ－２００を得て、バッチ数１０回分のループ数を１増やす（ステップＳＳ１１→ＳＫ１→ＳＳ１２）。棒が倒れずに、１エピソードｓｔｅｐ＝２００を達成したら報酬Ｒｔ＝－１を得て、バッチ数１０回分のループ数を１増やす（ステップＳＳ１１→ＳＫ２→ＳＫ３→ＳＳ１２）。棒が倒れずに、１エピソードｓｔｅｐ＜２００であれば、ステップ数を１増やしてステップＳＳ１１の先頭にループを戻す（ステップＳＳ１１→ＳＫ２→ＳＫ４→ＳＳ８）。

　次に、バッチ数のループｉを１増やし、報酬Ｒｔを過去１０回分の値を記憶する。次に、１エピソード内で倒れなかったステップ数を表す値であるｓｔｅｐを過去１００回分記憶し、その平均値ｓｔｅｐｍｅａｎを計算し記憶する（ステップＳＳ１２～ＳＳ１３）。

　次に、バッチ数のループｉがバッチ数１０回分に達するかどうかチェックする（ステップＳＳ１４）。バッチ数１０回分に達していないときは、ステップＳＳ４に戻る。バッチ数１０回分に達すると、ｓｔｅｐｍｅａｎの値をチェックし、ｓｔｅｐｍｅａｎ≧１９５を満足すると終了する（ステップＳＳ１５）。ｓｔｅｐｍｅａｎ＜１９５のときは、過去１０回分の報酬Ｒｔを正規化したＲｔａを計算、記憶する（ステップＳＳ１６）。そのＲｔａとべき指数Ｐｎを更新させる偏差Ｎの内積を計算し、偏微分値∂Ｒｔ／∂Ｐｎとして記憶してから、ステップＳＳ２に戻る（ステップＳＳ１７）。

　前述のべき乗探索法を用いたアルゴリズムをＣａｒｔＰｏｌｅ倒立振子シミュレーションへ実装した結果例を図３４に示した。このグラフから１１０エピソードで平均ステップ数１９５に到達し終了している。また、平均ステップ数１９５を達成したときの、べき数値は（ｐ０、ｐ１、ｐ２、ｐ３）＝（－１、２、３，３）であった。従来型の方策勾配法のグラフ図３０と比較すると１／１０以下のエピソード数、すなわち短時間で棒が倒れない関数の探索を完了している。図３５の表は、棒（Ｐｏｌｅ）が倒れずに耐えることができた過去１００エピソード毎の平均ステップ数≧１９５を満足するべき数値の例であり、前述の（ｐ０、ｐ１、ｐ２、ｐ３）＝（－１、２、３，３）のみでなく、ＣａｒｔＰｏｌｅ倒立振子シミュレーションを繰り返すと多数存在し、その５例を示した。

　棒が倒れず安定する理由を、本特許であるニューラルネットワークを用いて、人が理解できるように分析、視覚化することができる。べき数値（ｐ０、ｐ１、ｐ２、ｐ３）＝（－１、２、３，３）を例にして説明する。

　べき指数の値（ｐ０、ｐ１、ｐ２、ｐ３）＝（－１、２、３，３）をＣａｒｔＰｏｌｅ倒立振子に実装しシミュレーションを実施する。１エピソード内の最初から２００ステップの４次元の状態変数（ｄ０、ｄ１、ｄ２、ｄ３）の入力値、及び台車を右に押したステップを群Ａ、左に押したステップを群Ｂの２分類の答えのデータとして、第２の実施例（ヘロンの公式）で説明した評価関数に判別率を用いる方法と同様に、本発明のニューラルネットワークへ入力すると図２３で説明した縦軸ＹＹ／Ｗ（べき乗値の積）のグラフが得られ図３６に示した。図３６は、横軸に台車を押した時系列順、すなわちステップＮｏ．順を表し、縦軸にＹＹ／Ｗ（べき乗値の積）の値をプロットし、台車を右に押したステップ群Ａを●、台車を左に押したステップ群Ｂを菱形で表示している。なおＹＹ／Ｗ（べき乗値の積）の値は、４次元の状態変数（ｄ０、ｄ１、ｄ２、ｄ３）の（ｂａｓｅ）べき乗値（Ｄ０、Ｄ１、Ｄ２、Ｄ３）に変換する底（ｂａｓｅ）は１０を用いて、ニューラルネットワークへ入力する５次元の入力要素を（Ｄ０、Ｄ１、Ｄ２、Ｄ３、１）とし、判別率を最大にする（数５）及び（数１５）式に基づく出力値として得られる。

　前述の動作説明から、ＹＹ／Ｗ＝Ｄ０＾ｐ０＊Ｄ１＾ｐ１＊Ｄ２＾ｐ２＊Ｄ３＾ｐ３＞１のとき台車を右に押し、ＹＹ／Ｗ＝Ｄ０＾ｐ０＊Ｄ１＾ｐ１＊Ｄ２＾ｐ２＊Ｄ３＾ｐ３≦１のとき台車を左に押すルールであり、図３６のグラフを用いて、次のことを説明できる。

　図３６のグラフは、縦軸ＹＹ／Ｗ（べき乗値の積）の値で台車を確実に右へ押すＡ群、台車を確実に左へ押すＢ群、及び台車を右に押すときと左に押すときが混在するＣ群の領域に区別することができる。その中心値はＹＹ／Ｗ＝１である。ここで、ＹＹ／Ｗ（べき乗値の積）の値を判定する閾値を導入し変数Ａとすると、棒（Ｐｏｌｅ）はＹＹ／Ｗ（べき乗値の積）の閾値Ａを用いて左右の動きを制御できる。具体的には、ＹＹ／Ｗの閾値Ａが１のとき台車は中心に留まり棒（Ｐｏｌｅ）を垂直に立たせた状態を保つ。ＹＹ／Ｗ（べき乗値の積）の閾値Ａが１より大きいときは、初期状態で台車を右に押す機会が多くなり棒（Ｐｏｌｅ）は右に傾く。次の動作は棒（Ｐｏｌｅ）を倒さないようにするため、台車を左に押し台車は左へ進む。逆にＹＹ／Ｗ（べき乗値の積）の閾値Ａが１より小さいときは、初期状態で台車を左に押す機会が多くなり棒（Ｐｏｌｅ）は左に傾く。次の動作は棒（Ｐｏｌｅ）を倒さないようにするため、台車を右に押し台車は右へ進む。更に、ＹＹ／Ｗ＝１を中心とした閾値の深度により台車の移動速度を制御できることが直感できる。具体例として、べき指数の値を（ｐ０、ｐ１、ｐ２、ｐ３）＝（－１、２、３，３）のときのＹＹ／Ｗ（べき乗値の積）の式及び閾値Ａの値を変化させたときの台車の動作を図３７に纏めた。

　また、図３５のＮｏ．４及びＮｏ．５のべき指数ｐ０、ｐ１はそれぞれ０の値に着目すると、棒が中央で倒れない安定制御には、台座（Ｃａｒｔ）の位置、速度の状態変数であるＤ０、Ｄ１は不要であることを示している。棒が中央で安定している状態では、台座（Ｃａｒｔ）の位置はほぼ０、速度もほぼ０で中央に位置している状態であることから、無くても制御できると理解できる。このことからＤ０、Ｄ１を外し、Ｄ２、Ｄ３の棒（Ｐｏｌｅ）の角度、角速度の２つの状態変数を使って、前述のべき乗探索法を用いた強化学習を行い、棒（Ｐｏｌｅ）が倒れずに過去１００エピソード毎の平均ステップ数≧１９５を満足するべき数値の３例を図３８に示した。さらに、図３９に、状態パラメータ（Ｄ２、Ｄ３）及びべき数値（ｐ２、ｐ３）＝（５、３）を用いて、棒（Ｐｏｒｌ）を倒さずに、台座（Ｃａｒｔ）を中心位置から、左に移動、次に右へ移動し、さらに左端へ移動制御する制御式の適用例を示した。

このように、本特許は、答えを得るために必要な入力データを絞り込むことができる。つまり、不必要（余剰）な入力データを除くことで演算時間の削除、及び入力データを得る手段として必要なセンサー等の削減ができる。

　本事例の応用例として、各種センサー、モーター、通信及び制御用マイクロコンピュータを装備した教育版の組み立てキット、積み木（ブロック）を用いて、倒立振子装置を組み立て、棒を倒さずに静止、あるいは棒を左右に制御する体験を通してＡＩ（Ａｒｔｉｆｉｃｉａｌ　Ｉｎｔｅｌｉｇｅｎｃｅ）を学べる。教材によっては関係式が公式、法則を導きだしている場合もあるし、それに近い形で提供され、何か発見できるようなワクワク感があり、学習者の動機づけになる。

　制御方法を学習し、べき乗値の積を内蔵する制御式が提供される。シンプルな制御式が得られ、その式の成り立ちや制御方法が理解しやすい。場合によっては、制御ヘの貢献度が小さく不必要な入力データ部品（センサー等）の削減に繋がったり、新たな制御方式の発見に繋がったりする。

　得られた制御式を制御装置に適用すると、リアルタイムに制御式の安定性を評価し最適化できる。例えば、環境が異なった同装置の制御状態を学習し、動作が悪化している場合は良好な制御状態を保てる制御式へ更新、いわゆるズレ補正をリアルタイムに行い、より高い安定性を追求したフィードバック制御の自動化ができる。
　また、得られた制御式をこれを算出した演算装置と切り離した別のコンピュータのメモリに予め格納しておき、この格納された制御式と別途センサー等により入力されたデータで、具体的な計算を行い、その結果に従いモータ等の被制御装置を制御することができる。

　産業用ロボットは様々な現場に持ち運んで組み上げて、目的とした条件で動くように調整が入る。制御パラメータを設定しなおす、あるいは制御式に補正が必要な場面で、本特許による、べき乗探索法を用いた強化学習を用いて再学習を行うと、より速く安定した最適な制御式を導き出し、制御パラメータあるいは制御式を実装しなおすことが容易である。同様に自動車や飛行体の自動制御にも応用できる。

（実施例５）
　前述の第１～第４の実施例で、べき指数追加加算型ニューラルネットワーク用いて適切な法則、方程式、関係式（制御式）を導けることを説明した。このように本発明は、学習した入力以外の未学習の入力に対しても適切な出力を与える与える能力を持つ汎化能力に優れており、この能力をプロセスに適用すると、学習したプロセスだけでなく、それに類似したプロセスについても適切な予測を極めて論理的に行うことができる。この背景にあるのが、論理演算子（ＡＮＤ．ＯＲ，ＮＡＮＤ，ＮＯＲ，ＥＸＯＲ）を簡単に学習することができること、ｎ進法を１０進法に変換するなどの論理演算の数値データを簡単に学習し汎用式を提示できる優れた演算機能を有していることにある。

　論理演算子の排他論理和（ＥＸＯＲ）は非線形性を有するため、従来の単純パーセプトロンを使って真偽の出力を一本の直線（閾値）で分割できない。そのため２入力の真理値表を図４０に示すように、単純パーセプトロンで構成したＮＡＮＤ，ＯＲ，ＡＮＤ論理演算子を繋ぎ合わせた多層化ニューラルネットワーク構造へ大幅な設計変更を伴う。その学習した判別出力式は複雑に入り組んだパラメータ式になり、その式の理解も容易ではない。一方、べき指数追加加算型ニューラルネットワークは非線形を扱うことができ、図６及び図８のいずれか一つの、べき指数追加加算型ニューラルネットワークの基本構造に変更を加えることなくそのまま適用し、真偽の出力を一本の直線で分割するシンプルな判別出力式を導くことができる。

　例えば、図４１に示す３入力（ｄ０、ｄ１、ｄ２）の真理値表に示す排他論理和（ＥＸＯＲ）の出力データｄ３は、底（ｂａｓｅ）を１０とした４次元入力値（Ｄ０、Ｄ１、Ｄ２、Ｄ３）にして、べき指数追加加算型ニューラルネットワークを用いて出力分類の判別学習を行うと、図４２に示すように、べき指数（－１，１、－１，２）を持つ判別式が導かれ、一本の直線（閾値）５を用いて正しく分割される。なお、２入力の排他論理和（ＥＸＯＲ）は、あまりに簡単に解けるので説明を省いた。

　次に、２進数と１０進数の関係を表す表を図４３に示した。図４３は２進数４次元入力データ（ｄ０、ｄ１、ｄ２、ｄ３）と、その１０進数である０～９の出力値ｄ４の表である。これを底（ｂａｓｅ）を１０とした５次元入力値（Ｄ０、Ｄ１、Ｄ２、Ｄ３、Ｄ４）にして、図６及び図８のいずれか一つの、べき指数追加加算型ニューラルネットワークの基本構造をそのまま適用し、べき指数－１０～１０間の数式探索を行うと、図４４に示すように、べき指数（－８、－４、－２、－１，１）を持つ出力式と出力値１が導かれる。これより１０進数出力ｄ４の関係式は、ｄ４＝ｌｏｇ１０（Ｄ０＾８＊Ｄ１＾４＊Ｄ２＾２＊Ｄ３）＝２＾３＊ｄ０＋２＾２＊ｄ１＋２＾１＊ｄ３＋２＾０＊ｄ０　と表され、２進数を１０進数へ変換させる公式（汎用式）そのものであることが理解できる。これより２進数４次元データで表せる未学習の１０進数値１０～１５の値も正しく予測されることが判る。

　このように、べき指数追加加算型ニューラルネットワークは、その構造に手を加えることなく関係式、判別式を導くことができる応用範囲の広い演算方式であり、集積回路にしたＩＣ、マイクロコンピュータを提供し、判別装置及び制御装置に搭載すると、装置の高速化、小型化、低消費電力が実現できる。

（他の実施形態）
　本発明は上述した実施形態に制約されるものではなく、本発明の主旨を逸脱しない範囲内で種々変更して実施することが可能である。そして、それらはすべて、本発明の技術思想に含まれるものである。

１…演算装置、１Ａ…機械学習装置、１Ｂ…判別装置、
２…判別器学習部、３…学習パラメータ記憶部、４…学習データ記憶部、
５…学習データ処理部、６…判別結果処理部、７…判別データ取得部、
２０…学習部、２１…判別処理部、
１００Ａ～１００Ｃ…ニューラルネットワーク構造、
１１０Ａ～１１０Ｃ…入力層、１２０Ａ～１２０Ｃ…出力層
１３０…隠れ層、１３１…第１の隠れノード、１３２…第２の隠れノード

Claims

　入力層及び出力層を少なくとも含むニューラルネットワーク構造を用いて、前記入力層に入力される複数の入力データ（Ｄ０,Ｄ１,…,ＤＮ）に対して前記出力層から出力値を出力する演算装置であって、
　前記入力層は、
　　複数の前記入力データにそれぞれ対応付けられて、複数の前記入力データをそれぞれべき乗する複数のべき指数（ｐ０,ｐ１,…,ｐＮ）を、前記ニューラルネットワーク構造の学習パラメータとして有し、
　前記出力層は、
　　前記入力層に入力された複数の前記入力データが複数の前記べき指数によりそれぞれべき乗された複数のべき乗値（Ｄ０^ｐ０,Ｄ１^ｐ１,…,ＤＮ^ｐＮ）の積（ＹＹ０＝Ｄ０^ｐ０＊Ｄ１^ｐ１＊…＊ＤＮ^ｐＮ）に基づいて、前記出力値（ｙ＝ｆ（ＹＹ０））を出力する、
　演算装置。
　前記ニューラルネットワーク構造は、
　　前記入力層と前記出力層との間に隠れ層をさらに含み、
　前記隠れ層は、
　　複数の前記入力データが前記学習パラメータとしての複数の重み付けパラメータ（ｗ０，ｗ１，…,ｗＮ）を介してそれぞれ入力されて、下記の式（数１）で規定される目標値（ＹＹ１）を前記出力層に出力する第１の隠れノードと、
　　複数の前記入力データが前記複数の重み付けパラメータを介してそれぞれ入力されるともに、前記学習パラメータとしてのバイアスパラメータ（ｂ）が入力されて、下記の式（数２）で規定される加算型演算出力（ＢＹＡ）を前記出力層に出力する第２の隠れノードとを有し、
　前記出力層は、
　　前記目標値（ＹＹ１）と前記加算型演算出力（ＢＹＡ）とに基づいて、前記出力値（ｙ＝ｆ（ＹＹ１，ＢＹＡ））を出力する、
　請求項１に記載の演算装置。
（数１）
　ＹＹ１＝Ｄ０^ｐ０＊Ｄ１^ｐ１＊…＊ＤＮ^ｐＮ＊Ｗ０＊Ｗ１＊…＊ＷＮ
（数２）
　ＢＹＡ＝Ｂ＊（ｂａｓｅ）^{（ＳＩＧＭＡ［ｎ＝０→Ｎ］（ｗｎ＊ｐｎ＊ｄｎ））}
　但し、
　　ｂａｓｅは、１を除く正の数
　　Ｄｎ＝ｂａｓｅ^ｄｎ（ｎ＝０，１,…,Ｎ）
　　Ｗｎ＝ｂａｓｅ^ｗｎ（ｎ＝０，１,…,Ｎ）
　　Ｂ＝ｂａｓｅ^ｂ
　である。
　前記学習パラメータとしての複数の前記べき指数、複数の前記重み付けパラメータ、及び前記バイアスパラメータは、
　　複数の前記入力データを前記学習データとして複数組用いることで学習されるパラメータであって、
　　前記学習データとしての複数の前記入力データを前記入力層に入力したときに前記第１の隠れノードから出力される前記目標値（ＹＹ１）と前記第２の隠れノードから出力される前記加算型演算出力（ＢＹＡ）との間の差分（｜ＹＹ１－ＢＹＡ｜）が小さくなるように調整される、
　請求項２に記載の演算装置。
　前記入力層は、
　　複数の前記入力データ（Ｄ０,Ｄ１,…,ＤＮ）を対数（ｄ０,ｄ１,…,ｄＮ）にそれぞれ変換し、複数の前記入力データの前記対数と複数の前記べき指数とをそれぞれ乗算した複数の乗算値（ｄ０＊ｐ０，ｄ１＊ｐ１，…，ｄＮ＊ｐＮ）を前記出力層に出力し、
　前記出力層は、
　　複数の前記乗算値に対する総和（ｄ０＊ｐ０＋ｄ１＊ｐ１＋…＋ｄＮ＊ｐＮ）を真数（ｂａｓｅ^{ｄ０＊ｐ０＋ｄ１＊ｐ１＋…＋ｄＮ＊ｐＮ}）に変換し、前記真数を前記積として、前記出力値（ｙ＝ｆ（ＹＹ０））を出力する、
　請求項１に記載の演算装置。
　前記学習パラメータとしての複数の前記べき指数は、
　　複数の前記入力データと、複数の前記入力データに対応付けられた教師データとを含む学習データを複数組用いることで学習されるパラメータであって、
　　前記学習データに含まれる複数の前記入力データを前記入力層に入力したときに前記出力層から出力される前記出力値と、前記学習データに含まれる教師データとの間の差分が小さくなるように調整される、
　請求項１又は請求項４に記載の演算装置。
　複数の前記入力データの少なくとも１つは、
　　複素数で表されるデータである、
　請求項１乃至請求項５のいずれか一項に記載の演算装置。
　請求項１乃至請求項６のいずれか一項に記載の演算装置により用いられる前記ニューラルネットワーク構造を構成する集積回路であって、
　前記入力層及び前記出力層を構成する入出力部と、
　前記学習パラメータを記憶する記憶部と、
　前記入力層に入力される複数の前記入力データ及び前記記憶部に記憶された前記学習パラメータに基づいて、前記出力層から前記出力値を出力するための演算を行う演算部とを備える、
　集積回路。
　請求項１乃至請求項６のいずれか一項に記載の演算装置により用いられる前記ニューラルネットワーク構造を有する学習モデルを生成する機械学習装置であって、
　複数の前記入力データを少なくとも含む学習データを記憶する学習データ記憶部と、
　前記学習データ記憶部に記憶された前記学習データを前記学習モデルに入力することで、前記学習パラメータの学習を行う学習部と、
　前記学習部による学習結果として、前記学習パラメータを記憶する学習パラメータ記憶部とを備える、
　機械学習装置。
　請求項８に記載の機械学習装置により生成された前記学習モデルを用いて、判別データに対する判別結果を出力する判別装置であって、
　前記判別データを取得する判別データ取得部と、
　前記判別データ取得部により取得された前記判別データを前記学習モデルに入力することで、当該学習モデルからの前記出力値に基づいて前記判別結果を出力する判別処理部とを備える、
　判別装置。
　請求項１乃至請求項６のいずれか一項に記載の演算装置により出力された制御式に、センサー又はデータ入力により入力されたデータを入力し計算された計算値に基づいて被制御装置を制御する制御方法。
　請求項１乃至請求項６のいずれか一項に記載の演算装置により出力された制御式が格納される格納部と、
　センサー又はデータ入力により入力されたデータを該制御式に入力し計算する計算部と、
　該計算部から出力された計算値に基づいて被制御装置を制御する制御部とを有する制御装置。