JP3675246B2 - 正誤答判定機能を有するニューラルネットワーク手段 - Google Patents

正誤答判定機能を有するニューラルネットワーク手段 Download PDF

Info

Publication number
JP3675246B2
JP3675246B2 JP22919299A JP22919299A JP3675246B2 JP 3675246 B2 JP3675246 B2 JP 3675246B2 JP 22919299 A JP22919299 A JP 22919299A JP 22919299 A JP22919299 A JP 22919299A JP 3675246 B2 JP3675246 B2 JP 3675246B2
Authority
JP
Japan
Prior art keywords
output
value
neural network
intermediate layer
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22919299A
Other languages
English (en)
Other versions
JP2001051969A (ja
Inventor
陽太郎 八塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP22919299A priority Critical patent/JP3675246B2/ja
Publication of JP2001051969A publication Critical patent/JP2001051969A/ja
Application granted granted Critical
Publication of JP3675246B2 publication Critical patent/JP3675246B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、パターン認識、データマイニング及び画像処理などの分野に適用可能なニューラルネットワークにおいて、学習済みのニューラルネットワークを用いて入力データを処理する際に、学習入力データやテスト入力データ以外の未知入力データが入力された場合にも、その出力が正しいか誤りか、即ち正答か誤答かを判定することができる正誤答判定機能を有したニューラルネットワーク手段に関するものである。
【0002】
【従来の技術】
従来のニューラルネットワークには、文献 麻生英樹著、「ニューラルネットワーク情報処理」、産業図書出版などに示されているように、多層(階層)ニューラルネットワークや相互結合ニューラルネットワークなど種々のニューラルネットワークがある。
【0003】
特に、学習入力データと教師信号とを用いて、学習させた多層ニューラルネットワークが種々幅広く実用されている。ここでは、教師付き学習を行う多層ニューラルネットワークを例にとり、正答/誤答判定機能を有するニューラルネットワーク手段の従来技術について説明する。また、説明を簡単にする為に、パターン認識などに於て見られる2値教師信号を用いて学習させ、2値出力信号を送出させることとする。
【0004】
先ず、多層ニューラルネットワークの学習処理の構成について説明する。図2は、3層ニューラルネットワークの学習処理の1構成例を示す。N個のユニットからなる入力層4、P個の出力ユニットからなる中間層5及びM個の出力ユニットからなる出力層6から構成される。
【0005】
多層ニューラルネットワークへの入力データIは、I、I、..Iの入力データエレメントを持ったベクトルから構成され、入力端子2を介してそれぞれ対応した入力層4の出力ユニットに入力された後、更に中間層5の各出力ユニット(隠れユニット)にそれぞれ重み付けされ出力される。中間層5では、入力層4の各出力ユニットからの重み付けされた出力の総和を入力とし、スレショルド値を差し引いた後、シグモイド関数と呼ばれる非線形入出力特性を持った関数を介して出力される。出力層6においても中間層5と同様な入出力処理が行われた後、各出力層出力ユニットからそれぞれ対応した出力信号をスレショルド回路11を介して2値出力信号に変換し、2値出力端子3を介してニューラルネットワーク1の2値出力信号(2値出力信号エレメント、P、P、..P)として送出する。3層以上の多層の際にも、各層におけるそれぞれの出力ユニットは、入力側の隣接層の各ユニットの出力信号に重み付けをした後、それらの総和を入力として得、更にその入力からスレショルド値を差し引いた後、シグモイド関数などを介し出力層側の隣接層に出力信号を送出する。
【0006】
このような多層ニューラルネットワークの代表的学習方法としては、例えば、前記文献にも記載されているようにバック・プロパゲーション・アルゴリズムがある。
【0007】
本アルゴリズムを用いた学習過程では、重み係数に対して乱数などを用いて初期値設定した後、予め用意された2値教師信号T(教師信号エレメント、T、T、..T)と、入力層4に端子2を介して入力された予め用意された学習入力データに対する出力層6の出力ユニットからの出力信号との誤差信号を減算回路10を介して求め、重み係数制御器7に入力する。
【0008】
重み係数制御器7では、端子11を介して入力された各層の出力ユニットからの出力信号と前記誤差信号とを基に誤差電力を最小にするように各層間の重み係数W(例えば、W(1)は入力層と中間層の間の結合重み係数、W(2)は中間層と出力層間の結合重み係数)の修正値を求め、端子11を介して3層ニューラルネットワーク1の各重み係数を更新する重み係数適応制御による学習を行うものである。
【0009】
この適応制御による学習をすべての学習入力データに対して繰り返し、学習過程に於て収束する(平均出力誤差電力がある既定値以下となる)と、学習入力データに対するスレショルド回路12を介して得られた2値出力信号が2値教師信号と同一となる。しかしながら、誤差電力を極小にするローカルミニマム状態に一旦落ち込むと、全ての学習入力データに対して所望の2値出力信号が必ずしも得られず、2値教師信号と異なる2値出力信号を送出する場合が多い。
【0010】
このようにローカルミニマムの状態で収束した場合には、学習入力データに似たテスト入力データを入力した際に、所望の2値出力信号を送出する汎化能力があまり良くない。また、設定された重み係数の初期値によって正答となる入力データの領域、即ち汎化特性が異なり、初期値依存性がある。
【0011】
パターン認識などに於て、このようなローカルミニマムに収束した学習済みのニューラルネットワークを用いて、入力データに対して実行処理を行わせる際に、汎化能力が優れていない場合には、学習入力データに近い入力データに対して正しい2値出力信号が得られず、多くの誤認識が発生する。実用の際には、学習入力データやテスト入力データ以外の未知データが入力される場合が非常に多いが、これらの多くの未知入力データを学習させる為に事前に収集することは困難な場合が多い。従って、未知入力データに対して所望の正しい2値出力信号が得られているかどうか、即ち正答な2値出力信号が送出されているかどうかを知る事は、非常に重要である。正答な2値出力信号が送出されていないことが判明した場合には、それらの未知入力データを収集して、追加学習などを行い、ニューラルネットワークの性能を改善し、できるだけ正答な2値出力信号を送出させる必要がある。
【0012】
従来技術として、異なる重み係数初期値を設定して学習させた複数個の学習済みニューラルネットワークを入力に対して並列に接続し、それらの2値出力信号を多数決処理して入力データに対する汎化能力を改善し、而も正答判定や誤答判定、或いは判定不明などの正誤答判定情報を得るニューラルネットワーク手段がある。例えば、D. Sarkar, “Randomness in Generalization Ability: A Source to Improve It,” IEEE Trans. Neural Networks Vol.7, No.3, May 1996, pp.676-685. 及び中川徹、他 “複数の乱数化ANNを用いて高信頼なパターン識別とその応用” 電子情報通信学会、信学技報 NC98-155, 1999, 3月などがある。この従来方式によるニューラルネットワーク手段の1例を以下に示す。
【0013】
図3に、従来方式による入力データに対する正誤答判定或いは不明判定などの正誤答判定情報を送出するニューラルネットワーク手段14の1構成例を示す。上述のように、異なった重み係数の初期値を用いてぞれぞれ学習済みの第1、第2及び第3のニューラルネットワーク15、18、21を入力に対して並列接続している。更に、各単体の該ニューラルネットワーク15、18、21の出力層6の出力ユニットからの出力信号はそれぞれスレショルド回路16、19、22を介して2値出力信号に変換され送出され、3入力の多数決処理器24にそれぞれ入力される。ここで、第1の2値出力ニューラルネットワーク手段17は、該第1の学習済みニューラルネットワーク15と該スレショルド回路16から構成される。同様に、第2及び第3の2値出力ニューラルネットワーク手段20、23は、該第2及び第3の学習済みニューラルネットワーク18、21と該スレショルド回路19、22とからそれぞれ構成されている。
【0014】
該多数決処理器24では、該2値出力ニューラルネットワーク手段からの2値出力信号の内2個以上が一致すれば、正誤答判定情報として正答を端子27から送出し、同時にその2値出力信号を端子26から送出する。また、それ以外の場合には、不明或いは誤答と見做し、端子27から正誤答情報として出力する。不明或いは誤答と判定された場合には、予め定められた2値出力ニューラルネットワーク手段からの2値出力信号をニューラルネットワーク手段14の2値出力信号として送出する。
【0015】
出力選択処理器25では、このような多数決処理器24からの多数決判定に従って正答、或いは誤答の正誤答判定情報を得、2値出力ニューラルネットワーク手段からの2値出力信号を最終的に選択することから、単体の学習済みニューラルネットワーク15、18、21の汎化能力より若干高い汎化能力を得ることが出来る。しかしながら、異なる重み係数初期値の設定を行ないローカルミニマムに各ニューラルネットワークを収束させ学習済みとして用いることから、高い汎化能力は得られない欠点を有している。従って、正答率の高い2値出力信号が得にくく、而も正答の判定精度も低い欠点がある。例えば、正答判定の精度は、80%程度で飽和している。また、20%程度の不明判定となっている。
【0016】
ここでは、多数決処理器24を用いた場合について説明したが、これに代わり一致検出器を用いる場合もある。一致検出器を用いた場合には、正答判定の精度は改善されるものの、不明判定や誤答判定が増加する。
【0017】
【発明が解決しようとする課題】
上記の如く構成した従来のニューラルネットワーク手段14では、学習済みニューラルネットワーク15、18、21は、同一の構造を有し、而も同一の学習アルゴリズムを用いてそれぞれ異なった重み係数初期値を用いて同一の教師信号に対して学習を行っている。従って、これらのニューラルネットワーク15、18、21が同一のグローバルミニマムに収束すると、入力データに対する2値出力信号が正答或いは誤答に関らず殆ど一致してしまうことから、それらを並列接続して、入力データに対するそれぞれの2値出力信号を多数決処理しても、正答の場合には全てが正答となり、一方、誤答や不明の場合は全て同様な状態となることから並列接続と多数決処理を用いた効果が非常に小さい。従って、できるだけ異なったローカルミニマムに収束するよう学習させ、それぞれ異なった汎化特性を実現する必要がある。
【0018】
これらの理由から、それぞれ異なりずれた汎化特性を持たせるには、並列接続される学習済みニューラルネットワークとしてローカルミニマム状態で学習を終了させ使用する必要があり、汎化能力が余り高くなく、誤った2値出力信号を出しやすい。従って、入力データに対して出来るだけ正答な2値出力信号を得、而も精度の高い正誤答判定情報を得る為には、多くの学習済みニューラルネットワークを並列接続し、多数決処理をする必要があり、構成が複雑かつ処理量が増加する欠点がある。また、正答/誤答或いは不明の判定を、単に多数決処理のみで行っており、誤った2値出力信号に対してもお互いに同一な誤りならばそのまま正答とみなすなど、入力データに対する正答判断の精度がそれほど高くない欠点を持っている。
【0019】
従って、並列の学習済みニューラルネットワーク数を増加させ多数決処理を行っても、ローカルミニマムに収束していることから正答判定率やその精度に飽和状態が生じ、汎化能力は若干改善されるもの、正答判定の精度や正答判定率は余り改善されない。特に、単体の学習済みネットワークの汎化能力が低く、不明判定が多く発生し、正答の判定が低下すると共にその精度も劣化する。このように、従来の方式では、高い汎化能力と正答判定率とその精度向上とを同時に達成させるには限界がある。
【0020】
また、重み係数の初期値によって汎化特性が異なることを利用しているが、初期値によってどの程度異なった汎化特性が得られるかは、落ち込むローカルミニマムにより決まり、予め予測出来ない。従って、実際に種々の初期値を与えニューロネットワークを学習させた後、学習済みニューラルネットワークを並列接続し動作させて、初めて評価されるなどの欠点もある。特に、これらの欠点は、大規模ニューラルネットワークでは、種々の重み係数の初期値を用いてローカルミニマムに収束させる為の学習処理とテスト入力データに対する汎化能力と汎化特性との評価を繰り返し行なう試行錯誤が必要となり、満足できる結果を得るには膨大な作業を要し、実用的でない。
【0021】
本発明の目的は、上記の問題を解決し、従来の正誤答判定機能を有したニューラルネットワーク手段などに比べて、少ない並列度の学習済みニューラルネットワークを用いて、高精度な正答判定或いは誤答判定を送出する正誤答判定情報を得ると共に、単体の学習済みニューラルネットワークより汎化能力の優れ、正答判定率の高い多値出力信号を送出することができる正誤答判定機能を有するニューラルネットワーク手段を提供することにある。
【0022】
【課題を解決するための手段】
以下に主な手段を示す。第1の手段として、学習入力データと第1の多値教師信号とを用いて学習した学習済みニューラルネットワーク(29)と該ニューラルネットワークの出力層出力ユニットの出力信号を多値変換し多値出力信号を送出する多値スレショルド手段(30)とからなる第1の多値出力ニューラルネットワーク手段(31)と、
該第1の多値教師信号を変換し得られた第2の多値教師信号と該学習入力データとを用いて学習した学習済みニューラルネットワーク(32)と該ニューラルネットワークの出力層出力ユニットの出力信号を多値変換し多値出力信号を送出する多値スレショルド手段(33)と該第2の多値教師信号から該第1の多値教師信号への逆変換機能を有し入力された該多値スレショルド手段(33)からの該多値出力信号を逆変換し新たな多値出力信号を送出する教師信号コード逆変換手段(34)とからなる第2の多値出力ニューラルネットワーク手段(35)とを、入力に対して並列接続し、
更に、少なくとも前記第2の多値出力ニューラルネットワーク手段(35)と同一の構成を有し該入力に対して並列接続された少なくとも一個以上の新たな多値出力ニューラルネットワーク手段(39)を設け、他の前記多値教師信号とは異なり該第1の多値教師信号から変換して得られた多値教師信号と該学習入力データとを用いて学習させた学習済みニューラルネットワーク(36)を用い、該多値出力ニューラルネットワーク手段(39)内の教師信号コード逆変換手段(38)に於て学習に用いた該多値教師信号を前記第1の多値教師信号に逆変換させる機能を用い逆変換された多値出力信号を送出させ、並列接続された前記第1及び第2の多値出力ニューラルネットワーク手段(31)、(35)と少なくとも一個以上の新たな該多値出力ニューラルネットワーク手段(39)とからの該多値出力信号間の一致状態を検出する多数決処理手段(24)と、
該多数決処理手段(24)からの該一致状態を用いて、該第1及び該第2の多値出力ニューラルネットワーク手段(31)、(35)と少なくとも一個以上の新たな該多値出力ニューラルネットワーク手段(39)とからの該多値出力信号の正誤答判定を行ない、
該多値出力信号の何れかを選択し送出すると共に選択送出された該多値出力信号の正誤答判定情報を送出する出力選択処理手段(25)とを少なくとも具備し構成する。
【0023】
第2の手段として、
学習入力データと第1の多値教師信号とを用いて学習した学習済みニューラルネットワーク(41)と該ニューラルネットワークの出力層出力ユニットの出力信号を多値変換し多値出力信号を送出する多値スレショルド手段(42)とからなる第1の多値出力ニューラルネットワーク手段(43)と、
該第1の多値教師信号を変換し得られた、他とは異なる新たな多値教師信号と該学習入力データとを用いて学習した学習済みニューラルネットワーク(44)と該ニューラルネットワークの出力層出力ユニットの出力信号を多値変換し多値出力信号を送出する多値スレショルド手段(45)と該多値教師信号から該第1の多値教師信号への逆変換機能を有し、入力された該多値スレショルド手段(45)からの該多値出力信号を逆変換し得られた多値出力信号を送出する教師信号コード逆変換手段(46)とからなる、少なくとも1個以上の第2の多値出力ニューラルネットワーク手段(47)とを、入力に対して並列接続し、
該第1及び該第2の多値出力ニューラルネットワーク手段(43)、(47)とからの各該多値出力信号を比較し一致状態検出情報を送出する一致検出手段(48)と、
各該多値出力ニューラルネットワーク手段(43)、(47)からの各該多値出力信号の正誤答推定を夫々行なう正誤答推定手段(55)、(56)と、
各該正誤答推定手段(55)、(56)からの正誤答推定情報を用いて、該第1及び該第2の多値出力ニューラルネットワーク手段(43)、(47)からの該多値出力信号の正誤答判定を行ない、該多値出力信号の何れかを選択し送出すると共に選択送出された該多値出力信号の正誤答判定情報を送出する出力選択処理手段(59)とを少なくとも具備し構成する。
【0024】
第3の手段として、
第2の手段に記載の前記ニューラルネットワーク手段において、前記互いに異なる多値教 師信号に対して学習コアー入力データを設け、該学習コアー入力データを少なくとも用いて学習させた各前記学習済みニューラルネットワーク(41)、(44)の中間層出力ユニットからの該学習コアー入力データに対する出力信号を2値変換する各スレショルド回路(51)、(52)を設け、得られた2値出力信号を夫々中間層基準2値出力信号とし、該学習コアー入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の前記スレショルド回路(42)、(45)からの前記多値出力信号を用いて該中間層基準2値出力信号を夫々対応づけ格納し、前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号を元に対応した該中間層基準2値出力信号を検索し読み出す各中間層基準出力格納手段(49)、(50)と、
前記多値出力ニューラルネットワーク手段(43)、(47)の該中間層出力ユニットからの該スレショルド回路(51)、(52)を介して得られた2値出力信号と該中間層基準出力格納手段(49)、(50)から読み出された該中間層基準2値出力信号とのハミング距離を計算し中間層出力距離として夫々前記正誤推定手段(55)、(56)に送出する各中間層距離計算手段(53)、(54)と、
該中間層出力距離と予め設定された出力距離スレショルドとの中間層出力距離比較結果と前記一致検出手段(48)からの前記一致状態検出情報とを用いて、正答或いは誤答推定を行い夫々前記正誤答推定情報を送出する各前記正誤答推定手段(55)、(56)とを少なくとも具備し構成する。
【0025】
第4の手段として、
第2の手段に記載の前記ニューラルネットワーク手段において、前記互いに異なる多値教師信号に対して学習コアー入力データを設け、該学習コアー入力データを少なくとも用いて学習させた各前記学習済みニューラルネットワーク(41)、(44)の中間層ユニットからの該学習コアー入力データに対する出力信号を中間層基準出力信号とし、該学習コアー入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の前記スレショルド回路(42)、(45)からの前記多値出力信号を用いて該中間層基準出力信号を夫々対応づけ格納し、前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号を元に対応した該中間層基準出力信号を検索し読み出す中間層基準出力格納手段(49)、(50)と、前記多値出力ニューラルネットワーク手段(43)、(47)の該中間層出力ユニットからの該出力信号と該中間層基準出力格納手段(49)、(50)から読み出された該中間層基準出力信号との距離を計算し中間層出力距離として、夫々前記正誤推定手段(55)、(56)に送出する各中間層距離計算手段(53)、(54)と、
該中間層出力距離と予め設定された出力距離スレショルドとの中間層出力距離比較結果と前記一致検出手段(48)からの前記一致状態検出情報とを用いて、正答或いは誤答推定を行い夫々前記正誤答推定情報を送出する各前記正誤答推定手段(55)、(56)とを少なくとも具備し構成する。
【0026】
第5の手段として、
第2の手段に記載の該ニューラルネットワーク手段において、前記互いに異なる多値教師信号に対応して学習コアー入力データを設け、該学習コアー入力データを少なくとも用いて学習させた各前記学習済みニューラルネットワーク(41)、(44)の中間層出力ユニットからの該学習コアー入力データに対する出力信号を3以上の多値変換する各スレショルド回路(51)、(52)を設け、得られた多値出力信号を夫々中間層基準多値出力信号とし、該学習コアー入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の前記スレショルド回路(42)、(45)からの前記多値出力信号を用いて該中間層基準多値出力信号を夫々対応づけ格納し、前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号を元に対応した該中間層基準多値出力信号を検索し読み出す中間層基準出力格納手段(49)、(50)と、
前記多値出力ニューラルネットワーク手段(43)、(47)の該中間層出力ユニット からの出力信号を3以上の多値に変換する該スレショルド回路(51)、(52)を介して得られた多値出力信号と該中間層基準出力格納手段(49)、(50)から読み出された該中間層基準多値出力信号とのリー距離を計算し中間層出力距離として夫々前記正誤推定手段(55)、(56)に送出する各中間層距離計算手段(53)、(54)と、
該中間層出力距離と予め設定された出力距離スレショルドとの中間層出力距離比較結果と前記一致検出手段(48)からの前記一致状態検出情報とを用いて、正答或いは誤答推定を行い夫々前記正誤答推定情報を送出する前記正誤答推定手段(55)、(56)とを少なくとも具備し構成する。
第6の手段として、
請求項3、4又は5に記載の前記ニューラルネットワーク手段内の前記正誤答推定手段(55)、(56)に於て、前記中間層出力距離と、前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号が正答となるテスト入力データに対して前記中間層出力距離を前記多値教師信号毎に求め前記中間層出力距離の平均値、或いは更に標準偏差値とを少なくとも用いて予め設定された前記出力距離スレショルドとを比較し、正誤答推定を少なくとも行なう構成とする。
第7の手段として、
第3、4、5、又は6の手段に記載の該ニューラルネットワーク手段に於て、正答な前記多値出力信号を与えるテスト入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の出力層出力ユニットからの出力信号の出力層出力ユニット毎の正答を与える余裕値を求め、該余裕値の最大値と最小値とからなる範囲を示すテスト領域データを得、該テスト領域データを前記多値教師信号と対応させて予め格納し、入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号を元に該テスト領域データを読み出し、該入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の該出力層出力ユニットの出力信号の余裕値と該テスト領域データとを出力層出力ユニット毎に比較し、テスト領域内かテスト領域外かを判定し、テスト領域判定情報として送出するテスト領域判定手段(57)、(58)と、該テスト領域判定情報と前記中間層距離計算手段(53)、(54)からの前記中間層出力距離比較結果と、前記多値出力ニューラルネットワーク(43)、(47)からの多値出力信号を一致比較する前記一致検出手段(48)からの前記一致状態検出情報とを用いて、前記多値出力ニューラルネットワーク手段(43)、(47)からの該多値出力信号の正誤答を推定する前記正誤答推定手段(55)、(56)とを少なくとも具備し構成する。
【0027】
本発明の正誤答判定機能を有したニューラルネットワーク手段は、それぞれ異なった多値教師信号を用いてグローバルミニマムに収束させ学習させた学習済みニューラルネットワークを入力に対して並列に接続し、第1の多値出力ニューラルネットワークからの多値出力信号と教師信号コード逆変換器を持った多値出力ニューラルネットワークからの多値出力信号との一致/不一致検出或いは多数決処理結果と、中間層基準多値出力信号と入力データに対する学習済みニューラルネットワークの中間層出力ユニットからの多値出力信号とのハミング距離或いはリー距離よる比較と、学習済みニューラルネットワークの出力層出力ユニットからの出力信号の余裕に対するテスト領域判定とを元に、これらの2値出力信号の正誤答推定を行ない、更に何れかが正答ならばその2値出力信号を選択することにより、より高い汎化能力と非常に安定した高い精度の正誤答と而も正答判定率の高い2値出力信号を送出することが簡単に実現できる。更に、従来方式のような学習の際の重み係数の初期設定に於ける試行錯誤も不要で、迅速且つ簡単に本発明のニューラルネットワーク手段を設計することも出来る。
【0028】
また、上記説明のごとく本発明の正誤答判定機能を有するニューラルネットワーク手段は、従来方式のニューラルネットワーク手段に比べて非常に高精度且つ安定に正答/誤答を容易に得、而も汎化能力を高くできることから、種々のパターン認識などに於て、未知入力データに対する多値出力信号の正誤答判定情報から、学習済みニューラルネットワークに対する追加学習などの為の誤答の未知入力データ収集が簡単に行う事ができ、それらを追加学習させより高い汎化能力と非常に高精度な正誤答判定機能を持ったニューラルネットワーク手段を簡単に実現出来る。
【0029】
【発明の実施の形態】
以下に本発明のニューラルネットワーク手段の実施例1及び2をあげ、その構成及びその動作について、詳細に説明する。ここでは、2値教師信号を用いた場合を例にあげ説明する。
【0030】
[実施例1]
実施例1としての本発明のニューラルネットワーク手段28を図1に示す。3つの学習済みニューラルネットワークを用いた構成例を示す。学習入力データと第1の2値教師信号とを用いて学習した学習済みニューラルネットワーク29と該ニューラルネットワーク29の出力層出力ユニットの出力信号を2値に変換し2値出力信号を送出するスレショルド回路30とからなる第1の2値出力ニューラルネットワーク手段31と、該第1の教師信号からコード変換して得られた第2の2値教師信号と該学習入力データとを用いて学習した学習済みニューラルネットワーク32と該ニューラルネットワーク32の出力層出力ユニットの出力信号を2値に変換し2値出力信号を送出するスレショルド回路33と該第2の2値教師信号を該第1の2値教師信号へコード逆変換する機能を有し該スレショルド回路33からの2値出力信号を逆変換して新たな2値出力信号を送出する教師信号コード逆変換器34とからなる第2の2値出力ニューラルネットワーク手段35と、該第2の2値ニューラルネットワーク手段35と同一の構成を有し該第1の2値教師信号から変換され他の該2値教師信号と異なる第3の2値教師信号と該学習入力データとを用いて学習した学習済みニューラルネットワーク36と該第3の2値教師信号を該第1の2値教師信号へ逆変換する機能を有した教師信号コード逆変換器38を用いた第3の2値出力ニューラルネットワーク手段39と、該2値出力ニューラルネットワーク手段31、35及び39からの2値出力信号を入力し多数決処理結果を送出する多数決処理器24と、該多数決処理結果を元に該第1、第2及び第3の2値出力信号の何れかを選択し送出し、多数決論理を満たすと正答とし、その他の場合を誤答とする正誤答判定情報を送出する出力選択処理器25から構成される。
【0031】
以下、これらの動作について詳細に説明する。該第1の多値出力ニューラルネットワーク手段31は、図1に示す構成により、端子8の第1の2値教師信号Tと端子2の該学習入力データを用いてバックプロパゲーション法或いは誤差摂動型バックプロパゲーション法(特願平7−77168、特開平8−249304)などにより学習させる。特に、誤差摂動型バックプロパゲーション法を用いた場合には、3層ニューラルネットワークをグローバルミニマム状態に簡単に収束させることができ、而も全て正答の2値出力信号を得ることが出来る。この第1の2値教師信号を用いて学習したニューラルネットワークを該第1の学習済みニューラルネットワーク29として用い、その出力層出力ユニットからの出力信号をスレショルド回路30を介して2値化し第1の2値出力ニューラルネットワーク手段31から送出する。また、図1に示すように端子8の該第1の2値教師信号から教師信号コード変換器13を介して得られた第2の2値教師信号をスイッチ回路9を介して該減算器9に入力し、端子2の学習入力データに対して学習させグローバルミニマム状態に収束させる。この第2の2値教師信号を用いて学習したニューラルネットワークを第2の学習済みニューラルネットワーク32として用いる。
【0032】
該教師信号コード逆変換器34は、該第2の2値教師信号を該第1の2値教師信号に逆変換する機能を有し、該スレショルド回路33の2値出力信号を新たな2値出力信号に変換し第2の2値出力ニューラルネットワーク手段35から送出する。同様に第1の2値教師信号から変換し他の2値教師信号と異なる第3の2値教師信号を得、第3の2値教師信号と該学習入力データとを用いてグローバルミニマム状態に収束させたニューラルネットワークを第3の学習済みニューラルネットワークとして第3の2値出力ニューラルネットワーク手段39に用いる。また、教師信号コード変換器38は、第3の2値教師信号を第1の2値教師信号に逆変換する機能を有し、該スレショルド37からの2値出力信号を新たな2値出力信号に変換し第3の2値出力ニューラルネットワーク手段39から送出する。
【0033】
該教師信号コード変換器13を介して得られる該第2及び3の2値教師信号として、該第1の2値教師信号から、例えば2値コード補数変換や、学習入力データと第1の2値教師信号との対応ずけをシフト変換して得られた新たな2値教師信号を用いる。これらの2値教師信号を用いてグローバルミニマムの状態に学習させた該学習済みニューラルネットワーク29、32及び36は、それぞれ異なったグローバルミニマム状態に収束していることから、学習入力データに対しては、第1の2値出力ニューラルネットワーク手段31からの2値送出信号と他の第2及び第3の2値出力ニューラルネットワーク手段35、39からの2値出力信号とは正答で同一となり、全て一致する。また、テスト入力データに対する汎化能力も殆ど同じであるが、学習の際の2値教師信号がそれぞれ異なることから、正答の領域が一部異なった汎化特性を持ち、入力データに対して必ずしも同一の2値出力信号を送出しない。即ち、安定したほぼ同一の汎化能力と正答となる入力データの領域を簡単にずらすと共に、学習入力データに対しては全て正答の2値出力信号を得ることが出来る。また、これらの第2及び第3の学習済みニューラルネットワーク32、33に於て、その学習時に更に重み係数のそれぞれ異なった初期値設定を行い、汎化能力の差は余りないものの、汎化特性に於ける正答の領域をより異なった範囲にずらしてもよい。
【0034】
多数決処理器24では、該2値出力ニューラルネットワーク手段31、35及び39からの2値出力信号を入力し多数決処理し、2つ以上一致する2値出力信号を検出し多数決処理結果を送出する。出力選択処理器25では、該多数決処理結果を元に該第1、第2及び第3の2値出力信号の何れかを選択し送出し、多数決論理を満たすと正答と判定し、その他の場合を誤答と判定した正誤答判定情報を送出する。
【0035】
上記の説明の如くそれぞれ異なった教師信号を使用した学習によりそれぞれ異なったグローバルミニマム状態に収束させた学習済みニューラルネットワークを用いることにより、入力データに対する高い汎化能力が得られ、而も汎化特性の正答な領域を互いに簡単にずらすことができ、該第1、2及び3の2値出力ニューラルネットワーク手段31、35、39からの2値出力信号を該多数決処理器24に於て多数決処理し何れか2個以上の該2値出力信号が同一ならば正答それ以外を誤答とすることにより高い精度を持った正誤答判定ができる。また、この多数決処理によりニューラルネットワーク手段28の汎化能力も改善される。
【0036】
尚、実施例1では、3つの学習済みニューラルネットワークを用いた例を示したが、更に学習済みニューラルネットワーク、スレショルド回路及び教師信号コード逆変換器からなる新たな1つ以上の2値出力ニューラルネットワーク手段を入力に対し並列に接続し、それらの2値出力信号をそれぞれ該多数決処理器24及び該出力選択処理器25に入力してもよい。これにより、より高い汎化能力と正答判定率の拡大と正誤答判定の精度を改善出来る。
【0037】
[実施例2]
実施例2としての本発明のニューラルネットワーク手段40を図4に示す。2つのニューラルネットワークを用いた構成例を示す。第1の2値教師信号と学習入力データとを用いて学習させた学習済みニューラルネットワーク41と該学習済みニューラルネットワーク41の出力層6の出力ユニットの出力信号を2値変換し2値出力信号を送出するスレショルド回路42とからなる第1の2値出力ニューラルネットワーク手段43と、該第1の2値教師信号をコード変換して得た第2の2値教師信号と該学習入力データとを用いて学習させた学習済みニューラルネットワーク44と該学習済みニューラルネットワーク44の出力層6の出力ユニットの出力信号を2値に変換し2値出力信号を送出するスレショルド回路45と該第2の2値教師信号を該第1の2値教師信号へ逆変換する機能を有し該スレショルド回路45からの2値出力信号を新たな2値出力信号に逆変換し送出する教師信号コード逆変換器46とからなる第2の2値出力ニューラルネットワーク手段47とを入力に対して並列に接続し、該スレショルド回路42、45からの該2値出力信号を用いて予め格納されている中間層基準2値出力信号を検索し送出する中間層基準出力格納器49、50と、入力データに対する該学習済みニューラルネットワーク41、44の中間層5の出力ユニットの出力信号を2値変換してそれぞれの中間層2値出力信号を得るスレショルド回路51、52と、該中間層2値出力信号と該中間層基準2値出力信号との間のハミング距離を求め中間層出力距離として送出するハミング距離計算器53、54と、該学習済みニューラルネットワーク41、44の出力層6の該出力信号の各出力ユニット毎の余裕値をそれぞれ求め、該余裕値と、該第1の2値出力ニューラルネットワーク手段43、47内のスレショルド回路42、45からの該2値出力信号によって読み出された予め格納されたテスト領域データとを比較し該余裕値が該テスト領域内か外かを判定し、テスト領域判定情報として送出するテスト領域判定器57、58と、該第1及び第2の2値出力ニューラルネットワーク手段43、47から送出される該2値出力信号とを比較し一致或いは不一致を検出し一致検出情報として送出する一致検出器48と、該テスト領域判定器57、58及び該ハミング距離計算器53、54、更に該一致検出器48とからそれぞれ入力された該テスト領域判定情報と該中間層出力距離と該一致検出情報とを用いて、該2値出力信号が正答か誤答かを推定し、正誤答推定情報を送出する正誤答推定器55、56と、該正誤答推定情報と該一致検出情報とを元に該第1及び第2の2値出力ニューラルネットワーク手段からの該2値出力信号の何れかを選択しニューラルネットワーク手段40の2値出力信号として送出し、併せて正答か誤答かを判定して正誤答判定情報として送出する出力選択処理器59とから構成される。
【0038】
以下、これらの動作について詳細に説明する。該学習済みニューラルネットワーク41、44は入力層4、中間層5及び出力層6の3層の同一構成であり、該第1及び第2の2値教師信号をそれぞれ用いて異なったグローバルミニマムの状態に簡単に学習させることができる。従って、該第1及び第2の2値出力ニューラルネットワーク手段43、47からの2値送出信号は、学習入力データに対して、それぞれ全て同一の正答の出力となり、一致する。また、これら学習済みニューラルネットワーク41、44は学習アルゴリズムとニューラルネットワークの構造が同一であることから殆ど同様な高い汎化能力が得られる。
【0039】
また、異なる教師信号を用いて学習させた学習済みニューラルネットワーク41、44の汎化能力が高いことから汎化特性の正答な領域は広く而もずれており、未知入力データに対して該2値出力ニューラルネットワーク手段43、47からの両2値出力信号は幅広く同一となるが、ずれている領域では同一とはならず、何れかが誤答となる。
【0040】
ここで、学習済みニューラルネットワーク41、44の重み係数としては、同一或いはそれぞれ異なった重み係数初期値を設定して学習させたものを用いても良い。それぞれ異なった重み係数の初期値設定を行うと、汎化能力の変化は殆どないが、汎化特性はよりずれた正答の領域を持つ。
【0041】
該学習済みニューラルネットワーク41及び44に対して、端子2を介して入力データが並列に入力され、学習済みの重み係数を用いて実行処理が行われる。該一致検出器48に於て該2値出力ニューラルネットワーク手段43及び47からの2値出力信号が一致した場合には、共に正答の場合が殆どである。しかしながら、該スレショルド回路42、45からの2値出力信号が同じような誤りを発生している場合があり、誤答ではあるがお互いに一致する場合も発生率は非常に低いが発生する。この為、以下の推定処理を行っている。
【0042】
従来技術では、多数決処理或いは一致検出処理に於て、多数決論理或いは一致論理を満足すれば、正答、満足しなければ誤答と単純に判定している為に、正誤答の判定の精度が低い。
【0043】
これに対して実施例2では、正誤答推定器55、56に於て、それぞれ接続されているテスト領域判定器57、58からのテスト領域判定情報とハミング距離計算器53、54からの中間層出力距離と一致検出器48からの一致検出情報とから、該2値出力ニューラルネットワーク手段43、47からのそれぞれの該2値出力信号の正答/誤答を推定し、2値出力選択処理器59に正誤答推定情報としてそれぞれを送出する。ここでは、一致検出情報を元に、一致検出の場合と不一致検出の場合とに分けて、それぞれ中間層出力距離と予め定められた出力距離スレショルドとの比較とテスト領域判定情報とにより、正答或いは誤答の推定を行っている。例えば、両該2値出力信号が一致した場合、テスト領域外で且つ中間層出力距離が該出力距離スレショルドより大きいと誤答と推定する。また、その他の状態を正答と推定する。一方、両該2値出力信号が不一致の場合、テスト領域判定に無関係に中間層出力距離が該出力距離スレショルド以上であると、誤答と推定し、それ以外であると正答と推定する。
【0044】
該出力選択処理器59では、該正誤答推定情報と該一致検出情報とを用いて、該第1及び2の2値出力ニューラルネットワーク手段43、47からの両該2値出力信号が共に正答推定ならば正答と判定し、第1の2値出力ニューラルネットワーク手段43からの2値出力信号を送出すると共に正誤答情報として正答を送出する。何れか一方が正答推定ならば、正答推定である2値出力ニューラルネットワーク手段からの該2値出力信号を送出すると共に正誤答情報として正答を送出する。また、何れも誤答ならば、第1の2値出力ニューラルネットワーク手段43からの該2値出力信号を送出するとともに誤答を正誤答情報として送出する。以上の正誤答推定と論理和処理を行う正誤答判定とにより、正誤答の非常に高い判定精度と非常に高い正答判定率とを実現している。例えば、シミュレーションによると判定精度は99%以上で、判定率は95%程度を実現している。
【0045】
ここで、ニューラルネットワークを学習させ学習済みニューラルネットワーク41、44を得る際に、学習入力データと2値教師信号との対応づけに於て、2値教師信号毎に代表的な特徴を示している入力データや発生頻度の高い入力データを学習コアー入力データとする学習入力データを少なくとも準備し、該学習コアー入力データに対する2値出力信号が正答となるよう学習させた該学習済みニューラルネットワーク41及び44を用いる。ここで、学習が終了した際に、該学習コアー入力データに対する該学習済みニューラルネットワーク41及び44の中間層5の出力ユニットからの出力信号を該スレショルド回路51、52を介してそれぞれ2値出力信号に変換して、これらをそれぞれの中間層基準出力格納器49及び50に中間層基準2値出力信号として予め格納しておく。この時、第1及び第2の2値出力ニューラルネットワーク手段43、47の夫々の該スレショルド回路42及び45からの各2値出力信号、即ち2値教師信号に対応づけてそれぞれ格納する。
【0046】
入力データが入力された際には、該中間層基準出力格納器49、50では、該2値出力ニューラルネットワーク手段43、47からの該2値出力信号に対応した該中間層基準2値出力信号を読み出し、該ハミング距離計算器53、54へそれぞれ送出する。該ハミング距離計算器53では、該中間層基準2値出力信号と該中間層5の出力ユニットの出力信号から該スレショルド回路51、52を介して得られた2値出力信号とのハミング距離を測り、該正誤答推定器55、56へそれぞれ中間層出力距離として送出し、正誤答推定の尺度として用いる。一般に、正答の場合は、このハミング距離は小さく、誤答の場合はこの距離が大きい傾向にある。ここで、3以上の多値の場合には、該ハミング距離計算器53、54の代わりにリー距離計算器を用いればよい。
【0047】
次に、該テスト領域データとしては、該学習済みニューラルネットワーク41、44のテスト入力データに対する汎化能力を評価する際に、該スレショルド回路42、45が正答の2値出力信号を送出するテスト入力データ間で、該学習済みニューラルネットワーク41、44の出力層6の出力ユニットからの出力信号の出力ユニット毎の余裕値(即ち、該スレショルド回路42、45の2値化スレショルド値との差の絶対値)の最小値と最大値とを求め、該テスト領域判定データとし、該2値教師信号である2値出力信号に対応させてテスト領域判定器57、58にそれぞれ予め格納する。
【0048】
テスト領域判定器57、58では、第1及び第2の2値出力ニューラルネットワーク手段43、47の、夫々の入力データに対する該スレショルド回路42、45からの2値出力信号を用いて該テスト領域データを読み出し、この時の該出力層6の出力ユニットからの出力信号の該余裕値が全ての出力ユニット毎のそれぞれの該最大値と該最小値間の範囲に収まればテスト領域内、それ以外の状態をテスト領域外と判定し、テスト領域判定情報を送出する。ここで、入力データに対する出力層6の出力ユニットからの出力信号がテスト領域外であると判定されると、この入力データは未知入力データと判定しても良い。また、テスト領域判定データとして、出力ユニット毎の余裕値の最大及び最小値を用いているが、全出力ユニット間での余裕値の最大及び最小値を用いて判定しても良い。
【0049】
ここでは、正しい所望の2値出力信号を送出するテスト入力データだけから上記のテスト領域判定データを求めればよいが、準備されている全てのテスト入力データを元にテスト領域判定データを求める場合には、学習入力データを用いてニューラルネットワークを学習を終了させた後、更に誤った2値出力信号を送出するテスト入力データを学習入力データとして追加学習し、この追加学習を繰り返すことにより、最終的にテスト入力データに対して全て正しい2値出力信号を送出するよう学習させることができる。このような追加学習を行った後、その重み係数を用いて学習済みニューラルネットワーク手段43、47に設定し、これらのテスト入力データに対してテスト領域判定データを収集してもよい。
【0050】
実施例2に於ては、ハミング距離計算器53、54を用い、学習コアー入力データに対応した学習済みニューラルネットワーク41及び44の中間層出力ユニットのそれれぞれの出力信号を該スレショルド回路51、52を介して2値出力信号を得、それぞれ中間層基準2値出力信号としたが、該スレショルド回路51、52を介さず中間層出力ユニットのそれぞれの出力信号をそのまま中間層基準出力信号として該中間層基準出力格納器49、50に予め格納し、これらを該スレショルド回路43、45からの2値出力信号を元にそれぞれ読み出し、入力データに対応した中間層出力ユニットの出力信号との出力ユニット毎の差の絶対値を全出力ユニットに渡り加算して中間層出力距離として用いても良い。
【0051】
また、正誤答推定器55,56において、中間層出力距離と比較する出力距離スレショルドは、2値教師信号に対応した2値出力信号毎に異なる値を設定してもよい。或いは、正答同一の2値出力信号で2値教師信号となる種々のテスト入力データに対して、中間層出力距離を求め、この平均値或いは更に標準偏差とを用いて該距離比較スレショルドを設定しても良い。尚、実施例2では、中間層基準出力格納器49、50とハミング距離計算器53をそれぞれ分けて説明したが、これらを一緒にして中間層基準2値出力信号を格納したハミング距離計算処理器として構成してもよい。
【0052】
コード変換された第1以外の教師信号としては、該教師信号逆変換器46によって第1の教師信号へ逆変換することができる如何なる教師信号でもよい。例えば、第1の2値教師信号の2値補数からなる2値教師信号や、入力データと第1の2値教師信号との対応関係をシフトした2値教師信号を用いてもよい。または、第1の2値教師信号とは異なる第2の2値教師信号をランダムに発生させ、その対応関係を該教師信号コード逆変換器47に設定してもよい。
【0053】
本実施例のニューラルネットワーク手段40において、上記説明のごとく異なった教師信号に対して学習済みの2つの該2値出力ニューラルネットワーク手段43、47を用いているが、ここで、これらの2値出力ニューラルネットワーク手段43、47の他に、他とは異なった2値教師信号による学習済みのニューラルネットワークを用い、第2の2値出力ニューラルネットワーク手段と同様の構成をもった新たな2値出力ニューラルネットワーク手段を奇数個用意し入力データに対して並列接続し、増設された個々の該2値出力ニューラルネットワーク手段には、該2値出力ニューラルネットワーク手段47と同様にスレショルド回路52、ハミング距離計算器54、中間層基準出力格納器50、テスト領域判定器58及び正誤答推定器56とそれぞれ同一なものを接続し、更に、該一致検出器48を多数決処理器に置き換え構成し、並列度を増やしてもよい。
【0054】
ここで、全ての2値出力ニューラルネットワーク手段からの2値出力信号を多数決論理により処理し、あるスレショルド以上2値出力信号が互いに一致しておれば、一致検出、それ以下ならば不一致検出とする。これにより、ニューラルネットワーク手段の汎化能力をより一層改善でき、正誤答判定能力や精度も著しく改善される。
【0055】
尚、実施例1及び2に於て、2値教師信号と2値化する為のスレショルド回路を用いた2値の場合についてそれぞれ実施例を示した。ここでは、学習済みニューラルネットワーク29、32、36、41、44としてそれぞれ異なる2値教師信号を用いて学習させたものを用いたが、これらに対してそれぞれ異なる3値以上の多値教師信号を用いて学習させたものを用い、2値化するスレショルド回路30、33、37、42及び45に対してそれぞれ多値スレショルド回路を、また、学習コアー入力データに対して得られる中間層基準2値出力信号に代わり、多値教師信号による学習済みニューラルネットワークを用いて学習コアー入力データに対する中間層基準多値出力信号を得、これを該中間層基準出力格納器49、50に予め格納し、ハミング距離計算器53、54の代わりに多値出力信号間の距離を測るリー距離計算器を用いることにより、正誤答判定情報と多値出力信号とを送出する多値ニューラルネットワーク手段を構成することも出来る。
【0056】
入力データを入力してニューラルネットワーク手段40を動作させた際、端子26から誤答判定された2値出力信号が得られた場合には、これに対応した入力データを学習入力データとして該学習済みニューラルネットワークの重み係数を初期値として追加学習して、新たな重み係数を得、該学習済みニューラルネットワーク手段43、47に設定し、該ニューラルネットワーク手段40を動作させてもよい。この一連の処理を繰り返すことにより汎化能力や汎化特性の改善が図れ、より高い正答判定率とより高い判定精度を得ることが出来る。尚、この追加学習を行った際には、学習入力データを初めとする学習条件が変わると、該学習済みニューラルネットワーク41、44の重み係数が変化することから、これらのテスト領域判定データや中間層基準2値出力信号をその都度求めなおし、中間層基準出力格納器49、50及びテスト領域判定器57、58に予めそれぞれ格納する。
【0057】
学習方法として、バックプロパゲーション法を前提に説明したが、教師信号を用いた学習ならいずれの学習法でもよい。また、上記の実施例に於て、学習済みニューラルネットワークとしてローカルミニマム状態に収束させたものを用いてもよいが、汎化能力及び汎化特性ともグローバルミニマム状態で収束した場合より劣化することから、汎化能力及び正誤答判定に於ける判定精度も劣化する。
【0058】
以上説明したように、従来方式では、汎化特性の正答の領域をずらす為に、数多くのニューラルネットワークを必要とし、而も学習の際に種々の異なる重み係数の初期値設定を行ない異なったローカルミニマムに収束させる試行錯誤が必要であり、その作業量が膨大である。汎化能力が低く正答の2値出力信号を送出する入力データ領域も狭く、また、正誤答判定の精度も低い。
【0059】
一方、本発明の如く並列接続して用いられる学習済みニューラルネットワークは、それぞれ異なる2値教師信号を用いて学習しており、而もグローバルミニマムに収束していることから、汎化能力も非常に高く安定であり、汎化特性に於ける正答な2値出力信号を送出する領域も広く而も簡単にずらすことができる。従って、少ない数のニューラルネットワークでよく而も学習が簡単で且つ試行錯誤が不要である。また、それらネットワークの汎化能力及び汎化特性とも高性能で非常に安定していることから、容易に高い正答判定率と精度の高い正誤答推定や判定が実現出来る。
【0060】
【発明の効果】
以上述べたように、従来方式に於ける異なった重み係数の初期値に対してローカルミニマムに収束した複数個の学習済みニューラルネットワークを入力データに対して並列接続し、入力データに対する2値出力信号の単なる多数決処理や一致検出などによる正答/不明或いは誤答判定を行っており、汎化能力や正誤答の判定精度や2値出力信号の正答率などが低い。
【0061】
一方、本発明の正誤答判定機能を有したニューラルネットワーク手段は、それぞれ異なった多値教師信号を用いてグローバルミニマムに収束させ学習させた学習済みニューラルネットワークを入力に対して並列に接続し、2値出力信号間の一致/不一致を検出すると共に、中間層基準多値出力信号と入力データに対する中間層出力ユニットからの多値出力信号とのハミング距離或いはリー距離に於ける比較と、出力層出力ユニットからの出力信号の余裕値のテスト領域判定とを元にこれらの2値出力信号の正誤答推定を行ない、更に正答の2値出力信号の論理和による選択をすることにより、より高い汎化能力と非常に安定した高い精度の正誤答と大きい正答判定率の元に2値出力信号を送出することが簡単に実現できる。また、大きい正答判定率と高い正答精度が容易に得られることから、並列ニューラルネットワークに於て、数多くのニューラルネットワークを用いる必要がなく、構成が簡単になる。
【0062】
これらの結果から、本発明の正誤判定機能を有するニューラルネットワーク手段をパターン認識等に実用した際、未知入力データの多値出力信号に対して正誤答判定が得られ、而もその正答/誤答の精度が非常に高いことから、誤答と判定された未知入力データに対しては、正しい多値教師信号の対応ずけを行ない、並列接続されるそれぞれの学習済みニューラルネットワークの重み係数を追加学習させた重み係数で置き換えることにより、多値出力ニューラルネットワーク手段の汎化能力と正答判定能力を次第に向上させることが簡単に出来る。
【0063】
従って、パターン認識処理などに用いる際に、詳細な学習入力データを事前に取得した後に、ニューラルネットワークを学習させて使用する必要は必ずしもなく、少なくとも非常に特徴のある学習入力データを学習コアー入力データとしてまず学習させ、現実の使用環境の元で、高い汎化能力と精度の高い正誤答判定能力を利用して、而も誤答の2値出力信号を送出する未知入力データ収集を迅速に行ない、これらを追加学習させることにより、正誤答判定機能を有するニューラルネットワーク手段の正答判定能力と汎化能力を同時に著しく高めることが出来き、実用環境に適したパターン認識率の非常に高い高性能なニューラルネットワーク手段を簡単に実現出来る。
【0064】
上述のように本発明の正誤答判定機能を有するニューラルネットワーク手段は、従来方式に比べて、少ない数の学習済みニューラルネットワークを並列接続し使用しても非常に高い性能が簡単に得られ、構成が簡単になる利点を持つ。また、異なった多値教師信号を用いてグローバルミニマムに収束させたニューラルネットワークを用いることから、試行錯誤を必要とせず、学習処理が大幅に少ない。
【0065】
従って、従来技術では実現が困難な大規模ニューラルネットワークに対しても本発明のニューラルネットワークを用いて短時間で設計し実現することが出来、非常に高性能な正誤答判定能力や高い汎化能力が要求される人工知能システムや検索システム、画像処理システムさらにはネットワーク障害情報などを処理する通信処理システムなどへの幅広い応用ができるなど、非常に幅広い効果を有している。
【図面の簡単な説明】
【図1】 実施例1における本発明の正誤答判定機能を有したニューラルネットワーク手段の一構成例である。
【図2】 従来方式における3層ニューラルネットワークの学習処理の一構成例である。
【図3】 従来方式による出力状態情報出力機能を有したニューラルネットワーク網の一構成例である。
【図4】 実施例2における本発明の正誤答判定機能を有したニューラルネットワーク手段の一構成例である。
【符号の説明】
1 3層ニューラルネットワーク
2 入力信号入力端子
入力ユニット端子
入力ユニット端子
入力ユニット端子
3 2値出力端子
2値出力ユニット端子
2値出力ユニット端子
2値出力ユニット端子
4 入力層
入力層ユニット
入力層ユニット
入力層ユニット
5 中間層
中間層出力ユニット
中間層出力ユニット
6 出力層
出力層出力ユニット
出力層出力ユニット
出力層出力ユニット
7 重み係数制御器
8 2値教師信号入力端子
2値教師信号入力ユニット端子
2値教師信号入力ユニット端子
2値教師信号入力ユニット端子
9 スイッチ回路
10 減算器
10 減算器
10 減算器
10 減算器
11 重み係数入出力端子
12 スレショルド回路
12 スレショルド回路
12 スレショルド回路
12 スレショルド回路
13 教師信号コード変換器
14 従来技術によるニューラルネットワーク手段
15 第1の学習済みニューラルネットワーク
16 スレショルド回路
17 第1の2値出力ニューラルネットワーク手段
18 第2の学習済みニューラルネットワーク
19 スレショルド回路
20 第2の2値出力ニューラルネットワーク手段
21 第3の学習済みニューラルネットワーク
22 スレショルド回路
23 第3の2値出力ニューラルネットワーク手段
24 多数決処理器
25 出力選択処理器
26 2値出力信号端子
27 正誤答出力端子
28 本発明の第1の実施例におけるニューラルネットワーク手段
29 第1の学習済みニューラルネットワーク
30 スレショルド回路
31 第1の2値出力ニューラルネットワーク手段
32 第2の学習済みニューラルネットワーク
33 スレショルド回路
34 教師信号コード逆変換器
35 第2の2値出力ニューラルネットワーク手段
36 第3の学習済みニューラルネットワーク
37 スレショルド回路
38 教師信号コード逆変換器
39 第の2値出力ニューラルネットワーク手段
40 本発明の第2の実施例におけるニューラルネットワーク手段
41 第1の学習済みニューラルネットワーク
42 スレショルド回路
43 第1の2値出力ニューラルネットワーク手段
44 第2の学習済みニューラルネットワーク
45 スレショルド回路
46 教師信号コード逆変換器
47 第2の2値出力ニューラルネットワーク手段
48 一致検出器
49 中間層基準出力格納器
50 中間層基準出力格納器
51 スレショルド回路
52 スレショルド回路
53 ハミング距離計算器
54 ハミング距離計算器
55 正誤答推定器
56 正誤答推定器
57 テスト領域判定器
58 テスト領域判定器
59 出力選択処理器

Claims (7)

  1. 学習入力データと第1の多値教師信号とを用いて学習した学習済みニューラルネットワーク(29)と該ニューラルネットワークの出力層出力ユニットの出力信号を多値変換し多値出力信号を送出する多値スレショルド手段(30)とからなる第1の多値出力ニューラルネットワーク手段(31)と、
    該第1の多値教師信号を変換し得られた第2の多値教師信号と該学習入力データとを用いて学習した学習済みニューラルネットワーク(32)と該ニューラルネットワークの出力層出力ユニットの出力信号を多値変換し多値出力信号を送出する多値スレショルド手段(33)と該第2の多値教師信号から該第1の多値教師信号への逆変換機能を有し入力された該多値スレショルド手段(33)からの該多値出力信号を逆変換し新たな多値出力信号を送出する教師信号コード逆変換手段(34)とからなる第2の多値出力ニューラルネットワーク手段(35)とを、入力に対して並列接続し、
    更に、少なくとも前記第2の多値出力ニューラルネットワーク手段(35)と同一の構成を有し該入力に対して並列接続された少なくとも一個以上の新たな多値出力ニューラルネットワーク手段(39)を設け、他の前記多値教師信号とは異なり該第1の多値教師信号から変換して得られた多値教師信号と該学習入力データとを用いて学習させた学習済みニューラルネットワーク(36)を用い、該多値出力ニューラルネットワーク手段(39)内の教師信号コード逆変換手段(38)に於て学習に用いた該多値教師信号を前記第1の多値教師信号に逆変換させる機能を用い逆変換された多値出力信号を送出させ、並列接続された前記第1及び第2の多値出力ニューラルネットワーク手段(31)、(35)と少なくとも一個以上の新たな該多値出力ニューラルネットワーク手段(39)とからの該多値出力信号間の一致状態を検出する多数決処理手段(24)と、
    該多数決処理手段(24)からの該一致状態を用いて、該第1及び該第2の多値出力ニューラルネットワーク手段(31)、(35)と少なくとも一個以上の新たな該多値出力ニューラルネットワーク手段(39)とからの該多値出力信号の正誤答判定を行ない、
    該多値出力信号の何れかを選択し送出すると共に選択送出された該多値出力信号の正誤答判定情報を送出する出力選択処理手段(25)とを少なくとも具備し構成することを特徴とするニューラルネットワーク手段(28)
  2. 学習入力データと第1の多値教師信号とを用いて学習した学習済みニューラルネットワーク(41)と該ニューラルネットワークの出力層出力ユニットの出力信号を多値変換し多値出力信号を送出する多値スレショルド手段(42)とからなる第1の多値出力ニューラルネットワーク手段(43)と、
    該第1の多値教師信号を変換し得られた、他とは異なる新たな多値教師信号と該学習入力データとを用いて学習した学習済みニューラルネットワーク(44)と該ニューラルネットワークの出力層出力ユニットの出力信号を多値変換し多値出力信号を送出する多値スレショルド手段(45)と該多値教師信号から該第1の多値教師信号への逆変換機能を有し、入力された該多値スレショルド手段(45)からの該多値出力信号を逆変換し得られた多値出力信号を送出する教師信号コード逆変換手段(46)とからなる、少なくとも1個以上の第2の多値出力ニューラルネットワーク手段(47)とを、入力に対して並列接続し、
    該第1及び該第2の多値出力ニューラルネットワーク手段(43)、(47)とからの各該多値出力信号を比較し一致状態検出情報を送出する一致検出手段(48)と、
    各該多値出力ニューラルネットワーク手段(43)、(47)からの各該多値出力信号の正誤答推定を夫々行なう正誤答推定手段(55)、(56)と、
    各該正誤答推定手段(55)、(56)からの正誤答推定情報を用いて、該第1及び該第2の多値出力ニューラルネットワーク手段(43)、(47)からの該多値出力信号の正誤答判定を行ない、
    該多値出力信号の何れかを選択し送出すると共に選択送出された該多値出力信号の正誤 答判定情報を送出する出力選択処理手段(59)とを少なくとも具備し構成することを特徴とするニューラルネットワーク手段(40)。
  3. 請求項2に記載の前記ニューラルネットワーク手段において、前記互いに異なる多値教師信号に対して学習コアー入力データを設け、該学習コアー入力データを少なくとも用いて学習させた各前記学習済みニューラルネットワーク(41)、(44)の中間層出力ユニットからの該学習コアー入力データに対する出力信号を2値変換する各スレショルド回路(51)、(52)を設け、得られた2値出力信号を夫々中間層基準2値出力信号とし、該学習コアー入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の前記スレショルド回路(42)、(45)からの前記多値出力信号を用いて該中間層基準2値出力信号を夫々対応づけ格納し、前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号を元に対応した該中間層基準2値出力信号を検索し読み出す各中間層基準出力格納手段(49)、(50)と、
    前記多値出力ニューラルネットワーク手段(43)、(47)の該中間層出力ユニットからの該スレショルド回路(51)、(52)を介して得られた2値出力信号と該中間層基準出力格納手段(49)、(50)から読み出された該中間層基準2値出力信号とのハミング距離を計算し中間層出力距離として夫々前記正誤推定手段(55)、(56)に送出する各中間層距離計算手段(53)、(54)と、
    該中間層出力距離と予め設定された出力距離スレショルドとの中間層出力距離比較結果と前記一致検出手段(48)からの前記一致状態検出情報とを用いて、正答或いは誤答推定を行い夫々前記正誤答推定情報を送出する各前記正誤答推定手段(55)、(56)とを少なくとも具備し構成することを特徴としたニューラルネットワーク手段。
  4. 請求項2に記載の前記ニューラルネットワーク手段において、前記互いに異なる多値教師信号に対して学習コアー入力データを設け、該学習コアー入力データを少なくとも用いて学習させた各前記学習済みニューラルネットワーク(41)、(44)の中間層ユニットからの該学習コアー入力データに対する出力信号を中間層基準出力信号とし、該学習コアー入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の前記スレショルド回路(42)、(45)からの前記多値出力信号を用いて該中間層基準出力信号を夫々対応づけ格納し、前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号を元に対応した該中間層基準出力信号を検索し読み出す中間層基準出力格納手段(49)、(50)と、前記多値出力ニューラルネットワーク手段(43)、(47)の該中間層出力ユニットからの該出力信号と該中間層基準出力格納手段(49)、(50)から読み出された該中間層基準出力信号との距離を計算し中間層出力距離として、夫々前記正誤推定手段(55)、(56)に送出する各中間層距離計算手段(53)、(54)と、
    該中間層出力距離と予め設定された出力距離スレショルドとの中間層出力距離比較結果と前記一致検出手段(48)からの前記一致状態検出情報とを用いて、正答或いは誤答推定を行い夫々前記正誤答推定情報を送出する各前記正誤答推定手段(55)、(56)とを少なくとも具備し構成することを特徴としたニューラルネットワーク手段。
  5. 請求項2に記載の該ニューラルネットワーク手段において、前記互いに異なる多値教師信号に対応して学習コアー入力データを設け、該学習コアー入力データを少なくとも用いて学習させた各前記学習済みニューラルネットワーク(41)、(44)の中間層出力ユニットからの該学習コアー入力データに対する出力信号を3以上の多値変換する各スレショルド回路(51)、(52)を設け、得られた多値出力信号を夫々中間層基準多値出力信号とし、該学習コアー入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の前記スレショルド回路(42)、(45)からの前記多値出力信号を用いて該中間層基準多値出力信号を夫々対応づけ格納し、前記多値出力ニューラルネットワーク手段(43)、(47)から前記多値出力信号を元に対応した該中間層基準多値出力信号を検索し読み出す中間層基準出力格納手段(49)、(50)と、
    前記多値出力ニューラルネットワーク手段(43)、(47)の該中間層出力ユニットからの出力信号を3以上の多値に変換する該スレショルド回路(51)、(52)を介して得られた多値出力信号と該中間層基準出力格納手段(49)、(50)から読み出された該中間層基準多値出力信号とのリー距離を計算し中間層出力距離として夫々前記正誤推定手段(55)、(56)に送出する中間層距離計算手段(53)、(54)と、
    該中間層出力距離と予め設定された出力距離スレショルドとの中間層出力距離比較結果と前記一致検出手段(48)からの前記一致状態検出情報とを用いて、正答或いは誤答推定を行い夫々前記正誤答推定情報を送出する前記正誤答推定手段(55)、(56)とを少なくとも具備し構成することを特徴としたニューラルネットワーク手段。
  6. 請求項3、4又は5に記載の前記ニューラルネットワーク手段内の前記正誤答推定手段(55)、(56)に於て、前記中間層出力距離と、前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号が正答となるテスト入力データに対して前記中間層出力距離を前記多値教師信号毎に求め、前記中間層出力距離の平均値、或いは更に標準偏差値とを少なくとも用いて予め設定された前記出力距離スレショルドとを比較し、正誤答推定を少なくとも行なうことを特徴としたニューラルネットワーク手段。
  7. 請求項3、4、5、又は6に記載の該ニューラルネットワーク手段に於て、正答な前記多値出力信号を与えるテスト入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の出力層出力ユニットからの出力信号の出力層出力ユニット毎の正答を与える余裕値を求め、該余裕値の最大値と最小値とからなる範囲を示すテスト領域データを得、該テスト領域データを前記多値教師信号と対応させて予め格納し、入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)からの前記多値出力信号を元に該テスト領域データを読み出し、該入力データに対する前記多値出力ニューラルネットワーク手段(43)、(47)内の該出力層出力ユニットの出力信号の余裕値と該テスト領域データとを出力層出力ユニット毎に比較し、テスト領域内かテスト領域外かを判定し、テスト領域判定情報として送出するテスト領域判定手段(57)、(58)と、
    該テスト領域判定情報と、前記中間層距離計算手段(53)、(54)からの前記中間層出力距離比較結果と、前記多値出力ニューラルネットワーク(43)、(47)からの多値出力信号を一致比較する前記一致検出手段(48)からの前記一致状態検出情報とを用いて、前記多値出力ニューラルネットワーク手段(43)、(47)からの該多値出力信号の正誤答を推定する前記正誤答推定手段(55)、(56)とを少なくとも具備し構成することを特徴としたニューラルネットワーク手段。
JP22919299A 1999-08-13 1999-08-13 正誤答判定機能を有するニューラルネットワーク手段 Expired - Fee Related JP3675246B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22919299A JP3675246B2 (ja) 1999-08-13 1999-08-13 正誤答判定機能を有するニューラルネットワーク手段

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22919299A JP3675246B2 (ja) 1999-08-13 1999-08-13 正誤答判定機能を有するニューラルネットワーク手段

Publications (2)

Publication Number Publication Date
JP2001051969A JP2001051969A (ja) 2001-02-23
JP3675246B2 true JP3675246B2 (ja) 2005-07-27

Family

ID=16888258

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22919299A Expired - Fee Related JP3675246B2 (ja) 1999-08-13 1999-08-13 正誤答判定機能を有するニューラルネットワーク手段

Country Status (1)

Country Link
JP (1) JP3675246B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308517A (zh) * 2018-09-07 2019-02-05 中国科学院计算技术研究所 面向二值神经网络的二值化装置、方法及应用

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3545743B2 (ja) 2001-12-13 2004-07-21 株式会社東芝 特徴抽出システム及び半導体集積回路装置
WO2008096582A1 (ja) * 2007-02-06 2008-08-14 Nec Corporation 認識器重み学習装置および音声認識装置、ならびに、システム
CN106781790B (zh) * 2016-12-10 2022-10-21 杭州博世数据网络有限公司 一种带有自纠正功能的在线学习系统
EP3474192A1 (en) * 2017-10-19 2019-04-24 Koninklijke Philips N.V. Classifying data
DE102018214921A1 (de) 2018-09-03 2020-03-05 Deutsches Zentrum für Luft- und Raumfahrt e.V. Anordnung und Verfahren zur Steuerung einer Vorrichtung
JP7321690B2 (ja) * 2018-09-26 2023-08-07 キヤノンメディカルシステムズ株式会社 検証システム及び検証装置
JP7215131B2 (ja) * 2018-12-12 2023-01-31 株式会社オートネットワーク技術研究所 判定装置、判定プログラム、判定方法及びニューラルネットワークモデルの生成方法
JP7269013B2 (ja) * 2019-01-09 2023-05-08 川崎重工業株式会社 誤認識を抑制可能な画像認識システムおよび画像認識方法
JP2020187409A (ja) 2019-05-10 2020-11-19 ソニーセミコンダクタソリューションズ株式会社 画像認識装置、固体撮像装置、および画像認識方法
AU2020468806B2 (en) * 2020-09-18 2024-02-29 Nippon Telegraph And Telephone Corporation Learning device, learning method, and learning program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109308517A (zh) * 2018-09-07 2019-02-05 中国科学院计算技术研究所 面向二值神经网络的二值化装置、方法及应用

Also Published As

Publication number Publication date
JP2001051969A (ja) 2001-02-23

Similar Documents

Publication Publication Date Title
JP3675246B2 (ja) 正誤答判定機能を有するニューラルネットワーク手段
Sudheer et al. Radial basis function neural network for modeling rating curves
Mao et al. Algorithms for minimal model structure detection in nonlinear dynamic system identification
US6601053B1 (en) Optimized artificial neural networks
US5151969A (en) Self-repairing trellis networks
EP0975125B1 (en) Sequence estimation method and sequence estimator
JP3328935B2 (ja) 並列多値ニューラルネットワーク
Xu et al. Removal of salt and pepper noise in corrupted image based on multilevel weighted graphs and IGOWA operator
JP3855665B2 (ja) 出力状態判定機能を有する並列ニューラルネットワーク処理システム
JP3891124B2 (ja) 正誤答判定機能を有する並列ニューラルネットワーク手段
JP3855582B2 (ja) 出力状態判定機能を有する並列ニューラルネットワーク処理システム
JP3855580B2 (ja) 並列ニューラルネットワーク装置
JP3757722B2 (ja) 多層ニューラルネットワークユニット数最適化方法及び装置
CN116633758A (zh) 基于全异构元对比学习模型的网络故障预测方法及系统
JP3277648B2 (ja) 並列ニューラルネットワーク
US20080267220A1 (en) Method of Iterative Signal Processing For Cdma Interference Cancellation and Ising Perceptrons
Koldaev et al. Neural Network Decoder of Automatic Process Control System
CN112861115A (zh) 基于区块链安全认证的加密策略调用方法及云认证服务器
JP3678071B2 (ja) ニューラルネットワーク入力判別装置
JP3329202B2 (ja) ニューラルネットワーク学習方式
Yao Learning of decision regions based on the genetic algorithm
JP4687199B2 (ja) 連想記憶装置とそのソフトウェア
JP4696529B2 (ja) 多層ニューラルネットワーク装置とそのソフトウェア
JPH05307535A (ja) 学習型波形認識処理装置
Billings et al. Qualitative validation of radial basis function networks

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050425

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090513

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090513

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110513

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees