JPH0581226A

JPH0581226A - 神経回路網学習法およびそれを用いた装置

Info

Publication number: JPH0581226A
Application number: JP3239955A
Authority: JP
Inventors: Hiroshi Kamata; 洋鎌田
Original assignee: A T R SHICHIYOUKAKU KIKO KENKYUSHO KK; ATR AUDITORY VISUAL PERCEPTION
Current assignee: A T R SHICHIYOUKAKU KIKO KENKYUSHO KK; ATR AUDITORY VISUAL PERCEPTION
Priority date: 1991-09-19
Filing date: 1991-09-19
Publication date: 1993-04-02
Anticipated expiration: 2010-12-20
Also published as: JPH07120349B2

Abstract

(57)【要約】【目的】この発明は任意のパターン集合に対して最適
解が得られる神経回路網学習法およびそれを用いた装置
を提供することを主要な特徴とする。【構成】この発明はデータを入力する第１層と、この
第１層に接続される複数の第２層と、第２層に接続され
認識結果を出力する第３層とから構成される階層型の神
経回路網を用いて、学習すべき辞書データの特徴を学習
し、神経回路網の第３層よりの学習すべき辞書の認識デ
ータをカテゴリ毎に求め、認識率が所定の値以下のカテ
ゴリに対して、そのカテゴリに対応する第３層のニュー
ロンを随時追加し、再学習させることにより、認識率が
高い神経回路網を実現する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は神経回路網学習法およ
びそれを用いた装置に関する。より特定的には、この発
明は画像や音声などのデータを認識するのに好適な神経
回路網学習法およびそれを用いた装置に関する。

【０００２】

【従来の技術】神経回路網モデルは、生体の脳神経系の
働きを真似た情報処理システムであり、その代表的なも
のとして、第４図に示すものがある。神経回路網モデル
は、第４図に示すように、○印で示す情報処理ユニット
（ニューロン）が階層的構造をなし、ニューロンが層間
のみに接続されたラメルハート型のモデルである。

【０００３】簡単のため、３層のモデルの動作原理を説
明すると、まず入力信号ｘ_iが入力層ａ_iに与えられ、
それが層間結合値ｗ_ijにより重みづけされて中間層ｂ_j
に与えられた後、中間層ｂのニューロンで以下の処理が
行なわれ、出力値ｙ_jが得られる。

【０００４】

【数１】

【０００５】ｙ_j＝〔１＋ｅｘｐ（−ｕ_j）〕^-1 …（２）出力値ｙ_jは層間結合値ｗ_jkにより重みづけられて出力
層ニューロンｋに伝えられる。同様にして、出力層は以
下の処理により出力値ｚ_kを得る。

【０００６】

【数２】

【０００７】ｚ_k＝〔１＋ｅｘｐ（−ｖ_k）〕^-1 …（４）ただし、上述の回路網にユーザが望む出力値ｚ_kを得る
ために、バックプロパゲーションと呼ばれる学習アルゴ
リズム（たとえば、東京電機大学出版局発行、合原一幸
著「ニューラルコンピュータ」参照）を用いて上述の層
間結合値ｗ_ij，ｗ_ikを決定する。すなわち、特定の画
像，音声などのサンプルパターンｎのデータ入力値ｘ_n
（ｉ）に対するネットワーク出力をｚ_n（ｋ）、ユーザ
が望む信号をｔ_n（ｋ）とし、ネットワークの出力誤差
Ｅ_nを

【０００８】

【数３】

【０００９】として、誤差Ｅ_nが最小になるように層間
結合値ｗ_ij，ｗ_ikを決定する。ただし、第（５）式は学
習すべきすべてのパターン（以後、辞書パターンと呼
ぶ）に関する和をとる。

【００１０】次に、層間結合値は、たとえばｗ_ij（新）＝ｗ_ij（旧）＋Δｗ_ij …（６）と変化させるものであるが、この場合の結合値の変化量
Δｗ_ijは以下の第（７）式で決定される。

【００１１】 Δｗ_ij＝−α・ｄＥ／ｄｗ_ij …（７）ただし、αは作用長なる定数である。

【００１２】前述の第（７）式と第（１）式，第（２）
式，第（３）式，第（４）式，第（５）式および第
（６）式から前記Δｗ_ijが求められ、それにより結合値
ｗ_ijを順次修正すれば、辞書パターンを自動的に学習す
る神経回路網が形成される。

【００１３】神経回路網学習装置の特徴は、上述の原理
で学習データの特徴が自動的に抽出され、そのアルゴリ
ズムがネットワーク結合値ｗ_ij，ｗ_jkに蓄積されるた
め、未学習の類似パターンデータまたは変型パターンデ
ータについても正しい認識結果を出力するように学習す
る優れた性質を有している点にある。

【００１４】

【発明が解決しようとする課題】しかしながら、バック
プロパゲーションの学習を成功させるためには、中間層
のニューロンの数などの神経回路網の構造パラメータを
最適化する必要があり、従来はそれを試行錯誤的に行な
っていたため、学習に多大の時間を要し、しかも最適解
が得にくいという問題点があった。

【００１５】それゆえに、この発明の主たる目的は、任
意のパターン集合に対して最適解が得られるような神経
回路網学習法およびそれを用いた装置を提供することで
ある。

【００１６】

【課題を解決するための手段】請求項１に係る発明は、
データを入力する第１層と、この第１層に接続される複
数の第２層と、第２層に接続される第３層とを含む階層
型の神経回路網を用いて学習する神経回路網学習法であ
って、学習すべき辞書データを学習し、神経回路網の第
３層よりの学習すべき辞書の認識データをカテゴリ毎に
まとめ、認識データから認識率が所定の値以下であるカ
テゴリに対して、そのカテゴリに対応する第３層のニュ
ーロンを分割し、再学習させることにより認識率が高い
神経回路網を実現する。

【００１７】請求項２に係る発明は、請求項１において
認識率が所定の値以下であるカテゴリに対して、そのカ
テゴリに対応する分割後の第３層の親ニューロンに対し
て、その出力値を複数の子ニューロンに出力値の最大の
ものを選ばせる。

【００１８】請求項３に係る発明は、請求項１において
認識率が所定の値以下であるカテゴリに対して、そのカ
テゴリに対応する分割後の第３層のニューロンに対し
て、そのカテゴリの辞書データの中で正しい認識結果を
生じるグループと、誤認識を生じるグループとに分け、
それぞれを子ニューロンに従属させる。

【００１９】請求項４に係る発明は、請求項１において
認識率が所定の値以下であるカテゴリに対して、そのカ
テゴリに対応する増設前の第３層のニューロンに対し
て、そのカテゴリの辞書データの中で正しい認識結果を
生じるパターンの第２層の出力値の平均値をニューロン
に接続する結合値に入力する。

【００２０】請求項５に係る発明は、請求項１に係る認
識率が所定の値以下であるカテゴリに対して、そのカテ
ゴリに対応する増設した第３層の子ニューロンに対し
て、そのカテゴリの辞書データの中で、誤認識を生じる
パターンの第２層の出力値の平均値をニューロンに接続
する結合値に入力するステップを含む。

【００２１】請求項６に係る発明は、神経回路網学習法
を用いた装置であって、辞書データを記憶するための辞
書記憶手段と、構造データを記憶するための構造データ
記憶手段と、データが入力される第１層と、第１層に接
続される複数の第２層と、第２層に接続される第３層と
を含み、辞書データ記憶手段からの辞書データと構造デ
ータ記憶手段からの構造データとに応じて認識学習を行
なう神経回路網と、神経回路網の認識結果に応じて認識
率を演算し、その認識率が所定の値以下のカテゴリであ
れば構造データ記憶手段の構造データを更新し、構造デ
ータに対応して辞書データを更新する辞書データ制御部
を含む学習制御手段とを備え、すべてのカテゴリの認識
率が所定の値以下になるまで学習を繰返すように神経回
路網を用いる。

【００２２】

【作用】この発明に係る神経回路網学習法は、階層型の
神経回路網を用いて学習すべき辞書データの特徴を学習
し、神経回路網の第３層よりの学習すべき辞書の認識デ
ータをカテゴリ毎に求め、認識率が所定の値以下のカテ
ゴリに対して、そのカテゴリに対応する第３層のニュー
ロンを随時追加し、再学習させることにより、認識率が
高い神経回路網を実現する。

【００２３】

【実施例】まず、この発明の原理について説明する。こ
の発明は大津の解析（Ｏｔｓｕ，Ｎ．“Ｏｐｔｉｍａｌ
ｌｉｎｅａｒａｎｄｎｏｎｌｉｎｅａｒｓｏｌ
ｕｔｉｏｎｆｏｒｌｅａｓｔ−ｓｑｕａｒｅｄｄ
ｉｓｃｒｉｍｉｎａｎｔｆｅａｔｕｒｅｅｘｔｒａｃ
ｔｉｏｎ”，ｉｎＰｒｏｃ．ｏｆ６ｔｈＩｎｔ．
Ｃｏｎｆ．ｏｎＰａｔｔｅｒｎＲｅｃｏｇｎｉｔｉ
ｏｎ，（１９８２）５５７−５６０）を神経回路網に適
用する。すなわち、十分な数の学習データを３層の神経
回路網に学習させたとき、第３層のｎ番目のニューロン
の出力値ｚ _nは次の第（８）式で表わされる。

【００２４】ｚ_n＝ｐ（Ｃ_n）ｐ（Ｘ｜Ｃ_n）／ｐ（ｘ） …（８）ただし、ｐ（Ｃ_n）はカテゴリｎが生起する確率であ
り、ｐ（ｘ｜Ｃ_n）はｘのカテゴリ条件付確率であり、
ｐ（ｘ）はｘが生起する確率である。一方、ｚ_nは第２
層の出力ベクトルｙと第３層のｎ番目のニューロンに属
する参照ベクトルｗ_nを用いて、ｚ_n＝ｆ（ｙ，ｗ_n） …（９）ｚ_nの期待値をＥ〔ｚ_n〕とすれば、Ｅ〔ｚ_n〕＝∫ｚ_nｐ（ｘ）ｄｘ＝ｐ（Ｃ_n）² …（１０）ｙのカテゴリ条件付期待値をＥ〔ｙ〕_kとすれば、ｆが
線形の場合、第（９）式および第（１０）式よりｗ_n・Σｐ（Ｃ_k）Ｅ〔ｙ〕_k＝Ｐ（Ｃ_n）² …（１１）ｋ＝ｎ以外の寄与が十分小さく、しかも｜ｗ_n｜，｜ｙ
｜が１に近いときは、ｗ_n≒Ｅ〔ｙ〕_n／ｐ（Ｃ_n） …（１２）第（１２）式からｗ_nにｙのカテゴリ条件付期待値に比
例する参照ベクトルが形成されることがわかる。また、
第（９）式よりカテゴリｎとｋの境界はｙ・（ｗ_n−ｗ_k）＝０ …（１３）で表わされ、ｗ_n−ｗ_kに垂直な平面になっている。

【００２５】上述の解析から明らかなように、ｗ_nには
参照ベトクルが形成されるが１つのカテゴリに１個しか
割当てられない。また、カテゴリ間の境界は複数のｗ_n
で決まる長平面であるため、境界領域の形状が単純であ
るときは、従来法でも学習で最適解が得られるが、それ
以外のときは学習に失敗する。

【００２６】この発明は上述の検討結果に基づき、１つ
のカテゴリに複数の参照ベクトルを割当てるため、学習
誤差が大きいカテゴリに対する第３層のニューロンに内
部構造を設けるようにしたものである。

【００２７】すなわち、１つのカテゴリに対して、通常
１個の親ニューロンを対応させ、親ニューロン１個に対
して、複数の子ニューロンを設ける。しかしながら、従
来の神経回路網の第３層のニューロンに内部構造を持た
せるとき、認識結果の判定の方法に関して従来にない方
法が必要になる。その解決策として、この発明では、親
ニューロンの出力ｚ_nをＮ個の子ニューロンの出力値ｚ
_{n m}の最大値で与え、認識結果の判定は親ニューロンの
出力ｚ_nで判定する。

【００２８】ｚ_n＝ｍａｘ｛ｚ_n1，ｚ_n2，…，ｚ_nN｝…（１４）ただし、そのようにすると、最大値以外の出力値が切捨
てられるため、学習段階ではｄＥ／ｄｗ_ijは不連続にな
って、従来のバックプロパゲーション学習法を使うと学
習を失敗する場合がある。それを避けるため、１つのカ
テゴリに属する辞書データに対して、子ニューロンをそ
のカテゴリとして、辞書データをそれぞれの子ニューロ
ンに従属させ、誤差エネルギＥ_nを次式で与える。Ｅ_n＝ΣΣ［ｚ_nm（ｋ）−ｔ_nm（ｋ）］²…（１５）ただし、そのカテゴリへの辞書データの従属のさせ方と
して、学習段階にて、認識率が設定値以下のカテゴリの
辞書パターンに対して、認識結果が正確であるグループ
と、誤認識を与えるグループに二分割し、それぞれを子
ニューロンに従属させる。

【００２９】第１図はこの発明の一実施例による神経回
路網学習法の動作原理を説明するためのフロー図であ
る。まず、ステップ（図示ではＳＰと略称する）ＳＰ１
において、従来の神経回路網学習法で初期設定し、ステ
ップＳＰ２において、予めカテゴリがわかっている辞書
パターンの学習を行ない、ネットワークの結合値ｗ_ij，
ｗ_jkと辞書の特徴ｙを抽出し、その認識結果を決定す
る。ここまでが第１段階である。

【００３０】次に、ステップＳＰ３において、カテゴリ
毎に認識率を評価し、ステップＳＰ４において、その値
が所定の値Ｔｈ以下のカテゴリに対して第３層の親ニュ
ーロンを分割する。ただし、それに応じて、辞書パター
ンの認識結果が正解であるグループと、誤認識を与える
グループに二分割し、それぞれのグループごとに特徴ｙ
の平均値を計算し、その値をそれぞれが従属する子ニュ
ーロンに接続する結合値として与える。ここまでが第２
段階である。

【００３１】さらに、ステップＳＰ５において、新しい
構造のネットワークに対して、再度バックプロパゲーシ
ョンを行ない、ステップＳＰ３に戻る。これらのステッ
プＳＰ３〜ＳＰ５を繰返すことにより、最終的に誤認識
率がゼロに近くなるまで学習を行ない、すべてのカテゴ
リが所定の値Ｔｈ以上になれば、ステップＳＰ６におい
て学習を終了する。

【００３２】上述のごとく、この発明の一実施例では、
誤認識率がゼロに近くなるまで学習が行なわれ、しかも
最低限必要な数の参照ベクトルを決定することが可能で
ある。また、第２段階の学習は、神経回路網の結合値の
初期値を第（１４）式に基づいて、既存計算値からその
最もらしい値を決定するため、学習が確実にしかも高速
にできるメリットがある。

【００３３】図２は図１に示した実施例の動作を説明す
るためのパターン認識装置の概略ブロック図であり、図
３は図２に示した神経回路網演算部の構造を示す図であ
る。

【００３４】まず、図２を参照して、神経回路網演算部
１は図３に示したような演算部を含む。構造データ格納
部２は神経回路網演算部１に必要なニューロンの数や結
合値などの構造データを蓄積していて、その構造データ
を神経回路網演算部１に与える。学習段階では、外部か
らの学習命令により学習制御回路７が起動され、命令に
応じて必要なジョブが選択される。たとえば、学習命令
が伝達されると、辞書データが学習データ供給部４から
入力部５を介して神経回路網演算部１に与えられる。ま
た、神経回路網の構造データの初期値が構造制御回路３
から構造データ格納部２に供給される。その後、前述の
第１段階の学習が行なわれ、認識結果が出力データ格納
部６に入力される。

【００３５】認識誤差演算部１０はカテゴリ毎に認識率
を計算し、その結果を学習制御回路７に与える。学習制
御回路７はその結果を判断し、その値が所定の値以下の
カテゴリが１つでもあれば第２段階のアルゴリズムによ
り、構造データ変更の指令を構造制御回路３に与える。
その結果、変更値が構造データ格納部２に入力されると
ともに、辞書データ制御部１１に辞書データの再配置の
指令を出す。指令を受けた辞書データ制御部１１は、分
割されたニューロンそれぞれに、辞書データを再分配さ
れ、その値を学習データ供給部４に入力する。第３段階
の再学習をスタートさせる。

【００３６】このようにして、学習を繰返し行ない、最
終的にすべてのカテゴリの認識率が所定の値以下になっ
たとき、学習を終了させる。学習終了後は構造データ格
納部２には最適な構造データが格納される。ユーザが未
知のパターンを認識させたいときは、テストデータ供給
部８からデータが入力され、神経回路網演算部１で演算
された後、その結果が出力データ格納部６から取出さ
れ、出力回路９により結果が判定される。したがって、
学習回路がその段階では不要となるため、それを切離し
て使うことも可能である。また、テストデータおよびそ
の認識結果を学習データ供給部４に新たに登録すること
により、辞書の更新を行なうこともできる。

【００３７】

【発明の効果】以上のように、この発明によれば、入力
パターンの識別の難易度に応じて、神経回路網が内部構
造を決定するため、たとえば手書き文字認識や音声認識
に応用したときに高い認識率が得られるとともに、コス
トパフォーマンスの高いパターン認識装置を実現でき
る。

【図面の簡単な説明】

【図１】この発明の一実施例による神経回路網学習法の
原理を説明するためのフロー図である。

【図２】この発明の一実施例の概略ブロック図である。

【図３】この発明に用いる神経回路網の構造を示す図で
ある。

【図４】従来の神経回路網の構造を示す図である。

【符号の説明】

１神経回路網演算部２構造データ格納部３構造制御回路４学習データ供給部５入力部６出力データ格納部７学習制御回路８テストデータ供給部９出力回路１０認識誤差演算部

Claims

【特許請求の範囲】

【請求項１】データを入力する第１層と、前記第１層
に接続される複数の第２層と、前記第２層に接続される
第３層とを含む階層型の神経回路網を用いて学習する神
経回路網学習法であって、学習すべき辞書データを学習し、前記神経回路網の第３
層よりの前記学習すべき辞書の認識データをカテゴリ毎
に求める第１のステップ、および前記認識データから認
識率が所定の値以下であるカテゴリに対して、当該カテ
ゴリに対応する第３層のニューロンに対し、複数個の子
ニューロンを、内部構造として持たせる第２のステップ
を含むことを特徴とする、神経回路網学習法。
【請求項２】前記第２のステップは、前記第３層の親
ニューロンの出力を、その内部構造として含む複数個の
子ニューロンの出力の最大値として与えるステップを含
む、請求項１の神経回路網学習法。
【請求項３】前記第２のステップは、前記学習時の認
識率が所定の値以下であるカテゴリに対して、増設した
子ニューロンに対し、当カテゴリの辞書データを認識結
果が正しいものと、誤認識を行なうデータとに二分し、
それぞれ子ニューロンに従属させることを特徴とする、
請求項１の神経回路網学習法。
【請求項４】前記第２のステップは、前記認識率が所
定の値以下であるカテゴリに対して、当該カテゴリに対
応する増設した第３層の子ニューロンに対し、当該カテ
ゴリの辞書データの中で、正しい認識結果を生じるパタ
ーンの第２層の出力値の平均値を、前記ニューロンに接
続する結合値に入力するステップを含む、請求項１の神
経回路網学習法。
【請求項５】前記第２のステップは、前記認識率が所
定の値以下であるカテゴリに対して、当該カテゴリに対
応する増設した第３層の子ニューロンに対し、当該カテ
ゴリの辞書データの中で、誤認識を生じるパターンの第
２層の出力値の平均値を、前記ニューロンに接続する結
合値に入力するステップを含む、請求項１の神経回路網
学習法。
【請求項６】辞書データを記憶するための辞書データ
記憶手段、構造データを記憶するための構造データ記憶手段、データが入力される第１層と、前記第１層に接続される
複数の第２層と、前記第２層に接続される第３層とを含
み、前記辞書データ記憶手段からの辞書データと、前記
構造データ記憶手段からの構造データに応じて認識学習
を行なう神経回路網、および前記神経回路網の認識結果
に応じて認識率を演算し、その認識率が所定の値以下の
カテゴリがあれば、前記構造データ記憶手段の構造デー
タを更新し、その構造データに応じて辞書データを更新
する辞書データ制御部を含む学習制御手段を備え、すべてのカテゴリの認識率が所定の値以下になるまで学
習を繰返すようにした神経回路網学習法を用いた装置。