JP2606317B2

JP2606317B2 - 学習処理装置

Info

Publication number: JP2606317B2
Application number: JP63235441A
Authority: JP
Inventors: 篤信平岩
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1988-09-20
Filing date: 1988-09-20
Publication date: 1997-04-30
Anticipated expiration: 2012-04-30
Also published as: JPH0283656A

Description

【発明の詳細な説明】Ａ産業上の利用分野本発明は、それぞれニューロンに対応する信号処理を
行う複数のユニットにて構成された所謂ニューラルネッ
トワーク（Neural Network:神経回路網）を用いた信号
処理部に対して、バックプロパゲーション（Back propa
gation:逆伝播）学習則に従った学習処理を施す学習処
理装置に関する。

Ｂ発明の概要本発明は、ニューラルネットワークによる信号処理部
に対してバックプロパゲーション学習則に従った学習処
理を行う学習処理装置において、中間層のユニットの数
を増加させながら結合の強さの係数の学習処理を行うこ
とにより、学習処理過程における局所的最小値状態を回
避できるようにしたものである。

Ｃ従来の技術ニューラルネットワークの学習アルゴリズムであるバ
ックプロパゲーション学習則『「Parallel Distributed
Processing」Vol.1 The MIT Press 1986や日経エレク
トロニクス1987年８月10日号,No.427.pp115−124等参
照』は、第８図に示すように、入力層（31）と出力層
（33）の間に中間層（32）を有する多層構造のニューラ
ルネットワークに適用され、高速画像処理やパターン認
識等の各種の信号処理への応用が試みられている。

すなわち、第８図に示すように、このニューラルネッ
トワークを構成する各ユニット（u_j）は、ユニット
（u_i）からユニット（u_j）への結合係数w_jiで結合され
るユニット（u_i）の出力値o_iの総和net_jを例えばsigmoi
d関数などの所定の関数ｆで変換された値o_jを出力す
る。すなわち、パターンｐの値が入力層の各ユニット
（u_j）に入力値としてそれぞれ供給されたとき、中間層
および出力層の各ユニット（u_j）の出力値o_pjは、なる第１式で表される。

そして、入力層（31）から出力層（33）へ向かって、
各ニューロンに対応するユニット（u_j）の出力値を順次
計算していくことで、上記出力層（33）のユニット
（u_j）の出力値o_pjが得られる。

バックプロパゲーション学習アルゴリズムにおいて
は、パターンｐを与えたときの、出力層（33）の各ユニ
ット（u_j）の実際の出力値o_pjと望ましい出力値t_pjすな
わち教師信号との二乗誤差の総和E_p を極小化するように、結合係数w_jiを変える学習処理を
出力層（33）から入力層（31）へ向かって順次に行うこ
とにより、教師信号の値t_pjに最も近い出力値o_pjが上記
出力層（33）のユニット（u_j）から出力されるようにな
る。

そして、二乗誤差の総和E_pを小さくする結合係数w_ji
の変化量Δw_jiを、 Δw_ji∝−∂E_p/∂w_ji ……第３式と決めると、上記第３式は、 Δw_ji＝η・δ_pj・o_pi ……第４式に変形することができる（この過程は上述の文献を参
照）。

ここで、ηは学習レート（定数）で、ユニットの数や
層の数さらには入出力の値等から経験的に決定される。
また、δ_pjはユニット（u_i）のもつ誤差値である。

従って、上記変化量Δw_jiを決定するためには、上記
誤差値δ_pjをネットワークの出力層から入力層に向かっ
て逆向きに求めていけば良い。出力層のユニット（u_j）
の誤差値δ_pjは、 δ_pj＝（t_pj−o_pj）ｆ′_ｊ（net_j） ……第５式なる第５式で与えられ、中間層のユニット（u_j）の誤差
値δ_pjは、そのユニット（u_j）が結合されている各ユニ
ット（u_k）（この例では出力値の各ユニット）の結合係
数w_kjおよび誤差値δ_pkを用いて、なる再帰関数にて計算される（上記第５式および第６式
を求める過程は上述の文献を参照）。

なお、上記ｆ′_ｊ（net_j）は、出力関数f_j（net_j）の
微分値である。

そして、変化量Δw_jiは、上記第５式および第６式の
結果を用いて上述の第４式によって求められるが、前回
の学習結果を用いて、 Δw_ji(n+1)＝η・δ_pj・o_pi＋α・Δw_ji(n) ……第７式なる第７式にて求めることで、より安定した結果が得ら
れる。なお、αはエラーの振動を減らし、収束を速める
ための安定化定数である。

そして、この学習を繰り返し行い、出力値o_pjと教師
信号の値t_pjとの二乗誤差の総和E_pが十分に小さくなっ
た時点で学習を完了するようにしていた。

Ｄ発明が解決しようとする課題ところで、上述の如き多層型のニューラルネットワー
クに対するバックプロパゲーション学習則に従った学習
処理は、機能面で高い能力が期待できるのであるが、学
習処理過程において最適最小値（global minimum）に達
することなく、局所的最小値（local minimum）状態に
陥り、二乗誤差の総和E_Pが十分に小さくならないことが
多々ある。

従来、上記局所的最小値状態に陥った場合には、初期
値や学習レートηを変えて学習処理を繰り返し行うこと
により、最適最小値状態を見つけるようにしていたの
で、従来の学習処理装置では、学習処理時間が極めて長
く、しかも、変動が大きいという問題点があった。

そこで、本発明は、上述の如き従来の実情に鑑み、ニ
ューラルネットワークによる信号処理部に対してバック
プロパゲーション学習則に従った学習処理を施す学習処
理装置において、学習処理過程における局所的最小値状
態を効率良く回避して、安定に且つ高速に最適最小値状
態に収束できるようにすることを目的とし、中間層のユ
ニットを増加させながら学習処理を行うようにした新規
な構成の学習処理装置を提供するものである。

Ｅ課題を解決するための手段本発明は、上述の目的を達成するために、それぞれニ
ューロンに対応する信号処理を行う複数のユニットにて
構成された入力層、中間層および出力層を備える信号処
理部と、上記入力層に入力される入力信号パターンに対
する上記出力層の出力値と教師信号として与えられる所
望の出力値との誤差情報に基づいて上記各ユニットの間
の結合の強さの係数を上記出力層側から上記入力層側に
向かって順次に繰り返し計算し、上記結合の強さの係数
の学習処理を行う学習処理部とを備えて成る学習処理装
置において、上記結合の強さの係数の学習処理過程にお
いて上記中間層のユニットの数を増加させる制御手段を
上記学習処理部に設け、上記学習処理部にて上記中間層
のユニットの数を増加させながら上記結合の強さの係数
の学習処理を行うようにしたことを特徴としている。

Ｆ作用本発明に係る学習処理装置では、学習処理部にて中間
層のユニットの数を増加させながら結合の強さの係数の
学習処理を行うことにより、バックプロパゲーション学
習則に従った学習処理過程における局所的最小値状態を
回避して最適最小値状態に確実に収束する学習処理を行
う。

Ｇ実施例以下、本発明の実施例について、図面を参照しながら
詳細に説明する。

本発明に係る学習処理装置は、第１図にその原理的な
構成を示してあるように、それぞれニューロンに対応す
る信号処理を行う複数のユニットにて構成された少なく
とも入力層（11）、中間層（12）および出力層（13）を
備える３層構造のニューラルネットにて構成された信号
処理部（10）と、上記信号処理部（10）の上記入力層
（11）に入力される入力信号パターンｐに対する上記出
力層の出力値と教師信t_pjとして与えられる所望の出力
値o_pjとの誤差情報δ_pjに基づいて上記各ユニットの間
の結合の強さの係数w_jiを上記出力層（13）側から上記
入力層（11）側に向かって順次に繰り返し計算し、バッ
クプロッパゲーション学習則に従って上記結合係数w_ji
を学習する学習処理を上記信号処理部（10）に施す学習
処理部（20）とを備えて成る。

上記学習処理部（20）は、上記信号処理部（10）の上
記中間層（12）のユニットの数を増加させながら上記結
合係数w_jiの学習処理を行うもので、上記結合係数w_jiの
学習処理過程において上記中間層（12）のユニットの数
を増加させる制御機能を有し、例えば第２図Ａに示すよ
うに、それぞれニューロンに対応する任意の個数x,y,z
のユニット（u_I1〜u_Ix），（u_H1〜u_Hy），（u_O1〜u_Oz）
にて構成された入力層（11）、中間層（12）および出力
層（13）を有する信号処理部（10）に対して、第２図Ｂ
に示すように、上記中間層（12）のユニットの数をｙ個
から（ｙ＋ｍ）個に順次に増加させながら、上記結合係
数w_jiの学習処理を行う。

ここで、上記中間層（12）のユニットの数を増加させ
る制御は、上記結合係数w_jiの学習処理過程において定
期的に行っても良く、また、上記局所的最小値状態の発
生を検出する毎に行うようにしても良い。

上記結合係数w_jiの学習処理過程において上記中間層
（12）のユニットの数を増加させる制御機能を有する上
記学習処理部（20）は、入力層（11）、中間層（12）お
よび出力層（13）を備える３層構造のニューラルネット
にて構成された信号処理部（10）に対して、上記信号処
理部（10）の上記中間層（12）のユニットの数を増加さ
せながら上記結合係数w_jiの学習処理を行うことによ
り、上記結合係数w_jiの学習処理過程において局所的最
小値状態が発生した場合にも、上記中間層（12）のユニ
ットの増加によって上記局所的最小値状態から抜け出し
て、最適最小値状態に迅速に且つ確実に収束する学習処
理を行うことができる。

このように上記結合係数w_jiの学習処理過程において
上記中間層のユニットの数を増加させる制御機能を有す
る上記学習処理部（20）にて、例えば、第３図に示すよ
うに、それぞれニューロンに対応する任意の個数x,y,z
のユニット（u_I1〜u_Ix），（u_H1〜u_Hy），（u_O1〜u_Oz）
にて構成された入力層（L_I）と中間層（L_H）と出力層
（L_O）の３層構造のニューラルネットワークにて構成さ
れ、上記中間層（L_H）および出力層（L_O）の各ユニット
（u_H1〜u_Hy），（u_O1〜u_Oz）は、それぞれ遅延手段を備
え、その出力値o_j(t)を上記遅延手段を介して自己の入
力とするループ（LP）および他のユニットの入力とする
フィードバック（FB）を含むリカレント回路網を構成し
た信号処理部（100）について、入力層（L_I）のユニッ
ト数を８個（ｘ＝８）、出力層（L_O）のユニットを３個
（ｚ＝３）、各層の遅延手段の数を２とし、学習時の入
力信号パターンｐとしてｌ＝８×７の時空間パターンを
21個用いて、第４図のフローチャートに示す処理アルゴ
リズムにて、中間層（L_H）のユニット数を３個（ｙ＝
３）から学習を開始し、学習処理過程において上記中間
層（L_H）のユニットを追加する実験を繰り返し行ったと
ころ、上記中間層（L_H）のユニットを３〜５回追加する
ことにより、全ての学習処理実験において、局所的最小
値状態に陥ることなく、最適最小値状態に収束する実験
結果が得られた。

第５図は、上記実験の結果の１例を示しており、同図
中に矢印を付して示すタイミングで上記中間層（L_H）の
ユニットを追加して、上記中間層（L_H）のユニットを３
個から６個に増加させることにより、最適最小値状態に
収束する学習処理を行うことができた実験結果を示して
いる。なお、第５図において、縦軸は二乗誤差の総和LM
Sを示し、横軸は学習処理の回数を示している。

ここで、上記第４図のフローチャートに示す処理アル
ゴリズムについて説明する。

この処理アルゴリズムでは、先ず、ステップ１におい
て、局所的最小値状態を検出するための処理回数を示す
変化Ｋを０に初期設定するとともに、学習処理の収束条
件を判断するための第１の変数Lmsを1000000000に初期
設定する。

次のステップ２にて全学習パターンすなわちｌ個の入
力信号パターンｐの学習回数を示す変数ｎを０に初期設
定してから、ステップ３に移ってｌ個の入力信号パター
ンｐの学習処理を行う。

次のステップ４では、上記学習回数を示す変数ｎの判
定を行い、ｎ＝３でない場合にはステップ５に移ってｎ
＝ｎ＋１として上記ステップ３に戻って上記学習処理を
繰り返し行い、ｎ＝３になるとステップ６に移る。

上記ステップ６では、学習処理の収束条件を判断する
ための第２の変数Lms（−１）の値として上記第１の変
数Lmsの値を保持してから、各ユニットにおける教師信
号と出力信号との二乗誤差の総和を第８式にて算出し、
この値を上記第１の変数Lmsの新たな値とする。

次のステップ７では、上記学習処理の収束条件を判断
するための上記第１の変数Lmsと第２の変数Lms（−１）
との比較を行い、上記第１の変数Lmsの値が上記第２の
変数Lms（−１）の値よりも小さい場合にはステップ８
に移って局所的最小値状態を検出するための処理回数を
示す上記変数Ｋが０であるか否かの判定を行う。

上記ステップ８において、上記変数Ｋが０である場合
には上記ステップ２に直接戻り、また、上記変数Ｋが０
でない場合にはステップ９においてＫ＝Ｋ＋１としてか
ら上記ステップ２に戻ってｎ＝０にして、上述のｌ個の
入力信号パターンｐの学習処理を上記ステップ３にて行
う。

また、上記ステップ７において、上記第１の変数Lms
の値が上記第２の変数Lms（−１）の値よりも大きい場
合にはステップ10に移って局所的最小値状態を検出する
ための処理回数を示す上記変数Ｋの値をＫ＝Ｋ＋１とし
てからステップ11にて上記変数Ｋの値が２であるか否か
の判定を行う。

上記ステップ11において上記変数Ｋの値が２でない場
合には上記ステップ２に直接戻り、また、上記変数Ｋが
２である場合には局所的最小値状態に陥っていると判断
してステップ12において上記中間層（L_H）のユニットを
追加する制御を行い、さらに、ステップ13にてＫ＝０と
してから上記ステップ２に戻ってｎ＝０にして、上述の
ｌ個の入力信号パターンｐの学習処理を上記ステップ３
にて行う。

なお、上記第３図に示した上記信号処理部（100）に
おいて、上記入力層（L₁）の各ユニット（u_I1〜u_Ix）に
入力される入力信号パターンｐに対して、上記中間層
（L_H）の各ユニット（u_H1〜u_Hy）は、その入力の総和ne
t_jが、なる第９式にて与えられ、この入力の総和net_jに対し
て、なる第10式のsigmoid関数にて示される出力値o_Hj(t)を
与える。

さらに、上記出力層（L_O）の各ユニット（u_O1〜u_Oz）
は、その入力の総和net_jが、なる第11式にて与えられ、この入力の総和net_jに対し
て、なる第12式にて示される出力値o_Oj(t)を与える。

ここで、上記θ_ｊはしきい値、NI,NH,NOは、上記各層
（L_I），（L_H），（L_O）の遅延手段の数をそれぞれ示し
ている。

Ｈ比較例〔比較例１〕上記第３図に示した信号処理部（100）について、上
記中間層（L_H）のユニット数を６個（ｙ＝６）に固定し
て、学習処理実験を行ったところ、最適最小値状態に収
束させるのに学習処理を極めて多数回繰り返す必要があ
り多大な時間を要するばかりでなく、８回の学習処理実
験で３回は最適最小値状態に収束することなく局所的最
小値状態に陥るという実験結果が得られた。

ここで、この比較例１における学習処理実験で、局所
的最小値状態に陥ってしまった場合の実験結果の１例を
第６図に示してある。

なお、第６図において、縦軸は二乗誤差の総和LMSを
示し、横軸は学習処理の回数を示している。

〔比較例２〕上記第３図に示した信号処理部（100）について、上
記中間層（L_H）のユニット数を３個（ｙ＝３）に固定し
て、学習処理実験を30回行ったところ、第７図に示す実
験結果の１例のように、全ての学習処理実験において最
適最小値状態に収束することなく局所的最小値状態に陥
るという実験結果が得られた。

なお、第７図においても、縦軸は二乗誤差の総和LMS
を示し、横軸は学習処理の回数を示している。

Ｉ発明の効果本発明に係る学習処理装置では、学習処理部にて中間
層のユニットの数を増加させながら結合の強さの係数の
学習処理を行うことにより、バックプロパゲーション学
習則に従った学習処理過程における局所的最小値状態を
回避して最適最小値状態に迅速且つ確実に収束する安定
した学習処理を行うことができる。

【図面の簡単な説明】

第１図は本発明に係る学習処理装置の構成を概念的に示
すブロック図、第２図Ａおよび第２図Ｂは上記学習処理
装置による学習処理過程における学習処理開始時および
学習処理途中の信号処理部の状態を示す模式図、第３図
は本発明に係る学習処理装置にて学習処理を施した信号
処理部のニューラルネットワークの構成を示す模式図、
第４図は上記学習処理装置を構成する学習処理部による
学習処理過程をの１例を示すフローチャート、第５図は
上記学習処理部による学習処理実験の結果の１例を示す
特性線図、第６図は上記第３図に示した信号処理部のニ
ューラルネットワークの中間層のユニット数を６個に固
定して学習処理実験を行った結果を示す比較例１の特性
線図、第７図は上記第３図に示した信号処理部のニュー
ラルネットワークの中間層のユニット数を３個に固定し
て学習処理実験を行った結果を示す比較例２の特性線
図、第８図はバックプロッパゲーション学習則の適用さ
れるニューラルネットワークの一般的な構成を示す模式
図である。（10），（100）……信号処理部（20）……学習処理部（L_I）……入力層（L_H）……中間層（L_O）……出力層（u_I1〜u_Ix），（u_H1〜u_Hy），（u_O1〜u_Oz）……ユニッ
ト

Claims

(57)【特許請求の範囲】

【請求項１】それぞれニューロンに対応する信号処理を
行う複数のユニットにて構成された入力層、中間層およ
び出力層を備える信号処理部と、上記入力層に入力され
る入力信号パターンに対する上記出力層の出力値と教師
信号として与えられる所望の出力値との誤差情報に基づ
いて上記各ユニットの間の結合の強さの係数を上記出力
層側から上記入力層側に向かって順次に繰り返し計算
し、上記結合の強さの係数の学習処理を行う学習処理部
とを備えて成る学習処理装置において、上記結合の強さの係数の学習処理過程において上記中間
層のユニットの数を増加させる制御手段を上記学習処理
部に設け、上記学習処理部にて上記中間層のユニットの数を増加さ
せながら上記結合の強さの係数の学習処理を行うように
したことを特徴とする学習処理装置。