JP2979562B2

JP2979562B2 - 学習処理装置

Info

Publication number: JP2979562B2
Application number: JP1341824A
Authority: JP
Inventors: 繁有沢
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1989-12-28
Filing date: 1989-12-28
Publication date: 1999-11-15
Anticipated expiration: 2014-11-15
Also published as: JPH03201160A

Description

【発明の詳細な説明】Ａ産業上の利用分野本発明は、それぞれニューロンに対応する信号処理を
行う複数のユニットにより構成される所謂ニューラルネ
ットワーク（Neural Network:神経回路網）を用いた信
号処理部に対して、バックプロパゲーション（Back pro
pagation:逆伝播）学習則に従った学習処理を施す学習
処理装置に関する。

Ｂ発明の概要本発明は、ニューラルネットワークによる信号処理部
に対してバックプロパゲーション学習則に従った学習処
理を行う学習処理装置において、ニューロンに対応する
信号処理を行う複数のユニットを入力値ｘと出力値ｙと
の関係を与える状態遷移関数ｆ（ｘ）にその遷移値近傍
の傾きを大きくするｘの１次関数ｇ（ｘ）を付加したｙ＝ｆ（ｘ）＋ｇ（ｘ）なる出力値ｙを出力するようにすることによって、学習
処理時間の短縮を図ることができるようにしたものであ
る。

Ｃ従来の技術ニューラルネットワークの学習アルゴリズムであるバ
ックプロパゲーション学習則『「Parallel Distributed
Processing」Vol.1 The MIT Press1986や日経エレクト
ロニクス1987年８月10日号,No.427.pp115−124等参照』
は、第３図に示すように、入力層（31）と出力層（33）
の間に中間層（32）を有する多層構造のニューラルネッ
トワークに適用され、高速画像処理やパターン認識等の
各種の信号処理への応用が試みられている。

すなわち、第３図に示すように、このニューラルネッ
トワークを構成する各ユニット（u_j）は、ユニット
（u_i）からユニット（u_j）への結合係数w_jiで結合され
るユニット（u_i）の出力値o_iの総和すなわち入力の総和
net_jを例えばsigmoid関数などを用いた状態遷移関数ｆ
（net_j）で変換した値o_jを出力する。すなわち、パター
ンｐの値が入力層の各ユニット（u_j）に入力値としてそ
れぞれ供給されたとき、中間層および出力層の各ユニッ
ト（u_j）の出力値o_pjは、なる第１式で表される。

そして、入力層（31）から出力層（33）へ向かって、
各ニューロンに対応するユニット（u_j）の出力値を順次
計算していくことで、上記出力層（33）のユニット
（u_j）の出力値o_pjが得られる。

バックプロパゲーション学習アルゴリズムにおいて
は、パターンｐを与えたときの、出力層（33）の各ユニ
ット（u_j）の実際の出力値o_pjと望ましい出力値t_pjすな
わち教師信号との二乗誤差の総和E_p を極小化するように、結合係数w_jiを変える学習処理を
出力層（33）から入力層（31）へ向かって順次に行うこ
とにより、教師信号の値t_pjに最も近い出力値o_pjが上記
出力層（33）のユニット（u_j）から出力されるようにな
る。

そして、二乗誤差の総和E_pを小さくする結合係数w_ji
の変化量Δw_jiを、 Δw_jiα−∂E_p/∂w_ji ……第３式と決めると、上記第３式は、 Δw_ji＝η・δ_pj・o_pi ……第４式に変形することができる（この過程は上述の文献を参
照）。

ここで、ηは学習レート（定数）で、ユニットの数や
層の数さらには入出力の値等から経験的に決定される。
また、δ_pjはユニット（u_j）のもつ誤差値である。

従って、上記変化量Δw_jiを決定するためには、上記
誤差値δ_pjをネットワークの出力層から入力層に向かっ
て逆向きに求めていけば良い。出力層のユニット（u_j）
の誤差値δ_pjは、 δ_pj＝（t_pj−o_pj）ｆ′_ｊ（net_j） ……第５式なる第５式で与えられ、中間層のユニット（u_j）の誤差
値δ_pjは、そのユニット（u_j）が結合されている各ユニ
ット（u_k）（この例では出力層の各ユニット）の結合係
数w_kjおよび誤差値δ_pkを用いて、なる再帰関数により計算される（上記第５式および第６
式を求める過程は上述の文献を参照）。

なお、上記ｆ′_ｊ（net_j）は、状態遷移関数f_j（ne
t_j）の微分値である。

そして、変化量Δw_jiは、上記第５式および第６式の
結果を用いて上述の第４式によって求められるが、前回
の学習結果を用いて、 Δw_ji(n+1)＝η・δ_pj・o_pi＋α・Δw_ji(n) ……第７式なる第７式により求めることで、より安定した結果が得
られる。なお、αはエラーの振動を減らし、収束を速め
るための安定化定数である。

そして、この学習を繰り返し行い、出力値o_pjと教師
信号の値t_pjとの二乗誤差の総和E_pが十分に小さくなっ
た時点で学習を完了するようにしていた。

Ｄ発明が解決しようとする課題ところで、上述の如きバックプロパゲーション学習則
をニューラルネットワークに採用した学習処理装置にお
いて、各層のニューロンに対応するユニット（u_j）のも
つ誤差値δ_pjを与える上記第５式や第６式における状態
遷移関数f_j（net_j）の微分値ｆ′_ｊ（net_j）は、学習が
進み出力値o_pjが教師信号の値t_pjに近づくに従って小さ
くなる。従来、ニューロンに対応するユニットの数や層
数等から上述の学習定数ηを経験的に決定して、上述の
第７式を用いて一定の学習レートで学習処理を行ってい
たが、出力値o_pjが教師信号の値t_pjに近づくに従って上
記第７式により算出される結合係数w_jiの変化量Δw_jiが
小さくなってしまい、上述の二乗誤差の総和E_pを十分に
小さくして学習を終了するまでに要する学習の繰り返し
回数ｎが膨大な値になってしまい、効率の良い学習処理
を行うことができないという問題点があった。

なお、学習時間を短縮するには、上記学習定数ηを大
きく設定すれば良いのであるが、エラー量が多く、且
つ、状態遷移関数f_j（net_j）の微分値ｆ′_ｊ（net_j）を
大きくする入力パターンが呈示された場合に、過度の補
正がなされてしまう。

そこで、本発明は、上述の如き従来の実情に鑑み、ニ
ューラルネットワークによる信号処理部に対してバック
プロパゲーション学習則に従った学習処理を施す学習処
理装置において、効率良く且つ確実に学習処理を行うこ
とができるようにすることを目的とする。

Ｅ課題を解決するための手段本発明に係る学習処理装置は、上述の目的を達成する
ために、入力値ｘと出力値ｙとの関係を与える状態遷移
関数ｆ（ｘ）にその遷移値近傍の傾きを大きくするｘの
１次関数ｇ（ｘ）を付加したｙ＝ｆ（ｘ）＋ｇ（ｘ） ……第８式なる出力値ｙを出力し、それぞれニューロンに対応する
信号処理を行う複数のユニットにより構成された入力
層、中間層および出力層を備える信号処理部と、上記入
力層に入力される入力信号パターンに対する上記出力層
の出力値と教師信号として与えられる所望の出力値との
誤差情報に基づいて上記各ユニットの間の結合の強さの
係数を上記出力層側から上記入力層側に向かって順次に
繰り返し計算し、上記結合の強さの係数の学習処理を行
う学習処理部とを備えて成る。

Ｆ作用本発明に係る学習処理装置では、それぞれ入力ｘに対
して上記値第８式で示される出力値ｙを出力する信号処
理を行う複数のユニットにより構成された入力層、中間
層および出力層を備える信号処理部に対して、上記入力
層に入力される入力信号パターンに対する上記出力層の
出力値と教師信号として与えられる所望の出力値との誤
差情報に基づいて上記各ユニットの間の結合の強さの係
数を上記出力層側から上記入力層側に向かって順次に繰
り返し計算し、上記結合の強さの係数の学習処理を学習
処理部により行う。

Ｇ実施例以下、本発明の一実施例について、図面に従い詳細に
説明する。

本発明に係る学習処理装置は、その構成を第１図のブ
ロック図に概念的に示してあるように、入力信号パター
ンｐから出力値o_pjを得るための信号処理部（10）と、
上記信号処理部（10）にて入力信号パターンｐから所望
の出力値t_pjに最も近い出力値o_pjを得るための学習を行
う学習処理部（20）とで構成される。

上記信号処理部（10）は、ニューラルネットワークに
て構成され、少なくとも入力層（L_I）と中間層（L_H）と
出力層（L_O）の３層構造になっており、各層（L_I），
（L_H），（L_O）がそれぞれニューロンに対応する任意の
個数x,y,zのユニット（u_I1〜u_IX），（u_H1〜u_Hy），（u
_O1〜u_OZ）により構成される。

上記各ユニット（u_I1〜u_Ix），（u_H1〜u_Hy），（u_O1
〜u_OZ）は、なる入力の総和net_jに対して、なる第10式で示されるsigmod関数を状態遷移関数ｆ（ne
t_j）とし、この状態遷移関数ｆ（net_j）に、ｇ（net_j）＝ａ・net_j ……第11式なる第11式で示される１次関数ｇ（net_j）を付加した、 o_pj＝ｆ（net_j）＋ｇ（net_j） ……第12式なる第12式にて示される出力値o_pjを与える。

ここで、上記第10式において、ａはａ＞０の係数であ
る。

また、上記学習処理部（20）は、上記信号処理部（1
0）に入力される入力信号パターンｐに対する上記出力
層（L_O）の出力値o_ojが、教師信号として与えられる所
望の出力値t_pjに最も近い値になるように、第２図のフ
ローチャートに示すような手順で、上記出力層（L_O）側
から上記入力層（L_I）側に向かって上記各ユニット（u
_I1〜u_IX），（u_H1〜u_Hy），（u_O1〜u_OZ）の間の結合の
強さの係数w_jiを順次に繰り返し計算し、上記所望の出
力値t_pjと上記出力値o_ojとの二乗誤差の総和E_pを十分に
小さくするように、上記結合係数w_jiの学習処理を行
う。

すなわち、上記学習処理部（20）は、先ず、ステップ
１において、上記各ユニット（u_H1〜u_Hy），（u_O1〜
u_OZ）に結合係数w_jiを与えて、上記信号処理部（10）に
おける入力信号パターンｐに対する上記出力層（L_O）の
出力値o_ojの算出処理を行い、次のステップ２におい
て、上記出力値o_ojについて、教師信号として与えられ
る上記所望の出力値t_pjと上記出力値o_ojとの二乗誤差の
総和E_pに基づいて収束条件の判定動作を行う。

上記ステップ２の判定動作では、上記信号処理部（1
0）の出力層（L_O）に得られる出力値o_ojが上記所望の出
力値t_pjに最も近い値になっているか否かを判定する。
上記ステップ２の判定動作の結果が「YES」すなわち上
記二乗誤差の総和E_pが十分に小さくなり、上記出力値o
_ojが上記所望の出力値t_pjに最も近い値になっている場
合には学習処理を完了し、その判定結果が「NO」の場合
にはステップ３ないしステップ６の各算出処理を順番に
行う。

上記ステップ３の算出処理では、上記信号処理部（1
0）の各ユニット（u_H1〜u_Hy），（u_O1〜u_OZ）の誤差値
δ_pjを算出する。このステップ３の算出処理において、
上記出力層（L_O）の各ユニット（u_O1〜u_OZ）の誤差値δ
_ojは、 δ_oj＝（t_pj−o_oj）o_oj（１−o_oj） ……第13式なる第13式により与え、また、上記中間層（L_H）の各ユ
ニット（u_H1〜u_Hy）の誤差値δ_pjは、なる第14式により与えられる。

次に、ステップ４の算出処理では、上記各ユニット
（u_H1〜u_Hy），（u_O1〜u_OZ）に対するｉ番目のユニット
からｊ番目のユニットへの結合の強さの係数w_jiの学習
変数β_ｊを上記各ユニット（u_H1〜u_Hy），（u_O1〜u_OZ）
における入力値o_pjの総和net_jに正の係数ａを掛けて１
を加えた β_ｊ＝１＋ａ・|net_j| ……第15式なる第15式により算出する。

なお、上記第15式における変数|net_j|は、ディジタル
フィルタによりローパスフィルタ特性を与えて用いるよ
うにしても良い。

さらに、ステップ５の算出処理では、学習定数をη、
エラーの振動を減らして収束を速めるための安定化定数
をαとして、上記学習変数β_ｊを用いて上記各ユニット
（u_H1〜u_Hy），（u_O1〜u_OZ）に対するｉ番目のユニット
からｊ番目のユニットへの結合係数w_jiの変化量Δw
_jiを、 Δw_ji(n+1)＝η・β（δ_pjo_pj）＋α・Δw_ji(n) ……第16式なる第16式にて算出する。

そして、ステップ６の算出処理では、上記ステップ５
において算出された上記結合係数w_jiの変化量Δw_jiに基
づいて、第17式に示すように、上記各ユニット（u_H1〜u
_Hy），（u_O1〜u_OZ）の結合係数w_jiを w_ji＝w_ji＋Δw_ji ……第17式に変更する。

そして、上記ステップ１に戻って、上記信号処理部
（10）における入力信号パターンｐに対する上記出力層
（L_O）の出力値o_ojの算出処理を行う。

この学習処理部（20）は、上述のステップ１ないしス
テップ６の動作を繰り返し行い、上記教師信号として与
えられる所望の出力値t_pjと上記出力値o_ojとの二乗誤差
の総和E_pが十分に小さくなり、上記信号処理部（10）の
出力層（L_O）に得られる出力値o_ojが上記所望の出力値t
_pjに最も近い値になると、上記ステップ２の判定動作に
より、学習処理を完了する。

この実施例の学習処理装置では、上記信号処理部（2
0）の各ユニット（u_H1〜u_Hy），（u_O1〜u_OZ）におい
て、入力の総和net_jに対して上述のsigmod関数を用いた
状態遷移関数ｆ（net_j）に１次関数ｇ（net_j）を付加し
た第12式にて示される出力値o_pjを与えるようにしたこ
とにより、上記状態遷移関数ｆ（net_j）の遷移値近傍に
おける傾きすなわち出力値o_pjの変化量を大きくするこ
とができる。これにより、学習がある程度進んでも上記
結合の強さの係数w_jiの変化量Δw_jiが極端に小さくなる
ことがなく、学習回数ｎを大幅に減少させて、高速で安
定に学習を行うことができる。

なお、この実施例の学習処理装置では、上記各ユニッ
ト（u_H1〜u_Hy），（u_O1〜u_OZ）において、上記第14式に
より算出される学習変数βを用いて学習レートを上記入
力値o_piに応じて動的に変化させながら、上記結合の強
さの係数w_jiの学習処理を行うことによって、学習時間
をより短縮できるようにしてある。

Ｈ発明の効果本発明に係る学習処理装置では、信号処理部の各ユニ
ットが入力値ｘと出力値ｙとの関係を与える状態遷移関
数ｆ（ｘ）にその遷移値近傍の傾きを大きくするｘの１
次関数ｇ（ｘ）を付加した上記第８式で示される出力値
ｙを出力するようにしたことにより、上記状態遷移関数
ｆ（ｘ）の遷移値近傍における傾きすなわち出力値ｙの
変化量を大きくすることができる。これにより、上記信
号処理部の各ユニットに対して学習処理部によりバック
プロパゲーション学習則に従った学習処理を行い、学習
がある程度進んでも、結合の強さの係数の変化量が極端
に小さくなることがなく、学習回数を大幅に減少させ
て、高速で安定に学習を行うことができる。

【図面の簡単な説明】

第１図は本発明に係る学習処理装置の構成を概念的に示
すブロック図、第２図は上記学習処理装置を構成する学
習処理部における学習処理過程を示すフローチャートで
ある。第３図はバックプロッパゲーション学習則の適用される
ニューラルネットワークの一般的な構成を示す模式図で
ある。（10）……信号処理部（20）……学習処理部（L_I）……入力層（L_H）……中間層（L_O）……出力層（u_I1〜u_IZ），（u_H1〜u_HZ），（u_O2〜u_OZ）……ユニッ
ト

Claims

(57)【特許請求の範囲】

【請求項１】入力値ｘと出力値ｙとの関係を与える状態
遷移関数ｆ（ｘ）としてシグモイド関数を用い、上記状
態遷移関数ｆ（ｘ）にその遷移値近傍の傾きを大きくす
るｘの１次関数ｇ（ｘ）を付加したｙ＝ｆ（ｘ）＋ｇ（ｘ）なる出力値ｙを出力し、それぞれニューロンに対応する
信号処理を行う複数のユニットにより構成された入力
層、中間層および出力層を備える信号処理部と、上記入力層に入力される入力信号パターンに対する上記
出力層の出力値と教師信号として与えられる所望の出力
値との誤差情報に基づいて上記各ユニットの間の結合の
強さの係数を上記出力層側から上記入力層側に向かって
順次に繰り返し計算し、上記結合の強さの係数の学習処
理を行う学習処理部とを備えて成る学習処理装置。