JPH0421155A

JPH0421155A - 学習機械

Info

Publication number: JPH0421155A
Application number: JP2127361A
Authority: JP
Inventors: Shigeo Sakagami; 茂生阪上; Toshiyuki Koda; 敏行香田; 〆木　泰治; Taiji Shimeki; Hideyuki Takagi; 英行高木; Hayato Togawa; 戸川　隼人
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1990-05-16
Filing date: 1990-05-16
Publication date: 1992-01-24

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

産業上の利用分野本発明はデータ処理装置の学習機械に関するものである
。従来の技術従来の学習機械としては、例えば、テーイ、イー、ルン
メルハルト（Ｄ、Ｅ、Ｒｕｍｍｅｌｈａｒｔ）らによる
　「ラーニング−ｉ／７６リ　セーノｉイション　　ハ
ーイ　　ハーツクフ０ロバ６ｙ−イテイシク−エラー」
ネイチャー（”Ｌｅａｒｎｉｎｇ　　ｒｅｐｒｅｓｅｎ
ｔａｔｉｏｎｓ　　ｂｙ　　ｂａｃｋ−ｐｒｏｐａｇａ
ｔｉｎｇ　ｅｒｒｏｒｓ”、　Ｎａｔｕｒｅ）　Ｖｏ１
、３２３　Ｎｏ、９（１９８Ｇ）に示されている。第７
図にこの従来の学習機械の構成図を示す。第７図におい
て、２０１．２０２は入力端子、２０３．２０４．２０
５．２０６．２０７．２０８は可変重み乗算器、２０９
．２１０．２１１は飽和人出力特性を持つ加算器、２１
２は出力端子、２１３は教師信号発生部、２１４は誤差
算出部、２１５は最急降下方向決定部、２１６は重み変
更部、２１７は学習回路、２１８．２１９．２２０は多
入力一出力回路、２２１は出力層、２２２は隠れ層であ
る。第７図に示されるように、多入力一出力回路２１８．２
１９および２２０は可変重み乗算器２０３・・・と飽和
人出力特性を持つ加算器２０９・・・を備えている。即
ち、第５番目の多入力一出力回路の出力信号はｙ［ｊｌ
　　＝　　ｆｎｃ（Σ（ｗ［ｉ＋　　ｊｌ　　＊　　ｙ
［ｉコ））−−−−（１）で表される。ここに、ｙ［ｉ
］は前段の層の第１番目の多入力一出力回路の出力信号
であり、ｗ［ｉ、ｊｌは前段の層の第１番目の多入力一
出力回路の出力信号が第５番目の多入力一出力回路に人
力される時に掛けられる重みである。ｆｎｃＯは飽和特性を持つ関数でシグモイド関数等で表
される。第８図に、前記のｆｎｃＯで表される、飽和人
出力特性を持つ加算器２０９．２１０及び２１１の特性
関数のグラフを示す。学習機械は、このような多入力一出力回路を階層状に接
続した構成になっており、その学習の進め方は次の通り
である。まず、入力信号に対して望ましい出力信号（以下、教師
信号と呼ぶ）を出力するように、可変重み乗算器２０３
，２０４，２０５，２０６，２０７および２０８で掛け
られる重みを変更する。重みの変更方法としては、まず
教師信号と出力層の出力信号とから、誤差Ｅ　　＝　　
０．５　　＊　　Σ　Σ（↑ｐ［Ｊ］　　−ｙｐ［、＋
コ　）２＝　Ｅ　（Ｗ）・・・・（２）を求める。ここに、ｙｐ［Ｊ］は第９番目の入力信号に
対する出力層の第５番目の多入力一出力回路の出力信号
、ｔＪＪ］はｙ、［Ｊ］に対する教師信号、Σは全ての
教師信号に関する総和、 Σは出力層の全ての多入力一出力回路に関する総和、Ｗは重みｗ　［ｉ　、
　ｊ　］を成分とするベクトル（以下Ｗを重みベクトル
と呼ぶ）である、（２）式で示されるように誤差Ｅは教
師信号と出力層の出力信号との差の２乗和て表され、重
みベクトルＷの関数となる。そして、学習中に、それら重みを変更し、教師信号と実
際の出力信号との差、即ち誤差を最小化する。重みの変
更量はＡＷ　ニーＥ＊　　”　Ｅ　　＋　ｃｘ　＊ＡＷ”””
（３）θＷによって決定される。ここで、εは学習パラメータと呼
ばれる正の定数、αは加速パラメータと呼ばれる正の定
数であり、 θＷ（２）式で表される誤差Ｅの重みｗ［ｉ、ｊｌによる微
分を成分とするベクトルで、最急降下方向と呼ばれる。 ΔＷ′は、前回の学習における重み変更量のベクトル表
現である。第９図に、この従来の学習機械の学習回路２１７の構成
図を示す。第９図において、２２３は出力層出力の入力
端子、２２４は隠れ層比力の入力端子、２２５は入力信
号の入力端子、２２６は出力層の重みの出力端子、２２
７は隠れ層の重みの出力端子である。従来の学習機械の
学習回路２１７では、教師信号発生部２１３が入力信号
に対する教師信号（望ましい出力信号）七〇［ｊｌを発
生する。誤差算出部２１４は、教師信号ｔ。［ｊｌと出力層の出力信号ｙ、［ｊｌとから、（２）式
で表される誤差Ｅを算出する。誤差算出部２１４は重み
の変更のために必要な教師信号と出力信号との差信号ｔ
ｐ［ｊｌ　−ｙ。［ｊｌを、最急降下方向決定部２１５
に出力する。最急降下方向決定部２１５は前記差信号、
出力層出力信号、隠れ層比力信号、入力信号及び出力層
の重みをもとに、重みなベクトルで表現する重み空間に
おける誤差Ｅの、最急降下方向を求める。最急降下方向は、 −〇Ｅ（ｗ）　　・・・・（４）ｇ　＝　　− θＷで求まる。（４）式の右辺は、誤差Ｅの重み

【こよる微
分のベクトル表現である。最急降下方向決定部２１５は
、最急降下方向に学習パラメータを掛けて、重み変更部
２１６に出力する。重み変更部２１６は、（３）式によ
って重み変更量を求め、各可変型み乗算器２０３．２０
４．２０５．２０６．２０７および２０８で掛ける重み
を変更する。以上のように最急降下法によって重みの変
更量を求めることの繰り返しにより、誤差を小さくして
ゆき、誤差が十分に小さくなると、出力信号が望ましい
値に十分近くなったものとして、学習を終了する。第１Ｏ図は、従来の学習機械の学習回路２１７の更に詳
しい内容を示すブロック図を示す図である。第１０図に
おいて、２２８は学習終了判定部、２２９及び２３０は
微係数算出部、２３１は出力層微係数記憶部、２３２は
δ記憶部、２３３はδ木Ｗバッファ、２３４は隠れ層微
係数記憶部、２３５は入力信号記憶部、２３６．２３７
．２３８．２３９及び２４０は乗算器、２４１．２４２
．２４３及び２４４は加算器、２４５及び２４６は学習
パラメータ乗算器、２４７は出力層の重み記憶部、２４
８は隠れ層の重み記憶部である。第１Ｏ図を用いて、以下に学習回路２１７の動作を更に
詳細に説明する。最急降下方向決定部２１５が出力する
重み変更量は、で表される。ここにｗ［ｉ、ｊｌは第ｊ番目の多入力一
出力回路に人力される前段の層の第１番目の多入力一出
力回路の出力信号に掛けられる重み、６ｗｇ［ｉ、　ｊ
ｌはｗ［ｉ、ｊｌの最急降下方向に間する変更量、εは
学習パラメータである。（５）式は変形されて、・・・
・（６）ただしｎｅｔ、［ｊコ　　＝　　Σ　（ｗ［ｉ、　　　ｊｌ　
　　ネ　　ｙｐ［＋］）であり、ｙｐ［＋］は第２番目
の入力信号に対する前段の屡の第１番目の多入力一出力
回路の出力信号である。（６）式はさらに変形されて、６ｗｇ［ｉ、ｊコ　＝ε＊　　Σ（８ｗ、［ｊｌ　　＊
　　ｙＪｉｌ）（７）たたし、となる。以下、式の変形は、第３番目の多入力一出力回
路が出力層にあるときと、第３番目の多入力一出力回路
が隠れ層にあるときとで異なる。・第３番目の多入力一出力回路が出力層にある時で表さ
れる。ただしｆｎｃ（ｎｅＬ［ｊｌ）は出力層の各多大カー出力回路
の特性関数（：ｙＪ、＋］）である。り２）式を用いて
、この式はさらに変形されて、結局・・・・（９）と表すことができる。第１ｏ図において、加算器２４１
が（９）式における（　ｔｐ［Ｊｌ−ｙｐ［、＋］）を
計算し、微係数係数記憶部２３１を介して、乗算器２３
６でが計算される。この値はδＷ　９　［Ｊ　］なので
８記憶部２３２に記憶される。乗算器２３７でδＷ　ｐ
　［Ｊ　］と隠れ層出力ｙｐ［ｉ］との積を求め、乗算
器２４５で学習パラメータεを掛けて、（７）式で表さ
れるΔｗ、［ｉ、ｊ］を求める。（７）式のΔｗ　ｇ［
ｉ　、　ｊ　］に前回の学習における重み変更量のα倍
を加算して、（３）式で表される重み変更量Δｗ　［ｉ
　、　ｊ　］を求め、加算器２４３で変更前の重みとの
和を求め、出力層の重み記憶部２４７に記憶されている
出力層の重みを変更する。・第ｊ番目の多入力一出力回路が隠れ屑にある時θｎｅ
ｔ、［Ｊｌて表される。ただし、ｎｅｔ、［ｋｌ　　　”　　　Σ　（ｗ［ｊ、　　　ｋ
ｌ　　　ネ　　ｙｐ［ｊコ）で、ｗ［ｊ、　ｋｌは第３
番目の多入力一出力回路の出力ｙｐ［、＋］が次段の層
の多入力一出力回路に入力される時に掛けられる重みで
ある。　（８）式を用いて、この式はさらに変形されて
、結局・・・・（■０）となる。第１Ｏ図において、乗算器２３８がδ記憶部２
３２の出力δＷＤ［ｋｌと出力層の重みｗ［ｊ、ｋｌと
の積を求め、δ木Ｗバッファ２３３と加算器２４２によ
ってΣ（δＷい［ｋｌ＊ｗ［ｊ、ｋｌ）を求める。微係
数算出部２３微係数記憶部２３４を介して乗算器２３９
に人力され、前記Σ（δｗ、［ｋ］＊ｗ［ｊ、ｋｌ）と
の積より（１０）式のに δＷ　ｐ　［Ｊ　］が求められる。乗算器２４０て入力
信号ｙ。［ｉ］と掛け、乗算器２４６で学習パラメータεとの積
を求め、（７）式で表されるΔＷ２［Ｉ、Ｊｌを求める
。（７）式のΔｗ、［ｉ、ｊ］に前回の学習における重み
変更量のα倍を加算して、（３）式で表される重み変更
量Δｗ　［ｉ　、　ｊ　］を求め、加算器２４４で変更
前の重みとの和を求め、隠れ層の重み記憶部２４８に記
憶されている隠れ層の重みを変更する。以上のように、出力層の出力信号と教師信号との誤差を
減らすために、出力信号と教師信号との差信号から、ま
ず出力層の重みの変更量を求め、出力層側から入力端に
向かってＩＩＩＪｆ次重みの変更量を求める。この学習
アルゴリズムは誤差逆伝搬法と呼ばれる。発明が解決しようとする課題しかしながら上記のような構成では、学習パラメータε
及び加速パラメータαは経験的に定められるかもしくは
試行錯誤で求められた固定の値が用いられているので、
それらは必ずしも最適値ではなく、学習に要する時間が
長くなるという課題を有していた。また重みの変更方向
としては、誤差Ｅの重みによる微分（１！ＩＩち最急降
下方向）を用いており、重みの変更方向としては必ずし
も最適でないという課題を有していた。また、それ以上
学習を進めても誤差が減少しないという非効率的な状態
に学習が陥るという課題を有していた。本発明はかかる点に鑑み、教師信号（望ましい出力信号
）と実際の出力信号との誤差を最小化する方法として、
誤差を最小化する方向を動的に設定しながら学習を進め
ることによって、学習に要する時間の短い学習機械を提
供することを目的とするつ本発明の他の目的は、学習パラメータの最適値を動的に
設定して学習を進めることによって、学習に要する時間
が短い学習機械を提供することである。本発明の他の目的は、それ以上学習を進めても誤差が減
少しない非効率的状態に学習が陥っていることを検出す
ると、重みを調整しなおして学習を再開することにより
、学習時間の短い学習機械を提供することである。課題を解決するための手段本発明は、入力信号の加重和に飽和特性を持つ特性関数
で非線形処理を施して出力する複数の多入力一出力回路
を有する隠れ層と、前記隠れ層の出力信号の加重和に飽
和特性を持つ特性関数で非線形処理を施して出力する多
入力一出力回路を有する出力層と、前記出力層の望まし
い出力信号を発生する教師信号発生部と、前記教師信号
発生部の出力と前記出力層の出力との誤差を最小化する
ための重み変更方向を複数の方向から選択して決定する
重み変更方向決定部と、重み変更方向に関して複数の学
習パラメータに対する重み変更量を出力する直線探索部
と、前記直線探索部で求められた重み変更量より重み変
更量を選択する重み変更部と、学習をそれ以上進めても
誤差が効率的に減少しない不適当な状態に陥フているこ
とを重み変更方向が最急降下方向でありしかも誤差の減
少率がある値よりも小さいことによって検出する不適学
習状態検出部とを備えたことを特徴とする学習機械であ
る。作用本発明は前記した構成により、隠れ層及び出力層で入力
信号に重み付けをして加算し、非線形処理を施して出力
信号を求め、教師信号発生部が出力する望ましい出力信
号と出力層の出力信号との誤差を最小化するために、重
み変更方向決定部で重みの変更方向を決定した後、直線
探索部で複数の学習パラメータに対する重み変更量を求
め、不適学習状態検出部で学習が不効率な状態に陥って
いないかどうか調べながら、重み変更部で誤差が最小と
なる学習パラメータに対する重み変更量によって各重み
を変更する。以下同様に、重みの変更方向において誤差
が最小となる学習パラメータを用いて重みを変更する動
作を繰り返して誤差を十分に小さくする。以上により、
重みの変更方向が決まるとその方向において最適な学習
パラメータを動的に設定し、最適な学習パラメータを用
いて重みを変更して誤差を小さくすることによって、短
い学習時間で誤差が十分に小さくなり、学習を終了する
ことができる。本発明では、誤差を最小化するために、前記した構成の
重み変更方向決定部で、重みの変更方向を複数の方向か
ら選択して決定する。複数の重み変更方向としては、例
えは最急降下方向および共役勾配方向から選択してもよ
い。重みの変更方向としては、最急降下方向は、現在の
重みの値のごく近傍においては最も少ない重みの変更量
で最も誤差の減少量が大きいという意味で、局所的には
最も効率のよい方向である。それに対して、共役勾配方
向は、前回までの学習における重みの変更方向とは異な
る方向に重みを変更するという意味で、大局的にみて最
も効率のよい方向である。したがって、本発明では、重
みの変更方向をこれら複数の重み変更方向から選択して
動的に決定し、最適な重み変更方向を用いることによっ
て、学習に要する時間を短縮する。本発明では、前記した構成の不適学習状態検出部で、最
急降下方向に重みを変更しても、誤差の減少率がある値
よりも小さいことにょフて検出すると、学習が非効率的
状態に陥ったものと判断し、重みを調整しなおして学習
を再開することにより、学習が非効率的状態に陥ること
を避け、学習に要する時間を短縮する。実施例第１図は本発明の実施例における学習機械の構成図を示
すものである。第１図において、１及び２は入力端子、
３．４．５．６．７及び８は可変重み乗算器、９、ｌＯ
及び１１は飽和入出力特性をもつ加算器、１２は出力端
子、１３は教師信号発生部、１４は誤差算出部、１５は
共役勾配方向決定部、２１は出力層、２２は隠れ層、６
５は重み変更部、６６は学習パラメータ初期化部、６７
は直線探索部、７７は隠れ層積和記憶部、９２は不適学
習状態検出部、９３は学習回路、９４．９５及び９６は
多入力一出力回路である。本実施例の学習機械は、可変
重み乗算器と飽和人出力特性を持つ加算器からなる多入
力一出力回路を、階層状に接続した構成となっている。入力信号に対して、各多入力一出力回路で重み付けして
加算し、各加算器の特性関数によって非線形処理を施し
て、出力信号を求める。本実施例の学習機械の学習にお
いては、出力層２１の出力と教師信号発生部１３の出力
とが等しくなるように、可変重み乗算器３，４，５゜６
．７および８で掛けられる重みを変更する。これらの重
みを成分とするベクトルを重みベクトルと呼ぶと、重み
ベクトルの変更量をベクトルで表すことができる。この
重みの変更ベクトルの向きを重みの変更方向と呼ぶ。本
実施例では、重みの変更方向として共役勾配方向を用い
る。共役勾配方向は、ｄ＝ｇ　　　＋　　β　　　零　　ｄ　゛　・・・　・
（１１）て与えられる。ただし、ｇは（４）式で与えら
れる最急降下方向であり、βはで与えられる定数であり、ｄ′は前回の学習における共
役勾配方向、１ｇ′１　は前回の学習における最急降下
方向ｇ′のベクトルのノルムである。なお初回の学習に
おける重み変更方向は、最急降下方向に決定する。第２図に本実施例の学習回路９３の構成図を示す。第２図において、２３は出力層出力の入力端子、２４は
隠れ層出力の入力端子、２５は入力信号の入力端子、２
６は出力層の重みの出力端子、２７は隠れ層の重みの出
力端子、７３及び７４は加算器、７５は重み記憶部、８
４は隠れ層出力の出力端子、８５．８６及び８７は乗算
器、８８は入力信号と変更方向との積和記憶部、８９は
入力信号と重みとの積和記憶部、９０は加算器、９１は
非線形変換部である。本実施例の学習機械の学習回路９
３ては、教師信号発生部１３は入力信号に対する出力層
の出力として望ましい信号を教師信号として与え、誤差
算出部！４は教師信号と実際の出力信号との差信号を出
力する。共役勾配方向決定部１５は、この差信号をもと
に重みの変更方向を最急降下方向もしくは兵役勾配方向
に決定する。直線探索部６７は複数の学習パラメータに
対する重み変更量を求め、隠れ層積和記憶部７７は各学
習パラメータに対する隠れ層の出力信号を求め、誤差算
出部１４は各学習パラメータに対する誤差を求め、重み
変更部６５はこれらの誤差のうちで最小の誤差に対する
学習パラメータを用いて重みを変更する。本実施例の学習機械では、不適学習状態検出部９２で、
重み変更前の誤差と重み変更後の誤差を比較し、重み変
更方向が最急降下方向であり、しかも誤差の減少率があ
る値よりも小さいことを検出すると、それ以上学習を進
めても効率的に誤差が減少しない状態に学習が陥ったも
のと判断し、重みを乱数で初期化しなおして学習を再閉
する。第３図は共役勾配方向決定部１５の詳細を示すブロック
図である。第３図において、２８は最急降下方向算出部
、２９は共役勾配方向算出部、３０は重み変更方向決定
部、３１は学習回数計数部、３２は出力層の重みの入力
端子、３３は出力層の重み変更方向の出力端子、３４は
隠れ層の重み変更方向の出力端子、３５は差信号の入力
端子、３６および３７は微係数算出部、３８は出力Ｎ微
係数記憶部、３９は隠れ層微係数記憶部、４０はδ記憶
部、４１は今回の出力層の最急降下方向記憶部、４２は
前回の出力層の最急降下方向記憶部、４３はβ算出部、
４４は前回の出力層重み変更方向記憶部、４５．４６．
４７．４Ｂ、　４９．５０及び５１は乗算器、５２は加
算器、５３はδ＊Ｗバッファ、５４は入力信号記憶部、
５５は今回の隠れ層の最急降下方向記憶部、５６は前回
の隠れ層の最急降下方向記憶部、５８は前回の隠れ層重
み変更方向記憶部、５９および６０は重み変更方向切替
部、６３および６４は加算器である。第３図を用いて、共役勾配方向決定部１５の動作を詳細
に説明する。最急降下方向算出部２８は、第１Ｏ図に示
される従来の学習機械の最急降下方向決定部２１５とほ
ぼ同じ構成となっており、乗算器４６が出力層の重みに
関する最急降下方向を出力し、乗算器５０が隠れ層の重
みに関する最急降下方向を出力する。これらの最急降下
方向を表す信号は、重み変更方向決定部３０の重み変更
方向切替部５９．６０と、共役勾配方向算出部２９の今
回の出力層の最急降下方向記憶部４１及び今回の隠れ層
の最急降下方向記憶部５５に出力される。今回の出力層
の最急降下方向記憶部４１及び今回の隠れ層の最急降下
方向記憶部５５に記憶されている今回の学習における最
急降下方向と、前回の出力層の最急降下方向記憶部４２
及び前回の隠れ層の最急降下方向記憶部５６に記憶され
ている前回の学習における最急降下方向とをもとに、β
算出部４３は（１２）式を用いてβを求める。乗算器４
８．５１は前回の学習の重み変更方向ｄ′とβとの積を
求め、加算器６３．６４によって最急降下方向との和が
求まり、共役勾配方向として重み変更方向決定部３０の
重み変更方向切替部５９．６０に出力される。以上のよ
うにして重み変更方向切替部５９．６０には、最急降下
方向及び共役勾配方向が入力される。一方、学習回数計
数部３１は学習回数を数えており、重みの個数と等しい
回数に１回の学習では最急降下方向を重みの変更方向と
するように選択信号を出力する。本実施例では、可変重
み乗算器３．４．５．６．７および８で掛けられる重み
は６個あるので、６回に１回の学習では最急降下方向を
重み変更方向とし、それ以外の回数の学習では共役勾配
方向を重み変更方向とするように選択信号を出力する。この選択信号にしたがフて、重み変更方向切替部５９．
６０は重みの変更方向を最急降下方向と共役勾配方向と
で切り替える。以上のようにして、共役勾配方向決定部１５では、重み
の変更方向を求める。（２）式で表されるように、誤差Ｅは重みベクトルの関
数なので、可変重み乗算器３，４，５，６．７及び８の
重みをベクトルで表す重み空間における曲面として表す
ことができる。これを誤差曲面と呼ぶ。第４図に本実施例の動作を示す誤差曲面の等高線の模式
図を示す。第４図において、ｗ［ｉ＋、　ｊ＋］及びｗ
［ｉ２．　ｊ２コは可変重み乗算器３，４，５，６，７
及び８のうち任意の２つの可変重み乗算器の重み、Ｗｎ
は乱数で初期化された重みの値のベクトル表示、ｇ８は
初回の学習における最急降下方向、Ｐｌは初回の学習に
おける誤差最小点、８１はＰｉｅこおける最急降下方向
、ｄｌはＰｌにおける共役勾配方向、Ｐ２は第２回目の
学習における誤差最小点である。本実施例の学習機械の学習においては、最初に全ての可
変重み乗算器の重みを乱数で初期化するが、これは第４
図に示される誤差曲面における出発点（Ｗθ）を乱数で
設定することに相当する。学習の目的は、第４図の出発
点から始めて、誤差曲面上で誤差の小さくなる方向に重
みを変更することによって、誤差最小点の探索を繰り返
し、大局的誤差最小点に達することである。初回の学習
で（４）式によって求めた最急降下方向ｇｇ３を重みの
変更方向とし、ｇｏの方向において誤差が最小となる点
を求める。これをｇｌＩの方向に対する直線探索と呼ぶ。学習パラ
メータ初期化部６６は直線探索における学習パラメータ
の初期値として適当な正の値を出方する。第５図に誤差曲面の出発点とＰｌとの閏の断面図を示す
。第５図において、ε１は学習パラメータ初期化部６６
によフて設定される学習パラメータの初期値であり、 εに：εト１ネ２　　　　　　　　（ｋ　＞　１）・・
・・（１３）であり、Ｅ　ｋ（ｋ≧０）は学習パラメー
タεｋに対する誤差、即ちてあり、ε、は誤差曲面を近似した放物線の頂点におけ
る学習パラメータの値、Ｅｖは学習パラメータε７に一
対する誤差である。第６図は本実施例の学習機械の直線
探索における動作を示すＰＡＤ図（Ｐｒｏｂｌｅｍ　Ａ
ｎａｌｙｓｉｓ　Ｄｉａｇｒａｍ）である。第６図に示されるように直線探索においては、まず学習
パラメータの初期値ε１に対する誤差を求める。直線探
索部６７は学習パラメータの初期値ε１に共役勾配方向
を掛けて、学習パラメータの初期値ε１に対する重みの
変更量を求め、重み変更部６５に出力する。重み変更部
６５では、加算器７３で出力層の重み変更量と出力層の
重みとの和を求め、加算器７４で隠れ層の重み変更量と
隠れ層の重みとの和を求め、学習パラメータの初期値ε
１に対する重みを出力層の重みの出力端子２６及び隠れ
層の重みの出力端子２７から出力する。これらの重みを
用いて出力層２１で出力信号が求められ、誤差算出部１
４で教師信号と出力信号とを比較して誤差を求める。こ
のようにして学習パラメータの初期値ε１に対する誤差
の初期値Ｅ１が求められる。第６図のＰＡＤ図に示され
るように、直線探索部６７は誤差の初期値Ｅ１と誤差曲
面の出発点における誤差Ｅ１１との値の大きさを比較し
、Ｅｌが、Ｅ８より小さくなったときには、もつと大き
な値の学習パラメータに対する誤差の方が小さいことが
期待てきるので、学習パラメータεの値を２倍にすると
いう動作を誤差の値が増加に転するまで繰り返す。第５
図に示す初回の学習ではＥ＋くＥｅなので学習パラメー
タεの値を２倍にして誤差を求めるという動作を繰り返
すと、Ｅｓ　＞　Ｅ＋　＞　Ｅ２　＜　Ｅ３となるため
、直線探索部６７はε３に対する重み変更量まで求める
。なお学習パラメータの初期値に対する誤差Ｅ１が、誤
差の最初の値Ｅθより増加したときには、もっと小さな
値の学習パラメータに対する誤差の方が小さいことが期
待できるので、直線探索部６７は学習パラメータの値を
１／２倍するという動作を、誤差が誤差の最初の値Ｅ［
！より小さくなるまで繰り返す。次に直線探索部６７て
は、誤差最小点の近傍を放物線で近似するために、重み
空間内で重みの値が等間隔に変化する点での誤差を求め
る。即ち、ε２．５　”　（ε２＋ε３）／２・・・・
（１５）によって〜　εどε１＝ε２，５−ε２＝ε３
−ε２５とし、ε２４５に対する誤差Ｅ２．５　＝　　Ｅ（ｗ　　＋　ε２．５　　’ｔ　　
ｇｌｌ）　　　　　　・・・・（１６）を求める。第５
図においてはＥ２．５　＜Ｅ２　＜　Ｅ３＜Ｅ＋なので
、これらのうちで誤差が最小となる３点を通る放物線で
誤差最小点の近傍の誤差曲面を近似し、その頂点におけ
る誤差を求める。即ち、によって誤差曲面の放物線近似
の頂点の学習パラメータを求め、最急降下方向ｇ［＋と
ε９とを掛けて重み変更量を求め、重み変更部６５で学
習パラメータε、に対する重みの値を設定し、出力層２
１において出力信号を求め、誤差算出部１４において誤
差Ｅｖを算出する。直線探索部６７は、以上のようにし
て求められた誤差Ｅ　ｖ　ｙ　Ｅ　２　ｇ　Ｅ　２　、
５　？　Ｅ　３を比較し、それらの中で最も小さな誤差
Ｅ２．５を与える学習パラメータε２５に対する重みの
変更量ε２５ネｇｓを求めて出力する。重み変更部６５
において、加算器７３．７４で前記重み変更量ε２５＊ｇ［！と重み記憶部７５に記憶されている重みｗｌＩとの和を求め、新たな
重みとして重み記憶部７５に記憶される。このようにし
て、重みかに変更される。以上が初回の学習である。第２回目の学
習では、重み空間においてｗｌて表される点Ｐ１におけ
る共役勾配方向ｄ１を共役勾配方向決定部１５で求め、
２回目の学習における重みの変更方向とする。学習パラ
メータ初期化部６６は、学習パラメータの初期値を、初
回の学習ではε１とし、２回目以後の学習では前回の重
み変更ここ用いた学習パラメータの値もしくはε１のう
ち大きい方の値に決定する。即ち、２回目以後の学習で
は、前回の学習パラメータの最適値がε１よりも大きい
ときには前回の学習パラメータの最適値が学習パラメー
タの初期値となり、前回の学習パラメータの最適値がε
１よりも小さいときにはε１が学習バラメ−タの初期値
となる。これによフて、前回の学習パラメータの最適値
を今回の学習における学習パラメータの初期値とし、今
回の学習に最適な学習パラメータの設定を効率良く行う
ことができると同時に、前回の学習パラメータの最適値
が小さい場合に、それを今回の最小点探索の学習パラメ
ータの初期値として用いて、誤差曲面の局所的最小点に
陥り誤差曲面の大局的最小点に達することができなくな
ることを防ぐことができる。直線探索、部６７てはｄｌ
の方向に対して学習パラメータを２倍もしくは１／２倍
して、誤差が小さくなる重みの近傍おいて誤差曲線を放
物線近似して、ｄ】の方向において誤差が最小となる重
みを求めて、第２回目の学習における誤差最小点Ｐ２に
達する。以上のように、本実施例の学習機械では、共役
勾配方向に対する直線探索を繰り返して学習を進めるこ
とによって、学習パラメータの最適値を動的に設定して
誤差を小さくしてゆき、大局的誤差最小点に近づいてゆ
く。本実施例では、第２図に示したように、隠れ層積和記憶
部７７を用いて隠れ層の出力信号を求める。入力信号ｙｏ［ｉｌに対する隠れ層の出力信号ｙｐ［ｊ
ｌはｙＪ、、＋］　＝ｆｎｃ（Σ（ｗ［＋、　Ｊ］ネｙ
ｐ［＋］））　　・・・−（１８）て表される。ただし
、ｗ［ｉ、ｊｌは入力信号ｙｐ［ｉｌが隠れ層の第３番
目の多入力一出力回路に人力されるとき掛けられる重み
、ｆｎｃＯは隠れ層の加算器の特性関数で、飽和特性を
もつ非線形関数である。共役勾配方向決定部１５で求めた重みの変更方向ｄのｗ
［ｉ、ｊｌの変更量に対応する成分をｄ［＋、ｊｌで表
すと、学習パラメータεに対する隠れ層の出力信号ｙｐ
［、＋］は、となり、ｙｐ［ｊｌを求める度に、入力信号数の２倍の
回数の乗算を行う必要がある。本実施例では、Ａ、［ｊｌ　：　Σ（ｗ［ｉ、ＪＥ　　＊　　ｙｐ［ｉ
コ）　　　　　　　　　−−−−（２０）を、入力信号
と重みとの積和記憶部８９に記憶し、ＢＤ［ＪＥ” Σ（ｄ［ｉ、ｊ］ネｙＪｉ］）　　　　　・・・・（２
１）を、入力信号と変更方向との積和記憶部８８に記憶
しておくことによって、学習パラメータεに対する隠れ
層の出力信号ｙｐ［ｊｌを、ｙｐ［ＪＥ　　：　ｆｎｃ（Σ（（ｗ［ｉ、ｊコ＋ε＊
ｄ　［＋　、ＪＥ）＊ｙｐ［ｉコ））＝　　ｆｎｃ（Σ
（ｗ［ｉ、ｊ］ネｙｐ［＋］）＋　εネΣ（ｄ　［ｉ、
ｊコネｙｐ［ｉコ））＝　ｆｎｃ（Ａｐ［ｊｌ４ε＊Ｂ
　ｐ［ｊｌ）　　　　　”（２２）によって求める。即
ち、入力信号と変更方向との積和記憶部８８の出力Ｂ　
Ｄ［ＪＥに、乗算器８７において学習パラメータεを掛
けて、加算器９０で、入力信号と重みとの積和記憶部８
９の出力Ａｐ［ｊｌとの和（Ａ　ｐ　［Ｊ　］＋ε＊Ｂ
Ｄ［Ｊコ）を求める。非線形変換部９１では、加算器９
０の出力に隠れ層の加算器の特性関数ｆｎｃＯに等しい
非線形変換を施し、（２２）式で表されるｙｐ［ｊｌを
求める。これによって、重みの変更方向ｄに対する直線
探索において、演算回数を大幅に削減でき、学習時間の
短縮が図れる。以上のように本実施例によれば、不適学習状態検出部９
２で、学習が非効率な状態に陥ったことを検出すると、
重みを調整しなおして学習を再開することにより、学習
が非効率的状態に陥ることを避け、学習に要する時間を
短縮する。また、隠れ層積和記憶部７７において、入力
信号と重みとの積和及び入力信号と隠れ層の重み変更方
向との積和を記憶しておくことによって、重みの変更方
向ｄに対する直線探索において、直線探索における演算
回数を大幅に削減でき、学習時間の短縮が図れる。本実
施例によると、直線探索部６７て複数の学習パラメータ
に対する重みの変更量を求め、重み変更部６５で誤差が
最小となる重み変更量で重みを変更することにより、重
みの変更方向に対して最適な学習パラメータを動的に設
定して重みを変更することができ、学習に要する時間が
短縮される。また、兵役勾配方向決定部１５で、共役勾配方向もしく
は最急降下方向を、重み変更方向として求めることによ
り、学習に要する時開が短縮される。なお本実施例では、学習パラメータ初期化部６６は、学
習パラメータの初期値を、初回の学習ではε１とし、２
回目以後の学習では前回の学習における学習パラメータ
の最適値もしくはε１のうち大きい方の値に決定したが
、学習パラメータの初期値は常に固定の値ε１としても
よい。また、本実施例では、共役勾配方向決定部１５で、重み
の変更方向は求められた共役勾配方向もしくは最急降下
方向としたが、変更方向は常に最急降下方向としてもよ
い。また共役勾配方向決定部１５で重みの変更方向を、
重みの個数と等しい回数に１回の学習では最急降下方向
とし、それ以外の回数の学習では共役勾配方向としたが
、重みの個数の半分に等しい回数に１回の学習では最急
降下方向とし、それ以外の回数の学習では共役勾配方向
としてもよい。また共役勾配方向に対する直線探索にお
いて、重み変更量をある値より小さくしても誤差が減少
しないとき、重み変更方向を最急降下方向に切り替えて
もよい。また、本実施例では、不適学習検出部９２は重み変更方
向が最急降下方向であり、しかも誤差の減少率がある値
よりも小さいことによって、不適学習状態を検出したが
、重みの絶対値がある値よりも大きいことによって検出
してもよい。また、本実施例では、全ての重みを乱数で
初期化することによフて重みを調整したが、全ての重み
を一律に圧縮することによって重みを調整しても良いし
、重みの絶対値が最も大きな重みのみを圧縮してもよい
。また、本実施例では、隠れ層２２は入力信号を処理して
出力層に出力する多入力一出力回路から成っていたが、
階層状に接続された多入力一出力回路によって構成して
もよい。また本実施例では、２個の入力信号に対して１
個の出力信号を出力したが、これらの人出力信号の個数
は何個でもよい。発明の詳細な説明したように、本発明によれば、重み変更方向を複
数の方向から動的に選択して重みを変更し、最適な学習
パラメータを動的に設定し、学習が非効率的状態に陥っ
ていることを検出すると重みを調整でき、学習機械の学
習時間を短縮できる。

【図面の簡単な説明】

第１図は本発明の一実施例における学習機械のブロック
図、第２図は同実施例の学習回路のブロック図、第３図
は同実施例の共役勾配方向決定部の詳細ブロック図、第
４図は同実施例の動作を示す誤差曲面の等高線の模式図
、第５図は同実施例の誤差曲面の出発点とＰｌとの閏の
断面図、第６図は本実施例の直線探索における動作を示
すＰＡＤ図、第７図は従来の学習機械のブロック図、第
８図は同従来例の加算器の特性関数のグラフ、第９図は
同従来例の学習機械の学習回路のブロック図、第１０図
は同従来例の学習機械の学習回路の詳細ブロック図であ
る。１、２・・・入力端子、１２・・・出力端子、　１３・
・・教師信号発生部、１４・・・誤差算出部、１５・・
・共役勾配方向決定部、２１・・・出力層、２２・・・
隠れ層、６５・・・重み変更部、６７・・・直線探索部
、７７・・・隠れ層積和記憶部、９２・・・不適学習状
態検出部、９３・・・学習回路。

Claims

【特許請求の範囲】

（１）入力信号の加重和に飽和特性を持つ特性関数で非
線形処理を施して出力する複数の多入力一出力回路を有
する隠れ層と、前記隠れ層の出力信号の加重和に飽和特
性を持つ特性関数で非線形処理を施して出力する多入力
一出力回路を有する出力層と、前記出力層の望ましい出
力信号を発生する教師信号発生部と、前記教師信号発生
部の出力と前記出力層の出力との誤差を最小化するため
の重み変更方向を複数の方向から選択して決定する重み
変更方向決定部と、重み変更方向に関して複数の学習パ
ラメータに対する重み変更量を出力する直線探索部と、
前記直線探索部で求められた重み変更量より重み変更量
を選択する重み変更部と、学習をそれ以上進めても誤差
が効率的に減少しない不適当な状態に陥っていることを
、重み変更方向が最急降下方向でありしかも誤差の減少
率がある値よりも小さいことによって検出する不適学習
状態検出部とを備えたことを特徴とする学習機械。
（２）入力信号の加重和に飽和特性を持つ特性関数で非
線形処理を施して出力する複数の多入力一出力回路を有
する隠れ層と、前記隠れ層の出力信号の加重和に飽和特
性を持つ特性関数で非線形処理を施して出力する多入力
一出力回路を有する出力層と、前記出力層の望ましい出
力信号を発生する教師信号発生部と、前記教師信号発生
部の出力と前記出力層の出力との誤差を最小化するため
の重み変更方向を複数の方向から選択して決定する重み
変更方向決定部と、重み変更方向に関して複数の学習パ
ラメータに対する重み変更量を出力する直線探索部と、
前記直線探索部で求められた重み変更量より重み変更量
を選択する重み変更部と、入力信号と前記隠れ層の重み
との積和および入力信号と前記隠れ層の重みの変更方向
との積和を記憶する隠れ層積和記憶部と、学習をそれ以
上進めても誤差が効率的に減少しない不適当な状態に陥
っていることを、重み変更方向が最急降下方向であり、
しかも誤差の減少率がある値よりも小さいことによって
、検出する不適学習状態検出部とを備えたことを特徴と
する学習機械。
（３）教師信号発生部の出力と前記出力層の出力との誤
差を最小化するための重み変更方向を共役勾配方向もし
くは最急降下方向に決定する重み変更方向決定部を備え
たことを特徴とする請求項１または２記載の学習機械。
（４）直線探索部で求められた重み変更量のうち誤差が
最小となる重み変更量で重みを変更する重み変更部を備
えたことを特徴とする請求項１、２または３記載の学習
機械。