JP2847395B2

JP2847395B2 - 学習制御装置

Info

Publication number: JP2847395B2
Application number: JP1221142A
Authority: JP
Inventors: 隆木本; 和雄浅川
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1989-08-28
Filing date: 1989-08-28
Publication date: 1999-01-20
Anticipated expiration: 2014-01-20
Also published as: JPH0383155A

Description

【発明の詳細な説明】〔概要〕学習装置における最適な学習回数を自動的に決定する
学習制御装置に関し、階層型の学習装置に対して一連の学習データによって
学習を行った後、誤差フィードバックすることなく、テ
ストデータの誤差を記憶することを繰り返し、テスト誤
差が最小となる学習回数を最適な学習回数と決定し、オ
ーバーラーニングを防止して未知データに対する適切な
応答を可能にすることを目的とし、一連の学習データ（入力パターンおよび出力パター
ン）を入力として出力誤差を誤差フィードバックして階
層型の学習装置の階層間の重みの調整を行った後、テス
トデータ（入力パターンおよび出力パターン）を入力と
して誤差フィードバックすることなく、出力誤差を取り
出して記憶することを繰り返し行い、テストデータによ
る出力誤差が最小となる学習回数を求め、これを学習装
置の最適な学習回数と決定するように構成する。

〔産業上の利用分野〕

本発明は、学習装置における最適な学習回数を自動的
に決定する学習制御装置に関するものである。ニューラ
ルネットワークのような学習装置による対象物のモデル
化は、事例の提示回数、即ち学習回数による影響を多く
受けると言われている。このため、最適な学習回数を自
動的に決定することが望まれている。

〔従来の技術と発明が解決しようとする課題〕

従来の学習装置は、ニューラルネットワークに入力
値、教師信号を与えてこのときの出力誤差を取り出し、
下記の条件を満足したときに最適な学習回数と決定する
ようにしていた。

（１）出力値と教師信号との二乗誤差がある一定値以
下になった。（２）全ての出力値と教師信号との誤差が
ある一定値以下になった。（３）ある一定回数だけ学習
した。

しかし、学習してモデル化しようとする対象（例えば
転換社債の格付け）が数学的に厳密に規定されたモデル
でなく、経済分野への応用で人間の主観や、学習装置の
入力として選択した指標以外（例えば会社の成長性な
ど）の影響を受けやすいなどの非常に曖昧なモデルであ
る場合、全ての学習データを完全な望ましい値まで収束
させると、未知データに対する応答に適切に対処できな
くなるという、いわゆるオーバーラーニング（過学習）
が知られている。このため、従来の学習データの出力値
を参照して上記（１）ないし（３）のうちのいずれかの
判定によって最適な学習回数を決定していたのでは、オ
ーバーラーニングを防止し得ないという問題があった。

本発明は、階層型の学習装置に対して一連の学習デー
タによって学習を行った後、誤差フィードバックするこ
となく、テストデータの誤差を記憶することを繰り返
し、テスト誤差が最小となる学習回数を最適な学習回数
と決定し、オーバーラーニングを防止して未知データに
対する適切な応答を可能にすることを目的としている。

〔課題を解決する手段〕

第１図を参照して課題を解決する手段を説明する。

第１図において、階層型の学習装置31は、最適な学習
回数を自動的に決定しようとする学習装置である。

最適学習回数算出部３−１は、一連の学習データを入
力として出力誤差を誤差フィードバックして階層型の学
習装置31の階層間の重みの調整を行った状態で、テスト
データを入力として誤差フィードバックすることなく、
取り出した誤差（テスト誤差）が最小となる学習回数を
算出するものである。

〔作用〕

本発明は、第１図に示すように、一連の学習データを
入力として出力誤差を誤差フィードバックして階層型の
学習装置31の階層間の重みの調整を行った状態で、テス
トデータを入力として誤差フィードバックすることな
く、取り出した誤差（テスト誤差）をもとに、最適学習
回数算出部３−１がこれらの誤差のうちの最小となる学
習回数を算出して最適な学習回数と決定し、この学習回
数まで学習するようにしている。

従って、階層型の学習装置に対して学習を行った後、
誤差フィードバックすることなく、テストデータの誤差
を記憶することを繰り返し行い、テスト誤差が最小とな
る学習回数を最適な学習回数と決定することにより、最
適な学習回数を自動的に決定してオーバーラーニングを
防止し、未知データに対する適切な応答を可能にするこ
とができる。

〔実施例〕

次に、第１図から第４図を用いて本発明の１実施例の
構成および動作を順次詳細に説明する。

第１図において、学習制御装置32は、学習データ１を
格納する学習データ格納部８、テストデータを格納する
テストデータ格納部９、学習データを階層型の学習装置
31に提示する学習データ提示部10、テストデータを階層
型の学習装置31に提示するテストデータ提示部21、階層
型の学習装置31から出力された提示データに対する誤差
を学習応答記憶部４あるいはテスト応答記憶５のいずれ
かに通知する誤差選択部18、この誤差選択部18から通知
された学習データの誤差を二乗した二乗誤差を記憶する
学習応答記憶部４、誤差選択部18から通知されたテスト
データの誤差を二乗した二乗誤差を記憶するテスト応答
記憶部５、学習データあるいはテストデータによる誤差
を求めた回数を記憶する学習回数記憶部６、および各種
学習制御を行う学習制御部３などから構成されている。
学習制御部３は、学習回数に対応づけて学習誤差（学習
データによる出力誤差の二乗誤差）およびテスト誤差
（テストデータによる出力誤差の二乗誤差）を格納する
誤差テーブル25およびテスト誤差が最小の学習回数を算
出する最適学習回数算出部３−１などから構成されてい
る。

階層型の学習装置31は、ここでは３層構造のニュート
ラル・ネットワークであって、入力層31−１、中間層31
−２、および出力層31−３の３階層からなり、いわゆる
バックプロパゲーション法によって誤差17を最小とする
ように各層間の重みを調整するように構成されている。

次に、第１図構成の動作を説明する。

（１）外部から学習データ１、テストデータ２、最大
学習回数７を通知して学習データ格納部８、テストデー
タ格納部９、学習制御部３に格納する。

（２）学習制御部３が、階層型の学習装置31に対し
て、重み初期化命令24を発行して、重みの初期化を行
う。

（３）学習制御部３からの学習指令11を受けた学習デ
ータ提示部10が、学習データ格納部８に対して学習デー
タ取りだし命令12を発行し、学習データ13を受け取る。

（４）この学習データ13を入力パターン14と出力パタ
ーン15とに分割し、前者を階層型の学習装置31の入力層
31−１に提示して前向きの処理を行い、出力16を出力す
る。この出力16と、出力パターン15との誤差17を求め、
この求めた誤差17にもとづいて誤差フィードバックを行
い、階層間の結合の重みｗを調整する。この際、誤差切
り替え命令19を誤差選択部18に入力し、この誤差17につ
いて誤差選択部18を介して学習応答記憶部４に通知し、
二乗して二乗誤差を求め、学習回数を単位に累積した学
習誤差を求める。

（５）学習データ提示部10は、上記処理を学習データ
格納部８に格納されている全ての学習データについて１
回行った後、学習回数記憶部６に学習データ提示通知を
行う。これに対応して、学習回数記憶部６は、学習回数
を１回分増加させ、学習回数と、学習応答記憶部４に記
憶されている学習誤差とを学習制御部３に通知すると共
に、学習応答記憶部４に記憶されている学習誤差をクリ
アする。

次に、学習制御部３が、テストデータに対する誤差
（テスト誤差）を誤差テーブル25に格納する処理を行
う。

（６）学習制御部３からのテスト指令20を受けたテス
トデータ提示部21が、テストデータ格納部９に対してテ
ストデータ取りだし命令22を発行し、テストデータ23を
受け取る。

（７）このテストデータ23を入力パターン14と出力パ
ターン15とに分割し、前者を階層型の学習装置31の入力
層31−１に提示して前向きの処理を行い、出力16を出力
する。この際、出力16と、出力パターン15との誤差17を
求め、誤差フィードバックを行うことなく、誤差切り替
え命令19によって誤差選択部18を切り替えてこの誤差17
をテスト応答記憶部５に通知し、二乗して二乗誤差を求
め、学習回数を単位に累積したテスト誤差を求める。

（８）テストデータ提示部21は、上記処理をテストデ
ータ格納部９に格納されている全てのテストデータ（例
えば学習データから予め任意に選択したデータ）につい
て１回行った後、学習回数記憶部６にテストデータ提示
通知を行う。これに対応して、学習回数記憶部６は、テ
スト応答記憶部５に記憶されているテスト誤差を学習制
御部３に通知すると共に、テスト応答記憶部５に記憶さ
れているテスト誤差をクリアする。

（９）学習制御部３は、誤差テーブル25にエントリを
作成し、このエントリに通知された学習回数に対応づけ
て学習誤差、テスト誤差を格納する。以上の処理を通知
された最大学習回数７まで繰り返し行う。

（10）学習制御部３を構成する最適学習回数算出部３
−１が、作成された誤差テーブル25を参照し、テスト誤
差が最小の学習回数を検索して見つけ出し、これを最適
な学習回数を決定する。そして、階層型の学習装置31を
初期化し、この最適な学習回数まで学習を行う。

以上のように、学習データによって階層型の学習装置
31の階層間の重みｗを調整した状態でテストデータの誤
差を求めることを繰り返し行い、このテストデータの誤
差が最小の学習回数を最適な学習回数と決定し、この最
適な学習回数まで学習を行うことにより、最適な学習回
数を自動的に決定してオーバーラーニングを防止し、未
知データに対する適切な応答を可能にすることができ
る。

次に、第２図フローチャートに示す順序に従い、第３
図を用いて本実施例の構成の動作を具体的に説明する。

第２図において、は、学習データに対して学習、誤
差監視を行い、テストデータに対して誤差監視を行う。
これは、学習データに対して、既述した（３）ないし
（５）によって、学習データを階層型の学習装置31に提
示して学習を行うと共にその学習誤差を学習回数に対応
づけて誤差テーブル25に格納する。また、テストデータ
に対して、既述した（６）ないし（８）によって、テス
トデータを階層型の学習装置31に提示し、学習を行うこ
となく、そのテスト誤差を学習回数に対応づけて誤差テ
ーブル25に格納する。

は、学習データの誤差が十分に小さい？、かつテス
トデータの誤差が増加？、かつ一定回数以上学習したか
？を判別する。YESの場合には、でテストデータの誤
差が最小になる回数（例えば第３図（イ）テスト誤差が
最小となる120回）まで再学習を行う。NOの場合には、
を繰り返し行う。

第３図は、本発明に係る誤差例を示す。横軸は学習回
数を表し、縦軸は二乗誤差（学習データおよびテストデ
ータの１回分の二乗誤差の合計値）を表す。尚、第３図
（イ）は第３図（ロ）の先頭の学習回数1000回までを判
り易く拡大したものである。この第３図誤差は、転換社
債格付けを行った場合の誤差変化を示す。本実験は、３
層の階層型ニューラルネットワークを用い、入力層のユ
ニット数が16個、中間層のユニット数が10個、出力層の
ユニット数が１個である。学習データは、入力データと
して〔０、１〕区間に正規化した会社の16種類の財務指
標、出力データとして〔０、１〕区間に割り付けた格付
け会社の格付けを用い、最大学習回数として10,000回と
した。第３図（イ）、（ロ）を見て判明するように、学
習データの誤差は、学習回数の増加に伴い単調減少であ
るが、未知データ（テストデータ）に対する誤差は単調
減少でなく、学習が進み過ぎると増加に転ずることが判
明する。このため、テスト誤差が最小となる第３図
（イ）に示す120回を最適な学習回数と決定する。

第４図は、本発明の具体例説明図を示す。図中、●
は、10,000回まで学習を行ったときの未知データに対す
る応答を示す。○は、本実施例によるテストデータのテ
スト誤差が最小となる120回まで学習を行ったときの未
知データに対する応答を示す。■は、格付け機関による
格付けを示す。これを参照すれば、10,000回の学習を行
った●よりも、本実施例に係るテスト誤差が最小となる
120回まで学習を行った○の方が良い予測値が得られて
いることが判明する。

〔発明の効果〕

以上説明したように、本発明によれば、階層型の学習
装置に対して一連の学習データによって学習を行った
後、誤差フィードバックすることなく、テストデータの
誤差を記憶することを繰り返し行い、テストデータの誤
差が最小となる学習回数を最適な学習回数と決定する構
成を採用しているため、最適な学習回数を自動的に決定
してオーバーラーニングを防止し、未知データに対する
適切な応答を可能にすることができる。

【図面の簡単な説明】

第１図は本発明の１実施例構成図、第２図は本発明の動
作説明フローチャート、第３図は本発明に係る誤差例、
第４図は本発明の具体例説明図を示す。図中、３は学習制御部、３−１は最適学習回数算出部、
４は学習応答記憶部、５はテスト応答記憶部、６は学習
回数記憶部、10は学習データ提示部、14は入力パター
ン、15は出力パターン、16は出力、17は誤差、21はテス
トデータ提示部、25は誤差テーブル、31は階層型の学習
装置、31−１は入力層、31−２は中間層、31−３は出力
層、32は学習制御装置を表す。

Claims

(57)【特許請求の範囲】

【請求項１】学習装置における最適な学習回数を自動的
に決定する学習制御装置であって、一連の学習データを入力として出力誤差を誤差フィード
バックして、階層型の学習装置の階層間の重みの調整を
行う手段と、該重み調整手段で重みの調整を行った後、テストデータ
を入力として、誤差フィードバックすることなく、出力
誤差を取り出して記憶する手段と、該記憶手段に記憶されている出力誤差を基に、上記テス
トデータによる出力誤差が最小となる学習回数を求め、
これを上記学習装置の最適な学習回数と決定する最適学
習回数算出手段と、を備えたことを特徴とする学習制御装置。