JP2847395B2 - 学習制御装置 - Google Patents

学習制御装置

Info

Publication number
JP2847395B2
JP2847395B2 JP1221142A JP22114289A JP2847395B2 JP 2847395 B2 JP2847395 B2 JP 2847395B2 JP 1221142 A JP1221142 A JP 1221142A JP 22114289 A JP22114289 A JP 22114289A JP 2847395 B2 JP2847395 B2 JP 2847395B2
Authority
JP
Japan
Prior art keywords
learning
error
data
test
test data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1221142A
Other languages
English (en)
Other versions
JPH0383155A (ja
Inventor
隆 木本
和雄 浅川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1221142A priority Critical patent/JP2847395B2/ja
Publication of JPH0383155A publication Critical patent/JPH0383155A/ja
Application granted granted Critical
Publication of JP2847395B2 publication Critical patent/JP2847395B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 〔概要〕 学習装置における最適な学習回数を自動的に決定する
学習制御装置に関し、 階層型の学習装置に対して一連の学習データによって
学習を行った後、誤差フィードバックすることなく、テ
ストデータの誤差を記憶することを繰り返し、テスト誤
差が最小となる学習回数を最適な学習回数と決定し、オ
ーバーラーニングを防止して未知データに対する適切な
応答を可能にすることを目的とし、 一連の学習データ(入力パターンおよび出力パター
ン)を入力として出力誤差を誤差フィードバックして階
層型の学習装置の階層間の重みの調整を行った後、テス
トデータ(入力パターンおよび出力パターン)を入力と
して誤差フィードバックすることなく、出力誤差を取り
出して記憶することを繰り返し行い、テストデータによ
る出力誤差が最小となる学習回数を求め、これを学習装
置の最適な学習回数と決定するように構成する。
〔産業上の利用分野〕
本発明は、学習装置における最適な学習回数を自動的
に決定する学習制御装置に関するものである。ニューラ
ルネットワークのような学習装置による対象物のモデル
化は、事例の提示回数、即ち学習回数による影響を多く
受けると言われている。このため、最適な学習回数を自
動的に決定することが望まれている。
〔従来の技術と発明が解決しようとする課題〕
従来の学習装置は、ニューラルネットワークに入力
値、教師信号を与えてこのときの出力誤差を取り出し、
下記の条件を満足したときに最適な学習回数と決定する
ようにしていた。
(1)出力値と教師信号との二乗誤差がある一定値以
下になった。(2)全ての出力値と教師信号との誤差が
ある一定値以下になった。(3)ある一定回数だけ学習
した。
しかし、学習してモデル化しようとする対象(例えば
転換社債の格付け)が数学的に厳密に規定されたモデル
でなく、経済分野への応用で人間の主観や、学習装置の
入力として選択した指標以外(例えば会社の成長性な
ど)の影響を受けやすいなどの非常に曖昧なモデルであ
る場合、全ての学習データを完全な望ましい値まで収束
させると、未知データに対する応答に適切に対処できな
くなるという、いわゆるオーバーラーニング(過学習)
が知られている。このため、従来の学習データの出力値
を参照して上記(1)ないし(3)のうちのいずれかの
判定によって最適な学習回数を決定していたのでは、オ
ーバーラーニングを防止し得ないという問題があった。
本発明は、階層型の学習装置に対して一連の学習デー
タによって学習を行った後、誤差フィードバックするこ
となく、テストデータの誤差を記憶することを繰り返
し、テスト誤差が最小となる学習回数を最適な学習回数
と決定し、オーバーラーニングを防止して未知データに
対する適切な応答を可能にすることを目的としている。
〔課題を解決する手段〕
第1図を参照して課題を解決する手段を説明する。
第1図において、階層型の学習装置31は、最適な学習
回数を自動的に決定しようとする学習装置である。
最適学習回数算出部3−1は、一連の学習データを入
力として出力誤差を誤差フィードバックして階層型の学
習装置31の階層間の重みの調整を行った状態で、テスト
データを入力として誤差フィードバックすることなく、
取り出した誤差(テスト誤差)が最小となる学習回数を
算出するものである。
〔作用〕
本発明は、第1図に示すように、一連の学習データを
入力として出力誤差を誤差フィードバックして階層型の
学習装置31の階層間の重みの調整を行った状態で、テス
トデータを入力として誤差フィードバックすることな
く、取り出した誤差(テスト誤差)をもとに、最適学習
回数算出部3−1がこれらの誤差のうちの最小となる学
習回数を算出して最適な学習回数と決定し、この学習回
数まで学習するようにしている。
従って、階層型の学習装置に対して学習を行った後、
誤差フィードバックすることなく、テストデータの誤差
を記憶することを繰り返し行い、テスト誤差が最小とな
る学習回数を最適な学習回数と決定することにより、最
適な学習回数を自動的に決定してオーバーラーニングを
防止し、未知データに対する適切な応答を可能にするこ
とができる。
〔実施例〕
次に、第1図から第4図を用いて本発明の1実施例の
構成および動作を順次詳細に説明する。
第1図において、学習制御装置32は、学習データ1を
格納する学習データ格納部8、テストデータを格納する
テストデータ格納部9、学習データを階層型の学習装置
31に提示する学習データ提示部10、テストデータを階層
型の学習装置31に提示するテストデータ提示部21、階層
型の学習装置31から出力された提示データに対する誤差
を学習応答記憶部4あるいはテスト応答記憶5のいずれ
かに通知する誤差選択部18、この誤差選択部18から通知
された学習データの誤差を二乗した二乗誤差を記憶する
学習応答記憶部4、誤差選択部18から通知されたテスト
データの誤差を二乗した二乗誤差を記憶するテスト応答
記憶部5、学習データあるいはテストデータによる誤差
を求めた回数を記憶する学習回数記憶部6、および各種
学習制御を行う学習制御部3などから構成されている。
学習制御部3は、学習回数に対応づけて学習誤差(学習
データによる出力誤差の二乗誤差)およびテスト誤差
(テストデータによる出力誤差の二乗誤差)を格納する
誤差テーブル25およびテスト誤差が最小の学習回数を算
出する最適学習回数算出部3−1などから構成されてい
る。
階層型の学習装置31は、ここでは3層構造のニュート
ラル・ネットワークであって、入力層31−1、中間層31
−2、および出力層31−3の3階層からなり、いわゆる
バックプロパゲーション法によって誤差17を最小とする
ように各層間の重みを調整するように構成されている。
次に、第1図構成の動作を説明する。
(1) 外部から学習データ1、テストデータ2、最大
学習回数7を通知して学習データ格納部8、テストデー
タ格納部9、学習制御部3に格納する。
(2) 学習制御部3が、階層型の学習装置31に対し
て、重み初期化命令24を発行して、重みの初期化を行
う。
(3) 学習制御部3からの学習指令11を受けた学習デ
ータ提示部10が、学習データ格納部8に対して学習デー
タ取りだし命令12を発行し、学習データ13を受け取る。
(4) この学習データ13を入力パターン14と出力パタ
ーン15とに分割し、前者を階層型の学習装置31の入力層
31−1に提示して前向きの処理を行い、出力16を出力す
る。この出力16と、出力パターン15との誤差17を求め、
この求めた誤差17にもとづいて誤差フィードバックを行
い、階層間の結合の重みwを調整する。この際、誤差切
り替え命令19を誤差選択部18に入力し、この誤差17につ
いて誤差選択部18を介して学習応答記憶部4に通知し、
二乗して二乗誤差を求め、学習回数を単位に累積した学
習誤差を求める。
(5) 学習データ提示部10は、上記処理を学習データ
格納部8に格納されている全ての学習データについて1
回行った後、学習回数記憶部6に学習データ提示通知を
行う。これに対応して、学習回数記憶部6は、学習回数
を1回分増加させ、学習回数と、学習応答記憶部4に記
憶されている学習誤差とを学習制御部3に通知すると共
に、学習応答記憶部4に記憶されている学習誤差をクリ
アする。
次に、学習制御部3が、テストデータに対する誤差
(テスト誤差)を誤差テーブル25に格納する処理を行
う。
(6) 学習制御部3からのテスト指令20を受けたテス
トデータ提示部21が、テストデータ格納部9に対してテ
ストデータ取りだし命令22を発行し、テストデータ23を
受け取る。
(7) このテストデータ23を入力パターン14と出力パ
ターン15とに分割し、前者を階層型の学習装置31の入力
層31−1に提示して前向きの処理を行い、出力16を出力
する。この際、出力16と、出力パターン15との誤差17を
求め、誤差フィードバックを行うことなく、誤差切り替
え命令19によって誤差選択部18を切り替えてこの誤差17
をテスト応答記憶部5に通知し、二乗して二乗誤差を求
め、学習回数を単位に累積したテスト誤差を求める。
(8) テストデータ提示部21は、上記処理をテストデ
ータ格納部9に格納されている全てのテストデータ(例
えば学習データから予め任意に選択したデータ)につい
て1回行った後、学習回数記憶部6にテストデータ提示
通知を行う。これに対応して、学習回数記憶部6は、テ
スト応答記憶部5に記憶されているテスト誤差を学習制
御部3に通知すると共に、テスト応答記憶部5に記憶さ
れているテスト誤差をクリアする。
(9) 学習制御部3は、誤差テーブル25にエントリを
作成し、このエントリに通知された学習回数に対応づけ
て学習誤差、テスト誤差を格納する。以上の処理を通知
された最大学習回数7まで繰り返し行う。
(10) 学習制御部3を構成する最適学習回数算出部3
−1が、作成された誤差テーブル25を参照し、テスト誤
差が最小の学習回数を検索して見つけ出し、これを最適
な学習回数を決定する。そして、階層型の学習装置31を
初期化し、この最適な学習回数まで学習を行う。
以上のように、学習データによって階層型の学習装置
31の階層間の重みwを調整した状態でテストデータの誤
差を求めることを繰り返し行い、このテストデータの誤
差が最小の学習回数を最適な学習回数と決定し、この最
適な学習回数まで学習を行うことにより、最適な学習回
数を自動的に決定してオーバーラーニングを防止し、未
知データに対する適切な応答を可能にすることができ
る。
次に、第2図フローチャートに示す順序に従い、第3
図を用いて本実施例の構成の動作を具体的に説明する。
第2図において、は、学習データに対して学習、誤
差監視を行い、テストデータに対して誤差監視を行う。
これは、学習データに対して、既述した(3)ないし
(5)によって、学習データを階層型の学習装置31に提
示して学習を行うと共にその学習誤差を学習回数に対応
づけて誤差テーブル25に格納する。また、テストデータ
に対して、既述した(6)ないし(8)によって、テス
トデータを階層型の学習装置31に提示し、学習を行うこ
となく、そのテスト誤差を学習回数に対応づけて誤差テ
ーブル25に格納する。
は、学習データの誤差が十分に小さい?、かつテス
トデータの誤差が増加?、かつ一定回数以上学習したか
?を判別する。YESの場合には、でテストデータの誤
差が最小になる回数(例えば第3図(イ)テスト誤差が
最小となる120回)まで再学習を行う。NOの場合には、
を繰り返し行う。
第3図は、本発明に係る誤差例を示す。横軸は学習回
数を表し、縦軸は二乗誤差(学習データおよびテストデ
ータの1回分の二乗誤差の合計値)を表す。尚、第3図
(イ)は第3図(ロ)の先頭の学習回数1000回までを判
り易く拡大したものである。この第3図誤差は、転換社
債格付けを行った場合の誤差変化を示す。本実験は、3
層の階層型ニューラルネットワークを用い、入力層のユ
ニット数が16個、中間層のユニット数が10個、出力層の
ユニット数が1個である。学習データは、入力データと
して〔0、1〕区間に正規化した会社の16種類の財務指
標、出力データとして〔0、1〕区間に割り付けた格付
け会社の格付けを用い、最大学習回数として10,000回と
した。第3図(イ)、(ロ)を見て判明するように、学
習データの誤差は、学習回数の増加に伴い単調減少であ
るが、未知データ(テストデータ)に対する誤差は単調
減少でなく、学習が進み過ぎると増加に転ずることが判
明する。このため、テスト誤差が最小となる第3図
(イ)に示す120回を最適な学習回数と決定する。
第4図は、本発明の具体例説明図を示す。図中、●
は、10,000回まで学習を行ったときの未知データに対す
る応答を示す。○は、本実施例によるテストデータのテ
スト誤差が最小となる120回まで学習を行ったときの未
知データに対する応答を示す。■は、格付け機関による
格付けを示す。これを参照すれば、10,000回の学習を行
った●よりも、本実施例に係るテスト誤差が最小となる
120回まで学習を行った○の方が良い予測値が得られて
いることが判明する。
〔発明の効果〕
以上説明したように、本発明によれば、階層型の学習
装置に対して一連の学習データによって学習を行った
後、誤差フィードバックすることなく、テストデータの
誤差を記憶することを繰り返し行い、テストデータの誤
差が最小となる学習回数を最適な学習回数と決定する構
成を採用しているため、最適な学習回数を自動的に決定
してオーバーラーニングを防止し、未知データに対する
適切な応答を可能にすることができる。
【図面の簡単な説明】
第1図は本発明の1実施例構成図、第2図は本発明の動
作説明フローチャート、第3図は本発明に係る誤差例、
第4図は本発明の具体例説明図を示す。 図中、3は学習制御部、3−1は最適学習回数算出部、
4は学習応答記憶部、5はテスト応答記憶部、6は学習
回数記憶部、10は学習データ提示部、14は入力パター
ン、15は出力パターン、16は出力、17は誤差、21はテス
トデータ提示部、25は誤差テーブル、31は階層型の学習
装置、31−1は入力層、31−2は中間層、31−3は出力
層、32は学習制御装置を表す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】学習装置における最適な学習回数を自動的
    に決定する学習制御装置であって、 一連の学習データを入力として出力誤差を誤差フィード
    バックして、階層型の学習装置の階層間の重みの調整を
    行う手段と、 該重み調整手段で重みの調整を行った後、テストデータ
    を入力として、誤差フィードバックすることなく、出力
    誤差を取り出して記憶する手段と、 該記憶手段に記憶されている出力誤差を基に、上記テス
    トデータによる出力誤差が最小となる学習回数を求め、
    これを上記学習装置の最適な学習回数と決定する最適学
    習回数算出手段と、 を備えたことを特徴とする学習制御装置。
JP1221142A 1989-08-28 1989-08-28 学習制御装置 Expired - Lifetime JP2847395B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1221142A JP2847395B2 (ja) 1989-08-28 1989-08-28 学習制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1221142A JP2847395B2 (ja) 1989-08-28 1989-08-28 学習制御装置

Publications (2)

Publication Number Publication Date
JPH0383155A JPH0383155A (ja) 1991-04-09
JP2847395B2 true JP2847395B2 (ja) 1999-01-20

Family

ID=16762126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1221142A Expired - Lifetime JP2847395B2 (ja) 1989-08-28 1989-08-28 学習制御装置

Country Status (1)

Country Link
JP (1) JP2847395B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104350021B (zh) * 2012-05-30 2017-03-01 太平洋水泥株式会社 水泥的品质或制造条件的预测方法
JP5323290B1 (ja) * 2012-05-30 2013-10-23 太平洋セメント株式会社 セメントの品質または製造条件の予測方法
JP6732380B2 (ja) * 2015-09-29 2020-07-29 太平洋セメント株式会社 セメントの品質または製造条件の予測方法
JP6639988B2 (ja) * 2016-03-29 2020-02-05 太平洋セメント株式会社 セメントクリンカーの製造条件の予測方法
JP6639987B2 (ja) * 2016-03-29 2020-02-05 太平洋セメント株式会社 セメントの品質または製造条件の予測方法

Also Published As

Publication number Publication date
JPH0383155A (ja) 1991-04-09

Similar Documents

Publication Publication Date Title
US7647284B2 (en) Fixed-weight recurrent neural network controller with fixed long-term and adaptive short-term memory
US5195169A (en) Control device for controlling learning of a neural network
US4912647A (en) Neural network training tool
US4914603A (en) Training neural networks
JPH0738186B2 (ja) 自己拡張形ニユーラル・ネットワーク
JP2847395B2 (ja) 学習制御装置
US5485547A (en) Recognition unit and recognizing and judging apparatus employing same
US5276769A (en) Neural network learning apparatus and method
JP3329202B2 (ja) ニューラルネットワーク学習方式
JP3757722B2 (ja) 多層ニューラルネットワークユニット数最適化方法及び装置
US20020198853A1 (en) Controlling the self learning behavior of an autonomous agent
KR970006030B1 (ko) 부분선형 회귀모형 구조
JPH0512465A (ja) ニユーラルネツトワーク
Root Geometry-based Process Control
JP3022630B2 (ja) 入力領域適応型ニューラルネットワーク文字認識装置
Kovács et al. Output sensitive discretization for genetic algorithm with migration
JP3412700B2 (ja) 神経回路網型パターン学習方法およびパターン処理装置
JP2993153B2 (ja) 入力領域適応型ニューラルネットワーク文字認識装置
Mohamed et al. DOI Technical Report
JPH064506A (ja) ニューラルネット学習方法
JP3073031B2 (ja) ニューラルネットワーク学習装置
Roukhe et al. HLM algorithm-extension to pattern recognition
JP3097117B2 (ja) 入力領域適応型ニューラルネットワーク文字認識装置
JPH06139250A (ja) 環境適応型生産計画作成装置
Sun Training multilayer feedforward neural networks using dynamic programming