JP3435713B2 - 学習パターン選択型追加学習装置 - Google Patents

学習パターン選択型追加学習装置

Info

Publication number
JP3435713B2
JP3435713B2 JP31827592A JP31827592A JP3435713B2 JP 3435713 B2 JP3435713 B2 JP 3435713B2 JP 31827592 A JP31827592 A JP 31827592A JP 31827592 A JP31827592 A JP 31827592A JP 3435713 B2 JP3435713 B2 JP 3435713B2
Authority
JP
Japan
Prior art keywords
learning
control
pattern
neural network
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31827592A
Other languages
English (en)
Other versions
JPH06161982A (ja
Inventor
雅彦 立石
宗昭 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP31827592A priority Critical patent/JP3435713B2/ja
Publication of JPH06161982A publication Critical patent/JPH06161982A/ja
Application granted granted Critical
Publication of JP3435713B2 publication Critical patent/JP3435713B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Air Conditioning Control Device (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、学習パターン選択型追
加学習装置に関し、神経回路網により与えられた学習パ
ターンのうち、ある動作環境において必要なものを適宜
選択し、その選択された学習パターンを用いて学習を行
うことを特徴とする学習パターン選択型追加学習装置に
関する。
【0002】
【従来の技術】近年、空調機器において、機器の設置現
場の環境や機器使用者の感覚に合致した快適な空調制御
を実現したいという要求がある。その実現手法の一つと
して、適応制御機能(追加学習機能)を持つ神経回路網
による制御方式がある。この神経回路網を用いた制御方
式は、例えば、バックプロパゲーション法により、制御
曲線を学習させる方法である。
【0003】適応制御を神経回路網で実現しようとする
場合、機器自身が新たに追加学習パターンを獲得し、神
経回路網を再学習する機構を持つ必要がある。しかしな
がら、神経回路網は追加学習パターンのみを学習させる
と、それまで記憶していた学習パターンを忘れてしまう
という欠点がある。そこで、再学習時には、神経回路網
に、追加パターンとそれまでの学習パターンを併せて学
習させている。
【0004】
【発明が解決しようとする課題】一般に神経回路網は非
常に数多くの学習パターンを使用するため、学習に時間
がかかる。適応制御を行わないのであれば、神経回路網
の特性は固定で良く、学習をワークステーション等の高
速な計算機で行って、その結果をROMに焼き付けて機
器に組み込むといった方法をとればよい。この場合、学
習時間は問題とならない。
【0005】しかしながら、適応制御を実現する場合
は、学習を機器内蔵のマイコン等で行うことになる。神
経回路網で制御を実現しようとする場合は、一般に多量
の学習パターンが必要であり、再学習を行う度に、それ
ら多量の学習パターンと追加学習パターンとを同時に学
習させなければならない。そのため、追加学習に非常に
多くの時間がかかってしまい、実用的ではないという問
題があった。
【0006】そこで、本発明では、上記問題が神経回路
網に多量の学習パターンを一度にまとめて学習させるこ
とが原因となって発生するという点に着目し、ある動作
環境において、必要な学習パターンのみを選択して学習
パターン数を減らすことにより、高速学習を可能とする
追加学習装置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明は、上記目的を達
成するために、請求項1においては、環境に関する信号
を入力するセンサ(2)から成る信号入力手段(2)
と、 この信号入力手段(2)にて入力される入力信号
と、この入力信号に応じて出力される出力信号とからな
る制御パターンを神経回路網により学習し、前記入力信
号が入力されると、 この制御パターンに基づき出力信号
を出力する制御部(5)と、 この制御部(5)にて出力
された出力信号を任意の出力信号に変更する出力変更手
段(4)と、 この出力変更手段(4)にて前記出力信号
を変更した時に、この変更後の出力信号と、出力変更時
の入力信号とからなる追加制御パターンを記憶する記憶
部(63.64)と、 前記追加制御パターンの学習時
に、前記入力信号が入力される入力範囲において、追加
制御パターンの入力信号が含まれる一部の入力範囲内の
制御パターンであって、かつ、現在の環境に近い範囲内
のもののみを学習パターンとして選択する選択手段(6
2)と、 を備え、前記制御部(5)は、前記選択手段
(62)にて選択された学習パターンを用いて学習を行
う。 また、請求項2においては、前記センサ(2)は複
数のセンサからなり、 前記制御部(5)は前記センサ
(2)により入力される環境情報信号から前記出力信号
を計算して出力する適応制御神経回路網(52)を有
し、 前記記憶部は、前記出力変更手段(4)の操作時に
前記環境情報信号と変更後の前記出力信号を一組の追加
学習パターンとして生成する追加学習パターン生成器
(64)と、前記追加学習パターンおよび標準的な制御
特性を表す標準学習パターンを保持する学習パターンデ
ータベース(63)とから成り、 前記学習パターンデー
タベース(63)から学習データを一個もしくは複数個
選択する学習パターンセレクタ(62)から前記選択手
段(62)が構成され、前記学習パターンセレクタ(6
2)により選択された学習パターンを用いて前記 制御部
内の前記適応制御神経回路網(52)を学習させる。
た、請求項3においては、更に学習用神経回路網(6
1)を備え、前記学習パターンセレクタ(62)により
選択された学習パターンを用いて前記学習用神経回路網
(61)を学習し、学習完了後、前記適応制御神経回路
網(52)に前記学習用神経回路網(61)の学習結果
を複写して学習させる。 また、請求項4においては、装
置立ち上げ時に前記センサ(2)にて検知した装置立ち
上げ時環境情報信号から、ある定められた距離範囲内に
ある環境を制御領域として設定し、その後、前記学習パ
ターンセレクタ(62)に前記制御領域の内部にある学
習パターンを選択させて前記適応制御神経回路網(5
2)を学習させる。 また、請求項5においては装置立ち
上げ時に前記センサ(2)にて検知した装置立ち上げ時
環境情報信号から、ある定められた距離範囲内にある環
境を制御領域として設定し、その後、前記学習パターン
セレクタ(62)に前記制御領域の内部にある学習パタ
ーンを選択させて前記学習用神経回路網(61)を学習
させ、学習完了後、前記適応制御神経回路網(52)に
前記学習用神経回路網(61)の学習結果を複写する。
また、請求項6においては、装置稼動後にある定められ
た時間毎に前記センサ(2)にて時間毎環境情報信号を
検知し、前記装置立ち上げ時環境情報信号と前記時間毎
環境情報信号との間の距離がある定められた距離以上離
れた場合に、前記装置立ち上げ時環境情報信号から設定
された前記制御領域を、前記時間毎環境情報信号から前
記距離範囲内にある制御領域に変更し、その後、前記学
習パターンセレクタ(62)に前記距離範囲内にある制
御領域の内部にある学習パターンを選択させて前記適応
制御神経回路網(52)を学習する。 また、請求項7に
おいては、装置稼動後にある定められた時間毎に前記セ
ンサ(2)にて時間毎環境情報信号を検知し、前記装置
立ち上げ時環境情報信号と前記時間毎環境情報信号との
間の距離がある定められた距離以上離れた場合に、前記
装置立ち上げ時環境情報信号から設定された前記制御領
域を、前記時間毎環境情報信号から前記距離範囲内にあ
る制御領域に変更し、その後、前記学習パターンセレク
タ(62)に前記距離範囲内にある制御領域の内部にあ
る学習パターン を選択させて前記学習用神経回路網(6
1)を学習し、学習完了後、前記適応制御神経回路網
(52)に前記学習用神経回路網(61)の学習結果を
複写する。 また、請求項8においては、前記適応制御神
経回路網(52)とは別に標準制御特性を実現するモジ
ュールを備え、学習パターンの選択において、選択され
た学習パターンに追加学習パターンが含まれていない場
合、前記適応制御神経回路網(52)の学習を省略し、
前記標準制御特性を実現するモジュールに制御を切り替
えて出力信号を計算する。
【0008】
【作用】上記構成よりなる本発明の学習パターン選択型
追加学習装置によれば、ある入力信号に対して制御部に
て出力信号を出力する。この出力信号を変更すると、こ
の変更後の出力と、この時の入力信号とからなる追加制
御パターンを同時に記憶部に記憶する。追加制御パター
ンを学習する時には、この追加制御パターンが含まれる
一部の範囲内の学習パターンのみを選択し、この選択さ
れた学習パターンを基に学習する。そして、この選択に
際して学習パターンの中から現在の環境に近い範囲内の
もののみを選択している。よって、一部の範囲内の学習
パターンを取り出すために、パターンを平均化したりし
て算出しないので、追加学習パターンをより正確に学習
でき、きめ細かな制御が出来る。 また、装置立ち上げ時
に前記センサ(2)にて検知した装置立ち上げ時環境情
報信号から、ある定められた距離範囲内にある環境を制
御領域として設定し、その後、前記学習パターンセレク
タ(62)に前記制御領域の内部にある学習パターンを
選択させて学習させている。 更に、装置稼動後にある定
められた時間毎に前記センサ(2)にて時間毎環境情報
信号を検知し、前記装置立ち上げ時環境情報信号と前記
時間毎環境情報信号との間の距離がある定められた距離
以上離れた場合に、前記装置立ち上げ時環境情報信号か
ら設定された前記制御領域を、前記時間毎環境情報信号
から前記距離範囲内にある制御領域に変更し、その後、
前記学習パターンセレクタ(62)に前記距離範囲内に
ある制御領域の内部にある学習パターンを選択させて学
習させている。これらによって、機器動作中にオンライ
ンで学習でき、現在の環境が大きく変化した時、それに
応じた制御がなされる。 また、前記適応制御神経回路網
(52)とは別に標準制御特性を実現するモジュールを
備え、学習パターンの選択において、選択された学習パ
ターンに追加学習パターンが含まれていない場合、前記
適応制御神経回路網(52)の学習を省略し、前記標準
制御特性を実現するモジュールに制御を切り替えて出力
信号を計算することによって、不要なオンライン学習を
なくし、制御効率を高めることが出来る。
【0009】
【実施例】以下に、本発明の学習パターン選択型追加学
習装置を、車両用空調装置の風量制御装置に用いた例に
ついて説明する。
【0010】図1は本装置の構成例を示すブロック図で
ある。図1に示すように、1は空調装置の設置場所の環
境を示す。この追加学習装置の構成は、本発明の信号入
力手段に相当するセンサ2と、環境モニター3と、本発
明の出力変更手段に相当する風量修正スイッチ4と、
発明の制御部に相当する風量制御モジュール5と、神経
回路網学習モジュール6と、風量制御装置7とから構成
されている。更に、風量制御モジュール5は、標準制御
モジュール51と、適応制御用神経回路網52とから構
成されている。また、神経回路網学習モジュール6は、
学習用神経回路網61と、本発明の選択主段に相当する
学習パターンセレクタ62と、本発明の記憶部に相当す
学習パターンデータベース63と、追加学習パターン
生成器64とから構成される。
【0011】センサ2は、環境1における環境状態を検
出する各種のセンサを示し、環境モニター3と、神経回
路網学習モジュール6を構成する追加学習パターン生成
器64とに対して、環境状態を示す環境情報信号11を
送付する。車室内の温度や外気温を検出するためには温
度センサを配し、車室内に侵入する日射量を検出するた
めには日射センサを配する。
【0012】なお、ある時点での車室内への送風量は、
このセンサ2にて検出した車室内温度、外気温、日射量
等の環境によって決定される。以下、ある時点の環境で
の各環境情報をまとめてn次元ベクトルX= (x1, x2,
... , xn) とし、その環境における風量をYとする。
【0013】環境モニター3は、風量制御モジュール5
と、神経回路網学習モジュール6とを制御する制御部の
役割を持つ。センサ2からの環境状態を示す環境情報信
号11を受け取り、風量制御モジュール5にこの環境情
報信号11を送付する。また、神経回路網学習モジュー
ル6を構成する学習パターンセレクタ62に対して追加
学習を行う際の学習命令の信号17を送付する。
【0014】風量修正スイッチ4は、車両の乗員が、自
動制御された風量を増大、もしくは減少させて修正する
風量修正スイッチである。風量制御モジュール5は、環
境モニター3から送られた環境情報11を基に、その環
境下での最適な風量を計算し、風量制御装置7に制御信
号12を送る。風量制御モジュール5内には標準制御モ
ジュール51、適応制御用神経回路網52があり、環境
モニター3が場合に応じて両者を切り換えて使用する。
標準制御モジュール51は、標準的な制御特性を有する
モジュールであり、本装置の立ち上げ(初期化)時、お
よび後述の如く適応制御が不要な時に使用される。適応
制御用神経回路網52は、次に述べる神経回路網学習モ
ジュール6により設定される神経回路網で、適応制御を
行う場合に使用する。
【0015】なお、標準的な制御特性とは、一般ユーザ
の好む特性の平均的なものであり、従来の機器の工場出
荷時の特性に相当する。この特性は固定で必ずしも神経
回路網で実現されている必要はない。
【0016】神経回路網学習モジュール6は、適応制御
用の神経回路網を学習によって求めるためのモジュール
である。学習パターンデータベース63は、神経回路網
61の学習に使用するパターンを保持する記憶部であ
る。この学習データベース63には最初、標準的な風量
制御の入出力関係を表す標準制御パターンが保存されて
いるが、本装置稼動後、使用者により追加学習パターン
が追加されることもある。この追加学習パターンは、使
用者が本装置の風量制御を不快に感じ、風量修正スイッ
チ4を操作して自分が快適と感じるレベルに風量を修正
した時に追加学習パターン生成器64により生成、保存
される。すなわち、修正が入った場合、追加学習パター
ン生成器64はその時点の環境情報Xと修正後の風量Y
とを組にして、追加学習パターン16として学習パター
ンデータベース63に保存する。
【0017】学習パターンセレクタ62は、環境モニタ
ー3より学習命令信号17を受け取ると、後述の方法に
より、学習パターンデータベース63から学習パターン
を選択して学習用神経回路網61の学習を行う。学習完
了後、学習用神経回路網61の特性(シナプス荷重等)
は適応制御用神経回路網52にロードされ、学習が終了
したことを示す学習完了ステータス18が環境モニター
3に返される。
【0018】上記の適応制御用神経回路網52および学
習用神経回路網61に用いる神経回路網は、例えば、図
7に示す如く構成される。図7に示すように、神経回路
網8は、ある入力信号を与えた時に出力された出力信号
が正しい信号であるか誤った信号であるかという情報
(教師信号)を入力する事により、神経回路網8内に設
けられた入力層81、中間層82、83、出力層84内
部の各ニューロン85間の結合86の重み(シプナス荷
重)を修正するという誤差逆伝播学習(バックプロパゲ
ーション)機能を備えたものであり、繰り返し’学習’
させることにより、新たな信号が入力されたときに正解
を出力する確率を高めることができるものである。
【0019】各ニューロン85間の結合86の重みは、
結合86の抵抗値として表されるものであり、重みが大
きい結合86にてニューロン85間が結合されている結
合部では、入力側からみて前側の層内のニューロン85
からの信号が振幅の大きい信号となり、後流側のニュー
ロン85にその信号が流れる。また、重みが小さい結合
部ではニューロン85からの信号が振幅の小さい信号と
なり、後流側のニューロン85にその信号が流れる。
【0020】次に、本装置の作動について、図4及び図
5に示すフローチャートに沿って説明する。図4に装置
全体の制御手順のフローチャートを、また図5に神経回
路網学習の手順のフローチャートを示す。
【0021】本装置を制御する環境モニター3が、図4
に示すように、ステップ100にて制御を開始すると、
先ず、ステップ110にて、車室内温度、外気温度、日
射量等の環境1の環境情報を、センサ2により検出す
る。
【0022】ステップ120では、標準制御モジュール
51を風量制御装置7に接続し、標準制御モジュール5
1内の標準制御パターンに基づき制御できるようにす
る。ステップ130では、標準制御モジュール51に、
センサ2からの環境情報信号11を入力し、標準制御パ
ターンに基づき送風量を計算する。
【0023】次のステップ140では、ステップ130
にて計算された送風量に基づき、制御信号12を風量制
御装置7に送信する。ステップ150では、学習用神経
回路網61にて学習パターンセレクタ62の選択した学
習パターンを学習する。この学習方法については、図5
に示すフローチャートに基づき、後に詳細に説明する。
なお、最初にこのステップに移行してきた時には、学習
は行われない。
【0024】ステップ160では、標準制御モジュール
51もしくは適応制御用神経回路網52に、センサ2か
らの環境情報信号11を入力し、何れかの制御パターン
に基づき送風量を計算する。
【0025】ステップ170では、ステップ160にて
計算された送風量に基づき、制御信号12を風量制御装
置7に送信する。ステップ180では、10秒間経過し
てから、次のステップ190に移行する。
【0026】ステップ190では、ステップ110と同
様にして、環境モニター3がセンサ2から環境1をモニ
タリングする。このモニタリングは、ステップ180に
より定期的に時間(例えば、10秒間)をあけて行われ
る。
【0027】ステップ200では、ステップ190にて
モニタリングされた環境1が天候の変化等によって変化
し、現在の制御領域(後述)から外れることが予測され
た場合、「YES」と判断してステップ150に移行し
て、制御領域を設定し直し、学習パターンセレクタ62
に学習命令信号17を送って再度学習を行わせる。学習
完了後、適応制御用神経回路網52に新しい学習結果を
ロードする。一方、環境1が制御領域から外れない時に
は「NO」と判断して、ステップ160に移行する。
【0028】次に、学習パターンセレクタ62が学習パ
ターンデータベース63から学習パターンを選択する方
法を図2に基づき説明する。環境モニター3は本装置立
ち上げ(初期化)時に、その時点の環境情報Xの制御領
域を設定する。そして、学習パターンセレクタ62に学
習命令信号17を送る。学習命令信号17には、環境情
報X、および制御領域の情報が含まれている。制御領域
は、環境情報Xから、ユークリッド距離が、ある定めら
れた半径R内にある領域とする。
【0029】ところで、学習パターンデータベース63
の保持する学習パターン総数をMとおくと、データベー
ス63内のk番目の学習パターンである環境情報Xk
(1≦k≦M)は、Xk =(x1 k ,x2 K ... ,xnk )が
風量Yk となるとする。
【0030】ある環境情報Xから、各学習パターンXk
とのユークリッド距離をdk(X) とおく。すると、このユ
ークリッド距離は次式の如く示される。
【0031】
【数1】 学習パターンセレクタ62は学習命令信号17を受け取
ると、環境情報Xと各学習パターンXk とのユークリッ
ド距離dk(X) を計算し、dk(X) が制御領域内に入るもの
を選択して、学習用神経回路網61に送る。すなわち、
dk(X) ≦Rを満たす学習パターンを選択する。
【0032】なお、上述の例ではdk(X) としてユークリ
ッド距離を使用したので、制御領域はn次元における半
径Rの球体となるが、制御領域の形状は必ずしも球体で
ある必要はなく、問題に応じて適切なものを選択する。
【0033】次に、上記説明した図4に示すフローチャ
ートのステップ150での神経回路網学習の方法につい
て説明する。この学習方法は、図5のフローチャートに
示される。
【0034】ステップ151にて、上述の如く、dk(X)
≦Rを満たす学習パターンXk を選択する。ステップ1
52では、追加学習パターン16が存在するのか否かを
判断する。追加学習パターン16が存在する時には、
「YES」と判断し、ステップ153に移行する。追加
学習パターン16が存在しない時には、「NO」と判断
してステップ156に移行する。
【0035】ステップ153に制御が移行すると、この
ステップにて、学習用神経回路網61の学習をバックプ
ロパゲーション法により行う。この学習は学習用神経回
路網61の誤差が、ある定められた許容誤差の範囲内に
収まった時点で完了する。
【0036】ステップ154では、学習用神経回路網6
1にて学習した結果を適応制御用神経回路網52に複写
(ロード)する。次のステップ155では、適応制御用
神経回路網52を風量制御装置7に接続し、この適応制
御用神経回路網52により風量制御する。
【0037】一方、ステップ156は、ステップ152
にて追加学習パターン16が存在しないと判断された時
に移行するステップであり、このステップでは、追加学
習パターン16が存在しない制御領域内にて制御を行う
ので、標準制御モジュール51を風量制御装置7に接続
し、標準制御モジュール51にて風量制御する。
【0038】ステップ157に制御が移行すると、図4
に示すフローチャートのステップ160に移行する。な
お、上記の制御において、学習後の制御特性をロードし
た直後に、この制御特性が急変しない工夫が必要となる
が、その一方法として、制御領域の一部をオーバーラッ
プさせることにより、制御特性をなめらかに接続するこ
とが可能である。
【0039】図3にその一例を示す。環境情報がXから
X’に変化したときの制御領域の移動を示す。環境情報
X’がXの制御領域の境界に対し、ある定められた距離
ε以内に近づいたとき、X’を中心とする制御領域を新
たに設定する方法をとれば、上述のオーバーラップを実
現することができ、新しい神経回路網をロードした直後
の制御特性の急変を防止することができる。
【0040】特殊な場合として、制御領域内に追加学習
パターンがなく、標準制御パターンしか存在しない時
は、当該制御領域内の制御特性は標準のままで良く、標
準制御モジュール51をそのまま使用する。この場合、
適応制御を行う必要はなく、学習パターンセレクタ62
は再学習を行わない。適応制御が必要であるのか、それ
とも不要であるのかの情報は学習完了ステータス18に
より返される。環境モニタ3は学習完了ステータス18
を参照し、適応制御が必要な場合は適応制御用神経回路
網52を選択して使用し、適応制御が不要な場合は、標
準制御モジュール51を選択して使用する。
【0041】上記の方法によれば、制御領域内の一部の
学習パターンのみを学習するので、全部の学習パターン
を学習させる場合に比べ、学習時間が非常に短時間で済
む。また制御を制御領域内の処理に特化させることが出
来るので、制御領域内での理想的な制御を実現すること
が可能である。
【0042】なお、上記の実施例では、学習用神経回路
網61にて学習し、その学習結果を適応制御用神経回路
網52にロードする構成としたが、学習用神経回路網6
1を無くし、適応制御用神経回路網52にて学習する構
成としても良い。
【0043】また、本発明の追加学習装置にて追加学習
をおこなっている時には、適応制御用神経回路網52に
て制御を行わず、追加学習を始める直前の出力値にて制
御する。本発明によれば、学習時間を短くすることがで
きるので、学習中は追加学習を始める直前の出力値にて
制御しておき、学習の終了後に適応制御用神経回路網5
2にロードしてから、この適応制御用神経回路網52に
て制御するように構成することができる。
【0044】次に、従来の如く、(A)学習パターンの
選択なし(全学習パターンをまとめて学習)の場合と、
(B)学習パターンの選択あり(本発明の適用例)の場
合との2つの場合について神経回路網の学習を行い、学
習回数、計算時間(CPU時間)の比較を行った実験の
結果について説明する。
【0045】実験方法は以下の通りである。図6に示し
た風量制御特性を神経回路網に学習させる。なお、この
特性は実験のために仮想的に設定したものであり、実際
の空調制御で使用している特性とは細部において異な
る。風量は車内温度、外気温の関数であり、1から10
の連続値をとる。この例では環境情報を表すベクトルX
は二次元となる。ここで、環境情報Xにおける風量Yを
f(x)で表す。
【0046】環境X=(車内温度,外気温)の条件を次
の範囲内にて定める。車内温度は25〜45°Cの範囲
内の温度とし、外気温は25〜45°Cの範囲内の温度
とする。また、この時の出力である風量Y=f(X)は、1
〜10[V]の範囲内の電圧とする。
【0047】学習パターンは、車内温度と、外気温の範
囲25〜45°Cを1°Cおきにプロットしたときの風
量とする。すると、車内温度Trは、25,26,…,
45°Cの如く、21ポイントからなり、外気温Ts
も、25,26,…,45°Cの如く、21ポイントか
らなる。出力である風量Yの値は、各ポイントに対して
一つの出力値であるので、学習パターンの総数は21×
21=441個となる。なお、この時、風量はf(T
r,Ts)という関数からなる。
【0048】実験に使用した神経回路網は、図7に示す
四層型の神経回路網である。各層のユニット数は以下の
通りである。この実験では、出力層84が1個のニュー
ロン85からなり、第2中間層83が6個、第1中間層
82が6個、入力層81が2個のニューロン85からな
る。また、本学習実験に使用したパラメ−タは、学習率
を0.3、慣性モーメントを0.9とし、出力値Yの許
容誤差を±0.5〔V〕とした。学習アルゴリズムは前
述の如くバックプロパゲーション法である。
【0049】次に、実験結果を示す。(A)学習パター
ンの選択なしの時は、図7の神経回路網8に、441個
の全学習パターンを一度に学習させた時である。この時
には、学習を2966回繰り返し行うことにより、許容
誤差を満足でき、この時のCPUでの計算時間は、22
分13秒である。
【0050】本発明の適用例である(B)学習パターン
の選択ありの時には、先ず、図8に示すように、車内温
度、外気温の二次元入力データ空間を5℃間隔で区切
り、4×4=16個の正方形の制御領域を設ける。上記
に説明したように、制御領域は必ずしも円形である必要
はなく、本実験では、正方形の制御領域とする。
【0051】各領域には境界上の点も含めて6×6=3
6個の学習パターンが属する。図7の神経回路網を用
い、各領域それぞれにつき、学習を行ったときの学習回
数、CPUでの計算時間を図9に示す。
【0052】平均学習回数は93.8回となり、またCPU
での計算時間の平均は2.67秒となる。この結果に示され
るように、従来の(A)学習パターンの選択なしの時に
比べて、本発明の追加学習装置によれば、学習回数、C
PUでの計算時間の双方につき、大幅な削減が出来る。
【0053】従って、追加学習パターンが各領域内にて
追加された後においても、学習パターンを選択した時の
方が大幅な時間の削減をすることができる。なお、この
実験では神経回路網として四層型BPネットワークを使
用したが、本発明は他のモデルの神経回路網にも同様に
適用が可能である。
【0054】また、本実施例では、環境情報が変化する
と、この環境情報に従って制御領域を変化させる構成と
したが、図8に示すように、最初から制御領域を分割し
ておき、この制御領域内に対応する環境情報毎に追加学
習パターンの学習を行う構成としても良い。
【0055】
【発明の効果】上記説明したように、本発明の学習パタ
ーン選択型追加学習装置によれば、追加制御パターンの
含まれる一部の範囲内の制御パターンのみを選択し、こ
の制御パターンに基づき学習する。
【0056】従って、全体の入力範囲の制御パターンに
基づき学習するのと比べると、学習時の制御パターン数
が減少するので、学習時間を短縮することができる。
【図面の簡単な説明】
【図1】本発明の追加学習装置のシステム図を示す。
【図2】環境Xにおける制御領域を示す図である。
【図3】環境X内における制御領域の移動を示す図であ
る。
【図4】装置全体の制御手順を示すフローチャートであ
る。
【図5】神経回路網の学習の手順を示すフローチャート
である。
【図6】風量制御特性を示す図である。
【図7】神経回路網を示す図である。
【図8】制御領域を示す図である。
【図9】(a)、(b)は、本発明の適用実験結果を示
す図である。
【符号の説明】
2 センサ 3 環境モニター 4 風量修正スイッチ 5 風量制御モジュール 6 神経回路網学習モジュール 7 風量制御装置 52 適応制御用神経回路網 63 学習パターンデータベース
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平4−195667(JP,A) 特開 平4−299443(JP,A) 特開 昭62−59998(JP,A) 特開 平5−342188(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06N 1/00 - 7/08 G06G 7/60 F24F 11/00 - 11/08 G05B 13/00 - 13/04 JSTファイル(JOIS) CSDB(日本国特許庁)

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】 環境に関する信号を入力するセンサ
    (2)から成る信号入力手段(2)と、 この信号入力手段(2)にて入力される入力信号と、こ
    の入力信号に応じて出力される出力信号とからなる制御
    パターンを神経回路網により学習し、前記入力信号が入
    力されると、この制御パターンに基づき出力信号を出力
    する制御部(5)と、 この制御部(5)にて出力された出力信号を任意の出力
    信号に変更する出力変更手段(4)と、 この出力変更手段(4)にて前記出力信号を変更した時
    に、この変更後の出力信号と、出力変更時の入力信号と
    からなる追加制御パターンを記憶する記憶部(63.6
    4)と、 前記追加制御パターンの学習時に、前記入力信号が入力
    される入力範囲において、追加制御パターンの入力信号
    が含まれる一部の入力範囲内の制御パターンであって、
    かつ、現在の環境に近い範囲内のもののみを学習パター
    ンとして選択する選択手段(62)と、 を備え、前記制御部(5)は、前記選択手段(62)
    て選択された学習パターンを用いて学習を行う学習パタ
    ーン選択型追加学習装置。
  2. 【請求項2】 前記センサ(2)は複数のセンサからな
    り、 前記制御部(5)は前記センサ(2)により入力される
    環境情報信号から前記出力信号を計算して出力する適応
    制御神経回路網(52)を有し、 前記記憶部は、前記出力変更手段(4)の操作時に前記
    環境情報信号と変更後の前記出力信号を一組の追加学習
    パターンとして生成する追加学習パターン生成器(6
    4)と、前記追加学習パターンおよび標準的な制御特性
    を表す標準学習パターンを保持する学習パターンデータ
    ベース(63)とから成り、 前記学習パターンデータベース(63)から学習データ
    を一個もしくは複数個選択する学習パターンセレクタ
    (62)から前記選択手段(62)が構成され、前記学
    習パターンセレクタ(62)により選択された学習パタ
    ーンを用いて前記制御部内の前記適応制御神経回路網
    (52)を学習させることを特徴とする請求 項1記載の
    空調制御装置。
  3. 【請求項3】 更に学習用神経回路網(61)を備え、
    前記学習パターンセレクタ(62)により選択された学
    習パターンを用いて前記学習用神経回路網(61)を学
    習し、学習完了後、前記適応制御神経回路網(52)に
    前記学習用神経回路網(61)の学習結果を複写して学
    習させることを特徴とする請求項2記載の空調制御装
    置。
  4. 【請求項4】 装置立ち上げ時に前記センサ(2)にて
    検知した装置立ち上げ時環境情報信号から、ある定めら
    れた距離範囲内にある環境を制御領域として設定し、そ
    の後、前記学習パターンセレクタ(62)に前記制御領
    域の内部にある学習パターンを選択させて前記適応制御
    神経回路網(52)を学習させることを特徴とする請求
    項2記載の空調制御装置。
  5. 【請求項5】 装置立ち上げ時に前記センサ(2)にて
    検知した装置立ち上げ時環境情報信号から、ある定めら
    れた距離範囲内にある環境を制御領域として設定し、そ
    の後、前記学習パターンセレクタ(62)に前記制御領
    域の内部にある学習パターンを選択させて前記学習用神
    経回路網(61)を学習させ、学習完了後、前記適応制
    御神経回路網(52)に前記学習用神経回路網(61)
    の学習結果を複写することを特徴とする請求項3記載の
    空調制御装置。
  6. 【請求項6】 装置稼動後にある定められた時間毎に前
    記センサ(2)にて時間毎環境情報信号を検知し、前記
    装置立ち上げ時環境情報信号と前記時間毎環境情報信号
    との間の距離がある定められた距離以上離れた場合に、
    前記装置立ち上げ時環境情報信号から設定された前記制
    御領域を、前記時間毎環境情報信号から前記距離範囲内
    にある制御領域に変更し、その後、前記学習パターンセ
    レクタ(62)に前記距離範囲内にある制御領域の内部
    にある学習パターンを選択させて前記適応制御神経回路
    網(52)を学習することを特徴とする請求項4記載の
    空調制御装置。
  7. 【請求項7】 装置稼動後にある定められた時間毎に前
    記センサ(2)にて時間毎環境情報信号を検知し、前記
    装置立ち上げ時環境情報信号と前記時間毎環境情報信号
    との間の距離がある定められた距離以上離れた場合に、
    前記装置立ち上げ時環境情報信号から設定された前記制
    御領域を、前記時間毎環境情報信号か ら前記距離範囲内
    にある制御領域に変更し、その後、前記学習パターンセ
    レクタ(62)に前記距離範囲内にある制御領域の内部
    にある学習パターンを選択させて前記学習用神経回路網
    (61)を学習し、学習完了後、前記適応制御神経回路
    網(52)に前記学習用神経回路網(61)の学習結果
    を複写することを特徴とする請求項5記載の空調制御装
    置。
  8. 【請求項8】 前記適応制御神経回路網(52)とは別
    に標準制御特性を実現するモジュールを備え、学習パタ
    ーンの選択において、選択された学習パターンに追加学
    習パターンが含まれていない場合、前記適応制御神経回
    路網(52)の学習を省略し、前記標準制御特性を実現
    するモジュールに制御を切り替えて出力信号を計算する
    ことを特徴とする請求項2ないし7のいずれか一項に記
    載の空調制御装置。
JP31827592A 1992-11-27 1992-11-27 学習パターン選択型追加学習装置 Expired - Fee Related JP3435713B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31827592A JP3435713B2 (ja) 1992-11-27 1992-11-27 学習パターン選択型追加学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31827592A JP3435713B2 (ja) 1992-11-27 1992-11-27 学習パターン選択型追加学習装置

Publications (2)

Publication Number Publication Date
JPH06161982A JPH06161982A (ja) 1994-06-10
JP3435713B2 true JP3435713B2 (ja) 2003-08-11

Family

ID=18097389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31827592A Expired - Fee Related JP3435713B2 (ja) 1992-11-27 1992-11-27 学習パターン選択型追加学習装置

Country Status (1)

Country Link
JP (1) JP3435713B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60231480D1 (de) 2001-02-21 2009-04-23 Sony Corp Signalverarbeitungseinrichtung
PT1579288T (pt) * 2002-11-04 2017-06-23 Ge Intelligent Platforms Inc Monitorização do estado do sistema utilizando máquina de aprendizagem local recorrente
US9250625B2 (en) 2011-07-19 2016-02-02 Ge Intelligent Platforms, Inc. System of sequential kernel regression modeling for forecasting and prognostics
US9256224B2 (en) 2011-07-19 2016-02-09 GE Intelligent Platforms, Inc Method of sequential kernel regression modeling for forecasting and prognostics

Also Published As

Publication number Publication date
JPH06161982A (ja) 1994-06-10

Similar Documents

Publication Publication Date Title
US5714866A (en) Method and apparatus for fast battery charging using neural network fuzzy logic based control
Hoffmann Evolutionary algorithms for fuzzy control system design
Mori et al. Optimal fuzzy inference for short-term load forecasting
Hagras et al. A hierarchical fuzzy–genetic multi-agent architecture for intelligent buildings online learning, adaptation and control
JP3334807B2 (ja) ニュ−ラルネットを利用したパタ−ン分類方法および装置
JPH07107421B2 (ja) 車両の変速制御装置
JPH09301011A (ja) 車両用運転状況監視装置
JP3070643B2 (ja) ニューラルネット型追加学習装置
Gholizadeh et al. A comparative study of reinforcement learning algorithms for distribution network reconfiguration with deep Q-learning-based action sampling
JP3435713B2 (ja) 学習パターン選択型追加学習装置
Tao et al. Design of fuzzy controllers with adaptive rule insertion
JP2522102B2 (ja) 空気調和装置の運転制御装置
US5608846A (en) Fuzzy rule generator
US5222194A (en) Neural network with modification of neuron weights and reaction coefficient
JPH0553605A (ja) プロセス制御方法及びその制御装置
JPH06331204A (ja) 空気調和機
JP2673394B2 (ja) 空気調和機制御装置
JPH0991264A (ja) ニューラルネットワーク構造最適化装置ならびに方法
Tan Self-organizing neural architecture for reinforcement learning
Hougen et al. A neural network pole balancer that learns and operates on a real robot in real time
JP3025592B2 (ja) ニューロコンピュータ
JPH05265509A (ja) 学習制御装置
JPH09114503A (ja) 制御装置
JPH07244502A (ja) 制御装置
LU101167B1 (en) Method and System for Predicting the Time Behavior of an Environment using a Sensing Device, a Physical Model and an Artificial Neural Network

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030506

LAPS Cancellation because of no payment of annual fees