JP3435713B2

JP3435713B2 - 学習パターン選択型追加学習装置

Info

Publication number: JP3435713B2
Application number: JP31827592A
Authority: JP
Inventors: 雅彦立石; 宗昭松本
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 1992-11-27
Filing date: 1992-11-27
Publication date: 2003-08-11
Anticipated expiration: 2018-08-11
Also published as: JPH06161982A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、学習パターン選択型追
加学習装置に関し、神経回路網により与えられた学習パ
ターンのうち、ある動作環境において必要なものを適宜
選択し、その選択された学習パターンを用いて学習を行
うことを特徴とする学習パターン選択型追加学習装置に
関する。

【０００２】

【従来の技術】近年、空調機器において、機器の設置現
場の環境や機器使用者の感覚に合致した快適な空調制御
を実現したいという要求がある。その実現手法の一つと
して、適応制御機能（追加学習機能）を持つ神経回路網
による制御方式がある。この神経回路網を用いた制御方
式は、例えば、バックプロパゲーション法により、制御
曲線を学習させる方法である。

【０００３】適応制御を神経回路網で実現しようとする
場合、機器自身が新たに追加学習パターンを獲得し、神
経回路網を再学習する機構を持つ必要がある。しかしな
がら、神経回路網は追加学習パターンのみを学習させる
と、それまで記憶していた学習パターンを忘れてしまう
という欠点がある。そこで、再学習時には、神経回路網
に、追加パターンとそれまでの学習パターンを併せて学
習させている。

【０００４】

【発明が解決しようとする課題】一般に神経回路網は非
常に数多くの学習パターンを使用するため、学習に時間
がかかる。適応制御を行わないのであれば、神経回路網
の特性は固定で良く、学習をワークステーション等の高
速な計算機で行って、その結果をＲＯＭに焼き付けて機
器に組み込むといった方法をとればよい。この場合、学
習時間は問題とならない。

【０００５】しかしながら、適応制御を実現する場合
は、学習を機器内蔵のマイコン等で行うことになる。神
経回路網で制御を実現しようとする場合は、一般に多量
の学習パターンが必要であり、再学習を行う度に、それ
ら多量の学習パターンと追加学習パターンとを同時に学
習させなければならない。そのため、追加学習に非常に
多くの時間がかかってしまい、実用的ではないという問
題があった。

【０００６】そこで、本発明では、上記問題が神経回路
網に多量の学習パターンを一度にまとめて学習させるこ
とが原因となって発生するという点に着目し、ある動作
環境において、必要な学習パターンのみを選択して学習
パターン数を減らすことにより、高速学習を可能とする
追加学習装置を提供することを目的とする。

【０００７】

【課題を解決するための手段】本発明は、上記目的を達
成するために、請求項１においては、環境に関する信号
を入力するセンサ（２）から成る信号入力手段（２）
と、この信号入力手段（２）にて入力される入力信号
と、この入力信号に応じて出力される出力信号とからな
る制御パターンを神経回路網により学習し、前記入力信
号が入力されると、この制御パターンに基づき出力信号
を出力する制御部（５）と、この制御部（５）にて出力
された出力信号を任意の出力信号に変更する出力変更手
段（４）と、この出力変更手段（４）にて前記出力信号
を変更した時に、この変更後の出力信号と、出力変更時
の入力信号とからなる追加制御パターンを記憶する記憶
部（６３．６４）と、前記追加制御パターンの学習時
に、前記入力信号が入力される入力範囲において、追加
制御パターンの入力信号が含まれる一部の入力範囲内の
制御パターンであって、かつ、現在の環境に近い範囲内
のもののみを学習パターンとして選択する選択手段（６
２）と、を備え、前記制御部（５）は、前記選択手段
（６２）にて選択された学習パターンを用いて学習を行
う。また、請求項２においては、前記センサ（２）は複
数のセンサからなり、前記制御部（５）は前記センサ
（２）により入力される環境情報信号から前記出力信号
を計算して出力する適応制御神経回路網（５２）を有
し、前記記憶部は、前記出力変更手段（４）の操作時に
前記環境情報信号と変更後の前記出力信号を一組の追加
学習パターンとして生成する追加学習パターン生成器
（６４）と、前記追加学習パターンおよび標準的な制御
特性を表す標準学習パターンを保持する学習パターンデ
ータベース（６３）とから成り、前記学習パターンデー
タベース（６３）から学習データを一個もしくは複数個
選択する学習パターンセレクタ（６２）から前記選択手
段（６２）が構成され、前記学習パターンセレクタ（６
２）により選択された学習パターンを用いて前記制御部
内の前記適応制御神経回路網（５２）を学習させる。ま
た、請求項３においては、更に学習用神経回路網（６
１）を備え、前記学習パターンセレクタ（６２）により
選択された学習パターンを用いて前記学習用神経回路網
（６１）を学習し、学習完了後、前記適応制御神経回路
網（５２）に前記学習用神経回路網（６１）の学習結果
を複写して学習させる。また、請求項４においては、装
置立ち上げ時に前記センサ（２）にて検知した装置立ち
上げ時環境情報信号から、ある定められた距離範囲内に
ある環境を制御領域として設定し、その後、前記学習パ
ターンセレクタ（６２）に前記制御領域の内部にある学
習パターンを選択させて前記適応制御神経回路網（５
２）を学習させる。また、請求項５においては装置立ち
上げ時に前記センサ（２）にて検知した装置立ち上げ時
環境情報信号から、ある定められた距離範囲内にある環
境を制御領域として設定し、その後、前記学習パターン
セレクタ（６２）に前記制御領域の内部にある学習パタ
ーンを選択させて前記学習用神経回路網（６１）を学習
させ、学習完了後、前記適応制御神経回路網（５２）に
前記学習用神経回路網（６１）の学習結果を複写する。
また、請求項６においては、装置稼動後にある定められ
た時間毎に前記センサ（２）にて時間毎環境情報信号を
検知し、前記装置立ち上げ時環境情報信号と前記時間毎
環境情報信号との間の距離がある定められた距離以上離
れた場合に、前記装置立ち上げ時環境情報信号から設定
された前記制御領域を、前記時間毎環境情報信号から前
記距離範囲内にある制御領域に変更し、その後、前記学
習パターンセレクタ（６２）に前記距離範囲内にある制
御領域の内部にある学習パターンを選択させて前記適応
制御神経回路網（５２）を学習する。また、請求項７に
おいては、装置稼動後にある定められた時間毎に前記セ
ンサ（２）にて時間毎環境情報信号を検知し、前記装置
立ち上げ時環境情報信号と前記時間毎環境情報信号との
間の距離がある定められた距離以上離れた場合に、前記
装置立ち上げ時環境情報信号から設定された前記制御領
域を、前記時間毎環境情報信号から前記距離範囲内にあ
る制御領域に変更し、その後、前記学習パターンセレク
タ（６２）に前記距離範囲内にある制御領域の内部にあ
る学習パターンを選択させて前記学習用神経回路網（６
１）を学習し、学習完了後、前記適応制御神経回路網
（５２）に前記学習用神経回路網（６１）の学習結果を
複写する。また、請求項８においては、前記適応制御神
経回路網（５２）とは別に標準制御特性を実現するモジ
ュールを備え、学習パターンの選択において、選択され
た学習パターンに追加学習パターンが含まれていない場
合、前記適応制御神経回路網（５２）の学習を省略し、
前記標準制御特性を実現するモジュールに制御を切り替
えて出力信号を計算する。

【０００８】

【作用】上記構成よりなる本発明の学習パターン選択型
追加学習装置によれば、ある入力信号に対して制御部に
て出力信号を出力する。この出力信号を変更すると、こ
の変更後の出力と、この時の入力信号とからなる追加制
御パターンを同時に記憶部に記憶する。追加制御パター
ンを学習する時には、この追加制御パターンが含まれる
一部の範囲内の学習パターンのみを選択し、この選択さ
れた学習パターンを基に学習する。そして、この選択に
際して学習パターンの中から現在の環境に近い範囲内の
もののみを選択している。よって、一部の範囲内の学習
パターンを取り出すために、パターンを平均化したりし
て算出しないので、追加学習パターンをより正確に学習
でき、きめ細かな制御が出来る。また、装置立ち上げ時
に前記センサ（２）にて検知した装置立ち上げ時環境情
報信号から、ある定められた距離範囲内にある環境を制
御領域として設定し、その後、前記学習パターンセレク
タ（６２）に前記制御領域の内部にある学習パターンを
選択させて学習させている。更に、装置稼動後にある定
められた時間毎に前記センサ（２）にて時間毎環境情報
信号を検知し、前記装置立ち上げ時環境情報信号と前記
時間毎環境情報信号との間の距離がある定められた距離
以上離れた場合に、前記装置立ち上げ時環境情報信号か
ら設定された前記制御領域を、前記時間毎環境情報信号
から前記距離範囲内にある制御領域に変更し、その後、
前記学習パターンセレクタ（６２）に前記距離範囲内に
ある制御領域の内部にある学習パターンを選択させて学
習させている。これらによって、機器動作中にオンライ
ンで学習でき、現在の環境が大きく変化した時、それに
応じた制御がなされる。また、前記適応制御神経回路網
（５２）とは別に標準制御特性を実現するモジュールを
備え、学習パターンの選択において、選択された学習パ
ターンに追加学習パターンが含まれていない場合、前記
適応制御神経回路網（５２）の学習を省略し、前記標準
制御特性を実現するモジュールに制御を切り替えて出力
信号を計算することによって、不要なオンライン学習を
なくし、制御効率を高めることが出来る。

【０００９】

【実施例】以下に、本発明の学習パターン選択型追加学
習装置を、車両用空調装置の風量制御装置に用いた例に
ついて説明する。

【００１０】図１は本装置の構成例を示すブロック図で
ある。図１に示すように、１は空調装置の設置場所の環
境を示す。この追加学習装置の構成は、本発明の信号入
力手段に相当するセンサ２と、環境モニター３と、本発
明の出力変更手段に相当する風量修正スイッチ４と、本
発明の制御部に相当する風量制御モジュール５と、神経
回路網学習モジュール６と、風量制御装置７とから構成
されている。更に、風量制御モジュール５は、標準制御
モジュール５１と、適応制御用神経回路網５２とから構
成されている。また、神経回路網学習モジュール６は、
学習用神経回路網６１と、本発明の選択主段に相当する
学習パターンセレクタ６２と、本発明の記憶部に相当す
る学習パターンデータベース６３と、追加学習パターン
生成器６４とから構成される。

【００１１】センサ２は、環境１における環境状態を検
出する各種のセンサを示し、環境モニター３と、神経回
路網学習モジュール６を構成する追加学習パターン生成
器６４とに対して、環境状態を示す環境情報信号１１を
送付する。車室内の温度や外気温を検出するためには温
度センサを配し、車室内に侵入する日射量を検出するた
めには日射センサを配する。

【００１２】なお、ある時点での車室内への送風量は、
このセンサ２にて検出した車室内温度、外気温、日射量
等の環境によって決定される。以下、ある時点の環境で
の各環境情報をまとめてｎ次元ベクトルＸ＝ (x₁, x₂,
... , xn) とし、その環境における風量をＹとする。

【００１３】環境モニター３は、風量制御モジュール５
と、神経回路網学習モジュール６とを制御する制御部の
役割を持つ。センサ２からの環境状態を示す環境情報信
号１１を受け取り、風量制御モジュール５にこの環境情
報信号１１を送付する。また、神経回路網学習モジュー
ル６を構成する学習パターンセレクタ６２に対して追加
学習を行う際の学習命令の信号１７を送付する。

【００１４】風量修正スイッチ４は、車両の乗員が、自
動制御された風量を増大、もしくは減少させて修正する
風量修正スイッチである。風量制御モジュール５は、環
境モニター３から送られた環境情報１１を基に、その環
境下での最適な風量を計算し、風量制御装置７に制御信
号１２を送る。風量制御モジュール５内には標準制御モ
ジュール５１、適応制御用神経回路網５２があり、環境
モニター３が場合に応じて両者を切り換えて使用する。
標準制御モジュール５１は、標準的な制御特性を有する
モジュールであり、本装置の立ち上げ（初期化）時、お
よび後述の如く適応制御が不要な時に使用される。適応
制御用神経回路網５２は、次に述べる神経回路網学習モ
ジュール６により設定される神経回路網で、適応制御を
行う場合に使用する。

【００１５】なお、標準的な制御特性とは、一般ユーザ
の好む特性の平均的なものであり、従来の機器の工場出
荷時の特性に相当する。この特性は固定で必ずしも神経
回路網で実現されている必要はない。

【００１６】神経回路網学習モジュール６は、適応制御
用の神経回路網を学習によって求めるためのモジュール
である。学習パターンデータベース６３は、神経回路網
６１の学習に使用するパターンを保持する記憶部であ
る。この学習データベース６３には最初、標準的な風量
制御の入出力関係を表す標準制御パターンが保存されて
いるが、本装置稼動後、使用者により追加学習パターン
が追加されることもある。この追加学習パターンは、使
用者が本装置の風量制御を不快に感じ、風量修正スイッ
チ４を操作して自分が快適と感じるレベルに風量を修正
した時に追加学習パターン生成器６４により生成、保存
される。すなわち、修正が入った場合、追加学習パター
ン生成器６４はその時点の環境情報Ｘと修正後の風量Ｙ
とを組にして、追加学習パターン１６として学習パター
ンデータベース６３に保存する。

【００１７】学習パターンセレクタ６２は、環境モニタ
ー３より学習命令信号１７を受け取ると、後述の方法に
より、学習パターンデータベース６３から学習パターン
を選択して学習用神経回路網６１の学習を行う。学習完
了後、学習用神経回路網６１の特性（シナプス荷重等）
は適応制御用神経回路網５２にロードされ、学習が終了
したことを示す学習完了ステータス１８が環境モニター
３に返される。

【００１８】上記の適応制御用神経回路網５２および学
習用神経回路網６１に用いる神経回路網は、例えば、図
７に示す如く構成される。図７に示すように、神経回路
網８は、ある入力信号を与えた時に出力された出力信号
が正しい信号であるか誤った信号であるかという情報
（教師信号）を入力する事により、神経回路網８内に設
けられた入力層８１、中間層８２、８３、出力層８４内
部の各ニューロン８５間の結合８６の重み（シプナス荷
重）を修正するという誤差逆伝播学習（バックプロパゲ
ーション）機能を備えたものであり、繰り返し’学習’
させることにより、新たな信号が入力されたときに正解
を出力する確率を高めることができるものである。

【００１９】各ニューロン８５間の結合８６の重みは、
結合８６の抵抗値として表されるものであり、重みが大
きい結合８６にてニューロン８５間が結合されている結
合部では、入力側からみて前側の層内のニューロン８５
からの信号が振幅の大きい信号となり、後流側のニュー
ロン８５にその信号が流れる。また、重みが小さい結合
部ではニューロン８５からの信号が振幅の小さい信号と
なり、後流側のニューロン８５にその信号が流れる。

【００２０】次に、本装置の作動について、図４及び図
５に示すフローチャートに沿って説明する。図４に装置
全体の制御手順のフローチャートを、また図５に神経回
路網学習の手順のフローチャートを示す。

【００２１】本装置を制御する環境モニター３が、図４
に示すように、ステップ１００にて制御を開始すると、
先ず、ステップ１１０にて、車室内温度、外気温度、日
射量等の環境１の環境情報を、センサ２により検出す
る。

【００２２】ステップ１２０では、標準制御モジュール
５１を風量制御装置７に接続し、標準制御モジュール５
１内の標準制御パターンに基づき制御できるようにす
る。ステップ１３０では、標準制御モジュール５１に、
センサ２からの環境情報信号１１を入力し、標準制御パ
ターンに基づき送風量を計算する。

【００２３】次のステップ１４０では、ステップ１３０
にて計算された送風量に基づき、制御信号１２を風量制
御装置７に送信する。ステップ１５０では、学習用神経
回路網６１にて学習パターンセレクタ６２の選択した学
習パターンを学習する。この学習方法については、図５
に示すフローチャートに基づき、後に詳細に説明する。
なお、最初にこのステップに移行してきた時には、学習
は行われない。

【００２４】ステップ１６０では、標準制御モジュール
５１もしくは適応制御用神経回路網５２に、センサ２か
らの環境情報信号１１を入力し、何れかの制御パターン
に基づき送風量を計算する。

【００２５】ステップ１７０では、ステップ１６０にて
計算された送風量に基づき、制御信号１２を風量制御装
置７に送信する。ステップ１８０では、１０秒間経過し
てから、次のステップ１９０に移行する。

【００２６】ステップ１９０では、ステップ１１０と同
様にして、環境モニター３がセンサ２から環境１をモニ
タリングする。このモニタリングは、ステップ１８０に
より定期的に時間（例えば、１０秒間）をあけて行われ
る。

【００２７】ステップ２００では、ステップ１９０にて
モニタリングされた環境１が天候の変化等によって変化
し、現在の制御領域（後述）から外れることが予測され
た場合、「ＹＥＳ」と判断してステップ１５０に移行し
て、制御領域を設定し直し、学習パターンセレクタ６２
に学習命令信号１７を送って再度学習を行わせる。学習
完了後、適応制御用神経回路網５２に新しい学習結果を
ロードする。一方、環境１が制御領域から外れない時に
は「ＮＯ」と判断して、ステップ１６０に移行する。

【００２８】次に、学習パターンセレクタ６２が学習パ
ターンデータベース６３から学習パターンを選択する方
法を図２に基づき説明する。環境モニター３は本装置立
ち上げ（初期化）時に、その時点の環境情報Ｘの制御領
域を設定する。そして、学習パターンセレクタ６２に学
習命令信号１７を送る。学習命令信号１７には、環境情
報Ｘ、および制御領域の情報が含まれている。制御領域
は、環境情報Ｘから、ユークリッド距離が、ある定めら
れた半径Ｒ内にある領域とする。

【００２９】ところで、学習パターンデータベース６３
の保持する学習パターン総数をＭとおくと、データベー
ス６３内のｋ番目の学習パターンである環境情報Ｘk
（１≦ｋ≦Ｍ）は、Ｘk ＝（x₁ ^k，x₂ ^K ... ,xn^k）が
風量Ｙk となるとする。

【００３０】ある環境情報Ｘから、各学習パターンＸk
とのユークリッド距離をdk(X) とおく。すると、このユ
ークリッド距離は次式の如く示される。

【００３１】

【数１】学習パターンセレクタ６２は学習命令信号１７を受け取
ると、環境情報Ｘと各学習パターンＸk とのユークリッ
ド距離dk(X) を計算し、dk(X) が制御領域内に入るもの
を選択して、学習用神経回路網６１に送る。すなわち、
dk(X) ≦Ｒを満たす学習パターンを選択する。

【００３２】なお、上述の例ではdk(X) としてユークリ
ッド距離を使用したので、制御領域はｎ次元における半
径Ｒの球体となるが、制御領域の形状は必ずしも球体で
ある必要はなく、問題に応じて適切なものを選択する。

【００３３】次に、上記説明した図４に示すフローチャ
ートのステップ１５０での神経回路網学習の方法につい
て説明する。この学習方法は、図５のフローチャートに
示される。

【００３４】ステップ１５１にて、上述の如く、dk(X)
≦Ｒを満たす学習パターンＸk を選択する。ステップ１
５２では、追加学習パターン１６が存在するのか否かを
判断する。追加学習パターン１６が存在する時には、
「ＹＥＳ」と判断し、ステップ１５３に移行する。追加
学習パターン１６が存在しない時には、「ＮＯ」と判断
してステップ１５６に移行する。

【００３５】ステップ１５３に制御が移行すると、この
ステップにて、学習用神経回路網６１の学習をバックプ
ロパゲーション法により行う。この学習は学習用神経回
路網６１の誤差が、ある定められた許容誤差の範囲内に
収まった時点で完了する。

【００３６】ステップ１５４では、学習用神経回路網６
１にて学習した結果を適応制御用神経回路網５２に複写
（ロード）する。次のステップ１５５では、適応制御用
神経回路網５２を風量制御装置７に接続し、この適応制
御用神経回路網５２により風量制御する。

【００３７】一方、ステップ１５６は、ステップ１５２
にて追加学習パターン１６が存在しないと判断された時
に移行するステップであり、このステップでは、追加学
習パターン１６が存在しない制御領域内にて制御を行う
ので、標準制御モジュール５１を風量制御装置７に接続
し、標準制御モジュール５１にて風量制御する。

【００３８】ステップ１５７に制御が移行すると、図４
に示すフローチャートのステップ１６０に移行する。な
お、上記の制御において、学習後の制御特性をロードし
た直後に、この制御特性が急変しない工夫が必要となる
が、その一方法として、制御領域の一部をオーバーラッ
プさせることにより、制御特性をなめらかに接続するこ
とが可能である。

【００３９】図３にその一例を示す。環境情報がＸから
Ｘ’に変化したときの制御領域の移動を示す。環境情報
Ｘ’がＸの制御領域の境界に対し、ある定められた距離
ε以内に近づいたとき、Ｘ’を中心とする制御領域を新
たに設定する方法をとれば、上述のオーバーラップを実
現することができ、新しい神経回路網をロードした直後
の制御特性の急変を防止することができる。

【００４０】特殊な場合として、制御領域内に追加学習
パターンがなく、標準制御パターンしか存在しない時
は、当該制御領域内の制御特性は標準のままで良く、標
準制御モジュール５１をそのまま使用する。この場合、
適応制御を行う必要はなく、学習パターンセレクタ６２
は再学習を行わない。適応制御が必要であるのか、それ
とも不要であるのかの情報は学習完了ステータス１８に
より返される。環境モニタ３は学習完了ステータス１８
を参照し、適応制御が必要な場合は適応制御用神経回路
網５２を選択して使用し、適応制御が不要な場合は、標
準制御モジュール５１を選択して使用する。

【００４１】上記の方法によれば、制御領域内の一部の
学習パターンのみを学習するので、全部の学習パターン
を学習させる場合に比べ、学習時間が非常に短時間で済
む。また制御を制御領域内の処理に特化させることが出
来るので、制御領域内での理想的な制御を実現すること
が可能である。

【００４２】なお、上記の実施例では、学習用神経回路
網６１にて学習し、その学習結果を適応制御用神経回路
網５２にロードする構成としたが、学習用神経回路網６
１を無くし、適応制御用神経回路網５２にて学習する構
成としても良い。

【００４３】また、本発明の追加学習装置にて追加学習
をおこなっている時には、適応制御用神経回路網５２に
て制御を行わず、追加学習を始める直前の出力値にて制
御する。本発明によれば、学習時間を短くすることがで
きるので、学習中は追加学習を始める直前の出力値にて
制御しておき、学習の終了後に適応制御用神経回路網５
２にロードしてから、この適応制御用神経回路網５２に
て制御するように構成することができる。

【００４４】次に、従来の如く、（Ａ）学習パターンの
選択なし（全学習パターンをまとめて学習）の場合と、
（Ｂ）学習パターンの選択あり（本発明の適用例）の場
合との２つの場合について神経回路網の学習を行い、学
習回数、計算時間（ＣＰＵ時間）の比較を行った実験の
結果について説明する。

【００４５】実験方法は以下の通りである。図６に示し
た風量制御特性を神経回路網に学習させる。なお、この
特性は実験のために仮想的に設定したものであり、実際
の空調制御で使用している特性とは細部において異な
る。風量は車内温度、外気温の関数であり、１から１０
の連続値をとる。この例では環境情報を表すベクトルＸ
は二次元となる。ここで、環境情報Ｘにおける風量Ｙを
f(x)で表す。

【００４６】環境Ｘ＝（車内温度，外気温）の条件を次
の範囲内にて定める。車内温度は２５〜４５°Ｃの範囲
内の温度とし、外気温は２５〜４５°Ｃの範囲内の温度
とする。また、この時の出力である風量Ｙ＝f(X)は、１
〜１０［Ｖ］の範囲内の電圧とする。

【００４７】学習パターンは、車内温度と、外気温の範
囲２５〜４５°Ｃを１°Ｃおきにプロットしたときの風
量とする。すると、車内温度Ｔｒは、２５，２６，…，
４５°Ｃの如く、２１ポイントからなり、外気温Ｔｓ
も、２５，２６，…，４５°Ｃの如く、２１ポイントか
らなる。出力である風量Ｙの値は、各ポイントに対して
一つの出力値であるので、学習パターンの総数は２１×
２１＝４４１個となる。なお、この時、風量はｆ（Ｔ
ｒ，Ｔｓ）という関数からなる。

【００４８】実験に使用した神経回路網は、図７に示す
四層型の神経回路網である。各層のユニット数は以下の
通りである。この実験では、出力層８４が１個のニュー
ロン８５からなり、第２中間層８３が６個、第１中間層
８２が６個、入力層８１が２個のニューロン８５からな
る。また、本学習実験に使用したパラメ−タは、学習率
を０．３、慣性モーメントを０．９とし、出力値Ｙの許
容誤差を±０．５〔Ｖ〕とした。学習アルゴリズムは前
述の如くバックプロパゲーション法である。

【００４９】次に、実験結果を示す。（Ａ）学習パター
ンの選択なしの時は、図７の神経回路網８に、４４１個
の全学習パターンを一度に学習させた時である。この時
には、学習を２９６６回繰り返し行うことにより、許容
誤差を満足でき、この時のＣＰＵでの計算時間は、２２
分１３秒である。

【００５０】本発明の適用例である（Ｂ）学習パターン
の選択ありの時には、先ず、図８に示すように、車内温
度、外気温の二次元入力データ空間を５℃間隔で区切
り、４×４＝１６個の正方形の制御領域を設ける。上記
に説明したように、制御領域は必ずしも円形である必要
はなく、本実験では、正方形の制御領域とする。

【００５１】各領域には境界上の点も含めて６×６＝３
６個の学習パターンが属する。図７の神経回路網を用
い、各領域それぞれにつき、学習を行ったときの学習回
数、ＣＰＵでの計算時間を図９に示す。

【００５２】平均学習回数は93.8回となり、またＣＰＵ
での計算時間の平均は2.67秒となる。この結果に示され
るように、従来の（Ａ）学習パターンの選択なしの時に
比べて、本発明の追加学習装置によれば、学習回数、Ｃ
ＰＵでの計算時間の双方につき、大幅な削減が出来る。

【００５３】従って、追加学習パターンが各領域内にて
追加された後においても、学習パターンを選択した時の
方が大幅な時間の削減をすることができる。なお、この
実験では神経回路網として四層型ＢＰネットワークを使
用したが、本発明は他のモデルの神経回路網にも同様に
適用が可能である。

【００５４】また、本実施例では、環境情報が変化する
と、この環境情報に従って制御領域を変化させる構成と
したが、図８に示すように、最初から制御領域を分割し
ておき、この制御領域内に対応する環境情報毎に追加学
習パターンの学習を行う構成としても良い。

【００５５】

【発明の効果】上記説明したように、本発明の学習パタ
ーン選択型追加学習装置によれば、追加制御パターンの
含まれる一部の範囲内の制御パターンのみを選択し、こ
の制御パターンに基づき学習する。

【００５６】従って、全体の入力範囲の制御パターンに
基づき学習するのと比べると、学習時の制御パターン数
が減少するので、学習時間を短縮することができる。

【図面の簡単な説明】

【図１】本発明の追加学習装置のシステム図を示す。

【図２】環境Ｘにおける制御領域を示す図である。

【図３】環境Ｘ内における制御領域の移動を示す図であ
る。

【図４】装置全体の制御手順を示すフローチャートであ
る。

【図５】神経回路網の学習の手順を示すフローチャート
である。

【図６】風量制御特性を示す図である。

【図７】神経回路網を示す図である。

【図８】制御領域を示す図である。

【図９】（ａ）、（ｂ）は、本発明の適用実験結果を示
す図である。

【符号の説明】

２センサ３環境モニター４風量修正スイッチ５風量制御モジュール６神経回路網学習モジュール７風量制御装置５２適応制御用神経回路網６３学習パターンデータベース

───────────────────────────────────────────────────── フロントページの続き (56)参考文献特開平４−195667（ＪＰ，Ａ) 特開平４−299443（ＪＰ，Ａ) 特開昭62−59998（ＪＰ，Ａ) 特開平５−342188（ＪＰ，Ａ) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06N 1/00 - 7/08 G06G 7/60 F24F 11/00 - 11/08 G05B 13/00 - 13/04 ＪＳＴファイル（ＪＯＩＳ) ＣＳＤＢ（日本国特許庁)

Claims

(57)【特許請求の範囲】

【請求項１】環境に関する信号を入力するセンサ
（２）から成る信号入力手段（２）と、この信号入力手段（２）にて入力される入力信号と、こ
の入力信号に応じて出力される出力信号とからなる制御
パターンを神経回路網により学習し、前記入力信号が入
力されると、この制御パターンに基づき出力信号を出力
する制御部（５）と、この制御部（５）にて出力された出力信号を任意の出力
信号に変更する出力変更手段（４）と、この出力変更手段（４）にて前記出力信号を変更した時
に、この変更後の出力信号と、出力変更時の入力信号と
からなる追加制御パターンを記憶する記憶部（６３．６
４）と、前記追加制御パターンの学習時に、前記入力信号が入力
される入力範囲において、追加制御パターンの入力信号
が含まれる一部の入力範囲内の制御パターンであって、
かつ、現在の環境に近い範囲内のもののみを学習パター
ンとして選択する選択手段（６２）と、を備え、前記制御部（５）は、前記選択手段（６２）に
て選択された学習パターンを用いて学習を行う学習パタ
ーン選択型追加学習装置。
【請求項２】前記センサ（２）は複数のセンサからな
り、前記制御部（５）は前記センサ（２）により入力される
環境情報信号から前記出力信号を計算して出力する適応
制御神経回路網（５２）を有し、前記記憶部は、前記出力変更手段（４）の操作時に前記
環境情報信号と変更後の前記出力信号を一組の追加学習
パターンとして生成する追加学習パターン生成器（６
４）と、前記追加学習パターンおよび標準的な制御特性
を表す標準学習パターンを保持する学習パターンデータ
ベース（６３）とから成り、前記学習パターンデータベース（６３）から学習データ
を一個もしくは複数個選択する学習パターンセレクタ
（６２）から前記選択手段（６２）が構成され、前記学
習パターンセレクタ（６２）により選択された学習パタ
ーンを用いて前記制御部内の前記適応制御神経回路網
（５２）を学習させることを特徴とする請求項１記載の
空調制御装置。
【請求項３】更に学習用神経回路網（６１）を備え、
前記学習パターンセレクタ（６２）により選択された学
習パターンを用いて前記学習用神経回路網（６１）を学
習し、学習完了後、前記適応制御神経回路網（５２）に
前記学習用神経回路網（６１）の学習結果を複写して学
習させることを特徴とする請求項２記載の空調制御装
置。
【請求項４】装置立ち上げ時に前記センサ（２）にて
検知した装置立ち上げ時環境情報信号から、ある定めら
れた距離範囲内にある環境を制御領域として設定し、そ
の後、前記学習パターンセレクタ（６２）に前記制御領
域の内部にある学習パターンを選択させて前記適応制御
神経回路網（５２）を学習させることを特徴とする請求
項２記載の空調制御装置。
【請求項５】装置立ち上げ時に前記センサ（２）にて
検知した装置立ち上げ時環境情報信号から、ある定めら
れた距離範囲内にある環境を制御領域として設定し、そ
の後、前記学習パターンセレクタ（６２）に前記制御領
域の内部にある学習パターンを選択させて前記学習用神
経回路網（６１）を学習させ、学習完了後、前記適応制
御神経回路網（５２）に前記学習用神経回路網（６１）
の学習結果を複写することを特徴とする請求項３記載の
空調制御装置。
【請求項６】装置稼動後にある定められた時間毎に前
記センサ（２）にて時間毎環境情報信号を検知し、前記
装置立ち上げ時環境情報信号と前記時間毎環境情報信号
との間の距離がある定められた距離以上離れた場合に、
前記装置立ち上げ時環境情報信号から設定された前記制
御領域を、前記時間毎環境情報信号から前記距離範囲内
にある制御領域に変更し、その後、前記学習パターンセ
レクタ（６２）に前記距離範囲内にある制御領域の内部
にある学習パターンを選択させて前記適応制御神経回路
網（５２）を学習することを特徴とする請求項４記載の
空調制御装置。
【請求項７】装置稼動後にある定められた時間毎に前
記センサ（２）にて時間毎環境情報信号を検知し、前記
装置立ち上げ時環境情報信号と前記時間毎環境情報信号
との間の距離がある定められた距離以上離れた場合に、
前記装置立ち上げ時環境情報信号から設定された前記制
御領域を、前記時間毎環境情報信号から前記距離範囲内
にある制御領域に変更し、その後、前記学習パターンセ
レクタ（６２）に前記距離範囲内にある制御領域の内部
にある学習パターンを選択させて前記学習用神経回路網
（６１）を学習し、学習完了後、前記適応制御神経回路
網（５２）に前記学習用神経回路網（６１）の学習結果
を複写することを特徴とする請求項５記載の空調制御装
置。
【請求項８】前記適応制御神経回路網（５２）とは別
に標準制御特性を実現するモジュールを備え、学習パタ
ーンの選択において、選択された学習パターンに追加学
習パターンが含まれていない場合、前記適応制御神経回
路網（５２）の学習を省略し、前記標準制御特性を実現
するモジュールに制御を切り替えて出力信号を計算する
ことを特徴とする請求項２ないし７のいずれか一項に記
載の空調制御装置。