WO2005083531A1

WO2005083531A1 - 機器制御方法および機器制御装置

Info

Publication number: WO2005083531A1
Application number: PCT/JP2005/003020
Authority: WO
Inventors: Koji Morikawa
Original assignee: Matsushita Electric Industrial Co., Ltd.
Priority date: 2004-02-27
Filing date: 2005-02-24
Publication date: 2005-09-09
Also published as: JPWO2005083531A1; JP3954087B2; US20060229739A1

Abstract

　記憶部（２３）は、入力部（２１）から得た各種センサ信号と、出力部（２２）から指示した動作内容とを併せて、記憶する。信号識別部（２４）は記憶部（２３）を参照して、ある動作によって出力値が影響を受けたセンサを特定する。動作結果予測部（３０）および動作決定部（２７）は、動作と、特定されたセンサとの関係を表す予測モデルを学習によって作成し、作成した予測モデルを参照して、目標センサの出力が目標値になるような動作を決定する。

Description

明細書

機器制御方法および機器制御装置

技術分野

[0001] 本発明は、少なくとも 1つの機器と複数のセンサとを有するシステム、例えば、家庭用ロボット、情報端末、知能化住宅における家電ネットワーク等において、機器を自律的に制御する技術に関し、特に、予測による機器の動作決定を行う技術に関する背景技術

[0002] 近年、家庭用ロボット、情報端末、家電機器等において、多機能化が進んでいる。

これらの機器は、多彩な機能を実現するために、多様な入力信号を取得するためのセンサを数多く搭載している。そして、所定の入力信号を受けて、所定の処理を行い、出力を決定する。

[0003] また、これらの機器の中には、外部環境の変化に適応すベぐ入力に対する出力を調整するための学習機能を持つものがある。例えば、学習によって入出力関係を再現し、ある入力を受けると、再現した入出力関係に従って、出力を行う方法などがある

[0004] また、入出力関係の再現以上の能力を持たせるために、予測による出力決定機能が搭載されたものもある。これは、各出力に対する結果、すなわちどのような出力を外部に対して行ったら、外部がどのように変化して、結果としてシステムにどのようなフィードバックがある力、を学習するものである。この学習には、ニューラルネットワークや強化学習などの一般的な手法が用いられる。

[0005] 従来の予測型技術としては、例えば、視覚センサと回転角度センサの出力値を入力とし、次のステップにおける視覚センサの出力値の変化を予測するものがある（特許文献 1参照)。ここでは、 1ステップ先の視覚センサの情報を予測して、ロボットの動作と視覚センサの対応付けを学習している。学習手法としては、リカレント型の-ユーラルネットワークが用いられて!/、る。

[0006] また、将来の評価信号を予測するために状態評価器を準備し、どの状態でどの程度の報酬が得られそうかを予測するものもある（特許文献 2参照)。この例では、外部からの評価信号である報酬信号を最大化するために強化学習という手法が用いられており、各行動に対して期待される報酬の大きさを基にして、行動決定がなされている。

特許文献 1：特開 2002— 59384号公報

特許文献 2：特開 2002-189502号公報

発明の開示

発明が解決しょうとする課題

[0007] 予測による出力決定機能では、学習を行う対象となる予測モデル (予測器)が、行動決定のために重要な役割を果たしている。従来の予測型技術では、まず予測モデルに対する入力と出力をシステムの設計者が予め設計し、その入出力関係の下で学習が行われていた。し力しながら、入力信号や出力動作の種類が増加するにつれて、入力と出力の組合せの個数は爆発的に増大する。これに伴い、予測モデルの入出力の組合せの数も同様に増大するため、学習が困難になる可能性が高い。

[0008] この点を、知能化住宅における家電ネットワークを例にとって説明する。

[0009] 近年、住宅に関して、快適な室内環境を求める声とともに、環境意識の高まりなどから省エネルギーの要求も高まっている。快適な室内環境の実現のためには、空調機器や暖房 ·冷房機器など多くの機器を適切に稼動させて、室内の温度や湿度などを適度に保つ必要がある。し力しながら、多くの機器を稼動させることはエネルギー消費の増大につながり、省エネルギーは達成できない。すなわち、住環境の快適性と省エネルギーとはいわゆるトレードオフの関係にあり、両立させるためには何らかの調停が必要になる。

[0010] 一方、最近の住宅では、各種のセンサや機器がネットワークで相互に接続され、機器間で相互に情報を交換することが可能になりつつある。このような状況では、住人が各機器の動作を把握しなくても、各機器は、他の機器の動作状況を認識できる。これは、各機器が協調的に動作することによって、快適性と省エネの両立を実現できる可能性があることを意味する。温度や湿度等住環境に関する機器やセンサとしては、例えば、エアコン、人の居場所を検出するセンサ、調理器具、ガスファンヒータ、加湿器、除湿機等がある。

[0011] 快適性と省エネの両立を実現するためには、様々な状態において、各機器の動作を的確に決定する必要がある。様々な状態とは、各機器の動作状態、各センサの出力値 (現在の部屋の温度や湿度、室内の人の有無など）、外気温、人の帰宅時間などを含む。これらを時系列で変化する複数の変数とみると、時々刻々と変化する膨大な変数の中から適切な関係性を見出し、適切な機器に対して適切な制御指令を生成する、という課題を解決する必要がある。

[0012] 例えば加湿器は、搭載された湿度センサの出力値を、所定値よりも下回れば ONにして、所定値を上回れば OFFにするといつた機能を有するものが多い。ところが、このような加湿器単独の制御だけでは、快適性と省エネの両立を実現することは困難である。例えば、加湿器以外の機器であっても例えばガスファンヒータは、 ON動作のとき、燃焼時に発生する水蒸気によって湿度を上昇させてしまう。このような、機器が本来持つ機能とは別の影響を及ぼしてしまう現象にっ、て、これを加味した制御ルールを予め設定することは極めて困難である。

[0013] また、家庭用ロボットや情報端末でも、搭載されるセンサの種類や提供できる機能の個数は増加しており、動作ルールを設計者が予め記述するために、大量の作業が必要になってきている。また、そのシステムの規模の大きさから、学習方法も適応が困難になっている。

[0014] また、システムが有する機器やセンサの構成は、将来にわたってずっと同じものである保証はなぐ随時、変更されていく。例えば、システム構築時には未開発であつた新たな機器が追加接続されたり、故障のために取り外されたり、新製品に買い換えられたりすることは頻繁に起こりうる。このような場合には、従来のように、システム設計者がモデルの入出力を事前に設定する、ということ自体が極めて困難である。

[0015] 前記の問題に鑑み、本発明は、機器とセンサを有するシステムにおいて、センサの個数が多いために入力と出力との関係を事前に想定するのが困難な場合でも、また、機器構成が変化する場合でも、機器を自律的に制御し、機器の動作を適切に決定可能にすることを課題とする。

課題を解決するための手段 [0016] 本発明は、少なくとも 1つの機器と複数のセンサとを有するシステムにおいて、前記機器の制御を行う方法として、前記機器の動作を、その動作時における前記各センサの出力値の変化とともに記憶部に記録する第 1のステップと、前記記憶部に記録されたデータから、前記動作によって出力値が影響を受けたセンサを特定する第 2のステツプと、前記動作と、当該動作について前記第 2のステップにおいて特定されたセンサとの関係を表す予測モデルを、前記記憶部に記録されたデータ力学習によつて作成する第 3のステップと、目標状態を規定する目標センサと、その出力の目標値とを受ける第 4のステップと、前記第 3のステップにおいて作成された予測モデルの中力前記目標センサを含むものを選択し、選択されたモデルを基にして、前記目標センサの出力が前記目標値になるような動作を決定する第 5のステップとを備えたものである。

[0017] 本発明によると、機器の動作が、その動作時のセンサ出力値の変化とともに記憶部に記録され、この記憶部に記録されたデータから、当該動作によって出力値が影響を受けたセンサが特定される。そして、この動作と特定されたセンサとの関係を表す予測モデルが学習によって作成される。動作決定の際には、作成された予測モデルの中から目標センサを含むものを選択し、選択した予測モデルを基にして、目標センサの出力が目標値になるような動作を決定する。

[0018] すなわち、複数のセンサのうち、その出力値の変化が当該動作と何の関係もないとき、そのセンサ出力は動作決定にとってノイズになるだけである。したがって、システムの出力となる機器の動作について、関係がある入力すなわちセンサ出力を過去の履歴から特定し、関係のない入力を予め除外する。これにより、たとえ大規模なシステムであつても、予測モデルのサイズがコンパクトになり学習のしゃすさが高まるとともに、モデルの精度も向上させることができる。したがって、より適切な動作を決定することが可能になる。

[0019] また、本発明により、従来では考えられな力つたような機器動作とセンサ値との関係性も検出でき、予測モデルとして使用可能になる。

[0020] また、前記第 5のステップにおける動作決定の際に、目標センサの出力値の将来変化をカ卩味するのが好ましい。これにより、システムとは無関係に起きる環境や状況の変化をも考慮した、動作決定を行うことができる。

発明の効果

[0021] 本発明によると、事前に入力を指定しなくても、自律的に、コンパクトで精度の高い予測モデルを作成できるため、多くの入出力を持つ大規模なシステムや、構成の変化が多いシステムであっても、予測に基づぐより適切な動作決定が可能になる。図面の簡単な説明

[0022] [図 1]図 1は、本発明を適用する一例としての知能化住宅の概念図である。

[図 2]図 2は、図 1のエージェントの内部構成を示すブロック図である。

[図 3]図 3は、図 2の動作結果予測部の内部構成を示すブロック図である。

[図 4]図 4は、本発明の実施形態に係る機器制御方法の全体の流れを示すフローチヤートである。

[図 5]図 5は、図 4のステップ SI, S2の詳細の一例を示すフローチャートである。

[図 6]図 6 (a)は-ユーラルネットワークを用いたモデルの記述例、図 6 (b)は IF— THE

Nルールを用いたモデルの記述例である。

[図 7]図 7は、図 6のモデルを学習するためのデータを模式的に示す図である。

[図 8]図 8は、図 4のステップ S3の詳細の一例を示すフローチャートである。

[図 9]図 9は、室内の快適さを考慮した場合の目標状態を示す模式図である。

[図 10]図 10は、図 4のステップ S5の詳細の一例を示すフローチャートである。

[図 11]図 11は、機器およびセンサの構成が変更されたときの動作を示すフローチヤートである。

[図 12]図 12は、本発明の第 2の実施形態に係るエージェントの構成図である。

[図 13]図 13は、シミュレーションで想定した機器、機器動作およびセンサを示す図である。

[図 14]図 14は、シミュレーションで設定した機器動作とセンサ値との関係を示す図である。

[図 15]図 15は、シミュレーションによって得られた機器動作およびセンサ値の時系列変化を示すグラフである。

[図 16]図 16は、図 15のデータから求めた機器動作とセンサ値との相関関係を示す図である。

符号の説明

10 知能化住宅

11、 -17 機器

20, 20A エージェント (機器制御装置)

21 入力部

22 出力部

23 n己' 1思 ρβ

24 信号識別部 (センサ特定部）

25 信号選択部

27, 27Α 動作決定部

28 環境予測部

30 動作結果予測部

31 モデル記憶部

32 モデル選択部

33 予測部

34 評価部

35 モデル作成部

TS 目標状態

CP 現在状態

発明を実施するための最良の形態

本発明の第 1態様は、少なくとも 1つの機器と複数のセンサとを有するシステムにおいて、前記機器の制御を行う方法として、前記機器の動作を、その動作時における前記各センサの出力値の変化とともに記憶部に記録する第 1のステップと、前記記憶部に記録されたデータから、前記動作によって出力値が影響を受けたセンサを特定する第 2のステップと、前記動作と当該動作について前記第 2のステップにおいて特定されたセンサとの関係を表す予測モデルを、前記記憶部に記録されたデータから学習によって作成する第 3のステップと、目標状態を規定する目標センサとその出力の目標値とを受ける第 4のステップと、前記第 3のステップにおいて作成された予測モデルの中から前記目標センサを含むものを選択し、選択されたモデルを基にして、前記目標センサの出力が前記目標値になるような動作を決定する第 5のステップとを備えたものを提供する。

[0025] 本発明の第 2態様は、前記システムが有する機器およびセンサの構成が変更されたとき、前記第 1および第 2のステップを実行し、かつ、前記第 2のステップの処理結果から、新たな予測モデルが必要力否かを判断し、必要と判断したとき、新たな予測モデルを学習によって作成する第 1態様の機器制御方法を提供する。

[0026] 本発明の第 3態様は、前記第 2のステップにおけるセンサの特定を、動作と、センサの出力値の変化との相関を求めることによって、行う第 1態様の機器制御方法を提供する。

[0027] 本発明の第 4態様は、前記第 2のステップにおけるセンサの特定を、ニューラルネットワークを用いて行う第 1態様の機器制御方法を提供する。

[0028] 本発明の第 5態様は、前記第 5のステップは、前記目標センサの出力値の将来変化を加味して、動作の決定を行う第 1態様の機器制御方法を提供する。

[0029] 本発明の第 6態様は、少なくとも 1つの機器と複数のセンサとを有するシステムにおいて、前記機器の制御を行う装置として、前記機器の動作を、その動作時における前記各センサの出力値の変化とともに記憶する記憶部と、前記記憶部に記録されたデータから、前記動作によって出力値が影響を受けたセンサを特定するセンサ特定部と、前記動作と、当該動作について前記センサ特定部によって特定されたセンサとの関係を表す予測モデルを、前記記憶部に記録されたデータから学習によって作成するモデル作成部と、目標状態を規定する目標センサと、その出力の目標値とを受け、前記モデル作成部によって作成された予測モデルの中から、前記目標センサを含むものを選択するモデル選択部と、前記モデル選択部によって選択されたモデルを基にして、前記目標センサの出力が前記目標値になるような動作を決定する動作決定部とを備えたものを提供する。

[0030] 本発明の第 7態様は、前記機器のうちのいずれ力 1つに含まれている第 6態様の機器制御装置を提供する。 [0031] 以下、本発明の実施の形態について、図面を参照しながら説明する。

[0032] (第 1の実施形態）

本発明の第 1の実施形態について、知能化住宅に設置された機器を例にとって説明する。ここで、知能化住宅とは、住宅内にある機器がネットワークを介して接続されており、機器同士で情報のやり取りが可能になっている状態の住宅のことをいう。各機器は、他の機器力もの情報も取得可能であり、これらの情報も、動作の際に用いることがでさるちのとする。

[0033] 図 1は知能化住宅の例を示す概念図である。図 1では主に、住宅内の温度や湿度という住環境の制御に関連した機器を示している。実際の知能化住宅では、住環境の制御に関連した機器以外にも、映像や音響を扱う機器や食事に関する機器など様々な機器が想定されるが、図 1では説明を簡単にするために、知能化住宅におけるネットワークの一部の構成のみを概念的に図示している。

[0034] すなわち図 1 (a)では、知能化住宅 10は、エアコン 11、人間の有無を検出する人センサ 12、コンロ等の調理器具 13、外部から開閉制御が可能な自動窓 14、ガスファンヒータ 15、加湿器 16および除湿機 17を備えている。また、特定の機能は持たないが、各機器 11一 17から情報を収集し、各機器 11一 17に動作指令を出すことができる機器制御装置としてのエージェント 20を備えて、る。

[0035] 図 1 (b)は図 1 (a)の各機器 11一 17が有するセンサと、実行可能な動作の例を示す。各機器 11一 17は、単独で動作するために必要なセンサのみを搭載し、また、その役割を果たすための出力器 (ァクチユエータ）を有する。例えばエアコン 11は、温度センサと湿度センサを有し、また動作として、冷風送風と除湿を行う。

[0036] 図 2は図 1のエージェント 20の内部構成を示すブロック図である。図 2において、入力部 21は外部からの信号を受けるものであり、図 1の知能化住宅 10の例では、エアコン 11など各機器 11一 17が有するセンサの出力信号を入力する。また、各機器 11 一 17の動作内容を示す信号も入力する。出力部 22は、各機器 11一 17に対して動作を指示する。例えばガスファンヒータ 15に対して、燃焼の ONや OFFを指示する。

[0037] 記憶部 23は、入力部 21において検出された各種センサ信号と、出力部 22から指示した動作内容や入力部 21が受けた動作内容とを、併せて、時刻データとともに記憶する。センサ特定部としての信号識別部 24は、記憶部 23に記憶されたセンサ値と動作内容との関係を分析して、各動作について、それと関係の深いセンサを識別してリストアップする。信号選択部 25は、信号識別部 24から受けた情報に基づいて、記憶部 23から読み出したデータから、特定されたセンサに係るデータのみを抽出する。

[0038] 動作結果予測部 30は、動作とセンサ値の変化との関係を表すモデルを作成し、作成したモデルを基にして、目標状態を達成するための動作の候補を選び、その動作の結果を評価する。動作決定部 27は動作結果予測部 30の出力を受けて、目標状態に近づけるための動作を決定し、出力部 22にその動作の内容を伝達する。

[0039] 図 3は図 2の動作結果予測部 30の内部構成を示すブロック図である。図 3において、モデル作成部 35は、信号選択部 25によって選択されたデータを用いて、予測モデルを作成し、モデル記憶部 31に格納する。モデル選択部 32は、目標状態を示す目標センサの種類とその出力の目標値とを受け、目標センサを含む予測モデルをモデル記憶部 31から選択して、予測部 33に渡す。選択されるモデルは複数の場合もありえる。予測部 33は、モデル選択部 32によって選択されたモデルを基にして、予測を行い、センサの出力が目標値になり得るような動作候補を検索する。評価部 34は、各動作候補を評価する。

[0040] 本実施形態に係る機器制御方法について、説明する。ここでは、図 2および図 3に示すエージェント 20において、当該方法が実行されるものとする。

[0041] 図 4は本実施形態に係る機器制御方法の全体の流れを示すフローチャートである。まずステップ S1において、エージェント 20は、複数の機器 11一 17の各動作を、その動作時における各センサの出力値の変化とともに、記憶部 23に記録する。システムが動作し始めて力しばらくの間は、機器の各動作にどのセンサ信号が関係するのか不明なので、データ取得の期間が必要になる。そして、記憶部 23に十分なデータが取得されたと判断したとき、ステップ S2において、信号識別部 24が、機器 11一 1 7の各動作について、関係のあるセンサ、すなわちその出力値が影響を受けたセンサを特定する。

[0042] 図 5はステップ SI, S2の詳細の一例を示すフローチャートである。図 5では、ステツプ Sl l— S14がステップ SIに該当し、ステップ S21— S23がステップ S2に該当している。

[0043] まず、機器の動作を決定し (S 11)、決定された動作を外部 (ここでは住環境）に対して出力する（S12)。これは、エージヱント 20が動作を決定して、出力部 22を介して動作指示を出し、指示を受けた機器が動作を行う場合だけでなぐユーザが機器を操作した場合等も含む。特に最初は、エージェント 20は適当な動作決定方法を持たな!、ので、ユーザの操作によって機器の動作が決定される場合が多、。

[0044] そしてエージェント 20は、出力部 22から指示した動作とともに、その後のセンサの出力値の変化を入力部 21から収集して、記憶部 23に時刻情報とともに格納する。ュ一ザが機器を操作した場合には、当該機器カゝら動作内容を入力部 21を介して受け、センサの出力値の変化とともに記憶部 23に記録する（S 13)。

[0045] ステップ S11— S13を、機器動作とセンサ出力値の変化との関係を表すデータが所定の回数だけ蓄積されるまで、繰り返し実行する (S14)。所定回数だけ蓄積されると次ステップ S 21に進む。なお、データの蓄積が所定回数だけ行われたか否か以外にも、例えば、所定時間が経過したとき、ユーザカゝら指示があつたときなどの場合に、次ステップ S21に進むようにしてもよい。

[0046] ステップ S21では、信号識別部 24が、記憶部 23に蓄えられたデータを用いて、動作と、センサの出力値の変化との相関を計算する。そしてステップ S22において、ステツプ S21での相関計算の結果から、例えば閾値処理によって、当該動作と相関の高いセンサを特定する。信号識別部 24は、特定したセンサの組に関する情報を信号選択部 25に与える。

[0047] なお、動作と関係するセンサを特定する手法としては、相関計算を用いる以外にも、例えば、動作とセンサ値の変化とを-ユーラルネットワークに学習させて、学習後の結合荷重の大きさに基づき、例えば結合荷重の値が小さいセンサは、その動作とは関係がないと判断するといつた手法も考えられる。

[0048] 図 4にもどり、次にステップ S3において、動作と、当該動作に対してステップ S2で特定されたセンサとの関係を表す予測モデルを、学習によって作成する。ここで用いるモデルは、ある機器のある動作によって、センサ値がどのように変化するかを表現可能なものであればよい。例えば、 IF— THENルールや、ニューラルネットワーク、クラスタリングなどを用いることができる。

[0049] 図 6 (a)は-ユーラルネットワークを用いたモデルの記述例であり、ガスファンヒータの動作に対する温度センサおよび湿度センサの出力値の変化をモデルィ匕したものである。ガスファンヒータの ONZOFF動作を入力「1」「0」に対応させ、温度センサと湿度センサの単位時間当たりの変化量を出力とすると、図 6 (a)に示すように、 1入力 2出力の-ユーラルネットワークが必要になる。ここで出力値の範囲は例えば、温度センサ値と湿度センサ値の変化度合を示すために、「ー1」一「 + 1」とする。

[0050] 図 6 (b)は IF— THENルールを用いたモデルの記述例であり、エアコンの動作に対する温度センサの出力値の変化、および、加湿器の動作に対する湿度センサの出力値の変化をモデル化したものである。

[0051] また、図 7は図 6のモデルを学習するためのデータを模式的に示した図である。図 7

(a)は図 6 (a)のモデル 1を学習するためのデータであり、図 7 (b) , (c)は図 6 (b)のモデル 2, 3をそれぞれ学習するためのデータである。

[0052] 図 8はステップ S3の詳細の一例を示すフローチャートである。まず、動作結果予測部 30内のモデル作成部 35が、モデルを準備する（S31)。ここでは、動作を入力とし、特定されたセンサの出力値を出力とする未学習のモデルを作成するものとする。このモデルは、ある動作によってどのようなセンサ値の変化がおき得るかを表現するものであり、順モデルと呼ばれる。

[0053] そして、信号選択部 25が、記憶部 23から入出力関係データを例えば一組ずつ読み出す (S32)。入出力関係データとは、ある時刻における機器の動作とその動作時における各センサの出力値の変化のことであり、読み出されたときは、入出力関係デ一タにはシステムが有する全てのセンサ信号が含まれている。読み出した後、信号選択部 25は、信号識別部 24から受けた情報に基づいて、ステップ S2で特定されたセンサに係るデータのみを入出力関係データ力も抽出する（S33)。これによつて、ステップ S31で準備したモデルの学習のための教師データが準備されたことになる。

[0054] モデル作成部 35は、信号選択部 25から上述の教師データを受け、この教師データを用いて学習を行う（S34)。記憶部 23に蓄積された入出力関係データが全て読み出されるまで、ステップ S32— S34を繰り返し実行する（S35)。この結果、動作と、これに関連するセンサ値との関係を表すモデルが作成される。

[0055] なお、ここでは、動作を入力とし、センサ値を出力とする順モデルを用いるものとした力センサ値を入力とし、動作を出力とするいわゆる逆モデルを学習することも可能である。順モデルを用いた場合、様々な動作を候補として入力してセンサ値の変化を予測し、出力されたセンサ値が目標値に最も近いものを、動作として決定する。一方、逆モデルを用いた場合、目標とするセンサ値を入力すると、望ましい動作が出力される。一般に、逆モデルは、入力と出力とが一対一に対応していない場合は学習が困難であり、順モデルの方力応用範囲が広いという面では好ましいといえる。

[0056] 図 4に戻り、ステップ S4において、外部から、目標状態を規定する目標センサと、その出力の目標値とを受ける。ここでの目標センサおよび目標値は、ユーザの要求によって決定される場合もあり、また、システムがユーザの状態を観察して自律的に判断して決定する場合もある。そして、ステップ S5において、ステップ S3で作成したモデルの中から目標センサを含むものを選択し、選択されたモデルを基にして、目標センサの出力が目標値になるような動作を決定する。

[0057] ここでは、知能化住宅 10に居住するユーザが快適に過ごせる状態を目標状態とするものとする。例えば、人間は、室内の温度と湿度が所定の範囲内にあるとき、快適に感じると考え、温度センサおよび湿度センサを目標センサとし、居住するユーザにとって理想的な温度および湿度の範囲を、温度センサおよび湿度センサの出力の目標値とする。

[0058] 一般には、温度は 15— 20°C、湿度は 40— 60%が理想的であるといわれている。

温度に関しては、それ以上のときは暑さを感じ、それ以下のときは寒さを感じる。また湿度に関しては、快適さという側面以外にも、低すぎると風邪のウィルスが繁殖しやすくなり、一方、高すぎるとカビゃダニが発生しやすくなる、というような居住者の健康面も考慮してもよい。また高すぎると、結露も起こりやすい。

[0059] 図 9は上述した室内の快適さを考慮したときの目標状態を示す模式図である。温度を横軸に、湿度を縦軸にとったグラフにおいて、ノ、ツチを付した部分 TSが、ユーザが快適に感じる範囲すなわち目標状態となる。図 9では、温度 15°C— 20°C、湿度 40— 60%の範囲を目標状態 TSとしてヽる。現在の状態 CPをこの目標状態 TSに変化させることが、機器制御の目的となる。なお、目標状態 TSの範囲は、各家庭の好み、時間帯、季節等に応じて適当に設定すればよい。

[0060] 例えば、冬に外出先力帰宅したときの室内の状態が座標点 CPであった場合、目標状態 TSに変化させるためには、温度、湿度ともに高めなければならない。ところが

、システム内には複数の暖房手段や加湿手段があるため、これらの中から適切な機器を選択して制御する必要がある。

[0061] 図 10はステップ S5の詳細の一例を示すフローチャートである。まず、モデル選択部 32は、モデル記憶部 31に蓄えられた複数のモデルの中から、目標センサを含むモデルを検索する（S51)。該当するモデルが見つ力もな力つたときは処理を終了する（S52)。ここでは、次の 3種類のモデルが検索されたものとする。

モデル 1：ガスファンヒータ 15の動作と、温度センサおよび湿度センサ

モデル 2：エアコン 11の暖房動作と温度センサ

モデル 3：加湿器 16の動作と湿度センサ

[0062] 次に、予測部 33は、モデル選択部 32によって選択されたモデルを基にして、センサの出力が目標値になり得る動作を検索する（S53)。例えば、モデルに対して可能な動作候補を入力し、得られた出力が目標値と一致する、または、目標値に近づく動作候補を、探索する。該当する動作が見つからな力つたときは処理を終了する（S53

) o

[0063] ここでは、各モデル 1一 3を検討した結果、モデル 1を用いたときは温度、湿度ともに目標値の範囲に入ることが分力つたものとする。また、モデル 2を用いた場合は温度のみ、モデル 3を用いた場合は湿度のみしか制御できないが、モデル 2とモデル 3を組み合わせて用いることによって、温度、湿度ともに目標値の範囲に制御可能であることが分力つたものとする。この結果、次の 2つの候補が評価部 34に送られる。

候補 1：ガスファンヒータ ON (モデル 1)

候補 2：エアコン暖房 ON (モデル 2)と加湿器 ON (モデル 3)

[0064] 次に、評価部 34が各動作候補をそれぞれ評価し、その評価結果から、動作決定部 27が、実際に実行する動作を決定する（S55)。ここでは各動作候補を、省エネルギ一コストの観点から評価するものとする。すなわち、評価部 34が各動作候補のェネルギーコストを算出し、動作決定部 27が、エネルギーコストのより少ない動作候補を選択する。

[0065] 具体的には、候補 1に係るガスファンヒータ 15のガス消費量と電力消費量力も算出されるコストと、候補 2に係るエアコン 11の電力消費量と加湿器の電力消費量力算出されるコストとを比較する。ここで例えば、候補 1の方がエネルギーコストが低いものとすると、候補 1に係る動作、すなわちガスファンヒータ 15を ONする動作が、実際の動作として決定される。動作決定部 27は、決定した動作の内容を、出力部 22を介して外部に指示する（S56)。ここでは、最終的な制御対象はガスファンヒータ 15の ON 動作であるので、ガスファンヒータ 15に対してそのスィッチを入れる制御信号を出力する。

[0066] 以上のように本実施形態によると、各機器 11一 17の動作力その動作時のセンサ出力値の変化とともに記憶部 23に記録され、この記憶部 23に記録されたデータから、当該動作によって出力値が影響を受けたセンサが特定される。そして、この動作と特定されたセンサとの関係を表すモデル力学習によって作成される。これにより、たとえ大規模なシステムであっても、予測モデルのサイズがコンパクトになり学習のしゃすさが高まるとともに、予測モデルの精度も向上する。したがって、より適切な動作を決定することが可能になる。

[0067] なお、本実施形態では、エージェント 20が知能化住宅 10内の各機器の制御を行うものとして説明を行った力これ以外の形態でも例えば、知能化住宅 10内のエージェント 20以外の機器が、他の機器のセンサ情報も参照して、本実施形態と同様にして自己の動作または他の機器の動作を制御するようにしてもよい。つまり、エージェントは独立である必要はなぐエージェントの機能はネットワークにつながった機器内に実現されてもよい。

[0068] ガスファンヒータ 15を例にとって説明する。ガスファンヒータ 15が単独で動作する場合、出力とセンサ値との関係は比較的単純であり、燃焼スィッチの ONZOFFによつて温度の上昇 Z下降が決定される。これは、設計者によって予め設計できる範囲である。 [0069] ところが、知能化住宅 10において、ガスファンヒータ 15が他の機器からのセンサ信号も取得できるようになると、ガスファンヒータ 15の燃焼動作によって、多くのセンサの出力値が変化することを認識できる。例えば、湿度センサの出力値が上昇することが認識できたとすると、これによつて、ガスファンヒータ 15は、本来の目的である温度の制御以外にも、湿度の制御も実行可能ということが分かる。ガスファンヒータ 15の動作と湿度センサ値の変化との関係を表す予測モデルが作成されると、「湿度を上げる」という要求に対して、ガスファンヒータ 15の燃焼 ONという動作も選択肢として増えることになる。このように、機器同士がネットワークで接続された構成では、当初想定し得な力つたような予測モデルも作成できるので、ユーザの要求に対してより柔軟な応答が可能になる。

[0070] また、新ヽセンサや機器が追加されたときや、既に接続されて!ヽる機器やセンサが外されたり交換されたりしたときなど、システムが有する機器やセンサの構成が変更された場合には、図 11のように動作すればよい。すなわち、上述したステップ S1 および S2と同様の処理を実行した上で、ステップ S2の処理結果から、新たなモデルが必要カゝ否かを判断する（S61)。この判断は、ある動作に対して、既に特定されているセンサ以外に、出力値が影響を受けたセンサが存在する力否かを確認することによって、行うことができる。そして、必要と判断したときは、新たなモデルを学習によつて作成する（S62)。これにより、機器やセンサの構成が変更されたときでも、すで〖こ作成済みの予測モデルで十分である場合には、モデル作成処理を行わずに済み、処理量が軽減される。

[0071] また、図 11に示すようなモデルィ匕の処理は、新、機器やセンサが追加されたとき以外にも、外部環境の変化が大きいときにも行われるとよい。例えば、気温や湿度の環境に大きな影響を及ぼす外部環境の変化としては、季節の違いによる気温や湿度の変化や、一日のうちの気温や湿度の変動などが考えられる。例えば、窓を開けた場合の温度や湿度の変化は季節によって正反対になると考えられるし、照明器具と明るさのセンサとの関係も外の明るさの影響を強く受けると考えられる。

[0072] 一部の変動に対しては、外気温のセンサなどもネットワークに組み込むことで対応が可能であると考えられるし、また大きな季節の変動に対しては、モデルの切換え等も有効である。この場合は、複数のモデルセットを記憶する部分を準備して、季節に応じてモデルセットを切り替えることで、最初力の再学習を行うことなく対応が可能になる。

[0073] (第 2の実施形態）

本発明の第 2の実施形態では、図 4のフローにおけるステップ S5において、学習した予測モデルを基にして動作を決定する際に、目標センサの出力値の将来変化を加味することを特徴とする。

[0074] 図 12は本実施形態に係るエージェント 20Aの構成図である。図 12において、図 1 と共通の構成要素には同一の符号を付しており、ここではその詳細な説明を省略する。図 1の構成との相違は、機器の動作以外の要因による目標センサの出力値の将来変化を予測する環境予測部 28を有する点である。

[0075] 実際のシステムでは、動作を決定するために、外的要因の予測も必要になる場合がある。例えば、上述の知能化住宅 10の例では、ガスファンヒータ 15を動作させることによって温度センサの出力値は変化するが、温度センサの出力値はそれ以外の外的要因によっても、具体的には例えば、外気温変化やエアコン等の他の機器の動作によって、影響を受ける。これらの要因によるセンサの出力値の将来変化が予測されていれば、より適切な動作を決定することができる。

[0076] 例えば、温度の上昇を目的とする場合に、環境予測部 28が、調理器具 13が現在使用中であることを認識して、室内の気温が上昇するであろうことを予測しているときは、動作結果予測部 30によってガスファンヒータ 15の燃焼動作が決定されたとしても、動作決定部 27Aがその動作を控える、といった制御も可能になる。

[0077] このように、環境予測部 28を設けることによって、目標センサの出力値の将来変化をカロ味することができるので、より適した動作を決定することができる。

[0078] (第 3の実施形態）

上述の実施形態では、知能化住宅における利用を例にとって説明を行ったが、本発明はそれ以外の用途にも適用可能であり、例えば、家庭用ロボットの行動モデルの作成にも応用することができる。

[0079] 一般的な家庭用ロボットは、入力センサとして、映像入力のための視覚センサ、音声入力のための聴覚センサ、ユーザからのロボットへの直接の接触を検出するための触覚センサやスィッチ、距離や障害物を検出するための超音波センサ、各関節の角度を検出するエンコーダ、重心の移動を検出するセンサなどを備えている。また行動のためのァクチユエータとして、移動用の脚やタイヤ、物を動かすためのハンド、見る方向やうなずきなどを表現するための頭部周り、顔の表情を作るためのモータゃライト、ユーザに話しかけるためのスピーカなどを備えている。特に多機能な家庭用口ボットに関しては、入力のためのセンサや出力のためのァクチユエータがそれぞれ数十個以上も搭載されており、その個数は今後ますます増加することが予想される。

[0080] このような家庭用ロボットにおいて、従来のように入出力を固定し、予測モデルを学習しょうとすると、学習が必ずしも収束しないという問題が生じる。

[0081] そこで、家庭用ロボットの制御においても、各出力（ァクチユエータによる動作）に対して影響のあるセンサ信号のみを選択し、選択したセンサ信号を用いて予測モデルを作成することが望ましい。

[0082] 例えば、右手のァクチユエータに対して動作を指示したとき、右手にあるエンコーダの信号はその動作に応じて変化するが、左手や脚部のエンコーダ力ものセンサ信号は変化しな、し、また聴覚センサや超音波センサの信号も変化しな、と考えられる。この点に着目し、本実施形態では、過去の動作とセンサ出力値の変化との関係から、右手のァクチユエータの動作については、右手のエンコーダの信号のみを用いてモデルを作成する。

[0083] ここでは簡単のために分力りやすい例を挙げた力他にも、前進という動作と視覚センサ、スピーカからの合成音声の出力とユーザの反応のセンシングなど、ロボットは、ァクチユエータとセンサとの間の無数の因果関係に包まれていると言える。本実施形態によると、これらの因果関係を過去の動作とセンサ出力値の変化との関係力抽出して、コンパクトでかつ精度の良い予測モデルを学習によって作成することができるので、より適切な動作決定を行うことができる。

[0084] <シミュレーション >

本願発明者らは、図 1に示すような知能化住宅を想定して、機器動作に関係するセンサを特定するためのシミュレーションを実行した。知能化住宅では、各機器やセンサがネットワークで接続されて、るため、各機器の動作やセンサの動作状態は把握できるものとする。各機器が様々に動作をすることによって、センサ値も様々な影響を受ける。この中で、どの機器とどのセンサとが関係するかを特定する。

[0085] 図 13は本シミュレーションにおいて想定した機器、機器動作およびセンサの種類を示す図である。図 13に示すように、機器としては、知能化住宅における温度や湿度に関連する機器として、エアコン (冷房）、 IH調理器、ガスファンヒータ、加湿器および除湿機の 5種類を想定した。また、機器動作として、各機器の ONZOFFに加えて、状態の変化となる、人の有無および窓の開閉を含めて、 7種類を想定した。センサとしては、各機器に搭載されていると想定される 8種類のセンサを想定した。

[0086] 図 14は本シミュレーションにおいて設定した機器動作とセンサとの関係を示す図である。図 14において、機器動作側力もセンサ側に 2種類の矢印が出ており、実線の矢印は増加の影響を示し、点線の矢印は減少の影響を示す。センサには、湿度と温度を計測するものが複数含まれているため、機器動作とセンサとの関係も重複している。なお、本シミュレーションでは、センサ値そのものではなぐセンサ値が増加傾向にある力、減少傾向にあるかを学習の対象にした。これによつて、モデルが簡略にできるが、センサ値そのものを学習の対象としてもよい。

[0087] シミュレーションの目的は、このような設定において、各機器動作と各センサのセンサ値の変動との関係性を抽出することである。

[0088] 図 15は図 13および図 14の設定において、機器の動作とセンサ値との関係をシミュレートした結果を示すグラフである。図 15 (a)は各機器動作の時系列変化である。ここでは、各機器動作が様々な機器操作によって様々に組み合わさって実行される状況を再現するために、ランダムに選択した機器をランダムに ON/OFFする操作を 1 00回にわたり繰り返し実行した。また図 15 (b)は図 15 (b)の各機器動作の時系列変ィ匕に対応したセンサ値の時系列変化である。なお、図 15 (b)では、 8種類のセンサのうち、エアコンの湿度センサ、エアコンの温度センサ、および人センサのみを示している。湿度センサおよび温度センサについては、センサ値に変化がないときは 0、センサ値が増加したときは + 1、センサ値が減少したときは 1の値を取っている。人センサは、人がいるときは 1、人がいないときは 0の値を取っている。 [0089] 図 15をみると分力るように、各機器動作の時系列変化に対応して、センサ値も変動している。図 15のグラフは、図 14の関係性に基づいてランダムな操作系列を与えた場合に得られたものであるが、実際の知能化住宅においても、複数の機器の動作状態に応じてそれぞれのセンサ値は増加したり減少したりすることが想定される。したがつて、知能化住宅の制御システムにおいて、図 15と同様の時系列データが得られると考えて、問題ない。

[0090] 図 16は図 15のデータから、各機器動作とセンサ値の変化とについて、相関を取つた結果である。図 16では、 ±0. 2を閾値にして、正の相関がある組合せ、負の相関がある組合せ、相関がない組合せを、分類して示している。図 16から例えば、ェアコンの ONによって、エアコンの温度センサ、 IH調理器の温度センサ、室内の温度センサ、およびガスファンヒータの温度センサの値は減少する、という関係性が見いだせる。この場合、エアコンと、これら 4個のセンサのみを抽出して学習することによって、関係のモデルが記述できる。また、加湿器の ONによって、エアコンの湿度センサ、加湿器の湿度センサ、および除湿器の湿度センサの値が増加することが分力るので、この場合も、エアコンと同様、これら 3個のセンサのみを抽出して、モデル化すればよい。

[0091] このように、各機器動作と関係のあるセンサが特定された後は、図 6 (a)のような-ュ一ラルネットワーク、図 6 (b)のような IF— THENルール、図 7のようなテーブルなど、関係性を表現する各種の手法を用いることが可能になる。

[0092] また、機器動作と関係のあるセンサの特定を、実行する場合と実行しな!、場合とについて、計算時間の比較を行った。すなわち、ニューラルネットワークを用いた学習を例にとって、図 16のような相関計算によって機器動作とセンサとの関係を求めた後に学習する場合と、相関計算を行わずに図 15のデータから直接学習する場合とで、計算時間を比較した。ニューラルネットワークとしては 3層の階層型を用い、学習法はノックプロパゲーション法を採用し、計算終了条件としては、 50000回の学習または平均二乗誤差が 10— ⁵以下と設定した。

[0093] この結果、相関計算を行った場合は、 372回の学習で学習完了となったのに対して、相関計算を行わずに学習を行った場合は、 50000回の計算を行っても誤差が十分に減少せず、学習が完了しな力つた。

[0094] このことは、機器動作と関係のあるセンサを特定することなぐ機器とセンサとの関係を時系列データ力そのまま学習する場合、機器やセンサがたとえ 7— 8個程度であつても、学習が十分に困難である、ということを示している。機器やセンサの個数がさらに増えた場合は、もちろん学習は実質的に不可能になる。従来は、この学習の困難さのために、設計者が事前に機器とセンサとの関係性をルール等の形で与えるようにしていたが、上述したように、機器の追加や機器構成の変化には対応できない。これに対して、本発明のように、機器動作と関係のあるセンサを特定した上で学習を行う場合には、学習は容易に実行できるし、図 6および図 7のような簡潔な表現も使用可能になる。さらに、機器の追加や機器構成の変化にも、対応できる。

[0095] なお、今回のシミュレーションでは、各機器が持つセンサは主に温度センサと湿度センサであり、それらは一様に機器動作の影響を受けるものと設定したが、実際には各センサの設置場所は異なっている、例えばエアコンの温度センサは天井近くに設置されており、ガスファンヒータの温度センサは床面近くに、 IH調理器の温度センサはキッチンに、という具合である。当然、各機器動作がセンサに与える影響も一様ではなぐそれぞれ違った強さで影響を受けることが予想される。本発明によると、このような場合でも、事前には想定できないような関係性が発見できるの、効率のよいモデル学習が可能になると考えられる。

[0096] 例えば、温度や湿度に関係しな!ヽ機器群も接続された知能化住宅にお!ヽて、ブラズマディスプレイ（PDP)等の映像デバイスの電源が ONの場合に、温度センサのセンサ値が上昇する、というような関係性が検出される可能性がある。この場合は例えば、 PDPの電源が ONになった場合は、他の温度に影響を与える機器動作、例えばファンヒーターの出力を低下させるなどの制御によって、所望の室内温度に保つことができる。

[0097] また、例えば近年家庭に導入が進んで!/、る生ごみ処理機などに、生ごみ検出のためのにおいセンサが搭載されている場合がある。知能化住宅において、このにおいセンサがネットワークに接続されている場合、他の機器の動作、例えば石油ファンヒ一ターの OFF時には、においセンサのセンサ値が上昇する、というような関係性が検出され、モデルとして学習される可能性がある。このモデルから、石油ファンヒーター OFFの場合はにお!/、センサの値が所定範囲を超えることが想定されるので、この場合は、すでに獲得済である、窓を開ける動作とにおいセンサのセンサ値減少とののモデルが起動され、窓を開ける、という制御を、自動的に実現することができる。

[0098] さらに、例えば空気清浄機が知能化住宅のネットワークに追加された場合、新種のセンサである花粉センサがネットワークに追加されることも予想される。花粉センサの追カロにより、すでに設置されている各機器の動作と花粉センサとの関係性を、新たに検出することができる。これにより、例えば、においセンサの値を所定範囲にするために、窓を開けるという制御が実行されていたところ、窓を開けると花粉センサ値が上昇するという関係が新たに検出されたため、窓を開ける代わりに、空気清浄機を動作させる、という制御が選択されるようになる。

[0099] 本発明に対して、事前にルールを設定する従来手法では、 PDPと室温との関係のような想定が困難な関係性の検出や、石油ファンヒーター OFFと生ごみ処理機のにおいセンサとの関係のような、事前には想定されていな力つた新たな種類のセンサが加わった場合における、新たな関係性の検出はできな、。

[0100] 機器をネットワークで接続する場合には、後カゝら機器を購入したり、後から新たな機器が発売されたりと、機器群の構成はネットワークの処理体系を設定した時点では想定が困難なほど変化していくものと考えられる。このような場合に、本発明のような、機器動作とセンサ値との関係性を自律的に発見してモデルィ匕する手法は、特に有効であると考えられる。

産業上の利用可能性

[0101] 本発明では、事前に入出力を設計しなくても、動作とセンサ出力との関係力必要なセンサのみを特定して、自律的に予測モデルを作成できるため、特に、多くの入出力を持つシステムや、構成の変化が多いシステムに対して有効である。具体的には例えば、知能化住宅における家電ネットワーク、多数の入出力を持つ自律型のロボット等に有効である。また、多数のセンサが接続されたセンサネットワークに対するァクチユエータの動作モデルを作成する際にも、応用可能である。

Claims

請求の範囲

[1] 少なくとも 1つの機器と、複数のセンサとを有するシステムにおいて、前記機器の制御を行う方法であって、

前記機器の動作を、その動作時における前記各センサの出力値の変化とともに、記憶部に記録する第 1のステップと、

前記記憶部に記録されたデータから、前記動作によって、出力値が影響を受けたセンサを特定する第 2のステップと、

前記動作と、当該動作について前記第 2のステップにおいて特定されたセンサとの関係を表す予測モデルを、前記記憶部に記録されたデータから、学習によって作成する第 3のステップと、

目標状態を規定する目標センサと、その出力の目標値とを受ける第 4のステップと、前記第 3のステップにおいて作成された予測モデルの中から前記目標センサを含むものを選択し、選択されたモデルを基にして、前記目標センサの出力が前記目標値になるような動作を決定する第 5のステップとを備えた

ことを特徴とする機器制御方法。

[2] 請求項 1において、

前記システムが有する機器およびセンサの構成が変更されたとき、

前記第 1および第 2のステップを、実行し、かつ、

前記第 2のステップの処理結果から、新たな予測モデルが必要か否かを判断し、必要と判断したとき、新たな予測モデルを学習によって作成する

ことを特徴とする機器制御方法。

[3] 請求項 1において、

前記第 2のステップにおけるセンサの特定を、動作と、センサの出力値の変化との相関を求めることによって、行う

ことを特徴とする機器制御方法。

[4] 請求項 1において、

前記第 2のステップにおけるセンサの特定を、ニューラルネットワークを用いて、行うことを特徴とする機器制御方法。

[5] 請求項 1において、

前記第 5のステップは、

前記目標センサの出力値の将来変化を加味して、動作の決定を行う

ことを特徴とする機器制御方法。

[6] 少なくとも 1つの機器と、複数のセンサとを有するシステムにおいて、前記機器の制御を行う装置であって、

前記機器の動作を、その動作時における前記各センサの出力値の変化とともに、記憶する記憶部と、

前記記憶部に記録されたデータから、前記動作によって、出力値が影響を受けたセンサを特定するセンサ特定部と、

前記動作と、当該動作について前記センサ特定部によって特定されたセンサとの関係を表す予測モデルを、前記記憶部に記録されたデータから、学習によって作成するモデル作成部と、

目標状態を規定する目標センサと、その出力の目標値とを受け、前記モデル作成部によって作成された予測モデルの中から、前記目標センサを含むものを選択するモデル選択部と、

前記モデル選択部によって選択されたモデルを基にして、前記目標センサの出力が前記目標値になるような動作を決定する動作決定部とを備えた

ことを特徴とする機器制御装置。

[7] 請求項 6において、

前記機器のうちのいずれか 1つに、含まれている

ことを特徴とする機器制御装置。