JP7080294B2 - 情報処理装置、情報処理プログラム及び情報処理システム - Google Patents
情報処理装置、情報処理プログラム及び情報処理システム Download PDFInfo
- Publication number
- JP7080294B2 JP7080294B2 JP2020190185A JP2020190185A JP7080294B2 JP 7080294 B2 JP7080294 B2 JP 7080294B2 JP 2020190185 A JP2020190185 A JP 2020190185A JP 2020190185 A JP2020190185 A JP 2020190185A JP 7080294 B2 JP7080294 B2 JP 7080294B2
- Authority
- JP
- Japan
- Prior art keywords
- air
- space
- air conditioning
- information
- person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Investigating Or Analyzing Materials Using Thermal Means (AREA)
- Air Conditioning Control Device (AREA)
- Image Analysis (AREA)
Description
本発明は、情報処理装置、情報処理プログラム及び情報処理システムに関する。
従来、人物にとって快適な空間を提供するための技術が知られている。例えば、空間の環境因子(温度と湿度)の値の複数の組み合わせに対して、同一空間に居る複数のユーザが快適に感じる確率の平均に基づいて作成された確率合成マップにしたがってエアコンを制御する技術が知られている。
しかしながら、上記の従来技術では、確率合成マップは単なる平均値にしたがった指標にすぎないため、必ずしも個々人の快適さを考慮した空調制御ができるとは限らない。
実施形態に係る情報処理装置は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された前記個々の人物にとっての前記空間の快適さに基づいて、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、を備える。
以下に、本願に係る情報処理装置、情報処理プログラム及び情報処理システムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理プログラム及び情報処理システムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
〔1.はじめに〕
従来、人の暑さ寒さに関する温熱環境における快適さに基づいて空調制御する技術が知られている。例えば、空間の快適さを評価する指標として、人体の熱収支に影響する6つの要素からなるPMV(Predicted Mean Vote)が知られている。PMVは、温度[℃]、湿度[%]、(熱)放射[℃]、気流[m/s]の4つの環境要素と、着衣量[clo]、代謝量(活動量)[met]の2つの人的要素から算出される。ここで、温度、湿度、放射、気流の4つの環境要素は、空間に対するセンシングによって得ることができる。一方、着衣量、代謝量(活動量)の2つの人的要素は、外気温などから推定される推定値が用いられるのが一般的であった。そのため、従来の手法に基づいて算出されたPMV値は、必ずしも実際に人が感じている空間の快適さを反映しているとは限らなかった。すなわち、従来は、空間の快適さを精度よく推定できるとは限らなかった。
〔1.はじめに〕
従来、人の暑さ寒さに関する温熱環境における快適さに基づいて空調制御する技術が知られている。例えば、空間の快適さを評価する指標として、人体の熱収支に影響する6つの要素からなるPMV(Predicted Mean Vote)が知られている。PMVは、温度[℃]、湿度[%]、(熱)放射[℃]、気流[m/s]の4つの環境要素と、着衣量[clo]、代謝量(活動量)[met]の2つの人的要素から算出される。ここで、温度、湿度、放射、気流の4つの環境要素は、空間に対するセンシングによって得ることができる。一方、着衣量、代謝量(活動量)の2つの人的要素は、外気温などから推定される推定値が用いられるのが一般的であった。そのため、従来の手法に基づいて算出されたPMV値は、必ずしも実際に人が感じている空間の快適さを反映しているとは限らなかった。すなわち、従来は、空間の快適さを精度よく推定できるとは限らなかった。
そこで、本願発明に係る発明者らは、機械学習モデルを用いて、RGBカメラ、赤外線カメラおよび環境センサによって検出された空間のセンサ情報から空間の快適さを推定する技術(以下、提案技術ともいう)を提案している。具体的には、提案技術は、空間を撮像した画像に含まれる人物が撮像された領域(以下、人物領域ともいう)に関する情報に基づいて空間の快適さを推定する。例えば、提案技術は、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域に関する情報に基づいて空間の快適さを推定する。このように、提案技術は、姿勢推定処理を用いることにより、画像の中から人物領域を精緻に特定することができるので、推定対象となる人物の着衣量や代謝量(活動量)に関する情報を精度よく推定することができる。また、提案技術は、着衣量や代謝量(活動量)といった2つの人的要素を精度よく推定することができるため、空間の快適さの推定精度を向上させることができる。
また、従来、複数の人物が所在する空間の空調制御では、利用者のリモコン操作等による任意の温度設定がなされていた。このような任意の温度設定は、集団の総意を得ておらず、集団にとって快適な空調制御が実現されるとは限らなかった。
これに対し、実施形態に係る情報処理装置100は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。また、情報処理装置100は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。
このように、情報処理装置100は、個々の人物にとっての空間の快適さを精度よく推定することができるので、個々の人物が集まった集団にとっての空間の快適さを反映する指標としての空調に対する集団の報酬を精度よく算出することができる。また、情報処理装置100は、精度の高い集団の報酬に基づいて、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを強化学習することができるので、精度の高い空調制御モデルを生成することができる。これにより、情報処理装置100は、個々の人物にとっての空間の快適さに基づく集団にとって最適な快適さを実現する空調制御を適切に行うことが可能となる。したがって、情報処理装置100は、集団の快適さを考慮した空調制御を可能とすることができる。
なお、人物領域は、情報処理装置100が推定対象の人物を特定可能な領域であれば、任意の領域であってよい。例えば、人物領域は、人物を示す領域に加えて、その人物の周囲の空間を示す領域を含んでもよい。例えば、人物領域は、人物が撮像された領域に加えて、その人物の周囲の空間が撮像された領域を含んでもよい。例えば、人物領域は、人物の周囲に存在する家具等を示す領域を含んでもよい。なお、以下では、空間に所在する人物のことを「利用者」と記載する場合がある。
〔2.情報処理システムの構成〕
まず、図1を用いて、実施形態に係る情報処理システムの構成について説明する。図1は、実施形態に係る情報処理システムの構成例を示す図である。情報処理システム1には、空調装置10と、センサ装置20と、情報処理装置100とが含まれてよい。空調装置10と、センサ装置20と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続されてよい。なお、情報処理システム1には、任意の数の空調装置10と任意の数のセンサ装置20と任意の数の情報処理装置100とが含まれてもよい。
まず、図1を用いて、実施形態に係る情報処理システムの構成について説明する。図1は、実施形態に係る情報処理システムの構成例を示す図である。情報処理システム1には、空調装置10と、センサ装置20と、情報処理装置100とが含まれてよい。空調装置10と、センサ装置20と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続されてよい。なお、情報処理システム1には、任意の数の空調装置10と任意の数のセンサ装置20と任意の数の情報処理装置100とが含まれてもよい。
空調装置10は、空間の空気の温度や湿度などを調整する装置である。例えば、空調装置10は、情報処理装置100による空調制御の対象となる各空間に設置された空調機器(例えば、エアコン)であってよい。また、空調装置10は、IoT(Internet of Things)技術により、他の装置と通信可能であってよい。空調装置10は、情報処理装置100の制御に従って制御対象となる空間の空調を調整することができる。具体的には、空調装置10は、空間に設置された空調機器による空調を制御する空調制御情報を情報処理装置100から受信することができる。例えば、空調装置10は、空調制御情報として、冷房設定による空調を行うことを示す冷房情報または暖房設定による空調を行うことを示す暖房情報を受信してよい。また、空調装置10は、空調制御情報として、空間の設定温度を示す温度情報および空間の設定湿度を示す湿度情報を受信してよい。続いて、空調装置10は、情報処理装置100から受信した空調制御情報に従って、空間の空調を行う。例えば、空調装置10は、冷房情報(暖房情報)を受信すると、空間の温度や湿度を冷房設定(暖房設定)によって調整してよい。また、空調装置10は、温度情報を受信すると、空間の温度が設定温度や設定湿度に保たれるように調整してよい。また、空調装置10は、湿度情報を受信すると、空間の湿度が設定湿度に保たれるように調整してよい。なお、以下では、空調装置10のことを「空調機器」と記載する場合がある。
なお、図1に示すように、空調装置10が設置された空間に応じて、空調装置10を空調装置10-1~10-2のように区別して説明する場合がある。例えば、空調装置10-1は、会議室R1に設置されている空調装置10であってよい。また、例えば、空調装置10-2は、会議室R2に設置されている空調装置10であってよい。また、以下では、空調装置10-1~10-2について、特に区別なく説明する場合には、空調装置10と記載する。
センサ装置20は、空間の物理的な状態や空間に存在する利用者の物理的な状態を検知する装置である。センサ装置20は、空間の物理的な状態や空間に存在する利用者の物理的な状態を示す情報をセンサ情報として取得してよい。例えば、センサ装置20は、画像センサであってよい。例えば、センサ装置20は、RGBカメラであってよい。すなわち、センサ装置20は、例えば、空間に存在する利用者を被写体として含むRGB画像をセンサ情報として取得してよい。また、例えば、センサ装置20は、赤外線カメラであってよい。すなわち、センサ装置20は、例えば、空間に存在する利用者を被写体として含むサーマル画像をセンサ情報として取得してよい。また、センサ装置20は、環境センサであってよい。例えば、センサ装置20は、USB型の環境センサであってよい。すなわち、センサ装置20は、例えば、空間の温度や湿度などの環境に関する情報(以下、環境情報ともいう)をセンサ情報として取得してよい。また、センサ装置20は、取得したセンサ情報を情報処理装置100に送信する。なお、以下では、利用者のことを「人物」と記載する場合がある。また、センサ装置20が取得する環境情報は、後述する快適さの判定において利用可能な情報であればよく、上記の例に限定されない。例えば、センサ装置20は、環境情報として気圧や照度などの任意の情報を取得してよい。
なお、図1に示すように、センサ装置20が設置された空間に応じて、センサ装置20をセンサ装置20-1~20-2のように区別して説明する場合がある。例えば、センサ装置20-1は、会議室R1に設置されているセンサ装置20である。また、例えば、センサ装置20-2は、会議室R2に設置されているセンサ装置20である。また、以下では、センサ装置20-1~20-2について、特に区別なく説明する場合には、センサ装置20と記載する。
情報処理装置100は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。また、情報処理装置100は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。
〔3.情報処理装置の構成〕
次に、図2を用いて、実施形態に係る情報処理装置100の構成について説明する。図2は、実施形態に係る情報処理装置100の構成例を示す図である。情報処理装置100は、通信部110と、記憶部120と、制御部130とを有してよい。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示させるための表示部(例えば、液晶ディスプレイ等)を有してもよい。
次に、図2を用いて、実施形態に係る情報処理装置100の構成について説明する。図2は、実施形態に係る情報処理装置100の構成例を示す図である。情報処理装置100は、通信部110と、記憶部120と、制御部130とを有してよい。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示させるための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、空調装置10やセンサ装置20との間で情報の送受信を行う。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、空調装置10やセンサ装置20との間で情報の送受信を行う。
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。
記憶部120は、センサ装置20によって検出されたセンサ情報を記憶してよい。例えば、記憶部120は、利用者が所在する空間を撮像したRGB画像およびサーマル画像と空間を識別する識別情報とを対応付けて記憶してよい。また、記憶部120は、利用者が所在する空間の温度および湿度に関する情報と空間を識別する識別情報とを対応付けて記憶してよい。
また、記憶部120は、各種の学習モデルに関する情報を記憶してよい。例えば、記憶部120は、快適さ推定モデルに関する情報を記憶してよい。また、記憶部120は、空調制御モデルに関する情報を記憶してよい。例えば、記憶部120は、各種の学習モデルの接続係数に関する情報を記憶してよい。
(制御部130)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
制御部130は、取得部131と、推定部132と、空調制御部133と、決定部134と、学習部135とを機能部として有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部130の内部構成は、図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、各機能部は、制御部130の機能を示したものであり、必ずしも物理的に区別されるものでなくともよい。
(取得部131)
取得部131は、人物が所在する空間の物理的な状態や空間に所在する人物の物理的な状態を示すセンサ情報をセンサ装置20から取得してよい。具体的には、取得部131は、センサ情報の一例として、複数の人物が所在する空間に設置されたRGBカメラから複数の人物が所在する空間を撮像したRGB画像を取得してよい。続いて、取得部131は、RGB画像を取得すると、取得したRGB画像と空間を識別する識別情報とを対応付けて記憶部120に格納してよい。例えば、取得部131は、空調機器による空調が行われる前(以下、「空調前」と記載する場合がある)の空間を撮像したRGB画像と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調機器による空調が行われた後(以下、「空調後」と記載する場合がある)の空間を撮像したRGB画像と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得されたRGB画像を区別して記憶部120に格納してよい。
取得部131は、人物が所在する空間の物理的な状態や空間に所在する人物の物理的な状態を示すセンサ情報をセンサ装置20から取得してよい。具体的には、取得部131は、センサ情報の一例として、複数の人物が所在する空間に設置されたRGBカメラから複数の人物が所在する空間を撮像したRGB画像を取得してよい。続いて、取得部131は、RGB画像を取得すると、取得したRGB画像と空間を識別する識別情報とを対応付けて記憶部120に格納してよい。例えば、取得部131は、空調機器による空調が行われる前(以下、「空調前」と記載する場合がある)の空間を撮像したRGB画像と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調機器による空調が行われた後(以下、「空調後」と記載する場合がある)の空間を撮像したRGB画像と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得されたRGB画像を区別して記憶部120に格納してよい。
また、取得部131は、センサ情報の一例として、複数の人物が所在する空間に設置された赤外線カメラから複数の人物が所在する空間を撮像したサーマル画像を取得してよい。サーマル画像は、例えば、空間の温度分布を示す画像であってよい。続いて、取得部131は、サーマル画像を取得すると、取得したサーマル画像と空間を識別する識別情報とを対応付けて記憶部120に格納してよい。例えば、取得部131は、空調前の空間を撮像したサーマル画像と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調後の空間を撮像したサーマル画像と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得されたサーマル画像を区別して記憶部120に格納してよい。
また、取得部131は、センサ情報の一例として、複数の人物が所在する空間に設置された環境センサから複数の人物が所在する空間の環境情報を取得してよい。具体的には、例えば、取得部131は、複数の人物が所在する空間に設置されたセンサ装置20から複数の人物が所在する空間の温度および湿度に関する情報を環境情報として取得してよい。続いて、取得部131は、取得した環境情報と空間を識別する識別情報とを対応付けて記憶部120に格納してよい。例えば、取得部131は、空調前の環境情報と空調前の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。また、取得部131は、空調後の空間の環境情報と空調後の空間を識別する識別情報とを対応付けて記憶部120に格納してよい。すなわち、取得部131は、空調の前後においてそれぞれ取得された環境情報を区別して記憶部120に格納してよい。
また、取得部131は、各種の機械学習モデル(以下、「学習モデル」と記載する場合がある)に関する情報を外部の情報処理装置から取得してよい。具体的には、取得部131は、学習モデルの一例として、RGB画像が入力情報として入力された場合に、RGB画像の特徴を示す特徴ベクトルV1を出力情報として出力する学習モデルM1を取得してよい。例えば、取得部131は、ImageNet等の画像データベースに登録されている多数の(例えば、1000万枚を超える)画像から画像に写っている物体名(クラス)を推定するよう学習された学習モデルM1を取得してよい。例えば、取得部131は、畳み込みニューラルネットワークである学習モデルM1を取得してよい。例えば、取得部131は、Resnet50である学習モデルM1を取得してよい。例えば、取得部131は、RGB画像が入力情報として入力された場合に、RGB画像の特徴を示す2048次元の特徴ベクトルV1を出力情報として出力する機械学習モデルM1を取得してよい。続いて、取得部131は、学習モデルM1を取得すると、学習モデルM1に関する情報と学習モデルM1を識別する識別情報「M1」とを対応付けて記憶部120に格納してよい。
また、取得部131は、学習モデルの一例として、サーマル画像が入力情報として入力された場合に、サーマル画像の特徴を示す特徴ベクトルV2を出力情報として出力する学習モデルM2を取得してよい。例えば、取得部131は、ImageNet等の画像データベースに登録されている多数の(例えば、1000万枚を超える)サーマル画像からサーマル画像に写っている物体名(クラス)を推定するよう学習された学習モデルM2を取得してよい。例えば、取得部131は、畳み込みニューラルネットワークである学習モデルM2を取得してよい。例えば、取得部131は、Resnet50である学習モデルM2を取得してよい。例えば、取得部131は、サーマル画像が入力情報として入力された場合に、サーマル画像の特徴を示す2048次元の特徴ベクトルV2を出力情報として出力する機械学習モデルM2を取得してよい。続いて、取得部131は、学習モデルM2を取得すると、学習モデルM2に関する情報と学習モデルM2を識別する識別情報「M2」とを対応付けて記憶部120に格納してよい。
また、取得部131は、学習モデルの一例として、環境情報が入力情報として入力された場合に、環境情報の特徴を示す特徴ベクトルV3を出力情報として出力する学習モデルM3を取得してよい。具体的には、例えば、取得部131は、環境情報として空間の温度および湿度に関する情報が入力情報として入力された場合に、空間の温度および湿度に関する情報の特徴を示す特徴ベクトルV3を出力情報として出力する学習モデルM3を取得してよい。例えば、取得部131は、環境情報から環境情報の特徴を示す特徴ベクトルを推定するよう学習された学習モデルM3を取得してよい。例えば、取得部131は、ニューラルネットワークである学習モデルM3を取得してよい。例えば、取得部131は、環境情報が入力情報として入力された場合に、環境情報の特徴を示す2048次元の特徴ベクトルV3を出力情報として出力する機械学習モデルM3を取得してよい。続いて、取得部131は、学習モデルM3を取得すると、学習モデルM3に関する情報と学習モデルM3を識別する識別情報「M3」とを対応付けて記憶部120に格納してよい。
また、取得部131は、学習モデルの一例として、空間に所在する個々の人物の特徴を示す特徴ベクトルV4が入力情報として入力された場合に、個々の人物にとっての空間の快適さを出力情報として出力する快適さ推定モデルM4を取得してよい。例えば、取得部131は、特徴ベクトルV4が入力情報として入力された場合に、快適さを示す各カテゴリに特徴ベクトルV4が分類される確率を出力情報として出力するよう学習された快適さ推定モデルM4を取得してよい。例えば、取得部131は、特徴ベクトルV4が入力情報として入力された場合に、「寒い」カテゴリに分類される確率と「暑い」カテゴリに分類される確率と「普通」カテゴリに分類される確率を出力情報として出力する快適さ推定モデルM4を取得してよい。
なお、快適さを示すカテゴリは、任意の分類であってよく、上記の例に限定されない。例えば、快適さの分類は、「涼しい」、「暖かい」など他の分類を含んでよい。また、取得部131は、特徴ベクトルV4が入力情報として入力された場合に、特徴ベクトルV4が分類される快適さのカテゴリのラベルを出力情報として出力するよう学習された快適さ推定モデルM4を取得してよい。例えば、取得部131は、特徴ベクトルV4が入力情報として入力された場合に、快適さを示す各カテゴリに特徴ベクトルV4が分類される確率が最も高いカテゴリのラベルを出力情報として出力するよう学習された快適さ推定モデルM4を取得してよい。続いて、取得部131は、快適さ推定モデルM4を取得すると、快適さ推定モデルM4に関する情報と快適さ推定モデルM4を識別する識別情報「M4」とを対応付けて記憶部120に格納してよい。
また、取得部131は、RGB画像が入力情報として入力された場合に、RGB画像の特徴を示す特徴ベクトルを出力情報として出力する学習モデルM5を取得してよい。例えば、取得部131は、上述した学習モデルM1と同様の学習モデルM5を取得してよい。続いて、取得部131は、学習モデルM5を取得すると、学習モデルM5に関する情報と学習モデルM5を識別する識別情報「M5」とを対応付けて記憶部120に格納してよい。
また、取得部131は、サーマル画像が入力情報として入力された場合に、サーマル画像の特徴を示す特徴ベクトルを出力情報として出力する学習モデルM6を取得してよい。例えば、取得部131は、上述した学習モデルM2と同様の学習モデルM6を取得してよい。続いて、取得部131は、学習モデルM6を取得すると、学習モデルM6に関する情報と学習モデルM6を識別する識別情報「M6」とを対応付けて記憶部120に格納してよい。
(推定部132)
推定部132は、空間を撮像した画像に含まれる人物が撮像された領域(以下、人物領域ともいう)に関する情報に基づいて空間の快適さを推定する。例えば、推定部132は、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域に関する情報に基づいて空間の快適さを推定してよい。具体的は、例えば、推定部132は、複数の人物が所在する空間を撮像した空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された人物領域であって、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域に関する情報に基づいて、個々の人物にとっての空間の快適さを推定してよい。例えば、推定部132は、空調前の複数の人物が所在する空間を撮像した画像のうち個々の人物が撮像された領域である人物領域に関する情報に基づいて、空調前の個々の人物にとっての空間の快適さを推定してよい。また、推定部132は、空調後の複数の人物が所在する空間を撮像した画像のうち個々の人物が撮像された領域である人物領域に関する情報に基づいて、空調後の個々の人物にとっての空間の快適さを推定してよい。
推定部132は、空間を撮像した画像に含まれる人物が撮像された領域(以下、人物領域ともいう)に関する情報に基づいて空間の快適さを推定する。例えば、推定部132は、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域に関する情報に基づいて空間の快適さを推定してよい。具体的は、例えば、推定部132は、複数の人物が所在する空間を撮像した空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された人物領域であって、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域に関する情報に基づいて、個々の人物にとっての空間の快適さを推定してよい。例えば、推定部132は、空調前の複数の人物が所在する空間を撮像した画像のうち個々の人物が撮像された領域である人物領域に関する情報に基づいて、空調前の個々の人物にとっての空間の快適さを推定してよい。また、推定部132は、空調後の複数の人物が所在する空間を撮像した画像のうち個々の人物が撮像された領域である人物領域に関する情報に基づいて、空調後の個々の人物にとっての空間の快適さを推定してよい。
ここで、姿勢推定処理は、動画や静止画から人物の姿勢を推定し、人物領域を特定する処理であってよい。姿勢推定処理は、任意の公知技術により実現されてよい。例えば、姿勢推定処理は、姿勢推定(Pose Estimation)の技術(以下、姿勢推定技術ともいう)を用いた画像の処理により実現されてよい。例えば、姿勢推定処理は、姿勢推定モデルと呼ばれる深層学習モデルを用いて、動画や静止画から人物や動物の姿勢(骨格)を推定する姿勢推定技術により実現されてよい。なお、1枚の画像に複数の人物が写っている場合には、姿勢推定処理により、複数の人物について特徴点を検出して、複数の人物の姿勢を推定してもよい。すなわち、情報処理装置100は、複数の人物について、それぞれの人物が所在する空間の快適さをそれぞれ推定してもよい。
例えば、姿勢推定モデルの一例として、画像に含まれる人物の身体の特徴を示す特徴点(キーポイントともいう)を推定し、特徴点を結んだ人物の姿勢を検出するものがある。例えば、姿勢推定モデルの一例として、画像に含まれる人物の身体の特徴点として、人物の身体の関節の位置を示す関節点を推定し、関節点を連結して生成される人物の身体の骨格を示す骨格モデルを人物の姿勢として検出するものがある。このように、姿勢推定技術を用いると、画像中の人物の身体の関節点や骨格モデルを推定することができるので、画像中の人物の身体の部位を精緻に推定することができる。例えば、特徴点を検出するタイプの姿勢推定モデルの中には、画像中の人物の身体の30種類の部位を推定可能なものがある。具体的には、特徴点を検出するタイプの姿勢推定モデルを用いると、画像中の人物の身体の部位として、頭、目(右、左)、耳(右、左)、鼻、首、肩(右、中央、左)、肘(右、左)、背骨、手首(右、左)、手(右、左)、親指(右、左)、手先(右、左)、腰(右、中央、左)、膝(右、左)、足首(右、左)、足(右、左)を特定することができる。
また、姿勢推定モデルの一例として、DensePose(参考URL:http://openaccess.thecvf.com/content_cvpr_2018/html/Guler_DensePose_Dense_Human_CVPR_2018_paper.html)が知られている。DensePoseは、2次元の画像中の人物の人物領域を検出し、検出した人物領域に対応する3次元身体表面モデルを生成する技術である。より具体的には、DensePoseは、RGB画像を入力として、RGB画像中の人物の3次元表面のUV座標を推定する技術である。DensePoseを用いると、2次元の画像に写る人物領域から3次元身体表面のUV座標を推定することができるので、2次元の画像に写る人物領域の各人体パーツ(人物の身体の部位)を精緻に推定することができる。DensePoseを用いると、画像中の人物の身体の24種類の部位を推定することができる。具体的には、DensePoseを用いると、RGB画像から、画像中の人物の身体の部位として、頭(左、右)、首、胴体、腕(左、右/上、前/前、後)、脚(左、右/太もも、ふくらはぎ/前、後)、手(左、右)、足(左、右)を特定することができる。
より具体的には、推定部132は、複数の人物が所在する空間を撮像した画像の一例として、複数の人物が所在する空間を撮像したRGB画像のうち個々の人物が撮像された領域である人物領域に関する情報に基づいて、個々の人物にとっての空間の快適さを推定してよい。例えば、推定部132は、人物領域に関する情報の一例として、複数の人物が所在する空間を撮像したRGB画像のうち個々の人物が撮像された領域である人物領域であって、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域の特徴を示す特徴ベクトルV1を生成してよい。そして、推定部132は、生成した特徴ベクトルV1に基づいて、個々の人物にとっての空間の快適さを推定してよい。例えば、推定部132は、特徴ベクトルV1に基づいて、空間に所在する個々の人物の特徴を示す特徴ベクトルV4を生成してよい。続いて、推定部132は、特徴ベクトルV4から個々の人物にとっての空間の快適さを推定してよい。
例えば、推定部132は、記憶部120を参照して、複数の人物が所在する空間を撮像したRGB画像と学習モデルM1に関する情報を取得してよい。続いて、推定部132は、RGB画像を取得すると、姿勢推定処理に基づいてRGB画像のうち個々の人物が撮像された領域である人物領域を特定してよい。続いて、推定部132は、人物領域を特定すると、学習モデルM1を用いて、人物領域から、人物領域の特徴を示す特徴ベクトルV1を生成してよい。推定部132は、RGB画像に複数の人物が写っている場合は、RGB画像のうち複数の人物それぞれが撮像された領域である人物領域それぞれを特定してよい。続いて、推定部132は、複数の人物領域それぞれについて、学習モデルM1を用いて、複数の人物領域それぞれの特徴を示す特徴ベクトルを生成してよい。
また、推定部132は、複数の人物が所在する空間を撮像した画像の一例として、複数の人物が所在する空間を撮像したサーマル画像のうち個々の人物が撮像された領域である人物領域であって、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域に関する情報に基づいて、個々の人物にとっての空間の快適さを推定してよい。例えば、推定部132は、人物領域に関する情報の一例として、複数の人物が所在する空間を撮像したサーマル画像のうち個々の人物が撮像された領域である人物領域であって、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域の特徴を示す特徴ベクトルV2を生成してよい。そして、推定部132は、生成した特徴ベクトルV2に基づいて、個々の人物にとっての空間の快適さを推定してよい。例えば、推定部132は、特徴ベクトルV2に基づいて、空間に所在する個々の人物の特徴を示す特徴ベクトルV4を生成してよい。続いて、推定部132は、特徴ベクトルV4から個々の人物にとっての空間の快適さを推定してよい。
例えば、推定部132は、記憶部120を参照して、複数の人物が所在する空間を撮像したサーマル画像を取得してよい。続いて、推定部132は、サーマル画像を取得すると、姿勢推定処理に基づいてサーマル画像のうち個々の人物が撮像された領域である人物領域を特定してよい。より具体的には、推定部132は、同じ空間を撮影したRGB画像とサーマル画像とを重ね合わせて、RGB画像に対する姿勢推定処理に基づいて特定された人物領域と重複するサーマル画像の領域をサーマル画像の人物領域として特定してよい。続いて、推定部132は、サーマル画像の人物領域を特定すると、学習モデルM2を用いて、サーマル画像の人物領域から、サーマル画像の人物領域の特徴を示す特徴ベクトルV2を生成してよい。また、推定部132は、サーマル画像に複数の人物が写っている場合は、RGB画像とサーマル画像とを重ね合わせることにより、サーマル画像のうち複数の人物それぞれが撮像された領域である人物領域それぞれを特定してよい。続いて、推定部132は、複数の人物領域それぞれについて、学習モデルM2を用いて、複数の人物領域それぞれの特徴を示す特徴ベクトルを生成してよい。
また、推定部132は、複数の人物が所在する空間の環境情報の特徴を示す特徴ベクトルV3を生成してよい。例えば、推定部132は、記憶部120を参照して、複数の人物が所在する空間の環境情報を取得してよい。続いて、推定部132は、環境情報を取得すると、学習モデルM3を用いて、環境情報から、環境情報の特徴を示す特徴ベクトルV3を生成してよい。そして、推定部132は、生成した特徴ベクトルV3に基づいて、個々の人物にとっての空間の快適さを推定する。例えば、推定部132は、特徴ベクトルV3に基づいて、空間に所在する個々の人物の特徴を示す特徴ベクトルV4を生成してよい。続いて、推定部132は、特徴ベクトルV4から個々の人物にとっての空間の快適さを推定してよい。
より具体的には、推定部132は、特徴ベクトルV1~V3を生成すると、生成した特徴ベクトルV1~V3に基づいて、特徴ベクトルV1~V3の特徴を示す特徴マップMP1を生成してよい。続いて、推定部132は、特徴マップMP1を生成すると、特徴マップMP1に対する最大値プーリングにより、特徴マップMP1から特徴マップMP1の特徴を示す特徴ベクトルV4を生成してよい。例えば、推定部132は、最大値プーリングにより、特徴マップMP1の特徴を示す2048次元の特徴ベクトルV4を生成してよい。このようにして、推定部132は、空間に所在する個々の人物の特徴を示す特徴ベクトルV4を生成してよい。続いて、推定部132は、特徴ベクトルV4を生成すると、快適さ推定モデルM4を用いて、特徴ベクトルV4から個々の人物にとっての空間の快適さを推定してよい。
例えば、推定部132は、特徴ベクトルV4を快適さ推定モデルM4の入力情報として入力してよい。続いて、推定部132は、空間に所在する個々の人物にとっての快適さを快適さ推定モデルM4の出力情報として出力してよい。例えば、推定部132は、特徴ベクトルV4が快適さ推定モデルM4の入力情報として入力された場合に、快適さを示す3つのカテゴリのうち特徴ベクトルV4が分類される確率が最も高いカテゴリのラベルを出力情報として出力してよい。例えば、推定部132は、特徴ベクトルV4が入力情報として入力された場合に、空間の温度が低いことを示す「寒い」カテゴリと、空間の温度が高いことを示す「暑い」カテゴリと、空間の温度がちょうどよいことを示す「普通」カテゴリのうち、特徴ベクトルV4が分類される確率が最も高いカテゴリのラベルを出力情報として出力してよい。
(空調制御部133)
空調制御部133は、空調制御モデルM7を用いて空調を制御する。空調制御部133は、学習部135によって強化学習された空調制御モデルM7を用いて空調を制御する。具体的には、空調制御部133は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて決定された空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値と空調機器により空調が行われた際の空調制御情報とに基づいて強化学習された空調機器による空調を制御する空調制御情報を出力する空調制御モデルM7を用いて空調を制御する。
空調制御部133は、空調制御モデルM7を用いて空調を制御する。空調制御部133は、学習部135によって強化学習された空調制御モデルM7を用いて空調を制御する。具体的には、空調制御部133は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて決定された空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値と空調機器により空調が行われた際の空調制御情報とに基づいて強化学習された空調機器による空調を制御する空調制御情報を出力する空調制御モデルM7を用いて空調を制御する。
より具体的には、空調制御部133は、空調制御モデルM7の入力情報として空間を撮像した画像に関する情報が空調制御モデルM7に入力された場合に、空調制御モデルM7の出力情報として空調制御モデルM7から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部133は、空間を撮像した画像に関する情報の一例として、空間を撮像したRGB画像に関する情報が空調制御モデルM7に入力された場合に、空調制御モデルM7の出力情報として空調制御モデルM7から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部133は、RGB画像に関する情報の一例として、複数の人物が所在する空間を撮像したRGB画像の特徴を示す特徴ベクトルV5を生成してよい。例えば、空調制御部133は、記憶部120を参照して、複数の人物が所在する空間を撮像したRGB画像と学習モデルM5に関する情報を取得してよい。続いて、空調制御部133は、RGB画像を取得すると、学習モデルM5を用いて、RGB画像から、RGB画像の特徴を示す特徴ベクトルV5を生成してよい。そして、空調制御部133は、生成した特徴ベクトルV5に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルV7を生成してよい。続いて、空調制御部133は、空調制御モデルM7を用いて、特徴ベクトルV7から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。
また、空調制御部133は、空間を撮像した画像に関する情報の一例として、空間を撮像したサーマル画像に関する情報が空調制御モデルM7に入力された場合に、空調制御モデルM7の出力情報として空調制御モデルM7から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部133は、サーマル画像に関する情報の一例として、複数の人物が所在する空間を撮像したサーマル画像の特徴を示す特徴ベクトルV6を生成してよい。例えば、空調制御部133は、記憶部120を参照して、複数の人物が所在する空間を撮像したサーマル画像と学習モデルM6に関する情報を取得してよい。続いて、空調制御部133は、サーマル画像を取得すると、学習モデルM6を用いて、サーマル画像から、サーマル画像の特徴を示す特徴ベクトルV6を生成してよい。そして、空調制御部133は、生成した特徴ベクトルV6に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルV7を生成してよい。続いて、空調制御部133は、空調制御モデルM7を用いて、特徴ベクトルV7から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。
また、空調制御部133は、複数の人物が所在する空間の温度および湿度に関する情報が空調制御モデルM7に入力された場合に、空調制御モデルM7の出力情報として空調制御モデルM7から出力される空調制御情報に基づいて空調を制御する。例えば、空調制御部133は、空間の温度および湿度に関する情報の一例として、複数の人物が所在する空間の温度および湿度に関する情報の特徴を示す特徴ベクトルV3を生成してよい。例えば、空調制御部133は、記憶部120を参照して、複数の人物が所在する空間の温度および湿度に関する情報と学習モデルM3に関する情報を取得してよい。続いて、空調制御部133は、温度および湿度に関する情報を取得すると、学習モデルM3を用いて、温度および湿度に関する情報から、温度および湿度に関する情報の特徴を示す特徴ベクトルV3を生成してよい。そして、空調制御部133は、生成した特徴ベクトルV3に基づいて、複数の人物が所在する空間の特徴を示す特徴ベクトルV7を生成してよい。続いて、空調制御部133は、空調制御モデルM7を用いて、特徴ベクトルV7から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。
より具体的には、空調制御部133は、特徴ベクトルV3、V5~V6を生成すると、生成した特徴ベクトルV3、V5~V6に基づいて、特徴ベクトルV3、V5~V6の特徴を示す特徴ベクトルV7を生成してよい。例えば、空調制御部133は、生成した特徴ベクトルV3、V5~V6に基づいて、特徴ベクトルV3、V5~V6の特徴を示す特徴マップMP2を生成してよい。続いて、空調制御部133は、特徴マップMP2を生成すると、特徴マップMP2に対する最大値プーリングにより、特徴マップMP2から特徴マップMP2の特徴を示す特徴ベクトルV7を生成してよい。例えば、空調制御部133は、最大値プーリングにより、特徴マップMP2の特徴を示す2048次元の特徴ベクトルV7を生成してよい。このようにして、空調制御部133は、複数の人物が所在する空間の特徴を示す特徴ベクトルV7を生成してよい。続いて、空調制御部133は、特徴ベクトルV7を生成すると、空調制御モデルM7を用いて、特徴ベクトルV7から複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を推定してよい。より具体的には、空調制御部133は、特徴ベクトルV7を空調制御モデルM7の入力情報として入力してよい。続いて、空調制御部133は、複数の人物が所在する空間に設置された空調機器による空調を制御する空調制御情報を空調制御モデルM7の出力情報として出力してよい。
続いて、空調制御部133は、空調制御モデルM7から出力された空調制御情報に基づいて、空間の空調を制御してよい。具体的には、空調制御部133は、空調制御モデルM7から出力された空調制御情報を空調制御の対象となる空間に設置された空調装置10に送信してよい。このように、空調制御部133は、空調制御モデルM7を用いて、空間の空調を制御してよい。
(決定部134)
決定部134は、推定部132により推定された空間の快適さに基づいて、空調に対する報酬を示す値を決定する。例えば、決定部134は、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定してよい。具体的には、例えば、決定部134は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定してよい。例えば、決定部134は、空調機器による空調前の個々の人物にとっての空間の快適さと、空調機器による空調後の個々の人物にとっての空間の快適さとの比較に基づいて、集団の報酬を示す値を決定してよい。具体的には、例えば、決定部134は、空調前の個々の人物にとっての空間の快適さと、空調後の個々の人物にとっての空間の快適さとの比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定してよい。続いて、決定部134は、個々の報酬を示す値に基づいて、集団の報酬を示す値を決定してよい。この点について、図3を用いて詳しく説明する。図3は、一実施形態に係る決定部134により決定される個々の報酬の一例を示す表である。
決定部134は、推定部132により推定された空間の快適さに基づいて、空調に対する報酬を示す値を決定する。例えば、決定部134は、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定してよい。具体的には、例えば、決定部134は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定してよい。例えば、決定部134は、空調機器による空調前の個々の人物にとっての空間の快適さと、空調機器による空調後の個々の人物にとっての空間の快適さとの比較に基づいて、集団の報酬を示す値を決定してよい。具体的には、例えば、決定部134は、空調前の個々の人物にとっての空間の快適さと、空調後の個々の人物にとっての空間の快適さとの比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定してよい。続いて、決定部134は、個々の報酬を示す値に基づいて、集団の報酬を示す値を決定してよい。この点について、図3を用いて詳しく説明する。図3は、一実施形態に係る決定部134により決定される個々の報酬の一例を示す表である。
図3において、空調制御前の状態とは、空調機器が、空調制御部133の空調制御情報に従って、複数の人物が所在する空間の空調を行う前の状態を示す。一方、空調制御後の状態とは、空調機器が、空調制御部133の空調制御情報に従って、複数の人物が所在する空間の空調を行った後の状態を示す。
また、図3において、個々の人物にとって空間の快適さが「快適」な状態であるとは、推定部132によって推定された快適さのカテゴリが「普通」カテゴリであることを示す。また、図3において、個々の人物にとって空間の快適さが「不快」な状態であるとは、推定部132によって出力された快適さのカテゴリが「寒い」カテゴリまたは「暑い」カテゴリのうちいずれかであることを示す。
図3に示す例では、決定部134は、個々の人物にとって、空調前の空間の快適さが「快適」な状態であって、空調後の空間の快適さが「快適」な状態である場合には、空調機器による空調に対する個々の報酬を示す値を正の報酬である「+1」に決定してよい。一方、決定部134は、個々の人物にとって、空調前の空間の快適さが「不快」な状態であって、空調後の空間の快適さが「快適」な状態である場合には、空調機器による空調に対する個々の報酬を示す値を正の報酬である「+3」に決定してよい。このように、決定部134は、空調後の個々の人物にとっての空間の快適さが個々の人物にとって快適な状態を示す場合には、正の報酬として個々の報酬を示す値を決定してよい。また、決定部134は、決定部134は、空調後の個々の人物にとっての空間の快適さが個々の人物にとって快適な状態を示す場合において、空調前の個々の人物にとっての空間の快適さが個々の人物にとって不快な状態を示す場合に、空調前の個々の人物にとっての空間の快適さが個々の人物にとって快適な状態を示す場合に決定される個々の報酬を示す値よりも価値の高い正の報酬として個々の報酬を示す値を決定してよい。例えば、図3では、数字の大小関係により報酬の価値の高さが示されている。すなわち、図3の例では、報酬の価値として、「+1」よりも「+3」の方が価値が高い。なお、報酬の価値が高いほど、実行した空調制御が個々の人物にとって快適さをより向上させる制御であったと解釈されてよい。
また、決定部134は、個々の人物にとって、空調前の空間の快適さが「快適」な状態であって、空調後の空間の快適さが「不快」な状態である場合には、空調機器による空調に対する個々の報酬を示す値を負の報酬である「-3」に決定してよい。一方、決定部134は、個々の人物にとって、空調前の空間の快適さが「不快」な状態であって、空調後の空間の快適さが「不快」な状態である場合には、空調機器による空調に対する個々の報酬を示す値を負の報酬である「-1」に決定してよい。このように、決定部134は、空調後の個々の人物にとっての空間の快適さが個々の人物にとって不快な状態を示す場合には、負の報酬として個々の報酬を示す値を決定してよい。また、決定部134は、空調後の個々の人物にとっての空間の快適さが個々の人物にとって不快な状態を示す場合において、空調前の個々の人物にとっての空間の快適さが個々の人物にとって快適な状態を示す場合に、空調前の個々の人物にとっての空間の快適さが個々の人物にとって不快な状態を示す場合に決定される個々の報酬を示す値よりも価値の低い負の報酬として個々の報酬を示す値を決定してよい。例えば、図3では、報酬の価値として、「-1」よりも「-3」の方が価値が低い。なお、報酬の価値が低いほど、実行した空調制御が個々の人物にとっての快適さが向上しにくい制御であったと解釈されてよい。
続いて、決定部134は、個々の報酬を示す値を決定すると、決定した個々の報酬を示す値に基づいて、空間に所在する複数の人物にとっての空調機器による空調に対する集団の報酬を示す値を決定してよい。例えば、決定部134は、空間に所在する複数の人物全員についての個々の報酬を示す値を所定条件に基づいて計算することで、集団の報酬を示す値を決定してよい。例えば、決定部134は、複数の人物全員についての個々の報酬を示す値を加算または乗算することで集団の報酬を示す値を決定してよい。例えば、決定部134は、複数の人物全員についての個々の報酬を示す値を加算した値を複数の人物の人数で除すことで正規化した値を集団の報酬を示す値として決定してもよい。なお、決定部134は、空調に対する集団全体としての報酬を示す値を決定することができれば、上記の例に限られず任意の演算式によって集団の報酬を示す値を決定してよい。
ここで、集団の報酬の価値の高さは、集団の報酬を示す値の大小によって示されてよい。すなわち、集団の報酬を示す値が大きいほど、集団の報酬の価値が高いことを示してよい。言い換えれば、集団の報酬を示す値が大きいほど、実行した空調制御が空間に所在する複数の人物全体にとってより快適さを向上させる制御であったと解釈されてよい。また、集団の報酬を示す値が小さいほど、集団の報酬の価値が低いことを示してよい。言い換えれば、集団の報酬を示す値が小さいほど、実行した空調制御が空間に所在する複数の人物全体にとって快適さが向上しにくい制御であったと解釈されてよい。
(学習部135)
学習部135は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルM7を、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。例えば、学習部135は、集団全体の快適さを考慮した空調制御を実行可能なように空調制御モデルM7を強化学習してよい。例えば、学習部135は、集団の報酬の価値が最も高くなる空調制御情報を出力するように空調制御モデルM7を強化学習してよい。具体的には、例えば、学習部135は、集団の報酬を示す値が最大となる空調制御情報を出力するように空調制御モデルM7を強化学習してよい。学習部135は、空調制御モデルM7を強化学習すると、強化学習済みの空調制御モデルM7に関する情報と空調制御モデルM7を識別する識別情報「M7」とを対応付けて記憶部120に格納してよい。なお、空調機器は、図1に示す空調装置10に相当する。
学習部135は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルM7を、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。例えば、学習部135は、集団全体の快適さを考慮した空調制御を実行可能なように空調制御モデルM7を強化学習してよい。例えば、学習部135は、集団の報酬の価値が最も高くなる空調制御情報を出力するように空調制御モデルM7を強化学習してよい。具体的には、例えば、学習部135は、集団の報酬を示す値が最大となる空調制御情報を出力するように空調制御モデルM7を強化学習してよい。学習部135は、空調制御モデルM7を強化学習すると、強化学習済みの空調制御モデルM7に関する情報と空調制御モデルM7を識別する識別情報「M7」とを対応付けて記憶部120に格納してよい。なお、空調機器は、図1に示す空調装置10に相当する。
〔4.情報処理のフロー〕
次に、図4~図10を用いて、実施形態に係る情報処理の手順について説明する。図4~図10は、実施形態に係る情報処理手順を示すフローチャートである。
次に、図4~図10を用いて、実施形態に係る情報処理の手順について説明する。図4~図10は、実施形態に係る情報処理手順を示すフローチャートである。
まず、図4を用いて、実施形態に係る情報処理の手順について説明する。図4では、センサ装置20が複数の人物が所在する空間の環境に関するモニタリングを行う(ステップS11)。具体的には、センサ装置20は、複数の人物が所在する空間の物理的な状態や空間に所在する人物の物理的な状態を示すセンサ情報を取得してよい。続いて、センサ装置20は、取得したセンサ情報を情報処理装置100に送信してよい。
取得部131は、複数の人物が所在する空間の物理的な状態や空間に所在する人物の物理的な状態を示すセンサ情報をセンサ装置20から取得してよい。例えば、取得部131は、センサ情報の一例として、空間に所在する人物を被写体として含むRGB画像をRGBカメラから取得してよい。また、取得部131は、センサ情報の一例として、空間に所在する人物を被写体として含むサーマル画像を赤外線カメラから取得してよい。また、取得部131は、センサ情報の一例として、空間の温度や湿度に関する環境情報を環境センサから取得してよい。
続いて、推定部132は、取得部131によってセンサ情報が取得されると、快適さ推定モデルM4を用いて、空間に所在する個々の人物にとっての空間の快適さを推定する(ステップS12)。具体的には、推定部132は、RGB画像のうち個々の人物が撮像された領域である人物領域であって姿勢推定処理に基づいて特定された人物領域の特徴を示す特徴ベクトルV1、サーマル画像のうち個々の人物が撮像された領域である人物領域であって姿勢推定処理に基づいて特定された人物領域の特徴を示す特徴ベクトルV2、および空間の温度および湿度に関する情報の特徴を示す特徴ベクトルV3に基づいて生成された特徴ベクトルV4を入力情報として快適さ推定モデルM4に入力してよい。続いて、推定部132は、空間に所在する個々の人物にとっての快適さを快適さ推定モデルM4の出力情報として出力してよい。
続いて、推定部132は、空間に所在する個々の人物にとっての快適さを快適さ推定モデルM4の出力情報として出力すると、出力したデータを保存する(ステップS13)。具体的には、推定部132は、快適さ推定モデルM4の出力情報として出力したデータを一つ前の空間に所在する個々の人物にとっての快適さとして記憶部120に保存してよい。
次に、図5を用いて、実施形態に係る情報処理の手順について説明する。図5では、図4に続いて、空調制御部133が、空調制御モデルM7を用いて、空間に設置された空調機器による空調を制御する空調制御情報を推定する(ステップS21)。具体的には、空調制御部133は、取得部131によって取得されたセンサ情報を空調制御モデルM7の入力情報として入力してよい。より具体的には、空調制御部133は、取得部131によって取得されたセンサ情報の特徴を示す特徴ベクトルV7を空調制御モデルM7の入力情報として入力してよい。例えば、空調制御部133は、RGB画像の特徴を示す特徴ベクトルV5、サーマル画像の特徴を示す特徴ベクトルV6、および、空間の温度および湿度に関する環境情報の特徴を示す特徴ベクトルV3に基づいて生成された特徴ベクトルV7を入力情報として空調制御モデルM7に入力してよい。続いて、空調制御部133は、空間に設置された空調機器による空調を制御する空調制御情報を空調制御モデルM7の出力情報として出力してよい。
次に、図6を用いて、実施形態に係る情報処理の手順について説明する。図6では、図5に続いて、空調装置10が、情報処理装置100から出力された空調制御情報に基づいて、空間の空調を調整する(ステップS31)。具体的には、空調装置10は、情報処理装置100から空調制御情報を取得してよい。続いて、空調装置10は、空調制御情報を取得すると、空間に対して、取得した空調制御情報に基づく空調を行う。例えば、空調装置10は、空調制御情報に含まれる冷暖房設定に従って空間の空調を行う。また、空調装置10は、空調制御情報に含まれる設定温度になるよう空間の温度を調整してよい。また、空調装置10は、空調制御情報に含まれる設定湿度になるよう空間の湿度を調整してよい。
また、空調装置10によって空間の空調が調整された結果、空間の環境が変化する(ステップS32)。具体的には、空間の温度は、空調装置10による空調前の温度から設定温度に変化してよい。また、空間の湿度は、空調装置10による空調前の湿度から設定湿度に変化してよい。
また、センサ装置20は、複数の人物が所在する空間の空調後の環境に関するモニタリングを行う(ステップS33)。具体的には、センサ装置20は、複数の人物が所在する空調後の空間の物理的な状態や空調後の空間に所在する人物の物理的な状態を示すセンサ情報を取得してよい。続いて、センサ装置20は、取得したセンサ情報を情報処理装置100に送信してよい。
次に、図7を用いて、実施形態に係る情報処理の手順について説明する。図7では、図6に続いて、取得部131は、複数の人物が所在する空調後の空間の物理的な状態や空調後の空間に所在する人物の物理的な状態を示すセンサ情報をセンサ装置20から取得してよい。例えば、取得部131は、センサ情報の一例として、空調後の空間に所在する人物を被写体として含むRGB画像をRGBカメラから取得してよい。また、取得部131は、センサ情報の一例として、空調後の空間に所在する人物を被写体として含むサーマル画像を赤外線カメラから取得してよい。また、取得部131は、センサ情報の一例として、空調後の空間の温度や湿度に関する環境情報を環境センサから取得してよい。
続いて、推定部132は、取得部131によってセンサ情報が取得されると、快適さ推定モデルM4を用いて、空調後の空間に所在する個々の人物にとっての空間の快適さを推定する(ステップS41)。具体的には、推定部132は、空調後の空間に所在する個々の人物の特徴を示す特徴ベクトルV4´を快適さ推定モデルM4の入力情報として入力してよい。より具体的には、推定部132は、RGB画像のうち個々の人物が撮像された領域である人物領域の特徴を示す特徴ベクトルV1´、サーマル画像のうち個々の人物が撮像された領域である人物領域の特徴を示す特徴ベクトルV2´、および、空調後の空間の温度および湿度に関する情報の特徴を示す特徴ベクトルV3´に基づいて生成された特徴ベクトルV4´を入力情報として快適さ推定モデルM4に入力してよい。続いて、推定部132は、空調後の空間に所在する個々の人物にとっての快適さを快適さ推定モデルM4の出力情報として出力してよい。
次に、図8を用いて、実施形態に係る情報処理の手順について説明する。図8では、図7に続いて、決定部134が、記憶部120に保存された一つ前の空間に所在する個々の人物にとっての快適さと、快適さ推定モデルM4の出力情報として出力された空調後の空間に所在する個々の人物にとっての快適さとの比較に基づいて、個々の人物にとっての空調機器による空調に対する個々の報酬を示す値を決定してよい。続いて、決定部134は、個々の報酬を示す値を決定すると、空間に所在する複数の人物全員についての個々の報酬を示す値を加算することで、空間に所在する複数の人物にとっての空調機器による空調に対する集団の報酬(全体の報酬ともいう)を示す値を決定する(ステップS51)。
次に、図9を用いて、実施形態に係る情報処理の手順について説明する。図9では、図8に続いて、推定部132は、空調後の空間に所在する個々の人物にとっての快適さを快適さ推定モデルM4の出力情報として出力すると、出力したデータを保存する(ステップS61)。具体的には、推定部132は、快適さ推定モデルM4の出力情報として出力したデータを一つ前の個々の人物にとっての快適さとして記憶部120に保存してよい。
次に、図10を用いて、実施形態に係る情報処理の手順について説明する。図10では、図9に続いて、学習部135が、空調機器による空調に対する集団の報酬(全体の報酬ともいう)を示す値と、空調機器による空調を示す空調制御情報とに基づいて、空調制御モデルM7を強化学習する(ステップS71)。
〔5.効果〕
上述してきたように、実施形態に係る情報処理装置100は、決定部134と学習部135を備える。決定部134は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。学習部135は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。
上述してきたように、実施形態に係る情報処理装置100は、決定部134と学習部135を備える。決定部134は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて、空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値を決定する。学習部135は、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、空調機器により空調が行われた際の空調制御情報と集団の報酬を示す値とに基づいて強化学習する。
このように、情報処理装置100は、個々の人物にとっての空間の快適さを精度よく推定することができるので、個々の人物が集まった集団にとっての空間の快適さを反映する指標としての空調に対する集団の報酬を精度よく算出することができる。また、情報処理装置100は、精度の高い集団の報酬に基づいて、空調機器による空調を制御する空調制御情報を出力する空調制御モデルを強化学習することができるので、精度の高い空調制御モデルを生成することができる。また、これにより、情報処理装置100は、個々の人物にとっての空間の快適さに基づく集団の快適さを実現する空調制御を適切に行うことが可能となる。したがって、情報処理装置100は、集団の快適さを考慮した空調制御を可能とすることができる。
また、決定部134は、空調機器による空調前の個々の人物にとっての空間の快適さと、空調機器による空調後の個々の人物にとっての空間の快適さとの比較に基づいて、集団の報酬を示す値を決定する。具体的には、決定部134は、空調前の個々の人物にとっての空間の快適さと、空調後の個々の人物にとっての空間の快適さとの比較に基づいて、個々の人物にとっての空調に対する個々の報酬を示す値を決定する。続いて、決定部134は、個々の報酬を示す値に基づいて、集団の報酬を示す値を決定する。例えば、決定部134は、複数の人物全員についての個々の報酬を示す値を所定条件に基づいて加算することで、集団の報酬を示す値を決定する。
これにより、情報処理装置100は、個々の人物にとっての空調前後の快適さの変化に基づいて、集団の報酬を決定することができるため、空調による集団全体の快適さの変化を評価することができる。すなわち、一実施形態に係る情報処理装置100によれば、集団の快適さを考慮した空調制御を可能とすることができる。
また、決定部134は、空調後の個々の人物にとっての空間の快適さが個々の人物にとって快適な状態を示す場合には、正の報酬として個々の報酬を示す値を決定する。
これにより、情報処理装置100は、個々の人物にとって空間を快適な状態に変化させる空調制御に対して正の報酬を付与するため、集団にとって空間を快適な状態に変化させる空調制御を出力するよう空調制御モデルを強化学習させることができる。したがって、情報処理装置100は、集団にとって空間を快適な状態に変化させる空調制御を可能とすることができる。
また、決定部134は、空調後の個々の人物にとっての空間の快適さが個々の人物にとって快適な状態を示す場合において、空調前の個々の人物にとっての空間の快適さが個々の人物にとって不快な状態を示す場合に、空調前の個々の人物にとっての空間の快適さが個々の人物にとって快適な状態を示す場合に決定される個々の報酬を示す値よりも価値の高い正の報酬として個々の報酬を示す値を決定する。
これにより、情報処理装置100は、個々の人物にとって空間が不快な状態から快適な状態に変化させる空調制御に対してより大きな正の報酬を付与するため、集団にとって空間を不快な状態から快適な状態に変化させる空調制御をより出力するよう空調制御モデルを強化学習させることができる。したがって、情報処理装置100は、集団にとって空間を不快な状態から快適な状態に変化させる空調制御を可能とすることができる。
また、決定部134は、空調後の個々の人物にとっての空間の快適さが個々の人物にとって不快な状態を示す場合には、負の報酬として個々の報酬を示す値を決定する。
これにより、情報処理装置100は、個々の人物にとって空間を不快な状態に変化させる空調制御に対して負の報酬を付与するため、集団にとって空間を不快な状態に変化させる空調制御を出力しないよう空調制御モデルを強化学習させることができる。したがって、情報処理装置100は、集団にとって空間を不快な状態に変化させない空調制御を可能とすることができる。
また、決定部134は、空調後の個々の人物にとっての空間の快適さが個々の人物にとって不快な状態を示す場合において、空調前の個々の人物にとっての空間の快適さが個々の人物にとって快適な状態を示す場合に、空調前の個々の人物にとっての空間の快適さが個々の人物にとって不快な状態を示す場合に決定される個々の報酬を示す値よりも価値の低い負の報酬として個々の報酬を示す値を決定する。
これにより、情報処理装置100は、個々の人物にとって空間が快適な状態から不快な状態に変化させる空調制御に対してより大きな負の報酬を付与するため、集団にとって空間を快適な状態から不快な状態に変化させる空調制御をより出力しないよう空調制御モデルを強化学習させることができる。したがって、情報処理装置100は、集団にとって空間を快適な状態から不快な状態に変化させない空調制御を可能とすることができる。
また、情報処理装置100は、推定部132をさらに備える。推定部132は、空間を撮像した画像に含まれる情報のうち個々の人物が撮像された領域である人物領域であって、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域に関する情報に基づいて、個々の人物にとっての空間の快適さを推定する。また、推定部132は、空間を撮像した画像として、赤外線カメラで空間を撮像したサーマル画像またはRGBカメラで空間を撮像したRGB画像のうち少なくともいずれか一方に含まれる情報のうち人物領域に関する情報に基づいて、個々の人物にとっての空間の快適さを推定する。また、推定部132は、空間の温度および湿度に関する情報に基づいて、個々の人物にとっての空間の快適さを推定する。
このように、情報処理装置100は、姿勢推定技術を用いることにより、画像の中から個々の人物が撮像された領域である人物領域をより精緻に特定することができる。これにより、情報処理装置100は、画像の中から推定対象である個々の人物の人物領域を精緻に特定したうえで、精緻に特定された人物領域の特徴に基づいて、推定対象となる個々の人物にとっての空間の快適さを推定することができる。すなわち、情報処理装置100は、個々の人物にとっての空間の快適さの推定精度を向上させることができる。したがって、情報処理装置100は、集団の快適さを精度よく考慮した空調制御を可能とすることができる。
また、情報処理装置100は、空調制御部133をさらに備える。空調制御部133は、空調制御モデルを用いて空調を制御する。具体的には、空調制御部133は、空調制御モデルの入力情報として空間を撮像した画像に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。より具体的には、空調制御部133は、空間を撮像した画像に関する情報として、赤外線カメラで空間を撮像したサーマル画像またはRGBカメラで空間を撮像したRGB画像のうち少なくともいずれか一方に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。また、空調制御部133は、空調制御モデルの入力情報として空間の温度および湿度に関する情報が空調制御モデルに入力された場合に、空調制御モデルの出力情報として空調制御モデルから出力される空調制御情報に基づいて空調を制御する。
これにより、情報処理装置100は、集団の快適さを考慮した空調制御を学習した空調制御モデルを用いて、空間の空調を制御することができるので、集団の快適さを考慮した空調制御を可能とすることができる。
また、空調制御部133は、複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された個々の人物にとっての空間の快適さに基づいて決定された空間に所在する複数の人物にとっての空調に対する集団の報酬を示す値と空調機器により空調が行われた際の空調制御情報とに基づいて強化学習された空調機器による空調を制御する空調制御情報を出力する空調制御モデルを用いて空調を制御する。
これにより、情報処理装置100は、個々の人物にとっての空間の快適さに基づく集団の快適さを考慮した空調制御を学習した空調制御モデルを用いて、空間の空調を制御することができるので、集団の快適さを考慮した空調制御を可能とすることができる。
〔6.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100は、例えば図11に示すような構成のコンピュータ1000によって実現される。図11は、情報処理装置100の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
また、上述してきた実施形態に係る情報処理装置100は、例えば図11に示すような構成のコンピュータ1000によって実現される。図11は、情報処理装置100の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔7.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、上述した実施形態では、情報処理装置100が空調制御部133と決定部134と学習部135を備える例について説明したが、空調制御部133と決定部134と学習部135をそれぞれ別々の装置が備えてもよい。例えば、空調制御部133を備える装置と、決定部134および学習部135を備える装置とが別々の装置であってよい。
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、学習部は、学習手段や学習回路に読み替えることができる。
1 情報処理システム
10 空調装置
20 センサ装置
100 情報処理装置
110 通信部
120 記憶部
130 制御部
131 取得部
132 推定部
133 空調制御部
134 決定部
135 学習部
10 空調装置
20 センサ装置
100 情報処理装置
110 通信部
120 記憶部
130 制御部
131 取得部
132 推定部
133 空調制御部
134 決定部
135 学習部
Claims (21)
- 複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された前記個々の人物にとっての前記空間の快適さに基づいて、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、
を備える情報処理装置。 - 前記決定部は、
前記空調機器による空調前の前記個々の人物にとっての前記空間の快適さと、前記空調機器による空調後の前記個々の人物にとっての前記空間の快適さとの比較に基づいて、前記集団の報酬を示す値を決定する、
請求項1に記載の情報処理装置。 - 前記決定部は、
前記空調前の前記個々の人物にとっての前記空間の快適さと、前記空調後の前記個々の人物にとっての前記空間の快適さとの比較に基づいて、前記個々の人物にとっての前記空調に対する個々の報酬を示す値を決定する、
請求項2に記載の情報処理装置。 - 前記決定部は、
前記個々の報酬を示す値に基づいて、前記集団の報酬を示す値を決定する、
請求項3に記載の情報処理装置。 - 前記決定部は、
前記複数の人物全員についての前記個々の報酬を示す値を所定条件に基づいて加算することで、前記集団の報酬を示す値を決定する、
請求項3に記載の情報処理装置。 - 前記決定部は、
前記空調後の前記個々の人物にとっての前記空間の快適さが前記個々の人物にとって快適な状態を示す場合には、正の報酬として前記個々の報酬を示す値を決定する、
請求項2~5のいずれか1項に記載の情報処理装置。 - 前記決定部は、
前記空調後の前記個々の人物にとっての前記空間の快適さが前記個々の人物にとって快適な状態を示す場合において、前記空調前の前記個々の人物にとっての前記空間の快適さが前記個々の人物にとって不快な状態を示す場合に、前記空調前の前記個々の人物にとっての前記空間の快適さが前記個々の人物にとって快適な状態を示す場合に決定される前記個々の報酬を示す値よりも価値の高い正の報酬として前記個々の報酬を示す値を決定する、
請求項6に記載の情報処理装置。 - 前記決定部は、
前記空調後の前記個々の人物にとっての前記空間の快適さが前記個々の人物にとって不快な状態を示す場合には、負の報酬として前記個々の報酬を示す値を決定する、
請求項2~5のいずれか1項に記載の情報処理装置。 - 前記決定部は、
前記空調後の前記個々の人物にとっての前記空間の快適さが前記個々の人物にとって不快な状態を示す場合において、前記空調前の前記個々の人物にとっての前記空間の快適さが前記個々の人物にとって快適な状態を示す場合に、前記空調前の前記個々の人物にとっての前記空間の快適さが前記個々の人物にとって不快な状態を示す場合に決定される前記個々の報酬を示す値よりも価値の低い負の報酬として前記個々の報酬を示す値を決定する、
請求項8に記載の情報処理装置。 - 前記空間を撮像した画像に含まれる情報のうち個々の人物が撮像された領域である人物領域であって、個々の人物の姿勢を推定する姿勢推定処理に基づいて特定された人物領域に関する情報に基づいて、前記個々の人物にとっての前記空間の快適さを推定する推定部、
をさらに備える請求項1~9のいずれか1項に記載の情報処理装置。 - 前記推定部は、
前記空間を撮像した画像として、赤外線カメラで前記空間を撮像したサーマル画像またはRGBカメラで前記空間を撮像したRGB画像のうち少なくともいずれか一方に含まれる情報のうち前記人物領域に関する情報に基づいて、前記個々の人物にとっての前記空間の快適さを推定する、
請求項10に記載の情報処理装置。 - 前記推定部は、
前記空間の温度および湿度に関する情報に基づいて、前記個々の人物にとっての前記空間の快適さを推定する、
請求項10または11に記載の情報処理装置。 - 前記空調制御モデルを用いて空調を制御する空調制御部、
をさらに備える請求項1~12のいずれか1項に記載の情報処理装置。 - 前記空調制御部は、
前記空調制御モデルの入力情報として空間を撮像した画像に関する情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される空調制御情報に基づいて空調を制御する、
請求項13に記載の情報処理装置。 - 前記空調制御部は、
前記空間を撮像した画像に関する情報として、赤外線カメラで前記空間を撮像したサーマル画像またはRGBカメラで前記空間を撮像したRGB画像のうち少なくともいずれか一方に関する情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される前記空調制御情報に基づいて空調を制御する、
請求項14に記載の情報処理装置。 - 前記空調制御部は、
前記空調制御モデルの入力情報として前記空間の温度および湿度に関する情報が前記空調制御モデルに入力された場合に、前記空調制御モデルの出力情報として前記空調制御モデルから出力される前記空調制御情報に基づいて空調を制御する、
請求項13~15のいずれか1項に記載の情報処理装置。 - 複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された前記個々の人物にとっての前記空間の快適さに基づいて、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定手順と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。 - 情報処理装置と、空調装置とを含む情報処理システムであって、
前記情報処理装置は、
複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された前記個々の人物にとっての前記空間の快適さに基づいて、前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値を決定する決定部と、
前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを、前記空調機器により前記空調が行われた際の前記空調制御情報と前記集団の報酬を示す値とに基づいて強化学習する学習部と、
を備え、
前記空調装置は、
前記学習部によって強化学習された空調制御モデルから出力された前記空調制御情報に従って空調を行う、
情報処理システム。 - 複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された前記個々の人物にとっての前記空間の快適さに基づいて決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを用いて空調を制御する空調制御部と、
を備える情報処理装置。 - 複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された前記個々の人物にとっての前記空間の快適さに基づいて決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを用いて空調を制御する空調制御手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。 - 情報処理装置と、空調装置とを含む情報処理システムであって、
前記情報処理装置は、
複数の人物が所在し空調機器により空調が行われる空間を撮像した画像に含まれる情報のうち、個々の人物が撮像された領域である人物領域に関する情報に基づいて推定された前記個々の人物にとっての前記空間の快適さに基づいて決定された前記空間に所在する前記複数の人物にとっての前記空調に対する集団の報酬を示す値と前記空調機器により前記空調が行われた際の空調制御情報とに基づいて強化学習された前記空調機器による空調を制御する空調制御情報を出力する空調制御モデルを用いて空調を制御する空調制御部と、
を備え、
前記空調装置は、
前記空調制御部から出力された前記空調制御情報に従って空調を行う、
情報処理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020190185A JP7080294B2 (ja) | 2020-11-16 | 2020-11-16 | 情報処理装置、情報処理プログラム及び情報処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020190185A JP7080294B2 (ja) | 2020-11-16 | 2020-11-16 | 情報処理装置、情報処理プログラム及び情報処理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022079175A JP2022079175A (ja) | 2022-05-26 |
JP7080294B2 true JP7080294B2 (ja) | 2022-06-03 |
Family
ID=81707537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020190185A Active JP7080294B2 (ja) | 2020-11-16 | 2020-11-16 | 情報処理装置、情報処理プログラム及び情報処理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7080294B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019150612A1 (en) | 2018-02-05 | 2019-08-08 | Mitsubishi Electric Corporation | System and method for controlling operation |
JP2020134124A (ja) | 2019-02-12 | 2020-08-31 | 大成建設株式会社 | 空調システムおよび空調装置の制御方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7179530B2 (ja) * | 2018-08-23 | 2022-11-29 | 株式会社東芝 | 空調制御履歴表示装置、空調制御履歴表示方法及びプログラム |
-
2020
- 2020-11-16 JP JP2020190185A patent/JP7080294B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019150612A1 (en) | 2018-02-05 | 2019-08-08 | Mitsubishi Electric Corporation | System and method for controlling operation |
JP2020134124A (ja) | 2019-02-12 | 2020-08-31 | 大成建設株式会社 | 空調システムおよび空調装置の制御方法 |
Non-Patent Citations (1)
Title |
---|
服部 忠幸,人格と民主主義の数理モデル,電子情報通信学会技術研究報告,日本,社団法人電子情報通信学会,2008年05月27日,第108巻, 第79号 |
Also Published As
Publication number | Publication date |
---|---|
JP2022079175A (ja) | 2022-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Aryal et al. | Thermal comfort modeling when personalized comfort systems are in use: Comparison of sensing and learning methods | |
CN213501729U (zh) | 用于机动车辆乘客舱的热管理系统 | |
Yang et al. | Real-time and contactless measurements of thermal discomfort based on human poses for energy efficient control of buildings | |
Li et al. | Robust non-intrusive interpretation of occupant thermal comfort in built environments with low-cost networked thermal cameras | |
Cosma et al. | Using the contrast within a single face heat map to assess personal thermal comfort | |
US10372990B2 (en) | System and method for identification of personal thermal comfort | |
US10043068B1 (en) | Body modeling and garment fitting using an electronic device | |
JP7217058B2 (ja) | 1つまたは複数のサーモグラフィカメラおよび1つまたは複数のrgb-dセンサを使用して構築空間内の1人または複数の人間の居住者の存在をリアルタイムで検出し、熱的快適性を推定すること | |
WO2020050174A1 (ja) | 換気制御装置及び換気システム | |
Li et al. | Non-intrusive comfort sensing: Detecting age and gender from infrared images for personal thermal comfort | |
He et al. | Smart detection of indoor occupant thermal state via infrared thermography, computer vision, and machine learning | |
JP2015111019A (ja) | 空調システム、空調機器制御装置、制御方法、およびプログラム | |
CN115236123B (zh) | 基于非接触式室内热舒适性评价系统与方法 | |
KR102224596B1 (ko) | 식별가능한 얼굴 편차를 처리하기 위한 얼굴 교정 디자인 및 애플리케이션 프로토콜을 자동으로 생성하는 시스템 및 방법 | |
JP7311474B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Intharachathorn et al. | Potential use of an extended-distance thermal imaging camera for the assessment of thermal comfort in multi-occupant spaces | |
Bucarelli et al. | Deep learning approach for recognizing cold and warm thermal discomfort cues from videos | |
JP7080294B2 (ja) | 情報処理装置、情報処理プログラム及び情報処理システム | |
Mao et al. | A thermal comfort estimation method by wearable sensors | |
JP7311478B2 (ja) | 情報処理装置、情報処理プログラム及び情報処理システム | |
JP7380276B2 (ja) | 空調システム、および、空調機の制御方法 | |
KR102233157B1 (ko) | 딥러닝 기반의 재실자 포즈 분류를 이용한 재실자 활동량 산출 방법 및 시스템 | |
JP2018123989A (ja) | 温熱快適装置及び制御内容決定方法 | |
WO2023032771A1 (ja) | 制御方法、プログラム、及び、制御システム | |
Mao et al. | Subjective and Objective Thermal Comfort Estimation Using Wearable Sensors and Environmental Sensors |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210218 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220510 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220524 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7080294 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |