JP2021508118A

JP2021508118A - 動作を制御するシステム及び方法

Info

Publication number: JP2021508118A
Application number: JP2020534631A
Authority: JP
Inventors: ラフチーブ、エミル; ナタラジャン、アナマライ
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2018-02-05
Filing date: 2018-07-30
Publication date: 2021-02-25
Anticipated expiration: 2038-07-30
Also published as: US20190242608A1; CN111684370A; CN111684370B; WO2019150612A1; EP3750012A1; EP3750012B1; JP6925536B2; US10794609B2

Abstract

居住者のためのデバイスの動作を制御するシステム及び方法である。プロセッサが、初期化期間の間に個人別熱的快適性モデル（ＰＴＣＭ：personalized thermal comfort model）を反復してトレーニングする。ラベル無しリアルタイムデータのシーケンスが受信される。受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータ（ＬＤ：labeled data）のラベルとこの新たなラベル無しデータに関する予測ラベルとの間の不一致が閾値を超えているときに、送信機が、ラベル無しデータのインスタンスをラベル付けするように居住者に要求する。プロセッサは、ラベル付きデータの受信に応答して、履歴ＬＤと異なる、個人別ＬＤの重みを用いてＰＴＣＭをトレーニングする。ＰＴＣＭは、履歴データベース及び更新された個人別データベースを用いて再トレーニングされる。コントローラが、再トレーニングされたＰＴＣＭに基づいて一組のデバイスを制御する。

Description

本開示は、包括的には、加熱、換気及び空調（ＨＶＡＣ：heating, ventilation, and air conditioning）システムに関し、より詳細には、空間内の居住者（複数の場合もある）の熱的快適性を最大にするとともにＨＶＡＣシステムエネルギー消費を最小にするために、温度設定値及びＨＶＡＣシステムによって伝達される潜熱の量等の調整可能な設定の自動カスタマイゼーションに関する。

オフィス及び住宅建物等の環境における従来のＨＶＡＣシステムは、幾つかの見積もりによると、世界における最大のエネルギー消費者のうちの１つであり、全エネルギーの４０％を超えるエネルギーを消費している。これは、現代社会において屋内環境調節の重要性が大きいこと、及び、屋内環境調節が人々の生産性及び健全性に対して影響を及ぼすことに起因している。しかしながら、従来のＨＶＡＣシステムを用いた熱的快適性は、主として、建物居住者とＨＶＡＣシステムとの間の通信方法が非常に初歩的であるため、現在、最適には及ばない不十分な方法で継続されている。

多くのシステムにおいて、ＨＶＡＣシステムとの通信は、壁サーモスタットおよびリモコンのいずれかによって行われており、その目的は、機器をオン又はオフにすること、及び温度設定値を設定することである。オン／オフは、サービスが必要とされているとき及びサービスが必要とされていないときを意味する。温度設定は、建物居住者のニーズ及び熱的条件に従った熱的快適性の望ましいレベルを示す方法である。例えば、オフィスワーカーは、寒い冬の日に長時間の間、机の前にじっと座っていると、代謝率が低下するため寒いと感じる可能性が高く、温度設定値を上げることで暖房を強めてほしいと願う。同様に、肉体労働者は、蒸し暑い夏の日に激しい肉体労働を行っていると、非常に暑く感じる可能性が高く、温度設定値を下げることによって冷房を強めてほしいと願う。

基本的に、従来のＨＶＡＣ制御（オン／オフスイッチ及び温度設定値）は、可能であれば、熱的快適性を提供するべきである。しかしながら、実際には、これは、複数の理由によってほとんど行われない。少なくとも１つの理由は、温度設定値を常に手動で再調整することが現実的でないということであり、ほとんどの建物居住者にとって、注意散漫となる要因である。例えば、実生活においては、そのような再調整は、屋内環境がドラスティックに不快になり、その結果、建物居住者が満足できなくなるか又は生産的でなくなるときにしか行われない。

従来のＨＶＡＣの温度設定値の絶え間のない手動再調整が現実的でない別の理由は、居住者が温度設定値を調整したいと思っても、とりわけ、最適な値が幾つであるのかを知っていることがめったにないということである。上述したように、その値は、現在の身体活動レベル又は代謝率、屋内の湿度、居住者（複数の場合もある）が着用している衣類、及び日光等の外部熱源とともに室内の他の物体によって放射される放射熱の量に大いに依存する。

居住者の熱的快適性を予測するモデルは、ＩＳＯ７７３０及びＡＳＨＲＡＥ５５に示されているが、そのようなモデルは、建物の居住者が最適な温度を正しく判断するには実用的ではない。例えば、これらのモデルは、補正が必要であると判断されたことの合図、例えば、温度の上昇又は下降の合図しか提供せず、更なる補正が後に必要となり、そのため、建物の居住者に時間の浪費及び生産性に対する集中力欠如（distraction from productivity）という犠牲を伴わせる。これらのモデルに関するもう１つの問題は、とりわけ、過剰補正という現象が頻繁に見られるということであり、居住者が寒いと感じると、多くの場合、居住者が寒い感覚に対処しようと判断することによって、必要以上に高い温度設定値が選ばれ、その結果、室温は、居住者が過度に暑く感じる別の不快な状態をもたらすようになる。またしても、これらのモデルは、建物居住者に不快な経験を与え、更に多くの時間の浪費及び生産性に対する集中力欠如という犠牲を建物居住者にもたらす。

従来のＨＶＡＣの温度設定値の絶え間のない手動再調整が現実的でない別の理由は、従来のＨＶＡＣシステムの熱的快適性温度センサの調節が準最適であることによる。例えば、従来のＨＶＡＣセンサは、ＨＶＡＣデバイス／システム自体に配置され、ＨＶＡＣデバイスの通風孔（intake）に戻ってくる前の大気の温度を測定している。これは多くの問題を提起する。例えば、少なくとも１つの問題は、建物居住者が、そのロケーション、すなわち、従来のＨＶＡＣシステムの通風孔における空気温度に関心がないということである。むしろ、居住者は、建物内で自身がいるロケーションにおける心地よい温度を必要とする。居住者（複数の場合もある）のロケーション（複数の場合もある）は、通常、従来のＨＶＡＣデバイスから離れており、建物内には大きな温度勾配が存在するので、従来のＨＶＡＣデバイスによって検知及び調節される空気温度は、ある建物の領域にいる居住者が受ける空気温度と異なる。その結果、建物居住者（複数の場合もある）は、不快であり、特定の建物ゾーン環境の調整の要求又は手動による調整を行うことになり、これも、上記同様に、エネルギーコストの増加とともに、時間の浪費及び生産性に対する集中力欠如をもたらす。

別の従来の熱的快適性モニターは、センサ測定値から室内の実際の快適性レベルを求めることを試みる監視デバイスを備える（Vass他による特許文献１）。しかしながら、このＶａｓｓモデルには問題があり、例えば、多くの問題の中の１つの問題は、居住者がいるエリア内で測定値が検知されるということである。Ｖａｓｓモデルは、検知された測定値が特定の居住者に対するものではなく、その居住者の場所におけるもの、すなわち、その居住者の部屋内の状態及び／又は場所に関するものでもないという点において欠点を有する。

まだ取り組まれていない他の従来の熱的快適性モデルの問題には、同じ部屋を共有する複数の居住者が存在する建物環境、すなわち、環境状態の問題がある。例えば、複数の居住者は同じ熱的制御を受けるＨＶＡＣゾーンを占有するので、それらの複数の居住者は、環境制御の調整が制限される。幾つかの問題は、そのような複数の居住者の共有空間では、居住者の多くが、温度が過度に暑いか又は過度に寒いことによって著しい不快感を受けることがある点にある。従来の熱的快適性モデルに関する他の問題には、会議室及び研究室等の空のゾーン、すなわち、居住者のいないゾーンのＨＶＡＣシステムによる熱調整がある。そのような空のゾーンの熱調整には、多くの費用及びリソースの浪費が発生する。ゾーンが占有されていても、従来の熱的快適性モデルは、現在いる一組の居住者を満足させることができる最適な温度設定値を求めることでさえ非常に困難である。

米国特許第８，７００，２２７号

したがって、特に、空間内の居住者（複数の場合もある）のためのより良好な熱的快適性を達成するとともに、より良好なＨＶＡＣ動作を達成する必要がある。例えば、取り組むべき必要があるものとして、１人以上のゾーン居住者の熱的快適性を最大にすることが可能なＨＶＡＣ機器を制御する自動化方法がある。この自動化方法では、ゾーン内の各居住者は、ＨＶＡＣデバイスと手動によって過度にインタラクトする必要がなく、自身が認識した特定の好みを有することができると同時に、エネルギーを効率的に利用することが可能である。

本開示は、空間内の居住者（複数の場合もある）の熱的快適性を最大にするとともに、ＨＶＡＣシステムのエネルギー消費を最小にするために、温度設定値及びＨＶＡＣシステムによって伝達される潜熱の量等の調整可能な設定の自動カスタマイゼーションのためのシステム及び方法を提供することに関する。

本開示の幾つかの実施の形態は、調整された環境内の居住者の熱的快適性を記述した熱的快適性モデルに従って暖房換気空調（ＨＶＡＣ）システムを制御することが有利であるという理解に基づいている。例えば、熱的快適性の本開示の幾つかの実施の形態は、居住者のバイオメトリックデータと、環境内の状態のデータとに居住者の熱的快適性を関連付ける。実験によると、これらの本開示の熱的快適性の実施の形態／モデルは、環境の居住者の熱的快適性も最適化するとともに、ＨＶＡＣシステムのエネルギー消費も削減する。しかしながら、実験中、これらの熱的快適性の実施の形態／モデルの作成には、多くの課題を克服しなければならなかった。

例えば、本開示の幾つかの実施の形態は、環境内の一群の人々の平均的な熱的快適性を記述する熱的快適性モデルを生成することができることを認識している。しかしながら、実験を通じて分かったことは、これらの熱的快適性モデルは、平均的なユーザの平均的な熱的快適性を推定することに依拠しており、これは、後に、調整された環境内の特定のユーザ及び／又は特定の一群のユーザの快適性を正確に予測することができなかったということである。具体的に言えば、この平均的な熱的快適性モデルは、調整された環境の特定のユーザのニーズ及び／又は居住者のための個人別のニーズでないことが判明した。

本開示の幾つかの実施の形態は、環境の居住者の個人別熱的快適性モデルを、その居住者自身によって提供される情報に基づいて作成することができることを認識している。しかしながら、実験から、そのような個人別熱的快適性モデルの作成は、種々の環境条件における居住者からの快適性レベルについてのラベル付きデータを必要とすることが分かった。また、実験から分かったことは、そのようなラベル付きデータの取得を試みることは、克服するのが困難な作業であるということである。本明細書において用いられる場合、ラベル付きデータという用語は、各データ点を或る対象ラベルを用いてラベル付けすることができるデータセットと呼ぶことができる。例えば、少なくとも１つの温度センサの温度測定値の各値は、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含むユーザ／居住者の感覚に関連付けることができる。ユーザが値ごとに自身の感覚を報告する場合、データセットは、完全にラベル付けされる。ユーザは自身の感覚を１回又は２回報告する場合、データセットは、１つ又は２つのラベル付き例しか含むことができず、部分的にしかラベル付けされない。

ラベル付けされるデータの例は、居住者のバイオメトリックデータ、例えば、居住者の生命兆候と、環境データ、例えば、調整された環境内の温度、湿度、空気流との様々な組み合わせを含むことができる。多くの状況において、ラベル無しデータのインスタンスのそのようなデータ測定値を取得することは困難ではなかった。例えば、バイオメトリックデータは、ウェアラブルデバイス、例えば、ユーザが装着したスマートウォッチによって測定することができる一方、環境データもウェアラブルデバイスによって測定することができ、及び／又は、環境内に設置された様々なセンサによって測定することができる。

そのために、個人別熱的快適性モデルを作成する際に、幾つかの実施の形態は、各個人ユーザのラベル無しデータが大量に存在するとき、ラベル無しデータのインスタンスをラベル付けするためにユーザから多量の更なる入力が必要になるという問題に直面した。しかしながら、ユーザが、熱的快適性モデルをトレーニングするのに十分な量のフィードバックを提供するように一貫して要求されるのであれば、そのような入力情報をユーザから取得することは実情にそぐわない可能性がある。さらに、ユーザは、ラベル無しデータに対する多くのラベルを提供するように期待されるだけでなく、ユーザの利益も先延ばしされ、そのようなモデルから受ける報酬は、ユーザが数百以上のラベルを提供した後にしか得られない。

幾つかの実施の形態は、一群の人々の集約された熱的快適性を記述するために、ＨＶＡＣシステムの異なるユーザによって提供されるデータに基づいて熱的快適性モデルを作成することができるという認識に基づいている。しかしながら、そのようなモデルは、実世界における個人の快適性までも正確に予測することはできない。なぜならば、一群の中の各ユーザは、異なる快適性の好みを有する場合があるからである。特に、モデルをトレーニングするためにユーザに要求されるラベルは主観的であり、複数のユーザによるフィードバックからモデルをトレーニングするために能動学習によって用いられる通常の技法は、個人別熱制御のシナリオには不向きである。

幾つかの実施の形態は、個人別熱的快適性モデルは、当該個人別熱的快適性モデルのユーザによって提供されるラベル付きデータと、他のユーザによって提供されるラベル付きデータ、すなわち、履歴居住者データとの双方を用いるハイブリッド手法を使用して学習することができるという理解に基づいている。そのようなハイブリッド手法によって、ユーザの個人別熱的快適性モデルをトレーニングするためにユーザに要求されるラベル付きデータインスタンスの数を削減することが可能になり、これによって、ユーザに対する妨害が削減され、フィードバックを提供するユーザの意欲が増す。加えて、ハイブリッド手法によって、ユーザによって占有される環境においてＨＶＡＣを制御するためにそのトレーニングされたモデルの利用を開始する待機時間の削減が可能になり、これによって、さらに、ＨＶＡＣシステムのエネルギー消費が削減される。加えて、フィードバック情報の要求が削減されることによって、個人別熱的快適性モデルを構築するシステムのメモリ、ネットワークトラフィック、及び所要計算量を削減することができる。

しかしながら、ユーザのフィードバックを他のユーザからのフィードバックと組み合わせることによるハイブリッド手法の単純な使用は、モデルのフィードバックを提供する当該他のユーザが異なる快適性の好みを有するときに、個人別熱的快適性モデルの精度を低下させる可能性がある。そのために、幾つかの実施の形態は、この制限に対処するためにハイブリッド手法を修正する。

例えば、幾つかの実施の形態は、ユーザによって提供される個人別データベース内のラベル付きデータと、他のユーザによって提供される共通データベース内のラベル付きデータとについて異なるモデル重みを用いてユーザの個人別熱的快適性モデルを構築する。この手法によって、モデルの学習及び／又はトレーニング用に提供されるラベル付きデータの信頼性を考慮することが可能になる。

加えて、新たなフィードバックがユーザから受信されると、幾つかの実施の形態は、ラベル付きデータのこの新たなインスタンスを用いてモデルを更新するのではなく、ラベル付きデータのこの新たなインスタンスを個人別データベースに付加し、モデルを最初から再トレーニングする。この手法によって、ユーザによって提供されたデータに向けたモデルのより高速な学習を可能にすることができる。

さらに、モデルの再トレーニングによって、トレーニング中にユーザのフィードバックデータの重みを調整することが可能になる。例えば、幾つかの実施の形態では、ユーザによって提供された個人別データベース内のラベル付きデータの重み、及び／又は、他のユーザによって提供された共通データベース内のラベル付きデータの重みは、個人別データベース内のラベル付きデータのインスタンスの数の関数、及び／又は、個人別データベース内のラベル付きデータのインスタンスの数と共通データベース内のラベル付きデータのインスタンスの数との比の関数である。そのようにして、それらの実施の形態は、トレーニングされたモデルに対する共通データベース内のラベル付きデータの影響を軽減することができる。例えば、個人別データベースが、十分な数のラベル付きデータインスタンスを有するとき、幾つかの実施の形態は、ＨＶＡＣシステムの制御を中断することなく、共通データベースからラベル付きデータを段階的に除去する。例えば、１つの実施の形態は、或る特定の数のラベル付きインスタンスが個人別データベースに蓄積された後、個人別データベース及び調節された個人別モデル重みのみをモデルのその後のトレーニング及び／又は更新に用いる。

幾つかの実施の形態は、能動機械学習の分野から借用した異なる技法を用いて、ユーザへのフィードバック要求の数を削減することができるという理解に基づいている。ただし、それらの技法は、提供されるフィードバックに基づいて構築されるモデルの質を徐々に高めるのに用いられる。しかしながら、この場合、モデルは、初期においては信頼されない。そのために、異なる能動学習方法が望まれる。

具体的には、幾つかの実施の形態は、現在の状態の熱的快適性の予測に対するモデルの信頼度を検査するのではなく、現在の状態の共通データベース内のラベル付きデータと、ラベル無しデータインスタンスの予測ラベルとの一致を検査する。現在の状態における自身の快適性について意見を表明した他のユーザが、仮定された現在の予測ラベルと一致していないときに、ユーザはフィードバック要求を受信する。例えば、ユーザの生物医学的パラメータの現在の値と、調整された環境内の環境パラメータの現在の値とのうちの一方又はそれらの組み合わせを含む現在の状態に類似する状態について、他の全てのユーザが心地よいと示した場合、おそらく、それらの状態は個人別熱的快適性モデルのユーザにとっても心地よい。これとは対照的に、同じ状態について、心地よいユーザもいれば、そうでないユーザもいるとき、ユーザが自身の快適性を表明するフィードバックは正当化される。この手法によって、個人別熱的快適性モデルの精度に依拠することなく、フィードバックの要求の数を削減することが可能になる。

さらに、本開示の幾つかの実施の形態は、クイックスタートモデリング及びストリーミングベース能動学習用に修正された転移能動学習フレームワークを用いて個人別熱的快適性モデルを見つけるラベル効率の良い方法を提供することができる。例えば、転移能動学習フレームワークは、少なくとも２つの能動学習クエリ戦略を、特にストリームベース設定において用いることができる回帰設定に組み込むことができる。さらに、本開示の態様は、データのラベル付きの例が少数しか与えられないときは、事前知識、すなわち、履歴データ又は履歴ラベル付きデータを利用して、熱的快適性の予測モデルを高速に学習し、モデルを調整する。

本開示の一実施の形態によれば、居住者のための一組のデバイスの動作を制御するシステムが提供される。システムは、ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリを備える。ラベル付きデータの各インスタンスは、少なくとも１つの環境の異なる状態における少なくとも１人の居住者の熱的快適性レベルを示す。システムは、メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングするハードウェアプロセッサを備える。システムは、居住者のバイオメトリックデータの測定値、居住者がいる環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信する入力インタフェースを備える。システムは、受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータのインスタンスの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、ラベル無しデータのインスタンスをラベル付けするように居住者に要求する送信機を備える。ラベル無しデータのインスタンスのラベル付けに応答して、ハードウェアプロセッサは、ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとしてメモリ内の個人別ラベル付きデータベースに記憶する。ハードウェアプロセッサは、記憶された履歴ラベル付きデータと比較して、記憶された個人別ラベル付きデータの異なる重みを用いて、個人別熱的快適性モデルをトレーニングする。それによって、初期化期間の間の反復ごとに、個人別ラベル付きデータを用いて個人別ラベル付きデータベースが更新される。履歴データベース及び更新された個人別データベースを用いて個人別熱的快適性モデルが再トレーニングされる。最後に、システムは、再トレーニングされた個人別熱的快適性モデルに基づいて一組のデバイスを制御するコントローラを備える。

本開示の別の実施の形態によれば、居住者のための一組のデバイスの動作を制御する方法が提供される。方法は、ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリを用いることを含む。ラベル付きデータの各インスタンスは、少なくとも１つの環境の異なる状態における少なくとも１人の居住者の熱的快適性レベルを示す。方法は、ハードウェアプロセッサを用いて、メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングすることを含む。方法は、居住者のバイオメトリックデータの測定値、居住者がいる環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを入力インタフェースを介して受信すること含む。方法は、受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータ点の予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、送信機を介して、ラベル無しデータのインスタンスをラベル付けするように居住者に要求することを含む。方法は、入力インタフェースを用いて、ラベル無しデータのインスタンスをラベル付けしたことを含む居住者からの返答を受信することを含む。ハードウェアプロセッサは、ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとしてメモリ内の個人別ラベル付きデータベースに記憶する。ハードウェアプロセッサは、記憶された履歴ラベル付きデータとは異なる、記憶された個人別ラベル付きデータの重みを用いて、個人別熱的快適性モデルをトレーニングする。ハードウェアプロセッサは、初期化期間の間の反復ごとに、個人別ラベル付きデータを用いて個人別ラベル付きデータベースを更新し、履歴データベース及び更新された個人別データベースを用いて個人別熱的快適性モデルを再トレーニングする。最後に、方法は、再トレーニングされた個人別熱的快適性モデルに基づいて一組のデバイスを、コントローラを介して制御することを含む。

本開示の別の実施の形態によれば、居住者のための暖房換気空調（ＨＶＡＣ）システムの動作を制御するシステムが提供される。システムは、ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリを備える。ラベル付きデータの各インスタンスは、少なくとも１つの環境の異なる状態における少なくとも１人の居住者の熱的快適性レベルを示す。システムは、メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングするハードウェアプロセッサを備える。メモリに記憶される前の個人別熱的快適性モデルは、履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化され、その結果、初期化期間の間に個人別熱的快適性モデルをトレーニングするための探索空間が制限される。システムは、居住者のバイオメトリックデータの測定値、居住者がいる環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信する入力インタフェースを備える。システムは、受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータのインスタンスの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、ラベル無しデータのインスタンスをラベル付けするように居住者に要求する送信機を備える。ラベル無しデータのインスタンスのラベル付けに応答して、ハードウェアプロセッサは、ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとしてメモリ内の個人別ラベル付きデータベースに記憶する。ハードウェアプロセッサは、記憶された履歴ラベル付きデータと比較して、記憶された個人別ラベル付きデータの異なる重みを用いて、個人別熱的快適性モデルをトレーニングする。それによって、初期化期間の間の反復ごとに、個人別ラベル付きデータを用いて個人別ラベル付きデータベースが更新され、履歴データベース及び更新された個人別データベースを用いて個人別熱的快適性モデルが再トレーニングされる。最後に、システムは、再トレーニングされた個人別熱的快適性モデルに基づいてＨＶＡＣシステムを制御するコントローラを備える。

ここに開示されている実施形態は、添付図面を参照して更に説明される。示されている図面は、必ずしも一律の縮尺というわけではなく、ここに開示されている実施形態の原理を示すことに強調が置かれている。

本開示の実施形態による、居住者の一組のデバイスの動作を制御する方法を示すフロー図である。本開示の実施形態による、システムの幾つかの構成要素を用いて実施される図１Ａのシステムを示すブロック図である。本開示の実施形態による、オフラインステージ及びオンラインステージを示す、図１Ａのシステムを示すブロック図である。本開示の実施形態による複数の同時ユーザからのデータ収集を示す概略図である。本開示の実施形態による、居住者のバイオメトリックデータを測定することができるとともに、環境内の環境データを測定することができるか又は環境内の測定された環境データを取得することができる環境内の居住者によるウェアラブルデバイスを示す概略図である。本開示の実施形態による、図１Ｃのシステムのオフラインステージを示すブロック図である。本開示の実施形態による、図１Ｃのシステムのオンラインステージの態様を示すブロック図である。本開示の実施形態による、不一致スコアに関する図１Ｃのシステムのオンラインステージの態様を示すブロック図である。本開示の実施形態による、不一致スコアの更なる態様に関する図１Ｃのシステムのオンラインステージの態様を示すブロック図である。本開示の実施形態による、代替のコンピュータ又はプロセッサを用いて実施することができる図１Ａ及び図１Ｂの方法を示すブロック図である。

上記で明らかにされた図面は、ここに開示されている実施形態を記載しているが、この論述において言及されるように、他の実施形態も意図されている。この開示は、限定ではなく代表例として例示の実施形態を提示している。ここに開示されている実施形態の原理の範囲及び趣旨に含まれる非常に多くの他の変更及び実施形態を、当業者は考案することができる。

概説
本開示は、空間内の居住者（複数の場合もある）の熱的快適性を最大にするとともに、ＨＶＡＣシステムのエネルギー消費を最小にするために、温度設定値及びＨＶＡＣシステムによって伝達される潜熱の量等の調整可能な設定の自動カスタマイゼーションのためのシステム及び方法を提供することに関する。

幾つかの実施形態は、調整された環境内の居住者の熱的快適性を記述した熱的快適性モデルに従って暖房換気空調（ＨＶＡＣ）システムを制御することが有利であるという理解に基づいている。これらのモデルは、居住者のバイオメトリックデータ及び環境内の状態のデータとともに居住者の熱的快適性を含む。

別の実現態様は、環境の居住者の個人別熱的快適性モデルを、その居住者自身によって提供される情報に基づいて作成することができることを認識していることに基づいている。しかしながら、そのような個人別熱的快適性モデルは、種々の環境状態における居住者の快適性レベルについて数百の居住者ラベル付きデータを必要とし、その結果、そのようなモデルは、ユーザから必要とされるそのような大量の入力データに起因して様々な意味で非実用的である。用語「ラベル付きデータ」は、各データ点が或る対象ラベルを用いてラベル付けされたデータセットと呼ぶことができる。例えば、少なくとも１つの温度センサの各温度測定値は、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含むユーザ／居住者の感覚に関連付けることができる。さらに、ユーザが値ごとに自身の感覚を報告した場合、データセットをラベル付けすることができる。ユーザが自身の感覚を１回又は２回報告した場合、データセットは、１つ又は２つのラベル付きの例しか含むことができない。例えば、居住者の熱的快適性レベルは、約５９度Ｆ〜６５度Ｆ以下の寒い快適性範囲と、約６１度Ｆ〜６７度Ｆ以下の涼しい快適性範囲と、約６８度Ｆ〜７２度Ｆ又は約６５度Ｆ〜７４度Ｆの心地よい快適性範囲と、約７０度Ｆ〜７５度Ｆ以上又は約７２度Ｆ〜７７度Ｆ以上の暖かい快適性範囲と、約７３度Ｆ〜７５度Ｆ以上又は約７４度Ｆ〜８０度Ｆ以上の暑い快適性範囲とを含むことができる。もちろん、これらの温度範囲はユーザごとに変化し、他の要因、すなわち、湿度、室内風速、室内日射量、居住者の心拍数、居住者の活動レベル、居住者の健康状態、居住者の警戒状態等に応じて主観的なものでもある。居住者が熱的快適性レベルを知覚する環境は、建物の内部、建物の部分的な内部、屋根及び少なくとも１つの壁を有する構造物、又は建造された構造物のうちの１つとすることができる。

ラベル付けされるデータの例は、居住者のバイオメトリックデータ、例えば、居住者の生命兆候と、環境データ、例えば、調整された環境内の温度、湿度、空気流との様々な組み合わせを含むことができる。多くの状況において、ラベル無しデータのインスタンスの測定値を取得することは困難ではない。例えば、バイオメトリックデータは、ウェアラブルデバイス、例えば、ユーザが装着したスマートウォッチによって測定することができる一方、環境データもウェアラブルデバイスによって測定することができ、及び／又は、環境内に設置された様々なセンサによって測定することができる。そのために、個人別熱的快適性モデルの作成において、幾つかの実施形態は、個人ユーザから更なる入力を必要とする各個人ユーザのラベル無しデータが大量にあるときに問題に直面する。しかしながら、そのような入力情報をその個人ユーザから得ることは、熱的快適性モデルをトレーニングするのに十分な量のフィードバックを提供するようにユーザに要求することになり、実情にそぐわない可能性がある。さらに、ユーザは、多くのラベルを提供するように期待されるだけでなく、ユーザの利益も先延ばしされ、そのようなモデルから受ける報酬は、ユーザが数百以上のラベルを提供した後にしか得られない。

幾つかの実施形態は、一群の人々の集約された熱的快適性を記述するために、ＨＶＡＣシステムの異なるユーザによって提供されるデータに基づいて熱的快適性モデルを作成することができるという認識に基づいている。しかしながら、そのようなモデルは、実世界における個人の快適性までも正確に予測することはできない。なぜならば、一群の中の各ユーザは、異なる快適性の好みを有する場合があるからである。特に、モデルをトレーニングするためにユーザに要求されるラベルは主観的であり、複数のユーザによるフィードバックからモデルをトレーニングするために能動学習によって用いられる通常の技法は、個人別熱制御のシナリオには不向きである。

幾つかの実施形態は、個人別熱的快適性モデルは、当該個人別熱的快適性モデルのユーザによって提供されるラベル付きデータと、他のユーザによって提供されるラベル付きデータ、すなわち、履歴居住者データとの双方を用いるハイブリッド手法を使用して学習することができるという理解に基づいている。そのようなハイブリッド手法／フレームワークによって、ユーザの個人別熱的快適性モデルをトレーニングするためにユーザに要求されるラベル付きデータインスタンスの数を削減することが可能になり、これによって、ユーザに対する妨害が削減され、フィードバックを提供するユーザの意欲が増す。特に、このフレームワークは、能動学習及び転移学習の機械学習の分野を組み合わせて、熱的快適性の正確なモデルを得るのに必要とされるラベル付けの手間を削減する。

換言すれば、本開示の態様は、学習を容易にすることを目標として、１つのドメインからの知識が別のドメインに転移される機械学習の一タイプである転移学習を含む。少なくとも１つの実施形態では、ドメインとは異なるユーザを指し、具体的には、ソースドメインは、Ｎ−１人のユーザからのデータに関係し、ターゲットドメインは、第Ｎのユーザからのデータを指す。データのドメインがこのように記述され、ラベル付きデータがソースドメイン及びターゲットドメインの双方において利用可能であるとき、転移学習手法は、本明細書において帰納転移学習手法とみなすことができる。本開示の新規性を有する少なくとも１つの態様は、特に、ターゲットドメイン内の全てのラベル付きデータにアクセスするという前提がないものとすることができる。非限定的な例として、帰納転移学習の少なくとも１つの手法は、パラメータ転移とすることができ、この場合、類似のタスクの個々のモデルのパラメータは、同じ事前分布又は同様の事前分布からサンプリングされることになることが前提となっている。

加えて、上述したように、このハイブリッド手法によって、ユーザによって占有される環境においてＨＶＡＣを制御するためにそのトレーニングされたモデルの利用を開始する待機時間の削減が可能になり、これによって、さらに、ＨＶＡＣシステムのエネルギー消費が削減される。さらに、フィードバック情報の要求が削減されることによって、個人別熱的快適性モデルを構築するシステムのメモリ、ネットワークトラフィック、及び所要計算量を削減することができる。しかしながら、ユーザのフィードバックを他のユーザからのフィードバックと組み合わせるそのようなハイブリッド手法は、異なる快適性の好みを有する他のユーザがモデルのフィードバックを提供するときに、個人別熱的快適性モデルの精度を低下させる可能性がある。

さらに、このハイブリッド手法は、ターゲットドメイン内のセットアップデータがターゲットユーザによって提供された少数のラベル付きデータインスタンスからなるとき、回帰問題のパラメータ転移を考慮する。したがって、本開示の幾つかの手法の一態様は、パラメータ共有はシーケンシャルなものとすることができるということであり、ソースドメイン内のパラメータが最初に学習され、この情報は、ターゲットドメインにおいて利用可能になるデータとして利用される。例えば、幾人かのユーザは、システムの使用を通じてデータを提供してきている。それらのユーザのデータは、ソースドメインにおいて汎用熱的快適性モデルを学習するのに用いられる。新たなユーザがシステムに与えられると、この汎用モデルは、この新たなユーザのフィードバックの手間を削減するのに用いられる情報として提供される。

具体的には、このパラメータ共有手法は、第１に、ソースドメインパラメータを学習する。すなわち、ソースドメインにおいて熱的快適性の汎用モデルを学習する。第２に、ソースドメインモデルパラメータからのターゲットドメインモデルパラメータの偏差にペナルティが科される。すなわち、新たなユーザは、個人別モデルではあるが、熱的快適性の包括モデルに類似しているもののみを有することが可能になる。少なくとも１つの付加的な利益及び付加的な利点は、ターゲットドメインデータがない場合には、予測モデルは、ソースドメインモデルに依拠して、ランダムな推測よりも良好な予測を行うことができるということである。

そのために、幾つかの実施形態は、ユーザによって提供される個人別データベース内のラベル付きデータと、他のユーザによって提供される共通データベース内のラベル付きデータとについて異なるモデル重みを用いてユーザの個人別熱的快適性モデルを構築することによってこの制限に対処するためにハイブリッド手法を修正する。この手法によって、モデルの学習及び／又はトレーニング用に提供されるラベル付きデータの信頼性を考慮することが可能になる。加えて、新たなフィードバックがユーザから受信されると、ラベル付きデータのこの新たなインスタンスを用いてモデルを更新するのではなく、ラベル付きデータのこの新たなインスタンスを個人別データベースに付加し、モデルを最初から再トレーニングする動作を開始することができる。したがって、この手法によって、特に、ユーザによって提供されたデータに向けたモデルのより高速な学習を可能にすることができる。

さらに、モデルの再トレーニングによって、トレーニング中にユーザのフィードバックデータの重みを調整することを可能にすることができる。例えば、幾つかの実施形態では、ユーザによって提供された個人別データベース内のラベル付きデータの重み、及び／又は、他のユーザによって提供された共通データベース内のラベル付きデータの重みは、個人別データベース内のラベル付きデータのインスタンスの数の関数、及び／又は、個人別データベース内のラベル付きデータのインスタンスの数と共通データベース内のラベル付きデータのインスタンスの数との比の関数である。そのようにして、それらの実施形態は、トレーニングされたモデルに対する共通データベース内のラベル付きデータの影響を軽減することができる。例えば、個人別データベースが、十分な数のラベル付きデータインスタンスを有するとき、幾つかの実施形態は、ＨＶＡＣシステムの制御を中断することなく、共通データベースからラベル付きデータを段階的に除去する。例えば、１つの実施形態は、或る特定の数のラベル付きインスタンスが個人別データベースに蓄積された後、個人別データベース及び調節された個人別モデル重みのみをモデルのその後のトレーニング及び／又は更新に用いる。

図１Ａは、本開示の実施形態による、居住者の一組のデバイスの動作を制御する方法を示すブロック図である。

ステップ１１０は、方法１００が、事前にトレーニングされた個人別熱的快適性モデルを有するメモリを用いることを含む。記憶されている事前にトレーニングされた個人別熱的快適性モデルは、記憶される前であって、個人別熱的快適性モデルの反復トレーニングの前に、履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化される。この反復トレーニングは、リアルタイムデータ及び能動学習アルゴリズムを用いる。

転移学習アルゴリズムは、本開示による、学習を容易にすることを目的として１つのドメインからの知識が別のドメインに転移される機械学習タイプのものとすることができる。例えば、本開示の実施形態の構成によれば、Ｎ人のユーザを仮定すると、ドメインは異なるユーザを指し、具体的には、ソースドメインは、Ｎ−１人のユーザからのデータ（履歴ラベル付きデータ）に関するものであり、ターゲットドメインは、第Ｎのユーザからのデータ（個人別ラベル付きデータ）を指す。熱的快適性を予測することは、ラベル付きデータがソースドメイン及びターゲットドメインの双方において利用可能である帰納転移学習に該当するが、従来の転移学習アルゴリズムと対比した本開示の実施形態による相違は、ターゲットドメインにおける全てのラベル付きデータにアクセスすることを前提としないということである。具体的には、転移能動学習フレームワークの少なくとも１つの態様は、転移学習を介して他のユーザからのドメイン知識を利用しながら、能動学習を介して、ユーザごとに収集されるフィードバックを最小にするものとすることができる。必要とされるラベル付けのこの削減を行うために、フレームワークは、転移学習を用いて、少数のベースユーザからの知識、すなわち、制御された実験の初期ユーザの部分のグループを利用し、クイックスタートモデリング及びストリーミングベース能動学習用に変更される転移能動学習フレームワークを得る。

ステップ１１５は、方法１００が、初期化期間の間に、ハードウェアプロセッサを用いて、個人別熱的快適性モデルを反復してトレーニングすることを含む。個人別熱的快適性モデルは、環境内の居住者のためのモデルであり、その居住者自身が提供した情報に基づいている。個人別熱的快適性モデルは、特定の用途に応じて、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンの１つ又は組み合わせとすることができる。

図１Ａのステップ１１５を引き続き参照すると、ハードウェアプロセッサは、履歴ラベル付きデータを有する事前にトレーニングされた熱的快適性モデルに対する個人別熱的快適性モデルの正則化に基づいて、個人別熱的快適性モデルを反復してトレーニングする。この正則化は、初期化期間の間に個人別熱的快適性モデルをトレーニングする探索空間を制限する。正則化は、履歴ラベル付きデータに基づく事前にトレーニングされた熱的快適性モデルと大幅に異なるモデルへのコストの追加と呼ぶことができる。

図１Ａのステップ１１５を引き続き参照すると、個人別熱的快適性モデルは、個人別熱的快適性モデルの精度レベルが閾値を上回るまで、能動学習及び転移学習を用いて反復してトレーニングされ、その後、居住者が不快感を覚えていると判断し、リアルタイムラベルを観測データに与えるまで、この個人別熱的快適性モデルを用いることができる。上記閾値は、熱的快適スケール上の点の１／２に等しくなるように閾値を設定すること、学習を用いて、ユーザがそのレベルを上回ると通常快適であると知覚する誤差レベルを見分けること、又は他の適した方法を含む多数の方法で求めることもできるし、特定の用途に応じて求めることもできる。閾値は、通常、国際的に容認された熱的快適スケール、又は、履歴データベース内の履歴ラベル付きデータに基づくことになる。

メモリは、履歴ラベル付きデータを有する履歴データベースを含むことができるデータを記憶している。メモリは、方法１００の実施中に、個人別ラベル付きデータベースに個人別ラベル付きデータも記憶することができる。ラベル付きデータの各インスタンス（履歴及び個人別）は、少なくとも１つの環境の異なる状態にある少なくとも１人の居住者の熱的快適性レベルを示す。

記憶された熱的快適性モデルは、履歴ラベル付きデータに基づくことができる。この履歴データは、サンプル環境データが居住者の環境と異なる環境、居住者の環境と同じ環境又はそれらの双方のうちの１つとなるように、少なくとも１人のサンプル居住者によって一組のサンプルデバイス内のデバイスに提供されたデバイスに関する使用履歴データに基づいてサンプル環境内の少なくとも１人のサンプル居住者によって選択された少なくとも１つのサンプル居住者データ、サンプル環境データ及びサンプル熱的快適性レベルを含むデータのインスタンスのシーケンスを含むことができる。熱的快適性レベルデータは、少なくとも１つのサンプル環境の異なる状態におけるサンプル居住者の快適性を示すデータのインスタンスを含む。さらに、履歴データのうちの幾つかのデータは、方法１００のユーザの現在の使用と比較される、この方法が実施される前の或る以前の時点に収集された現在のユーザ（居住者）からのものとすることができる。

図１Ａのステップ１１５を引き続き参照すると、特に、履歴ラベル付きデータは、現在のユーザのバイオメトリックデータと同様の又はユーザの環境に対する環境データの現在の測定値と同様のサンプル居住者のバイオメトリックデータの測定値又はサンプル環境内の環境データの測定値とすることができる。居住者の熱的快適性レベルは、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含むことができる。

個人別ラベル付きデータは、メモリに記憶されたラベル無しデータのインスタンスを個人別ラベル付きデータとしてラベル付けした居住者を含むことができる。上述したように、居住者ラベル付きデータの各インスタンスは、少なくとも１つの環境の異なる状態における少なくとも１人の居住者の熱的快適性レベルを示す。

ステップ１２０は、居住者のバイオメトリックデータの測定値と、居住者がいる環境内の環境データの測定値とを含むラベル無しリアルタイムデータのシーケンスを受信することを含む。データのシーケンスは、１秒未満から１時間、１週間、１カ月又は１年の範囲の期間の間に取得されるデータを含むことができる。例えば、ラベル無しリアルタイムデータは、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値等の居住者のバイオメトリックデータの測定値に関するデータとすることができる。他のラベル無しリアルタイムデータは、居住者がいる環境内の環境データの測定値を含むことができ、この環境データは、温度、明るさ、音量、空気流量又は日射量等のデータを含むことができる。

ステップ１２５は、受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルと、ラベル無しデータ点の予測ラベルとの間に不一致があるときに、ラベル無しデータのインスタンスにラベル付けするように居住者に要求することを含む。履歴データ内の不一致が所定の閾値よりも高いとき、ラベルが要求される。履歴不一致を得るために、まず、ラベル無し（新たな）データ点のＫ個の最近傍が特定される。次に、これらのＫ個の最近傍のラベルとラベル無しデータ点に関する予測ラベルとの間の不一致スコアが計算され、このスコアが閾値を超えている場合、アルゴリズムはラベルを要求する。

上記所定の閾値は、全ての新たなユーザデータが既知であるときに最も高い不一致を選ぶこと、全ての履歴データ間の不一致を事前に計算して、これらの不一致スコアの或るパーセンテージに閾値を設定すること、所望のモデリングエラーメトリック等の関数として不一致を設定すること、又は特定の態様に応じた他の或る方法を含む多くの方法によって選ぶことができる。

ステップ１３０は、居住者がラベル無しデータのインスタンスをラベル付けしたことを含む居住者からの応答を受信することを含む。ラベル無しデータのインスタンスをラベル付けすることに応答して、ハードウェアプロセッサは、ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとしてメモリ内の個人別ラベル付きデータベースに記憶する。その後、ハードウェアプロセッサは、記憶された履歴ラベル付きデータと比較して、記憶された個人別ラベル付きデータの異なる重みを用いて個人別熱的快適性モデルをトレーニングする。それによって、初期化期間中の反復ごとに、ハードウェアプロセッサは、個人別ラベル付きデータを用いて個人別ラベル付きデータベースを更新するとともに、履歴データベース及び更新された個人別データベースを用いて個人別熱的快適性モデルを再トレーニングする。

ステップ１３０は、熱的快適性モデリングのためのラベル付けの手間を削減する手法として能動学習を転移学習と組み合わせる。本開示による能動学習について、この能動学習は、学習すべき例を選ぶことが可能であるときに予測モデルが良好な性能を達成する機械学習のタイプのものである。能動学習者は、クエリを介してラベル付けされるサンプルを選び、次に、選ばれたサンプルのラベルを提供するようにオラクルに要求する。能動回帰学習は、モデルフリーの手法とモデルベース手法とに細分することができる。

モデルフリー戦略は、ラベル付けするデータサンプルを決定するのに予測モデルに依拠しない能動学習手法である。その代わりに、これらの手法は、データ分布の統計だけに依拠する。本開示の実施形態に関するモデルフリーの能動学習手法において直面する難題は、連続するクエリが、既得された事前知識を考慮せず、多くの場合、冗長なクエリを発行することになってしまうということである。したがって、モデルフリーの能動学習手法は、問題設定が人間ユーザのラベル付けを伴うとき、ユーザが自発的にラベル付けするクエリの数について極端な制約があるので、本開示の実施形態に適していない。

引き続きステップ１３０を参照すると、回帰モデルを構築する場合のモデルベース能動学習は、全汎化誤差が最小にされるように、モデル分散を最小にすることに焦点を当てている。回帰の分散削減技法を用いる際の課題は、データ分布全体に関する統計を計算しなければならず、したがって、サンプルが一度に１つずつ到来するとき、計算を実現することができないということである。このことは、本開示の実施形態が、完全なデータ分布の知識が知られていないストリームベース設定に移植されることになるので、重要である。ここで、ストリームベース設定とは、データがセンサによって観測されたときにその値が求められ、値を求める前に記憶されないことを示す。これは、値を求める前に全ての新たなデータの収集を必須又は必要とする従来の手法と異なる。

本開示の実施形態は、まず、転移学習手法と能動学習手法とを組み合わせるときに共変量シフトを取り扱うために重要度重みを計算することに依拠しない独自の態様を非限定的な例によって提供する。そのため、これらの重要度重みは、ソースドメイン及びターゲットドメインにおける周辺分布の確率密度を推定することによって計算される。これは、高次元であるが、低いサンプルカウントを有するデータセットにおいては困難である。これは、本開示の実施形態のデータセットの場合に当てはまる。第２に、モデルフリーの手法及びモデルベース手法の双方をストリームベース設定に実施することはできず、必然的に作り直さなければならない。これとは対照的に、本開示の実施形態は、とりわけ、ストリームベース設定に対する変更を最小限にして実施することができる手法を含む。

ステップ１３５は、再トレーニングされた個人別熱的快適性モデルに基づいて一組のデバイスを制御することを含む。

図１Ｂは、本開示の実施形態による図１Ａのシステムを示すブロック図であり、このシステムは、幾つかの構成要素を用いて実施される。図１Ｂは、入力インタフェース１４２、居住者送受信機１４４、メモリ１４６、送信機１４８、コントローラ１５０と通信するハードウェアプロセッサ１４０を含むことができる。コントローラは、一組のデバイス１５２に接続することができる。居住者送受信機１４４は、居住者（ユーザ）が一組のデバイス１５２を制御するために装着するとともに情報を送受信することができるウェアラブル電子デバイスとすることができる。

ハードウェアプロセッサ１４０は、特定の用途の要求に応じて２つ以上のハードウェアプロセッサを含むことができることが考えられる。もちろん、入力インタフェース、出力インタフェース及び送受信機を含む他の構成要素を方法１００とともに用いることもできる。

引き続き図１Ｂを参照すると、方法１００の態様は、入力インタフェース１４２からラベル無しリアルタイムデータのシーケンスを受信するステップ１２０を含む。ステップ１２２は、ラベル無しリアルタイムデータから、類似する記憶履歴データと、ラベル付きインスタンスとラベル無しデータインスタンスの予測ラベルとの間の不一致とを特定することを含む。ステップ１２４は、ステップ１２２から特定された不一致を所定の閾値と比較し、不一致がこの閾値を超えているか否かを識別する判定を含む。不一致が所定の閾値を超えていない場合、すなわち、ＮＯである場合、方法はステップ１２６に進む。不一致が所定の閾値を超えている場合、すなわち、ＹＥＳである場合、方法はステップ１２５に進む。ステップ１２５において、居住者への、ラベル無しデータのインスタンスのラベル付けの居住者要求が、送信機１４８を介して行われる。ステップ１３０は、居住者がラベル無しデータのインスタンスをラベル付けしたという居住者応答を、送信機１４８を介して受信することを含む。すなわち、このラベル付けされたデータは、個人用ラベル付きデータであり、メモリに記憶される。ステップ１３５は、ラベル無しデータの居住者ラベル付きインスタンスが記憶されている個人別ラベル付きデータベースを更新することを含み、履歴熱的快適性モデル及び更新された個人別データベースを用いて個人別熱的快適性モデルを再トレーニングする。

図１Ｃは、本開示の実施形態による、オフラインステージ及びオンラインステージを示す図１Ａのシステムを示すブロック図である。

方法１００は、２つのステージ、すなわち、オフラインステージ１１１及びオンラインステージ１１２からなることができる。オフラインステージ１１１は、初期化期間の間に個人別熱的快適性モデル１４７を反復してトレーニングする。この反復トレーニングは、メモリ１４６に記憶された履歴熱的快適性モデルに対する個人別熱的快適性モデルの正則化に基づくことができる。この正則化は、初期化期間の間に個人別熱的快適性モデルをトレーニングするための探索空間の制限をもたらす。特に、正則化は、メモリ内の履歴データベースに記憶された履歴ラベル付きデータに関して特定された履歴熱的快適性モデルの重みと比較して、メモリ内の個人別データベースに記憶されている受信された個人別ラベル付きデータの関数としての個人別熱的快適性モデルの異なる重みを用いる。

引き続き図１Ｃを参照すると、オンラインステージ１１２は、入力インタフェース１４２が、居住者のバイオメトリックデータの測定値、居住者がいる環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信することを含むことができる。入力インタフェース１４２は、メモリ１４６に接続することができ、ステップ１２０へデータを供給する。受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータ点に関する予測ラベルとの間の不一致が所定の閾値を超えているとき（ステップ１２４）、ラベル無しデータのインスタンスをラベル付けするように居住者に要求する（ステップ１２５）ために送信機１４８を用いることができる。居住者がラベル無しデータのインスタンスをラベル付けした（ステップ１３０）ことに応答して、ハードウェアプロセッサは、ラベル無しデータの居住者ラベル付きインスタンスをメモリ１４６に記憶することができ、ラベル無しデータの記憶された居住者ラベル付きインスタンスを用いて個人別ラベル付きデータベースを更新することができ、履歴熱的快適性モデル及び更新された個人別データベースを用いて個人別熱的快適性モデルを再トレーニングすることができる。コントローラ１５０は、再トレーニングされた個人別熱的快適性モデルに基づいて一組のデバイス１５２を制御するのに用いることができる。

図２Ａは、本開示の実施形態による複数の同時ユーザからのデータ収集を示す概略図である。例えば、図２Ａは、複数のユーザの個々の快適性を最適化するように共有空間においてＨＶＡＣシステムを制御するときの複数の居住者２０７、２０７Ｎの組み合わせを示している。

特に、図２Ａは、Ｎ人のユーザのそれぞれについて、システムが、そのユーザの環境からのデータ（環境データ）２０１と、そのユーザの身体からのデータ（バイオメトリックデータ）２０２と、外部環境からのデータ（天候データ）２０３と、これらのデータに関連した時間情報２０４とを収集することを示している。各ユーザは、クエリ要求を受信する方法（クエリ要求受信）２０５と、フィードバックをシステムに提供する方法（快適性レベルのユーザフィードバック）２０６とを有する。これらのデータは、データベースに集約することができ、このデータベースは、本開示において説明するように、その後、個人用熱的快適性モデルを作成するのに用いられる。これらのモデルは、その後、快適性スコア最適化アルゴリズムが、ユーザ熱的快適性を最大にする最適なＨＶＡＣ設定値を求めるのに用いられる。

換言すれば、図２Ａは、ユーザが、ユーザＮ−データ取得セット２０７Ｎとともにユーザ１−データ取得セット２０７を含むことができることを示し、ユーザデータ（ユーザ１、２０７及びユーザＮ、２０７Ｎ）は、管理デバイス２４０と通信され、例えば、これは、特定の用途に応じて、プロセッサ１４０であってもよいし、異なるプロセッサであってもよいし、互いに通信する複数のプロセッサとすることもできる。管理デバイス２４０内には、非限定的な例として、ユーザＮの更新予測モデル２４４と通信し、トレーニングデータ２４６と通信するユーザ１の更新予測モデル２４２が存在することができる。ユーザ１の予測モデル２４２及びユーザＮの予測モデル２４４は、快適性スコア最適化部２４８と通信することができ、快適性スコア最適化部は、ＨＶＡＣ設定点部２５２と通信する。

図２Ｂは、本開示の実施形態による、居住者のバイオメトリックデータを測定することができるとともに、環境内の環境データを測定することができるか又は環境内の測定された環境データを取得することができる環境内の居住者によるウェアラブルデバイスを示す概略図である。

例えば、ウェアラブルデバイス１４４は、居住者２２９が装着することができ、当該居住者のバイオメトリックデータを測定／収集することができる。例えば、バイオメトリックデータのタイプは、非限定的な例として、居住者が環境内で特定の時点にどのように感じているのかの変化又はスケーリング２２０、すなわち、暑い２２１、暖かい２２２、わずかに暖かい２２３、中立若しくはおそらく心地よい２２４、わずかに寒い２２５、涼しい２２６又は寒い２２７を含むことができる。もちろん、これらの変化は、１〜１０、１〜１００等の範囲の数値若しくは文字、又は、居住者が環境内で特定の時点にどのように感じているのかを示す他の或る類似の態様等によって異なって提示することもできる。

ウェアラブルデバイス１４４は、本開示の実施形態に従って、環境内の環境データを測定することもできるし、環境内の測定された環境データを取得することもできる。現在、この図は、熱的快適性レベルが重ね合わされたウェアラブルデバイスを示している。これは、ユーザがフィードバックを提供することができる可能なスケールを例示している。ユーザが用いることができる代替の方法は、ユーザの音声又はジェスチャーを用いたフィードバックを含むが、これらに限定されるものではない。

図３は、本開示の実施形態による、図１Ｃのシステムのオフラインステージを示すブロック図である。図３は、集団レベルモデルＷｐを求めることができる方法を示している。集団レベルモードＷｐは、履歴データベースにおいてラベル付きデータを記述するのに用いられるモデルである。Ｗｐを求めるために、履歴データベース（全てのユーザ）からの全てのラベル付きデータが単一の大規模データセットに組み合わされる。次に、各ユーザのデータからサンプリングが行われ、個人用熱的快適性学習アルゴリズムの学習パラメータを調節する適切なパーセンテージが求められる。これに続いて、この新たなデータセットに名称が与えられる。この名称は、開発データセットとすることができる。この開発データセット及び交差検証技法を用いて、必要とされるモデリングパラメータが求められる。次に、大規模データセットの残り及び学習されたモデリングパラメータを用いて、ラベル付き履歴データベースに関する集団レベルモデルＷｐが学習される。それらの結果及びデータは履歴データベースに記憶される。

図４Ａは、本開示の実施形態による、図１Ｃのシステムのオンラインステージの態様を示すブロック図である。図４Ａは、現在のラベル無しデータ点に類似するラベル付き履歴データのインスタンスのラベルと、ラベル無しデータ点の予測ラベルとの間の不一致スコアを求める方法を含むことができる。

例えば、ステップ１２２は、受信されたラベル無しデータを記憶されたデータに関連付けて、受信されたラベル無しデータと、類似する記憶された履歴ラベル付きデータとの間の不一致の数を求める態様に関するものである。

図４Ａのステップ４１１は、履歴データベースに記憶されたラベル付きデータ点ごとに、そのデータ点と新たなラベル無しデータ点との間の距離を求めることを説明している。

図４Ａのステップ４１２は、これらの距離をベクトルの形で記憶し、このベクトルをソートすることを含む。

図４Ａのステップ４１３は、Ｋ個の最小距離を選び、それらのラベルを履歴データベースから取得することを説明している。

図４Ａのステップ４１４は、ユーザモデルの現在のバージョンを用い、履歴データベースからのラベルとラベル無しデータ点の予測ラベルとを用いて不一致メトリックを計算する方法を示している。

換言すれば、不一致スコアを計算するために、第１に（４１１）、新たなラベル無しデータ点とラベル付き履歴データベース内の全てのデータ点との間の距離が求められる。第２に（４１２）、これらの距離がベクトルの形で記憶され、このベクトルがソートされる。すなわち、これらの距離がソートされる。第３に（４１３）、Ｋ個の最小距離が選ばれ、それらのラベルが履歴データベースから取得される。第４に（４１４）、ラベル無しデータ点のラベルが予測され、次に、不一致スコアが計算される。すなわち、ユーザモデルの現在のバージョンを用い、履歴データベースからのラベルとラベル無しデータ点の予測ラベルとを用いて不一致メトリックが計算される。

図４Ｂは、本開示の実施形態による、図１Ｃのシステムのオンラインステージの態様を示すブロック図である。例えば、図４Ｂは、図１Ｃのステップ１２２の後に、すなわち、受信されたラベル無しデータを記憶されたデータに関連付けて、受信されたラベル無しデータと、類似する記憶された履歴ラベル付きデータとの間の不一致の数を求めた後に、所定の閾値が更新されているか否かについてメモリを調べるステップであるステップ４２７を含むことができる。

ステップ１４６はメモリが行うステップであり、ステップ４２９は、所定の閾値が更新されているか否かを判断するステップである。更新されていない場合（４３１）、処理はステップ１２４に進む。更新されている場合（４３３）、所定の閾値は更新され、処理はステップ１２４に進む。

図４Ｂのステップ１２４は、不一致スコアが所定の閾値を超えているか否かを判断することを含む。ＹＥＳである場合、すなわち、不一致スコアが所定の閾値を超えている場合には、システムは居住者にラベルを要求する（１２５）。不一致スコアが閾値を超えていない場合には、動作は実行されない（１２６）。

図４Ｃは、本開示の実施形態による、図１Ｃのシステムのオンラインステージの態様を示すブロック図である。例えば、図４Ｃは、ユーザラベルが取得されると、個人別熱的快適性モデルをどのように取得するかについての、本開示の実施形態によるステップ１３０を含むことができる。

図４Ｃのステップ４３２は、個人別データベース内のラベル付きデータ点の数が最小閾値を超えているか否かに関する判定を含む。

図４Ｃのステップ４３４に関して、ＹＥＳである場合、すなわち、個人別データベース内のラベル付きデータ点の数が最小閾値を超えている場合には、処理はステップ４３４に進む。その場合、履歴データベースを用いて学習された集団レベルモデルＷｐは、現在の個人別モデルに設定される。次のステップはステップ４４０である。次に、処理はステップ４４０に進む。このステップは、Ｗｐ及び個人別データベースを用いて、更新されたモデルを見つけることを含む。

図４Ｃのステップ４３６に関して、ＮＯである場合、すなわち、個人別データベース内のラベル付きデータ点の数が最小閾値を超えていない場合には、処理はステップ４３６に進む。その場合、集団レベルモデルＷｐが履歴データベースから導出される。

熱的快適性予測の転移能動学習フレームワーク
表記法
本開示の態様の紹介に際して、まず、或る表記法を導入する。例えば、Ｄ＝（ｘ^ｉ，ｙ^ｉ） ∀ｉ∈｛ｌｎ｝の形のｎ個のラベル付きサンプルを含むデータセットＤが与えられるものと仮定する。ここで、各ｘ^ｉは特徴ベクトルに対応し、それぞれは実数値ｘ^ｉ∈Ｒ^ｐであり、それぞれはウェアラブルセンサ及び周囲室内センサからのデータに対応する。インデックスｉはサンプル番号を示す一方、ｐは、予測モデルにおいて用いられる特徴量の数に対応するベクトルの長さを示す。便宜上、ｎ個のラベル付きデータサンプルは全て、ｎ行ｐ列を有する計画行列と呼ばれる行列Ｘとして表される。目標値ｙ^ｉは、既定の集合ｙ^ｉ∈｛０，±１，±２，±３｝から取り出される。これらは、ユーザからフィードバックとして与えられる熱的快適性等級に対応する。

数ある目標の中でも特に本開示の少なくとも１つの目標は、任意の入力ベクトルｘについて、予測目標値

を出力する予測モデルｈ、ｈ：ｘ→ｙを学習することである。この特定の例では、予測モデルは回帰を用いて学習されるので、予測目標値は、平方値に関して、

として、実際の目標値

からεよりも大きく逸脱してはならないことが条件として要求される。

転移学習への履歴データの使用
この分野を展開するために、目標値ｙは、範囲｛−３，＋３｝に制限される連続値として扱われる。ここでの固有の仮定は、ユーザは自身の状態を７つのレベルに離散化するように要求されるが、実際には、ユーザの熱的快適性ははるかに多くの微妙な違いを有するということである。

熱的快適性予測の問題を回帰問題として取り扱うことによって、クラス不均衡の問題が検討される。特に、ほとんどのユーザはＨＶＡＣ制御空間にいるので、受信されたほとんどのフィードバックは、非常に寒いクラス、寒いクラス、暑いクラス及び非常に暑いクラスの厳しいクラス不均衡をもたらす範囲｛−１，＋１｝にある。したがって、回帰方法を用いることは、熱的快適性予測器をトレーニングするときの自然な手法である。

この手法を簡単に実証するために、線形回帰が用いられる。線形回帰は、モデル出力に対する各特徴量の影響のより容易な定量化を提供することができる。線形回帰を求めるには、計画行列と重みベクトルとの乗算が目標値の推定値

を生成するような重みベクトルＷを見つける必要がある。

リグレッサー重みベクトルを見つける手法は、最小二乗推定法（ＯＬＳ：ordinary least squares）と呼ばれる。ＯＬＳの目標は、特に、推定された目標値と実際の目標値との差の二乗和を最小にすることである。これらの差は残差と呼ばれ、最適化目標として記述されることが多い残差の和は、以下の式として表される。

ＷのＯＬＳ推定値は、モデル重みの分散が高くなる傾向があるとともに、特徴量間での重みの配分（選択）が不十分になる傾向がある。さらに、この問題に対する従来の解析的解法は良設定ではなく、データ行列を容易に反転することができない場合には、数値問題を有するという難点がある。

これらの問題を改善するために、ペナルティがリグレッサー重みベクトルに導入される。この分野では、ペナルティは２ノルムの形を取り、これは、以下の式がリッジ回帰フレームワークに従うことを意味する。ここで、２ノルムは、相関性がある特徴量の取り扱いがより有益であることから選ばれる。追加されるペナルティパラメータは、モデル分散を削減し、その結果、或る特徴量重みを０に近くすることができる解が得られる。これは、多くの場合、特徴量選択と呼ばれる。解くべき新たな目的関数は、したがって、以下の式である。

式（３）において、λは、解におけるペナルティ項の重みを決定するペナルティパラメータである。λを増加させると、Ｗにおける重み係数は小さくなり、λを減少させると、Ｗにおける重み係数は大きくなる。このため、λは、リグレッサー係数の縮小を制御すると言われる。

従来、リッジ回帰を利用するとき、この縮小パラメータは、モデル誤り性能を損なうことなく係数を０に近づけていくように最適化される。リッジ回帰に対するこの従来の手法は、重みベクトル係数が、ゼロ平均及び分散＝

を有する事前正規分布からサンプリングされるベイズ的解釈を有する。

リッジ回帰に対する代替の手法は、係数を非ゼロの事前分布に向けて縮小することである。この手法が取られるとき、非ゼロの事前分布は、この問題についての或る事前知識を表す。この場合、事前分布に向けた係数の縮小はドメイン知識の転移を誘発すると言われる。なぜならば、見つけられる重みベクトルは、可能な限り事前分布に近くあるべきであるからである。修正されたリッジＯＬＳは以下の形を有する。

式（４）において、履歴データベースから取得される集団レベルモデルＷ_ｐは、サンプルリグレッサーベクトルを含むベクトルである。このベクトルは、上述した事前分布の平均を表す。Ｗ_ｐを０に設定することによって、式（３）からの従来のリッジＯＬＳが得られることに留意されたい。

本開示による事前リグレッサーＷ_ｐを推定する手法は複数存在する。この分野では、ユーザ間に強い類似性が存在し、モデルをわずかに変更するだけで新たな個人に適合するに違いないことが前提とされる。この前提は、体温調節の生理機能が人同士で異ならないということにその根拠がある。個人の好みが異なるだけである。

熱的快適性モデリングの場合における転移学習の１つの便利な事前知識は、一群のユーザにわたる包括的な熱的快適性である。すなわち、Ｎ人の異なるユーザから収集されたＮ個のデータセットがあるものと仮定する。その場合、式（３）を用いて、Ｎ−１人のユーザからのデータを記述する一般的な線形リグレッサーを見つけることができる。このリグレッサーは、本発明者らの集団モデルＷ_ｐと呼ばれる。その後、式（４）が使用される。

次に、式（４）を解くと、第Ｎのユーザの個人別熱的快適性モデルが得られる。事前知識を導入するこの手法は、新たなユーザの係数Ｗが、個人差を認めつつも他のユーザとほとんど同様であるはずであるという考えを直感的に捉えたものである。

この問題を最適化問題として具体的に設定すると、リッジ回帰係数は、以下の目的関数を最小にすることによって学習される。

この定式化において、第１項は、式（３）の通常の形式を有する損失関数であり、第２項は、事前モデルＷ_ｐからの新たなモデルＷのリッジ係数の偏差にペナルティを科すものである。この目的関数を新たなリグレッサー重みベクトルＷで微分し、微分したものを０に設定すると、以下の解析解が得られ、この解析解は、修正リッジ回帰と呼ばれる。

能動学習の組み込み
このフレームワークの少なくとも１つの目標は、各ユーザからの大規模なトレーニングデータセットの収集を必要とせず、個人用熱的快適性を予測する回帰モデルを作成することである。これまで、フレームワークの転移学習構成要素を導入してきたが、モデルを第Ｎのユーザに個人化するには、このユーザがフィードバックを提供しなければならない。能動学習を転移学習と組み合わせることは、熱的快適性モデリングのラベル付けの手間を削減する論理的な手法である。

プールベース能動学習では、解法は、多くの場合、これからラベル付けされることになる利用可能な全ての例のプールＡと、或る能動学習戦略を通じて選ばれるラベル付き例の集合Ｌとを導入することから開始する。重要な点として、プールベース設定では、全てのラベルが存在するが、ラベルの取得に関連した何らかのコストが存在し、このコストはサンプル選択を通じて最小化されることになる。能動学習の全体的な目標は、テストセットに対して良好な汎化性能を達成するようなｍ個（ｍ≪ｎ）のラベル付き例からなる最適なサブセットＬを選ぶことである。

能動学習の構成要素には、ラベル付けバジェット（labeling budget）及びクエリ戦略（querying strategy）という２つの重要な構成要素がある。ラベル付けバジェットは、取得することができるラベルの単純な総数である。個人別熱的快適性モデリングの場合、これは、各ユーザに依頼することが可能なラベルの数である。この問題では、ユーザは頻繁に妨害されることがないので、ラベル付けバジェットは可能な限り小さなものとなる。

クエリ戦略は、集合Ａ内のいずれの例をラベル付けすべきであるのかを判断するのに用いられる手法である。本明細書では、修正ＱＢＣ（Query-By-Committee）手法が提案される。通常のＱＢＣ手法では、ラベル付きデータセットＬは、コミティー（committee）メンバーを更新するのに用いられる。ここでは、コミティーメンバーを更新しないことが選ばれ、代わりに、第Ｎのユーザの現在の予測モデルのみが更新される。第Ｎのユーザの予測モデルの更新が選ばれる理由として次の２つの理由がある。第１に、第Ｎのユーザからのラベル付き例は、体温調節行動において大きな共通部分を示すコミティーメンバーにしか有益なものになり得ない。ラベル付き例を用いて大きく異なるコミティーメンバーを更新すると、その結果、その後のクエリを発行するときに、雑音を有する予測がもたらされる。第２に、この研究の目標は、可能な限り少数のラベル付き例を用いて個人別予測モデルを開発することであり、したがって、第Ｎのユーザの予測モデルを更新することによって、より迅速にその目標に向かうことになる。したがって、提案されたＱＢＣ戦略は、コミティーメンバー及び第Ｎのユーザの予測モデルを最大限一致させない例を選ぶことである。直感的に、これは、提案されたＱＢＣ技法が、第Ｎのユーザのモデルは確信していないが、コミティーはかなり確信している例を選ぶことを意味する。

ここで検討する少なくとも１つのキーポイントは、特に不一致の概念である。前述したように、新たなラベル無しデータに類似する記憶されたデータの間の不一致が評価される。一例として、ここでは、Ａにおける第ｉの例のサンプル不一致スコアｄ_ｉが以下のように計算されるものと定義する。

従来の能動学習解釈では、式（７）における量は次のように定義される。Ｃは、コミティーメンバーの数であり、

は、第ｃのコミティーメンバーに関連した予測であり、

は、これまでに取得されたラベル付き例Ｌのみを用いてトレーニングされた第Ｎのユーザの予測モデルによって行われた予測に対応する。この不一致スコアは履歴データからのモデルを用いることに留意することが重要である。後ほど、Ｋ個の最近傍のみを用いる不一致スコアを説明する。この不一致スコアは、体温調節行動、例えば、衣類の重ね着における個人差に対応するとともに、異なる個人から収集されるデータセットに生じ得る相違、例えば、第Ｎのユーザのモデルは、他の全てのユーザが類似の条件下で暑いと感じているときに寒いと予測すること、に焦点を当てる。

転移学習及び能動学習を組み合わせると、完成した転移能動学習フレームワークは、次にように示すことができる。まず、利用可能なデータ例のプールＡが作成される。このプールは、履歴データベースからの全てのデータを含む。次に、このプールは、機械学習モデル（リッジ回帰）を学習するのに用いられる。このモデルは、集団レベルモデルＷ_ｐと呼ばれる。この集団レベルモデルは、新たなユーザに対する転移学習に用いられる。

初期モデルが作成された後、アルゴリズムは、ユーザへのクエリのバジェット数を用いて個人別モデルの学習を試みる。各クエリは、対応するデータ点のラベルの発見を試みる。個人別データベース用のラベルが得られると、トレーニングデータセットは更新されており、集団モデルによってペナルティを科されたリッジ回帰モデルは再トレーニングされる。

このモデルは、トレーニングバジェットが使い尽くされたときに個人化されているとみなされる。この時点で、ユーザは、データ点のラベル付けを継続することを選ぶことができるが、アルゴリズムは、ユーザへのクエリの発行を積極的に試みない。ユーザが、その後、十分多数のデータ点をラベル付けした場合、この個人別モデル自体を日ごとの情報転移に用いることができる。

データ分割及び前処理
データが収集されると、完全なデータセットをトレーニングデータセットと試験データセットとに最良に分割する方法が重要な問題となる。この分割の最適な選択肢は、実験的な評価を要する検討事項であるが、この作業について、ラベル付きデータセットは、実験の日ごと及びユーザごとに２等分された。第１の半分は快適性予測モデルをトレーニングするのに用いられ、第２の半分は快適性予測モデルを試験するのに用いられる。

収集された各特徴量は、平均を減算して標準偏差によって除算し、全ての特徴量を同じスケールに持ってくることによって中心に位置決めされる。これは、単一の特徴量が回帰モデルにおいて支配的にならないことを確保する。トレーニングデータセット及び試験データセットの双方は、各ユーザ内のデータセットのレーニング分割のみに基づいて計算された平均及び標準偏差を用いて変換されたものである。ユーザ等級も同様に、トレーニングデータから導出された正則化係数を用いて中心に位置決めされたものである。ここでは、平均のみが各等級から減算されている。ユーザ等級を正則化することによって、回帰設定においてインターセプトを適合させる必要がなくなる。

能動学習−クエリ戦略
このために、２つの戦略を用いることができる。ただし、このことは、これらの戦略が本開示を扱う唯一の戦略であることを意味するものではない。各戦略は、この作業の自然な設定であるストリーミング設定について最適化されたプールベース能動学習設定に基づいている。

第１の能動学習戦略は、Ｋ最近傍手法（ＱＢＣ−Ｋ）を利用する。このラベル付け戦略の主なアイデアは、プールＡ内の全ての利用可能な例の不一致スコアを計算することである。次に、この一組の不一致スコアから、最大の不一致スコアを有する例が選ばれる。この例のラベルについてクエリが発行される。

不一致スコアが式（７）のように計算される。第１項

におけるＣは、Ｋ個の最近傍に等しくなるように設定される。次に、Ｋ個の最近傍にわたる平均等級が計算される。ここで、近傍は、Ｎ−１人のユーザからのラベル付き例に対応し、最近という概念は、ユークリッド距離によって定義される。平均ユーザ等級の推定に用いられる近傍の数は、近傍値Ｋ＝５、１０、１５、２０について実験的に試験されたものである。これらの中で、１０個の近傍が最適な性能を与えることが確認された。式（７）の第２項

は、ラベル付き例Ｌのみを用いてトレーニングされる第Ｎのユーザの現在の予測モデルを用いて計算される。具体的には、バジェットＢにおいて、Ｌは、全てが第Ｎのユーザからの多くともＢ個のラベル付き例を保持する。この戦略は、第Ｎのユーザのモデルを利用するモデルベースクエリ戦略である。したがって、予測モデルは、各ラベル付き点がＬに加えられた後に再トレーニングされる。

第２の能動学習戦略では、Ｎ−１人のユーザのそれぞれが、Ａ内の全ての利用可能な例の予測を行うことが可能なコミティーメンバーとして扱われる。すなわち、コミティーメンバーごとに、熱的快適性モデルが、そのユーザからのデータのみを用いて学習される。各ユーザのデータにわたる５分割交差検証が実行され、ハイパーパラメータが選ばれる。各コミティーメンバーは、次に、プール内の全ての利用可能な例の熱的快適性等級を予測する。次に、コミティー等級の加重平均がサンプルごとに計算される。高い重みほど、特徴量空間において第Ｎのユーザと重なるユーザに割り当てられる。これらの重みは、対となった第ＮのユーザとＮ−１人のユーザとの間のＡＵＲＯＣの逆数として計算される。この戦略の残りの詳細は、第１の戦略の上述したものと同じである。

本開示の一態様は、システムが、当該システムの新たなユーザから大量のラベル付きデータセットを収集する必要性を削減する正確な個人別熱的快適性モデルを特定することを支援することである。すなわち、本開示の一態様は、個人別熱的快適性モデルのユーザによって提供されるラベル付きデータと、他のユーザによって提供されるラベル付きデータ、すなわち、履歴居住者データとを用いて、ハイブリッド手法によって個人別熱的快適性モデルを学習することができる理解に基づいている。例えば、実験を通じて分かったこととして、個人の熱的快適性のモデリングは、２つの重要な点で異なるということがある。第１に、個人用熱的快適性は個人ごとに異なり、多くの場合、この違いは、性別、民族性、ロケーション、及び季節によって説明することができる。第２に、個人用熱的快適性は、疲労及び病気等の状態を含むその個人の体調によってその個人内で異なる可能性がある。

特徴
本開示の態様によれば、個人別熱的快適性モデルは、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンのうちの１つ又はそれらの組み合わせとすることができる。一態様は、個人別熱的快適性モデルが、メモリに記憶される前に、履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化されることも含むことができる。さらに、個人別熱的快適性モデルは、初期化期間の間に個人別熱的快適性モデルをトレーニングするための探索空間を制限する、記憶された履歴ラベル付きデータに対する個人別熱的快適性モデルの正則化に基づいて、メモリに記憶される前に反復して事前トレーニングされる。個人別熱的快適性モデルの重みは、回帰関数、ニューラルネットワーク、分類器、サポートベクターマシンのうちの１つを含む機械学習モデルのパラメータに対応することが可能である。

本開示の別の態様は、居住者ラベル付きデータの測定値は、一組のデバイスによって制御される被制御パラメータと、一組のデバイスによって制御されないパラメータとを含むことを含むことができる。被制御パラメータは、温度、湿度又は風速のうちの１つ又はそれらの組み合わせを含み、制御されないパラメータは、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値のうちの１つ又はそれらの組み合わせを含む。或いは、被制御パラメータは、制御されないパラメータと被制御パラメータとをリアルタイムデータのそのインスタンス内のグループに分離することと、結果として得られる個人別熱的快適性モデルが、熱的快適スケールによる居住者の快適性を最大にする居住者の予測された熱的快適性レベルを出力するように、最適化方法を用いて被制御パラメータの各被制御パラメータの値を求めることとによって、トレーニングされた個人別熱的快適性モデルに従って居住者の予測された熱的快適性レベルを最適化することによって求められ、その後、コントローラは、一組の最適な被制御パラメータのうちの少なくとも１つのパラメータに従って一組のデバイスを指示する。

本開示の別の態様は、個人別熱的快適性モデルのトレーニングは、全ての個人別ラベル付きデータがアクセス不能又は未知であると仮定されるような、記憶された履歴ラベル付きデータ及び個人別ラベル付きデータを用いる回帰手法の機械学習のタイプである帰納転移学習アルゴリズムに基づいていることを含むことができる。さらにまた、個人別熱的快適性モデルの反復したトレーニングは、リアルタイムデータ及び能動学習アルゴリズムを用い、反復したトレーニングは、個人別熱的快適性モデルの精度が閾値を上回るまで継続するように行われ、その後、個人別熱的快適性モデルの反復したトレーニングは、受信された居住者ラベル付きリアルタイムデータのみを用いてトレーニングされる。

データは、リアルタイムに受信され、居住者のバイオメトリックデータの受信される測定値は、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値のうちの１つ又はそれらの組み合わせを含むようになっていることが可能である。また、居住者は、一組のデバイスのユーザとすることができ、電子デバイス又はウェアラブル電子デバイスを介して一組のデバイスを制御する。

別の態様は、居住者の熱的快適性レベルは、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含むことを含むことができる。さらにまた、環境内の居住者によって選択される熱的快適性レベルは、リアルタイムデータに基づいて能動学習アルゴリズムを用いてシステムによって開始することができる。別の態様は、環境内の環境データの測定値は、温度、明るさ、音量、空気流量若しくは日射量、又はそれらの或る組み合わせのうちの少なくとも１つを含み、一組のデバイスは、システムと通信するサーモスタット又は環境の温度を変化させる空調暖房システムのうちの一方であるというものである。

一態様は、個人別熱的快適性モデルは、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンのうちの１つ又はそれらの組み合わせであることを含むことができることが可能である。また、個人別熱的快適性モデルの重みは、回帰関数、ニューラルネットワーク、分類器、サポートベクターマシンのうちの１つを含む機械学習モデルのパラメータに対応する。

図５は、本開示の実施形態による、代替のコンピュータ又はハードウェアプロセッサを用いて実施することができる図１Ａの方法を示すブロック図である。コンピュータ５１１は、バス５５６を通じて接続されているハードウェアプロセッサ５４０と、コンピュータ可読メモリ５１２と、記憶装置５５８と、ディスプレイ５５２及びキーボード５５１とのユーザインタフェース５４９とを備える。例えば、ハードウェアプロセッサ５４０及びコンピュータ可読メモリ５１２と通信するユーザインタフェース５４９は、ユーザによるユーザインタフェース５４９の表面であるキーボード面５５１から入力を受信すると、信号データ例を取得し、コンピュータ可読メモリ５１２に記憶する。

コンピュータ５１１は、電源５５４を備えることができ、用途に応じて、電源５５４は、任意選択でコンピュータ５１１の外部に配置することもできる。ディスプレイデバイス５４８に接続するように適合されたユーザ入力インタフェース５５７をバス５５６を通じて結合することができる。ディスプレイデバイス５４８は、特に、コンピュータモニター、カメラ、テレビ、プロジェクター、又はモバイルデバイスを含むことができる。プリンタインタフェース５５９も、バス５５６を通じて接続することができ、印刷デバイス５３２に接続するように適合することができる。印刷デバイス５３２は、特に、液体インクジェットプリンタ、固体インクプリンタ、大型商用プリンタ、サーマルプリンタ、ＵＶプリンタ、又は昇華型プリンタを含むことができる。ネットワークインタフェースコントローラ（ＮＩＣ）５３４は、バス５５６を通じてネットワーク５３６に接続するように適合されている。特に、時系列データ又は他のデータを、コンピュータ５１１の外部のサードパーティディスプレイデバイス、サードパーティ撮像デバイス、及び／又はサードパーティ印刷デバイスにレンダリングすることができる。

引き続き図５を参照すると、特に、信号データ又は他のデータは、記憶及び／又は更なる処理のために、ネットワーク５３６の通信チャネルを介して送信することができ、及び／又は、記憶システム５５８内に記憶することができる。信号データは、最初に外部メモリに記憶しておき、後に処理するためにハードウェアプロセッサによって取り出すこともできるし、後の或る時点において処理するためにハードウェアプロセッサのメモリに信号データを記憶することもできることが考えられる。ハードウェアプロセッサメモリは、例えば、エレベータシステム／方法を実行するハードウェアプロセッサ又はコンピュータによって実行可能な記憶された実行可能プログラム、エレベータ動作データ、当該エレベータと同じタイプのメンテナンスデータ及び履歴エレベータデータ、並びに当該エレベータ又は当該エレベータと類似のタイプのエレベータの動作健全性管理に関係する他のデータを含む。

さらに、信号データ又は他のデータは、受信機５４６（又は外部受信機５３８）から無線又は有線で受信することもできるし、送信機５４７（又は外部送信機５３９）を介して無線又は有線で送信することもでき、受信機５４６及び送信機５４７はともに、バス５５６を通じて接続されている。コンピュータ５１１は、入力インタフェース５０８を介して外部検知デバイス５４４及び外部入力／出力デバイス５４１に接続することができる。例えば、外部検知デバイス５４４は、エレベータ／運搬機の信号データの収集前／収集中／収集後にデータを収集するセンサを備えることができる。データは、例えば、機械の近く又はエレベータ／運搬機の近くではない環境状態、すなわち、エレベータ／運搬機における温度又はその近くの温度、エレベータ／運搬機のロケーションの建物内の温度、エレベータ／運搬機の建物の外部の屋外の温度、エレベータ／運搬機自体のビデオ、エレベータ／運搬機の近くエリアのビデオ、エレベータ／運搬機の近くでないエリアのビデオ、エレベータ／運搬機の態様に関係した他のデータを含む。コンピュータ５１１は、他の外部コンピュータ５４２に接続することができる。出力インタフェース５０９は、ハードウェアプロセッサ５４０からの処理されたデータを出力するのに用いることができる。ハードウェアプロセッサ５４０及び非一時的コンピュータ可読記憶媒体５１２と通信するユーザインタフェース５４９は、ユーザによるユーザインタフェース５４９の表面５５２からの入力を受け取ると、領域データを取得し、非一時的コンピュータ可読記憶媒体５１２に記憶することに留意されたい。

実施形態
以下の説明は、例示的な実施形態のみを提供し、本開示の範囲も、適用範囲も、構成も限定することを意図していない。そうではなく、例示的な実施形態の以下の説明は１つ以上の例示的な実施形態を実施することを可能にする説明を当業者に提供する。添付の特許請求の範囲に明記されているような開示された主題の趣旨及び範囲から逸脱することなく要素の機能及び配置に行うことができる様々な変更が意図されている。

以下の説明では、実施形態の十分な理解を提供するために、具体的な詳細が与えられる。しかしながら、当業者は、これらの具体的な詳細がなくても実施形態を実施することができることを理解することができる。例えば、開示された主題におけるシステム、プロセス、及び他の要素は、実施形態を不必要な詳細で不明瞭にしないように、ブロック図形式の構成要素として示される場合がある。それ以外の場合において、よく知られたプロセス、構造、及び技法は、実施形態を不明瞭にしないように不必要な詳細なしで示される場合がある。さらに、様々な図面における同様の参照符号及び名称は、同様の要素を示す。

また、個々の実施形態は、フローチャート、フロー図、データフロー図、構造図、又はブロック図として描かれるプロセスとして説明される場合がある。フローチャートは、動作を逐次的なプロセスとして説明することができるが、これらの動作の多くは、並列又は同時に実行することができる。加えて、これらの動作の順序は、再配列することができる。プロセスは、その動作が完了したときに終了することができるが、論述されない又は図に含まれない追加のステップを有する場合がある。さらに、特に説明される任意のプロセスにおける全ての動作が全ての実施形態において行われ得るとは限らない。プロセスは、方法、関数、手順、サブルーチン、サブプログラム等に対応することができる。プロセスが関数に対応するとき、その関数の終了は、呼び出し側関数又はメイン関数へのその機能の復帰に対応することができる。

さらに、開示された主題の実施形態は、少なくとも一部は手動又は自動のいずれかで実施することができる。手動実施又は自動実施は、マシン、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、又はそれらの任意の組み合わせを用いて実行することもできるし、少なくとも援助することができる。ソフトウェア、ファームウェア、ミドルウェア又はマイクロコードで実施されるとき、必要なタスクを実行するプログラムコード又はプログラムコードセグメントは、マシン可読媒体に記憶することができる。プロセッサ（複数の場合もある）が、それらの必要なタスクを実行することができる。

本明細書において略述された様々な方法又はプロセスは、様々なオペレーティングシステム又はプラットフォームのうちの任意の１つを用いる１つ以上のプロセッサ上で実行可能なソフトウェアとしてコード化することができる。加えて、そのようなソフトウェアは、複数の適したプログラミング言語及び／又はプログラミングツール若しくはスクリプティングツールのうちの任意のものを用いて記述することができ、実行可能機械語コード、又はフレームワーク若しくは仮想機械上で実行される中間コードとしてコンパイルすることもできる。通常、プログラムモジュールの機能は、様々な実施形態において所望に応じて組み合わせることもできるし、分散させることもできる。

本開示の実施形態は、方法として具現化することができ、この方法の一例が提供されている。この方法の一部として実行される動作は、任意の適した方法で順序付けることができる。したがって、例示したものと異なる順序で動作が実行される実施形態を構築することができ、この順序は、いくつかの動作が例示の実施形態では順次的な動作として示されていても、それらの動作を同時に実行することを含むことができる。さらに、請求項の要素を修飾する、特許請求の範囲における「第１」、「第２」等の序数の使用は、それ自体で、１つの請求項の要素の別の請求項の要素に対する優先順位も、優位性も、順序も暗示するものでもなければ、方法の動作が実行される時間的な順序も暗示するものでもなく、請求項の要素を区別するために、単に、或る特定の名称を有する１つの請求項の要素を、同じ（序数の用語の使用を除く）名称を有する別の要素と区別するラベルとして用いられているにすぎない。

Claims

居住者のための一組のデバイスの動作を制御するシステムであって、
ラベル付きデータの各インスタンスが少なくとも１つの環境の異なる状態における少なくとも１人の居住者の熱的快適性レベルを示す、前記ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリと、
前記メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングするハードウェアプロセッサと、
前記居住者のバイオメトリックデータの測定値、前記居住者がいる前記環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信する入力インタフェースと、
前記受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータのインスタンスの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、前記ラベル無しデータのインスタンスをラベル付けするように前記居住者に要求する送信機と、
を備え、
前記ラベル無しデータのインスタンスの前記ラベル付けに応答して、前記ハードウェアプロセッサは、前記ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとして前記メモリ内の個人別ラベル付きデータベースに記憶し、前記記憶された履歴ラベル付きデータと比較して、前記記憶された個人別ラベル付きデータの異なる重みを用いて、前記個人別熱的快適性モデルをトレーニングし、前記初期化期間の間の反復ごとに、前記個人別ラベル付きデータを用いて前記個人別ラベル付きデータベースを更新し、前記履歴データベース及び前記更新された個人別データベースを用いて前記個人別熱的快適性モデルを再トレーニングし、
前記システムは、
再トレーニングされた個人別熱的快適性モデルに基づいて前記一組のデバイスを制御するコントローラ、
を備える、システム。
前記個人別熱的快適性モデルは、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンのうちの１つ又はそれらの組み合わせである、請求項１に記載のシステム。
前記個人別熱的快適性モデルを前記メモリに記憶する前に、前記個人別熱的快適性モデルは、前記履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化される、請求項１に記載のシステム。
前記個人別熱的快適性モデルは、前記初期化期間の間に前記個人別熱的快適性モデルをトレーニングするための探索空間を制限する、前記記憶された履歴ラベル付きデータに対する前記個人別熱的快適性モデルの正則化に基づいて、前記メモリに記憶される前に反復して事前トレーニングされる、請求項１に記載のシステム。
前記個人別熱的快適性モデルの重みは、回帰関数、ニューラルネットワーク、分類器、サポートベクターマシンのうちの１つを含む機械学習モデルのパラメータに対応する、請求項１に記載のシステム。
前記個人別ラベル付きデータの測定値は、前記一組のデバイスによって制御される被制御パラメータと、前記一組のデバイスによって制御されないパラメータとを含む、請求項１に記載のシステム。
前記被制御パラメータは、温度、湿度又は風速のうちの１つ又はそれらの組み合わせを含み、前記制御されないパラメータは、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値のうちの１つ又はそれらの組み合わせを含む、請求項６に記載のシステム。
前記被制御パラメータは、
前記制御されないパラメータと前記被制御パラメータとをリアルタイムデータのそのインスタンス内のグループに分離することと、
結果として得られる個人別熱的快適性モデルが、熱的快適スケールによる前記居住者の快適性を最大にする前記居住者の予測された熱的快適性レベルを出力するように、最適化方法を用いて前記被制御パラメータの各被制御パラメータの値を求めることと、
によって、トレーニングされた個人別熱的快適性モデルに従って前記居住者の予測された熱的快適性レベルを最適化することによって求められ、
その後、前記コントローラは、一組の最適な被制御パラメータのうちの少なくとも１つのパラメータに従って前記一組のデバイスを指示する、請求項６に記載のシステム。
前記個人別熱的快適性モデルのトレーニングは、全ての個人別ラベル付きデータがアクセス不能又は未知であると仮定されるような、前記記憶された履歴ラベル付きデータ及び前記個人別ラベル付きデータを用いる回帰手法の機械学習のタイプである帰納転移学習アルゴリズムに基づいている、請求項１に記載のシステム。
前記個人別熱的快適性モデルの前記反復したトレーニングは、前記リアルタイムデータ及び能動学習アルゴリズムを用い、前記反復したトレーニングは、前記個人別熱的快適性モデルの精度が閾値を上回るまで継続するように行われ、その後、前記個人別熱的快適性モデルの前記反復したトレーニングは、前記受信された居住者ラベル付きリアルタイムデータのみを用いてトレーニングされる、請求項１に記載のシステム。
前記リアルタイムデータは、リアルタイムに受信されるデータであり、前記居住者の前記バイオメトリックデータの受信される測定値は、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値のうちの１つ又はそれらの組み合わせを含むようになっている、請求項１に記載のシステム。
前記居住者は、前記一組のデバイスのユーザであり、電子デバイス又はウェアラブル電子デバイスを介して前記一組のデバイスを制御する、請求項１に記載のシステム。
居住者のための一組のデバイスの動作を制御する方法であって、
ラベル付きデータの各インスタンスが少なくとも１つの環境の異なる状態における少なくとも１人の居住者の熱的快適性レベルを示す、前記ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリを用いることと、
ハードウェアプロセッサを用いて、前記メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングすることと、
前記居住者のバイオメトリックデータの測定値、前記居住者がいる前記環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを入力インタフェースを介して受信することと、
前記受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータのインスタンスの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、送信機を介して、前記ラベル無しデータのインスタンスをラベル付けするように前記居住者に要求することと、
前記入力インタフェースを用いて、前記ラベル無しデータのインスタンスをラベル付けしたことを含む前記居住者からの返答を受信し、前記ハードウェアプロセッサが、前記ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとして前記メモリ内の個人別ラベル付きデータベースに記憶し、前記記憶された履歴ラベル付きデータとは異なる、前記記憶された個人別ラベル付きデータの重みを用いて、前記個人別熱的快適性モデルをトレーニングし、前記初期化期間の間の反復ごとに、前記個人別ラベル付きデータを用いて前記個人別ラベル付きデータベースを更新し、前記履歴データベース及び前記更新された個人別データベースを用いて前記個人別熱的快適性モデルを再トレーニングすることと、
再トレーニングされた個人別熱的快適性モデルに基づいて前記一組のデバイスを、コントローラを介して制御することと、
を含む、方法。
前記居住者の前記熱的快適性レベルは、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含む、請求項１３に記載の方法。
前記環境内の前記居住者によって選択される前記熱的快適性レベルは、前記リアルタイムデータに基づいて能動学習アルゴリズムを用いてシステムによって開始される、請求項１３に記載の方法。
前記環境内の環境データの前記測定値は、温度、明るさ、音量、空気流量若しくは日射量、又はそれらの或る組み合わせのうちの少なくとも１つを含み、前記一組のデバイスは、システムと通信するサーモスタット及び前記環境の温度を変化させる空調暖房システムのうちの一方である、請求項１３に記載の方法。
居住者のための暖房換気空調（ＨＶＡＣ）システムの動作を制御するシステムであって、
ラベル付きデータの各インスタンスが少なくとも１つの環境の異なる状態における少なくとも１人の居住者の熱的快適性レベルを示す、前記ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリと、
前記メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングするハードウェアプロセッサであって、前記メモリに記憶される前の前記個人別熱的快適性モデルは、履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化され、その結果、前記初期化期間の間に前記個人別熱的快適性モデルをトレーニングするための探索空間が制限される、ハードウェアプロセッサと、
前記居住者のバイオメトリックデータの測定値、前記居住者がいる前記環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信する入力インタフェースと、
前記受信されたラベル無しデータに類似する記憶された前記履歴ラベル付きデータのラベルとラベル無しデータポイントの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、前記ラベル無しデータのインスタンスをラベル付けするように前記居住者に要求する送信機と、
を備え、
前記ラベル無しデータのインスタンスの前記ラベル付けに応答して、前記ハードウェアプロセッサは、前記ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとして前記メモリ内の個人別ラベル付きデータベースに記憶し、前記記憶された履歴ラベル付きデータと比較して、前記記憶された個人別ラベル付きデータの異なる重みを用いて、前記個人別熱的快適性モデルをトレーニングし、前記初期化期間の間の反復ごとに、前記個人別ラベル付きデータを用いて前記個人別ラベル付きデータベースを更新し、前記履歴データベース及び前記更新された個人別データベースを用いて前記個人別熱的快適性モデルを再トレーニングし、
前記システムは、
再トレーニングされた個人別熱的快適性モデルに基づいて前記ＨＶＡＣシステムを制御するコントローラ、
を備える、システム。
前記個人別熱的快適性モデルは、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンのうちの１つ又はそれらの組み合わせである、請求項１７に記載のシステム。
前記個人別熱的快適性モデルの重みは、回帰関数、ニューラルネットワーク、分類器、サポートベクターマシンのうちの１つを含む機械学習モデルのパラメータに対応する、請求項１７に記載のシステム。
前記個人別ラベル付きデータの前記測定値は、前記ＨＶＡＣシステムによって制御される被制御パラメータと、前記ＨＶＡＣシステムによって制御されないパラメータとを含み、
前記被制御パラメータは、
前記制御されないパラメータと前記被制御パラメータとをリアルタイムデータのそのインスタンス内のグループに分離することと、
結果として得られる個人別熱的快適性モデルが、熱的快適スケールによる前記居住者の快適性を最大にする前記居住者の予測された熱的快適性レベルを出力するように、最適化方法を用いて前記被制御パラメータの各被制御パラメータの値を求めることと、
によって、トレーニングされた個人別熱的快適性モデルに従って前記居住者の予測された熱的快適性レベルを最適化することによって求められ、
その後、前記コントローラは、一組の最適な被制御パラメータのうちの少なくとも１つのパラメータに従って前記一組のデバイスを指示する、請求項１７に記載のシステム。