JP2021508118A - 動作を制御するシステム及び方法 - Google Patents

動作を制御するシステム及び方法 Download PDF

Info

Publication number
JP2021508118A
JP2021508118A JP2020534631A JP2020534631A JP2021508118A JP 2021508118 A JP2021508118 A JP 2021508118A JP 2020534631 A JP2020534631 A JP 2020534631A JP 2020534631 A JP2020534631 A JP 2020534631A JP 2021508118 A JP2021508118 A JP 2021508118A
Authority
JP
Japan
Prior art keywords
data
thermal comfort
labeled
resident
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020534631A
Other languages
English (en)
Other versions
JP6925536B2 (ja
Inventor
ラフチーブ、エミル
ナタラジャン、アナマライ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JP2021508118A publication Critical patent/JP2021508118A/ja
Application granted granted Critical
Publication of JP6925536B2 publication Critical patent/JP6925536B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • F24F11/63Electronic processing
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/70Control systems characterised by their outputs; Constructional details thereof
    • F24F11/80Control systems characterised by their outputs; Constructional details thereof for controlling the temperature of the supplied air
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/0295Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using fuzzy logic and expert systems
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F2120/00Control inputs relating to users or occupants
    • F24F2120/20Feedback from users
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/20Pc systems
    • G05B2219/26Pc applications
    • G05B2219/2642Domotique, domestic, home control, automation, smart house

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • Fuzzy Systems (AREA)
  • Air Conditioning Control Device (AREA)
  • Central Air Conditioning (AREA)
  • Train Traffic Observation, Control, And Security (AREA)
  • Feedback Control In General (AREA)

Abstract

居住者のためのデバイスの動作を制御するシステム及び方法である。プロセッサが、初期化期間の間に個人別熱的快適性モデル(PTCM:personalized thermal comfort model)を反復してトレーニングする。ラベル無しリアルタイムデータのシーケンスが受信される。受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータ(LD:labeled data)のラベルとこの新たなラベル無しデータに関する予測ラベルとの間の不一致が閾値を超えているときに、送信機が、ラベル無しデータのインスタンスをラベル付けするように居住者に要求する。プロセッサは、ラベル付きデータの受信に応答して、履歴LDと異なる、個人別LDの重みを用いてPTCMをトレーニングする。PTCMは、履歴データベース及び更新された個人別データベースを用いて再トレーニングされる。コントローラが、再トレーニングされたPTCMに基づいて一組のデバイスを制御する。

Description

本開示は、包括的には、加熱、換気及び空調(HVAC:heating, ventilation, and air conditioning)システムに関し、より詳細には、空間内の居住者(複数の場合もある)の熱的快適性を最大にするとともにHVACシステムエネルギー消費を最小にするために、温度設定値及びHVACシステムによって伝達される潜熱の量等の調整可能な設定の自動カスタマイゼーションに関する。
オフィス及び住宅建物等の環境における従来のHVACシステムは、幾つかの見積もりによると、世界における最大のエネルギー消費者のうちの1つであり、全エネルギーの40%を超えるエネルギーを消費している。これは、現代社会において屋内環境調節の重要性が大きいこと、及び、屋内環境調節が人々の生産性及び健全性に対して影響を及ぼすことに起因している。しかしながら、従来のHVACシステムを用いた熱的快適性は、主として、建物居住者とHVACシステムとの間の通信方法が非常に初歩的であるため、現在、最適には及ばない不十分な方法で継続されている。
多くのシステムにおいて、HVACシステムとの通信は、壁サーモスタットおよびリモコンのいずれかによって行われており、その目的は、機器をオン又はオフにすること、及び温度設定値を設定することである。オン/オフは、サービスが必要とされているとき及びサービスが必要とされていないときを意味する。温度設定は、建物居住者のニーズ及び熱的条件に従った熱的快適性の望ましいレベルを示す方法である。例えば、オフィスワーカーは、寒い冬の日に長時間の間、机の前にじっと座っていると、代謝率が低下するため寒いと感じる可能性が高く、温度設定値を上げることで暖房を強めてほしいと願う。同様に、肉体労働者は、蒸し暑い夏の日に激しい肉体労働を行っていると、非常に暑く感じる可能性が高く、温度設定値を下げることによって冷房を強めてほしいと願う。
基本的に、従来のHVAC制御(オン/オフスイッチ及び温度設定値)は、可能であれば、熱的快適性を提供するべきである。しかしながら、実際には、これは、複数の理由によってほとんど行われない。少なくとも1つの理由は、温度設定値を常に手動で再調整することが現実的でないということであり、ほとんどの建物居住者にとって、注意散漫となる要因である。例えば、実生活においては、そのような再調整は、屋内環境がドラスティックに不快になり、その結果、建物居住者が満足できなくなるか又は生産的でなくなるときにしか行われない。
従来のHVACの温度設定値の絶え間のない手動再調整が現実的でない別の理由は、居住者が温度設定値を調整したいと思っても、とりわけ、最適な値が幾つであるのかを知っていることがめったにないということである。上述したように、その値は、現在の身体活動レベル又は代謝率、屋内の湿度、居住者(複数の場合もある)が着用している衣類、及び日光等の外部熱源とともに室内の他の物体によって放射される放射熱の量に大いに依存する。
居住者の熱的快適性を予測するモデルは、ISO7730及びASHRAE55に示されているが、そのようなモデルは、建物の居住者が最適な温度を正しく判断するには実用的ではない。例えば、これらのモデルは、補正が必要であると判断されたことの合図、例えば、温度の上昇又は下降の合図しか提供せず、更なる補正が後に必要となり、そのため、建物の居住者に時間の浪費及び生産性に対する集中力欠如(distraction from productivity)という犠牲を伴わせる。これらのモデルに関するもう1つの問題は、とりわけ、過剰補正という現象が頻繁に見られるということであり、居住者が寒いと感じると、多くの場合、居住者が寒い感覚に対処しようと判断することによって、必要以上に高い温度設定値が選ばれ、その結果、室温は、居住者が過度に暑く感じる別の不快な状態をもたらすようになる。またしても、これらのモデルは、建物居住者に不快な経験を与え、更に多くの時間の浪費及び生産性に対する集中力欠如という犠牲を建物居住者にもたらす。
従来のHVACの温度設定値の絶え間のない手動再調整が現実的でない別の理由は、従来のHVACシステムの熱的快適性温度センサの調節が準最適であることによる。例えば、従来のHVACセンサは、HVACデバイス/システム自体に配置され、HVACデバイスの通風孔(intake)に戻ってくる前の大気の温度を測定している。これは多くの問題を提起する。例えば、少なくとも1つの問題は、建物居住者が、そのロケーション、すなわち、従来のHVACシステムの通風孔における空気温度に関心がないということである。むしろ、居住者は、建物内で自身がいるロケーションにおける心地よい温度を必要とする。居住者(複数の場合もある)のロケーション(複数の場合もある)は、通常、従来のHVACデバイスから離れており、建物内には大きな温度勾配が存在するので、従来のHVACデバイスによって検知及び調節される空気温度は、ある建物の領域にいる居住者が受ける空気温度と異なる。その結果、建物居住者(複数の場合もある)は、不快であり、特定の建物ゾーン環境の調整の要求又は手動による調整を行うことになり、これも、上記同様に、エネルギーコストの増加とともに、時間の浪費及び生産性に対する集中力欠如をもたらす。
別の従来の熱的快適性モニターは、センサ測定値から室内の実際の快適性レベルを求めることを試みる監視デバイスを備える(Vass他による特許文献1)。しかしながら、このVassモデルには問題があり、例えば、多くの問題の中の1つの問題は、居住者がいるエリア内で測定値が検知されるということである。Vassモデルは、検知された測定値が特定の居住者に対するものではなく、その居住者の場所におけるもの、すなわち、その居住者の部屋内の状態及び/又は場所に関するものでもないという点において欠点を有する。
まだ取り組まれていない他の従来の熱的快適性モデルの問題には、同じ部屋を共有する複数の居住者が存在する建物環境、すなわち、環境状態の問題がある。例えば、複数の居住者は同じ熱的制御を受けるHVACゾーンを占有するので、それらの複数の居住者は、環境制御の調整が制限される。幾つかの問題は、そのような複数の居住者の共有空間では、居住者の多くが、温度が過度に暑いか又は過度に寒いことによって著しい不快感を受けることがある点にある。従来の熱的快適性モデルに関する他の問題には、会議室及び研究室等の空のゾーン、すなわち、居住者のいないゾーンのHVACシステムによる熱調整がある。そのような空のゾーンの熱調整には、多くの費用及びリソースの浪費が発生する。ゾーンが占有されていても、従来の熱的快適性モデルは、現在いる一組の居住者を満足させることができる最適な温度設定値を求めることでさえ非常に困難である。
米国特許第8,700,227号
したがって、特に、空間内の居住者(複数の場合もある)のためのより良好な熱的快適性を達成するとともに、より良好なHVAC動作を達成する必要がある。例えば、取り組むべき必要があるものとして、1人以上のゾーン居住者の熱的快適性を最大にすることが可能なHVAC機器を制御する自動化方法がある。この自動化方法では、ゾーン内の各居住者は、HVACデバイスと手動によって過度にインタラクトする必要がなく、自身が認識した特定の好みを有することができると同時に、エネルギーを効率的に利用することが可能である。
本開示は、空間内の居住者(複数の場合もある)の熱的快適性を最大にするとともに、HVACシステムのエネルギー消費を最小にするために、温度設定値及びHVACシステムによって伝達される潜熱の量等の調整可能な設定の自動カスタマイゼーションのためのシステム及び方法を提供することに関する。
本開示の幾つかの実施の形態は、調整された環境内の居住者の熱的快適性を記述した熱的快適性モデルに従って暖房換気空調(HVAC)システムを制御することが有利であるという理解に基づいている。例えば、熱的快適性の本開示の幾つかの実施の形態は、居住者のバイオメトリックデータと、環境内の状態のデータとに居住者の熱的快適性を関連付ける。実験によると、これらの本開示の熱的快適性の実施の形態/モデルは、環境の居住者の熱的快適性も最適化するとともに、HVACシステムのエネルギー消費も削減する。しかしながら、実験中、これらの熱的快適性の実施の形態/モデルの作成には、多くの課題を克服しなければならなかった。
例えば、本開示の幾つかの実施の形態は、環境内の一群の人々の平均的な熱的快適性を記述する熱的快適性モデルを生成することができることを認識している。しかしながら、実験を通じて分かったことは、これらの熱的快適性モデルは、平均的なユーザの平均的な熱的快適性を推定することに依拠しており、これは、後に、調整された環境内の特定のユーザ及び/又は特定の一群のユーザの快適性を正確に予測することができなかったということである。具体的に言えば、この平均的な熱的快適性モデルは、調整された環境の特定のユーザのニーズ及び/又は居住者のための個人別のニーズでないことが判明した。
本開示の幾つかの実施の形態は、環境の居住者の個人別熱的快適性モデルを、その居住者自身によって提供される情報に基づいて作成することができることを認識している。しかしながら、実験から、そのような個人別熱的快適性モデルの作成は、種々の環境条件における居住者からの快適性レベルについてのラベル付きデータを必要とすることが分かった。また、実験から分かったことは、そのようなラベル付きデータの取得を試みることは、克服するのが困難な作業であるということである。本明細書において用いられる場合、ラベル付きデータという用語は、各データ点を或る対象ラベルを用いてラベル付けすることができるデータセットと呼ぶことができる。例えば、少なくとも1つの温度センサの温度測定値の各値は、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含むユーザ/居住者の感覚に関連付けることができる。ユーザが値ごとに自身の感覚を報告する場合、データセットは、完全にラベル付けされる。ユーザは自身の感覚を1回又は2回報告する場合、データセットは、1つ又は2つのラベル付き例しか含むことができず、部分的にしかラベル付けされない。
ラベル付けされるデータの例は、居住者のバイオメトリックデータ、例えば、居住者の生命兆候と、環境データ、例えば、調整された環境内の温度、湿度、空気流との様々な組み合わせを含むことができる。多くの状況において、ラベル無しデータのインスタンスのそのようなデータ測定値を取得することは困難ではなかった。例えば、バイオメトリックデータは、ウェアラブルデバイス、例えば、ユーザが装着したスマートウォッチによって測定することができる一方、環境データもウェアラブルデバイスによって測定することができ、及び/又は、環境内に設置された様々なセンサによって測定することができる。
そのために、個人別熱的快適性モデルを作成する際に、幾つかの実施の形態は、各個人ユーザのラベル無しデータが大量に存在するとき、ラベル無しデータのインスタンスをラベル付けするためにユーザから多量の更なる入力が必要になるという問題に直面した。しかしながら、ユーザが、熱的快適性モデルをトレーニングするのに十分な量のフィードバックを提供するように一貫して要求されるのであれば、そのような入力情報をユーザから取得することは実情にそぐわない可能性がある。さらに、ユーザは、ラベル無しデータに対する多くのラベルを提供するように期待されるだけでなく、ユーザの利益も先延ばしされ、そのようなモデルから受ける報酬は、ユーザが数百以上のラベルを提供した後にしか得られない。
幾つかの実施の形態は、一群の人々の集約された熱的快適性を記述するために、HVACシステムの異なるユーザによって提供されるデータに基づいて熱的快適性モデルを作成することができるという認識に基づいている。しかしながら、そのようなモデルは、実世界における個人の快適性までも正確に予測することはできない。なぜならば、一群の中の各ユーザは、異なる快適性の好みを有する場合があるからである。特に、モデルをトレーニングするためにユーザに要求されるラベルは主観的であり、複数のユーザによるフィードバックからモデルをトレーニングするために能動学習によって用いられる通常の技法は、個人別熱制御のシナリオには不向きである。
幾つかの実施の形態は、個人別熱的快適性モデルは、当該個人別熱的快適性モデルのユーザによって提供されるラベル付きデータと、他のユーザによって提供されるラベル付きデータ、すなわち、履歴居住者データとの双方を用いるハイブリッド手法を使用して学習することができるという理解に基づいている。そのようなハイブリッド手法によって、ユーザの個人別熱的快適性モデルをトレーニングするためにユーザに要求されるラベル付きデータインスタンスの数を削減することが可能になり、これによって、ユーザに対する妨害が削減され、フィードバックを提供するユーザの意欲が増す。加えて、ハイブリッド手法によって、ユーザによって占有される環境においてHVACを制御するためにそのトレーニングされたモデルの利用を開始する待機時間の削減が可能になり、これによって、さらに、HVACシステムのエネルギー消費が削減される。加えて、フィードバック情報の要求が削減されることによって、個人別熱的快適性モデルを構築するシステムのメモリ、ネットワークトラフィック、及び所要計算量を削減することができる。
しかしながら、ユーザのフィードバックを他のユーザからのフィードバックと組み合わせることによるハイブリッド手法の単純な使用は、モデルのフィードバックを提供する当該他のユーザが異なる快適性の好みを有するときに、個人別熱的快適性モデルの精度を低下させる可能性がある。そのために、幾つかの実施の形態は、この制限に対処するためにハイブリッド手法を修正する。
例えば、幾つかの実施の形態は、ユーザによって提供される個人別データベース内のラベル付きデータと、他のユーザによって提供される共通データベース内のラベル付きデータとについて異なるモデル重みを用いてユーザの個人別熱的快適性モデルを構築する。この手法によって、モデルの学習及び/又はトレーニング用に提供されるラベル付きデータの信頼性を考慮することが可能になる。
加えて、新たなフィードバックがユーザから受信されると、幾つかの実施の形態は、ラベル付きデータのこの新たなインスタンスを用いてモデルを更新するのではなく、ラベル付きデータのこの新たなインスタンスを個人別データベースに付加し、モデルを最初から再トレーニングする。この手法によって、ユーザによって提供されたデータに向けたモデルのより高速な学習を可能にすることができる。
さらに、モデルの再トレーニングによって、トレーニング中にユーザのフィードバックデータの重みを調整することが可能になる。例えば、幾つかの実施の形態では、ユーザによって提供された個人別データベース内のラベル付きデータの重み、及び/又は、他のユーザによって提供された共通データベース内のラベル付きデータの重みは、個人別データベース内のラベル付きデータのインスタンスの数の関数、及び/又は、個人別データベース内のラベル付きデータのインスタンスの数と共通データベース内のラベル付きデータのインスタンスの数との比の関数である。そのようにして、それらの実施の形態は、トレーニングされたモデルに対する共通データベース内のラベル付きデータの影響を軽減することができる。例えば、個人別データベースが、十分な数のラベル付きデータインスタンスを有するとき、幾つかの実施の形態は、HVACシステムの制御を中断することなく、共通データベースからラベル付きデータを段階的に除去する。例えば、1つの実施の形態は、或る特定の数のラベル付きインスタンスが個人別データベースに蓄積された後、個人別データベース及び調節された個人別モデル重みのみをモデルのその後のトレーニング及び/又は更新に用いる。
幾つかの実施の形態は、能動機械学習の分野から借用した異なる技法を用いて、ユーザへのフィードバック要求の数を削減することができるという理解に基づいている。ただし、それらの技法は、提供されるフィードバックに基づいて構築されるモデルの質を徐々に高めるのに用いられる。しかしながら、この場合、モデルは、初期においては信頼されない。そのために、異なる能動学習方法が望まれる。
具体的には、幾つかの実施の形態は、現在の状態の熱的快適性の予測に対するモデルの信頼度を検査するのではなく、現在の状態の共通データベース内のラベル付きデータと、ラベル無しデータインスタンスの予測ラベルとの一致を検査する。現在の状態における自身の快適性について意見を表明した他のユーザが、仮定された現在の予測ラベルと一致していないときに、ユーザはフィードバック要求を受信する。例えば、ユーザの生物医学的パラメータの現在の値と、調整された環境内の環境パラメータの現在の値とのうちの一方又はそれらの組み合わせを含む現在の状態に類似する状態について、他の全てのユーザが心地よいと示した場合、おそらく、それらの状態は個人別熱的快適性モデルのユーザにとっても心地よい。これとは対照的に、同じ状態について、心地よいユーザもいれば、そうでないユーザもいるとき、ユーザが自身の快適性を表明するフィードバックは正当化される。この手法によって、個人別熱的快適性モデルの精度に依拠することなく、フィードバックの要求の数を削減することが可能になる。
さらに、本開示の幾つかの実施の形態は、クイックスタートモデリング及びストリーミングベース能動学習用に修正された転移能動学習フレームワークを用いて個人別熱的快適性モデルを見つけるラベル効率の良い方法を提供することができる。例えば、転移能動学習フレームワークは、少なくとも2つの能動学習クエリ戦略を、特にストリームベース設定において用いることができる回帰設定に組み込むことができる。さらに、本開示の態様は、データのラベル付きの例が少数しか与えられないときは、事前知識、すなわち、履歴データ又は履歴ラベル付きデータを利用して、熱的快適性の予測モデルを高速に学習し、モデルを調整する。
本開示の一実施の形態によれば、居住者のための一組のデバイスの動作を制御するシステムが提供される。システムは、ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリを備える。ラベル付きデータの各インスタンスは、少なくとも1つの環境の異なる状態における少なくとも1人の居住者の熱的快適性レベルを示す。システムは、メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングするハードウェアプロセッサを備える。システムは、居住者のバイオメトリックデータの測定値、居住者がいる環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信する入力インタフェースを備える。システムは、受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータのインスタンスの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、ラベル無しデータのインスタンスをラベル付けするように居住者に要求する送信機を備える。ラベル無しデータのインスタンスのラベル付けに応答して、ハードウェアプロセッサは、ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとしてメモリ内の個人別ラベル付きデータベースに記憶する。ハードウェアプロセッサは、記憶された履歴ラベル付きデータと比較して、記憶された個人別ラベル付きデータの異なる重みを用いて、個人別熱的快適性モデルをトレーニングする。それによって、初期化期間の間の反復ごとに、個人別ラベル付きデータを用いて個人別ラベル付きデータベースが更新される。履歴データベース及び更新された個人別データベースを用いて個人別熱的快適性モデルが再トレーニングされる。最後に、システムは、再トレーニングされた個人別熱的快適性モデルに基づいて一組のデバイスを制御するコントローラを備える。
本開示の別の実施の形態によれば、居住者のための一組のデバイスの動作を制御する方法が提供される。方法は、ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリを用いることを含む。ラベル付きデータの各インスタンスは、少なくとも1つの環境の異なる状態における少なくとも1人の居住者の熱的快適性レベルを示す。方法は、ハードウェアプロセッサを用いて、メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングすることを含む。方法は、居住者のバイオメトリックデータの測定値、居住者がいる環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを入力インタフェースを介して受信すること含む。方法は、受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータ点の予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、送信機を介して、ラベル無しデータのインスタンスをラベル付けするように居住者に要求することを含む。方法は、入力インタフェースを用いて、ラベル無しデータのインスタンスをラベル付けしたことを含む居住者からの返答を受信することを含む。ハードウェアプロセッサは、ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとしてメモリ内の個人別ラベル付きデータベースに記憶する。ハードウェアプロセッサは、記憶された履歴ラベル付きデータとは異なる、記憶された個人別ラベル付きデータの重みを用いて、個人別熱的快適性モデルをトレーニングする。ハードウェアプロセッサは、初期化期間の間の反復ごとに、個人別ラベル付きデータを用いて個人別ラベル付きデータベースを更新し、履歴データベース及び更新された個人別データベースを用いて個人別熱的快適性モデルを再トレーニングする。最後に、方法は、再トレーニングされた個人別熱的快適性モデルに基づいて一組のデバイスを、コントローラを介して制御することを含む。
本開示の別の実施の形態によれば、居住者のための暖房換気空調(HVAC)システムの動作を制御するシステムが提供される。システムは、ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリを備える。ラベル付きデータの各インスタンスは、少なくとも1つの環境の異なる状態における少なくとも1人の居住者の熱的快適性レベルを示す。システムは、メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングするハードウェアプロセッサを備える。メモリに記憶される前の個人別熱的快適性モデルは、履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化され、その結果、初期化期間の間に個人別熱的快適性モデルをトレーニングするための探索空間が制限される。システムは、居住者のバイオメトリックデータの測定値、居住者がいる環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信する入力インタフェースを備える。システムは、受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータのインスタンスの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、ラベル無しデータのインスタンスをラベル付けするように居住者に要求する送信機を備える。ラベル無しデータのインスタンスのラベル付けに応答して、ハードウェアプロセッサは、ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとしてメモリ内の個人別ラベル付きデータベースに記憶する。ハードウェアプロセッサは、記憶された履歴ラベル付きデータと比較して、記憶された個人別ラベル付きデータの異なる重みを用いて、個人別熱的快適性モデルをトレーニングする。それによって、初期化期間の間の反復ごとに、個人別ラベル付きデータを用いて個人別ラベル付きデータベースが更新され、履歴データベース及び更新された個人別データベースを用いて個人別熱的快適性モデルが再トレーニングされる。最後に、システムは、再トレーニングされた個人別熱的快適性モデルに基づいてHVACシステムを制御するコントローラを備える。
ここに開示されている実施形態は、添付図面を参照して更に説明される。示されている図面は、必ずしも一律の縮尺というわけではなく、ここに開示されている実施形態の原理を示すことに強調が置かれている。
本開示の実施形態による、居住者の一組のデバイスの動作を制御する方法を示すフロー図である。 本開示の実施形態による、システムの幾つかの構成要素を用いて実施される図1Aのシステムを示すブロック図である。 本開示の実施形態による、オフラインステージ及びオンラインステージを示す、図1Aのシステムを示すブロック図である。 本開示の実施形態による複数の同時ユーザからのデータ収集を示す概略図である。 本開示の実施形態による、居住者のバイオメトリックデータを測定することができるとともに、環境内の環境データを測定することができるか又は環境内の測定された環境データを取得することができる環境内の居住者によるウェアラブルデバイスを示す概略図である。 本開示の実施形態による、図1Cのシステムのオフラインステージを示すブロック図である。 本開示の実施形態による、図1Cのシステムのオンラインステージの態様を示すブロック図である。 本開示の実施形態による、不一致スコアに関する図1Cのシステムのオンラインステージの態様を示すブロック図である。 本開示の実施形態による、不一致スコアの更なる態様に関する図1Cのシステムのオンラインステージの態様を示すブロック図である。 本開示の実施形態による、代替のコンピュータ又はプロセッサを用いて実施することができる図1A及び図1Bの方法を示すブロック図である。
上記で明らかにされた図面は、ここに開示されている実施形態を記載しているが、この論述において言及されるように、他の実施形態も意図されている。この開示は、限定ではなく代表例として例示の実施形態を提示している。ここに開示されている実施形態の原理の範囲及び趣旨に含まれる非常に多くの他の変更及び実施形態を、当業者は考案することができる。
概説
本開示は、空間内の居住者(複数の場合もある)の熱的快適性を最大にするとともに、HVACシステムのエネルギー消費を最小にするために、温度設定値及びHVACシステムによって伝達される潜熱の量等の調整可能な設定の自動カスタマイゼーションのためのシステム及び方法を提供することに関する。
幾つかの実施形態は、調整された環境内の居住者の熱的快適性を記述した熱的快適性モデルに従って暖房換気空調(HVAC)システムを制御することが有利であるという理解に基づいている。これらのモデルは、居住者のバイオメトリックデータ及び環境内の状態のデータとともに居住者の熱的快適性を含む。
別の実現態様は、環境の居住者の個人別熱的快適性モデルを、その居住者自身によって提供される情報に基づいて作成することができることを認識していることに基づいている。しかしながら、そのような個人別熱的快適性モデルは、種々の環境状態における居住者の快適性レベルについて数百の居住者ラベル付きデータを必要とし、その結果、そのようなモデルは、ユーザから必要とされるそのような大量の入力データに起因して様々な意味で非実用的である。用語「ラベル付きデータ」は、各データ点が或る対象ラベルを用いてラベル付けされたデータセットと呼ぶことができる。例えば、少なくとも1つの温度センサの各温度測定値は、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含むユーザ/居住者の感覚に関連付けることができる。さらに、ユーザが値ごとに自身の感覚を報告した場合、データセットをラベル付けすることができる。ユーザが自身の感覚を1回又は2回報告した場合、データセットは、1つ又は2つのラベル付きの例しか含むことができない。例えば、居住者の熱的快適性レベルは、約59度F〜65度F以下の寒い快適性範囲と、約61度F〜67度F以下の涼しい快適性範囲と、約68度F〜72度F又は約65度F〜74度Fの心地よい快適性範囲と、約70度F〜75度F以上又は約72度F〜77度F以上の暖かい快適性範囲と、約73度F〜75度F以上又は約74度F〜80度F以上の暑い快適性範囲とを含むことができる。もちろん、これらの温度範囲はユーザごとに変化し、他の要因、すなわち、湿度、室内風速、室内日射量、居住者の心拍数、居住者の活動レベル、居住者の健康状態、居住者の警戒状態等に応じて主観的なものでもある。居住者が熱的快適性レベルを知覚する環境は、建物の内部、建物の部分的な内部、屋根及び少なくとも1つの壁を有する構造物、又は建造された構造物のうちの1つとすることができる。
ラベル付けされるデータの例は、居住者のバイオメトリックデータ、例えば、居住者の生命兆候と、環境データ、例えば、調整された環境内の温度、湿度、空気流との様々な組み合わせを含むことができる。多くの状況において、ラベル無しデータのインスタンスの測定値を取得することは困難ではない。例えば、バイオメトリックデータは、ウェアラブルデバイス、例えば、ユーザが装着したスマートウォッチによって測定することができる一方、環境データもウェアラブルデバイスによって測定することができ、及び/又は、環境内に設置された様々なセンサによって測定することができる。そのために、個人別熱的快適性モデルの作成において、幾つかの実施形態は、個人ユーザから更なる入力を必要とする各個人ユーザのラベル無しデータが大量にあるときに問題に直面する。しかしながら、そのような入力情報をその個人ユーザから得ることは、熱的快適性モデルをトレーニングするのに十分な量のフィードバックを提供するようにユーザに要求することになり、実情にそぐわない可能性がある。さらに、ユーザは、多くのラベルを提供するように期待されるだけでなく、ユーザの利益も先延ばしされ、そのようなモデルから受ける報酬は、ユーザが数百以上のラベルを提供した後にしか得られない。
幾つかの実施形態は、一群の人々の集約された熱的快適性を記述するために、HVACシステムの異なるユーザによって提供されるデータに基づいて熱的快適性モデルを作成することができるという認識に基づいている。しかしながら、そのようなモデルは、実世界における個人の快適性までも正確に予測することはできない。なぜならば、一群の中の各ユーザは、異なる快適性の好みを有する場合があるからである。特に、モデルをトレーニングするためにユーザに要求されるラベルは主観的であり、複数のユーザによるフィードバックからモデルをトレーニングするために能動学習によって用いられる通常の技法は、個人別熱制御のシナリオには不向きである。
幾つかの実施形態は、個人別熱的快適性モデルは、当該個人別熱的快適性モデルのユーザによって提供されるラベル付きデータと、他のユーザによって提供されるラベル付きデータ、すなわち、履歴居住者データとの双方を用いるハイブリッド手法を使用して学習することができるという理解に基づいている。そのようなハイブリッド手法/フレームワークによって、ユーザの個人別熱的快適性モデルをトレーニングするためにユーザに要求されるラベル付きデータインスタンスの数を削減することが可能になり、これによって、ユーザに対する妨害が削減され、フィードバックを提供するユーザの意欲が増す。特に、このフレームワークは、能動学習及び転移学習の機械学習の分野を組み合わせて、熱的快適性の正確なモデルを得るのに必要とされるラベル付けの手間を削減する。
換言すれば、本開示の態様は、学習を容易にすることを目標として、1つのドメインからの知識が別のドメインに転移される機械学習の一タイプである転移学習を含む。少なくとも1つの実施形態では、ドメインとは異なるユーザを指し、具体的には、ソースドメインは、N−1人のユーザからのデータに関係し、ターゲットドメインは、第Nのユーザからのデータを指す。データのドメインがこのように記述され、ラベル付きデータがソースドメイン及びターゲットドメインの双方において利用可能であるとき、転移学習手法は、本明細書において帰納転移学習手法とみなすことができる。本開示の新規性を有する少なくとも1つの態様は、特に、ターゲットドメイン内の全てのラベル付きデータにアクセスするという前提がないものとすることができる。非限定的な例として、帰納転移学習の少なくとも1つの手法は、パラメータ転移とすることができ、この場合、類似のタスクの個々のモデルのパラメータは、同じ事前分布又は同様の事前分布からサンプリングされることになることが前提となっている。
加えて、上述したように、このハイブリッド手法によって、ユーザによって占有される環境においてHVACを制御するためにそのトレーニングされたモデルの利用を開始する待機時間の削減が可能になり、これによって、さらに、HVACシステムのエネルギー消費が削減される。さらに、フィードバック情報の要求が削減されることによって、個人別熱的快適性モデルを構築するシステムのメモリ、ネットワークトラフィック、及び所要計算量を削減することができる。しかしながら、ユーザのフィードバックを他のユーザからのフィードバックと組み合わせるそのようなハイブリッド手法は、異なる快適性の好みを有する他のユーザがモデルのフィードバックを提供するときに、個人別熱的快適性モデルの精度を低下させる可能性がある。
さらに、このハイブリッド手法は、ターゲットドメイン内のセットアップデータがターゲットユーザによって提供された少数のラベル付きデータインスタンスからなるとき、回帰問題のパラメータ転移を考慮する。したがって、本開示の幾つかの手法の一態様は、パラメータ共有はシーケンシャルなものとすることができるということであり、ソースドメイン内のパラメータが最初に学習され、この情報は、ターゲットドメインにおいて利用可能になるデータとして利用される。例えば、幾人かのユーザは、システムの使用を通じてデータを提供してきている。それらのユーザのデータは、ソースドメインにおいて汎用熱的快適性モデルを学習するのに用いられる。新たなユーザがシステムに与えられると、この汎用モデルは、この新たなユーザのフィードバックの手間を削減するのに用いられる情報として提供される。
具体的には、このパラメータ共有手法は、第1に、ソースドメインパラメータを学習する。すなわち、ソースドメインにおいて熱的快適性の汎用モデルを学習する。第2に、ソースドメインモデルパラメータからのターゲットドメインモデルパラメータの偏差にペナルティが科される。すなわち、新たなユーザは、個人別モデルではあるが、熱的快適性の包括モデルに類似しているもののみを有することが可能になる。少なくとも1つの付加的な利益及び付加的な利点は、ターゲットドメインデータがない場合には、予測モデルは、ソースドメインモデルに依拠して、ランダムな推測よりも良好な予測を行うことができるということである。
そのために、幾つかの実施形態は、ユーザによって提供される個人別データベース内のラベル付きデータと、他のユーザによって提供される共通データベース内のラベル付きデータとについて異なるモデル重みを用いてユーザの個人別熱的快適性モデルを構築することによってこの制限に対処するためにハイブリッド手法を修正する。この手法によって、モデルの学習及び/又はトレーニング用に提供されるラベル付きデータの信頼性を考慮することが可能になる。加えて、新たなフィードバックがユーザから受信されると、ラベル付きデータのこの新たなインスタンスを用いてモデルを更新するのではなく、ラベル付きデータのこの新たなインスタンスを個人別データベースに付加し、モデルを最初から再トレーニングする動作を開始することができる。したがって、この手法によって、特に、ユーザによって提供されたデータに向けたモデルのより高速な学習を可能にすることができる。
さらに、モデルの再トレーニングによって、トレーニング中にユーザのフィードバックデータの重みを調整することを可能にすることができる。例えば、幾つかの実施形態では、ユーザによって提供された個人別データベース内のラベル付きデータの重み、及び/又は、他のユーザによって提供された共通データベース内のラベル付きデータの重みは、個人別データベース内のラベル付きデータのインスタンスの数の関数、及び/又は、個人別データベース内のラベル付きデータのインスタンスの数と共通データベース内のラベル付きデータのインスタンスの数との比の関数である。そのようにして、それらの実施形態は、トレーニングされたモデルに対する共通データベース内のラベル付きデータの影響を軽減することができる。例えば、個人別データベースが、十分な数のラベル付きデータインスタンスを有するとき、幾つかの実施形態は、HVACシステムの制御を中断することなく、共通データベースからラベル付きデータを段階的に除去する。例えば、1つの実施形態は、或る特定の数のラベル付きインスタンスが個人別データベースに蓄積された後、個人別データベース及び調節された個人別モデル重みのみをモデルのその後のトレーニング及び/又は更新に用いる。
図1Aは、本開示の実施形態による、居住者の一組のデバイスの動作を制御する方法を示すブロック図である。
ステップ110は、方法100が、事前にトレーニングされた個人別熱的快適性モデルを有するメモリを用いることを含む。記憶されている事前にトレーニングされた個人別熱的快適性モデルは、記憶される前であって、個人別熱的快適性モデルの反復トレーニングの前に、履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化される。この反復トレーニングは、リアルタイムデータ及び能動学習アルゴリズムを用いる。
転移学習アルゴリズムは、本開示による、学習を容易にすることを目的として1つのドメインからの知識が別のドメインに転移される機械学習タイプのものとすることができる。例えば、本開示の実施形態の構成によれば、N人のユーザを仮定すると、ドメインは異なるユーザを指し、具体的には、ソースドメインは、N−1人のユーザからのデータ(履歴ラベル付きデータ)に関するものであり、ターゲットドメインは、第Nのユーザからのデータ(個人別ラベル付きデータ)を指す。熱的快適性を予測することは、ラベル付きデータがソースドメイン及びターゲットドメインの双方において利用可能である帰納転移学習に該当するが、従来の転移学習アルゴリズムと対比した本開示の実施形態による相違は、ターゲットドメインにおける全てのラベル付きデータにアクセスすることを前提としないということである。具体的には、転移能動学習フレームワークの少なくとも1つの態様は、転移学習を介して他のユーザからのドメイン知識を利用しながら、能動学習を介して、ユーザごとに収集されるフィードバックを最小にするものとすることができる。必要とされるラベル付けのこの削減を行うために、フレームワークは、転移学習を用いて、少数のベースユーザからの知識、すなわち、制御された実験の初期ユーザの部分のグループを利用し、クイックスタートモデリング及びストリーミングベース能動学習用に変更される転移能動学習フレームワークを得る。
ステップ115は、方法100が、初期化期間の間に、ハードウェアプロセッサを用いて、個人別熱的快適性モデルを反復してトレーニングすることを含む。個人別熱的快適性モデルは、環境内の居住者のためのモデルであり、その居住者自身が提供した情報に基づいている。個人別熱的快適性モデルは、特定の用途に応じて、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンの1つ又は組み合わせとすることができる。
図1Aのステップ115を引き続き参照すると、ハードウェアプロセッサは、履歴ラベル付きデータを有する事前にトレーニングされた熱的快適性モデルに対する個人別熱的快適性モデルの正則化に基づいて、個人別熱的快適性モデルを反復してトレーニングする。この正則化は、初期化期間の間に個人別熱的快適性モデルをトレーニングする探索空間を制限する。正則化は、履歴ラベル付きデータに基づく事前にトレーニングされた熱的快適性モデルと大幅に異なるモデルへのコストの追加と呼ぶことができる。
図1Aのステップ115を引き続き参照すると、個人別熱的快適性モデルは、個人別熱的快適性モデルの精度レベルが閾値を上回るまで、能動学習及び転移学習を用いて反復してトレーニングされ、その後、居住者が不快感を覚えていると判断し、リアルタイムラベルを観測データに与えるまで、この個人別熱的快適性モデルを用いることができる。上記閾値は、熱的快適スケール上の点の1/2に等しくなるように閾値を設定すること、学習を用いて、ユーザがそのレベルを上回ると通常快適であると知覚する誤差レベルを見分けること、又は他の適した方法を含む多数の方法で求めることもできるし、特定の用途に応じて求めることもできる。閾値は、通常、国際的に容認された熱的快適スケール、又は、履歴データベース内の履歴ラベル付きデータに基づくことになる。
メモリは、履歴ラベル付きデータを有する履歴データベースを含むことができるデータを記憶している。メモリは、方法100の実施中に、個人別ラベル付きデータベースに個人別ラベル付きデータも記憶することができる。ラベル付きデータの各インスタンス(履歴及び個人別)は、少なくとも1つの環境の異なる状態にある少なくとも1人の居住者の熱的快適性レベルを示す。
記憶された熱的快適性モデルは、履歴ラベル付きデータに基づくことができる。この履歴データは、サンプル環境データが居住者の環境と異なる環境、居住者の環境と同じ環境又はそれらの双方のうちの1つとなるように、少なくとも1人のサンプル居住者によって一組のサンプルデバイス内のデバイスに提供されたデバイスに関する使用履歴データに基づいてサンプル環境内の少なくとも1人のサンプル居住者によって選択された少なくとも1つのサンプル居住者データ、サンプル環境データ及びサンプル熱的快適性レベルを含むデータのインスタンスのシーケンスを含むことができる。熱的快適性レベルデータは、少なくとも1つのサンプル環境の異なる状態におけるサンプル居住者の快適性を示すデータのインスタンスを含む。さらに、履歴データのうちの幾つかのデータは、方法100のユーザの現在の使用と比較される、この方法が実施される前の或る以前の時点に収集された現在のユーザ(居住者)からのものとすることができる。
図1Aのステップ115を引き続き参照すると、特に、履歴ラベル付きデータは、現在のユーザのバイオメトリックデータと同様の又はユーザの環境に対する環境データの現在の測定値と同様のサンプル居住者のバイオメトリックデータの測定値又はサンプル環境内の環境データの測定値とすることができる。居住者の熱的快適性レベルは、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含むことができる。
個人別ラベル付きデータは、メモリに記憶されたラベル無しデータのインスタンスを個人別ラベル付きデータとしてラベル付けした居住者を含むことができる。上述したように、居住者ラベル付きデータの各インスタンスは、少なくとも1つの環境の異なる状態における少なくとも1人の居住者の熱的快適性レベルを示す。
ステップ120は、居住者のバイオメトリックデータの測定値と、居住者がいる環境内の環境データの測定値とを含むラベル無しリアルタイムデータのシーケンスを受信することを含む。データのシーケンスは、1秒未満から1時間、1週間、1カ月又は1年の範囲の期間の間に取得されるデータを含むことができる。例えば、ラベル無しリアルタイムデータは、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値等の居住者のバイオメトリックデータの測定値に関するデータとすることができる。他のラベル無しリアルタイムデータは、居住者がいる環境内の環境データの測定値を含むことができ、この環境データは、温度、明るさ、音量、空気流量又は日射量等のデータを含むことができる。
ステップ125は、受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルと、ラベル無しデータ点の予測ラベルとの間に不一致があるときに、ラベル無しデータのインスタンスにラベル付けするように居住者に要求することを含む。履歴データ内の不一致が所定の閾値よりも高いとき、ラベルが要求される。履歴不一致を得るために、まず、ラベル無し(新たな)データ点のK個の最近傍が特定される。次に、これらのK個の最近傍のラベルとラベル無しデータ点に関する予測ラベルとの間の不一致スコアが計算され、このスコアが閾値を超えている場合、アルゴリズムはラベルを要求する。
上記所定の閾値は、全ての新たなユーザデータが既知であるときに最も高い不一致を選ぶこと、全ての履歴データ間の不一致を事前に計算して、これらの不一致スコアの或るパーセンテージに閾値を設定すること、所望のモデリングエラーメトリック等の関数として不一致を設定すること、又は特定の態様に応じた他の或る方法を含む多くの方法によって選ぶことができる。
ステップ130は、居住者がラベル無しデータのインスタンスをラベル付けしたことを含む居住者からの応答を受信することを含む。ラベル無しデータのインスタンスをラベル付けすることに応答して、ハードウェアプロセッサは、ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとしてメモリ内の個人別ラベル付きデータベースに記憶する。その後、ハードウェアプロセッサは、記憶された履歴ラベル付きデータと比較して、記憶された個人別ラベル付きデータの異なる重みを用いて個人別熱的快適性モデルをトレーニングする。それによって、初期化期間中の反復ごとに、ハードウェアプロセッサは、個人別ラベル付きデータを用いて個人別ラベル付きデータベースを更新するとともに、履歴データベース及び更新された個人別データベースを用いて個人別熱的快適性モデルを再トレーニングする。
ステップ130は、熱的快適性モデリングのためのラベル付けの手間を削減する手法として能動学習を転移学習と組み合わせる。本開示による能動学習について、この能動学習は、学習すべき例を選ぶことが可能であるときに予測モデルが良好な性能を達成する機械学習のタイプのものである。能動学習者は、クエリを介してラベル付けされるサンプルを選び、次に、選ばれたサンプルのラベルを提供するようにオラクルに要求する。能動回帰学習は、モデルフリーの手法とモデルベース手法とに細分することができる。
モデルフリー戦略は、ラベル付けするデータサンプルを決定するのに予測モデルに依拠しない能動学習手法である。その代わりに、これらの手法は、データ分布の統計だけに依拠する。本開示の実施形態に関するモデルフリーの能動学習手法において直面する難題は、連続するクエリが、既得された事前知識を考慮せず、多くの場合、冗長なクエリを発行することになってしまうということである。したがって、モデルフリーの能動学習手法は、問題設定が人間ユーザのラベル付けを伴うとき、ユーザが自発的にラベル付けするクエリの数について極端な制約があるので、本開示の実施形態に適していない。
引き続きステップ130を参照すると、回帰モデルを構築する場合のモデルベース能動学習は、全汎化誤差が最小にされるように、モデル分散を最小にすることに焦点を当てている。回帰の分散削減技法を用いる際の課題は、データ分布全体に関する統計を計算しなければならず、したがって、サンプルが一度に1つずつ到来するとき、計算を実現することができないということである。このことは、本開示の実施形態が、完全なデータ分布の知識が知られていないストリームベース設定に移植されることになるので、重要である。ここで、ストリームベース設定とは、データがセンサによって観測されたときにその値が求められ、値を求める前に記憶されないことを示す。これは、値を求める前に全ての新たなデータの収集を必須又は必要とする従来の手法と異なる。
本開示の実施形態は、まず、転移学習手法と能動学習手法とを組み合わせるときに共変量シフトを取り扱うために重要度重みを計算することに依拠しない独自の態様を非限定的な例によって提供する。そのため、これらの重要度重みは、ソースドメイン及びターゲットドメインにおける周辺分布の確率密度を推定することによって計算される。これは、高次元であるが、低いサンプルカウントを有するデータセットにおいては困難である。これは、本開示の実施形態のデータセットの場合に当てはまる。第2に、モデルフリーの手法及びモデルベース手法の双方をストリームベース設定に実施することはできず、必然的に作り直さなければならない。これとは対照的に、本開示の実施形態は、とりわけ、ストリームベース設定に対する変更を最小限にして実施することができる手法を含む。
ステップ135は、再トレーニングされた個人別熱的快適性モデルに基づいて一組のデバイスを制御することを含む。
図1Bは、本開示の実施形態による図1Aのシステムを示すブロック図であり、このシステムは、幾つかの構成要素を用いて実施される。図1Bは、入力インタフェース142、居住者送受信機144、メモリ146、送信機148、コントローラ150と通信するハードウェアプロセッサ140を含むことができる。コントローラは、一組のデバイス152に接続することができる。居住者送受信機144は、居住者(ユーザ)が一組のデバイス152を制御するために装着するとともに情報を送受信することができるウェアラブル電子デバイスとすることができる。
ハードウェアプロセッサ140は、特定の用途の要求に応じて2つ以上のハードウェアプロセッサを含むことができることが考えられる。もちろん、入力インタフェース、出力インタフェース及び送受信機を含む他の構成要素を方法100とともに用いることもできる。
引き続き図1Bを参照すると、方法100の態様は、入力インタフェース142からラベル無しリアルタイムデータのシーケンスを受信するステップ120を含む。ステップ122は、ラベル無しリアルタイムデータから、類似する記憶履歴データと、ラベル付きインスタンスとラベル無しデータインスタンスの予測ラベルとの間の不一致とを特定することを含む。ステップ124は、ステップ122から特定された不一致を所定の閾値と比較し、不一致がこの閾値を超えているか否かを識別する判定を含む。不一致が所定の閾値を超えていない場合、すなわち、NOである場合、方法はステップ126に進む。不一致が所定の閾値を超えている場合、すなわち、YESである場合、方法はステップ125に進む。ステップ125において、居住者への、ラベル無しデータのインスタンスのラベル付けの居住者要求が、送信機148を介して行われる。ステップ130は、居住者がラベル無しデータのインスタンスをラベル付けしたという居住者応答を、送信機148を介して受信することを含む。すなわち、このラベル付けされたデータは、個人用ラベル付きデータであり、メモリに記憶される。ステップ135は、ラベル無しデータの居住者ラベル付きインスタンスが記憶されている個人別ラベル付きデータベースを更新することを含み、履歴熱的快適性モデル及び更新された個人別データベースを用いて個人別熱的快適性モデルを再トレーニングする。
図1Cは、本開示の実施形態による、オフラインステージ及びオンラインステージを示す図1Aのシステムを示すブロック図である。
方法100は、2つのステージ、すなわち、オフラインステージ111及びオンラインステージ112からなることができる。オフラインステージ111は、初期化期間の間に個人別熱的快適性モデル147を反復してトレーニングする。この反復トレーニングは、メモリ146に記憶された履歴熱的快適性モデルに対する個人別熱的快適性モデルの正則化に基づくことができる。この正則化は、初期化期間の間に個人別熱的快適性モデルをトレーニングするための探索空間の制限をもたらす。特に、正則化は、メモリ内の履歴データベースに記憶された履歴ラベル付きデータに関して特定された履歴熱的快適性モデルの重みと比較して、メモリ内の個人別データベースに記憶されている受信された個人別ラベル付きデータの関数としての個人別熱的快適性モデルの異なる重みを用いる。
引き続き図1Cを参照すると、オンラインステージ112は、入力インタフェース142が、居住者のバイオメトリックデータの測定値、居住者がいる環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信することを含むことができる。入力インタフェース142は、メモリ146に接続することができ、ステップ120へデータを供給する。受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータ点に関する予測ラベルとの間の不一致が所定の閾値を超えているとき(ステップ124)、ラベル無しデータのインスタンスをラベル付けするように居住者に要求する(ステップ125)ために送信機148を用いることができる。居住者がラベル無しデータのインスタンスをラベル付けした(ステップ130)ことに応答して、ハードウェアプロセッサは、ラベル無しデータの居住者ラベル付きインスタンスをメモリ146に記憶することができ、ラベル無しデータの記憶された居住者ラベル付きインスタンスを用いて個人別ラベル付きデータベースを更新することができ、履歴熱的快適性モデル及び更新された個人別データベースを用いて個人別熱的快適性モデルを再トレーニングすることができる。コントローラ150は、再トレーニングされた個人別熱的快適性モデルに基づいて一組のデバイス152を制御するのに用いることができる。
図2Aは、本開示の実施形態による複数の同時ユーザからのデータ収集を示す概略図である。例えば、図2Aは、複数のユーザの個々の快適性を最適化するように共有空間においてHVACシステムを制御するときの複数の居住者207、207Nの組み合わせを示している。
特に、図2Aは、N人のユーザのそれぞれについて、システムが、そのユーザの環境からのデータ(環境データ)201と、そのユーザの身体からのデータ(バイオメトリックデータ)202と、外部環境からのデータ(天候データ)203と、これらのデータに関連した時間情報204とを収集することを示している。各ユーザは、クエリ要求を受信する方法(クエリ要求受信)205と、フィードバックをシステムに提供する方法(快適性レベルのユーザフィードバック)206とを有する。これらのデータは、データベースに集約することができ、このデータベースは、本開示において説明するように、その後、個人用熱的快適性モデルを作成するのに用いられる。これらのモデルは、その後、快適性スコア最適化アルゴリズムが、ユーザ熱的快適性を最大にする最適なHVAC設定値を求めるのに用いられる。
換言すれば、図2Aは、ユーザが、ユーザN−データ取得セット207Nとともにユーザ1−データ取得セット207を含むことができることを示し、ユーザデータ(ユーザ1、207及びユーザN、207N)は、管理デバイス240と通信され、例えば、これは、特定の用途に応じて、プロセッサ140であってもよいし、異なるプロセッサであってもよいし、互いに通信する複数のプロセッサとすることもできる。管理デバイス240内には、非限定的な例として、ユーザNの更新予測モデル244と通信し、トレーニングデータ246と通信するユーザ1の更新予測モデル242が存在することができる。ユーザ1の予測モデル242及びユーザNの予測モデル244は、快適性スコア最適化部248と通信することができ、快適性スコア最適化部は、HVAC設定点部252と通信する。
図2Bは、本開示の実施形態による、居住者のバイオメトリックデータを測定することができるとともに、環境内の環境データを測定することができるか又は環境内の測定された環境データを取得することができる環境内の居住者によるウェアラブルデバイスを示す概略図である。
例えば、ウェアラブルデバイス144は、居住者229が装着することができ、当該居住者のバイオメトリックデータを測定/収集することができる。例えば、バイオメトリックデータのタイプは、非限定的な例として、居住者が環境内で特定の時点にどのように感じているのかの変化又はスケーリング220、すなわち、暑い221、暖かい222、わずかに暖かい223、中立若しくはおそらく心地よい224、わずかに寒い225、涼しい226又は寒い227を含むことができる。もちろん、これらの変化は、1〜10、1〜100等の範囲の数値若しくは文字、又は、居住者が環境内で特定の時点にどのように感じているのかを示す他の或る類似の態様等によって異なって提示することもできる。
ウェアラブルデバイス144は、本開示の実施形態に従って、環境内の環境データを測定することもできるし、環境内の測定された環境データを取得することもできる。現在、この図は、熱的快適性レベルが重ね合わされたウェアラブルデバイスを示している。これは、ユーザがフィードバックを提供することができる可能なスケールを例示している。ユーザが用いることができる代替の方法は、ユーザの音声又はジェスチャーを用いたフィードバックを含むが、これらに限定されるものではない。
図3は、本開示の実施形態による、図1Cのシステムのオフラインステージを示すブロック図である。図3は、集団レベルモデルWpを求めることができる方法を示している。集団レベルモードWpは、履歴データベースにおいてラベル付きデータを記述するのに用いられるモデルである。Wpを求めるために、履歴データベース(全てのユーザ)からの全てのラベル付きデータが単一の大規模データセットに組み合わされる。次に、各ユーザのデータからサンプリングが行われ、個人用熱的快適性学習アルゴリズムの学習パラメータを調節する適切なパーセンテージが求められる。これに続いて、この新たなデータセットに名称が与えられる。この名称は、開発データセットとすることができる。この開発データセット及び交差検証技法を用いて、必要とされるモデリングパラメータが求められる。次に、大規模データセットの残り及び学習されたモデリングパラメータを用いて、ラベル付き履歴データベースに関する集団レベルモデルWpが学習される。それらの結果及びデータは履歴データベースに記憶される。
図4Aは、本開示の実施形態による、図1Cのシステムのオンラインステージの態様を示すブロック図である。図4Aは、現在のラベル無しデータ点に類似するラベル付き履歴データのインスタンスのラベルと、ラベル無しデータ点の予測ラベルとの間の不一致スコアを求める方法を含むことができる。
例えば、ステップ122は、受信されたラベル無しデータを記憶されたデータに関連付けて、受信されたラベル無しデータと、類似する記憶された履歴ラベル付きデータとの間の不一致の数を求める態様に関するものである。
図4Aのステップ411は、履歴データベースに記憶されたラベル付きデータ点ごとに、そのデータ点と新たなラベル無しデータ点との間の距離を求めることを説明している。
図4Aのステップ412は、これらの距離をベクトルの形で記憶し、このベクトルをソートすることを含む。
図4Aのステップ413は、K個の最小距離を選び、それらのラベルを履歴データベースから取得することを説明している。
図4Aのステップ414は、ユーザモデルの現在のバージョンを用い、履歴データベースからのラベルとラベル無しデータ点の予測ラベルとを用いて不一致メトリックを計算する方法を示している。
換言すれば、不一致スコアを計算するために、第1に(411)、新たなラベル無しデータ点とラベル付き履歴データベース内の全てのデータ点との間の距離が求められる。第2に(412)、これらの距離がベクトルの形で記憶され、このベクトルがソートされる。すなわち、これらの距離がソートされる。第3に(413)、K個の最小距離が選ばれ、それらのラベルが履歴データベースから取得される。第4に(414)、ラベル無しデータ点のラベルが予測され、次に、不一致スコアが計算される。すなわち、ユーザモデルの現在のバージョンを用い、履歴データベースからのラベルとラベル無しデータ点の予測ラベルとを用いて不一致メトリックが計算される。
図4Bは、本開示の実施形態による、図1Cのシステムのオンラインステージの態様を示すブロック図である。例えば、図4Bは、図1Cのステップ122の後に、すなわち、受信されたラベル無しデータを記憶されたデータに関連付けて、受信されたラベル無しデータと、類似する記憶された履歴ラベル付きデータとの間の不一致の数を求めた後に、所定の閾値が更新されているか否かについてメモリを調べるステップであるステップ427を含むことができる。
ステップ146はメモリが行うステップであり、ステップ429は、所定の閾値が更新されているか否かを判断するステップである。更新されていない場合(431)、処理はステップ124に進む。更新されている場合(433)、所定の閾値は更新され、処理はステップ124に進む。
図4Bのステップ124は、不一致スコアが所定の閾値を超えているか否かを判断することを含む。YESである場合、すなわち、不一致スコアが所定の閾値を超えている場合には、システムは居住者にラベルを要求する(125)。不一致スコアが閾値を超えていない場合には、動作は実行されない(126)。
図4Cは、本開示の実施形態による、図1Cのシステムのオンラインステージの態様を示すブロック図である。例えば、図4Cは、ユーザラベルが取得されると、個人別熱的快適性モデルをどのように取得するかについての、本開示の実施形態によるステップ130を含むことができる。
図4Cのステップ432は、個人別データベース内のラベル付きデータ点の数が最小閾値を超えているか否かに関する判定を含む。
図4Cのステップ434に関して、YESである場合、すなわち、個人別データベース内のラベル付きデータ点の数が最小閾値を超えている場合には、処理はステップ434に進む。その場合、履歴データベースを用いて学習された集団レベルモデルWpは、現在の個人別モデルに設定される。次のステップはステップ440である。次に、処理はステップ440に進む。このステップは、Wp及び個人別データベースを用いて、更新されたモデルを見つけることを含む。
図4Cのステップ436に関して、NOである場合、すなわち、個人別データベース内のラベル付きデータ点の数が最小閾値を超えていない場合には、処理はステップ436に進む。その場合、集団レベルモデルWpが履歴データベースから導出される。
熱的快適性予測の転移能動学習フレームワーク
表記法
本開示の態様の紹介に際して、まず、或る表記法を導入する。例えば、D=(x,y) ∀i∈{ln}の形のn個のラベル付きサンプルを含むデータセットDが与えられるものと仮定する。ここで、各xは特徴ベクトルに対応し、それぞれは実数値x∈Rであり、それぞれはウェアラブルセンサ及び周囲室内センサからのデータに対応する。インデックスiはサンプル番号を示す一方、pは、予測モデルにおいて用いられる特徴量の数に対応するベクトルの長さを示す。便宜上、n個のラベル付きデータサンプルは全て、n行p列を有する計画行列と呼ばれる行列Xとして表される。目標値yは、既定の集合y∈{0,±1,±2,±3}から取り出される。これらは、ユーザからフィードバックとして与えられる熱的快適性等級に対応する。
数ある目標の中でも特に本開示の少なくとも1つの目標は、任意の入力ベクトルxについて、予測目標値
Figure 2021508118
を出力する予測モデルh、h:x→yを学習することである。この特定の例では、予測モデルは回帰を用いて学習されるので、予測目標値は、平方値に関して、
Figure 2021508118
として、実際の目標値
Figure 2021508118
からεよりも大きく逸脱してはならないことが条件として要求される。
転移学習への履歴データの使用
この分野を展開するために、目標値yは、範囲{−3,+3}に制限される連続値として扱われる。ここでの固有の仮定は、ユーザは自身の状態を7つのレベルに離散化するように要求されるが、実際には、ユーザの熱的快適性ははるかに多くの微妙な違いを有するということである。
熱的快適性予測の問題を回帰問題として取り扱うことによって、クラス不均衡の問題が検討される。特に、ほとんどのユーザはHVAC制御空間にいるので、受信されたほとんどのフィードバックは、非常に寒いクラス、寒いクラス、暑いクラス及び非常に暑いクラスの厳しいクラス不均衡をもたらす範囲{−1,+1}にある。したがって、回帰方法を用いることは、熱的快適性予測器をトレーニングするときの自然な手法である。
この手法を簡単に実証するために、線形回帰が用いられる。線形回帰は、モデル出力に対する各特徴量の影響のより容易な定量化を提供することができる。線形回帰を求めるには、計画行列と重みベクトルとの乗算が目標値の推定値
Figure 2021508118
を生成するような重みベクトルWを見つける必要がある。
Figure 2021508118
リグレッサー重みベクトルを見つける手法は、最小二乗推定法(OLS:ordinary least squares)と呼ばれる。OLSの目標は、特に、推定された目標値と実際の目標値との差の二乗和を最小にすることである。これらの差は残差と呼ばれ、最適化目標として記述されることが多い残差の和は、以下の式として表される。
Figure 2021508118
WのOLS推定値は、モデル重みの分散が高くなる傾向があるとともに、特徴量間での重みの配分(選択)が不十分になる傾向がある。さらに、この問題に対する従来の解析的解法は良設定ではなく、データ行列を容易に反転することができない場合には、数値問題を有するという難点がある。
これらの問題を改善するために、ペナルティがリグレッサー重みベクトルに導入される。この分野では、ペナルティは2ノルムの形を取り、これは、以下の式がリッジ回帰フレームワークに従うことを意味する。ここで、2ノルムは、相関性がある特徴量の取り扱いがより有益であることから選ばれる。追加されるペナルティパラメータは、モデル分散を削減し、その結果、或る特徴量重みを0に近くすることができる解が得られる。これは、多くの場合、特徴量選択と呼ばれる。解くべき新たな目的関数は、したがって、以下の式である。
Figure 2021508118
式(3)において、λは、解におけるペナルティ項の重みを決定するペナルティパラメータである。λを増加させると、Wにおける重み係数は小さくなり、λを減少させると、Wにおける重み係数は大きくなる。このため、λは、リグレッサー係数の縮小を制御すると言われる。
従来、リッジ回帰を利用するとき、この縮小パラメータは、モデル誤り性能を損なうことなく係数を0に近づけていくように最適化される。リッジ回帰に対するこの従来の手法は、重みベクトル係数が、ゼロ平均及び分散=
Figure 2021508118
を有する事前正規分布からサンプリングされるベイズ的解釈を有する。
リッジ回帰に対する代替の手法は、係数を非ゼロの事前分布に向けて縮小することである。この手法が取られるとき、非ゼロの事前分布は、この問題についての或る事前知識を表す。この場合、事前分布に向けた係数の縮小はドメイン知識の転移を誘発すると言われる。なぜならば、見つけられる重みベクトルは、可能な限り事前分布に近くあるべきであるからである。修正されたリッジOLSは以下の形を有する。
Figure 2021508118
式(4)において、履歴データベースから取得される集団レベルモデルWは、サンプルリグレッサーベクトルを含むベクトルである。このベクトルは、上述した事前分布の平均を表す。Wを0に設定することによって、式(3)からの従来のリッジOLSが得られることに留意されたい。
本開示による事前リグレッサーWを推定する手法は複数存在する。この分野では、ユーザ間に強い類似性が存在し、モデルをわずかに変更するだけで新たな個人に適合するに違いないことが前提とされる。この前提は、体温調節の生理機能が人同士で異ならないということにその根拠がある。個人の好みが異なるだけである。
熱的快適性モデリングの場合における転移学習の1つの便利な事前知識は、一群のユーザにわたる包括的な熱的快適性である。すなわち、N人の異なるユーザから収集されたN個のデータセットがあるものと仮定する。その場合、式(3)を用いて、N−1人のユーザからのデータを記述する一般的な線形リグレッサーを見つけることができる。このリグレッサーは、本発明者らの集団モデルWと呼ばれる。その後、式(4)が使用される。
次に、式(4)を解くと、第Nのユーザの個人別熱的快適性モデルが得られる。事前知識を導入するこの手法は、新たなユーザの係数Wが、個人差を認めつつも他のユーザとほとんど同様であるはずであるという考えを直感的に捉えたものである。
この問題を最適化問題として具体的に設定すると、リッジ回帰係数は、以下の目的関数を最小にすることによって学習される。
Figure 2021508118
この定式化において、第1項は、式(3)の通常の形式を有する損失関数であり、第2項は、事前モデルWからの新たなモデルWのリッジ係数の偏差にペナルティを科すものである。この目的関数を新たなリグレッサー重みベクトルWで微分し、微分したものを0に設定すると、以下の解析解が得られ、この解析解は、修正リッジ回帰と呼ばれる。
Figure 2021508118
能動学習の組み込み
このフレームワークの少なくとも1つの目標は、各ユーザからの大規模なトレーニングデータセットの収集を必要とせず、個人用熱的快適性を予測する回帰モデルを作成することである。これまで、フレームワークの転移学習構成要素を導入してきたが、モデルを第Nのユーザに個人化するには、このユーザがフィードバックを提供しなければならない。能動学習を転移学習と組み合わせることは、熱的快適性モデリングのラベル付けの手間を削減する論理的な手法である。
プールベース能動学習では、解法は、多くの場合、これからラベル付けされることになる利用可能な全ての例のプールAと、或る能動学習戦略を通じて選ばれるラベル付き例の集合Lとを導入することから開始する。重要な点として、プールベース設定では、全てのラベルが存在するが、ラベルの取得に関連した何らかのコストが存在し、このコストはサンプル選択を通じて最小化されることになる。能動学習の全体的な目標は、テストセットに対して良好な汎化性能を達成するようなm個(m≪n)のラベル付き例からなる最適なサブセットLを選ぶことである。
能動学習の構成要素には、ラベル付けバジェット(labeling budget)及びクエリ戦略(querying strategy)という2つの重要な構成要素がある。ラベル付けバジェットは、取得することができるラベルの単純な総数である。個人別熱的快適性モデリングの場合、これは、各ユーザに依頼することが可能なラベルの数である。この問題では、ユーザは頻繁に妨害されることがないので、ラベル付けバジェットは可能な限り小さなものとなる。
クエリ戦略は、集合A内のいずれの例をラベル付けすべきであるのかを判断するのに用いられる手法である。本明細書では、修正QBC(Query-By-Committee)手法が提案される。通常のQBC手法では、ラベル付きデータセットLは、コミティー(committee)メンバーを更新するのに用いられる。ここでは、コミティーメンバーを更新しないことが選ばれ、代わりに、第Nのユーザの現在の予測モデルのみが更新される。第Nのユーザの予測モデルの更新が選ばれる理由として次の2つの理由がある。第1に、第Nのユーザからのラベル付き例は、体温調節行動において大きな共通部分を示すコミティーメンバーにしか有益なものになり得ない。ラベル付き例を用いて大きく異なるコミティーメンバーを更新すると、その結果、その後のクエリを発行するときに、雑音を有する予測がもたらされる。第2に、この研究の目標は、可能な限り少数のラベル付き例を用いて個人別予測モデルを開発することであり、したがって、第Nのユーザの予測モデルを更新することによって、より迅速にその目標に向かうことになる。したがって、提案されたQBC戦略は、コミティーメンバー及び第Nのユーザの予測モデルを最大限一致させない例を選ぶことである。直感的に、これは、提案されたQBC技法が、第Nのユーザのモデルは確信していないが、コミティーはかなり確信している例を選ぶことを意味する。
ここで検討する少なくとも1つのキーポイントは、特に不一致の概念である。前述したように、新たなラベル無しデータに類似する記憶されたデータの間の不一致が評価される。一例として、ここでは、Aにおける第iの例のサンプル不一致スコアdが以下のように計算されるものと定義する。
Figure 2021508118
従来の能動学習解釈では、式(7)における量は次のように定義される。Cは、コミティーメンバーの数であり、
Figure 2021508118
は、第cのコミティーメンバーに関連した予測であり、
Figure 2021508118
は、これまでに取得されたラベル付き例Lのみを用いてトレーニングされた第Nのユーザの予測モデルによって行われた予測に対応する。この不一致スコアは履歴データからのモデルを用いることに留意することが重要である。後ほど、K個の最近傍のみを用いる不一致スコアを説明する。この不一致スコアは、体温調節行動、例えば、衣類の重ね着における個人差に対応するとともに、異なる個人から収集されるデータセットに生じ得る相違、例えば、第Nのユーザのモデルは、他の全てのユーザが類似の条件下で暑いと感じているときに寒いと予測すること、に焦点を当てる。
転移学習及び能動学習を組み合わせると、完成した転移能動学習フレームワークは、次にように示すことができる。まず、利用可能なデータ例のプールAが作成される。このプールは、履歴データベースからの全てのデータを含む。次に、このプールは、機械学習モデル(リッジ回帰)を学習するのに用いられる。このモデルは、集団レベルモデルWと呼ばれる。この集団レベルモデルは、新たなユーザに対する転移学習に用いられる。
初期モデルが作成された後、アルゴリズムは、ユーザへのクエリのバジェット数を用いて個人別モデルの学習を試みる。各クエリは、対応するデータ点のラベルの発見を試みる。個人別データベース用のラベルが得られると、トレーニングデータセットは更新されており、集団モデルによってペナルティを科されたリッジ回帰モデルは再トレーニングされる。
このモデルは、トレーニングバジェットが使い尽くされたときに個人化されているとみなされる。この時点で、ユーザは、データ点のラベル付けを継続することを選ぶことができるが、アルゴリズムは、ユーザへのクエリの発行を積極的に試みない。ユーザが、その後、十分多数のデータ点をラベル付けした場合、この個人別モデル自体を日ごとの情報転移に用いることができる。
データ分割及び前処理
データが収集されると、完全なデータセットをトレーニングデータセットと試験データセットとに最良に分割する方法が重要な問題となる。この分割の最適な選択肢は、実験的な評価を要する検討事項であるが、この作業について、ラベル付きデータセットは、実験の日ごと及びユーザごとに2等分された。第1の半分は快適性予測モデルをトレーニングするのに用いられ、第2の半分は快適性予測モデルを試験するのに用いられる。
収集された各特徴量は、平均を減算して標準偏差によって除算し、全ての特徴量を同じスケールに持ってくることによって中心に位置決めされる。これは、単一の特徴量が回帰モデルにおいて支配的にならないことを確保する。トレーニングデータセット及び試験データセットの双方は、各ユーザ内のデータセットのレーニング分割のみに基づいて計算された平均及び標準偏差を用いて変換されたものである。ユーザ等級も同様に、トレーニングデータから導出された正則化係数を用いて中心に位置決めされたものである。ここでは、平均のみが各等級から減算されている。ユーザ等級を正則化することによって、回帰設定においてインターセプトを適合させる必要がなくなる。
能動学習−クエリ戦略
このために、2つの戦略を用いることができる。ただし、このことは、これらの戦略が本開示を扱う唯一の戦略であることを意味するものではない。各戦略は、この作業の自然な設定であるストリーミング設定について最適化されたプールベース能動学習設定に基づいている。
第1の能動学習戦略は、K最近傍手法(QBC−K)を利用する。このラベル付け戦略の主なアイデアは、プールA内の全ての利用可能な例の不一致スコアを計算することである。次に、この一組の不一致スコアから、最大の不一致スコアを有する例が選ばれる。この例のラベルについてクエリが発行される。
不一致スコアが式(7)のように計算される。第1項
Figure 2021508118
におけるCは、K個の最近傍に等しくなるように設定される。次に、K個の最近傍にわたる平均等級が計算される。ここで、近傍は、N−1人のユーザからのラベル付き例に対応し、最近という概念は、ユークリッド距離によって定義される。平均ユーザ等級の推定に用いられる近傍の数は、近傍値K=5、10、15、20について実験的に試験されたものである。これらの中で、10個の近傍が最適な性能を与えることが確認された。式(7)の第2項
Figure 2021508118
は、ラベル付き例Lのみを用いてトレーニングされる第Nのユーザの現在の予測モデルを用いて計算される。具体的には、バジェットBにおいて、Lは、全てが第Nのユーザからの多くともB個のラベル付き例を保持する。この戦略は、第Nのユーザのモデルを利用するモデルベースクエリ戦略である。したがって、予測モデルは、各ラベル付き点がLに加えられた後に再トレーニングされる。
第2の能動学習戦略では、N−1人のユーザのそれぞれが、A内の全ての利用可能な例の予測を行うことが可能なコミティーメンバーとして扱われる。すなわち、コミティーメンバーごとに、熱的快適性モデルが、そのユーザからのデータのみを用いて学習される。各ユーザのデータにわたる5分割交差検証が実行され、ハイパーパラメータが選ばれる。各コミティーメンバーは、次に、プール内の全ての利用可能な例の熱的快適性等級を予測する。次に、コミティー等級の加重平均がサンプルごとに計算される。高い重みほど、特徴量空間において第Nのユーザと重なるユーザに割り当てられる。これらの重みは、対となった第NのユーザとN−1人のユーザとの間のAUROCの逆数として計算される。この戦略の残りの詳細は、第1の戦略の上述したものと同じである。
本開示の一態様は、システムが、当該システムの新たなユーザから大量のラベル付きデータセットを収集する必要性を削減する正確な個人別熱的快適性モデルを特定することを支援することである。すなわち、本開示の一態様は、個人別熱的快適性モデルのユーザによって提供されるラベル付きデータと、他のユーザによって提供されるラベル付きデータ、すなわち、履歴居住者データとを用いて、ハイブリッド手法によって個人別熱的快適性モデルを学習することができる理解に基づいている。例えば、実験を通じて分かったこととして、個人の熱的快適性のモデリングは、2つの重要な点で異なるということがある。第1に、個人用熱的快適性は個人ごとに異なり、多くの場合、この違いは、性別、民族性、ロケーション、及び季節によって説明することができる。第2に、個人用熱的快適性は、疲労及び病気等の状態を含むその個人の体調によってその個人内で異なる可能性がある。
特徴
本開示の態様によれば、個人別熱的快適性モデルは、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンのうちの1つ又はそれらの組み合わせとすることができる。一態様は、個人別熱的快適性モデルが、メモリに記憶される前に、履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化されることも含むことができる。さらに、個人別熱的快適性モデルは、初期化期間の間に個人別熱的快適性モデルをトレーニングするための探索空間を制限する、記憶された履歴ラベル付きデータに対する個人別熱的快適性モデルの正則化に基づいて、メモリに記憶される前に反復して事前トレーニングされる。個人別熱的快適性モデルの重みは、回帰関数、ニューラルネットワーク、分類器、サポートベクターマシンのうちの1つを含む機械学習モデルのパラメータに対応することが可能である。
本開示の別の態様は、居住者ラベル付きデータの測定値は、一組のデバイスによって制御される被制御パラメータと、一組のデバイスによって制御されないパラメータとを含むことを含むことができる。被制御パラメータは、温度、湿度又は風速のうちの1つ又はそれらの組み合わせを含み、制御されないパラメータは、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値のうちの1つ又はそれらの組み合わせを含む。或いは、被制御パラメータは、制御されないパラメータと被制御パラメータとをリアルタイムデータのそのインスタンス内のグループに分離することと、結果として得られる個人別熱的快適性モデルが、熱的快適スケールによる居住者の快適性を最大にする居住者の予測された熱的快適性レベルを出力するように、最適化方法を用いて被制御パラメータの各被制御パラメータの値を求めることとによって、トレーニングされた個人別熱的快適性モデルに従って居住者の予測された熱的快適性レベルを最適化することによって求められ、その後、コントローラは、一組の最適な被制御パラメータのうちの少なくとも1つのパラメータに従って一組のデバイスを指示する。
本開示の別の態様は、個人別熱的快適性モデルのトレーニングは、全ての個人別ラベル付きデータがアクセス不能又は未知であると仮定されるような、記憶された履歴ラベル付きデータ及び個人別ラベル付きデータを用いる回帰手法の機械学習のタイプである帰納転移学習アルゴリズムに基づいていることを含むことができる。さらにまた、個人別熱的快適性モデルの反復したトレーニングは、リアルタイムデータ及び能動学習アルゴリズムを用い、反復したトレーニングは、個人別熱的快適性モデルの精度が閾値を上回るまで継続するように行われ、その後、個人別熱的快適性モデルの反復したトレーニングは、受信された居住者ラベル付きリアルタイムデータのみを用いてトレーニングされる。
データは、リアルタイムに受信され、居住者のバイオメトリックデータの受信される測定値は、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値のうちの1つ又はそれらの組み合わせを含むようになっていることが可能である。また、居住者は、一組のデバイスのユーザとすることができ、電子デバイス又はウェアラブル電子デバイスを介して一組のデバイスを制御する。
別の態様は、居住者の熱的快適性レベルは、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含むことを含むことができる。さらにまた、環境内の居住者によって選択される熱的快適性レベルは、リアルタイムデータに基づいて能動学習アルゴリズムを用いてシステムによって開始することができる。別の態様は、環境内の環境データの測定値は、温度、明るさ、音量、空気流量若しくは日射量、又はそれらの或る組み合わせのうちの少なくとも1つを含み、一組のデバイスは、システムと通信するサーモスタット又は環境の温度を変化させる空調暖房システムのうちの一方であるというものである。
一態様は、個人別熱的快適性モデルは、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンのうちの1つ又はそれらの組み合わせであることを含むことができることが可能である。また、個人別熱的快適性モデルの重みは、回帰関数、ニューラルネットワーク、分類器、サポートベクターマシンのうちの1つを含む機械学習モデルのパラメータに対応する。
図5は、本開示の実施形態による、代替のコンピュータ又はハードウェアプロセッサを用いて実施することができる図1Aの方法を示すブロック図である。コンピュータ511は、バス556を通じて接続されているハードウェアプロセッサ540と、コンピュータ可読メモリ512と、記憶装置558と、ディスプレイ552及びキーボード551とのユーザインタフェース549とを備える。例えば、ハードウェアプロセッサ540及びコンピュータ可読メモリ512と通信するユーザインタフェース549は、ユーザによるユーザインタフェース549の表面であるキーボード面551から入力を受信すると、信号データ例を取得し、コンピュータ可読メモリ512に記憶する。
コンピュータ511は、電源554を備えることができ、用途に応じて、電源554は、任意選択でコンピュータ511の外部に配置することもできる。ディスプレイデバイス548に接続するように適合されたユーザ入力インタフェース557をバス556を通じて結合することができる。ディスプレイデバイス548は、特に、コンピュータモニター、カメラ、テレビ、プロジェクター、又はモバイルデバイスを含むことができる。プリンタインタフェース559も、バス556を通じて接続することができ、印刷デバイス532に接続するように適合することができる。印刷デバイス532は、特に、液体インクジェットプリンタ、固体インクプリンタ、大型商用プリンタ、サーマルプリンタ、UVプリンタ、又は昇華型プリンタを含むことができる。ネットワークインタフェースコントローラ(NIC)534は、バス556を通じてネットワーク536に接続するように適合されている。特に、時系列データ又は他のデータを、コンピュータ511の外部のサードパーティディスプレイデバイス、サードパーティ撮像デバイス、及び/又はサードパーティ印刷デバイスにレンダリングすることができる。
引き続き図5を参照すると、特に、信号データ又は他のデータは、記憶及び/又は更なる処理のために、ネットワーク536の通信チャネルを介して送信することができ、及び/又は、記憶システム558内に記憶することができる。信号データは、最初に外部メモリに記憶しておき、後に処理するためにハードウェアプロセッサによって取り出すこともできるし、後の或る時点において処理するためにハードウェアプロセッサのメモリに信号データを記憶することもできることが考えられる。ハードウェアプロセッサメモリは、例えば、エレベータシステム/方法を実行するハードウェアプロセッサ又はコンピュータによって実行可能な記憶された実行可能プログラム、エレベータ動作データ、当該エレベータと同じタイプのメンテナンスデータ及び履歴エレベータデータ、並びに当該エレベータ又は当該エレベータと類似のタイプのエレベータの動作健全性管理に関係する他のデータを含む。
さらに、信号データ又は他のデータは、受信機546(又は外部受信機538)から無線又は有線で受信することもできるし、送信機547(又は外部送信機539)を介して無線又は有線で送信することもでき、受信機546及び送信機547はともに、バス556を通じて接続されている。コンピュータ511は、入力インタフェース508を介して外部検知デバイス544及び外部入力/出力デバイス541に接続することができる。例えば、外部検知デバイス544は、エレベータ/運搬機の信号データの収集前/収集中/収集後にデータを収集するセンサを備えることができる。データは、例えば、機械の近く又はエレベータ/運搬機の近くではない環境状態、すなわち、エレベータ/運搬機における温度又はその近くの温度、エレベータ/運搬機のロケーションの建物内の温度、エレベータ/運搬機の建物の外部の屋外の温度、エレベータ/運搬機自体のビデオ、エレベータ/運搬機の近くエリアのビデオ、エレベータ/運搬機の近くでないエリアのビデオ、エレベータ/運搬機の態様に関係した他のデータを含む。コンピュータ511は、他の外部コンピュータ542に接続することができる。出力インタフェース509は、ハードウェアプロセッサ540からの処理されたデータを出力するのに用いることができる。ハードウェアプロセッサ540及び非一時的コンピュータ可読記憶媒体512と通信するユーザインタフェース549は、ユーザによるユーザインタフェース549の表面552からの入力を受け取ると、領域データを取得し、非一時的コンピュータ可読記憶媒体512に記憶することに留意されたい。
実施形態
以下の説明は、例示的な実施形態のみを提供し、本開示の範囲も、適用範囲も、構成も限定することを意図していない。そうではなく、例示的な実施形態の以下の説明は1つ以上の例示的な実施形態を実施することを可能にする説明を当業者に提供する。添付の特許請求の範囲に明記されているような開示された主題の趣旨及び範囲から逸脱することなく要素の機能及び配置に行うことができる様々な変更が意図されている。
以下の説明では、実施形態の十分な理解を提供するために、具体的な詳細が与えられる。しかしながら、当業者は、これらの具体的な詳細がなくても実施形態を実施することができることを理解することができる。例えば、開示された主題におけるシステム、プロセス、及び他の要素は、実施形態を不必要な詳細で不明瞭にしないように、ブロック図形式の構成要素として示される場合がある。それ以外の場合において、よく知られたプロセス、構造、及び技法は、実施形態を不明瞭にしないように不必要な詳細なしで示される場合がある。さらに、様々な図面における同様の参照符号及び名称は、同様の要素を示す。
また、個々の実施形態は、フローチャート、フロー図、データフロー図、構造図、又はブロック図として描かれるプロセスとして説明される場合がある。フローチャートは、動作を逐次的なプロセスとして説明することができるが、これらの動作の多くは、並列又は同時に実行することができる。加えて、これらの動作の順序は、再配列することができる。プロセスは、その動作が完了したときに終了することができるが、論述されない又は図に含まれない追加のステップを有する場合がある。さらに、特に説明される任意のプロセスにおける全ての動作が全ての実施形態において行われ得るとは限らない。プロセスは、方法、関数、手順、サブルーチン、サブプログラム等に対応することができる。プロセスが関数に対応するとき、その関数の終了は、呼び出し側関数又はメイン関数へのその機能の復帰に対応することができる。
さらに、開示された主題の実施形態は、少なくとも一部は手動又は自動のいずれかで実施することができる。手動実施又は自動実施は、マシン、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、又はそれらの任意の組み合わせを用いて実行することもできるし、少なくとも援助することができる。ソフトウェア、ファームウェア、ミドルウェア又はマイクロコードで実施されるとき、必要なタスクを実行するプログラムコード又はプログラムコードセグメントは、マシン可読媒体に記憶することができる。プロセッサ(複数の場合もある)が、それらの必要なタスクを実行することができる。
本明細書において略述された様々な方法又はプロセスは、様々なオペレーティングシステム又はプラットフォームのうちの任意の1つを用いる1つ以上のプロセッサ上で実行可能なソフトウェアとしてコード化することができる。加えて、そのようなソフトウェアは、複数の適したプログラミング言語及び/又はプログラミングツール若しくはスクリプティングツールのうちの任意のものを用いて記述することができ、実行可能機械語コード、又はフレームワーク若しくは仮想機械上で実行される中間コードとしてコンパイルすることもできる。通常、プログラムモジュールの機能は、様々な実施形態において所望に応じて組み合わせることもできるし、分散させることもできる。
本開示の実施形態は、方法として具現化することができ、この方法の一例が提供されている。この方法の一部として実行される動作は、任意の適した方法で順序付けることができる。したがって、例示したものと異なる順序で動作が実行される実施形態を構築することができ、この順序は、いくつかの動作が例示の実施形態では順次的な動作として示されていても、それらの動作を同時に実行することを含むことができる。さらに、請求項の要素を修飾する、特許請求の範囲における「第1」、「第2」等の序数の使用は、それ自体で、1つの請求項の要素の別の請求項の要素に対する優先順位も、優位性も、順序も暗示するものでもなければ、方法の動作が実行される時間的な順序も暗示するものでもなく、請求項の要素を区別するために、単に、或る特定の名称を有する1つの請求項の要素を、同じ(序数の用語の使用を除く)名称を有する別の要素と区別するラベルとして用いられているにすぎない。

Claims (20)

  1. 居住者のための一組のデバイスの動作を制御するシステムであって、
    ラベル付きデータの各インスタンスが少なくとも1つの環境の異なる状態における少なくとも1人の居住者の熱的快適性レベルを示す、前記ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリと、
    前記メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングするハードウェアプロセッサと、
    前記居住者のバイオメトリックデータの測定値、前記居住者がいる前記環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信する入力インタフェースと、
    前記受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータのインスタンスの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、前記ラベル無しデータのインスタンスをラベル付けするように前記居住者に要求する送信機と、
    を備え、
    前記ラベル無しデータのインスタンスの前記ラベル付けに応答して、前記ハードウェアプロセッサは、前記ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとして前記メモリ内の個人別ラベル付きデータベースに記憶し、前記記憶された履歴ラベル付きデータと比較して、前記記憶された個人別ラベル付きデータの異なる重みを用いて、前記個人別熱的快適性モデルをトレーニングし、前記初期化期間の間の反復ごとに、前記個人別ラベル付きデータを用いて前記個人別ラベル付きデータベースを更新し、前記履歴データベース及び前記更新された個人別データベースを用いて前記個人別熱的快適性モデルを再トレーニングし、
    前記システムは、
    再トレーニングされた個人別熱的快適性モデルに基づいて前記一組のデバイスを制御するコントローラ、
    を備える、システム。
  2. 前記個人別熱的快適性モデルは、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンのうちの1つ又はそれらの組み合わせである、請求項1に記載のシステム。
  3. 前記個人別熱的快適性モデルを前記メモリに記憶する前に、前記個人別熱的快適性モデルは、前記履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化される、請求項1に記載のシステム。
  4. 前記個人別熱的快適性モデルは、前記初期化期間の間に前記個人別熱的快適性モデルをトレーニングするための探索空間を制限する、前記記憶された履歴ラベル付きデータに対する前記個人別熱的快適性モデルの正則化に基づいて、前記メモリに記憶される前に反復して事前トレーニングされる、請求項1に記載のシステム。
  5. 前記個人別熱的快適性モデルの重みは、回帰関数、ニューラルネットワーク、分類器、サポートベクターマシンのうちの1つを含む機械学習モデルのパラメータに対応する、請求項1に記載のシステム。
  6. 前記個人別ラベル付きデータの測定値は、前記一組のデバイスによって制御される被制御パラメータと、前記一組のデバイスによって制御されないパラメータとを含む、請求項1に記載のシステム。
  7. 前記被制御パラメータは、温度、湿度又は風速のうちの1つ又はそれらの組み合わせを含み、前記制御されないパラメータは、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値のうちの1つ又はそれらの組み合わせを含む、請求項6に記載のシステム。
  8. 前記被制御パラメータは、
    前記制御されないパラメータと前記被制御パラメータとをリアルタイムデータのそのインスタンス内のグループに分離することと、
    結果として得られる個人別熱的快適性モデルが、熱的快適スケールによる前記居住者の快適性を最大にする前記居住者の予測された熱的快適性レベルを出力するように、最適化方法を用いて前記被制御パラメータの各被制御パラメータの値を求めることと、
    によって、トレーニングされた個人別熱的快適性モデルに従って前記居住者の予測された熱的快適性レベルを最適化することによって求められ、
    その後、前記コントローラは、一組の最適な被制御パラメータのうちの少なくとも1つのパラメータに従って前記一組のデバイスを指示する、請求項6に記載のシステム。
  9. 前記個人別熱的快適性モデルのトレーニングは、全ての個人別ラベル付きデータがアクセス不能又は未知であると仮定されるような、前記記憶された履歴ラベル付きデータ及び前記個人別ラベル付きデータを用いる回帰手法の機械学習のタイプである帰納転移学習アルゴリズムに基づいている、請求項1に記載のシステム。
  10. 前記個人別熱的快適性モデルの前記反復したトレーニングは、前記リアルタイムデータ及び能動学習アルゴリズムを用い、前記反復したトレーニングは、前記個人別熱的快適性モデルの精度が閾値を上回るまで継続するように行われ、その後、前記個人別熱的快適性モデルの前記反復したトレーニングは、前記受信された居住者ラベル付きリアルタイムデータのみを用いてトレーニングされる、請求項1に記載のシステム。
  11. 前記リアルタイムデータは、リアルタイムに受信されるデータであり、前記居住者の前記バイオメトリックデータの受信される測定値は、心拍数、皮膚温度、電気皮膚応答、高度計読み取り値、ジャイロスコープ読み取り値、加速度計読み取り値、光レベルインジケータの測定値又は衣類センサの測定値のうちの1つ又はそれらの組み合わせを含むようになっている、請求項1に記載のシステム。
  12. 前記居住者は、前記一組のデバイスのユーザであり、電子デバイス又はウェアラブル電子デバイスを介して前記一組のデバイスを制御する、請求項1に記載のシステム。
  13. 居住者のための一組のデバイスの動作を制御する方法であって、
    ラベル付きデータの各インスタンスが少なくとも1つの環境の異なる状態における少なくとも1人の居住者の熱的快適性レベルを示す、前記ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリを用いることと、
    ハードウェアプロセッサを用いて、前記メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングすることと、
    前記居住者のバイオメトリックデータの測定値、前記居住者がいる前記環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを入力インタフェースを介して受信することと、
    前記受信されたラベル無しデータに類似する記憶された履歴ラベル付きデータのラベルとラベル無しデータのインスタンスの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、送信機を介して、前記ラベル無しデータのインスタンスをラベル付けするように前記居住者に要求することと、
    前記入力インタフェースを用いて、前記ラベル無しデータのインスタンスをラベル付けしたことを含む前記居住者からの返答を受信し、前記ハードウェアプロセッサが、前記ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとして前記メモリ内の個人別ラベル付きデータベースに記憶し、前記記憶された履歴ラベル付きデータとは異なる、前記記憶された個人別ラベル付きデータの重みを用いて、前記個人別熱的快適性モデルをトレーニングし、前記初期化期間の間の反復ごとに、前記個人別ラベル付きデータを用いて前記個人別ラベル付きデータベースを更新し、前記履歴データベース及び前記更新された個人別データベースを用いて前記個人別熱的快適性モデルを再トレーニングすることと、
    再トレーニングされた個人別熱的快適性モデルに基づいて前記一組のデバイスを、コントローラを介して制御することと、
    を含む、方法。
  14. 前記居住者の前記熱的快適性レベルは、寒い快適性範囲、涼しい快適性範囲、心地よい快適性範囲、暖かい快適性範囲及び暑い快適性範囲を含む、請求項13に記載の方法。
  15. 前記環境内の前記居住者によって選択される前記熱的快適性レベルは、前記リアルタイムデータに基づいて能動学習アルゴリズムを用いてシステムによって開始される、請求項13に記載の方法。
  16. 前記環境内の環境データの前記測定値は、温度、明るさ、音量、空気流量若しくは日射量、又はそれらの或る組み合わせのうちの少なくとも1つを含み、前記一組のデバイスは、システムと通信するサーモスタット及び前記環境の温度を変化させる空調暖房システムのうちの一方である、請求項13に記載の方法。
  17. 居住者のための暖房換気空調(HVAC)システムの動作を制御するシステムであって、
    ラベル付きデータの各インスタンスが少なくとも1つの環境の異なる状態における少なくとも1人の居住者の熱的快適性レベルを示す、前記ラベル付きデータを含む履歴データを履歴データベースに記憶したメモリと、
    前記メモリに記憶された個人別熱的快適性モデルを初期化期間の間に反復してトレーニングするハードウェアプロセッサであって、前記メモリに記憶される前の前記個人別熱的快適性モデルは、履歴ラベル付きデータ及び転移学習アルゴリズムを用いて初期化され、その結果、前記初期化期間の間に前記個人別熱的快適性モデルをトレーニングするための探索空間が制限される、ハードウェアプロセッサと、
    前記居住者のバイオメトリックデータの測定値、前記居住者がいる前記環境内の環境データの測定値、又はそれらの双方を含むラベル無しリアルタイムデータのシーケンスを受信する入力インタフェースと、
    前記受信されたラベル無しデータに類似する記憶された前記履歴ラベル付きデータのラベルとラベル無しデータポイントの予測ラベルとの間の不一致が所定の不一致閾値を超えているときに、前記ラベル無しデータのインスタンスをラベル付けするように前記居住者に要求する送信機と、
    を備え、
    前記ラベル無しデータのインスタンスの前記ラベル付けに応答して、前記ハードウェアプロセッサは、前記ラベル無しデータのラベル付きインスタンスを個人別ラベル付きデータとして前記メモリ内の個人別ラベル付きデータベースに記憶し、前記記憶された履歴ラベル付きデータと比較して、前記記憶された個人別ラベル付きデータの異なる重みを用いて、前記個人別熱的快適性モデルをトレーニングし、前記初期化期間の間の反復ごとに、前記個人別ラベル付きデータを用いて前記個人別ラベル付きデータベースを更新し、前記履歴データベース及び前記更新された個人別データベースを用いて前記個人別熱的快適性モデルを再トレーニングし、
    前記システムは、
    再トレーニングされた個人別熱的快適性モデルに基づいて前記HVACシステムを制御するコントローラ、
    を備える、システム。
  18. 前記個人別熱的快適性モデルは、回帰関数、ニューラルネットワーク、分類器又はサポートベクターマシンのうちの1つ又はそれらの組み合わせである、請求項17に記載のシステム。
  19. 前記個人別熱的快適性モデルの重みは、回帰関数、ニューラルネットワーク、分類器、サポートベクターマシンのうちの1つを含む機械学習モデルのパラメータに対応する、請求項17に記載のシステム。
  20. 前記個人別ラベル付きデータの前記測定値は、前記HVACシステムによって制御される被制御パラメータと、前記HVACシステムによって制御されないパラメータとを含み、
    前記被制御パラメータは、
    前記制御されないパラメータと前記被制御パラメータとをリアルタイムデータのそのインスタンス内のグループに分離することと、
    結果として得られる個人別熱的快適性モデルが、熱的快適スケールによる前記居住者の快適性を最大にする前記居住者の予測された熱的快適性レベルを出力するように、最適化方法を用いて前記被制御パラメータの各被制御パラメータの値を求めることと、
    によって、トレーニングされた個人別熱的快適性モデルに従って前記居住者の予測された熱的快適性レベルを最適化することによって求められ、
    その後、前記コントローラは、一組の最適な被制御パラメータのうちの少なくとも1つのパラメータに従って前記一組のデバイスを指示する、請求項17に記載のシステム。
JP2020534631A 2018-02-05 2018-07-30 動作を制御するシステム及び方法 Active JP6925536B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US15/888,172 2018-02-05
US15/888,172 US10794609B2 (en) 2018-02-05 2018-02-05 Methods and systems for personalized heating, ventilation, and air conditioning
PCT/JP2018/029320 WO2019150612A1 (en) 2018-02-05 2018-07-30 System and method for controlling operation

Publications (2)

Publication Number Publication Date
JP2021508118A true JP2021508118A (ja) 2021-02-25
JP6925536B2 JP6925536B2 (ja) 2021-08-25

Family

ID=63517965

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020534631A Active JP6925536B2 (ja) 2018-02-05 2018-07-30 動作を制御するシステム及び方法

Country Status (5)

Country Link
US (1) US10794609B2 (ja)
EP (1) EP3750012B1 (ja)
JP (1) JP6925536B2 (ja)
CN (1) CN111684370B (ja)
WO (1) WO2019150612A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210096284A (ko) * 2019-02-28 2021-08-04 엘지전자 주식회사 인공지능 학습에 기반하여 온수기를 제어하는 방법 및 서버

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10678279B2 (en) 2012-08-01 2020-06-09 Tendril Oe, Llc Optimization of energy use through model-based simulations
US9423779B2 (en) 2013-02-06 2016-08-23 Tendril Networks, Inc. Dynamically adaptive personalized smart energy profiles
US9310815B2 (en) 2013-02-12 2016-04-12 Tendril Networks, Inc. Setpoint adjustment-based duty cycling
US9503623B2 (en) 2014-06-03 2016-11-22 Applied Minds, Llc Color night vision cameras, systems, and methods thereof
WO2017173406A1 (en) 2016-04-01 2017-10-05 Tendril Networks, Inc. Orchestrated energy
US11715042B1 (en) 2018-04-20 2023-08-01 Meta Platforms Technologies, Llc Interpretability of deep reinforcement learning models in assistant systems
US11010436B1 (en) 2018-04-20 2021-05-18 Facebook, Inc. Engaging users by personalized composing-content recommendation
US11886473B2 (en) 2018-04-20 2024-01-30 Meta Platforms, Inc. Intent identification for agent matching by assistant systems
US11676220B2 (en) 2018-04-20 2023-06-13 Meta Platforms, Inc. Processing multimodal user input for assistant systems
US11307880B2 (en) 2018-04-20 2022-04-19 Meta Platforms, Inc. Assisting users with personalized and contextual communication content
US20190378020A1 (en) 2018-05-04 2019-12-12 Johnson Controls Technology Company Building energy system with energy data stimulation for pre-training predictive building models
US12086697B2 (en) * 2018-06-07 2024-09-10 Nec Corporation Relationship analysis device, relationship analysis method, and recording medium for analyzing relationship between a plurality of types of data using kernel mean learning
US20210012239A1 (en) * 2019-07-12 2021-01-14 Microsoft Technology Licensing, Llc Automated generation of machine learning models for network evaluation
WO2021016397A1 (en) 2019-07-24 2021-01-28 Uplight, Inc. Adaptive thermal comfort learning for optimized hvac control
US20230182749A1 (en) * 2019-07-30 2023-06-15 Lg Electronics Inc. Method of monitoring occupant behavior by vehicle
CN110500729A (zh) * 2019-08-26 2019-11-26 宁波奥克斯电气股份有限公司 一种空调的控制方法、系统、可读存储介质及空调
CN110500728A (zh) * 2019-08-26 2019-11-26 宁波奥克斯电气股份有限公司 一种空调的控制方法、系统、可读存储介质及空调
US11506410B2 (en) * 2019-09-10 2022-11-22 Johnson Controls Tyco IP Holdings LLP Zone monitoring systems and methods for a zoning system
EP4036931A4 (en) * 2019-09-26 2023-09-20 Lunit Inc. TRAINING METHOD FOR SPECIALIZING AN ARTIFICIAL INTELLIGENCE MODEL IN AN INSTITUTION FOR USE AND DEVICE FOR TRAINING ARTIFICIAL INTELLIGENCE MODELS
CN113496318A (zh) * 2020-03-18 2021-10-12 海信集团有限公司 一种评价用户个性化热舒适的pmv值的终端和方法
CN111412621B (zh) * 2020-03-31 2022-04-01 广东美的制冷设备有限公司 儿童空调及其运行控制方法、计算机存储介质
CN113627448A (zh) * 2020-05-07 2021-11-09 香港大学浙江科学技术研究院 构建人体热舒适预测模型的方法、预测方法及系统
KR20220014620A (ko) * 2020-07-29 2022-02-07 삼성전자주식회사 공기 조화 장치, 공기 조화 시스템 및 제어 방법
JP7041374B2 (ja) 2020-09-04 2022-03-24 ダイキン工業株式会社 生成方法、プログラム、情報処理装置、情報処理方法、及び学習済みモデル
JP6997401B1 (ja) * 2020-09-04 2022-01-17 ダイキン工業株式会社 生成方法、プログラム、情報処理装置、情報処理方法、及び学習済みモデル
CN112178875B (zh) * 2020-09-28 2022-10-04 Tcl空调器(中山)有限公司 一种空调控制方法、空调器、存储介质及系统
JP7080294B2 (ja) * 2020-11-16 2022-06-03 ソフトバンク株式会社 情報処理装置、情報処理プログラム及び情報処理システム
CN112507420B (zh) * 2020-11-19 2022-12-27 同济大学 办公建筑内人员个性化环控行为预测模型训练集构建系统
CN114963459B (zh) * 2021-02-20 2023-10-20 海信集团控股股份有限公司 一种热舒适度调节方法及其设备
CN112963946B (zh) * 2021-02-26 2022-06-17 南京邮电大学 一种面向共享办公区域的暖通空调系统控制方法及装置
CN115111717A (zh) * 2021-03-08 2022-09-27 佛山市顺德区美的电热电器制造有限公司 温度调节设备及其温控方法及装置、电子设备及存储介质
EP4120045A1 (en) * 2021-07-12 2023-01-18 Robert Bosch GmbH Heating, ventilation, and air-conditioning, system, method of controlling a heating, ventilation, and air-conditioning system and method of training a comfort model to be used for controlling a heating, ventilation, and air-conditioning system
US11941925B2 (en) * 2022-06-29 2024-03-26 Beta Air, Llc Monitoring system for an electric aircraft and a method for its use
EP4446824A1 (en) * 2023-04-13 2024-10-16 Robert Bosch GmbH System and method for training a control strategy for a heating, ventilation, and air-conditioning (hvac) system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007315631A (ja) * 2006-05-23 2007-12-06 Toshiba Corp 空調制御装置
JP2010091228A (ja) * 2008-10-10 2010-04-22 Panasonic Corp 空気調和機
WO2016175219A1 (en) * 2015-04-28 2016-11-03 Mitsubishi Electric Corporation Method and system for personalizing a heating ventilation and air conditioning system

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6760716B1 (en) * 2000-06-08 2004-07-06 Fisher-Rosemount Systems, Inc. Adaptive predictive model in a process control system
US6726113B2 (en) 2002-02-25 2004-04-27 Carrier Corporation Temperature control strategy utilizing neural network processing of occupancy and activity level sensing
US8180492B2 (en) * 2008-07-14 2012-05-15 Ecofactor, Inc. System and method for using a networked electronic device as an occupancy sensor for an energy management system
US20140288714A1 (en) 2013-03-15 2014-09-25 Alain Poivet Intelligent energy and space management
US8140450B2 (en) * 2009-03-27 2012-03-20 Mitsubishi Electric Research Laboratories, Inc. Active learning method for multi-class classifiers
US9020647B2 (en) 2009-03-27 2015-04-28 Siemens Industry, Inc. System and method for climate control set-point optimization based on individual comfort
CA2716303A1 (en) * 2010-01-27 2011-07-27 Lennox Industries Inc. Customer equipment profile system for hvac controls
US20120031984A1 (en) 2010-08-03 2012-02-09 Massachusetts Institute Of Technology Personalized Building Comfort Control
DE102010050726A1 (de) * 2010-11-08 2012-05-10 Alphaeos Gmbh & Co. Kg Gebäudeautomationssystem
US9459018B2 (en) * 2010-11-19 2016-10-04 Google Inc. Systems and methods for energy-efficient control of an energy-consuming system
US9256230B2 (en) * 2010-11-19 2016-02-09 Google Inc. HVAC schedule establishment in an intelligent, network-connected thermostat
US9244444B2 (en) * 2011-03-07 2016-01-26 Callida Energy Llc Systems and methods for optimizing energy and resource management for building systems
US8700227B2 (en) * 2011-03-11 2014-04-15 Honeywell International Inc. Room thermal comfort monitor
EP2634707A1 (en) * 2012-02-29 2013-09-04 British Telecommunications Public Limited Company Recommender control system, apparatus and method
EP2842011A4 (en) * 2012-04-25 2016-05-04 Bidgely Inc ENERGY DISPLAY ENGINEERING TECHNOLOGIES FOR ENERGY CONSUMPTION DATA OF A WHOLE HOUSE WITH LOW RESOLUTION
US9411327B2 (en) * 2012-08-27 2016-08-09 Johnson Controls Technology Company Systems and methods for classifying data in building automation systems
US10083255B2 (en) * 2012-12-14 2018-09-25 Honeywell International Inc. Equipment fault detection, diagnostics and disaggregation system
US10067516B2 (en) 2013-01-22 2018-09-04 Opower, Inc. Method and system to control thermostat using biofeedback
EP2792957A1 (en) * 2013-04-15 2014-10-22 Schneider Electric Danmark A/S System and method for climate control in a building
US9996091B2 (en) * 2013-05-30 2018-06-12 Honeywell International Inc. Comfort controller with user feedback
TWI546506B (zh) * 2014-12-04 2016-08-21 台達電子工業股份有限公司 環境舒適度控制系統及其控制方法
US10262272B2 (en) * 2014-12-07 2019-04-16 Microsoft Technology Licensing, Llc Active machine learning
US10254726B2 (en) * 2015-01-30 2019-04-09 Schneider Electric USA, Inc. Interior comfort HVAC user-feedback control system and apparatus
US20170051934A1 (en) * 2015-08-21 2017-02-23 Google Inc. Persistent thermal model and method of using same for automatically determining the presence of an additional thermal source other than the hvac system being controlled
US20170123440A1 (en) * 2015-10-29 2017-05-04 Honeywell International Inc. Crowd comfortable settings
US10247438B2 (en) * 2017-03-20 2019-04-02 International Business Machines Corporation Cognitive climate control based on individual thermal-comfort-related data
US10769500B2 (en) * 2017-08-31 2020-09-08 Mitsubishi Electric Research Laboratories, Inc. Localization-aware active learning for object detection
US20190187635A1 (en) * 2017-12-15 2019-06-20 Midea Group Co., Ltd Machine learning control of environmental systems

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007315631A (ja) * 2006-05-23 2007-12-06 Toshiba Corp 空調制御装置
JP2010091228A (ja) * 2008-10-10 2010-04-22 Panasonic Corp 空気調和機
WO2016175219A1 (en) * 2015-04-28 2016-11-03 Mitsubishi Electric Corporation Method and system for personalizing a heating ventilation and air conditioning system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210096284A (ko) * 2019-02-28 2021-08-04 엘지전자 주식회사 인공지능 학습에 기반하여 온수기를 제어하는 방법 및 서버
KR102686883B1 (ko) * 2019-02-28 2024-07-19 엘지전자 주식회사 인공지능 학습에 기반하여 온수기를 제어하는 방법 및 서버

Also Published As

Publication number Publication date
US20190242608A1 (en) 2019-08-08
CN111684370A (zh) 2020-09-18
CN111684370B (zh) 2023-07-28
WO2019150612A1 (en) 2019-08-08
EP3750012A1 (en) 2020-12-16
EP3750012B1 (en) 2023-09-06
JP6925536B2 (ja) 2021-08-25
US10794609B2 (en) 2020-10-06

Similar Documents

Publication Publication Date Title
JP6925536B2 (ja) 動作を制御するシステム及び方法
Lu et al. Data-driven simulation of a thermal comfort-based temperature set-point control with ASHRAE RP884
Martins et al. A systematic review of personal thermal comfort models
Feng et al. Data-driven personal thermal comfort prediction: A literature review
US11268713B2 (en) Smart home air conditioner automatic control system based on artificial intelligence
Jiang et al. Modelling personal thermal sensations using C-Support Vector Classification (C-SVC) algorithm
CN110377936B (zh) 一种智能建筑人员个性化热舒适度动态感知的系统及方法
US20160320081A1 (en) Method and System for Personalization of Heating, Ventilation, and Air Conditioning Services
Laftchiev et al. An IoT system to estimate personal thermal comfort
Megri et al. Prediction of the thermal comfort indices using improved support vector machine classifiers and nonlinear kernel functions
TW201715182A (zh) 智能節能環境調控系統及方法
CN110726222B (zh) 空调控制方法、装置、存储介质以及处理器
Cen et al. Physiological sensing of personal thermal comfort with wearable devices in fan-assisted cooling environments in the tropics
Kim et al. Human-building interaction for indoor environmental control: Evolution of technology and future prospects
CN110377084A (zh) 一种基于智慧控制策略的建筑室内环境调控方法
KR20210049769A (ko) 인공지능 기반 스마트 홈 에어컨 자동 제어 시스템
Kumar et al. Real-time data based thermal comfort prediction leading to temperature setpoint control
CN109373499B (zh) 空调控制方法及装置
JP7258798B2 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
Fan et al. A data-driven framework for thermal comfort assessment method based on user interaction
WO2022025819A1 (en) System and method of controlling an air-conditioning and/or heating system
EP4051968B1 (en) System and method for thermal control based on invertible causation relationship
Laftchiev et al. Personalizing individual comfort in the group setting
Awalgaonkar et al. Learning personalized thermal preferences via Bayesian active learning with unimodality constraints
CN116931419A (zh) 应用于智能设备控制的环境舒适模型自动构建方法及装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200619

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200619

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210622

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210803

R150 Certificate of patent or registration of utility model

Ref document number: 6925536

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250