WO2022101989A1

WO2022101989A1 - 空気調和装置、および空気調和装置の学習装置

Info

Publication number: WO2022101989A1
Application number: PCT/JP2020/041935
Authority: WO
Inventors: 一平篠田
Original assignee: 三菱電機株式会社
Priority date: 2020-11-10
Filing date: 2020-11-10
Publication date: 2022-05-19
Also published as: EP4246050A1; EP4246050A4

Abstract

室内ユニット（２０ａ、２０ｂ）は、制御器（６ａ、６ｂ）と、室内熱交換器（３ａ、３ｂ）と、電子膨張弁（４ａ、４ｂ）と、吸込空気温度を検出する吸込サーミスタ（７ａ、７ｂ）と、吹出空気温度を検出する吹出サーミスタ（８ａ、８ｂ）とを含み、吹出サーミスタ（８ａ、８ｂ）の検出温度が基準値に達すると、サーモオフ運転する。空気調和装置は、過去の一定期間における、設定温度、複数の吸込サーミスタ（７ａ、７ｂ）の検出温度、および複数の吹出サーミスタ（８ａ、８ｂ）の検出温度を含む要因から、将来の一定期間において、複数の室内ユニット（２０ａ、２０ｂ）のうちのいずれかがサーモオフ運転するか否かを推論する第１の推論装置（３２）を備える。

Description

空気調和装置、および空気調和装置の学習装置

　本開示は、空気調和装置、および空気調和装置の学習装置に関する。

　複数の室内ユニットを備え、各室内ユニットがサーモオフ運転することができる空気調和装置が知られている。

　たとえば、特許文献１に記載の空気調和装置は、室内熱交換器及び室内膨張弁を個別に有する複数の室内ユニットと、室外膨張弁を有する室外ユニットとが液冷媒連絡管及びガス冷媒連絡管により接続された冷媒回路を有する。各室内ユニットは、個別にサーモオフ運転を実行する。

特開２０２０－１６９８０９号公報

　特許文献１に記載の空気調和装置においては、室内ユニットごとに、サーモオフ運転するか否かが判定される。各室内ユニットは、自律的にサーモオフ運転するため、ある室内ユニットがサーモオフ運転した場合、室外機は圧縮機の高圧および低圧を運転範囲内に保つため、その室内ユニット分の冷媒の循環量を低下させる必要がある。その結果、空気調和装置全体として見た時に、冷媒の循環量が急激に低下するので、吹出空気の温度が乱れてしまう。

　それゆえに、本開示の目的は、複数のサーモオフ運転が可能な室内ユニットを備え、吹出空気の温度を安定させることができる空気調和装置、および空気調和装置の学習装置を提供することである。

　本開示は、室内機と室外機とを備えた空気調和装置である。室外機は、圧縮機と、室外熱交換気とを含む。室内機は、複数の室内ユニットと、ファンとを含む。各室内ユニットは、制御器と、室内熱交換器と、電子膨張弁と、吸込空気温度を検出する吸込サーミスタと、吹出空気温度を検出する吹出サーミスタとを含み、吹出サーミスタの検出温度が基準値に達すると、サーモオフ運転する。空気調和装置は、過去の一定期間における、設定温度、複数の吸込サーミスタの検出温度、および複数の吹出サーミスタの検出温度を含む要因から、将来の一定期間において、複数の室内ユニットのうちのいずれかがサーモオフ運転するか否かを推論する第１の推論装置をさらに備える。

　本開示は、室内機と室外機とを備えた空気調和装置の学習装置である。室外機は、圧縮機と、室外熱交換気とを含む。室内機は、複数の室内ユニットと、ファンとを含む。各室内ユニットは、制御器と、室内熱交換器と、電子膨張弁と、吸込空気温度を検出する吸込サーミスタと、吹出空気温度を検出する吹出サーミスタとを含み、吹出サーミスタの検出温度が基準値に達すると、サーモオフ運転する。空気調和装置の学習装置は、第１の期間における、設定温度、複数の吸込サーミスタの検出温度、および複数の吹出サーミスタの検出温度を含む要因データと、第１の期間より後の第２の期間において、複数の室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測データとを含む第１の学習データを取得する第１のデータ取得部と、第１の学習データを用いて、過去の一定期間における、設定温度、複数の吸込サーミスタの検出温度、および複数の吹出サーミスタの検出温度を含む要因から、将来の一定期間において、複数の室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力するための第１の学習済みモデルを生成する第１のモデル生成部とを備える。

　本開示によれば、複数のサーモオフ運転が可能な室内ユニットを備えた空気調和装置において、吹出空気の温度を安定させることができる。

実施の形態の空気調和装置の構成を表わす図である。空気調和装置の冷房運転時におけるサーモオフ運転の例を表わす図である。空気調和装置の暖房運転時におけるサーモオフ運転の例を表わす図である。学習装置１１の構成を表わす図である。実施の形態１の第１の学習済みモデルを説明するための図である。実施の形態１の第２の学習済みモデルを説明するための図である。空気調和装置の冷房運転時における第１の学習データの取得例を説明するための図である。空気調和装置の暖房運転時における第１の学習データの取得例を説明するための図である。ニューラルネットワークの構成を表わす図である。第１の学習装置１２による第１の学習手順を表わすフローチャートである。第２の学習装置１３による第２の学習手順を表わすフローチャートである。推論装置３１の構成を表わす図である。第１の推論装置３２による第１の推論手順を表わすフローチャートである。第２の推論装置３３による第２の推論手順を表わすフローチャートである。空気調和装置の冷房運転時における第１の推論、第２の推論、および空調制御の例を表わす図である。空気調和装置の暖房運転時における第１の推論、第２の推論、および空調制御の例を表わす図である。実施の形態２の第１の学習済みモデルを説明するための図である。実施の形態２の第２の学習済みモデルを説明するための図である。実施の形態３の第１の学習済みモデルを説明するための図である。実施の形態３の第２の学習済みモデルを説明するための図である。学習装置１１、推論装置３１、またはメインコントローラ５１のハードウェア構成を表わす図である。

　実施の形態１．
　図１は、実施の形態の空気調和装置の構成を表わす図である。

　空気調和装置は、室外機２と、室内機１と、学習装置１１と、学習済みモデル記憶装置２１と、推論装置３１と、データ記憶装置７１と、メインコントローラ５１とを備える。

　室外機２は、圧縮機１０と、室外熱交換器９とを備える。
　室内機１は、第１の室内ユニット２０ａと、第２の室内ユニット２０ｂと、ファン５とを備える。

　第１の室内ユニット２０ａは、第１の制御器６ａと、第１の室内熱交換器３ａと、第１の電子膨張弁４ａと、第１の室内ユニット２０ａへの吸込空気温度を検出する第１の吸込サーミスタ７ａと、第１の室内ユニット２０ａからの吹出空気温度を検出する第１の吹出サーミスタ８ａとを備える。第１の制御器６ａは、第１の室内熱交換器３ａ、第１の電子膨張弁４ａ、第１の吸込サーミスタ７ａ、第１の吹出サーミスタ８ａ、およびファン５と接続される。

　第２の室内ユニット２０ｂは、第２の制御器６ｂと、第２の室内熱交換器３ｂと、第２の電子膨張弁４ｂと、第２の室内ユニット２０ｂへの吸込空気温度を検出する第２の吸込サーミスタ７ｂと、第２の室内ユニット２０ｂからの吹出空気温度を検出する第２の吹出サーミスタ８ｂとを備える。第２の制御器６ｂは、第２の室内熱交換器３ｂ、第２の電子膨張弁４ｂ、第２の吸込サーミスタ７ｂ、第２の吹出サーミスタ８ｂ、およびファン５と接続される。

　図１には、空気調和装置の冷房運転時の、冷媒の流れが示されている。
　第１の室内ユニット２０ａは、第１の吹出サーミスタ８ａの検出温度が基準値に達すると、サーモオフ運転する。サーモオフ運転では、たとえば、第１の制御器６ａは、第１の電子膨張弁４ａを全閉に設定するとともに、室外機２にサーモオフ運転に切替えたことを通知する。室外機２は、圧縮機１０の周波数の上限を下げるとともに、圧縮機１０の実運転周波数を下げる。

　第２の室内ユニット２０ｂは、第２の吹出サーミスタ８ｂの検出温度が基準値に達すると、サーモオフ運転する。サーモオフ運転では、たとえば、第２の制御器６ｂは、第２の電子膨張弁４ｂを全閉に設定するとともに、ファン５を停止させ、室外機２にサーモオフ運転に切替えたことを通知する。室外機２は、圧縮機１０の周波数の上限を下げるとともに、圧縮機１０の実運転周波数を下げる。

　図２は、空気調和装置の冷房運転時におけるサーモオフ運転の例を表わす図である。
　負荷に対して能力が過剰な状態であり、吹出温度が低下する。吹出温度が下限基準値ＴＬに達すると、第１の室内ユニット２０ａまたは第２の室内ユニット２０ｂがサーモオフ運転する。その結果、低圧の著しい低下を防ぐため、圧縮機１０の周波数も下げられる。その後、吹出温度は急激に上昇し、ハンチングした後に、リモコンによって設定された設定温度に収束する。

　図３は、空気調和装置の暖房運転時におけるサーモオフ運転の例を表わす図である。
　負荷に対して能力が過剰な状態であり、吹出温度が上昇する。吹出温度が上限基準値ＴＨに達すると、第１の室内ユニット２０ａまたは第２の室内ユニット２０ｂがサーモオフ運転する。その後、吹出温度は急激に上昇し、ハンチングした後に、リモコンによって設定された設定温度に収束する。

　データ記憶装置７１は、時刻ｔごとの、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、複数の吹出サーミスタ８ａ、８ｂの検出温度、および複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転したか否かを表わすデータを記憶する。

　図４は、学習装置１１の構成を表わす図である。
　学習装置１１は、第１の学習装置１２と、第２の学習装置１３とを備える。学習済みモデル記憶装置２１は、第１の学習済みモデル記憶装置２２と、第２の学習済みモデル記憶装置２３とを備える。

　第１の学習済みモデル記憶装置２２は、第１の学習済みモデルを記憶する。
　図５は、実施の形態１の第１の学習済みモデルを説明するための図である。

　実施の形態１の第１の学習済みモデルは、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因から、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力するためのモデルである。

　第２の学習済みモデル記憶装置２３は、第２の学習済みモデルを記憶する。
　図６は、実施の形態１の第２の学習済みモデルを説明するための図である。

　実施の形態１の第２の学習済みモデルは、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を出力するためのモデルである。

　第１の学習装置１２は、第１のデータ取得部１４と、第１のモデル生成部１５とを備える。

　図７は、空気調和装置の冷房運転時における第１の学習データの取得例を説明するための図である。図８は、空気調和装置の暖房運転時における第１の学習データの取得例を説明するための図である。

　第１のデータ取得部１４は、データ記憶装置７１から、第１の期間（ｔ１～ｔ１＋ΔＴｘ）における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因データと、第１の期間より後の第２の期間（ｔ１＋ΔＴｘ～ｔ１＋ΔＴｙ）において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測データとを含む第１の学習データを取得する。第１のデータ取得部１４は、ｔ１を変化させることによって、複数の第１の学習データを取得する。

　第１のモデル生成部１５は、第１のデータ取得部１４が取得した第１の学習データを用いて、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因から、将来の一定期間内において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力する第１の学習済みモデルを生成する。第１のモデル生成部１５は、生成した第１の学習済みモデルを第１の学習済みモデル記憶装置２２に記憶する。

　第１のモデル生成部１５が用いる学習アルゴリズムは教師あり学習、教師なし学習、または強化学習等の公知のアルゴリズムを用いることができる。一例として、ニューラルネットワークを適用した場合について説明する。

　図９は、ニューラルネットワークの構成を表わす図である。
　第１のモデル生成部１５は、例えば、ニューラルネットワークモデルに従って、いわゆる教師あり学習により、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因から、将来の一定期間内において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を学習する。ここで、教師あり学習とは、入力と結果（ラベル）のデータの組（第１の学習データ）を第１の学習装置１２に与えることによって、第１の学習データにある特徴を学習し、入力から結果を推論する手法をいう。

　ニューラルネットワークは、複数のニューロンからなる入力層、複数のニューロンからなる中間層(隠れ層)、及び複数のニューロンからなる出力層によって構成される。中間層は、１層、又は２層以上でもよい。

　例えば、３層のニューラルネットワークであれば、複数の入力が入力層（Ｘ１～Ｘ３）に入力されると、その値に重みＷ１（ｗ１１～ｗ１６）を掛けて中間層（Ｙ１～Ｙ２）に入力され、その結果にさらに重みＷ２（ｗ２１～ｗ２６）を掛けて出力層（Ｚ１～Ｚ３）から出力される。この出力結果は、重みＷ１とＷ２の値によって変わる。

　ニューラルネットワークは、第１のデータ取得部１４によって取得される第１の学習データに従って、いわゆる教師あり学習により、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度から、将来の一定期間内において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力する第１の学習済みモデルを生成する。

　すなわち、ニューラルネットワークは、入力層に、過去の一定期間における設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を入力して、出力層から出力された結果が、将来の一定期間内において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測（正解）に近づくように重みＷ１とＷ２を調整することで学習する。

　第１のモデル生成部１５は、以上のような学習を実行することで学習済みモデルを生成し、第１の学習済みモデル記憶装置２２に出力する。

　図１０は、第１の学習装置１２による第１の学習手順を表わすフローチャートである。
　ステップｂ１において、第１のデータ取得部１４は、データ記憶装置７１から、第１の期間（ｔ１～ｔ１＋ΔＴｘ）における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因データと、第１の期間より後の第２の期間（ｔ１＋ΔＴｘ～ｔ１＋ΔＴｙ）において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測データとを含む第１の学習データを取得する。第１のデータ取得部１４は、ｔ１を変化させることによって、複数の第１の学習データを取得する。

　ステップｂ２において、第１のモデル生成部１５は、第１のデータ取得部１４が取得した第１の学習データを用いて、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因から、将来の一定期間内において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力する第１の学習済みモデルを生成する。

　ステップｂ３において、第１のモデル生成部１５は、生成した第１の学習済みモデルを第１の学習済みモデル記憶装置２２に記憶する。

　第２の学習装置１３は、第２のデータ取得部１６と、第２のモデル生成部１７とを備える。

　第２のデータ取得部１６は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態と、この状態における、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動とを含む第２の学習データを取得する。

　第２のモデル生成部１７は、第２のデータ取得部１６によって取得された第２の学習データを用いて、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を出力するための第２の学習済みモデルを生成する。第２のモデル生成部１７は、生成した第２の学習済みモデルを第２の学習済みモデル記憶装置２３に記憶する。

　第２のモデル生成部１７が用いる学習アルゴリズムとして、強化学習等の公知のアルゴリズムを用いることができる。一例として、強化学習を適用した場合について説明する。強化学習では、ある環境内におけるエージェント（行動主体）が、現在の状態（環境のパラメータ）を観測し、取るべき行動を決定する。エージェントの行動により環境が動的に変化し、エージェントには環境の変化に応じて報酬が与えられる。エージェントはこれを繰り返し、一連の行動を通じて報酬が最も多く得られる行動方針を学習する。強化学習の代表的な手法であるＱ学習、またはＴＤ学習（Temporal　Difference　Learning）を用いることができる。例えば、Ｑ学習（Q-learning）の場合、行動価値関数Ｑ（ｓ，ａ）の一般的な更新式は、式（１）で表される。

　式（１）において、ｓｔは時刻ｔにおける環境の状態を表し、ａｔは時刻ｔにおける行動を表す。行動ａｔにより、状態はｓｔ＋１に変わる。ｒｔ＋１はその状態の変化によってもらえる報酬を表し、γは割引率を表し、αは学習係数を表す。なお、γは０＜γ≦１、αは０＜α≦１の範囲とする。設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、２０ｂの検出温度が状態ｓｔとなる。目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度が行動ａｔとなる。Ｑ学習では、時刻ｔの状態ｓｔにおける最良の行動ａｔを学習する。

　式（１）で表される更新式は、時刻ｔ＋１における最もＱ値の高い行動ａの行動価値関数Ｑの値が、時刻ｔにおいて実行された行動ａの行動価値関数Ｑの値よりも大きければ、行動価値関数Ｑの値を大きくし、逆の場合は、行動価値関数Ｑの値を小さくする。換言すれば、時刻ｔにおける行動ａの行動価値関数Ｑの値を、時刻ｔ＋１における最良の行動価値に近づけるように、行動価値関数Ｑ（ｓ，ａ）を更新する。それにより、或る環境における最良の行動価値が、それ以前の環境における行動価値に順次伝播していくようになる。

　上記のように、強化学習によって第２の学習済みモデルを生成する場合、第２のモデル生成部１７は、報酬計算部１８と、関数更新部１９とを備える。

　報酬計算部１８は、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動と、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態とに基づいて、報酬を計算する。報酬計算部１８は、設定温度と吹出空気温度との差に基づいて、報酬ｒを計算する。吹出空気温度は、複数の吹出サーミスタ８ａ、８ｂの検出温度のいずれか、あるいは平均とすることができる。例えば、報酬計算部１８は、設定温度と吹出空気温度との差が減少したときに、報酬ｒを増大させ（例えば「１」の報酬を与える。）、他方、設定温度と吹出空気温度との差が増加した場合には報酬ｒを低減する（例えば「－１」の報酬を与える。）。

　関数更新部１９は、報酬計算部１８によって計算される報酬に従って、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を決定するための関数を更新し、第２の学習済みモデル記憶装置２３に出力する。例えばＱ学習の場合、関数更新部１９は、式（１）で表される行動価値関数Ｑ（ｓｔ，ａｔ）を、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を算出するための関数として用いる。

　以上のような学習を繰り返し実行する。第２の学習済みモデル記憶装置２３は、関数更新部１９によって更新された行動価値関数Ｑ（ｓｔ，ａｔ）、すなわち、第２の学習済みモデルを記憶する。

　図１１は、第２の学習装置１３による第２の学習手順を表わすフローチャートである。
　ステップｄ１において、第２のデータ取得部１６は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態と、この状態における、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動とを含む第２の学習データを取得する。

　ステップｄ２において、第２のモデル生成部１７は、第２の学習データに基づいて、報酬を計算する。具体的には、報酬計算部１８は、設定温度と吹出空気温度との差に基づいて、報酬を増大させるか、あるいは減少させるかを決定する。

　報酬計算部１８が報酬を増大させると判断した場合に、処理がステップＳ１０３に進む。報酬計算部１８が報酬を減少させると判断した場合に、処理がステップＳ１０４に進む。

　ステップｄ３において、報酬計算部１８が、報酬を増大させる。
　ステップｄ４において、報酬計算部１８は、報酬を減少させる。

　ステップｄ５において、関数更新部１９は、報酬計算部１８によって計算された報酬に基づいて、第２の学習済みモデル記憶装置２３が記憶する式（１）で表される行動価値関数Ｑ（ｓｔ，ａｔ）を更新する。

　第２の学習装置１３は、以上のステップｄ１からｄ５までのステップを繰り返し実行し、生成された行動価値関数Ｑ（ｓｔ，ａｔ）を第２の学習済みモデルとして記憶する。

　図１２は、推論装置３１の構成を表わす図である。
　推論装置３１は、第１の推論装置３２と、第２の推論装置３３とを備える。

　第１の推論装置３２は、第１のデータ取得部３４と、第１の推論部３５とを備える。
　第１のデータ取得部３４は、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因データを取得する。過去の一定期間は、現在の時刻をｔ０としたときに、（ｔ０－ΔＴｘ～ｔ０）の期間とすることができる。

　第１の推論部３５は、第１の学習済みモデル記憶装置２２に記憶されている第１の学習済みモデルに、第１のデータ取得部３４が取得した要因データを入力して、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力する。

　図１３は、第１の推論装置３２による第１の推論手順を表わすフローチャートである。
　ステップｃ１において、第１のデータ取得部３４は、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因データを取得する。

　ステップｃ２、ｃ３において、第１の推論部３５は、第１の学習済みモデル記憶装置２２に記憶されている第１の学習済みモデルに、第１のデータ取得部３４が取得した要因データを入力して、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力する。

　ステップｃ４において、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転すると予測された場合に、処理がステップｃ５に進み、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転することがないと予測された場合に、処理が終了する。

　ステップｃ５において、第２の推論装置３３が、次に説明する推論処理を実行する。
　第２の推論装置３３は、第２のデータ取得部３６と、第２の推論部３７とを備える。

　第２のデータ取得部３６は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態を取得する。

　第２の推論部３７は、第２の学習済みモデル記憶装置２３に記憶されている第２の学習済みモデルを利用して、第２のデータ取得部３６で取得した状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を推論する。

　たとえば、第２の推論部３７は、第２の学習済みモデル記憶装置２３から第２の学習済みモデルとして、行動価値関数Ｑ（ｓｔ，ａｔ）を読み出す。第２の推論部３７は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態ｓｔに対して、行動価値関数Ｑ（ｓ，ａ）に基づいて、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動ａｔを得る。

　メインコントローラ５１は、第２の推論部３７から出力される目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動ａｔに基づいて、空気調和装置を制御する。

　たとえば、メインコントローラ５１は、空気調和装置の冷房運転時において、室内熱交換器３ａ、３ｂの直後の液冷媒の過熱度が目標過熱度となるように電子膨張弁４ａ、４ｂを制御する。たとえば、メインコントローラ５１は、空気調和装置の暖房運転時において、室内熱交換器３ａ、３ｂの直後の液冷媒の過冷却度が目標過冷却度となるように電子膨張弁４ａ、４ｂを制御する。

　図１４は、第２の推論装置３３による第２の推論手順を表わすフローチャートである。
　ステップｅ１において、第２のデータ取得部３６は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態を取得する。

　ステップｅ２において、第２の推論部３７は、第２の学習済みモデル記憶装置２３に記憶されている第２の学習済みモデルを利用して、第２のデータ取得部３６で取得した状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を推論する。

　ステップｅ３において、第２の推論部３７は、得られた目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度をメインコントローラ５１に出力する。

　ステップｅ４において、メインコントローラ５１は、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度に基づいて、空気調和装置を制御する。

　図１５は、空気調和装置の冷房運転時における第１の推論、第２の推論、および空調制御の例を表わす図である。図１６は、空気調和装置の暖房運転時における第１の推論、第２の推論、および空調制御の例を表わす図である。

　第１の推論装置３２が、時刻ｔａにおいて、過去の一定期間（ｔａ－ΔＴｘ～ｔａ）における要因データを第１の学習済みモデルに入力することによって、将来の一定期間（ｔａ～ｔａ＋ΔＴｘ）において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転すると予測する。

　第２の推論装置が、時刻ｔａ以降において、第２の学習済みモデル記憶装置２３に記憶されている第２の学習済みモデルを利用して、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を推論する。

　メインコントローラ５１は、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度に基づいて、空気調和装置を制御する。これによって、空気調和装置の冷房運転時には、吹出温度が下限基準値ＴＬに達しないため、第１の室内ユニット２０ａまたは第２の室内ユニット２０ｂがサーモオフ運転せずに、吹出温度が設定温度に達する。空気調和装置の暖房運転時には、吹出温度が上限基準値ＴＨに達しないため、第１の室内ユニット２０ａまたは第２の室内ユニット２０ｂがサーモオフ運転せずに、吹出温度が設定温度に達する。

　以上のように、本実施の形態の空気調和装置は、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む要因から、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力する。これによって、複数のサーモオフ運転が可能な室内ユニットを備えた空気調和装置において、各室内ユニットがサーモオフ運転するのを予測することができる。

　本実施の形態の空気調和装置は、さらに、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を出力する。これによって、空気調和装置は、各室内ユニットがサーモオフ運転せずに、吹出空気温度が設定温度に安定するように制御することができる。

　実施の形態２．
　図１７は、実施の形態２の第１の学習済みモデルを説明するための図である。

　実施の形態２の第１の学習済みモデルは、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度と、将来の一定期間における、外気温度の予報、および天候の予報とを含む要因から、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力するためのモデルである。将来の一定期間における、外気温度の予報、および天候の予報は、たとえば、現在から１０分以内、または１時間以内などの一定期間の予報をインターネットなどを通じて取得するものとすることができる。

　図１８は、実施の形態２の第２の学習済みモデルを説明するための図である。
　実施の形態２の第２の学習済みモデルは、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を出力するためのモデルである。

　第１の学習装置１２について説明する。
　第１のデータ取得部１４は、第１の期間（ｔ１～ｔ１＋ΔＴｘ）における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度と、第１の期間より後の第２の期間（ｔ１＋ΔＴｘ～ｔ１＋ΔＴｙ）における外気温度の予報、および天候の予報とを含む要因データと、第２の期間（ｔ１＋ΔＴｘ～ｔ１＋ΔＴｙ）において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測データとを含む第１の学習データを取得する。第１のデータ取得部１４は、ｔ１を変化させることによって、複数の第１の学習データを取得する。

　第１のモデル生成部１５は、第１のデータ取得部１４が取得した第１の学習データを用いて、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度と、将来の一定期間における、外気温度の予報、および天候の予報とを含む要因から、将来の一定期間内において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力する第１の学習済みモデルを生成する。第１のモデル生成部１５は、生成した第１の学習済みモデルを第１の学習済みモデル記憶装置２２に記憶する。

　第２の学習装置１３について説明する。
　第２のデータ取得部１６は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態と、この状態における、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動とを含む第２の学習データを取得する。

　第２のモデル生成部１７は、第２のデータ取得部１６によって取得された第２の学習データを用いて、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を出力するための第２の学習済みモデルを生成する。

　報酬計算部１８は、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動と、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態とに基づいて、報酬を計算する。報酬計算部１８は、設定温度と吹出空気温度との差に基づいて、報酬ｒを計算する。

　関数更新部１９は、報酬計算部１８によって計算される報酬に従って、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を決定するための関数を更新し、第２の学習済みモデル記憶装置２３に出力する。

　第１の推論装置３２について説明する。
　第１のデータ取得部３４は、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度と、将来の一定期間における、外気温度の予報、および天候の予報とを含む要因データを取得する。

　第２の推論装置３３について説明する。
　第２のデータ取得部３６は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態を取得する。

　メインコントローラ５１は、実施の形態１と同様にして、得られた目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度に基づいて、空気調和装置を制御する。

　本実施の形態によれば、天候に左右されずに、吹出空気温度を安定化させることができる。

　実施の形態３．
　図１９は、実施の形態３の第１の学習済みモデルを説明するための図である。

　実施の形態３の第１の学習済みモデルは、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度と、将来の一定期間における、外気温度の予報、外気湿度の予報、および天候の予報を含む要因から、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力するためのモデルである。将来の一定期間における、外気温度の予報、外気湿度の予報、および天候の予報は、たとえば、現在から１０分以内、または１時間以内などの一定期間の予報をインターネットなどを通じて取得するものとすることができる。

　図２０は、実施の形態３の第２の学習済みモデルを説明するための図である。
　実施の形態３の第２の学習済みモデルは、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態から、目標過熱度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動を出力するためのモデルである。

　第１の学習装置１２について説明する。
　第１のデータ取得部１４は、第１の期間（ｔ１～ｔ１＋ΔＴｘ）における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度と、第１の期間より後の第２の期間（ｔ１＋ΔＴｘ～ｔ１＋ΔＴｙ）における、外気温度の予報、外気湿度の予報および天候の予報とを含む要因データと、第２の期間（ｔ１＋ΔＴｘ～ｔ１＋ΔＴｙ）において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測データとを含む第１の学習データを取得する。第１のデータ取得部１４は、ｔ１を変化させることによって、複数の第１の学習データを取得する。

　第１のモデル生成部１５は、第１のデータ取得部１４が取得した第１の学習データを用いて、過去の一定期間における、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度と、将来の一定期間における、外気温度の予報、外気湿度の予報、および天候の予報とを含む要因から、将来の一定期間内において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力する第１の学習済みモデルを生成する。第１のモデル生成部１５は、生成した第１の学習済みモデルを第１の学習済みモデル記憶装置２２に記憶する。

　第２の学習装置１３について説明する。
　第２のデータ取得部１６は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態と、この状態における、目標過熱度、室外機２の圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動とを含む第２の学習データを取得する。

　第２のモデル生成部１７は、第２のデータ取得部１６によって取得された第２の学習データを用いて、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態から、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動を出力するための第２の学習済みモデルを生成する。

　第２の推論部３７は、第２の学習済みモデル記憶装置２３に記憶されている第２の学習済みモデルを利用して、第２のデータ取得部３６で取得した状態から、目標過熱度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動を推論する。

　たとえば、第２の推論部３７は、第２の学習済みモデル記憶装置２３から第２の学習済みモデルとして、行動価値関数Ｑ（ｓｔ，ａｔ）を読み出す。第２の推論部３７は、設定温度、複数の吸込サーミスタ７ａ、７ｂの検出温度、および複数の吹出サーミスタ８ａ、８ｂの検出温度を含む状態ｓｔに対して、行動価値関数Ｑ（ｓ，ａ）に基づいて、目標過熱度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動ａｔを得る。

　メインコントローラ５１は、実施の形態１と同様にして、得られた目標過熱度、圧縮機１０の設定周波数、および目標冷媒蒸発温度に基づいて、空気調和装置を制御する。また、メインコントローラ５１は、室内湿度が目標湿度に達するように冷房運転または除湿運転を制御する。

　本実施の形態によれば、天気予報が雨天など湿度が高いような場合には、自動的に除湿運転に切り替えることができる。

　変形例．
　（１）学習装置１１および推論装置３１は、空気調和装置の内部に設けられるが、ネットワークを通じて、空気調和装置と接続され、空気調和装置とは別個の装置であってもよい。さらに、学習装置１１および推論装置３１は、クラウドサーバ上に存在していてもよい。

　（２）図２１は、学習装置１１、推論装置３１、またはメインコントローラ５１のハードウェア構成を表わす図である。

　学習装置１１、推論装置３１、およびメインコントローラ５１は、相当する動作をデジタル回路のハードウェアまたはソフトウェアで構成することができる。学習装置１１、推論装置３１、およびメインコントローラ５１の機能をソフトウェアを用いて実現する場合には、学習装置１１、推論装置３１、およびメインコントローラ５１は、例えば、図２１に示すように、バス５００３によって接続されたプロセッサ５００２とメモリ５００１とを備え、メモリ５００１に記憶されたプログラムをプロセッサ５００２が実行するようにすることができる。

　（３）実施の形態では、第１のモデル生成部１５が用いる学習アルゴリズムに教師あり学習を適用した場合について説明したが、これに限られるものではない。学習アルゴリズムについては、教師あり学習以外にも、強化学習、教師なし学習、又は半教師あり学習等を適用することも可能である。実施の形態は、第２のモデル生成部１７が用いる学習アルゴリズムに強化学習を適用した場合について説明したが、これに限られるものではない。学習アルゴリズムについては、強化学習以外にも、教師あり学習、教師なし学習、又は半教師あり学習等を適用することも可能である。

　（４）第１のモデル生成部１５、および第２のモデル生成部１７は、それぞれ、複数の空気調和装置において作成される第１の学習データ、第２の学習データに従って、第１の学習済みモデル、第２の学習済みモデルを生成してもよい。第１のモデル生成部１５、および第２のモデル生成部１７は、それぞれ、同一のエリアで使用される複数の空気調和装置から第１の学習データ、第２のが学習データを取得してもよいし、異なるエリアで独立して動作する複数の空気調和装置から第１の学習データ、第２の学習データを取得してもよい。第１の学習データ、および第２の学習データを収集する空気調和装置を途中で対象に追加したり、対象から除去することも可能である。さらに、ある空気調和装置の第１の学習データ、および第２の学習データを用いて、第１の学習済みモデル、および第２の学習済みモデルを生成し、これとは別の空気調和装置の第１の学習データ、および第２の学習済みモデルを用いて、第１の学習済みモデル、および第２の学習済みモデルを更新する（再学習する）ようにしてもよい。

　（５）第１のモデル生成部１５および第２のモデル生成部１７が用いられる学習アルゴリズムとしては、特徴量そのものの抽出を学習する、深層学習を用いることもでき、他の公知の方法、例えば遺伝的プログラミング、機能論理プログラミング、またはサポートベクターマシンなどに従って機械学習を実行してもよい。

　（６）実施の形態では、第１の推論部３５は、第１の学習済みモデルを用いて、第１のデータ取得部３４が取得した要因データから、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力するものとしたが、これに限定するものではない。たとえば、第１の推論部３５は、ルールベース推論、または事例ベース推論に基づいて、第１のデータ取得部３４が取得した要因データから、将来の一定期間において、複数の室内ユニット２０ａ、２０ｂのうちのいずれかがサーモオフ運転するか否かの予測を出力するものとしてもよい。

　実施の形態１では、第２の推論部３７は、第２の学習済みモデルを用いて、第２のデータ取得部３６が取得した状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を推論したが、これに限定するものではない。たとえば、第２の推論部３７は、ルールベース推論、または事例ベース推論に基づいて、第２のデータ取得部３６が取得した状態から、目標過熱度、目標過冷却度、圧縮機１０の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を推移論するものとしてもよい。実施の形態２および３においても、同様である。

　（７）上記の実施形態では、第１の学習済みモデルの要因は、過去の一定期間における設定温度を含むものとしたが、これに限定されるものではない。第１の学習済みモデルの要因は、過去の一定期間における複数の吹出サーミスタの検出温度の各々と、過去の一定期間における設定温度との差としてもよい。上記の実施形態では、第２の学習済みモデルの状態は、設定温度を含むものとしたが、これに限定されるものではない。第２の学習済みモデルの要因は、複数の吹出サーミスタの検出温度の各々と、設定温度との差としてもよい。

　（８）上記の実施形態では、室内ユニットは、２個としたが、これに限定されるものでではない。室内ユニットの数は、３個以上であってもよい。

　今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本開示の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。

　１　室内機、２　室外機、３ａ　第１の室内熱交換器、３ｂ　第２の室内熱交換器、４ａ　第１の電子膨張弁、４ｂ　第２の電子膨張弁、５　ファン、６ａ　第１の制御器、６ｂ　第２の制御器、７ａ　第１の吸込サーミスタ、７ｂ　第２の吸込サーミスタ、８ａ　第１の吹出サーミスタ、８ｂ　第２の吹出サーミスタ、９　室外熱交換器、１０　圧縮機、１１　学習装置、１２　第１の学習装置、１３　第２の学習装置、１４，３４　第１のデータ取得部、１５　第１のモデル生成部、１６，３６　第２のデータ取得部、１７　第２のモデル生成部、１８　報酬計算部、１９　関数更新部、２０ａ　第１の室内ユニット、２０ｂ　第２の室内ユニット、２１　学習済みモデル記憶装置、２２　第１の学習済みモデル記憶装置、２３　第２の学習済みモデル記憶装置、３１　推論装置、３２　第１の推論装置、３３　第２の推論装置、３５　第１の推論部、３７　第２の推論部、５１　メインコントローラ、７１　データ記憶装置、５００１　メモリ、５００２　プロセッサ、５００３　バス。

Claims

　室内機と室外機とを備えた空気調和装置であって、
　前記室外機は、圧縮機と、室外熱交換気とを含み、
　前記室内機は、複数の室内ユニットと、ファンとを含み、
　各室内ユニットは、制御器と、室内熱交換器と、電子膨張弁と、吸込空気温度を検出する吸込サーミスタと、吹出空気温度を検出する吹出サーミスタとを含み、前記吹出サーミスタの検出温度が基準値に達すると、サーモオフ運転し、
　過去の一定期間における、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む要因から、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かを推論する第１の推論装置をさらに備えた、空気調和装置。
　前記第１の推論装置は、
　過去の一定期間における、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む要因データを取得する第１のデータ取得部と、
　過去の一定期間における、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む要因から、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力するための第１の学習済みモデルに前記第１のデータ取得部が取得した前記要因データを入力して、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力する第１の推論部と、
　を含む、請求項１記載の空気調和装置。
　前記第１のデータ取得部は、将来の一定期間における、外気温度の予報、および天候の予報をさらに含む要因データを取得し、
　前記第１の推論部は、過去の一定期間における、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度と、将来の一定期間における、外気温度の予報、および天候の予報とを含む要因から、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力するための第１の学習済みモデルに前記第１のデータ取得部が取得した要因データを入力して、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力する、請求項２記載の空気調和装置。
　前記第１のデータ取得部は、将来の一定期間における、外気温度の予報、外気湿度の予報、および天候の予報をさらに含む要因データを取得し、
　前記第１の推論部は、過去の一定期間における、設定温度、複数の前記吸込サーミスタの検出温度、複数の前記吹出サーミスタの検出温度と、将来の一定期間における、外気温度の予報、外気湿度の予報、および天候の予報とを含む要因から、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かを推論するための第１の学習済みモデルに前記第１のデータ取得部が取得した要因データを入力して、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力する、請求項２記載の空気調和装置。
　将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するとの予測が出力されたときに、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む状態から、目標過熱度、目標過冷却度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を推論する第２の推論装置と、
　前記第２の推論装置の推論結果に基づいて、前記空気調和装置を制御するメインコントローラと、
　を備えた、請求項１記載の空気調和装置。
　前記第２の推論装置は、
　設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む状態を取得する第２のデータ取得部と、
　設定温度、複数の前記吸込サーミスタの検出温度、複数の前記吹出サーミスタの検出温度を含む状態から、目標過熱度、目標過冷却度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を推論するための第２の学習済みモデルを用いて、前記第２のデータ取得部が取得した前記状態から、目標過熱度、目標過冷却度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を推論する第２の推論部と、
　を含む、請求項５記載の空気調和装置。
　将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するとの予測が出力されたときに、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む状態から、目標過熱度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標湿度を推論する第２の推論装置と、
　前記第２の推論装置の推論結果に基づいて、前記空気調和装置を制御するメインコントローラと、
　を備えた、請求項１記載の空気調和装置。
　前記第２の推論装置は、
　設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む状態を取得する第２のデータ取得部と、
　設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む状態から、目標過熱度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動を推論するための第２の学習済みモデルを用いて、前記第２のデータ取得部が取得した前記状態から、目標過熱度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動を推論する第２の推論部と、
　を含む、請求項７記載の空気調和装置。
　室内機と室外機とを備えた空気調和装置の学習装置であって、
　前記室外機は、圧縮機と、室外熱交換気とを含み、
　前記室内機は、複数の室内ユニットと、ファンとを含み、
　各室内ユニットは、制御器と、室内熱交換器と、電子膨張弁と、吸込空気温度を検出する吸込サーミスタと、吹出空気温度を検出する吹出サーミスタとを含み、前記吹出サーミスタの検出温度が基準値に達すると、サーモオフ運転し、
　第１の期間における、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む要因データと、前記第１の期間より後の第２の期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測データとを含む第１の学習データを取得する第１のデータ取得部と、
　前記第１の学習データを用いて、過去の一定期間における、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む要因から、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力するための第１の学習済みモデルを生成する第１のモデル生成部と、
　を備える空気調和装置の学習装置。
　前記第１のデータ取得部は、将来の一定期間における、外気温度の予報、および天候の予報をさらに含む要因データと、前記予測データとを含む第１の学習データを取得し、
　前記第１のモデル生成部は、前記第１の学習データを用いて、過去の一定期間における、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度と、将来の一定期間における、外気温度の予報、および天候の予報を含む要因から、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力するための第１の学習済みモデルを生成する、請求項９記載の空気調和装置の学習装置。
　前記第１のデータ取得部は、将来の一定期間における、外気温度の予報、外気湿度の予報、および天候の予報をさらに含む要因データと、前記予測データとを含む第１の学習データを取得し、
　前記第１のモデル生成部は、前記第１の学習データを用いて、過去の一定期間における、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度と、将来の一定期間における、外気温度の予報、外気湿度の予報、および天候の予報とを含む要因から、将来の一定期間において、複数の前記室内ユニットのうちのいずれかがサーモオフ運転するか否かの予測を出力するための第１の学習済みモデルを生成する、請求項９記載の空気調和装置の学習装置。
　設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む状態と、前記状態における、目標過熱度、目標過冷却度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動とを含む第２の学習データを取得する第２のデータ取得部と、
　前記第２の学習データを用いて、設定温度、複数の前記吸込サーミスタの検出温度、複数の前記吹出サーミスタの検出温度を含む状態から、目標過熱度、目標過冷却度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標冷媒凝縮温度を含む行動を出力するための第２の学習済みモデルを生成する第２のモデル生成部と、
　を備える、請求項９記載の空気調和装置の学習装置。
　設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む状態と、前記状態における、目標過熱度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動とを含む第２の学習データを取得する第２のデータ取得部と、
　前記第２の学習データを用いて、設定温度、複数の前記吸込サーミスタの検出温度、および複数の前記吹出サーミスタの検出温度を含む状態から、目標過熱度、前記圧縮機の設定周波数、目標冷媒蒸発温度、および目標湿度を含む行動を出力するための第２の学習済みモデルを生成する第２のモデル生成部と、
　を備える、請求項９記載の空気調和装置の学習装置。
　前記第２のモデル生成部は、Ｑ学習によって前記第２の学習済みモデルを生成する、請求項９～１３のいずれか１項に記載の空気調和装置の学習装置。
　前記第２のモデル生成部は、前記設定温度と吹出空気温度との差が減少したときに、報酬を増大させ、前記設定温度と前記吹出空気温度との差が増加したときに、報酬を減少させる、請求項１４記載の空気調和装置の学習装置。