JP2020148329A

JP2020148329A - 機械学習装置、及び、磁気軸受装置

Info

Publication number: JP2020148329A
Application number: JP2019048948A
Authority: JP
Inventors: 俊平藤本; Shumpei Fujimoto; 篤阪脇; Atsushi Sakawaki; 平田　和也; Kazuya Hirata; 和也平田; 寛日比野; Hiroshi Hibino
Original assignee: Daikin Industries Ltd
Current assignee: Daikin Industries Ltd
Priority date: 2019-03-15
Filing date: 2019-03-15
Publication date: 2020-09-17
Anticipated expiration: 2039-03-15
Also published as: CN113574289B; EP3940254A4; JP6828762B2; CN113574289A; US20220056953A1; WO2020189565A1; EP3940254A1; EP3940254B1

Abstract

【課題】機械学習装置を備え、被支持体の位置の制御を適切に行うことができる磁気軸受装置を提供する。【解決手段】機械学習装置は、磁気軸受装置１０の制御条件を学習する。磁気軸受装置は、シャフト１１５に電磁力を付与する複数の電磁石５１〜５４を有する磁気軸受２１，２２を備える。機械学習装置は、学習部４５と、状態変数取得部４３と、評価データ取得部４４と、更新部４７とを備える。状態変数取得部は、シャフトの位置に相関する少なくとも１つのパラメータを含む状態変数を取得する。評価データ取得部は、シャフトの位置の測定値、シャフトの位置の目標値、及び、目標値からの偏差に相関するパラメータのうちの少なくとも１つのパラメータを含む評価データを取得する。更新部は、評価データを用いて学習部の学習状態を更新する。学習部は、更新部の出力に従って、制御条件を学習する。【選択図】図８

Description

機械学習装置、及び、それを備える磁気軸受装置

従来、複数の電磁石の合成電磁力によりシャフト等の被支持体を非接触で支持する磁気軸受装置が知られている。特許文献１（実開平０４−０４０３０８号公報）には、被支持体の位置をセンサにより検出し、検出信号に基づいて電磁石の電磁力を制御して被支持体の位置を所定の位置に保持する構成が開示されている。

磁気軸受装置の製品ごとのバラツキ、及び、磁気軸受装置の経時変化等によって、被支持体の位置の制御が適切に行われなくなる課題がある。

第１観点の機械学習装置は、磁気軸受装置の制御条件を学習する。磁気軸受装置は、シャフトに電磁力を付与する複数の電磁石を有する磁気軸受を備える。機械学習装置は、学習部と、状態変数取得部と、評価データ取得部と、更新部とを備える。状態変数取得部は、シャフトの位置に相関する少なくとも１つのパラメータを含む状態変数を取得する。評価データ取得部は、シャフトの位置の測定値、シャフトの位置の目標値、及び、目標値からの偏差に相関するパラメータのうちの少なくとも１つのパラメータを含む評価データを取得する。更新部は、評価データを用いて学習部の学習状態を更新する。学習部は、更新部の出力に従って、制御条件を学習する。

第２観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、シャフトの位置に応じた信号を出力する変位センサの出力値を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも１つを制御条件として学習する。

第３観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、電磁石の電流値及び電圧値、又は、電磁石の電流値及び磁束を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも１つを制御条件として学習する。

第４観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、シャフトの位置に応じた信号を出力する変位センサの出力値を少なくとも含む。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。

第５観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、電磁石の電流値及び電圧値、又は、電磁石の電流値及び磁束を少なくとも含む。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。

第６観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、シャフトの位置の検出値、及び、シャフトの位置の指令値を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも１つを制御条件として学習する。

第７観点の機械学習装置は、第２又は第３観点の機械学習装置であって、更新部は、磁気軸受を駆動するための電流値を所定の許容値以下にするように学習部をさらに学習させる。

第８観点の機械学習装置は、第２又は第３観点の機械学習装置であって、評価データは、磁気軸受を駆動するインバータの温度に相関するパラメータをさらに含む。更新部は、インバータの温度を所定の許容値以下にするように学習部をさらに学習させる。

第９観点の機械学習装置は、第２、第３及び第６観点のいずれか１つの機械学習装置であって、状態変数は、磁気軸受が電圧型インバータによって駆動される場合には電磁石の電流検出値をさらに含み、磁気軸受が電流型インバータによって駆動される場合には電磁石の電圧検出値をさらに含む。

第１０観点の機械学習装置は、第９観点の機械学習装置であって、更新部は、電流値の制御の応答性に相関する値を小さくするために学習部をさらに学習させる。

第１１観点の機械学習装置は、第２、第３及び第６観点のいずれか１つの機械学習装置であって、状態変数は、シャフトの回転数をさらに含む。

第１２観点の機械学習装置は、第２、第３及び第６観点のいずれか１つの機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも１つのパラメータをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。

第１３観点の機械学習装置は、第１２観点の機械学習装置であって、状態変数は、シャフトに付与される電磁力に相関する少なくとも１つのパラメータをさらに含む。電磁力に相関するパラメータは、冷凍装置の冷媒負荷に相関するパラメータ、及び、冷凍装置の物理特性に相関するパラメータの少なくとも１つを含む。

第１４観点の機械学習装置は、第１２観点の機械学習装置であって、状態変数は、磁気軸受の特性に相関する少なくとも１つのパラメータをさらに含む。磁気軸受の特性に相関するパラメータは、電磁石のコイルのインダクタンスに相関するパラメータ、及び、電磁石のコイルの抵抗に相関するパラメータの少なくとも１つを含む。

第１５観点の機械学習装置は、第２又は第３観点の機械学習装置であって、評価データは、磁気軸受の消費電力に相関するパラメータをさらに含む。更新部は、消費電力を小さくするために学習部をさらに学習させる。消費電力に相関するパラメータは、磁気軸受を駆動するための電流値、磁気軸受を駆動するための電圧値、及び、電磁石のコイルの抵抗のうちの少なくとも２つを含む。

第１６観点の機械学習装置は、第７、第８及び第１５観点のいずれか１つの機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも１つのパラメータをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。

第１７観点の機械学習装置は、第２、第３及び第６観点のいずれか１つの機械学習装置であって、評価データは、電動機によって駆動される圧縮機に供給される入力エネルギーに相関する少なくとも１つのパラメータをさらに含む。更新部は、入力エネルギーを小さくするために学習部をさらに学習させる。

第１８観点の機械学習装置は、第１７観点の機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも１つのパラメータ、及び、シャフトに連結されるインペラの断熱効率に相関する少なくとも１つのパラメータの少なくとも１つをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。インペラの断熱効率に相関するパラメータは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも１つを含む。

第１９観点の機械学習装置は、第２又は第４観点の機械学習装置であって、状態変数は、変位センサの温度に相関するパラメータをさらに含む。

第２０観点の機械学習装置は、第１乃至第１９観点のいずれか１つの機械学習装置であって、更新部は、評価データに基づいて報酬を算出する。学習部は、報酬を用いて学習する。

第２１観点の機械学習装置は、第１乃至第１９観点のいずれか１つの機械学習装置であって、学習部は、更新部の出力に従って、関数のパラメータの変更を複数回行い、パラメータが変更された関数ごとに状態変数から制御条件を出力する。更新部は、蓄積部と、判定部とを備える。判定部は、評価データを判定して、判定結果を出力する。蓄積部は、判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部は、蓄積部に蓄積された教師データに基づいて学習する。

第２２観点の機械学習装置は、第１乃至第２１観点のいずれか１つの機械学習装置であって、学習部が学習した結果得られた学習済みモデルに基づいて、制御条件を出力する。

第２３観点の磁気軸受装置は、第２２観点の機械学習装置を備える。

第１実施形態に係る磁気軸受装置１０を備える空気調和装置１００の全体構成図である。圧縮機１１０の縦断面図である。ラジアル磁気軸受２１の横断面図である。ラジアル磁気軸受２１の縦断面図である。スラスト磁気軸受２２の平面図である。スラスト磁気軸受２２の縦断面図である。比較のための参考図であって、シャフト１１５の位置制御システムのブロック構成図である。第１実施形態における、シャフト１１５の位置制御システムのブロック構成図である。教師あり学習を行う制御部４０のブロック構成図である。教師あり学習を行う制御部４０のブロック構成図である。ニューラルネットワークのニューロンのモデルの模式図である。図１０に示されるニューロンを組み合わせて構成した三層のニューラルネットワークの模式図である。サポートベクターマシンを説明するための図である。２クラスの学習データが線形分離可能である特徴空間を表す。２クラスの学習データが線形分離不可能である特徴空間を表す。分割統治法によって構成された決定木の一例である。図１４の決定木によって分割される特徴空間を表す。Ｑ学習による強化学習を行う制御部４０のブロック構成図である。第３実施形態における、シャフト１１５の位置制御システムのブロック構成図である。第４実施形態における、シャフト１１５の位置制御システムのブロック構成図である。第５実施形態における、シャフト１１５の位置制御システムのブロック構成図である。変形例Ｆにおける空気調和装置１００の運転条件の一例である。

―第１実施形態―
第１実施形態に係る磁気軸受装置１０を備える空気調和装置１００について、図面を参照しながら説明する。

（１）空気調和装置１００の全体構成
図１は、空気調和装置１００の全体構成図である。空気調和装置１００は、冷媒回路１９０を備える。冷媒回路１９０は、冷媒が充填された閉回路である。冷媒回路１９０には、圧縮機１１０、凝縮器１２０、膨張弁１３０、蒸発器１４０、及び、電動機冷却制御装置１５０が設けられている。圧縮機１１０には、種々の圧縮機を採用できる。本実施形態では、圧縮機１１０は、ターボ圧縮機である。圧縮機１１０は、電動機１１４によって駆動される。電動機１１４には、電動機制御装置１６０から電力が供給される。

凝縮器１２０及び蒸発器１４０は、水冷媒熱交換器である。膨張弁１３０は、例えば、電子膨張弁である。冷媒回路１９０には、冷媒圧力を検出するセンサ、及び、冷媒温度を検出するセンサ等が設けられている。

図２は、圧縮機１１０の縦断面図である。圧縮機１１０は、主として、ケーシング１１２と、圧縮機構１１３と、電動機１１４と、シャフト１１５と、ラジアルタッチダウン軸受１１６と、スラストタッチダウン軸受１１７と、磁気軸受装置１０とを備える。

ケーシング１１２は、両端が閉塞された円筒形状を有する。ケーシング１１２は、その円筒形状の円筒軸が水平方向に平行となるように配置される。ケーシング１１２内の空間は、壁部１１２ａによって区画される。図２において、壁部１１２ａよりも右側の空間は、圧縮機構１１３を収容する圧縮機構室Ｓ１である。図２において、壁部１１２ａよりも左側の空間は、電動機１１４を収容する電動機室Ｓ２である。ケーシング１１２内の空間には、水平方向に延びるシャフト１１５が配置される。シャフト１１５は、圧縮機構１１３と電動機１１４とを連結している。

圧縮機構１１３は、流体を圧縮する。流体とは、本実施形態では、冷媒回路１９０に充填されている冷媒である。圧縮機構１１３は、主として、羽根車１１３ａと、インレットガイドベーン１１３ｂとを備える。羽根車１１３ａは、複数の羽根によって外形が略円錐形状となるように構成されている。羽根車１１３ａは、シャフト１１５の一方の端部に固定されている。インレットガイドベーン１１３ｂは、圧縮機構１１３の流体の吸入口に設けられる。インレットガイドベーン１１３ｂは、流体の吸入量を制御するための弁である。

電動機１１４は、シャフト１１５を回転駆動する。電動機１１４は、主として、固定子１１４ａと、回転子１１４ｂとを有する。固定子１１４ａは、円筒形状に形成され、ケーシング１１２内に固定されている。回転子１１４ｂは、円柱形状に形成され、固定子１１４ａの内側に回転可能に設置されている。回転子１１４ｂの中心部には、シャフト１１５が固定される軸孔が形成されている。シャフト１１５の端部には、円盤部１１５ａが固定されている。円盤部１１５ａは、羽根車１１３ａが固定されていない方の端部に固定されている。

電動機制御装置１６０は、電動機１１４に供給する電力を制御して、電動機１１４の起動、停止、及び、回転速度の制御を行う。電動機制御装置１６０は、主として、コンバータ回路、インバータ回路、及び、マイクロコンピュータを備える。これらは、制御基板１６０ａ上に実装されている。マイクロコンピュータは、インバータ回路が有するスイッチング素子のスイッチング動作を制御する。そのため、マイクロコンピュータには、電動機１１４の回転速度、及び、電動機１１４の電流値の情報等が入力される。制御基板１６０ａには、スイッチング素子の保護等の目的で温度センサが設けられている。マイクロコンピュータは、インバータ回路の制御の際に、その温度センサの検出値を利用する。

圧縮機１１０は、凝縮器１２０内の冷媒を電動機１１４の内部に流すことで電動機１１４を冷却する。電動機冷却制御装置１５０は、電動の開閉弁１５０ａと、温度センサ１５０ｂとを有する。電動機冷却制御装置１５０は、温度センサ１５０ｂの検出値に応じて、開閉弁１５０ａを制御し、凝縮器１２０から電動機１１４に流入する冷媒の流量を制御する。これにより、冷媒回路１９０では、電動機１１４の温度を所定温度範囲に維持することができる。電動機１１４は、開閉弁１５０ａを介して凝縮器１２０に配管接続されている。電動機１１４は、蒸発器１４０にも配管接続されている。電動機１１４内を流れて電動機１１４を冷却した冷媒は、蒸発器１４０に戻されている。温度センサ１５０ｂは、電動機１１４と蒸発器１４０とを連結する配管に取り付けられている。

圧縮機１１０は、ラジアルタッチダウン軸受１１６及びスラストタッチダウン軸受１１７の２種類のタッチダウン軸受を有する。ラジアルタッチダウン軸受１１６は、磁気軸受装置１０が非通電であるとき、言い換えると、シャフト１１５が磁気浮上していないときに、シャフト１１５を支持する。

（２）磁気軸受装置１０の詳細構成
磁気軸受装置１０は、被支持体であるシャフト１１５を磁気浮上させることで、シャフト１１５を非接触で回転可能に支持する。磁気軸受装置１０は、主として、１つ又は複数（本実施形態では３つ）の磁気軸受２１，２２と、１つ又は複数（本実施形態では５つ）の変位センサ３１，３２と、制御部４０とを備える。

（２−１）磁気軸受２１，２２
磁気軸受２１，２２は、被支持体を挟んで互いに対向する電磁石対を有する。磁気軸受２１，２２は、電磁石対の合成電磁力により被支持体を非接触に支持するように構成されている。磁気軸受２１，２２では、電磁石対に流れる電流を制御することにより、その電磁石対の合成電磁力を制御して、その電磁石対の対向方向における被支持体の位置を制御することができる。本実施形態では、磁気軸受装置１０は、磁気軸受２１，２２として、２つのラジアル磁気軸受２１と、１つのスラスト磁気軸受２２とを備える。

（２−１−１）ラジアル磁気軸受２１
図３は、ラジアル磁気軸受２１の横断面図である。図４は、ラジアル磁気軸受２１の縦断面図である。図３及び図４に示されるように、ラジアル磁気軸受２１は、第１〜第４電磁石５１〜５４を有し、ヘテロポーラ型のラジアル磁気軸受を構成している。第１及び第２電磁石５１，５２は、シャフト１１５を挟んで互いに対向し、第１及び第２電磁石５１，５２の電磁力Ｆ１，Ｆ２によりシャフト１１５を非接触に支持する。第３及び第４電磁石５３，５４は、シャフト１１５を挟んで互いに対向し、第３及び第４電磁石５３，５４の電磁力Ｆ３，Ｆ４によりシャフト１１５を非接触に支持する。第３及び第４電磁石５３，５４の対向方向は、平面視において、第１及び第２電磁石５１，５２の対向方向と直交している。

図３では、ラジアル磁気軸受２１は、磁気軸受コア６１と、８つのコイル６５とを備える。磁気軸受コア６１は、例えば、複数の電磁鋼板が積層されて構成され、バックヨーク６２と８つのティース６３とを有する。バックヨーク６２は、円筒状に形成されている。８つのティース６３は、バックヨーク６２の内周面に沿うように所定間隔（本実施形態では４５°間隔）で周方向に配列される。ティース６３は、バックヨーク６２の内周面から径方向内側に突出する。ティース６３の内周面（突端面）は、シャフト１１５の外周面と所定のギャップを隔てて対向する。

８つのコイル６５は、磁気軸受コア６１の８つのティース６３にそれぞれ巻回されている。これにより、８つの電磁石部７１〜７８が形成される。図３では、第１電磁石部７１、第２電磁石部７２、第７電磁石部７７、第８電磁石部７８、第３電磁石部７３、第４電磁石部７４、第５電磁石部７５及び第６電磁石部７６が、時計回り方向に順に配列されている。第１電磁石５１は、第１電磁石部７１及び第２電磁石部７２を有する。第２電磁石５２は、第３電磁石部７３及び第４電磁石部７４を有する。第３電磁石５３は、第５電磁石部７５及び第６電磁石部７６を有する。第４電磁石５４は、第７電磁石部７７及び第８電磁石部７８を有する。８つの電磁石部７１〜７８に流れる電流を制御して、第１〜第４電磁石５１〜５４の電磁力Ｆ１〜Ｆ４の合力である合成電磁力を制御することで、第１及び第２電磁石５１，５２の対向方向、及び、第３及び第４電磁石５３，５４の対向方向におけるシャフト１１５の位置を制御することができる。

コイル６５の巻回方向、及び、コイル６５に流れる電流の向きは、第１〜第４電磁石５１〜５４の各々に吸引力が発生するように設定されている。この場合、吸引力とは、シャフト１１５を引き寄せる方向に作用する電磁力である。具体的には、コイル６５の巻回方向、及び、コイル６５に流れる電流の向きは、図３に示されるループ状の矢印の方向に磁束が発生するように設定されている。

（２−１−２）スラスト磁気軸受２２
図５は、スラスト磁気軸受２２の平面図である。図６は、スラスト磁気軸受２２の縦断面図である。図５及び図６に示されるように、スラスト磁気軸受２２は、第１及び第２電磁石５１，５２を有している。第１及び第２電磁石５１，５２は、円盤部１１５ａを水平方向に挟んで互いに対向し、第１及び第２電磁石５１，５２の電磁力Ｆ１，Ｆ２により円盤部１１５ａを非接触に支持する。

具体的には、スラスト磁気軸受２２は、２つの磁気軸受コア６１と、２つのコイル６５とを備える。２つの磁気軸受コア６１は、それぞれが円環状に形成され、円盤部１１５ａの軸方向両側に所定のギャップを隔てて配置されている。磁気軸受コア６１の対向面には、円周溝が全周に亘って形成されている。２つのコイル６５は、２つの磁気軸受コア６１の円周溝にそれぞれ収容されている。これにより、第１及び第２電磁石５１，５２が構成されている。第１及び第２電磁石５１，５２に流れる電流を制御して、第１及び第２電磁石５１，５２の電磁力Ｆ１，Ｆ２の合力である合成電磁力を制御することで、第１及び第２電磁石５１，５２の対向方向（水平方向）における円盤部１１５ａの位置（シャフト１１５の位置）を制御することができる。

コイル６５の巻回方向、及び、コイル６５に流れる電流の向きは、第１及び第２電磁石５１，５２の各々に吸引力が発生するように設定されている。この場合、吸引力とは、円盤部１１５ａを引き寄せる方向に作用する電磁力である。具体的には、コイル６５の巻回方向、及び、コイル６５に流れる電流の向きは、図６に示されるループ状の矢印の方向に磁束が発生するように設定されている。

（２−２）変位センサ３１，３２
変位センサ３１，３２は、いずれも渦電流式の変位センサである。変位センサ３１，３２は、被支持体を挟んで互いに対向する電磁石対（第１及び第２電磁石５１，５２の組）に対応して設けられる。変位センサ３１，３２は、変位センサ３１，３２の基準位置に対する被支持体の変位量を検出する。変位センサ３１，３２の基準位置とは、例えば、変位センサ３１，３２のセンサヘッドの位置、又は、電磁石対の対向方向における中央位置である。電磁石対の対向方向における中央位置とは、例えば、第１電磁石５１と第２電磁石５２との間の中央位置である。本実施形態では、磁気軸受装置１０は、変位センサ３１，３２として、ラジアル変位センサ３１と、スラスト変位センサ３２とを有する。

（２−２−１）ラジアル変位センサ３１
ラジアル変位センサ３１は、各ラジアル磁気軸受２１に２つずつ設けられている。言い換えると、磁気軸受装置１０は、４つのラジアル変位センサ３１を備える。ラジアル変位センサ３１は、ラジアル変位センサ３１の基準位置に対する変位量を検出する。ラジアル変位センサ３１の基準位置とは、例えば、ラジアル変位センサ３１のセンサヘッドの位置、又は、シャフト１１５の中央位置である。各ラジアル磁気軸受２１では、一方のラジアル変位センサ３１が、ラジアル磁気軸受２１の第１電磁石５１と第２電磁石５２との対向方向（Ｘ軸方向）の変位量を検出する。Ｘ軸方向は、ラジアル磁気軸受２１の径方向である。他方のラジアル変位センサ３１は、ラジアル磁気軸受２１の第３電磁石５３と第４電磁石５４との対向方向（Ｙ軸方向）の変位量を検出する。Ｙ軸方向は、Ｘ軸方向と直交する、ラジアル磁気軸受２１の径方向である。

ラジアル変位センサ３１は、ラジアル変位センサ３１の基準位置に対する変位量を所定の時間間隔で検出する。所定の時間間隔は、例えば、４０μ秒である。

（２−２−２）スラスト変位センサ３２
磁気軸受装置１０は、１つのスラスト変位センサ３２を備える。スラスト変位センサ３２は、スラスト磁気軸受２２の第１電磁石５１と第２電磁石５２との対向方向（Ｚ軸方向）の変位量を検出する。Ｚ軸方向は、シャフト１１５の回転軸に沿った方向である。スラスト変位センサ３２は、スラスト変位センサ３２の基準位置に対する変位量を検出する。スラスト変位センサ３２の基準位置とは、例えば、スラスト変位センサ３２のセンサヘッドの位置、又は、円盤部１１５ａの中央位置である。

スラスト変位センサ３２は、スラスト変位センサ３２の基準位置に対する変位量を所定の時間間隔で検出する。所定の時間間隔は、例えば、４０μ秒である。

（２−３）制御部４０
制御部４０は、被支持体（シャフト１１５及び円盤部１１５ａ）が非接触に支持されるように、１つ又は複数の磁気軸受２１，２２を制御する。制御部４０は、各磁気軸受２１，２２の電磁力を制御することによって、被支持体の浮上制御を行う。制御部４０は、具体的には、マイクロコンピュータと、それを動作させるためのソフトウェアを格納したメモリディバイス等から構成される。制御部４０は、ラジアル制御部４１と、スラスト制御部４２とを有する。

（２−３−１）ラジアル制御部４１
ラジアル制御部４１は、２つのラジアル磁気軸受２１によるシャフト１１５の浮上制御を行う。この浮上制御では、ラジアル制御部４１は、Ｘ軸方向及びＹ軸方向のそれぞれにおけるシャフト１１５の位置制御を行う。具体的には、ラジアル制御部４１は、Ｘ軸方向及びＹ軸方向の各方向について、ラジアル変位センサ３１が検出した変位量に基づいて、シャフト１１５の位置と、予め定められた位置指令値との差分値がゼロに収束するように、ラジアル磁気軸受２１の第１〜第４電磁石５１〜５４を構成するそれぞれのコイル６５に電流（制御電流）を流す。ラジアル制御部４１は、各コイル６５に制御電流が流れるように、各コイル６５に印加される電圧（電圧指令値）を出力する。

（２−３−２）スラスト制御部４２
スラスト制御部４２は、スラスト磁気軸受２２による円盤部１１５ａの浮上制御を行う。この浮上制御では、スラスト制御部４２は、Ｚ軸方向における円盤部１１５ａの位置制御を行う。具体的には、スラスト制御部４２は、Ｚ軸方向について、スラスト変位センサ３２が検出した変位量に基づいて、円盤部１１５ａの位置と、予め定められた位置指令値との差分値がゼロに収束するように、スラスト磁気軸受２２の第１及び第２電磁石５１，５２を構成するそれぞれのコイル６５に電流（制御電流）を流す。スラスト制御部４２は、各コイル６５に制御電流が流れるように、各コイル６５に印加される電圧（電圧指令値）を出力する。

（２−４）磁気軸受装置１０の位置制御システム
磁気軸受装置１０は、シャフト１１５の位置制御システムを有する。位置制御システムでは、制御部４０は、各磁気軸受２１，２２の電磁力を制御することによって、非接触支持されているシャフト１１５の位置制御を行う。

次に、制御部４０（ラジアル制御部４１及びスラスト制御部４２）が２つのラジアル磁気軸受２１及び１つのスラスト磁気軸受２２の電磁力を制御することで、シャフト１１５の位置制御を行う手法について説明する。シャフト１１５の位置制御では、シャフト１１５をＺ軸に沿って見た場合に、Ｘ軸及びＹ軸を含むＸＹ平面におけるシャフト１１５の可動限界領域の中心に、シャフト１１５の回転軸が位置するように、シャフト１１５の位置が制御される。シャフト１１５の可動限界領域は、シャフト１１５がラジアルタッチダウン軸受１１６と接触する位置より内側の領域である。具体的には、例えば、シャフト１１５の可動限界領域は、半径２５０μｍの円形領域である。シャフト１１５の回転時において、例えば、シャフト１１５は、その回転軸から１０μｍ以下の範囲を揺れ動く。シャフト１１５の可動許容領域は、例えば、半径８３μｍの円形領域である。シャフト１１５の可動許容領域は、シャフト１１５の回転時において、シャフト１１５が、その回転軸から離れて揺れ動くことが許容される範囲である。

本実施形態では、制御部４０は、機械学習の手法を用いて、シャフト１１５の位置制御を行う。ここで、比較のために、機械学習の手法を用いない、従来の制御部の動作について説明する。図７は、比較のための参考図であって、従来の制御部９４０を含む、シャフト１１５の位置制御システムのブロック構成図である。制御部９４０は、主として、位置検出部９４１と、位置制御部９４２と、電流制御部９４３とを有する。図７には、制御対象装置５０及び外部装置６０が示されている。制御対象装置５０及び外部装置６０は、制御部９４０と情報を送受信する。制御対象装置５０は、磁気軸受装置１０が有する装置であって、具体的には、シャフト１１５、磁気軸受２１，２２及び変位センサ３１，３２である。外部装置６０は、磁気軸受装置１０以外の装置であって、空気調和装置１００が有する装置である。外部装置６０は、例えば、電動機冷却制御装置１５０である。

位置検出部９４１は、ＸＹ平面におけるシャフト１１５の位置を検出する。位置検出部９４１は、変位センサ３１，３２の出力値を受信する。変位センサ３１，３２の出力値は、シャフト１１５のＸ軸方向の位置、及び、シャフト１１５のＹ軸方向の位置を含む。位置検出部９４１は、空気調和装置１００の運転に関する情報を外部装置６０から受信する。位置検出部９４１は、変位センサ３１，３２から受信した出力値、及び、外部装置６０から受信した情報（外部情報）に基づいて、シャフト１１５の位置に関する情報である位置検出値を出力する。

位置制御部９４２は、位置検出部９４１が検出したシャフト１１５の位置に関する情報、及び、外部情報に基づいて、シャフト１１５が可動許容領域内で回転するように、予め定められた制御規則に基づいて電流指令値を出力する。電流指令値は、磁気軸受２１，２２の電磁石のコイル６５に入力される電流である。

電流制御部９４３は、位置制御部９４２が出力した電流指令値、磁気軸受２１，２２のコイル６５を流れている電流の検出値、及び、外部情報に基づいて、磁気軸受２１，２２のコイル６５に印加される電圧指令値を出力する。電圧指令値は、磁気軸受２１，２２のコイル６５に印加される電圧である。

制御部９４０は、制御対象装置５０及び外部装置６０の出力値に基づいて、シャフト１１５が可動許容領域内で回転するように、予め定められた制御規則に基づいて電圧指令値を出力する。

次に、本実施形態の制御部４０によるシャフト１１５の位置制御について説明する。図８は、本実施形態の制御部４０を含む、シャフト１１５の位置制御システムのブロック構成図である。制御部４０は、磁気軸受装置１０の制御条件を学習する機械学習装置としての機能を有する。具体的には、制御部４０は、機械学習の手法を用いて、シャフト１１５の位置制御を行う。より具体的には、制御部４０は、制御対象装置５０の出力値を用いて、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）を、教師あり学習又は強化学習の手法を用いて学習する。本実施形態では、制御対象装置５０は、シャフト１１５、磁気軸受２１，２２及び変位センサ３１，３２の少なくとも一部である。制御部４０は、位置制御条件の学習結果を用いて、新たな出力値について最適な位置制御条件を決定する。制御部４０は、主として、状態変数取得部４３と、評価データ取得部４４と、学習部４５と、決定部４６と、更新部４７とを有する。図９Ａ及び図９Ｂは、教師あり学習を行う制御部４０のブロック構成図である。

（２−４−１）状態変数取得部４３
状態変数取得部４３は、磁気軸受装置１０の動作中に磁気軸受装置１０の状態を観測して、観測された状態に関する情報を状態変数として取得する。言い換えると、状態変数取得部４３は、磁気軸受装置１０の状態が入力され、状態変数を出力する。状態変数は、シャフト１１５の位置に相関する少なくとも１つのパラメータを含む。本実施形態では、状態変数は、変位センサ３１，３２の出力値である。状態変数は、教師あり学習において教師データとして用いられる。

ここで、シャフト１１５の位置とは、シャフト１１５の回転軸（Ｚ軸）回りの角度を除く５自由度を規制する座標値の少なくとも１つである。５自由度の一の例は、シャフト１１５の重心位置のＸ軸方向、Ｙ軸方向及びＺ軸方向のそれぞれの座標値、シャフト１１５のＸ軸回りの角度、及び、シャフト１１５のＹ軸回りの角度である。５自由度の他の例は、２つのラジアル磁気軸受２１のそれぞれのＸ軸方向及びＹ軸方向の座標値、及び、２つのラジアル磁気軸受２１の重心のＺ軸方向の座標値である。具体例を挙げると、シャフト１１５の位置として、ＸＹ平面におけるシャフト１１５の重心位置が用いられてもよい。

（２−４−２）評価データ取得部４４
評価データ取得部４４は、判定データを評価して、評価データを取得する。評価データは、教師あり学習において教師データとして用いられる。評価データは、シャフト１１５の位置の測定値、シャフト１１５の位置の目標値、及び、シャフト１１５の位置の目標値からの偏差に相関するパラメータ、のうちの少なくとも１つのパラメータを含む。評価データ取得部４４は、例えば、判定データを所定の評価関数に入力して、評価関数の出力値を評価データとして取得する。言い換えると、評価データ取得部４４は、判定データが入力され、評価データを出力する。判定データは、例えば、シャフト１１５の位置制御の評価に用いることができるデータである。本実施形態では、判定データは、シャフト１１５の可動範囲の中心位置（位置指令値）、及び、シャフト１１５の位置の検出値（位置検出値）である。位置指令値は、シャフト１１５の位置の目標値である。位置検出値は、例えば、変位センサ３１，３２の出力値から得られた、シャフト１１５の位置の検出値である。

この場合、制御部４０は、位置検出値が位置指令値にできるだけ近くなるように、シャフト１１５の位置制御を行う。そのため、評価データ取得部４４は、判定データを用いて、位置指令値を基準にした場合の位置検出値の偏差（シャフト位置偏差）を評価データとして取得する。シャフト位置偏差は、ゼロに近いほど好ましい。この場合、評価関数の入力値は位置指令値及び位置検出値であり、評価関数の出力値はシャフト位置偏差である。

評価関数は、シャフト位置偏差が所定範囲内であれば一定値と見なされる関数であってもよい。所定範囲とは、ゼロの近傍の範囲であり、一定値とは、ゼロである。言い換えると、シャフト１１５の位置制御の観点からは、シャフト位置偏差はゼロ近傍に留まればよく、ゼロに収束する必要はない。

シャフト位置偏差は、例えば、位置指令値と位置検出値との間の距離の絶対値である。しかし、シャフト位置偏差は、現在から過去の所定時点までにおける当該距離の二乗平均平方根（ＲＭＳ）又は二乗平均（ＭＳ）でもよく、強制的に外乱を加えた場合の当該距離のオーバーシュート量又は整定時間でもよい。オーバーシュート量とは、位置検出値が位置指令値に近付く過程において、位置検出値が位置指令値を超えた（オーバーシュートした）場合に、位置指令値を超えた分の量である。整定時間とは、位置検出値が位置指令値に近付く過程において、位置検出値が、位置指令値の近傍の所定の許容範囲内に入り、かつ、以降はその許容範囲から出なくなる時点までの時間である。

（２−４−３）学習部４５
学習部４５は、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）を、教師あり学習又は強化学習の手法を用いて学習する。学習部４５は、更新部４７の出力に従って位置制御条件を学習する。次に、教師あり学習を用いる場合の学習部４５の動作について説明する。

学習部４５は、学習データとして、状態変数取得部４３が予め取得した状態変数と、評価データ取得部４４が予め取得した評価データとの対を用いる。本実施形態では、状態変数は、変位センサ３１，３２の出力値であり、評価データは、シャフト位置偏差である。学習部４５が学習に使用する教師データは、状態変数と評価データとの対である。

学習部４５は、更新部４７の出力に従って、状態変数から評価データへの写像である識別関数のパラメータを調整することで、位置制御条件を学習する。学習部４５による学習の目的は、新規の状態変数から正しい又は適切な評価データを得ることができるように、学習データを用いて識別関数のパラメータを調整することである。学習部４５によってパラメータが十分に調整された識別関数は、学習済みモデルに相当する。

学習部４５は、図９Ａに示されるように、教師データの一部を学習データとして用いて識別関数のパラメータを調整し、残りをテストデータとして用いてもよい。テストデータとは、学習に使用されなかったデータであり、主に、学習済みモデルの性能評価に用いられるデータである。テストデータを用いることで、新規の状態変数から得られた評価データの性能を、テストデータに対する誤り確率という形式で予測することができる。予め取得したデータを学習データとテストデータとに分ける手法としては、ホールドアウト法、交差確認法、一つ抜き法（ジャックナイフ法）及びブートストラップ法等が用いられる。

また、学習部４５による学習は、モデルが更新されるタイミングに応じて、オンライン学習とバッチ学習とに分類される。オンライン学習とは、モデルの更新に必要なデータを取得する度に、新たに取得したデータのみを用いて、従来のモデルを随時更新する手法である。バッチ学習とは、モデルの更新に必要なデータを全て揃えた後、所定のタイミングで、学習対象となるデータを全てまとめて一括で処理してモデルを生成する手法である。

（２−４−４）更新部４７
更新部４７は、評価データを用いて学習部４５の学習状態を更新する。学習部４５は、更新部４７の出力（教師データ）に従って、識別関数のパラメータの変更を複数回行い、パラメータが変更された識別関数ごとに状態変数から制御条件（位置制御条件）を出力する。

更新部４７は、蓄積部４７ａと、判定部４７ｂとを備える。判定部４７ｂは、評価データを判定して、判定結果を出力する。蓄積部４７ａは、評価データの判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部４５は、蓄積部４７ａに蓄積された教師データに基づいて制御条件を学習する。

（２−４−５）決定部４６
決定部４６は、学習部４５による学習の結果得られた学習済みモデルに基づいて、シャフト１１５の位置に相関する新規の状態変数から、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）を決定して出力する。シャフト１１５の位置に相関する状態変数は、変位センサ３１，３２の出力値である。位置制御条件は、磁気軸受装置１０を駆動するための情報である。本実施形態では、位置制御条件は、磁気軸受装置１０を駆動するための電流又は電圧であり、具体的には、磁気軸受２１，２２のコイル６５に印加される電圧（電圧指令値）である。

図９Ａ及び図９Ｂは、学習済みモデルに基づいて新規の状態変数から位置制御条件を決定する時におけるデータの流れを表す。

図９Ａでは、オンライン学習による教師あり学習が行われる。この場合、学習部４５は、磁気軸受装置１０の出荷又は設置前の試験運転時等に取得したデータ（状態変数）を用いて学習済みモデルを予め生成する。決定部４６は、磁気軸受装置１０の初回運転開始時には、学習部４５が予め生成した学習済みモデルに基づいて、位置制御条件を決定する。その後、学習部４５は、磁気軸受装置１０の運転時に新たに取得したデータ（状態変数）を用いて学習済みモデルを更新する。決定部４６は、学習部４５が更新した学習済みモデルに基づいて、位置制御条件を決定する。このように、オンライン学習では、学習済みモデルが定期的に更新され、決定部４６は、最新の学習済みモデルに基づいて、位置制御条件を決定する。

図９Ｂでは、バッチ学習による教師あり学習が行われる。この場合、学習部４５は、磁気軸受装置１０の出荷又は設置前の試験運転時等に取得したデータ（状態変数）を用いて学習済みモデルを予め生成する。決定部４６は、磁気軸受装置１０の運転時において、学習部４５が予め生成した学習済みモデルに基づいて、位置制御条件を決定する。この学習済みモデルは、学習部４５によって予め生成された後は更新されない。言い換えると、決定部４６は、同じ学習済みモデルを用いて位置制御条件を決定する。

図９Ａ及び図９Ｂに示される構成では、磁気軸受装置１０が備える制御部４０が、学習済みモデルを生成する。しかし、制御部４０とインターネット等のコンピュータネットワークを介して接続されたサーバが、学習済みモデルを生成してもよく、また、クラウドコンピューティングのサービスを利用して、学習済みモデルを生成してもよい。

（２−４−６）教師あり学習
学習部４５が用いる機械学習の手法である教師あり学習について説明する。教師あり学習は、教師データを用いて、未知の入力データに対応する出力を生成する手法である。教師あり学習では、学習データと識別関数とが用いられる。学習データとは、入力データと、それに対応する教師データとの対の集合である。入力データは、例えば、特徴空間における特徴ベクトルである。教師データは、例えば、入力データの識別、分類及び評価に関するパラメータである。識別関数は、入力データから、それに対応する出力への写像を表す。教師あり学習は、事前に与えられた学習データを用いて、識別関数の出力と教師データとの誤差が小さくなるように、識別関数のパラメータを調整する手法である。教師あり学習で用いられるモデル又はアルゴリズムとしては、回帰分析、時系列分析、決定木、サポートベクターマシン、ニューラルネットワーク、アンサンブル学習等が挙げられる。

回帰分析は、例えば、線形回帰分析、重回帰分析、ロジスティック回帰分析である。回帰分析は、最小二乗法等を用いて、入力データ（説明変数）と教師データ（目的変数）との間にモデルを当てはめる手法である。説明変数の次元は、線形回帰分析では１であり、重回帰分析では２以上である。ロジスティック回帰分析では、ロジスティック関数（シグモイド関数）がモデルとして用いられる。

時系列分析は、例えば、ＡＲモデル（自己回帰モデル）、ＭＡモデル（移動平均モデル）、ＡＲＭＡモデル（自己回帰移動平均モデル）、ＡＲＩＭＡモデル（自己回帰和分移動平均モデル）、ＳＡＲＩＭＡモデル（季節自己回帰和分移動平均モデル）、ＶＡＲモデル（ベクトル自己回帰モデル）である。ＡＲ、ＭＡ、ＡＲＭＡ、ＶＡＲモデルは、定常過程を表し、ＡＲＩＭＡ、ＳＡＲＩＭＡモデルは、非定常過程を表す。ＡＲモデルは、時間の経過に対して規則的に値が変化するモデルである。ＭＡモデルは、ある期間における変動が一定であるモデルである。例えば、ＭＡモデルでは、ある時点の値は、その時点より前の移動平均によって決まる。ＡＲＭＡモデルは、ＡＲモデルとＭＡモデルとを組み合わせたモデルである。ＡＲＩＭＡモデルは、中長期的なトレンド（増加又は減少傾向）を考慮して、前後の値の差分についてＡＲＭＡモデルを適用するモデルである。ＳＡＲＩＭＡモデルは、中長期的な季節変動を考慮して、ＡＲＩＭＡモデルを適用するモデルである。ＶＡＲモデルは、ＡＲモデルを多変量に拡張したモデルである。

決定木は、複数の識別器を組み合わせて複雑な識別境界を生成するためのモデルである。決定木の詳細については後述する。

サポートベクターマシンは、２クラスの線形識別関数を生成するアルゴリズムである。サポートベクターマシンの詳細については後述する。

ニューラルネットワークは、人間の脳神経系のニューロンをシナプスで結合して形成されたネットワークをモデル化したものである。ニューラルネットワークは、狭義には、誤差逆伝播法を用いた多層パーセプトロンを意味する。代表的なニューラルネットワークとしては、畳み込みニューラルネットワーク（ＣＮＮ）、リカレントニューラルネットワーク（ＲＮＮ）が挙げられる。ＣＮＮは、全結合していない（結合が疎である）順伝播型ニューラルネットワークの一種である。ＲＮＮは、有向閉路を持つニューラルネットワークの一種である。ＣＮＮ及びＲＮＮは、音声・画像・動画認識、及び、自然言語処理に用いられる。

アンサンブル学習は、複数のモデルを組み合わせて識別性能を向上させる手法である。アンサンブル学習が用いる手法は、例えば、バギング、ブースティング、ランダムフォレストである。バギングは、学習データのブートストラップサンプルを用いて複数のモデルを学習させ、新規の入力データの評価を、複数のモデルによる多数決によって決する手法である。ブースティングは、バギングの学習結果に応じて学習データに重み付けをして、誤って識別された学習データを、正しく識別された学習データよりも集中的に学習させる手法である。ランダムフォレストは、モデルとして決定木を用いる場合において、相関が低い複数の決定木からなる決定木群（ランダムフォレスト）を生成する手法である。ランダムフォレストの詳細については後述する。

本実施形態では、学習部４５が用いる教師あり学習の好ましいモデル又はアルゴリズムとして、次に説明する、ニューラルネットワーク、サポートベクターマシン、決定木、及び、ランダムフォレストが用いられる。

（２−４−６−１）ニューラルネットワーク
図１０は、ニューラルネットワークのニューロンのモデルの模式図である。図１１は、図１０に示されるニューロンを組み合わせて構成した三層のニューラルネットワークの模式図である。図１０に示されるように、ニューロンは、複数の入力ｘ（図１０では入力ｘ１，ｘ２，ｘ３）に対する出力ｙを出力する。各入力ｘ（図１０では入力ｘ１，ｘ２，ｘ３）には、対応する重みｗ（図１０では重みｗ１，ｗ２，ｗ３）が乗算される。ニューロンは、次の式（１）を用いて出力ｙを出力する。

式（１）において、入力ｘ、出力ｙ及び重みｗは、すべてベクトルであり、θは、バイアスであり、φは、活性化関数である。活性化関数は、非線形関数であり、例えば、ステップ関数（形式ニューロン）、単純パーセプトロン、シグモイド関数又はＲｅＬＵ（ランプ関数）である。

図１１に示される三層のニューラルネットワークでは、入力側（図１１の左側）から複数の入力ベクトルｘ（図１１では入力ベクトルｘ１，ｘ２，ｘ３）が入力され、出力側（図１１の右側）から複数の出力ベクトルｙ（図１１では出力ベクトルｙ１，ｙ２，ｙ３）が出力される。このニューラルネットワークは、３つの層Ｌ１，Ｌ２，Ｌ３から構成される。

第１の層Ｌ１では、入力ベクトルｘ１，ｘ２，ｘ３は、３つのニューロンＮ１１，Ｎ１２，Ｎ１３のそれぞれに、対応する重みが掛けられて入力される。図１１では、これらの重みは、まとめてＷ１と表記されている。ニューロンＮ１１，Ｎ１２，Ｎ１３は、それぞれ、特徴ベクトルｚ１１，ｚ１２，ｚ１３を出力する。

第２の層Ｌ２では、特徴ベクトルｚ１１，ｚ１２，ｚ１３は、２つのニューロンＮ２１，Ｎ２２のそれぞれに、対応する重みが掛けられて入力される。図１１では、これらの重みは、まとめてＷ２と表記されている。ニューロンＮ２１，Ｎ２２は、それぞれ、特徴ベクトルｚ２１，ｚ２２を出力する。

第３の層Ｌ３では、特徴ベクトルｚ２１，ｚ２２は、３つのニューロンＮ３１，Ｎ３２，Ｎ３３のそれぞれに、対応する重みが掛けられて入力される。図１１では、これらの重みは、まとめてＷ３と表記されている。ニューロンＮ３１，Ｎ３２，Ｎ３３は、それぞれ、出力ベクトルｙ１，ｙ２，ｙ３を出力する。

ニューラルネットワークの動作には、学習モードと予測モードとがある。学習モードでは、学習データセットを用いて重みＷ１，Ｗ２，Ｗ３を学習する。予測モードでは、学習した重みＷ１，Ｗ２，Ｗ３のパラメータを用いて識別等の予測を行う。

重みＷ１，Ｗ２，Ｗ３は、例えば、誤差逆伝播法（バックプロパゲーション）により学習可能である。この場合、誤差に関する情報は、出力側から入力側に向かって、言い換えると、図１１において右側から左側に向かって伝達される。誤差逆伝播法は、各ニューロンにおいて、入力ｘが入力されたときの出力ｙと、真の出力ｙ（教師データ）との差を小さくするように、重みＷ１，Ｗ２，Ｗ３を調整して学習する手法である。

ニューラルネットワークは、３層より多い層を有するように構成することができる。４層以上のニューラルネットワークによる機械学習の手法は、ディープラーニング（深層学習）として知られている。

（２−４−６−２）サポートベクターマシン
サポートベクターマシン（ＳＶＭ）とは、最大マージンを実現する２クラス線形識別関数を求めるアルゴリズムである。図１２は、ＳＶＭを説明するための図である。２クラス線形識別関数とは、図１２に示される特徴空間において、２つのクラスＣ１，Ｃ２の学習データを線形分離するための超平面である識別超平面Ｐ１，Ｐ２を表す。図１２において、クラスＣ１の学習データは円で示され、クラスＣ２の学習データは正方形で示されている。識別超平面のマージンとは、識別超平面に最も近い学習データと、識別超平面との間の距離である。図１２には、識別超平面Ｐ１のマージンｄ１、及び、識別超平面Ｐ２のマージンｄ２が示されている。ＳＶＭでは、マージンが最大となるような識別超平面である最適識別超平面Ｐ１が求められる。一方のクラスＣ１の学習データと最適識別超平面Ｐ１との間の距離の最小値ｄ１は、他方のクラスＣ２の学習データと最適識別超平面Ｐ２との間の距離の最小値ｄ１と等しい。

図１２において、２クラス問題の教師あり学習に用いられる学習データセットＤ_Ｌを以下の式（２）で表す。

学習データセットＤ_Ｌは、学習データ（特徴ベクトル）ｘ_ｉと、教師データｔ_ｉ＝｛−１，＋１｝との対の集合である。学習データセットＤ_Ｌの要素数は、Ｎである。教師データｔ_ｉは、学習データｘ_ｉがクラスＣ１，Ｃ２のどちらに属するのかを表す。クラスＣ１はｔ_ｉ＝−１のクラスであり、クラスＣ２はｔ_ｉ＝＋１のクラスである。

図１２において、全ての学習データｘ_ｉで成り立つ、正規化された線形識別関数は、以下の２つの式（３−１）及び（３−２）で表される。ｗは係数ベクトルであり、ｂはバイアスである。

これらの２つの式は、以下の１つの式（４）で表される。

識別超平面Ｐ１，Ｐ２を以下の式（５）で表す場合、そのマージンｄは、式（６）で表される。

式（６）において、ρ（ｗ）は、クラスＣ１，Ｃ２のそれぞれの学習データｘ_ｉを識別超平面Ｐ１，Ｐ２の法線ベクトルｗ上に射影した長さの差の最小値を表す。式（６）の「ｍｉｎ」及び「ｍａｘ」の項は、それぞれ、図１２において符号「ｍｉｎ」及び符号「ｍａｘ」で示された点である。図１２において、最適識別超平面は、マージンｄが最大となる識別超平面Ｐ１である。

図１２は、２クラスの学習データが線形分離可能である特徴空間を表す。図１３は、図１２と同様の特徴空間であって、２クラスの学習データが線形分離不可能である特徴空間を表す。２クラスの学習データが線形分離不可能である場合、式（４）にスラック変数ξ_ｉを導入して拡張した次の式（７）を用いることができる。

スラック変数ξ_ｉは、学習時のみに使用され、０以上の値をとる。図１３には、識別超平面Ｐ３と、マージン境界Ｂ１，Ｂ２と、マージンｄ３とが示されている。識別超平面Ｐ３の式は式（５）と同じである。マージン境界Ｂ１，Ｂ２は、識別超平面Ｐ３からの距離がマージンｄ３である超平面である。

スラック変数ξ_ｉが０の場合、式（７）は式（４）と等価である。このとき、図１３において白抜きの円又は正方形で示されるように、式（７）を満たす学習データｘ_ｉは、マージンｄ３内で正しく識別される。このとき、学習データｘ_ｉと識別超平面Ｐ３との間の距離は、マージンｄ３以上である。

スラック変数ξ_ｉが０より大きく１以下の場合、図１３においてハッチングされた円又は正方形で示されるように、式（７）を満たす学習データｘ_ｉは、マージン境界Ｂ１，Ｂ２を超えているが、識別超平面Ｐ３を超えておらず、正しく識別される。このとき、学習データｘ_ｉと識別超平面Ｐ３との間の距離は、マージンｄ３未満である。

スラック変数ξ_ｉが１より大きい場合、図１３において黒塗りの円又は正方形で示されるように、式（７）を満たす学習データｘ_ｉは、識別超平面Ｐ３を超えており、誤認識される。

このように、スラック変数ξ_ｉを導入した式（７）を用いることで、２クラスの学習データが線形分離不可能である場合においても、学習データｘ_ｉを識別することができる。

上述の説明から、全ての学習データｘ_ｉのスラック変数ξ_ｉの和は、誤認識される学習データｘ_ｉの数の上限を表す。ここで、評価関数Ｌ_ｐを次の式（８）で定義する。

学習部４５は、評価関数Ｌ_ｐの出力値を最小化する解（ｗ、ξ）を求める。式（８）において、第２項のパラメータＣは、誤認識に対するペナルティの強さを表す。パラメータＣが大きいほど、ｗのノルム（第１項）よりも誤認識数（第２項）を小さくする方を優先する解が求められる。

（２−４−６−３）決定木
決定木とは、複数の識別器を組み合わせて複雑な識別境界（非線形識別関数等）を得るためのモデルである。識別器とは、例えば、ある特徴軸の値と閾値との大小関係に関する規則である。学習データから決定木を構成する方法としては、例えば、特徴空間を２分割する規則（識別器）を求めることを繰り返す分割統治法がある。図１４は、分割統治法によって構成された決定木の一例である。図１５は、図１４の決定木によって分割される特徴空間を表す。図１５では、学習データは白丸又は黒丸で示され、図１４に示される決定木によって、各学習データは、白丸のクラス又は黒丸のクラスに分類される。図１４には、１から１１までの番号が付されたノードと、ノード間を結びＹｅｓ又はＮｏのラベルが付されたリンクとが示されている。図１４において、終端ノード（葉ノード）は、四角で示され、非終端ノード（根ノード及び内部ノード）は、丸で示されている。終端ノードは、６から１１までの番号が付されたノードであり、非終端ノードは、１から５までの番号が付されたノードである。各終端ノードには、学習データを表す白丸又は黒丸が示されている。各非終端ノードには、識別器が付されている。識別器は、特徴軸ｘ_１、ｘ_２の値と閾値ａ〜ｅとの大小関係を判断する規則である。リンクに付されたラベルは、識別器の判断結果を示す。図１５において、識別器は点線で示され、識別器によって分割された領域には、対応するノードの番号が付されている。

分割統治法によって適切な決定木を構成する過程では、以下の（ａ）〜（ｃ）の３点について検討する必要がある。
（ａ）識別器を構成するための特徴軸及び閾値の選択。
（ｂ）終端ノードの決定。例えば、１つの終端ノードに含まれる学習データが属するクラスの数。又は、決定木の剪定（根ノードが同じ部分木を得ること）をどこまで行うかの選択。
（ｃ）終端ノードに対する多数決によるクラスの割り当て。

決定木の学習方法には、例えば、ＣＡＲＴ、ＩＤ３及びＣ４．５が用いられる。ＣＡＲＴは、図１４及び図１５に示されるように、終端ノード以外の各ノードにおいて特徴空間を特徴軸ごとに２分割することで、決定木として２分木を生成する手法である。

決定木を用いる学習では、学習データの識別性能を向上させるために、非終端ノードにおいて特徴空間を最適な分割候補点で分割することが重要である。特徴空間の分割候補点を評価するパラメータとして、不純度とよばれる評価関数が用いられてもよい。ノードｔの不純度を表す関数Ｉ（ｔ）としては、例えば、以下の式（９−１）〜（９−３）で表されるパラメータが用いられる。Ｋは、クラスの数である。
（ａ）ノードｔにおける誤り率

（ｂ）交差エントロピー（逸脱度）

（ｃ）ジニ係数

上式において、確率Ｐ（Ｃ_ｉ｜ｔ）は、ノードｔにおけるクラスＣ_ｉの事後確率であり、言い換えると、ノードｔにおいてクラスＣ_ｉのデータが選ばれる確率である。式（９−３）の第２式において、確率Ｐ（Ｃ_ｊ｜ｔ）は、クラスＣ_ｉのデータがｊ（≠ｉ）番目のクラスに間違われる確率であるので、第２式は、ノードｔにおける誤り率を表す。式（９−３）の第３式は、全てのクラスに関する確率Ｐ（Ｃ_ｉ｜ｔ）の分散の和を表す。

不純度を評価関数としてノードを分割する場合、例えば、当該ノードにおける誤り率、及び、決定木の複雑さで決まる許容範囲まで、決定木を剪定する手法が用いられる。

（２−４−６−４）ランダムフォレスト
ランダムフォレストは、アンサンブル学習の一種であって、複数の決定木を組み合わせて識別性能を強化する手法である。ランダムフォレストを用いる学習では、相関が低い複数の決定木からなる群（ランダムフォレスト）が生成される。ランダムフォレストの生成及び識別には、以下のアルゴリズムが用いられる。
（１）ｍ＝１からＭまで以下を繰り返す。
（ａ）Ｎ個のｄ次元学習データから、ｍ個のブートストラップサンプルＺ_ｍを生成する。
（ｂ）Ｚ_ｍを学習データとして、以下の手順で各ノードｔを分割して、ｍ個の決定木を生成する。
（ｉ）ｄ個の特徴からｄ´個の特徴をランダムに選択する。（ｄ´＜ｄ）
（ｉｉ）選択されたｄ´個の特徴の中から、学習データの最適な分割を与える特徴と分割点（閾値）を求める。
（ｉｉｉ）求めた分割点でノードｔを２分割する。
（２）ｍ個の決定木からなるランダムフォレストを出力する。
（３）入力データに対して、ランダムフォレストの各決定木の識別結果を得る。ランダムフォレストの識別結果は、各決定木の識別結果の多数決によって決定される。
ランダムフォレストを用いる学習では、決定木の各非終端ノードにおいて識別に用いる特徴をあらかじめ決められた数だけランダムに選択することで、決定木間の相関を低くすることができる。

（２−４−７）強化学習
学習部４５が用いる機械学習の手法である強化学習について説明する。強化学習は、一連の行動の結果としての報酬が最大となるような方策を学習する手法である。強化学習で用いられるモデル又はアルゴリズムは、Ｑ学習（Ｑ−ｌｅａｒｎｉｎｇ）等がある。Ｑ学習は、状態ｓの下で行動ａを選択する価値を表すＱ値を学習する手法である。Ｑ学習では、Ｑ値が最も高い行動ａが最適な行動として選択される。高いＱ値を求めるため、行動ａの主体（エージェント）には、状態ｓの下で選択した行動ａに対して報酬が与えられる。Ｑ学習では、エージェントが行動するたびに、以下の式（１０）を用いて、Ｑ値が更新される。

式（１０）において、Ｑ（ｓ_t，ａ_t）は、状態ｓ_tのエージェントが行動ａ_tを選択する価値を表すＱ値である。Ｑ（ｓ_t，ａ_t）は、状態ｓと行動ａとをパラメータとする関数（行動価値関数）である。ｓ_tは、時刻ｔにおけるエージェントの状態である。ａ_tは、時刻ｔにおけるエージェントの行動である。αは、学習係数である。αは、式（１０）によってＱ値が最適な値に収束するように設定される。ｒ_t+1は、エージェントが状態ｓ_t+1に遷移したときに得る報酬である。γは、割引率である。γは、０以上１以下の定数である。ｍａｘを含む項は、環境ｓ_t+1の下で、最もＱ値が高い行動ａを選択した場合のＱ値にγを掛けたものである。行動価値関数によって求められるＱ値は、エージェントが得る報酬の期待値である。

図１６は、Ｑ学習による強化学習を行う制御部４０のブロック構成図である。制御部４０は、主として、状態変数取得部１４３と、学習部１４５と、決定部１４６とを有する。状態変数取得部１４３及び決定部１４６は、それぞれ、図９Ａ及び図９Ｂに示される状態変数取得部４３及び決定部４６と同じ機能を有する。学習部１４５は、報酬条件設定部１４５ａと、報酬計算部１４５ｂと、関数更新部１４５ｃとを有する。報酬条件設定部１４５ａは、報酬条件を設定する。報酬計算部１４５ｂは、状態変数取得部１４３が取得した状態変数、及び、報酬条件設定部１４５ａが設定した報酬条件に基づいて、報酬を計算する。関数更新部１４５ｃは、報酬計算部１４５ｂが計算した報酬に基づいて、行動価値関数を更新する。行動価値関数は、状態変数取得部１４３が取得した状態変数の下で所定の行動を選択する価値であるＱ値を求める関数である。関数更新部１４５ｃは、例えば、式（１０）を用いて、行動価値関数を更新する。関数更新部１４５ｃは、最適化された行動価値関数を学習済みモデルとして出力する。このように、学習部１４５は、状態変数に基づいて、行動価値関数のパラメータを調整して行動価値関数を更新することで、報酬が最大となる方策を学習して、学習済みモデルを生成する。学習部１４５は、報酬を用いて、オンライン学習による強化学習を行う。

（２−４−８）機械学習のその他の手法
学習部４５は、種種の機械学習の手法を用い得る。学習部４５が用い得る機械学習の手法は、既に説明した教師あり学習及び強化学習の他に、教師なし学習、半教師あり学習、トランスダクティブ学習、マルチタスク学習及び転移学習等がある。学習部４５は、これらの手法を組み合わせて用いてもよい。

教師なし学習は、教師データを用いずに、所定の統計的性質に基づいて入力データをグループ分け（クラスタリング）する手法である。教師なし学習で用いられるモデル又はアルゴリズムとしては、ｋ平均法（ｋ−ｍｅａｎｓ法）、ウォード法（Ｗａｒｄ法）、主成分分析等がある。ｋ平均法は、各入力データにランダムにクラスタを割り当て、各クラスタの中心を計算し、各入力データを最も近い中心のクラスタに割り当て直す工程を繰り返す手法である。ウォード法は、クラスタの各入力データからクラスタの質量中心までの距離を最小化するように、各入力データをクラスタに割り当て直す工程を繰り返す手法である。主成分分析は、相関のある複数の変数から、相関の最も小さい主成分と呼ばれる変数を生成する多変量解析の手法である。

半教師あり学習は、対応する教師データが付かない入力データ（ラベルなしデータ）と、対応する教師データ付きの入力データ（ラベルありデータ）との両方を用いて学習する手法である。

トランスダクティブ学習は、半教師あり学習において、学習に用いられるラベルなしデータに対応する出力を生成し、未知の入力データに対応する出力を生成しない手法である。

マルチタスク学習は、複数の関連するタスク同士の情報を共有して、これらのタスクを同時に学習させることで、タスクに共通の要因を獲得してタスクの予測精度を上げる手法である。

転移学習は、あるドメインで予め学習させたモデルを、別のドメインに適応することで予測精度を上げる手法である。

（２−４−９）学習で使用されるデータ
本実施形態において、制御部４０が機械学習の手法を用いて学習済みモデルを生成するために使用するデータについて説明する。

制御部４０が教師あり学習の手法を用いる場合、制御部４０は、状態変数、評価データ及び制御条件の各データを使用する。

状態変数は、シャフト１１５の位置に相関する少なくとも１つのパラメータを含む。本実施形態では、状態変数取得部４３は、状態変数として、変位センサ３１，３２の出力値を取得する。

評価データは、シャフト１１５の位置の目標値からの偏差に相関する少なくとも１つのパラメータを含む。本実施形態では、評価データ取得部４４は、評価データとして、シャフト１１５の位置の検出値と、シャフト１１５の位置の目標値との差であるシャフト位置偏差を取得する。検出値とは、変位センサ３１，３２の出力値から換算された値である。目標値とは、シャフト１１５の可動範囲の中心位置である。

制御条件は、学習部４５によって学習され、シャフト１１５の位置制御を適切に行うための条件である。本実施形態では、学習部４５は、シャフト位置偏差を小さくするための制御条件を学習する。決定部４６は、制御条件として、磁気軸受２１，２２の電磁石のコイル６５に印加する電圧（電圧指令値）、及び、コイル６５を流れる電流（電流指令値）の少なくとも１つを決定する。

また、制御部４０が、強化学習の手法を用いる場合、制御部４０は、状態変数及び報酬条件を使用する。状態変数は、制御部４０が教師あり学習の手法を用いる場合に使用される状態変数と同じである。制御部４０は、所定の報酬条件に基づいて、シャフト位置偏差から報酬を計算する。本実施形態では、シャフト位置偏差が小さい場合には、報酬が増え、シャフト位置偏差が大きい場合には、報酬が減るか又は変化しないように、報酬条件が設定される。報酬条件は、例えば、評価データに基づいて報酬を算出するための条件である。

（３）効果
本実施形態の空気調和装置１００が備える磁気軸受装置１０は、磁気軸受のコイルに印加される電圧（電圧指令値）等を調整して、磁気浮上しているシャフト１１５の位置制御システムを備える。従来の位置制御システムは、予め定められた制御規則に基づいて、電圧指令値等を調整する。この場合、装置の品質のバラツキ、及び、システムの経時変化等によって適切な電圧指令値が得られず、シャフトの浮上制御の安定性が低下したり、浮上中に大きな外乱力が発生した場合にシャフトがタッチダウン軸受に接触したりするおそれがある。

本実施形態の磁気軸受装置１０では、学習機能を有する制御部４０が、シャフト１１５の位置に相関する状態変数と、シャフト１１５の位置に関する評価データとに基づいて、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）を、教師あり学習の手法を用いて学習する。変位センサ３１，３２は、比較的短い時間間隔（例えば４０μ秒ごと）でシャフト１１５の位置を検出するので、制御部４０は、シャフト１１５の位置制御を、比較的短い時間間隔で行うことができる。そのため、制御部４０は、シャフト１１５の位置制御の安定性を長期間にわたって維持することができる。これにより、磁気軸受装置１０の品質のバラツキ、及び、システムの経時変化等による、シャフト１１５の浮上制御の安定性の低下、及び、外乱力によるシャフト１１５とタッチダウン軸受１１６，１１７との接触の発生を抑制することができる。

―第２実施形態―
第１実施形態では、状態変数取得部４３は、状態変数として、変位センサ３１，３２の出力値を取得する。変位センサ３１，３２の出力値は、シャフト１１５の位置に相関するパラメータである。

本実施形態では、状態変数取得部４３は、状態変数として、変位センサ３１，３２の出力値以外のパラメータであって、シャフト１１５の位置に相関するパラメータを取得する。そのため、本実施形態は、変位センサ３１，３２を有さないセンサレスタイプの磁気軸受装置に適用することができる。

具体的には、状態変数取得部４３は、状態変数として、シャフト１１５の位置の推定に必要な種種の情報を取得する。シャフト１１５の位置の推定に必要な情報は、磁気軸受２１，２２の電磁石の電流検出値、電圧検出値、磁束検出値、電流指令値及び電圧指令値の少なくとも２つを含む。電流検出値は、電磁石のコイル６５に流れている電流の検出値である。電圧検出値は、電磁石のコイル６５に印加されている電圧の検出値である。磁束検出値は、電磁石のコイル６５から発生する磁界の検出値である。磁束検出値は、例えば、非接触型の磁気センサであるホールセンサの出力値である。電流指令値は、制御部４０によって制御され、電磁石のコイル６５に入力される電流値である。電圧指令値は、制御部４０によって制御され、電磁石のコイル６５に入力される電圧値である。

シャフト１１５の位置の推定に必要な情報として、例えば、次の（ａ）〜（ｃ）の情報が挙げられる。
（ａ）電圧指令値と電流検出値
（ｂ）電流指令値と電圧検出値
（ｃ）電流検出値と磁束検出値

情報（ａ）を用いる場合、状態変数取得部４３は、電圧指令値を入力し、電流検出値を取得することで、シャフト１１５の位置を推定する。

情報（ｂ）を用いる場合、状態変数取得部４３は、電流指令値を入力し、電圧検出値を取得することで、シャフト１１５の位置を推定する。

情報（ａ）及び（ｂ）を用いる場合、状態変数取得部４３は、コイル６５の電流（又は電流微分値）及び電圧がシャフト１１５の位置に相関する性質を利用することで、シャフト１１５の位置を推定する。電流又は電圧は、正弦波状に入力されてもよく、ステップ状に入力されてもよい。

情報（ｃ）を用いる場合、状態変数取得部４３は、電流検出値及び磁束検出値がシャフト１１５の位置に相関する性質を利用することで、シャフト１１５の位置を推定する。

評価データ取得部４４は、評価データとして、状態変数から換算したシャフト１１５の位置の推定値と、シャフト１１５の位置の目標値との差であるシャフト位置偏差を取得する。

学習部４５は、シャフト位置偏差を小さくするための制御条件を学習する。

決定部４６は、制御条件として、磁気軸受２１，２２の電磁石のコイル６５に印加する電圧（電圧指令値）、及び、コイル６５を流れる電流（電流指令値）の少なくとも１つを決定する。

―第３実施形態―
第１及び第２実施形態では、図７に示される従来の制御部９４０の代わりに、学習機能を有する制御部４０が用いられている。言い換えると、第１及び第２実施形態は、図７に示される位置検出部９４１、位置制御部９４２及び電流制御部９４３の全ての機能が学習機能を有する構成に関する。

しかし、図７に示される位置検出部９４１、位置制御部９４２及び電流制御部９４３のうちの一部の機能のみが学習機能を有してもよい。以下に説明する第３〜第５実施形態は、従来の制御部９４０の位置検出部９４１、位置制御部９４２及び電流制御部９４３のうちの１つの機能のみが学習機能を有する構成に関する。

本実施形態は、従来の制御部９４０の位置検出部９４１のみが学習機能を有する構成に関する。図１７は、本実施形態における、シャフト１１５の位置制御システムのブロック構成図である。図１７に示されるように、図７の位置検出部９４１に相当するブロックが、学習機能を有する学習制御部３４０に置き換えられている。学習制御部３４０は、第１及び第２実施形態の制御部４０と同じ機能を有する。言い換えると、学習制御部３４０は、図９Ａ及び図９Ｂに示されるように、状態変数取得部４３と、評価データ取得部４４と、学習部４５と、決定部４６とを有する。以下、第１及び第２実施形態の制御部４０との相違点を中心に説明する。

第１及び第２実施形態では、評価データ取得部４４は、判定データとして、シャフト１１５の位置の目標値（位置指令値）、及び、シャフト１１５の位置の検出値（位置検出値）を用いる。

本実施形態では、評価データ取得部４４は、判定データとして、位置指令値及び位置検出値の代わりに、シャフト１１５の位置に相関するパラメータ（相関パラメータ）の目標値、及び、相関パラメータの検出値を用いる。相関パラメータとしては、第１及び第２実施形態において状態変数取得部４３が取得した状態変数が用いられる。例えば、評価データ取得部４４は、相関パラメータとして、第１実施形態で説明した変位センサ３１，３２の出力値を用いてもよく、第２実施形態で説明したシャフト１１５の位置の推定に必要な情報を用いてもよい。

評価データ取得部４４は、判定データを用いて、例えば、相関パラメータの目標値を基準にした場合の相関パラメータの検出値の偏差（相関パラメータ偏差）を評価データとして取得する。

学習部４５は、相関パラメータ偏差を小さくするための制御条件を学習する。

決定部４６は、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）として、位置検出値を決定する。

本実施形態では、学習部４５は、特定の時点において位置制御条件を学習してもよい。特定の時点とは、相関パラメータに基づいて、シャフト１１５の位置を特定又は推定することができる時点である。具体的には、特定の時点とは、シャフト１１５の位置に一定の制約がある時点、又は、シャフト１１５に加わる力が既知である時点である。シャフト１１５の位置に一定の制約がある時点とは、例えば、シャフト１１５がタッチダウン軸受１１６，１１７に接触している時点である。シャフト１１５に加わる力が既知である時点とは、例えば、シャフト１１５が自由落下している時点である。

本実施形態では、評価データ取得部４４は、評価データとして、相関パラメータ偏差の代わりに、シャフト１１５の位置の真値を取得してもよい。シャフト１１５の位置の真値として、判定データに含まれる位置検出値が用いられてもよい。なお、上述の「特定の時点」において特定又は推定されたシャフト１１５の位置が、シャフト１１５の位置の真値として用いられてもよい。

―第４実施形態―
本実施形態は、従来の制御部９４０の位置制御部９４２のみが学習機能を有する構成に関する。図１８は、本実施形態における、シャフト１１５の位置制御システムのブロック構成図である。図１８に示されるように、図７の位置制御部９４２に相当するブロックが、学習機能を有する学習制御部４４０に置き換えられている。学習制御部４４０は、第１及び第２実施形態の制御部４０と同じ機能を有する。言い換えると、学習制御部４４０は、図９Ａ及び図９Ｂに示されるように、状態変数取得部４３と、評価データ取得部４４と、学習部４５と、決定部４６とを有する。以下、第１及び第２実施形態の制御部４０との相違点を中心に説明する。

本実施形態では、状態変数取得部４３は、状態変数として、シャフト１１５の位置の目標値（位置指令値）、及び、シャフト１１５の位置の検出値（位置検出値）を用いる。

評価データ取得部４４は、判定データとして、位置指令値及び位置検出値を用いる。評価データ取得部４４は、評価データとして、位置指令値と位置検出値との差であるシャフト位置偏差を取得する。

決定部４６は、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）として、磁気軸受２１，２２の電磁石のコイル６５に印加する電圧（電圧指令値）、及び、コイル６５を流れる電流（電流指令値）の少なくとも１つを決定する。

―第５実施形態―
本実施形態は、従来の制御部９４０の電流制御部９４３のみが学習機能を有する構成に関する。図１９は、本実施形態における、シャフト１１５の位置制御システムのブロック構成図である。図１９に示されるように、図７の電流制御部９４３に相当するブロックが、学習機能を有する学習制御部５４０に置き換えられている。学習制御部５４０は、第１及び第２実施形態の制御部４０と同じ機能を有する。言い換えると、学習制御部５４０は、図９Ａ及び図９Ｂに示されるように、状態変数取得部４３と、評価データ取得部４４と、学習部４５と、決定部４６とを有する。以下、第１及び第２実施形態の制御部４０との相違点を中心に説明する。

本実施形態では、状態変数取得部４３は、状態変数として、磁気軸受２１，２２の電磁石のコイル６５を流れる電流（電流指令値）、及び、シャフト１１５の位置の検出値（位置検出値）を取得する。

評価データ取得部４４は、判定データとして、電流指令値及び位置検出値を用いる。評価データ取得部４４は、評価データとして、電流制御の応答性に関する量（応答レベル）を取得する。応答レベルは、ゼロに近いほど好ましいパラメータである。応答レベルは、例えば、電流指令値を基準にした場合の電流検出値の偏差の絶対値、二乗平均平方根（ＲＭＳ）又は二乗平均（ＭＳ）であってもよく、強制的に外乱を加えた場合の当該偏差のオーバーシュート量又は整定時間であってもよい。

学習部４５は、応答レベルを小さくするための制御条件を学習する。

決定部４６は、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）として、磁気軸受２１，２２の電磁石のコイル６５に印加する電圧（電圧指令値）を決定する。

―変形例―
以下、第１〜第５実施形態の少なくとも一部の変形例について説明する。

（１）変形例Ａ
本変形例は、第１、第２及び第５実施形態において、評価データ取得部４４は、判定データとして、磁気軸受２１，２２を駆動するための電流値に相関するパラメータをさらに用いる。評価データ取得部４４は、評価データとして、磁気軸受２１，２２を駆動するための電流値をさらに取得する。更新部４７は、磁気軸受２１，２２を駆動するための電流値を所定値以下にするように学習部４５を学習させる。所定値とは、具体的には、磁気軸受２１，２２を駆動するためのインバータの許容電流値である。本変形例は、インバータの仕様が決まっている場合において、インバータの故障の発生を抑制することができる。

（２）変形例Ｂ
本変形例は、第１、第２及び第５実施形態において、評価データ取得部４４は、判定データとして、磁気軸受２１，２２を駆動するためのインバータの温度に相関するパラメータをさらに用いる。評価データ取得部４４は、評価データとして、磁気軸受２１，２２を駆動するためのインバータの温度をさらに取得する。更新部４７は、インバータの温度を所定値以下にするように学習部４５を学習させる。所定値とは、具体的には、インバータの許容温度である。本変形例は、インバータの仕様が決まっている場合において、インバータの故障の発生を抑制することができる。

（３）変形例Ｃ
本変形例は、第１、第２、第４及び第５実施形態において、状態変数取得部４３は、状態変数として、磁気軸受２１，２２が電圧型インバータによって駆動される場合において磁気軸受２１，２２の電磁石の電流検出値をさらに取得し、磁気軸受２１，２２が電流型インバータによって駆動される場合において磁気軸受２１，２２の電磁石の電圧検出値をさらに取得する。

（４）変形例Ｄ
本変形例は、変形例Ｃにおいて、評価データ取得部４４は、判定データとして、電流指令値及び位置検出値をさらに用いる。評価データ取得部４４は、評価データとして、電流制御の応答性に関する量（応答レベル）をさらに取得する。応答レベルは、ゼロに近いほど好ましいパラメータである。応答レベルは、例えば、電流指令値を基準にした場合の電流検出値の偏差の絶対値、二乗平均平方根（ＲＭＳ）又は二乗平均（ＭＳ）であってもよく、強制的に外乱を加えた場合の当該偏差のオーバーシュート量又は整定時間であってもよい。更新部４７は、応答レベルを小さくするように学習部４５を学習させる。

（５）変形例Ｅ
本変形例は、第１、第２、第４及び第５実施形態において、状態変数取得部４３は、状態変数として、シャフト１１５の回転数をさらに取得する。

（６）変形例Ｆ
本変形例は、第１、第２、第４及び第５実施形態において、状態変数取得部４３は、状態変数として、空気調和装置１００の運転条件に相関する少なくとも１つのパラメータをさらに取得する。

空気調和装置１００の運転条件とは、空気調和装置１００の冷凍能力、及び、凝縮器１２０の入口水温度の所定の範囲である。入口水温度とは、空気調和装置１００の冷媒回路１９０を循環する冷媒と熱交換される媒体である水の温度であって、凝縮器１２０に流入する時の水の温度である。図２０は、空気調和装置１００の運転条件の一例である。空気調和装置１００の冷凍能力の単位は、冷凍トンである。凝縮器１２０の入口水温度の単位は、華氏度である。図２０においてハッチングされた領域が、空気調和装置１００の運転条件であり、空気調和装置１００による空気調和が実現可能な範囲である。

空気調和装置１００の運転条件に相関するパラメータは、具体的には、以下に列挙する空気調和装置１００の運転情報に関するデータである。
（ａ）圧縮機１１０に吸入される冷媒の温度
（ｂ）圧縮機１１０から吐出される冷媒の温度
（ｃ）圧縮機１１０に吸入される冷媒の圧力
（ｄ）圧縮機１１０から吐出される冷媒の圧力
（ｅ）冷媒回路１９０を循環する冷媒の流量
（ｆ）凝縮器１２０に流入する水の温度
（ｇ）凝縮器１２０から流出する水の温度
（ｈ）蒸発器１４０に流入する水の温度
（ｉ）蒸発器１４０から流出する水の温度
（ｊ）インレットガイドベーン１１３ｂの開度
（ｋ）電動機１１４の回転数
（ｌ）電動機１１４の回転角度
（ｍ）電動機１１４のトルク
（ｎ）電動機１１４の電流値

パラメータ（ｆ）〜（ｉ）の「水」は、凝縮器１２０又は蒸発器１４０において冷媒と熱交換される媒体である水を意味する。空気調和装置１００の運転条件に相関するパラメータは、上記のパラメータ（ａ）〜（ｎ）の少なくとも１つを含む。空気調和装置１００の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

本変形例では、制御部４０は、空気調和装置１００の運転条件ごとに最適な制御条件を学習することができる。

（７）変形例Ｇ
本変形例は、変形例Ｆにおいて、状態変数取得部４３は、状態変数として、シャフト１１５に付与される電磁力に相関する少なくとも１つのパラメータをさらに取得する。

シャフト１１５に付与される電磁力に相関するパラメータは、空気調和装置１００の冷媒負荷に相関するパラメータ、及び、空気調和装置１００の物理特性に相関するパラメータの少なくとも１つを含む。

空気調和装置１００の冷媒負荷に相関するパラメータとは、変形例Ｆにおいて列挙されたパラメータ（ａ）〜（ｎ）の少なくとも１つを含む。空気調和装置１００の冷媒負荷に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

空気調和装置１００の物理特性に相関するパラメータとは、シャフト１１５の重量、及び、シャフト１１５に作用する力の少なくとも１つである。シャフト１１５に作用する力とは、シャフト１１５に作用するコリオリ力、及び、シャフト１１５に作用する遠心力の少なくとも１つである。シャフト１１５に作用する力の代わりに、シャフト１１５の偏心の量に相関するパラメータ、及び、電動機１１４の回転数の少なくとも１つが用いられてもよい。

本変形例では、空気調和装置１００の運転中におけるシャフト１１５の回転軸の移動を抑制することができる。

（８）変形例Ｈ
本変形例は、変形例Ｆにおいて、状態変数取得部４３は、状態変数として、磁気軸受２１，２２の特性に相関する少なくとも１つのパラメータをさらに取得する。

磁気軸受２１，２２の特性に相関するパラメータとは、磁気軸受２１，２２の電磁石のコイル６５のインダクタンスに相関するパラメータ、及び、コイル６５の抵抗に相関するパラメータの少なくとも１つを含む。コイル６５のインダクタンスに相関するパラメータとは、例えば、コイル６５を流れる電流の検出値である。コイル６５の抵抗に相関するパラメータとは、コイル６５の温度、又は、コイル６５の周囲の温度に相関するパラメータであり、具体的には、変形例Ｆにおいて列挙されたパラメータ（ａ）〜（ｉ）の少なくとも１つを含む。コイル６５の抵抗に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

（９）変形例Ｉ
本変形例は、第１、第２及び第５実施形態において、評価データ取得部４４は、判定データとして、磁気軸受２１，２２の消費電力に相関するパラメータをさらに用いる。

磁気軸受２１，２２の消費電力に相関するパラメータとは、磁気軸受２１，２２を駆動するための電流値に相関するパラメータ、磁気軸受２１，２２を駆動するための電圧値に相関するパラメータ、及び、磁気軸受２１，２２の電磁石のコイル６５の抵抗に相関するパラメータのうちの少なくとも２つを含む。磁気軸受２１，２２を駆動するための電流値に相関するパラメータとは、例えば、コイル６５を流れる電流の検出値である。コイル６５の抵抗に相関するパラメータとは、コイル６５の温度、又は、コイル６５の周囲の温度に相関するパラメータであり、具体的には、変形例Ｆにおいて列挙されたパラメータ（ａ）〜（ｉ）の少なくとも１つを含む。コイル６５の抵抗に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

評価データ取得部４４は、評価データとして、磁気軸受２１，２２の消費電力をさらに取得する。

更新部４７は、磁気軸受２１，２２の消費電力を小さくするように学習部４５を学習させる。

本変形例では、制御部４０は、空気調和装置１００の消費電力を抑制することができる制御条件を学習することができる。

（１０）変形例Ｊ
本変形例は、変形例Ａ，Ｂ，Ｉにおいて、状態変数取得部４３は、状態変数として、空気調和装置１００の運転条件に相関する少なくとも１つのパラメータをさらに取得する。空気調和装置１００の運転条件に相関するパラメータは、変形例Ｆにおいて列挙されたパラメータ（ａ）〜（ｎ）の少なくとも１つを含む。空気調和装置１００の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

（１１）変形例Ｋ
本変形例は、第１、第２、第４及び第５実施形態において、評価データ取得部４４は、判定データとして、電動機１１４によって駆動される圧縮機１１０に供給される入力エネルギーに相関する少なくとも１つのパラメータをさらに用いる。入力エネルギーに相関するパラメータとは、磁気軸受２１，２２の入力電流、磁気軸受２１，２２の入力電力、磁気軸受２１，２２を駆動するためのインバータの入力電流、磁気軸受２１，２２を駆動するためのインバータの入力電力、電動機１１４の入力電流、電動機１１４の入力電力、電動機１１４を駆動するためのインバータの入力電流、及び、電動機１１４を駆動するためのインバータの入力電力の少なくとも１つを含む。評価データ取得部４４は、評価データとして、圧縮機１１０に供給される入力エネルギーをさらに取得する。

更新部４７は、圧縮機１１０に供給される入力エネルギーを小さくように学習部４５を学習させる。

本変形例では、制御部４０は、圧縮機１１０に供給される入力エネルギーが最小となる制御条件を学習することができる。

（１２）変形例Ｌ
本変形例は、変形例Ｊにおいて、状態変数取得部４３は、状態変数として、空気調和装置１００の運転条件に相関する少なくとも１つのパラメータ、及び、シャフト１１５に連結される羽根車１１３ａの断熱効率に相関する少なくとも１つのパラメータの少なくとも１つをさらに取得する。

空気調和装置１００の運転条件に相関するパラメータは、変形例Ｆにおいて列挙されたパラメータ（ａ）〜（ｎ）の少なくとも１つを含む。空気調和装置１００の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

羽根車１１３ａの断熱効率に相関するパラメータとは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも１つを含む。冷媒の圧力に相関するパラメータは、変形例Ｆにおいて列挙されたパラメータ（ａ）〜（ｅ）の少なくとも１つを含む。冷媒の圧力に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。冷媒の温度に相関するパラメータは、変形例Ｆにおいて列挙されたパラメータ（ａ）〜（ｉ）の少なくとも１つを含む。冷媒の温度に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

本変形例では、制御部４０は、羽根車１１３ａの断熱効率が最大となる制御条件を学習することができる。

（１３）変形例Ｍ
本変形例では、状態変数取得部４３は、状態変数として、変位センサ３１，３２の出力値を取得する場合に、変位センサ３１，３２の温度に相関するパラメータをさらに取得する。変位センサ３１，３２の温度に相関するパラメータは、変形例Ｆにおいて列挙されたパラメータ（ａ）〜（ｉ）の少なくとも１つを含む。冷媒の温度に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

本変形例では、制御部４０は、温度特性を有する変位センサ３１，３２の温度に関する情報を状態変数として用いることで、温度による変位センサ３１，３２の検出値のズレを補償することができる。そのため、制御部４０は、タッチダウン軸受１１６，１１７の位置の推定値を高い精度で取得して、タッチダウン軸受１１６，１１７の中心にシャフト１１５の回転軸が近付くように、シャフト１１５の位置合わせを行うことができる。

（１４）変形例Ｎ
本変形例では、第１、第２、第４及び第５実施形態において、磁気軸受装置１０の運転開始時等に、変位センサ３１，３２のキャリブレーションが行われる。キャリブレーションによって、例えば、変位センサ３１，３２の異常を検出することができる。

変位センサ３１，３２のキャリブレーションは、例えば、シャフト１１５の位置、磁気軸受２１，２２の電磁石のコイル６５の電流値、及び、コイル６５の電圧値等のパラメータを強制的に変化させて行われる。この場合、これらのパラメータに周期波形を重畳させてもよく、これらのパラメータをステップ状に変化させてもよく、これらのパラメータをランプ状に変化させてもよい。周期波形は、例えば、正弦波、矩形波、三角波及び鋸波である。周期波形の周波数は、断続的に変化させてもよく、連続的に変化させてもよい。

また、変位センサ３１，３２のキャリブレーションは、シャフト１１５の位置指令値と、所定の波形による摂動とを重畳させて行われてもよい。所定の波形とは、例えば、周期波形、パルス波形及びステップ波形である。周期波形は、例えば、正弦波、矩形波、三角波及び鋸波である。

また、変位センサ３１，３２のキャリブレーションは、シャフト１１５の位置に一定の制約を設けることで行われてもよい。例えば、シャフト１１５をタッチダウン軸受１１６，１１７に接触させる動作、及び、シャフト１１５に作用する力が既知である動作が行われてもよい。シャフト１１５に作用する力が既知である動作とは、例えば、シャフト１１５が自由落下しているときの動作である。

（１５）変形例Ｏ
上記の各実施形態及び各変形例では、制御部４０は、教師あり学習又は強化学習の手法を用いて、シャフト１１５の位置制御を適切に行うための条件を学習する。しかし、制御部４０は、教師あり学習と強化学習とを組み合わせた手法を用いて、シャフト１１５の位置制御を適切に行うための条件を学習してもよい。

（１６）変形例Ｐ
上記の各実施形態及び各変形例では、ラジアル磁気軸受２１は、ベアリングレスモータ（シャフトを非接触で支持する機能を有する電動機）の支持機構を用いてもよい。

―むすび―
以上、本開示の実施形態を説明したが、特許請求の範囲に記載された本開示の趣旨及び範囲から逸脱することなく、形態や詳細の多様な変更が可能なことが理解されるであろう。

磁気軸受装置は、被支持体の位置の制御を適切に行うことができる。

１０磁気軸受装置
２１ラジアル磁気軸受（磁気軸受）
２２スラスト磁気軸受（磁気軸受）
３１ラジアル変位センサ（変位センサ）
３２スラスト変位センサ（変位センサ）
４３状態変数取得部
４４評価データ取得部
４５学習部
４６決定部
４７更新部
４７ａ蓄積部
４７ｂ判定部
５１第１電磁石（電磁石）
５２第２電磁石（電磁石）
５３第３電磁石（電磁石）
５４第４電磁石（電磁石）
１００空気調和装置（冷凍装置）
１１０圧縮機
１１３ａ羽根車（インペラ）
１１５シャフト
１２０凝縮器
１３０膨張機構
１４０蒸発器
１９０冷媒回路

実開平０４−０４０３０８号公報

機械学習装置、及び、それを備える磁気軸受装置

第１観点の機械学習装置は、磁気軸受装置の制御条件を学習する。磁気軸受装置は、シャフトに電磁力を付与する複数の電磁石を有する磁気軸受を備える。機械学習装置は、学習部と、状態変数取得部と、評価データ取得部と、更新部とを備える。状態変数取得部は、シャフトの位置に相関する少なくとも１つのパラメータを含む状態変数を取得する。評価データ取得部は、シャフトの位置の測定値、シャフトの位置の目標値、及び、目標値からの偏差に相関するパラメータのうちの少なくとも１つのパラメータを含む評価データを取得する。更新部は、評価データを用いて学習部の学習状態を更新する。学習部は、更新部の出力に従って、制御条件を学習する。状態変数は、冷凍装置の運転条件に相関する少なくとも１つのパラメータをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。状態変数は、第１パラメータ、第２パラメータ及び第３パラメータのいずれか１つである。第１パラメータは、シャフトの位置に応じた信号を出力する変位センサの出力値を少なくとも含む。第２パラメータは、電磁石の電流値及び電圧値、又は、電磁石の電流値及び磁束を少なくとも含む。第３パラメータは、シャフトの位置の検出値、及び、シャフトの位置の指令値を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも１つを制御条件として学習する。

第２観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、第１パラメータである。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。

第３観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、第２パラメータである。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。

第４観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、第１パラメータ又は第２パラメータである。更新部は、磁気軸受を駆動するための電流値を所定の許容値以下にするように学習部をさらに学習させる。

第５観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、第１パラメータ又は第２パラメータである。評価データは、磁気軸受を駆動するインバータの温度に相関するパラメータをさらに含む。更新部は、インバータの温度を所定の許容値以下にするように学習部をさらに学習させる。

第６観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、磁気軸受が電圧型インバータによって駆動される場合には電磁石の電流検出値をさらに含み、磁気軸受が電流型インバータによって駆動される場合には電磁石の電圧検出値をさらに含む。

第７観点の機械学習装置は、第６観点の機械学習装置であって、更新部は、電流値の制御の応答性に相関する値を小さくするために学習部をさらに学習させる。

第８観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、シャフトの回転数をさらに含む。

第９観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、シャフトに付与される電磁力に相関する少なくとも１つのパラメータをさらに含む。電磁力に相関するパラメータは、冷凍装置の冷媒負荷に相関するパラメータ、及び、冷凍装置の物理特性に相関するパラメータの少なくとも１つを含む。

第１０観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、磁気軸受の特性に相関する少なくとも１つのパラメータをさらに含む。磁気軸受の特性に相関するパラメータは、電磁石のコイルのインダクタンスに相関するパラメータ、及び、電磁石のコイルの抵抗に相関するパラメータの少なくとも１つを含む。

第１１観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、第１パラメータ又は第２パラメータである。評価データは、磁気軸受の消費電力に相関するパラメータをさらに含む。更新部は、消費電力を小さくするために学習部をさらに学習させる。消費電力に相関するパラメータは、磁気軸受を駆動するための電流値、磁気軸受を駆動するための電圧値、及び、電磁石のコイルの抵抗のうちの少なくとも２つを含む。

第１２観点の機械学習装置は、第１観点の機械学習装置であって、評価データは、電動機によって駆動される圧縮機に供給される入力エネルギーに相関する少なくとも１つのパラメータをさらに含む。更新部は、入力エネルギーを小さくするために学習部をさらに学習させる。

第１３観点の機械学習装置は、第１２観点の機械学習装置であって、状態変数は、シャフトに連結されるインペラの断熱効率に相関する少なくとも１つのパラメータの少なくとも１つをさらに含む。インペラの断熱効率に相関するパラメータは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも１つを含む。

第１４観点の機械学習装置は、第１観点の機械学習装置であって、状態変数は、第１パラメータである。状態変数は、変位センサの温度に相関するパラメータをさらに含む。

第１５観点の機械学習装置は、第１乃至第１４観点のいずれか１つの機械学習装置であって、更新部は、評価データに基づいて報酬を算出する。学習部は、報酬を用いて学習する。

第１６観点の機械学習装置は、第１乃至第１４観点のいずれか１つの機械学習装置であって、学習部は、更新部の出力に従って、関数のパラメータの変更を複数回行い、パラメータが変更された関数ごとに状態変数から制御条件を出力する。更新部は、蓄積部と、判定部とを備える。判定部は、評価データを判定して、判定結果を出力する。蓄積部は、判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部は、蓄積部に蓄積された教師データに基づいて学習する。

第１７観点の機械学習装置は、第１乃至第１６観点のいずれか１つの機械学習装置であって、学習部が学習した結果得られた学習済みモデルに基づいて、制御条件を出力する。

第１８観点の磁気軸受装置は、第１７観点の機械学習装置を備える。

これらの２つの式は、以下の１つの式（４）で表される。

分割統治法によって適切な決定木を構成する過程では、以下の（ａ）〜（ｃ）の３点について検討する必要がある。

（ａ）識別器を構成するための特徴軸及び閾値の選択。

（ｂ）終端ノードの決定。例えば、１つの終端ノードに含まれる学習データが属するクラスの数。又は、決定木の剪定（根ノードが同じ部分木を得ること）をどこまで行うかの選択。

（ｃ）終端ノードに対する多数決によるクラスの割り当て。

決定木を用いる学習では、学習データの識別性能を向上させるために、非終端ノードにおいて特徴空間を最適な分割候補点で分割することが重要である。特徴空間の分割候補点を評価するパラメータとして、不純度とよばれる評価関数が用いられてもよい。ノードｔの不純度を表す関数Ｉ（ｔ）としては、例えば、以下の式（９−１）〜（９−３）で表されるパラメータが用いられる。Ｋは、クラスの数である。

（ａ）ノードｔにおける誤り率

（ｂ）交差エントロピー（逸脱度）

（ｃ）ジニ係数

（２−４−６−４）ランダムフォレスト
ランダムフォレストは、アンサンブル学習の一種であって、複数の決定木を組み合わせて識別性能を強化する手法である。ランダムフォレストを用いる学習では、相関が低い複数の決定木からなる群（ランダムフォレスト）が生成される。ランダムフォレストの生成及び識別には、以下のアルゴリズムが用いられる。

（１）ｍ＝１からＭまで以下を繰り返す。

（ａ）Ｎ個のｄ次元学習データから、ｍ個のブートストラップサンプルＺ_ｍを生成する。

（ｂ）Ｚ_ｍを学習データとして、以下の手順で各ノードｔを分割して、ｍ個の決定木を生成する。

（ｉ）ｄ個の特徴からｄ´個の特徴をランダムに選択する。（ｄ´＜ｄ）
（ｉｉ）選択されたｄ´個の特徴の中から、学習データの最適な分割を与える特徴と分割点（閾値）を求める。

（ｉｉｉ）求めた分割点でノードｔを２分割する。

（２）ｍ個の決定木からなるランダムフォレストを出力する。

（３）入力データに対して、ランダムフォレストの各決定木の識別結果を得る。ランダムフォレストの識別結果は、各決定木の識別結果の多数決によって決定される。

ランダムフォレストを用いる学習では、決定木の各非終端ノードにおいて識別に用いる特徴をあらかじめ決められた数だけランダムに選択することで、決定木間の相関を低くすることができる。

本実施形態の磁気軸受装置１０では、学習機能を有する制御部４０が、シャフト１１５の位置に相関する状態変数と、シャフト１１５の位置に関する評価データとに基づいて、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）を、教師あり学習の手法を用いて学習する。変位センサ３１，３２は、比較的短い時間間隔（例えば４０μ秒ごと）でシャフト１１５の位置を検出するので、制御部４０は、シャフト１１５の位置制御を、比較的短い時間間隔で行うことができる。そのため、制御部４０は、シャフト１１５の位置制御の安定性を長期間にわたって維持することができる。これにより、磁気軸受装置１０の品質のバラツキ、及び、システムの経時変化等による、シャフト１１５の浮上制御の安定性の低下、及び、外乱力によるシャフト１１５とタッチダウン軸受１１６，１１７との接触の発生を抑制することができる。
―第２実施形態―
第１実施形態では、状態変数取得部４３は、状態変数として、変位センサ３１，３２の出力値を取得する。変位センサ３１，３２の出力値は、シャフト１１５の位置に相関するパラメータである。

シャフト１１５の位置の推定に必要な情報として、例えば、次の（ａ）〜（ｃ）の情報が挙げられる。

（ａ）電圧指令値と電流検出値
（ｂ）電流指令値と電圧検出値
（ｃ）電流検出値と磁束検出値
情報（ａ）を用いる場合、状態変数取得部４３は、電圧指令値を入力し、電流検出値を取得することで、シャフト１１５の位置を推定する。

決定部４６は、制御条件として、磁気軸受２１，２２の電磁石のコイル６５に印加する電圧（電圧指令値）、及び、コイル６５を流れる電流（電流指令値）の少なくとも１つを決定する。
―第３実施形態―
第１及び第２実施形態では、図７に示される従来の制御部９４０の代わりに、学習機能を有する制御部４０が用いられている。言い換えると、第１及び第２実施形態は、図７に示される位置検出部９４１、位置制御部９４２及び電流制御部９４３の全ての機能が学習機能を有する構成に関する。

本実施形態では、評価データ取得部４４は、評価データとして、相関パラメータ偏差の代わりに、シャフト１１５の位置の真値を取得してもよい。シャフト１１５の位置の真値として、判定データに含まれる位置検出値が用いられてもよい。なお、上述の「特定の時点」において特定又は推定されたシャフト１１５の位置が、シャフト１１５の位置の真値として用いられてもよい。
―第４実施形態―
本実施形態は、従来の制御部９４０の位置制御部９４２のみが学習機能を有する構成に関する。図１８は、本実施形態における、シャフト１１５の位置制御システムのブロック構成図である。図１８に示されるように、図７の位置制御部９４２に相当するブロックが、学習機能を有する学習制御部４４０に置き換えられている。学習制御部４４０は、第１及び第２実施形態の制御部４０と同じ機能を有する。言い換えると、学習制御部４４０は、図９Ａ及び図９Ｂに示されるように、状態変数取得部４３と、評価データ取得部４４と、学習部４５と、決定部４６とを有する。以下、第１及び第２実施形態の制御部４０との相違点を中心に説明する。

決定部４６は、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）として、磁気軸受２１，２２の電磁石のコイル６５に印加する電圧（電圧指令値）、及び、コイル６５を流れる電流（電流指令値）の少なくとも１つを決定する。
―第５実施形態―
本実施形態は、従来の制御部９４０の電流制御部９４３のみが学習機能を有する構成に関する。図１９は、本実施形態における、シャフト１１５の位置制御システムのブロック構成図である。図１９に示されるように、図７の電流制御部９４３に相当するブロックが、学習機能を有する学習制御部５４０に置き換えられている。学習制御部５４０は、第１及び第２実施形態の制御部４０と同じ機能を有する。言い換えると、学習制御部５４０は、図９Ａ及び図９Ｂに示されるように、状態変数取得部４３と、評価データ取得部４４と、学習部４５と、決定部４６とを有する。以下、第１及び第２実施形態の制御部４０との相違点を中心に説明する。

決定部４６は、シャフト１１５の位置制御を適切に行うための条件（位置制御条件）として、磁気軸受２１，２２の電磁石のコイル６５に印加する電圧（電圧指令値）を決定する。
―変形例―
以下、第１〜第５実施形態の少なくとも一部の変形例について説明する。

空気調和装置１００の運転条件に相関するパラメータは、具体的には、以下に列挙する空気調和装置１００の運転情報に関するデータである。

（ａ）圧縮機１１０に吸入される冷媒の温度
（ｂ）圧縮機１１０から吐出される冷媒の温度
（ｃ）圧縮機１１０に吸入される冷媒の圧力
（ｄ）圧縮機１１０から吐出される冷媒の圧力
（ｅ）冷媒回路１９０を循環する冷媒の流量
（ｆ）凝縮器１２０に流入する水の温度
（ｇ）凝縮器１２０から流出する水の温度
（ｈ）蒸発器１４０に流入する水の温度
（ｉ）蒸発器１４０から流出する水の温度
（ｊ）インレットガイドベーン１１３ｂの開度
（ｋ）電動機１１４の回転数
（ｌ）電動機１１４の回転角度
（ｍ）電動機１１４のトルク
（ｎ）電動機１１４の電流値
パラメータ（ｆ）〜（ｉ）の「水」は、凝縮器１２０又は蒸発器１４０において冷媒と熱交換される媒体である水を意味する。空気調和装置１００の運転条件に相関するパラメータは、上記のパラメータ（ａ）〜（ｎ）の少なくとも１つを含む。空気調和装置１００の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。

（１６）変形例Ｐ
上記の各実施形態及び各変形例では、ラジアル磁気軸受２１は、ベアリングレスモータ（シャフトを非接触で支持する機能を有する電動機）の支持機構を用いてもよい。
―むすび―
以上、本開示の実施形態を説明したが、特許請求の範囲に記載された本開示の趣旨及び範囲から逸脱することなく、形態や詳細の多様な変更が可能なことが理解されるであろう。

実開平０４−０４０３０８号公報

Claims

シャフト（１１５）に電磁力を付与する複数の電磁石（５１〜５４）を有する磁気軸受（２１，２２）を備える磁気軸受装置（１０）の制御条件を学習する機械学習装置であって、
学習部（４５）と、
前記シャフトの位置に相関する少なくとも１つのパラメータを含む状態変数を取得する状態変数取得部（４３）と、
前記シャフトの位置の測定値、前記シャフトの位置の目標値、及び、前記目標値からの偏差に相関するパラメータのうちの少なくとも１つのパラメータを含む評価データを取得する評価データ取得部（４４）と、
前記評価データを用いて前記学習部の学習状態を更新する更新部（４７）と、
を備え、
前記学習部は、前記更新部の出力に従って、前記制御条件を学習する、
機械学習装置。
前記状態変数は、前記シャフトの位置に応じた信号を出力する変位センサ（３１，３２）の出力値を少なくとも含み、
前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも１つを前記制御条件として学習する、
請求項１に記載の機械学習装置。
前記状態変数は、前記電磁石の電流値及び電圧値、又は、前記電磁石の電流値及び磁束を少なくとも含み、
前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも１つを前記制御条件として学習する、
請求項１に記載の機械学習装置。
前記状態変数は、前記シャフトの位置に応じた信号を出力する変位センサ（３１，３２）の出力値を少なくとも含み、
前記評価データは、前記シャフトの位置の真値を少なくとも含み、
前記学習部は、前記シャフトの位置を前記制御条件として学習する、
請求項１に記載の機械学習装置。
前記状態変数は、前記電磁石の電流値及び電圧値、又は、前記電磁石の電流値及び磁束を少なくとも含み、
前記評価データは、前記シャフトの位置の真値を少なくとも含み、
前記学習部は、前記シャフトの位置を前記制御条件として学習する、
請求項１に記載の機械学習装置。
前記状態変数は、前記シャフトの位置の検出値、及び、前記シャフトの位置の指令値を少なくとも含み、
前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも１つを前記制御条件として学習する、
請求項１に記載の機械学習装置。
前記更新部は、前記磁気軸受を駆動するための電流値を所定の許容値以下にするように前記学習部をさらに学習させる、
請求項２又は３に記載の機械学習装置。
前記評価データは、前記磁気軸受を駆動するインバータの温度に相関するパラメータをさらに含み、
前記更新部は、前記インバータの温度を所定の許容値以下にするように前記学習部をさらに学習させる、
請求項２又は３に記載の機械学習装置。
前記状態変数は、
前記磁気軸受が電圧型インバータによって駆動される場合には前記電磁石の電流検出値をさらに含み、
前記磁気軸受が電流型インバータによって駆動される場合には前記電磁石の電圧検出値をさらに含む、
請求項２，３及び６のいずれか１項に記載の機械学習装置。
前記更新部は、前記電流値の制御の応答性に相関する値を小さくするために前記学習部をさらに学習させる、
請求項９に記載の機械学習装置。
前記状態変数は、前記シャフトの回転数をさらに含む、
請求項２，３及び６のいずれか１項に記載の機械学習装置。
前記状態変数は、冷凍装置（１００）の運転条件に相関する少なくとも１つのパラメータをさらに含み、
前記冷凍装置は、圧縮機（１１０）と、凝縮器（１２０）と、膨張機構（１３０）と、蒸発器（１４０）とが接続された冷媒回路（１９０）を備え、
前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含む、
請求項２，３及び６のいずれか１項に記載の機械学習装置。
前記状態変数は、前記シャフトに付与される電磁力に相関する少なくとも１つのパラメータをさらに含み、
前記電磁力に相関するパラメータは、前記冷凍装置の冷媒負荷に相関するパラメータ、及び、前記冷凍装置の物理特性に相関するパラメータの少なくとも１つを含む、
請求項１２に記載の機械学習装置。
前記状態変数は、前記磁気軸受の特性に相関する少なくとも１つのパラメータをさらに含み、
前記磁気軸受の特性に相関するパラメータは、前記電磁石のコイルのインダクタンスに相関するパラメータ、及び、前記電磁石のコイルの抵抗に相関するパラメータの少なくとも１つを含む、
請求項１２に記載の機械学習装置。
前記評価データは、前記磁気軸受の消費電力に相関するパラメータをさらに含み、
前記更新部は、前記消費電力を小さくするために前記学習部をさらに学習させ、
前記消費電力に相関するパラメータは、前記磁気軸受を駆動するための電流値、前記磁気軸受を駆動するための電圧値、及び、前記電磁石のコイルの抵抗のうちの少なくとも２つを含む、
請求項２又は３に記載の機械学習装置。
前記状態変数は、冷凍装置（１００）の運転条件に相関する少なくとも１つのパラメータをさらに含み、
前記冷凍装置は、圧縮機（１１０）と、凝縮器（１２０）と、膨張機構（１３０）と、蒸発器（１４０）とが接続された冷媒回路（１９０）を備え、
前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含む、
請求項７，８及び１５のいずれか１項に記載の機械学習装置。
前記評価データは、圧縮機（１１０）に供給される入力エネルギーに相関する少なくとも１つのパラメータをさらに含み、
前記更新部は、前記入力エネルギーを小さくするために前記学習部をさらに学習させる、
請求項２，３及び６のいずれか１項に記載の機械学習装置。
前記状態変数は、冷凍装置（１００）の運転条件に相関する少なくとも１つのパラメータ、及び、前記シャフトに連結されるインペラ（１１３ａ）の断熱効率に相関する少なくとも１つのパラメータの少なくとも１つをさらに含み、
前記冷凍装置は、圧縮機（１１０）と、凝縮器（１２０）と、膨張機構（１３０）と、蒸発器（１４０）とが接続された冷媒回路（１９０）を備え、
前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含み、
前記インペラの断熱効率に相関するパラメータは、前記冷媒の圧力に相関するパラメータ、及び、前記冷媒の温度に相関するパラメータの少なくとも１つを含む、
請求項１７に記載の機械学習装置。
前記状態変数は、前記変位センサの温度に相関するパラメータをさらに含む、
請求項２又は４に記載の機械学習装置。
前記更新部は、前記評価データに基づいて報酬を算出し、
前記学習部は、前記報酬を用いて学習する、
請求項１から１９のいずれか１項に記載の機械学習装置。
前記学習部は、前記更新部の出力に従って、関数のパラメータの変更を複数回行い、前記パラメータが変更された前記関数ごとに前記状態変数から前記制御条件を出力し、
前記更新部は、蓄積部（４７ａ）と、判定部（４７ｂ）とを備え、
前記判定部は、前記評価データを判定して、判定結果を出力し、
前記蓄積部は、前記判定結果に基づいて、前記状態変数及び前記評価データから教師データを作成して蓄積し、
前記学習部は、前記蓄積部に蓄積された前記教師データに基づいて学習する、
請求項１から１９のいずれか１項に記載の機械学習装置。
前記学習部が学習した結果得られた学習済みモデルに基づいて、前記制御条件を出力する、
請求項１から２１のいずれか１項に記載の機械学習装置。
請求項２２に記載の機械学習装置を備える、磁気軸受装置。