JP2020148329A - 機械学習装置、及び、磁気軸受装置 - Google Patents

機械学習装置、及び、磁気軸受装置 Download PDF

Info

Publication number
JP2020148329A
JP2020148329A JP2019048948A JP2019048948A JP2020148329A JP 2020148329 A JP2020148329 A JP 2020148329A JP 2019048948 A JP2019048948 A JP 2019048948A JP 2019048948 A JP2019048948 A JP 2019048948A JP 2020148329 A JP2020148329 A JP 2020148329A
Authority
JP
Japan
Prior art keywords
shaft
unit
learning
value
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019048948A
Other languages
English (en)
Other versions
JP6828762B2 (ja
Inventor
俊平 藤本
Shumpei Fujimoto
俊平 藤本
篤 阪脇
Atsushi Sakawaki
篤 阪脇
平田 和也
Kazuya Hirata
和也 平田
寛 日比野
Hiroshi Hibino
寛 日比野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Daikin Industries Ltd
Original Assignee
Daikin Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Daikin Industries Ltd filed Critical Daikin Industries Ltd
Priority to JP2019048948A priority Critical patent/JP6828762B2/ja
Priority to CN202080020858.8A priority patent/CN113574289B/zh
Priority to PCT/JP2020/011162 priority patent/WO2020189565A1/ja
Priority to EP20773439.3A priority patent/EP3940254B1/en
Priority to US17/435,242 priority patent/US20220056953A1/en
Publication of JP2020148329A publication Critical patent/JP2020148329A/ja
Application granted granted Critical
Publication of JP6828762B2 publication Critical patent/JP6828762B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D17/00Radial-flow pumps, e.g. centrifugal pumps; Helico-centrifugal pumps
    • F04D17/08Centrifugal pumps
    • F04D17/10Centrifugal pumps for compressing or evacuating
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D25/00Pumping installations or systems
    • F04D25/02Units comprising pumps and their driving means
    • F04D25/06Units comprising pumps and their driving means the pump being electrically driven
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/001Testing thereof; Determination or simulation of flow characteristics; Stall or surge detection, e.g. condition monitoring
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D29/00Details, component parts, or accessories
    • F04D29/05Shafts or bearings, or assemblies thereof, specially adapted for elastic fluid pumps
    • F04D29/051Axial thrust balancing
    • F04D29/0513Axial thrust balancing hydrostatic; hydrodynamic thrust bearings
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D29/00Details, component parts, or accessories
    • F04D29/05Shafts or bearings, or assemblies thereof, specially adapted for elastic fluid pumps
    • F04D29/056Bearings
    • F04D29/058Bearings magnetic; electromagnetic
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0444Details of devices to control the actuation of the electromagnets
    • F16C32/0446Determination of the actual position of the moving member, e.g. details of sensors
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0444Details of devices to control the actuation of the electromagnets
    • F16C32/0451Details of controllers, i.e. the units determining the power to be supplied, e.g. comparing elements, feedback arrangements with P.I.D. control
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0444Details of devices to control the actuation of the electromagnets
    • F16C32/0451Details of controllers, i.e. the units determining the power to be supplied, e.g. comparing elements, feedback arrangements with P.I.D. control
    • F16C32/0453Details of controllers, i.e. the units determining the power to be supplied, e.g. comparing elements, feedback arrangements with P.I.D. control for controlling two axes, i.e. combined control of x-axis and y-axis
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0444Details of devices to control the actuation of the electromagnets
    • F16C32/0457Details of the power supply to the electromagnets
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C41/00Other accessories, e.g. devices integrated in the bearing not relating to the bearing function as such
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0459Details of the magnetic circuit
    • F16C32/0468Details of the magnetic circuit of moving parts of the magnetic circuit, e.g. of the rotor
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/047Details of housings; Mounting of active magnetic bearings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mechanical Engineering (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Electromagnetism (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Fluid Mechanics (AREA)
  • Magnetic Bearings And Hydrostatic Bearings (AREA)
  • Control Of Positive-Displacement Air Blowers (AREA)
  • Structures Of Non-Positive Displacement Pumps (AREA)

Abstract

【課題】機械学習装置を備え、被支持体の位置の制御を適切に行うことができる磁気軸受装置を提供する。【解決手段】機械学習装置は、磁気軸受装置10の制御条件を学習する。磁気軸受装置は、シャフト115に電磁力を付与する複数の電磁石51〜54を有する磁気軸受21,22を備える。機械学習装置は、学習部45と、状態変数取得部43と、評価データ取得部44と、更新部47とを備える。状態変数取得部は、シャフトの位置に相関する少なくとも1つのパラメータを含む状態変数を取得する。評価データ取得部は、シャフトの位置の測定値、シャフトの位置の目標値、及び、目標値からの偏差に相関するパラメータのうちの少なくとも1つのパラメータを含む評価データを取得する。更新部は、評価データを用いて学習部の学習状態を更新する。学習部は、更新部の出力に従って、制御条件を学習する。【選択図】図8

Description

機械学習装置、及び、それを備える磁気軸受装置
従来、複数の電磁石の合成電磁力によりシャフト等の被支持体を非接触で支持する磁気軸受装置が知られている。特許文献1(実開平04−040308号公報)には、被支持体の位置をセンサにより検出し、検出信号に基づいて電磁石の電磁力を制御して被支持体の位置を所定の位置に保持する構成が開示されている。
磁気軸受装置の製品ごとのバラツキ、及び、磁気軸受装置の経時変化等によって、被支持体の位置の制御が適切に行われなくなる課題がある。
第1観点の機械学習装置は、磁気軸受装置の制御条件を学習する。磁気軸受装置は、シャフトに電磁力を付与する複数の電磁石を有する磁気軸受を備える。機械学習装置は、学習部と、状態変数取得部と、評価データ取得部と、更新部とを備える。状態変数取得部は、シャフトの位置に相関する少なくとも1つのパラメータを含む状態変数を取得する。評価データ取得部は、シャフトの位置の測定値、シャフトの位置の目標値、及び、目標値からの偏差に相関するパラメータのうちの少なくとも1つのパラメータを含む評価データを取得する。更新部は、評価データを用いて学習部の学習状態を更新する。学習部は、更新部の出力に従って、制御条件を学習する。
第2観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、シャフトの位置に応じた信号を出力する変位センサの出力値を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも1つを制御条件として学習する。
第3観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、電磁石の電流値及び電圧値、又は、電磁石の電流値及び磁束を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも1つを制御条件として学習する。
第4観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、シャフトの位置に応じた信号を出力する変位センサの出力値を少なくとも含む。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。
第5観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、電磁石の電流値及び電圧値、又は、電磁石の電流値及び磁束を少なくとも含む。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。
第6観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、シャフトの位置の検出値、及び、シャフトの位置の指令値を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも1つを制御条件として学習する。
第7観点の機械学習装置は、第2又は第3観点の機械学習装置であって、更新部は、磁気軸受を駆動するための電流値を所定の許容値以下にするように学習部をさらに学習させる。
第8観点の機械学習装置は、第2又は第3観点の機械学習装置であって、評価データは、磁気軸受を駆動するインバータの温度に相関するパラメータをさらに含む。更新部は、インバータの温度を所定の許容値以下にするように学習部をさらに学習させる。
第9観点の機械学習装置は、第2、第3及び第6観点のいずれか1つの機械学習装置であって、状態変数は、磁気軸受が電圧型インバータによって駆動される場合には電磁石の電流検出値をさらに含み、磁気軸受が電流型インバータによって駆動される場合には電磁石の電圧検出値をさらに含む。
第10観点の機械学習装置は、第9観点の機械学習装置であって、更新部は、電流値の制御の応答性に相関する値を小さくするために学習部をさらに学習させる。
第11観点の機械学習装置は、第2、第3及び第6観点のいずれか1つの機械学習装置であって、状態変数は、シャフトの回転数をさらに含む。
第12観点の機械学習装置は、第2、第3及び第6観点のいずれか1つの機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも1つのパラメータをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。
第13観点の機械学習装置は、第12観点の機械学習装置であって、状態変数は、シャフトに付与される電磁力に相関する少なくとも1つのパラメータをさらに含む。電磁力に相関するパラメータは、冷凍装置の冷媒負荷に相関するパラメータ、及び、冷凍装置の物理特性に相関するパラメータの少なくとも1つを含む。
第14観点の機械学習装置は、第12観点の機械学習装置であって、状態変数は、磁気軸受の特性に相関する少なくとも1つのパラメータをさらに含む。磁気軸受の特性に相関するパラメータは、電磁石のコイルのインダクタンスに相関するパラメータ、及び、電磁石のコイルの抵抗に相関するパラメータの少なくとも1つを含む。
第15観点の機械学習装置は、第2又は第3観点の機械学習装置であって、評価データは、磁気軸受の消費電力に相関するパラメータをさらに含む。更新部は、消費電力を小さくするために学習部をさらに学習させる。消費電力に相関するパラメータは、磁気軸受を駆動するための電流値、磁気軸受を駆動するための電圧値、及び、電磁石のコイルの抵抗のうちの少なくとも2つを含む。
第16観点の機械学習装置は、第7、第8及び第15観点のいずれか1つの機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも1つのパラメータをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。
第17観点の機械学習装置は、第2、第3及び第6観点のいずれか1つの機械学習装置であって、評価データは、電動機によって駆動される圧縮機に供給される入力エネルギーに相関する少なくとも1つのパラメータをさらに含む。更新部は、入力エネルギーを小さくするために学習部をさらに学習させる。
第18観点の機械学習装置は、第17観点の機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも1つのパラメータ、及び、シャフトに連結されるインペラの断熱効率に相関する少なくとも1つのパラメータの少なくとも1つをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。インペラの断熱効率に相関するパラメータは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも1つを含む。
第19観点の機械学習装置は、第2又は第4観点の機械学習装置であって、状態変数は、変位センサの温度に相関するパラメータをさらに含む。
第20観点の機械学習装置は、第1乃至第19観点のいずれか1つの機械学習装置であって、更新部は、評価データに基づいて報酬を算出する。学習部は、報酬を用いて学習する。
第21観点の機械学習装置は、第1乃至第19観点のいずれか1つの機械学習装置であって、学習部は、更新部の出力に従って、関数のパラメータの変更を複数回行い、パラメータが変更された関数ごとに状態変数から制御条件を出力する。更新部は、蓄積部と、判定部とを備える。判定部は、評価データを判定して、判定結果を出力する。蓄積部は、判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部は、蓄積部に蓄積された教師データに基づいて学習する。
第22観点の機械学習装置は、第1乃至第21観点のいずれか1つの機械学習装置であって、学習部が学習した結果得られた学習済みモデルに基づいて、制御条件を出力する。
第23観点の磁気軸受装置は、第22観点の機械学習装置を備える。
第1実施形態に係る磁気軸受装置10を備える空気調和装置100の全体構成図である。 圧縮機110の縦断面図である。 ラジアル磁気軸受21の横断面図である。 ラジアル磁気軸受21の縦断面図である。 スラスト磁気軸受22の平面図である。 スラスト磁気軸受22の縦断面図である。 比較のための参考図であって、シャフト115の位置制御システムのブロック構成図である。 第1実施形態における、シャフト115の位置制御システムのブロック構成図である。 教師あり学習を行う制御部40のブロック構成図である。 教師あり学習を行う制御部40のブロック構成図である。 ニューラルネットワークのニューロンのモデルの模式図である。 図10に示されるニューロンを組み合わせて構成した三層のニューラルネットワークの模式図である。 サポートベクターマシンを説明するための図である。2クラスの学習データが線形分離可能である特徴空間を表す。 2クラスの学習データが線形分離不可能である特徴空間を表す。 分割統治法によって構成された決定木の一例である。 図14の決定木によって分割される特徴空間を表す。 Q学習による強化学習を行う制御部40のブロック構成図である。 第3実施形態における、シャフト115の位置制御システムのブロック構成図である。 第4実施形態における、シャフト115の位置制御システムのブロック構成図である。 第5実施形態における、シャフト115の位置制御システムのブロック構成図である。 変形例Fにおける空気調和装置100の運転条件の一例である。
―第1実施形態―
第1実施形態に係る磁気軸受装置10を備える空気調和装置100について、図面を参照しながら説明する。
(1)空気調和装置100の全体構成
図1は、空気調和装置100の全体構成図である。空気調和装置100は、冷媒回路190を備える。冷媒回路190は、冷媒が充填された閉回路である。冷媒回路190には、圧縮機110、凝縮器120、膨張弁130、蒸発器140、及び、電動機冷却制御装置150が設けられている。圧縮機110には、種々の圧縮機を採用できる。本実施形態では、圧縮機110は、ターボ圧縮機である。圧縮機110は、電動機114によって駆動される。電動機114には、電動機制御装置160から電力が供給される。
凝縮器120及び蒸発器140は、水冷媒熱交換器である。膨張弁130は、例えば、電子膨張弁である。冷媒回路190には、冷媒圧力を検出するセンサ、及び、冷媒温度を検出するセンサ等が設けられている。
図2は、圧縮機110の縦断面図である。圧縮機110は、主として、ケーシング112と、圧縮機構113と、電動機114と、シャフト115と、ラジアルタッチダウン軸受116と、スラストタッチダウン軸受117と、磁気軸受装置10とを備える。
ケーシング112は、両端が閉塞された円筒形状を有する。ケーシング112は、その円筒形状の円筒軸が水平方向に平行となるように配置される。ケーシング112内の空間は、壁部112aによって区画される。図2において、壁部112aよりも右側の空間は、圧縮機構113を収容する圧縮機構室S1である。図2において、壁部112aよりも左側の空間は、電動機114を収容する電動機室S2である。ケーシング112内の空間には、水平方向に延びるシャフト115が配置される。シャフト115は、圧縮機構113と電動機114とを連結している。
圧縮機構113は、流体を圧縮する。流体とは、本実施形態では、冷媒回路190に充填されている冷媒である。圧縮機構113は、主として、羽根車113aと、インレットガイドベーン113bとを備える。羽根車113aは、複数の羽根によって外形が略円錐形状となるように構成されている。羽根車113aは、シャフト115の一方の端部に固定されている。インレットガイドベーン113bは、圧縮機構113の流体の吸入口に設けられる。インレットガイドベーン113bは、流体の吸入量を制御するための弁である。
電動機114は、シャフト115を回転駆動する。電動機114は、主として、固定子114aと、回転子114bとを有する。固定子114aは、円筒形状に形成され、ケーシング112内に固定されている。回転子114bは、円柱形状に形成され、固定子114aの内側に回転可能に設置されている。回転子114bの中心部には、シャフト115が固定される軸孔が形成されている。シャフト115の端部には、円盤部115aが固定されている。円盤部115aは、羽根車113aが固定されていない方の端部に固定されている。
電動機制御装置160は、電動機114に供給する電力を制御して、電動機114の起動、停止、及び、回転速度の制御を行う。電動機制御装置160は、主として、コンバータ回路、インバータ回路、及び、マイクロコンピュータを備える。これらは、制御基板160a上に実装されている。マイクロコンピュータは、インバータ回路が有するスイッチング素子のスイッチング動作を制御する。そのため、マイクロコンピュータには、電動機114の回転速度、及び、電動機114の電流値の情報等が入力される。制御基板160aには、スイッチング素子の保護等の目的で温度センサが設けられている。マイクロコンピュータは、インバータ回路の制御の際に、その温度センサの検出値を利用する。
圧縮機110は、凝縮器120内の冷媒を電動機114の内部に流すことで電動機114を冷却する。電動機冷却制御装置150は、電動の開閉弁150aと、温度センサ150bとを有する。電動機冷却制御装置150は、温度センサ150bの検出値に応じて、開閉弁150aを制御し、凝縮器120から電動機114に流入する冷媒の流量を制御する。これにより、冷媒回路190では、電動機114の温度を所定温度範囲に維持することができる。電動機114は、開閉弁150aを介して凝縮器120に配管接続されている。電動機114は、蒸発器140にも配管接続されている。電動機114内を流れて電動機114を冷却した冷媒は、蒸発器140に戻されている。温度センサ150bは、電動機114と蒸発器140とを連結する配管に取り付けられている。
圧縮機110は、ラジアルタッチダウン軸受116及びスラストタッチダウン軸受117の2種類のタッチダウン軸受を有する。ラジアルタッチダウン軸受116は、磁気軸受装置10が非通電であるとき、言い換えると、シャフト115が磁気浮上していないときに、シャフト115を支持する。
(2)磁気軸受装置10の詳細構成
磁気軸受装置10は、被支持体であるシャフト115を磁気浮上させることで、シャフト115を非接触で回転可能に支持する。磁気軸受装置10は、主として、1つ又は複数(本実施形態では3つ)の磁気軸受21,22と、1つ又は複数(本実施形態では5つ)の変位センサ31,32と、制御部40とを備える。
(2−1)磁気軸受21,22
磁気軸受21,22は、被支持体を挟んで互いに対向する電磁石対を有する。磁気軸受21,22は、電磁石対の合成電磁力により被支持体を非接触に支持するように構成されている。磁気軸受21,22では、電磁石対に流れる電流を制御することにより、その電磁石対の合成電磁力を制御して、その電磁石対の対向方向における被支持体の位置を制御することができる。本実施形態では、磁気軸受装置10は、磁気軸受21,22として、2つのラジアル磁気軸受21と、1つのスラスト磁気軸受22とを備える。
(2−1−1)ラジアル磁気軸受21
図3は、ラジアル磁気軸受21の横断面図である。図4は、ラジアル磁気軸受21の縦断面図である。図3及び図4に示されるように、ラジアル磁気軸受21は、第1〜第4電磁石51〜54を有し、ヘテロポーラ型のラジアル磁気軸受を構成している。第1及び第2電磁石51,52は、シャフト115を挟んで互いに対向し、第1及び第2電磁石51,52の電磁力F1,F2によりシャフト115を非接触に支持する。第3及び第4電磁石53,54は、シャフト115を挟んで互いに対向し、第3及び第4電磁石53,54の電磁力F3,F4によりシャフト115を非接触に支持する。第3及び第4電磁石53,54の対向方向は、平面視において、第1及び第2電磁石51,52の対向方向と直交している。
図3では、ラジアル磁気軸受21は、磁気軸受コア61と、8つのコイル65とを備える。磁気軸受コア61は、例えば、複数の電磁鋼板が積層されて構成され、バックヨーク62と8つのティース63とを有する。バックヨーク62は、円筒状に形成されている。8つのティース63は、バックヨーク62の内周面に沿うように所定間隔(本実施形態では45°間隔)で周方向に配列される。ティース63は、バックヨーク62の内周面から径方向内側に突出する。ティース63の内周面(突端面)は、シャフト115の外周面と所定のギャップを隔てて対向する。
8つのコイル65は、磁気軸受コア61の8つのティース63にそれぞれ巻回されている。これにより、8つの電磁石部71〜78が形成される。図3では、第1電磁石部71、第2電磁石部72、第7電磁石部77、第8電磁石部78、第3電磁石部73、第4電磁石部74、第5電磁石部75及び第6電磁石部76が、時計回り方向に順に配列されている。第1電磁石51は、第1電磁石部71及び第2電磁石部72を有する。第2電磁石52は、第3電磁石部73及び第4電磁石部74を有する。第3電磁石53は、第5電磁石部75及び第6電磁石部76を有する。第4電磁石54は、第7電磁石部77及び第8電磁石部78を有する。8つの電磁石部71〜78に流れる電流を制御して、第1〜第4電磁石51〜54の電磁力F1〜F4の合力である合成電磁力を制御することで、第1及び第2電磁石51,52の対向方向、及び、第3及び第4電磁石53,54の対向方向におけるシャフト115の位置を制御することができる。
コイル65の巻回方向、及び、コイル65に流れる電流の向きは、第1〜第4電磁石51〜54の各々に吸引力が発生するように設定されている。この場合、吸引力とは、シャフト115を引き寄せる方向に作用する電磁力である。具体的には、コイル65の巻回方向、及び、コイル65に流れる電流の向きは、図3に示されるループ状の矢印の方向に磁束が発生するように設定されている。
(2−1−2)スラスト磁気軸受22
図5は、スラスト磁気軸受22の平面図である。図6は、スラスト磁気軸受22の縦断面図である。図5及び図6に示されるように、スラスト磁気軸受22は、第1及び第2電磁石51,52を有している。第1及び第2電磁石51,52は、円盤部115aを水平方向に挟んで互いに対向し、第1及び第2電磁石51,52の電磁力F1,F2により円盤部115aを非接触に支持する。
具体的には、スラスト磁気軸受22は、2つの磁気軸受コア61と、2つのコイル65とを備える。2つの磁気軸受コア61は、それぞれが円環状に形成され、円盤部115aの軸方向両側に所定のギャップを隔てて配置されている。磁気軸受コア61の対向面には、円周溝が全周に亘って形成されている。2つのコイル65は、2つの磁気軸受コア61の円周溝にそれぞれ収容されている。これにより、第1及び第2電磁石51,52が構成されている。第1及び第2電磁石51,52に流れる電流を制御して、第1及び第2電磁石51,52の電磁力F1,F2の合力である合成電磁力を制御することで、第1及び第2電磁石51,52の対向方向(水平方向)における円盤部115aの位置(シャフト115の位置)を制御することができる。
コイル65の巻回方向、及び、コイル65に流れる電流の向きは、第1及び第2電磁石51,52の各々に吸引力が発生するように設定されている。この場合、吸引力とは、円盤部115aを引き寄せる方向に作用する電磁力である。具体的には、コイル65の巻回方向、及び、コイル65に流れる電流の向きは、図6に示されるループ状の矢印の方向に磁束が発生するように設定されている。
(2−2)変位センサ31,32
変位センサ31,32は、いずれも渦電流式の変位センサである。変位センサ31,32は、被支持体を挟んで互いに対向する電磁石対(第1及び第2電磁石51,52の組)に対応して設けられる。変位センサ31,32は、変位センサ31,32の基準位置に対する被支持体の変位量を検出する。変位センサ31,32の基準位置とは、例えば、変位センサ31,32のセンサヘッドの位置、又は、電磁石対の対向方向における中央位置である。電磁石対の対向方向における中央位置とは、例えば、第1電磁石51と第2電磁石52との間の中央位置である。本実施形態では、磁気軸受装置10は、変位センサ31,32として、ラジアル変位センサ31と、スラスト変位センサ32とを有する。
(2−2−1)ラジアル変位センサ31
ラジアル変位センサ31は、各ラジアル磁気軸受21に2つずつ設けられている。言い換えると、磁気軸受装置10は、4つのラジアル変位センサ31を備える。ラジアル変位センサ31は、ラジアル変位センサ31の基準位置に対する変位量を検出する。ラジアル変位センサ31の基準位置とは、例えば、ラジアル変位センサ31のセンサヘッドの位置、又は、シャフト115の中央位置である。各ラジアル磁気軸受21では、一方のラジアル変位センサ31が、ラジアル磁気軸受21の第1電磁石51と第2電磁石52との対向方向(X軸方向)の変位量を検出する。X軸方向は、ラジアル磁気軸受21の径方向である。他方のラジアル変位センサ31は、ラジアル磁気軸受21の第3電磁石53と第4電磁石54との対向方向(Y軸方向)の変位量を検出する。Y軸方向は、X軸方向と直交する、ラジアル磁気軸受21の径方向である。
ラジアル変位センサ31は、ラジアル変位センサ31の基準位置に対する変位量を所定の時間間隔で検出する。所定の時間間隔は、例えば、40μ秒である。
(2−2−2)スラスト変位センサ32
磁気軸受装置10は、1つのスラスト変位センサ32を備える。スラスト変位センサ32は、スラスト磁気軸受22の第1電磁石51と第2電磁石52との対向方向(Z軸方向)の変位量を検出する。Z軸方向は、シャフト115の回転軸に沿った方向である。スラスト変位センサ32は、スラスト変位センサ32の基準位置に対する変位量を検出する。スラスト変位センサ32の基準位置とは、例えば、スラスト変位センサ32のセンサヘッドの位置、又は、円盤部115aの中央位置である。
スラスト変位センサ32は、スラスト変位センサ32の基準位置に対する変位量を所定の時間間隔で検出する。所定の時間間隔は、例えば、40μ秒である。
(2−3)制御部40
制御部40は、被支持体(シャフト115及び円盤部115a)が非接触に支持されるように、1つ又は複数の磁気軸受21,22を制御する。制御部40は、各磁気軸受21,22の電磁力を制御することによって、被支持体の浮上制御を行う。制御部40は、具体的には、マイクロコンピュータと、それを動作させるためのソフトウェアを格納したメモリディバイス等から構成される。制御部40は、ラジアル制御部41と、スラスト制御部42とを有する。
(2−3−1)ラジアル制御部41
ラジアル制御部41は、2つのラジアル磁気軸受21によるシャフト115の浮上制御を行う。この浮上制御では、ラジアル制御部41は、X軸方向及びY軸方向のそれぞれにおけるシャフト115の位置制御を行う。具体的には、ラジアル制御部41は、X軸方向及びY軸方向の各方向について、ラジアル変位センサ31が検出した変位量に基づいて、シャフト115の位置と、予め定められた位置指令値との差分値がゼロに収束するように、ラジアル磁気軸受21の第1〜第4電磁石51〜54を構成するそれぞれのコイル65に電流(制御電流)を流す。ラジアル制御部41は、各コイル65に制御電流が流れるように、各コイル65に印加される電圧(電圧指令値)を出力する。
(2−3−2)スラスト制御部42
スラスト制御部42は、スラスト磁気軸受22による円盤部115aの浮上制御を行う。この浮上制御では、スラスト制御部42は、Z軸方向における円盤部115aの位置制御を行う。具体的には、スラスト制御部42は、Z軸方向について、スラスト変位センサ32が検出した変位量に基づいて、円盤部115aの位置と、予め定められた位置指令値との差分値がゼロに収束するように、スラスト磁気軸受22の第1及び第2電磁石51,52を構成するそれぞれのコイル65に電流(制御電流)を流す。スラスト制御部42は、各コイル65に制御電流が流れるように、各コイル65に印加される電圧(電圧指令値)を出力する。
(2−4)磁気軸受装置10の位置制御システム
磁気軸受装置10は、シャフト115の位置制御システムを有する。位置制御システムでは、制御部40は、各磁気軸受21,22の電磁力を制御することによって、非接触支持されているシャフト115の位置制御を行う。
次に、制御部40(ラジアル制御部41及びスラスト制御部42)が2つのラジアル磁気軸受21及び1つのスラスト磁気軸受22の電磁力を制御することで、シャフト115の位置制御を行う手法について説明する。シャフト115の位置制御では、シャフト115をZ軸に沿って見た場合に、X軸及びY軸を含むXY平面におけるシャフト115の可動限界領域の中心に、シャフト115の回転軸が位置するように、シャフト115の位置が制御される。シャフト115の可動限界領域は、シャフト115がラジアルタッチダウン軸受116と接触する位置より内側の領域である。具体的には、例えば、シャフト115の可動限界領域は、半径250μmの円形領域である。シャフト115の回転時において、例えば、シャフト115は、その回転軸から10μm以下の範囲を揺れ動く。シャフト115の可動許容領域は、例えば、半径83μmの円形領域である。シャフト115の可動許容領域は、シャフト115の回転時において、シャフト115が、その回転軸から離れて揺れ動くことが許容される範囲である。
本実施形態では、制御部40は、機械学習の手法を用いて、シャフト115の位置制御を行う。ここで、比較のために、機械学習の手法を用いない、従来の制御部の動作について説明する。図7は、比較のための参考図であって、従来の制御部940を含む、シャフト115の位置制御システムのブロック構成図である。制御部940は、主として、位置検出部941と、位置制御部942と、電流制御部943とを有する。図7には、制御対象装置50及び外部装置60が示されている。制御対象装置50及び外部装置60は、制御部940と情報を送受信する。制御対象装置50は、磁気軸受装置10が有する装置であって、具体的には、シャフト115、磁気軸受21,22及び変位センサ31,32である。外部装置60は、磁気軸受装置10以外の装置であって、空気調和装置100が有する装置である。外部装置60は、例えば、電動機冷却制御装置150である。
位置検出部941は、XY平面におけるシャフト115の位置を検出する。位置検出部941は、変位センサ31,32の出力値を受信する。変位センサ31,32の出力値は、シャフト115のX軸方向の位置、及び、シャフト115のY軸方向の位置を含む。位置検出部941は、空気調和装置100の運転に関する情報を外部装置60から受信する。位置検出部941は、変位センサ31,32から受信した出力値、及び、外部装置60から受信した情報(外部情報)に基づいて、シャフト115の位置に関する情報である位置検出値を出力する。
位置制御部942は、位置検出部941が検出したシャフト115の位置に関する情報、及び、外部情報に基づいて、シャフト115が可動許容領域内で回転するように、予め定められた制御規則に基づいて電流指令値を出力する。電流指令値は、磁気軸受21,22の電磁石のコイル65に入力される電流である。
電流制御部943は、位置制御部942が出力した電流指令値、磁気軸受21,22のコイル65を流れている電流の検出値、及び、外部情報に基づいて、磁気軸受21,22のコイル65に印加される電圧指令値を出力する。電圧指令値は、磁気軸受21,22のコイル65に印加される電圧である。
制御部940は、制御対象装置50及び外部装置60の出力値に基づいて、シャフト115が可動許容領域内で回転するように、予め定められた制御規則に基づいて電圧指令値を出力する。
次に、本実施形態の制御部40によるシャフト115の位置制御について説明する。図8は、本実施形態の制御部40を含む、シャフト115の位置制御システムのブロック構成図である。制御部40は、磁気軸受装置10の制御条件を学習する機械学習装置としての機能を有する。具体的には、制御部40は、機械学習の手法を用いて、シャフト115の位置制御を行う。より具体的には、制御部40は、制御対象装置50の出力値を用いて、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習又は強化学習の手法を用いて学習する。本実施形態では、制御対象装置50は、シャフト115、磁気軸受21,22及び変位センサ31,32の少なくとも一部である。制御部40は、位置制御条件の学習結果を用いて、新たな出力値について最適な位置制御条件を決定する。制御部40は、主として、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46と、更新部47とを有する。図9A及び図9Bは、教師あり学習を行う制御部40のブロック構成図である。
(2−4−1)状態変数取得部43
状態変数取得部43は、磁気軸受装置10の動作中に磁気軸受装置10の状態を観測して、観測された状態に関する情報を状態変数として取得する。言い換えると、状態変数取得部43は、磁気軸受装置10の状態が入力され、状態変数を出力する。状態変数は、シャフト115の位置に相関する少なくとも1つのパラメータを含む。本実施形態では、状態変数は、変位センサ31,32の出力値である。状態変数は、教師あり学習において教師データとして用いられる。
ここで、シャフト115の位置とは、シャフト115の回転軸(Z軸)回りの角度を除く5自由度を規制する座標値の少なくとも1つである。5自由度の一の例は、シャフト115の重心位置のX軸方向、Y軸方向及びZ軸方向のそれぞれの座標値、シャフト115のX軸回りの角度、及び、シャフト115のY軸回りの角度である。5自由度の他の例は、2つのラジアル磁気軸受21のそれぞれのX軸方向及びY軸方向の座標値、及び、2つのラジアル磁気軸受21の重心のZ軸方向の座標値である。具体例を挙げると、シャフト115の位置として、XY平面におけるシャフト115の重心位置が用いられてもよい。
(2−4−2)評価データ取得部44
評価データ取得部44は、判定データを評価して、評価データを取得する。評価データは、教師あり学習において教師データとして用いられる。評価データは、シャフト115の位置の測定値、シャフト115の位置の目標値、及び、シャフト115の位置の目標値からの偏差に相関するパラメータ、のうちの少なくとも1つのパラメータを含む。評価データ取得部44は、例えば、判定データを所定の評価関数に入力して、評価関数の出力値を評価データとして取得する。言い換えると、評価データ取得部44は、判定データが入力され、評価データを出力する。判定データは、例えば、シャフト115の位置制御の評価に用いることができるデータである。本実施形態では、判定データは、シャフト115の可動範囲の中心位置(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)である。位置指令値は、シャフト115の位置の目標値である。位置検出値は、例えば、変位センサ31,32の出力値から得られた、シャフト115の位置の検出値である。
この場合、制御部40は、位置検出値が位置指令値にできるだけ近くなるように、シャフト115の位置制御を行う。そのため、評価データ取得部44は、判定データを用いて、位置指令値を基準にした場合の位置検出値の偏差(シャフト位置偏差)を評価データとして取得する。シャフト位置偏差は、ゼロに近いほど好ましい。この場合、評価関数の入力値は位置指令値及び位置検出値であり、評価関数の出力値はシャフト位置偏差である。
評価関数は、シャフト位置偏差が所定範囲内であれば一定値と見なされる関数であってもよい。所定範囲とは、ゼロの近傍の範囲であり、一定値とは、ゼロである。言い換えると、シャフト115の位置制御の観点からは、シャフト位置偏差はゼロ近傍に留まればよく、ゼロに収束する必要はない。
シャフト位置偏差は、例えば、位置指令値と位置検出値との間の距離の絶対値である。しかし、シャフト位置偏差は、現在から過去の所定時点までにおける当該距離の二乗平均平方根(RMS)又は二乗平均(MS)でもよく、強制的に外乱を加えた場合の当該距離のオーバーシュート量又は整定時間でもよい。オーバーシュート量とは、位置検出値が位置指令値に近付く過程において、位置検出値が位置指令値を超えた(オーバーシュートした)場合に、位置指令値を超えた分の量である。整定時間とは、位置検出値が位置指令値に近付く過程において、位置検出値が、位置指令値の近傍の所定の許容範囲内に入り、かつ、以降はその許容範囲から出なくなる時点までの時間である。
(2−4−3)学習部45
学習部45は、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習又は強化学習の手法を用いて学習する。学習部45は、更新部47の出力に従って位置制御条件を学習する。次に、教師あり学習を用いる場合の学習部45の動作について説明する。
学習部45は、学習データとして、状態変数取得部43が予め取得した状態変数と、評価データ取得部44が予め取得した評価データとの対を用いる。本実施形態では、状態変数は、変位センサ31,32の出力値であり、評価データは、シャフト位置偏差である。学習部45が学習に使用する教師データは、状態変数と評価データとの対である。
学習部45は、更新部47の出力に従って、状態変数から評価データへの写像である識別関数のパラメータを調整することで、位置制御条件を学習する。学習部45による学習の目的は、新規の状態変数から正しい又は適切な評価データを得ることができるように、学習データを用いて識別関数のパラメータを調整することである。学習部45によってパラメータが十分に調整された識別関数は、学習済みモデルに相当する。
学習部45は、図9Aに示されるように、教師データの一部を学習データとして用いて識別関数のパラメータを調整し、残りをテストデータとして用いてもよい。テストデータとは、学習に使用されなかったデータであり、主に、学習済みモデルの性能評価に用いられるデータである。テストデータを用いることで、新規の状態変数から得られた評価データの性能を、テストデータに対する誤り確率という形式で予測することができる。予め取得したデータを学習データとテストデータとに分ける手法としては、ホールドアウト法、交差確認法、一つ抜き法(ジャックナイフ法)及びブートストラップ法等が用いられる。
また、学習部45による学習は、モデルが更新されるタイミングに応じて、オンライン学習とバッチ学習とに分類される。オンライン学習とは、モデルの更新に必要なデータを取得する度に、新たに取得したデータのみを用いて、従来のモデルを随時更新する手法である。バッチ学習とは、モデルの更新に必要なデータを全て揃えた後、所定のタイミングで、学習対象となるデータを全てまとめて一括で処理してモデルを生成する手法である。
(2−4−4)更新部47
更新部47は、評価データを用いて学習部45の学習状態を更新する。学習部45は、更新部47の出力(教師データ)に従って、識別関数のパラメータの変更を複数回行い、パラメータが変更された識別関数ごとに状態変数から制御条件(位置制御条件)を出力する。
更新部47は、蓄積部47aと、判定部47bとを備える。判定部47bは、評価データを判定して、判定結果を出力する。蓄積部47aは、評価データの判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部45は、蓄積部47aに蓄積された教師データに基づいて制御条件を学習する。
(2−4−5)決定部46
決定部46は、学習部45による学習の結果得られた学習済みモデルに基づいて、シャフト115の位置に相関する新規の状態変数から、シャフト115の位置制御を適切に行うための条件(位置制御条件)を決定して出力する。シャフト115の位置に相関する状態変数は、変位センサ31,32の出力値である。位置制御条件は、磁気軸受装置10を駆動するための情報である。本実施形態では、位置制御条件は、磁気軸受装置10を駆動するための電流又は電圧であり、具体的には、磁気軸受21,22のコイル65に印加される電圧(電圧指令値)である。
図9A及び図9Bは、学習済みモデルに基づいて新規の状態変数から位置制御条件を決定する時におけるデータの流れを表す。
図9Aでは、オンライン学習による教師あり学習が行われる。この場合、学習部45は、磁気軸受装置10の出荷又は設置前の試験運転時等に取得したデータ(状態変数)を用いて学習済みモデルを予め生成する。決定部46は、磁気軸受装置10の初回運転開始時には、学習部45が予め生成した学習済みモデルに基づいて、位置制御条件を決定する。その後、学習部45は、磁気軸受装置10の運転時に新たに取得したデータ(状態変数)を用いて学習済みモデルを更新する。決定部46は、学習部45が更新した学習済みモデルに基づいて、位置制御条件を決定する。このように、オンライン学習では、学習済みモデルが定期的に更新され、決定部46は、最新の学習済みモデルに基づいて、位置制御条件を決定する。
図9Bでは、バッチ学習による教師あり学習が行われる。この場合、学習部45は、磁気軸受装置10の出荷又は設置前の試験運転時等に取得したデータ(状態変数)を用いて学習済みモデルを予め生成する。決定部46は、磁気軸受装置10の運転時において、学習部45が予め生成した学習済みモデルに基づいて、位置制御条件を決定する。この学習済みモデルは、学習部45によって予め生成された後は更新されない。言い換えると、決定部46は、同じ学習済みモデルを用いて位置制御条件を決定する。
図9A及び図9Bに示される構成では、磁気軸受装置10が備える制御部40が、学習済みモデルを生成する。しかし、制御部40とインターネット等のコンピュータネットワークを介して接続されたサーバが、学習済みモデルを生成してもよく、また、クラウドコンピューティングのサービスを利用して、学習済みモデルを生成してもよい。
(2−4−6)教師あり学習
学習部45が用いる機械学習の手法である教師あり学習について説明する。教師あり学習は、教師データを用いて、未知の入力データに対応する出力を生成する手法である。教師あり学習では、学習データと識別関数とが用いられる。学習データとは、入力データと、それに対応する教師データとの対の集合である。入力データは、例えば、特徴空間における特徴ベクトルである。教師データは、例えば、入力データの識別、分類及び評価に関するパラメータである。識別関数は、入力データから、それに対応する出力への写像を表す。教師あり学習は、事前に与えられた学習データを用いて、識別関数の出力と教師データとの誤差が小さくなるように、識別関数のパラメータを調整する手法である。教師あり学習で用いられるモデル又はアルゴリズムとしては、回帰分析、時系列分析、決定木、サポートベクターマシン、ニューラルネットワーク、アンサンブル学習等が挙げられる。
回帰分析は、例えば、線形回帰分析、重回帰分析、ロジスティック回帰分析である。回帰分析は、最小二乗法等を用いて、入力データ(説明変数)と教師データ(目的変数)との間にモデルを当てはめる手法である。説明変数の次元は、線形回帰分析では1であり、重回帰分析では2以上である。ロジスティック回帰分析では、ロジスティック関数(シグモイド関数)がモデルとして用いられる。
時系列分析は、例えば、ARモデル(自己回帰モデル)、MAモデル(移動平均モデル)、ARMAモデル(自己回帰移動平均モデル)、ARIMAモデル(自己回帰和分移動平均モデル)、SARIMAモデル(季節自己回帰和分移動平均モデル)、VARモデル(ベクトル自己回帰モデル)である。AR、MA、ARMA、VARモデルは、定常過程を表し、ARIMA、SARIMAモデルは、非定常過程を表す。ARモデルは、時間の経過に対して規則的に値が変化するモデルである。MAモデルは、ある期間における変動が一定であるモデルである。例えば、MAモデルでは、ある時点の値は、その時点より前の移動平均によって決まる。ARMAモデルは、ARモデルとMAモデルとを組み合わせたモデルである。ARIMAモデルは、中長期的なトレンド(増加又は減少傾向)を考慮して、前後の値の差分についてARMAモデルを適用するモデルである。SARIMAモデルは、中長期的な季節変動を考慮して、ARIMAモデルを適用するモデルである。VARモデルは、ARモデルを多変量に拡張したモデルである。
決定木は、複数の識別器を組み合わせて複雑な識別境界を生成するためのモデルである。決定木の詳細については後述する。
サポートベクターマシンは、2クラスの線形識別関数を生成するアルゴリズムである。サポートベクターマシンの詳細については後述する。
ニューラルネットワークは、人間の脳神経系のニューロンをシナプスで結合して形成されたネットワークをモデル化したものである。ニューラルネットワークは、狭義には、誤差逆伝播法を用いた多層パーセプトロンを意味する。代表的なニューラルネットワークとしては、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)が挙げられる。CNNは、全結合していない(結合が疎である)順伝播型ニューラルネットワークの一種である。RNNは、有向閉路を持つニューラルネットワークの一種である。CNN及びRNNは、音声・画像・動画認識、及び、自然言語処理に用いられる。
アンサンブル学習は、複数のモデルを組み合わせて識別性能を向上させる手法である。アンサンブル学習が用いる手法は、例えば、バギング、ブースティング、ランダムフォレストである。バギングは、学習データのブートストラップサンプルを用いて複数のモデルを学習させ、新規の入力データの評価を、複数のモデルによる多数決によって決する手法である。ブースティングは、バギングの学習結果に応じて学習データに重み付けをして、誤って識別された学習データを、正しく識別された学習データよりも集中的に学習させる手法である。ランダムフォレストは、モデルとして決定木を用いる場合において、相関が低い複数の決定木からなる決定木群(ランダムフォレスト)を生成する手法である。ランダムフォレストの詳細については後述する。
本実施形態では、学習部45が用いる教師あり学習の好ましいモデル又はアルゴリズムとして、次に説明する、ニューラルネットワーク、サポートベクターマシン、決定木、及び、ランダムフォレストが用いられる。
(2−4−6−1)ニューラルネットワーク
図10は、ニューラルネットワークのニューロンのモデルの模式図である。図11は、図10に示されるニューロンを組み合わせて構成した三層のニューラルネットワークの模式図である。図10に示されるように、ニューロンは、複数の入力x(図10では入力x1,x2,x3)に対する出力yを出力する。各入力x(図10では入力x1,x2,x3)には、対応する重みw(図10では重みw1,w2,w3)が乗算される。ニューロンは、次の式(1)を用いて出力yを出力する。
Figure 2020148329
式(1)において、入力x、出力y及び重みwは、すべてベクトルであり、θは、バイアスであり、φは、活性化関数である。活性化関数は、非線形関数であり、例えば、ステップ関数(形式ニューロン)、単純パーセプトロン、シグモイド関数又はReLU(ランプ関数)である。
図11に示される三層のニューラルネットワークでは、入力側(図11の左側)から複数の入力ベクトルx(図11では入力ベクトルx1,x2,x3)が入力され、出力側(図11の右側)から複数の出力ベクトルy(図11では出力ベクトルy1,y2,y3)が出力される。このニューラルネットワークは、3つの層L1,L2,L3から構成される。
第1の層L1では、入力ベクトルx1,x2,x3は、3つのニューロンN11,N12,N13のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW1と表記されている。ニューロンN11,N12,N13は、それぞれ、特徴ベクトルz11,z12,z13を出力する。
第2の層L2では、特徴ベクトルz11,z12,z13は、2つのニューロンN21,N22のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW2と表記されている。ニューロンN21,N22は、それぞれ、特徴ベクトルz21,z22を出力する。
第3の層L3では、特徴ベクトルz21,z22は、3つのニューロンN31,N32,N33のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW3と表記されている。ニューロンN31,N32,N33は、それぞれ、出力ベクトルy1,y2,y3を出力する。
ニューラルネットワークの動作には、学習モードと予測モードとがある。学習モードでは、学習データセットを用いて重みW1,W2,W3を学習する。予測モードでは、学習した重みW1,W2,W3のパラメータを用いて識別等の予測を行う。
重みW1,W2,W3は、例えば、誤差逆伝播法(バックプロパゲーション)により学習可能である。この場合、誤差に関する情報は、出力側から入力側に向かって、言い換えると、図11において右側から左側に向かって伝達される。誤差逆伝播法は、各ニューロンにおいて、入力xが入力されたときの出力yと、真の出力y(教師データ)との差を小さくするように、重みW1,W2,W3を調整して学習する手法である。
ニューラルネットワークは、3層より多い層を有するように構成することができる。4層以上のニューラルネットワークによる機械学習の手法は、ディープラーニング(深層学習)として知られている。
(2−4−6−2)サポートベクターマシン
サポートベクターマシン(SVM)とは、最大マージンを実現する2クラス線形識別関数を求めるアルゴリズムである。図12は、SVMを説明するための図である。2クラス線形識別関数とは、図12に示される特徴空間において、2つのクラスC1,C2の学習データを線形分離するための超平面である識別超平面P1,P2を表す。図12において、クラスC1の学習データは円で示され、クラスC2の学習データは正方形で示されている。識別超平面のマージンとは、識別超平面に最も近い学習データと、識別超平面との間の距離である。図12には、識別超平面P1のマージンd1、及び、識別超平面P2のマージンd2が示されている。SVMでは、マージンが最大となるような識別超平面である最適識別超平面P1が求められる。一方のクラスC1の学習データと最適識別超平面P1との間の距離の最小値d1は、他方のクラスC2の学習データと最適識別超平面P2との間の距離の最小値d1と等しい。
図12において、2クラス問題の教師あり学習に用いられる学習データセットDを以下の式(2)で表す。
Figure 2020148329
学習データセットDは、学習データ(特徴ベクトル)xと、教師データt={−1,+1}との対の集合である。学習データセットDの要素数は、Nである。教師データtは、学習データxがクラスC1,C2のどちらに属するのかを表す。クラスC1はt=−1のクラスであり、クラスC2はt=+1のクラスである。
図12において、全ての学習データxで成り立つ、正規化された線形識別関数は、以下の2つの式(3−1)及び(3−2)で表される。wは係数ベクトルであり、bはバイアスである。
Figure 2020148329
これらの2つの式は、以下の1つの式(4)で表される。
Figure 2020148329
識別超平面P1,P2を以下の式(5)で表す場合、そのマージンdは、式(6)で表される。
Figure 2020148329
式(6)において、ρ(w)は、クラスC1,C2のそれぞれの学習データxを識別超平面P1,P2の法線ベクトルw上に射影した長さの差の最小値を表す。式(6)の「min」及び「max」の項は、それぞれ、図12において符号「min」及び符号「max」で示された点である。図12において、最適識別超平面は、マージンdが最大となる識別超平面P1である。
図12は、2クラスの学習データが線形分離可能である特徴空間を表す。図13は、図12と同様の特徴空間であって、2クラスの学習データが線形分離不可能である特徴空間を表す。2クラスの学習データが線形分離不可能である場合、式(4)にスラック変数ξを導入して拡張した次の式(7)を用いることができる。
Figure 2020148329
スラック変数ξは、学習時のみに使用され、0以上の値をとる。図13には、識別超平面P3と、マージン境界B1,B2と、マージンd3とが示されている。識別超平面P3の式は式(5)と同じである。マージン境界B1,B2は、識別超平面P3からの距離がマージンd3である超平面である。
スラック変数ξが0の場合、式(7)は式(4)と等価である。このとき、図13において白抜きの円又は正方形で示されるように、式(7)を満たす学習データxは、マージンd3内で正しく識別される。このとき、学習データxと識別超平面P3との間の距離は、マージンd3以上である。
スラック変数ξが0より大きく1以下の場合、図13においてハッチングされた円又は正方形で示されるように、式(7)を満たす学習データxは、マージン境界B1,B2を超えているが、識別超平面P3を超えておらず、正しく識別される。このとき、学習データxと識別超平面P3との間の距離は、マージンd3未満である。
スラック変数ξが1より大きい場合、図13において黒塗りの円又は正方形で示されるように、式(7)を満たす学習データxは、識別超平面P3を超えており、誤認識される。
このように、スラック変数ξを導入した式(7)を用いることで、2クラスの学習データが線形分離不可能である場合においても、学習データxを識別することができる。
上述の説明から、全ての学習データxのスラック変数ξの和は、誤認識される学習データxの数の上限を表す。ここで、評価関数Lを次の式(8)で定義する。
Figure 2020148329
学習部45は、評価関数Lの出力値を最小化する解(w、ξ)を求める。式(8)において、第2項のパラメータCは、誤認識に対するペナルティの強さを表す。パラメータCが大きいほど、wのノルム(第1項)よりも誤認識数(第2項)を小さくする方を優先する解が求められる。
(2−4−6−3)決定木
決定木とは、複数の識別器を組み合わせて複雑な識別境界(非線形識別関数等)を得るためのモデルである。識別器とは、例えば、ある特徴軸の値と閾値との大小関係に関する規則である。学習データから決定木を構成する方法としては、例えば、特徴空間を2分割する規則(識別器)を求めることを繰り返す分割統治法がある。図14は、分割統治法によって構成された決定木の一例である。図15は、図14の決定木によって分割される特徴空間を表す。図15では、学習データは白丸又は黒丸で示され、図14に示される決定木によって、各学習データは、白丸のクラス又は黒丸のクラスに分類される。図14には、1から11までの番号が付されたノードと、ノード間を結びYes又はNoのラベルが付されたリンクとが示されている。図14において、終端ノード(葉ノード)は、四角で示され、非終端ノード(根ノード及び内部ノード)は、丸で示されている。終端ノードは、6から11までの番号が付されたノードであり、非終端ノードは、1から5までの番号が付されたノードである。各終端ノードには、学習データを表す白丸又は黒丸が示されている。各非終端ノードには、識別器が付されている。識別器は、特徴軸x、xの値と閾値a〜eとの大小関係を判断する規則である。リンクに付されたラベルは、識別器の判断結果を示す。図15において、識別器は点線で示され、識別器によって分割された領域には、対応するノードの番号が付されている。
分割統治法によって適切な決定木を構成する過程では、以下の(a)〜(c)の3点について検討する必要がある。
(a)識別器を構成するための特徴軸及び閾値の選択。
(b)終端ノードの決定。例えば、1つの終端ノードに含まれる学習データが属するクラスの数。又は、決定木の剪定(根ノードが同じ部分木を得ること)をどこまで行うかの選択。
(c)終端ノードに対する多数決によるクラスの割り当て。
決定木の学習方法には、例えば、CART、ID3及びC4.5が用いられる。CARTは、図14及び図15に示されるように、終端ノード以外の各ノードにおいて特徴空間を特徴軸ごとに2分割することで、決定木として2分木を生成する手法である。
決定木を用いる学習では、学習データの識別性能を向上させるために、非終端ノードにおいて特徴空間を最適な分割候補点で分割することが重要である。特徴空間の分割候補点を評価するパラメータとして、不純度とよばれる評価関数が用いられてもよい。ノードtの不純度を表す関数I(t)としては、例えば、以下の式(9−1)〜(9−3)で表されるパラメータが用いられる。Kは、クラスの数である。
(a)ノードtにおける誤り率
Figure 2020148329
(b)交差エントロピー(逸脱度)
Figure 2020148329
(c)ジニ係数
Figure 2020148329
上式において、確率P(C|t)は、ノードtにおけるクラスCの事後確率であり、言い換えると、ノードtにおいてクラスCのデータが選ばれる確率である。式(9−3)の第2式において、確率P(C|t)は、クラスCのデータがj(≠i)番目のクラスに間違われる確率であるので、第2式は、ノードtにおける誤り率を表す。式(9−3)の第3式は、全てのクラスに関する確率P(C|t)の分散の和を表す。
不純度を評価関数としてノードを分割する場合、例えば、当該ノードにおける誤り率、及び、決定木の複雑さで決まる許容範囲まで、決定木を剪定する手法が用いられる。
(2−4−6−4)ランダムフォレスト
ランダムフォレストは、アンサンブル学習の一種であって、複数の決定木を組み合わせて識別性能を強化する手法である。ランダムフォレストを用いる学習では、相関が低い複数の決定木からなる群(ランダムフォレスト)が生成される。ランダムフォレストの生成及び識別には、以下のアルゴリズムが用いられる。
(1)m=1からMまで以下を繰り返す。
(a)N個のd次元学習データから、m個のブートストラップサンプルZを生成する。
(b)Zを学習データとして、以下の手順で各ノードtを分割して、m個の決定木を生成する。
(i)d個の特徴からd´個の特徴をランダムに選択する。(d´<d)
(ii)選択されたd´個の特徴の中から、学習データの最適な分割を与える特徴と分割点(閾値)を求める。
(iii)求めた分割点でノードtを2分割する。
(2)m個の決定木からなるランダムフォレストを出力する。
(3)入力データに対して、ランダムフォレストの各決定木の識別結果を得る。ランダムフォレストの識別結果は、各決定木の識別結果の多数決によって決定される。
ランダムフォレストを用いる学習では、決定木の各非終端ノードにおいて識別に用いる特徴をあらかじめ決められた数だけランダムに選択することで、決定木間の相関を低くすることができる。
(2−4−7)強化学習
学習部45が用いる機械学習の手法である強化学習について説明する。強化学習は、一連の行動の結果としての報酬が最大となるような方策を学習する手法である。強化学習で用いられるモデル又はアルゴリズムは、Q学習(Q−learning)等がある。Q学習は、状態sの下で行動aを選択する価値を表すQ値を学習する手法である。Q学習では、Q値が最も高い行動aが最適な行動として選択される。高いQ値を求めるため、行動aの主体(エージェント)には、状態sの下で選択した行動aに対して報酬が与えられる。Q学習では、エージェントが行動するたびに、以下の式(10)を用いて、Q値が更新される。
Figure 2020148329
式(10)において、Q(st,at)は、状態stのエージェントが行動atを選択する価値を表すQ値である。Q(st,at)は、状態sと行動aとをパラメータとする関数(行動価値関数)である。stは、時刻tにおけるエージェントの状態である。atは、時刻tにおけるエージェントの行動である。αは、学習係数である。αは、式(10)によってQ値が最適な値に収束するように設定される。rt+1は、エージェントが状態st+1に遷移したときに得る報酬である。γは、割引率である。γは、0以上1以下の定数である。maxを含む項は、環境st+1の下で、最もQ値が高い行動aを選択した場合のQ値にγを掛けたものである。行動価値関数によって求められるQ値は、エージェントが得る報酬の期待値である。
図16は、Q学習による強化学習を行う制御部40のブロック構成図である。制御部40は、主として、状態変数取得部143と、学習部145と、決定部146とを有する。状態変数取得部143及び決定部146は、それぞれ、図9A及び図9Bに示される状態変数取得部43及び決定部46と同じ機能を有する。学習部145は、報酬条件設定部145aと、報酬計算部145bと、関数更新部145cとを有する。報酬条件設定部145aは、報酬条件を設定する。報酬計算部145bは、状態変数取得部143が取得した状態変数、及び、報酬条件設定部145aが設定した報酬条件に基づいて、報酬を計算する。関数更新部145cは、報酬計算部145bが計算した報酬に基づいて、行動価値関数を更新する。行動価値関数は、状態変数取得部143が取得した状態変数の下で所定の行動を選択する価値であるQ値を求める関数である。関数更新部145cは、例えば、式(10)を用いて、行動価値関数を更新する。関数更新部145cは、最適化された行動価値関数を学習済みモデルとして出力する。このように、学習部145は、状態変数に基づいて、行動価値関数のパラメータを調整して行動価値関数を更新することで、報酬が最大となる方策を学習して、学習済みモデルを生成する。学習部145は、報酬を用いて、オンライン学習による強化学習を行う。
(2−4−8)機械学習のその他の手法
学習部45は、種種の機械学習の手法を用い得る。学習部45が用い得る機械学習の手法は、既に説明した教師あり学習及び強化学習の他に、教師なし学習、半教師あり学習、トランスダクティブ学習、マルチタスク学習及び転移学習等がある。学習部45は、これらの手法を組み合わせて用いてもよい。
教師なし学習は、教師データを用いずに、所定の統計的性質に基づいて入力データをグループ分け(クラスタリング)する手法である。教師なし学習で用いられるモデル又はアルゴリズムとしては、k平均法(k−means法)、ウォード法(Ward法)、主成分分析等がある。k平均法は、各入力データにランダムにクラスタを割り当て、各クラスタの中心を計算し、各入力データを最も近い中心のクラスタに割り当て直す工程を繰り返す手法である。ウォード法は、クラスタの各入力データからクラスタの質量中心までの距離を最小化するように、各入力データをクラスタに割り当て直す工程を繰り返す手法である。主成分分析は、相関のある複数の変数から、相関の最も小さい主成分と呼ばれる変数を生成する多変量解析の手法である。
半教師あり学習は、対応する教師データが付かない入力データ(ラベルなしデータ)と、対応する教師データ付きの入力データ(ラベルありデータ)との両方を用いて学習する手法である。
トランスダクティブ学習は、半教師あり学習において、学習に用いられるラベルなしデータに対応する出力を生成し、未知の入力データに対応する出力を生成しない手法である。
マルチタスク学習は、複数の関連するタスク同士の情報を共有して、これらのタスクを同時に学習させることで、タスクに共通の要因を獲得してタスクの予測精度を上げる手法である。
転移学習は、あるドメインで予め学習させたモデルを、別のドメインに適応することで予測精度を上げる手法である。
(2−4−9)学習で使用されるデータ
本実施形態において、制御部40が機械学習の手法を用いて学習済みモデルを生成するために使用するデータについて説明する。
制御部40が教師あり学習の手法を用いる場合、制御部40は、状態変数、評価データ及び制御条件の各データを使用する。
状態変数は、シャフト115の位置に相関する少なくとも1つのパラメータを含む。本実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する。
評価データは、シャフト115の位置の目標値からの偏差に相関する少なくとも1つのパラメータを含む。本実施形態では、評価データ取得部44は、評価データとして、シャフト115の位置の検出値と、シャフト115の位置の目標値との差であるシャフト位置偏差を取得する。検出値とは、変位センサ31,32の出力値から換算された値である。目標値とは、シャフト115の可動範囲の中心位置である。
制御条件は、学習部45によって学習され、シャフト115の位置制御を適切に行うための条件である。本実施形態では、学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。決定部46は、制御条件として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
また、制御部40が、強化学習の手法を用いる場合、制御部40は、状態変数及び報酬条件を使用する。状態変数は、制御部40が教師あり学習の手法を用いる場合に使用される状態変数と同じである。制御部40は、所定の報酬条件に基づいて、シャフト位置偏差から報酬を計算する。本実施形態では、シャフト位置偏差が小さい場合には、報酬が増え、シャフト位置偏差が大きい場合には、報酬が減るか又は変化しないように、報酬条件が設定される。報酬条件は、例えば、評価データに基づいて報酬を算出するための条件である。
(3)効果
本実施形態の空気調和装置100が備える磁気軸受装置10は、磁気軸受のコイルに印加される電圧(電圧指令値)等を調整して、磁気浮上しているシャフト115の位置制御システムを備える。従来の位置制御システムは、予め定められた制御規則に基づいて、電圧指令値等を調整する。この場合、装置の品質のバラツキ、及び、システムの経時変化等によって適切な電圧指令値が得られず、シャフトの浮上制御の安定性が低下したり、浮上中に大きな外乱力が発生した場合にシャフトがタッチダウン軸受に接触したりするおそれがある。
本実施形態の磁気軸受装置10では、学習機能を有する制御部40が、シャフト115の位置に相関する状態変数と、シャフト115の位置に関する評価データとに基づいて、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習の手法を用いて学習する。変位センサ31,32は、比較的短い時間間隔(例えば40μ秒ごと)でシャフト115の位置を検出するので、制御部40は、シャフト115の位置制御を、比較的短い時間間隔で行うことができる。そのため、制御部40は、シャフト115の位置制御の安定性を長期間にわたって維持することができる。これにより、磁気軸受装置10の品質のバラツキ、及び、システムの経時変化等による、シャフト115の浮上制御の安定性の低下、及び、外乱力によるシャフト115とタッチダウン軸受116,117との接触の発生を抑制することができる。
―第2実施形態―
第1実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する。変位センサ31,32の出力値は、シャフト115の位置に相関するパラメータである。
本実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値以外のパラメータであって、シャフト115の位置に相関するパラメータを取得する。そのため、本実施形態は、変位センサ31,32を有さないセンサレスタイプの磁気軸受装置に適用することができる。
具体的には、状態変数取得部43は、状態変数として、シャフト115の位置の推定に必要な種種の情報を取得する。シャフト115の位置の推定に必要な情報は、磁気軸受21,22の電磁石の電流検出値、電圧検出値、磁束検出値、電流指令値及び電圧指令値の少なくとも2つを含む。電流検出値は、電磁石のコイル65に流れている電流の検出値である。電圧検出値は、電磁石のコイル65に印加されている電圧の検出値である。磁束検出値は、電磁石のコイル65から発生する磁界の検出値である。磁束検出値は、例えば、非接触型の磁気センサであるホールセンサの出力値である。電流指令値は、制御部40によって制御され、電磁石のコイル65に入力される電流値である。電圧指令値は、制御部40によって制御され、電磁石のコイル65に入力される電圧値である。
シャフト115の位置の推定に必要な情報として、例えば、次の(a)〜(c)の情報が挙げられる。
(a)電圧指令値と電流検出値
(b)電流指令値と電圧検出値
(c)電流検出値と磁束検出値
情報(a)を用いる場合、状態変数取得部43は、電圧指令値を入力し、電流検出値を取得することで、シャフト115の位置を推定する。
情報(b)を用いる場合、状態変数取得部43は、電流指令値を入力し、電圧検出値を取得することで、シャフト115の位置を推定する。
情報(a)及び(b)を用いる場合、状態変数取得部43は、コイル65の電流(又は電流微分値)及び電圧がシャフト115の位置に相関する性質を利用することで、シャフト115の位置を推定する。電流又は電圧は、正弦波状に入力されてもよく、ステップ状に入力されてもよい。
情報(c)を用いる場合、状態変数取得部43は、電流検出値及び磁束検出値がシャフト115の位置に相関する性質を利用することで、シャフト115の位置を推定する。
評価データ取得部44は、評価データとして、状態変数から換算したシャフト115の位置の推定値と、シャフト115の位置の目標値との差であるシャフト位置偏差を取得する。
学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。
決定部46は、制御条件として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
―第3実施形態―
第1及び第2実施形態では、図7に示される従来の制御部940の代わりに、学習機能を有する制御部40が用いられている。言い換えると、第1及び第2実施形態は、図7に示される位置検出部941、位置制御部942及び電流制御部943の全ての機能が学習機能を有する構成に関する。
しかし、図7に示される位置検出部941、位置制御部942及び電流制御部943のうちの一部の機能のみが学習機能を有してもよい。以下に説明する第3〜第5実施形態は、従来の制御部940の位置検出部941、位置制御部942及び電流制御部943のうちの1つの機能のみが学習機能を有する構成に関する。
本実施形態は、従来の制御部940の位置検出部941のみが学習機能を有する構成に関する。図17は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図17に示されるように、図7の位置検出部941に相当するブロックが、学習機能を有する学習制御部340に置き換えられている。学習制御部340は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部340は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
第1及び第2実施形態では、評価データ取得部44は、判定データとして、シャフト115の位置の目標値(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)を用いる。
本実施形態では、評価データ取得部44は、判定データとして、位置指令値及び位置検出値の代わりに、シャフト115の位置に相関するパラメータ(相関パラメータ)の目標値、及び、相関パラメータの検出値を用いる。相関パラメータとしては、第1及び第2実施形態において状態変数取得部43が取得した状態変数が用いられる。例えば、評価データ取得部44は、相関パラメータとして、第1実施形態で説明した変位センサ31,32の出力値を用いてもよく、第2実施形態で説明したシャフト115の位置の推定に必要な情報を用いてもよい。
評価データ取得部44は、判定データを用いて、例えば、相関パラメータの目標値を基準にした場合の相関パラメータの検出値の偏差(相関パラメータ偏差)を評価データとして取得する。
学習部45は、相関パラメータ偏差を小さくするための制御条件を学習する。
決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、位置検出値を決定する。
本実施形態では、学習部45は、特定の時点において位置制御条件を学習してもよい。特定の時点とは、相関パラメータに基づいて、シャフト115の位置を特定又は推定することができる時点である。具体的には、特定の時点とは、シャフト115の位置に一定の制約がある時点、又は、シャフト115に加わる力が既知である時点である。シャフト115の位置に一定の制約がある時点とは、例えば、シャフト115がタッチダウン軸受116,117に接触している時点である。シャフト115に加わる力が既知である時点とは、例えば、シャフト115が自由落下している時点である。
本実施形態では、評価データ取得部44は、評価データとして、相関パラメータ偏差の代わりに、シャフト115の位置の真値を取得してもよい。シャフト115の位置の真値として、判定データに含まれる位置検出値が用いられてもよい。なお、上述の「特定の時点」において特定又は推定されたシャフト115の位置が、シャフト115の位置の真値として用いられてもよい。
―第4実施形態―
本実施形態は、従来の制御部940の位置制御部942のみが学習機能を有する構成に関する。図18は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図18に示されるように、図7の位置制御部942に相当するブロックが、学習機能を有する学習制御部440に置き換えられている。学習制御部440は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部440は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
本実施形態では、状態変数取得部43は、状態変数として、シャフト115の位置の目標値(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)を用いる。
評価データ取得部44は、判定データとして、位置指令値及び位置検出値を用いる。評価データ取得部44は、評価データとして、位置指令値と位置検出値との差であるシャフト位置偏差を取得する。
学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。
決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
―第5実施形態―
本実施形態は、従来の制御部940の電流制御部943のみが学習機能を有する構成に関する。図19は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図19に示されるように、図7の電流制御部943に相当するブロックが、学習機能を有する学習制御部540に置き換えられている。学習制御部540は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部540は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
本実施形態では、状態変数取得部43は、状態変数として、磁気軸受21,22の電磁石のコイル65を流れる電流(電流指令値)、及び、シャフト115の位置の検出値(位置検出値)を取得する。
評価データ取得部44は、判定データとして、電流指令値及び位置検出値を用いる。評価データ取得部44は、評価データとして、電流制御の応答性に関する量(応答レベル)を取得する。応答レベルは、ゼロに近いほど好ましいパラメータである。応答レベルは、例えば、電流指令値を基準にした場合の電流検出値の偏差の絶対値、二乗平均平方根(RMS)又は二乗平均(MS)であってもよく、強制的に外乱を加えた場合の当該偏差のオーバーシュート量又は整定時間であってもよい。
学習部45は、応答レベルを小さくするための制御条件を学習する。
決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)を決定する。
―変形例―
以下、第1〜第5実施形態の少なくとも一部の変形例について説明する。
(1)変形例A
本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22を駆動するための電流値に相関するパラメータをさらに用いる。評価データ取得部44は、評価データとして、磁気軸受21,22を駆動するための電流値をさらに取得する。更新部47は、磁気軸受21,22を駆動するための電流値を所定値以下にするように学習部45を学習させる。所定値とは、具体的には、磁気軸受21,22を駆動するためのインバータの許容電流値である。本変形例は、インバータの仕様が決まっている場合において、インバータの故障の発生を抑制することができる。
(2)変形例B
本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22を駆動するためのインバータの温度に相関するパラメータをさらに用いる。評価データ取得部44は、評価データとして、磁気軸受21,22を駆動するためのインバータの温度をさらに取得する。更新部47は、インバータの温度を所定値以下にするように学習部45を学習させる。所定値とは、具体的には、インバータの許容温度である。本変形例は、インバータの仕様が決まっている場合において、インバータの故障の発生を抑制することができる。
(3)変形例C
本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、磁気軸受21,22が電圧型インバータによって駆動される場合において磁気軸受21,22の電磁石の電流検出値をさらに取得し、磁気軸受21,22が電流型インバータによって駆動される場合において磁気軸受21,22の電磁石の電圧検出値をさらに取得する。
(4)変形例D
本変形例は、変形例Cにおいて、評価データ取得部44は、判定データとして、電流指令値及び位置検出値をさらに用いる。評価データ取得部44は、評価データとして、電流制御の応答性に関する量(応答レベル)をさらに取得する。応答レベルは、ゼロに近いほど好ましいパラメータである。応答レベルは、例えば、電流指令値を基準にした場合の電流検出値の偏差の絶対値、二乗平均平方根(RMS)又は二乗平均(MS)であってもよく、強制的に外乱を加えた場合の当該偏差のオーバーシュート量又は整定時間であってもよい。更新部47は、応答レベルを小さくするように学習部45を学習させる。
(5)変形例E
本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、シャフト115の回転数をさらに取得する。
(6)変形例F
本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータをさらに取得する。
空気調和装置100の運転条件とは、空気調和装置100の冷凍能力、及び、凝縮器120の入口水温度の所定の範囲である。入口水温度とは、空気調和装置100の冷媒回路190を循環する冷媒と熱交換される媒体である水の温度であって、凝縮器120に流入する時の水の温度である。図20は、空気調和装置100の運転条件の一例である。空気調和装置100の冷凍能力の単位は、冷凍トンである。凝縮器120の入口水温度の単位は、華氏度である。図20においてハッチングされた領域が、空気調和装置100の運転条件であり、空気調和装置100による空気調和が実現可能な範囲である。
空気調和装置100の運転条件に相関するパラメータは、具体的には、以下に列挙する空気調和装置100の運転情報に関するデータである。
(a)圧縮機110に吸入される冷媒の温度
(b)圧縮機110から吐出される冷媒の温度
(c)圧縮機110に吸入される冷媒の圧力
(d)圧縮機110から吐出される冷媒の圧力
(e)冷媒回路190を循環する冷媒の流量
(f)凝縮器120に流入する水の温度
(g)凝縮器120から流出する水の温度
(h)蒸発器140に流入する水の温度
(i)蒸発器140から流出する水の温度
(j)インレットガイドベーン113bの開度
(k)電動機114の回転数
(l)電動機114の回転角度
(m)電動機114のトルク
(n)電動機114の電流値
パラメータ(f)〜(i)の「水」は、凝縮器120又は蒸発器140において冷媒と熱交換される媒体である水を意味する。空気調和装置100の運転条件に相関するパラメータは、上記のパラメータ(a)〜(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
本変形例では、制御部40は、空気調和装置100の運転条件ごとに最適な制御条件を学習することができる。
(7)変形例G
本変形例は、変形例Fにおいて、状態変数取得部43は、状態変数として、シャフト115に付与される電磁力に相関する少なくとも1つのパラメータをさらに取得する。
シャフト115に付与される電磁力に相関するパラメータは、空気調和装置100の冷媒負荷に相関するパラメータ、及び、空気調和装置100の物理特性に相関するパラメータの少なくとも1つを含む。
空気調和装置100の冷媒負荷に相関するパラメータとは、変形例Fにおいて列挙されたパラメータ(a)〜(n)の少なくとも1つを含む。空気調和装置100の冷媒負荷に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
空気調和装置100の物理特性に相関するパラメータとは、シャフト115の重量、及び、シャフト115に作用する力の少なくとも1つである。シャフト115に作用する力とは、シャフト115に作用するコリオリ力、及び、シャフト115に作用する遠心力の少なくとも1つである。シャフト115に作用する力の代わりに、シャフト115の偏心の量に相関するパラメータ、及び、電動機114の回転数の少なくとも1つが用いられてもよい。
本変形例では、空気調和装置100の運転中におけるシャフト115の回転軸の移動を抑制することができる。
(8)変形例H
本変形例は、変形例Fにおいて、状態変数取得部43は、状態変数として、磁気軸受21,22の特性に相関する少なくとも1つのパラメータをさらに取得する。
磁気軸受21,22の特性に相関するパラメータとは、磁気軸受21,22の電磁石のコイル65のインダクタンスに相関するパラメータ、及び、コイル65の抵抗に相関するパラメータの少なくとも1つを含む。コイル65のインダクタンスに相関するパラメータとは、例えば、コイル65を流れる電流の検出値である。コイル65の抵抗に相関するパラメータとは、コイル65の温度、又は、コイル65の周囲の温度に相関するパラメータであり、具体的には、変形例Fにおいて列挙されたパラメータ(a)〜(i)の少なくとも1つを含む。コイル65の抵抗に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
本変形例では、空気調和装置100の運転中におけるシャフト115の回転軸の移動を抑制することができる。
(9)変形例I
本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22の消費電力に相関するパラメータをさらに用いる。
磁気軸受21,22の消費電力に相関するパラメータとは、磁気軸受21,22を駆動するための電流値に相関するパラメータ、磁気軸受21,22を駆動するための電圧値に相関するパラメータ、及び、磁気軸受21,22の電磁石のコイル65の抵抗に相関するパラメータのうちの少なくとも2つを含む。磁気軸受21,22を駆動するための電流値に相関するパラメータとは、例えば、コイル65を流れる電流の検出値である。コイル65の抵抗に相関するパラメータとは、コイル65の温度、又は、コイル65の周囲の温度に相関するパラメータであり、具体的には、変形例Fにおいて列挙されたパラメータ(a)〜(i)の少なくとも1つを含む。コイル65の抵抗に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
評価データ取得部44は、評価データとして、磁気軸受21,22の消費電力をさらに取得する。
更新部47は、磁気軸受21,22の消費電力を小さくするように学習部45を学習させる。
本変形例では、制御部40は、空気調和装置100の消費電力を抑制することができる制御条件を学習することができる。
(10)変形例J
本変形例は、変形例A,B,Iにおいて、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータをさらに取得する。空気調和装置100の運転条件に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
(11)変形例K
本変形例は、第1、第2、第4及び第5実施形態において、評価データ取得部44は、判定データとして、電動機114によって駆動される圧縮機110に供給される入力エネルギーに相関する少なくとも1つのパラメータをさらに用いる。入力エネルギーに相関するパラメータとは、磁気軸受21,22の入力電流、磁気軸受21,22の入力電力、磁気軸受21,22を駆動するためのインバータの入力電流、磁気軸受21,22を駆動するためのインバータの入力電力、電動機114の入力電流、電動機114の入力電力、電動機114を駆動するためのインバータの入力電流、及び、電動機114を駆動するためのインバータの入力電力の少なくとも1つを含む。評価データ取得部44は、評価データとして、圧縮機110に供給される入力エネルギーをさらに取得する。
更新部47は、圧縮機110に供給される入力エネルギーを小さくように学習部45を学習させる。
本変形例では、制御部40は、圧縮機110に供給される入力エネルギーが最小となる制御条件を学習することができる。
(12)変形例L
本変形例は、変形例Jにおいて、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータ、及び、シャフト115に連結される羽根車113aの断熱効率に相関する少なくとも1つのパラメータの少なくとも1つをさらに取得する。
空気調和装置100の運転条件に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
羽根車113aの断熱効率に相関するパラメータとは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも1つを含む。冷媒の圧力に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(e)の少なくとも1つを含む。冷媒の圧力に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。冷媒の温度に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(i)の少なくとも1つを含む。冷媒の温度に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
本変形例では、制御部40は、羽根車113aの断熱効率が最大となる制御条件を学習することができる。
(13)変形例M
本変形例では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する場合に、変位センサ31,32の温度に相関するパラメータをさらに取得する。変位センサ31,32の温度に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(i)の少なくとも1つを含む。冷媒の温度に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
本変形例では、制御部40は、温度特性を有する変位センサ31,32の温度に関する情報を状態変数として用いることで、温度による変位センサ31,32の検出値のズレを補償することができる。そのため、制御部40は、タッチダウン軸受116,117の位置の推定値を高い精度で取得して、タッチダウン軸受116,117の中心にシャフト115の回転軸が近付くように、シャフト115の位置合わせを行うことができる。
(14)変形例N
本変形例では、第1、第2、第4及び第5実施形態において、磁気軸受装置10の運転開始時等に、変位センサ31,32のキャリブレーションが行われる。キャリブレーションによって、例えば、変位センサ31,32の異常を検出することができる。
変位センサ31,32のキャリブレーションは、例えば、シャフト115の位置、磁気軸受21,22の電磁石のコイル65の電流値、及び、コイル65の電圧値等のパラメータを強制的に変化させて行われる。この場合、これらのパラメータに周期波形を重畳させてもよく、これらのパラメータをステップ状に変化させてもよく、これらのパラメータをランプ状に変化させてもよい。周期波形は、例えば、正弦波、矩形波、三角波及び鋸波である。周期波形の周波数は、断続的に変化させてもよく、連続的に変化させてもよい。
また、変位センサ31,32のキャリブレーションは、シャフト115の位置指令値と、所定の波形による摂動とを重畳させて行われてもよい。所定の波形とは、例えば、周期波形、パルス波形及びステップ波形である。周期波形は、例えば、正弦波、矩形波、三角波及び鋸波である。
また、変位センサ31,32のキャリブレーションは、シャフト115の位置に一定の制約を設けることで行われてもよい。例えば、シャフト115をタッチダウン軸受116,117に接触させる動作、及び、シャフト115に作用する力が既知である動作が行われてもよい。シャフト115に作用する力が既知である動作とは、例えば、シャフト115が自由落下しているときの動作である。
(15)変形例O
上記の各実施形態及び各変形例では、制御部40は、教師あり学習又は強化学習の手法を用いて、シャフト115の位置制御を適切に行うための条件を学習する。しかし、制御部40は、教師あり学習と強化学習とを組み合わせた手法を用いて、シャフト115の位置制御を適切に行うための条件を学習してもよい。
(16)変形例P
上記の各実施形態及び各変形例では、ラジアル磁気軸受21は、ベアリングレスモータ(シャフトを非接触で支持する機能を有する電動機)の支持機構を用いてもよい。
―むすび―
以上、本開示の実施形態を説明したが、特許請求の範囲に記載された本開示の趣旨及び範囲から逸脱することなく、形態や詳細の多様な変更が可能なことが理解されるであろう。
磁気軸受装置は、被支持体の位置の制御を適切に行うことができる。
10 磁気軸受装置
21 ラジアル磁気軸受(磁気軸受)
22 スラスト磁気軸受(磁気軸受)
31 ラジアル変位センサ(変位センサ)
32 スラスト変位センサ(変位センサ)
43 状態変数取得部
44 評価データ取得部
45 学習部
46 決定部
47 更新部
47a 蓄積部
47b 判定部
51 第1電磁石(電磁石)
52 第2電磁石(電磁石)
53 第3電磁石(電磁石)
54 第4電磁石(電磁石)
100 空気調和装置(冷凍装置)
110 圧縮機
113a 羽根車(インペラ)
115 シャフト
120 凝縮器
130 膨張機構
140 蒸発器
190 冷媒回路
実開平04−040308号公報
機械学習装置、及び、それを備える磁気軸受装置
従来、複数の電磁石の合成電磁力によりシャフト等の被支持体を非接触で支持する磁気軸受装置が知られている。特許文献1(実開平04−040308号公報)には、被支持体の位置をセンサにより検出し、検出信号に基づいて電磁石の電磁力を制御して被支持体の位置を所定の位置に保持する構成が開示されている。
磁気軸受装置の製品ごとのバラツキ、及び、磁気軸受装置の経時変化等によって、被支持体の位置の制御が適切に行われなくなる課題がある。
第1観点の機械学習装置は、磁気軸受装置の制御条件を学習する。磁気軸受装置は、シャフトに電磁力を付与する複数の電磁石を有する磁気軸受を備える。機械学習装置は、学習部と、状態変数取得部と、評価データ取得部と、更新部とを備える。状態変数取得部は、シャフトの位置に相関する少なくとも1つのパラメータを含む状態変数を取得する。評価データ取得部は、シャフトの位置の測定値、シャフトの位置の目標値、及び、目標値からの偏差に相関するパラメータのうちの少なくとも1つのパラメータを含む評価データを取得する。更新部は、評価データを用いて学習部の学習状態を更新する。学習部は、更新部の出力に従って、制御条件を学習する。状態変数は、冷凍装置の運転条件に相関する少なくとも1つのパラメータをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。状態変数は、第1パラメータ、第2パラメータ及び第3パラメータのいずれか1つである。第1パラメータは、シャフトの位置に応じた信号を出力する変位センサの出力値を少なくとも含む。第2パラメータは、電磁石の電流値及び電圧値、又は、電磁石の電流値及び磁束を少なくとも含む。第3パラメータは、シャフトの位置の検出値、及び、シャフトの位置の指令値を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも1つを制御条件として学習する。
観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、第1パラメータである。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。
観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、第2パラメータである。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。
観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、第1パラメータ又は第2パラメータである。更新部は、磁気軸受を駆動するための電流値を所定の許容値以下にするように学習部をさらに学習させる。
観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、第1パラメータ又は第2パラメータである。評価データは、磁気軸受を駆動するインバータの温度に相関するパラメータをさらに含む。更新部は、インバータの温度を所定の許容値以下にするように学習部をさらに学習させる。
観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、磁気軸受が電圧型インバータによって駆動される場合には電磁石の電流検出値をさらに含み、磁気軸受が電流型インバータによって駆動される場合には電磁石の電圧検出値をさらに含む。
観点の機械学習装置は、第観点の機械学習装置であって、更新部は、電流値の制御の応答性に相関する値を小さくするために学習部をさらに学習させる。
観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、シャフトの回転数をさらに含む。
観点の機械学習装置は、第観点の機械学習装置であって、状態変数は、シャフトに付与される電磁力に相関する少なくとも1つのパラメータをさらに含む。電磁力に相関するパラメータは、冷凍装置の冷媒負荷に相関するパラメータ、及び、冷凍装置の物理特性に相関するパラメータの少なくとも1つを含む。
10観点の機械学習装置は、第観点の機械学習装置であって、状態変数は、磁気軸受の特性に相関する少なくとも1つのパラメータをさらに含む。磁気軸受の特性に相関するパラメータは、電磁石のコイルのインダクタンスに相関するパラメータ、及び、電磁石のコイルの抵抗に相関するパラメータの少なくとも1つを含む。
11観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、第1パラメータ又は第2パラメータである。評価データは、磁気軸受の消費電力に相関するパラメータをさらに含む。更新部は、消費電力を小さくするために学習部をさらに学習させる。消費電力に相関するパラメータは、磁気軸受を駆動するための電流値、磁気軸受を駆動するための電圧値、及び、電磁石のコイルの抵抗のうちの少なくとも2つを含む。
12観点の機械学習装置は、第1観点の機械学習装置であって、評価データは、電動機によって駆動される圧縮機に供給される入力エネルギーに相関する少なくとも1つのパラメータをさらに含む。更新部は、入力エネルギーを小さくするために学習部をさらに学習させる。
13観点の機械学習装置は、第12観点の機械学習装置であって、状態変数はシャフトに連結されるインペラの断熱効率に相関する少なくとも1つのパラメータの少なくとも1つをさらに含むインペラの断熱効率に相関するパラメータは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも1つを含む。
14観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、第1パラメータである。状態変数は、変位センサの温度に相関するパラメータをさらに含む。
15観点の機械学習装置は、第1乃至第14観点のいずれか1つの機械学習装置であって、更新部は、評価データに基づいて報酬を算出する。学習部は、報酬を用いて学習する。
16観点の機械学習装置は、第1乃至第14観点のいずれか1つの機械学習装置であって、学習部は、更新部の出力に従って、関数のパラメータの変更を複数回行い、パラメータが変更された関数ごとに状態変数から制御条件を出力する。更新部は、蓄積部と、判定部とを備える。判定部は、評価データを判定して、判定結果を出力する。蓄積部は、判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部は、蓄積部に蓄積された教師データに基づいて学習する。
17観点の機械学習装置は、第1乃至第16観点のいずれか1つの機械学習装置であって、学習部が学習した結果得られた学習済みモデルに基づいて、制御条件を出力する。
18観点の磁気軸受装置は、第17観点の機械学習装置を備える。
第1実施形態に係る磁気軸受装置10を備える空気調和装置100の全体構成図である。 圧縮機110の縦断面図である。 ラジアル磁気軸受21の横断面図である。 ラジアル磁気軸受21の縦断面図である。 スラスト磁気軸受22の平面図である。 スラスト磁気軸受22の縦断面図である。 比較のための参考図であって、シャフト115の位置制御システムのブロック構成図である。 第1実施形態における、シャフト115の位置制御システムのブロック構成図である。 教師あり学習を行う制御部40のブロック構成図である。 教師あり学習を行う制御部40のブロック構成図である。 ニューラルネットワークのニューロンのモデルの模式図である。 図10に示されるニューロンを組み合わせて構成した三層のニューラルネットワークの模式図である。 サポートベクターマシンを説明するための図である。2クラスの学習データが線形分離可能である特徴空間を表す。 2クラスの学習データが線形分離不可能である特徴空間を表す。 分割統治法によって構成された決定木の一例である。 図14の決定木によって分割される特徴空間を表す。 Q学習による強化学習を行う制御部40のブロック構成図である。 第3実施形態における、シャフト115の位置制御システムのブロック構成図である。 第4実施形態における、シャフト115の位置制御システムのブロック構成図である。 第5実施形態における、シャフト115の位置制御システムのブロック構成図である。 変形例Fにおける空気調和装置100の運転条件の一例である。
―第1実施形態―
第1実施形態に係る磁気軸受装置10を備える空気調和装置100について、図面を参照しながら説明する。
(1)空気調和装置100の全体構成
図1は、空気調和装置100の全体構成図である。空気調和装置100は、冷媒回路190を備える。冷媒回路190は、冷媒が充填された閉回路である。冷媒回路190には、圧縮機110、凝縮器120、膨張弁130、蒸発器140、及び、電動機冷却制御装置150が設けられている。圧縮機110には、種々の圧縮機を採用できる。本実施形態では、圧縮機110は、ターボ圧縮機である。圧縮機110は、電動機114によって駆動される。電動機114には、電動機制御装置160から電力が供給される。
凝縮器120及び蒸発器140は、水冷媒熱交換器である。膨張弁130は、例えば、電子膨張弁である。冷媒回路190には、冷媒圧力を検出するセンサ、及び、冷媒温度を検出するセンサ等が設けられている。
図2は、圧縮機110の縦断面図である。圧縮機110は、主として、ケーシング112と、圧縮機構113と、電動機114と、シャフト115と、ラジアルタッチダウン軸受116と、スラストタッチダウン軸受117と、磁気軸受装置10とを備える。
ケーシング112は、両端が閉塞された円筒形状を有する。ケーシング112は、その円筒形状の円筒軸が水平方向に平行となるように配置される。ケーシング112内の空間は、壁部112aによって区画される。図2において、壁部112aよりも右側の空間は、圧縮機構113を収容する圧縮機構室S1である。図2において、壁部112aよりも左側の空間は、電動機114を収容する電動機室S2である。ケーシング112内の空間には、水平方向に延びるシャフト115が配置される。シャフト115は、圧縮機構113と電動機114とを連結している。
圧縮機構113は、流体を圧縮する。流体とは、本実施形態では、冷媒回路190に充填されている冷媒である。圧縮機構113は、主として、羽根車113aと、インレットガイドベーン113bとを備える。羽根車113aは、複数の羽根によって外形が略円錐形状となるように構成されている。羽根車113aは、シャフト115の一方の端部に固定されている。インレットガイドベーン113bは、圧縮機構113の流体の吸入口に設けられる。インレットガイドベーン113bは、流体の吸入量を制御するための弁である。
電動機114は、シャフト115を回転駆動する。電動機114は、主として、固定子114aと、回転子114bとを有する。固定子114aは、円筒形状に形成され、ケーシング112内に固定されている。回転子114bは、円柱形状に形成され、固定子114aの内側に回転可能に設置されている。回転子114bの中心部には、シャフト115が固定される軸孔が形成されている。シャフト115の端部には、円盤部115aが固定されている。円盤部115aは、羽根車113aが固定されていない方の端部に固定されている。
電動機制御装置160は、電動機114に供給する電力を制御して、電動機114の起動、停止、及び、回転速度の制御を行う。電動機制御装置160は、主として、コンバータ回路、インバータ回路、及び、マイクロコンピュータを備える。これらは、制御基板160a上に実装されている。マイクロコンピュータは、インバータ回路が有するスイッチング素子のスイッチング動作を制御する。そのため、マイクロコンピュータには、電動機114の回転速度、及び、電動機114の電流値の情報等が入力される。制御基板160aには、スイッチング素子の保護等の目的で温度センサが設けられている。マイクロコンピュータは、インバータ回路の制御の際に、その温度センサの検出値を利用する。
圧縮機110は、凝縮器120内の冷媒を電動機114の内部に流すことで電動機114を冷却する。電動機冷却制御装置150は、電動の開閉弁150aと、温度センサ150bとを有する。電動機冷却制御装置150は、温度センサ150bの検出値に応じて、開閉弁150aを制御し、凝縮器120から電動機114に流入する冷媒の流量を制御する。これにより、冷媒回路190では、電動機114の温度を所定温度範囲に維持することができる。電動機114は、開閉弁150aを介して凝縮器120に配管接続されている。電動機114は、蒸発器140にも配管接続されている。電動機114内を流れて電動機114を冷却した冷媒は、蒸発器140に戻されている。温度センサ150bは、電動機114と蒸発器140とを連結する配管に取り付けられている。
圧縮機110は、ラジアルタッチダウン軸受116及びスラストタッチダウン軸受117の2種類のタッチダウン軸受を有する。ラジアルタッチダウン軸受116は、磁気軸受装置10が非通電であるとき、言い換えると、シャフト115が磁気浮上していないときに、シャフト115を支持する。
(2)磁気軸受装置10の詳細構成
磁気軸受装置10は、被支持体であるシャフト115を磁気浮上させることで、シャフト115を非接触で回転可能に支持する。磁気軸受装置10は、主として、1つ又は複数(本実施形態では3つ)の磁気軸受21,22と、1つ又は複数(本実施形態では5つ)の変位センサ31,32と、制御部40とを備える。
(2−1)磁気軸受21,22
磁気軸受21,22は、被支持体を挟んで互いに対向する電磁石対を有する。磁気軸受21,22は、電磁石対の合成電磁力により被支持体を非接触に支持するように構成されている。磁気軸受21,22では、電磁石対に流れる電流を制御することにより、その電磁石対の合成電磁力を制御して、その電磁石対の対向方向における被支持体の位置を制御することができる。本実施形態では、磁気軸受装置10は、磁気軸受21,22として、2つのラジアル磁気軸受21と、1つのスラスト磁気軸受22とを備える。
(2−1−1)ラジアル磁気軸受21
図3は、ラジアル磁気軸受21の横断面図である。図4は、ラジアル磁気軸受21の縦断面図である。図3及び図4に示されるように、ラジアル磁気軸受21は、第1〜第4電磁石51〜54を有し、ヘテロポーラ型のラジアル磁気軸受を構成している。第1及び第2電磁石51,52は、シャフト115を挟んで互いに対向し、第1及び第2電磁石51,52の電磁力F1,F2によりシャフト115を非接触に支持する。第3及び第4電磁石53,54は、シャフト115を挟んで互いに対向し、第3及び第4電磁石53,54の電磁力F3,F4によりシャフト115を非接触に支持する。第3及び第4電磁石53,54の対向方向は、平面視において、第1及び第2電磁石51,52の対向方向と直交している。
図3では、ラジアル磁気軸受21は、磁気軸受コア61と、8つのコイル65とを備える。磁気軸受コア61は、例えば、複数の電磁鋼板が積層されて構成され、バックヨーク62と8つのティース63とを有する。バックヨーク62は、円筒状に形成されている。8つのティース63は、バックヨーク62の内周面に沿うように所定間隔(本実施形態では45°間隔)で周方向に配列される。ティース63は、バックヨーク62の内周面から径方向内側に突出する。ティース63の内周面(突端面)は、シャフト115の外周面と所定のギャップを隔てて対向する。
8つのコイル65は、磁気軸受コア61の8つのティース63にそれぞれ巻回されている。これにより、8つの電磁石部71〜78が形成される。図3では、第1電磁石部71、第2電磁石部72、第7電磁石部77、第8電磁石部78、第3電磁石部73、第4電磁石部74、第5電磁石部75及び第6電磁石部76が、時計回り方向に順に配列されている。第1電磁石51は、第1電磁石部71及び第2電磁石部72を有する。第2電磁石52は、第3電磁石部73及び第4電磁石部74を有する。第3電磁石53は、第5電磁石部75及び第6電磁石部76を有する。第4電磁石54は、第7電磁石部77及び第8電磁石部78を有する。8つの電磁石部71〜78に流れる電流を制御して、第1〜第4電磁石51〜54の電磁力F1〜F4の合力である合成電磁力を制御することで、第1及び第2電磁石51,52の対向方向、及び、第3及び第4電磁石53,54の対向方向におけるシャフト115の位置を制御することができる。
コイル65の巻回方向、及び、コイル65に流れる電流の向きは、第1〜第4電磁石51〜54の各々に吸引力が発生するように設定されている。この場合、吸引力とは、シャフト115を引き寄せる方向に作用する電磁力である。具体的には、コイル65の巻回方向、及び、コイル65に流れる電流の向きは、図3に示されるループ状の矢印の方向に磁束が発生するように設定されている。
(2−1−2)スラスト磁気軸受22
図5は、スラスト磁気軸受22の平面図である。図6は、スラスト磁気軸受22の縦断面図である。図5及び図6に示されるように、スラスト磁気軸受22は、第1及び第2電磁石51,52を有している。第1及び第2電磁石51,52は、円盤部115aを水平方向に挟んで互いに対向し、第1及び第2電磁石51,52の電磁力F1,F2により円盤部115aを非接触に支持する。
具体的には、スラスト磁気軸受22は、2つの磁気軸受コア61と、2つのコイル65とを備える。2つの磁気軸受コア61は、それぞれが円環状に形成され、円盤部115aの軸方向両側に所定のギャップを隔てて配置されている。磁気軸受コア61の対向面には、円周溝が全周に亘って形成されている。2つのコイル65は、2つの磁気軸受コア61の円周溝にそれぞれ収容されている。これにより、第1及び第2電磁石51,52が構成されている。第1及び第2電磁石51,52に流れる電流を制御して、第1及び第2電磁石51,52の電磁力F1,F2の合力である合成電磁力を制御することで、第1及び第2電磁石51,52の対向方向(水平方向)における円盤部115aの位置(シャフト115の位置)を制御することができる。
コイル65の巻回方向、及び、コイル65に流れる電流の向きは、第1及び第2電磁石51,52の各々に吸引力が発生するように設定されている。この場合、吸引力とは、円盤部115aを引き寄せる方向に作用する電磁力である。具体的には、コイル65の巻回方向、及び、コイル65に流れる電流の向きは、図6に示されるループ状の矢印の方向に磁束が発生するように設定されている。
(2−2)変位センサ31,32
変位センサ31,32は、いずれも渦電流式の変位センサである。変位センサ31,32は、被支持体を挟んで互いに対向する電磁石対(第1及び第2電磁石51,52の組)に対応して設けられる。変位センサ31,32は、変位センサ31,32の基準位置に対する被支持体の変位量を検出する。変位センサ31,32の基準位置とは、例えば、変位センサ31,32のセンサヘッドの位置、又は、電磁石対の対向方向における中央位置である。電磁石対の対向方向における中央位置とは、例えば、第1電磁石51と第2電磁石52との間の中央位置である。本実施形態では、磁気軸受装置10は、変位センサ31,32として、ラジアル変位センサ31と、スラスト変位センサ32とを有する。
(2−2−1)ラジアル変位センサ31
ラジアル変位センサ31は、各ラジアル磁気軸受21に2つずつ設けられている。言い換えると、磁気軸受装置10は、4つのラジアル変位センサ31を備える。ラジアル変位センサ31は、ラジアル変位センサ31の基準位置に対する変位量を検出する。ラジアル変位センサ31の基準位置とは、例えば、ラジアル変位センサ31のセンサヘッドの位置、又は、シャフト115の中央位置である。各ラジアル磁気軸受21では、一方のラジアル変位センサ31が、ラジアル磁気軸受21の第1電磁石51と第2電磁石52との対向方向(X軸方向)の変位量を検出する。X軸方向は、ラジアル磁気軸受21の径方向である。他方のラジアル変位センサ31は、ラジアル磁気軸受21の第3電磁石53と第4電磁石54との対向方向(Y軸方向)の変位量を検出する。Y軸方向は、X軸方向と直交する、ラジアル磁気軸受21の径方向である。
ラジアル変位センサ31は、ラジアル変位センサ31の基準位置に対する変位量を所定の時間間隔で検出する。所定の時間間隔は、例えば、40μ秒である。
(2−2−2)スラスト変位センサ32
磁気軸受装置10は、1つのスラスト変位センサ32を備える。スラスト変位センサ32は、スラスト磁気軸受22の第1電磁石51と第2電磁石52との対向方向(Z軸方向)の変位量を検出する。Z軸方向は、シャフト115の回転軸に沿った方向である。スラスト変位センサ32は、スラスト変位センサ32の基準位置に対する変位量を検出する。スラスト変位センサ32の基準位置とは、例えば、スラスト変位センサ32のセンサヘッドの位置、又は、円盤部115aの中央位置である。
スラスト変位センサ32は、スラスト変位センサ32の基準位置に対する変位量を所定の時間間隔で検出する。所定の時間間隔は、例えば、40μ秒である。
(2−3)制御部40
制御部40は、被支持体(シャフト115及び円盤部115a)が非接触に支持されるように、1つ又は複数の磁気軸受21,22を制御する。制御部40は、各磁気軸受21,22の電磁力を制御することによって、被支持体の浮上制御を行う。制御部40は、具体的には、マイクロコンピュータと、それを動作させるためのソフトウェアを格納したメモリディバイス等から構成される。制御部40は、ラジアル制御部41と、スラスト制御部42とを有する。
(2−3−1)ラジアル制御部41
ラジアル制御部41は、2つのラジアル磁気軸受21によるシャフト115の浮上制御を行う。この浮上制御では、ラジアル制御部41は、X軸方向及びY軸方向のそれぞれにおけるシャフト115の位置制御を行う。具体的には、ラジアル制御部41は、X軸方向及びY軸方向の各方向について、ラジアル変位センサ31が検出した変位量に基づいて、シャフト115の位置と、予め定められた位置指令値との差分値がゼロに収束するように、ラジアル磁気軸受21の第1〜第4電磁石51〜54を構成するそれぞれのコイル65に電流(制御電流)を流す。ラジアル制御部41は、各コイル65に制御電流が流れるように、各コイル65に印加される電圧(電圧指令値)を出力する。
(2−3−2)スラスト制御部42
スラスト制御部42は、スラスト磁気軸受22による円盤部115aの浮上制御を行う。この浮上制御では、スラスト制御部42は、Z軸方向における円盤部115aの位置制御を行う。具体的には、スラスト制御部42は、Z軸方向について、スラスト変位センサ32が検出した変位量に基づいて、円盤部115aの位置と、予め定められた位置指令値との差分値がゼロに収束するように、スラスト磁気軸受22の第1及び第2電磁石51,52を構成するそれぞれのコイル65に電流(制御電流)を流す。スラスト制御部42は、各コイル65に制御電流が流れるように、各コイル65に印加される電圧(電圧指令値)を出力する。
(2−4)磁気軸受装置10の位置制御システム
磁気軸受装置10は、シャフト115の位置制御システムを有する。位置制御システムでは、制御部40は、各磁気軸受21,22の電磁力を制御することによって、非接触支持されているシャフト115の位置制御を行う。
次に、制御部40(ラジアル制御部41及びスラスト制御部42)が2つのラジアル磁気軸受21及び1つのスラスト磁気軸受22の電磁力を制御することで、シャフト115の位置制御を行う手法について説明する。シャフト115の位置制御では、シャフト115をZ軸に沿って見た場合に、X軸及びY軸を含むXY平面におけるシャフト115の可動限界領域の中心に、シャフト115の回転軸が位置するように、シャフト115の位置が制御される。シャフト115の可動限界領域は、シャフト115がラジアルタッチダウン軸受116と接触する位置より内側の領域である。具体的には、例えば、シャフト115の可動限界領域は、半径250μmの円形領域である。シャフト115の回転時において、例えば、シャフト115は、その回転軸から10μm以下の範囲を揺れ動く。シャフト115の可動許容領域は、例えば、半径83μmの円形領域である。シャフト115の可動許容領域は、シャフト115の回転時において、シャフト115が、その回転軸から離れて揺れ動くことが許容される範囲である。
本実施形態では、制御部40は、機械学習の手法を用いて、シャフト115の位置制御を行う。ここで、比較のために、機械学習の手法を用いない、従来の制御部の動作について説明する。図7は、比較のための参考図であって、従来の制御部940を含む、シャフト115の位置制御システムのブロック構成図である。制御部940は、主として、位置検出部941と、位置制御部942と、電流制御部943とを有する。図7には、制御対象装置50及び外部装置60が示されている。制御対象装置50及び外部装置60は、制御部940と情報を送受信する。制御対象装置50は、磁気軸受装置10が有する装置であって、具体的には、シャフト115、磁気軸受21,22及び変位センサ31,32である。外部装置60は、磁気軸受装置10以外の装置であって、空気調和装置100が有する装置である。外部装置60は、例えば、電動機冷却制御装置150である。
位置検出部941は、XY平面におけるシャフト115の位置を検出する。位置検出部941は、変位センサ31,32の出力値を受信する。変位センサ31,32の出力値は、シャフト115のX軸方向の位置、及び、シャフト115のY軸方向の位置を含む。位置検出部941は、空気調和装置100の運転に関する情報を外部装置60から受信する。位置検出部941は、変位センサ31,32から受信した出力値、及び、外部装置60から受信した情報(外部情報)に基づいて、シャフト115の位置に関する情報である位置検出値を出力する。
位置制御部942は、位置検出部941が検出したシャフト115の位置に関する情報、及び、外部情報に基づいて、シャフト115が可動許容領域内で回転するように、予め定められた制御規則に基づいて電流指令値を出力する。電流指令値は、磁気軸受21,22の電磁石のコイル65に入力される電流である。
電流制御部943は、位置制御部942が出力した電流指令値、磁気軸受21,22のコイル65を流れている電流の検出値、及び、外部情報に基づいて、磁気軸受21,22のコイル65に印加される電圧指令値を出力する。電圧指令値は、磁気軸受21,22のコイル65に印加される電圧である。
制御部940は、制御対象装置50及び外部装置60の出力値に基づいて、シャフト115が可動許容領域内で回転するように、予め定められた制御規則に基づいて電圧指令値を出力する。
次に、本実施形態の制御部40によるシャフト115の位置制御について説明する。図8は、本実施形態の制御部40を含む、シャフト115の位置制御システムのブロック構成図である。制御部40は、磁気軸受装置10の制御条件を学習する機械学習装置としての機能を有する。具体的には、制御部40は、機械学習の手法を用いて、シャフト115の位置制御を行う。より具体的には、制御部40は、制御対象装置50の出力値を用いて、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習又は強化学習の手法を用いて学習する。本実施形態では、制御対象装置50は、シャフト115、磁気軸受21,22及び変位センサ31,32の少なくとも一部である。制御部40は、位置制御条件の学習結果を用いて、新たな出力値について最適な位置制御条件を決定する。制御部40は、主として、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46と、更新部47とを有する。図9A及び図9Bは、教師あり学習を行う制御部40のブロック構成図である。
(2−4−1)状態変数取得部43
状態変数取得部43は、磁気軸受装置10の動作中に磁気軸受装置10の状態を観測して、観測された状態に関する情報を状態変数として取得する。言い換えると、状態変数取得部43は、磁気軸受装置10の状態が入力され、状態変数を出力する。状態変数は、シャフト115の位置に相関する少なくとも1つのパラメータを含む。本実施形態では、状態変数は、変位センサ31,32の出力値である。状態変数は、教師あり学習において教師データとして用いられる。
ここで、シャフト115の位置とは、シャフト115の回転軸(Z軸)回りの角度を除く5自由度を規制する座標値の少なくとも1つである。5自由度の一の例は、シャフト115の重心位置のX軸方向、Y軸方向及びZ軸方向のそれぞれの座標値、シャフト115のX軸回りの角度、及び、シャフト115のY軸回りの角度である。5自由度の他の例は、2つのラジアル磁気軸受21のそれぞれのX軸方向及びY軸方向の座標値、及び、2つのラジアル磁気軸受21の重心のZ軸方向の座標値である。具体例を挙げると、シャフト115の位置として、XY平面におけるシャフト115の重心位置が用いられてもよい。
(2−4−2)評価データ取得部44
評価データ取得部44は、判定データを評価して、評価データを取得する。評価データは、教師あり学習において教師データとして用いられる。評価データは、シャフト115の位置の測定値、シャフト115の位置の目標値、及び、シャフト115の位置の目標値からの偏差に相関するパラメータ、のうちの少なくとも1つのパラメータを含む。評価データ取得部44は、例えば、判定データを所定の評価関数に入力して、評価関数の出力値を評価データとして取得する。言い換えると、評価データ取得部44は、判定データが入力され、評価データを出力する。判定データは、例えば、シャフト115の位置制御の評価に用いることができるデータである。本実施形態では、判定データは、シャフト115の可動範囲の中心位置(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)である。位置指令値は、シャフト115の位置の目標値である。位置検出値は、例えば、変位センサ31,32の出力値から得られた、シャフト115の位置の検出値である。
この場合、制御部40は、位置検出値が位置指令値にできるだけ近くなるように、シャフト115の位置制御を行う。そのため、評価データ取得部44は、判定データを用いて、位置指令値を基準にした場合の位置検出値の偏差(シャフト位置偏差)を評価データとして取得する。シャフト位置偏差は、ゼロに近いほど好ましい。この場合、評価関数の入力値は位置指令値及び位置検出値であり、評価関数の出力値はシャフト位置偏差である。
評価関数は、シャフト位置偏差が所定範囲内であれば一定値と見なされる関数であってもよい。所定範囲とは、ゼロの近傍の範囲であり、一定値とは、ゼロである。言い換えると、シャフト115の位置制御の観点からは、シャフト位置偏差はゼロ近傍に留まればよく、ゼロに収束する必要はない。
シャフト位置偏差は、例えば、位置指令値と位置検出値との間の距離の絶対値である。しかし、シャフト位置偏差は、現在から過去の所定時点までにおける当該距離の二乗平均平方根(RMS)又は二乗平均(MS)でもよく、強制的に外乱を加えた場合の当該距離のオーバーシュート量又は整定時間でもよい。オーバーシュート量とは、位置検出値が位置指令値に近付く過程において、位置検出値が位置指令値を超えた(オーバーシュートした)場合に、位置指令値を超えた分の量である。整定時間とは、位置検出値が位置指令値に近付く過程において、位置検出値が、位置指令値の近傍の所定の許容範囲内に入り、かつ、以降はその許容範囲から出なくなる時点までの時間である。
(2−4−3)学習部45
学習部45は、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習又は強化学習の手法を用いて学習する。学習部45は、更新部47の出力に従って位置制御条件を学習する。次に、教師あり学習を用いる場合の学習部45の動作について説明する。
学習部45は、学習データとして、状態変数取得部43が予め取得した状態変数と、評価データ取得部44が予め取得した評価データとの対を用いる。本実施形態では、状態変数は、変位センサ31,32の出力値であり、評価データは、シャフト位置偏差である。学習部45が学習に使用する教師データは、状態変数と評価データとの対である。
学習部45は、更新部47の出力に従って、状態変数から評価データへの写像である識別関数のパラメータを調整することで、位置制御条件を学習する。学習部45による学習の目的は、新規の状態変数から正しい又は適切な評価データを得ることができるように、学習データを用いて識別関数のパラメータを調整することである。学習部45によってパラメータが十分に調整された識別関数は、学習済みモデルに相当する。
学習部45は、図9Aに示されるように、教師データの一部を学習データとして用いて識別関数のパラメータを調整し、残りをテストデータとして用いてもよい。テストデータとは、学習に使用されなかったデータであり、主に、学習済みモデルの性能評価に用いられるデータである。テストデータを用いることで、新規の状態変数から得られた評価データの性能を、テストデータに対する誤り確率という形式で予測することができる。予め取得したデータを学習データとテストデータとに分ける手法としては、ホールドアウト法、交差確認法、一つ抜き法(ジャックナイフ法)及びブートストラップ法等が用いられる。
また、学習部45による学習は、モデルが更新されるタイミングに応じて、オンライン学習とバッチ学習とに分類される。オンライン学習とは、モデルの更新に必要なデータを取得する度に、新たに取得したデータのみを用いて、従来のモデルを随時更新する手法である。バッチ学習とは、モデルの更新に必要なデータを全て揃えた後、所定のタイミングで、学習対象となるデータを全てまとめて一括で処理してモデルを生成する手法である。
(2−4−4)更新部47
更新部47は、評価データを用いて学習部45の学習状態を更新する。学習部45は、更新部47の出力(教師データ)に従って、識別関数のパラメータの変更を複数回行い、パラメータが変更された識別関数ごとに状態変数から制御条件(位置制御条件)を出力する。
更新部47は、蓄積部47aと、判定部47bとを備える。判定部47bは、評価データを判定して、判定結果を出力する。蓄積部47aは、評価データの判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部45は、蓄積部47aに蓄積された教師データに基づいて制御条件を学習する。
(2−4−5)決定部46
決定部46は、学習部45による学習の結果得られた学習済みモデルに基づいて、シャフト115の位置に相関する新規の状態変数から、シャフト115の位置制御を適切に行うための条件(位置制御条件)を決定して出力する。シャフト115の位置に相関する状態変数は、変位センサ31,32の出力値である。位置制御条件は、磁気軸受装置10を駆動するための情報である。本実施形態では、位置制御条件は、磁気軸受装置10を駆動するための電流又は電圧であり、具体的には、磁気軸受21,22のコイル65に印加される電圧(電圧指令値)である。
図9A及び図9Bは、学習済みモデルに基づいて新規の状態変数から位置制御条件を決定する時におけるデータの流れを表す。
図9Aでは、オンライン学習による教師あり学習が行われる。この場合、学習部45は、磁気軸受装置10の出荷又は設置前の試験運転時等に取得したデータ(状態変数)を用いて学習済みモデルを予め生成する。決定部46は、磁気軸受装置10の初回運転開始時には、学習部45が予め生成した学習済みモデルに基づいて、位置制御条件を決定する。その後、学習部45は、磁気軸受装置10の運転時に新たに取得したデータ(状態変数)を用いて学習済みモデルを更新する。決定部46は、学習部45が更新した学習済みモデルに基づいて、位置制御条件を決定する。このように、オンライン学習では、学習済みモデルが定期的に更新され、決定部46は、最新の学習済みモデルに基づいて、位置制御条件を決定する。
図9Bでは、バッチ学習による教師あり学習が行われる。この場合、学習部45は、磁気軸受装置10の出荷又は設置前の試験運転時等に取得したデータ(状態変数)を用いて学習済みモデルを予め生成する。決定部46は、磁気軸受装置10の運転時において、学習部45が予め生成した学習済みモデルに基づいて、位置制御条件を決定する。この学習済みモデルは、学習部45によって予め生成された後は更新されない。言い換えると、決定部46は、同じ学習済みモデルを用いて位置制御条件を決定する。
図9A及び図9Bに示される構成では、磁気軸受装置10が備える制御部40が、学習済みモデルを生成する。しかし、制御部40とインターネット等のコンピュータネットワークを介して接続されたサーバが、学習済みモデルを生成してもよく、また、クラウドコンピューティングのサービスを利用して、学習済みモデルを生成してもよい。
(2−4−6)教師あり学習
学習部45が用いる機械学習の手法である教師あり学習について説明する。教師あり学習は、教師データを用いて、未知の入力データに対応する出力を生成する手法である。教師あり学習では、学習データと識別関数とが用いられる。学習データとは、入力データと、それに対応する教師データとの対の集合である。入力データは、例えば、特徴空間における特徴ベクトルである。教師データは、例えば、入力データの識別、分類及び評価に関するパラメータである。識別関数は、入力データから、それに対応する出力への写像を表す。教師あり学習は、事前に与えられた学習データを用いて、識別関数の出力と教師データとの誤差が小さくなるように、識別関数のパラメータを調整する手法である。教師あり学習で用いられるモデル又はアルゴリズムとしては、回帰分析、時系列分析、決定木、サポートベクターマシン、ニューラルネットワーク、アンサンブル学習等が挙げられる。
回帰分析は、例えば、線形回帰分析、重回帰分析、ロジスティック回帰分析である。回帰分析は、最小二乗法等を用いて、入力データ(説明変数)と教師データ(目的変数)との間にモデルを当てはめる手法である。説明変数の次元は、線形回帰分析では1であり、重回帰分析では2以上である。ロジスティック回帰分析では、ロジスティック関数(シグモイド関数)がモデルとして用いられる。
時系列分析は、例えば、ARモデル(自己回帰モデル)、MAモデル(移動平均モデル)、ARMAモデル(自己回帰移動平均モデル)、ARIMAモデル(自己回帰和分移動平均モデル)、SARIMAモデル(季節自己回帰和分移動平均モデル)、VARモデル(ベクトル自己回帰モデル)である。AR、MA、ARMA、VARモデルは、定常過程を表し、ARIMA、SARIMAモデルは、非定常過程を表す。ARモデルは、時間の経過に対して規則的に値が変化するモデルである。MAモデルは、ある期間における変動が一定であるモデルである。例えば、MAモデルでは、ある時点の値は、その時点より前の移動平均によって決まる。ARMAモデルは、ARモデルとMAモデルとを組み合わせたモデルである。ARIMAモデルは、中長期的なトレンド(増加又は減少傾向)を考慮して、前後の値の差分についてARMAモデルを適用するモデルである。SARIMAモデルは、中長期的な季節変動を考慮して、ARIMAモデルを適用するモデルである。VARモデルは、ARモデルを多変量に拡張したモデルである。
決定木は、複数の識別器を組み合わせて複雑な識別境界を生成するためのモデルである。決定木の詳細については後述する。
サポートベクターマシンは、2クラスの線形識別関数を生成するアルゴリズムである。サポートベクターマシンの詳細については後述する。
ニューラルネットワークは、人間の脳神経系のニューロンをシナプスで結合して形成されたネットワークをモデル化したものである。ニューラルネットワークは、狭義には、誤差逆伝播法を用いた多層パーセプトロンを意味する。代表的なニューラルネットワークとしては、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)が挙げられる。CNNは、全結合していない(結合が疎である)順伝播型ニューラルネットワークの一種である。RNNは、有向閉路を持つニューラルネットワークの一種である。CNN及びRNNは、音声・画像・動画認識、及び、自然言語処理に用いられる。
アンサンブル学習は、複数のモデルを組み合わせて識別性能を向上させる手法である。アンサンブル学習が用いる手法は、例えば、バギング、ブースティング、ランダムフォレストである。バギングは、学習データのブートストラップサンプルを用いて複数のモデルを学習させ、新規の入力データの評価を、複数のモデルによる多数決によって決する手法である。ブースティングは、バギングの学習結果に応じて学習データに重み付けをして、誤って識別された学習データを、正しく識別された学習データよりも集中的に学習させる手法である。ランダムフォレストは、モデルとして決定木を用いる場合において、相関が低い複数の決定木からなる決定木群(ランダムフォレスト)を生成する手法である。ランダムフォレストの詳細については後述する。
本実施形態では、学習部45が用いる教師あり学習の好ましいモデル又はアルゴリズムとして、次に説明する、ニューラルネットワーク、サポートベクターマシン、決定木、及び、ランダムフォレストが用いられる。
(2−4−6−1)ニューラルネットワーク
図10は、ニューラルネットワークのニューロンのモデルの模式図である。図11は、図10に示されるニューロンを組み合わせて構成した三層のニューラルネットワークの模式図である。図10に示されるように、ニューロンは、複数の入力x(図10では入力x1,x2,x3)に対する出力yを出力する。各入力x(図10では入力x1,x2,x3)には、対応する重みw(図10では重みw1,w2,w3)が乗算される。ニューロンは、次の式(1)を用いて出力yを出力する。
Figure 2020148329


式(1)において、入力x、出力y及び重みwは、すべてベクトルであり、θは、バイアスであり、φは、活性化関数である。活性化関数は、非線形関数であり、例えば、ステップ関数(形式ニューロン)、単純パーセプトロン、シグモイド関数又はReLU(ランプ関数)である。
図11に示される三層のニューラルネットワークでは、入力側(図11の左側)から複数の入力ベクトルx(図11では入力ベクトルx1,x2,x3)が入力され、出力側(図11の右側)から複数の出力ベクトルy(図11では出力ベクトルy1,y2,y3)が出力される。このニューラルネットワークは、3つの層L1,L2,L3から構成される。
第1の層L1では、入力ベクトルx1,x2,x3は、3つのニューロンN11,N12,N13のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW1と表記されている。ニューロンN11,N12,N13は、それぞれ、特徴ベクトルz11,z12,z13を出力する。
第2の層L2では、特徴ベクトルz11,z12,z13は、2つのニューロンN21,N22のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW2と表記されている。ニューロンN21,N22は、それぞれ、特徴ベクトルz21,z22を出力する。
第3の層L3では、特徴ベクトルz21,z22は、3つのニューロンN31,N32,N33のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW3と表記されている。ニューロンN31,N32,N33は、それぞれ、出力ベクトルy1,y2,y3を出力する。
ニューラルネットワークの動作には、学習モードと予測モードとがある。学習モードでは、学習データセットを用いて重みW1,W2,W3を学習する。予測モードでは、学習した重みW1,W2,W3のパラメータを用いて識別等の予測を行う。
重みW1,W2,W3は、例えば、誤差逆伝播法(バックプロパゲーション)により学習可能である。この場合、誤差に関する情報は、出力側から入力側に向かって、言い換えると、図11において右側から左側に向かって伝達される。誤差逆伝播法は、各ニューロンにおいて、入力xが入力されたときの出力yと、真の出力y(教師データ)との差を小さくするように、重みW1,W2,W3を調整して学習する手法である。
ニューラルネットワークは、3層より多い層を有するように構成することができる。4層以上のニューラルネットワークによる機械学習の手法は、ディープラーニング(深層学習)として知られている。
(2−4−6−2)サポートベクターマシン
サポートベクターマシン(SVM)とは、最大マージンを実現する2クラス線形識別関数を求めるアルゴリズムである。図12は、SVMを説明するための図である。2クラス線形識別関数とは、図12に示される特徴空間において、2つのクラスC1,C2の学習データを線形分離するための超平面である識別超平面P1,P2を表す。図12において、クラスC1の学習データは円で示され、クラスC2の学習データは正方形で示されている。識別超平面のマージンとは、識別超平面に最も近い学習データと、識別超平面との間の距離である。図12には、識別超平面P1のマージンd1、及び、識別超平面P2のマージンd2が示されている。SVMでは、マージンが最大となるような識別超平面である最適識別超平面P1が求められる。一方のクラスC1の学習データと最適識別超平面P1との間の距離の最小値d1は、他方のクラスC2の学習データと最適識別超平面P2との間の距離の最小値d1と等しい。
図12において、2クラス問題の教師あり学習に用いられる学習データセットDを以下の式(2)で表す。
Figure 2020148329

学習データセットDは、学習データ(特徴ベクトル)xと、教師データt={−1,+1}との対の集合である。学習データセットDの要素数は、Nである。教師データtは、学習データxがクラスC1,C2のどちらに属するのかを表す。クラスC1はt=−1のクラスであり、クラスC2はt=+1のクラスである。
図12において、全ての学習データxで成り立つ、正規化された線形識別関数は、以下の2つの式(3−1)及び(3−2)で表される。wは係数ベクトルであり、bはバイアスである。
Figure 2020148329

これらの2つの式は、以下の1つの式(4)で表される。
Figure 2020148329

識別超平面P1,P2を以下の式(5)で表す場合、そのマージンdは、式(6)で表される。
Figure 2020148329

式(6)において、ρ(w)は、クラスC1,C2のそれぞれの学習データxを識別超平面P1,P2の法線ベクトルw上に射影した長さの差の最小値を表す。式(6)の「min」及び「max」の項は、それぞれ、図12において符号「min」及び符号「max」で示された点である。図12において、最適識別超平面は、マージンdが最大となる識別超平面P1である。
図12は、2クラスの学習データが線形分離可能である特徴空間を表す。図13は、図12と同様の特徴空間であって、2クラスの学習データが線形分離不可能である特徴空間を表す。2クラスの学習データが線形分離不可能である場合、式(4)にスラック変数ξを導入して拡張した次の式(7)を用いることができる。
Figure 2020148329

スラック変数ξは、学習時のみに使用され、0以上の値をとる。図13には、識別超平面P3と、マージン境界B1,B2と、マージンd3とが示されている。識別超平面P3の式は式(5)と同じである。マージン境界B1,B2は、識別超平面P3からの距離がマージンd3である超平面である。
スラック変数ξが0の場合、式(7)は式(4)と等価である。このとき、図13において白抜きの円又は正方形で示されるように、式(7)を満たす学習データxは、マージンd3内で正しく識別される。このとき、学習データxと識別超平面P3との間の距離は、マージンd3以上である。
スラック変数ξが0より大きく1以下の場合、図13においてハッチングされた円又は正方形で示されるように、式(7)を満たす学習データxは、マージン境界B1,B2を超えているが、識別超平面P3を超えておらず、正しく識別される。このとき、学習データxと識別超平面P3との間の距離は、マージンd3未満である。
スラック変数ξが1より大きい場合、図13において黒塗りの円又は正方形で示されるように、式(7)を満たす学習データxは、識別超平面P3を超えており、誤認識される。
このように、スラック変数ξを導入した式(7)を用いることで、2クラスの学習データが線形分離不可能である場合においても、学習データxを識別することができる。
上述の説明から、全ての学習データxのスラック変数ξの和は、誤認識される学習データxの数の上限を表す。ここで、評価関数Lを次の式(8)で定義する。
Figure 2020148329

学習部45は、評価関数Lの出力値を最小化する解(w、ξ)を求める。式(8)において、第2項のパラメータCは、誤認識に対するペナルティの強さを表す。パラメータCが大きいほど、wのノルム(第1項)よりも誤認識数(第2項)を小さくする方を優先する解が求められる。
(2−4−6−3)決定木
決定木とは、複数の識別器を組み合わせて複雑な識別境界(非線形識別関数等)を得るためのモデルである。識別器とは、例えば、ある特徴軸の値と閾値との大小関係に関する規則である。学習データから決定木を構成する方法としては、例えば、特徴空間を2分割する規則(識別器)を求めることを繰り返す分割統治法がある。図14は、分割統治法によって構成された決定木の一例である。図15は、図14の決定木によって分割される特徴空間を表す。図15では、学習データは白丸又は黒丸で示され、図14に示される決定木によって、各学習データは、白丸のクラス又は黒丸のクラスに分類される。図14には、1から11までの番号が付されたノードと、ノード間を結びYes又はNoのラベルが付されたリンクとが示されている。図14において、終端ノード(葉ノード)は、四角で示され、非終端ノード(根ノード及び内部ノード)は、丸で示されている。終端ノードは、6から11までの番号が付されたノードであり、非終端ノードは、1から5までの番号が付されたノードである。各終端ノードには、学習データを表す白丸又は黒丸が示されている。各非終端ノードには、識別器が付されている。識別器は、特徴軸x、xの値と閾値a〜eとの大小関係を判断する規則である。リンクに付されたラベルは、識別器の判断結果を示す。図15において、識別器は点線で示され、識別器によって分割された領域には、対応するノードの番号が付されている。
分割統治法によって適切な決定木を構成する過程では、以下の(a)〜(c)の3点について検討する必要がある。
(a)識別器を構成するための特徴軸及び閾値の選択。
(b)終端ノードの決定。例えば、1つの終端ノードに含まれる学習データが属するクラスの数。又は、決定木の剪定(根ノードが同じ部分木を得ること)をどこまで行うかの選択。
(c)終端ノードに対する多数決によるクラスの割り当て。
決定木の学習方法には、例えば、CART、ID3及びC4.5が用いられる。CARTは、図14及び図15に示されるように、終端ノード以外の各ノードにおいて特徴空間を特徴軸ごとに2分割することで、決定木として2分木を生成する手法である。
決定木を用いる学習では、学習データの識別性能を向上させるために、非終端ノードにおいて特徴空間を最適な分割候補点で分割することが重要である。特徴空間の分割候補点を評価するパラメータとして、不純度とよばれる評価関数が用いられてもよい。ノードtの不純度を表す関数I(t)としては、例えば、以下の式(9−1)〜(9−3)で表されるパラメータが用いられる。Kは、クラスの数である。
(a)ノードtにおける誤り率
Figure 2020148329

(b)交差エントロピー(逸脱度)
Figure 2020148329

(c)ジニ係数
Figure 2020148329

上式において、確率P(C|t)は、ノードtにおけるクラスCの事後確率であり、言い換えると、ノードtにおいてクラスCのデータが選ばれる確率である。式(9−3)の第2式において、確率P(C|t)は、クラスCのデータがj(≠i)番目のクラスに間違われる確率であるので、第2式は、ノードtにおける誤り率を表す。式(9−3)の第3式は、全てのクラスに関する確率P(C|t)の分散の和を表す。
不純度を評価関数としてノードを分割する場合、例えば、当該ノードにおける誤り率、及び、決定木の複雑さで決まる許容範囲まで、決定木を剪定する手法が用いられる。
(2−4−6−4)ランダムフォレスト
ランダムフォレストは、アンサンブル学習の一種であって、複数の決定木を組み合わせて識別性能を強化する手法である。ランダムフォレストを用いる学習では、相関が低い複数の決定木からなる群(ランダムフォレスト)が生成される。ランダムフォレストの生成及び識別には、以下のアルゴリズムが用いられる。
(1)m=1からMまで以下を繰り返す。
(a)N個のd次元学習データから、m個のブートストラップサンプルZを生成する。
(b)Zを学習データとして、以下の手順で各ノードtを分割して、m個の決定木を生成する。
(i)d個の特徴からd´個の特徴をランダムに選択する。(d´<d)
(ii)選択されたd´個の特徴の中から、学習データの最適な分割を与える特徴と分割点(閾値)を求める。
(iii)求めた分割点でノードtを2分割する。
(2)m個の決定木からなるランダムフォレストを出力する。
(3)入力データに対して、ランダムフォレストの各決定木の識別結果を得る。ランダムフォレストの識別結果は、各決定木の識別結果の多数決によって決定される。
ランダムフォレストを用いる学習では、決定木の各非終端ノードにおいて識別に用いる特徴をあらかじめ決められた数だけランダムに選択することで、決定木間の相関を低くすることができる。
(2−4−7)強化学習
学習部45が用いる機械学習の手法である強化学習について説明する。強化学習は、一連の行動の結果としての報酬が最大となるような方策を学習する手法である。強化学習で用いられるモデル又はアルゴリズムは、Q学習(Q−learning)等がある。Q学習は、状態sの下で行動aを選択する価値を表すQ値を学習する手法である。Q学習では、Q値が最も高い行動aが最適な行動として選択される。高いQ値を求めるため、行動aの主体(エージェント)には、状態sの下で選択した行動aに対して報酬が与えられる。Q学習では、エージェントが行動するたびに、以下の式(10)を用いて、Q値が更新される。
Figure 2020148329

式(10)において、Q(st,at)は、状態stのエージェントが行動atを選択する価値を表すQ値である。Q(st,at)は、状態sと行動aとをパラメータとする関数(行動価値関数)である。stは、時刻tにおけるエージェントの状態である。atは、時刻tにおけるエージェントの行動である。αは、学習係数である。αは、式(10)によってQ値が最適な値に収束するように設定される。rt+1は、エージェントが状態st+1に遷移したときに得る報酬である。γは、割引率である。γは、0以上1以下の定数である。maxを含む項は、環境st+1の下で、最もQ値が高い行動aを選択した場合のQ値にγを掛けたものである。行動価値関数によって求められるQ値は、エージェントが得る報酬の期待値である。
図16は、Q学習による強化学習を行う制御部40のブロック構成図である。制御部40は、主として、状態変数取得部143と、学習部145と、決定部146とを有する。状態変数取得部143及び決定部146は、それぞれ、図9A及び図9Bに示される状態変数取得部43及び決定部46と同じ機能を有する。学習部145は、報酬条件設定部145aと、報酬計算部145bと、関数更新部145cとを有する。報酬条件設定部145aは、報酬条件を設定する。報酬計算部145bは、状態変数取得部143が取得した状態変数、及び、報酬条件設定部145aが設定した報酬条件に基づいて、報酬を計算する。関数更新部145cは、報酬計算部145bが計算した報酬に基づいて、行動価値関数を更新する。行動価値関数は、状態変数取得部143が取得した状態変数の下で所定の行動を選択する価値であるQ値を求める関数である。関数更新部145cは、例えば、式(10)を用いて、行動価値関数を更新する。関数更新部145cは、最適化された行動価値関数を学習済みモデルとして出力する。このように、学習部145は、状態変数に基づいて、行動価値関数のパラメータを調整して行動価値関数を更新することで、報酬が最大となる方策を学習して、学習済みモデルを生成する。学習部145は、報酬を用いて、オンライン学習による強化学習を行う。
(2−4−8)機械学習のその他の手法
学習部45は、種種の機械学習の手法を用い得る。学習部45が用い得る機械学習の手法は、既に説明した教師あり学習及び強化学習の他に、教師なし学習、半教師あり学習、トランスダクティブ学習、マルチタスク学習及び転移学習等がある。学習部45は、これらの手法を組み合わせて用いてもよい。
教師なし学習は、教師データを用いずに、所定の統計的性質に基づいて入力データをグループ分け(クラスタリング)する手法である。教師なし学習で用いられるモデル又はアルゴリズムとしては、k平均法(k−means法)、ウォード法(Ward法)、主成分分析等がある。k平均法は、各入力データにランダムにクラスタを割り当て、各クラスタの中心を計算し、各入力データを最も近い中心のクラスタに割り当て直す工程を繰り返す手法である。ウォード法は、クラスタの各入力データからクラスタの質量中心までの距離を最小化するように、各入力データをクラスタに割り当て直す工程を繰り返す手法である。主成分分析は、相関のある複数の変数から、相関の最も小さい主成分と呼ばれる変数を生成する多変量解析の手法である。
半教師あり学習は、対応する教師データが付かない入力データ(ラベルなしデータ)と、対応する教師データ付きの入力データ(ラベルありデータ)との両方を用いて学習する手法である。
トランスダクティブ学習は、半教師あり学習において、学習に用いられるラベルなしデータに対応する出力を生成し、未知の入力データに対応する出力を生成しない手法である。
マルチタスク学習は、複数の関連するタスク同士の情報を共有して、これらのタスクを同時に学習させることで、タスクに共通の要因を獲得してタスクの予測精度を上げる手法である。
転移学習は、あるドメインで予め学習させたモデルを、別のドメインに適応することで予測精度を上げる手法である。
(2−4−9)学習で使用されるデータ
本実施形態において、制御部40が機械学習の手法を用いて学習済みモデルを生成するために使用するデータについて説明する。
制御部40が教師あり学習の手法を用いる場合、制御部40は、状態変数、評価データ及び制御条件の各データを使用する。
状態変数は、シャフト115の位置に相関する少なくとも1つのパラメータを含む。本実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する。
評価データは、シャフト115の位置の目標値からの偏差に相関する少なくとも1つのパラメータを含む。本実施形態では、評価データ取得部44は、評価データとして、シャフト115の位置の検出値と、シャフト115の位置の目標値との差であるシャフト位置偏差を取得する。検出値とは、変位センサ31,32の出力値から換算された値である。目標値とは、シャフト115の可動範囲の中心位置である。
制御条件は、学習部45によって学習され、シャフト115の位置制御を適切に行うための条件である。本実施形態では、学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。決定部46は、制御条件として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
また、制御部40が、強化学習の手法を用いる場合、制御部40は、状態変数及び報酬条件を使用する。状態変数は、制御部40が教師あり学習の手法を用いる場合に使用される状態変数と同じである。制御部40は、所定の報酬条件に基づいて、シャフト位置偏差から報酬を計算する。本実施形態では、シャフト位置偏差が小さい場合には、報酬が増え、シャフト位置偏差が大きい場合には、報酬が減るか又は変化しないように、報酬条件が設定される。報酬条件は、例えば、評価データに基づいて報酬を算出するための条件である。
(3)効果
本実施形態の空気調和装置100が備える磁気軸受装置10は、磁気軸受のコイルに印加される電圧(電圧指令値)等を調整して、磁気浮上しているシャフト115の位置制御システムを備える。従来の位置制御システムは、予め定められた制御規則に基づいて、電圧指令値等を調整する。この場合、装置の品質のバラツキ、及び、システムの経時変化等によって適切な電圧指令値が得られず、シャフトの浮上制御の安定性が低下したり、浮上中に大きな外乱力が発生した場合にシャフトがタッチダウン軸受に接触したりするおそれがある。
本実施形態の磁気軸受装置10では、学習機能を有する制御部40が、シャフト115の位置に相関する状態変数と、シャフト115の位置に関する評価データとに基づいて、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習の手法を用いて学習する。変位センサ31,32は、比較的短い時間間隔(例えば40μ秒ごと)でシャフト115の位置を検出するので、制御部40は、シャフト115の位置制御を、比較的短い時間間隔で行うことができる。そのため、制御部40は、シャフト115の位置制御の安定性を長期間にわたって維持することができる。これにより、磁気軸受装置10の品質のバラツキ、及び、システムの経時変化等による、シャフト115の浮上制御の安定性の低下、及び、外乱力によるシャフト115とタッチダウン軸受116,117との接触の発生を抑制することができる。
―第2実施形態―
第1実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する。変位センサ31,32の出力値は、シャフト115の位置に相関するパラメータである。
本実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値以外のパラメータであって、シャフト115の位置に相関するパラメータを取得する。そのため、本実施形態は、変位センサ31,32を有さないセンサレスタイプの磁気軸受装置に適用することができる。
具体的には、状態変数取得部43は、状態変数として、シャフト115の位置の推定に必要な種種の情報を取得する。シャフト115の位置の推定に必要な情報は、磁気軸受21,22の電磁石の電流検出値、電圧検出値、磁束検出値、電流指令値及び電圧指令値の少なくとも2つを含む。電流検出値は、電磁石のコイル65に流れている電流の検出値である。電圧検出値は、電磁石のコイル65に印加されている電圧の検出値である。磁束検出値は、電磁石のコイル65から発生する磁界の検出値である。磁束検出値は、例えば、非接触型の磁気センサであるホールセンサの出力値である。電流指令値は、制御部40によって制御され、電磁石のコイル65に入力される電流値である。電圧指令値は、制御部40によって制御され、電磁石のコイル65に入力される電圧値である。
シャフト115の位置の推定に必要な情報として、例えば、次の(a)〜(c)の情報が挙げられる。
(a)電圧指令値と電流検出値
(b)電流指令値と電圧検出値
(c)電流検出値と磁束検出値
情報(a)を用いる場合、状態変数取得部43は、電圧指令値を入力し、電流検出値を取得することで、シャフト115の位置を推定する。
情報(b)を用いる場合、状態変数取得部43は、電流指令値を入力し、電圧検出値を取得することで、シャフト115の位置を推定する。
情報(a)及び(b)を用いる場合、状態変数取得部43は、コイル65の電流(又は電流微分値)及び電圧がシャフト115の位置に相関する性質を利用することで、シャフト115の位置を推定する。電流又は電圧は、正弦波状に入力されてもよく、ステップ状に入力されてもよい。
情報(c)を用いる場合、状態変数取得部43は、電流検出値及び磁束検出値がシャフト115の位置に相関する性質を利用することで、シャフト115の位置を推定する。
評価データ取得部44は、評価データとして、状態変数から換算したシャフト115の位置の推定値と、シャフト115の位置の目標値との差であるシャフト位置偏差を取得する。
学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。
決定部46は、制御条件として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
―第3実施形態―
第1及び第2実施形態では、図7に示される従来の制御部940の代わりに、学習機能を有する制御部40が用いられている。言い換えると、第1及び第2実施形態は、図7に示される位置検出部941、位置制御部942及び電流制御部943の全ての機能が学習機能を有する構成に関する。
しかし、図7に示される位置検出部941、位置制御部942及び電流制御部943のうちの一部の機能のみが学習機能を有してもよい。以下に説明する第3〜第5実施形態は、従来の制御部940の位置検出部941、位置制御部942及び電流制御部943のうちの1つの機能のみが学習機能を有する構成に関する。
本実施形態は、従来の制御部940の位置検出部941のみが学習機能を有する構成に関する。図17は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図17に示されるように、図7の位置検出部941に相当するブロックが、学習機能を有する学習制御部340に置き換えられている。学習制御部340は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部340は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
第1及び第2実施形態では、評価データ取得部44は、判定データとして、シャフト115の位置の目標値(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)を用いる。
本実施形態では、評価データ取得部44は、判定データとして、位置指令値及び位置検出値の代わりに、シャフト115の位置に相関するパラメータ(相関パラメータ)の目標値、及び、相関パラメータの検出値を用いる。相関パラメータとしては、第1及び第2実施形態において状態変数取得部43が取得した状態変数が用いられる。例えば、評価データ取得部44は、相関パラメータとして、第1実施形態で説明した変位センサ31,32の出力値を用いてもよく、第2実施形態で説明したシャフト115の位置の推定に必要な情報を用いてもよい。
評価データ取得部44は、判定データを用いて、例えば、相関パラメータの目標値を基準にした場合の相関パラメータの検出値の偏差(相関パラメータ偏差)を評価データとして取得する。
学習部45は、相関パラメータ偏差を小さくするための制御条件を学習する。
決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、位置検出値を決定する。
本実施形態では、学習部45は、特定の時点において位置制御条件を学習してもよい。特定の時点とは、相関パラメータに基づいて、シャフト115の位置を特定又は推定することができる時点である。具体的には、特定の時点とは、シャフト115の位置に一定の制約がある時点、又は、シャフト115に加わる力が既知である時点である。シャフト115の位置に一定の制約がある時点とは、例えば、シャフト115がタッチダウン軸受116,117に接触している時点である。シャフト115に加わる力が既知である時点とは、例えば、シャフト115が自由落下している時点である。
本実施形態では、評価データ取得部44は、評価データとして、相関パラメータ偏差の代わりに、シャフト115の位置の真値を取得してもよい。シャフト115の位置の真値として、判定データに含まれる位置検出値が用いられてもよい。なお、上述の「特定の時点」において特定又は推定されたシャフト115の位置が、シャフト115の位置の真値として用いられてもよい。
―第4実施形態―
本実施形態は、従来の制御部940の位置制御部942のみが学習機能を有する構成に関する。図18は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図18に示されるように、図7の位置制御部942に相当するブロックが、学習機能を有する学習制御部440に置き換えられている。学習制御部440は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部440は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
本実施形態では、状態変数取得部43は、状態変数として、シャフト115の位置の目標値(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)を用いる。
評価データ取得部44は、判定データとして、位置指令値及び位置検出値を用いる。評価データ取得部44は、評価データとして、位置指令値と位置検出値との差であるシャフト位置偏差を取得する。
学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。
決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
―第5実施形態―
本実施形態は、従来の制御部940の電流制御部943のみが学習機能を有する構成に関する。図19は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図19に示されるように、図7の電流制御部943に相当するブロックが、学習機能を有する学習制御部540に置き換えられている。学習制御部540は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部540は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
本実施形態では、状態変数取得部43は、状態変数として、磁気軸受21,22の電磁石のコイル65を流れる電流(電流指令値)、及び、シャフト115の位置の検出値(位置検出値)を取得する。
評価データ取得部44は、判定データとして、電流指令値及び位置検出値を用いる。評価データ取得部44は、評価データとして、電流制御の応答性に関する量(応答レベル)を取得する。応答レベルは、ゼロに近いほど好ましいパラメータである。応答レベルは、例えば、電流指令値を基準にした場合の電流検出値の偏差の絶対値、二乗平均平方根(RMS)又は二乗平均(MS)であってもよく、強制的に外乱を加えた場合の当該偏差のオーバーシュート量又は整定時間であってもよい。
学習部45は、応答レベルを小さくするための制御条件を学習する。
決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)を決定する。
―変形例―
以下、第1〜第5実施形態の少なくとも一部の変形例について説明する。
(1)変形例A
本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22を駆動するための電流値に相関するパラメータをさらに用いる。評価データ取得部44は、評価データとして、磁気軸受21,22を駆動するための電流値をさらに取得する。更新部47は、磁気軸受21,22を駆動するための電流値を所定値以下にするように学習部45を学習させる。所定値とは、具体的には、磁気軸受21,22を駆動するためのインバータの許容電流値である。本変形例は、インバータの仕様が決まっている場合において、インバータの故障の発生を抑制することができる。
(2)変形例B
本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22を駆動するためのインバータの温度に相関するパラメータをさらに用いる。評価データ取得部44は、評価データとして、磁気軸受21,22を駆動するためのインバータの温度をさらに取得する。更新部47は、インバータの温度を所定値以下にするように学習部45を学習させる。所定値とは、具体的には、インバータの許容温度である。本変形例は、インバータの仕様が決まっている場合において、インバータの故障の発生を抑制することができる。
(3)変形例C
本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、磁気軸受21,22が電圧型インバータによって駆動される場合において磁気軸受21,22の電磁石の電流検出値をさらに取得し、磁気軸受21,22が電流型インバータによって駆動される場合において磁気軸受21,22の電磁石の電圧検出値をさらに取得する。
(4)変形例D
本変形例は、変形例Cにおいて、評価データ取得部44は、判定データとして、電流指令値及び位置検出値をさらに用いる。評価データ取得部44は、評価データとして、電流制御の応答性に関する量(応答レベル)をさらに取得する。応答レベルは、ゼロに近いほど好ましいパラメータである。応答レベルは、例えば、電流指令値を基準にした場合の電流検出値の偏差の絶対値、二乗平均平方根(RMS)又は二乗平均(MS)であってもよく、強制的に外乱を加えた場合の当該偏差のオーバーシュート量又は整定時間であってもよい。更新部47は、応答レベルを小さくするように学習部45を学習させる。
(5)変形例E
本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、シャフト115の回転数をさらに取得する。
(6)変形例F
本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータをさらに取得する。
空気調和装置100の運転条件とは、空気調和装置100の冷凍能力、及び、凝縮器120の入口水温度の所定の範囲である。入口水温度とは、空気調和装置100の冷媒回路190を循環する冷媒と熱交換される媒体である水の温度であって、凝縮器120に流入する時の水の温度である。図20は、空気調和装置100の運転条件の一例である。空気調和装置100の冷凍能力の単位は、冷凍トンである。凝縮器120の入口水温度の単位は、華氏度である。図20においてハッチングされた領域が、空気調和装置100の運転条件であり、空気調和装置100による空気調和が実現可能な範囲である。
空気調和装置100の運転条件に相関するパラメータは、具体的には、以下に列挙する空気調和装置100の運転情報に関するデータである。
(a)圧縮機110に吸入される冷媒の温度
(b)圧縮機110から吐出される冷媒の温度
(c)圧縮機110に吸入される冷媒の圧力
(d)圧縮機110から吐出される冷媒の圧力
(e)冷媒回路190を循環する冷媒の流量
(f)凝縮器120に流入する水の温度
(g)凝縮器120から流出する水の温度
(h)蒸発器140に流入する水の温度
(i)蒸発器140から流出する水の温度
(j)インレットガイドベーン113bの開度
(k)電動機114の回転数
(l)電動機114の回転角度
(m)電動機114のトルク
(n)電動機114の電流値
パラメータ(f)〜(i)の「水」は、凝縮器120又は蒸発器140において冷媒と熱交換される媒体である水を意味する。空気調和装置100の運転条件に相関するパラメータは、上記のパラメータ(a)〜(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
本変形例では、制御部40は、空気調和装置100の運転条件ごとに最適な制御条件を学習することができる。
(7)変形例G
本変形例は、変形例Fにおいて、状態変数取得部43は、状態変数として、シャフト115に付与される電磁力に相関する少なくとも1つのパラメータをさらに取得する。
シャフト115に付与される電磁力に相関するパラメータは、空気調和装置100の冷媒負荷に相関するパラメータ、及び、空気調和装置100の物理特性に相関するパラメータの少なくとも1つを含む。
空気調和装置100の冷媒負荷に相関するパラメータとは、変形例Fにおいて列挙されたパラメータ(a)〜(n)の少なくとも1つを含む。空気調和装置100の冷媒負荷に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
空気調和装置100の物理特性に相関するパラメータとは、シャフト115の重量、及び、シャフト115に作用する力の少なくとも1つである。シャフト115に作用する力とは、シャフト115に作用するコリオリ力、及び、シャフト115に作用する遠心力の少なくとも1つである。シャフト115に作用する力の代わりに、シャフト115の偏心の量に相関するパラメータ、及び、電動機114の回転数の少なくとも1つが用いられてもよい。
本変形例では、空気調和装置100の運転中におけるシャフト115の回転軸の移動を抑制することができる。
(8)変形例H
本変形例は、変形例Fにおいて、状態変数取得部43は、状態変数として、磁気軸受21,22の特性に相関する少なくとも1つのパラメータをさらに取得する。
磁気軸受21,22の特性に相関するパラメータとは、磁気軸受21,22の電磁石のコイル65のインダクタンスに相関するパラメータ、及び、コイル65の抵抗に相関するパラメータの少なくとも1つを含む。コイル65のインダクタンスに相関するパラメータとは、例えば、コイル65を流れる電流の検出値である。コイル65の抵抗に相関するパラメータとは、コイル65の温度、又は、コイル65の周囲の温度に相関するパラメータであり、具体的には、変形例Fにおいて列挙されたパラメータ(a)〜(i)の少なくとも1つを含む。コイル65の抵抗に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
本変形例では、空気調和装置100の運転中におけるシャフト115の回転軸の移動を抑制することができる。
(9)変形例I
本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22の消費電力に相関するパラメータをさらに用いる。
磁気軸受21,22の消費電力に相関するパラメータとは、磁気軸受21,22を駆動するための電流値に相関するパラメータ、磁気軸受21,22を駆動するための電圧値に相関するパラメータ、及び、磁気軸受21,22の電磁石のコイル65の抵抗に相関するパラメータのうちの少なくとも2つを含む。磁気軸受21,22を駆動するための電流値に相関するパラメータとは、例えば、コイル65を流れる電流の検出値である。コイル65の抵抗に相関するパラメータとは、コイル65の温度、又は、コイル65の周囲の温度に相関するパラメータであり、具体的には、変形例Fにおいて列挙されたパラメータ(a)〜(i)の少なくとも1つを含む。コイル65の抵抗に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
評価データ取得部44は、評価データとして、磁気軸受21,22の消費電力をさらに取得する。
更新部47は、磁気軸受21,22の消費電力を小さくするように学習部45を学習させる。
本変形例では、制御部40は、空気調和装置100の消費電力を抑制することができる制御条件を学習することができる。
(10)変形例J
本変形例は、変形例A,B,Iにおいて、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータをさらに取得する。空気調和装置100の運転条件に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
(11)変形例K
本変形例は、第1、第2、第4及び第5実施形態において、評価データ取得部44は、判定データとして、電動機114によって駆動される圧縮機110に供給される入力エネルギーに相関する少なくとも1つのパラメータをさらに用いる。入力エネルギーに相関するパラメータとは、磁気軸受21,22の入力電流、磁気軸受21,22の入力電力、磁気軸受21,22を駆動するためのインバータの入力電流、磁気軸受21,22を駆動するためのインバータの入力電力、電動機114の入力電流、電動機114の入力電力、電動機114を駆動するためのインバータの入力電流、及び、電動機114を駆動するためのインバータの入力電力の少なくとも1つを含む。評価データ取得部44は、評価データとして、圧縮機110に供給される入力エネルギーをさらに取得する。
更新部47は、圧縮機110に供給される入力エネルギーを小さくように学習部45を学習させる。
本変形例では、制御部40は、圧縮機110に供給される入力エネルギーが最小となる制御条件を学習することができる。
(12)変形例L
本変形例は、変形例Jにおいて、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータ、及び、シャフト115に連結される羽根車113aの断熱効率に相関する少なくとも1つのパラメータの少なくとも1つをさらに取得する。
空気調和装置100の運転条件に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
羽根車113aの断熱効率に相関するパラメータとは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも1つを含む。冷媒の圧力に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(e)の少なくとも1つを含む。冷媒の圧力に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。冷媒の温度に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(i)の少なくとも1つを含む。冷媒の温度に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
本変形例では、制御部40は、羽根車113aの断熱効率が最大となる制御条件を学習することができる。
(13)変形例M
本変形例では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する場合に、変位センサ31,32の温度に相関するパラメータをさらに取得する。変位センサ31,32の温度に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)〜(i)の少なくとも1つを含む。冷媒の温度に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
本変形例では、制御部40は、温度特性を有する変位センサ31,32の温度に関する情報を状態変数として用いることで、温度による変位センサ31,32の検出値のズレを補償することができる。そのため、制御部40は、タッチダウン軸受116,117の位置の推定値を高い精度で取得して、タッチダウン軸受116,117の中心にシャフト115の回転軸が近付くように、シャフト115の位置合わせを行うことができる。
(14)変形例N
本変形例では、第1、第2、第4及び第5実施形態において、磁気軸受装置10の運転開始時等に、変位センサ31,32のキャリブレーションが行われる。キャリブレーションによって、例えば、変位センサ31,32の異常を検出することができる。
変位センサ31,32のキャリブレーションは、例えば、シャフト115の位置、磁気軸受21,22の電磁石のコイル65の電流値、及び、コイル65の電圧値等のパラメータを強制的に変化させて行われる。この場合、これらのパラメータに周期波形を重畳させてもよく、これらのパラメータをステップ状に変化させてもよく、これらのパラメータをランプ状に変化させてもよい。周期波形は、例えば、正弦波、矩形波、三角波及び鋸波である。周期波形の周波数は、断続的に変化させてもよく、連続的に変化させてもよい。
また、変位センサ31,32のキャリブレーションは、シャフト115の位置指令値と、所定の波形による摂動とを重畳させて行われてもよい。所定の波形とは、例えば、周期波形、パルス波形及びステップ波形である。周期波形は、例えば、正弦波、矩形波、三角波及び鋸波である。
また、変位センサ31,32のキャリブレーションは、シャフト115の位置に一定の制約を設けることで行われてもよい。例えば、シャフト115をタッチダウン軸受116,117に接触させる動作、及び、シャフト115に作用する力が既知である動作が行われてもよい。シャフト115に作用する力が既知である動作とは、例えば、シャフト115が自由落下しているときの動作である。
(15)変形例O
上記の各実施形態及び各変形例では、制御部40は、教師あり学習又は強化学習の手法を用いて、シャフト115の位置制御を適切に行うための条件を学習する。しかし、制御部40は、教師あり学習と強化学習とを組み合わせた手法を用いて、シャフト115の位置制御を適切に行うための条件を学習してもよい。
(16)変形例P
上記の各実施形態及び各変形例では、ラジアル磁気軸受21は、ベアリングレスモータ(シャフトを非接触で支持する機能を有する電動機)の支持機構を用いてもよい。
―むすび―
以上、本開示の実施形態を説明したが、特許請求の範囲に記載された本開示の趣旨及び範囲から逸脱することなく、形態や詳細の多様な変更が可能なことが理解されるであろう。
磁気軸受装置は、被支持体の位置の制御を適切に行うことができる。
10 磁気軸受装置
21 ラジアル磁気軸受(磁気軸受)
22 スラスト磁気軸受(磁気軸受)
31 ラジアル変位センサ(変位センサ)
32 スラスト変位センサ(変位センサ)
43 状態変数取得部
44 評価データ取得部
45 学習部
46 決定部
47 更新部
47a 蓄積部
47b 判定部
51 第1電磁石(電磁石)
52 第2電磁石(電磁石)
53 第3電磁石(電磁石)
54 第4電磁石(電磁石)
100 空気調和装置(冷凍装置)
110 圧縮機
113a 羽根車(インペラ)
115 シャフト
120 凝縮器
130 膨張機構
140 蒸発器
190 冷媒回路
実開平04−040308号公報

Claims (23)

  1. シャフト(115)に電磁力を付与する複数の電磁石(51〜54)を有する磁気軸受(21,22)を備える磁気軸受装置(10)の制御条件を学習する機械学習装置であって、
    学習部(45)と、
    前記シャフトの位置に相関する少なくとも1つのパラメータを含む状態変数を取得する状態変数取得部(43)と、
    前記シャフトの位置の測定値、前記シャフトの位置の目標値、及び、前記目標値からの偏差に相関するパラメータのうちの少なくとも1つのパラメータを含む評価データを取得する評価データ取得部(44)と、
    前記評価データを用いて前記学習部の学習状態を更新する更新部(47)と、
    を備え、
    前記学習部は、前記更新部の出力に従って、前記制御条件を学習する、
    機械学習装置。
  2. 前記状態変数は、前記シャフトの位置に応じた信号を出力する変位センサ(31,32)の出力値を少なくとも含み、
    前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも1つを前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  3. 前記状態変数は、前記電磁石の電流値及び電圧値、又は、前記電磁石の電流値及び磁束を少なくとも含み、
    前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも1つを前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  4. 前記状態変数は、前記シャフトの位置に応じた信号を出力する変位センサ(31,32)の出力値を少なくとも含み、
    前記評価データは、前記シャフトの位置の真値を少なくとも含み、
    前記学習部は、前記シャフトの位置を前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  5. 前記状態変数は、前記電磁石の電流値及び電圧値、又は、前記電磁石の電流値及び磁束を少なくとも含み、
    前記評価データは、前記シャフトの位置の真値を少なくとも含み、
    前記学習部は、前記シャフトの位置を前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  6. 前記状態変数は、前記シャフトの位置の検出値、及び、前記シャフトの位置の指令値を少なくとも含み、
    前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも1つを前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  7. 前記更新部は、前記磁気軸受を駆動するための電流値を所定の許容値以下にするように前記学習部をさらに学習させる、
    請求項2又は3に記載の機械学習装置。
  8. 前記評価データは、前記磁気軸受を駆動するインバータの温度に相関するパラメータをさらに含み、
    前記更新部は、前記インバータの温度を所定の許容値以下にするように前記学習部をさらに学習させる、
    請求項2又は3に記載の機械学習装置。
  9. 前記状態変数は、
    前記磁気軸受が電圧型インバータによって駆動される場合には前記電磁石の電流検出値をさらに含み、
    前記磁気軸受が電流型インバータによって駆動される場合には前記電磁石の電圧検出値をさらに含む、
    請求項2,3及び6のいずれか1項に記載の機械学習装置。
  10. 前記更新部は、前記電流値の制御の応答性に相関する値を小さくするために前記学習部をさらに学習させる、
    請求項9に記載の機械学習装置。
  11. 前記状態変数は、前記シャフトの回転数をさらに含む、
    請求項2,3及び6のいずれか1項に記載の機械学習装置。
  12. 前記状態変数は、冷凍装置(100)の運転条件に相関する少なくとも1つのパラメータをさらに含み、
    前記冷凍装置は、圧縮機(110)と、凝縮器(120)と、膨張機構(130)と、蒸発器(140)とが接続された冷媒回路(190)を備え、
    前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含む、
    請求項2,3及び6のいずれか1項に記載の機械学習装置。
  13. 前記状態変数は、前記シャフトに付与される電磁力に相関する少なくとも1つのパラメータをさらに含み、
    前記電磁力に相関するパラメータは、前記冷凍装置の冷媒負荷に相関するパラメータ、及び、前記冷凍装置の物理特性に相関するパラメータの少なくとも1つを含む、
    請求項12に記載の機械学習装置。
  14. 前記状態変数は、前記磁気軸受の特性に相関する少なくとも1つのパラメータをさらに含み、
    前記磁気軸受の特性に相関するパラメータは、前記電磁石のコイルのインダクタンスに相関するパラメータ、及び、前記電磁石のコイルの抵抗に相関するパラメータの少なくとも1つを含む、
    請求項12に記載の機械学習装置。
  15. 前記評価データは、前記磁気軸受の消費電力に相関するパラメータをさらに含み、
    前記更新部は、前記消費電力を小さくするために前記学習部をさらに学習させ、
    前記消費電力に相関するパラメータは、前記磁気軸受を駆動するための電流値、前記磁気軸受を駆動するための電圧値、及び、前記電磁石のコイルの抵抗のうちの少なくとも2つを含む、
    請求項2又は3に記載の機械学習装置。
  16. 前記状態変数は、冷凍装置(100)の運転条件に相関する少なくとも1つのパラメータをさらに含み、
    前記冷凍装置は、圧縮機(110)と、凝縮器(120)と、膨張機構(130)と、蒸発器(140)とが接続された冷媒回路(190)を備え、
    前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含む、
    請求項7,8及び15のいずれか1項に記載の機械学習装置。
  17. 前記評価データは、圧縮機(110)に供給される入力エネルギーに相関する少なくとも1つのパラメータをさらに含み、
    前記更新部は、前記入力エネルギーを小さくするために前記学習部をさらに学習させる、
    請求項2,3及び6のいずれか1項に記載の機械学習装置。
  18. 前記状態変数は、冷凍装置(100)の運転条件に相関する少なくとも1つのパラメータ、及び、前記シャフトに連結されるインペラ(113a)の断熱効率に相関する少なくとも1つのパラメータの少なくとも1つをさらに含み、
    前記冷凍装置は、圧縮機(110)と、凝縮器(120)と、膨張機構(130)と、蒸発器(140)とが接続された冷媒回路(190)を備え、
    前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含み、
    前記インペラの断熱効率に相関するパラメータは、前記冷媒の圧力に相関するパラメータ、及び、前記冷媒の温度に相関するパラメータの少なくとも1つを含む、
    請求項17に記載の機械学習装置。
  19. 前記状態変数は、前記変位センサの温度に相関するパラメータをさらに含む、
    請求項2又は4に記載の機械学習装置。
  20. 前記更新部は、前記評価データに基づいて報酬を算出し、
    前記学習部は、前記報酬を用いて学習する、
    請求項1から19のいずれか1項に記載の機械学習装置。
  21. 前記学習部は、前記更新部の出力に従って、関数のパラメータの変更を複数回行い、前記パラメータが変更された前記関数ごとに前記状態変数から前記制御条件を出力し、
    前記更新部は、蓄積部(47a)と、判定部(47b)とを備え、
    前記判定部は、前記評価データを判定して、判定結果を出力し、
    前記蓄積部は、前記判定結果に基づいて、前記状態変数及び前記評価データから教師データを作成して蓄積し、
    前記学習部は、前記蓄積部に蓄積された前記教師データに基づいて学習する、
    請求項1から19のいずれか1項に記載の機械学習装置。
  22. 前記学習部が学習した結果得られた学習済みモデルに基づいて、前記制御条件を出力する、
    請求項1から21のいずれか1項に記載の機械学習装置。
  23. 請求項22に記載の機械学習装置を備える、磁気軸受装置。
JP2019048948A 2019-03-15 2019-03-15 機械学習装置、及び、磁気軸受装置 Active JP6828762B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2019048948A JP6828762B2 (ja) 2019-03-15 2019-03-15 機械学習装置、及び、磁気軸受装置
CN202080020858.8A CN113574289B (zh) 2019-03-15 2020-03-13 机器学习装置和磁轴承装置
PCT/JP2020/011162 WO2020189565A1 (ja) 2019-03-15 2020-03-13 機械学習装置、及び、磁気軸受装置
EP20773439.3A EP3940254B1 (en) 2019-03-15 2020-03-13 Machine-learning device and magnetic bearing device
US17/435,242 US20220056953A1 (en) 2019-03-15 2020-03-13 Machine learning device and magnetic bearing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019048948A JP6828762B2 (ja) 2019-03-15 2019-03-15 機械学習装置、及び、磁気軸受装置

Publications (2)

Publication Number Publication Date
JP2020148329A true JP2020148329A (ja) 2020-09-17
JP6828762B2 JP6828762B2 (ja) 2021-02-10

Family

ID=72429391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019048948A Active JP6828762B2 (ja) 2019-03-15 2019-03-15 機械学習装置、及び、磁気軸受装置

Country Status (5)

Country Link
US (1) US20220056953A1 (ja)
EP (1) EP3940254B1 (ja)
JP (1) JP6828762B2 (ja)
CN (1) CN113574289B (ja)
WO (1) WO2020189565A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022052545A (ja) * 2020-09-23 2022-04-04 ダイキン工業株式会社 情報処理装置、情報処理方法、及びプログラム
JP7445718B1 (ja) 2022-08-24 2024-03-07 東京瓦斯株式会社 熱源システム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7093527B2 (ja) * 2020-11-20 2022-06-30 株式会社エイシング 情報処理装置、方法、プログラム及びシステム
CN114720128B (zh) * 2022-05-12 2022-12-27 珠海格力电器股份有限公司 一种电磁轴承控制方法、装置及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0699373A (ja) * 1992-09-21 1994-04-12 Toyoda Mach Works Ltd ロボット制御装置
JPH09191683A (ja) * 1996-01-12 1997-07-22 Matsushita Electric Ind Co Ltd インバータ装置
JP2001165163A (ja) * 1999-12-03 2001-06-19 Ebara Densan Ltd 磁気軸受制御装置
JP2002174199A (ja) * 2000-12-05 2002-06-21 Nsk Ltd レーザ発振器ブロワ用軸受装置
CN103631137A (zh) * 2013-10-08 2014-03-12 江苏大学 五自由度交流主动磁轴承混合核函数支持向量机检测方法
JP2018005739A (ja) * 2016-07-06 2018-01-11 株式会社デンソー ニューラルネットワークの強化学習方法及び強化学習装置
WO2018033945A1 (ja) * 2016-08-18 2018-02-22 ダイキン工業株式会社 磁気軸受装置、及びそれを用いた流体機械システム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2564510Y2 (ja) 1990-07-31 1998-03-09 エヌティエヌ株式会社 磁気軸受装置
US6965181B1 (en) * 1997-09-15 2005-11-15 Mohawk Innovative Technology, Inc. Hybrid foil-magnetic bearing with improved load sharing
US6323614B1 (en) * 1998-09-04 2001-11-27 The Texas A&M University System System and method for controlling suspension using a magnetic field
JP2008190376A (ja) * 2007-02-02 2008-08-21 Ntn Corp 空気サイクル冷凍機用タービンユニット
EP2829756B1 (en) * 2013-07-26 2016-06-29 SKF Magnetic Mechatronics S.A.S. Auxiliary bearing of the ball bearing type for a magnetically suspended rotor system
JP6241551B2 (ja) * 2014-09-01 2017-12-06 ダイキン工業株式会社 磁気軸受
WO2017098541A1 (ja) * 2015-12-10 2017-06-15 ダイキン工業株式会社 磁気軸受装置および圧縮機
DE112018000122T8 (de) * 2018-06-14 2020-04-09 Mitsubishi Electric Corporation Maschinelles-Lernen-Vorrichtung, Korrekturparameter-Anpassungssystem und Maschinelles-Lernen-Verfahren

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0699373A (ja) * 1992-09-21 1994-04-12 Toyoda Mach Works Ltd ロボット制御装置
JPH09191683A (ja) * 1996-01-12 1997-07-22 Matsushita Electric Ind Co Ltd インバータ装置
JP2001165163A (ja) * 1999-12-03 2001-06-19 Ebara Densan Ltd 磁気軸受制御装置
JP2002174199A (ja) * 2000-12-05 2002-06-21 Nsk Ltd レーザ発振器ブロワ用軸受装置
CN103631137A (zh) * 2013-10-08 2014-03-12 江苏大学 五自由度交流主动磁轴承混合核函数支持向量机检测方法
JP2018005739A (ja) * 2016-07-06 2018-01-11 株式会社デンソー ニューラルネットワークの強化学習方法及び強化学習装置
WO2018033945A1 (ja) * 2016-08-18 2018-02-22 ダイキン工業株式会社 磁気軸受装置、及びそれを用いた流体機械システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022052545A (ja) * 2020-09-23 2022-04-04 ダイキン工業株式会社 情報処理装置、情報処理方法、及びプログラム
JP7093031B2 (ja) 2020-09-23 2022-06-29 ダイキン工業株式会社 情報処理装置、情報処理方法、及びプログラム
US11774955B1 (en) 2020-09-23 2023-10-03 Daikin Industries, Ltd. Information processing apparatus, information processing method, and program
JP7445718B1 (ja) 2022-08-24 2024-03-07 東京瓦斯株式会社 熱源システム

Also Published As

Publication number Publication date
EP3940254A4 (en) 2022-11-30
JP6828762B2 (ja) 2021-02-10
CN113574289B (zh) 2023-06-09
US20220056953A1 (en) 2022-02-24
EP3940254A1 (en) 2022-01-19
CN113574289A (zh) 2021-10-29
EP3940254B1 (en) 2023-12-06
WO2020189565A1 (ja) 2020-09-24

Similar Documents

Publication Publication Date Title
WO2020189565A1 (ja) 機械学習装置、及び、磁気軸受装置
US11774923B2 (en) Augmented deep learning using combined regression and artificial neural network modeling
Li et al. A semi-supervised approach to fault detection and diagnosis for building HVAC systems based on the modified generative adversarial network
WO2021107054A1 (ja) 機械学習装置、デマンド制御システム、及び、空調制御システム
Li et al. Diagnosis for multiple faults of chiller using ELM-KNN model enhanced by multi-label learning and specific feature combinations
Qin et al. IIoT-enabled health monitoring for integrated heat pump system using mixture slow feature analysis
Djelloul et al. Fault diagnosis of manufacturing systems using data mining techniques
Dey et al. Semi-supervised learning techniques for automated fault detection and diagnosis of HVAC systems
Gupta et al. Lightweight computational intelligence for IoT health monitoring of off-road vehicles: Enhanced selection log-scaled mutation GA structured ANN
Nourmohammadzadeh et al. Fault classification of a centrifugal pump in normal and noisy environment with artificial neural network and support vector machine enhanced by a genetic algorithm
JP7275305B2 (ja) 故障予測装置、学習装置、および学習方法
Ilott et al. Fault diagnosis of pumping machinery using artificial neural networks
Martin et al. Automated eigenmode classification for airfoils in the presence of fixation uncertainties
JP2021056893A (ja) 機械学習装置、及び、空調制御システム
Dey et al. Automated terminal unit performance analysis employing x-RBF neural network and associated energy optimisation–A case study based approach
Otaka et al. Refrigerated showcase fault analysis by a Correntropy based artificial neural network using particle swarm optimization
Otaka et al. Refrigerated showcase fault detection by a pasting based artificial neural networks using parallel multi-population modified brain storm optimization and Correntropy
Dutta et al. Application of machine learning algorithm for anomaly detection for industrial pumps
Muscat et al. Hierarchical fuzzy support vector machine (SVM) for rail data classification
Liu et al. A hybrid data-fusion estimate method for health status of train braking system
Yuwono et al. Automatic feature selection using multiobjective cluster optimization for fault detection in a heating ventilation and air conditioning system
Bam et al. Machine learning-based predictive maintenance for diagnostics and prognostics of engineering systems
Turunen Machine learning for centrifugal pump condition monitoring using data from variable frequency drive
Otaka et al. Refrigerated showcase fault detection by a correntropy based artificial neural network using fast brain storm optimization
Dudley et al. Semi-Supervised Learning Techniques for Automated Fault Detection and Diagnosis of HVAC System

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200317

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210104

R151 Written notification of patent or utility model registration

Ref document number: 6828762

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151