WO2020189565A1 - 機械学習装置、及び、磁気軸受装置 - Google Patents

機械学習装置、及び、磁気軸受装置 Download PDF

Info

Publication number
WO2020189565A1
WO2020189565A1 PCT/JP2020/011162 JP2020011162W WO2020189565A1 WO 2020189565 A1 WO2020189565 A1 WO 2020189565A1 JP 2020011162 W JP2020011162 W JP 2020011162W WO 2020189565 A1 WO2020189565 A1 WO 2020189565A1
Authority
WO
WIPO (PCT)
Prior art keywords
shaft
unit
value
learning
parameter
Prior art date
Application number
PCT/JP2020/011162
Other languages
English (en)
French (fr)
Inventor
俊平 藤本
篤 阪脇
平田 和也
寛 日比野
Original Assignee
ダイキン工業株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ダイキン工業株式会社 filed Critical ダイキン工業株式会社
Priority to US17/435,242 priority Critical patent/US20220056953A1/en
Priority to CN202080020858.8A priority patent/CN113574289B/zh
Priority to EP20773439.3A priority patent/EP3940254B1/en
Publication of WO2020189565A1 publication Critical patent/WO2020189565A1/ja

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D17/00Radial-flow pumps, e.g. centrifugal pumps; Helico-centrifugal pumps
    • F04D17/08Centrifugal pumps
    • F04D17/10Centrifugal pumps for compressing or evacuating
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D25/00Pumping installations or systems
    • F04D25/02Units comprising pumps and their driving means
    • F04D25/06Units comprising pumps and their driving means the pump being electrically driven
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D27/00Control, e.g. regulation, of pumps, pumping installations or pumping systems specially adapted for elastic fluids
    • F04D27/001Testing thereof; Determination or simulation of flow characteristics; Stall or surge detection, e.g. condition monitoring
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D29/00Details, component parts, or accessories
    • F04D29/05Shafts or bearings, or assemblies thereof, specially adapted for elastic fluid pumps
    • F04D29/051Axial thrust balancing
    • F04D29/0513Axial thrust balancing hydrostatic; hydrodynamic thrust bearings
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04DNON-POSITIVE-DISPLACEMENT PUMPS
    • F04D29/00Details, component parts, or accessories
    • F04D29/05Shafts or bearings, or assemblies thereof, specially adapted for elastic fluid pumps
    • F04D29/056Bearings
    • F04D29/058Bearings magnetic; electromagnetic
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0444Details of devices to control the actuation of the electromagnets
    • F16C32/0446Determination of the actual position of the moving member, e.g. details of sensors
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0444Details of devices to control the actuation of the electromagnets
    • F16C32/0451Details of controllers, i.e. the units determining the power to be supplied, e.g. comparing elements, feedback arrangements with P.I.D. control
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0444Details of devices to control the actuation of the electromagnets
    • F16C32/0451Details of controllers, i.e. the units determining the power to be supplied, e.g. comparing elements, feedback arrangements with P.I.D. control
    • F16C32/0453Details of controllers, i.e. the units determining the power to be supplied, e.g. comparing elements, feedback arrangements with P.I.D. control for controlling two axes, i.e. combined control of x-axis and y-axis
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0444Details of devices to control the actuation of the electromagnets
    • F16C32/0457Details of the power supply to the electromagnets
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C41/00Other accessories, e.g. devices integrated in the bearing not relating to the bearing function as such
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/0459Details of the magnetic circuit
    • F16C32/0468Details of the magnetic circuit of moving parts of the magnetic circuit, e.g. of the rotor
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F16ENGINEERING ELEMENTS AND UNITS; GENERAL MEASURES FOR PRODUCING AND MAINTAINING EFFECTIVE FUNCTIONING OF MACHINES OR INSTALLATIONS; THERMAL INSULATION IN GENERAL
    • F16CSHAFTS; FLEXIBLE SHAFTS; ELEMENTS OR CRANKSHAFT MECHANISMS; ROTARY BODIES OTHER THAN GEARING ELEMENTS; BEARINGS
    • F16C32/00Bearings not otherwise provided for
    • F16C32/04Bearings not otherwise provided for using magnetic or electric supporting means
    • F16C32/0406Magnetic bearings
    • F16C32/044Active magnetic bearings
    • F16C32/047Details of housings; Mounting of active magnetic bearings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions

Definitions

  • Patent Document 1 (Actual Kaihei 04-040308), the position of the supported body is detected by a sensor, and the electromagnetic force of the electromagnet is controlled based on the detection signal to hold the position of the supported body at a predetermined position.
  • the configuration to be used is disclosed.
  • the machine learning device of the first viewpoint learns the control conditions of the magnetic bearing device.
  • the magnetic bearing device includes a magnetic bearing having a plurality of electromagnets that apply electromagnetic force to the shaft.
  • the machine learning device includes a learning unit, a state variable acquisition unit, an evaluation data acquisition unit, and an update unit.
  • the state variable acquisition unit acquires a state variable including at least one parameter that correlates with the position of the shaft.
  • the evaluation data acquisition unit acquires evaluation data including at least one of the measured value of the shaft position, the target value of the shaft position, and the parameter correlating with the deviation from the target value.
  • the update unit updates the learning state of the learning unit using the evaluation data.
  • the learning unit learns the control conditions according to the output of the update unit.
  • the machine learning device of the second viewpoint is the machine learning device of the first viewpoint, and the state variable includes at least the output value of the displacement sensor that outputs a signal according to the position of the shaft.
  • the learning unit learns at least one of the voltage value of the electromagnet and the current value of the electromagnet as control conditions.
  • the machine learning device of the third viewpoint is the machine learning device of the first viewpoint, and the state variables include at least the current value and voltage value of the electromagnet, or the current value and magnetic flux of the electromagnet.
  • the learning unit learns at least one of the voltage value of the electromagnet and the current value of the electromagnet as control conditions.
  • the machine learning device of the fourth viewpoint is the machine learning device of the first viewpoint, and the state variable includes at least the output value of the displacement sensor that outputs a signal according to the position of the shaft.
  • the evaluation data includes at least the true value of the shaft position.
  • the learning unit learns the position of the shaft as a control condition.
  • the machine learning device of the fifth viewpoint is the machine learning device of the first viewpoint, and the state variables include at least the current value and voltage value of the electromagnet, or the current value and magnetic flux of the electromagnet.
  • the evaluation data includes at least the true value of the shaft position.
  • the learning unit learns the position of the shaft as a control condition.
  • the machine learning device of the sixth viewpoint is the machine learning device of the first viewpoint, and the state variable includes at least the detected value of the shaft position and the command value of the shaft position.
  • the learning unit learns at least one of the voltage value of the electromagnet and the current value of the electromagnet as control conditions.
  • the machine learning device of the seventh aspect is the machine learning device of the second or third aspect, and the updating unit further increases the learning unit so that the current value for driving the magnetic bearing is equal to or less than a predetermined allowable value. Let them learn.
  • the machine learning device of the eighth viewpoint is the machine learning device of the second or third viewpoint, and the evaluation data further includes a parameter correlating with the temperature of the inverter that drives the magnetic bearing.
  • the update unit further learns the learning unit so that the temperature of the inverter becomes equal to or lower than a predetermined allowable value.
  • the machine learning device of the ninth aspect is any one of the second, third and sixth aspects, and the state variable is the current of the electromagnet when the magnetic bearing is driven by the voltage type inverter.
  • the detected value is further included, and when the magnetic bearing is driven by the current type inverter, the voltage detected value of the electromagnet is further included.
  • the machine learning device of the tenth viewpoint is the machine learning device of the ninth viewpoint, and the updating unit further learns the learning unit in order to reduce the value that correlates with the responsiveness of the control of the current value.
  • the machine learning device of the eleventh viewpoint is any one of the second, third, and sixth viewpoints, and the state variable further includes the rotation speed of the shaft.
  • the machine learning device of the twelfth viewpoint is any one of the second, third, and sixth viewpoints, and the state variable further includes at least one parameter that correlates with the operating conditions of the refrigerating device.
  • the freezing device includes a refrigerant circuit in which a compressor driven by an electric motor, a condenser, an expansion mechanism, and an evaporator are connected.
  • the operating conditions include the range of the freezing capacity of the refrigerating apparatus and the range of the temperature of the medium that exchanges heat with the refrigerant circulating in the refrigerant circuit and flows into the condenser.
  • the machine learning device of the thirteenth viewpoint is the machine learning device of the twelfth viewpoint, and the state variable further includes at least one parameter that correlates with the electromagnetic force applied to the shaft.
  • the parameter that correlates with the electromagnetic force includes at least one of the parameter that correlates with the refrigerant load of the refrigerating device and the parameter that correlates with the physical property of the refrigerating device.
  • the machine learning device of the 14th viewpoint is the machine learning device of the 12th viewpoint, and the state variable further includes at least one parameter that correlates with the characteristics of the magnetic bearing.
  • the parameters that correlate with the characteristics of the magnetic bearing include at least one of the parameters that correlate with the inductance of the coil of the electromagnet and the parameters that correlate with the resistance of the coil of the electromagnet.
  • the machine learning device of the fifteenth viewpoint is a machine learning device of the second or third viewpoint, and the evaluation data further includes a parameter correlating with the power consumption of the magnetic bearing.
  • the update unit further learns the learning unit in order to reduce the power consumption.
  • Parameters that correlate with power consumption include at least two of the current value for driving the magnetic bearing, the voltage value for driving the magnetic bearing, and the resistance of the coil of the electromagnet.
  • the machine learning device of the 16th viewpoint is any one of the 7th, 8th and 15th viewpoints, and the state variable further includes at least one parameter that correlates with the operating conditions of the refrigerating device.
  • the freezing device includes a refrigerant circuit in which a compressor driven by an electric motor, a condenser, an expansion mechanism, and an evaporator are connected.
  • the operating conditions include the range of the freezing capacity of the refrigerating apparatus and the range of the temperature of the medium that exchanges heat with the refrigerant circulating in the refrigerant circuit and flows into the condenser.
  • the machine learning device of the 17th viewpoint is any one of the 2nd, 3rd and 6th viewpoints, and the evaluation data correlates with the input energy supplied to the compressor driven by the electric motor. It further includes at least one parameter.
  • the update unit further learns the learning unit in order to reduce the input energy.
  • the machine learning device of the 18th viewpoint is the machine learning device of the 17th viewpoint, and the state variable correlates with at least one parameter that correlates with the operating conditions of the refrigerating device and the heat insulation efficiency of the impeller connected to the shaft. Further includes at least one of at least one parameter to be used.
  • the freezing device includes a refrigerant circuit in which a compressor driven by an electric motor, a condenser, an expansion mechanism, and an evaporator are connected.
  • the operating conditions include the range of the freezing capacity of the refrigerating apparatus and the range of the temperature of the medium that exchanges heat with the refrigerant circulating in the refrigerant circuit and flows into the condenser.
  • the parameters that correlate with the adiabatic efficiency of the impeller include at least one of the parameters that correlate with the pressure of the refrigerant and the parameters that correlate with the temperature of the refrigerant.
  • the machine learning device of the 19th viewpoint is the machine learning device of the 2nd or 4th viewpoint, and the state variable further includes a parameter correlating with the temperature of the displacement sensor.
  • the machine learning device of the 20th viewpoint is any one of the machine learning devices of the 1st to 19th viewpoints, and the update unit calculates the reward based on the evaluation data.
  • the learning department learns using rewards.
  • the machine learning device of the 21st viewpoint is any one of the 1st to 19th viewpoints, and the learning unit changes the parameters of the function a plurality of times according to the output of the update unit, and the parameters are changed.
  • the control condition is output from the state variable for each function.
  • the update unit includes a storage unit and a determination unit.
  • the determination unit determines the evaluation data and outputs the determination result.
  • the storage unit creates and stores teacher data from state variables and evaluation data based on the determination result.
  • the learning unit learns based on the teacher data accumulated in the storage unit.
  • the machine learning device of the 22nd viewpoint is any one of the 1st to 21st viewpoints, and outputs control conditions based on the learned model obtained as a result of learning by the learning unit.
  • the magnetic bearing device of the 23rd viewpoint includes a machine learning device of the 22nd viewpoint.
  • FIG. 5 is an overall configuration diagram of an air conditioner 100 including the magnetic bearing device 10 according to the first embodiment. It is a vertical sectional view of a compressor 110. It is a cross-sectional view of a radial magnetic bearing 21. It is a vertical sectional view of a radial magnetic bearing 21. It is a top view of the thrust magnetic bearing 22. It is a vertical sectional view of a thrust magnetic bearing 22. It is a reference diagram for comparison, and is the block block diagram of the position control system of a shaft 115. It is a block block diagram of the position control system of a shaft 115 in 1st Embodiment. It is a block block diagram of the control unit 40 which performs supervised learning.
  • FIG. 1 is an overall configuration diagram of the air conditioner 100.
  • the air conditioner 100 includes a refrigerant circuit 190.
  • the refrigerant circuit 190 is a closed circuit filled with a refrigerant.
  • the refrigerant circuit 190 is provided with a compressor 110, a condenser 120, an expansion valve 130, an evaporator 140, and an electric motor cooling control device 150.
  • Various compressors can be adopted as the compressor 110.
  • the compressor 110 is a turbo compressor.
  • the compressor 110 is driven by an electric motor 114. Electric power is supplied to the electric motor 114 from the electric motor control device 160.
  • the condenser 120 and the evaporator 140 are water refrigerant heat exchangers.
  • the expansion valve 130 is, for example, an electronic expansion valve.
  • the refrigerant circuit 190 is provided with a sensor for detecting the refrigerant pressure, a sensor for detecting the refrigerant temperature, and the like.
  • FIG. 2 is a vertical sectional view of the compressor 110.
  • the compressor 110 mainly includes a casing 112, a compression mechanism 113, an electric motor 114, a shaft 115, a radial touchdown bearing 116, a thrust touchdown bearing 117, and a magnetic bearing device 10.
  • the casing 112 has a cylindrical shape with both ends closed.
  • the casing 112 is arranged so that its cylindrical cylindrical axis is parallel in the horizontal direction.
  • the space inside the casing 112 is partitioned by the wall portion 112a.
  • the space on the right side of the wall portion 112a is the compression mechanism chamber S1 that houses the compression mechanism 113.
  • the space on the left side of the wall portion 112a is the electric motor chamber S2 that houses the electric motor 114.
  • a shaft 115 extending in the horizontal direction is arranged in the space inside the casing 112. The shaft 115 connects the compression mechanism 113 and the electric motor 114.
  • the compression mechanism 113 compresses the fluid.
  • the fluid is the refrigerant filled in the refrigerant circuit 190 in the present embodiment.
  • the compression mechanism 113 mainly includes an impeller 113a and an inlet guide vane 113b.
  • the impeller 113a is configured so that the outer shape is substantially conical with a plurality of blades.
  • the impeller 113a is fixed to one end of the shaft 115.
  • the inlet guide vane 113b is provided at the fluid suction port of the compression mechanism 113.
  • the inlet guide vane 113b is a valve for controlling the suction amount of the fluid.
  • the electric motor 114 rotates and drives the shaft 115.
  • the electric motor 114 mainly has a stator 114a and a rotor 114b.
  • the stator 114a is formed in a cylindrical shape and is fixed in the casing 112.
  • the rotor 114b is formed in a cylindrical shape and is rotatably installed inside the stator 114a.
  • a shaft hole for fixing the shaft 115 is formed in the center of the rotor 114b.
  • a disk portion 115a is fixed to the end portion of the shaft 115.
  • the disk portion 115a is fixed to the end portion to which the impeller 113a is not fixed.
  • the electric motor control device 160 controls the electric power supplied to the electric motor 114 to start, stop, and control the rotation speed of the electric motor 114.
  • the electric motor control device 160 mainly includes a converter circuit, an inverter circuit, and a microcomputer. These are mounted on the control board 160a.
  • the microcomputer controls the switching operation of the switching element of the inverter circuit. Therefore, information such as the rotation speed of the electric motor 114 and the current value of the electric motor 114 is input to the microcomputer.
  • the control board 160a is provided with a temperature sensor for the purpose of protecting the switching element and the like.
  • the microcomputer uses the detected value of the temperature sensor when controlling the inverter circuit.
  • the compressor 110 cools the electric motor 114 by flowing the refrigerant in the condenser 120 into the electric motor 114.
  • the electric motor cooling control device 150 includes an electric on-off valve 150a and a temperature sensor 150b.
  • the electric motor cooling control device 150 controls the on-off valve 150a according to the detected value of the temperature sensor 150b, and controls the flow rate of the refrigerant flowing from the condenser 120 into the electric motor 114.
  • the temperature of the electric motor 114 can be maintained within a predetermined temperature range.
  • the electric motor 114 is connected to the condenser 120 by piping via an on-off valve 150a.
  • the electric motor 114 is also connected to the evaporator 140 by piping.
  • the refrigerant that has flowed through the electric motor 114 and cooled the electric motor 114 is returned to the evaporator 140.
  • the temperature sensor 150b is attached to a pipe connecting the electric motor 114 and the evaporator 140.
  • the compressor 110 has two types of touchdown bearings, a radial touchdown bearing 116 and a thrust touchdown bearing 117.
  • the radial touchdown bearing 116 supports the shaft 115 when the magnetic bearing device 10 is de-energized, in other words, when the shaft 115 is not magnetically levitated.
  • the magnetic bearing device 10 magnetically levitates the shaft 115, which is a supported body, to rotatably support the shaft 115 in a non-contact manner.
  • the magnetic bearing device 10 mainly includes one or more (three in this embodiment) magnetic bearings 21 and 22, one or more (five in this embodiment) displacement sensors 31 and 32, and a control unit. 40 and.
  • Magnetic bearings 21 and 22 The magnetic bearings 21 and 22 have a pair of electromagnets facing each other with the supported body in between.
  • the magnetic bearings 21 and 22 are configured to non-contactly support the supported body by the combined electromagnetic force of the electromagnet pair.
  • the combined electromagnetic force of the electromagnet pair can be controlled by controlling the current flowing through the electromagnet pair, and the position of the supported body in the direction opposite to the electromagnet pair can be controlled.
  • the magnetic bearing device 10 includes two radial magnetic bearings 21 and one thrust magnetic bearing 22 as magnetic bearings 21 and 22.
  • FIG. 3 is a cross-sectional view of the radial magnetic bearing 21.
  • FIG. 4 is a vertical cross-sectional view of the radial magnetic bearing 21.
  • the radial magnetic bearing 21 has first to fourth electromagnets 51 to 54, and constitutes a heteropolar type radial magnetic bearing.
  • the first and second electromagnets 51 and 52 face each other with the shaft 115 in between, and the shaft 115 is non-contactly supported by the electromagnetic forces F1 and F2 of the first and second electromagnets 51 and 52.
  • the third and fourth electromagnets 53 and 54 face each other with the shaft 115 interposed therebetween, and the shaft 115 is non-contactly supported by the electromagnetic forces F3 and F4 of the third and fourth electromagnets 53 and 54.
  • the facing directions of the third and fourth electromagnets 53 and 54 are orthogonal to the facing directions of the first and second electromagnets 51 and 52 in a plan view.
  • the radial magnetic bearing 21 includes a magnetic bearing core 61 and eight coils 65.
  • the magnetic bearing core 61 is formed by laminating a plurality of electromagnetic steel plates, for example, and has a back yoke 62 and eight teeth 63.
  • the back yoke 62 is formed in a cylindrical shape.
  • the eight teeth 63 are arranged in the circumferential direction at predetermined intervals (45 ° intervals in this embodiment) along the inner peripheral surface of the back yoke 62.
  • the teeth 63 project radially inward from the inner peripheral surface of the back yoke 62.
  • the inner peripheral surface (protruding end surface) of the teeth 63 faces the outer peripheral surface of the shaft 115 with a predetermined gap.
  • the eight coils 65 are each wound around the eight teeth 63 of the magnetic bearing core 61.
  • eight electromagnet portions 71 to 78 are formed.
  • the first electromagnet unit 71, the second electromagnet unit 72, the seventh electromagnet unit 77, the eighth electromagnet unit 78, the third electromagnet unit 73, the fourth electromagnet unit 74, the fifth electromagnet unit 75, and the sixth electromagnet unit 76 are arranged in order in the clockwise direction.
  • the first electromagnet 51 has a first electromagnet portion 71 and a second electromagnet portion 72.
  • the second electromagnet 52 has a third electromagnet portion 73 and a fourth electromagnet portion 74.
  • the third electromagnet 53 has a fifth electromagnet section 75 and a sixth electromagnet section 76.
  • the fourth electromagnet 54 has a seventh electromagnet section 77 and an eighth electromagnet section 78.
  • the winding direction of the coil 65 and the direction of the current flowing through the coil 65 are set so that attractive force is generated in each of the first to fourth electromagnets 51 to 54.
  • the attractive force is an electromagnetic force acting in the direction of attracting the shaft 115.
  • the winding direction of the coil 65 and the direction of the current flowing through the coil 65 are set so that the magnetic flux is generated in the direction of the loop-shaped arrow shown in FIG.
  • FIG. 5 is a plan view of the thrust magnetic bearing 22.
  • FIG. 6 is a vertical cross-sectional view of the thrust magnetic bearing 22.
  • the thrust magnetic bearing 22 has first and second electromagnets 51 and 52.
  • the first and second electromagnets 51 and 52 face each other with the disc portion 115a sandwiched in the horizontal direction, and the disc portions 115a are non-contactly supported by the electromagnetic forces F1 and F2 of the first and second electromagnets 51 and 52.
  • the thrust magnetic bearing 22 includes two magnetic bearing cores 61 and two coils 65.
  • Each of the two magnetic bearing cores 61 is formed in an annular shape, and is arranged on both sides of the disk portion 115a in the axial direction with a predetermined gap.
  • Circumferential grooves are formed on the facing surface of the magnetic bearing core 61 over the entire circumference.
  • the two coils 65 are housed in the circumferential grooves of the two magnetic bearing cores 61, respectively.
  • the first and second electromagnets 51 and 52 are configured.
  • the first and second electromagnets are controlled.
  • the position of the disk portion 115a (position of the shaft 115) in the opposite direction (horizontal direction) of the electromagnets 51 and 52 can be controlled.
  • the winding direction of the coil 65 and the direction of the current flowing through the coil 65 are set so that attractive force is generated in each of the first and second electromagnets 51 and 52.
  • the attractive force is an electromagnetic force acting in the direction of attracting the disk portion 115a.
  • the winding direction of the coil 65 and the direction of the current flowing through the coil 65 are set so that the magnetic flux is generated in the direction of the loop-shaped arrow shown in FIG.
  • the displacement sensors 31 and 32 are both eddy current type displacement sensors.
  • the displacement sensors 31 and 32 are provided corresponding to a pair of electromagnets (a set of first and second electromagnets 51 and 52) facing each other with the supported body in between.
  • the displacement sensors 31 and 32 detect the amount of displacement of the supported object with respect to the reference position of the displacement sensors 31 and 32.
  • the reference position of the displacement sensors 31 and 32 is, for example, the position of the sensor head of the displacement sensors 31 and 32, or the central position in the opposite direction of the electromagnet pair.
  • the central position in the opposite direction of the electromagnet pair is, for example, the central position between the first electromagnet 51 and the second electromagnet 52.
  • the magnetic bearing device 10 has a radial displacement sensor 31 and a thrust displacement sensor 32 as displacement sensors 31 and 32.
  • Radial displacement sensor 31 Two radial displacement sensors 31 are provided on each radial magnetic bearing 21.
  • the magnetic bearing device 10 includes four radial displacement sensors 31.
  • the radial displacement sensor 31 detects the amount of displacement of the radial displacement sensor 31 with respect to the reference position.
  • the reference position of the radial displacement sensor 31 is, for example, the position of the sensor head of the radial displacement sensor 31 or the central position of the shaft 115.
  • one of the radial displacement sensors 31 detects the amount of displacement of the radial magnetic bearing 21 in the opposite direction (X-axis direction) between the first electromagnet 51 and the second electromagnet 52.
  • the X-axis direction is the radial direction of the radial magnetic bearing 21.
  • the other radial displacement sensor 31 detects the amount of displacement of the radial magnetic bearing 21 in the opposite direction (Y-axis direction) between the third electromagnet 53 and the fourth electromagnet 54.
  • the Y-axis direction is the radial direction of the radial magnetic bearing 21 orthogonal to the X-axis direction.
  • the radial displacement sensor 31 detects the amount of displacement of the radial displacement sensor 31 with respect to the reference position at predetermined time intervals.
  • the predetermined time interval is, for example, 40 ⁇ s.
  • the magnetic bearing device 10 includes one thrust displacement sensor 32.
  • the thrust displacement sensor 32 detects the amount of displacement of the thrust magnetic bearing 22 in the opposite direction (Z-axis direction) between the first electromagnet 51 and the second electromagnet 52.
  • the Z-axis direction is a direction along the rotation axis of the shaft 115.
  • the thrust displacement sensor 32 detects the amount of displacement of the thrust displacement sensor 32 with respect to the reference position.
  • the reference position of the thrust displacement sensor 32 is, for example, the position of the sensor head of the thrust displacement sensor 32 or the central position of the disk portion 115a.
  • the thrust displacement sensor 32 detects the amount of displacement of the thrust displacement sensor 32 with respect to the reference position at predetermined time intervals.
  • the predetermined time interval is, for example, 40 ⁇ s.
  • Control unit 40 controls one or more magnetic bearings 21 and 22 so that the supported body (shaft 115 and disk portion 115a) is non-contactly supported.
  • the control unit 40 controls the levitation of the supported body by controlling the electromagnetic force of each of the magnetic bearings 21 and 22.
  • the control unit 40 includes a microcomputer and a memory device or the like that stores software for operating the microcomputer.
  • the control unit 40 includes a radial control unit 41 and a thrust control unit 42.
  • Radial control unit 41 controls the levitation of the shaft 115 by the two radial magnetic bearings 21. In this levitation control, the radial control unit 41 controls the position of the shaft 115 in each of the X-axis direction and the Y-axis direction. Specifically, the radial control unit 41 sets the position of the shaft 115 and a predetermined position command value based on the displacement amount detected by the radial displacement sensor 31 in each of the X-axis direction and the Y-axis direction. A current (control current) is passed through each of the coils 65 constituting the first to fourth electromagnets 51 to 54 of the radial magnetic bearing 21 so that the difference value of is converged to zero. The radial control unit 41 outputs a voltage (voltage command value) applied to each coil 65 so that a control current flows through each coil 65.
  • Thrust control unit 42 controls the levitation of the disk portion 115a by the thrust magnetic bearing 22. In this levitation control, the thrust control unit 42 controls the position of the disk unit 115a in the Z-axis direction. Specifically, in the thrust control unit 42, the difference value between the position of the disk portion 115a and the predetermined position command value becomes zero based on the displacement amount detected by the thrust displacement sensor 32 in the Z-axis direction. A current (control current) is passed through each of the coils 65 constituting the first and second electromagnets 51 and 52 of the thrust magnetic bearing 22 so as to converge. The thrust control unit 42 outputs a voltage (voltage command value) applied to each coil 65 so that a control current flows through each coil 65.
  • the magnetic bearing device 10 has a position control system for the shaft 115.
  • the control unit 40 controls the position of the shaft 115 which is non-contact supported by controlling the electromagnetic force of each of the magnetic bearings 21 and 22.
  • the movable limit region of the shaft 115 is a circular region having a radius of 250 ⁇ m.
  • the shaft 115 swings in a range of 10 ⁇ m or less from the rotation axis.
  • the movable allowable region of the shaft 115 is, for example, a circular region having a radius of 83 ⁇ m.
  • the movable allowable area of the shaft 115 is a range in which the shaft 115 is allowed to swing away from the rotation axis when the shaft 115 is rotated.
  • FIG. 7 is a reference diagram for comparison, and is a block configuration diagram of a position control system for the shaft 115 including a conventional control unit 940.
  • the control unit 940 mainly includes a position detection unit 941, a position control unit 942, and a current control unit 943.
  • FIG. 7 shows the controlled object device 50 and the external device 60.
  • the control target device 50 and the external device 60 transmit and receive information to and from the control unit 940.
  • the control target device 50 is a device included in the magnetic bearing device 10, and specifically, is a shaft 115, magnetic bearings 21 and 22, and displacement sensors 31 and 32.
  • the external device 60 is a device other than the magnetic bearing device 10 and is a device included in the air conditioner 100.
  • the external device 60 is, for example, an electric motor cooling control device 150.
  • the position detection unit 941 detects the position of the shaft 115 on the XY plane.
  • the position detection unit 941 receives the output values of the displacement sensors 31 and 32.
  • the output values of the displacement sensors 31 and 32 include the position of the shaft 115 in the X-axis direction and the position of the shaft 115 in the Y-axis direction.
  • the position detection unit 941 receives information regarding the operation of the air conditioner 100 from the external device 60.
  • the position detection unit 941 outputs a position detection value which is information regarding the position of the shaft 115 based on the output value received from the displacement sensors 31 and 32 and the information (external information) received from the external device 60.
  • the position control unit 942 is based on a predetermined control rule so that the shaft 115 rotates within the movable allowable region based on the information about the position of the shaft 115 detected by the position detection unit 941 and the external information. Outputs the current command value.
  • the current command value is the current input to the coil 65 of the electromagnet of the magnetic bearings 21 and 22.
  • the current control unit 943 is based on the current command value output by the position control unit 942, the detected value of the current flowing through the coils 65 of the magnetic bearings 21 and 22, and the external information, and the coil 65 of the magnetic bearings 21 and 22. Outputs the voltage command value applied to.
  • the voltage command value is the voltage applied to the coils 65 of the magnetic bearings 21 and 22.
  • the control unit 940 outputs a voltage command value based on a predetermined control rule so that the shaft 115 rotates within the movable allowable region based on the output values of the controlled target device 50 and the external device 60.
  • FIG. 8 is a block configuration diagram of the position control system of the shaft 115 including the control unit 40 of the present embodiment.
  • the control unit 40 has a function as a machine learning device for learning the control conditions of the magnetic bearing device 10. Specifically, the control unit 40 controls the position of the shaft 115 by using a machine learning method. More specifically, the control unit 40 uses the output value of the controlled device 50 to set conditions (position control conditions) for appropriately controlling the position of the shaft 115 by supervised learning or reinforcement learning. Learn using.
  • the controlled device 50 is at least a part of the shaft 115, the magnetic bearings 21 and 22, and the displacement sensors 31 and 32.
  • the control unit 40 determines the optimum position control condition for the new output value by using the learning result of the position control condition.
  • the control unit 40 mainly includes a state variable acquisition unit 43, an evaluation data acquisition unit 44, a learning unit 45, a determination unit 46, and an update unit 47.
  • 9A and 9B are block configuration diagrams of the control unit 40 that performs supervised learning.
  • State variable acquisition unit 43 The state variable acquisition unit 43 observes the state of the magnetic bearing device 10 during the operation of the magnetic bearing device 10 and acquires information on the observed state as a state variable. In other words, the state variable acquisition unit 43 inputs the state of the magnetic bearing device 10 and outputs the state variable.
  • the state variable contains at least one parameter that correlates with the position of the shaft 115. In this embodiment, the state variable is the output value of the displacement sensors 31 and 32. State variables are used as teacher data in supervised learning.
  • the position of the shaft 115 is at least one of the coordinate values that regulate the five degrees of freedom excluding the angle around the rotation axis (Z axis) of the shaft 115.
  • 5 degrees of freedom is the coordinate values of the center of gravity of the shaft 115 in the X-axis direction, the Y-axis direction, and the Z-axis direction, the angle around the X-axis of the shaft 115, and the Y-axis of the shaft 115.
  • Another example of the five degrees of freedom is the coordinate values in the X-axis direction and the Y-axis direction of the two radial magnetic bearings 21 and the coordinate values in the Z-axis direction of the centers of gravity of the two radial magnetic bearings 21.
  • the position of the center of gravity of the shaft 115 on the XY plane may be used as the position of the shaft 115.
  • Evaluation data acquisition unit 44 evaluates the determination data and acquires the evaluation data.
  • the evaluation data is used as teacher data in supervised learning.
  • the evaluation data includes at least one of a measured value of the position of the shaft 115, a target value of the position of the shaft 115, and a parameter that correlates with the deviation of the position of the shaft 115 from the target value.
  • the evaluation data acquisition unit 44 for example, inputs the determination data into a predetermined evaluation function and acquires the output value of the evaluation function as the evaluation data. In other words, the evaluation data acquisition unit 44 inputs the determination data and outputs the evaluation data.
  • the determination data is, for example, data that can be used for evaluation of the position control of the shaft 115.
  • the determination data is the center position (position command value) of the movable range of the shaft 115 and the detection value (position detection value) of the position of the shaft 115.
  • the position command value is a target value of the position of the shaft 115.
  • the position detection value is, for example, a detection value of the position of the shaft 115 obtained from the output values of the displacement sensors 31 and 32.
  • the control unit 40 controls the position of the shaft 115 so that the position detection value is as close as possible to the position command value. Therefore, the evaluation data acquisition unit 44 uses the determination data to acquire the deviation of the position detection value (shaft position deviation) when the position command value is used as a reference as the evaluation data. The closer the shaft position deviation is to zero, the more preferable.
  • the input value of the evaluation function is the position command value and the position detection value, and the output value of the evaluation function is the shaft position deviation.
  • the evaluation function may be a function that is regarded as a constant value if the shaft position deviation is within a predetermined range.
  • a predetermined range is a range in the vicinity of zero, and a constant value is zero. In other words, from the viewpoint of the position control of the shaft 115, the shaft position deviation need only remain near zero and does not have to converge to zero.
  • the shaft position deviation is, for example, the absolute value of the distance between the position command value and the position detection value.
  • the shaft position deviation may be the root mean square (RMS) or the root mean square (MS) of the distance from the present to a predetermined time in the past, and the overshoot amount or settling of the distance when a disturbance is forcibly applied. It may be time.
  • the overshoot amount is the amount that exceeds the position command value when the position detection value exceeds (overshoots) the position command value in the process of approaching the position command value.
  • the settling time is the time until the position detection value falls within a predetermined allowable range in the vicinity of the position command value in the process of approaching the position command value, and then does not come out of the allowable range. Is.
  • the learning unit 45 learns a condition (position control condition) for appropriately controlling the position of the shaft 115 by using a method of supervised learning or reinforcement learning.
  • the learning unit 45 learns the position control condition according to the output of the updating unit 47. Next, the operation of the learning unit 45 when supervised learning is used will be described.
  • the learning unit 45 uses a pair of the state variable acquired in advance by the state variable acquisition unit 43 and the evaluation data acquired in advance by the evaluation data acquisition unit 44 as the learning data.
  • the state variable is the output value of the displacement sensors 31 and 32
  • the evaluation data is the shaft position deviation.
  • the teacher data used by the learning unit 45 for learning is a pair of state variables and evaluation data.
  • the learning unit 45 learns the position control condition by adjusting the parameter of the identification function which is a mapping from the state variable to the evaluation data according to the output of the updating unit 47.
  • the purpose of learning by the learning unit 45 is to adjust the parameters of the discriminant function using the learning data so that correct or appropriate evaluation data can be obtained from the new state variable.
  • the discriminant function whose parameters are sufficiently adjusted by the learning unit 45 corresponds to the trained model.
  • the learning unit 45 may use a part of the teacher data as the learning data to adjust the parameters of the discrimination function and use the rest as the test data.
  • the test data is data that has not been used for training, and is mainly data that is used for performance evaluation of a trained model. By using the test data, the performance of the evaluation data obtained from the new state variables can be predicted in the form of error probability with respect to the test data.
  • a holdout method As a method of dividing the data acquired in advance into training data and test data, a holdout method, an intersection confirmation method, a one-pulling method (jackknife method), a bootstrap method, or the like is used.
  • the learning by the learning unit 45 is classified into online learning and batch learning according to the timing when the model is updated.
  • Online learning is a method of updating a conventional model at any time by using only newly acquired data every time data necessary for updating a model is acquired.
  • Batch learning is a method of generating a model by collectively processing all the data to be learned at a predetermined timing after preparing all the data necessary for updating the model.
  • Update section 47 updates the learning state of the learning unit 45 using the evaluation data.
  • the learning unit 45 changes the parameters of the discriminant function a plurality of times according to the output (teacher data) of the update unit 47, and outputs a control condition (position control condition) from the state variable for each discriminant function whose parameters are changed.
  • the update unit 47 includes a storage unit 47a and a determination unit 47b.
  • the determination unit 47b determines the evaluation data and outputs the determination result.
  • the storage unit 47a creates and stores teacher data from the state variables and the evaluation data based on the determination result of the evaluation data.
  • the learning unit 45 learns the control conditions based on the teacher data accumulated in the storage unit 47a.
  • the determination unit 46 is a condition (position control) for appropriately controlling the position of the shaft 115 from a new state variable that correlates with the position of the shaft 115 based on the learned model obtained as a result of learning by the learning unit 45. Condition) is determined and output.
  • the state variable that correlates with the position of the shaft 115 is the output value of the displacement sensors 31 and 32.
  • the position control condition is information for driving the magnetic bearing device 10.
  • the position control condition is a current or a voltage for driving the magnetic bearing device 10, and specifically, a voltage (voltage command value) applied to the coils 65 of the magnetic bearings 21 and 22. ..
  • 9A and 9B show the flow of data when determining the position control condition from a new state variable based on the trained model.
  • supervised learning is performed by online learning.
  • the learning unit 45 generates a trained model in advance using the data (state variables) acquired during the test operation before shipping or installation of the magnetic bearing device 10.
  • the determination unit 46 determines the position control conditions based on the learned model generated in advance by the learning unit 45.
  • the learning unit 45 updates the learned model using the data (state variable) newly acquired during the operation of the magnetic bearing device 10.
  • the determination unit 46 determines the position control condition based on the learned model updated by the learning unit 45.
  • the trained model is updated periodically, and the determination unit 46 determines the position control condition based on the latest trained model.
  • supervised learning is performed by batch learning.
  • the learning unit 45 generates a trained model in advance using the data (state variables) acquired during the test operation before shipping or installation of the magnetic bearing device 10.
  • the determination unit 46 determines the position control conditions based on the learned model generated in advance by the learning unit 45 during the operation of the magnetic bearing device 10. This trained model is not updated after being pre-generated by the learning unit 45. In other words, the determination unit 46 determines the position control condition using the same trained model.
  • control unit 40 included in the magnetic bearing device 10 generates a trained model.
  • a server connected to the control unit 40 via a computer network such as the Internet may generate a trained model, or may generate a trained model by using a cloud computing service. Good.
  • Supervised learning is a method of using supervised data to generate an output corresponding to unknown input data.
  • learning data and discriminant functions are used.
  • the training data is a set of pairs of input data and corresponding teacher data.
  • the input data is, for example, a feature vector in the feature space.
  • Teacher data is, for example, parameters relating to the identification, classification and evaluation of input data.
  • the discriminant function represents a mapping from the input data to the corresponding output.
  • Supervised learning is a method of adjusting the parameters of the discriminant function by using the learning data given in advance so that the error between the output of the discriminant function and the supervised data becomes small.
  • Models or algorithms used in supervised learning include regression analysis, time series analysis, decision trees, support vector machines, neural networks, ensemble learning, and the like.
  • Regression analysis is, for example, linear regression analysis, multiple regression analysis, logistic regression analysis.
  • Regression analysis is a method of fitting a model between input data (explanatory variable) and teacher data (objective variable) using the least squares method or the like.
  • the dimension of the explanatory variable is 1 in linear regression analysis and 2 or more in multiple regression analysis.
  • logistic regression analysis a logistic function (sigmoid function) is used as a model.
  • Time series analysis includes, for example, AR model (autoregressive model), MA model (autoregressive average model), ARMA model (autoregressive moving average model), ARIMA model (autoregressive sum moving average model), SARIMA model (seasonal self Regressive sum moving average model), VAR model (vector autoregressive model).
  • AR model autoregressive model
  • MA model autoregressive average model
  • ARMA model autoregressive moving average model
  • ARIMA model autoregressive sum moving average model
  • SARIMA model seasonal self Regressive sum moving average model
  • VAR model vector autoregressive model
  • the AR, MA, ARMA, and VAR models represent stationary processes, and the ARIMA, SARIMA models represent non-stationary processes.
  • the AR model is a model in which the value changes regularly with the passage of time.
  • the MA model is a model in which the fluctuation over a certain period is constant. For example, in the MA model, the value at a certain point in time is determined by the moving average
  • the ARMA model is a combination of the AR model and the MA model.
  • the ARIMA model is a model in which the ARMA model is applied to the difference between the values before and after in consideration of the medium- to long-term trend (increasing or decreasing trend).
  • the SARIMA model is a model to which the ARIMA model is applied in consideration of medium- to long-term seasonal fluctuations.
  • the VAR model is a multivariate extension of the AR model.
  • the decision tree is a model for combining multiple classifiers to generate complex discriminant boundaries. The details of the decision tree will be described later.
  • the support vector machine is an algorithm that generates two classes of linear discrimination functions. Details of the support vector machine will be described later.
  • a neural network is a model of a network formed by connecting neurons of the human cranial nerve system at synapses.
  • a neural network in a narrow sense, means a multi-layer perceptron using the backpropagation method.
  • Typical neural networks include convolutional neural networks (CNN) and recurrent neural networks (RNN).
  • CNN is a type of feedforward neural network that is not fully coupled (loosely coupled).
  • RNN is a kind of neural network having a directed cycle.
  • CNNs and RNNs are used for voice / image / video recognition and natural language processing.
  • Ensemble learning is a method of improving discrimination performance by combining multiple models.
  • Techniques used by ensemble learning are, for example, bagging, boosting, and random forest.
  • Bagging is a method in which a plurality of models are trained using a bootstrap sample of training data, and the evaluation of new input data is determined by a majority decision by the plurality of models.
  • Boosting is a method of weighting training data according to the learning result of bagging so that erroneously identified learning data is trained more intensively than correctly identified learning data.
  • Random forest is a method of generating a decision tree group (random forest) consisting of a plurality of decision trees having low correlation when a decision tree is used as a model. The details of Random Forest will be described later.
  • the neural network, the support vector machine, the decision tree, and the random forest described below are used as the preferred model or algorithm for supervised learning used by the learning unit 45.
  • FIG. 10 is a schematic diagram of a neuron model of a neural network.
  • FIG. 11 is a schematic diagram of a three-layer neural network configured by combining the neurons shown in FIG.
  • the neuron outputs an output y for a plurality of inputs x (inputs x1, x2, x3 in FIG. 10).
  • Each input x (inputs x1, x2, x3 in FIG. 10) is multiplied by a corresponding weight w (weights w1, w2, w3 in FIG. 10).
  • the neuron outputs the output y using the following equation (1).
  • the input x, the output y and the weight w are all vectors, ⁇ is a bias, and ⁇ is an activation function.
  • the activation function is a non-linear function, such as a step function (formal neuron), a simple perceptron, a sigmoid function or a ReLU (ramp function).
  • a plurality of input vectors x (input vectors x1, x2, x3 in FIG. 11) are input from the input side (left side in FIG. 11), and the output side (right side in FIG. 11).
  • a plurality of output vectors y (output vectors y1, y2, y3 in FIG. 11) are output from.
  • This neural network is composed of three layers L1, L2, and L3.
  • the input vectors x1, x2, x3 are input by applying the corresponding weights to each of the three neurons N11, N12, and N13. In FIG. 11, these weights are collectively referred to as W1.
  • the neurons N11, N12, and N13 output the feature vectors z11, z12, and z13, respectively.
  • the feature vectors z11, z12, and z13 are input by applying corresponding weights to each of the two neurons N21 and N22. In FIG. 11, these weights are collectively referred to as W2.
  • the neurons N21 and N22 output the feature vectors z21 and z22, respectively.
  • the feature vectors z21 and z22 are input by applying corresponding weights to each of the three neurons N31, N32 and N33. In FIG. 11, these weights are collectively referred to as W3.
  • the neurons N31, N32, and N33 output output vectors y1, y2, and y3, respectively.
  • the operation of the neural network has a learning mode and a prediction mode.
  • the weights W1, W2, and W3 are learned using the learning data set.
  • prediction such as identification is performed using the learned parameters of the weights W1, W2, and W3.
  • the weights W1, W2, and W3 can be learned by, for example, the error backpropagation method (backpropagation).
  • the error backpropagation method learns by adjusting the weights W1, W2, and W3 in each neuron so as to reduce the difference between the output y when the input x is input and the true output y (teacher data). It is a method to do.
  • the neural network can be configured to have more than three layers.
  • a machine learning method using a neural network having four or more layers is known as deep learning.
  • FIG. 12 is a diagram for explaining SVM.
  • the two-class linear discrimination function represents the discrimination hyperplanes P1 and P2, which are hyperplanes for linearly separating the training data of the two classes C1 and C2 in the feature space shown in FIG.
  • the training data of class C1 is shown by a circle
  • the learning data of class C2 is shown by a square.
  • the margin of the identification hyperplane is the distance between the training data closest to the identification hyperplane and the identification hyperplane.
  • the optimum identification hyperplane P1 which is the identification hyperplane that maximizes the margin is required.
  • the minimum value d1 of the distance between the training data of one class C1 and the optimal identification hyperplane P1 is equal to the minimum value d1 of the distance between the training data of the other class C2 and the optimal identification hyperplane P2.
  • the number of elements of the training dataset D L is N.
  • the teacher data t i represents whether the learning data x i belongs to the classes C1 and C2.
  • the margin d is represented by the equation (6).
  • ⁇ (w) denotes the class C1, the respective minimum length difference which is projected onto the normal vector w of learning data x i identification hyperplane P1, P2 of C2.
  • the "min” and “max” terms of the formula (6) are the points indicated by the symbols “min” and “max” in FIG. 12, respectively.
  • the optimum identification hyperplane is the identification hyperplane P1 having the maximum margin d.
  • FIG. 12 represents a feature space in which the two classes of training data are linearly separable.
  • FIG. 13 is a feature space similar to that of FIG. 12, and represents a feature space in which the two classes of training data cannot be linearly separated.
  • the following equation (7) extended by introducing the slack variable ⁇ i into the equation (4) can be used.
  • FIG. 13 shows the identification hyperplane P3, the margin boundaries B1 and B2, and the margin d3.
  • the equation of the identification hyperplane P3 is the same as the equation (5).
  • the margin boundaries B1 and B2 are hyperplanes in which the distance from the identification hyperplane P3 is the margin d3.
  • equation (7) is equivalent to equation (4).
  • the learning data x i that satisfies the equation (7) is correctly identified in the margin d3.
  • the distance between the learning data x i and the identification hyperplane P3 is margin d3 more.
  • the training data x i satisfying equation (7) exceeds the margin boundaries B1 and B2, as shown by the hatched circle or square in FIG. , The identification hyperplane P3 is not exceeded and is correctly identified. The distance between the learning data x i and the identification hyperplane P3 is less than the margin d3.
  • the learning data x i satisfying the equation (7) exceeds the identification hyperplane P3 and is erroneously recognized, as shown by the black circle or square in FIG. ..
  • the training data x i can be identified even when the training data of the two classes cannot be linearly separated.
  • the sum of the slack variables ⁇ i of all the training data x i represents the upper limit of the number of misrecognized learning data x i .
  • the evaluation function L p is defined by the following equation (8).
  • the learning unit 45 finds a solution (w, ⁇ ) that minimizes the output value of the evaluation function L p .
  • the parameter C of the second term represents the strength of the penalty for misrecognition. As the parameter C is larger, a solution that gives priority to reducing the number of false recognitions (second term) rather than the norm of w (first term) is required.
  • a decision tree is a model for combining a plurality of classifiers to obtain a complicated discriminant boundary (non-linear discriminant function, etc.).
  • the discriminator is, for example, a rule regarding the magnitude relationship between the value of a certain feature axis and the threshold value.
  • As a method of constructing a decision tree from learning data for example, there is a divide-and-conquer method in which a rule (discriminator) for dividing a feature space into two is repeatedly obtained.
  • FIG. 14 is an example of a decision tree constructed by the divide-and-conquer law.
  • FIG. 15 represents a feature space divided by the decision tree of FIG. In FIG.
  • the training data is indicated by white circles or black circles, and each training data is classified into a white circle class or a black circle class according to the decision tree shown in FIG.
  • FIG. 14 shows nodes numbered 1 to 11 and links linking the nodes and labeled Yes or No.
  • terminal nodes leaf nodes
  • non-terminal nodes root nodes and internal nodes
  • Terminating nodes are nodes numbered 6 to 11, and non-terminating nodes are nodes numbered 1 to 5.
  • Each terminal node is indicated by a white circle or a black circle representing the training data.
  • Each non-terminating node has a classifier.
  • Classifier is a rule for determining the size relationship between the value of the feature axis x 1, x 2 and the threshold a ⁇ e.
  • the label attached to the link indicates the judgment result of the classifier.
  • the classifiers are shown by dotted lines, and the areas divided by the classifiers are numbered with corresponding nodes.
  • CART is a method of generating a binary tree as a decision tree by dividing the feature space into two for each feature axis in each node other than the terminal node.
  • impureness may be used as a parameter for evaluating the division candidate points of the feature space.
  • the function I (t) representing the purity of the node t
  • the parameters represented by the following equations (9-1) to (9-3) are used.
  • K is the number of classes.
  • t) is the posterior probability of class C i at the node t, in other words, the probability that the data of class C i is selected at the node t.
  • t) is the probability that the data of the class C i is mistaken for the j ( ⁇ i) th class. Represents the error rate at t.
  • the third equation of equation (9-3) represents the sum of the variances of the probabilities P (C i
  • Random forest Random forest is a kind of ensemble learning, and is a method of enhancing discrimination performance by combining a plurality of decision trees.
  • a group consisting of multiple decision trees with low correlation is generated.
  • A From N d-dimensional learning data, m bootstrap samples Z m are generated.
  • B Using Z m as training data, each node t is divided according to the following procedure to generate m decision trees.
  • d'features are randomly selected.
  • the correlation between decision trees can be lowered by randomly selecting a predetermined number of features used for identification at each non-terminal node of the decision tree.
  • Reinforcement learning is a method of learning a strategy that maximizes the reward as a result of a series of actions.
  • Models or algorithms used in reinforcement learning include Q-learning.
  • Q-learning is a method of learning a Q value representing the value of selecting an action a under the state s.
  • the action a having the highest Q value is selected as the optimal action.
  • the subject (agent) of the action a is rewarded for the action a selected under the state s.
  • the Q value is updated using the following equation (10).
  • Q (s t , a t) is the Q value representing the value that the agent state s t to select an action a t.
  • Q (s t, a t) is a function of the state s and action a as a parameter (action-value function).
  • st is the state of the agent at time t.
  • a t is the action of the agent at time t.
  • is a learning coefficient.
  • is set by Eq. (10) so that the Q value converges to the optimum value.
  • r t + 1 is the reward that the agent gets when it transitions to the state st + 1 .
  • is the discount rate.
  • is a constant of 0 or more and 1 or less.
  • the term including max is the Q value multiplied by ⁇ when the action a having the highest Q value is selected under the environment st + 1 .
  • the Q value obtained by the action value function is the expected value of the reward obtained
  • FIG. 16 is a block configuration diagram of the control unit 40 that performs reinforcement learning by Q-learning.
  • the control unit 40 mainly has a state variable acquisition unit 143, a learning unit 145, and a determination unit 146.
  • the state variable acquisition unit 143 and the determination unit 146 have the same functions as the state variable acquisition unit 43 and the determination unit 46 shown in FIGS. 9A and 9B, respectively.
  • the learning unit 145 has a reward condition setting unit 145a, a reward calculation unit 145b, and a function update unit 145c.
  • the reward condition setting unit 145a sets the reward condition.
  • the reward calculation unit 145b calculates the reward based on the state variable acquired by the state variable acquisition unit 143 and the reward condition set by the reward condition setting unit 145a.
  • the function update unit 145c updates the action value function based on the reward calculated by the reward calculation unit 145b.
  • the action value function is a function for obtaining a Q value, which is the value of selecting a predetermined action under the state variable acquired by the state variable acquisition unit 143.
  • the function update unit 145c updates the action value function by using, for example, the equation (10).
  • the function update unit 145c outputs the optimized action value function as a trained model. In this way, the learning unit 145 learns the policy that maximizes the reward by adjusting the parameters of the behavior value function and updating the behavior value function based on the state variables, and generates a trained model. ..
  • the learning unit 145 uses the reward to perform reinforcement learning by online learning.
  • the learning unit 45 may use various machine learning techniques.
  • Machine learning methods that can be used by the learning unit 45 include unsupervised learning, semi-supervised learning, transductive learning, multitasking learning, transfer learning, and the like, in addition to the supervised learning and reinforcement learning already described.
  • the learning unit 45 may use these methods in combination.
  • Unsupervised learning is a method of grouping (clustering) input data based on predetermined statistical properties without using teacher data.
  • Models or algorithms used in unsupervised learning include k-means method (k-means method), Ward's method (Ward method), principal component analysis, and the like.
  • the k-means method is a method of repeating the steps of randomly allocating clusters to each input data, calculating the center of each cluster, and reassigning each input data to the cluster of the closest center.
  • Ward's method is a method of repeating the process of reassigning each input data to a cluster so as to minimize the distance from each input data of the cluster to the center of mass of the cluster.
  • Principal component analysis is a multivariate analysis method that generates a variable called the principal component with the smallest correlation from a plurality of correlated variables.
  • Semi-supervised learning is a method of learning using both input data without corresponding teacher data (unlabeled data) and input data with corresponding teacher data (labeled data).
  • Transductive learning is a method in semi-supervised learning that generates an output corresponding to unlabeled data used for learning and does not generate an output corresponding to unknown input data.
  • Multitask learning is a method of sharing information between multiple related tasks and learning these tasks at the same time to acquire common factors for the tasks and improve the prediction accuracy of the tasks.
  • Transfer learning is a method of improving prediction accuracy by adapting a model trained in advance in one domain to another domain.
  • control unit 40 uses the supervised learning method, the control unit 40 uses each data of the state variable, the evaluation data, and the control condition.
  • the state variable contains at least one parameter that correlates with the position of the shaft 115.
  • the state variable acquisition unit 43 acquires the output values of the displacement sensors 31 and 32 as the state variables.
  • the evaluation data includes at least one parameter that correlates with the deviation of the position of the shaft 115 from the target value.
  • the evaluation data acquisition unit 44 acquires the shaft position deviation, which is the difference between the detected value of the position of the shaft 115 and the target value of the position of the shaft 115, as the evaluation data.
  • the detected value is a value converted from the output values of the displacement sensors 31 and 32.
  • the target value is the central position of the movable range of the shaft 115.
  • the control conditions are learned by the learning unit 45 and are conditions for appropriately controlling the position of the shaft 115.
  • the learning unit 45 learns the control conditions for reducing the shaft position deviation.
  • the determination unit 46 determines at least one of the voltage (voltage command value) applied to the coil 65 of the electromagnet of the magnetic bearings 21 and 22 and the current (current command value) flowing through the coil 65 as control conditions.
  • control unit 40 uses the state variable and the reward condition.
  • the state variables are the same as the state variables used when the control unit 40 uses the supervised learning method.
  • the control unit 40 calculates a reward from the shaft position deviation based on a predetermined reward condition.
  • the reward condition is set so that the reward increases when the shaft position deviation is small and the reward decreases or does not change when the shaft position deviation is large.
  • the reward condition is, for example, a condition for calculating the reward based on the evaluation data.
  • the magnetic bearing device 10 included in the air conditioner 100 of the present embodiment adjusts the voltage (voltage command value) applied to the coil of the magnetic bearing to control the position of the magnetically levitated shaft 115. Equipped with a system.
  • the conventional position control system adjusts the voltage command value and the like based on a predetermined control rule. In this case, if an appropriate voltage command value cannot be obtained due to variations in the quality of the device, changes over time in the system, etc., the stability of the levitation control of the shaft deteriorates, or a large disturbance force is generated during levitation.
  • the shaft may come into contact with the touchdown bearing.
  • the control unit 40 having a learning function appropriately controls the position of the shaft 115 based on the state variables correlating with the position of the shaft 115 and the evaluation data regarding the position of the shaft 115.
  • the conditions for performing are learned using a supervised learning method. Since the displacement sensors 31 and 32 detect the position of the shaft 115 at a relatively short time interval (for example, every 40 ⁇ s), the control unit 40 can control the position of the shaft 115 at a relatively short time interval. .. Therefore, the control unit 40 can maintain the stability of the position control of the shaft 115 for a long period of time.
  • the quality of the magnetic bearing device 10 varies, the stability of the levitation control of the shaft 115 deteriorates due to changes over time of the system, and the contact between the shaft 115 and the touchdown bearings 116, 117 due to disturbance force. The occurrence can be suppressed.
  • the state variable acquisition unit 43 acquires the output values of the displacement sensors 31 and 32 as state variables.
  • the output values of the displacement sensors 31 and 32 are parameters that correlate with the position of the shaft 115.
  • the state variable acquisition unit 43 acquires parameters other than the output values of the displacement sensors 31 and 32 as state variables and correlates with the position of the shaft 115. Therefore, this embodiment can be applied to a sensorless type magnetic bearing device that does not have displacement sensors 31 and 32.
  • the state variable acquisition unit 43 acquires information on the species required for estimating the position of the shaft 115 as a state variable.
  • the information necessary for estimating the position of the shaft 115 includes at least two of the current detection value, the voltage detection value, the magnetic flux detection value, the current command value and the voltage command value of the electromagnets of the magnetic bearings 21 and 22.
  • the current detection value is a detection value of the current flowing through the coil 65 of the electromagnet.
  • the voltage detection value is a detection value of the voltage applied to the coil 65 of the electromagnet.
  • the magnetic flux detection value is a detection value of the magnetic field generated from the coil 65 of the electromagnet.
  • the magnetic flux detection value is, for example, an output value of a hall sensor which is a non-contact type magnetic sensor.
  • the current command value is a current value controlled by the control unit 40 and input to the coil 65 of the electromagnet.
  • the voltage command value is a voltage value controlled by the control unit 40 and input to the coil 65 of the electromagnet
  • Examples of the information required for estimating the position of the shaft 115 include the following information (a) to (c).
  • the state variable acquisition unit 43 estimates the position of the shaft 115 by inputting the voltage command value and acquiring the current detection value.
  • the state variable acquisition unit 43 estimates the position of the shaft 115 by inputting the current command value and acquiring the voltage detection value.
  • the state variable acquisition unit 43 utilizes the property that the current (or current derivative value) and the voltage of the coil 65 correlate with the position of the shaft 115, so that the position of the shaft 115 is used. To estimate.
  • the current or voltage may be input in a sinusoidal manner or in a stepped manner.
  • the state variable acquisition unit 43 estimates the position of the shaft 115 by utilizing the property that the current detection value and the magnetic flux detection value correlate with the position of the shaft 115.
  • the evaluation data acquisition unit 44 acquires the shaft position deviation, which is the difference between the estimated value of the position of the shaft 115 converted from the state variable and the target value of the position of the shaft 115, as the evaluation data.
  • the learning unit 45 learns the control conditions for reducing the shaft position deviation.
  • the determination unit 46 determines at least one of the voltage (voltage command value) applied to the coil 65 of the electromagnet of the magnetic bearings 21 and 22 and the current (current command value) flowing through the coil 65 as control conditions.
  • the first and second embodiments relate to a configuration in which all the functions of the position detection unit 941, the position control unit 942, and the current control unit 943 shown in FIG. 7 have a learning function.
  • the third to fifth embodiments described below relate to a configuration in which only one of the functions of the conventional control unit 940, the position detection unit 941, the position control unit 942, and the current control unit 943, has a learning function.
  • FIG. 17 is a block configuration diagram of the position control system of the shaft 115 in the present embodiment. As shown in FIG. 17, the block corresponding to the position detection unit 941 in FIG. 7 is replaced with the learning control unit 340 having a learning function.
  • the learning control unit 340 has the same function as the control unit 40 of the first and second embodiments. In other words, the learning control unit 340 has a state variable acquisition unit 43, an evaluation data acquisition unit 44, a learning unit 45, and a determination unit 46, as shown in FIGS. 9A and 9B.
  • the differences from the control unit 40 of the first and second embodiments will be mainly described.
  • the evaluation data acquisition unit 44 uses the target value (position command value) of the position of the shaft 115 and the detection value (position detection value) of the position of the shaft 115 as the determination data.
  • the evaluation data acquisition unit 44 uses the target value of the parameter (correlation parameter) that correlates with the position of the shaft 115 and the detection value of the correlation parameter as the determination data instead of the position command value and the position detection value.
  • the correlation parameter the state variable acquired by the state variable acquisition unit 43 in the first and second embodiments is used.
  • the evaluation data acquisition unit 44 may use the output values of the displacement sensors 31 and 32 described in the first embodiment as the correlation parameter, and is necessary for estimating the position of the shaft 115 described in the second embodiment. Information may be used.
  • the evaluation data acquisition unit 44 acquires, for example, the deviation of the detected value of the correlation parameter (correlation parameter deviation) as the evaluation data when the target value of the correlation parameter is used as a reference, using the determination data.
  • the learning unit 45 learns the control conditions for reducing the correlation parameter deviation.
  • the determination unit 46 determines the position detection value as a condition (position control condition) for appropriately controlling the position of the shaft 115.
  • the learning unit 45 may learn the position control condition at a specific time point.
  • the specific time point is a time point at which the position of the shaft 115 can be specified or estimated based on the correlation parameter.
  • the specific time point is a time point when the position of the shaft 115 is restricted to a certain degree, or a time point when the force applied to the shaft 115 is known.
  • the time when the position of the shaft 115 is restricted is, for example, the time when the shaft 115 is in contact with the touchdown bearings 116 and 117.
  • the time when the force applied to the shaft 115 is known is, for example, the time when the shaft 115 is free-falling.
  • the evaluation data acquisition unit 44 may acquire the true value of the position of the shaft 115 as the evaluation data instead of the correlation parameter deviation.
  • the position detection value included in the determination data may be used.
  • the position of the shaft 115 specified or estimated at the above-mentioned "specific time point" may be used as the true value of the position of the shaft 115.
  • FIG. 18 is a block configuration diagram of the position control system for the shaft 115 in the present embodiment. As shown in FIG. 18, the block corresponding to the position control unit 942 in FIG. 7 is replaced with the learning control unit 440 having a learning function.
  • the learning control unit 440 has the same function as the control unit 40 of the first and second embodiments. In other words, the learning control unit 440 has a state variable acquisition unit 43, an evaluation data acquisition unit 44, a learning unit 45, and a determination unit 46, as shown in FIGS. 9A and 9B.
  • the differences from the control unit 40 of the first and second embodiments will be mainly described.
  • the state variable acquisition unit 43 uses the target value (position command value) of the position of the shaft 115 and the detection value (position detection value) of the position of the shaft 115 as the state variables.
  • the evaluation data acquisition unit 44 uses the position command value and the position detection value as the determination data.
  • the evaluation data acquisition unit 44 acquires the shaft position deviation, which is the difference between the position command value and the position detection value, as the evaluation data.
  • the learning unit 45 learns the control conditions for reducing the shaft position deviation.
  • the determination unit 46 flows the voltage (voltage command value) applied to the coil 65 of the electromagnet of the magnetic bearings 21 and 22 and the coil 65 as conditions (position control conditions) for appropriately controlling the position of the shaft 115. Determine at least one of the currents (current command values).
  • FIG. 19 is a block configuration diagram of the position control system of the shaft 115 in the present embodiment. As shown in FIG. 19, the block corresponding to the current control unit 943 in FIG. 7 is replaced with the learning control unit 540 having a learning function.
  • the learning control unit 540 has the same function as the control unit 40 of the first and second embodiments. In other words, the learning control unit 540 has a state variable acquisition unit 43, an evaluation data acquisition unit 44, a learning unit 45, and a determination unit 46, as shown in FIGS. 9A and 9B.
  • the differences from the control unit 40 of the first and second embodiments will be mainly described.
  • the state variable acquisition unit 43 uses the current flowing through the coil 65 of the electromagnet of the magnetic bearings 21 and 22 (current command value) and the position detection value (position detection value) of the shaft 115 as state variables. get.
  • the evaluation data acquisition unit 44 uses the current command value and the position detection value as the determination data.
  • the evaluation data acquisition unit 44 acquires an amount (response level) related to the responsiveness of the current control as the evaluation data. The closer the response level is to zero, the more preferable the parameter.
  • the response level may be, for example, the absolute value of the deviation of the current detection value based on the current command value, the root mean square (RMS) or the root mean square (MS), and when a disturbance is forcibly applied. It may be the overshoot amount or the settling time of the deviation.
  • the learning unit 45 learns the control conditions for reducing the response level.
  • the determination unit 46 determines the voltage (voltage command value) applied to the coil 65 of the electromagnet of the magnetic bearings 21 and 22 as a condition (position control condition) for appropriately controlling the position of the shaft 115.
  • the evaluation data acquisition unit 44 further uses a parameter correlating with the current value for driving the magnetic bearings 21 and 22 as determination data.
  • the evaluation data acquisition unit 44 further acquires the current value for driving the magnetic bearings 21 and 22 as evaluation data.
  • the updating unit 47 trains the learning unit 45 so that the current value for driving the magnetic bearings 21 and 22 is set to a predetermined value or less.
  • the predetermined value is an allowable current value of the inverter for driving the magnetic bearings 21 and 22.
  • the evaluation data acquisition unit 44 further uses a parameter that correlates with the temperature of the inverter for driving the magnetic bearings 21 and 22 as determination data.
  • the evaluation data acquisition unit 44 further acquires the temperature of the inverter for driving the magnetic bearings 21 and 22 as evaluation data.
  • the update unit 47 trains the learning unit 45 so that the temperature of the inverter becomes equal to or lower than a predetermined value.
  • the predetermined value is the allowable temperature of the inverter.
  • the state variable acquisition unit 43 uses the magnetic bearing 21, as a state variable, when the magnetic bearings 21 and 22 are driven by a voltage type inverter.
  • the current detection value of the electromagnet of 22 is further acquired, and the voltage detection value of the electromagnet of the magnetic bearings 21 and 22 is further acquired when the magnetic bearings 21 and 22 are driven by the current type inverter.
  • the evaluation data acquisition unit 44 further uses the current command value and the position detection value as the determination data.
  • the evaluation data acquisition unit 44 further acquires an amount (response level) related to the responsiveness of the current control as the evaluation data. The closer the response level is to zero, the more preferable the parameter.
  • the response level may be, for example, the absolute value of the deviation of the current detection value based on the current command value, the root mean square (RMS) or the root mean square (MS), and when a disturbance is forcibly applied. It may be the overshoot amount or the settling time of the deviation.
  • the update unit 47 trains the learning unit 45 so as to reduce the response level.
  • the state variable acquisition unit 43 further acquires the rotation speed of the shaft 115 as a state variable.
  • the state variable acquisition unit 43 further acquires at least one parameter that correlates with the operating conditions of the air conditioner 100 as a state variable.
  • the operating conditions of the air conditioner 100 are a predetermined range of the refrigerating capacity of the air conditioner 100 and the inlet water temperature of the condenser 120.
  • the inlet water temperature is the temperature of water which is a medium for heat exchange with the refrigerant circulating in the refrigerant circuit 190 of the air conditioner 100, and is the temperature of water when flowing into the condenser 120.
  • FIG. 20 is an example of operating conditions of the air conditioner 100.
  • the unit of refrigerating capacity of the air conditioner 100 is a refrigerating ton.
  • the unit of the inlet water temperature of the condenser 120 is Fahrenheit.
  • the hatched region in FIG. 20 is the operating condition of the air conditioner 100, and is the range in which the air conditioner 100 can achieve air conditioning.
  • the parameters that correlate with the operating conditions of the air conditioner 100 are, specifically, data related to the operation information of the air conditioner 100 listed below.
  • (A) Temperature of the refrigerant sucked into the compressor 110 (b) Temperature of the refrigerant discharged from the compressor 110 (c) Pressure of the refrigerant sucked into the compressor 110 (d) Refrigerant discharged from the compressor 110 (E) Flow rate of the refrigerant circulating in the refrigerant circuit 190 (f) Temperature of the water flowing into the compressor 120 (g) Temperature of the water flowing out of the compressor 120 (h) Temperature of the water flowing into the evaporator 140 (I) Temperature of water flowing out from the evaporator 140 (j) Opening of inlet guide vane 113b (k) Number of rotations of the electric motor 114 (l) Rotation angle of the electric motor 114 (m) Torque of the electric motor 114 (n) Electric motor 114 Current value of
  • Water in the parameters (f) to (i) means water which is a medium for heat exchange with the refrigerant in the condenser 120 or the evaporator 140.
  • the parameter that correlates with the operating conditions of the air conditioner 100 includes at least one of the above parameters (a) to (n).
  • the parameters that correlate with the operating conditions of the air conditioner 100 may further include information about the type of refrigerant.
  • control unit 40 can learn the optimum control conditions for each operating condition of the air conditioner 100.
  • the state variable acquisition unit 43 further acquires at least one parameter that correlates with the electromagnetic force applied to the shaft 115 as a state variable.
  • the parameter that correlates with the electromagnetic force applied to the shaft 115 includes at least one of the parameter that correlates with the refrigerant load of the air conditioner 100 and the parameter that correlates with the physical property of the air conditioner 100.
  • the parameter that correlates with the refrigerant load of the air conditioner 100 includes at least one of the parameters (a) to (n) listed in the modified example F.
  • the parameters that correlate with the refrigerant load of the air conditioner 100 may further include information about the type of refrigerant.
  • the parameters that correlate with the physical properties of the air conditioner 100 are the weight of the shaft 115 and at least one of the forces acting on the shaft 115.
  • the force acting on the shaft 115 is at least one of the Coriolis force acting on the shaft 115 and the centrifugal force acting on the shaft 115.
  • a parameter that correlates with the amount of eccentricity of the shaft 115 and at least one of the rotation speeds of the motor 114 may be used.
  • the state variable acquisition unit 43 further acquires at least one parameter that correlates with the characteristics of the magnetic bearings 21 and 22 as a state variable.
  • the parameter that correlates with the characteristics of the magnetic bearings 21 and 22 includes at least one parameter that correlates with the inductance of the coil 65 of the electromagnet of the magnetic bearings 21 and 22 and a parameter that correlates with the resistance of the coil 65.
  • the parameter that correlates with the inductance of the coil 65 is, for example, a detected value of the current flowing through the coil 65.
  • the parameters that correlate with the resistance of the coil 65 are parameters that correlate with the temperature of the coil 65 or the temperature around the coil 65, and specifically, the parameters (a) to (i) listed in the modified example F. ) Includes at least one.
  • the parameters that correlate with the resistance of the coil 65 may further include information about the type of refrigerant.
  • the evaluation data acquisition unit 44 further uses a parameter correlating with the power consumption of the magnetic bearings 21 and 22 as determination data.
  • the parameters that correlate with the power consumption of the magnetic bearings 21 and 22 are the parameters that correlate with the current value for driving the magnetic bearings 21 and 22, the parameters that correlate with the voltage value for driving the magnetic bearings 21 and 22, and the parameters. , Includes at least two of the parameters that correlate with the resistance of the electromagnet coil 65 of the magnetic bearings 21 and 22.
  • the parameter that correlates with the current value for driving the magnetic bearings 21 and 22 is, for example, the detected value of the current flowing through the coil 65.
  • the parameters that correlate with the resistance of the coil 65 are parameters that correlate with the temperature of the coil 65 or the temperature around the coil 65, and specifically, the parameters (a) to (i) listed in the modified example F. ) Includes at least one.
  • the parameters that correlate with the resistance of the coil 65 may further include information about the type of refrigerant.
  • the evaluation data acquisition unit 44 further acquires the power consumption of the magnetic bearings 21 and 22 as evaluation data.
  • the updating unit 47 trains the learning unit 45 so as to reduce the power consumption of the magnetic bearings 21 and 22.
  • control unit 40 can learn the control conditions that can suppress the power consumption of the air conditioner 100.
  • the state variable acquisition unit 43 further acquires at least one parameter that correlates with the operating conditions of the air conditioner 100 as a state variable.
  • the parameter that correlates with the operating conditions of the air conditioner 100 includes at least one of the parameters (a) to (n) listed in the modified example F.
  • the parameters that correlate with the operating conditions of the air conditioner 100 may further include information about the type of refrigerant.
  • the evaluation data acquisition unit 44 correlates with at least the input energy supplied to the compressor 110 driven by the electric motor 114 as determination data.
  • the parameters that correlate with the input energy are the input current of the magnetic bearings 21 and 22, the input power of the magnetic bearings 21 and 22, the input current of the inverter for driving the magnetic bearings 21 and 22, and the magnetic bearings 21 and 22. Includes at least one of the input power of the inverter for, the input current of the motor 114, the input power of the motor 114, the input current of the inverter for driving the motor 114, and the input power of the inverter for driving the motor 114. ..
  • the evaluation data acquisition unit 44 further acquires the input energy supplied to the compressor 110 as the evaluation data.
  • the update unit 47 trains the learning unit 45 so that the input energy supplied to the compressor 110 is reduced.
  • control unit 40 can learn the control conditions that minimize the input energy supplied to the compressor 110.
  • the state variable acquisition unit 43 uses at least one parameter that correlates with the operating conditions of the air conditioner 100 as a state variable, and the heat insulation efficiency of the impeller 113a connected to the shaft 115. Further obtain at least one of at least one parameter that correlates with.
  • the parameter that correlates with the operating conditions of the air conditioner 100 includes at least one of the parameters (a) to (n) listed in the modified example F.
  • the parameters that correlate with the operating conditions of the air conditioner 100 may further include information about the type of refrigerant.
  • the parameter that correlates with the heat insulation efficiency of the impeller 113a includes at least one of the parameter that correlates with the pressure of the refrigerant and the parameter that correlates with the temperature of the refrigerant.
  • the parameter that correlates with the pressure of the refrigerant includes at least one of the parameters (a) to (e) listed in the modified example F.
  • the parameters that correlate with the pressure of the refrigerant may further include information about the type of refrigerant.
  • the parameter that correlates with the temperature of the refrigerant includes at least one of the parameters (a) to (i) listed in the modified example F.
  • the parameters that correlate with the temperature of the refrigerant may further include information about the type of refrigerant.
  • control unit 40 can learn the control conditions that maximize the heat insulation efficiency of the impeller 113a.
  • the state variable acquisition unit 43 further acquires a parameter that correlates with the temperature of the displacement sensors 31 and 32 when acquiring the output values of the displacement sensors 31 and 32 as the state variable.
  • the parameters that correlate with the temperature of the displacement sensors 31 and 32 include at least one of the parameters (a) to (i) listed in the modification F.
  • the parameters that correlate with the temperature of the refrigerant may further include information about the type of refrigerant.
  • control unit 40 can compensate for the deviation of the detected values of the displacement sensors 31 and 32 due to the temperature by using the information on the temperature of the displacement sensors 31 and 32 having the temperature characteristics as a state variable. Therefore, the control unit 40 acquires the estimated value of the positions of the touchdown bearings 116 and 117 with high accuracy, and aligns the shaft 115 so that the rotation axis of the shaft 115 approaches the center of the touchdown bearings 116 and 117. It can be performed.
  • Calibration of the displacement sensors 31 and 32 is performed by forcibly changing parameters such as the position of the shaft 115, the current value of the coil 65 of the electromagnet of the magnetic bearings 21 and 22, and the voltage value of the coil 65. ..
  • a periodic waveform may be superimposed on these parameters, these parameters may be changed in steps, or these parameters may be changed in a ramp shape.
  • Periodic waveforms are, for example, sine waves, square waves, triangular waves and sawtooth waves.
  • the frequency of the periodic waveform may be changed intermittently or continuously.
  • the displacement sensors 31 and 32 may be calibrated by superimposing the position command value of the shaft 115 and the perturbation by a predetermined waveform.
  • the predetermined waveform is, for example, a periodic waveform, a pulse waveform, and a step waveform.
  • Periodic waveforms are, for example, sine waves, square waves, triangular waves and sawtooth waves.
  • the displacement sensors 31 and 32 may be calibrated by setting a certain restriction on the position of the shaft 115. For example, an operation of bringing the shaft 115 into contact with the touchdown bearings 116 and 117 and an operation of which the force acting on the shaft 115 is known may be performed.
  • the operation in which the force acting on the shaft 115 is known is, for example, an operation when the shaft 115 is freely falling.
  • control unit 40 learns the conditions for appropriately controlling the position of the shaft 115 by using the method of supervised learning or reinforcement learning.
  • the control unit 40 may learn the conditions for appropriately controlling the position of the shaft 115 by using a method that combines supervised learning and reinforcement learning.
  • the radial magnetic bearing 21 may use a support mechanism of a bearingless motor (an electric motor having a function of supporting the shaft in a non-contact manner).
  • the magnetic bearing device can appropriately control the position of the supported body.
  • Magnetic bearing device 21 Radial magnetic bearing (magnetic bearing) 22 Thrust magnetic bearing (magnetic bearing) 31 Radial displacement sensor (displacement sensor) 32 Thrust displacement sensor (displacement sensor) 43 State variable acquisition unit 44 Evaluation data acquisition unit 45 Learning unit 46 Decision unit 47 Update unit 47a Storage unit 47b Judgment unit 51 First electromagnet (electromagnet) 52 Second electromagnet (electromagnet) 53 Third electromagnet (electromagnet) 54 4th electromagnet (electromagnet) 100 Air conditioner (freezing device) 110 Compressor 113a Impeller 115 Shaft 120 Condenser 130 Expansion mechanism 140 Evaporator 190 Refrigerant circuit

Abstract

機械学習装置を備え、被支持体の位置の制御を適切に行うことができる磁気軸受装置を提供する。機械学習装置は、磁気軸受装置(10)の制御条件を学習する。磁気軸受装置は、シャフト(115)に電磁力を付与する複数の電磁石(51~54)を有する磁気軸受(21,22)を備える。機械学習装置は、学習部(45)と、状態変数取得部(43)と、評価データ取得部(44)と、更新部(47)とを備える。状態変数取得部は、シャフトの位置に相関する少なくとも1つのパラメータを含む状態変数を取得する。評価データ取得部は、シャフトの位置の測定値、シャフトの位置の目標値、及び、目標値からの偏差に相関するパラメータのうちの少なくとも1つのパラメータを含む評価データを取得する。更新部は、評価データを用いて学習部の学習状態を更新する。学習部は、更新部の出力に従って、制御条件を学習する。

Description

機械学習装置、及び、磁気軸受装置
 機械学習装置、及び、それを備える磁気軸受装置
 従来、複数の電磁石の合成電磁力によりシャフト等の被支持体を非接触で支持する磁気軸受装置が知られている。特許文献1(実開平04-040308号公報)には、被支持体の位置をセンサにより検出し、検出信号に基づいて電磁石の電磁力を制御して被支持体の位置を所定の位置に保持する構成が開示されている。
 磁気軸受装置の製品ごとのバラツキ、及び、磁気軸受装置の経時変化等によって、被支持体の位置の制御が適切に行われなくなる課題がある。
 第1観点の機械学習装置は、磁気軸受装置の制御条件を学習する。磁気軸受装置は、シャフトに電磁力を付与する複数の電磁石を有する磁気軸受を備える。機械学習装置は、学習部と、状態変数取得部と、評価データ取得部と、更新部とを備える。状態変数取得部は、シャフトの位置に相関する少なくとも1つのパラメータを含む状態変数を取得する。評価データ取得部は、シャフトの位置の測定値、シャフトの位置の目標値、及び、目標値からの偏差に相関するパラメータのうちの少なくとも1つのパラメータを含む評価データを取得する。更新部は、評価データを用いて学習部の学習状態を更新する。学習部は、更新部の出力に従って、制御条件を学習する。
 第2観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、シャフトの位置に応じた信号を出力する変位センサの出力値を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも1つを制御条件として学習する。
 第3観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、電磁石の電流値及び電圧値、又は、電磁石の電流値及び磁束を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも1つを制御条件として学習する。
 第4観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、シャフトの位置に応じた信号を出力する変位センサの出力値を少なくとも含む。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。
 第5観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、電磁石の電流値及び電圧値、又は、電磁石の電流値及び磁束を少なくとも含む。評価データは、シャフトの位置の真値を少なくとも含む。学習部は、シャフトの位置を制御条件として学習する。
 第6観点の機械学習装置は、第1観点の機械学習装置であって、状態変数は、シャフトの位置の検出値、及び、シャフトの位置の指令値を少なくとも含む。学習部は、電磁石の電圧値、及び、電磁石の電流値の少なくとも1つを制御条件として学習する。
 第7観点の機械学習装置は、第2又は第3観点の機械学習装置であって、更新部は、磁気軸受を駆動するための電流値を所定の許容値以下にするように学習部をさらに学習させる。
 第8観点の機械学習装置は、第2又は第3観点の機械学習装置であって、評価データは、磁気軸受を駆動するインバータの温度に相関するパラメータをさらに含む。更新部は、インバータの温度を所定の許容値以下にするように学習部をさらに学習させる。
 第9観点の機械学習装置は、第2、第3及び第6観点のいずれか1つの機械学習装置であって、状態変数は、磁気軸受が電圧型インバータによって駆動される場合には電磁石の電流検出値をさらに含み、磁気軸受が電流型インバータによって駆動される場合には電磁石の電圧検出値をさらに含む。
 第10観点の機械学習装置は、第9観点の機械学習装置であって、更新部は、電流値の制御の応答性に相関する値を小さくするために学習部をさらに学習させる。
 第11観点の機械学習装置は、第2、第3及び第6観点のいずれか1つの機械学習装置であって、状態変数は、シャフトの回転数をさらに含む。
 第12観点の機械学習装置は、第2、第3及び第6観点のいずれか1つの機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも1つのパラメータをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。
 第13観点の機械学習装置は、第12観点の機械学習装置であって、状態変数は、シャフトに付与される電磁力に相関する少なくとも1つのパラメータをさらに含む。電磁力に相関するパラメータは、冷凍装置の冷媒負荷に相関するパラメータ、及び、冷凍装置の物理特性に相関するパラメータの少なくとも1つを含む。
 第14観点の機械学習装置は、第12観点の機械学習装置であって、状態変数は、磁気軸受の特性に相関する少なくとも1つのパラメータをさらに含む。磁気軸受の特性に相関するパラメータは、電磁石のコイルのインダクタンスに相関するパラメータ、及び、電磁石のコイルの抵抗に相関するパラメータの少なくとも1つを含む。
 第15観点の機械学習装置は、第2又は第3観点の機械学習装置であって、評価データは、磁気軸受の消費電力に相関するパラメータをさらに含む。更新部は、消費電力を小さくするために学習部をさらに学習させる。消費電力に相関するパラメータは、磁気軸受を駆動するための電流値、磁気軸受を駆動するための電圧値、及び、電磁石のコイルの抵抗のうちの少なくとも2つを含む。
 第16観点の機械学習装置は、第7、第8及び第15観点のいずれか1つの機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも1つのパラメータをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。
 第17観点の機械学習装置は、第2、第3及び第6観点のいずれか1つの機械学習装置であって、評価データは、電動機によって駆動される圧縮機に供給される入力エネルギーに相関する少なくとも1つのパラメータをさらに含む。更新部は、入力エネルギーを小さくするために学習部をさらに学習させる。
 第18観点の機械学習装置は、第17観点の機械学習装置であって、状態変数は、冷凍装置の運転条件に相関する少なくとも1つのパラメータ、及び、シャフトに連結されるインペラの断熱効率に相関する少なくとも1つのパラメータの少なくとも1つをさらに含む。冷凍装置は、電動機によって駆動される圧縮機と、凝縮器と、膨張機構と、蒸発器とが接続された冷媒回路を備える。運転条件は、冷凍装置の冷凍能力の範囲、及び、冷媒回路を循環する冷媒と熱交換される媒体であって凝縮器に流入する媒体の温度の範囲を含む。インペラの断熱効率に相関するパラメータは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも1つを含む。
 第19観点の機械学習装置は、第2又は第4観点の機械学習装置であって、状態変数は、変位センサの温度に相関するパラメータをさらに含む。
 第20観点の機械学習装置は、第1乃至第19観点のいずれか1つの機械学習装置であって、更新部は、評価データに基づいて報酬を算出する。学習部は、報酬を用いて学習する。
 第21観点の機械学習装置は、第1乃至第19観点のいずれか1つの機械学習装置であって、学習部は、更新部の出力に従って、関数のパラメータの変更を複数回行い、パラメータが変更された関数ごとに状態変数から制御条件を出力する。更新部は、蓄積部と、判定部とを備える。判定部は、評価データを判定して、判定結果を出力する。蓄積部は、判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部は、蓄積部に蓄積された教師データに基づいて学習する。
 第22観点の機械学習装置は、第1乃至第21観点のいずれか1つの機械学習装置であって、学習部が学習した結果得られた学習済みモデルに基づいて、制御条件を出力する。
 第23観点の磁気軸受装置は、第22観点の機械学習装置を備える。
第1実施形態に係る磁気軸受装置10を備える空気調和装置100の全体構成図である。 圧縮機110の縦断面図である。 ラジアル磁気軸受21の横断面図である。 ラジアル磁気軸受21の縦断面図である。 スラスト磁気軸受22の平面図である。 スラスト磁気軸受22の縦断面図である。 比較のための参考図であって、シャフト115の位置制御システムのブロック構成図である。 第1実施形態における、シャフト115の位置制御システムのブロック構成図である。 教師あり学習を行う制御部40のブロック構成図である。 教師あり学習を行う制御部40のブロック構成図である。 ニューラルネットワークのニューロンのモデルの模式図である。 図10に示されるニューロンを組み合わせて構成した三層のニューラルネットワークの模式図である。 サポートベクターマシンを説明するための図である。2クラスの学習データが線形分離可能である特徴空間を表す。 2クラスの学習データが線形分離不可能である特徴空間を表す。 分割統治法によって構成された決定木の一例である。 図14の決定木によって分割される特徴空間を表す。 Q学習による強化学習を行う制御部40のブロック構成図である。 第3実施形態における、シャフト115の位置制御システムのブロック構成図である。 第4実施形態における、シャフト115の位置制御システムのブロック構成図である。 第5実施形態における、シャフト115の位置制御システムのブロック構成図である。 変形例Fにおける空気調和装置100の運転条件の一例である。
 ―第1実施形態―
 第1実施形態に係る磁気軸受装置10を備える空気調和装置100について、図面を参照しながら説明する。
 (1)空気調和装置100の全体構成
 図1は、空気調和装置100の全体構成図である。空気調和装置100は、冷媒回路190を備える。冷媒回路190は、冷媒が充填された閉回路である。冷媒回路190には、圧縮機110、凝縮器120、膨張弁130、蒸発器140、及び、電動機冷却制御装置150が設けられている。圧縮機110には、種々の圧縮機を採用できる。本実施形態では、圧縮機110は、ターボ圧縮機である。圧縮機110は、電動機114によって駆動される。電動機114には、電動機制御装置160から電力が供給される。
 凝縮器120及び蒸発器140は、水冷媒熱交換器である。膨張弁130は、例えば、電子膨張弁である。冷媒回路190には、冷媒圧力を検出するセンサ、及び、冷媒温度を検出するセンサ等が設けられている。
 図2は、圧縮機110の縦断面図である。圧縮機110は、主として、ケーシング112と、圧縮機構113と、電動機114と、シャフト115と、ラジアルタッチダウン軸受116と、スラストタッチダウン軸受117と、磁気軸受装置10とを備える。
 ケーシング112は、両端が閉塞された円筒形状を有する。ケーシング112は、その円筒形状の円筒軸が水平方向に平行となるように配置される。ケーシング112内の空間は、壁部112aによって区画される。図2において、壁部112aよりも右側の空間は、圧縮機構113を収容する圧縮機構室S1である。図2において、壁部112aよりも左側の空間は、電動機114を収容する電動機室S2である。ケーシング112内の空間には、水平方向に延びるシャフト115が配置される。シャフト115は、圧縮機構113と電動機114とを連結している。
 圧縮機構113は、流体を圧縮する。流体とは、本実施形態では、冷媒回路190に充填されている冷媒である。圧縮機構113は、主として、羽根車113aと、インレットガイドベーン113bとを備える。羽根車113aは、複数の羽根によって外形が略円錐形状となるように構成されている。羽根車113aは、シャフト115の一方の端部に固定されている。インレットガイドベーン113bは、圧縮機構113の流体の吸入口に設けられる。インレットガイドベーン113bは、流体の吸入量を制御するための弁である。
 電動機114は、シャフト115を回転駆動する。電動機114は、主として、固定子114aと、回転子114bとを有する。固定子114aは、円筒形状に形成され、ケーシング112内に固定されている。回転子114bは、円柱形状に形成され、固定子114aの内側に回転可能に設置されている。回転子114bの中心部には、シャフト115が固定される軸孔が形成されている。シャフト115の端部には、円盤部115aが固定されている。円盤部115aは、羽根車113aが固定されていない方の端部に固定されている。
 電動機制御装置160は、電動機114に供給する電力を制御して、電動機114の起動、停止、及び、回転速度の制御を行う。電動機制御装置160は、主として、コンバータ回路、インバータ回路、及び、マイクロコンピュータを備える。これらは、制御基板160a上に実装されている。マイクロコンピュータは、インバータ回路が有するスイッチング素子のスイッチング動作を制御する。そのため、マイクロコンピュータには、電動機114の回転速度、及び、電動機114の電流値の情報等が入力される。制御基板160aには、スイッチング素子の保護等の目的で温度センサが設けられている。マイクロコンピュータは、インバータ回路の制御の際に、その温度センサの検出値を利用する。
 圧縮機110は、凝縮器120内の冷媒を電動機114の内部に流すことで電動機114を冷却する。電動機冷却制御装置150は、電動の開閉弁150aと、温度センサ150bとを有する。電動機冷却制御装置150は、温度センサ150bの検出値に応じて、開閉弁150aを制御し、凝縮器120から電動機114に流入する冷媒の流量を制御する。これにより、冷媒回路190では、電動機114の温度を所定温度範囲に維持することができる。電動機114は、開閉弁150aを介して凝縮器120に配管接続されている。電動機114は、蒸発器140にも配管接続されている。電動機114内を流れて電動機114を冷却した冷媒は、蒸発器140に戻されている。温度センサ150bは、電動機114と蒸発器140とを連結する配管に取り付けられている。
 圧縮機110は、ラジアルタッチダウン軸受116及びスラストタッチダウン軸受117の2種類のタッチダウン軸受を有する。ラジアルタッチダウン軸受116は、磁気軸受装置10が非通電であるとき、言い換えると、シャフト115が磁気浮上していないときに、シャフト115を支持する。
 (2)磁気軸受装置10の詳細構成
 磁気軸受装置10は、被支持体であるシャフト115を磁気浮上させることで、シャフト115を非接触で回転可能に支持する。磁気軸受装置10は、主として、1つ又は複数(本実施形態では3つ)の磁気軸受21,22と、1つ又は複数(本実施形態では5つ)の変位センサ31,32と、制御部40とを備える。
 (2-1)磁気軸受21,22
 磁気軸受21,22は、被支持体を挟んで互いに対向する電磁石対を有する。磁気軸受21,22は、電磁石対の合成電磁力により被支持体を非接触に支持するように構成されている。磁気軸受21,22では、電磁石対に流れる電流を制御することにより、その電磁石対の合成電磁力を制御して、その電磁石対の対向方向における被支持体の位置を制御することができる。本実施形態では、磁気軸受装置10は、磁気軸受21,22として、2つのラジアル磁気軸受21と、1つのスラスト磁気軸受22とを備える。
 (2-1-1)ラジアル磁気軸受21
 図3は、ラジアル磁気軸受21の横断面図である。図4は、ラジアル磁気軸受21の縦断面図である。図3及び図4に示されるように、ラジアル磁気軸受21は、第1~第4電磁石51~54を有し、ヘテロポーラ型のラジアル磁気軸受を構成している。第1及び第2電磁石51,52は、シャフト115を挟んで互いに対向し、第1及び第2電磁石51,52の電磁力F1,F2によりシャフト115を非接触に支持する。第3及び第4電磁石53,54は、シャフト115を挟んで互いに対向し、第3及び第4電磁石53,54の電磁力F3,F4によりシャフト115を非接触に支持する。第3及び第4電磁石53,54の対向方向は、平面視において、第1及び第2電磁石51,52の対向方向と直交している。
 図3では、ラジアル磁気軸受21は、磁気軸受コア61と、8つのコイル65とを備える。磁気軸受コア61は、例えば、複数の電磁鋼板が積層されて構成され、バックヨーク62と8つのティース63とを有する。バックヨーク62は、円筒状に形成されている。8つのティース63は、バックヨーク62の内周面に沿うように所定間隔(本実施形態では45°間隔)で周方向に配列される。ティース63は、バックヨーク62の内周面から径方向内側に突出する。ティース63の内周面(突端面)は、シャフト115の外周面と所定のギャップを隔てて対向する。
 8つのコイル65は、磁気軸受コア61の8つのティース63にそれぞれ巻回されている。これにより、8つの電磁石部71~78が形成される。図3では、第1電磁石部71、第2電磁石部72、第7電磁石部77、第8電磁石部78、第3電磁石部73、第4電磁石部74、第5電磁石部75及び第6電磁石部76が、時計回り方向に順に配列されている。第1電磁石51は、第1電磁石部71及び第2電磁石部72を有する。第2電磁石52は、第3電磁石部73及び第4電磁石部74を有する。第3電磁石53は、第5電磁石部75及び第6電磁石部76を有する。第4電磁石54は、第7電磁石部77及び第8電磁石部78を有する。8つの電磁石部71~78に流れる電流を制御して、第1~第4電磁石51~54の電磁力F1~F4の合力である合成電磁力を制御することで、第1及び第2電磁石51,52の対向方向、及び、第3及び第4電磁石53,54の対向方向におけるシャフト115の位置を制御することができる。
 コイル65の巻回方向、及び、コイル65に流れる電流の向きは、第1~第4電磁石51~54の各々に吸引力が発生するように設定されている。この場合、吸引力とは、シャフト115を引き寄せる方向に作用する電磁力である。具体的には、コイル65の巻回方向、及び、コイル65に流れる電流の向きは、図3に示されるループ状の矢印の方向に磁束が発生するように設定されている。
 (2-1-2)スラスト磁気軸受22
 図5は、スラスト磁気軸受22の平面図である。図6は、スラスト磁気軸受22の縦断面図である。図5及び図6に示されるように、スラスト磁気軸受22は、第1及び第2電磁石51,52を有している。第1及び第2電磁石51,52は、円盤部115aを水平方向に挟んで互いに対向し、第1及び第2電磁石51,52の電磁力F1,F2により円盤部115aを非接触に支持する。
 具体的には、スラスト磁気軸受22は、2つの磁気軸受コア61と、2つのコイル65とを備える。2つの磁気軸受コア61は、それぞれが円環状に形成され、円盤部115aの軸方向両側に所定のギャップを隔てて配置されている。磁気軸受コア61の対向面には、円周溝が全周に亘って形成されている。2つのコイル65は、2つの磁気軸受コア61の円周溝にそれぞれ収容されている。これにより、第1及び第2電磁石51,52が構成されている。第1及び第2電磁石51,52に流れる電流を制御して、第1及び第2電磁石51,52の電磁力F1,F2の合力である合成電磁力を制御することで、第1及び第2電磁石51,52の対向方向(水平方向)における円盤部115aの位置(シャフト115の位置)を制御することができる。
 コイル65の巻回方向、及び、コイル65に流れる電流の向きは、第1及び第2電磁石51,52の各々に吸引力が発生するように設定されている。この場合、吸引力とは、円盤部115aを引き寄せる方向に作用する電磁力である。具体的には、コイル65の巻回方向、及び、コイル65に流れる電流の向きは、図6に示されるループ状の矢印の方向に磁束が発生するように設定されている。
 (2-2)変位センサ31,32
 変位センサ31,32は、いずれも渦電流式の変位センサである。変位センサ31,32は、被支持体を挟んで互いに対向する電磁石対(第1及び第2電磁石51,52の組)に対応して設けられる。変位センサ31,32は、変位センサ31,32の基準位置に対する被支持体の変位量を検出する。変位センサ31,32の基準位置とは、例えば、変位センサ31,32のセンサヘッドの位置、又は、電磁石対の対向方向における中央位置である。電磁石対の対向方向における中央位置とは、例えば、第1電磁石51と第2電磁石52との間の中央位置である。本実施形態では、磁気軸受装置10は、変位センサ31,32として、ラジアル変位センサ31と、スラスト変位センサ32とを有する。
 (2-2-1)ラジアル変位センサ31
 ラジアル変位センサ31は、各ラジアル磁気軸受21に2つずつ設けられている。言い換えると、磁気軸受装置10は、4つのラジアル変位センサ31を備える。ラジアル変位センサ31は、ラジアル変位センサ31の基準位置に対する変位量を検出する。ラジアル変位センサ31の基準位置とは、例えば、ラジアル変位センサ31のセンサヘッドの位置、又は、シャフト115の中央位置である。各ラジアル磁気軸受21では、一方のラジアル変位センサ31が、ラジアル磁気軸受21の第1電磁石51と第2電磁石52との対向方向(X軸方向)の変位量を検出する。X軸方向は、ラジアル磁気軸受21の径方向である。他方のラジアル変位センサ31は、ラジアル磁気軸受21の第3電磁石53と第4電磁石54との対向方向(Y軸方向)の変位量を検出する。Y軸方向は、X軸方向と直交する、ラジアル磁気軸受21の径方向である。
 ラジアル変位センサ31は、ラジアル変位センサ31の基準位置に対する変位量を所定の時間間隔で検出する。所定の時間間隔は、例えば、40μ秒である。
 (2-2-2)スラスト変位センサ32
 磁気軸受装置10は、1つのスラスト変位センサ32を備える。スラスト変位センサ32は、スラスト磁気軸受22の第1電磁石51と第2電磁石52との対向方向(Z軸方向)の変位量を検出する。Z軸方向は、シャフト115の回転軸に沿った方向である。スラスト変位センサ32は、スラスト変位センサ32の基準位置に対する変位量を検出する。スラスト変位センサ32の基準位置とは、例えば、スラスト変位センサ32のセンサヘッドの位置、又は、円盤部115aの中央位置である。
 スラスト変位センサ32は、スラスト変位センサ32の基準位置に対する変位量を所定の時間間隔で検出する。所定の時間間隔は、例えば、40μ秒である。
 (2-3)制御部40
 制御部40は、被支持体(シャフト115及び円盤部115a)が非接触に支持されるように、1つ又は複数の磁気軸受21,22を制御する。制御部40は、各磁気軸受21,22の電磁力を制御することによって、被支持体の浮上制御を行う。制御部40は、具体的には、マイクロコンピュータと、それを動作させるためのソフトウェアを格納したメモリディバイス等から構成される。制御部40は、ラジアル制御部41と、スラスト制御部42とを有する。
 (2-3-1)ラジアル制御部41
 ラジアル制御部41は、2つのラジアル磁気軸受21によるシャフト115の浮上制御を行う。この浮上制御では、ラジアル制御部41は、X軸方向及びY軸方向のそれぞれにおけるシャフト115の位置制御を行う。具体的には、ラジアル制御部41は、X軸方向及びY軸方向の各方向について、ラジアル変位センサ31が検出した変位量に基づいて、シャフト115の位置と、予め定められた位置指令値との差分値がゼロに収束するように、ラジアル磁気軸受21の第1~第4電磁石51~54を構成するそれぞれのコイル65に電流(制御電流)を流す。ラジアル制御部41は、各コイル65に制御電流が流れるように、各コイル65に印加される電圧(電圧指令値)を出力する。
 (2-3-2)スラスト制御部42
 スラスト制御部42は、スラスト磁気軸受22による円盤部115aの浮上制御を行う。この浮上制御では、スラスト制御部42は、Z軸方向における円盤部115aの位置制御を行う。具体的には、スラスト制御部42は、Z軸方向について、スラスト変位センサ32が検出した変位量に基づいて、円盤部115aの位置と、予め定められた位置指令値との差分値がゼロに収束するように、スラスト磁気軸受22の第1及び第2電磁石51,52を構成するそれぞれのコイル65に電流(制御電流)を流す。スラスト制御部42は、各コイル65に制御電流が流れるように、各コイル65に印加される電圧(電圧指令値)を出力する。
 (2-4)磁気軸受装置10の位置制御システム
 磁気軸受装置10は、シャフト115の位置制御システムを有する。位置制御システムでは、制御部40は、各磁気軸受21,22の電磁力を制御することによって、非接触支持されているシャフト115の位置制御を行う。
 次に、制御部40(ラジアル制御部41及びスラスト制御部42)が2つのラジアル磁気軸受21及び1つのスラスト磁気軸受22の電磁力を制御することで、シャフト115の位置制御を行う手法について説明する。シャフト115の位置制御では、シャフト115をZ軸に沿って見た場合に、X軸及びY軸を含むXY平面におけるシャフト115の可動限界領域の中心に、シャフト115の回転軸が位置するように、シャフト115の位置が制御される。シャフト115の可動限界領域は、シャフト115がラジアルタッチダウン軸受116と接触する位置より内側の領域である。具体的には、例えば、シャフト115の可動限界領域は、半径250μmの円形領域である。シャフト115の回転時において、例えば、シャフト115は、その回転軸から10μm以下の範囲を揺れ動く。シャフト115の可動許容領域は、例えば、半径83μmの円形領域である。シャフト115の可動許容領域は、シャフト115の回転時において、シャフト115が、その回転軸から離れて揺れ動くことが許容される範囲である。
 本実施形態では、制御部40は、機械学習の手法を用いて、シャフト115の位置制御を行う。ここで、比較のために、機械学習の手法を用いない、従来の制御部の動作について説明する。図7は、比較のための参考図であって、従来の制御部940を含む、シャフト115の位置制御システムのブロック構成図である。制御部940は、主として、位置検出部941と、位置制御部942と、電流制御部943とを有する。図7には、制御対象装置50及び外部装置60が示されている。制御対象装置50及び外部装置60は、制御部940と情報を送受信する。制御対象装置50は、磁気軸受装置10が有する装置であって、具体的には、シャフト115、磁気軸受21,22及び変位センサ31,32である。外部装置60は、磁気軸受装置10以外の装置であって、空気調和装置100が有する装置である。外部装置60は、例えば、電動機冷却制御装置150である。
 位置検出部941は、XY平面におけるシャフト115の位置を検出する。位置検出部941は、変位センサ31,32の出力値を受信する。変位センサ31,32の出力値は、シャフト115のX軸方向の位置、及び、シャフト115のY軸方向の位置を含む。位置検出部941は、空気調和装置100の運転に関する情報を外部装置60から受信する。位置検出部941は、変位センサ31,32から受信した出力値、及び、外部装置60から受信した情報(外部情報)に基づいて、シャフト115の位置に関する情報である位置検出値を出力する。
 位置制御部942は、位置検出部941が検出したシャフト115の位置に関する情報、及び、外部情報に基づいて、シャフト115が可動許容領域内で回転するように、予め定められた制御規則に基づいて電流指令値を出力する。電流指令値は、磁気軸受21,22の電磁石のコイル65に入力される電流である。
 電流制御部943は、位置制御部942が出力した電流指令値、磁気軸受21,22のコイル65を流れている電流の検出値、及び、外部情報に基づいて、磁気軸受21,22のコイル65に印加される電圧指令値を出力する。電圧指令値は、磁気軸受21,22のコイル65に印加される電圧である。
 制御部940は、制御対象装置50及び外部装置60の出力値に基づいて、シャフト115が可動許容領域内で回転するように、予め定められた制御規則に基づいて電圧指令値を出力する。
 次に、本実施形態の制御部40によるシャフト115の位置制御について説明する。図8は、本実施形態の制御部40を含む、シャフト115の位置制御システムのブロック構成図である。制御部40は、磁気軸受装置10の制御条件を学習する機械学習装置としての機能を有する。具体的には、制御部40は、機械学習の手法を用いて、シャフト115の位置制御を行う。より具体的には、制御部40は、制御対象装置50の出力値を用いて、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習又は強化学習の手法を用いて学習する。本実施形態では、制御対象装置50は、シャフト115、磁気軸受21,22及び変位センサ31,32の少なくとも一部である。制御部40は、位置制御条件の学習結果を用いて、新たな出力値について最適な位置制御条件を決定する。制御部40は、主として、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46と、更新部47とを有する。図9A及び図9Bは、教師あり学習を行う制御部40のブロック構成図である。
 (2-4-1)状態変数取得部43
 状態変数取得部43は、磁気軸受装置10の動作中に磁気軸受装置10の状態を観測して、観測された状態に関する情報を状態変数として取得する。言い換えると、状態変数取得部43は、磁気軸受装置10の状態が入力され、状態変数を出力する。状態変数は、シャフト115の位置に相関する少なくとも1つのパラメータを含む。本実施形態では、状態変数は、変位センサ31,32の出力値である。状態変数は、教師あり学習において教師データとして用いられる。
 ここで、シャフト115の位置とは、シャフト115の回転軸(Z軸)回りの角度を除く5自由度を規制する座標値の少なくとも1つである。5自由度の一の例は、シャフト115の重心位置のX軸方向、Y軸方向及びZ軸方向のそれぞれの座標値、シャフト115のX軸回りの角度、及び、シャフト115のY軸回りの角度である。5自由度の他の例は、2つのラジアル磁気軸受21のそれぞれのX軸方向及びY軸方向の座標値、及び、2つのラジアル磁気軸受21の重心のZ軸方向の座標値である。具体例を挙げると、シャフト115の位置として、XY平面におけるシャフト115の重心位置が用いられてもよい。
 (2-4-2)評価データ取得部44
 評価データ取得部44は、判定データを評価して、評価データを取得する。評価データは、教師あり学習において教師データとして用いられる。評価データは、シャフト115の位置の測定値、シャフト115の位置の目標値、及び、シャフト115の位置の目標値からの偏差に相関するパラメータ、のうちの少なくとも1つのパラメータを含む。評価データ取得部44は、例えば、判定データを所定の評価関数に入力して、評価関数の出力値を評価データとして取得する。言い換えると、評価データ取得部44は、判定データが入力され、評価データを出力する。判定データは、例えば、シャフト115の位置制御の評価に用いることができるデータである。本実施形態では、判定データは、シャフト115の可動範囲の中心位置(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)である。位置指令値は、シャフト115の位置の目標値である。位置検出値は、例えば、変位センサ31,32の出力値から得られた、シャフト115の位置の検出値である。
 この場合、制御部40は、位置検出値が位置指令値にできるだけ近くなるように、シャフト115の位置制御を行う。そのため、評価データ取得部44は、判定データを用いて、位置指令値を基準にした場合の位置検出値の偏差(シャフト位置偏差)を評価データとして取得する。シャフト位置偏差は、ゼロに近いほど好ましい。この場合、評価関数の入力値は位置指令値及び位置検出値であり、評価関数の出力値はシャフト位置偏差である。
 評価関数は、シャフト位置偏差が所定範囲内であれば一定値と見なされる関数であってもよい。所定範囲とは、ゼロの近傍の範囲であり、一定値とは、ゼロである。言い換えると、シャフト115の位置制御の観点からは、シャフト位置偏差はゼロ近傍に留まればよく、ゼロに収束する必要はない。
 シャフト位置偏差は、例えば、位置指令値と位置検出値との間の距離の絶対値である。しかし、シャフト位置偏差は、現在から過去の所定時点までにおける当該距離の二乗平均平方根(RMS)又は二乗平均(MS)でもよく、強制的に外乱を加えた場合の当該距離のオーバーシュート量又は整定時間でもよい。オーバーシュート量とは、位置検出値が位置指令値に近付く過程において、位置検出値が位置指令値を超えた(オーバーシュートした)場合に、位置指令値を超えた分の量である。整定時間とは、位置検出値が位置指令値に近付く過程において、位置検出値が、位置指令値の近傍の所定の許容範囲内に入り、かつ、以降はその許容範囲から出なくなる時点までの時間である。
 (2-4-3)学習部45
 学習部45は、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習又は強化学習の手法を用いて学習する。学習部45は、更新部47の出力に従って位置制御条件を学習する。次に、教師あり学習を用いる場合の学習部45の動作について説明する。
 学習部45は、学習データとして、状態変数取得部43が予め取得した状態変数と、評価データ取得部44が予め取得した評価データとの対を用いる。本実施形態では、状態変数は、変位センサ31,32の出力値であり、評価データは、シャフト位置偏差である。学習部45が学習に使用する教師データは、状態変数と評価データとの対である。
 学習部45は、更新部47の出力に従って、状態変数から評価データへの写像である識別関数のパラメータを調整することで、位置制御条件を学習する。学習部45による学習の目的は、新規の状態変数から正しい又は適切な評価データを得ることができるように、学習データを用いて識別関数のパラメータを調整することである。学習部45によってパラメータが十分に調整された識別関数は、学習済みモデルに相当する。
 学習部45は、図9Aに示されるように、教師データの一部を学習データとして用いて識別関数のパラメータを調整し、残りをテストデータとして用いてもよい。テストデータとは、学習に使用されなかったデータであり、主に、学習済みモデルの性能評価に用いられるデータである。テストデータを用いることで、新規の状態変数から得られた評価データの性能を、テストデータに対する誤り確率という形式で予測することができる。予め取得したデータを学習データとテストデータとに分ける手法としては、ホールドアウト法、交差確認法、一つ抜き法(ジャックナイフ法)及びブートストラップ法等が用いられる。
 また、学習部45による学習は、モデルが更新されるタイミングに応じて、オンライン学習とバッチ学習とに分類される。オンライン学習とは、モデルの更新に必要なデータを取得する度に、新たに取得したデータのみを用いて、従来のモデルを随時更新する手法である。バッチ学習とは、モデルの更新に必要なデータを全て揃えた後、所定のタイミングで、学習対象となるデータを全てまとめて一括で処理してモデルを生成する手法である。
 (2-4-4)更新部47
 更新部47は、評価データを用いて学習部45の学習状態を更新する。学習部45は、更新部47の出力(教師データ)に従って、識別関数のパラメータの変更を複数回行い、パラメータが変更された識別関数ごとに状態変数から制御条件(位置制御条件)を出力する。
 更新部47は、蓄積部47aと、判定部47bとを備える。判定部47bは、評価データを判定して、判定結果を出力する。蓄積部47aは、評価データの判定結果に基づいて、状態変数及び評価データから教師データを作成して蓄積する。学習部45は、蓄積部47aに蓄積された教師データに基づいて制御条件を学習する。
 (2-4-5)決定部46
 決定部46は、学習部45による学習の結果得られた学習済みモデルに基づいて、シャフト115の位置に相関する新規の状態変数から、シャフト115の位置制御を適切に行うための条件(位置制御条件)を決定して出力する。シャフト115の位置に相関する状態変数は、変位センサ31,32の出力値である。位置制御条件は、磁気軸受装置10を駆動するための情報である。本実施形態では、位置制御条件は、磁気軸受装置10を駆動するための電流又は電圧であり、具体的には、磁気軸受21,22のコイル65に印加される電圧(電圧指令値)である。
 図9A及び図9Bは、学習済みモデルに基づいて新規の状態変数から位置制御条件を決定する時におけるデータの流れを表す。
 図9Aでは、オンライン学習による教師あり学習が行われる。この場合、学習部45は、磁気軸受装置10の出荷又は設置前の試験運転時等に取得したデータ(状態変数)を用いて学習済みモデルを予め生成する。決定部46は、磁気軸受装置10の初回運転開始時には、学習部45が予め生成した学習済みモデルに基づいて、位置制御条件を決定する。その後、学習部45は、磁気軸受装置10の運転時に新たに取得したデータ(状態変数)を用いて学習済みモデルを更新する。決定部46は、学習部45が更新した学習済みモデルに基づいて、位置制御条件を決定する。このように、オンライン学習では、学習済みモデルが定期的に更新され、決定部46は、最新の学習済みモデルに基づいて、位置制御条件を決定する。
 図9Bでは、バッチ学習による教師あり学習が行われる。この場合、学習部45は、磁気軸受装置10の出荷又は設置前の試験運転時等に取得したデータ(状態変数)を用いて学習済みモデルを予め生成する。決定部46は、磁気軸受装置10の運転時において、学習部45が予め生成した学習済みモデルに基づいて、位置制御条件を決定する。この学習済みモデルは、学習部45によって予め生成された後は更新されない。言い換えると、決定部46は、同じ学習済みモデルを用いて位置制御条件を決定する。
 図9A及び図9Bに示される構成では、磁気軸受装置10が備える制御部40が、学習済みモデルを生成する。しかし、制御部40とインターネット等のコンピュータネットワークを介して接続されたサーバが、学習済みモデルを生成してもよく、また、クラウドコンピューティングのサービスを利用して、学習済みモデルを生成してもよい。
 (2-4-6)教師あり学習
 学習部45が用いる機械学習の手法である教師あり学習について説明する。教師あり学習は、教師データを用いて、未知の入力データに対応する出力を生成する手法である。教師あり学習では、学習データと識別関数とが用いられる。学習データとは、入力データと、それに対応する教師データとの対の集合である。入力データは、例えば、特徴空間における特徴ベクトルである。教師データは、例えば、入力データの識別、分類及び評価に関するパラメータである。識別関数は、入力データから、それに対応する出力への写像を表す。教師あり学習は、事前に与えられた学習データを用いて、識別関数の出力と教師データとの誤差が小さくなるように、識別関数のパラメータを調整する手法である。教師あり学習で用いられるモデル又はアルゴリズムとしては、回帰分析、時系列分析、決定木、サポートベクターマシン、ニューラルネットワーク、アンサンブル学習等が挙げられる。
 回帰分析は、例えば、線形回帰分析、重回帰分析、ロジスティック回帰分析である。回帰分析は、最小二乗法等を用いて、入力データ(説明変数)と教師データ(目的変数)との間にモデルを当てはめる手法である。説明変数の次元は、線形回帰分析では1であり、重回帰分析では2以上である。ロジスティック回帰分析では、ロジスティック関数(シグモイド関数)がモデルとして用いられる。
 時系列分析は、例えば、ARモデル(自己回帰モデル)、MAモデル(移動平均モデル)、ARMAモデル(自己回帰移動平均モデル)、ARIMAモデル(自己回帰和分移動平均モデル)、SARIMAモデル(季節自己回帰和分移動平均モデル)、VARモデル(ベクトル自己回帰モデル)である。AR、MA、ARMA、VARモデルは、定常過程を表し、ARIMA、SARIMAモデルは、非定常過程を表す。ARモデルは、時間の経過に対して規則的に値が変化するモデルである。MAモデルは、ある期間における変動が一定であるモデルである。例えば、MAモデルでは、ある時点の値は、その時点より前の移動平均によって決まる。ARMAモデルは、ARモデルとMAモデルとを組み合わせたモデルである。ARIMAモデルは、中長期的なトレンド(増加又は減少傾向)を考慮して、前後の値の差分についてARMAモデルを適用するモデルである。SARIMAモデルは、中長期的な季節変動を考慮して、ARIMAモデルを適用するモデルである。VARモデルは、ARモデルを多変量に拡張したモデルである。
 決定木は、複数の識別器を組み合わせて複雑な識別境界を生成するためのモデルである。決定木の詳細については後述する。
 サポートベクターマシンは、2クラスの線形識別関数を生成するアルゴリズムである。サポートベクターマシンの詳細については後述する。
 ニューラルネットワークは、人間の脳神経系のニューロンをシナプスで結合して形成されたネットワークをモデル化したものである。ニューラルネットワークは、狭義には、誤差逆伝播法を用いた多層パーセプトロンを意味する。代表的なニューラルネットワークとしては、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)が挙げられる。CNNは、全結合していない(結合が疎である)順伝播型ニューラルネットワークの一種である。RNNは、有向閉路を持つニューラルネットワークの一種である。CNN及びRNNは、音声・画像・動画認識、及び、自然言語処理に用いられる。
 アンサンブル学習は、複数のモデルを組み合わせて識別性能を向上させる手法である。アンサンブル学習が用いる手法は、例えば、バギング、ブースティング、ランダムフォレストである。バギングは、学習データのブートストラップサンプルを用いて複数のモデルを学習させ、新規の入力データの評価を、複数のモデルによる多数決によって決する手法である。ブースティングは、バギングの学習結果に応じて学習データに重み付けをして、誤って識別された学習データを、正しく識別された学習データよりも集中的に学習させる手法である。ランダムフォレストは、モデルとして決定木を用いる場合において、相関が低い複数の決定木からなる決定木群(ランダムフォレスト)を生成する手法である。ランダムフォレストの詳細については後述する。
 本実施形態では、学習部45が用いる教師あり学習の好ましいモデル又はアルゴリズムとして、次に説明する、ニューラルネットワーク、サポートベクターマシン、決定木、及び、ランダムフォレストが用いられる。
 (2-4-6-1)ニューラルネットワーク
 図10は、ニューラルネットワークのニューロンのモデルの模式図である。図11は、図10に示されるニューロンを組み合わせて構成した三層のニューラルネットワークの模式図である。図10に示されるように、ニューロンは、複数の入力x(図10では入力x1,x2,x3)に対する出力yを出力する。各入力x(図10では入力x1,x2,x3)には、対応する重みw(図10では重みw1,w2,w3)が乗算される。ニューロンは、次の式(1)を用いて出力yを出力する。
Figure JPOXMLDOC01-appb-M000001
 式(1)において、入力x、出力y及び重みwは、すべてベクトルであり、θは、バイアスであり、φは、活性化関数である。活性化関数は、非線形関数であり、例えば、ステップ関数(形式ニューロン)、単純パーセプトロン、シグモイド関数又はReLU(ランプ関数)である。
 図11に示される三層のニューラルネットワークでは、入力側(図11の左側)から複数の入力ベクトルx(図11では入力ベクトルx1,x2,x3)が入力され、出力側(図11の右側)から複数の出力ベクトルy(図11では出力ベクトルy1,y2,y3)が出力される。このニューラルネットワークは、3つの層L1,L2,L3から構成される。
 第1の層L1では、入力ベクトルx1,x2,x3は、3つのニューロンN11,N12,N13のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW1と表記されている。ニューロンN11,N12,N13は、それぞれ、特徴ベクトルz11,z12,z13を出力する。
 第2の層L2では、特徴ベクトルz11,z12,z13は、2つのニューロンN21,N22のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW2と表記されている。ニューロンN21,N22は、それぞれ、特徴ベクトルz21,z22を出力する。
 第3の層L3では、特徴ベクトルz21,z22は、3つのニューロンN31,N32,N33のそれぞれに、対応する重みが掛けられて入力される。図11では、これらの重みは、まとめてW3と表記されている。ニューロンN31,N32,N33は、それぞれ、出力ベクトルy1,y2,y3を出力する。
 ニューラルネットワークの動作には、学習モードと予測モードとがある。学習モードでは、学習データセットを用いて重みW1,W2,W3を学習する。予測モードでは、学習した重みW1,W2,W3のパラメータを用いて識別等の予測を行う。
 重みW1,W2,W3は、例えば、誤差逆伝播法(バックプロパゲーション)により学習可能である。この場合、誤差に関する情報は、出力側から入力側に向かって、言い換えると、図11において右側から左側に向かって伝達される。誤差逆伝播法は、各ニューロンにおいて、入力xが入力されたときの出力yと、真の出力y(教師データ)との差を小さくするように、重みW1,W2,W3を調整して学習する手法である。
 ニューラルネットワークは、3層より多い層を有するように構成することができる。4層以上のニューラルネットワークによる機械学習の手法は、ディープラーニング(深層学習)として知られている。
 (2-4-6-2)サポートベクターマシン
 サポートベクターマシン(SVM)とは、最大マージンを実現する2クラス線形識別関数を求めるアルゴリズムである。図12は、SVMを説明するための図である。2クラス線形識別関数とは、図12に示される特徴空間において、2つのクラスC1,C2の学習データを線形分離するための超平面である識別超平面P1,P2を表す。図12において、クラスC1の学習データは円で示され、クラスC2の学習データは正方形で示されている。識別超平面のマージンとは、識別超平面に最も近い学習データと、識別超平面との間の距離である。図12には、識別超平面P1のマージンd1、及び、識別超平面P2のマージンd2が示されている。SVMでは、マージンが最大となるような識別超平面である最適識別超平面P1が求められる。一方のクラスC1の学習データと最適識別超平面P1との間の距離の最小値d1は、他方のクラスC2の学習データと最適識別超平面P2との間の距離の最小値d1と等しい。
 図12において、2クラス問題の教師あり学習に用いられる学習データセットDを以下の式(2)で表す。
Figure JPOXMLDOC01-appb-M000002
  学習データセットDは、学習データ(特徴ベクトル)xと、教師データt={-1,+1}との対の集合である。学習データセットDの要素数は、Nである。教師データtは、学習データxがクラスC1,C2のどちらに属するのかを表す。クラスC1はt=-1のクラスであり、クラスC2はt=+1のクラスである。
 図12において、全ての学習データxで成り立つ、正規化された線形識別関数は、以下の2つの式(3-1)及び(3-2)で表される。wは係数ベクトルであり、bはバイアスである。
Figure JPOXMLDOC01-appb-M000003
 これらの2つの式は、以下の1つの式(4)で表される。
Figure JPOXMLDOC01-appb-M000004
 識別超平面P1,P2を以下の式(5)で表す場合、そのマージンdは、式(6)で表される。
Figure JPOXMLDOC01-appb-M000005
 式(6)において、ρ(w)は、クラスC1,C2のそれぞれの学習データxを識別超平面P1,P2の法線ベクトルw上に射影した長さの差の最小値を表す。式(6)の「min」及び「max」の項は、それぞれ、図12において符号「min」及び符号「max」で示された点である。図12において、最適識別超平面は、マージンdが最大となる識別超平面P1である。
 図12は、2クラスの学習データが線形分離可能である特徴空間を表す。図13は、図12と同様の特徴空間であって、2クラスの学習データが線形分離不可能である特徴空間を表す。2クラスの学習データが線形分離不可能である場合、式(4)にスラック変数ξを導入して拡張した次の式(7)を用いることができる。
Figure JPOXMLDOC01-appb-M000006
 スラック変数ξは、学習時のみに使用され、0以上の値をとる。図13には、識別超平面P3と、マージン境界B1,B2と、マージンd3とが示されている。識別超平面P3の式は式(5)と同じである。マージン境界B1,B2は、識別超平面P3からの距離がマージンd3である超平面である。
 スラック変数ξが0の場合、式(7)は式(4)と等価である。このとき、図13において白抜きの円又は正方形で示されるように、式(7)を満たす学習データxは、マージンd3内で正しく識別される。このとき、学習データxと識別超平面P3との間の距離は、マージンd3以上である。
 スラック変数ξが0より大きく1以下の場合、図13においてハッチングされた円又は正方形で示されるように、式(7)を満たす学習データxは、マージン境界B1,B2を超えているが、識別超平面P3を超えておらず、正しく識別される。このとき、学習データxと識別超平面P3との間の距離は、マージンd3未満である。
 スラック変数ξが1より大きい場合、図13において黒塗りの円又は正方形で示されるように、式(7)を満たす学習データxは、識別超平面P3を超えており、誤認識される。
 このように、スラック変数ξを導入した式(7)を用いることで、2クラスの学習データが線形分離不可能である場合においても、学習データxを識別することができる。
 上述の説明から、全ての学習データxのスラック変数ξの和は、誤認識される学習データxの数の上限を表す。ここで、評価関数Lを次の式(8)で定義する。
Figure JPOXMLDOC01-appb-M000007
 学習部45は、評価関数Lの出力値を最小化する解(w、ξ)を求める。式(8)において、第2項のパラメータCは、誤認識に対するペナルティの強さを表す。パラメータCが大きいほど、wのノルム(第1項)よりも誤認識数(第2項)を小さくする方を優先する解が求められる。
 (2-4-6-3)決定木
 決定木とは、複数の識別器を組み合わせて複雑な識別境界(非線形識別関数等)を得るためのモデルである。識別器とは、例えば、ある特徴軸の値と閾値との大小関係に関する規則である。学習データから決定木を構成する方法としては、例えば、特徴空間を2分割する規則(識別器)を求めることを繰り返す分割統治法がある。図14は、分割統治法によって構成された決定木の一例である。図15は、図14の決定木によって分割される特徴空間を表す。図15では、学習データは白丸又は黒丸で示され、図14に示される決定木によって、各学習データは、白丸のクラス又は黒丸のクラスに分類される。図14には、1から11までの番号が付されたノードと、ノード間を結びYes又はNoのラベルが付されたリンクとが示されている。図14において、終端ノード(葉ノード)は、四角で示され、非終端ノード(根ノード及び内部ノード)は、丸で示されている。終端ノードは、6から11までの番号が付されたノードであり、非終端ノードは、1から5までの番号が付されたノードである。各終端ノードには、学習データを表す白丸又は黒丸が示されている。各非終端ノードには、識別器が付されている。識別器は、特徴軸x、xの値と閾値a~eとの大小関係を判断する規則である。リンクに付されたラベルは、識別器の判断結果を示す。図15において、識別器は点線で示され、識別器によって分割された領域には、対応するノードの番号が付されている。
 分割統治法によって適切な決定木を構成する過程では、以下の(a)~(c)の3点について検討する必要がある。
 (a)識別器を構成するための特徴軸及び閾値の選択。
 (b)終端ノードの決定。例えば、1つの終端ノードに含まれる学習データが属するクラスの数。又は、決定木の剪定(根ノードが同じ部分木を得ること)をどこまで行うかの選択。
 (c)終端ノードに対する多数決によるクラスの割り当て。
 決定木の学習方法には、例えば、CART、ID3及びC4.5が用いられる。CARTは、図14及び図15に示されるように、終端ノード以外の各ノードにおいて特徴空間を特徴軸ごとに2分割することで、決定木として2分木を生成する手法である。
 決定木を用いる学習では、学習データの識別性能を向上させるために、非終端ノードにおいて特徴空間を最適な分割候補点で分割することが重要である。特徴空間の分割候補点を評価するパラメータとして、不純度とよばれる評価関数が用いられてもよい。ノードtの不純度を表す関数I(t)としては、例えば、以下の式(9-1)~(9-3)で表されるパラメータが用いられる。Kは、クラスの数である。
Figure JPOXMLDOC01-appb-M000008
  上式において、確率P(C|t)は、ノードtにおけるクラスCの事後確率であり、言い換えると、ノードtにおいてクラスCのデータが選ばれる確率である。式(9-3)の第2式において、確率P(C|t)は、クラスCのデータがj(≠i)番目のクラスに間違われる確率であるので、第2式は、ノードtにおける誤り率を表す。式(9-3)の第3式は、全てのクラスに関する確率P(C|t)の分散の和を表す。
 不純度を評価関数としてノードを分割する場合、例えば、当該ノードにおける誤り率、及び、決定木の複雑さで決まる許容範囲まで、決定木を剪定する手法が用いられる。
 (2-4-6-4)ランダムフォレスト
 ランダムフォレストは、アンサンブル学習の一種であって、複数の決定木を組み合わせて識別性能を強化する手法である。ランダムフォレストを用いる学習では、相関が低い複数の決定木からなる群(ランダムフォレスト)が生成される。ランダムフォレストの生成及び識別には、以下のアルゴリズムが用いられる。
 (1)m=1からMまで以下を繰り返す。
   (a)N個のd次元学習データから、m個のブートストラップサンプルZを生成する。
   (b)Zを学習データとして、以下の手順で各ノードtを分割して、m個の決定木を生成する。
     (i)d個の特徴からd´個の特徴をランダムに選択する。(d´<d)
     (ii)選択されたd´個の特徴の中から、学習データの最適な分割を与える特徴と分割点(閾値)を求める。
     (iii)求めた分割点でノードtを2分割する。
 (2)m個の決定木からなるランダムフォレストを出力する。
 (3)入力データに対して、ランダムフォレストの各決定木の識別結果を得る。ランダムフォレストの識別結果は、各決定木の識別結果の多数決によって決定される。
 ランダムフォレストを用いる学習では、決定木の各非終端ノードにおいて識別に用いる特徴をあらかじめ決められた数だけランダムに選択することで、決定木間の相関を低くすることができる。
 (2-4-7)強化学習
 学習部45が用いる機械学習の手法である強化学習について説明する。強化学習は、一連の行動の結果としての報酬が最大となるような方策を学習する手法である。強化学習で用いられるモデル又はアルゴリズムは、Q学習(Q-learning)等がある。Q学習は、状態sの下で行動aを選択する価値を表すQ値を学習する手法である。Q学習では、Q値が最も高い行動aが最適な行動として選択される。高いQ値を求めるため、行動aの主体(エージェント)には、状態sの下で選択した行動aに対して報酬が与えられる。Q学習では、エージェントが行動するたびに、以下の式(10)を用いて、Q値が更新される。
Figure JPOXMLDOC01-appb-M000009
 式(10)において、Q(st,at)は、状態stのエージェントが行動atを選択する価値を表すQ値である。Q(st,at)は、状態sと行動aとをパラメータとする関数(行動価値関数)である。stは、時刻tにおけるエージェントの状態である。atは、時刻tにおけるエージェントの行動である。αは、学習係数である。αは、式(10)によってQ値が最適な値に収束するように設定される。rt+1は、エージェントが状態st+1に遷移したときに得る報酬である。γは、割引率である。γは、0以上1以下の定数である。maxを含む項は、環境st+1の下で、最もQ値が高い行動aを選択した場合のQ値にγを掛けたものである。行動価値関数によって求められるQ値は、エージェントが得る報酬の期待値である。
 図16は、Q学習による強化学習を行う制御部40のブロック構成図である。制御部40は、主として、状態変数取得部143と、学習部145と、決定部146とを有する。状態変数取得部143及び決定部146は、それぞれ、図9A及び図9Bに示される状態変数取得部43及び決定部46と同じ機能を有する。学習部145は、報酬条件設定部145aと、報酬計算部145bと、関数更新部145cとを有する。報酬条件設定部145aは、報酬条件を設定する。報酬計算部145bは、状態変数取得部143が取得した状態変数、及び、報酬条件設定部145aが設定した報酬条件に基づいて、報酬を計算する。関数更新部145cは、報酬計算部145bが計算した報酬に基づいて、行動価値関数を更新する。行動価値関数は、状態変数取得部143が取得した状態変数の下で所定の行動を選択する価値であるQ値を求める関数である。関数更新部145cは、例えば、式(10)を用いて、行動価値関数を更新する。関数更新部145cは、最適化された行動価値関数を学習済みモデルとして出力する。このように、学習部145は、状態変数に基づいて、行動価値関数のパラメータを調整して行動価値関数を更新することで、報酬が最大となる方策を学習して、学習済みモデルを生成する。学習部145は、報酬を用いて、オンライン学習による強化学習を行う。
 (2-4-8)機械学習のその他の手法
 学習部45は、種種の機械学習の手法を用い得る。学習部45が用い得る機械学習の手法は、既に説明した教師あり学習及び強化学習の他に、教師なし学習、半教師あり学習、トランスダクティブ学習、マルチタスク学習及び転移学習等がある。学習部45は、これらの手法を組み合わせて用いてもよい。
 教師なし学習は、教師データを用いずに、所定の統計的性質に基づいて入力データをグループ分け(クラスタリング)する手法である。教師なし学習で用いられるモデル又はアルゴリズムとしては、k平均法(k-means法)、ウォード法(Ward法)、主成分分析等がある。k平均法は、各入力データにランダムにクラスタを割り当て、各クラスタの中心を計算し、各入力データを最も近い中心のクラスタに割り当て直す工程を繰り返す手法である。ウォード法は、クラスタの各入力データからクラスタの質量中心までの距離を最小化するように、各入力データをクラスタに割り当て直す工程を繰り返す手法である。主成分分析は、相関のある複数の変数から、相関の最も小さい主成分と呼ばれる変数を生成する多変量解析の手法である。
 半教師あり学習は、対応する教師データが付かない入力データ(ラベルなしデータ)と、対応する教師データ付きの入力データ(ラベルありデータ)との両方を用いて学習する手法である。
 トランスダクティブ学習は、半教師あり学習において、学習に用いられるラベルなしデータに対応する出力を生成し、未知の入力データに対応する出力を生成しない手法である。
 マルチタスク学習は、複数の関連するタスク同士の情報を共有して、これらのタスクを同時に学習させることで、タスクに共通の要因を獲得してタスクの予測精度を上げる手法である。
 転移学習は、あるドメインで予め学習させたモデルを、別のドメインに適応することで予測精度を上げる手法である。
 (2-4-9)学習で使用されるデータ
 本実施形態において、制御部40が機械学習の手法を用いて学習済みモデルを生成するために使用するデータについて説明する。
 制御部40が教師あり学習の手法を用いる場合、制御部40は、状態変数、評価データ及び制御条件の各データを使用する。
 状態変数は、シャフト115の位置に相関する少なくとも1つのパラメータを含む。本実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する。
 評価データは、シャフト115の位置の目標値からの偏差に相関する少なくとも1つのパラメータを含む。本実施形態では、評価データ取得部44は、評価データとして、シャフト115の位置の検出値と、シャフト115の位置の目標値との差であるシャフト位置偏差を取得する。検出値とは、変位センサ31,32の出力値から換算された値である。目標値とは、シャフト115の可動範囲の中心位置である。
 制御条件は、学習部45によって学習され、シャフト115の位置制御を適切に行うための条件である。本実施形態では、学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。決定部46は、制御条件として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
 また、制御部40が、強化学習の手法を用いる場合、制御部40は、状態変数及び報酬条件を使用する。状態変数は、制御部40が教師あり学習の手法を用いる場合に使用される状態変数と同じである。制御部40は、所定の報酬条件に基づいて、シャフト位置偏差から報酬を計算する。本実施形態では、シャフト位置偏差が小さい場合には、報酬が増え、シャフト位置偏差が大きい場合には、報酬が減るか又は変化しないように、報酬条件が設定される。報酬条件は、例えば、評価データに基づいて報酬を算出するための条件である。
 (3)効果
 本実施形態の空気調和装置100が備える磁気軸受装置10は、磁気軸受のコイルに印加される電圧(電圧指令値)等を調整して、磁気浮上しているシャフト115の位置制御システムを備える。従来の位置制御システムは、予め定められた制御規則に基づいて、電圧指令値等を調整する。この場合、装置の品質のバラツキ、及び、システムの経時変化等によって適切な電圧指令値が得られず、シャフトの浮上制御の安定性が低下したり、浮上中に大きな外乱力が発生した場合にシャフトがタッチダウン軸受に接触したりするおそれがある。
 本実施形態の磁気軸受装置10では、学習機能を有する制御部40が、シャフト115の位置に相関する状態変数と、シャフト115の位置に関する評価データとに基づいて、シャフト115の位置制御を適切に行うための条件(位置制御条件)を、教師あり学習の手法を用いて学習する。変位センサ31,32は、比較的短い時間間隔(例えば40μ秒ごと)でシャフト115の位置を検出するので、制御部40は、シャフト115の位置制御を、比較的短い時間間隔で行うことができる。そのため、制御部40は、シャフト115の位置制御の安定性を長期間にわたって維持することができる。これにより、磁気軸受装置10の品質のバラツキ、及び、システムの経時変化等による、シャフト115の浮上制御の安定性の低下、及び、外乱力によるシャフト115とタッチダウン軸受116,117との接触の発生を抑制することができる。
 ―第2実施形態―
 第1実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する。変位センサ31,32の出力値は、シャフト115の位置に相関するパラメータである。
 本実施形態では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値以外のパラメータであって、シャフト115の位置に相関するパラメータを取得する。そのため、本実施形態は、変位センサ31,32を有さないセンサレスタイプの磁気軸受装置に適用することができる。
 具体的には、状態変数取得部43は、状態変数として、シャフト115の位置の推定に必要な種種の情報を取得する。シャフト115の位置の推定に必要な情報は、磁気軸受21,22の電磁石の電流検出値、電圧検出値、磁束検出値、電流指令値及び電圧指令値の少なくとも2つを含む。電流検出値は、電磁石のコイル65に流れている電流の検出値である。電圧検出値は、電磁石のコイル65に印加されている電圧の検出値である。磁束検出値は、電磁石のコイル65から発生する磁界の検出値である。磁束検出値は、例えば、非接触型の磁気センサであるホールセンサの出力値である。電流指令値は、制御部40によって制御され、電磁石のコイル65に入力される電流値である。電圧指令値は、制御部40によって制御され、電磁石のコイル65に入力される電圧値である。
 シャフト115の位置の推定に必要な情報として、例えば、次の(a)~(c)の情報が挙げられる。
 (a)電圧指令値と電流検出値
 (b)電流指令値と電圧検出値
 (c)電流検出値と磁束検出値
 情報(a)を用いる場合、状態変数取得部43は、電圧指令値を入力し、電流検出値を取得することで、シャフト115の位置を推定する。
 情報(b)を用いる場合、状態変数取得部43は、電流指令値を入力し、電圧検出値を取得することで、シャフト115の位置を推定する。
 情報(a)及び(b)を用いる場合、状態変数取得部43は、コイル65の電流(又は電流微分値)及び電圧がシャフト115の位置に相関する性質を利用することで、シャフト115の位置を推定する。電流又は電圧は、正弦波状に入力されてもよく、ステップ状に入力されてもよい。
 情報(c)を用いる場合、状態変数取得部43は、電流検出値及び磁束検出値がシャフト115の位置に相関する性質を利用することで、シャフト115の位置を推定する。
 評価データ取得部44は、評価データとして、状態変数から換算したシャフト115の位置の推定値と、シャフト115の位置の目標値との差であるシャフト位置偏差を取得する。
 学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。
 決定部46は、制御条件として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
 ―第3実施形態―
 第1及び第2実施形態では、図7に示される従来の制御部940の代わりに、学習機能を有する制御部40が用いられている。言い換えると、第1及び第2実施形態は、図7に示される位置検出部941、位置制御部942及び電流制御部943の全ての機能が学習機能を有する構成に関する。
 しかし、図7に示される位置検出部941、位置制御部942及び電流制御部943のうちの一部の機能のみが学習機能を有してもよい。以下に説明する第3~第5実施形態は、従来の制御部940の位置検出部941、位置制御部942及び電流制御部943のうちの1つの機能のみが学習機能を有する構成に関する。
 本実施形態は、従来の制御部940の位置検出部941のみが学習機能を有する構成に関する。図17は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図17に示されるように、図7の位置検出部941に相当するブロックが、学習機能を有する学習制御部340に置き換えられている。学習制御部340は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部340は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
 第1及び第2実施形態では、評価データ取得部44は、判定データとして、シャフト115の位置の目標値(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)を用いる。
 本実施形態では、評価データ取得部44は、判定データとして、位置指令値及び位置検出値の代わりに、シャフト115の位置に相関するパラメータ(相関パラメータ)の目標値、及び、相関パラメータの検出値を用いる。相関パラメータとしては、第1及び第2実施形態において状態変数取得部43が取得した状態変数が用いられる。例えば、評価データ取得部44は、相関パラメータとして、第1実施形態で説明した変位センサ31,32の出力値を用いてもよく、第2実施形態で説明したシャフト115の位置の推定に必要な情報を用いてもよい。
 評価データ取得部44は、判定データを用いて、例えば、相関パラメータの目標値を基準にした場合の相関パラメータの検出値の偏差(相関パラメータ偏差)を評価データとして取得する。
 学習部45は、相関パラメータ偏差を小さくするための制御条件を学習する。
 決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、位置検出値を決定する。
 本実施形態では、学習部45は、特定の時点において位置制御条件を学習してもよい。特定の時点とは、相関パラメータに基づいて、シャフト115の位置を特定又は推定することができる時点である。具体的には、特定の時点とは、シャフト115の位置に一定の制約がある時点、又は、シャフト115に加わる力が既知である時点である。シャフト115の位置に一定の制約がある時点とは、例えば、シャフト115がタッチダウン軸受116,117に接触している時点である。シャフト115に加わる力が既知である時点とは、例えば、シャフト115が自由落下している時点である。
 本実施形態では、評価データ取得部44は、評価データとして、相関パラメータ偏差の代わりに、シャフト115の位置の真値を取得してもよい。シャフト115の位置の真値として、判定データに含まれる位置検出値が用いられてもよい。なお、上述の「特定の時点」において特定又は推定されたシャフト115の位置が、シャフト115の位置の真値として用いられてもよい。
 ―第4実施形態―
 本実施形態は、従来の制御部940の位置制御部942のみが学習機能を有する構成に関する。図18は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図18に示されるように、図7の位置制御部942に相当するブロックが、学習機能を有する学習制御部440に置き換えられている。学習制御部440は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部440は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
 本実施形態では、状態変数取得部43は、状態変数として、シャフト115の位置の目標値(位置指令値)、及び、シャフト115の位置の検出値(位置検出値)を用いる。
 評価データ取得部44は、判定データとして、位置指令値及び位置検出値を用いる。評価データ取得部44は、評価データとして、位置指令値と位置検出値との差であるシャフト位置偏差を取得する。
 学習部45は、シャフト位置偏差を小さくするための制御条件を学習する。
 決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)、及び、コイル65を流れる電流(電流指令値)の少なくとも1つを決定する。
 ―第5実施形態―
 本実施形態は、従来の制御部940の電流制御部943のみが学習機能を有する構成に関する。図19は、本実施形態における、シャフト115の位置制御システムのブロック構成図である。図19に示されるように、図7の電流制御部943に相当するブロックが、学習機能を有する学習制御部540に置き換えられている。学習制御部540は、第1及び第2実施形態の制御部40と同じ機能を有する。言い換えると、学習制御部540は、図9A及び図9Bに示されるように、状態変数取得部43と、評価データ取得部44と、学習部45と、決定部46とを有する。以下、第1及び第2実施形態の制御部40との相違点を中心に説明する。
 本実施形態では、状態変数取得部43は、状態変数として、磁気軸受21,22の電磁石のコイル65を流れる電流(電流指令値)、及び、シャフト115の位置の検出値(位置検出値)を取得する。
 評価データ取得部44は、判定データとして、電流指令値及び位置検出値を用いる。評価データ取得部44は、評価データとして、電流制御の応答性に関する量(応答レベル)を取得する。応答レベルは、ゼロに近いほど好ましいパラメータである。応答レベルは、例えば、電流指令値を基準にした場合の電流検出値の偏差の絶対値、二乗平均平方根(RMS)又は二乗平均(MS)であってもよく、強制的に外乱を加えた場合の当該偏差のオーバーシュート量又は整定時間であってもよい。
 学習部45は、応答レベルを小さくするための制御条件を学習する。
 決定部46は、シャフト115の位置制御を適切に行うための条件(位置制御条件)として、磁気軸受21,22の電磁石のコイル65に印加する電圧(電圧指令値)を決定する。
 ―変形例―
 以下、第1~第5実施形態の少なくとも一部の変形例について説明する。
 (1)変形例A
 本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22を駆動するための電流値に相関するパラメータをさらに用いる。評価データ取得部44は、評価データとして、磁気軸受21,22を駆動するための電流値をさらに取得する。更新部47は、磁気軸受21,22を駆動するための電流値を所定値以下にするように学習部45を学習させる。所定値とは、具体的には、磁気軸受21,22を駆動するためのインバータの許容電流値である。本変形例は、インバータの仕様が決まっている場合において、インバータの故障の発生を抑制することができる。
 (2)変形例B
 本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22を駆動するためのインバータの温度に相関するパラメータをさらに用いる。評価データ取得部44は、評価データとして、磁気軸受21,22を駆動するためのインバータの温度をさらに取得する。更新部47は、インバータの温度を所定値以下にするように学習部45を学習させる。所定値とは、具体的には、インバータの許容温度である。本変形例は、インバータの仕様が決まっている場合において、インバータの故障の発生を抑制することができる。
 (3)変形例C
 本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、磁気軸受21,22が電圧型インバータによって駆動される場合において磁気軸受21,22の電磁石の電流検出値をさらに取得し、磁気軸受21,22が電流型インバータによって駆動される場合において磁気軸受21,22の電磁石の電圧検出値をさらに取得する。
 (4)変形例D
 本変形例は、変形例Cにおいて、評価データ取得部44は、判定データとして、電流指令値及び位置検出値をさらに用いる。評価データ取得部44は、評価データとして、電流制御の応答性に関する量(応答レベル)をさらに取得する。応答レベルは、ゼロに近いほど好ましいパラメータである。応答レベルは、例えば、電流指令値を基準にした場合の電流検出値の偏差の絶対値、二乗平均平方根(RMS)又は二乗平均(MS)であってもよく、強制的に外乱を加えた場合の当該偏差のオーバーシュート量又は整定時間であってもよい。更新部47は、応答レベルを小さくするように学習部45を学習させる。
 (5)変形例E
 本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、シャフト115の回転数をさらに取得する。
 (6)変形例F
 本変形例は、第1、第2、第4及び第5実施形態において、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータをさらに取得する。
 空気調和装置100の運転条件とは、空気調和装置100の冷凍能力、及び、凝縮器120の入口水温度の所定の範囲である。入口水温度とは、空気調和装置100の冷媒回路190を循環する冷媒と熱交換される媒体である水の温度であって、凝縮器120に流入する時の水の温度である。図20は、空気調和装置100の運転条件の一例である。空気調和装置100の冷凍能力の単位は、冷凍トンである。凝縮器120の入口水温度の単位は、華氏度である。図20においてハッチングされた領域が、空気調和装置100の運転条件であり、空気調和装置100による空気調和が実現可能な範囲である。
 空気調和装置100の運転条件に相関するパラメータは、具体的には、以下に列挙する空気調和装置100の運転情報に関するデータである。
 (a)圧縮機110に吸入される冷媒の温度
 (b)圧縮機110から吐出される冷媒の温度
 (c)圧縮機110に吸入される冷媒の圧力
 (d)圧縮機110から吐出される冷媒の圧力
 (e)冷媒回路190を循環する冷媒の流量
 (f)凝縮器120に流入する水の温度
 (g)凝縮器120から流出する水の温度
 (h)蒸発器140に流入する水の温度
 (i)蒸発器140から流出する水の温度
 (j)インレットガイドベーン113bの開度
 (k)電動機114の回転数
 (l)電動機114の回転角度
 (m)電動機114のトルク
 (n)電動機114の電流値
 パラメータ(f)~(i)の「水」は、凝縮器120又は蒸発器140において冷媒と熱交換される媒体である水を意味する。空気調和装置100の運転条件に相関するパラメータは、上記のパラメータ(a)~(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
 本変形例では、制御部40は、空気調和装置100の運転条件ごとに最適な制御条件を学習することができる。
 (7)変形例G
 本変形例は、変形例Fにおいて、状態変数取得部43は、状態変数として、シャフト115に付与される電磁力に相関する少なくとも1つのパラメータをさらに取得する。
 シャフト115に付与される電磁力に相関するパラメータは、空気調和装置100の冷媒負荷に相関するパラメータ、及び、空気調和装置100の物理特性に相関するパラメータの少なくとも1つを含む。
 空気調和装置100の冷媒負荷に相関するパラメータとは、変形例Fにおいて列挙されたパラメータ(a)~(n)の少なくとも1つを含む。空気調和装置100の冷媒負荷に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
 空気調和装置100の物理特性に相関するパラメータとは、シャフト115の重量、及び、シャフト115に作用する力の少なくとも1つである。シャフト115に作用する力とは、シャフト115に作用するコリオリ力、及び、シャフト115に作用する遠心力の少なくとも1つである。シャフト115に作用する力の代わりに、シャフト115の偏心の量に相関するパラメータ、及び、電動機114の回転数の少なくとも1つが用いられてもよい。
 本変形例では、空気調和装置100の運転中におけるシャフト115の回転軸の移動を抑制することができる。
 (8)変形例H
 本変形例は、変形例Fにおいて、状態変数取得部43は、状態変数として、磁気軸受21,22の特性に相関する少なくとも1つのパラメータをさらに取得する。
 磁気軸受21,22の特性に相関するパラメータとは、磁気軸受21,22の電磁石のコイル65のインダクタンスに相関するパラメータ、及び、コイル65の抵抗に相関するパラメータの少なくとも1つを含む。コイル65のインダクタンスに相関するパラメータとは、例えば、コイル65を流れる電流の検出値である。コイル65の抵抗に相関するパラメータとは、コイル65の温度、又は、コイル65の周囲の温度に相関するパラメータであり、具体的には、変形例Fにおいて列挙されたパラメータ(a)~(i)の少なくとも1つを含む。コイル65の抵抗に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
 本変形例では、空気調和装置100の運転中におけるシャフト115の回転軸の移動を抑制することができる。
 (9)変形例I
 本変形例は、第1、第2及び第5実施形態において、評価データ取得部44は、判定データとして、磁気軸受21,22の消費電力に相関するパラメータをさらに用いる。
 磁気軸受21,22の消費電力に相関するパラメータとは、磁気軸受21,22を駆動するための電流値に相関するパラメータ、磁気軸受21,22を駆動するための電圧値に相関するパラメータ、及び、磁気軸受21,22の電磁石のコイル65の抵抗に相関するパラメータのうちの少なくとも2つを含む。磁気軸受21,22を駆動するための電流値に相関するパラメータとは、例えば、コイル65を流れる電流の検出値である。コイル65の抵抗に相関するパラメータとは、コイル65の温度、又は、コイル65の周囲の温度に相関するパラメータであり、具体的には、変形例Fにおいて列挙されたパラメータ(a)~(i)の少なくとも1つを含む。コイル65の抵抗に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
 評価データ取得部44は、評価データとして、磁気軸受21,22の消費電力をさらに取得する。
 更新部47は、磁気軸受21,22の消費電力を小さくするように学習部45を学習させる。
 本変形例では、制御部40は、空気調和装置100の消費電力を抑制することができる制御条件を学習することができる。
 (10)変形例J
 本変形例は、変形例A,B,Iにおいて、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータをさらに取得する。空気調和装置100の運転条件に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)~(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
 (11)変形例K
 本変形例は、第1、第2、第4及び第5実施形態において、評価データ取得部44は、判定データとして、電動機114によって駆動される圧縮機110に供給される入力エネルギーに相関する少なくとも1つのパラメータをさらに用いる。入力エネルギーに相関するパラメータとは、磁気軸受21,22の入力電流、磁気軸受21,22の入力電力、磁気軸受21,22を駆動するためのインバータの入力電流、磁気軸受21,22を駆動するためのインバータの入力電力、電動機114の入力電流、電動機114の入力電力、電動機114を駆動するためのインバータの入力電流、及び、電動機114を駆動するためのインバータの入力電力の少なくとも1つを含む。評価データ取得部44は、評価データとして、圧縮機110に供給される入力エネルギーをさらに取得する。
 更新部47は、圧縮機110に供給される入力エネルギーを小さくように学習部45を学習させる。
 本変形例では、制御部40は、圧縮機110に供給される入力エネルギーが最小となる制御条件を学習することができる。
 (12)変形例L
 本変形例は、変形例Jにおいて、状態変数取得部43は、状態変数として、空気調和装置100の運転条件に相関する少なくとも1つのパラメータ、及び、シャフト115に連結される羽根車113aの断熱効率に相関する少なくとも1つのパラメータの少なくとも1つをさらに取得する。
 空気調和装置100の運転条件に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)~(n)の少なくとも1つを含む。空気調和装置100の運転条件に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
 羽根車113aの断熱効率に相関するパラメータとは、冷媒の圧力に相関するパラメータ、及び、冷媒の温度に相関するパラメータの少なくとも1つを含む。冷媒の圧力に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)~(e)の少なくとも1つを含む。冷媒の圧力に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。冷媒の温度に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)~(i)の少なくとも1つを含む。冷媒の温度に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
 本変形例では、制御部40は、羽根車113aの断熱効率が最大となる制御条件を学習することができる。
 (13)変形例M
 本変形例では、状態変数取得部43は、状態変数として、変位センサ31,32の出力値を取得する場合に、変位センサ31,32の温度に相関するパラメータをさらに取得する。変位センサ31,32の温度に相関するパラメータは、変形例Fにおいて列挙されたパラメータ(a)~(i)の少なくとも1つを含む。冷媒の温度に相関するパラメータは、さらに、冷媒の種類に関する情報を含んでもよい。
 本変形例では、制御部40は、温度特性を有する変位センサ31,32の温度に関する情報を状態変数として用いることで、温度による変位センサ31,32の検出値のズレを補償することができる。そのため、制御部40は、タッチダウン軸受116,117の位置の推定値を高い精度で取得して、タッチダウン軸受116,117の中心にシャフト115の回転軸が近付くように、シャフト115の位置合わせを行うことができる。
 (14)変形例N
 本変形例では、第1、第2、第4及び第5実施形態において、磁気軸受装置10の運転開始時等に、変位センサ31,32のキャリブレーションが行われる。キャリブレーションによって、例えば、変位センサ31,32の異常を検出することができる。
 変位センサ31,32のキャリブレーションは、例えば、シャフト115の位置、磁気軸受21,22の電磁石のコイル65の電流値、及び、コイル65の電圧値等のパラメータを強制的に変化させて行われる。この場合、これらのパラメータに周期波形を重畳させてもよく、これらのパラメータをステップ状に変化させてもよく、これらのパラメータをランプ状に変化させてもよい。周期波形は、例えば、正弦波、矩形波、三角波及び鋸波である。周期波形の周波数は、断続的に変化させてもよく、連続的に変化させてもよい。
 また、変位センサ31,32のキャリブレーションは、シャフト115の位置指令値と、所定の波形による摂動とを重畳させて行われてもよい。所定の波形とは、例えば、周期波形、パルス波形及びステップ波形である。周期波形は、例えば、正弦波、矩形波、三角波及び鋸波である。
 また、変位センサ31,32のキャリブレーションは、シャフト115の位置に一定の制約を設けることで行われてもよい。例えば、シャフト115をタッチダウン軸受116,117に接触させる動作、及び、シャフト115に作用する力が既知である動作が行われてもよい。シャフト115に作用する力が既知である動作とは、例えば、シャフト115が自由落下しているときの動作である。
 (15)変形例O
 上記の各実施形態及び各変形例では、制御部40は、教師あり学習又は強化学習の手法を用いて、シャフト115の位置制御を適切に行うための条件を学習する。しかし、制御部40は、教師あり学習と強化学習とを組み合わせた手法を用いて、シャフト115の位置制御を適切に行うための条件を学習してもよい。
 (16)変形例P
 上記の各実施形態及び各変形例では、ラジアル磁気軸受21は、ベアリングレスモータ(シャフトを非接触で支持する機能を有する電動機)の支持機構を用いてもよい。
 ―むすび―
 以上、本開示の実施形態を説明したが、特許請求の範囲に記載された本開示の趣旨及び範囲から逸脱することなく、形態や詳細の多様な変更が可能なことが理解されるであろう。
 磁気軸受装置は、被支持体の位置の制御を適切に行うことができる。
 10   磁気軸受装置
 21   ラジアル磁気軸受(磁気軸受)
 22   スラスト磁気軸受(磁気軸受)
 31   ラジアル変位センサ(変位センサ)
 32   スラスト変位センサ(変位センサ)
 43   状態変数取得部
 44   評価データ取得部
 45   学習部
 46   決定部
 47   更新部
 47a  蓄積部
 47b  判定部
 51   第1電磁石(電磁石)
 52   第2電磁石(電磁石)
 53   第3電磁石(電磁石)
 54   第4電磁石(電磁石)
100   空気調和装置(冷凍装置)
110   圧縮機
113a  羽根車(インペラ)
115   シャフト
120   凝縮器
130   膨張機構
140   蒸発器
190   冷媒回路
実開平04-040308号公報

Claims (23)

  1.  シャフト(115)に電磁力を付与する複数の電磁石(51~54)を有する磁気軸受(21,22)を備える磁気軸受装置(10)の制御条件を学習する機械学習装置であって、
     学習部(45)と、
     前記シャフトの位置に相関する少なくとも1つのパラメータを含む状態変数を取得する状態変数取得部(43)と、
     前記シャフトの位置の測定値、前記シャフトの位置の目標値、及び、前記目標値からの偏差に相関するパラメータのうちの少なくとも1つのパラメータを含む評価データを取得する評価データ取得部(44)と、
     前記評価データを用いて前記学習部の学習状態を更新する更新部(47)と、
    を備え、
     前記学習部は、前記更新部の出力に従って、前記制御条件を学習する、
    機械学習装置。
  2.  前記状態変数は、前記シャフトの位置に応じた信号を出力する変位センサ(31,32)の出力値を少なくとも含み、
     前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも1つを前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  3.  前記状態変数は、前記電磁石の電流値及び電圧値、又は、前記電磁石の電流値及び磁束を少なくとも含み、
     前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも1つを前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  4.  前記状態変数は、前記シャフトの位置に応じた信号を出力する変位センサ(31,32)の出力値を少なくとも含み、
     前記評価データは、前記シャフトの位置の真値を少なくとも含み、
     前記学習部は、前記シャフトの位置を前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  5.  前記状態変数は、前記電磁石の電流値及び電圧値、又は、前記電磁石の電流値及び磁束を少なくとも含み、
     前記評価データは、前記シャフトの位置の真値を少なくとも含み、
     前記学習部は、前記シャフトの位置を前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  6.  前記状態変数は、前記シャフトの位置の検出値、及び、前記シャフトの位置の指令値を少なくとも含み、
     前記学習部は、前記電磁石の電圧値、及び、前記電磁石の電流値の少なくとも1つを前記制御条件として学習する、
    請求項1に記載の機械学習装置。
  7.  前記更新部は、前記磁気軸受を駆動するための電流値を所定の許容値以下にするように前記学習部をさらに学習させる、
    請求項2又は3に記載の機械学習装置。
  8.  前記評価データは、前記磁気軸受を駆動するインバータの温度に相関するパラメータをさらに含み、
     前記更新部は、前記インバータの温度を所定の許容値以下にするように前記学習部をさらに学習させる、
    請求項2又は3に記載の機械学習装置。
  9.  前記状態変数は、
      前記磁気軸受が電圧型インバータによって駆動される場合には前記電磁石の電流検出値をさらに含み、
      前記磁気軸受が電流型インバータによって駆動される場合には前記電磁石の電圧検出値をさらに含む、
    請求項2,3及び6のいずれか1項に記載の機械学習装置。
  10.  前記更新部は、前記電流値の制御の応答性に相関する値を小さくするために前記学習部をさらに学習させる、
    請求項9に記載の機械学習装置。
  11.  前記状態変数は、前記シャフトの回転数をさらに含む、
    請求項2,3及び6のいずれか1項に記載の機械学習装置。
  12.  前記状態変数は、冷凍装置(100)の運転条件に相関する少なくとも1つのパラメータをさらに含み、
     前記冷凍装置は、圧縮機(110)と、凝縮器(120)と、膨張機構(130)と、蒸発器(140)とが接続された冷媒回路(190)を備え、
     前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含む、
    請求項2,3及び6のいずれか1項に記載の機械学習装置。
  13.  前記状態変数は、前記シャフトに付与される電磁力に相関する少なくとも1つのパラメータをさらに含み、
     前記電磁力に相関するパラメータは、前記冷凍装置の冷媒負荷に相関するパラメータ、及び、前記冷凍装置の物理特性に相関するパラメータの少なくとも1つを含む、
    請求項12に記載の機械学習装置。
  14.  前記状態変数は、前記磁気軸受の特性に相関する少なくとも1つのパラメータをさらに含み、
     前記磁気軸受の特性に相関するパラメータは、前記電磁石のコイルのインダクタンスに相関するパラメータ、及び、前記電磁石のコイルの抵抗に相関するパラメータの少なくとも1つを含む、
    請求項12に記載の機械学習装置。
  15.  前記評価データは、前記磁気軸受の消費電力に相関するパラメータをさらに含み、
     前記更新部は、前記消費電力を小さくするために前記学習部をさらに学習させ、
     前記消費電力に相関するパラメータは、前記磁気軸受を駆動するための電流値、前記磁気軸受を駆動するための電圧値、及び、前記電磁石のコイルの抵抗のうちの少なくとも2つを含む、
    請求項2又は3に記載の機械学習装置。
  16.  前記状態変数は、冷凍装置(100)の運転条件に相関する少なくとも1つのパラメータをさらに含み、
     前記冷凍装置は、圧縮機(110)と、凝縮器(120)と、膨張機構(130)と、蒸発器(140)とが接続された冷媒回路(190)を備え、
     前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含む、
    請求項7,8及び15のいずれか1項に記載の機械学習装置。
  17.  前記評価データは、圧縮機(110)に供給される入力エネルギーに相関する少なくとも1つのパラメータをさらに含み、
     前記更新部は、前記入力エネルギーを小さくするために前記学習部をさらに学習させる、
    請求項2,3及び6のいずれか1項に記載の機械学習装置。
  18.  前記状態変数は、冷凍装置(100)の運転条件に相関する少なくとも1つのパラメータ、及び、前記シャフトに連結されるインペラ(113a)の断熱効率に相関する少なくとも1つのパラメータの少なくとも1つをさらに含み、
     前記冷凍装置は、圧縮機(110)と、凝縮器(120)と、膨張機構(130)と、蒸発器(140)とが接続された冷媒回路(190)を備え、
     前記運転条件は、前記冷凍装置の冷凍能力の範囲、及び、前記冷媒回路を循環する冷媒と熱交換される媒体であって前記凝縮器に流入する前記媒体の温度の範囲を含み、
     前記インペラの断熱効率に相関するパラメータは、前記冷媒の圧力に相関するパラメータ、及び、前記冷媒の温度に相関するパラメータの少なくとも1つを含む、
    請求項17に記載の機械学習装置。
  19.  前記状態変数は、前記変位センサの温度に相関するパラメータをさらに含む、
    請求項2又は4に記載の機械学習装置。
  20.  前記更新部は、前記評価データに基づいて報酬を算出し、
     前記学習部は、前記報酬を用いて学習する、
    請求項1から19のいずれか1項に記載の機械学習装置。
  21.  前記学習部は、前記更新部の出力に従って、関数のパラメータの変更を複数回行い、前記パラメータが変更された前記関数ごとに前記状態変数から前記制御条件を出力し、
     前記更新部は、蓄積部(47a)と、判定部(47b)とを備え、
     前記判定部は、前記評価データを判定して、判定結果を出力し、
     前記蓄積部は、前記判定結果に基づいて、前記状態変数及び前記評価データから教師データを作成して蓄積し、
     前記学習部は、前記蓄積部に蓄積された前記教師データに基づいて学習する、
    請求項1から19のいずれか1項に記載の機械学習装置。
  22.  前記学習部が学習した結果得られた学習済みモデルに基づいて、前記制御条件を出力する、
    請求項1から21のいずれか1項に記載の機械学習装置。
  23.  請求項22に記載の機械学習装置を備える、磁気軸受装置。
PCT/JP2020/011162 2019-03-15 2020-03-13 機械学習装置、及び、磁気軸受装置 WO2020189565A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US17/435,242 US20220056953A1 (en) 2019-03-15 2020-03-13 Machine learning device and magnetic bearing device
CN202080020858.8A CN113574289B (zh) 2019-03-15 2020-03-13 机器学习装置和磁轴承装置
EP20773439.3A EP3940254B1 (en) 2019-03-15 2020-03-13 Machine-learning device and magnetic bearing device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019-048948 2019-03-15
JP2019048948A JP6828762B2 (ja) 2019-03-15 2019-03-15 機械学習装置、及び、磁気軸受装置

Publications (1)

Publication Number Publication Date
WO2020189565A1 true WO2020189565A1 (ja) 2020-09-24

Family

ID=72429391

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2020/011162 WO2020189565A1 (ja) 2019-03-15 2020-03-13 機械学習装置、及び、磁気軸受装置

Country Status (5)

Country Link
US (1) US20220056953A1 (ja)
EP (1) EP3940254B1 (ja)
JP (1) JP6828762B2 (ja)
CN (1) CN113574289B (ja)
WO (1) WO2020189565A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022107408A1 (ja) * 2020-11-20 2022-05-27 株式会社エイシング 情報処理装置、方法、プログラム及びシステム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7093031B2 (ja) 2020-09-23 2022-06-29 ダイキン工業株式会社 情報処理装置、情報処理方法、及びプログラム
CN114720128B (zh) * 2022-05-12 2022-12-27 珠海格力电器股份有限公司 一种电磁轴承控制方法、装置及系统
JP7445718B1 (ja) 2022-08-24 2024-03-07 東京瓦斯株式会社 熱源システム

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0440308U (ja) 1990-07-31 1992-04-06
JPH0699373A (ja) * 1992-09-21 1994-04-12 Toyoda Mach Works Ltd ロボット制御装置
JPH09191683A (ja) * 1996-01-12 1997-07-22 Matsushita Electric Ind Co Ltd インバータ装置
JP2001165163A (ja) * 1999-12-03 2001-06-19 Ebara Densan Ltd 磁気軸受制御装置
JP2002174199A (ja) * 2000-12-05 2002-06-21 Nsk Ltd レーザ発振器ブロワ用軸受装置
CN103631137A (zh) * 2013-10-08 2014-03-12 江苏大学 五自由度交流主动磁轴承混合核函数支持向量机检测方法
JP2018005739A (ja) * 2016-07-06 2018-01-11 株式会社デンソー ニューラルネットワークの強化学習方法及び強化学習装置
WO2018033945A1 (ja) * 2016-08-18 2018-02-22 ダイキン工業株式会社 磁気軸受装置、及びそれを用いた流体機械システム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6965181B1 (en) * 1997-09-15 2005-11-15 Mohawk Innovative Technology, Inc. Hybrid foil-magnetic bearing with improved load sharing
US6323614B1 (en) * 1998-09-04 2001-11-27 The Texas A&M University System System and method for controlling suspension using a magnetic field
JP2008190376A (ja) * 2007-02-02 2008-08-21 Ntn Corp 空気サイクル冷凍機用タービンユニット
EP2829756B1 (en) * 2013-07-26 2016-06-29 SKF Magnetic Mechatronics S.A.S. Auxiliary bearing of the ball bearing type for a magnetically suspended rotor system
EP3168487B1 (en) * 2014-09-01 2018-11-14 Daikin Industries, Ltd. Magnetic bearing
WO2017098541A1 (ja) * 2015-12-10 2017-06-15 ダイキン工業株式会社 磁気軸受装置および圧縮機
DE112018000122T8 (de) * 2018-06-14 2020-04-09 Mitsubishi Electric Corporation Maschinelles-Lernen-Vorrichtung, Korrekturparameter-Anpassungssystem und Maschinelles-Lernen-Verfahren

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0440308U (ja) 1990-07-31 1992-04-06
JPH0699373A (ja) * 1992-09-21 1994-04-12 Toyoda Mach Works Ltd ロボット制御装置
JPH09191683A (ja) * 1996-01-12 1997-07-22 Matsushita Electric Ind Co Ltd インバータ装置
JP2001165163A (ja) * 1999-12-03 2001-06-19 Ebara Densan Ltd 磁気軸受制御装置
JP2002174199A (ja) * 2000-12-05 2002-06-21 Nsk Ltd レーザ発振器ブロワ用軸受装置
CN103631137A (zh) * 2013-10-08 2014-03-12 江苏大学 五自由度交流主动磁轴承混合核函数支持向量机检测方法
JP2018005739A (ja) * 2016-07-06 2018-01-11 株式会社デンソー ニューラルネットワークの強化学習方法及び強化学習装置
WO2018033945A1 (ja) * 2016-08-18 2018-02-22 ダイキン工業株式会社 磁気軸受装置、及びそれを用いた流体機械システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3940254A4

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022107408A1 (ja) * 2020-11-20 2022-05-27 株式会社エイシング 情報処理装置、方法、プログラム及びシステム
JP2022082254A (ja) * 2020-11-20 2022-06-01 株式会社エイシング 情報処理装置、方法、プログラム及びシステム
JP7093527B2 (ja) 2020-11-20 2022-06-30 株式会社エイシング 情報処理装置、方法、プログラム及びシステム

Also Published As

Publication number Publication date
CN113574289B (zh) 2023-06-09
US20220056953A1 (en) 2022-02-24
EP3940254A1 (en) 2022-01-19
CN113574289A (zh) 2021-10-29
EP3940254A4 (en) 2022-11-30
EP3940254B1 (en) 2023-12-06
JP6828762B2 (ja) 2021-02-10
JP2020148329A (ja) 2020-09-17

Similar Documents

Publication Publication Date Title
WO2020189565A1 (ja) 機械学習装置、及び、磁気軸受装置
US11774923B2 (en) Augmented deep learning using combined regression and artificial neural network modeling
Li et al. A semi-supervised approach to fault detection and diagnosis for building HVAC systems based on the modified generative adversarial network
Zhu et al. Transfer learning based methodology for migration and application of fault detection and diagnosis between building chillers for improving energy efficiency
WO2021107054A1 (ja) 機械学習装置、デマンド制御システム、及び、空調制御システム
Liu et al. Sensor fault detection and diagnosis method for AHU using 1-D CNN and clustering analysis
Li et al. Diagnosis for multiple faults of chiller using ELM-KNN model enhanced by multi-label learning and specific feature combinations
Qin et al. IIoT-enabled health monitoring for integrated heat pump system using mixture slow feature analysis
Djelloul et al. Fault diagnosis of manufacturing systems using data mining techniques
Dey et al. Semi-supervised learning techniques for automated fault detection and diagnosis of HVAC systems
Gupta et al. Lightweight computational intelligence for IoT health monitoring of off-road vehicles: Enhanced selection log-scaled mutation GA structured ANN
Nourmohammadzadeh et al. Fault classification of a centrifugal pump in normal and noisy environment with artificial neural network and support vector machine enhanced by a genetic algorithm
Dehestani et al. Robust fault tolerant application for HVAC system based on combination of online SVM and ANN black box model
Ilott et al. Fault diagnosis of pumping machinery using artificial neural networks
JP7275305B2 (ja) 故障予測装置、学習装置、および学習方法
Otaka et al. Refrigerated showcase fault detection by a pasting based artificial neural networks using parallel multi-population modified brain storm optimization and Correntropy
JP2021056893A (ja) 機械学習装置、及び、空調制御システム
Dey et al. Automated terminal unit performance analysis employing x-RBF neural network and associated energy optimisation–A case study based approach
Muscat et al. Hierarchical fuzzy support vector machine (SVM) for rail data classification
Liu et al. A hybrid data-fusion estimate method for health status of train braking system
Yuwono et al. Automatic feature selection using multiobjective cluster optimization for fault detection in a heating ventilation and air conditioning system
Bam et al. Machine learning-based predictive maintenance for diagnostics and prognostics of engineering systems
Sodemann et al. Data-driven surge map modeling for centrifugal air compressors
Turunen Machine learning for centrifugal pump condition monitoring using data from variable frequency drive
Dudley et al. Semi-Supervised Learning Techniques for Automated Fault Detection and Diagnosis of HVAC System

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20773439

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2020773439

Country of ref document: EP