WO2022030274A1 - 振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ - Google Patents

振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ Download PDF

Info

Publication number
WO2022030274A1
WO2022030274A1 PCT/JP2021/027461 JP2021027461W WO2022030274A1 WO 2022030274 A1 WO2022030274 A1 WO 2022030274A1 JP 2021027461 W JP2021027461 W JP 2021027461W WO 2022030274 A1 WO2022030274 A1 WO 2022030274A1
Authority
WO
WIPO (PCT)
Prior art keywords
vibration type
control device
control
trained model
type actuator
Prior art date
Application number
PCT/JP2021/027461
Other languages
English (en)
French (fr)
Inventor
潤 住岡
Original Assignee
キヤノン株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by キヤノン株式会社 filed Critical キヤノン株式会社
Publication of WO2022030274A1 publication Critical patent/WO2022030274A1/ja
Priority to US18/153,897 priority Critical patent/US20230147581A1/en

Links

Images

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02NELECTRIC MACHINES NOT OTHERWISE PROVIDED FOR
    • H02N2/00Electric machines in general using piezoelectric effect, electrostriction or magnetostriction
    • H02N2/02Electric machines in general using piezoelectric effect, electrostriction or magnetostriction producing linear motion, e.g. actuators; Linear positioners ; Linear motors
    • H02N2/06Drive circuits; Control arrangements or methods
    • H02N2/062Small signal circuits; Means for controlling position or derived quantities, e.g. for removing hysteresis
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B7/00Mountings, adjusting means, or light-tight connections, for optical elements
    • G02B7/02Mountings, adjusting means, or light-tight connections, for optical elements for lenses
    • G02B7/04Mountings, adjusting means, or light-tight connections, for optical elements for lenses with mechanism for focusing or varying magnification
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B5/00Adjustment of optical system relative to image or object surface other than for focusing
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B11/00Automatic controllers
    • G05B11/01Automatic controllers electric
    • G05B11/36Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02NELECTRIC MACHINES NOT OTHERWISE PROVIDED FOR
    • H02N2/00Electric machines in general using piezoelectric effect, electrostriction or magnetostriction
    • H02N2/02Electric machines in general using piezoelectric effect, electrostriction or magnetostriction producing linear motion, e.g. actuators; Linear positioners ; Linear motors
    • H02N2/026Electric machines in general using piezoelectric effect, electrostriction or magnetostriction producing linear motion, e.g. actuators; Linear positioners ; Linear motors by pressing one or more vibrators against the driven body
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B21/00Microscopes
    • G02B21/24Base structure
    • G02B21/26Stages; Adjusting means therefor
    • GPHYSICS
    • G02OPTICS
    • G02BOPTICAL ELEMENTS, SYSTEMS OR APPARATUS
    • G02B27/00Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
    • G02B27/64Imaging systems using optical elements for stabilisation of the lateral and angular position of the image
    • G02B27/646Imaging systems using optical elements for stabilisation of the lateral and angular position of the image compensating for small deviations, e.g. due to vibration or shake
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B17/00Details of cameras or camera bodies; Accessories therefor
    • G03B17/02Bodies
    • G03B17/12Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets
    • G03B17/14Bodies with means for supporting objectives, supplementary lenses, filters, masks, or turrets interchangeably
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02NELECTRIC MACHINES NOT OTHERWISE PROVIDED FOR
    • H02N2/00Electric machines in general using piezoelectric effect, electrostriction or magnetostriction
    • H02N2/0005Electric machines in general using piezoelectric effect, electrostriction or magnetostriction producing non-specific motion; Details common to machines covered by H02N2/02 - H02N2/16
    • H02N2/001Driving devices, e.g. vibrators
    • H02N2/0015Driving devices, e.g. vibrators using only bending modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction
    • H04N23/685Vibration or motion blur correction performed by mechanical compensation
    • H04N23/687Vibration or motion blur correction performed by mechanical compensation by shifting the lens or sensor position

Definitions

  • the present invention relates to a control device for a vibration type actuator, a vibration type drive device having the control device, an interchangeable lens, an image pickup device, an automatic stage, and the like.
  • the vibration type actuator (ultrasonic motor) generates high-frequency vibration in the electric-mechanical energy conversion element by applying an AC voltage to the electric-mechanical energy conversion element such as a piezoelectric element coupled to the elastic body. Then, it is a non-electromagnetically driven actuator configured to take out the vibration energy as continuous mechanical motion.
  • the vibration type actuator has excellent actuator performance (motor performance) such as small size and light weight, high accuracy, and high torque at low speed drive compared to the electromagnetically driven actuator.
  • actuator performance motor performance
  • non-linear actuator characteristics motor characteristics
  • it is difficult to model it, and the controllability changes according to the driving conditions and temperature environment, so it is necessary to devise a control system.
  • control parameters such as frequency, phase difference, and voltage amplitude, which complicates adjustment.
  • FIG. 45A is a control block diagram of a vibration type drive device by conventional general PID control (see Patent Document 1).
  • a two-phase (A phase, B phase) AC voltage (AC signal) is output from the drive circuit to which the control amount described later is input.
  • the frequency (1 / period), phase difference, and voltage amplitude (see FIG. 45B) of the two-phase AC voltage output from the drive circuit By controlling the frequency (1 / period), phase difference, and voltage amplitude (see FIG. 45B) of the two-phase AC voltage output from the drive circuit, the relative speed of the vibrating actuator (hereinafter, simply "speed”). Also called) can be controlled.
  • the voltage amplitude is variable depending on the pulse width input from the PID controller to the drive circuit, which will be described later.
  • (1), (2), and (3) in FIG. 45B represent the period, phase difference, and voltage amplitude of the two-phase AC voltage output from the drive circuit, respectively.
  • the position deviation which is the difference (target position-relative position) between the target position generated by the position command unit and the relative position of the vibration type motor detected by the position detection unit
  • the PID controller control amount output unit
  • the control amount frequency, phase difference, and pulse width
  • the control amount output from the PID controller is input to the drive circuit.
  • a two-phase AC voltage is output from the drive circuit to which the control amount is input, and the speed of the vibration type actuator is controlled by the two-phase AC voltage output from the drive circuit.
  • the position feedback control is performed by them.
  • FIG. 45C is a diagram schematically showing the frequency-velocity characteristics of the vibration type actuator. Specifically, in FIG. 45C, the slope of the frequency-speed characteristic is large in the high-speed range (low frequency range) frequency (f1), and the slope of the frequency-speed characteristic is large in the low-speed range (high frequency range) frequency (f2). Is shown to be small.
  • FIG. 45D is a diagram schematically showing the phase difference-velocity characteristics of the vibration type actuator, and is a diagram comparing the phase difference-velocity characteristics at the low speed frequency (f2) and the high speed frequency (f1). be.
  • the vibration type actuator has different slopes of frequency-speed characteristics and phase difference-speed characteristics depending on the speed range used, so that the control performance changes depending on the phase difference.
  • the resonance frequency shifts to the high frequency side based on the temperature characteristics of the piezoelectric element. In that case, since the speed and inclination when driven at the same frequency are different, the control performance also changes depending on the environmental temperature.
  • control performance since the speed and inclination differ depending on the individual difference of the vibration type actuator, the control performance also changes depending on the individual. In addition, the control performance also changes due to changes over time.
  • An object of the present invention is to provide a control device for a vibration type actuator having a control amount output unit different from that of a conventional PID controller as a main control amount output unit.
  • the uniform state of the present invention is a control device for a vibration type actuator that moves a contact body in contact with the vibrator relative to the vibrator by vibration generated in the vibrator, and the contact body is moved to the vibrator. Learning machine-learned to output a control amount for moving the contact body relative to the vibrator when a target speed for moving the contact body relative to the vibrator is input. It is a control device for a vibration type actuator, characterized in that it is provided with a control amount output unit having a finished model.
  • a control device for a vibration type actuator having a control amount output unit different from that of a conventional PID controller as a main control amount output unit.
  • 6 is a control block diagram of a vibration type drive device according to a sixth embodiment (when control is performed using a trained model in which machine learning is performed using a phase difference, a frequency, and a pulse width as control amounts). It is a figure which shows the neural network composition which outputs a phase difference, a frequency, and a pulse width.
  • Is. The figure which shows the learning model of the fifteenth embodiment (when the control is performed using the trained model which performed the machine learning with the phase difference and the frequency as control quantities), and the Z-layer regression type recurrent neural network structure which the trained model has.
  • FIG. 1 is a control block diagram of the vibration type drive device of the present embodiment.
  • the vibration type drive device 17 has a control device 15 and a vibration type motor 13 (vibration type actuator).
  • the control device 15 is the vibration type drive device 17 excluding the vibration type actuator 13.
  • the control device 15 is a machine learning unit 12 (learning unit) having a learned model control unit 10 (control unit) that controls a vibration type actuator, a drive unit 11, a speed detection unit 16 (speed detection means), and a learning model 106. ) And a position detecting unit 14 (position detecting means).
  • the drive unit 11 includes an AC signal generation unit 104 (AC signal generation means) and a booster circuit 105.
  • the vibration type actuator 13 has an oscillator 131 and a driven body 132 (contact body).
  • the speed detection unit 16 detects the relative speed (hereinafter, referred to as “relative speed”) of the vibrator 131 and the contact body 132 with respect to the vibrator 131.
  • the position detection unit 14 detects the relative position (hereinafter, also referred to as “relative position”) of the contact body 132 with respect to the oscillator 131.
  • As the position detection unit a so-called absolute encoder, an increment encoder, or the like is used, but the position detection unit is not limited to these. This is because the position detection unit may be any one that can detect the position information.
  • the speed detection unit 16 is not limited to the one that directly detects the speed information (speed sensor), and may indirectly detect the speed information by calculating the position information or the like. This is because the speed detection unit may be any one that can detect speed information.
  • the control unit 10 is configured to be able to generate a signal for controlling the drive of the oscillator 131 (the relative movement of the contact body 132 with respect to the oscillator 131). That is, the target speed (first speed) and the position deviation are input to the trained model, and the output phase difference and frequency are used as the control amount (first control amount) of the vibration type actuator 13.
  • the target speed (first speed) is a speed set so that the relative speed (second speed, detection speed) follows when the contact body 132 is moved relative to the oscillator 131. be.
  • the position deviation is the difference between the target position (first position) and the relative position (second position, detection position).
  • the target position is a position set so that the relative position (second position, detection position) follows when the contact body 132 is moved relative to the oscillator 131. be.
  • a pulse width for changing the voltage amplitude may be used as the first control amount.
  • the control unit 10 has a speed command unit 101 (speed command means, speed generation means) that generates a target speed, and a position command unit 102 (position command means, position generation means) that generates a target position. Further, the control unit 10 has a trained model 103 (control amount output unit, control amount output device) in which a target speed and a position deviation are input and a phase difference and a frequency are output.
  • the speed command unit 101 generates a target speed for each unit time. Further, the position command unit 102 generates a target position for each unit time. Then, the difference between the target position for each unit time generated by the position command unit 102 detected by the position detection unit 14 and the relative position for each unit time detected by the speed detection unit 16 is the difference for each unit time. It is calculated as a position deviation. The difference is the relative position per unit time-the target position per unit time.
  • the target speed and the target position are generated for each control sampling cycle as a unit time, for example.
  • one command value representing the target speed is output from the speed command unit 101 in each control sampling cycle
  • one command value representing the target position is output from the position command unit 102 in each control sampling cycle.
  • the command value may be associated with the target speed instead of the target speed itself.
  • the control sampling period is from the acquisition of the position deviation in FIG. 1, the output of the control amount, the application of the AC voltage to the vibrator, the relative speed (second speed, detection speed) and the relative position (second position, detection). It refers to one cycle from the detection of position) to just before the acquisition of position deviation starts.
  • the position or speed of the vibrating actuator is feedback-controlled.
  • the target speed may be generated by differentiating the target position for each unit time. On the contrary, the target position may be generated by integrating the target speed.
  • the control amount (phase difference, frequency) is calculated and output by the trained model 103 using the target speed and the position deviation.
  • the trained model 103 has a neural network (hereinafter, also referred to as “NN”) configuration shown in FIG.
  • the NN is composed of an X layer of an input layer, an H layer of a hidden layer, and a Z layer of an output layer.
  • the target speed is set to the input x1 and the position deviation is set to the input x2 as the input data
  • the phase difference is set to the output z1
  • the frequency is set to the output z2 as the output data.
  • the input layer has 2 neurons (X1, X2), the hidden layer has 7 neurons (H1, H2, ..., H7), and the output layer has 2 neurons (Z1, Z2) and is activated.
  • a general sigmoid function (Fig. 2B) was used as the function.
  • the number of neurons in the hidden layer is not limited to 7, but a range of 3 to 20 is preferable. The smaller the number of neurons in the hidden layer, the lower the learning accuracy, but the learning converges faster (the learning speed becomes faster), and the larger the number of neurons in the hidden layer, the better the learning accuracy, but the slower the learning speed, and the learning. This is because there is a trade-off between accuracy and learning speed.
  • sigmoid function and ReLU are generally used as the activation function of the output layer, but a linear function (Fig. 2C) is used in order to correspond to the minus sign of the phase difference, which is a control amount. board.
  • the weight (first weight) connecting the neuron in the input layer (first neuron) and the neuron in the hidden layer (second neuron) was defined as wh.
  • the threshold value of the neuron (second neuron) in the hidden layer was set to ⁇ h.
  • the weight connecting the neurons in the hidden layer (second neuron) and the neurons in the output layer (third neuron) was set as wo.
  • the threshold value of the neuron (third neuron) in the output layer was set to ⁇ o.
  • the learned NN can be regarded as an aggregate obtained by extracting a common feature pattern from the time-series data of the relative velocity and the control amount of the vibration type actuator. Therefore, the output is a value obtained by a function whose variables (parameters) are weights and thresholds.
  • the control amount (phase difference, frequency) output from the NN is input to the AC signal generation unit 104, and the speed and drive direction of the vibration type actuator are controlled.
  • the AC signal generation unit 104 generates a two-phase AC signal based on the phase difference, frequency, and pulse width.
  • the booster circuit 105 has, for example, a coil or a transformer, and an AC signal (AC voltage) boosted to a desired drive voltage by the booster circuit 105 is applied to the piezoelectric element of the transducer 131 to drive the contact body 132. do.
  • AC signal AC voltage
  • FIG. 3 is a diagram illustrating a driving principle of a linear drive type (linear drive type) vibration type actuator using a chip type oscillator which is an example of a vibration type actuator.
  • the vibrating actuator 13 shown in FIG. 3A has an elastic body 203 and a vibrator 131 having a piezoelectric element 204 which is an electric-mechanical energy conversion element bonded to the elastic body 203, and a contact body 132 driven by the vibrator 131.
  • Has. By applying an AC voltage to the piezoelectric element 204, two vibration modes as shown in FIGS.
  • the vibration type actuator to which the present invention can be applied is not limited to the linear drive type (linear motion type) vibration type actuator using a chip type oscillator, and can be applied to various types of vibration type actuators. For example, it can be applied to a ring type (rotating type) vibration type actuator using a chip type oscillator. It can also be applied to an annular type (rotating type) vibration type actuator using a ring type oscillator. This is because the vibration type actuator may be any as long as it can move the vibrator and the contact body relatively by the vibration generated in the vibrator by applying a voltage to the electric-mechanical energy conversion element. ..
  • FIG. 3B is a diagram showing an electrode pattern of the piezoelectric element 204.
  • the piezoelectric element 204 of the vibrator 131 is formed with an electrode region divided into two equal parts in the longitudinal direction. Further, the polarization directions in each electrode region are the same direction (+).
  • an AC voltage (VB) is applied to the electrode region located on the right side of FIG. 3B
  • an AC voltage (VA) is applied to the electrode region located on the left side.
  • the entire piezoelectric element 204 (two electrode regions) extends at one moment and at another moment. It will shrink. As a result, vibration in the first vibration mode shown in FIG. 3C (hereinafter referred to as “push-up vibration”) is generated in the vibrator 131. As a result, the protrusion 202 is displaced in the push-up direction (Z direction).
  • VB and VA have an AC voltage having a frequency near the resonance frequency of the second vibration mode and a phase shift of 180 °
  • the electrode region on the right side of the piezoelectric element 204 shrinks and the electrode region on the left side shrinks.
  • the electrode area is stretched.
  • the relationship is reversed.
  • vibration in the second vibration mode shown in FIG. 3D (hereinafter referred to as feed vibration) is generated in the vibrator 131.
  • the protrusion 202 is displaced in the drive direction (feed direction, X direction).
  • the protrusion 202 makes an elliptical motion in the cross section perpendicular to the Y direction (direction perpendicular to the X direction and the Z direction) in FIG. 3D.
  • the elliptical motion drives the contact body 132 in the direction of the arrow in FIG. 3A.
  • the direction in which the contact body 132 and the vibrator 131 move relative to each other, that is, the direction in which the contact body 132 is driven by the vibrator 131 (here, the X direction) is referred to as a drive direction.
  • the amplitude ratio R (feed vibration amplitude / push-up vibration amplitude) of the second vibration mode with respect to the first vibration mode is obtained by changing the phase difference of the two-phase AC voltage input to the electrode divided into two equal parts. It can be changed.
  • this vibration type actuator it is possible to change the speed of the contact body by changing the amplitude ratio of the vibration.
  • the present invention is not limited to this embodiment. It is sufficient that the positions of the contact portions of the contact body and the oscillator are relatively different from each other.
  • the contact body may be stationary (fixed) and the oscillator may be moved (driven). That is, in the present invention, “driving” means changing the position of the contact body relative to the oscillator, and does not necessarily include the absolute position of the contact body (for example, the contact body and the oscillator). It is not necessary to change the position of the contact body with respect to the position of the housing).
  • a linear drive type (linear drive type) vibration type actuator has been described as an example. That is, the case where the oscillator 131 or the contact body 132 moves (drives) in the linear direction has been described as an example, but the present invention is not limited to this embodiment. It is sufficient that the positions of the contact portions of the contact body and the oscillator are relatively different from each other. For example, the oscillator and the contact body may move in the rotational direction.
  • Examples of the vibration type actuator in which the vibrator and the contact body move in the rotational direction include a ring type (rotational type) vibration type actuator having a ring-shaped vibrator.
  • the vibration type actuator is used, for example, for driving the autofocus of a camera.
  • FIG. 4 is a perspective view illustrating the driving mechanism of the lens of the lens barrel.
  • the drive mechanism of the lens holder by the vibration type actuator includes a vibrator, a lens holder, and a first guide bar and a second guide bar arranged in parallel to hold the lens holder slidably.
  • the second guide bar is a contact body, the second guide bar is fixed, and the vibrator and the lens holder move together will be described.
  • the vibrator moves relative to the second guide bar in contact between the vibrator and the protrusion of the elastic body due to the elliptical motion of the protrusion of the vibrator generated by the application of the driving voltage to the electric-mechanical energy conversion element. Generate force.
  • the lens holder fixed integrally with the vibrator is configured to be movable along the first and second guide bars.
  • the drive mechanism 300 of the contact body is mainly a lens holder 302 which is a lens holding member, a lens 306, an oscillator 131 to which a flexible printed substrate is bonded, a pressurizing magnet 305, and two guide bars 303 and 304. And has a substrate (not shown).
  • the oscillator 131 will be described as an example.
  • the lens holder 302 includes a cylindrical holder portion 302a, a holding portion 302b that holds and fixes the vibrator 131 and the pressurizing magnet 305, and a first guide portion 302c that is fitted with the first guide bar 303 to act as a guide. Have.
  • the pressure magnet 305 for forming the pressure portion has a permanent magnet and two yokes arranged at both ends of the permanent magnet. A magnetic circuit is formed between the pressurizing magnet 305 and the second guide bar 304, and an attractive force is generated between these members.
  • the pressurizing magnet 305 is arranged at a distance from the second guide bar 304, and the second guide bar 304 is arranged so as to be in contact with the oscillator 131.
  • a pressing force is applied between the second guide bar 304 and the vibrator 131 by the suction force.
  • the two protrusions of the elastic body come into pressure contact with the second guide bar 304 to form the second guide portion.
  • the second guide portion forms a guide mechanism by using the attractive force by magnetism, and the oscillator 131 and the second guide bar 304 are separated from each other by receiving an external force or the like. It is dealt with as follows.
  • the fall prevention portion 302d provided on the lens holder 302 hits the second guide bar 304, so that the lens holder 302 returns to a desired position.
  • a desired AC voltage AC signal
  • the relative position and relative velocity are detected by a position sensor (not shown) attached to the contact body 132 or the oscillator 131.
  • the relative position is fed back to the control unit 10 as a position deviation, so that the vibration type actuator is feedback-controlled so as to follow the target position for each unit time.
  • the relative velocity is input to the machine learning unit 12 and used as learning data together with the control amount (phase difference, frequency) output from the control unit 10.
  • the training data is data composed of a pair of input data and output data (correct answer data).
  • the training data is data composed of a pair of a relative speed as input data and a control amount (phase difference, frequency) as output data (correct answer data).
  • a two-phase drive control device for driving a piezoelectric element which is an electric-mechanical energy conversion element, by dividing it into two phases
  • the present invention is not limited to the two-phase drive. It can also be applied to vibration type actuators with two or more phases.
  • the learning model 106 has an NN configuration (see FIG. 2) in which the relative speed and the target deviation from the speed detection unit 16 are input and the phase difference and the frequency are output.
  • the target deviation is a value set so that the position deviation follows when the contact body 132 is moved relative to the oscillator 131.
  • the target deviation here is a value of the same dimension (data format) as the position deviation.
  • the target deviation is set to, for example, zero, but an offset value may be given so as to compensate for the backlash of the mechanical system.
  • the learning model 106 may input a speed deviation, which is the difference between the target speed and the detection speed, as an input instead of the target deviation (see FIG. 5).
  • the control amount (phase difference, frequency) output from the control unit 10 is used as correct answer data, and an error is calculated by comparing with the control amount output from the learning model 106 that has not been learned or is being learned.
  • the phase difference and the frequency are used as the control amount, but in addition to this, the combination of the pulse width and the frequency and the pulse width and the phase difference can also be used as the control amount.
  • the number of neurons in the output layer of the NN may be one, and the control amount may be designed to select any of phase difference, frequency, and pulse width.
  • FIG. 6 is a flowchart of machine learning and control by a trained model in this embodiment.
  • step 1 initial values are set in the weights and thresholds of the learning model 103 of the control unit based on the random function (unlearned state).
  • step 2 the vibration type actuator is controlled by the unlearned model (unlearned NN).
  • step 3 the time-series data of the control amount (phase difference, frequency) output from the unlearned model while driving the vibration type actuator and the relative speed detected by the speed detection unit 16 is learned. Obtained as data.
  • step 4 (S4) the optimization calculation by machine learning using the learning model 106 is performed with the control amount of the learning data as the correct answer data. Optimization is to adjust the parameters of the NN so that the output from the NN by the input to the NN approaches the training data, so that the output from the NN by the input to the NN matches the training data. In addition, it is not limited to adjusting the parameters of NN.
  • the learning model 106 has the same NN configuration as the trained model 103 used for control. Machine learning optimizes the NN weights and thresholds, and updates the parameters of the trained model 103 of the control unit.
  • step 5 the vibration type actuator is controlled by the learned model 103 in which the weight and the threshold value are updated.
  • the machine learning unit 12 has a program that causes a computer (not shown) to execute these steps.
  • step 3 S3
  • learning data is acquired.
  • step 3 S3
  • batch learning in which learning is performed while driving is stopped, online learning in which sequential learning is performed during driving, and the like are carried out.
  • FIG. 7 is a timing chart for explaining batch learning and online learning (a method of manufacturing a control device for a vibration type actuator) in the machine learning unit 12.
  • the horizontal axis shows time, and the vertical axis shows the target position pattern given as a command value for feedback control of the vibration type actuator.
  • FIG. 7A shows an example of batch learning in which learning is performed while the drive is stopped (except when the contact body is moved relative to the oscillator).
  • time-series data of relative velocity and control amount detected during the drive period of the vibration type actuator is acquired as training data, and machine learning and NN parameters are updated (weight, threshold) using the stop period. Is. It is not always necessary to perform machine learning for each stop period, and for example, a method of learning only when a change in the temperature environment or driving conditions is detected is possible.
  • FIG. 7B shows an example of online learning in which sequential learning is performed during driving (when the contact body is moved relative to the oscillator).
  • machine learning is performed online in parallel with the vibration type actuator drive period, and the NN parameters are updated during the drive period.
  • FIG. 8A is a flowchart when Adam is used as the NN parameter optimization method (optimization algorithm).
  • Steps 1 to 2 are as described in FIG. 6 above.
  • step 3 (S3) the control amount (n) and the detection speed (n), which are the time-series learning data shown in FIG. 8B, are acquired.
  • the control amount (n) and the detection speed (n) are measurement data when the vibration type actuator 13 is controlled by the unlearned model, and the speed detection unit when the vibration type actuator 13 is driven by the control amount (n).
  • the speed detected by 16 is the detection speed (n).
  • the number n of each sample of the control amount (phase difference) and the detection speed is 3400. This is actual measurement data when driven for 0.34 sec at a controlled sampling rate (1 / controlled sampling cycle) of 10 kHz.
  • the learning data does not necessarily have to be acquired at the controlled sampling rate, and it is possible to save memory and shorten the learning time by thinning out.
  • the detection speed (n) is used as the input of the learning model 106, and the output z (n) which is the result of calculation (derivation) and output by the learning model 106 is defined as t (n) which corresponds to the correct answer data of the learning data.
  • the error gradients ⁇ E of the threshold values ( ⁇ h, ⁇ o) are calculated respectively.
  • w t is the parameter update amount
  • ⁇ E is the error gradient
  • v t is the moving average of the error gradient
  • st is the moving average of the square of the error gradient
  • is the learning rate
  • is the zero division prevention constant.
  • the weight and the threshold value are updated, and the output z (n) of the learning model approaches t (n), which corresponds to the correct answer data, so that the error E becomes smaller.
  • step 5 the vibration type actuator is controlled by the learned NN whose weight and threshold value are updated.
  • FIG. 8C shows the transition of the error E based on the number of calculation loops.
  • optimization method optimization algorithm
  • other methods algorithms
  • FIG. 9A compares the calculation results by Adam, RMSprop, Momentum, and SGD using the learning model 106 of the present embodiment and the learning data obtained by actual measurement. In terms of the number of operations, stability, and final error, Adam gave the best results.
  • FIG. 9B is an example of learning the controlled variable (phase difference) by Adam. It can be seen that the output z of the learning model of the first loop is significantly different from the control amount t of the correct answer data. The calculation is repeated, and the output z of the learning model at the 5000th loop is almost the same as the control amount t of the correct answer data.
  • the number of loops is set to 5000, and the optimization is performed. However, it is desirable to adjust the number of times as appropriate according to the convergence rate.
  • the control unit 10 and the machine learning unit 12 are composed of, for example, a digital device such as a CPU and a PLD (including an ASIC), and an element such as an A / D converter.
  • the AC signal generation unit 104 of the drive unit 11 has, for example, a CPU, a function generator, and a switching circuit
  • the booster circuit 105 of the drive unit 11 is composed of, for example, a coil, a transformer, and a capacitor.
  • the control unit 10, the machine learning unit 12, and the drive unit 11 are not only composed of one element or circuit, but may be composed of a plurality of elements or circuits. Further, any element or circuit may execute each process in the control unit 10, the machine learning unit 12, and the drive unit 11.
  • FIGS. 10A, 10B and 10C compare the results of the conventional PID control and the control by the trained model of the present invention when the feedback control is performed with a predetermined target position pattern.
  • the target speed is a trapezoidal drive with a maximum speed of 50 mm / s, and is a pattern in which a reciprocating operation with a 5 mm stroke including a positioning operation is performed.
  • the horizontal axis is time (sec)
  • the vertical axis is the phase difference control amount (deg)
  • target position number of encoder pulses: 8000pls per mm.
  • the position deviation ( ⁇ m) is shown.
  • FIG. 10A is a result of a vibration type actuator control device (see FIG. 47A) using a conventional PID controller.
  • the frequency (driving frequency) of the AC voltage applied to the vibration type actuator 13 is fixed at 93 kHz. Further, the vibration type actuator 13 was controlled only by the phase difference.
  • the position deviation tends to be large especially in the acceleration / deceleration region. This is because the inertia of the driven body driven by the vibrating actuator has an effect. In addition, it can be seen that it takes a long time to stop and settle (from the time when the target position does not change until the actual position does not change). Although it is possible to reduce the position deviation by further increasing the PID control gain, a certain gain margin and phase are ensured in order to ensure robustness against changes in driving conditions (frequency range used 91 kHz to 95 kHz) and environmental temperature. A PID control gain with a margin was applied.
  • FIG. 10B is a control result by the control device of the vibration type actuator using the trained model of the present invention.
  • the drive frequency was fixed at 93 kHz and controlled only by the phase difference.
  • FIG. 10C is a control result by the control device of the vibration type actuator using the trained model.
  • the drive frequency starts from 93 kHz, and the frequency is manipulated in parallel with the phase difference, whereby the drive frequency is manipulated.
  • the frequency is an unsigned absolute value, and the drive frequency is always operated to the low frequency side with reference to 93 kHz.
  • learning was performed by defining the ratio of frequency and phase difference.
  • the speed range of the vibrating actuator can be expanded by using the phase difference and frequency as the control amount, and the speed deviation and the position deviation are improved compared to the PID control.
  • the change of the phase difference of the virtual PID control is displayed (the uppermost figure). This is not directly used for the control of the vibration type actuator, but is the output of the control amount obtained by performing the PID calculation as an observer based on the position deviation.
  • FIG. 11 is a result showing the robustness in the control device of the present invention.
  • the horizontal axis shows time (sec)
  • the vertical axis shows the target position (left axis) in pulse units of the encoder, and the position deviation in ⁇ m units (right axis).
  • FIG. 11A shows the control result by the trained model that machine-learned at a frequency of 95 kHz
  • FIG. 11B shows the control result by the trained model that machine-learned at a frequency of 91 kHz.
  • FIGS. 45A, 45B, 45C, and 45D when the control is performed at different frequencies, the slope of the speed changes due to the non-linear characteristics of the vibration type actuator. was difficult.
  • the present invention can generate a trained model corresponding to a change in the slope of the velocity curve by machine learning, so that good controllability can be obtained even at different frequencies.
  • FIG. 12 is a control block diagram of a vibration type drive device when the control result of PID control is used as learning data.
  • the control device is the one excluding the vibration type actuator 13.
  • the position feedback control of the vibration type actuator 13 is performed by using the PID controller 901.
  • the position deviation is input to the PID controller 901, and the phase difference and the frequency as the control amount calculated by the PID are output from the PID controller 901.
  • the controller may have a configuration other than the PID controller, and for example, a P controller, a PI controller, a PD controller, and the like can also be applied.
  • Machine learning of the learning model 106 is performed using the relative speed (detection speed) detected by the speed detection unit 16 in the machine learning unit 12 and the control amount (phase difference, frequency) output from the PID controller 901. Will be.
  • a feature of this embodiment is that the control result by the PID controller and the control result by the trained model obtained by machine learning using the control amount of the PID controller as correct answer data can be compared. By comparing with the PID controller, it can be determined whether or not the training is successful, and the reliability of the trained model can be guaranteed.
  • FIG. 13 is a control block diagram of a vibration type drive device when the control result of the open drive is used as learning data.
  • the control device is the one excluding the vibration type actuator 13.
  • feedback control of the vibration type actuator 13 is not performed.
  • An arbitrary pattern waveform generated by the drive pattern generation unit 1001 (drive pattern command unit) is output (commanded) from the open drive unit 1002 to the AC signal generation unit 111.
  • a repeating signal of a SIN wave pattern or a rectangular pattern is used.
  • the phase difference of the same frequency and the SIN wave pattern of the frequency are output respectively.
  • the control performance of the trained model can be adjusted.
  • the phase difference SIN wave amplitude is 90 deg
  • the frequency SIN wave amplitude is 1 kHz.
  • Machine learning of the learning model 106 is performed using the relative speed detected by the speed detection unit 16 in the machine learning unit 12 and the control amount (phase difference, frequency) output from the open drive unit 1002.
  • a feature of this embodiment is that the control result by the open drive unit and the control result by the trained model obtained by machine learning using the control amount of the open drive unit as correct data can be compared. By comparing with the open drive unit, it can be determined whether or not the training is successful, and the reliability of the trained model can be guaranteed.
  • FIG. 14 is a control block diagram of the vibration type drive device when the trained model and the PID controller are used in combination.
  • the control device is the one excluding the vibration type actuator 13.
  • the position feedback control of the vibration type actuator 13 is performed by using the PID controller 1401 (first PID controller) and the trained model 103.
  • the position deviation is input to the first PID controller 1401, and the PID-calculated position deviation is output from the first PID controller 1401.
  • a configuration other than the PID controller may be used, and for example, a P controller, a PI controller, a PD controller, and the like can also be applied.
  • the target speed and the PID-calculated position deviation are input to the trained model 103.
  • machine learning of the learning model 106 is performed using the relative speed detected by the speed detection unit 16 in the machine learning unit 12 and the control amount (phase difference, frequency) output from the trained model 103. ..
  • the PID-calculated position deviation may be input to the trained model 103 and may be added to the output (control amount) from the trained model 103 as in the fifth embodiment described later (a fifth embodiment). See FIG. 15). This is to make the PID calculation amount of the position deviation function in series and in parallel with the trained model 103.
  • the effect of the position deviation can be greatly enhanced by the series component (the responsiveness is enhanced), and the effect of stabilizing the control system can be obtained by the parallel component.
  • the PID arithmetic units can be configured in series and in parallel in this way, and a control system with a high degree of freedom can be constructed.
  • the gain of the position deviation input to the trained model can be adjusted, so that the control system can be finely adjusted.
  • FIG. 16 is a control block diagram of the vibration type drive device when the trained model and the PID controller are used in combination.
  • the control device is the one excluding the vibration type actuator 13.
  • the position feedback control of the vibration type actuator 13 is obtained by adding the control amount output from the PID controller 1501 (second PID controller) and the control amount output from the trained model 103. It is done.
  • the position deviation is input to the second PID controller 1501, and the PID-calculated phase difference and frequency are output.
  • a configuration other than the PID controller may be used, and for example, a P controller, a PI controller, a PD controller, and the like can also be applied.
  • a phase compensator may be arranged after the PID controller.
  • the target speed and the position deviation are input to the trained model 103, but the position deviation may be zero.
  • phase difference and frequency are output from the trained model 103, and the phase difference and frequency output from the second PID controller 1501 are added to each other.
  • the added control amount and the relative speed detected by the speed detection unit 16 are input to the machine learning unit 12, and machine learning of the learning model 106 is performed.
  • the gain of the position deviation input to the trained model can be adjusted, so that the control system can be finely adjusted.
  • FIG. 17 is a control block diagram of a vibration type drive device in the case of performing control using a trained model in which machine learning is performed using the phase difference, frequency, and pulse width as control amounts.
  • the control device is the one excluding the vibration type actuator 13.
  • the position feedback control of the vibration type actuator 13 is performed by each control amount (phase difference, frequency, and pulse width) output from the trained model 1601.
  • the target speed and position deviation are input to the trained model 1601, the phase difference, frequency, and pulse width calculated by NN are output to the drive unit 11, and the vibration type actuator 13 is controlled.
  • the machine learning unit 12 acquires the three control amounts output from the trained model 1601 and the relative velocity detected by the speed detection unit 16 as learning data, and machine learning is performed by the learning model 1602.
  • FIG. 18 is a diagram showing a neural network configuration having a phase difference, a frequency, and a pulse width as outputs.
  • the trained model 1601 and the trained model 1062 have an NN configuration in which the target velocity and the position deviation are input and three control quantities are output.
  • the measurement data of the control by the trained model may be used as described above, or the measurement data when the vibration type actuator is controlled by the unlearned model in which the parameters are set by the random function may be used. ..
  • the measurement data by the open drive and the measurement data by the PID control may be used.
  • parameters with optimum conditions may be selected from a plurality of learning data from the viewpoint of position deviation, power consumption, and the like. This is because there are innumerable combinations of phase difference, frequency, and pulse width, that is, conditions for obtaining a predetermined speed of the vibration type actuator.
  • the parameters for operating the vibration type actuator increase, so it is possible to finely adjust the control performance by performing appropriate machine learning.
  • FIG. 19 corresponds to a control block diagram of the vibration type drive device in the case where the position command unit 102, the position detection unit 14, and the like are removed from the vibration type drive device of FIG.
  • the control device is the one excluding the vibration type actuator 13.
  • FIG. 20 is a diagram showing an NN configuration of the learning model used in FIG. 19 and the trained model control unit.
  • FIG. 21 shows the control of the vibration type drive device when the feedback control by the speed deviation is performed instead of the feedback loop control by the position deviation, except for the position command unit 102, the position detection unit 14, and the like from the vibration type drive device of FIG. Corresponds to a block diagram.
  • the control device is the one excluding the vibration type actuator 13.
  • FIG. 22 is a diagram showing an NN configuration of the learning model used in FIG. 21 and the trained model control unit.
  • the control device has a control amount output unit having a trained model machine-learned to output the first control amount when the first velocity is commanded.
  • the learning unit may be removed from the control device.
  • the trained model has a storage unit for storing the parameters (first weight, second weight, threshold value of the second neuron, and threshold value of the third neuron). You may do it. Then, the trained model may be machine-learned by substituting the parameters of the trained model with the parameters stored in the storage unit.
  • a memory such as a ROM is used for the storage unit, but the storage unit is not limited to this. This is because the storage unit may be any one that can store the parameters of the trained model.
  • an environment sensor for detecting an environmental state may be provided. Then, the trained model may be machine-learned when a change in the environment is detected by the environment sensor.
  • the environment sensor may be at least one of a temperature sensor and a humidity sensor.
  • FIG. 23 is a control block diagram of the vibration type drive device of the present embodiment.
  • the vibration type drive device 17 has a control device 15 and a vibration type actuator 13.
  • the control device 15 is the vibration type drive device 17 excluding the vibration type actuator 13.
  • the control device 15 includes a learned model control unit 10 (control unit) that controls a vibration type actuator, a drive unit 11, a machine learning unit 12 having a learning model 116, and a position detection unit 14.
  • the drive unit 11 has an AC signal generation unit 104 and a booster circuit 105.
  • the vibration type actuator 13 has an oscillator 131 and a contact body 132.
  • the speed detection unit 16 detects the relative speed (relative speed) of the contact body 132 with respect to the oscillator 131.
  • the position detection unit 14 detects the relative position (relative position) of the contact body 132 with respect to the oscillator 131.
  • As the position detection unit a so-called absolute encoder, an increment encoder, or the like is used, but the position detection unit is not limited to these.
  • the speed detection unit 16 is not limited to the one that directly detects the speed information (speed sensor), and may be the one that indirectly detects the speed information by calculating the position information.
  • the control unit 10 is configured to be able to generate a signal for controlling the drive of the oscillator 131 (the relative movement of the contact body 132 with respect to the oscillator 131). That is, the target speed and the position deviation are input to the trained model, and the output phase difference and frequency are used as the control amount (first control amount) of the vibration type actuator 13.
  • the target speed is a speed set so that the actual speed (detection speed) follows when the contact body 132 is moved relative to the vibrator 131.
  • the position deviation is the difference between the target position and the actual position (detection position).
  • the target position is a position set so that the actual position (detection position) follows when the contact body 132 is moved relative to the oscillator 131.
  • a pulse width for changing the voltage amplitude may be used as the control amount.
  • the control unit 10 has a speed command unit 101 that commands a target speed and a position command unit 102 that commands a target position. Further, the control unit 10 has a control amount output unit 113 having a learned model in which a target speed and a position deviation are input and a phase difference and a frequency are output. In the following, the "controlled variable output unit having a trained model” is also simply referred to as a "trained model”.
  • the drive unit 11 has an AC signal generation unit 104 and a booster circuit 105.
  • the speed command unit 101 generates and commands a target speed for each unit time. Further, the position command unit 102 generates and commands a target position for each unit time. Then, the difference between the target position and the detection position detected by the position detection unit 14 for each unit time is calculated as a position deviation. The difference is the detection position per unit time-the target position per unit time.
  • the target speed and the target position are generated for each control sampling cycle as a unit time, for example.
  • one command value representing the target speed is output from the speed command unit 101 in each control sampling cycle
  • one command value representing the target position is output from the position command unit 102 in each control sampling cycle.
  • the command value may be associated with the target speed instead of the target speed itself.
  • the control sampling cycle is the position deviation from the acquisition of the position deviation in FIG. 23, the output of the control amount, the application of the AC voltage to the vibrator, the detection of the actual speed (detection speed) and the actual position (detection position), and then the position deviation. It refers to one cycle until just before the acquisition starts.
  • the position or speed of the vibrating actuator is feedback-controlled.
  • the target speed may be generated by differentiating the target position for each unit time. On the contrary, the target position may be generated by integrating the target speed.
  • the control amount is calculated and output by the trained model 113 using the target speed and the position deviation.
  • the trained model 113 has a recurrent neural network (hereinafter, also referred to as “RNN”) structure shown in FIGS. 24A, 24B, and 24C.
  • the RNN is composed of an X layer of an input layer, an H layer of a hidden layer, a Z layer of an output layer, and a C layer of a state layer, and has a so-called deep learning structure. It is a feature of the present invention that the feature of RNN that performs machine learning while storing time-series information is utilized and applied to the feedback control of a vibration type actuator.
  • the target speed is set to the input x1 and the position deviation is set to the input x2 as the input data
  • the phase difference is set to the output z1
  • the frequency is set to the output z2 as the output data.
  • the input layer has 2 neurons (X1, X2), the hidden layer has 7 neurons (H1, H2, ..., H7), and the output layer has 2 neurons (Z1, Z2) and is activated.
  • a general sigmoid function (FIG. 24B) was used as the function.
  • the number of neurons in the hidden layer is not limited to 7, but a range of 3 to 20 is preferable. The smaller the number of neurons in the hidden layer, the lower the learning accuracy, but the learning converges faster (the learning speed becomes faster), and the larger the number of neurons in the hidden layer, the better the learning accuracy, but the slower the learning speed, and the learning. This is because there is a trade-off between accuracy and learning speed.
  • sigmoid function and ReLU are generally used as the activation function of the output layer, but a linear function (Fig. 24C) is used in order to correspond to the minus sign of the phase difference, which is a control amount. board.
  • the state layer has 7 neurons (C1, C2, ..., C7), and the output of the hidden layer is held by each neuron in the state layer. That is, the data before one control sampling of the time series data is retained. The data held in the state layer is regressed to the state layer at the next control sampling. Therefore, the data (velocity, position deviation) from the input layer and the retained data from the state layer are input to the hidden layer after being multiplied by the weight. As a result, the output data (phase difference and frequency) is calculated after the past time series data information is stored.
  • the weight (first weight) connecting the neuron in the input layer (first neuron) and the neuron in the hidden layer (second neuron) was defined as wh.
  • the threshold value of the neuron (second neuron) in the hidden layer was set to ⁇ h.
  • the weight connecting the neurons in the hidden layer (second neuron) and the neurons in the output layer (third neuron) was set as wo.
  • the threshold value of the neuron (third neuron) in the output layer was set to ⁇ o.
  • the weight connecting the neurons in the state layer (fourth neuron) and the neurons in the hidden layer (second neuron) was defined as wc. As the weight and the threshold value, the values learned by the machine learning unit 12 described later are applied.
  • the learned RNN can be regarded as an aggregate obtained by extracting a common feature pattern from the time-series data of the actual speed (detection speed) and the control amount of the vibration type actuator. Therefore, the output is a value obtained by a function whose variables (parameters) are weights and thresholds.
  • the control amount (phase difference and frequency) output from the NN is input to the AC signal generation unit 104, and the speed and drive direction of the vibration type actuator are controlled.
  • the AC signal generation unit 104 generates a two-phase AC signal based on the phase difference, frequency, and pulse width.
  • the booster circuit 105 has, for example, a coil or a transformer, and an AC signal (AC voltage) boosted to a desired drive voltage by the booster circuit 105 is applied to the piezoelectric element of the transducer 131 to drive the contact body 132. do.
  • AC signal AC voltage
  • FIG. 25 is a flowchart when Adam is used as an optimization method (optimization algorithm) for RNN parameters.
  • the contents of steps 1 to 5 are the above-mentioned FIGS. 8A and below, except that the error gradient calculated and used is the error gradient ⁇ E of the weight (wh, wc, wo) and the threshold value ( ⁇ h, ⁇ o). It is the same as the explanation used.
  • FIGS. 26A, 26B, and 26C compare the control results when the feedback control is performed with a predetermined target position pattern between the conventional PID control and the control by the trained model of the present invention.
  • the target speed is a trapezoidal drive with a maximum speed of 50 mm / s, and is a pattern in which a reciprocating operation with a 5 mm stroke including a positioning operation is performed.
  • the horizontal axis is time (sec)
  • the vertical axis is the phase difference control amount (deg)
  • target position number of encoder pulses: 8000pls per mm.
  • the position deviation ( ⁇ m) is shown.
  • FIG. 26A is a control result by a control device (see FIG. 45A) of a vibration type actuator using a conventional PID controller.
  • the frequency (driving frequency) of the AC voltage applied to the vibration type actuator 13 is fixed at 93 kHz. Further, the vibration type actuator 13 was controlled only by the phase difference.
  • the position deviation tends to be large especially in the acceleration / deceleration region. This is because the inertia of the driven body driven by the vibrating actuator has an effect. In addition, it can be seen that it takes a long time to stop and settle (from the time when the target position does not change until the actual position does not change). Although it is possible to reduce the position deviation by further increasing the PID control gain, a certain gain margin and phase are ensured in order to ensure robustness against changes in driving conditions (frequency range used 91 kHz to 95 kHz) and environmental temperature. A PID control gain with a margin was applied.
  • FIG. 26B is a control result by the control device (control device 15 in FIG. 23) of the vibration type actuator using the trained model of the present invention (trained model of H layer recurrent neural network structure).
  • the H-layer recurrent neural network is a neural network that stores the output of the H layer (hidden layer) in the C layer (state layer) and returns it to the H layer (hidden layer).
  • 24A, 24B, and 24C show an H-layer recurrent neural network structure.
  • the drive frequency was fixed and the phase difference was changed.
  • the drive frequency (“frequency” in FIG. 23, output z2 in FIG. 24A) is fixed at 93 kHz, and the vibration type actuator 13 changes the phase difference (phase difference in FIG. 23, z1 in FIG. 24A). Controlled by.
  • the H-layer regression type RNN of the present invention it was found that the position deviation is improved in all regions during acceleration / deceleration and stop setting.
  • FIG. 26C shows a control device for a vibration type actuator using the trained model of the present invention (a trained model of a Z-layer recurrent neural network structure) (in the control device 15 of FIG. 23, the trained model and the trained model are shown. It is a control result by replacing the H layer regression type RNN with the Z layer regression type RNN).
  • the Z-layer recurrent neural network is a neural network that stores the output of the Z layer (output layer) in the C layer (state layer) and returns it to the H layer (hidden layer).
  • 36A, 36B and 36C show a Z-layer recurrent neural network structure.
  • the drive frequency was fixed and the phase difference was changed.
  • the drive frequency (“frequency” in FIG. 23, output z2 in FIG. 36A) is fixed at 93 kHz, and the vibration type actuator 13 changes the phase difference (phase difference in FIG. 23, z1 in FIG. 36A). Controlled by.
  • the Z-layer regression type RNN of the present invention it was found that the position deviation is improved in all regions during acceleration / deceleration and stop setting.
  • the target speed is set to x1 and the position deviation is set to x2 as the input data, and the phase difference is set to z1 as the output data.
  • phase difference may be used as one output, or only the drive frequency (“frequency” in FIG. 23) may be used. Further, the pulse width may be used.
  • the hidden layer was formed by 7 neurons, and the activation function used was the sigmoid function (Fig. 36B).
  • a linear function (FIG. 36C) was used as the activation function of the output layer.
  • the state layer is formed by two neurons, and the output of the output layer is held by each neuron in the state layer. That is, the data before one control sampling of the time series data is retained. The data held in the state layer is regressed to the hidden layer at the next control sampling. Therefore, the data from the input layer (velocity, position deviation) and the retained data from the state layer (phase difference, and frequency) are input to the hidden layer after being multiplied by the weight. As a result, the output data (phase difference and frequency) is calculated after the past time series data information is stored.
  • the weight connecting each neuron in the input layer and the hidden layer is wh
  • the weight connecting each neuron in the state layer and the hidden layer is wc
  • the threshold value of the neuron in the hidden layer is ⁇ h
  • the weight connecting each neuron in the hidden layer and the output layer is wo.
  • the threshold value of the neuron in the output layer was set to ⁇ o.
  • the values learned by the machine learning unit 12 are applied to all the weights and threshold values.
  • FIGS. 26B and 26C changes in the phase difference of the virtual PID control are displayed (top view).
  • This is not directly used for the control of the vibration type actuator, but is the output of the control amount obtained by performing the PID calculation as an observer based on the position deviation.
  • this PID control amount it is possible to detect an abnormality in the control of the trained model. That is, by comparing the control amount output by the trained model with the PID control amount, it can be predicted that the NN parameter deviates from the normal value if there is a large deviation from the predetermined range, and the parameter is reset. Can be done.
  • this function is not an essential configuration for obtaining the effect of the present invention, reliability can be improved from the viewpoint of guaranteeing the performance of control by the trained model.
  • 27A and 27B are simulation results showing the responsiveness of high frequency in the control device of the vibration type actuator of the present invention.
  • Feedback control is performed with a predetermined target position pattern (position command value) indicated by a solid SIN wave, and the target speed is a maximum of 30 mm / s SIN wave drive, and a small distance (50 to 100 ⁇ m) is high frequency (100 Hz).
  • 200 Hz is a pattern that performs reciprocating operation.
  • the horizontal axis indicates time (ms), and the vertical axis indicates position (mm).
  • 27A shows the control result by the position command value of 100 Hz
  • FIG. 27B shows the control result by the target position pattern of 200 Hz.
  • the phase of the PID control is greatly delayed with respect to the target position pattern, and sufficient tracking performance is not obtained. This becomes more remarkable as the target position pattern becomes higher frequency.
  • the RNN control (control using the RNN for the control unit) of the present invention has good followability to the target position pattern. That is, it can be seen that the temporal phase delay with respect to the target position pattern (the phase delay in the time axis direction with respect to the target position pattern) is smaller in the RNN control of the present invention than in the PID control. It is considered that the reason for this is that since the RNN stores the past time-series information, the prediction accuracy of the control amount at the time of acceleration / deceleration is improved. Specifically, it is as follows.
  • the vibration type actuator When the vibration type actuator is driven to follow the target speed, the actual speed (detection speed) inevitably deviates from the target speed (the detection speed has a follow-up delay). In order to reduce this tracking delay, it is necessary to predict the target speed and then output the control amount.
  • NN control control using NN for the control unit
  • the control amount is output based only on the target speed (output from the input layer) as the speed command, so the target speed is not predicted (see FIG. 28A).
  • RNN control H layer regression type RNN control
  • the output from the state layer past output from the hidden layer
  • the target velocity output from the input layer
  • the target speed is predicted. That is, the output from the state layer is based on the history of the past target speed (has information on the history of the past target speed), and the output from such a state layer is added to the current target speed.
  • the control amount is output after predicting the future target speed (see FIG. 28B).
  • the number of neurons in the hidden layer H is two for the sake of simplification of the figure, but the same applies when the number of neurons in the hidden layer is three or more.
  • RNN control Z-layer regression type RNN control
  • the output from the state layer past output from the output layer
  • the target speed is predicted. That is, the output from the state layer is based on the history of the past target speed (has information on the history of the past target speed), and the output from such a state layer is added to the current target speed.
  • the control amount is output after predicting the future target speed (see FIG. 28C).
  • the number of neurons in the hidden layer H is set to 2 in order to simplify the figure, but the same applies when the number of neurons in the hidden layer is 3 or more.
  • 29A and 29B are the results showing the robustness in the control device of the present invention. It is a pattern in which feedback control is performed with a predetermined target position pattern, a trapezoidal drive with a maximum target speed of 50 mm / s is performed, and a reciprocating operation with a 5 mm stroke including a positioning operation is performed.
  • the horizontal axis shows time (sec)
  • the vertical axis shows the target position (left axis) in pulse units of the encoder
  • the position deviation in ⁇ m units (right axis).
  • FIG. 29A shows the control result by the trained model that machine-learned at the start-up frequency of 95 kHz
  • FIG. 29B shows the control result by the trained model that machine-learned at the start-up frequency of 91 kHz.
  • FIG. 30 is a control block diagram when the control result by the control device of the vibration type actuator using the PID controller is used as learning data.
  • the position feedback control of the vibration type actuator 13 is performed by using the PID controller 901.
  • the position deviation is input to the PID controller 901, and the phase difference and frequency of the control amount calculated by PID are output.
  • a configuration other than the PID controller may be used, and for example, P control, PI control, PD control and the like can be applied.
  • machine learning of the learning model 116 is performed using the detection speed detected by the speed detection unit 16 in the machine learning unit 12 and the control amount output from the PID controller.
  • a feature of this embodiment is that the control result by the PID controller and the control result by the trained model can be compared. By comparing with the PID controller, it can be determined whether or not the training is successful, and the reliability of the trained model can be guaranteed.
  • FIG. 31 is a control block diagram when the control result in the open drive (control result by the control device of the vibration type actuator using the open drive unit) is used as learning data.
  • feedback control of the vibration type actuator 13 is not performed.
  • An arbitrary pattern waveform generated by the drive pattern generation unit 1001 is output from the open drive unit 1002 to the AC signal generation unit 111.
  • a repeating signal of a SIN wave pattern or a rectangular pattern is used.
  • the phase difference of the same frequency and the SIN wave pattern of the frequency are output respectively.
  • the control performance of the trained model can be adjusted.
  • the phase difference SIN wave amplitude is 90 deg
  • the frequency SIN wave amplitude is 1 kHz.
  • machine learning of the learning model 116 is performed using the detection speed detected by the speed detection unit 16 in the machine learning unit 12 and the control amount output from the open drive unit 1002.
  • the result at the time of open driving can be used for learning data, and the same effect can be obtained.
  • FIG. 32 is a control block diagram when the trained model and the PID controller are used together.
  • the position feedback control of the vibration type actuator 13 is performed by using the PID controller 1401 and the trained model 113.
  • the position deviation is input to the PID controller 1401, the PID calculation is performed, and the position deviation is output.
  • a configuration other than the PID controller may be used, and for example, P control, PI control, PD control and the like can be applied.
  • the target speed and the PID-calculated position deviation are input to the trained model 113.
  • machine learning of the learning model 116 is performed using the detection speed detected by the speed detection unit 16 in the machine learning unit 12 and the control amount output from the trained model 113.
  • the gain of the position deviation input to the trained model can be adjusted, so that more fine adjustment of the control system (adjustment of the control amount) can be performed.
  • FIG. 33 is a control block diagram when the trained model and the PID controller are used together.
  • the position feedback control of the vibration type actuator 13 is performed by adding the control amounts of the PID controller 1501 and the trained model 113.
  • the position deviation is input to the PID controller 1501, and the PID-calculated phase difference and frequency are output.
  • a configuration other than the PID controller may be used, and for example, P control, PI control, PD control and the like can be applied.
  • a phase compensator may be arranged after the PID controller.
  • the target speed and the position deviation are input to the trained model 113, but the position deviation may be zero.
  • phase difference and frequency are output from the trained model 113, and the phase difference and frequency output from the PID calculator 1501 are added to each other.
  • the added control amount and the detection speed detected by the speed detection unit 16 are input to the machine learning unit 12, and machine learning of the learning model 116 is performed.
  • the gain of the position deviation can be adjusted, so that more fine adjustment of the control system (adjustment of the control amount) can be performed.
  • FIG. 34 is a control block diagram for performing control using a trained model in which machine learning is performed using the phase difference, frequency, and pulse width as control quantities.
  • the position feedback control of the vibration type actuator 13 is performed by each control amount (phase difference, frequency, and pulse width) output from the trained model 1601.
  • the target speed and position deviation are input to the trained model 1601, the phase difference, frequency, and pulse width calculated by the recurrent neural network are output to the drive unit 11, and the vibration type actuator 13 is controlled.
  • the machine learning unit 12 acquires the three control amounts output from the trained model 1601 and the detection speed detected by the speed detection unit 16 as learning data, and machine learning is performed by the learning model 1602.
  • FIG. 35 shows the H-layer recurrent neural network structure of the learning model that outputs the phase difference, frequency, and pulse width.
  • the trained model 1611 and the training model 1612 of FIG. 34 have an H-layer regression type RNN structure in which the target velocity and the position deviation are input and three control quantities are output.
  • the measurement data of the control by the trained model may be used as described above, or the measurement data of the control by the unlearned model in which the parameters are set by the random function may be used.
  • the measurement data by the open drive and the measurement data by the PID control may be used.
  • parameters with optimum conditions may be selected from a plurality of learning data from the viewpoint of position deviation, power consumption, and the like. This is because there are innumerable combinations of phase difference, frequency, and pulse width, that is, conditions for obtaining a predetermined speed of the vibration type actuator.
  • the parameters for operating the vibration type actuator increase, so it is possible to finely adjust the control performance by performing appropriate machine learning.
  • FIGS. 36A, 36B, and 36C show a Z-layer recurrent neural network structure of a learning model that outputs a phase difference and a frequency.
  • the trained model 113 and the training model 116 of FIG. 23 may have a Z-layer regression type RNN structure in which the target velocity and the position deviation are input and the two control quantities are output.
  • the measurement data of the control by the trained model may be used as described above, or the measurement data of the control by the unlearned model in which the parameters are set by the random function may be used.
  • the measurement data by the open drive and the measurement data by the PID control may be used.
  • parameters with optimum conditions may be selected from a plurality of learning data from the viewpoint of position deviation, power consumption, and the like. This is because there are innumerable combinations of phase difference and frequency, that is, conditions for obtaining a predetermined speed of the vibration type actuator.
  • the position deviation can be improved in all regions during acceleration / deceleration and stop setting.
  • FIG. 37 corresponds to a control block diagram of the vibration type drive device when the position command unit 102, the position detection unit 14, and the like are removed from the vibration type drive device of FIG. 23.
  • the control device is the one excluding the vibration type actuator 13.
  • FIG. 38 is a diagram showing the RNN structure of the learning model used in FIG. 37 and the trained model control unit.
  • FIG. 39 shows the control of the vibration type drive device in the case where the feedback control by the speed deviation is performed instead of the feedback loop control by the position deviation, except for the position command unit 102, the position detection unit 14, and the like from the vibration type drive device of FIG. Corresponds to a block diagram.
  • the control device is the one excluding the vibration type actuator 13.
  • FIG. 40 is a diagram showing an RNN structure of the learning model used in FIG. 39 and the trained model control unit.
  • the control device has a control amount output unit having a trained model machine-learned to output the first control amount when the first velocity is commanded.
  • the learning unit may be removed from the control device.
  • the parameters (first weight, second weight, third weight, second neuron threshold, and third neuron threshold) possessed by the trained model are stored. It may have a storage unit. Then, the trained model may be machine-learned by substituting the parameters of the trained model with the parameters stored in the storage unit.
  • a memory such as a ROM is used for the storage unit, but the storage unit is not limited to this. This is because the storage unit may be any one that can store the parameters of the trained model.
  • an environment sensor for detecting an environmental state may be provided. Then, the trained model may be machine-learned when a change in the environment is detected by the environment sensor.
  • the environment sensor may be at least one of a temperature sensor and a humidity sensor.
  • FIG. 41 is a control device for a vibration type actuator according to another embodiment of the present invention, and is a diagram showing adaptive control using a recurrent neural network.
  • the machine learning unit is not shown and is not always necessary in this example.
  • the control unit 10 has a first trained model 1611, a second trained model 1612, and an adaptive control unit 108.
  • the two trained models have the same RNN structure, the target speed and position deviation are input to the first trained model, and the detected detection speed and target deviation (zero) are input to the second trained model. Entered.
  • the error gradient is calculated by the adaptive learning unit 108 based on the error data of the control amount output from each of the two trained models.
  • RNN weight and threshold parameters are updated using SGD (Stochastic Gradient Descent) and reflected in the two trained models. That is, the data during the sampling period is used as the learning data.
  • the learning model using the recurrent neural network of the present invention can also be applied to adaptive control that compensates for changes in actuator characteristics during driving.
  • LSTM Long short-term memory
  • RNN Recurrent Neural Network
  • future weighting is performed based on past weighting.
  • an oblivion gate, an input gate, and an output gate are provided. In particular, by providing a forgetting gate, it becomes possible to learn long-term continuous data, which was not possible with RNNs.
  • FIG. 42A shows a configuration when LSTM is applied to the learning model of the present invention.
  • Xt from the input layer and the output Ht-1 at the time t-1 before the hidden layer are input to the LSTM, and Ht is output to the output layer Z.
  • a storage cell is provided inside the LSTM, and the internal state is held at each time.
  • FIG. 42B is a block diagram showing the internal configuration of the LSTM.
  • the oblivion gate, input gate, and output gate are sigmoid functions, respectively.
  • the oblivion gate determines how much past information is retained, and the input gate determines which value to update. Further, the storage cell is updated by using the tanh function. This creates a new candidate value to be added to the storage cell.
  • the output gate selects the elements of the storage cell candidates and selects how much information is to be transmitted at the next time.
  • LSTM model is a basic model, it is not limited to the network shown here. You may change the coupling between the networks. QRNN (Quasi Recurrent Neural Network) may be used instead of LSTM.
  • FIGS. 43A and 43B In the first embodiment, an example in which the control device of the vibration type actuator is used for driving a lens for autofocus of an image pickup device has been described, but the application example of the present invention is not limited to this.
  • FIGS. 43A and 43B it can also be used to drive a lens or an image sensor during image stabilization.
  • FIG. 43A is a plan view (top view) showing the appearance of the image pickup apparatus 60.
  • FIG. 43B is a schematic diagram of the internal configuration of the image pickup apparatus 60.
  • the image pickup apparatus 60 is roughly composed of a main body 61 and a lens barrel 62 that can be attached to and detached from the main body 61.
  • the main body 61 includes an image pickup element 63 such as a CCD sensor or a CMOS sensor that converts an optical image formed by light passing through a lens barrel 62 into an image signal, and a camera control microcomputer that controls the overall operation of the image pickup device 60. 64 is provided.
  • a plurality of lenses L such as a focus lens and a zoom lens are arranged at predetermined positions in the lens barrel 62.
  • the lens barrel 62 has a built-in image blur correction device 50
  • the image blur correction device 50 has a disc member 56 and an oscillator 131 provided on the disc member 56, and is a disc member.
  • the image blur correction lens 65 is arranged in the hole formed in the center of the 56.
  • the image blur correction device 50 is arranged so that the image blur correction lens 65 can be moved in a plane orthogonal to the optical axis of the lens barrel 62.
  • the oscillator 131 and the disk member 56 move relative to the contact body 132 fixed to the lens barrel, and the correction lens is moved. Driven.
  • control device of the present invention can also be used to drive the lens holder for moving the zoom lens. Therefore, the control device of the present invention can be mounted on an interchangeable lens in addition to the image pickup device for driving the lens.
  • control device for the vibration type actuator shown in the first embodiment can also be used for driving the automatic stage.
  • control device for the vibration type actuator shown in the first embodiment can also be used for driving the automatic stage.
  • it can be used to drive an automatic stage of a microscope.
  • the microscope of FIG. 44 has an image pickup unit 70 having a built-in image pickup element and an optical system, and an automatic stage 71 having a stage 72 provided on a base and moved by a vibration type actuator.
  • the object to be observed is placed on the stage 72, and an enlarged image is taken by the image pickup unit 70.
  • the stage 72 is moved by driving the vibration type drive actuator using the control device 12 of the first or second embodiment.
  • a computer (not shown) can be used to combine captured images to obtain a single high-definition image with a wide observation range.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Automation & Control Theory (AREA)
  • Optics & Photonics (AREA)
  • Feedback Control In General (AREA)
  • General Electrical Machinery Utilizing Piezoelectricity, Electrostriction Or Magnetostriction (AREA)
  • Lens Barrels (AREA)
  • Adjustment Of Camera Lenses (AREA)

Abstract

振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータの制御装置であって、前記接触体を前記振動子に対して相対的に移動させるための第1の速度が指令された場合に、前記接触体を前記振動子に対して相対的に移動させるための第1の制御量を出力するよう機械学習された学習済モデルを有する制御量出力部を有することを特徴とする振動型アクチュエータの制御装置であることを特徴とする。

Description

振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ
 本発明は、振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージなどに関するものである。
 振動型アクチュエータ(超音波モータ)は、弾性体に結合された、圧電素子などの電気-機械エネルギー変換素子に交流電圧を印加することで、該電気-機械エネルギー変換素子に高周波振動を発生させる。そして、その振動エネルギーを連続的な機械運動として取り出すように構成された、非電磁駆動式のアクチュエータである。
 振動型アクチュエータは、電磁駆動式のアクチュエータと比較して、小型軽量、高精度、低速駆動時に高トルクといった優れたアクチュエータ性能(モータ性能)を有する。その一方で、非線形のアクチュエータ特性(モータ特性)を有しているので、モデル化は難しく、駆動条件や温度環境に応じて制御性が変化するので、制御系に工夫が必要となる。また、周波数、位相差、電圧振幅といった制御パラメータも多く、調整も複雑となる。
 図45Aは、従来の一般的なPID制御による振動型駆動装置の制御ブロック図である(特許文献1参照)。
 後述する制御量が入力された駆動回路からは2相(A相、B相)の交流電圧(交流信号)が出力される。駆動回路から出力される2相の交流電圧の、周波数(1/周期)、位相差、電圧振幅(図45B参照)、を制御することで、振動型アクチュエータの相対速度(以下、単に「速度」ともいう)を制御することができる。尚、電圧振幅は、後述する、PID制御器から駆動回路へ入力されるパルス幅によって可変である。また、図45Bの(1)、(2)、(3)はそれぞれ、駆動回路から出力される2相の交流電圧の周期、位相差、電圧振幅を表す。
 位置指令部によって生成された目標位置と、位置検出部によって検出された、振動型モータの相対位置と、の差分(目標位置-相対位置)である位置偏差が、PID制御器(制御量出力部)に入力される。そして、PID制御器に入力された位置偏差に応じてPID演算された制御量(周波数、位相差、及びパルス幅)が、PID制御器から制御サンプリング周期毎に逐次出力される。PID制御器から出力された制御量が駆動回路に入力される。そして、制御量が入力された駆動回路からは2相の交流電圧が出力され、駆動回路から出力された2相の交流電圧により振動型アクチュエータの速度が制御される。そして、それらにより、位置フィードバック制御が行われる。
 図45Cは、振動型アクチュエータの周波数-速度特性を模式的に示した図である。図45Cには、具体的には、高速域(低周波数範囲)の周波数(f1)では周波数-速度特性の傾きが大きく低速域(高周波数範囲)の周波数(f2)では周波数-速度特性の傾きが小さい様子が示されている。
 図45Dは、振動型アクチュエータの位相差-速度特性を模式的に示した図であり、低速域の周波数(f2)と高速域の周波数(f1)での位相差-速度特性を比較した図である。
 図45Cや図45Dに示したように、振動型アクチュエータは、使用する速度域によって周波数-速度特性の傾きや位相差-速度特性が異なるので、位相差によって制御性能が変化してしまう。
 また、環境温度による変化、例えば、常温から低温に変化した場合は圧電素子の温度特性に基づき共振周波数が高周波数側にシフトする。その場合、同じ周波数で駆動した場合の速度と傾きが異なるので、環境温度によっても制御性能が変化してしまう。
 また、振動型アクチュエータの個体差によっても速度と傾きが異なるので、個体によっても制御性能が変化してしまう。また、経時変化によっても制御性能が変化してしまう。
 これら全ての変化要因を考慮してPID制御ゲイン(PID制御の比例、積分、微分ゲイン)を調整し、ゲイン余裕と位相余裕を確保するように設計する必要がある。
特開2016-144262号公報
 そこで、従来のPID制御器とは異なる制御量出力部を主たる制御量出力部として有する振動型アクチュエータの制御装置などが求められていた。本発明は、従来のPID制御器とは異なる制御量出力部を主たる制御量出力部として有する振動型アクチュエータの制御装置などを提供することを目的とする。
 本発明の一様態は、振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータの制御装置であって、前記接触体を前記振動子に対して相対的に移動させるための目標速度が入力された場合に、前記接触体を前記振動子に対して相対的に移動させるための制御量を出力するように機械学習された学習済モデルを有する制御量出力部を備えることを特徴とする振動型アクチュエータの制御装置であることを特徴とする。
 本発明によれば、従来のPID制御器とは異なる制御量出力部を主たる制御量出力部として有する振動型アクチュエータの制御装置などを提供することができる。
第1の実施形態の振動型駆動装置の制御ブロック図である。 第1の実施形態の学習モデル及び学習済モデルが有するニューラルネットワーク構成を示す図である。 第1の実施形態の学習モデル及び学習済モデルが有するニューラルネットワーク構成を示す図である。 第1の実施形態の学習モデル及び学習済モデルが有するニューラルネットワーク構成を示す図である。 リニア駆動型の振動型アクチュエータの駆動原理を説明する図である。 リニア駆動型の振動型アクチュエータの駆動原理を説明する図である。 リニア駆動型の振動型アクチュエータの駆動原理を説明する図である。 リニア駆動型の振動型アクチュエータの駆動原理を説明する図である。 レンズ鏡筒のレンズの駆動機構を説明する斜視図である。 第1の実施形態の振動型駆動装置の制御ブロック図(目標偏差に代えて速度偏差を学習済モデル106への入力とした場合)である。 第1の実施形態での、機械学習と学習済モデルによる制御のフローチャートである。 学習部における、バッチ学習とオンライン学習を説明するタイミングチャートである。 ニューラルネットワークのパラメータの最適化手法としてAdamを用いた場合の説明図である。 ニューラルネットワークのパラメータの最適化手法としてAdamを用いた場合の説明図である。 ニューラルネットワークのパラメータの最適化手法としてAdamを用いた場合の説明図である。 第1の実施形態の学習モデルと実測して得た学習データを用いて、Adam、RMSprop、Momentum、SGDの演算結果を比較したものである。 Adamによる制御量(位相差)の学習例である。 従来のPID制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。 本発明の制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。 本発明の制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。 本発明の制御装置におけるロバスト性を示す結果である。 本発明の制御装置におけるロバスト性を示す結果である。 第2の実施形態(PID制御器の制御結果を学習データとして用いる場合)の振動型駆動装置の制御ブロック図である。 第3の実施形態(オープン駆動での制御結果を学習データとして用いる場合)の振動型駆動装置の制御ブロック図である。 第4の実施形態(学習済モデルとPID制御器を併用した場合)の振動型駆動装置の制御ブロック図である。 第4の実施形態(学習済モデルとPID制御器を併用した場合であって、PID制御器からの出力を、学習済モデルへの入力とすると共に、学習済モデルからの出力へ加算する場合)の振動型駆動装置の制御ブロック図である。 第5の実施形態(学習済モデルとPID制御器を併用した場合)の振動型駆動装置の制御ブロック図である。 第6の実施形態(位相差、周波数、パルス幅を制御量として機械学習を行った学習済モデルを用いた制御を行う場合)の振動型駆動装置の制御ブロック図である。 位相差、周波数、及びパルス幅を出力とするニューラルネットワーク構成を示す図である。 第7の実施形態の振動型駆動装置の制御ブロック図である。 第7の実施形態の学習モデル及び学習済モデル制御部が有するNN構成を示す図である。 第7の実施形態の学習モデル及び学習済モデル制御部が有するNN構成を示す図である。 第7の実施形態の学習モデル及び学習済モデル制御部が有するNN構成を示す図である。 第8の振動型駆動装置の制御ブロック図である。 第8の実施形態の学習モデル及び学習済モデル制御部が有するNN構成を示す図である。 第8の実施形態の学習モデル及び学習済モデル制御部が有するNN構成を示す図である。 第8の実施形態の学習モデル及び学習済モデル制御部が有するNN構成を示す図である。 第9の実施形態の振動型駆動装置の制御ブロック図である。 第9の実施形態の学習モデル及び学習済モデルが有するH層回帰型リカレントニューラルネットワーク構造を示す図である。 第9の実施形態の学習モデル及び学習済モデルが有するH層回帰型リカレントニューラルネットワーク構造を示す図である。 第9の実施形態の学習モデル及び学習済モデルが有するH層回帰型リカレントニューラルネットワーク構造を示す図である。 リカレントニューラルネットワークのパラメータの最適化アルゴリズムとしてAdamを用いた場合のフローチャートなどである。 従来のPID制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。 本発明の制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。 本発明の制御において、所定の目標位置パターンでフィードバック制御を行った場合の結果の説明図である。 本発明の振動型アクチュエータの制御装置における高周波の応答性を示すシミュレーション結果である。 本発明の振動型アクチュエータの制御装置における高周波の応答性を示すシミュレーション結果である。 ニューラルネットワーク構造の展開図を示す図である。 H層回帰型リカレントニューラルネットワーク構造の展開図を示す図である。 Z層回帰型リカレントニューラルネットワーク構造の展開図を示す図である。 本発明の振動型アクチュエータの制御装置におけるロバスト性を示す結果である。 本発明の振動型アクチュエータの制御装置におけるロバスト性を示す結果である。 第10の実施形態(PID制御器の制御結果を学習データとして用いる場合)の振動型駆動装置の制御ブロック図である。 第11の実施形態(オープン駆動での制御結果を学習データとして用いる場合)の振動型駆動装置の制御ブロック図である。 第12の実施形態(学習済モデルとPID制御器を併用した場合)の振動型駆動装置の制御ブロック図である。 第13の実施形態(学習済モデルとPID制御器を併用した場合)の振動型駆動装置の制御ブロック図である。 第14の実施形態(位相差、周波数、及びパルス幅を制御量として機械学習を行った学習済モデルを用いた制御を行う場合)の振動型駆動装置の制御ブロック図である。 第14の実施形態の学習モデル及び学習済モデルが有するH層回帰型リカレントニューラルネットワーク構造を示す図である。 第15の実施形態(位相差及び周波数を制御量として機械学習を行った学習済モデルを用いた制御を行う場合)の学習モデル及び学習済モデルが有するZ層回帰型リカレントニューラルネットワーク構造を示す図である。 第15の実施形態(位相差及び周波数を制御量として機械学習を行った学習済モデルを用いた制御を行う場合)の学習モデル及び学習済モデルが有するZ層回帰型リカレントニューラルネットワーク構造を示す図である。 第15の実施形態(位相差及び周波数を制御量として機械学習を行った学習済モデルを用いた制御を行う場合)の学習モデル及び学習済モデルが有するZ層回帰型リカレントニューラルネットワーク構造を示す図である。 第16の実施形態の振動型駆動装置の制御ブロック図である。 第16の実施形態の振動型駆動装置のH層回帰型リカレントニューラルネットワーク構造を示す図である。 第17の実施形態の振動型駆動装置の制御ブロック図である。 第17の実施形態の振動型駆動装置のH層回帰型リカレントニューラルネットワーク構造を示す図である。 第19の実施形態の振動型駆動装置の制御ブロック図である。 第20の実施形態(学習モデルにLSTMを適用した場合)のH層回帰型リカレントニューラルネットワーク構造を示す図である。 第20の実施形態(学習モデルにLSTMを適用した場合)のH層回帰型リカレントニューラルネットワーク構造を示す図である。 第21の実施形態の振動型アクチュエータの制御装置の適用例である撮像装置の、外観を示す平面図である。 第21の実施形態の振動型アクチュエータの制御装置の適用例である撮像装置の、内部構成の概略図である。 第21の実施形態の振動型アクチュエータの制御装置の適用例である顕微鏡の外観を示す斜視図である。 従来の一般的なPID制御による振動型駆動装置の説明図である。 従来の一般的なPID制御による振動型駆動装置の説明図である。 従来の一般的なPID制御による振動型駆動装置の説明図である。 従来の一般的なPID制御による振動型駆動装置の説明図である。
 (第1の実施形態)
 図1は、本実施形態の振動型駆動装置の制御ブロック図である。振動型駆動装置17は、制御装置15及び振動型モータ13(振動型アクチュエータ)を有する。図1においては、振動型駆動装置17から振動型アクチュエータ13を除いたものが、制御装置15である。
 制御装置15は、振動型アクチュエータを制御する学習済モデル制御部10(制御部)と、駆動部11と、速度検出部16(速度検出手段)及び学習モデル106を有する機械学習部12(学習部)と、位置検出部14(位置検出手段)と、を有する。駆動部11は、交流信号生成部104(交流信号生成手段)及び昇圧回路105を有する。
 振動型アクチュエータ13は、振動子131及び被駆動体132(接触体)を有する。速度検出部16は、振動子131と接触体132の振動子131に対する相対的な速度(以下、「相対速度」という)を検出する。位置検出部14は、接触体132の振動子131に対する相対的な位置(以下、「相対位置」ともいう)を検出する。位置検出部としては、いわゆるアブソリュート・エンコーダやインクリメント・エンコーダなどが用いられるがこれらに限られない。位置検出部としては、位置情報を検出できるものであればよいからである。速度検出部16としては、速度情報を直接的に検出するもの(速度センサ)に限られず、位置情報を演算すること等により速度情報を間接的に検出するものであってもよい。速度検出部としては、速度情報を検出できるものであればよいからである。
 制御部10は、振動子131の駆動(接触体132の振動子131に対する相対的な移動)を制御する信号を生成できるよう構成される。すなわち、目標速度(第1の速度)と位置偏差とを学習済モデルに入力し、出力された位相差と周波数を振動型アクチュエータ13の制御量(第1の制御量)として用いる。目標速度(第1の速度)とは、接触体132を振動子131に対して相対的に移動させる際に、相対速度(第2の速度、検出速度)が追従するように設定される速度である。位置偏差とは、目標位置(第1の位置)と相対位置(第2の位置、検出位置)との差である。目標位置(第1の位置)とは、接触体132を振動子131に対して相対的に移動させる際に、相対位置(第2の位置、検出位置)が追従するように設定される位置である。尚、第1の制御量として、電圧振幅を変更するためのパルス幅を用いても良い。
 制御部10は、目標速度を生成する速度指令部101(速度指令手段、速度生成手段)、目標位置を生成する位置指令部102(位置指令手段、位置生成手段)を有する。また、制御部10は、目標速度と位置偏差とが入力され、位相差と周波数とを出力する学習済モデル103(制御量出力部、制御量出力装置)を有する。
 速度指令部101によって、単位時間毎の目標速度が生成される。また、位置指令部102によって、単位時間毎の目標位置が生成される。そして、位置検出部14によって検出された、位置指令部102によって生成された単位時間毎の目標位置と、速度検出部16によって検出された単位時間毎の相対位置と、の単位時間毎の差分が位置偏差として演算される。当該差分は、単位時間毎の相対位置-単位時間毎の目標位置、である。
 ここで、目標速度及び目標位置は、例えば、単位時間としての制御サンプリング周期毎に生成される。具体的には、目標速度を表す1つの指令値が、制御サンプリング周期毎に速度指令部101から出力され、目標位置を表す1つの指令値が、制御サンプリング周期毎に位置指令部102から出力される。指令値は、目標速度自体ではなく、目標速度に対応付けられたものでもよい。制御サンプリング周期とは、図1における位置偏差の取得から、制御量の出力、振動子への交流電圧の印加、相対速度(第2の速度、検出速度)や相対位置(第2の位置、検出位置)の検出を経て、位置偏差の取得が始まる直前までの1サイクルのことをいう。前記サイクルで、振動型アクチュエータの位置又は速度がフィードバック制御される。尚、目標速度は、目標位置を単位時間毎に微分することで生成しても良い。逆に、目標速度を積分することで目標位置を生成しても良い。
 目標速度と位置偏差を用いて、学習済モデル103で制御量(位相差、周波数)が演算され、出力される。学習済モデル103は、図2に示すニューラルネットワーク(以下、「NN」ともいう)構成を有する。NNは、入力層のX層、隠れ層のH層、出力層のZ層から成る。本実施形態では、入力データとして目標速度を入力x1、位置偏差を入力x2に設定し、出力データとして位相差を出力z1、周波数を出力z2に設定した。
 入力層は2個のニューロン(X1、X2)、隠れ層は7個のニューロン(H1、H2、・・・、H7)、出力層は2個のニューロン(Z1、Z2)を有し、活性化関数として一般的なシグモイド関数(図2B)を用いた。隠れ層のニューロンは7個に限られないが、3~20個の範囲が好ましい。隠れ層のニューロンの数が少ないほど学習精度は低下するが学習が速く収束し(学習速度が速くなり)、隠れ層のニューロンの数が多いほど学習精度は向上するが学習速度が遅くなり、学習精度と学習速度はトレードオフの関係にあるからである。また、出力層の活性化関数は、一般的にはシグモイド関数やReLU(ランプ関数)が用いられるが、制御量である位相差のマイナス符号にも対応させる為、線形関数(図2C)を用いた。
 入力層のニューロン(第1のニューロン)と隠れ層のニューロン(第2のニューロン)を結ぶ重み(第1の重み)をwhとした。また、隠れ層のニューロン(第2のニューロン)の閾値をθhとした。また、隠れ層のニューロン(第2のニューロン)と出力層のニューロン(第3のニューロン)を結ぶ重みをwoとした。また、出力層のニューロン(第3のニューロン)の閾値をθoとした。重みと閾値は、後述の機械学習部12によって学習された値が適用される。学習済みのNNは、振動型アクチュエータの相対速度と制御量の時系列データから共通する特徴パターンを抽出した集合体と捉えることができる。したがって、出力は、重みと閾値を変数(パラメータ)とする関数によって得られる値となる。
 NNから出力された制御量(位相差、周波数)は、交流信号生成部104に入力され、振動型アクチュエータの速度、駆動方向が制御される。交流信号生成部104では、位相差、周波数、及びパルス幅に基づいて、2相の交流信号が生成される。
 昇圧回路105は、例えば、コイルやトランスなどを有し、昇圧回路105によって所望の駆動電圧に昇圧された交流信号(交流電圧)は、振動子131の圧電素子に印加され、接触体132を駆動する。
 本発明を適用できる振動型アクチュエータの一例について、図面を参照しながら説明する。本発明を適用できる振動型アクチュエータは、振動子、及び接触体を有する。図3は、振動型アクチュエータの一例であるチップ型の振動子を用いるリニア駆動型(直動型)の振動型アクチュエータの駆動原理を説明する図である。図3Aに示す振動型アクチュエータ13は、弾性体203、及び弾性体203に接着された電気-機械エネルギー変換素子である圧電素子204を有する振動子131と、振動子131によって駆動される接触体132を有する。圧電素子204に交流電圧を印加することによって、図3C、図3Dに示すような2つの振動モードを発生させ、突起部202に加圧接触する接触体132を矢印方向に移動させる。尚、本発明を適用できる振動型アクチュエータはチップ型の振動子を用いるリニア駆動型(直動型)の振動型アクチュエータに限られず、様々な形態の振動型アクチュエータに適用できる。たとえば、チップ型の振動子を用いるリング型(回動型)の振動型アクチュエータなどにも適用できる。また、リング型の振動子を用いる円環型(回動型)の振動型アクチュエータなどにも適用できる。振動型アクチュエータとしては、電気-機械エネルギー変換素子に電圧を印加することによって振動子に発生させた振動によって、振動子と接触体を相対的に移動させることができるものであればよいからである。
 図3Bは、圧電素子204の電極パターンを示す図であり、例えば、振動子131の圧電素子204には、長手方向で2等分された電極領域が形成されている。また、各電極領域における分極方向は、同一方向(+)となっている。圧電素子204の2つの電極領域のうち図3Bの右側に位置する電極領域には交流電圧(VB)が印加され、左側に位置する電極領域には交流電圧(VA)が印加される。
 VBおよびVAを第1の振動モードの共振周波数付近の周波数で、かつ同位相の交流電圧とすると、圧電素子204の全体(2つの電極領域)がある瞬間には伸び、また別の瞬間には縮むことになる。この結果、振動子131には図3Cに示す第1の振動モードの振動(以下、突上げ振動)が発生することになる。これによって、突起部202には、突上げ方向(Z方向)の変位が生じる。
 また、VBおよびVAを第2の振動モードの共振周波数付近の周波数で、かつ位相が180°ずれた交流電圧とすると、ある瞬間には、圧電素子204の右側の電極領域が縮むとともに、左側の電極領域が伸びる。また、別の瞬間には逆の関係となる。この結果、振動子131には図3Dに示す第2の振動モードの振動(以下、送り振動)が発生することになる。これによって、突起部202には、駆動方向(送り方向、X方向)の変位が生じる。
 したがって、第1及び第2の振動モードの共振周波数付近の周波数を有する交流電圧を圧電素子204の電極に印加することで、第1及び第2の振動モードが合成された振動を励起することができる。
 このように、2つの振動モードを合成することによって、突起部202は、図3DにおけるY方向(X方向及びZ方向と垂直な方向)に垂直な断面において、楕円運動を行う。該楕円運動によって、接触体132が図3Aの矢印方向に駆動される。この接触体132と振動子131が相対移動する方向、すなわち振動子131によって接触体132が駆動される方向(ここではX方向)を、駆動方向と示す。
 また、第2の振動モードの第1の振動モードに対する振幅比R(送り振動振幅/突上げ振動振幅)は、2等分された電極へ入力する2相の交流電圧の位相差を変えることによって変更可能である。この振動型アクチュエータでは、振動の振幅比を変えることによって接触体の速度を変更させることが可能となる。
 尚、上記説明では、振動子131が静止し(固定され)、接触体132が移動する(駆動される)場合を例として説明したが、本発明はこの形態に限定されない。接触体と振動子は、互いの接触部の位置が相対的に変わっていればよい。例えば、接触体が静止し(固定され)、振動子が移動しても(駆動されても)良い。すなわち、本発明において、「駆動する」とは、接触体の振動子に対する相対的な位置を変化させることを意味し、必ずしも、接触体の絶対位置(例えば、接触体と振動子とを内包する筐体の位置を基準とした場合の接触体の位置)が変化することを要しない。
 尚、上記説明では、リニア駆動型(直動型)の振動型アクチュエータを例として説明した。つまり、振動子131又は接触体132が直線方向に移動する(駆動される)場合を例として説明したが、本発明はこの形態に限定されない。接触体と振動子は、互いの接触部の位置が相対的に変わっていればよい。例えば、振動子と接触体が回転方向に移動してもよい。振動子と接触体が回転方向に移動する振動型アクチュエータとしては、リング形状の振動子を有するリング型(回動型)の振動型アクチュエータなどがある。
 振動型アクチュエータは、例えば、カメラのオートフォーカス駆動などに用いられている。
 図4は、レンズ鏡筒のレンズの駆動機構を説明する斜視図である。振動型アクチュエータによるレンズホルダの駆動機構は、振動子と、レンズホルダと、このレンズホルダを摺動自在に保持する、平行に配された第1ガイドバー及び第2ガイドバーとを備えている。本実施形態において、第2ガイドバーが接触体であり、第2ガイドバーは固定され、振動子とレンズホルダが一体となって移動する場合について説明する。
 振動子は、電気-機械エネルギー変換素子に対する駆動電圧の印加によって生成された振動子の突起部の楕円運動によって、振動子と弾性体の突起部と接触する第2ガイドバーとの間に相対移動力を発生させる。これによって、振動子と一体に固定されたレンズホルダを第1及び第2ガイドバーに沿って移動可能に構成されている。
 具体的には、接触体の駆動機構300は、主にレンズ保持部材であるレンズホルダ302、レンズ306、フレキシブルプリント基板が結合された振動子131、加圧磁石305、2つのガイドバー303、304及び不図示の基体を有する。ここでは、振動子として振動子131を例に説明する。
 第1のガイドバー303、第2ガイドバー304は、互いに平行に配置されるようにそれらの各ガイドバーの両端が、不図示の基体によって保持固定されている。レンズホルダ302は、円筒状のホルダ部302a、振動子131及び加圧磁石305を保持固定する保持部302b、第1ガイドバー303と嵌合してガイドの作用をなす第1のガイド部302cを有する。
 加圧部を構成するための加圧磁石305は、永久磁石及び永久磁石の両端に配置される2つのヨークを有する。加圧磁石305と第2ガイドバー304との間に磁気回路が形成され、これら部材間に吸引力が発生する。加圧磁石305は第2ガイドバー304とは間隔を設けて配置されており、第2ガイドバー304は振動子131と接するように配置されている。
 前記の吸引力によって第2ガイドバー304と振動子131との間に加圧力が与えられる。弾性体の2箇所の突起部が第2ガイドバー304と加圧接触して第2のガイド部を形成する。第2のガイド部は磁気による吸引力を利用してガイド機構を形成しており、外力を受けるなどによって振動子131と第2ガイドバー304が引き離される状態が生じるが、これに対しては、つぎのように対処されている。
 すなわち、レンズホルダ302に備えられる脱落防止部302dが第2ガイドバー304に当たることで、レンズホルダ302が所望の位置に戻るように対応が施されている。振動子131に所望の交流電圧(交流信号)を与えることで振動子131と第2ガイドバー304との間に駆動力が発生し、この駆動力によってレンズホルダの駆動が行われる。
 接触体132または振動子131に取り付けられた不図示の位置センサによって、相対位置及び相対速度が検出される。相対位置は、制御部10に位置偏差としてフィードバックされることで、単位時間毎の目標位置に追従するように振動型アクチュエータはフィードバック制御される。相対速度は、機械学習部12に入力されて、制御部10から出力される制御量(位相差、周波数)と共に学習データとして使用される。学習データとは、入力データ及び出力データ(正解データ)のペアで構成されるデータのことである。本実施形態では、入力データとしての相対速度及び出力データ(正解データ)としての制御量(位相差、周波数)のペアで構成されるデータが学習データである。尚、本実施形態は、電気-機械エネルギー変換素子である圧電素子を2相に分けて駆動する2相駆動の制御装置を例にとり説明するが、本発明は2相駆動に限定されるものではなく、2相以上の振動型アクチュエータにも適用できる。
 次に、機械学習部12を詳細に説明する。学習モデル106は、速度検出部16からの相対速度と目標偏差を入力とし、位相差及び周波数を出力とするNN構成(図2参照)を有する。目標偏差とは、接触体132を振動子131に対して相対的に移動させる際に、位置偏差が追従するように設定される値である。目標偏差は、ここでは、位置偏差と同じ次元(データ形式)の値である。目標偏差は、例えば、ゼロと設定されるが、メカ系のガタを補償するようにオフセット値を与えても良い。また、学習モデル106は、目標偏差に代えて、目標速度と検出速度との差分である速度偏差を入力としても良い(図5参照)。速度偏差を与えた場合、従来では取得できなかったモータ特性を副次的に学習できる事を発見した。具体的には、速度偏差に含まれる多様な振動成分と制御量の関係に基づき振動型アクチュエータの周波数応答(所謂、伝達特性)に相当する特徴が学習されており、入力とする位置偏差に係るNNの重み値と閾値は適切な値に学習され、制御系を補償することができる。
 制御部10から出力される制御量(位相差、周波数)は正解データとして用いられ、未学習または学習中の学習モデル106から出力される制御量と比較し、誤差が算出される。尚、本例は位相差と周波数を制御量としたが、これ以外にも、パルス幅と周波数、パルス幅と位相差、の組み合わせも制御量とすることができる。また、NNの出力層のニューロンを1つとしても良く、制御量として、位相差、周波数、及びパルス幅のうちのいずれかを選択するよう設計しても良い。
 図6は、本実施形態での、機械学習と学習済モデルによる制御のフローチャートである。ステップ1(S1)で、制御部の学習モデル103の重みと閾値に初期値がランダム関数に基づいて設定される(未学習状態)。ステップ2(S2)で、前記未学習モデル(未学習のNN)によって振動型アクチュエータの制御が行われる。
 ステップ3(S3)で、振動型アクチュエータの駆動中に未学習モデルから出力された制御量(位相差、周波数)と、速度検出部16によって検出された相対速度と、の時系列データが、学習データとして取得される。
 ステップ4(S4)で、前記学習データの制御量を正解データとして、学習モデル106を用いた機械学習による最適化演算が行われる。最適化とは、NNへの入力によるNNからの出力が、学習データに近づくように、NNのパラメータを調整することであり、NNへの入力によるNNからの出力が、学習データと一致するように、NNのパラメータを調整することに限られない。尚、学習モデル106は、制御に用いる学習済モデル103と同じNN構成を有する。機械学習によってNNの重みと閾値が最適化され、制御部の学習済モデル103のパラメータが更新される。
 ステップ5(S5)で、重みと閾値が更新された学習済モデル103によって振動型アクチュエータの制御が行われる。機械学習部12は、これらステップを不図示のコンピュータに実行させるプログラムを有している。
 制御後は、駆動条件や温度環境の変化に対応するため、ステップ3(S3)に戻り、学習データの取得が行われる。学習データの取得方法として、駆動停止中に学習を行うバッチ学習や、駆動中に逐次学習を行うオンライン学習などが実施される。
 図7は、機械学習部12における、バッチ学習とオンライン学習(振動型アクチュエータの制御装置の製造方法)を説明するタイミングチャートである。横軸は時間を示し、縦軸は振動型アクチュエータをフィードバック制御するために指令値として与える目標位置パターンを示す。
 図7(a)は、駆動停止中(接触体を振動子に対して相対的に移動させる場合以外の場合)に学習を行うバッチ学習の例を示す。本例は、振動型アクチュエータの駆動期間において検出した相対速度と制御量の時系列データを学習データとして取得し、停止期間を利用して機械学習とNNのパラメータを更新(重み、閾値)するものである。尚、停止期間毎に必ずしも機械学習を行う必要はなく、例えば、温度環境や駆動条件の変化を検知した場合のみ学習する方法も可能である。
 図7(b)は、駆動中(接触体を振動子に対して相対的に移動させる場合)に逐次学習を行うオンライン学習の例を示す。本例は、振動型アクチュエータ駆動期間と併行してオンラインで機械学習を行い、駆動期間中にNNのパラメータを更新するものである。オンライン学習の適用によって、バッチ学習では対応することができない、駆動期間中に生じる負荷変動にも対応することが可能となる。
 前述のステップ4(S4)の機械学習について、図8A以下を用いて更に説明する。図8Aは、NNのパラメータの最適化手法(最適化アルゴリズム)としてAdamを用いた場合のフローチャートなどである。
 ステップ1~ステップ2(S1~S2)は、前述の図6で説明した通りである。
 ステップ3(S3)で、図8Bに示す時系列の学習データである制御量(n)と検出速度(n)を取得する。制御量(n)と検出速度(n)は、未学習モデルによって振動型アクチュエータ13を制御した場合の測定データであり、制御量(n)によって振動型アクチュエータ13が駆動されたときに速度検出部16によって検出された速度が検出速度(n)である。制御量(位相差)と検出速度の各サンプル数nは3400個である。これは、制御サンプリングレート(1/制御サンプリング周期)10kHzで0.34sec駆動した場合の実測データである。
 尚、学習データは必ずしも制御サンプリングレートで取得する必要はなく、間引くことでメモリの節約と学習時間の短縮が可能である。本発明は、検出速度(n)を学習モデル106の入力とし、学習モデル106によって演算(導出)され出力された結果である出力z(n)を、学習データの正解データにあたるt(n)と比較して、誤差e(n)を算出する。具体的には、誤差e(n)は、誤差e(n)=(t(n)-z(n))とした。
 ステップ4(S4)で、3400個分の誤差E(=Σe(n)=Σ(t(n)-z(n)))が1回目のループで算出され、重み(wh、wo)と閾値(θh、θo)の誤差勾配∇Eがそれぞれ演算される。
 次に、誤差勾配∇Eを用いて、最適化演算手法(最適化アルゴリズム)の1つであるAdamを用いて下記のようにパラメータの最適化が行われる。
Figure JPOXMLDOC01-appb-M000001
 wはパラメータ更新量、∇Eは誤差勾配、vは誤差勾配の移動平均、sは誤差勾配の二乗の移動平均、ηは学習率、εはゼロ割防止定数である。各パラメータ、はη=0.001、β=0.9、β=0.999、ε=10e-12を用いた。最適化演算を繰り返す毎に重みと閾値が更新され、学習モデルの出力z(n)は、正解データにあたるt(n)に近づいていくので、誤差Eは小さくなっていく。
 最後に、ステップ5(S5)で、重みと閾値が更新された学習済NNによって振動型アクチュエータの制御が行われる。
 図8Cは、演算ループ回数に基づく誤差Eの推移を示したものである。尚、最適化手法(最適化アルゴリズム)として、これ以外の手法(アルゴリズム)を用いても良い。
 図9Aは、本実施形態の学習モデル106と実測して得た学習データを用いて、Adam、RMSprop、Momentum、SGDによる演算結果を比較したものである。演算回数と安定性、最終的な誤差、の観点から、Adamで最も優秀な結果が得られた。
 図9Bは、Adamによる制御量(位相差)の学習例である。ループ1回目の学習モデルの出力zは、正解データの制御量tと大きく異なる様子がわかる。演算を繰り返し、ループ5000回目の学習モデルの出力zは、正解データの制御量tとほぼ一致している。本学習例は、ループ回数を5000回として最適化を行ったが、収束率に応じて、回数は適宜調整するのが望ましい。
 以上が本発明の制御装置の構成である。尚、制御部10と機械学習部12は、例えば、CPU、PLD(ASICを含む)などのデジタルデバイスや、A/D変換器などの素子から構成される。また、駆動部11の交流信号生成部104は、例えば、CPUや関数発生器とスイッチング回路を有し、駆動部11の昇圧回路105は、例えば、コイルや、トランス、コンデンサから構成される。尚、制御部10、機械学習部12及び駆動部11は、1つの素子や回路から構成されるだけではなく、複数の素子や回路から構成されていてもよい。また、制御部10、機械学習部12及び駆動部11における各処理を、いずれの素子や回路が実行してもよい。
 図10A、図10B及び図10Cは、従来のPID制御と本発明の学習済モデルによる制御とにおいて、所定の目標位置パターンでフィードバック制御を行った場合の結果を比較したものである。目標速度は最大50mm/sの台形駆動で、位置決め動作を含む5mmストロークの往復動作を行うパターンである。横軸は時間(sec)、縦軸は上から順に位相差制御量(deg)、検出速度(mm/s)と速度偏差(mm/s)、目標位置(エンコーダパルス数:1mmあたり8000pls)と位置偏差(μm)を示す。
 図10Aは、従来のPID制御器を用いた振動型アクチュエータの制御装置(図47A参照)による結果である。従来のPID制御による制御では、振動型アクチュエータ13に印加する交流電圧の周波数(駆動周波数)は93kHzに固定した。また、振動型アクチュエータ13を、位相差のみで制御した。
 速度偏差及び位置偏差のうち、特に位置偏差が加減速領域で大きくなる傾向にある。これは、振動型アクチュエータが駆動する被駆動体のイナーシャ(慣性)が影響する為である。また、停止整定するまでに(目標位置が変化しなくなってから実位置が変化しなくなるまでに)長時間を要している様子が分かる。尚、PID制御ゲインを更に大きくすれば位置偏差を低減することは可能だが、駆動条件(使用する周波数範囲91kHz~95kHz)や環境温度の変化に対するロバスト性を確保するため、一定のゲイン余裕と位相余裕を有するPID制御ゲインを適用した。
 図10Bは、本発明の学習済モデルを用いた振動型アクチュエータの制御装置による制御結果である。同様に、駆動周波数は93kHzに固定し、位相差のみで制御した。本発明の適用によって、位置偏差は加減速及び停止整定時の全ての領域において改善することが分かった。
 図10Cは、学習済モデルを用いた振動型アクチュエータの制御装置による制御結果である。駆動周波数は93kHzを起点とし、位相差と併行して周波数が操作され、それによって、駆動周波数が操作される。尚、周波数は符号なし絶対値であり、駆動周波数は常に93kHzを基準として低周波数側に操作される。本例のように、制御量が複数ある場合、機械学習において所定の速度が得られる制御量の組み合わせは無数に考えられる。従って、学習データを取得する時点で制御量の関係性を規定しておく必要がある。
 本実施形態では、周波数と位相差の比を規定することで学習を行った。これ以外にも、例えば、NNのパラメータをランダム関数で設定し、複数の学習結果を比較することで、位置偏差や電力が最も良好な結果を示すパラメータで規定するのも良い。制御量を位相差と周波数を用いることによって、振動型アクチュエータの速度レンジを拡大することができ、速度偏差、位置偏差はPID制御より改善することが分かった。尚、図10Bと図10Cにおいて、仮想的なPID制御の位相差の変化を表示している(最上段の図)。これは、振動型アクチュエータの制御には直接使用されないが、位置偏差に基づき観測器としてPID演算を行った制御量の出力である。
 このPID制御量を利用することで、学習済モデルの制御の異常検知を行うことができる。すなわち、学習済モデルが出力する制御量とPID制御量を比較することで、所定の範囲から大きくずれることがあればNNのパラメータが正常値から外れていることを予測でき、パラメータをリセットする事ができる。本機能は本発明の効果を得る上で必須の構成ではないが、学習済モデルによる制御の性能保証という観点で信頼性を上げることができる。図11は、本発明の制御装置におけるロバスト性を示す結果である。所定の目標位置パターンでフィードバック制御を行い、目標速度は最大50mm/sの台形駆動で、位置決め動作を含む5mmストロークの往復動作を行うパターンである。横軸は時間(sec)、縦軸はエンコーダのパルス単位での目標位置(左軸)、μm単位での位置偏差(右軸)を示す。
 図11Aは、周波数95kHzで機械学習を行った学習済モデルによる制御結果、図11Bは、周波数91kHzで機械学習を行った学習済モデルによる制御結果を示す。図45A、図45B、図45C、図45Dを用いて説明した前述のように、異なる周波数で制御を行うと振動型アクチュエータの非線形特性によって速度の傾きが変化するので、従来のPID制御では対応が難しかった。
 本発明は、機械学習によって速度カーブの傾き変化に対応した学習済モデルを生成することができるので、異なる周波数においても良好な制御性を得ることができる。
 (第2の実施形態)
 本発明の機械学習の他の実施形態について説明する。図12は、PID制御での制御結果を学習データとして用いる場合の振動型駆動装置の制御ブロック図である。図12においては、振動型アクチュエータ13を除いたものが、制御装置である。本制御ブロックにおいて、振動型アクチュエータ13の位置フィードバック制御は、PID制御器901を用いて行われる。PID制御器901には位置偏差が入力され、PID制御器901からはPID演算された制御量としての位相差と周波数が出力される。尚、制御器としてはPID制御器以外の構成でも良く、例えば、P制御器、PI制御器、PD制御器なども適用できる。
 機械学習部12において速度検出部16によって検出された相対速度(検出速度)と、PID制御器901から出力された制御量(位相差、周波数)と、を用いて学習モデル106の機械学習が行われる。本実施形態の特徴としては、PID制御器による制御結果と、PID制御器の制御量を正解データとして機械学習を行った学習済モデルによる制御結果を比較できることである。PID制御器との比較によって、学習が上手く出来たかどうかを判定することができ、学習済モデルの信頼性を保証することができる。
 (第3の実施形態)
 本発明の機械学習の他の実施形態について説明する。図13は、オープン駆動での制御結果を学習データとして用いる場合の振動型駆動装置の制御ブロック図である。図13においては、振動型アクチュエータ13を除いたものが、制御装置である。本制御ブロックの特徴として、振動型アクチュエータ13のフィードバック制御は行われない。
 駆動パターン生成部1001(駆動パターン指令部)によって生成された任意のパターン波形がオープン駆動部1002から交流信号生成部111に出力(指令)される。例えば、SIN波パターンや矩形パターンの繰り返し信号が用いられる。
 本実施形態では、同一周波数の位相差と周波数のSIN波パターンを各々出力する。尚、各SIN波の振幅の比率を調整することで、学習済モデルの制御性能を調整することができる。本例では、位相差のSIN波振幅を90deg、周波数のSIN波振幅を1kHzとした。
 機械学習部12において速度検出部16によって検出された相対速度と、オープン駆動部1002から出力された制御量(位相差、周波数)と、を用いて学習モデル106の機械学習が行われる。本実施形態の特徴としては、オープン駆動部による制御結果と、オープン駆動部の制御量を正解データとして機械学習を行った学習済モデルによる制御結果を比較できることである。オープン駆動部との比較によって、学習が上手く出来たかどうかを判定することができ、学習済モデルの信頼性を保証することができる。
 (第4の実施形態)
 図1で示した、第1の実施形態における制御部10の他の実施形態について説明する。図14は、学習済モデルとPID制御器を併用した場合の振動型駆動装置の制御ブロック図である。図14においては、振動型アクチュエータ13を除いたものが、制御装置である。本制御ブロックにおいて、振動型アクチュエータ13の位置フィードバック制御は、PID制御器1401(第1のPID制御器)と学習済モデル103とを用いて行われる。
 第1のPID制御器1401には位置偏差が入力され、第1のPID制御器1401からはPID演算された位置偏差が出力される。尚、PID制御器以外の構成でも良く、例えば、P制御器、PI制御器、PD制御器なども適用できる。
 学習済モデル103には、目標速度と、PID演算された位置偏差と、が入力される。同様に、機械学習部12において速度検出部16によって検出された相対速度と、学習済モデル103から出力された制御量(位相差、周波数)と、を用いて学習モデル106の機械学習が行われる。尚、PID演算された位置偏差を、学習済モデル103への入力とすると共に、後述する第5の実施形態のように、学習済モデル103からの出力(制御量)へ加算してもよい(図15参照)。これは、位置偏差のPID演算量を学習済モデル103に対して直列且つ、並列に機能させる為である。直列成分によって位置偏差の効きを大幅に高めることができ(応答性が高まる)、更に並列成分によって制御系を安定化させる効果が得らえる。本発明の学習済モデル103は、このようにPID演算器を直列且かつ並列に構成することもでき、自由度の高い制御系を構築できる。
 本実施形態を適用することによって、学習済モデルに入力する位置偏差のゲイン調整を行うことができるので、より細かな制御系の調整を行うことができる。
 (第5の実施形態)
 図1で示した、第1の実施形態における制御部10の他の実施形態について説明する。図16は、学習済モデルとPID制御器を併用した場合の振動型駆動装置の制御ブロック図である。図16においては、振動型アクチュエータ13を除いたものが、制御装置である。本制御ブロックにおいて、振動型アクチュエータ13の位置フィードバック制御は、PID制御器1501(第2のPID制御器)から出力された制御量と、学習済モデル103から出力された制御量と、を加算して行われる。
 第2のPID制御器1501には位置偏差が入力され、PID演算された位相差と周波数が出力される。尚、PID制御器以外の構成でも良く、例えば、P制御器、PI制御器、PD制御器なども適用できる。また、PID制御器の後段に位相補償器を配しても良い。学習済モデル103には、目標速度と位置偏差とが入力されるが、位置偏差はゼロとしても良い。
 学習済モデル103から位相差と周波数が出力され、第2のPID制御器1501から出力された位相差と周波数が各々加算される。加算された制御量と、速度検出部16によって検出された相対速度と、は機械学習部12に入力され、学習モデル106の機械学習が行われる。
 本実施形態を適用することによって、学習済モデルに入力する位置偏差のゲイン調整を行うことができるので、より細かな制御系の調整を行うことができる。
 (第6の実施形態)
 図1で示した、第1の実施形態における制御部10の他の実施形態について説明する。図17は、位相差、周波数、及びパルス幅を制御量として機械学習を行った学習済モデルを用いた制御を行う場合の振動型駆動装置の制御ブロック図である。図17においては、振動型アクチュエータ13を除いたものが、制御装置である。本制御ブロックにおいて、振動型アクチュエータ13の位置フィードバック制御は、学習済モデル1601から出力される各制御量(位相差、周波数、及びパルス幅)によって行われる。
 学習済モデル1601には、目標速度と位置偏差が入力され、NNで演算された位相差、周波数、及びパルス幅が駆動部11に出力されて振動型アクチュエータ13は制御される。機械学習部12では、学習済モデル1601から出力された3つの制御量と、速度検出部16によって検出された相対速度を学習データとして取得し、学習モデル1602による機械学習が行われる。図18は、位相差、周波数、及びパルス幅を出力とするニューラルネットワーク構成を示す図である。学習済モデル1601と学習モデル1062は目標速度と位置偏差を入力とし、3つの制御量を出力とするNN構成を有する。機械学習に用いる学習データは、前述のように学習済モデルによる制御の測定データを用いても良いし、ランダム関数でパラメータを設定した未学習モデルによって振動型アクチュエータを制御した場合の測定データでも良い。それ以外にも、オープン駆動による測定データ、PID制御による測定データを用いても良い。
 尚、NNの重みと閾値を決定する際、複数の学習データから位置偏差や消費電力などの観点で最適な条件のパラメータを選定しても良い。これは、振動型アクチュエータの所定の速度が得られる条件、すなわち位相差、周波数、パルス幅の組み合わせは無数に存在する為である。
 本実施形態を適用することによって、振動型アクチュエータを操作するパラメータが増えるので、適切な機械学習を行うことで細かな制御性能の調整を行うことができる。
 (第7の実施形態)
 図1で示した、第1の実施形態における制御部10の他の実施形態について説明する。図19は、図1の振動型駆動装置から、位置指令部102、位置検出部14などを除いた場合の振動型駆動装置の制御ブロック図に相当する。図19においては、振動型アクチュエータ13を除いたものが、制御装置である。図20は、図19で使用される学習モデル及び学習済モデル制御部が有するNN構成を示す図である。
 このような形態においても、これまでの実施形態と同様に、学習済モデルを生成することができる。
 図1で示した、第1の実施形態における制御部10の他の実施形態について説明する。図21は、図1の振動型駆動装置から、位置指令部102、位置検出部14などを除き、位置偏差によるフィードバックループ制御に代え、速度偏差によるフィードバック制御を行う場合の振動型駆動装置の制御ブロック図に相当する。図21においては、振動型アクチュエータ13を除いたものが、制御装置である。図22は、図21で使用される学習モデル及び学習済モデル制御部が有するNN構成を示す図である。
 このような形態においても、これまでの実施形態と同様に、学習済モデルを生成することができる。
 (第8の実施形態)
 これまでの実施形態において、第1の速度が指令された場合に、第1の制御量を出力するよう機械学習された学習済モデルを有する制御量出力部を制御装置が有しているならば、制御装置から学習部を除いても良い。このような制御装置では学習済モデルは再び機械学習ができないというデメリットが存在するものの、再び機械学習を行う必要性が低い振動型駆動装置においては、学習部が除かれた分、構成が簡素になるというメリットがある。
 これまでの実施形態において、学習済モデルが有していたパラメータ(第1の重み、第2の重み、第2のニューロンの閾値、及び第3のニューロンの閾値)を記憶する記憶部を有するようにしてもよい。そして、学習済モデルは、記憶部が記憶するパラメータによって、学習済モデルが有するパラメータが置換されることによって機械学習されてもよい。記憶部には、ROMなどのメモリが用いられるがこれに限られない。記憶部としては、学習済モデルが有していたパラメータを記憶できるものであればよいからである。
 また、これまでの実施形態において、環境状態を検知する環境センサを有するようにしてもよい。そして、学習済モデルは、前記環境センサによって環境の変化を検知した場合に、機械学習されてもよい。環境センサは、温度センサ及び湿度センサのうちの少なくとも1つであるようにしてもよい。
 (第9の実施形態)
 図23は、本実施形態の振動型駆動装置の制御ブロック図である。振動型駆動装置17は、制御装置15及び振動型アクチュエータ13を有する。図23においては、振動型駆動装置17から振動型アクチュエータ13を除いたものが、制御装置15である。
 制御装置15は、振動型アクチュエータを制御する学習済モデル制御部10(制御部)と、駆動部11と、学習モデル116を有する機械学習部12と、位置検出部14と、を有する。駆動部11は、交流信号生成部104及び昇圧回路105を有する。
 振動型アクチュエータ13は、振動子131及び接触体132を有する。速度検出部16は、接触体132の振動子131に対する相対的な速度(相対速度)を検出する。位置検出部14は、接触体132の振動子131に対する相対的な位置(相対位置)を検出する。位置検出部としては、いわゆるアブソリュート・エンコーダやインクリメント・エンコーダなどが用いられるがこれらに限られない。速度検出部16としては、直接速度情報を検出するもの(速度センサ)に限られず、位置情報を演算することにより速度情報を間接的に検出するものであってもよい。
 制御部10は、振動子131の駆動(接触体132の振動子131に対する相対的な移動)を制御する信号を生成できるよう構成される。すなわち、目標速度と位置偏差とを学習済モデルに入力し、出力された位相差と周波数を振動型アクチュエータ13の制御量(第1の制御量)として用いる。目標速度とは、接触体132を振動子131に対して相対的に移動させる際に、実速度(検出速度)が追従するように設定される速度である。位置偏差とは、目標位置と実位置(検出位置)との差である。目標位置とは、接触体132を振動子131に対して相対的に移動させる際に、実位置(検出位置)が追従するように設定される位置である。尚、制御量として電圧振幅を変更するためのパルス幅を用いても良い。
 制御部10は、目標速度を指令する速度指令部101、目標位置を指令する位置指令部102を有する。また、制御部10は、目標速度と位置偏差とが入力され、位相差と周波数とを出力する学習済モデルを有する制御量出力部113を有する。尚、以下では、「学習済モデルを有する制御量出力部」を、単に、「学習済モデル」ともいう。
 駆動部11は、交流信号生成部104及び昇圧回路105を有する。
 速度指令部101によって、単位時間毎の目標速度が生成され指令される。また、位置指令部102によって、単位時間毎の目標位置が生成され指令される。そして、目標位置と、位置検出部14によって検出された検出位置と、の単位時間毎の差が、位置偏差として演算される。当該差は、単位時間毎の検出位置-単位時間毎の目標位置、である。
 ここで、目標速度及び目標位置は、例えば、単位時間としての制御サンプリング周期毎に生成される。具体的には、目標速度を表す1つの指令値が、制御サンプリング周期毎に速度指令部101から出力され、目標位置を表す1つの指令値が、制御サンプリング周期毎に位置指令部102から出力される。指令値は、目標速度自体ではなく、目標速度に対応付けられたものでもよい。
 制御サンプリング周期とは、図23における位置偏差の取得から、制御量の出力、振動子への交流電圧の印加、実速度(検出速度)や実位置(検出位置)の検出を経て、位置偏差の取得が始まる直前までの1サイクルのことをいう。前記サイクルで、振動型アクチュエータの位置又は速度がフィードバック制御される。尚、目標速度は、目標位置を単位時間毎に微分することで生成しても良い。逆に、目標速度を積分することで目標位置を生成しても良い。
 目標速度と位置偏差を用いて、学習済モデル113で制御量(位相差、及び周波数)が演算され、出力される。学習済モデル113は、図24A、図24B、図24Cに示すリカレントニューラルネットワーク(以下、「RNN」ともいう)構造を有する。RNNは、入力層のX層、隠れ層のH層、出力層のZ層、そして状態層のC層から成り、いわゆるディープラーニング構造を有する。時系列情報を記憶しながら機械学習を行っていくRNNの特徴を活かし、振動型アクチュエータのフィードバック制御に応用したのが本発明の特徴である。本実施形態では、入力データとして目標速度を入力x1、位置偏差を入力x2に設定し、出力データとして位相差を出力z1、周波数を出力z2に設定した。
 入力層は2個のニューロン(X1、X2)、隠れ層は7個のニューロン(H1、H2、・・・、H7)、出力層は2個のニューロン(Z1、Z2)を有し、活性化関数として一般的なシグモイド関数(図24B)を用いた。隠れ層のニューロンは7個に限られないが、3~20個の範囲が好ましい。隠れ層のニューロンの数が少ないほど学習精度は低下するが学習が速く収束し(学習速度が速くなり)、隠れ層のニューロンの数が多いほど学習精度は向上するが学習速度が遅くなり、学習精度と学習速度はトレードオフの関係にあるからである。また、出力層の活性化関数は、一般的にはシグモイド関数やReLU(ランプ関数)が用いられるが、制御量である位相差のマイナス符号にも対応させる為、線形関数(図24C)を用いた。
 状態層は7個のニューロン(C1、C2、・・・、C7)を有し、隠れ層の出力は状態層の各ニューロンに保持される。つまり、時系列データの1制御サンプリング前のデータが保持されていることになる。状態層に保持されたデータは、次の制御サンプリング時に状態層に回帰される。従って、隠れ層には、入力層からのデータ(速度、位置偏差)と状態層からの保持データとが、重みが乗算された上で入力されることになる。その結果、過去の時系列データ情報が記憶された上で、出力データ(位相差、及び周波数)が演算される。
 入力層のニューロン(第1のニューロン)と隠れ層のニューロン(第2のニューロン)を結ぶ重み(第1の重み)をwhとした。また、隠れ層のニューロン(第2のニューロン)の閾値をθhとした。また、隠れ層のニューロン(第2のニューロン)と出力層のニューロン(第3のニューロン)を結ぶ重みをwoとした。また、出力層のニューロン(第3のニューロン)の閾値をθoとした。状態層のニューロン(第4のニューロン)と隠れ層のニューロン(第2のニューロン)を結ぶ重みをwcとした。重みと閾値は、後述の機械学習部12によって学習された値が適用される。学習済みのRNNは、振動型アクチュエータの実速度(検出速度)と制御量の時系列データから共通する特徴パターンを抽出した集合体と捉えることができる。したがって、出力は、重みと閾値を変数(パラメータ)とする関数によって得られる値となる。
 NNから出力された制御量(位相差、及び周波数)は、交流信号生成部104に入力され、振動型アクチュエータの速度、駆動方向が制御される。交流信号生成部104では、位相差、周波数、及びパルス幅に基づいて、2相の交流信号が生成される。
 昇圧回路105は、例えば、コイルやトランスなどを有し、昇圧回路105によって所望の駆動電圧に昇圧された交流信号(交流電圧)は、振動子131の圧電素子に印加され、接触体132を駆動する。
 前述のステップ4(S4)の機械学習について、図25を用いて更に説明する。図25は、RNNのパラメータの最適化手法(最適化アルゴリズム)としてAdamを用いた場合のフローチャートなどである。ステップ1~ステップ5の内容は、演算され用いられる誤差勾配が、重み(wh、wc、wo)と閾値(θh、θo)の誤差勾配∇Eである点以外は、上述した、図8A以下を用いた説明と同様である。
 図26A、図26B、図26Cは、従来のPID制御と本発明の学習済モデルによる制御とにおいて、所定の目標位置パターンでフィードバック制御を行った場合の制御結果を比較したものである。目標速度は最大50mm/sの台形駆動で、位置決め動作を含む5mmストロークの往復動作を行うパターンである。横軸は時間(sec)、縦軸は上から順に位相差制御量(deg)、検出速度(mm/s)と速度偏差(mm/s)、目標位置(エンコーダパルス数:1mmあたり8000pls)と位置偏差(μm)を示す。
 図26Aは、従来のPID制御器を用いた振動型アクチュエータの制御装置(図45A参照)による制御結果である。従来のPID制御による制御では、振動型アクチュエータ13に印加する交流電圧の周波数(駆動周波数)は93kHzに固定した。また、振動型アクチュエータ13を、位相差のみで制御した。
 速度偏差及び位置偏差のうち、特に位置偏差が加減速領域で大きくなる傾向にある。これは、振動型アクチュエータが駆動する被駆動体のイナーシャ(慣性)が影響する為である。また、停止整定するまでに(目標位置が変化しなくなってから実位置が変化しなくなるまでに)長時間を要している様子が分かる。尚、PID制御ゲインを更に大きくすれば位置偏差を低減することは可能だが、駆動条件(使用する周波数範囲91kHz~95kHz)や環境温度の変化に対するロバスト性を確保するため、一定のゲイン余裕と位相余裕を有するPID制御ゲインを適用した。
 図26Bは、本発明の学習済モデル(H層回帰型リカレントニューラルネットワーク構造の学習済モデル)を用いた振動型アクチュエータの制御装置(図23の制御装置15)による制御結果である。H層回帰型リカレントニューラルネットワークとは、H層(隠れ層)の出力をC層(状態層)に格納し、H層(隠れ層)に回帰させるニューラルネットワークである。図24A、図24B、図24Cは、H層回帰型リカレントニューラルネットワーク構造を示したものである。
 本発明の学習済モデルを用いた振動型アクチュエータの制御装置15による制御では、駆動周波数を固定し、位相差を変化させることにより制御した。具体的には、駆動周波数(図23における「周波数」、図24Aにおける出力z2)は93kHzに固定し、振動型アクチュエータ13を、位相差(図23における位相差、図24Aにおけるz1)を変化させることにより制御した。本発明のH層回帰型RNNを適用することにより、位置偏差は、加減速及び停止整定時の全ての領域において改善することが分かった。
 図26Cは、本発明の学習済モデル(Z層回帰型リカレントニューラルネットワーク構造の学習済モデル)を用いた振動型アクチュエータの制御装置(図23の制御装置15において、学習済モデル及び学習モデルを、H層回帰型RNNからZ層回帰型RNNに置き換えたもの)による制御結果である。Z層回帰型リカレントニューラルネットワークとは、Z層(出力層)の出力をC層(状態層)に格納し、H層(隠れ層)に回帰させるニューラルネットワークである。図36A、図36B、図36Cは、Z層回帰型リカレントニューラルネットワーク構造を示したものである。
 本発明の学習済モデルを用いた振動型アクチュエータの制御装置15による制御では、駆動周波数を固定し、位相差を変化させることにより制御した。具体的には、駆動周波数(図23における「周波数」、図36Aにおける出力z2)は93kHzに固定し、振動型アクチュエータ13を、位相差(図23における位相差、図36Aにおけるz1)を変化させることにより制御した。本発明のZ層回帰型RNNを適用することにより、位置偏差は、加減速及び停止整定時の全ての領域において改善することが分かった。
 本実施形態では、入力データとして、目標速度をx1、位置偏差をx2に設定し、出力データとして、位相差をz1に設定した。
 説明上、制御量として位相差と周波数を使用する例を図に示したが、出力を1つとして位相差のみ、あるいは駆動周波数(図23における「周波数」)のみ、としても良い。また、パルス幅を用いても良い。
 隠れ層は7個のニューロンで形成し、活性化関数はシグモイド関数(図36B)を用いた。出力層の活性化関数は、線形関数(図36C)を用いた。状態層は2個のニューロンで形成し、出力層の出力は状態層の各ニューロンに保持される。つまり、時系列データの1制御サンプリング前のデータが保持されていることになる。状態層に保持されたデータは、次の制御サンプリング時に隠れ層に回帰される。従って、隠れ層には、入力層からのデータ(速度、位置偏差)と状態層からの保持データ(位相差、及び周波数)とが、重みが乗算された上で入力されることになる。その結果、過去の時系列データ情報が記憶された上で、出力データ(位相差、及び周波数)が演算される。
 入力層と隠れ層の各ニューロンを結ぶ重みをwh、状態層と隠れ層の各ニューロンを結ぶ重みをwc、隠れ層のニューロンの閾値をθh、隠れ層と出力層の各ニューロンを結ぶ重みをwo、出力層のニューロンの閾値をθoとした。全ての重みと閾値は、機械学習部12によって学習された値が適用される。
 本発明の適用により、位置偏差は加減速及び停止整定時の全ての領域において改善することが分かった。
 尚、図26B及び図26Cにおいて、仮想的なPID制御の位相差の変化を表示している(最上段の図)。これは、振動型アクチュエータの制御には直接使用されないが、位置偏差に基づき観測器としてPID演算を行った制御量の出力である。このPID制御量を利用することで、学習済モデルの制御の異常検出を行うことができる。すなわち、学習済モデルが出力する制御量とPID制御量を比較することで、所定の範囲から大きくずれることがあればNNのパラメータが正常値から外れていることを予測でき、パラメータをリセットする事ができる。本機能は本発明の効果を得る上で必須の構成ではないが、学習済モデルによる制御の性能保証という観点で信頼性を上げることができる。
 図27A、図27Bは、本発明の振動型アクチュエータの制御装置における高周波の応答性を示すシミュレーション結果である。実線のSIN波で示された、所定の目標位置パターン(位置指令値)でフィードバック制御を行い、目標速度は最大30mm/sのSIN波駆動で、微小な距離(50~100μm)を高周波(100Hz、200Hz)で往復動作を行うパターンである。横軸は時間(ms)、縦軸は位置(mm)を示す。図27Aは、100Hzの位置指令値による制御結果、図27Bは、200Hzの目標位置パターンによる制御結果を示す。PID制御は、目標位置パターンに対して位相が大きく遅れており、十分な追従性能が得られていない様子が分かる。これは、目標位置パターンが高周波になるほど顕著である。これに対して本発明のRNN制御(制御部にRNNを用いた制御)は、目標位置パターンへの追従性が良いことが分かる。つまり、目標位置パターンに対する時間的な位相の遅れ(目標位置パターンに対する時間軸方向の位相の遅れ)が、PID制御よりも、本発明のRNN制御の方が小さいことが分かる。この理由は、RNNは過去の時系列情報を記憶しているので、加減速時の制御量の予測精度が向上する為だと考えられる。具体的には、以下の通りである。
 振動型アクチュエータを目標速度に追従するように駆動する場合、目標速度に対して、実速度(検出速度)は必然的にずれる(検出速度に追従遅れが生じる)。この追従遅れを縮めるためには、目標速度を予測した上で制御量を出力する必要がある。NN制御(制御部にNNを用いた制御)では、速度指令としては目標速度(入力層からの出力)のみに基づき制御量を出力するので、目標速度を予測しない(図28A参照)。
 しかし、RNN制御(H層回帰型RNN制御)では、隠れ層に、目標速度(入力層からの出力)と共に、状態層からの出力(過去の、隠れ層からの出力)が入力(加算)されることにより、目標速度を予測する。つまり、状態層からの出力は、過去の目標速度の履歴に基づく(過去の目標速度の履歴の情報を有する)ものであり、このような状態層からの出力を、現在の目標速度に加算することにより、将来の目標速度を予測した上で制御量を出力する(図28B参照)。尚、図28Bでは、図を簡略化するため、隠れ層Hのニューロンの数を2つにしたが、隠れ層のニューロンの数を3つ以上の場合も同様である。
 また、RNN制御(Z層回帰型RNN制御)では、隠れ層に、目標速度(入力層からの出力)と共に、状態層からの出力(過去の、出力層のからの出力)が入力(加算)されることにより、目標速度を予測する。つまり、状態層からの出力は、過去の目標速度の履歴に基づく(過去の目標速度の履歴の情報を有する)ものであり、このような状態層からの出力を、現在の目標速度に加算することにより、将来の目標速度を予測した上で制御量を出力する(図28C参照)。尚、図28Cでは、図を簡略化するため、隠れ層Hのニューロンの数を2つにしたが、隠れ層のニューロンの数を3つ以上の場合も同様である。
 図29A、図29Bは、本発明の制御装置におけるロバスト性を示す結果である。所定の目標位置パターンでフィードバック制御を行い、目標速度は最大50mm/sの台形駆動で、位置決め動作を含む5mmストロークの往復動作を行うパターンである。横軸は時間(sec)、縦軸はエンコーダのパルス単位での目標位置(左軸)、μm単位での位置偏差(右軸)を示す。
 図29Aは起動周波数95kHzで機械学習を行った学習済モデルによる制御結果、図29Bは起動周波数91kHzで機械学習を行った学習済モデルによる制御結果を示す。図45A、図45B、図45C、図45Dを用いて説明した前述のように、異なる起動周波数で制御を行うと振動型アクチュエータの非線形特性によって速度の傾きが変化するので従来のPID制御では対応が難しかった。本発明は、機械学習によって速度カーブの傾き変化に対応した学習済モデルを生成することができるので、異なる起動周波数においても良好な制御性を得ることができる。
 (第10の実施形態)
 本発明の機械学習の他の実施形態について説明する。
 図30は、PID制御器を用いた振動型アクチュエータの制御装置による制御結果を学習データとして用いる場合の制御ブロック図である。本制御ブロックにおいて、振動型アクチュエータ13の位置フィードバック制御は、PID制御器901を用いて行われる。PID制御器901には位置偏差が入力され、PID演算された制御量の位相差と周波数が出力される。尚、PID制御器以外の構成でも良く、例えば、P制御、PI制御、PD制御なども適用できる。
 第9の実施形態と同様に、機械学習部12において速度検出部16で検出された検出速度と、PID制御器から出力された制御量を用いて学習モデル116の機械学習が行われる。本実施形態の特徴としては、PID制御器による制御結果と、その学習済モデルによる制御結果を比較できることである。PID制御器との比較により、学習が上手く出来たかどうかを判定することができ、学習済モデルの信頼性を保証することができる。
 (第11の実施形態)
 本発明の機械学習の他の実施形態について説明する。
 図31は、オープン駆動での制御結果(オープン駆動部を用いた振動型アクチュエータの制御装置による制御結果)を学習データとして用いる場合の制御ブロック図である。本制御ブロックの特徴として、振動型アクチュエータ13のフィードバック制御は行われない。駆動パターン生成部1001で生成された任意のパターン波形がオープン駆動部1002から交流信号生成部111に出力される。例えば、SIN波パターンや矩形パターンの繰り返し信号が用いられる。本実施形態では、同一周波数の位相差と周波数のSIN波パターンを各々出力する。尚、各SIN波の振幅の比率を調整することで、学習済モデルの制御性能を調整することができる。本例では、位相差のSIN波振幅を90deg、周波数のSIN波振幅を1kHzとした。
 第9の実施形態と同様に、機械学習部12において速度検出部16で検出された検出速度と、オープン駆動部1002から出力された制御量を用いて学習モデル116の機械学習が行われる。本発明は、オープン駆動時の結果を学習データに用いることもでき、同様の効果を得ることができる。
 (第12の実施形態)
 図23で示した、第9の実施形態における制御部10の他の実施形態について説明する。
 図32は、学習済モデルとPID制御器を併用した場合の制御ブロック図である。本制御ブロックにおいて、振動型アクチュエータ13の位置フィードバック制御は、PID制御器1401と学習済モデル113とを用いて行われる。PID制御器1401には位置偏差が入力され、PID演算されて出力される。尚、PID制御器以外の構成でも良く、例えば、P制御、PI制御、PD制御なども適用できる。学習済モデル113には、目標速度とPID演算された位置偏差とが入力される。同様に、機械学習部12において速度検出部16で検出された検出速度と、学習済モデル113から出力された制御量を用いて学習モデル116の機械学習が行われる。
 本実施形態を適用することにより、学習済モデルに入力する位置偏差のゲイン調整を行うことができるので、より細かな制御系の調整(制御量の調整)を行うことができる。
 (第13の実施形態)
 図23で示した、第9の実施形態における制御部10の他の実施形態について説明する。
 図33は、学習済モデルとPID制御器を併用した場合の制御ブロック図である。本制御ブロックにおいて、振動型アクチュエータ13の位置フィードバック制御は、PID制御器1501と学習済モデル113の各制御量を加算して行われる。PID制御器1501には位置偏差が入力され、PID演算された位相差と周波数が出力される。尚、PID制御器以外の構成でも良く、例えば、P制御、PI制御、PD制御なども適用できる。また、PID制御器の後段に位相補償器を配しても良い。学習済モデル113には、目標速度と位置偏差とが入力されるが、位置偏差はゼロとしても良い。学習済モデル113から位相差と周波数が出力され、PID演算器1501から出力された位相差と周波数が各々加算される。加算された制御量と、速度検出部16で検出された検出速度は機械学習部12に入力され、学習モデル116の機械学習が行われる。
 本実施形態を適用することにより、位置偏差のゲイン調整を行うことができるので、より細かな制御系の調整(制御量の調整)を行うことができる。
 (第14の実施形態)
 図23で示した、第9の実施形態における制御部10の他の実施形態について説明する。
 図34は、位相差、周波数、及びパルス幅を制御量として機械学習を行った学習済モデルを用いた制御を行うための制御ブロック図である。本制御ブロックにおいて、振動型アクチュエータ13の位置フィードバック制御は、学習済モデル1601から出力される各制御量(位相差、周波数、及びパルス幅)によって行われる。学習済モデル1601には目標速度と位置偏差が入力され、リカレントニューラルネットワークで演算された位相差、周波数、及びパルス幅が駆動部11に出力されて振動型アクチュエータ13は制御される。機械学習部12では、学習済モデル1601から出力された3つの制御量と、速度検出部16で検出された検出速度を学習データとして取得し、学習モデル1602による機械学習が行われる。
 図35は、位相差、周波数、及びパルス幅を出力とする学習モデルのH層回帰型リカレントニューラルネットワーク構造を示すものである。図34の学習済モデル1611と学習モデル1612は目標速度と位置偏差を入力とし、3つの制御量を出力とするH層回帰型RNN構造を有する。機械学習に用いる学習データは、前述のように学習済モデルによる制御の測定データを用いても良いし、ランダム関数でパラメータを設定した未学習モデルによる制御の測定データでも良い。それ以外にも、オープン駆動による測定データ、PID制御による測定データを用いても良い。尚、RNNの重みと閾値を決定する際、複数の学習データから位置偏差や消費電力などの観点で最適な条件のパラメータを選定しても良い。これは、振動型アクチュエータの所定の速度が得られる条件、すなわち、位相差、周波数、及びパルス幅の組み合わせは無数に存在する為である。
 本実施形態を適用することにより、振動型アクチュエータを操作するパラメータが増えるので、適切な機械学習を行うことで、より細かな制御性能の調整を行うことができる。
 (第15の実施形態)
 図23で示した、第9の実施形態における制御部10の他の実施形態について説明する。
 図36A、図36B、図36Cは、位相差、及び周波数を出力とする学習モデルのZ層回帰型リカレントニューラルネットワーク構造を示すものである。図23の学習済モデル113と学習モデル116は目標速度と位置偏差を入力とし、2つの制御量を出力とするZ層回帰型RNN構造を有しても良い。機械学習に用いる学習データは、前述のように学習済モデルによる制御の測定データを用いても良いし、ランダム関数でパラメータを設定した未学習モデルによる制御の測定データでも良い。それ以外にも、オープン駆動による測定データ、PID制御による測定データを用いても良い。尚、RNNの重みと閾値を決定する際、複数の学習データから位置偏差や消費電力などの観点で最適な条件のパラメータを選定しても良い。これは、振動型アクチュエータの所定の速度が得られる条件、すなわち、位相差、及び周波数の組み合わせは無数に存在する為である。
 本実施形態(Z層回帰型RNN)を適用することにより、図26Cに示したように、位置偏差は、加減速及び停止整定時の全ての領域において改善することができる。
 (第16の実施形態)
 図23で示した、第9の実施形態における制御部10の他の実施形態について説明する。
 図37は、図23の振動型駆動装置から、位置指令部102、位置検出部14などを除いた場合の振動型駆動装置の制御ブロック図に相当する。図37においては、振動型アクチュエータ13を除いたものが、制御装置である。図38は、図37で使用される学習モデル及び学習済モデル制御部が有するRNN構造を示す図である。
 このような形態においても、これまでの実施形態と同様に、学習済モデルを生成することができる。
 (第17の実施形態)
 図23で示した、第9の実施形態における制御部10の他の実施形態について説明する。
 図39は、図23の振動型駆動装置から、位置指令部102、位置検出部14などを除き、位置偏差によるフィードバックループ制御に代え、速度偏差によるフィードバック制御を行う場合の振動型駆動装置の制御ブロック図に相当する。図39においては、振動型アクチュエータ13を除いたものが、制御装置である。図40は、図39で使用される学習モデル及び学習済モデル制御部が有するRNN構造を示す図である。
 このような形態においても、これまでの実施形態と同様に、学習済モデルを生成することができる。
 (第18の実施形態)
 これまでの実施形態において、第1の速度が指令された場合に、第1の制御量を出力するよう機械学習された学習済モデルを有する制御量出力部を制御装置が有しているならば、制御装置から学習部を除いても良い。このような制御装置では学習済モデルは再び機械学習ができないというデメリットが存在するものの、再び機械学習を行う必要性が低い振動型駆動装置においては、学習部が除かれた分、構成が簡素になるというメリットがある。
 これまでの実施形態において、学習済モデルが有していたパラメータ(第1の重み、第2の重み、第3の重み、第2のニューロンの閾値、及び第3のニューロンの閾値)を記憶する記憶部を有するようにしてもよい。そして、学習済モデルは、記憶部が記憶するパラメータによって、学習済モデルが有するパラメータが置換されることによって機械学習されてもよい。記憶部には、ROMなどのメモリが用いられるがこれに限られない。記憶部としては、学習済モデルが有していたパラメータを記憶できるものであればよいからである。
 また、これまでの実施形態において、環境状態を検知する環境センサを有するようにしてもよい。そして、学習済モデルは、前記環境センサによって環境の変化を検知した場合に、機械学習されてもよい。環境センサは、温度センサ及び湿度センサのうちの少なくとも1つであるようにしてもよい。
 (第19の実施形態)
 図23で示した、第9の実施形態における制御部10の他の実施形態について説明する。
 図41は、本発明の他の形態における振動型アクチュエータの制御装置であり、リカレントニューラルネットワークを用いた適応制御を示す図である。尚、機械学習部は不図示であり、本例では必ずしも必要としない。制御部10は、第1の学習済モデル1611、第2の学習済モデル1612、適応制御部108を有する。前記2つの学習済モデルは同じRNN構造を有し、第1の学習済モデルには目標速度と位置偏差が入力され、第2の学習済モデルには検出した検出速度と目標偏差(ゼロ)が入力される。
 制御サンプリング周期毎に、2つの学習済モデルから各々出力される制御量の誤差データに基づいて適応学習部108で誤差勾配が算出される。SGD(確率的勾配降下法)を用いてRNNの重みと閾値のパラメータが更新され、2つの学習済モデルに反映される。つまり、サンプリング周期間のデータを学習データとして用いるのである。
 この制御サンプリング周期毎の演算が駆動中に繰り返されることで、第1の学習済モデルから出力される制御量(位相差、及び周波数)と第2の学習済モデルから出力される制御量とは誤差が最小となるように収束していく。その結果、目標速度に追従し、位置偏差はゼロに近づくようにフィードバック制御を行うことができる。
 このように、本発明のリカレントニューラルネットワークを用いた学習モデルは、駆動中にアクチュエータの特性変化を補償する適応制御にも適用することが可能である。
 (第20の実施形態)
 本発明の学習モデルに用いるニューラルネットワークの他の実施形態について説明する。
 図42A、図42Bは、本発明の他の形態における振動型アクチュエータの制御装置であり、LSTM(Long short-term memory)を用いた学習モデルの構造を示す図である。LSTMはRNN(リカレントニューラルネットワーク)の派生のネットワークであり、内部にループを持ち、情報を持続させることができる。これにより、過去の重み付けを踏まえて未来の重み付けが行われる。LSTMはRNNの内部にループを持つという構造に加えて、忘却ゲート、入力ゲート、出力ゲートを設けられている。特に、忘却ゲートを設けることで、RNNでは出来なかった、長期の連続データの学習が行えるようになる。
 図42Aに本発明の学習モデルにLSTMを適用した場合の構成を示す。入力層からXtと、隠れ層の前時刻t-1の出力Ht-1とがLSTMに入力され、Htが出力層Zに出力される。LSTMの内部には記憶セルが設けられ、内部状態が各時刻で保持される。
 図42BはLSTMの内部構成を示すブロック図である。忘却ゲート、入力ゲート、出力ゲートはそれぞれシグモイド関数である。忘却ゲートは過去の情報をどれだけ保持するかを決め、入力ゲートはどの値を更新するかを判定するものである。また、記憶セルの更新はtanh関数を用いて行われる。これは、記憶セルに加えられる新たな候補値を作成するものである。出力ゲートは、記憶セル候補の要素を選択し次の時刻にどの程度の情報を伝えるか選択する。
 尚、上述したLSTMのモデルは基本形であるため、ここで示したネットワークに限らない。ネットワーク間の結合を変更してもよい。LSTMではなく、QRNN(Quasi Recurrent Neural Network)を用いてもよい。
 (第21の実施形態)
 第1の実施形態では、振動型アクチュエータの制御装置は、撮像装置のオートフォーカス用のレンズ駆動に用いる例を説明したが、本発明の適用例はこれに限定されない。例えば、図43A、図43Bに示すように、手ぶれ補正時のレンズや撮像素子の駆動に用いることもできる。図43Aは、撮像装置60の外観を示す平面図(上面図)である。また、図43Bは、撮像装置60の内部構成の概略図である。
 撮像装置60は、大略的に、本体61と、本体61に対して着脱自在なレンズ鏡筒62とで構成されている。本体61は、レンズ鏡筒62を通過した光が結像した光学像を画像信号に変換するCCDセンサやCMOSセンサなどの撮像素子63と、撮像装置60の全体的な動作を制御するカメラ制御マイコン64を備える。
 レンズ鏡筒62には、フォーカスレンズやズームレンズなどの複数のレンズLが所定位置に配置されている。また、レンズ鏡筒62には、像ぶれ補正装置50が内蔵されており、像ぶれ補正装置50は、円板部材56、円板部材56に設けられた振動子131を有し、円板部材56の中央に形成されている穴部に、像ぶれ補正レンズ65が配置されている。
 像ぶれ補正装置50は、レンズ鏡筒62の光軸と直交する面内で像ぶれ補正レンズ65を移動させることができるように配置される。この場合、本発明の制御装置12を用いて振動子131を駆動することで、鏡筒に固定されている接触体132に対し、振動子131や円板部材56が相対移動し、補正レンズが駆動される。
 また、本願発明の制御装置は、ズーム用レンズの移動のためのレンズホルダの駆動に用いることもできる。したがって、本願発明の制御装置は、レンズ駆動用に、撮像装置に加えて、交換用レンズにも搭載することができる。
 また、第1の実施形態に示した、振動型アクチュエータの制御装置は、自動ステージの駆動にも用いることができる。例えば、図44の斜視図に外観を示すように、顕微鏡の自動ステージの駆動に用いることができる。
 図44の顕微鏡は、撮像素子と光学系を内蔵する撮像部70と、基台上に設けられ、振動型アクチュエータによって移動されるステージ72を有する自動ステージ71と、を有する。被観察物をステージ72上に置いて、拡大画像を撮像部70で撮影する。観察範囲が広範囲に有る場合には、第1または第2の実施形態の制御装置12を用いて振動型駆アクチュエータを駆動することで、ステージ72を移動させる。
 これによって、被観察物を図中のX方向やY方向に移動させて、多数の撮影画像を取得する。不図示のコンピュータにて、撮影画像を結合し、観察範囲が広範囲で、かつ、高精細な1枚の画像を取得できる。
 以上、本発明をその好適な実施形態に基づいて詳述してきた。しかし、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。さらに、上述した各実施形態は本発明の一実施形態を示すものにすぎず、各実施形態を適宜組み合わせることも可能である。
 本発明は上記実施の形態に制限されるものではなく、本発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために以下の請求項を添付する。
 本願は、2020年8月5日提出の日本国特許出願特願2020-133219と2020年11月30日提出の日本国特許出願特願2020-198282を基礎として優先権を主張するものであり、その記載内容の全てをここに援用する。

Claims (37)

  1.  振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータの制御装置であって、
     前記接触体を前記振動子に対して相対的に移動させるための目標速度が入力された場合に、前記接触体を前記振動子に対して相対的に移動させるための制御量を出力するように機械学習された学習済モデルを有する制御量出力部を備えることを特徴とする振動型アクチュエータの制御装置。
  2.  前記学習済モデルは、前記制御量によって前記接触体が前記振動子に対して相対的に移動された場合に検出された検出速度を入力とし、前記制御量を出力とする学習データを使用して機械学習されたことを特徴とする請求項1に記載の振動型アクチュエータの制御装置。
  3.  前記学習済モデルには、前記目標速度が指令された場合に、前記目標速度と、前記目標速度と前記検出速度との差分である速度偏差と、が入力されることを特徴とする請求項1又は2に記載の振動型アクチュエータの制御装置。
  4.  前記学習済モデルは、前記検出速度と、前記目標速度と前記検出速度との差分である速度偏差と同じデータ形式の値と、を入力とし、前記制御量を出力とする学習データを使用して機械学習されたことを特徴とする請求項3に記載の振動型アクチュエータの制御装置。
  5.  前記学習済モデルには、前記目標速度が指令された場合に、前記目標速度と、前記接触体を前記振動子に対して相対的に移動させるために指令された目標位置と、前記制御量によって前記接触体が前記振動子に対して相対的に移動された場合に検出された検出位置と、の差分である位置偏差と、が入力されることを特徴とする請求項1又は2に記載の振動型アクチュエータの制御装置。
  6.  前記学習済モデルは、前記検出速度と、前記目標位置と前記検出位置との差分である位置偏差と同じデータ形式の値と、を入力とし、前記制御量を出力とする学習データを使用して機械学習されたことを特徴とする請求項5に記載の振動型アクチュエータの制御装置。
  7.  PID制御器を有し、
     前記学習済モデルには、前記目標速度が指令された場合に、前記目標速度と、前記PID制御器に前記位置偏差が入力された場合の出力と、が入力されることを特徴とする請求項5又は6に記載の振動型アクチュエータの制御装置。
  8.  PID制御器を有し、
     前記学習済モデルは、前記PID制御器に前記位置偏差が入力された場合の出力を前記制御量に加算した制御量としての第2の制御量によって前記接触体が前記振動子に対して相対的に移動された場合に検出された検出速度を入力とし、前記第2の制御量を出力とする学習データを使用して機械学習されたことを特徴とする請求項5又は6に記載の振動型アクチュエータの制御装置。
  9.  前記制御量は、位相差、周波数、及びパルス幅のうちの少なくともいずれか1つであることを特徴とする請求項1乃至8のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  10.  前記制御量は、位相差であることを特徴とする請求項1乃至8のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  11.  前記制御量は、位相差及び周波数であることを特徴とする請求項1乃至8のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  12.  前記制御量は、位相差、周波数、及びパルス幅であることを特徴とする請求項1乃至8のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  13.  前記学習済モデルは、1つ又は複数の第1のニューロンを有する入力層と、複数の第2のニューロンを有する隠れ層と、及び1つ又は複数の第3のニューロンを有する出力層と、を有するニューラルネットワーク構成を有し、
     前記ニューラルネットワーク構成は、前記第1のニューロンと前記第2のニューロンを結ぶ複数の第1の重みと、前記第2のニューロンと前記第3のニューロンを結ぶ複数の第2の重みと、前記第2のニューロンの閾値と、前記第3のニューロンの閾値と、を有することを特徴とする請求項1乃至12のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  14.  前記学習済モデルは、前記第1の重み、前記第2の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値が最適化されたことを特徴とする請求項13に記載の振動型アクチュエータの制御装置。
  15.  前記学習済モデルは、ランダム関数で設定された前記第1の重み、前記第2の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値が最適化アルゴリズムに基づいて機械学習されることによって最適化されたことを特徴とする請求項14に記載の振動型アクチュエータの制御装置。
  16.  前記学習済モデルは、最適化アルゴリズムに基づいて機械学習された前記第1の重み、前記第2の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値が最適化されることによって機械学習されたことを特徴とする請求項14に記載の振動型アクチュエータの制御装置。
  17.  前記学習済モデルが有していた前記第1の重み、前記第2の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値を記憶する記憶部を有し、
     前記学習済モデルは、前記記憶部が記憶する前記第1の重み、前記第2の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値によって、前記学習済モデルが有する前記第1の重み、前記第2の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値が置換されることによって機械学習されたことを特徴とする請求項13に記載の振動型アクチュエータの制御装置。
  18.  前記学習済モデルは、入力層、隠れ層、出力層、及び、前記隠れ層又は前記出力層からの出力を記憶して、記憶した前記隠れ層又は前記出力層からの出力を前記隠れ層へ出力する状態層を有するリカレントニューラルネットワーク構造を有することを特徴とする請求項1乃至12のいずれか1項に記載の振動型アクチュエータの制御装置。
  19.  前記学習済モデルは、前記リカレントニューラルネットワーク構造として、1つ又は複数の第1のニューロンを有する入力層と、複数の第2のニューロンを有する隠れ層と、1つ又は複数の第3のニューロンを有する出力層と、前記複数の第2のニューロンからの複数の出力又は前記複数の第3のニューロンからの複数の出力を記憶する複数の第4のニューロンを有する状態層と、を有し、
     前記リカレントニューラルネットワーク構造におけるパラメータとして、前記1つ又は複数の第1のニューロンから前記複数の第2のニューロンへの複数の出力に付された複数の第1の重みと、前記複数の第2のニューロンから前記1つ又は複数の第3のニューロンへの複数の出力に付された複数の第2の重みと、前記複数の第4のニューロンからの前記複数の第2のニューロンへの複数の出力に付された第3の重みと、前記第2のニューロンの閾値と、前記第3のニューロンの閾値と、を有することを特徴とする請求項18に記載の振動型アクチュエータの制御装置。
  20.  前記学習済モデルは、前記第1の重み、前記第2の重み、前記第3の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値が最適化されたことを特徴とする請求項19に記載の振動型アクチュエータの制御装置。
  21.  前記学習済モデルは、ランダム関数で設定された前記第1の重み、前記第2の重み、前記第3の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値が最適化アルゴリズムに基づいて機械学習されることによって最適化されたことを特徴とする請求項20に記載の振動型アクチュエータの制御装置。
  22.  前記学習済モデルは、最適化アルゴリズムに基づいて機械学習された前記第1の重み、前記第2の重み、前記第3の重み、前記第2のニューロンの閾値、前記第3のニューロンの閾値が最適化アルゴリズムに基づいて機械学習されることによって最適化されたことを特徴とする請求項20に記載の振動型アクチュエータの制御装置。
  23.  前記学習済モデルが有していた前記第1の重み、前記第2の重み、前記第3の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値を記憶する記憶部を有し、
     前記学習済モデルは、前記記憶部が記憶する前記第1の重み、前記第2の重み、前記第3の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値によって、前記学習済モデルが有する前記第1の重み、前記第2の重み、前記第3の重み、前記第2のニューロンの閾値、及び前記第3のニューロンの閾値が置換されることによって最適化されたことを特徴とする請求項20に記載の振動型アクチュエータの制御装置。
  24.  前記隠れ層は、LSTM(Long short-term memory)構造を有することを特徴とする請求項18乃至23のいずれか1項に記載の振動型アクチュエータの制御装置。
  25.  前記最適化アルゴリズムは、Adam、Momentum、RMSprop、及びSGDのいずれか1つであることを特徴とする請求項15、16、21及び22のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  26.  前記学習済モデルは、前記接触体を前記振動子に対して相対的に移動させる場合以外の場合に、機械学習されたことを特徴とする請求項1乃至25のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  27.  前記学習済モデルは、前記接触体を前記振動子に対して相対的に移動させる場合に、機械学習されたことを特徴とする請求項1乃至25のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  28.  環境状態を検知する環境センサを有し、
     前記学習済モデルは、前記環境センサによって前記環境の変化を検知した場合に、機械学習されたことを特徴とする請求項1乃至25のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  29.  前記環境センサは、温度センサ及び湿度センサのうちの少なくとも1つであることを特徴とする請求項28に記載の振動型アクチュエータの制御装置。
  30.  前記第1の速度を指令する速度指令部と、
     前記第2の速度を検知する速度検出部と、を有することを特徴とする請求項1乃至29のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  31.  前記第1の位置を指令する位置指令部と、
     前記第2の位置を検出する位置検出部と、を有することを特徴とする請求項5乃至8のうちのいずれか1項に記載の振動型アクチュエータの制御装置。
  32.  振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータと、
     請求項1乃至31のうちのいずれか1項に記載の振動型アクチュエータの制御装置と、を有することを特徴とする振動型駆動装置。
  33.  請求項32に記載の振動型駆動装置と、
     前記接触体を前記振動子に対して相対的に移動させることによって駆動されるレンズと、を有することを特徴とする交換用レンズ。
  34.  請求項32に記載の振動型駆動装置と、
     前記接触体を前記振動子に対して相対的に移動させることによって駆動される撮像素子と、を有することを特徴とする撮像装置。
  35.  請求項32に記載の振動型駆動装置と、
     前記接触体を前記振動子に対して相対的に移動させることによって駆動されるステージと、を有することを特徴とする自動ステージ。
  36.  振動子に発生した振動によって、前記振動子と接触する接触体を前記振動子に対して相対的に移動させる振動型アクチュエータの制御量出力方法であって、
     前記接触体を前記振動子に対して相対的に移動させるための第1の速度が指令された場合に、前記接触体を前記振動子に対して相対的に移動させるための第1の制御量によって前記接触体が前記振動子に対して相対的に移動された場合に検知された第2の速度を入力とし、前記第1の制御量を出力とする学習データを使用して機械学習するステップを有することを特徴とする振動型アクチュエータの制御装置の製造方法。
  37.  請求項36に記載の振動型アクチュエータの制御装置の製造方法をコンピュータに実行させるプログラム。
PCT/JP2021/027461 2020-08-05 2021-07-26 振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ WO2022030274A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/153,897 US20230147581A1 (en) 2020-08-05 2023-01-12 Control apparatus for vibration actuator, and vibration driving apparatus, interchangeable lens, imaging apparatus, and automatic stage including same

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2020133219 2020-08-05
JP2020-133219 2020-08-05
JP2020198282 2020-11-30
JP2020-198282 2020-11-30

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US18/153,897 Continuation US20230147581A1 (en) 2020-08-05 2023-01-12 Control apparatus for vibration actuator, and vibration driving apparatus, interchangeable lens, imaging apparatus, and automatic stage including same

Publications (1)

Publication Number Publication Date
WO2022030274A1 true WO2022030274A1 (ja) 2022-02-10

Family

ID=80117330

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/027461 WO2022030274A1 (ja) 2020-08-05 2021-07-26 振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ

Country Status (3)

Country Link
US (1) US20230147581A1 (ja)
JP (1) JP2022031178A (ja)
WO (1) WO2022030274A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022086802A (ja) * 2020-11-30 2022-06-09 キヤノン株式会社 レンズ装置、撮像装置、カメラ装置、制御方法、及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05201564A (ja) * 1992-01-24 1993-08-10 Ricoh Co Ltd 紙送り装置
JPH0778028A (ja) * 1993-06-18 1995-03-20 Masanori Sugisaka 自立走行車
JPH07319507A (ja) * 1994-05-26 1995-12-08 Bridgestone Corp ロボット制御装置
JPH08286550A (ja) * 1995-04-12 1996-11-01 Ricoh Co Ltd 温度制御装置
JP2007283474A (ja) * 2006-04-13 2007-11-01 Takao Soma 脚式ロボットの歩行制御方法
JP2011234603A (ja) * 2010-04-09 2011-11-17 Canon Inc 振動型アクチュエータの制御回路
WO2019065454A1 (ja) * 2017-09-28 2019-04-04 キヤノン株式会社 撮像装置およびその制御方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05201564A (ja) * 1992-01-24 1993-08-10 Ricoh Co Ltd 紙送り装置
JPH0778028A (ja) * 1993-06-18 1995-03-20 Masanori Sugisaka 自立走行車
JPH07319507A (ja) * 1994-05-26 1995-12-08 Bridgestone Corp ロボット制御装置
JPH08286550A (ja) * 1995-04-12 1996-11-01 Ricoh Co Ltd 温度制御装置
JP2007283474A (ja) * 2006-04-13 2007-11-01 Takao Soma 脚式ロボットの歩行制御方法
JP2011234603A (ja) * 2010-04-09 2011-11-17 Canon Inc 振動型アクチュエータの制御回路
WO2019065454A1 (ja) * 2017-09-28 2019-04-04 キヤノン株式会社 撮像装置およびその制御方法

Also Published As

Publication number Publication date
JP2022031178A (ja) 2022-02-18
US20230147581A1 (en) 2023-05-11

Similar Documents

Publication Publication Date Title
CN106357148B (zh) 振动致动器的控制设备和控制方法
CN102859865B (zh) 移动控制装置、移动控制方法以及移动控制电路
JP6667220B2 (ja) 振動型アクチュエータの制御装置とその制御方法、駆動装置、撮像装置、及び自動ステージ
JP4918682B2 (ja) 超音波モータの制御方法、超音波モータ制御装置及び超音波モータを制御するためのプログラム
US9242370B2 (en) Miniature robot having multiple legs using piezo legs having two degrees of freedom
TWI491164B (zh) 驅動一馬達驅動機械系統之方法
JP6579893B2 (ja) 振動型アクチュエータの制御装置と制御方法、駆動装置、撮像装置及び自動ステージ
JP6748135B2 (ja) 機械学習装置、サーボ制御装置、サーボ制御システム、及び機械学習方法
WO2022030274A1 (ja) 振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ
US11759947B2 (en) Method for controlling a robot device and robot device controller
US11762165B2 (en) Lens apparatus, image pickup apparatus, control method, and computer-readable storage medium
CN113747041B (zh) 一种摄像机对焦方法及基于循环神经网络的对焦方法
Yan et al. LSTM-based model predictive control of piezoelectric motion stages for high-speed autofocus
US11696030B2 (en) Vibration type actuator control apparatus, vibration type driving apparatus having the same, interchangeable lens, imaging apparatus, and automatic stage
US11825197B2 (en) Vibration actuator control apparatus, vibration driving apparatus, interchangeable lens, imaging apparatus, and automatic stage
US20230314909A1 (en) High-speed autofocus control
JP2022071832A (ja) 振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ
Ishige et al. Blind bin picking of small screws through in-finger manipulation with compliant robotic fingers
WO2024084992A1 (ja) 量子駆動制御部を備えたアクチュエータ
US20220413453A1 (en) Positioning control device and positioning control method
JP2008178242A (ja) アクチュエータ駆動装置およびカメラ装置
JP3382979B2 (ja) カメラ
JP7016906B2 (ja) 振動型アクチュエータの制御装置、駆動装置、交換用レンズ、撮像装置、自動ステージ、および振動型アクチュエータの制御方法
Čas et al. Neural network position control of XY piezo actuator stage by visual feedback
JP3407365B2 (ja) カメラ

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21853442

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21853442

Country of ref document: EP

Kind code of ref document: A1