WO2021130988A1 - 位置決め制御装置及び位置決め制御方法 - Google Patents

位置決め制御装置及び位置決め制御方法 Download PDF

Info

Publication number
WO2021130988A1
WO2021130988A1 PCT/JP2019/051237 JP2019051237W WO2021130988A1 WO 2021130988 A1 WO2021130988 A1 WO 2021130988A1 JP 2019051237 W JP2019051237 W JP 2019051237W WO 2021130988 A1 WO2021130988 A1 WO 2021130988A1
Authority
WO
WIPO (PCT)
Prior art keywords
adjustment
condition
positioning
unit
parameter
Prior art date
Application number
PCT/JP2019/051237
Other languages
English (en)
French (fr)
Inventor
高野 直人
将哉 木村
英俊 池田
Original Assignee
三菱電機株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 三菱電機株式会社 filed Critical 三菱電機株式会社
Priority to JP2021531147A priority Critical patent/JP6981579B2/ja
Priority to DE112019008005.9T priority patent/DE112019008005T5/de
Priority to KR1020227020059A priority patent/KR20220101152A/ko
Priority to PCT/JP2019/051237 priority patent/WO2021130988A1/ja
Priority to US17/780,036 priority patent/US20220413453A1/en
Priority to CN201980103204.9A priority patent/CN114846427A/zh
Publication of WO2021130988A1 publication Critical patent/WO2021130988A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D3/00Control of position or direction
    • G05D3/12Control of position or direction using feedback
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05KPRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
    • H05K13/00Apparatus or processes specially adapted for manufacturing or adjusting assemblages of electric components
    • H05K13/08Monitoring manufacture of assemblages
    • H05K13/089Calibration, teaching or correction of mechanical systems, e.g. of the mounting head
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/402Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by control arrangements for positioning, e.g. centring a tool relative to a hole in the workpiece, additional detection means to correct position
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/45Nc applications
    • G05B2219/45026Circuit board, pcb

Definitions

  • the present disclosure relates to a positioning control device that controls positioning by a motor.
  • positioning control is performed by driving the motor to drive the position of the machine such as the mounting head by the target distance.
  • the time required for positioning is shortened and the productivity of the device is improved by setting the parameters that define the time-series pattern of the command signal for driving the device, the parameters of the control system, etc. to the optimum values. can do.
  • the moving machine is a machine that easily generates low-rigidity vibration
  • these parameter settings require adjustment by trial and error, and there is a problem that the adjustment work takes time and effort.
  • the time required for the adjustment work, the result of the adjustment, etc. largely depend on the knowledge and experience of the worker, and there is a problem that the quality of the adjustment varies depending on the worker.
  • a technique for solving the above-mentioned problems a technique for setting parameters using a command pattern prepared in advance has been proposed.
  • Patent Document 1 discloses an automatic adjustment method of an electric motor control device that automatically tunes control parameters in feedback control, feedforward control, and the like.
  • the automatic adjustment method disclosed in Patent Document 1 generates a plurality of continuously changing position command patterns for adjustment operation, and when given as a position command value of a position controller, the vibration amplitude of the position deviation waveform is predetermined. Adjustment is performed to increase the response frequency of the position controller and speed controller within the range that does not exceed the value.
  • the present disclosure has been made in view of the above, and an object of the present disclosure is to provide a positioning control device capable of performing a high-performance positioning operation with a short time required for adjustment.
  • the positioning control device is a command in which the operation of the motor in the positioning operation for moving the mechanical load mechanically connected to the motor by the target movement distance is a parameter that can be changed under the operating conditions and the operating conditions.
  • a positioning control device defined by parameters that executes a positioning operation based on an adjustment condition that is one of the operating conditions and a trial parameter that is one of the command parameters, and the motor or mechanical load during the executed positioning operation.
  • a set of an adjustment unit that executes an adjustment that determines one of the command parameters as an excellent parameter corresponding to the adjustment condition based on the evaluation result of the state sensor signal that detects the state of, and an adjustment condition and an excellent parameter corresponding to the adjustment condition.
  • an adjustment record holding unit that holds the adjustment record, and one of the command parameters based on the adjustment record as an estimated excellent parameter corresponding to the unadjusted condition, which is one of the operating conditions different from the adjustment condition held in the adjustment record. It is provided with an estimation unit for determining.
  • FIG. It is a block diagram which shows an example of the structure of the positioning control device in Embodiment 1.
  • FIG. It is a figure which shows an example of the command pattern in Embodiment 1.
  • FIG. It is a figure which shows an example of the relationship between the operation condition and a command parameter in Embodiment 1.
  • FIG. It is a flow figure which shows an example of the adjustment operation in Embodiment 1.
  • FIG. It is a figure which shows an example of the time response of the deviation in Embodiment 1.
  • FIG. It is a flow figure which shows an example of the adjustment operation in Embodiment 1.
  • FIG. It is a figure which shows the configuration example in the case where the processing circuit included in the positioning control device in Embodiment 1 is configured by a processor and a memory.
  • FIG. 1 It is a figure which shows the configuration example in the case where the processing circuit included in the positioning control device in Embodiment 1 is configured by the dedicated hardware. It is a block diagram which shows an example of the structure of the positioning control device in Embodiment 2. It is a figure which illustrates the structure of the operation condition determination part in Embodiment 2.
  • FIG. It is a block diagram which shows an example of the structure of the positioning control device in Embodiment 3. It is a figure which shows an example of the correspondence relationship between the operation condition and a command parameter in Embodiment 3.
  • FIG. It is a flow chart which shows an example of the operation of the positioning control device in Embodiment 3. It is a block diagram which shows an example of the structure of the positioning control device in Embodiment 4.
  • Embodiment 4 It is a block diagram which shows an example of the structure of the adjustment part in Embodiment 4. It is a block diagram which shows an example of the structure of the positioning control device in Embodiment 5. It is a block diagram which shows an example of the structure of the excellent parameter determination part in Embodiment 5. It is a figure which shows an example of the structure of the neural network in Embodiment 5.
  • FIG. 1 is a block diagram showing an example of the configuration of the positioning control device 1000 according to the present embodiment.
  • the positioning control device 1000 includes a command generation unit 2 that determines a command signal 103 based on a trial parameter 105 and an adjustment condition 108, and a control unit 4 that drives a motor 1 based on the command signal 103 to execute a positioning operation. Further, the positioning control device 1000 includes an adjusting unit 7 that executes adjustment and determines an excellent parameter 106 corresponding to the adjustment condition 108. Further, the positioning control device 1000 includes an adjustment record holding unit 10 that holds the adjustment record 111, and an estimation unit 8 that estimates the excellent parameter 106 corresponding to the adjustment condition 108 as the estimated excellent parameter 107 based on the adjustment record 111.
  • the motor 1 generates torque, thrust, etc. by the drive power E output from the control unit 4.
  • Examples of the motor 1 include a rotary servo motor, a linear motor, a stepping motor, and the like.
  • the mechanical load 3 is mechanically connected to the motor 1 and driven by the motor 1.
  • a device that operates by the torque, thrust, or the like generated by the motor 1 and executes the positioning operation of the mechanical load 3 can be appropriately selected.
  • the positioning operation is an operation of moving the mechanical load 3 by a target moving distance.
  • Examples of the machine load 3 include an electronic component mounting machine, a semiconductor manufacturing apparatus, and the like. Further, in the movement of the mechanical load 3 in the positioning operation, the entire mechanical load 3 may be moved, or a part of the movable portion of the mechanical load 3 may be moved.
  • the motor 1 and the mechanical load 3 are referred to as control targets 2000.
  • the control unit 4 Based on the command signal 103, the control unit 4 supplies the drive power E to the motor 1 to drive the motor 1 and cause the motor 1 to follow the command signal 103.
  • the command signal 103 is a command value for the motor 1, and may be, for example, a command value for the position, speed, acceleration, torque, and current for the motor 1.
  • the control unit 4 a configuration can be appropriately adopted in which the position of the motor 1 is made to follow the command signal 103.
  • a feedback control system that calculates the torque or current of the motor 1 based on the PID control may be adopted so that the difference between the detected position of the motor 1 and the command signal 103 becomes small.
  • the positioning control device 1000 may be configured not to include the control unit 4 as a component.
  • a memory, a processor, or the like outside the positioning control device 1000 may drive the motor 1 to follow the command signal 103, as in the control unit 4 of FIG.
  • the state sensor 5 detects the state of at least one of the motor 1 and the mechanical load 3, that is, the state of the controlled object 2000 as the state sensor signal 101.
  • the state quantity include the position, speed, acceleration, current, torque, thrust, etc. of the motor 1.
  • the position, speed, acceleration, etc. of the mechanical load 3 can be mentioned.
  • the state quantity may be all or a part of those exemplified above.
  • the state sensor 5 include an encoder, a laser displacement meter, a gyro sensor, an acceleration sensor, a current sensor, a force sensor, and the like.
  • the state sensor 5 of FIG. 1 will be described as an encoder that detects the position of the motor 1 as a state quantity.
  • the adjustment unit 7 executes a positioning operation based on the adjustment condition 108, which is one of the operating conditions, and the trial parameter 105, which is one of the command parameters. Then, one of the command parameters is determined as the excellent parameter 106 corresponding to the adjustment condition 108 based on the evaluation result 109 by the state sensor signal 101 that detects the state of the motor 1 or the mechanical load 3 at the time of the executed positioning operation.
  • a series of operations by the adjustment unit 7 is referred to as adjustment.
  • the adjustment unit 7 may determine a plurality of trial parameters 105 and perform a positioning operation by each of the adjustment condition 108 and the plurality of trial parameters a plurality of times.
  • a time-series pattern of command values such as position, speed, and acceleration of the motor 1 during the positioning operation is referred to as a command pattern.
  • the command pattern is defined by the adjustment condition 108 and the trial parameter 105.
  • the adjustment condition 108 is a kind of operating condition.
  • the operating condition is a condition that constrains the operation of the motor 1 during the positioning operation, and the operating condition includes at least one numerical parameter that defines the movement of the motor 1. This numerical parameter is called an operation parameter.
  • the driving parameter may include a target travel distance.
  • the target moving distance is a target value of the moving distance of the mechanical load 3 in the positioning operation.
  • the command parameter is a command that specifies the operation of the motor 1 and is a command that is input to the command generation unit 2.
  • the command generation unit 2 determines the command signal 103 based on the command parameters.
  • the control unit 4 drives the motor 1 based on the command signal 103.
  • the trial parameter 105, the excellent parameter 106 described later, the estimated excellent parameter 107 described later, and the like are each a group of command parameters, and these can be said to be names for classifying the command parameters by type.
  • the trial parameter 105 is a kind of command parameter, and is a parameter that can be changed under the adjustment condition 108.
  • the adjustment unit 7 acquires the adjustment condition 108.
  • the adjustment condition 108 may be determined by the operator, or may be determined by an internal or external device of the positioning control device 1000.
  • the adjusting unit 7 determines one or more trial parameters 105 under the adjusting condition 108.
  • the command generation unit 2 acquires the adjustment condition 108 and the determined trial parameter 105, generates the command signal 103, and the control unit 4 executes the positioning operation based on the command signal 103.
  • the adjustment unit 7 executes a positioning operation based on the adjustment condition 108 and the trial parameter 105.
  • the evaluation unit 6 determines the result of evaluating the executed positioning operation based on the above-mentioned state sensor signal 101 as the evaluation result 109.
  • the evaluation unit 6 evaluates the trial parameter 105 used for the positioning operation at the same time by evaluating the positioning operation.
  • the control unit 4 executes a positioning operation based on the combination of the adjustment condition 108 and each of the determined trial parameters 105.
  • the positioning operation that is, the operation in which the evaluation unit 6 evaluates the trial parameter 105 will be described later.
  • the adjustment unit 7 acquires the evaluation result 109. Then, based on the acquired evaluation result 109, one of the command parameters is determined as the excellent parameter 106 corresponding to the adjustment condition 108.
  • the excellent parameter 106 is a kind of command parameter.
  • the command parameter that causes the evaluation result 109 to execute a good positioning operation may be determined as the excellent parameter 106. In such a case, the excellent parameter 106 changes depending on the evaluation method of the evaluation unit 6, and the performance required for the positioning operation can be selected by setting the evaluation method of the evaluation unit 6 to a desired method. ..
  • the adjusting unit 7 may determine one of the command parameters as the excellent parameter 106 based on the evaluation result 109.
  • the trial parameter 105 having the best evaluation result 109 of the positioning operation executed in the adjustment may be determined as the excellent parameter 106. Further, as an example, two may be selected in which the evaluation result 109 of the positioning operation executed in the adjustment is good, and an intermediate value between them may be determined as the excellent parameter 106.
  • the adjusting unit 7 executes the positioning operation once or a plurality of times, and acquires the evaluation result 109 for each of the positioning operations.
  • the pair of the adjustment condition 108 and the determined excellent parameter 106 is held in the adjustment record holding unit 10 as the adjustment record 111.
  • an operation of associating the adjustment condition 108 with the excellent parameter 106 will be illustrated. These may be associated based on the input timing. For example, the adjustment condition 108 and the excellent parameter 106 input immediately after the adjustment condition 108 is input may be associated with each other as a set. Further, both the adjustment condition 108 and the excellent parameter 106 may be associated with each other by providing an identifier.
  • the estimation unit 8 acquires the unadjusted condition 110.
  • the unadjusted condition 110 is a kind of operating condition.
  • the unadjusted condition 110 may be an operating condition different from the adjustment condition 108 held in the adjustment record holding unit 10.
  • the estimation unit 8 further determines one of the command parameters as the estimated excellent parameter 107 corresponding to the unadjusted condition 110 based on the adjustment record 111.
  • the estimated excellent parameter 107 is a kind of command parameter.
  • the excellent parameter 106 is determined by the adjusting unit 7 by executing the adjustment, and as an example, it may be a command parameter for executing a positioning operation that gives a good evaluation result 109 under the adjustment condition 108.
  • the estimated excellent parameter 107 is determined by the estimation unit 8 by estimation, with one of the command parameters as the estimated excellent parameter 107 corresponding to the unadjusted condition 110.
  • the estimation unit 8 may determine one of the command parameters as the estimation excellent parameter 107 based on the adjustment record 111, and various methods can be taken.
  • one of the command parameters for which a good evaluation result 109 can be obtained may be estimated and determined as the estimated excellent parameter 107.
  • one of the command parameters that seems to give the best evaluation result 109 may be estimated and determined as the estimated excellent parameter 107.
  • command parameters that are expected to give a good evaluation result 109 may be selected in order from the highest one, and the average value thereof may be determined as the estimated excellent parameter 107.
  • the unadjusted condition 110 is given from the outside, but a component for determining the unadjusted condition 110 may be provided inside the positioning control device 1000.
  • the estimated excellent parameter 107 and the unadjusted condition 110 are input to the command generation unit 2, but the estimated excellent parameter 107 and the unadjusted condition 110 are It does not necessarily have to be input to the command generation unit 2.
  • it may be configured to be output to the outside, or it may be configured to be held by the adjustment record holding unit 10.
  • FIG. 2 is a diagram showing an example of a command pattern in the present embodiment.
  • the horizontal axis of FIGS. 2 (a) to 2 (d) is time.
  • the vertical axis of each of FIGS. 2 (a) to 2 (d) shows the position, speed, acceleration, and jerk of the motor 1, and these are command signals 103.
  • the velocity, acceleration, and jerk are the first derivative, the second derivative, and the third derivative of the position of the motor 1, respectively.
  • the intersection of the horizontal axis and the vertical axis is time 0 on the horizontal axis, which is the command start time when the evaluation operation is started.
  • the command pattern in FIG. 2 is divided into a first section to a seventh section in order from the time 0 when the command starts to the end time.
  • n be a natural number from 1 to 7, and let the time length of the nth interval be the nth time length Tn.
  • the seven parameters from the first time length T1 to the seventh time length T7 are set as one trial parameter 105. That is, one set of seven parameters is set as one trial parameter 105.
  • the magnitudes of acceleration in the second section and the sixth section are Aa and Ad, respectively, and these are constant within the section.
  • the magnitude Aa of the acceleration and the magnitude Ad of the acceleration are dependent variables of the trial parameter 105 and have no degree of freedom in setting.
  • the command signal 103 since it is assumed that the command signal 103 is shown in time series as the command pattern, the numerical value of the command pattern at each time is called the command signal 103.
  • the command signal 103 at the time t (0 ⁇ t ⁇ T1) in the first section can be calculated as follows. Acceleration A1, velocity V1 and position P1 are obtained by integrating each of jerk, acceleration A1 and velocity V1 in time from time 0 in the first section to time t in the first interval. Then, since the acceleration increases at a constant rate in the first section and reaches the acceleration magnitude Aa at time T1, the jerk in the first section is a value obtained by dividing the acceleration magnitude Aa by T1. .. From the above, the acceleration A1, the velocity V1, and the position P1 can be calculated from the equations (1) to the equations (3), respectively.
  • the command signal 103 at the time t (T1 ⁇ t ⁇ T1 + T2) in the second section, that is, the acceleration A2, the velocity V2, and the position P2 is as in the first section from the equations (4) to (6). Can be calculated.
  • the command signal 103 at the time t (T1 + T2 ⁇ t ⁇ T1 + T2 + T3) in the third section, that is, the acceleration A3, the velocity V3, and the position P3 is as in the first section from equations (7) to (9). Can be calculated.
  • the command signal 103 at the time t (T1 + T2 + T3 ⁇ t ⁇ T1 + T2 + T3 + T4) in the fourth section, that is, the acceleration A4, the velocity V4, and the position P4 is as in the first section from the equations (10) to (12). Can be calculated to.
  • the command signal 103 at the time t (T1 + T2 + T3 + T4 ⁇ t ⁇ T1 + T2 + T3 + T4 + T5) in the fifth section that is, the acceleration A5, the velocity V5, and the position P5 are the same as in the first section, as in equations (13) to (15). Can be calculated.
  • the command signal 103 at the time t (T1 + T2 + T3 + T4 + T5 ⁇ t ⁇ T1 + T2 + T3 + T4 + T5 + T6) in the sixth section that is, the acceleration A6, the velocity V6, and the position P6 is as in the first section from equations (16) to (18). Can be calculated.
  • the command signal 103 at the time t (T1 + T2 + T3 + T4 + T5 + T6 ⁇ t ⁇ T1 + T2 + T3 + T4 + T5 + T6 + T7) in the seventh section that is, the acceleration A7, the velocity V7, and the position P7 are the same as in the first section from equations (19) to (21). Can be calculated.
  • the jerk is a constant value of non-zero. That is, the first time length T1, the third time length T3, the fifth time length T5, and the seventh time length T7 specify the time when the jerk becomes a non-zero constant value.
  • the non-zero constant value means a constant value larger than 0 or a constant value smaller than 0.
  • the size of the jerk can be set as the trial parameter 105 instead of the time length Tn. For example, when the size of the jerk in the first section is defined as J1, the first time length T1 and the jerk J1 have a relationship as shown in equation (24).
  • the trial parameter 105 may be any one that determines the command pattern by the trial parameter 105 and the adjustment condition 108, and as illustrated here, a plurality of options are selected even under the same adjustment condition 108. There can be.
  • the method of selecting the trial parameter 105 is not limited to the method described above.
  • the maximum acceleration of the motor 1 is determined by determining the operating conditions and the command parameters. That is, the form of FIG.
  • the operating conditions and the command parameters define the maximum value of the acceleration of the motor 1 during the positioning operation.
  • the maximum acceleration of the motor is often determined by the specifications of the motor, and can be easily adjusted by adopting the above configuration.
  • FIG. 3 is a diagram showing an example of the relationship between the operating conditions and the command parameters in the present embodiment.
  • the operating conditions shown in FIG. 3 are the adjusted condition 108 and the unadjusted condition 110, and the command parameters shown in FIG. 3 are the excellent parameter 106 and the estimated excellent parameter 107.
  • the horizontal axis of FIG. 3 indicates the target movement distance, which is one of the driving parameters.
  • the vertical axis of FIG. 3 is a command parameter.
  • Adjustment records 111 are plotted in FIGS. 3 (a) and 3 (b). That is, in FIGS. 3A and 3B, the adjustment condition 108 and the excellent parameter 106 corresponding to the adjustment condition 108 are plotted using a fill symbol, that is, a black circle symbol.
  • the nth adjustment condition 108 is set as the target movement distance D (n) .
  • the jth time length at the target movement distance D (n) be Tj (n) .
  • n is an integer of 3 or more
  • j is an integer of 1 to 7.
  • Tj (n) is the jth parameter of the nth excellent parameter 106, that is, the jth jth time length in the example of FIG. As described above, in the example of FIG. 2, it is assumed that seven time lengths constitute one command parameter.
  • FIG. 3 shows only the jth parameter of the command parameter as the excellent parameter 106.
  • each of the plurality of parameters of the command parameter can be plotted in the same manner.
  • the plot is performed in a multidimensional space having coordinate axes for each of the operating parameters instead of the plot on the two-dimensional plane as shown in FIG. You may.
  • Ln be the adjustment record 111, which is a set of the nth adjustment condition 108 and the nth excellent parameter 106.
  • the nth adjustment record Ln can be written as a set of the nth target movement distance D (n) and the nth excellent parameter 106 as in Eq. (25).
  • FIG. 3 shows five adjustment records 111 from the n-2nd to the n + 2nd, but the number of data points of the adjustment record 111 may be 1 or more, and 2 or more. It is preferable to have.
  • the estimated excellent parameter Tj * is plotted using a hollow, that is, a white circle symbol.
  • the estimation unit 8 may estimate the estimated excellent parameter Tj * by performing linear interpolation as in Eq. (26) based on the adjustment record 111.
  • the estimated excellent parameter Tj * is determined by a linear linear approximation equation using the adjustment record Ln and the adjustment record Ln + 1 in the vicinity of the unadjusted condition D *.
  • the estimation unit 8 estimates the estimated excellent parameter 107 by using a linear interpolation function that approximates the operating parameter and the excellent parameter 106 as inputs and outputs, respectively. Further, the estimation unit 8 may perform estimation by interpolation using a P-order function which is an approximate polynomial of degree P instead of the linear interpolation function as in Eq. (27). Using the sum symbol ⁇ , equation (27) can be described as equation (28).
  • the aj (u ) in the equation (28) is a constant determined by the adjustment record 111, the boundary condition, and the like.
  • the estimated excellent parameter 107 may be estimated by using approximation by Lagrange interpolation, spline interpolation, or the like.
  • the above is an example of an operation in which the estimation unit 8 estimates the estimated excellent parameter 107 as a command parameter whose positioning control performance is excellent under the unadjusted condition 110 based on the adjustment record 111.
  • the operation parameter of the adjustment condition 108 is only the target movement distance is shown, but an operation parameter other than the target movement distance may be added.
  • Examples of the operation parameters include a start position, a stop position, and the like of the positioning operation of the mechanical load 3. If the start position, stop position, etc. of the operation are changed while the target movement distance is the same, the characteristics of the mechanical load 3 change, and the magnitude of the amplitude of the generated vibration, the frequency of the generated vibration, and the damping of the generated vibration The properties may change and it may be necessary to readjust the command parameters. In other words, the start position, stop position, etc. of the positioning operation of the mechanical load 3 affect the evaluation result 109 of the positioning operation, that is, the superiority of the positioning operation.
  • the estimation unit 8 may calculate the maximum acceleration in all the positioning operations executed based on the adjustment condition 108 included in the adjustment record 111 and the excellent parameter 106 corresponding to the adjustment condition 108. .. Then, the value of the maximum acceleration in the positioning operation executed based on the unadjusted condition 110 and the estimated excellent parameter 107 corresponding to the unadjusted condition 110 is smaller than the calculated value. , The estimated good parameter 107 may be determined. By determining the estimated excellent parameter 107 in this way, the combination of the unadjusted condition 110 that generates an unrealizable thrust or torque and the estimated excellent parameter 107 can be excluded from the estimation result by the estimation unit 8. it can. Then, under the operating conditions, it is possible to efficiently search for the command parameter for executing the positioning operation that obtains a good evaluation result 109 by combining adjustment and estimation.
  • the operating parameters the magnitude of inertia of the machine load 3, the ambient temperature, etc. may be adopted.
  • the inertia of the machine load 3 is determined by the mass of the machine and the like.
  • the disturbance of the positioning control device 1000 may change depending on the inertia, the ambient temperature, and the like, which may affect the performance of the positioning operation.
  • a device capable of performing high-performance positioning control corresponding to each operation parameter may be configured by adopting a numerical value affecting the control performance as an operation parameter constituting the adjustment condition 108.
  • the disclosure of the present embodiment has been described as an example in which the mechanical load 3 moves linearly and the positioning control device 1000 controls the linear motion type positioning.
  • the movable portion of the mechanical load 3 rotates.
  • the angle, the angular velocity, and the angular acceleration may be used instead of the position, the velocity, and the acceleration, respectively.
  • the adjustment condition 108 may be created for all combinations of the types of operation parameters and the possible values.
  • the data stored in a state in which the numerical values obtained when the independent variable is changed in various ways can be retrieved in correspondence with the independent variable is referred to as a table.
  • a storage location for example, a storage device capable of retrieving data can be mentioned.
  • the main body that supplies the adjustment condition 108 may be, for example, a component such as the operation condition determination unit 11 shown in FIG.
  • FIG. 4 is a flow chart showing an example of the adjustment operation in the present embodiment.
  • the adjusting unit 7 sets the total number of adjustments M in step S101. M may be the total number of adjustment conditions 108.
  • the adjustment unit 7 increments the number of adjustments k being executed. That is, k is incremented by 1.
  • step S104 the adjusting unit 7 reads out the kth adjustment condition 108 out of the M adjustment conditions 108.
  • step S105 the adjustment unit 7 executes the adjustment described later under the k-th adjustment condition 108, and sets the excellent parameter 106 corresponding to the k-th adjustment condition 108 as the k-th excellent parameter. Determined as 106.
  • step S106 the adjustment record holding unit 10 associates the k-th adjustment condition with the k-th excellent parameter 106 and holds them as the adjustment record 111.
  • step S107 the adjusting unit 7 determines whether or not k is M or more. If it is determined in step S107 that k is less than M, the process proceeds to step S103. Then, in step S107, the operation flow from step S103 to step S107 is repeatedly executed until k is determined to be M or more.
  • step S107 if it is determined in step S107 that k is M or more, the adjustment work for all the adjustment conditions 108 is completed.
  • the adjustment record holding unit 10 sets the adjustment record 111 in which the adjustment condition 108 and the excellent parameter 106 corresponding to the adjustment condition 108 are combined, for all of the M adjustment conditions 108. It will be in a state of holding.
  • FIG. 5 is a diagram showing an example of the time response of the deviation in the present embodiment.
  • the deviation is the difference between the target moving distance and the position of the motor 1.
  • the position of the motor 1 is detected as a state sensor signal 101 by the state sensor 5.
  • 5 (a) to 5 (c) show time waveforms of deviations in positioning operation based on different trial parameters 105, respectively.
  • the command generation unit 2 generates the command signal 103 based on the trial parameter 105 and the control unit 4 executes the positioning operation based on the generated command signal 103
  • the executed positioning operation is referred to as the trial parameter 105. It is called a positioning operation based on.
  • the trial parameter 105 may be composed of a plurality of parameters, just as one trial parameter 105 is composed of seven time lengths.
  • the allowable width IMP which is a reference for the accuracy of positioning control, is determined in advance when detecting the completion time of positioning. Then, the time from the start of the positioning control until the magnitude of the deviation first becomes equal to or less than the allowable width IMP is referred to as a settling time.
  • the settling time may be longer than the end time T1 + T2 + T3 + T4 + T5 + T6 + T7 at which the command pattern ends, but the settling time may be shorter than the end time due to the influence of mechanical vibration or the like.
  • the settling time is Tst1, and after the settling time Tst1, the magnitude of the deviation does not exceed the allowable width IMP until the amplitude converges.
  • the settling time is Tst2, and after the settling time Tst2, the magnitude of the deviation exceeds the permissible width IMP once before the amplitude converges.
  • the settling time is Tst3, and after the settling time Tst3, the magnitude of the deviation does not exceed the allowable width IMP until the amplitude converges.
  • the settling time Tst3 is smaller than the settling time Tst1 and larger than the settling time Tst2 (Tst2 ⁇ Tst3 ⁇ Tst1). It is required that the deviation does not exceed the allowable width IMP after the settling time and that the positioning time, which is the time from the start of the positioning operation until the deviation becomes smaller than the predetermined value, is shortened. And. Then, under the same adjustment condition 108, it is assumed that the three positioning operations shown in FIGS. 5 (a) to 5 (c) are executed. In such a case, the operation example of FIG. 5C has the highest control performance, and the trial parameter 105 in which the positioning operation of FIG. 5C is executed may be determined as the excellent parameter 106.
  • the evaluation result 109 may be determined based on the positioning time.
  • the positioning time starts from the start time of the positioning operation, but the starting point is not limited to such a case.
  • the starting point may be a time point before or after a certain time from the start time point of the positioning operation.
  • the evaluation unit 6 combines the settling time and the overshoot information which is information on whether or not the magnitude of the deviation exceeds the permissible width IMP between the time when the positioning time elapses and the time when the predetermined time elapses.
  • the evaluation result may be determined.
  • the trial parameter 105 that determines the evaluation result 109 based on the overshoot information and executes the operation in which the magnitude of the deviation exceeds the allowable width IMP after the completion of the positioning operation can be selected as the excellent parameter 106.
  • the sex can be reduced. Further, it is possible to reduce the possibility that the trial parameter 105 for executing the positioning operation having a large deviation vibration amplitude is selected as the excellent parameter 106.
  • the evaluation unit 6 outputs the evaluation function E of the equation (29) as an evaluation result, and the adjustment unit 7 executes adjustment with the aim of minimizing the evaluation function E, assuming that the smaller the evaluation function E is, the higher the control performance is. You may. Further, the reciprocal of Eq. (29) may be used as the evaluation function, and the larger the evaluation function, the higher the control performance, and the adjustment may be performed with the goal of maximizing the evaluation function.
  • Tst of the first term on the right side of equation (29) is the settling time.
  • L ⁇ Pe in the second term is a penalty term determined based on the overshoot information.
  • Pe in the second term is a numerical value indicating the presence or absence of a penalty. For example, it is set to 1 when the magnitude of the deviation exceeds the allowable range by the time when a certain time elapses from the completion of the positioning operation, and when it does not exceed May be 0.
  • L in the second term is a positive constant that determines the magnitude of the penalty.
  • the configuration of the evaluation unit 6 is not limited to the above.
  • the evaluation result 109 may be calculated using the time integral value of the deviation and the time integral value of the thrust of the motor 1. Further, an optimum regulator for calculating the evaluation result 109 by combining these may be used. Further, the maximum value of the excess amount of the position with respect to the target movement distance may be used as an index from the time when the magnitude of the deviation becomes equal to or less than the allowable range for the first time until a predetermined time elapses. Further, the evaluation result 109 may be determined based on the size of the overshoot, which is a distance that exceeds the target movement distance and goes too far to the side opposite to the start point of the positioning operation when viewed from the end point of the positioning operation.
  • the positioning control device 1000 may be configured not to include the evaluation unit 6 as a component.
  • a memory, a processor, a processor, or the like outside the positioning control device 1000 may evaluate the positioning operation, that is, the trial parameter 105, based on the state sensor signal 101, as in the evaluation unit 6 of FIG.
  • FIG. 6 is a flow chart showing an example of the adjustment operation of the present embodiment.
  • the adjustment unit 7 sets the total number of trials V, which is the total number of trials of the positioning operation to be executed under one adjustment condition 108, in step S111.
  • V trial parameters 105 are prepared in advance, and when the i-th positioning operation is executed, the i-th trial parameter 105 is selected from the prepared V trial parameters 105. It is supposed to be set.
  • a brute force method called grid search can be mentioned.
  • An example of grid search for the trial parameter 105 composed of seven time lengths illustrated with reference to FIG. 2 of the present embodiment will be described.
  • the value to be set may include 0.
  • the first time length T1 is 0, the time from the start of operation until the acceleration of the command signal 103 reaches the maximum acceleration becomes 0.
  • Similar to the first time length T1 for the six from the second time length T2 to the seventh time length T7, some values that can be taken by each parameter are set discretely. Note that the seven time lengths cannot take negative values.
  • the combination of the set values is set in advance as the trial parameter 105.
  • the number of combinations is 3 to the 7th power of 2187
  • the number of trial parameters 105 is 2187.
  • step S113 the adjusting unit 7 increments the number of trials i. That is, the number of trials i is increased by 1.
  • step S114 the adjusting unit 7 determines the trial parameter 105 for executing the i-th positioning operation trial.
  • step S115 the adjusting unit 7 reads out the i-th trial parameter 105 from the V trial parameters 105 set in step S111.
  • the command generation unit 2 determines the command signal 103 based on the adjustment condition 108 and the read trial parameter 105.
  • step S115 the control unit 4 determines the drive power E based on the command signal 103 and the state sensor signal 101, and executes the positioning operation.
  • step S115 the state sensor 5 determines the i-th state sensor signal 101.
  • step S116 the evaluation unit 6 determines the i-th evaluation result 109, and the adjustment unit 7 acquires the i-th evaluation result 109.
  • the i-th evaluation result 109 is an evaluation result for the i-th positioning operation.
  • step S117 the adjusting unit 7 executes a determination as to whether or not i is V or more. If the adjusting unit 7 determines in step S117 that i is smaller than V, the adjustment unit 7 proceeds to step S113.
  • step S117 the operation flow from step S113 to step S117 is repeatedly executed until i is determined to be V or more, and the evaluation corresponding to each of the first to Vth positioning operations and the positioning operations is performed. The determination of result 109 is executed.
  • step S118 the adjusting unit 7 selects the trial parameter 105 having the best positioning control performance from the V evaluation results 109, and determines it as the excellent parameter 106 under the adjusting condition 108. As described with reference to FIG. 4, the adjusting unit 7 executes adjustment for each of the adjustment conditions 108 to obtain the excellent parameter 106. Therefore, in the operation according to the flow chart shown in FIG. 4, a total of M excellent parameters 106 are obtained.
  • the trial parameter 105 in which the evaluation result 109 corresponding to one adjustment condition 108 is the best may be determined as the excellent parameter 106. ..
  • the adjustment method is not limited to the above, and the excellent parameter 106 corresponding to the adjustment condition may be determined by a different procedure.
  • the trial parameter 105 that executed the best positioning operation is selected as the excellent parameter 106, but it is not always necessary to select from the trial parameters 105.
  • the command parameter that gives the best positioning operation may be selected.
  • a method of adjusting the command parameters that define the command pattern so that the performance of the positioning control is excellent has been described.
  • the control gain used when the control unit 4 executes the feedback control or the feedforward control may be included in the command parameters, and the optimum value of the control gain may be searched for by adjustment.
  • FIG. 7 is a diagram showing a configuration example in the case where the processing circuit included in the positioning control device 1000 according to the present embodiment is configured by the processor 10001 and the memory 10002.
  • the processing circuit is composed of the processor 10001 and the memory 10002
  • each function of the processing circuit of the positioning control device 1000 is realized by software, firmware, or a combination of software and firmware.
  • Software, firmware, etc. are described as programs and stored in the memory 10002.
  • each function is realized by the processor 10001 reading and executing the program stored in the memory 10002. That is, the processing circuit includes a memory 10002 for storing a program in which the processing of the positioning control device 1000 is eventually executed. It can also be said that these programs cause the computer to execute the procedure and method of the positioning control device 1000.
  • the processor 10001 may be a CPU (Central Processing Unit), a processing device, an arithmetic unit, a microprocessor, a microcomputer, a DSP (Digital Signal Processor), or the like.
  • the memory 10002 is a non-volatile or volatile semiconductor memory such as RAM (Random Access Memory), ROM (Read Only Memory), flash memory, EPROM (Erasable Programmable ROM), EEPROM (registered trademark) (Electrically EPROM), etc. May be.
  • the memory 10002 may be a magnetic disk, a flexible disk, an optical disk, a compact disk, a mini disk, a DVD (Digital Versatile Disc), or the like.
  • FIG. 8 is a diagram showing a configuration example in the case where the processing circuit included in the positioning control device 1000 according to the present embodiment is configured by dedicated hardware.
  • the processing circuit 10003 shown in FIG. 8 includes, for example, a single circuit, a composite circuit, a programmed processor, a parallel programmed processor, an ASIC (Application Specific Integrated Circuit), and the like. FPGA (Field Programmable Gate Array) or a combination thereof may be used.
  • the function of the positioning control device 1000 may be realized by the processing circuit 1003 for each function, or a plurality of functions may be collectively realized by the processing circuit 1003.
  • the positioning control device 1000 and the control target 2000 may be connected via a network. Further, the positioning control device 1000 may exist on the cloud server.
  • FIG. 9 is a block diagram showing an example of the configuration of the positioning control device 1000a according to the present embodiment.
  • the positioning control device 1000a includes an operating condition determination unit 11 in addition to the components of the positioning control device 1000 of the first embodiment.
  • the operating condition determination unit 11 determines either or both of the adjustment condition 108 and the unadjusted condition 110 based on the adjustment record 111 or the machine specifications of the control target 2000. More specifically, the operating parameter of the adjusted condition 108 or the operating parameter of the unadjusted condition 110 is determined.
  • the same or corresponding components as those in FIG. 1 are designated by the same symbols as those in FIG.
  • the adjustment range may be a range of operating parameters.
  • the range of multiple operating parameters is set as the adjustment range, and the range defined in the multidimensional space having as many dimensions as the number of operating parameters is set as the adjustment range. May be good.
  • the operation condition determination unit 11 determines the value of the operation parameter of the adjustment condition 108 or the unadjusted condition 110 within the adjustment range.
  • the set adjustment condition 108 may be held as a table. For example, the operating parameters of a plurality of adjustment conditions 108 may be set to be arranged at equal intervals within the adjustment range.
  • FIG. 10 is a diagram illustrating the configuration of the operating condition determination unit 11 in the present embodiment.
  • the operating condition determination unit 11 shown in FIG. 10A includes an accuracy estimation unit 1101, a machine specification 1102, and a determination unit 1103.
  • the machine specifications 1102 the machine specifications for the motor 1, the machine load 3, and the like are stored.
  • Examples of the machine specifications stored as the machine specifications 1102 include the maximum speed, the maximum acceleration, the maximum torque of the motor 1, the inertia of the machine load 3, and the like.
  • the machine specifications 1102 may be, for example, retrievable information recorded in a storage device.
  • the accuracy estimation unit 1101 determines the degree to which it is easy or difficult for the estimation unit 8 to estimate the estimation excellent parameter 107 with high accuracy for a part or all of the adjustment range. Alternatively, it is estimated based on the adjustment record 111.
  • the range in which the estimated excellent parameter 107 can be easily estimated with high accuracy is defined as a range in which the difference between the estimated excellent parameter 107 and the excellent parameter 106 is smaller than that of other parts in the adjustment range. May be good.
  • the above-mentioned estimated excellent parameter 107 is an estimated excellent parameter 107 estimated by the estimation unit 8 with one operating condition included in the range as the unadjusted condition 110.
  • the excellent parameter 106 is an excellent parameter 106 determined by the adjusting unit 7 by executing adjustment with the same operating conditions as the above as the trial parameter 105. Further, for example, consider a case where the estimation unit 8 executes estimation by using linear interpolation as in Eq. (22).
  • the accuracy estimation unit 1101 may set the portion of the adjustment range in which the relationship between the operation parameter of the adjustment condition 108 and the excellent parameter 106 is close to the linear relationship as the high accuracy range based on the adjustment record 111. .. Further, a low precision range may be used for a portion that is significantly different from the linear relationship. In this way, the accuracy estimation unit 1101 may set the high accuracy range and the low accuracy range.
  • the determination unit 1103 may increase the density of the adjustment condition 108 in a range where it is difficult to predict with high accuracy. Further, the density of the unadjusted condition 110 may be increased in a range where prediction with high accuracy is easy.
  • the density of the adjusted condition 108 or the unadjusted condition 110 may be the density of the operating parameter.
  • the density of the operating parameters is the degree of the number of operating parameters arranged within a certain range of the values of the operating parameters. That is, when the number of operating parameters arranged within a certain range of operating parameter values is large, it is said that the density of operating parameters is high.
  • the driving parameter is the target travel distance.
  • the mechanical load 3 has a resonance frequency.
  • the speed and acceleration of the motor 1 are limited to the maximum speed or less and the maximum acceleration or less, respectively.
  • the mechanical load 3 accelerates at the maximum acceleration from the stopped state (zero speed state) to the maximum speed state, then moves at the maximum speed for the longest possible time, and then moves at the maximum speed for as long as possible, and then the maximum acceleration until it stops.
  • a positioning operation is performed to decelerate with.
  • the shape of the speed pattern (command pattern) showing the speed in time series is ideally an isosceles trapezium shape.
  • the vicinity of the target movement distance where vibration is likely to occur may be set as a low-precision range in which high-precision estimation of the estimation excellent parameter 107 is difficult.
  • the above is an example of the operation of the accuracy estimation unit 1101.
  • the range of operating conditions in which the mechanical load 3 is likely to operate according to an analytical formula may be defined as a high-precision range in which the estimated excellent parameter 107 can be easily estimated.
  • the number of the low precision range and the number of the high precision range may be one or a plurality, and the high precision range and the low precision range may be mixed in the adjustment range.
  • the widths of the low-precision range, high-precision range, and the like may be the same or different from each other.
  • a low precision range or a high precision range may be set for all of the plurality of operation parameters, or a low precision range or a high precision range may be set for some of them.
  • the estimation unit 8 sets the adjustment condition 108 or the unadjusted condition 110 according to the difficulty in estimating the estimated excellent parameter 107. can do. Therefore, it is possible to select a range in which it is effective to execute the adjustment and execute the adjustment.
  • the operating condition determination unit 11 shown in FIG. 10B includes an adjustment range determination unit 1104 in place of the accuracy estimation unit 1101 shown in FIG. 10A.
  • the adjustment condition 108 or the unadjusted condition 110 is determined with respect to the adjustment range given in advance, but in the configuration example shown in FIG. 10B, the adjustment range determination unit 1104 determines.
  • the adjustment range is determined based on the machine specifications 1102 or the adjustment record 111.
  • the operation of the adjustment range determination unit 1104 to determine the adjustment range is illustrated below. It is assumed that Vmax, which is the maximum speed of the motor 1, and Amax, which is the maximum acceleration of the motor 1, are stored as machine specifications 1102. The mechanical load 3 accelerates at the maximum acceleration from the stopped state (zero speed state) to the maximum speed state, then moves at the maximum speed for the longest possible time, and performs a positioning operation of decelerating at the maximum acceleration. And. It is assumed that the adjustment range is given by the target movement distance which is an operation parameter, and the target movement distance Dmax is the adjustment range from the target movement distance 0. It is assumed that the adjustment range determination unit 1104 determines the adjustment range by determining Dmax, which is the maximum value of the target movement distance.
  • Vmax 2 / Amax accelerates at maximum acceleration, decelerates at maximum acceleration, and maximizes at the highest point of speed in point-to-point positioning of motors where maximum speed and maximum acceleration are limited. This is the target movement distance when the speed is reached.
  • the target moving distance is less than Vmax 2 / Amax, the shape of the speed pattern (command pattern) becomes triangular, there is no section for moving at the maximum speed Vmax, and vibration is likely to occur. Therefore, it can be expected that the positioning time can be significantly shortened by performing the adjustment. That is, the effect of adjustment is large.
  • the adjustment range determination unit 1104 may determine the adjustment range using the equation (30) as follows.
  • the adjustment range determination unit 1104 may set C in the formula (30) to, for example, between 0.5 and 3, and set the range in which the target movement distance in the formula (30) is 0 to Dmax as the adjustment range. More preferably, C in the formula (30) may be set to 1, and the range in which the target moving distance in the formula (30) is 0 to Dmax may be set as the adjustment range. In this way, Vmax 2 / Amax can be used as an index value, and a case where the value is less than the same value as this index value can be set as the adjustment range. That is, the adjustment range may be set to a range in which the effect of the adjustment is large, and the adjustment time may be further shortened.
  • the determination unit 1103 sets the adjustment condition 108 in the adjustment range defined by the adjustment range determination unit 1104.
  • the adjustment condition 108 or the unadjusted condition 110 may be set at equal intervals within the adjustment range. Further, based on the adjustment record 111, a region in which the excellent parameter 106 corresponding to the adjustment condition 108 is abruptly changed with respect to the operation parameter of the adjustment condition 108 may be determined as the adjustment range. In other words, based on the adjustment record 111, a range of operating conditions in which the change in the excellent parameter 106 is large depending on the adjustment condition 108 may be defined as the adjustment range. Then, the range of operating conditions where the effect of shortening the time required for the positioning operation by the adjustment or the effect of reducing the vibration by the adjustment is large may be defined as the adjustment range.
  • the operation condition determination unit 11 for determining the adjustment condition 108 or the unadjusted condition 110 based on the machine specifications of the motor 1 or the machine specifications of the machine load 3 or the adjustment record 111 is provided.
  • the operating condition determination unit 11 may include an accuracy estimation unit 1101 that determines the degree of ease with which the estimation unit 8 estimates the estimation excellent parameter 107 with high accuracy.
  • the number of adjustment conditions 108 can be increased or decreased according to the estimation accuracy of the estimated excellent parameter 107 in the adjustment range. Therefore, many adjustment conditions 108 can be set in the low accuracy range, and the excellent parameter 106 can be obtained by adjustment regardless of estimation. Then, the adjustment can be performed efficiently. Further, many unadjusted conditions 110 can be set in the high accuracy range, and the estimated excellent parameter 107 can be obtained by estimation regardless of adjustment. Then, the time for performing the adjustment can be further shortened, and the adjustment can be performed efficiently.
  • the operation condition determination unit 11 may include an adjustment range determination unit 1104 that determines an adjustment range that is a range of operation conditions in which the adjustment condition 108 is set. In such a case, the adjustment can be performed with the adjustment range as the range in which the effect of shortening the positioning time by the adjustment can be expected to be large. Then, the time for performing the adjustment can be further shortened, and the adjustment can be performed efficiently.
  • FIG. 11 is a block diagram showing an example of the configuration of the positioning control device 1000b according to the present embodiment.
  • the positioning control device 1000b includes an adjustment unit 7a and an adjustment record holding unit 10a, respectively, in place of the adjusting unit 7 and the adjustment record holding unit 10 of the positioning control device 1000 of the first embodiment.
  • the adjustment management unit 9 which is not included in the positioning control device 1000 shown in FIG. 1 is provided.
  • the same or corresponding components as those of FIG. 1 are designated by the same reference numerals as those of FIG.
  • the positioning control device 1000b executes a positioning operation according to the unadjusted condition 110 and the estimated excellent parameter 107. Then, it is determined whether the executed positioning operation is good or bad, and if the positioning operation is poor, the additional adjustment condition 112, which is a new operating condition, is determined. Then, the adjustment unit 7a executes the adjustment under the additional adjustment condition 112, and determines one of the command parameters as the additional excellent parameter 113 corresponding to the additional adjustment condition 112.
  • the operation of the positioning control device 1000b will be described.
  • the adjusting unit 7a executes the adjustment under the adjusting condition 108 in the same manner as the adjusting unit 7 of the first embodiment.
  • the adjustment record holding unit 10a holds the adjustment record 111 in the same manner as the adjustment record holding unit 10 of the first embodiment.
  • the estimation unit 8 has acquired the unadjusted condition 110 from the outside.
  • the adjustment management unit 9 determines the unadjusted condition 110.
  • the positioning control device 1000b of FIG. 11 may also be configured to acquire the unadjusted condition 110 from the outside. Similar to the estimation unit 8 of FIG. 1, the estimation unit 8 of FIG.
  • the adjusting unit 7a executes a verification positioning operation, which is a positioning operation based on the unadjusted condition 110 and the estimated excellent parameter 107.
  • the command generation unit 2 and the control unit 4 are made to execute the positioning operation by the unadjusted condition 110 determined by the adjustment management unit 9 and the estimated excellent parameter 107 determined by the estimation unit 8.
  • the adjustment management unit 9 acquires the evaluation result 109 for the verification positioning operation from the evaluation unit 6 and determines whether or not the evaluation result 109 for the verification positioning operation satisfies a predetermined criterion.
  • the verification positioning operation executed by the adjustment unit 7a and the determination executed by the adjustment management unit 9 are referred to as verification.
  • the adjustment management unit 9 determines the additional adjustment condition 112.
  • the additional adjustment condition 112 is an operating condition different from the adjustment condition 108 included in the adjustment record 111.
  • the adjustment unit 7a executes the adjustment under the determined additional adjustment condition 112, and determines one of the command parameters as the additional excellent parameter 113 corresponding to the additional adjustment condition 112.
  • the adjustment record holding unit 10a holds a set of the additional adjustment condition 112 and the additional excellent parameter 113 as an additional adjustment record.
  • the adjustment record holding unit 10a holds the pair of the unadjusted condition 110 and the estimated excellent parameter 107 as the adjustment record 111. Good. Further, the pair of the unadjusted condition 110 and the estimated excellent parameter 107 may also be held as an additional adjustment record instead of the adjustment record 111.
  • FIG. 12 is a diagram showing an example of the correspondence between the operating conditions and the command parameters in the present embodiment.
  • the horizontal axis of FIG. 12 is an operating condition.
  • the vertical axis of FIG. 12 is a command parameter.
  • the same or corresponding data points, axes, and the like as in FIG. 3 of the first embodiment are designated by the same reference numerals as those in FIG.
  • the meanings of the symbols attached to the data points, axes, etc. in FIG. 12A are the same as those in FIG. 3A.
  • FIG. 12 (b) shows the unadjusted condition 110 and the estimated excellent parameter 107.
  • the unadjusted condition 110 and the estimated excellent parameter 107 are referred to as unadjusted data.
  • the unadjusted data for which the verification result is judged to satisfy the predetermined criteria that is, the unadjusted data that is good is indicated by using a hollow symbol (white circle symbol).
  • unadjusted data judged not to meet the criteria that is, unadjusted data for which the verification result is negative is indicated by using a cross mark (multiplication symbol).
  • the range of operating conditions between adjacent adjustment conditions 108 is referred to as an unknown section.
  • the unknown section includes the end of the adjustment range, which is the range in which the adjustment condition 108 is arranged, and the adjustment condition 108 adjacent to this end.
  • the range between them may also be an unknown section.
  • the unknown section INT (n) is an open section between D (n) and D (n + 1) , which are operating parameters of the two adjustment conditions 108.
  • the unknown interval INT (n) is (D (n) , D (n + 1) ).
  • four unknown sections from the unknown section INT (n-2) to the unknown section INT (n + 1) are shown, but the number of unknown sections depends on the number of adjustment conditions 108. It can be increased or decreased.
  • the data points for which the verification result is judged to be good are indicated by white circles, but the verification result is judged to be negative.
  • the data points given are not shown.
  • the additional adjustment condition 112 and the additional excellent parameter 113 are indicated by double circle symbols. As described above, the set of the additional adjustment condition 112 and the additional excellent parameter 113 is referred to as an additional adjustment record.
  • FIG. 12B it is assumed that unadjusted data whose verification result is negative exists in the unknown section INT (n-2) and the unknown section INT (n-1).
  • the adjustment management unit 9 adds one additional adjustment condition 112 to each of the unknown sections in which the unadjusted data whose verification result is negative exists. That is, one additional adjustment record is added to each of the unknown section INT (n-2) and the unknown section INT (n-2).
  • the additional adjustment record added to the unknown interval INT (n-2) is used as the data point by D ad1 and Tj ad1.
  • the additional adjustment record added to the unknown interval INT (n-1) is used as the data point by D ad2 and Tj ad2.
  • the positioning control device 1000a of the present embodiment verifies the unadjusted data. Therefore, it is possible to detect unadjusted data that executes a positioning operation that does not satisfy the reference. Then, as described above, the adjustment management unit 9 adds the adjustment condition 112 to the unknown section in which the unadjusted data determined to be negative by the verification exists among the unknown sections which are the sections between the two adjustment conditions 108. Can be determined.
  • the additional adjustment condition 112 By determining the arrangement of the additional adjustment condition 112 in this way, the operating condition close to the unadjusted condition 110 of the unadjusted data determined to be negative can be determined as the additional adjustment condition 112.
  • the fact that the two operating conditions are close to each other may mean that the values of the same type of operating parameters of the two operating conditions are close to each other. That is, the additional adjustment condition 112 can be selectively arranged in the region where the estimation accuracy of the estimation excellent parameter 107 is low. As described above, the adjustment can be performed efficiently.
  • FIG. 13 is a flow chart showing an example of the operation of the positioning control device 1000b according to the present embodiment.
  • FIG. 13 shows an operation flow from the adjustment record holding unit 10a holding the adjustment record 111 shown in FIG. 12A to the adjustment record holding unit 10a holding the additional adjustment record shown in FIG. 12C. ..
  • the adjustment record 111 shown in FIG. 12A is held by the adjustment record holding unit 10a.
  • the adjustment management unit 9 determines the number of unknown sections according to the number of adjustment conditions 108 held in the adjustment record holding unit 10a. Let P be the number of unknown intervals.
  • step S202 the adjustment management unit 9 initializes the unknown section number q, which is the number of the unknown section being processed.
  • the initialization in which the value of q is set to 0 is executed in FIG. 13, but the initialization may be set to another value such as 1, for example.
  • step S203 the adjustment management unit 9 increments the unknown section number q being processed. In other words, the unknown interval number q being processed is incremented by 1.
  • step S204 the adjustment management unit 9 determines L unadjusted conditions 110 for the qth unknown section.
  • step S206 the adjustment management unit 9 increments the unadjusted condition number w being processed. In other words, the operation of increasing the unadjusted condition number w during processing by 1 is executed.
  • step S207 the estimation unit 8 determines the estimation excellent parameter 107 corresponding to the w-th unadjusted condition 110.
  • step S208 the adjusting unit 7a and the like execute the w-th positioning operation, which is the positioning operation based on the w-th unadjusted data.
  • step S209 the adjustment management unit 9 obtains the w-th evaluation result 109 by the evaluation unit 6 based on the state sensor signal 101 obtained in the w-th positioning operation.
  • step S210 the adjustment management unit 9 executes a determination as to whether or not w is L or more. Then, if w is less than L, the process proceeds to step S206. Then, the operation flow from step S206 to step S210 is repeatedly executed until w is determined to be L or more in step S210. On the other hand, if it is determined in step S210 that L is w or more, the process proceeds to step S211. At this time, L evaluation results from the first evaluation result 109 to the Lth evaluation result 109 are obtained.
  • step S211 the adjustment management unit 9 determines whether or not all of the above L evaluation results satisfy the predetermined criteria. If it is determined in step S211 that all of the L evaluation results satisfy the criteria, the process proceeds to step S212. On the other hand, if it is determined in step S211 that at least one of the L evaluation results does not satisfy the criteria, the process proceeds to step S213.
  • step S212 the adjustment management unit 9 determines whether or not L is q or less. When L is q or less, the operation flow is terminated. On the other hand, when L is larger than q, the process proceeds to step S203, and in step S212, the operation flow from step S203 to step S212 is repeatedly executed until it is determined that L is q or less.
  • step S213 the adjustment management unit 9 determines the additional adjustment condition 112. Then, in step S214, the adjustment unit 7a executes the additional adjustment, which is the adjustment under the additional adjustment condition 112, and determines the additional excellent parameter 113. Then, in step S215, the adjustment record holding unit 10a holds the set of the additional adjustment condition 112 and the additional excellent parameter 113 as the additional adjustment record. Then, the process proceeds to step S204. Then, the operation flow from step S204 to step S215 is repeatedly executed until it is determined in step S211 that the L evaluation results satisfy the criteria.
  • the unknown section occupies the entire space between the two adjacent adjustment conditions 108, but the unknown section may be a part of the space between the two adjacent adjustment conditions 108.
  • an unknown section may be set so that a portion within the range of operating conditions that is unlikely to be used is not included in the unknown section.
  • the adjustment management unit 9 may arrange more unknown sections in the range of operating conditions that are likely to be used than in the range of operating conditions that are unlikely to be used. Then, more additional adjustment conditions 112 may be provided in the range of operating conditions that are likely to be used, and the adjustment may be performed intensively.
  • the interval between the unadjusted condition 110 and the interval between the unadjusted condition 110 and the adjusted condition 108 may be set evenly or unevenly. Further, in the setting of the unadjusted condition 110, the unadjusted condition 110 may be stochastically determined by using a random number.
  • one additional adjustment condition 112 is set at the center of the unknown section, but two or more additional adjustment conditions 112 may be arranged in the unknown section. Further, in the state where the additional adjustment condition 112 is set, when another operating condition is newly set as the additional adjustment condition 112, the existing additional adjustment condition 112 may be left or deleted. Further, the additional adjustment condition 112 may be changed based on the unadjusted condition 110 determined to be negative in the verification. For example, the additional adjustment condition 112 may be provided within a range of a predetermined distance or less from the unadjusted condition 110 determined to be negative. Then, the adjustment may be efficiently executed by executing the adjustment aiming at the vicinity of the unadjusted condition determined to be negative.
  • the distance between the two operating conditions may be the difference between two operating parameters of the same type included in the two operating conditions.
  • the adjustment management unit 9 shown in FIG. 11 determines the additional adjustment condition 112 when the judgment result obtained as a result of the verification does not satisfy the predetermined standard.
  • the operation of the adjustment management unit 9 of the present embodiment is not limited to such an embodiment. Even if the adjustment unit 7a and the adjustment management unit 9 do not execute the verification, the adjustment management unit 9 can determine the additional adjustment condition 112, which is one of the operating conditions. Further, when the verification is executed, the adjustment management unit 9 can determine the additional adjustment condition 112, which is one of the operating conditions, regardless of the result of the executed verification. Then, since additional adjustment can be executed for the operating condition in which the adjustment has not been executed, it is preferable that the additional adjustment condition 112 determined by the adjustment management unit 9 is an operating condition different from the adjustment condition 108.
  • the adjustment unit 7a shown in FIG. 11 executes the adjustment under the additional adjustment condition 112 determined as described above, and sets one of the command parameters as the additional excellent parameter 113 corresponding to the determined additional adjustment condition 112. Can be determined as. Then, the adjustment record holding unit 10a can hold a set of the additional adjustment condition 112 determined in this way and the additional excellent parameter 113 corresponding to the additional adjustment condition 112 as an additional adjustment record.
  • the positioning control device 1000b of the present embodiment includes an adjustment management unit 9.
  • the adjustment management unit 9 determines the additional adjustment condition 112, which is one of the operating conditions different from the adjustment condition 108.
  • the adjustment unit 7a executes the adjustment under the additional adjustment condition 112, and determines one of the command parameters as the additional excellent parameter 113 corresponding to the additional adjustment condition 112.
  • the adjustment record holding unit 10a further holds a set of the additional adjustment condition 112 and the additional excellent parameter 113 as an additional adjustment record.
  • the adjustment can be performed under the additional adjustment condition 112 not included in the adjustment record 111, and the evaluation result 109 can determine a good command parameter. Therefore, it is possible to provide a positioning control device capable of executing the positioning operation with higher accuracy.
  • the adjusting unit 7a executes the positioning operation based on the unadjusted condition 110 and the estimated excellent parameter 107 as the verification positioning operation.
  • the adjustment management unit 9a determines whether or not the evaluation result 109 by the state sensor signal 101 at the time of the verification positioning operation satisfies the predetermined standard. Then, if the criteria are not satisfied, the adjustment management unit 9a determines the additional adjustment condition 112. Therefore, it is possible to set the additional adjustment condition 112 by selecting the case where the evaluation result of the estimated excellent parameter 107 does not satisfy the standard, and it is possible to perform efficient adjustment without performing unnecessary adjustment. ..
  • the adjustment management unit 9 may determine the additional adjustment condition 112 in the unknown section in which the unadjusted condition 110 determined not to satisfy the standard is arranged among the unknown sections.
  • the unknown section may be a range of operating conditions between adjacent adjustment conditions 108.
  • the unknown section may be a range of operating conditions between the end of the adjustment range, which is the range in which the adjustment condition 108 is arranged, and the adjustment condition 108 adjacent to the end of the adjustment range. Since the positioning control device of the present embodiment has the above-described configuration, the additional adjustment condition 112 can be determined near the unadjusted condition 110 determined not to satisfy the standard. Therefore, the additional adjustment condition 112 can be selectively determined in the portion where the estimation accuracy of the estimation excellent parameter 107 is low.
  • the adjustment management unit 9 uses the machine specifications 1102, the adjustment record 111, and the like as in the operation condition determination unit 11 for determining the adjustment condition 108 or the unadjusted condition 110 shown in FIGS. 9 and 10.
  • the additional adjustment condition 112 can also be determined.
  • the adjustment management unit 9 may determine the reference distance based on the predetermined maximum speed of the motor 1 and the predetermined maximum acceleration of the motor 1. .. Then, the additional adjustment condition 112 may be determined so that the target moving distance of the additional adjustment condition 112 is the same as or smaller than the above reference distance.
  • the reference distance may be a distance that becomes longer as the maximum speed of the predetermined motor increases and becomes shorter as the maximum acceleration of the predetermined motor increases.
  • the adjustment management unit 9 sets Dmax described in the equation (30) with C as 1 as a reference distance, and adds so that the target movement distance, which is an operating condition, is set in a range equal to or less than this reference distance.
  • the adjustment condition 112 may be determined. If the additional adjustment condition 112 is determined in this way, the additional adjustment condition 112 can be set in a range in which the time required for the positioning operation can be significantly shortened by the adjustment, that is, in a range in which the adjustment is effective. ..
  • FIG. 14 is a block diagram showing an example of the configuration of the positioning control device 1000c according to the present embodiment.
  • the configuration of the positioning control device 1000c is the same as that of the positioning control device 1000 shown in FIG. 1 of the first embodiment, except that the adjusting unit 7b is provided instead of the adjusting unit 7.
  • FIG. 15 is a block diagram showing an example of the configuration of the adjusting unit 7b.
  • the adjustment unit 7b includes an adjustment learning unit 70.
  • the same or corresponding components as those shown in FIG. 1 of the first embodiment are designated by the same reference numerals.
  • the adjustment learning unit 70 learns the relationship between the trial parameter 105 used for the positioning operation and the state quantity including the evaluation result 109 of the executed positioning operation, and determines the trial parameter 105 based on the learned result.
  • the adjustment learning unit 70 includes a reward calculation unit 701 that calculates the reward r based on the evaluation result 109, and a value function update unit 702 that updates the value function Q based on the reward r.
  • the adjustment learning unit 70 of FIG. 15 learns the relationship between the trial parameter 105 and the evaluation result 109, while the adjustment learning unit 70 learns the relationship between the trial parameter 105 and the adjustment state quantity including the evaluation result 109. You may.
  • the adjustment learning unit 70 includes a decision-making unit 703 that determines the trial parameter 105 used for the positioning operation executed at the time of adjustment based on the value function Q. In the present embodiment, in the operation of step S114 of FIG. 6, the adjustment learning unit 70 determines the trial parameter 105. Except for the left side, the operation flow of the present embodiment is the same as that of FIGS. 4 and 6 of the first embodiment.
  • the adjustment learning unit 70 can execute learning by using various learning algorithms.
  • Reinforcement learning is that an agent (behavior) in a certain environment observes the current state and decides the action to be taken. Agents choose actions and get rewards from the environment. Then, learn the measures that will give you the most rewards through a series of actions.
  • Q-learning, TD-Learning, and the like are known as typical methods of reinforcement learning.
  • the general update equation of the action value function Q (s, a) is expressed by equation (32).
  • the update formula can also be expressed in the action value table.
  • s t represents the environment at time t
  • a t represents the behavior in time t.
  • rt + 1 represents the reward received by the change in the environment
  • represents the discount rate
  • represents the learning coefficient.
  • the discount rate ⁇ is in the range greater than 0 and 1 or less (0 ⁇ ⁇ 1)
  • the learning coefficient ⁇ is in the range greater than 0 and 1 or less (0 ⁇ ⁇ 1). If you apply the Q-learning, the action a t, it is the determination of the trial parameters 105.
  • the adjustment condition 108 consists of an initial position of the motor 1.
  • the operation of the reward calculation unit 701 to determine the reward r is illustrated.
  • the reward calculation unit 701 determines the reward r according to the evaluation result 109.
  • the evaluation unit 6 illustrated in the first embodiment determines the evaluation result 109 based on the settling time or the positioning time and the overshoot information.
  • the overshoot information is information on whether or not the magnitude of the deviation exceeds the permissible width IMP between the time when the settling time elapses and the time when the predetermined time elapses, as described above.
  • the overshoot information is referred to as good, and if the allowable width IMP is not exceeded before the predetermined time elapses, the overshoot information is referred to as good.
  • Overshoot information is said to be no. If the overshoot information is negative, the value obtained by subtracting 5 from the reciprocal value of the settling time is set as the reward r, and if the overshoot information is good, the value obtained by subtracting 5 from the reciprocal value of the settling time is set as the reward r.
  • the reward r is set to 5 which is the reciprocal of the settling time, which is 10 minus 5.
  • the reward calculation unit 701 may search for the trial parameter 105 in which the settling time is short and the overshoot information is good.
  • the evaluation unit 6 may determine the evaluation result 109 based on the size of the overshoot, which is a distance that exceeds the target movement distance and goes too far to the side opposite to the start point of the positioning operation.
  • the value function update unit 702 updates the action value function Q based on the reward r calculated by the reward calculation unit 701. Decision-making unit 703, the updated action-value function Q is to determine the most larger action a t. That is, the trial parameter 105 is determined so that the action value function Q is the largest.
  • reinforcement learning is applied as the learning algorithm used by the adjustment learning unit 70
  • the learning algorithm of the present embodiment is not limited to reinforcement learning. It is also possible to apply known learning algorithms such as supervised learning, unsupervised learning, and semi-supervised learning. Further, as the learning algorithm described above, deep learning for learning the extraction of the feature amount itself may be used. Machine learning may also be performed according to other methods such as neural networks, genetic programming, functional logic programming, support vector machines, Bayesian optimization, and the like.
  • a positioning control device including a learned learner that has executed the learning described in the present embodiment may be configured.
  • the trained learner may be composed of trained data, trained programs, or a combination thereof.
  • learning using another positioning control device can be used, so that it is possible to provide a positioning control device that can realize high-performance positioning without performing new learning. ..
  • the configuration described in the present embodiment may be applied to the adjusting unit 7 shown in FIG. 9 and the adjusting unit 7a shown in FIG. 11 to efficiently execute the adjustment.
  • the positioning control device 1000c of the present embodiment can provide a positioning control device capable of performing a high-performance positioning operation with a short time required for adjustment, as in the first embodiment. it can. Further, the positioning control device 1000c of the present embodiment includes an adjusting unit 7b.
  • the adjustment unit 7b includes an adjustment learning unit 70 that learns the relationship between the trial parameter 105 and the adjustment state quantity including the evaluation result 109, and determines the trial parameter 105 based on the learned result. Trial parameters can be determined by using the learning results. Then, the time required for adjustment can be shortened.
  • the adjustment learning unit 70 determines the trial parameter 105 using the learning result to reduce the time required for the adjustment. Can be shortened. In addition, the time required for adjustment can be shortened as compared with the adjustment in which simple trial and error is repeated.
  • FIG. 16 is a block diagram showing an example of the configuration of the positioning control device 1000d according to the present embodiment.
  • the positioning control device 1000d includes an estimation unit 8a instead of the estimation unit 8 of the positioning control device 1000 of the first embodiment shown in FIG. Other points are the same as those of the positioning control device 1000 of the first embodiment.
  • the same or corresponding components as those in FIG. 1 of the first embodiment are designated by the same reference numerals.
  • FIG. 17 is a block diagram showing an example of the configuration of the estimation unit 8a in the present embodiment.
  • the estimation unit 8a learns the relationship between the adjustment condition 108 and the excellent parameter 106 corresponding to the adjustment condition 108 based on the estimated state quantity including the adjustment record 111. Then, based on the learned result, one of the command parameters is determined as the estimated excellent parameter 107 under the unadjusted condition 110.
  • the command parameter for executing the positioning operation that gives a good evaluation result 109 may be determined as the estimated excellent parameter 107.
  • the estimation unit 8a includes an estimation learning unit 80 that learns an estimation function Es that calculates an estimation superior parameter based on the unadjusted condition 110.
  • the estimation learning unit 80 includes an adjustment record 111, an error calculation unit 801 for calculating an error er with the estimation excellent parameter 107, and an estimation function update unit 802 for updating the estimation function Es based on the error er. Further, the estimation learning unit 80 includes an estimation value determination unit 803 that determines the estimation superior parameter 107 based on the estimation function Es and the unadjusted condition 110. In FIG. 17, the error calculation unit 801 calculates the error er based on the adjustment record 111, but the error er may be calculated based on the estimated state quantity including the adjustment record 111.
  • the estimation learning unit 80 may learn the relationship between the excellent parameter 106 and the adjustment condition 108 by so-called supervised learning according to, for example, a neural network model.
  • a neural network model a model in which a large number of sets of data of a certain input and a result (label) are given to a learning device to learn the features in those data sets and estimate the result from the input is called supervised learning.
  • a neural network is composed of an input layer composed of a plurality of neurons, an intermediate layer (hidden layer) composed of a plurality of neurons, and an output layer composed of a plurality of neurons.
  • the intermediate layer may be one layer or two or more layers.
  • FIG. 18 is a diagram showing an example of the configuration of the neural network in the present embodiment.
  • the neural network of FIG. 18 has 3 inputs and 3 layers.
  • the input layer composed of X1 to X3 the value obtained by multiplying the input value by the weight W1 composed of w11 to w16 is input to the intermediate layer composed of Y1 and Y2. Will be done.
  • the value obtained by multiplying the input value of the intermediate layer by the weight W2 composed of w21 to w26 is output from the output layer composed of Z1 to Z3. This output result changes depending on the value of the weight W1 and the value of the weight W2.
  • the adjustment condition 108 has the adjustment condition 108 and the excellent parameter 106 corresponding to the adjustment condition 108 by supervised learning according to the data set created based on the adjustment record 111 input to the estimation learning unit 80.
  • Learn the relationship That is, in an example of learning by the neural network of the present embodiment, the adjustment condition 108 is input to the input layer, and the evaluation result 109 of the positioning operation using the excellent parameter 106 output from the output layer becomes excellent.
  • the weight W1 and the weight W2 are adjusted.
  • a positioning control device equipped with a learned learner that has executed the learning described in the present embodiment may be configured.
  • the trained learner may be composed of trained data, trained programs, or a combination thereof. By using the learned learner, learning using another positioning control device can be used, so that it is possible to provide a positioning control device that can realize high-performance positioning without performing new learning. ..
  • the configuration described in the present embodiment may be applied to other configurations.
  • Examples of other configurations include the estimation unit 8 of the positioning control device 1000a shown in FIG. 9, the estimation unit 8 of the positioning control device 1000b shown in FIG. 11, or the estimation unit 8 of the positioning control device 1000c shown in FIG. Can be done. Then, in the positioning control device 1000a, the positioning control device 1000b, or the positioning control device 1000c, the estimation of the estimated excellent parameter 107 may be performed accurately or efficiently.
  • the positioning control device 1000d of the present embodiment includes an estimation unit 8a having an estimation learning unit 80.
  • the estimation learning unit 80 learns the relationship between the excellent parameter 106 and the adjustment condition 108 based on the estimated state quantity including the adjustment record 111, and determines the estimated excellent parameter 107 based on the learned result. Therefore, the estimated good parameter 107 can be determined more accurately in a shorter period of time. Then, the excellent parameter 106 that can realize the positioning operation that gives a good evaluation result 109 even for the machine load 3 having complicated characteristics can be efficiently determined in a shorter time.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Manufacturing & Machinery (AREA)
  • Operations Research (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Control Of Position Or Direction (AREA)
  • Feedback Control In General (AREA)

Abstract

調整に要する時間が短く、高性能な位置決め動作を実行するために、モータ(1)に接続された機械負荷(3)を目標移動距離だけ移動させる位置決め動作におけるモータの動作が、運転条件と指令パラメータとによって規定される位置決め制御装置(1000)であって、運転条件及び指令パラメータである調整条件(108)及び試行パラメータ(105)に基づく位置決め動作を実行し、実行した位置決め動作の際のモータ又は機械負荷の状態による評価結果(109)に基づいて指令パラメータのひとつを調整条件に対応する優良パラメータ(106)として決定する調整部(7)と、調整条件と調整条件に対応する優良パラメータとの組である調整レコード(111)に基づいて指令パラメータのひとつを、運転条件のひとつである未調整条件(110)に対応する推定優良パラメータ(107)として決定する推定部(8)とを備える。

Description

位置決め制御装置及び位置決め制御方法
 本開示は、モータによる位置決めを制御する位置決め制御装置に関するものである。
 電子部品実装機、半導体製造装置等では、モータの駆動により、実装ヘッド等の機械の位置を目標距離だけ駆動させる位置決め制御が行われる。位置決め制御においては、装置を駆動するための指令信号の時系列パターンを規定するパラメータ、制御系のパラメータ等を最適な値に設定することによって位置決めに要する時間を短縮し、装置の生産性を向上することができる。これらのパラメータ設定は、移動する機械が低剛性の振動の発生しやすい機械である場合には、試行錯誤による調整が必要となり、調整作業に時間と手間がかかるという課題があった。また、調整作業にかかる時間、調整の結果等は、作業者の知識、経験に依存するところが大きく、作業者によって調整の品質にばらつきが生じるという課題があった。前述の課題を解決するための技術として、予め用意した指令パターンを用いてパラメータを設定する技術が提案されている。
 特許文献1には、フィードバック制御、フィードフォワード制御等における制御パラメータを自動的にチューニングする電動機制御装置の自動調整法が開示されている。特許文献1に開示される自動調整法は、連続的に変化する複数の調整運転用の位置指令パターンを生成し、位置制御器の位置指令値として与えた際に位置偏差波形の振動振幅が所定値を超えない範囲内で、位置制御器、速度制御器の応答周波数を増加させるという調整を実行する。
特開2007-135344号公報
 特許文献1の自動調整法では、すべての位置指令パターンに対してひとつの最適な制御パラメータを選択する。そのため、個別の位置指令パターンへの制御パラメータの適合の度合いが悪く制御性能が低いという課題があった。また、多くの位置指令パターンについて運転を実行する必要があるため、調整に長い時間を要するという課題があった。
 本開示は、上記を鑑みてなされたものであって、調整に要する時間が短く、高性能な位置決め動作を実行可能な位置決め制御装置を提供することを目的とする。
 本開示に係る位置決め制御装置は、モータに機械的に接続された機械負荷を目標移動距離だけ移動させる位置決め動作におけるモータの動作が、運転条件と運転条件のもとで変更可能なパラメータである指令パラメータとによって規定される位置決め制御装置であって、運転条件のひとつである調整条件と指令パラメータのひとつである試行パラメータとに基づく位置決め動作を実行し、実行した位置決め動作の際のモータ又は機械負荷の状態を検出した状態センサ信号による評価結果に基づいて指令パラメータのひとつを調整条件に対応する優良パラメータとして決定する調整を実行する調整部と、調整条件と調整条件に対応する優良パラメータとの組を調整レコードとして保持する調整レコード保持部と、調整レコードに基づいて指令パラメータのひとつを、調整レコードに保持される調整条件とは異なる運転条件のひとつである未調整条件に対応する推定優良パラメータとして決定する推定部とを備える。
 本開示によれば、調整に要する時間が短く、高性能な位置決め動作を実行可能な位置決め制御装置を提供することができる。
実施の形態1における位置決め制御装置の構成の一例を示すブロック図である。 実施の形態1における指令パターンの一例を示す図である。 実施の形態1における運転条件と指令パラメータとの関係の一例を示す図である。 実施の形態1における調整の動作の一例を示すフロー図である。 実施の形態1における偏差の時間応答の一例を示す図である。 実施の形態1における調整の動作の一例を示すフロー図である。 実施の形態1における位置決め制御装置が備える処理回路をプロセッサ及びメモリで構成する場合の構成例を示す図である。 実施の形態1における位置決め制御装置が備える処理回路を専用のハードウェアで構成する場合の構成例を示す図である。 実施の形態2における位置決め制御装置の構成の一例を示すブロック図である。 実施の形態2における運転条件決定部の構成を例示する図である。 実施の形態3における位置決め制御装置の構成の一例を示すブロック図である。 実施の形態3における運転条件と指令パラメータとの対応関係の一例を示す図である。 実施の形態3における位置決め制御装置の動作の一例を示すフロー図である。 実施の形態4における位置決め制御装置の構成の一例を示すブロック図である。 実施の形態4における調整部の構成の一例を示すブロック図である。 実施の形態5における位置決め制御装置の構成の一例を示すブロック図である。 実施の形態5における優良パラメータ決定部の構成の一例を示すブロック図である。 実施の形態5におけるニューラルネットワークの構成の一例を示す図である。
 以下に、実施の形態を図面に基づいて詳細に説明する。なお、以下に説明する実施の形態は例示である。また、各実施の形態は、適宜組み合わせて実行することができる。
 実施の形態1
 図1は、本実施の形態における位置決め制御装置1000の構成の一例を示すブロック図である。位置決め制御装置1000は、試行パラメータ105及び調整条件108に基づき指令信号103を決定する指令生成部2、指令信号103に基づきモータ1を駆動し位置決め動作を実行する制御部4を備える。さらに、位置決め制御装置1000は、調整を実行し調整条件108に対応する優良パラメータ106を決定する調整部7を備える。さらに、位置決め制御装置1000は、調整レコード111を保持する調整レコード保持部10、調整レコード111に基づき調整条件108に対応する優良パラメータ106を推定優良パラメータ107として推定する推定部8を備える。
 モータ1は、制御部4から出力される駆動電力Eによってトルク、推力等を発生する。モータ1の例としては、回転型サーボモータ、リニアモータ、ステッピングモータ等を挙げることができる。機械負荷3は、モータ1と機械的に接続され、モータ1によって駆動される。機械負荷3として、モータ1の発生するトルク、推力等によって動作し、機械負荷3の位置決め動作を実行する装置を適宜選択することができる。ここで、位置決め動作とは、機械負荷3を、目標移動距離だけ移動させる動作である。機械負荷3の例としては、電子部品実装機、半導体製造装置等を挙げることができる。また、位置決め動作における機械負荷3の移動は、機械負荷3の全体が移動してもよく、機械負荷3の一部の可動部が移動してもよい。モータ1及び機械負荷3を制御対象2000と称する。
 制御部4は、指令信号103に基づき、駆動電力Eをモータ1に供給してモータ1を駆動し、モータ1を指令信号103に追従させる。ここで、指令信号103は、モータ1についての指令値であり、例えば、モータ1についての、位置、速度、加速度、トルク、電流の指令値としてもよい。制御部4として、モータ1の位置を指令信号103に追従させる構成を適宜採用することができる。例えば、検出したモータ1の位置と指令信号103との差異が小さくなるように、モータ1のトルク又は電流をPID制御に基づいて算出するフィードバック制御系を採用してもよい。また、制御部4として、検出した機械負荷3の位置が、指令信号103に追従するようにモータ1を駆動するフィードバック制御に、フィードフォワード制御を加えた2自由度制御系を採用してもよい。位置決め制御装置1000は、制御部4を構成要素として含まない構成とすることもできる。例えば、位置決め制御装置1000の外部にあるメモリ、プロセッサ等が、図1の制御部4と同様に、モータ1を指令信号103に追従させるように駆動してもよい。
 状態センサ5は、モータ1又は機械負荷3の少なくともいずれか一方の状態、すなわち、制御対象2000の状態を、状態センサ信号101として検出する。状態量の例としては、モータ1についての、位置、速度、加速度、電流、トルク、推力等を挙げることができる。さらに、状態量の例として、機械負荷3についての、位置、速度、加速度等を挙げることができる。状態量は、上記に例示したものの全部としてもよく、一部としてもよい。状態センサ5の例としては、エンコーダ、レーザ変位計、ジャイロセンサ、加速度センサ、電流センサ、力センサ等を挙げることができる。図1の状態センサ5は、モータ1の位置を状態量として検出するエンコーダであるとして説明を行う。
 調整部7は、運転条件のひとつである調整条件108と指令パラメータのひとつである試行パラメータ105とに基づく位置決め動作を実行する。そして、実行した位置決め動作の際のモータ1又は機械負荷3の状態を検出した状態センサ信号101による評価結果109に基づいて、指令パラメータのひとつを調整条件108に対応する優良パラメータ106として決定する。上記の調整部7による一連の動作を調整と称する。なお、左記の調整の中で、調整部7は、試行パラメータ105を複数決定し、調整条件108と複数の試行パラメータの各々とによる位置決め動作を、複数回行ってもよい。
 調整部7が実行する調整の説明に用いる用語について説明する。位置決め動作の間のモータ1についての、位置、速度、加速度等の指令値の時系列パターンを指令パターンと称する。本実施の形態において、指令パターンは、調整条件108と試行パラメータ105とによって規定される。換言すれば、調整条件108及び試行パラメータ105を決定すれば、位置決め動作の間の指令パターンが一意に決定され、モータの動作が規定される。ここで、調整条件108とは、運転条件の一種である。そして、運転条件とは、位置決め動作の間のモータ1の動作を拘束する条件であり、運転条件は、モータ1の動きを規定する少なくとも一つの数値パラメータを含む。この数値パラメータを運転パラメータと称する。運転パラメータは、目標移動距離を含んでもよい。目標移動距離とは、位置決め動作における機械負荷3の移動距離の目標値である。
 指令パラメータは、モータ1の動作を指定する指令であって、指令生成部2に入力される指令である。指令生成部2は、指令パラメータに基づいて指令信号103を決定する。そして、制御部4は、指令信号103に基づきモータ1を駆動する。また、試行パラメータ105、後述する優良パラメータ106、後述する推定優良パラメータ107等は、それぞれ、一群の指令パラメータであり、これらは、指令パラメータを種類ごとに分類する呼称ということができる。試行パラメータ105は、指令パラメータの一種であり、調整条件108のもとで変更可能なパラメータである。なお、調整条件108を拘束条件として、試行パラメータ105を様々に変更することによって、上記の拘束条件のもとで、様々な指令パターンの位置決め動作を実行することができる。試行パラメータ105、指令パターン、調整条件108等についての具体例については、図2を用いて後述する。
 調整部7は、調整条件108を取得する。本実施の形態において、調整条件108は、作業者が決定してもよく、位置決め制御装置1000の内部又は外部の装置が決定してもよい。調整部7は、調整条件108のもとで、1つ又は複数の試行パラメータ105を決定する。そして、指令生成部2は、調整条件108と決定された試行パラメータ105とを取得し、指令信号103を生成し、制御部4は、指令信号103に基づく位置決め動作を実行する。換言すれば、調整部7は、調整条件108と試行パラメータ105とに基づく位置決め動作を実行する。評価部6は、実行した位置決め動作を、前述の状態センサ信号101に基づいて評価した結果を評価結果109として決定する。なお、評価部6は、位置決め動作を評価することによって、同時に位置決め動作に用いた試行パラメータ105を評価している。また、複数の試行パラメータ105を決定した場合、制御部4は、調整条件108と決定された試行パラメータ105の各々との組み合わせに基づく位置決め動作を実行する。評価部6が位置決め動作、すなわち試行パラメータ105を評価する動作については後述する。
 調整部7は、評価結果109を取得する。そして、取得した評価結果109に基づき、指令パラメータのひとつを調整条件108に対応する優良パラメータ106として決定する。ここで、優良パラメータ106は、指令パラメータの一種である。また、評価結果109が良い位置決め動作を実行させる指令パラメータを、優良パラメータ106として決定してもよい。このような場合、優良パラメータ106は、評価部6の評価方法に依存して変化し、評価部6の評価方法を所望の方法に設定することにより、位置決め動作に求める性能を選択することができる。調整部7は、評価結果109に基づいて指令パラメータのひとつを優良パラメータ106として決定すればよい。一例として、調整において実行させた位置決め動作の評価結果109が最も良かった試行パラメータ105を、優良パラメータ106として決定してもよい。また、一例として、調整において実行させた位置決め動作の評価結果109が良かった2つを選択し、これらの中間値を優良パラメータ106として決定してもよい。
また、調整部7が、調整条件108を取得してから、調整条件108に対応する優良パラメータ106を決定するまでの動作を調整と称する。本実施の形態において、調整部7は、1回又は複数回の位置決め動作を実行し、位置決め動作の各々について評価結果109を取得する。調整条件108と決定された優良パラメータ106との組は、調整レコード111として調整レコード保持部10に保持される。ここで、調整条件108と優良パラメータ106とを対応づける動作を例示する。これらを、入力のタイミングに基づいて対応付けてもよい。例えば、調整条件108と調整条件108が入力された直後に入力される優良パラメータ106とを組とすることによって対応付けてもよい。また、調整条件108と優良パラメータ106との両方に識別子を設けて対応付けてもよい。
 推定部8は、未調整条件110を取得する。ここで、未調整条件110は、運転条件の一種である。未調整条件110を、調整レコード保持部10に保持される調整条件108とは異なる運転条件としてもよい。推定部8はさらに、調整レコード111に基づいて指令パラメータのひとつを、未調整条件110に対応する推定優良パラメータ107として決定する。ここで、推定優良パラメータ107は、指令パラメータの一種である。ここで、優良パラメータ106は、調整部7が調整を実行して決定するものであり、一例として、調整条件108のもとで良い評価結果109を与える位置決め動作を実行させる指令パラメータとしてもよい。一方、推定優良パラメータ107は、指令パラメータのひとつを、未調整条件110に対応する推定優良パラメータ107として、推定部8が、推定により決定したものである。ここで、推定部8は、調整レコード111に基づいて指令パラメータのひとつを推定優良パラメータ107として決定すればよく、様々な方法をとることができる。一例として、未調整条件110のもとで、良い評価結果109が得られる指令パラメータのひとつを推定し、推定優良パラメータ107として決定してもよい。一例として、最善の評価結果109が得られると思われる指令パラメータのひとつを推定し、推定優良パラメータ107として決定してもよい。また、良い評価結果109が得られると思われる指令パラメータを、最上位のものから順にいくつか選択し、これらの平均値を推定優良パラメータ107として決定してもよい。図1の構成例では、未調整条件110は、外部から与えられるとしているが、位置決め制御装置1000の内部に、未調整条件110を決定する構成要素を設けてもよい。なお、本実施の形態において、図1の構成例では、推定優良パラメータ107及び未調整条件110が、指令生成部2に入力される構成としているが、推定優良パラメータ107及び未調整条件110は、必ずしも指令生成部2に入力される必要はない。例えば、外部へ出力する構成としてもよく、調整レコード保持部10に保持させる構成としてもよい。
 以下に、試行パラメータ105、指令パターン、調整条件108等の具体例を例示する。図2は、本実施の形態における指令パターンの一例を示す図である。図2(a)から図2(d)の横軸は時間である。図2(a)から図2(d)のそれぞれの縦軸には、モータ1の、位置、速度、加速度及びジャークが示されており、これらは、指令信号103である。ここで、速度、加速度及びジャークはそれぞれ、モータ1の位置の、1階微分、2階微分及び3階微分である。横軸と縦軸との交点は、横軸上において評価運転の開始される指令開始時点となる時刻0である。図2の動作例の運転条件は、目標移動距離がDであるとする。すなわち、モータ1の位置が評価運転の開始時点0において0であり、終端時点となる時刻t=T1+T2+T3+T4+T5+T6+T7におけるモータ1の位置をDとする。
 図2の指令パターンは、指令開始時点である時刻0から終端時点まで、順に、第1区間から第7区間に区分されている。nを1から7の自然数として、第n区間の時間長を第n時間長Tnとする。図2の動作例では、第1時間長T1から第7時間長T7までの7つのパラメータを、ひとつの試行パラメータ105とする。すなわち、7つで1セットのパラメータを、ひとつの試行パラメータ105としている。第2区間及び第6区間の加速度の大きさをそれぞれ、Aa及びAdとし、これらは、区間内で一定であるとする。加速度の大きさAaと加速度の大きさAdとは、試行パラメータ105の従属変数であり、設定自由度が無いことに留意する。なお、図2の例では、指令信号103を時系列に示したものが指令パターンとなっていると仮定しているため、指令パターンの各時刻における数値を指令信号103とよんでいる。
 第1区間の時刻t(0≦t<T1)における指令信号103を、以下のように計算することができる。第1区間の時刻0から第1区間内の時刻tまでの間の、ジャーク、加速度A1及び速度V1のそれぞれを時間で積分したものが、加速度A1、速度V1及び位置P1となる。そして、第1区間では一定の割合で加速度が増加し、時刻T1で加速度の大きさAaに到達するとしているため、第1区間のジャークは、加速度の大きさAaをT1で除した値となる。以上から、加速度A1、速度V1及び位置P1はそれぞれ、(1)式から(3)式のように計算することができる。
Figure JPOXMLDOC01-appb-M000001
Figure JPOXMLDOC01-appb-M000002
Figure JPOXMLDOC01-appb-M000003
 また、第2区間の時刻t(T1≦t<T1+T2)における指令信号103、すなわち、加速度A2、速度V2及び位置P2は、第1区間と同様に(4)式から(6)式のように計算することができる。
Figure JPOXMLDOC01-appb-M000004
Figure JPOXMLDOC01-appb-M000005
Figure JPOXMLDOC01-appb-M000006
 また、第3区間の時刻t(T1+T2≦t<T1+T2+T3)における指令信号103、すなわち、加速度A3、速度V3及び位置P3は、第1区間と同様に(7)式から(9)式のように計算することができる。
Figure JPOXMLDOC01-appb-M000007
Figure JPOXMLDOC01-appb-M000008
Figure JPOXMLDOC01-appb-M000009
 また、第4区間の時刻t(T1+T2+T3≦t<T1+T2+T3+T4)における指令信号103、すなわち、加速度A4、速度V4及び位置P4は、第1区間と同様に、(10)式から(12)式のように計算することができる。
Figure JPOXMLDOC01-appb-M000010
Figure JPOXMLDOC01-appb-M000011
Figure JPOXMLDOC01-appb-M000012
 また、第5区間の時刻t(T1+T2+T3+T4≦t<T1+T2+T3+T4+T5)における指令信号103、すなわち、加速度A5、速度V5及び位置P5は、第1区間と同様に(13)式から(15)式のように計算することができる。
Figure JPOXMLDOC01-appb-M000013
Figure JPOXMLDOC01-appb-M000014
Figure JPOXMLDOC01-appb-M000015
 また、第6区間の時刻t(T1+T2+T3+T4+T5≦t<T1+T2+T3+T4+T5+T6)における指令信号103、すなわち、加速度A6、速度V6及び位置P6は、第1区間と同様に(16)式から(18)式のように計算することができる。
Figure JPOXMLDOC01-appb-M000016
Figure JPOXMLDOC01-appb-M000017
Figure JPOXMLDOC01-appb-M000018
 また、第7区間の時刻t(T1+T2+T3+T4+T5+T6≦t≦T1+T2+T3+T4+T5+T6+T7)における指令信号103、すなわち、加速度A7、速度V7及び位置P7は、第1区間と同様に(19)式から(21)式のように計算することができる。
Figure JPOXMLDOC01-appb-M000019
Figure JPOXMLDOC01-appb-M000020
Figure JPOXMLDOC01-appb-M000021
 そして、終端時点となる時刻t=T1+T2+T3+T4+T5+T6+T7において、速度V7が0に一致し、さらに、位置P7が目標移動距離Dに一致する。そのため、終端時点において、(22)式、及び(23)式が成立する。第2区間の加速度の大きさAa、及び第6区間の加速度の大きさAdは、(22)式と(23)式とから決定することができる。
Figure JPOXMLDOC01-appb-M000022
Figure JPOXMLDOC01-appb-M000023
 以上が、試行パラメータ105と調整条件108とに基づき、指令信号103を生成する指令生成部2の動作の例示である。ここで、第1区間、第3区間、第5区間及び第7区間では、ジャークが非零の一定値である。つまり、第1時間長T1、第3時間長T3、第5時間長T5及び第7時間長T7は、ジャークが非零の一定値となる時間を指定している。ここで非零の一定値とは、0よりも大きい一定値又は0より小さい一定値を意味する。また、これらの区間では、時間長Tnに代えて、ジャークの大きさを、試行パラメータ105とすることもできる。例えば、第1区間におけるジャークの大きさをJ1と定めた場合、第1時間長T1とジャークJ1とは、(24)式のような関係を有する。
Figure JPOXMLDOC01-appb-M000024
 ジャークが非零の一定値となる区間の時間長を試行パラメータ105として定めることと、ジャークが非零の一定値となる区間のジャークの大きさを試行パラメータ105として定めることとは等価である。上記の例のように、試行パラメータ105は、試行パラメータ105と調整条件108とによって指令パターンを決定するものであればよく、ここで例示したように、同じ調整条件108のもとでも複数の選択肢があり得る。なお、試行パラメータ105の選び方は、上記に説明する方法に限定されるものではない。ここで、図2を用いて説明した形態では、運転条件と指令パラメータとを決定すれば、モータ1の最大加速度が決まる。すなわち、図2の形態は、運転条件と指令パラメータとが、位置決め動作の際のモータ1の加速度の最大値を規定している場合の一例である。このような場合、モータ1の最大加速度を超えないという拘束条件のもとで指令パラメータを変更しつつ、良い評価結果109を与える位置決め動作を実行させる指令パラメータを探索することができる。なお、モータの最大加速度は、モータの仕様によって決定される場合が多く、上記のような構成にすることによって容易に調整を行うことができる。
 図3は、本実施の形態における運転条件と指令パラメータとの関係の一例を示す図である。なお、図3に示す運転条件は、調整条件108及び未調整条件110であり、図3に示す指令パラメータは、優良パラメータ106及び推定優良パラメータ107である。図3の横軸は、運転パラメータのひとつである目標移動距離を示している。図3の縦軸は指令パラメータである。図3(a)及び図3(b)には、調整レコード111がプロットされている。すなわち、図3(a)及び図3(b)には調整条件108と調整条件108に対応する優良パラメータ106とが塗り潰し記号、すなわち黒丸記号を用いてプロットされている。ここで、第n番目の調整条件108を目標移動距離D(n)とする。そして、目標移動距離D(n)における第j時間長をTj(n)とする。ここで、nは3以上の整数であり、jは1から7の整数である。また、Tj(n)は第n番目の優良パラメータ106の第j番目のパラメータ、すなわち、図2の例における第j番目の第j時間長である。このように、図2の例では、7つの時間長がひとつの指令パラメータを構成しているとしている。
 なお、わかりやすく表示するために、図3には、優良パラメータ106として、指令パラメータの第j番目のパラメータのみを示している。図2の動作例のように、ひとつの指令パラメータが複数のパラメータで構成される場合も、指令パラメータの複数のパラメータの各々について同様にプロットすることができる。また、運転条件が、目標移動距離に加えてひとつ又は複数の運転パラメータを有する場合、図3のような2次元平面上のプロットに代えて、運転パラメータの各々について座標軸を有する多次元空間にプロットしてもよい。ここで、第n番目の調整条件108と第n番目の優良パラメータ106との組である調整レコード111をLnとする。第n番目の調整レコードLnは、第n番目の目標移動距離D(n)と第n番目の優良パラメータ106の組として、(25)式のように書くことができる。
Figure JPOXMLDOC01-appb-M000025
 なお、図3には、第n-2番目から第n+2番目までの5点の調整レコード111が示されているが、調整レコード111のデータ点数は、1点以上であればよく、2以上であることが好適である。調整レコード111のデータ点の数が多いほど、推定部8が推定優良パラメータ107を精度良く推定できる。図3(b)は、図3(a)に示すデータ点に追加して、D(n) と D(n+1)との間に、未調整条件Dと、未調整条件Dに対応する推定優良パラメータ Tjとを、中抜き、すなわち白丸の記号を用いてプロットしたものである。推定部8は、調整レコード111に基づいて、(26)式のように線形補間を行うことによって推定優良パラメータTjを推定してもよい。
Figure JPOXMLDOC01-appb-M000026
 (26)式では、未調整条件Dの近傍の、調整レコードLnと、調整レコードLn+1とを用いた線形1次近似式によって推定優良パラメータTjを決定している。換言すれば、推定部8は、運転パラメータ及び優良パラメータ106をそれぞれ、入力及び出力として近似する線形補間関数を用いて推定優良パラメータ107を推定している。また、推定部8は、(27)式のように、線形補間関数に代えて、次数がPの近似多項式であるP次関数を用いて補間による推定を実行してもよい。総和記号Σを用いれば、(27)式を、(28)式のように記載することができる。
Figure JPOXMLDOC01-appb-M000027
Figure JPOXMLDOC01-appb-M000028
 (28)式のaj(u)は、調整レコード111、境界条件等によって定まる定数である。上記に例示した線形補間、多項式補間に加え、ラグランジュ補間、スプライン補間等による近似を用いて推定優良パラメータ107を推定してもよい。以上が、推定部8が、調整レコード111に基づいて、未調整条件110のもとで、位置決め制御性能が優良となる指令パラメータとして、推定優良パラメータ107を推定する動作の例示である。なお、本実施の形態では、調整条件108の運転パラメータが目標移動距離のみとした場合について示したが、目標移動距離以外の運転パラメータを追加してもよい。運転パラメータの例としては、機械負荷3の位置決め動作の開始位置、停止位置等を挙げることができる。目標移動距離が同じ状態で、動作の開始位置、停止位置等を変更すると、機械負荷3の特性が変化し、発生する振動の振幅の大きさ、発生する振動の周波数、発生する振動の減衰の性質等が変わり、指令パラメータの再調整が必要となる場合がある。換言すれば、機械負荷3の位置決め動作の開始位置、停止位置等は、位置決め動作の評価結果109、すなわち、位置決め動作の優良度に影響を及ぼす。
 なお、推定部8は、調整レコード111に含まれる調整条件108と調整条件108に対応する優良パラメータ106とに基づいて実行される全ての位置決め動作の中での最大の加速度を算出してもよい。そして、この算出された値より、未調整条件110と未調整条件110に対応する推定優良パラメータ107とに基づいて実行される位置決め動作の中での最大の加速度の値の方が小さくなるように、推定優良パラメータ107を決定してもよい。このように推定優良パラメータ107を決定することにより、実現不可能な推力又はトルクを発生させる未調整条件110と推定優良パラメータ107との組み合わせを、推定部8による推定結果の中から排除することができる。そして、運転条件のもとで、良い評価結果109が得られる位置決め動作を実行させる指令パラメータを、調整と推定とを組み合わせて効率的に探索することができる。
 さらに、運転パラメータとして、機械負荷3の慣性の大きさ、周囲温度等を採用してもよい。ここで、機械負荷3の慣性は機械の質量等によって決まる。慣性、周囲温度等に依存して、位置決め制御装置1000の外乱が変化し、位置決め動作の性能に影響を及ぼす場合がある。上述のように、制御性能に影響のある数値を、調整条件108を構成する運転パラメータとして採用し、各運転パラメータに対応した高性能な位置決め制御を行うことができる装置を構成してもよい。また、本実施の形態の開示は、機械負荷3が直動し、位置決め制御装置1000が、直動型の位置決めを制御する場合を例として説明したが、例えば、機械負荷3の可動部が回転し、回転型の位置決めを制御する場合についても適用可能である。このような場合、位置、速度及び加速度のそれぞれに代えて、角度、角速度、角加速度を用いてもよい。
 調整条件108が複数の運転パラメータを含み、運転パラメータごとに複数の値を取りうる場合、運転パラメータの種類と取りうる値との組み合わせの全てについて調整条件108を作成してもよい。調整条件108の一例を挙げる。例えば、運転パラメータとして、5つの値を取り得る目標移動距離と、3つの値を取り得る機械負荷3の慣性とが採用されたとする。このような場合、調整条件108の数をM=15とし、15の調整条件108を、調整条件108を調整部7及び調整レコード保持部10へと供給する主体が、テーブルに格納してもよい。ここで、独立変数を様々に変化させた場合に得られる数値を、独立変数に対応させて取り出すことが可能な状態に格納したデータをテーブルと称する。格納する場所の例としては、例えば、データを取り出し可能な記憶装置を挙げることができる。また、調整条件108を供給する主体とは、例えば、図9に示す運転条件決定部11のような構成要素としてもよい。
 図4は、本実施の形態における調整の動作の一例を示すフロー図である。調整部7は、ステップS101において、全調整回数Mを設定する。Mは調整条件108の総数としてもよい。ステップS102において、調整部7は、実行中の調整回数kを初期化しk=0とする。ここで、ステップS101とステップS102の順番は、どちらを先に実行してもよく、2つの動作の一部又は全部を同時に実行してもよい。次に、ステップS103において、調整部7は、実行中の調整回数kをインクリメントする。すなわち、kを1増加させる。次に、ステップS104において、調整部7は、M個の調整条件108のうちの第k番目の調整条件108を読み出す。なお、図4の説明では、あらかじめすべての調整条件108を決定してテーブルに格納したものを読み出す構成を例示するが、調整条件108をあらかじめ決定せず、ステップS104を実行するごとに、調整条件108を決定する構成としてもよい。
 次に、ステップS105において、調整部7は、第k番目の調整条件108のもとで後述する調整を実行し、第k番目の調整条件108に対応する優良パラメータ106を第k番目の優良パラメータ106として決定する。次に、ステップS106において、調整レコード保持部10は、第k番目の調整条件と第k番目の優良パラメータ106とを対応付けて、調整レコード111として保持する。次に、ステップS107において、調整部7は、kはM以上であるか否かを判断する。ステップS107において、kはM未満と判断した場合、ステップS103へ進む。そして、ステップS107において、kはM以上と判断されるまで、ステップS103からステップS107までの動作フローを繰り返し実行する。一方、ステップS107において、kはM以上と判断した場合、全ての調整条件108についての調整作業を終了する。図4に示す動作フローを実行することによって、調整条件108と調整条件108に対応する優良パラメータ106とを組にした調整レコード111を、M個の調整条件108のすべてについて調整レコード保持部10が保持する状態となる。
 次に、評価部6の構成及び動作を例示する。図5は、本実施の形態における偏差の時間応答の一例を示す図である。偏差とは、目標移動距離とモータ1の位置との間の差異である。図5の動作例において、モータ1の位置は、状態センサ5によって状態センサ信号101として検出されるとしている。図5(a)から図5(c)はそれぞれ、異なる試行パラメータ105に基づく位置決め動作の偏差の時間波形を示している。ここで、試行パラメータ105に基づいて指令生成部2が指令信号103を生成し、生成された指令信号103に基づき制御部4が位置決め動作を実行する場合、実行された位置決め動作を、試行パラメータ105に基づく位置決め動作と称する。また、図2の例では、ひとつの試行パラメータ105が7つの時間長で構成されたように、試行パラメータ105が複数のパラメータで構成されるとしてもよい。
 図5に示す例では、位置決めの完了時点を検出する際に、あらかじめ、位置決め制御の精度の基準となる許容幅IMPを定める。そして、位置決め制御を開始してから最初に偏差の大きさが許容幅IMP以下となるまでの時間を整定時間と称する。整定時間は、指令パターンが終了する終端時間T1+T2+T3+T4+T5+T6+T7よりも長くなる場合があるが、機械振動の影響等により、整定時間が終端時間より短くなる場合もあり得る。
 図5(a)の動作例では、整定時間はTst1であり、整定時間Tst1の後、振幅が収束するまで偏差の大きさが許容幅IMPを超えない。図5(b)の動作例では、整定時間はTst2であり、整定時間Tst2の後、振幅が収束するまでに、偏差の大きさが1回許容幅IMPを超える。図5(c)では、整定時間はTst3であり、整定時間Tst3の後、振幅が収束するまで偏差の大きさが許容幅IMPを超えない。ここで、整定時間Tst3は、整定時間Tst1より小さく、整定時間Tst2より大きい(Tst2<Tst3<Tst1)としている。整定時間より後に偏差が許容幅IMPを超えないことと、位置決め動作の開始時点から偏差があらかじめ定めた値より最初に小さくなるまでの時間である位置決め時間を短くすることの2つが求められているとする。そして、同じ調整条件108のもとで、図5(a)から図5(c)に示した3つの位置決め動作が実行されるとする。このような場合、図5(c)の動作例が最も制御性能が高く、図5(c)の位置決め動作を実行させた試行パラメータ105を、優良パラメータ106として決定してもよい。上記のように、位置決め時間に基づいて評価結果109を決定してもよい。なお、位置決め時間は、位置決め動作の開始時点を起点としているが、起点は、このような場合に限定されるものではない。例えば、位置決め動作の開始時点より一定の時間だけ前又は後の時点を起点とすることもできる。
 評価部6は、整定時間と、位置決め時間の経過時点からあらかじめ定めた時間が経過するまでの間に偏差の大きさが許容幅IMPを超えるか否かについての情報であるオーバーシュート情報とを組み合わせて評価結果を決定してもよい。このように、オーバーシュート情報に基づいて評価結果109を決定し、位置決め動作の完了時点より後に偏差の大きさが許容幅IMPを超える動作を実行させる試行パラメータ105が優良パラメータ106として選択される可能性を低下させることができる。また、偏差の振動振幅が大きい位置決め動作を実行させる試行パラメータ105が優良パラメータ106として選択される可能性を低下させることができる。また、評価部6は、(29)式の評価関数Eを評価結果として出力し、調整部7は、評価関数Eが小さいほど制御性能が高いとして評価関数Eの最小化を目標として調整を実行してもよい。また、(29)式の逆数を評価関数とし、評価関数が大きいほど制御性能が高いとして評価関数の最大化を目標として調整を実行してもよい。
Figure JPOXMLDOC01-appb-M000029
 (29)式の右辺の第1項のTstは整定時間である。また、第二項のL×Peは、オーバーシュート情報に基づいて決定されるペナルティの項である。第二項のPeはペナルティの有無を示す数値で、例えば、位置決め動作の完了時点からある一定の時間が経過するまでに偏差の大きさが許容幅を超えた場合に1とし、超えなかった場合に0としてもよい。また、第二項のLはペナルティの大きさを決定する正の定数である。Lを大きくすると、(29)式の評価関数は、整定時間に比べてペナルティに依存する度合いが大きくなり、ペナルティを避けることを優先する調整が実行される。一方、Lを小さくすると、評価関数は、ペナルティに比べて整定時間に依存する度合いが大きくなり、整定時間を短くすることを優先する調整が実行される。以上が、評価部6の構成及び動作の一例である。
 なお、評価部6の構成は上記に限定されるものではない。例えば、偏差の時間積分値とモータ1の推力の時間積分値とを用いて評価結果109を算出してもよい。また、これらを組み合わせて評価結果109を算出する最適レギュレータを用いてもよい。また、偏差の大きさが初めて許容幅以下となってから、あらかじめ定めた時間が経過するまで目標移動距離に対する位置の超過量の最大値を指標としてもよい。また、目標移動距離を超えて位置決め動作の終着地点から見て位置決め動作の開始地点とは逆の側に行き過ぎる距離であるオーバーシュートの大きさに基づいて評価結果109を決定してもよい。また、指令パターンの中の最大加速度、又は指令パターンの中の最大速度を用いて評価結果としてもよい。また、これらを組み合わせて使用しても良い。なお、位置決め制御装置1000は、評価部6を構成要素として含まない構成としてもよい。例えば、位置決め制御装置1000の外部にあるメモリ及びプロセッサ、プロセッサ等が、図1の評価部6と同様に、状態センサ信号101に基づいて位置決め動作、すなわち試行パラメータ105を評価してもよい。
 図6は、本実施の形態の調整の動作の一例を示すフロー図である。調整を開始すると、調整部7は、ステップS111において、1つの調整条件108のもとで実行する位置決め動作の試行回数の総数である総試行回数Vを設定する。ステップS112において、調整部7は、実行中の試行回数iを初期化する。例えばi=0としてもよい。図6の動作例では、試行パラメータ105をあらかじめV個用意し、第i番目の位置決め動作の実行の際には、用意したV個の試行パラメータ105の中から、第i番目の試行パラメータ105を設定するとしている。
 試行パラメータ105の設定方法の例として、グリッドサーチと呼ばれる総当り方式を挙げることができる。本実施の形態の図2を用いて例示した7つの時間長で構成される試行パラメータ105についてのグリッドサーチの一例を説明する。第1時間長T1がとりうる値を複数設定する。設定する値は0を含んでも良い。第1時間長T1が0の場合、動作開始から指令信号103の加速度が最大加速度に到達するまでの時間が0になる。第1時間長T1と同様に、第2時間長T2から第7時間長T7までの6つに関しても、それぞれのパラメータがとりうる値を離散的にいくつか設定する。7つの時間長は、負の値を取ることはできないことに留意する。次に、設定した値の組み合わせを、試行パラメータ105としてあらかじめ設定する。例えば、1つの試行パラメータ105を構成するパラメータが、第1時間長T1から第7時間長T7の7つあり、時間長の各々について3点ずつ離散的に値を設定すると仮定する。このような場合、組み合わせの数は、3の7乗の2187個となり、試行パラメータ105の数は2187個となる。この場合、総試行回数をV=2187としてもよい。以上が、グリッドサーチによる試行パラメータ105の設定の一例である。
 次にステップS113において、調整部7は、試行回数iをインクリメントする。すなわち、試行回数iを1増加させる。次に、ステップS114において、調整部7は、第i番目の位置決め動作の試行を実行するための試行パラメータ105を決定する。次に、ステップS115において、調整部7は、ステップS111において設定したV個の試行パラメータ105から、第i番目の試行パラメータ105を読み出す。そして、指令生成部2は、調整条件108と読みだした試行パラメータ105とに基づいて指令信号103を決定する。ステップS115において、制御部4は、指令信号103及び状態センサ信号101に基づいて駆動電力Eを決定し位置決め動作を実行する。さらに、ステップS115において、状態センサ5は、第i番目の状態センサ信号101を決定する。次に、ステップS116において、評価部6は、第i番目の評価結果109を決定し、調整部7は、第i番目の評価結果109を取得する。第i番目の評価結果109は、第i番目の位置決め動作に対する評価結果である。次に、ステップS117において、調整部7は、iがV以上であるか否かの判断を実行する。ステップS117において、調整部7は、iがVより小さいと判断した場合、ステップS113へ進む。そして、ステップS117において、iがV以上と判断されるまで、ステップS113からステップS117までの動作フローを繰り返し実行し、第1番目から第V番目までの位置決め動作と位置決め動作の各々に対応する評価結果109の決定が実行される。
 一方、iがV以上と判断された場合(i≧V)、調整部7は、ステップS118へ進む。このとき、上述の第1番目から第V番目までの位置決め動作が実行され、位置決め動作に用いられたV個の試行パラメータ105と、試行パラメータ105の各々に対応する評価結果109とが得られた状態となっている。ステップS118において、調整部7は、V個の評価結果109の中から、位置決め制御の性能が最良であった試行パラメータ105を選択し、調整条件108のもとでの優良パラメータ106として決定する。なお、図4に説明したように、調整部7は、調整条件108の各々について調整を実行し、優良パラメータ106を得る。そのため、図4に示したフロー図による動作では、優良パラメータ106を、合計M個得る。
 以上のように、ステップS111からステップS118までの動作フローを実施することによって、1つの調整条件108に対応する評価結果109が最も優良となる試行パラメータ105を、優良パラメータ106として決定してもよい。なお、調整の方法は上記に限るものではなく、調整条件に対応する優良パラメータ106を異なる手順で決定してもよい。また、図6の例では、最良の位置決め動作を実行した試行パラメータ105を優良パラメータ106として選択しているが、必ずしも、試行パラメータ105の中から選択する必要はない。調整条件108のもとで、最良の位置決め動作を与える指令パラメータを選択すればよい。本実施の形態では、指令パターンを規定する指令パラメータを、位置決め制御の性能が優良となるよう調整する方法を説明した。別の例として、制御部4がフィードバック制御又はフィードフォワード制御を実行する場合に用いる制御ゲインが、指令パラメータの中に含まれる構成とし、調整によって制御ゲインの最適値を探索してもよい。
 図7は、本実施の形態における位置決め制御装置1000が備える処理回路をプロセッサ10001及びメモリ10002で構成する場合の構成例を示す図である。処理回路がプロセッサ10001及びメモリ10002で構成される場合、位置決め制御装置1000の処理回路の各機能は、ソフトウェア、ファームウェア、又はソフトウェアとファームウェアとの組み合わせによって実現される。ソフトウェア、ファームウェア等はプログラムとして記述され、メモリ10002に格納される。処理回路では、メモリ10002に記憶されたプログラムをプロセッサ10001が読み出して実行することによって、各機能を実現する。すなわち、処理回路は、位置決め制御装置1000の処理が結果的に実行されることになるプログラムを格納するためのメモリ10002を備える。また、これらのプログラムは、位置決め制御装置1000の手順および方法をコンピュータに実行させるものであるともいえる。
 ここで、プロセッサ10001は、CPU(Central Processing Unit)、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、又はDSP(Digital Signal Processor)等であってもよい。メモリ10002は、例えば、RAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ、EPROM(Erasable Programmable ROM)、EEPROM(登録商標)(Electrically EPROM)等の、不揮発性又は揮発性の半導体メモリとしてもよい。また、メモリ10002を、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、又はDVD(Digital Versatile Disc)等としてもよい。
 図8は、本実施の形態における位置決め制御装置1000が備える処理回路を専用のハードウェアで構成する場合の構成例を示す図である。処理回路が専用のハードウェアで構成される場合、図8に示す処理回路10003は、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、又はこれらを組み合わせたものとしてもよい。位置決め制御装置1000の機能を、機能ごとに処理回路10003によって実現してもよく、複数の機能をまとめて処理回路10003によって実現してもよい。なお、位置決め制御装置1000と制御対象2000とは、ネットワークを介して接続してもよい。また、位置決め制御装置1000は、クラウドサーバ上に存在してもよい。
 以上のように、本実施の形態によれば、調整に要する時間が短く、高性能な位置決め動作を実行可能な位置決め制御装置を提供することができる。
 実施の形態2
 図9は、本実施の形態における位置決め制御装置1000aの構成の一例を示すブロック図である。位置決め制御装置1000aは、実施の形態1の位置決め制御装置1000の構成要素に加えて、運転条件決定部11を備える。運転条件決定部11は、調整レコード111又は制御対象2000の機械諸元に基づいて調整条件108又は未調整条件110のいずれか一方又は両方を決定する。より具体的には、調整条件108の運転パラメータ又は未調整条件110の運転パラメータを決定する。本実施の形態において、図1と同じ又は対応する構成要素については、図1と同一の符合を付す。
 以下の説明では、調整条件108又は未調整条件110が設定される運転条件の範囲を調整範囲と称する。調整範囲とは、運転パラメータの範囲としてもよい。運転パラメータが複数ある場合、運転パラメータを複数有する運転条件について、複数の運転パラメータの範囲を調整範囲とし、運転パラメータの数だけの次元数を有する多次元空間の中に定められる範囲を調整範囲としてもよい。運転条件決定部11は、調整範囲の中で調整条件108又は未調整条件110の運転パラメータの値を定める。なお、設定した調整条件108はテーブルとして保持してもよい。例えば、調整範囲の中に、複数の調整条件108の運転パラメータが等間隔に配置されるように設定してもよい。
 図10は、本実施の形態における運転条件決定部11の構成を例示する図である。図10(a)に示す運転条件決定部11は、精度推定部1101、機械諸元1102及び決定部1103を備える。機械諸元1102として、モータ1、機械負荷3等についての機械諸元が格納されている。機械諸元1102として格納される機械諸元の例としては、モータ1の最大速度、最大加速度、最大トルク、機械負荷3の慣性等を挙げることができる。機械諸元1102は、例えば、記憶装置に記録された取り出し可能な情報としてもよい。精度推定部1101は、調整範囲の中の一部又は全部について、推定部8にとって、推定優良パラメータ107を高い精度で推定することが容易であるか困難であるかの度合いを、機械諸元1102又は調整レコード111に基づいて推定する。
 ここで、推定優良パラメータ107を高い精度で推定することが容易な範囲とは、推定優良パラメータ107と、優良パラメータ106との差異が、調整範囲の中の他の部分と比較して小さい範囲としてもよい。ここで、上記の推定優良パラメータ107は、その範囲に含まれるひとつの運転条件を未調整条件110として推定部8が推定した推定優良パラメータ107である。そして、優良パラメータ106とは、上記と同じ運転条件を試行パラメータ105として調整部7が調整を実行して決定した優良パラメータ106である。また、例えば、(22)式のように、線形補間を用いて推定部8が推定を実行する場合を考える。このような場合、精度推定部1101は、調整レコード111に基づき、調整範囲の中で、調整条件108の運転パラメータと優良パラメータ106との関係が線形の関係に近い部分を高精度範囲としてもよい。また、線形の関係と大きく異なる部分については低精度範囲としてもよい。このようにして、精度推定部1101が高精度範囲と低精度範囲を設定してもよい。
 決定部1103は、高い精度での予測が困難な範囲における調整条件108の密度を増加させてもよい。また、高い精度での予測が容易な範囲における未調整条件110の密度を増加させてもよい。ここで、調整条件108又は未調整条件110の密度とは、運転パラメータの密度としてもよい。ここで、運転パラメータの密度とは、運転パラメータの値の一定の幅の中に配置された運転パラメータの数の多さの度合いである。すなわち、運転パラメータの値の一定の幅の中に配置された運転パラメータの数が多い場合、運転パラメータの密度が高いと称している。
 以下に、精度推定部1101の動作を例示する。運転パラメータが目標移動距離であるとする。また、機械負荷3が共振周波数を有すると仮定する。そして、モータ1の速度及び加速度がそれぞれ、最大速度以下及び最大加速度以下に制限されているとする。そして、機械負荷3は、停止した状態(速度ゼロの状態)から最大速度の状態まで、最大加速度で加速し、次に、最大速度で可能な限り長い時間移動し、その後、停止するまで最大加速度で減速する位置決め動作を行うとする。このような場合、速度を時系列に示す速度パターンの形状(指令パターン)は、理想的には2等辺台形形状となる。そして、調整範囲の中に振動が発生しやすい目標移動距離があるとする。この振動が発生しやすい目標移動距離の近辺では、目標移動距離の変化に依存して、振動の発生しにくい指令パラメータの値が急激に変化する。そのため、振動が発生しやすい目標移動距離の近辺を、推定優良パラメータ107の高精度な推定が困難な低精度範囲としてもよい。以上が、精度推定部1101の動作の一例である。
 なお、機械負荷3が解析的な式によって動作する可能性が高い運転条件の範囲を、推定優良パラメータ107の推定が容易な範囲である高精度範囲と定めてもよい。また、低精度範囲の数、高精度範囲の数は、ひとつでも複数でもよく、調整範囲の中に、高精度範囲と低精度範囲とが混在してもよい。そして、複数の低精度範囲又は高精度範囲を設定する場合、低精度範囲、高精度範囲等の幅は同じもよく、互いに異なってもよい。また、複数の運転パラメータの全部について低精度範囲又は高精度範囲を設定してもよく、一部について低精度範囲又は高精度範囲を設定してもよい。以上のように、図10(a)に説明した本実施の形態の構成によれば、推定部8が推定優良パラメータ107を推定する際の難度に応じて調整条件108又は未調整条件110を設定することができる。そのため、調整を実行することが効果的な範囲を選択して調整を実行させることができる。
 図10(b)に示す運転条件決定部11は、図10(a)に示した精度推定部1101に代えて調整範囲決定部1104を備える。図10(a)に示す構成例では、あらかじめ与えられた調整範囲に対して調整条件108又は未調整条件110を決定したが、図10(b)に示す構成例では、調整範囲決定部1104が機械諸元1102又は調整レコード111に基づいて調整範囲を決定する。
 以下に、調整範囲決定部1104が調整範囲を決定する動作を例示する。モータ1の最大速度であるVmaxと、モータ1の最大加速度であるAmaxとが、機械諸元1102として記憶されているとする。機械負荷3は、停止した状態(速度ゼロの状態)から最大速度の状態まで、最大加速度で加速し、次に、最大速度で可能な限り長い時間移動し、最大加速度で減速する位置決め動作を行うとする。調整範囲が運転パラメータである目標移動距離で与えられ、目標移動距離0から目標移動距離Dmaxが調整範囲であるとする。調整範囲決定部1104は、目標移動距離の最大値であるDmaxを決定することによって調整範囲を決定すると仮定する。
 Vmax/Amaxは、最大速度と最大加速度とが制限されるモータの間欠方式(Point-to-Point)の位置決めにおいて、最大加速度で加速し、最大加速度で減速し、速度の最高到達点で最大速度となる場合の目標移動距離である。このような場合、目標移動距離がVmax/Amaxを下回ると、速度パターンの形状(指令パターン)は三角形状になり、最大速度Vmaxで移動する区間がなく、振動が発生しやすい。そのため、調整を実行することによって位置決め時間を大きく短縮することが期待できる。すなわち、調整の効果が大きい。
 一方、目標移動距離がVmax/Amaxを上回る場合、速度パターンの形状(指令パターン)は台形形状となり、最大速度Vmaxで移動する区間が生じる。このような場合、振動は発生しにくく、調整によって位置決め時間を大きく短縮することは期待できない。すなわち、調整の効果が小さい。上記に述べた内容により、目標移動距離がVmax/Amaxを上回る場合、調整の効果は小さく、目標移動距離がVmax/Amaxを下回る場合、調整の効果は小さいということができる。このような場合、調整範囲決定部1104は、次のように、(30)式を用いて調整範囲を決定してもよい。
Figure JPOXMLDOC01-appb-M000030
 (30)式のCは正の定数である。調整範囲決定部1104は、(30)式のCを、例えば、0.5から3の間として、(30)式の目標移動距離が0からDmaxの範囲を調整範囲としてもよい。さらに好ましくは、(30)式のCを1として(30)式の目標移動距離が0からDmaxの範囲を調整範囲としてもよい。このようにすれば、Vmax/Amaxを指標値として、この指標値と同程度の値を下回る場合を調整範囲とすることができる。すなわち、調整の効果が大きい範囲を調整範囲とし、調整を行う時間をさらに短縮してもよい。以上が、調整範囲決定部1104の動作の一例である。決定部1103は、調整範囲決定部1104の定めた調整範囲に、調整条件108を設定する。なお、調整条件108又は未調整条件110を調整範囲の中に、互いに等しい間隔に設定してもよい。また、調整レコード111に基づいて、調整条件108の運転パラメータに対して調整条件108に対応する優良パラメータ106が急激に変化している領域を調整範囲に決定してもよい。言い換えれば、調整レコード111に基づいて、調整条件108に依存して優良パラメータ106の変化が大きい運転条件の範囲を調整範囲として定めてもよい。そして、調整によって位置決め動作に要する時間を短縮できる効果、又は、調整によって振動を低減する効果が大きい運転条件の範囲を調整範囲として定めてもよい。
 以上説明したように、本実施の形態によれば、調整に要する時間が短く、高性能な位置決め動作を実行可能な位置決め制御装置を提供することができる。さらに、モータ1の機械諸元もしくは機械負荷3の機械諸元、又は調整レコード111に基づいて調整条件108又は未調整条件110を決定する運転条件決定部11を備える。
 運転条件決定部11は、推定部8が高精度に推定優良パラメータ107を推定する容易さの度合いを決定する精度推定部1101を備えてもよい。このような場合、調整範囲の中の、推定優良パラメータ107の推定精度に応じて調整条件108の数を増減させることができる。そのため、低精度範囲には、多くの調整条件108を設定し、推定によらず調整によって優良パラメータ106を得ることができる。そして、効率良く調整を実行することができる。また、高精度範囲には、多くの未調整条件110を設定して、調整によらず推定によって推定優良パラメータ107を得ることができる。そして、調整を行う時間をさらに短縮することが可能となり、効率良く調整を実行することができる。
 また、運転条件決定部11は、調整条件108が設定される運転条件の範囲である調整範囲を決定する調整範囲決定部1104を備えてもよい。このような場合、調整による位置決め時間の短縮の効果が大きいことが期待できる範囲を調整範囲として、調整を実行することができる。そして、調整を行う時間をさらに短縮することが可能となり、効率良く調整を実行することができる。
 実施の形態3
 図11は、本実施の形態における位置決め制御装置1000bの構成の一例を示すブロック図である。位置決め制御装置1000bは、実施の形態1の位置決め制御装置1000の調整部7及び調整レコード保持部10に代えて、調整部7a及び調整レコード保持部10aをそれぞれ備える。そして、図1に示す位置決め制御装置1000には含まれない調整管理部9を備える。図11の説明において、図1と同じ又は対応する構成要素については、図1と同一の符合を付す。
 位置決め制御装置1000と位置決め制御装置1000bとの相違点の概略を述べる。位置決め制御装置1000bは、未調整条件110と推定優良パラメータ107とによる位置決め動作を実行する。そして、実行した位置決め動作の良又は不良を判断し、位置決め動作が不良である場合、新たな運転条件である追加調整条件112を決定する。そして、調整部7aが追加調整条件112のもとで調整を実行して、指令パラメータのひとつを、追加調整条件112に対応する追加優良パラメータ113として決定する。
 位置決め制御装置1000bの動作について説明する。調整部7aは、実施の形態1の調整部7と同様に、調整条件108のもとでの調整を実行する。そして、調整レコード保持部10aは、実施の形態1の調整レコード保持部10と同様に調整レコード111を保持する。図1の位置決め制御装置1000では、推定部8が未調整条件110を外部から取得した。一方、図11の位置決め制御装置1000bでは、調整管理部9が未調整条件110を決定する。図11の位置決め制御装置1000bにおいても、未調整条件110を外部から取得する構成としてもよい。図11の推定部8は、図1の推定部8と同様に、指令パラメータのひとつを、未調整条件110に対応する推定優良パラメータ107として決定する。さらに、調整部7aは、未調整条件110と推定優良パラメータ107とによる位置決め動作である検証位置決め動作を実行する。換言すれば、調整管理部9が決定した未調整条件110と推定部8が決定した推定優良パラメータ107とによって、指令生成部2及び制御部4に位置決め動作を実行させる。さらに、調整管理部9は、評価部6から検証位置決め動作についての評価結果109を取得し、検証位置決め動作についての評価結果109が、あらかじめ定めた基準を満たすか否かを判断する。上記の調整部7aが実行する検証位置決め動作及び調整管理部9が実行する判断を検証と称する。
 この検証の結果得られた判断結果が、あらかじめ定めた基準を満たさない場合、調整管理部9は追加調整条件112を決定する。ここで、追加調整条件112は、調整レコード111に含まれる調整条件108とは異なる運転条件とすることが望ましい。さらに、調整部7aは、決定された追加調整条件112のもとで調整を実行し、指令パラメータのひとつを追加調整条件112に対応する追加優良パラメータ113として決定する。調整レコード保持部10aは、追加調整条件112と追加優良パラメータ113との組を、追加調整レコードとして保持する。なお、実行した推定優良パラメータ107に基づく位置決め動作が、あらかじめ定めた基準を満たす場合、未調整条件110と推定優良パラメータ107との組を、調整レコード111として調整レコード保持部10aが保持してもよい。また、この未調整条件110と推定優良パラメータ107との組についても、調整レコード111ではなく追加調整レコードとして保持してもよい。
 図12は、本実施の形態における運転条件と指令パラメータとの対応関係の一例を示す図である。図12の横軸は運転条件である。図12の縦軸は、指令パラメータである。図12において、実施の形態1の図3と同一又は対応するデータ点、軸等については、図3と同じ符合を付す。図12(a)のデータ点、軸等に付された符合の意味は、図3(a)と同一である。図12(b)には、図12(a)に示したデータ点に加え、未調整条件110と推定優良パラメータ107とが示されている。ここで、未調整条件110と推定優良パラメータ107とを未調整データと称する。ここで、検証の結果があらかじめ定めた基準を満たすと判断された未調整データ、すなわち、良である未調整データは、中抜き記号(白丸記号)を用いて示す。一方、基準を満たさないと判断された未調整データ、すなわち、検証の結果が否である未調整データは、バツ印記号(掛け算記号)を用いて示す。図10では、隣り合う調整条件108の間の運転条件の範囲を、未知区間と称する。なお、未知区間は、上記の隣り合う調整条件108の間の運転条件の範囲に加えて、調整条件108の配置される範囲である調整範囲の端部と、この端部に隣接する調整条件108の間の範囲も未知区間としてもよい。未知区間INT(n)は、2つの調整条件108の運転パラメータである、D(n)とD(n+1)との間の開区間としている。(31)式に示すように、未知区間INT(n)を、(D(n)、D(n+1))とする。なお、図12に示す例では、未知区間INT(n―2)から未知区間INT(n+1)までの4つの未知区間を図示しているが、未知区間の数は調整条件108の数に応じて増減させることができる。
Figure JPOXMLDOC01-appb-M000031
 図12(c)には、図12(b)と同様に、未調整データのうち、検証の結果が良と判断されたデータ点は白丸で示されているが、検証の結果が否と判断されたデータ点は、示していない。そして、追加調整条件112と追加優良パラメータ113とが、二重丸記号で示されている。前述のように、追加調整条件112と追加優良パラメータ113との組を追加調整レコードと称する。図12(b)では、未知区間INT(n―2)及び未知区間INT(n―1)に、検証の結果が否の未調整データが存在するとしている。調整管理部9は、検証の結果が否の未調整データが存在する未知区間の各々に追加調整条件112を1つずつ追加する。すなわち、未知区間INT(n―2)及び未知区間INT(n―2)のそれぞれに追加調整レコードを1点ずつ追加する。
 未知区間INT(n―2)に追加した追加調整レコードを、Dad1及びTjad1によるデータ点とする。未知区間INT(n―1)に追加した追加調整レコードを、Dad2及びTjad2によるデータ点とする。以上のように、本実施の形態の位置決め制御装置1000aは、未調整データについて検証を実行する。そのため、基準を満たさない位置決め動作を実行させる未調整データを検出することができる。そして、前述のように、調整管理部9は、2つの調整条件108の間の区間である未知区間のうち、検証によって、否と判断された未調整データが存在する未知区間に追加調整条件112を決定することができる。このように追加調整条件112の配置を決定すれば、否と判断された未調整データの未調整条件110に近い運転条件を、追加調整条件112として決定することができる。ここで、2つの運転条件が近いとは、2つの運転条件の有する同種の運転パラメータの値が近いという意味としてもよい。すなわち、推定優良パラメータ107の推定精度が低い領域に対して選択的に追加調整条件112を配置することができる。以上により、効率よく調整を実行することができる。
 図13は、本実施の形態における位置決め制御装置1000bの動作の一例を示すフロー図である。図13は、図12(a)に示す調整レコード111を調整レコード保持部10aが保持してから、図12(c)の追加調整レコードを調整レコード保持部10aが保持するまでの動作フローを示す。なお、図13の動作フローを開始する前に、図12(a)に示されている調整レコード111が調整レコード保持部10aに保持されているとする。動作フローを開始すると、ステップS201において、調整管理部9は、調整レコード保持部10aに保持された調整条件108の数に応じて、未知区間の数を決定する。未知区間の数をPとする。次に、ステップS202において、調整管理部9は、処理中の未知区間の番号である未知区間番号qの初期化を実行する。ここで、ステップS202において、図13ではqの値を0とする初期化を実行しているが、初期化として、例えば1などの他の値に設定してもよい。
 次に、ステップS203において、調整管理部9は、処理中の未知区間番号qをインクリメントする。換言すると、処理中の未知区間番号qを1増加させる。次に、ステップS204において、調整管理部9は、第q番目の未知区間の未調整条件110をL個決定する。そして、ステップS205において、調整管理部9は、処理中の未調整条件番号wを初期化する。例えば、初期化として、wの値を0としてもよい。このL個の未調整条件110は、位置決め制御の性能を確認することが可能な数を用意することが望ましい。図12(a)に示した例では、各未知区間につき4つの未調整条件110を決定しており、L=4としている。
 次に、ステップS206において、調整管理部9は、処理中の未調整条件番号wをインクリメントする。換言すれば、処理中の未調整条件番号wを1増加させる動作を実行する。次に、ステップS207において、推定部8は、第w番目の未調整条件110に対応する推定優良パラメータ107を決定する。次に、ステップS208において、調整部7a等は、第w番目の未調整データによる位置決め動作である第w番目の位置決め動作を実行する。次に、ステップS209において、調整管理部9は、第w番目の位置決め動作において得られた状態センサ信号101に基づいて評価部6による第w番目の評価結果109を得る。次に、ステップS210において、調整管理部9は、wがL以上か否かの判断を実行する。そして、wがL未満の場合、ステップS206へ進む。そして、ステップS210においてwがL以上と判断されるまで、ステップS206からステップS210までの動作フローを繰り返し実行する。一方、ステップS210において、Lがw以上と判断された場合、ステップS211へ進む。このとき、第1番目の評価結果109から第L番目の評価結果109までのL個の評価結果が得られた状態となっている。
 ステップS211において、調整管理部9は、上記のL個の評価結果のすべてが、あらかじめ定めた基準を満たすか否かを判断する。ステップS211において、L個の評価結果のすべてが基準を満たすと判断した場合、ステップS212へ進む。一方、ステップS211において、L個の評価結果のうち少なくとも1つが基準を満たさないと判断した場合、ステップS213へと進む。ステップS212へ進んだ場合、調整管理部9は、Lがq以下であるか否かを判断する。Lがq以下である場合、動作フローを終了する。一方、Lがqより大きい場合、ステップS203へと進み、ステップS212において、Lがq以下であると判断されるまでステップS203からステップS212までの動作フローを繰り返し実行する。
 ステップS213に進んだ場合、調整管理部9は、追加調整条件112を決定する。そして、ステップS214において、調整部7aは、追加調整条件112のもとでの調整である追加調整を実行し、追加優良パラメータ113を決定する。そして、ステップS215において、調整レコード保持部10aは、追加調整条件112と追加優良パラメータ113との組を追加調整レコードとして保持する。そして、ステップS204へ進む。そして、ステップS211でL個の評価結果が基準を満たすと判断されるまでステップS204からステップS215までの動作フローを繰り返し実行する。
 なお、図12の動作例では、隣り合う2つの調整条件108の間の全体を未知区間が占めるとしているが、未知区間は、隣り合う2つの調整条件108の間の一部としてもよい。例えば、運転条件の範囲の中で、利用される可能性が低い部分が未知区間に含まれないように未知区間を設定してもよい。また、調整管理部9は、利用する可能性が低い運転条件の範囲に比べて、利用する可能性が高い運転条件の範囲により多くの未知区間を配置してもよい。そして、利用する可能性が高い運転条件の範囲に、より多くの追加調整条件112を設け、重点的に調整を実行してもよい。また、未調整条件110の間の間隔、未調整条件110と調整条件108との間の間隔は、均等に設定してもよく不均等に設定してもよい。また、未調整条件110の設定において、乱数を用いて確率的に未調整条件110を決定してもよい。
 図12に示す動作例では、追加調整条件112を、未知区間の中心に1点とるが、未知区間の中に追加調整条件112を2点以上配置してもよい。また、追加調整条件112が定められた状態において、別の運転条件を新たに追加調整条件112として定める場合、既存の追加調整条件112を残してもよく削除してもよい。また、追加調整条件112を、検証において否と判断された未調整条件110に基づいて変更してもよい。例えば、否と判断された未調整条件110から所定の距離以下の範囲に、追加調整条件112を設けてもよい。そして、否と判断された未調整条件の付近を狙って調整を実行することによって効率よく調整を実行してもよい。ここで、2つの運転条件の間の距離とは、この2つの運転条件の含む同種の2つの運転パラメータの間の差異としてもよい。
 図11に示す調整管理部9は、検証の結果得られた判断結果があらかじめ定めた基準を満たさない場合に追加調整条件112を決定する。しかしながら、本実施の形態の調整管理部9の動作は、このような形態に限定されるものではない。調整部7a及び調整管理部9が検証を実行しない場合でも、調整管理部9は、運転条件のひとつである追加調整条件112を決定することができる。また、検証が実行された場合に、実行した検証の結果に関わらず、調整管理部9は、運転条件のひとつである追加調整条件112を決定することができる。そして、調整が実行されていない運転条件に対して追加で調整を実行できるため、調整管理部9が決定する追加調整条件112は、調整条件108とは異なる運転条件とするのが好適である。図11に示す調整部7aは、上記のように決定された追加調整条件112のもとでの調整を実行し、指令パラメータのひとつを、決定された追加調整条件112に対応する追加優良パラメータ113として決定することができる。そして、調整レコード保持部10aは、このように決定された追加調整条件112と追加調整条件112に対応する追加優良パラメータ113との組を追加調整レコードとして保持することができる。
 以上説明したように、本実施の形態によれば、実施の形態1と同様に、調整に要する時間が短く、高性能な位置決め動作を実行可能な位置決め制御装置を提供することができる。さらに、本実施の形態の位置決め制御装置1000bは、調整管理部9を備える。調整管理部9は、調整条件108とは異なる運転条件のひとつである追加調整条件112を決定する。そして、調整部7aは、追加調整条件112のもとでの調整を実行し、指令パラメータのひとつを、追加調整条件112に対応する追加優良パラメータ113として決定する。調整レコード保持部10aは、追加調整条件112と追加優良パラメータ113との組を追加調整レコードとしてさらに保持する。本実施の形態によれば、調整レコード111に含まれない追加調整条件112のもとでの調整を実行して、評価結果109が良い指令パラメータを決定することができる。そのため、より高精度に位置決め動作を実行することができる位置決め制御装置を提供することができる。
 また、調整部7aは、未調整条件110と推定優良パラメータ107とによる位置決め動作を検証位置決め動作として実行する。調整管理部9aは、検証位置決め動作の際の状態センサ信号101による評価結果109があらかじめ定めた基準を満たすか否かを判断する。そして、基準を満たさない場合、調整管理部9aは、追加調整条件112を決定する。そのため、推定優良パラメータ107についての評価の結果が基準を満たさない場合を選択して追加調整条件112を設定することが可能となり、不要な調整を行わずに効率の良い調整を実行することができる。
 調整管理部9は、未知区間のうち、基準を満たさないと判断された未調整条件110が配置された未知区間に追加調整条件112を決定してもよい。ここで、未知区間を、隣接する調整条件108の間の運転条件の範囲としてもよい。また、未知区間を、調整条件108が配置される範囲である調整範囲の端とこの調整範囲の端に隣接する調整条件108の間の運転条件の範囲としてもよい。本実施の形態の位置決め制御装置は、上記のような構成を有するため、基準を満たさないと判断された未調整条件110の近くに追加調整条件112を決定することができる。そのため、推定優良パラメータ107の推定の精度が低い部分に、選択的に追加調整条件112を決定することができる。
 また、調整管理部9は、図9、図10に示した、調整条件108又は未調整条件110を決定する運転条件決定部11と同様に、機械諸元1102、調整レコード111等を利用して追加調整条件112を決定することもできる。また、運転条件108が目標移動距離を指定する場合に、調整管理部9は、あらかじめ定めたモータ1の最大速度とあらかじめ定めたモータ1の最大加速度とに基づいて基準距離を決定してもよい。そして、追加調整条件112の目標移動距離が、上記の基準距離と同じか上記の基準距離より小さくなるように、追加調整条件112を決定してもよい。基準距離は、あらかじめ定めたモータの最大速度が大きくなるほど長くなり、あらかじめ定めたモータの最大加速度が大きくなるほど短くなるような距離としてもよい。また、例えば、モータ1の最大加速度及びモータ1の最大速度が、モータ1の機械諸元として与えられているとする。そして、調整管理部9は、Cを1とした(30)式に記載のDmaxを基準距離として定め、この基準距離以下の範囲に、運転条件である目標移動距離が設定されるように、追加調整条件112を決定してもよい。このように、追加調整条件112を決定すれば、調整によって、位置決め動作に要する時間を顕著に短縮することができる範囲、すなわち、調整が有効な範囲に、追加調整条件112を設定することができる。
 実施の形態4
 図14は、本実施の形態における位置決め制御装置1000cの構成の一例を示すブロック図である。位置決め制御装置1000cの構成は、調整部7に代えて調整部7bを備える点を除き、実施の形態1の図1に示す位置決め制御装置1000と同じである。図15は、調整部7bの構成の一例を示すブロック図である。調整部7bは、調整学習部70を備える。図14、図15に示す構成要素のうち、実施の形態1の図1に示す構成要素と同じ又は対応する構成要素については、同一の符号を付す。
 調整学習部70は、位置決め動作に用いた試行パラメータ105と実行された位置決め動作の評価結果109を含む状態量との関係を学習し、学習した結果に基づいて試行パラメータ105を決定する。調整学習部70は、評価結果109に基づいて報酬rを計算する報酬計算部701と、報酬rに基づいて価値関数Qを更新する価値関数更新部702とを備える。なお、図15の調整学習部70は、試行パラメータ105と評価結果109との関係を学習するが、調整学習部70は、試行パラメータ105と評価結果109を含む調整状態量との関係を学習してもよい。調整状態量の例としては、調整条件108、モータ1又は機械負荷3の機械諸元、温度、湿度等の周囲の環境等を挙げることができる。さらに、調整学習部70は、価値関数Qに基づいて調整の際に実行される位置決め動作に用いる試行パラメータ105を決定する意思決定部703を備える。本実施の形態では、図6のステップS114の動作において、調整学習部70が、試行パラメータ105を決定する。左記を除き、本実施の形態の動作フローは、実施の形態1の図4及び図6と同様である。
 調整学習部70が試行パラメータ105を決定する動作の一例について説明する。調整学習部70は、様々な学習アルゴリズムを用いて学習を実行することができる。本実施の形態では、強化学習(Reinforcement Learning)を適用した場合を一例として説明する。強化学習は、ある環境内におけるエージェント(行動主体)が現在の状態を観測し、取るべき行動を決定するというものである。エージェントは行動を選択し、環境から報酬を得る。そして、一連の行動を通じて報酬が最も多く得られるような方策を学習する。強化学習の代表的な手法として、Q学習(Q-Learning)、TD学習(TD-Learning)等が知られている。例えばQ学習の場合、行動価値関数Q(s,a)の一般的な更新式は、(32)式で表される。更新式は、行動価値テーブルで表記することもできる。
Figure JPOXMLDOC01-appb-M000032
 (32)式において、sは時刻tにおける環境をあらわし、aは時刻tにおける行動をあらわす。行動aによって環境はst+1に変わる。rt+1はその環境の変化によってもらえる報酬をあらわし、γは割引率をあらわし、αは学習係数をあらわす。なお、割引率γは0より大きく1以下の範囲(0<γ≦1)、学習係数αは0より大きく1以下の範囲(0<α≦1)とする。Q学習を適用した場合、行動aは、試行パラメータ105の決定である。環境sは、調整条件108、モータ1の初期位置等で構成される。
 報酬計算部701が報酬rを決定する動作を例示する。報酬計算部701は、評価結果109に応じて報酬rを決定する。実施の形態1に例示した評価部6は、評価結果109を、整定時間又は位置決め時間と、オーバーシュート情報とに基づいて決定する。ここで、オーバーシュート情報とは、前述のように、整定時間の経過時点からあらかじめ定めた時間が経過するまでの間に偏差の大きさが許容幅IMPを超えるか否かについての情報である。以下では、あらかじめ定めた時間が経過するまでの間に許容幅IMPを超える場合、オーバーシュート情報は良であると称し、あらかじめ定めた時間が経過するまでの間に許容幅IMPを超えない場合、オーバーシュート情報は否であると称する。オーバーシュート情報が否である場合、整定時間の逆数の値から5を減算した値を報酬rとし、オーバーシュート情報が良である場合、整定時間の逆数の値を報酬rとする。例えば、オーバーシュート情報が否で整定時間が0.1秒の場合、報酬rを整定時間の逆数である10から5を減じた5とする。報酬計算部701は、このように報酬rを決定することによって、整定時間が短く、かつ、オーバーシュート情報が良となる試行パラメータ105を探索してもよい。また、評価部6は、目標移動距離を超えて位置決め動作の開始地点とは逆の側に行き過ぎる距離であるオーバーシュートの大きさに基づいて評価結果109を決定してもよい。
 価値関数更新部702は、報酬計算部701が計算した報酬rに基づいて行動価値関数Qを更新する。意思決定部703は、更新された行動価値関数Qが最も大きくなる行動aを決定する。すなわち、行動価値関数Qが最も大きくなるように、試行パラメータ105を決定する。なお、位置決め制御装置1000cの説明では、調整学習部70が用いる学習アルゴリズムとして強化学習を適用した場合について説明したが、本実施の形態の学習アルゴリズムは、強化学習に限定されるものではない。教師あり学習、教師なし学習、半教師あり学習等の公知の学習アルゴリズムを適用することも可能である。また、上述した学習アルゴリズムとしては、特徴量そのものの抽出を学習する深層学習(Deep Learning)を用いてもよい。また、他の方法、例えば、ニューラルネットワーク、遺伝的プログラミング、機能論理プログラミング、サポートベクターマシン、ベイズ最適化等に従って機械学習を実行してもよい。
 また、本実施の形態に説明した学習を実行した学習済み学習器を備える位置決め制御装置を構成してもよい。学習済み学習器は、学習済のデータ、学習済のプログラム、又はこれらの組み合わせで構成してもよい。学習済み学習器を用いることにより、他の位置決め制御装置を用いた学習を利用することができるため、新たに学習を行わずに、高性能な位置決めを実現できる位置決め制御装置を提供することができる。また、図9に示す調整部7、図11に示す調整部7aに、本実施の形態に説明した構成を適用し、調整を効率的に実行してもよい。
 以上、説明したように、本実施の形態の位置決め制御装置1000cは、実施の形態1と同様に、調整に要する時間が短く、高性能な位置決め動作を実行可能な位置決め制御装置を提供することができる。さらに、本実施の形態の位置決め制御装置1000cは、調整部7bを備える。調整部7bは、試行パラメータ105と評価結果109を含む調整状態量との関係を学習し、学習した結果に基づいて試行パラメータ105を決定する調整学習部70を備える。学習の結果を利用することにより試行パラメータを決定することができる。そして、調整に要する時間を短縮することができる。例えば、機械負荷3の剛性が小さいなど、機械負荷3の挙動の予測が困難な場合等に、調整学習部70が学習結果を利用して試行パラメータ105を決定することにより、調整に要する時間を短縮することができる。また、単純な試行錯誤を繰り返す調整に比べて、調整に要する時間を短縮することができる。
 実施の形態5
 図16は、本実施の形態における位置決め制御装置1000dの構成の一例を示すブロック図である。位置決め制御装置1000dは、図1に示す実施の形態1の位置決め制御装置1000の推定部8に代えて推定部8aを備える。その他の点については、実施の形態1の位置決め制御装置1000と同じである。位置決め制御装置1000dの説明では、実施の形態1の図1と同じ又は対応する構成要素については、同一の符号を付す。
 図17は、本実施の形態における推定部8aの構成の一例を示すブロック図である。推定部8aは、調整レコード111を含む推定状態量に基づいて調整条件108と、調整条件108に対応する優良パラメータ106との関係を学習する。そして、学習した結果に基づいて、未調整条件110のもとで、指令パラメータのひとつを、推定優良パラメータ107として決定する。ここで、未調整条件110のもとで、良い評価結果109を与える位置決め動作を実行させる指令パラメータを、推定優良パラメータ107として決定してもよい。以下の説明では、一例として、推定部8aは、未調整条件110に基づいて推定優良パラメータを算出する推定用関数Esを学習する推定用学習部80を備える。推定用学習部80は、調整レコード111と、推定優良パラメータ107との誤差erを計算する誤差計算部801と、誤差erに基づき推定用関数Esを更新する推定用関数更新部802とを備える。さらに、推定用学習部80は、推定用関数Esと未調整条件110とに基づいて推定優良パラメータ107を決定する推定値決定部803を備える。なお、図17において誤差計算部801は、調整レコード111に基づいて誤差erを計算するが、調整レコード111を含む推定状態量に基づいて誤差erを計算してもよい。
 推定用学習部80は、例えば、ニューラルネットワークモデルに従って、いわゆる教師あり学習によって、優良パラメータ106と調整条件108との関係を学習してもよい。ここで、ある入力と結果(ラベル)のデータの組を大量に学習装置に与えることで、それらのデータセットにある特徴を学習し、入力から結果を推定するモデルを教師あり学習とよんでいる。ニューラルネットワークは、複数のニューロンからなる入力層、複数のニューロンからなる中間層(隠れ層)、及び複数のニューロンからなる出力層で構成される。中間層は、1層でもよく2層以上でもよい。
 図18は、本実施の形態におけるニューラルネットワークの構成の一例を示す図である。説明をわかりやすくするため、図18のニューラルネットワークは、入力数を3、層数を3としている。複数の入力が、X1からX3で構成される入力層に入力されると、入力値にw11からw16で構成される重みW1を乗じた値が、Y1とY2とで構成される中間層に入力される。さらに、中間層の入力値に、w21からw26で構成される重みW2を乗じた値が、Z1からZ3で構成される出力層から出力される。この出力結果は、重みW1の値と重みW2の値に依存して変化する。図18に示すニューラルネットワークは、推定用学習部80に入力される調整レコード111に基づいて作成されるデータセットに従って、教師あり学習により、調整条件108と、調整条件108に対応する優良パラメータ106との関係を学習する。すなわち、本実施の形態のニューラルネットワークによる学習の一例では、入力層に調整条件108を入力して、出力層から出力される優良パラメータ106を用いた位置決め動作の評価結果109が優良となるように重みW1及び重みW2を調整する。なお、本実施の形態において説明した学習を実行した学習済み学習器を搭載した位置決め制御装置を構成してもよい。学習済み学習器は、学習済のデータ、学習済のプログラム、又はこれらの組み合わせで構成してもよい。学習済み学習器を用いることにより、他の位置決め制御装置を用いた学習を利用することができるため、新たに学習を行わずに、高性能な位置決めを実現できる位置決め制御装置を提供することができる。
 また、他の構成に、本実施の形態に説明した構成を適用してもよい。他の構成の例としては、図9に示す位置決め制御装置1000aの推定部8、図11に示す位置決め制御装置1000bの推定部8、又は図14に示す位置決め制御装置1000cの推定部8を挙げることができる。そして、位置決め制御装置1000a、位置決め制御装置1000b、又は位置決め制御装置1000cにおいて、推定優良パラメータ107の推定を、精度よく又は効率的に実行してもよい。
 以上、説明したように、本実施の形態によれば、実施の形態1と同様に、調整に要する時間が短く、高性能な位置決め動作を実行可能な位置決め制御装置を提供することができる。さらに、本実施の形態の位置決め制御装置1000dは、推定用学習部80を有する推定部8aを備える。推定用学習部80は、調整レコード111を含む推定状態量に基づいて優良パラメータ106と調整条件108との関係を学習し、学習した結果に基づいて推定優良パラメータ107を決定する。そのため、推定優良パラメータ107を、より短い時間の間により正確に決定することができる。そして、複雑な特性をもつ機械負荷3に対しても、良い評価結果109を与える位置決め動作を実現することができる優良パラメータ106を、より短い時間で効率良く決定することができる。
 1 モータ、2 指令生成部、3 機械負荷、4 制御部、5 状態センサ、6 評価部、7、7a、7b 調整部、8、8a 推定部、9 調整管理部、10、10a 調整レコード保持部、11 運転条件決定部、70 調整学習部、80 推定用学習部、101 状態センサ信号、103 指令信号、105 試行パラメータ、106 優良パラメータ、107 推定優良パラメータ、108 調整条件、109 評価結果、110 未調整条件、 111 調整レコード、112 追加調整条件、113 追加優良パラメータ、701 報酬計算部、702 価値関数更新部、703 意思決定部、801 誤差計算部、802 推定用関数更新部、803 推定値決定部、1000、1000a、1000b、1000c 位置決め制御装置、1102 機械諸元、2000 制御対象、INT(n) 未知区間。

Claims (15)

  1.  モータに機械的に接続された機械負荷を目標移動距離だけ移動させる位置決め動作における前記モータの動作が、運転条件と前記運転条件のもとで変更可能なパラメータである指令パラメータとによって規定される位置決め制御装置であって、
     前記運転条件のひとつである調整条件と前記指令パラメータのひとつである試行パラメータとに基づく前記位置決め動作を実行し、実行した前記位置決め動作の際の前記モータ又は前記機械負荷の状態を検出した状態センサ信号による評価結果に基づいて前記指令パラメータのひとつを前記調整条件に対応する優良パラメータとして決定する調整を実行する調整部と、
     前記調整条件と前記調整条件に対応する前記優良パラメータとの組を調整レコードとして保持する調整レコード保持部と、
     前記調整レコードに基づいて前記指令パラメータのひとつを、前記調整レコードに保持される前記調整条件とは異なる前記運転条件のひとつである未調整条件に対応する推定優良パラメータとして決定する推定部と
    を備える位置決め制御装置。
  2.  前記モータ及び前記機械負荷の少なくともいずれか一方についての機械諸元、又は前記調整レコードに基づいて前記調整条件又は前記未調整条件を決定する運転条件決定部を備えることを特徴とする請求項1に記載の位置決め制御装置。
  3.  前記調整条件とは異なる前記運転条件のひとつである追加調整条件を決定する調整管理部をさらに備え、
     前記調整部は、前記調整管理部で決定された前記追加調整条件のもとで前記調整を実行し、前記指令パラメータのひとつを前記追加調整条件に対応する追加優良パラメータとして決定し、
     前記調整レコード保持部は、前記追加調整条件と前記追加優良パラメータとの組を追加調整レコードとしてさらに保持することを特徴とする請求項1又は2に記載の位置決め制御装置。
  4.  前記調整部は、前記未調整条件と前記推定優良パラメータとによる前記位置決め動作を検証位置決め動作として実行し、
     前記調整管理部は、前記検証位置決め動作の際の前記状態センサ信号による評価結果があらかじめ定めた基準を満たすか否かを判断し、前記基準を満たさない場合に前記追加調整条件の決定を実行することを特徴とする請求項3に記載の位置決め制御装置。
  5.  前記調整条件が配置される前記運転条件の範囲である調整範囲として規定され、前記調整範囲の両端となる運転条件が調整範囲端として規定され、前記運転条件の範囲である未知区間が、前記調整レコードに含まれる隣りあう2つの前記調整条件の間の範囲、及び、前記調整レコードに含まれ前記調整範囲端に隣接する前記調整条件と前記調整範囲端との間の範囲として規定され、
     前記調整管理部は、前記基準を満たさないと判断された前記未調整条件が配置された前記未知区間に前記追加調整条件が配置されるように前記追加調整条件を決定することを特徴とする請求項4に記載の位置決め制御装置。
  6.  前記運転条件は、前記モータの動作に関する数値パラメータである運転パラメータを含み、前記目標移動距離は前記運転パラメータのひとつであり、
     前記推定部は、前記運転パラメータ及び前記優良パラメータをそれぞれ入力及び出力として近似する線形補間関数を用いて前記推定優良パラメータを推定することを特徴とする請求項1から5のいずれか1項に記載の位置決め制御装置。
  7.  前記運転条件及び前記指令パラメータを決定すれば、前記運転条件及び前記指令パラメータに基づいて実行される前記位置決め動作の際の前記モータの加速度の最大値が決まることを特徴とする請求項1から6のいずれか1項に記載の位置決め制御装置。
  8.  前記調整部は、前記調整条件に応じて前記試行パラメータを複数決定し、前記調整条件と決定した前記試行パラメータの各々との組によって前記位置決め動作を実行し、前記位置決め動作の際の前記状態センサ信号による前記評価結果に基づいて前記指令パラメータのひとつを前記調整条件に対応する前記優良パラメータとして決定することを特徴とする請求項1から7のいずれか1項に記載の位置決め制御装置。
  9.  前記推定部は、
     前記調整レコードに含まれる前記調整条件と前記調整条件に対応する前記優良パラメータとに基づいて実行される全ての前記位置決め動作の中での最大の加速度に比べて、前記未調整条件と前記未調整条件に対応する前記推定優良パラメータとに基づいて実行される前記位置決め動作の中での最大の加速度の方が小さくなるように、前記推定優良パラメータを決定することを特徴とする請求項1から8のいずれか1項に記載の位置決め制御装置。
  10.  前記状態センサ信号に基づいて前記試行パラメータを評価し前記評価結果を決定する評価部をさらに備え、
     前記評価部は、前記位置決め動作の開始時点から前記機械負荷の位置と前記目標移動距離との差異である偏差があらかじめ定めた値より小さくなるまでの時間である位置決め時間に基づいて前記評価結果を決定することを特徴とする請求項1から9のいずれか1項に記載の位置決め制御装置。
  11.  前記状態センサ信号に基づいて前記試行パラメータを評価し前記評価結果を決定する評価部をさらに備え、
     前記評価部は、前記機械負荷の位置が、前記目標移動距離を超えて前記位置決め動作の終着地点から見て前記位置決め動作の開始地点とは逆の側に行き過ぎる距離であるオーバーシュートの大きさに基づいて前記評価結果を決定することを特徴とする請求項1から10のいずれか1項に記載の位置決め制御装置。
  12.  前記調整部は、前記評価結果を含む調整状態量と前記試行パラメータとの関係を学習し、学習した結果に基づいて前記試行パラメータを決定する調整学習部を備えることを特徴とする請求項1から11のいずれか1項に記載の位置決め制御装置。
  13.  前記推定部は、前記調整レコードを含む推定状態量に基づいて前記優良パラメータと前記調整条件との関係を学習し、学習した結果に基づいて前記推定優良パラメータを決定する推定用学習部を備えることを特徴とする請求項1から12のいずれか1項に記載の位置決め制御装置。
  14.  前記運転条件によって前記目標移動距離が指定され、
     前記調整管理部は、あらかじめ定めた前記モータの最大速度が大きくなるほど長くなり、あらかじめ定めた前記モータの最大加速度が大きくなるほど短くなる距離である基準距離を設定し、
     前記調整管理部はさらに、前記追加調整条件の前記目標移動距離が、前記基準距離と同じか又は前記基準距離より短くなるように前記追加調整条件を決定することを特徴とする請求項4又は5に記載の位置決め制御装置。
  15.  モータに機械的に接続された機械負荷を目標移動距離だけ移動させる位置決め動作における前記モータの動作が、運転条件と前記運転条件のもとで変更可能なパラメータである指令パラメータとによって規定される位置決め制御方法であって、
     前記運転条件のひとつである調整条件と前記指令パラメータのひとつである試行パラメータとに基づく前記位置決め動作を実行し、実行した前記位置決め動作の際の前記モータ又は前記機械負荷の状態を検出した状態センサ信号による評価結果に基づいて、前記調整条件のもとで前記指令パラメータのひとつを前記調整条件に対応する優良パラメータとして決定する調整を実行し、
     前記調整条件と前記調整条件に対応する前記優良パラメータとの組を調整レコードとして保持し、
     前記調整レコードに基づいて前記指令パラメータのひとつを、前記調整レコードとして保持される前記調整条件とは異なる前記運転条件のひとつである未調整条件に対応する推定優良パラメータとして決定する位置決め制御方法。
PCT/JP2019/051237 2019-12-26 2019-12-26 位置決め制御装置及び位置決め制御方法 WO2021130988A1 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2021531147A JP6981579B2 (ja) 2019-12-26 2019-12-26 位置決め制御装置及び位置決め制御方法
DE112019008005.9T DE112019008005T5 (de) 2019-12-26 2019-12-26 Positionierungssteuergerät und positionierungssteuerverfahren
KR1020227020059A KR20220101152A (ko) 2019-12-26 2019-12-26 위치 결정 제어 장치 및 위치 결정 제어 방법
PCT/JP2019/051237 WO2021130988A1 (ja) 2019-12-26 2019-12-26 位置決め制御装置及び位置決め制御方法
US17/780,036 US20220413453A1 (en) 2019-12-26 2019-12-26 Positioning control device and positioning control method
CN201980103204.9A CN114846427A (zh) 2019-12-26 2019-12-26 定位控制装置及定位控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/051237 WO2021130988A1 (ja) 2019-12-26 2019-12-26 位置決め制御装置及び位置決め制御方法

Publications (1)

Publication Number Publication Date
WO2021130988A1 true WO2021130988A1 (ja) 2021-07-01

Family

ID=76573790

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/051237 WO2021130988A1 (ja) 2019-12-26 2019-12-26 位置決め制御装置及び位置決め制御方法

Country Status (6)

Country Link
US (1) US20220413453A1 (ja)
JP (1) JP6981579B2 (ja)
KR (1) KR20220101152A (ja)
CN (1) CN114846427A (ja)
DE (1) DE112019008005T5 (ja)
WO (1) WO2021130988A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024089873A1 (ja) * 2022-10-28 2024-05-02 Smc株式会社 パラメータ判定装置およびパラメータ判定方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0287209A (ja) * 1988-09-22 1990-03-28 Matsushita Electric Works Ltd 位置決め制御方法
JPH04227509A (ja) * 1990-06-18 1992-08-17 Matsushita Electric Ind Co Ltd アクチュエータのアクセス方法とアクセス制御装置
JP2003061377A (ja) * 2001-08-17 2003-02-28 Yaskawa Electric Corp オートチューニング機能を備えたモータ制御装置
JP2004240609A (ja) * 2003-02-05 2004-08-26 Fuji Mach Mfg Co Ltd 電動機制御システムの自律設計方法及び自律設計装置並びに電動機制御システム
JP2005110396A (ja) * 2003-09-30 2005-04-21 Matsushita Electric Ind Co Ltd 電動機の制御装置及び制御方法
JP2015027246A (ja) * 2013-06-19 2015-02-05 日本精工株式会社 モータの最適動作パターン選定方法、モータの最適動作パターン選定プログラム及びモータ選定装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000339005A (ja) * 1999-05-28 2000-12-08 Yamaha Motor Co Ltd 制御対象の最適化制御方法及び制御装置
JP4745798B2 (ja) 2005-11-11 2011-08-10 株式会社日立産機システム 電動機制御装置の自動調整法および装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0287209A (ja) * 1988-09-22 1990-03-28 Matsushita Electric Works Ltd 位置決め制御方法
JPH04227509A (ja) * 1990-06-18 1992-08-17 Matsushita Electric Ind Co Ltd アクチュエータのアクセス方法とアクセス制御装置
JP2003061377A (ja) * 2001-08-17 2003-02-28 Yaskawa Electric Corp オートチューニング機能を備えたモータ制御装置
JP2004240609A (ja) * 2003-02-05 2004-08-26 Fuji Mach Mfg Co Ltd 電動機制御システムの自律設計方法及び自律設計装置並びに電動機制御システム
JP2005110396A (ja) * 2003-09-30 2005-04-21 Matsushita Electric Ind Co Ltd 電動機の制御装置及び制御方法
JP2015027246A (ja) * 2013-06-19 2015-02-05 日本精工株式会社 モータの最適動作パターン選定方法、モータの最適動作パターン選定プログラム及びモータ選定装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024089873A1 (ja) * 2022-10-28 2024-05-02 Smc株式会社 パラメータ判定装置およびパラメータ判定方法

Also Published As

Publication number Publication date
US20220413453A1 (en) 2022-12-29
JPWO2021130988A1 (ja) 2021-12-23
KR20220101152A (ko) 2022-07-19
CN114846427A (zh) 2022-08-02
JP6981579B2 (ja) 2021-12-15
DE112019008005T5 (de) 2022-10-27

Similar Documents

Publication Publication Date Title
US10261497B2 (en) Machine tool for generating optimum acceleration/deceleration
US10331104B2 (en) Machine tool, simulation apparatus, and machine learning device
US20180164756A1 (en) Control system and machine learning device
JP6903240B1 (ja) モータ制御装置及びモータ制御方法
WO2018151215A1 (ja) 制御装置及び制御方法
US11366433B2 (en) Reinforcement learning method and device
US11640557B2 (en) Machine learning device, numerical control system, and machine learning method
JP4918682B2 (ja) 超音波モータの制御方法、超音波モータ制御装置及び超音波モータを制御するためのプログラム
CN113874865A (zh) 借助于贝叶斯优化方法确定技术系统的调节策略的模型参数的方法和装置
JP6981579B2 (ja) 位置決め制御装置及び位置決め制御方法
US20220004160A1 (en) Positioning control device and positioning method
JP5038998B2 (ja) シーク制御装置、およびシーク制御のための制御データ生成方法
KR102494187B1 (ko) 위치 결정 제어 장치 및 위치 결정 방법
JP4301491B2 (ja) 電動機制御システムの自律設計方法及び自律設計装置並びに電動機制御システム
JP6800384B1 (ja) 位置決め制御装置および位置決め方法
JP7415100B1 (ja) パラメータ調整装置およびパラメータ調整方法
Liu et al. Model-free and model-based time-optimal control of a badminton robot
CN110727242B (zh) 机器学习装置、控制装置、以及机器学习方法
WO2020036086A1 (ja) モデル予測制御装置、モデル予測制御装置の制御方法、情報処理プログラム、および記録媒体
CN113939775A (zh) 用于确定针对技术系统的调节策略的方法和设备
CN117930662A (zh) 一种基于mimo-brb-pso的伺服系统参数优化计算方法

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2021531147

Country of ref document: JP

Kind code of ref document: A

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19957962

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20227020059

Country of ref document: KR

Kind code of ref document: A

122 Ep: pct application non-entry in european phase

Ref document number: 19957962

Country of ref document: EP

Kind code of ref document: A1