WO2017094424A1 - 制御装置 - Google Patents

制御装置 Download PDF

Info

Publication number
WO2017094424A1
WO2017094424A1 PCT/JP2016/082294 JP2016082294W WO2017094424A1 WO 2017094424 A1 WO2017094424 A1 WO 2017094424A1 JP 2016082294 W JP2016082294 W JP 2016082294W WO 2017094424 A1 WO2017094424 A1 WO 2017094424A1
Authority
WO
WIPO (PCT)
Prior art keywords
control
command value
control device
correction
learning
Prior art date
Application number
PCT/JP2016/082294
Other languages
English (en)
French (fr)
Inventor
正樹 浪江
雅和 小松
美樹子 真鍋
Original Assignee
オムロン株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by オムロン株式会社 filed Critical オムロン株式会社
Priority to EP16870364.3A priority Critical patent/EP3385796B1/en
Priority to CN201680046503.XA priority patent/CN107850874B/zh
Priority to US15/750,828 priority patent/US10571874B2/en
Publication of WO2017094424A1 publication Critical patent/WO2017094424A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/19Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by positioning or contouring control systems, e.g. to control position from one programmed point to another or to control movement along a programmed continuous path
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • the present invention relates to a control device that improves control performance by learning control in a control device that controls a controlled object by a control command.
  • a general method is to model the control target and calculate the feedforward input based on the parameters used to identify the control target system.
  • a learning control method is known as a method of realizing a target output by correcting a feedforward input while actually repeating trials when it is difficult to accurately calculate a parameter value.
  • ⁇ ⁇ ⁇ Learning control is used to control a dynamic system that includes unknown elements in the control target, especially to control a mechanical system using a robot and a motor.
  • the position deviation data and the correction data are fetched for each period, and a learning calculation using the position deviation data is performed.
  • a numerical control device is disclosed that can realize highly accurate machining by performing learning control at an arbitrary position where the same shape is machined and acquiring a position deviation.
  • JP 2004-227163 A (published on August 12, 2004)
  • An object of the present invention is to provide a control device that can easily calculate parameters used for learning control according to a control target.
  • a control device is a control device that controls a control target, a command value generation unit that calculates a command value from a command pattern, and the command value calculated from the command pattern
  • a learning control unit that repeatedly calculates correction data including a correction value for correcting the command value, and a control that calculates a corrected command value from the command value and the correction data, and transmits the corrected command value to the control target
  • the learning control unit includes a deviation between a feedback value for the corrected command value output to the control target, a command value calculated by the command value generation unit, and a response of the control target.
  • the correction data is generated from the delay characteristics.
  • control device that performs learning control, and a control device that can easily determine parameters to be used for learning control and improve control performance can be obtained.
  • control device 100 According to the present invention, an embodiment of a control device 100 according to the present invention will be described in detail with reference to the drawings. It should be noted that the present invention is not limited to the embodiment.
  • FIG. 1 is a block diagram showing a configuration of a control system including a control device 100 according to an embodiment of the present invention.
  • the control system includes a control device 100 and a control target 2 according to the present embodiment.
  • the control device 100 is typically composed of a PLC (programmable controller), calculates a control output, and controls a control target.
  • the control device 100 calculates a control output from a feedback value that is a result of controlling a control target at every predetermined control cycle.
  • the control target 2 is typically a machine driven by an actuator as a drive control device, and a control output calculated by the control device 100 is input and driven according to the control output.
  • the controlled object driven by the control output outputs the position / velocity driven via an encoder (not shown) or the like to the control device 100 as a feedback value.
  • Embodiments of the present invention will be described below with reference to an example of a control system that controls a locus according to a command pattern by performing position control.
  • control device 100 is not limited to this example as long as the control is performed by the control device 100.
  • temperature control for controlling temperature as a control target It may be a device.
  • FIG. 2 is a schematic diagram illustrating an example of a hardware configuration of the control device 100 illustrated in FIG. 1.
  • the control apparatus 100 implement
  • the control device 100 includes a processor 102 such as a CPU (Central Processing Unit) and an MPU (Micro-Processing Unit), a chipset 104, a main memory 106, a flash memory 108, and an external network controller 116.
  • the processor 102 reads out the system program 110 and the user program 112 stored in the flash memory 108, develops them in the main memory 106, and executes them, thereby realizing control of the control target.
  • the system program 110 includes instruction codes for providing basic functions of the control device 100 such as data input / output processing and execution timing control.
  • system program 110 includes a library program 110A.
  • the library program 110A is stored in a form in which general-purpose processing can be reused, and is called as necessary (call / invoke) when the user program 112 is executed. That is, the library program 110 ⁇ / b> A is used for program execution in the control device 100.
  • the user program 112 is arbitrarily designed according to the control target, and includes a sequence program 112A for executing sequence control and a motion program 112B for executing motion control. These sequence program 112A and motion program 112B are executed by appropriately calling the library program 110A.
  • the chipset 104 realizes processing as the entire control device 100 by controlling each component.
  • the internal bus controller 122 is an interface for exchanging data with the I / O unit 126 connected to the control device 100 through an internal bus.
  • the field bus controller 124 is an interface for exchanging data with the I / O unit 128 connected to the control device 100 and the field bus 130 (FIG. 2).
  • the internal bus controller 122 and the field bus controller 124 obtain state values input to the corresponding I / O units 126 and 128, respectively, and command the operation results in the processor 102 from the corresponding I / O units 126 and 128. Output each as a value.
  • the external network controller 116 controls the exchange of data through various wired / wireless networks.
  • the memory card interface 118 is configured so that the memory card 120 can be attached and detached, and data can be written to and read from the memory card 120.
  • a part or all of the functions provided by the control device 100 executing the program may be implemented as a dedicated hardware circuit.
  • FIG. 3 is a flowchart showing the operation of the control device 100 when the learning control program according to the present embodiment is executed. By executing the learning control program, the control device 100 repeatedly calculates a correction value for producing a desired output using the deviation data before the trial.
  • the learning control parameter is read from the memory.
  • the learning control parameter is a parameter that is changed according to the characteristics of the control target controlled by the control device 100, and includes a correction shift time described later.
  • the command value is calculated from the command pattern.
  • a command value to be output to the motor control device is calculated for each control cycle from a command pattern defined by the user program.
  • the command pattern is a pattern that defines a target operation to be controlled.
  • the data indicates a temporal change in a position where the control target is moved from a specific position to a specific position.
  • the control device 100 calculates a position command value to be given to the motor control device for each control cycle from the command pattern.
  • the command value output for each control cycle is calculated using the Kth correction data.
  • the control device 100 reads the correction data stored in the memory, adds the read correction data to the command value, corrects the command value, and obtains a corrected command value.
  • the corrected command value corrected for each control cycle is output to the motor control device.
  • the control device 100 sequentially reads out the command value corrected in S3 from the memory and outputs it to the motor control device. At the same time, feedback data is acquired from the controlled object and sequentially stored in the memory.
  • the K + 1-th correction data is calculated from the stored feedback data, the command value for each control cycle, and the learning control parameter.
  • the control device 100 calculates deviation data between the stored feedback data and the command value for each control cycle, and calculates using the correction shift time from the learning control parameter read in the deviation data, thereby calculating the following equation 1 to K + 1.
  • the second correction data is calculated. By repeatedly executing a series of these processes, correction data that approaches a command pattern that defines a target operation of the control target is repeatedly calculated.
  • the control device 100 evaluates the correction data for K times calculated as a learning result, and selects and stores the most suitable correction data by a predetermined evaluation function. Specifically, the control device 100 acquires the sum of squares of the positional deviations up to the Kth time, and ends the learning control when the decreasing rate of the square sum of the positional deviations is equal to or less than a predetermined value.
  • the method of evaluating the learning result is not limited to this method. For example, correction data that minimizes the sum of squares of the position deviations may be selected as a result of learning a predetermined number of times. In this way, when the degree of approach to the target value is used as the learning control end condition, it is not always close to the target command value even if the correction data is obtained by performing repeated learning control. Control computation can be avoided.
  • FIG. 4 is a flowchart showing the operation of the control device 100 when the learning control parameter calculation program is executed.
  • the control device 100 calculates the correction shift time included in the learning control parameter by acquiring response characteristic data of the control target device.
  • the control device 100 reads the characteristic measurement command pattern and calculates the characteristic measurement command value.
  • the characteristic measurement command pattern may be any command pattern as long as it can calculate the response characteristic of the control target with respect to the command value, and may be a unit pulse, a step function, or a ramp function.
  • control device 100 outputs the characteristic measurement command value calculated for each control cycle, and captures and stores the feedback value for each control cycle.
  • control device 100 acquires response characteristic data of the controlled object from the characteristic measurement command value and the feedback value for each control cycle.
  • response characteristic data is acquired from a feedback value when a unit pulse is output.
  • the control device 100 calculates the correction shift time using the response characteristic data. The correction shift time calculated from the response characteristic data will be described later.
  • the control device 100 calculates the correction shift time and stores the calculated correction shift time as a learning control parameter.
  • control device 100 acquires response characteristic data to be controlled by executing the learning control parameter calculation program, and stores the learning control parameter.
  • the control device 100 repeatedly calculates the correction data by using the learning control parameter calculated from the execution of the learning control parameter calculation program by executing the learning control program, and the correction data obtained as a result of the learning control.
  • the control device 100 calculates a command value using the command value calculated from the command pattern using the correction data obtained as a result of the learning control and the correction data obtained as a result of the learning control, and outputs the command value every control cycle. To do.
  • a command value that minimizes a positional deviation with respect to a command pattern that is a pattern that defines a target operation of a control target is calculated using correction data.
  • control device 100 reads the command pattern and generates a command value.
  • control device 100 reads the correction data, adds it to the command value, and calculates the corrected command value.
  • the command value calculated for each control cycle is output to the motor control device.
  • the command value corrected for each control cycle is repeatedly output to the controlled object.
  • FIG. 6 shows an example of a characteristic measurement pattern.
  • a unit time width pulse short pulse with a unit time width
  • FIG. 6 shows an example in which a unit time width pulse is input and its response data is acquired.
  • the unit time refers to the time width of the control cycle.
  • the control cycle is 1 ms
  • an example in which a 1 ms wide pulse is output will be described below.
  • the command value changes at every normal sampling time.
  • the correction data obtained by learning control is considered to be a collection of correction amounts at each sampling time. Therefore, in the learning control according to the embodiment of the present invention, it is possible to calculate appropriate correction data through learning control by obtaining a correction amount for a command value at a corresponding sampling time using a deviation at a certain sampling time.
  • the correction amount of the command value is a pulse at each sampling time, when the unit time width pulse is input, the correction amount is obtained from the response data at the sampling time at which the influence is most significant.
  • FIG. 7 shows the control results using the correction command value using the shift correction time.
  • FIG. 7 shows the locus of the command position, actual position, and corrected position command value.
  • FIG. 7 shows a positional deviation amount between the command position and the actual position.
  • FIG. 7 shows a change over time in the command value correction amount. As shown in FIG. 7, the deviation between the actual position and the command position is minimized by using the corrected position command value of the sampling time that is traced back by the correction shift time with respect to the actual position and the command position.
  • FIG. 8 shows the result of learning control using a different correction shift time for a control target having the characteristics of FIG. 6 as response characteristics. The calculation was performed under the condition that the learning control is discontinued when the rate of reduction of the square sum of the positional deviation between the command value before correction and the feedback value calculated from the command pattern is 5% or less.
  • the correction shift time is not an appropriate value that matches the characteristics of the control target. It can be seen that even if the learning is repeatedly executed, the target action is not approached.
  • the correction shift time which is the value of the learning control parameter, is calculated from the characteristic value of the control target, and the target given as the command pattern is obtained by performing learning control using an appropriate correction shift time. It can approach the operation of the machine.
  • Response data U (n) may be obtained.
  • FIG. 9 shows a functional configuration of the control device 100 according to the embodiment of the present invention.
  • the control device 100 includes a command value generation unit 20, a learning control unit 30, a control unit 10, a characteristic measurement command value generation unit 40, and a correction shift time calculation unit 50.
  • the command value generation unit 20 reads a command pattern and generates a command value based on the read command pattern.
  • the command pattern is a control target value that defines the motion trajectory of the control target 2 targeted by the control system.
  • the control unit 10 outputs a command value after correction obtained by adding the command value generated by the command value generation unit 20 and the correction data generated by the learning control unit 30 every predetermined control period, and drives the control target 2. .
  • the characteristic measurement command value generation unit 40 generates a command pattern for measuring the characteristic of the controlled object 2.
  • the control unit 10 outputs a command value for characteristic measurement to the control target 2 with respect to the control target 2 every predetermined control cycle.
  • the correction shift time calculation unit 50 calculates the correction shift time as a learning control parameter from the feed-back value that drives the control object 2 based on the characteristic measurement command value.
  • the learning control unit 30 reads deviation data, which is the difference between the command value generated by the command value generation unit 20 and the feedback value, and repeatedly calculates correction data including a correction value for correcting the command value.
  • the learning control unit 30 calculates a deviation between the command value calculated by the command value generation unit 20 and the feedback value input from the control target 2.
  • the learning control unit 30 further performs calculation from the command value calculated by the command value generation unit 20 and the feedback value at predetermined control cycles, and uses the K-th deviation data to obtain correction data for the K + 1-th command value.
  • the correction data corresponding to the control target characteristic can be calculated by calculating the correction data using the deviation data shifted from the response characteristic related to the control target 2 by the correction shift time.
  • the correction shift time may be a multiple of the control cycle or a real number.
  • Rev (k + 1) (n) Rev (k) (n) + G * Err (k) (n + st) k: Number of learning 0,1,2,... n: Sample time 0,1,2,..., N Rev (k + 1) (n): Correction data of sample time n for learning k + 1 Rev (k) (n): Correction data of sample time n for the kth learning G: Factor that determines the strength of learning Err (k) (n + st): Deviation data at the learning time n + st of the kth learning st: Correction shift time (integer multiple of control cycle)
  • the control unit 10 adds the correction value to the command value and outputs (transmits) the control target.
  • a library program suitable for learning control and learning control parameter calculation is facilitated in the control device in advance.
  • a user of the control device can create a code that reads the library program using a support device of the control device (not shown).
  • a control device manufacturer or a third party By providing such a library program in advance by a control device manufacturer or a third party, it is possible to create a user program that calculates a learning control parameter corresponding to a control target in a short time. That is, the user program is used to calculate correction data given by the command pattern by learning control in a control device that typically controls an operation trajectory in a control target.
  • FIG. 10 shows an example of a library program executed by the control device of the present embodiment. It mainly includes a learning control function block and a learning control parameter calculation function block. Some or all of the function blocks are instructions for designating reading of a corresponding library program and reading and execution when the execution order arrives. In other words, the library program which is the actual state of the program corresponding to each function block is facilitated in advance, and the processor calls and executes the library program as appropriate according to the program. The function of each function block will be described below.
  • the characteristic measurement FB generates a command value for calculating the response characteristic of the controlled object, and obtains a feedback value for the generated command value, thereby deriving a correction shift time as a learning control parameter from the response characteristic of the controlled object. To do.
  • ⁇ Characteristic measurement FB input, maximum measurement time, command value height feedback value are specified as input for characteristic measurement FB.
  • the characteristic measurement mode activation is a signal for activating this function block, and when it becomes TRUE, the characteristic measurement mode is started, and during characteristic measurement, it becomes TRUE.
  • the control device calculates a command value from the pattern for the characteristic command, outputs it to the controlled object, and sequentially stores a feedback value from the controlled object.
  • the maximum measurement time is the maximum time for measuring the feedback value with respect to the command value output to the controlled object, and the feedback value of the controlled object is measured and stored for the maximum time from the control cycle in which the characteristic measurement command value is output.
  • the command value height is an input that specifies the height of the characteristic measurement command value to be output to the controlled object, and the characteristic measurement command value that has the command value height for the maximum measurement time is output in pulses or steps. To do.
  • a feedback value is further defined as an input to the function block for characteristic measurement.
  • the stored feedback value is input at the measurement time given as the maximum measurement time.
  • the correction shift time is output by comparing the time of the characteristic measurement command value and the feedback value.
  • FIG. 11 shows an example of a learning control function block.
  • learning control activation is defined as an input.
  • TRUE is output during learning control.
  • the learning control function block further includes a learning end determination value, a correction shift time, a command pattern (array data), and a feedback value as inputs.
  • the learning end determination value is a real number given as a determination condition.
  • the correction shift time is a value calculated by the characteristic measurement function block, and is given as an integer multiple of the control period or a real number.
  • the command pattern is given as array data.
  • the feedback value is given as array data. The square sum of the position deviation is calculated from the command pattern and the feedback value, and is output as an evaluation function value.
  • the control function block is further defined with correction data as input.
  • the correction data is output by adding the time shifted by the correction shift time with respect to the deviation between the command pattern and the feedback value, and the correction data array is updated and output.
  • the learning end becomes TRUE as an output, and the activation of the learning control function block ends.
  • the learning control function block, the characteristic calculation function block, and the library program for realizing the learning control function as described above are provided.
  • a user program for performing learning control can be created.
  • a control device is a control device that controls a control target, a command value generation unit that calculates a command value from a command pattern, and the command value calculated from the command pattern
  • a learning control unit that repeatedly calculates correction data including a correction value for correcting the command value, and a control that calculates a corrected command value from the command value and the correction data, and transmits the corrected command value to the control target
  • the learning control unit includes a deviation between a feedback value for the corrected command value output to the control target, a command value calculated by the command value generation unit, and a response of the control target.
  • the correction data is generated from the delay characteristics.
  • the control device includes a characteristic measurement command value generation unit, a correction shift time calculation unit that calculates a correction shift time used when learning control is performed in the learning control unit,
  • the correction shift time calculation unit obtains a feedback value for the characteristic measurement command value generated by the characteristic measurement command value generation unit, and compares the characteristic measurement command value with the feedback value to thereby obtain the feedback value.
  • the correction shift time may be calculated.
  • the characteristic measurement command value may be a short pulse having a unit time width.
  • the characteristic measurement command value may be a step function
  • the correction shift time calculation unit may calculate the correction shift time by calculating a step response. Good.
  • the characteristic measurement command value is a ramp function
  • the correction shift time calculation unit calculates a step response from the ramp response and calculates the correction shift time from the step response. You may do.
  • the correction shift time may be a real number calculated from a delay characteristic of the response to be controlled.
  • Control object 10 Control object 10
  • Control unit 20 Command value generation unit 30
  • Learning control unit 40 Characteristic measurement command value generation unit 50
  • Correction shift time calculation unit 100 Control device

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Feedback Control In General (AREA)
  • Numerical Control (AREA)

Abstract

制御対象(2)を制御する制御装置(100)であって、指令パターンから指令値を算出する指令値生成部(20)と、前記指令パターンから算出された前記指令値を補正する補正値を含む補正データを繰り返し算出する学習制御部(30)と、前記指令値と前記補正データから補正後指令値を算出し、前記制御対象に対して補正後指令値を送信する制御部(10)と、を備え、前記学習制御部(30)は、前記制御対象に対して出力した前記補正後指令値に対するフィードバック値と、前記指令値生成部(20)が演算した前記指令値との偏差と、前記制御対象の応答の遅れ特性とから、前記補正データを生成する。

Description

制御装置
 この発明は、制御指令により制御対象を制御する制御装置において学習制御により制御性能を向上させる制御装置に関する。
 制御対象をモデル化し、制御対象のシステムの同定に用いたパラメータに基づいてフィードフォワード入力を計算する方式が一般的である。制御対象がパラメータ値を正確に算出することが困難である場合、実際に試行を繰り返しながらフィードフォワード入力を修正して目標とする出力を-実現する方式として学習制御方式が知られている。
 制御対象に未知の要素を含む動的システムに制御において、特にロボット、モータを用いたメカニカルシステムの制御に学習制御が用いられている。
 特許文献1に記載の数値制御装置においては、各周期毎に位置偏差データと補正データとを取り込み、この位置偏差データを用いた学習演算を行う。これにより、同一形状を加工する任意の位置で学習制御を行い、位置偏差を取得することで高精度な加工を実現できる数値制御装置を開示する。
日本国公開特許公報「特開2004-227163号公報(2004年8月12日公開)」
 しかしながら、学習制御によって制御性能を向上させるためには、学習制御に用いられ鵜パラメータを制御対象に合わせて適切に設定する必要がある。
 上記特許文献1に挙げられた制御装置においては、目標とする偏差量を少なくするような補正値が算出される。しかし、この補正値は制御対象の特性を加味したものではない。よって、学習制御のためのパラメータが適切に設定されていないことに起因して、制御性能が目標性能に到達しない恐れがある。学習制御を行うパラメータを調整と補正値の演算を試行錯誤しながら行うこととなり、制御装置を含む制御システムの迅速な立上を阻害する。
 本発明は、制御対象に合わせた学習制御に用いられるパラメータを容易に算出することができる制御装置を提供することを目的とする。
 上記の課題を解決するために、本発明に係る制御装置は、制御対象を制御する制御装置であって、指令パターンから指令値を算出する指令値生成部と、前記指令パターンから算出された前記指令値を補正する補正値を含む補正データを繰り返し算出する学習制御部と、前記指令値と前記補正データから補正後指令値を算出し、前記制御対象に対して補正後指令値を送信する制御部と、を備え前記学習制御部は、前記制御対象に対して出力した前記補正後指令値に対するフィードバック値と、前記指令値生成部が演算した前記指令値との偏差と、前記制御対象の応答の遅れ特性とから、前記補正データを生成する、ことを特徴としている。
 本発明によれば、学習制御を行う制御装置であって、学習制御に用いられる制御対象のパラメータを容易に求めることができ、制御性能を向上させる制御装置を得ることができる。
制御システムの全体構成を示す図である。 制御装置のハードウェア構成を示す図である。 制御装置100の動作フローチャートを示す図である。 制御装置100の動作フローチャートを示す図である。 制御装置100の動作フローチャートを示す図である。 特性測定用パターンから補正シフト時間演算を示す図である。 学習制御パラメータを用いて学習制御を行った結果を示す図である。 異なる補正シフト時間で学習を行った結果を示す図である。 制御装置の機能構成を示すブロック図である。 本実施の形態の制御装置で実行されるライブラリプログラムの一例を示す図である。 本実施の形態の制御装置で実行されるライブラリプログラムの一例を示す図である。
 以下に、本発明にかかる制御装置100の実施の形態を図面に基づいて詳細に説明する。なお、この実施の形態の形態によりこの発明が限定されるものではない。
 〔実施の形態1〕
 <制御システムの全体構成>
 図1は、本発明の実施の形態による制御装置100を含む制御システムの構成を示すブロック図である。図において、当該制御システムは、本実施の形態にかかわる制御装置100と制御対象2から構成される。制御装置100は典型的には、PLC(プログラマブルコントローラ)で構成され、制御出力を演算し制御対象を制御する。制御装置100は所定の制御周期ごとに制御対象を制御した結果であるフィードバック値から制御出力を演算する。制御対象2は、典型的には駆動制御装置としてアクチュエータにより駆動される機械であり、制御装置100が演算した制御出力が入力され、制御出力に応じて駆動される。制御出力によって駆動された制御対象は、エンコーダ(図示せず)等を介して駆動された位置・速度等をフィードバック値として制御装置100へ出力する。
 本発明の実施の形態については位置制御を行うことにより、指令パターンに応じた軌跡の制御を行う制御システムの実施例について以下に説明する。
 本実施の形態では、モータで制御対象を駆動する例を取って説明を行うが制御装置100によって制御が行われるものであればこの例に限定されず、例えば制御対象として温度を制御する温度制御装置であっても良い。
 <制御装置のハードウェア構成>
 次に、制御装置100のハードウェア構成の構成について説明する。図2は、図1に示す制御装置100のハードウェア構成の一例を示す模式図である。図2を参照して、制御装置100は、予めインストールされたプログラムをプロセッサが実行することで、制御対象に対する制御を実現する。より具体的には、制御装置100は、CPU(Central Processing Unit)やMPU(Micro-Processing Unit)などのプロセッサ102と、チップセット104と、メインメモリ106と、フラッシュメモリ108と、外部ネットワークコントローラ116と、メモリカードインターフェイス118と、内部バスコントローラ122と、フィールドバスコントローラ124とを含む。
 プロセッサ102は、フラッシュメモリ108に格納されたシステムプログラム110およびユーザプログラム112を読み出して、メインメモリ106に展開して実行することで、制御対象に対する制御を実現する。システムプログラム110は、データの入出力処理や実行タイミング制御などの、制御装置100の基本的な機能を提供するための命令コードを含む。本実施の形態においては、システムプログラム110は、ライブラリプログラム110Aを含む。ライブラリプログラム110Aは、汎用的な処理を再利用可能な形で格納されており、ユーザプログラム112の実行時に、必要に応じて呼び出される(call/invoke)。すなわち、ライブラリプログラム110Aは、制御装置100でのプログラム実行に用いられる。
 ユーザプログラム112は、制御対象に応じて任意に設計され、シーケンス制御を実行するためのシーケンスプログラム112Aおよびモーション制御を実行するためのモーションプログラム112Bを含む。これらのシーケンスプログラム112Aおよびモーションプログラム112Bは、ライブラリプログラム110Aを適宜呼び出すことで実行される。
 チップセット104は、各コンポーネントを制御することで、制御装置100全体としての処理を実現する。
 内部バスコントローラ122は、制御装置100と内部バスを通じて連結されるI/Oユニット126とデータを遣り取りするインターフェイスである。フィールドバスコントローラ124は、制御装置100とフィールドバス130(図2)を通じて連結されるI/Oユニット128とデータを遣り取りするインターフェイスである。内部バスコントローラ122およびフィールドバスコントローラ124は、対応のI/Oユニット126および128にそれぞれ入力される状態値を取得するとともに、プロセッサ102での演算結果を対応のI/Oユニット126および128から指令値としてそれぞれ出力する。
 外部ネットワークコントローラ116は、各種の有線/無線ネットワークを通じたデータの遣り取りを制御する。メモリカードインターフェイス118は、メモリカード120を着脱可能に構成されており、メモリカード120に対してデータを書込み、メモリカード120からデータを読出すことが可能になっている。
 制御装置100がプログラムを実行することで提供される機能の一部または全部を専用のハードウェア回路として実装してもよい。
 <学習制御の制御装置の動作>
 図3は本実施の形態にかかわる学習制御プログラムが実行された時の制御装置100の動作を示すフローチャートを示す。学習制御プログラムが実行されることにより、制御装置100は試行前の偏差データを用いて望ましい出力を出すための補正値を繰り返し的に算出する。
 S1では学習制御パラメータをメモリから読み出す。学習制御パラメータは制御装置100が制御する制御対象の特性応じて変更されるパラメータであり、後述する補正シフト時間を含む。
 S2では指令パターンから指令値を算出する。ユーザプログラムで規定されている指令パターンから制御周期ごとにモータ制御装置へ出力する指令値を演算する。指令パターンとは、目標とする制御対象の動作を規定するパターンである。典型的には制御対象を特定の位置から特定の位置へ移動させる位置の時間的な変化を示すデータである。制御装置100は指令パターンから制御周期毎にモータ制御装置へ与える位置指令値を演算する。
 S3ではK回目の補正データを用いて、制御周期毎に出力する指令値を算出する。制御装置100はメモリ上に格納された補正データを読み出し、読みだした補正データを指令値に加算することにより、指令値を補正し、補正後指令値を得る。
 S4では制御周期毎に補正した補正後指令値をモータ制御装置へ出力する。制御装置100はS3で補正された指令値を逐次メモリから読み出しモータ制御装置へ出力する。同時に制御対象からフィードバックデータを取得し、逐次メモリに格納する。
 S5では格納したフィードバックデータと制御周期毎の指令値と学習制御パラメータからK+1回目の補正データを算出する。制御装置100は格納されたフィードバックデータと制御周期毎の指令値との偏差データを算出し、偏差データに読み込んだ学習制御パラメータから補正シフト時間を用いて算出することにより、後述する数式1からK+1回目の補正データを算出する。これらの一連の処理を繰り返し的に実行することにより、目標とする制御対象の動作を規定する指令パターンに近づくような補正データを繰り返し算出する。
 S6では、制御装置100は学習の結果として算出したK回分の補正データを評価し、所定の評価関数によって最も適した補正データを選択し格納する。具体的には制御装置100は、K回目までの位置偏差の二乗和を取得し、その位置偏差の二乗和の減少率が所定の値以下になった場合に学習制御を終了とする。学習結果の評価の仕方はこの手法に限らず、例えば所定回数の学習を行った結果、最も位置偏差の二乗和が少なくなる補正データを選択しても良い。このように目標値に近づく度合を学習制御の終了条件とする構成をとる場合は、繰り返し学習制御を行い補正データを求めたとしても目標とする指令値に近づくとは限らないため、無駄な学習制御演算を回避することができる。
 <学習制御パラメータ算出実行時の制御装置の動作>
 図4は、学習制御パラメータ算出プログラムが実行された時の制御装置100の動作を示すフローチャートである。学習制御パラメータ算出プログラムが実行されると、制御装置100は学習制御パラメータに含まれる、補正シフト時間を制御対象装置の応答特性のデータを取得することにより算出する。
 S11では学習制御パラメータ算出プログラムが実行されると、制御装置100は特性計測用指令パターンを読み出し、特性計測用の指令値を算出する。ここで特性計測用指令パターンは、指令値に対する制御対象の応答特性を算出できる指令パターンであればどのような指令パターンであっても良く、単位パルス、ステップ関数、ランプ関数であっても良い。
 S12では、制御装置100は制御周期毎に算出した特性計測用指令値を出力し、かつ制御周期毎にフィードバック値を取り込み格納する。
 S13では、制御装置100は特性計測用指令値及び制御周期毎のフィードバック値から、制御対象の応答特性データを取得する。本発明の実施形態では単位パルスを出力した場合のフィードバック値から、応答特性データを取得する。制御装置100は応答特性データを用いて補正シフト時間を算出する。応答特性データから算出する補正シフト時間については後述する。
 制御装置100は、補正シフト時間を算出し算出した補正シフト時間を学習制御パラメータとして格納する。
 <学習結果を用いた制御プログラム実行時の制御装置の動作>
 上述したように、制御装置100は、学習制御パラメータ算出プログラム実行により、制御対象の応答特性のデータを取得し、学習制御パラメータを格納する。
 制御装置100は、学習制御プログラム実行により、学習制御パラメータ算出プログラム実行より、算出された学習制御パラメータを用いて、繰り返し的に補正データを算出すると共に、学習制御の結果として得られた補正データを格納する。(図5)
 制御装置100は、学習制御の結果として得られた補正データを用いて指令パターンから算出した指令値と学習制御の結果として得られた補正データを用いて指令値を算出し、制御周期毎に出力する。目標とする制御対象の動作を規定するパターンである指令パターンに対する位置偏差が最小となるような指令値を補正データを用いて算出する。
 S31では、制御装置100は、指令パターンを読み出し指令値を生成する。
 S32では制御装置100は、補正データを読み出し、指令値に加算し、補正された指令値を算出する。
 S33では、制御周期毎に算出した指令値をモータ制御装置へ出力する。制御周期毎に補正された指令値を制御対象へ繰り返し出力する。
 <補正シフト時間>
 図6に特性計測用パターンの例を示す。ここでは、単位時間幅パルス(単位時間幅の短パルス)を特性計測用パターンとして出力する例を示す。図6は、単位時間幅パルスを入力し、その応答データを取得した例を示す。ここで単位時間とは制御周期の時間幅を指す。図6の例では制御周期が1msであるため1ms幅のパルスを出力した例で以下に説明をする。
 学習制御が適用されるケースでは、通常サンプリング時刻毎に指令値が変化する。学習制御で求める補正データは、各サンプリング時刻の補正量の集まりであると考えられる。そのため本発明の実施形態による学習制御では、あるサンプリング時刻の偏差を用いて対応するサンプリング時刻の指令値に対する補正量を求めることにより、学習制御を通じて適切な補正データの算出が可能となる。
 指令値の補正量は、サンプリング時刻毎のパルスになるので、単位時間幅パルスを入力したとき、影響が最も多く現れるサンプリング時刻の応答データから補正量を求める。
 図6に示す例では、単位時間幅のパルスに対して、4msの応答遅れ(応答の遅れ特性)が生じていることが分かる。この値をシフト補正時間として設定する。
 図7にシフト補正時間を用いた補正指令値を用いた制御結果について示す。図7に指令位置、実位置、補正後位置指令値の軌跡を示す。加えて図7には、指令位置と実位置の位置偏差量を示す。さらに図7には、指令値補正量の時間変化を示す。図7に示す通り、補正後位置指令値は、実位置と指令位置に対して、補正シフト時刻だけ遡ったサンプリング時刻の補正データを用いることにより、実位置と指令位置との偏差が最少化されていることが分かる。
 図8に応答特性として図6の特性を有する制御対象について、異なる補正シフト時間を用いて学習制御を行った結果を示す。指令パターンから算出される補正前の指令値とフィードバック値の位置偏差の2乗和の減少率が5%以下になった場合に学習制御を打ち切る条件で算出した。
 補正シフト時間として4msとして設定して学習制御を行った場合と、補正シフト時間として1msと6msとして設定した結果とを比較すると、補正シフト時間が制御対象の特性に合致した適切な値でない場合には、学習を繰り返し実行したとしても目標とする動作に近づかないことが分かる。
 本発明においては、学習制御のパラメータの値である補正シフト時間を制御対象の特性値から算出することにより、適切な補正シフト時間を用いた学習制御を行うことにより指令パターンとして与えられる目標とする機械の動作へ近づけることができる。
 <補正シフト時間算出の変形例>
 補正シフト時間の算出にあたり、図5の例では単位時間幅パルスに対する応答データを取得した。これに対してステップ応答データS(n),n=0~Nを測定して、次の計算式により、単位時間幅パルス指令値に対する応答データU(n)を求めても良い。
U(n) = S(n) - S(n-1) , n=0~N,
ただし、S(-1) = 0 
 また、補正シフト時間の算出にあたり、ランプ応答データR(n), n=0~Nを測定して次の計算式によりステップ応答データS(n)を経由して、単位時間幅パルス指令値に対する応答データU(n)を求めても良い。
S(n) = R(n) - R(n-1), n=0~N, ただしR(-1)=0
U(n) = S(n) - S(n-1), n=0~N, ただしS(-1)=0
 <制御装置の機能的構成>
 図9に、本発明の実施の形態による制御装置100の機能的構成を示す。制御装置100は、指令値生成部20と、学習制御部30と、制御部10と、特性測定用指令値生成部40と補正シフト時間算出部50とを備える。
 指令値生成部20は、指令パターンを読み出し、読み出した指令パターンに基づいて指令値を生成する。ここで指令パターンは制御システムが目標とする制御対象2の動作軌跡を規定とする制御の目標とする値である。
 制御部10は、指令値生成部20が生成した指令値と学習制御部30が生成した補正データとを加算された補正後指令値を所定の制御周期毎に出力し、制御対象2を駆動させる。
 特性用測定用指令値生成部40は、制御対象2の特性を計測するための指令パターンを生成する。制御部10は制御対象2の特性測定を行う場合は、制御対象2に対して所定の制御周期毎に特性測定用の指令値を制御対象2へ出力する。
 補正シフト時間算出部50は、特性測定用指令値に基づいて制御対象2を駆動したフィードアック値から、学習制御パラメータとして補正シフト時間を算出する。
 学習制御部30は、指令値生成部20が生成した指令値とフィードバック値との差である偏差データを読み込み、指令値を補正する補正値を含む補正データ繰り返し的に演算する。
 学習制御部30は、指令値生成部が20演算した指令値と、制御対象2から入力されるフィードバック値との偏差を演算する。学習制御部30はさらに、所定の制御周期ごとに、指令値生成部20が演算した指令値とフィードバック値とから演算を行い、K回目の偏差データを用いてK+1回目の指令値に対する補正データを演算する。ここで制御対象2に関する応答特性から補正シフト時間分だけシフトさせた偏差データを用いて、補正データを演算することにより、制御対象特性に応じた補正データを算出することが可能となる。
 補正シフト時間は、制御周期の倍数であっても良いし、実数を用いても良い。
 Rev(k+1)(n) = Rev(k)(n) + G * Err(k) (n+st)
k: 学習回数 0,1,2,…
n: サンプル時刻 0,1,2,…,N
Rev(k+1)(n): 学習k+1回目用のサンプル時刻nの補正データ
Rev(k)(n): 学習k回目用のサンプル時刻nの補正データ
G : 学習の強さを決める係数
Err(k)(n+st): 学習k回目のサンプル時刻n+stの偏差データ
st: 補正シフト時間(制御周期の整数倍)
 制御部10は、指令値に対して補正値を加算して、制御対象へ出力(送信)する。
 <ライブラリプログラムおよびユーザプログラム>
 次に本実施の形態の制御装置が学習制御パラメータ算出、学習制御、動作軌跡制御を行う構成について説明する。一実施形態として、制御装置には、学習制御、学習制御パラメータ算出に適したライブラリプログラムが予め容易される。制御装置のユーザは、図示しない制御装置のサポート装置を用いて当該ライブラリプログラムを読みだすようなコードを作成することができる。このようなライブラリプログラムを制御装置メーカやサードパーティが予め提供しておくことで、短い時間で、制御対象に応じた学習制御パラメータの算出をするようなユーザプログラムを作成することが可能となる。すなわち、ユーザプログラムは、制御対象において典型的には動作軌跡を制御する制御装置において学習制御により指令パターンで与えられる補正データの算出に用いられる。
 図10は、本実施の形態の制御装置で実行されるライブラリプログラムの一例を示す。主として、学習制御ファンクションブロックと、学習制御パラメータ算出ファンクションブロックとを含む。ファンクションブロックの一部または全部は、その実行順序が到来すると、対応するライブラリプログラムを読み出すこと、および、読みだして実行することを指定するための命令である。言い換えれば、各ファンクションブロックに対応するプログラムの実態であるライブラリプログラムが予め容易されており、プロセッサは、プログラムに従って、ライブラリプログラムを適宜呼び出して実行することになる。以下、各ファンクションブロックの機能について説明する。
 特性測定FBは、制御対象の応答特性を算出するための指令値を生成し、生成した指令値に対すフィードバック値を入手することにより、制御対象の応答特性から学習制御パラメータとして補正シフト時間を導出する。
 特性測定FBの入力としては、特性測定モード起動と最大測定時間と指令値高さフィードバック値とが規定されている。特性測定モード起動は本ファンクションブロックを起動する信号であり、TRUEとなると特性測定モードが開始され、特性測定中がTRUEとなる。特性測定モードでは、制御装置は特性指令用のパターンから指令値を算出し、制御対象へ出力すると共に、制御対象からのフィードバック値を逐次格納する。最大測定時間は、制御対象への指令値出力に対してフィードバック値を測定する最大時間であり、特性測定用指令値を出力した制御周期から最大時間だけ制御対象のフィードバック値を測定し格納する。指令値高さは制御対象へ出力する特性計測用指令値の高さを指定する入力であり、最大測定時間でかつ指令値高さを有する特性計測用指令値をパルス状、またはステップ状に出力する。
 特性測定用ファンクションブロックは入力としてさらに、フィードバック値が規定される。フィードバック値は、最大測定時間として与えられた測定時間において、格納されたフィードバック値が入力される。特性計測用指令値とフィードバック値との時刻を比較することにより、補正シフト時間が出力される。
 <2.学習制御ファンクションブロック>
 図11は学習制御ファンクションブロックの一例を示す。学習制御ファンクションブロックは、入力として学習制御起動が規定される。学習制御起動がTRUEとなると、学習制御中にTRUEが出力される。
 学習制御ファンクションブロックは、さらに学習終了判定値、補正シフト時間、指令パターン(配列データ)、フィードバック値を入力として備える。学習終了判定値 は、判定条件として与えられる実数である。補正シフト時間は、特性測定ファンクションブロックで演算された値であり、制御周期の整数倍または実数で与えられる。指令パターンは配列データとして与えられる。フィードバック値は配列データとして与えられる。指令パターンとフィードバック値とから位置偏差の2乗和を算出し、評価関数値として出力する。
 制御ファンクションブロックはさらに補正データを入力として規定される。補正データについては、指令パターンとフィードバック値との偏差に対して補正シフト時間分だけシフトした時間について加算することで補正データを出力し、補正データ配列を更新して出力する。補正データ配列の更新が完了すると出力として学習終了がTRUEとなり、学習制御ファンクションブロックの起動が終了する。
 (利点)
 上述したような学習制御ファンクションブロック、特性算出用ファンクションブロックおよびそれを実現するためのライブラリプログラムが提供されることで、作成工数をかけることなく、制御対象の特性に王板学習制御パラメータの算出と、学習制御を行うユーザプログラムが作成できる。
 (付記事項)
 上記の課題を解決するために、本発明に係る制御装置は、制御対象を制御する制御装置であって、指令パターンから指令値を算出する指令値生成部と、前記指令パターンから算出された前記指令値を補正する補正値を含む補正データを繰り返し算出する学習制御部と、前記指令値と前記補正データから補正後指令値を算出し、前記制御対象に対して補正後指令値を送信する制御部と、を備え前記学習制御部は、前記制御対象に対して出力した前記補正後指令値に対するフィードバック値と、前記指令値生成部が演算した前記指令値との偏差と、前記制御対象の応答の遅れ特性とから、前記補正データを生成する、ことを特徴としている。
 
 また、本発明に係る制御装置は、前記制御装置は、特性測定用指令値生成部と、前記学習制御部で学習制御を行う際に用いられる補正シフト時間を算出する補正シフト時間算出部と、をさら備え、前記補正シフト時間算出部は、前記特性測定用指令値生成部が生成した特性測定用指令値に対するフィードバック値を取得し、特性測定用指令値とフィードバック値とを比較することにより前記補正シフト時間を算出するものであってもよい。
 また、本発明に係る制御装置は、前記特性測定用指令値は、単位時間幅の短パルスであってもよい。
 また、本発明に係る制御装置は、前記特性測定用指令値は、ステップ関数であり、前記補正シフト時間算出部はステップ応答を算出することにより、前記補正シフト時間を算出するものであってもよい。
 また、本発明に係る制御装置は、前記特性測定用指令値は、ランプ関数であり、前記補正シフト時間算出部は、ランプ応答からステップ応答を算出し、前記ステップ応答から前記補正シフト時間を算出するものであってもよい。
 また、本発明に係る制御装置は、前記補正シフト時間は、前記制御対象の前記応答の遅れ特性から算出される実数であってもよい。
 本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
2 制御対象
10 制御部
20 指令値生成部
30 学習制御部
40 特性測定用指令値生成部
50 補正シフト時間算出部
100 制御装置
 

Claims (6)

  1.  制御対象を制御する制御装置であって、
     指令パターンから指令値を算出する指令値生成部と、
     前記指令パターンから算出された前記指令値を補正する補正値を含む補正データを繰り返し算出する学習制御部と、
     前記指令値と前記補正データから補正後指令値を算出し、前記制御対象に対して補正後指令値を送信する制御部と、
    を備え、
     前記学習制御部は、前記制御対象に対して出力した前記補正後指令値に対するフィードバック値と、前記指令値生成部が演算した前記指令値との偏差と、前記制御対象の応答の遅れ特性とから、前記補正データを生成する、
    ことを特徴とする、制御装置。
  2.  前記制御装置は、特性測定用指令値生成部と、前記学習制御部で学習制御を行う際に用いられる補正シフト時間を算出する補正シフト時間算出部と、をさら備え、
     前記補正シフト時間算出部は、前記特性測定用指令値生成部が生成した特性測定用指令値に対するフィードバック値を取得し、特性測定用指令値とフィードバック値とを比較することにより前記補正シフト時間を算出する、請求項1に記載の制御装置。
  3.  前記特性測定用指令値は、単位時間幅の短パルスであることを特徴とする、請求項2に記載の制御装置。
  4.  前記特性測定用指令値は、ステップ関数であり、前記補正シフト時間算出部はステップ応答を算出することにより、前記補正シフト時間を算出することを特徴とする、請求項2に記載の制御装置。
  5.  前記特性測定用指令値は、ランプ関数であり、前記補正シフト時間算出部は、ランプ応答からステップ応答を算出し、前記ステップ応答から前記補正シフト時間を算出することを特徴とする、請求項2に記載の制御装置。
  6.  前記補正シフト時間は、前記制御対象の前記応答の遅れ特性から算出される実数であることを特徴とする、請求項2~4のいずれか1項に記載の制御装置。
     
PCT/JP2016/082294 2015-11-30 2016-10-31 制御装置 WO2017094424A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP16870364.3A EP3385796B1 (en) 2015-11-30 2016-10-31 Control device
CN201680046503.XA CN107850874B (zh) 2015-11-30 2016-10-31 控制装置
US15/750,828 US10571874B2 (en) 2015-11-30 2016-10-31 Control device for performing learning control

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015234297A JP6544219B2 (ja) 2015-11-30 2015-11-30 制御装置
JP2015-234297 2015-11-30

Publications (1)

Publication Number Publication Date
WO2017094424A1 true WO2017094424A1 (ja) 2017-06-08

Family

ID=58797049

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/082294 WO2017094424A1 (ja) 2015-11-30 2016-10-31 制御装置

Country Status (5)

Country Link
US (1) US10571874B2 (ja)
EP (1) EP3385796B1 (ja)
JP (1) JP6544219B2 (ja)
CN (1) CN107850874B (ja)
WO (1) WO2017094424A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019107454A1 (ja) * 2017-11-28 2019-06-06 川崎重工業株式会社 技能伝承機械装置
WO2019176655A1 (ja) * 2018-03-15 2019-09-19 オムロン株式会社 学習装置、学習方法、及びそのプログラム
JP2019160017A (ja) * 2018-03-15 2019-09-19 オムロン株式会社 学習装置、学習方法、及びそのプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6897360B2 (ja) 2017-06-21 2021-06-30 オムロン株式会社 制御装置、制御プログラムおよび制御システム
JP6740277B2 (ja) * 2018-04-13 2020-08-12 ファナック株式会社 機械学習装置、制御装置、及び機械学習方法
EP3561615B1 (en) * 2018-04-23 2021-07-14 Omron Corporation Method for operating an automation system and automation system
US10840840B2 (en) 2018-06-14 2020-11-17 Mitsubishi Electric Corporation Machine learning correction parameter adjustment apparatus and method for use with a motor drive control system
JP7156982B2 (ja) * 2019-03-11 2022-10-19 株式会社日立製作所 リアルタイムコントローラおよびそれを用いた分散制御システム、産業機械

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057409A (ja) * 1983-09-08 1985-04-03 Kobe Steel Ltd 学習制御方法
JPS62174804A (ja) * 1986-01-28 1987-07-31 Komatsu Ltd 産業用ロボツトの学習制御方法
JPS63204402A (ja) * 1987-02-20 1988-08-24 Sanyo Electric Co Ltd Piまたはpid調節器
JPH03269703A (ja) * 1990-03-20 1991-12-02 Yaskawa Electric Corp 指令補正方法
JP2003308101A (ja) * 2002-04-16 2003-10-31 Yokogawa Electric Corp オフライン診断システム
JP2004227163A (ja) 2003-01-21 2004-08-12 Fanuc Ltd サーボ制御装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4580535A (en) * 1985-06-03 1986-04-08 Mitsubishi Jidosha Kogyo Kabushiki Kaisha Engine idling speed controlling system
JPH0731529B2 (ja) * 1988-07-29 1995-04-10 オ−クマ株式会社 数値制御工作機械における学習制御方式
JP3442795B2 (ja) * 1992-02-10 2003-09-02 富士重工業株式会社 エンジンのiscバルブ制御方法
US5773938A (en) * 1995-07-04 1998-06-30 Samsung Electronics Co., Ltd. Apparatus for controlling speed of a rotary motor
JP2716024B2 (ja) * 1995-11-24 1998-02-18 日本電気株式会社 先読み学習によるディジタルサーボ装置
JP3215067B2 (ja) * 1997-03-21 2001-10-02 ファナック株式会社 移動方向反転時の位置補正方法
US6574067B2 (en) * 2000-02-25 2003-06-03 Seagate Technology Llc Optimally designed parsimonious repetitive learning compensator for hard disc drives having high track density
KR100677097B1 (ko) * 2000-08-26 2007-02-05 삼성전자주식회사 광 기록/재생 장치에서 학습 제어를 이용한 외란 보상장치 및 방법과, 그를 이용한 광 기록 매체 드라이브 서보시스템
JP2002239960A (ja) * 2001-02-21 2002-08-28 Sony Corp ロボット装置の動作制御方法、プログラム、記録媒体及びロボット装置
JP2002358678A (ja) * 2001-05-31 2002-12-13 Fujitsu Ltd トラックサーボ制御方法、トラックサーボ制御装置及び光記憶装置
KR100408288B1 (ko) * 2001-06-20 2003-12-03 삼성전자주식회사 편심 보상을 위한 디스크 드라이브 서보 시스템 및 외란보상 방법
JP3787762B2 (ja) * 2001-10-23 2006-06-21 株式会社日立グローバルストレージテクノロジーズ 磁気ディスク装置および回転同期振動の制御方法
JP4043996B2 (ja) * 2003-01-20 2008-02-06 ファナック株式会社 サーボモータ駆動制御装置
JP3898686B2 (ja) * 2003-10-20 2007-03-28 ファナック株式会社 数値制御装置
JP2005174510A (ja) * 2003-12-15 2005-06-30 Toshiba Corp ディスク記憶装置及びディスクシフト量算出方法
JP2005327191A (ja) * 2004-05-17 2005-11-24 Fanuc Ltd サーボ制御装置
JP4355261B2 (ja) * 2004-06-09 2009-10-28 三菱電機株式会社 内燃機関のスロットル制御装置
JP2006105943A (ja) * 2004-10-08 2006-04-20 Omron Corp 知識作成装置及びパラメータ探索方法並びにプログラム製品
JP2006110702A (ja) * 2004-10-18 2006-04-27 Fanuc Ltd 学習制御機能を備えたロボット及びロボットの制御方法
JP4276187B2 (ja) * 2005-02-02 2009-06-10 ファナック株式会社 学習制御機能を有する数値制御装置
JP4074638B2 (ja) * 2006-01-31 2008-04-09 ファナック株式会社 電動機の制御装置
JP4340676B2 (ja) * 2006-10-11 2009-10-07 本田技研工業株式会社 制御装置
JP2008225533A (ja) * 2007-03-08 2008-09-25 Fanuc Ltd サーボ制御装置
JP4323542B2 (ja) * 2007-10-22 2009-09-02 ファナック株式会社 学習制御機能を備えた電動機の制御装置
JP4741637B2 (ja) * 2008-06-30 2011-08-03 ファナック株式会社 サーボモータの駆動制御装置及び駆動制御方法
US8239106B2 (en) * 2009-03-27 2012-08-07 GM Global Technology Operations LLC Adaptive shift learn control for automatic transmissions
JP4575508B1 (ja) * 2009-05-20 2010-11-04 ファナック株式会社 デュアル位置フィードバック制御を行うサーボ制御装置
CN102163047B (zh) * 2010-02-19 2014-02-12 发那科株式会社 学习控制机器人
US8251484B2 (en) * 2010-05-14 2012-08-28 Xerox Corporation Method and system for measuring and compensating for sensitivity and backlash in electrical motors that laterally move printheads in a continuous web inkjet printer
JP5647917B2 (ja) * 2011-03-04 2015-01-07 東芝三菱電機産業システム株式会社 制御装置及び制御方法
US8886359B2 (en) * 2011-05-17 2014-11-11 Fanuc Corporation Robot and spot welding robot with learning control function
JP5221735B2 (ja) * 2011-10-27 2013-06-26 ファナック株式会社 不感帯処理部を備えた電動機の制御装置
JP5897662B2 (ja) * 2014-07-30 2016-03-30 ファナック株式会社 複数軸の加工精度を向上させるサーボモータの制御装置
JP6474456B2 (ja) * 2017-05-16 2019-02-27 ファナック株式会社 機械学習装置、サーボ制御システム及び機械学習方法
JP6538766B2 (ja) * 2017-07-18 2019-07-03 ファナック株式会社 機械学習装置、サーボモータ制御装置、サーボモータ制御システム、及び機械学習方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6057409A (ja) * 1983-09-08 1985-04-03 Kobe Steel Ltd 学習制御方法
JPS62174804A (ja) * 1986-01-28 1987-07-31 Komatsu Ltd 産業用ロボツトの学習制御方法
JPS63204402A (ja) * 1987-02-20 1988-08-24 Sanyo Electric Co Ltd Piまたはpid調節器
JPH03269703A (ja) * 1990-03-20 1991-12-02 Yaskawa Electric Corp 指令補正方法
JP2003308101A (ja) * 2002-04-16 2003-10-31 Yokogawa Electric Corp オフライン診断システム
JP2004227163A (ja) 2003-01-21 2004-08-12 Fanuc Ltd サーボ制御装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3385796A4

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019107454A1 (ja) * 2017-11-28 2019-06-06 川崎重工業株式会社 技能伝承機械装置
WO2019107455A1 (ja) * 2017-11-28 2019-06-06 川崎重工業株式会社 技能伝承機械装置
JPWO2019107455A1 (ja) * 2017-11-28 2020-11-19 川崎重工業株式会社 技能伝承機械装置
JPWO2019107454A1 (ja) * 2017-11-28 2020-11-19 川崎重工業株式会社 技能伝承機械装置
JP7185639B2 (ja) 2017-11-28 2022-12-07 川崎重工業株式会社 技能伝承機械装置
JP7185640B2 (ja) 2017-11-28 2022-12-07 川崎重工業株式会社 技能伝承機械装置
WO2019176655A1 (ja) * 2018-03-15 2019-09-19 オムロン株式会社 学習装置、学習方法、及びそのプログラム
JP2019160017A (ja) * 2018-03-15 2019-09-19 オムロン株式会社 学習装置、学習方法、及びそのプログラム
JP2019160016A (ja) * 2018-03-15 2019-09-19 オムロン株式会社 学習装置、学習方法、及びそのプログラム
CN111684366A (zh) * 2018-03-15 2020-09-18 欧姆龙株式会社 学习装置、学习方法及其程序

Also Published As

Publication number Publication date
JP6544219B2 (ja) 2019-07-17
CN107850874B (zh) 2020-12-11
US10571874B2 (en) 2020-02-25
EP3385796B1 (en) 2020-10-14
CN107850874A (zh) 2018-03-27
EP3385796A1 (en) 2018-10-10
EP3385796A4 (en) 2019-10-16
US20180231943A1 (en) 2018-08-16
JP2017102624A (ja) 2017-06-08

Similar Documents

Publication Publication Date Title
WO2017094424A1 (ja) 制御装置
JP6519457B2 (ja) 補正装置、補正装置の制御方法、情報処理プログラム、および記録媒体
US10386794B2 (en) Control device, storage medium, and control system by creating internal model of control target
CN109100990B (zh) 控制装置、记录媒体及控制系统
JP5227254B2 (ja) プロセスモデルの状態量のリアルタイム計算方法およびシミュレータ
JP2016130908A (ja) 加工条件に応じてパラメータを調整するパラメータ自動調整装置
JP6519458B2 (ja) 制御装置
US11086277B2 (en) System and method for determining the parameters of a controller
US11262721B2 (en) Automatic optimization of the parameterization of a movement controller
WO2020162200A1 (ja) 制御装置および制御プログラム
WO2020162199A1 (ja) 制御装置、モデル作成方法および制御プログラム
JP6087262B2 (ja) 数値制御装置
CN111052029B (zh) 指令值插值装置和伺服驱动器
JP2010218007A (ja) 外乱推定装置、制御対象モデル推定装置、フィードフォワード量推定装置および制御装置
KR101432432B1 (ko) 가속도가 제한된 유연시스템의 과도변위 제한 및 잔류진동 저감을 위한 입력성형 제어기 및 이에 의한 과도변위 제한 및 잔류진동 저감방법
JP7031624B2 (ja) 制御装置および制御プログラム
CN117099062A (zh) 用于确定补偿参数的方法和系统
Duma et al. Towards a rapid control prototyping toolbox for the stellaris lm3s8000 microcontrollers
KR20150093998A (ko) 가속도 제한된 유연시스템에 대한 허용 잔류변위를 활용한 강건 입력성형 제어방법
US20070038312A1 (en) Parameter setting device, parameter setting method and program
JP2004277992A (ja) 幅方向位置対応関係の同定方法およびそれを用いたシート状製品製造装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16870364

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 15750828

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE