WO2020158184A1 - 搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデル - Google Patents

搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデル Download PDF

Info

Publication number
WO2020158184A1
WO2020158184A1 PCT/JP2019/047600 JP2019047600W WO2020158184A1 WO 2020158184 A1 WO2020158184 A1 WO 2020158184A1 JP 2019047600 W JP2019047600 W JP 2019047600W WO 2020158184 A1 WO2020158184 A1 WO 2020158184A1
Authority
WO
WIPO (PCT)
Prior art keywords
target position
transported object
acceleration
start position
learning
Prior art date
Application number
PCT/JP2019/047600
Other languages
English (en)
French (fr)
Inventor
敬之 西
Original Assignee
富士フイルム株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 富士フイルム株式会社 filed Critical 富士フイルム株式会社
Priority to JP2020569417A priority Critical patent/JP7270654B2/ja
Publication of WO2020158184A1 publication Critical patent/WO2020158184A1/ja

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B66HOISTING; LIFTING; HAULING
    • B66CCRANES; LOAD-ENGAGING ELEMENTS OR DEVICES FOR CRANES, CAPSTANS, WINCHES, OR TACKLES
    • B66C13/00Other constructional features or details
    • B66C13/18Control systems or devices
    • B66C13/22Control systems or devices for electric drives
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D3/00Control of position or direction
    • G05D3/12Control of position or direction using feedback

Definitions

  • the present disclosure relates to a transfer control device that transfers an object to be transferred to a target position, a transfer control method, a transfer control program, a learning device, a learning method, a learning program, and a learned model.
  • the transported object In a transport system that transports a transported object by a suspension crane, the transported object is hung on a crane, transported to the target position while the transported object is suspended, and the transported object is unloaded at the target position. The work is repeated. However, when the conveyed object is stopped at the target position, it swings according to the law of inertia. Therefore, in order to continue the work such as unloading the transported object from the crane, it is necessary to wait until the swing stops or to perform the work to stop the swing forcibly, resulting in a work time Becomes longer.
  • Patent Document 1 a fuzzy inference using a rule map is used to create an operating speed pattern including two-stage acceleration and deceleration suitable for the rope length to be used, the load deflection angle of a suspended load is measured, and a learning function is provided.
  • a method has been proposed in which the control time for acceleration and deceleration is adjusted based on the load deflection angle using.
  • Patent Document 2 proposes a method of measuring a rope state amount such as a rope deflection angle and using model prediction control to output a speed reference for stopping a trolley at a target position.
  • Patent Document 3 a load deflection angle of a suspended load is measured, and a parameter required for speed control of a trolley by a learning model based on a crane deflection such as a rope length and a weight of a suspended load and a deflection angle. Has been proposed.
  • Patent Documents 1 to 3 require additional means such as a sensor for measuring the load swing angle and the rope swing angle.
  • additional means such as a sensor for measuring the load swing angle and the rope swing angle.
  • the method using the rule map described in Patent Document 1 when a rope having a rope length that is not included in the rule map is used, there is a possibility that an appropriate operating speed pattern cannot be created.
  • the method described in Patent Document 2 uses a model based on the dynamics of a crane having a two-dimensional pendulum, it is necessary to analyze the model system.
  • the method described in Patent Document 3 uses a state equation in which the crane is a single pendulum, it is difficult to apply it to a complicated model other than the crane.
  • the present disclosure has been made in view of the above circumstances, and an object of the present disclosure is to make it possible to easily suppress shaking of a conveyed object when the object is stopped.
  • a transfer control device is a transfer control device that suspends a transferred object swingably and transfers the transferred object from a start position to a target position.
  • the transported object By inputting at least the length from the fulcrum of swing to the center of gravity of the transported object and the information indicating the start position and the target position, the transported object for minimizing the shaking when the transported object reaches the target position
  • a learned model that has been learned to output the steady speed and the timing of acceleration/deceleration during the conveyance of
  • An input unit that receives input of information indicating the length and the start position and the target position, Based on the input length and the information indicating the start position and the target position, the learned model outputs the steady speed and the acceleration/deceleration timing when the transferred object is conveyed from the start position to the target position.
  • the information indicating the start position and the target position may include three-dimensional coordinates of the start position and the target position.
  • the information indicating the start position and the target position may include the distance between the start position and the target position.
  • the information indicating the start position and the target position may include the distance between the start position and the target position and the height difference between the start position and the target position. Good.
  • the acceleration/deceleration timing may include the acceleration time or the acceleration end time.
  • the acceleration/deceleration timing may include an acceleration end time, a deceleration start time, and a deceleration end time.
  • the acceleration/deceleration timing may be the first acceleration end time, at least one second acceleration start time, at least one second acceleration end time, or at least one deceleration start time. And at least one deceleration end time.
  • a drive unit that is driven along a path including a start position and a target position may further include a control unit that controls the drive unit according to the steady speed and the acceleration/deceleration timing output from the learned model.
  • the drive unit may include a hook that suspends the transported object.
  • the drive unit may include a suspending mechanism that suspends the transferred object so as to be rotatable in the moving direction of the transferred object.
  • a learning device is a learning device for learning a learning model for suspending an object to be oscillated and determining a timing of acceleration/deceleration when the object is conveyed from a start position to a target position. There At least the length from the fulcrum of swing to the center of gravity of the conveyed object, and the information indicating the start position and the target position, the conveyance of the conveyed object to minimize the shaking when the conveyed object reaches the target position.
  • An input unit that receives input of a plurality of teacher data representing the steady speed and the timing of acceleration/deceleration in the Based on a plurality of teacher data, at least the length from the fulcrum of swing to the center of gravity of the transported object and unknown information indicating the start position and the target position are input to determine when the transported object reaches the target position.
  • a learning unit that learns a learning model so as to output a steady speed and a timing of acceleration/deceleration during the conveyance of the conveyed object for minimizing the shake.
  • the learned model according to the present disclosure is a learned model for determining the timing of acceleration/deceleration when suspending a transported object swingably and transporting the transported object from a start position to a target position, By inputting at least the length from the fulcrum of swing to the center of gravity of the transported object and the information indicating the start position and the target position, the transported object for minimizing the shaking when the transported object reaches the target position Learning is performed to output the steady speed and the timing of acceleration/deceleration during the conveyance of.
  • a transport control method is a transport control method of suspending a transported object swingably and transporting the transported object from a start position to a target position, By inputting at least the length from the fulcrum of swing to the center of gravity of the transported object and the information indicating the start position and the target position, the transported object for minimizing the shaking when the transported object reaches the target position Accepts input of information indicating the length and the start position and target position for the learned model that has output the steady speed and the timing of acceleration/deceleration during the conveyance of Based on the input length and the information indicating the start position and the target position, the learned model outputs the steady speed and the acceleration/deceleration timing when the transferred object is conveyed from the start position to the target position.
  • a learning method is a learning method for learning a learning model for suspending an object to be oscillated and determining a timing of acceleration/deceleration when the object is conveyed from a start position to a target position. There At least the length from the fulcrum of swing to the center of gravity of the conveyed object, and the information indicating the start position and the target position, the conveyance of the conveyed object to minimize the shaking when the conveyed object reaches the target position.
  • Another transfer control device is a transfer control device that suspends a transferred object swingably and transfers the transferred object from a start position to a target position, and stores a command to be executed by a computer.
  • Memory and A processor configured to execute the stored instructions, the processor comprising: By inputting at least the length from the fulcrum of swing to the center of gravity of the transported object and the information indicating the start position and the target position, the transported object for minimizing the shaking when the transported object reaches the target position Accepts input of information indicating the length and the start position and target position for the learned model that has output the steady speed and the timing of acceleration/deceleration during the conveyance of Based on the input length and the information indicating the start position and the target position, the learned model is used to output the steady speed and the acceleration/deceleration timing when the transferred object is conveyed from the start position to the target position. ..
  • Another learning apparatus is a learning method for learning a learning model for suspending an object to be oscillated and determining a timing of acceleration/deceleration when the object is conveyed from a start position to a target position.
  • a diagram showing a speed pattern in which the timing of acceleration and deceleration is non-axisymmetric Diagram showing the speed pattern that performs acceleration/deceleration in multiple stages The figure which shows the speed pattern used as S-shaped acceleration/deceleration.
  • FIG. 1 is an overall configuration diagram of a transfer device to which a transfer control device according to an embodiment of the present disclosure is applied.
  • the carrier device 1 according to the present embodiment has a linear guide member 3 and a guide member that are respectively connected to the upper ends of the two columns 2A and 2B and the two columns 2A and 2B. 3, a drive unit 4 that is moved along the drive unit 3, a moving mechanism 5 for moving the drive unit 4, and a control unit 6 that controls the drive of the drive unit 4.
  • the drive unit 4 and the control unit 6 constitute the transfer control device of this embodiment.
  • the moving mechanism 5 for moving the drive unit 4 includes a motor 10 and a ball screw 11 rotated by the motor 10.
  • the motor 10 is attached to the guide member 3 on the front side in the transport direction with respect to the transport start position Ps of the transported object 7 transported by the drive unit 4.
  • the ball screw 11 extends along the guide member 3.
  • One end of the ball screw 11 is connected to the motor 10, and the other end is rotatably supported by the bearing 12.
  • the bearing 12 is attached to the guide member 3 at a position beyond the target position Pe for transportation in the transport direction of the transported object 7.
  • a hook 4a for suspending the transported object 7 is attached to the drive unit 4.
  • An encoder 13 is connected to the motor 10.
  • the encoder 13 detects the position of the drive unit 4 according to the rotation of the motor 10 and outputs a detection signal to the control unit 6.
  • the moving mechanism 5 for moving the drive unit 4 is not limited to the above configuration, and any configuration can be adopted as long as the drive unit 4 can be moved along the guide member 3.
  • the transported object 7 is, for example, an endoscope flexible tube described in JP 2011-183115 A.
  • the transported object 7 is held and transported by the holding member 8.
  • a hook 8a is attached to the holding member 8 on the side opposite to the side holding the transported object 7.
  • the transported object 7 held by the holding member 8 is oscillatably suspended by the drive unit 4 by hooking the hook 8a on the hook 4a of the drive unit 4.
  • FIG. 2 is a schematic block diagram showing the configuration of the control unit.
  • the control unit 6 includes a CPU (Central Processing Unit) 21, a motion controller 22, a servo amplifier 23, a storage unit 24, a learned model 25, and a learning unit 26.
  • an input unit 27 including a keyboard and a mouse, and a display unit 28 including a liquid crystal monitor are connected to the control unit 6.
  • the input unit 27 also has a function such as a communication interface for inputting data to the control unit 6.
  • the steady speed and the acceleration/deceleration timing of the drive unit 4 are input to the motion controller 22 from the learned model 25.
  • a position signal indicating the position of the drive unit 4 is input to the motion controller 22 via the servo amplifier 23.
  • the motion controller 22 outputs a drive signal for driving the motor 10 to the servo amplifier 23 according to the instruction from the CPU 21, the output of the learned model 25, and the input position signal.
  • the learned model 25 will be described later.
  • the drive signal from the motion controller 22 and the detection signal from the encoder 13 are input to the servo amplifier 23.
  • the servo amplifier 23 outputs a drive signal to the motor 10, which causes the motor 10 to rotate and drive the drive unit 4.
  • the drive unit 4 is accelerated/decelerated at the acceleration/deceleration timing output by the learned model 25, and the rotation of the motor 10 is controlled so that the drive unit 4 attains the steady speed output by the learned model 25.
  • the storage unit 24 includes a semiconductor memory and serves as a work area when the control unit 6 performs various controls.
  • the control unit 6 drives the drive unit 4 to move the drive unit 4 from the start position Ps to the target position Pe, so that the transported object suspended by the drive unit 4 is swingable. 7 is conveyed from the start position Ps to the target position Pe.
  • the learned model 25 is input with information indicating the length L0 from the fulcrum P0 of the swing of the transported object 7 to the center of gravity G0 of the transported object 7 and the start position Ps and the target position Pe shown in FIG.
  • the information indicating the start position Ps and the target position Pe is the distance D0 between the start position Ps and the target position Pe shown in FIG.
  • the swing fulcrum P0 is a point where the hook 4a and the hook 8a come into contact with each other when the transported object 7 is hung on the drive unit 4. More specifically, the position of the swing fulcrum P0 can be specified by swinging the transported object 7 while the transported object 7 is suspended by the drive unit 4.
  • a linearly symmetrical velocity pattern as shown in FIG. 3 is used.
  • the drive unit 4 is accelerated in the section z1, is driven at a constant speed at the steady speed V0 in the section z2, and is decelerated in the section z3.
  • the sections z1 and z3 have the same length of time. Therefore, in the present embodiment, if the length of time in the section z1, that is, the acceleration time T1 from the start of acceleration to the stop of acceleration and the steady speed V0 in the section z2 are determined, the drive unit 4 is determined.
  • the transported object 7 can be moved from the start position Ps to the target position Pe.
  • the acceleration time T1 is used as the acceleration/deceleration timing output by the learned model 25. Therefore, in the present embodiment, the learned model 25 is constructed so as to output the steady speed V0 and the acceleration time T1 by inputting the length L0 and the distance D0.
  • FIG. 4 is a diagram schematically showing the learned model 25.
  • the learned model 25 is composed of a neural network having a three-layer structure including an input layer 31, a hidden layer 32, and an output layer 33.
  • the hierarchy of the neural network is not limited to three layers, and may be appropriately set to two layers or four layers or more in consideration of learning accuracy and learning load.
  • the input layer 31 includes two units u1-1 and u1-2, to which the length L0 and the distance D0 are input.
  • the output layer 33 has two units u3-1 and u3-2, and the steady speed V0 and the acceleration time T1 are output from each of them.
  • the learning unit 26 performs learning of the neural network.
  • the weight of the connection between each unit of each layer in the neural network is determined using the teacher data.
  • the transported object 7 is set at the target position with respect to the combination of the length L0 from the swing fulcrum P0 to the center of gravity of the transported object 7 and the distance D0 between the start position Ps and the target position Pe.
  • Plural sets of teacher data are prepared in which a combination of the steady speed V0 and the acceleration time T1 during the conveyance of the conveyed object 7 is set so as to minimize the shake when reaching Pe.
  • the neural network corresponds to the learning model of the present disclosure.
  • the transported object 7 is moved from the start position Ps as described in, for example, Japanese Patent Laid-Open No. 2011-93333.
  • the length of time to move to the target position Pe may be set to n times (n is a natural number) the cycle of shaking of the transported object 7.
  • the teacher data may be prepared by experimentally obtaining the steady speed V0 and the acceleration time T1 for the length L0 and the various distances D0 of the various transported objects 7.
  • the performance of the learned model 25 can be improved by preparing teacher data having various lengths L0 and distances D0.
  • the learning unit 26 learns the neural network and constructs the learned model 25 by updating the connection weight between units in each layer of the neural network using a plurality of teacher data. Accordingly, when the unknown length L0 and the unknown distance D0 are input, the steady speed V0 and the acceleration time T1 for minimizing the swing of the transported object 7 are output from the learned model 25. Become.
  • the learned model 25 is evaluated by inputting the length L0 and the distance D0 included in certain teacher data into the learned model 25, outputting the steady speed V0 and the acceleration time T1 output from the learned model 25, and the teacher data. Can be obtained by obtaining the correlation between the steady speed V0 and the acceleration time T1 of In this case, if the correlation is larger than a predetermined threshold value, it can be evaluated that the learned model 25 is appropriately learned. On the contrary, if the correlation is less than or equal to the threshold value, it can be evaluated that the learned model 25 is not properly learned. In this case, it is necessary to improve the accuracy of the learned model 25 by re-learning the learned model 25.
  • the learned model 25 outputs the steady speed V0 and the acceleration time T1 for minimizing the swing of the transported object 7 for the combination of the unknown length L0 and the unknown distance D0
  • the unknown length is output.
  • the trained model 25 may be further learned by using the steady speed V0 and the acceleration time T1 for the length L0 and the unknown distance D0 as new teacher data.
  • the control unit 6 may be composed of a computer including a CPU, a semiconductor memory, a hard disk, and the like.
  • the transfer control program and the learning program of the present disclosure are installed in the hard disk, and the drive of the drive unit 4 is controlled by the transfer control program.
  • FIG. 5 is a flowchart showing the processing performed during learning in this embodiment.
  • the learning unit 26 receives an input of teacher data from the input unit 27 (step ST1), and learns a neural network that is a learning model using the teacher data (step ST2). As a result, the learned model 25 is constructed.
  • FIG. 6 is a flowchart showing the processing performed during the transport control in this embodiment.
  • the control unit 6 receives the input of the length L0 and the distance D0 of the transported object 7 from the input unit 27 (step ST11).
  • the learned model 25 outputs the steady speed V0 and the acceleration time T1 by the input of the length L0 and the distance D0 (step ST12).
  • the control unit 6 conveys the conveyed object 7 according to the velocity pattern based on the steady velocity V0 and the acceleration time T1 (step ST13), and ends the process.
  • the learned model 25 Based on the information indicating Pe, the learned model 25 outputs the steady speed V0 and the acceleration time T1 which is the timing of acceleration/deceleration when the conveyed object 7 is conveyed from the start position Ps to the target position Pe. Is. Therefore, if the drive unit 4 is driven by the steady speed V0 and the acceleration time T1 output from the learned model 25 to convey the conveyed object 7 from the start position Ps to the target position Pe, the target position Pe is reached. It is possible to minimize the shaking of the transported object 7 at that time. Therefore, according to the present embodiment, it is possible to easily suppress the shaking of the transported object when the transported object is stopped, without separately providing a device such as a sensor.
  • the learned model 25 is used, compared with the method using the rule map like the method described in Patent Document 1, the steady speed V0 appropriate for the unknown condition is obtained. And the timing of acceleration/deceleration can be acquired.
  • the learned model 25 since the learned model 25 is used, even the transported object 7 that cannot be replaced by a simple model due to bending like an endoscope flexible tube occurs. It is possible to generate a steady speed and a timing of acceleration/deceleration that minimizes the shaking when stopped. Therefore, it is not necessary to analyze the model system or the like unlike the methods described in Patent Documents 2 and 3, and as a result, it is possible to easily suppress the shaking of the transported object when it is stopped.
  • a neural network having a three-layer structure shown in FIG. 4 was prepared as a learning model.
  • the teacher data as shown in FIG. 7, various combinations of the length L0 and the distance D0 and the steady speed V0 and the acceleration time T1 for minimizing the swing of the transported object 7 that has reached the target position Pe. 14 sets of teacher data were prepared that corresponded to various combinations of.
  • the speed pattern is a line-symmetric pattern in which the acceleration time and the deceleration time are the same as shown in FIG.
  • the commercially available neural network fitting application was used for the neural network for constructing the trained model 25. Specifically, a neural network was constructed using a Matlab Neural Fitting tool manufactured by MathWorks.
  • the neural network fitting application is not limited to the above, and for example, Tensorflow python or the like may be used.
  • the Levenberg-Marquardt method is a network learning algorithm that updates the value of the weight according to the optimization of the Levenberg-Marquardt method, and has a characteristic of high calculation speed.
  • the Levenberg-Marquardt method is a least-squares algorithm that finds a vector that minimizes the function of the sum of squares, where the performance is the mean or sum of the squared errors.
  • the Bayesian regularization algorithm is a network learning algorithm that updates the value of weights according to the optimization of the Levenberg-Marquardt method, but in addition to the error that is performance, it is the one that minimizes the linear combination of weight squares. ..
  • a regularization term is added to the evaluation function, and the linear combination is changed so that the generalization quality of the resulting network at the end of learning is good (overtraining suppression).
  • FIG. 8 is a table showing the evaluation results of learning. As shown in FIG. 8, the evaluation value of the Bayes normalization learning algorithm method was lower than that of the Levenberg-Marquardt method. For this reason, the Bayes normalization learning algorithm was used for learning the neural network.
  • FIG. 9 shows an output result when a combination of the length L0 and the distance D0 which is not included in the teacher data is input to the learned model 25.
  • FIG. 10 is a diagram showing a simulation result when the transported object 7 is transported using the steady speed V0 and the acceleration time T1 output from the learned model 25.
  • the solid line indicates the transport simulation result
  • the broken line indicates the swing cycle of the transported object 7 in the simulation.
  • the time required to carry the transported object 7 based on the output result of the learned model 25 substantially matches the swing cycle of the transported object 7. Therefore, it is possible to suppress the swing of the transported object 7 after the transported object 7 is transported to the target position Pe.
  • the length of time until the acceleration is stopped may be used as the output of the learned model 25, instead of the acceleration time T1.
  • the length L0 and the distance D0 are used as inputs of the learned model 25, but the present invention is not limited to this.
  • the three-dimensional coordinates of the start position Ps and the target position Pe may be used instead of the distance D0.
  • the input layer 31 of the neural network has seven units. Will have.
  • the three-dimensional coordinates of the target position Pe based on the start position Ps may be input to the learned model 25.
  • the input layer 31 of the neural network has four units. ..
  • the height difference between the start position Ps and the target position Pe may be further used as an input to the learned model 25.
  • the learned model 25 is constructed to output the steady speed V0 and the acceleration/deceleration timing by inputting the height difference in addition to the length L0 and the distance D0. Therefore, the input layer 31 of the neural network has three units. As a result, as shown in FIG. 11, even when the heights of the start position Ps and the target position Pe are different, the steady speed V0 capable of suppressing the swing of the transported object 7 reaching the target position Pe. And the acceleration time T1 is output from the learned model 25.
  • the input to the learned model 25 is performed.
  • the height difference can be included.
  • the characteristics of the transported object 7, for example, the weight, the length, the projected area, and the rigidity of the transported object are input to the learned model 25. Etc. may be further used.
  • the projected area is an area when the transported object 7 is projected in the moving direction, and when the transported object 7 has a cylindrical shape, the projected area is obtained by the product of the outer diameter and the length of the transported object 7. You can The Young's modulus of the transported object 7 may be used as the rigidity.
  • the input layer 31 of the neural network has the number of units corresponding to the input.
  • the transported object 7 can be transported at the steady speed V0 and the timing of acceleration/deceleration in consideration of the characteristics of the transported object 7, and as a result, the target position Pe can be set according to the characteristics of the transported object 7. It is possible to minimize the shaking of the transported object 7 when it reaches.
  • the speed pattern of the transported object 7 a speed pattern having line symmetry as shown in FIG. 3 is used, but the speed pattern is not limited to this.
  • the present disclosure can be applied to speed patterns in which the acceleration time T1 and the deceleration time T2 are different.
  • the learned model 25 is learned so as to output the steady speed V0, the acceleration time T1 and the deceleration time T2.
  • the output layer 33 of the neural network has three units.
  • the learned model 25 may be constructed so as to output the acceleration end time t11, the deceleration start time t12, and the deceleration end time t13 from the movement start, instead of the deceleration time T2.
  • a speed pattern in which acceleration/deceleration is performed in multiple stages may be used.
  • the learned model 25 is learned so as to output the time t1, t2, t3, t4, t5, t6, t7, t8, t9 which is the timing of acceleration/deceleration from the start of movement.
  • t1 is the first acceleration end time
  • t2 is the second acceleration start time
  • t3 is the second acceleration end time
  • t4, t6, and t8 are deceleration start times
  • t5, t7, and t9 are deceleration end times.
  • the output layer 33 of the neural network has 10 units including the steady speed V0.
  • the speed pattern in which acceleration/deceleration is performed with uniform acceleration is used, but the present invention is not limited to this.
  • a speed pattern may be used that has an S-shaped acceleration/deceleration, such that the acceleration at the time of starting and stopping the movement is reduced.
  • the learned model 25 may be learned so that the acceleration time T1 and the deceleration time T2 in the speed pattern having the S-shaped acceleration/deceleration are output.
  • the neural network may be learned so as to output either uniform acceleration or S-shaped acceleration as the acceleration/deceleration pattern.
  • the hook 4a is attached to the drive unit 4, and the hook 8a of the holding member 8 is hooked on the hook 4a to suspend the transported object 7 on the drive unit 4, but the present invention is not limited to this. Not a thing.
  • any mechanism capable of suspending the transported object 7 rotatably in its moving direction can be used.
  • the steady speed V0 and the steady speed V0 for minimizing the shake when the transported object reaches the target position can be obtained depending on the mechanism to be used. Acceleration/deceleration timing can be acquired.
  • the fulcrum of swinging is the center of rotation of the mechanism.
  • control unit 6 includes the learned model 25 and the learning unit 26, but the present invention is not limited to this.
  • the setting unit 40 including the learned model 25 and the learning unit 26 may be provided separately from the control unit 6. In this case, by inputting the length L0 and the distance D0 from the input unit 41 of the setting unit 40, the steady speed V0 and the acceleration time T1 output by the learned model 25 are input to the control unit 6 and the driving unit 4 Will be controlled.
  • the learned model 25 and the learning unit 26 are provided in the control unit 6 or the setting unit 40, but the present invention is not limited to this.
  • the learning unit 26 may be provided separately from the learned model 25.
  • the transported object 7 is transported along the linear guide member 3, but the transport path of the transported object 7 is not limited to the linear shape, but is a curved shape.
  • the route may include a straight line and a curved line.
  • the learning of the neural network is performed by using the training data in which the various combinations of the length L0 and the distance D0 corresponding to the route and the various combinations of the steady speed V0 and the acceleration/deceleration timing are associated with each other, and the learned model is obtained. 25 will be built.

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Mechanical Engineering (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Control Of Conveyors (AREA)
  • Control And Safety Of Cranes (AREA)

Abstract

搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデルにおいて、被搬送物の停止時の揺れを簡易に抑制できるようにする。搬送制御装置は、被搬送物を揺動自在に吊り下げて、被搬送物を開始位置から目標位置まで搬送する。駆動部は、開始位置および目標位置を含む経路に沿って駆動される。学習済みモデルは、少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す情報の入力により、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされる。入力された長さ並びに開始位置および目標位置を表す情報に基づいて、学習済みモデルにより被搬送物を開始位置から目標位置まで搬送する際の定常速度および加減速のタイミングを出力する。

Description

搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデル

 本開示は、被搬送物を目標位置まで搬送する搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデルに関する。

 懸架式クレーンによって被搬送物を搬送する搬送システムにおいては、被搬送物をクレーンに吊り下げ、被搬送物を吊り下げた状態で目標位置まで搬送し、目標位置において被搬送物を降ろすという一連の作業が繰り返される。しかしながら、搬送された被搬送物は、目標位置において停止させると、慣性の法則により揺動する。このため、被搬送物をクレーンから降ろす等の作業を継続するためには、揺動が停止するまで待つか、または揺動を強制的に停止させる作業を行う必要があり、その結果、作業時間が長くなる。

 このような一連の作業の作業時間を短縮するために、停止時における被搬送物の揺れを抑制する手法が提案されている。例えば、特許文献1においては、ルールマップを用いたファジー推論により、使用するロープ長に適した2段加速および減速を含む運転速度パターンを作成し、吊り荷の荷振れ角を計測し、学習機能を用いて荷振れ角に基づいて加速および減速の制御時間を加減する手法が提案されている。また、特許文献2おいては、ロープ振れ角等のロープ状態量を測定し、モデル予測制御を用いて、トロリーを目標位置に停止させるための速度基準を出力する手法が提案されている。また、特許文献3においては、吊り荷の荷振れ角を測定し、ロープ長および吊り荷の重量等のクレーン状態量と荷振れ角とに基づいて、学習モデルによりトロリーの速度制御に必要なパラメータを出力する手法が提案されている。

特開平7-144881号公報 特開平11-21077号公報 特開2003-176093号公報

 しかしながら、特許文献1~3に記載された手法においては、荷振れ角およびロープ振れ角を測定するためのセンサ等の手段が別途必要となる。また、特許文献1に記載されたルールマップを用いる手法においては、ルールマップにないロープ長のロープを使用する場合、適切な運転速度パターンを作成できない可能性がある。また、特許文献2に記載された手法は、2次元振り子のクレーンのダイナミクスを前提としたモデルを使用しているため、モデル系の解析が必要となる。また、特許文献3に記載された手法は、クレーンを単振り子とした状態方程式を用いているため、クレーン以外の複雑なモデルへ適用することは困難である。

 本開示は、上記事情に鑑みなされたものであり、被搬送物の停止時の揺れを簡易に抑制できるようにすることを目的とする。

 本開示による搬送制御装置は、被搬送物を揺動自在に吊り下げて、被搬送物を開始位置から目標位置まで搬送する搬送制御装置であって、

 少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す情報の入力により、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされた学習済みモデルと、

 長さ並びに開始位置および目標位置を表す情報の入力を受け付ける入力部とを備え、

 入力された長さ並びに開始位置および目標位置を表す情報に基づいて、学習済みモデルにより被搬送物を開始位置から目標位置まで搬送する際の定常速度および加減速のタイミングを出力する。

 なお、本開示による搬送制御装置においては、開始位置および目標位置を表す情報は、開始位置および目標位置の3次元座標を含むものであってもよい。

 また、本開示による搬送制御装置においては、開始位置および目標位置を表す情報は、開始位置と目標位置との間の距離を含むものであってもよい。

 また、本開示による搬送制御装置においては、開始位置および目標位置を表す情報は、開始位置と目標位置との間の距離および開始位置と目標位置との間の高低差を含むものであってもよい。

 また、本開示による搬送制御装置においては、加減速のタイミングは、加速時間または加速終了時間を含むものであってもよい。

 また、本開示による搬送制御装置においては、加減速のタイミングは、加速終了時間、減速開始時間および減速終了時間を含むものであってもよい。

 また、本開示による搬送制御装置においては、加減速のタイミングは、第1の加速終了時間、少なくとも1つの第2の加速開始時間、少なくとも1つの第2の加速終了時間、少なくとも1つの減速開始時間および少なくとも1つの減速終了時間を含むものであってもよい。

 また、本開示による搬送制御装置においては、開始位置および目標位置を含む経路に沿って駆動される駆動部と、

 学習済みモデルから出力された定常速度および加減速のタイミングにより、駆動部を制御する制御部とをさらに備えるものであってもよい。

 また、本開示による搬送制御装置においては、駆動部は、被搬送物を吊り下げるフックを備えるものであってもよい。

 また、本開示による搬送制御装置においては、駆動部は、被搬送物を被搬送物の移動方向において回動自在に吊り下げる吊り下げ機構を備えるものであってもよい。

 本開示による学習装置は、被搬送物を揺動自在に吊り下げて、被搬送物を開始位置から目標位置まで搬送する際の加減速のタイミングを決定するための学習モデルを学習する学習装置であって、

 少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す情報に対する、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを表す複数の教師データの入力を受け付ける入力部と、

 複数の教師データに基づいて、少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す未知の情報の入力により、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを出力するように学習モデルを学習する学習部とを備える。

 本開示による学習済みモデルは、被搬送物を揺動自在に吊り下げて、被搬送物を開始位置から目標位置まで搬送する際の加減速のタイミングを決定するための学習済みモデルであって、

 少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す情報の入力により、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされてなる。

 本開示による搬送制御方法は、被搬送物を揺動自在に吊り下げて、被搬送物を開始位置から目標位置まで搬送する搬送制御方法であって、

 少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す情報の入力により、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされた学習済みモデルに対する、長さ並びに開始位置および目標位置を表す情報の入力を受け付け、

 入力された長さ並びに開始位置および目標位置を表す情報に基づいて、学習済みモデルにより被搬送物を開始位置から目標位置まで搬送する際の定常速度および加減速のタイミングを出力する。

 本開示による学習方法は、被搬送物を揺動自在に吊り下げて、被搬送物を開始位置から目標位置まで搬送する際の加減速のタイミングを決定するための学習モデルを学習する学習方法であって、

 少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す情報に対する、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを表す複数の教師データの入力を受け付け、

 複数の教師データに基づいて、少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す未知の情報の入力により、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを出力するように学習モデルを学習する。

 なお、本開示による搬送制御方法および学習方法をコンピュータに実行させるためのプログラムとして提供してもよい。

 本開示による他の搬送制御装置は、被搬送物を揺動自在に吊り下げて、被搬送物を開始位置から目標位置まで搬送する搬送制御装置であって、コンピュータに実行させるための命令を記憶するメモリ、および

 記憶された命令を実行するよう構成されたプロセッサを備え、プロセッサは、

 少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す情報の入力により、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされた学習済みモデルに対する、長さ並びに開始位置および目標位置を表す情報の入力を受け付け、

 入力された長さ並びに開始位置および目標位置を表す情報に基づいて、学習済みモデルにより被搬送物を開始位置から目標位置まで搬送する際の定常速度および加減速のタイミングを出力する処理を実行する。

 本開示による他の学習装置は、被搬送物を揺動自在に吊り下げて、被搬送物を開始位置から目標位置まで搬送する際の加減速のタイミングを決定するための学習モデルを学習する学習装置であって、コンピュータに実行させるための命令を記憶するメモリ、および

 記憶された命令を実行するよう構成されたプロセッサを備え、プロセッサは、

 少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す情報に対する、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを表す複数の教師データの入力を受け付け、

 複数の教師データに基づいて、少なくとも揺動の支点から被搬送物の重心までの長さ、並びに開始位置および目標位置を表す未知の情報の入力により、被搬送物が目標位置に到達した際の揺れを最小にするための被搬送物の搬送中における定常速度および加減速のタイミングを出力するように学習モデルを学習する処理を実行する。

 本開示によれば、被搬送物の停止時の揺れを簡易に抑制できる。

本開示の実施形態による搬送制御装置を適用した搬送装置の全体構成図 制御部の構成を示す概略ブロック図 加速および減速のタイミングが線対称となる速度パターンを示す図 ニューラルネットワークの構成を示す図 本実施形態において学習時に行われる処理を示すフローチャート 本実施形態において搬送制御時に行われる処理を示すフローチャート ニューラルネットワークの学習に用いる教師データを示す図 学習の評価結果を示す表 教師データにはない長さおよび距離の組み合わせを入力した場合の出力の結果を示す図 学習済みモデルから出力された定常速度および加速時間を用いて、被搬送物を搬送したシミュレーション結果を示す図 開始位置と目標位置との高さが異なる搬送経路を示す図 加速および減速のタイミングが非線対称となる速度パターンを示す図 多段階で加減速を行う速度パターンを示す図 S字状の加減速となる速度パターンを示す図 制御部の他の構成を示す概略ブロック図

 以下、図面を参照して本開示の実施形態について説明する。図1は本開示の実施形態による搬送制御装置を適用した搬送装置の全体構成図である。図1に示すように、本実施形態による搬送装置1は、2本の支柱2A,2B、2本の支柱2A,2Bの上端部のそれぞれに接続された、直線状の案内部材3、案内部材3に沿って移動される駆動部4、駆動部4を移動させるための移動機構5、および駆動部4の駆動を制御する制御部6を備える。なお、駆動部4および制御部6が本実施形態の搬送制御装置を構成する。

 駆動部4を移動させるための移動機構5は、モータ10、およびモータ10により回転されるボールネジ11を備える。モータ10は、駆動部4により搬送される被搬送物7の搬送の開始位置Psよりも搬送方向手前側において案内部材3に取り付けられている。ボールネジ11は案内部材3に沿って延在する。ボールネジ11の一端部はモータ10に接続されており、他端部は軸受12により回転自在に支持されている。軸受12は、被搬送物7の搬送方向において、搬送の目標位置Peを超えた位置において案内部材3に取り付けられている。これにより、モータ10を回転させることによってボールネジ11が回転されると、回転方向に応じた方向に、駆動部4が案内部材3に沿って移動する。なお、駆動部4には被搬送物7を吊り下げるためのフック4aが取り付けられている。

 また、モータ10にはエンコーダ13が接続されている。エンコーダ13は、モータ10の回転に応じた駆動部4の位置を検出し、検出信号を制御部6へ出力する。

 なお、駆動部4を移動させるための移動機構5は上記の構成に限定されるものではなく、駆動部4を案内部材3に沿って移動できれば、任意の構成を採用することができる。

 被搬送物7は、本実施形態においては、例えば特開2011-183115号公報に記載された、内視鏡可撓管である。被搬送物7は保持部材8により保持されて搬送される。保持部材8には、被搬送物7を保持する側とは反対側にフック8aが取り付けられている。保持部材8により保持された被搬送物7は、フック8aを駆動部4のフック4aに引っかけることにより、駆動部4に揺動自在に吊り下げられる。これにより、駆動部4を移動後に停止させると、被搬送物7は慣性の法則により揺動する。

 図2は制御部の構成を示す概略ブロック図である。図2に示すように、制御部6は、CPU(Central Processing Unit)21、モーションコントローラ22、サーボアンプ23、記憶部24、学習済みモデル25および学習部26を備える。また、制御部6にはキーボードおよびマウス等からなる入力部27、並びに液晶モニタ等からなる表示部28が接続されている。なお、本実施形態においては、入力部27は制御部6にデータを入力するための通信インターフェース等の機能も有するものとする。

 モーションコントローラ22には、学習済みモデル25から駆動部4の定常速度および加減速のタイミングが入力される。また、モーションコントローラ22には、サーボアンプ23を介して、駆動部4の位置を表す位置信号が入力される。モーションコントローラ22は、CPU21からの指示、学習済みモデル25の出力および入力された位置信号に応じて、モータ10を駆動するための駆動信号をサーボアンプ23に出力する。学習済みモデル25については後述する。

 サーボアンプ23には、モーションコントローラ22からの駆動信号およびエンコーダ13からの検出信号が入力される。サーボアンプ23は駆動信号をモータ10へ出力し、これによりモータ10が回転して駆動部4を駆動する。この際、学習済みモデル25が出力した加減速のタイミングにより駆動部4の加減速がなされて、駆動部4が学習済みモデル25が出力した定常速度となるように、モータ10の回転が制御される。

 記憶部24は、半導体メモリからなり、制御部6が各種制御を行う際の作業領域となる。

 次いで、学習済みモデル25について説明する。本実施形態においては、制御部6は駆動部4を駆動して、駆動部4を開始位置Psから目標位置Peまで移動することにより、駆動部4に揺動自在に吊り下げられた被搬送物7を開始位置Psから目標位置Peまで搬送する。学習済みモデル25は、図1に示す被搬送物7の揺動の支点P0から被搬送物7の重心G0までの長さL0、並びに開始位置Psおよび目標位置Peを表す情報が入力されると、被搬送物7が目標位置Peに到達した際の揺れを最小にするための、被搬送物7を開始位置Psから目標位置Peまで搬送する際の定常速度および加減速のタイミングを出力するように学習がなされている。なお、本実施形態においては、開始位置Psおよび目標位置Peを表す情報は、図1に示す開始位置Psと目標位置Peとの間の距離D0とする。なお、揺動の支点P0は、被搬送物7を駆動部4に吊り下げた際に、フック4aとフック8aとが接触する点となる。より具体的には、被搬送物7を駆動部4に吊り下げた状態で被搬送物7を揺らすことにより、揺動の支点P0の位置を特定することができる。

 本実施形態においては、駆動部4を駆動するために、図3に示すように線対称の速度パターンを用いるものとする。図3に示す速度パターンにおいては、駆動部4は、区間z1において加速され、区間z2において定常速度V0により定速走行され、区間z3において減速される。図3に示す速度パターンにおいては、区間z1と区間z3とは同じ時間の長さとなる。このため、本実施形態においては、区間z1の時間の長さ、すなわち加速を開始してから加速を停止するまでの加速時間T1と、区間z2における定常速度V0とが定められれば、駆動部4により被搬送物7を開始位置Psから目標位置Peまで移動させることができる。したがって、本実施形態においては、学習済みモデル25が出力する加減速のタイミングとして、加速時間T1を用いるものとする。よって、本実施形態においては、長さL0および距離D0の入力により、定常速度V0および加速時間T1を出力するように学習済みモデル25が構築されることとなる。

 図4は学習済みモデル25を模式的に示す図である。学習済みモデル25は、入力層31、隠れ層32および出力層33の3層の層構造を有するニューラルネットワークからなる。なお、ニューラルネットワークの階層は3層に限定されるものではなく、学習の精度および学習の負荷を考慮して、2層または4層以上等、適宜定めればよい。

 図4に示すように、入力層31は2つのユニットu1-1,u1-2を有し、それぞれに長さL0および距離D0が入力される。また、出力層33は2つのユニットu3-1,u3-2を有し、それぞれから定常速度V0および加速時間T1が出力される。隠れ層32は、例えば10個のユニットu2-1~u2-10を有する。この場合、学習済みモデル25における入力層31、隠れ層32および出力層33の間の結合数は、2×10+2×10=40となる。

 ニューラルネットワークの学習は学習部26が行う。学習に際しては、教師データを用いて、ニューラルネットワークにおける各層の各ユニット間の結合の重みが決定される。本実施形態においては、揺動の支点P0から被搬送物7の重心までの長さL0と開始位置Psおよび目標位置Peの間の距離D0との組み合わせに対して、被搬送物7が目標位置Peに到達した際の揺れを最小にするための被搬送物7の搬送中における定常速度V0および加速時間T1の組み合わせが定められた教師データが複数用意される。なお、ニューラルネットワークが本開示の学習モデルに対応する。

 ここで、被搬送物7が目標位置Peに到達した際の揺れを最小にするためには、例えば特開2011-93633号公報に記載されているように、被搬送物7を開始位置Psから目標位置Peまで移動させる時間の長さを、被搬送物7の揺れの周期のn倍(nは自然数)とすればよい。被搬送物7の揺れの周期C1は、C1=2π√(L0/g)により表される。gは重力加速度である。このため、教師データとしては、n×C1の所要時間により被搬送物7を距離D0を移動させるための、各種被搬送物7についての長さL0および各種距離D0と、長さL0および距離D0に対応する定常速度V0および加速時間T1とを組み合わせたデータが用いられる。なお、各種被搬送物7についての長さL0および各種距離D0に関して、実験的に定常速度V0および加速時間T1を求めることにより教師データを用意してもよい。なお、長さL0および距離D0が多岐に亘る教師データを用意することにより、学習済みモデル25の性能を向上させることができる。

 学習部26は、複数の教師データを用いてニューラルネットワークの各層におけるユニット間の結合重みを更新することにより、ニューラルネットワークを学習して学習済みモデル25を構築する。これにより、未知の長さL0および未知の距離D0が入力されると、被搬送物7の揺れを最小にするための定常速度V0および加速時間T1が、学習済みモデル25から出力されることとなる。

 なお、学習の終了後は、学習済みモデル25の学習結果を評価することが好ましい。学習済みモデル25の評価は、学習済みモデル25に対して、ある教師データに含まれる長さL0および距離D0を入力し、学習済みモデル25が出力した定常速度V0および加速時間T1と、教師データについての定常速度V0および加速時間T1との相関を求めることにより行えばよい。この場合、相関が予め定められたしきい値より大きければ、学習済みモデル25の学習が適切に行われていると評価することができる。逆に相関がしきい値以下の場合は、学習済みモデル25の学習が適切に行われていないと評価することができる。この場合、学習済みモデル25の再学習を行うことにより、学習済みモデル25の精度を高める必要がある。

 一方、学習済みモデル25により、未知の長さL0および未知の距離D0の組み合わせに対する、被搬送物7の揺れを最小にするための定常速度V0および加速時間T1が出力された場合、未知の長さL0および未知の距離D0に対する定常速度V0および加速時間T1を、新たな教師データとして用いて、学習済みモデル25をさらに学習するようにしてもよい。

 また、教師データとして使用した長さL0および距離D0の組み合わせに対して、被搬送物7の揺れをより抑えることができる定常速度V0および加速時間T1が見いだされた場合、その教師データについての学習結果を学習済みモデル25から削除し、教師データとして使用した長さL0および距離D0に対する新たな定常速度V0および加速時間T1を新たな教師データとして用いて、学習済みモデル25を再学習してもよい。

 なお、制御部6を、CPU、半導体メモリおよびハードディスク等を備えたコンピュータから構成してもよい。この場合、ハードディスクに本開示の搬送制御プログラムおよび学習プログラムがインストールされ、搬送制御プログラムにより駆動部4の駆動が制御される。

 次いで、本実施形態において行われる処理について説明する。図5は、本実施形態において学習時に行われる処理を示すフローチャートである。まず、学習部26が入力部27からの教師データの入力を受け付け(ステップST1)、教師データを用いて、学習モデルであるニューラルネットワークの学習を行う(ステップST2)。これにより学習済みモデル25が構築される。

 図6は、本実施形態において搬送制御時に行われる処理を示すフローチャートである。制御部6が、入力部27からの被搬送物7についての長さL0および距離D0の入力を受け付ける(ステップST11)。次いで、学習済みモデル25が、長さL0および距離D0の入力により、定常速度V0および加速時間T1を出力する(ステップST12)。そして、制御部6は、定常速度V0および加速時間T1に基づく速度パターンにより、被搬送物7を搬送し(ステップST13)、処理を終了する。

 このように、本実施形態においては、少なくとも揺動の支点P0から被搬送物7の重心G0までの長さL0並びに開始位置Psおよび目標位置Peの間の距離D0という、開始位置Psおよび目標位置Peを表す情報に基づいて、学習済みモデル25により被搬送物7を開始位置Psから目標位置Peまで搬送する際の定常速度V0および加減速のタイミングである加速時間T1を出力するようにしたものである。このため、学習済みモデル25により出力された定常速度V0および加速時間T1によって駆動部4を駆動して、被搬送物7を開始位置Psから目標位置Peまで搬送すれば、目標位置Peに到達した際の被搬送物7の揺れを最小にすることができる。したがって、本実施形態によれば、センサ等の手段を別途設けることなく、被搬送物の停止時の揺れを簡易に抑制できる。

 また、本実施形態においては、学習済みモデル25を用いているため、特許文献1に記載された手法のようにルールマップを用いる手法と比較して、未知の条件に対して適切な定常速度V0および加減速のタイミングを取得することができる。

 また、本実施形態においては、学習済みモデル25を用いているため、内視鏡可撓管のようなたわみが発生するために単純なモデルでは置き換えられないような被搬送物7であっても、停止時の揺れを最小とするような定常速度および加減速のタイミングを生成することができる。したがって、特許文献2,3に記載された手法のようにモデル系の解析等も不要となり、その結果、被搬送物の停止時の揺れを簡易に抑制できる。

 次いで、本開示の実施例について説明する。本開示の実施例においては、学習済みモデルを構築するために、図4に示す3層構造のニューラルネットワークを学習モデルとして用意した。また、教師データとして、図7に示すように、目標位置Peに到達した被搬送物7の揺れを最小にするための、長さL0および距離D0の各種組み合わせと、定常速度V0および加速時間T1の各種組み合わせとを対応づけた14個の教師データを用意した。なお、速度パターンは図3に示すように加速時間および減速時間が同一の線対称のパターンとした。

 学習済みモデル25を構築するためのニューラルネットワークは、市販のニューラルネットワークフィッティングアプリケーションを用いた。具体的には、MathWorks社製のMatlab Neural Fitting toolを用いてニューラルネットワークを構築した。ニューラルネットワークフィッティングアプリケーションは、上記に限定されず、例えばTensorflowのpython等を用いることもできる。

 学習に使用したアルゴリズムとしては、学習性能の評価のために、レーベンバーグ・マルカート法およびベイズ正規化学習アルゴリズムの2種類使用した。レーベンバーグ・マルカート法は、レーベンバーグ・マルカート法の最適化に従って重みの値を更新するネットワーク学習アルゴリズムであり、計算速度が速いという特徴を有する。詳細には、レーベンバーグ・マルカート法は、性能が二乗誤差の平均または和であるとして、二乗和の関数を極小にするベクトルを見つける最小二乗アルゴリズムである。ベイズ正則化アルゴリズムは、レーベンバーグ・マルカート法の最適化に従って重みの値を更新するネットワーク学習アルゴリズムであるが、性能である誤差に加え、重みの二乗の線形結合を最小化するものとなっている。ベイズ正規化学習アルゴリズムにおいては、評価関数に正則化項を追加しており、学習の終了時に結果として得られるネットワークの汎化品質が良好(過学習の抑制)になるよう、線形結合が変更される。

 図8は、学習の評価結果を示す表である。図8に示すようにレーベンバーグ・マルカート法と比較して、ベイズ正規化学習アルゴリズムの法が評価値が低かった。このため、ニューラルネットワークの学習にはベイズ正規化学習アルゴリズムを用いた。

 学習済みモデル25に対して、教師データにはない長さL0および距離D0の組み合わせを入力した場合の出力の結果を図9に示す。なお、図9において、丸形のプロットは、教師データに含まれる長さL0=1.65m、1.2m、0.9mおよび距離D0=1.1mのそれぞれの場合の定常速度V0および加速時間T1を示す。四角のプロットは、教師データに含まれる長さL0=1.65m、1.2m、0.9mおよび距離D0=0.3mのそれぞれの場合の定常速度V0および加速時間T1を示す。三角のプロットが、教師データには含まれない長さL0=1.65m、1.2m、0.9mおよび距離D0=0.6mのそれぞれの場合の、学習済みモデル25から出力された定常速度V0および加速時間T1を示す。

 図10は学習済みモデル25から出力された定常速度V0および加速時間T1を用いて、被搬送物7を搬送した場合のシミュレーション結果を示す図である。図10に示すシミュレーション結果は、長さL0=1.65m、距離D0=0.6mを入力した場合に学習済みモデル25から出力された定常速度V0=0.26m/sec、加速時間T1=1.6secを用いている。図10においては、実線が搬送シミュレーション結果を、破線が当該シミュレーションにおける被搬送物7の揺動周期を示している。図10に示すように、学習済みモデル25の出力結果に基づく、被搬送物7の搬送の所要時間は、被搬送物7の揺動周期と実質的に一致している。このため、被搬送物7を目標位置Peまで搬送した後の被搬送物7の揺れを抑えることができる。

 なお、上記実施形態においては、学習済みモデル25の出力として、加速時間T1に代えて、加速を停止するまでの時間の長さを用いてもよい。

 また、上記実施形態においては、学習済みモデル25の入力として、長さL0および距離D0を用いているが、これに限定されるものではない。距離D0に代えて、開始位置Psおよび目標位置Peの3次元座標を用いてもよい。この場合、学習済みモデル25には、長さL0と、開始位置Psおよび目標位置Peの3次元座標(合計6個)とが入力されることから、ニューラルネットワークの入力層31は7個のユニットを有するものとなる。なお、開始位置Psを基準とした目標位置Peの3次元座標を学習済みモデル25に入力するようにしてもよい。この場合、学習済みモデル25には、長さL0と、目標位置Peの3次元座標(3個)とが入力されることから、ニューラルネットワークの入力層31は4個のユニットを有するものとなる。

 また、上記実施形態においては、学習済みモデル25への入力として、開始位置Psと目標位置Peとの間の高低差をさらに用いてもよい。この場合、長さL0および距離D0に加えて高低差の入力により、定常速度V0および加減速のタイミングを出力するように学習済みモデル25が構築される。このため、ニューラルネットワークの入力層31は3個のユニットを有するものとなる。これにより、図11に示すように、開始位置Psと目標位置Peとの高さが異なる場合であっても、目標位置Peに到達した被搬送物7の揺れを抑えることが可能な定常速度V0および加速時間T1が学習済みモデル25から出力されることとなる。なお、学習済みモデル25の入力として、開始位置Psおよび目標位置Peの3次元座標、または開始位置Psを基準とした目標位置Peの3次元座標を用いた場合、学習済みモデル25への入力として高低差を含めることができることとなる。

 また、上記実施形態においては、学習済みモデル25への入力として、長さL0および距離D0に加えて、被搬送物7の特性、例えば、被搬送物の重さ、長さ、投影面積および剛性等をさらに用いるようにしてもよい。投影面積とは、被搬送物7をその移動方向に投影した場合の面積であり、被搬送物7が円筒形の場合、投影面積は被搬送物7の外径と長さとの積により求めることができる。また、剛性としては被搬送物7のヤング率を用いればよい。この場合、ニューラルネットワークの入力層31は、入力に応じた数のユニットを有するものとなる。これにより、被搬送物7の特性も考慮した定常速度V0および加減速のタイミングにより、被搬送物7を搬送することができ、その結果、被搬送物7の特性に応じて、目標位置Peに到達した際の被搬送物7の揺れを最小にすることができる。

 また、上記実施形態においては、被搬送物7の速度パターンとして、図3に示すように線対称となる速度パターンを用いているが、これに限定されるものではない。例えば、図12に示すように、加速時間T1と減速時間T2とが異なる速度パターンに対しても本開示を適用できる。この場合、学習済みモデル25は、長さL0および距離D0が入力されると、定常速度V0、加速時間T1および減速時間T2を出力するように学習がなされる。この場合、ニューラルネットワークの出力層33は3個のユニットを有するものとなる。なお、この場合、減速時間T2に代えて、移動開始からの加速終了時間t11、減速開始時間t12および減速終了時間t13を出力するように学習済みモデル25を構築してもよい。

 また、図13に示すように、多段階で加減速を行う速度パターンを用いてもよい。この場合、移動開始から加減速のタイミングである時間t1,t2,t3,t4,t5,t6,t7,t8,t9を出力するように学習済みモデル25が学習される。なお、t1が第1の加速終了時間、t2が第2の加速開始時間、t3が第2の加速終了時間、t4,t6,t8が減速開始時間、t5,t7,t9が減速終了時間となる。この場合、ニューラルネットワークの出力層33は、定常速度V0を含め10個のユニットを有するものとなる。

 また、上記実施形態においては、加減速が等加速度で行われる速度パターンを用いているが、これに限定されるものではない。例えば、図14に示すように、移動開始時および停止時における加速度を小さくするような、S字状の加減速度となるような速度パターンを用いてもよい。この場合、S字状の加減速度となる速度パターンにおける加速時間T1および減速時間T2が出力されるように、学習済みモデル25を学習すればよい。なお、加減速度のパターンとして等加速度およびS字状の加速度のいずれかを出力するようにニューラルネットワークを学習してもよい。

 また、上記実施形態においては、駆動部4にフック4aを取り付け、フック4aに保持部材8のフック8aを引っかけて、駆動部4に被搬送物7を吊り下げているが、これに限定されるものではない。例えば、被搬送物7をその移動方向において回動自在に吊り下げることが可能な任意の機構を用いることができる。この場合、使用する機構に応じて学習済みモデル25を構築しておくことにより、使用する機構に応じて、被搬送物が目標位置に到達した際の揺れを最小にするための定常速度V0および加減速のタイミングを取得することができる。なお、回動自在に吊り下げ可能な機構を用いた場合、揺動の支点は、当該機構の回動中心となる。

 また、上記実施形態においては、制御部6が学習済みモデル25および学習部26を備えるものとしているが、これに限定されるものではない。図15に示すように、学習済みモデル25および学習部26を備えた設定部40を制御部6とは別個に設けるようにしてもよい。この場合、設定部40の入力部41から長さL0および距離D0が入力されることにより、学習済みモデル25が出力した定常速度V0および加速時間T1が、制御部6に入力され、駆動部4の駆動の制御が行われることとなる。

 また、上記実施形態においては、学習済みモデル25および学習部26を、制御部6または設定部40に設けているが、これに限定されるものではない。学習部26を学習済みモデル25とは別個に設けるようにしてもよい。

 また、上記実施形態においては、直線状の案内部材3に沿って被搬送物7を搬送しているが、被搬送物7の搬送経路は直線状に限定されるものではなく、曲線状であってもよく、直線と曲線とを含む経路であってもよい。この場合、経路に応じた長さL0および距離D0の各種組み合わせと定常速度V0および加減速のタイミングの各種組み合わせとを対応づけた教師データを用いて、ニューラルネットワークの学習が行われ、学習済みモデル25が構築されることとなる。

   1  搬送装置

   2A,2B  支柱

   3  案内部材

   4  駆動部

   4a  フック

   5  移動機構

   6  制御部

   7  被搬送物

   8  保持部材

   8a  フック

   10  モータ

   11  ボールネジ

   12  軸受

   13  エンコーダ

   21  CPU

   22  モーションコントローラ

   23  サーボアンプ

   24  記憶部

   25  学習済みモデル

   26  学習部

   27  入力部

   28  表示部

   30  ニューラルネットワーク

   31  入力層

   32  隠れ層

   33  出力層

   40  設定部

   41  入力部

   D0  距離

   G0  被搬送物の重心

   L0  長さ

   P0  揺動の支点

   Ps  開始位置

   Pe  目標位置

   T1  加速時間

   T2  減速時間

   t1~t9  時定数

   t11,t12,t13  時間

   u1-1、u1-2…、u3-1、u3-2  ユニット

   z1~z3  区間

   V0  定常速度

Claims (16)


  1.  被搬送物を揺動自在に吊り下げて、前記被搬送物を開始位置から目標位置まで搬送する搬送制御装置であって、

     少なくとも、揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す情報の入力により、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされた学習済みモデルと、

     前記長さ並びに前記開始位置および前記目標位置を表す情報の入力を受け付ける入力部とを備え、

     入力された前記長さ並びに前記開始位置および前記目標位置を表す情報に基づいて、前記学習済みモデルにより前記被搬送物を前記開始位置から前記目標位置まで搬送する際の定常速度および加減速のタイミングを出力する搬送制御装置。

  2.  前記開始位置および前記目標位置を表す情報は、前記開始位置および前記目標位置の3次元座標を含む請求項1に記載の搬送制御装置。

  3.  前記開始位置および前記目標位置を表す情報は、前記開始位置と前記目標位置との間の距離を含む請求項1に記載の搬送制御装置。

  4.  前記開始位置および前記目標位置を表す情報は、前記開始位置と前記目標位置との間の距離および前記開始位置と前記目標位置との間の高低差を含む請求項1に記載の搬送制御装置。

  5.  前記加減速のタイミングは、加速時間または加速終了時間を含む請求項1から4のいずれか1項に記載の搬送制御装置。

  6.  前記加減速のタイミングは、加速終了時間、減速開始時間および減速終了時間を含む請求項1から4のいずれか1項に記載の搬送制御装置。

  7.  前記加減速のタイミングは、第1の加速終了時間、少なくとも1つの第2の加速開始時間、該少なくとも1つの第2の加速終了時間、少なくとも1つの減速開始時間および少なくとも1つの減速終了時間を含む請求項1から4のいずれか1項に記載の搬送制御装置。

  8.  前記開始位置および前記目標位置を含む経路に沿って駆動される駆動部と、

     前記学習済みモデルから出力された前記定常速度および前記加減速のタイミングにより、前記駆動部を制御する制御部とをさらに備えた請求項1から7のいずれか1項に記載の搬送制御装置。

  9.  前記駆動部は、前記被搬送物を吊り下げるフックを備えた請求項8に記載の搬送制御装置。

  10.  前記駆動部は、被搬送物を前記被搬送物の移動方向において回動自在に吊り下げる吊り下げ機構を備えた請求項8に記載の搬送制御装置。

  11.  被搬送物を揺動自在に吊り下げて、前記被搬送物を開始位置から目標位置まで搬送する際の加減速のタイミングを決定するための学習モデルを学習する学習装置であって、

     少なくとも、揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す情報に対する、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを表す複数の教師データの入力を受け付ける入力部と、

     前記複数の教師データに基づいて、少なくとも前記揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す未知の情報の入力により、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを出力するように前記学習モデルを学習する学習部とを備えた学習装置。



  12.  被搬送物を揺動自在に吊り下げて、前記被搬送物を開始位置から目標位置まで搬送する際の加減速のタイミングを決定するための学習済みモデルであって、

     少なくとも、揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す情報の入力により、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされた学習済みモデル。

  13.  被搬送物を揺動自在に吊り下げて、前記被搬送物を開始位置から目標位置まで搬送する搬送制御方法であって、

     少なくとも、揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す情報の入力により、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされた学習済みモデルに対する、前記長さ並びに前記開始位置および前記目標位置を表す情報の入力を受け付け、

     入力された前記長さ並びに前記開始位置および前記目標位置を表す情報に基づいて、前記学習済みモデルにより前記被搬送物を前記開始位置から前記目標位置まで搬送する際の定常速度および加減速のタイミングを出力する搬送制御方法。

  14.  被搬送物を揺動自在に吊り下げて、前記被搬送物を開始位置から目標位置まで搬送する際の加減速のタイミングを決定するための学習モデルを学習する学習方法であって、

     少なくとも、揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す情報に対する、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを表す複数の教師データの入力を受け付け、

     前記複数の教師データに基づいて、少なくとも前記揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す未知の情報の入力により、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを出力するように前記学習モデルを学習する学習方法。

  15.  被搬送物を揺動自在に吊り下げて、前記被搬送物を開始位置から目標位置まで搬送する搬送制御方法をコンピュータに実行させる搬送制御プログラムであって、

     少なくとも、揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す情報の入力により、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを出力する学習がなされた学習済みモデルに対する、前記長さ並びに前記開始位置および前記目標位置を表す情報の入力を受け付ける手順と、

     入力された前記長さ並びに前記開始位置および前記目標位置を表す情報に基づいて、前記学習済みモデルにより前記被搬送物を前記開始位置から前記目標位置まで搬送する際の定常速度および加減速のタイミングを出力する手順とをコンピュータに実行させる搬送制御プログラム。

  16.  被搬送物を揺動自在に吊り下げて、前記被搬送物を開始位置から目標位置まで搬送する際の加減速のタイミングを決定するための学習モデルを学習する学習方法をコンピュータに実行させる学習プログラムであって、

     少なくとも、揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す情報に対する、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを表す複数の教師データの入力を受け付ける手順と、

     前記複数の教師データに基づいて、少なくとも前記揺動の支点から前記被搬送物の重心までの長さ、並びに前記開始位置および前記目標位置を表す未知の情報の入力により、前記被搬送物が前記目標位置に到達した際の揺れを最小にするための前記被搬送物の搬送中における定常速度および加減速のタイミングを出力するように前記学習モデルを学習する手順とをコンピュータに実行させる学習プログラム。
PCT/JP2019/047600 2019-01-29 2019-12-05 搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデル WO2020158184A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020569417A JP7270654B2 (ja) 2019-01-29 2019-12-05 搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデル

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2019013606 2019-01-29
JP2019-013606 2019-01-29

Publications (1)

Publication Number Publication Date
WO2020158184A1 true WO2020158184A1 (ja) 2020-08-06

Family

ID=71841364

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2019/047600 WO2020158184A1 (ja) 2019-01-29 2019-12-05 搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデル

Country Status (2)

Country Link
JP (1) JP7270654B2 (ja)
WO (1) WO2020158184A1 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0356394A (ja) * 1989-07-21 1991-03-11 Hitachi Kiden Kogyo Ltd 天井クレーンにおける振れ止め制御方法
JPH0597386A (ja) * 1991-10-11 1993-04-20 Mitsubishi Heavy Ind Ltd クレーン制御装置
JPH05319780A (ja) * 1992-05-22 1993-12-03 Kawaden Co Ltd クレーンの振れ止め制御装置
JPH06183686A (ja) * 1992-12-15 1994-07-05 Hitachi Kiden Kogyo Ltd 天井クレーンにおける振れ止め制御方法
JPH07144881A (ja) * 1993-11-19 1995-06-06 Kajima Corp クレーンの荷振れ止め運転方法及び装置
JP2000153989A (ja) * 1998-11-20 2000-06-06 Mitsubishi Heavy Ind Ltd 吊荷の振れ止め制御装置
JP2009067507A (ja) * 2007-09-11 2009-04-02 Fuji Electric Systems Co Ltd クレーン振れ止め制御装置およびクレーンの振れ止め制御方法
JP2014026300A (ja) * 2012-07-24 2014-02-06 Hitachi High-Technologies Corp ステージ装置及び試料搬送装置並びに位置決め制御方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0356394A (ja) * 1989-07-21 1991-03-11 Hitachi Kiden Kogyo Ltd 天井クレーンにおける振れ止め制御方法
JPH0597386A (ja) * 1991-10-11 1993-04-20 Mitsubishi Heavy Ind Ltd クレーン制御装置
JPH05319780A (ja) * 1992-05-22 1993-12-03 Kawaden Co Ltd クレーンの振れ止め制御装置
JPH06183686A (ja) * 1992-12-15 1994-07-05 Hitachi Kiden Kogyo Ltd 天井クレーンにおける振れ止め制御方法
JPH07144881A (ja) * 1993-11-19 1995-06-06 Kajima Corp クレーンの荷振れ止め運転方法及び装置
JP2000153989A (ja) * 1998-11-20 2000-06-06 Mitsubishi Heavy Ind Ltd 吊荷の振れ止め制御装置
JP2009067507A (ja) * 2007-09-11 2009-04-02 Fuji Electric Systems Co Ltd クレーン振れ止め制御装置およびクレーンの振れ止め制御方法
JP2014026300A (ja) * 2012-07-24 2014-02-06 Hitachi High-Technologies Corp ステージ装置及び試料搬送装置並びに位置決め制御方法

Also Published As

Publication number Publication date
JP7270654B2 (ja) 2023-05-10
JPWO2020158184A1 (ja) 2021-09-30

Similar Documents

Publication Publication Date Title
JP6240689B2 (ja) 人の行動パターンを学習する機械学習装置、ロボット制御装置、ロボットシステム、および機械学習方法
US11231715B2 (en) Method and system for controlling a vehicle
JP7116901B2 (ja) ロボット制御装置、ロボット制御方法及びロボット制御プログラム
US11565416B2 (en) Transporting robot and method for controlling the same
JP6824217B2 (ja) 搬送制御装置、方法およびプログラム
CN110914024A (zh) 路径输出方法、路径输出系统和路径输出程序
Ji et al. Synthesizing the optimal gait of a quadruped robot with soft actuators using deep reinforcement learning
CN108638070A (zh) 基于动态平衡的机器人负载重力参数辨识方法
US11478927B1 (en) Hybrid computing architectures with specialized processors to encode/decode latent representations for controlling dynamic mechanical systems
CN114488801A (zh) 一种基于数据驱动的桥式起重机模型预测控制方法
WO2020158184A1 (ja) 搬送制御装置、搬送制御方法、搬送制御プログラム、学習装置、学習方法、学習プログラム、及び学習済みモデル
CN114943182A (zh) 基于图神经网络的机器人线缆形状控制方法及设备
CN109062039A (zh) 一种三自由度Delta并联机器人的自适应鲁棒控制方法
JP2021525689A (ja) 長固定子リニアモーターの形の運搬装置の運搬ユニットを制御する方法
WO2021171500A1 (ja) ロボット制御装置、ロボット制御方法及び学習モデル生成装置
Sichkar et al. Moving elements of mobile robots stabilization modelling
CN117466145A (zh) 基于深度强化学习的桥门式起重机防摇控制方法及装置
Grimshaw et al. Applying deep reinforcement learning to cable driven parallel robots for balancing unstable loads: a ball case study
CN117270398A (zh) 基于神经网络和强化学习的机器人步态规划算法
CN116736748A (zh) 构建机器人的控制器的方法和机器人
JP6641804B2 (ja) 搬送車の移動経路設定方法
Osburg et al. Using deep neural networks to improve contact wrench estimation of serial robotic manipulators in static tasks
Suh et al. Anti-sway control of an ATC using NN predictive PID control
JP2008202719A (ja) 時変形システムに対する振動抑制制御入力決定方法、搬送システム、および時変形システムに対する振動抑制制御入力演算プログラム
Tho et al. Analysis and evaluation of CDPR cable sagging based on ANFIS

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19913454

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020569417

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19913454

Country of ref document: EP

Kind code of ref document: A1