CN111344120B

CN111344120B - 机器人的动作调整装置、动作控制系统及机器人系统

Info

Publication number: CN111344120B
Application number: CN201880072607.7A
Authority: CN
Inventors: 白土浩司; 南本高志
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2017-11-14
Filing date: 2018-11-01
Publication date: 2023-04-07
Anticipated expiration: 2038-11-01
Also published as: JPWO2019098044A1; WO2019098044A1; JP6696627B2; DE112018005832B4; DE112018005832T5; CN111344120A

Abstract

对机器人的动作进行调整以使得不会对作业对象作用过大的负载，并且使调整变得容易。机器人控制装置(111)将动作指令值发送至机器人(120)，使装载有末端执行器(130)的机器人(120)试执行针对作业对象(200)的作业。外界传感器(142)对由于试执行而作用于末端执行器(130)的力进行检测。动作调整装置(112)进行使用了外界传感器(142)的检测结果的学习，对从机器人控制装置(111)所取得的动作指令值进行调整、更新。

Description

机器人的动作调整装置、动作控制系统及机器人系统

技术领域

本发明涉及工业用机器人、面向非制造业的服务机器人等。特别地，本发明涉及对用于使装载于机器人的末端执行器到达至成为目标的位置姿态的机器人的动作进行调整的动作调整装置及动作控制系统、和具有该动作调整装置及动作控制系统的机器人系统。

背景技术

在现有的工业用机器人系统中，机器人和作业对象的关系被精密地定位，在定位后的环境下机器人以高速、高精度重复作业这样的系统结构多。与此相对，近年来，有效使用力觉传感器或者视觉传感器等多个外界传感器的机器人系统正在增加。如上所述的机器人系统在机器人和作业对象没有精密地定位的环境下使用，与外界传感器的检测结果相应地对机器人动作进行控制。

例如，如上所述的机器人系统在成为作业对象的物体的位置姿态或者周边环境未知的状况下使用。另外，作为其他例子，如上所述的机器人系统在成为作业对象的物体的位置姿态或者周边环境变化的状况下使用。作为具体的事例，举出抓取零件作业、伴随表面仿形动作的插入作业、连接器等的部件的嵌合作业等。另外，在面向非制造业的服务机器人的领域中，以各种变化的环境下的作业为前提，同样地使用多个传感器而控制机器人的动作。

在有效使用这些传感器的机器人的控制系统中，为了对机器人的动作进行调整，需要进行多个控制参数的调整。通过适当地调整控制参数，从而机器人的动作变得适当，确保机器人系统的性能。但是，控制参数的调整不容易，大多要求专门性的知识。因此，为了使控制参数的调整变得容易，提出了几种自动调整方法。例如，在专利文献1中公开了一种通过学习而使机器人的动作高速化的机器人系统。

专利文献1：日本特开2017－94438号公报

发明内容

在现有的机器人系统中，在学习中，没有考虑由于机器人的动作而多用于作业对象的负载的大小。因此，在通过学习得到的机器人的动作中，作用于作业对象的负载没有成为适当的大小，有时对作业对象作用过大的负载。本发明的目的在于，得到能够对机器人的动作进行调整以使得不会对作业对象作用过大的负载，能够使机器人的动作的调整变得容易的动作调整装置、动作控制系统及机器人系统。

本发明的机器人动作调整装置，具有装载有末端执行器的机器人和对机器人的动作进行控制的机器人控制装置，该机器人的动作调整装置被使用在由机器人针对作业对象进行作业的机器人系统中，该动作调整装置具有指令值学习部，该指令值学习部进行将通过机器人系统所具有的外界传感器检测出的作用于末端执行器的力作为输入的学习，对为了对机器人的动作进行控制而从机器人控制装置发送至机器人的动作指令值进行调整。

另外，本发明的动作控制系统被使用在由装载有末端执行器的机器人针对作业对象进行作业的机器人系统中，具有：机器人控制装置，其对机器人发送动作指令值而对机器人的动作进行控制；以及指令值学习部，其进行将通过传感器检测出的作用于末端执行器的力作为输入的学习，对动作指令值进行调整。

另外，本发明的机器人系统具有：机器人，其装载有末端执行器；机器人控制装置，其对机器人发送动作指令值而对机器人的动作进行控制；以及指令值学习部，其进行将通过传感器检测出的作用于末端执行器的力作为输入的学习，对动作指令值进行调整，机器人针对作业对象进行作业。

发明的效果

根据本发明的动作调整装置、动作控制系统及机器人系统，能够对机器人的动作进行调整以使得不会对作业对象作用过大的负载，能够使机器人的动作的调整变得容易。

附图说明

图1是表示具有本发明的实施方式1所涉及的动作调整装置的机器人系统的系统结构的一个例子的框图。

图2是表示用于实现本发明的实施方式1所涉及的机器人控制装置及动作调整装置的具体的硬件结构的一个例子的图。

图3是表示本发明的实施方式1所涉及的动作调整装置的结构例及周边的模块的框图。

图4是用于对本发明的实施方式1所涉及的动作调整装置的动作进行说明的图。

图5是表示本发明的实施方式1所涉及的机器人系统中的更新前的速度模式的一个例子的图。

图6是表示本发明的实施方式1所涉及的动作控制系统的处理的流程的一个例子的流程图。

图7是用于对本发明的实施方式2所涉及的动作调整装置的动作进行说明的图。

图8是表示本发明的实施方式2所涉及的机器人系统中的速度模式的初始值的一个例子的图。

图9是表示本发明的实施方式2所涉及的机器人系统中的力觉传感器的检测值的一个例子的图。

图10是表示本发明的实施方式2所涉及的机器人系统中的更新后的速度模式的一个例子的图。

图11是表示本发明的实施方式2所涉及的机器人系统中的更新后的速度模式的其他例的图。

图12是表示本发明的实施方式3所涉及的动作调整装置的结构例及周边的模块的框图。

图13是表示本发明的实施方式3所涉及的指令值学习部的结构例及周边的模块的框图。

图14是表示本发明的实施方式3所涉及的机器人系统所实施的作业的一个例子的图。

图15是表示本发明的实施方式3所涉及的学习处理部的处理的流程的一个例子的流程图。

图16是表示通过本发明的实施方式3所涉及的学习处理部进行的前处理的流程的一个例子的流程图。

图17是表示通过本发明的实施方式3所涉及的学习处理部进行的学习处理的流程的一个例子的流程图。

图18是表示本发明的实施方式3所涉及的机器人系统中的试执行时的速度模式的一个例子的图。

图19是表示在本发明的实施方式3所涉及的机器人系统中的试执行时取得的力信息的一个例子的图。

图20是表示本发明的实施方式4所涉及的动作调整装置的结构例及周边的模块的框图。

图21是表示通过本发明的实施方式4所涉及的动作调整装置进行的前处理的流程的一个例子的流程图。

图22是表示通过本发明的实施方式4所涉及的动作调整装置进行的学习处理的流程的一个例子的流程图。

图23是表示本发明的实施方式5所涉及的动作调整装置的结构例及周边的模块的框图。

图24是表示本发明的实施方式5所涉及的动作学习部的结构例的框图。

图25是表示本发明的实施方式5所涉及的动作调整装置的其他结构例及周边的模块的框图。

具体实施方式

实施方式1.

图1是表示具有本发明的实施方式1所涉及的动作调整装置的机器人系统100的系统结构的一个例子的框图。如图1所示的那样，机器人系统100具有动作控制系统110、机器人120、末端执行器130、内界传感器141及外界传感器142。另外，动作控制系统110具有机器人控制装置111及动作调整装置112。机器人控制装置也被称为机器人控制器。

机器人控制装置111基于内界传感器141及外界传感器142的检测结果，将用于对机器人120的动作进行控制的动作指令值发送至机器人120，对机器人120的动作进行控制。在机器人120中装载机器人手等末端执行器130。末端执行器130直接作用于作业对象200。就末端执行器130而言，与由机器人系统100进行的各作业相应地选择适当种类的末端执行器。在作业对象200的周边存在周边环境300。

周边环境300例如是成为对作业对象200进行组装的目标的部件、对作业对象200进行定位的夹具、对作业对象200实施加工的工具(电动螺丝刀等)、供给作业对象200的部件供给器、包围机器人120的安全罩、输送作业对象200的带式输送机等。另外，有时对作业对象进行拍摄的照相机等外界传感器142也作为周边环境的一部分进行处理。其原因在于，在外界传感器142固定于机器人120的周边的规定的位置等情况下，机器人120或者末端执行器130有可能与外界传感器142接触。

从机器人控制装置111输出的动作指令值，例如是表示装载于机器人120的末端执行器130的各时刻下的目标位置及目标姿态的信息即位置指令值。在动作指令值表示各时刻下的末端执行器130的目标位置的情况下，还通过动作指令值表示各时刻间的末端执行器的130的移动速度。因此，位置指令值也能够认为是表示机器人的目标动作速度的速度指令值。

另外，从机器人控制装置111输出的动作指令值也可以是表示机器人120的目标动作速度、或者末端执行器130的目标移动速度的速度指令值。目标动作速度或者目标移动速度是根据机器人120的动作的各时刻之间的速度、或者路径的各地点之间的速度而得出的。并且，动作指令值也可以是表示机器人120的动作的目标加速度、或者末端执行器130的移动的目标加速度的加速度指令值。动作指令值如果直接地控制机器人120的动作，则可考虑各种方式。

动作调整装置112与外界传感器142的检测结果和从外部赋予的限制条件相应地，对由机器人控制装置111生成的动作指令值进行调整、更新。即，动作调整装置112对机器人的动作进行调整。换言之，动作调整装置112对内界传感器141及外界传感器142的检测结果和从机器人控制装置111输出的动作指令值的对应关系进行调整，反映调整结果而更新对应关系。此外，动作指令值的调整也能够换句话说，是动作指令值的修正、或者动作指令值的校正。

在存在更新后的动作指令值的情况下，机器人控制装置111将更新后的动作指令值向机器人120输出。动作调整装置112不仅参照外界传感器142的检测结果，还参照内界传感器141的检测结果而更新动作指令值。此外，限制条件可以预先存储于动作调整装置112或者机器人控制装置111的内部。

本实施方式的机器人系统100进行下述2个处理：对动作指令值进行调整而更新的调整处理、和使用更新后的动作指令值进行针对作业对象200的作业的作业处理。换言之，在机器人系统100的动作中存在调整阶段和作业阶段，调整处理是调整阶段中的机器人系统100的处理。另外，作业处理是作业阶段中的机器人系统100的处理。动作调整装置112在调整处理中，对动作指令值进行调整以使得成为最佳的动作指令值。但是，调整处理和作业处理无需完全地分离。例如，机器人系统100也可以构成为在正在进行针对作业对象200的作业的期间，动作调整装置112也随时计算最佳的动作指令值。在该结构中，机器人系统100在计算出比当前正在使用的动作指令值更适当的动作指令值等情况下，根据需要在规定的定时对动作指令值进行更新。这一点在此后的实施方式中也是同样的。

图2是表示用于实现机器人控制装置111及动作调整装置112的具体的硬件结构的一个例子的图。机器人控制装置111及动作调整装置112是通过由处理器401执行在存储器402中存储的程序而实现的。处理器401和存储器402通过数据总线403连接。在存储器402中具有易失性的存储器及非易失性的存储器，临时性的信息存储于易失性的存储器。此外，机器人控制装置111及动作调整装置112可以一体地构成，也可以分体地构成。例如，机器人控制装置111和动作调整装置112可以经由网络等而连接。在此后的实施方式中，机器人控制装置111及动作调整装置112也能够通过相同的硬件结构而实现。

机器人系统100构成了控制系统，即，基于通过内界传感器141及外界传感器142取得的数据而由动作控制系统110输出动作指令值，机器人120追随动作指令值而进行动作。作为内界传感器141，存在取得机器人的关节的位置的传感器、取得关节的动作速度的传感器、取得用于使关节进行动作的电动机的电流值的传感器等。机器人系统100通过机器人控制装置111、机器人120及内界传感器141而构成进行末端执行器130的定位的位置控制系统。作为取得机器人的关节的位置的传感器，例如考虑对电动机的旋转量进行检测的编码器、解析器、电位计等。另外，作为取得关节的动作速度的传感器而考虑转速计等。作为内界传感器，除此以外，有时作为机器人120自身的信息而使用陀螺仪传感器、惯性传感器等。

通过基于内界传感器141的反馈控制，机器人系统100构成进行物料搬运作业等的位置控制机器人系统。在这里，物料搬运作业是指资材、部件等的移送、输送的作业。将该位置控制机器人系统称为基于内界传感器141的反馈控制系统。在基于内界传感器141的反馈控制中，作为控制参数而存在位置控制的增益、速度控制的增益、电流控制的增益、在反馈控制中使用的滤波器的设计参数等。作为在反馈控制中使用的滤波器，考虑移动平均滤波器、低通滤波器、带通滤波器、高通滤波器等。此外，基于内界传感器141的反馈控制，成为机器人120按照动作指令值用于进行动作的控制。换言之，基于内界传感器141的反馈控制成为为了实现动作指令值而进行的控制。

另一方面，作为外界传感器142，存在力觉传感器、照相机等视觉传感器、触觉传感器、触摸传感器等。外界传感器142对机器人120和作业对象200或者周边环境300的接触状态、位置关系进行测量。机器人系统100通过机器人控制装置111、动作调整装置112、机器人120及外界传感器142而构成了基于外界传感器142的传感器反馈控制系统。另外，机器人系统100有时不基于从外界传感器142输出的传感器信号实施传感器反馈控制，而是将来自外界传感器142的传感器信号仅用作触发信号。在该情况下，机器人系统100以触发信号为起点，对内界传感器141所涉及的反馈控制的控制参数进行切换。基于外界传感器142的传感器反馈控制系统，构建为位置控制机器人系统的外侧环路。

基于外界传感器142的传感器反馈控制系统，通过加速度、速度、位置姿态、距离、力、力矩等，对机器人120、机器人臂或者末端执行器130和作业对象200或者周边环境300的位置关系、接触举动等进行感测。并且，基于外界传感器142的传感器反馈控制系统，基于感测结果而对机器人120的动作进行控制，以使得获得期望的位置关系或者力响应。换言之，基于外界传感器142的传感器反馈控制系统，对动作指令值进行修正以使得获得期望的位置关系或者力响应。在基于外界传感器142的传感器反馈控制系统中，作为控制参数，存在与力觉控制相关的力控制增益、阻抗参数、与视觉伺服控制相关的增益、视觉阻抗参数、在反馈控制中使用的滤波器的设定参数等。

在基于内界传感器141及外界传感器142进行控制的情况下，有时将需要进行调整的控制参数在以后简称为参数。在这里，作为用作内界传感器141或者外界传感器142的传感器，具体地说，考虑电流值传感器、关节位置传感器、关节速度传感器、温度距离传感器、照相机、RGB－D传感器、接近觉传感器、触觉传感器、力传感器等。另外，内界传感器141或者外界传感器142的测量对象，考虑机器人120的位置姿态、末端执行器130的位置姿态、成为作业对象200的工件的位置姿态、作业者的位置姿态等。

图3是表示本发明的实施方式1所涉及的动作调整装置112的结构例及周边的模块的框图。图3将机器人系统100的结构的一部分提取而示出。动作调整装置112具有指令值学习部113。此外，在图3中，传感器140将内界传感器141及外界传感器142汇总为1个。如上所述，作为传感器140而考虑多种传感器。但是，本实施方式的机器人系统100在传感器140中至少具有对由于机器人120的动作而作用于末端执行器130的外力进行检测的力觉传感器。该力觉传感器成为外界传感器142。此外，作为传感器140而至少包含力觉传感器，在此后的实施方式中也是同样的。

力觉传感器用于对作用于末端执行器130的外力进行测量、实施力控制或者阻抗控制。此外，将对由末端执行器130向作业对象200或者周边环境300赋予的力进行控制称为力控制。另外，将按照力觉传感器的检测结果而对机器人120的动作进行控制称为力觉控制。在力控制中，设定目标作业力，对向作业对象200或者周边环境300赋予的力的大小进行控制。

另一方面，在阻抗控制中，对与在末端执行器130和作业对象200接触等情况下产生的接触力相关的阻抗特性(弹簧、减振器、惯性)进行定义，用于控制。作为产生接触力的情况，还考虑在末端执行器130和周边环境300接触的情况、由末端执行器130抓持的作业对象200和周边环境300接触的情况等。另外，阻抗特性通过阻抗参数表示。

在力控制中，需要决定力控制的目标值。另外，在阻抗控制中，需要使用阻抗参数而决定控制特性。并且，在力控制及阻抗控制中，也都需要决定对控制的响应性做出贡献的增益等，调整项目多。在现有的机器人系统中，以稳定地进行作业为目的的参数调整多。在该情况下，对包含机器人120的动作的响应性、机械刚性等在内的系统特性进行辨识，找出1个与条件或者状态无关而稳定地响应的参数集。但是，在伴有与作业对象200的接触的机器人120的动作中，由于动作的进行，作业对象200和末端执行器130之间的接触状态变化。因此，参数集的调整需要考虑接触状态的变化而进行。该调整是以试错的方式进行的，因而是不容易的。

在本实施方式的机器人系统100中，动作调整装置112对动作指令值进行更新，由此进行控制以使得机器人120的动作变得适当。向动作调整装置112输入限制条件。在限制条件中包含通过力觉传感器进行检测的力信息的上限值或者下限值。此后，设为从动作控制系统110输出的动作指令值为速度指令值而进行说明。速度指令值是与末端执行器130的移动路径上的各地点对应的末端执行器130的目标移动速度。此时，时间序列的速度指令值成为与各地点对应的速度模式。速度指令值也可以是与作业中的各时刻对应的机器人120的目标动作速度。

在速度模式中，对目标速度Vi(i＝1、2、3、···)和目标速度的切换位置Pi(i＝1、2、3、···)进行定义。此外，切换位置可以通过切换时间、用于切换的参数进行设定。作为用于切换的参数，例示出以位置、时间为基准的动作指令值的进展率。另外，目标速度的切换位置Pi可以是目标速度的切换的开始点，也可以是目标速度的切换的完成点。另外，目标速度的切换位置Pi也可以是通过内界传感器141进行检测的动作速度从目标速度收敛于规定的误差范围内的情况得到保障的点。

图4是用于对本发明的实施方式1所涉及的动作调整装置112的动作进行说明的图。如图4所示，考虑搭载于机器人120的末端执行器130从位置P0移动至位置P3的情况。在机器人120中作为外界传感器142而安装有力觉传感器143。力觉传感器143对作用于末端执行器130的外力进行测量。

图5是表示本发明的实施方式1所涉及的机器人系统100中的更新前的速度模式的一个例子的图。在图5中横轴为末端执行器130的位置P，纵轴为末端执行器130的目标移动速度V。在图5的速度模式中，在末端执行器130从P0向P3移动的期间，目标速度发生变化。动作调整装置112基于力觉传感器143的检测结果对速度模式进行更新。

图6是表示本发明的实施方式1所涉及的动作控制系统110的处理的流程的一个例子的流程图。在这里，作为限制条件，设为包含有通过力觉传感器143进行检测的力信息的上限值及下限值和作业时间的上限值。首先，在步骤S10中，机器人控制装置111决定速度模式的初始值。接下来，在步骤S11中，机器人控制装置111对机器人120的动作进行控制而试执行作业。此外，如前所述在调整处理和作业处理没有完全地分离等情况下，有时机器人系统100中的通常作业的一部分试执行而处理。

接下来，在步骤S12中，动作调整装置112对限制条件是否被满足进行判定。即，在步骤S12中，如果力觉传感器143的检测值进入至由限制条件规定的上限值及下限值之间，则动作调整装置112对作业时间的限制是否被满足进行判定。在对力觉传感器143的检测值进行判定时，例如，将检测值的最大值与限制条件的上限值相比较，将检测值的最小值与限制条件的下限值相比较。此外，在步骤S12中，动作调整装置112也可以不使用力觉传感器143的检测值本身，而是使用根据检测值而通过运算求出的评价值。作为该评价值的一个例子，考虑将力觉传感器143的检测值和生产节拍时间作为输入的通过评价函数进行运算的评价值。在步骤S12中，动作调整装置112可以对该评价值是否处于限制范围内进行判定。

在步骤S12中，在判定为限制条件被满足的情况下，动作控制系统110的处理暂时结束，此后进行更新后的速度模式下的作业。另一方面，在步骤S12中，在判定为限制条件没有被满足的情况下，动作控制系统110的处理向步骤S13跳转。在步骤S13中，动作调整装置112对速度模式进行调整，对速度模式进行更新。在步骤S13中，动作调整装置112例如对用于校正的校正系数进行计算，与进行了试执行时的速度模式相乘，由此对速度模式进行调整。如果步骤S13的处理结束，则动作控制系统110的处理向步骤S11返回。

本发明的实施方式1所涉及的动作控制系统110进行以上这样的处理。如以上所述，本发明的实施方式1所涉及的动作控制系统110基于通过多次试执行得到的数据而以学习方式进行速度模式的调整。换言之，本发明的实施方式1所涉及的动作控制系统110，使用机械学习或者优化方法而进行动作指令值即速度模式的调整。

此外，在以上的说明中，设为作业时间的上限值包含于限制条件，但并不是必须的条件，也可以是其他条件。另外，作为限制条件，可以取代赋予作业时间的上限值，而是在满足了其他条件的基础上将作业时间成为最短作为限制条件。并且，在以上的说明中，对动作控制系统110更新动作指令值以使得满足所赋予的限制条件的情况进行了说明，但还考虑设为动作控制系统110对控制参数进行调整而更新的结构。并且，在图1中示出了分别具有机器人控制装置111和动作调整装置112的结构例，但也能够构成为机器人控制装置111内置动作调整装置112。

本实施方式的动作调整装置112、动作控制系统110及机器人系统100按照以上方式构成。根据本实施方式的动作调整装置112、动作控制系统110及机器人系统100，对机器人120的动作进行调整以使得力觉传感器143的检测值处于规定的范围内。在这里，力觉传感器143的检测值表示出作用于末端执行器130的外力的大小。换言之，力觉传感器143的检测值是表示由于机器人120的动作而施加于作业对象200或周边环境300的力的大小的信息。因此，根据本实施方式的动作调整装置112、动作控制系统110及机器人系统100，能够对机器人120的动作进行调整，以使得施加于作业对象200或者周边环境300的力成为适当的大小，即不会对作业对象200或者周边环境300作用过大的负载，另外，能够使机器人120的动作的调整变得容易。

如以上所述，通过使用力觉传感器143以学习方式调整动作指令值以使得力响应收敛于期望的范围内，从而能够实现不损坏成为作业对象的物体的高品质的机器人作业。并且，通过将作业时间加入至限制条件，从而也能够实现高速的作业。

另外，本实施方式的动作调整装置112、动作控制系统110及机器人系统100，作为限制条件而使用了通过力觉传感器143进行检测的力的大小，但也能够对力矩、扭矩、电流值等进行检测，将它们的上限或者下限的任意者用于限制条件。由此，能够在机器人120或者末端执行器130和外界的接触状况中设置限制值，能够对期望的范围内的动作指令值进行探索。其结果，能够实现不损伤作业对象200这样的作业。

并且，作为限制条件，也能够加入与周边环境300的相对位置姿态、机器人120的位置姿态。通过将它们的上限或者下限的任意者加入至限制条件，从而能够实现高品质的作业，并实现抑制了与周边环境300的干涉的机器人作业。作为其结果，能够得到提高系统的运转率这样的特别的效果。以上所述的效果在其他实施方式中也同样地得到。

实施方式2.

本实施方式的动作调整装置、动作控制系统及机器人系统的结构与图1所示的结构相同。本实施方式的动作调整装置112、动作控制系统110及机器人系统100，将为了进行一系列的作业而赋予给机器人120的动作指令分割为多个区分，针对每个区分对动作指令值进行调整。此外，此后设为从动作控制系统输出的动作指令值为速度指令值而进行说明。

图7是用于对本发明的实施方式2所涉及的动作调整装置112的动作进行说明的图。如图7所示，考虑使装载于机器人120的末端执行器130从位置P0移动至位置P3的作业。初始位置即位置P0为作业的开始点，位置P3为作业的结束点。末端执行器130在从位置P0移动至位置P3为止的期间经过位置P1、位置P2。

在本实施方式的机器人系统100中，从作业的开始点至作业的结束点为止的路径被分割为多个区分。换言之，在本实施方式的机器人系统100中，从1个作业的开始至作业的结束为止的机器人120的动作被分割为多个区分。在这里，将从位置P0至位置P1为止设为区分S1，将从位置P1至位置P2为止设为区分S2，将从位置P2至位置P3为止设为区分S3。另外，将区分S1的目标移动速度设为V1，将区分S2的目标移动速度设为V2，将区分S3的目标移动速度设为V3。本实施方式的机器人系统100针对分割出的每个区分对动作指令值进行调整而更新。具体地说，机器人系统100分别对区分S1的目标移动速度、区分S2的目标移动速度、区分S3的目标移动速度进行调整。

此外，在本实施方式的机器人系统100中，成为用于分割为区分的分割点的位置P1、P2设为是与作业内容相应地预先设定。位置P1、P2是区分切换的位置，有时被称为切换位置。另外，在这里将区分的数量例示为3个，但并不是限定于3个。并且，在这里通过位置在空间上定义出区分，但也可以将从作业的开始时刻至作业的结束时刻为止在时间上进行分割。

在本实施方式的动作控制系统110中，设为是作为限制条件而赋予力觉传感器143的检测结果的上限值Flim。本实施方式的动作控制系统110的处理的流程基本上与图6所示的流程图相同。但是，速度模式针对每个区分进行调整。首先，在图6的步骤S10中，机器人控制装置111决定速度模式的初始值。图8是表示本发明的实施方式2所涉及的机器人系统100中的速度模式的初始值的一个例子的图。在图8中横轴为末端执行器130的位置P，纵轴为末端执行器130的目标移动速度V。在图8中，速度模式的初始值为V1＝V2＝V3＝Vini。

接下来，在步骤S11中，机器人控制装置111对机器人120的动作进行控制而试执行作业。图9是表示本发明的实施方式2所涉及的机器人系统100中的力觉传感器143的检测值的一个例子的图。在图9中横轴为末端执行器130的位置P，纵轴为力觉传感器143的检测值F。图9示出在通过图8所示的速度模式的初始值使机器人120进行了动作的情况下，通过力觉传感器143进行检测的值。

接下来，在步骤S12中，动作调整装置112对限制条件是否被满足进行判定。即，在步骤S12中，动作调整装置112对各区分中的力觉传感器143的检测值是否小于或等于由限制条件规定的上限值Flim进行判定。作为用于判定的力觉传感器143的检测值，例如使用各区分中的力觉传感器143的检测值中的最大值。在步骤S12中，在全部区分中力觉传感器143的检测值小于或等于Flim的情况下，动作调整装置112判定为限制条件被满足。另一方面，在步骤S12中，在力觉传感器143的检测值超过上限值Flim的区分存在1个的情况下，动作调整装置112判定为限制条件没有被满足。

在步骤S12中，在判定为限制条件被满足的情况下，动作控制系统110的处理暂时结束，此后进行更新后的速度模式下的作业。另一方面，在步骤S12中，在判定为限制条件没有被满足的情况下，动作控制系统110的处理向步骤S13跳转。在步骤S13中，动作调整装置112对速度模式进行调整、对速度模式进行更新，以使得力觉传感器143的检测值超过上限值Flim的区分的目标速度变小。

在图9所示的例子中，在区分S2中，力觉传感器143的检测值Fmax2超过上限值Flim。另一方面，区分S1中的力觉传感器143的检测值Fmax1及区分S3中的力觉传感器143的检测值Fmax3没有超过上限值Flim。因此，在步骤S12中，动作调整装置112判定为限制条件没有被满足。在步骤S13中，动作调整装置112对速度模式进行调整以使得区分S2中的目标速度V2变小。本发明的实施方式2所涉及的动作控制系统110进行以上这样的处理。图10是表示本发明的实施方式2所涉及的机器人系统100中的更新后的速度模式的一个例子的图。在图10中横轴为末端执行器130的位置P，纵轴为末端执行器130的目标移动速度V。

此外，在以上的说明中，设为是作为限制条件而赋予力觉传感器143的检测结果的上限值Flim，但也可以还将作业时间成为最短作为限制条件而添加。在该情况下，在图9中，Fmax1及Fmax3没有超过上限值Flim，因此在步骤S13中，动作调整装置112对速度模式进行调整，以使得区分S1中的目标速度V1及区分S3中的目标速度V3变大。如上所述通过对速度模式进行调整，从而能够进一步缩短作业时间。图11是表示本发明的实施方式2所涉及的机器人系统100中的更新后的速度模式的其他例的图。在图11中横轴为末端执行器130的位置P，纵轴为末端执行器130的目标移动速度V。

此外，在动作指令值为速度指令值的情况下，如图10、图11所示的那样，分割点P1、P2成为目标速度进行切换的位置。分割点P1、P2可以是目标速度的切换的开始点，也可以是目标速度的切换的完成点。另外，分割点P1、P2也可以是通过内界传感器141进行检测的动作速度从目标速度收敛于规定的误差范围内的情况得到保障的点。

本实施方式的动作调整装置112、动作控制系统110及机器人系统100按照以上方式构成。根据本实施方式的动作调整装置112、动作控制系统110及机器人系统100，针对每个区分对机器人120的动作进行调整。进行调整以使得仅力觉传感器143的检测值大于规定的值的区分的动作变慢，因此无需使作业整体的动作不必要地变慢，而且能够对机器人120的动作进行调整以使得不对作业对象200或者周边环境300作用过大的负载，另外，能够使机器人120的动作的调整变得容易。并且，如果构成为关于力觉传感器143的检测值小于规定的值的区分进行调整以使得动作变快，则也能够使作业整体的动作进一步变快。

如以上所述，根据本实施方式的动作调整装置112、动作控制系统110及机器人系统100，针对每个区间对最佳的动作指令值进行学习并更新，由此能够实现在现有的调整中无法实现的精细的动作指令值的设计，其结果能够实现高速且高品质的机器人作业。

实施方式3.

图12是表示本发明的实施方式3所涉及的动作调整装置112b的结构例及周边的模块的框图。图12将机器人系统100的结构的一部分提取而示出。动作调整装置112b具有指令值学习部113b。本实施方式的动作调整装置、动作控制系统及机器人系统的结构除了动作调整装置112置换为动作调整装置112b以外，与图1所示的结构相同。本实施方式中的动作调整装置112b与实施方式2中的动作调整装置112相比较，不同点在于输入区分信息。在区分信息中包含区分位置的初始值及各区分中的动作指令值的初始值的信息。此外，区分位置是指各区分的两端的分割点Pi的位置，例如是动作速度的目标值进行切换的位置。如果通过内界传感器141或者外界传感器142检测到末端执行器130到达至规定的位置，则将动作速度的目标值进行切换。

本实施方式的动作调整装置、动作控制系统及机器人系统与实施方式2同样地，针对每个区分对动作指令值进行调整。通过针对每个区分对动作指令值进行调整，从而能够使指令值学习部113b成为下述学习部，即，该学习部进行调整以使得会发生碰撞等的区分成为低速的动作，除此以外的区分成为高速的动作。根据该学习器，能够自动地学习实现高速的作业的动作指令值。指令值学习部113b不断自动地学习与各区分相对应的动作指令值。为了简单，设为动作调整装置112b不调整控制参数而是仅调整动作指令值而进行说明。

在本实施方式的动作调整装置、动作控制系统及机器人系统中，指令值学习部113b将区分信息、限制条件、传感器140的检测值及更新前的动作指令值设为输入，分别对动作指令值进行更新。区分信息为了将动作指令值分割为N个区分而进行了定义。为了分割为区分而将各自的分割点定义为Pi(i＝0、1、2、···、N+1)。在这里，N为自然数。另外，在这里，设为动作的开始点及结束点也包含于分割点，将开始点设为P0。将分割点Pi的前1个分割点和分割点Pi之间的区间称为区分Si(i＝0、1、2、···、N)。

在本实施方式的动作调整装置、动作控制系统及机器人系统中，区分设想为是在作业状态每次变化时而进行定义的。例如，如果考虑使用了力觉传感器的嵌合作业，则分割点Pi在进行嵌合的部件间的接触现象的发生前后、在接触状态变化的前后进行定义。与预想的接触状态的变化相应地对分割点Pi进行定义，变更为与各自相适合的位置、速度、加速度这样的动作指令的目标值，由此实现作业整体的高速化。此时，根据过去的试执行信息而对适当的分割点Pi的位置和各个区分Si的指令值模式进行定义，是本实施方式的动作调整装置、动作控制系统及机器人系统的特征。

向指令值学习部113b输入的限制条件是关于进行了高速化的作业而对作业成功和作业失败的边界进行定义的条件。在进行了高速化的作业动作中，由于末端执行器130的位置控制的误差等，存在末端执行器130强烈地碰撞作业对象200的风险。如果发生了强烈的碰撞，则有时末端执行器130或者作业对象200损坏，导致作业失败。考虑如上所述的过去的作业失败，在设计时刻用户对限制条件进行定义、或者通过过去的试执行数据对限制条件进行定义，由此能够实现进行高速且低冲击的作业的动作指令值的生成。

作为限制条件，存在位置的限制范围、姿态的限制范围、动作速度的上限值、动作速度的下限值、力的上限值、力的下限值、力矩的上限值、力矩的下限定值等。特别地，在能够取得机器人120、作业对象200的位置姿态的情况下，作为限制条件而能够输入通过机器人120的位置姿态、机器人120和周边环境300的相对性的位置姿态的上限或者下限的任意者进行定义的限制值。

另外，将通过内界传感器141或者外界传感器142所取得的数据称为传感器信息。针对传感器信息而根据需要进行通过滤波器处理将噪声去除的处理、仅对超过了阈值的值进行提取的处理等前处理。

动作指令值是指能够输入至机器人系统100的位置控制系统的控制指令值。动作指令值有时简称为指令值。机器人120的动作是通过各轴的电动机的动作进行控制的。在动作指令值中例如还包含用于对电动机的动作进行控制的位置指令值、速度指令值、电流指令值等。另外，也能够通过根据表示时间和速度的关系的曲线而生成的速度模式，动作调整装置112b等效地生成位置指令值的时间序列数据，输入至机器人控制装置111。动作指令值也能够在机器人控制装置111的内部生成。

本实施方式的动作调整装置112b导出机器人控制装置111的内部的指令值，与作为由机器人120实施了作业时的响应而得到的传感器信息相应地对动作指令值进行调整、更新。这一点在其他实施方式中也是同样的。此后设为从动作控制系统输出的动作指令值为速度指令值而进行说明。此外，作为其他结构，还考虑到下述结构，即，动作调整装置112b不将动作指令值本身，而是将动作指令值的生成所需的参数发送至机器人控制装置111。例如，动作调整装置112b也能够仅将区分位置及各区分中的动作速度的目标值输入至机器人控制装置111。在该情况下，机器人控制装置基于输入的区分位置及动作速度的目标值而生成动作指令值。

动作调整装置112b具有指令值学习部113b。指令值学习部113b对动作指令值进行调整、更新。指令值学习部113b基于区分信息、限制条件、更新前的动作指令值、传感器140的检测值而求出新的动作指令值。指令值学习部113b以下述方式进行设计，即，在求出新的动作指令值时，通过评价函数对作业的高速性和作业品质进行评价，对作业对象200不易破坏的高速的动作进行探索。此外，另外动作调整装置112b也可以构成为对机器人控制装置111所使用的控制参数进行调整、更新。控制参数的调整、更新也通过指令值学习部113b进行。

图13是表示本发明的实施方式3所涉及的指令值学习部113b的结构例及周边的模块的框图。图13将机器人系统100的结构的一部分提取而示出。指令值学习部113b具有存储部114及学习处理部115。使用图13对指令值学习部113b中的探索的方法的一个例子进行叙述。在这里，预先将区分的数量定义为N＝4。另外，设为在各区分中定义出的目标速度的值即速度目标值作为动作指令值使用。另外，指令值学习部113b对各区分中的速度目标值进行调整，由此实现高速的作业。

图14是表示本发明的实施方式3所涉及的机器人系统100所实施的作业的一个例子的图。如图14所示的那样，机器人系统100进行将第1部件210插入至第2部件310的作业。图14图示出与作业的进行相伴的第1部件210和第2部件310的相对位置的变化，按照(a)、(b)、(c)、(d)的顺序表示作业不断进行的情况。第1部件210相当于作业对象200，第2部件310相当于周边环境300。

在第1部件210设置有孔211。另一方面，在第2部件310设置有凸起311。在将第1部件210向第2部件310插入时，凸起311向孔211插入。第1部件210由第1材料构成。另一方面，第2部件310具有由第1材料构成的部分312和由第2材料构成的部分313。在将第1部件210插入至第2部件310时，第1部件210和第2部件310的接触状态发生变化。

在图14所示的例子中，与从(b)至(d)的作业的进行相应地，在部件间接触的部位及接触状态变化。作为接触状态，举出接触部分的各部件的材料、接触部分的大小等。接触状态变化，由此在接触部分产生的摩擦力变化。在图14的(b)中，第1部件210及第2部件310的外形彼此的摩擦力产生。在图14的(c)中，还加入孔211和凸起311的接触，因此摩擦力变大。由于在部件间产生的摩擦力的变化，力觉传感器143的检测结果也发生变化。即，在部件的相互嵌合作业、连接器的插入作业等中，与作业的进行相应地部件间的反作用力变化。力觉传感器对该部件间的反作用力进行检测。

如图13所示的那样，指令值学习部113b将通过传感器140检测出的力信息及从机器人控制装置111取得的速度模式存储于存储部114。机器人系统100设为在为了调整动作指令值而对作业进行试执行时，能够对速度模式进行指定而使机器人120动作。基于在存储部114中存储的力信息、速度模式、区分信息及限制条件，学习处理部115对速度模式进行更新，作为离线处理而输出至机器人控制装置111。

在这里，在机器人控制装置111中存储有1个速度模式，但在动作指令值的调整时，动作调整装置112b相对于成为基准的1个速度模式，还使用多个种类的速度模式而促使对作业进行试执行。其结果，在动作指令值的调整时，机器人系统100通过各种条件试执行。动作调整装置112b基于通过各种条件下的试执行而得到的数据对动作指令值进行调整。例如，机器人系统100包含与在机器人控制装置111中存储的动作指令值不同的动作指令值，通过各自不同的动作指令值而进行Na次试执行。动作调整装置112b将作为Na次试执行的结果而得到的数据进行输入而进行1次学习，对动作指令值进行更新。将Na次试执行作为1组，如果实施了Nb组的试执行，则在大多情况下动作指令值收敛，不会发生进一步的改善。在这里，Na、Nb为大于或等于1的整数。

如以上所示的那样，在本实施方式的机器人系统100中，使用设定出的1个或者大于或等于1个的多个动作指令值而试执行，基于得到的力传感器数据而生成评价值。动作调整装置112b基于各个评价值而进行动作指令值的更新。在动作指令值的更新中，动作调整装置112b生成1个或者大于或等于1个的多个动作指令值，再次实施试执行。在动作指令值为1个的情况下，如果在绘制评价值而得到的图形中评价值收敛，则动作调整装置112b结束动作指令值的更新。在动作指令值为多个的情况下，如果在仅对与动作指令值相对应的评价值成为最小的结果进行绘制得到的图形中评价值收敛，则动作调整装置112b结束动作指令值的更新。在该情况下，在对多个动作指令值进行了更新的情况下，动作调整装置112b更新为评价值成为最小的动作指令值。

图15是表示本发明的实施方式3所涉及的学习处理部115的处理的流程的一个例子的流程图。如图15所示的那样，首先在步骤S100中，学习处理部115进行作为准备阶段的前处理。接下来在步骤S200中，学习处理部115进行学习处理。

图16是表示通过本发明的实施方式3所涉及的学习处理部115进行的前处理的流程的一个例子的流程图。此外，为了动作的说明，在图16中还记载有由除了学习处理部115以外的模块进行的动作。首先，在步骤S101中，机器人控制装置111对用于进行力觉控制的控制参数进行设定。接下来，在步骤S102中，机器人控制装置111使机器人120动作而对作业进行试执行。接下来，在步骤S103中，指令值学习部113b取得通过该试执行得到的数据。将通过各试执行得到的数据称为试执行数据。在试执行数据中包含通过各试执行检测出的力信息、在各试执行中使用的速度模式。力信息是在各试执行中，以规定的时间间隔通过力觉传感器143取得的时间序列的数据，也被称为力波形。接下来，在步骤S104中，存储部114对通过步骤S103取得的数据进行存储。

接下来，在步骤S105中，学习处理部115对试执行数据是否取得了大于或等于K个进行判定。在这里，K为自然数，是预先设定的。如果还未取得大于或等于K个试执行数据，则处理返回至步骤S102。另一方面，如果取得了大于或等于K个试执行数据，则处理进入至步骤S106。因此，在处理进入至步骤S106的时刻，取得K个试执行数据D1j(j＝1、2、3、···K)，存储于存储部114。

接下来，在步骤S106中，学习处理部115基于在存储部114中存储的K个试执行数据而对区分位置进行定义。区分位置是指各区分的两端的分割点的位置。分割点的位置例如与末端执行器130的位置相对应。分割点的位置成为速度目标值的切换位置。分割点的位置可以是目标速度的切换的开始点，也可以是目标速度的切换的完成点。另外，分割点的位置也可以是通过内界传感器141进行检测的动作速度从目标速度收敛于规定的误差范围内的情况得到保障的点。

学习处理部115例如基于K个试执行数据的平均、分散而对区分位置进行定义。学习处理部115关注于力波形的变化率，在力波形大幅地变化的前后设定分割点，由此能够自动地决定分割点的位置。或者，用户也能够与作业内容相匹配地将状态变化的发生点作为分割点而手动地决定。

接下来，在步骤S107中，学习处理部115对是否定义了区分位置进行判定。如果没有定义区分位置，则处理返回至步骤S106。如果定义了区分位置，则处理进入至步骤S108。接下来，在步骤S108中，学习处理部115针对各区分对速度目标值进行定义。速度目标值是基于由用户指定的力的上限值及目标生产节拍时间而计算的。

具体地说，学习处理部115将用于使作业完成至目标生产节拍时间为止的标准作业速度设定为整体的速度目标值Vdn。接下来，学习处理部115基于力的上限值，对速度上限值Vmax进行定义。末端执行器130与作业对象200或者周边环境300发生了碰撞时的速度和此时施加至末端执行器130的外力的关系能够基于作业对象的刚性信息等而预先求出。学习处理部115能够参照存储有该关系的表格等而求出速度上限值Vmax。

学习处理部115使用整体的速度目标值Vdn和速度上限值Vmax而决定目标速度Vd。速度目标值Vd大于0，小于速度上限值Vmax。目标速度Vd设定为逐渐地接近Vdn。例如，学习处理部115在0＜Vd＜Vdn＜Vmax的条件下，利用随机数对多个速度目标值Vd进行定义以使得速度参数以一定程度发生波动。如上所述，在步骤S108中，学习处理部115以在决定出的范围内成为波动值的方式决定速度目标值Vd。接下来，在步骤S109中，学习处理部115对是否定义了速度目标值进行判定。如果没有定义速度目标值，则处理返回至步骤S108。如果定义了速度目标值，则前处理结束。通过前处理，决定进行学习处理时的初始值。

图17是表示通过本发明的实施方式3所涉及的学习处理部115进行的学习处理的流程的一个例子的流程图。此外，为了动作的说明，在图17中还记载有由除了学习处理部115以外的模块进行的动作。首先，在步骤S201中，机器人控制装置111使机器人120动作而对作业进行试执行。接下来，在步骤S202中，指令值学习部113b取得通过该试执行得到的试执行数据。接下来，在步骤S203中，存储部114对通过步骤S202取得的试执行数据进行存储。

接下来，在步骤S204中，学习处理部115对试执行数据是否取得了大于或等于M个进行判定。在这里，M为自然数，是预先设定的。如果还未取得大于或等于M个试执行数据，则处理返回至步骤S201。另一方面，如果取得了大于或等于M个试执行数据，则处理进入至步骤S205。因此，在处理进入至步骤S205的时刻，取得M个试执行数据D2j(j＝1、2、3、···M)，存储于存储部114。此外，如果定义了M组区分位置、速度目标值，则步骤S201中的试执行使用各自不同的组的区分位置、速度目标值而执行。因此，在处理进入至步骤S205的时刻，对与M组的区分位置、速度目标值相对应的M个试执行数据D2j进行存储。

接下来，在步骤S205中，学习处理部115基于限制条件，针对M个试执行数据各自对评价值进行运算。对运算出的评价值进行存储。接下来，在步骤S206中，学习处理部115求出与M个试执行数据中的、评价值最好的试执行数据相对应的区分位置及速度目标值。接下来，在步骤S207中，学习处理部115将新求出的M个评价值中最好的评价值和过去求出的评价值进行比较，对是否收敛于评价值最好的结果进行判定。如果收敛，则处理进入至步骤S209，进行用于完成调整的处理，动作指令值的调整完成。在动作指令值的调整完成的时刻，得到最好的评价值的区分位置及速度目标值成为动作指令值的调整结果。另一方面，如果还未收敛，则处理进入至步骤S208。

接下来，在步骤S208中，学习处理部115重新对M组区分位置及速度目标值进行定义，对区分位置及速度目标值进行更新。M组区分位置及速度目标值的区分位置或者速度目标值彼此不同。即，在步骤S208中，学习处理部115重新对M组动作指令值进行设定。M组动作指令值各自作为参数而具有区分位置和与各区分位置相对应的速度目标值。在各组动作指令值中，存在比区分数多1个的区分位置，存在与区分数相同数的速度目标值。如果步骤S208的处理完成，则处理返回至步骤S201。

如以上所述，在学习处理中，机器人系统100基于所设定的区分位置和针对各区分所设定的速度目标值而实施M次试执行作业。M次试执行作业各自是在区分位置或者速度目标值不同的条件下实施的。在M次试执行每次结束时，学习处理部115对针对各区分的分割点的位置及针对各区分的速度目标值进行更新。

图18是表示本发明的实施方式3所涉及的机器人系统100中的试执行时的速度模式的一个例子的图。另外，图19是表示在本发明的实施方式3所涉及的机器人系统100中的试执行时取得的力信息的一个例子的图。在图18及图19中，P0～P3为分割点的位置，S1～S4表示4个区分。另外，在图18中，V1～V4表示各区分中的速度目标值。图19表示在通过图18所示的速度模式进行的试执行中取得的力信息。

在图14所示这样的组装作业中，有时在部件间的接触发生的位置的附近，对第1部件210进行保持的末端执行器130和第2部件310之间的反作用力大于限制值。在该情况下，能够通过限制超过量对超过限制值的力的量进行评价。在图19中，在区分S2中，通过力觉传感器143检测出的力的大小F超过限制值L0。限制超过量DH在检测出的力的大小F超过限制值L0的情况下，通过检测出的力的大小F和限制值L0的差分而求出。在存在限制超过量DH大于所设定的阈值的区分的情况下，需要对该区分的速度目标值进行调整。

在图19中，在区分S2中检测出的力F变大。因此，针对图18所示的速度模式，学习处理部115对速度模式进行调整，以使得区分S2中的速度目标值V2变小。并且，学习处理部115还对成为区分S2的两端的分割点P1及P2的位置进行调整。在图18所示的速度模式中，分割点P1为开始降低速度目标值的点，分割点P2为开始提高速度目标值的点。即，学习处理部115还对开始速度目标值的变化的点的位置进行调整。这些调整是基于限制条件进行的。

例如，作为限制条件，在对力的大小F设定出限制值L0的情况下，针对没有超过成为上限的限制值L0的试执行以与力的大小F相关的评价值成为0的方式对评价函数进行定义。在与力的大小F相关的评价值不为0的情况下，学习处理部115对速度目标值V2、分割点P1、P2的位置继续进行更新，对动作指令值进行调整。也能够与该调整同时地，对评价函数进行定义以使得实施尽可能高速的作业。在图19中，在区分S1、S3及S4中，检测出的力的大小F相对于限制值L0存在富裕量DL。在这里，富裕量DL是指直至限制值L0为止的量，或者将直至限制值L0为止的量进行指标化得到的量。直至限制值L0为止的量是通过限制值LO和检测出的力的大小F的差分进行定义的。在富裕量DL大于0的情况下，能够向提高速度目标值的方向调整、更新。通过如上所述的调整，从而能够进行调整以使得尽可能高速地进行作业。

在图17中的步骤S205及步骤S206进行这些调整。此时，为了求出使评价值最好的分割点Pi的位置及速度目标值，能够应用使用了评价函数的机械学习或者优化方法。例如例示出强化学习、贝叶斯优化、粒子群优化等方法。通过这些方法，能够对使评价值最好的动作指令值进行设定。例如定义出评价函数Fq，该评价函数Fq通过使用在作业中的各时刻下检测的力F(t)及作业时间T的式(1)进行表示。学习处理部115对动作指令值进行调整以使得通过评价函数Fq计算的评价值变小，由此能够求出使得力F(t)及作业时间T变小的动作指令值。如图17所示，通过评价函数求出的评价值收敛，调整完成。

[式1]

Fq(F₃T)＝wf*∑(Flim-F(t))+wt*T···(1)

本实施方式的动作调整装置112、动作控制系统110及机器人系统100按照以上方式构成。根据本实施方式的动作调整装置112、动作控制系统110及机器人系统100，针对每个区分对机器人120的动作进行调整。因此，无需使作业整体的动作不必要地变慢，而且能够对机器人120的动作进行调整以使得不对作业对象200或者周边环境300作用过大的负载，另外，能够使机器人120的动作的调整变得容易。并且，如果构成为关于力觉传感器143的检测值小于规定的值的区分进行调整以使得动作变快，则也能够使作业整体的动作进一步变快。

如以上所述，根据本实施方式的动作调整装置112、动作控制系统110及机器人系统100，针对每个区间对最佳的动作指令值进行学习并更新，由此能够实现在现有的调整中无法实现的精细的动作指令值的设计，其结果能够实现高速且高品质的机器人作业。具体地说，根据本实施方式的动作调整装置112、动作控制系统110及机器人系统100，在部件的相互嵌合作业、连接器的插入作业等中，能够一边抑制相互嵌合的部件间的反作用力、一边缩短作业时间。

实施方式4.

图20是表示本发明的实施方式4所涉及的动作调整装置112c的结构例及周边的模块的框图。在本实施方式的动作调整装置、动作控制系统及机器人系统中，其他结构与图1所示的结构相同。图20将机器人系统100的结构的一部分提取而示出。本实施方式的动作调整装置112c具有指令值学习部113b及指令值区分部116。

向指令值区分部116从机器人控制装置111输入更新前的动作指令值，传感器140的检测值即传感器信息从传感器140输入，限制条件从外部输入。指令值区分部116针对这些输入，使用末端执行器130等的位置或者指令值进展率而对区分动作指令值的分割点Pi(i＝0、1、2、···、N+1)进行定义，将其作为区分信息而输出。指令值学习部113b与图12所示的指令值学习部相同。

本实施方式的动作调整装置112c使用传感器信息的特征量、限制条件，例如应用机械学习而决定应该分割的空间，在这里利用分割出的特征量空间上的类信息而生成当前的分割点Pi。动作调整装置112c与图15所示的处理同样地，进行前处理及学习处理。图21是表示通过本发明的实施方式4所涉及的动作调整装置112c进行的前处理的流程的一个例子的流程图。另外，图22是表示通过本发明的实施方式4所涉及的动作调整装置112c进行的学习处理的流程的一个例子的流程图。

图21所示的前处理与图16所示的处理相比较，不同点在于，在步骤S106b中，在区分位置的基础上还定义区分数。例如，能够基于波形上的特征而自动地生成区分。作为波形上的特征，例如关于按照时间序列所取得的位置数据、速度数据、力数据及力变化率数据，每隔一定时间而将Tsmp的数据的最大值或者度数分布作为输入，基于输入而实施聚类。在聚类时，能够使用机械学习的一种即k－means法等聚类方法而针对波形的特征性的每个履历对分隔线进行定义。基于其而例如对X个种类的波形特征进行定义。

接下来，能够基于所取得的簇，针对原来的数据而实施附带标签。例如，针对与存在X个的簇各自对应的、作为对象的输入的相似度S(i)(在这里，i＝1、2、3、···、X)进行定义，能够对与哪个组的属性的特征最接近这一情况通过百分比表现。在该情况下，作为百分比最大的组，能够附带标签。设为以时间t作为变量而定义出的各时刻的标签L(t)。在步骤S106b中，能够在发生标签的变化的全部或者一些部分处作为分隔线而定义区分数及区分位置。

另一方面，图22所示的学习处理如果与图17所示的处理相比较，则步骤S211、步骤S212、步骤S213这3个处理不同。图22所示的学习处理在步骤S211中，基于传感器信息、动作指令值及控制参数、限制条件，使用用于对区分数和区分位置进行学习的评价函数而求出第1评价值。另外，图22所示的学习处理在步骤S212中，基于第1评价值对区分数及区分位置进行学习、更新。并且，图22所示的学习处理在步骤S213中，求出用于对动作指令值进行学习的第2评价值。因此，图22所示的学习处理在学习区分数及区分位置之后，对动作指令值进行学习。

通过包含以上的处理，从而无需追加自动地学习区分信息的框组，无需预先利用事前知识而设计区分信息，能够得到缩短设计时间这一特别的效果。

实施方式5.

图23是表示本发明的实施方式5所涉及的动作调整装置112d的结构例及周边的模块的框图。在本实施方式的动作调整装置、动作控制系统及机器人系统中，其他结构与图1所示的结构相同。图23将机器人系统100的结构的一部分提取而示出。本实施方式的动作调整装置112d具有指令值区分部116及动作学习部117。指令值区分部116与图20所示的指令值区分部相同。

图24是表示本发明的实施方式5所涉及的动作学习部117的结构例的框图。动作学习部117具有指令值学习部113b及参数学习部118。指令值学习部113b与图20所示的指令值学习部相同。向动作学习部117从机器人控制装置111输入更新前的动作指令值及控制参数。另外，向动作学习部117从外部输入限制条件。另外，向动作学习部117从传感器140输入传感器信息。另外，向动作学习部117从指令值区分部116输入区分信息。输入的信号输入至指令值学习部113b及参数学习部118。

参数学习部118不是对位置指令值、速度指令值、加速度指令值这样的直接的机器人的举动进行调整，而是对基于外界传感器的传感器反馈控制系统的增益、阻抗参数、滤波器设计参数等进行调整。即，参数学习部118对反馈控制系统的控制参数进行调整。参数学习部118将区分信息、传感器信息、限制条件、指令值及控制参数作为输入，使用它们将输入的控制参数更新为使得满足限制条件这样的控制参数。在对控制参数进行更新时，能够使用机械学习。作为例示，参数学习部118对控制参数进行更新以使得通过预先定义出的评价函数得到的评价值变大，直至渐进地收敛为止而重复运算。此外，通过定义的评价函数，参数学习部118对控制参数进行更新以使得评价值变小。

在这里，在图24中，参数学习部118例示出与指令值学习部113b相独立的结构。但是，参数学习部118及指令值学习部113b无需一定各自进行独立的处理。例如，参数学习部118及指令值学习部113b也能够使用1个评价函数而同时地进行处理。此外，参数学习部118针对每个区分而调整控制参数。另外，指令值学习部113b所使用的区分数和参数学习部118所使用的区分数不一定相同。例如，考虑与指令值学习部113b所使用的区分数相比较，参数学习部118所使用的区分数多的情况。

另外，参数学习部118不仅能够对基于外界传感器142的传感器反馈控制系统中的控制参数，还能够对基于内界传感器141的反馈控制系统中的控制参数进行更新，其结果，能够以更高品质实现高速的机器人作业。

图25是表示发明的实施方式5所涉及的动作调整装置112d的其他结构例及周边的模块的框图。在图25中示出了不具有指令值学习部113b的结构例。在该结构例中，动作调整装置112d不进行动作指令值的更新，而是仅对控制参数进行更新。

实施方式6.

本实施方式的动作调整装置、动作控制系统及机器人系统在对速度模式进行调整时，针对各区分Si中的速度目标值而确定上限值或者下限值，基于作业对象的刚性、作业对象的组装品质上的限制而对各个区分中的探索空间进行定义。根据本实施方式的动作调整装置、动作控制系统及机器人系统，在探索空间中，不对能够实现但会发生组装品质上的问题的动作指令值或者控制参数进行探索。因此，在规定出用户所要求的作业品质的范围，能够收敛于实现高速的组装的动作指令值或者控制参数。由此，调整后的机器人能够得到下述特别的效果，即，不会增大作用于作业对象的反作用力，能够确保不会损伤的作业品质。

标号的说明

100机器人系统，110动作控制系统，111机器人控制装置，112、112b、112c、112d动作调整装置，113、113b指令值学习部，114存储部，115学习处理部，116指令值区分部，117动作学习部，120机器人，130末端执行器，140传感器，141内界传感器，142外界传感器，143力觉传感器，200作业对象，210第1部件，211孔，300周边环境，310第2部件，311凸起，401处理器，402存储器，403数据总线。

Claims

1.一种动作调整装置，其在使用对装载有末端执行器的机器人的动作进行控制的机器人控制装置而由所述机器人针对作业对象进行作业的机器人系统中被使用，

所述机器人的动作调整装置的特征在于，具有：

指令值区分部，其将从所述作业的开始至结束为止的期间进行分割而生成多个区分；以及

指令值学习部，其将通过所述机器人系统所具有的外界传感器检测出的作用于所述末端执行器的力作为输入，为了针对通过所述指令值区分部生成的每个所述区分而对所述机器人的动作进行控制，进行从所述机器人控制装置发送至所述机器人的动作指令值的学习。

2.根据权利要求1所述的动作调整装置，其特征在于，

所述指令值学习部进行将作用于所述末端执行器的力的范围作为限制条件的学习，对所述动作指令值进行调整。

3.根据权利要求1或2所述的动作调整装置，其特征在于，

所述指令值学习部进行将所述作业所需的时间的上限作为限制条件的学习，对所述动作指令值进行调整。

4.根据权利要求1或2所述的动作调整装置，其特征在于，

所述动作指令值是所述末端执行器的移动速度的目标值或者所述机器人的动作速度的目标值即速度指令值。

5.根据权利要求1或2所述的动作调整装置，其特征在于，

所述指令值区分部对用于将所述作业分割为所述区分的分割点的位置进行调整。

6.根据权利要求1或2所述的动作调整装置，其特征在于，

所述指令值学习部进行将力、力矩、扭矩或者电流值的上限或者下限的任意者作为限制条件的学习，对所述动作指令值进行调整。

7.根据权利要求1或2所述的动作调整装置，其特征在于，

所述指令值学习部将所述机器人的位置姿态或者与周边环境的相对位置姿态的上限或者下限的任意者作为限制条件而进行学习，对所述动作指令值进行调整。

8.根据权利要求1或2所述的动作调整装置，其特征在于，

所述指令值学习部针对每M次作业的试执行而进行基于评价函数的评价，对所述动作指令值进行调整，其中，M为自然数。

9.根据权利要求1或2所述的动作调整装置，其特征在于，

具有参数学习部，该参数学习部进行基于所述机器人系统所具有的内界传感器的反馈控制及基于所述外界传感器的反馈控制中的至少一者中的控制参数的学习，

所述参数学习部进行基于与所述区分相关的信息即区分信息、和通过多次试执行从所述外界传感器得到的传感器信息的学习，对所述控制参数进行更新。

10.一种动作调整装置，其在使用对装载有末端执行器的机器人的动作进行控制的机器人控制装置而由所述机器人针对作业对象进行作业的机器人系统中被使用，

所述机器人的动作调整装置的特征在于，具有：

参数学习部，其进行将通过所述机器人系统所具有的外界传感器检测出的作用于所述末端执行器的力作为输入的学习，进行基于所述机器人系统所具有的内界传感器的所述机器人的动作的反馈控制及基于所述外界传感器的所述机器人的动作的反馈控制的至少一者中的控制参数的学习；以及

指令值区分部，其将从所述作业的开始至结束为止的期间进行分割而生成多个区分，

所述参数学习部针对通过所述指令值区分部生成的所述区分，分别对所述控制参数进行调整。