CN111699080A

CN111699080A - 机器人的控制装置

Info

Publication number: CN111699080A
Application number: CN201980012348.3A
Authority: CN
Inventors: 柴田义也
Original assignee: Omron Corp
Current assignee: Omron Corp
Priority date: 2018-03-14
Filing date: 2019-02-20
Publication date: 2020-09-22
Anticipated expiration: 2039-02-20
Also published as: CN111699080B; WO2019176477A1; JP2019155554A; EP3766642A4; JP6933167B2; US20210046649A1; EP3766642A1; US11673266B2

Abstract

本发明是一种控制装置，控制机器人的运行，包括：第一处理部，用以将所述机器人的第一状态及自所述第一状态转变的第二状态设为输入，且将自为了从所述第一状态向所述第二状态转变而所述机器人执行的多个基本运行中选择的至少一个所述基本运行及此基本运行的运行顺序设为输出，并且对各所述基本运行设定规定的运行参数；以及指令部，基于来自所述第一处理部的输出，而对所述机器人发出运行指令。

Description

机器人的控制装置

技术领域

本发明涉及一种机器人的控制装置、控制方法、控制程序及处理装置。

背景技术

在全部由人来制作机器人的控制系统的情况下，存在细微的参数调整需要时间的问题。另一方面，通过机械学习来决定自当前状态至目标状态的机器人的行动次序的计划(例如专利文献1)。

现有技术文献

专利文献

专利文献1：日本专利特开2007-18490号公报

发明内容

发明所要解决的问题

然而，若如上所述采用机械学习，则存在如下问题。例如，若想要以神经网络(neural network)等一个大的学习完毕模型来实现复杂的行动次序的决定，则存在学习花费时间的问题。另外，学习完毕模型中，即便人看到权重等内部参数，也无法理解含义，因此即便在想要部分地变更学习结果的情况下，也存在无法调整的问题。

此外，此种问题并不限定于机器人的控制装置，而是在由多数候补进行规定的处理来达成目的那样的所有处理装置中可能产生的问题。

本发明是为了解决此问题而形成，目的为提供一种能够实现处理的效率化的机器人的控制装置、控制方法、控制程序及处理装置。

解决问题的技术手段

本公开是一种控制机器人的运行的控制装置，包括：第一处理部，用以将所述机器人的第一状态及自所述第一状态转变的第二状态设为输入，且将自为了从所述第一状态向所述第二状态转变而所述机器人执行的多个基本运行中选择的至少一个所述基本运行、及此基本运行的运行顺序设为输出，并且对各所述基本运行设定规定的运行参数；以及指令部，基于来自所述第一处理部的输出，而对所述机器人发出运行指令。

根据此构成，关于机器人的运行，并非利用处理部而自所有运行中获得输出，而是预先准备规定数量的基本运行，以自其中选择最佳的基本运行及其顺序的方式，由第一处理部来进行处理，因此能够缩短用于处理的运算时间。另外，由于预先决定基本运行，故而使用者能够通过观察其组合来容易地获知机器人的运行。进而，由于对各基本运行设定了运行参数，故而基本运行决定后，使用者能够任意地变更各基本运行的运行参数。

此外，所谓机器人的第一状态、第二状态，不仅包含机器人自身的状态，而且还包含利用机器人进行作业的作业对象的状态。

所述控制装置中，能够还包括第二处理部，所述第二处理部用以将所述第一状态及所述第二状态设为输入，且将为了从所述第一状态向所述第二状态转变作为所述第一处理部的输出而选择的各所述基本运行的运行参数设为输出，并且所述指令部基于来自所述第一处理部及所述第二处理部的输出，而对所述机器人发出运行指令。

根据此构成，能够自动进行基本运行的调整、即运行参数的调整，因此能够提高第二状态的达成的精度。

所述控制装置中，能够构成为：在根据利用所述第一处理部的输出，无法以规定的基准将所述机器人转变为所述第二状态的情况下，利用所述第二处理部来进行所述运行参数的输出。

所述控制装置中，能够构成为在规定范围内输出所述运行参数。由此，能够缩小探索的范围，能够缩短处理的时间。

所述控制装置中，能够还包括接受部，所述接受部接受对各所述基本运行的运行参数的调整。由此，使用者能够任意地进行运行参数的调整。

所述控制装置中，能够还包括输入部，所述输入部接受所述第二状态的指定。

所述控制装置中，所述第一处理部能够包括学习完毕的学习器。

本公开的机器人的控制系统包括：机器人、以及所述任一所述机器人的控制装置，并且所述机器人构成为：根据来自所述控制装置的所述运行指令而自所述第一状态转变为第二状态。

本公开是一种控制机器人的运行的控制方法，包括以下步骤：准备第一处理部，所述第一处理部用以将所述机器人的第一状态、及自所述第一状态转变的第二状态设为输入，且将自为了从所述第一状态向所述第二状态转变而所述机器人执行的多个基本运行中选择的至少一个所述基本运行及此基本运行的运行顺序设为输出；对各所述基本运行设定规定的运行参数；对所述第一处理部输入规定的所述第一状态及所述第二状态，且输出至少一个所述基本运行及此基本运行的运行顺序；以及基于来自所述第一处理部的输出，而对所述机器人发出运行指令。

本公开是一种控制机器人的运行的控制程序，使计算机执行以下步骤：准备第一处理部，所述第一处理部用以将所述机器人的第一状态、及自所述第一状态转变的第二状态设为输入，且将自为了从所述第一状态向所述第二状态转变而所述机器人执行的多个基本运行中选择的至少一个所述基本运行及此基本运行的运行顺序设为输出，并且对各所述基本运行设定规定的运行参数；对所述第一处理部输入规定的所述第一状态及所述第二状态，且输出至少一个所述基本运行及此基本运行的运行顺序；以及基于来自所述第一处理部的输出，而对所述机器人发出运行指令。

本公开是一种用以对处理对象物进行处理的处理装置，包括：第一处理部，用以将所述处理对象物的第一状态、及自所述第一状态转变的第二状态设为输入，且将自为了从所述第一状态向所述第二状态转变而对所述处理对象物进行的多个基本处理中选择的至少一个所述基本处理及此基本处理的处理顺序设为输出，并且对各所述基本处理设定规定的处理参数；以及指令部，基于来自所述第一处理部的输出，而对所述处理对象物进行处理。

所述处理装置中，能够还包括第二处理部，所述第二处理部用以将所述处理对象物的第一状态及自所述第一状态转变的第二状态设为输入，且将为了从所述第一状态向所述第二状态转变而作为所述第一处理部的输出而选择的各所述基本处理的处理参数设为输出，并且所述指令部基于来自所述第一处理部及所述第二处理部的输出，而对所述处理对象物进行处理。

所述处理装置中，能够构成为：在根据利用所述第一处理部的输出，无法以规定的基准将所述处理对象物转变为所述第二状态的情况下，利用所述第二处理部来进行所述处理参数的输出。

所述处理装置中，能够构成为在规定范围内输出所述处理参数。

所述处理装置中，能够将所述处理设为图像处理，且能够将所述多个基本处理设为对图像实施的过滤处理。

发明的效果

根据本发明，能够缩短用以决定最佳处理的处理时间，并且能够容易进行各处理的调整。

附图说明

图1是表示本发明的机器人的控制装置的一实施方式的概要的框图。

图2是表示机器人的作业对象的初始状态及目标位置的图。

图3是表示机器人的运行的图。

图4是表示运行原语(primitive)的例子的图。

图5是表示基于运行原语的机器人的运行例的图。

图6是表示机器人的运行的评价方法的图。

图7是对运行参数的调整进行说明的图。

图8是表示图1的控制装置的硬件构成的框图。

图9是表示图1的控制装置的功能构成的框图。

图10是表示图1的控制装置中所使用的神经网络的一例的图。

图11是表示图1的控制装置的学习器的学习的一例的图。

图12是例示利用图1的控制装置来进行的机器人的控制的处理顺序的一例的流程图。

图13是对运行决定部的其他处理的例子进行说明的图。

具体实施方式

以下，参照附图对本发明的机器人的控制装置、控制方法及控制程序的一实施方式进行说明。但，以下所说明的本实施方式在所有方面仅为本发明的例示。当然可不脱离本发明的范围而进行各种改良或变形。即，在实施本发明时，可适宜采用与实施方式相对应的具体构成。此外，利用自然语言来对本实施方式中出现的数据进行说明，更具体而言，利用计算机可识别的拟语言、命令(command)、参数、机器语言等来指定。

＜1.应用例＞

以下，对本实施方式的机器人的控制装置进行说明。如图1所示，此控制装置中，为了规定的目的，当使机器人自第一状态转变为第二状态时，将第一状态及第二状态设为输入，且将机器人所进行的至少一个基本运行、及其运行顺序设为输出。此输出是利用学习器来进行。

例如，如图2所示，以利用机器人，自长方体状的零件A与具有嵌入有零件A的凹部的零件B分离配置的初始状态，至在零件B的凹部嵌入有零件A的目标状态的转变的情况为例，来进行说明。

为了机器人10使零件A自初始状态移动至目标状态，而考虑各种运行及运行顺序。但是，若对所有运行进行研究，则存在计算需要时间的顾虑。因此，本实施方式中，通过将机器人10所进行的运行的候选预先设定为运行原语(基本运行)，以规定的顺序来执行自其中选择的运行原语，进行零件A的移动。此外，所谓运行原语，是指将机器人10能够进行的运行以规定数量的元件来表现的情况下的各个元件。例如，当机器人10搬送零件时，若设为在水平移动后，进行下降移动，则水平移动及下降移动成为运行原语。

如图3所示，本实施方式中，机器人10进行上升(Up)、下降(Down)、右侧移动(Right)、左侧移动(Left)、倾斜(Tilt)这五个运行，将这些五个运行中的几个加以组合，将零件A嵌入零件B。此外，本实施方式中，为了便于说明，并不考虑与附图的纸面垂直的方向的移动。但，根据机器人10的作业内容，也可包含所述方向的移动。

如图4所示，本实施方式中，所述五个运行设定为运行原语，各运行原语中分别设定了移动量。将其称为行动集(action set)。图4的例子中，对各运行原语设定了三个为一组的行动集。例如，右侧移动(1)、右侧移动(2)、右侧移动(3)分别是指向右侧的移动量为1、2、3。以下，将此移动量(或者倾斜的角度)称为运行参数。此外，所谓运行参数，是表示运行原语所表示的运行的形态/程度，并不限定于移动量或角度。另外，所谓行动集，是指运行原语与运行参数的组合，能够称为运行的系列。进而，此处，作为行动集，示出作为运行参数的移动量为1、2、3的集，但并不限定于此。例如，若将运行参数的组合设为P1、P2、P3……Pn，则它们能够成为如等差数列、或者等比数列那样具有规则性的组合。

如上所述在本实施方式中，自包含多个行动集的15种运行原语中，决定零件A的移动所使用的运行原语及其顺序。即，当将零件A与零件B的初始状态及目标状态设为输入时，以机器人10所执行的最佳运行原语及其运行顺序成为输出的方式，学习器运行。

此处，为了利用学习器来进行最佳的输出，以如下方式来评价机器人10的运行。例如，如图5所示，为了机器人10的运行，存在多种运行原语的组合。此处，例示出三种运行原语的组合。三个机器人的运行(1)～(3)的结果、零件A与零件B的最终状态分别不同，但将此最终状态与目标状态加以比较，来进行机器人的运行的评价。

例如，将零件A的目标状态下的位置的矢量、与零件A的最终状态下的位置矢量加以比较，根据其差来算出评价值。此例中，将位置矢量设为V(左右位置、上下位置、倾斜)，将目标状态的位置矢量设为Vg，将最终状态的位置矢量设为Ve。而且，利用以下的式子来算出评价值。

评价值＝1－∣Ve－Vg∣/K

(其中，K是用以将评价值标准化为0～1的系数；因此，例如能够以在理想状态下评价值接近1，若超过可容许的偏差量，则评价值成为0的方式，来设定K)

例如，关于所述三个机器人10的运行(1)～(3)，能够如图6那样来算出评价值。此例中，基于运行(2)的零件A的最终状态的评价值最高。即，零件A配置在与目标状态最近的位置。因此，学习器是以将用于获得如上所述的高评价值的运行原语及其顺序输出的方式来学习。

此外，所述运行(2)的评价值并不是1.0(满分)，如图6所示，零件A并未完全嵌入零件B的凹部。因此，机器人10的运行存在改善的余地。图6中，例如认为通过将运行(2)的最后的运行即下降(Down)(1)的运行参数由1来修正，能够将零件A完全嵌入零件B的凹部。因此，本实施方式中，在仅利用所准备的运行原语未完全达成目的的情况下，也可调整运行原语的运行参数。

例如，如图7所示，若将运行(2)的最后的运行原语的运行参数由1变更为1.2，则评价值成为1.0，能够使最终状态成为目标状态。此处，运行参数的调整方法有各种方法，也能够在决定运行原语及其顺序后，随机变更运行参数来探索最佳值，或使用学习器来决定最佳值。

如上所述的运行参数的调整能够基于使用者的想法来进行。因此，获得与最佳的运行接近的运行原语后，使用者能够手动地调整机器人运行。

＜2.构成例＞

＜2-1.硬件构成＞

首先，还参照图8对本实施方式的机器人的控制装置的硬件构成进行说明。图8是表示本实施方式的机器人的控制装置的硬件构成的框图。

＜2-1-1.机器人＞

如图3所示，机器人10具有能够握持零件的臂，构成为此臂上下左右地移动，并且臂倾斜。但，机器人的构成并无特别限定，能够适宜变更为能够进行其他运行。

＜2-1-2.控制装置＞

如图8所示，本实施方式的机器人的控制装置2是将控制部21、存储部22、通信接口23、输入装置(输入部、接受部)24、输出装置25、显示装置26、外部接口27、及驱动器28电连接而成的计算机。此外，图1中，将通信接口及外部接口分别记载为“通信I/F”及“外部I/F”。

控制部21包含中央处理器(Central Processing Unit，CPU)、随机存取存储器(Random Access Memory，RAM)、只读存储器(Read Only Memory，ROM)等，根据信息处理来进行各构成元件的控制。存储部22例如为硬盘驱动器、固态驱动器等辅助存储装置，存储有：由控制部21所执行的控制程序221、运行原语数据222、输入数据223、输出数据224、表示与学习完毕的学习器相关的信息的学习结果数据225、用以使学习器进行学习的学习数据226等。除此之外，还能够存储驱动控制装置所需要的各种数据。

控制程序221为了机器人的运行而接受所述输入，进行与其对应的输出，利用后述的学习器来进行输出。如所述图4所示，运行原语数据222是根据机器人10的种类或所要求的作业的种类来预先设定。输入数据223是包含所述零件的初始状态及目标状态的数据，输出数据224是表示由学习器所输出的机器人10的运行的数据。学习结果数据225是用以进行学习完毕的学习器的设定的数据。另外，学习数据226是当前的学习器的学习所使用的数据。此外，与学习相关的详细说明将在后面叙述。

通信接口23例如为有线局域网(Local Area Network，LAN)组件、无线LAN组件等，且是用以经由网络进行有线或无线通信的接口。通信接口23例如，用于与机器人10通信，或者将与机器人10的控制相关的信息发送至外部。输入装置24例如为鼠标、键盘等用以进行输入的装置，除了将输入数据223输入之外，能够输入使用者发出的各种指示。输出装置25例如为扬声器等用以进行输出的装置。显示装置26能够包括显示器等，例如能够显示根据学习器的输出的结果等。外部接口27为通用串行总线(Universal Serial Bus，USB)端口等，且是用以与外部装置连接的接口。

驱动器28例如为光盘(Compact Disk，CD)驱动器、数字通用光盘(DigitalVersatile Disk，DVD)驱动器等，且是用以读入存储介质91所存储的程序的装置。驱动器17的种类可根据存储介质91的种类来适宜选择。所述存储部22所存储的各种数据221～226中的至少一个也可存储于此存储介质91。另外，输入数据223、输出数据224还能够存储于控制部21的RAM。

存储介质91为下述介质，即：通过电作用、磁作用、光学作用、机械作用或化学作用来存储所记录的程序等信息，以使计算机及其他装置、机械等可读取所述程序等信息。此控制装置2也可自此存储介质91中获取所述各种数据221～226。

此处，图8中，作为存储介质91的一例，例示出CD、DVD等磁盘型的存储介质。然而，存储介质91的种类并不限定于磁盘型，也可以是磁盘型以外的存储介质。作为磁盘型以外的存储介质，例如可列举闪速存储器等半导体存储器。

此外，关于控制装置2的具体的硬件构成，可根据实施方式来适宜进行构成元件的省略、置换及追加。例如，控制部21也可包含多个处理器。控制装置2也可包括多台信息处理装置。另外，控制装置2除了所提供的设计为服务专用的信息处理装置以外，还可使用通用的桌上型个人计算机(Personal Computer，PC)、平板PC等。

＜2-2.控制装置的功能构成＞

接着，参照图8及图9，对本实施方式的控制系统的功能构成的一例进行说明。图9是表示控制装置的功能构成的框图。

＜2-2-1.概略构成＞

控制装置2的控制部21将存储部22所存储的控制程序221在RAM中展开。然后，控制部21利用CPU来解释及执行在RAM中展开的程序221，来控制各构成元件。由此，如图9所示，本实施方式的控制装置2作为包括运行决定部211、评价部212及运行参数决定部213的计算机来发挥功能。

＜2-2-2.运行决定部＞

运行决定部211中，如上所述，将如图2所示的零件的初始状态及目标状态作为输入数据来输入。如上所述的输入是由输入装置24来输入，但存在各种输入方法。例如，可输入初始状态及目标状态的座标、位置矢量等，也可自预先设定的初始状态及目标状态中选择。或者，还能够获取初始状态及目标状态的图像，并将其输入。

而且，运行决定部211中包括用以根据如上所述的输入数据来决定机器人10的运行的第一学习器214。第一学习器214的输出为至少一个运行原语、以及运行顺序。即，此第一学习器214是以根据预先设定的多个运行原语，来输出所述评价值升高那样的运行原语、及其顺序的方式来学习。

进行此种输出的学习器214包括神经网络。具体而言，是如图10所示的所谓深层学习所使用的多层结构的神经网络，自输入起依次包括输入层71、中间层(隐藏层)72、及输出层73。

图10中，神经网络7包括一层的中间层72，输入层71的输出成为中间层72的输入，中间层72的输出成为输出层73的输入。但，中间层72的数量也可不限定于一层，神经网络7还可包括两层以上的中间层72。

各层71～层73包括一个或多个神经元。例如，输入层71的神经元的数量能够根据输入数据的数量来设定。中间层72的神经元的数量能够根据实施方式来适宜设定。另外，输出层73也能够根据运行原语的数量来设定。

邻接的层的神经元彼此适宜耦合，对各耦合设定权重(耦合荷重)。图4的例子中，各神经元与邻接的层的所有神经元耦合，但神经元的耦合也可不限定于此种例，可根据实施方式来适宜设定。

在各神经元设定有阈值，基本上，根据各输入与各权重的积的和是否超过阈值来决定各神经元的输出。控制装置2通过对如上所述的神经网络7的输入层71输入所述输入数据，而自输出层73获得表示最佳的机器人的运行的输出数据。

此外，表示如上所述的神经网络7的构成(例如：神经网络7的层数、各层中的神经元的个数、神经元彼此的耦合关系、各神经元的传递函数)、各神经元间的耦合的权重、以及各神经元的阈值的信息包含于学习结果数据225。控制装置2参照学习结果数据225，来进行学习完毕的学习器的设定。

另外，第一学习器214的学习例如是根据如图11所示那样的学习数据226来进行。即，使用将初始状态及目标状态设为输入、且将用于理想运行的运行原语及运行顺序设为输出的学习数据，由此利用误差传播法等来进行学习。

＜2-2-3.评价部＞

评价部(指令部)212对运行决定部211的输出进行评价。例如，在根据运行决定部211所输出的运行原语及运行顺序，能够将零件完全移动至目标位置的情况下，能够通过运行决定部211的输出而使机器人10运行。但，如所述图6所示，也存在根据运行决定部211所输出的运行原语及运行顺序，无法将零件完全移动至目标状态的情况。在此情况下，需要调整运行参数。

因此，评价部212以规定的基准来判定运行决定部211的输出是否适当，在满足基准的情况下，以通过运行决定部211的输出来运行的方式，对机器人10发出指令。此基准例如能够使用所述评价值，若与评价值1.0的差为规定范围内，则能够判断为满足基准。另一方面，在不满足规定基准的情况下，运行参数决定部213中，进行最佳的运行参数的决定。此时，也能够将评价部212的决定显示于显示装置26，由使用者来决定是否进行运行参数的调整。

运行参数决定部213包括第二学习器215，利用此第二学习器215，输出各运行原语的最佳的运行参数。第二学习器215能够与第一学习器214同样地包括神经网络。对第二学习器215，能够进行各种输入。例如，还能够将初始状态、目标状态、由第一学习器214输出的运行原语、以及所决定的运行顺序设为输入，且将各运行原语的运行参数设为输出。或者，也能够将与第一学习器214的输出对应的评价值添加于输入。如此一来，设定输入及输出，输出用以达成目标状态的最佳的各运行原语的运行参数。

而且，所输出的运行参数被发送至评价部212，基于运行参数经变更的运行原语及运行顺序，来对机器人10发出运行指令。

＜2-3.控制装置的运行＞

接着，参照图12，对控制装置2中的机器人的控制处理的例子进行说明。图12是例示出控制装置的处理顺序的一例的流程图。此外，以下所说明的处理顺序仅为一例，各处理也可尽可能变更。另外，关于以下所说明的处理顺序，能够根据实施方式来适宜进行步骤的省略、置换及追加。

如图12所示，首先，自输入装置24输入零件的初始状态及目标状态(步骤S101)。由此，运行决定部211输出与输入相应的最佳的运行原语及运行顺序(步骤S102)。接着，评价部212根据运行决定部211所输出的运行原语及运行顺序，来判断目标状态是否能够达成(步骤S103)。即，判断运行决定部211的输出是否满足规定的基准。而且，在满足规定基准的情况下(步骤S103的是(YES))，基于运行决定部211的输出，对机器人10发出运行指令(步骤S104)。另一方面，在不满足规定基准的情况下(步骤S103的否(NO))，进行运行参数的调整。即，运行参数决定部213中，决定最佳的运行参数(步骤S105)。继其之后，评价部212基于运行参数经变更的运行原语及运行顺序，对机器人10发出运行指令(步骤S106)。

＜3.特征＞

如上所述，根据本实施方式，关于机器人的运行，并非利用学习器而自所有运行中获得输出，而是以预先准备规定数量的运行原语，自其中选择最佳的运行原语及其顺序的方式，由第一学习器214来学习，因此能够以短时间来进行学习。另外，由于运行原语被预先决定，故而使用者通过观察其组合，能够容易获知机器人的运行。

但，在根据由运行决定部211所决定的运行原语及运行顺序，也无法达成目标状态的情况下，能够由运行参数决定部213来自动地决定各运行原语的运行参数。由此，能够提高目标位置的达成的精度。

＜4.变形例＞

以上，对本发明的实施方式进行了详细说明，但所述为止的说明在所有方面仅为本发明的例示。当然可不脱离本发明的范围而进行各种改良或变形。例如，可进行如下那样的变更。此外，以下，关于与所述实施方式相同的构成元件使用相同的符号，且关于与所述实施方式相同的方面适宜省略说明。以下的变形例可适宜组合。

＜1＞

评价部中，当判断为运行决定部的输出不满足规定的基准时，还能够将评价部212的决定显示于显示装置26后，由使用者来决定运行参数。在此情况下，使用者能够自输入装置24直接输入运行参数。因此，使机器人进行与使用者的偏好相符的运行。

＜2＞

运行参数决定部213中，不需要变更所有运行原语的运行参数，也可仅变更一部分的运行原语的运行参数。例如，能够仅变更即将到达最终位置之前的一个或多个运行的运行原语的运行参数。

＜3＞

运行参数是在规定的范围内设定，运行参数决定部213中，能够在其范围内进行运行参数的调整。

＜4＞

所述实施方式中，运行决定部211中，决定运行原语及其运行顺序，但根据机器人的作业，也存在基本的运行原语及其运行顺序为已知的情况。在此情况下，例如，如图13所示，也能够自仅与基本的原语类似的运行参数不同的运行原语中，决定最佳的运行原语。在此情况下，对于学习器的输入能够设为与所述实施方式相同，但预先准备的运行原语能够如图13所示，设为仅运行参数不同的运行原语，或者设为运行自身类似的运行原语，能够由学习器从其中来决定最佳的运行原语。

＜5＞

所述实施方式中所示的运行原语及运行参数为一例，能够根据机器人的种类或作业的种类来适宜决定。例如，作为运行原语，能够进行旋转、握持、挤压、拉伸等各种设定，但能够根据机器人所进行的作业来适宜设定。例如，在具有多指手的机器人进行组装作业的情况下，设定“挤压”、“拉伸”等运行原语。所谓挤压，是将机器人的手以一定的力向某个方向挤压的运行，运行参数成为挤压力。另外，所谓拉伸，是机器人以关闭手指的状态向一定的方向且以一定的力来移动的运行，运行参数成为拉伸力。进而，在使机器人握持笔来进行在纸上写字的作业的情况下，设定将笔以一定的力对纸挤压的“挤压”、以挤压笔的状态向前后左右移动的“移动”、使笔移动且缓缓上升的“脱离”等运行原语。通过将这些运行原语加以组合，也能够获得可将成为字帖的字的线的粗度或“捺”、“提”等表述再现出来的运行。

＜6＞

所述的例子中，作为神经网络7，使用具有多层结构的一般的前馈型神经网络。然而，各神经网络7的种类也可不限定于如上所述的例子，可根据实施方式来适宜选择。例如，各神经网络7也可为将输入层71及中间层72作为卷积层及池化层(pooling layer)来利用的卷积神经网络。另外，例如，各神经网络7也可为具有如自中间层72向输入层71等那样，自输出侧递归至输入侧的具有耦合的递归型神经网络。此外，各神经网络7的层数、各层中的神经元的个数、神经元彼此的耦合关系、以及各神经元的传递函数可根据实施方式来适宜决定。

＜7＞

所述各学习器214、学习器215是本发明的第一处理部及第二处理部的一例，其种类并无特别限定，除了神经网络以外，例如能够设为：支持向量机(support vectormachine)、自组织映射(self-organizing map)、或者通过强化学习来进行学习的学习器。或者能够使用机械学习以外的其他方法，只要输出运行原语、其顺序、运行参数，则相当于本发明的第一处理部或第二处理部。

尤其关于运行参数决定部213，也可使用遗传算法代替学习器，来决定运行参数。以下，对其一例进行说明。首先，制作将各运行原语的运行参数作为基因来编码的个体。例如，图5的运行(2)可形成具有与(2、2、1)的基因的个体。而且，制作具有多个如上所述的个体的初始集团，算出各个体的评价值。此评价值能够设为与图6所示的评价值相同。而且，基于此评价值，对集团反复进行个体的删除、个体间的交配、基因的突变等，在数代后自集团中选择获得最高的评价值的个体，能够将此基因的运行参数设为运行参数决定部213的输出。利用如上所述的遗传算法来输出的算法也相当于本发明的处理部。

＜8＞

所述实施方式中，在控制装置2设置有运行决定部211、评价部212、及运行参数决定部213，也能够利用运行决定部211及评价部212来构成本发明的控制装置。例如，在将具有多数个行动集的运行原语设定多数个的情况下，也能够不设置运行参数决定部213。在此情况下，评价部212不进行运行原语的评价，仅仅作为对机器人10发出指令的指令部来发挥功能。

＜9＞

所述初始状态(第一状态)及目标状态(第二状态)表示机器人的作业对象的状态，也可将其称为机器人的状态。另外，还能够直接将机器人的状态设为初始状态及目标状态而用于学习器的输入。

＜10＞

本发明的控制装置不仅应用于机器人的控制装置，而且还能够应用于其他的控制或处理。即，也可自规定数量的处理中，选择将处理对象物的第一状态及自此第一状态转变的第二状态设为输入、且为了此转变而对处理对象物进行的处理。关于此方面，与所述运行决定部211的处理相同。而且，能够基于规定的基准，通过与所述运行参数决定部相同的处理来决定所选择的处理的处理参数。

此种处理的例子例如可列举图像处理。作为与运行原语对应的图像处理(基本处理)，例如可列举：高斯滤波器(Gauss filter)、二值化处理、边缘提取处理等。具体的应用对象例如可列举以下例子。

例如考虑如下应用：当输入计算机断层摄影(Computed Tomography，CT)图像时，变换为仅显示骨的部分的图像。在自动地进行此种处理的情况下，将如下的图像处理加以组合：若人写入程序，则例如将图像以某个阈值进行二值化，对经二值化的图像应用收缩膨胀处理(由此，消除如噪声之类的细小区域)，将收缩膨胀处理结果作为掩模来获取与原始图像的图像的积(AND)，由此获得所期望的图像。但是，此时，需要对二值化处理的阈值、或膨胀收缩处理(所谓的开放(opening)处理)的滤波器尺寸、或收缩膨胀次数等参数进行适当调整。若想要实现所述调整，则需要由具有图像处理及编程知识的人编制程序，反复进行参数调整，进行反复试验，以成为所期望的处理结果。对此，若使用本发明，则能够自动决定适当的图像处理滤波器(基本处理)的应用顺序、以及各滤波器的参数(处理参数)。

符号的说明

10：机器人

212：评价部(指令部)

214：第一学习器(第一处理部)

215：第二学习器(第二处理部)

Claims

1.一种机器人的控制装置，控制机器人的运行，所述机器人的控制装置包括：

第一处理部，用以将所述机器人的第一状态及自所述第一状态转变的第二状态设为输入，且将自为了从所述第一状态向所述第二状态转变而所述机器人执行的多个基本运行中选择的至少一个所述基本运行及所述基本运行的运行顺序设为输出，对于各所述基本运行设定规定的运行参数；以及

指令部，基于来自所述第一处理部的输出，而对所述机器人发出运行指令。

2.根据权利要求1所述的机器人的控制装置，还包括：

第二处理部，用以将所述第一状态及所述第二状态设为输入，且将为了从所述第一状态向所述第二状态转变作为所述第一处理部的输出而选择的各所述基本运行的运行参数设为输出，

所述指令部基于来自所述第一处理部及所述第二处理部的输出，而对所述机器人发出运行指令。

3.根据权利要求2所述的机器人的控制装置，其中

构成为：在根据利用所述第一处理部的输出，无法以规定的基准将所述机器人转变为所述第二状态的情况下，利用所述第二处理部来进行所述运行参数的输出。

4.根据权利要求2或3所述的机器人的控制装置，其中

构成为在规定范围内输出所述运行参数。

5.根据权利要求1至3中任一项所述的机器人的控制装置，还包括：

接受部，接受对各所述基本运行的运行参数进行的调整。

6.根据权利要求1至5中任一项所述的机器人的控制装置，还包括：

输入部，接受所述第二状态的指定。

7.根据权利要求1至6中任一项所述的机器人的控制装置，其中

所述第一处理部包括学习完毕的学习器。

8.一种机器人的控制系统，包括：

机器人；以及

如权利要求1至7中任一项所述的所述机器人的控制装置，

所述机器人的控制系统构成为：所述机器人根据来自所述控制装置的所述运行指令而自所述第一状态转变为所述第二状态。

9.一种机器人的控制方法，控制机器人的运行，所述机器人的控制方法包括以下步骤：

准备第一处理部，所述第一处理部用以将所述机器人的第一状态及自所述第一状态转变的第二状态设为输入，且将自为了从所述第一状态向所述第二状态转变而所述机器人执行的多个基本运行中选择的至少一个所述基本运行及所述基本运行的运行顺序设为输出，并且对各所述基本运行设定规定的运行参数；

对所述第一处理部输入规定的所述第一状态及所述第二状态，且输出至少一个所述基本运行及所述基本运行的运行顺序；以及

基于来自所述第一处理部的输出，而对所述机器人发出运行指令。

10.一种控制程序，控制机器人的运行，并且

所述控制程序使计算机执行以下步骤：

11.一种处理装置，用以对处理对象物进行处理，所述处理装置包括：

第一处理部，用以将所述处理对象物的第一状态及自所述第一状态转变的第二状态设为输入，且将自为了从所述第一状态向所述第二状态转变而对所述处理对象物进行的多个基本处理中选择的至少一个所述基本处理及所述基本处理的处理顺序设为输出，并且对各所述基本处理设定规定的处理参数；以及

指令部，基于来自所述第一处理部的输出，而对所述处理对象物进行处理。

12.根据权利要求11所述的处理装置，还包括：

第二处理部，用以将所述处理对象物的第一状态及自所述第一状态转变的第二状态设为输入，且将为了从所述第一状态向所述第二状态转变而作为所述第一处理部的输出而选择的各所述基本处理的处理参数设为输出，并且

所述指令部基于来自所述第一处理部及所述第二处理部的输出，而对所述处理对象物进行处理。

13.根据权利要求12所述的处理装置，其中

构成为：在根据利用所述第一处理部的输出，无法以规定的基准将所述处理对象物转变为所述第二状态的情况下，利用所述第二处理部来进行所述处理参数的输出。

14.根据权利要求12或13所述的处理装置，其中

构成为在规定范围内输出所述处理参数。

15.根据权利要求11至14中任一项所述的处理装置，其中

所述处理为图像处理，

所述多个基本处理是对图像实施的过滤处理。