CN116075782A

CN116075782A - 参数调整装置及参数调整方法

Info

Publication number: CN116075782A
Application number: CN202080103542.5A
Authority: CN
Inventors: 前川清石; 春尾七星
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2020-10-12
Filing date: 2020-10-12
Publication date: 2023-05-05
Also published as: JP7305061B2; WO2022079761A1; JPWO2022079761A1; DE112020007693T5

Abstract

参数调整装置(1)调整由控制装置(5)对控制对象实机(6)进行控制时所使用的控制参数，具有：第1参数调整部(3)，其基于控制对象实机(6)的举动的仿真结果对控制参数进行调整；以及第2参数调整部(4)，其基于控制对象实机(6)的举动对控制参数进行调整，进行使用了通过第1参数调整部(3)得到的控制参数的调整结果即第1调整结果及通过第2参数调整部(4)得到的控制参数的调整结果即第2调整结果之中的至少第1调整结果的学习，生成在控制参数的决定处理中使用的学习模型。

Description

参数调整装置及参数调整方法

技术领域

本发明涉及调整对机器人、工业机械、工作机械、升降机、输送机械等力学系统进行控制时的控制参数的参数调整装置及参数调整方法。

背景技术

在机器人、工业机械、工作机械、升降机、输送机械等力学系统中，以缩短动作时间、提高精度等高性能化为目的，调整了在对力学系统进行控制的控制装置中设定的控制参数。难以实现将力学系统的举动详细地再现的模拟器，因此控制参数的调整是实际上使力学系统动作而对所需的数据进行收集，基于收集到的数据而进行的。为了实现高性能，需要针对由驱动机构的位置、速度、加速度等决定的每个动作条件，单独地对控制参数进行调整。

对控制参数进行调整的现有方法在专利文献1中进行了公开。在专利文献1所记载的调整方法中，在对各动作条件下的控制参数进行调整时，首先，一边在第1范围对控制参数的值进行变更，一边重复进行仿真，提取控制参数的最佳值的候选，接下来，基于在提取出的各候选的附近即第2范围内使实机重复动作而得到的结果，决定控制参数的最佳值。

专利文献1：日本特开2017－102619号公报

发明内容

根据专利文献1所记载的技术，能够削减针对每个动作条件的实机中的用于调整的试行次数，但无法削减通过实机进行调整的动作条件的数量。例如，在一边使停止位置发生各种变动，一边通过实机进行控制参数的调整的情况下，需要高精度地测量实机的停止位置，但用于进行该测量的系统的设置及测定需要时间。因此，无法削减通过实机进行调整的动作条件的数量，无法缩短调整时间。

本发明就是鉴于上述情况而提出的，其目的在于得到能够削减通过实机进行控制参数的调整的动作条件的数量的参数调整装置。

为了解决上述课题，并达到目的，本发明是一种参数调整装置，其调整由控制装置对实机进行控制时所使用的控制参数，该参数调整装置具有：第1参数调整部，其基于实机的举动的仿真结果对控制参数进行调整；以及第2参数调整部，其基于实机的举动对控制参数进行调整。参数调整装置进行使用了通过第1参数调整部得到的控制参数的调整结果即第1调整结果及通过第2参数调整部得到的控制参数的调整结果即第2调整结果之中的至少第1调整结果的学习，生成在控制参数的决定处理中使用的学习模型。

发明的效果

本发明所涉及的参数调整装置具有下述效果，即，能够削减通过实机进行控制参数的调整的动作条件的数量。

附图说明

图1是表示实施方式1所涉及的参数调整装置的结构例的图。

图2是表示参数变换关系学习部的结构例的图。

图3是表示实施方式1所涉及的参数调整装置对控制参数进行调整的动作的一个例子的流程图。

图4是表示参数变换关系学习部的其他结构例的图。

图5是表示实施方式2所涉及的参数调整装置的结构例的图。

图6是表示参数关系学习部的结构例的图。

图7是表示实施方式2所涉及的参数调整装置对控制参数进行调整的动作的一个例子的流程图。

图8是表示参数关系学习部的其他结构例的图。

图9是表示实施方式3所涉及的参数调整装置的结构例的图。

图10是表示规格变换关系学习部的结构例的图。

图11是表示规格变换函数学习部的结构例的图。

图12是表示实施方式3所涉及的参数调整装置对控制参数进行调整的动作的一个例子的流程图。

图13是表示实施方式4所涉及的参数调整装置的结构例的图。

图14是表示校正模型学习部的结构例的图。

图15是表示实施方式4所涉及的参数调整装置对控制参数进行调整的动作的一个例子的流程图。

图16是表示实现参数调整装置的硬件的一个例子的图。

具体实施方式

下面，基于附图，对本发明的实施方式所涉及的参数调整装置及参数调整方法详细地进行说明。

实施方式1.

图1是表示实施方式1所涉及的参数调整装置的结构例的图。本实施方式所涉及的参数调整装置1具有仿真部2、第1参数调整部3、第2参数调整部4、参数变换关系学习部7及参数变换部8。第1参数调整部3、第2参数调整部4、参数变换关系学习部7及参数变换部8构成参数决定部31。

参数调整装置1是调整对控制对象实机6进行控制的控制装置5的控制参数的装置。控制对象实机6是由控制装置5控制的力学系统，是工业用机器人、工业机械、工作机械、升降机等。

在这里，在本实施方式中，参数调整装置1并不限定于构建在控制装置5外部的个人计算机或者服务器中。参数调整装置1也可以构成在控制装置5的内部，也可以构成在云上。仿真部2是将与控制装置5组合时的控制对象实机6的举动在个人计算机等虚拟环境下再现的模拟器。

第1参数调整部3及第2参数调整部4对控制装置5的控制参数进行调整。控制参数的例子是对控制对象实机6即力学系统的驱动轴进行控制的电动机的反馈增益、前馈控制参数、滤波器参数、指令参数等。第1参数调整部3及第2参数调整部4实施这些控制参数中的至少1个调整。

第1参数调整部3将仿真部2作为对象而进行控制参数的调整。具体地说，第1参数调整部3使仿真部2执行对控制对象实机6的举动进行再现的仿真，基于仿真的结果而进行控制参数的调整。另一方面，第2参数调整部4将控制装置5及控制对象实机6作为对象而进行控制参数的调整。具体地说，第2参数调整部4经由控制装置5使控制对象实机6实际上动作，基于动作结果而进行控制参数的调整。第1参数调整部3及第2参数调整部4分别通过试错对调整对象的控制参数的值进行变更，对满足定位时间缩短、轨迹精度提高等目标规格的控制参数的值进行探索。第1参数调整部3及第2参数调整部4在满足目标规格的控制参数的值存在多个的情况下，对最满足目标规格的控制参数的值进行探索。“最满足目标规格”是指与目标规格相应地决定的评价函数变得最小。例如，在目标规格是定位时间缩短的情况下，第1参数调整部3及第2参数调整部4对定位时间变得最短的控制参数进行探索。作为通过第1参数调整部3及第2参数调整部4进行的控制参数的值的探索方法，应用强化学习、被称为粒子群优化的PSO(Particle Swarm Optimization)、贝叶斯优化、网格搜索、被称为遗传算法的GA(Genetic Algorithm)等。

如果控制参数的调整结束，则第1参数调整部3将通过控制参数的调整处理而得到的多个调整结果的一部分输出至参数变换关系学习部7，将剩余输出至参数变换部8。如果控制参数的调整结束，则第2参数调整部4将调整结果输出至参数变换关系学习部7及控制装置5。此外，第1参数调整部3输出的调整结果是第1调整结果，第2参数调整部4输出的调整结果是第2调整结果。

参数变换关系学习部7生成学习模型，该学习模型对由第1参数调整部3及第2参数调整部4在特定的同一动作条件下对控制参数进行调整而得到的调整后的控制参数彼此之间的关系进行学习，用于将由第1参数调整部3调整后的控制参数变换为控制装置5的控制参数。动作条件由动作开始地点及动作结束地点处的力学系统的前端部的位置、动作开始地点及动作结束地点处的构成力学系统的各轴的位置、所设定的最高速度等大于或等于1个动作参数决定。通过对这些各动作参数的值进行变更，从而对动作条件进行变更。

图2是表示参数变换关系学习部7的结构例的图。如图2所示，参数变换关系学习部7是包含神经网络14而构成的。

在参数变换关系学习部7中，将由第1参数调整部3进行了参数调整时的动作条件(以下，设为学习用动作条件)、学习用动作条件下的通过第1参数调整部3得到的调整结果即调整后的控制参数和学习用动作条件下的通过第2参数调整部4得到的调整结果即调整后的控制参数输入至神经网络14。此外，学习用动作条件是在对控制参数进行调整时使用的各种动作条件中的一部分动作条件。神经网络14进行下述学习，即，如果被输入通过第1参数调整部3得到的调整结果及由第1参数调整部3对控制参数进行调整时使用的动作条件，则对在输入的动作条件下的通过第2参数调整部4得到的控制参数的调整结果进行输出。通过第1参数调整部3及第2参数调整部4得到的调整结果的例子是如比例增益、积分增益及微分增益这样的反馈增益、前馈参数、指令中的滤波器的参数、加减速时间等。换言之，第1参数调整部3及第2参数调整部4进行调整的控制参数是如比例增益、积分增益及微分增益这样的反馈增益、前馈参数、指令中的滤波器的参数、加减速时间等。训练好的神经网络14作为学习模型而从参数变换关系学习部7输出至参数变换部8。

参数变换部8对由参数变换关系学习部7生成的学习模型(训练好的神经网络14)进行接收而保存。参数变换部8利用所保存的神经网络，将从第1参数调整部3输出的调整后的控制参数变换为由控制装置5在控制对象实机6的控制时实际使用的控制参数。具体地说，如果第1参数调整部3对控制参数进行了调整时的动作条件及控制参数的调整结果(调整后的控制参数)从第1参数调整部3输出，则参数变换部8对它们进行接收，将接收到的动作条件及调整结果输入至所保存的神经网络，将此时的神经网络的输出作为在从第1参数调整部3接收到的动作条件下对控制对象实机6进行控制时的控制参数而输出至控制装置5。参数变换部8输出的控制参数成为与由第2参数调整部4使控制对象实机6动作而进行调整后的控制参数同等的控制参数。

由以上的第1参数调整部3、第2参数调整部4、参数变换关系学习部7及参数变换部8构成的参数决定部31，基于与由第1参数调整部3对控制参数进行调整的动作相关的第1信息和与由第2参数调整部4对控制参数进行调整的动作相关的第2信息之间的关系进行学习后的结果，针对每个动作条件而决定分别通过多个动作条件使控制对象实机6动作时的控制参数。在本实施方式中，第1参数调整部3在特定动作条件下对控制参数进行调整后的结果是上述第1信息，第2参数调整部4在特定动作条件下对控制参数进行调整后的结果是上述第2信息。

接下来，使用图3对由参数调整装置1对控制参数进行调整时的整体动作进行说明。图3是表示实施方式1所涉及的参数调整装置1对控制参数进行调整的动作的一个例子的流程图。

在参数调整装置1对控制装置5的控制参数进行调整的情况下，首先，执行第1参数调整部3在多样的动作条件下将控制参数导出的第1参数调整步骤(步骤S11)。即，第1参数调整部3一边对动作条件进行变更，一边使仿真部2重复实施仿真，基于仿真的结果对控制参数不断进行更新，由此在各个动作条件下将使控制对象实机6动作时的适当的控制参数针对每个动作条件导出。第1参数调整部3使用PSO、贝叶斯优化、强化学习等方法对由过冲量、建立时间等控制规格构成的评价函数变得最小的控制参数的值进行探索。

接下来，执行第2参数调整部4在特定动作条件下将控制参数导出的第2参数调整步骤(步骤S12)。即，第2参数调整部4使用在上述步骤S11中第1参数调整部3将控制参数导出时所使用的多样的动作条件中的一部分的动作条件即特定动作条件，经由控制装置5使控制对象实机6重复动作。而且，第2参数调整部4基于控制对象实机6的动作结果对控制参数不断进行更新，由此在各个特定动作条件下将使控制对象实机6动作时的适当的控制参数针对每个特定动作条件导出。第2参数调整部4与第1参数调整部3同样地，使用PSO、贝叶斯优化、强化学习等方法，对由过冲量、建立时间等控制规格构成的评价函数变得最小的控制参数的值进行探索。此外，特定动作条件相当于上述的学习用动作条件。

接下来，执行参数变换关系学习部7对在特定动作条件下导出的控制参数彼此的关系进行学习而生成学习模型的学习模型生成步骤(步骤S13)。即，参数变换关系学习部7对在步骤S12中第2参数调整部4将控制参数导出时的动作条件(特定动作条件)、与在步骤S12中第2参数调整部4导出的控制参数和在步骤S11中第1参数调整部3导出的控制参数之中的在特定动作条件下导出的控制参数的之间的关系进行学习，由此生成在通过参数决定部31进行的控制参数的决定处理中使用的学习模型。更详细地说，参数变换关系学习部7以如果第1参数调整部3导出的控制参数及第1参数调整部3将控制参数导出时的动作条件输入至神经网络14，则在输入的动作条件下对与由第2参数调整部4导出的控制参数相同的控制参数进行输出的方式使神经网络14实施学习。如果神经网络14的学习结束，则参数变换关系学习部7将训练好的神经网络14作为学习模型而输出至参数变换部8。

接下来，执行参数变换部8基于由第1参数调整部3调整后的控制参数及学习结果而将实机的控制参数导出的参数变换步骤(步骤S14)。即，参数变换部8从第1参数调整部3对调整后的控制参数及控制参数的调整时所使用的动作条件进行接收，将接收到的控制参数及动作条件输入至从参数变换关系学习部7接收到的训练好的神经网络14。而且，参数变换部8将从训练好的神经网络14输出的控制参数作为由控制装置5对控制对象实机6进行控制时的控制参数即实机的控制参数而输出至控制装置5。

如上所述，第1参数调整部3通过利用了仿真部2的仿真对控制参数进行调整，参数变换部8将调整后的控制参数变换为实机的控制参数。因此，在参数调整装置1中，使控制对象实机6动作而进行控制参数的调整的第2参数调整部4关于控制参数的调整所需的各种动作条件中的一部分动作条件，将控制参数导出，关于剩余的动作条件，将第1参数调整部3通过仿真而导出的控制参数变换为参数变换部8，由此将控制装置5对控制对象实机6进行控制时的控制参数导出。由此，一边对动作条件进行变更，一边使控制对象实机6动作而能够削减将控制参数导出的次数。另外，能够削减控制参数的调整所需的时间。此外，在上述中对在通过第2参数调整部4进行调整后的一部分动作条件下应用第2参数调整部4中的调整结果的事例进行了说明，但关于通过第2参数调整部4进行调整后的动作条件，也将第1参数调整部3通过仿真而导出的控制参数由参数变换部8进行变换，由此可以将控制装置5对控制对象实机6进行控制时的控制参数导出。

图2所示的参数变换关系学习部7构成为，神经网络14对在特定动作条件(学习用动作条件)下由第1参数调整部3及第2参数调整部4各自对控制参数进行调整而得到的调整结果彼此的关系进行学习，但也可以是图4所示的结构。图4是表示参数变换关系学习部7的其他结构例的图。

图4所示的参数变换关系学习部7构成为，神经网络14对在相同的动作条件下第1参数调整部3及第2参数调整部4对控制参数进行了调整时的通过第2参数调整部4得到的调整结果和通过第1参数调整部3得到的调整结果的差进行学习。如图4所示，对神经网络14输入通过第2参数调整部4得到的调整结果和通过第1参数调整部3得到的调整结果的差，并且输入第1参数调整部3及第2参数调整部4对控制参数进行了调整时的动作条件。神经网络14如果被输入动作条件，则以对在输入的动作条件下通过第1参数调整部3及第2参数调整部4对控制参数进行了调整时的通过第2参数调整部4得到的调整结果、和通过第1参数调整部3得到的调整结果的差进行输出的方式进行学习。

图4所示的结构的参数变换关系学习部7与图2所示的结构的参数变换关系学习部7同样地，将训练好的神经网络14作为学习模型而输出至参数变换部8。

参数变换部8从第1参数调整部3接收由第1参数调整部3对控制参数进行了调整时的动作条件及控制参数的调整结果(调整后的控制参数)。参数变换部8将接收到的动作条件输入至所保存的神经网络，将此时的神经网络的输出与从第1参数调整部3接收到的调整后的控制参数相加，生成对控制对象实机6进行控制时的控制参数。参数变换部8将生成的控制参数输出至控制装置5。

如以上所述，本实施方式所涉及的参数调整装置1，在应用了图2所示的结构的参数变换关系学习部7及图4所示的结构的参数变换关系学习部7的任意者的情况下，关于在特定动作条件下由第2参数调整部4对控制参数进行调整而得到的调整结果即调整后的控制参数，均直接发送至控制装置5。另一方面，关于第2参数调整部4不进行控制参数的调整的动作条件下的控制参数，参数变换部8使用由参数变换关系学习部7学习到的神经网络对在特定动作条件以外的动作条件下由第1参数调整部3对控制参数进行调整而得到的调整结果进行变换而导出。参数变换部8将导出的控制参数发送至控制装置5。

本实施方式所涉及的参数调整装置1对通过仿真得到的控制参数的调整结果和实机中的控制参数的调整结果之间的关系进行学习，基于学习结果和通过仿真得到的控制参数的调整结果，决定使控制对象实机6动作而对控制参数进行调整的特定动作条件以外的动作条件的控制参数。因此，得到下述效果，即，能够削减需要使实机动作而进行控制参数的调整的动作条件的数量，能够削减控制参数的调整所需的时间。另外，参数调整装置1关于使实机动作而进行控制参数的调整的特定动作条件以外的动作条件的控制参数，也能够通过仿真而调整为适当的值。

实施方式2.

图5是表示实施方式2所涉及的参数调整装置的结构例的图。此外，在图5中，对与在实施方式1中说明的参数调整装置1(参照图1)共通的结构要素标注有相同标号。另外，图5所示的控制装置5及控制对象实机6与图1所示的控制装置5及控制对象实机6相同，因此省略说明。在本实施方式中，以与实施方式1不同的结构要素及动作为中心进行说明。

实施方式2所涉及的参数调整装置1a将实施方式1所涉及的参数调整装置1的参数决定部31置换为参数决定部32。参数决定部32具有第1参数调整部3、第2参数调整部4、参数关系学习部9及参数变换部10。

第1参数调整部37与实施方式1同样地，关于多个动作条件，分别对控制装置5的控制参数进行调整。在这里，在多个动作条件中包含成为基准的动作条件即第1动作条件。多个动作条件之中的第1动作条件以外的动作条件是第2动作条件。如果与多个动作条件各自有关的控制参数的调整结束，则第1参数调整部3将调整结果输出至参数关系学习部9。另一方面，第2参数调整部4在第1动作条件下进行控制参数的调整，将调整结果输出至控制装置5及参数变换部10。

参数关系学习部9基于通过第1参数调整部3得到的控制参数的调整结果，对第1动作条件下的调整结果和第2动作条件下的调整结果之间的关系进行学习。参数关系学习部9在学习动作中，生成用于根据由第2参数调整部4在第1动作条件下对控制参数进行调整后的结果而导出第2动作条件下的控制参数的调整结果的学习模型。

图6是表示参数关系学习部9的结构例的图。如图6所示，参数关系学习部9与在实施方式1中说明的参数变换关系学习部7同样地，是包含神经网络14而构成的。

在参数关系学习部9中，将由第1参数调整部3进行了参数调整时的第2动作条件和第1动作条件的差、及第2动作条件下的调整结果和第1动作条件下的调整结果的差输入至神经网络14。神经网络14以如果被输入第2动作条件和第1动作条件的差，则对第2动作条件下的调整结果和第1动作条件下的调整结果的差进行输出的方式进行学习。训练好的神经网络14作为学习模型而从参数关系学习部9输出至参数变换部10。

参数变换部10对由参数关系学习部9生成的学习模型(训练好的神经网络14)进行接收而保存。参数变换部10利用所保存的神经网络，将从第2参数调整部4输出的第1动作条件中的控制参数的调整结果变换为控制装置5在控制对象实机6的控制中实际上使用的控制参数。具体地说，参数变换部10将第2动作条件和第1动作条件的差输入至所保存的神经网络，将此时的神经网络的输出与从第2参数调整部4输入的第1动作条件下的控制参数的调整结果相加，将相加后的结果作为在第2动作条件下对控制对象实机6进行控制时的控制参数而输出至控制装置5。参数变换部10输出的控制参数成为与由第2参数调整部4在第2动作条件下使控制对象实机6动作而进行调整后的控制参数同等的控制参数。

此外，在本实施方式中，仅第1参数调整部3进行控制参数的调整的第2动作条件(特定动作条件)是参数决定部32决定控制参数时所使用的第1信息。另外，第2参数调整部4进行控制参数的调整的第1动作条件(不符合特定动作条件的动作条件)是参数决定部32决定控制参数时所使用的第2信息。

接下来，使用图7对由参数调整装置1a对控制参数进行调整时的整体动作进行说明。图7是表示实施方式2所涉及的参数调整装置1a对控制参数进行调整的动作的一个例子的流程图。

在参数调整装置1a对控制装置5的控制参数进行调整的情况下，首先，第1参数调整部3在多样的动作条件下将控制参数导出(步骤S11)。该处理是与在实施方式1中说明的图3的步骤S11相同的处理。

接下来，第2参数调整部4在特定动作条件下将控制参数导出(步骤S12)。该步骤S12中的特定动作条件是上述的第1动作条件。即，第2参数调整部4使用在上述的步骤S11中第1参数调整部3将控制参数导出时所使用的多样的动作条件中的基准的动作条件即第1动作条件，经由控制装置5使控制对象实机6重复动作。而且，第2参数调整部4基于控制对象实机6的动作结果对控制参数不断进行更新，由此将在第1动作条件下使控制对象实机6动作时的适当的控制参数导出。此外，第1动作条件即特定动作条件也可以从多样的动作条件中任意地选择。

接下来，执行参数关系学习部9对通过第1参数调整部3得到的特定动作条件下的调整结果和其他动作条件下的调整结果之间的关系进行学习而生成学习模型的学习模型生成步骤(步骤S21)。具体地说，参数关系学习部9对由第1参数调整部3进行了参数调整时的特定动作条件以外的动作条件和特定动作条件的差与通过第1参数调整部3得到的特定动作条件以外的动作条件下的控制参数的调整结果和特定动作条件下的控制参数的调整结果的差之间的关系进行学习，由此生成在通过参数决定部32进行的控制参数的决定处理中使用的学习模型。更详细地说，如果由第1参数调整部3进行了控制参数的调整时的特定动作条件以外的动作条件和特定动作条件的差输入至神经网络14，则参数关系学习部9以对通过第1参数调整部3得到的特定动作条件以外的动作条件下的控制参数的调整结果和特定动作条件下的控制参数的调整结果的差进行输出的方式，使神经网络14实施学习。如果神经网络14的学习结束，则参数关系学习部9将训练好的神经网络14作为学习模型而输出至参数变换部10。

接下来，执行参数变换部10基于由第2参数调整部4调整后的控制参数及学习结果而将实机的控制参数导出的参数变换步骤(步骤S22)。即，参数变换部10从第2参数调整部4对调整后的控制参数及控制参数的调整时所使用的特定动作条件进行接收，将接收到的特定动作条件和特定动作条件以外的动作条件的差输入至从参数关系学习部9接收到的训练好的神经网络14。而且，参数变换部10将训练好的神经网络14的输出与从第2参数调整部4输出的控制参数的调整结果相加，将相加后的结果作为由控制装置5对控制对象实机6进行控制时的控制参数即实机的控制参数而输出至控制装置5。

如上所述，第1参数调整部3通过利用了仿真部2的仿真对控制参数进行调整，参数变换部10将调整后的控制参数变换为实机的控制参数。因此，在参数调整装置1a中，使控制对象实机6动作而进行控制参数的调整的第2参数调整部4关于控制参数的调整所需的各种动作条件中的一部分的动作条件即第1动作条件而将控制参数导出，关于剩余的动作条件即第2动作条件，参数变换部8对第1参数调整部3通过仿真而导出的控制参数进行变换，由此将由控制装置5对控制对象实机6进行控制时的控制参数导出。由此，能够一边对动作条件进行变更，一边使控制对象实机6动作而削减将控制参数导出的次数。另外，能够削减控制参数的调整所需的时间。

图6所示的参数关系学习部9构成为神经网络14对多个动作条件中的第2动作条件下的通过第1参数调整部3得到的调整结果和第1动作条件下的通过第1参数调整部3得到的调整结果的差进行学习，但也可以是图8所示的结构。图8是表示参数关系学习部9的其他结构例的图。

图8所示的参数关系学习部9具有：除法部18，其对第1动作条件下的通过第1参数调整部3得到的调整结果和第2动作条件下的通过第1参数调整部3得到的调整结果的比进行计算；以及神经网络14，其对由除法部18计算出的比进行学习。如图8所示，向神经网络14输入第2动作条件和第1动作条件的差，并且输入第1动作条件下的通过第1参数调整部3得到的调整结果和第2动作条件下的通过第1参数调整部3得到的调整结果的比。神经网络14以如果被输入第2动作条件和第1动作条件的差，则对第1动作条件下的控制参数的调整结果和第2动作条件下的控制参数的调整结果的比进行输出的方式进行学习。

图8所示的结构的参数关系学习部9与图6所示的结构的参数关系学习部9同样地，将训练好的神经网络14作为学习模型而输出至参数变换部10。

如果从第2参数调整部4接收到由第2参数调整部4通过第1动作条件对控制参数进行调整后的结果，则参数变换部10将第1动作条件和第2动作条件的差输入至所保存的神经网络，将此时的神经网络的输出与从第2参数调整部4接收到的调整后的控制参数相乘，生成对控制对象实机6进行控制时的控制参数。参数变换部10将生成的控制参数输出至控制装置5。

如以上所述，本实施方式所涉及的参数调整装置1a，在应用图6所示的结构的参数关系学习部9及图8所示的结构的参数关系学习部9的任意者的情况下，关于在第1动作条件下由第2参数调整部4对控制参数进行调整而得到的调整结果即调整后的控制参数，都直接发送至控制装置5。另一方面，关于第2参数调整部4不进行控制参数的调整的第2动作条件下的控制参数，参数变换部10使用由参数关系学习部9学习到的神经网络，对在第2动作条件下由第1参数调整部3对控制参数进行调整而得到的调整结果进行变换而导出。参数变换部10将导出的控制参数发送至控制装置5。

本实施方式所涉及的参数调整装置1a对基准的动作条件即第1动作条件下的通过仿真得到的控制参数的调整结果和第2动作条件下的通过仿真得到的控制参数的调整结果之间的关系进行学习，基于学习结果和第1动作条件下的通过实机得到的控制参数的调整结果，决定第2动作条件的控制参数。因此，得到下述效果，即，能够削减需要通过实机进行调整的动作条件的数量，能够削减控制参数的调整所需的时间。另外，参数调整装置1a关于使实机动作而进行控制参数的调整的第1动作条件以外的第2动作条件的控制参数，也能够通过仿真而调整为适当的值。

实施方式3.

图9是表示实施方式3所涉及的参数调整装置的结构例的图。此外，在图9中，对与在实施方式1中说明的参数调整装置1(参照图1)共通的结构要素标注有相同标号。另外，图9所示的控制装置5及控制对象实机6与图1所示的控制装置5及控制对象实机6相同，因此省略说明。在本实施方式中，以与实施方式1不同的结构要素及动作为中心进行说明。

实施方式3所涉及的参数调整装置1b将实施方式1所涉及的参数调整装置1的参数决定部31置换为参数决定部33。参数决定部33具有第1参数调整部3、第2参数调整部4、规格变换关系学习部11及规格变换部12。

第1参数调整部3与实施方式1同样地，关于多个动作条件分别对控制装置5的控制参数进行调整。如果与多个动作条件各自相关的控制参数的调整结束，则第1参数调整部3将调整后的控制参数输出至控制装置5。此外，第1参数调整部3在控制规格由规格变换部12调整为适当的值的状态下对控制参数进行调整。在这里，控制规格是如建立时间及过冲量这样的成为控制参数的调整的指针的值。详细内容在后面记述，规格变换部12基于由规格变换关系学习部11生成的学习模型和第1参数调整部3在控制参数的调整中使用的动作条件，生成第1参数调整部3所使用的调整后的控制规格。

第2参数调整部4关于多个动作条件中的一部分的动作条件，使用实机进行控制参数的调整。如果控制参数的调整完成，则第2参数调整部4将控制参数的调整结果、调整所使用的动作条件及控制规格输出至规格变换关系学习部11。第2参数调整部4关于控制参数的调整结果，在规格变换关系学习部11的基础上还输出至控制装置5。

规格变换关系学习部11对由第1参数调整部3调整控制参数时的控制规格和由第2参数调整部4调整控制参数时的控制规格之间的关系进行学习。具体地说，规格变换关系学习部11对由第1参数调整部3及第2参数调整部4在相同的动作条件下对控制参数进行调整后的结果变得同等的情况下的第1参数调整部3的控制规格和第2参数调整部4的控制规格之间的关系进行学习。规格变换关系学习部11在学习动作中，生成用于从第2参数调整部4的控制规格将第1参数调整部3的控制规格导出的学习模型。

图10是表示规格变换关系学习部11的结构例的图。如图10所示，规格变换关系学习部11具有控制规格值学习部15及规格变换函数学习部16。

控制规格值学习部15对由第1参数调整部3对控制参数进行调整时所使用的控制规格的值(以下，设为控制规格值)进行调整。具体地说，控制规格值学习部15以通过第1参数调整部3得到的控制参数的调整结果和通过第2参数调整部4得到的控制参数的调整结果变得同等的方式，对第1参数调整部3所使用的控制规格值进行调整。控制规格值学习部15按照以下方式对第1参数调整部3所使用的控制规格值进行调整。首先，控制规格值学习部15将第2参数调整部4在控制参数的调整时使用的控制规格值、即从第2参数调整部4输出的控制规格的值作为初始值而输出至第1参数调整部3。第1参数调整部3使用从控制规格值学习部15输入的控制规格值进行控制参数的调整，将调整结果输出至控制规格值学习部15。接下来，控制规格值学习部15对从第1参数调整部3输出的调整结果和通过第2参数调整部4得到的调整结果进行比较，以通过第1参数调整部3得到的调整结果和通过第2参数调整部4得到的调整结果的差变小的方式，对输出至第1参数调整部3的控制规格值进行更新。控制规格值学习部15使用PSO、GA、贝叶斯优化等对控制规格值进行更新。更新后的控制规格值输出至第1参数调整部3，第1参数调整部3使用更新后的控制规格值而再次对控制参数进行调整，将调整结果输出至控制规格值学习部15。控制规格值学习部15重复执行如上所述的动作，如果通过第1参数调整部3得到的调整结果和通过第2参数调整部4得到的调整结果的差小于或等于设定的规定值，则完成学习，作为学习到的第1参数调整部3的控制规格值而输出至规格变换函数学习部16。

图11是表示规格变换函数学习部16的结构例的图。如图11所示，规格变换函数学习部16是包含神经网络14而构成的。在规格变换函数学习部16中，将第1参数调整部3的控制规格值和第2参数调整部4的控制规格值的差与第2参数调整部4的动作条件输入至神经网络14。神经网络14进行如果被输入动作条件，则对第1参数调整部3的控制规格值和第2参数调整部4的控制规格值的差进行输出那样的学习。训练好的神经网络14作为学习模型而从规格变换关系学习部11输出至规格变换部12。

规格变换部12对由规格变换关系学习部11生成的学习模型(训练好的神经网络14)进行接收而保存。另外，向规格变换部12输入由第1参数调整部3对控制参数进行调整时所使用的动作条件及控制规格值。如果从第1参数调整部3输入动作条件及控制规格值，则规格变换部12利用所保存的神经网络，根据输入的动作条件及控制规格值，生成由第1参数调整部3对控制参数进行调整时所使用的调整后的控制规格值。具体地说，规格变换部12将动作条件输入至所保存的神经网络，将此时的神经网络的输出与从第1参数调整部3输入的控制规格值相加，生成调整后的控制规格值。规格变换部12将调整后的控制规格值输出至第1参数调整部3。第1参数调整部3使用从规格变换部12输入的调整后的控制规格值对控制参数进行调整，将调整后的控制参数发送至控制装置5。

此外，在本实施方式中，第1参数调整部3的控制规格值是由参数决定部33决定控制参数时所使用的第1信息，第2参数调整部4的控制规格值是由参数决定部33决定控制参数时所使用的第2信息。

接下来，使用图12对由参数调整装置1b对控制参数进行调整时的整体动作进行说明。图12是表示实施方式3所涉及的参数调整装置1b对控制参数进行调整的动作的一个例子的流程图。

在由参数调整装置1b对控制装置5的控制参数进行调整的情况下，首先，第2参数调整部4在特定动作条件下将控制参数导出(步骤S12)。该处理是与在实施方式1中说明的图3的步骤S12相同的处理。

接下来，规格变换关系学习部11基于第2参数调整部4的控制规格值和通过第2参数调整部4得到的控制参数的调整结果，将第1参数调整部3的控制规格值导出(步骤S31)。具体地说，规格变换关系学习部11的控制规格值学习部15通过与第2参数调整部4在步骤S12中将控制参数导出时的特定动作条件相同的动作条件，使第1参数调整部3重复执行控制参数的调整，以通过第1参数调整部3得到的调整结果与通过第2参数调整部4得到的调整结果接近的方式对控制规格值不断进行更新，由此将与特定动作条件相对应的第1参数调整部3的控制规格值导出。与特定动作条件相对应的第1参数调整部3的控制规格值是第1参数调整部3通过特定动作条件对控制参数进行调整时所使用的控制规格值。如上所述，控制规格值学习部15在控制规格值的更新中使用PSO、GA、贝叶斯优化等。

接下来，执行规格变换关系学习部11对动作条件、第1参数调整部3的控制规格值和第2参数调整部4的控制规格值之间的关系进行学习而生成学习模型的学习模型生成步骤(步骤S32)。在这里的第1参数调整部3的控制规格值是通过步骤S31导出的控制规格值。在步骤S32中，具体地说，规格变换关系学习部11的规格变换函数学习部16对第2参数调整部4的动作条件与第1参数调整部3的控制规格值和第2参数调整部4的控制规格值的差之间的关系进行学习，由此生成在通过参数决定部33进行的控制参数的决定处理中使用的学习模型。更详细地说，如果动作条件输入至神经网络14，则规格变换函数学习部16以对第1参数调整部3的控制规格值和第2参数调整部4的控制规格值的差进行输出的方式使神经网络14实施学习。如果通过规格变换函数学习部16进行的神经网络14的学习结束，则规格变换关系学习部11将训练好的神经网络14作为学习模型而输出至规格变换部12。

接下来，执行规格变换部12基于通过规格变换关系学习部11得到的学习结果而将第1参数调整部3的控制规格值导出的规格变换步骤(步骤S33)。具体地说，规格变换部12取得由第1参数调整部3对控制参数进行调整的动作条件，将所取得的动作条件输入至从规格变换关系学习部11接收到的训练好的神经网络14。而且，规格变换部12将训练好的神经网络14的输出与第2参数调整部4所对应的控制规格值相加，将相加结果作为第1参数调整部3的控制规格值而输出至第1参数调整部3。在这里，输入至训练好的神经网络14的动作条件由用户指定。即，规格变换部12从用户接收动作条件的指定，将接收到的动作条件设为向训练好的神经网络14的输入。此外，从用户接收指定的动作条件是对控制参数进行调整时所使用的多个动作条件之中的与在上述的步骤S12中由第2参数调整部4将控制参数导出的特定动作条件不符合的动作条件。另外，第2参数调整部4所对应的控制规格值是在通过向训练好的神经网络14输入的动作条件由第2参数调整部4对控制参数进行调整的情况下第2参数调整部4所使用的控制规格值。该控制规格值可以是规格变换部12接收来自用户的输入而取得，也可以是规格变换部12从第2参数调整部4取得相应的控制规格值。

接下来，执行第1参数调整部3使用由规格变换部12导出的控制规格值，将实机的控制参数导出的控制参数生成步骤(步骤S34)。即，第1参数调整部3基于使用由规格变换部12导出的控制规格值而由仿真部2执行仿真后的结果，将控制参数导出。

如以上所述，本实施方式所涉及的参数调整装置1b，关于第2参数调整部4在特定动作条件下对控制参数进行调整而得到的调整结果即调整后的控制参数，直接发送至控制装置5。另一方面，关于第2参数调整部4不进行控制参数的调整的动作条件下的控制参数，使用基于对第1参数调整部3的控制规格值、第2参数调整部4的控制规格值和动作条件之间的关系进行学习得到的结果而导出的控制规格值而由第1参数调整部3进行调整。此外，对关于在上述中第2参数调整部4在特定动作条件下对控制参数进行调整而得到的调整结果即调整后的控制参数，直接发送至控制装置5的事例进行了说明，但在由第2参数调整部4进行了调整的特定动作条件的情况下，也可以使用基于对第1参数调整部3的控制规格值、第2参数调整部4的控制规格值和动作条件之间的关系进行学习得到的结果而导出的控制规格值而由第1参数调整部3进行调整。

本实施方式所涉及的参数调整装置1b，对以实机中的控制参数的调整结果和通过仿真得到的控制参数的调整结果的差小于或等于规定值的方式变换控制规格值的规格变换关系进行学习，基于学习结果，将通过仿真进行的控制参数的调整中使用的控制规格值导出，因此能够通过经由仿真实施的调整动作而得到与实机中的控制参数的调整结果同等的调整结果。另外，得到下述效果，即，能够削减需要通过实机进行调整的动作条件的数量，能够削减控制参数的调整所需的时间。

实施方式4.

图13是表示实施方式4所涉及的参数调整装置的结构例的图。此外，在图13中，对与在实施方式1中说明的参数调整装置1(参照图1)共通的结构要素标注有相同标号。另外，图13所示的控制装置5及控制对象实机6与图1所示的控制装置5及控制对象实机6相同，因此省略说明。在本实施方式中，以与实施方式1不同的结构要素及动作为中心进行说明。

实施方式4所涉及的参数调整装置1c将实施方式1所涉及的参数调整装置1的参数决定部31置换为参数决定部34。参数决定部34具有第1参数调整部3、第2参数调整部4及校正模型学习部13。在本实施方式中，构成仿真部2的模拟器在内部具有用于减小第1参数调整部3的调整结果和第2参数调整部4的调整结果的差的校正模型。

第1参数调整部3与实施方式1同样地，关于多个动作条件，分别对控制装置5的控制参数进行调整。此外，第1参数调整部3对控制参数进行调整时所利用的仿真部2所具有的校正模型由校正模型学习部13生成。详细内容在后面记述，第1参数调整部3直至由校正模型学习部13用于创建校正模型的学习完成为止的期间，将控制参数的调整结果(调整后的控制参数)输出至校正模型学习部13。第1参数调整部3在由校正模型学习部13用于创建校正模型的学习完成后，将与多个动作条件分别有关的控制参数的调整结果输出至控制装置5。

第2参数调整部4关于多个动作条件中的一部分的动作条件，使用实机进行控制参数的调整。如果控制参数的调整完成，则第2参数调整部4将控制参数的调整结果及调整所使用的动作条件输出至校正模型学习部13。第2参数调整部4关于控制参数的调整结果，在校正模型学习部13的基础上还输出至控制装置5。

校正模型学习部13对通过第1参数调整部3得到的控制参数的调整结果和通过第2参数调整部4得到的控制参数的调整结果之间的关系进行学习，生成构成仿真部2的校正模型。

图14是表示校正模型学习部13的结构例的图。如图13所示，校正模型学习部13是包含校正模型参数学习部17而构成的。

校正模型参数学习部17在内部存储有校正模型的参数(以下，设为校正模型参数)的初始值，通过以下所示的顺序而生成校正模型。首先，校正模型参数学习部17将由第2参数调整部4对控制参数进行调整时所使用的动作条件输出至第1参数调整部3而对控制参数的调整进行指示，并且将所存储的校正模型参数的初始值输出至仿真部2。第1参数调整部3使用从校正模型参数学习部17输入的各个动作条件而实施控制参数的调整，将调整结果输出至校正模型参数学习部17。如果通过第1参数调整部3进行的控制参数的调整结束，则校正模型参数学习部17以通过第2参数调整部4得到的调整结果和通过第1参数调整部3得到的调整结果的差变小的方式对发送至仿真部2的校正模型参数进行更新。校正模型参数学习部17使用PSO、GA、贝叶斯优化等对校正模型参数进行更新。接下来，校正模型参数学习部17将更新后的校正模型参数发送至仿真部2，并且对第1参数调整部3指示控制参数的再调整。接收到该指示的第1参数调整部3实施控制参数的再调整，将调整结果输出至校正模型参数学习部17。校正模型参数学习部17重复执行如上所述的动作，如果通过第1参数调整部3得到的调整结果和通过第2参数调整部4得到的调整结果的差小于或等于设定的规定值，则完成学习，将该时刻的校正模型参数作为最终的校正模型参数而输出至仿真部2。

此外，在本实施方式中，第1参数调整部3在特定动作条件下对控制参数进行调整后的结果是由参数决定部34决定控制参数时所使用的第1信息，第2参数调整部4在特定动作条件对控制参数进行调整后的结果是由参数决定部34决定控制参数时所使用的第2信息。

接下来，使用图15对由参数调整装置1c对控制参数进行调整时的整体动作进行说明。图15是表示实施方式4所涉及的参数调整装置1c对控制参数进行调整的动作的一个例子的流程图。

在参数调整装置1c对控制装置5的控制参数进行调整的情况下，首先，第2参数调整部4在特定动作条件下将控制参数导出(步骤S12)。该处理是与在实施方式1中说明的图3的步骤S12相同的处理。

接下来，校正模型学习部13基于通过第2参数调整部4得到的控制参数的调整结果和由第2参数调整部4对控制参数进行了调整时的动作条件，对仿真部2的校正模型参数进行更新，由此生成在通过参数决定部34进行的控制参数的决定处理中使用的学习模型(步骤S41)。该步骤S41是学习模型生成步骤。即，校正模型学习部13以相同的动作条件下的通过第1参数调整部3得到的控制参数的调整结果和通过第2参数调整部4得到的控制参数的调整结果的差小于或等于规定值的方式探索而决定仿真部2的校正模型参数。对校正模型参数进行探索是由上述的校正模型参数学习部17进行的。

接下来，执行第1参数调整部3将实机的控制参数导出的控制参数生成步骤(步骤S42)。即，第1参数调整部3使在步骤S41中对内部的校正模型的参数进行更新后的状态的仿真部2执行各种动作条件下的仿真，基于仿真的结果对控制参数进行调整。如果控制参数的调整结束，则第1参数调整部3将调整结果输出至控制装置5。

如以上所述，本实施方式所涉及的参数调整装置1c关于第2参数调整部4在特定动作条件下对控制参数进行调整而得到的调整结果即调整后的控制参数，直接发送至控制装置5。另一方面，关于第2参数调整部4不进行控制参数的调整的动作条件下的控制参数，第1参数调整部3基于仿真部2中的仿真结果而进行调整，该仿真部2具有以通过实机得到的控制参数的调整结果和通过仿真得到的控制参数的调整结果的差变小的方式对参数进行学习得到的校正模型。此外，对关于在上述中第2参数调整部4在特定动作条件下对控制参数进行调整而得到的调整结果即调整后的控制参数，直接发送至控制装置5的事例进行了说明，但在由第2参数调整部4进行了调整的特定动作条件的情况下，第1参数调整部3也可以基于仿真部2中的仿真结果而进行调整，该仿真部2具有以通过实机得到的控制参数的调整结果和通过仿真得到的控制参数的调整结果的差变小的方式对参数进行学习得到的校正模型。

本实施方式所涉及的参数调整装置1c，使用以实机中的控制参数的调整结果和通过仿真得到的控制参数的调整结果小于或等于规定值的方式对参数进行调整后的校正模型而进行仿真，能够基于仿真结果对控制参数进行调整，因此得到下述效果，即，能够削减需要通过实机进行调整的动作条件的数量，能够削减控制参数的调整所需的时间。另外，参数调整装置1c关于使实机动作而进行控制参数的调整的特定动作条件以外的动作条件的控制参数，也能够通过仿真而调整为适当的值。

接下来，对上述各实施方式所涉及的参数调整装置(参数调整装置1、1a、1b、1c)的硬件结构进行说明。各参数调整装置(参数调整装置1、1a、1b、1c)的硬件结构相同，因此作为一个例子，对实施方式1所涉及的参数调整装置1的硬件结构进行说明。图16是表示实现参数调整装置1的硬件的一个例子的图。

实施方式1所涉及的参数调整装置1能够通过运算装置101、存储装置102及接口电路103实现。运算装置101的例子是CPU(也称为Central Processing Unit、中央处理装置、处理装置、运算装置、微处理器、微型计算机、DSP(Digital Signal Processor))、系统LSI(Large Scale Integration)等。存储装置102的例子是RAM(Random Access Memory)、ROM(Read Only Memory)、硬盘驱动器、SSD(Solid State Drive)、可装卸的存储器器件或者它们的组合。

参数调整装置1的仿真部2、第1参数调整部3、第2参数调整部4、参数变换关系学习部7及参数变换部8是运算装置101执行用于作为这些各部进行动作的程序而实现的。用于作为仿真部2、第1参数调整部3、第2参数调整部4、参数变换关系学习部7及参数变换部8进行动作的程序预先储存于存储装置102。运算装置101从存储装置102读出而执行上述程序，由此作为仿真部2、第1参数调整部3、第2参数调整部4、参数变换关系学习部7及参数变换部8进行动作。

存储装置102还作为对上述程序进行保存，并且由运算装置101执行各种处理时的暂时存储器使用。接口电路103在参数调整装置1与控制装置5之间对数据进行收发时被使用。

此外，用于作为参数调整装置1的各部进行动作的上述程序预先储存于存储装置102，但并不限定于此。上述程序可以是在写入至CD(Compact Disc)－ROM、DVD(DigitalVersatile Disc)－ROM等记录介质的状态下供给至用户，由用户安装于存储装置102的方式。另外，上述程序也可以是经由互联网等网络而提供给用户的方式。

此外，在上述各实施方式中，由第2参数调整部4对与需要控制参数的调整的多个动作条件的一部分即特定动作条件有关的控制参数进行调整，由第1参数调整部3对与剩余的动作条件有关的控制参数进行调整，但也可以是由第1参数调整部3对与全部动作条件有关的控制参数进行调整。即，可以是通过第2参数调整部4得到的与特定动作条件有关的控制参数的调整结果仅在各实施方式所说明的生成学习模型的学习动作中使用。

以上的实施方式所示的结构表示一个例子，也能够与其他公知技术组合，也能够将实施方式彼此组合，在不脱离主旨的范围也能够将结构的一部分省略、变更。

标号的说明

1、1a、1b、1c参数调整装置，2仿真部，3第1参数调整部，4第2参数调整部，5控制装置，6控制对象实机，7参数变换关系学习部，8、10参数变换部，9参数关系学习部，11规格变换关系学习部，12规格变换部，13校正模型学习部，14神经网络，15控制规格值学习部，16规格变换函数学习部，17校正模型参数学习部，18除法部，31、32、33、34参数决定部。

Claims

1.一种参数调整装置，其调整由控制装置对实机进行控制时所使用的控制参数，

该参数调整装置的特征在于，具有：

第1参数调整部，其基于所述实机的举动的仿真结果对所述控制参数进行调整；以及

第2参数调整部，其基于所述实机的举动对所述控制参数进行调整，

进行使用了通过所述第1参数调整部得到的所述控制参数的调整结果即第1调整结果、及通过所述第2参数调整部得到的所述控制参数的调整结果即第2调整结果之中的至少所述第1调整结果的学习，生成在所述控制参数的决定处理中使用的学习模型。

2.根据权利要求1所述的参数调整装置，其特征在于，

具有：

参数变换关系学习部，其对所述第1调整结果和所述第2调整结果之间的关系进行学习而生成所述学习模型；以及

参数变换部，其基于所述学习模型对所述第1调整结果进行变换而生成所述控制参数。

3.根据权利要求1所述的参数调整装置，其特征在于，

具有：

参数关系学习部，其对所述第1调整结果之中的基于由所述第2参数调整部对所述控制参数进行调整时使所述实机动作的动作条件即特定动作条件下的仿真结果的第1调整结果、和所述第1调整结果之中的基于与所述特定动作条件不符合的动作条件下的仿真结果的第1调整结果之间的关系进行学习而生成所述学习模型；以及

参数变换部，其基于所述学习模型对所述第2调整结果进行变换而生成所述控制参数。

4.根据权利要求1所述的参数调整装置，其特征在于，

具有：

规格变换关系学习部，其对所述第1参数调整部及所述第2参数调整部在相同的动作条件下对所述控制参数进行了调整时的所述第1调整结果和所述第2调整结果变得同等的情况下的、由所述第1参数调整部对所述控制参数进行调整时的控制规格值和由所述第2参数调整部对所述控制参数进行调整时的控制规格值之间的关系进行学习而生成所述学习模型；以及

规格变换部，其基于由所述第1参数调整部进行所述控制参数的调整的动作条件和所述学习模型而生成所述第1参数调整部的控制规格值，

所述第1参数调整部使用由所述规格变换部生成的所述控制规格值，进行基于所述仿真结果的所述控制参数的调整，生成所述控制参数。

5.根据权利要求1所述的参数调整装置，其特征在于，

所述学习模型是所述实机的举动的仿真所使用的校正模型，

该参数调整装置具有校正模型学习部，该校正模型学习部基于所述第1调整结果及所述第2调整结果，以所述第1调整结果和所述第2调整结果的差变小的方式对所述校正模型的参数进行更新，

所述第1参数调整部基于使用了所述参数的更新完成后的所述校正模型的仿真结果而生成所述控制参数。

6.一种参数调整方法，其使参数调整装置调整由控制装置对实机进行控制时所使用的控制参数，

该参数调整方法的特征在于，包含：

第1参数调整步骤，基于所述实机的举动的仿真结果而对所述控制参数进行调整；

第2参数调整步骤，基于所述实机的举动而对所述控制参数进行调整；以及

学习模型生成步骤，其进行使用了所述第1参数调整步骤中的所述控制参数的调整结果即第1调整结果及所述第2参数调整步骤中的所述控制参数的调整结果即第2调整结果之中的至少所述第1调整结果的学习，生成在所述控制参数的决定处理中使用的学习模型。

7.根据权利要求6所述的参数调整方法，其特征在于，

在所述学习模型生成步骤中，对所述第1调整结果和所述第2调整结果之间的关系进行学习而生成所述学习模型，

该参数调整方法包含参数变换步骤，即，基于所述学习模型对所述第1调整结果进行变换而生成所述控制参数。

8.根据权利要求6所述的参数调整方法，其特征在于，

在所述学习模型生成步骤中，对所述第1调整结果之中的基于通过所述第2参数调整步骤对所述控制参数进行调整时使所述实机动作的动作条件即特定动作条件下的仿真结果的第1调整结果和所述第1调整结果之中的基于与所述特定动作条件不符合的动作条件下的仿真结果的第1调整结果之间的关系进行学习而生成所述学习模型，

该参数调整方法包含参数变换步骤，即，基于所述学习模型对所述第2调整结果进行变换而生成所述控制参数。

9.根据权利要求6所述的参数调整方法，其特征在于，

所述学习模型生成步骤对在所述第1参数调整步骤及所述第2参数调整步骤中在相同的动作条件下对所述控制参数进行了调整时的所述第1调整结果和所述第2调整结果变得同等的情况下的、在所述第1参数调整步骤中对所述控制参数进行调整时的控制规格值和在所述第2参数调整步骤中对所述控制参数进行调整时的控制规格值之间的关系进行学习而生成所述学习模型，

该参数调整方法包含：

规格变换步骤，基于在所述第1参数调整步骤中进行所述控制参数的调整的动作条件和所述学习模型，基于所述仿真结果而生成对所述控制参数进行调整时所使用的控制规格值；以及

控制参数生成步骤，使用通过所述规格变换步骤生成的所述控制规格值而进行基于所述仿真结果的所述控制参数的调整，生成所述控制参数。

10.根据权利要求6所述的参数调整方法，其特征在于，

所述学习模型是所述实机的举动的仿真所使用的校正模型，

在所述学习模型生成步骤中，基于所述第1调整结果及所述第2调整结果，以所述第1调整结果和所述第2调整结果的差变小的方式对所述校正模型的参数进行更新，

该参数调整方法包含控制参数生成步骤，即，基于使用了所述参数的更新完成后的所述校正模型的仿真结果而生成所述控制参数。