CN116796853A

CN116796853A - 模型验证装置、模型验证方法和非临时性计算机可读介质

Info

Publication number: CN116796853A
Application number: CN202310280150.1A
Authority: CN
Inventors: 高见豪; 冈本浩実; 佐藤正彦; 藤井英幸; 神宫善行; 御供颂弘
Original assignee: Yokogawa Electric Corp
Current assignee: Yokogawa Electric Corp
Priority date: 2022-03-22
Filing date: 2023-03-21
Publication date: 2023-09-22
Also published as: JP7444186B2; US20230305501A1; JP2023140233A; EP4249179A1

Abstract

本发明提供模型验证装置、模型验证方法和非临时性计算机可读介质，所述模型验证装置包括：模型存储部，存储使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的机器学习模型，所述学习样本包含表示设置有控制对象的所述设备的状态的状态数据、以及表示用于确定提供给所述控制对象的操作量的行为的行为数据；学习范围确定部，确定表示所述学习样本的范围的学习范围；验证数据取得部，取得所述学习范围外的表示所述设备的多个状态的验证数据；以及验证结果输出部，根据输入了所述验证数据，输出表示所述机器学习模型输出的多个行为的验证结果。

Description

模型验证装置、模型验证方法和非临时性计算机可读介质

技术领域

本发明涉及模型验证装置、模型验证方法和非临时性计算机可读介质。

背景技术

在专利文献1中记载了“在画面上显示所记录的控制规则…”。在专利文献2中记载了“基于事例的模型”。在专利文献3中记载了“自主学习型控制器”。在专利文献4中记载了“监视学习的状况”。在专利文献5中记载了“向操作员提示控制对象的操作量”。

现有技术文献

专利文献1：日本专利公开公报特开2019-159876

专利文献2：日本专利公开公报特开2007-156881

专利文献3：日本专利公开公报特开2015-028783

专利文献4：日本专利公开公报特开2018-106466

专利文献5：日本专利公开公报特开2021-137748

发明内容

在本发明的第一方式中提供一种模型验证装置。所述模型验证装置可以包括模型存储部，所述模型存储部存储使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的机器学习模型，所述学习样本包含表示设置有控制对象的所述设备的状态的状态数据、以及表示用于确定提供给所述控制对象的操作量的行为的行为数据。所述模型验证装置可以包括确定表示所述学习样本的范围的学习范围的学习范围确定部。所述模型验证装置可以包括验证数据取得部，所述验证数据取得部取得所述学习范围外的表示所述设备的多个状态的验证数据。所述模型验证装置可以包括验证结果输出部，所述验证结果输出部根据输入了所述验证数据，输出表示所述机器学习模型输出的多个行为的验证结果。

所述验证结果输出部可以将所述学习范围内的行为与所述验证结果一起输出。

所述验证结果输出部可以将所述验证结果以能够区别于所述学习范围内的行为的方式输出。

所述验证结果输出部可以输出将所述多个行为与所述多个状态对应的行为映射。

所述验证结果输出部可以输出将所述多个行为与所述设备的多个物理量所涉及的所述多个状态对应的行为映射。

所述验证结果输出部可以将所述多个行为根据行为的内容以不同的浓度来输出。

所述验证结果输出部可以将所述多个行为根据行为的内容以不同的颜色来输出。

所述模型验证装置可以还包括指定表示所述验证数据的范围的验证范围的验证范围指定部。所述模型验证装置可以还包括基于所述验证范围生成所述验证数据的验证数据生成部。

所述模型验证装置可以还包括取得成为所述学习样本的样本数据的样本数据取得部。所述模型验证装置可以还包括通过使用所述学习样本的机器学习来生成所述机器学习模型的模型生成部。

所述模型验证装置可以还包括根据输出了所述验证结果而接受用户输入的用户输入部。

所述模型验证装置可以还包括根据所述用户输入而输出所述机器学习模型的模型输出部。

所述模型验证装置可以还包括控制部，所述控制部根据所述用户输入，开始使用所述机器学习模型的所述控制对象的控制。

在本发明的第二方式中提供一种模型验证方法。所述模型验证方法可以包括存储使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的机器学习模型，所述学习样本包含表示设置有控制对象的所述设备的状态的状态数据、以及表示用于确定提供给所述控制对象的操作量的行为的行为数据。所述模型验证方法可以包括确定表示所述学习样本的范围的学习范围。所述模型验证方法可以包括取得所述学习范围外的表示所述设备的多个状态的验证数据。所述模型验证方法可以包括根据输入了所述验证数据，输出表示所述机器学习模型输出的多个行为的验证结果。

在本发明的第三方式中提供一种记录有模型验证程序的非临时性计算机可读介质。所述模型验证程序可以由计算机执行。所述计算机可以通过执行所述模型验证程序而发挥作为模型存储部的功能，所述模型存储部存储使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的机器学习模型，所述学习样本包含表示设置有控制对象的所述设备的状态的状态数据、以及表示用于确定提供给所述控制对象的操作量的行为的行为数据。所述计算机可以通过执行所述模型验证程序而发挥作为学习范围确定部的功能，所述学习范围确定部确定表示所述学习样本的范围的学习范围。所述计算机可以通过执行所述模型验证程序而发挥作为验证数据取得部的功能，所述验证数据取得部取得所述学习范围外的表示所述设备的多个状态的验证数据。所述计算机可以通过执行所述模型验证程序而发挥作为验证结果输出部的功能，所述验证结果输出部根据输入了所述验证数据，输出表示所述机器学习模型输出的多个行为的验证结果。

另外，上述发明的概要没有列举出本发明的所有特征。此外，这些特征组的子组合也可以成为发明。

附图说明

图1示出第一实施方式的模型验证装置100的模块图的一例。

图2示出作为模型验证装置100的验证对象的机器学习模型115所具有的表的一例。

图3示出表示学习范围内的机器学习模型115的输出的行为映射的一例。

图4示出模型验证装置100验证机器学习模型115的流程的一例。

图5示出模型验证装置100输出的验证结果的第一例。

图6示出模型验证装置100输出的验证结果的第二例。

图7示出模型验证装置100输出的验证结果的第三例。

图8示出模型验证装置100输出的验证结果的第四例。

图9示出第二实施方式的模型验证装置100的模块图的一例。

图10示出第三实施方式的模型验证装置100的模块图的一例。

图11示出第四实施方式的模型验证装置100的模块图的一例。

图12示出第五实施方式的模型验证装置100的模块图的一例。

图13示出可以整体或局部实现本发明的多种方式的计算机9900的例子。

附图标记说明

100模型验证装置，110模型存储部，115机器学习模型，120学习范围确定部，130验证数据取得部，140验证结果输出部，610验证范围指定部，620验证数据生成部，710样本数据取得部，720模型生成部，810用户输入部，820模型输出部，910状态数据取得部，920控制部，9900计算机，9901DVD-ROM，9910主控制器，9912CPU，9914RAM，9916图形控制器，9918显示装置，9920输入/输出控制器，9922通信接口，9924硬盘驱动器，9926DVD驱动器，9930ROM，9940输入/输出芯片，9942键盘。

具体实施方式

下面，通过发明的实施方式对本发明进行说明，但是以下的实施方式并不限定权利要求书所涉及的发明。此外，在实施方式中说明的特征的组合的全部并不是发明的解决手段所必须的。

图1示出第一实施方式的模型验证装置100的模块图的一例。模型验证装置100为了控制设置于设备的控制对象而验证使用学习样本进行了机器学习的模型。此时，模型验证装置100验证作为验证对象的模型在学习样本的范围外输出何种行为并输出结果。

设备是设置有控制对象的设施或装置等。例如，设备可以是工厂，也可以是将多个仪器复合的复合装置。作为工厂，除了化学或生物等工业工厂以外，还可以列举对气田或油田等井口及其周边进行管理控制的工厂、对水力、火力、原子能等发电进行管理控制的工厂、对太阳光或风力等环境发电进行管理控制的工厂、以及对上下水或水坝等进行管理控制的工厂等。

在此之前，作为一例说明设备是作为工艺装置之一的三段水槽的情况。三段水槽是如下循环系统：利用泵从储水水箱抽水，向第三段(最上方)的水槽(也称为“上段水箱”)注入水，水依次流向第二段(正中间)的水槽(也称为“中段水箱”)、第一段(最下方)的水槽(也称为“下段水箱”)，并再次返回到储水水箱。在这样的三段水槽中，作为一例，为了以将第一段水槽的水位调整为任意值(例如30)为目标来控制向第三段水槽注入的水的流量，对设置于从储水水箱到第三段水槽之间的控制路径的阀进行开闭控制。

控制对象是设置于设备并成为控制的对象的仪器和装置等。例如，控制对象可以是对设备的工序中的物体的量、温度、压力、流量、速度和pH等中的至少一个物理量进行控制的阀、加热器、电动机、风扇和开关等执行器，执行与操作量MV(Manipulated Variable)对应的所需要的操作。作为一例，在设备是三段水槽的情况下，控制对象可以是设置于控制路径的阀。

在设置有这种控制对象的设备中可以设置能够测量设备的内外的各种状态(物理量)的一个或多个传感器。作为一例，在设备是三段水槽的情况下，传感器可以输出测量了各水槽的水位、控制路径的流量等的测量值PV(Process Variable过程变量)。在表示设备的状态的状态数据中可以包含这样的测量值PV。此外，在状态数据中可以包含表示作为控制对象的阀的开闭度的操作量MV。在状态数据中，除了表示以上述方式控制了控制对象的结果的运转状态的运转数据以外，还可以包含表示设备中的能量或原材料的消耗量的消耗量数据、表示能够对控制对象的控制作为干扰而起作用的物理量的干扰环境数据等。

在三段水槽中，在对作为控制对象的阀进行开闭控制时使用PID(ProportionalIntegral Differential比例积分微分)控制的情况下，有时发生过冲，直到第一段水槽的水位达到例如设为目标值DV(Desired Variable)的±5％以内的制定值为止需要较长的时间。因此，在对这样的阀进行开闭控制时，考虑使用由机器学习生成的机器学习模型。作为一例，模型验证装置100可以将为了在这样的三段水槽中控制阀的开闭而进行了机器学习的机器学习模型作为验证对象。

模型验证装置100可以是PC(个人计算机)、平板型计算机、智能手机、工作站、服务器计算机或通用计算机等计算机，也可以是连接有多个计算机的计算机系统。这样的计算机系统是广义的计算机。此外，模型验证装置100也可以通过在计算机内能够执行的一个或多个虚拟计算机环境来实现。代替于此，模型验证装置100可以是设计为机器学习模型的验证用的专用计算机，也可以是由专用电路实现的专用硬件。此外，在模型验证装置100能够与网络连接的情况下，模型验证装置100也可以通过云计算来实现。

模型验证装置100包括模型存储部110、学习范围确定部120、验证数据取得部130和验证结果输出部140。另外，这些模块是在功能上分别分离的功能模块，并且可以不必与实际的设备构成一致。即，在本图中，虽然表示为一个模块，但是其也可以不一定由一个设备构成。此外，在本图中，虽然表示为不同的模块，但是它们也可以不一定由不同的设备构成。

模型存储部110存储机器学习模型115。机器学习模型115是使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的模型，该学习样本包含表示设置有控制对象的设备的状态的状态数据、以及表示用于确定提供给控制对象的操作量MV的行为的行为数据。在此，这样的机器学习模型115可以是其他装置通过机器学习而生成的，也可以如后所述是模型验证装置100自身通过机器学习而生成的。

在机器学习模型115中保存根据状态来确定行为的策略(policy)。作为一例，机器学习模型115可以具有保存了多个样本数据作为学习样本的表。这样的表可以由设备的状态与用于确定提供给控制对象的操作量MV的行为的组合以及针对该组合的权重而构成。在后面说明表的详细情况。

在这样的机器学习模型115中，例如可以以如下方式输出与设备的状态对应的行为。机器学习模型115可以针对输入的状态数据与包含在选项中的各行为的组合，在与保存于表的各样本数据之间进行内核(kernel)计算，分别计算与各样本数据之间的距离。接着，机器学习模型115可以将对各样本数据计算出的距离乘以各自的权重后的结果依次相加，按每个组合计算评价值。并且，机器学习模型115可以选择评价值最高的组合下的行为作为下一行为并输出。

此外，可以基于以上述方式选择的行为来执行强化学习。作为一例，可以基于各样本数据以及针对该样本数据的回报值，通过KDPP(Kernel Dynamic Policy Programming内核动态策略编程)等现有算法来执行强化学习。此时，基于控制对象被操作的设备的下一状态，评价被选择的行为并计算回报值。在此，作为一例，在以将第一段水槽的水位调整为任意值为目标的情况下，可以以第一段水槽的水位中的测量值PV越接近目标值DV则回报值越高的方式设定回报函数。并且，可以以进一步提高由一系列的行为得到的回报的方式更新机器学习模型115。即，为了机器学习模型115容易输出进一步提高回报的行为，除了覆盖保存于表的针对各样本数据的权重以外，也可以将迄今为止未保存的新的样本数据作为学习样本追加到表中。

学习范围确定部120确定表示学习样本的范围的学习范围。学习范围确定部120例如可以访问模型存储部110。并且，学习范围确定部120可以对保存于机器学习模型115的表的学习样本进行统计处理，确定学习样本的范围是从哪里到哪里的范围。学习范围确定部120将所确定的学习范围的信息供给到验证数据取得部130。

验证数据取得部130取得学习范围外的表示设备的多个状态的验证数据。验证数据取得部130能够基于从学习范围确定部120供给的信息来识别学习范围。因此，验证数据取得部130可以基于这样的信息，取得学习范围外的表示设备的多个状态的验证数据。验证数据取得部130将取得的验证数据输入到机器学习模型115。

验证结果输出部140根据输入了验证数据，输出表示机器学习模型115输出的多个行为的验证结果。

图2示出模型验证装置100的作为验证对象的机器学习模型115所具有的表的一例。如本图所示，这样的表可以由设备的状态与行为的组合以及针对该组合的权重构成。在此，不同的标签可以分别对应于表示设备的状态S的多个物理量。在本图中，作为一例，标签“LI003”、标签“LI002”和标签“LI001”分别对应于上段水箱、中段水箱和下段水箱的水位数据。此外，标签“FI001”对应于控制路径的流量数据。此外，标签“V001”对应于作为控制对象的阀的开度数据、即操作量MV。

在此，本表中的第一行表示关于时间a的数据。在这种情况下，时间a的设备的状态可以表示为状态数据Sa＝(31.02，30.67，35.23，47.21，50)。此外，本表中的第二行表示关于接着时间a的时间b的数据。在这种情况下，时间b的设备的状态可以表示为状态数据Sb＝(29.17，30.15，32.89，44.19，47)。因此，能够使用这样的状态数据S按时间序列表示设备的状态。

此外，用于确定提供给控制对象的操作量MV的行为可以表示为操作量MV的变更量。例如，在操作量MV(即标签“V001”)在时间a是50，并且操作量MV在接着时间a的时间b是47的情况下，表示了如下情况：从时间a到时间b，操作量MV从50的状态变化为47的状态。在此，如果从时间b的操作量MV＝47中减去时间a的操作量MV＝50，则操作变更量ΔMV＝-3。在这种情况下，时间a处的行为可以表示为行为数据Aa＝-3。这意味着，在时间a，在上段水箱水位为31.02％、中段水箱水位为30.67％、下段水箱水位为35.23％、控制路径的流量为47.21％的状态下，采取了控制作为控制对象的阀从50％旋转-3％(例如，绕作为关闭阀的方向的顺时针方向3％)的行为。同样，在操作量MV在接着时间b的时间c处为46的情况下，如果从时间c处的操作量MV＝46中减去时间b处的操作量MV＝47，则操作变更量ΔMV＝-1。在这种情况下，时间b处的行为可以表示为行为数据Ab＝-1。因此，能够使用这样的行为数据A按时间序列表示用于确定操作量MV的行为。

由此，在机器学习模型115所具有的表中可以保存多个样本数据作为学习样本，各个样本数据由状态数据S＝(LI003，LI002，LI001，FI001，V001)与行为数据A＝ΔMV的组合以及表示针对该组合的权重的权重数据W构成。另外，保存于表的这些值例如可以通过％等比例来表示，也可以通过绝对值等来表示。

图3示出表示学习范围内的机器学习模型115的输出的行为映射的一例。在本图中，横轴表示LI001、即下段水箱的水位。在此，在本图中，横轴表示20～40的范围，这是指表示学习样本的范围的学习范围是LI001＝20～40。

此外，纵轴表示FI001、即控制路径的流量。在此，在本图中，纵轴表示40.0～64.0的范围，这是指表示学习样本的范围的学习范围是FI001＝40.0～64.0。

并且，在本图中，在学习范围内，机器学习模型115输出的行为被映射到以LI001为列、以FI001为行的各单元。此后，将这样的行为的表示方法称为“行为映射”。在后面说明行为映射的详细情况。

在这样的机器学习模型115中，在输入了处于学习范围外的状态数据的情况下，输出何种行为是不明确的。因此，在控制对象的控制中使用这样的机器学习模型115的情况下，根据处于学习范围外的状态数据的输入而输出机器学习模型115不期望的行为，这有可能对设备造成不良影响。这种影响特别是在要求安全、安心的工厂中进行作业时可能变得非常严重。因此，模型验证装置100验证这样的机器学习模型115。使用流程对此进行详细说明。

图4示出模型验证装置100验证机器学习模型115的流程的一例。在步骤S410中，模型验证装置100存储机器学习模型115。例如，模型验证装置100经由网络、各种存储设备或用户输入等，取得其他装置通过机器学习而生成的机器学习模型115。这样的机器学习模型115可以是如上所述使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的模型，该学习样本包含表示设置有控制对象的设备的状态的状态数据、以及表示用于确定提供给控制对象的操作量MV的行为的行为数据。并且，模型存储部110存储这样的机器学习模型115。

在步骤S420中，模型验证装置100确定学习范围。例如，学习范围确定部120确定表示学习样本的范围的学习范围。作为一例，学习范围确定部120可以访问模型存储部110。并且，学习范围确定部120也可以对在步骤S410中存储的机器学习模型115的表中保存的学习样本进行统计处理，确定学习样本的范围是从哪里到哪里的范围。

此时，学习范围确定部120可以对作为学习样本保存的样本数据中包含的状态数据按每个物理量进行统计处理。即，学习范围确定部120对样本数据中包含的LI001进行统计处理。在此，LI001的最小值为20.0，最大值为40.0。在这种情况下，学习范围确定部120可以确定为LI001的学习范围是LI001＝20.0～40.0。

同样，学习范围确定部120对样本数据中包含的FI001进行统计处理。在此，FI001的最小值为40.0，最大值为64.0。在这种情况下，学习范围确定部120可以确定为FI001的学习范围是FI001＝40.0～64.0。学习范围确定部120可以对其他物理量、即LI002、LI003、V001同样地确定学习范围。

另外，在上述说明中，作为一例表示了学习范围确定部120使用最小值和最大值来确定学习范围的情况，但是并不限定于此。学习范围确定部120例如也可以使用偏差等其他统计量来确定学习范围。作为一例，学习范围确定部120也可以针对至少任意一个物理量，将平均-3σ～平均+3σ的范围确定为学习范围。

此外，在上述说明中，作为一例表示了学习范围为连续的一个范围的情况，但是学习范围也可以是离散的多个范围。学习范围确定部120例如能够以上述方式按每个物理量来确定表示学习样本的范围的学习范围。学习范围确定部120将所确定的学习范围的信息供给到验证数据取得部130。

在步骤S430中，模型验证装置100取得验证数据。例如，验证数据取得部130取得学习范围外的表示设备的多个状态的验证数据。作为一例，验证数据取得部130可以输出表示在步骤S420中确定的学习范围的信息，促使用户输入不包含在学习范围内的设备的状态。据此，用户可以输入关心的范围中的不包含在学习范围内的设备的多个状态。例如，验证数据取得部130可以在监视器上显示表示学习范围为LI001＝20.0～40.0、FI001＝40.0～64.0的画面。据此，用户可以输入关心的LI001＝10.0～70.0、FI001＝30.0～65.0的范围内的除了学习范围的范围中的设备的多个状态。验证数据取得部130也可以对其他物理量同样地取得验证数据。

但是，并不限定于此。验证数据取得部130也可以将表示学习范围的信息发送到设备或其他装置，并且请求不包含在学习范围内的设备的状态。据此，设备或其他装置也可以回答不包含在学习范围内的设备的多个状态。验证数据取得部130例如能够以上述方式取得验证数据。

在步骤S440中，模型验证装置100将验证数据输入到机器学习模型115。例如，验证数据取得部130将在步骤S430中取得的验证数据输入到在步骤S410中存储的机器学习模型115。据此，机器学习模型115分别输出与验证数据中包含的多个状态对应的多个行为。

作为一例，模型验证装置100将(LI003，LI002，LI001，FI001，V001)＝(38，39，44，65，68)的验证数据输入到机器学习模型115。据此，机器学习模型115输出“-3”(将阀关闭3％)作为行为。同样，模型验证装置100将(LI003，LI002，LI001，FI001，V001)＝(20，28，18，35，39)的验证数据输入到机器学习模型115。据此，机器学习模型115输出“3”(将阀打开3％)作为行为。

在步骤S450中，模型验证装置100输出验证结果。例如，验证结果输出部140取得在步骤S440中机器学习模型115分别输出的多个行为。并且，验证结果输出部140可以在监视器上显示输出表示所取得的多个行为的验证结果。但是，并不限定于此。验证结果输出部140可以通过扬声器将验证结果进行语音输出，可以通过打印机进行打印输出，也可以向其他装置进行发送输出。由此，验证结果输出部140可以根据输入了验证数据，输出表示机器学习模型115输出的多个行为的验证结果。

图5示出模型验证装置100输出的验证结果的第一例。例如，模型验证装置100可以与图3同样地将验证结果输出为行为映射。此时，验证结果输出部140可以与验证结果一起输出学习范围内的行为。即，验证结果输出部140可以与学习范围外的行为一起一并输出学习范围内的行为。在此，在本图中，由粗线包围的区域表示学习范围内。并且，由粗线包围的区域之外表示学习范围外。由此，验证结果输出部140只要将验证结果以能够与学习范围内的行为区别的方式输出即可。

在本图中，横轴与图3同样地表示LI001、即下段水箱的水位。在此，在本图中，横轴表示10.0～70.0的范围。这是指在LI001中，验证数据的范围为LI001＝10.0～70.0。

此外，纵轴与图3同样地表示FI001、即控制路径的流量。在此，在本图中，纵轴表示30.0～65.0的范围。这是指在FI001中，验证数据的范围为FI001＝30.0～65.0。

并且，在本图中，与图3同样，机器学习模型115输出的行为被映射到以LI001为列、以FI001为行的各单元。即，在将包含列所示的LI001和行所示的FI001的状态数据S＝(LI003，LI002，LI001，FI001，V001)输入到机器学习模型115的情况下，各单元分别表示机器学习模型115输出的行为数据A＝ΔMV。由此，验证结果输出部140可以输出将多个行为与多个状态对应的行为映射。此外，验证结果输出部140可以输出将多个行为与设备的多个物理量(在本图中为LI001和FI001)所涉及的多个状态对应的行为映射。

此时，如本图所示，验证结果输出部140可以将多个行为根据行为的内容以不同的浓度来输出。例如，作为机器学习模型115输出的行为的选项，使用[-3，-1，0，1，3]这五个选项、即[关闭3％、关闭1％、不变更、打开1％、打开3％]这五个选项。在这种情况下，验证结果输出部140也可以使作为行为而输出“-3”或“-1”的(即输出关闭阀的行为的)概率越高的单元越浓，使作为行为而输出“3”或“1”的(即输出打开阀的行为的)概率越高的单元越淡等，将机器学习模型115输出的行为根据行为的内容以阶段性的浓度来输出。

代替于此或在此基础上，验证结果输出部140也可以将多个行为根据行为的内容以不同的颜色来输出。例如，验证结果输出部140也可以将作为行为而输出“-3”的单元设为蓝色，将输出“-1”的单元设为淡蓝色，将输出“0”的单元设为绿色，将输出“1”的单元设为黄绿色，将输出“3”的单元设为黄色等，将机器学习模型115输出的行为根据行为的内容以不同的颜色来输出。

另外，在上述说明中，作为一例表示了模型验证装置100采用将横轴作为LI001、将纵轴作为FI001的行为映射的情况。但是，并不限定于此。模型验证装置100也可以采用将横轴和纵轴的至少任意一个作为其他物理量的行为映射。但是，在以将特定的物理量调整为任意值为目标来进行控制的情况下，优选采用至少包含该特定的物理量的行为映射。此外，在上述说明中，作为一例表示了模型验证装置100采用了二维的行为映射的情况。但是，并不限定于此。模型验证装置100也可以采用包含三个以上的物理量的多维的行为映射。

图6示出模型验证装置100输出的验证结果的第二例。在本图中，纵轴表示LI003、即上段水箱的水位。其他定义与图5相同。即，在本图中，机器学习模型115输出的行为被映射到以LI001为列、以LI003为行的各单元。

图7示出模型验证装置100输出的验证结果的第三例。在本图中，纵轴表示LI002、即中段水箱的水位。其他定义与图5相同。即，在本图中，机器学习模型115输出的行为被映射到以LI001为列、以LI002为行的各单元。

图8示出模型验证装置100输出的验证结果的第四例。在本图中，纵轴表示V001、即阀的开度。其他定义与图5相同。即，在本图中，机器学习模型115输出的行为被映射到以LI001为列、以V001为行的各单元。

验证结果输出部140例如可以输出这种由多个物理量的不同组合构成的多个行为映射。此时，验证结果输出部140可以在一个画面上显示多个行为映射，也可以根据用户输入依次切换显示行为映射。

一般来说，在三段水槽的特性上，下段水箱的水位比阀操作延迟。此外，上段水箱的水位、中段水箱的水位延迟而影响下段水箱的水位。因此，难以把握这样的控制系统中的趋势。

相对于此，模型验证装置100为了控制设置于设备的控制对象而验证使用学习样本进行了机器学习的机器学习模型115。此时，模型验证装置100验证机器学习模型115在学习样本的范围外输出何种行为并输出结果。由此，根据模型验证装置100，能够向用户提示机器学习模型115在学习样本的范围外输出何种行为。因此，在使用机器学习模型115对控制对象进行控制之前，通过使用这样的模型验证装置100，能够事先防止对设备造成不良影响。此外，即使在使用机器学习模型115的控制下，也能够通过使用这样的模型验证装置100，例如有效地用于设备发生异常时的原因查明。这样的效果特别是在要求安全、安心的工厂中进行作业的方面是非常有用的。

此外，模型验证装置100不仅输出验证结果、即学习范围外的行为，还可以输出学习范围内的行为。由此，模型验证装置100能够向用户通知，随着设备的状态从学习范围内向外，机器学习模型115输出的行为如何变化。此时，模型验证装置100可以将学习范围外的行为以能够区别于学习范围内的行为的方式输出。由此，根据模型验证装置100，能够向用户通知，到哪个范围为止是学习范围内，从哪个范围开始是学习范围外。

此外，模型验证装置100可以将验证结果输出为使多个状态与多个行为对应的行为映射。由此，根据模型验证装置100能够将机器学习模型115针对设备的状态不同的多个情况分别输出何种行为，一并向用户通知。此时，模型验证装置100可以将验证结果输出为使多个行为与设备的多个物理量所涉及的多个状态对应的行为映射。在机器学习模型115输出的行为依赖于多个物理量(例如水位和流量等)的状态的情况下，这样的行为映射是特别有用的。

此外，模型验证装置100在将多个行为作为行为映射来输出时，可以根据行为的内容以不同的浓度或颜色来输出。由此，根据模型验证装置100，能够以视觉方式向用户通知机器学习模型115输出的行为的差异。在装置只能输出单色、黑白或灰度的情况下，以不同浓度输出是特别有用的。此外，在机器学习模型115输出的行为的选项多的情况或想要提高视觉辨认性的情况下，以不同颜色输出是特别有用的。

在这样的行为映射中，可以认为作为一个指标，优选例如在设备的状态接近目标值的范围内，关闭阀的行为和打开阀的行为以大致相同程度的概率出现，在远离目标值的范围内，只有关闭阀的行为或打开阀的行为一律出现。因此，观察到这样的行为映射的用户根据行为映射中的阶段性的变化，能够比较容易判断机器学习模型115在学习范围外是否输出所期望的行为。并且，在判断为机器学习模型115未输出所期望的行为的情况下，用户能够指示机器学习模型115的再学习。

图9示出第二实施方式的模型验证装置100的模块图的一例。在图9中，对具有与图1相同的功能和构成的构件标注相同的附图标记，并且除了以下不同点以外省略说明。在上述实施方式中，作为一例表示了模型验证装置100从外部(用户、设备等)取得验证数据的情况，但是在本实施方式中，模型验证装置100自身生成验证数据。本实施方式的模型验证装置100除了上述实施方式的模型验证装置100所具备的功能部以外，还包括验证范围指定部610和验证数据生成部620。在本实施方式中，学习范围确定部120将所确定的学习范围的信息供给到验证范围指定部610。

验证范围指定部610指定表示验证数据的范围的验证范围。验证范围指定部610能够基于从学习范围确定部120供给的信息来识别学习范围。因此，验证范围指定部610可以基于这样的信息来指定表示验证数据的范围的验证范围。例如，验证范围指定部610可以基于学习范围确定部120确定的学习范围和预先确定的验证余量M来指定验证范围。作为一例，在学习范围确定部120将“最小值”～“最大值”的范围确定为学习范围的情况下，验证范围指定部610可以将“最小值-M”～“最大值+M”的范围中的不包含在学习范围内的范围指定为验证范围。此外，在学习范围确定部120将“平均-3σ”～“平均+3σ”的范围确定为学习范围的情况下，验证范围指定部610可以将“平均-(3+M)σ”～“平均+(3+M)σ”的范围中的不包含在学习范围内的范围指定为验证范围。验证范围指定部610例如能够以上述方式指定验证范围。此外，验证范围指定部610也可以一并指定验证范围的分辨率、即将验证范围分割为几部分等。验证范围指定部610将所指定的验证范围的信息供给到验证数据生成部620。

验证数据生成部620基于验证范围生成验证数据。例如，验证数据生成部620可以通过在指定的验证范围内随机地或网罗性地产生多个状态数据来生成验证数据。代替于此或在此基础上，验证数据生成部620也可以通过从已经取得的状态数据中提取验证范围中包含的多个状态数据来生成验证数据。验证数据生成部620将所生成的验证数据输入到机器学习模型115。此后的处理可以与第一实施方式相同，因此在此省略说明。

由此，本实施方式的模型验证装置100自身生成用于验证机器学习模型115的验证数据。由此，根据本实施方式的模型验证装置100，不从外部取得验证数据，就能够在自身装置内完成并验证机器学习模型。

图10示出第三实施方式的模型验证装置100的模块图的一例。在图10中，对具有与图1相同的功能和构成的构件标注相同的附图标记，并且除了以下不同点以外省略说明。在上述实施方式中，作为一例表示了模型验证装置100存储由其他装置生成的机器学习模型的情况，但是在本实施方式中，模型验证装置100自身生成机器学习模型。本实施方式的模型验证装置100除了上述实施方式的模型验证装置100所具备的功能部以外，还包括样本数据取得部710和模型生成部720。

样本数据取得部710取得成为学习样本的样本数据。例如，样本数据取得部710取得状态数据S＝(LI003，LI002，LI001，FI001，V001)。此时，样本数据取得部710可以经由网络、用户输入或各种存储设备中的至少任意一个来取得状态数据。并且，样本数据取得部710可以根据所取得的状态数据中包含的操作量MV(即V001)来计算行为数据。另外，在上述说明中，作为一例表示了样本数据取得部710从所取得的状态数据中二次取得行为数据的情况，但是样本数据取得部710也可以与状态数据同样地直接取得行为数据。样本数据取得部710将所取得的样本数据供给到模型生成部720。

模型生成部720通过使用学习样本的机器学习来生成机器学习模型115。例如，模型生成部720将从样本数据取得部710供给的样本数据作为学习样本来使用并进行机器学习，由此生成机器学习模型115。机器学习的详细情况可以如上所述，因此在此省略详细说明。模型生成部720将所生成的机器学习模型115供给到模型存储部110。因此，在本实施方式中，模型存储部110存储模型验证装置100自身通过机器学习而生成的机器学习模型115。即，在本实施方式中，模型验证装置100将自身生成的机器学习模型115作为验证对象。

由此，本实施方式的模型验证装置100通过使用了学习样本的机器学习，由自身生成机器学习模型115。由此，根据本实施方式的模型验证装置100，能够将自身通过机器学习生成的机器学习模型115作为验证的对象，并且能够在一个装置内完成生成机器学习模型115的功能和验证机器学习模型115的功能。

图11示出第四实施方式的模型验证装置100的模块图的一例。在图11中，对具有与图1相同的功能和构成的构件标注相同的附图标记，并且除了以下不同点以外省略说明。在上述实施方式中，作为一例表示了模型验证装置100具有到输出机器学习模型115的验证结果为止的功能的情况，但是在本实施方式中，模型验证装置100还具有根据用户输入而输出机器学习模型115的功能。本实施方式的模型验证装置100除了上述实施方式的模型验证装置100所具备的功能部以外，还具备用户输入部810和模型输出部820。

用户输入部810根据输出了验证结果而接受用户输入。例如，用户输入部810根据验证结果输出部140输出作为验证对象的机器学习模型115的验证结果，接受表示该机器学习模型115的有效性的用户输入。并且，在用户输入部810经由键盘或鼠标等输入了机器学习模型115有效的情况下，将该意思通知给模型输出部820。

模型输出部820根据用户输入而输出机器学习模型。例如，在模型输出部820从用户输入部810被通知了机器学习模型115有效的情况下，将存储于模型存储部110的机器学习模型115输出到承担控制对象的控制的控制装置(未图示)。此时，模型输出部820可以通过将存储于模型存储部110的机器学习模型115移动到控制装置来进行输出，也可以通过将存储于模型存储部110的机器学习模型115复制到控制装置来进行输出。

由此，本实施方式的模型验证装置100根据用户输入而输出机器学习模型115。由此，根据本实施方式的模型验证装置100，观察到验证结果的用户能够将判断为机器学习模型115有效作为触发，将该机器学习模型115提供给承担控制对象的控制的控制装置。

图12示出第五实施方式的模型验证装置100的模块图的一例。在图12中，对具有与图11相同的功能和构成的构件标注相同的附图标记，并且除了以下不同点以外省略说明。在第四实施方式中，作为一例表示了模型验证装置100对承担控制对象的控制的其他控制装置输出机器学习模型115的情况，但是在第五实施方式中，模型验证装置100自身对控制对象进行控制。本实施方式的模型验证装置100还具备状态数据取得部910和控制部920，以替代模型输出部820。

状态数据取得部910按时间序列取得表示设备的状态的状态数据。例如，状态数据取得部910可以将状态数据S＝(LI003，LI002，LI001，FI001，V001)经由网络从设备按时间序列取得。状态数据取得部910将所取得的状态数据依次供给到控制部920。

控制部920根据用户输入，开始使用了机器学习模型的控制对象的控制。例如，在控制部920从用户输入部810被通知了机器学习模型115有效的情况下，将从状态数据取得部910供给的状态数据输入到存储于模型存储部110的机器学习模型115。并且，控制部920将把机器学习模型115输出的行为加到当前操作量MV(即V001)后的新的操作量MV提供给控制对象。由此，控制部920使用机器学习模型对控制对象进行控制。另外，这样的控制部920与其他功能部可以一体构成，也可以分体(例如其他功能部由云执行等)构成。

由此，本实施方式的模型验证装置100根据用户输入，开始使用了机器学习模型115的控制对象的控制。由此，根据本实施方式的模型验证装置100，观察到验证结果的用户能够将判断为机器学习模型115有效作为触发，作为所谓的AI控制器发挥功能，实际控制控制对象。

本发明的各种实施方式可以参照流程图和模块图进行记载，在此模块可以表示(1)执行操作的过程的阶段或(2)具有执行操作的作用的装置的部分。特定的阶段和部分可以通过专用电路、与存储在计算机可读介质上的计算机可读指令一起供给的可编程电路和/或与存储在计算机可读介质上的计算机可读指令一起供给的处理器来实现。专用电路可以包括数字和/或模拟硬件电路，也可以包括集成电路(IC)和/或分立电路。可编程电路可以包括可重构硬件电路，该可重构硬件电路包括逻辑AND、逻辑OR、逻辑XOR、逻辑NAND、逻辑NOR和其他逻辑操作、触发器、寄存器、现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)等存储器元件等。

计算机可读介质可以包括能够存储由适当的设备执行的指令的任意的有形设备，其结果，具有存储在其中的指令的计算机可读介质包括包含为了制作用于执行由流程图或模块图指定的操作的手段而能够执行的指令的产品。作为计算机可读介质的例子可以包括：电子存储介质、磁存储介质、光存储介质、电磁存储介质、半导体存储介质等。作为计算机可读介质的更具体的例子可以包括：软(注册商标)盘、磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存器)、电可擦除可编程只读存储器(EEPROM)、静态随机存取存储器(SRAM)、光盘只读存储器(CD-ROM)、数字多用途盘(DVD)、蓝光(RTM)碟、存储棒、集成电路卡等。

计算机可读指令包括由包括汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微码、固件指令、状态设定数据、或Smalltalk(注册商标)、JAVA(注册商标)、C++等面向对象编程语言、和“C”编程语言或同样的编程语言那样的现有的过程型编程语言的一个或多个编程语言的任意组合描述的源代码和目标代码中的任意一个。

计算机可读指令可以经由本地或局域网(LAN)、互联网等广域网(WAN)提供给通用计算机、特殊目的的计算机或其他可编程的数据处理装置的处理器或可编程电路，并且为了制作用于执行由流程图或模块图指定的操作的手段而执行计算机可读指令。作为处理器的例子包括：计算机处理器、处理单元、微处理器、数字信号处理器、控制器、微控制器等。

图13表示可以整体或局部实现本发明的多种方式的计算机9900的例子。通过安装于计算机9900的程序，计算机9900能够发挥作为与本发明的实施方式的装置相关联的操作或该装置的一个或多个部分的功能、或者执行该操作或该一个或多个部分、和/或计算机9900能够执行本发明的实施方式的过程或该过程的阶段。为了使计算机9900执行与本说明书记载的流程图和模块图的模块中的几个或全部相关联的特定的操作，可以由CPU9912执行这种程序。

本实施方式的计算机9900包括CPU9912、RAM9914、图形控制器9916和显示装置9918，它们通过主控制器9910相互连接。计算机9900还包括通信接口9922、硬盘驱动器9924、DVD驱动器9926和IC卡驱动器那样的输入/输出单元，它们经由输入/输出控制器9920与主控制器9910连接。计算机还包括ROM9930和键盘9942那样的传统的输入/输出单元，它们经由输入/输出芯片9940与输入/输出控制器9920连接。

CPU9912按照存储在ROM9930和RAM9914内的程序而动作，由此控制各单元。图形控制器9916获取在RAM9914内提供的帧缓存器等或其自身中的由CPU9912生成的图像数据，并且在显示装置9918上显示图像数据。

通信接口9922能够经由网络与其他电子设备进行通信。硬盘驱动器9924存储由计算机9900内的CPU9912使用的程序和数据。DVD驱动器9926从DVD-ROM9901读取程序或数据，经由RAM9914向硬盘驱动器9924提供程序或数据。IC卡驱动器从IC卡读取程序和数据和/或将程序和数据写入IC卡。

ROM9930在其中存储激活时由计算机9900执行的引导程序等和/或依赖于计算机9900的硬件的程序。输入/输出芯片9940也可以经由并行端口、串行端口、键盘端口、鼠标端口等使各种输入/输出单元与输入/输出控制器9920连接。

由DVD-ROM9901或IC卡那样的计算机可读介质提供程序。程序从计算机可读介质读取，并且安装于也作为计算机可读介质的例子的硬盘驱动器9924、RAM9914或ROM9930，并由CPU9912执行。在这些程序内描述的信息处理被读取到计算机9900，从而带来程序与上述各种类型的硬件资源之间的协作。装置或方法可以通过伴随计算机9900的使用来实现信息的操作或处理而构成。

例如，在计算机9900和外部设备之间执行通信的情况下，CPU9912可以执行加载于RAM9914的通信程序，基于在通信程序中描述的处理对通信接口9922指示通信处理。通信接口9922在CPU9912的控制下，读取存储于在RAM9914、硬盘驱动器9924、DVD-ROM9901或IC卡那样的记录介质内提供的发送缓冲处理区域的发送数据，将读取到的发送数据发送到网络，或者将从网络接收到的接收数据写入到在记录介质上提供的接收缓冲处理区域等。

此外，CPU9912可以将存储于硬盘驱动器9924、DVD驱动器9926(DVD-ROM9901)、IC卡等那样的外部记录介质的文件或数据库的全部或必要的部分读取到RAM9914，并对RAM9914上的数据执行各种类型的处理。接着，CPU9912将处理后的数据写回到外部记录介质。

如各种类型的程序、数据、表和数据库那样的各种类型的信息可以存储于记录介质并接受信息处理。CPU9912对从RAM9914读取的数据执行本公开各处记载的各种类型的处理并将结果写回到RAM9914，该各种类型的处理包括由程序的指令序列指定的各种类型的操作、信息处理、条件判断、条件分支、无条件分支、信息的检索/置换等。此外，CPU9912可以检索记录介质内的文件、数据库等中的信息。例如，在分别具有与第二属性的属性值相关联的第一属性的属性值的多个条目存储在记录介质内的情况下，CPU9912可以从该多个条目中检索与指定第一属性的属性值的条件一致的条目，并且读取存储在该条目内的第二属性的属性值，由此获取与满足预先确定的条件的第一属性相关联的第二属性的属性值。

以上说明的程序或软件模块可以存储在计算机9900上或计算机9900附近的计算机可读介质中。此外，在与专用通信网络或互联网连接的服务器系统内提供的硬盘或RAM那样的记录介质能够用作计算机可读介质，由此，经由网络将程序提供给计算机9900。

以上，利用实施方式对本发明进行了说明，但是本发明的技术范围并不限定于上述实施方式记载的范围。对本领域技术人员而言能够对上述实施方式进行各种变更或改良是显而易见的。根据权利要求书的记载可知，进行了这种变更或改良的方式也可以包含于本发明的技术范围。

在权利要求书、说明书和附图中所示的装置、系统、程序和方法中的动作、过程、步骤和阶段等各处理的执行顺序没有特别明示为“更早”、“之前”等，此外，应注意的是只要在后一处理中没有使用前一处理的输出，则能够以任意的顺序实现。关于权利要求书、说明书和附图中的动作流程，即使为了便于说明而使用“首先，”、“接着，”等进行了说明，也不意味着必须按照该顺序实施。

Claims

1.一种模型验证装置，其特征在于包括：

模型存储部，存储使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的机器学习模型，所述学习样本包含表示设置有控制对象的所述设备的状态的状态数据、以及表示用于确定提供给所述控制对象的操作量的行为的行为数据；

学习范围确定部，确定表示所述学习样本的范围的学习范围；

验证数据取得部，取得所述学习范围外的表示所述设备的多个状态的验证数据；以及

验证结果输出部，根据输入了所述验证数据，输出表示所述机器学习模型输出的多个行为的验证结果。

2.根据权利要求1所述的模型验证装置，其特征在于，所述验证结果输出部将所述学习范围内的行为与所述验证结果一起输出。

3.根据权利要求2所述的模型验证装置，其特征在于，所述验证结果输出部将所述验证结果以能够区别于所述学习范围内的行为的方式输出。

4.根据权利要求1至3中任意一项所述的模型验证装置，其特征在于，所述验证结果输出部输出将所述多个行为与所述多个状态对应的行为映射。

5.根据权利要求4所述的模型验证装置，其特征在于，所述验证结果输出部输出将所述多个行为与所述设备的多个物理量所涉及的所述多个状态对应的行为映射。

6.根据权利要求4或5所述的模型验证装置，其特征在于，所述验证结果输出部将所述多个行为根据行为的内容以不同的浓度来输出。

7.根据权利要求4至6中任意一项所述的模型验证装置，其特征在于，所述验证结果输出部将所述多个行为根据行为的内容以不同的颜色来输出。

8.根据权利要求1至7中任意一项所述的模型验证装置，其特征在于还包括：

验证范围指定部，指定表示所述验证数据的范围的验证范围；以及

验证数据生成部，基于所述验证范围生成所述验证数据。

9.根据权利要求1至8中任意一项所述的模型验证装置，其特征在于还包括：

样本数据取得部，取得成为所述学习样本的样本数据；以及

模型生成部，通过使用所述学习样本的机器学习来生成所述机器学习模型。

10.根据权利要求1至9中任意一项所述的模型验证装置，其特征在于，还包括根据输出了所述验证结果而接受用户输入的用户输入部。

11.根据权利要求10所述的模型验证装置，其特征在于，还包括根据所述用户输入而输出所述机器学习模型的模型输出部。

12.根据权利要求10所述的模型验证装置，其特征在于，还包括控制部，所述控制部根据所述用户输入，开始使用所述机器学习模型的所述控制对象的控制。

13.一种模型验证方法，其特征在于包括：

存储使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的机器学习模型，所述学习样本包含表示设置有控制对象的所述设备的状态的状态数据、以及表示用于确定提供给所述控制对象的操作量的行为的行为数据；

确定表示所述学习样本的范围的学习范围；

取得所述学习范围外的表示所述设备的多个状态的验证数据；以及

根据输入了所述验证数据，输出表示所述机器学习模型输出的多个行为的验证结果。

14.一种记录有模型验证程序的非临时性计算机可读介质，其特征在于，

计算机通过执行所述模型验证程序而发挥作为模型存储部、学习范围确定部、验证数据取得部和验证结果输出部的功能，

所述模型存储部存储使用学习样本以输出与设备的状态对应的行为的方式进行了机器学习的机器学习模型，所述学习样本包含表示设置有控制对象的所述设备的状态的状态数据、以及表示用于确定提供给所述控制对象的操作量的行为的行为数据，

所述学习范围确定部确定表示所述学习样本的范围的学习范围，

所述验证数据取得部取得所述学习范围外的表示所述设备的多个状态的验证数据，

所述验证结果输出部根据输入了所述验证数据，输出表示所述机器学习模型输出的多个行为的验证结果。