CN115087998A - 模型更新装置、方法以及程序 - Google Patents
模型更新装置、方法以及程序 Download PDFInfo
- Publication number
- CN115087998A CN115087998A CN202180012735.4A CN202180012735A CN115087998A CN 115087998 A CN115087998 A CN 115087998A CN 202180012735 A CN202180012735 A CN 202180012735A CN 115087998 A CN115087998 A CN 115087998A
- Authority
- CN
- China
- Prior art keywords
- model
- unit
- explanatory variable
- variable
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 33
- 230000006870 function Effects 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 description 35
- 238000003860 storage Methods 0.000 description 16
- 238000009826 distribution Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 239000000284 extract Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 206010027175 memory impairment Diseases 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0205—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
- G05B13/021—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a variable is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0265—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/04—Programme control other than numerical control, i.e. in sequence controllers or logic controllers
- G05B19/05—Programmable logic controllers, e.g. simulating logic interconnections of signals according to ladder diagrams or function charts
- G05B19/056—Programming the PLC
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/18—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
- G05B19/406—Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by monitoring or safety
- G05B19/4065—Monitoring tool breakage, life or condition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0205—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
- G05B13/026—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system using a predictor
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33027—Artificial neural network controller
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/33—Director till display
- G05B2219/33038—Real time online learning, training, dynamic network
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Automation & Control Theory (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Manufacturing & Machinery (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
取得部(11)取得向输出针对解释变量的目标变量的模型(37)输入的解释变量,确定部(12)将分割解释变量空间得到的各区域所包含的解释变量被取得部(11)取得的频度与各区域对应起来,并且确定如下的区域:该区域是模型(37)的学习中利用的学习数据所包含的解释变量所属的区域,且是被取得部(11)取得的解释变量的频度为规定值以下的区域,更新部(14)以忘却包含属于由确定部(12)确定出的区域的解释变量的学习数据的方式更新模型(37)。
Description
技术领域
本发明涉及模型更新装置、模型更新方法以及模型更新程序。
背景技术
以往通过对以推断并输出针对所输入的解释变量的目标变量的方式预先进行了学习的模型进行追加学习、重新学习,来维持或提高模型的推断精度。
例如,提出了提高机械设备的故障预测精度的技术。该技术收集设置于机械设备的多个传感器的传感器数据,提取传感器数据中的机械设备处于正常状态的规定期间部分以及任意评价时的评价部分。另外,该技术通过执行使用了正常期间部分的机器学习,生成机械设备中的相关模型,根据通过对相关模型输入正常期间部分而得到的相关模型的输出值导出正常期间部分的采样数据。并且,该技术根据通过对相关模型输入评价部分而得到的相关模型输出值来评价从机械设备的正常状态的偏离度,基于偏离度来判定机械设备的故障预兆。此外,该技术通过执行使得包含所提取的与误检测对应的传感器数据的追加学习部分以及正常期间部分的采样数据都被反映的机器学习来更新相关模型(参照日本特开2019-28565号公报)。
发明内容
发明所要解决的课题
然而,在模型所设想的推断对象的整体状态存在变化的情况下等,仅对新的学习数据进行追加学习,有时推断精度不会提高。
本公开是鉴于上述的点而完成的,其目的在于以有效地提高模型的推断精度的方式更新模型。
用于解决课题的手段
为了实现上述目的,本公开的模型更新装置构成为包括:取得部,其取得向模型输入的解释变量,所述模型输出针对解释变量的目标变量;确定部,其将分割解释变量空间而得到的各区域所包含的解释变量被所述取得部取得的频度与各区域对应起来,并且确定如下的区域:该区域是所述模型的学习中利用的学习数据所包含的解释变量所属的区域,且是被所述取得部取得的解释变量的频度为规定值以下的区域;以及更新部,其以忘却包含属于由所述确定部确定出的区域的解释变量的学习数据的方式更新所述模型。
另外,也可以是,所述更新部在所述模型中去除利用要忘却的学习数据进行学习而得到的部分,由此更新所述模型。
另外,也可以是,所述更新部利用去除要忘却的学习数据后的学习数据对所述模型进行重新学习,由此更新所述模型。
另外,也可以是,模型更新装置包括判定部,所述判定部判定所述模型的推断精度,所述取得部取得将所述解释变量输入到所述模型时的目标变量以及针对所述解释变量的期待值,所述判定部基于由所述取得部取得的所述目标变量和所述期待值,判定所述推断精度是否满足规定的精度,在由所述判定部判定为所述推断精度不满足所述规定的精度的情况下,所述更新部利用将与由所述取得部取得的解释变量对应的期待值作为针对所述解释变量的新的目标变量的学习数据对所述模型进行追加学习,由此更新所述模型。
另外,也可以是,所述更新部以忘却包含如下的解释变量的学习数据的方式更新所述模型:该解释变量是与所述新的目标变量对应且与所述新的目标变量以外的目标变量建立了对应的解释变量。
另外,模型更新装置也可以构成为包括控制部,所述控制部根据从所述模型输出的目标变量,生成并输出用于对控制对象进行控制的控制信号。
另外,本公开的模型更新方法是如下方法:取得部取得向模型输入的解释变量,所述模型输出针对解释变量的目标变量,确定部将分割解释变量空间而得到的各区域所包含的解释变量被所述取得部取得的频度与各区域对应起来,并且确定如下的区域:该区域是所述模型的学习中利用的学习数据所包含的解释变量所属的区域,且是被所述取得部取得的解释变量的频度为规定值以下的区域,更新部以忘却包含属于由所述确定部确定出的区域的解释变量的学习数据的方式更新所述模型。
另外,本公开的模型更新程序是用于使计算机作为以下各部发挥功能的程序:取得部,其取得向模型输入的解释变量,所述模型输出针对解释变量的目标变量;确定部,其将分割解释变量空间而得到的各区域所包含的解释变量被所述取得部取得的频度与各区域对应起来,并且确定如下的区域:该区域是所述模型的学习中利用的学习数据所包含的解释变量所属的区域,且是被所述取得部取得的解释变量的频度为规定值以下的区域;以及更新部,其以忘却包含属于由所述确定部确定出的区域的解释变量的学习数据的方式更新所述模型。
发明效果
根据本公开的模型更新装置、方法以及程序,能够以有效地提高模型的推断精度的方式更新模型。
附图说明
图1是表示本实施方式的预测控制系统的概略结构的框图。
图2是表示本实施方式的PLC的硬件结构的框图。
图3是表示模型生成装置以及PLC的功能性结构的框图。
图4是概念性地表示学习数据分布信息的图。
图5是用于说明模型更新的概要的图。
图6是概念性地示出推断发生频度信息的图。
图7是用于说明推断精度的判定的图。
图8是概念性地表示学习数据忘却时的模型更新的情形的图。
图9是概念性地表示追加学习时的模型更新的情形的图。
图10是用于说明追加了学习数据时的原来的学习数据的忘却的图。
图11是表示本实施方式中的控制处理的流程的流程图。
图12是表示本实施方式中的模型更新处理的流程的流程图。
具体实施方式
以下,参照附图对本公开的实施方式的一例进行说明。在本实施方式中,以包含搭载有本公开的模型更新装置的PLC(Programmable Logic Controller)的预测控制系统为例进行说明。另外,在各附图中,对相同或等效的构成要素及部分标注相同的参照标号。并且,为了便于说明,附图的尺寸及比率被夸大,有时与实际的比率不同。
如图1所示,本实施方式所涉及的预测控制系统100包括模型生成装置30、PLC 20以及制造装置50。PLC 20使用由模型生成装置30生成的模型来控制作为控制对象的制造装置50的动作。制造装置50例如是输送装置、冲压机等。各PLC 20的控制对象制造装置50可以是1个,也可以是多个。PLC 20以及制造装置50的各组也可以分别设置于不同的多个制造现场。
图2是表示本实施方式的PLC 20的硬件结构的框图。如图2所示,PLC 20具有CPU(Central Processing Unit)41、存储器42、存储装置43、输入输出I/F(Interface:接口)44、存储介质读取装置45以及通信I/F 46。各结构经由总线47以能够相互通信的方式连接。
在存储装置43中保存有包括用于执行后述的控制处理的控制程序、用于执行模型更新处理的模型更新程序在内的各种程序。CPU 41是中央运算处理单元,执行各种程序或控制各结构。即,CPU 41从存储装置43读出程序,将存储器42作为作业区域来执行程序。CPU41按照存储于存储装置43的程序,进行上述各结构的控制以及各种运算处理。
存储器42由RAM(Random Access Memory)构成,作为作业区域暂时存储程序和数据。存储装置43由ROM(Read Only Memory)、HDD(Hard Disk Drive)、SSD(Solid StateDrive)等构成,保存包含操作系统在内的各种程序以及各种数据。
输入输出I/F 44是进行来自制造装置50的数据的输入、以及向制造装置50输出数据的接口。另外,例如也可以连接键盘、鼠标等用于进行各种输入的输入装置、以及例如显示器、打印机等用于输出各种信息的输出装置。作为输出装置,也可以通过采用触摸面板显示器而作为输入装置发挥功能。
存储介质读取装置45进行存储于CD(Compact Disc)-ROM、DVD(DigitalVersatile Disc)-ROM、蓝光光盘、USB(Universal Serial Bus)存储器等各种存储介质的数据的读入、对存储介质的数据写入等。
通信I/F 46是用于与模型生成装置30等其他设备进行通信的接口,例如使用以太网(注册商标)、FDDI、Wi-Fi(注册商标)等标准。
模型生成装置30的硬件结构与PLC 20的硬件结构相同,因此省略说明。
图3表示模型生成装置30及PLC 20的功能性结构。
如图3所示,模型生成装置30在功能上包括收集部31、生成部32以及分析部33。
收集部31收集基于在制造装置50中观测到的数据的信息(以下,称为“观测信息”),存储于收集数据DB 36。观测信息例如是制造装置50内的马达的转速、由设置于制造装置50的各种传感器检测出的传感器值、基于这些值进行了判定处理等的处理结果等的时间序列的信息。
生成部32生成如下的模型37:该模型37是输出针对解释变量的目标变量的模型37,生成部32使用学习数据对用于通过PLC 20对制造装置50进行控制的模型37的参数进行预先学习,由此生成模型37。
在本实施方式中,解释变量是基于由收集部31收集到的观测信息的信息,目标变量是表示从得到解释变量所示的观测信息起规定时间后的制造装置50的状态的值。即,模型37基于观测信息来推断制造装置50的规定时间后的状态。
因此,生成部32取得在收集数据DB 36中存储的观测信息,提取基于观测信息的解释变量。另外,生成部32提取表示观测到该观测信息的情况下的制造装置50的规定时间后的正确解的状态的目标变量。生成部32将提取出的解释变量与目标变量的对作为学习数据,对模型37的参数进行学习,由此生成模型37。生成部32将学习参数得到的模型37发布给各PLC 20。
分析部33生成在解释变量空间中表示在模型37的学习中利用的学习数据所包含的解释变量所属的区域的分布的学习数据分布信息38。图4概念性地示出学习数据分布信息38。在图4的例子中,示出解释变量为x1以及x2这2个的情况。分析部33将分别以x1和x2为各轴的解释变量空间分割为例如图4所示那样的网格状。然后,针对用于模型37的学习的各个学习数据,对该学习数据所包含的解释变量(图4中的白圈)所属的区域赋予表示存在学习数据的值。在图4的例子中,用阴影区域表示存在学习数据的区域,用白色区域表示不存在学习数据的区域。分析部33将生成的学习数据分布信息38发布给各PLC 20。
接着,对本实施方式的PLC 20的功能结构进行说明。
如图3所示,PLC 20包括收集部21、推断部22、控制部23以及模型更新部10作为功能结构。另外,模型更新部10是本公开的模型更新装置的一例。另外,在PLC20的规定的存储区域中存储有从模型生成装置30发布的模型37以及学习数据分布信息38。
收集部21与模型生成装置30的收集部31同样地,从PLC 20所控制的制造装置50收集观测信息,存储于收集数据DB 26。
推断部22取得在收集数据DB 26中存储的观测信息,提取基于观测信息的解释变量,将解释变量输入到模型37,取得作为推断结果的目标变量。推断部22将取得的目标变量传递给控制部23。另外,推断部22将输入到模型37的解释变量、以及作为模型37的输出而取得的目标变量传递给后述的模型更新部10的取得部11。
控制部23基于从推断部22传递来的目标变量,生成并输出用于对制造装置50进行控制的控制信号。例如,控制部23根据由模型37预测出的制造装置50的状态,生成用于调整辊的角度或变更马达的旋转速度的控制信号。
模型更新部10在功能上还包含取得部11、确定部12、判定部13及更新部14。
首先,对模型更新部10的概要进行说明。在图5的上段概念性地示出运用开始时的模型37、即刚刚由模型生成装置30生成之后的模型37。以将由目标变量和解释变量表示的空间中的正例的学习数据(图5中的实线的○标记)与负例的学习数据(图5中的实线的×标记)区分开的方式设定模型37的边界。
当使用模型37的制造装置50的控制的运用开始时,例如存在装置状态随时间劣化等而观测到的观测信息缓慢地变化的情况、即制造装置50的状态变化的情况。在这样的情况下,如图5中的下段所示,在模型37的学习所利用的学习数据的周边,存在实际运用中难以产生的数据(图5中的虚线的○标记以及×标记)。另外,在模型37的学习所利用的学习数据中不存在的数据有时在实际的运用时容易产生(图5中的阴影的○标记以及×标记)。
一般而言,在运用开始后,产生了模型的推断精度的课题的情况下,调用一次模型的学习所利用的当初的学习数据集。然后,通过利用对当初的学习数据集追加了用于追加学习而新得到的学习数据后的学习数据集来进行学习,从而更新模型。即,是将新从制造装置50得到的数据追加到已搭载于PLC 20的模型37中进行更新的结构。但是,在该情况下,如上所述,在制造装置50的状态由于经年劣化等而变化的情况下等,仅通过以最新的数据进行追加学习,在模型37中持续残留以原来的学习数据建模得到的行为。因此,存在未解决推断精度的课题的情况。
因此,模型更新部10以忘却在周边难以发生推断的学习数据的方式更新模型37。另外,对于发生了新的推断的数据,利用新的学习数据进行追加学习来更新模型37。由此,如图5的下段所示,模型37的边界从虚线所示的状态被更新为实线所示的状态。因此,根据制造装置50的状态的变化,也能够使模型37的状态偏移。
以下,对模型更新部10的各功能部进行详细叙述。
取得部11从推断部22取得输入到模型37的解释变量。取得部11将所取得的解释变量传递给确定部12。
另外,取得部11取得从推断部22传递来的目标变量、即对模型37输入了解释变量时所输出的目标变量,并与解释变量对应起来传递给判定部13。进而,取得部11根据在规定时间后收集到的观测信息提取针对解释变量的期待值、即成为针对该解释变量的正确解的目标变量,与解释变量对应起来传递给判定部13。
确定部12与学习数据分布信息38同样地,生成将分割解释变量空间得到的各区域所包含的解释变量被取得部11取得的频度与各区域对应起来的推断发生频度信息16。解释变量被取得部11取得的频度是发生了基于该区域中包含的解释变量的推断的频度。
图6概念性地示出推断发生频度信息16。在图6的例子中,与学习数据分布信息38重叠地表示推断发生频度信息16。在图6中,用粗框表示的区域是由学习数据分布信息38表示的、模型37的学习所利用的学习数据存在的区域。另外,在图6的例子中,用区域的浓度表示发生了基于属于各区域的解释变量的推断的频度,浓度越浓,表示频度越高。
具体而言,确定部12每当从取得部11被传递了解释变量时,在推断发生频度信息16中对取得的解释变量所属的区域所保持的频度加1。另外,确定部12也可以通过使推断发生频度信息16内的频度的最大值为规定值的方式对各区域的频度进行归一化。
确定部12确定模型37的学习所利用的学习数据中包含的解释变量所属的、且发生了推断的频度为规定值以下的区域。规定值可以是预先决定的值。另外,也可以将按频度从高到低的顺序的倒数第规定个频度设为规定值。在该情况下,能够确定频度比其他区域相对低的区域。确定部12将确定出的区域的信息传递给更新部14。包含属于确定出的区域的解释变量的学习数据相当于在图5中说明的在周边难以发生推断的学习数据,是成为忘却的对象的学习数据。
判定部13判定模型37的推断精度。具体而言,判定部13对与从取得部11传递来的解释变量对应的目标变量和期待值进行比较,判定模型37的推断精度是否满足规定的精度。例如,如图7所示,考虑模型37推断规定时间L后的状态的情况。在该情况下,判定部13取得针对在时间t取得的解释变量(x1(t),x2(t))的来自模型37的输出即目标变量y^(在图7中为“y”上带“^”)和根据在时间t+L取得的观测信息提取出的期待值y(t+L)。然后,判定部13基于y^和y(t+L)之间的误差、y(t+L)是否包含于y^的规定信赖区间来判定推断精度。
例如,判定部13在目标变量与期待值的误差为规定值以下的情况下,判定为推断精度满足规定的精度。另一方面,判定部13在目标变量与期待值的误差超过规定值的情况下,表示制造装置50的状态从当初的模型37的学习时发生了变化,判定为推断精度不满足规定的精度。判定部13将判定结果传递给更新部14。
更新部14当从确定部12接收到确定出的区域的信息时,以忘却模型37的学习所利用的学习数据中的、包含属于确定出的区域的解释变量的学习数据的方式更新模型37。
具体而言,更新部14通过在模型37中去除利用要忘却的学习数据进行学习而得到的部分,而更新模型37。在该处理中,能够使用不需要最初的模型37的学习时的学习数据集,而能够直接对模型进行数据的追加以及删除的算法。在图8中概念性地示出基于该算法的学习数据忘却时的模型37的更新的情形。如图8所示,在模型37由包括多个节点的树结构表示的情况下,通过模型更新,去除与利用要忘却的学习数据进行学习而得到的部分相当的节点(图8中的虚线的椭圆部分)。在该处理的情况下,在模型37中,基于所去除的节点以外的节点部分的推断结果不变化。
另外,更新部14也可以利用当初的学习数据集中的、去除了要忘却的学习数据后的学习数据,对模型37进行重新学习,由此更新模型37。在该情况下,模型更新部10从模型生成装置30取得并保持当初的学习数据集即可。
另外,更新部14在由判定部13判定为推断精度不满足规定的精度的情况下,通过对模型37进行追加学习来更新模型37。具体而言,更新部14制作新的学习数据,该新的学习数据将与从取得部11传递来的解释变量对应的期待值作为针对该解释变量的正确解的目标变量。然后,使用上述的能够直接针对模型进行数据的追加以及删除的算法来进行追加学习。在图9中概念性地表示基于该算法的追加学习时的模型37的更新的情形。如图9所示,通过模型更新,追加新的节点(图9中的虚线的椭圆部分)。在该处理的情况下,基于模型37的已有部分的推断结果不变化。
此外,更新部14也可以从当初的学习数据集中去除要忘却的学习数据,并且利用追加了新的学习数据后的新学习数据集进行重新学习,由此更新模型37。
另外,更新部14以忘却包含如下的解释变量的学习数据的方式更新模型37:该解释变量与新的目标变量对应且与新的目标变量以外的目标变量建立了对应。例如,如图10所示,设为在作为最初的学习数据而存在解释变量x和目标变量yold的对的情况下,作为新的学习数据而追加了解释变量x和目标变量ynew的对。在该情况下,更新部14以忘却作为解释变量x与目标变量yold的对的学习数据的方式更新模型37。
接下来,对本实施方式的预测控制系统100的作用进行说明。
首先,在模型生成装置30中,生成模型37及学习数据分布信息38,发布给PLC 20。
在PLC 20中,开始使用了模型37的运用。具体而言,PLC 20执行使用模型37的输出对制造装置50进行控制的处理即控制处理。图11是表示由PLC 20的CPU 41执行的控制处理的流程的流程图。CPU 41从存储装置43读出控制程序,在存储器42中展开并执行,由此CPU41作为PLC 20的各功能结构发挥功能,反复执行图11所示的控制处理。
在步骤S12中,控制部23输出用于对制造装置50进行控制的控制信号。由此,制造装置50基于控制信号被控制而进行动作。伴随着制造装置50的动作,在制造装置50中观测到观测信息,输出到PLC 20。
接着,在步骤S14中,收集部21从制造装置50取得观测信息,存储于收集数据DB26。
接着,在步骤S16中,推断部22从收集数据DB 26取得观测信息,对观测信息进行必要的处理,加工成解释变量,将解释变量输入到模型37。在观测信息直接成为输入到模型37的解释变量的情况下,推断部22将观测信息直接作为解释变量输入到模型37。
接着,在步骤S18中,控制部23基于从模型输出的目标变量,生成用于对制造装置50进行控制的控制信号。然后,处理返回到步骤S12。
接着,对更新模型37的模型更新处理进行说明。图12是表示由PLC 20的CPU 41执行的模型更新处理的流程的流程图。CPU 41从存储装置43读出模型更新程序,在存储器42中展开并执行,由此CPU 41作为PLC 20的各功能结构发挥功能,执行图12所示的模型更新处理。每当从制造装置50收集到观测信息时执行模型更新处理。
在步骤S22中,取得部11从推断部22取得向模型37输入的解释变量。取得部11将所取得的解释变量传递给确定部12。
接下来,在步骤S24中,确定部12通过在推断发生频度信息16中对从取得部11传递来的解释变量所属的区域中保持的频度加1等来更新推断发生频度信息16。
接着,在步骤S26中,确定部12对学习数据分布信息38和推断发生频度信息16进行比较,判定是否存在模型37的学习所利用的学习数据所包含的解释变量所属的、且推断发生的频度为规定值以下的区域。在存在区域的情况下,确定部12将该区域的信息传递给更新部14,处理转移到步骤S28,在不存在区域的情况下,处理转移到步骤S30。
在步骤S28中,更新部14以忘却模型37的学习所利用的学习数据中的、包含属于由确定部12确定出的区域的解释变量的学习数据的方式更新模型37。
接着,在步骤S30中,取得部11取得从推断部22传递来的目标变量、即向模型37输入了解释变量时所输出的目标变量,与解释变量对应起来传递给判定部13。
接着,在步骤S32中,取得部11根据在规定时间后收集到的观测信息提取针对解释变量的期待值、即作为针对该解释变量的正确解的目标变量,与解释变量对应起来传递给判定部13。
接着,在步骤S34中,判定部13对与从取得部11传递来的解释变量对应的目标变量和期待值进行比较,判定模型37的推断精度是否满足规定的精度。在不满足规定的精度的情况下,处理转移到步骤S36,在满足的情况下,模型更新处理结束。
在步骤S36中,更新部14制作新的学习数据,该新的学习数据将与从取得部11传递来的解释变量对应的期待值作为针对该解释变量的正确解的目标变量。
接着,在步骤S38中,更新部14通过利用所制作的新的学习数据进行追加学习来更新模型37。进而,更新部14以忘却包含如下的解释变量的学习数据的方式更新模型37:该解释变量与新的目标变量对应且与新的目标变量以外的目标变量建立了对应。然后,模型更新处理结束。
如以上说明的那样,根据本实施方式的预测控制系统,PLC中包含的模型更新部取得向输出针对解释变量的目标变量的模型输入的解释变量。另外,模型更新部对推断发生频度信息进行更新,该推断发生频度信息是将分割解释变量空间得到的各区域与使用了各区域所包含的解释变量的推断发生的频度对应起来的推断发生频度信息。另外,模型更新部将表示模型的学习所利用的学习数据中包含的解释变量所属的区域的学习数据分布信息与推断发生频度信息进行比较。然后,模型更新部确定如下的区域:该区域是模型的学习所利用的学习数据所包含的解释变量所属的区域、且推断的发生频度为规定值以下的区域。进而,模型更新部以忘却包含属于确定出的区域的解释变量的学习数据的方式更新模型。
由此,在模型中,能够避免根据原来的学习数据而建模出的行为持续残留,能够以有效地提高模型的推断精度的方式更新模型。其结果,在PLC侧、即现场,能够根据最近的制造装置50的状态来更新模型。
另外,通过在判定模型的推断精度的基础上,进行基于追加学习以及学习数据的忘却的更新,能够进一步提高推断精度。
另外,在模型的更新中使用了能够直接对模型进行数据的追加以及删除的算法的情况下,不需要在PLC侧保持当初的学习数据集。
此外,在上述实施方式中,对将本公开的模型更新装置搭载于PLC的例子进行了说明,但并不限定于此。不限于将模型的输出利用于控制对象的控制的情况,能够对各种模型应用本公开。
另外,在上述实施方式中,作为推断发生频度信息,对将解释变量空间划分为网格状的情况进行了说明,但并不限定于此。例如,也可以基于解释变量空间中的距各学习数据的位置的距离来划分区域。
另外,也可以由CPU以外的各种处理器执行在上述实施方式中CPU读入软件(程序)而执行的模型更新处理。作为该情况下的处理器,例示FPGA(Field-Programmable GateArray)等在制造后能够变更电路结构的PLD(Programmable Logic Device)、以及ASIC(Application Specific Integrated Circuit)等具有为了执行特定的处理而专门设计的电路结构的处理器即专用电路等。另外,可以通过这些各种处理器中的1个来执行模型更新处理,也可以通过同种或不同种的2个以上的处理器的组合(例如,多个FPGA、以及CPU与FPGA的组合等)来执行模型更新处理。另外,更具体而言,这些各种处理器的硬件结构是组合了半导体元件等电路元件的电路。
另外,在上述实施方式中,说明了模型更新程序预先存储(安装)于存储装置的方式,但并不限定于此。程序也可以以存储在CD-ROM、DVD-ROM、蓝光光盘、USB存储器等存储介质中的方式提供。另外,程序也可以设为经由网络从外部装置下载的方式。
关于本说明书中记载的所有文献、专利申请以及技术标准,以通过参照而取入为与具体且分别记载各个文献、专利申请以及技术标准的情况相同的程度,通过参照而取入到本说明书中。
标号说明
10:模型更新部;11:取得部;12:确定部;13:判定部;14:更新部;16:推断发生频度信息;20:PLC;21:收集部;22:推断部;23:控制部;26:收集数据DB;30:模型生成装置;31:收集部;32:生成部;33:分析部;36:收集数据DB;37:模型;38:学习数据分布信息;41:CPU;42:存储器;43:存储装置;44:输入输出I/F;45:存储介质读取装置;46:通讯I/F;47:总线;50:制造装置;100:预测控制系统。
Claims (8)
1.一种模型更新装置,其包括:
取得部,其取得向模型输入的解释变量,所述模型输出针对解释变量的目标变量;
确定部,其将分割解释变量空间而得到的各区域所包含的解释变量被所述取得部取得的频度与各区域对应起来,并且确定如下的区域:该区域是所述模型的学习中利用的学习数据所包含的解释变量所属的区域,且是被所述取得部取得的解释变量的频度为规定值以下的区域;以及
更新部,其以忘却包含属于由所述确定部确定出的区域的解释变量的学习数据的方式更新所述模型。
2.根据权利要求1所述的模型更新装置,其中,
所述更新部在所述模型中去除利用要忘却的学习数据进行学习而得到的部分,由此更新所述模型。
3.根据权利要求1所述的模型更新装置,其中,
所述更新部利用去除要忘却的学习数据后的学习数据对所述模型进行重新学习,由此更新所述模型。
4.根据权利要求1至3中的任一项所述的模型更新装置,其中,
所述模型更新装置包括判定部,所述判定部判定所述模型的推断精度,
所述取得部取得将所述解释变量输入到所述模型时的目标变量以及针对所述解释变量的期待值,
所述判定部基于由所述取得部取得的所述目标变量和所述期待值,判定所述推断精度是否满足规定的精度,
在由所述判定部判定为所述推断精度不满足所述规定的精度的情况下,所述更新部利用将与由所述取得部取得的解释变量对应的期待值作为针对所述解释变量的新的目标变量的学习数据对所述模型进行追加学习,由此更新所述模型。
5.根据权利要求4所述的模型更新装置,其中,
所述更新部以忘却包含如下的解释变量的学习数据的方式更新所述模型:该解释变量是与所述新的目标变量对应且与所述新的目标变量以外的目标变量建立了对应的解释变量。
6.根据权利要求1至5中的任一项所述的模型更新装置,其中,
所述模型更新装置包括控制部,所述控制部根据从所述模型输出的目标变量,生成并输出用于对控制对象进行控制的控制信号。
7.一种模型更新方法,其中,
取得部取得向模型输入的解释变量,所述模型输出针对解释变量的目标变量,
确定部将分割解释变量空间而得到的各区域所包含的解释变量被所述取得部取得的频度与各区域对应起来,并且确定如下的区域:该区域是所述模型的学习中利用的学习数据所包含的解释变量所属的区域,且是被所述取得部取得的解释变量的频度为规定值以下的区域,
更新部以忘却包含属于由所述确定部确定出的区域的解释变量的学习数据的方式更新所述模型。
8.一种模型更新程序,所述模型更新程序用于使计算机作为如下部分发挥功能:
取得部,其取得向模型输入的解释变量,所述模型输出针对解释变量的目标变量;
确定部,其将分割解释变量空间而得到的各区域所包含的解释变量被所述取得部取得的频度与各区域对应起来,并且确定如下的区域:该区域是所述模型的学习中利用的学习数据所包含的解释变量所属的区域,且是被所述取得部取得的解释变量的频度为规定值以下的区域;以及
更新部,其以忘却包含属于由所述确定部确定出的区域的解释变量的学习数据的方式更新所述模型。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020-032223 | 2020-02-27 | ||
JP2020032223A JP7396117B2 (ja) | 2020-02-27 | 2020-02-27 | モデル更新装置、方法、及びプログラム |
PCT/JP2021/002486 WO2021171863A1 (ja) | 2020-02-27 | 2021-01-25 | モデル更新装置、方法、及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115087998A true CN115087998A (zh) | 2022-09-20 |
Family
ID=77490890
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180012735.4A Pending CN115087998A (zh) | 2020-02-27 | 2021-01-25 | 模型更新装置、方法以及程序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230075229A1 (zh) |
EP (1) | EP4113397A4 (zh) |
JP (1) | JP7396117B2 (zh) |
CN (1) | CN115087998A (zh) |
WO (1) | WO2021171863A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7363407B2 (ja) * | 2019-11-21 | 2023-10-18 | オムロン株式会社 | 追加学習装置、方法、及びプログラム |
WO2023209878A1 (ja) * | 2022-04-27 | 2023-11-02 | 株式会社エイシング | 異常検知装置、システム、方法及びプログラム |
KR20230162770A (ko) * | 2022-05-20 | 2023-11-28 | 주식회사 히타치하이테크 | 탐색 장치 및 탐색 방법 그리고 반도체 장치 제조 시스템 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2796100B2 (ja) * | 1988-10-05 | 1998-09-10 | 松下電器産業株式会社 | アナログニューロチップの学習・再学習方法 |
JP3203674B2 (ja) * | 1991-03-27 | 2001-08-27 | 豊田工機株式会社 | ニューラルネットワークの学習方法 |
JP4299444B2 (ja) | 2000-08-25 | 2009-07-22 | Necインフロンティア株式会社 | 通話記録装置 |
JP6839342B2 (ja) * | 2016-09-16 | 2021-03-10 | 富士通株式会社 | 情報処理装置、情報処理方法およびプログラム |
EP3340129B1 (en) | 2016-12-21 | 2019-01-30 | Axis AB | Artificial neural network class-based pruning |
JP7082461B2 (ja) | 2017-07-26 | 2022-06-08 | 株式会社Ye Digital | 故障予知方法、故障予知装置および故障予知プログラム |
JP6899273B2 (ja) * | 2017-08-01 | 2021-07-07 | 株式会社日立製作所 | プラント制御装置およびその制御方法、圧延機制御装置およびその制御方法並びにプログラム |
-
2020
- 2020-02-27 JP JP2020032223A patent/JP7396117B2/ja active Active
-
2021
- 2021-01-25 CN CN202180012735.4A patent/CN115087998A/zh active Pending
- 2021-01-25 WO PCT/JP2021/002486 patent/WO2021171863A1/ja unknown
- 2021-01-25 EP EP21759642.8A patent/EP4113397A4/en active Pending
- 2021-01-25 US US17/798,395 patent/US20230075229A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4113397A1 (en) | 2023-01-04 |
JP7396117B2 (ja) | 2023-12-12 |
WO2021171863A1 (ja) | 2021-09-02 |
JP2021135812A (ja) | 2021-09-13 |
EP4113397A4 (en) | 2024-03-27 |
US20230075229A1 (en) | 2023-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115087998A (zh) | 模型更新装置、方法以及程序 | |
TWI640390B (zh) | 刀具磨耗監測與預測方法 | |
US11163277B2 (en) | Abnormality detection system, support device, and model generation method | |
JP6140331B1 (ja) | 主軸または主軸を駆動するモータの故障予知を学習する機械学習装置および機械学習方法、並びに、機械学習装置を備えた故障予知装置および故障予知システム | |
JP2019179395A (ja) | 異常検知システム、サポート装置および異常検知方法 | |
US11687058B2 (en) | Information processing method and information processing apparatus used for detecting a sign of malfunction of mechanical equipment | |
EP4028841B1 (en) | Systems and methods for detecting wind turbine operation anomaly using deep learning | |
TWI747055B (zh) | 狀態推斷裝置以及狀態推斷方法 | |
JP2016161950A (ja) | 検知プログラム、検知方法及び検知装置 | |
US7949497B2 (en) | Machine condition monitoring using discontinuity detection | |
EP3825928A2 (en) | Additional learning device, additional learning method, and additional learning program | |
CN114861522A (zh) | 一种基于人工智能元学习技术的精密制造质量监测方法和装置 | |
JP6898607B2 (ja) | 異常予兆検出システムおよび異常予兆検出方法 | |
JP7374868B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
US20220404792A1 (en) | Method, system and computer program product for monitoring a shaping process | |
CN115244551A (zh) | 学习用数据生成装置、学习装置、控制装置、学习用数据生成方法、学习方法、控制方法、学习用数据生成程序、学习程序以及控制程序 | |
CN116249943A (zh) | 加工诊断装置、学习装置、推断装置、加工诊断方法及程序 | |
WO2021199160A1 (ja) | 情報処理装置、情報処理方法、記録媒体、情報処理システム | |
CN116194945A (zh) | 信息处理装置、信息处理方法和信息处理程序 | |
JP7458347B2 (ja) | 鉄道保守データ分析支援方法及び鉄道保守データ分析支援システム | |
CN114286931B (zh) | 异常部分检测装置、异常部分检测方法及计算机可读取的记录介质 | |
KR102553397B1 (ko) | 데이터 처리 장치 | |
JP7322918B2 (ja) | プログラム、情報処理装置、及び学習モデルの生成方法 | |
WO2021217636A1 (zh) | 工业网络行为分析方法、装置、系统和计算机可读介质 | |
JP2024071195A (ja) | 情報処理装置、情報処理方法およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |