CN115427907A - 用于工业过程中的智能报警管理方法 - Google Patents

用于工业过程中的智能报警管理方法 Download PDF

Info

Publication number
CN115427907A
CN115427907A CN202180028760.1A CN202180028760A CN115427907A CN 115427907 A CN115427907 A CN 115427907A CN 202180028760 A CN202180028760 A CN 202180028760A CN 115427907 A CN115427907 A CN 115427907A
Authority
CN
China
Prior art keywords
time series
value
machine learning
learning model
industrial process
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180028760.1A
Other languages
English (en)
Inventor
蒙塞夫·希欧亚
马塞洛·迪克斯
本杰明·克洛珀
爱奥尼斯·林佩罗普洛斯
丹尼斯·詹卡
巴勃罗·罗德里格斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ABB Schweiz AG
Original Assignee
ABB Schweiz AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ABB Schweiz AG filed Critical ABB Schweiz AG
Publication of CN115427907A publication Critical patent/CN115427907A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • G05B23/0254Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a quantitative model, e.g. mathematical relationships between inputs and outputs; functions: observer, Kalman filter, residual calculation, Neural Networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2223/00Indexing scheme associated with group G05B23/00
    • G05B2223/02Indirect monitoring, e.g. monitoring production to detect faults of a system

Abstract

本发明涉及智能报警管理领域,特别是在工业过程中(50)。该方法包括以下步骤:通过输入数据(20)和得分数据(30)来训练机器学习模型(10),其中输入数据包括至少一个可观察过程变量的第一时间序列,并且其中机器学习模型(10)是人工神经网络ANN;通过将第一时间序列(21)应用于经训练的机器学习模型(10)来运行经训练的机器学习模型(10);以及输出值(40)由经训练的机器学习模型(10)输出,该输出值至少包括指示在预定义的时间距离(T1)中的工业过程(50)的异常行为的至少一个预测的可观察过程值PPV的第二临界值(42)。

Description

用于工业过程中的智能报警管理方法
技术领域
本发明涉及智能报警管理领域,特别是在工业过程中的智能报警管理领域。本发明还涉及计算机程序产品、计算机可读存储介质以及该方法的使用。
背景技术
至少一些工业过程(例如在设施中)可能非常复杂,以至于操作员和/或服务人员并不总是清楚其行为。特别是对于至少一些情形而言,异常行为的识别可能是困难的和/或容易出错的。这可能会变得更加复杂,因为有时可能会发出太多警报,从而无法清楚地了解当前工业过程的关键性。
发明内容
因此,本发明的目的是针对工业过程提供改进的警报管理。该目的通过独立权利要求的主题来实现。另外的实施例从从属专利权利要求和以下描述中显而易见。
一个方面涉及一种用于发现工业过程的异常行为的方法。该方法包括以下步骤:
通过输入数据和得分数据来训练机器学习模型,其中机器学习模型是人工神经网络ANN,
其中输入数据包括工业过程的至少一个可观察过程值的第一时间序列、影响工业过程的至少一个操纵变量的第二时间序列和工业过程的至少一个内部变量的第三时间序列;
并且其中得分数据包括:指示工业过程的异常行为的至少一个可观察过程值中的每个可观察过程值的第一临界值,以及工业过程的至少一个预测的可观察过程值的第四时间序列;
通过将第一个时间序列应用于经过训练的机器学习模型来运行经训练的机器学习模型;以及
输出值由经训练的机器学习模型输出,该输出值至少包括指示在预定义的时间距离内的工业过程的异常行为的至少一个预测的可观察过程值的第二临界值。
工业过程可以在工业设施中运行,如在例如化学和过程工程中使用的那样。工业过程可以被配置用于生产和/或制造物质,例如材料和/或化合物。异常行为可以是偏离工业过程的和/或工业设施的有意行为的行为。异常行为可以通过可观察(“外部”)值(诸如设施的容器中的温度或压力)来指示,和/或可以通过不可观察(“内部”)值(例如混合化合物的内部非故意干扰)来指示。异常行为可能会导致警报,无论是短期的,例如立即,和/或在某个时间距离内,例如在几秒钟、几分钟和/或其他时间跨度内。
机器学习模型是在训练和/或训练阶段之后使用的人工神经网络ANN。训练可以进行一次,或者可以在模型的使用期间被重复。可以通过输入数据和得分数据来进行训练;然而,另外的数据也可以被用于训练。输入数据和/或得分数据的时间序列可以基于过去的数据记录。因此,工业过程的“未来行为”可能是“已知的”,即,可能是时间序列的一部分。例如,一个过程值的快速变化可能会在几分钟内导致危急情形,而另一过程值的快速变化可能已经被证明是非危急的,即使已经发出警报。输入数据可以包括:(多个)可观察过程值、(多个)不可观察的内部变量(可能来自仿真和/或例如来自不可观察的干扰)和/或(多个)操纵变量(例如来自对工业过程的警报和/或其他行为作出反应的操作员)。
得分数据可以是ANN的奖励和/或惩罚。得分数据可以包括:第一临界值,它可以是(多个)可观察过程值和/或(多个)内部变量的函数。该函数可以是一个或多个变量的复合函数和/或组合函数。该函数可以是一个简单的函数,例如:“如果温度低于32℃,那么alarm5=true”(警报5=真)。预测的可观察过程值可以基于历史数据,这些历史数据可以示出“发展中的”过程值,例如:“如果温度高于76℃,那么alarm8=true”(警报8=真),因为过程行为在2分钟内变得危急。时间距离可以是固定的,例如5分钟,它可能是不止一个距离,和/或是可变距离,可能受至少一个历史时间序列的影响。
经训练的机器学习模型的运行可以在训练阶段之后进行。在过程的操作期间,至少将第一时间序列应用于经训练的机器学习模型;但是,可能会有更多数据被应用于模型。
通过经训练的机器学习模型的输出可以包括警报和/或附加警报。警报可以基于或可以包括第二临界值。模型的输出可能与其他警报相似或不同,例如通过工业过程的其他组件和/或子系统。在一些情况下,模型的输出可能会导致警报的重新评估,例如可能导致一个警报“过度加权”和/或可能导致一个警报“加权不足”。这种“纠正”可能有助于在工业过程中进行更有效的警报管理和/或减轻操作员的负担。特别地,这可以容易识别工业过程的异常行为。
在各种实施例中,输出值还包括取决于第一时间序列、第二时间序列和/或第三时间序列中的至少一个的工业过程的场景编号。在无法找到场景编号的情况下,可能会输出“未定义”的场景编号。场景编号可能有利地有助于更好地了解工业过程中当前正在发生的事情,从而导致对当前情况和/或相关历史情况的更快反应和/或进一步调查。
在各种实施例中,输出值还包括取决于第一时间序列、第二时间序列和/或第三时间序列中的至少一个的第五时间序列。第五时间序列可以类似于(多个)预测的可观察过程值的第四时间序列。第五时间序列可以包括“绕过”第四时间序列,从而有利地利用由多个历史时间序列提供的知识库。因此,基于给定过程的过去和当前的测量和/或数据,并且在考虑操纵变量时,还基于计划的未来操作员动作,该方法可以促进或有助于预测设施的行为。此外,这可以被用来训练机器学习算法,以便为上述被用于在线部署的方法创建快速和准确的代理模型。
在各种实施例中,输出值还包括至少一个可观察过程值(即当前值)的第一临界值。输入也可以被用作输出,例如简单地“被转发”和/或作为第一临界值的一种“捷径(shortcut)”。这进一步提高了对当前过程行为的理解。
在各种实施例中,该方法还包括输出取决于第一时间序列和/或第三时间序列中的至少一个的操纵变量的步骤。该实现可以包括该值(即,可观察值和/或不可观察值)的“简单转发或绕过”。这可以有利地实现传感器值和仿真结果的一种无缝集成。如果针对这种情况存在可行的解决方案或“标准解决方案”,这可能会进一步有助于洞察。此外,可以将新情形可能作为对该情形和/或场景的一些特别关注的指示而告知操作员。
在各种实施例中,该方法还包括确定到超过预定义临界值的第二临界值的时间距离的步骤。这可以有利地回答如下问题:“在这种情形/场景下,何时会发生下一个警报?”或“对于这种情形/场景,会有警报吗?”这可以有利地被用于在某些情形中能够“转移”警报消息以释放(discharge)人员。因此,可能取决于临界值的上升速度,例如在将来,可以为该特定警报插入时间缓冲区。这可以进一步改进警报管理。
在各种实施例中,该方法还包括以下步骤:确定第二临界值的增加速度;并且当增加速度超过预定义临界值时输出警报。这可能会引发警报,作为对一些过程值的加速(例如,升温)的反应。
一个方面涉及一种包括指令的计算机程序产品,当该程序由计算机和/或人工神经网络ANN执行时,该指令使计算机和/或ANN执行上文和/或下文描述的方法.
一个方面涉及一种计算机可读存储介质,如上所述的计算机程序或计算机程序产品被存储在计算机可读存储介质上。
一个方面涉及机器学习模型,特别是经训练的机器学习模型,其被配置用于执行如上文和/或下文所述的方法。
一个方面涉及机器学习模型在监控和/或控制工业过程中的用途。
一个方面涉及一种包括计算机和/或ANN(人工神经网络)的工业设施,指令被存储在工业设施上,当该程序由计算机和/或ANN执行时,使计算机或工业设施执行如上文和/或下文所述的方法。
为了进一步澄清,本发明通过附图中所示的实施例进行描述。这些实施例仅被认为是示例,而不是限制。
附图说明
这些附图描绘了:
图1示意性地示出了根据实施例的工业过程与机器学习模型的协作;
图2示意性地示出了根据实施例的包括输入数据和临界值的查找表;
图3示意性地示出了根据实施例的一些元素和输入数据;
图4示意性地示出了根据实施例的训练过程;
图5示意性地示出了根据实施例的预测过程;
图6示意性地示出了根据实施例的代理模型训练工作流程;
图7示意性地示出了根据实施例的使用用于预测警报的代理模型的示例;
图8示意性地示出了根据实施例的与过程变量的时间演变相对应的警报管理系统的区间;
图9示意性地示出了根据另一实施例的区间或警报界限;
图10示意性地示出了根据实施例的机器学习模型的训练过程;
图11示意性地示出了根据实施例的警报管理系统的操作阶段;
图12示意性地示出了根据实施例的基于预测的警报是有益的示例情形;
图13示意性地示出了根据实施例的代理模型训练工作流程;
图14示意性地示出了根据实施例的使用用于预测警报的代理模型的示例;
图15示意性地示出了根据实施例的使用在线仿真的方法;
图16示意性地示出了根据实施例的利用来自仿真和机器学习的数据进行根本原因分析的示例;
图17示意性地示出了根据实施例的方法;
具体实施方式
图1示意性地示出了根据实施例的工业过程50与机器学习模型10的协作。工业过程50可以通过可观察过程值PV的第一时间序列21来观看或观察。工业过程50还具有至少一个内部变量IV的第三时间序列23,该至少一个内部变量IV可能是不可观察的,即不可直接观察到和/或通过仿真等“可观察到”。工业过程50由至少一个操纵变量MV的第二时间序列22控制和/或操纵。MV可以由操作员、服务人员和/或一个或多个自动化过程输入到系统中。机器学习模型10可以是人工神经网络ANN。机器学习模型10具有输入数据20,其包括第一时间序列21、第三时间序列23和第二时间序列22。IV的第三时间序列23可以被显示在IV表68中。
机器学习模型10还具有得分数据30,其包括第一临界值32和第四时间序列34。第一临界值32可以基于和/或可以是当前可观察过程值PV的函数和/或基于可观察过程值PV的第一时间序列21上,因此考虑了更长时间跨度的PV。所述函数可以由映射设备62构建。映射设备62还可以将第一临界值32输出到警报显示器64。系统中可以存在一个或多个警报显示器64。(多个)警报显示器64还可以通过系统的其他组件和/或模块馈送,例如通过传感器输出,例如温度、压力等等,具体取决于工业过程50。第四时间序列34包括工业过程50的至少一个预测的可观察过程值PPV。预测的可观察过程值PPV的预测可以基于历史数据。机器学习模型10输出输出值40。输出值40包括第二临界值42和第五时间序列44。第五时间序列44可以类似于第四时间序列34,和/或简单地“前馈”第四时间序列34,从而使仿真结果作为模型数据的一个组成部分可用。第二临界值42是至少一个预测的可观察过程值PPV的函数。因此,第二临界值42是一种过程行为的“浓缩知识”,可能包括PV的未来发展的各方面。
图2示意性地示出了根据实施例的示例查找表70,包括输入数据20和第二临界值42。输入数据20可以包括多个PV、MV和IV的多个时间序列31、22、23。得分数据30可以包括第一临界值和/或其他值。查找表70还可以包括工业过程50的场景编号46,从而指示工业过程50当前处于的“状态”。示例查找表70还可以包括预定义的时间距离T1,其例如可以指示第二临界值42的基础,即时间距离T1中的预测值。
图3示意性地示出了根据实施例的一些元素、输入数据以及它们的交互。示出了解决方案元素及其交互。仿真器可以包括工业过程和装备的模型以及控制系统的模型。虚拟操作员是软件模块,其可以将预定义或预编程的操作员动作(例如设定点或MV更改)应用于仿真的控制系统。数据交换可以通过适当的API(应用编程接口)、OPC DA(应用编程接口数据访问)或者经由脚本用户动作(例如执行光标移动和键盘输入)来完成。虚拟操作员在从给定初始状态开始的第一原理模型的仿真运行(例如对内部行为进行仿真)期间执行某些操作员动作。由过程设施的第一原理模型所产生的数据被存储在数据库中,并由ANN或机器学习模型用于机器学习。备选地,可以使用来自仿真器的数据流对ANN,进行训练而不必存储数据。
使用控制回路设定点的从时间t0到tn的时间窗口内的过程值(PV)、操纵变量(MV)或在同一时间窗口t0到tn内的操作员动作以及从tn到tend的计划的未来设定值来对人工神经网络(有时被称为“ML学习算法”或“ML算法”)进行训练。目标(要预测的过程变量)是从tn+1到tend的过程值。在操作期间,经训练的ML模型将被馈送类似于预测器的数据:从t0到tn的过程值和设定点,以及从tn+1到tend的来自操作员的设定点的计划的未来轨迹。该模型可以根据未来过程变量轨迹输出预期的设施行为。
图4示意性地示出了根据实施例的训练过程。这可以是关于图3的后续活动。最初,虚拟操作员加载设定点配置文件。然后,加载仿真的初始状态并运行仿真。在仿真运行期间,虚拟操作员操纵设定点。可选地,数据被存储,可能用于其他用途,并且机器学习模型被训练和保存。
图5示意性地示出了根据实施例的通常在工业过程的运行时间期间运行的预测过程。过去的过程值和设定值是从包括过程设施历史记录在内的设施自动化系统中收集的。操作员提供计划的设定点轨迹;在最简单的情况下,这可能只包括一个设定点。经训练的模型在指定的时间范围内执行预测。可选地,预测警报逻辑被用来向操作员指示警报是否将由预测的过程值轨迹触发。最后,向操作员示出过程值轨迹和对应的警报。
图6示意性地示出了根据实施例的代理模型训练工作流程。第一原理动态设施模型被用来创建数据,该数据被记录以用作训练数据。仿真可能是一种可行的方法,因为在常规生产过程中,操作员会避免达到临界阈值,并且因此训练数据会不足。然而,在仿真中,可以生成这样的训练数据,而不会在生产过程中产生负面影响。此外,可以用历史设施数据丰富训练数据。根据记录的仿真数据以及可选的历史设施数据,生成训练样本。训练样本由如下组成:作为预测变量的在n个时间点上的过程值、设定点和控制输出以及KPI值,以及作为因变量的一个或多个KPI的接下来m个值。一种常见的配置是使用若干PV、设定点和控制输出,以及多个KPI和单个KPI的接下来m个值。在这里,m必须选择得足够大,以使得预测包括相关的时间范围。
训练样本被用来训练机器学习算法,例如递归神经网络或ANN。经训练的算法,例如具有经训练权重的循环神经网络,将成为代理模型或其一部分。
图7示意性地示出了根据实施例的使用用于预测警报的代理模型的示例。代理模型被馈送例如来自DCS(分布式控制系统)的相同设定点、控制输出的过去n个值,以及在训练期间所使用的过程值和KPI(关键执行指示符)值,并且产生m步的轨迹。KPI值可能出自过程和/或出自DCS。可选地,通过警报逻辑分析m步的轨迹,检查是否违反了相关的目标值,并且如果是这种情况,则将在对应的人机界面上(例如在警报列表中)呈现警报。备选地,可以将KPI的未来轨迹呈现给操作员。
图8示意性地示出了根据实施例的与过程变量的时间演变相对应的警报管理系统的区间。有时被称为警报智能暂缓(Alarm Intelligent Deferment)(AID)的ANN系统可以在事件导致警报之前主动管理它们。AID可以减少向PO发出警报的数量,同时控制警报到达PO的时序。AID的目标是减轻操作员的精神负担并减少人为错误。PV通常操作在如图8中所示的安全区间内。AMS(警报管理系统)可以维持多区间警报系统,以避免达到危险的操作条件。如果过程变量退出安全区间,则会向操作员触发警报(视觉或声音警告),操作员必须通过操纵设定点进行手动干预。如果过程进入危险区间,硬编码仪表安全系统,例如安全阀等等会被触发。如果PV无法通过这些手段进行控制,则它会进入破坏区间,在该区间可能会发生整个系统关闭,从而会导致严重的经济成本和安全隐患。AID的目的是最大程度地将PV保持在安全区间内,并仅允许有限数量的事件到达设施操作员(PO)。然后,人类操作员可以舒适地应用他们的经验知识,而不会出现多个警报淹没他们的认知状态。这样,很少有事件(如果有的话)会逃出警报区间,走向更危险的状况。AID将在其监控PO的动作时不断增长其知识库,例如解决未见过的情况,并运行更多仿真以扩展其对警报事件的理解。
图9示意性地示出了根据另一实施例的区间或警报极限。这些区间包括警报管理中位于临界上限和临界下限之间的典型阈值。警报阈值可以从临界上限向后定义,给操作员足够的时间做出反应。阈值的定义可能成为一项艰巨的任务,特别是将给操作员足够的时间做出反应。此外,静态定义的阈值不能反映设施的当前状态和当前动态。如果定义了响应所需的时间,则可以使用预测模型来决定过程值是否将在时间窗口内超过任何阈值,从而给操作员足够的时间对警报做出反应。如果预测模型是设施的动态模型,则警报也将能够解释设施的当前状态和动态。
图10示意性地示出了根据实施例的机器学习模型的训练过程。训练阶段可以离线和/或在使用机器学习模型之前被启动。训练数据可以通过多个源来生成。第一源可以包括对事件和操作员动作的仿真以及这些动作的对应结果。第二源可以包括来自真实过程的被监控的数据。收集类似的数据格式,更具体地说:“设定点”加上“过去PV时间序列”和对应的“未来PV时间序列”。时间序列被定义为PV按时间步长{PVt-τ,PVt-τ+1,…,PVt}的演变,而设定点构成PO可访问的操纵变量,{MVt+Τ}。PV与MV的组合产生了用于提前的fmv(T)的PV{PVt+1,PVt+2,…,PVt+T}的演变。
训练数据被收集在知识库中,并由训练两个ML模块的ML-训练系统使用:(1)ML暂缓模块:如果存在导致对指定的时间头的问题的可行解决方案的设定点(MV)的组合,那么使用对应的数据来训练这个模块。该模块输出针对给定时间序列的设定点动作,其将PV的未来演变保留在安全区间。设定点动作根据其KPI从最有效到最不有效进行排名。(2)ML延迟模块:如果在基于知识的数据中不存在为指定的提前时间提供可行解决方案(保留在安全区间内)的设定点组合,那么使用对应的数据来训练该模块。不同的设定点动作根据它们在退出安全区间之前可以附加到PV的时间延迟来进行排名(与无动作相比)。当前知识库中可能不存在任何可以为PV添加延迟的设定点动作。
人工设备操作员可以被采用来指导ML训练并促进其工作。PO的主要输入在于,指定哪个是最适合每个事件或PV的MV。此外,PO可以建议近似的设定点动作,例如根据经验知识对MV进行量化,以帮助更进一步的ML训练。ML训练模块在图形用户界面中通过查询来提示PO,以促进交互。在操作员的低认知负担或零认知负担期间提示查询。这样,ML训练系统可以显著限制其探索空间,并为ML模块的训练获得良好的初始条件。
图11示意性地示出了根据实施例的警报管理系统的操作阶段。可以持续监控(多个)感兴趣的PV。该数据被馈送到预测系统。预测系统评估任何PV离开安全区间并在预定义的时间范围内发出警报的概率。如果概率高于阈值,则调用ML模块来解决即将发生的事件。
如果针对此事件存在可行的解决方案,则调用ML暂缓模块,该模块启动所有对应的动作以将PV保留在安全区间内。如果采取的行动成功,则预测系统停止发出警报预测。
如果ML暂缓模块的知识库中不存在可以成功解决预测事件的可行的解决方案,则调用ML延迟模块。ML延迟模块尝试在发出实际警报之前插入时间缓冲区。如果PO承受着沉重的认知负荷(PO已经在处理针对其他事件的多个发出警报),则ML延迟模块选择最大可行延迟。如果PO处于低认知负荷或零认知负荷下,则模块相应地选择小延迟或零延迟。
如果不存在可行的解决方案并且没有延迟可以被添加到预测警报的演变中,则适当地通知PO。PO解决警报的动作被记录并相应地扩充知识库,以使得在未来发生事件时自主解决事件,从而增强AID的问题解决能力。
图12示意性地示出了根据实施例的基于预测的警报是有益的示例情形。它示出了四种不同的过程价值轨迹:
(a)被用来定义静态阈值的假设的PV轨迹。阈值的选择方式使得操作员有足够的时间来对警报进行响应并防止PV超过临界阈值。
(b)PV增加速度快于假设的情况。警报将激活得太迟,并且操作员没有足够的时间进行响应。
(c)与(b)相反,PV增加速度比假设的要慢。警报激活得太早。根据报警管理标准,这也是不期望的。操作员可能会忽略警报
(d)轨迹在超过静态阈值之后发生变化,并且永远不会超过临界阈值。不需要警报。
图13示意性地示出了根据实施例的代理模型训练工作流程。第一原理动态设施模型被用来创建数据,该数据被记录以用作训练数据。使用仿真是因为在生产过程中操作员会避免达到临界阈值并且训练数据会不足。然而,在仿真中,可以生成这样的训练数据,而不会在生产过程中产生负面影响。然而,可以用历史设施数据来丰富训练数据。根据记录的仿真数据以及可选的历史设施数据,生成训练样本。训练样本由如下组成:作为预测变量的在n个时间点上的过程值、设定点和控制输出,以及作为因变量的一个或多个过程值的接下来m个值。一种常见的配置是使用若干PV、设定点和控制输出,以及单个PV的接下来n个值。此处,m必须选择得足够大,以使得预测包括相关的时间范围,即,比反应时间长。训练样本被用来训练机器学习算法,例如循环神经网络。经训练的算法,例如具有经训练权重的递归神经网络,将成为代理模型。
图14示意性地示出了根据实施例的使用用于预测警报的代理模型的示例。代理模型被馈送例如来自DCS的相同设定点、控制输出的过去n个值,以及在训练期间所使用的例如来自过程(技术上也可能来自DCS)的过程值,并且产生m步的轨迹。m步的数量对应于对警报进行响应所需的时间。通过报警逻辑分析m步的轨迹,检查是否违反了相关的阈值,如果是这种情况,则将在对应的人机界面上呈现报警,例如:报警列表。
在变体中,警报逻辑仍然可以基于静态阈值进行评估,但是分析是否(a)如果以静态阈值发出警报,仍有足够的时间响应,(b)有超过响应所需的时间,或(c)PV可能未达到临界阈值。在(a)的情况下,逻辑可能会比平时更早地激活警报并向HMI提供原因信息,例如预计的轨迹。在(b)的情况下,逻辑可能不会抑制警报,而是在HMI上添加仍有时间响应的附加信息,例如预计的轨迹。在(c)的情况下,逻辑可能不会抑制警报,而是在HMI上添加可能根本不需要做出反应的附加信息,例如预计的轨迹。
图15示意性地示出了根据实施例的使用在线仿真的方法。为此,将当前设施数据馈送到系统中。(0)在第一步中,可以估计设施的状态,并且估计的状态被用来(1)初始化仿真或者通过将设施数据馈送到仿真中而初始化的仿真,直到仿真以真实设施状态收敛。这种真实设施状态可能是过去的,理想情况下是在干扰出现时,甚至更早。接下来,(3)选择干扰曲线。选择可以基于来自设施的读数,例如通过排除某些不太可能发生的干扰。也有可能针对同一仿真运行选择多个干扰曲线。(4)利用干扰曲线,运行仿真。步骤(3)和(4)可能发生在并发执行中。由仿真产生的数据,即过程值PV和设定值SP(或MV),将与实际设施数据相匹配。匹配可以通过合适的距离测量发生,如欧几里得距离、动态时间扭曲(DTW)、Jaccarq、Levenshtein、基于相关性、自相关等。如果匹配显示距离足够小,则可能的根本原因被(5)呈现给用户。备选地,将呈现具有最小度量的干扰曲线。如果根据专家或机器学习的定义,对于某些类型的干扰,对抗措施是已知的(方法),则系统可以(6)向用户推荐这些措施或直接触发动作的执行。仿真模型可能不是第一原理模型,而是用于满足在线使用仿真的实时性要求的代理模型。
图16示意性地示出了根据实施例的利用来自仿真和机器学习的数据进行根本原因分析的示例。变体可能不直接使用仿真和/或代理模型和干扰。相反,可以训练机器学习模型来标识可能的根本原因干扰。该过程被拆分为两步:训练和根本原因分析(RCA)。
在训练中,仿真是用大量干扰曲线以及干扰曲线的组合来执行的。仿真利用预测器——例如过程值、设定点、警报和事件——以及在仿真期间使用的干扰曲线(作为连续信号或仅作为干扰标识符)来产生训练数据。在第二步中,使用干扰信息作为标签来训练机器学习分类器,或者训练机器学习回归以再现干扰曲线。然后将创建的模型用于RCA任务。
在RCA期间,RCA是由操作员或监控系统(例如异常检测系统)请求的。从设施收集的数据被馈送到机器学习模型中。然后可以将输出作为可能的根本原因呈现给操作员。如果根据专家或机器学习的定义,对于某些类型的干扰,对抗措施是已知的(方法),则系统可以(4)向用户推荐这些措施或直接触发动作的执行。
变体可以包括首先在代理模型上尝试来自干扰方法的动作并进行评估。例如使用贝叶斯优化,动作的过程——例如时序、顺序、设定值等——可以在优化循环中变化,并且可以基于客观时间优化动作,例如将执行时间最小化,将执行期间的吞吐量最大化等。
可以在运行设施过程的数字孪生的部署中实现变体。数字孪生使用基于模型的动力学以数字的方式复制设施过程。然而,这些只是实际过程的近似,它们会慢慢偏离设施中发生的情况。标准实践是使用来自物理设施过程的测量值将数字孪生与物理设施过程同步。然而,这些测量值并不总是足以在可能产生完全相同测量值的不同内部状态之间进行区分。这可能对设施的未来演变具有不同的影响。数字孪生可能不会在符合实际设施状态的一个瞬时运行,而是根据某种概率所加权的多种可能场景。使用ML模型可以保持、丢弃或重新加权这些场景。每当检测到干扰的特征时,并行运行的一些实例将被丢弃或被重新加权。此外,如果不存在符合ML模型的内部状态,则ML可能需要使用来自数字孪生的相关场景来增强其基于的训练数据。
图17示意性地示出了根据实施例的方法的流程图80。在步骤81中,机器学习模型10(见图1)通过输入数据20和得分数据30来进行训练。机器学习模型10——也称为ML模型——是人工神经网络ANN。输入数据20包括工业过程50的至少一个可观察过程值PV的第一时间序列21、影响工业过程50的至少一个操纵变量MV的第二时间序列22、以及工业过程50的至少一个内部变量IV的第三时间序列23。得分数据30包括指示工业过程50的异常行为的至少一个可观察过程值PV中的每个可观察过程值PV的第一临界值32,以及工业过程50的至少一个预测的可观察过程值PPV的第四时间序列34。在步骤82中,通过将第一时间序列21应用于经训练的机器学习模型10来运行经训练的机器学习模型10。在步骤83中,输出值40由经训练的机器学习模型10输出,其至少包括指示在预定义的时间距离T1中的工业过程50的异常行为的至少一个预测的可观察过程值PPV的第二临界值42。

Claims (12)

1.一种用于发现工业过程(50)的异常行为的方法,所述方法包括以下步骤:
通过输入数据(20)和得分数据(30)来训练机器学习模型(10),其中所述机器学习模型(10)是人工神经网络ANN,
其中所述输入数据(20)包括:
所述工业过程(50)的至少一个可观察过程值(PV)的第一时间序列(21),
影响所述工业过程(50)的至少一个操纵变量(MV)的第二时间序列(22),以及
所述工业过程(50)的至少一个内部变量(IV)的第三时间序列(23);
并且其中所述得分数据(30)包括:
指示所述工业过程(50)的所述异常行为的所述至少一个可观察过程值(PV)中的每个可观察过程值(PV)的第一临界值(32),以及
所述工业过程(50)的至少一个预测的可观察过程值(PPV)的第四时间序列(34);
通过将所述第一时间序列(21)应用于经训练的所述机器学习模型(10)来运行经训练的所述机器学习模型(10);以及
由经训练的所述机器学习模型(10)输出输出值(40),所述输出值(40)至少包括指示在预定义的时间距离(T1)中的所述工业过程(50)的异常行为的所述至少一个预测的可观察过程值(PPV)的第二临界值(42)。
2.根据权利要求1所述的方法,其中所述输出值(40)还包括:
取决于所述第一时间序列(21)、所述第二时间序列(21)和/或所述第三时间序列(23)中的至少一个的所述工业过程(50)的场景编号(44)。
3.根据权利要求1所述的方法,其中所述输出值(40)还包括:
取决于所述第一时间序列(21)、所述第二时间序列(21)和/或所述第三时间序列(23)中的至少一个的第五时间序列(44)。
4.根据权利要求1所述的方法,其中所述输出值(40)还包括:
所述至少一个可观察过程值(PV)的所述第一临界值(32)。
5.根据权利要求1所述的方法,还包括以下步骤:
输出取决于所述第一时间序列(21)和/或所述第三时间序列(23)中的至少一个的操纵变量(MV)。
6.根据权利要求1所述的方法,还包括以下步骤:
确定到超过预定义临界值的第二临界值(42)的时间距离。
7.根据权利要求1所述的方法,还包括以下步骤:
确定所述第二临界值(42)的增加速度;以及
当所述增加速度超过预定义临界值时输出警报。
8.一种包括指令的计算机程序产品,当所述程序由计算机和/或人工神经网络ANN执行时,所述指令使所述计算机和/或所述ANN执行根据权利要求1至7中任一项所述的方法。
9.一种计算机可读存储介质,根据权利要求8所述的计算机程序被存储在所述计算机可读存储介质上。
10.一种机器学习模型(10),被配置用于执行权利要求1至7中的任一项。
11.机器学习模型(10)在监控和/或控制工业过程(50)中的用途。
12.一种包括计算机和/或ANN的工业设施,指令被存储在所述计算机和/或所述ANN上,并且当所述程序由所述计算机和/或由所述ANN执行时,所述指令使所述计算机或所述工业设施执行根据权利要求1至7中任一项所述的方法。
CN202180028760.1A 2020-04-16 2021-04-13 用于工业过程中的智能报警管理方法 Pending CN115427907A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EPPCT/EP2020/060755 2020-04-16
EP2020060755 2020-04-16
PCT/EP2021/059529 WO2021209432A1 (en) 2020-04-16 2021-04-13 Method for an intelligent alarm management in industrial processes

Publications (1)

Publication Number Publication Date
CN115427907A true CN115427907A (zh) 2022-12-02

Family

ID=75426623

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180028760.1A Pending CN115427907A (zh) 2020-04-16 2021-04-13 用于工业过程中的智能报警管理方法

Country Status (6)

Country Link
US (1) US20230034769A1 (zh)
EP (1) EP4136514A1 (zh)
CN (1) CN115427907A (zh)
AU (1) AU2021257589A1 (zh)
CA (1) CA3173315A1 (zh)
WO (1) WO2021209432A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
LU502876B1 (en) * 2022-10-05 2024-04-08 Wurth Paul Sa Anticipating the cause of abnormal operation in industrial machines

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090210081A1 (en) * 2001-08-10 2009-08-20 Rockwell Automation Technologies, Inc. System and method for dynamic multi-objective optimization of machine selection, integration and utilization
US7117046B2 (en) * 2004-08-27 2006-10-03 Alstom Technology Ltd. Cascaded control of an average value of a process parameter to a desired value
US10809704B2 (en) * 2017-11-01 2020-10-20 Honeywell International Inc. Process performance issues and alarm notification using data analytics
EP3714036A1 (en) * 2017-11-20 2020-09-30 Lonza Ltd Process and system for propagating cell cultures while preventing lactate accumulation
US10534360B2 (en) * 2017-11-21 2020-01-14 General Electric Company Apparatus and method for automatic detection and classification of industrial alarms

Also Published As

Publication number Publication date
US20230034769A1 (en) 2023-02-02
AU2021257589A1 (en) 2022-09-22
WO2021209432A1 (en) 2021-10-21
EP4136514A1 (en) 2023-02-22
CA3173315A1 (en) 2021-10-21

Similar Documents

Publication Publication Date Title
US10809704B2 (en) Process performance issues and alarm notification using data analytics
US11353835B2 (en) Plant operation support apparatus, plant operation support method, and plant operation support program recording medium
JP5179086B2 (ja) 工業プロセスの監視方法及び監視システム
Alves et al. Deployment of a smart and predictive maintenance system in an industrial case study
US20160048139A1 (en) Real-Time Chemical Process Monitoring, Assessment and Decision-Making Assistance Method
US20220172146A1 (en) Apparatus for the semantic-based optimization of production facilities with explainability
US10824963B2 (en) Alarm handling system and method in plant process automation
WO2003042769A1 (en) Analysing events
JP2022519228A (ja) 工業プロセスで使用されるコンポーネントから発生する信号の異常を検出及び測定するためのシステムと方法
Kumaraguru et al. Integrating real-time analytics and continuous performance management in smart manufacturing systems
US20210088986A1 (en) Assistance device, learning device, and plant operation condition setting assistance system
US20230034769A1 (en) Method for an Intelligent Alarm Management in Industrial Processes
EP4080303A1 (en) Decision support in industrial plants
EP3731201A1 (en) A support system for an operator
Foong et al. ALAP: Alarm prioritization system for oil refinery
US20200385141A1 (en) Data driven machine learning for modeling aircraft sensors
EP4184261A1 (en) Determining appropriate sequences of actions to take upon operating states of industrial plants
EP3971800A1 (en) Safety interlock recommendation system
US20210065056A1 (en) Parameter calculating device, parameter calculating method, and recording medium having parameter calculating program recorded thereon
Sebzali et al. Joint analysis of process and operator performance in chemical process operational safety
US20230168791A1 (en) Method for Generating a Series of Content Areas for Presentation at a Display Screen
US20230259120A1 (en) Intelligent workflow engine for manufacturing process
JP2002133026A (ja) 業務支援システム、操業支援システム及び記録媒体
Martínez et al. A Data-Driven Approach for Components Useful Life Estimation in Wind Turbines
Tripathi et al. Extrapolative Preservation Management of Medical Equipment through IoT

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination