CN111260176A - 用于排除技术设施中的故障状况的方法和系统 - Google Patents

用于排除技术设施中的故障状况的方法和系统 Download PDF

Info

Publication number
CN111260176A
CN111260176A CN201911212320.2A CN201911212320A CN111260176A CN 111260176 A CN111260176 A CN 111260176A CN 201911212320 A CN201911212320 A CN 201911212320A CN 111260176 A CN111260176 A CN 111260176A
Authority
CN
China
Prior art keywords
technical facility
facility
fault condition
technical
mitigation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911212320.2A
Other languages
English (en)
Other versions
CN111260176B (zh
Inventor
A.西罗希
S.阿拉姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of CN111260176A publication Critical patent/CN111260176A/zh
Application granted granted Critical
Publication of CN111260176B publication Critical patent/CN111260176B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • G05B23/0254Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a quantitative model, e.g. mathematical relationships between inputs and outputs; functions: observer, Kalman filter, residual calculation, Neural Networks
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0243Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model
    • G05B23/0245Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults model based detection method, e.g. first-principles knowledge model based on a qualitative model, e.g. rule based; if-then decisions
    • G05B23/0248Causal models, e.g. fault tree; digraphs; qualitative physics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • G05B13/027Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion using neural networks only
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0297Reconfiguration of monitoring system, e.g. use of virtual sensors; change monitoring method as a response to monitoring results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Educational Administration (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及用于排除技术设施中的故障状况的方法和系统。提供了用于排除技术设施(107)中的故障状况的方法(300)和系统(100)。在本发明的一个方面中,该方法包括在技术设施的至少一部分中预测故障状况的发生。该方法还包括确定所预测的故障状况的根本原因。另外,该方法包括识别用以解决故障状况的一个或多个缓解动作。此外,该方法包括确定与一个或多个缓解动作中的至少一个缓解动作相关联的在技术设施(107)上的结果。该方法还包括基于所确定的影响,在与用户相关联的设备(108)上输出要在技术设施(107)中实施的至少一个缓解动作。

Description

用于排除技术设施中的故障状况的方法和系统
技术领域
本发明涉及用于排除技术设施(technical installation)中的故障状况的方法和系统。
背景技术
诸如电厂或冶炼厂之类的技术设施或工业机构包括多个现场设备或组件。每个组件可以是该技术设施高效运转所需的工业过程的一部分。因此,这样的组件和过程在技术设施中扮演着重要角色。组件的性能和过程的效率提高了技术设施的可靠性,并降低了技术设施的总体能耗、服务和维护成本。因此,增加技术设施的生命周期和安全性,从而降低技术设施的终身维护成本。当前,通过基于机器学习模型的监控系统来执行技术设施的组件或过程中的故障状况的检测。这样的基于模型的训练系统对与组件和过程相关联的几个参数进行连续评估,并为用户生成报警,使得在发现偏差时采取必要的动作。
然而,这样的基于模型的系统的使用取决于模型的训练程度。训练数据不足可能会导致模型错误地识别故障,从而导致技术设施停摆。另外,当前的基于机器学习模型的系统仅能够针对检测到的故障状况生成报警。这不会提供故障状况的根本原因分析。因此,确定缓解动作较为困难。此外,现有的基于模型的系统并不会于在技术设施中实施缓解动作之前测试缓解动作的影响。因此,没有任何方式能预测缓解动作是否会高效地纠正故障状况。
鉴于上述内容,在技术设施中需要改进的智能故障检测系统,其能够准确地识别故障状况的原因,并于在技术设施中实施缓解动作之前高效地确定这样的缓解动作的影响。
发明内容
因此,本发明的目的是要提供用于排除技术设施中的设备的故障状况的方法和系统,其于在该技术设施中实施所提议的缓解动作之前对所述缓解动作执行影响分析。
通过如权利要求1中要求保护的排除技术设施中的设备的故障状况的方法、如权利要求14、15和16中要求保护的系统、如权利要求17中要求保护的计算机程序产品以及如权利要求18中要求保护的确定与缓解动作相关联的在技术设施上的结果的计算机可读介质来解决本发明的目的。
在下文中,关于所要求保护的系统以及所要求保护的方法来描述根据本发明的解决方案。可以将本文的特征、优点或替换实施例赋予其他要求保护的客体,并且反之亦然。换言之,可以利用在方法的上下文中描述或要求保护的特征来改进系统权利要求。在这种情况下,方法的功能特征通过系统的客观存在的单元来体现。
基于上述方法,本发明通过以下方式实现了目的:确定与一个或多个缓解动作中的至少一个缓解动作相关联的在技术设施上的结果;以及基于所确定的影响,在与用户相关联的设备上输出要在技术设施中实施的至少一个缓解动作。本发明的优点在于,确定缓解动作对技术设施的影响提高了技术设施中的组件和过程的可靠性。本发明的另一优点在于,于在技术设施中实施缓解动作之前确定缓解动作的结果使得能够减少解决故障状况的时间和精力。
本发明描述了一种排除技术设施中的故障状况的方法。该方法包括确定技术设施中的至少一个设备的故障状况。故障状况可以是技术设施或技术设施的一部分的设备、组件、单元或装备中的异常或缺陷。异常也可以是由于技术设施中执行的过程中的错误而导致的。这样的异常可能会影响技术设施的运转或使技术设施完全故障。对故障状况的高效识别使得能够准确地确定对应的缓解动作。该方法还包括确定所预测的故障状况的根本原因。故障状况的根本原因可以是导致设备运行不畅的主要因素或引发因素。确定故障状况的根本原因使得能够准确地识别用以解决这样的故障状况的缓解动作。该方法还包括识别用以解决所述故障状况的一个或多个缓解动作。缓解动作是为了降低或根除一个或多个事件对人类生命和财产的风险而实施的步骤或过程。因此,识别一个或多个缓解动作使得能够解决故障状况,从而允许技术设施高效运转。该方法还包括确定与一个或多个缓解动作中的至少一个缓解动作相关联的在技术设施上的结果。在实施缓解动作后,作为结果,可能会在技术设施中引发效果。确定缓解动作对技术设施的效果很重要,这样才能识别出是否实现了缓解动作的优选结果。尽早识别出缓解动作的结果使得能够有效地利用时间和资源来维护技术设施。该方法还包括在与用户相关联的设备上输出所述至少一个缓解动作。如果缓解动作的结果是优选结果,则将这样的缓解动作输出到与技术设施的用户相关联的设备上。这样的用户可以是负责技术设施的运转和维护的任何实体。有利地,适时地将缓解动作通知给技术设施的用户。因此,使得能够高效地实施缓解动作。
根据实施例,在预测故障状况的发生时,该方法包括从技术设施中安装的一个或多个传感器获得传感器数据。这样的一个或多个传感器可以被配置成收集与技术设施中的至少一个设备相关联的一个或多个参数值。传感器数据可以包括与技术设施中的设备相关联的实时数据,并且这样的一个或多个参数值可以与事件相关联。事件可以例如与故障状况相关联。事件可以是技术设施的至少一部分中的任何发生的事情或活动。事件可以是技术设施中的工业过程的一部分,并且可以与形成工业过程的一部分的组件的运转相关联。参数可以是例如温度、压力、流体液位等。该方法还包括通过合适的机器学习模型来处理所获得的传感器数据。这样的机器学习模型可以是例如基于神经网络的模型,其可以能够基于与技术设施中的设备相关联的历史和实时数据来处理传感器数据以预测设备的故障状况。该方法还包括使用一种或多种机器学习技术来预测故障状况。机器学习模型可以采用一种或多种机器学习技术来预测设备的故障状况。这样的一种或多种机器学习技术可以包括有监督和无监督的学习技术。有利地,预测设备的故障状况使得技术设施的用户能够在设备中产生实际故障状况之前发起必要的动作。因此,避免了技术设施中的设备的任何损失和损坏。
根据实施例,在处理所获得的数据时,该方法包括获得与技术设施相关联的工程数据。这样的工程数据可以包括例如功能图、工厂显示、复合组件、样机、运行时容器类型、运行时容器编号、对等通信详细信息以及自动化服务器的类型。该方法还包括从与技术设施相关联的管道和仪表图获得数据。这样的管道和仪表图指示过程流中的一个或多个管道、器皿和组件以及仪表和控制设备。该方法还包括基于工程数据来确定在技术设施的至少一部分中执行的工业过程的类型。该方法还包括识别技术设施的至少一部分中的一个或多个组件。这样的组件可以是所确定的工业过程的一部分。工业过程可以包括可以得到特定结果的几个可执行步骤。准确而高效地执行每个可执行步骤对于技术设施的运转至关重要。可以从管道和仪表图中确定一个或多个组件。在实施例中,可以使用例如一个或多个标签信息来识别工业过程和/或相关联的组件。技术设施中的工业过程和组件可以与标签信息相关联。这样的标签信息可以包括与例如过程相关标识、设施单位内的设施点、位置标识等有关的数据。因此,这样的标签信息可以使得能够准确地确定故障状况。该方法包括识别与事件相关联的故障信号。可以基于传感器数据来识别这样的故障信号。该方法还包括将故障信号映射到所述工业过程的类型和/或所述一个或多个组件中的至少一个。有利地,故障信号到组件和/或工业过程的映射使得能够准确地预测故障状况。该方法的另一优点在于,在技术设施中准确地确定故障状况的位置。
根据实施例,在识别故障信号时,该方法包括将实时参数值与预定义的门限值进行比较。每个参数可以具有预定义的最佳值或门限值。参数值与这样的预定义的门限值的偏差可能会导致工业过程或技术设施运转异常。预定义的门限值可以例如存储在技术数据库中。该方法还包括确定在参数值与预定义的门限值之间是否存在偏差。这样的偏差可以对应于故障信号。
根据实施例,使用决策矩阵来确定所预测的故障状况的根本原因。根据实施例,使用决策矩阵来确定故障状况的根本原因包括获得与技术设施相关联的工程数据。这样的工程数据可以包括例如功能图、工厂显示、复合组件、样机、运行时容器类型、运行时容器编号、对等通信详细信息以及自动化服务器的类型。该方法还包括从与技术设施相关联的管道和仪表图获得数据。这样的管道和仪表图指示过程流中的一个或多个管道、器皿和组件以及仪表和控制设备。该方法还包括基于工程数据来确定在技术设施的至少一部分中执行的工业过程的类型。这样的工业过程可以与事件相关联。工业过程可以包括可以得到特定结果的几个可执行步骤。准确而高效地执行每个可执行步骤对于技术设施的运转至关重要。该方法还包括识别技术设施的至少一部分中的一个或多个组件。这样的组件可以是所确定的工业过程的一部分。可以从管道和仪表图中确定一个或多个组件。在实施例中,可以使用例如一个或多个标签信息来识别工业过程和/或相关联的组件。技术设施中的工业过程和组件可以与标签信息相关联。这样的标签信息可以包括与例如过程相关标识、设施单位内的设施点、位置标识等有关的数据。因此,这样的标签信息可以使得能够准确地确定故障状况。该方法包括基于所识别的一个或多个组件和工业过程的类型来生成调查表,并从调查表中确定技术设施中的故障状况的根本原因。决策矩阵可以使用例如决策树流程。调查表可以用于生成决策树节点。调查表可以是基于与技术设施中的一个或多个组件相关联的标签信息。每个决策树节点可以处理内部节点问题并提供输出。这样的输出可以是以分支的形式,其中这样的分支可以具有另外的子节点。决策树分支可以包括诸如“是”和“否”之类的选项作为答案。如果对内部节点问题的答案为“是”,则可以创建决策树的后续分支。可以创建决策树的这样的分支,直到识别出相关联的故障组件为止。替换地,决策树可以指示与故障状况相关联的故障组件。因此,所映射的组件有利地指示故障状况。
根据该方法的实施例,可以创建根本原因分析报告。这样的报告可以包括与使用决策矩阵确定的与技术设施相关联的工业过程和一个或多个组件相关联的数据。有利地,根本原因分析报告为技术设施的用户提供了所预测的故障状况和相关原因的简明信息。
根据本发明的实施例,在确定与一个或多个缓解动作中的至少一个缓解动作相关联的结果时,该方法包括在技术设施的虚拟模型中实施所述一个或多个缓解动作中的一个。虚拟模型可以是技术设施的数字孪生,其能够模拟技术设施的功能。这样的虚拟模型可以是基于云环境。在实施例中,与技术设施的运转相关联的所有数据可以存储在云环境中。虚拟模型可以使用这样的数据来模拟技术设施的功能。有利地,模拟技术设施的功能使得能够及时地识别用以缓解故障状况的适当的缓解动作。虚拟模型的使用还使得能够有效地利用时间和资源,从而防止了在技术设施中实施不正确的缓解动作时的精力浪费。因此,虚拟模型允许于在技术设施中实时地实施缓解动作之前预测这样的缓解动作的结果。缓解动作的实施可以包括在虚拟模型中执行缓解动作。该方法还包括使用虚拟模型来预测缓解动作对技术设施的效果。虚拟模型可以例如基于从技术设施接收到的存档数据和实时信息来执行预测分析。预测分析可以是基于从存档数据中识别出的模式,从而使得能够评估与缓解动作相关联的风险和潜在可能。
根据本发明的优选实施例,该方法包括确定所实施动作的结果是否是优选结果。通过在技术设施的虚拟模型中实施缓解动作而引起的效果使得能够识别出缓解动作的结果是否是优选结果。优选结果可以包括在技术设施中产生期望成果使得故障状况得以解决的结果。替换地,优选结果还可以包括进一步解决技术设施中的故障状况的原因的结果。如果结果是优选结果,则在与技术设施的用户相关联的设备上输出缓解动作。可以向技术设施的用户通知优选的缓解动作,以使得能够高效且及时地解决故障状况。输出可以是以例如与用户相关联的设备上的通知的形式。在实施例中,这样的通知可以包括缓解动作的细节、以及要继续在技术设施中实施缓解动作的基于图形用户接口的选项。在实施例中,如果缓解动作的结果不是优选结果,则可以在虚拟模型中实施来自所述一个或多个缓解动作的另一缓解动作。有利地,可以于在技术设施中实际实施缓解动作之前预测缓解动作的结果。此外,如果未实现优选结果,则可以实施替换的缓解动作,而不会造成烦扰与时间浪费。因此,防止了由于实施了不正确的缓解动作而导致的任何技术设施故障。
根据本发明的实施例,在虚拟模型中实施所述一个或多个缓解动作中的一个,直到确定了优选结果为止。因此,使得能够识别出解决故障状况的高效的缓解动作。
根据本发明的另一实施例,可以在技术设施中执行具有优选结果的缓解动作。在实施例中,缓解动作在设备上的输出可以与有时间限制的动作相关联。如果未从用户接收到对缓解动作的实施的响应,则可以在所安排的时间段期满时在技术设施中自动地执行或实施缓解动作。有利地,及时地实施缓解动作防止了技术设施中的毁灭性的灾难。此外,缓解动作在技术设施中的实施不会因缺少来自技术设施用户的响应而暂缓。
根据本发明的实施例,在识别一个或多个缓解动作时,该方法包括分析故障状况以确定故障模式。故障模式可以包括例如实时参数值、所估计的预定义的门限值以及实时参数值与预定义的门限值之间的偏差。故障模式还可以提供值的偏差以及时间戳。因此,还可以分析故障状况的进程。该方法还包括将故障模式映射到预定义的矩阵。预定义的矩阵可以包括技术设施中已识别的所有故障模式以及过去实施的对应缓解动作。将故障模式映射到预定义的矩阵,并基于相关性来识别一个或多个缓解动作。该方法还包括从预定义的矩阵来确定用以解决所分析的故障状况的一个或多个缓解动作。有利地,预定义的矩阵使得能够准确地识别用于解决故障状况的一个或多个缓解动作。
根据本发明的又一实施例,在与技术设施的用户相关联的设备上生成警报。当确定了参数值与预定义的门限值之间的偏差时,可以生成这样的警报。警报可以例如是以通知的形式。这样的通知还可以包括基于声音的警报。有利地,警报使得能够将故障状况高效地传达给技术设施的用户。
在一个方面中,本发明涉及一种用于排除技术设施中的故障状况的系统。该系统包括一个或多个处理单元、以及与所述一个或多个处理单元耦合的一个或多个存储器单元。存储器单元包括故障排除模块。故障排除模块可以被配置成确定技术设施中的至少一个设备的故障状况。故障状况可以是技术设施或技术设施的一部分的设备、组件、单元或装备中的异常或缺陷。异常也可以是由于技术设施中执行的过程中的错误而导致的。这样的异常可能会影响技术设施的运转或使技术设施完全故障。对故障状况的高效识别使得能够准确地确定对应的缓解动作。故障排除模块还可以被配置成确定所预测的故障状况的根本原因。故障状况的根本原因可以是导致设备运行不畅的主要因素或引发因素。确定故障状况的根本原因使得能够准确地识别用以解决这样的故障状况的缓解动作。故障排除模块还可以被配置成识别用以解决所述故障状况的一个或多个缓解动作。缓解动作是为了降低或根除一个或多个事件对人类生命和财产的风险而实施的步骤或过程。因此,识别一个或多个缓解动作使得能够解决故障状况,从而允许技术设施高效运转。故障排除模块还可以被配置成确定与一个或多个缓解动作中的至少一个缓解动作相关联的在技术设施上的结果。在实施缓解动作后,作为结果,可能会在技术设施中引发效果。确定缓解动作对技术设施的效果很重要,这样才能识别出是否实现了缓解动作的优选结果。尽早识别出缓解动作的结果使得能够有效地利用时间和资源来维护技术设施。故障排除模块还可以被配置成在与用户相关联的设备上输出所述至少一个缓解动作。如果缓解动作的结果是优选结果,则将这样的缓解动作输出到与技术设施的用户相关联的设备上。这样的用户可以是负责技术设施的运转和维护的任何实体。有利地,适时地将缓解动作通知给技术设施的用户。因此,使得能够高效地实施缓解动作。
根据实施例,在预测故障状况的发生时,故障排除模块可以被配置成从技术设施中安装的一个或多个传感器获得传感器数据。这样的一个或多个传感器可以被配置成收集与技术设施中的至少一个设备相关联的一个或多个参数值。传感器数据可以包括与技术设施中的设备相关联的实时数据,并且这样的一个或多个参数值可以与事件相关联。事件可以例如与故障状况相关联。事件可以是技术设施的至少一部分中的任何发生的事情或活动。事件可以是技术设施中的工业过程的一部分,并且可以与形成工业过程的一部分的组件的运转相关联。参数可以是例如温度、压力、流体液位等。故障排除模块还可以被配置成通过合适的机器学习模型来处理所获得的传感器数据。这样的机器学习模型可以是例如基于神经网络的模型,其可以能够基于与技术设施中的设备相关联的历史和实时数据来处理传感器数据以预测设备的故障状况。故障排除模块还可以被配置成使用一种或多种机器学习技术来预测故障状况。机器学习模型可以采用一种或多种机器学习技术来预测设备的故障状况。这样的一种或多种机器学习技术可以包括有监督和无监督的学习技术。有利地,预测设备的故障状况使得技术设施的用户能够在设备中产生实际故障状况之前发起必要的动作。因此,避免了技术设施中的设备的任何损失和损坏。
根据实施例,在处理所获得的数据时,故障排除模块可以被配置成获得与技术设施相关联的工程数据。这样的工程数据可以包括例如功能图、工厂显示、复合组件、样机、运行时容器类型、运行时容器编号、对等通信详细信息以及自动化服务器的类型。故障排除模块还可以被配置成从与技术设施相关联的管道和仪表图获得数据。这样的管道和仪表图指示过程流中的一个或多个管道、器皿和组件以及仪表和控制设备。故障排除模块还可以被配置成基于工程数据来确定在技术设施的至少一部分中执行的工业过程的类型。故障排除模块还可以被配置成识别技术设施的至少一部分中的一个或多个组件。这样的组件可以是所确定的工业过程的一部分。工业过程可以包括可以得到特定结果的几个可执行步骤。准确而高效地执行每个可执行步骤对于技术设施的运转至关重要。可以从管道和仪表图中确定一个或多个组件。在实施例中,可以使用例如一个或多个标签信息来识别工业过程和/或相关联的组件。技术设施中的工业过程和组件可以与标签信息相关联。这样的标签信息可以包括与例如过程相关标识、设施单位内的设施点、位置标识等有关的数据。因此,这样的标签信息可以使得能够准确地确定故障状况。故障排除模块还可以被配置成识别与事件相关联的故障信号。可以基于传感器数据来识别这样的故障信号。故障排除模块还可以被配置成将故障信号映射到所述工业过程的类型和/或所述一个或多个组件中的至少一个。有利地,故障信号到组件和/或工业过程的映射使得能够准确地预测故障状况。另一优点在于,在技术设施中准确地确定故障状况的位置。
根据实施例,在识别故障信号时,故障排除模块还可以被配置成将实时参数值与预定义的门限值进行比较。每个参数可以具有预定义的最佳值或门限值。参数值与这样的预定义的门限值的偏差可能会导致工业过程或技术设施运转异常。预定义的门限值可以例如存储在技术数据库中。故障排除模块还可以被配置成确定在参数值与预定义的门限值之间是否存在偏差。这样的偏差可以对应于故障信号。
根据实施例,使用决策矩阵来确定所预测的故障状况的根本原因。根据实施例,使用决策矩阵来确定故障状况的根本原因包括获得与技术设施相关联的工程数据。这样的工程数据可以包括例如功能图、工厂显示、复合组件、样机、运行时容器类型、运行时容器编号、对等通信详细信息以及自动化服务器的类型。故障排除模块还可以被配置成从与技术设施相关联的管道和仪表图获得数据。这样的管道和仪表图指示过程流中的一个或多个管道、器皿和组件以及仪表和控制设备。故障排除模块还可以被配置成基于工程数据来确定在技术设施的至少一部分中执行的工业过程的类型。这样的工业过程可以与事件相关联。工业过程可以包括可以得到特定结果的几个可执行步骤。准确而高效地执行每个可执行步骤对于技术设施的运转至关重要。故障排除模块还可以被配置成识别技术设施的至少一部分中的一个或多个组件。这样的组件可以是所确定的工业过程的一部分。可以从管道和仪表图中确定一个或多个组件。在实施例中,可以使用例如一个或多个标签信息来识别工业过程和/或相关联的组件。技术设施中的工业过程和组件可以与标签信息相关联。这样的标签信息可以包括与例如过程相关标识、设施单位内的设施点、位置标识等有关的数据。因此,这样的标签信息可以使得能够准确地确定故障状况。故障排除模块还可以被配置成基于所识别的一个或多个组件和工业过程的类型来生成调查表,并从调查表中确定技术设施中的故障状况的根本原因。决策矩阵可以使用例如决策树流程。调查表可以用于生成决策树节点。调查表可以是基于与技术设施中的一个或多个组件相关联的标签信息。每个决策树节点可以处理内部节点问题并提供输出。这样的输出可以是以分支的形式,其中这样的分支可以具有另外的子节点。决策树分支可以包括诸如“是”和“否”之类的选项作为答案。如果对内部节点问题的答案为“是”,则可以创建决策树的后续分支。可以创建决策树的这样的分支,直到识别出相关联的故障组件为止。替换地,决策树可以指示与故障状况相关联的故障组件。因此,所映射的组件有利地指示故障状况。
根据实施例,可以创建根本原因分析报告。这样的报告可以包括与使用决策矩阵确定的与技术设施相关联的工业过程和一个或多个组件相关联的数据。有利地,根本原因分析报告为技术设施的用户提供了所预测的故障状况和相关原因的简明信息。
根据本发明的实施例,在确定与一个或多个缓解动作中的至少一个缓解动作相关联的结果时,故障排除模块还可以被配置成在技术设施的虚拟模型中实施所述一个或多个缓解动作中的一个。虚拟模型可以是技术设施的数字孪生,其能够模拟技术设施的功能。这样的虚拟模型可以是基于云环境。在实施例中,与技术设施的运转相关联的所有数据可以存储在云环境中。虚拟模型可以使用这样的数据来模拟技术设施的功能。有利地,模拟技术设施的功能使得能够及时地识别用以缓解故障状况的适当的缓解动作。虚拟模型的使用还使得能够有效地利用时间和资源,从而防止了在技术设施中实施不正确的缓解动作时的精力浪费。因此,虚拟模型允许于在技术设施中实时地实施缓解动作之前预测这样的缓解动作的结果。缓解动作的实施可以包括在虚拟模型中执行缓解动作。故障排除模块还可以被配置成使用虚拟模型来预测缓解动作对技术设施的效果。虚拟模型可以例如基于从技术设施接收到的存档数据和实时信息来执行预测分析。预测分析可以是基于从存档数据中识别出的模式,从而使得能够评估与缓解动作相关联的风险和潜在可能。
根据本发明的优选实施例,故障排除模块可以被配置成确定所实施动作的结果是否是优选结果。通过在技术设施的虚拟模型中实施缓解动作而引起的效果使得能够识别出缓解动作的结果是否是优选结果。优选结果可以包括在技术设施中产生期望成果使得故障状况得以解决的结果。替换地,优选结果还可以包括进一步解决技术设施中的故障状况的原因的结果。如果结果是优选结果,则在与技术设施的用户相关联的设备上输出缓解动作。可以向技术设施的用户通知优选的缓解动作,以使得能够高效且及时地解决故障状况。输出可以是以例如与用户相关联的设备上的通知的形式。在实施例中,这样的通知可以包括缓解动作的细节、以及要继续在技术设施中实施缓解动作的基于图形用户接口的选项。在实施例中,如果缓解动作的结果不是优选结果,则可以在虚拟模型中实施来自所述一个或多个缓解动作的另一缓解动作。有利地,可以于在技术设施中实际实施缓解动作之前预测缓解动作的结果。此外,如果未实现优选结果,则可以实施替换的缓解动作,而不会造成烦扰与时间浪费。因此,防止了由于实施了不正确的缓解动作而导致的任何技术设施故障。
根据本发明的实施例,在虚拟模型中实施所述一个或多个缓解动作中的一个,直到确定了优选结果为止。因此,使得能够识别出解决故障状况的高效的缓解动作。
根据本发明的另一实施例,可以在技术设施中执行具有优选结果的缓解动作。在实施例中,缓解动作在设备上的输出可以与有时间限制的动作相关联。如果未从用户接收到对缓解动作的实施的响应,则可以在所安排的时间段期满时在技术设施中自动地执行或实施缓解动作。有利地,及时地实施缓解动作防止了技术设施中的毁灭性的灾难。此外,缓解动作在技术设施中的实施不会因缺少来自技术设施用户的响应而暂缓。
根据本发明的实施例,在识别一个或多个缓解动作时,故障排除模块可以被配置成分析故障状况以确定故障模式。故障模式可以包括例如实时参数值、所估计的预定义的门限值以及实时参数值与预定义的门限值之间的偏差。故障模式还可以提供值的偏差以及时间戳。因此,还可以分析故障状况的进程。故障排除模块还可以被配置成将故障模式映射到预定义的矩阵。预定义的矩阵可以包括技术设施中已识别的所有故障模式以及过去实施的对应缓解动作。将故障模式映射到预定义的矩阵,并基于相关性来识别一个或多个缓解动作。故障排除模块还可以被配置成从预定义的矩阵来确定用以解决所分析的故障状况的一个或多个缓解动作。有利地,预定义的矩阵使得能够准确地识别用于解决故障状况的一个或多个缓解动作。
根据本发明的又一实施例,在与技术设施的用户相关联的设备上生成警报。当确定了参数值与预定义的门限值之间的偏差时,可以生成这样的警报。警报可以例如是以通知的形式。这样的通知还可以包括基于声音的警报。有利地,警报使得能够将故障状况高效地传达给技术设施的用户。
本发明还涉及一种系统,其包括位于远离技术设施的一个或多个服务器。该系统还包括通信地耦合到所述一个或多个服务器的一个或多个传感器,以及通信地耦合到所述一个或多个服务器的一个或多个用户设备。所述一个或多个服务器包括计算机可读指令,所述计算机可读指令在由所述一个或多个服务器执行时使所述一个或多个服务器实行根据权利要求1至13所述的方法。
在一个方面中,本发明还涉及一种用于工艺厂区(process plant)的操作的过程控制系统。该过程控制系统包括如权利要求14中要求保护的系统。
在一个方面中,本发明涉及一种计算机程序产品,其包括计算机程序,所述计算机程序可加载到系统的存储单元中,所述计算机程序包括程序代码段,以当在所述系统中执行所述计算机程序时使所述系统执行根据本发明的方面的方法。
在一个方面中,本发明涉及一种计算机可读介质,在其上保存有计算机程序的程序代码段,所述程序代码段可加载到系统中和/或可在系统中执行,以当在所述系统中执行所述程序代码段时使所述系统执行根据本发明的方面的方法。
通过计算机程序产品和/或计算机可读介质实现本发明的优点在于,可以容易地通过软件更新来采用已经存在的管理系统,以便如本发明所提议的那样工作。
计算机程序产品可以是例如计算机程序,或者包括除计算机程序之外的另一元件。该另一元件可以是硬件,例如其上存储有计算机程序的存储器设备、用于使用计算机程序的硬件密钥、等等;和/或软件,例如用于使用计算机程序的文档或软件密钥。
附图说明
在后文中参考在附图中示出的所例示的实施例来进一步描述本发明,在附图中:
图1是根据第一实施例的工业机构的示意性表示。
图2是根据第一实施例的如图1中所示的云平台的框图。
图3例示了根据实施例的排除技术设施中的故障状况的方法的流程图。
图4例示了根据实施例的预测技术设施中的故障状况的方法的流程图。
图5例示了根据实施例的计算用于故障预测的基于机器学习的模型并使用该基于机器学习的模型来预测故障状况的方法的流程图。
图6例示了根据实施例的确定故障状况的根本原因的方法的流程图。
图7例示了根据另一实施例的识别用以解决故障状况的一个或多个缓解动作的方法的流程图。
图8例示了根据实施例的确定与一个或多个缓解动作相关联的结果的方法的流程图。
具体实施方式
在后文中,详细地描述用于实现本发明的实施例。参考附图来描述各种实施例,其中相似的参考标号自始至终用于指代相似的元件。在以下描述中,出于解释的目的,阐述了众多具体细节以提供对一个或多个实施例的透彻理解。可以显而易见的是,可以在没有这些具体细节的情况下实践这样的实施例。
图1是根据第一实施例的工业机构100的示意性表示。工业机构100包括云平台102、连接到云平台102的一个或多个技术设施107、以及与技术设施107的用户相关联的用户设备108。技术设施107可以是工业机构,诸如制造场所、电厂等。技术设施107可以在地理上是分布的。技术设施107中的每一个可以包括几个设备或组件104A-N。组件104A-N可以包括位于技术设施107中的不同类型的资产(装备、机器、传感器、执行器等)。组件104A-N中的每一个能够经由互联网或网络经由通信链路116A-C使用各自的通信接口120A-N与云平台102通信。另外,组件104A-N能够经由通信链路116D至116F使用各自的通信接口120A-N彼此通信。通信链路116D至116F可以是有线或无线链路。
另外,在技术设施107中,一个或多个组件104N可以连接到技术设施107中的资产106A-N。这样的资产106A-N无法直接与云平台102通信。如图1中所示,组件104N经由有线或无线网络连接到资产106A-N。例如,组件104N是IoT网关,并且资产106A-N可以是经由IoT网关104N与云平台102通信的机器人、传感器、执行器、机器或其他现场设备。
组件104A-N中的每一个被配置成经由通信接口120A-N与云平台102通信。组件104A-N可以具有操作系统和至少一个软件程序,用于在技术设施107中执行期望的操作。另外,组件104A-N可以运行用于收集和预处理工厂数据(过程数据)并将预处理的数据传输到云平台102的软件应用。
云平台102可以是能够基于工厂数据提供诸如数据存储服务、数据分析服务、数据可视化服务等的基于云的服务的云基础设施。云平台102可以是公共云或私有云的一部分。云平台102可以使得数据科学家/软件供应商能够将软件应用/固件作为服务来提供,从而消除了用户对软件维护、升级和备份的需求。软件应用可以是完整的应用或软件补丁。
在图2中进一步更详细地例示了云平台102。参考图2,云平台包括处理单元201、存储器202、存储单元203、网络接口114、标准接口或总线207。云平台102可以是系统的示例性实施例。系统102可以是(个人)计算机、工作站、在主机硬件上运行的虚拟机、微控制器或集成电路。作为替换,系统102可以是真实的或虚拟的计算机组(真实的计算机组的技术术语是“集群”,虚拟的计算机组的技术术语是“云”)。
如本文所使用的,处理单元201意指任何类型的计算电路,诸如但不限于:微处理器、微控制器、复杂指令集计算微处理器、精简指令集计算微处理器、超长指令字微处理器、显式并行指令计算微处理器、图形处理器、数字信号处理器或任何其他类型的处理电路。处理单元201还可以包括嵌入式控制器,诸如通用或可编程逻辑器件或阵列、专用集成电路、单芯片计算机等。一般而言,处理单元201可以包括硬件元件和软件元件。处理单元201可以被配置用于多线程处理,即,处理单元201可以同时托管不同的计算过程,从而并行地执行主动和被动计算过程或在主动和被动计算过程之间进行切换。
存储器202可以是易失性存储器和非易失性存储器。存储器202可以被耦合以用于与处理单元201进行通信。处理单元201可以执行存储在存储器202中的指令和/或代码。各种各样的计算机可读存储介质可以存储在存储器202中并且从存储器202进行访问。存储器202可以包括用于存储数据和机器可读指令的任何合适的元件,诸如只读存储器、随机存取存储器、可擦除可编程只读存储器、电可擦除可编程只读存储器、硬盘驱动器、用于处置紧凑盘、数字视频盘、磁盘、磁带盒、存储器卡的可移除媒体驱动器、等等。在本实施例中,存储器202包括以以上提到的存储介质中的任何介质上的机器可读指令的形式存储的故障排除模块110,并且可以与处理单元201通信和由处理单元201执行。当由处理单元201执行时,故障排除模块110使处理单元201管理在技术设施107中可能发生的故障状况。故障排除模块还可以使处理单元于在技术设施中实施缓解动作之前预测技术设施中的缓解动作的结果。由处理单元201执行以实现以上提到的功能性的方法步骤在图3、4、5、6、7和8中详细地进行详尽阐述。
存储单元203可以是存储技术数据库112的非暂时性存储介质。技术数据库112可以存储技术设施107中的一个或多个组件104A-N的事件历史。此外,技术数据库112还可以包括基于机器学习的模型,以预测技术设施107中的故障状况并预测缓解动作在技术设施107上的结果。总线207充当处理单元201、存储器202、存储单元203和网络接口114之间的互连。
本领域技术人员将领会到,图2中描绘的硬件可以针对特定实施而变化。例如,除了所描绘的硬件之外或作为其替代,还可以使用其他外围设备,诸如光盘驱动器和类似物、局域网(LAN)/广域网(WAN)/无线(例如Wi-Fi)适配器、图形适配器、磁盘控制器、输入/输出(I/O)适配器。仅出于解释的目的而提供所描绘的示例,并且不意在暗示关于本公开的架构限制。
根据本公开的实施例的系统包括采用图形用户接口的操作系统。操作系统准许在图形用户接口中同时呈现多个显示窗口,其中每个显示窗口提供与不同应用或与同一应用的不同实例的接口。图形用户接口中的光标可以由用户通过定点设备来操纵。光标的位置可以改变,和/或生成诸如点击鼠标按钮之类的事件以致动期望的响应。
如果经适当修改,可以采用各种商用操作系统之一,诸如位于华盛顿雷德蒙的微软公司的产品Microsoft WindowsTM的版本。根据如所描述的本公开来修改或创建操作系统。
本发明不限于特定的计算机系统平台、处理单元、操作系统或网络。本发明的一个或多个方面可以分布在一个或多个计算机系统之间,例如,被配置成向一个或多个客户端计算机提供一个或多个服务、或在分布式系统中执行完整任务的服务器。例如,根据各种实施例,本发明的一个或多个方面可以在客户端-服务器系统上执行,该客户端-服务器系统包括分布在执行多种功能的一个或多个服务器系统之间的组件。这些组件包括例如可执行代码、中间代码或解译代码,它们使用通信协议通过网络进行传送。本发明不限于可在任何特定的系统或系统组上执行,并且不限于任何特定的分布式架构、网络或通信协议。
所公开的实施例提供了用于排除技术设施中的故障状况的系统和方法。特别地,所述系统和方法可以识别针对故障状况的一个或多个缓解动作,并于在技术设施中实施缓解动作之前确定这样的缓解动作在技术设施中的结果。
图3例示了根据实施例的排除技术设施107中的故障状况的方法300的流程图。在步骤301处,预测技术设施107中的故障状况。故障状况可以是技术设施107的运转中的异常或缺陷。这样的运转不良可能是由于例如技术设施107中的故障组件或故障过程而导致的。可以基于从技术设施107中的一个或多个组件104A-N接收到的存档数据和实时数据来预测技术设施107中的故障状况。图4和图5中详细描述了用于预测故障状况的方法步骤。还可以识别所识别的故障状况的根本原因。在图6中详细描述了用于确定故障状况的根本原因的方法步骤。方法300还包括识别用以解决故障状况的一个或多个缓解动作的步骤302。可以使用基于机器学习的模型来确定一个或多个缓解动作。在实施例中,基于机器学习的模型能够分析与故障状况相关联的故障模式。故障模式可以包括与跟故障状况相关联的工业过程步骤和/或组件有关的信息。基于故障模式的分析,可以识别一个或多个缓解动作。在图7中详细描述了用于识别一个或多个缓解动作的方法步骤。方法300还包括确定与在技术设施107上的一个或多个缓解动作中的至少一个缓解动作相关联的结果的方法步骤303。可以例如使用技术设施107的虚拟模型来确定这样的结果。因此,即使在技术设施107中实施缓解动作之前,也可以识别出缓解动作的结果。因此,在技术设施107中高效地管理故障状况,而不会导致对技术设施107的损坏。在图8中详细描述了确定缓解动作的结果所涉及到的方法步骤。方法300还包括在与技术设施107的用户相关联的设备108上输出至少一个缓解动作的步骤304。将缓解动作输出到设备108使得能够将解决方案及时通知给用户。因此,确保了故障状况的更快解决。
图4例示了根据实施例的预测技术设施107中的故障状况的方法400的流程图。在该方法的步骤401处,在技术设施的至少一部分中检测到至少一个事件。这样的事件与故障状况相关联。事件可以是例如与技术设施107的运转有关的技术设施107中的任何发生的事情。使用基于机器学习的模型来执行基于检测到的事件的故障状况的预测。图5中进一步描述了基于机器学习的模型的各方面。参考图5,例示了计算基于机器学习的模型和使用基于机器学习的模型进行故障预测的方法500的流程图。在步骤501处,从技术数据库112接收与技术设施107相关联的存档数据和实时数据。存档数据可以包括但不限于与一个或多个组件104A-N相关联的数据、与工业过程相关联的数据、组件104A-N的事件历史、一个或多个工业过程参数值以及与过程参数相关联的预定义的门限值。另外,存档数据还可以包括过去在技术设施107中识别出的故障模式。这样的故障模式可以是针对故障状况特定的,并且可以指示与故障状况相关联的一个或多个组件104A-N或工业过程。实时数据与技术设施107中的一个或多个组件104A-N相关联,并且包括与一个或多个组件104A-N实时相关联的一个或多个参数值。通过与一个或多个组件104A-N相关联的一个或多个传感器106A-N来捕获这样的实时数据。传感器106A-N可以被配置成将实时数据传输给云平台102。这样的数据可以存储在技术数据库112中。
在实施例中,存档数据可以分为一个或多个类别,从而使得能够更容易和更快地预测故障状况。类别可以包括例如用户数据、配置数据、工厂工程数据、安全数据等。用户数据可以包括例如用户认证和凭证信息。配置数据可以包括例如与技术设施107相关联的硬件配置、与技术设施107相关联的软件配置以及网络拓扑信息。工厂工程数据可以包括例如功能图、工厂显示、复合组件、样机、运行时容器类型、运行时容器编号、对等通信详细信息以及自动化服务器的类型。安全数据可以包括例如防火墙规则、与恶意软件防护系统相关联的数据、非军事区设置等。
在方法500的步骤502处,解析存档数据以获得工厂工程数据。可以例如使用自动化学习算法来执行这样的解析。技术设施107中的每个组件104A-N与标签信息相关联。这样的标签信息可以包括例如过程相关代码、设施点代码、位置代码等。因此,这样的标签信息可以使得能够准确地确定故障状况。过程相关代码可以是与机械、土木(civil)、电气、控制和仪表工程相关联的组件的过程相关标识。设施点代码指示技术设施107中的电气和控制以及仪表组件的设施点的标识。位置代码使得能够识别组件在楼层或房间内的位置,并且还使得能够识别防火区和地形规定。可以从针对技术设施107的管道和仪表图中提取附加信息,以生成基于机器学习的模型。在步骤503处,基于存档的工厂工程数据来计算基于机器学习的模型。在方法500的步骤504处,使用从技术数据库112获得的实时数据来重新计算基于机器学习的模型。使用实时数据来评估基于机器学习的模型。使用定期从技术设施107获得的实时数据来周期性地更新该增量模型。在步骤505处,测试该模型以确定训练后的模型是否能够准确地预测故障状况。如果基于测试数据预测了故障状况,则在步骤506处使用该模型来实时预测故障状况。如果故障预测不正确,则可以重新计算模型以提高效率。
参考图4,在方法400的步骤402处,从在技术设施107中安装的传感器106A-N获得一个或多个参数值。这样的参数值与检测到的事件相关联。因此,参数值是从传感器106A-N获得的实时值。通过基于机器学习的模型分析这些参数值以预测故障状况。在步骤403处,将一个或多个参数值与跟参数相关联的预定义的门限值进行比较。每个参数可以具有参数值必须位于其内的相关联的门限值。参数值与预定义的门限值相比的偏差可能导致技术设施107的运转异常。因此,该模型将实时参数值与预定义的门限值进行比较。在步骤404处,通过基于机器学习的模型来确定一个或多个参数值与预定义的门限值之间的偏差。预定义的门限值可以是确定的值、或参数值可以位于其内的范围。可以计算一个或多个参数值与预定义的门限值之间的差以确定偏差。在实施例中,还可以将与预定义的门限值的偏差的估计提供给用户。该估计可以是例如百分比值,其描绘了当与预定义的门限值相比时的实时参数值的偏差程度。在步骤405处,当确定了一个或多个参数值与预定义的门限值之间的偏差时,可以在与技术设施107的用户相关联的设备108中生成警报。在实施例中,还可以在安装在技术设施107中的报警系统中生成报警。
图6例示了根据实施例的确定故障状况的根本原因的方法600的流程图。在方法600的步骤601处,确定在技术设施107的至少一部分中执行的工业过程的类型。工业过程可以与检测到的故障状况事件相关联。技术设施107的这样的部分可以是其中可能发生过该故障状况的部分。工业过程可以包括可以在技术设施107中执行的多个可执行步骤。在步骤602处,识别与工业过程相关联的一个或多个组件104A-N。因此,工业过程的确定使得能够容易地识别相关联的组件104A-N。从而更快且更高效地确定故障状况的原因。在步骤603处,识别与事件相关联的故障信号。故障信号可以例如以波形的形式被描绘并且可以包括与该波形相关联的参数值、可能发生过该故障的时间戳以及与参数值相关联的参数。这样的故障信号可以显示在例如技术设施107的操作控制室中。在步骤604处,将故障信号映射到至少一个或多个组件104A-N和/或工业过程的多个可执行步骤中的至少一个,以确定故障状况。在实施例中,故障信号可以与一个或多个标签信息相关联。标签信息包括代码(过程相关代码、位置代码和/或设施点代码,如前所述)。使用用于预测技术设施107中的故障状况的规则或判据来分析故障信号和相关联的标签信息。基于该分析,可以执行故障信号到技术设施107中的一个或多个组件104A-N的映射。在实施例中,可以生成可以使用决策树流程的决策矩阵。调查表可以用于生成决策树节点。每个决策树节点可以处理内部节点问题并提供输出。这样的输出可以是以分支的形式,其中这样的分支可以具有另外的子节点。决策树分支可以包括诸如“是”和“否”之类的选项作为答案。如果对内部节点问题的答案为“是”,则可以创建决策树的后续分支。可以创建决策树的这样的分支,直到识别出相关联的故障组件104A-N为止。替换地,决策树可以指示与故障状况相关联的故障组件104A-N。
图7例示了根据实施例的识别用以解决故障状况的一个或多个缓解动作的方法700的流程图。在步骤701处,分析故障状况以识别故障模式。故障模式可以是偏差参数值、相关联的故障组件104A-N和/或与故障组件104A-N相关联的工业过程步骤的组合。在步骤702处,将故障模式映射到预定义的矩阵。预定义的矩阵可以包括技术设施107中的已识别的所有故障模式和过去实施的对应的缓解动作。在步骤703处,将故障模式映射到预定义的矩阵,并基于相关性来确定一个或多个缓解动作。
图8例示了根据实施例的确定与一个或多个缓解动作相关联的结果的方法800的流程图。在步骤801处,在技术设施107的虚拟模型中实施一个或多个缓解动作。虚拟模型是技术设施107的数字孪生,其能够模拟技术设施107的功能。这样的虚拟模型可以是基于云平台102。与技术设施107的运转相关联的所有数据都存储在云平台102中。使用与技术设施107的运转相关联的这样的数据来生成虚拟模型。使用虚拟模型使得能够有效地利用时间和资源,从而防止了在技术设施107中实施不正确的缓解动作时的精力浪费。在方法800的步骤802处,使用虚拟模型来预测缓解动作的结果。在虚拟模型中实施缓解动作可以在技术设施107的虚拟模型中生成效果。这样的效果被识别为缓解动作的结果。效果例如可以是与缓解动作相关联的参数值的改变。例如,如果缓解动作被配置成引起虚拟模型中记录的温度值的改变,则由缓解动作的实施引起的效果可以包括所述记录的温度值的增大、减小或不变。因此,实施缓解动作的结果可以是优选结果或不期望的结果。在步骤803处,确定结果是优选结果还是不期望的结果。优选结果可以是在技术设施107中产生期望成果的结果。优选结果也可以是进一步解决技术设施107中的故障状况的原因的结果。执行预测分析以确定所实施的缓解动作的结果。该预测性分析确定了缓解动作对与缓解动作相关联的参数值的效果。如果识别出与优选参数值的偏差,则该结果可能是不期望的结果。如果结果是优选结果,则在步骤804处,在与技术设施107的用户相关联的设备108上输出缓解动作。可以将优选的缓解动作通知给技术设施的用户,以使得能够高效且及时地解决故障状况。输出可以是以例如在与用户相关联的设备108上的通知的形式。在实施例中,这样的通知可以包括缓解动作的细节、以及要继续在技术设施中实施缓解动作的基于图形用户接口的选项。如果缓解动作的结果不是优选结果,则在虚拟模型中实施所识别的缓解动作中的另一缓解动作。在实施例中,在虚拟模型中实施缓解动作,直到识别出优选结果或直到彻底研究了所有识别出的缓解动作为止。
在方法800的步骤805处,如果从用户获得了响应,则在步骤806处进行检查以确定该响应是“是”还是“否”,其中“是”指示在技术设施107中实施缓解动作,并且“否”指示不在技术设施107中实施缓解动作。如果响应为“是”,则在步骤808处在技术设施107中实时地实施缓解动作。在实施例中,指示优选缓解动作的通知可以是有时间限制的。因此,将所安排的时间段分配给该通知,应在该时间段内从用户接收到响应。因此,在步骤807处,进行检查以确定所安排的时间段是否已期满。如果所安排的时间段已期满而在所安排的时间段期满之前未从用户接收到响应,则在步骤808处在技术设施107中实时地实施缓解动作。如果尚未流逝所安排的时间段,则不采取动作,直到所安排的时间段期满为止。
仅出于解释的目的提供了前述示例,并且其绝不应以任何方式解释为对本文公开的本发明的限制。尽管已参考各种实施例描述了本发明,但是要理解的是,本文中使用的词汇是描述性和例示性的词汇,而不是限制性的词汇。此外,尽管本文参考特定的手段、材料和实施例描述了本发明,但是本发明并不意在限于本文所公开的特定细节;相反,本发明扩展到所有功能上等同的结构、方法和用途,诸如在所附权利要求的范围之内的那些。受益于本说明书的教导的本领域技术人员可以对其做出众多修改,并且可以进行改变而不脱离本发明在其各方面的范围和精神。

Claims (18)

1.一种排除技术设施(107)中的至少一个设备(104A)的故障状况的方法,所述方法包括:
预测技术设施(107)的设备(104A)的故障状况的发生;
确定所预测的故障状况的根本原因;
确定用以解决所述故障状况的一个或多个缓解动作;
确定与所述一个或多个缓解动作中的至少一个缓解动作相关联的在技术设施(107)上的结果;以及
基于与所述一个或多个缓解动作中的至少一个缓解动作相关联的所确定的结果,在与用户相关联的设备(108)上输出要在技术设施(107)中实施的至少一个缓解动作。
2.根据权利要求1所述的方法,其中,在预测故障状况的发生时,所述方法包括:
从在技术设施(107)中安装的一个或多个传感器(106A-N)获得传感器数据,其中,所述传感器数据包括与技术设施(107)中的事件相关联的一个或多个参数值;
通过合适的机器学习模型来处理所获得的传感器数据;以及
使用一种或多种机器学习技术来预测故障状况。
3.根据权利要求2所述的方法,其中,在处理所获得的数据时,所述方法包括:
获得与技术设施(107)相关联的工程数据;
获得来自与技术设施(107)相关联的管道和仪表图的数据;
基于所述工程数据确定在技术设施(107)的至少一部分中执行的工业过程的类型;
识别技术设施(107)的所述至少一部分中的一个或多个组件,其中,所述组件是基于所述管道和仪表图确定的工业过程的一部分;
识别与所述事件相关联的故障信号,其中,基于所述传感器数据来识别所述故障信号;以及
将所述故障信号映射到所述工业过程的类型和/或所述一个或多个组件中的至少一个。
4.根据权利要求3所述的方法,其中,在识别与所述事件相关联的故障信号时,所述方法包括:
比较所述传感器数据中的一个或多个参数值与预定义的门限值;以及
确定所述一个或多个参数值与所述预定义的门限值之间的偏差,其中,所述一个或多个参数值与所述预定义的门限值之间的所述偏差对应于所述故障信号。
5.根据权利要求1或2所述的方法,其中,使用决策矩阵来确定所预测的故障状况的根本原因。
6.根据权利要求5所述的方法,其中,使用决策矩阵来确定所述故障状况的根本原因包括:
获得与技术设施(107)相关联的工程数据;
获得来自与技术设施(107)相关联的管道和仪表图的数据;
基于所述工程数据来确定在技术设施(107)的至少一部分中执行的工业过程的类型;
识别技术设施(107)的所述至少一部分中的一个或多个组件,其中,所述组件是基于所述管道和仪表图确定的工业过程的一部分;
基于所识别的一个或多个组件和所述工业过程的类型来生成调查表;以及
从所述调查表确定技术设施(107)中的故障状况的根本原因。
7.根据权利要求5和6所述的方法,还包括创建根本原因分析报告,其中,所述报告包括与使用所述决策矩阵确定的与技术设施(107)相关联的工业过程和一个或多个组件相关联的数据。
8.根据权利要求1所述的方法,其中,在确定与一个或多个缓解动作中的至少一个缓解动作相关联的结果时,所述方法包括:
在技术设施(107)的虚拟模型中实施所述一个或多个缓解动作中的一个缓解动作,其中,所述虚拟模型被配置成模拟技术设施(107)的功能;以及
使用所述虚拟模型来预测所实施的缓解动作对技术设施(107)的效果。
9.根据前述权利要求中的任一项所述的方法,还包括:
确定所实施的缓解动作的结果是否为优选结果;
如果所述结果是优选结果,则在与技术设施(107)的用户相关联的设备(108)上输出所述缓解动作,其中,要在技术设施(107)中实施所述缓解动作;以及
如果所述结果不是优选结果,则在所述虚拟模型中实施所述一个或多个缓解动作中的另一缓解动作。
10.根据前述权利要求中的任一项所述的方法,其中,在技术设施(107)的虚拟模型中实施所述一个或多个缓解动作中的一个缓解动作,直到确定了优选结果为止。
11.根据权利要求5所述的方法,其中,在技术设施(107)中执行具有优选结果的缓解动作。
12.根据前述权利要求中的任一项所述的方法,其中,在识别一个或多个缓解动作时,所述方法包括:
分析所述故障状况以确定故障模式;
将所述故障模式映射到预定义的矩阵;以及
从所述预定义的矩阵来确定用以解决所分析的故障状况的一个或多个缓解动作。
13.根据权利要求1和4所述的方法,还包括:当在所述参数值与所述预定义的门限值之间确定了偏差时,在与技术设施(107)的用户相关联的设备(108)上生成警报。
14.一种用于排除技术设施(107)中的故障状况的系统(100),所述系统包括:
一个或多个处理单元(201);以及
耦合到所述一个或多个处理单元的一个或多个存储器单元(202),其中,所述一个或多个存储器单元(202)包括故障排除模块(110),所述故障排除模块(110)被配置用于执行根据权利要求1至13中的任一项所述的方法。
15.一种系统(100),其包括:
位于远离技术设施(107)的一个或多个服务器(102);
通信地耦合到所述一个或多个服务器(102)的一个或多个传感器(106A-N);以及
通信地耦合到所述一个或多个服务器(102)的一个或多个用户设备(108),其中,所述一个或多个服务器(102)包括计算机可读指令,所述计算机可读指令在由所述一个或多个服务器(102)执行时使所述一个或多个服务器(102)实行根据权利要求1至13所述的方法。
16.一种用于工艺厂区的操作的过程控制系统,所述过程控制系统包括根据权利要求14所述的系统(100)。
17.一种包括机器可读指令的计算机程序产品,所述机器可读指令在由处理单元(201)执行时使处理单元(201)实行根据权利要求1至13所述的方法。
18.一种计算机可读介质,其上保存有计算机程序的程序代码段,所述程序代码段可加载到系统中和/或可在系统中执行,以当在所述系统中执行所述程序代码段时使所述系统执行根据权利要求1至13中的任一项所述的方法。
CN201911212320.2A 2018-11-30 2019-12-02 用于排除技术设施中的故障状况的方法和系统 Active CN111260176B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP18209564.6A EP3660612B1 (en) 2018-11-30 2018-11-30 Method and system for elimination of fault conditions in a technical installation
EP18209564.6 2018-11-30

Publications (2)

Publication Number Publication Date
CN111260176A true CN111260176A (zh) 2020-06-09
CN111260176B CN111260176B (zh) 2023-11-03

Family

ID=64564696

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911212320.2A Active CN111260176B (zh) 2018-11-30 2019-12-02 用于排除技术设施中的故障状况的方法和系统

Country Status (3)

Country Link
US (1) US11188067B2 (zh)
EP (1) EP3660612B1 (zh)
CN (1) CN111260176B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3786745B1 (de) * 2019-08-28 2023-02-22 Siemens Aktiengesellschaft Identifikation von abweichungen zwischen realer anlage und ihrem digitalen zwilling
US11789428B2 (en) 2021-06-16 2023-10-17 Fisher-Rosemount Systems, Inc. I/O server services for selecting and utilizing active controller outputs from containerized controller services in a process control environment
US11726933B2 (en) 2021-06-16 2023-08-15 Fisher-Rosemount Systems, Inc. I/O server services configured to facilitate control in a process control environment by containerized controller services
US20220404799A1 (en) * 2021-06-16 2022-12-22 Fisher-Rosemount Systems, Inc. Software defined process control system and methods for industrial process plants
US20220404798A1 (en) * 2021-06-16 2022-12-22 Fisher-Rosemount Systems, Inc. Software defined process control system and methods for industrial process plants
US11960588B2 (en) 2021-06-16 2024-04-16 Fisher-Rosemount Systems, Inc Security services in a software defined control system
US20230251646A1 (en) * 2022-02-10 2023-08-10 International Business Machines Corporation Anomaly detection of complex industrial systems and processes

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020022952A1 (en) * 1998-03-26 2002-02-21 David Zager Dynamic modeling of complex networks and prediction of impacts of faults therein
US20080010531A1 (en) * 2006-06-12 2008-01-10 Mks Instruments, Inc. Classifying faults associated with a manufacturing process
US20090172460A1 (en) * 2007-12-28 2009-07-02 International Business Machines Corporation Defining a computer recovery process that matches the scope of outage
JP2010073189A (ja) * 2008-08-19 2010-04-02 Nec Corp 顧客状態推定システム、顧客状態推定方法および顧客状態推定プログラム
US20120215352A1 (en) * 2011-02-17 2012-08-23 Convergent Information Technologies Gmbh Method for the automated programming and optimization of robotic work sequences
EP2608123A1 (en) * 2011-12-23 2013-06-26 Vlaamse Instelling voor Technologisch Onderzoek (VITO) System for distributing electrical energy over a cluster of electrical devices, method for distributing electrical energy over a cluster of electrical devices of such a system and controller for use in such a system
US20130325147A1 (en) * 2012-06-01 2013-12-05 Sap Ag Method and System for Complex Smart Grid Infrastructure Assessment
EP2757648A2 (en) * 2013-01-18 2014-07-23 General Electric Company Methods and systems for restoring power based on forecasted loads
CN106649915A (zh) * 2016-09-08 2017-05-10 国家电网公司 一种输配电网设备缺陷预警系统
CN106940533A (zh) * 2017-04-11 2017-07-11 上海交通大学 一种基于云超实时仿真平台与硬件在环的实时决策方法
CN107193375A (zh) * 2017-05-17 2017-09-22 刘继君 一种基于虚拟现实的电力安全生产场景交互系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171585B2 (en) * 2003-11-26 2007-01-30 International Business Machines Corporation Diagnosing faults and errors from a data repository using directed graphs
EP2223260A2 (en) * 2007-11-07 2010-09-01 EDSA Micro Corporation Systems and methods for real-time forecasting and predicting of electrical peaks and managing the energy, health, reliability, and performance of electrical power systems based on an artificial adaptive neural network
US10908602B2 (en) * 2017-08-02 2021-02-02 Strong Force Iot Portfolio 2016, Llc Systems and methods for network-sensitive data collection
JP6485537B1 (ja) * 2017-12-28 2019-03-20 横河電機株式会社 装置、方法、およびプログラム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020022952A1 (en) * 1998-03-26 2002-02-21 David Zager Dynamic modeling of complex networks and prediction of impacts of faults therein
US20080010531A1 (en) * 2006-06-12 2008-01-10 Mks Instruments, Inc. Classifying faults associated with a manufacturing process
US20090172460A1 (en) * 2007-12-28 2009-07-02 International Business Machines Corporation Defining a computer recovery process that matches the scope of outage
JP2010073189A (ja) * 2008-08-19 2010-04-02 Nec Corp 顧客状態推定システム、顧客状態推定方法および顧客状態推定プログラム
US20120215352A1 (en) * 2011-02-17 2012-08-23 Convergent Information Technologies Gmbh Method for the automated programming and optimization of robotic work sequences
EP2608123A1 (en) * 2011-12-23 2013-06-26 Vlaamse Instelling voor Technologisch Onderzoek (VITO) System for distributing electrical energy over a cluster of electrical devices, method for distributing electrical energy over a cluster of electrical devices of such a system and controller for use in such a system
US20130325147A1 (en) * 2012-06-01 2013-12-05 Sap Ag Method and System for Complex Smart Grid Infrastructure Assessment
EP2757648A2 (en) * 2013-01-18 2014-07-23 General Electric Company Methods and systems for restoring power based on forecasted loads
CN106649915A (zh) * 2016-09-08 2017-05-10 国家电网公司 一种输配电网设备缺陷预警系统
CN106940533A (zh) * 2017-04-11 2017-07-11 上海交通大学 一种基于云超实时仿真平台与硬件在环的实时决策方法
CN107193375A (zh) * 2017-05-17 2017-09-22 刘继君 一种基于虚拟现实的电力安全生产场景交互系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUIGI PORTINALE ET AL.: "Using Dynamic Decision Networks and Extended Fault Trees for Autonomous FDIR", pages 480 - 484 *
金鑫等: "基于决策树的企业信息系统故障自动诊断分析方法", no. 03, pages 168 - 172 *

Also Published As

Publication number Publication date
CN111260176B (zh) 2023-11-03
EP3660612B1 (en) 2022-12-28
EP3660612A1 (en) 2020-06-03
US20200174462A1 (en) 2020-06-04
US11188067B2 (en) 2021-11-30

Similar Documents

Publication Publication Date Title
US11188067B2 (en) Method and system for elimination of fault conditions in a technical installation
EP3206368B1 (en) Telemetry analysis system for physical process anomaly detection
JP7017861B2 (ja) 異常検知システムおよび異常検知方法
US10809704B2 (en) Process performance issues and alarm notification using data analytics
KR102118670B1 (ko) Ict 인프라 관리 시스템 및 이를 이용한 ict 인프라 관리 방법
EP3125172B1 (en) Data supply chain components configuration reliability analysis
JP2019185422A (ja) 故障予知方法、故障予知装置および故障予知プログラム
RU2724075C1 (ru) Система и способ определения источника аномалии в кибер-физической системе, обладающей определенными характеристиками
Liulys Machine learning application in predictive maintenance
CN113924570A (zh) 用于工业控制系统中的安全异常检测的用户行为分析
EP4038557A1 (en) Method and system for continuous estimation and representation of risk
Ruiz-Arenas et al. Towards the maintenance principles of cyber-physical systems
Ghosh et al. Modeling and testing of temporal dependency in the failure of a process system
MR et al. AICrit: A unified framework for real-time anomaly detection in water treatment plants
JP7062505B2 (ja) 設備管理支援システム
Lazarova-Molnar et al. Reliability analysis of cyber-physical systems
US20200280570A1 (en) Method for Monitoring an Industrial Network
WO2020231334A1 (en) Modelling and black-box security testing of cyber-physical systems
EP4099656A1 (en) Computer-implemented method and surveillance arrangement for identifying manipulations of cyber-physical-systems as well as computer-implemented-tool and cyber-physical-system
EP4160452A1 (en) Computer-implemented method and surveillance arrangement for identifying manipulations of cyber-physical-systems as well as computer-implemented-tool and cyber-physical-system
Cook Anomaly diagnosis in industrial control systems for digital forensics
KR20230037743A (ko) 클라우드 기반의 스마트 팩토리 플랫폼 제공 시스템 및 방법
Agbo et al. Resilience of Industrial Control Systems Using Signal Temporal Logic And Autotuning Mechanism
Katonaa et al. Building predictive maintenance framwork for smart environment applicaion systems
Jackson et al. Securing the Transportation of Tomorrow: Enabling Self-Healing Intelligent Transportation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant