CN115292423A

CN115292423A - 一种用于信息化串流的故障信息归类方法及系统

Info

Publication number: CN115292423A
Application number: CN202211219387.0A
Authority: CN
Inventors: 赵士贤
Original assignee: Nanjing Guangquan Technology Co ltd
Current assignee: Nanjing Guangquan Technology Co ltd
Priority date: 2022-10-08
Filing date: 2022-10-08
Publication date: 2022-11-04

Abstract

本发明适用于数据处理技术领域，提供了一种用于信息化串流的故障信息归类方法及系统，包括以下步骤：接收历史数据流故障信息，所述历史数据流故障信息包括异常数据流、数据参数名称和故障原因；根据故障原因对历史数据流故障信息进行第一次分类，从而得到若干个大类，根据数据参数名称对每大类中的历史数据流故障信息进行第二次分类，从而得到若干个小类；对每小类中的异常数据流进行分析，确定数据趋势特征，数据趋势特征上标记有数据参数名称，对所有的数据趋势特征进行汇总，得到数据趋势库。本发明通过将当前数据流故障信息输入至数据趋势库，进行数据变化趋势的匹配，就能够自动得到预测故障原因，预测速度快，预测结果精准。

Description

一种用于信息化串流的故障信息归类方法及系统

技术领域

本发明涉及数据处理技术领域，具体是涉及一种用于信息化串流的故障信息归类方法及系统。

背景技术

串流处理是针对数据流应用大规模密集型计算特点而设计的一种编程模型，数据流是一连串的数字编码序列，常用来表示某一设备所产生的连续事件信息，它代表了一种新的数据模式，与传统数据库模型不同，它是一种大量、连续、快速并且随时间变化的数据流。目前的故障信息归类仅仅是根据故障原因和设备参数名称进行归类的，没有对归类后的故障信息进行进一步的自动分析和细化，且归类的故障信息缺少连续性，难以分析出故障原因导致的动态变化趋势，后续发生故障时，不便于根据归类的故障信息快速精准找到故障原因。因此，需要提供一种用于信息化串流的故障信息归类方法及系统，旨在解决上述问题。

发明内容

针对现有技术存在的不足，本发明的目的在于提供一种用于信息化串流的故障信息归类方法及系统，以解决上述背景技术中存在的问题。

本发明是这样实现的，一种用于信息化串流的故障信息归类方法，所述方法包括以下步骤：

接收历史数据流故障信息，所述历史数据流故障信息包括异常数据流、数据参数名称和故障原因；

根据故障原因对历史数据流故障信息进行第一次分类，从而得到若干个大类，根据数据参数名称对每大类中的历史数据流故障信息进行第二次分类，从而得到若干个小类；

对每小类中的异常数据流进行分析，确定数据趋势特征，数据趋势特征上标记有数据参数名称，对所有的数据趋势特征进行汇总，得到数据趋势库，所述数据趋势库包括多种数据趋势特征和对应的故障原因；

接收当前数据流故障信息，将当前数据流故障信息输入至数据趋势库，自动输出预测故障原因。

作为本发明进一步的方案：所述对每小类中的异常数据流进行分析，确定数据趋势特征的步骤，具体包括：

确定每小类中每个异常数据流的突变特征，所述突变特征包括突变速度和突变端点值；

根据每个异常数据流的突变特征的相似度，对异常数据流进行分组和筛选；

根据筛选后的异常数据流确定数据趋势特征，所述数据趋势特征包括一组或者多组突变速度范围和突变端点值范围。

作为本发明进一步的方案：所述确定每小类中每个异常数据流的突变特征的步骤，具体包括：

根据最小间隔值依次计算异常数据流的每段变换速度；

当后一段的变换速度相比前一段变换速度的变化幅度大于设定变化值时，设定后一段的变换速度为突变速度，记录突变端点值；

当后一段的变换速度相比前一段变换速度的变化幅度小于或者等于设定变化值时，且前一段变换速度为突变速度时，将这两段变换速度整合为一段，并对突变速度和突变端点值进行更新；

对所有的突变速度和对应的突变端点值进行汇总，从而得到突变特征。

作为本发明进一步的方案：所述根据每个异常数据流的突变特征的相似度，对异常数据流进行分组和筛选的步骤，具体包括：

根据突变特征的相似度对每小类的异常数据流进行分组；

根据每组中异常数据流的数量对异常数据流进行筛选，当一组中异常数据流的数量值小于设定数量值，删除所述组中所有的异常数据流。

作为本发明进一步的方案：所述将当前数据流故障信息输入至数据趋势库，自动输出预测故障原因的步骤，具体包括：

将当前数据流故障信息输入至数据趋势库，所述当前数据流故障信息包含数据参数名称；

计算当前数据流故障信息的待验证趋势特征；

将待验证趋势特征与数据趋势库中的数据趋势特征进行匹配，输出匹配度最高的数据趋势特征以及对应的故障原因。

本发明的另一目的在于提供一种用于信息化串流的故障信息归类系统，所述系统包括：

历史数据流接收模块，用于接收历史数据流故障信息，所述历史数据流故障信息包括异常数据流、数据参数名称和故障原因；

历史数据流归类模块，用于根据故障原因对历史数据流故障信息进行第一次分类，从而得到若干个大类，根据数据参数名称对每大类中的历史数据流故障信息进行第二次分类，从而得到若干个小类；

数据趋势库生成模块，用于对每小类中的异常数据流进行分析，确定数据趋势特征，数据趋势特征上标记有数据参数名称，对所有的数据趋势特征进行汇总，得到数据趋势库，所述数据趋势库包括多种数据趋势特征和对应的故障原因；

故障原因预测模块，用于接收当前数据流故障信息，将当前数据流故障信息输入至数据趋势库，自动输出预测故障原因。

作为本发明进一步的方案：所述数据趋势库生成模块包括：

突变特征确定单元，用于确定每小类中每个异常数据流的突变特征，所述突变特征包括突变速度和突变端点值；

异常数据流筛选单元，用于根据每个异常数据流的突变特征的相似度，对异常数据流进行分组和筛选；

数据趋势特征确定单元，用于根据筛选后的异常数据流确定数据趋势特征，所述数据趋势特征包括一组或者多组突变速度范围和突变端点值范围。

作为本发明进一步的方案：所述突变特征确定单元包括：

变换速度确定子单元，用于根据最小间隔值依次计算异常数据流的每段变换速度；

突变速度确定子单元，当后一段的变换速度相比前一段变换速度的变化幅度大于设定变化值时，设定后一段的变换速度为突变速度，记录突变端点值；

突变速度更新子单元，当后一段的变换速度相比前一段变换速度的变化幅度小于或者等于设定变化值时，且前一段变换速度为突变速度时，将这两段变换速度整合为一段，并对突变速度和突变端点值进行更新；

突变特征确定子单元，用于对所有的突变速度和对应的突变端点值进行汇总，从而得到突变特征。

作为本发明进一步的方案：所述故障原因预测模块包括：

当前数据流输入单元，用于将当前数据流故障信息输入至数据趋势库，所述当前数据流故障信息包含数据参数名称；

待验证趋势特征单元，用于计算当前数据流故障信息的待验证趋势特征；

趋势特征匹配单元，用于将待验证趋势特征与数据趋势库中的数据趋势特征进行匹配，输出匹配度最高的数据趋势特征以及对应的故障原因。

与现有技术相比，本发明的有益效果是：

本发明通过对异常数据流进行自动分析，确定数据趋势特征，并对所有的数据趋势特征进行汇总，得到数据趋势库，如此，后续有故障发生时，调取发生时的数据流故障信息，形成当前数据流故障信息，将当前数据流故障信息输入至数据趋势库，进行数据变化趋势的匹配，就能够自动得到预测故障原因，预测速度快，预测结果精准。

附图说明

图1为一种用于信息化串流的故障信息归类方法的流程图。

图2为一种用于信息化串流的故障信息归类方法中对每小类中的异常数据流进行分析，确定数据趋势特征的流程图。

图3为一种用于信息化串流的故障信息归类方法中确定每小类中每个异常数据流的突变特征的流程图。

图4为一种用于信息化串流的故障信息归类方法中将当前数据流故障信息输入至数据趋势库，自动输出预测故障原因的流程图。

图5为一种用于信息化串流的故障信息归类系统的结构示意图。

图6为一种用于信息化串流的故障信息归类系统中数据趋势库生成模块的结构示意图。

图7为一种用于信息化串流的故障信息归类系统中突变特征确定单元的结构示意图。

图8为一种用于信息化串流的故障信息归类系统中故障原因预测模块的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清晰，以下结合附图及具体实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述。

如图1所示，本发明实施例提供了一种用于信息化串流的故障信息归类方法，所述方法包括以下步骤：

S100，接收历史数据流故障信息，所述历史数据流故障信息包括异常数据流、数据参数名称和故障原因；

S200，根据故障原因对历史数据流故障信息进行第一次分类，从而得到若干个大类，根据数据参数名称对每大类中的历史数据流故障信息进行第二次分类，从而得到若干个小类；

S300，对每小类中的异常数据流进行分析，确定数据趋势特征，数据趋势特征上标记有数据参数名称，对所有的数据趋势特征进行汇总，得到数据趋势库，所述数据趋势库包括多种数据趋势特征和对应的故障原因；

S400，接收当前数据流故障信息，将当前数据流故障信息输入至数据趋势库，自动输出预测故障原因。

需要说明的是，串流处理是针对数据流应用大规模密集型计算特点而设计的一种编程模型，数据流是一连串的数字编码序列，常用来表示某一设备所产生的连续事件信息，它代表了一种新的数据模式，与传统数据库模型不同，它是一种大量、连续、快速且随时间变化的数据流。目前的故障信息归类仅仅是根据故障原因和设备参数名称进行归类的，没有对归类后的故障信息进行进一步的自动分析和细化，且归类的故障信息缺少连续性，难以分析出故障原因导致的动态变化趋势，后续发生故障时，不便于根据归类的故障信息快速精准找到故障原因，本发明实施例旨在解决上述问题。

本发明实施例中，首先需要对历史数据流故障信息进行分类和深入分析，所述历史数据流故障信息包括异常数据流、数据参数名称和故障原因，具体的，输入历史数据流故障信息，本发明实施例自动根据故障原因对历史数据流故障信息进行第一次分类，从而得到若干个大类，紧接着根据数据参数名称对每个大类中的历史数据流故障信息进行第二次分类，从而得到若干个小类，这样每个小类中异常数据流的故障原因和参数名称都是相同的，然后对每小类中的异常数据流进行分析，确定数据趋势特征，所述数据趋势特征能够反映数据的变化特性，容易理解，当故障发生时，设备参数会从合格变为不合格，从合格变为不合格会有一个变化特性，基本上不同种故障原因导致的变化特性不相同，同一种故障原因导致的变化特性相似，因此，确定数据趋势特征对于后续故障信息的分析很有必要，接着对所有的数据趋势特征进行汇总，得到数据趋势库，所述数据趋势库包括多种数据趋势特征，每种数据趋势特征对应有故障原因。如此，后续再有故障发生时，调取发生时的数据流故障信息，即为当前数据流故障信息，当前数据流故障信息包括当前数据流和数据参数名称，不包含故障原因，将当前数据流故障信息输入至数据趋势库，进行数据变化特性的匹配，就能够自动得到预测故障原因，预测速度快，预测结果精准。

如图2所示，作为本发明一个优选的实施例，所述对每小类中的异常数据流进行分析，确定数据趋势特征的步骤，具体包括：

S301，确定每小类中每个异常数据流的突变特征，所述突变特征包括突变速度和突变端点值；

S302，根据每个异常数据流的突变特征的相似度，对异常数据流进行分组和筛选；

S303，根据筛选后的异常数据流确定数据趋势特征，所述数据趋势特征包括一组或者多组突变速度范围和突变端点值范围。

本发明实施例中，每个异常数据流是一段固定时长的数据，为了确定数据趋势特征，首先确定每小类中每个异常数据流的突变特征，突变特征包括突变速度和突变端点值，例如突变特征为：12mA/s：从24mA到48mA和-6mA/s：从48mA到12mA，接着对异常数据流进行分组和筛选，具体的：根据突变特征的相似度对每小类的异常数据流进行分组，当两个突变特征的突变速度的差值百分比以及突变端点值的差值百分比都在设定范围内，则这两个突变特征的相似度符合要求，能够将这两个突变特征所对应的异常数据流分为一组，需要注意的是，一组中任意两个突变特征的相似度都要符合要求；并根据每组中异常数据流的数量对异常数据流进行筛选，当一组中异常数据流的数量值小于设定数量值时，删除所述组中所有的异常数据流，也就是说，数量太少的话，具有偶然性，这样的突变特征和故障原因之间的关联性不强。最后根据保留的异常数据流确定数据趋势特征，所述数据趋势特征包括一组或者多组突变速度范围和突变端点值范围，一组异常数据流对应一组突变速度范围和突变端点值范围，突变速度范围为该组中相应的突变速度最大值和突变速度最小值，突变端点值范围为该组中相应的突变端点最大值和突变端点最小值。

如图3所示，作为本发明一个优选的实施例，所述确定每小类中每个异常数据流的突变特征的步骤，具体包括：

S3011，根据最小间隔值依次计算异常数据流的每段变换速度；

S3012，当后一段的变换速度相比前一段变换速度的变化幅度大于设定变化值时，设定后一段的变换速度为突变速度，记录突变端点值；

S3013，当后一段的变换速度相比前一段变换速度的变化幅度小于或者等于设定变化值时，且前一段变换速度为突变速度时，将这两段变换速度整合为一段，并对突变速度和突变端点值进行更新；

S3014，对所有的突变速度和对应的突变端点值进行汇总，从而得到突变特征。

本发明实施例中，首先设置有最小间隔值，最小间隔值为定值，然后根据最小间隔值依次计算异常数据流的每段变换速度，例如最小间隔值为2s，一段异常数据流如下表所示：

每段变换速度依次为：5mA/s、5mA/s、5mA/s、10mA/s以及11mA/s，当后一段的变换速度相比前一段变换速度的变化幅度大于设定变化值时，设定后一段的变换速度为突变速度，记录突变端点值，这里设定变化值为20%，第四段与第三段之间的变化幅度=|10-5|/5，所以10mA/s为突变速度，记录突变端点值为230mA-250mA，当后一段的变换速度相比前一段变换速度的变化幅度小于或者等于设定变化值时，且前一段变换速度为突变速度时，将这两段变换速度整合为一段，并对突变速度和突变端点值进行更新，第五段与第四段之间的变化幅度=|11-10|/10＜20%，且第四段为突变速度，则将第五段与第四段进行整合，突变速度更新为10.5mA/s，突变端点值更新为230mA-272mA，最后对所有的突变速度和对应的突变端点值进行汇总，从而得到突变特征，容易理解，一个数据流中很可能包含几个突变速度。

如图4所示，作为本发明一个优选的实施例，所述将当前数据流故障信息输入至数据趋势库，自动输出预测故障原因的步骤，具体包括：

S401，将当前数据流故障信息输入至数据趋势库，所述当前数据流故障信息包含数据参数名称；

S402，计算当前数据流故障信息的待验证趋势特征；

S403，将待验证趋势特征与数据趋势库中的数据趋势特征进行匹配，输出匹配度最高的数据趋势特征以及对应的故障原因。

本发明实施例中，为了预测故障原因，需要计算当前数据流故障信息的待验证趋势特征，然后将待验证趋势特征与数据趋势库中的所有的数据趋势特征进行匹配，输出匹配度最高的数据趋势特征以及对应的故障原因，匹配度=突变速度且突变端点值相符合的数量max（待验证趋势特征中突变速度的数量，数据趋势特征中突变速度的数量），例如待验证趋势特征为：12mA/s：从24mA到48mA和-6mA/s：从48mA到12mA，数据趋势特征为：（10～13）mA/s：从（23～25）mA到（46～50）mA和（-7～-8）mA/s：从（46～50）mA到（10～8）mA，则匹配度=1/2=50%。

如图5所示，本发明实施例还提供了一种用于信息化串流的故障信息归类系统，所述系统包括：

历史数据流接收模块100，用于接收历史数据流故障信息，所述历史数据流故障信息包括异常数据流、数据参数名称和故障原因；

历史数据流归类模块200，用于根据故障原因对历史数据流故障信息进行第一次分类，从而得到若干个大类，根据数据参数名称对每大类中的历史数据流故障信息进行第二次分类，从而得到若干个小类；

数据趋势库生成模块300，用于对每小类中的异常数据流进行分析，确定数据趋势特征，数据趋势特征上标记有数据参数名称，对所有的数据趋势特征进行汇总，得到数据趋势库，所述数据趋势库包括多种数据趋势特征和对应的故障原因；

故障原因预测模块400，用于接收当前数据流故障信息，将当前数据流故障信息输入至数据趋势库，自动输出预测故障原因。

如图6所示，作为本发明一个优选的实施例，所述数据趋势库生成模块300包括：

突变特征确定单元301，用于确定每小类中每个异常数据流的突变特征，所述突变特征包括突变速度和突变端点值；

异常数据流筛选单元302，用于根据每个异常数据流的突变特征的相似度，对异常数据流进行分组和筛选；

数据趋势特征确定单元303，用于根据筛选后的异常数据流确定数据趋势特征，所述数据趋势特征包括一组或者多组突变速度范围和突变端点值范围。

如图7所示，作为本发明一个优选的实施例，所述突变特征确定单元301包括：

变换速度确定子单元3011，用于根据最小间隔值依次计算异常数据流的每段变换速度；

突变速度确定子单元3012，当后一段的变换速度相比前一段变换速度的变化幅度大于设定变化值时，设定后一段的变换速度为突变速度，记录突变端点值；

突变速度更新子单元3013，当后一段的变换速度相比前一段变换速度的变化幅度小于或者等于设定变化值时，且前一段变换速度为突变速度时，将这两段变换速度整合为一段，并对突变速度和突变端点值进行更新；

突变特征确定子单元3014，用于对所有的突变速度和对应的突变端点值进行汇总，从而得到突变特征。

如图8所示，作为本发明一个优选的实施例，所述故障原因预测模块400包括：

当前数据流输入单元401，用于将当前数据流故障信息输入至数据趋势库，所述当前数据流故障信息包含数据参数名称；

待验证趋势特征单元402，用于计算当前数据流故障信息的待验证趋势特征；

趋势特征匹配单元403，用于将待验证趋势特征与数据趋势库中的数据趋势特征进行匹配，输出匹配度最高的数据趋势特征以及对应的故障原因。

以上仅对本发明的较佳实施例进行了详细叙述，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

应该理解的是，虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink） DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

本领域技术人员在考虑说明书及实施例处的公开后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

Claims

1.一种用于信息化串流的故障信息归类方法，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述一种用于信息化串流的故障信息归类方法，其特征在于，所述对每小类中的异常数据流进行分析，确定数据趋势特征的步骤，具体包括：

3.根据权利要求2所述一种用于信息化串流的故障信息归类方法，其特征在于，所述确定每小类中每个异常数据流的突变特征的步骤，具体包括：

根据最小间隔值依次计算异常数据流的每段变换速度；

4.根据权利要求2所述一种用于信息化串流的故障信息归类方法，其特征在于，所述根据每个异常数据流的突变特征的相似度，对异常数据流进行分组和筛选的步骤，具体包括：

根据突变特征的相似度对每小类的异常数据流进行分组；

5.根据权利要求1所述一种用于信息化串流的故障信息归类方法，其特征在于，所述将当前数据流故障信息输入至数据趋势库，自动输出预测故障原因的步骤，具体包括：

计算当前数据流故障信息的待验证趋势特征；

6.一种用于信息化串流的故障信息归类系统，其特征在于，所述系统包括：

7.根据权利要求6所述一种用于信息化串流的故障信息归类系统，其特征在于，所述数据趋势库生成模块包括：

8.根据权利要求7所述一种用于信息化串流的故障信息归类系统，其特征在于，所述突变特征确定单元包括：

9.根据权利要求6所述一种用于信息化串流的故障信息归类系统，其特征在于，所述故障原因预测模块包括：