CN115114565B - 一种基于大数据分析的直线电机故障检测方法及系统 - Google Patents

一种基于大数据分析的直线电机故障检测方法及系统 Download PDF

Info

Publication number
CN115114565B
CN115114565B CN202211015641.5A CN202211015641A CN115114565B CN 115114565 B CN115114565 B CN 115114565B CN 202211015641 A CN202211015641 A CN 202211015641A CN 115114565 B CN115114565 B CN 115114565B
Authority
CN
China
Prior art keywords
data
dimension
coding
category
information source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211015641.5A
Other languages
English (en)
Other versions
CN115114565A (zh
Inventor
刘礼兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qidong Jingyao Photoelectric Technology Co ltd
Original Assignee
Qidong Jingyao Photoelectric Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qidong Jingyao Photoelectric Technology Co ltd filed Critical Qidong Jingyao Photoelectric Technology Co ltd
Priority to CN202211015641.5A priority Critical patent/CN115114565B/zh
Publication of CN115114565A publication Critical patent/CN115114565A/zh
Application granted granted Critical
Publication of CN115114565B publication Critical patent/CN115114565B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及数据处理领域,具体涉及一种基于大数据分析的直线电机故障检测方法及系统。采集设备多个维度的运行数据进行类别划分;计算每个维度数据的贡献度;获取每个维度数据的编码间隔;将每个维度中最小的数据作为初始符号开始增加编码间隔,得到下一个信源符号,将初始符号作为该间隔内所有数据的代表;依次增加编码间隔得到代表每个维度所有数据的信源符号编码范围;计算每个维度信源符号的频率;进行霍夫曼编码,得到每个维度的编码结果,将编码结果进行传输;对每个维度的编码结果进行解码,得到每个维度的检测数据,根据该维度的检测数据对设备进行故障检测。本发明通过对数据进行有损压缩,缩短编码长度的同时提高压缩传输效率。

Description

一种基于大数据分析的直线电机故障检测方法及系统
技术领域
本发明涉及数据处理领域,具体涉及一种基于大数据分析的直线电机故障检测方法及系统。
背景技术
直线电机是一种将电能直接转换成直线运动机械能,而不需要任何中间转换机构的传动装置,结构简单,响应速度快,易于调节和控制,在物流系统、工业加工与装配等领域有着广泛的应用。在直线电机的实际应用中,经常会出现一些故障,一旦发生故障,若不能及时发现并处理,将造成巨大的经济损失和人员伤亡。为避免巨大的经济损失和人员伤亡,需要实时在直线电机运行过程的可控范围内检测出故障。
故障检测通常需要综合多种数据进行综合判断,计算过程复杂,而直线电机的数据采集端的计算能力有限,不能进行太过复杂的计算,因此,需要将采集端采集的数据实时传输至数据处理端,为了满足故障检测的实时性,需要数据传输方法足够快速且简单。
基于此,本发明提出一种基于大数据分析的直线电机故障检测方法及系统。本发明通过均值聚类漂移算法对历史运行数据进行分类,根据分类结果计算每个维度的贡献率,结合维度特性获得信源符号的间隔,进而获得每个维度的信源符号和霍夫曼编码表,根据霍夫曼编码表对检测数据和补充数据进行编码,根据检测数据获得故障检测结果,对于检测结果模糊的检测数据,传输对应的补充数据,根据更准确的数据对直线电机进行故障检测。
发明内容
本发明提供一种基于大数据分析的直线电机故障检测方法及系统,以解决现有的问题,包括:采集设备多个维度的运行数据进行类别划分;计算每个维度数据的贡献度;获取每个维度数据的编码间隔;将每个维度中最小的数据作为初始符号开始增加编码间隔,得到下一个信源符号,将初始符号作为该间隔内所有数据的代表;依次增加编码间隔得到代表每个维度所有数据的信源符号序列;计算每个维度信源符号的频率;进行霍夫曼编码,得到每个维度的编码结果,将编码结果进行传输;对每个维度的编码结果进行解码,得到每个维度的检测数据,根据该维度的检测数据对设备进行故障检测。
根据本发明提出的技术手段,结合维度贡献率和维度特性给每个维度自适应信源符号的间隔,进而实现对不同维度的数据进行不同程度的有损压缩,保证了重要维度数据的准确性,通过对数据进行有损压缩,减少霍夫曼编码中信源符号的数量,缩短编码长度,提高压缩传输效率实现了对运行数据的实时传输和对直线电机故障的实时监测检测,同时对属于正常数据的概率较小的数据,进行补充传输,这样既提高了压缩效率,也能够保证对直线电机的故障检测的准确性。
本发明采用如下技术方案,一种基于大数据分析的直线电机故障检测方法,包括:
采集设备多个维度的运行数据,对所有维度的运行数据进行类别划分,得到多个类别。
根据每个维度的运行数据与该维度数据所在类别的数据均值之间的差异计算每个维度数据的贡献度。
将每个维度的数据值从小到大进行排列,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据的值以及该维度数据的贡献度计算该维度数据的编码间隔,获取每个维度数据的编码间隔。
将每个维度中最小的数据作为初始符号,对每个维度的初始符号增加对应维度的编码间隔,得到下一个信源符号,获取每个维度数据中数据值处于该间隔内的数据个数。
将每个维度数据中数据值处于初始符号与其下一个信源符号之间的数据个数作为每个维度数据初始符号的编码范围;对每个维度数据的下一个信源符号增加编码间隔,获取下一个信源符号的编码范围。
依次对每个维度数据的信源符号增加编码间隔,直至每个维度数据信源符号的编码范围中包含该维度数据的最大值,得到每个维度数据的所有信源符号,获取每个维度数据的所有信源符号的编码范围。
根据每个维度数据的信源符号编码范围中该维度的数据个数计算每个维度数据的所有信源符号频率。
根据每个维度数据的所有信源符号频率值进行霍夫曼编码,得到每个维度数据的编码结果,将编码结果进行传输。
对每个维度数据的编码结果进行解码,得到每个维度的检测数据,根据该维度的检测数据对设备进行故障检测。
进一步的,一种基于大数据分析的直线电机故障检测方法,对所有维度的运行数据进行类别划分,得到多个类别的方法为:
通过采集该设备的不同数据作为该设备的多维数据,利用均值漂移聚类算法对该设备多个维度的运行数据进行聚类,将该设备的多维数据分为正常类别和异常类别。
进一步的,一种基于大数据分析的直线电机故障检测方法,计算数据的贡献度的方法为:
获取每个类别的聚类中心,计算每个类别中数据的均值,根据每个维度的数据值与各个类别中数据的均值之间的差异计算每个维度数据的贡献度,表达式为:
Figure 948949DEST_PATH_IMAGE001
其中,
Figure 613279DEST_PATH_IMAGE002
表示第i个维度数据的贡献度,
Figure 371020DEST_PATH_IMAGE003
表示正常类别中第i个维度的第j个数据值,
Figure 363378DEST_PATH_IMAGE004
表示正常类别,
Figure 231977DEST_PATH_IMAGE005
表示异常类别,
Figure 16393DEST_PATH_IMAGE006
表示正常类别中第
Figure 430188DEST_PATH_IMAGE007
个维度数据的均值,
Figure 424689DEST_PATH_IMAGE008
表示异常类别中第
Figure 593850DEST_PATH_IMAGE007
个维度数据的均值,
Figure 154145DEST_PATH_IMAGE009
为第
Figure 801158DEST_PATH_IMAGE007
个维度所有数据的均值,
Figure 96004DEST_PATH_IMAGE010
为正常类别中的数据个数,
Figure 244089DEST_PATH_IMAGE011
为异常类别中的数据个数,
Figure 675201DEST_PATH_IMAGE012
为所有数据的个数。
进一步的,一种基于大数据分析的直线电机故障检测方法,每个维度数据的编码间隔的方法为:
将每个维度的数据从小到大进行排序,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据值之差以及每个维度数据的贡献度计算该维度数据的编码间隔,表达式为:
Figure 758695DEST_PATH_IMAGE013
其中,
Figure 727788DEST_PATH_IMAGE014
表示第i个维度数据的编码间隔,
Figure 227033DEST_PATH_IMAGE002
表示第i个维度数据的贡献度,
Figure 761920DEST_PATH_IMAGE015
表示第i个维度的第k个数据,
Figure 16315DEST_PATH_IMAGE016
表示第i个维度与第k个数据相邻的第
Figure 223436DEST_PATH_IMAGE017
个数据,M表示该维度中的数据个数。
进一步的,一种基于大数据分析的直线电机故障检测方法,获取每个维度数据的所有信源符号的编码范围的方法为:
以每个维度中的最小数据值作为初始符号,对初始符号增加编码间隔得到第二信源符号,统计该维度中数据值处于初始符号和第二信源符号之间的所有数据,将数据值处于初始符号和初始符号下一符号之间的所有数据的个数作为初始符号的编码范围;
对第二信源符号增加编码间隔得到第三信源符号,统计该维度中数据值处于第二信源符号和第三信源符号之间的所有数据,将第二信源符号作为数据值处于第二信源符号和第三信源符号之间的所有数据的个数作为第二信源符号的编码范围;
依次增加编码间隔,直至得到的信源符号的编码范围包含该维度中数据最大值的信源符号,根据该维度数据的所有信源编码构成该维度数据的信源编码序列。
进一步的,一种基于大数据分析的直线电机故障检测方法,根据检测数据对设备进行故障检测的方法为:
获取设备多个维度数据的正常类别的聚类中心和异常类别的聚类中心;
对编码结果进行解码得到检测数据,计算该检测数据与正常类别中每个维度数据的差值绝对值,获取所有差值绝对值与正常类别中数据个数的比值之和作为检测数据的正常概率,根据该检测数据的正常概率判断设备的故障情况。
进一步的,一种基于大数据分析的直线电机故障检测方法,计算得到检测数据的正常概率之后,还包括:
获取正常概率值小于阈值的检测数据,获取该检测数据与其对应的真实数据之间的误差值,将误差值作为该检测数据的补充数据,获取补充数据的信源符号,将补充数据的信源符号进行编码传输;
对补充数据的信源符号进行解码,根据该检测数据和其对应的补充数据判断设备的故障情况。
进一步的,本发明还提出了一种基于大数据分析的直线电机故障检测系统,包括数据采集模块、数据传输模块以及数据接收模块;
数据采集模块,用于采集设备多个维度的运行数据,对所有维度的运行数据进行类别划分,得到多个类别;
数据传输模块包括编码间隔计算单元、信源符号确定单元以及数据编码传输单元;
编码间隔计算单元,用于根据每个维度的运行数据与该维度数据所在类别的数据均值之间的差异计算每个维度数据的贡献度;
将每个维度的数据值从小到大进行排列,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据的值以及该维度数据的贡献度计算该维度数据的编码间隔,获取每个维度数据的编码间隔;
信源符号确定单元,用于将每个维度中最小的数据作为初始符号,对每个维度的初始符号增加对应维度的编码间隔,得到下一个信源符号,获取每个维度数据中数据值处于该间隔内的数据个数;
将每个维度数据中数据值处于初始符号与其下一个信源符号之间的数据个数作为每个维度数据初始符号的编码范围;对每个维度数据的下一个信源符号增加编码间隔,获取下一个信源符号的编码范围;
依次对每个维度数据的信源符号增加编码间隔,直至每个维度数据信源符号的编码范围中包含该维度数据的最大值,得到每个维度数据的所有信源符号,获取每个维度数据的所有信源符号的编码范围;
数据编码传输单元,用于根据每个维度数据的信源符号编码范围中该维度的数据个数计算每个维度数据的所有信源符号频率;根据每个维度数据的所有信源符号频率值进行霍夫曼编码,得到每个维度数据的编码结果,将编码结果进行传输;
数据接收模块,用于对每个维度的编码结果进行解码,得到每个维度的检测数据,根据该维度的检测数据对设备进行故障检测。
本发明的有益效果是:根据本发明提出的技术手段,结合维度贡献率和维度特性给每个维度自适应信源符号的间隔,进而实现对不同维度的数据进行不同程度的有损压缩,保证了重要维度数据的准确性,通过对数据进行有损压缩,减少霍夫曼编码中信源符号的数量,缩短编码长度,提高压缩传输效率实现了对运行数据的实时传输和对直线电机故障的实时监测检测,同时对属于正常数据的概率较小的数据,进行补充传输,这样既提高了压缩效率,也能够保证对直线电机的故障检测的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的一种基于大数据分析的直线电机故障检测方法结构示意图;
图2为本发明实施例的一种基于大数据分析的直线电机故障检测系统流程示意图;
图3为本发明实施例的数据传输模块流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,给出了本发明实施例的一种基于大数据分析的直线电机故障检测方法结构示意图,包括:
101.采集设备多个维度的运行数据,对所有维度的运行数据进行类别划分,得到多个类别。
对所有维度的运行数据进行类别划分,得到多个类别的方法为:
通过采集该设备的不同数据作为该设备的多维数据,利用均值漂移聚类算法对该设备多个维度的运行数据进行聚类,将该设备的多维数据分为正常类别和异常类别。
在直线电机的实际应用中,经常会出现一些故障,比如定子故障、电源故障等,针对这些故障的检测,需要采集大量运行数据进行分析。
本发明中多个维度的运行数据为通过设置传感器采集直线电机运行过程中的速度、加速度、位置、震动信号等运行数据,同时通过发送端将运行数据传输至数据处理端。
102.根据每个维度的运行数据与各个类别数据的均值之间的差异计算每个维度数据的贡献度。
对于数据的每个维度,若该维度能够较好的区分正常类别和异常类别,即该维度数据在正常类别中差异较小且在正常类别与异常类别之间差异较大,则该维度数据对故障检测结果准确性的贡献率越大。
计算数据的贡献度的方法为:
获取每个类别的聚类中心,计算每个类别中数据的均值,根据每个维度的数据值与各个类别中数据的均值之间的差异计算每个维度数据的贡献度,表达式为:
Figure 588690DEST_PATH_IMAGE018
其中,
Figure 243662DEST_PATH_IMAGE002
表示第i个维度数据的贡献度,
Figure 544325DEST_PATH_IMAGE003
表示正常类别中第i个维度的第j个数据值,
Figure 19168DEST_PATH_IMAGE004
表示正常类别,
Figure 594637DEST_PATH_IMAGE005
表示异常类别,
Figure 104116DEST_PATH_IMAGE006
表示正常类别中第
Figure 372417DEST_PATH_IMAGE007
个维度数据的均值,
Figure 413186DEST_PATH_IMAGE008
表示异常类别中第
Figure 41613DEST_PATH_IMAGE007
个维度数据的均值,
Figure 156331DEST_PATH_IMAGE009
为第
Figure 844801DEST_PATH_IMAGE007
个维度所有数据的均值,
Figure 248232DEST_PATH_IMAGE010
为正常类别中的数据个数,
Figure 414771DEST_PATH_IMAGE011
为异常类别中的数据个数,
Figure 649574DEST_PATH_IMAGE012
为所有数据的个数。
103.将每个维度的数据值从小到大进行排列,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据的值以及该维度数据的贡献度计算该维度数据的编码间隔,获取每个维度数据的编码间隔。
每个维度数据的编码间隔的方法为:
将每个维度的数据从小到大进行排序,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据值之差以及每个维度数据的贡献度计算该维度数据的编码间隔,表达式为:
Figure 508946DEST_PATH_IMAGE013
其中,
Figure 247008DEST_PATH_IMAGE014
表示第i个维度数据的编码间隔,
Figure 233550DEST_PATH_IMAGE002
表示第i个维度数据的贡献度,
Figure 775390DEST_PATH_IMAGE015
表示第i个维度的第k个数据,
Figure 556395DEST_PATH_IMAGE016
表示第i个维度与第k个数据相邻的第
Figure 980423DEST_PATH_IMAGE017
个数据,M表示该维度中的数据个数。
104.将每个维度中最小的数据作为初始符号,从初始符号开始增加编码间隔,得到下一个信源符号,获取每个维度数据中数据值处于该间隔内的数据个数,将初始符号作为该间隔内所有数据的代表。
对下一个信源符号增加编码间隔,获取下一个信源符号代表的该维度所有数据,依次增加编码间隔,直至获取代表该维度中数据最大值的信源符号,得到代表每个维度所有数据的信源符号序列。
获取每个维度数据的所有信源符号的编码范围的方法为:
以每个维度中的最小数据值作为初始符号,对初始符号增加编码间隔得到第二信源符号,统计该维度中数据值处于初始符号和第二信源符号之间的所有数据,将数据值处于初始符号和初始符号下一符号之间的所有数据的个数作为初始符号的编码范围;
对第二信源符号增加编码间隔得到第三信源符号,统计该维度中数据值处于第二信源符号和第三信源符号之间的所有数据,将第二信源符号作为数据值处于第二信源符号和第三信源符号之间的所有数据的个数作为第二信源符号的编码范围;
依次增加编码间隔,直至得到的信源符号的编码范围包含该维度中数据最大值的信源符号,根据该维度数据的所有信源编码构成该维度数据的信源编码序列。
对于第
Figure 567394DEST_PATH_IMAGE007
个维度的数据,获取该维度数据的最小值
Figure 511210DEST_PATH_IMAGE019
和最大值
Figure 977963DEST_PATH_IMAGE020
,则该维度的信源符号为
Figure 577703DEST_PATH_IMAGE021
,其中,
Figure 889736DEST_PATH_IMAGE014
为第
Figure 953638DEST_PATH_IMAGE007
个维度的间隔,
Figure 325713DEST_PATH_IMAGE022
,且
Figure 537383DEST_PATH_IMAGE023
表示向上取整数。
对于第i个维度中的数据,其信源符号序列中的每个信源符号均代表了该维度中的多个数据,即每个信源符号的编码范围为对应维度中的多个数据,如第i个维度数据的信源符号序列中,
Figure 669418DEST_PATH_IMAGE019
表示第
Figure 774777DEST_PATH_IMAGE007
个维度的数据中数据值处于
Figure 68487DEST_PATH_IMAGE024
之间的所有数据,获取该范围内所有数据的个数,即为
Figure 688824DEST_PATH_IMAGE019
的编码范围。
105.根据每个维度的信源符号序列中每个信源符号代表的数据个数计算每个维度信源符号的频率。
对于第
Figure 686867DEST_PATH_IMAGE007
个维度的第
Figure 459782DEST_PATH_IMAGE025
个信源符号
Figure 376922DEST_PATH_IMAGE026
,其概率计算公式为:
Figure 828763DEST_PATH_IMAGE027
,其中,
Figure 302601DEST_PATH_IMAGE015
为第
Figure 116973DEST_PATH_IMAGE007
个维度对应的序列中的第
Figure 283644DEST_PATH_IMAGE028
个数据,
Figure 691622DEST_PATH_IMAGE029
为数值
Figure 952839DEST_PATH_IMAGE015
满足中条件
Figure 649749DEST_PATH_IMAGE030
的数据点的数量,
Figure 236588DEST_PATH_IMAGE031
为第
Figure 131862DEST_PATH_IMAGE007
个维度的第
Figure 947503DEST_PATH_IMAGE025
个信源符号
Figure 2047DEST_PATH_IMAGE026
的概率。
106.根据每个维度信源符号序列中每个信源符号的频率值进行霍夫曼编码,得到每个维度数据的编码结果,将编码结果进行传输。
本发明为了提高压缩和传输的效率采用有损压缩,其中接收端的接收数据并用于检测故障的数据,记为检测数据,根据霍夫曼编码表对检测数据进行编码,利用信源符号的概率构建加权霍夫曼树,获得霍夫曼编码表并通过发送端向接收端传输。
107.对每个维度数据的编码结果进行解码,得到每个维度的检测数据,根据该维度的检测数据对设备进行故障检测。
本发明通过安装在直线电机处的发送端将检测数据传输至接收端,并通过数据处理端进行故障检测,计算该检测数据的正常概率。
根据检测数据对设备进行故障检测的方法为:
获取设备多个维度数据的正常类别的聚类中心和异常类别的聚类中心;
对编码结果进行解码得到检测数据,计算该检测数据与正常类别中每个维度数据的差值绝对值,获取所有差值绝对值与正常类别中数据个数的比值之和作为检测数据的正常概率,根据该检测数据的正常概率判断设备的故障情况。
计算得到检测数据的正常概率之后,还包括:
由于采用了有损压缩,因此,检测数据与真实数据之间存在误差,记为补充数据,对于真实数据中的第
Figure 307257DEST_PATH_IMAGE007
个维度的数据
Figure 627511DEST_PATH_IMAGE032
,在对应维度的信源符号中,找到比
Figure 433793DEST_PATH_IMAGE032
小的最大的信源符号,则该信源符号即为数据
Figure 890313DEST_PATH_IMAGE032
的检测数据
Figure 632004DEST_PATH_IMAGE033
,记检测数据与真实数据的误差为
Figure 423243DEST_PATH_IMAGE034
,由于误差小于信源符号的间隔,因此在霍夫曼编码表没有对应的编码,为了通过现有的编码表对误差进行编码,将误差扩大10倍,在对应维度的信源符号中,找到比
Figure 783948DEST_PATH_IMAGE035
小的最大的信源符号,则该信源符号即为补充数据
Figure 609822DEST_PATH_IMAGE036
,根据霍夫曼编码表对补充数据进行编码,并暂存在发送端。
若检测数据的正常概率概率
Figure 256835DEST_PATH_IMAGE037
小于0.3,则说明通过该检测数据属于正常类别的概率较低,为了能够更加准确的判断直线电机的故障,需要更准确的数据进行分析。
获取正常概率值小于阈值的检测数据,获取该检测数据与其对应的真实数据之间的误差值,将误差值作为该检测数据的补充数据,获取补充数据的信源符号,将补充数据的信源符号进行编码传输;
对补充数据的信源符号进行解码,根据该检测数据和其对应的补充数据判断设备的故障情况。
如图2所示,给出了本发明实施例的一种基于大数据分析的直线电机故障检测系统流程示意图,包括数据采集模块、数据传输模块以及数据接收模块;
数据采集模块,用于采集设备多个维度的运行数据,对所有维度的运行数据进行类别划分,得到多个类别;
如图3所示,数据传输模块包括编码间隔计算单元、信源符号确定单元以及数据编码传输单元;
编码间隔计算单元,用于根据每个维度的运行数据与该维度数据所在类别的数据均值之间的差异计算每个维度数据的贡献度;
将每个维度的数据值从小到大进行排列,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据的值以及该维度数据的贡献度计算该维度数据的编码间隔,获取每个维度数据的编码间隔;
信源符号确定单元,用于将每个维度中最小的数据作为初始符号,对每个维度的初始符号增加对应维度的编码间隔,得到下一个信源符号,获取每个维度数据中数据值处于该间隔内的数据个数;
将每个维度数据中数据值处于初始符号与其下一个信源符号之间的数据个数作为每个维度数据初始符号的编码范围;对每个维度数据的下一个信源符号增加编码间隔,获取下一个信源符号的编码范围;
依次对每个维度数据的信源符号增加编码间隔,直至每个维度数据信源符号的编码范围中包含该维度数据的最大值,得到每个维度数据的所有信源符号,获取每个维度数据的所有信源符号的编码范围;
数据编码传输单元,用于根据每个维度数据的信源符号编码范围中该维度的数据个数计算每个维度数据的所有信源符号频率;根据每个维度数据的所有信源符号频率值进行霍夫曼编码,得到每个维度数据的编码结果,将编码结果进行传输;
数据接收模块,用于对每个维度的编码结果进行解码,得到每个维度的检测数据,根据该维度的检测数据对设备进行故障检测。
根据本发明提出的技术手段,结合维度贡献率和维度特性给每个维度自适应信源符号的间隔,进而实现对不同维度的数据进行不同程度的有损压缩,保证了重要维度数据的准确性,通过对数据进行有损压缩,减少霍夫曼编码中信源符号的数量,缩短编码长度,提高压缩传输效率实现了对运行数据的实时传输和对直线电机故障的实时监测检测,同时对属于正常数据的概率较小的数据,进行补充传输,这样既提高了压缩效率,也能够保证对直线电机的故障检测的准确性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于大数据分析的直线电机故障检测方法,其特征在于,包括:
采集设备多个维度的运行数据,对所有维度的运行数据进行类别划分,得到多个类别;
根据每个维度的运行数据与该维度数据所在类别的数据均值之间的差异计算每个维度数据的贡献度;计算数据的贡献度的方法为:
获取每个类别的聚类中心,计算每个类别中数据的均值,根据每个维度的数据值与各个类别中数据的均值之间的差异计算每个维度数据的贡献度,表达式为:
Figure 519156DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示第i个维度数据的贡献度,
Figure 95893DEST_PATH_IMAGE004
表示正常类别中第i个维度的第j个数据值,
Figure DEST_PATH_IMAGE005
表示正常类别,
Figure 306295DEST_PATH_IMAGE006
表示异常类别,
Figure DEST_PATH_IMAGE007
表示正常类别中第
Figure 547527DEST_PATH_IMAGE008
个维度数据的均值,
Figure DEST_PATH_IMAGE009
表示异常类别中第
Figure 614709DEST_PATH_IMAGE008
个维度数据的均值,
Figure 318223DEST_PATH_IMAGE010
为第
Figure 801157DEST_PATH_IMAGE008
个维度所有数据的均值,
Figure DEST_PATH_IMAGE011
为正常类别中的数据个数,
Figure 165404DEST_PATH_IMAGE012
为异常类别中的数据个数,
Figure DEST_PATH_IMAGE013
为所有数据的个数;
将每个维度的数据值从小到大进行排列,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据的值以及该维度数据的贡献度计算该维度数据的编码间隔,获取每个维度数据的编码间隔,方法为:
将每个维度的数据从小到大进行排序,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据值之差以及每个维度数据的贡献度计算该维度数据的编码间隔,表达式为:
Figure DEST_PATH_IMAGE015
其中,
Figure 137908DEST_PATH_IMAGE016
表示第i个维度数据的编码间隔,
Figure 459929DEST_PATH_IMAGE003
表示第i个维度数据的贡献度,
Figure DEST_PATH_IMAGE017
表示第i个维度的第k个数据,
Figure 74450DEST_PATH_IMAGE018
表示第i个维度与第k个数据相邻的第
Figure DEST_PATH_IMAGE019
个数据,M表示该维度中的数据个数;
将每个维度中最小的数据作为初始符号,对每个维度的初始符号增加对应维度的编码间隔,得到下一个信源符号,获取每个维度数据中数据值处于该间隔内的数据个数;
将每个维度数据中数据值处于初始符号与其下一个信源符号之间的数据个数作为每个维度数据初始符号的编码范围;对每个维度数据的下一个信源符号增加编码间隔,获取下一个信源符号的编码范围;
依次对每个维度数据的信源符号增加编码间隔,直至每个维度数据信源符号的编码范围中包含该维度数据的最大值,得到每个维度数据的所有信源符号,获取每个维度数据的所有信源符号的编码范围;
根据每个维度数据的信源符号编码范围中该维度的数据个数计算每个维度数据的所有信源符号频率;
根据每个维度数据的所有信源符号频率值进行霍夫曼编码,得到每个维度数据的编码结果,将编码结果进行传输;
对每个维度数据的编码结果进行解码,得到每个维度的检测数据,根据该维度的检测数据对设备进行故障检测,方法为:
获取设备多个维度数据的正常类别的聚类中心和异常类别的聚类中心;
对编码结果进行解码得到检测数据,计算该检测数据与正常类别中每个维度数据的差值绝对值,获取所有差值绝对值与正常类别中数据个数的比值之和作为检测数据的正常概率,根据该检测数据的正常概率判断设备的故障情况。
2.根据权利要求1所述的一种基于大数据分析的直线电机故障检测方法,其特征在于,对所有维度的运行数据进行类别划分,得到多个类别的方法为:
通过采集该设备的不同数据作为该设备的多维数据,利用均值漂移聚类算法对该设备多个维度的运行数据进行聚类,将该设备的多维数据分为正常类别和异常类别。
3.根据权利要求1所述的一种基于大数据分析的直线电机故障检测方法,其特征在于,获取每个维度数据的所有信源符号的编码范围的方法为:
以每个维度中的最小数据值作为初始符号,对初始符号增加编码间隔得到第二信源符号,统计该维度中数据值处于初始符号和第二信源符号之间的所有数据,将数据值处于初始符号和初始符号下一符号之间的所有数据的个数作为初始符号的编码范围;
对第二信源符号增加编码间隔得到第三信源符号,统计该维度中数据值处于第二信源符号和第三信源符号之间的所有数据,将第二信源符号作为数据值处于第二信源符号和第三信源符号之间的所有数据的个数作为第二信源符号的编码范围;
依次增加编码间隔,直至得到的信源符号的编码范围包含该维度中数据最大值的信源符号,根据该维度数据的所有信源编码构成该维度数据的信源编码序列。
4.根据权利要求1所述的一种基于大数据分析的直线电机故障检测方法,其特征在于,计算得到检测数据的正常概率之后,还包括:
获取正常概率值小于阈值的检测数据,获取该检测数据与其对应的真实数据之间的误差值,将误差值作为该检测数据的补充数据,获取补充数据的信源符号,将补充数据的信源符号进行编码传输;
对补充数据的信源符号进行解码,根据该检测数据和其对应的补充数据判断设备的故障情况。
5.一种基于大数据分析的直线电机故障检测系统,其特征在于,包括数据采集模块、数据传输模块以及数据接收模块;
数据采集模块,用于采集设备多个维度的运行数据,对所有维度的运行数据进行类别划分,得到多个类别;
数据传输模块包括编码间隔计算单元、信源符号确定单元以及数据编码传输单元;
编码间隔计算单元,用于根据每个维度的运行数据与该维度数据所在类别的数据均值之间的差异计算每个维度数据的贡献度;计算数据的贡献度的方法为:
获取每个类别的聚类中心,计算每个类别中数据的均值,根据每个维度的数据值与各个类别中数据的均值之间的差异计算每个维度数据的贡献度,表达式为:
Figure 762045DEST_PATH_IMAGE002
其中,
Figure 108713DEST_PATH_IMAGE003
表示第i个维度数据的贡献度,
Figure 786819DEST_PATH_IMAGE004
表示正常类别中第i个维度的第j个数据值,
Figure 142714DEST_PATH_IMAGE005
表示正常类别,
Figure 589876DEST_PATH_IMAGE006
表示异常类别,
Figure 340401DEST_PATH_IMAGE007
表示正常类别中第
Figure 302540DEST_PATH_IMAGE008
个维度数据的均值,
Figure 196547DEST_PATH_IMAGE009
表示异常类别中第
Figure 560532DEST_PATH_IMAGE008
个维度数据的均值,
Figure 688151DEST_PATH_IMAGE010
为第
Figure 403166DEST_PATH_IMAGE008
个维度所有数据的均值,
Figure 38546DEST_PATH_IMAGE011
为正常类别中的数据个数,
Figure 991459DEST_PATH_IMAGE012
为异常类别中的数据个数,
Figure 116410DEST_PATH_IMAGE013
为所有数据的个数;
将每个维度的数据值从小到大进行排列,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据的值以及该维度数据的贡献度计算该维度数据的编码间隔,获取每个维度数据的编码间隔;方法为:
将每个维度的数据从小到大进行排序,得到每个维度的数据序列,根据每个维度的数据序列中相邻两两数据值之差以及每个维度数据的贡献度计算该维度数据的编码间隔,表达式为:
Figure 286098DEST_PATH_IMAGE015
其中,
Figure 725169DEST_PATH_IMAGE016
表示第i个维度数据的编码间隔,
Figure 63747DEST_PATH_IMAGE003
表示第i个维度数据的贡献度,
Figure 94020DEST_PATH_IMAGE017
表示第i个维度的第k个数据,
Figure 753933DEST_PATH_IMAGE018
表示第i个维度与第k个数据相邻的第
Figure 527854DEST_PATH_IMAGE019
个数据,M表示该维度中的数据个数;
信源符号确定单元,用于将每个维度中最小的数据作为初始符号,对每个维度的初始符号增加对应维度的编码间隔,得到下一个信源符号,获取每个维度数据中数据值处于该间隔内的数据个数;
将每个维度数据中数据值处于初始符号与其下一个信源符号之间的数据个数作为每个维度数据初始符号的编码范围;对每个维度数据的下一个信源符号增加编码间隔,获取下一个信源符号的编码范围;
依次对每个维度数据的信源符号增加编码间隔,直至每个维度数据信源符号的编码范围中包含该维度数据的最大值,得到每个维度数据的所有信源符号,获取每个维度数据的所有信源符号的编码范围;
数据编码传输单元,用于根据每个维度数据的信源符号编码范围中该维度的数据个数计算每个维度数据的所有信源符号频率;根据每个维度数据的所有信源符号频率值进行霍夫曼编码,得到每个维度数据的编码结果,将编码结果进行传输;
数据接收模块,用于对每个维度的编码结果进行解码,得到每个维度的检测数据,根据该维度的检测数据对设备进行故障检测,方法为:
获取设备多个维度数据的正常类别的聚类中心和异常类别的聚类中心;
对编码结果进行解码得到检测数据,计算该检测数据与正常类别中每个维度数据的差值绝对值,获取所有差值绝对值与正常类别中数据个数的比值之和作为检测数据的正常概率,根据该检测数据的正常概率判断设备的故障情况。
CN202211015641.5A 2022-08-24 2022-08-24 一种基于大数据分析的直线电机故障检测方法及系统 Active CN115114565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211015641.5A CN115114565B (zh) 2022-08-24 2022-08-24 一种基于大数据分析的直线电机故障检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211015641.5A CN115114565B (zh) 2022-08-24 2022-08-24 一种基于大数据分析的直线电机故障检测方法及系统

Publications (2)

Publication Number Publication Date
CN115114565A CN115114565A (zh) 2022-09-27
CN115114565B true CN115114565B (zh) 2022-12-27

Family

ID=83336154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211015641.5A Active CN115114565B (zh) 2022-08-24 2022-08-24 一种基于大数据分析的直线电机故障检测方法及系统

Country Status (1)

Country Link
CN (1) CN115114565B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115309753B (zh) * 2022-10-11 2023-04-18 江苏泰洁检测技术股份有限公司 一种高效环保智能样本研发系统的数据快速读取方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811114A (zh) * 2012-07-12 2012-12-05 中国电子科技集团公司第二十八研究所 一种采用帧间编码的字符型通信报文压缩方法
CN110631527A (zh) * 2019-08-29 2019-12-31 南京理工大学 一种城轨列车直线电机槽楔下沉故障检测方法
CN111699696A (zh) * 2017-12-06 2020-09-22 V-诺瓦国际有限公司 用于对字节流进行编码和解码的方法和设备
CN113360718A (zh) * 2021-06-03 2021-09-07 河南纽瑞电气科技有限公司 一种基于大数据分析的直线电机故障检测方法及系统
CN114915295A (zh) * 2022-05-09 2022-08-16 重庆邮电大学 一种特定条件下超越熵极限的符号编码方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811114A (zh) * 2012-07-12 2012-12-05 中国电子科技集团公司第二十八研究所 一种采用帧间编码的字符型通信报文压缩方法
CN111699696A (zh) * 2017-12-06 2020-09-22 V-诺瓦国际有限公司 用于对字节流进行编码和解码的方法和设备
CN110631527A (zh) * 2019-08-29 2019-12-31 南京理工大学 一种城轨列车直线电机槽楔下沉故障检测方法
CN113360718A (zh) * 2021-06-03 2021-09-07 河南纽瑞电气科技有限公司 一种基于大数据分析的直线电机故障检测方法及系统
CN114915295A (zh) * 2022-05-09 2022-08-16 重庆邮电大学 一种特定条件下超越熵极限的符号编码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
改进的基于霍夫曼编码的故障诊断策略;匡翠婷等;《计算机应用》;20150620;第35卷;第186-188页 *

Also Published As

Publication number Publication date
CN115114565A (zh) 2022-09-27

Similar Documents

Publication Publication Date Title
CN110895526A (zh) 一种大气监测系统中数据异常的修正方法
CN115114565B (zh) 一种基于大数据分析的直线电机故障检测方法及系统
CN116304898B (zh) 基于机器学习的传感器数据智能存储系统
CN110376522A (zh) 一种数据融合的深度学习网络的电机故障诊断方法
CN112327100B (zh) 基于物联网的电力故障检测方法及其系统
CN114186617B (zh) 一种基于分布式深度学习的机械故障诊断方法
CN116467649A (zh) 一种基于eemd排列熵和ga-svm的透平膨胀机故障诊断方法及装置
CN117473351B (zh) 基于物联网的电源信息远程传输系统
CN115184016A (zh) 一种升降机轴承故障检测方法
CN114372093A (zh) 一种变压器dga在线监测数据的处理方法
CN117036732B (zh) 一种基于融合模型的机电设备检测系统、方法及设备
CN115695564B (zh) 一种物联网数据的高效传输方法
Yaqub et al. Machine fault severity estimation based on adaptive wavelet nodes selection and SVM
Hou et al. Machine fault diagnosis using industrial wireless sensor networks and on-sensor wavelet transform
CN116167008A (zh) 基于数据增强的物联感知云数据中心异常定位方法
CN115269659A (zh) 一种组合式空调箱的能耗检测的远程监控系统
CN108958221A (zh) 基于工业物联网与支持向量机多分类算法的设备故障诊断方法
CN111476383A (zh) 一种泵站机组状态检修动态决策方法
CN117273547B (zh) 基于边缘计算的生产设备运行数据处理方法
CN111980900B (zh) 一种基于多源数据融合分析的水泵故障诊断方法
CN117474345B (zh) 一种智慧环境环保远程实时监测预警方法及系统
CN115270895B (zh) 一种用于柴油机的故障检测方法
CN115277324B (zh) 基于卷积神经网络的fsk信号识别方法
CN113609207B (zh) 一种边坡形变监测数据的数据预处理方法
CN117909668B (zh) 基于卷积神经网络的轴承故障诊断方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant