CN111949646B - 基于大数据的设备运行状况分析方法、装置、设备及介质 - Google Patents

基于大数据的设备运行状况分析方法、装置、设备及介质 Download PDF

Info

Publication number
CN111949646B
CN111949646B CN202010913770.0A CN202010913770A CN111949646B CN 111949646 B CN111949646 B CN 111949646B CN 202010913770 A CN202010913770 A CN 202010913770A CN 111949646 B CN111949646 B CN 111949646B
Authority
CN
China
Prior art keywords
data
feature
data set
value
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010913770.0A
Other languages
English (en)
Other versions
CN111949646A (zh
Inventor
陈于辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202010913770.0A priority Critical patent/CN111949646B/zh
Publication of CN111949646A publication Critical patent/CN111949646A/zh
Application granted granted Critical
Publication of CN111949646B publication Critical patent/CN111949646B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明涉及数据处理技术,揭露了一种基于大数据的设备运行状况分析方法,包括:获取设备的运行数据集并进行数据清洗得到清洗数据集;提取清洗数据集的运行特征数据,得到运行特征数据集;计算运行特征数据集的运行特征值;当运行特征值在预设的告警阈值区间内,推送告警状态;当运行特征值大于告警阈值区间的上限,根据运行特征数据集判断设备的故障类型;查询与故障类型相应的故障解决方案,推送故障类型及故障解决方案。所述运行状态可存储于区块链中。本发明还提出一种基于大数据的设备运行状况分析装置、电子设备以及一种计算机可读存储介质。本发明可以实现预先对设备运行状态进行预警和提高设备运行状况分析的效率。

Description

基于大数据的设备运行状况分析方法、装置、设备及介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于大数据的设备运行状况分析方法、装置、电子设备及计算机可读存储介质。
背景技术
随着科技的发展,人们日常生活中使用大量的电子设备来提高生活的质量或办事的效率,但由于目前技术的限制,使用设备时可能会存在一些安全隐患,例如电梯运行卡死,电子自动门无法打开等。因此需要对电子设备的运行状况进行分析,如运行正常或是运行异常等。
但目前市场上对于电子设备进行运行状况分析的手段多为:由人工监测仪表等方式来监控设备的运行状况,该方法导致对设备运行状况分析的效率低下,且无法预先对设备运行状态进行预警。
发明内容
本发明提供一种基于大数据的设备运行状况分析方法、装置、电子设备及计算机可读存储介质,其主要目的在于实现预先对设备运行状态进行预警和提高设备运行状况分析的效率。
为实现上述目的,本发明提供的一种基于大数据的设备运行状况分析方法,包括:
获取设备的运行数据集;
对所述运行数据集进行数据清洗,得到清洗数据集;
提取所述清洗数据集的运行特征数据;
当所述运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态;
当所述运行特征值大于所述告警阈值区间的上限,根据所述运行特征数据集判断所述设备的故障类型;
从预先构建的数据库中查询与所述故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。
可选地,所述对所述运行数据集进行数据清洗,包括:
判断所述运行数据集是否存在缺失值,当所述运行数据集存在缺失值时,对所述运行数据集进行数据填充;或者
判断所述运行数据集是否存在异常值,当所述运行数据集存在异常值时,删除所述运行数据集包含的异常值。
可选地,所述对所述运行数据集进行数据填充,包括:
将所述缺失值的相邻值分别输入预设的线性回归方程,通过所述线性回归方程计算所述缺失值的线性预测值;
计算所述缺失值的预设邻域范围内的所有数值的第一平均值,得到所述缺失值的平均预测值;
计算所述平均预测值与所述线性预测值的第二平均值,利用所述第二平均值对所述缺失值进行填充。
可选地,所述判断所述运行数据集是否存在异常值,包括:
利用对比算法计算所述运行数据集中运行数据与所述运行数据的邻近运行数据的局部可达密度比值;
判断所述局部可达密度比值是否小于或等于预设比值;
若所述局部可达密度比值小于或等于预设比值,确定所述运行数据为异常值。
可选地,所述利用对比算法计算所述运行数据集中运行数据与所述运行数据的邻近运行数据的局部可达密度比值,包括:
利用如下对比算法计算所述运行数据与所述运行数据的邻近运行数据的局部可达密度比值LFk(q):
其中,Nk(q)为所述运行数据的邻近运行数据的集合,p为所述运行数据,q为Nk(q)中任一邻近运行数据,ldk(q)为Nk(q)内的数据密度,ld(p)为所述运行数据的自身密度,k为Nk(q)中邻近运行数据的个数,reach-distk(p,q)为用于计算p,q之间的距离的运算。
可选地,所述计算所述运行特征数据集的运行特征值,包括:
随机从所述特征数据集中选取多个特征数据作为多个运行特征;
分别计算未选取特征数据子集中的数据与所述多个运行特征的距离,其中,所述未选取特征数据子集是所述特征数据集中未被选取的特征数据的集合;
依次从所述未选取特征数据子集中选取目标数据与待汇集运行特征进行汇集,并且计算汇集后的特征簇中所有数据的特征均值,直至所述特征均值的变化小于预设变化阈值,其中,所述待汇集运行特征为所述多个运行特征中与所述目标数据距离最小的目标运行特征,或者为包含所述目标运行特征的特征簇;
确定变化小于预设阈值的特征均值为所述运行特征数据集的运行特征值。
可选地,所述分别计算未选取特征数据子集中的数据与所述多个运行特征的距离,包括:
利用如下距离算法计算所述特征数据集中未被选取的特征数据与所述运行特征的距离值d(x,y)2,所述距离值的计算公式为:
d(x,y)2=‖x-y‖2
其中,x为特征数据集中任一特征数据,y为任一运行特征。
为了解决上述问题,本发明还提供一种基于大数据的设备运行状况分析装置,所述装置包括:
数据获取模块,用于获取设备的运行数据集;
数据清洗模块,用于对所述运行数据集进行数据清洗,得到清洗数据集;
特征提取模块,用于提取所述清洗数据集的运行特征数据,得到运行特征数据集;
特征值计算模块,用于计算所述运行特征数据集的运行特征值;
状态告警模块,用于当所述运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态;
故障类型分析模块,用于当所述运行特征值大于所述告警阈值区间的上限,根据所述运行特征数据集判断所述设备的故障类型;
解决方案推送模块,用于从预先构建的数据库中查询与所述故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述中任意一项所述的基于大数据的设备运行状况分析方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储创建的数据,存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现上述中任意一项所述的基于大数据的设备运行状况分析方法。
本发明实施例在获取到设备的运行数据集之后,对运行数据集进行数据清洗,能够减少数据冗余,提高数据数据精确性,有利于对设备的运行数据进行准确的分析;通过提取清洗数据集的运行特征数据,得到运行特征数据集,并计算运行特征数据的运行特征值,从而减少数据的分析量,进一步的,当运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用第一推送文件推送所述告警状态,实现了对设备运行故障的提前告警;当运行特征值大于告警阈值区间的上限,根据运行特征数据集判断设备的故障类型;从预先构建的数据库中查询与故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用第二推送文件推送故障类型及故障解决方案,当出现故障时根据运行特征数据集准确判断故障类型,查询故障解决方案,推送故障类型与故障解决方案,从而提高故障分析的精确度与效率。因此本发明提出的基于大数据的设备运行状况分析方法、装置及计算机可读存储介质,可以提高设备运行状况分析的效率及精确度。
附图说明
图1为本发明一实施例提供的基于大数据的设备运行状况分析方法的流程示意图;
图2为本发明一实施例提供的基于大数据的设备运行状况分析装置的模块示意图;
图3为本发明一实施例提供的实现基于大数据的设备运行状况分析方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供的基于大数据的设备运行状况分析方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于大数据的设备运行状况分析方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
本发明提供一种基于大数据的设备运行状况分析方法。参照图1所示,为本发明一实施例提供的基于大数据的设备运行状况分析方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,基于大数据的设备运行状况分析方法包括:
S1、获取设备的运行数据集。
本发明实施例中,所述运行数据集为设备的运行数据集,包括但不限于:设备的正常运行速度,设备正常承受重量、设备故障时的运行速度、设备故障时的承受重量及设备当前运行时产生的各项运行数据。
例如,所述设备为电梯,所述运行数据集包括但不限于:电梯的正常运行速度,电梯正常承受重量、电梯故障时的运行速度、电梯故障时的承受重量及电梯当前运行时产生的各项运行数据。
进一步地,在本发明一可选实施例中,所述运行数据集还包括设备故障时的故障原因以及所述故障原因对应的故障解决方案。
具体的,本发明实施例可通过安装于设备上的各种传感设备来实时获取设备的运行数据集。
S2、对所述运行数据集进行数据清洗,得到清洗数据集。
具体地,所述数据清洗可以包括异常值修正,缺失值填充,数据去敏感化,冗余数据去除等。
本发明实施例通过对运行数据集集进行数据清洗,可以删除无效数据以及错误数据,减少数据冗余,提高数据数据精确性,有利于基于清洗后的数据进行准确的分析。
较佳地,在本发明一可选实施例中,所述对所述运行数据集进行数据清洗,包括:
判断所述运行数据集是否存在缺失值,当所述运行数据集存在缺失值时,对所述运行数据集进行数据填充;或者
判断所述运行数据集是否存在异常值,当所述运行数据集存在异常值时,删除所述运行数据集包含的异常值。
详细地,所述缺失值为所述运行数据集中缺失(不存在)的数据,所述异常值为所述运行数据集中存在但数值异常的数据。例如,运行数据集中第一时刻的第一运行速度不存在,则所述第一运行速度为缺失值;运行数据集中第二时刻的运行速度为10000米每秒钟,则所述第二运行速度为异常值。
详细地,本发明实施例利用具有缺失值检测功能的java语句来判断所述运行数据集是否存在缺失值。
较佳地,本发明实施例可利用预先编辑好的java语句,对所述运行数据集中的运行数据进行长度检测,其中,运行数据集中包含多个运行数据的属性数据和对应数值,如,所述运行数据集中存在着运行数据的速度数据,以及速度数据对应的数值;在进行长度检测时,检测运行数据集中各个属性数据对应的数值,当检测到数值长度不为0或不为null时,则确定该属性数据的值未缺失,继续进行检测;当检测到数值长度为0或为null时,则确定该属性数据的值缺失。
本发明实施例中,所述缺失值可以为运行数据中的任何参数,例如电梯的运行速度,电梯运行时的加速度,电梯运行时的承重等。
在本发明一可选实施例中,所述对所述运行数据集进行数据填充,包括:
将所述缺失值的相邻值分别输入预设的线性回归方程,通过所述线性回归方程计算所述缺失值的线性预测值;
计算所述缺失值的预设邻域范围内的所有数值的第一平均值,得到所述缺失值的平均预测值;
计算所述平均预测值与所述线性预测值的第二平均值,利用所述第二平均值对所述缺失值进行填充。
本发明实施例中,选取缺失值数据临近的预设邻域内的数据,基于所述邻域内的数据对所述缺失值进行线性预测。
优选地,所述线性回归方程为:
Y=aX+b
其中,Y为所述线性预测值,X为所述缺失值的相邻值,a,b为预设回归参数。
在本发明一可选实施例中,若运行数据集包含缺失的时间数据,根据缺失的时间数据的时间顺序进行填充缺失的时间数据。
本发明实施例中,由于一般设备运行时有较为稳定的运行速度变化,如开始启动或准备停止时的速度变化,这些速度变化均会趋向于稳定的线性变化,因此,本发明实施例利用线性回归方程对缺失值进行预测和填充,可提高缺失值预测和填充的准确性,保证数据的可用性。
本发明另一可选实施例中,所述判断所述运行数据集是否存在异常值,包括:
利用对比算法计算所述运行数据集中运行数据与所述运行数据的邻近运行数据的局部可达密度比值;
判断所述局部可达密度比值是否小于或等于预设比值;
若所述局部可达密度比值小于或等于预设比值,确定所述运行数据为异常值。
本实施例中,运行数据可以为运行数据集中任意运行数据。
具体的,本发明实施例利用如下对比算法计算所述运行数据与所述运行数据的邻近运行数据的局部可达密度比值LFk(q):
其中,Nk(q)为所述运行数据的邻近运行数据的集合,p为所述运行数据,q为Nk(q)中任一邻近运行数据,ldk(q)为Nk(q)内的数据密度,ld(p)为所述运行数据的自身密度,k为Nk(q)中邻近运行数据的个数,reach-distk(p,q)为用于计算p,q之间的距离的运算。
S3、提取所述清洗数据集的运行特征数据,得到运行特征数据集。
本发明实施例中,运行特征数据集包括但不限于:设备当前的运行速度特征,设备当前的承载重量特征。
本发明实施例利用预先训练的特征提取模型将所述清洗数据集进行特征提取,得到多个运行特征数据,并将提取到的所有运行特征数据汇集为运行特征数据集。
其中,所述预先训练的特征提取模型用于识别出清洗数据集中具有特征的数据。
本发明实施例将清洗数据集进行特征提取,获取多个运行特征数据,并将提取到的所有运行特征数据汇集为运行特征数据集,可以减少清洗数据集中对于当前设备运行状态无关的数据,从而减少后续数据分析过程中计算资源的占用,提高数据分析的效率,例如,电梯的运行速度数据中,在电梯无人使用时速度为0,此时的电梯运行速度数据对于分析电梯的运行状况并没有作用,且会增加后续分析的数据量,降低数据分析的效率。
详细地,在将所述清洗数据集进行特征提取之前,本发明还包括训练特征提取模型,所述特征提取模型的训练过程包括:
步骤A:生成训练数据集和所述训练数据集对应的标准结果;
步骤B:将所述训练数据集输入至所述特征提取模型进行特征提取,得到训练结果;
步骤C:利用预设的损失函数对所述训练结果与标准结果进行损失值计算,得到损失值;
步骤D:当所述损失值大于或等于预设的损失阈值,调整所述特征提取模型的参数,返回步骤B重新进行特征提取;
步骤E:当所述损失值小于所述损失阈值,确定包含当前参数的特征提取模型为得到训练的特征提取模型。
详细地,本发明实施例利用如下所述损失对所述训练结果与预设的目标结果进行差异计算,得到差异值:
其中,为所述训练结果,Y为所述标准结果,α表示误差因子,为预设常数。
本发明实施例利用训练的特征提取模型进行数据提取可提高数据提取的精度,避免人工手动进行数据提取时,出现失误。
S4、计算所述运行特征数据集的运行特征值。
详细地,所述计算所述运行特征数据集的运行特征值,包括:
随机从所述特征数据集中选取多个特征数据作为多个运行特征;
分别计算未选取特征数据子集中的数据与所述多个运行特征的距离,其中,所述未选取特征数据子集是所述特征数据集中未被选取的特征数据的集合;
依次从所述未选取特征数据子集中选取目标数据与待汇集运行特征进行汇集,并且计算汇集后的特征簇中所有数据的特征均值,直至所述特征均值的变化小于预设变化阈值,其中,所述待汇集运行特征为所述多个运行特征中与所述目标数据距离最小的目标运行特征,或者为包含所述目标运行特征的特征簇;
确定变化小于预设阈值的特征均值为所述运行特征数据集的运行特征值。
例如,当所述特征数据集中包含a,b,c,d,e,f六个特征数据,随机选择a和b作为运行特征,分别计算未选取特征数据子集中c,d,e,f与a和b的距离,当距离计算完成后,随机从所述未选取特征数据子集中选取目标数据c,若目标数据c与运行特征a的距离比目标数据c与运行特征b的距离更近,则将目标数据c与运行特征a进行汇集,计算a与c的特征均值,再随机从所述未选取特征数据子集中选取目标数据d,若目标数据d与运行特征a的距离比目标数据d与运行特征b的距离更近,则将目标数据d与运行特征a进行汇集,计算a,c,d的特征均值,比较a与c的特征均值和a,c,d的特征均值的变化,当所述变化小于预设阈值时,停止汇集,确定变化小于预设阈值的特征均值为所述运行特征数据集的运行特征值,即确定a,c,d的特征均值为运行特征数据集的运行特征值。
同时,继续随机地从未选取特征数据子集选取目标数据e,若目标数据e与运行特征b的距离比目标数据e与运行特征a的距离更近,则将目标数据e与运行特征b进行汇集,计算b与e的特征均值,再随机从所述未选取特征数据子集中选取目标数据f,若目标数据f与运行特征b的距离比目标数据f与运行特征a的距离更近,则将目标数据f与运行特征b进行汇集,计算b,e,f的特征均值,比较b与e的特征均值和b,e,f的特征均值的变化,当所述变化小于预设阈值时,停止汇集,确定变化小于预设阈值的特征均值为所述运行特征数据集的运行特征值,即确定b,e,f的特征均值为运行特征数据集的另一个运行特征值。
具体的,本发明实施例利用如下距离算法计算所述特征数据集中未被选取的特征数据与所述运行特征的距离值d(x,y)2,所述距离值的计算公式为:
d(x,y)2=‖x-y‖2
其中,x为特征数据集中任一特征数据,y为任一运行特征。
当汇集完成后,本发明实施例利用如下特征值算法计算所述运行特征值T(j)2
其中,j为第j个运行特征,m为第j个运行特征中特征数据的数量,xi为所述第j个运行特征中第i个特征数据。
每次汇集后计算每个特征簇中所有运行特征的运行特征值的均值,不断汇集并计算新的特征簇的运行特征值的均值,直至每个特征簇中所有所有运行特征值的均值的变化小于预设变化阈值,此时得到的运行特征值可用于判断设备的运行状态。
S5、当所述运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态。
本发明实施例中,预设告警阈值区间,当所述运行特征值在告警阈值区间内(包括所述告警阈值区间的上限与下限),对设备的运行状态进行告警。例如,当所述运行特征值在告警阈值区间(g,h)内时(即所述运行特征值大于等于所述告警阈值区间的下限g且小于等于所述告警阈值区间的上限h时),确定所述设备(如电梯)可能存在着运行风险,此时所述设备(如电梯)的运行状态为处于告警状态。
本实施例中,在推送运行状态时,可以直接向用户推送运行状态,也可以向监控预警系统推送状态。
具体地,所述配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态,包括:
获取所述告警状态的数据属性;
根据所述数据属性配置所述告警状态的推送文件;
执行所述推送文件,将所述告警状态推送给用户。
所述数据属性包括:文本数据属性、音频数据属性、视频数据属性等。
详细地,本发明实施例利用具有数据属性提取功能的程序语句获取所述告警状态的数据属性,所述数据属性提取语句可以是利用java或python等计算机语言编写的一段程序语句。当获取到所述告警状态的数据属性后,根据所述数据属性对所述推送文件进行配置,如对所述推送文件配置与所述数据属性相应的数据传输接口信息或数据传输路径信息等。
本实施例中,执行所述推送文件,将所述运行状态推送给用户之前,所述方法还包括:将所述推送文件与所述告警状态上传至预先构建的数据推送引擎。
本发明实施例在所述数据推送引擎中执行所述推送文件,将所述告警状态推送给用户。
较佳地,本发明实施例中,所述数据推送引擎使用分布式搜索引擎Elasticsearch,当从所述告警状态中进行推送一条数据完成后,所述分布式搜索引擎Elasticsearch可自动删除该已推送的数据,保证了数据不会被重复进行推送,直至所述告警状态全部被推送完成。
S6、当所述运行特征值大于所述告警阈值区间的上限,根据所述运行特征数据集判断所述设备的故障类型。
本发明实施例中,当所述运行特征值超过了所述告警阈值区间的上限时,对设备的运行状态进行故障类型判断。例如,当所述运行特征值大于告警阈值区间(g,h)的上限h时,确定所述设备(如电梯)已经出现故障,此时所述设备(如电梯)的运行状态为故障状态,根据所述运行特征数据集判断所述设备的故障类型。
进一步地,本发明实施例根据所述运行特征数据集判断所述设备的故障类型,包括:
利用分类值算法计算所述运行特征数据集的分类值;
根据所述分类值确定所述设备的故障类型。
详细地,所述利用分类值算法计算所述运行特征数据集的分类值包括:
利用如下分类值算法计算所述运行特征数据集的分类值Lcls
其中,M为所述运行特征数据集中运行特征数据的数量;yi为所述运行特征数据集中第i个运行特征数据的预设标准标签,pi为所述运行特征数据集中第i个运行特征数据。
本发明实施例通过预设不同的阈值区间,并根据分类值是否在不同的阈值区间内,对设备的运行状态进行判断。例如,当所述分类值在阈值区间(a,b)时,确定所述设备(如电梯)为传送带卡死的故障类型,当所述运行特征值在阈值区间(c,d)时,确定所述设备(如电梯)状态为轴承松动状态的故障类型。
S7、从预先构建的数据库中查询与所述故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。
本发明实施例中,获取设备的故障类型后,从预先构建的数据库中查询与所述故障类型相应的故障解决方案。其中,所述数据库内存储有设备运行过程中所有可能发生的故障及故障对应的解决方案。
详细地,本发明实施例采用倒查法的检索方法从预先构建的数据库中查询与所述故障类型相应的故障解决方案。所述倒查法是按从近到远的时间顺序进行查找的方法,由于设备的更新迭代,会导致不同版本的设备故障的解决方法不一致,因此本发明实施例采用倒查法,可查询出最近时间的相同故障的解决方案,确保解决方案的可用性。
进一步地,本发明实施例配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。推送所述故障类型及所述故障解决方案的方法与S5中推送告警状态的方法相同。
本发明实施例在获取到设备的运行数据集之后,对运行数据集进行数据清洗,能够减少数据冗余,提高数据数据精确性,有利于对设备的运行数据进行准确的分析;通过提取清洗数据集的运行特征数据,得到运行特征数据集,并计算运行特征数据的运行特征值,从而减少数据的分析量,进一步的,当运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用第一推送文件推送所述告警状态,实现了对设备运行故障的提前告警;当运行特征值大于告警阈值区间的上限,根据运行特征数据集判断设备的故障类型;从预先构建的数据库中查询与故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用第二推送文件推送故障类型及故障解决方案,当出现故障时根据运行特征数据集准确判断故障类型,查询故障解决方案,推送故障类型与故障解决方案,从而提高故障分析的精确度与效率。因此本发明提出的基于大数据的设备运行状况分析方法,可以提高设备运行状况分析的效率及精确度。
如图2所示,是本发明基于大数据的设备运行状况分析装置的模块示意图。
本发明所述基于大数据的设备运行状况分析装置100可以安装于电子设备中。根据实现的功能,所述基于大数据的设备运行状况分析装置可以包括数据获取模块101、数据清洗模块102、特征提取模块103、特征值计算模块104、状态告警模块105、故障类型分析模块106和解决方案推送模块107。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述数据获取模块101,用于获取设备的运行数据集;
所述数据清洗模块102,用于对所述运行数据集进行数据清洗,得到清洗数据集;
所述特征提取模块103,用于提取所述清洗数据集的运行特征数据,得到运行特征数据集;
所述特征值计算模块104,用于计算所述运行特征数据集的运行特征值;
所述状态告警模块105,用于当所述运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态;
所述故障类型分析模块106,用于当所述运行特征值大于所述告警阈值区间的上限,根据所述运行特征数据集判断所述设备的故障类型;
所述解决方案推送模块107,用于从预先构建的数据库中查询与所述故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。
详细地,所述基于大数据的设备运行状况分析装置各模块的具体实施方式如下:
所述数据获取模块101,用于获取设备的运行数据集。
本发明实施例中,所述运行数据集为设备的运行数据集,包括但不限于:设备的正常运行速度,设备正常承受重量、设备故障时的运行速度、设备故障时的承受重量及设备当前运行时产生的各项运行数据。
例如,所述设备为电梯,所述运行数据集包括但不限于:电梯的正常运行速度,电梯正常承受重量、电梯故障时的运行速度、电梯故障时的承受重量及电梯当前运行时产生的各项运行数据。
进一步地,在本发明一可选实施例中,所述运行数据集还包括设备故障时的故障原因以及所述故障原因对应的故障解决方案。
具体的,本发明实施例可通过安装于设备上的各种传感设备来实时获取设备的运行数据集。
所述数据清洗模块102,用于对所述运行数据集进行数据清洗,得到清洗数据集。
具体地,所述数据清洗可以包括异常值修正,缺失值填充,数据去敏感化,冗余数据去除等。
本发明实施例通过对运行数据集集进行数据清洗,可以删除无效数据以及错误数据,减少数据冗余,提高数据数据精确性,有利于基于清洗后的数据进行准确的分析。
较佳地,在本发明一可选实施例中,所述数据清洗模块102具体用于:
判断所述运行数据集是否存在缺失值,当所述运行数据集存在缺失值时,对所述运行数据集进行数据填充;或者
判断所述运行数据集是否存在异常值,当所述运行数据集存在异常值时,删除所述运行数据集包含的异常值。
详细地,本发明实施例利用具有缺失值检测功能的java语句来判断所述运行数据集是否存在缺失值。
详细地,所述缺失值为所述运行数据集中缺失(不存在)的数据,所述异常值为所述运行数据集中存在但数值异常的数据。例如,运行数据集中第一时刻的第一运行速度不存在,则所述第一运行速度为缺失值;运行数据集中第二时刻的运行速度为10000米每秒钟,则所述第二运行速度为异常值。
较佳地,本发明实施例可利用预先编辑好的java语句,对所述运行数据集中的运行数据进行长度检测,其中,运行数据集中包含多个运行数据的属性数据和对应数值,如,所述运行数据集中存在着运行数据的速度数据,以及速度数据对应的数值;在进行长度检测时,检测运行数据集中各个属性数据对应的数值,当检测到数值长度不为0或不为null时,则确定该属性数据的值未缺失,继续进行检测;当检测到数值长度为0或为null时,则确定该属性数据的值缺失。
本发明实施例中,所述缺失值可以为运行数据中的任何参数,例如电梯的运行速度,电梯运行时的加速度,电梯运行时的承重等。
在本发明一可选实施例中,所述对所述运行数据集进行数据填充,包括:
将所述缺失值的相邻值分别输入预设的线性回归方程,通过所述线性回归方程计算所述缺失值的线性预测值;
计算所述缺失值的预设邻域范围内的所有数值的第一平均值,得到所述缺失值的平均预测值;
计算所述平均预测值与所述线性预测值的第二平均值,利用所述第二平均值对所述缺失值进行填充。
本发明实施例中,选取缺失值数据临近的预设邻域内的数据,基于所述邻域内的数据对所述缺失值进行线性预测。
优选地,所述线性回归方程为:
Y=aX+b
其中,Y为所述线性预测值,X为所述缺失值的相邻值,a,b为预设回归参数。
在本发明一可选实施例中,若运行数据集包含缺失的时间数据,根据缺失的时间数据的时间顺序进行填充缺失的时间数据。
本发明实施例中,由于一般设备运行时有较为稳定的运行速度变化,如开始启动或准备停止时的速度变化,这些速度变化均会趋向于稳定的线性变化,因此,本发明实施例利用线性回归方程对缺失值进行预测和填充,可提高缺失值预测和填充的准确性,保证数据的可用性。
本发明另一可选实施例中,所述判断所述运行数据集是否存在异常值,包括:
利用对比算法计算所述运行数据集中运行数据与所述运行数据的邻近运行数据的局部可达密度比值;
判断所述局部可达密度比值是否小于或等于预设比值;
若所述局部可达密度比值小于或等于预设比值,确定所述运行数据为异常值。
本实施例中,运行数据可以为运行数据集中任意运行数据。
具体的,本发明实施例利用如下对比算法计算所述运行数据与所述运行数据的邻近运行数据的局部可达密度比值LFk(q):
其中,Nk(q)为所述运行数据的邻近运行数据的集合,p为所述运行数据,q为Nk(q)中任一邻近运行数据,ldk(q)为Nk(q)内的数据密度,ld(p)为所述运行数据的自身密度,k为Nk(q)中邻近运行数据的个数,reach-distk(p,q)为用于计算p,q之间的距离的运算。
所述特征提取模块103,用于提取所述清洗数据集的运行特征数据,得到运行特征数据集。
本发明实施例中,运行特征数据集包括但不限于:设备当前的运行速度特征,设备当前的承载重量特征。
本发明实施例利用预先训练的特征提取模型将所述清洗数据集进行特征提取,得到多个运行特征数据,并将提取到的所有运行特征数据汇集为运行特征数据集。
其中,所述预先训练的特征提取模型用于识别出清洗数据集中具有特征的数据。
本发明实施例将清洗数据集进行特征提取,获取多个运行特征数据,并将提取到的所有运行特征数据汇集为运行特征数据集,可以减少清洗数据集中对于当前设备运行状态无关的数据,从而减少后续数据分析过程中计算资源的占用,提高数据分析的效率,例如,电梯的运行速度数据中,在电梯无人使用时速度为0,此时的电梯运行速度数据对于分析电梯的运行状况并没有作用,且会增加后续分析的数据量,降低数据分析的效率。
详细地,在将所述清洗数据集进行特征提取之前,本发明还包括训练特征提取模型,所述特征提取模型的训练过程包括:
步骤A:生成训练数据集和所述训练数据集对应的标准结果;
步骤B:将所述训练数据集输入至所述特征提取模型进行特征提取,得到训练结果;
步骤C:利用预设的损失函数对所述训练结果与标准结果进行损失值计算,得到损失值;
步骤D:当所述损失值大于或等于预设的损失阈值,调整所述特征提取模型的参数,返回步骤B重新进行特征提取;
步骤E:当所述损失值小于所述损失阈值,确定包含当前参数的特征提取模型为得到训练的特征提取模型。
详细地,本发明实施例利用如下所述损失对所述训练结果与预设的目标结果进行差异计算,得到差异值:
其中,为所述训练结果,Y为所述标准结果,α表示误差因子,为预设常数。
本发明实施例利用训练的特征提取模型进行数据提取可提高数据提取的精度,避免人工手动进行数据提取时,出现失误。
所述特征值计算模块104,用于计算所述运行特征数据集的运行特征值。
详细地,所述特征值计算模块104具体用于:
随机从所述特征数据集中选取多个特征数据作为多个运行特征;
分别计算未选取特征数据子集中的数据与所述多个运行特征的距离,其中,所述未选取特征数据子集是所述特征数据集中未被选取的特征数据的集合;
依次从所述未选取特征数据子集中选取目标数据与待汇集运行特征进行汇集,并且计算汇集后的特征簇中所有数据的特征均值,直至所述特征均值的变化小于预设变化阈值,其中,所述待汇集运行特征为所述多个运行特征中与所述目标数据距离最小的目标运行特征,或者为包含所述目标运行特征的特征簇;
确定变化小于预设阈值的特征均值为所述运行特征数据集的运行特征值。
例如,当所述特征数据集中包含a,b,c,d,e,f六个特征数据,随机选择a和b作为运行特征,分别计算未选取特征数据子集中c,d,e,f与a和b的距离,当距离计算完成后,随机从所述未选取特征数据子集中选取目标数据c,若目标数据c与运行特征a的距离比目标数据c与运行特征b的距离更近,则将目标数据c与运行特征a进行汇集,计算a与c的特征均值,再随机从所述未选取特征数据子集中选取目标数据d,若目标数据d与运行特征a的距离比目标数据d与运行特征b的距离更近,则将目标数据d与运行特征a进行汇集,计算a,c,d的特征均值,比较a与c的特征均值和a,c,d的特征均值的变化,当所述变化小于预设阈值时,停止汇集,确定变化小于预设阈值的特征均值为所述运行特征数据集的运行特征值,即确定a,c,d的特征均值为运行特征数据集的运行特征值。
同时,继续随机地从未选取特征数据子集选取目标数据e,若目标数据e与运行特征b的距离比目标数据e与运行特征a的距离更近,则将目标数据e与运行特征b进行汇集,计算b与e的特征均值,再随机从所述未选取特征数据子集中选取目标数据f,若目标数据f与运行特征b的距离比目标数据f与运行特征a的距离更近,则将目标数据f与运行特征b进行汇集,计算b,e,f的特征均值,比较b与e的特征均值和b,e,f的特征均值的变化,当所述变化小于预设阈值时,停止汇集,确定变化小于预设阈值的特征均值为所述运行特征数据集的运行特征值,即确定b,e,f的特征均值为运行特征数据集的另一个运行特征值。
具体的,本发明实施例利用如下距离算法计算所述特征数据集中未被选取的特征数据与所述运行特征的距离值d(x,y)2,所述距离值的计算公式为:
d(x,y)2=‖x-y‖2
其中,x为特征数据集中任一特征数据,y为任一运行特征。
当汇集完成后,本发明实施例利用如下特征值算法计算所述运行特征值T(j)2
其中,j为第j个运行特征,m为第j个运行特征中特征数据的数量,xi为所述第j个运行特征中第i个特征数据。
每次汇集后计算每个特征簇中所有运行特征的运行特征值的均值,不断汇集并计算新的特征簇的运行特征值的均值,直至每个特征簇中所有所有运行特征值的均值的变化小于预设变化阈值,此时得到的运行特征值可用于判断设备的运行状态。
所述状态告警模块105,用于当所述运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态。
本发明实施例中,预设告警阈值区间,当所述运行特征值在告警阈值区间内(包括所述告警阈值区间的上限与下限),对设备的运行状态进行告警。例如,当所述运行特征值在告警阈值区间(g,h)内时(即所述运行特征值大于等于所述告警阈值区间的下限g且小于等于所述告警阈值区间的上限h时),确定所述设备(如电梯)可能存在着运行风险,此时所述设备(如电梯)的运行状态为处于告警状态。
本实施例中,在推送运行状态时,可以直接向用户推送运行状态,也可以向监控预警系统推送状态。
具体地,所述状态告警模块105具体用于:
获取所述告警状态的数据属性;
根据所述数据属性配置所述告警状态的推送文件;
执行所述推送文件,将所述告警状态推送给用户。
所述数据属性包括:文本数据属性、音频数据属性、视频数据属性等。
详细地,本发明实施例利用具有数据属性提取功能的程序语句获取所述告警状态的数据属性,所述数据属性提取语句可以是利用java或python等计算机语言编写的一段程序语句。当获取到所述告警状态的数据属性后,根据所述数据属性对所述推送文件进行配置,如对所述推送文件配置与所述数据属性相应的数据传输接口信息或数据传输路径信息等。
本实施例中,执行所述推送文件,将所述运行状态推送给用户之前,所述方法还包括:将所述推送文件与所述告警状态上传至预先构建的数据推送引擎。
本发明实施例在所述数据推送引擎中执行所述推送文件,将所述告警状态推送给用户。
较佳地,本发明实施例中,所述数据推送引擎使用分布式搜索引擎Elasticsearch,当从所述告警状态中进行推送一条数据完成后,所述分布式搜索引擎Elasticsearch可自动删除该已推送的数据,保证了数据不会被重复进行推送,直至所述告警状态全部被推送完成。
所述故障类型分析模块106,用于当所述运行特征值大于所述告警阈值区间的上限,根据所述运行特征数据集判断所述设备的故障类型。
本发明实施例中,当所述运行特征值超过了所述告警阈值区间的上限时,对设备的运行状态进行故障类型判断。例如,当所述运行特征值大于告警阈值区间(g,h)的上限h时,确定所述设备(如电梯)已经出现故障,此时所述设备(如电梯)的运行状态为故障状态,根据所述运行特征数据集判断所述设备的故障类型。
进一步地,所述故障类型分析模块106具体用于:
利用分类值算法计算所述运行特征数据集的分类值;
根据所述分类值确定所述设备的故障类型。
详细地,所述利用分类值算法计算所述运行特征数据集的分类值包括:
利用如下分类值算法计算所述运行特征数据集的分类值Lcls
其中,M为所述运行特征数据集中运行特征数据的数量;yi为所述运行特征数据集中第i个运行特征数据的预设标准标签,pi为所述运行特征数据集中第i个运行特征数据。
本发明实施例通过预设不同的阈值区间,并根据分类值是否在不同的阈值区间内,对设备的运行状态进行判断。例如,当所述分类值在阈值区间(a,b)时,确定所述设备(如电梯)为传送带卡死的故障类型,当所述运行特征值在阈值区间(c,d)时,确定所述设备(如电梯)状态为轴承松动状态的故障类型。
所述解决方案推送模块107,用于从预先构建的数据库中查询与所述故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。
本发明实施例中,获取设备的故障类型后,从预先构建的数据库中查询与所述故障类型相应的故障解决方案。其中,所述数据库内存储有设备运行过程中所有可能发生的故障及故障对应的解决方案。
详细地,本发明实施例采用倒查法的检索方法从预先构建的数据库中查询与所述故障类型相应的故障解决方案。所述倒查法是按从近到远的时间顺序进行查找的方法,由于设备的更新迭代,会导致不同版本的设备故障的解决方法不一致,因此本发明实施例采用倒查法,可查询出最近时间的相同故障的解决方案,确保解决方案的可用性。
进一步地,本发明实施例配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。推送所述故障类型及所述故障解决方案的方法与所述状态告警模块105中推送告警状态的方法相同。
本发明实施例在获取到设备的运行数据集之后,对运行数据集进行数据清洗,能够减少数据冗余,提高数据数据精确性,有利于对设备的运行数据进行准确的分析;通过提取清洗数据集的运行特征数据,得到运行特征数据集,并计算运行特征数据的运行特征值,从而减少数据的分析量,进一步的,当运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用第一推送文件推送所述告警状态,实现了对设备运行故障的提前告警;当运行特征值大于告警阈值区间的上限,根据运行特征数据集判断设备的故障类型;从预先构建的数据库中查询与故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用第二推送文件推送故障类型及故障解决方案,当出现故障时根据运行特征数据集准确判断故障类型,查询故障解决方案,推送故障类型与故障解决方案,从而提高故障分析的精确度与效率。因此本发明提出的基于大数据的设备运行状况分析方法、装置及计算机可读存储介质,可以提高设备运行状况分析的效率及精确度。
如图3所示,是本发明实现基于大数据的设备运行状况分析方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于大数据的设备运行状况分析程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于大数据的设备运行状况分析程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行基于大数据的设备运行状况分析程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于大数据的设备运行状况分析程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
获取设备的运行数据集;
对所述运行数据集进行数据清洗,得到清洗数据集;
提取所述清洗数据集的运行特征数据,得到运行特征数据集;
计算所述运行特征数据集的运行特征值;
当所述运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态;
当所述运行特征值大于所述告警阈值区间的上限,根据所述运行特征数据集判断所述设备的故障类型;
从预先构建的数据库中查询与所述故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图表记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (7)

1.一种基于大数据的设备运行状况分析方法,其特征在于,所述方法包括:
获取设备的运行数据集;
对所述运行数据集进行数据清洗,得到清洗数据集;
提取所述清洗数据集的运行特征数据,得到运行特征数据集;
计算所述运行特征数据集的运行特征值;
当所述运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态;
当所述运行特征值大于所述告警阈值区间的上限,根据所述运行特征数据集判断所述设备的故障类型;
从预先构建的数据库中查询与所述故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案;
其中,所述对所述运行数据集进行数据清洗,包括:判断所述运行数据集是否存在缺失值,当所述运行数据集存在缺失值时,对所述运行数据集进行数据填充;或者,判断所述运行数据集是否存在异常值,当所述运行数据集存在异常值时,删除所述运行数据集包含的异常值;
所述对所述运行数据集进行数据填充,包括:将所述缺失值的相邻值分别输入预设的线性回归方程,通过所述线性回归方程计算所述缺失值的线性预测值;计算所述缺失值的预设邻域范围内的所有数值的第一平均值,得到所述缺失值的平均预测值;计算所述平均预测值与所述线性预测值的第二平均值,利用所述第二平均值对所述缺失值进行填充;
所述计算所述运行特征数据集的运行特征值,包括:随机从所述特征数据集中选取多个特征数据作为多个运行特征;分别计算未选取特征数据子集中的数据与所述多个运行特征的距离,其中,所述未选取特征数据子集是所述特征数据集中未被选取的特征数据的集合;依次从所述未选取特征数据子集中选取目标数据与待汇集运行特征进行汇集,并且计算汇集后的特征簇中所有数据的特征均值,直至所述特征均值的变化小于预设变化阈值,其中,所述待汇集运行特征为所述多个运行特征中与所述目标数据距离最小的目标运行特征,或者为包含所述目标运行特征的特征簇;确定变化小于预设阈值的特征均值为所述运行特征数据集的运行特征值。
2.如权利要求1所述的基于大数据的设备运行状况分析方法,其特征在于,所述判断所述运行数据集是否存在异常值,包括:
利用对比算法计算所述运行数据集中运行数据与所述运行数据的邻近运行数据的局部可达密度比值;
判断所述局部可达密度比值是否小于或等于预设比值;
若所述局部可达密度比值小于或等于预设比值,确定所述运行数据为异常值。
3.如权利要求2所述的基于大数据的设备运行状况分析方法,其特征在于,所述利用对比算法计算所述运行数据集中运行数据与所述运行数据的邻近运行数据的局部可达密度比值,包括:
利用如下对比算法计算所述运行数据与所述运行数据的邻近运行数据的局部可达密度比值
其中,为所述运行数据的邻近运行数据的集合,p为所述运行数据,q为/>中任一邻近运行数据,/>为/>内的数据密度,/>为所述运行数据的自身密度,k为/>中邻近运行数据的个数,/>为用于计算p,q之间的距离的运算。
4.如权利要求1所述的基于大数据的设备运行状况分析方法,其特征在于,所述分别计算未选取特征数据子集中的数据与所述多个运行特征的距离,包括:
利用如下距离算法计算所述特征数据集中未被选取的特征数据与所述运行特征的距离值,所述距离值的计算公式为:
其中,为特征数据集中任一特征数据,/>为任一运行特征。
5.一种基于大数据的设备运行状况分析装置,用于实现如权利要求1至4中任一所述的基于大数据的设备运行状况分析方法,其特征在于,所述装置包括:
数据获取模块,用于获取设备的运行数据集;
数据清洗模块,用于对所述运行数据集进行数据清洗,得到清洗数据集;
特征提取模块,用于提取所述清洗数据集的运行特征数据,得到运行特征数据集;
特征值计算模块,用于计算所述运行特征数据集的运行特征值;
状态告警模块,用于当所述运行特征值在预设的告警阈值区间内,配置告警状态的第一推送文件,利用所述第一推送文件推送所述告警状态;
故障类型分析模块,用于当所述运行特征值大于所述告警阈值区间的上限,根据所述运行特征数据集判断所述设备的故障类型;
解决方案推送模块,用于从预先构建的数据库中查询与所述故障类型相应的故障解决方案,配置故障解决方案的第二推送文件,利用所述第二推送文件推送所述故障类型及所述故障解决方案。
6.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至4中任一所述的基于大数据的设备运行状况分析方法。
7.一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储创建的数据,存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至4中任一所述的基于大数据的设备运行状况分析方法。
CN202010913770.0A 2020-09-03 2020-09-03 基于大数据的设备运行状况分析方法、装置、设备及介质 Active CN111949646B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010913770.0A CN111949646B (zh) 2020-09-03 2020-09-03 基于大数据的设备运行状况分析方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010913770.0A CN111949646B (zh) 2020-09-03 2020-09-03 基于大数据的设备运行状况分析方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN111949646A CN111949646A (zh) 2020-11-17
CN111949646B true CN111949646B (zh) 2023-12-01

Family

ID=73366571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010913770.0A Active CN111949646B (zh) 2020-09-03 2020-09-03 基于大数据的设备运行状况分析方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111949646B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113706019A (zh) * 2021-08-30 2021-11-26 平安银行股份有限公司 基于多维数据的业务能力分析方法、装置、设备及介质
CN116090911A (zh) * 2023-04-11 2023-05-09 西南科技大学 一种基于多核聚类的设备故障分析方法、装置及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020082516A1 (zh) * 2018-10-22 2020-04-30 网宿科技股份有限公司 一种运维数据的处理方法、系统及装置
CN111368890A (zh) * 2020-02-26 2020-07-03 珠海格力电器股份有限公司 故障检测方法及装置、信息物理融合系统
CN111581193A (zh) * 2020-04-27 2020-08-25 平安资产管理有限责任公司 数据处理方法、设备、计算机系统及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104516879B (zh) * 2013-09-26 2019-09-13 Sap欧洲公司 用于管理含有具有缺失值的记录的数据库的方法和系统
EP3575980A3 (en) * 2018-05-29 2020-03-04 Accenture Global Solutions Limited Intelligent data quality

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020082516A1 (zh) * 2018-10-22 2020-04-30 网宿科技股份有限公司 一种运维数据的处理方法、系统及装置
CN111368890A (zh) * 2020-02-26 2020-07-03 珠海格力电器股份有限公司 故障检测方法及装置、信息物理融合系统
CN111581193A (zh) * 2020-04-27 2020-08-25 平安资产管理有限责任公司 数据处理方法、设备、计算机系统及存储介质

Also Published As

Publication number Publication date
CN111949646A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
US10373065B2 (en) Generating database cluster health alerts using machine learning
CN111949646B (zh) 基于大数据的设备运行状况分析方法、装置、设备及介质
CN115330275B (zh) 一种退役电池的梯次利用方法及装置
CN114514141A (zh) 充电站监测方法和设备
CN112434308B (zh) 应用漏洞检测方法、装置、电子设备及计算机存储介质
CN111950660A (zh) 一种人工智能训练平台的告警预测方法及装置
CN113760670A (zh) 电缆接头异常预警方法、装置、电子设备和存储介质
CN113931258A (zh) 自我诊断方法和无负压叠压供水设备
CN111652278A (zh) 用户行为检测方法、装置、电子设备及介质
EP3953853A1 (en) Leveraging a collection of training tables to accurately predict errors within a variety of tables
CN111800289A (zh) 通信网络故障分析方法和装置
CN116257663A (zh) 面向无人地面车辆的异常检测与关联分析方法及相关设备
CN112148566B (zh) 计算引擎的监控方法、装置、电子设备及存储介质
CN112700006A (zh) 网络架构搜索方法、装置、电子设备及介质
CN110348005B (zh) 配网设备状态数据处理方法、装置、计算机设备及介质
CN114312930B (zh) 基于日志数据的列车运行异常诊断方法和装置
CN110517731A (zh) 基因检测质量监控数据处理方法和系统
CN116108276A (zh) 基于人工智能的信息推荐方法、装置及相关设备
CN113535458B (zh) 异常误报的处理方法及装置、存储介质、终端
CN107121616B (zh) 一种用于对智能仪表进行故障定位的方法和装置
CN111221704B (zh) 一种确定办公管理应用系统运行状态的方法及系统
CN111651652B (zh) 基于人工智能的情感倾向识别方法、装置、设备及介质
CN114239538A (zh) 断言处理方法、装置、计算机设备及存储介质
CN113590484A (zh) 算法模型服务测试方法、系统、设备及存储介质
CN112737834A (zh) 一种云硬盘故障预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant