CN112906776B - 一种指标数据处理方法、装置和计算设备 - Google Patents
一种指标数据处理方法、装置和计算设备 Download PDFInfo
- Publication number
- CN112906776B CN112906776B CN202110164307.5A CN202110164307A CN112906776B CN 112906776 B CN112906776 B CN 112906776B CN 202110164307 A CN202110164307 A CN 202110164307A CN 112906776 B CN112906776 B CN 112906776B
- Authority
- CN
- China
- Prior art keywords
- target
- index data
- label
- tag
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 17
- 238000012216 screening Methods 0.000 claims abstract description 15
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000000034 method Methods 0.000 claims description 36
- 238000004138 cluster model Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 238000004891 communication Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000010219 correlation analysis Methods 0.000 description 3
- 230000002093 peripheral effect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003064 k means clustering Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000007723 transport mechanism Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种指标数据处理方法,包括:选择目标指标在预定时间区间的目标指标数据;基于目标指标数据和目标指标数据的数据点所具有的对应于各标签的标签值,确定各标签与目标指标之间的相关系数;基于相关系数,从目标指标的多个标签中确定目标标签;利用聚类模型,从目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值;以及基于目标标签值,筛选出与目标指标数据相关联的其他指标的指标数据。本发明还公开了对应的指标数据处理装置、计算设备和可读存储介质。
Description
技术领域
本发明涉及设备状态监测技术领域,尤其涉及一种指标数据处理方法、装置和计算设备。
背景技术
实现设备状态监测的基本理念,就是通过对采集到的数据信息提取有效的指标,并对提取出来的指标进行分析。当设备存在异常时,指标出现异常并触发异常提示,使得用户能关注到设备的异常,及时介入处理,避免经济损失和事故发生。而目前对指标的分析通常是对于单个指标的分析,无法对多个指标进行关联分析。
因此,需要提供一种更先进的指标数据处理方案。
发明内容
为此,本发明实施例提供一种指标数据处理方法、装置和计算设备,以力图解决或者至少缓解上面存在的至少一个问题。
根据本发明实施例的一个方面,提供了一种指标数据处理方法,指标数据包括对应指标的多个数据点,指标具有多个标签,指标数据的每个数据点具有分别对应于多个标签的多个标签值,方法包括:选择目标指标在预定时间区间的目标指标数据;基于目标指标数据和目标指标数据的数据点所具有的对应于各标签的标签值,确定各标签与目标指标之间的相关系数;基于相关系数,从目标指标的多个标签中确定目标标签;利用聚类模型,从目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值;以及基于目标标签值,筛选出与目标指标数据相关联的其他指标的指标数据。
可选地,在根据本发明实施例的方法中,相关系数为典型相关系数,确定各标签与目标指标之间的相关系数,包括:使用统计分析软件SPSS确定各标签与目标指标之间的典型相关系数。
可选地,在根据本发明实施例的方法中,基于相关系数,从目标指标的多个标签中确定目标标签,包括:判断标签与目标指标之间的相关系数是否大于预定阈值;在相关系数大于预定阈值的标签中,确定相关系数最大的预定数目个标签为目标标签。
可选地,在根据本发明实施例的方法中,利用聚类模型,从目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值,包括:利用聚类模型,将目标指标数据的数据点所具有的对应于目标标签的标签值划分为两个标签值集合;选择标签值数目较多的标签值集合,将该标签值集合所包括的标签值作为目标标签值。
可选地,在根据本发明实施例的方法中,基于目标标签值,筛选出与目标指标数据相关联的其他指标的指标数据,包括:获取其他指标在预定时间区间的指标数据;筛选出其中具有目标标签值的指标数据。
可选地,在根据本发明实施例的方法中,聚类模型为k-means聚类模型。
可选地,在根据本发明实施例的方法中,标签包括以下至少一个:流量、采集温度、环境温度、转速、压力、设备状态、设备工艺和阀门开度。
根据本发明实施例的另一个方面,提供了一种指标数据处理装置,指标数据包括对应指标的多个数据点,指标具有多个标签,指标数据的每个数据点具有分别对应于多个标签的多个标签值,装置包括:数据选择模块,适于选择目标指标在预定时间区间的目标指标数据;标签确定模块,适于基于目标指标数据和目标指标数据的数据点所具有的对应于各标签的标签值,确定各标签与目标指标之间的相关系数;基于相关系数,从目标指标的多个标签中确定目标标签;利用聚类模型,从目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值;以及数据筛选模块,适于基于目标标签值,筛选出与目标指标数据相关联的其他指标的指标数据。
根据本发明实施例的另一个方面,提供了一种计算设备,包括:一个或多个处理器;存储器;以及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,该一个或多个程序包括用于执行根据本发明实施例的指标数据处理方法中的任一方法的指令。
根据本发明实施例的还有一个方面,提供了一种存储程序的可读存储介质,该程序包括指令,该指令当由计算设备执行时,使得计算设备执行根据本发明实施例的指标数据处理方法的中任一方法。
本发明实施例的指标数据处理方法,可以基于数据之间的相关性,挖掘不同指标之间的关联关系,从而可以在选择目标指标数据之后得到相关联的其他指标数据,以便同时进行比较分析,有利于设备故障的监测,避免了不同指标数据混杂带来的分析困难和错误。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的计算设备100的示意图;
图2示出了根据本发明一个实施例的指标数据处理方法200的示意图;
图3示出了根据本发明一个实施例的目标指标数据的示意图;
图4示出了本发明一个实施例的相关系数的示意图;以及
图5示出了根据本发明一个实施例的指标数据处理装置500的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的计算设备100的示意图。如图1所示,在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备100可以实现为服务器,例如数据库服务器、应用程序服务器和WEB服务器等,也可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。当然,计算设备100也可以实现为小尺寸便携(或者移动)电子设备的一部分。
在根据本发明的实施例中,计算设备100可以被配置为执行根据本发明实施例的指标数据处理方法200。其中,计算设备100的应用122中包含执行根据本发明实施例的指标数据处理方法200的多条指令。
图2示出了根据本发明一个实施例的指标数据处理方法200的示意图。如图2所示,指标数据处理方法200在计算设备100中执行,并始于步骤S210。
在步骤S310中,选择目标指标在预定时间区间的目标指标数据。可以理解地,可以采集被测设备的多个指标的指标数据,例如以下指标中的至少一个:有效值、峭度、峰峰值、歪度、频段能量等。
每个指标除了指标值之后,还可以具有多个标签,例如以下标签中的至少一个:流量、采集温度、环境温度、转速、压力、设备状态、设备工艺和阀门开度。这些标签可以反映在采集指标数据时被测设备的其他运行情况。
每个指标的指标数据包括该指标的多个数据点,其中每个数据点可以具有分别对应于上述多个标签的多个标签值。
图3示出了根据本发明一个实施例的目标指标数据的示意图。该目标指标数据为有效值指标在预定时间区间2020.01.01~2020.01.05的指标数据。有效值指标具有转速、采集温度、环境温度和流量这些标签。其中,采集时刻2020.01.01对应的有效值指标为2.34,其所具有的转速标签的标签值为780,采集温度标签的标签值为33,环境温度标签的标签值为23.5,流量标签的标签值为2.3。
而后在步骤S220中,基于目标指标数据和目标指标数据的数据点所具有的对应于各标签的标签值,确定各标签与目标指标之间的相关系数。
在一些实施例中,可以选择典型相关系数作为相关系数,即进行典型相关分析。典型相关分析的原理如下:
假设所研究的两组变量为X组和Y组,其中X组有p个变量X=(x1,x2,...,xp),Y组有q个变量Y=(y1,y2,...,yq)。分别对这两组变量进行线性组合之后,再计算它们的加权和的简单相关系数,以这个简单相关系数作为这两组变量之间相关性的度量指标,即
其中,u和v分别是由x变量和y变量的线性组合产生的综合逐步变量。显然,对任意的一组系数(a1,a2,...,ap)、(b1,b2,...,bp),都可以通过上式求出一对u和v,即典型相关分析中的典型变量u和v。进而可以求出典型变量u和v的简单相关系数,也就是典型相关系数。
具体地,可以使用统计分析软件SPSS(Statistical Product and ServiceSolutions)确定各标签与目标指标之间的典型相关系数。图4示出了根据图3的目标指标数据及其标签所确定的转速、采集温度、环境温度和流量中的每个标签与有效值指标之间的相关系数。如图4所示,转速标签与有效值指标之间的相关系数为0.753140,采集温度标签与有效值指标之间的相关系数为0.501082,环境温度标签与有效值指标之间的相关系数为0.806314,流量标签与有效值指标之间的相关系数为0.876976。
得到相关系数之后,可以在步骤S230中,基于相关系数,从目标指标的多个标签中确定目标标签。具体地,对于目标指标的每个标签,可以判断该标签与目标指标之间的相关系数是否大于预定阈值(例如0.7)。在相关系数大于预定阈值的标签中,确定相关系数最大的预定数目个(例如3个)标签为目标标签。例如,根据图4所示的相关系数,可以确定在有效值指标的标签中,相关系数大于0.7且相关系数最大的3个目标标签为流量标签、环境温度标签和转速标签。
确定目标标签之后,可以在步骤S340中,利用聚类模型,从目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值。具体地,对于每个目标标签,可以利用聚类模型,将目标指标数据的数据点所具有的对应于目标标签的标签值划分为两个标签值集合,选择其中标签值数目较多的标签值集合,将该标签值集合所包括的标签值作为目标标签值。应当指出,本发明实施例可以采用任何合适的聚类模型,例如k-means聚类模型、深度学习聚类模型等等,本发明对此不做限制。
例如,根据图3,目标指标数据的数据点所具有的对应于转速标签的标签值包括780、781、791、771和772。可以利用将这些标签值划分为两个标签值集合,选择其中标签值数目较多的标签值集合,将该标签值集合所包括的标签值作为目标标签值。
确定每个目标标签的目标标签值之后,可以在步骤S350中,基于目标标签值,筛选出与目标指标数据相关联的其他指标的指标数据。具体地,可以获取其他指标在预定时间区间的指标数据,筛选出其中具有目标标签值的指标数据。具体地,可以筛选出其中具有任一目标标签的任一目标标签值的指标数据。
在一些应用场景中,用户可以经由客户端在显示有目标指标的指标数据的图形用户界面上选择预定时间区间的目标指标数据,服务器采用本发明实施例的指标数据处理方法200,确定与目标指标数据相关联的其他指标的指标数据,并返回给客户端,客户端同时显示目标指标数据和相关联的其他指标的指标数据,以便用户查看并对比分析。
这样,本发明实施例的指标数据处理方法,可以基于数据之间的相关性,挖掘不同指标之间的关联关系,从而可以在选择目标指标数据之后得到相关联的其他指标数据,以便同时进行比较分析,有利于设备故障的监测,避免了不同指标数据混杂带来的分析困难和错误。
图5示出了根据本发明一个实施例的指标数据处理装置500的示意图。如图5所示,指标数据处理装置500包括数据选择模块510、标签确定模块520和数据筛选模块530。其中,指标数据包括对应指标的多个数据点,指标具有多个标签,指标数据的每个数据点具有分别对应于多个标签的多个标签值。其中,标签包括以下至少一个:流量、采集温度、环境温度、转速、压力、设备状态、设备工艺和阀门开度。
数据选择模块510适于选择目标指标在预定时间区间的目标指标数据。标签确定模块520适于基于目标指标数据和目标指标数据的数据点所具有的对应于各标签的标签值,确定各标签与目标指标之间的相关系数,基于相关系数,从目标指标的多个标签中确定目标标签,利用聚类模型,从目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值。数据筛选模块530适于基于目标标签值,筛选出与目标指标数据相关联的其他指标的指标数据。
在一些实施例中,相关系数为典型相关系数,标签确定模块520适于使用统计分析软件SPSS,确定各标签与目标指标之间的典型相关系数。标签确定模块520还适于判断各标签与目标指标之间的相关系数是否大于预定阈值,在相关系数大于预定阈值的标签中,确定相关系数最大的预定数目个标签为目标标签。标签确定模块520还适于利用聚类模型,将目标指标数据的数据点所具有的对应于目标标签的标签值划分为两个标签值集合,选择标签值数目较多的标签值集合,将该标签值集合所包括的标签值作为目标标签值。其中,聚类模型为k-means聚类模型。
在一些实施例中,数据筛选模块530还适于获取其他指标在预定时间区间的指标数据,筛选出其中具有目标标签值的指标数据。
以上在结合图1~图4说明指标数据处理方法200的具体描述中已经对指标数据处理装置500各模块中的相应处理进行了详细解释,这里不再对重复内容进行赘述。
应当理解,这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被该机器执行时,该机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的该程序代码中的指令,执行本发明的各种方法。
以示例而非限制的方式,计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。
应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本发明实施例还可以包括:B9、如B8所述的装置,其中,所述相关系数为典型相关系数,所述标签确定模块适于使用统计分析软件SPSS,确定各标签与所述目标指标之间的典型相关系数。B10、如B8所述的装置,其中,所述标签确定模块适于判断所述标签与所述目标指标之间的相关系数是否大于预定阈值;在相关系数大于预定阈值的标签中,确定相关系数最大的预定数目个标签为目标标签。B11、如B8所述的装置,其中,所述标签确定模块适于利用聚类模型,将所述目标指标数据的数据点所具有的对应于目标标签的标签值划分为两个标签值集合;选择标签值数目较多的标签值集合,将该标签值集合所包括的标签值作为目标标签值。B12、如B8所述的装置,其中,所述数据筛选模块适于获取其他指标在预定时间区间的指标数据;筛选出其中具有所述目标标签值的指标数据。B13、如B8-12中任一项所述的装置,其中,所述聚类模型为k-means聚类模型。B14、如B8-13中任一项的装置,其中,所述标签包括以下至少一个:流量、采集温度、环境温度、转速、压力、设备状态、设备工艺和阀门开度。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (14)
1.一种指标数据处理方法,所述指标数据包括对应指标的多个数据点,所述指标具有多个标签,所述指标数据的每个数据点具有分别对应于所述多个标签的多个标签值,以及所述标签包括流量、采集温度、环境温度、转速、压力、设备状态、设备工艺和阀门开度中的至少一个,所述方法包括:
选择被测设备的目标指标在预定时间区间的目标指标数据;
基于所述目标指标数据和所述目标指标数据的数据点所具有的对应于各标签的标签值,确定各标签与所述目标指标之间的相关系数;
基于所述相关系数,从所述目标指标的多个标签中确定目标标签;
利用聚类模型,从所述目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值;以及
基于所述目标标签值,筛选出与所述目标指标数据相关联的其他指标的指标数据。
2.如权利要求1所述的方法,其中,所述相关系数为典型相关系数,确定各标签与所述目标指标之间的相关系数,包括:
使用统计分析软件SPSS确定各标签与所述目标指标之间的典型相关系数。
3.如权利要求1所述的方法,其中,基于所述相关系数,从所述目标指标的多个标签中确定目标标签,包括:
判断所述标签与所述目标指标之间的相关系数是否大于预定阈值;
在相关系数大于预定阈值的标签中,确定相关系数最大的预定数目个标签为目标标签。
4.如权利要求1所述的方法,其中,利用聚类模型,从所述目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值,包括:
利用聚类模型,将所述目标指标数据的数据点所具有的对应于目标标签的标签值划分为两个标签值集合;
选择标签值数目较多的标签值集合,将该标签值集合所包括的标签值作为目标标签值。
5.如权利要求1所述的方法,其中,基于所述目标标签值,筛选出与所述目标指标数据相关联的其他指标的指标数据,包括:
获取其他指标在预定时间区间的指标数据;
筛选出其中具有所述目标标签值的指标数据。
6.如权利要求1-5中任一项所述的方法,其中,所述聚类模型为k-means聚类模型。
7.一种指标数据处理装置,所述指标数据包括对应指标的多个数据点,所述指标具有多个标签,所述指标数据的每个数据点具有分别对应于所述多个标签的多个标签值,以及所述标签包括流量、采集温度、环境温度、转速、压力、设备状态、设备工艺和阀门开度中的至少一个,所述装置包括:
数据选择模块,适于选择被测设备的目标指标在预定时间区间的目标指标数据;
标签确定模块,适于基于所述目标指标数据和所述目标指标数据的数据点所具有的对应于各标签的标签值,确定各标签与所述目标指标之间的相关系数;基于所述相关系数,从所述目标指标的多个标签中确定目标标签;利用聚类模型,从所述目标指标数据的数据点所具有的对应于目标标签的标签值中确定目标标签的目标标签值;以及
数据筛选模块,适于基于所述目标标签值,筛选出与所述目标指标数据相关联的其他指标的指标数据。
8.如权利要求7所述的装置,其中,所述相关系数为典型相关系数,所述标签确定模块适于
使用统计分析软件SPSS,确定各标签与所述目标指标之间的典型相关系数。
9.如权利要求7所述的装置,其中,所述标签确定模块适于
判断所述标签与所述目标指标之间的相关系数是否大于预定阈值;
在相关系数大于预定阈值的标签中,确定相关系数最大的预定数目个标签为目标标签。
10.如权利要求7所述的装置,其中,所述标签确定模块适于
利用聚类模型,将所述目标指标数据的数据点所具有的对应于目标标签的标签值划分为两个标签值集合;
选择标签值数目较多的标签值集合,将该标签值集合所包括的标签值作为目标标签值。
11.如权利要求7所述的装置,其中,所述数据筛选模块适于
获取其他指标在预定时间区间的指标数据;
筛选出其中具有所述目标标签值的指标数据。
12.如权利要求7-11中任一项所述的装置,其中,所述聚类模型为k-means聚类模型。
13.一种计算设备,包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行如权利要求1-6所述的指标数据处理方法中的任一方法的指令。
14.一种存储程序的可读存储介质,所述程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如权利要求1-6所述的指标数据处理方法中的任一方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110164307.5A CN112906776B (zh) | 2021-02-05 | 2021-02-05 | 一种指标数据处理方法、装置和计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110164307.5A CN112906776B (zh) | 2021-02-05 | 2021-02-05 | 一种指标数据处理方法、装置和计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112906776A CN112906776A (zh) | 2021-06-04 |
CN112906776B true CN112906776B (zh) | 2024-02-27 |
Family
ID=76123247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110164307.5A Active CN112906776B (zh) | 2021-02-05 | 2021-02-05 | 一种指标数据处理方法、装置和计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112906776B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102045358A (zh) * | 2010-12-29 | 2011-05-04 | 深圳市永达电子股份有限公司 | 一种基于整合相关性分析与分级聚类的入侵检测方法 |
CN104462167A (zh) * | 2013-09-17 | 2015-03-25 | 株式会社日立制作所 | 数据分析辅助系统 |
US9367872B1 (en) * | 2014-12-22 | 2016-06-14 | Palantir Technologies Inc. | Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures |
CN108596227A (zh) * | 2018-04-12 | 2018-09-28 | 广东电网有限责任公司 | 一种用户用电行为主导影响因素挖掘方法 |
CN111164224A (zh) * | 2017-09-14 | 2020-05-15 | 普梭梅根公司 | 微生物相关的重要性指数指标 |
CN111582619A (zh) * | 2020-01-22 | 2020-08-25 | 汕头大学 | 一种基于相关性与依赖性分析的适应性设计方法 |
CN112184872A (zh) * | 2020-10-17 | 2021-01-05 | 蔡娟 | 基于大数据和云计算的游戏渲染优化方法及云端计算中心 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9912523B2 (en) * | 2015-01-20 | 2018-03-06 | Telefonaktiebolaget Lm Ericsson (Publ) | Systems and methods for multi-variate attribute correlation |
US10795347B2 (en) * | 2018-09-28 | 2020-10-06 | Rockwell Automation Technologies, Inc. | Systems and methods for controlling industrial devices based on modeled target variables |
-
2021
- 2021-02-05 CN CN202110164307.5A patent/CN112906776B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102045358A (zh) * | 2010-12-29 | 2011-05-04 | 深圳市永达电子股份有限公司 | 一种基于整合相关性分析与分级聚类的入侵检测方法 |
CN104462167A (zh) * | 2013-09-17 | 2015-03-25 | 株式会社日立制作所 | 数据分析辅助系统 |
US9367872B1 (en) * | 2014-12-22 | 2016-06-14 | Palantir Technologies Inc. | Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures |
CN111164224A (zh) * | 2017-09-14 | 2020-05-15 | 普梭梅根公司 | 微生物相关的重要性指数指标 |
CN108596227A (zh) * | 2018-04-12 | 2018-09-28 | 广东电网有限责任公司 | 一种用户用电行为主导影响因素挖掘方法 |
CN111582619A (zh) * | 2020-01-22 | 2020-08-25 | 汕头大学 | 一种基于相关性与依赖性分析的适应性设计方法 |
CN112184872A (zh) * | 2020-10-17 | 2021-01-05 | 蔡娟 | 基于大数据和云计算的游戏渲染优化方法及云端计算中心 |
Non-Patent Citations (3)
Title |
---|
K Gouda 等.Assessing the effectiveness of data-driven time-domain condition indicators in predicting the progression of surface distress under rolling contact.《Proceedings of the Institution of Mechanical Engineers,Part J:Journal of Engineering Tribology》.2019,第223卷(第10期),1-31. * |
一种融合评价指标相关性的多目标社区检测算法;易鑫睿;陈昊;兰金明;;《小型微型计算机系统》;20200904;第41卷(第09期);1806-1811 * |
多属性综合评价指标体系理论综述;李远远;云俊;;《武汉理工大学学报(信息与管理工程版)》;20090415;第31卷(第02期);305-309 * |
Also Published As
Publication number | Publication date |
---|---|
CN112906776A (zh) | 2021-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021184727A1 (zh) | 数据异常检测方法、装置、电子设备及存储介质 | |
CN106844576B (zh) | 一种异常检测方法、装置和监控设备 | |
US8914279B1 (en) | Efficient parsing with structured prediction cascades | |
WO2021189827A1 (zh) | 识别模糊图像的方法、装置、设备及计算机可读存储介质 | |
CN112733023A (zh) | 资讯推送方法、装置、电子设备及计算机可读存储介质 | |
CN112306835A (zh) | 用户数据监控分析方法、装置、设备及介质 | |
CN108491875A (zh) | 一种数据异常检测方法、装置、设备及介质 | |
CN112395179B (zh) | 一种模型训练方法、磁盘预测方法、装置及电子设备 | |
CN111949798A (zh) | 图谱的构建方法、装置、计算机设备和存储介质 | |
CN112994960B (zh) | 业务数据异常检测方法、装置及计算设备 | |
CN109933502A (zh) | 电子装置、用户操作记录的处理方法和存储介质 | |
JP2019219848A (ja) | ソースコード解析方法およびソースコード解析装置 | |
CN113627179B (zh) | 一种基于大数据的威胁情报预警文本分析方法及系统 | |
CN111522782A (zh) | 文件数据写入方法、装置及计算机可读存储介质 | |
CN108304310B (zh) | 一种日志分析方法及计算设备 | |
US8504324B2 (en) | System and method for analyzing reliability of electronic device | |
CN112906776B (zh) | 一种指标数据处理方法、装置和计算设备 | |
CN111898378A (zh) | 政企客户的行业分类方法和装置、电子设备、存储介质 | |
CN116168403A (zh) | 医疗数据分类模型训练方法、分类方法、装置及相关介质 | |
CN113344087B (zh) | 一种建立样本集的方法及计算设备 | |
CN107291614B (zh) | 文件异常检测方法和电子设备 | |
US10467258B2 (en) | Data categorizing system, method, program software and recording medium therein | |
CN109284354B (zh) | 脚本搜索方法、装置、计算机设备及存储介质 | |
CN115146641A (zh) | 一种ner带噪训练方法及装置 | |
CN114943695A (zh) | 医学序列影像的异常检测方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |