CN114579827B - 一种工业设备数据性能曲线的处理方法、装置及设备 - Google Patents
一种工业设备数据性能曲线的处理方法、装置及设备 Download PDFInfo
- Publication number
- CN114579827B CN114579827B CN202210485314.XA CN202210485314A CN114579827B CN 114579827 B CN114579827 B CN 114579827B CN 202210485314 A CN202210485314 A CN 202210485314A CN 114579827 B CN114579827 B CN 114579827B
- Authority
- CN
- China
- Prior art keywords
- time sequence
- curve
- filtering
- time
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Library & Information Science (AREA)
- Computational Linguistics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明提供一种工业设备数据性能曲线的处理方法、装置及设备,所述方法包括:获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线;获取第一过滤时序曲线的第一标签时序数据以及第二过滤时序曲线的第二标签时序数据;根据第一标签时序数据、第二标签时序数据和预设分类模型,确定第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。本发明的方案能够快速确认出工业设备数据性能曲线间的差异,降低人工核查成本,且适应性强。
Description
技术领域
本发明涉及工业设备数据处理技术领域,特别是指一种工业设备数据性能曲线的处理方法、装置及设备。
背景技术
在工业设备数据的处理过程中,例如,风机的风功率曲线有很多不同的加工方法,这些方法存在微妙的差别。了解风功率曲线差别最直接的方式是阅读风功率曲线的加工处理算法的源代码,但代码复杂性使得无法准确获知这些不同的方法加工出来的风功率曲线的差异,造成无法对风功率曲线进行准确分析,无法了解风机等设备的异常或者故障等情况。
发明内容
本发明要解决的技术问题是如何提供一种工业设备数据性能曲线的处理方法、装置及设备,以提高工业设备数据性能曲线中差异数据点的核查效率。
为解决上述技术问题,本发明的实施例提供一种工业设备数据性能曲线的处理方法,所述方法包括:
获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线;
获取所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据;所述第一标签时序数据包括:所述第一过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;所述第二标签时序数据包括:第二过滤时序曲线中判断为第三类型标签的时序数据点和第四类型标签的时序数据点;
根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,确定所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。
可选的,获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线之后,还包括:
对所述第一过滤时序曲线和所述第二过滤时序曲线进行时序数据点的同化处理,获得具有相同时间间隔的过滤时序曲线。
可选的,对所述第一过滤时序曲线和所述第二过滤时序曲线进行时序数据点的同化处理,获得具有相同时间间隔的过滤时序曲线,包括:
获取所述第一过滤时序曲线中相邻两个时序数据点的第一时间间隔;
获取所述第二过滤时序曲线中相邻两个时序数据点的第二时间间隔;
根据所述第一时间间隔和所述第二时间间隔的比值K,对所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔进行映射处理;获得具有相同时间间隔的第一过滤时序曲线和第二过滤时序曲线。
可选的,根据所述第一时间间隔和所述第二时间间隔的比值K,对所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔进行映射处理,包括:
当所述比值K大于1且不是整数时,将所述第二过滤时序曲线中每个时序数据点的时间戳t取值定义为[t-(K+1)/2,t+(K+1)/2];
当所述比值K为1或其他整数时,则保持所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔不变。
可选的,在获得所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据之后,还包括:
获取所述第一过滤时序曲线与所述第二过滤时序曲线中的公共时序数据点集合;
将工业设备数据性能曲线的原始时序数据点中属于所述公共时序数据点集合的时序数据点滤除,获得过滤后的时序数据点;
对所述过滤后的时序数据点进行聚类,得到至少一个分类簇。
可选的,根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,获得所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果,包括:
获取所述第一过滤时序曲线中所述第一标签时序数据的至少一个第一时序特征量和所述第二过滤时序曲线中所述第二标签时序数据的至少一个第二时序特征量;
将至少一个所述第一时序特征量、至少一个所述第二时序特征量多个维度的时序特征量和至少一个所述分类簇输入预设分类模型中进行分类处理,得到所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。
可选的,获取所述第一过滤时序曲线中所述第一标签时序数据的至少一个第一时序特征量和所述第二过滤时序曲线中所述第二标签时序数据的至少一个第二时序特征量,包括:
根据所述第一过滤时序曲线的第一时间间隔构建第一时间邻域窗口;
根据所述第二过滤时序曲线的第二时间间隔构建第二时间邻域窗口;
根据预设特征量提取配置,获取所述第一时间邻域窗口内所述第一标签时序数据的至少一个第一时序特征量和所述第二时间邻域窗口内所述第二标签时序数据的至少一个第二时序特征量。
本发明的实施例还提供一种工业设备数据性能曲线的处理装置,包括:
获取模块,用于获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线;
处理模块,用于获取所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据;所述第一标签时序数据包括:所述第一过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;所述第二标签时序数据包括:第二过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,确定所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。
本发明的实施例还提供一种计算设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上述所述的方法。
本发明的实施例还提供一种计算机可读存储介质,存储指令,当所述指令在计算机上运行时,使得计算机执行如上述所述的方法。
本发明的上述方案至少包括以下有益效果:
通过获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线;获取所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据;所述第一标签时序数据包括:所述第一过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;所述第二标签时序数据包括:第二过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,确定所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果;提高了工业设备时序数据在不同处理算法下判别差异点的效率,同时提高了不同的处理算法下差异点判别的适应性。
附图说明
图1是本发明实施例提供的工业设备数据性能曲线的处理方法流程图;
图2是本发明实施例提供的第一过滤时序曲线示意图;
图3是本发明实施例提供的第二过滤时序曲线示意图;
图4是本发明实施例提供的时序数据点的分类簇示意图;
图5是本发明实施例提供的预设分类模型进行分类的示意图;
图6是本发明实施例提供的工业设备数据性能曲线的处理装置的模块框示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
如图1所示,本发明的实施例提供一种工业设备数据性能曲线的处理方法,所述方法包括:
步骤11,获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线;
步骤12,获取所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据;所述第一标签时序数据包括:所述第一过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;所述第二标签时序数据包括:第二过滤时序曲线中判断为第三类型标签的时序数据点和第四类型标签的时序数据点;
步骤13,根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,确定所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。
该实施例中,所述第一过滤时序曲线可以是通过第一过滤算法,对收集到的工业设备产生的时序数据进行过滤处理得到的;所述第二过滤时序曲线可以是通过第二过滤算法,对收集到的工业设备产生的时序数据进行过滤处理得到的,所述第一、第二过滤算法可以是采用现有方案中的过滤算法;由于工业设备时序数据量庞大,如风机的风功率对应的时序数据,可以通过功率分仓算法,对时序数据进行过滤处理后得到风功率的二维散点图,即所述第一过滤时序曲线;也可以通过风速分仓算法,对时序数据进行过滤处理后得到风功率的二维散点图,即所述第二过滤时序曲线,如图2、3所示;应当知道,工业设备时序数据的过滤算法不仅限于两种,对应时序数据的不同特征,可以选取合适的过滤算法对时序数据进行过滤处理;
所述第一标签时序数据是通过所述第一过滤算法处理后输出的时序数据点,也即是所述第一过滤时序曲线中的时序数据点;所述第一标签时序数据包括:第一类型标签的时序数据点和第二类型标签的时序数据点,所述第一类型标签的时序数据点可以表示为:经过所述第一过滤算法处理后,所述第一过滤时序曲线判断为正常的时序数据点;所述第二类型标签的时序数据点可以表示为:经过所述第一过滤算法处理后,所述第一过滤时序曲线判断为正常的时序数据点,同时该时序数据点也处于所述第二过滤时序曲线中;
所述第二标签时序数据是通过所述第二过滤算法处理后输出的时序数据点,也即是所述第二过滤时序曲线中的时序数据点;所述二标签时序数据包括:第三类型标签的时序数据点和第四类型标签的时序数据点,所述第三类型标签的时序数据点可以表示为:经过所述第二过滤算法处理后,所述二过滤时序曲线判断为正常的时序数据点;所述第四类型标签的时序数据点可以表示为:经过所述第二过滤算法处理后,所述第二过滤时序曲线判断为正常的时序数据点,同时该时序数据点也处于所述第一过滤时序曲线中;
所述预设分类模型可以是对所述第一过滤时序曲线与所述第二过滤时序曲线中的时序数据点进行差异研判的模型;可以通过大量的时序数据对现有的分类模型进行训练后得到的;优选的,所述预设分类模型可以是决策树模型,当然其他可实现分类判断的模型亦可;
所述第一类型标签的时序数据和所述第二类型标签的时序数据均包括多个不同的时序特征量,通过将所述第一标签时序数据和所述第二标签时序数据输入所述预设分类模型,进行处理,获得两条时序曲线中时序数据点的差异点分类结果,与现有人工研判相比,提高了研判差异点的效率及准确性,同时所述预设分离模型进行分类研判处理,针对不同过滤算法,其适应性更强。
本发明的一可选实施例中,在所述步骤11之后,还可以包括:
步骤01,对所述第一过滤时序曲线和所述第二过滤时序曲线进行时序数据点的同化处理,获得具有相同时间间隔的过滤时序曲线。
该实施例中,由于不同过滤算法侧重性质不同,过滤处理后得到的过滤时序曲线中的时序数据点的数量及时间间隔也会不同,通过对所述第一过滤时序曲线和所述第二过滤时序曲线进行同化处理,使得所述第一过滤时序曲线和所述第二过滤时序曲线中成为具有相同的时间粒度,也即是具有相同的时间间隔,以便于后续在相同时间间隔内进行差异点的分类及比较,保证后续分类处理的准确性。
本发明的一可选实施例中,所述步骤01,可以包括:
步骤011,获取所述第一过滤时序曲线中相邻两个时序数据点的第一时间间隔;
步骤012,获取所述第二过滤时序曲线中相邻两个时序数据点的第二时间间隔;
步骤013,根据所述第一时间间隔和所述第二时间间隔的比值K,对所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔进行映射处理;获得具有相同时间间隔的第一过滤时序曲线和第二过滤时序曲线。
该实施例中,分别对所述第一过滤时序曲线和所述第二过滤时序曲线中的时序数据点,按照各自对应的时间戳从小到大的顺序进行排列,根据所述时间戳,计算任意相邻的两个时序数据点的时间间隔,分别得到所述第一过滤时序曲线的时间间隔集合,所述第二过滤时序曲线的时间间隔集合;由于所述第一过滤时序曲线和所述第二过滤时序曲线是经过不同过滤算法过滤得到的,在按照过滤时序曲线中时序数据点各自对应的时间戳的大小进行排序时,相邻的两个时序数据之间可能会存在被过滤掉的时序数据点,而导致计算的时间间隔较大;在获得所述第一过滤时序曲线的时间间隔集合和所述第二过滤时序曲线的时间间隔集合后,分别将集合中的时间间隔按照从小到大的顺序进行排列,去排列后的时间间隔中的中位数,作为最终的时间间隔的大小,以保证获得的时间间隔的准确性;进一步,确定所述第一过滤时序曲线中相邻两个时序数据点的第一时间间隔,以及所述第二过滤时序曲线中相邻两个时序数据点的第二时间间隔;
在本发明的一可实现方案中,获取所述第一过滤时序曲线和第二过滤时序曲线的时间间隔时,也可以是按照等间隔原则,根据原始时序数据点,将过滤掉的时序数据点补齐,此时所述第一过滤时序曲线中候补的时序数据点标记为第五类型标签的时序数据点,也即是所述第一过滤时序曲线判断的为异常的时序数据,所述第二过滤时序曲线中候补的时序数据点标记为第六类型标签的时序数据点,也即是所述第二过滤时序曲线判断的为异常的时序数据;进而根据补齐后的时序数据,获得所述第一过滤时序曲线的第一时间间隔以及所述第二过滤时序曲线的第二时间间隔;
计算所述第一时间间隔与所述第二时间间隔的比值K,根据所述比值K实际计算值,对所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔进行映射处理,以使所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔相同,保证后续数据点的可比性以及比较的准确性。
本发明的一可选实施例中,所述步骤013,可以包括:
步骤0131-a,当所述比值K大于1且不是整数时,将所述第二过滤时序曲线中每个时序数据点的时间戳t取值定义为[t-(K+1)/2,t+(K+1)/2];
步骤0131-b,当所述比值K为1或其他整数时,则保持所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔不变。
该实施例中,当所述比值K为1或其他整数时,也即是所述第一过滤时序曲线的第一时间间隔与所述第二过滤时序曲线的第二时间间隔相等,或者所述第一过滤时序曲线的第一时间间隔是所述第二过滤时序曲线的第二时间间隔的整数倍时,保持所述第一时间间隔和所述第二时间间隔的大小不变;优选的,在所述比值K为其他整数时,所述第二时间间隔保持不变,在进行后续步骤时,只需要在所述第二过滤时序曲线中,截取与所述第一时间间隔大小相同的时间间隔内对应的时序数据点即可;
当所述比值K大于1且不是整数时,取所述比值K的整数部分,将所述第二过滤时序曲线中每个时序数据点的时间戳t取值定义为[t-(K+1)/2,t+(K+1)/2],并按照新的时间戳计算所述第二过滤时序曲线中相邻时序数据点的新的第二时间间隔;
应当知道的是,当所述比值K为所述第二时间间隔与所述第一时间间隔的比值时,按照上述方法,对所述第一过滤时序曲线做相同的处理。
本发明的一可选实施例中,在所述步骤11之后,还包括:
步骤011,获取所述第一过滤时序曲线与所述第二过滤时序曲线中的公共时序数据点集合;
步骤012,将工业设备数据性能曲线的原始时序数据点中属于所述公共时序数据点集合的时序数据点滤除,获得过滤后的时序数据点;
步骤013,对所述过滤后的时序数据点进行聚类,得到至少一个分类簇。
该实施例中,在获得所述第一过滤时序曲线与所述第二过滤时序曲线后,对所述第一过滤时序曲线与所述第二过滤时序曲线进行交集处理,获得两条时序曲线的公共时序数据点集合;
根据所述公共时序数据点集合,对所述原始时序数据点形成的二维散点图进行过滤处理,过滤掉所述原始时序数据点中的公共时序数据点,同时对过滤后的剩余时序数据点,按照在二维散点图中的位置特征进行聚类处理,得到至少一个分类簇;所述分类簇的种类数可以依据实际场景的需求确定;以风功率时序数据点的二维散点图为例,如图4所示,根据实际应用中功率大小的要求,以及对应风速的不同,可以分为5个分类簇:第一分类簇、第二分类簇、第三分类簇、第四分类簇以及第五分类簇;优选的,可以采用DBSCAN密度聚类法进行聚类处理;
通过对所述过滤后的剩余时序数据点进行聚类处理,在后续进行差异点分类时,可以快速确认所述第一过滤时序曲线中的第一标签时序数据、所述第二过滤时序曲线中的第二标签时序数据在原始时序数据所形成的二维散点图中的准确位置。
本发明的一可选实施例中,所述步骤13,可以包括:
步骤131,获取所述第一过滤时序曲线中所述第一标签时序数据的至少一个第一时序特征量和所述第二过滤时序曲线中所述第二标签时序数据的至少一个第二时序特征量;
步骤132,将至少一个所述第一时序特征量、至少一个所述第二时序特征量多个维度的时序特征量和至少一个所述分类簇输入预设分类模型中进行分类处理,得到所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。
该实施例中,所述第一标签时序数据可以包含多个不同维度的时序特征量,所述第二标签时序数据也可以包含多个不同维度的时序特征量,以风机的风功率对应的时序数据点为例,可以包括的时序特征量有:平均风速的大小、当前风速的大小、湍流强度的大小、风向、风速的稳定性、温度、压力等;所以所述第一标签时序数据可以包含多个不同的第一时序特征量,所述第二标签时序数据可以包含多个不同的第二时序特征量,
由于所述第一标签时序数据有多个,则对应的所述第一时序特征量实际为第一时序特征量的集合;相应的,所述第二时序特征量实际为第二时序特征量的集合;将获取到的所述第一标签时序数据的至少一个第一时序特征量和所述第二标签时序数据的至少一个第二时序特征量,进行合并,得到时序特征量集合;
将所述时序特征量集合以及至少一个所述分类簇输入预设分类模型中进行分类处理,即可获得所述时序特征量集合中的时序特征量对应的标签时序数据的标签类型;
以风机的风功率的过滤时序曲线为例,如图5所示,当输入的时序特征量表示平均风速时,且平均风速大于20m/s时,可以确定该时序特征量对应的标签时序数据为第一类型标签的时序数据;若平均风速小于20m/s时,且该时序特征量对应的标签时序数据属于第一分类簇示,可以确定该标签时序数据为第一类型标签的时序数据;若该时序特征量对应的标签时序数据不属于第一分类簇时,且当该标签时序数据的当前风速特征量小于5m/s时,可以确定该标签时序数据为第三类型标签的时序数据;依次类推,可以进行每一个标签时序数据的标签类型;
所述预设分类模型可以是通过现有技术中的决策树模型,按照所述时序特征量集合中的时序特征量的种类数和多个同一特征量的个数,以及至少一个所述分类簇进行切割训练得到的。
本发明的一可选实施例中,所述步骤131,可以包括:
步骤1311,根据所述第一过滤时序曲线的第一时间间隔构建第一时间邻域窗口;
步骤1312,根据所述第二过滤时序曲线的第二时间间隔构建第二时间邻域窗口;
步骤1313,根据预设特征量提取配置,获取所述第一时间邻域窗口内所述第一标签时序数据的至少一个第一时序特征量和所述第二时间邻域窗口内所述第二标签时序数据的至少一个第二时序特征量。
该实施例中,所述第一时间领域窗口可以依据所述第一时间间隔的大小进行划定,所述第二时间领域窗口可以依据所述第二时间间隔的大小进行划定;分别对处于所述第一时间领域窗口内的所述第一标签数据以及处于所述第二时间领域窗口内的所述第二标签时序数据,按照所述预设特征量提取配置进行多维度的时序特征量的提取,以便于后续根据所述第一过滤时序曲线中的第一标签数据以及所述第二过滤时序曲线中的第二标签数据的至少一个时序特征量,进行两条过滤时序曲线差异点的类型判别;所述预设特征量提取配置可以是常见的特征提取方法,如通过时序特征函数库进行时序特征量的提取。
本发明的上述实施例中,通过构建时间领域窗口,同时以时间领域窗口的大小为一个步长,沿过滤时序曲线进行滑动,每滑动一次,便提取一次窗口内标签数据的时序特转,以保证过滤时序曲线中的每个标签数据都能够提取到时序特征量,保证后续两条过滤时序曲线差异点判别的准确性与全面性。
如图6所示,本发明的实施例还提供一种工业设备数据性能曲线的处理装置60,包括:
获取模块61,用于获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线;
处理模块62,用于获取所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据;所述第一标签时序数据包括:所述第一过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;所述第二标签时序数据包括:第二过滤时序曲线中判断为第三类型标签的时序数据点和第四类型标签的时序数据点;根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,确定所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。
可选的,所述获取模块61,在获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线之后,所述处理模块62,还用于:
对所述第一过滤时序曲线和所述第二过滤时序曲线进行时序数据点的同化处理,获得具有相同时间间隔的过滤时序曲线。
可选的,所述处理模块62,用于对所述第一过滤时序曲线和所述第二过滤时序曲线进行时序数据点的同化处理,获得具有相同时间间隔的过滤时序曲线,包括:
获取所述第一过滤时序曲线中相邻两个时序数据点的第一时间间隔;
获取所述第二过滤时序曲线中相邻两个时序数据点的第二时间间隔;
根据所述第一时间间隔和所述第二时间间隔的比值K,对所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔进行映射处理;获得具有相同时间间隔的第一过滤时序曲线和第二过滤时序曲线。
可选的,所述处理模块62,用于根据所述第一时间间隔和所述第二时间间隔的比值K,对所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔进行映射处理,包括:
当所述比值K大于1且不是整数时,将所述第二过滤时序曲线中每个时序数据点的时间戳t取值定义为[t-(K+1)/2,t+(K+1)/2];
当所述比值K为1或其他整数时,则保持所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔不变。
可选的,所述获取模块61,在在获得所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据之后,所述处理模块62,还用于:
获取所述第一过滤时序曲线与所述第二过滤时序曲线中的公共时序数据点集合;
将工业设备数据性能曲线的原始时序数据点中属于所述公共时序数据点集合的时序数据点滤除,获得过滤后的时序数据点;
对所述过滤后的时序数据点进行聚类,得到至少一个分类簇。
可选的,所述处理模块62,用于根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,获得所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果,包括:
获取所述第一过滤时序曲线中所述第一标签时序数据的至少一个第一时序特征量和所述第二过滤时序曲线中所述第二标签时序数据的至少一个第二时序特征量;
将至少一个所述第一时序特征量、至少一个所述第二时序特征量多个维度的时序特征量和至少一个所述分类簇输入预设分类模型中进行分类处理,得到所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。
可选的,所述处理模块62,用于获取所述第一过滤时序曲线中所述第一标签时序数据的至少一个第一时序特征量和所述第二过滤时序曲线中所述第二标签时序数据的至少一个第二时序特征量,包括:
根据所述第一过滤时序曲线的第一时间间隔构建第一时间邻域窗口;
根据所述第二过滤时序曲线的第二时间间隔构建第二时间邻域窗口;
根据预设特征量提取配置,获取所述第一时间邻域窗口内所述第一标签时序数据的至少一个第一时序特征量和所述第二时间邻域窗口内所述第二标签时序数据的至少一个第二时序特征量。
需要说明的是,该装置是与上述方法对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种通信设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本发明的实施例还提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如上所述的方法。上述方法实施例中的所有实现方式均适用于该实施例中,也能达到相同的技术效果。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
此外,需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行,某些步骤可以并行或彼此独立地执行。对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (9)
1.一种工业设备数据性能曲线的处理方法,其特征在于,所述方法包括:
获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线;
获取所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据;所述第一标签时序数据包括:所述第一过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;所述第二标签时序数据包括:第二过滤时序曲线中判断为第三类型标签的时序数据点和第四类型标签的时序数据点;
根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,确定所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果;
其中,在获得所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据之后,还包括:
获取所述第一过滤时序曲线与所述第二过滤时序曲线中的公共时序数据点集合;
将工业设备数据性能曲线的原始时序数据点中属于所述公共时序数据点集合的时序数据点滤除,获得过滤后的时序数据点;
对所述过滤后的时序数据点进行聚类,得到至少一个分类簇。
2.根据权利要求1所述的工业设备数据性能曲线的处理方法,其特征在于,获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线之后,还包括:
对所述第一过滤时序曲线和所述第二过滤时序曲线进行时序数据点的同化处理,获得具有相同时间间隔的过滤时序曲线。
3.根据权利要求2所述的工业设备数据性能曲线的处理方法,其特征在于,对所述第一过滤时序曲线和所述第二过滤时序曲线进行时序数据点的同化处理,获得具有相同时间间隔的过滤时序曲线,包括:
获取所述第一过滤时序曲线中相邻两个时序数据点的第一时间间隔;
获取所述第二过滤时序曲线中相邻两个时序数据点的第二时间间隔;
根据所述第一时间间隔和所述第二时间间隔的比值K,对所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔进行映射处理;获得具有相同时间间隔的第一过滤时序曲线和第二过滤时序曲线。
4.根据权利要求3所述的工业设备数据性能曲线的处理方法,其特征在于,根据所述第一时间间隔和所述第二时间间隔的比值K,对所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔进行映射处理,包括:
当所述比值K大于1且不是整数时,将所述第二过滤时序曲线中每个时序数据点的时间戳t取值定义为[t-(K+1)/2,t+(K+1)/2];
当所述比值K为1或其他整数时,则保持所述第一过滤时序曲线和所述第二过滤时序曲线的时间间隔不变。
5.根据权利要求1所述的工业设备数据性能曲线的处理方法,其特征在于,根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,获得所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果,包括:
获取所述第一过滤时序曲线中所述第一标签时序数据的至少一个第一时序特征量和所述第二过滤时序曲线中所述第二标签时序数据的至少一个第二时序特征量;
将至少一个所述第一时序特征量、至少一个所述第二时序特征量多个维度的时序特征量和至少一个所述分类簇输入预设分类模型中进行分类处理,得到所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果。
6.根据权利要求5所述的工业设备数据性能曲线的处理方法,其特征在于,获取所述第一过滤时序曲线中所述第一标签时序数据的至少一个第一时序特征量和所述第二过滤时序曲线中所述第二标签时序数据的至少一个第二时序特征量,包括:
根据所述第一过滤时序曲线的第一时间间隔构建第一时间邻域窗口;
根据所述第二过滤时序曲线的第二时间间隔构建第二时间邻域窗口;
根据预设特征量提取配置,获取所述第一时间邻域窗口内所述第一标签时序数据的至少一个第一时序特征量和所述第二时间邻域窗口内所述第二标签时序数据的至少一个第二时序特征量。
7.一种工业设备数据性能曲线的处理装置,其特征在于,包括:
获取模块,用于获取工业设备数据性能曲线的原始时序数据点的第一过滤时序曲线和第二过滤时序曲线;
处理模块,用于获取所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据;所述第一标签时序数据包括:所述第一过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;所述第二标签时序数据包括:第二过滤时序曲线中判断为第一类型标签的时序数据点和第二类型标签的时序数据点;根据所述第一标签时序数据、所述第二标签时序数据和预设分类模型,确定所述第一过滤时序曲线和第二过滤时序曲线的差异点分类结果;
其中,在获得所述第一过滤时序曲线的第一标签时序数据以及所述第二过滤时序曲线的第二标签时序数据之后,还包括:
获取所述第一过滤时序曲线与所述第二过滤时序曲线中的公共时序数据点集合;
将工业设备数据性能曲线的原始时序数据点中属于所述公共时序数据点集合的时序数据点滤除,获得过滤后的时序数据点;
对所述过滤后的时序数据点进行聚类,得到至少一个分类簇。
8.一种计算设备,其特征在于,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如权利要求1至6任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,存储指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210485314.XA CN114579827B (zh) | 2022-05-06 | 2022-05-06 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210485314.XA CN114579827B (zh) | 2022-05-06 | 2022-05-06 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114579827A CN114579827A (zh) | 2022-06-03 |
CN114579827B true CN114579827B (zh) | 2022-08-05 |
Family
ID=81769382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210485314.XA Active CN114579827B (zh) | 2022-05-06 | 2022-05-06 | 一种工业设备数据性能曲线的处理方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114579827B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106371939A (zh) * | 2016-09-12 | 2017-02-01 | 山东大学 | 一种时序数据异常检测方法及其系统 |
CN107067100A (zh) * | 2017-01-25 | 2017-08-18 | 国网冀北电力有限公司 | 风电功率异常数据辨识方法及辨识装置 |
CN108763584A (zh) * | 2018-06-11 | 2018-11-06 | 北京天泽智云科技有限公司 | 一种风功率曲线散点过滤的方法及其系统 |
CN109740175A (zh) * | 2018-11-18 | 2019-05-10 | 浙江大学 | 一种面向风电机组功率曲线数据的离群点判别方法 |
CN110032670A (zh) * | 2019-04-17 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 时序数据的异常检测方法、装置、设备及存储介质 |
CN112598539A (zh) * | 2020-12-28 | 2021-04-02 | 江苏徐工信息技术股份有限公司 | 一种风力发电机组风功率曲线优化计算及异常值检测方法 |
WO2021184727A1 (zh) * | 2020-03-19 | 2021-09-23 | 平安科技(深圳)有限公司 | 数据异常检测方法、装置、电子设备及存储介质 |
-
2022
- 2022-05-06 CN CN202210485314.XA patent/CN114579827B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106371939A (zh) * | 2016-09-12 | 2017-02-01 | 山东大学 | 一种时序数据异常检测方法及其系统 |
CN107067100A (zh) * | 2017-01-25 | 2017-08-18 | 国网冀北电力有限公司 | 风电功率异常数据辨识方法及辨识装置 |
CN108763584A (zh) * | 2018-06-11 | 2018-11-06 | 北京天泽智云科技有限公司 | 一种风功率曲线散点过滤的方法及其系统 |
CN109740175A (zh) * | 2018-11-18 | 2019-05-10 | 浙江大学 | 一种面向风电机组功率曲线数据的离群点判别方法 |
CN110032670A (zh) * | 2019-04-17 | 2019-07-19 | 腾讯科技(深圳)有限公司 | 时序数据的异常检测方法、装置、设备及存储介质 |
WO2021184727A1 (zh) * | 2020-03-19 | 2021-09-23 | 平安科技(深圳)有限公司 | 数据异常检测方法、装置、电子设备及存储介质 |
CN112598539A (zh) * | 2020-12-28 | 2021-04-02 | 江苏徐工信息技术股份有限公司 | 一种风力发电机组风功率曲线优化计算及异常值检测方法 |
Non-Patent Citations (1)
Title |
---|
风力发电机组功率曲线状态评估方法;熊弦 等;《电子元器件与信息技术》;20200430;第4卷(第4期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN114579827A (zh) | 2022-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111798312A (zh) | 一种基于孤立森林算法的金融交易系统异常识别方法 | |
CN112367273B (zh) | 基于知识蒸馏的深度神经网络模型的流量分类方法及装置 | |
CN105550253B (zh) | 一种类型关系的获取方法及装置 | |
CN109726737B (zh) | 基于轨迹的异常行为检测方法及装置 | |
CN113971425A (zh) | 一种异常分析方法、装置及存储介质 | |
CN114281864A (zh) | 一种面向电力网络告警信息的关联分析方法 | |
CN113723452A (zh) | 一种基于kpi聚类的大规模异常检测系统 | |
CN108596227B (zh) | 一种用户用电行为主导影响因素挖掘方法 | |
CN104951553A (zh) | 一种数据处理准确的内容搜集与数据挖掘平台及其实现方法 | |
CN110189799B (zh) | 基于变量重要性评分和奈曼皮尔逊检验的宏基因组特征选择方法 | |
CN202815869U (zh) | 一种车载微机图像视频数据提取装置 | |
CN114386931A (zh) | 一种基于ai技术的图像分析系统及方法 | |
CN114579827B (zh) | 一种工业设备数据性能曲线的处理方法、装置及设备 | |
CN116561230B (zh) | 一种基于云计算的分布式存储与检索系统 | |
CN117277566A (zh) | 基于大数据的电网数据分析电力调度系统及方法 | |
CN112257076A (zh) | 一种基于随机探测算法和信息聚合的漏洞检测方法 | |
CN104537392A (zh) | 一种基于判别性语义部件学习的对象检测方法 | |
CN112487991B (zh) | 一种基于特征自学习的高精度负荷辨识方法及系统 | |
CN109189775B (zh) | 一种工业监控平台海量数据处理系统及方法 | |
CN111209158B (zh) | 服务器集群的挖矿监控方法及集群监控系统 | |
CN113392397A (zh) | 基于混合特征和emd的恶意代码半监督聚类方法 | |
Bones et al. | Clustering Multivariate Climate Data Streamsusing Fractal Dimension. | |
CN117270791B (zh) | 一种电力数据分析方法及系统 | |
CN117370898B (zh) | 一种电子数据安全管控系统 | |
CN113761034B (zh) | 一种数据处理方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |