CN116738203A - 时序数据信息价值评估方法及装置 - Google Patents
时序数据信息价值评估方法及装置 Download PDFInfo
- Publication number
- CN116738203A CN116738203A CN202310555476.0A CN202310555476A CN116738203A CN 116738203 A CN116738203 A CN 116738203A CN 202310555476 A CN202310555476 A CN 202310555476A CN 116738203 A CN116738203 A CN 116738203A
- Authority
- CN
- China
- Prior art keywords
- time sequence
- sequence data
- value
- information value
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims abstract description 123
- 239000012634 fragment Substances 0.000 claims abstract description 56
- 238000000034 method Methods 0.000 claims abstract description 31
- 230000011218 segmentation Effects 0.000 claims abstract description 24
- 238000005070 sampling Methods 0.000 claims description 33
- 238000004519 manufacturing process Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 26
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 6
- 238000012952 Resampling Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000005096 rolling process Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种时序数据信息价值评估方法及装置,涉及信息技术领域,其中该方法包括:根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度;根据每一第二时序数据片段对应的多个相似度值,确定第二时序数据片段的特征值;根据每一第二时序数据片段的特征值,得到每一第二时序数据片段的信息价值;根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据的信息价值密度。本发明可以辅助人员快速定位高信息价值时序数据。
Description
技术领域
本发明涉及信息技术领域,尤其涉及时序数据信息价值评估方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
工业数据采集系统需要采集和分析时序数据,分析时,主要是等时间间隔分析,或在等时间间隔基础上进行长度折算,后进行等长度分析。但实际情况是,每个时间段或长度段产生的数据提供的信息价值并不一致,对于没有异常的情况,多数不需要分析,而有异常的情况,在分析时又需要针对长时间的大量数据人工拖动时间轴或长度轴一段一段查找,造成时间浪费,而且效率低下。在实际生产过程中,生产上正常生产的时序数据有其固有模式,而非正常生产的往往模式比较特别,分析时的最佳方式是既能关注连续长时间的整个趋势过程,又能关注异常时段的细节部分,提升分析效率。因此,分析系统在展示数据时应该有所取舍,信息价值高的时间段尽可能展示更多的数据,信息价值低的时间段尽可能展示较少的数据,但如何定义信息价值,目前尚没有统一的方法,尤其是对于工业系统而言,单从数据的角度上分析,并不会得到有效的方法,必须结合实际业务场景,才能发挥时序数据信息价值。目前缺少有效、客观的工业时序数据信息价值评估方法,导致时序数据分析效率低。
发明内容
本发明实施例提供一种时序数据信息价值评估方法,用以准确快速的定位高信息价值的时序数据,提高时序数据分析效率,该方法包括:
根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
根据预先设定的业务分析目标,确定时序数据切分点标志;
根据切分点标志将待分析时序数据分为多个时序数据片段;
针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
本发明实施例还提供一种时序数据信息价值评估装置,用以准确快速的定位高信息价值的时序数据,提高时序数据分析效率,该装置包括:
第一处理模块,用于根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
第二处理模块,用于根据预先设定的业务分析目标,确定时序数据切分点标志;
第三处理模块,用于根据切分点标志将待分析时序数据分为多个时序数据片段;
赋值模块,用于针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
相似度计算模块,用于针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
第四处理模块,用于将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
第五处理模块,用于将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
第六处理模块,用于将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述时序数据信息价值评估方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述时序数据信息价值评估方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述时序数据信息价值评估方法。
本发明实施例中,根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;根据预先设定的业务分析目标,确定时序数据切分点标志;根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。这样根据时序数据的信息价值密度,无论是数据可视化分析,还是异常点搜索,都可以辅助人员快速定位高信息价值时序数据,提升分析效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中提供的一种时序数据信息价值评估方法的流程图;
图2为本发明实施例中提供的一种价值基准模板的示例图;
图3为本发明实施例中提供的一种待分析时序数据的示例图;
图4为本发明实施例中提供的一种将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值的方法流程图;
图5为本发明实施例中提供的一种将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值的方法流程图;
图6为本发明实施例中提供的一种得到待分析时序数据在业务分析目标下的信息价值密度的方法流程图;
图7为本发明实施例中提供的一种时序数据信息价值评估装置的示意图;
图8为本发明实施例中提供的一种计算机设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
在本说明书的描述中,所使用的“包含”、“包括”、“具有”、“含有”等,均为开放性的用语,即意指包含但不限于。参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”等的描述意指结合该实施例或示例描述的具体特征、结构或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。各实施例中涉及的步骤顺序用于示意性说明本申请的实施,其中的步骤顺序不作限定,可根据需要作适当调整。
经研究发现,工业数据采集系统需要采集和分析时序数据,分析时,主要是等时间间隔分析,或在等时间间隔基础上进行长度折算,后进行等长度分析。但实际情况是,每个时间段或长度段产生的数据提供的信息价值并不一致,对于没有异常的情况,多数不需要分析,而有异常的情况,在分析时又需要针对长时间的大量数据人工拖动时间轴或长度轴一段一段查找,造成时间浪费,而且效率低下。在实际生产过程中,生产上正常生产的时序数据有其固有模式,而非正常生产的往往模式比较特别,分析时的最佳方式是既能关注连续长时间的整个趋势过程,又能关注异常时段的细节部分,提升分析效率。因此,分析系统在展示数据时应该有所取舍,信息价值高的时间段尽可能展示更多的数据,信息价值低的时间段尽可能展示较少的数据,但如何定义信息价值,目前尚没有统一的方法,尤其是对于工业系统而言,单从数据的角度上分析,并不会得到有效的方法,必须结合实际业务场景,才能发挥时序数据信息价值。目前缺少有效、客观的工业时序数据信息价值评估方法,导致时序数据分析效率低。
针对上述研究,如图1所示,本发明实施例提供一种时序数据信息价值评估方法,包括:
S101:根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
S102:根据预先设定的业务分析目标,确定时序数据切分点标志;
S103:根据切分点标志将待分析时序数据分为多个时序数据片段;
S104:针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
S105:针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
S106:将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
S107:将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
S108:将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
本发明实施例中,根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;根据预先设定的业务分析目标,确定时序数据切分点标志;根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。这样根据时序数据的信息价值密度,无论是数据可视化分析,还是异常点搜索,都可以辅助人员快速定位高信息价值时序数据,提升分析效率。
下面对上述时序数据信息价值评估方法加以详细说明。
针对上述S101,业务分析目标例如包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度,价值基准模板是正常生产模式时产生的时序数据片段。
具体的,技术人员或行业专家需要在产线或设备出现故障时,根据记录的过程数据曲线,进行分析,以查找故障原因,分析曲线相比于正常生产曲线的偏离程度,就可视为业务分析目标。例如,需要定位活套的故障,其中一个业务分析目标就可以是:“分析棒线材活套带载时高度曲线相比于正常生产时的高度曲线异常状况”。分析该业务目标时,根据切分点,可以切分出需要分析的曲线片段。上述活套带载高度曲线的切分点,是指能够划分活套带载与空载之间的临界点。
再例如:分析某机架轧机转矩带载时的波动情况,将业务分析目标定为分析转矩是否波动过大,超出设计工作范围。切分点就是该机架轧机带载和空载的之间的临界点(带载时,转矩大,空载时,转矩小,可以通过转矩值找到切分点)。
另外,针对同一个分析目标,可以选取多个价值基准模板,例如图2所示,根据业务分析目标选取价值基准模板T1、T2。价值基准模板可以根据实际场景、以及历史经验对正常生产模式时产生的时序数据进行分段选取。
针对上述S102,根据预先设定的业务分析目标,确定时序数据切分点标志,例如图3所示,业务分析目标为分析棒线材活套带载时高度曲线的异常状况,用设备带载与空载的切换点作为切分点标志,即图3中数据从接近0开始迅速上升以及从高位迅速降到接近0的位置。
针对上述S103,待分析时序数据例如为有长周期时序数据X=(X1,X2…Xn),则根据切分标志分为组,片段1为Y1=(X1,X2…X120),片段2为Y2=(X121,X122…X260)等。
此处,片段提取以切分标志为准,切分后的时序数据片段长度(时序数据片段内元素数量)可以相等,也可以不相等。
针对上述S104,如图3所示,根据切分点标志将待分析时序数据分为5组时序数据片段:Y1~Y5,对与业务分析目标无关的第一时序数据片段Y2、Y4,直接赋予信息价值为0,即I2=I4=0,这两段为空载时段曲线,与业务目标要分析的带载时段无关。
针对上述S105,相似度的计算例如可以选用相关系数、欧式距离、模式距离、形状距离、DWT等,对于一些算法需要进行数据预处理,例如包括:升采样或降采样算法,以保证数据片段长度与价值基准模板的数据长度一致。
因此,如图4所示,本发明实施例提供一种将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值的方法,包括:
S401:对每一第二时序数据片段进行采样,得到每一第二时序数据的第一采样数据。
S402:对每一价值基准模板进行采样,得到每一价值基准模板的第二采样数据;其中,第一采样数据的数据长度与第二采样数据的数据长度相等。
S403:计算每一第二时序数据的第一采样数据与每一价值基准模板的第二采样数据之间的相似度。
此外,升采样或降采样算法可选用各种差值、重采样算法。
示例性的,如图3所示的时序数据片段,对与业务分析目标相关的第二时序数据片段Y1、Y3和Y5与价值基准模板T1、T2进行相似度计算,以采用下表1和皮尔逊相关系数计算为例:
表1时序数据片段列表
如表1所示,Y1、Y3、Y5、T1、T2的数据长度均不一致,需要先进行重采样对齐,以保证相同的数据长度。具体执行操作例如包括:Y1’[i]=Y1[int(i*Y1长度/T1长度)]。其中Y1’为Y1重采样后的时序数据片段,Y1’[i]代表,Y1’的第i个元素,int代表括号内取整数,则根据重新采样与模板T1对齐后的Y1、Y3、Y5为Y1’(T1)、Y3’(T1)、Y5’(T1),与模板T2对齐后的Y1、Y3、Y5为Y1’(T2)、Y3’(T2)、Y5’(T2),见表1。对齐后的数据分别与模板T1、T2进行相关性计算。相关计算结果见下表2的T1列和T2列:
表2相关系数、特征值、信息价值表
T1 | T2 | v | I | |
Y1' | 0.95731 | 0.96200 | 0.96200 | 0.055888 |
Y3' | 0.94918 | 0.93099 | 0.94918 | 0.075247 |
Y5' | 0.94929 | 0.93791 | 0.94929 | 0.075081 |
针对上述S106,选取与所有价值基准模板相似度最大的值作为该第二时序数据片段的特征值V,例如,表2的V列。若与业务分析目标相关的时序数据片段有K组,则K组时序片段将有K个特征值,分别为V1,V2…Vk。
针对上述S107,如图5所示,为本发明实施例提供的一种将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值的方法流程图,包括:
S501:对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段的归一化特征值。
具体的,对每一第二时序数据片段的特征值进行归一化处理,折算到0-1区间,得到每一第二时序数据片段的归一化特征值。
S502:对每一第二时序数据片段的归一化特征值取负对数值,得到每一第二时序数据片段在业务分析目标下的信息价值。
例如,可以采用下述公式取负对数值:
其中,Ik代表第k个第二时序数据片段的价值信息,Vk代表第k个第二时序数据片段的特征值,Vmin代表k个第二时序数据片段中最小特征值,Vmax代表k个第二时序数据片段中最大特征值,其中,K为整数。
此外,归一化处理可采用本领域常用算法,对数的底可选,通常为2。
示例性的,以用相关系数计算相似度为例,归一化处理方式可以采用:V大于0,则值不变,V小于0,则值记为0。表2的示例中,所有特征值均大于0,因此可直接取负对数操作,信息价值为表2中I列所示。
针对上述S108,如图6所示,为本发明实施例提供的一种得到待分析时序数据在业务分析目标下的信息价值密度的方法流程图,包括:
S601:将第一时序数据片段的信息价值与第二时序数据片段的信息价值求和,得到待分析时序数据的信息价值总和。
具体的,整个待分析的时序数据针对该业务分析目标的信息价值为所有时序数据片段信息价值的总和:其中,I(p)代表针对p业务分析目标的待分析时序数据的信息价值总和,Im代表第m个时序数据片段(包括:第一时序数据片段、第二时序数据片段)的信息价值,k等于第一时序数据片段与第二时序数据片段的总和。
S602:利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度。
具体的,利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度,包括:其中,I(p)代表待分析时序数据的信息价值总和,n为待分析时序数据长度,f(p)代表待分析时序数据在业务分析目标下的信息价值密度。
示例性的,以表2为例,整个待分析的时序数据针对该业务分析目标的信息价值为所有时序数据片段信息价值的总和:I(P)=I1+I2+I3+I4+I5=0.055888+0+0.075247+0+0.075081=0.206216,则信息价值密度f(p)=0.206216/1606=0.0001284。
此外,为快速定位当前业务中异常数据的位置,可根据各时序数据及时序数据片段的信息价值,快速定位和提取关键数据。
本发明实施例中还提供了一种时序数据信息价值评估装置,如下面的实施例所述。由于该装置解决问题的原理与时序数据信息价值评估方法相似,因此该装置的实施可以参见时序数据信息价值评估方法的实施,重复之处不再赘述。
如图7所示,为本发明实施例提供的一种时序数据信息价值评估装置的示意图,包括:
第一处理模块701,用于根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
第二处理模块702,用于根据预先设定的业务分析目标,确定时序数据切分点标志;
第三处理模块703,用于根据切分点标志将待分析时序数据分为多个时序数据片段;
赋值模块704,用于针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
相似度计算模块705,用于针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
第四处理模块706,用于将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
第五处理模块707,用于将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
第六处理模块708,用于将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
在一种可能的实施方式中,相似度计算模块,具体用于对每一第二时序数据片段进行采样,得到每一第二时序数据的第一采样数据;对每一价值基准模板进行采样,得到每一价值基准模板的第二采样数据;其中,第一采样数据的数据长度与第二采样数据的数据长度相等;计算每一第二时序数据的第一采样数据与每一价值基准模板的第二采样数据之间的相似度。
在一种可能的实施方式中,第五处理模块,具体用于对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段的归一化特征值;对每一第二时序数据片段的归一化特征值取负对数值,得到每一第二时序数据片段在业务分析目标下的信息价值。
在一种可能的实施方式中,第六处理模块,具体用于将第一时序数据片段的信息价值与第二时序数据片段的信息价值求和,得到待分析时序数据的信息价值总和;利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度。
基于前述发明构思,如图8所示,本发明还提出了一种计算机设备800,包括存储器810、处理器820及存储在存储器810上并可在处理器820上运行的计算机程序830,所述处理器820执行所述计算机程序830时实现前述时序数据信息价值评估方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述时序数据信息价值评估方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述时序数据信息价值评估方法。
本发明实施例中,根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;根据预先设定的业务分析目标,确定时序数据切分点标志;根据切分点标志将待分析时序数据分为多个时序数据片段;针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。这样根据时序数据的信息价值密度,无论是数据可视化分析,还是异常点搜索,都可以辅助人员快速定位高信息价值时序数据,提升分析效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (11)
1.一种时序数据信息价值评估方法,其特征在于,包括:
根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
根据预先设定的业务分析目标,确定时序数据切分点标志;
根据切分点标志将待分析时序数据分为多个时序数据片段;
针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
2.如权利要求1所述的时序数据信息价值评估方法,其特征在于,针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,包括:
对每一第二时序数据片段进行采样,得到每一第二时序数据的第一采样数据;
对每一价值基准模板进行采样,得到每一价值基准模板的第二采样数据;其中,第一采样数据的数据长度与第二采样数据的数据长度相等;
计算每一第二时序数据的第一采样数据与每一价值基准模板的第二采样数据之间的相似度。
3.如权利要求1所述的时序数据信息价值评估方法,其特征在于,将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值,包括:
对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段的归一化特征值;
对每一第二时序数据片段的归一化特征值取负对数值,得到每一第二时序数据片段在业务分析目标下的信息价值。
4.如权利要求1所述的时序数据信息价值评估方法,其特征在于,将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度,包括:
将第一时序数据片段的信息价值与第二时序数据片段的信息价值求和,得到待分析时序数据的信息价值总和;
利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度。
5.一种时序数据信息价值评估装置,其特征在于,包括:
第一处理模块,用于根据预先设定的业务分析目标,确定多个价值基准模板;其中,价值基准模板是正常生产模式时产生的时序数据片段,业务分析目标包括:实际生产曲线中任意一个或多个数据指标相比于正常生成曲线中对应数据指标的偏离程度;
第二处理模块,用于根据预先设定的业务分析目标,确定时序数据切分点标志;
第三处理模块,用于根据切分点标志将待分析时序数据分为多个时序数据片段;
赋值模块,用于针对与业务分析目标无关的第一时序数据片段,赋予信息价值为0;
相似度计算模块,用于针对与业务分析目标相关的第二时序数据片段,确定每一第二时序数据片段与每一价值基准模板之间的相似度,得到每一第二时序数据片段对应的多个相似度值;
第四处理模块,用于将每一第二时序数据片段对应的多个相似度值中的最大值确定为每一第二时序数据片段的特征值;
第五处理模块,用于将每一第二时根据对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段在业务分析目标下的信息价值;
第六处理模块,用于将每一第二时根据对每一第二时序数据片段的根据待分析时序数据的数据长度、第一时序数据片段的信息价值、第二时序数据片段的信息价值,得到待分析时序数据在业务分析目标下的信息价值密度。
6.如权利要求5所述的时序数据信息价值评估装置,其特征在于,相似度计算模块,具体用于对每一第二时序数据片段进行采样,得到每一第二时序数据的第一采样数据;
对每一价值基准模板进行采样,得到每一价值基准模板的第二采样数据;其中,第一采样数据的数据长度与第二采样数据的数据长度相等;
计算每一第二时序数据的第一采样数据与每一价值基准模板的第二采样数据之间的相似度。
7.如权利要求5所述的时序数据信息价值评估装置,其特征在于,第五处理模块,具体用于对每一第二时序数据片段的特征值进行归一化处理,得到每一第二时序数据片段的归一化特征值;
对每一第二时序数据片段的归一化特征值取负对数值,得到每一第二时序数据片段在业务分析目标下的信息价值。
8.如权利要求5所述的时序数据信息价值评估装置,其特征在于,第六处理模块,具体用于将第一时序数据片段的信息价值与第二时序数据片段的信息价值求和,得到待分析时序数据的信息价值总和;
利用待分析时序数据的信息价值总和除以待分析时序数据的数据长度,得到待分析时序数据在业务分析目标下的信息价值密度。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4任一所述方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至4任一所述方法。
11.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至4任一所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310555476.0A CN116738203A (zh) | 2023-05-17 | 2023-05-17 | 时序数据信息价值评估方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310555476.0A CN116738203A (zh) | 2023-05-17 | 2023-05-17 | 时序数据信息价值评估方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116738203A true CN116738203A (zh) | 2023-09-12 |
Family
ID=87917756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310555476.0A Pending CN116738203A (zh) | 2023-05-17 | 2023-05-17 | 时序数据信息价值评估方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116738203A (zh) |
-
2023
- 2023-05-17 CN CN202310555476.0A patent/CN116738203A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106780121B (zh) | 一种基于用电负荷模式分析的用电异常识别方法 | |
JP5301717B1 (ja) | 設備状態監視方法およびその装置 | |
JP5342708B1 (ja) | 異常検知方法及びその装置 | |
US10613960B2 (en) | Information processing apparatus and information processing method | |
CN111610407A (zh) | 基于朴素贝叶斯的电缆老化状态评估方法和装置 | |
CN110543907A (zh) | 一种基于微机监测功率曲线的故障分类方法 | |
CN110991527A (zh) | 一种考虑电压曲线平均波动率的相似度阈值确定方法 | |
CN110991985A (zh) | 一种项目进度数据处理方法 | |
CN111444060A (zh) | 异常检测模型训练方法、异常检测方法及相关装置 | |
CN115664038A (zh) | 一种用于电气安全管理的智能配电运维监控系统 | |
Bator et al. | Feature extraction and reduction applied to sensorless drive diagnosis | |
CN116738203A (zh) | 时序数据信息价值评估方法及装置 | |
CN112906113A (zh) | 基于大数据和云计算的建筑主体工程质量安全监理分析预警方法 | |
JP4772613B2 (ja) | 品質解析方法、品質解析装置、コンピュータプログラム、及びコンピュータ読み取り可能な記憶媒体 | |
CN105499282A (zh) | 一种冷轧带钢在线板形分析方法及装置 | |
CN111310121A (zh) | 一种新能源出力概率预测方法和系统 | |
CN107402925B (zh) | 信息推送方法及装置 | |
KR101791947B1 (ko) | 프랙탈 차원 분석에 기반한 주행 평가 방법 및 장치 | |
Herman | Industry specifics of joint-stock companies in Poland and their bankruptcy prediction | |
CN113792749A (zh) | 时间序列数据异常检测方法、装置、设备及存储介质 | |
JP2007122682A (ja) | 故障品類似製品の抽出方法および抽出システム | |
JP2009238190A (ja) | メンテナンス計画支援システム | |
CN116797001B (zh) | 金融行业从业人员的管理系统及方法 | |
CN113409025B (zh) | 一种业务数据提取方法、装置及存储介质 | |
JP2014215715A (ja) | 市場情勢変化分析装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |