CN116975590A - 数据处理方法、装置、程序产品、计算机设备和介质 - Google Patents

数据处理方法、装置、程序产品、计算机设备和介质 Download PDF

Info

Publication number
CN116975590A
CN116975590A CN202211507303.3A CN202211507303A CN116975590A CN 116975590 A CN116975590 A CN 116975590A CN 202211507303 A CN202211507303 A CN 202211507303A CN 116975590 A CN116975590 A CN 116975590A
Authority
CN
China
Prior art keywords
signal
sample
time sequence
target
feature extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211507303.3A
Other languages
English (en)
Inventor
沈雷
王艺霖
张睿欣
丁守鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202211507303.3A priority Critical patent/CN116975590A/zh
Publication of CN116975590A publication Critical patent/CN116975590A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Abstract

本申请公开了一种数据处理方法、装置、程序产品、计算机设备和介质,该方法包括:获取目标时序信号;目标时序信号基于样本时序信号的趋势信号和周期信号得到,样本时序信号由目标业务在第一时段的业务参数值构成;对目标时序信号中的信号值采样得到多个样本;基于多个样本构建样本对;样本对包括正样本对和负样本对,正样本对包含的样本间具有重合的信号值,负样本对包含的样本间不具有重合的信号值;采用样本对训练特征提取网络;训练好的特征提取网络用于提取目标时序信号的信号特征,目标时序信号的信号特征用于预测目标业务在第二时段内的业务参数值,第二时段晚于第一时段。采用本申请,可提高预测目标业务的业务参数值的效率及准确性。

Description

数据处理方法、装置、程序产品、计算机设备和介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、程序产品、计算机设备和介质。
背景技术
在电力系统的工作过程中,通常需要预测电力系统的相关工作参数(如工作温度等),以能及时得知和应对电力系统工作异常的相关情况。
现有应用中,通常是先统计电力系统在当前工作的相关的参数值(即工作参数),并由人工基于统计的参数值来分析预测电力系统在未来某段时间内的相关工作参数,可见,此种预测方式效率低、准确性低。
发明内容
本申请提供了一种数据处理方法、装置、程序产品、计算机设备和介质,可提高预测目标业务的业务参数值的效率以及准确性。
本申请一方面提供了一种数据处理方法,该方法包括:
获取目标时序信号;目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,趋势信号用于表示样本时序信号的信号变化成分,周期信号用于表示样本时序信号的信号平稳成分;
对目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从目标时序信号中采样得到的多个信号值;
基于多个样本构建样本对;样本对包括正样本对和负样本对,一个样本对由两个样本组成,正样本对包含的样本之间具有重合的信号值,负样本对包含的样本之间不具有重合的信号值;
采用样本对训练特征提取网络,得到训练好的特征提取网络;训练好的特征提取网络用于提取目标时序信号的信号特征,目标时序信号的信号特征用于预测目标业务在第二时段内产生的业务参数值,第二时段晚于第一时段。
本申请一方面提供了一种数据处理装置,该装置包括:
获取模块,用于获取目标时序信号;目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,趋势信号用于表示样本时序信号的信号变化成分,周期信号用于表示样本时序信号的信号平稳成分;
采样模块,用于对目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从目标时序信号中采样得到的多个信号值;
构建模块,用于基于多个样本构建样本对;样本对包括正样本对和负样本对,一个样本对由两个样本组成,正样本对包含的样本之间具有重合的信号值,负样本对包含的样本之间不具有重合的信号值;
训练模块,用于采用样本对训练特征提取网络,得到训练好的特征提取网络;训练好的特征提取网络用于提取目标时序信号的信号特征,目标时序信号的信号特征用于预测目标业务在第二时段内产生的业务参数值,第二时段晚于第一时段。
其中,获取模块获取目标时序信号的方式,包括:
获取样本时序信号;
对样本时序信号进行趋势分解处理,得到样本时序信号的趋势信号;
获取样本时序信号与趋势信号之间的差值,并将差值确定为样本时序信号的周期信号;
基于周期信号和趋势信号确定目标时序信号。
其中,获取模块基于周期信号和趋势信号确定目标时序信号的方式,包括:
基于周期信号和趋势信号计算样本时序信号的自相关值;
基于自相关值对周期信号进行加权,得到加权后的周期信号;
基于自相关值对趋势信号进行加权,得到加权后的趋势信号;
对加权后的周期信号和加权后的趋势信号进行拼接处理,得到目标时序信号。
其中,加权后的周期信号和加权后的趋势信号均包含N行信号值,加权后的周期信号中的第i行信号值与加权后的趋势信号中的第i行信号值具有关联关系,i和N均为正整数且i小于或等于N;
获取模块对加权后的周期信号和加权后的趋势信号进行拼接处理,得到目标时序信号的方式,包括:
将加权后的趋势信号中的第i行信号值拼接到加权后的周期信号中第i行信号值的相邻位置处,得到目标时序信号。
其中,获取模块基于周期信号和趋势信号计算样本时序信号的自相关值的方式,包括:
对周期信号和趋势信号进行拼接处理,得到拼接信号;
对拼接信号进行嵌入处理,得到拼接信号的嵌入特征;
对嵌入特征进行自相关计算,得到自相关值。
其中,目标时序信号的各个列用于指示目标时序信号的时间维度;
采样模块对目标时序信号中的信号值进行采样,得到多个样本的方式,包括:
获取时间维度包含的多个时间区间;
分别按照每个时间区间对目标时序信号中的各个列进行采样,得到每个时间区间分别对应的样本;任一时间区间对应的样本包含在任一时间区间内对目标时序信号采样得到的列包含的信号值;
将多个时间区间对应的样本确定为多个样本。
其中,多个时间区间包含第一时间区间和第二时间区间;
构建模块基于多个样本构建样本对的方式,包括:
若第一时间区间和第二时间区间之间具有时间交集,则基于第一时间区间对应的样本和第二时间区间对应的样本构建正样本对;
若第一时间区间和第二时间区间之间不具有时间交集,则基于第一时间区间对应的样本和第二时间区间对应的样本构建负样本对。
其中,训练模块采用样本对训练特征提取网络,得到训练好的特征提取网络的方式,包括:
调用特征提取网络对样本对包含的样本进行特征提取,得到样本对包含的样本的样本特征;
获取正样本对中样本的样本特征之间的第一相似度,并获取负样本对中样本的样本特征之间的第二相似度;
基于第一相似度和第二相似度修正特征提取网络的网络参数,得到训练好的特征提取网络。
其中,训练模块基于第一相似度和第二相似度修正特征提取网络的网络参数,得到训练好的特征提取网络的方式,包括:
基于第一相似度和第二相似度确定特征提取网络的特征提取偏差;
基于特征提取偏差修正特征提取网络的网络参数,得到训练好的特征提取网络;
其中,特征提取偏差用于修正特征提取网络的网络参数,使第一相似度增高,且使第二相似度降低。
其中,上述装置还用于:
调用训练好的特征提取网络提取样本时序信号的信号特征;
调用预测网络基于样本时序信号的信号特征,预测由目标业务在第二时段内产生的业务参数值构成的时序信号;
获取由目标业务在第二时段内产生的业务参数值构成的真实的时序信号;
基于真实的时序信号和预测的时序信号确定预测网络的信号预测偏差;
基于信号预测偏差修正预测网络的网络参数,得到训练好的预测网络。
其中,上述装置还用于:
获取待预测的时序信号;待预测的时序信号是由目标业务在第三时段内产生的业务参数值构成的;
调用训练好的特征提取网络对待预测的时序信号进行特征提取,得到待预测的时序信号的信号特征;
调用训练好的预测网络基于待预测的时序信号的信号特征,预测由目标业务在第四时段内产生的业务参数值构成的时序信号;第四时段晚于第三时段。
其中,上述装置还用于:
获取基准业务参数值;
获取预测的目标业务在第四时段内产生的业务参数值的参考业务参数值;
若参考业务参数值大于基准业务参数值,则对目标业务进行业务预警。
本申请一方面提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行本申请中一方面中的方法。
本申请一方面提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时使该处理器执行上述一方面中的方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述一方面等各种可选方式中提供的方法。
本申请首先可以获取目标时序信号;目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,趋势信号用于表示样本时序信号的信号变化成分,周期信号用于表示样本时序信号的信号平稳成分;接着,可以对目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从目标时序信号中采样得到的多个信号值;进而,基于多个样本构建样本对;样本对包括正样本对和负样本对,一个样本对由两个样本组成,正样本对包含的样本之间具有重合的信号值,负样本对包含的样本之间不具有重合的信号值;最后,采用样本对训练特征提取网络,得到训练好的特征提取网络;训练好的特征提取网络用于提取目标时序信号的信号特征,目标时序信号的信号特征用于预测目标业务在第二时段内产生的业务参数值,第二时段晚于第一时段。由此可见,本申请提出的方法,首先可以通过对样本时序信号进行分解得到的趋势信号和周期信号得到目标时序信号,进而可以通过该目标时序信号构建正负样本对,该正负样本对的构建不仅考虑到了时间维度的特征,更是考虑到了趋势维度的特征(如趋势信号的特征)以及周期维度的特征(如周期信号的特征),因此,通过该正负样本对可以实现对特征提取网络更准确的训练,后续通过训练好的特征提取网络也可以实现对目标时序信号更准确的特征提取(即特征重表示),通过提取得到的目标时序信号准确的信号特征也可以准确快速地实现对目标业务的业务参数值的准确预测。
附图说明
为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种网络架构的结构示意图;
图2是本申请提供的一种训练特征提取网络的场景示意图;
图3是本申请提供的一种数据处理方法的流程示意图;
图4是本申请提供的一种构建正样本对的场景示意图;
图5是本申请提供的一种构建负样本对的场景示意图;
图6是本申请提供的一种解码器的结构示意图;
图7是本申请提供的一种信号获取方法的流程示意图;
图8是本申请提供的一种对信号进行拼接的场景示意图;
图9是本申请提供的一种网络训练方法的流程示意图;
图10是本申请提供的一种数据预测的场景示意图;
图11是本申请提供的一种数据处理的流程示意图;
图12是本申请提供的一种数据处理装置的结构示意图;
图13是本申请提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请涉及到人工智能相关技术。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请中主要涉及到了人工智能中的机器学习。其中,机器学习(MachineLearning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请中所涉及到的机器学习主要指,如何训练得到特征提取网络和预测网络,以通过该特征提取网络和预测网络来预测目标业务的业务参数值,具体可以参见下述图3对应的实施例中的描述。
本申请还涉及到云技术。其中,云技术(Cloud Technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。
本申请中所涉及到的云技术可以指历史时序信号(如样本时序信号)可以是通过“云”进行存储的,后续需要使用时,也可以是通过“云”获取到的。
首先,需要进行说明的是,本申请所采集的所有数据(包括样本时序信号、待预测的时序信号等相关数据)都是在所属对象(如该数据所属的用户、企业或者机构等)同意并授权的情况下进行采集的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
请参见图1,图1是本申请提供的一种网络架构的结构示意图。如图1所示,网络架构可以包括服务器200和终端设备集群,终端设备集群可以包括一个或者多个终端设备,这里将不对终端设备的数量进行限制。如图1所示,多个终端设备具体可以包括终端设备1、终端设备2、终端设备3、…、终端设备n;如图1所示,终端设备1、终端设备2、终端设备3、…、终端设备n均可以与服务器200进行网络连接,以便于每个终端设备可以通过网络连接与服务器200之间进行数据交互。
如图1所示的服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备可以是:智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视、车载终端等智能终端。下面以终端设备1与服务器200之间的通信为例,进行本申请实施例的具体描述。
请一并参见图2,图2是本申请提供的一种训练特征提取网络的场景示意图。如图2所示,服务器200可以获取到样本时序信号,该样本时序信号是由目标业务在第一时段内产生的业务参数值构成,服务器200可以对该样本时序信号进行趋势分解,得到样本时序信号的趋势信号和周期信号,该趋势信号用于表示样本时序信号的信号变化成分,该周期信号用于表示样本时序信号的信号平稳成分。
服务器200可以采用样本时序信号的自相关值对趋势信号进行加权,得到加权后的趋势信号,并可以采用样本时序信号的自相关值对周期信号进行加权,得到加权后的周期信号。
服务器200可以对该加权后的周期信号和加权后的趋势信号进行拼接,以得到目标时序信号,后续,可以对该目标时序信号进行随机采样,采样得到多个样本,通过该多个样本可以构建用于对特征提取网络进行训练的正样本对以及负样本对。通过构建的该正样本对以及负样本对就可以对特征提取网络进行训练,以得到训练好的特征提取网络,训练好的特征提取网络就可以用于提取时序信号(如下述图9中待预测的时序信号)的信号特征,通过该信号特征就可以用于预测目标业务在未来时段(如下述第四时段)产生的业务参数值。
其中,终端设备1可以是相关技术人员的终端设备,服务器200可以将预测的目标业务在未来时段(如下述第四时段)产生的业务参数值发送给终端设备1,使得终端设备1可以输出显示预测的目标业务在未来时段(如下述第四时段)产生的业务参数值,使得相关技术人员就可以对该预测的目标业务在未来时段(如下述第四时段)产生的业务参数值进行分析,看是否有异常,若有异常,则就需要对目标业务进行及时的改善。
其中,计算样本时序信号的自相关值、构建正/负样本对的方式、通过构建的正/负样本对对特征提取网络进行训练的具体过程,可以参见下述图3对应实施例、图7对应实施例、以及图9对应实施例中的相关描述。
本申请中通过对样本时序信号进行趋势分解,后续通过样本时序信号的趋势信号以及周期信号生成目标时序信号,并通过该目标时序信号构建用于对特征提取网络进行训练的正/负样本对,该正/负样本对不仅考虑到了时间维度,还考虑到了趋势信号的特征维度以及周期信号的特征维度,因此,通过构建的该正/负样本对可以实现对特征提取网络的准确训练,后续通过该训练好的特征提取网络也可以实现对时序信号准确的特征提取。
请参见图3,图3是本申请提供的一种数据处理方法的流程示意图。本申请实施例中的执行主体可以是数据处理设备,该数据处理设备可以是由一个或多个计算机设备构成,该计算机设备可以是服务器,也可以是终端设备,或者还可以是其他任意可以进行网络训练以及业务参数值预测的设备。如图3所示,该方法可以包括:
步骤S101,获取目标时序信号;目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,趋势信号用于表示样本时序信号的信号变化成分,周期信号用于表示样本时序信号的信号平稳成分。
具体的,数据处理设备可以获取到目标时序信号,该目标时序信号可以是用于生成对特征提取网络进行训练的样本的时序信号。
其中,目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号、趋势信号和周期信号这三者的信号维度可以是相同的,样本时序信号、趋势信号和周期信号中均可以包含若干个信号值,某个信号中的一个信号值可以是该信号中的一个元素。即可以理解的是,趋势信号中各个位置的信号值与样本时序信号中各个位置的信号值是一一对应,趋势信号中某个位置的信号值与样本时序信号中该个位置的信号值是对应的;同理,周期信号中各个位置的信号值与样本时序信号中各个位置的信号值也是一一对应,周期信号中某个位置的信号值与样本时序信号中该个位置的信号值是对应的。
可以理解为是,通过将样本时序信号分解为趋势信号和周期信号,实现了将样本时序信号中各个位置的信号值分别分解为了趋势信号中相应位置的信号值和周期信号中相应位置的信号值,即样本时序信号中的一个信号值分解为了趋势信号中的一个信号值以及周期信号中的一个信号值这两个信号值。
其中,样本时序信号可以是由目标业务在第一时段内产生的业务参数值构成的,即样本时序信号包含的各个信号值可以是目标业务在第一时段内产生的各个业务参数值。样本时序信号可以是用于训练特征提取网络(用于提取信号的特征)和预测网络(用于通过特征提取网络提取的信号的特征预测目标业务的业务参数值)的历史时序信号,该第一时段可以是属于历史的某个时段,如历史的某个小时、几个小时、或者某天对应的时段,该第一时段的长度(如时长)可以根据实际训练和预测需求确定,对此不做限制。
可选的,上述目标业务可以是电力系统(或者电能系统)的业务,目标业务的业务参数值可以是电力系统工作时产生的工况信息的数值,该工况信息可以是由相应的传感器检测得到的,该工况信息可以包括但不限于电力系统工作过程中的堆芯出口温度和/或冷却管温度等。其中,目标业务可以是任意与时序信号相关的业务(即目标业务在某个时段的业务参数值可以构成时序信号),对此不做限制。
其中,电力系统的工况信息可以有一种或者多种,每种工况信息可以是分别通过对应的传感器采集得到。其中,样本时序信号的信号维度可以是n*d(即n行d列),n表示工况信息的种类数,d表示一种工况信息的维度,即一种工况信息可以对应样本时序信号中的一行信号(该行信号包含对应工况信息的d个数值,即一行信号包含d个业务参数值),具体有多少种工况信息可以根据实际应用场景确定,对此不做限制,不论工况信息有多少种,其训练和预测的原理都是相同的。若工况信息只有一种,则样本时序信号可以只有一行信号,若工况信息有多种,则样本时序信号可以有多行信号。
即目标业务的业务参数值可以有多种,每种业务参数值均可以有若干个(如可以理解为不同种类的工况信息可以对应不同种类的业务参数值),样本时序信号中的各个信号值可以是在第一时段内按照一定的采样时间间隔(如0.5秒、或者1秒等)对目标业务在第一时段内产生的业务参数值进行采样或者检测得到。
举个例子,若样本时序信号只包含一行信号,该行信号为(1,2,3,4,5),采样时间间隔为1秒,则信号值1可以是在第一时段的起始时间的时间点采集(同检测)到的目标业务的业务参数值,信号值2可以是在起始时间后的第1秒的时间点采集到的目标业务的业务参数值,信号值3可以是在起始时间后的第2秒的时间点采集到的目标业务的业务参数值,信号值4可以是在起始时间后的第3秒的时间点采集到的目标业务的业务参数值,信号值5可以是在起始时间后的第4秒的时间点(也可以是第一时段的终止时间的时间点)采集到的目标业务的业务参数值。
可以理解的是,若样本时序信号包含多行信号,则每行信号的信号值的采集方式都是相同的,都如上述的采集方式。
因此,可以理解为,样本时序信号中的各个列表征了样本时序信号的时间维度,该时间维度可以用于指示第一时段的起始时间到第一时段的终止时间的维度,该时间维度可以包含第一时段内各个采样时间点(即采集对应业务参数值的时间点)的维度。
更多的,上述趋势信号可以用于表示样本时序信号的信号变化成分,该趋势信号用于表征样本时序信号中信号值的变化趋势,该趋势信号可以是对样本时序信号进行趋势分解后得到的时序信号。
而上述周期信号可以用于表示样本时序信号的信号平稳成分,该周期信号可以是将样本时序信号减去趋势信号后所得到的时序信号,该周期信号可以理解为是对样本时序信号进行平滑滤波后所得到的时序信号,该周期信号属于样本时序信号中平稳的信号。
上述目标时序信号可以是对样本时序信号加权后的趋势信号和加权后的周期信号进行拼接得到的,拼接后的时间维度可以不变(即列数不变),即目标时序信号的列数可以等于加权后的周期信号的列数,并等于加权后的趋势信号的列数,目标时序信号的行数可以等于加权后的趋势信号的行数和加权后的周期信号的行数之和。具体如何对趋势信号和周期信号进行加权,以及如何对加权后的趋势信号和加权后的周期信号进行拼接以得到目标时序信号的过程,可以参见下述图7对应实施例中的相关描述。
步骤S102,对目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从目标时序信号中采样得到的多个信号值。
具体的,数据处理设备可以对目标时序信号中的信号值进行采样,以根据采样的信号值生成多个样本,任一个样本都可以包含从目标时序信号中采样得到的多个信号值,如下述内容描述。
由于目标时序信号的各个列可以用于指示目标时序信号的时间维度(该时间维度与样本时序信号的时间维度相同),因此,数据处理设备可以获取时间维度包含的多个时间区间,该多个时间区间也可以认为是第一时段包含的时间区间,该多个时间区间的区间大小可以相同也可以不同,各个时间区间的起始时间和终止时间都可以是任意的,该多个时间区间可以是任意设置的多个区间,通过该多个时间区间可以实现对目标时序信号的随机采样。
数据处理设备可以分别按照每个时间区间对目标时序信号中的各个列进行采样,得到每个时间区间分别对应的样本;其中,可以理解为,样本时序信号中的每一列都可以分别对应第一时段内的一个时间点,目标时序信号的列数(即时间维度)与样本时序信号的列数相同,因此,目标时序信号中每一列也都分别对应第一时段内的一个时间点(该时间点可以是采集样本时序信号中对应列的业务参数值的时间点)。
因此,按照任一个时间区间对目标时序信号采样得到的列就可以包含目标时序信号中对应的时间点属于该任一时间区间中的时间点的所有列或者部分列。因此,任一时间区间对应的样本就可以包含通过该任一时间区间在目标时序信号中采样得到的列包含的信号值。
通常情况下,任一时间区间对应的样本可以包含目标时序信号中对应的时间点属于该任一时间区间中的时间点的所有列,使得目标时序信号中更多列的特征可以被采样得到,从而实现对特征提取更为准确和完善的训练。
不过在某些特定的场景下,任一时间区间对应的样本也可以包含目标时序信号中对应的时间点属于该任一时间区间中的时间点的部分列,如该部分列可以是按照特定的列间隔(每隔一列或者两列等),在目标时序信号中对应的时间点属于该任一时间区间中的时间点的所有列中进一步进行采样得到,以此可以降低采样得到的列的维度,从而可以减少训练特征提取网络的计算量,并提高对特征提取网络的计算效率。
通过上述多个时间区间可以实现将第一时段对应的时间维度进行分片,可以理解为降低时间维度的分辨率,在第一时段的各个分片的时间段(即各个时间区间)实现对目标时序信号的采样,得到各个时间区间分别对应的样本,后续,通过在第一时段的各个分片的时间段内采样的样本,也可以实现让特征提取网络对目标时序信号在第一时段的各个分片的时间段内的信号特征的准确学习,这也可以理解为是降低了目标时序信号的信号特征的分辨率,目标时序信号的信号特征的分辨率从目标时序信号的整体的特征降低为了各个分片的时间段内的特征,这可以实现让特征提取网络更好地对目标时序信号在各个分片的时间段内的特征的学习。
上述多个时间区间对应的多个样本(一个时间区间可以对应一个样本)即可以为对目标时序信号中的信号值进行采样得到的多个样本。
步骤S103,基于多个样本构建样本对;样本对包括正样本对和负样本对,一个样本对由两个样本组成,正样本对包含的样本之间具有重合的信号值,负样本对包含的样本之间不具有重合的信号值。
具体的,数据处理设备可以通过上述采样得到的多个样本构建样本对,该样本对可以包括正样本对和负样本对,构建该样本对可以有若干个,若干个样本对中可以包含若干个正样本对和若干个负样本对。正样本对和负样本对的数量可以根据实际应用场景确定,对此不做限制。
其中,一个样本对可以包含上述多个样本中的两个样本,即一个样本对可以由两个样本组成,下述具体说明正/负样本对的构建方式:
上述多个时间区间可以包含第一时间区间和第二时间区间,第一时间区间可以是该多个时间区间中的任意一个时间区间,第二时间区间也可以是该多个时间区间中的任意一个时间区间,第一时间区间和第二时间区间可以不是同一个时间区间,因此,可以理解的是,第一时间区间和第二时间区间可以是该多个时间区间中的任意两个时间区间。
若第一时间区间和第二时间区间之间具有时间交集,即第一时间区间和第二时间区间这两个时间区间具有区间的交集(即重合,可以是部分重合),则可以根据第一时间区间对应的样本和第二时间区间对应的样本构建正样本对。因为通过两个有交集的时间区间采样得到的两个样本可以认为是在差异不大的时间内(即相隔不久或者相同的时间内)采样得到的样本,即该两个样本包含的信号值可以理解为是在相同或相近时间内采集到的,因此,可以通过该两个样本构建正样本对。
同理,若第一时间区间和第二时间区间之间不具有时间交集,即第一时间区间和第二时间区间这两个时间区间不具有区间的交集(即不重合),则可以根据第一时间区间对应的样本和第二时间区间对应的样本构建负样本对。因为通过两个没有交集的时间区间采样得到的两个样本可以认为是在差异较大的时间内(即相隔较久的时间内)采样得到的样本,即该两个样本包含的信号值是在不同或者相隔较远时间内采集到的,因此,可以通过该两个样本构建负样本对。
例如,第一时间区间表示为(a1,b1),a1可以是第一时间区间的起始时间的时间点,b1可以是第一时间区间的终止时间的时间点;第二时间区间表示为(a2,b2),a2可以是第二时间区间的起始时间的时间点,b2可以是第二时间区间的终止时间的时间点。
若a1<a2<b1<b2(其中,<的意思可以是晚于),则表明第一时间区间和第二时间区间具有时间交集,通过第一时间区间对应的样本和第二时间区间对应的样本可以构建正样本对。
若a1<b1<a2<b2,则表明第一时间区间和第二时间区间不具有时间交集,通过第一时间区间对应的样本和第二时间区间对应的样本可以构建负样本对。
因此,可以理解的是,正样本对包含的两个样本之间可以具有重合的信号值,如该重合的信号值包含目标时序信号中该两个样本都包含的列的信号值。反之,负样本对包含的两个样本之间就不具有重合的信号值,即该两个样本之间不具有目标时序信号中相同列的信号值。
请参见图4,图4是本申请提供的一种构建正样本对的场景示意图。目标时序信号可以包含3行信号值,如图4所示,若目标时序信号的前3列信号值对应的时间点处于第一时间区间,目标时序信号的第3列信号值和第4列信号值对应的时间点处于第二时间区间,第一时间区间和第二时间区间具有时间交集,因此,此处可以通过第一时间区间采样得到的样本和通过第二时间区间采样得到的样本,构建正样本对。
同理,请参见图5,图5是本申请提供的一种构建负样本对的场景示意图。目标时序信号可以包含3行信号值,如图5所示,若目标时序信号的前3列信号值对应的时间点处于第一时间区间,目标时序信号的第5列信号值和第6列信号值对应的时间点处于第二时间区间,第一时间区间和第二时间区间不具有时间交集,因此,此处可以通过第一时间区间采样得到的样本和通过第二时间区间采样得到的样本,构建负样本对。
数据处理设备可以通过上述所描述的原理,对采样得到的多个样本进行两两组合,以通过该多个样本构建得到若干个正样本对和若干个负样本对。
步骤S104,采用样本对训练特征提取网络,得到训练好的特征提取网络;训练好的特征提取网络用于提取样本时序信号的信号特征,样本时序信号的信号特征用于预测目标业务在第二时段内产生的业务参数值,第二时段晚于第一时段。
具体的,数据处理设备可以采用上述构建的正负样本对来训练特征提取网络,以修正特征提取网络的网络参数,网络参数修正完成后的特征提取网络即为训练好的特征提取网络。其中,可以通过若干样本时序信号对特征提取网络进行多轮的训练,每一轮的训练原理都可以是上述过程所描述的原理,每一轮的训练原理都是相同的。可选的,直到对特征提取网络训练的轮次达到了某个轮次阈值,或者是对特征提取网络的网络参数修正到收敛状态,则可以认为对特征提取网络训练完成,训练完成的特征提取网络即为训练好的特征提取网络。
其中,采用上述构建的正样本对和负样本对训练特征提取网络的过程可以包括:首先,数据处理设备可以调用特征提取网络对各个样本对(包括正样本对和负样本对)包含的样本进行特征提取,得到各个样本对包含的各个样本的样本特征(即样本的信号特征),一个样本可以有一个样本特征。
可选的,特征提取网络可以包含用于提取时序信号(如样本)的信号特征的特征提取子网络,该特征提取子网络可以是由多个transformer(一种解码器)堆叠而成。
请参见图6,图6是本申请提供的一种解码器的结构示意图。本申请中,transformer解码器可以包含输入层(input feature)、多头注意力机制层、残差连接层(add&norm)、卷积层、另一个残差连接层(add&norm)以及输出层(outpput feature),通过多个transformer解码器的各层网络即可实现对样本的样本特征的提取。
进而,数据处理设备可以获取正样本对中两个样本的样本特征之间的相似度(可以称为第一相似度),并可以获取负样本对中两个样本的样本特征之间的相似度(可以称为第二相似度)。
进而,数据处理设备可以通过该第一相似度和第二相似度来修正特征提取网络的网络参数,包括:数据处理设备可以通过第一相似度和第二相似度生成特征提取网络的特征提取偏差,该特征提取偏差用于指示特征提取网络对样本进行特征提取的偏差。
数据处理设备可以通过该特征提取偏差修正特征提取网络的网络参数,以得到训练好的特征提取网络。其中,该特征提取偏差用于修正特征提取网络的网络参数,使得第一相似度增高(即更高),并使得第二相似度降低(即更低)。
换句话说,通过第一相似度和第二相似度生成的特征提取偏差,用于使得正样本对中样本的样本特征之间的差异更小,并使得负样本对中样本的样本特征之间的差异更大。
可选的,通过任一样本对中样本的样本特征之间的相似度(如第一相似度或第二相似度)可以得到该样本对对应的一个交叉熵损失,进而,通过将各个样本对对应的交叉熵损失进行求和,即可得到上述特征提取偏差,换句话说,上述特征提取偏差可以是对通过各个样本对对应的相似度分别生成的交叉熵损失的加和值。
本申请在训练特征提取网络时,通过修正特征提取网络的网络参数,使得正样本对中两个样本的样本特征之间的相似度更高,并使得负样本对中两个样本的样本特征之间的相似度更低,可以使得特征提取网络对于相同或相近的时序信号(如正样本对中两个相同或相近时间采样得到的样本的时序信号)生成的信号特征(如样本特征)是一致或者相似的,并可以使得特征提取网络对于不同的时序信号(如负样本对中两个相隔较远时间采样得到的样本的时序信号)生成的信号特征(如样本特征)是不同或者差异较大的,采用此种方式,可以使得特征提取网络能够对时序信号进行更准确的特征表征(即特征表示),也就是使得特征提取网络可以对时序信号进行更准确的特征提取。
上述训练好的特征提取网络就可以用于提取样本时序信号的信号特征,提取的该样本时序信号的信号特征就可以用于预测由目标业务在第二时段内产生的业务参数值构成的时序信号,该预测的时序信号中就包含预测的目标业务在第二时段内产生的业务参数值。
其中,该预测的时序信号的维度可以与样本时序信号的维度是相同的,第二时段的时长可以与第一时段的时长相同,第二时段晚于第一时段,第二时段可以是第一时段之后的相邻的一个时段。例如,第一时段是某个小时的时段,则第二时段可以是该小时后的一小时的时段。
其中,具体如何预测由目标业务在第二时段内产生的业务参数值构成的时序信号的过程可以参见下述图9对应实施例中的相关描述。
本申请首先可以获取目标时序信号;目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,趋势信号用于表示样本时序信号的信号变化成分,周期信号用于表示样本时序信号的信号平稳成分;接着,可以对目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从目标时序信号中采样得到的多个信号值;进而,基于多个样本构建样本对;样本对包括正样本对和负样本对,一个样本对由两个样本组成,正样本对包含的样本之间具有重合的信号值,负样本对包含的样本之间不具有重合的信号值;最后,采用样本对训练特征提取网络,得到训练好的特征提取网络;训练好的特征提取网络用于提取目标时序信号的信号特征,目标时序信号的信号特征用于预测目标业务在第二时段内产生的业务参数值,第二时段晚于第一时段。由此可见,本申请提出的方法,首先可以通过对样本时序信号进行分解得到的趋势信号和周期信号得到目标时序信号,进而可以通过该目标时序信号构建正负样本对,该正负样本对的构建不仅考虑到了时间维度的特征,更是考虑到了趋势维度的特征(如趋势信号的特征)以及周期维度的特征(如周期信号的特征),因此,通过该正负样本对可以实现对特征提取网络更准确的训练,后续通过训练好的特征提取网络也可以实现对目标时序信号更准确的特征提取(即特征重表示),通过提取得到的目标时序信号准确的信号特征也可以准确地实现对目标业务的业务参数值的准确预测。
请参见图7,图7是本申请提供的一种信号获取方法的流程示意图。本申请实施例中的执行主体也可以是数据处理设备。如图7所示,该方法可以包括:
步骤S201,获取样本时序信号。
具体的,数据处理设备可以获取到样本时序信号,该样本时序信号可以是预先采集并存储到数据库中的,数据处理设备可以是在该数据库中获取的该样本时序信号。对样本时序信号的相关描述还可以参见上述图3对应实施例中的相关描述。
步骤S202,对样本时序信号进行趋势分解处理,得到样本时序信号的趋势信号。
具体的,对数据处理设备可以对样本时序信号进行趋势分解处理,以得到样本时序信号的趋势信号。
可选的,特征提取网络可以包含分解网络,该分解网络可以是特征提取网络的输入层,数据处理设备可以通过该分解网络对样本时序信号进行趋势分解,该过程可以是:分解网络可以包含Padding层(填充层,用于增加信号边缘的信号值)和avgpooling层(平均池化层),因此,数据处理设备可以先通过Padding层对样本时序信号进行边缘填充,进而,可以再通过avgpooling层对边缘填充后的样本时序信号进行平均池化,即可得到样本时序信号的趋势信号。如下述公式(1)所示:
Xt =avgpooling(Padding(X)) (1)
其中,X表示样本时序信号,Xt表示趋势信号。
步骤S203,获取样本时序信号与趋势信号之间的差值,并将差值确定为样本时序信号的周期信号。
具体的,数据处理设备可以获取样本时序信号减去趋势信号的差值,并可以将该差值作为样本时序信号的周期信号。如下述公式(2)所示:
Xs=X-Xt (2)
其中,Xs表示周期信号,X表示样本时序信号,Xt表示趋势信号。
步骤S204,基于周期信号和趋势信号确定目标时序信号。
具体的,数据处理设备可以通过周期信号和趋势信号来计算样本时序信号的自相关值,该自相关值可以是矩阵,该自相关值的维度可以与样本时序信号的维度相同,可以理解为,该自相关值包含样本时序信号中各个位置上的信号值分别对应的权重值。
可选的,通过周期信号和趋势信号计算自相关值的过程可以包括:
首先,数据处理设备可以对周期信号和趋势信号进行拼接处理,可以将对周期信号和趋势信号进行拼接处理后得到的信号称之为是拼接信号。其中,对周期信号和趋势信号进行拼接的方法可以是:分别对周期信号和趋势信号中的每行信号进行拼接,如可以依次拼接周期信号的第1行信号、趋势信号的第1行信号、周期信号的第2行信号、趋势信号的第2行信号、周期信号的第3行信号、趋势信号的第3行信号、…、周期信号的最后一行信号、趋势信号的最后一行信号,得到的拼接信号的第1行信号就是周期信号的第1行信号、拼接信号的第2行信号就是趋势信号的第1行信号、拼接信号的第3行信号就是周期信号的第2行信号、拼接信号的第4行信号就是趋势信号的第2行信号、…、拼接信号的倒数第2行信号就是周期信号的最后1行信号、拼接信号的最后1行信号就是趋势信号的最后1行信号。
可以理解为,周期信号中的每行信号与趋势信号中对应位置(如行数相同)的每行信号具有关联关系,可以将周期信号和趋势信号中具有关联关系的行拼接在一起,后续也可以更好地关联学习到周期信号和趋势信号中各个相同位置上的信号值的特征。如周期信号中第1行第1列的位置与趋势信号中第1行第1列的位置是相同的,以此类推。
进而,数据处理设备还可以对拼接信号进行嵌入处理,得到拼接信号的嵌入特征。如分解网络还可以包含全连接层,数据处理设备可以将拼接信号输入全连接层,即可得到拼接信号的嵌入特征(embedding)。
数据处理设备可以对该嵌入特征进行自相关计算,即可得到上述自相关值。其中,可以采用自注意力机制的原理对嵌入特征进行自相关计算,自注意力机制可以包含3个权重,该3个权重分别是Wq、Wk、Wv。其中,Wq、Wk、Wv是自定义的3个矩阵,Wq、Wk、Wv用于对嵌入特征进行不同的线性变换,通过对嵌入特征进行不同的线性变换,以实现对嵌入特征中的特征进行传递的目的,Wq、Wk、Wv也属于分解网络的网络参数,在训练特征提取网络时,该3个权重也会进行训练。
可以分别将拼接信号的嵌入特征乘以该3个权重,得到3个值Q、K、V,Q表示嵌入特征与权重Wq的乘积,K表示嵌入特征与权重Wk的乘积,V表示嵌入特征与权重Wv的乘积。可以将自相关值表示为Auto-correlation,因此,Auto-correlation可以如下述公式所示:
Auto-correlation=softmax(QKT)V (3)
其中,softmax表示归一化指数函数,softmax包含在分解网络的归一化层。KT表示K的转置。
通过上述过程即计算得到了自相关值。在对特征提取网络进行训练时,也会修正分解网络的网络参数(包括上述全连接层的网络参数、归一化层的网络参数、填充层的网络参数、平均池化层的网络参数、上述3个权重等),使得特征提取网络可以对时序信号进行更准确地趋势分解,以及计算更准确的自相关值。
数据处理设备可以采用上述计算得到的自相关值对周期信号进行加权,得到加权后的周期信号。周期信号和自相关值的维度是相同的,自相关值中可以包含对周期信号中各个位置的信号值进行加权的权重,采用自相关值对周期信号进行加权即为采用自相关值中各个位置上的权重分别对周期信号中对应位置(如相同位置)上的信号值相乘,以得到加权后的周期信号。
同理,数据处理设备可以采用上述计算得到的自相关值对趋势信号进行加权,得到加权后的趋势信号。趋势信号和自相关值的维度是相同的,自相关值中可以包含对趋势信号中各个位置的信号值进行加权的权重(该权重与对周期信号中信号值进行加权的权重相同),采用自相关值对趋势信号进行加权即为采用自相关值中各个位置上的权重分别对趋势信号中对应位置(如相同位置)上的信号值相乘,以得到加权后的趋势信号。
进而,数据处理设备可以对加权后的周期信号和加权后的趋势信号进行拼接处理,对加权后的周期信号和加权后的趋势信号进行拼接处理后得到的信号即为上述目标时序信号。
其中,对加权后的周期信号和加权后的趋势信号进行拼接处理的方式可以包括:对加权后的周期信号和加权后的趋势信号进行拼接处理的方式可以与上述对周期信号和趋势信号进行拼接以得到拼接信号的方式相同,如都对加权后的周期信号中的每行信号与加权后的趋势信号中的每行信号进行交叉拼接,如下述内容描述。
加权后的周期信号的维度和加权后的趋势信号的维度是相同的,加权后的周期信号和加权后的趋势信号均包含N行信号值(即N行信号),加权后的周期信号中第i行信号值与加权后的趋势信号中第i行信号值可以具有关联关系,加权后的周期信号中的第i行信号值与加权后的趋势信号中的第i行信号值是对样本时序信号中第i行信号值进行分解后加权得到。i和N均为正整数,且i小于N,即第i行信号值可以是N行信号值中的任意一行信号值。
数据处理设备可以将加权后的趋势信号中的第i行信号值拼接到加权后的周期信号中第i行信号值的相邻位置处(如拼接到加权后的周期信号中第i行信号值的后一行信号值处),通过将加权后的趋势信号中的每行信号值与加权后的周期信号中的每行信号值都按照此种原理进行拼接,即可得到目标时序信号。
目标时序信号的第1行信号就是加权后的周期信号的第1行信号、目标时序信号的第2行信号就是加权后的趋势信号的第1行信号、目标时序信号的第3行信号就是加权后的周期信号的第2行信号、目标时序信号的第4行信号就是加权后的趋势信号的第2行信号、…、目标时序信号的倒数第2行信号就是加权后的周期信号的最后1行信号、目标时序信号的最后1行信号就是加权后的趋势信号的最后1行信号。目标时序信号的行数就等于加权后的周期信号的行数与加权后的趋势信号的行数之和,目标时序信号的列数等于加权后的周期信号的列数,并等于加权后的趋势信号的列数。目标时序信号的时间维度与样本时序信号的时间维度是相同的,因为加权后的趋势信号的时间维度与加权后的周期信号的时间维度也都与样本时序信号的时间维度相同。
请参见图8,图8是本申请提供的一种对信号进行拼接的场景示意图。如图8所示,加权后的周期信号可以包含3行信号值,加权后的趋势信号也可以包含3行信号值,可以对加权后的周期信号和加权后的趋势信号按照行进行交叉拼接,即可得到目标时序信号。该目标时序信号的第1行信号值就为加权后的周期信号的第1行信号值,该目标时序信号的第2行信号值就为加权后的趋势信号的第1行信号值,该目标时序信号的第3行信号值就为加权后的周期信号的第2行信号值,该目标时序信号的第4行信号值就为加权后的趋势信号的第2行信号值,该目标时序信号的第5行信号值就为加权后的周期信号的第3行信号值,该目标时序信号的第6行信号值就为加权后的趋势信号的第3行信号值。
通过将加权后的周期信号和加权后的趋势信号中具有关联关系的行拼接在一起,后续也可以更好地关联学习到加权后的周期信号和加权后的趋势信号中各个相同位置上的信号值的特征。如加权后的周期信号中第1行第1列的位置与加权后的趋势信号中第1行第1列的位置是相同的,以此类推。
通过上述过程得到的目标时序信号,同时考虑到了样本时序信号的趋势信号和周期信号,并且,是保持目标时序信号的时间维度与样本时序信号的时间维度是相同的,后续通过该目标时序信号也可以更好地对特征提取网络进行训练,如通过该目标时序信号采样得到的样本,不仅考虑到了时间维度(如不同时间区间的样本)的特征,还考虑到了样本时序信号的趋势信号的维度的特征以及样本时序信号的周期信号的维度的特征等多维度的特征,使得特征提取网络在被训练时,可以同时充分地学习到样本时序信号的趋势信号的特征、周期信号的特征、以及不同时间分片(如不同时间区间)上信号的特征,因此,后续通过该目标时序信号进行训练的特征提取网络也可以更准确地对时序信号的信号特征进行提取。
请参见图9,图9是本申请提供的一种网络训练方法的流程示意图。本申请实施例中的执行主体也可以是数据处理设备。如图9所示,该方法可以包括:
步骤S301,调用训练好的特征提取网络提取样本时序信号的信号特征。
具体的,在得到训练好的特征提取网络后,数据处理设备可以将样本时序信号输入训练好的特征提取网络,以调用训练好的特征提取网络提取样本时序信号的信号特征,该过程可以如下内容描述。
数据处理设备首先可以调用训练好的特征提取网络中的分解网络,对样本时序信号进行趋势分解后进行加权,以得到样本时序信号的加权时序信号,其中,通过样本时序信号得到加权时序信号的原理与通过样本时序信号得到目标时序信号的原理相同,只是目标时序信号是采用未训练完成的特征提取网络得到的,而加权时序信号是采用训练好的特征提取网络得到的。
进而,特征提取网络即可对该加权时序信号进行特征提取,即可得到样本时序信号的信号特征(也可以称之为是加权时序信号的信号特征)。特征提取网络对加权时序信号进行特征提取的原理与上述特征提取网络对样本进行特征提取的原理相同。
步骤S302,调用预测网络基于样本时序信号的信号特征,预测由目标业务在第二时段内产生的业务参数值构成的时序信号。
具体的,数据处理设备可以将上述提取得到的样本时序信号的信号特征输入预测网络,以调用预测网络基于该样本时序信号的信号特征,预测由目标业务在第二时段内产生的业务参数值构成的时序信号。该第二时段可以是与第一时段的时长相同且处于第一时段后面相邻的时段。
可选的,该预测网络是用于预测由目标业务的业务参数值构成的时序信号的网络,该预测网络可以是回归网络。
可选的,该回归网络可以是长短期记忆网络(LSTM,Long Short-Term Memory)。其中,LSTM是一种针对时间序列和序列问题的RNN网络(循环神经网络),LSTM通过引入输入门、遗忘门、单元候选门、输出门等可以控制信息流的功能,从而减少因长序列梯度消失而对时间步长较远处的信息的遗忘,从而可以实现对长时间序列信息的高效抓取与记忆。因此,通过将预测网络配置为LSTM,可以有效预测由目标业务的业务参数值构成的时序信号。
步骤S303,获取由目标业务在第二时段内产生的业务参数值构成的真实的时序信号。
具体的,数据处理设备可以获取由目标业务在第二时段内产生的业务参数值构成的真实的时序信号,该真实的时序信号就包含目标业务在第二时段内真实产生的业务参数值,该真实的时序信号的维度与样本时序信号的维度可以是相同的。
其中,该真实的时序信号的采集方式可以与该样本时序信号的采集方式相同,具体如何采集可以参见上述图3对应实施例中的相关描述。
步骤S304,基于真实的时序信号和预测的时序信号确定预测网络的信号预测偏差。
具体的,数据处理设备可以基于真实的时序信号与预测的时序信号来生成预测网络针对预测的时序信号的预测偏差(可以称为信号预测偏差),该信号预测偏差用于表征真实的时序信号与预测的时序信号之间的信号差异,该信号预测偏差可以是通过真实的时序信号与预测的时序信号得到的交叉熵损失。
步骤S305,基于信号预测偏差修正预测网络的网络参数,得到训练好的预测网络。
具体的,数据处理设备可以通过该信号预测偏差来修正预测网络的网络参数,得到训练好的预测网络。
其中,在通过信号预测偏差来修正预测网络的网络参数的目标,就是修正预测网络的网络参数,使得信号预测偏差达到最小值,也就使得真实的时序信号与预测的时序信号之间的差异最小。
可选的,可以通过若干样本时序信号和各个样本时序信号关联的真实的时序信号对预测网络进行多轮的训练,每一轮的训练原理都可以是上述过程所描述的原理,每一轮的训练原理都是相同的。可选的,直到对预测网络训练的轮次达到了某个轮次阈值,或者是对预测网络的网络参数修正到收敛状态,则可以认为对预测网络训练完成,训练完成的预测网络即为训练好的预测网络。
其中,需要进行说明的是,第一时段和第二时段属于一个相对的概念,不同的样本时序信号可以对应不同的第一时段,不同的样本时序信号关联的真实的时序信号也可以对应不同的第二时段,只要样本时序信号对应的第一时段与该样本时序信号关联的真实的时序信号对应的第二时段,具有预设的时段关系即可,如该预设的时段关系可以是第一时段的时长和第二时段的时长相同,且第二时段是第一时段后面的一个时段即可,如第一时段是9点到10点的时段,第二时段可以是10点到11点的时段。
其中,对预测网络训练完成,得到训练好的预测网络后,就可以通过上述训练好的特征提取网络以及训练好的预测网络实现对目标业务在某个时段的业务参数值的预测,如下述内容描述。
数据处理设备可以获取待预测的时序信号,该待预测的时序信号可以是由目标业务在第三时段内产生的业务参数值构成的,该待预测的时序信号的维度可以与样本时序信号的维度相同。该待预测的时序信号的采集方式可以与样本时序信号的采集方式相同。
该第三时段可以是当前最新时间的前一个时段,即待预测的时序信号可以是当前最近的一个历史时序信号。如当前时间是9点,该第三时段可以是8点到9点。
数据处理设备可以将该待预测的时序信号输入特征提取网络,调用特征提取网络对该待预测的时序信号进行特征提取,以得到该待预测的时序信号的信号特征。其中,特征提取网络对该待预测的时序信号进行特征提取,以得到待预测的时序信号的信号特征的原理,与上述特征提取网络对样本时序信号进行特征特征提取,以得到样本时序信号的信号特征(即加权时序信号的信号特征)的原理相同。
进而,数据处理设备可以将通过特征提取网络提取的待预测的时序信号的信号特征输入训练好的预测网络,以调用训练好的预测网络基于该待预测的时序信号的信号特征,预测由目标业务在第四时段内产生的业务参数值构成的时序信号,预测的该时序信号就包含训练好的预测网络预测的目标业务在第四时段内产生的业务参数值,预测的该时序信号的维度可以与待预测的时序信号的维度相同。该第四时段可以是第三时段后的一个时段,第四时段与第三时段之间的关系和第一时段与第二时段之间的关系相同。如第三时段的时长可以与第四时段的时长相同,且第四时段是第三时段后相邻的一个时段。例如,当前时间是9点,该第三时段可以是8点到9点,第四时段可以是9点到10点。
上述预测的由目标业务在第四时段内产生的业务参数值构成的时序信号,即为预测的未来一段时间内目标业务在第四时段的各个时间点可能产生的业务参数值。
请参见图10,图10是本申请提供的一种数据预测的场景示意图。如图10所示,首先,可以将待预测的时序信号输入训练好的特征提取网络,以提取得到待预测的时序信号的信号特征。
进而,可以将待预测的时序信号的信号特征输入训练好的预测网络,通过训练好的预测网络即可预测得到由目标业务在第四时段产生的业务参数值构成的时序信号。
可选的,数据处理设备可以获取基准业务参数值,基准业务参数值可以是预设的目标业务在一个时段内业务参数值的数值变化的最大方差值。
数据处理设备还可以获取预测的目标业务在第四时段内产生的各个业务参数值之间的方差值(可以称为参考业务参数值),该方差值可以用于表征预测的目标业务在第四时段内产生的各个业务参数值之间的变化幅度,方差值越大,变化幅度越大,方差值越小,变化幅度越小。
进而,数据处理设备可以对该参考业务参数值与基准业务参数值进行比对,若该参考业务参数值小于或等于基准业务参数值,则认为预测的目标业务在第四时段内产生的各个业务参数值之间的变化是合理的,无需对目标业务进行业务预警。
而若参考业务参数值大于基准业务参数值,则认为预测的目标业务在第四时段内产生的各个业务参数值之间的变化是不合理的(是异常的),此时数据处理设备可以对该目标业务进行业务预警,如输出针对该目标业务的预警提示信息(也可以是发送给技术人员的设备,由技术人员的设备输出该预警提示信息),以通过该预测提示信息对相关技术人员进行目标业务的业务预警,技术人员可以通过数据处理设备的预警对目标业务进行分析和评估,并对目标业务进行及时的调整和改善。
或者,数据处理设备可以输出上述预测的由目标业务在第四时段内产生的业务参数值构成的时序信号供相关技术人员参考和分析,也可以是将预测的该时序信号发送给技术人员的设备进行输出,若技术人员分析和发现预测的目标业务在第四时段内产生的业务参数值有异常,则可以及时对目标业务进行相应的调整。
例如,目标业务是电力系统的业务,预测的目标业务在第四时段内产生的业务参数值包括预测的电力系统在第四时段内堆芯出口温度,若该堆芯出口温度变化异常,如从一个较小的值跳变到一个很大的值,就认为电力系统在堆芯出口温度的变化情况是异常的,此时相关技术人员可以采取相应得到措施来及时降低电力系统的堆芯出口温度。
通过上述过程,即采用训练好的特征提取网络和训练好的预测网络通过待预测的时序信号,对目标业务在第四时段内产生的各个业务参数值进行了准确的预测。
请参见图11,图11是本申请提供的一种数据处理的流程示意图。如图11所示,该流程可以包括:
s1:数据处理设备可以采集得到电力系统的工况信息,并通过该工况信息生成对应的样本时序信号。
S2:数据处理设备可以采用特征提取网络中的深度分解模块(即上述分解网络),对由电力系统的工况信息构成的样本时序信号进行趋势分解,以得到样本时序信号的趋势信号,并可以将该样本时序信号减去该趋势信号,即可得到样本时序信号的周期信号。
后续,可以通过趋势信号和周期信号计算样本时序信号的自相关值,通过该自相关值可以分别对趋势信号和周期信号进行加权,即可得到加权后的趋势信号和加权后的周期信号。
对加权后的趋势信号和加权后的周期信号进行拼接,即可得到目标时序信号。
S3:数据处理设备可以通过该目标时序信号进行采样,以构建用于对特征提取网络进行训练的正/负样本对,通过该正/负样本对对特征提取网络进行训练,训练完成后,可以得到训练好的特征提取网络。
S4:后续,就可以通过训练好的特征提取网络提取历史工况信息(如样本时序信号)的表征(即信号特征)。
S5:通过提取得到的历史工况信息的表征就可以训练回归网络(即预测网络),得到训练好的回归网络。
S6:通过训练好的回归网络即可对时序信号(如上述待预测的时序信号)预测得到工况信息预测结果(如由目标业务在第四时段的业务参数值构成的时序信号)。
本申请提出的方法,首先可以通过对样本时序信号进行分解得到的趋势信号和周期信号得到目标时序信号,进而可以通过该目标时序信号构建正负样本对,该正负样本对的构建不仅考虑到了时间维度的特征,更是考虑到了趋势维度的特征(如趋势信号的特征)以及周期维度的特征(如周期信号的特征),因此,通过该正负样本对可以实现对特征提取网络更准确的训练,后续通过训练好的特征提取网络也可以实现对目标时序信号更准确的特征提取(即特征重表示),通过提取得到的目标时序信号准确的信号特征也可以准确地实现对目标业务的业务参数值的准确预测。
请参见图12,图12是本申请提供的一种数据处理装置的结构示意图。该数据处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如该数据处理装置为一个应用软件,该数据处理装置可以用于执行本申请实施例提供的方法中的相应步骤。如图12所示,该数据处理装置1可以包括:获取模块11、采样模块12、构建模块13和训练模块14。
获取模块11,用于获取目标时序信号;目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,趋势信号用于表示样本时序信号的信号变化成分,周期信号用于表示样本时序信号的信号平稳成分;
采样模块12,用于对目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从目标时序信号中采样得到的多个信号值;
构建模块13,用于基于多个样本构建样本对;样本对包括正样本对和负样本对,一个样本对由两个样本组成,正样本对包含的样本之间具有重合的信号值,负样本对包含的样本之间不具有重合的信号值;
训练模块14,用于采用样本对训练特征提取网络,得到训练好的特征提取网络;训练好的特征提取网络用于提取目标时序信号的信号特征,目标时序信号的信号特征用于预测目标业务在第二时段内产生的业务参数值,第二时段晚于第一时段。
其中,获取模块11获取目标时序信号的方式,包括:
获取样本时序信号;
对样本时序信号进行趋势分解处理,得到样本时序信号的趋势信号;
获取样本时序信号与趋势信号之间的差值,并将差值确定为样本时序信号的周期信号;
基于周期信号和趋势信号确定目标时序信号。
其中,获取模块11基于周期信号和趋势信号确定目标时序信号的方式,包括:
基于周期信号和趋势信号计算样本时序信号的自相关值;
基于自相关值对周期信号进行加权,得到加权后的周期信号;
基于自相关值对趋势信号进行加权,得到加权后的趋势信号;
对加权后的周期信号和加权后的趋势信号进行拼接处理,得到目标时序信号。
其中,加权后的周期信号和加权后的趋势信号均包含N行信号值,加权后的周期信号中的第i行信号值与加权后的趋势信号中的第i行信号值具有关联关系,i和N均为正整数且i小于或等于N;
获取模块11对加权后的周期信号和加权后的趋势信号进行拼接处理,得到目标时序信号的方式,包括:
将加权后的趋势信号中的第i行信号值拼接到加权后的周期信号中第i行信号值的相邻位置处,得到目标时序信号。
其中,获取模块11基于周期信号和趋势信号计算样本时序信号的自相关值的方式,包括:
对周期信号和趋势信号进行拼接处理,得到拼接信号;
对拼接信号进行嵌入处理,得到拼接信号的嵌入特征;
对嵌入特征进行自相关计算,得到自相关值。
其中,目标时序信号的各个列用于指示目标时序信号的时间维度;
采样模块12对目标时序信号中的信号值进行采样,得到多个样本的方式,包括:
获取时间维度包含的多个时间区间;
分别按照每个时间区间对目标时序信号中的各个列进行采样,得到每个时间区间分别对应的样本;任一时间区间对应的样本包含在任一时间区间内对目标时序信号采样得到的列包含的信号值;
将多个时间区间对应的样本确定为多个样本。
其中,多个时间区间包含第一时间区间和第二时间区间;
构建模块13基于多个样本构建样本对的方式,包括:
若第一时间区间和第二时间区间之间具有时间交集,则基于第一时间区间对应的样本和第二时间区间对应的样本构建正样本对;
若第一时间区间和第二时间区间之间不具有时间交集,则基于第一时间区间对应的样本和第二时间区间对应的样本构建负样本对。
其中,训练模块14采用样本对训练特征提取网络,得到训练好的特征提取网络的方式,包括:
调用特征提取网络对样本对包含的样本进行特征提取,得到样本对包含的样本的样本特征;
获取正样本对中样本的样本特征之间的第一相似度,并获取负样本对中样本的样本特征之间的第二相似度;
基于第一相似度和第二相似度修正特征提取网络的网络参数,得到训练好的特征提取网络。
其中,训练模块14基于第一相似度和第二相似度修正特征提取网络的网络参数,得到训练好的特征提取网络的方式,包括:
基于第一相似度和第二相似度确定特征提取网络的特征提取偏差;
基于特征提取偏差修正特征提取网络的网络参数,得到训练好的特征提取网络;
其中,特征提取偏差用于修正特征提取网络的网络参数,使第一相似度增高,且使第二相似度降低。
其中,上述装置1还用于:
调用训练好的特征提取网络提取样本时序信号的信号特征;
调用预测网络基于样本时序信号的信号特征,预测由目标业务在第二时段内产生的业务参数值构成的时序信号;
获取由目标业务在第二时段内产生的业务参数值构成的真实的时序信号;
基于真实的时序信号和预测的时序信号确定预测网络的信号预测偏差;
基于信号预测偏差修正预测网络的网络参数,得到训练好的预测网络。
其中,上述装置1还用于:
获取待预测的时序信号;待预测的时序信号是由目标业务在第三时段内产生的业务参数值构成的;
调用训练好的特征提取网络对待预测的时序信号进行特征提取,得到待预测的时序信号的信号特征;
调用训练好的预测网络基于待预测的时序信号的信号特征,预测由目标业务在第四时段内产生的业务参数值构成的时序信号;第四时段晚于第三时段。
其中,上述装置1还用于:
获取基准业务参数值;
获取预测的目标业务在第四时段内产生的业务参数值的参考业务参数值;
若参考业务参数值大于基准业务参数值,则对目标业务进行业务预警。
根据本申请的一个实施例,图3所示的数据处理方法所涉及的步骤可由图12所示的数据处理装置1中的各个模块来执行。例如,图3中所示的步骤S101可由图12中的获取模块11来执行,图3中所示的步骤S102可由图12中的采样模块12来执行;图3中所示的步骤S103可由图12中的构建模块13来执行,图3中所示的步骤S104可由图12中的训练模块14来执行。
本申请首先可以获取目标时序信号;目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,趋势信号用于表示样本时序信号的信号变化成分,周期信号用于表示样本时序信号的信号平稳成分;接着,可以对目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从目标时序信号中采样得到的多个信号值;进而,基于多个样本构建样本对;样本对包括正样本对和负样本对,一个样本对由两个样本组成,正样本对包含的样本之间具有重合的信号值,负样本对包含的样本之间不具有重合的信号值;最后,采用样本对训练特征提取网络,得到训练好的特征提取网络;训练好的特征提取网络用于提取目标时序信号的信号特征,目标时序信号的信号特征用于预测目标业务在第二时段内产生的业务参数值,第二时段晚于第一时段。由此可见,本申请提出的装置,首先可以通过对样本时序信号进行分解得到的趋势信号和周期信号得到目标时序信号,进而可以通过该目标时序信号构建正负样本对,该正负样本对的构建不仅考虑到了时间维度的特征,更是考虑到了趋势维度的特征(如趋势信号的特征)以及周期维度的特征(如周期信号的特征),因此,通过该正负样本对可以实现对特征提取网络更准确的训练,后续通过训练好的特征提取网络也可以实现对目标时序信号更准确的特征提取(即特征重表示),通过提取得到的目标时序信号准确的信号特征也可以准确地实现对目标业务的业务参数值的准确预测。
根据本申请的一个实施例,图12所示的数据处理装置1中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由多个单元来实现,或者多个模块的功能由一个单元实现。在本申请的其它实施例中,数据处理装置1也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。
根据本申请的一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理元件和存储元件的例如计算机的通用计算机设备上运行能够执行如图3中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图12中所示的数据处理装置1,以及来实现本申请实施例的数据处理方法。上述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
请参见图13,图13是本申请提供的一种计算机设备的结构示意图。如图13所示,计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图13所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图13所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取目标时序信号;目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,趋势信号用于表示样本时序信号的信号变化成分,周期信号用于表示样本时序信号的信号平稳成分;
对目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从目标时序信号中采样得到的多个信号值;
基于多个样本构建样本对;样本对包括正样本对和负样本对,一个样本对由两个样本组成,正样本对包含的样本之间具有重合的信号值,负样本对包含的样本之间不具有重合的信号值;
采用样本对训练特征提取网络,得到训练好的特征提取网络;训练好的特征提取网络用于提取样本时序信号的信号特征,样本时序信号的信号特征用于预测目标业务在第二时段内产生的业务参数值,第二时段晚于第一时段。
在一种可能的实现方式中,处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取样本时序信号;
对样本时序信号进行趋势分解处理,得到样本时序信号的趋势信号;
获取样本时序信号与趋势信号之间的差值,并将差值确定为样本时序信号的周期信号;
基于周期信号和趋势信号确定目标时序信号。
在一种可能的实现方式中,处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
基于周期信号和趋势信号计算样本时序信号的自相关值;
基于自相关值对周期信号进行加权,得到加权后的周期信号;
基于自相关值对趋势信号进行加权,得到加权后的趋势信号;
对加权后的周期信号和加权后的趋势信号进行拼接处理,得到目标时序信号。
在一种可能的实现方式中,加权后的周期信号和加权后的趋势信号均包含N行信号值,加权后的周期信号中的第i行信号值与加权后的趋势信号中的第i行信号值具有关联关系,i和N均为正整数且i小于或等于N;处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
将加权后的趋势信号中的第i行信号值拼接到加权后的周期信号中第i行信号值的相邻位置处,得到目标时序信号。
在一种可能的实现方式中,处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
对周期信号和趋势信号进行拼接处理,得到拼接信号;
对拼接信号进行嵌入处理,得到拼接信号的嵌入特征;
对嵌入特征进行自相关计算,得到自相关值。
在一种可能的实现方式中,目标时序信号的各个列用于指示目标时序信号的时间维度;处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取时间维度包含的多个时间区间;
分别按照每个时间区间对目标时序信号中的各个列进行采样,得到每个时间区间分别对应的样本;任一时间区间对应的样本包含在任一时间区间内对目标时序信号采样得到的列包含的信号值;
将多个时间区间对应的样本确定为多个样本。
在一种可能的实现方式中,多个时间区间包含第一时间区间和第二时间区间;处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
若第一时间区间和第二时间区间之间具有时间交集,则基于第一时间区间对应的样本和第二时间区间对应的样本构建正样本对;
若第一时间区间和第二时间区间之间不具有时间交集,则基于第一时间区间对应的样本和第二时间区间对应的样本构建负样本对。
在一种可能的实现方式中,处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
调用特征提取网络对样本对包含的样本进行特征提取,得到样本对包含的样本的样本特征;
获取正样本对中样本的样本特征之间的第一相似度,并获取负样本对中样本的样本特征之间的第二相似度;
基于第一相似度和第二相似度修正特征提取网络的网络参数,得到训练好的特征提取网络。
在一种可能的实现方式中,处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
基于第一相似度和第二相似度确定特征提取网络的特征提取偏差;
基于特征提取偏差修正特征提取网络的网络参数,得到训练好的特征提取网络;
其中,特征提取偏差用于修正特征提取网络的网络参数,使第一相似度增高,且使第二相似度降低。
在一种可能的实现方式中,处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
调用训练好的特征提取网络提取样本时序信号的信号特征;
调用预测网络基于样本时序信号的信号特征,预测由目标业务在第二时段内产生的业务参数值构成的时序信号;
获取由目标业务在第二时段内产生的业务参数值构成的真实的时序信号;
基于真实的时序信号和预测的时序信号确定预测网络的信号预测偏差;
基于信号预测偏差修正预测网络的网络参数,得到训练好的预测网络。
在一种可能的实现方式中,处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取待预测的时序信号;待预测的时序信号是由目标业务在第三时段内产生的业务参数值构成的;
调用训练好的特征提取网络对待预测的时序信号进行特征提取,得到待预测的时序信号的信号特征;
调用训练好的预测网络基于待预测的时序信号的信号特征,预测由目标业务在第四时段内产生的业务参数值构成的时序信号;第四时段晚于第三时段。
在一种可能的实现方式中,处理器1001还可以用于调用存储器1005中存储的设备控制应用程序,以实现:
获取基准业务参数值;
获取预测的目标业务在第四时段内产生的业务参数值的参考业务参数值;
若参考业务参数值大于基准业务参数值,则对目标业务进行业务预警。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3对应实施例中对上述数据处理方法的描述,也可执行前文图12所对应实施例中对上述数据处理装置1的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的数据处理装置1所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图3所对应实施例中对数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
作为示例,上述程序指令可被部署在一个计算机设备上执行,或者被部署位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链网络。
上述计算机可读存储介质可以是前述任一实施例提供的数据处理装置或者上述计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前文图3对应实施例中对上述数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (16)

1.一种数据处理方法,其特征在于,所述方法包括:
获取目标时序信号;所述目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,所述样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,所述趋势信号用于表示所述样本时序信号的信号变化成分,所述周期信号用于表示所述样本时序信号的信号平稳成分;
对所述目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从所述目标时序信号中采样得到的多个信号值;
基于所述多个样本构建样本对;所述样本对包括正样本对和负样本对,一个样本对由两个样本组成,所述正样本对包含的样本之间具有重合的信号值,所述负样本对包含的样本之间不具有重合的信号值;
采用所述样本对训练特征提取网络,得到训练好的特征提取网络;所述训练好的特征提取网络用于提取所述样本时序信号的信号特征,所述样本时序信号的信号特征用于预测所述目标业务在第二时段内产生的业务参数值,所述第二时段晚于所述第一时段。
2.根据权利要求1所述的方法,其特征在于,所述获取目标时序信号,包括:
获取所述样本时序信号;
对所述样本时序信号进行趋势分解处理,得到所述样本时序信号的所述趋势信号;
获取所述样本时序信号与所述趋势信号之间的差值,并将所述差值确定为所述样本时序信号的所述周期信号;
基于所述周期信号和所述趋势信号确定所述目标时序信号。
3.根据权利要求2所述的方法,其特征在于,所述基于所述周期信号和所述趋势信号确定所述目标时序信号,包括:
基于所述周期信号和所述趋势信号计算所述样本时序信号的自相关值;
基于所述自相关值对所述周期信号进行加权,得到加权后的周期信号;
基于所述自相关值对所述趋势信号进行加权,得到加权后的趋势信号;
对所述加权后的周期信号和所述加权后的趋势信号进行拼接处理,得到所述目标时序信号。
4.根据权利要求3所述的方法,其特征在于,所述加权后的周期信号和所述加权后的趋势信号均包含N行信号值,所述加权后的周期信号中的第i行信号值与所述加权后的趋势信号中的第i行信号值具有关联关系,i和N均为正整数且i小于或等于N;
所述对所述加权后的周期信号和所述加权后的趋势信号进行拼接处理,得到所述目标时序信号,包括:
将所述加权后的趋势信号中的第i行信号值拼接到所述加权后的周期信号中第i行信号值的相邻位置处,得到所述目标时序信号。
5.根据权利要求3所述的方法,其特征在于,所述基于所述周期信号和所述趋势信号计算所述样本时序信号的自相关值,包括:
对所述周期信号和所述趋势信号进行拼接处理,得到拼接信号;
对所述拼接信号进行嵌入处理,得到所述拼接信号的嵌入特征;
对所述嵌入特征进行自相关计算,得到所述自相关值。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述目标时序信号的各个列用于指示所述目标时序信号的时间维度;
所述对所述目标时序信号中的信号值进行采样,得到多个样本,包括:
获取所述时间维度包含的多个时间区间;
分别按照每个时间区间对所述目标时序信号中的各个列进行采样,得到所述每个时间区间分别对应的样本;任一时间区间对应的样本包含在所述任一时间区间内对所述目标时序信号采样得到的列包含的信号值;
将所述多个时间区间对应的样本确定为所述多个样本。
7.根据权利要求6所述的方法,其特征在于,所述多个时间区间包含第一时间区间和第二时间区间;
所述基于所述多个样本构建样本对,包括:
若所述第一时间区间和所述第二时间区间之间具有时间交集,则基于所述第一时间区间对应的样本和所述第二时间区间对应的样本构建所述正样本对;
若所述第一时间区间和所述第二时间区间之间不具有时间交集,则基于所述第一时间区间对应的样本和所述第二时间区间对应的样本构建所述负样本对。
8.根据权利要求1所述的方法,其特征在于,所述采用所述样本对训练特征提取网络,得到训练好的特征提取网络,包括:
调用所述特征提取网络对所述样本对包含的样本进行特征提取,得到所述样本对包含的样本的样本特征;
获取所述正样本对中样本的样本特征之间的第一相似度,并获取所述负样本对中样本的样本特征之间的第二相似度;
基于所述第一相似度和所述第二相似度修正所述特征提取网络的网络参数,得到所述训练好的特征提取网络。
9.根据权利要求8所述的方法,其特征在于,所述基于所述第一相似度和所述第二相似度修正所述特征提取网络的网络参数,得到所述训练好的特征提取网络,包括:
基于所述第一相似度和所述第二相似度确定所述特征提取网络的特征提取偏差;
基于所述特征提取偏差修正所述特征提取网络的网络参数,得到所述训练好的特征提取网络;
其中,所述特征提取偏差用于修正所述特征提取网络的网络参数,使所述第一相似度增高,且使所述第二相似度降低。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
调用所述训练好的特征提取网络提取所述样本时序信号的信号特征;
调用预测网络基于所述样本时序信号的信号特征,预测由所述目标业务在所述第二时段内产生的业务参数值构成的时序信号;
获取由所述目标业务在所述第二时段内产生的业务参数值构成的真实的时序信号;
基于所述真实的时序信号和预测的时序信号确定所述预测网络的信号预测偏差;
基于所述信号预测偏差修正所述预测网络的网络参数,得到训练好的预测网络。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
获取待预测的时序信号;所述待预测的时序信号是由所述目标业务在第三时段内产生的业务参数值构成的;
调用所述训练好的特征提取网络对所述待预测的时序信号进行特征提取,得到所述待预测的时序信号的信号特征;
调用所述训练好的预测网络基于所述待预测的时序信号的信号特征,预测由所述目标业务在第四时段内产生的业务参数值构成的时序信号;所述第四时段晚于所述第三时段。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
获取基准业务参数值;
获取预测的所述目标业务在所述第四时段内产生的业务参数值的参考业务参数值;
若所述参考业务参数值大于所述基准业务参数值,则对所述目标业务进行业务预警。
13.一种数据处理方法,其特征在于,所述方法包括:
获取模块,用于获取目标时序信号;所述目标时序信号是基于样本时序信号的趋势信号和周期信号得到的,所述样本时序信号是由目标业务在第一时段内产生的业务参数值构成的,所述趋势信号用于表示所述样本时序信号的信号变化成分,所述周期信号用于表示所述样本时序信号的信号平稳成分;
采样模块,用于对所述目标时序信号中的信号值进行采样,得到多个样本;任一样本包含从所述目标时序信号中采样得到的多个信号值;
构建模块,用于基于所述多个样本构建样本对;所述样本对包括正样本对和负样本对,一个样本对由两个样本组成,所述正样本对包含的样本之间具有重合的信号值,所述负样本对包含的样本之间不具有重合的信号值;
训练模块,用于采用所述样本对训练特征提取网络,得到训练好的特征提取网络;所述训练好的特征提取网络用于提取所述目标时序信号的信号特征,所述目标时序信号的信号特征用于预测所述目标业务在第二时段内产生的业务参数值,所述第二时段晚于所述第一时段。
14.一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1-12任一项所述方法的步骤。
15.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1-12中任一项所述方法的步骤。
16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适用于由处理器加载并执行权利要求1-12任一项所述的方法。
CN202211507303.3A 2022-11-29 2022-11-29 数据处理方法、装置、程序产品、计算机设备和介质 Pending CN116975590A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211507303.3A CN116975590A (zh) 2022-11-29 2022-11-29 数据处理方法、装置、程序产品、计算机设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211507303.3A CN116975590A (zh) 2022-11-29 2022-11-29 数据处理方法、装置、程序产品、计算机设备和介质

Publications (1)

Publication Number Publication Date
CN116975590A true CN116975590A (zh) 2023-10-31

Family

ID=88480315

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211507303.3A Pending CN116975590A (zh) 2022-11-29 2022-11-29 数据处理方法、装置、程序产品、计算机设备和介质

Country Status (1)

Country Link
CN (1) CN116975590A (zh)

Similar Documents

Publication Publication Date Title
CN109587713B (zh) 一种基于arima模型的网络指标预测方法、装置及存储介质
US20150347673A1 (en) Wetland modeling and prediction
CN109580004A (zh) 一种温度检测方法及装置
CN110363098B (zh) 一种暴力行为预警方法、装置、可读存储介质及终端设备
CN112801434A (zh) 性能指标健康度的监测方法、装置、设备和存储介质
CN114638633A (zh) 异常流量检测的方法和装置、电子设备和存储介质
CN115082752A (zh) 基于弱监督的目标检测模型训练方法、装置、设备及介质
CN112597984A (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN113313215B (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN114328277A (zh) 一种软件缺陷预测和质量分析方法、装置、设备及介质
CN103049629A (zh) 一种检测噪音数据的方法及装置
CN117176417A (zh) 网络流量异常确定方法、装置、电子设备和可读存储介质
CN116435995A (zh) 时间序列的处理方法、计算机可读存储介质和电子设备
CN116975590A (zh) 数据处理方法、装置、程序产品、计算机设备和介质
CN115982965A (zh) 去噪扩散样本增量学习的碳纤维材料损伤检测方法及装置
CN115935822A (zh) 计算机参数长期退化趋势预测方法、系统、设备及介质
CN113780356B (zh) 基于集成学习模型的水质预测方法及系统
CN115147353A (zh) 缺陷检测模型的训练方法、装置、设备、介质及程序产品
CN117435901B (zh) 一种工业互联网数据获取方法、系统、终端及储存介质
CN117058498B (zh) 分割图评估模型的训练方法、分割图的评估方法及装置
CN116778534B (zh) 图像处理方法、装置、设备和介质
CN111526054B (zh) 用于获取网络的方法及装置
CN116340765B (zh) 一种窃电用户预测方法、装置、存储介质及电子设备
CN115080445B (zh) 一种游戏测试管理方法及其系统
CN116977690A (zh) 图像处理方法、装置、产品、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication