CN111814106A - 时序数据滞后性处理方法、装置、电子设备及存储介质 - Google Patents

时序数据滞后性处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111814106A
CN111814106A CN202010656657.9A CN202010656657A CN111814106A CN 111814106 A CN111814106 A CN 111814106A CN 202010656657 A CN202010656657 A CN 202010656657A CN 111814106 A CN111814106 A CN 111814106A
Authority
CN
China
Prior art keywords
time sequence
data
hysteresis
time
differential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010656657.9A
Other languages
English (en)
Inventor
阮晓雯
邓攀
徐亮
肖京
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010656657.9A priority Critical patent/CN111814106A/zh
Priority to PCT/CN2020/119091 priority patent/WO2021151304A1/zh
Publication of CN111814106A publication Critical patent/CN111814106A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Abstract

本发明涉及数据处理技术,揭露一种时序数据滞后性处理方法,包括:对时序样本数据进行时序差分处理及曲线拟合,得到真实曲线;利用预先构建的多个时序分析模型对所述时序样本数据进行时序差分处理及曲线拟合,生成多个预测曲线;根据所述预测曲线和真实曲线之间的损失值计算所述预测曲线的滞后度,根据所述滞后度,从所述多个时序分析模型中筛选出标准时序分析模型,利用所述标准时序分析模型对预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。本发明还涉及区块链技术,所述预设事件的时序数据可以存储在区块链中。本发明还揭露一种时序数据滞后性处理装置、电子设备及存储介质。本发明可以提高时序分析过程中预测的准确性。

Description

时序数据滞后性处理方法、装置、电子设备及存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种时序数据滞后性处理方法、装置、电子设备及计算机可读存储介质。
背景技术
滞后是指一个现象与另一个密切相关的现象之间所出现的落后延迟情况,这种情况通常是受自身或者其它变量的影响而产生的,滞后度是用来衡量滞后程度的大小,滞后度评估则是指利用一个时序分析模型去解决滞后的问题,例如对利用流感疫情相关信息预测下周流感强度的方法会存在滞后。由于流感病毒的高度可变性和不可确定性,流感防控面临诸多挑战,流感疫情的滞后度评估成为预防和控制流感的关键策略。
当获取的信息样本越来越大时,传统的时序分析模型在根据所述信息样本中提取到的历史信息预测下一周期信息时,会存在长期滞后现象,如此会造成计算过程的复杂以及评估准确率的下降。
发明内容
本发明提供一种时序数据滞后性处理方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决评估信息时存在的滞后现象,以及造成计算过程的复杂以及评估准确率的下降的问题。
为实现上述目的,本发明提供的一种时序数据滞后性处理方法,包括:
获取时序样本数据,对所述时序样本数据进行时序差分处理,得到差分数据集;
对所述差分数据集进行曲线拟合,得到真实曲线;
通过预先构建的多个时序分析模型,解析所述时序样本数据,得到多个时序解析数据,对所述多个时序解析数据进行时序差分处理,得到多个差分解析数据集,对多个差分解析数据集进行曲线拟合,获得多个预测曲线;
利用损失函数计算多个所述预测曲线和所述真实曲线之间的损失值;
基于所述损失值计算每个所述预测曲线的滞后因子,并根据所述滞后因子确定每个所述预测曲线的滞后度;
根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型;
利用所述标准时序分析模型对用户输入的预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。
可选地,所述对所述时序样本数据进行时序差分处理之前,所述方法还包括:
判断所述时序样本数据是否具有平稳性;
在所述时序样本数据具有平稳性时,不执行对时序样本数据的时序差分处理;
在所述时序样本数据不具有平稳性时,执行对时序样本数据的时序差分处理。
可选地,所述对所述时序样本数据进行时序差分处理,包括:
采用下述公式对所述时序样本数据进行时序差分处理:
Δyx=yx+1-yx
其中,Δyx是所述物体温度随时间变化数据的一阶差分,yx+1是在x+1时刻的数据,yx是在x时刻的数据。
可选地,所述对差分数据集进行曲线拟合,得到真实曲线,包括:
提取所述差分数据集中差分数据的时序特征;
利用所述时序特征对所述差分数据集中的差分数据进行坐标编码;
利用所述坐标编码将所述差分数据集中的差分数据映射至预先构建的坐标系中;
根据所述时序特征将坐标系中的差分数据进行连接,得到所述真实曲线。
可选地,所述时序分析模型为:
St+1=Xt+Yt
Xt=αSt+(1-α)(St-1-Yt-1)
Yt=β(Xt-Xt-1)+(1-β)Yt-1
其中,St表示所述差分数据集中在t时刻的差分数据,St-1表示所述差分数据集中在t-1时刻的差分数据,Xt表示t时刻的平滑值,Xt-1表示t-1时刻的平滑值,Yt表示t时刻的趋势值,Yt-1表示t-1时刻的趋势值,St+1表示所述差分解析数据集中在t+1时刻的差分解析数据,d和β为预设的不同的平滑系数。
可选地,所述基于所述损失值计算所述预测曲线的滞后因子,包括:
利用如下算法计算所述滞后因子τm
Figure BDA0002577005650000031
其中,arg min是使函数取得其最小值的所有自变量集合,
Figure BDA0002577005650000032
为解析值,τ为损失值,i为所述预测曲线的起始值,n为所述预测曲线的终点值。
可选地,所述根据所述滞后因子确定每个所述预测曲线的滞后度,包括:
利用如下算法计算所述滞后度scoredelay
Figure BDA0002577005650000033
其中,τm为所述预测曲线的滞后因子;
Figure BDA0002577005650000034
为τm平移后最小的均方根误差。
为了解决上述问题,本发明还提供一种时序数据滞后性处理方法装置,所述装置包括:
差分数据生成模块,用于获取时序样本数据,对所述时序样本数据进行时序差分处理,得到差分数据集;
真实曲线生成模块,用于对所述差分数据集进行曲线拟合,得到真实曲线;
预测曲线生成模块,用于通过预先构建的多个时序分析模型,解析所述时序样本数据,得到多个时序解析数据,对所述多个时序解析数据进行时序差分处理,得到多个差分解析数据集,对多个差分解析数据集进行曲线拟合,获得多个预测曲线;
损失值计算模块,用于利用损失函数计算多个所述预测曲线和所述真实曲线之间的损失值;
滞后度计算模块,用于基于所述损失值计算每个所述预测曲线的滞后因子,并根据所述滞后因子确定每个所述预测曲线的滞后度;
标准时序分析模型筛选模块,根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型;
数据分析模块,用于利用所述标准时序分析模型对用户输入的预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述的时序数据滞后性处理方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的时序数据滞后性处理方法。
本发明实施例首先通过对时序样本数据进行时序差分处理及曲线拟合,得到真实曲线,进一步利用预先构建的多个时序分析模型对所述时序样本数据进行解析、时序差分处理和曲线拟合,得到预测曲线,所述生成真实曲线和预测曲线采用较简单的时序差分处理,因此生成真实曲线和预测曲线的过程更准确且占用少量计算资源;同时,根据每个所述预测曲线的滞后度,从多个时序分析模型中筛选出标准时序分析模型,确保了时序分析过程预测的准确性,为后续利用标准时序分析模型提供了保障。因此本发明提出的时序数据滞后性处理方法、装置及计算机可读存储介质,可以提高时序数据滞后性处理方法的效率,解决评估信息时存在的滞后现象,以及造成计算过程的复杂以及评估准确率的下降的问题。
附图说明
图1为本发明一实施例提供的时序数据滞后性处理方法的流程示意图;
图2为本发明一实施例提供的时序数据滞后性处理方法中其中一个步骤的流程示意图;
图3为本发明一实施例提供的时序数据滞后性处理方法的模块示意图;
图4为本发明一实施例提供的实现时序数据滞后性处理方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供的时序数据滞后性处理方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述时序数据滞后性处理方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明实施例提供的时序数据滞后性处理方法的流程示意图。
在本实施例中,时序数据滞后性处理方法包括:
S1、获取时序样本数据,对所述时序样本数据进行时序差分处理,得到差分数据集。
本发明实施例中,所述时序样本数据也称时间序列样本数据,包括任何具有时序特征的数据,例如流行病强度随时间变化的数据、物体温度随时间变化的数据等。本发明实施例可利用具有数据调用功能的java语句从用于存储时序样本数据的数据库中获取所述时序样本数据。
优选地,所述对所述时序样本数据进行时序差分处理之前,所述方法还包括:
判断所述时序样本数据是否具有平稳性;
在所述时序样本数据具有平稳性时,不执行对时序样本数据的时序差分处理;
在所述时序样本数据不具有平稳性时,执行对时序样本数据的时序差分处理。
优选地,本发明实施例可以通过检测所述时序样本数据中是否存在单位根来判断所述时序样本数据是否具有平稳性。其中,单位根是指所述时序样本数据中模为1的根,例如:1、-1、i、-i都是4次单位根。
当所述时序样本数据中不存在单位根时,说明所述时序样本数据具有平稳性,以及当所述时序样本数据中存在单位根时,说明所述时序样本数据不具有平稳性。
较佳地,本发明实施例采用一阶差分对所述时序样本数据进行时序差分,其中,所述一阶差分公式如下所示:
Δyx=yx+1-yx
其中,Δyx是所述物体温度随时间变化数据的一阶差分,yx+1是在x+1时刻的数据,yx是在x时刻的数据。
在本发明实施例中,对所述时序样本数据进行时序差分处理,可以将时序样本数据中的不平稳因素滤除。
S2、对差分数据集进行曲线拟合,得到真实曲线。
具体地,参阅图2所示,所述S2的详细实施流程包括:
S20、提取所述差分数据集中差分数据的时序特征;
S21、利用所述时序特征对所述差分数据集中的差分数据进行坐标编码;
S22、利用所述坐标编码将所述差分数据集中的差分数据映射至预先构建的坐标系中;
S23、根据所述时序特征将坐标系中的差分数据进行连接,得到所述真实曲线。所述真实曲线是一条平稳的,可以表示差分数据随时间变化的曲线。
本发明实施例中,所述时序特征是指所述差分数据的时间先后顺序;根据所述时序特征对所述差分数据集中的差分数据进行坐标编码包括按照所述差分数据的时间先后顺序将所述差分数据表示在预设的坐标系中。
例如,建立以t时刻,t+1时刻为横轴,以Lt,Lt+1为纵轴建立一个坐标系,将所述差分数据集中的差分数据进行坐标编码,映射在所述构建的坐标系中,进而根据所述时序特征将坐标系中的差分数据进行连接,得到所述真实曲线。
S3、通过预先构建的多个时序分析模型,解析所述时序样本数据,得到多个时序解析数据,对所述多个时序解析数据进行时序差分处理,得到多个差分解析数据集,对多个差分解析数据集进行曲线拟合,获得多个预测曲线。
本发明实施例中,所述时序分析模型为:
St+1=Xt+Yt
Xt=αSt+(1-α)(St-1-Yt-1)
Yt=β(Xt-Xt-1)+(1-β)Yt-1
其中,St表示所述差分数据集中在t时刻的差分数据,St-1表示所述差分数据集中在t-1时刻的差分数据,Xt表示t时刻的平滑值,Xt-1表示t-1时刻的平滑值,Yt表示t时刻的趋势值,Yt-1表示t-1时刻的趋势值,St+1表示所述差分解析数据集中在t+1时刻的差分解析数据,α和β为预设的不同的平滑系数。
本发明实施例通过自定义不同的平滑系数α和β来得到多个时序分析模型。
具体地,本发明实施例利用所述多个时序分析模型对所述时序样本数据进行解析,得到多个时序解析数据。例如,对于以物体温度随时间变化的数据为时序样本数据:[(1,2),(2,4),(3,5),(4,8)],其中,第一位数字为时间标识,用于表示所述时序样本数据的时间,第二位数字为数据标识,用于表示所述随时间变化的物体温度的数值大小;利用所述时序分析模型对所述以物体温度随时间变化的数据进行解析,得到多个时序解析数据:[(5,9),(6,11),(7,14),(8,16)]。
进一步地,由于得到所述时序解析数据中可能包含不平稳的因素,因此,本发明实施例进一步对所述时序解析数据进行时序差分处理,以将所述时序解析数据中的不平稳因素滤除。
详细地,本发明实施例对所述多个时序解析数据进行如S1所述的时序差分处理,得到多个差分解析数据集。
本发明实施例对多个差分解析数据集进行曲线拟合,获得多个预测曲线。
较佳地,所述对多个差分解析数据集进行曲线拟合的方法与上述S2中对差分数据集进行曲线拟合的方法相同,这里不再赘述。
S4、利用损失函数计算多个预测曲线和所述真实曲线之间的损失值。
较佳地,本发明实施例利用下述公式计算所述多个预测曲线和所述真实曲线之间的初始损失值:
Figure BDA0002577005650000071
其中,
Figure BDA0002577005650000083
表示初始损失值,
Figure BDA0002577005650000084
表示预测曲线的预测值,σ表示所述时序分析模型的个数,Y表示不同平移程度下真实曲线的真实值,α表示误差因子。
进一步地,根据所述初始损失值,计算初始损失值均方根误差,得到损失值,包括:
Figure BDA0002577005650000081
其中,RMSE
Figure BDA0002577005650000085
为初始损失值的均方根误差,即损失值,
Figure BDA0002577005650000086
表示初始损失值,m表示所述时序分析模型的个数。
S5、基于所述损失值计算多个预测曲线的滞后因子,并根据所述滞后因子确定多个预测曲线的滞后度。
本发明实施例中,利用如下算法计算所述滞后因子τm
Figure BDA0002577005650000082
其中,arg min是指使函数取得其最小值的所有自变量集合,
Figure BDA0002577005650000087
为解析值,τ为损失值,i为所述预测曲线的起始值,n为所述预测曲线的终点值。
进一步地,本发明实施例根据所述滞后因子确定每个所述预测曲线的滞后度,包括:
利用如下算法计算所述滞后度scoredelay
scoredelay=(1+τm)×RMSEτ
其中,τm为所述预测曲线的滞后因子;
Figure BDA0002577005650000088
为τm平移后最小的均方根误差。
本发明实施例将多个预测曲线的滞后因子代入上述算法,得到多个预测曲线的滞后度,所述滞后度表示所述预测曲线与所述真实曲线相比较滞后的程度。
S6、根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型。
在本发明实施例中,所述根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型,包括:
根据所述滞后度对多个时序分析模型进行筛选,得到标准时序分析模型。
本发明实施例筛选出多个时序分析模型中滞后度小于预设阈值的模型,得到标准时序分析模型。
所述标准时序分析模型是比较不同的所述时序分析模型之间滞后度和误差程度后所筛选出来的模型,可以解决时序预测中长期存在的滞后性问题,滞后度是用来衡量滞后程度的大小,所述多个时序分析模型的滞后度越小,经过所述标准时序分析模型处理后的数据会相对准确,存在的滞后问题会比较少。
生活中,流感病毒存在高度可变性和不可确定性,正确预测流感疫情的高峰点对预防和控制流感是很关键的。而筛选出来的标准时序分析模型可以解决预测流感高峰点时出现的预测结果滞后、预测误差较大的问题,提高流感预测的准确率。
S7、利用所述标准时序分析模型对用户输入的预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。
本发明实施例中,根据筛选得到的所述标准时序分析模型,对待处理的所述时序进行分析,得到所述预设事件的发展趋势。
优选地,为了保证数据安全,所述预设事件的时序数据可以存储在区块链中。
例如:流感是全球性的严重公共卫生问题,利用所述时序分析模型对历史的流感疫情相关信息进行分析,可以得到下周流感强度信息,同时得到的流感信息不会存在滞后和误差较大的问题。
如图3所示,是本发明时序数据滞后性处理装置的模块示意图。
本发明所述时序数据滞后性处理装置100可以安装于电子设备中。根据实现的功能,所述时序数据滞后性处理装置100可以包括差分数据生成模块101、真实曲线生成模块102、预测曲线生成模块103、损失值计算模块104、滞后度计算模块105、标准时序分析模型筛选模块106和数据分析模块107。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述差分数据生成模块101,用于获取时序样本数据,对所述时序样本数据进行时序差分处理,得到差分数据集;
所述真实曲线生成模块102,用于对所述差分数据集进行曲线拟合,得到真实曲线;
所述预测曲线生成模块103,用于通过预先构建的多个时序分析模型,解析所述时序样本数据,得到多个时序解析数据,对所述多个时序解析数据进行时序差分处理,得到多个差分解析数据集,对多个差分解析数据集进行曲线拟合,获得多个预测曲线;
所述损失值计算模块104,用于利用损失函数计算多个所述预测曲线和所述真实曲线之间的损失值;
所述滞后度计算模块105,用于基于所述损失值计算每个所述预测曲线的滞后因子,并根据所述滞后因子确定每个所述预测曲线的滞后度;
所述标准时序分析模型筛选模块106,根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型;
所述数据分析模块107,用于利用所述标准时序分析模型对用户输入的预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。
详细地,所述时序数据滞后性处理装置100各模块的具体实施方式如下:
步骤一、所述差分数据生成模块101获取时序样本数据,对所述时序样本数据进行时序差分处理,得到差分数据集。
本发明实施例中,所述时序样本数据包括任何具有时序特征的数据,例如流行病强度随时间变化的数据、物体温度随时间变化的数据等。本发明实施例可利用具有数据调用功能的java语句从用于存储时序样本数据的数据库中获取所述时序样本数据。
优选地,所述对所述时序样本数据进行时序差分处理之前,所述差分数据生成模块101还执行:
判断所述时序样本数据是否具有平稳性;
在所述时序样本数据具有平稳性时,不执行对时序样本数据的时序差分处理;
在所述时序样本数据不具有平稳性时,执行对时序样本数据的时序差分处理。
优选地,本发明实施例所述差分数据生成模块101可以通过检测所述时序样本数据中是否存在单位根来判断所述时序样本数据是否具有平稳性。其中,单位根是指所述时序样本数据中模为1的根,例如:1、-1、i、-i都是4次单位根。
当所述时序样本数据中不存在单位根时,说明所述时序样本数据具有平稳性,以及当所述时序样本数据中存在单位根时,说明所述时序样本数据不具有平稳性。
较佳地,本发明实施例所述差分数据生成模块101采用一阶差分对所述时序样本数据进行时序差分,其中,所述一阶差分公式如下所示:
Δyx=yx+1-yx
其中,Δyx是所述物体温度随时间变化数据的一阶差分,yx+1是在x+1时刻的数据,yx是在x时刻的数据。
在本发明实施例中,对所述时序样本数据进行时序差分处理,可以将时序样本数据中的不平稳因素滤除。
步骤二、所述真实曲线生成模块102对所述差分数据集进行曲线拟合,得到真实曲线。
具体地,所述真实曲线生成模块102详细用于:
提取所述差分数据集中差分数据的时序特征;
利用所述时序特征对所述差分数据集中的差分数据进行坐标编码;
利用所述坐标编码将所述差分数据集中的差分数据映射至预先构建的坐标系中;
根据所述时序特征将坐标系中的差分数据进行连接,得到所述真实曲线。所述真实曲线是一条平稳的,可以表示差分数据随时间变化的曲线。
本发明实施例中,所述时序特征是指所述差分数据的时间先后顺序;根据所述时序特征对所述差分数据集中的差分数据进行坐标编码包括按照所述差分数据的时间先后顺序将所述差分数据表示在预设的坐标系中。
例如,建立以t时刻,t+1时刻为横轴,以Lt,Lt+1为纵轴建立一个坐标系,将所述差分数据集中的差分数据进行坐标编码,映射在所述构建的坐标系中,进而根据所述时序特征将坐标系中的差分数据进行连接,得到所述真实曲线。
步骤三、所述预测曲线生成模块103通过预先构建的多个时序分析模型,解析所述时序样本数据,得到多个时序解析数据,对所述多个时序解析数据进行时序差分处理,得到多个差分解析数据集,对多个差分解析数据集进行曲线拟合,获得多个预测曲线。
本发明实施例中,所述时序分析模型为:
St+1=Xt+Yt
Xt=αSt+(1-α)(St-1-Yt-1)
Yt=β(Xt-Xt-1)+(1-β)Yt-1
其中,St表示所述差分数据集中在t时刻的差分数据,St-1表示所述差分数据集中在t-1时刻的差分数据,Xt表示t时刻的平滑值,Xt-1表示t-1时刻的平滑值,Yt表示t时刻的趋势值,Yt-1表示t-1时刻的趋势值,St+1表示所述差分解析数据集中在t+1时刻的差分解析数据,α和β为预设的不同的平滑系数。
本发明实施例所述预测曲线生成模块103通过自定义不同的平滑系数α和β来得到多个时序分析模型。
具体地,本发明实施例所述预测曲线生成模块103利用所述多个时序分析模型对所述时序样本数据进行解析,得到多个时序解析数据。例如,对于以物体温度随时间变化的数据为时序样本数据:[(1,2),(2,4),(3,5),(4,8)],其中,第一位数字为时间标识,用于表示所述时序样本数据的时间,第二位数字为数据标识,用于表示所述随时间变化的物体温度的数值大小;利用所述时序分析模型对所述以物体温度随时间变化的数据进行解析,得到多个时序解析数据:[(5,9),(6,11),(7,14),(8,16)]。
进一步地,由于得到所述时序解析数据中可能包含不平稳的因素,因此,本发明实施例所述预测曲线生成模块103进一步对所述时序解析数据进行时序差分处理,以将所述时序解析数据中的不平稳因素滤除。
详细地,本发明实施例对所述多个时序解析数据进行如差分数据生成模块101执行的所述的时序差分处理,得到多个差分解析数据集。
本发明实施例对多个差分解析数据集进行曲线拟合,获得多个预测曲线。
较佳地,所述对多个差分解析数据集进行曲线拟合的方法与上述真实曲线生成模块102执行的对差分数据集进行曲线拟合的方法相同,这里不再赘述。
步骤四、所述损失值计算模块104利用损失函数计算多个预测曲线和所述真实曲线之间的损失值。
较佳地,本发明实施例所述损失值计算模块104利用下述公式计算所述多个预测曲线和所述真实曲线之间的初始损失值:
Figure BDA0002577005650000131
其中,
Figure BDA0002577005650000132
表示初始损失值,
Figure BDA0002577005650000133
表示预测曲线的预测值,σ表示所述时序分析模型的个数,Y表示不同平移程度下真实曲线的真实值,α表示误差因子。
进一步地,所述损失值计算模块104根据所述初始损失值,计算初始损失值均方根误差,得到损失值,包括:
Figure BDA0002577005650000134
其中,RMSE
Figure BDA0002577005650000136
为初始损失值的均方根误差,即损失值,
Figure BDA0002577005650000137
表示初始损失值,m表示所述时序分析模型的个数。
步骤五、所述滞后度计算模块105基于所述损失值计算多个预测曲线的滞后因子,并根据所述滞后因子确定多个预测曲线的滞后度。
本发明实施例中,所述滞后度计算模块105利用如下算法计算所述滞后因子τm
Figure BDA0002577005650000135
其中,arg min是使函数取得其最小值的所有自变量集合,
Figure BDA0002577005650000138
为解析值,τ为损失值,i为所述预测曲线的起始值,n为所述预测曲线的终点值。
进一步地,本发明实施例所述滞后度计算模块105根据所述滞后因子确定每个所述预测曲线的滞后度,包括:
利用如下算法计算所述滞后度scoredelay
scoredelay=(1+τm)×RMSEτ
其中,τm为所述预测曲线的滞后因子;
Figure BDA0002577005650000141
为τm平移后最小的均方根误差。
本发明实施例所述滞后度计算模块105将多个预测曲线的滞后因子代入上述算法,得到多个预测曲线的滞后度,所述滞后度表示所述预测曲线与所述真实曲线相比较滞后的程度。
步骤六、所述标准时序分析模型筛选模块106根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型。
在本发明实施例中,所述标准时序分析模型筛选模块106通过下述操作从所述多个时序分析模型中筛选出标准时序分析模型:
根据所述滞后度对多个时序分析模型进行筛选,得到标准时序分析模型。
本发明实施例筛选出多个时序分析模型中滞后度小于预设阈值的模型,得到标准时序分析模型。
所述标准时序分析模型是比较不同的所述时序分析模型之间滞后度和误差程度后所筛选出来的模型,可以解决时序预测中长期存在的滞后性问题,滞后度是用来衡量滞后程度的大小,所述多个时序分析模型的滞后度越小,经过所述标准时序分析模型处理后的数据会相对准确,存在的滞后问题会比较少。
生活中,流感病毒存在高度可变性和不可确定性,正确预测流感疫情的高峰点对预防和控制流感是很关键的。而筛选出来的标准时序分析模型可以解决预测流感高峰点时出现的预测结果滞后、预测误差较大的问题,提高流感预测的准确率。
步骤七、所述数据分析模块107利用所述标准时序分析模型对用户输入的预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。
本发明实施例中,所述数据分析模块107根据筛选得到的所述标准时序分析模型,对待处理的所述时序进行分析,得到所述预设事件的发展趋势。
优选地,为了保证数据安全,所述预设事件的时序数据可以存储在区块链中。
例如:流感是全球性的严重公共卫生问题,利用所述时序分析模型对历史的流感疫情相关信息进行分析,可以得到下周流感强度信息,同时得到的流感信息不会存在滞后和误差较大的问题。
如图4所示,是本发明实现时序数据滞后性处理方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如时序数据滞后性处理程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如时序数据滞后性处理程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行时序数据滞后性处理程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的时序数据滞后性处理程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
获取时序样本数据,对所述时序样本数据进行时序差分处理,得到差分数据集;
对所述差分数据集进行曲线拟合,得到真实曲线;
通过预先构建的多个时序分析模型,解析所述时序样本数据,得到多个时序解析数据,对所述多个时序解析数据进行时序差分处理,得到多个差分解析数据集,对多个差分解析数据集进行曲线拟合,获得多个预测曲线;
利用损失函数计算多个所述预测曲线和所述真实曲线之间的损失值;
基于所述损失值计算每个所述预测曲线的滞后因子,并根据所述滞后因子确定每个所述预测曲线的滞后度;
根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型;
利用所述标准时序分析模型对用户输入的预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图表记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种时序数据滞后性处理方法,其特征在于,所述方法包括:
获取时序样本数据,对所述时序样本数据进行时序差分处理,得到差分数据集;
对所述差分数据集进行曲线拟合,得到真实曲线;
通过预先构建的多个时序分析模型,解析所述时序样本数据,得到多个时序解析数据,对所述多个时序解析数据进行时序差分处理,得到多个差分解析数据集,对多个差分解析数据集进行曲线拟合,获得多个预测曲线;
利用损失函数计算多个所述预测曲线和所述真实曲线之间的损失值;
基于所述损失值计算每个所述预测曲线的滞后因子,并根据所述滞后因子确定每个所述预测曲线的滞后度;
根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型;
利用所述标准时序分析模型对用户输入的预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。
2.如权利要求1所述的时序数据滞后性处理方法,其特征在于,所述对所述时序样本数据进行时序差分处理之前,所述方法还包括:
判断所述时序样本数据是否具有平稳性;
在所述时序样本数据具有平稳性时,不执行对时序样本数据的时序差分处理;
在所述时序样本数据不具有平稳性时,执行对时序样本数据的时序差分处理。
3.如权利要求1或2所述的时序数据滞后性处理方法,其特征在于,所述对所述时序样本数据进行时序差分处理,包括:
采用下述公式对所述时序样本数据进行时序差分处理:
Δyx=yx+1-yx
其中,Δyx是所述物体温度随时间变化数据的一阶差分,yx+1是在x+1时刻的数据,yx是在x时刻的数据。
4.如权利要求1所述的时序数据滞后性处理方法,其特征在于,所述对所述差分数据集进行曲线拟合,得到真实曲线,包括:
提取所述差分数据集中差分数据的时序特征;
利用所述时序特征对所述差分数据集中的差分数据进行坐标编码;
利用所述坐标编码将所述差分数据集中的差分数据映射至预先构建的坐标系中;
根据所述时序特征将坐标系中的差分数据进行连接,得到所述真实曲线。
5.如权利要求1所述的时序数据滞后性处理方法,其特征在于,所述时序分析模型为:
St+1=Xt+Yt
Xt=αSt+(1-α)(St-1-Yt-1)
Yt=β(Xt-Xt-1)+(1-β)Yt-1
其中,St表示所述差分数据集中在t时刻的差分数据,St-1表示所述差分数据集中在t-1时刻的差分数据,Xt表示t时刻的平滑值,Xt-1表示t-1时刻的平滑值,Yt表示t时刻的趋势值,Yt-1表示t-1时刻的趋势值,St+1表示所述差分解析数据集中在t+1时刻的差分解析数据,α和β为预设的不同的平滑系数。
6.如权利要求1所述的时序数据滞后性处理方法,其特征在于,所述基于所述损失值计算所述预测曲线的滞后因子,包括:
利用如下算法计算所述滞后因子τm
Figure FDA0002577005640000021
其中,arg min是使函数取得其最小值的所有自变量集合,
Figure FDA0002577005640000022
为解析值,τ为损失值,i为所述预测曲线的起始值,n为所述预测曲线的终点值。
7.如权利要求6所述的时序数据滞后性处理方法,其特征在于,所述根据所述滞后因子确定每个所述预测曲线的滞后度,包括:
利用如下算法计算所述滞后度scoredelay
Figure FDA0002577005640000023
其中,τm为所述预测曲线的滞后因子;
Figure FDA0002577005640000031
为τm平移后最小的均方根误差。
8.如权利要求6所述的时序数据滞后性处理方法装置,其特征在于,所述装置包括:
差分数据生成模块,用于获取时序样本数据,对所述时序样本数据进行时序差分处理,得到差分数据集;
真实曲线生成模块,用于对所述差分数据集进行曲线拟合,得到真实曲线;
预测曲线生成模块,用于通过预先构建的多个时序分析模型,解析所述时序样本数据,得到多个时序解析数据,对所述多个时序解析数据进行时序差分处理,得到多个差分解析数据集,对多个差分解析数据集进行曲线拟合,获得多个预测曲线;
损失值计算模块,用于利用损失函数计算多个所述预测曲线和所述真实曲线之间的损失值;
滞后度计算模块,用于基于所述损失值计算每个所述预测曲线的滞后因子,并根据所述滞后因子确定每个所述预测曲线的滞后度;
标准时序分析模型筛选模块,根据所述每个所述预测曲线的滞后度,从所述多个时序分析模型中筛选出标准时序分析模型;
数据分析模块,用于利用所述标准时序分析模型对用户输入的预设事件的时序数据进行数据分析,得到所述预设事件的发展趋势。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的时序数据滞后性处理方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的时序数据滞后性处理方法。
CN202010656657.9A 2020-07-09 2020-07-09 时序数据滞后性处理方法、装置、电子设备及存储介质 Pending CN111814106A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010656657.9A CN111814106A (zh) 2020-07-09 2020-07-09 时序数据滞后性处理方法、装置、电子设备及存储介质
PCT/CN2020/119091 WO2021151304A1 (zh) 2020-07-09 2020-09-29 时序数据滞后性处理方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010656657.9A CN111814106A (zh) 2020-07-09 2020-07-09 时序数据滞后性处理方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN111814106A true CN111814106A (zh) 2020-10-23

Family

ID=72842854

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010656657.9A Pending CN111814106A (zh) 2020-07-09 2020-07-09 时序数据滞后性处理方法、装置、电子设备及存储介质

Country Status (2)

Country Link
CN (1) CN111814106A (zh)
WO (1) WO2021151304A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215438A (zh) * 2020-11-09 2021-01-12 广东新禾道信息科技有限公司 一种应急灾害预警分析数据处理方法及系统
CN113393179A (zh) * 2021-08-18 2021-09-14 江苏中协智能科技有限公司 一种基于时序差分的数据集成系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968670B (zh) * 2012-10-23 2016-08-17 北京京东世纪贸易有限公司 预测数据的方法和装置
JP6109037B2 (ja) * 2013-10-23 2017-04-05 本田技研工業株式会社 時系列データ予測装置、時系列データ予測方法、及びプログラム
JP6318007B2 (ja) * 2013-11-29 2018-04-25 株式会社日立ハイテクノロジーズ データ処理方法、データ処理装置および処理装置
CN107871538A (zh) * 2016-12-19 2018-04-03 平安科技(深圳)有限公司 基于宏观因子的大数据预测方法及系统
CN109189762A (zh) * 2018-09-03 2019-01-11 深圳市智物联网络有限公司 一种工业物联网数据分析方法、系统及相关设备
CN110706823A (zh) * 2019-11-15 2020-01-17 广州地理研究所 一种基于滞后分析和lstm的呼吸系统疾病发病人数预测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215438A (zh) * 2020-11-09 2021-01-12 广东新禾道信息科技有限公司 一种应急灾害预警分析数据处理方法及系统
CN112215438B (zh) * 2020-11-09 2021-05-14 广东新禾道信息科技有限公司 一种应急灾害预警分析数据处理方法及系统
CN113393179A (zh) * 2021-08-18 2021-09-14 江苏中协智能科技有限公司 一种基于时序差分的数据集成系统
CN113393179B (zh) * 2021-08-18 2022-06-28 江苏中协智能科技有限公司 一种基于时序差分的数据集成系统

Also Published As

Publication number Publication date
WO2021151304A1 (zh) 2021-08-05

Similar Documents

Publication Publication Date Title
CN112148577B (zh) 数据异常检测方法、装置、电子设备及存储介质
CN109243619B (zh) 预测模型的生成方法、装置及计算机可读存储介质
CN113504935A (zh) 软件开发质量评估方法、装置、电子设备及可读存储介质
CN111814106A (zh) 时序数据滞后性处理方法、装置、电子设备及存储介质
CN111652279A (zh) 基于时序数据的行为评价方法、装置及可读存储介质
CN113327136A (zh) 归因分析方法、装置、电子设备及存储介质
CN112463530A (zh) 微服务系统的异常检测方法、装置、电子设备及存储介质
CN112306835A (zh) 用户数据监控分析方法、装置、设备及介质
CN111694844A (zh) 基于配置算法的企业运行数据分析方法、装置及电子设备
CN113268403A (zh) 时间序列的分析预测方法、装置、设备及存储介质
CN113849374A (zh) 中央处理器占用率预测方法、系统、电子设备及存储介质
CN113742069A (zh) 基于人工智能的容量预测方法、装置及存储介质
CN111460293B (zh) 信息推送方法、装置及计算机可读存储介质
CN111950707B (zh) 基于行为共现网络的行为预测方法、装置、设备及介质
CN113360139A (zh) 前端框架的集成方法、装置、电子设备及存储介质
CN113591459A (zh) 地址标准化处理方法、装置、电子设备及可读存储介质
CN112346838A (zh) 一种基于物联网的智能调度方法及装置
CN112990374A (zh) 图像分类方法、装置、电子设备及介质
CN112631903A (zh) 任务测试方法、装置、电子设备及存储介质
CN112148566A (zh) 计算引擎的监控方法、装置、电子设备及存储介质
CN111985194A (zh) 数据存储方法、装置、电子设备及存储介质
CN112541688A (zh) 业务数据校验方法、装置、电子设备及计算机存储介质
CN115691251A (zh) 基于物联网的工业操作教学实训系统、方法及设备
CN115394442A (zh) 一种发育评估方法、装置、设备及介质
CN113766312A (zh) 设备间的响应延迟计算方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40030783

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination