CN115545151A - 训练用于时间序列数据预测的预测模型的方法及相关设备 - Google Patents

训练用于时间序列数据预测的预测模型的方法及相关设备 Download PDF

Info

Publication number
CN115545151A
CN115545151A CN202211028602.9A CN202211028602A CN115545151A CN 115545151 A CN115545151 A CN 115545151A CN 202211028602 A CN202211028602 A CN 202211028602A CN 115545151 A CN115545151 A CN 115545151A
Authority
CN
China
Prior art keywords
population
series data
hyper
data
time series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211028602.9A
Other languages
English (en)
Inventor
郑凤
倪斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Shangtai Electronic Engineering Co ltd
Original Assignee
Nanjing Shangtai Electronic Engineering Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Shangtai Electronic Engineering Co ltd filed Critical Nanjing Shangtai Electronic Engineering Co ltd
Priority to CN202211028602.9A priority Critical patent/CN115545151A/zh
Publication of CN115545151A publication Critical patent/CN115545151A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种训练用于时间序列数据预测的预测模型的方法和相关设备。所述方法包括:基于获取的时间序列数据的缺失比例,对所述时间序列数据进行质量优化,得到优化时间序列数据;根据所述优化时间序列数据,利用经优化的麻雀搜索算法,对利用预测模型的超参数构建的超参数种群中个体进行更新,以训练所述预测模型的超参数,得到训练好的预测模型。本申请实施例利用变分模态分解方法将非稳定性的时间序列数据进行分解,能够在降低输入序列复杂度的同时提升训练精度,另外,利用自适应正弦干扰策略麻雀搜索算法,在麻雀搜索超参寻优算法的基础上引入了三种策略,在一定程度上克服了原来算法搜索速度较慢,收敛过早的缺点,从而提高模型训练精度。

Description

训练用于时间序列数据预测的预测模型的方法及相关设备
技术领域
本申请涉及时间序列预测技术领域,尤其涉及一种训练用于时间序列数据预测的预测模型的方法及相关设备。
背景技术
现有技术中对于时间序列数据的训练过程中大多数要求时序数据是稳定的,或者通过差分化后是稳定的,利用非平稳时间序列数据训练后得到的模型的预测效果会很差,并且在训练过程中,模型参数需要手动设置,存在人为的误差影响因素也较大。
发明内容
有鉴于此,本申请的目的在于提出一种训练用于时间序列数据预测的预测模型的方法及相关设备。
基于上述目的,本申请提供了一种训练用于时间序列数据预测的预测模型的方法,其特征在于,包括:
基于获取的时间序列数据的缺失比例,对所述时间序列数据进行质量优化,得到优化时间序列数据;
根据所述优化时间序列数据,利用经优化的麻雀搜索算法,对利用预测模型的超参数构建的超参数种群中个体进行更新,以训练所述预测模型的超参数,得到训练好的预测模型。
在一种可能的实现方式中,所述根据所述优化时间序列数据,利用麻雀搜索算法对预测模型的超参数进行训练,得到训练好的预测模型,包括:
利用扰动补偿因子更新构建好的超参数种群中个体的位置,得到初始种群;
利用正弦干扰策略更新所述初始种群,得到正弦干扰种群;
根据所述优化时间序列数据,计算得到所述正弦干扰种群中每个个体的适应度;
利用自适应柯西变异策略对所述正弦干扰种群中的最低的所述适应度的第一个体进行变异,得到第二个体;
判断所述正弦干扰种群是否达到最大迭代次数;
响应于所述正弦干扰种群达到最大迭代次数,将所述第一个体和所述第二个体中的最低的所述适应度对应的个体作为最终个体,并输出所述最终个体对应的最终超参数;将所述最终超参数作为所述预测模型的超参数,得到所述训练好的预测模型;
在一种可能的实现方式中,所述根据所述优化时间序列数据,计算得到所述正弦干扰种群中每个个体的适应度,包括:
获取所述优化时间序列数据对应的真预测结果;
将所述优化时间序列数据输入所述正弦干扰种群中每个个体对应的所述预测模型,得到每个个体对应的预测结果;
分别计算每一所述每个个体对应的预测结果和所述真预测结果的均方误差,得到所述正弦干扰种群中每个个体的适应度。
在一种可能的实现方式中,所述构建好的超参数种群通过下述方法构建:
利用立方混沌映射对超参数种群进行初始化,得到构建好的超参数种群。
在一种可能的实现方式中,所述利用扰动补偿因子更新构建好的超参数种群中个体的位置,得到初始种群,包括:
利用扰动补偿因子更新所述构建好的超参数种群中个体的位置,得到扰动种群;
计算所述构建好的超参数种群和所述扰动种群中的所有个体的适应度值,将所有适应度值低于预设的第一阈值的个体作为初始种群。
在一种可能的实现方式中,所述初始种群包括:发现者、跟随者和警戒者;所述正弦干扰种群包括:干扰发现者、更新跟随者和更新警戒者;
其中,所述利用正弦干扰策略更新所述初始种群,得到正弦干扰种群,包括:
利用正弦干扰策略对所述发现者的位置进行更新,得到干扰发现者;
对所述跟随者的位置进行更新,得到更新跟随者;
对所述警戒者的位置进行更新,得到更新警戒者。
在一种可能的实现方式中,所述所述基于获取的时间序列数据的缺失比例,对所述时间序列数据进行质量优化,得到优化时间序列数据,包括:
根据所述时间序列的数据缺失比例,以及与所述数据缺失比例相应的第二阈值,得到半优化时间序列数据;
判断所述半优化时间序列数据是否为非平稳型数据;
响应于所述半优化时间序列数据为非平稳型数据,利用变分模态分解方法将所述半优化时间序列数据分解,得到所述优化时间序列数据。
在一种可能的实现方式中,所述根据所述时间序列的数据缺失比例,以及与所述数据缺失比例相应的第二阈值,得到半优化时间序列数据,包括:
响应于所述时间序列数据缺失比例小于所述第二阈值,将缺失的所述时间序列数据删除,得到所述半优化时间序列数据;
响应于所述时间序列的数据缺失比例大于等于所述第二阈值,计算缺失的时间序列数据的前十个所述时间序列数据的平均值,利用所述平均值对缺失的时间序列数据进行填充,得到所述半优化时间序列数据。
基于同一发明构思,本说明书一个或多个实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任意一项所述的训练用于时间序列数据预测的预测模型的方法。
基于同一发明构思,本说明书一个或多个实施例还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述任一所述的训练用于时间序列数据预测的预测模型的方法。
从上面所述可以看出,本申请实施例的训练用于时间序列数据预测的预测模型的方法及相关设备,基于获取的时间序列数据的缺失比例,对所述时间序列数据进行质量优化,得到优化时间序列数据;根据所述优化时间序列数据,利用经优化的麻雀搜索算法,对利用预测模型的超参数构建的超参数种群中个体进行更新,以训练所述预测模型的超参数,得到训练好的预测模型。对于时间序列数据而言,利用变分模态分解方法将非稳定时间序列数据进行分解,能够在降低输入序列复杂度的同时提升训练精度。此外,为了避免人为设置参数对模型带来的影响,在麻雀搜索超参数寻优算法的基础上引入了三种策略,能够使得模型在输入数据类型的不同的基础上自动调整模型超参数的设置,从而达到提高训练后模型的预测精度的效果。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的训练用于时间序列数据预测的预测模型的方法流程图;
图2为本申请实施例的对时间序列数据预处理的流程图;
图3为本申请实施例的利用麻雀搜索算法对预测模型的超参数进行训练的流程图;
图4为本申请实施例的电子设备结构图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
如背景技术部分所述,相关技术中的时间序列数据训练方法中,要求时序数据需要稳定,或者时序数据经差分化后是稳定的,因为相关技术中的时间序列数据预测模型只能捕捉线性关系,不能捕捉非线性关系,若时序数据不稳定,那么最终训练好的模型的预测结果会很差。此外,相关技术中的时间序列数据预测模型在训练过程中的超参数需要自行手动设置,导致模型训练过程遭受人为的误差影响因素也较大。
综合上述考虑,本申请实施例提出一种训练用于时间序列数据预测的预测模型的方法,基于获取的时间序列数据的缺失比例,对所述时间序列数据进行质量优化,得到优化时间序列数据;根据所述优化时间序列数据,利用经优化的麻雀搜索算法,对利用预测模型的超参数构建的超参数种群中个体进行更新,以训练所述预测模型的超参数,得到训练好的预测模型。从而能够在有效的降低时间序列数据的复杂度的同时,提升训练模型的精度。此外,利用优化过的麻雀搜索算法对超参数进行训练,能够使得模型在输入数据类型不同的基础上自动调整模型超参数的设置,从而达到提高模型训练后的预测精度的效果。
以下,通过具体的实施例来详细说明本申请实施例的技术方案。
参考图1,本申请实施例的训练用于时间序列数据预测的预测模型的方法,包括以下步骤:
步骤S101,基于获取的时间序列数据的缺失比例,对所述时间序列数据进行质量优化,得到优化时间序列数据;
步骤S102,根据所述优化时间序列数据,利用经优化的麻雀搜索算法,对利用预测模型的超参数构建的超参数种群中个体进行更新,以训练所述预测模型的超参数,得到训练好的预测模型。
针对步骤S101,参考图2,为本申请实施例的时间序列数据的预处理流程图。具体的,首先对获取到的时间序列数据进行检测,具体检测时间序列数据是否存在数据缺失的情况,若存在数据缺失的情况,那么检测缺失的数据占比是否小于总数据的第二阈值,在本实施例中,第二阈值取十分之一;当时间序列数据缺失的比例小于第二阈值时,将缺失的时间序列数据删除,得到半优化时间序列数据。获取到的数据一般以数据库的形式呈现,缺失数值会以特殊符号表示,因此上述将缺失的时间序列数据删除指的是将该特殊符号删除。
当时间序列数据缺失的比例大于等于第二阈值时,计算每一个缺失的时间序列数据的前十个时间序列数据的平均值,利用该平均值对上述缺失的时间序列数据进行填充,最终得到半优化时间序列数据。
进一步的,需要判断经上述处理步骤优化过的半优化时间序列数据是否为非平稳型数据,在本实施例中,取线性数据或呈周期性的数据为平稳型数据。如果并不为非平稳型数据,即该数据为平稳型数据,则可以直接将该数据用于后续的模型训练中,因为预测模型对于平稳型数据的处理效果较好,因此平稳型数据可以直接用于后续的训练过程。而对于非平稳型数据而言,例如非线性或者非周期性的数据,预测模型对于非平稳型数据的处理效果较差,因此需要对上述非平稳型的半优化时间序列数据进行进一步处理,使其成为能很好适应模型的平稳型数据。
在本实施例中,采用的是变分模态分解方法,利用变分模态分解方法将非平稳型时间序列数据分解成六个相对平稳,频率逐级变化的本征模态分量,即为上述的优化时间序列数据。需要注意的是,若利用六个本征模态分量作为预测模型的训练数据,在后续的训练过程中,将六个本征模态分量输入预测模型后,会得到六个模态分量预测结果,需要将六个本征模态分量预测结果进行叠加重构后,得到预测结果,之后再利用该预测结果与真预测结果对预测模型进行后续的训练步骤。
在信号处理中,变分模态分解方法是一种信号分解估计方法。该方法在获取分解分量的过程中通过迭代搜寻变分模型最优解来确定每个分量的频率中心和带宽,从而能够自适应地实现信号的频域剖分及各分量的有效分离。变分模态分解的整体框架是变分问题,使得每个模态的估计带宽之和最小,其中假设每个“模态”是具有不同中心频率的有限带宽,为解决这一变分问题,采用了交替方向乘子法,不断更新各模态及其中心频率,逐步将各模态解调到相应的基频带,最终各个模态即相应的中心频率被一同提取出来。
具体的利用变分模态分解方法对半优化时间序列数据进行分解的过程以及对六个本征模态分量进行叠加重构的过程,本领域技术人员应当知晓,故在此不再赘述。
针对步骤S102,在对上述数据进行优化结束之后,需要对预测模型的超参数进行训练,本申请中预测模型为长短期记忆神经网络,构建长短期记忆神经网络为本领域技术人员应当知晓的,在此不再赘述。
具体的,参考图3,利用引入三种策略的麻雀搜索算法对上述超参数进行训练。
首先,对麻雀搜索算法中种群的参数进行初始化,包括发现者所占种群比例,警戒者所占种群比例,跟随者所占比例,搜索解空间上限,搜索解空间下限以及最大迭代次数Tmax,在本实施例中,以对预测模型的学习率进行训练为例,设置发现者所占种群比例为70%,警戒者所占种群比例为10%,跟随者所占比例为20%,搜索解空间上限为0.1,搜索解空间下限为0,种群个体值为1000,最大迭代次数为1000。
需要注意的是,上述对于数值的具体设置,本领域技术人员可以根据超参数的不同或者需求的不同自行更改替换,并不仅限于上述数值范围之内,超参数的范围也并不限于学习率,还可以包括隐藏层的神经元个数等。
进一步的,利用立方混沌映射对种群进行初始化,得到构建好的超参数种群。
通过下式利用立方混沌映射对种群进行初始化:
yi+1=4yi 3-3yi,-1≤yi≤1,i=1,2,...,N,y0≠0
Figure BDA0003816582180000071
其中,yi表示未经映射的个体,yi+1表示经映射后的个体,i表示种群个体的序数,N表示个体的个数,Xi表示经映射后个体的位置,lb表示解空间的上界,ub表示解空间的下界。
对上述1000个个体进行立方混沌映射后,得到构建好的超参数种群,个体值为1000。
进一步的,利用扰动补偿因子对上述构建好的超参数种群中的个体位置进行更新,更新后的个体构成扰动种群。
通过下式计算所述扰动种群个体的位置:
Ri=Xi+(-1)i·rand()·(ub-lb)
其中,Ri表示扰动种群个体的位置,Xi表示经映射后个体的位置,i表示种群个体的序数,rand()表示0-1的随机数,lb表示解空间的上界,ub表示解空间的下界。
进一步的,计算所述构建好的超参数种群中所有个体的适应度值,并计算所述扰动种群中所有个体的适应度值,比较两个种群中个体的适应度值的大小,将所有适应度值低于预设的第一阈值的个体作为初始种群。
适应度值是根据优化时间序列数据计算得到的,具体的,获取优化时间序列数据对应的真预测结果,进一步的,将所述优化时间序列数据输入所述正弦干扰种群中每个个体对应的所述预测模型,得到每个个体对应的预测结果,进一步的,分别计算每一所述每个个体对应的预测结果和所述真预测结果的均方误差,得到所述正弦干扰种群中每个个体的适应度。
通过下式计算所述适应度:
Figure BDA0003816582180000081
其中,n表示预测结果的个数,a表示预测结果的序数,Ya表示预测结果,
Figure BDA0003816582180000082
表示真预测结果。
由上述可知,计算得到的适应度值越小,证明预测模型训练后的性能越好,那么为了得到更好性能的预测模型,我们需要获取的是能够获得更小适应度值对应的超参数。
经过上述步骤得到的初始种群中的个体,因前述扰动补偿因子的引入,使得构建好的种群中个体的位置更加均匀的分布,有效防止了个体扎堆情况的发生,且在选取初始种群时,也考虑到了未引入扰动补偿因子扰动的种群,最终选取的是两个种群中质量最优的个体,有效提升了种群的质量和遍历性。
进一步的,得到初始种群之后,利用正弦干扰策略更新所述初始种群,得到正弦干扰种群。具体的,初始种群中包括发现者、跟随者和警戒者,利用正弦干扰策略对发现者的位置进行更新,得到干扰发现者。
通过下式更新所述发现者的位置:
Figure BDA0003816582180000083
Figure BDA0003816582180000084
其中,
Figure BDA0003816582180000085
表示干扰发现者的位置,
Figure BDA0003816582180000086
表示发现者的位置,w(t)表示权重,α∈(0,1],表示一个随机数,b表示发现者的序数,Tmax表示最大迭代次数,R2表示预警值,ST表示安全值,Q表示服从正态分布的随机数,L表示单位向量,wmax表示权重变化范围的最大值,wmin表示权重变化范围的最小值,t表示当前迭代次数。
在上述公式中,当R2<ST时,表示觅食环境周围无捕食者,发现者进行广域搜索;当R2≥ST时,表示部分麻雀发现捕食者,则需飞往其他安全区域进行捕食。
在利用正弦干扰策略对发现者位置进行更新后,在算法寻优初期,权重因子大,提升了发现者探索未知区域的能力,从而使得算法的全局搜索能力范围广;在算法寻优后期,权重因子减小,算法局部开发能力强,使算法跳出局部最优的可能性增加,有效提高算法的收敛速度,提升了种群间的信息交流能力,改善了算法的全局搜索能力。
进一步的,对跟随者的位置进行更新,得到更新跟随者。
通过下式更新所述跟随者的位置:
Figure BDA0003816582180000091
其中,
Figure BDA0003816582180000092
表示更新跟随者的位置,Q表示服从正态分布的随机数,
Figure BDA0003816582180000093
表示当前迭代次数中种群中个体最差的位置,
Figure BDA0003816582180000094
表示跟随者的位置,c表示跟随者的序数,m表示跟随者的数量,
Figure BDA0003816582180000095
表示当前迭代次数中发现者的最优位置,A表示1×d矩阵且其值随机赋值为1或-1,并且A+=AT(AAT)-1,t表示当前迭代次数。
在上述公式中,当c>m/2时,表示适应度值较低的第c个跟随者没用足够的食物需要飞往其他地方搜寻食物。当c≤m/2时,表示跟随者的位置。
进一步的,对警戒者的位置进行更新,得到更新警戒者。
通过下式更新所述警戒者的位置:
Figure BDA0003816582180000096
其中,
Figure BDA0003816582180000097
表示更新警戒者的位置,
Figure BDA0003816582180000098
表示当前迭代次数中所有个体中适应度最低的个体的位置,β表示步长控制参数,
Figure BDA0003816582180000099
表示警戒者的位置,fd表示当前迭代次数中第d个警戒者的适应度,fg表示当前迭代次数中所有个体中最低的适应度,K表示随机数,且K∈[-1,1],
Figure BDA00038165821800000910
表示当前迭代次数中所有个体中适应度最高的个体的位置,fw表示当前迭代次数中所有个体中最高的适应度,ε表示很小的常数,以避免分母为0的情况。
在上述公式中,当fi≠fg时,表示在群体边缘的麻雀的位置变化;当fi=fg时,表示处于种群中间的麻雀意识到了危险,需要靠近其他的麻雀以此尽量减少它们被捕食的风险。
进一步的,当利用正弦干扰策略更新初始种群得到正弦干扰种群后,计算正弦干扰种群中所有个体的适应度,选取适应度最低的个体作为第一个体,利用自适应柯西变异策略对所述第一个体进行变异,得到第二个体。因为在迭代过程中,群体中个体会快速同化,导致容易陷入局部最优解的问题,因此需要对正弦干扰种群进行一定的变异,避免算法陷入局部最优解,有效提升了种群的抗停滞能力。
具体的,通过下式对所述第一个体进行变异:
Figure BDA0003816582180000101
其中,
Figure BDA0003816582180000102
表示第二个体的位置,
Figure BDA0003816582180000103
表示当前迭代次数中所有个体中适应度最低的个体的位置,Nt表示变异步长,Cauchy(0,1)表示柯西分布函数产生的随机数。
进一步的,由于第二个体的位置不一定优于第一个体的位置,则比较第一个体和第二个体的适应度值。如果第一个体适应度值低于第二个体的适应度值,则保留第一个体。如果第一个体适应度值高于第二个体的适应度值,则将第二个体替换第一个体。
通过下式计算得到所述最终个体的位置:
Figure BDA0003816582180000104
其中,
Figure BDA0003816582180000105
表示最终个体的位置,
Figure BDA0003816582180000106
表示第二个体的位置,
Figure BDA0003816582180000107
表示当前迭代次数中所有个体中适应度最低的个体的位置,f(·)表示计算适应度。
进一步的,判断正弦干扰种群是否达到最大的迭代次数,如果并未达到最大的迭代次数,则按照上述第一个体和第二个体的替换规则对最优个体进行替换后,再进行下一次迭代;若达到最大的迭代次数,则将第一个体和第二个体中拥有最低适应度的个体作为最终个体,并输出该最终个体对应的最终超参数,并将该最终超参数作为预测模型的超参数,当对预测模型的所有超参数均迭代训练完成,最终得到训练好的预测模型。
通过上述实施例可以看出,本申请实施例所述的训练用于时间序列数据预测的预测模型的方法,对获取的时间序列数据进行优化,对缺失的数据进行删除或者填充,以防止缺失的数据对后续预测模型的训练造成影响,进一步的,在麻雀搜索超参数寻优算法的基础上引入三种策略,在种群初始化时引入立方混沌映射和扰动补偿因子的策略,提升了初始种群的质量和便利性,利用正弦干扰策略对发现者的位置进行更新,有效提升了种群间的信息交流能力,改善了算法的全局搜索能力,进一步的,利用自适应柯西变异策略对当前迭代次数中最优个体进行变异,有效避免算法陷入局部最优解,提高了种群的抗停滞能力。综上所述,利用优化后的麻雀搜索算法对预测模型的超参数进行训练,可以使得模型能够免受数据波动性的影响,克服人为选取参数导致训练出的模型在预测过程中误差较大的问题,有效提升了训练预测模型的效率以及有效提升了训练好的预测模型的预测精度。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的训练用于时间序列数据预测的预测模型的方法。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的训练用于时间序列数据预测的预测模型的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的训练用于时间序列数据预测的预测模型的方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的训练用于时间序列数据预测的预测模型的方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种训练用于时间序列数据预测的预测模型的方法,其特征在于,包括:
基于获取的时间序列数据的缺失比例,对所述时间序列数据进行质量优化,得到优化时间序列数据;
根据所述优化时间序列数据,利用经优化的麻雀搜索算法,对利用预测模型的超参数构建的超参数种群中个体进行更新,以训练所述预测模型的超参数,得到训练好的预测模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述优化时间序列数据,利用经优化的麻雀搜索算法,对利用预测模型的超参数构建的超参数种群中个体进行更新,以训练所述预测模型的超参数,得到训练好的预测模型,包括:
利用扰动补偿因子更新构建好的超参数种群中个体的位置,得到初始种群;
利用正弦干扰策略更新所述初始种群,得到正弦干扰种群;
根据所述优化时间序列数据,计算得到所述正弦干扰种群中每个个体的适应度;
利用自适应柯西变异策略对所述正弦干扰种群中的最低的所述适应度的第一个体进行变异,得到第二个体;
判断所述正弦干扰种群是否达到最大迭代次数;
响应于所述正弦干扰种群达到最大迭代次数,将所述第一个体和所述第二个体中的最低的所述适应度对应的个体作为最终个体,并输出所述最终个体对应的最终超参数;将所述最终超参数作为所述预测模型的超参数,得到所述训练好的预测模型。
3.根据权利要求2所述的方法,其特征在于,所述根据所述优化时间序列数据,计算得到所述正弦干扰种群中每个个体的适应度,包括:
获取所述优化时间序列数据对应的真预测结果;
将所述优化时间序列数据输入所述正弦干扰种群中每个个体对应的所述预测模型,得到每个个体对应的预测结果;
分别计算每一所述每个个体对应的预测结果和所述真预测结果的均方误差,得到所述正弦干扰种群中每个个体的适应度。
4.根据权利要求2所述的方法,其特征在于,所述构建好的超参数种群通过下述方法构建:
利用立方混沌映射对超参数种群进行初始化,得到构建好的超参数种群。
5.根据权利要求2所述的方法,其特征在于,所述利用扰动补偿因子更新构建好的超参数种群中个体的位置,得到初始种群,包括:
利用扰动补偿因子更新所述构建好的超参数种群中个体的位置,得到扰动种群;
计算所述构建好的超参数种群和所述扰动种群中的所有个体的适应度值,将所有适应度值低于预设的第一阈值的个体作为初始种群。
6.根据权利要求2所述的方法,其特征在于,所述初始种群包括:发现者、跟随者和警戒者;所述正弦干扰种群包括:干扰发现者、更新跟随者和更新警戒者;
其中,所述利用正弦干扰策略更新所述初始种群,得到正弦干扰种群,包括:
利用正弦干扰策略对所述发现者的位置进行更新,得到干扰发现者;
对所述跟随者的位置进行更新,得到更新跟随者;
对所述警戒者的位置进行更新,得到更新警戒者。
7.根据权利要求1所述的方法,其特征在于,所述基于获取的时间序列数据的缺失比例,对所述时间序列数据进行质量优化,得到优化时间序列数据,包括:
根据所述时间序列的数据缺失比例,以及与所述数据缺失比例相应的第二阈值,得到半优化时间序列数据;
判断所述半优化时间序列数据是否为非平稳型数据;
响应于所述半优化时间序列数据为非平稳型数据,利用变分模态分解方法将所述半优化时间序列数据分解,得到所述优化时间序列数据。
8.根据权利要求7所述的方法,其特征在于,所述根据所述时间序列的数据缺失比例,以及与所述数据缺失比例相应的第二阈值,得到半优化时间序列数据,包括:
响应于所述时间序列数据缺失比例小于所述第二阈值,将缺失的所述时间序列数据删除,得到所述半优化时间序列数据;
响应于所述时间序列的数据缺失比例大于等于所述第二阈值,计算缺失的时间序列数据的前十个所述时间序列数据的平均值,利用所述平均值对缺失的时间序列数据进行填充,得到所述半优化时间序列数据。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任意一项所述的方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至8任一所述方法。
CN202211028602.9A 2022-08-25 2022-08-25 训练用于时间序列数据预测的预测模型的方法及相关设备 Pending CN115545151A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211028602.9A CN115545151A (zh) 2022-08-25 2022-08-25 训练用于时间序列数据预测的预测模型的方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211028602.9A CN115545151A (zh) 2022-08-25 2022-08-25 训练用于时间序列数据预测的预测模型的方法及相关设备

Publications (1)

Publication Number Publication Date
CN115545151A true CN115545151A (zh) 2022-12-30

Family

ID=84724780

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211028602.9A Pending CN115545151A (zh) 2022-08-25 2022-08-25 训练用于时间序列数据预测的预测模型的方法及相关设备

Country Status (1)

Country Link
CN (1) CN115545151A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056847A (zh) * 2023-10-10 2023-11-14 中南大学 一种流式数据的异常检测方法、系统、设备及存储介质
CN117272051A (zh) * 2023-11-21 2023-12-22 浪潮通用软件有限公司 一种基于lstm优化模型的时间序列预测方法、设备及介质
CN117388681A (zh) * 2023-12-07 2024-01-12 国网辽宁省电力有限公司 一种高压隔离开关故障诊断方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117056847A (zh) * 2023-10-10 2023-11-14 中南大学 一种流式数据的异常检测方法、系统、设备及存储介质
CN117056847B (zh) * 2023-10-10 2024-01-30 中南大学 一种流式数据的异常检测方法、系统、设备及存储介质
CN117272051A (zh) * 2023-11-21 2023-12-22 浪潮通用软件有限公司 一种基于lstm优化模型的时间序列预测方法、设备及介质
CN117272051B (zh) * 2023-11-21 2024-03-08 浪潮通用软件有限公司 一种基于lstm优化模型的时间序列预测方法、设备及介质
CN117388681A (zh) * 2023-12-07 2024-01-12 国网辽宁省电力有限公司 一种高压隔离开关故障诊断方法

Similar Documents

Publication Publication Date Title
CN115545151A (zh) 训练用于时间序列数据预测的预测模型的方法及相关设备
Dias et al. Concept lattices reduction: Definition, analysis and classification
US20190354809A1 (en) Computational model management
CN111581046A (zh) 数据异常检测方法、装置、电子设备及存储介质
US20200320337A1 (en) Method for managing training data
US9330358B1 (en) Case-based reasoning system using normalized weight vectors
Yang et al. Estimating time-varying graphical models
CN110428137B (zh) 一种风险防控策略的更新方法及装置
CN110709862B (zh) 计算方法决定系统、计算方法决定方法、记录介质
CN109586950B (zh) 网络场景识别方法、网络管理设备、系统及存储介质
EP3239905A1 (en) Methods and apparatus for use in predicting non-stationary time-series data
CN113849848B (zh) 一种数据权限配置方法及系统
CN113449132A (zh) 一种向量检索方法及装置
CN113164056A (zh) 睡眠预测方法、装置、存储介质及电子设备
CN116188878A (zh) 基于神经网络结构微调的图像分类方法、装置和存储介质
CN111159481A (zh) 图数据的边预测方法、装置及终端设备
Jiang et al. A short-term wind power prediction approach based on ensemble empirical mode decomposition and improved long short-term memory
Kokhazadeh et al. A Design space exploration methodology for enabling tensor train decomposition in edge devices
CN114580791B (zh) 膨化机工作状态识别方法、装置、计算机设备、存储介质
CN116090618A (zh) 一种电力通信网的运行态势感知方法和装置
CN114358186A (zh) 一种数据处理方法、装置及计算机可读存储介质
CN113191477A (zh) 碱式电解槽的温度传感器故障诊断方法与装置
KR102546176B1 (ko) 영상의 안정성을 위한 후처리 방법
Yastrebov et al. An analysis of evolutionary algorithms for multiobjective optimization of structure and learning of fuzzy cognitive maps based on multidimensional medical data
CN117973604A (zh) 一种混合预测模型的负荷短期预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination