CN117609905A - 一种监测数据预测方法、系统、设备以及可读存储介质 - Google Patents

一种监测数据预测方法、系统、设备以及可读存储介质 Download PDF

Info

Publication number
CN117609905A
CN117609905A CN202311351283.XA CN202311351283A CN117609905A CN 117609905 A CN117609905 A CN 117609905A CN 202311351283 A CN202311351283 A CN 202311351283A CN 117609905 A CN117609905 A CN 117609905A
Authority
CN
China
Prior art keywords
monitoring data
prediction
calculating
sequences
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311351283.XA
Other languages
English (en)
Inventor
杨柳
侯丽娟
周宇超
马征
刘恒
文煜轩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Research Institute Of Yibin Southwest Jiaotong University
Southwest Jiaotong University
Original Assignee
Research Institute Of Yibin Southwest Jiaotong University
Southwest Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Research Institute Of Yibin Southwest Jiaotong University, Southwest Jiaotong University filed Critical Research Institute Of Yibin Southwest Jiaotong University
Publication of CN117609905A publication Critical patent/CN117609905A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2433Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种监测数据预测方法、系统、设备以及可读存储介质,涉及数据监测技术领域,包括获取预设时间段内的若干组监测数据序列;由全部监测数据序列对应的重组数据构成数据集,将所述数据集随机划分为训练集和测试集;建立多种时间序列预测模型,利用所述训练集和测试集分别对多种时间序列预测模型进行训练和测试,根据每个时间序列预测模型的预测结果计算得到预测误差;根据每个时间序列预测模型的预测误差,采用熵权法计算每个时间序列预测模型的权重,计算得到最终预测结果,本发明用于解决现有技术中的预测模型大部分均采用单一模型进行预测,采集的数据会带有一定的随机性和复杂性,存在模态混叠的技术问题。

Description

一种监测数据预测方法、系统、设备以及可读存储介质
技术领域
本发明涉及数据监测技术领域,具体而言,涉及一种监测数据预测方法、系统、设备以及可读存储介质。
背景技术
在数据监测系统中,由于受到传感器自身因素或复杂环境的影响,传感器采集的数据会带有一定的随机性和复杂性,存在模态混叠的情况,若直接采用经典的时间序列预测模型对数据进行预测则会产生较大的误差。目前针对采集的时序数据,已有大量的预测模型的已提出,但提出用于时序数据的预测模型大部分均采用单一模型进行预测,且由于环境或传感器自身因素影响,采集的数据会带有一定的随机性和复杂性,并存在模态混叠的情况。
发明内容
本发明的目的在于提供一种一种监测数据预测方法、系统、设备以及可读存储介质,以改善上述问题。为了实现上述目的,本发明采取的技术方案如下:
第一方面,本申请提供了一种监测数据预测方法,包括:
获取预设时间段内的若干组监测数据序列,对每一组监测进行预处理以剔除异常点和填补空缺值;
采用自适应控制策略的完全自适应噪声集合经验模态分解法对预处理后的每一组监测数据序列进行分解,将每一组监测数据序列分解为若干组模态分量序列;
采用熵值自动重组模型对每组监测数据序列对应的若干组模态分量序列进行熵值重组,得到每组监测数据序列对应的重组数据;
由全部监测数据序列对应的重组数据构成数据集,将所述数据集随机划分为训练集和测试集;
建立多种时间序列预测模型,利用所述训练集和测试集分别对多种时间序列预测模型进行训练和测试,根据每个时间序列预测模型的预测结果计算得到预测误差;
根据每个时间序列预测模型的预测误差,采用熵权法计算每个时间序列预测模型的权重,根据每个时间序列预测模型预测结果和权重计算得到最终预测结果。
第二方面,本申请还提供了一种监测数据预测装置,包括:
预处理模块:用于获取预设时间段内的若干组监测数据序列,对每一组监测进行预处理以剔除异常点和填补空缺值;
分解模块:用于采用自适应控制策略的完全自适应噪声集合经验模态分解法对预处理后的每一组监测数据序列进行分解,将每一组监测数据序列分解为若干组模态分量序列;
重组模块:用于采用熵值自动重组模型对每组监测数据序列对应的若干组模态分量序列进行熵值重组,得到每组监测数据序列对应的重组数据;
数据集划分模块:用于由全部监测数据序列对应的重组数据构成数据集,将所述数据集随机划分为训练集和测试集;
预测模块:用于建立多种时间序列预测模型,利用所述训练集和测试集分别对多种时间序列预测模型进行训练和测试,根据每个时间序列预测模型的预测结果计算得到预测误差;
计算模块:用于根据每个时间序列预测模型的预测误差,采用熵权法计算每个时间序列预测模型的权重,根据每个时间序列预测模型预测结果和权重计算得到最终预测结果。
第三方面,本申请还提供了一种监测数据预测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现所述监测数据预测方法的步骤。
第四方面,本申请还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于监测数据预测方法的步骤。
本发明的有益效果为:
本发明采用改进的带有自适应噪声的完备集合经验模式分解方法对原始监测数据进行分解,可以将监测数据按照不同的频带进行分解得到多个分量,然后再采用排列熵自动重组算法对多分量进行重组,将分量进行合并得到重组数据,以减少整个算法的时间复杂度。最后采用各经典时序预测模型对各重组数据进行预测,将各模型预测的结果通过熵权法赋予权值后乘以权值再相加得到最终的预测结果。经过实验表明,本发明预测结果的精确度远远高于各经典时序预测模型的结果,具有较大的可行性。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例中所述的监测数据预测方法流程示意图;
图2为本发明实施例中所述的模态分量序列的示意图;
图3为本发明实施例中所述的重组数据的示意图;
图4为本发明实施例中所述的监测数据预测装置结构示意图一;
图5为本发明实施例中所述的监测数据预测装置结构示意图二;
图6为本发明实施例中所述的监测数据预测设备结构示意图。
图中标记:
800、监测数据预测设备;801、处理器;802、存储器;803、多媒体组件;804、I/O接口;805、通信组件。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
实施例1:
本实施例提供了一种监测数据预测方法。
参见图1,图中示出了本方法包括:
S1.获取预设时间段内的若干组监测数据序列,对每一组监测进行预处理以剔除异常点和填补空缺值,具体的,所述监测数据可以为桥梁的温度监测数据或支座位移数据,例如,获取桥梁在60天内的支座位移数据,将2小时或4小时内的支座位移数据作为一组监测数据序列D1=(x1,x2…xi…xm);
具体的,所述步骤S1包括:
S11.对每一组监测数据序列进行均值方差归一化处理,具体的,对监测数据序列中的任意一个数据进行归一化处理:
式中,xi表示归一化前的原始数据,xi *表示归一化后的数据,μ代表均值,σ代表标准差。
S12.根据归一化处理后的监测数据序列,利用基于密度的聚类模型()剔除离群点计算得到对应的簇集C={C1,C2,...,Ck},具体如下:
1)确定监测数据序列D1==(x1,x2…xi…xm)的邻域参数(Eps,MinPts),其中,Eps表示邻域半径,用于决定一个监测数据的领域大小,MinPts表示邻域中数据对象数目阈值;
2)初始化核心对象集合聚类簇数k=0、未访问样本集合Γ=D,簇集
3)以距离度量方式,寻找样本xi的Eps-邻域子样本集NEps(xi),若子样本集的样本数量满足|NEps(xi)|≥MinPts,则将样本xi加入集合Ω:Ω=Ω∪{xi};
4)若集合则算法结束,得到簇集C={C1,C2,...,Ck},否则进入步骤5);
5)在集合Ω中,随机选择一个核心对象o,将当前聚类簇Ωcur={o}初始化,初始化类别序号k=k+1,初始化当前簇样本集合Ck={o},更新集合Γ=Γ-{o};
6)若则Ck生成完毕,更新簇集C={C1,C2,...,Ck},更新集合Ω=Ω-Ck,进入步骤3),否则更新集合Ω=Ω-Ck
7)在Ωcur中选择出一个核心对象o′,通过邻域距离阈值Eps找出所有的邻域子样本集NEps(o′),令Δ=NEps(o′)∩Γ,更新集合Ck=Ck∪Δ,更新集合Γ=Γ-Δ,更新Ωcur=Ωcur∪(Δ∩Ω)-o′,进入步骤6)。
S13.将监测数据序列中不属于簇集的数值作为异常点,并在监测数据序列中剔除所述异常点后得到新的监测数据序列D2=(x1,x2…xj…xn);
具体的,本方法还包括:
S14.计算监测数据序列D2=(x1,x2…xj…xn)的全局标准差σ;
S15.确定空缺值的位置,并根据空缺值的位置确定空缺值对应的相似点的搜寻范围;优选的,令缺失值为xj在监测数据序列中的第k个位置,此时则在xj前后k个数据内寻找最可能的相似样本,若j-k小于等于0,则范围为[0,j+k],若j+k大于等于n,则范围为[j-k,n-1]。
S16.在搜寻范围寻找出若干个相似点,并计算每个相似点加入监测数据序列后的标准差;
S17.根据所述标准差与全局标准差确定相似点的相似点加权值包括:
1、分别建立用于存储相似值的空列表X和用于存储相似加权值的空列表W;
2、将xa,a∈[j-k,j+k]加入列表X中,并计算当前列表X的标准差σ′;
3、判断标准差σ′与全局标准差σ的大小,若σ′小于σ,则表示xa为xj的相似点;否则,则认为xa不是xj的相似点,将xa从列表X中删除;
4、计算标准差σ′与全局标准差σ的差值Δσ;
5、根据差值Δσ计算相似点加权值wi,并将wi加入列表W中,其中,wi的计算方法为:
6、依次遍历[j-k,j+k]中的每个数据点,并重复步骤2~5,得到与xt的相似点列表X及其对应的相似加权值列表W。
S18.依次计算每个相似点与对应的相似点加权值的联合期望值xj′,对全部联合期望值进行加权后计算得到最相似估计值xj′,具体的,联合期望值计算方法如下:
xj′=∑xa·wi,xa∈X,wi∈W;
S19.利用所述最相似估计值填补空缺值后得到监测数据序列χ,所述序列χ中包括N个数据值。
基于以上实施例,本方法还包括:
S2.采用自适应控制策略的完全自适应噪声集合经验模态分解法对预处理后的每一组监测数据序列进行分解,将每一组监测数据序列分解为若干组模态分量序列;
具体的,所述步骤S2包括:
S21.对一组监测数据序列χ添加白噪声β1E1(w(e))后得到向量组χ(e),其中,E1(·)表示经过EMD分解后的第1个模态向量,w(e)表示原始高斯白噪声的第e个IMF分量,β1表示第1个分量噪声的信噪比与该噪声分量标准差之比。
S22.计算所述向量组的局部平均值得到第一残差分量r1
r1=<M(χ(e))>;
式中,M()表示计算局部平均值,<>表示取均值。
S23.计算监测数据序列与第一残差分量的差值得到第一模态分量序列imf1=χ-r1
S24.重复对第一残差分量,添加白噪声后得到新的向量组;
计算所述新的向量组的局部平均值得到第二残差分量r2
计算第一残差分量与第二残差分量的差值得到第二模态分量序列imf2
根据第二残差分量和第二模态分量序列循环计算,得到监测数据序列对应的若干组模态分量序列imf1、imf2…imfp,请参阅图2,其中,每一组模态分量序列均包括N个数据。
基于以上实施例,本方法还包括:
S3.采用熵值自动重组模型对每组监测数据序列对应的若干组模态分量序列进行熵值重组,得到每组监测数据序列对应的重组数据;
具体的,所述步骤S3包括:
其中,排列熵计算包括:
S31.对一组模态分量序列进行粗粒化处理得到粗粒化序列;
本实施例中,以imfp={lv|v=1,2,3,...,N}为例进行说明,对imfp进行粗粒化处理:
式中,表示粗粒化处理后的数据,s表示尺度因子,/>表示对/>取整,当s=1时,粗粒化序列即为原数据序列imfp={lv|v=1,2,3,...,N}为例进行说明,
对imfp进行粗粒化后得到Y={yi|i=1,2,...,N}。
S32.对粗粒化序列进行空间重构后得到重构矩阵;
其中,τ为延迟时间,m为嵌入维数,对于第j行的元素,分别为原时序数据第j个数据、第j+τ个数据、…、第j+(m-1)τ个元素。
S33.计算重构矩阵中每一行行向量的信息熵,由全部行向量的信息熵构成所述模态分量序列的排列熵;
对于任意一行行向量{Yj=[yi,yi+τ,…,,yi+(m-1)τ],将其进行全排列,得到m!种排列方式;
对于Yj任意一种排列r,出现的概率P(r)为:
式中,T(r)表示排列r出现的次数;
因此,所述排列r的信息熵为:
HPE=-P(r)lnP(r);
计算全部排列的信息熵,由此可以得到Yj的排列熵HPE为:
优选的,对排列熵HPE归一化处理;
S34.对每组模态分量序列进行排列熵计算,得到每组模态分量序列分别对应的排列熵,将全部排列熵进行重组后得到重组数据。
具体的,重复步骤S31~S33计算每组模态分量序列的排列熵,得到一组长度为G的熵值列表data,采用以下方法对data中的数据进行重组:
式中,α表示斜率阈值,θ表示差值阈值,kl表示从第二个数开始的值与前一个数的斜率,kr表示从第二个数开始后一个数与该值的斜率;cr为从第二个数开始后一个数与该值的差值,g表示data中的第g个元素,abs表示绝对值函数。
由上述公式得到一个对data中分量进行重新组合,得到一组重组数据,如图3所示。
基于以上实施例,本方法还包括:
S4.由全部监测数据序列对应的重组数据构成数据集,将所述数据集随机划分为训练集和测试集;
本实施例中,将前30天的支座位移数据作为输入标签,后30天的支座位移数据作为输出标签,具体而言,将前30天中的任意一组监测数据序列向后推移30天,得到一组监测数据序列即为与之对应的输出标签。
具体的,按照8:2的比例,将数据集划分为训练集和测试集。
基于以上实施例,本方法还包括:
S5.建立多种时间序列预测模型,利用所述训练集和测试集分别对多种时间序列预测模型进行训练和测试,根据每个时间序列预测模型的预测结果计算得到预测误差;具体的,所述时间序列预测模型可以为:(1)ARIMA预测模型;(2)岭回归预测模型;(3)支持向量回归预测模型;(4)BiLSTM预测模型;(5)时域卷积网络预测模型;(6)Transformer预测模型;(7)CNN-LSTM组合预测模型。
其中,各个模型的建模参数如下:
(1)ARIMA预测模型的参数经过平稳性校验、模型识别与参数估计后得出自回归系数p为0、差分次数d为1、移动平均系数q为0时效果指标最好。
(2)岭回归预测模型在训练时采用网格搜索方法,选择10折交叉验证,得到最优的alpha参数值约为0.0234。
(3)支持向量回归预测模型的内核函数选择径向基核函数(RBF),正则项的惩罚系数C为0.2,内核宽度参数gamma为0.1。
(4)BiLSTM预测模型的神经网络第一层使用Bidirectional_LSTM,神经元个数设置为4个,激活函数使用双曲正切tanh函数,取值范围为[-1,1],输出层设置为1个神经元,优化函数选择为Adam,损失函数选择平均绝对误差MAE。
(5)时域卷积网络预测模型窗口大小window_size设置为10,训练批次batch_size设置为32,训练迭代次数epochs为100,滤波器的数量nb_filters设置为10,卷积核的大小kernel_size设置为4,优化函数选择为Adam,损失函数选择平均绝对误差MAE。
(6)Transformer预测模型输入数据的长度input_window设置为20,因为是单维数据预测,输出数据的长度output_window设置为1,Encoder中数据嵌入的维度设置为250,多头注意力中平行头的数目设置为10,dropout的概率设置为0.1,优选的,本实施例中没有采用原始Decoder的架构,而是采用了一个全连接层来进行替代,在其中引用了Decoder中的掩码机制以避免受到未来信息的干扰。
(7)CNN-LSTM组合预测模型参数为,步长steps为30,卷积神经网络层中,卷积层中第一层过滤器个数filters设置为256,第二层设置为128,卷积核大小kernel_size设置为2,激活函数采用ReLU,长短期记忆网络中,单元数units设置为100,激活函数采用ReLU,dropout的概率设置为0.2,模型训练的损失函数使用均方误差MSE,优化算法选择为Adam。
具体的,本实施例将平均绝对百分比误差MAPE、平均绝对误差MAE、均方根误差RMSE、决定系数R2作为评价指标,依次计算在每种评价指标下各时间序列预测模型对应的预测误差。
基于以上实施例,本方法还包括:
S6.根据每个时间序列预测模型的预测误差,采用熵权法计算每个时间序列预测模型的权重,根据每个时间序列预测模型预测结果和权重计算得到最终预测结果。
具体的,所述步骤S6包括:
S61.由全部时间序列预测模型在每种评价指标下的预测误差构成正向化矩阵:
式中,ρ表示时间序列预测模型的数量,表示评价指标的数量,/>表示第ρ在第种评价指标下的预测误差。
S62.对所述正向化矩阵进行标准化处理得到标准化矩阵Z;
其中,可采用最大值最小是归一化方法进行标准化处理。
S63.将所述标准化矩阵转化为概率矩阵pij,根据所述概率矩阵计算出每种评价指标的信息熵ej
式中,j表示第j项评价指标,i表示第i种时间序列预测模型;
S64.利用每种评价指标的信息熵计算得到每种评价指标的熵权值wj
S65.根据每种评价指标的熵权值和所述标准化矩阵计算得到每个时间序列预测模型所对应的权重:
具体的,所述步骤S65包括:
根据所述标准化矩阵Z定义最大值Z+和最小值Z-
定义第i种时间序列预测模型与最大值的距离Di +
定义第i种时间序列预测模型与最小值的距离Di -
计算第i种时间序列预测模型未归一化的得分Si
其中,0≤Si≤1,且Si越大则Di +越小,即越接近最大值。
对所述得分Si进行归一化处理后得到第i种时间序列预测模型的权值。
根据每个时间序列预测模型预测结果和权重计算得到最终预测结果Y:
式中,表示第i种第i种时间序列预测模型对支座位移数据的预测结果,其为一组时间序列。
在实际应用过程中,采集当前时段的一组关于支座位移的监测数据序列,对其进行处理后得到一组重组数据,将所述重组数据输入至上述7种模型进行分别进行预测,分别输出预测结果,所述预测结果为30天后的支座位移的监测数据序列,最后再根据7种预测模型的权重,计算得到最终预测结果。
需要说明的是,本实施例中预测30天后的数据只是作为一个优选的实施例,本实施例不仅限于预测30天后的数据,可根据实际需要进行设定。
实施例2:
请参阅图4、图5,相应于上面的方法实施例,本实施例中还提供了一种监测数据预测装置,包括:
预处理模块:用于获取预设时间段内的若干组监测数据序列,对每一组监测进行预处理以剔除异常点和填补空缺值;
分解模块:用于采用自适应控制策略的完全自适应噪声集合经验模态分解法对预处理后的每一组监测数据序列进行分解,将每一组监测数据序列分解为若干组模态分量序列;
重组模块:用于采用熵值自动重组模型对每组监测数据序列对应的若干组模态分量序列进行熵值重组,得到每组监测数据序列对应的重组数据;
数据集划分模块:用于由全部监测数据序列对应的重组数据构成数据集,将所述数据集随机划分为训练集和测试集;
预测模块:用于建立多种时间序列预测模型,利用所述训练集和测试集分别对多种时间序列预测模型进行训练和测试,根据每个时间序列预测模型的预测结果计算得到预测误差;
计算模块:用于根据每个时间序列预测模型的预测误差,采用熵权法计算每个时间序列预测模型的权重,根据每个时间序列预测模型预测结果和权重计算得到最终预测结果。
基于以上实施例,所述预处理模块包括:
归一化处理单元:用于对每一组监测数据序列进行均值方差归一化处理;
第一计算单元:用于根据归一化处理后的监测数据序列,利用基于密度的聚类模型剔除离群点计算得到对应的簇集;
剔除单元:用于将监测数据序列中不属于簇集的数值作为异常点,并在监测数据序列中剔除所述异常点。
基于以上实施例,所述预处理模块还包括:
第二计算单元:用于计算监测数据序列的全局标准差;
第一确定单元:用于确定空缺值的位置,并根据空缺值的位置确定空缺值对应的相似点的搜寻范围;
第三计算单元:用于在搜寻范围寻找出若干个相似点,并计算每个相似点加入监测数据序列后的标准差;
第二确定单元:用于根据所述标准差与全局标准差确定相似点的相似点加权值;
第四计算单元:用于依次计算每个相似点与对应的相似点加权值的联合期望值,对全部联合期望值进行加权后计算得到最相似估计值;
填补单元:用于利用所述最相似估计值填补空缺值。
基于以上实施例,所述分解模块包括:
第一添加单元:用于对一组监测数据序列添加白噪声后得到向量组;
第五计算单元:用于计算所述向量组的局部平均值得到第一残差分量;
第六计算单元:用于计算监测数据序列与第一残差分量的差值得到第一模态分量序列;
第二添加单元:用于重复对第一残差分量添加白噪声后得到新的向量组;
第七计算单元:用于计算所述新的向量组的局部平均值得到第二残差分量;
第八计算单元:用于计算第一残差分量与第二残差分量的差值得到第二模态分量序列;
第九计算单元:用于根据第二残差分量和第二模态分量序列循环计算,得到监测数据序列对应的若干组模态分量序列。
基于以上实施例,所述计算模块包括:
第三确定单元:用于确定多种评价指标,并计算在每种评价指标下各时间序列预测模型对应的预测误差;
构造单元:用于由全部时间序列预测模型在每种评价下的预测误差构成正向化矩阵;
标准化处理单元:用于对所述正向化矩阵进行标准化处理得到标准化矩阵;
转化单元:用于将所述标准化矩阵转化为概率矩阵,根据所述概率矩阵计算出每种评价指标的信息熵;
第十计算单元:用于利用每种评价指标的信息熵计算得到每种评价指标的熵权值;
第十一计算单元:用于根据每种评价指标的熵权值和所述标准化矩阵计算得到每个时间序列预测模型所对应的权重。
需要说明的是,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
实施例3:
相应于上面的方法实施例,本实施例中还提供了一种监测数据预测设备,下文描述的一种监测数据预测设备与上文描述的一种监测数据预测方法可相互对应参照。
图6是根据示例性实施例示出的一种监测数据预测设备800的框图。如图6所示,该监测数据预测设备800可以包括:处理器801,存储器802。该监测数据预测设备800还可以包括多媒体组件803,I/O接口804,以及通信组件805中的一者或多者。
其中,处理器801用于控制该监测数据预测设备800的整体操作,以完成上述的监测数据预测方法中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该监测数据预测设备800的操作,这些数据例如可以包括用于在该监测数据预测设备800上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口804为处理器801和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该监测数据预测设备800与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件805可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,监测数据预测设备800可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal ProcessingDevice,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的监测数据预测方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的监测数据预测方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器802,上述程序指令可由监测数据预测设备800的处理器801执行以完成上述的监测数据预测方法。
实施例4:
相应于上面的方法实施例,本实施例中还提供了一种可读存储介质,下文描述的一种可读存储介质与上文描述的一种监测数据预测方法可相互对应参照。
一种可读存储介质,可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例的监测数据预测方法的步骤。
该可读存储介质具体可以为U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可存储程序代码的可读存储介质。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种监测数据预测方法,其特征在于,包括:
获取预设时间段内的若干组监测数据序列,对每一组监测进行预处理以剔除异常点和填补空缺值;
采用自适应控制策略的完全自适应噪声集合经验模态分解法对预处理后的每一组监测数据序列进行分解,将每一组监测数据序列分解为若干组模态分量序列;
采用熵值自动重组模型对每组监测数据序列对应的若干组模态分量序列进行熵值重组,得到每组监测数据序列对应的重组数据;
由全部监测数据序列对应的重组数据构成数据集,将所述数据集随机划分为训练集和测试集;
建立多种时间序列预测模型,利用所述训练集和测试集分别对多种时间序列预测模型进行训练和测试,根据每个时间序列预测模型的预测结果计算得到预测误差;
根据每个时间序列预测模型的预测误差,采用熵权法计算每个时间序列预测模型的权重,根据每个时间序列预测模型预测结果和权重计算得到最终预测结果。
2.根据权利要求1所述的监测数据预测方法,其特征在于,对每一组监测数据序列进行预处理以剔除异常点,包括:
对每一组监测数据序列进行均值方差归一化处理;
根据归一化处理后的监测数据序列,利用基于密度的聚类模型剔除离群点计算得到对应的簇集;
将监测数据序列中不属于簇集的数值作为异常点,并在监测数据序列中剔除所述异常点。
3.根据权利要求1所述的监测数据预测方法,其特征在于,采用自适应控制策略的完全自适应噪声集合经验模态分解法对预处理后的一组监测数据序列进行分解,将一组监测数据序列分解为若干组模态分量序列,包括:
对一组监测数据序列添加白噪声后得到向量组;
计算所述向量组的局部平均值得到第一残差分量;
计算监测数据序列与第一残差分量的差值得到第一模态分量序列;
重复对第一残差分量添加白噪声后得到新的向量组;
计算所述新的向量组的局部平均值得到第二残差分量;
计算第一残差分量与第二残差分量的差值得到第二模态分量序列;
根据第二残差分量和第二模态分量序列循环计算,得到监测数据序列对应的若干组模态分量序列。
4.根据权利要求1所述的监测数据预测方法,其特征在于,根据每个时间序列预测模型的预测误差,采用熵权法计算每个时间序列预测模型的权重,包括:
确定多种评价指标,并计算在每种评价指标下各时间序列预测模型对应的预测误差;
由全部时间序列预测模型在每种评价下的预测误差构成正向化矩阵;
对所述正向化矩阵进行标准化处理得到标准化矩阵;
将所述标准化矩阵转化为概率矩阵,根据所述概率矩阵计算出每种评价指标的信息熵;
利用每种评价指标的信息熵计算得到每种评价指标的熵权值;
根据每种评价指标的熵权值和所述标准化矩阵计算得到每个时间序列预测模型所对应的权重。
5.一种监测数据预测装置,其特征在于,包括:
预处理模块:用于获取预设时间段内的若干组监测数据序列,对每一组监测进行预处理以剔除异常点和填补空缺值;
分解模块:用于采用自适应控制策略的完全自适应噪声集合经验模态分解法对预处理后的每一组监测数据序列进行分解,将每一组监测数据序列分解为若干组模态分量序列;
重组模块:用于采用熵值自动重组模型对每组监测数据序列对应的若干组模态分量序列进行熵值重组,得到每组监测数据序列对应的重组数据;
数据集划分模块:用于由全部监测数据序列对应的重组数据构成数据集,将所述数据集随机划分为训练集和测试集;
预测模块:用于建立多种时间序列预测模型,利用所述训练集和测试集分别对多种时间序列预测模型进行训练和测试,根据每个时间序列预测模型的预测结果计算得到预测误差;
计算模块:用于根据每个时间序列预测模型的预测误差,采用熵权法计算每个时间序列预测模型的权重,根据每个时间序列预测模型预测结果和权重计算得到最终预测结果。
6.根据权利要求5所述的监测数据预测装置,其特征在于,预处理模块包括:
归一化处理单元:用于对每一组监测数据序列进行均值方差归一化处理;
第一计算单元:用于根据归一化处理后的监测数据序列,利用基于密度的聚类模型剔除离群点计算得到对应的簇集;
剔除单元:用于将监测数据序列中不属于簇集的数值作为异常点,并在监测数据序列中剔除所述异常点。
7.根据权利要求5所述的监测数据预测装置,其特征在于,所述重组模块包括:
分解模块包括:
第一添加单元:用于对一组监测数据序列添加白噪声后得到向量组;
第五计算单元:用于计算所述向量组的局部平均值得到第一残差分量;
第六计算单元:用于计算监测数据序列与第一残差分量的差值得到第一模态分量序列;
第二添加单元:用于重复对第一残差分量添加白噪声后得到新的向量组;
第七计算单元:用于计算所述新的向量组的局部平均值得到第二残差分量;
第八计算单元:用于计算第一残差分量与第二残差分量的差值得到第二模态分量序列;
第九计算单元:用于根据第二残差分量和第二模态分量序列循环计算,得到监测数据序列对应的若干组模态分量序列。
8.根据权利要求5所述的监测数据预测装置,其特征在于,所述重组模块还包括:
计算模块包括:
第三确定单元:用于确定多种评价指标,并计算在每种评价指标下各时间序列预测模型对应的预测误差;
构造单元:用于由全部时间序列预测模型在每种评价下的预测误差构成正向化矩阵;
标准化处理单元:用于对所述正向化矩阵进行标准化处理得到标准化矩阵;
转化单元:用于将所述标准化矩阵转化为概率矩阵,根据所述概率矩阵计算出每种评价指标的信息熵;
第十计算单元:用于利用每种评价指标的信息熵计算得到每种评价指标的熵权值;
第十一计算单元:用于根据每种评价指标的熵权值和所述标准化矩阵计算得到每个时间序列预测模型所对应的权重。
9.一种监测数据预测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述监测数据预测方法的步骤。
10.一种可读存储介质,其特征在于:所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述监测数据预测方法的步骤。
CN202311351283.XA 2023-08-10 2023-10-18 一种监测数据预测方法、系统、设备以及可读存储介质 Pending CN117609905A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202311007248 2023-08-10
CN2023110072486 2023-08-10

Publications (1)

Publication Number Publication Date
CN117609905A true CN117609905A (zh) 2024-02-27

Family

ID=89950465

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202311325729.1A Pending CN117611501A (zh) 2023-08-10 2023-10-12 一种低照度图像增强方法、装置、设备及可读存储介质
CN202311351283.XA Pending CN117609905A (zh) 2023-08-10 2023-10-18 一种监测数据预测方法、系统、设备以及可读存储介质

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202311325729.1A Pending CN117611501A (zh) 2023-08-10 2023-10-12 一种低照度图像增强方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (2) CN117611501A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118154487B (zh) * 2024-05-10 2024-08-16 南京龟兔赛跑软件研究院有限公司 基于光照校正的图像增强方法及系统

Also Published As

Publication number Publication date
CN117611501A (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
CN112380098B (zh) 一种时序异常检测方法、装置、计算机设备及存储介质
Essien et al. A deep learning framework for univariate time series prediction using convolutional LSTM stacked autoencoders
CN112639834A (zh) 用于数据分析的计算机实现的方法、计算机程序产品以及系统
US20150254554A1 (en) Information processing device and learning method
CN111079836B (zh) 基于伪标签方法和弱监督学习的过程数据故障分类方法
CN111553543B (zh) 基于TPA-Seq2Seq的电力负荷预测方法及相关组件
CN113723007B (zh) 基于drsn和麻雀搜索优化的设备剩余寿命预测方法
CN111738520A (zh) 一种融合孤立森林与长短期记忆网络的系统负载预测方法
CN117609905A (zh) 一种监测数据预测方法、系统、设备以及可读存储介质
CN114399032A (zh) 一种电能表计量误差预测方法及系统
CN113438114A (zh) 互联网系统的运行状态监控方法、装置、设备及存储介质
CN115169746A (zh) 基于融合模型的电力负荷短期预测方法、装置及相关介质
CN111985719A (zh) 一种基于改进的长短期记忆网络的电力负荷预测方法
CN115409292A (zh) 一种电力系统短期负荷预测方法及相关装置
CN116383096A (zh) 基于多指标时序预测的微服务系统异常检测方法及装置
CN112488142A (zh) 一种雷达故障的预测方法、装置及存储介质
CN118151020B (zh) 一种电池安全性能的检测方法及系统
CN115456306A (zh) 一种母线负荷预测方法、系统、设备及存储介质
CN115564155A (zh) 一种分散式风电机组功率预测方法及相关设备
CN114334013A (zh) 一种单细胞聚类方法、装置、设备及可读存储介质
CN114331214A (zh) 基于强化学习的域自适应轴承声纹故障诊断方法及系统
CN116522232A (zh) 文档分类方法、装置、设备及存储介质
CN116663388A (zh) 粮堆温度预测方法、装置、设备及存储介质
CN115982575A (zh) 滚动轴承故障诊断方法、装置、电子设备和可读存储设备
CN115240782A (zh) 药物属性预测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination