CN117076931B

CN117076931B - 一种基于条件扩散模型的时间序列数据预测方法和系统

Info

Publication number: CN117076931B
Application number: CN202311315844.0A
Authority: CN
Inventors: 张天翔; 张毅思; 李江昀; 王怡婷; 庄培显
Original assignee: University of Science and Technology Beijing USTB
Current assignee: University of Science and Technology Beijing USTB
Priority date: 2023-10-12
Filing date: 2023-10-12
Publication date: 2024-01-12
Anticipated expiration: 2043-10-12
Also published as: CN117076931A

Abstract

本发明提供一种基于条件扩散模型的时间序列数据预测方法和系统，包括：将训练集内天动态时序数据，经过特征编码器得到高维动态时序数据；搭建以条件输入Transformer为主干的条件扩散模型，将训练集内天高维动态时序数据作为加噪数据，以及天的高维动态时序数据与静态数据融合后的条件特征，输入条件扩散模型进行训练；将待预测的第一动态时序数据升维后的高维动态时序数据与第一静态数据融合后的条件特征，输入条件扩散模型，执行去噪操作，预测高维动态时序特征输入特征解码器，获得预测的第二动态时序数据。本发明支持长时间维度建模，构建识别精度高泛化性好的产量预测方法。

Description

一种基于条件扩散模型的时间序列数据预测方法和系统

技术领域

本发明涉及时间序列数据预测技术领域，特别是指一种基于条件扩散模型的时间序列数据预测方法和系统。

背景技术

时间序列数据（比如页岩油产量数据、每天的电网负荷数据、天气温度相关数据等）的预测，例如页岩油产量数据的预测，具有较长的时间依赖性，过去的产量数据对未来的产量变化有着重要影响，而传统的预测方法难以有效捕捉到这种长期依赖性，而且传统迭代预测序列模型存在误差积累问题。此外，很多时间序列数据，例如页岩油产量数据，存在非线性关系的复杂因素影响问题和样本数量少的问题，因此亟需一种有效的时间序列数据预测方法。

发明内容

本发明提供了一种基于条件扩散模型的时间序列数据预测方法和系统，用以解决现有技术存在的问题，所述技术方案如下：

一方面，提供了一种基于条件扩散模型的时间序列数据预测方法，包括：

S1、收集并预处理历史数据，所述历史数据包括随时间变化的动态时序数据和对应的不随时间变化的静态数据；

S2、将预处理后的历史数据划分为训练集与验证集，并将所述训练集的动态时序数据划分多组时间步；

S3、搭建特征处理模型，包括特征编码器与特征解码器，使用所述动态时序数据进行自编码、解码训练，将所述训练集内时间步的动态时序数据，经过训练完成的特征编码器进行特征升维，得到高维动态时序数据；

S4、搭建以条件输入Transformer为主干网络的条件扩散模型，将训练集内天的高维动态时序数据作为条件扩散模型的加噪数据，以及/>天的高维动态时序数据与对应的静态数据融合后作为条件特征，输入条件扩散模型进行模型训练；

S5、将待预测的第一动态时序数据升维后的高维动态时序数据与对应的第一静态数据融合后作为条件特征，输入训练完成的条件扩散模型，执行去噪操作，得到预测的高维动态时序特征，将所述预测的高维动态时序特征输入S3中训练完成的特征解码器，获得最终预测的第二动态时序数据。

另一方面，提供了一种基于条件扩散模型的时间序列数据预测系统，所述系统包括：

收集预处理模块，用于收集并预处理历史数据，所述历史数据包括随时间变化的动态时序数据和对应的不随时间变化的静态数据；

划分模块，用于将预处理后的历史数据划分为训练集与验证集，并将所述训练集的动态时序数据划分多组时间步；

第一搭建模块，用于搭建特征处理模型，包括特征编码器与特征解码器，使用所述动态时序数据进行自编码、解码训练，将所述训练集内时间步的动态时序数据，经过训练完成的特征编码器进行特征升维，得到高维动态时序数据；

第二搭建模块，用于搭建以条件输入Transformer为主干网络的条件扩散模型，将训练集内天的高维动态时序数据作为条件扩散模型的加噪数据，以及天的高维动态时序数据与对应的静态数据融合后作为条件特征，输入条件扩散模型进行模型训练；

预测模块，用于将待预测的第一动态时序数据升维后的高维动态时序数据与对应的第一静态数据融合后作为条件特征，输入训练完成的条件扩散模型，执行去噪操作，得到预测的高维动态时序特征，将所述预测的高维动态时序特征输入S3中训练完成的特征解码器，获得最终预测的第二动态时序数据。

另一方面，提供了一种电子设备，所述电子设备包括处理器和存储器，所述存储器中存储有指令，所述指令由所述处理器加载并执行以实现上述基于条件扩散模型的时间序列数据预测方法。

另一方面，提供了一种计算机可读存储介质，所述存储介质中存储有指令，所述指令由处理器加载并执行以实现上述基于条件扩散模型的时间序列数据预测方法。

本发明提供的技术方案带来的有益效果至少包括：

1）本发明提出了一种条件输入Transformer为主干网络的条件扩散模型，能够支持长时间维度的建模，构建训练一个识别精度高、泛化性好的产量预测方法。

2）传统的扩散生成式模型只适用于图像任务的构建和处理，通过本发明的模型可以实现对时间序列数据的学习和预测，拥有更强的序列信息提取能力，提高了计算效率。

3）本发明的条件扩散模型生成过程中存在随机性和不确定性，从而在预测过程中能够生成多样性的特征，模拟真实数据中的不确定性和噪声，增加模型的鲁棒性。

4）本发明的模型相比传统时序预测模型，在模型内部对所有时间下的特征计算关联性，同时输出所有时间的预测值，不需要依靠预测值来进行下一时间的预测，避免了累计误差的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种基于条件扩散模型的时间序列数据预测方法流程图；

图2是本发明实施例提供的特征处理模型结构图；

图3是本发明实施例提供的条件输入Transformer基本结构图；

图4是本发明实施例提供的条件扩散模型训练阶段结构图；

图5是本发明实施例提供的条件扩散模型预测阶段结构图；

图6是本发明实施例提供的整体页岩油产量预测算法结构图；

图7是本发明实施例提供的一种基于条件扩散模型的时间序列数据预测系统框图；

图8是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

如图1所示，本发明实施例提供了一种基于条件扩散模型的时间序列数据预测方法，包括：

下面结合图2-图6，以页岩油产量数据的预测为例，来详细说明本发明实施例提供的一种基于条件扩散模型的时间序列数据预测方法，包括：

收集页岩油不同油井以及不同开采时间的历史数据，所述历史数据包括随时间变化的动态时序数据和对应的不随时间变化的静态数据，所述动态时序数据主要包括油井产量数据，也包括油嘴油压等随时间变化的动态数据；所述静态数据主要包括在生产过程中保持静态的地质参数和人工参数等施工数据。

对历史数据进行预处理，包括但不限于根据不同的开采工艺，将历史数据按照相应的工艺不同进行拆分；检测并去除空数据以及那些远离整体产量分布曲线的异常值等。

其他的动态时序数据，比如可以为每天的电网负荷数据、天气温度相关数据，静态数据比如可以是电器设备、地理位置等相应的数据。

预处理后划分数据集为训练集和验证集，并将训练集的动态时序数据划分多组时间步，其中/>将作为条件扩散模型的条件特征的一部分，将作为条件扩散模型用于训练时加噪的数据。

可选地，如图2所示，所述特征编码器通过全连接上采样层与非线性层ReLU进行上采样操作，实现数据（图2中的产量数据）重构和特征升维；所述特征解码器通过全连接下采样层与非线性层ReLU进行下采样操作，将升维的特征重新拟合为动态时序数据（图2中的产量预测数据）；

所述S3中的自编码、解码训练包括：

将所述训练集中的所述动态时序数据输入所述特征编码器，对于所述特征解码器的输出计算MSE损失，优化模型内部权重，最终得到对所述动态时序数据的特征升维和解码降维的映射关系。

可选地，所述条件输入Transformer，通过多头自注意力层提取并融合条件特征与带有高斯噪声的数据的特征信息，并通过条件扩散模型的训练过程学习由特征信息到噪声分布的映射关系，输出预测的高斯噪声；

如图3所示，所述条件输入Transformer，将条件扩散模型的带有马尔科夫噪声的数据作为线性层的输入，对线性层的输出进行层标准化，同时将条件扩散模型的条件特征Xc经过多层感知机编码，对多层感知机输出的条件特征与参数相乘后，与线性层标准化后的结果拼接，将拼接后的结果并行输入第一个残差网络的查询、键与值特征映射层后，通过多头注意力层计算输出，所述输出，与多层感知机输出的条件特征经过参数/>相乘后的结果相加，并与第一个残差网络的输入进行残差相加后作为第二个残差网络的输入，多层感知机输出的条件特征与参数/>相乘后，与第二个残差网络的输入经过层标准化层后的输出相加，输入前馈神经网络的输出，与多层感知机输出的条件特征和参数/>相乘后的结果相加，之后与第二个残差网络的输入进行残差相加，作为第二个残差网络的输出，所述输出经过层标准化后作为整个条件输入Transformer的输出，也就是条件扩散模型的高斯噪声预测值。

可选地，如图4所示，所述S4的模型训练，分为前向加噪过程和噪声预测学习过程；

所述前向加噪过程，包括：

将训练集内天的高维动态时序数据（图4中的升维产量特征）作为/>，/>服从分布/>，记为/>；

通过T个时间步阶段的马尔可夫过程向添加方差为/>的高斯噪声，此处/>为模型预先设定的超参数，得到一系列经噪声叠加后的带有马尔科夫噪声的数据样本，此时/>可以看作为独立分布的高斯噪声，其中/>的分布由通过重参数化采样后得到，/>，表示在给定/>的情况下/>的样本分布，均服从高斯分布，计算公式如式(1.1)所示：

(1.1)

其中为标准矩阵，/>表示正态分布，前向加噪过程产生的样本/>与/>将作为训练阶段噪声预测学习过程的标签；

对于每个时间步，所述噪声预测学习过程，包括：

通过所述条件输入Transformer学习由条件特征与带有高斯噪声的数据，预测对应时间步添加的噪声，所述条件输入Transformer的输出为对应时间步所添加的噪声的预测值；

对于第T时间步，所述条件输入Transformer的输入，为由原始高维动态时序数据序列逐步加噪后获得的近似各向同性的带有高斯噪声的数据，以及条件特征，输出为预测的噪声，记为/>，通过公式(1.2)得到所述时间步去噪的结果；

(1.2)

在训练过程中，使用前向加噪过程中得到的噪声特征分布，对公式(1.2)得到的去噪结果进行监督，使用KL散度作为损失函数迭代优化模型参数，公式如式(1.3)所示；

(1.3) 。

其他时间步，和第T时间步类似。

可选地，如图5所示，所述S5，具体包括：

将随机高斯噪声序列和所述条件特征Xc，输入训练完成的条件扩散模型，随机高斯噪声序列作为初始/>，执行逆向生成过程，所述条件输入Transformer预测添加的噪声/>，通过公式(1.2)进行去噪计算得到/>，将/>作为下一次迭代的输入，重复T次迭代过程得到预测的高维动态时序特征/>，将/>输入S3中训练完成的特征解码器，获得最终预测的第二动态时序数据。

如图6所示，本发明实施例使用划分好的训练集在搭建的条件扩散模型中进行训练，保存训练好的模型参数配置以及权重，在验证集上生成预测产量特征，使用S3中训练完成的特征解码器对/>解码得到最终的产量预测值，进行模型效果的验证以及测试。

验证测试后，本发明实施例可以使用训练完成的条件扩散模型对待预测的第一动态时序数据（比如第1-10天的产量数据）进行预测得到第二动态时序数据（比如第11-20天的产量数据）。

本发明实施例通过对Transformer模型进行与扩散模型改进并组合，包括对于Transformer引入新的条件输入，并使用条件输入Transformer模型来替代传统扩散模型中仅能处理图像的U-Net模型，以更好地处理长序列预测问题（比如页岩油产量预测）。同时，本发明实施例提出了一种基于条件输入Transformer的条件扩散模型，充分利用条件特征、去噪特征并借由本身具有因果关系的马尔科夫去噪过程来获取页岩油序列中的数据相关度、时间依赖度，对噪声特征进行去噪来预测产量特征能够充分利用序列中的相关性和时间依赖性，提高模型的预测性能和泛化能力。此外，模型与传统基于解码器进行预测的模型不同，不依靠解码器得到的预测值进行迭代预测，减少解码器带来的累计误差的影响，提高模型的鲁棒性和稳定性，从而在长序列预测任务中取得更好的效果。

如图7所示，本发明实施例还提供了一种基于条件扩散模型的时间序列数据预测系统，所述系统包括：

收集预处理模块710，用于收集并预处理历史数据，所述历史数据包括随时间变化的动态时序数据和对应的不随时间变化的静态数据；

划分模块720，用于将预处理后的历史数据划分为训练集与验证集，并将所述训练集的动态时序数据划分多组时间步；

第一搭建模块730，用于搭建特征处理模型，包括特征编码器与特征解码器，使用所述动态时序数据进行自编码、解码训练，将所述训练集内时间步的动态时序数据，经过训练完成的特征编码器进行特征升维，得到高维动态时序数据；

第二搭建模块740，用于搭建以条件输入Transformer为主干网络的条件扩散模型，将训练集内天的高维动态时序数据作为条件扩散模型的加噪数据，以及/>天的高维动态时序数据与对应的静态数据融合后作为条件特征，输入条件扩散模型进行模型训练；

预测模块750，用于将待预测的第一动态时序数据升维后的高维动态时序数据与对应的第一静态数据融合后作为条件特征，输入训练完成的条件扩散模型，执行去噪操作，得到预测的高维动态时序特征，将所述预测的高维动态时序特征输入S3中训练完成的特征解码器，获得最终预测的第二动态时序数据。

可选地，所述特征编码器通过全连接上采样层与非线性层ReLU进行上采样操作，实现数据重构和特征升维；所述特征解码器通过全连接下采样层与非线性层ReLU进行下采样操作，将升维的特征重新拟合为动态时序数据；

所述第一搭建模块，具体用于：

所述条件输入Transformer，将条件扩散模型的带有马尔科夫噪声的数据作为线性层的输入，对线性层的输出进行层标准化，同时将条件扩散模型的条件特征Xc经过多层感知机编码，对多层感知机输出的条件特征与参数相乘后，与线性层标准化后的结果拼接，将拼接后的结果并行输入第一个残差网络的查询、键与值特征映射层后，通过多头注意力层计算输出，所述输出，与多层感知机输出的条件特征经过参数/>相乘后的结果相加，并与第一个残差网络的输入进行残差相加后作为第二个残差网络的输入，多层感知机输出的条件特征与参数/>相乘后，与第二个残差网络的输入经过层标准化层后的输出相加，输入前馈神经网络的输出，与多层感知机输出的条件特征和参数/>相乘后的结果相加，之后与第二个残差网络的输入进行残差相加，作为第二个残差网络的输出，所述输出经过层标准化后作为整个条件输入Transformer的输出，也就是条件扩散模型的高斯噪声预测值。

可选地，所述第二搭建模块，具体用于：进行前向加噪过程和噪声预测学习过程；

所述前向加噪过程，包括：

将训练集内天的高维动态时序数据作为/>，/>服从分布/>，记为/>；

通过T个时间步阶段的马尔可夫过程向添加方差为/>的高斯噪声，此处/>为模型预先设定的超参数，得到一系列经噪声叠加后的带有马尔科夫噪声的数据样本，此时/>可以看作为独立分布的高斯噪声，其中/>的分布由/>通过重参数化采样后得到，/>，表示在给定/>的情况下/>的样本分布，均服从高斯分布，计算公式如式(1.1)所示：

(1.1)

对于每个时间步，所述噪声预测学习过程，包括：

(1.2)

(1.3)。

可选地，所述预测模块，具体用于：

将随机高斯噪声序列和所述条件特征，输入训练完成的条件扩散模型，随机高斯噪声序列作为初始，执行逆向生成过程，所述条件输入Transformer预测添加的噪声，通过公式(1.2)进行去噪计算得到/>，将/>作为下一次迭代的输入，重复T次迭代过程得到预测的高维动态时序特征/>，将/>输入S3中训练完成的特征解码器，获得最终预测的第二动态时序数据。

本发明实施例提供的一种基于条件扩散模型的时间序列数据预测系统，其功能结构与本发明实施例提供的一种基于条件扩散模型的时间序列数据预测方法相对应，在此不再赘述。

图8是本发明实施例提供的一种电子设备800的结构示意图，该电子设备800可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器（centralprocessing units，CPU）801和一个或一个以上的存储器802，其中，所述存储器802中存储有指令，所述指令由所述处理器801加载并执行以实现上述基于条件扩散模型的时间序列数据预测方法的步骤。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由终端中的处理器执行以完成上述基于条件扩散模型的时间序列数据预测方法。例如，所述计算机可读存储介质可以是ROM、随机存取存储器（RAM）、CD-ROM、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于条件扩散模型的时间序列数据预测方法，其特征在于，所述方法包括：

S1、收集并预处理页岩油不同油井以及不同开采时间的历史数据，所述历史数据包括随时间变化的动态时序数据和对应的不随时间变化的静态数据，所述动态时序数据包括油井产量数据和其他随时间变化的动态数据；所述静态数据包括在生产过程中保持静态的施工数据；

S4、搭建以条件输入Transformer为主干网络的条件扩散模型，将训练集内天的高维动态时序数据作为条件扩散模型的加噪数据，以及天的高维动态时序数据与对应的静态数据融合后作为条件特征，输入条件扩散模型进行模型训练；

S5、将待预测的第一动态时序数据升维后的高维动态时序数据与对应的第一静态数据融合后作为条件特征，输入训练完成的条件扩散模型，执行去噪操作，得到预测的高维动态时序特征，将所述预测的高维动态时序特征输入S3中训练完成的特征解码器，获得最终预测的第二动态时序数据，所述第一动态时序数据为第一产量数据，所述第二动态时序数据为第二产量数据；

所述条件输入Transformer，通过多头自注意力层提取并融合条件特征与带有高斯噪声的数据的特征信息，并通过条件扩散模型的训练过程学习由特征信息到噪声分布的映射关系，输出预测的高斯噪声；

2.根据权利要求1所述的方法，其特征在于，所述特征编码器通过全连接上采样层与非线性层ReLU进行上采样操作，实现数据重构和特征升维；所述特征解码器通过全连接下采样层与非线性层ReLU进行下采样操作，将升维的特征重新拟合为动态时序数据；

所述S3中的自编码、解码训练包括：

3.根据权利要求1所述的方法，其特征在于，所述S4的模型训练，分为前向加噪过程和噪声预测学习过程；

所述前向加噪过程，包括：

将训练集内天的高维动态时序数据作为/>，/>服从分布/>，记为；

通过T个时间步阶段的马尔可夫过程向添加方差为/>的高斯噪声，此处/>为模型预先设定的超参数，得到一系列经噪声叠加后的带有马尔科夫噪声的数据样本，此时/>看作为独立分布的高斯噪声，其中/>的分布由通过重参数化采样后得到，/>，表示在给定/>的情况下/>的样本分布，均服从高斯分布，计算公式如式(1.1)所示：

(1.1)

对于每个时间步，所述噪声预测学习过程，包括：

(1.2)

(1.3)。

4.根据权利要求3所述的方法，其特征在于，所述S5，具体包括：

5.一种基于条件扩散模型的时间序列数据预测系统，其特征在于，所述系统包括：

收集预处理模块，用于收集并预处理页岩油不同油井以及不同开采时间的历史数据，所述历史数据包括随时间变化的动态时序数据和对应的不随时间变化的静态数据，所述动态时序数据包括油井产量数据和其他随时间变化的动态数据；所述静态数据包括在生产过程中保持静态的施工数据；

第二搭建模块，用于搭建以条件输入Transformer为主干网络的条件扩散模型，将训练集内天的高维动态时序数据作为条件扩散模型的加噪数据，以及/>天的高维动态时序数据与对应的静态数据融合后作为条件特征，输入条件扩散模型进行模型训练；

预测模块，用于将待预测的第一动态时序数据升维后的高维动态时序数据与对应的第一静态数据融合后作为条件特征，输入训练完成的条件扩散模型，执行去噪操作，得到预测的高维动态时序特征，将所述预测的高维动态时序特征输入S3中训练完成的特征解码器，获得最终预测的第二动态时序数据，所述第一动态时序数据为第一产量数据，所述第二动态时序数据为第二产量数据；

6.根据权利要求5所述的系统，其特征在于，所述特征编码器通过全连接上采样层与非线性层ReLU进行上采样操作，实现数据重构和特征升维；所述特征解码器通过全连接下采样层与非线性层ReLU进行下采样操作，将升维的特征重新拟合为动态时序数据；

所述第一搭建模块，具体用于：

7.根据权利要求5所述的系统，其特征在于，所述第二搭建模块，具体用于：进行前向加噪过程和噪声预测学习过程；

所述前向加噪过程，包括：

(1.1)

对于每个时间步，所述噪声预测学习过程，包括：

(1.2)

(1.3)。

8.根据权利要求7所述的系统，其特征在于，所述预测模块，具体用于：