发明内容
本申请实施例在于提供一种基于深度学习的多传感器融合瓦斯浓度多步预测方法,旨在解决瓦斯序列预测多为基于统计学习模型进行的单步预测,预测精度较差,同时缺乏对井下不同测点的空间拓扑关系考虑的问题。
本申请实施例第一方面提供一种基于深度学习的多传感器融合瓦斯浓度多步预测方法,包括:
获取矿井中的瓦斯监控监测数据,并对瓦斯监控监测数据进行预处理;
提取瓦斯监控监测数据的特征数据,特征数据包括:时序因素特征数据和空间因素特征数据;
将特征数据作为原始特征输入,构建瓦斯浓度预测模型;
实时获取矿井中的瓦斯浓度数据,将瓦斯浓度数据导入瓦斯浓度预测模型,生成对未来多个时间步瓦斯浓度的预测结果。
可选地,提取瓦斯监控监测数据的时序因素特征数据,包括:
定义时序特征算子,并构建特征算子的自动计算框架;其中,时序特征算子包括:当前时间点的瓦斯浓度值以及一阶差分值、前一时间段的瓦斯浓度值以及一阶差分值、基于瓦斯浓度值和一阶差分值的滑动统计量、基于瓦斯浓度值和一阶差分值的残差特征;
对获取的瓦斯监控监测数据依据特征自动进行提取计算,并将计算结果输入到瓦斯浓度预测模型中。
可选地,提取瓦斯监控监测数据的空间因素特征数据,包括:
获取矿井内瓦斯测点在巷道内的相对位置;
根据矿井内瓦斯测点在巷道内的相对位置,建立无向图;
采用协相关系数来刻画不同测点瓦斯浓度峰值在时间维度上的延迟效应,并依据延迟效应为无向图添加方向,形成延迟效应有向图;
根据风向为无向图添加方向,形成风向有向图;
将延迟效应有向图和风向有向图叠加形成空间拓扑网络图;
在构建瓦斯浓度预测模型过程中,依据空间拓扑网络图,自动提取所需测点的空间因素特征数据输入瓦斯浓度预测模型。
可选地,在将特征数据作为原始特征输入,构建瓦斯浓度预测模型的步骤之后,方法包括:
根据时间设定将输入数据拆分为训练数据与测试数据;
通过训练数据进行瓦斯浓度预测模型的训练,生成训练预测结果;
通过测试数据对训练预测结果进行验证,直至瓦斯浓度预测模型收敛。
可选地,瓦斯浓度预测模型的训练方法为批训练方法。
可选地,瓦斯浓度预测模型采用MSE作为模型训练的损失函数。
可选地,对瓦斯监控监测数据进行预处理,包括:
预设瓦斯监控监测数据的值域范围,当瓦斯监控监测数据超出预设值域范围时,剔除瓦斯监控监测数据。
可选地,当缺失数据时,对瓦斯监控监测数据进行预处理,包括:
当前值缺失时,则使用与之相邻的前一个值作为填补值,当相邻的前一个值仍为缺失值,则使用更前一个值作为填补值;直至找到对应的填补值。
可选地,对瓦斯监控监测数据进行预处理,包括:对瓦斯监控监测数据进行重采样。
可选地,瓦斯浓度预测模型包括:编码器和解码器;
编码器为单层LSTM,用于将历史特征数据映射成状态向量;
解码器由LSTM和全连接层构成,用于将状态向量解码为需要预测的未来瓦斯浓度序列。
有益效果:
本申请提供的一种基于深度学习的多传感器融合瓦斯浓度多步预测方法,基于深度学习相关理论建立多步瓦斯浓度预测模型。该模型通过对瓦斯浓度历史大数据分析,提取不同监测点瓦斯浓度空间拓扑特征和时序特征,并在瓦斯浓度预测模型中融合多个传感器的信息,能够进行多步预测,同时有效提高瓦斯预测准确率和瓦斯浓度预测模型的多步预测结果稳定性,有效解决传统预测模型经验依赖、时效性差、局限于浅层数据特征等不足。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
相关技术中,工作面瓦斯的多源特征和瓦斯混合气体的运移特征使得瓦斯浓度既具有一定的规律性,又具有一定的复杂性,是典型的非线性预测问题。传统算法主要采用单个瓦斯传感器的原始数据,缺乏对各类传感器数据的融合,且往往是通过人工提取特征的方式进行模型训练,存在经验依赖、时效性差、局限于浅层数据特征等不足。此外,影响瓦斯涌出的因素众多,如:地质条件、煤层瓦斯含量、煤层埋深、邻近层、采空区和开采过程等,部分因素并非时间序列数据,无法实时量化测得,不能很好融合进预测模型中,为煤矿瓦斯准确预测带来了挑战。
有鉴于此,本申请提供的一种基于深度学习的多传感器融合瓦斯浓度多步预测方法,基于深度学习相关理论建立多步瓦斯浓度预测模型。该模型通过对瓦斯浓度历史大数据分析,提取不同监测点瓦斯浓度空间拓扑特征和时序特征,并在瓦斯浓度预测模型中融合多个传感器的信息,能够有效提高瓦斯预测准确率和瓦斯浓度预测的多步预测结果稳定性,有效解决传统预测模型经验依赖、时效性差、局限于浅层数据特征等不足。
实施例一
参照图1,示出了本申请一种基于深度学习的多传感器融合瓦斯浓度多步预测方法的流程图,如图1所示,本申请实施例一提供一种基于深度学习的多传感器融合瓦斯浓度多步预测方法,包括:
获取矿井中的瓦斯监控监测数据,并对瓦斯监控监测数据进行预处理。
瓦斯监控监测数据至少包含瓦斯浓度、矿井内瓦斯测点在巷道内的相对位置,在数据预处理过程中,针对传感器本身系统噪音以及采样频率较高等原因而造成数据分布具有明显的锯齿状的特点,对瓦斯监控监测数据进行标准差标准化预处理,能够尽量降低异常数据对泛化效果的影响程度。
提取瓦斯监控监测数据的特征数据,特征数据包括:时序因素特征数据和空间因素特征数据。
特征提取与处理:单个瓦斯测点的短期瓦斯浓度与该测点历史瓦斯浓度以及其他测点瓦斯浓度均具有一定关系,定义前者为时序因素,后者为空间拓扑因素。再将数据输入到模型之前,对原始数据进行简单的特征提取有助于模型的快速收敛。
在提取时序因素时,本发明通过定义并提取时间维度的相关特征算子来加速深度模型收敛,并提供了对算子的自动计算框架,对读入的序列数据依据特征定义自动进行提取计算,并将计算结果作为模型输入从而输入到瓦斯浓度预测模型中;在提取空间拓扑因素时,本发明对各个测点建立空间拓扑关系,通过考虑空间拓扑关联性来提高对测点与瓦斯浓度预测的准确程度。
将特征数据作为原始特征输入,构建瓦斯浓度预测模型。
瓦斯浓度预测模型使用Tensorflow进行网络的搭建,Tensorflow是一个基于数据流编程的符号数学系统,是用于数值计算的开源软件库。本发明基于该框架构建了完整的Encoder-Deocoder网络模型,能够同时进行模型训练和预测。
实时获取矿井中的瓦斯浓度数据,将瓦斯浓度数据导入瓦斯浓度预测模型,生成对未来多个时间步瓦斯浓度的预测结果。
本申请提供的一种基于深度学习的多传感器融合瓦斯浓度多步预测方法,基于深度学习相关理论建立多步瓦斯浓度序列预测模型。该瓦斯浓度预测模型通过对瓦斯浓度历史大数据分析,提取不同监测点瓦斯浓度空间拓扑特征和时序特征,并在预测模型中融合多个传感器的信息,能够有效提高瓦斯预测准确率和瓦斯浓度预测模型的多步预测结果稳定性,有效解决传统预测模型经验依赖、时效性差、局限于浅层数据特征等不足。
在另一种实施方式中,提取瓦斯监控监测数据的时序因素特征数据,包括:
定义时序特征算子,并构建特征算子的自动计算框架;其中,时序特征算子包括:当前时间点的瓦斯浓度值以及一阶差分值、前一时间段的瓦斯浓度值以及一阶差分值、基于瓦斯浓度值和一阶差分值的滑动统计量、基于瓦斯浓度值和一阶差分值的残差特征;
对获取的瓦斯监控监测数据依据特征自动进行提取计算,并将计算结果输入到瓦斯浓度预测模型中。
时序因素,某测点未来短时间内的瓦斯浓度与该测点历史瓦斯浓度具有一定的关联性,而且该关联性往往是复杂的非线性关系。本发明通过定义并提取时间维度的相关特征算子来加速深度模型收敛。假设当前时刻为,某瓦斯测点瓦斯浓度序列为x0,x1,x2,...,xt,定义该浓度序列的一阶差分序列为z0,z1,z2,...,zt,其中zt=xt-xt-1(可令z0=0),为预测未来时刻数据,本发明定义相关时序特征算子包括:
①当前时间点浓度值以及一阶差分值:xt,zt;(zt=xt-xt-1,下同)
③基于浓度值和一阶差分值的滑动统计量,其中窗口大小为l1,统计量包括统计均值以及标准差,计算方法如式(1,2)所示:
④基于浓度值和一阶差分的残差特征,其中窗口大小为l2,计算方法如式(3)所示:
本发明提供了对此四类特征的自动计算框架,该框架对读入的序列数据依据特征定义自动进行提取计算,并将计算结果作为模型输入从而输入到瓦斯浓度预测模型中。
在本实施方式中,提取瓦斯监控监测数据的空间因素特征数据,包括:
获取矿井内瓦斯测点在巷道内的相对位置;
根据矿井内瓦斯测点在巷道内的相对位置,建立无向图;
采用协相关系数来刻画不同测点瓦斯浓度峰值在时间维度上的延迟效应,并依据延迟效应为无向图添加方向,形成延迟效应有向图;
根据风向为无向图添加方向,形成风向有向图;
将延迟效应有向图和风向有向图叠加形成空间拓扑网络图;
在构建瓦斯浓度预测模型过程中,依据空间拓扑网络图,自动提取所需测点的空间因素特征数据输入瓦斯浓度预测模型。
空间拓扑因素,依据矿井内瓦斯测点在巷道内的相对位置,建立无向图,参照图2,示出了本申请某煤矿瓦斯测点分布示意图,如图2所示,图2中节点为瓦斯传感器测点,图2中边表示测点之间基于巷道具有连通性。上面所述工作面四个瓦斯测点形成无向图。为更加细致描述不同测点之间瓦斯浓度的相互依赖关系,本发明利用风流方向以及自相关系数为无向图中的边添加方向。不难理解,参照图3,示出了本申请瓦斯监测点有向图,如图3所示,位于风流下游测点的瓦斯浓度受对上游测点具有依赖关系,依据风流方向可以得出如图3所示的有向图。
此外,不同测点瓦斯浓度峰值在时间维度上具有一定延迟效应,本发明采用协相关系数来刻画这种延迟效应,并依据延迟效应的方向为无向图添加方向。对在无向图中具拓扑邻接关系的瓦斯测点计算相关系数,具体计算方法为对其中一个测点的瓦斯浓度序列在时间维度上进行平移,将该测点平移后的瓦斯序列与邻接测点的瓦斯浓度序列计算相关系数,经过多次平移后可以形成一条相关系数曲线,依据上述相关系数原理,可以得到如图3所示的有向图。
如图3所示,同时依据风向和延迟效应,对两个有向图进行叠加形成空间拓扑网络图,该有向图反应了井下不同瓦斯测点间的拓扑关系。依据该有向图,系统在对某测点进行建模时,自动提取出该测点依赖的相关测点数据作为原始特征输入,而不是将全部测点数据直接输入,这样在考虑空间相互关系的同时减少了训练成本和模型复杂程度,对模型收敛速度和训练效率具有重要意义。
具体地,在将特征数据作为原始特征输入,构建瓦斯浓度预测模型的步骤之后,方法包括:
根据时间设定将输入数据拆分为训练数据与测试数据;
通过训练数据进行模型的训练,生成训练预测结果;
通过测试数据对训练预测结果进行验证,直至瓦斯浓度预测模型收敛。
输入数据为采集的多个时间步长的瓦斯浓度相关参数,示例的:采集的数据为N个时间步长的数据,其中,第一个时间点的数据为训练数据输入模型,生成对未来N个时间步瓦斯浓度的预测结果;此时,采集的第N个时间步长数据为测试数据,用来验证模型生成的对未来N个时间步瓦斯浓度的预测结果,直至瓦斯浓度预测模型收敛。
在其中一种实施例中,模型的训练方法为批训练方法。
本发明采用批训练方法来进行模型的训练,即每次输入一个批处理(batch)数据到模型中进行训练。对于连续时间序列数据,在训练前,需要进行批采样,本发明首先定义单样本随机采样方法,并依据单样本采样定义批采样,最后依据批采样定义如何采样出单个epoch数据;模型训练过程中,一次完整的遍历数据集称为一次epoch。
在其中另一种实施例中,模型采用均方差函数(Mean Square Error,以下简称MSE)作为模型训练的损失函数。
瓦斯浓度预测是经典的回归问题,因此本发明将MSE作为模型训练的损失函数,其公式如式(4)所示,其中b为一次训练所选取的样本数(batch_size),n为预测步长,t为当前时刻,y为真实瓦斯浓度值,
为预测瓦斯浓度值。
为了防止过拟合,实验表明在损失函数中加入L1正则化项能够有效提升模型训练的泛化能力。式(5)为加入L1正则化项后的损失函数。其中W为模型的全部参数矩阵。||W||1为W的1范数。
在训练中,为了使模型快速收敛,本发明使用Adam算法作为优化器。Adam算法结合了AdaGrad算法和RMSProp算法的优点,Adam算法不仅基于一阶矩均值计算适应性参数学习率,同时还充分利用了梯度的二阶矩均值。Adam算法本身具有很高的计算效率和较低的内存需求,很适合求解带有大规模数据或参数的优化问题。
在本实施方式中,对瓦斯监控监测数据进行预处理,包括:
预设瓦斯监控监测数据的值域范围,当瓦斯监控监测数据超出预设值域范围时,剔除瓦斯监控监测数据。
如图2所示,获取该工作面内包括①工作面进风测点、②上隅角测点、③工作面回风测点、④回风混合测点共四个监测点的瓦斯浓度监测数据。四个测点位置如图2所示。由于传感器异常等原因,监测数据有含有少量数据超过1或小于0,此类数据不符合预期,因此对于超出值域[0,1]之间的数据直接剔除。
在其中一种实施例中,当缺失数据时,对瓦斯监控监测数据进行预处理,包括:
当前值缺失时,则使用与之相邻的前一个值作为填补值,当相邻的前一个值仍为缺失值,则使用更前一个值作为填补值;直至找到对应的填补值。
针对与缺失数据,本发明采用“前向填补法”,即当前值如果缺失,则使用与之相邻的前一个值作为填补值,如果相邻的前一个值仍为缺失值,则使用更前一个值作为填补值,如此反复,直到找到对应的填补值即可。需要特别指出的是,对于前文所述异常值剔除的情况,异常值一旦剔除则成为缺失值,之后按照前向填补方法进行填补。
本发明中,瓦斯浓度值变化范围在[0,1]之间,在建立基于深度学习的预测模型时,为了使得训练更加稳定,防止出现模型权值过度偏移的情况,本发明采用预测瓦斯浓度的一阶差分值来代替直接预测浓度值。
在其中一种实施例中,对瓦斯监控监测数据进行预处理,包括:对瓦斯监控监测数据进行重采样。
原始数据存在采样频率过高、数据缺失、数据异常等多种问题,在进行数据分析、建立预测模型前需要对数据进行清洗和必要的预处理。原始数据记录由于传感器本身系统噪音以及采样频率较高等原因而造成数据分布具有明显的锯齿状特点,此类数据对建立模型具有较大干扰。基于此,本发明通过对原始数据进行重采样,来减弱数据分布的锯齿形态同时使得采样频率固定,便于后续分析。
在本实施方式中,参照图4,示出了本申请瓦斯浓度序列多步预测模型结构图,如图4所示,瓦斯浓度预测模型包括:编码器(Encoder)和解码器(Decoder);
编码器为单层的长短期记忆网络(Long Short-Term Memory,以下简称LSTM),用于将历史特征数据映射成状态向量;
解码器由LSTM和全连接层构成,用于将状态向量解码为需要预测的未来瓦斯浓度序列。
在某时间点t,模型以历史上m个时间点的特征数据{x
t-m,..,x
t-1,x
t}为输入,其中x
t为时刻的特征,包含空间拓扑因素与时序因素,来自于前文所述的自动化特征提取。LSTM网络将输入数据映射为对应的细胞状态C和隐层状态h,并作为模型Encoder阶段的输出。在Decoder阶段,以Encoder阶段输出的状态C,h为输入状态,同时以p个时间点的历史浓度序列数据为LSTM网络每个时间步的输入,再通过一层全连接层,最终得到对未来个时间步瓦斯浓度的预测结果
需要注意的是,Decoder阶段每个时间步的输入均为以该时间步的时间为基准向前获取p个时间步的瓦斯浓度序列,而当进行多步预测时,可能并不存在前p步的真实瓦斯浓度数据,此时需要利用预测值作为替代,如在预测
时,INPUT向量为
应当理解地,本申请说明书尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
以上对本申请所提供的一种基于深度学习的多传感器融合瓦斯浓度多步预测方法,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。