CN112712192B

CN112712192B - 结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法

Info

Publication number: CN112712192B
Application number: CN202011327457.5A
Authority: CN
Inventors: 韩世锋; 王超; 吴东风; 陈昌一; 赵青青; 冯乐
Original assignee: Jiangsu Zhong Kuang An Hua Technology Development Co ltd
Current assignee: Jiangsu Zhong Kuang An Hua Technology Development Co ltd
Priority date: 2020-11-24
Filing date: 2020-11-24
Publication date: 2021-09-03
Anticipated expiration: 2040-11-24
Also published as: CN112712192A

Abstract

本发明公开了一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，首先获取其历史瓦斯浓度监测数据，数据预处理与缺失数据填充，样本集生成，对样本集Φ中预测目标Y进行拆分，使预测目标Y中的每一列数据均与X结合，构成t个拆分子集，训练子集生成，通过训练子集训练集成学习与加权极限学习机模型，本发明能够实时接收最新的瓦斯浓度数据，形成对未来3小时的瓦斯浓度趋势预测，本发明时间复杂度低，准确度高。

Description

结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法

技术领域

本发明涉及一种煤矿瓦斯浓度预测方法，属于瓦斯浓度预测技术领域。

背景技术

煤矿瓦斯防护属于高危行业，极易造成群死群伤。据统计，我国瓦斯爆炸事故占重大事故次数60以上，瓦斯事故防治是煤矿安全工作重中之重。随着人工智能技术的发展，瓦斯浓度的智能预测成为防范瓦斯爆炸事故的主要手段。目前，瓦斯浓度预测方法主要包括1)时间序列方式预测，如指数平滑和曲线拟合等，这种方法参数较多、预测精度低，模型更新难。2)采用bp神经网络等技术进行预测，此类方法训练时间长，动态调整较为复杂。上述方法只考虑单一分类器的情况，单一分类器间存在一定的差异性，这会导致分类可能存在错误。那么若将多个若分类器合并后，就可以减少整体预测的错误率，实现更好的瓦斯安全监测。

发明内容

发明目的：为了克服现有技术中存在的不足，本发明提供一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，可以对未来3小时的瓦斯浓度及其走势进行相对准确的预测，可提升煤矿安全生产的智能化水平。

技术方案：为实现上述目的，本发明采用的技术方案为：

一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，包括以下步骤：

步骤1，针对矿井下某个监测点，获取其历史瓦斯浓度监测数据。

步骤2，数据预处理与缺失数据填充：对于一个监测点每间隔10分钟计算一次瓦斯浓度均值，得到规整的瓦斯浓度监测数据，提取同一时间段非缺失瓦斯浓度数据，计算得到均值与方差，并利用计算得到的均值与方差对所有缺失值进行填充，得到规整的瓦斯浓度监测时间序列。

步骤3，样本集生成：取连续24小时的瓦斯浓度数据作为特征X，其后3小时的瓦斯浓度数据作为预测目标Y，并按照单点顺序移动的方式逐一生成训练样本，若在规泛化的瓦斯浓度监测数据时间序列中遇到断点，则新样本的提取在断点后重新开始，得到样本集Φ。

步骤4，样本集拆分：对样本集Φ中预测目标Y进行拆分，使预测目标Y中的每一列数据均与X结合，构成t个拆分子集，分别记为Φ ₁，Φ ₂，...，

，...，Φ _t。

其中，

表示第

个拆分子集，

表示第

个拆分子集关于第j个样本的预测输出，i∈{1，2，...，t}为拆分子集号，j∈{1，2，...，N}。

步骤5，训练子集生成：利用Bootstrap方法在每个拆分子集上分别生成K个训练子集Φ _i，k，i∈{1，2，...，t}为拆分子集号，k∈{1，2，...，K}为采样子集号，共生成Kt个样本子集。

步骤6，模型训练：在每个训练子集上以预测目标值越大，赋予的权重越小为原则训练加权极限学习机模型，进一步提取每个拆分子集上K个模型的预测结果，采用计算K个模型预测结果均值的方式得出最终的集成预测结果，按照时间顺序排列拆分子集顺序，形成对未来3小时的瓦斯浓度预测结果。

步骤61，对于每一个训练子集Φ _i，k，为其中每一个预测输出值Y _i，k-m，分配对应的权重：

其中，

表示预测输出值Y _i，k-m对应的权重，m∈{1，2，...，k}，norm表示范数，范数norm取1/2。

步骤62，对于任一训练子集Φ _i，k，令

表示其目标输出矩阵，其中，S为训练子集中样本的数量。

步骤63，设定极限学习机中的隐层节点个数L与惩罚因子C，随机生成输入层到隐层之间的权重与偏置序列，a=[a ₁，a ₂，...，

，...，a _L]和b=[b ₁，b ₂，...，

，...，b _L]，其中，

∈[-1，1]，

∈[-1，1]，利用Sigmoid激活函数将任一训练子集Φ _i，k转化为隐层输出矩阵：

其中，

表示隐层输出矩阵，

表示第

个样本在隐层输出矩阵的变换，

∈[1，S]，G为Sigmoid激活函数，其计算方式如下：

其中，

表示Sigmoid激活函数。

最优参数取值组合采用加权的均方误差最小化原则确定，即：

其中，WRMSE表示加权的均方误差，

表示预测输出值

对应的权重，

表示集成预测值。哪一个L与C的取值组合具有最小的WRMSE，则将对应值最为最优参数分别分配给L和C。

利用步骤S61提取的权重生成对应的加权矩阵

：

求解下式：

其中，

表示含参数L和C的损失函数，

表示正则化参数，

表示第k 个样本的训练误差，

表示第s个样本误差，

表示连接隐层与输出层间的权重矩阵。

根据Karush–Kuhn–Tucker(KKT)理论，

可求解如下：

其中，H表示隐层输出矩阵简写，

表示矩阵H的转置，

表示权矩阵，

表示目标输出矩阵，

表示隐层节点个数，通过上述过程，可逐一训练各拆分子集模型。

步骤64，集成决策：对于任一拆分子集Ф _i中的每一个样本，分别将其置于K个对应的已训练好的模型中，得到对应的预测值

，i∈{1，2，...，t}，j∈{1，2，...，N}，通过均方根值计算得到集成预测值

：

步骤7，数据预测：实时接收最新的瓦斯浓度数据，导入到训练好的模型中，形成对未来3小时的瓦斯浓度趋势预测。

实时获取过去24小时的瓦斯浓度监测数据，做规范化处理后，记为

，通过保存的18×K个模型中的输入层权重和偏置a和b，分别将

转化为18×K个

，结合保存的 18×K个隐层权重矩阵

，通过计算各个

×

并利用集成决策原则，逐一得到对应的未来三小时各时间段预测结果，并按照时间顺序拼接为

。

优选的：步骤1中对于一个监测点，至少应包括30天的历史瓦斯浓度监测数据。

优选的：所述步骤2中得到规整的瓦斯浓度监测时间序列方法，包括以下步骤：

步骤21，读取历史瓦斯浓度监测数据，从第一个数据开始，提取10分钟内的所有数据，并做均值计算，生成规整监测瓦斯浓度数据x ₁，以此类推，每10分钟进行一次计算，最终得到规整的瓦斯浓度监测时间序列数据x ₁，x ₂，...，x _M，其中，M为规整监测数据的总数。

步骤22，若瓦斯浓度监测时间序列数据x ₁，x ₂，...，x _M中存在缺失数据，假设x _t，1缺失，则提取与x _t，1监测日期不同而时间段相同的数据，并计算其均值μ与均方差σ，通过下式对x _t，1进行填充：

其中，

表示瓦斯浓度第一个监测时间数据，η为[-1，1]之间的随机数，且保证

，

表示概率函数，

表示

时的概率。

优选的：所述步骤S3中得到样本集Φ的方法：针对规整的瓦斯浓度监测数据时间序列x ₁，x ₂，...，x _M，首先从起始位置取连续24小时的瓦斯浓度数据作为特征X ₁=[x ₁，x ₂，...，x ₁₄₄]，其后3小时的瓦斯浓度数据作为对应的预测目标Y ₁=[x ₁₄₅，x ₁₄₆，...，x ₁₆₂]，生成第一个样本，然后通过单点移动的方式生成第二个样本，即X ₂=[x ₂，x ₃，...，x ₁₄₅]，Y ₂=[x ₁₄₆，x ₁₄₇，...，x ₁₆₃]，以此类推，不断生成样本，直至数据序列耗尽，得到样本集Φ：

其中，N表示生成的样本个数。

优选的：所述步骤S5采用Bootstrap方法对每一个拆分子集进行K次采样，每次采集原始N个样本的60%，得到多个不同的样本训练子集Φ _i，k。

优选的：范数norm取值的范围在(0，1)之间的数。

优选的：范数norm取2/3。

优选的：步骤63中隐层节点数L及惩罚因子C通过格搜索方法在整体数据集上确定，L∈{20，40，...，180，200}，C∈{10^-2，10^-1，...，10⁶}。

优选的：所述步骤S7中训练好的模型要求在使用时实时读取同一监测点最新24小时的瓦斯浓度监测数据。

本发明相比现有技术，具有以下有益效果：

1.本发明结合了集成学习与加权极限学习机，实现了对未来一段时间的瓦斯浓度趋势预测，实现简单，时间复杂度低，准确度高，泛化能力强。

附图说明

图1是本发明的流程图。

图2是本发明实施例的流程图。

图3是本发明方法上线运行的流程图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，如图1-3所示，包括以下步骤：

A、提取传感器采集的某煤矿监测点瓦斯浓度监测历史数据，按10分钟等间隔计算均值，得到规范化的瓦斯浓度监测数据，并分析监测数据是否存在缺失，如果存在缺失数据则进入步骤B。

B、提取同一时间段非缺失瓦斯浓度数据，计算得到均值与方差，并利用上述两个参数值对所有缺失值进行填充，得到规整的瓦斯浓度监测时间序列，然后进入步骤C。

C、从规范化数据时间序列头开始取连续24小时的瓦斯浓度数据作为特征X，其后3小时的瓦斯浓度数据作为预测目标Y，并按照单点顺序移动逐一生成训练样本，若在规泛化的瓦斯浓度监测数据时间序列中遇到断点，则新样本的提取在断点后重新开始，最终得到样本集Φ：

(1)

其中，N表示生成的样本个数。

D、将Ф拆分为18个子集Φ ₁，Φ ₂，...，Φ ₁₈，其中：

(2)

其中，

表示第

个拆分子集，

表示第

个拆分子集关于第j个样本的预测输出，i∈{1，2，...，t}为拆分子集号，i∈{1，2，...，t}，j∈{1，2，...，N}。

E、采用Bootstrap对每一个拆分子集进行K次采样，每次采样原始N个样本的60%，得到多个不同的训练子集Φ _i，k，其中：i∈{1，2，...，18}为拆分子集号，k∈{1，2，...，K}为采样子集号，共生成18×K个样本子集。

F、对于每一个训练子集Φ _i，k，为其中每一个预测输出值Y _i，k-m，分配对应的权重，计算公式如下：

(3)

其中，

为Y _i，k-m对应的权重。

G、对于任一训练子集Φ _i，k，令

表示其目标输出矩阵，其中S为样本子集中样本的数量。

H、设定极限学习机中的隐层节点个数L与惩罚因子C，随机生成输入层到隐层之间的权重与偏置序列a=[a ₁，a ₂，...，

，...，a _L]和b=[b ₁，b ₂，...，

，...，b _L]，其中，

∈ [-1，1]，

(4)

其中，

表示隐层输出矩阵，

表示第

个样本在隐层矩阵的变换，

∈[1，S]，G为Sigmoid激活函数，其计算方式如下：

(5)

其中，

表示Sigmoid激活函数。

利用步骤F提取的权重向量生成对应的加权矩阵

：

(6)

进一步，求解下式：

(7)

其中，

表示含参数L和C的损失函数，

表示正则化参数，

表示第s 个样本的训练误差，

表示第s个样本误差，

表示连接隐层与输出层间的权重矩阵。

根据Karush–Kuhn–Tucker(KKT)理论，

可求解如下：

(8)

其中，H表示隐层输出矩阵简写，

表示矩阵H的转置，

表示权矩阵，

表示目标输出矩阵，

表示隐层节点个数，通过上述过程，可逐一训练各子模型。

I、对于任一样本集Ф _i中的每一个样本，分别将其置于K个对应的已训练好的模型中，得到对应的预测值

，i∈{1，2，...，t}，j∈{1，2，...，N}，进一步通过均值计算得到集成预测值

：

(9)

J、实时获取过去24小时的瓦斯浓度监测数据，做规范化处理后，记为

，通过保存的18×K个模型中的输入层权重和偏置a和b，分别将

转化为18×K个

，结合保存的18×K个隐层权重矩阵

，通过计算各个

×

并利用集成决策(公式(9))原则，逐一得到对应的未来三小时各时间段预测结果，并按照时间顺序拼接为

。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，其特征在于，包括以下步骤：

步骤1，针对矿井下某个监测点，获取其历史瓦斯浓度监测数据；

步骤2，数据预处理与缺失数据填充：对于一个监测点每间隔10分钟计算一次瓦斯浓度均值，得到规整的瓦斯浓度监测数据，提取同一时间段非缺失瓦斯浓度数据，计算得到均值与方差，并利用计算得到的均值与方差对所有缺失值进行填充，得到规整的瓦斯浓度监测时间序列数据；

步骤3，样本集生成：从规整的瓦斯浓度监测时间序列数据中取连续24小时的瓦斯浓度监测数据作为特征X，其后3小时的瓦斯浓度监测数据作为预测目标Y，并按照单点顺序移动的方式逐一生成训练样本，若在规整的瓦斯浓度监测时间序列数据中遇到断点，则新样本的提取在断点后重新开始，最终得到样本集

：

其中，N表示生成的样本个数；

，...，Φ _t；

其中，

表示第

个拆分子集，

表示第

个拆分子集关于第j个样本的预测输出，i ∈{1，2，...，t}为拆分子集号，j∈{1，2，...，N}；

步骤5，训练子集生成：利用Bootstrap方法在每个拆分子集

上分别生成K个训练子集Φ _i，k，i∈{1，2，...，t}为拆分子集号，k∈{1，2，...，K}为采样子集号，共生成t*K个样本子集；

步骤6，模型训练：在每个训练子集上以预测目标值越大，赋予的权重越小为原则训练加权极限学习机模型，进一步提取每个拆分子集上K个模型的预测结果，采用计算K个模型预测结果均值的方式得出最终的集成预测结果，按照时间顺序排列拆分子集顺序，形成对未来3小时的瓦斯浓度预测结果，具体包括：

其中，

表示预测输出值Y _i，k-m对应的权重，m∈{1，2，...，k}，norm表示范数，范数norm取1/2；

步骤62，对于任一训练子集Φ _i，k，令

表示其目标输出矩阵，其中，S为训练子集中样本的数量；

步骤63，设定加权极限学习机模型中的隐层节点个数L与惩罚因子C，随机生成输入层到隐层之间的权重与偏置序列，a=[a ₁，a ₂，...，

，...，a _L]和

，其中，

∈[-1，1]，

其中，

表示隐层输出矩阵，

表示第

个样本在隐层输出矩阵的变换，

∈[1，S]，G为Sigmoid激活函数，其计算方式如下：

其中，

表示Sigmoid激活函数；

最优参数L与C取值组合采用加权的均方误差最小化原则确定，加权的均方误差如下：

其中，WRMSE表示加权的均方误差，

表示预测输出值

对应的权重，

表示集成预测值，

表示预测输出值；

利用步骤S61提取的预测输出值

对应的权重

生成对应的加权矩阵

：

求解下式：

其中，

表示含参数L和C的损失函数，

表示正则化参数，

表示第s个样本的训练误差，

表示第s个样本误差，

表示连接隐层与输出层间的权重矩阵；

求解如下：

其中，H表示隐层输出矩阵简写，

表示矩阵H的转置，

表示权矩阵，

表示目标输出矩阵，

表示隐层节点个数，逐一训练各拆分子集模型；

步骤64，对于任一拆分子集Ф _i中的每一个样本，分别将其置于K个对应的已训练好的模型中，得到对应的预测值

：

2.根据权利要求1所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，其特征在于：步骤1中对于一个监测点，至少应包括30天的历史瓦斯浓度监测数据。

3.根据权利要求2所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，其特征在于：所述步骤2中得到规整的瓦斯浓度监测时间序列方法，包括以下步骤：

步骤21，读取历史瓦斯浓度监测数据，从第一个数据开始，提取10分钟内的所有数据，并做均值计算，生成规整瓦斯浓度监测数据x ₁，以此类推，每10分钟进行一次计算，最终得到规整的瓦斯浓度监测时间序列数据x ₁，x ₂，...，x _M，其中，M为规整监测数据的总数；

其中，

表示瓦斯浓度监测时间序列数据存在的缺失数据，η为[-1，1]之间的随机数，且保证

，

表示概率函数，

表示

时的概率。

4.根据权利要求3所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，其特征在于：所述步骤3中得到样本集Φ的方法：针对规整的瓦斯浓度监测时间序列数据x ₁，x ₂，...，x _M，首先从起始位置取连续24小时的瓦斯浓度监测数据作为特征X ₁=[x ₁，x ₂，...，x ₁₄₄]，其后3小时的瓦斯浓度监测数据作为对应的预测目标Y ₁=[x ₁₄₅，x ₁₄₆，...，x ₁₆₂]，生成第一个样本，然后通过单点移动的方式生成第二个样本，即X ₂=[x ₂，x ₃，...，x ₁₄₅]，Y ₂=[x ₁₄₆，x ₁₄₇，...，x ₁₆₃]，以此类推，不断生成样本，直至时间序列数据耗尽，得到样本集Φ：

其中，N表示生成的样本个数。

5.根据权利要求4所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，其特征在于：所述步骤5采用Bootstrap方法对每一个拆分子集进行K次采样，每次采集原始N个样本的60%，得到多个不同的样本训练子集Φ _i，k。

6.根据权利要求5所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，其特征在于：步骤63中隐层节点个数L及惩罚因子C取值范围如下，L∈{20，40，...，180，200}，C∈{10^-2，10^-1，...，10⁶}。

7.根据权利要求6所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法，其特征在于：所述步骤7中训练好的模型要求在使用时实时读取同一监测点最新24小时的瓦斯浓度监测数据。