CN113946790B

CN113946790B - 一种导水裂隙带高度预测方法、系统、设备及终端

Info

Publication number: CN113946790B
Application number: CN202111222432.3A
Authority: CN
Inventors: 毕尧山; 吴基文; 翟晓荣; 刘伟; 王广涛; 黄楷
Original assignee: Anhui University of Science and Technology
Current assignee: Anhui University of Science and Technology
Priority date: 2021-10-20
Filing date: 2021-10-20
Publication date: 2024-07-26
Anticipated expiration: 2041-10-20
Also published as: CN113946790A

Abstract

本发明属于煤层开采导水裂隙带高度预测技术领域，公开了一种导水裂隙带高度预测方法、系统、设备及终端，导水裂隙带高度预测方法包括：进行原始数据的标准化处理；进行因子分析，并构建FA‑RBF神经网络模型；基于FA‑RBF神经网络进行导水裂隙带高度预测模型的构建。本发明在前人研究的基础上，根据我国多个矿区的导水裂隙带发育高度实测数据，选取影响导水裂隙带发育高度的主要影响因素，采用因子分析对原始数据进行降维处理以消除各个影响因素之间的冗余信息，结合自适应能力强、具有局部最佳逼近能力的RBF神经网络，建立基于因子分析和RBF神经网络的导水裂隙带高度预测模型，能够为导水裂隙带发育高度预测提供新思路。

Description

一种导水裂隙带高度预测方法、系统、设备及终端

技术领域

本发明属于煤层开采导水裂隙带高度预测技术领域，尤其涉及一种导水裂隙带高度预测方法、系统、设备及终端。

背景技术

目前，煤炭资源仍将是我国现阶段及未来数年内十分重要的化石能源，但由于煤层开采是较为剧烈的工程与环境效应，导致了一些地质与环境灾害问题的发生。煤层开采后上覆岩层将会发生变形、移动、破断现象，最终自上而下形成“三带”，分别为垮落带、裂隙带和缓慢下沉带，其中垮落带和裂隙带统称为导水裂隙带(见图7)。在导水裂隙带内易形成裂隙通道，如果裂隙通道连通上覆含水层或地表水，就会成为上覆含水层水或地表水进入采煤工作面或采空区等的通道，引发煤层顶板突水事故的发生，严重威胁了矿井的安全生产。因此，准确预测导水裂隙带的发育高度，对于矿井顶板水害防治、保障煤矿安全回采以及生态环境保护具有极其重要的意义。

国内外众多专家学者对此开展了大量卓有成效的研究，目前常用的预测方法有理论计算、物理相似模拟或数值模拟、现场实测，这些成果都对煤炭开采形成的导水裂隙带发育高度预测具有一定的理论价值和实践指导意义，但也都存在着一定的缺陷，例如理论计算虽然较为简单，但精度难以保证；现场实测方法数值精度高，但存在操作复杂、工作量大、成本高等问题。近年来，很多学者提出将统计分析理论与数据挖掘方法运用到导水裂隙带发育高度预测中，如胡小娟等以综采导水裂隙带发育高度实测数据为基础，采用多元回归分析，得到了综采条件下导水裂隙带发育高度与其影响因素间的非线性统计关系式；李波对收集的实测数据进行因果模糊聚类分类，建立了模糊预测模型对导水裂隙带发育高度进行了研究；李振华、谢晓峰等通过分析影响导高的多指标因素并采用BP神经网络方法对导水裂隙带发育高度进行了预测；孙云普等应用支持向量机(Support Vector Machine，SVM)建立导水裂隙带高度预计模型预计导水裂隙带高度。这些新方法的应用也均取得了一些重要的研究成果，然而这些预测方法在理论计算和实践中都存在一定的缺陷，仍有待进一步完善，如SVM模型预测性能的优劣与参数的选择密切相关，目前对于参数的优化还没有得到很好的解决，且效率低下；BP神经网络虽然考虑了多种影响因素，但是对建模条件要求较为苛刻，具有网络结构难以确定、学习速度较慢、容易陷入局部极小点而无法得到全局最优解等缺点。与BP神经网络不同的是，RBF神经网络克服了BP神经网络的上述问题，且比神经网络表现出更快的学习速度和更好的算法性能。此外，由于影响导水裂隙带发育高度的因素较多而且十分复杂，影响因素与断裂带高度之间存在高度的非线性关系，且大部分伴有噪声且各因素间存在相关性，在构建预测模型时必须考虑减少或者消除这些噪声和冗余，否则将直接影响导水裂隙带高度预测的准确性，而原有研究大多直接利用原始数据进行预测，因信息重叠难以确保预测精度。因此对于导水裂隙带发育高度预测问题，减少或消除其影响因素间的冗余信息和噪声，并简化模型结构，选用学习速度快、自适应能力强的预测工具是提高预测精度的有效途径。

通过上述分析，现有技术存在的问题及缺陷为：

(1)现有导水裂隙带高度预测方法中，理论计算方法的精度难以保证；现场实测方法存在操作复杂、工作量大、成本高等问题。

(2)现有导水裂隙带高度预测方法中，SVM模型预测性能的优劣与参数的选择密切相关，目前对于参数的优化还没有得到很好的解决，且效率低下。

(3)现有导水裂隙带高度预测方法中，BP神经网络对建模条件要求较为苛刻，具有网络结构难以确定、学习速度较慢、容易陷入局部极小点而无法得到全局最优解等缺点。

(4)原有针对导水裂隙带高度预测的研究大多直接利用原始数据进行预测，因信息重叠难以确保预测精度。

解决以上问题及缺陷的难度为：

解决以上问题及缺陷的难度在于需要改进现有的现场实测手段，需要大量的科研投入资金；需要结合相关的优化算法对SVM和BP神经网络进行优化，但这专业要求较高。

解决以上问题及缺陷的意义为：

解决以上问题及缺陷的意义在于能在一定程度上降低成本，提高导水裂隙带发育高度的预测精度。

发明内容

针对现有技术存在的问题，本发明提供了一种导水裂隙带高度预测方法、系统、设备及终端，尤其涉及一种基于因子分析和径向基神经网络的导水裂隙带高度预测方法、系统、设备及终端。

本发明是这样实现的，一种导水裂隙带高度预测方法，所述导水裂隙带高度预测方法包括以下步骤：

步骤一，进行原始数据的标准化处理；

步骤二，进行因子分析，并构建FA-RBF神经网络模型；

步骤三，基于FA-RBF神经网络进行导水裂隙带高度预测模型的构建。

进一步，步骤一中，所述原始数据标准化处理，包括：

根据研究数据信息，建立影响因素矩阵X：

X＝(x_ij)_n*p；

其中，n为导水裂隙带高度实测样本组数；p为影响导水裂隙带发育高度主控因素个数。

对各指标的原始数据进行标准化处理，消除各个指标不同量纲的影响及各指标自身变异或者数值相差较大所引起的误差，所述标准化公式如下式所示：

其中，为第j个评价指标的平均值；为第j个评价指标的标准差。

进一步，步骤二中，所述因子分析，包括：

因子分析是主成分分析方法的推广和深化，是用少量几个因子来描述许多指标或因素之间的联系，以较少的几个因子反应原数据的大部分信息的统计方法。根据变量X的相关矩阵，将原来的p个变量表示为m个新变量的线性组合的形式，m＜p，所述数学模型为：

用矩阵形式表示为：

X＝AF+aε；

其中，f_j为两两正交的公共因子；e_i为特殊因子；a_ij为公共因子的负载，A为公共因子的负载矩阵。

进一步，所述因子分析的步骤如下：

(1)依据矩阵X计算其协方差矩阵，即相关矩阵R，R＝(r_ij)_p*p；

(2)依据协方差矩阵，计算其特征根λ_i及其对应的特征向量；

(3)以前q个特征值的方差累计百分数大于85％作为判断原则，确定公共因子的个数q；

(4)进行因子旋转并计算因子载荷矩阵A；

(5)建立因子得分模型并求解。

进一步，步骤二中，所述构建FA-RBF神经网络模型，包括：

(1)RBF神经网络

RBF神经网络共3层，分别为输入层、隐含层和输出层。输入层与隐含层之间为非线性变换，从隐含层到输出层为线性变换。在RBF神经网络中，输入层仅作为通道传输信号，隐含层中神经元的变换函数为径向基函数，通过非线性变换可将信号从输入层传递到隐含层，输出层是对输入信号的响应。与BP神经网络性能依赖于最优参数的选择、收敛速度慢且容易陷入局部极小不同，单隐含层的RBF神经网络，其隐含层神经元数目在训练阶段自适应地调整，因此可以得到连续函数的最佳逼近。

RBF神经网络的训练过程分为两步，首先进行无监督学习，计算输入层与隐含层之间的和，常用的RBF函数为高斯函数，输出值由以下激活函数得到：

其中，||x_p-c_i||为欧式范数，c_i为聚类中心，σ_i为基函数标准差。

求隐含层与输出层之间的权值ω_i，最终得到RBF神经网络的输出：

其中，ω_i为隐含层到输出层的连接权值；y_p为第p个样本对应模型的输出。

(2)FA-RBF神经网络模型的构建

所述FA-RBF神经网络模型是由因子分析和RBF神经网络结合而成，用于集合两种方法各自的独特优势，采用因子分析对原始变量进行降维处理，消除原始变量之间的相关性，提取出累计贡献率大于85％的新综合变量作为RBF神经网络的新输入；通过RBF神经网络对样本进行仿真训练，最后通过测试样本对其预测结果进行。

进一步，步骤三中，所述基于FA-RBF神经网络的导水裂隙带高度预测模型的构建，包括：

(1)确定导水裂隙带发育高度影响因素分析及数据来源

选取开采深度、煤层倾角、采厚、覆岩单轴抗压强度以及工作面斜长这5项指标作为影响导水裂隙带发育高度的主控因素，分别用X1，X2，X3，X4，X5表示，这5项指标通过矿井地质资料即可获得相关具体数据。

(2)因子分析提取主成分

首先，对训练样本数据按公式进行标准化处理后，对影响导水裂隙带发育高度的5个主控因素进行相关性分析；各因素之间存在一定的相关性，其中工作面斜长与煤层倾角、采高、覆岩单轴抗压强度之间的相关系数分别为-0.38、0.36、-0.38，表明这些因素之间存在较强的相关性。

通过SPSS 26软件进行因子分析，计算各成分的方差贡献率及累计贡献率，选取前4个成分作为新的预测指标，并采用最大方差法进行旋转；采用回归方法进行计算因子得分，分别记为F1、F2、F3、F4，最终得到4个新成分的得分模型。对于主成分F1，覆岩单轴抗压强度、工作面斜长的分量的载荷贡献较大，可概括为顶板岩性特征和工作面几何尺寸因素，其与覆岩单轴抗压强度有较强的正相关关系，而与工作面斜长有较强的负相关关系；主成分F2在开采深度上的载荷较大，主要代表开采深度因素；主成分F3在煤层倾角上的载荷较大，主要代表煤层发育特征；主成分F4在采厚上的载荷较大，主要代表煤层开采厚度因素。

其中，F_i为成分得分；X_i为原始数据标准化处理后的值。

(3)建立FA-RBF神经网络预测模型

将因子分析提取的四个新的成分F1、F2、F3、F4的得分值作为模型的输入因子，模型的输入节点数为4，以训练样本的导水裂隙带发育高度值的标准化值作为预测对象，模型的输出节点数为1；通过MATLAB R2018b提供的函数newrb对网络进行训练，命令调用格式为：

net＝newrb(P,T,goal,spread,mn,df)；

其中，net为需要建立的径向基神经网络预测模型；newrb为MATLAB中径向基函数神经网络模型的调用命令；P为模型输入矩阵，为因子分析提取出的F1、F2、F3、F4这四个主成分的的分值；T为目标输出矩阵，为训练样本的导水裂隙带发育高度值的标准化值；goal为均方误差，设为0.00001；spread为扩展函数；mn为隐含层的最大神经元个数；df为迭代过程的显示频率。

进行网络训练时，设置goal为0.00001，mn为30，df为5，采用试凑法经反复试验确定spread值取1时，RBF网络的误差满足精度要求，逼近效果最好；当训练次数达到20次时，均方误差达到6.35279e-30，小于设定的误差要求，训练结束；对FA-RBF神经网络模型输出值进行反标准化处理后得到训练样本的导水裂隙带发育高度预测值，并与真实值对比，确定模型的拟合能力。

(4)模型效果检验

采用预留的3组测试样本对模型进行效果检验；将3组测试样本数据按训练样本的标准化处理原则进行标准化处理后，代入公式获得经因子分析处理后的四个新成分的得分值，代入建好的FA-RBF神经网络模型中，并输出进行反标准化处理得到3组测试样本的导水裂隙带发育高度预测值。

采用平均绝对误差MAE、误差均方根RMSE和平均相对误差d_r这3个指标来评价FA-RBF神经网络预测模型的效果；基于同一误差水平建立未经因子分析的RBF神经网络预测模型和传统的SVM模型预测模型，并将对于测试样本的预测结果与FA-RBF神经网络模型进行对比。

计算公式如以下公式所示：

其中，为模型的节点输出值；y_i为实际值；n为测试样本数，n＝3；MAE、RMSE、值越小，则误差越小，表明模型的预测效果越好。

本发明的另一目的在于提供一种应用所述的导水裂隙带高度预测方法的导水裂隙带高度预测系统，所述导水裂隙带高度预测系统包括：

数据标准化处理模块，用于进行原始数据的标准化处理；

神经网络模型构建模块，用于进行因子分析，并构建FA-RBF神经网络模型；

高度预测模型构建模块，用于基于FA-RBF神经网络进行导水裂隙带高度预测模型的构建。

本发明的另一目的在于提供一种计算机设备，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如下步骤：

进行原始数据的标准化处理；进行因子分析，并构建FA-RBF神经网络模型；基于FA-RBF神经网络进行导水裂隙带高度预测模型的构建。

本发明的另一目的在于提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如下步骤：

本发明的另一目的在于提供一种信息数据处理终端，所述信息数据处理终端用于实现所述的导水裂隙带高度预测系统。

结合上述的所有技术方案，本发明所具备的优点及积极效果为：本发明提供的导水裂隙带高度预测方法，为准确预测煤层顶板导水裂隙带发育高度，基于我国多个矿区的煤层顶板导水裂隙带发育高度实测数据，采用因子分析并结合RBF神经网络建立了基于FA-RBF神经网络的导水裂隙带发育高度预测模型，并检验了该模型对新样本数据的预测性能。

为提高导水裂隙带发育高度预测模型的预测精度，本发明在前人研究的基础上，根据我国多个矿区的导水裂隙带发育高度实测数据，选取了影响导水裂隙带发育高度的主要影响因素，采用因子分析对原始数据进行降维处理以消除各个影响因素之间的冗余信息，并结合自适应能力强、具有局部最佳逼近能力的RBF神经网络，建立了基于因子分析和RBF神经网络的导水裂隙带高度预测模型，能够为导水裂隙带发育高度预测提供一种新思路。

结果表明，本发明的基于FA-RBF神经网络的导水裂隙带发育高度预测模型具有很好的拟合能力，同时对于新样本也表现出较强的泛化能力和较好的预测性能，其对新样本预测结果的平均绝对误差、误差均方根、平均相对误差分别为4.4658m、4.7091m、7.52％，优于未经因子分析处理的RBF神经网络预测模型和传统的SVM预测模型。该模型不但可以避免传统预测方法未考虑各影响因素间存在的相关性而影响预测精度的弊端，而且简化了神经网络输入层的维数，缩小了神经网络规模，并解决了传统BP神经网络模型在处理非线性系统问题上存在的训练复杂化、容易陷入局部最小且隐含层结点个数不易确定等缺点。本发明为准确预测导水裂隙带发育高度提供了一种有效的途径和方法。

本发明基于我国多个矿区的煤层顶板导水裂隙带发育高度实测数据，采用因子分析对原始数据进行了降维处理，消除了各影响因素间的重复信息对预测精度的影响，并结合RBF神经网络建立了基于FA-RBF神经网络的导水裂隙带发育高度预测模型，主要得到以下结论：

(1)采用因子分析消除了影响导水裂隙带发育高度的主控因素间存在的共线性，提取的主成分保留原始变量的主要信息，同时降低了神经网络输入层的维数，缩小了神经网络规模，简化了模型。

(2)建立的基于FA-RBF神经网络的导水裂隙带发育高度预测模型优于未经因子分析处理的RBF神经网络预测模型和传统的BP神经网络预测模型，对于新样本表现出较强的泛化能力和较好的预测性能，其平均绝对误差、误差均方根、平均相对误差分别为4.4658m、4.7091m、7.52％。

(3)本发明为准确预测导水裂隙带发育高度提供了一种有效的途径和方法。需要指出的是，今后的研究中应进一步考虑更多的影响因素和收集更多的样本数，以进一步提高模型的预测精度和增大模型的应用范围，使其能更好地应用于矿井煤层顶板导水裂隙带发育高度预测中。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图做简单的介绍，显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的导水裂隙带高度预测方法流程图。

图2是本发明实施例提供的导水裂隙带高度预测方法原理图。

图3是本发明实施例提供的导水裂隙带高度预测系统结构框图；

图中：1、数据标准化处理模块；2、神经网络模型构建模块；3、高度预测模型构建模块。

图4是本发明实施例提供的各主控因素间相关系数热图。

图5是本发明实施例提供的模型训练误差变化图。

图6是本发明实施例提供的训练样本预测值与真实值对比示意图。

图7是本发明实施例提供的采矿覆盖层导水断裂带(WCFZ)的发展示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提供了一种导水裂隙带高度预测方法、系统、设备及终端，下面结合附图对本发明作详细的描述。

如图1所示，本发明实施例提供的导水裂隙带高度预测方法包括以下步骤：

S101，进行原始数据的标准化处理；

S102，进行因子分析，并构建FA-RBF神经网络模型；

S103，基于FA-RBF神经网络进行导水裂隙带高度预测模型的构建。

本发明实施例提供的导水裂隙带高度预测方法原理图如图2所示。

如图3所示，本发明实施例提供的导水裂隙带高度预测系统包括：

数据标准化处理模块1，用于进行原始数据的标准化处理；

神经网络模型构建模块2，用于进行因子分析，构建FA-RBF神经网络模型；

高度预测模型构建模块3，用于基于FA-RBF神经网络进行导水裂隙带高度预测模型的构建。

下面结合具体实施例对本发明的技术方案作进一步描述。

1、发明概述

准确预测导水裂隙带的发育高度，对于矿井煤层顶板水害防治、保障煤矿安全回采具有极其重要的意义。为准确预测煤层顶板导水裂隙带发育高度，基于我国多个矿区的煤层顶板导水裂隙带发育高度实测数据，采用因子分析并结合RBF神经网络建立了基于FA-RBF神经网络的导水裂隙带发育高度预测模型，并检验了该模型对新样本数据的预测性能。结果表明：基于FA-RBF神经网络的导水裂隙带发育高度预测模型具有很好的拟合能力，同时对于新样本也表现出较强的泛化能力和较好的预测性能，其对新样本预测结果的平均绝对误差、误差均方根、平均相对误差分别为4.4658m、4.7091m、7.52％，优于未经因子分析处理的RBF神经网络预测模型和传统的SVM预测模型。该模型不但可以避免传统预测方法未考虑各影响因素间存在的相关性而影响预测精度的弊端，而且简化了神经网络输入层的维数，缩小了神经网络规模，并解决了传统BP神经网络模型在处理非线性系统问题上存在的训练复杂化、容易陷入局部最小且隐含层结点个数不易确定等缺点。本发明为准确预测导水裂隙带发育高度提供了一种有效的途径和方法。

2、发明内容

2.1原始数据标准化处理

根据研究数据信息，建立影响因素矩阵X：

X＝(x_ij)_n*p(1)

为了消除各个指标不同量纲的影响及各指标自身变异或者数值相差较大所引起的误差，需要要对各指标的原始数据进行标准化处理，标准化公式如式所示。数据标准化可以加快训练速度，比没有标准化的同样条件训练出来的模型更加稳定，拟合度更均匀，预测精度更高。

2.2因子分析

因子分析是主成分分析方法的推广和深化，是用少量几个因子来描述许多指标或因素之间的联系，以较少的几个因子反应原数据的大部分信息的统计方法。因子分析对多变量的平面数据进行最佳综合和简化，即在保证数据信息丢失最少的原则下，对高维变量空间进行降维处理，既合理解释了包含在因子间的相关性，又简化了观测系统。根据变量X的相关矩阵，可把原来的p个变量表示为m(m＜p)个新变量的线性组合的形式，其数学模型为：

用矩阵形式表示为：

X＝AF+aε (4)

因子分析的具体步骤如下：

(1)依据矩阵X计算其协方差矩阵，即相关矩阵R，R＝(r_ij)_p*p。

(2)依据协方差矩阵，计算其特征根λ_i及其对应的特征向量。

(3)以前q个特征值的方差累计百分数大于85％作为判断原则，确定公共因子的个数q。

(4)进行因子旋转并计算因子载荷矩阵A。

(5)建立因子得分模型并求解。

2.3RBF神经网络

RBF神经网络是一种局部逼近的前向反馈式神经网络，能够逼近任意的非线性函数，在处理系统内难以解析的规律性时，具有良好的泛化能力，且结构简单并有很快的学习收敛速度，在很多领域内得到了应用。RBF神经网络共3层，分别为输入层、隐含层和输出层。输入层与隐含层之间为非线性变换，从隐含层到输出层为线性变换。在RBF神经网络中，输入层仅作为通道传输信号，隐含层中神经元的变换函数为径向基函数，通过非线性变换可将信号从输入层传递到隐含层，输出层是对输入信号的响应。与BP神经网络性能依赖于最优参数的选择、收敛速度慢且容易陷入局部极小不同，单隐含层的RBF神经网络，其隐含层神经元数目在训练阶段自适应地调整，因此可以得到连续函数的最佳逼近。

RBF神经网络的训练过程分为两步，首先进行无监督学习，计算输入层与隐含层之间的和，常用的RBF函数为高斯函数，输出值可由激活函数(1)得到：

式中：||x_p-c_i||为欧式范数，c_i为聚类中心，σ_i为基函数标准差。

然后求隐含层与输出层之间的权值ω_i，最终得到RBF神经网络的输出：

式中：ω_i为隐含层到输出层的连接权值；y_p为第p个样本对应模型的输出。

2.4FA-RBF神经网络模型

本发明建立的FA-RBF神经网络模型是由因子分析和RBF神经网络结合而成，旨在集合两种方法各自的独特优势，首先采用因子分析对原始变量进行降维处理，消除原始变量之间的相关性，提取出累计贡献率大于85％的新综合变量作为RBF神经网络的新输入，然后通过RBF神经网络对样本进行仿真训练，最后通过测试样本对其预测结果进行。本发明的流程图如图2所示。

3、基于FA-RBF神经网络的导水裂隙带高度预测模型

3.1导水裂隙带发育高度影响因素分析及数据来源

导水裂隙带发育高度影响因素众多，一般来说导水裂隙带发育高度主要受到地质条件、采动覆岩性质和开采工艺等方面的影响和控制。结合前人的研究成果，同时考虑影响因素易于获取、便于统一量化等原则，选取开采深度、煤层倾角、采厚、覆岩单轴抗压强度以及工作面斜长这5项指标作为影响导水裂隙带发育高度的主控因素，分别用X1，X2，X3，X4，X5表示，这5项指标通过矿井地质资料即可获得相关具体数据。本次研究根据现有文献选取我国多个矿区共24组煤层顶板导水裂隙带发育高度实测数据作为样本数据进行分析，如表1所示，其中1～22组作为训练样本建立预测模型，23～24组作为测试样本用以检验模型预测效果。

(1)开采深度

根据岩石力学理论，地应力随深度的增加而增大，煤层开采深度的不同会导致工作面周围所受地应力不同，地应力大小的不同会造成其上覆岩层破坏范围的不同。煤层开采后，顶板上覆岩层运动导致导水裂隙带的形成，覆岩运动的幅度和速度直接影响着导水裂隙带的高度。因此，煤层的开采深度越深，矿山压力越大，覆岩运动规模越大，导水裂隙带越发育。

(2)煤层倾角

一般情况下，水平和缓倾斜煤层覆岩破坏高度随着煤层倾角增大而缓慢增大；倾斜煤层覆岩破坏高度随着煤层倾角增大而迅速增大；急倾斜煤层覆岩破坏高度随着煤层倾角增大反而迅速减小。

(3)采高

采高即采煤机的实际开采高度(采全高时等于煤层厚度)。采高是预测导水裂隙带发育高度的主要影响因素。采高对煤层开采后上覆岩层的应力重分布、变形和破裂范围影响最为显著，开采厚度越大，顶板塑性区的范围也越大，导水裂隙带高度越大。

(4)覆岩单轴抗压强度

煤层上覆岩层单轴抗压强度可反映覆岩性质及其组合结构，大小近似为覆岩加权单轴抗压强度。硬度较大的脆性岩体，易于产生导水的裂隙带，软弱的塑性岩体，以塑性变形为主，不易产生导水的裂隙带。

(5)工作面斜长

在煤层未充分采动之前，工作面斜长对于导水裂隙带发育影响较大，发育高度随着工作面开采不断增加；当煤层充分采动后，工作面斜长对裂隙带发育影响不明显，导水裂隙带发育高度达到最大时会形成典型的拱形。

表1导水裂隙带发育高度实测数据样本

3.2因子分析提取主成分

首先，对表1中的21组训练样本数据按公式(1)～(2)进行标准化处理，然后对影响导水裂隙带发育高度的5个主控因素进行相关性分析，结果如图4所示。由图4可知，各因素之间存在一定的相关性，其中工作面斜长与煤层倾角、采高、覆岩单轴抗压强度之间的相关系数分别为-0.38、0.36、-0.38，表明这些因素之间存在较强的相关性，由于信息冗余的存在增加了导水裂隙带发育高度预测问题的复杂性，也会使得预测精度难以保证。因此，有必要采用因子分析的方法将相关的变量处理为低维、互不相关且能够保留原始变量绝大部分信息的新综合变量。

本发明通过SPSS 26软件进行因子分析，先计算各成分的方差贡献率及累计贡献率(见表2)，由表3可知前4个成分的累计方差贡献率为92.287％，大于85％，满足主成分提取的原则，可以反映原始数据的绝大部分信息。因此选取前4个成分作为新的预测指标，并采用最大方差法进行旋转，然后采用回归方法进行计算因子得分，分别记为F1、F2、F3、F4，得到的成分得分系数矩阵如表3所示，最终得到4个新成分的得分模型(见式7所示)。对于主成分F1，覆岩单轴抗压强度、工作面斜长的分量的载荷贡献较大，可概括为顶板岩性特征和工作面几何尺寸因素，其与覆岩单轴抗压强度有较强的正相关关系，而与工作面斜长有较强的负相关关系；主成分F2在开采深度上的载荷较大，主要代表开采深度因素；主成分F3在煤层倾角上的载荷较大，主要代表煤层发育特征；主成分F4在采厚上的载荷较大，主要代表煤层开采厚度因素。

这样就将原来的5维因子降为4维，减小了模型规模，同时生成的四个新成分可以反映和解释原始变量之间的复杂关系，消除了各影响因素之间的相关性。

表2总方差解释

表3成分得分系数矩阵

式中：F_i为成分得分；X_i为原始数据标准化处理后的值。

3.3建立FA-RBF神经网络预测模型

将因子分析提取的四个新的成分F1、F2、F3、F4的得分值作为模型的输入因子，模型的输入节点数为4，以21组训练样本的导水裂隙带发育高度值的标准化值作为预测对象，模型的输出节点数为1。本发明通过MATLAB R2018b提供的函数newrb对网络进行训练，其命令调用格式为：

net＝newrb(P,T,goal,spread,mn,df)(9)

其中，net为需要建立的径向基神经网络预测模型；newrb为MATLAB中径向基函数神经网络模型的调用命令；P为模型输入矩阵，本发明中为因子分析提取出的F1、F2、F3、F4这四个主成分的的分值；T为目标输出矩阵，本发明中为21组训练样本的导水裂隙带发育高度值的标准化值；goal为均方误差，本发明中设为0.00001；spread为扩展函数；mn为隐含层的最大神经元个数；df为迭代过程的显示频率。

用newrb函数设计RBF神经网络是一个不断尝试的过程，在网络设计过程中，需要用不同的spread值进行尝试，以确定一个最优值。本次研究进行网络训练时，设置goal为0.00001，mn为30，df为5，采用试凑法经反复试验确定spread值取1时，RBF网络的误差满足精度要求，逼近效果最好。训练过程中，误差变化的情况如图5所示。由图5可知，当训练次数达到20次时，均方误差达到6.35279e-30，小于设定的误差要求，训练结束。对FA-RBF神经网络模型输出值进行反标准化处理后得到21组训练样本的导水裂隙带发育高度预测值，并将其与真实值对比，如图6所示。由图6可知，训练样本的预测值与真实值曲线的重合度很高，即预测值与真实值十分接近，表明该模型输出能很好地逼近非线性函数，即该模型具有极好的拟合能力。

3.4模型效果检验

当建立的模型具有很好的拟合能力时，还应关注模型是否出现过拟合现象，即该模型在训练样本附近预测精度非常高，但对于新样本数据的预测精度较低。因此，评价一个预测模型的好坏，主要取决于该模型对新样本的预测能力。为验证基于FA-RBF神经网络模型对新样本数据的预测能力，采用预留的3组测试样本(编号22-24)对其进行效果检验。先将3组测试样本数据按之前训练样本的标准化处理原则进行标准化处理，然后代入公式(8)中获得经因子分析处理后的四个新成分的得分值，将其代入建好的FA-RBF神经网络模型中，并将其输出进行反标准化处理得到3组测试样本的导水裂隙带发育高度预测值(见表4)。为更精确地评价模型的预测能力，本发明采用平均绝对误差MAE、误差均方根RMSE和平均相对误差这3个指标来评价FA-RBF神经网络预测模型的效果，其计算公式如公式(10)所示。MAE、RMSE、值越小，则误差越小，表明模型的预测效果越好。

式中：为模型的节点输出值；y_i为实际值；n为测试样本数，此处n＝3。

为了进一步验证因子分析对RBF神经网络模型输入因子的简化作用以及对影响因素间相关性的消除作用和RBF神经网络模型相对传统SVM模型的优势，本发明基于同一误差水平建立了未经因子分析的RBF神经网络预测模型和传统的SVM模型预测模型，并将它们对于测试样本的预测结果与FA-RBF神经网络模型进行对比，如表4、表5所示。

表4不同模型的预测值与真实值对比

表5不同模型的评价指标对比

评价指标	平均绝对误差/m	误差均方根/m	平均相对误差％
				FA-RBF模型	4.4658	4.7091	7.52
RBF模型	4.7820	5.5665	8.46
				SVM模型	15.1188	16.7411	25.32

由表5可知，在本发明中，SVM模型对于测试样本的平均绝对误差、误差均方根、平均相对误差在3种模型中均为最大的，其次为RBF神经网络预测模型，FA-RBF预测模型的平均绝对误差、误差均方根、平均相对误差均为3种模型中最小的，表明相较于传统的SVM模型，RBF神经网络模型对于新样本具有较高的预测能力，而经过因子分析后的FA-RBF神经网络模型对于新样本的预测能力又得到了进一步的提高。FA-RBF神经网络模型具有较强的泛化能力，预测精度较高，为准确预测导水裂隙带发育高度提供了有效的途径和方法。

4、人工神经网络作为人工智能的一种形式，在对于非线性问题的预测领域取得了较好的应用效果。目前用于导水裂隙带发育高度预测领域的人工神经网络主要是BP神经网络，但BP神经网络具有容易陷入局部最小且隐含层结点个数不易确定等缺点，而RBF神经网络克服了BP神经网络的缺点，而且使用函数newrb可自适应增加RBF网络的隐含层节点数直至达到目标误差要求或网络达到最大神经元数目为止，这比BP神经网络优越。此外，SVM模型在导水裂隙带发育高度预测方面也得到了较多应用。本发明提出的基于FA-RBF神经网络预测模型相较于传统的SVM模型，对导水裂隙带发育高度的预测精度有了显著提高，相对于未经因子分析处理的RBF神经网络模型对导水裂隙带发育高度的预测精度有了进一步提高。产生这种结果的原因，一方面是由于RBF神经网络较BP神经网络模型具有更强的自适应性和处理非线性函数关系的能力；另一方面是由于因子分析降低了数据维度，简化了RBF神经网络模型的输入结构，同时又有效避免了因影响因素间重复信息干扰和噪声存在而影响预测精度的弊端。这两方面原因的组合作用在很大程度上提高了该模型的收敛速度、学习能力和预测能力。

尽管本发明提出的基于FA-RBF神经网络预测模型表现出了较好的预测性能，同时也存在一定的不确定性。由于导水裂隙带发育高度主要受到地质条件、采动覆岩性质和开采工艺等诸多方面的影响和控制，本发明从指标易于获取和便于统一量化的角度出发，只考虑了开采深度、煤层倾角、采高、覆岩单轴抗压强度、工作面斜长这5个因素的影响，且建模数据相对较少。而对于模型预测精度来说，选取的影响因素的多少和数据资源的丰富程度及可靠程度都会对预测结果的精度产生影响。因此今后在构建训练样本集的时候，有必要进一步考虑更多的影响因素(如煤层硬度、工作面推进速度、开采方法等)和收集更多的导水裂隙带发育高度实测样本数据，以进一步提高模型的预测精度。

此外，本发明尚未对系统内部进行深入和综合分析，仅单一地从我国多个矿区收集的煤层顶板导水裂隙带发育高度实测数据中寻找规律对导水裂隙带发育高度进行预测，尚未对可能影响导水裂隙带发育高度预测结果的影响因素进行全方面的分析，可能会使得该模型在有些情况不适用。比如已有研究表明地质构造的存在也会影响煤层顶板导水裂隙带的发育高度，现有文献通过理论分析和数值模拟结果的对比表明，考虑断层存在情况下的导水裂隙带高度约为无断层情况下的1.50倍；此外断层性质(正、逆断层)、倾角和落差对导水裂隙带发育规律也具有较大影响，但目前仍缺乏深入研究的研究。今后有必要对影响导水裂隙带发育高度的这些因素做深入研究和探讨，以进一步改善模型，增大模型的应用范围。

5、本发明基于多个矿区的煤层顶板导水裂隙带发育高度实测数据，采用因子分析对原始数据进行了降维处理，消除了各影响因素间的重复信息对预测精度的影响，并结合RBF神经网络建立了基于FA-RBF神经网络的导水裂隙带发育高度预测模型，主要得到以下结论：

(3)本发明为准确预测导水裂隙带发育高度提供了一种有效的途径和方法。需要指出的是，今后的分析中应进一步考虑更多的影响因素和收集更多的样本数，以进一步提高模型的预测精度和增大模型的应用范围，使其能更好地应用于矿井煤层顶板导水裂隙带发育高度预测中。

在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上；术语“上”、“下”、“左”、“右”、“内”、“外”、“前端”、“后端”、“头部”、“尾部”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”等仅用于描述目的，而不能理解为指示或暗示相对重要性。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现，所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘Solid StateDisk(SSD))等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，都应涵盖在本发明的保护范围之内。

Claims

1.一种导水裂隙带高度预测方法，其特征在于，所述导水裂隙带高度预测方法包括以下步骤：

步骤一，进行原始数据的标准化处理；

步骤二，进行因子分析，并构建FA-RBF神经网络模型；

步骤三，基于FA-RBF神经网络进行导水裂隙带高度预测模型的构建；

步骤一中，所述原始数据标准化处理，包括：

根据研究数据信息，建立影响因素矩阵X：

X＝(x_ij)_n*p；

其中，n为导水裂隙带高度实测样本组数；p为影响导水裂隙带发育高度主控因素个数；

其中，为第j个评价指标的平均值；为第j个评价指标的标准差；

步骤二中，所述因子分析，包括：

因子分析是主成分分析方法的推广和深化，是用少量几个因子来描述许多指标或因素之间的联系，以较少的几个因子反应原数据的大部分信息的统计方法；根据变量X的相关矩阵，将原来的p个变量表示为m个新变量的线性组合的形式，m＜p，数学模型为：

用矩阵形式表示为：

X＝AF+aε；

其中，f_j为两两正交的公共因子；e_i为特殊因子；a_ij为公共因子的负载，A为公共因子的负载矩阵；

所述因子分析的步骤如下：

(1)依据矩阵X计算其协方差矩阵，即相关矩阵R，R＝(r_ij)_p*p；

(2)依据协方差矩阵，计算其特征根λ_i及其对应的特征向量；

(4)进行因子旋转并计算因子载荷矩阵A；

(5)建立因子得分模型并求解；

步骤二中，所述构建FA-RBF神经网络模型，包括：

(1)RBF神经网络

RBF神经网络共3层，分别为输入层、隐含层和输出层；输入层与隐含层之间为非线性变换，从隐含层到输出层为线性变换；在RBF神经网络中，输入层仅作为通道传输信号，隐含层中神经元的变换函数为径向基函数，通过非线性变换可将信号从输入层传递到隐含层，输出层是对输入信号的响应；与BP神经网络性能依赖于最优参数的选择、收敛速度慢且容易陷入局部极小不同，单隐含层的RBF神经网络，其隐含层神经元数目在训练阶段自适应地调整，因此可以得到连续函数的最佳逼近；

其中，||x_p-c_i||为欧式范数，c_i为聚类中心，σ_i为基函数标准差；

其中，ω_i为隐含层到输出层的连接权值；y_p为第p个样本对应模型的输出；

(2)FA-RBF神经网络模型的构建

所述FA-RBF神经网络模型是由因子分析和RBF神经网络结合而成，用于集合两种方法各自的独特优势，采用因子分析对原始变量进行降维处理，消除原始变量之间的相关性，提取出累计贡献率大于85％的新综合变量作为RBF神经网络的新输入；通过RBF神经网络对样本进行仿真训练，最后通过测试样本对其预测结果进行；

步骤三中，所述基于FA-RBF神经网络的导水裂隙带高度预测模型的构建，包括：

(1)确定导水裂隙带发育高度影响因素分析及数据来源：

选取开采深度、煤层倾角、采厚、覆岩单轴抗压强度以及工作面斜长这5项指标作为影响导水裂隙带发育高度的主控因素，分别用X1，X2，X3，X4，X5表示，这5项指标通过矿井地质资料即可获得相关具体数据；

(2)因子分析提取主成分：

首先，对训练样本数据按公式进行标准化处理后，对影响导水裂隙带发育高度的5个主控因素进行相关性分析；各因素之间存在一定的相关性，其中工作面斜长与煤层倾角、采高、覆岩单轴抗压强度之间的相关系数分别为-0.38、0.36、-0.38，表明这些因素之间存在较强的相关性；

通过SPSS26软件进行因子分析，计算各成分的方差贡献率及累计贡献率，选取前4个成分作为新的预测指标，并采用最大方差法进行旋转；采用回归方法进行计算因子得分，分别记为F1、F2、F3、F4，最终得到4个新成分的得分模型；对于主成分F1，覆岩单轴抗压强度、工作面斜长的分量的载荷贡献较大，概括为顶板岩性特征和工作面几何尺寸因素，其与覆岩单轴抗压强度有较强的正相关关系，而与工作面斜长有较强的负相关关系；主成分F2在开采深度上的载荷较大，主要代表开采深度因素；主成分F3在煤层倾角上的载荷较大，主要代表煤层发育特征；主成分F4在采厚上的载荷较大，主要代表煤层开采厚度因素；

其中，F_i为成分得分；X_i为原始数据标准化处理后的值；

(3)建立FA-RBF神经网络预测模型

net＝newrb(P,T,goal,spread,mn,df)；

其中，net为需要建立的径向基神经网络预测模型；newrb为MATLAB中径向基函数神经网络模型的调用命令；P为模型输入矩阵，为因子分析提取出的F1、F2、F3、F4这四个主成分的的分值；T为目标输出矩阵，为训练样本的导水裂隙带发育高度值的标准化值；goal为均方误差，设为0.00001；spread为扩展函数；mn为隐含层的最大神经元个数；df为迭代过程的显示频率；

进行网络训练时，设置goal为0.00001，mn为30，df为5，采用试凑法经反复试验确定spread值取1时，RBF网络的误差满足精度要求，逼近效果最好；当训练次数达到20次时，均方误差达到6.35279e-30，小于设定的误差要求，训练结束；对FA-RBF神经网络模型输出值进行反标准化处理后得到训练样本的导水裂隙带发育高度预测值，并与真实值对比，确定模型的拟合能力；

(4)模型效果检验

采用预留的3组测试样本对模型进行效果检验；将3组测试样本数据按训练样本的标准化处理原则进行标准化处理后，代入公式获得经因子分析处理后的四个新成分的得分值，代入建好的FA-RBF神经网络模型中，并输出进行反标准化处理得到3组测试样本的导水裂隙带发育高度预测值；

采用平均绝对误差MAE、误差均方根RMSE和平均相对误差这3个指标来评价FA-RBF神经网络预测模型的效果；基于同一误差水平建立未经因子分析的RBF神经网络预测模型和传统的SVM模型预测模型，并将对于测试样本的预测结果与FA-RBF神经网络模型进行对比；

计算公式如以下公式所示：

2.一种应用如权利要求1所述的导水裂隙带高度预测方法的导水裂隙带高度预测系统，其特征在于，所述导水裂隙带高度预测系统包括：

数据标准化处理模块，用于进行原始数据的标准化处理；

3.一种计算机设备，其特征在于，所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如如权利要求1所述的导水裂隙带高度预测方法的步骤。

4.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如如权利要求1所述的导水裂隙带高度预测方法的步骤。

5.一种信息数据处理终端，其特征在于，所述信息数据处理终端用于实现如权利要求2所述的导水裂隙带高度预测系统。