CN107122861B - 一种基于pca-pso-elm的瓦斯涌出量预测方法 - Google Patents
一种基于pca-pso-elm的瓦斯涌出量预测方法 Download PDFInfo
- Publication number
- CN107122861B CN107122861B CN201710290863.0A CN201710290863A CN107122861B CN 107122861 B CN107122861 B CN 107122861B CN 201710290863 A CN201710290863 A CN 201710290863A CN 107122861 B CN107122861 B CN 107122861B
- Authority
- CN
- China
- Prior art keywords
- gas emission
- emission quantity
- data
- learning machine
- principal component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 239000002245 particle Substances 0.000 claims abstract description 84
- 230000006870 function Effects 0.000 claims abstract description 49
- 230000004913 activation Effects 0.000 claims abstract description 32
- 210000002569 neuron Anatomy 0.000 claims abstract description 31
- 230000009467 reduction Effects 0.000 claims abstract description 20
- 238000005457 optimization Methods 0.000 claims abstract description 19
- 238000012360 testing method Methods 0.000 claims abstract description 18
- 238000002790 cross-validation Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 5
- 239000010410 layer Substances 0.000 claims description 60
- 239000003245 coal Substances 0.000 claims description 31
- 238000012549 training Methods 0.000 claims description 25
- 238000005065 mining Methods 0.000 claims description 24
- 238000012544 monitoring process Methods 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000001186 cumulative effect Effects 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 3
- 239000011229 interlayer Substances 0.000 claims description 2
- 238000000513 principal component analysis Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Evolutionary Computation (AREA)
- Human Resources & Organizations (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Agronomy & Crop Science (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
Abstract
本发明提出一种基于PCA‑PSO‑ELM的瓦斯涌出量预测方法,该方法为:采用主成分分析法对瓦斯涌出量的影响因素数据进行处理,得到降维后的主成分数据,建立极限学习机,将降维后的主成分数据作为极限学习机的输入,采用粒子群优化算法优化极限学习机的隐含层神经元个数和激活函数的类型组合,得到瓦斯涌出量预测模型;对瓦斯涌出量进行预测,将测试数据集E输入作为瓦斯涌出量预测模型,得到瓦斯涌出量的预测值。本发明方法采用粒子群算法结合十折交叉验证对极限学习机中隐含层神经元个数及激活函数类型进行了组合优化,该方法减少了优化的参数,同时保证了模型具有良好的泛化性能。
Description
技术领域
本发明属于瓦斯涌出量预测技术领域,具体涉及一种基于PCA-PSO-ELM的瓦斯涌出量预测方法。
背景技术
瓦斯是危及煤矿安全生产的主要灾害之一,准确预测瓦斯涌出量是实现瓦斯有效管理和保障煤矿安全生产的基础工作。目前对瓦斯涌出量进行预测的方法主要有基于灰色系统理论的方法、主成分分析结合多步线性回归法、EMD-SVM法、EMD-PSO-SVM法、LLE结合BA-Elman的方法、蚁群粒子群混合算法优化LS-SVM的方法等,采用上述方法对瓦斯涌出量进行预测取得了大量研究成果,但是矿井瓦斯涌出量受到煤层瓦斯含量、煤层厚度、煤层倾角、煤层埋藏深度等诸多因素的影响,影响因素之间及其与瓦斯涌出量之间呈现出复杂的非线性、相关性特征,为瓦斯涌出量的预测带来了一定的影响,因此有必要继续探索新的方法对瓦斯涌出量进行预测。
主成分分析(principal component analysis,PCA)是一种常见的数据简化方法,能够消除数据之间的相关性;极限学习机(extreme learning machine,ELM)是黄广斌等人提出的一种智能优化算法,具有泛化性能好、学习速度快、设置参数少的优点,目前在很多领域得到广泛应用,如朱志洁等采用遗传算法优化极限学习机的输入权值和隐含层偏差对冲击地压进行了预测,然而极限学习机的性能主要受隐含层神经元个数及激活函数的影响较大,且当隐含层神经元个数较多时需要优化的参数较多;丁华等采用遗传算法优选最佳隐层神经元个数,使用递进方式比选确定激励函数对采煤机功率进行了预测,然而由于在对隐含层神经元数量进行寻优时已经固定了激活函数的类型,且输入层与隐含层的权值与隐含层阈值是随机产生的,因此难以保证运行结果的唯一性。此外在对极限学习机的参数进行训练时没有充分考虑模型的过拟合问题,因而无法保证模型的预测性能。粒子群算法(particle swarm optimization,PSO)是一种性能良好的全局随机搜索算法,而十折交叉验证可以较好地避免模型过拟合问题,因而可以采用粒子群算法结合十折交叉验证对极限学习机中隐含层神经元个数及激活函数的类型两个参数进行组合优化,进而建立瓦斯涌出量预测模型。
发明内容
针对现有技术的不足,本发明提出一种基于PCA-PSO-ELM的瓦斯涌出量预测方法。
一种基于PCA-PSO-ELM的瓦斯涌出量预测方法,包括以下步骤:
步骤1:采集采煤矿井中瓦斯涌出量监测数据、已知瓦斯涌出量对应的影响因素数据Z=[z1,z2,......,zp]T、待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,z′p]T,其中,zi为第i类已知瓦斯涌出量对应的影响因素数据,z′i为第i类待预测瓦斯涌出量的影响因素数据,i=1,2,…,p,p为瓦斯涌出量的影响因素个数;
所述瓦斯涌出量的影响因素包括地质因素、开采因素、开采层原始瓦斯含量和临近层瓦斯含量;
所述地质因素包括:煤层深度、煤层厚度、煤层倾角、煤层间距、临近层厚度、层间岩性;
所述开采因素包括:采高、工作面长度、推进速度、采出率、日产量。
步骤2:对已知瓦斯涌出量对应的影响因素数据Z=[z1,z2,......,zp]T和待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,z′p]T同时进行标准化处理,得到标准化后的瓦斯涌出量的影响因素数据X=[x1,x2,......,xp]T;
所述对已知瓦斯涌出量的影响因素数据Z=[z1,z2,......,zp]T和待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,z′p]T同时进行标准化处理采用的方法为zscore标准化法。
步骤3:采用主成分分析法对标准化后的瓦斯涌出量的影响因素数据进行处理,得到降维后的主成分数据,将已知瓦斯涌出量对应的影响因素数据Z及其降维后的主成分数据作为训练样本集,将待预测瓦斯涌出量的影响因素数据Z′降维后的主成分数据作为测试数据集,记为E;
步骤3.1:计算标准化后的瓦斯涌出量的影响因素数据的均值及标准化后的瓦斯涌出量的影响因素数据的协方差矩阵S;
步骤3.2:计算协方差矩阵S的特征值λi及对应的单位正交特征向量ei;
步骤3.3:按照特征值从大到小的顺序对相应的特征向量进行排列,得到特征向量矩阵A=[e1,e2,...,ep]T;
步骤3.4:根据特征向量矩阵A得到影响因素数据的主成分矩阵Y=[Y1,Y2,......,Yp]T=AX,其中,Yi为第i个主成分数据;
步骤3.5:根据从大到小顺序排列后的特征值计算相应主成分的累计方差贡献率G(m),选择累计方差贡献率大于累计方差贡献率上限阈值的m个主成分,得到降维后的主成分数据,将已知瓦斯涌出量对应的影响因素数据Z及其降维后的主成分数据作为训练样本集,将待预测瓦斯涌出量的影响因素数据Z′降维后的主成分数据作为测试数据集,记为E,其中,m<p。
所述根据从大到小顺序排列后的特征值计算相应主成分的累计方差贡献率G(m)的公式如下所示:
其中,m∈{1,2,...,p}为选择的主成分个数,k=1,2,...,p。
步骤4:建立极限学习机,将训练样本集中降维后的主成分数据作为极限学习机的输入,将训练样本集中相应的瓦斯涌出量监测数据作为极限学习机的输出,采用粒子群优化算法优化极限学习机的隐含层神经元个数和激活函数的类型组合,对迭代过程中根据每个粒子建立的极限学习机模型采用十折交叉验证法计算预测结果的均方误差,根据全局最优粒子确定极限学习机的隐含层神经元个数和激活函数的类型组合,得到瓦斯涌出量预测模型;
步骤4.1:将隐含层神经元个数和激活函数的类型组合作为粒子,设定粒子群优化算法的粒子的搜索维数D、种群规模J、最大迭代次数Gmax、学习因子c1和c2、惯性因子w、粒子速度区间,随机初始化粒子群优化算法的粒子位置初值hj(1)及粒子速度初值vj(1),令迭代次数t=1,其中,j=1,...,J,Gmax≥t;
所述激活函数的类型为1~3的整数,分别表示为sigmoid函数、sin函数、hardlim函数。
步骤4.2:根据当前粒子建立极限学习机,将训练样本集中降维后的主成分数据作为当前极限学习机的输入,将训练样本集中相应的瓦斯涌出量监测数据作为当前极限学习机的输出,采用十折交叉验证法测试极限学习机的性能,计算十次预测结果与训练样本集相应的瓦斯涌出量监测数据的均方误差,将该均方误差值作为相应粒子的适应度值,并更新粒子的个体极值和粒子群的全局极值;
步骤4.3:判断当前迭代次数t是否达到最大迭代次数Gmax,若是,执行步骤4.5,否则,令迭代次数t=t+1,执行步骤4.4;
步骤4.4:根据t时刻粒子的个体极值pj(t)和t时刻粒子群的全局极值g(t),更新t+1时刻粒子的位置信息hj(t+1)和t+1时刻粒子的速度信息vj(t+1),返回步骤4.2;
所述根据t时刻粒子的个体极值pj(t)和t时刻粒子群的全局极值g(t),更新t+1时刻粒子的位置信息hj(t+1)和t+1时刻粒子的速度信息为vj(t+1)的计算公式如下所示:
其中,vj(t)为t时刻第j个粒子的速度信息,hj(t)为t时刻第j个粒子的位置信息,r1和r2为[0,1]范围内的随机数。
步骤4.5:根据全局极值确定极限学习机的隐含层神经元个数和激活函数的类型;
步骤4.6:根据步骤4.5确定的隐含层神经元个数和激活函数的类型建立极限学习机,即得到瓦斯涌出量预测模型;
步骤5:对瓦斯涌出量进行预测,将测试数据集E输入作为瓦斯涌出量预测模型,得到瓦斯涌出量的预测值。
本发明的有益效果:
本发明提出一种基于PCA-PSO-ELM的瓦斯涌出量预测方法,由于瓦斯涌出量的影响因素较多,且具有非线性、相关性特征,采用主成分分析消除了各影响因素数据间的相关性,同时减少了指标个数;极限学习机的性能受隐含层神经元个数及激活函数类型的影响较大,采用粒子群算法结合十折交叉验证对极限学习机中隐含层神经元个数及激活函数类型进行了组合优化,该方法减少了优化的参数,同时保证了模型具有良好的泛化性能。
附图说明
图1为本发明具体实施方式中基于PCA-PSO-ELM的瓦斯涌出量预测方法的流程图;
图2为本发明具体实施方式中采用主成分分析法对标准化后的瓦斯涌出量的影响因素数据进行处理的流程图;
图3为本发明具体实施方式中适应度函数进化图。
具体实施方式
下面结合附图对本发明具体实施方式加以详细的说明。
一种基于PCA-PSO-ELM的瓦斯涌出量预测方法,如图1所示,包括以下步骤:
步骤1:采集采煤矿井中瓦斯涌出量监测数据、已知瓦斯涌出量对应的影响因素数据Z=[z1,z2,......,zp]T、待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,z′p]T,其中,zi为第i类已知瓦斯涌出量对应的影响因素数据,z′i为第i类待预测瓦斯涌出量的影响因素数据,i=1,2,...,p,p为瓦斯涌出量的影响因素个数。
本实施方式中,瓦斯涌出量的影响因素包括地质因素、开采因素、开采层原始瓦斯含量和临近层瓦斯含量。
地质因素包括:煤层深度、煤层厚度、煤层倾角、煤层间距、临近层厚度、层间岩性。
开采因素包括:采高、工作面长度、推进速度、采出率、日产量。
本实施方式中,瓦斯涌出量的影响因素个数p=13。
本实施方式中,选取某煤矿30组瓦斯涌出量监测数据及对应的瓦斯涌出量的影响因素数据,其中前25组数据用来表示已知瓦斯涌出量监测数据及对应的影响因素数据Z,用于生成训练样本集,剩余5组数据用于生成测试样本集,其中的瓦斯涌出量影响因素数据表示为Z′用于预测瓦斯涌出量,将预测结果与真实监测数据进行比较来验证所提方法的有效性,采集的数据如表1所示:
表1瓦斯涌出量监测数据及对应的影响因素数据
表1中,N1为煤层深度、N2为煤层厚度、N3为煤层倾角、N4为开采层原始瓦斯含量、N5为煤层间距、N6为采高、N7为临近层瓦斯含量、N8为临近层厚度、N9为层间岩性、N10为工作面长度、N11为推进速度、N12为采出率、N13为日产量。
步骤2:对已知瓦斯涌出量对应的影响因素数据Z=[z1,z2,......,zp]T和待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,z′p]T同时进行标准化处理,得到标准化后的瓦斯涌出量的影响因素数据X=[x1,x2,......,xp]T。
本实施方式中,所述对已知瓦斯涌出量的影响因素数据Z=[z1,z2,......,zp]T和待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,z′p]T同时进行标准化处理采用的方法为zscore标准化法,公式如式(1)所示:
其中,xin为标准化后的第i类已知瓦斯涌出量的影响因素数据的第n个值,μi为第i类瓦斯涌出量的影响因素数据的均值,σi为第i类瓦斯涌出量的影响因素数据的标准差,zin为第i类瓦斯涌出量的影响因素数据的第n个值。
本实施方式中,对各瓦斯涌出量的影响因素数据进行相关性分析,得到的相关系数如表2所示:
表2瓦斯涌出量的影响因素数据的相关系数
从2表中可见各指标之间存在较强的相关性,如煤层深度x1与开采层原始瓦斯含量x4的相关系数达到0.972,煤层厚度x2与采高x6的相关系数达到0.991,直接使用上述指标对瓦斯涌出量进行预测必然会对预测结果的精度产生影响,因此采用主成分分析消除指标间的相关性,并降低数据的维度。
步骤3:采用主成分分析法对标准化后的瓦斯涌出量的影响因素数据进行处理,得到降维后的主成分数据,将已知瓦斯涌出量对应的影响因素数据Z及其降维后的主成分数据作为训练样本集,将待预测瓦斯涌出量的影响因素数据Z′降维后的主成分数据作为测试数据集,记为E。
步骤3.2:计算协方差矩阵S的特征值λi及对应的单位正交特征向量ei。
步骤3.3:按照特征值从大到小的顺序对相应的特征向量进行排列,得到特征向量矩阵A=[e1,e2,...,ep]T;
步骤3.4:根据特征向量矩阵A得到影响因素数据的主成分矩阵Y=[Y1,Y2,......,Yp]T=AX,其中,Yi为第i个主成分数据。
步骤3.5:根据从大到小顺序排列后的特征值计算相应主成分的累计方差贡献率G(m),选择累计方差贡献率大于累计方差贡献率上限阈值的m个主成分,得到降维后的主成分数据,将已知瓦斯涌出量对应的影响因素数据Z及其降维后的主成分数据作为训练样本集,将待预测瓦斯涌出量的影响因素数据Z′降维后的主成分数据作为测试数据集,记为E,其中,m<p。
本实施方式中,累计方差贡献率上限阈值为85%。
本实施方式中,根据从大到小顺序排列后的特征值计算相应主成分的累计方差贡献率G(m)的公式如式(2)所示:
其中,m∈{1,2,...,p}为选择的主成分个数,k=1,2,...,p。
经过主成分分析后得到前四个主成分的方差贡献率分别为0.570143162、0.162605184、0.094412701及0.058019067,累计方差贡献率达到88.5%,大于85%的累计方差贡献率,因此选取前四个主成分进行后继分析,各主成分的系数如表3所示:
表3各主成分的系数
本实施方式中,四个主成分的计算公式如式(3)~(6)所示:
由表3可知,第一个主成分主要受煤层深度x1、煤层厚度x2、开采层原始瓦斯含量x4、采高x6、临近层瓦斯含量x7的影响较大,可以将其命名为开采条件因子;第二个主成分主要受煤层倾角x3、工作面长度x10、采出率x12,其中受煤层倾角x3的影响最大,可以将该主成分命名为工作面信息因子;第三个主成分主要受煤层间距x5、临近层厚度x8的影响较大,可以将该主成分命名为临近层因子;第四个主成分主要受层间岩性x9、日产量x13影响较大,其中层间岩性的系数最大,可以将其命名为层间构造因子。
步骤4:建立极限学习机,将训练样本集中降维后的主成分数据作为极限学习机的输入,将训练样本集中相应的瓦斯涌出量监测数据作为极限学习机的输出,采用粒子群优化算法优化极限学习机的隐含层神经元个数和激活函数的类型组合,对迭代过程中根据每个粒子建立的极限学习机模型采用十折交叉验证法计算预测结果的均方误差,根据全局最优粒子确定极限学习机的隐含层神经元个数和激活函数的类型组合,得到瓦斯涌出量预测模型。
步骤4.1:将隐含层神经元个数和激活函数的类型组合作为粒子,设定粒子群优化算法的粒子的搜索维数D、种群规模J、最大迭代次数Gmax、学习因子c1和c2、惯性因子w、粒子速度区间,随机初始化粒子群优化算法的粒子位置初值hj(1)及粒子速度初值vj(1),令迭代次数t=1,其中,j=1,...,J,Gmax≥t。
本实施方式中,搜索维数为D=2,种群规模为T=20,最大迭代次数Gmax=50,学习因子c1=1.4995,c2=1.4995,惯性因子w=0.3,粒子速度区间为[-10,10],粒子的位置区间取值设置为[1,30],粒子位置的第一维初始值设为1~30之间的随机数,对该随机数进行四舍五入取整以表示隐含层神经元个数,第二维初始值设为随机生成的1~3之间的整数,对应不同的激活函数,激活函数的类型分别为sigmoid函数、sin函数、hardlim函数,其中sigmoid函数取值为1、sin函数取值为2、hardlim函数取值为3。
步骤4.2:根据当前粒子建立极限学习机,将训练样本集中降维后的主成分数据作为当前极限学习机的输入,将训练样本集中相应的瓦斯涌出量监测数据作为当前极限学习机的输出,采用十折交叉验证法测试极限学习机的性能,计算十次预测结果与训练样本集相应的瓦斯涌出量监测数据的均方误差,将该均方误差值作为相应粒子的适应度值,并更新粒子的个体极值和粒子群的全局极值。
本实施方式中,采用十折交叉验证法计算十次预测结果与训练样本集相应的瓦斯涌出量监测数据的均方误差具体为:
根据当前粒子对应的隐含层神经元个数及激活函数类型建立极限学习机,将训练样本集中降维后的主成分数据分成十份,轮流将其中九份作为训练数据,一份作为测试数据,输入当前极限学习机,预测测试数据对应的瓦斯涌出量,经过十次运算,计算十次预测结果与瓦斯涌出量监测数据真实值的均方误差,将该均方误差作为相应粒子的适应度值。步骤4.3:判断当前迭代次数t是否达到最大迭代次数Gmax,若是,执行步骤4.5,否则,令迭代次数t=t+1,执行步骤4.4。
步骤4.4:根据t时刻粒子的个体极值pj(t)和t时刻粒子群的全局极值g(t),更新t+1时刻粒子的位置信息hj(t+1)和t+1时刻粒子的速度信息vj(t+1),返回步骤4.2。
根据t时刻粒子的个体极值pj(t)和t时刻粒子群的全局极值g(t),更新t+1时刻粒子的位置信息hj(t+1)和t+1时刻粒子的速度信息为vj(t+1)的计算公式如式(7)所示:
其中,vj(t)为t时刻第j个粒子的速度信息,hj(t)为t时刻第j个粒子的位置信息,r1和r2为[0,1]范围内的随机数。
步骤4.5:根据全局极值确定极限学习机的隐含层神经元个数和激活函数的类型。
本实施方式中,最优隐含层神经元个数为11,激活函数的类型为sigmoid函数,最优均方误差为0.08089,得到的适应度函数进化图如图3所示。
步骤4.6:根据步骤4.5确定的隐含层神经元个数和激活函数的类型建立极限学习机,即得到瓦斯涌出量预测模型。
本实施方式中,瓦斯涌出量预测模型为三层结构,公式如(8)所示:
其中,M为有粒子群算法优化得到的隐含层神经元个数,xn为第n个输入数据,n=1,2,...,N,N为样本数量,ωv为输入层与隐含层的连接权值,βv为隐含层与输出层的连接权值,bv为隐含层神经元的阈值,g(*)为优化得到的极限学习机的激活函数,on为模型输出,输出层有一个节点对应相应的输出结果,该结果即为瓦斯浓度涌出量预测值。
本实施方式中,输入层与隐含层之间的权值与隐含层神经元的阈值b如表4所示:
表4输入层与隐含层之间的权值与隐含层神经元的阈值b
为了对所提方法进行比较,直接采用极限学习机根据原始数据中前25条数据建立预测模型,其中极限学习机中激活函数选择常用的sigmoid函数,经过不断尝试,当隐含层节点数设为14时,十折交叉验证结果较优,此时模型的均方误差为3.1769,明显大于PCA-PSO-ELM方法所得结果的均方误差0.08089。
步骤5:对瓦斯涌出量进行预测,将测试数据集E输入作为瓦斯涌出量预测模型,得到瓦斯涌出量的预测值。
本实施方式中,表1中瓦斯涌出量的影响因素数据经过标准化、主成分分析降维后所得数据的后5条数据输入步骤4建立的瓦斯涌出量预测模型,预测相应的瓦斯涌出量,为了进行比较,使用上文直接采用极限学习机建立的预测模型根据表1中后5条瓦斯涌出量影响因素数据对瓦斯涌出量进行预测,预测结果如表5所示:
表5瓦斯涌出量的预测值
其中,本发明方法所得预测结果的均方误差为0.1083,为了进行比较,使用上文直接采用极限学习机建立的预测模型对5条测试数据进行预测,预测结果的均方误差为3.9701,说明本发明方法具有更好的预测能力。
Claims (7)
1.一种基于PCA-PSO-ELM的瓦斯涌出量预测方法,其特征在于,包括以下步骤:
步骤1:采集采煤矿井中瓦斯涌出量监测数据、已知瓦斯涌出量对应的影响因素数据Z=[z1,z2,......,zp]T、待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,zp]T,其中,zi为第i类已知瓦斯涌出量对应的影响因素数据,z′i为第i类待预测瓦斯涌出量的影响因素数据,i=1,2,...,p,p为瓦斯涌出量的影响因素个数;
步骤2:对已知瓦斯涌出量对应的影响因素数据Z=[z1,z2,......,zp]T和待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,zp]T同时进行标准化处理,得到标准化后的瓦斯涌出量的影响因素数据X=[x1,x2,......,xp]T;
步骤3:采用主成分分析法对标准化后的瓦斯涌出量的影响因素数据进行处理,得到降维后的主成分数据,将已知瓦斯涌出量对应的影响因素数据Z及其降维后的主成分数据作为训练样本集,将待预测瓦斯涌出量的影响因素数据Z′降维后的主成分数据作为测试数据集,记为E;
步骤4:建立极限学习机,将训练样本集中降维后的主成分数据作为极限学习机的输入,将训练样本集中相应的瓦斯涌出量监测数据作为极限学习机的输出,采用粒子群优化算法优化极限学习机的隐含层神经元个数和激活函数的类型组合,对迭代过程中根据每个粒子建立的极限学习机模型采用十折交叉验证法计算预测结果的均方误差,根据全局最优粒子确定极限学习机的隐含层神经元个数和激活函数的类型组合,得到瓦斯涌出量预测模型;
步骤4.1:将隐含层神经元个数和激活函数的类型组合作为粒子,设定粒子群优化算法的粒子的搜索维数D、种群规模J、最大迭代次数Gmax、学习因子c1和c2、惯性因子w、粒子速度区间,随机初始化粒子群优化算法的粒子位置初值hj(1)及粒子速度初值vj(1),令迭代次数t=1,其中,j=1,...,J,Gmax≥t;
步骤4.2:根据当前粒子建立极限学习机,将训练样本集中降维后的主成分数据作为当前极限学习机的输入,将训练样本集中相应的瓦斯涌出量监测数据作为当前极限学习机的输出,采用十折交叉验证法测试极限学习机的性能,计算十次预测结果与训练样本集相应的瓦斯涌出量监测数据的均方误差,将该均方误差值作为相应粒子的适应度值,并更新粒子的个体极值和粒子群的全局极值;
步骤4.3:判断当前迭代次数t是否达到最大迭代次数Gmax,若是,执行步骤4.5,否则,令迭代次数t=t+1,执行步骤4.4;
步骤4.4:根据t时刻粒子的个体极值pj(t)和t时刻粒子群的全局极值g(t),更新t+1时刻粒子的位置信息hj(t+1)和t+1时刻粒子的速度信息vj(t+1),返回步骤4.2;
步骤4.5:根据全局极值确定极限学习机的隐含层神经元个数和激活函数的类型;
步骤4.6:根据步骤4.5确定的隐含层神经元个数和激活函数的类型建立极限学习机,即得到瓦斯涌出量预测模型;
步骤5:对瓦斯涌出量进行预测,将测试数据集E输入作为瓦斯涌出量预测模型,得到瓦斯涌出量的预测值。
2.根据权利要求1所述的基于PCA-PSO-ELM的瓦斯涌出量预测方法,其特征在于,所述瓦斯涌出量的影响因素包括地质因素、开采因素、开采层原始瓦斯含量和临近层瓦斯含量;
所述地质因素包括:煤层深度、煤层厚度、煤层倾角、煤层间距、临近层厚度、层间岩性;
所述开采因素包括:采高、工作面长度、推进速度、采出率、日产量。
3.根据权利要求1所述的基于PCA-PSO-ELM的瓦斯涌出量预测方法,其特征在于,所述对已知瓦斯涌出量的影响因素数据Z=[z1,z2,......,zp]T和待预测瓦斯涌出量的影响因素数据Z′=[z′1,z′2,......,zp]T同时进行标准化处理采用的方法为zscore标准化法。
4.根据权利要求1所述的基于PCA-PSO-ELM的瓦斯涌出量预测方法,其特征在于,所述步骤3包括以下步骤:
步骤3.2:计算协方差矩阵S的特征值λi及对应的单位正交特征向量ei;
步骤3.3:按照特征值从大到小的顺序对相应的特征向量进行排列,得到特征向量矩阵A=[e1,e2,...,ep]T;
步骤3.4:根据特征向量矩阵A得到影响因素数据的主成分矩阵Y=[Y1,Y2,......,Yp]T=AX,其中,Yi为第i个主成分数据;
步骤3.5:根据从大到小顺序排列后的特征值计算相应主成分的累计方差贡献率G(m),选择累计方差贡献率大于累计方差贡献率上限阈值的m个主成分,得到降维后的主成分数据,将已知瓦斯涌出量对应的影响因素数据Z及其降维后的主成分数据作为训练样本集,将待预测瓦斯涌出量的影响因素数据Z′降维后的主成分数据作为测试数据集,记为E,其中,m<p。
5.根据权利要求1所述的基于PCA-PSO-ELM的瓦斯涌出量预测方法,其特征在于,所述激活函数的类型为1~3的整数,分别表示为sigmoid函数、sin函数、hardlim函数。
6.根据权利要求1所述的基于PCA-PSO-ELM的瓦斯涌出量预测方法,其特征在于,所述根据t时刻粒子的个体极值pj(t)和t时刻粒子群的全局极值g(t),更新t+1时刻粒子的位置信息hj(t+1)和t+1时刻粒子的速度信息为vj(t+1)的计算公式如下所示:
其中,vj(t)为t时刻第j个粒子的速度信息,hj(t)为t时刻第j个粒子的位置信息,r1和r2为[0,1]范围内的随机数。
7.根据权利要求4所述的基于PCA-PSO-ELM的瓦斯涌出量预测方法,其特征在于,所述根据从大到小顺序排列后的特征值计算相应主成分的累计方差贡献率G(m)的公式如下所示:
其中,m∈{1,2,...,p}为选择的主成分个数,k=1,2,...,p。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710290863.0A CN107122861B (zh) | 2017-04-28 | 2017-04-28 | 一种基于pca-pso-elm的瓦斯涌出量预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710290863.0A CN107122861B (zh) | 2017-04-28 | 2017-04-28 | 一种基于pca-pso-elm的瓦斯涌出量预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107122861A CN107122861A (zh) | 2017-09-01 |
CN107122861B true CN107122861B (zh) | 2020-02-11 |
Family
ID=59725149
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710290863.0A Expired - Fee Related CN107122861B (zh) | 2017-04-28 | 2017-04-28 | 一种基于pca-pso-elm的瓦斯涌出量预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107122861B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107798431A (zh) * | 2017-10-31 | 2018-03-13 | 河海大学 | 一种基于改进Elman神经网络的中长期径流预报方法 |
CN108091135B (zh) * | 2017-12-12 | 2021-01-19 | 重庆师范大学 | 基于优化小波神经网络的停车泊位多步预测方法 |
CN108661715B (zh) * | 2018-04-17 | 2019-10-15 | 天地(常州)自动化股份有限公司 | 煤矿监控系统瓦斯涌出预警结果的评判方法 |
CN108647772B (zh) * | 2018-05-10 | 2020-12-25 | 东北大学 | 一种用于边坡监测数据粗差剔除的方法 |
CN109187898B (zh) * | 2018-09-03 | 2020-06-26 | 中国农业大学 | 水产养殖环境中水质氨氮含量的软测量方法及装置 |
CN109344492A (zh) * | 2018-09-27 | 2019-02-15 | 中国人民解放军海军航空大学 | 一种基于k-均值聚类与粒子群核极限学习机的航空发动机推力估计方法 |
CN109446697B (zh) * | 2018-11-08 | 2023-04-18 | 辽宁工程技术大学 | 一种基于elm的矿井风速故障分支诊断方法 |
CN109635914B (zh) * | 2018-12-17 | 2020-05-15 | 杭州电子科技大学 | 基于混合智能遗传粒子群的优化极限学习机轨迹预测方法 |
CN110222606B (zh) * | 2019-05-24 | 2022-09-06 | 电子科技大学 | 基于树搜索极限学习机的电子系统早期故障预测方法 |
CN110222766B (zh) * | 2019-06-06 | 2021-03-30 | 合肥工业大学 | 一种基于稀疏逆协方差的煤与瓦斯突出预测方法 |
CN110750941B (zh) * | 2019-11-07 | 2023-09-15 | 大连理工大学 | 一种基于煤矿通风动态解算的瓦斯涌出预测方法 |
CN111126658A (zh) * | 2019-11-15 | 2020-05-08 | 太原理工大学 | 一种基于深度学习的煤矿瓦斯预测方法 |
CN111045407B (zh) * | 2019-12-23 | 2021-11-12 | 东莞东阳光科研发有限公司 | 腐蚀箔生产控制方法及装置 |
CN111222238A (zh) * | 2020-01-03 | 2020-06-02 | 辽宁工程技术大学 | 用于应急救援的瓦斯爆炸冲击波传播状态快速预测方法 |
CN112712192B (zh) * | 2020-11-24 | 2021-09-03 | 江苏中矿安华科技发展有限公司 | 结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法 |
CN113159265B (zh) * | 2021-03-24 | 2022-09-09 | 国网河南省电力公司电力科学研究院 | 基于svm-蚁群算法的牵引负荷参数辨识方法及系统 |
CN117094837B (zh) * | 2023-10-19 | 2024-01-26 | 太原理工大学 | 基于碳氢同位素及cs-bp神经网络模型的瓦斯抽采方法 |
CN117520789B (zh) * | 2024-01-05 | 2024-03-26 | 深圳市百勤石油技术有限公司 | 一种基于人工智能的深井作业安全数据分析系统及方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7069258B1 (en) * | 2002-09-26 | 2006-06-27 | Bothwell Phillip D | Weather prediction method for forecasting selected events |
CN103745093A (zh) * | 2013-12-25 | 2014-04-23 | 中国矿业大学 | 一种基于pca-eml的煤矿突水预测方法 |
CN104832210B (zh) * | 2015-05-13 | 2016-04-13 | 山东科技大学 | 基于pca-fig-svm的瓦斯绝对涌出量预测方法 |
-
2017
- 2017-04-28 CN CN201710290863.0A patent/CN107122861B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN107122861A (zh) | 2017-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107122861B (zh) | 一种基于pca-pso-elm的瓦斯涌出量预测方法 | |
CN107122860B (zh) | 基于网格搜索和极限学习机的冲击地压危险等级预测方法 | |
CN108985335B (zh) | 核反应堆包壳材料辐照肿胀的集成学习预测方法 | |
Jamshidian et al. | Prediction of free flowing porosity and permeability based on conventional well logging data using artificial neural networks optimized by imperialist competitive algorithm–a case study in the South Pars Gas field | |
CN112529341A (zh) | 一种基于朴素贝叶斯算法的钻井漏失机率预测方法 | |
CN104200284B (zh) | 矿井断层构造预测方法 | |
US11846748B2 (en) | Deep learning seismic attribute fault predictions | |
US20230162052A1 (en) | Graph neural network (gnn)-based prediction system for total organic carbon (toc) in shale | |
CN111144001A (zh) | 一种基于bp神经网络的矿山井筒工程tbm控制方法 | |
CN115983465A (zh) | 一种基于小样本学习的冲击地压时序预测模型构建方法 | |
CN111079783A (zh) | 一种基于多核集成学习识别地层岩性参数的方法 | |
CN115049173A (zh) | 深度学习和Eaton法耦合驱动地层孔隙压力预测方法 | |
Harding et al. | Trend modeling and modeling with a trend | |
CN114117898A (zh) | 一种基于机器学习算法的随钻伽马测井正演方法 | |
CN113946790A (zh) | 一种导水裂隙带高度预测方法、系统、设备及终端 | |
Shi et al. | Optimization and data mining for fracture prediction in geosciences | |
Wei et al. | Permeability prediction in tight carbonate rocks using gene expression programming (GEP) | |
Murthy et al. | Prediction of throw in bench blasting using neural networks: an approach | |
CN115345282A (zh) | 基于变差函数模型的grnn平滑因子设置方法及系统 | |
CN115809411A (zh) | 一种基于测井数据的改进型决策树岩性识别方法 | |
Asoodeh et al. | NMR parameters determination through ACE committee machine with genetic implanted fuzzy logic and genetic implanted neural network | |
Chen et al. | Shear-Wave Velocity Prediction Method via a Gate Recurrent Unit Fusion Network Based on the Spatiotemporal Attention Mechanism | |
Wang et al. | Auto recognition of carbonate microfacies based on an improved back propagation neural network | |
CN117390973B (zh) | 基于多层感知机模型的矿山爆破炮孔利用率预测方法 | |
Vergara et al. | Predictive model of rock fragmentation using the neuro-fuzzy inference system (ANFIS) and Particle swarm optimization (PSO) to estimate fragmentation size in open pit mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20200211 |