CN112712192B - 结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法 - Google Patents

结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法 Download PDF

Info

Publication number
CN112712192B
CN112712192B CN202011327457.5A CN202011327457A CN112712192B CN 112712192 B CN112712192 B CN 112712192B CN 202011327457 A CN202011327457 A CN 202011327457A CN 112712192 B CN112712192 B CN 112712192B
Authority
CN
China
Prior art keywords
gas concentration
data
subset
training
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011327457.5A
Other languages
English (en)
Other versions
CN112712192A (zh
Inventor
韩世锋
王超
吴东风
陈昌一
赵青青
冯乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Zhong Kuang An Hua Technology Development Co ltd
Original Assignee
Jiangsu Zhong Kuang An Hua Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Zhong Kuang An Hua Technology Development Co ltd filed Critical Jiangsu Zhong Kuang An Hua Technology Development Co ltd
Priority to CN202011327457.5A priority Critical patent/CN112712192B/zh
Publication of CN112712192A publication Critical patent/CN112712192A/zh
Application granted granted Critical
Publication of CN112712192B publication Critical patent/CN112712192B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Primary Health Care (AREA)
  • Quality & Reliability (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Operations Research (AREA)
  • Mining & Mineral Resources (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Security & Cryptography (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,首先获取其历史瓦斯浓度监测数据,数据预处理与缺失数据填充,样本集生成,对样本集Φ中预测目标Y进行拆分,使预测目标Y中的每一列数据均与X结合,构成t个拆分子集,训练子集生成,通过训练子集训练集成学习与加权极限学习机模型,本发明能够实时接收最新的瓦斯浓度数据,形成对未来3小时的瓦斯浓度趋势预测,本发明时间复杂度低,准确度高。

Description

结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法
技术领域
本发明涉及一种煤矿瓦斯浓度预测方法,属于瓦斯浓度预测技术领域。
背景技术
煤矿瓦斯防护属于高危行业,极易造成群死群伤。据统计,我国瓦斯爆炸事故占重大事故次数60以上,瓦斯事故防治是煤矿安全工作重中之重。随着人工智能技术的发展,瓦斯浓度的智能预测成为防范瓦斯爆炸事故的主要手段。目前,瓦斯浓度预测方法主要包括1)时间序列方式预测,如指数平滑和曲线拟合等,这种方法参数较多、预测精度低,模型更新难。2)采用bp神经网络等技术进行预测,此类方法训练时间长,动态调整较为复杂。上述方法只考虑单一分类器的情况,单一分类器间存在一定的差异性,这会导致分类可能存在错误。那么若将多个若分类器合并后,就可以减少整体预测的错误率,实现更好的瓦斯安全监测。
发明内容
发明目的:为了克服现有技术中存在的不足,本发明提供一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,可以对未来3小时的瓦斯浓度及其走势进行相对准确的预测,可提升煤矿安全生产的智能化水平。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,包括以下步骤:
步骤1,针对矿井下某个监测点,获取其历史瓦斯浓度监测数据。
步骤2,数据预处理与缺失数据填充:对于一个监测点每间隔10分钟计算一次瓦斯浓度均值,得到规整的瓦斯浓度监测数据,提取同一时间段非缺失瓦斯浓度数据,计算得到均值与方差,并利用计算得到的均值与方差对所有缺失值进行填充,得到规整的瓦斯浓度监测时间序列。
步骤3,样本集生成:取连续24小时的瓦斯浓度数据作为特征X,其后3小时的瓦斯浓度数据作为预测目标Y,并按照单点顺序移动的方式逐一生成训练样本,若在规泛化的瓦斯浓度监测数据时间序列中遇到断点,则新样本的提取在断点后重新开始,得到样本集Φ
步骤4,样本集拆分:对样本集Φ中预测目标Y进行拆分,使预测目标Y中的每一列 数据均与X结合,构成t个拆分子集,分别记为Φ 1Φ 2,...,
Figure 932480DEST_PATH_IMAGE001
,...,Φ t
Figure 847347DEST_PATH_IMAGE002
其中,
Figure 822123DEST_PATH_IMAGE001
表示第
Figure 429822DEST_PATH_IMAGE003
个拆分子集,
Figure 669042DEST_PATH_IMAGE004
表示第
Figure 246654DEST_PATH_IMAGE003
个拆分子集关于第j个样本的预测输 出,i∈{1,2,...,t}为拆分子集号,j∈{1,2,...,N}。
步骤5,训练子集生成:利用Bootstrap方法在每个拆分子集上分别生成K个训练子集Φ i,k i∈{1,2,...,t}为拆分子集号,k∈{1,2,...,K}为采样子集号,共生成Kt个样本子集。
步骤6,模型训练:在每个训练子集上以预测目标值越大,赋予的权重越小为原则训练加权极限学习机模型,进一步提取每个拆分子集上K个模型的预测结果,采用计算K个模型预测结果均值的方式得出最终的集成预测结果,按照时间顺序排列拆分子集顺序,形成对未来3小时的瓦斯浓度预测结果。
步骤61,对于每一个训练子集Φ i,k ,为其中每一个预测输出值Y i,k-m ,分配对应的权重:
Figure 700769DEST_PATH_IMAGE005
其中,
Figure 839889DEST_PATH_IMAGE006
表示预测输出值Y i,k-m 对应的权重,m∈{1,2,...,k},norm表示范数, 范数norm取1/2。
步骤62,对于任一训练子集Φ i,k ,令
Figure 379454DEST_PATH_IMAGE007
表示其目标输出矩阵,其中,S为训练子集中样本的数量。
步骤63,设定极限学习机中的隐层节点个数L与惩罚因子C,随机生成输入层到隐 层之间的权重与偏置序列,a=[a 1a 2,...,
Figure 26336DEST_PATH_IMAGE008
,...,a L ]和b=[b 1b 2,...,
Figure 194013DEST_PATH_IMAGE009
,...,b L ],其中,
Figure 143514DEST_PATH_IMAGE008
∈[-1,1],
Figure 170376DEST_PATH_IMAGE009
∈[-1,1],利用Sigmoid激活函数将任一训练子集Φ i,k 转化为隐层输出矩 阵:
Figure 620949DEST_PATH_IMAGE010
其中,
Figure 784077DEST_PATH_IMAGE011
表示 隐层输出矩阵,
Figure 527649DEST_PATH_IMAGE012
表示第
Figure 41807DEST_PATH_IMAGE013
个样本在隐层输出矩阵的变换,
Figure 30491DEST_PATH_IMAGE013
∈[1,S],G为Sigmoid激 活函数,其计算方式如下:
Figure 48126DEST_PATH_IMAGE014
其中,
Figure 729643DEST_PATH_IMAGE015
表示Sigmoid激活函数。
最优参数取值组合采用加权的均方误差最小化原则确定,即:
Figure 465518DEST_PATH_IMAGE016
其中,WRMSE表示加权的均方误差,
Figure 992314DEST_PATH_IMAGE017
表示预测输出值
Figure 130034DEST_PATH_IMAGE018
对应的权重,
Figure 483917DEST_PATH_IMAGE019
表 示集成预测值。哪一个LC的取值组合具有最小的WRMSE,则将对应值最为最优参数分别分 配给LC
利用步骤S61提取的权重生成对应的加权矩阵
Figure 441509DEST_PATH_IMAGE017
Figure 37575DEST_PATH_IMAGE020
求解下式:
Figure 29802DEST_PATH_IMAGE021
其中,
Figure 787543DEST_PATH_IMAGE022
表示含参数L和C的损失函数,
Figure 498010DEST_PATH_IMAGE023
表示正则化参数,
Figure 632188DEST_PATH_IMAGE024
表示第k 个样本的训练误差,
Figure 744500DEST_PATH_IMAGE025
表示第s个样本误差,
Figure 177537DEST_PATH_IMAGE026
表示连接隐层与输出层间的权重矩阵。
根据Karush–Kuhn–Tucker(KKT)理论,
Figure 109721DEST_PATH_IMAGE026
可求解如下:
Figure 47590DEST_PATH_IMAGE027
其中,H表示隐层输出矩阵简写,
Figure 279988DEST_PATH_IMAGE028
表示矩阵H的转置,
Figure 113952DEST_PATH_IMAGE029
表示权矩阵,
Figure 799011DEST_PATH_IMAGE030
表示 目标输出矩阵,
Figure 274992DEST_PATH_IMAGE031
表示隐层节点个数,通过上述过程,可逐一训练各拆分子集模型。
步骤64,集成决策:对于任一拆分子集Ф i 中的每一个样本,分别将其置于K个对应 的已训练好的模型中,得到对应的预测值
Figure 96317DEST_PATH_IMAGE032
i∈{1,2,...,t},j∈{1,2,...,N},通过均方根值计算得到集成预测值
Figure 868226DEST_PATH_IMAGE033
Figure 775002DEST_PATH_IMAGE034
步骤7,数据预测:实时接收最新的瓦斯浓度数据,导入到训练好的模型中,形成对未来3小时的瓦斯浓度趋势预测。
实时获取过去24小时的瓦斯浓度监测数据,做规范化处理后,记为
Figure 320253DEST_PATH_IMAGE035
,通过保存 的18×K个模型中的输入层权重和偏置ab,分别将
Figure 996085DEST_PATH_IMAGE035
转化为18×K
Figure 703010DEST_PATH_IMAGE036
,结合保存的 18×K个隐层权重矩阵
Figure 97082DEST_PATH_IMAGE026
,通过计算各个
Figure 914865DEST_PATH_IMAGE036
×
Figure 710783DEST_PATH_IMAGE026
并利用集成决策原则,逐一得到对应的 未来三小时各时间段预测结果,并按照时间顺序拼接为
Figure 87144DEST_PATH_IMAGE037
优选的:步骤1中对于一个监测点,至少应包括30天的历史瓦斯浓度监测数据。
优选的:所述步骤2中得到规整的瓦斯浓度监测时间序列方法,包括以下步骤:
步骤21,读取历史瓦斯浓度监测数据,从第一个数据开始,提取10分钟内的所有数据,并做均值计算,生成规整监测瓦斯浓度数据x 1,以此类推,每10分钟进行一次计算,最终得到规整的瓦斯浓度监测时间序列数据x 1x 2,...,x M ,其中,M为规整监测数据的总数。
步骤22,若瓦斯浓度监测时间序列数据x 1x 2,...,x M 中存在缺失数据,假设x t,1缺失,则提取与x t,1监测日期不同而时间段相同的数据,并计算其均值μ与均方差σ,通过下式对x t,1进行填充:
Figure 702934DEST_PATH_IMAGE038
其中,
Figure 324408DEST_PATH_IMAGE039
表示瓦斯浓度第一个监测时间数据,η为[-1,1]之间的随机数,且保证
Figure 974832DEST_PATH_IMAGE040
Figure 23559DEST_PATH_IMAGE041
表示概率函数,
Figure 392224DEST_PATH_IMAGE042
表示
Figure 551810DEST_PATH_IMAGE043
时的概率。
优选的:所述步骤S3中得到样本集Φ的方法:针对规整的瓦斯浓度监测数据时间序列x 1x 2,...,x M ,首先从起始位置取连续24小时的瓦斯浓度数据作为特征X 1=[x 1x 2,...,x 144],其后3小时的瓦斯浓度数据作为对应的预测目标Y 1=[x 145x 146,...,x 162],生成第一个样本,然后通过单点移动的方式生成第二个样本,即X 2=[x 2x 3,...,x 145],Y 2=[x 146x 147,...,x 163],以此类推,不断生成样本,直至数据序列耗尽,得到样本集Φ
Figure 56740DEST_PATH_IMAGE044
其中,N表示生成的样本个数。
优选的:所述步骤S5采用Bootstrap方法对每一个拆分子集进行K次采样,每次采集原始N个样本的60%,得到多个不同的样本训练子集Φ i,k
优选的:范数norm取值的范围在(0,1)之间的数。
优选的:范数norm取2/3。
优选的:步骤63中隐层节点数L及惩罚因子C通过格搜索方法在整体数据集上确定,L∈{20,40,...,180,200},C∈{10-2,10-1,...,106}。
优选的:所述步骤S7中训练好的模型要求在使用时实时读取同一监测点最新24小时的瓦斯浓度监测数据。
本发明相比现有技术,具有以下有益效果:
1.本发明结合了集成学习与加权极限学习机,实现了对未来一段时间的瓦斯浓度趋势预测,实现简单,时间复杂度低,准确度高,泛化能力强。
附图说明
图1是本发明的流程图。
图2是本发明实施例的流程图。
图3是本发明方法上线运行的流程图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,如图1-3所示,包括以下步骤:
A、提取传感器采集的某煤矿监测点瓦斯浓度监测历史数据,按10分钟等间隔计算均值,得到规范化的瓦斯浓度监测数据,并分析监测数据是否存在缺失,如果存在缺失数据则进入步骤B。
B、提取同一时间段非缺失瓦斯浓度数据,计算得到均值与方差,并利用上述两个参数值对所有缺失值进行填充,得到规整的瓦斯浓度监测时间序列,然后进入步骤C。
C、从规范化数据时间序列头开始取连续24小时的瓦斯浓度数据作为特征X,其后3小时的瓦斯浓度数据作为预测目标Y,并按照单点顺序移动逐一生成训练样本,若在规泛化的瓦斯浓度监测数据时间序列中遇到断点,则新样本的提取在断点后重新开始,最终得到样本集Φ
Figure 777834DEST_PATH_IMAGE044
(1)
其中,N表示生成的样本个数。
D、将Ф拆分为18个子集Φ 1Φ 2,...,Φ 18,其中:
Figure 368215DEST_PATH_IMAGE002
(2)
其中,
Figure 331492DEST_PATH_IMAGE001
表示第
Figure 956509DEST_PATH_IMAGE003
个拆分子集,
Figure 487984DEST_PATH_IMAGE004
表示第
Figure 424716DEST_PATH_IMAGE003
个拆分子集关于第j个样本的预测输 出,i∈{1,2,...,t}为拆分子集号,i∈{1,2,...,t},j∈{1,2,...,N}。
E、采用Bootstrap对每一个拆分子集进行K次采样,每次采样原始N个样本的60%,得到多个不同的训练子集Φ i,k ,其中:i∈{1,2,...,18}为拆分子集号,k∈{1,2,...,K}为采样子集号,共生成18×K个样本子集。
F、对于每一个训练子集Φ i,k ,为其中每一个预测输出值Y i,k-m ,分配对应的权重,计算公式如下:
Figure 926105DEST_PATH_IMAGE045
(3)
其中,
Figure 405627DEST_PATH_IMAGE006
Y i,k-m 对应的权重。
G、对于任一训练子集Φ i,k ,令
Figure 108004DEST_PATH_IMAGE007
表示其目标输出矩阵,其中S为样 本子集中样本的数量。
H、设定极限学习机中的隐层节点个数L与惩罚因子C,随机生成输入层到隐层之间 的权重与偏置序列a=[a 1a 2,...,
Figure 24708DEST_PATH_IMAGE008
,...,a L ]和b=[b 1b 2,...,
Figure 329787DEST_PATH_IMAGE009
,...,b L ],其中,
Figure 929396DEST_PATH_IMAGE008
∈ [-1,1],
Figure 661729DEST_PATH_IMAGE009
∈[-1,1],利用Sigmoid激活函数将任一训练子集Φ i,k 转化为隐层输出矩阵:
Figure 448419DEST_PATH_IMAGE046
(4)
其中,
Figure 557189DEST_PATH_IMAGE047
表示 隐层输出矩阵,
Figure 11305DEST_PATH_IMAGE012
表示第
Figure 416003DEST_PATH_IMAGE013
个样本在隐层矩阵的变换,
Figure 689990DEST_PATH_IMAGE013
∈[1,S],G为Sigmoid激活函 数,其计算方式如下:
Figure 336872DEST_PATH_IMAGE014
(5)
其中,
Figure 645493DEST_PATH_IMAGE015
表示Sigmoid激活函数。
利用步骤F提取的权重向量生成对应的加权矩阵
Figure 719629DEST_PATH_IMAGE017
Figure 746491DEST_PATH_IMAGE048
(6)
进一步,求解下式:
Figure 931484DEST_PATH_IMAGE049
(7)
其中,
Figure 360192DEST_PATH_IMAGE022
表示含参数L和C的损失函数,
Figure 103763DEST_PATH_IMAGE023
表示正则化参数,
Figure 352342DEST_PATH_IMAGE024
表示第s 个样本的训练误差,
Figure 341027DEST_PATH_IMAGE025
表示第s个样本误差,
Figure 624240DEST_PATH_IMAGE026
表示连接隐层与输出层间的权重矩阵。
根据Karush–Kuhn–Tucker(KKT)理论,
Figure 40178DEST_PATH_IMAGE026
可求解如下:
Figure 776053DEST_PATH_IMAGE027
(8)
其中,H表示隐层输出矩阵简写,
Figure 568429DEST_PATH_IMAGE028
表示矩阵H的转置,
Figure 706149DEST_PATH_IMAGE029
表示权矩阵,
Figure 794453DEST_PATH_IMAGE030
表示 目标输出矩阵,
Figure 17624DEST_PATH_IMAGE031
表示隐层节点个数,通过上述过程,可逐一训练各子模型。
I、对于任一样本集Ф i 中的每一个样本,分别将其置于K个对应的已训练好的模型 中,得到对应的预测值
Figure 613690DEST_PATH_IMAGE032
i∈{1,2,...,t},j∈{1,2,...,N}, 进一步通过均值计算得到集成预测值
Figure 605917DEST_PATH_IMAGE033
Figure 363657DEST_PATH_IMAGE034
(9)
J、实时获取过去24小时的瓦斯浓度监测数据,做规范化处理后,记为
Figure 808545DEST_PATH_IMAGE035
,通过保 存的18×K个模型中的输入层权重和偏置ab,分别将
Figure 208302DEST_PATH_IMAGE035
转化为18×K
Figure 55036DEST_PATH_IMAGE036
,结合保存 的18×K个隐层权重矩阵
Figure 488072DEST_PATH_IMAGE026
,通过计算各个
Figure 420256DEST_PATH_IMAGE036
×
Figure 623704DEST_PATH_IMAGE026
并利用集成决策(公式(9))原则,逐一 得到对应的未来三小时各时间段预测结果,并按照时间顺序拼接为
Figure 324944DEST_PATH_IMAGE037
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,其特征在于,包括以下步骤:
步骤1,针对矿井下某个监测点,获取其历史瓦斯浓度监测数据;
步骤2,数据预处理与缺失数据填充:对于一个监测点每间隔10分钟计算一次瓦斯浓度均值,得到规整的瓦斯浓度监测数据,提取同一时间段非缺失瓦斯浓度数据,计算得到均值与方差,并利用计算得到的均值与方差对所有缺失值进行填充,得到规整的瓦斯浓度监测时间序列数据;
步骤3,样本集生成:从规整的瓦斯浓度监测时间序列数据中取连续24小时的瓦斯浓度 监测数据作为特征X,其后3小时的瓦斯浓度监测数据作为预测目标Y,并按照单点顺序移动 的方式逐一生成训练样本,若在规整的瓦斯浓度监测时间序列数据中遇到断点,则新样本 的提取在断点后重新开始,最终得到样本集
Figure 970600DEST_PATH_IMAGE001
Figure 301087DEST_PATH_IMAGE002
其中,N表示生成的样本个数;
步骤4,样本集拆分:对样本集Φ中预测目标Y进行拆分,使预测目标Y中的每一列数据 均与X结合,构成t个拆分子集,分别记为Φ 1Φ 2,...,
Figure 293314DEST_PATH_IMAGE003
,...,Φ t
Figure 316634DEST_PATH_IMAGE004
其中,
Figure 27101DEST_PATH_IMAGE003
表示第
Figure 665673DEST_PATH_IMAGE005
个拆分子集,
Figure 777986DEST_PATH_IMAGE006
表示第
Figure 706627DEST_PATH_IMAGE005
个拆分子集关于第j个样本的预测输出,i ∈{1,2,...,t}为拆分子集号,j∈{1,2,...,N};
步骤5,训练子集生成:利用Bootstrap方法在每个拆分子集
Figure 904391DEST_PATH_IMAGE003
上分别生成K个训练子 集Φ i,k i∈{1,2,...,t}为拆分子集号,k∈{1,2,...,K}为采样子集号,共生成t*K个样本 子集;
步骤6,模型训练:在每个训练子集上以预测目标值越大,赋予的权重越小为原则训练加权极限学习机模型,进一步提取每个拆分子集上K个模型的预测结果,采用计算K个模型预测结果均值的方式得出最终的集成预测结果,按照时间顺序排列拆分子集顺序,形成对未来3小时的瓦斯浓度预测结果,具体包括:
步骤61,对于每一个训练子集Φ i,k ,为其中每一个预测输出值Y i,k-m ,分配对应的权重:
Figure 576680DEST_PATH_IMAGE007
其中,
Figure 543499DEST_PATH_IMAGE008
表示预测输出值Y i,k-m 对应的权重,m∈{1,2,...,k},norm表示范数,范数norm取1/2;
步骤62,对于任一训练子集Φ i,k ,令
Figure 908622DEST_PATH_IMAGE009
表示其目标输出矩阵,其中,S为训 练子集中样本的数量;
步骤63,设定加权极限学习机模型中的隐层节点个数L与惩罚因子C,随机生成输入层 到隐层之间的权重与偏置序列,a=[a 1a 2,...,
Figure 328102DEST_PATH_IMAGE010
,...,a L ]和
Figure 305547DEST_PATH_IMAGE011
,其中,
Figure 126873DEST_PATH_IMAGE010
∈[-1,1],
Figure 662896DEST_PATH_IMAGE012
∈[-1,1],利用Sigmoid激活函 数将任一训练子集Φ i,k 转化为隐层输出矩阵:
Figure DEST_PATH_IMAGE013
Figure 163148DEST_PATH_IMAGE014
其中,
Figure 52606DEST_PATH_IMAGE015
表示隐层输 出矩阵,
Figure 853072DEST_PATH_IMAGE016
表示第
Figure 435363DEST_PATH_IMAGE017
个样本在隐层输出矩阵的变换,
Figure 452604DEST_PATH_IMAGE017
∈[1,S],G为Sigmoid激活函 数,其计算方式如下:
Figure 145754DEST_PATH_IMAGE018
其中,
Figure 800726DEST_PATH_IMAGE019
表示Sigmoid激活函数;
最优参数LC取值组合采用加权的均方误差最小化原则确定,加权的均方误差如下:
Figure 553918DEST_PATH_IMAGE020
其中,WRMSE表示加权的均方误差,
Figure 559921DEST_PATH_IMAGE021
表示预测输出值
Figure 56761DEST_PATH_IMAGE022
对应的权重,
Figure 831819DEST_PATH_IMAGE023
表示集 成预测值,
Figure 490333DEST_PATH_IMAGE022
表示预测输出值;
利用步骤S61提取的预测输出值
Figure 485097DEST_PATH_IMAGE022
对应的权重
Figure 520049DEST_PATH_IMAGE021
生成对应的加权矩阵
Figure 415192DEST_PATH_IMAGE024
Figure 244608DEST_PATH_IMAGE025
求解下式:
Figure 225202DEST_PATH_IMAGE026
其中,
Figure 63845DEST_PATH_IMAGE027
表示含参数L和C的损失函数,
Figure 547916DEST_PATH_IMAGE028
表示正则化参数,
Figure 813813DEST_PATH_IMAGE029
表示第s个样 本的训练误差,
Figure 532237DEST_PATH_IMAGE030
表示第s个样本误差,
Figure 174571DEST_PATH_IMAGE031
表示连接隐层与输出层间的权重矩阵;
Figure 778728DEST_PATH_IMAGE031
求解如下:
Figure 215525DEST_PATH_IMAGE032
其中,H表示隐层输出矩阵简写,
Figure 905133DEST_PATH_IMAGE033
表示矩阵H的转置,
Figure 351157DEST_PATH_IMAGE034
表示权矩阵,
Figure 809821DEST_PATH_IMAGE035
表示目标输 出矩阵,
Figure 417519DEST_PATH_IMAGE036
表示隐层节点个数,逐一训练各拆分子集模型;
步骤64,对于任一拆分子集Ф i 中的每一个样本,分别将其置于K个对应的已训练好的模 型中,得到对应的预测值
Figure 95888DEST_PATH_IMAGE037
i∈{1,2,...,t},j∈{1,2,...,N},通过均方根值计算得到集成预测值
Figure 814445DEST_PATH_IMAGE038
Figure 127615DEST_PATH_IMAGE039
步骤7,数据预测:实时接收最新的瓦斯浓度数据,导入到训练好的模型中,形成对未来3小时的瓦斯浓度趋势预测。
2.根据权利要求1所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,其特征在于:步骤1中对于一个监测点,至少应包括30天的历史瓦斯浓度监测数据。
3.根据权利要求2所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,其特征在于:所述步骤2中得到规整的瓦斯浓度监测时间序列方法,包括以下步骤:
步骤21,读取历史瓦斯浓度监测数据,从第一个数据开始,提取10分钟内的所有数据,并做均值计算,生成规整瓦斯浓度监测数据x 1,以此类推,每10分钟进行一次计算,最终得到规整的瓦斯浓度监测时间序列数据x 1x 2,...,x M ,其中,M为规整监测数据的总数;
步骤22,若瓦斯浓度监测时间序列数据x 1x 2,...,x M 中存在缺失数据,假设x t,1缺失,则提取与x t,1监测日期不同而时间段相同的数据,并计算其均值μ与均方差σ,通过下式对x t,1进行填充:
Figure 171794DEST_PATH_IMAGE040
其中,
Figure 835994DEST_PATH_IMAGE041
表示瓦斯浓度监测时间序列数据存在的缺失数据,η为[-1,1]之间的随机数, 且保证
Figure 358242DEST_PATH_IMAGE042
Figure 791497DEST_PATH_IMAGE043
表示概率函数,
Figure 740999DEST_PATH_IMAGE044
表示
Figure 125450DEST_PATH_IMAGE045
时的概 率。
4.根据权利要求3所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,其特征在于:所述步骤3中得到样本集Φ的方法:针对规整的瓦斯浓度监测时间序列数据x 1x 2,...,x M ,首先从起始位置取连续24小时的瓦斯浓度监测数据作为特征X 1=[x 1x 2,...,x 144],其后3小时的瓦斯浓度监测数据作为对应的预测目标Y 1=[x 145x 146,...,x 162],生成第一个样本,然后通过单点移动的方式生成第二个样本,即X 2=[x 2x 3,...,x 145],Y 2=[x 146x 147,...,x 163],以此类推,不断生成样本,直至时间序列数据耗尽,得到样本集Φ
Figure 451389DEST_PATH_IMAGE002
其中,N表示生成的样本个数。
5.根据权利要求4所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,其特征在于:所述步骤5采用Bootstrap方法对每一个拆分子集进行K次采样,每次采集原始N个样本的60%,得到多个不同的样本训练子集Φ i,k
6.根据权利要求5所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,其特征在于:步骤63中隐层节点个数L及惩罚因子C取值范围如下,L∈{20,40,...,180,200},C∈{10-2,10-1,...,106}。
7.根据权利要求6所述结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法,其特征在于:所述步骤7中训练好的模型要求在使用时实时读取同一监测点最新24小时的瓦斯浓度监测数据。
CN202011327457.5A 2020-11-24 2020-11-24 结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法 Active CN112712192B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011327457.5A CN112712192B (zh) 2020-11-24 2020-11-24 结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011327457.5A CN112712192B (zh) 2020-11-24 2020-11-24 结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法

Publications (2)

Publication Number Publication Date
CN112712192A CN112712192A (zh) 2021-04-27
CN112712192B true CN112712192B (zh) 2021-09-03

Family

ID=75542392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011327457.5A Active CN112712192B (zh) 2020-11-24 2020-11-24 结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法

Country Status (1)

Country Link
CN (1) CN112712192B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123476A (zh) * 2014-08-12 2014-10-29 大连海事大学 基于极限学习机的气体浓度预测方法及其装置
CN104537444A (zh) * 2015-01-13 2015-04-22 安徽理工大学 一种基于emd和elm的瓦斯突出预测方法
CN107122861A (zh) * 2017-04-28 2017-09-01 辽宁工程技术大学 一种基于pca‑pso‑elm的瓦斯涌出量预测方法
CN108052793A (zh) * 2017-12-26 2018-05-18 杭州电子科技大学 一种基于模糊加权elm的移动污染源排放浓度预测方法
KR101869266B1 (ko) * 2017-05-08 2018-06-21 경북대학교 산학협력단 극한 심층학습 기반 차선 검출 시스템 및 그 방법
CN109615082A (zh) * 2018-11-26 2019-04-12 北京工业大学 一种基于堆叠选择性集成学习器的空气中细颗粒物pm2.5浓度的预测方法
CN111102005A (zh) * 2019-09-16 2020-05-05 中煤科工集团重庆研究院有限公司 矿井环境瓦斯浓度在线预测方法
CN111126658A (zh) * 2019-11-15 2020-05-08 太原理工大学 一种基于深度学习的煤矿瓦斯预测方法
CN111178616A (zh) * 2019-12-24 2020-05-19 淮阴工学院 基于负相关学习和正则化极限学习机集成的风速预测方法
CN111210085A (zh) * 2020-01-15 2020-05-29 重庆邮电大学 一种基于多视图集成学习的煤矿瓦斯浓度预警方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104123476A (zh) * 2014-08-12 2014-10-29 大连海事大学 基于极限学习机的气体浓度预测方法及其装置
CN104537444A (zh) * 2015-01-13 2015-04-22 安徽理工大学 一种基于emd和elm的瓦斯突出预测方法
CN107122861A (zh) * 2017-04-28 2017-09-01 辽宁工程技术大学 一种基于pca‑pso‑elm的瓦斯涌出量预测方法
KR101869266B1 (ko) * 2017-05-08 2018-06-21 경북대학교 산학협력단 극한 심층학습 기반 차선 검출 시스템 및 그 방법
CN108052793A (zh) * 2017-12-26 2018-05-18 杭州电子科技大学 一种基于模糊加权elm的移动污染源排放浓度预测方法
CN109615082A (zh) * 2018-11-26 2019-04-12 北京工业大学 一种基于堆叠选择性集成学习器的空气中细颗粒物pm2.5浓度的预测方法
CN111102005A (zh) * 2019-09-16 2020-05-05 中煤科工集团重庆研究院有限公司 矿井环境瓦斯浓度在线预测方法
CN111126658A (zh) * 2019-11-15 2020-05-08 太原理工大学 一种基于深度学习的煤矿瓦斯预测方法
CN111178616A (zh) * 2019-12-24 2020-05-19 淮阴工学院 基于负相关学习和正则化极限学习机集成的风速预测方法
CN111210085A (zh) * 2020-01-15 2020-05-29 重庆邮电大学 一种基于多视图集成学习的煤矿瓦斯浓度预警方法

Also Published As

Publication number Publication date
CN112712192A (zh) 2021-04-27

Similar Documents

Publication Publication Date Title
CN112784965B (zh) 面向云环境下大规模多元时间序列数据异常检测方法
CN108898251B (zh) 考虑气象相似性和功率波动的海上风电场功率预测方法
CN108596327B (zh) 一种基于深度学习的地震速度谱人工智能拾取方法
CN107194524B (zh) 一种基于rbf神经网络的煤与瓦斯突出预测方法
CN112633317A (zh) 基于注意力机制的cnn-lstm风机故障预测方法及系统
CN111160620A (zh) 一种基于端到端记忆网络的短期风电功率预测方法
CN111461463A (zh) 一种基于tcn-bp的短期负荷预测方法、系统及设备
CN111597175B (zh) 融合时空信息的传感器缺失值的填充方法
CN111242351A (zh) 基于自编码器和gru神经网络的热带气旋轨迹预测方法
Suryo et al. Improved time series prediction using LSTM neural network for smart agriculture application
CN116316599A (zh) 一种智能用电负荷预测方法
CN114580545A (zh) 一种基于融合模型的风电机组齿轮箱故障预警方法
CN115983465A (zh) 一种基于小样本学习的冲击地压时序预测模型构建方法
CN117290800A (zh) 一种基于超图注意力网络的时序异常检测方法及系统
CN113627070A (zh) 一种短期光伏功率预测方法
CN111191823B (zh) 一种基于深度学习的生产物流预测方法
Xing-yu et al. RNN-based method for fault diagnosis of grinding system
CN111881299A (zh) 基于复制神经网络的离群事件检测与识别方法
CN115905848A (zh) 基于多模型融合的化工过程故障诊断方法及系统
CN112712192B (zh) 结合集成学习与加权极限学习机的煤矿瓦斯浓度预测方法
CN115660221B (zh) 基于混合神经网络的油气藏经济可采储量评估方法及系统
CN114330500B (zh) 基于storm平台的电网电力设备在线并行诊断方法及系统
CN116720057A (zh) 基于特征筛选与权值分配的江河水质预测方法及系统
CN116842358A (zh) 一种基于多尺度卷积和自适应特征融合的软测量建模方法
CN115883424A (zh) 一种高速骨干网间流量数据预测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant