CN116163754A - 基于功率分布分层抽样的掘进参数样本前处理方法 - Google Patents
基于功率分布分层抽样的掘进参数样本前处理方法 Download PDFInfo
- Publication number
- CN116163754A CN116163754A CN202211571457.9A CN202211571457A CN116163754A CN 116163754 A CN116163754 A CN 116163754A CN 202211571457 A CN202211571457 A CN 202211571457A CN 116163754 A CN116163754 A CN 116163754A
- Authority
- CN
- China
- Prior art keywords
- tunneling
- efficiency
- equal
- power
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005641 tunneling Effects 0.000 title claims abstract description 226
- 238000005070 sampling Methods 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000007781 pre-processing Methods 0.000 title claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims abstract description 46
- 238000012216 screening Methods 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000000638 solvent extraction Methods 0.000 claims abstract description 5
- 238000005192 partition Methods 0.000 claims description 64
- 238000010248 power generation Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000005259 measurement Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000002203 pretreatment Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 238000003672 processing method Methods 0.000 abstract description 2
- 238000006467 substitution reaction Methods 0.000 abstract description 2
- 238000005315 distribution function Methods 0.000 abstract 1
- 238000005516 engineering process Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 235000019738 Limestone Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000006028 limestone Substances 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Classifications
-
- E—FIXED CONSTRUCTIONS
- E21—EARTH OR ROCK DRILLING; MINING
- E21D—SHAFTS; TUNNELS; GALLERIES; LARGE UNDERGROUND CHAMBERS
- E21D9/00—Tunnels or galleries, with or without linings; Methods or apparatus for making thereof; Layout of tunnels or galleries
- E21D9/06—Making by using a driving shield, i.e. advanced by pushing means bearing against the already placed lining
- E21D9/093—Control of the driving shield, e.g. of the hydraulic advancing cylinders
Landscapes
- Engineering & Computer Science (AREA)
- Mining & Mineral Resources (AREA)
- Environmental & Geological Engineering (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Geochemistry & Mineralogy (AREA)
- Geology (AREA)
- Complex Calculations (AREA)
Abstract
本发明基于功率分布分层抽样的掘进参数样本前处理方法属于盾构数据处理方法领域及高端装备制造领域;本方法主要对原始数据进行盾构掘进参数分布特征多重分层抽样及统计量替代。为了提高盾构掘进参数预测模型训练集输入层对原始采集参数物理意义及统计规律的代表性,以数据分类、分布函数求解、多重分层抽样及方差缩减为主要技术手段,以功率值域分区、计算掘进效率期望、功率分层抽样筛选、生成高效参数矩阵、生成混合样本集为实施步骤,可缩减训练集数据量和样本方差,提高训练效率和掘进参数预测模型的可解释性。
Description
技术领域
本技术涉及盾构掘进参数智能预测技术,属于盾构数据处理方法领域及高端装备制造领域。
背景技术
掘进参数预测技术,是盾构智能控制的关键。掘进参数预测模型是掘进参数预测技术的核心,而根据短时间间隔内采集得到的大量原始掘进参数所构成的输入层训练得到掘进参数预测模型,往往存在训练耗时长、过拟合严重、预测结果波动大的缺点。原始数据采集自真实过程,原始数据的波动程度大、缺乏统计意义,是导致直接训练缺陷的原因之一,可采用统计修正的方法对数据进行前处理。
(陶冶.基于SVM的盾构刀盘能耗预测分析[D].华中科技大学,2017.)研究了以盾构掘进参数为输入、以刀盘耗能作为输出的多参数预测模型,分析了主要掘进参数与掘进能耗之间的关系。
(成志飞,王立辉,苏翠侠,周思阳,张茜.TBM装备掘进载荷的力学分析与功率建模[J].机械科学与技术,2017,36(12):1810-1815.)根据掘进过程中的力学特征推导了刀盘驱动功率方程,建立了掘进功率估计模型。
(侯少康,刘耀儒,张凯.基于IPSO-BP混合模型的TBM掘进参数预测[J].岩石力学与工程学报,2020,39(08):1648-1657.)将TBM上升段数据预测稳定段的掘进参数用于生成掘进参数预测模型训练样本。
(孙亭帅.基于数据挖掘的土压平衡盾构掘进参数研究[D].鲁东大学,2021.)剔除盾构机非工作时间产生的无用数据,并采用非参数统计方法对采集的原始掘进参数进行了前处理。
一种智能化的盾构TBM数据采集与补全方法(申请公布号:CN109460401A,公开公告日:2019-03-12)采用自适应阈值判定方法清洗并保存采集到的掘进参数。
文献研究表明,现有的掘进参数前处理方法未涉及功率值域分区、基于掘进效率分布的功率分层抽样筛选等技术。
发明内容
针对上述现有技术的不足,本发明提出基于功率分布分层抽样的掘进参数样本前处理方法,能够减少样本波动、增强样本的对原始采集参数物理意义及统计规律的代表性,有利于提高掘进参数预测模型的训练效率和可解释性。包括如下步骤:
步骤一、功率值域分区;
步骤二、计算掘进效率期望;
步骤三、功率分层抽样筛选;
步骤四、生成高效参数矩阵;
步骤五、生成混合样本集。
进一步地,步骤一具体包括:以同一时刻从盾构机可编程逻辑控制器或上位工控机内读取得到的所有类型掘进参数数值作为一行,所有行共同构成初始表,初始表总行数为M。
初始表每行均有一个P值。
将功率值域均匀划分为N个功率值域等分区间,每一功率值域等分区间均有区间中点值。
定义各功率值域等分区间内所包含的行数在M中所占比例,为各功率值域等分区间的功率发生频率。
定义功率发生频率拟合为:对于同一个N值所对应的所有功率值域等分区间,以高斯分布公式去拟合自变量为各功率值域等分区间中点值、应变量为相应各功率值域等分区间的功率发生频率的过程。
对每个N值均进行功率发生频率拟合,取各N值相应功率发生频率拟合的拟合精度中最高的N值,作为功率分区数B1,0<B1<M。
拟合精度取与功率发生频率拟合相应的决定系数。
进一步地,步骤一还包括:单个功率值域等分区间中点值在功率发生频率分布中的相应发生频率为该功率值域等分区间的代表频率。
从B1个功率值域等分区间中,独立随机不重复抽取得到C1个功率值域等分区间,以在该C1个功率值域等分区间的C1个代表频率中最低的代表频率为抽样最小代表频率,记抽样最小代表频率的功率值域等分区间为抽样最小代表频率功率值域等分区间,0<C1<B1。
该C1个功率值域等分区间的功率发生频率均大于零。
该C1个功率值域等分区间应包含至少一个在闭区间[E(P)-H×σ(P),E(P)+H×σ(P)]外的功率值域等分区间,H为标准差倍数,0<H≤3。E(P)、σ(P)分别为功率发生频率分布的期望和标准差。
对该C1个功率值域等分区间中的每一个功率值域等分区间均作单功率值域等分区间X1组方差缩减处理,Q1为该功率值域等分区间的代表频率与抽样最小代表频率的比值,X1为不大于Q1的最大正整数。
将该C1个功率值域等分区间的所有多遇掘进参数非协调均值集组成多遇参数矩阵,多遇参数矩阵的列为各类掘进参数的种类,多遇参数矩阵中每行是一个多遇掘进参数非协调均值集。
对多遇参数矩阵的行进行抽样,得到的样本集为多遇样本集。
进一步地,步骤二具体包括:
计算初始表中每行的掘进效率v/T,将v/T的值域均匀划分为D个掘进效率等分区间,每一掘进效率等分区间均有区间中点值。
v/T值域的上限为根据实测掘进参数算得的v/T最大值,v/T值域的下限为根据实测掘进参数算得的v/T最小值。
定义单个掘进效率等分区间内所包含的行数在M中所占比例,为该掘进效率等分区间对应的掘进效率发生频率。
定义掘进效率发生频率拟合为:对于同一个D值所对应的所有掘进效率等分区间,以高斯分布公式去拟合自变量为各掘进效率等分区间中点值、应变量为相应各掘进效率等分区间的掘进效率发生频率的过程。
对每个D值均进行掘进效率发生频率拟合,取各D值相应掘进效率发生频率拟合的拟合精度最高的D值,作为掘进效率分区数B2。
拟合精度可取与掘进效率发生频率拟合相应的决定系数。
取B2对应的掘进效率发生频率拟合计算得到的高斯分布方程作为掘进效率发生频率分布,取掘进效率发生频率分布的期望作为掘进效率期望。
进一步地,步骤三具体包括:对B1所对应的各功率值域等分区间分别进行效率变异计算。
定义效率变异计算为:对初始表中的一个功率值域等分区间所对应的各行数据,将各行的掘进效率作为元素构成该功率值域等分区间对应的功率值域等分区间掘进效率集,计算该功率值域等分区间掘进效率集的变异系数。
将B1所对应的各功率值域等分区间的变异系数作为元素构成总体掘进效率变异系数集,取总体掘进效率变异系数集中所有元素的算术平均值作为总体掘进效率变异水平。
对功率值域等分区间掘进效率集中的变异系数小于总体效率变异水平的A1个功率值域等分区间,分别进行掘进效率筛选,0<A1≤B1。
定义掘进效率筛选为:对初始表中的一个功率值域等分区间所对应的各行数据,分别计算各行的掘进效率,保留掘进效率大于掘进效率期望的各行数据。
定义由单个功率值域等分区间经过掘进效率筛选后保留的元素所构成的非空集合,为该功率值域等分区间对应的功率值域等分区间高效集。
经掘进效率筛选,得到A2个功率值域等分区间高效集,0<A2≤A1。
进一步地,步骤四具体包括:定义单个功率值域等分区间高效集内所包含的行数在M中所占比例,为该功率值域等分区间对应的功率值域等分区间高效频率。
对A2个功率值域等分区间高效集独立随机不重复抽样,得到C2个功率值域等分区间高效集,该C2个功率值域等分区间高效频率中最低的功率值域等分区间高效频率为抽样最小高效代表频率,记抽样最小高效代表频率的功率值域等分区间高效集为抽样最小高效代表频率功率值域等分区间高效集,0<C2≤A2。
对该C2个功率值域等分区间高效集中的每一个功率值域等分区间高效集均作单功率值域等分区间高效集X2组方差缩减处理,Q2为该功率值域等分区间高效集的功率值域等分区间高效频率与抽样最小高效代表频率的比值,X2为不大于Q2的最大正整数。
将C2个功率值域等分区间高效集的所有高效掘进参数非协调均值集组成高效参数矩阵,高效参数矩阵的列为各类掘进参数的种类,高效参数矩阵中每行是一个高效掘进参数非协调均值集。
对高效参数矩阵的行进行抽样,得到的样本集为高效样本集。
进一步地,步骤五具体包括:
将多遇参数矩阵和高效参数矩阵进行合并得到混合参数矩阵,混合参数矩阵的列为各类掘进参数的种类,混合参数矩阵中的一行是一个高效掘进参数非协调均值集或一个多遇掘进参数非协调均值集。
对混合参数矩阵的行进行抽样,得到的样本集为混合样本集。
将混合样本集作为输入层,用于训练掘进参数预测模型。
混合样本集的高掘进效率样本平均含量,高于多遇样本集的高掘进效率样本平均含量,以混合样本集作为输入层得到的掘进参数预测模型,其预测结果的v/T期望高于以多遇样本集作为输入层得到的掘进参数预测模型,所以混合样本集相较于多遇样本集在预测结果高效程度上更优。
混合样本集的非高掘进效率样本平均含量大于零,而高效样本集内无非高掘进效率样本,以混合样本集作为输入层,相较于以高效样本集作为输入层,在相同拟合算法条件下更容易得到精度满足需求的掘进参数预测模型,故混合样本集相较于高效样本集更能代表实际掘进过程中的数据分布。
有益效果
(1)本发明方法主要对原始数据进行盾构掘进参数分布特征多重分层抽样及统计量替代,能够减少样本波动、增强样本的对原始采集参数物理意义及统计规律的代表性,有利于提高掘进参数预测模型的训练效率和可解释性。
(2)混合样本集相较于多遇样本集在预测结果高效程度上更优,混合样本集相较于高效样本集更能代表实际掘进过程中的数据分布,混合样本集在预测结果高效程度和对原始实测数据分布代表性两方面能够同时达到较好水平。
具体实施方式
步骤一功率值域分区
将直接从盾构机可编程逻辑控制器或上位工控机内读取得到的各类掘进参数,作为初始变量,如刀盘转速、刀盘扭矩、掘进速率、土仓压力、千斤顶总推力、铰接力、姿态参数。
以同一时刻记录的所有类型掘进参数数值作为一行,所有行共同构成初始表,初始表总行数为M。
按式(1)计算每一行的功率,其中P为功率,T为刀盘扭矩,n为刀盘转速,F为千斤顶总推力,v为掘进速率,T、n、F、v的单位依次为百万牛顿·米、每分钟转数、千牛顿、毫米每分钟,式(1)中的各物理量以单位前数值进行运算。
P=T×n×100π/3+F×v/60000(1)
初始表每行均有一个P值。
功率值域的上限为根据实测掘进参数算得的最大功率,功率值域的下限为根据实测掘进参数算得的最小功率。
将功率值域均匀划分为N个功率值域等分区间,每一功率值域等分区间均有区间中点值。
定义各功率值域等分区间内所包含的行数在M中所占比例,为各功率值域等分区间的功率发生频率。
定义功率发生频率拟合为:对于同一个N值所对应的所有功率值域等分区间,以高斯分布公式去拟合自变量为各功率值域等分区间中点值、应变量为相应各功率值域等分区间的功率发生频率的过程。
对每个N值均进行功率发生频率拟合,取各N值相应功率发生频率拟合的拟合精度中最高的N值,作为功率分区数B1,0<B1<M。
拟合精度可取与功率发生频率拟合相应的决定系数。
取B1对应的功率发生频率拟合计算得到的高斯分布方程作为功率发生频率分布。
E(P)、σ(P)分别为功率发生频率分布的期望和标准差。
单个功率值域等分区间中点值在功率发生频率分布中的相应发生频率为该功率值域等分区间的代表频率。
从B1个功率值域等分区间中,独立随机不重复抽取得到C1个功率值域等分区间,以在该C1个功率值域等分区间的C1个代表频率中最低的代表频率为抽样最小代表频率,记抽样最小代表频率的功率值域等分区间为抽样最小代表频率功率值域等分区间,0<C1<B1。
该C1个功率值域等分区间的功率发生频率均大于零。
该C1个功率值域等分区间应包含至少一个在闭区间[E(P)-H×σ(P),E(P)+H×σ(P)]外的功率值域等分区间,H为标准差倍数,0<H≤3。
对该C1个功率值域等分区间中的每一个功率值域等分区间均作单功率值域等分区间X1组方差缩减处理,Q1为该功率值域等分区间的代表频率与抽样最小代表频率的比值,X1为不大于Q1的最大正整数,
定义单功率值域等分区间X1组方差缩减为:将同一功率值域等分区间中的所有行实测数据随机划分为X1组,每组包含至少1行,任意两组中无相同的行,每行均有其所归属的组,对每一组中各类掘进参数分别计算得到该组的各类掘进参数算术平均值,将该组的各类掘进参数算术平均值作为元素构成该功率值域等分区间中该组的多遇掘进参数非协调均值集。
将该C1个功率值域等分区间的所有多遇掘进参数非协调均值集组成多遇参数矩阵,多遇参数矩阵的列为各类掘进参数的种类,多遇参数矩阵中每行是一个多遇掘进参数非协调均值集。
对多遇参数矩阵的行进行抽样,得到的样本集为多遇样本集。
步骤二计算掘进效率期望
计算初始表中每行的掘进效率v/T,将v/T的值域均匀划分为D个掘进效率等分区间,每一掘进效率等分区间均有区间中点值。
v/T值域的上限为根据实测掘进参数算得的v/T最大值,v/T值域的下限为根据实测掘进参数算得的v/T最小值。
定义单个掘进效率等分区间内所包含的行数在M中所占比例,为该掘进效率等分区间对应的掘进效率发生频率。
定义掘进效率发生频率拟合为:对于同一个D值所对应的所有掘进效率等分区间,以高斯分布公式去拟合自变量为各掘进效率等分区间中点值、应变量为相应各掘进效率等分区间的掘进效率发生频率的过程。
对每个D值均进行掘进效率发生频率拟合,取各D值相应掘进效率发生频率拟合的拟合精度最高的D值,作为掘进效率分区数B2。
拟合精度可取与掘进效率发生频率拟合相应的决定系数。
取B2对应的掘进效率发生频率拟合计算得到的高斯分布方程作为掘进效率发生频率分布,取掘进效率发生频率分布的期望作为掘进效率期望。
步骤三功率分层抽样筛选
对B1所对应的各功率值域等分区间分别进行效率变异计算。
定义效率变异计算为:对初始表中的一个功率值域等分区间所对应的各行数据,将各行的掘进效率作为元素构成该功率值域等分区间对应的功率值域等分区间掘进效率集,计算该功率值域等分区间掘进效率集的变异系数。
将B1所对应的各功率值域等分区间的变异系数作为元素构成总体掘进效率变异系数集,取总体掘进效率变异系数集中所有元素的算术平均值作为总体掘进效率变异水平。
对功率值域等分区间掘进效率集中的变异系数小于总体效率变异水平的A1个功率值域等分区间,分别进行掘进效率筛选,0<A1≤B1。
定义掘进效率筛选为:对初始表中的一个功率值域等分区间所对应的各行数据,分别计算各行的掘进效率,保留掘进效率大于掘进效率期望的各行数据。
定义由单个功率值域等分区间经过掘进效率筛选后保留的元素所构成的非空集合,为该功率值域等分区间对应的功率值域等分区间高效集。
经掘进效率筛选,得到A2个功率值域等分区间高效集,0<A2≤A1。
步骤四生成高效参数矩阵
定义单个功率值域等分区间高效集内所包含的行数在M中所占比例,为该功率值域等分区间对应的功率值域等分区间高效频率。
对A2个功率值域等分区间高效集独立随机不重复抽样,得到C2个功率值域等分区间高效集,该C2个功率值域等分区间高效频率中最低的功率值域等分区间高效频率为抽样最小高效代表频率,记抽样最小高效代表频率的功率值域等分区间高效集为抽样最小高效代表频率功率值域等分区间高效集,0<C2≤A2。
对该C2个功率值域等分区间高效集中的每一个功率值域等分区间高效集均作单功率值域等分区间高效集X2组方差缩减处理,Q2为该功率值域等分区间高效集的功率值域等分区间高效频率与抽样最小高效代表频率的比值,X2为不大于Q2的最大正整数,
定义单功率值域等分区间高效集X2组方差缩减为:将同一功率值域等分区间高效集中的所有行实测数据随机划分为X2组,每组包含至少1行,任意两组中无相同的行,每行均有其所归属的组,对每一组中各类掘进参数分别计算得到该组的各类掘进参数算术平均值,将该组的各类掘进参数算术平均值作为元素构成该功率值域等分区间高效集内该组的高效掘进参数非协调均值集。
将C2个功率值域等分区间高效集的所有高效掘进参数非协调均值集组成高效参数矩阵,高效参数矩阵的列为各类掘进参数的种类,高效参数矩阵中每行是一个高效掘进参数非协调均值集。
对高效参数矩阵的行进行抽样,得到的样本集为高效样本集。
步骤五生成混合样本集
将多遇参数矩阵和高效参数矩阵进行合并得到混合参数矩阵,混合参数矩阵的列为各类掘进参数的种类,混合参数矩阵中的一行是一个高效掘进参数非协调均值集或一个多遇掘进参数非协调均值集。
对混合参数矩阵的行进行抽样,得到的样本集为混合样本集。
将混合样本集作为输入层,用于训练掘进参数预测模型。
混合样本集的高掘进效率样本平均含量,高于多遇样本集的高掘进效率样本平均含量,以混合样本集作为输入层得到的掘进参数预测模型,其预测结果的v/T期望高于以多遇样本集作为输入层得到的掘进参数预测模型,所以混合样本集相较于多遇样本集在预测结果高效程度上更优。
混合样本集的非高掘进效率样本平均含量大于零,而高效样本集内无非高掘进效率样本,以混合样本集作为输入层,相较于以高效样本集作为输入层,在相同拟合算法条件下更容易得到精度满足需求的掘进参数预测模型,所以混合样本集相较于高效样本集更能代表实际掘进过程中的数据分布。
以盾构掘进某地石灰岩复合地层实例,对初始表按照本方法处理得到多类型样本集,分别根据多遇样本集、高效样本集、混合样本集训练得到各拟合模型,再分别用直接从盾构机可编程逻辑控制器或上位工控机内读取得到的不同于初始表的掘进参数测试集对各拟合模型进行测试,初始表内高效掘进参数样本行数在M中的占比约为43.8%,测试集内高效掘进参数样本行数在测试集总行数中的占比约为44.3%,按照本方法重复进行10次运算,各类样本集性能指标统计情况如表1所示,混合样本集在预测结果高效程度和对原始实测数据分布代表性两方面能够同时达到较好水平。
表1各类样本集比较统计表
Claims (10)
1.基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:包括以下五个步骤:
步骤一、功率值域分区;
步骤二、计算掘进效率期望;
步骤三、功率分层抽样筛选;
步骤四、生成高效参数矩阵;
步骤五、生成混合样本集。
2.根据权利要求1所述的基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:步骤一具体包括:
以同一时刻从盾构机可编程逻辑控制器或上位工控机内读取得到的所有类型掘进参数数值作为一行,所有行共同构成初始表,初始表总行数为M;
初始表每行均有一个P值;
将功率值域均匀划分为N个功率值域等分区间,每一功率值域等分区间均有区间中点值;
定义各功率值域等分区间内所包含的行数在M中所占比例,为各功率值域等分区间的功率发生频率;
定义功率发生频率拟合为:对于同一个N值所对应的所有功率值域等分区间,以高斯分布公式去拟合自变量为各功率值域等分区间中点值、应变量为相应各功率值域等分区间的功率发生频率的过程;
对每个N值均进行功率发生频率拟合,取各N值相应功率发生频率拟合的拟合精度中最高的N值,作为功率分区数B1,0<B1<M;
拟合精度取与功率发生频率拟合相应的决定系数。
3.根据权利要求1所述的基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:步骤一还包括:
单个功率值域等分区间中点值在功率发生频率分布中的相应发生频率为该功率值域等分区间的代表频率;
从B1个功率值域等分区间中,独立随机不重复抽取得到C1个功率值域等分区间,以在该C1个功率值域等分区间的C1个代表频率中最低的代表频率为抽样最小代表频率,记抽样最小代表频率的功率值域等分区间为抽样最小代表频率功率值域等分区间,0<C1<B1;
该C1个功率值域等分区间的功率发生频率均大于零;
该C1个功率值域等分区间应包含至少一个在闭区间[E(P)-H×σ(P), E(P)+H×σ(P)]外的功率值域等分区间,H为标准差倍数,0<H≤3;E(P)、σ(P)分别为功率发生频率分布的期望和标准差;
对该C1个功率值域等分区间中的每一个功率值域等分区间均作单功率值域等分区间X1组方差缩减处理,Q1为该功率值域等分区间的代表频率与抽样最小代表频率的比值,X1为不大于Q1的最大正整数。
4.根据权利要求3所述的基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:所述单功率值域等分区间X1组方差缩减处理,具体如下:
将同一功率值域等分区间中的所有行实测数据随机划分为X1组,每组包含至少1行,任意两组中无相同的行,每行均有其所归属的组,对每一组中各类掘进参数分别计算得到该组的各类掘进参数算术平均值,将该组的各类掘进参数算术平均值作为元素构成该功率值域等分区间中该组的多遇掘进参数非协调均值集;
将该C1个功率值域等分区间的所有多遇掘进参数非协调均值集组成多遇参数矩阵,多遇参数矩阵的列为各类掘进参数的种类,多遇参数矩阵中每行是一个多遇掘进参数非协调均值集;
对多遇参数矩阵的行进行抽样,得到的样本集为多遇样本集。
6.根据权利要求1所述的基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:步骤二具体包括:
计算初始表中每行的掘进效率v/T,将v/T的值域均匀划分为D个掘进效率等分区间,每一掘进效率等分区间均有区间中点值;
v/T值域的上限为根据实测掘进参数算得的v/T最大值,v/T值域的下限为根据实测掘进参数算得的v/T最小值;
定义单个掘进效率等分区间内所包含的行数在M中所占比例,为该掘进效率等分区间对应的掘进效率发生频率;
定义掘进效率发生频率拟合为:对于同一个D值所对应的所有掘进效率等分区间,以高斯分布公式去拟合自变量为各掘进效率等分区间中点值、应变量为相应各掘进效率等分区间的掘进效率发生频率的过程;
对每个D值均进行掘进效率发生频率拟合,取各D值相应掘进效率发生频率拟合的拟合精度最高的D值,作为掘进效率分区数B2;
拟合精度可取与掘进效率发生频率拟合相应的决定系数;
取B2对应的掘进效率发生频率拟合计算得到的高斯分布方程作为掘进效率发生频率分布,取掘进效率发生频率分布的期望作为掘进效率期望。
7.根据权利要求1所述的基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:步骤三具体包括:
对B1所对应的各功率值域等分区间分别进行效率变异计算;
定义效率变异计算为:对初始表中的一个功率值域等分区间所对应的各行数据,将各行的掘进效率作为元素构成该功率值域等分区间对应的功率值域等分区间掘进效率集,计算该功率值域等分区间掘进效率集的变异系数;
将B1所对应的各功率值域等分区间的变异系数作为元素构成总体掘进效率变异系数集,取总体掘进效率变异系数集中所有元素的算术平均值作为总体掘进效率变异水平;
对功率值域等分区间掘进效率集中的变异系数小于总体效率变异水平的A1个功率值域等分区间,分别进行掘进效率筛选,0<A1≤B1;
定义掘进效率筛选为:对初始表中的一个功率值域等分区间所对应的各行数据,分别计算各行的掘进效率,保留掘进效率大于掘进效率期望的各行数据;
定义由单个功率值域等分区间经过掘进效率筛选后保留的元素所构成的非空集合,为该功率值域等分区间对应的功率值域等分区间高效集;
经掘进效率筛选,得到A2个功率值域等分区间高效集,0<A2≤A1。
8.根据权利要求1所述的基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:步骤四具体包括:
定义单个功率值域等分区间高效集内所包含的行数在M中所占比例,为该功率值域等分区间对应的功率值域等分区间高效频率;
对A2个功率值域等分区间高效集独立随机不重复抽样,得到C2个功率值域等分区间高效集,该C2个功率值域等分区间高效频率中最低的功率值域等分区间高效频率为抽样最小高效代表频率,记抽样最小高效代表频率的功率值域等分区间高效集为抽样最小高效代表频率功率值域等分区间高效集,0<C2≤A2;
对该C2个功率值域等分区间高效集中的每一个功率值域等分区间高效集均作单功率值域等分区间高效集X2组方差缩减处理,Q2为该功率值域等分区间高效集的功率值域等分区间高效频率与抽样最小高效代表频率的比值,X2为不大于Q2的最大正整数。
9.根据权利要求8所述的基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:所述单功率值域等分区间高效集X2组方差缩减为:
将同一功率值域等分区间高效集中的所有行实测数据随机划分为X2组,每组包含至少1行,任意两组中无相同的行,每行均有其所归属的组,对每一组中各类掘进参数分别计算得到该组的各类掘进参数算术平均值,将该组的各类掘进参数算术平均值作为元素构成该功率值域等分区间高效集内该组的高效掘进参数非协调均值集;
将C2个功率值域等分区间高效集的所有高效掘进参数非协调均值集组成高效参数矩阵,高效参数矩阵的列为各类掘进参数的种类,高效参数矩阵中每行是一个高效掘进参数非协调均值集;
对高效参数矩阵的行进行抽样,得到的样本集为高效样本集。
10.据权利要求1所述的基于功率分布分层抽样的掘进参数样本前处理方法,其特征在于:步骤五具体包括:
将多遇参数矩阵和高效参数矩阵进行合并得到混合参数矩阵,混合参数矩阵的列为各类掘进参数的种类,混合参数矩阵中的一行是一个高效掘进参数非协调均值集或一个多遇掘进参数非协调均值集;
对混合参数矩阵的行进行抽样,得到的样本集为混合样本集;
将混合样本集作为输入层,用于训练掘进参数预测模型;
混合样本集的高掘进效率样本平均含量,高于多遇样本集的高掘进效率样本平均含量,以混合样本集作为输入层得到的掘进参数预测模型,其预测结果的v/T期望高于以多遇样本集作为输入层得到的掘进参数预测模型,所以混合样本集相较于多遇样本集在预测结果高效程度上更优;
混合样本集的非高掘进效率样本平均含量大于零,而高效样本集内无非高掘进效率样本,以混合样本集作为输入层,相较于以高效样本集作为输入层,在相同拟合算法条件下更容易得到精度满足需求的掘进参数预测模型,故混合样本集相较于高效样本集更能代表实际掘进过程中的数据分布。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211571457.9A CN116163754B (zh) | 2022-12-08 | 2022-12-08 | 基于功率分布分层抽样的掘进参数样本前处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211571457.9A CN116163754B (zh) | 2022-12-08 | 2022-12-08 | 基于功率分布分层抽样的掘进参数样本前处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116163754A true CN116163754A (zh) | 2023-05-26 |
CN116163754B CN116163754B (zh) | 2023-11-21 |
Family
ID=86417266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211571457.9A Active CN116163754B (zh) | 2022-12-08 | 2022-12-08 | 基于功率分布分层抽样的掘进参数样本前处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116163754B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182502A (zh) * | 2014-08-18 | 2014-12-03 | 浪潮(北京)电子信息产业有限公司 | 一种数据抽取方法及装置 |
CN111310789A (zh) * | 2020-01-15 | 2020-06-19 | 云南电网有限责任公司大理供电局 | 基于核密度估计的风电功率区间预测方法及其实现系统 |
CN111488694A (zh) * | 2020-04-16 | 2020-08-04 | 盾构及掘进技术国家重点实验室 | 基于多元线性自回归的泥水盾构机掘进关键参数预测方法 |
CN111946398A (zh) * | 2020-08-17 | 2020-11-17 | 南京工业大学 | 一种复合地层盾构掘进效率现场预测计算方法 |
JP2021014726A (ja) * | 2019-07-12 | 2021-02-12 | 株式会社奥村組 | シールド掘進工法における掘進予測モデルの作成方法 |
CN112796768A (zh) * | 2021-03-08 | 2021-05-14 | 盾构及掘进技术国家重点实验室 | 一种双模隧道掘进机施工掘进参数选择方法 |
JP2022143627A (ja) * | 2021-03-18 | 2022-10-03 | 株式会社奥村組 | シールド掘進機の掘進予測モデル |
-
2022
- 2022-12-08 CN CN202211571457.9A patent/CN116163754B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104182502A (zh) * | 2014-08-18 | 2014-12-03 | 浪潮(北京)电子信息产业有限公司 | 一种数据抽取方法及装置 |
JP2021014726A (ja) * | 2019-07-12 | 2021-02-12 | 株式会社奥村組 | シールド掘進工法における掘進予測モデルの作成方法 |
CN111310789A (zh) * | 2020-01-15 | 2020-06-19 | 云南电网有限责任公司大理供电局 | 基于核密度估计的风电功率区间预测方法及其实现系统 |
CN111488694A (zh) * | 2020-04-16 | 2020-08-04 | 盾构及掘进技术国家重点实验室 | 基于多元线性自回归的泥水盾构机掘进关键参数预测方法 |
CN111946398A (zh) * | 2020-08-17 | 2020-11-17 | 南京工业大学 | 一种复合地层盾构掘进效率现场预测计算方法 |
CN112796768A (zh) * | 2021-03-08 | 2021-05-14 | 盾构及掘进技术国家重点实验室 | 一种双模隧道掘进机施工掘进参数选择方法 |
JP2022143627A (ja) * | 2021-03-18 | 2022-10-03 | 株式会社奥村組 | シールド掘進機の掘進予測モデル |
Non-Patent Citations (3)
Title |
---|
尹志清等: "基于符号回归算法的地铁盾构刀盘扭矩预测研究", 城市轨道交通研究, no. 1, pages 127 - 131 * |
张世豪等: "花岗岩地层中盾构掘进效率影响因素研究", 重庆交通大学学报(自然科学版), vol. 40, no. 04, pages 105 - 111 * |
文佳等: "复合地层盾构掘进参数相关性分析及掘进速度预测", 铁道建筑技术, no. 2, pages 6 - 10 * |
Also Published As
Publication number | Publication date |
---|---|
CN116163754B (zh) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109711609B (zh) | 基于小波变换和极限学习机的光伏电站输出功率预测方法 | |
CN110285969B (zh) | 多项式核植入特征分布适配的滚动轴承故障迁移诊断方法 | |
CN113798920B (zh) | 一种基于变分自动编码器与极限学习机的刀具磨损状态监测方法 | |
CN111695521A (zh) | 一种基于Attention-LSTM的滚动轴承性能衰退预测方法 | |
CN115130495A (zh) | 一种滚动轴承故障预测方法及系统 | |
CN112736902B (zh) | 一种基于stl分解的时间序列短期电力负荷预测方法 | |
CN110020680B (zh) | 一种基于随机矩阵理论和模糊c均值聚类算法的pmu数据分类方法 | |
CN104182803A (zh) | 风电数据预处理方法及风电功率预测方法和系统 | |
CN111600300A (zh) | 考虑风电功率多元相关性椭球集合的鲁棒优化调度方法 | |
CN112649196A (zh) | 基于频域信息的信号变分模态分解预设尺度参数选取方法 | |
CN116520772A (zh) | 基于多任务迁移学习的薄板零件数控加工质量预测方法 | |
CN109921462B (zh) | 一种基于lstm的新能源消纳能力评估方法及系统 | |
CN115146718A (zh) | 基于深度表示的风电机组异常检测方法 | |
CN114266416A (zh) | 基于相似日的光伏发电功率短期预测方法、装置及存储介质 | |
CN116163754B (zh) | 基于功率分布分层抽样的掘进参数样本前处理方法 | |
CN114357866A (zh) | 基于lstm-ae集成共享框架的风电机组异常数据检测及清洗方法 | |
CN114077929A (zh) | 基于is-arima-lstm预测模型的风电功率预测方法及系统 | |
Hussain et al. | Gearbox fault detection using real coded genetic algorithm and novel shock response spectrum features extraction | |
CN113537573B (zh) | 基于双重时空特征提取的风电功率运行趋势预测方法 | |
CN114943189A (zh) | 一种基于XGboost的声速剖面反演方法及系统 | |
CN114357851A (zh) | 一种基于dae-rnn的数控铣削表面粗糙度预测方法 | |
CN113554203B (zh) | 基于高维网格化和LightGBM的风电预测方法及装置 | |
CN111766832B (zh) | 一种不完备数据驱动的数控机床切削能耗预测建模方法 | |
CN114372640A (zh) | 一种基于波动序列分类校正的风电功率预测方法 | |
CN114266194A (zh) | 一种企业生产系统能耗智能预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |