CN108468549B - 土压平衡盾构的优化方法及装置 - Google Patents

土压平衡盾构的优化方法及装置 Download PDF

Info

Publication number
CN108468549B
CN108468549B CN201810197524.2A CN201810197524A CN108468549B CN 108468549 B CN108468549 B CN 108468549B CN 201810197524 A CN201810197524 A CN 201810197524A CN 108468549 B CN108468549 B CN 108468549B
Authority
CN
China
Prior art keywords
soil pressure
network
sealed compartment
compartment soil
dominant vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810197524.2A
Other languages
English (en)
Other versions
CN108468549A (zh
Inventor
刘宣宇
许胜�
赵宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Shihua University
Original Assignee
Liaoning Shihua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Shihua University filed Critical Liaoning Shihua University
Priority to CN201810197524.2A priority Critical patent/CN108468549B/zh
Publication of CN108468549A publication Critical patent/CN108468549A/zh
Application granted granted Critical
Publication of CN108468549B publication Critical patent/CN108468549B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21DSHAFTS; TUNNELS; GALLERIES; LARGE UNDERGROUND CHAMBERS
    • E21D9/00Tunnels or galleries, with or without linings; Methods or apparatus for making thereof; Layout of tunnels or galleries
    • E21D9/06Making by using a driving shield, i.e. advanced by pushing means bearing against the already placed lining
    • E21D9/093Control of the driving shield, e.g. of the hydraulic advancing cylinders
    • EFIXED CONSTRUCTIONS
    • E21EARTH OR ROCK DRILLING; MINING
    • E21DSHAFTS; TUNNELS; GALLERIES; LARGE UNDERGROUND CHAMBERS
    • E21D9/00Tunnels or galleries, with or without linings; Methods or apparatus for making thereof; Layout of tunnels or galleries
    • E21D9/12Devices for removing or hauling away excavated material or spoil; Working or loading platforms
    • E21D9/124Helical conveying means therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Mining & Mineral Resources (AREA)
  • Environmental & Geological Engineering (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Life Sciences & Earth Sciences (AREA)
  • Geochemistry & Mineralogy (AREA)
  • Geology (AREA)
  • Excavating Of Shafts Or Tunnels (AREA)

Abstract

本发明公开了一种土压平衡盾构的优化方法及装置,涉及一种盾构技术领域,主要目的在于解决现有由于各地地质条件不同,施工过程中盾构密封舱土压无法得到有效控制,会导致地表变形和严重的安全事故的问题。主要技术方案:获取盾构设备当前时刻的密封舱土压;结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩;根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。

Description

土压平衡盾构的优化方法及装置
技术领域
本发明涉及一种盾构技术领域,特别是涉及一种土压平衡盾构的优化方法及装置。
背景技术
随着城市化进程不断加快,土压平衡盾构已被广泛应用于软土地层的地下工程建设中。其中,由于盾构能够承受来自地层的压力,防止地下水或流砂的入侵,采用封闭式盾构的土压平衡盾构在推进时,盾构设备前端刀盘旋转掘削地层土体,切削下来的土体进入土舱,当土体充满土舱时,其被动土压与掘削面上的土压、水压基本平衡,使得掘削面与盾构面处于平衡状态,即稳定状态,从而实现土压平衡。
目前,现有的土压平衡盾构主要通过调整螺旋输送机转速,改变密封舱渣土体积,维持密封舱土压与开挖面压力平衡,有效控制地表变形。但是,由于各地地质条件不同,对盾构施工过程中盾构密封舱土压控制要求也就不同,施工过程中,盾构密封舱土压无法得到有效控制,会导致地表变形和严重的安全事故。因此,土压平衡盾构的优化方法已经成为亟待解决的问题。
发明内容
有鉴于此,本发明提供一种土压平衡盾构的优化方法及装置,主要目的在于解决现有由于各地地质条件不同,施工过程中盾构密封舱土压无法得到有效控制,会导致地表变形和严重的安全事故的问题。
依据本发明一个方面,提供了一种土压平衡盾构的优化方法,包括:
获取盾构设备当前时刻的密封舱土压;
结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩;
根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。
依据本发明一个方面,提供了一种土压平衡盾构的优化装置,包括:
获取单元,用于获取盾构设备当前时刻的密封舱土压;
优化单元,用于结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩;
控制单元,用于根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。
根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述土压平衡盾构的优化方法对应的操作。
根据本发明的再一方面,提供了一种终端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述土压平衡盾构的优化方法对应的操作。
借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
本发明提供了一种土压平衡盾构的优化方法及装置,首先获取盾构设备当前时刻的密封舱土压,再结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩,然后根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。与现有由于各地地质条件不同,对盾构施工过程中盾构密封舱土压控制要求也就不同,施工过程中,盾构密封舱土压无法得到有效控制相比,本发明实施例通过HDP控制器对密封舱土压进行优化,以总推力、螺旋输送机转速、推进速度、刀盘扭矩等参数作为多变量同步协调控制,实现对密封舱土压优化调节时间更短,超调更小,优化控制过程更加稳定,提高抗干扰能力,从而使得盾构机可以快速达到稳定状态。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的一种土压平衡盾构的优化方法流程图;
图2示出了本发明实施例提供的一种执行网络结构示意图;
图3示出了本发明实施例提供的一种密封舱土压HDP控制器结构示意图;
图4示出了本发明实施例提供的另一种土压平衡盾构的优化方法流程图;
图5示出了本发明实施例提供的一种密封舱土压预测模型结构示意图;
图6示出了本发明实施例提供的一种评价网络结构示意图;
图7示出了本发明实施例提供的一种密封舱隔板压力传感器分布示意图;
图8示出了本发明实施例提供的一种有无刀盘扭矩的密封舱土压预测模型仿真示意图;
图9示出了本发明实施例提供的一种密封舱土压优化控制代价函数示意图;
图10示出了本发明实施例提供的一种密封舱土压优化轨迹示意图;
图11示出了本发明实施例提供的一种刀盘扭矩、总推力、推进速度、螺旋输送机转速的优化轨迹示意图;
图12示出了本发明实施例提供的一种密封舱土压控制轨迹示意图;
图13示出了本发明实施例提供的一种土压平衡盾构的优化装置框图;
图14示出了本发明实施例提供的另一种土压平衡盾构的优化装置框图;
图15示出了本发明实施例提供的一种终端的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明实施例提供了一种土压平衡盾构的优化方法,如图1所示,所述方法包括:
101、获取盾构设备当前时刻的密封舱土压。
其中,所述盾构设备为进行盾构施工的盾构机,所述密封舱土压为密封舱在传输挖掘出的土料时对盾构机产生的压力,一般的,密封舱土压需要控制在一定范围内,从而避免损坏盾构机。
需要说明的是,为了便于本发明实施例中模型的训练及预测,定义p(k)为k时刻密封舱土压。
102、结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练。
其中,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩,可以通过HDP控制器中的执行网络训练出当前时刻的控制向量:u(k)=[n(k),v(k),F(k),T(k)]T,其中,n(k)为总推力、v(k)为螺旋输送机转速、F(k)为推进速度、T(k)为刀盘扭矩。另外,HDP控制器中作为密封舱效用函数为U(k)=f[p(k),u(k),k],以便对HDP控制器中的密封舱土压和控制向量做出评价。
需要说明的是,HDP控制器中采用迭代的形式训练评价网络以近似贝尔曼动态规划方程中的代价函数J(k)表示效用函数从k时刻开始的迭代值。另外,本发明实施例中,为了体现非线性映射能力,并扩大工业控制中的建模适用范围,利用HDP控制器中的执行网络来对控制向量进行预测时,执行网络为BP神经网络,为了减少预测密封舱土压预测误差,如图2所示,执行网络输入层的输入为p(k),隐藏层中的节点为8个,输出层中的输出包括了n(k)、v(k)、F(k)、T(k)。
103、根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。
其中,所述优化训练后的控制向量为当前时刻的u(k),如图3所示的密封舱土压HDP控制器结构,盾构机通过接收到当前时刻的控制向量u(k)来预测出下一时刻的密封舱土压p(k+1),并进行控制。
需要说明的是,如图3中,密封舱土压HDP控制器结构包括盾构机、执行网络、模型网络、评价网络。首先,执行网络通过当前时刻的密封舱土压p(k)来预测当前时刻的控制向量u(k),盾构机通过u(k)可以确定出p(k+1),而模型网络根据u(k)和p(k)预测出的p(k+1)作为评价网络的输入,通过评价出密封舱土压优化控制代价函数J(k+1),定义γ∈(0,1]为折扣因子,通过折扣因子进行折算,显示效用函数迭代的时间效应,HDP的目标是选择最优控制向量,k=i,i+1...,推导出J(k)=U(k)+γJ(k+1),根据Bellman优化原理,以J(k)=U(k)+γJ(k+1)作为网络权值调整的目标,则可以通过网络训练使得代价函数逐步趋向当前控制策略下的最优值。为了使评价网络近似,定义评价网络误差函数ec(k)=J*(k)-γJ*(k+1)-U(k),其中,J*(k)为k时刻代价函数估计值,J*(k+1)为k+1时刻代价函数估计值。另外,为了将执行网络的训练以最小化J(k)=U(k)+γJ(k+1)为目标,从而获得最优控制向量,因此,定义执行网络误差为ea(k)=J*(k)=J*(k+1)+U(k),执行网络根据返回的误差再次校正训练模型,从而提高模型精度。
本发明提供了一种土压平衡盾构的优化方法,与现有由于各地地质条件不同,施工过程中盾构密封舱土压无法得到有效控制相比,本发明实施例通过HDP控制器对密封舱土压进行优化,以总推力、螺旋输送机转速、推进速度、刀盘扭矩等参数作为多变量同步协调控制,实现对密封舱土压优化调节时间更短,超调更小,优化控制过程更加稳定,提高抗干扰能力,从而使得盾构机可以快速达到稳定状态。
本发明实施例提供了另一种土压平衡盾构的优化方法,如图4所示,所述方法包括:
201、获取盾构设备当前时刻的密封舱土压。
本步骤与图1所示的步骤101方法相同,在此不再赘述。
202、获取已经完成模型训练的模型网络及执行网络。
其中,所述执行网络以最小化密封舱土压优化控制代价函数为目标,以使得优化控制向量,所述模型网络为网络隐藏层节点为9的BP神经网络预测模型,即密封舱土压预测模型,如图5所示,以p(k)、n(k)、v(k)、F(k)、T(k)为密封舱土压预测模型的输入,输出为p(k+1),即表示为p(k+1)=f[p(k),n(k),v(k),F(k),T(k)]。所述执行网络为如图2所示,输入层的输入为p(k),隐藏层中的节点为8个,输出层中的输出包括了n(k)、v(k)、F(k)、T(k)。
需要说明的是,对模型网络的训练可以为采用如图5所示的输出与密封舱土压预测模型的p(k+1)之间产生的误差em(k+1)用于模型网络权重更新,其中,根据梯度下降算法与链式法则,通过最小化em(k+1)=p(k+1)-p*(k+1)定义的模型网络误差实现权值更新,p(k+1)为密封舱土压预测模型输出,p*(k+1)为模型网络输出,进一步地,针对隐藏层到输出层的权值更新规则可以为:Wm2(k+1)=Wm2(k)+ΔWm2(k),输入层到隐藏层的权重更新规则可以为Wm1(k+1)=Wm1(k)+ΔWm1(k),其中,lm∈(0,1]为模型网络学习率,ΔWm(k)为k时刻权值增量,ΔWm1(k)为k时刻输入层到隐藏层的权值,ΔWm2(k)为k时刻隐藏层到输出层的权值,ΔWm(k+1)为k+1时刻模型网络权值。
另外,对执行网络的训练可以采用隐藏层为8时如图2所示的BP神经网络预测模型,即1-8-4结构的三层BP网络,执行网络目标是最小化评价网络输出的密封舱土压优化控制代价函数,获得最优控制向量。执行网络利用反向传播的评价网络误差,实现其权值更新。针对隐藏层到输出层的权值更新规则,可以根据ea(k)=J*(k)=J*(k+1)+U(k)、定位为:Wa2(k+1)=Wa2(k)+ΔWa2(k),其中,输入层到隐藏层的权值更新规则为:Wa1(k+1)=Wa1(k)+ΔWa1(k),其中,la∈(0,1],为执行网络学习率,ΔWa(k)为k时刻权值增量,ΔWa1(k)为k时刻输入层到隐藏层的权值,ΔWa2(k),为k时刻隐藏层到输出层的权值,Wa(k+1)为k+1时刻执行网络权值。
203、将所述当前时刻的密封舱土压作为所述执行网络的输入,执行所述执行网络的运算确定出控制向量。
其中,如图3中所示的HDP控制器结构,为了预测出当前时刻的控制向量,并以图2所示的执行网络进行运算,将当前时刻的密封舱土压p(k)作为执行网络的输入,确定出控制向量u(k)。
204、将所述当前密封舱土压、所述控制向量作为模型网络的输入,运行所述模型网络的预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压,并将所述下一时刻的密封舱土压进行评价后的评价结果反馈至所述执行网络,所述执行网络根据所述评价结果对所述控制向量进行优化训练。
需要说明的是,如图3所示的HDP控制器结构图,为了减小执行网络运行误差及优化模型运算,利用模型网络预测得到下一时刻的密封舱土压p(k+1),然后通过评价网络进行评价。其中,密封舱土压效用函数U(k)是整个HDP控制器设计过程中与密封舱土压直接相关的重要指标,实际上,在自适应动态规划中,设计效用函数的过程本质上就是优化设计HDP控制器的过程,在某种程度上,效用函数的选择决定了控制器的动态控制的优劣。在对工业系统的控制过程中,效用函数必须能够反映实际系统的控制特效和系统自身属性,所设计的控制器才可满足控制要求,由于本发明实施例中的控制对象为密封舱土压,为了使其稳定于0.18-0.22MPa范围内,因此选择的效用函数为,效用函数确定为:
对于本发明实施例,为了细化对下一时刻的密封舱土压评价过程,步骤204具体可以为:将所述当前密封舱土压、所述控制向量作为基于隐藏层节点数为9的三层BP神经网络的模型网络的输入,运行预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压;将所述下一时刻的密封舱土压作为基于隐藏层节点数为8的三层BP神经网络的评价网络的输入,运行评价运算得到下一时刻密封舱土压优化控制代价函数,并根据所述评价网络的代价函数误差更新网络权值,逼近所述下一时刻密封舱土压优化控制代价函数;所述执行网络根据所述评价网络反馈的评价网络误差进行权值更新,对所述控制向量进行优化。
对于本发明实施例,为了使评价网络的训练效果最优,评价网络采用1-8-1结构的三层BP神经网络,如图6所示,根据评价网络误差函数ec(k)=J*(k)-γJ*(k+1)-U(k)、以及梯度下降算法和链式法则,隐藏层到输出层的权值更新规则为:Wc2(k+1)=Wc2(k)+ΔWc2(k),输入层到隐藏层的权值更新规则为:Wc1(k+1)=Wc1(k)+ΔWc1(k),其中,lc∈(0,1]为评价网络学习率,ΔWc(k)为k时刻评价网络权值增量,ΔWc1(k)为k时刻输入层到隐藏层的权值,ΔWc2(k)为k时刻隐藏层到输出层的权值,ΔWc(k+1)为k+1时刻评价网络权值。
进一步地,所述所述执行网络根据所述评价网络反馈的误差进行权值更新,对所述控制向量进行优化之后,还包括:判断对所述控制向量进行优化的迭代误差是否处于预设正常误差范围内;若所述迭代误差没有处于预设正常误差范围内,则循环更新所述网络权值。
对于本发明实施例,为了避免迭代误差引起较大的模型误差,降低准确性,需要对控制向量进行优化后的迭代误差进行判断,所述预设正常误差范围根据盾构机挖掘中盾构总推力、密封舱土压、螺旋输送机转速、推进速度的所有参数进行综合设定,具体数值本发明实施例可以不做具体限定。
205、若所述迭代误差处于预设正常误差范围内,则根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。
本步骤与图1所示的步骤103方法相同,在此不再赘述。
进一步地,本发明实施例还包括:建立具有输入层、隐藏层、输出层的三层BP神经网络的密封舱土压预测模型;
其中,所述输入层中包括当前密封舱土压p(k)、当前螺旋输送机转速n(k)、当前推进速度v(k)、当前总推力F(k)、当前刀盘扭矩T(k),所述隐藏层用于反应具有多节点结构的权值更新规则,以便为模型网络、评价网络配置对应的节点,所述输出层为下一时刻密封舱土压p(k+1),确定为p(k+1)=f[p(k),n(k),v(k),F(k),T(k)],k为当前时刻。
对于本发明实施例,具体的应用场景可以如下所示,但不限于此,包括:针对HDP控制器的训练过程具体可以为:初始各网络的权值,赋值网络学习率和折扣因子,并设置最大迭代步数qmax;设定初始密封舱土压p(k)。将其作为执行网络输入,输出控制向量u(k)=[n(k),v(k),F(k),T(k)]T;将p(k)输入评价网络,输出密封舱土压优化控制代价函数J*(k);同时,将当前密封舱土压p(k)与控制向量u(k)输入模型网络,获得k+1时刻密封舱土压p*(k+1);求解效用函数U(k);将p*(k+1)作为评价网络输入,输出下一时刻密封舱土压优化控制代价函数J*(k+1);依据评价网络中的代价函数误差ec(k),更新网络权值,逼近密封舱土压优化控制代价函数;执行网络根据评价反馈的误差ea(k),实现权值更新,优化控制向量;判断迭代误差,在范围内,执行判断迭代步数;反之,返回循环更新网络权值;判断迭代步数时,若q≤qmax,更新状态和控制向量,重新进行p(k)输入评价网络步骤;否则,训练结束。从如图7所示的密封舱隔板压力传感器分布图中的传感器1获取密封舱土压数据为800组,剔除一部分异常数据后得到650组有效数据,用其中的550组作为训练样本,另外100组作为测试样本,通过MATLAB对密封舱土压预测模型进行仿真。有无刀盘扭矩的密封舱土压预测模型仿真如图8所示,当刀盘扭矩作为模型控制量之一时,其均方误差更小,说明考虑刀盘扭矩的土压预测模型具有更好的预测精度,考虑刀盘扭矩的模型,其预测值与实测值整体拟合效果较好。由于地质条件或工况的不确定性,存在个别点拟合较差,但误差基本在10%以内,满足工程要求,如下表1所示。
表1:预测模型均方误差
密封舱土压预测模型 均方误差
有刀盘扭矩 9.1554*10<sup>-5</sup>
无刀盘扭矩 3.2*10<sup>-3</sup>
另外,HDP控制器初始密封舱土压p(k)=0.18MPa;la、lc初始值为0.7;折扣因子γ=1,密封舱土压优化控制代价函数如图9所示;密封舱土压优化轨迹如图10所示;相应的,刀盘扭矩、总推力、推进速度、螺旋输送机转速的优化轨迹如图11所示。为了验证HDP控制器对密封舱土压优化效果,其密封舱土压控制轨迹如图12所示。
本发明提供了另一种土压平衡盾构的优化方法,本发明实施例通过HDP控制器对密封舱土压进行优化,以总推力、螺旋输送机转速、推进速度、刀盘扭矩等参数作为多变量同步协调控制,实现对密封舱土压优化调节时间更短,超调更小,优化控制过程更加稳定,提高抗干扰能力,从而使得盾构机可以快速达到稳定状态。
进一步的,作为对上述图1所示方法的实现,本发明实施例提供了一种土压平衡盾构的优化装置,如图13所示,该装置包括:获取单元31、优化单元32、控制单元33。
获取单元31,用于获取盾构设备当前时刻的密封舱土压;所述获取单元31为土压平衡盾构的优化装置执行获取盾构设备当前时刻的密封舱土压的程序模块。
优化单元32,用于结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩;所述优化单元32为土压平衡盾构的优化装置执行结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练的程序模块。
控制单元33,用于根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。所述控制单元33为土压平衡盾构的优化装置执行根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制的程序模块。
本发明提供了一种土压平衡盾构的优化装置,与现有由于各地地质条件不同,对盾构施工过程中盾构密封舱土压控制要求也就不同,施工过程中,盾构密封舱土压无法得到有效控制相比,本发明实施例通过HDP控制器对密封舱土压进行优化,以总推力、螺旋输送机转速、推进速度、刀盘扭矩等参数作为多变量同步协调控制,实现对密封舱土压优化调节时间更短,超调更小,优化控制过程更加稳定,提高抗干扰能力,从而使得盾构机可以快速达到稳定状态。
进一步的,作为对上述图4所示方法的实现,本发明实施例提供了另一种土压平衡盾构的优化装置,如图14所示,该装置包括:获取单元41、优化单元42、控制单元43、建立单元44。
获取单元41,用于获取盾构设备当前时刻的密封舱土压;
优化单元42,用于结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩;
控制单元43,用于根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。
具体的,所述优化单元42包括:
获取模块4201,用于获取已经完成模型训练的模型网络及执行网络,所述执行网络以最小化密封舱土压优化控制代价函数为目标,以使得优化控制向量;
确定模块4202,用于将所述当前时刻的密封舱土压作为所述执行网络的输入,执行所述执行网络的运算确定出控制向量;
训练模块4203,用于将所述当前密封舱土压、所述控制向量作为模型网络的输入,运行所述模型网络的预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压,并将所述下一时刻的密封舱土压进行评价后的评价结果反馈至所述执行网络,所述执行网络根据所述评价结果对所述控制向量进行优化训练。
所述训练模块4203,具体用于将所述当前密封舱土压、所述控制向量作为基于隐藏层节点数为9的三层BP神经网络的模型网络的输入,运行预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压;
所述训练模块4203,还具体用于将所述下一时刻的密封舱土压作为基于隐藏层节点数为8的三层BP神经网络的评价网络的输入,运行评价运算得到下一时刻密封舱土压优化控制代价函数,并根据所述评价网络的代价函数误差更新网络权值,逼近所述下一时刻密封舱土压优化控制代价函数;
所述训练模块4203,还具体用于所述执行网络根据所述评价网络反馈的评价网络误差进行权值更新,对所述控制向量进行优化。
具体的,所述优化单元42还包括:
判断模块4204,用于判断对所述控制向量进行优化的迭代误差是否处于预设正常误差范围内;
更新模块4205,用于若判断模块4204判断出所述迭代误差没有处于预设正常误差范围内,则循环更新所述网络权值;
所述控制单元43,具体用于若判断模块4204判断出所述迭代误差处于预设正常误差范围内,则根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。
进一步地,所述装置还包括:
建立单元44,用于建立具有输入层、隐藏层、输出层的三层BP神经网络的密封舱土压预测模型;
其中,所述输入层中包括当前密封舱土压p(k)、当前螺旋输送机转速n(k)、当前推进速度v(k)、当前总推力F(k)、当前刀盘扭矩T(k),所述隐藏层用于反应具有多节点结构的权值更新规则,以便为模型网络、评价网络配置对应的节点,所述输出层为下一时刻密封舱土压p(k+1),确定为p(k+1)=f[p(k),n(k),v(k),F(k),T(k)],k为当前时刻。
本发明提供了另一种土压平衡盾构的优化装置,本发明实施例通过HDP控制器对密封舱土压进行优化,以总推力、螺旋输送机转速、推进速度、刀盘扭矩等参数作为多变量同步协调控制,实现对密封舱土压优化调节时间更短,超调更小,优化控制过程更加稳定,提高抗干扰能力,从而使得盾构机可以快速达到稳定状态。
根据本发明一个实施例提供了一种存储介质,所述存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的土压平衡盾构的优化方法。
图15示出了根据本发明一个实施例提供的一种终端的结构示意图,本发明具体实施例并不对终端的具体实现做限定。
如图15所示,该终端可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述土压平衡盾构的优化方法实施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。终端包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序510具体可以用于使得处理器502执行以下操作:
获取盾构设备当前时刻的密封舱土压;
结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩;
根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的土压平衡盾构的优化方法及装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (8)

1.一种土压平衡盾构的优化方法,其特征在于,包括:
获取盾构设备当前时刻的密封舱土压;
结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩;
根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制;
所述结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练包括:
获取已经完成模型训练的模型网络及执行网络,所述执行网络以最小化密封舱土压优化控制代价函数为目标,以优化控制向量;
将所述当前时刻的密封舱土压作为所述执行网络的输入,执行所述执行网络的运算确定出控制向量;
将所述当前密封舱土压、所述控制向量作为模型网络的输入,运行所述模型网络的预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压,并将所述下一时刻的密封舱土压进行评价后的评价结果反馈至所述执行网络,所述执行网络根据所述评价结果对所述控制向量进行优化训练,其中,密封舱土压的效用函数U(k),p(k)为密封舱土压。
2.根据权利要求1所述的方法,其特征在于,所述将所述当前密封舱土压、所述控制向量作为模型网络的输入,运行所述模型网络的预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压,并将所述下一时刻的密封舱土压进行评价后的评价结果反馈至所述执行网络,所述执行网络根据所述评价结果对所述控制向量进行优化训练包括:
将所述当前密封舱土压、所述控制向量作为基于隐藏层节点数为9的三层BP神经网络的模型网络的输入,运行预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压;
将所述下一时刻的密封舱土压作为基于隐藏层节点数为8的三层BP神经网络的评价网络的输入,运行评价运算得到下一时刻密封舱土压优化控制代价函数,并根据所述评价网络的代价函数误差更新网络权值,逼近所述下一时刻密封舱土压优化控制代价函数;
所述执行网络根据所述评价网络反馈的评价网络误差进行权值更新,对所述控制向量进行优化。
3.根据权利要求2所述的方法,其特征在于,所述执行网络根据所述评价网络反馈的误差进行权值更新,对所述控制向量进行优化之后,还包括:
判断对所述控制向量进行优化的迭代误差是否处于预设正常误差范围内;
若所述迭代误差没有处于预设正常误差范围内,则循环更新所述网络权值;
所述根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制包括:
若所述迭代误差处于预设正常误差范围内,则根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
建立具有输入层、隐藏层、输出层的三层BP神经网络的密封舱土压预测模型;
其中,所述输入层中包括当前密封舱土压p(k)、当前螺旋输送机转速n(k)、当前推进速度v(k)、当前总推力F(k)、当前刀盘扭矩T(k),所述隐藏层用于反应具有多节点结构的权值更新规则,以便为模型网络、评价网络配置对应的节点,所述输出层为下一时刻密封舱土压p(k+1),确定为p(k+1)=f[p(k),n(k),v(k),F(k),T(k)],k为当前时刻。
5.一种土压平衡盾构的优化装置,其特征在于,包括:
获取单元,用于获取盾构设备当前时刻的密封舱土压;
优化单元,用于结合所述密封舱土压与预设的启发式动态规划HDP控制器确定控制向量,并进行优化训练,所述控制向量中的参数包括总推力、螺旋输送机转速、推进速度、刀盘扭矩;
控制单元,用于根据优化训练后的控制向量对所述盾构设备的下一时刻的密封舱土压进行控制;
所述优化单元包括:
获取模块,用于获取已经完成模型训练的模型网络及执行网络,所述执行网络以最小化密封舱土压优化控制代价函数为目标,以优化控制向量;
确定模块,用于将所述当前时刻的密封舱土压作为所述执行网络的输入,执行所述执行网络的运算确定出控制向量;
训练模块,用于将所述当前密封舱土压、所述控制向量作为模型网络的输入,运行所述模型网络的预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压,并将所述下一时刻的密封舱土压进行评价后的评价结果反馈至所述执行网络,所述执行网络根据所述评价结果对所述控制向量进行优化训练,其中,密封舱土压的效用函数U(k),p(k)为密封舱土压。
6.根据权利要求5所述的装置,其特征在于,
所述训练模块,具体用于将所述当前密封舱土压、所述控制向量作为基于隐藏层节点数为9的三层BP神经网络的模型网络的输入,运行预测运算得到与所述当前密封舱土压对应的下一时刻的密封舱土压;
所述训练模块,还具体用于将所述下一时刻的密封舱土压作为基于隐藏层节点数为8的三层BP神经网络的评价网络的输入,运行评价运算得到下一时刻密封舱土压优化控制代价函数,并根据所述评价网络的代价函数误差更新网络权值,逼近所述下一时刻密封舱土压优化控制代价函数;
所述训练模块,还具体用于所述执行网络根据所述评价网络反馈的评价网络误差进行权值更新,对所述控制向量进行优化。
7.一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-4中任一项所述的土压平衡盾构的优化方法对应的操作。
8.一种终端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-4中任一项所述的土压平衡盾构的优化方法对应的操作。
CN201810197524.2A 2018-03-11 2018-03-11 土压平衡盾构的优化方法及装置 Expired - Fee Related CN108468549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810197524.2A CN108468549B (zh) 2018-03-11 2018-03-11 土压平衡盾构的优化方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810197524.2A CN108468549B (zh) 2018-03-11 2018-03-11 土压平衡盾构的优化方法及装置

Publications (2)

Publication Number Publication Date
CN108468549A CN108468549A (zh) 2018-08-31
CN108468549B true CN108468549B (zh) 2019-08-23

Family

ID=63265241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810197524.2A Expired - Fee Related CN108468549B (zh) 2018-03-11 2018-03-11 土压平衡盾构的优化方法及装置

Country Status (1)

Country Link
CN (1) CN108468549B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110096827B (zh) * 2019-05-09 2022-08-05 中铁工程服务有限公司 一种基于深度神经网络的盾构机参数优化方法
CN110633525B (zh) * 2019-09-12 2023-04-07 辽宁石油化工大学 土压平衡盾构机系统能耗的优化方法及装置
CN112647957A (zh) * 2020-12-23 2021-04-13 上海隧道工程有限公司 土压平衡盾构的土压智能控制方法及其系统
CN113361824B (zh) * 2021-07-19 2023-04-07 中国铁建重工集团股份有限公司 土压平衡盾构机及其推进速度预测方法、装置、存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184426A (zh) * 2015-10-20 2015-12-23 华中科技大学 一种基于随机连续寻优策略的梯级电站调峰方法
WO2016064610A1 (en) * 2014-10-21 2016-04-28 Cisco Technology, Inc. Dynamic programming across multiple streams
CN105552895A (zh) * 2015-12-30 2016-05-04 国家电网公司 一种基于多层次启发式动态规划的电力系统动态等值法
CN105835854A (zh) * 2016-03-17 2016-08-10 奇瑞汽车股份有限公司 一种紧急制动控制系统及其控制方法
CN105971615A (zh) * 2016-05-06 2016-09-28 同济大学 一种动态反馈调节盾构土压平衡控制方法
CN106285710A (zh) * 2016-08-23 2017-01-04 中南大学 一种基于地表变形的土压平衡盾构掘进参数控制方法
CN106842948A (zh) * 2017-03-01 2017-06-13 长春工业大学 基于bp网络的hdp分子蒸馏系统的最优控制方法
CN107769244A (zh) * 2017-08-31 2018-03-06 南京邮电大学 计及多种柔性负荷模型的多储能风电调度方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016064610A1 (en) * 2014-10-21 2016-04-28 Cisco Technology, Inc. Dynamic programming across multiple streams
CN105184426A (zh) * 2015-10-20 2015-12-23 华中科技大学 一种基于随机连续寻优策略的梯级电站调峰方法
CN105552895A (zh) * 2015-12-30 2016-05-04 国家电网公司 一种基于多层次启发式动态规划的电力系统动态等值法
CN105835854A (zh) * 2016-03-17 2016-08-10 奇瑞汽车股份有限公司 一种紧急制动控制系统及其控制方法
CN105971615A (zh) * 2016-05-06 2016-09-28 同济大学 一种动态反馈调节盾构土压平衡控制方法
CN106285710A (zh) * 2016-08-23 2017-01-04 中南大学 一种基于地表变形的土压平衡盾构掘进参数控制方法
CN106842948A (zh) * 2017-03-01 2017-06-13 长春工业大学 基于bp网络的hdp分子蒸馏系统的最优控制方法
CN107769244A (zh) * 2017-08-31 2018-03-06 南京邮电大学 计及多种柔性负荷模型的多储能风电调度方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
基于启发式动态规划的冷热源优化控制;王伯伊;《电子制作》;20171001(第19期);第23-25页
基于自适应动态规划的储能系统优化控制方法;李相俊;《电网技术》;20160531;第40卷(第5期);第1355-1362页
盾构密封舱土压预测及智能优化控制策略;曹曦;《煤炭学报》;20151231;第40卷(第12期);第2980-2986页
自适应动态规划综述;张化光;《自动化学报》;20130430;第39卷(第4期);第303-311页

Also Published As

Publication number Publication date
CN108468549A (zh) 2018-08-31

Similar Documents

Publication Publication Date Title
CN108468549B (zh) 土压平衡盾构的优化方法及装置
KR102211421B1 (ko) 터널 굴진면의 전방 지질 상태 예측에 기반한 tbm 제어 파라미터 결정 방법 및 시스템
CN101807048B (zh) 过程控制系统中的在线自适应模型预测控制
CN110409528B (zh) 一种挖掘机铲斗轨迹自动控制装置、方法和计算机可读存储介质
CN110110419A (zh) 一种基于多目标学习的tbm掘进参数预测方法
CN101817163B (zh) 一种基于神经网络的磨削加工工况检测方法
US11308413B2 (en) Intelligent optimization of flow control devices
Frank et al. On increasing fuel efficiency by operator assistant systems in a wheel loader
CN113361824B (zh) 土压平衡盾构机及其推进速度预测方法、装置、存储介质
CN109993205A (zh) 时间序列预测方法、装置、可读存储介质及电子设备
KR102382047B1 (ko) Pso를 이용한 모터 제어기의 자동 학습 튜닝 시스템
US11295045B2 (en) Tools and methods for aerodynamically optimizing the geometry of vehicle bodies
CN109507891B (zh) 一种半主动模糊控制方法
CN108235347A (zh) 一种无线传感器网络能耗控制方法
CN110486029A (zh) 盾构机土压平衡控制的优化方法及装置
CN104156619A (zh) 协同探测中传感器分配方法
Javalera et al. Negotiation and learning in distributed MPC of large scale systems
Dong et al. A novel ADP based model-free predictive control
Toropov Modelling and approximation strategies in optimization—global and mid-range approximations, response surface methods, genetic programming, low/high fidelity models
CN114124259A (zh) 基于不完整信息的智能反射表面的干扰测试方法
EP3835894A1 (en) Method and apparatus for configuring a machine controller
CN106202760B (zh) 一种虚拟试验全系统参数优化方法
CN108549745A (zh) 低雷诺数飞行条件的机翼失速边界及恢复边界的预测方法
CN104570737A (zh) 基于随机算法的pid控制器参数选定方法
CN113910241B (zh) 一种多人零和博弈可重构机器人最优控制方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190823

Termination date: 20200311

CF01 Termination of patent right due to non-payment of annual fee