CN100413771C - 基于cmac网络的群控电梯调度方法 - Google Patents

基于cmac网络的群控电梯调度方法 Download PDF

Info

Publication number
CN100413771C
CN100413771C CNB200610040554XA CN200610040554A CN100413771C CN 100413771 C CN100413771 C CN 100413771C CN B200610040554X A CNB200610040554X A CN B200610040554XA CN 200610040554 A CN200610040554 A CN 200610040554A CN 100413771 C CN100413771 C CN 100413771C
Authority
CN
China
Prior art keywords
beta
elevator
cmac
parameter
lift
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB200610040554XA
Other languages
English (en)
Other versions
CN1857981A (zh
Inventor
高阳
胡景凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CNB200610040554XA priority Critical patent/CN100413771C/zh
Publication of CN1857981A publication Critical patent/CN1857981A/zh
Application granted granted Critical
Publication of CN100413771C publication Critical patent/CN100413771C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Elevator Control (AREA)

Abstract

本发明公开了一种基于CMAC网络的群控电梯调度方法,其步骤为:(1)确定静态参数、动态参数、乘客到达模型、CMAC网络参数和强化学习参数,然后触发电梯群控系统;(2)观察电梯状态计算得出Q(x,run)和Q(x,stop);(3)选择电梯动作;(4)令电梯i的下一个决策点发生在ty时刻,其相应的状态为y,更新所有电梯的获得R[i]值;(5)调节电梯I的Q(s,a)的估值;(6)根据式:更新CMAC网络权值;(7)将x←y,tx←ty..转至步骤1,从而实现群控电梯调度。本方法的显著优点是能有效地减少乘客平均等待时间,提高电梯调度的性能。

Description

基于CMAC网络的群控电梯调度方法
一、技术领域
本发明涉及一种电梯的调度方法,尤其涉及一种电梯群控调度方法。
二、背景技术
早期电梯控制采用单呼梯信号形式,随着计算机控制和智能技术的发展,由计算机统一管理一组电梯的呼叫和指令信号,根据系统设定的优化目标和建筑物中的实际交通状况,产生最优电梯调度策略,这就是目前常见的电梯群控系统,其调度的实质是在开放、动态的复杂环境中,对乘客候梯时间、乘客乘梯时间、拥挤度和能耗等多个优化目标进行优化控制。目前群控电梯调度方法主要涉及分区算法、基于搜索的算法和基于规则的算法等等。随着智能技术的发展,越来越多的研究者采用专家系统、模糊控制、人工神经网络以及遗传算法等技术研究自适应的学习算法。但由于电梯运行在一个连续时间系统中,其状态空间高维,同时外部状态不能完全感知且随乘客到达率变化而动态改变,因此有效计算电梯群控调度的最优策略仍然是研究界和产业界面临的主要难题之一。
考虑到电梯面临的实际环境是未知的、不确定的,而调度是针对顾客到达模型的在线优化。因此将强化学习(Reinforcement learning)技术应用到电梯群控调度中,通过仿真实验表明其方法与目前已有算方法相比,能够获得较小的顾客平均等待时间。
三、发明内容
1、发明目的:本发明的目的是提供一种可以减少乘客平均等待时间的高效电梯群控调度方法。
2、为了达到上述的发明目的,本发明包括下述步骤:
(1)确定静态参数、动态参数、乘客到达模型、CMAC网络参数和强化学习参数,然后触发电梯群控系统,其中,静态参数为电梯数目和楼层数目,动态参数为层间运行时间、电梯停止/转向时间和乘客进出电梯时间,乘客到达模型参数为乘客到达时间分布,CMAC网络参数为输入节点、输出节点和泛化参数,强化学习参数为指数衰减速率β和学习率α;所述的CMAC网络即小脑模型关节控制器神经网络(CerebellarModel Articulation Controller Neural Network),是一种根据小脑的生物模型提出的一种人工神经网络。
(2)设在tx时刻电梯i到达一个决策点,观察得到状态为x,根据CMAC网络计算得出Q(x,run)和Q(x,stop),其中,Q(x,run)为在x状态下电梯继续运行的Q值函数,Q(x,stop)为电梯停靠的Q值函数;
(3)根据以下公式选择动作a:
Pr ( stop ) = e Q ( x , run ) / T e Q ( x , stop ) / T + e Q ( x , run ) / T
其中,T为温度参数且T>0;
(4)令电梯i的下一个决策点发生在ty时刻,其相应的状态为y,根据式
ΔR [ i ] = e - β ( t 0 - d [ i ] ) Σ b { 2 λ b ( 1 - e - p ( t 1 - t 0 ) ) β 4 + ( 2 β 3 + 2 w 0 ( b ) β 2 + w 0 2 ( b ) β )
- e - β ( t 1 - t 0 ) ( 2 β 3 + 2 w 1 ( b ) β 2 + w 1 2 ( b ) β ) + λ b [ ( 2 w 0 ( b ) β 3 + w 0 2 ( b ) β 2 + w 0 3 ( b ) 3 β ) -
e - β ( t 1 - t 0 ) ( 2 w 1 ( b ) β 3 + w 1 2 ( b ) β 2 + w 1 3 ( b ) 3 β ) ] }
更新所有电梯的获得R[i]值,其中,R[i]为第i部电梯从其上一次决策时间点d[i]时开始累计的总折扣强化值,t0为上一事件发生的时间,t1为当前事件发生的时间,对于每个在t0和t1之间有效的电梯呼叫键b而言,令w0(b)和w1(b)分别为t0和t1时刻按钮b按下后逝去的时间,式中β为指数衰减速率,λ为顾客的泊松到达率;
(5)电梯i根据式:
Q ( x , a ) ← R [ i ] + e - β ( t v - t x ) min a ′ ∈ { stop , cont } Q cmac ( y , a ′ ) 调节其Q(s,a)的估值;
(6)根据式:
ΔW = α [ R [ i ] + e - β ( t v - t x ) min a ′ ∈ { stop , cont } Q cmac ( y , a ′ W ) - Q cmac ( x , a , W ) ] ▿ W Q cmac ( x , a , W ) 更新CMAC网络权值;
(7)将x←y,tx←ty..转至步骤1,从而实现群控电梯调度。
3、有益效果:其显著优点是能有效地减少乘客平均等待时间,提高电梯调度的性能。
表1仅含下行交通模式的对比实验结果
  算法   AvgWait  SquaredWait   Percent>60s
  SECTOR   214   674   112
  RL-BP   212   569   009
  RL-CMAC   197   529   007
表2含上行交通模式的对比实验结果
  算法   AvgWait   SquaredWait   Percent>60s
  SECTOR   273   1252   924
  RL-BP   243   1140   990
  RL-CMAC   218   1048   914
表3两倍上行交通的对比实验结果
  算法   AvgWait  SquaredWait Percent>60s
  SECTOR   303   1643   1350
  RL-BP   278   1698   874
  RL-CMAC   234   1562   820
以上分别在三种交通模式下进行实验,实验表明基于CMAC网络的群控电梯调度算法相比采用基于BP网络强化学习的群控调度算法和经典的SECTOR算法,能够获得较小的顾客平均等待时间;同时顾客等待时间超过60s的比例大幅减小。
四、附图说明
图1是强化学习函数估计的结构图;
图2是CMAC神经网络结构示意图。
五、具体实施方式
如图1、图2所示,本实施例包括下列步骤:
(1)根据表4确定静态参数、动态参数、乘客到达模型、CMAC网络参数和强化学习参数,然后触发电梯群控系统;
表4实施例参数配置
(2)设在tx时刻电梯i到达一个决策点,观察得到状态为x,根据CMAC网络计算得出Q(x,run)和Q(x,stop),其中,Q(x,run)为在x状态下电梯继续运行的Q值函数,Q(x,stop)为电梯停靠的Q值函数;
(3)根据以下公式选择动作a:
Pr ( stop ) = e Q ( x , run ) / T e Q ( x , stop ) / T + e Q ( x , run ) / T
其中,T为温度参数且T>0;
(4)令电梯i的下一个决策点发生在ty时刻,其相应的状态为y,根据式
ΔR [ i ] = e - β ( t 0 - d [ i ] ) Σ b { 2 λ b ( 1 - e - β ( t 1 - t 0 ) ) β 4 + ( 2 β 3 + 2 w 0 ( b ) β 2 + w 0 2 ( b ) β )
- e - β ( t 1 - t 0 ) ( 2 β 3 + 2 w 1 ( b ) β 2 + w 1 2 ( b ) β ) + λ b [ ( 2 w 0 ( b ) β 3 + w 0 2 ( b ) β 2 + w 0 3 ( b ) 3 β ) -
e - β ( t 1 - t 0 ) ( 2 w 1 ( b ) β 3 + w 1 2 ( b ) β 2 + w 1 3 ( b ) 3 β ) ] } ,更新所有电梯的获得R[i]值,其中,R[i]为第i部电梯从其上一次决策时间点d[i]时开始累计的总折扣强化值,tθ为上一事件发生的时间,t1为当前事件发生的时间,对于每个在t0和t1之间有效的电梯呼叫键b而言,令w0(b)和w1(b)分别为t0和t1时刻按钮b按下后逝去的时间,式中β为指数衰减速率,λ为顾客的泊松到达率;
(5)电梯i根据式:
Q ( x , a ) ← R [ i ] + e - β ( t v - t x ) min a ′ ∈ { stop , cont } Q cmac ( y , a ′ ) 调节其Q(s,a)的估值;
(6)根据式:
ΔW = α [ R [ i ] + e - β ( t v - t x ) min a ′ ∈ { stop , cont } Q cmac ( y , a ′ , W ) - Q cmac ( x , a , W ) ] ▿ W Q cmac ( x , a , W ) 更新CMAC网络权值;
(7)将x←y,tx←ty..转至步骤1,从而实现群控电梯调度。

Claims (1)

1. 一种基于CMAC网络的群控电梯调度方法,其特征在于,该方法包括以下步骤:
(1)确定静态参数、动态参数、乘客到达模型、CMAC网络参数和强化学习参数,然后触发电梯群控系统,其中,静态参数为电梯数目和楼层数目,动态参数为层间运行时间、电梯停止/转向时间和乘客进出电梯时间,乘客到达模型参数为乘客到达时间分布,CMAC网络参数为输入节点、输出节点和泛化参数,强化学习参数为指数衰减速率β和学习率α;
(2)设在tx时刻电梯i到达一个决策点,观察得到状态为x,根据CMAC网络计算得出Q(x,run)和Q(x,stop),其中,Q(x,run)为在x状态下电梯继续运行的Q值函数,Q(x,stop)为电梯停靠的Q值函数;
(3)根据以下公式选择动作a:
Pr ( stop ) = e Q ( x , run ) / T e Q ( x , stop ) / T + e Q ( x , run ) / T
其中,T为温度参数且T>0;
(4)令电梯i的下一个决策点发生在ty时刻,其相应的状态为y,根据式
ΔR [ i ] = e - β ( t 0 - d [ i ] ) Σ b { 2 λ b ( 1 - e - β ( t 1 - t 0 ) ) β 4 + ( 2 β 3 + 2 w 0 ( b ) β 2 + w 0 2 ( b ) β )
- e - β ( t 1 - t 0 ) ( 2 β 3 + 2 w 1 ( b ) β 2 + w 1 2 ( b ) β ) + λ b [ ( 2 w 0 ( b ) β 3 + w 0 2 ( b ) β 2 + w 0 3 ( b ) 3 β ) -
e - β ( t 1 - t 0 ) ( 2 w 1 ( b ) β 3 + w 1 2 ( b ) β 2 + w 1 3 ( b ) 3 β ) ] } ,
更新所有电梯的获得R[i]值,其中,R[i]为第i部电梯从其上一次决策时间点d[i]时开始累计的总折扣强化值,t0为上一事件发生的时间,t1为当前事件发生的时间,对于每个在t0和t1之间有效的电梯呼叫键b而言,令w0(b)和w1(b)分别为t0和t1时刻按钮b按下后逝去的时间,式中β为指数衰减速率,λ为顾客的泊松到达率;
(5)电梯i根据式:
Q ( x , a ) ← R [ i ] + e - β ( t y - t x ) min a ′ ∈ { stop , cont } Q cmac ( y , a ′ )
调节其Q(s,a)的估值;
(6)根据式:
ΔW = α [ R [ i ] + e - β ( t y - t x ) min a ′ ∈ { stop , cont } Q cmac ( y , a ′ , W )
- Q cmac ( x , a , W ) ] ▿ W Q cmac ( x , a , W ) 更新CMAC网络权值;
(7)将x←y,tx←ty..转至步骤1,从而实现群控电梯调度。
CNB200610040554XA 2006-05-24 2006-05-24 基于cmac网络的群控电梯调度方法 Expired - Fee Related CN100413771C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB200610040554XA CN100413771C (zh) 2006-05-24 2006-05-24 基于cmac网络的群控电梯调度方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB200610040554XA CN100413771C (zh) 2006-05-24 2006-05-24 基于cmac网络的群控电梯调度方法

Publications (2)

Publication Number Publication Date
CN1857981A CN1857981A (zh) 2006-11-08
CN100413771C true CN100413771C (zh) 2008-08-27

Family

ID=37296943

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200610040554XA Expired - Fee Related CN100413771C (zh) 2006-05-24 2006-05-24 基于cmac网络的群控电梯调度方法

Country Status (1)

Country Link
CN (1) CN100413771C (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108408514B (zh) * 2018-03-14 2020-04-21 南京理工大学 一种多联机群控型电梯调度方法
CN109343532A (zh) * 2018-11-09 2019-02-15 中国联合网络通信集团有限公司 一种动态随机环境的路径规划方法和装置
CN110065855B (zh) * 2019-04-21 2024-01-23 苏州科技大学 多轿厢电梯控制方法及控制系统
CN110127464B (zh) * 2019-05-16 2021-09-17 永大电梯设备(中国)有限公司 一种基于动态优化的多目标电梯调度系统及方法
CN114348807B (zh) * 2022-02-15 2023-07-21 平安科技(深圳)有限公司 电梯调度方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004050522A1 (en) * 2002-11-29 2004-06-17 Kone Corporation Allocation method
CN1621332A (zh) * 2003-11-25 2005-06-01 因温特奥股份公司 电梯设备的工作方法和电梯控制装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004050522A1 (en) * 2002-11-29 2004-06-17 Kone Corporation Allocation method
CN1621332A (zh) * 2003-11-25 2005-06-01 因温特奥股份公司 电梯设备的工作方法和电梯控制装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
基于CMAC再励学习控制的电梯群控调度方法. 刘建昌,林琳.信息与控制,第34卷第4期. 2005
基于CMAC再励学习控制的电梯群控调度方法. 刘建昌,林琳.信息与控制,第34卷第4期. 2005 *
强化学习研究综述. 高阳,陈世福,陆鑫.自动化学报,第30卷第1期. 2004
强化学习研究综述. 高阳,陈世福,陆鑫.自动化学报,第30卷第1期. 2004 *

Also Published As

Publication number Publication date
CN1857981A (zh) 2006-11-08

Similar Documents

Publication Publication Date Title
CN100413771C (zh) 基于cmac网络的群控电梯调度方法
CN111753468B (zh) 基于深度强化学习的电梯系统自学习最优控制方法及系统
CN101807159B (zh) 一种自适应任务调度方法
CN106365003B (zh) 一种多轿厢电梯群的优化调度方法
EP1883873B1 (de) Verfahren zur koordination konkurrierender prozesse oder zur steuerung des transports von mobilen einheiten innerhalb eines netzwerkes
CN110703761B (zh) 一种基于事件触发的网络化自主车队调度与协同控制方法
CN101441441B (zh) 起重机智能防摇控制系统的设计方法
JP2664782B2 (ja) エレベータの群管理制御装置
Tartan et al. Optimization of waiting and journey time in group elevator system using genetic algorithm
CN111917642B (zh) 分布式深度强化学习的sdn网络智慧路由数据传输方法
CN114758497A (zh) 一种自适应停车场可变出入口控制方法、装置及存储介质
CN104527637B (zh) 混合动力汽车控制方法和系统
Hu et al. A multi-objective genetic algorithm designed for energy saving of the elevator system with complete information
Munoz et al. Distributed approach to group control of elevator systems using fuzzy logic and FPGA implementation of dispatching algorithms
CN106549805A (zh) 一种sdn网络架构及其通信方法
Liu et al. Dispatching algorithm design for elevator group control system with Q-learning based on a recurrent neural network
Zhang et al. The Application of the Fuzzy Neural Network Control in Elevator Intelligent Scheduling Simulation
Li et al. Adaptive dynamic neuro-fuzzy system for traffic signal control
Bayğin et al. A new intelligent group elevator control approach
JP2573722B2 (ja) エレベータ制御装置
CN110127464B (zh) 一种基于动态优化的多目标电梯调度系统及方法
Walczak et al. A distributed learning control system for elevator groups
Cao et al. Elevator group dynamic dispatching system based on artificial intelligent theory
Chen et al. GA based hybrid fuzzy rule optimization approach for elevator group control system
KR950001901B1 (ko) 엘리베이터 그룹 제어방법 및 그 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080827

Termination date: 20100524