CN111400796A - 一种基于Agent的室内应急疏散位置风险评估方法 - Google Patents
一种基于Agent的室内应急疏散位置风险评估方法 Download PDFInfo
- Publication number
- CN111400796A CN111400796A CN202010164331.4A CN202010164331A CN111400796A CN 111400796 A CN111400796 A CN 111400796A CN 202010164331 A CN202010164331 A CN 202010164331A CN 111400796 A CN111400796 A CN 111400796A
- Authority
- CN
- China
- Prior art keywords
- emergency
- safety
- building plan
- agent
- building
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012502 risk assessment Methods 0.000 title claims abstract description 47
- 238000011156 evaluation Methods 0.000 claims abstract description 34
- 238000013135 deep learning Methods 0.000 claims abstract description 22
- 239000002356 single layer Substances 0.000 claims abstract description 8
- 230000009471 action Effects 0.000 claims description 39
- 230000000694 effects Effects 0.000 claims description 27
- 230000007704 transition Effects 0.000 claims description 16
- 238000004088 simulation Methods 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 8
- 239000010410 layer Substances 0.000 claims description 4
- 230000008676 import Effects 0.000 claims description 2
- 238000007781 pre-processing Methods 0.000 claims description 2
- 230000007547 defect Effects 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 239000003795 chemical substances by application Substances 0.000 description 24
- 238000013461 design Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000006399 behavior Effects 0.000 description 8
- 238000005094 computer simulation Methods 0.000 description 8
- 238000011161 development Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/08—Construction
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于Agent的室内应急疏散位置风险评估方法,属于人工智能与智能代理技术领域。包括1)建筑平面图导入模块接收单层建筑平面图并对进行预处理,输出处理后的建筑平面图以及具体的应急情形,再等待外部命令,若外部命令是插入模拟应急安全事件,则跳至2),若外部命令时验证平面安全性,则跳至3);2)应急事件生成模块指定应急安全事件发生的位置,并根据应急安全事件性质改变应急安全事件发生位置处的格点状态、调整其与相邻格点连接的奖赏值;3)针对应急情形选择深度学习方法,反馈设计合理的安全性指标,输出平面整体的安全性评价指标。所述方法有效避免了人为制定刚性规则来化解室内应急疏散隐患时存在的缺陷。
Description
技术领域
本发明涉及一种基于Agent的室内应急疏散位置风险评估方法,属于人工智能与智能代理技术领域。
背景技术
现代生活中,建筑的存在与人的活动密不可分。形形色色的建筑为人们的经济社会生活提供了必要的基础设施和活动场所,成为人类社会不可或缺的重要底色。而工程技术的发展带来的基建能力提升,以及现代建筑美学思想的发展,亦促使具有不同功能的建筑衍生出多样的形制,在相当程度上丰富了人们的日常审美体验。
然而,建筑的设计建造不独关系到人们对于建筑功能的依赖。人在建筑中活动的安全性,特别是人在应急条件下进行疏散活动的安全性,应该是建筑设计者所关注的更加基础、更为关键的要素。
如今,对建筑应急安全评估问题的研究正吸引着越来越多相关领域研究人员的兴趣。而科学合理的建筑应急安全评估标准的设计与应用,则在这一问题的解决中处于核心地位。虽然建筑设计辅助工具在过去的十数年中得到了充分的发展,建筑设计师已经可以借助先进的计算机软件系统来完成复杂的设计过程,但建筑设计中对于应急安全评估的考量却十分缺乏。
通常,建筑设计师们仍仅通过在建筑设计中遵守某些人为制定的刚性规则来缓解他们对于可能建筑应急安全性存在的顾虑。然而,这一套方法正逐渐变得不再适用:一方面,建筑规模的扩大和结构的复杂化使得规则的运用变得比以往困难得多;另一方面,这种方法不具备刻画建筑内部人员在应急疏散情形下的复杂活动规律的能力,并且大多数基于经验的规则并不能对应急情形下的建筑安全情况进行量化评价,以指导进行疏散方案策划或建筑改造。进行应急疏散演习是另一种可能的建筑应急安全评估方案,但应急疏散演习只能在建筑建成后开展,我们无法将其作为一种设计辅助方案运用。此外,应急疏散演习还具有成本高、风险大、操作性弱等特点,将为相关研究引入更多难以解决的现实问题。现在,研究者们已经开始探索运用计算机仿真的方法来研究建筑应急安全评估问题。得益于计算机科学的发展,计算机对于现实世界的仿真模拟能力能力不断增强,研究者能够尝试运用计算机程序对应急疏散情形下建筑内人员活动的复杂性和不确定性进行量化建模,从而对人员的应急行为模式进行刻画与探讨[3]。目前来看,推动相关研究发展的动力主要有:(1)借助计算机仿真对应急情形下的人群行为理论假设进行验证的需求;(2)借助计算机仿真对所设计的建筑应急疏散策略有效性进行验证的需求;(3)借助计算机仿真对应急情形下可能出现的相关现象开展研究的需求。事实上,运用计算机程序对疏散情形进行仿真已经成为对应急疏散策略设计和规划过程中的重要工具。然而,大多数研究的关注点在于计算机程序对于真实世界中疏散行为仿真的精度,其关注点在于人以及人的行为。与之不同,本发明研究关注于应急疏散情形中人的行为对于建筑的投射。在合理地假定建筑的安全性对人在其中的疏散行为效果具有正向作用的基础上,我们尝试运用计算机进行应急疏散仿真,从而给出科学的建筑应急安全评估方法。
发明内容
本发明的目的在于针对现有室内应急疏散位置风险评估中对刚性规则的依赖性、难以通过对应急疏散情形下建筑内人员活动进行有效刻画来开展基于行为的室内应急疏散位置风险评估的技术缺陷,提出了一种基于Agent的室内应急疏散位置风险评估方法。
所述基于Agent的室内应急疏散位置风险评估方法依托的评估框架包括建筑平面图导入模块、应急安全评估模块、应急事件生成模块以及安全性指标输出模块;
其中,建筑平面图导入模块用于接收单层建筑平面图输入,允许研究者或建筑设计师逐层对建筑物进行安全性指标评价,具体地:该建筑平面图导入模块接受彩色或黑白的二维建筑平面图像,经过自动化处理将图像映射到指定大小的平面网格空间中,并划分出可通行区域、不可通行区域与出口;
应急安全评估模块是评估框架的核心,具体针对不同应急情形,采用Q-learning或Sarsa深度学习方法,反馈设计合理的安全性指标;
安全指标输出模块是评估框架的输出部分,其根据应急安全评估模块中采取方法的运行结果,计算并输出对所处理建筑平面的安全性指标,作为建筑应急安全评价的结果;让代理从每一个状态出发,根据所选择深度学习方法学习并执行疏散动作,直到到达出口为止;这时根据当前习得策略判断是否已达到最优疏散策略,并对习得策略为最优策略时代理总计执行疏散动作数目进行记录,将代理习得最优策略所消耗的动作数作为对该位置的一种安全性评价;所需动作数越少,则该位置越安全;为了抵消平面大小对数值带来的影响,用代理所需执行的动作数cx除以其到出口E的最短路径长dx作为对其安全性的评价指标,即Sx=cx/dx。进一步,以平面上所有Sx的均值S作为对平面整体的安全性评价指标。
应急事件生成模块允许研究者或建筑设计师在评估框架内模拟应急事件的发生,以便对真实应急疏散情形进行仿真;针对特定应急安全事件的模拟需要,在建筑平面图导入模块后选择是否在网格化的建筑平面图中加入对应急安全事件的模拟。
基于Agent的室内应急疏散位置风险评估方法,包括如下步骤:
步骤1:建筑平面图导入模块接收单层建筑平面图并对其进行预处理操作,输出处理后的建筑平面图以及具体的应急情形,再等待外部命令,若外部命令是插入模拟应急安全事件,则跳至步骤2,若外部命令时验证平面安全性,则跳至步骤3;
其中,预处理操作,包括如下子步骤:
步骤1.1将建筑平面图导入Netlogo仿真环境,建筑平面图预处理程序根据像素色彩取值与指定的网格空间大小将建筑平面图网格化、二值化;
其中,像素色彩取值也可以为灰度值;
步骤1.2根据网格化、二值化得到的建筑平面图进行划分,确定可通行区域、不可通行区域与出口;
步骤1.3根据步骤1.2对网格化建筑平面图不同区域的划分,为可通行区域与出口中的每一格点赋予一个状态,并在相邻可通行区域间、出口与出口相邻的可通行区域间建立连接,根据路径的性质赋予不同的奖赏值,输出处理后的建筑平面图以及具体的应急情形;
其中,建立连接,即建立路径;
步骤2:若需加入应急安全事件模拟,则应急事件生成模块在事件模拟的外部指令到来后,指定应急安全事件发生的位置,并根据应急安全事件性质改变应急安全事件发生位置处的格点状态、调整其与相邻格点连接的奖赏值;
步骤3:应急安全评估模块根据步骤1输出处理后的建筑平面图以及具体的应急情形,针对该应急情形选择深度学习方法,并反馈安全性指标,具体为:
步骤3.1 netlogo仿真环境根据处理后的平面图得到输入信息;
其中,输入信息包括根据处理后的平面图得到的平面状态空间X=G∪N∪E、代理动作空间A以及转移概率空间P,根据经验得到的转移奖赏空间R、奖赏折扣γ、更新步长α、探索概率ε,以及起始状态x0;
其中,G为可通行区域,N为不可通行区域,E为出口,起始状态x0为遍历平面图中任意一点作为一次起始状态;
步骤3.2依据应急情形选择深度学习方法,并将步骤3.1得到的输入信息输入深度学习方法中,输出安全性指标;
其中,安全性指标即动作数以及最短路径长;cx为从所有状态x∈X出发,代理欲习得最优疏散路径而所需执行的动作数;dx为从所有状态x∈X出发,到出口E的最短路径长;
步骤4:安全指标输出模块对建筑平面中各位置及总体的安全性进行评价,输出平面整体的安全性评价指标,具体包括如下子步骤:
步骤4.1计算所有状态x∈X的安全性评价指标Sx=cx/dx,;
步骤4.2计算所有Sx的均值S=1/|X|·∑x∈XSx作为对平面整体的安全性评价指标;
至此,经过步骤1到步骤4,完成了一种基于Agent的室内应急疏散位置风险评估方法。
有益效果
一种基于Agent的室内应急疏散位置风险评估方法,与现有的室内应急疏散位置风险评估方法相比,具有如下有益效果:
1.运用基于Agent的计算机仿真模拟技术开展室内应急疏散位置风险评估,有效避免了采用人为制定的刚性规则来化解室内应急疏散隐患时存在的缺陷,能够通过对建筑内部人员在应急疏散情形下的复杂活动规律的刻画,对应急情形下的建筑安全情况进行客观的量化评价;
2.运用基于Agent的计算机仿真模拟技术开展室内应急疏散位置风险评估,能够有效解决随着建筑规模的扩大和结构的复杂化,采用人为制定的刚性规则来化解室内应急疏散隐患时,规则的运用变得非常困难和难以解释的问题;
3.运用基于Agent的计算机仿真模拟技术开展室内应急疏散位置风险评估,有效规避了通过举办应急疏散演习来开展室内应急疏散位置风险评估时,存在的成本高、风险大、操作性弱等阻碍;
4.将深度学习方法运用于基于Agent的计算机仿真模拟中,作为开展室内应急疏散位置风险评估中对建筑内部人员在应急疏散情形下活动规律进行刻画的具体方式,能够有效地模拟建筑内部人员在应急疏散情形下对周围环境的认知学习与疏散行为的形成过程,为室内应急疏散位置风险评估提供良好的行为学视角方案。
附图说明
图1是所提基于Agent的室内应急疏散位置风险评估方法的结构说明图;
图2是采用Q-learning方法作为应急安全评估模块中使用的深度学习方法,对案例1(公寓楼层)开展室内应急疏散位置风险评估的效果展示;
图3是采用Q-learning方法作为应急安全评估模块中使用的深度学习方法,对案例2(办公楼层)开展室内应急疏散位置风险评估的效果展示;
图4是采用Q-learning方法作为应急安全评估模块中使用的深度学习方法,对案例3(医院楼层)开展室内应急疏散位置风险评估的效果展示;
图5是采用Sarsa方法作为应急安全评估模块中使用的深度学习方法,对案例1(公寓楼层)开展室内应急疏散位置风险评估的效果展示;
图6是采用Sarsa方法作为应急安全评估模块中使用的深度学习方法,对案例2(办公楼层)开展室内应急疏散位置风险评估的效果展示;
图7是采用Sarsa方法作为应急安全评估模块中使用的深度学习方法,对案例3(医院楼层)开展室内应急疏散位置风险评估的效果展示;
其中,对各案例风险评估效果的展示方式具体采用灰度图的方式直观展示。
具体实施方式
下面结合附图和实施例对本发明做进一步说明和详细描述。
实施例1
本实施例详细阐述了本发明基于Agent的室内应急疏散位置风险评估方法,如图1所示。图中,建筑平面图导入后,在应急事件生驱动下进行应急安全评估,输出安全性指标。具体实施时,如发明内容中的步骤所述。
其中,步骤1执行完后,根据研究者的需求,若需要插入事件,则执行步骤2;插入的事件可以为在平面内随机位置放入着火点或者平面塌陷造成原可通行路径被阻碍。
执行步骤3,采用Q-learning方法作为应急安全评估模块中使用的深度学习方法,并在3个真实案例中开展室内应急疏散位置风险评估的效果展示。Q-learning深度学习方法的具体操作为:
输入:平面状态空间X=G∪N∪E,代理动作空间A,转移概率空间P,转移奖赏空间R;起始状态x0;奖赏折扣γ;更新步长α;探索概率ε;
第一步.给定输入为平面状态空间X=G∪N∪E(其中G为可通行区域,N为不可通行区域,E为出口),代理动作空间A,转移概率空间P,转移奖赏空间R;起始状态x0;奖赏折扣γ;更新步长α;探索概率ε。
第二步.对任意的状态x∈X,计算其到出口E的最短路径px,记录其对应的最短路径长dx。
第三步.对每一状态x∈X,以t=1,2,...为时间步开始循环,执行下述操作,直到达到循环终止条件。
第四步.令起始状态为x0=x,总累计执行动作数cx=0。
第五步.从起始状态出发,按1-ε概率执行策略π,对应动作为a=πε(x),表示按ε概率随机选取动作时得到的动作。
第七步.从转移后状态x′出发执行策略π,对应动作为a′=π(x′)。
第八步.按下式更新状态-动作值函数
Q(x,a)=Q(x,a)+α(r+γQ(x′,a′)-Q(x,a))
第九步.根据更新后的状态-动作值函数,按下式更新策略π
π(x)=argmaxa″Q(x,a″)
第十步.更新起始状态为x=x′,更新累计执行动作数c=c+1。
第十一步.若当前起始状态x∈E,即代理到达出口,则停止并跳出循环。
第十二步.输出学习得到的最终策略π以及累积执行动作数c。
第十三步.根据习得策略π生成疏散路径pπ=x0→x1…→xe∈E。
第十四步.若疏散路径为最短路径,即pπ=px,则累加总累计执行动作数cx=cx+c,达到终止条件,停止当前循环并执行后续循环。
第十五步.输出为习得最优疏散路径代理所需执行的动作数cx。
图2是案例1(公寓楼层)的室内应急疏散位置风险评估的效果展示。其原始平面设计图如图2左部所示,经由Netlogo处理得到的网格平面空间如图2中部所示,其大小为30x30,图中网格颜色所代表的意义:黑色的部分代表不可通行区域N,包括墙与空间中间的十字形障碍物,白色的部分代表可通行区域G,灰色的部分代表出口E。图2右部展示了运用Q-learning方法的应急安全评估模块进行室内应急疏散位置风险评估所得到网格平面空间中的安全性指标分布,其中在网格平面空间生成的灰度图中,灰度越深代表该位置的安全性风险越高;灰度越浅代表该位置的安全性风险越低。
在实验中,设置可通行区域间移动的奖赏为-1,从可通行区域到达出口的奖赏为10。对Q-learning方法,设置奖赏折扣γ=0.9;更新步长α=0.1;探索概率ε=0.2,得到总体安全性指标为986.456。
图3是案例2(办公楼层)的室内应急疏散位置风险评估的效果展示。原始平面设计图如图3上部所示,经由Netlogo处理得到的网格平面空间如图3下左部所示,其大小为60x60。图中网格颜色所代表的意义:黑色的部分代表不可通行区域N,包括墙与空间中间的十字形障碍物,白色的部分代表可通行区域G,灰色的部分代表出口E。图3下右部展示了运用Q-learning方法的应急安全评估模块进行室内应急疏散位置风险评估所得到网格平面空间中的安全性指标分布,其中在网格平面空间生成的灰度图中,灰度越深代表该位置的安全性风险越高;灰度越浅代表该位置的安全性风险越低。
在实验中,设置可通行区域间移动的奖赏为-1,从可通行区域到达出口的奖赏为15。对Q-learning方法,设置奖赏折扣γ=0.9;更新步长α=0.1;探索概率ε=0.2,得到总体安全性指标为7699.473。
图4是案例3(医院楼层)的室内应急疏散位置风险评估的效果展示。在第三个案例研究中,我们考虑面积更大一些的的医院楼层平面。其原始平面设计图如4上部所示,经由Netlogo处理得到的网格平面空间如图4下左部所示,其大小为100x100。图4下右部展示了运用Q-learning方法的应急安全评估模块进行室内应急疏散位置风险评估所得到网格平面空间中的安全性指标分布,其中在网格平面空间生成的灰度图中,灰度越深代表该位置的安全性风险越高;灰度越浅代表该位置的安全性风险越低。
在实验中,设置可通行区域间移动的奖赏为-1,从可通行区域到达出口的奖赏为15。对Q-learning方法,设置奖赏折扣γ=0.9;更新步长α=0.1;探索概率ε=0.2,得到总体安全性指标为8201.441。
实施例2
本实施例详细阐述了本发明基于Agent的室内应急疏散位置风险评估方法具体实施时,采用Sarsa方法作为应急安全评估模块中使用的深度学习方法,并在3个真实案例中开展室内应急疏散位置风险评估的效果展示。Sarsa深度学习方法的具体操作为:
输入:平面状态空间X=G∪N∪E,代理动作空间A,转移概率空间P,转移奖赏空间R;起始状态x0;奖赏折扣γ;更新步长α;探索概率ε;。
第一步.给定输入为平面状态空间X=G∪N∪E(其中G为可通行区域,N为不可通行区域,E为出口),代理动作空间A,转移概率空间P,转移奖赏空间R;起始状态x0;奖赏折扣γ;更新步长α;探索概率ε。
第二步.对任意的状态x∈X,计算其到出口E的最短路径px,记录其对应的最短路径长dx。
第三步.对每一状态x∈X,以t=1,2,...为时间步开始循环,执行下述操作,直到达到循环终止条件。
第四步.令起始状态为x0=x,总累计执行动作数cx=0。
第五步.从起始状态出发,执行策略π,对应动作为a=π(x),表示按ε概率随机选取动作时得到的动作。
第七步.从转移后状态x′出发按1-ε概率执行策略π,对应动作为a′=πε(x′),表示按ε概率随机选取动作时得到的动作。
第八步.按下式更新状态-动作值函数
Q(x,a)=Q(x,a)+α(r+γQ(x′,a′)-Q(x,a))
第九步.根据更新后的状态-动作值函数,按下式更新策略π
π(x)=argmaxa″Q(x,a″)
第十步.更新起始状态为x=x′,动作为a=a′,更新累计执行动作数c=c+1。
第十一步.若当前起始状态x∈E,即代理到达出口,则停止并跳出循环。
第十二步.输出学习得到的最终策略π以及累积执行动作数c。
第十三步.根据习得策略π生成疏散路径pπ=x0→x1…→xe∈E。
第十四步.若疏散路径为最短路径,即pπ=px,则累加总累计执行动作数cx=cx+c,达到终止条件,停止当前循环并执行后续循环。
第十五步.输出为习得最优疏散路径代理所需执行的动作数cx。
图5是案例1(公寓楼层)的室内应急疏散位置风险评估的效果展示。其原始平面设计图如图5左部所示,经由Netlogo处理得到的网格平面空间如图5中部所示,其大小为30x30,图中网格颜色所代表的意义:黑色的部分代表不可通行区域N,包括墙与空间中间的十字形障碍物,白色的部分代表可通行区域G,灰色的部分代表出口E。图5右部展示了运用Sarsa方法的应急安全评估模块进行室内应急疏散位置风险评估所得到网格平面空间中的安全性指标分布,其中在网格平面空间生成的灰度图中,灰度越深代表该位置的安全性风险越高;灰度越浅代表该位置的安全性风险越低。
在实验中,设置可通行区域间移动的奖赏为-1,从可通行区域到达出口的奖赏为10。对Sarsa方法,设置奖赏折扣γ=0.9;更新步长α=0.1;探索概率ε=0.2,得到总体安全性指标为995.928。
图6是案例2(办公楼层)的室内应急疏散位置风险评估的效果展示。原始平面设计图如图6上部所示,经由Netlogo处理得到的网格平面空间如图6下左部所示,其大小为60x60。图中网格颜色所代表的意义:黑色的部分代表不可通行区域N,包括墙与空间中间的十字形障碍物,白色的部分代表可通行区域G,灰色的部分代表出口E。图6下右部展示了运用Sarsa方法的应急安全评估模块进行室内应急疏散位置风险评估所得到网格平面空间中的安全性指标分布,其中在网格平面空间生成的灰度图中,灰度越深代表该位置的安全性风险越高;灰度越浅代表该位置的安全性风险越低。
在实验中,设置可通行区域间移动的奖赏为-1,从可通行区域到达出口的奖赏为15。对Sarsa方法,设置奖赏折扣γ=0.9;更新步长α=0.1;探索概率ε=0.2,得到总体安全性指标为8146.502。
图7是案例3(医院楼层)的室内应急疏散位置风险评估的效果展示。在第三个案例研究中,我们考虑面积更大一些的医院楼层平面。其原始平面设计图如7上部所示,经由Netlogo处理得到的网格平面空间如图7下左部所示,其大小为100x100。图7下右部展示了运用Sarsa方法的应急安全评估模块进行室内应急疏散位置风险评估所得到网格平面空间中的安全性指标分布,其中在网格平面空间生成的灰度图中,灰度越深代表该位置的安全性风险越高;灰度越浅代表该位置的安全性风险越低。
在实验中,设置可通行区域间移动的奖赏为-1,从可通行区域到达出口的奖赏为15。对Sarsa方法,设置奖赏折扣γ=0.9;更新步长α=0.1;探索概率ε=0.2,得到总体安全性指标为8216.973。
以上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。
Claims (6)
1.一种基于Agent的室内应急疏散位置风险评估方法,其特征在于:依托的评估框架包括建筑平面图导入模块、应急安全评估模块、应急事件生成模块以及安全性指标输出模块;
其中,建筑平面图导入模块用于接收单层建筑平面图输入,允许研究者或建筑设计师逐层对建筑物进行安全性指标评价,具体地:该建筑平面图导入模块接受彩色或黑白的二维建筑平面图像,经过自动化处理将图像映射到指定大小的平面网格空间中,并划分出可通行区域、不可通行区域与出口;
应急安全评估模块是评估框架的核心,具体针对不同应急情形,采用Q-learning或Sarsa深度学习方法,反馈设计合理的安全性指标;
安全指标输出模块是评估框架的输出部分,其根据应急安全评估模块中采取方法的运行结果,计算并输出对所处理建筑平面的安全性指标,作为建筑应急安全评价的结果;让代理从每一个状态出发,根据所选择深度学习方法学习并执行疏散动作,直到到达出口为止;这时根据当前习得策略判断是否已达到最优疏散策略,并对习得策略为最优策略时代理总计执行疏散动作数目进行记录,将代理习得最优策略所消耗的动作数作为对该位置的一种安全性评价;所需动作数越少,则该位置越安全;为了抵消平面大小对数值带来的影响,用代理所需执行的动作数cx除以其到出口E的最短路径长dx作为对其安全性的评价指标,即Sx=cx/dx;进一步,以平面上所有Sx的均值S作为对平面整体的安全性评价指标;
应急事件生成模块允许研究者或建筑设计师在评估框架内模拟应急事件的发生,以便对真实应急疏散情形进行仿真;针对特定应急安全事件的模拟需要,在建筑平面图导入模块后选择是否在网格化的建筑平面图中加入对应急安全事件的模拟;
所述应急疏散位置风险评估方法,包括如下步骤:
步骤1:建筑平面图导入模块接收单层建筑平面图并对其进行预处理操作,输出处理后的建筑平面图以及具体的应急情形,再等待外部命令,若外部命令是插入模拟应急安全事件,则跳至步骤2,若外部命令时验证平面安全性,则跳至步骤3;
步骤2:若需加入应急安全事件模拟,则应急事件生成模块在事件模拟的外部指令到来后,指定应急安全事件发生的位置,并根据应急安全事件性质改变应急安全事件发生位置处的格点状态、调整其与相邻格点连接的奖赏值;
步骤3:应急安全评估模块根据步骤1输出处理后的建筑平面图以及具体的应急情形,针对该应急情形选择深度学习方法,并反馈安全性指标;
其中,安全性指标即动作数以及最短路径长;cx为从所有状态出发,代理欲习得最优疏散路径而所需执行的动作数;dx为从所有状态出发,到出口E的最短路径长;
步骤4:安全指标输出模块对建筑平面中各位置及总体的安全性进行评价,输出平面整体的安全性评价指标,具体包括如下子步骤:
步骤4.1计算所有状态的安全性评价指标Sx=cx/dx,;
步骤4.2计算所有Sx的均值作为对平面整体的安全性评价指标。
2.根据权利要求1所述的一种基于Agent的室内应急疏散位置风险评估方法,其特征在于:步骤1中,预处理操作,包括如下子步骤:
步骤1.1将建筑平面图导入Netlogo仿真环境,建筑平面图预处理程序根据像素色彩取值与指定的网格空间大小将建筑平面图网格化、二值化;
步骤1.2根据网格化、二值化得到的建筑平面图进行划分,确定可通行区域、不可通行区域与出口;
步骤1.3根据步骤1.2对网格化建筑平面图不同区域的划分,为可通行区域与出口中的每一格点赋予一个状态,并在相邻可通行区域间、出口与出口相邻的可通行区域间建立连接,根据路径的性质赋予不同的奖赏值,输出处理后的建筑平面图以及具体的应急情形。
3.根据权利要求2所述的一种基于Agent的室内应急疏散位置风险评估方法,其特征在于:步骤1.1中,像素色彩取值也可以为灰度值。
4.根据权利要求2所述的一种基于Agent的室内应急疏散位置风险评估方法,其特征在于:步骤1.3中,建立连接,即建立路径。
5.根据权利要求1所述的一种基于Agent的室内应急疏散位置风险评估方法,其特征在于:步骤3,具体为:
步骤3.1netlogo仿真环境根据处理后的平面图得到输入信息;
步骤3.2依据应急情形选择深度学习方法,并将步骤3.1得到的输入信息输入深度学习方法中,输出安全性指标。
6.根据权利要求5所述的一种基于Agent的室内应急疏散位置风险评估方法,其特征在于:步骤3.1得到的输入信息包括根据处理后的平面图得到的平面状态空间X=G∪N∪E、代理动作空间A以及转移概率空间P,根据经验得到的转移奖赏空间R、奖赏折扣γ、更新步长α、探索概率ε,以及起始状态x0;
其中,G为可通行区域,N为不可通行区域,E为出口,起始状态x0为遍历平面图中任意一点作为一次起始状态。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010164331.4A CN111400796B (zh) | 2020-03-11 | 2020-03-11 | 一种基于Agent的室内应急疏散位置风险评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010164331.4A CN111400796B (zh) | 2020-03-11 | 2020-03-11 | 一种基于Agent的室内应急疏散位置风险评估方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111400796A true CN111400796A (zh) | 2020-07-10 |
CN111400796B CN111400796B (zh) | 2022-03-01 |
Family
ID=71434162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010164331.4A Active CN111400796B (zh) | 2020-03-11 | 2020-03-11 | 一种基于Agent的室内应急疏散位置风险评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111400796B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220141576A (ko) * | 2021-04-13 | 2022-10-20 | 한기성 | 머신 러닝을 활용한 피난 경로 시뮬레이션 장치 및 학습 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080046134A1 (en) * | 2005-04-25 | 2008-02-21 | The Boeing Company | Evacuation route planning tool |
CN101515309A (zh) * | 2009-04-07 | 2009-08-26 | 华中科技大学 | 基于多智能体的城市应急疏散仿真系统 |
US20170161859A1 (en) * | 2014-08-26 | 2017-06-08 | Swiss Reinsurance Company Ltd. | Disaster risk management and financing system, and corresponding method thereof |
US20180247382A1 (en) * | 2015-01-29 | 2018-08-30 | Jtb Corp. | Risk information distribution device and risk information distribution method |
CN109086550A (zh) * | 2018-08-27 | 2018-12-25 | 山东师范大学 | 基于多Agent共享Q学习的疏散仿真方法及系统 |
-
2020
- 2020-03-11 CN CN202010164331.4A patent/CN111400796B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080046134A1 (en) * | 2005-04-25 | 2008-02-21 | The Boeing Company | Evacuation route planning tool |
CN101515309A (zh) * | 2009-04-07 | 2009-08-26 | 华中科技大学 | 基于多智能体的城市应急疏散仿真系统 |
US20170161859A1 (en) * | 2014-08-26 | 2017-06-08 | Swiss Reinsurance Company Ltd. | Disaster risk management and financing system, and corresponding method thereof |
US20180247382A1 (en) * | 2015-01-29 | 2018-08-30 | Jtb Corp. | Risk information distribution device and risk information distribution method |
CN109086550A (zh) * | 2018-08-27 | 2018-12-25 | 山东师范大学 | 基于多Agent共享Q学习的疏散仿真方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220141576A (ko) * | 2021-04-13 | 2022-10-20 | 한기성 | 머신 러닝을 활용한 피난 경로 시뮬레이션 장치 및 학습 방법 |
KR102521990B1 (ko) | 2021-04-13 | 2023-04-14 | 한기성 | 머신 러닝을 활용한 피난 경로 시뮬레이션 장치 및 학습 방법 |
Also Published As
Publication number | Publication date |
---|---|
CN111400796B (zh) | 2022-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xie et al. | Learning and teaching engineering design through modeling and simulation on a CAD platform | |
Brown | Design performance and designer preference in an interactive, data-driven conceptual building design scenario | |
Shih et al. | Elementary school student’s acceptance of Lego NXT: The technology acceptance model, a preliminary investigation | |
García-Magariño et al. | TABSAOND: A technique for developing agent-based simulation apps and online tools with nondeterministic decisions | |
Xie et al. | On the instructional sensitivity of CAD logs | |
McComb et al. | A conceptual framework for multidisciplinary design research with example application to agent-based modeling | |
CN101419623B (zh) | 地理模拟优化系统 | |
Von Richthofen et al. | The ‘Urban Elements’ method for teaching parametric urban design to professionals | |
Qudrat-Ullah | Debriefing can reduce misperceptions of feedback: The case of renewable resource management | |
CN111400796B (zh) | 一种基于Agent的室内应急疏散位置风险评估方法 | |
Yankovskaya et al. | Family of 2-simplex cognitive tools and their application for decision-making and its justifications | |
McGregor et al. | Interactive visualization for testing markov decision processes: MDPVIS | |
Smajgl et al. | Visions, beliefs and transformation: Methods for understanding cross-scale and trans-boundary dynamics in the wider Mekong region | |
Yilmaz et al. | Panel discussion: What makes good research in modeling and simulation: Sustaining the growth and vitality of the M&S discipline | |
Chipulu et al. | Investigating cultural and structural influences on optimizing engineer-to-order project delivery and sustainability | |
Tauscher et al. | Area cartograms in building product model visualization | |
Abou-Ibrahim et al. | Understanding Stakeholders' impact on design workflow dynamics using agent-based modeling | |
Bunt | Progression of Designer Behavior when Exploring Digital Building Design Spaces | |
Taylor et al. | Student modeling & simulation projects in healthcare: experiences with Hillingdon Hospital | |
Feng et al. | Application of Multi-agent System in Land Use Decision-Making of Industrial Park: A Case Study of Tianfo Health Industrial Park, Shandong | |
Zamora et al. | Campus information model: A participatory design tool to support qualitative decision making | |
Shan et al. | Research on Computer Aided Urban Space Environment Design | |
Zhang et al. | College English Education's Innovative Path Integrating Environmental Protection Literacy Training with E-Learning | |
Janssen et al. | GENERATING URBAN FORM | |
Martinez-Gil et al. | A Reinforcement Learning Approach for Multiagent Navigation. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |