CN114219228A - 一种基于em聚类算法的体育场疏散评价方法 - Google Patents

一种基于em聚类算法的体育场疏散评价方法 Download PDF

Info

Publication number
CN114219228A
CN114219228A CN202111405168.7A CN202111405168A CN114219228A CN 114219228 A CN114219228 A CN 114219228A CN 202111405168 A CN202111405168 A CN 202111405168A CN 114219228 A CN114219228 A CN 114219228A
Authority
CN
China
Prior art keywords
evacuation
stadium
data
algorithm
weighted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111405168.7A
Other languages
English (en)
Inventor
刘莹
孙澄
谭金颖
孙立博
甄蒙
杨阳
刘芳芳
刘敏
王欢
唐征征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Institute of Technology
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN202111405168.7A priority Critical patent/CN114219228A/zh
Publication of CN114219228A publication Critical patent/CN114219228A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • G06Q50/265Personal security, identity or safety

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Security & Cryptography (AREA)
  • Alarm Systems (AREA)

Abstract

本发明是一种基于EM聚类算法的体育场疏散评价方法,本发明采用K最邻近算法,将新发现的因素合理分类,使得在收集影响疏散因素方面更全面也可以简化庞杂的数据。影响体育场疏散因素指标权重主要以专家预测来决定,具有一定的经验惯性,不够客观,本发明采用PageRank算法加权重,使评价结果具有客观性。面对现在处理体育场疏散评价的算法在实现靠近真实结果时,越复杂,对计算需要时间成本和性能成本高的窘境,本发明提出采用EM聚合算法综合处理数据,即避免使用神经网络使算法复杂,又能高效地得出最优的体育场疏散评价结果。

Description

一种基于EM聚类算法的体育场疏散评价方法
技术领域
本发明涉及建筑安全与疏散评价技术领域,是一种基于EM聚类算法的体育场疏散评价方法。
背景技术
体育场作为大型公共建筑,其有着建造成本高、结构计算复杂、建筑多功能的特点。同时,体育场属于人群密集的场所,体育场疏散也在很大程度上影响着体育场建造成本、结构计算、功能排布。所以,对体育场准确、客观、高效的评价将不仅保证体育场内的安全疏散,还能对体育场设计在建造、结构、功能排布上提供优化建议。
现有对体育场疏散评价方法主要流程为建立因素评判集、建立评语集、确定评价指标的权重、确定评价算法、最终评价结果的确定。在建立因素评判集时,现有评价方法只取重要因素,无法做到全面研究,因为一旦因素考虑越多评价方法就复杂也越困难,亟需寻找合适的解决方法。在确定评价指标的权重时,指标权重主要以专家预测来决定,具有一定的经验惯性,不够客观,且采用单一层次分析法确定权重,导致权重计算精度不够。在确定评价算法方面,现有方法使用的算法有AHP、熵权法、灰色关联度分析法、模糊综合评价法、神经网络法、贝叶斯网络法等,这些算法在实现靠近真实结果时,算法就越复杂,对计算需要时间成本和性能成本,存在着弊端,亟需改进。
发明内容
本发明针对目前体育场评价的各种弊端,本发明的目的在于提供了一种更高效、更全面、更客观、更准确的基于EM聚类算法的体育场疏散评价方法。
本发明提供了一种基于EM聚类算法的体育场疏散评价方法,本发明提供了以下技术方案:
一种基于EM聚类算法的体育场疏散评价方法,所述方法包括以下步骤:
步骤1:建立影响体育场疏散的因素集;
步骤2:采用k最邻近算法对评判因素集进行分类处理;
步骤3:对分类完的评判因素对的体育场疏散进行量化打分,形成映射评语集;
步骤4:采用PageRank算法对评语集的数据的重要程度进行判断加权得到数据矩阵R,对应因素集计算得到加权后评语聚类簇的均值μj和方差Σi
步骤5:将评分簇的均值μ和协方差矩阵作为期望最大化EM算法中第j个高斯模型的初始量,并引入训练集的类先验信息;
步骤6:通过EM聚合算法获取均值和方差,得到最优评分期望。
优选地,所述步骤1具体为:
将因素分为建筑设计因素、疏散设备因素、疏散管理因素和人群行为因素,建筑设计因素分为形体因素、流线因素、构成因素三个子类,疏散设备因素分为应急照明系统、灯光疏散指示系统、广播疏散系统、火灾自动报警系统四个子类,疏散管理因素分为维护管理、日常管理两个子类,人群行为因素分为惯性行为、突发行为两个子类,上述分类作为初始分类集。
优选地,所述步骤2具体为:
步骤2.1:根据输入的影响体育场疏散因素与各个初始分类集之间相似度来定义因素和初始分类集里的距离;
步骤2.2:按照距离的递增关系进行排序;
步骤2.3:选取距离最小的K个点;
步骤2.4:确定前K个点所在类别的出现频率;
步骤2.5:返回前K个点中出现频率最高的类别作为影响体育场疏散因素的预测分类。
优选地,所述步骤3具体为:
针对已经分类好的评判因素对现有的体育场进行量化打分,评分通过安全等级来评;评分采用百分制,为使评分趋于准确,将以十分作为一个区间,划分为十个等级,以此避免评分的两极分化;这十个等级分别为非常安全、比较安全、一般安全、稍微安全、稍微不安全、一般不安全、比较不安全、不安全、很不安全,对应[90,100]、[80,90]、[70,80]、[60,70]、[50,60]、[40,50]、[30,40]、[20,30]、[10,20]、[0,10]评分区间;所得到的数据集即为因素集关于安全等级评判的映射,组成体育场疏散评语聚类簇的空间矩阵N。
优选地,所述步骤4具体为:
步骤4.1:将体育场疏散评语聚类簇的空间矩阵N作为PageRank算法里的含i×j个结点的有向图,平稳分布R为这个有向图的PageRank值;
步骤4.2:令t=0,计算
Figure BDA0003371999180000031
当Rt+1与Rt充分接近,令Rt+1=Rt停止迭代;
步骤4.3:否则t=t+1,执行步骤4.2;
步骤4.4:最后得到体育场疏散评语聚类簇的空间矩阵N的PageRank向量R;
步骤4.5:对体育场疏散评语集的数据的重要程度进行判断加权得到的数据矩阵R,通过下式表示:
Figure BDA0003371999180000032
步骤4.6:计算得到数据矩阵R的得到每个加权体育场疏散评语聚类簇的均值μj和方差Σi
优选地,步骤五具体为:
将评分簇的均值μ和协方差矩阵作为期望最大化EM算法中第j个高斯模型的初始量,通过下式表示出事量θ:
θ={μ(θ),∑,(θ)|1≤j≤M},
引入所述训练集的类先验信息;使用EM聚合算法综合处理体育场疏散评价数据,首先将步骤4处理得到影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R作为初始化数据,即将评分簇的均值μj和协方差矩阵Σi作为期望最大化EM算法中第j个高斯模型的初始;
构建关于所述数据矩阵R的高斯混合模型的条件密度函数,通过最大化高斯混合模型的条件密度函数中参数θ的似然函数获取E步公式和M步公式。
优选地,关于数据矩阵R中数据x的高斯混合模型的条件密度函数为:
Figure BDA0003371999180000041
其中,C为影响体育场疏散因素集中第k个因素类别,x为数据矩阵R中的数据,γ为期望最大化EM算法中高斯混合模型与类C间的近似度,π为类C属于期望最大化EM算法中高斯混合模型的概率,θ为唯一标识x的高斯模型的参数,包括均值和协方差,θj为第j个高斯模型的均值和协方差参数,p(x|j;θ)为训练子集x属于第j个高斯模型的条件概率,πjk为Ck数据的第j个高斯模型的概率,满足
Figure BDA0003371999180000042
γjk为第j个高斯模型与Ck数据间的近似度,满足
Figure BDA0003371999180000043
将均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入上式可得:
Figure BDA0003371999180000044
优选地,所述步骤6具体为:
步骤6.1:输入初始化参数θ(0),即为影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi
步骤6.2:执行EM聚合算法中的E步计算,利用当前参数θ(t)计算Q函数,表达式为:
Figure BDA0003371999180000051
步骤6.3:执行EM聚合算法中的M步计算,极大化Q函数,求出相应的θ=argmaxQ(θ,θ(t));
步骤四:重复上述步骤6.3和步骤6.3,直至收敛,输出疏散评价系统最优解。
优选地,EM迭代方程中E步按照下式得到数据矩阵R的最大期望值Z(i)
Figure BDA0003371999180000052
设当t=i时,迭代计算完成,则上式可转换成:
Figure BDA0003371999180000053
将均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入式(6)可得:
Figure BDA0003371999180000054
其中,i表示迭代次数,X表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R,隐变量Z表示最后体育场疏散评分结果,x(i)表示第i个加权体育场疏散评价数据的特征向量,μj表示第i个加权体育场疏散评价数据的均值向量,
Figure BDA0003371999180000061
表示第i个加权体育场疏散评价数据的协方差矩阵,p(x(i),z(i)j,Σi)表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率,Qi(z(i))表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率值。
优选地,EM迭代方程中M步按照下式得到最大化步骤:
θ=argmaxQ(θ,θ(t)) (7)
将影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入式(7)可得:
Figure BDA0003371999180000062
Figure BDA0003371999180000063
其中,i表示迭代次数,X表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R,隐变量Z表示最后体育场疏散评分结果,x(i)表示第i个加权体育场疏散评价数据的特征向量,μj表示第i个加权体育场疏散评价数据的均值向量,
Figure BDA0003371999180000064
表示第i个加权体育场疏散评价数据的协方差矩阵,p(x(i),z(i)j,Σi)表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率,Qi(z(i))表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率值。
本发明具有以下有益效果:
实际体育场工程项目中影响体育场疏散的因素众多,且不同项目影响因素也会可能不一样或是会发现新影响因素,本发明采用K最邻近算法,将新发现的因素合理分类,使得在收集影响疏散因素方面更全面也可以简化庞杂的数据。b.影响体育场疏散因素指标权重主要以专家预测来决定,具有一定的经验惯性,不够客观,本发明采用PageRank算法加权重,使评价结果具有客观性。c.面对现在处理体育场疏散评价的算法在实现靠近真实结果时,越复杂,对计算需要时间成本和性能成本高的窘境,本发明提出采用EM聚合算法综合处理数据,即避免使用神经网络使算法复杂,又能高效地得出最优的体育场疏散评价结果。
附图说明
图1为图1为本发明一种基于EM聚类算法的体育场疏散评价方法的流程图;
图2为本发明对于影响体育馆疏散因素初始分类集的图示表示;
图3为本发明采用k最邻近算法对新输入的因素进行分类处理的流程图;
图4为本发明采用PageRank算法对评语集的数据的重要程度进行判断加权的流程图;
图5为本发明采用EM聚合算法综合数据处理的流程图。
具体实施方式
以下结合具体实施例,对本发明进行了详细说明。
具体实施例一:
根据图1至图5所示,本发明为解决上述技术问题采取的具体优化技术方案是:
一种基于EM聚类算法的体育场疏散评价方法,所述方法包括以下步骤:
步骤1:建立影响体育场疏散的因素集;
所述步骤1具体为:
将因素分为建筑设计因素、疏散设备因素、疏散管理因素和人群行为因素,建筑设计因素分为形体因素、流线因素、构成因素三个子类,疏散设备因素分为应急照明系统、灯光疏散指示系统、广播疏散系统、火灾自动报警系统四个子类,疏散管理因素分为维护管理、日常管理两个子类,人群行为因素分为惯性行为、突发行为两个子类,上述分类作为初始分类集。
步骤2:采用k最邻近算法对评判因素集进行分类处理;
所述步骤2具体为:
步骤2.1:根据输入的影响体育场疏散因素与各个初始分类集之间相似度来定义因素和初始分类集里的距离;
步骤2.2:按照距离的递增关系进行排序;
步骤2.3:选取距离最小的K个点;
步骤2.4:确定前K个点所在类别的出现频率;
步骤2.5:返回前K个点中出现频率最高的类别作为影响体育场疏散因素的预测分类。
步骤3:对分类完的评判因素对的体育场疏散进行量化打分,形成映射评语集;
所述步骤3具体为:
针对已经分类好的评判因素对现有的体育场进行量化打分,评分通过安全等级来评;评分采用百分制,为使评分趋于准确,将以十分作为一个区间,划分为十个等级,以此避免评分的两极分化;这十个等级分别为非常安全、比较安全、一般安全、稍微安全、稍微不安全、一般不安全、比较不安全、不安全、很不安全,对应[90,100]、[80,90]、[70,80]、[60,70]、[50,60]、[40,50]、[30,40]、[20,30]、[10,20]、[0,10]评分区间;所得到的数据集即为因素集关于安全等级评判的映射,组成体育场疏散评语聚类簇的空间矩阵N。
步骤4:采用PageRank算法对评语集的数据的重要程度进行判断加权得到数据矩阵R,对应因素集计算得到加权后评语聚类簇的均值μj和方差Σi
所述步骤4具体为:
步骤4.1:将体育场疏散评语聚类簇的空间矩阵N作为PageRank算法里的含i×j个结点的有向图,平稳分布R为这个有向图的PageRank值;
步骤4.2:令t=0,计算
Figure BDA0003371999180000091
当Rt+1与Rt充分接近,令Rt+1=Rt停止迭代;
步骤4.3:否则t=t+1,执行步骤4.2;
步骤4.4:最后得到体育场疏散评语聚类簇的空间矩阵N的PageRank向量R;
步骤4.5:对体育场疏散评语集的数据的重要程度进行判断加权得到的数据矩阵R,通过下式表示:
Figure BDA0003371999180000092
步骤4.6:计算得到数据矩阵R的得到每个加权体育场疏散评语聚类簇的均值μj和方差Σi
步骤5:将评分簇的均值μ和协方差矩阵作为期望最大化EM算法中第j个高斯模型的初始量,并引入训练集的类先验信息;
优选地,步骤5具体为:
将评分簇的均值μ和协方差矩阵作为期望最大化EM算法中第j个高斯模型的初始量,通过下式表示出事量θ:
θ={μ(θ),∑,(θ)|1≤j≤M},
引入所述训练集的类先验信息;使用EM聚合算法综合处理体育场疏散评价数据,首先将步骤4处理得到影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R作为初始化数据,即将评分簇的均值μj和协方差矩阵Σi作为期望最大化EM算法中第j个高斯模型的初始;
构建关于所述数据矩阵R的高斯混合模型的条件密度函数,通过最大化高斯混合模型的条件密度函数中参数θ的似然函数获取E步公式和M步公式。
关于数据矩阵R中数据x的高斯混合模型的条件密度函数为:
Figure BDA0003371999180000101
其中,C为影响体育场疏散因素集中第k个因素类别,x为数据矩阵R中的数据,γ为期望最大化EM算法中高斯混合模型与类C间的近似度,π为类C属于期望最大化EM算法中高斯混合模型的概率,θ为唯一标识x的高斯模型的参数,包括均值和协方差,θj为第j个高斯模型的均值和协方差参数,p(x|j;θ)为训练子集x属于第j个高斯模型的条件概率,πjk为Ck数据的第j个高斯模型的概率,满足
Figure BDA0003371999180000102
γjk为第j个高斯模型与Ck数据间的近似度,满足
Figure BDA0003371999180000103
将均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入上式可得:
Figure BDA0003371999180000104
步骤6:通过EM聚合算法获取均值和方差,得到最优评分期望。
所述步骤6具体为:
步骤6.1:输入初始化参数θ(0),即为影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi
步骤6.2:执行EM聚合算法中的E步计算,利用当前参数θ(t)计算Q函数,表达式为:
Figure BDA0003371999180000111
步骤6.3:执行EM聚合算法中的M步计算,极大化Q函数,求出相应的θ=argmaxQ(θ,θ(t));
步骤6.4:重复上述步骤6.3和步骤6.3,直至收敛,输出疏散评价系统最优解。
EM迭代方程中E步按照下式得到数据矩阵R的最大期望值Z(i)
Figure BDA0003371999180000112
设当t=i时,迭代计算完成,则上式可转换成:
Figure BDA0003371999180000113
将均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入式(6)可得:
Figure BDA0003371999180000114
其中,i表示迭代次数,X表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R,隐变量Z表示最后体育场疏散评分结果,x(i)表示第i个加权体育场疏散评价数据的特征向量,μj表示第i个加权体育场疏散评价数据的均值向量,
Figure BDA0003371999180000121
表示第i个加权体育场疏散评价数据的协方差矩阵,p(x(i),z(i)j,Σi)表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率,Qi(z(i))表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率值。
EM迭代方程中M步按照下式得到最大化步骤:
θ=argmaxQ(θ,θ(t)) (7)
将影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入式(7)可得:
Figure BDA0003371999180000122
Figure BDA0003371999180000123
其中,i表示迭代次数,X表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R,隐变量Z表示最后体育场疏散评分结果,x(i)表示第i个加权体育场疏散评价数据的特征向量,μj表示第i个加权体育场疏散评价数据的均值向量,
Figure BDA0003371999180000124
表示第i个加权体育场疏散评价数据的协方差矩阵,p(x(i),z(i)j,Σi)表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率,Qi(z(i))表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率值。
EM聚合算法是一种隐变量估计方法,它首先需要输入初始化数据,然后观察预期,这两个步骤就是期望步骤,即E步,如果结果存在偏差则需重新估计参数,这被称为最大化步骤,即M步。使用EM聚合算法综合处理体育场疏散评价数据,首先将步骤四处理得到影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R作为初始化数据,即将评分簇的均值μj和协方差矩阵Σi作为期望最大化EM算法中第j个高斯模型的初始。然后构建关于所述数据矩阵R的高斯混合模型的条件密度函数,通过最大化高斯混合模型的条件密度函数中参数θ的似然函数获取E步公式和M步公式。
所述步骤6的EM聚合算法综合处理数据的算法过程为:将影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi作为期望最大化EM算法中θ的初值然后进行迭代逐渐最大化似然函数。
Figure BDA0003371999180000131
由Jensen不等式:
Figure BDA0003371999180000132
其中0≤αi≤1
Figure BDA0003371999180000133
Figure BDA0003371999180000134
则有:L(θ)≥B(θ,θ(i))
优化问题转换为:θ(i+1)=argmaxB(θ,θ(i))去除跟θ无关的项,即:
Figure BDA0003371999180000141
即:
Figure BDA0003371999180000142
(10)
其中,i表示迭代次数,X表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R,隐变量Z表示最后体育场疏散评分结果,x(i)表示第i个加权体育场疏散评价数据的特征向量,μj表示第i个加权体育场疏散评价数据的均值向量,
Figure BDA0003371999180000143
表示第i个加权体育场疏散评价数据的协方差矩阵。
以上所述仅是一种基于EM聚类算法的体育场疏散评价方法的优选实施方式,一种基于EM聚类算法的体育场疏散评价方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均属于本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。

Claims (10)

1.一种基于EM聚类算法的体育场疏散评价方法,其特征是:所述方法包括以下步骤:
步骤1:建立影响体育场疏散的因素集;
步骤2:采用k最邻近算法对评判因素集进行分类处理;
步骤3:对分类完的评判因素对的体育场疏散进行量化打分,形成映射评语集;
步骤4:采用PageRank算法对评语集的数据的重要程度进行判断加权得到数据矩阵R,对应因素集计算得到加权后评语聚类簇的均值μj和方差Σi
步骤5:将评分簇的均值μ和协方差矩阵作为期望最大化EM算法中第j个高斯模型的初始量,并引入训练集的类先验信息;
步骤6:通过EM聚合算法获取均值和方差,得到最优评分期望。
2.根据权利要求1所述的一种基于EM聚类算法的体育场疏散评价方法,其特征是:所述步骤1具体为:
将因素分为建筑设计因素、疏散设备因素、疏散管理因素和人群行为因素,建筑设计因素分为形体因素、流线因素、构成因素三个子类,疏散设备因素分为应急照明系统、灯光疏散指示系统、广播疏散系统、火灾自动报警系统四个子类,疏散管理因素分为维护管理、日常管理两个子类,人群行为因素分为惯性行为、突发行为两个子类,上述分类作为初始分类集。
3.根据权利要求2所述的一种基于EM聚类算法的体育场疏散评价方法,其特征是:所述步骤2具体为:
步骤2.1:根据输入的影响体育场疏散因素与各个初始分类集之间相似度来定义因素和初始分类集里的距离;
步骤2.2:按照距离的递增关系进行排序;
步骤2.3:选取距离最小的K个点;
步骤2.4:确定前K个点所在类别的出现频率;
步骤2.5:返回前K个点中出现频率最高的类别作为影响体育场疏散因素的预测分类。
4.根据权利要求3所述的一种基于EM聚类算法的体育场疏散评价方法,其特征是:所述步骤3具体为:
针对已经分类好的评判因素对现有的体育场进行量化打分,评分通过安全等级来评;评分采用百分制,为使评分趋于准确,将以十分作为一个区间,划分为十个等级,以此避免评分的两极分化;这十个等级分别为非常安全、比较安全、一般安全、稍微安全、稍微不安全、一般不安全、比较不安全、不安全、很不安全,对应[90,100]、[80,90]、[70,80]、[60,70]、[50,60]、[40,50]、[30,40]、[20,30]、[10,20]、[0,10]评分区间;所得到的数据集即为因素集关于安全等级评判的映射,组成体育场疏散评语聚类簇的空间矩阵N。
5.根据权利要求4所述的一种基于EM聚类算法的体育场疏散评价方法,其特征是:所述步骤4具体为:
步骤4.1:将体育场疏散评语聚类簇的空间矩阵N作为PageRank算法里的含i×j个结点的有向图,平稳分布R为这个有向图的PageRank值;
步骤4.2:令t=0,计算
Figure FDA0003371999170000021
当Rt+1与Rt充分接近,令Rt+1=Rt停止迭代;
步骤4.3:否则t=t+1,执行步骤4.2;
步骤4.4:最后得到体育场疏散评语聚类簇的空间矩阵N的PageRank向量R;
步骤4.5:对体育场疏散评语集的数据的重要程度进行判断加权得到的数据矩阵R,通过下式表示:
Figure FDA0003371999170000031
步骤4.6:计算得到数据矩阵R的得到每个加权体育场疏散评语聚类簇的均值μj和方差Σi
6.根据权利要求5所述的一种基于EM聚类算法的体育场疏散评价方法,其特征是:步骤5具体为:
将评分簇的均值μ和协方差矩阵作为期望最大化EM算法中第j个高斯模型的初始量,通过下式表示出事量θ:
θ={μ(θ),∑,(θ)|1≤j≤M},
引入所述训练集的类先验信息;使用EM聚合算法综合处理体育场疏散评价数据,首先将步骤4处理得到影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R作为初始化数据,即将评分簇的均值μj和协方差矩阵Σi作为期望最大化EM算法中第j个高斯模型的初始;
构建关于所述数据矩阵R的高斯混合模型的条件密度函数,通过最大化高斯混合模型的条件密度函数中参数θ的似然函数获取E步公式和M步公式。
7.根据权利要求6所述的一种基于EM聚类算法的体育场疏散评价方法,其特征是:关于数据矩阵R中数据x的高斯混合模型的条件密度函数为:
Figure FDA0003371999170000032
其中,C为影响体育场疏散因素集中第k个因素类别,x为数据矩阵R中的数据,γ为期望最大化EM算法中高斯混合模型与类C间的近似度,π为类C属于期望最大化EM算法中高斯混合模型的概率,θ为唯一标识x的高斯模型的参数,包括均值和协方差,θj为第j个高斯模型的均值和协方差参数,p(x|j;θ)为训练子集x属于第j个高斯模型的条件概率,πjk为Ck数据的第j个高斯模型的概率,满足
Figure FDA0003371999170000041
γjk为第j个高斯模型与Ck数据间的近似度,满足
Figure FDA0003371999170000042
将均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入上式可得:
Figure FDA0003371999170000043
8.根据权利要求1所述的一种火星低压尘暴模拟装置抽真空系统,其特征是:所述步骤6具体为:
步骤6.1:输入初始化参数θ(0),即为影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi
步骤6.2:执行EM聚合算法中的E步计算,利用当前参数θ(t)计算Q函数,表达式为:
Figure FDA0003371999170000044
步骤6.3:执行EM聚合算法中的M步计算,极大化Q函数,求出相应的θ=argmaxQ(θ,θ(t));
步骤6.4:重复上述步骤6.3和步骤6.3,直至收敛,输出疏散评价系统最优解。
9.根据权利要求1所述的一种火星低压尘暴模拟装置抽真空系统,其特征是:
EM迭代方程中E步按照下式得到数据矩阵R的最大期望值Z(i)
Figure FDA0003371999170000045
设当t=i时,迭代计算完成,则上式可转换成:
Figure FDA0003371999170000046
将均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入式(6)可得:
Figure FDA0003371999170000051
其中,i表示迭代次数,X表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R,隐变量Z表示最后体育场疏散评分结果,x(i)表示第i个加权体育场疏散评价数据的特征向量,μj表示第i个加权体育场疏散评价数据的均值向量,
Figure FDA0003371999170000054
表示第i个加权体育场疏散评价数据的协方差矩阵,p(x(i),z(i)j,Σi)表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率,Qi(z(i))表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率值。
10.根据权利要求1所述的一种火星低压尘暴模拟装置抽真空系统,其特征是:
EM迭代方程中M步按照下式得到最大化步骤:
θ=argmaxQ(θ,θ(t)) (7)
将影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi作为期望最大化EM算法中第j个高斯模型的初始代入式(7)可得:
Figure FDA0003371999170000052
Figure FDA0003371999170000053
其中,i表示迭代次数,X表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R,隐变量Z表示最后体育场疏散评分结果,x(i)表示第i个加权体育场疏散评价数据的特征向量,μj表示第i个加权体育场疏散评价数据的均值向量,
Figure FDA0003371999170000061
表示第i个加权体育场疏散评价数据的协方差矩阵,p(x(i),z(i)j,Σi)表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率,Qi(z(i))表示影响体育场疏散因素集关于安全等级评判的映射N加权处理后的数据矩阵R的均值μj和方差Σi条件下在加权体育场疏散评价数据集属于第i个加权体育场疏散评价数据的概率值。
CN202111405168.7A 2021-11-24 2021-11-24 一种基于em聚类算法的体育场疏散评价方法 Pending CN114219228A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111405168.7A CN114219228A (zh) 2021-11-24 2021-11-24 一种基于em聚类算法的体育场疏散评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111405168.7A CN114219228A (zh) 2021-11-24 2021-11-24 一种基于em聚类算法的体育场疏散评价方法

Publications (1)

Publication Number Publication Date
CN114219228A true CN114219228A (zh) 2022-03-22

Family

ID=80698150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111405168.7A Pending CN114219228A (zh) 2021-11-24 2021-11-24 一种基于em聚类算法的体育场疏散评价方法

Country Status (1)

Country Link
CN (1) CN114219228A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115472001A (zh) * 2022-07-25 2022-12-13 深圳市城市交通规划设计研究中心股份有限公司 体育场人车交通疏散仿真评估方法、电子设备及存储介质
CN116431965A (zh) * 2022-09-09 2023-07-14 哈尔滨工业大学 一种基于ism模型的建筑安全疏散影响因素分析方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115472001A (zh) * 2022-07-25 2022-12-13 深圳市城市交通规划设计研究中心股份有限公司 体育场人车交通疏散仿真评估方法、电子设备及存储介质
CN115472001B (zh) * 2022-07-25 2023-12-26 深圳市城市交通规划设计研究中心股份有限公司 体育场人车交通疏散仿真评估方法、电子设备及存储介质
CN116431965A (zh) * 2022-09-09 2023-07-14 哈尔滨工业大学 一种基于ism模型的建筑安全疏散影响因素分析方法
CN116431965B (zh) * 2022-09-09 2024-04-16 哈尔滨工业大学 一种基于ism模型的建筑安全疏散影响因素分析方法

Similar Documents

Publication Publication Date Title
US20230136352A1 (en) Method and system for predicting a day-ahead wind power of wind farms
CN113378990B (zh) 基于深度学习的流量数据异常检测方法
CN114219228A (zh) 一种基于em聚类算法的体育场疏散评价方法
CN107579846B (zh) 一种云计算故障数据检测方法及系统
Kianmehr et al. Fuzzy clustering-based discretization for gene expression classification
WO2021189830A1 (zh) 样本数据优化方法、装置、设备及存储介质
CN110459292B (zh) 一种基于聚类和pnn的药品风险分级方法
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN115688024B (zh) 基于用户内容特征和行为特征的网络异常用户预测方法
CN111339478B (zh) 基于改进模糊层次分析法的气象数据质量评估方法
CN112612820A (zh) 数据处理方法及装置、计算机可读存储介质及处理器
CN111611293B (zh) 一种基于特征加权与MapReduce的离群数据挖掘方法
CN113657678A (zh) 一种基于信息新鲜度的电网电力数据预测方法
CN113839926A (zh) 一种基于灰狼算法特征选择的入侵检测系统建模方法、系统及装置
CN116823496A (zh) 基于人工智能的智能保险风险评估和定价系统
CN110177112B (zh) 基于双重子空间采样和置信偏移的网络入侵检测方法
CN114513367A (zh) 基于图神经网络的蜂窝网络异常检测方法
CN113569920A (zh) 基于自动编码的第二近邻异常检测方法
CN116051924B (zh) 一种图像对抗样本的分治防御方法
CN113609480B (zh) 基于大规模网络流的多路学习入侵检测方法
CN114298245A (zh) 异常检测方法、装置、存储介质和计算机设备
CN110097126B (zh) 基于dbscan聚类算法的核查重点人员、房屋漏登记的方法
CN113128789A (zh) 一种基于概率预测的城市路面塌陷预防方法、系统及存储介质
CN116910660B (zh) 面向不平衡数据的自步半监督集成分类器训练方法及系统
CN113222034B (zh) 基于知识蒸馏的细粒度多类别不平衡故障分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination