CN106960213A - 一种基于大数据分析的消防安全重点单位等级排序系统 - Google Patents

一种基于大数据分析的消防安全重点单位等级排序系统 Download PDF

Info

Publication number
CN106960213A
CN106960213A CN201710078630.4A CN201710078630A CN106960213A CN 106960213 A CN106960213 A CN 106960213A CN 201710078630 A CN201710078630 A CN 201710078630A CN 106960213 A CN106960213 A CN 106960213A
Authority
CN
China
Prior art keywords
data
matrix
building
value
sample data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710078630.4A
Other languages
English (en)
Other versions
CN106960213B (zh
Inventor
蔡斯凯
孔祥明
蔡禹
陈贤耿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Building Fire Facilities Detection Center Co., Ltd.
Guangdong industry Kaiyuan science and Technology Co., Ltd.
Original Assignee
Guangdong Industry Kaiyuan Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Industry Kaiyuan Science And Technology Co Ltd filed Critical Guangdong Industry Kaiyuan Science And Technology Co Ltd
Priority to CN201710078630.4A priority Critical patent/CN106960213B/zh
Publication of CN106960213A publication Critical patent/CN106960213A/zh
Application granted granted Critical
Publication of CN106960213B publication Critical patent/CN106960213B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据分析的消防安全重点单位等级排序系统,该系统包括用于采集多个建筑所对应的建筑属性参数的数据采集单元、用于采用PCA算法对采集得到的多个建筑所对应的建筑属性参数进行主成分分析处理,得到多个建筑所对应的主成分数据,对多个建筑所对应的主成分数据进行聚类分析后得到至少两个数据簇的数据处理单元、用于计算每个数据簇的第一主成分平均值,根据第一主成分平均值,对数据簇进行排序的数据排序单元。通过使用本发明的系统,能准确对消防安全重点单位进行界定,并且令消防安全重点单位的等级确定结果更符合实际情况,且处理效率高。本发明的系统可广泛应用于消防管控领域中。

Description

一种基于大数据分析的消防安全重点单位等级排序系统
技术领域
本发明涉及数据判定排序处理技术,尤其涉及一种基于大数据分析的消防安全重点单位(建筑物)等级排序处理系统。
背景技术
技术词解释:
PCA:Principal Component Analysis,主成分分析,其是一种统计方法,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
随着近年社会经济的快速发展,消防工作面临的新情况、新问题不断增多,消防安全形势依然严峻,区域性火灾隐患突出,总体上仍处于火灾易发、多发期,给消防工作带来严峻的挑战和考验。为了降低火灾发生几率,减少火灾造成的人民生命财产的损害,县级以上地方人民政府公安机关消防机构会将发生火灾可能性较大以及发生火灾可能造成重大的人身伤亡或者财产损失的单位(建筑物),确定为本行政区域内的消防安全重点单位(建筑物),进行专门的管理以及重点关注,从而加强消防安全保障。然而,在现有对消防安全重点单位的等级排序技术中,对各种建筑的参数界定却缺乏大量统计数据支撑,容易导致等级排序结果的准确度低下,发生与实际情况不符的情况,而且其中定义的规则也较为繁杂,因此会降低了操作性以及数据处理效率,还有,各种建筑的参数在时间迁移的过程中会发生变化,这样则会导致消防安全重点单位的等级排序结果发生变化,而由于目前消防安全重点单位的等级排序基本是依赖人为操作来完成的,因此,当建筑的参数更新变化时,工作人员则需要重新进行数据处理来得出新的等级排序结果,这样不仅大大降低处理效率、操作便利性以及为产生结果滞后性,而且还会极大地增加工作人员的工作负担。
发明内容
为了解决上述技术问题,本发明的目的是提供一种效率高、准确度高、符合实际情况的基于大数据分析的消防安全重点单位(建筑物)等级排序处理系统。
本发明所采用的技术方案是:一种基于大数据分析的消防安全重点单位等级排序系统,该系统包括:
数据采集单元,用于采集多个建筑所对应的建筑属性参数;
数据处理单元,用于采用PCA算法对采集得到的多个建筑所对应的建筑属性参数进行主成分分析处理,从而得到多个建筑所对应的主成分数据,然后对多个建筑所对应的主成分数据进行聚类分析,从而得到至少两个数据簇;
数据排序单元,用于计算每个数据簇的第一主成分平均值,然后根据计算得出的第一主成分平均值,对数据簇进行排序。
进一步,所述数据采集单元包括:
获取模块,用于采集多个建筑所对应的建筑属性信息,其中,一个建筑对应多个建筑属性信息;
处理模块,用于对采集得到的多个建筑所对应的建筑属性信息进行数值转化处理,从而令一个建筑属性信息对应一建筑属性数值;
构建模块,用于将多个建筑所对应的建筑属性数值构成建成一样本数据矩阵,其中,所述样本数据矩阵作为所需采集的多个建筑所对应的建筑属性参数。
进一步,所述数据处理单元包括:
PCA处理模块,用于对样本数据矩阵进行归一化处理,从而得到归一化样本数据矩阵,然后计算归一化样本数据矩阵所对应的相关系数矩阵,接着,计算相关系数矩阵所对应的特征向量矩阵以及多个特征值,跟着,根据计算得出的多个特征值,从而计算得出每一个建筑所对应的主成分数据;
聚类处理模块,用于采用kmeans聚类算法对多个建筑所对应的主成分数据进行聚类分析,从而得到三个数据簇。
进一步,所述归一化样本数据矩阵中所包含的元素数值,其计算公式如下所示:
其中,hij表示为归一化样本数据矩阵中第i行第j列的元素数值,xij表示为样本数据矩阵中第i行第j列的建筑属性数值,表示为样本数据矩阵中第j列建筑属性数值的平均值,var(xj)表示为样本数据矩阵中第j列建筑属性数值的方差,n为建筑的个数,m为一个建筑所对应的建筑属性数值的个数。
进一步,所述相关系数矩阵中第i行第j列的元素数值表示为归一化样本数据矩阵中第i列建筑属性数值与第j列建筑属性数值之间的相关系数。
进一步,所述相关系数矩阵中所包含的元素数值,其计算公式如下所示:
其中,cov(hi,hj)为hi,hj之间的协方差,为hi的标准差,为hj的标准差;hi表示为归一化样本数据矩阵中第i列建筑属性数值,hj表示为归一化样本数据矩阵中第j列建筑属性数值,cij表示为相关系数矩阵中第i行第j列的元素数值。
进一步,所述根据计算得出的多个特征值,从而计算得出每一个建筑所对应的主成分数据,其具体为:
首先,计算多个特征值的总和,然后按照数值从大至小的顺序依次选取特征值,当选取出的k个特征值的和超出预设值时,则利用选取出的k个特征值从特征向量矩阵中选取出相对应的k列特征向量数据构建成一个m×k的矩阵M;
然后,将归一化样本数据矩阵与矩阵M相乘,从而得到新的样本数据矩阵,其中,所述新的样本数据矩阵包括有每一个建筑所对应的主成分数据。
进一步,所述采用kmeans聚类算法对多个建筑所对应的主成分数据进行聚类分析,从而得到三个数据簇,其具体包括:
设定3个初始质心;
计算数据点与3个质心的距离,然后将该数据点划分至与其距离最近的质心所属的数据簇中,从而形成3个数据簇;
判断当前3个数据簇是否满足聚类结束条件,若是,则结束聚类,将当前得到的3个数据簇作为最终聚类分析后得到的3个数据簇;反之,则重新分别计算3个数据簇的质心,然后返回执行上一步骤。
进一步,所述数据簇的第一主成分平均值,其具体计算步骤包括有:
首先,对该数据簇中所包含的所有建筑所对应的主成分数据进行同一属性主成分数据的方差计算;
然后,选出数值最大的方差,将选出的方差所对应的同一属性主成分数据作为第一主成分数据;
接着,计算第一主成分数据的平均值作为该数据簇的第一主成分平均值。
进一步,所述相关系数矩阵所对应的特征向量矩阵以及多个特征值,其采用雅可比法来计算得出。
本发明的有益效果是:通过使用本发明的等级排序处理系统,能够为工作人员的操作带来极大的便利性,大大减轻工作人员的工作负担,而且当建筑的参数发生变化时,能快速计算得出消防安全重点单位的等级排序结构,数据处理效率高,而且其计算处理过程中不涉及人工操作,因此还大大提高计算结果的准确性。另外,对于本发明的等级排序处理系统,其首先通过PCA算法来对建筑物的消防相关属性参数进行主成分分析处理,提取出对建筑消防风险影响最大的因素,并且根据这些因素来判定该建筑主体是否为消防安全重点单位,最后在利用这些提取出来的因素,采用聚类方法对所述的重点单位进行等级划分排序,从而确定所述重点单位所属的等级,即重要程度,如最重要、次重要、一般重要等,由此可见,本发明的系统是基于大数据分析技术而实现的,而且采用PCA算法和聚类算法来实现消防安全重点单位的判定及其重要等级的确定,能令处理得出的等级确定结果更符合实际情况,避免发生真正高风险的建筑物被大量“次重点”的建筑物所掩盖的问题,有利于消防管控工作的资源调配。
附图说明
图1是本发明一种基于大数据分析的消防安全重点单位等级排序系统的结构框图;
图2是本发明一种基于大数据分析的消防安全重点单位等级排序系统的一具体实施例结构框图;
图3是针对一种基于大数据分析的消防安全重点单位等级排序系统所涉及的数据处理步骤流程图。
具体实施方式
如图1所示,一种基于大数据分析的消防安全重点单位等级排序系统,该系统包括:
数据采集单元101,用于采集多个建筑所对应的建筑属性参数;
数据处理单元102,用于采用PCA算法对采集得到的多个建筑所对应的建筑属性参数进行主成分分析处理,从而得到多个建筑所对应的主成分数据,然后对多个建筑所对应的主成分数据进行聚类分析,从而得到至少两个数据簇;
数据排序单元103,用于计算每个数据簇的第一主成分平均值,然后根据计算得出的第一主成分平均值,对数据簇进行排序。
进一步作为本实施例的优选实施方式,如图2所示,所述数据采集单元101包括:
获取模块1011,用于采集多个建筑所对应的建筑属性信息,其中,一个建筑对应多个建筑属性信息;
处理模块1012,用于对采集得到的多个建筑所对应的建筑属性信息进行数值转化处理,从而令一个建筑属性信息对应一建筑属性数值;
构建模块1013,用于将多个建筑所对应的建筑属性数值构成建成一样本数据矩阵,其中,所述样本数据矩阵作为所需采集的多个建筑所对应的建筑属性参数。
进一步作为本实施例的优选实施方式,如图2所示,所述数据处理单元102包括:
PCA处理模块1021,用于对样本数据矩阵进行归一化处理,从而得到归一化样本数据矩阵,然后计算归一化样本数据矩阵所对应的相关系数矩阵,接着,计算相关系数矩阵所对应的特征向量矩阵以及多个特征值,跟着,根据计算得出的多个特征值,从而计算得出每一个建筑所对应的主成分数据;
聚类处理模块1022,用于采用kmeans聚类算法对多个建筑所对应的主成分数据进行聚类分析,从而得到三个数据簇。
进一步作为本实施例的优选实施方式,所述归一化样本数据矩阵中所包含的元素数值,其计算公式如下所示:
其中,hij表示为归一化样本数据矩阵中第i行第j列的元素数值,xij表示为样本数据矩阵中第i行第j列的建筑属性数值,表示为样本数据矩阵中第j列建筑属性数值的平均值,var(xj)表示为样本数据矩阵中第j列建筑属性数值的方差,n为建筑的个数,m为一个建筑所对应的建筑属性数值的个数。
进一步作为本实施例的优选实施方式,所述相关系数矩阵中第i行第j列的元素数值表示为归一化样本数据矩阵中第i列建筑属性数值与第j列建筑属性数值之间的相关系数。
进一步作为本实施例的优选实施方式,所述相关系数矩阵中所包含的元素数值,其计算公式如下所示:
其中,cov(hi,hj)为hi,hj之间的协方差,为hi的标准差,为hj的标准差;hi表示为归一化样本数据矩阵中第i列建筑属性数值,hj表示为归一化样本数据矩阵中第j列建筑属性数值,cij表示为相关系数矩阵中第i行第j列的元素数值。
进一步作为本实施例的优选实施方式,所述根据计算得出的多个特征值,从而计算得出每一个建筑所对应的主成分数据,其具体为:
首先,计算多个特征值的总和,然后按照数值从大至小的顺序依次选取特征值,当选取出的k个特征值的和超出预设值时,则利用选取出的k个特征值从特征向量矩阵中选取出相对应的k列特征向量数据构建成一个m×k的矩阵M;
然后,将归一化样本数据矩阵与矩阵M相乘,从而得到新的样本数据矩阵,其中,所述新的样本数据矩阵包括有每一个建筑所对应的主成分数据。
进一步作为本实施例的优选实施方式,所述采用kmeans聚类算法对多个建筑所对应的主成分数据进行聚类分析,从而得到三个数据簇,其具体包括:
设定3个初始质心;
计算数据点与3个质心的距离,然后将该数据点划分至与其距离最近的质心所属的数据簇中,从而形成3个数据簇;
判断当前3个数据簇是否满足聚类结束条件,若是,则结束聚类,将当前得到的3个数据簇作为最终聚类分析后得到的3个数据簇;反之,则重新分别计算3个数据簇的质心,然后返回执行上一步骤。
进一步作为本实施例的优选实施方式,所述数据簇的第一主成分平均值,其具体计算步骤包括有:
首先,对该数据簇中所包含的所有建筑所对应的主成分数据进行同一属性主成分数据的方差计算;
然后,选出数值最大的方差,将选出的方差所对应的同一属性主成分数据作为第一主成分数据;
接着,计算第一主成分数据的平均值作为该数据簇的第一主成分平均值。
进一步作为本实施例的优选实施方式,所述相关系数矩阵所对应的特征向量矩阵以及多个特征值,其采用雅可比法来计算得出。
如图3所示,针对上述基于大数据分析的消防安全重点单位等级排序处理系统,其具体处理方法步骤包括有:
S101、采集多个建筑所对应的建筑属性信息,其中,一个建筑对应多个建筑属性信息,而一个建筑所对应的多个建筑属性信息包括有:
a)建筑层数;
b)建筑高度;
c)建筑面积(m2);
d)占地面积(m2);
e)建筑主要使用功能:厂房、仓库、住宅、宿舍、公寓、学校、图书馆、医院、体育馆、电影院、商场、地下商场、地下车库、地下仓库、人民防空等;
f)房间数量;
g)人员数量;
h)投入使用年数;
i)其他扩展的数据;
S102、对采集得到的多个建筑所对应的建筑属性信息进行数值转化处理,从而令一个建筑属性信息对应一建筑属性数值;具体地,可采用布尔型数据转化方式将建筑属性信息这一非数值类数据转化为数值类数据,0或1,又或者,枚举型(针对建筑主要使用功能)采用整数数值对建筑主要使用功能依次编号,如厂房为1、仓库为2、住宅为3等如此类推;
S103、将多个建筑所对应的建筑属性数值构成建成一样本数据矩阵,其中,所述一样本数据矩阵作为所需采集的多个建筑所对应的建筑属性参数,例如,一共有n个建筑主体,而每个建筑主体包含m个建筑属性数值,那么该样本数据矩阵X如下所示:
可见,矩阵X中第i行的建筑属性数值对应第i个建筑主体;
S201、由于矩阵X中所包括的建筑属性数值的最大值和最小值均不确定,难以确定统一取值范围,并且数据中不同类别数据的取值范围差异较大,容易影响主成分分析过程,因此优选采用z-score方法对样本数据矩阵X进行归一化处理,使所有数据的取值范围落在[0,1]之间,从而得到归一化样本数据矩阵H,而该归一化样本数据矩阵H如下所示:
对于所述归一化样本数据矩阵H中所包含的元素数值hij,其具体计算公式如下所示:
其中,hij表示为归一化样本数据矩阵H中第i行第j列的元素数值,xij表示为样本数据矩阵X中第i行第j列的建筑属性数值,表示为样本数据矩阵X中第j列建筑属性数值的平均值,var(xj)表示为样本数据矩阵X中第j列建筑属性数值的方差;
S202、计算归一化样本数据矩阵H所对应的相关系数矩阵C,其中,相关系数矩阵C中第i行第j列的元素数值cij表示为矩阵H中第i列建筑属性数值,即hi,与第j列建筑属性数值,即hj,之间的相关系数;
具体地,设定(h1,h2,h3...hm)是一个m维随机变量,任意hi与hj之间的相关系数cij表(i,j=1,2,...m)存在,则以cij为元素数值的m阶矩阵称为该维随机向量的相关系数矩阵,记作C,相关系数矩阵C如下所示:
其中,对于相关系数矩阵C中所包含的元素数值cij,其计算公式如下所示:
其中,cov(hi,hj)为hi,hj之间的协方差,为hi的标准差,为hj的标准差;
S203、采用雅可比法来计算相关系数矩阵所对应的特征向量矩阵V以及多个特征值λ1、λ2…..λm,如矩阵S所示,其中,特征向量矩阵V和矩阵S如下所示:
S204、根据计算得出的多个特征值,从而计算得出每一个建筑所对应的主成分数据;
对于所述的步骤S204,其具体包括有:
S2041、计算多个特征值的总和λ=λ12+……+λm,然后按照数值从大至小的顺序依次选取特征值,当选取出的k个特征值的和超出预设值,如85%*λ,那么利用选取出的k个特征值从特征向量矩阵V选取出相对应的k列特征向量数据作为一个m×k的矩阵M;
例如,当多个特征值按照数值从大至小的顺序为λ12>……>λm,然后,λ12的和超出85%*λ,那么λ1和λ2便为当前选取的特征值,即此时k为2,接着,利用选取出的这2个特征值,从特征向量矩阵V中选取出第1列和第2列特征向量数据作为一m×2的矩阵M,矩阵M如下所示:
若选取出的特征值为第三特征值λ3和第六特征值λ6,那么则从特征向量矩阵V中选取出第3列和第6列特征向量数据作为一m×2的矩阵M;
S2042、将归一化样本数据矩阵H与矩阵M相乘,从而得到新的样本数据矩阵H’,即令H'nk=HnmMmk
通过采用上述的处理步骤,将n×m的归一化样本数据矩阵H映射成n×k的样本数据矩阵H’,而一建筑主体所对应的特征值数量则由m个减少到k个,此时,矩阵H’中第i行的k个元素数值实质为第i个建筑主体所对应的k个主成分数据,如k为2时,第1个建筑对应的2个主成分数据,即在新的样本数据矩阵H’包含了n个建筑所对应的主成分数据;
S205、将一建筑所对应的主成分数据作为一数据点,然后采用kmeans聚类算法对多个建筑所对应的数据点进行聚类分析,从而得到三个数据簇;
对于所述步骤S205,其具体为:
S2051、选取3个数据点作为3个初始质心;
S2052、采用曼哈顿距离计算数据点与3个质心的距离,然后将该数据点划分至与其距离最近的质心所属的数据簇中,从而形成3个数据簇;
S2053、判断当前3个数据簇是否满足聚类结束条件,如数据簇是否不再发生变化或当前迭代次数已达到最大迭代次数,若是,则结束聚类,将当前得到的3个数据簇作为最终聚类分析后得到的3个数据簇;反之,则重新分别计算3个数据簇的质心,然后返回执行上一步骤S2052;
S206、计算每个数据簇的第一主成分平均值;
其中,对于一数据簇的第一主成分平均值,其具体计算步骤包括有:
对该数据簇中所包含的所有建筑所对应的主成分数据进行同一属性主成分数据的方差计算,例如,该数据簇中包含了10个建筑所对应主成分数据,而一建筑对应2个主成分数据,其数据矩阵如下所示:
可见,n为10,此时,则计算第1列10个主成分数据的方差以及第2列主成分数据的方差(同一列主成分数据属于同一属性,不同列的数据对应不同属性),即计算同一属性主成分数据的方差,然后选出数值最大的方差,其中,数值最大的方差所对应的那一列主成分数据为第一主成分数据,接着,计算出那一列第一主成分数据的平均值作为该数据簇的第一主成分平均值;
S207、根据每一个数据簇所对应的第一主成分平均值,按照数值从大至小的顺序对3个数据簇进行排序,这样排序为第一的数据簇(即该数据簇的第一主成分平均值的数值为最大的),其中所包含的建筑为第一类消防安全重点单位,排序为第二的数据簇,其中所包含的建筑为第二类消防安全重点单位,排序为第三的数据簇(即该数据簇的第一主成分平均值的数值为最小的),其中所包含的建筑为第三类消防安全重点单位。
由上述可见,通过使用上述本发明的消防安全重点单位等级排序方式,能够为工作人员的操作带来极大的便利性,大大减轻工作人员的工作负担,而且当建筑的参数发生变化时,能快速计算得出消防安全重点单位的等级排序结构,数据处理效率高,而且其计算处理过程中不涉及人工操作,因此还大大提高计算结果的准确性。另外,本发明采用PCA算法和聚类算法来实现消防安全重点单位的判定及其重要等级的确定,能令处理得出的等级确定结果更符合实际情况,避免发生真正高风险的建筑物被大量“次重点”的建筑物所掩盖的问题,而且可以快速复制应用于以后消防安全大数据平台的开发,作为主要的建筑物重要程度分类排序算法,用于消防大数据平台的决策辅助应用,指导建筑物维护专项资金的分配,消防安全检查工作的安排等。
以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

Claims (10)

1.一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:该系统包括:
数据采集单元,用于采集多个建筑所对应的建筑属性参数;
数据处理单元,用于采用PCA算法对采集得到的多个建筑所对应的建筑属性参数进行主成分分析处理,从而得到多个建筑所对应的主成分数据,然后对多个建筑所对应的主成分数据进行聚类分析,从而得到至少两个数据簇;
数据排序单元,用于计算每个数据簇的第一主成分平均值,然后根据计算得出的第一主成分平均值,对数据簇进行排序。
2.根据权利要求1所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述数据采集单元包括:
获取模块,用于采集多个建筑所对应的建筑属性信息,其中,一个建筑对应多个建筑属性信息;
处理模块,用于对采集得到的多个建筑所对应的建筑属性信息进行数值转化处理,从而令一个建筑属性信息对应一建筑属性数值;
构建模块,用于将多个建筑所对应的建筑属性数值构成建成一样本数据矩阵,其中,所述样本数据矩阵作为所需采集的多个建筑所对应的建筑属性参数。
3.根据权利要求2所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述数据处理单元包括:
PCA处理模块,用于对样本数据矩阵进行归一化处理,从而得到归一化样本数据矩阵,然后计算归一化样本数据矩阵所对应的相关系数矩阵,接着,计算相关系数矩阵所对应的特征向量矩阵以及多个特征值,跟着,根据计算得出的多个特征值,从而计算得出每一个建筑所对应的主成分数据;
聚类处理模块,用于采用kmeans聚类算法对多个建筑所对应的主成分数据进行聚类分析,从而得到三个数据簇。
4.根据权利要求3所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述归一化样本数据矩阵中所包含的元素数值,其计算公式如下所示:
h i j = x i j - x ‾ j var ( x j ) , ( i = 1 , 2 , ... , n ; j = 1 , 2 , ... , m )
其中,hij表示为归一化样本数据矩阵中第i行第j列的元素数值,xij表示为样本数据矩阵中第i行第j列的建筑属性数值,表示为样本数据矩阵中第j列建筑属性数值的平均值,var(xj)表示为样本数据矩阵中第j列建筑属性数值的方差,n为建筑的个数,m为一个建筑所对应的建筑属性数值的个数。
5.根据权利要求4所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述相关系数矩阵中第i行第j列的元素数值表示为归一化样本数据矩阵中第i列建筑属性数值与第j列建筑属性数值之间的相关系数。
6.根据权利要求5所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述相关系数矩阵中所包含的元素数值,其计算公式如下所示:
c i j = cov ( h i , h j ) Dh i Dh j , ( i , j = 1 , 2 , ... , m )
其中,cov(hi,hj)为hi,hj之间的协方差,为hi的标准差,为hj的标准差;hi表示为归一化样本数据矩阵中第i列建筑属性数值,hj表示为归一化样本数据矩阵中第j列建筑属性数值,cij表示为相关系数矩阵中第i行第j列的元素数值。
7.根据权利要求6所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述根据计算得出的多个特征值,从而计算得出每一个建筑所对应的主成分数据,其具体为:
首先,计算多个特征值的总和,然后按照数值从大至小的顺序依次选取特征值,当选取出的k个特征值的和超出预设值时,则利用选取出的k个特征值从特征向量矩阵中选取出相对应的k列特征向量数据构建成一个m×k的矩阵M;
然后,将归一化样本数据矩阵与矩阵M相乘,从而得到新的样本数据矩阵,其中,所述新的样本数据矩阵包括有每一个建筑所对应的主成分数据。
8.根据权利要求7所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述采用kmeans聚类算法对多个建筑所对应的主成分数据进行聚类分析,从而得到三个数据簇,其具体包括:
设定3个初始质心;
计算数据点与3个质心的距离,然后将该数据点划分至与其距离最近的质心所属的数据簇中,从而形成3个数据簇;
判断当前3个数据簇是否满足聚类结束条件,若是,则结束聚类,将当前得到的3个数据簇作为最终聚类分析后得到的3个数据簇;反之,则重新分别计算3个数据簇的质心,然后返回执行上一步骤。
9.根据权利要求7所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述数据簇的第一主成分平均值,其具体计算步骤包括有:
首先,对该数据簇中所包含的所有建筑所对应的主成分数据进行同一属性主成分数据的方差计算;
然后,选出数值最大的方差,将选出的方差所对应的同一属性主成分数据作为第一主成分数据;
接着,计算第一主成分数据的平均值作为该数据簇的第一主成分平均值。
10.根据权利要求3-9任一项所述一种基于大数据分析的消防安全重点单位等级排序系统,其特征在于:所述相关系数矩阵所对应的特征向量矩阵以及多个特征值,其采用雅可比法来计算得出。
CN201710078630.4A 2017-02-14 2017-02-14 一种基于大数据分析的消防安全重点单位等级排序系统 Active CN106960213B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710078630.4A CN106960213B (zh) 2017-02-14 2017-02-14 一种基于大数据分析的消防安全重点单位等级排序系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710078630.4A CN106960213B (zh) 2017-02-14 2017-02-14 一种基于大数据分析的消防安全重点单位等级排序系统

Publications (2)

Publication Number Publication Date
CN106960213A true CN106960213A (zh) 2017-07-18
CN106960213B CN106960213B (zh) 2018-08-31

Family

ID=59480937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710078630.4A Active CN106960213B (zh) 2017-02-14 2017-02-14 一种基于大数据分析的消防安全重点单位等级排序系统

Country Status (1)

Country Link
CN (1) CN106960213B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508051A (zh) * 2020-11-06 2021-03-16 重庆恢恢信息技术有限公司 通过大数据平台进行建筑施工项目混合聚类工作方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033932A (zh) * 2010-12-17 2011-04-27 东南大学 面向一体化设计的城市轨道交通站点分类方法
US8385662B1 (en) * 2009-04-30 2013-02-26 Google Inc. Principal component analysis based seed generation for clustering analysis
CN104966090A (zh) * 2015-07-21 2015-10-07 公安部第三研究所 实现面向图像理解的视觉单词生成和评价的系统及方法
CN105303468A (zh) * 2015-11-20 2016-02-03 国网天津市电力公司 一种基于主成分聚类分析的智能电网建设综合评价方法
CN106339354A (zh) * 2016-08-17 2017-01-18 盐城师范学院 基于改进pca的云计算网络中高维数据可视化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8385662B1 (en) * 2009-04-30 2013-02-26 Google Inc. Principal component analysis based seed generation for clustering analysis
CN102033932A (zh) * 2010-12-17 2011-04-27 东南大学 面向一体化设计的城市轨道交通站点分类方法
CN104966090A (zh) * 2015-07-21 2015-10-07 公安部第三研究所 实现面向图像理解的视觉单词生成和评价的系统及方法
CN105303468A (zh) * 2015-11-20 2016-02-03 国网天津市电力公司 一种基于主成分聚类分析的智能电网建设综合评价方法
CN106339354A (zh) * 2016-08-17 2017-01-18 盐城师范学院 基于改进pca的云计算网络中高维数据可视化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李柯萱: "中庭类大空间建筑火灾风险综合评估方法研究", 《中国优秀硕士学位论文全文数据库》 *
董肇宾 等: "基于GIS的山东省中心城市发展水平综合评价", 《测绘与空间地理信息》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508051A (zh) * 2020-11-06 2021-03-16 重庆恢恢信息技术有限公司 通过大数据平台进行建筑施工项目混合聚类工作方法

Also Published As

Publication number Publication date
CN106960213B (zh) 2018-08-31

Similar Documents

Publication Publication Date Title
CN104715318A (zh) 面向通信网络的多维度运行风险评价方法
CN107454105A (zh) 一种基于ahp与灰色关联的多维网络安全评估方法
CN106845846A (zh) 大数据资产评估方法
CN111191926B (zh) 基于可拓不确定性量化法的装备抢修效能云评估方法
CN109934500A (zh) 一种配电台区的低电压评价方法、装置、设备及存储介质
CN103839183A (zh) 智能授信方法及智能授信装置
CN111898839A (zh) 电力用户的重要程度分类方法及装置
CN108197848A (zh) 一种基于直觉模糊理论的电能质量综合评估方法及装置
CN113505978A (zh) 一种不同形式城市社区的防灾功能评估方法和装置
Curado et al. Analysis and comparison of centrality measures applied to urban networks with data
CN111340325A (zh) 一种基于综合评价指标对输变电设施服务水平进行评价的方法及系统
CN108898273A (zh) 一种基于形态分析的用户侧负荷特征聚类评价方法
KR102379472B1 (ko) 시공간 피해특성을 고려한 다종 데이터 융합 분석방법
Thillaigovindan et al. A better score function for multiple criteria decision making in fuzzy environment with criteria choice under risk
CN107145608A (zh) 一种智能环卫平台应用于垃圾设备的处理管理控制系统
Chen et al. Volunteer multi-person multi-task optimization dispatch method considering two-sided matching
CN107093005A (zh) 基于大数据挖掘算法实现办税服务厅自动分级的方法
CN106960213B (zh) 一种基于大数据分析的消防安全重点单位等级排序系统
CN107622362A (zh) 一种配电网投资效益的评价方法及装置
CN102708298B (zh) 一种车载通信系统电磁兼容指标分配方法
CN104679988B (zh) 一种基于云topsis的多属性决策方法
CN116957319A (zh) 一种馆藏文物保存环境风险防控辅助决策方法
CN104462480B (zh) 基于典型性的评论大数据挖掘方法
Nasseri Ranking trapezoidal fuzzy numbers by using Hadi method
Yang et al. Multi-attribute decision making method based on probabilistic linguistic term sets and its application in the evaluation of emergency logistics capacity

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CB03 Change of inventor or designer information

Inventor after: Huang Junjian

Inventor after: Zhang Jian

Inventor after: Xu Xiaowei

Inventor after: Cai Nanxian

Inventor after: Hu Min

Inventor after: Zhang Ying

Inventor after: Wang Xinhan

Inventor after: Wu Baozhu

Inventor after: Wu Kaishun

Inventor after: Wang Xiaojia

Inventor after: Chen Xiangeng

Inventor after: Zeng Ying

Inventor after: Cai Delun

Inventor after: Zhu Bin

Inventor after: Cui Rixun

Inventor before: Cai Sikai

Inventor before: Kong Xiangming

Inventor before: Cai Yu

Inventor before: Chen Xiangeng

CB03 Change of inventor or designer information
TR01 Transfer of patent right

Effective date of registration: 20181018

Address after: 510620 Guangdong Guangzhou Tianhe District Tianhe Road Tianhe Sports Center inner street distribution room two floor

Co-patentee after: Guangdong industry Kaiyuan science and Technology Co., Ltd.

Patentee after: Guangdong Building Fire Facilities Detection Center Co., Ltd.

Address before: 510623 Guangdong Guangzhou Tianhe District Pearl River New Town 1 Jinhua Road No. 408

Patentee before: Guangdong industry Kaiyuan science and Technology Co., Ltd.

TR01 Transfer of patent right