CN115018318B - 一种社会区域风险预测分析方法与系统 - Google Patents

一种社会区域风险预测分析方法与系统 Download PDF

Info

Publication number
CN115018318B
CN115018318B CN202210622953.6A CN202210622953A CN115018318B CN 115018318 B CN115018318 B CN 115018318B CN 202210622953 A CN202210622953 A CN 202210622953A CN 115018318 B CN115018318 B CN 115018318B
Authority
CN
China
Prior art keywords
unit
neural network
probability density
density analysis
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210622953.6A
Other languages
English (en)
Other versions
CN115018318A (zh
Inventor
张玲玲
宗兵
汪涛
曹景超
宣梦君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aerospace Shenzhou Wisdom System Technology Co ltd
Original Assignee
Aerospace Shenzhou Wisdom System Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aerospace Shenzhou Wisdom System Technology Co ltd filed Critical Aerospace Shenzhou Wisdom System Technology Co ltd
Priority to CN202210622953.6A priority Critical patent/CN115018318B/zh
Publication of CN115018318A publication Critical patent/CN115018318A/zh
Application granted granted Critical
Publication of CN115018318B publication Critical patent/CN115018318B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A30/00Adapting or protecting infrastructure or their operation
    • Y02A30/60Planning or developing urban green infrastructure

Abstract

本申请公开了一种社会区域风险预测分析方法与系统,属于数据处理领域,方法包括:基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数;收集各数源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据;进行BP神经网络的训练,得到训练后的BP神经网络;进行预测分析,以热力图的方式进行展示。系统包括:概率密度分析估测模块、样本获取模块、网络训练模块、预测展示模块。本申请在保证各部门细节数据的安全同时,综合分析了更多的社会治理要素,使得预测结果更为准确可靠。

Description

一种社会区域风险预测分析方法与系统
技术领域
本申请属于数据处理领域,具体涉及一种社会区域风险预测分析方法与系统。
背景技术
当前,随着全球化和城市化的快速推进,我国城市中的经济规模和人口规模快速增大,城市管理形势也日益严峻。现有的基于地理分布的分析系统多是局限于单部门的数据的分析系统。当下城市管理系统建设逐渐成熟,为社会管理进行综合性的大数据分析,提供了丰富的数据资源。随着社会管理中各参与部门之间的整合和协同的需求越来越迫切,原有的基于单部门系统的分析评估系统已经不能满足越来越精细化的社会管理需求。
目前,基于社会管理大数据的综合分析,即跨多个部门的数据预测系统,尚未有提出有效解决方案。
发明内容
为解决现有技术中的不足,本申请提出一种社会区域风险预测分析方法与系统。
第一方面,本申请提出一种社会区域风险预测分析方法,包括如下步骤:
基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数;
收集各数源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据;
通过所述学习样本数据,进行BP神经网络的训练,得到训练后的BP神经网络;
采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示。
所述基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数,包括如下步骤:
基于m个数据源系统,根据各数据源系统所属的行业属性,依照行业标准,确定各数据源系统中对应的风险源或事件的核密度分析权重;
根据所述风险源或事件的核密度分析权重,针对当前系统风险源或事件进行核密度分析;
根据所述核密度分析结果,得到当前系统所属区域中每个风险源或事件的概率密度估测函数Fm(x,y,t):
Figure GDA0003774855210000021
其中,popi为给定的权重字段,n为POI点个数,h为带宽,K0为核函数,disti为点(x,y)到第i个点的距离,(x,y)为点的坐标值,Fm(x,y,t)为点(x,y)在第m个系统中t时段的概率密度估测值;具体实施中,时段的选取以月或者季度为单位。
所述收集各数源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据,包括如下步骤:
收集m个数据源系统的核密度分析结果以及概率密度估测函数,形成区域的m个维度的核密度分析结果及对应的概率密度估测函数,进行加密训练;
选取每个时间段的风险事件的概率密度估测函数的极值点的集合作为特征节点集合N;
针对加密训练后区域的m个维度的核密度分析结果及对应的概率密度估测函数,选取特征节点集合N同样位置的点,作为学习样本数据,并计算每个点t0时段的特征数据,公式如下:Dp={F1(xp,yp,t0),F2(xp,yp,t0),...,Fm(xp,yp,t0)},p为特征节点序号;
以t1时间段对应的风险事件的特征节点的概率密度估测值为期望值,其中,t1为t0的后续时段,进行BP神经网络的训练。
所述通过所述学习样本数据,进行BP神经网络的训练,得到最优BP神经网络,包括如下步骤:
确定BP神经网络隐层节点个数,公式为:q=logm+a
其中,m为输入层节点数目,a为1-10之间的调解常数;
选择函数tanh作为隐层神经元的激活函数和输出层神经元的激活函数,函数tanh公式为:f(z)=tanh(z)=(ez-e-z)/(ez+e-z),其中,z为任意实数;
初始化BP神经网络各权值和阈值;
计算BP神经网络各层的输出公式为:
对于隐含层第j个节点的输出
Figure GDA0003774855210000031
有:
Figure GDA0003774855210000032
其中,
Figure GDA0003774855210000033
为隐含层第j个节点的输入;
Figure GDA0003774855210000034
为输入层第i个节点的输出;f()为上述函数tanh;
对于输出层第g个节点的输出
Figure GDA0003774855210000035
有:
Figure GDA0003774855210000036
其中,
Figure GDA0003774855210000037
为输出层第g个节点的输入;
通过节点期望输出值与实际输出值确定误差计算公式:
Figure GDA0003774855210000038
其中,E为误差,
Figure GDA0003774855210000039
为输出层第i个样本第g个节点期望输出值,
Figure GDA00037748552100000310
为输出层第i个样本第g个节点实际输出值;
当误差大于预设的误差值时,不断调整神经网络各权值和阈值,直至误差小于预设的误差值为止,得到训练后的BP神经网络,调整公式如下:
Figure GDA00037748552100000311
其中,n为学习次数,δ为学习因子,vij表示BP神经网络输入层和隐含层节点之间的连接权值,wjg表示BP神经网络隐含层和输出层节点之间的连接权值,wjg的调整方法和vij是一样的。
所述采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示,包括如下步骤:
采用所述训练后的BP神经网络,通过输入当前月份所有数源系统的核密度分析结果,预测得出未来时间段的特征节点集合N的概率密度估测值;
基于未来时间段的特征节点集合N的概率密度估测值,在地理信息系统(GIS,geographic information system)中绘制核密度分析热力图,并进行展示。
第二方面,本申请提出一种社会区域风险预测分析系统,包括:
概率密度分析估测模块、样本获取模块、网络训练模块、预测展示模块;
所述概率密度分析估测模块、样本获取模块、网络训练模块、预测展示模块依次顺序相连接;
所述概率密度分析估测模块用于基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数;
所述样本获取模块用于收集各数源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据;
所述网络训练模块用于通过所述学习样本数据,进行BP神经网络的训练,得到训练后的BP神经网络;
所述预测展示模块用于采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示。
所述概率密度分析估测模块,包括:权重确定单元、核密度分析单元、估测函数获取单元;
所述权重确定单元、核密度分析单元、估测函数获取单元依次顺序相连接;
所述权重确定单元用于基于m个数据源系统,根据各数据源系统所属的行业属性,依照行业标准,确定各数据源系统中对应的风险源或事件的核密度分析权重;
所述核密度分析单元用于根据所述风险源或事件的核密度分析权重,针对当前系统风险源或事件进行核密度分析;
所述估测函数获取单元用于根据所述核密度分析结果,得到当前系统所属区域中每个风险源或事件的概率密度估测函数。
所述样本获取模块,包括:区域数据形成单元、特征集合形成单元、样本数据形成单元;
所述区域数据形成单元、特征集合形成单元、样本数据形成单元依次顺序相连接;
所述区域数据形成单元用于收集m个数据源系统的核密度分析结果以及概率密度估测函数,形成区域的m个维度的核密度分析结果及对应的概率密度估测函数,进行加密训练;
所述特征集合形成单元用于选取每个时间段的风险事件的概率密度估测函数的极值点的集合作为特征节点集合N;
所述样本数据形成单元用于针对加密训练后区域的m个维度的核密度分析结果及对应的概率密度估测函数,选取特征节点集合N同样位置的点,作为学习样本数据,并计算每个点t0时段的特征数据;
以t1时间段对应的风险事件的特征节点的概率密度估测值为期望值,其中,t1为t0的后续时段,进行BP神经网络的训练。
所述网络训练模块,包括:隐层确定单元、函数选择单元、初始化单元、输出计算单元、误差确定单元、训练输出单元;
所述隐层确定单元、函数选择单元、初始化单元、输出计算单元、误差确定单元、训练输出单元依次顺序相连接;
所述隐层确定单元用于确定BP神经网络隐层节点个数;
所述函数选择单元用于选择函数tanh作为隐层神经元的激活函数和输出层神经元的激活函数;
所述初始化单元用于初始化BP神经网络各权值和阈值;
所述输出计算单元用于计算BP神经网络各层的输出;
所述误差确定单元用于通过节点期望输出值与实际输出值确定误差计算公式;
所述训练输出单元用于当误差大于预设的误差值时,不断调整神经网络各权值和阈值,直至误差小于预设的误差值为止,得到训练后的BP神经网络。
所述预测展示模块,包括:估测值预测单元、热力图展示单元;
所述估测值预测单元、热力图展示单元相连接;
所述估测值预测单元用于采用所述训练后的BP神经网络,通过输入当前月份所有数源系统的核密度分析结果,预测得出未来时间段的特征节点集合N的概率密度估测值;
所述热力图展示单元用于基于未来时间段的特征节点集合N的概率密度估测值,在地理信息系统(GIS,geographic information system)中绘制核密度分析热力图,并进行展示。
本申请所达到的有益效果:
本申请提出一种社会区域风险预测分析方法与系统,相较于以往的单部门系统的预测,以“可用不可见”的原则,采用纵向联邦学习方式提取分析结果,保证各部门细节数据的安全同时,综合分析了更多的社会治理要素,使得预测结果更为准确可靠。
针对现有技术的数据来源的局限性,和部分数据源的保密属性,基于“可用不可见”的原则,采用联邦学习方式,进行了规避。本申请通过对来源于各种数据源的点数据,经过把风险属性作为权重进行量化,利用GIS核密度分析工具进行分析,得出地区概率密度估测函数,将分析结果带入BP神经网络进行训练。用训练好的BP神经网络,对区域的未来安全形势,进行预测分析。
附图说明
图1为本申请实施例的一种社会区域风险预测分析方法流程图;
图2为本申请实施例的得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数流程图;
图3为本申请实施例的获取学习样本数据流程图;
图4为本申请实施例的得到最优BP神经网络流程图;
图5为本申请实施例的以热力图的方式进行展示流程图;
图6为本申请实施例的一种社会区域风险预测分析系统原理框图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本申请的技术方案,而不能以此来限制本申请的保护范围。
本申请提出一种社会区域风险预测分析方法与系统。
本系统通过深入结合各部门的社会治理数据,同时避免敏感信息泄露、保障信息安全的前提下,对区域风险进行综合性的直观展示、自动评估与科学预测。
本申请基于网格地图和标准地址库建设成果,结合核密度分析、地理信息系统、BP神经网络、联邦学习、热力图等方法技术,建设风险防控一张图,为基层社会管理区域性、领域性、综合性的风险防控分析、预测提供支持,并进行直观展示,定期将分析结果推送至领导工作台,为领导提供辅助决策数据,为管理人员提前发现区域性风险提供决策支撑,采取专项管理或者综合管理等措施,最大限度降低风险事件,提高群众安全感。
本申请首先基于GIS核密度分析工具,对各领域不同系统来源的人、地、事、物、组织数据,以可能的风险程度或者已发生的事后危害程度为权重,按照时间、行政区划分别对各系统的数据进行核密度分析。在此基础上,综合当前区域不同时间段的核密度分析结果,以纵向联邦学习的方式,训练BP神经网络,进行机器学习,发现不同数源系统核密度分析结果对最终风险事件核密度分析结果的影响,从而预测出当前区域未来的管理风险走势,并在GIS上以热力图的形式直观展示。
统计学中,核密度分析(Kernel Density Estimation)用以基于有限的样本推断总体数据的分布,因此,核密度估计的结果即为样本的概率密度函数估计,根据该分析的概率密度函数,就可以得到数据分布的一些性质,如数据的聚集区域。核密度分析可用于测量建筑密度、获取风险事件情况报告等。
本申请的数源系统包括各领域不同系统的人、地、事、物、组织数据。上述列举的数源系统,数据多具有保密性质。因此,我们在进行机器学习的过程中,应保证数据隐私安全及合法合规。联邦学习(Federated Learning)是一种新兴的人工智能基础技术,在2016年由谷歌最先提出,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。其中,联邦学习可使用的机器学习算法不局限于神经网络,还包括随机森林等重要算法。联邦学习有望成为下一代人工智能协同算法和协作网络的基础。
本申请采用纵向联邦学习的方式。纵向联邦学习在两个数据集的用户重叠较多而用户特征重叠较少的情况下,我们把数据集按照纵向(即特征维度)切分,并取出双方用户相同而用户特征不完全相同的那部分数据进行训练。这种方法叫做纵向联邦学习。本实施例中,不同数源部门的数据对于本地区的治安形势的未来均有影响,但是不同部门处理的实际业务是不同的,因此它们的对本地区的特征描述交集较小。纵向联邦学习就是将这些不同特征在加密的状态下加以聚合,以增强模型能力。目前,逻辑回归模型、树形结构模型和神经网络模型等众多机器学习模型已经逐渐被证实能够建立在此联邦体系上。本实施例中,通过将不同部门的数据通过核密度分析的方法,得出地区的概率密度估测函数,进行数据聚合和机器学习,增强模型的能力。通过此方式,不同部门的数据均获得数据保护,共同提升模型的预测效果、预测模型无损失。
联邦学习优势具有以下优势:
(1)数据隔离,数据不会泄露到外部,满足用户隐私保护和数据安全的需求;
(2)能够保证模型质量无损,不会出现负迁移,保证联邦模型比割裂的独立模型效果好;
(3)参与者地位对等,能够实现公平合作;
(4)能够保证参与各方在保持独立性的情况下,进行信息与模型参数的加密交换,并同时获得成长。
第一方面,本申请提出一种社会区域风险预测分析方法,如图1所示,包括如下步骤:
步骤S1:基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数;
步骤S2:收集各数源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据;
步骤S3:通过所述学习样本数据,进行BP神经网络的训练,得到训练后的BP神经网络;
步骤S4:采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示。
所述基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数,如图2所示,包括如下步骤:
步骤S1.1:基于m个数据源系统,根据各数据源系统所属的行业属性,依照行业标准,确定各数据源系统中对应的风险源或事件的核密度分析权重;
对单个事件风险源的分级,按照风险源的行业风险大小将风险源分为一般、较大、重大风险源。事件风险等级的规则如下:
一级风险事件,是指出现下列情形之一:
(1)涉及安全领域的所有风险事件;
(2)处于上升发酵的二级风险事件二级风险事件。
二级风险事件,是指出现下列情形之一:
(1)除安全领域外,涉及其余四个领域的多领域风险事件;
(2)处于上升发酵的三级风险事件。
三级风险事件,是指出现下列情形之一:
(1)除安全领域外,涉及其余三个领域的多领域风险;
(2)除安全领域外,单个领域内重大风险事件;
(3)处于上升发酵的四级风险事件。
四级风险事件,是指出现下列情形之一:
(1)除安全领域外,涉及其余两个领域的多领域风险;
(2)除安全领域外,单个领域内较大风险事件;
(3)处于上升发酵的五级风险事件。
五级风险事件
是指除安全领域外,涉及其余的单个领域一般风险事件。
步骤S1.2:根据所述风险源或事件的核密度分析权重,针对当前系统风险源或事件进行核密度分析;
步骤S1.3:根据所述核密度分析结果,得到当前系统所属区域中每个风险源或事件的概率密度估测函数。
Figure GDA0003774855210000091
其中,popi为给定的权重字段,n为POI点个数,h为带宽,K0为核函数,disti为点(x,y)到第i个点的距离,(x,y)为点的坐标值,Fm(x,y,t)为点(x,y)在第m个系统中t时段的概率密度估测值;具体实施中,时段的选取以月或者季度为单位。
所述收集各数源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据,如图3所示,包括如下步骤:
步骤S2.1:收集m个数据源系统的核密度分析结果以及概率密度估测函数,形成区域的m个维度的核密度分析结果及对应的概率密度估测函数Fm(x,y,t),进行加密训练;
步骤S2.2:选取每个时间段的风险事件的概率密度估测函数Fm(x,y,t)的极值点的集合作为特征节点集合N;
步骤S2.3:针对加密训练后区域的m个维度的核密度分析结果及对应的概率密度估测函数,选取特征节点集合N同样位置的点,作为学习样本数据,并计算每个点t0时段的特征数据;
每个点t0时段的特征数据如下:
Dp={F1(xp,yp,t0),F2(xp,yp,t0),...,Fm(xp,yp,t0)},p为特征节点序号;
步骤S2.4:以t1时间段对应的风险事件的特征节点的概率密度估测值为期望值,其中,t1为t0的后续时段,进行BP神经网络的训练。
所述通过所述学习样本数据,进行BP神经网络的训练,得到最优BP神经网络,如图4所示,包括如下步骤:
步骤S3.1:确定BP神经网络隐层节点个数;
使用以下经验公式确定隐层节点个数
q=log m+a
其中,m为输入层节点数目,a为1-10之间的调解常数;
步骤S3.2:选择函数tanh作为隐层神经元的激活函数和输出层神经元的激活函数:
f(z)=tanh(z)=(ez-e-z)/(ez+e-z)
其中,z为任意实数。
步骤S3.3:初始化BP神经网络各权值和阈值,本实施例中,初始值均为0.01;
步骤S3.4:计算BP神经网络各层的输出;
对于隐含层第j个节点的输出
Figure GDA0003774855210000101
有:
Figure GDA0003774855210000102
其中,
Figure GDA0003774855210000103
为隐含层第j个节点的输入;
Figure GDA0003774855210000104
为输入层第i个节点的输出;f()为上述函数tanh;
对于输出层第g个节点的输出
Figure GDA0003774855210000105
有:
Figure GDA0003774855210000106
其中,
Figure GDA0003774855210000107
为输出层第g个节点的输入;
步骤S3.5:通过节点期望输出值与实际输出值确定误差计算公式;
本实施例中,误差的计算公式是:
Figure GDA0003774855210000108
其中,E为误差,
Figure GDA0003774855210000111
为输出层第i个样本第g个节点期望输出值,
Figure GDA0003774855210000112
为输出层第i个样本第g个节点实际输出值。
步骤S3.6:当误差大于预设的误差值时,不断调整神经网络各权值和阈值,直至误差小于预设的误差值为止,得到训练后的BP神经网络。
此过程中,调整的计算公式是;
Figure GDA0003774855210000113
其中,n为学习次数,δ为学习因子,vij表示BP神经网络输入层和隐含层节点之间的连接权值,wjg表示BP神经网络隐含层和输出层节点之间的连接权值,wjg的调整方法和vij是一样的。
所述采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示,如图5所示,包括如下步骤:
步骤S4.1:采用所述训练后的BP神经网络,通过输入当前月份所有数源系统的核密度分析结果,预测得出未来时间段的特征节点集合N的概率密度估测值;
步骤S4.2:基于未来时间段的特征节点集合N的概率密度估测值,在地理信息系统(GIS,geographic information system)中绘制核密度分析热力图,并进行展示。
第二方面,本申请提出一种社会区域风险预测分析系统,如图6所示,包括:
概率密度分析估测模块、样本获取模块、网络训练模块、预测展示模块;
所述概率密度分析估测模块、样本获取模块、网络训练模块、预测展示模块依次顺序相连接;
所述概率密度分析估测模块用于基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数;
所述样本获取模块用于收集各数源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据;
所述网络训练模块用于通过所述学习样本数据,进行BP神经网络的训练,得到训练后的BP神经网络;
所述预测展示模块用于采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示。
所述概率密度分析估测模块,包括:权重确定单元、核密度分析单元、估测函数获取单元;
所述权重确定单元、核密度分析单元、估测函数获取单元依次顺序相连接;
所述权重确定单元用于基于m个数据源系统,根据各数据源系统所属的行业属性,依照行业标准,确定各数据源系统中对应的风险源或事件的核密度分析权重;
所述核密度分析单元用于根据所述风险源或事件的核密度分析权重,针对当前系统风险源或事件进行核密度分析;
所述估测函数获取单元用于根据所述核密度分析结果,得到当前系统所属区域中每个风险源或事件的概率密度估测函数。
所述样本获取模块,包括:区域数据形成单元、特征集合形成单元、样本数据形成单元;
所述区域数据形成单元、特征集合形成单元、样本数据形成单元依次顺序相连接;
所述区域数据形成单元用于收集m个数据源系统的核密度分析结果以及概率密度估测函数,形成区域的m个维度的核密度分析结果及对应的概率密度估测函数,进行加密训练;
所述特征集合形成单元用于选取每个时间段的风险事件的概率密度估测函数的极值点的集合作为特征节点集合N;
所述样本数据形成单元用于针对加密训练后区域的m个维度的核密度分析结果及对应的概率密度估测函数,选取特征节点集合N同样位置的点,作为学习样本数据,并计算每个点t0时段的特征数据;
以t1时间段对应的风险事件的特征节点的概率密度估测值为期望值,其中,t1为t0的后续时段,进行BP神经网络的训练。
所述网络训练模块,包括:隐层确定单元、函数选择单元、初始化单元、输出计算单元、误差确定单元、训练输出单元;
所述隐层确定单元、函数选择单元、初始化单元、输出计算单元、误差确定单元、训练输出单元依次顺序相连接;
所述隐层确定单元用于确定BP神经网络隐层节点个数;
所述函数选择单元用于选择函数tanh作为隐层神经元的激活函数和输出层神经元的激活函数;
所述初始化单元用于初始化BP神经网络各权值和阈值;
所述输出计算单元用于计算BP神经网络各层的输出;
所述误差确定单元用于通过节点期望输出值与实际输出值确定误差计算公式;
所述训练输出单元用于当误差大于预设的误差值时,不断调整神经网络各权值和阈值,直至误差小于预设的误差值为止,得到训练后的BP神经网络。
所述预测展示模块,包括:估测值预测单元、热力图展示单元;
所述估测值预测单元、热力图展示单元相连接;
所述估测值预测单元用于采用所述训练后的BP神经网络,通过输入当前月份所有数源系统的核密度分析结果,预测得出未来时间段的特征节点集合N的概率密度估测值;
所述热力图展示单元用于基于未来时间段的特征节点集合N的概率密度估测值,在地理信息系统(GIS,geographic information system)中绘制核密度分析热力图,并进行展示。
本申请申请人结合说明书附图对本申请的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本申请的优选实施方案,详尽的说明只是为了帮助读者更好地理解本申请精神,而并非对本申请保护范围的限制,相反,任何基于本申请的发明精神所作的任何改进或修饰都应当落在本申请的保护范围之内。

Claims (6)

1.一种社会区域风险预测分析方法,其特征在于,包括以下步骤:
基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数;
收集各数据源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据;
通过所述学习样本数据,进行BP神经网络的训练,得到训练后的BP神经网络;
采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示;
所述基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数,包括如下步骤:
基于m个数据源系统,根据各数据源系统所属的行业属性,依照行业标准,确定各数据源系统中对应的风险源或事件的核密度分析权重;
根据所述风险源或事件的核密度分析权重,针对当前系统风险源或事件进行核密度分析;
根据所述核密度分析结果,得到当前系统所属区域中每个风险源或事件的概率密度估测函数Fm(x,y,t):
Figure FDA0004045097320000011
其中,popi为给定的权重字段,n1为POI点个数,h为带宽,K0为核函数,disti为点(x,y)到第i个点的距离,(x,y)为点的坐标值,Fm(x,y,t)为点(x,y)在第m个数据源系统中t时段的概率密度估测值;具体实施中,时段的选取以月或者季度为单位;
所述收集各数据源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据,包括如下步骤:
收集m个数据源系统的核密度分析结果以及概率密度估测函数,形成区域的m个维度的核密度分析结果及对应的概率密度估测函数,进行加密训练;
选取每个时间段的风险源或事件的概率密度估测函数的极值点的集合作为特征节点集合N;
针对加密训练后区域的m个维度的核密度分析结果及对应的概率密度估测函数,选取特征节点集合N同样位置的点,作为学习样本数据,并计算每个点t0时段的特征数据,公式如下:Dp={F1(xp,yp,t0),F2(xp,yp,t0),...,Fm(xp,yp,t0)},p为特征节点序号;
以t1时间段对应的风险源或事件的特征节点的概率密度估测值为期望值,其中,t1为t0的后续时段,进行BP神经网络的训练。
2.根据权利要求1所述的社会区域风险预测分析方法,其特征在于:所述通过所述学习样本数据,进行BP神经网络的训练,得到训练后的BP神经网络,包括如下步骤:
确定BP神经网络隐含层节点个数,公式为:q=logn2+a
其中,n2为输入层节点数目,a为1-10之间的调解常数;
选择函数tanh作为隐含层神经元的激活函数和输出层神经元的激活函数,函数tanh公式为:f(z=tanh(z)ez-e-z)/ez+e-z),其中,z为任意实数;
初始化BP神经网络各权值和阈值;
计算BP神经网络各层的输出,公式为:
对于隐含层第j个节点的输出
Figure FDA00040450973200000210
有:
Figure FDA0004045097320000021
其中,
Figure FDA0004045097320000022
为隐含层第j个节点的输入;
Figure FDA0004045097320000023
为输入层第i个节点的输出;f为上述函数tanh;
对于输出层第g个节点的输出
Figure FDA0004045097320000029
有:
Figure FDA0004045097320000024
其中,
Figure FDA0004045097320000025
为输出层第g个节点的输入;
通过节点期望输出值与实际输出值确定误差计算公式:
Figure FDA0004045097320000026
其中,E为误差,
Figure FDA0004045097320000027
为输出层第g个节点期望输出值,
Figure FDA0004045097320000028
为输出层第g个节点实际输出值;
当误差大于预设的误差值时,不断调整神经网络各权值和阈值,直至误差小于预设的误差值为止,得到训练后的BP神经网络,调整公式如下:
Figure FDA0004045097320000031
其中,n3为学习次数,δ为学习因子,vij表示BP神经网络输入层和隐含层节点之间的连接权值,wjg表示BP神经网络隐含层和输出层节点之间的连接权值,wjg的调整方法和vij是一样的。
3.根据权利要求1所述的社会区域风险预测分析方法,其特征在于:所述采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示,包括如下步骤:
采用所述训练后的BP神经网络,通过输入当前月份所有数据源系统的核密度分析结果,预测得出未来时间段的特征节点集合N的概率密度估测值;
基于未来时间段的特征节点集合N的概率密度估测值,在地理信息系统中绘制核密度分析热力图,并进行展示。
4.一种社会区域风险预测分析系统,其特征在于:概率密度分析估测模块、样本获取模块、网络训练模块、预测展示模块;
所述概率密度分析估测模块、样本获取模块、网络训练模块、预测展示模块依次顺序相连接;
所述概率密度分析估测模块用于基于地理信息系统,采用核密度分析的方法,得到各数据源系统不同时段的核密度分析结果以及概率密度估测函数;
所述样本获取模块用于收集各数据源系统不同时段的核密度分析结果以及概率密度估测函数,通过纵向联邦学习的方式进行时间段和特征节点对齐,获取学习样本数据;
所述网络训练模块用于通过所述学习样本数据,进行BP神经网络的训练,得到训练后的BP神经网络;
所述预测展示模块用于采用所述训练后的BP神经网络,进行预测分析,以热力图的方式进行展示;
所述概率密度分析估测模块,包括:权重确定单元、核密度分析单元、估测函数获取单元;
所述权重确定单元、核密度分析单元、估测函数获取单元依次顺序相连接;
所述权重确定单元用于基于m个数据源系统,根据各数据源系统所属的行业属性,依照行业标准,确定各数据源系统中对应的风险源或事件的核密度分析权重;
所述核密度分析单元用于根据所述风险源或事件的核密度分析权重,针对当前系统风险源或事件进行核密度分析;
所述估测函数获取单元用于根据所述核密度分析结果,得到当前系统所属区域中每个风险源或事件的概率密度估测函数;
所述概率密度估测函数Fm(x,y,t):
Figure FDA0004045097320000041
其中,popi为给定的权重字段,n1为POI点个数,h为带宽,K0为核函数,disti为点(x,y)到第i个点的距离,(x,y)为点的坐标值,Fm(x,y,t)为点(x,y)在第m个数据源系统中t时段的概率密度估测值;具体实施中,时段的选取以月或者季度为单位;
所述样本获取模块,包括:区域数据形成单元、特征集合形成单元、样本数据形成单元;
所述区域数据形成单元、特征集合形成单元、样本数据形成单元依次顺序相连接;
所述区域数据形成单元用于收集m个数据源系统的核密度分析结果以及概率密度估测函数,形成区域的m个维度的核密度分析结果及对应的概率密度估测函数,进行加密训练;
所述特征集合形成单元用于选取每个时间段的风险源或事件的概率密度估测函数的极值点的集合作为特征节点集合N;
所述样本数据形成单元用于针对加密训练后区域的m个维度的核密度分析结果及对应的概率密度估测函数,选取特征节点集合N同样位置的点,作为学习样本数据,并计算每个点t0时段的特征数据,公式如下:
Dp={F1(xp,yp,t0),F2(xp,yp,t0),...,Fm(xp,yp,t0)},p为特征节点序号;
以t1时间段对应的风险源或事件的特征节点的概率密度估测值为期望值,其中,t1为t0的后续时段,进行BP神经网络的训练。
5.根据权利要求4所述的社会区域风险预测分析系统,其特征在于:所述网络训练模块,包括:隐含层确定单元、函数选择单元、初始化单元、输出计算单元、误差确定单元、训练输出单元;
所述隐含层确定单元、函数选择单元、初始化单元、输出计算单元、误差确定单元、训练输出单元依次顺序相连接;
所述隐含层确定单元用于确定BP神经网络隐含层节点个数;
所述函数选择单元用于选择函数tanh作为隐含层神经元的激活函数和输出层神经元的激活函数;
所述初始化单元用于初始化BP神经网络各权值和阈值;
所述输出计算单元用于计算BP神经网络各层的输出;
所述误差确定单元用于通过节点期望输出值与实际输出值确定误差计算公式;
所述训练输出单元用于当误差大于预设的误差值时,不断调整神经网络各权值和阈值,直至误差小于预设的误差值为止,得到训练后的BP神经网络。
6.根据权利要求4所述的社会区域风险预测分析系统,其特征在于:所述预测展示模块,包括:估测值预测单元、热力图展示单元;
所述估测值预测单元、热力图展示单元相连接;
所述估测值预测单元用于采用所述训练后的BP神经网络,通过输入当前月份所有数据源系统的核密度分析结果,预测得出未来时间段的特征节点集合N的概率密度估测值;
所述热力图展示单元用于基于未来时间段的特征节点集合N的概率密度估测值,在地理信息系统中绘制核密度分析热力图,并进行展示。
CN202210622953.6A 2022-06-01 2022-06-01 一种社会区域风险预测分析方法与系统 Active CN115018318B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210622953.6A CN115018318B (zh) 2022-06-01 2022-06-01 一种社会区域风险预测分析方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210622953.6A CN115018318B (zh) 2022-06-01 2022-06-01 一种社会区域风险预测分析方法与系统

Publications (2)

Publication Number Publication Date
CN115018318A CN115018318A (zh) 2022-09-06
CN115018318B true CN115018318B (zh) 2023-04-18

Family

ID=83072546

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210622953.6A Active CN115018318B (zh) 2022-06-01 2022-06-01 一种社会区域风险预测分析方法与系统

Country Status (1)

Country Link
CN (1) CN115018318B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116663912A (zh) * 2023-07-31 2023-08-29 中国铁路设计集团有限公司 铁路外部环境空间安全风险评估方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458370A (zh) * 2019-08-19 2019-11-15 南京航空航天大学 一种基于开放数据的城市道路安全预测方法及系统
CN113283665A (zh) * 2021-06-10 2021-08-20 北京邮电大学 一种基于路网的城市交通事故风险预测方法
WO2022007321A1 (zh) * 2020-07-10 2022-01-13 深圳前海微众银行股份有限公司 纵向联邦建模优化方法、装置、设备及可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955804B (zh) * 2014-05-20 2017-06-13 中山大学 一种服务于警务防控分区规划的犯罪风险时空模式识别方法
CN112116176B (zh) * 2019-06-19 2022-11-04 云南电网有限责任公司玉溪供电局 基于气象因素的地区绝缘子群污闪风险评估方法和系统
CN110796859A (zh) * 2019-10-28 2020-02-14 长安大学 基于交通流的实时交通状态辨识及事故风险预警方法
CN110956275B (zh) * 2019-11-27 2021-04-02 支付宝(杭州)信息技术有限公司 风险预测和风险预测模型的训练方法、装置及电子设备
CN113408867B (zh) * 2021-05-28 2023-07-21 北京大学 基于手机用户和poi数据的城市入室盗窃犯罪风险评估方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110458370A (zh) * 2019-08-19 2019-11-15 南京航空航天大学 一种基于开放数据的城市道路安全预测方法及系统
WO2022007321A1 (zh) * 2020-07-10 2022-01-13 深圳前海微众银行股份有限公司 纵向联邦建模优化方法、装置、设备及可读存储介质
CN113283665A (zh) * 2021-06-10 2021-08-20 北京邮电大学 一种基于路网的城市交通事故风险预测方法

Also Published As

Publication number Publication date
CN115018318A (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
AU2018101946A4 (en) Geographical multivariate flow data spatio-temporal autocorrelation analysis method based on cellular automaton
CN111353413B (zh) 一种输电设备低漏报率缺陷识别方法
CN107977673B (zh) 一种基于大数据的经济活动人口识别方法
CN110728656A (zh) 基于元学习的无参考图像质量数据处理方法、智能终端
CN107027023A (zh) 基于神经网络的VoIP无参考视频通信质量客观评价方法
CN103796183B (zh) 一种垃圾短信识别方法及装置
WO2020177484A1 (zh) 一种本地化差分隐私城市环卫数据报告和隐私计算方法
CN112054943B (zh) 一种移动网络基站流量预测方法
CN111709914B (zh) 一种基于hvs特性的无参考图像质量评价方法
CN115018318B (zh) 一种社会区域风险预测分析方法与系统
CN107257419B (zh) 一种基于贝叶斯分析人际关系量化估值方法
CN110428412A (zh) 图像质量的评价及模型生成方法、装置、设备和存储介质
Conley et al. Estimating dynamic local interactions models
CN110377846A (zh) 社交关系挖掘方法、装置、存储介质和计算机设备
CN111080501A (zh) 基于手机信令数据的真实人群密度时空分布估算方法
CN114493052A (zh) 多模型融合自适应新能源功率预测方法和系统
CN113112032A (zh) 基于联邦学习的航班延误预测系统及方法
CN110716998B (zh) 一种精细尺度人口数据空间化方法
Montero-Parejo et al. Visual impact assessment of colour and scale of buildings on the rural landscape.
CN115810149A (zh) 基于超像素与图卷积的高分辨率遥感图像建筑物提取方法
CN113743796B (zh) 基于权重的多约束条件双随机抽查方法
CN109995549B (zh) 一种评估流量价值的方法及装置
Andersson et al. Combining street-level and aerial images for dengue incidence rate estimation
CN108647189B (zh) 一种识别用户人群属性的方法及装置
CN115936264A (zh) 单日工程量计算方法、阶段性工程量预测方法及预测装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant