CN115293465A - 一种人群密度预测方法及系统 - Google Patents

一种人群密度预测方法及系统 Download PDF

Info

Publication number
CN115293465A
CN115293465A CN202211224188.9A CN202211224188A CN115293465A CN 115293465 A CN115293465 A CN 115293465A CN 202211224188 A CN202211224188 A CN 202211224188A CN 115293465 A CN115293465 A CN 115293465A
Authority
CN
China
Prior art keywords
time
crowd density
data
representing
time point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211224188.9A
Other languages
English (en)
Other versions
CN115293465B (zh
Inventor
付佳
冯灏
尹玄鲲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maple Valley Chengdu Technology Co ltd
Original Assignee
Maple Valley Chengdu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maple Valley Chengdu Technology Co ltd filed Critical Maple Valley Chengdu Technology Co ltd
Priority to CN202211224188.9A priority Critical patent/CN115293465B/zh
Publication of CN115293465A publication Critical patent/CN115293465A/zh
Application granted granted Critical
Publication of CN115293465B publication Critical patent/CN115293465B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Tourism & Hospitality (AREA)
  • Biomedical Technology (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Marketing (AREA)
  • Biophysics (AREA)
  • Primary Health Care (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种人群密度预测方法及系统,所述方法包括:建立人群密度预测数据集;根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;通过所述人群密度预测数据集对所述人群密度预测模型进行训练;对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。本发明基于全要素分析、真实历史数据和极端情况模拟仿真,实现了可靠、完备的人群密度演化信息收集和数据集建立。本发明基于时空波动容错机制,提升了人群密度预测算法的鲁棒性。本发明基于精度和时效权衡,实现了按需进行的人群密度预测。

Description

一种人群密度预测方法及系统
技术领域
本发明属于应急安全管理技术领域,特别涉及一种人群密度预测方法及系统。
背景技术
在公共安全管理领域,人群密度是管理者和执勤人员重点关注的关键表征指标之一。目前,已经存在多种实现公共场所人群密度实时或离线测量的方法。比如,通过基于物联网的传感器定位系统(如室外GPS、移动通讯基站定位、室内近场通讯定位)和基于摄像头图像识别和分析的人群定位方法。事实上,即使在不存在现代定位系统的情况下,公共安全管理者或执勤人员也可以通过肉眼判断,从现场情况或视频图像上大致获得人群密度分布的信息。然而,从发现人群密度异常,到管理者做决策启动相应预案,再到调动人力物力资源来进行人群密度干预(比如疏散),往往需要一段较长的时间,从而可能错过安全管理的最佳时机。由于人群受物理条件限制的自然流动以及受心理因素影响的趋利避害等造成人群密度异常变化的事件的发生需要一个较长的要素累积过程,所以通过分析特定场景下,人群及其所在场景的历史演化或模拟仿真数据就可以识别、测量和构建这些前置要素和未来人群密度的关系,从而实现人群密度的预测。
综上所述,现有人群密度监控主要集中在实时测量上。然而聚集性人群事故,如踩踏的发生和发展的时间很短,一旦发生场面混乱。因此发现人群大量聚集之后再进行处理,事实上已经错过干预时机。所以,如何提前预测人群的密度分布变化,为实施干预措施争取尽可能多的时间,是人群密度监控目前的关键难点问题。
发明内容
针对背景技术中存在问题,本发明提供一种人群密度预测方法及系统,用于解决现有人群密度监控无法预测的问题,目的在于提前预测人群的密度分布变化,为实施干预措施争取尽可能多的时间。
本发明提供了:一种人群密度预测方法,包括:
建立人群密度预测数据集;
根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
优选地,在所述的建立人群密度预测数据集之前包括:
获取人群密度时空演化序列数据;
获取与人群密度演化相关的相关要素;
获取相关要素的历史演化数据;
通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集;
对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识,构建全场景样本数据集,所述场景包括日常场景和特殊场景。
优选地,所述的获取人群密度时空演化序列数据包括:
将感兴趣区域划分为多个子区域:
Figure 724321DEST_PATH_IMAGE001
;(1)
其中,S表示感兴趣区域集合,j表示感兴趣区域集合中任意一子区域的标号,m表示感兴趣区域集合中最后一子区域的标号,S1表示第一子区域,Sj表示第j子区域,Sm表示第m子区域;
实时测量每个子区域的人群密度,并按矢量的数据结构进行存储:
Figure 610237DEST_PATH_IMAGE002
;(2)
其中,
Figure 936176DEST_PATH_IMAGE003
表示多个子区域的人群密度集合,
Figure 223938DEST_PATH_IMAGE004
表示第一子区域的人群密度,
Figure 344341DEST_PATH_IMAGE005
表 示第j子区域的人群密度,
Figure 655237DEST_PATH_IMAGE006
表示第m子区域的人群密度;
以时间间隔
Figure 643921DEST_PATH_IMAGE007
存储每个子区域的人群密度,得到人群密度时空演化序列数据:
Figure 661556DEST_PATH_IMAGE008
;(3)
其中,
Figure 546335DEST_PATH_IMAGE009
表示人群密度时空演化序列数据,
Figure 78948DEST_PATH_IMAGE010
表示tn时刻、第一子区域S1的人群密 度,
Figure 871323DEST_PATH_IMAGE011
表示tn时刻、第二子区域S2的人群密度,
Figure 743464DEST_PATH_IMAGE012
表示tn时刻、第m子区域Sm的人群密度;n表 示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表示 时间序列中第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 595883DEST_PATH_IMAGE013
表示时间间隔。
优选地,所述的获取与人群密度演化相关的相关要素包括:
获取调查数据;
从所述调查数据中获取与人群密度演化相关的相关要素;
将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集,并用矢量表示:
Figure 819053DEST_PATH_IMAGE014
;(4)
其中,
Figure 149541DEST_PATH_IMAGE015
表示相关要素集,x1表示第一个相关要素,xi表示第i个相关要素,xd表示第 d个相关要素,d表示相关要素的个数。
优选地,所述的获取相关要素的历史演化数据包括:
获取感兴趣区域内的历史信息;
从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据,所述历史 状态演化数据被表征时间序列按时间间隔
Figure 141767DEST_PATH_IMAGE007
存储:
Figure 165087DEST_PATH_IMAGE016
;(5)
其中,
Figure 609975DEST_PATH_IMAGE017
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 744153DEST_PATH_IMAGE018
表示tn时刻获取的第 一个相关要素;
Figure 856466DEST_PATH_IMAGE019
表示tn时刻获取的第i个相关要素,
Figure 253949DEST_PATH_IMAGE020
表示tn时刻获取的第d个相关要素,n 表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表 示时间序列中的第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时 间,
Figure 576346DEST_PATH_IMAGE021
表示时间间隔。
优选地,所述时序数据集为:
Figure 124002DEST_PATH_IMAGE022
;(6)
其中,tn表示时间序列中的第n个时间点的具体时间,n表示时间序列中的第n个时 间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,
Figure 215455DEST_PATH_IMAGE017
表示tn时刻获得的相关要素的 历史状态演化数据,
Figure 190364DEST_PATH_IMAGE023
表示人群密度时空演化序列数据。
优选地,所述的将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集之后包括:
计算相关要素集中每个要素与每个区域的人群密度之间的相关性系数rij
Figure 57DEST_PATH_IMAGE024
;(7)
其中,i表示相关要素集中第i个要素,tn表示时间序列中的第n个时间点的具体时 间,
Figure 351404DEST_PATH_IMAGE025
表示tn时刻的相关要素中的第i个要素的值,
Figure 297363DEST_PATH_IMAGE026
表示第tn时刻第j个子区域的人群密 度值,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间 点,n=2时,表示第二个时间点,
Figure 708753DEST_PATH_IMAGE027
为序列
Figure 740163DEST_PATH_IMAGE028
和序列
Figure 629621DEST_PATH_IMAGE029
的协方差,
Figure 695666DEST_PATH_IMAGE030
Figure 12378DEST_PATH_IMAGE031
Figure 531084DEST_PATH_IMAGE032
和序列
Figure 958654DEST_PATH_IMAGE033
的方差;
将所述相关性系数与设定的相关性阈值进行对比;
将所述相关性系数大于等于设定的相关性阈值的相关要素保留为初步关键要素:
Figure 144785DEST_PATH_IMAGE034
;(8)
其中,
Figure 897977DEST_PATH_IMAGE035
表示初步关键要素集,
Figure 638400DEST_PATH_IMAGE036
表示第i个初步关键要素,
Figure 322191DEST_PATH_IMAGE037
表示初步关键要 素集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相 关性阈值,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标号,p 表示初步关键要素的个数,m表示感兴趣区域集合中子区域的个数。
优选地,在所述的将所述相关性系数与设定的相关性阈值进行对比之后包括:
将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素,并形成待定要素集:
Figure 300512DEST_PATH_IMAGE038
;(9)
其中,
Figure 21343DEST_PATH_IMAGE039
表示待定要素集,
Figure 514641DEST_PATH_IMAGE040
表示第i个待定要素,
Figure 549593DEST_PATH_IMAGE041
表示待定要素集中第i个要 素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈值,
Figure 179158DEST_PATH_IMAGE042
表 示第i个待定要素,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域 的标号,d表示相关要素的个数,p表示初步关键要素的个数,d-p表示总共有d-p个待定要 素,m表示感兴趣区域集合中子区域的个数。
优选地,所述全场景样本数据集为:
Figure 274153DEST_PATH_IMAGE043
;(10)
其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间 点,n=2表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一个场景,a=2表 示个场景,a=h表示第h个场景,
Figure 254747DEST_PATH_IMAGE044
表示在第a个场景中要素集在第n个时间点的状态数据,
Figure 14762DEST_PATH_IMAGE045
表示在第a场景中、第n个时间点的人群密度分布数据。
优选地,包括:
建立初步关键要素的状态信息演化数据与相对初步关键要素采集时刻一段时间后的人群密度分布数据之间的关系,形成人群密度预测数据集:
Figure 764412DEST_PATH_IMAGE046
;(11)
其中,k表示样本集中收集数据的参考时间点;q为回溯时间偏移量,表示从参考时 间点往前回溯时间点的数目,m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的 终止时刻;
Figure 30308DEST_PATH_IMAGE047
表示k-q时刻的关键要素状态数据;
Figure 232619DEST_PATH_IMAGE048
表示k-q下一时刻,即k-q+1时刻 的关键要素状态数据;
Figure 874953DEST_PATH_IMAGE049
表示样本数据收集的参考时间点k时刻的关键要素状态数据;
Figure 213531DEST_PATH_IMAGE050
表示从k-q到k时间段内要素状态数据的集合;
Figure 650328DEST_PATH_IMAGE051
表示在未来第k+l个时 间点的人群密度分布。
优选地,所述的根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型包括:
基于人群密度预测数据集,在tn时刻,人群密度预测模型
Figure 339936DEST_PATH_IMAGE052
的计算值由基于知识 模型的预测函数
Figure 254802DEST_PATH_IMAGE053
计算结果和基于机器学习算法的预测模型
Figure 979044DEST_PATH_IMAGE054
的计算结果加和而成:
Figure 586743DEST_PATH_IMAGE055
;(12)
优选地,根据使用场景及硬件条件,选择不同的基于机器学习算法的预测模型,所述基于机器学习算法的预测模型包括:随机森林模型、多元线性回归模型、LSTM(LongShort-Term Memory,长短期记忆网络)模型和CNN(Convolutional Neural Networks,卷积神经网络)模型。
优选地,包括:
将人群密度预测值与当前预测时间点n′邻近时刻范围k内的人群密度的真实测量值的最大差异作为预测误差函数:
Figure 763647DEST_PATH_IMAGE056
;(13)
其中,
Figure 482204DEST_PATH_IMAGE057
表示第j个子区域的误差函数,n′表示当前预测时间点,k表示邻近时 刻范围,
Figure 60953DEST_PATH_IMAGE058
是第j个子区域、第i′时间点的人群密度的真实测量值,i′表示在时刻n′-k 和n′+k之间的任意一个时间点,
Figure 839553DEST_PATH_IMAGE059
是第j个子区域、在当前预测时间点n′的人群密度预 测值;
通过所述预测误差函数对训练后的人群密度预测模型进行优化。
本发明还提供一种人群密度预测系统,包括:
建立单元,用于建立人群密度预测数据集;
构建单元,用于根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
训练单元,用于通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
优化单元,用于对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
优选地,包括:
获取单元,用于获取人群密度时空演化序列数据、获取与人群密度演化相关的相关要素以及获取相关要素的历史演化数据;
匹配单元,用于通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集;
标识单元,用于对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识,构建全场景样本数据集,所述场景包括日常场景和特殊场景。
优选地,获取单元包括:
划分模块,用于将感兴趣区域划分为多个子区域:
Figure 503753DEST_PATH_IMAGE001
;(1)
其中,S表示感兴趣区域集合,j表示感兴趣区域集合中任意一子区域的标号,m表示感兴趣区域集合中最后一子区域的标号,S1表示第一子区域,Sj表示第j子区域,Sm表示第m子区域;
测量模块,用于实时测量每个子区域的人群密度,并按矢量的数据结构进行存储:
Figure 26001DEST_PATH_IMAGE060
;(2)
其中,
Figure 459256DEST_PATH_IMAGE003
表示多个子区域的人群密度集合,
Figure 408758DEST_PATH_IMAGE004
表示第一子区域的人群密度,
Figure 318111DEST_PATH_IMAGE005
表 示第j子区域的人群密度,
Figure 644051DEST_PATH_IMAGE006
表示第m子区域的人群密度;
以时间间隔
Figure 931812DEST_PATH_IMAGE061
存储每个子区域的人群密度,得到人群密度时空演化序列数据:
Figure 848953DEST_PATH_IMAGE062
;(3)
其中,
Figure 363111DEST_PATH_IMAGE063
表示人群密度时空演化序列数据,
Figure 351795DEST_PATH_IMAGE010
表示tn时刻、第一子区域S1的人群密 度,
Figure 369430DEST_PATH_IMAGE064
表示tn时刻、第二子区域S2的人群密度,
Figure 50947DEST_PATH_IMAGE065
表示tn时刻、第m子区域Sm的人群密度;n表 示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表示 时间序列中第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 786822DEST_PATH_IMAGE013
表示时间间隔。
优选地,获取单元包括:
第一获取模块,用于获取调查数据以及从所述调查数据中获取与人群密度演化相关的相关要素;
建立模块,用于将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集,并用矢量表示:
Figure 313618DEST_PATH_IMAGE066
;(4)
其中,
Figure 451338DEST_PATH_IMAGE015
表示相关要素集,x1表示第一个相关要素,xi表示第i个相关要素,xd表示第 d个相关要素,d表示相关要素的个数。
优选地,获取单元包括:
第二获取模块,用于获取感兴趣区域内的历史信息,以及从所述感兴趣区域内的 历史信息中获取相关要素的历史状态演化数据,所述历史状态演化数据被表征时间序列按 时间间隔
Figure 303757DEST_PATH_IMAGE067
存储:
Figure 261349DEST_PATH_IMAGE016
;(5)
其中,
Figure 857415DEST_PATH_IMAGE017
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 849642DEST_PATH_IMAGE068
表示tn时刻获取的 第一个相关要素;
Figure 607382DEST_PATH_IMAGE069
表示tn时刻获取的第i个相关要素,
Figure 317849DEST_PATH_IMAGE070
表示tn时刻获取的第d个相关要 素,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点, tn表示时间序列中的第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体 时间,
Figure 452027DEST_PATH_IMAGE021
表示时间间隔。
优选地,所述时序数据集为:
Figure 298761DEST_PATH_IMAGE071
;(6)
其中,tn表示时间序列中的第n个时间点的具体时间,n表示时间序列中的第n个时 间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,
Figure 227402DEST_PATH_IMAGE017
表示tn时刻获得的相关要素的 历史状态演化数据,
Figure 159586DEST_PATH_IMAGE023
表示人群密度时空演化序列数据。
优选地,包括:
计算单元,用于计算相关要素集中每个要素与每个区域的人群密度之间的相关性系数rij
Figure 97455DEST_PATH_IMAGE072
;(7)
其中,i表示相关要素集中第i个要素,tn表示时间序列中的第n个时间点的具体时 间,
Figure 64274DEST_PATH_IMAGE073
表示tn时刻的相关要素中的第i个要素的值,
Figure 163817DEST_PATH_IMAGE026
表示第tn时刻第j个子区域的人群密 度值,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间 点,n=2时,表示第二个时间点,
Figure 848877DEST_PATH_IMAGE074
为序列
Figure 324857DEST_PATH_IMAGE075
和序列
Figure 146183DEST_PATH_IMAGE076
的协方差,
Figure 416627DEST_PATH_IMAGE077
Figure 323403DEST_PATH_IMAGE031
Figure 603075DEST_PATH_IMAGE032
和序列
Figure 75644DEST_PATH_IMAGE033
的方差;
对比单元,用于将所述相关性系数与设定的相关性阈值进行对比;
第一筛选单元,用于将所述相关性系数大于等于设定的相关性阈值的相关要素保留为初步关键要素:
Figure 985832DEST_PATH_IMAGE078
;(8)
其中,
Figure 176642DEST_PATH_IMAGE035
表示初步关键要素集,
Figure 869791DEST_PATH_IMAGE036
表示第i个初步关键要素,
Figure 790343DEST_PATH_IMAGE079
表示初步关键要 素集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相 关性阈值,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标号,p 表示初步关键要素的个数,m表示感兴趣区域集合中子区域的个数。
优选地,包括:
第二筛选单元,还用于将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素,并形成待定要素集:
Figure 543535DEST_PATH_IMAGE080
;(9)
其中,
Figure 283958DEST_PATH_IMAGE081
表示待定要素集,
Figure 780798DEST_PATH_IMAGE040
表示第i个待定要素,
Figure 555856DEST_PATH_IMAGE041
表示待定要素集中第i个要 素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈值,
Figure 479950DEST_PATH_IMAGE042
表 示第i个待定要素,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域 的标号,d表示相关要素的个数,p表示初步关键要素的个数,d-p表示总共有d-p个待定要 素,m表示感兴趣区域集合中子区域的个数。
优选地,所述全场景样本数据集为:
Figure 973248DEST_PATH_IMAGE043
;(10)
其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间 点,n=2表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一个场景,a=2表 示个场景,a=h表示第h个场景,
Figure 8200DEST_PATH_IMAGE082
表示在第a个场景中要素集在第n个时间点的状态数据,
Figure 637765DEST_PATH_IMAGE045
表示在第a场景中、第n个时间点的人群密度分布数据。
优选地,包括:
形成单元,建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系,形成人群密度预测数据集:
Figure 732760DEST_PATH_IMAGE083
;(11)
其中,k表示样本集中收集数据的参考时间点;q为回溯时间偏移量,表示从参考时 间点往前回溯时间点的数目,m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的 终止时刻;
Figure 447775DEST_PATH_IMAGE047
表示k-q时刻的关键要素状态数据;
Figure 286418DEST_PATH_IMAGE048
表示k-q下一时刻,即k-q+1时刻 的关键要素状态数据;
Figure 36068DEST_PATH_IMAGE049
表示样本数据收集的参考时间点k时刻的关键要素状态数据;
Figure 36385DEST_PATH_IMAGE050
表示从k-q到k时间段内要素状态数据的集合;
Figure 238696DEST_PATH_IMAGE051
表示在未来第k+l个时 间点的人群密度分布。
优选地,基于人群密度预测数据集,在tn时刻,人群密度预测模型
Figure 615451DEST_PATH_IMAGE052
的计算值由 基于知识模型的预测函数
Figure 219608DEST_PATH_IMAGE053
计算结果和基于机器学习算法的预测模型
Figure 656405DEST_PATH_IMAGE084
的计算结果 加和而成:
Figure 346012DEST_PATH_IMAGE055
;(12)
优选地,根据使用场景及硬件条件,选择不同的基于机器学习算法的预测模型,所述基于机器学习算法的预测模型包括:随机森林模型、多元线性回归模型、LSTM模型和CNN模型。
优选地,将人群密度预测值与当前预测时间点n′邻近时刻范围k内的人群密度的真实测量值的最大差异作为预测误差函数:
Figure 526458DEST_PATH_IMAGE085
;(13)
其中,
Figure 250700DEST_PATH_IMAGE057
表示第j个子区域的误差函数,n′表示当前预测时间点,k表示邻近时 刻范围,
Figure 858399DEST_PATH_IMAGE058
是第j个子区域、第i′时间点的人群密度的真实测量值,i′表示在时刻n′-k 和n′+k之间的任意一个时间点,
Figure 769723DEST_PATH_IMAGE086
是第j个子区域、在当前预测时间点n′的人群密度预 测值;
通过所述预测误差函数对训练后的人群密度预测模型进行优化。
本发明的有益效果:本发明基于全要素分析、真实历史数据和极端情况模拟仿真,实现了可靠、完备的人群密度演化信息收集和数据集建立。
本发明基于时空波动容错机制,提升了人群密度预测算法的鲁棒性。
本发明基于精度和时效权衡,实现了按需进行的人群密度预测。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。
附图说明
图1是本发明一种人群密度预测方法的流程图;
图2是本发明以火车站进站大厅为例进行人群密度预测的方法流程图;
图3是本发明一种人群密度预测系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了具有时间与空间容错机制的全情景人群密度预测方法,可以用于日常和极端情况下的人群密度的提前感知。本发明包括三个相互联系的部分。第一部分提出了获取与人群密度变化相关的要素以及对其进行量化处理的方法。该方法从专家知识、经验和数据分析出发,筛选出特定情景下与人群密度变化相关的要素,并系统地建立量化和获取它们的办法。第二部分提出了根据第一部所获取的要素预测人群密度未来变化的方法。该方法首先通过知识和数据双驱动的联合型算法建立起人群密度和相关要素之间的带参数的映射关系,把人群密度预测问题转化为参数优化问题。然后,为了实际求解相应的优化问题,该部分根据应用场景特点,进一步建立了相应的样本数据集和提出了针对性的优化目标。具体来说,首先,针对第一部分所筛选出来的要素,收集其历史状态演化信息,并通过时间序列匹配与人群密度变化建立联系,形成样本数据集。对于现有场景历史演化未曾涉及的极端物理环境和恶性事件,该方法也通过仿真模拟进行了数据扩充以确保数据集对人群安全管理全情景的覆盖。然后,在优化目标的设计上,考虑到在真实人群安全管理中,人群密度预测更多的是关注峰值、趋势出现的时间和空间区间,允许密度时序有一定的不确定性。所以,该方法针对性地设计了具有鲁棒性的优化目标,使得优化出来的预测模型具有时空序列上的容错机制,能够包容在人群密度预测时存在的时序错配。第三部分为基于第二部分所述的参数模型、数据集和优化目标,通过优化算法具体求解优化问题,获得适用于不同预测精度和时效要求的预测模型用于人群密度预测。
图1示出了本发明一种人群密度预测方法的流程图,如图1所示,本发明提供了一种人群密度预测方法,包括:
S1建立人群密度预测数据集;
S2根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
S3通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
S4对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
具体地,在S1建立人群密度预测数据集之前包括步骤:
S10获取人群密度时空演化序列数据,具体包括:
S100将感兴趣区域(所关心的空间区域)划分为多个子区域:
Figure 753860DEST_PATH_IMAGE001
;(1)
其中,S表示感兴趣区域集合,j表示感兴趣区域集合中任意一子区域的标号,m表示感兴趣区域集合中最后一子区域的标号,S1表示第一子区域,Sj表示第j子区域,Sm表示第m子区域;
S101实时测量每个子区域的人群密度,并按矢量的数据结构进行存储:
Figure 4713DEST_PATH_IMAGE002
;(2)
其中,
Figure 907947DEST_PATH_IMAGE003
表示多个子区域的人群密度集合,
Figure 181933DEST_PATH_IMAGE004
表示第一子区域的人群密度,
Figure 828815DEST_PATH_IMAGE005
表 示第j子区域的人群密度,
Figure 137437DEST_PATH_IMAGE006
表示第m子区域的人群密度;
经过实时测量,得到人群的密度分布,并将其按矢量的数据结构进行存储,矢量的每一个维度表示在对应物理区域内单位面积的人群计数;
S102以时间间隔
Figure 211572DEST_PATH_IMAGE087
存储每个子区域的人群密度,得到人群密度时空演化序列数 据:
Figure 238434DEST_PATH_IMAGE088
;(3)
其中,
Figure 423428DEST_PATH_IMAGE089
表示人群密度时空演化序列数据,
Figure 852135DEST_PATH_IMAGE090
表示tn时刻、第一子区域S1的人群密 度,
Figure 97171DEST_PATH_IMAGE091
表示tn时刻、第二子区域S2的人群密度,
Figure 345750DEST_PATH_IMAGE092
表示tn时刻、第m子区域Sm的人群密度;n表 示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表示 时间序列中第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 334435DEST_PATH_IMAGE093
表示时间间隔。
根据应用场景要求,对时间进行序列化处理,以一定的时间间隔储存人群密度得到人群密度的时空演化序列数据。
S20获取与人群密度演化相关的相关要素,具体包括:
S200获取调查数据;
S201从所述调查数据中获取与人群密度演化相关的初始猜测要素,简称相关要素;
S202将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集,并用矢量表示:
Figure 617649DEST_PATH_IMAGE094
;(4)
其中,
Figure 768007DEST_PATH_IMAGE095
表示相关要素集,x1表示第一个相关要素,xi表示第i个相关要素,xd表示 第d个相关要素,d表示相关要素的个数;本实施例中,通过与场所管理人员、执勤人员以及 专家进行交流访谈,形成调查数据,从调查数据中获取影响要素的初步待定选项。
示例性地,访谈以提问的方式展开,问题主要包括“各个区域人群的来源、各个区域人群的去处、哪些事件及活动(比如促销、节假日等)会造成人群数量的增加、人群达到顶峰的时间跨度、哪些事件及活动会造成人群数量的减少、人群减少到谷底的时间跨度、应急预案中涉及到的干预人群流动的方法有哪些、具体举措是什么、每个干预措施具体分为了几个步骤、每一个步骤所需要的时间大致是多少、还有哪些可以影响到人群密度变化的因素”。进一步地,将相关人员的回答中,与人群密度有关的、可量化的答案转换抽象成变量,建立起与人群密度变化相关的要素集,并用矢量标识。
S30获取相关要素的历史演化数据具体包括:
S300获取感兴趣区域内的历史信息;
S301从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据,与人 群密度数据类似,所述历史状态演化数据被表征时间序列,按时间间隔
Figure 503882DEST_PATH_IMAGE096
存储:
Figure 561837DEST_PATH_IMAGE097
;(5)
其中,
Figure 433978DEST_PATH_IMAGE098
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 20817DEST_PATH_IMAGE099
表示tn时刻获取的 第一个相关要素;
Figure 243988DEST_PATH_IMAGE100
表示tn时刻获取的第i个相关要素,
Figure 840054DEST_PATH_IMAGE101
表示tn时刻获取的第d个相关要 素,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点, tn表示时间序列中的第n个时间点的具体时间,tn-1表示
时间序列中第n-1个时间点的具体时间,
Figure 832281DEST_PATH_IMAGE021
表示时间间隔。
本实施例中,通过场所管理者和执勤人员所掌握的整个场所的历史信息(比如信息系统、人工登记的工作记录等),可以获得要素集的历史状态演化信息。
S40通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集:
Figure 590021DEST_PATH_IMAGE022
;(6)
其中,tn表示时间序列中的第n个时间点的具体时间,n表示时间序列中的第n个时 间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,
Figure 300489DEST_PATH_IMAGE017
表示tn时刻获得的相关要素的 历史状态演化数据,
Figure 434667DEST_PATH_IMAGE023
表示人群密度时空演化序列数据。
针对时序数据集,通过统计分析初步判断要素集对预测人群密度的重要性,首先,计算要素集中每一个要素与密度之间的相关性系数,具体地:所述的S202将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集之后包括:
S2021计算初步要素集中每个初步要素与每个区域的人群密度之间的相关性系数rij
Figure 281400DEST_PATH_IMAGE024
;(7)
其中,i表示相关要素集中第i个要素,tn表示时间序列中的第n个时间点的具体时 间,
Figure 475621DEST_PATH_IMAGE102
表示tn时刻的相关要素中的第i个要素的值,
Figure 407805DEST_PATH_IMAGE026
表示第tn时刻第j个子区域的人群密 度值,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间 点,n=2时,表示第二个时间点,
Figure 345674DEST_PATH_IMAGE103
为序列
Figure 46914DEST_PATH_IMAGE075
和序列
Figure 412036DEST_PATH_IMAGE104
的协方差,
Figure 628254DEST_PATH_IMAGE105
Figure 307497DEST_PATH_IMAGE031
Figure 925560DEST_PATH_IMAGE106
和序列
Figure 336949DEST_PATH_IMAGE033
的方差;
S2022将所述相关性系数与设定的相关性阈值进行对比;
如果相关性系数大于或等于某设定的阈值,表示两者有强的线性相关性,相关的变量作为必须要考虑的初步关键要素保留,其他线性相关性差的要素则作为待定因素放入待定要素集,具体地:
S2023将所述相关性系数大于等于设定的相关性阈值的初步要素保留为初步关键要素:
Figure 368359DEST_PATH_IMAGE034
;(8)
其中,
Figure 523397DEST_PATH_IMAGE107
表示初步关键要素集,
Figure 323863DEST_PATH_IMAGE108
表示第i个初步关键要素,
Figure 906154DEST_PATH_IMAGE109
表示初步关键要 素集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相 关性阈值,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标号,p 表示初步关键要素的个数,意味着通过筛选,初步关键要素的个数降低为p个,m表示感兴趣 区域集合中子区域的个数。
S2024将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素,并形成待定要素集:
Figure 424860DEST_PATH_IMAGE110
;(9)
其中,
Figure 118010DEST_PATH_IMAGE111
表示待定要素集,
Figure 38561DEST_PATH_IMAGE112
表示第i个待定要素,
Figure 526174DEST_PATH_IMAGE113
表示待定要素集中第i个 要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈值,
Figure 532176DEST_PATH_IMAGE114
表示第i个待定要素,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区 域的标号,d表示相关要素的个数,p表示初步关键要素的个数,d-p表示总共有d-p个待定 要素,m表示感兴趣区域集合中子区域的个数。
值得说明的是,如果最后预测效果不好,说明相关要素集中有要素与密度之间存在非线性关系,这时需要将(9)式所示待定要素,重新并入式(4)中进行测试。
在人群密度演化要素分析及其量化处理的步骤中,已获得如式(6)所示的时序数据集。但是通常管理者或执行人员所积累的数据都是日常运维数据,很少或者未曾包含发生极端情况,如火灾、抢劫等突发事件引起的人群异常流动的数据,而这些极端环境下人群流动却是人群安全管理的重点。所以,需要通过应急演练、仿真模拟等方式,获取极端条件下的人群密度相关样本数据。特别是仿真模拟技术,可以不受场景和资源限制,是获取相关数据的主要途径。基于人群动力学的仿真模拟技术已经成熟,主要有基于流的方法(Flow-based Approach)、基于实体的方法(Entity-based Approach)和基于主体的方法(Agent-based Approach),并存在着大量的实现软件工具,如vadere、NetLogo等。通过这些工具,我们可以实现全场景的样本数据采集,从而扩充式(6)所示的数据集,形成全场景样本数据集。
所述全场景样本数据集为:
Figure 29017DEST_PATH_IMAGE043
;(10)
其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间 点,n=2表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一个场景,a=2表 示个场景,a=h表示第h个场景,
Figure 804075DEST_PATH_IMAGE115
表示在第a个场景中要素集在第n个时间点的状态数据,
Figure 728168DEST_PATH_IMAGE116
表示在第a场景中、第n个时间点的人群密度分布数据。
建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系,形成人群密度预测数据集:
Figure 955887DEST_PATH_IMAGE117
;(11)
其中,k表示样本集中收集数据的参考时间点;q为回溯时间偏移量,表示从参考时 间点往前回溯时间点的数目,m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的 终止时刻;
Figure 990839DEST_PATH_IMAGE118
表示k-q时刻的关键要素状态数据;
Figure 885983DEST_PATH_IMAGE119
表示k-q下一时刻,即k-q+1时 刻的关键要素状态数据;
Figure 980978DEST_PATH_IMAGE120
表示样本数据收集的参考时间点k时刻的关键要素状态数据;
Figure 695993DEST_PATH_IMAGE121
表示从k-q到k时间段内要素状态数据的集合;
Figure 534636DEST_PATH_IMAGE122
表示在未来第k+l 个时间点的人群密度分布。
将人群密度预测问题转换为带参数函数的模型优化问题,具体包括:根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型:
基于人群密度预测数据集,在tn时刻,人群密度预测模型
Figure 284286DEST_PATH_IMAGE123
的计算值由基于知识 模型的预测函数
Figure 550183DEST_PATH_IMAGE124
计算结果和基于机器学习算法的预测模型
Figure 752494DEST_PATH_IMAGE125
的计算结果加和而成:
Figure 129249DEST_PATH_IMAGE126
;(12)
由于基于知识的模型,往往只能解决人群密度演化的共性问题,对于特定场景的 特殊复杂情况,预测可能并不是完全准确。所以在基于知识模型的预测函数
Figure 733405DEST_PATH_IMAGE127
之上,额 外构建一个完全基于数据构建的机器学习模型(如决策树、卷积神经网络等)
Figure 170203DEST_PATH_IMAGE125
,用于修 正基于知识模型的预测函数
Figure 859810DEST_PATH_IMAGE128
遗漏掉的信息。
考虑时空波动容错的优化目标:
具体地,具体地,有了式(11)所示的数据集和式(12)所示的人群密度预测模型
Figure 40256DEST_PATH_IMAGE129
,我们就可以通过优化目标函数的方法来寻找人群密度预测模型
Figure 233340DEST_PATH_IMAGE130
中的待定参数,实现基于要素集的历史状态演化信息来预测人群密度的未来分布。由于在人群安全管理中,某一时刻具体人群密度的绝对精度并不重要,大家更为关心的是人群密度高峰的量值及所述量值具体出现的时间段。所以,传统的预测值和真实值的方差并不适合于人群密度预测。为了处理这种时序上可以容许错位的密度预测,根据人群密度高峰的量值及所述量值具体出现的时间段构建误差函数:
Figure 841039DEST_PATH_IMAGE131
;(13)
其中,
Figure 17942DEST_PATH_IMAGE132
表示第j个子区域的误差函数,n′表示当前预测时间点,k表示邻近时 刻范围,
Figure 2079DEST_PATH_IMAGE133
是第j个子区域、第i′时间点的人群密度的真实测量值,i′表示在时刻n′-k 和n′+k之间的任意一个时间点,
Figure 315248DEST_PATH_IMAGE134
是第j个子区域、在当前预测时间点n′的人群密度预 测值;
通过所述预测误差函数对训练后的人群密度预测模型进行优化。
优化问题的求解:
根据使用场景及硬件条件,选择不同的基于机器学习算法的预测模型,所述基于机器学习算法的预测模型包括:随机森林模型、多元线性回归模型、LSTM模型和CNN模型。
具体地,基于精度和时效性权衡的模型复杂度选择:分析具体的使用场景和硬件条件限制,可以选择合适的预测模型计算复杂度。对于没有显卡等加速器存在的硬件环境、以及要求时效性在秒级的预测系统,式(12)中的机器学习模型宜选择随机森林、多元线性回归等传统少参数模型:
Figure 93848DEST_PATH_IMAGE135
;(14)
对于由显卡加速器存在的硬件系统,式(12)中的机器学习模型选择LSTM、CNN等深度学习模型:
Figure 758048DEST_PATH_IMAGE136
;(15)
预测模型参数的获取:利用式(11)所示的数据集,以式(13)所示的误差函数为优化目标,根据梯度下降算法,调整模型的每一个参数,得到最终的人群密度预测模型。
人群密度预测:根据上一步得到的最终模型,基于要素集的历史数据和不断产生的实时人群密度监控数据,实现人群密度预测。
下面以火车站进站大厅为例,结合附图对本发明作进一步详细地说明,但不应理解为是对本发明保护内容的任何限定。
图2是本发明以火车站进站大厅为例进行人群密度预测的方法流程图,如图2所示:
走访火车站管理和执勤人员,结合三维空间特点和人员流动情况,将相关系数大于或等于设定的相关性阈值r0的相关要素作为确认影响火车站进站楼层人群未来密度分布的关键因素,示例性地,影响火车站进站楼层人群未来密度分布的因素有:
是否有地铁到站x1,状态为x1=0表示到站,状态为x1=1表示未到站;
进站楼层过去10分钟的人群密度分布,根据需求将进站楼层划分为有限个区域。以2个为例,那么密度分布对要素集贡献两个要素x2、x3,需要说明的是,密度状态为非负实数,表示该区域人群密度;
是否是适合出行的节假日x4,状态为x4=1,表示是,状态为x4=0,表示否。
于是,影响火车站进站大厅人群密度分布的要素集为:
Figure 280296DEST_PATH_IMAGE137
;(16)
其中,
Figure 219212DEST_PATH_IMAGE138
表示影响火车进站大厅人群密度分布的要素集,x1表示因素:是否有地铁 到站,x2表示因素:进站楼层第一个区域过去10分钟的人群密度值变化,x3表示因素:进站楼 层第二个区域过去10分钟的人群密度值变化,x4表示因素:是否是适合出行的节假日;
通过火车站的人群定位系统测量人群在日常正常运作情景下的实时密度分布并 按式(6)的数据结构,将要素和密度的映射关系,按一定的时间间隔(比如1秒)储存在数据 库中,并对每一个样本数据点(6)标定其采集情景:
Figure 808195DEST_PATH_IMAGE139
(其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间点,n=2 表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一情景,a=2表示第二情 景,
Figure 959690DEST_PATH_IMAGE140
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 20050DEST_PATH_IMAGE141
为要素的状态信息演化信息, 表示在第a个场景中要素集在第n个时间点的状态数据);存储样本的数据结构如表1所示:
表1 数据结构
Figure 307812DEST_PATH_IMAGE142
对于日常情景,将情景标签标记为j=0。利用仿真模拟技术,模拟地铁晚点等原因造成的火车站的入口人员流量远远大于正常值(比如入口密度设置为平时值的5倍)时,一段时间内火车站大厅人群密度的演化情况。将相应的数据按表1所示的数据格式储存在数据库中,将情景标签标记为j=1。
根据上述步骤所建的数据库,利用式(11)的数据格式,取回溯时间偏移量指标q为 固定值(比如q=599),取未来时间偏移量指标l为固定值(比如l=600),随机抽取足量样本点 (比如1万个),组成密度预测数据集
Figure 67695DEST_PATH_IMAGE143
根据火车站高精度和高时效的要求,配置高性能加速卡,选取CNN模型:
Figure 440908DEST_PATH_IMAGE144
;(17)
加入式(12)中构成密度预测模型。其中,CNN模型由若干个卷积层和一个全连接的神经网络层构成。
本实施例中,在人群密度数据集D中,以表1所示的数据结构中t时刻的前10分钟 (共600个样本点)要素为特征输入X,以表1所示的数据结构中t时刻第10分钟后的区域密度 (1个样本点)为预测目标Y,以式(14)所示的误差函数为优化目标,分两部得到预测模型。首 先利用梯度下降算法,以式(14)所示的误差函数为优化目标,利用数据(X,Y),拟合式(12) 中基于知识模型的预测函数
Figure 304959DEST_PATH_IMAGE145
的待定参数,得到最终的知识参数模型
Figure 712806DEST_PATH_IMAGE146
。然后,保 持
Figure 4110DEST_PATH_IMAGE147
的模型参数不变,利用Adam算法,以式(14)所示的误差函数为优化目标,训练得 到式(12)中
Figure 864619DEST_PATH_IMAGE148
所示的CNN深度学习模型(基于Pytorch等深度学习训练平台实现),从而得 到用于人群密度预测的最终参数模型,以前10分钟的要素数据为输入,以后十分钟的密度 分布为输出,可以记为:
Figure 329098DEST_PATH_IMAGE149
其中,
Figure 794715DEST_PATH_IMAGE150
表示t时刻未来 600秒后的人群密度分布,表示由知
Figure 53658DEST_PATH_IMAGE151
识和机器学习 训练出来的计算模型,
Figure 276829DEST_PATH_IMAGE152
表示t时刻前599秒的要素数据,
Figure 607316DEST_PATH_IMAGE153
表示t时刻前598秒的要 素数据,
Figure 599543DEST_PATH_IMAGE154
表示当前样本时间点。
如果上述算法的精度无法达到要求,则需要扩充要素集,然后重新执行上述步骤得到合适的参数模型。
从数据库中不断获取最近邻的十分钟的要素集状态数据
Figure 622862DEST_PATH_IMAGE155
, 然后利用算法完成10分钟后的人群密度预测。例如用表1中的0到599行中的
Figure 333329DEST_PATH_IMAGE156
数据 预测第1199行的密度数据
Figure 201928DEST_PATH_IMAGE157
图3是本发明一种人群密度预测系统的结构示意图,如图3所示,本发明提供一种人群密度预测系统,包括:建立单元,用于建立人群密度预测数据集;构建单元,用于根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;训练单元,用于通过所述人群密度预测数据集对所述人群密度预测模型进行训练;优化单元,用于对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (14)

1.一种人群密度预测方法,其特征在于,包括:
建立人群密度预测数据集;
根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
2.根据权利要求1所述的人群密度预测方法,其特征在于,在所述的建立人群密度预测数据集之前包括:
获取人群密度时空演化序列数据;
获取与人群密度演化相关的相关要素;
获取相关要素的历史演化数据;
通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集;
对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识,构建全场景样本数据集,所述场景包括日常场景和特殊场景。
3.根据权利要求2所述的人群密度预测方法,其特征在于,所述的获取人群密度时空演化序列数据包括:
将感兴趣区域划分为多个子区域:
Figure 776058DEST_PATH_IMAGE001
;(1)
其中,S表示感兴趣区域集合,j表示感兴趣区域集合中任意一子区域的标号,m表示感兴趣区域集合中最后一子区域的标号,S1表示第一子区域,Sj表示第j子区域,Sm表示第m子区域;
实时测量每个子区域的人群密度,并按矢量的数据结构进行存储:
Figure 224357DEST_PATH_IMAGE002
;(2)
其中,
Figure 535253DEST_PATH_IMAGE003
表示多个子区域的人群密度集合,
Figure 461621DEST_PATH_IMAGE004
表示第一子区域的人群密度,
Figure 807151DEST_PATH_IMAGE005
表示第j 子区域的人群密度,
Figure 160772DEST_PATH_IMAGE006
表示第m子区域的人群密度;
以时间间隔
Figure 958964DEST_PATH_IMAGE007
存储每个子区域的人群密度,得到人群密度时空演化序列数据:
Figure 689023DEST_PATH_IMAGE008
;(3)
其中,
Figure 889060DEST_PATH_IMAGE009
表示人群密度时空演化序列数据,
Figure 413582DEST_PATH_IMAGE010
表示tn时刻、第一子区域S1的人群密度,
Figure 699070DEST_PATH_IMAGE011
表示tn时刻、第二子区域S2的人群密度,
Figure 967240DEST_PATH_IMAGE012
表示tn时刻、第m子区域Sm的人群密度;n表示 时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表示时 间序列中第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 225046DEST_PATH_IMAGE013
表 示时间间隔。
4.根据权利要求2所述的人群密度预测方法,其特征在于,所述的获取与人群密度演化相关的相关要素包括:
获取调查数据;
从所述调查数据中获取与人群密度演化相关的相关要素;
将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集,并用矢量表示:
Figure 186049DEST_PATH_IMAGE014
;(4)
其中,
Figure 958833DEST_PATH_IMAGE015
表示相关要素集,x1表示第一个相关要素,xi表示第i个相关要素,xd表示第d个 相关要素,d表示相关要素的个数。
5.根据权利要求2所述的人群密度预测方法,其特征在于,所述的获取相关要素的历史演化数据包括:
获取感兴趣区域内的历史信息;
从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据,所述历史状态 演化数据被表征时间序列按时间间隔
Figure 765115DEST_PATH_IMAGE016
存储:
Figure 939744DEST_PATH_IMAGE017
;(5)其中,
Figure 806069DEST_PATH_IMAGE018
表示tn时刻获得的相关要 素的历史状态演化数据,
Figure 66149DEST_PATH_IMAGE019
表示tn时刻
获取的第一个相关要素;
Figure 676122DEST_PATH_IMAGE020
表示tn时刻获取的第i个相关要素,
Figure 705258DEST_PATH_IMAGE021
表示tn时刻获取的第 d个相关要素,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一 个时间点,tn表示时间序列中的第n个时间点的具体时
间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 8063DEST_PATH_IMAGE022
表示时间间隔。
6.根据权利要求2所述的人群密度预测方法,其特征在于,所述时序数据集为:
Figure 489860DEST_PATH_IMAGE023
;(6)
其中,tn表示时间序列中的第n个时间点的具体时间,n表示时间序列中的第n个时间点, n=0时,表示初始时间点,n=1时,表示第一个时间点,
Figure 903524DEST_PATH_IMAGE024
表示tn时刻获得的相关要素的历史 状态演化数据,
Figure 787166DEST_PATH_IMAGE025
表示人群密度时空演化序列数据。
7.根据权利要求4所述的人群密度预测方法,其特征在于,所述的将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集之后包括:
计算相关要素集中每个要素与每个区域的人群密度之间的相关性系数rij
Figure 260873DEST_PATH_IMAGE026
;(7)
其中,i表示相关要素集中第i个要素,tn表示时间序列中的第n个时间点的具体时间,
Figure 229966DEST_PATH_IMAGE027
表示tn时刻的相关要素中的第i个要素的值,
Figure 181741DEST_PATH_IMAGE028
表示第tn时刻第j个子区域的人群密度 值,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,n =2时,表示第二个时间点,
Figure 185470DEST_PATH_IMAGE029
为序列
Figure 830078DEST_PATH_IMAGE030
和序列
Figure 286467DEST_PATH_IMAGE031
的协方差,
Figure 41933DEST_PATH_IMAGE032
Figure 634588DEST_PATH_IMAGE033
Figure 450098DEST_PATH_IMAGE034
和序列
Figure 393783DEST_PATH_IMAGE035
的方差;
将所述相关性系数与设定的相关性阈值进行对比;
将所述相关性系数大于等于设定的相关性阈值的相关要素保留为初步关键要素:
Figure 952940DEST_PATH_IMAGE036
;(8)
其中,
Figure 665681DEST_PATH_IMAGE037
表示初步关键要素集,
Figure 386513DEST_PATH_IMAGE038
表示第i个初步关键要素,
Figure 817494DEST_PATH_IMAGE039
表示初步关键要素集 中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性 阈值,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标号,p表示 初步关键要素的个数,m表示感兴趣区域集合中子区域的个数。
8.根据权利要求7所述的人群密度预测方法,其特征在于,在所述的将所述相关性系数与设定的相关性阈值进行对比之后包括:
将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素,并形成待定要素集:
Figure 914763DEST_PATH_IMAGE040
;(9)
其中,
Figure 747590DEST_PATH_IMAGE041
表示待定要素集,
Figure 639322DEST_PATH_IMAGE042
表示第i个待定要素,
Figure 557600DEST_PATH_IMAGE043
表示待定要素集中第i个要素与 第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈值,
Figure 458560DEST_PATH_IMAGE044
表示第 i个待定要素,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标 号,d表示相关要素的个数,p表示初步关键要素的个数,d-p表示总共有d-p个待定要素,m 表示感兴趣区域集合中子区域的个数。
9.根据权利要求2所述的人群密度预测方法,其特征在于,所述全场景样本数据集为:
Figure 880314DEST_PATH_IMAGE045
;(10)
其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间点,n =2表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一个场景,a=2表示个 场景,a=h表示第h个场景,
Figure 208527DEST_PATH_IMAGE046
表示在第a个场景中要素集在第n个时间点的状态数据,
Figure 348521DEST_PATH_IMAGE047
表 示在第a场景中、第n个时间点的人群密度分布数据。
10.根据权利要求9所述的人群密度预测方法,其特征在于,包括:
建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系,形成人群密度预测数据集:
Figure 53172DEST_PATH_IMAGE048
;(11)
其中,k表示样本集中收集数据的参考时间点;q为回溯时间偏移量,表示从参考时间点 往前回溯时间点的数目,m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的终止 时刻;
Figure 595012DEST_PATH_IMAGE049
表示k-q时刻的关键要素状态数据;
Figure 94126DEST_PATH_IMAGE050
表示k-q下一时刻,即k-q+1时刻的关 键要素状态数据;
Figure 721417DEST_PATH_IMAGE051
表示样本数据收集的参考时间点k时刻的关键要素状态数据;
Figure 760917DEST_PATH_IMAGE052
表示从k-q到k时间段内要素状态数据的集合;
Figure 157263DEST_PATH_IMAGE053
表示在未来第k+l个时 间点的人群密度分布。
11.根据权利要求10所述的人群密度预测方法,其特征在于,所述的根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型包括:
基于人群密度预测数据集,在tn时刻,人群密度预测模型的计算值由基于知识模型的预测函数计算结果和基于机器学习算法的预测模型的计算结果加和而成:
Figure 827279DEST_PATH_IMAGE054
;(12)
其中,
Figure 941866DEST_PATH_IMAGE055
表示人群密度预测模型,
Figure 722740DEST_PATH_IMAGE056
表示基于知识模型的预测函数,
Figure 442434DEST_PATH_IMAGE057
表示基于 机器学习算法的预测模型。
12.根据权利要求11所述的人群密度预测方法,其特征在于,根据使用场景及硬件条件,选择不同的基于机器学习算法的预测模型,所述基于机器学习算法的预测模型包括:随机森林模型、多元线性回归模型、LSTM模型和CNN模型。
13.根据权利要求12所述的人群密度预测方法,其特征在于,包括:
将人群密度预测值与当前预测时间n′邻近时刻范围k内的人群密度的真实测量值的最大差异作为预测误差函数:
Figure 80089DEST_PATH_IMAGE058
;(13)
其中,
Figure 681971DEST_PATH_IMAGE059
表示第j个子区域的误差函数,n′表示当前预测时间点,k表示邻近时刻范 围,
Figure 266536DEST_PATH_IMAGE060
是第j个子区域、第i′时间点的人群密度的真实测量值,i′表示在时刻n′-k和n′+ k之间的任意一个时间点,
Figure 637475DEST_PATH_IMAGE061
是第j个子区域、在当前预测时间点n′的人群密度预测值;
通过所述预测误差函数对训练后的人群密度预测模型进行优化。
14.一种人群密度预测系统,其特征在于,包括:
建立单元,用于建立人群密度预测数据集;
构建单元,用于根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
训练单元,用于通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
优化单元,用于对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
CN202211224188.9A 2022-10-09 2022-10-09 一种人群密度预测方法及系统 Active CN115293465B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211224188.9A CN115293465B (zh) 2022-10-09 2022-10-09 一种人群密度预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211224188.9A CN115293465B (zh) 2022-10-09 2022-10-09 一种人群密度预测方法及系统

Publications (2)

Publication Number Publication Date
CN115293465A true CN115293465A (zh) 2022-11-04
CN115293465B CN115293465B (zh) 2023-02-14

Family

ID=83833743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211224188.9A Active CN115293465B (zh) 2022-10-09 2022-10-09 一种人群密度预测方法及系统

Country Status (1)

Country Link
CN (1) CN115293465B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024146507A1 (zh) * 2023-01-03 2024-07-11 北京辰安科技股份有限公司 景区人群密度预测方法、装置、电子设备和介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160133025A1 (en) * 2014-11-12 2016-05-12 Ricoh Company, Ltd. Method for detecting crowd density, and method and apparatus for detecting interest degree of crowd in target position
WO2016183766A1 (en) * 2015-05-18 2016-11-24 Xiaogang Wang Method and apparatus for generating predictive models
CN107832912A (zh) * 2017-10-09 2018-03-23 中国电子科技集团公司第二十八研究所 一种密集人群风险分析方法及系统
CN108388852A (zh) * 2018-02-09 2018-08-10 北京天元创新科技有限公司 一种基于深度学习的区域人群密度预测方法及装置
CN109478205A (zh) * 2016-06-24 2019-03-15 元素认知有限责任公司 用于计算机学习和理解的体系结构和方法
CN111563447A (zh) * 2020-04-30 2020-08-21 南京邮电大学 一种基于密度图的人群密度分析与检测定位方法
US20210150196A1 (en) * 2019-11-20 2021-05-20 Omron Corporation Methods and Systems for Forecasting Crowd Dynamics
CN113643170A (zh) * 2021-10-14 2021-11-12 枫树谷(成都)科技有限责任公司 一种大数据驱动的公共场所聚集人群疏散方法及装置
CN113743422A (zh) * 2021-09-07 2021-12-03 西安建筑科技大学 多特征信息融合的人群密度估计方法、设备及存储介质
CN114358375A (zh) * 2021-11-29 2022-04-15 重庆邮电大学 一种基于大数据的人群密度预测方法及系统
CN115083112A (zh) * 2022-08-22 2022-09-20 枫树谷(成都)科技有限责任公司 一种智能预警应急管理系统及其部署方法

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160133025A1 (en) * 2014-11-12 2016-05-12 Ricoh Company, Ltd. Method for detecting crowd density, and method and apparatus for detecting interest degree of crowd in target position
WO2016183766A1 (en) * 2015-05-18 2016-11-24 Xiaogang Wang Method and apparatus for generating predictive models
CN109478205A (zh) * 2016-06-24 2019-03-15 元素认知有限责任公司 用于计算机学习和理解的体系结构和方法
CN107832912A (zh) * 2017-10-09 2018-03-23 中国电子科技集团公司第二十八研究所 一种密集人群风险分析方法及系统
CN108388852A (zh) * 2018-02-09 2018-08-10 北京天元创新科技有限公司 一种基于深度学习的区域人群密度预测方法及装置
US20210150196A1 (en) * 2019-11-20 2021-05-20 Omron Corporation Methods and Systems for Forecasting Crowd Dynamics
CN111563447A (zh) * 2020-04-30 2020-08-21 南京邮电大学 一种基于密度图的人群密度分析与检测定位方法
CN113743422A (zh) * 2021-09-07 2021-12-03 西安建筑科技大学 多特征信息融合的人群密度估计方法、设备及存储介质
CN113643170A (zh) * 2021-10-14 2021-11-12 枫树谷(成都)科技有限责任公司 一种大数据驱动的公共场所聚集人群疏散方法及装置
CN114358375A (zh) * 2021-11-29 2022-04-15 重庆邮电大学 一种基于大数据的人群密度预测方法及系统
CN115083112A (zh) * 2022-08-22 2022-09-20 枫树谷(成都)科技有限责任公司 一种智能预警应急管理系统及其部署方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张洞明等: "基于多特征集成学习的景区人群密度估计", 《科学技术与工程》 *
邓远志等: "基于特征金字塔的人群密度估计方法", 《测控技术》 *
黄贺贺等: "基于群体行为分析的人群异常聚集预测方法", 《计算机工程》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024146507A1 (zh) * 2023-01-03 2024-07-11 北京辰安科技股份有限公司 景区人群密度预测方法、装置、电子设备和介质

Also Published As

Publication number Publication date
CN115293465B (zh) 2023-02-14

Similar Documents

Publication Publication Date Title
Sheu Dynamic relief-demand management for emergency logistics operations under large-scale disasters
Khosravi et al. Prediction intervals to account for uncertainties in travel time prediction
Lam et al. Decision support system for contractor pre‐qualification—artificial neural network model
CN108399745B (zh) 一种基于无人机的分时段城市路网状态预测方法
CN110232203B (zh) 知识蒸馏优化rnn短期停电预测方法、存储介质及设备
CN110555617A (zh) 一种基于物联网的建筑火灾风险实时动态定量评估方法
Yang et al. Forecasting overall pavement condition with neural networks: Application on Florida highway network
Christodoulou et al. A neurofuzzy decision framework for the management of water distribution networks
Zheng et al. Multi-attraction, hourly tourism demand forecasting
CN108197820B (zh) 一种配电网可靠性关联关系模型的建立方法
CN115660217B (zh) 一种智慧城市垃圾清扫量预测方法和物联网系统
CN114495507B (zh) 融合时空注意力神经网络和交通模型的交通流预测方法
CN115293465B (zh) 一种人群密度预测方法及系统
CN118037014B (zh) 基于物联网的道路施工监测系统
CN116385970B (zh) 基于时空序列数据的人流聚集预测模型
CN116976702B (zh) 基于大场景gis轻量化引擎的城市数字孪生平台及方法
CN118134172B (zh) 一种城市公共资源管理与调配系统
CN113298318A (zh) 一种新型的配电变压器重过载预测方法
Hryhorkiv et al. Forecasting financial time sesries using combined ARIMA-ANN algorithm
Lytvynenko et al. Development of the dynamic Bayesian network to evaluate the national law enforcement agencies' work
CN110889536A (zh) 警情态势预测和预警方法及其系统
CN114841518A (zh) 一种内河助航标志服役状态评价方法
CN117912235A (zh) 一种智慧城市的规划数据处理方法和系统
CN117495094A (zh) 一种产业链安全风险综合评估预警方法与系统
TW201911812A (zh) 影像串流服務的障礙定位系統及維運方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant