CN115293465B - 一种人群密度预测方法及系统 - Google Patents

一种人群密度预测方法及系统 Download PDF

Info

Publication number
CN115293465B
CN115293465B CN202211224188.9A CN202211224188A CN115293465B CN 115293465 B CN115293465 B CN 115293465B CN 202211224188 A CN202211224188 A CN 202211224188A CN 115293465 B CN115293465 B CN 115293465B
Authority
CN
China
Prior art keywords
time
crowd density
data
time point
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211224188.9A
Other languages
English (en)
Other versions
CN115293465A (zh
Inventor
付佳
冯灏
尹玄鲲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maple Valley Chengdu Technology Co ltd
Original Assignee
Maple Valley Chengdu Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maple Valley Chengdu Technology Co ltd filed Critical Maple Valley Chengdu Technology Co ltd
Priority to CN202211224188.9A priority Critical patent/CN115293465B/zh
Publication of CN115293465A publication Critical patent/CN115293465A/zh
Application granted granted Critical
Publication of CN115293465B publication Critical patent/CN115293465B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种人群密度预测方法及系统,所述方法包括:建立人群密度预测数据集;根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;通过所述人群密度预测数据集对所述人群密度预测模型进行训练;对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。本发明基于全要素分析、真实历史数据和极端情况模拟仿真,实现了可靠、完备的人群密度演化信息收集和数据集建立。本发明基于时空波动容错机制,提升了人群密度预测算法的鲁棒性。本发明基于精度和时效权衡,实现了按需进行的人群密度预测。

Description

一种人群密度预测方法及系统
技术领域
本发明属于应急安全管理技术领域,特别涉及一种人群密度预测方法及系统。
背景技术
在公共安全管理领域,人群密度是管理者和执勤人员重点关注的关键表征指标之一。目前,已经存在多种实现公共场所人群密度实时或离线测量的方法。比如,通过基于物联网的传感器定位系统(如室外GPS、移动通讯基站定位、室内近场通讯定位)和基于摄像头图像识别和分析的人群定位方法。事实上,即使在不存在现代定位系统的情况下,公共安全管理者或执勤人员也可以通过肉眼判断,从现场情况或视频图像上大致获得人群密度分布的信息。然而,从发现人群密度异常,到管理者做决策启动相应预案,再到调动人力物力资源来进行人群密度干预(比如疏散),往往需要一段较长的时间,从而可能错过安全管理的最佳时机。由于人群受物理条件限制的自然流动以及受心理因素影响的趋利避害等造成人群密度异常变化的事件的发生需要一个较长的要素累积过程,所以通过分析特定场景下,人群及其所在场景的历史演化或模拟仿真数据就可以识别、测量和构建这些前置要素和未来人群密度的关系,从而实现人群密度的预测。
综上所述,现有人群密度监控主要集中在实时测量上。然而聚集性人群事故,如踩踏的发生和发展的时间很短,一旦发生场面混乱。因此发现人群大量聚集之后再进行处理,事实上已经错过干预时机。所以,如何提前预测人群的密度分布变化,为实施干预措施争取尽可能多的时间,是人群密度监控目前的关键难点问题。
发明内容
针对背景技术中存在问题,本发明提供一种人群密度预测方法及系统,用于解决现有人群密度监控无法预测的问题,目的在于提前预测人群的密度分布变化,为实施干预措施争取尽可能多的时间。
本发明提供了:一种人群密度预测方法,包括:
建立人群密度预测数据集;
根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
优选地,在所述的建立人群密度预测数据集之前包括:
获取人群密度时空演化序列数据;
获取与人群密度演化相关的相关要素;
获取相关要素的历史演化数据;
通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集;
对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识,构建全场景样本数据集,所述场景包括日常场景和特殊场景。
优选地,所述的获取人群密度时空演化序列数据包括:
将感兴趣区域划分为多个子区域:
Figure 239976DEST_PATH_IMAGE001
(1)
其中,S表示感兴趣区域集合,j表示感兴趣区域集合中任意一子区域的标号,m表示感兴趣区域集合中最后一子区域的标号,S1表示第一子区域,Sj表示第j子区域,Sm表示第m子区域;
实时测量每个子区域的人群密度,并按矢量的数据结构进行存储:
Figure 903039DEST_PATH_IMAGE002
(2)
其中,
Figure 195742DEST_PATH_IMAGE003
表示多个子区域的人群密度集合,
Figure 71294DEST_PATH_IMAGE004
表示第一子区域的人群密度,
Figure 303692DEST_PATH_IMAGE005
表示 第j子区域的人群密度,
Figure 872077DEST_PATH_IMAGE006
表示第m子区域的人群密度;
以时间间隔
Figure 681770DEST_PATH_IMAGE007
存储每个子区域的人群密度,得到人群密度时空演化序列数据:
Figure 862478DEST_PATH_IMAGE008
(3)
其中,
Figure 277279DEST_PATH_IMAGE009
表示人群密度时空演化序列数据,
Figure 282144DEST_PATH_IMAGE010
表示tn时刻、第一子区域S1的人群 密度,
Figure 454499DEST_PATH_IMAGE011
表示tn时刻、第二子区域S2的人群密度,
Figure 671854DEST_PATH_IMAGE012
表示tn时刻、第m子区域Sm的人群密度; n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表 示时间序列中第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时间, 表
Figure 504943DEST_PATH_IMAGE013
示时间间隔。
优选地,所述的获取与人群密度演化相关的相关要素包括:
获取调查数据;
从所述调查数据中获取与人群密度演化相关的相关要素;
将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集,并用矢量表示:
Figure 87234DEST_PATH_IMAGE014
(4)
其中,
Figure 74781DEST_PATH_IMAGE015
表示相关要素集,x1表示第一个相关要素,xi表示第i个相关要素,xd表示第 d个相关要素,d表示相关要素的个数。
优选地,所述的获取相关要素的历史演化数据包括:
获取感兴趣区域内的历史信息;
从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据,所述历史 状态演化数据被表征时间序列按时间间隔
Figure 95827DEST_PATH_IMAGE016
存储:
Figure 750799DEST_PATH_IMAGE017
(5)
其中,
Figure 864511DEST_PATH_IMAGE018
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 73776DEST_PATH_IMAGE019
表示tn时刻获取的第 一个相关要素;
Figure 570616DEST_PATH_IMAGE020
表示tn时刻获取的第i个相关要素,
Figure 611253DEST_PATH_IMAGE021
表示tn时刻获取的第d个相关要素,n 表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表 示时间序列中的第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时 间,
Figure 597664DEST_PATH_IMAGE022
表示时间间隔。
优选地,所述时序数据集为:
Figure 61268DEST_PATH_IMAGE023
(6)
其中,tn表示时间序列中的第n个时间点的具体时间,n表示时间序列中的第n个时 间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,
Figure 361800DEST_PATH_IMAGE018
表示tn时刻获得的相关要素的 历史状态演化数据,
Figure 460206DEST_PATH_IMAGE024
表示人群密度时空演化序列数据。
优选地,所述的将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集之后包括:
计算相关要素集中每个要素与每个区域的人群密度之间的相关性系数rij
Figure 679834DEST_PATH_IMAGE025
(7)
其中,i表示相关要素集中第i个要素,tn表示时间序列中的第n个时间点的具体时 间,
Figure 863691DEST_PATH_IMAGE026
表示tn时刻的相关要素中的第i个要素的值,
Figure 702334DEST_PATH_IMAGE027
表示第tn时刻第j个子区域的人群 密度值,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间 点,n=2时,表示第二个时间点,
Figure 422291DEST_PATH_IMAGE028
为序列
Figure 16083DEST_PATH_IMAGE029
和序列
Figure 218394DEST_PATH_IMAGE030
的协方差,
Figure 126307DEST_PATH_IMAGE031
Figure 28667DEST_PATH_IMAGE032
Figure 731043DEST_PATH_IMAGE033
和序列
Figure 420651DEST_PATH_IMAGE034
的方差;
将所述相关性系数与设定的相关性阈值进行对比;
将所述相关性系数大于等于设定的相关性阈值的相关要素保留为初步关键要素:
Figure 928993DEST_PATH_IMAGE035
(8)
其中,
Figure 856497DEST_PATH_IMAGE036
表示初步关键要素集,
Figure 729775DEST_PATH_IMAGE037
表示第i个初步关键要素,
Figure 599687DEST_PATH_IMAGE038
表示初步关键要素 集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关 性阈值,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标号,p表 示初步关键要素的个数,m表示感兴趣区域集合中子区域的个数。
优选地,在所述的将所述相关性系数与设定的相关性阈值进行对比之后包括:
将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素,并形成待定要素集:
Figure 708457DEST_PATH_IMAGE039
(9)
其中,
Figure 162573DEST_PATH_IMAGE040
表示待定要素集,
Figure 862544DEST_PATH_IMAGE041
表示第i个待定要素,
Figure 667689DEST_PATH_IMAGE042
表示待定要素集中第i个要素 与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈值,
Figure 19298DEST_PATH_IMAGE043
表示 第i个待定要素,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的 标号,d表示相关要素的个数,p表示初步关键要素的个数,d-p表示总共有d-p个待定要 素,m表示感兴趣区域集合中子区域的个数。
优选地,所述全场景样本数据集为:
Figure 452554DEST_PATH_IMAGE044
(10)
其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间 点,n=2表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一个场景,a=2表 示个场景,a=h表示第h个场景,
Figure 667634DEST_PATH_IMAGE045
表示在第a个场景中要素集在第n个时间点的状态数据,
Figure 350288DEST_PATH_IMAGE046
表示在第a场景中、第n个时间点的人群密度分布数据。
优选地,包括:
建立初步关键要素的状态信息演化数据与相对初步关键要素采集时刻一段时间后的人群密度分布数据之间的关系,形成人群密度预测数据集:
Figure 771168DEST_PATH_IMAGE047
(11)
其中,k表示样本集中收集数据的参考时间点;q为回溯时间偏移量,表示从参考时 间点往前回溯时间点的数目,m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的 终止时刻;
Figure 199875DEST_PATH_IMAGE048
表示k-q时刻的关键要素状态数据;
Figure 648174DEST_PATH_IMAGE049
表示k-q下一时刻,即k-q+1时刻 的关键要素状态数据;
Figure 286966DEST_PATH_IMAGE050
表示样本数据收集的参考时间点k时刻的关键要素状态数据;
Figure 744492DEST_PATH_IMAGE051
表示从k-q到k时间段内要素状态数据的集合;
Figure 857067DEST_PATH_IMAGE052
表示在未来第k+l个时间点 的人群密度分布。
优选地,所述的根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型包括:
基于人群密度预测数据集,在tn时刻,人群密度预测模型
Figure 679529DEST_PATH_IMAGE053
的计算值由基于知识 模型的预测函数
Figure 540038DEST_PATH_IMAGE054
计算结果和基于机器学习算法的预测模型
Figure 535676DEST_PATH_IMAGE055
的计算结果加和而成:
Figure 1292DEST_PATH_IMAGE056
(12)
优选地,根据使用场景及硬件条件,选择不同的基于机器学习算法的预测模型,所述基于机器学习算法的预测模型包括:随机森林模型、多元线性回归模型、LSTM(LongShort-Term Memory,长短期记忆网络)模型和CNN(Convolutional Neural Networks,卷积神经网络)模型。
优选地,包括:
将人群密度预测值与当前预测时间点n′邻近时刻范围k内的人群密度的真实测量值的最大差异作为预测误差函数:
Figure 994656DEST_PATH_IMAGE057
(13)
其中,
Figure 47188DEST_PATH_IMAGE058
表示第j个子区域的误差函数,n′表示当前预测时间点,k表示邻近时刻 范围,
Figure 643254DEST_PATH_IMAGE059
是第j个子区域、第i′时间点的人群密度的真实测量值,i′表示在时刻n′-k和 n′+k之间的任意一个时间点,
Figure 963377DEST_PATH_IMAGE060
是第j个子区域、在当前预测时间点n′的人群密度预测 值;
通过所述预测误差函数对训练后的人群密度预测模型进行优化。
本发明还提供一种人群密度预测系统,包括:
建立单元,用于建立人群密度预测数据集;
构建单元,用于根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
训练单元,用于通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
优化单元,用于对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
优选地,包括:
获取单元,用于获取人群密度时空演化序列数据、获取与人群密度演化相关的相关要素以及获取相关要素的历史演化数据;
匹配单元,用于通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集;
标识单元,用于对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识,构建全场景样本数据集,所述场景包括日常场景和特殊场景。
优选地,获取单元包括:
划分模块,用于将感兴趣区域划分为多个子区域:
Figure 455538DEST_PATH_IMAGE001
(1)
其中,S表示感兴趣区域集合,j表示感兴趣区域集合中任意一子区域的标号,m表示感兴趣区域集合中最后一子区域的标号,S1表示第一子区域,Sj表示第j子区域,Sm表示第m子区域;
测量模块,用于实时测量每个子区域的人群密度,并按矢量的数据结构进行存储:
Figure 900426DEST_PATH_IMAGE002
(2)
其中,
Figure 801648DEST_PATH_IMAGE003
表示多个子区域的人群密度集合,
Figure 913961DEST_PATH_IMAGE004
表示第一子区域的人群密度,
Figure 639340DEST_PATH_IMAGE005
表示 第j子区域的人群密度,
Figure 430579DEST_PATH_IMAGE006
表示第m子区域的人群密度;
以时间间隔
Figure 978235DEST_PATH_IMAGE061
存储每个子区域的人群密度,得到人群密度时空演化序列数据:
Figure 836731DEST_PATH_IMAGE062
(3)
其中,
Figure 405116DEST_PATH_IMAGE009
表示人群密度时空演化序列数据,
Figure 683651DEST_PATH_IMAGE010
表示tn时刻、第一子区域S1的人群 密度,
Figure 362894DEST_PATH_IMAGE063
表示tn时刻、第二子区域S2的人群密度,
Figure 184219DEST_PATH_IMAGE012
表示tn时刻、第m子区域Sm的人群密度; n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表 示时间序列中第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 690549DEST_PATH_IMAGE064
表示时间间隔。
优选地,获取单元包括:
第一获取模块,用于获取调查数据以及从所述调查数据中获取与人群密度演化相关的相关要素;
建立模块,用于将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集,并用矢量表示:
Figure 190800DEST_PATH_IMAGE065
(4)
其中,
Figure 470472DEST_PATH_IMAGE015
表示相关要素集,x1表示第一个相关要素,xi表示第i个相关要素,xd表示第 d个相关要素,d表示相关要素的个数。
优选地,获取单元包括:
第二获取模块,用于获取感兴趣区域内的历史信息,以及从所述感兴趣区域内的 历史信息中获取相关要素的历史状态演化数据,所述历史状态演化数据被表征时间序列按 时间间隔
Figure 739779DEST_PATH_IMAGE066
存储:
Figure 56491DEST_PATH_IMAGE067
(5)
其中,
Figure 353960DEST_PATH_IMAGE018
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 640585DEST_PATH_IMAGE068
表示tn时刻获取的 第一个相关要素;
Figure 29978DEST_PATH_IMAGE069
表示tn时刻获取的第i个相关要素,
Figure 111066DEST_PATH_IMAGE070
表示tn时刻获取的第d个相关 要素,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间 点,tn表示时间序列中的第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的 具体时间,
Figure 992435DEST_PATH_IMAGE022
表示时间间隔。
优选地,所述时序数据集为:
Figure 115374DEST_PATH_IMAGE071
(6)
其中,tn表示时间序列中的第n个时间点的具体时间,n表示时间序列中的第n个时 间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,
Figure 562536DEST_PATH_IMAGE018
表示tn时刻获得的相关要素的 历史状态演化数据,
Figure 876842DEST_PATH_IMAGE024
表示人群密度时空演化序列数据。
优选地,包括:
计算单元,用于计算相关要素集中每个要素与每个区域的人群密度之间的相关性系数rij
Figure 245507DEST_PATH_IMAGE025
(7)
其中,i表示相关要素集中第i个要素,tn表示时间序列中的第n个时间点的具体时 间,
Figure 608355DEST_PATH_IMAGE072
表示tn时刻的相关要素中的第i个要素的值,
Figure 208226DEST_PATH_IMAGE027
表示第tn时刻第j个子区域的人群 密度值,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间 点,n=2时,表示第二个时间点,
Figure 896696DEST_PATH_IMAGE073
为序列
Figure 877291DEST_PATH_IMAGE074
和序列
Figure 715934DEST_PATH_IMAGE075
的协方差,
Figure 934425DEST_PATH_IMAGE076
Figure 295262DEST_PATH_IMAGE032
Figure 966415DEST_PATH_IMAGE077
和序列
Figure 733382DEST_PATH_IMAGE034
的方差;
对比单元,用于将所述相关性系数与设定的相关性阈值进行对比;
第一筛选单元,用于将所述相关性系数大于等于设定的相关性阈值的相关要素保留为初步关键要素:
Figure 212905DEST_PATH_IMAGE035
(8)
其中,
Figure 72539DEST_PATH_IMAGE036
表示初步关键要素集,
Figure 230988DEST_PATH_IMAGE037
表示第i个初步关键要素,
Figure 145854DEST_PATH_IMAGE078
表示初步关键要素 集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关 性阈值,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标号,p表 示初步关键要素的个数,m表示感兴趣区域集合中子区域的个数。
优选地,包括:
第二筛选单元,还用于将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素,并形成待定要素集:
Figure 135676DEST_PATH_IMAGE079
(9)
其中,
Figure 71271DEST_PATH_IMAGE040
表示待定要素集,
Figure 123540DEST_PATH_IMAGE041
表示第i个待定要素,
Figure 202617DEST_PATH_IMAGE042
表示待定要素集中第i个要素 与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈值,
Figure 250208DEST_PATH_IMAGE043
表示 第i个待定要素,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的 标号,d表示相关要素的个数,p表示初步关键要素的个数,d-p表示总共有d-p个待定要 素,m表示感兴趣区域集合中子区域的个数。
优选地,所述全场景样本数据集为:
Figure 153442DEST_PATH_IMAGE044
(10)
其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间 点,n=2表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一个场景,a=2表 示个场景,a=h表示第h个场景,
Figure 20903DEST_PATH_IMAGE045
表示在第a个场景中要素集在第n个时间点的状态数据,
Figure 638092DEST_PATH_IMAGE080
表示在第a场景中、第n个时间点的人群密度分布数据。
优选地,包括:
形成单元,建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系,形成人群密度预测数据集:
Figure 540189DEST_PATH_IMAGE081
(11)
其中,k表示样本集中收集数据的参考时间点;q为回溯时间偏移量,表示从参考时 间点往前回溯时间点的数目,m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的 终止时刻;
Figure 489690DEST_PATH_IMAGE048
表示k-q时刻的关键要素状态数据;
Figure 641186DEST_PATH_IMAGE082
表示k-q下一时刻,即k-q+1时刻 的关键要素状态数据;
Figure 560600DEST_PATH_IMAGE050
表示样本数据收集的参考时间点k时刻的关键要素状态数据;
Figure 553089DEST_PATH_IMAGE083
表示从k-q到k时间段内要素状态数据的集合;
Figure 939071DEST_PATH_IMAGE052
表示在未来第k+l个时间点 的人群密度分布。
优选地,基于人群密度预测数据集,在tn时刻,人群密度预测模型
Figure 781125DEST_PATH_IMAGE053
的计算值由基 于知识模型的预测函数
Figure 238652DEST_PATH_IMAGE084
计算结果和基于机器学习算法的预测模型
Figure 646499DEST_PATH_IMAGE085
的计算结果加和 而成:
Figure 21025DEST_PATH_IMAGE056
(12)
优选地,根据使用场景及硬件条件,选择不同的基于机器学习算法的预测模型,所述基于机器学习算法的预测模型包括:随机森林模型、多元线性回归模型、LSTM模型和CNN模型。
优选地,将人群密度预测值与当前预测时间点n′邻近时刻范围k内的人群密度的真实测量值的最大差异作为预测误差函数:
Figure 22479DEST_PATH_IMAGE086
(13)
其中,
Figure 752537DEST_PATH_IMAGE058
表示第j个子区域的误差函数,n′表示当前预测时间点,k表示邻近时刻 范围,
Figure 483733DEST_PATH_IMAGE087
是第j个子区域、第i′时间点的人群密度的真实测量值,i′表示在时刻n′-k和n′ +k之间的任意一个时间点,
Figure 804993DEST_PATH_IMAGE088
是第j个子区域、在当前预测时间点n′的人群密度预测值;
通过所述预测误差函数对训练后的人群密度预测模型进行优化。
本发明的有益效果:本发明基于全要素分析、真实历史数据和极端情况模拟仿真,实现了可靠、完备的人群密度演化信息收集和数据集建立。
本发明基于时空波动容错机制,提升了人群密度预测算法的鲁棒性。
本发明基于精度和时效权衡,实现了按需进行的人群密度预测。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。
附图说明
图1是本发明一种人群密度预测方法的流程图;
图2是本发明以火车站进站大厅为例进行人群密度预测的方法流程图;
图3是本发明一种人群密度预测系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提出了具有时间与空间容错机制的全情景人群密度预测方法,可以用于日常和极端情况下的人群密度的提前感知。本发明包括三个相互联系的部分。第一部分提出了获取与人群密度变化相关的要素以及对其进行量化处理的方法。该方法从专家知识、经验和数据分析出发,筛选出特定情景下与人群密度变化相关的要素,并系统地建立量化和获取它们的办法。第二部分提出了根据第一部所获取的要素预测人群密度未来变化的方法。该方法首先通过知识和数据双驱动的联合型算法建立起人群密度和相关要素之间的带参数的映射关系,把人群密度预测问题转化为参数优化问题。然后,为了实际求解相应的优化问题,该部分根据应用场景特点,进一步建立了相应的样本数据集和提出了针对性的优化目标。具体来说,首先,针对第一部分所筛选出来的要素,收集其历史状态演化信息,并通过时间序列匹配与人群密度变化建立联系,形成样本数据集。对于现有场景历史演化未曾涉及的极端物理环境和恶性事件,该方法也通过仿真模拟进行了数据扩充以确保数据集对人群安全管理全情景的覆盖。然后,在优化目标的设计上,考虑到在真实人群安全管理中,人群密度预测更多的是关注峰值、趋势出现的时间和空间区间,允许密度时序有一定的不确定性。所以,该方法针对性地设计了具有鲁棒性的优化目标,使得优化出来的预测模型具有时空序列上的容错机制,能够包容在人群密度预测时存在的时序错配。第三部分为基于第二部分所述的参数模型、数据集和优化目标,通过优化算法具体求解优化问题,获得适用于不同预测精度和时效要求的预测模型用于人群密度预测。
图1示出了本发明一种人群密度预测方法的流程图,如图1所示,本发明提供了一种人群密度预测方法,包括:
S1建立人群密度预测数据集;
S2根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
S3通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
S4对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
具体地,在S1建立人群密度预测数据集之前包括步骤:
S10获取人群密度时空演化序列数据,具体包括:
S100将感兴趣区域(所关心的空间区域)划分为多个子区域:
Figure 654262DEST_PATH_IMAGE001
(1)
其中,S表示感兴趣区域集合,j表示感兴趣区域集合中任意一子区域的标号,m表示感兴趣区域集合中最后一子区域的标号,S1表示第一子区域,Sj表示第j子区域,Sm表示第m子区域;
S101实时测量每个子区域的人群密度,并按矢量的数据结构进行存储:
Figure 125695DEST_PATH_IMAGE002
(2)
其中,
Figure 445818DEST_PATH_IMAGE003
表示多个子区域的人群密度集合,
Figure 469138DEST_PATH_IMAGE004
表示第一子区域的人群密度,
Figure 773080DEST_PATH_IMAGE005
表示 第j子区域的人群密度,
Figure 877564DEST_PATH_IMAGE006
表示第m子区域的人群密度;
经过实时测量,得到人群的密度分布,并将其按矢量的数据结构进行存储,矢量的每一个维度表示在对应物理区域内单位面积的人群计数;
S102以时间间隔
Figure 52194DEST_PATH_IMAGE089
存储每个子区域的人群密度,得到人群密度时空演化序列数 据:
Figure 387360DEST_PATH_IMAGE090
(3)
其中,
Figure 444178DEST_PATH_IMAGE009
表示人群密度时空演化序列数据,
Figure 54151DEST_PATH_IMAGE010
表示tn时刻、第一子区域S1的人群 密度,
Figure 912648DEST_PATH_IMAGE011
表示tn时刻、第二子区域S2的人群密度,
Figure 215453DEST_PATH_IMAGE012
表示tn时刻、第m子区域Sm的人群密度; n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表 示时间序列中第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 166092DEST_PATH_IMAGE091
表示时间间隔。
根据应用场景要求,对时间进行序列化处理,以一定的时间间隔储存人群密度得到人群密度的时空演化序列数据。
S20获取与人群密度演化相关的相关要素,具体包括:
S200获取调查数据;
S201从所述调查数据中获取与人群密度演化相关的初始猜测要素,简称相关要素;
S202将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集,并用矢量表示:
Figure 845335DEST_PATH_IMAGE014
(4)
其中,
Figure 791294DEST_PATH_IMAGE092
表示相关要素集,x1表示第一个相关要素,xi表示第i个相关要素,xd表示 第d个相关要素,d表示相关要素的个数;本实施例中,通过与场所管理人员、执勤人员以及 专家进行交流访谈,形成调查数据,从调查数据中获取影响要素的初步待定选项。
示例性地,访谈以提问的方式展开,问题主要包括“各个区域人群的来源、各个区域人群的去处、哪些事件及活动(比如促销、节假日等)会造成人群数量的增加、人群达到顶峰的时间跨度、哪些事件及活动会造成人群数量的减少、人群减少到谷底的时间跨度、应急预案中涉及到的干预人群流动的方法有哪些、具体举措是什么、每个干预措施具体分为了几个步骤、每一个步骤所需要的时间大致是多少、还有哪些可以影响到人群密度变化的因素”。进一步地,将相关人员的回答中,与人群密度有关的、可量化的答案转换抽象成变量,建立起与人群密度变化相关的要素集,并用矢量标识。
S30获取相关要素的历史演化数据具体包括:
S300获取感兴趣区域内的历史信息;
S301从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据,与人 群密度数据类似,所述历史状态演化数据被表征时间序列,按时间间隔
Figure 32045DEST_PATH_IMAGE093
存储:
Figure 797875DEST_PATH_IMAGE094
(5)
其中,
Figure 952913DEST_PATH_IMAGE095
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 956641DEST_PATH_IMAGE096
表示tn时刻获取的 第一个相关要素;
Figure 929145DEST_PATH_IMAGE097
表示tn时刻获取的第i个相关要素,
Figure 152578DEST_PATH_IMAGE098
表示tn时刻获取的第d个相关要 素,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点, tn表示时间序列中的第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体 时间,
Figure 439203DEST_PATH_IMAGE099
表示时间间隔。
本实施例中,通过场所管理者和执勤人员所掌握的整个场所的历史信息(比如信息系统、人工登记的工作记录等),可以获得要素集的历史状态演化信息。
S40通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集:
Figure 500700DEST_PATH_IMAGE100
(6)
其中,tn表示时间序列中的第n个时间点的具体时间,n表示时间序列中的第n个时 间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,
Figure 581789DEST_PATH_IMAGE018
表示tn时刻获得的相关要素的 历史状态演化数据,
Figure 587791DEST_PATH_IMAGE024
表示人群密度时空演化序列数据。
针对时序数据集,通过统计分析初步判断要素集对预测人群密度的重要性,首先,计算要素集中每一个要素与密度之间的相关性系数,具体地:所述的S202将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集之后包括:
S2021计算初步要素集中每个初步要素与每个区域的人群密度之间的相关性系数rij
Figure 913992DEST_PATH_IMAGE101
(7)
其中,i表示相关要素集中第i个要素,tn表示时间序列中的第n个时间点的具体时 间,
Figure 157892DEST_PATH_IMAGE102
表示tn时刻的相关要素中的第i个要素的值,
Figure 675461DEST_PATH_IMAGE027
表示第tn时刻第j个子区域的人群 密度值,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间 点,n=2时,表示第二个时间点,
Figure 44125DEST_PATH_IMAGE103
为序列
Figure 469290DEST_PATH_IMAGE029
和序列
Figure 803582DEST_PATH_IMAGE104
的协方差,
Figure 164156DEST_PATH_IMAGE105
Figure 82434DEST_PATH_IMAGE032
Figure 514552DEST_PATH_IMAGE106
和序列
Figure 529781DEST_PATH_IMAGE034
的方差;
S2022将所述相关性系数与设定的相关性阈值进行对比;
如果相关性系数大于或等于某设定的阈值,表示两者有强的线性相关性,相关的变量作为必须要考虑的初步关键要素保留,其他线性相关性差的要素则作为待定因素放入待定要素集,具体地:
S2023将所述相关性系数大于等于设定的相关性阈值的初步要素保留为初步关键要素:
Figure 714836DEST_PATH_IMAGE107
(8)
其中,
Figure 792514DEST_PATH_IMAGE108
表示初步关键要素集,
Figure 497165DEST_PATH_IMAGE109
表示第i个初步关键要素,
Figure 570163DEST_PATH_IMAGE110
表示初步关键 要素集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的 相关性阈值,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标 号,p表示初步关键要素的个数,意味着通过筛选,初步关键要素的个数降低为p个,m表示感 兴趣区域集合中子区域的个数。
S2024将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素,并形成待定要素集:
Figure 866015DEST_PATH_IMAGE111
(9)
其中,
Figure 57087DEST_PATH_IMAGE112
表示待定要素集,
Figure 565429DEST_PATH_IMAGE113
表示第i个待定要素,
Figure 430617DEST_PATH_IMAGE114
表示待定要素集中第i个 要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈值,
Figure 366212DEST_PATH_IMAGE115
表示第i个待定要素,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子 区域的标号,d表示相关要素的个数,p表示初步关键要素的个数,d-p表示总共有d-p个待 定要素,m表示感兴趣区域集合中子区域的个数。
值得说明的是,如果最后预测效果不好,说明相关要素集中有要素与密度之间存在非线性关系,这时需要将(9)式所示待定要素,重新并入式(4)中进行测试。
在人群密度演化要素分析及其量化处理的步骤中,已获得如式(6)所示的时序数据集。但是通常管理者或执行人员所积累的数据都是日常运维数据,很少或者未曾包含发生极端情况,如火灾、抢劫等突发事件引起的人群异常流动的数据,而这些极端环境下人群流动却是人群安全管理的重点。所以,需要通过应急演练、仿真模拟等方式,获取极端条件下的人群密度相关样本数据。特别是仿真模拟技术,可以不受场景和资源限制,是获取相关数据的主要途径。基于人群动力学的仿真模拟技术已经成熟,主要有基于流的方法(Flow-based Approach)、基于实体的方法(Entity-based Approach)和基于主体的方法(Agent-based Approach),并存在着大量的实现软件工具,如vadere、NetLogo等。通过这些工具,我们可以实现全场景的样本数据采集,从而扩充式(6)所示的数据集,形成全场景样本数据集。
所述全场景样本数据集为:
Figure 746378DEST_PATH_IMAGE044
(10)
其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间 点,n=2表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一个场景,a=2表 示个场景,a=h表示第h个场景,
Figure 825454DEST_PATH_IMAGE116
表示在第a个场景中要素集在第n个时间点的状态数据,
Figure 873045DEST_PATH_IMAGE117
表示在第a场景中、第n个时间点的人群密度分布数据。
建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系,形成人群密度预测数据集:
Figure 776279DEST_PATH_IMAGE118
(11)
其中,k表示样本集中收集数据的参考时间点;q为回溯时间偏移量,表示从参考时 间点往前回溯时间点的数目,m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的 终止时刻;
Figure 315844DEST_PATH_IMAGE119
表示k-q时刻的关键要素状态数据;
Figure 165989DEST_PATH_IMAGE120
表示k-q下一时刻,即k-q+1 时刻的关键要素状态数据;
Figure 366288DEST_PATH_IMAGE121
表示样本数据收集的参考时间点k时刻的关键要素状态数 据;
Figure 315790DEST_PATH_IMAGE122
表示从k-q到k时间段内要素状态数据的集合;
Figure 936127DEST_PATH_IMAGE123
表示在未来第k+l 个时间点的人群密度分布。
将人群密度预测问题转换为带参数函数的模型优化问题,具体包括:根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型:
基于人群密度预测数据集,在tn时刻,人群密度预测模型
Figure 589962DEST_PATH_IMAGE124
的计算值由基于知 识模型的预测函数
Figure 346565DEST_PATH_IMAGE125
计算结果和基于机器学习算法的预测模型
Figure 358646DEST_PATH_IMAGE126
的计算结果加和而 成:
Figure 935121DEST_PATH_IMAGE127
(12)
由于基于知识的模型,往往只能解决人群密度演化的共性问题,对于特定场景的 特殊复杂情况,预测可能并不是完全准确。所以在基于知识模型的预测函数
Figure 799172DEST_PATH_IMAGE128
之上,额外 构建一个完全基于数据构建的机器学习模型(如决策树、卷积神经网络等)
Figure 941440DEST_PATH_IMAGE129
,用于修正 基于知识模型的预测函数
Figure 826219DEST_PATH_IMAGE130
遗漏掉的信息。
考虑时空波动容错的优化目标:
具体地,有了式(11)所示的数据集和式(12)所示的人群密度预测模型
Figure 391455DEST_PATH_IMAGE131
,我们 就可以通过优化目标函数的方法来寻找人群密度预测模型
Figure 449410DEST_PATH_IMAGE124
中的待定参数,实现基于要 素集的历史状态演化信息来预测人群密度的未来分布。由于在人群安全管理中,某一时刻 具体人群密度的绝对精度并不重要,大家更为关心的是人群密度高峰的量值及所述量值具 体出现的时间段。所以,传统的预测值和真实值的方差并不适合于人群密度预测。为了处理 这种时序上可以容许错位的密度预测,根据人群密度高峰的量值及所述量值具体出现的时 间段构建误差函数:
Figure 915026DEST_PATH_IMAGE132
(13)
其中,
Figure 377232DEST_PATH_IMAGE133
表示第j个子区域的误差函数,n′表示当前预测时间点,k表示邻近时 刻范围,
Figure 990616DEST_PATH_IMAGE134
是第j个子区域、第i′时间点的人群密度的真实测量值,i′表示在时刻n′- k和n′+k之间的任意一个时间点,
Figure 291409DEST_PATH_IMAGE135
是第j个子区域、在当前预测时间点n′的人群密度 预测值;
通过所述预测误差函数对训练后的人群密度预测模型进行优化。
优化问题的求解:
根据使用场景及硬件条件,选择不同的基于机器学习算法的预测模型,所述基于机器学习算法的预测模型包括:随机森林模型、多元线性回归模型、LSTM模型和CNN模型。
具体地,基于精度和时效性权衡的模型复杂度选择:分析具体的使用场景和硬件条件限制,可以选择合适的预测模型计算复杂度。对于没有显卡等加速器存在的硬件环境、以及要求时效性在秒级的预测系统,式(12)中的机器学习模型宜选择随机森林、多元线性回归等传统少参数模型:
Figure 877111DEST_PATH_IMAGE136
(14)
对于由显卡加速器存在的硬件系统,式(12)中的机器学习模型选择LSTM、CNN等深度学习模型:
Figure 775797DEST_PATH_IMAGE137
(15)
预测模型参数的获取:利用式(11)所示的数据集,以式(13)所示的误差函数为优化目标,根据梯度下降算法,调整模型的每一个参数,得到最终的人群密度预测模型。
人群密度预测:根据上一步得到的最终模型,基于要素集的历史数据和不断产生的实时人群密度监控数据,实现人群密度预测。
下面以火车站进站大厅为例,结合附图对本发明作进一步详细地说明,但不应理解为是对本发明保护内容的任何限定。
图2是本发明以火车站进站大厅为例进行人群密度预测的方法流程图,如图2所示:
走访火车站管理和执勤人员,结合三维空间特点和人员流动情况,将相关系数大于或等于设定的相关性阈值r0的相关要素作为确认影响火车站进站楼层人群未来密度分布的关键因素,示例性地,影响火车站进站楼层人群未来密度分布的因素有:
是否有地铁到站x1,状态为x1=0表示到站,状态为x1=1表示未到站;
进站楼层过去10分钟的人群密度分布,根据需求将进站楼层划分为有限个区域。以2个为例,那么密度分布对要素集贡献两个要素x2、x3,需要说明的是,密度状态为非负实数,表示该区域人群密度;
是否是适合出行的节假日x4,状态为x4=1,表示是,状态为x4=0,表示否。
于是,影响火车站进站大厅人群密度分布的要素集为:
Figure 814160DEST_PATH_IMAGE138
(16)
其中,
Figure 213918DEST_PATH_IMAGE139
表示影响火车进站大厅人群密度分布的要素集,x1表示因素:是否有地铁到 站,x2表示因素:进站楼层第一个区域过去10分钟的人群密度值变化,x3表示因素:进站楼层 第二个区域过去10分钟的人群密度值变化,x4表示因素:是否是适合出行的节假日;
通过火车站的人群定位系统测量人群在日常正常运作情景下的实时密度分布并 按式(6)的数据结构,将要素和密度的映射关系,按一定的时间间隔(比如1秒)储存在数据 库中,并对每一个样本数据点(6)标定其采集情景:
Figure 890012DEST_PATH_IMAGE140
(其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间点,n=2 表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一情景,a=2表示第二情 景,
Figure 553074DEST_PATH_IMAGE141
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 78734DEST_PATH_IMAGE142
为要素的状态信息演化信息,表 示在第a个场景中要素集在第n个时间点的状态数据);存储样本的数据结构如表1所示:
表1 数据结构
Figure 157548DEST_PATH_IMAGE143
对于日常情景,将情景标签标记为j=0。利用仿真模拟技术,模拟地铁晚点等原因造成的火车站的入口人员流量远远大于正常值(比如入口密度设置为平时值的5倍)时,一段时间内火车站大厅人群密度的演化情况。将相应的数据按表1所示的数据格式储存在数据库中,将情景标签标记为j=1。
根据上述步骤所建的数据库,利用式(11)的数据格式,取回溯时间偏移量指标q为 固定值(比如q=599),取未来时间偏移量指标l为固定值(比如l=600),随机抽取足量样本点 (比如1万个),组成密度预测数据集
Figure 983422DEST_PATH_IMAGE144
根据火车站高精度和高时效的要求,配置高性能加速卡,选取CNN模型:
Figure 41552DEST_PATH_IMAGE145
(17)
加入式(12)中构成密度预测模型。其中,CNN模型由若干个卷积层和一个全连接的神经网络层构成。
本实施例中,在人群密度数据集D中,以表1所示的数据结构中t时刻的前10分钟 (共600个样本点)要素为特征输入X,以表1所示的数据结构中t时刻第10分钟后的区域密度 (1个样本点)为预测目标Y,以式(14)所示的误差函数为优化目标,分两部得到预测模型。首 先利用梯度下降算法,以式(14)所示的误差函数为优化目标,利用数据(X,Y),拟合式(12) 中基于知识模型的预测函数
Figure 726612DEST_PATH_IMAGE146
的待定参数,得到最终的知识参数模型
Figure 405855DEST_PATH_IMAGE147
。然后,保 持
Figure 820656DEST_PATH_IMAGE148
的模型参数不变,利用Adam算法,以式(14)所示的误差函数为优化目标,训练得 到式(12)中
Figure 825521DEST_PATH_IMAGE149
所示的CNN深度学习模型(基于Pytorch等深度学习训练平台实现),从而得 到用于人群密度预测的最终参数模型,以前10分钟的要素数据为输入,以后十分钟的密度 分布为输出,可以记为:
Figure 623975DEST_PATH_IMAGE150
其中,
Figure 106909DEST_PATH_IMAGE151
表示t时刻未来 600秒后的人群密度分布,表示由知
Figure 48320DEST_PATH_IMAGE152
识和机器学习 训练出来的计算模型,
Figure 958507DEST_PATH_IMAGE153
表示t时刻前599秒的要素数据,
Figure 946055DEST_PATH_IMAGE154
表示t时刻前598秒的 要素数据,
Figure 734144DEST_PATH_IMAGE155
表示当前样本时间点。
如果上述算法的精度无法达到要求,则需要扩充要素集,然后重新执行上述步骤得到合适的参数模型。
从数据库中不断获取最近邻的十分钟的要素集状态数据
Figure 920275DEST_PATH_IMAGE156
,然后利用算法完成10分钟后的人群密度预测。例如用表1中的0 到599行中的
Figure 735784DEST_PATH_IMAGE157
数据预测第1199行的密度数据
Figure 617153DEST_PATH_IMAGE158
图3是本发明一种人群密度预测系统的结构示意图,如图3所示,本发明提供一种人群密度预测系统,包括:建立单元,用于建立人群密度预测数据集;构建单元,用于根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;训练单元,用于通过所述人群密度预测数据集对所述人群密度预测模型进行训练;优化单元,用于对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (13)

1.一种人群密度预测方法,其特征在于,包括:
获取人群密度时空演化序列数据;
获取与人群密度演化相关的相关要素;
获取相关要素的历史演化数据;
通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集;
对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识,构建全场景样本数据集,所述场景包括日常场景和特殊场景;
建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系,形成人群密度预测数据集;m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的终止时刻;q为回溯时间偏移量,表示从参考时间点往前回溯时间点的数目;
根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型,用于实现人群密度预测。
2.根据权利要求1所述的人群密度预测方法,其特征在于,所述的获取人群密度时空演化序列数据包括:
将感兴趣区域划分为多个子区域:
Figure 788102DEST_PATH_IMAGE001
(1)
其中,S表示感兴趣区域集合,j表示感兴趣区域集合中任意一子区域的标号,m表示感兴趣区域集合中最后一子区域的标号,S1表示第一子区域,Sj表示第j子区域,Sm表示第m子区域;
实时测量每个子区域的人群密度,并按矢量的数据结构进行存储:
Figure 82817DEST_PATH_IMAGE002
(2)
其中,
Figure 916781DEST_PATH_IMAGE003
表示多个子区域的人群密度集合,
Figure 165622DEST_PATH_IMAGE004
表示第一子区域的人群密度,
Figure 907182DEST_PATH_IMAGE005
表示第j子 区域的人群密度,
Figure 728508DEST_PATH_IMAGE006
表示第m子区域的人群密度;
以时间间隔
Figure 61269DEST_PATH_IMAGE007
存储每个子区域的人群密度,得到人群密度时空演化序列数据:
Figure 233624DEST_PATH_IMAGE008
(3)
其中,
Figure 218023DEST_PATH_IMAGE009
表示人群密度时空演化序列数据,
Figure 284068DEST_PATH_IMAGE010
表示tn时刻、第一子区域S1的人群密度,
Figure 194255DEST_PATH_IMAGE011
表示tn时刻、第二子区域S2的人群密度,
Figure 181803DEST_PATH_IMAGE012
表示tn时刻、第m子区域Sm的人群密度;n表示 时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,tn表示时 间序列中第n个时间点的具体时间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 140532DEST_PATH_IMAGE013
表 示时间间隔。
3.根据权利要求1所述的人群密度预测方法,其特征在于,所述的获取与人群密度演化相关的相关要素包括:
获取调查数据;
从所述调查数据中获取与人群密度演化相关的相关要素;
将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集,并用矢量表示:
Figure 31389DEST_PATH_IMAGE014
(4)
其中,
Figure 643636DEST_PATH_IMAGE015
表示相关要素集,x1表示第一个相关要素,xi表示第i个相关要素,xd表示第d个 相关要素,d表示相关要素的个数。
4.根据权利要求1所述的人群密度预测方法,其特征在于,所述的获取相关要素的历史演化数据包括:
获取感兴趣区域内的历史信息;
从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据,所述历史状态 演化数据被表征时间序列按时间间隔
Figure 852901DEST_PATH_IMAGE016
存储:
Figure 943217DEST_PATH_IMAGE017
(5)
其中,
Figure 859220DEST_PATH_IMAGE018
表示tn时刻获得的相关要素的历史状态演化数据,
Figure 674991DEST_PATH_IMAGE019
表示tn时刻
获取的第一个相关要素;
Figure 965027DEST_PATH_IMAGE020
表示tn时刻获取的第i个相关要素,
Figure 265559DEST_PATH_IMAGE021
表示tn时刻获取的 第d个相关要素,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第 一个时间点,tn表示时间序列中的第n个时间点的具体时
间,tn-1表示时间序列中第n-1个时间点的具体时间,
Figure 865430DEST_PATH_IMAGE022
表示时间间隔。
5.根据权利要求1所述的人群密度预测方法,其特征在于,所述时序数据集为:
Figure 350638DEST_PATH_IMAGE023
(6)
其中,tn表示时间序列中的第n个时间点的具体时间,n表示时间序列中的第n个时间点, n=0时,表示初始时间点,n=1时,表示第一个时间点,
Figure 268915DEST_PATH_IMAGE024
表示tn时刻获得的相关要素的历史 状态演化数据,
Figure 373137DEST_PATH_IMAGE025
表示人群密度时空演化序列数据。
6.根据权利要求3所述的人群密度预测方法,其特征在于,所述的将所述相关要素抽象成变量,建立起与人群密度演化相关的相关要素集之后包括:
计算相关要素集中每个要素与每个区域的人群密度之间的相关性系数rij
Figure 591629DEST_PATH_IMAGE026
(7)
其中,i表示相关要素集中第i个要素,tn表示时间序列中的第n个时间点的具体时间,
Figure 686886DEST_PATH_IMAGE027
表示tn时刻的相关要素中的第i个要素的值,
Figure 154777DEST_PATH_IMAGE028
表示第tn时刻第j个子区域的人群密度 值,n表示时间序列中的第n个时间点,n=0时,表示初始时间点,n=1时,表示第一个时间点,n =2时,表示第二个时间点,
Figure 859427DEST_PATH_IMAGE029
为序列
Figure 932426DEST_PATH_IMAGE030
和序列
Figure 634802DEST_PATH_IMAGE031
的协方差,
Figure 40856DEST_PATH_IMAGE032
Figure 611514DEST_PATH_IMAGE033
Figure 945544DEST_PATH_IMAGE034
和序列
Figure 146718DEST_PATH_IMAGE035
的方差;
将所述相关性系数与设定的相关性阈值进行对比;
将所述相关性系数大于等于设定的相关性阈值的相关要素保留为初步关键要素:
Figure 621824DEST_PATH_IMAGE036
(8)
其中,
Figure 871540DEST_PATH_IMAGE037
表示初步关键要素集,
Figure 184709DEST_PATH_IMAGE038
表示第i个初步关键要素,
Figure 291206DEST_PATH_IMAGE039
表示初步关键要素集中 第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈 值,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标号,p表示初 步关键要素的个数,m表示感兴趣区域集合中子区域的个数。
7.根据权利要求6所述的人群密度预测方法,其特征在于,在所述的将所述相关性系数与设定的相关性阈值进行对比之后包括:
将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素,并形成待定要素集:
Figure 424247DEST_PATH_IMAGE040
(9)
其中,
Figure 212074DEST_PATH_IMAGE041
表示待定要素集,
Figure 350057DEST_PATH_IMAGE042
表示第i个待定要素,
Figure 689771DEST_PATH_IMAGE043
表示待定要素集中第i个要素与第 j个子区域的人群密度之间的相关性系数的绝对值,r0表示设定的相关性阈值,
Figure 310108DEST_PATH_IMAGE044
表示第i个 待定要素,i表示相关要素集中第i个要素,j表示感兴趣区域集合中任意一子区域的标号,d 表示相关要素的个数,p表示初步关键要素的个数,d-p表示总共有d-p个待定要素,m表示 感兴趣区域集合中子区域的个数。
8.根据权利要求1所述的人群密度预测方法,其特征在于,所述全场景样本数据集为:
Figure 963943DEST_PATH_IMAGE045
(10)
其中,n表示时间序列中的第n个时间点,n=0表示初始时间点,n=1表示第一个时间点,n =2表示第二个时间点,n=3表示第三个时间点,a表示场景,a=1表示第一个场景,a=2表示个 场景,a=h表示第h个场景,
Figure 127072DEST_PATH_IMAGE046
表示在第a个场景中要素集在第n个时间点的状态数据,
Figure 342414DEST_PATH_IMAGE047
表 示在第a场景中、第n个时间点的人群密度分布数据。
9.根据权利要求8所述的人群密度预测方法,其特征在于,包括:
形成的人群密度预测数据集为:
Figure 715627DEST_PATH_IMAGE048
(11)
其中,k表示样本集中收集数据的参考时间点;q为回溯时间偏移量,表示从参考时间点 往前回溯时间点的数目,m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的终止 时刻;
Figure 438732DEST_PATH_IMAGE049
表示k-q时刻的关键要素状态数据;
Figure 315422DEST_PATH_IMAGE050
表示k-q下一时刻,即k-q+1时刻的 关键要素状态数据;
Figure 606726DEST_PATH_IMAGE051
表示样本数据收集的参考时间点k时刻的关键要素状态数据;
Figure 171961DEST_PATH_IMAGE052
表示从k-q到k时间段内要素状态数据的集合;
Figure 229916DEST_PATH_IMAGE053
表示在未来第k+l个时间 点的人群密度分布。
10.根据权利要求9所述的人群密度预测方法,其特征在于,所述的根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型包括:
基于人群密度预测数据集,在tn时刻,人群密度预测模型的计算值由基于知识模型的预测函数计算结果和基于机器学习算法的预测模型的计算结果加和而成:
Figure 695533DEST_PATH_IMAGE054
(12)
其中,
Figure 751213DEST_PATH_IMAGE055
表示人群密度预测模型,
Figure 69324DEST_PATH_IMAGE056
表示基于知识模型的预测函数,
Figure 275178DEST_PATH_IMAGE057
表示基于机 器学习算法的预测模型。
11.根据权利要求10所述的人群密度预测方法,其特征在于,根据使用场景及硬件条件,选择不同的基于机器学习算法的预测模型,所述基于机器学习算法的预测模型包括:随机森林模型、多元线性回归模型、LSTM模型和CNN模型。
12.根据权利要求11所述的人群密度预测方法,其特征在于,包括:
将人群密度预测值与当前预测时间点n′邻近时刻范围k内的人群密度的真实测量值的最大差异作为预测误差函数:
Figure 657618DEST_PATH_IMAGE058
(13)
其中,
Figure 884200DEST_PATH_IMAGE059
表示第j个子区域的误差函数,n′表示当前预测时间点,k表示邻近时刻范 围,
Figure 860246DEST_PATH_IMAGE060
是第j个子区域、第i′时间点的人群密度的真实测量值,i′表示在时刻n′-k和n′+ k之间的任意一个时间点,
Figure 197686DEST_PATH_IMAGE061
是第j个子区域、在当前预测时间点n′的人群密度预测值;
通过所述预测误差函数对训练后的人群密度预测模型进行优化。
13.一种人群密度预测系统,其特征在于,包括:
获取单元,用于获取人群密度时空演化序列数据、获取与人群密度演化相关的相关要素以及获取相关要素的历史演化数据;
匹配单元,用于通过时间戳匹配,建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系,形成时序数据集;
标识单元,用于对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识,构建全场景样本数据集,所述场景包括日常场景和特殊场景;
形成单元,建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系,形成人群密度预测数据集;m表示样本数据收集的起点时刻,m>q;u表示样本数据收集的终止时刻;q为回溯时间偏移量,表示从参考时间点往前回溯时间点的数目;
构建单元,用于根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型;
训练单元,用于通过所述人群密度预测数据集对所述人群密度预测模型进行训练;
优化单元,用于对训练后的人群密度预测模型进行优化,形成最终人群密度预测模型。
CN202211224188.9A 2022-10-09 2022-10-09 一种人群密度预测方法及系统 Active CN115293465B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211224188.9A CN115293465B (zh) 2022-10-09 2022-10-09 一种人群密度预测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211224188.9A CN115293465B (zh) 2022-10-09 2022-10-09 一种人群密度预测方法及系统

Publications (2)

Publication Number Publication Date
CN115293465A CN115293465A (zh) 2022-11-04
CN115293465B true CN115293465B (zh) 2023-02-14

Family

ID=83833743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211224188.9A Active CN115293465B (zh) 2022-10-09 2022-10-09 一种人群密度预测方法及系统

Country Status (1)

Country Link
CN (1) CN115293465B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107832912A (zh) * 2017-10-09 2018-03-23 中国电子科技集团公司第二十八研究所 一种密集人群风险分析方法及系统
CN108388852A (zh) * 2018-02-09 2018-08-10 北京天元创新科技有限公司 一种基于深度学习的区域人群密度预测方法及装置
CN109478205A (zh) * 2016-06-24 2019-03-15 元素认知有限责任公司 用于计算机学习和理解的体系结构和方法
CN111563447A (zh) * 2020-04-30 2020-08-21 南京邮电大学 一种基于密度图的人群密度分析与检测定位方法
CN113643170A (zh) * 2021-10-14 2021-11-12 枫树谷(成都)科技有限责任公司 一种大数据驱动的公共场所聚集人群疏散方法及装置
CN113743422A (zh) * 2021-09-07 2021-12-03 西安建筑科技大学 多特征信息融合的人群密度估计方法、设备及存储介质
CN114358375A (zh) * 2021-11-29 2022-04-15 重庆邮电大学 一种基于大数据的人群密度预测方法及系统
CN115083112A (zh) * 2022-08-22 2022-09-20 枫树谷(成都)科技有限责任公司 一种智能预警应急管理系统及其部署方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654021B (zh) * 2014-11-12 2019-02-01 株式会社理光 检测人群对目标位置关注度的方法及设备
CN107624189B (zh) * 2015-05-18 2020-11-20 北京市商汤科技开发有限公司 用于生成预测模型的方法和设备
US11106904B2 (en) * 2019-11-20 2021-08-31 Omron Corporation Methods and systems for forecasting crowd dynamics

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109478205A (zh) * 2016-06-24 2019-03-15 元素认知有限责任公司 用于计算机学习和理解的体系结构和方法
CN107832912A (zh) * 2017-10-09 2018-03-23 中国电子科技集团公司第二十八研究所 一种密集人群风险分析方法及系统
CN108388852A (zh) * 2018-02-09 2018-08-10 北京天元创新科技有限公司 一种基于深度学习的区域人群密度预测方法及装置
CN111563447A (zh) * 2020-04-30 2020-08-21 南京邮电大学 一种基于密度图的人群密度分析与检测定位方法
CN113743422A (zh) * 2021-09-07 2021-12-03 西安建筑科技大学 多特征信息融合的人群密度估计方法、设备及存储介质
CN113643170A (zh) * 2021-10-14 2021-11-12 枫树谷(成都)科技有限责任公司 一种大数据驱动的公共场所聚集人群疏散方法及装置
CN114358375A (zh) * 2021-11-29 2022-04-15 重庆邮电大学 一种基于大数据的人群密度预测方法及系统
CN115083112A (zh) * 2022-08-22 2022-09-20 枫树谷(成都)科技有限责任公司 一种智能预警应急管理系统及其部署方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于多特征集成学习的景区人群密度估计;张洞明等;《科学技术与工程》;20170218(第05期);第79-86页 *
基于群体行为分析的人群异常聚集预测方法;黄贺贺等;《计算机工程》;20190909(第03期);第298-304+314页 *

Also Published As

Publication number Publication date
CN115293465A (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
Sheu Dynamic relief-demand management for emergency logistics operations under large-scale disasters
Khosravi et al. Prediction intervals to account for uncertainties in travel time prediction
Lam et al. Decision support system for contractor pre‐qualification—artificial neural network model
CN110232203B (zh) 知识蒸馏优化rnn短期停电预测方法、存储介质及设备
CN108197820B (zh) 一种配电网可靠性关联关系模型的建立方法
Zheng et al. Multi-attraction, hourly tourism demand forecasting
CN110555617A (zh) 一种基于物联网的建筑火灾风险实时动态定量评估方法
Chohlas-Wood et al. Mining 911 calls in New York City: Temporal patterns, detection, and forecasting
Bejarano-Luque et al. A deep-learning model for estimating the impact of social events on traffic demand on a cell basis
CN113298318A (zh) 一种新型的配电变压器重过载预测方法
Hryhorkiv et al. Forecasting financial time sesries using combined ARIMA-ANN algorithm
Lytvynenko et al. Development of the dynamic Bayesian network to evaluate the national law enforcement agencies' work
CN110889536A (zh) 警情态势预测和预警方法及其系统
CN115293465B (zh) 一种人群密度预测方法及系统
Lv et al. An origin–destination passenger flow prediction system based on convolutional neural network and passenger source-based attention mechanism
CN114169659A (zh) 一种犯罪时空风险预测及决策调度方法和装置
CN117495094A (zh) 一种产业链安全风险综合评估预警方法与系统
TW201911812A (zh) 影像串流服務的障礙定位系統及維運方法
EP3846096A1 (en) Systems and methods for identifying an officer at risk of an adverse event
US20220019948A1 (en) System and Method for Controlling Motion of a Bank of Elevators
KR20070113558A (ko) 케이스기반 예측방법
Voudouris et al. ARMS: An automated resource management system for British Telecommunications plc
Prakash et al. A Markov chain analysis of cost of quality in the supply chain of integrated aluminium manufacturing company
Nguyen et al. Data-driven models for individual and group decision making
Danilchenko et al. Decision Support for Management in Emergency Situations based on the Construction of Functional, Information and Dynamic Models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant