CN115293465B

CN115293465B - 一种人群密度预测方法及系统

Info

Publication number: CN115293465B
Application number: CN202211224188.9A
Authority: CN
Inventors: 付佳; 冯灏; 尹玄鲲
Original assignee: Maple Valley Chengdu Technology Co ltd
Current assignee: Maple Valley Chengdu Technology Co ltd
Priority date: 2022-10-09
Filing date: 2022-10-09
Publication date: 2023-02-14
Anticipated expiration: 2042-10-09
Also published as: CN115293465A

Abstract

本发明公开了一种人群密度预测方法及系统，所述方法包括：建立人群密度预测数据集；根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型；通过所述人群密度预测数据集对所述人群密度预测模型进行训练；对训练后的人群密度预测模型进行优化，形成最终人群密度预测模型，用于实现人群密度预测。本发明基于全要素分析、真实历史数据和极端情况模拟仿真，实现了可靠、完备的人群密度演化信息收集和数据集建立。本发明基于时空波动容错机制，提升了人群密度预测算法的鲁棒性。本发明基于精度和时效权衡，实现了按需进行的人群密度预测。

Description

一种人群密度预测方法及系统

技术领域

本发明属于应急安全管理技术领域，特别涉及一种人群密度预测方法及系统。

背景技术

在公共安全管理领域，人群密度是管理者和执勤人员重点关注的关键表征指标之一。目前，已经存在多种实现公共场所人群密度实时或离线测量的方法。比如，通过基于物联网的传感器定位系统（如室外GPS、移动通讯基站定位、室内近场通讯定位）和基于摄像头图像识别和分析的人群定位方法。事实上，即使在不存在现代定位系统的情况下，公共安全管理者或执勤人员也可以通过肉眼判断，从现场情况或视频图像上大致获得人群密度分布的信息。然而，从发现人群密度异常，到管理者做决策启动相应预案，再到调动人力物力资源来进行人群密度干预（比如疏散），往往需要一段较长的时间，从而可能错过安全管理的最佳时机。由于人群受物理条件限制的自然流动以及受心理因素影响的趋利避害等造成人群密度异常变化的事件的发生需要一个较长的要素累积过程，所以通过分析特定场景下，人群及其所在场景的历史演化或模拟仿真数据就可以识别、测量和构建这些前置要素和未来人群密度的关系，从而实现人群密度的预测。

综上所述，现有人群密度监控主要集中在实时测量上。然而聚集性人群事故，如踩踏的发生和发展的时间很短，一旦发生场面混乱。因此发现人群大量聚集之后再进行处理，事实上已经错过干预时机。所以，如何提前预测人群的密度分布变化，为实施干预措施争取尽可能多的时间，是人群密度监控目前的关键难点问题。

发明内容

针对背景技术中存在问题，本发明提供一种人群密度预测方法及系统，用于解决现有人群密度监控无法预测的问题，目的在于提前预测人群的密度分布变化，为实施干预措施争取尽可能多的时间。

本发明提供了：一种人群密度预测方法，包括：

建立人群密度预测数据集；

根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型；

通过所述人群密度预测数据集对所述人群密度预测模型进行训练；

对训练后的人群密度预测模型进行优化，形成最终人群密度预测模型，用于实现人群密度预测。

优选地，在所述的建立人群密度预测数据集之前包括：

获取人群密度时空演化序列数据；

获取与人群密度演化相关的相关要素；

获取相关要素的历史演化数据；

通过时间戳匹配，建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系，形成时序数据集；

对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识，构建全场景样本数据集，所述场景包括日常场景和特殊场景。

优选地，所述的获取人群密度时空演化序列数据包括：

将感兴趣区域划分为多个子区域：

（1）

其中，S表示感兴趣区域集合，j表示感兴趣区域集合中任意一子区域的标号，m表示感兴趣区域集合中最后一子区域的标号，S₁表示第一子区域，S_j表示第j子区域，S_m表示第m子区域；

实时测量每个子区域的人群密度，并按矢量的数据结构进行存储：

（2）

其中，

表示多个子区域的人群密度集合，

表示第一子区域的人群密度，

表示第j子区域的人群密度，

表示第m子区域的人群密度；

以时间间隔

存储每个子区域的人群密度，得到人群密度时空演化序列数据：

（3）

其中，

表示人群密度时空演化序列数据，

表示t_n时刻、第一子区域S₁的人群密度，

表示t_n时刻、第二子区域S₂的人群密度，

表示t_n时刻、第m子区域S_m的人群密度； n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，t_n表示时间序列中第n个时间点的具体时间，t_n－1表示时间序列中第n－1个时间点的具体时间，表

示时间间隔。

优选地，所述的获取与人群密度演化相关的相关要素包括：

获取调查数据；

从所述调查数据中获取与人群密度演化相关的相关要素；

将所述相关要素抽象成变量，建立起与人群密度演化相关的相关要素集，并用矢量表示：

（4）

其中，

表示相关要素集，x₁表示第一个相关要素，x_i表示第i个相关要素，x_d表示第 d个相关要素，d表示相关要素的个数。

优选地，所述的获取相关要素的历史演化数据包括：

获取感兴趣区域内的历史信息；

从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据，所述历史状态演化数据被表征时间序列按时间间隔

存储：

（5）

其中，

表示t_n时刻获得的相关要素的历史状态演化数据，

表示t_n时刻获取的第一个相关要素；

表示t_n时刻获取的第i个相关要素，

表示t_n时刻获取的第d个相关要素，n 表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，t_n表示时间序列中的第n个时间点的具体时间，t_n－1表示时间序列中第n－1个时间点的具体时间，

表示时间间隔。

优选地，所述时序数据集为：

（6）

其中，t_n表示时间序列中的第n个时间点的具体时间，n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，

表示t_n时刻获得的相关要素的历史状态演化数据，

表示人群密度时空演化序列数据。

优选地，所述的将所述相关要素抽象成变量，建立起与人群密度演化相关的相关要素集之后包括：

计算相关要素集中每个要素与每个区域的人群密度之间的相关性系数r_ij：

（7）

其中，i表示相关要素集中第i个要素，t_n表示时间序列中的第n个时间点的具体时间，

表示t_n时刻的相关要素中的第i个要素的值，

表示第t_n时刻第j个子区域的人群密度值，n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，n=2时，表示第二个时间点，

为序列

和序列

的协方差，

和

为

和序列

的方差；

将所述相关性系数与设定的相关性阈值进行对比；

将所述相关性系数大于等于设定的相关性阈值的相关要素保留为初步关键要素：

（8）

其中，

表示初步关键要素集，

表示第i个初步关键要素，

表示初步关键要素集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值，r₀表示设定的相关性阈值，i表示相关要素集中第i个要素，j表示感兴趣区域集合中任意一子区域的标号，p表示初步关键要素的个数，m表示感兴趣区域集合中子区域的个数。

优选地，在所述的将所述相关性系数与设定的相关性阈值进行对比之后包括：

将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素，并形成待定要素集：

（9）

其中，

表示待定要素集，

表示第i个待定要素，

表示待定要素集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值，r₀表示设定的相关性阈值，

表示第i个待定要素，i表示相关要素集中第i个要素，j表示感兴趣区域集合中任意一子区域的标号，d表示相关要素的个数，p表示初步关键要素的个数，d－p表示总共有d－p个待定要素，m表示感兴趣区域集合中子区域的个数。

优选地，所述全场景样本数据集为：

（10）

其中，n表示时间序列中的第n个时间点，n=0表示初始时间点，n=1表示第一个时间点，n=2表示第二个时间点，n=3表示第三个时间点，a表示场景，a=1表示第一个场景，a=2表示个场景，a=h表示第h个场景，

表示在第a个场景中要素集在第n个时间点的状态数据，

表示在第a场景中、第n个时间点的人群密度分布数据。

优选地，包括：

建立初步关键要素的状态信息演化数据与相对初步关键要素采集时刻一段时间后的人群密度分布数据之间的关系，形成人群密度预测数据集:

（11）

其中，k表示样本集中收集数据的参考时间点；q为回溯时间偏移量，表示从参考时间点往前回溯时间点的数目，m表示样本数据收集的起点时刻，m＞q；u表示样本数据收集的终止时刻；

表示k－q时刻的关键要素状态数据；

表示k－q下一时刻，即k－q+1时刻的关键要素状态数据；

表示样本数据收集的参考时间点k时刻的关键要素状态数据；

表示从k－q到k时间段内要素状态数据的集合；

表示在未来第k+l个时间点的人群密度分布。

优选地，所述的根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型包括：

基于人群密度预测数据集，在t_n时刻，人群密度预测模型

的计算值由基于知识模型的预测函数

计算结果和基于机器学习算法的预测模型

的计算结果加和而成：

（12）

优选地，根据使用场景及硬件条件，选择不同的基于机器学习算法的预测模型，所述基于机器学习算法的预测模型包括：随机森林模型、多元线性回归模型、LSTM（LongShort-Term Memory，长短期记忆网络）模型和CNN（Convolutional Neural Networks，卷积神经网络）模型。

优选地，包括：

将人群密度预测值与当前预测时间点n′邻近时刻范围k内的人群密度的真实测量值的最大差异作为预测误差函数：

（13）

其中，

表示第j个子区域的误差函数，n′表示当前预测时间点，k表示邻近时刻范围，

是第j个子区域、第i′时间点的人群密度的真实测量值，i′表示在时刻n′－k和 n′+k之间的任意一个时间点，

是第j个子区域、在当前预测时间点n′的人群密度预测值；

通过所述预测误差函数对训练后的人群密度预测模型进行优化。

本发明还提供一种人群密度预测系统，包括：

建立单元，用于建立人群密度预测数据集；

构建单元，用于根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型；

训练单元，用于通过所述人群密度预测数据集对所述人群密度预测模型进行训练；

优化单元，用于对训练后的人群密度预测模型进行优化，形成最终人群密度预测模型，用于实现人群密度预测。

优选地，包括：

获取单元，用于获取人群密度时空演化序列数据、获取与人群密度演化相关的相关要素以及获取相关要素的历史演化数据；

匹配单元，用于通过时间戳匹配，建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系，形成时序数据集；

标识单元，用于对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识，构建全场景样本数据集，所述场景包括日常场景和特殊场景。

优选地，获取单元包括：

划分模块，用于将感兴趣区域划分为多个子区域：

（1）

测量模块，用于实时测量每个子区域的人群密度，并按矢量的数据结构进行存储：

（2）

其中，

表示多个子区域的人群密度集合，

表示第一子区域的人群密度，

表示第j子区域的人群密度，

表示第m子区域的人群密度；

以时间间隔

（3）

其中，

表示人群密度时空演化序列数据，

表示t_n时刻、第一子区域S₁的人群密度，

表示t_n时刻、第二子区域S₂的人群密度，

表示t_n时刻、第m子区域S_m的人群密度； n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，t_n表示时间序列中第n个时间点的具体时间，t_n－1表示时间序列中第n－1个时间点的具体时间，

表示时间间隔。

优选地，获取单元包括：

第一获取模块，用于获取调查数据以及从所述调查数据中获取与人群密度演化相关的相关要素；

建立模块，用于将所述相关要素抽象成变量，建立起与人群密度演化相关的相关要素集，并用矢量表示：

（4）

其中，

优选地，获取单元包括：

第二获取模块，用于获取感兴趣区域内的历史信息，以及从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据，所述历史状态演化数据被表征时间序列按时间间隔

存储：

（5）

其中，

表示tn时刻获得的相关要素的历史状态演化数据，

表示tn时刻获取的第一个相关要素；

表示tn时刻获取的第i个相关要素，

表示tn时刻获取的第d个相关要素，n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，t_n表示时间序列中的第n个时间点的具体时间，t_n－1表示时间序列中第n－1个时间点的具体时间，

表示时间间隔。

优选地，所述时序数据集为：

（6）

表示t_n时刻获得的相关要素的历史状态演化数据，

表示人群密度时空演化序列数据。

优选地，包括：

计算单元，用于计算相关要素集中每个要素与每个区域的人群密度之间的相关性系数r_ij：

（7）

表示t_n时刻的相关要素中的第i个要素的值，

为序列

和序列

的协方差，

和

为

和序列

的方差；

对比单元，用于将所述相关性系数与设定的相关性阈值进行对比；

第一筛选单元，用于将所述相关性系数大于等于设定的相关性阈值的相关要素保留为初步关键要素：

（8）

其中，

表示初步关键要素集，

表示第i个初步关键要素，

优选地，包括：

第二筛选单元，还用于将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素，并形成待定要素集：

（9）

其中，

表示待定要素集，

表示第i个待定要素，

优选地，所述全场景样本数据集为：

（10）

表示在第a个场景中要素集在第n个时间点的状态数据，

表示在第a场景中、第n个时间点的人群密度分布数据。

优选地，包括：

形成单元，建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系，形成人群密度预测数据集:

（11）

表示k－q时刻的关键要素状态数据；

表示k－q下一时刻，即k－q+1时刻的关键要素状态数据；

表示样本数据收集的参考时间点k时刻的关键要素状态数据；

表示从k－q到k时间段内要素状态数据的集合；

表示在未来第k+l个时间点的人群密度分布。

优选地，基于人群密度预测数据集，在t_n时刻，人群密度预测模型

的计算值由基于知识模型的预测函数

计算结果和基于机器学习算法的预测模型

的计算结果加和而成：

（12）

优选地，根据使用场景及硬件条件，选择不同的基于机器学习算法的预测模型，所述基于机器学习算法的预测模型包括：随机森林模型、多元线性回归模型、LSTM模型和CNN模型。

优选地，将人群密度预测值与当前预测时间点n′邻近时刻范围k内的人群密度的真实测量值的最大差异作为预测误差函数：

（13）

其中，

是第j个子区域、第i′时间点的人群密度的真实测量值，i′表示在时刻n′－k和n′ +k之间的任意一个时间点，

是第j个子区域、在当前预测时间点n′的人群密度预测值；

本发明的有益效果：本发明基于全要素分析、真实历史数据和极端情况模拟仿真，实现了可靠、完备的人群密度演化信息收集和数据集建立。

本发明基于时空波动容错机制，提升了人群密度预测算法的鲁棒性。

本发明基于精度和时效权衡，实现了按需进行的人群密度预测。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。

附图说明

图1是本发明一种人群密度预测方法的流程图；

图2是本发明以火车站进站大厅为例进行人群密度预测的方法流程图；

图3是本发明一种人群密度预测系统的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地说明，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提出了具有时间与空间容错机制的全情景人群密度预测方法，可以用于日常和极端情况下的人群密度的提前感知。本发明包括三个相互联系的部分。第一部分提出了获取与人群密度变化相关的要素以及对其进行量化处理的方法。该方法从专家知识、经验和数据分析出发，筛选出特定情景下与人群密度变化相关的要素，并系统地建立量化和获取它们的办法。第二部分提出了根据第一部所获取的要素预测人群密度未来变化的方法。该方法首先通过知识和数据双驱动的联合型算法建立起人群密度和相关要素之间的带参数的映射关系，把人群密度预测问题转化为参数优化问题。然后，为了实际求解相应的优化问题，该部分根据应用场景特点，进一步建立了相应的样本数据集和提出了针对性的优化目标。具体来说，首先，针对第一部分所筛选出来的要素，收集其历史状态演化信息，并通过时间序列匹配与人群密度变化建立联系，形成样本数据集。对于现有场景历史演化未曾涉及的极端物理环境和恶性事件，该方法也通过仿真模拟进行了数据扩充以确保数据集对人群安全管理全情景的覆盖。然后，在优化目标的设计上，考虑到在真实人群安全管理中，人群密度预测更多的是关注峰值、趋势出现的时间和空间区间，允许密度时序有一定的不确定性。所以，该方法针对性地设计了具有鲁棒性的优化目标，使得优化出来的预测模型具有时空序列上的容错机制，能够包容在人群密度预测时存在的时序错配。第三部分为基于第二部分所述的参数模型、数据集和优化目标，通过优化算法具体求解优化问题，获得适用于不同预测精度和时效要求的预测模型用于人群密度预测。

图1示出了本发明一种人群密度预测方法的流程图，如图1所示，本发明提供了一种人群密度预测方法，包括：

S1建立人群密度预测数据集；

S2根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型；

S3通过所述人群密度预测数据集对所述人群密度预测模型进行训练；

S4对训练后的人群密度预测模型进行优化，形成最终人群密度预测模型，用于实现人群密度预测。

具体地，在S1建立人群密度预测数据集之前包括步骤：

S10获取人群密度时空演化序列数据，具体包括：

S100将感兴趣区域（所关心的空间区域）划分为多个子区域：

（1）

S101实时测量每个子区域的人群密度，并按矢量的数据结构进行存储：

（2）

其中，

表示多个子区域的人群密度集合，

表示第一子区域的人群密度，

表示第j子区域的人群密度，

表示第m子区域的人群密度；

经过实时测量，得到人群的密度分布，并将其按矢量的数据结构进行存储，矢量的每一个维度表示在对应物理区域内单位面积的人群计数；

S102以时间间隔

（3）

其中，

表示人群密度时空演化序列数据，

表示t_n时刻、第一子区域S₁的人群密度，

表示t_n时刻、第二子区域S₂的人群密度，

表示时间间隔。

根据应用场景要求，对时间进行序列化处理，以一定的时间间隔储存人群密度得到人群密度的时空演化序列数据。

S20获取与人群密度演化相关的相关要素，具体包括：

S200获取调查数据；

S201从所述调查数据中获取与人群密度演化相关的初始猜测要素，简称相关要素；

S202将所述相关要素抽象成变量，建立起与人群密度演化相关的相关要素集，并用矢量表示：

（4）

其中，

表示相关要素集，x₁表示第一个相关要素，x_i表示第i个相关要素，x_d表示第d个相关要素，d表示相关要素的个数；本实施例中，通过与场所管理人员、执勤人员以及专家进行交流访谈，形成调查数据，从调查数据中获取影响要素的初步待定选项。

示例性地，访谈以提问的方式展开，问题主要包括“各个区域人群的来源、各个区域人群的去处、哪些事件及活动（比如促销、节假日等）会造成人群数量的增加、人群达到顶峰的时间跨度、哪些事件及活动会造成人群数量的减少、人群减少到谷底的时间跨度、应急预案中涉及到的干预人群流动的方法有哪些、具体举措是什么、每个干预措施具体分为了几个步骤、每一个步骤所需要的时间大致是多少、还有哪些可以影响到人群密度变化的因素”。进一步地，将相关人员的回答中，与人群密度有关的、可量化的答案转换抽象成变量，建立起与人群密度变化相关的要素集，并用矢量标识。

S30获取相关要素的历史演化数据具体包括：

S300获取感兴趣区域内的历史信息；

S301从所述感兴趣区域内的历史信息中获取相关要素的历史状态演化数据，与人群密度数据类似，所述历史状态演化数据被表征时间序列，按时间间隔

存储：

（5）

其中，

表示t_n时刻获得的相关要素的历史状态演化数据，

表示t_n时刻获取的第一个相关要素；

表示t_n时刻获取的第i个相关要素，

表示t_n时刻获取的第d个相关要素，n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点， t_n表示时间序列中的第n个时间点的具体时间，t_n－1表示时间序列中第n－1个时间点的具体时间，

表示时间间隔。

本实施例中，通过场所管理者和执勤人员所掌握的整个场所的历史信息（比如信息系统、人工登记的工作记录等），可以获得要素集的历史状态演化信息。

S40通过时间戳匹配，建立所述相关要素的历史演化数据与人群密度时空演化序列数据之间的映射关系，形成时序数据集：

（6）

表示t_n时刻获得的相关要素的历史状态演化数据，

表示人群密度时空演化序列数据。

针对时序数据集，通过统计分析初步判断要素集对预测人群密度的重要性，首先，计算要素集中每一个要素与密度之间的相关性系数，具体地：所述的S202将所述相关要素抽象成变量，建立起与人群密度演化相关的相关要素集之后包括：

S2021计算初步要素集中每个初步要素与每个区域的人群密度之间的相关性系数r_ij：

（7）

表示t_n时刻的相关要素中的第i个要素的值，

为序列

和序列

的协方差，

和

为

和序列

的方差；

S2022将所述相关性系数与设定的相关性阈值进行对比；

如果相关性系数大于或等于某设定的阈值，表示两者有强的线性相关性，相关的变量作为必须要考虑的初步关键要素保留，其他线性相关性差的要素则作为待定因素放入待定要素集，具体地：

S2023将所述相关性系数大于等于设定的相关性阈值的初步要素保留为初步关键要素：

（8）

其中，

表示初步关键要素集，

表示第i个初步关键要素，

表示初步关键要素集中第i个要素与第j个子区域的人群密度之间的相关性系数的绝对值，r₀表示设定的相关性阈值，i表示相关要素集中第i个要素，j表示感兴趣区域集合中任意一子区域的标号，p表示初步关键要素的个数，意味着通过筛选，初步关键要素的个数降低为p个，m表示感兴趣区域集合中子区域的个数。

S2024将所述相关性系数小于设定的相关性阈值的初步要素作为待定要素，并形成待定要素集：

（9）

其中，

表示待定要素集，

表示第i个待定要素，

值得说明的是，如果最后预测效果不好，说明相关要素集中有要素与密度之间存在非线性关系，这时需要将(9)式所示待定要素，重新并入式（4）中进行测试。

在人群密度演化要素分析及其量化处理的步骤中，已获得如式（6）所示的时序数据集。但是通常管理者或执行人员所积累的数据都是日常运维数据，很少或者未曾包含发生极端情况，如火灾、抢劫等突发事件引起的人群异常流动的数据，而这些极端环境下人群流动却是人群安全管理的重点。所以，需要通过应急演练、仿真模拟等方式，获取极端条件下的人群密度相关样本数据。特别是仿真模拟技术，可以不受场景和资源限制，是获取相关数据的主要途径。基于人群动力学的仿真模拟技术已经成熟，主要有基于流的方法（Flow-based Approach）、基于实体的方法（Entity-based Approach）和基于主体的方法（Agent-based Approach），并存在着大量的实现软件工具，如vadere、NetLogo等。通过这些工具，我们可以实现全场景的样本数据采集，从而扩充式（6）所示的数据集，形成全场景样本数据集。

所述全场景样本数据集为：

（10）

表示在第a个场景中要素集在第n个时间点的状态数据，

表示在第a场景中、第n个时间点的人群密度分布数据。

建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系，形成人群密度预测数据集：

（11）

表示k－q时刻的关键要素状态数据；

表示k－q下一时刻，即k－q+1 时刻的关键要素状态数据；

表示样本数据收集的参考时间点k时刻的关键要素状态数据；

表示从k－q到k时间段内要素状态数据的集合；

表示在未来第k+l 个时间点的人群密度分布。

将人群密度预测问题转换为带参数函数的模型优化问题，具体包括：根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型：

基于人群密度预测数据集，在t_n时刻，人群密度预测模型

的计算值由基于知识模型的预测函数

计算结果和基于机器学习算法的预测模型

的计算结果加和而成：

（12）

由于基于知识的模型，往往只能解决人群密度演化的共性问题，对于特定场景的特殊复杂情况，预测可能并不是完全准确。所以在基于知识模型的预测函数

之上，额外构建一个完全基于数据构建的机器学习模型（如决策树、卷积神经网络等）

，用于修正基于知识模型的预测函数

遗漏掉的信息。

考虑时空波动容错的优化目标：

具体地，有了式（11）所示的数据集和式（12）所示的人群密度预测模型

，我们就可以通过优化目标函数的方法来寻找人群密度预测模型

中的待定参数，实现基于要素集的历史状态演化信息来预测人群密度的未来分布。由于在人群安全管理中，某一时刻具体人群密度的绝对精度并不重要，大家更为关心的是人群密度高峰的量值及所述量值具体出现的时间段。所以，传统的预测值和真实值的方差并不适合于人群密度预测。为了处理这种时序上可以容许错位的密度预测，根据人群密度高峰的量值及所述量值具体出现的时间段构建误差函数：

（13）

其中，

是第j个子区域、第i′时间点的人群密度的真实测量值，i′表示在时刻n′－ k和n′+k之间的任意一个时间点，

是第j个子区域、在当前预测时间点n′的人群密度预测值；

优化问题的求解：

根据使用场景及硬件条件，选择不同的基于机器学习算法的预测模型，所述基于机器学习算法的预测模型包括：随机森林模型、多元线性回归模型、LSTM模型和CNN模型。

具体地，基于精度和时效性权衡的模型复杂度选择：分析具体的使用场景和硬件条件限制，可以选择合适的预测模型计算复杂度。对于没有显卡等加速器存在的硬件环境、以及要求时效性在秒级的预测系统，式（12）中的机器学习模型宜选择随机森林、多元线性回归等传统少参数模型：

（14）

对于由显卡加速器存在的硬件系统，式（12）中的机器学习模型选择LSTM、CNN等深度学习模型：

（15）

预测模型参数的获取：利用式（11）所示的数据集，以式（13）所示的误差函数为优化目标，根据梯度下降算法，调整模型的每一个参数，得到最终的人群密度预测模型。

人群密度预测：根据上一步得到的最终模型，基于要素集的历史数据和不断产生的实时人群密度监控数据，实现人群密度预测。

下面以火车站进站大厅为例，结合附图对本发明作进一步详细地说明，但不应理解为是对本发明保护内容的任何限定。

图2是本发明以火车站进站大厅为例进行人群密度预测的方法流程图，如图2所示：

走访火车站管理和执勤人员，结合三维空间特点和人员流动情况，将相关系数大于或等于设定的相关性阈值r₀的相关要素作为确认影响火车站进站楼层人群未来密度分布的关键因素，示例性地，影响火车站进站楼层人群未来密度分布的因素有：

是否有地铁到站x₁，状态为x₁=0表示到站，状态为x₁=1表示未到站；

进站楼层过去10分钟的人群密度分布，根据需求将进站楼层划分为有限个区域。以2个为例，那么密度分布对要素集贡献两个要素x₂、x₃，需要说明的是，密度状态为非负实数，表示该区域人群密度；

是否是适合出行的节假日x₄，状态为x₄=1，表示是，状态为x₄=0，表示否。

于是，影响火车站进站大厅人群密度分布的要素集为：

（16）

其中，

表示影响火车进站大厅人群密度分布的要素集，x₁表示因素：是否有地铁到站，x₂表示因素：进站楼层第一个区域过去10分钟的人群密度值变化，x₃表示因素：进站楼层第二个区域过去10分钟的人群密度值变化，x₄表示因素：是否是适合出行的节假日；

通过火车站的人群定位系统测量人群在日常正常运作情景下的实时密度分布并按式（6）的数据结构，将要素和密度的映射关系，按一定的时间间隔（比如1秒）储存在数据库中，并对每一个样本数据点（6）标定其采集情景：

（其中，n表示时间序列中的第n个时间点，n=0表示初始时间点，n=1表示第一个时间点，n=2 表示第二个时间点，n=3表示第三个时间点，a表示场景，a=1表示第一情景，a=2表示第二情景，

表示t_n时刻获得的相关要素的历史状态演化数据，

为要素的状态信息演化信息，表示在第a个场景中要素集在第n个时间点的状态数据）；存储样本的数据结构如表1所示：

表1 数据结构

对于日常情景，将情景标签标记为j=0。利用仿真模拟技术，模拟地铁晚点等原因造成的火车站的入口人员流量远远大于正常值（比如入口密度设置为平时值的5倍）时，一段时间内火车站大厅人群密度的演化情况。将相应的数据按表1所示的数据格式储存在数据库中，将情景标签标记为j=1。

根据上述步骤所建的数据库，利用式（11）的数据格式，取回溯时间偏移量指标q为固定值（比如q=599），取未来时间偏移量指标l为固定值（比如l=600），随机抽取足量样本点（比如1万个），组成密度预测数据集

。

根据火车站高精度和高时效的要求，配置高性能加速卡，选取CNN模型：

（17）

加入式（12）中构成密度预测模型。其中，CNN模型由若干个卷积层和一个全连接的神经网络层构成。

本实施例中，在人群密度数据集D中，以表1所示的数据结构中t时刻的前10分钟（共600个样本点）要素为特征输入X，以表1所示的数据结构中t时刻第10分钟后的区域密度（1个样本点）为预测目标Y，以式（14）所示的误差函数为优化目标，分两部得到预测模型。首先利用梯度下降算法，以式（14）所示的误差函数为优化目标，利用数据（X，Y），拟合式（12）中基于知识模型的预测函数

的待定参数，得到最终的知识参数模型

。然后，保持

的模型参数不变，利用Adam算法，以式（14）所示的误差函数为优化目标，训练得到式（12）中

所示的CNN深度学习模型（基于Pytorch等深度学习训练平台实现），从而得到用于人群密度预测的最终参数模型，以前10分钟的要素数据为输入，以后十分钟的密度分布为输出，可以记为：

；

其中，

表示t时刻未来 600秒后的人群密度分布，表示由知

识和机器学习训练出来的计算模型，

表示t时刻前599秒的要素数据，

表示t时刻前598秒的要素数据，

表示当前样本时间点。

如果上述算法的精度无法达到要求，则需要扩充要素集，然后重新执行上述步骤得到合适的参数模型。

从数据库中不断获取最近邻的十分钟的要素集状态数据

，然后利用算法完成10分钟后的人群密度预测。例如用表1中的0 到599行中的

数据预测第1199行的密度数据

。

图3是本发明一种人群密度预测系统的结构示意图，如图3所示，本发明提供一种人群密度预测系统，包括：建立单元，用于建立人群密度预测数据集；构建单元，用于根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型；训练单元，用于通过所述人群密度预测数据集对所述人群密度预测模型进行训练；优化单元，用于对训练后的人群密度预测模型进行优化，形成最终人群密度预测模型，用于实现人群密度预测。

尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种人群密度预测方法，其特征在于，包括：

获取人群密度时空演化序列数据；

获取与人群密度演化相关的相关要素；

获取相关要素的历史演化数据；

对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识，构建全场景样本数据集，所述场景包括日常场景和特殊场景；

建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系，形成人群密度预测数据集；m表示样本数据收集的起点时刻，m＞q；u表示样本数据收集的终止时刻；q为回溯时间偏移量，表示从参考时间点往前回溯时间点的数目；

2.根据权利要求1所述的人群密度预测方法，其特征在于，所述的获取人群密度时空演化序列数据包括：

将感兴趣区域划分为多个子区域：

（1）

（2）

其中，

表示多个子区域的人群密度集合，

表示第一子区域的人群密度，

表示第j子区域的人群密度，

表示第m子区域的人群密度；

以时间间隔

（3）

其中，

表示人群密度时空演化序列数据，

表示t_n时刻、第一子区域S₁的人群密度，

表示t_n时刻、第二子区域S₂的人群密度，

表示t_n时刻、第m子区域S_m的人群密度；n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，t_n表示时间序列中第n个时间点的具体时间，t_n－1表示时间序列中第n－1个时间点的具体时间，

表示时间间隔。

3.根据权利要求1所述的人群密度预测方法，其特征在于，所述的获取与人群密度演化相关的相关要素包括：

获取调查数据；

从所述调查数据中获取与人群密度演化相关的相关要素；

（4）

其中，

表示相关要素集，x₁表示第一个相关要素，x_i表示第i个相关要素，x_d表示第d个相关要素，d表示相关要素的个数。

4.根据权利要求1所述的人群密度预测方法，其特征在于，所述的获取相关要素的历史演化数据包括：

获取感兴趣区域内的历史信息；

存储：

（5）

其中，

表示t_n时刻获得的相关要素的历史状态演化数据，

表示t_n时刻

获取的第一个相关要素；

表示t_n时刻获取的第i个相关要素，

表示t_n时刻获取的第d个相关要素，n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，t_n表示时间序列中的第n个时间点的具体时

间，t_n－1表示时间序列中第n－1个时间点的具体时间，

表示时间间隔。

5.根据权利要求1所述的人群密度预测方法，其特征在于，所述时序数据集为：

（6）

其中，t_n表示时间序列中的第n个时间点的具体时间，n表示时间序列中的第n个时间点， n=0时，表示初始时间点，n=1时，表示第一个时间点，

表示t_n时刻获得的相关要素的历史状态演化数据，

表示人群密度时空演化序列数据。

6.根据权利要求3所述的人群密度预测方法，其特征在于，所述的将所述相关要素抽象成变量，建立起与人群密度演化相关的相关要素集之后包括：

（7）

表示t_n时刻的相关要素中的第i个要素的值，

表示第t_n时刻第j个子区域的人群密度值，n表示时间序列中的第n个时间点，n=0时，表示初始时间点，n=1时，表示第一个时间点，n =2时，表示第二个时间点，

为序列

和序列

的协方差，

和

为

和序列

的方差；

将所述相关性系数与设定的相关性阈值进行对比；

（8）

其中，

表示初步关键要素集，

表示第i个初步关键要素，

7.根据权利要求6所述的人群密度预测方法，其特征在于，在所述的将所述相关性系数与设定的相关性阈值进行对比之后包括：

（9）

其中，

表示待定要素集，

表示第i个待定要素，

表示待定要素集中第i个要素与第 j个子区域的人群密度之间的相关性系数的绝对值，r₀表示设定的相关性阈值，

表示第i个待定要素，i表示相关要素集中第i个要素，j表示感兴趣区域集合中任意一子区域的标号，d 表示相关要素的个数，p表示初步关键要素的个数，d－p表示总共有d－p个待定要素，m表示感兴趣区域集合中子区域的个数。

8.根据权利要求1所述的人群密度预测方法，其特征在于，所述全场景样本数据集为：

（10）

其中，n表示时间序列中的第n个时间点，n=0表示初始时间点，n=1表示第一个时间点，n =2表示第二个时间点，n=3表示第三个时间点，a表示场景，a=1表示第一个场景，a=2表示个场景，a=h表示第h个场景，

表示在第a个场景中要素集在第n个时间点的状态数据，

表示在第a场景中、第n个时间点的人群密度分布数据。

9.根据权利要求8所述的人群密度预测方法，其特征在于，包括：

形成的人群密度预测数据集为:

（11）

表示k－q时刻的关键要素状态数据；

表示k－q下一时刻，即k－q+1时刻的关键要素状态数据；

表示样本数据收集的参考时间点k时刻的关键要素状态数据；

表示从k－q到k时间段内要素状态数据的集合；

表示在未来第k+l个时间点的人群密度分布。

10.根据权利要求9所述的人群密度预测方法，其特征在于，所述的根据基于知识模型的预测函数以及基于机器学习算法的预测模型构建人群密度预测模型包括：

基于人群密度预测数据集，在t_n时刻，人群密度预测模型的计算值由基于知识模型的预测函数计算结果和基于机器学习算法的预测模型的计算结果加和而成：

（12）

其中，

表示人群密度预测模型，

表示基于知识模型的预测函数，

表示基于机器学习算法的预测模型。

11.根据权利要求10所述的人群密度预测方法，其特征在于，根据使用场景及硬件条件，选择不同的基于机器学习算法的预测模型，所述基于机器学习算法的预测模型包括：随机森林模型、多元线性回归模型、LSTM模型和CNN模型。

12.根据权利要求11所述的人群密度预测方法，其特征在于，包括：

（13）

其中，

是第j个子区域、第i′时间点的人群密度的真实测量值，i′表示在时刻n′－k和n′+ k之间的任意一个时间点，

是第j个子区域、在当前预测时间点n′的人群密度预测值；

13.一种人群密度预测系统，其特征在于，包括：

标识单元，用于对所述时序数据集中的每个相关要素的历史演化数据和人群密度时空演化序列数据进行场景标识，构建全场景样本数据集，所述场景包括日常场景和特殊场景；

形成单元，建立初步关键要素的状态信息演化数据与自初步关键要素采集时刻起m-u时间内的人群密度分布数据之间的关系，形成人群密度预测数据集；m表示样本数据收集的起点时刻，m＞q；u表示样本数据收集的终止时刻；q为回溯时间偏移量，表示从参考时间点往前回溯时间点的数目；

优化单元，用于对训练后的人群密度预测模型进行优化，形成最终人群密度预测模型。