CN113128772A

CN113128772A - 一种基于序列到序列模型的人群数量预测方法以及装置

Info

Publication number: CN113128772A
Application number: CN202110444972.XA
Authority: CN
Inventors: 钟竞辉; 刘伟恒; 蔡文桐
Original assignee: Sino Singapore International Joint Research Institute
Current assignee: Sino Singapore International Joint Research Institute
Priority date: 2021-04-24
Filing date: 2021-04-24
Publication date: 2021-07-16
Anticipated expiration: 2041-04-24
Also published as: CN113128772B

Abstract

本发明公开了一种基于序列到序列模型的人群数量预测方法以及装置，包括以下步骤：在场景中选取K个监控点，所述监控点包括输入监控点K_in和预测监控点K_pred；选取T个时刻的人群轨迹数据，对每个监控点半径R范围内的人数进行统计；用矩阵A存储下来；通过滑动窗口的方法，对矩阵A进行数据处理，生成模型训练的数据集；将数据集输入至序列到序列模型中得出预测结果，所述序列到序列模型包括编码器和解码器，将数据集输入至编码器后，经过编码器编码生成上下文向量context；随后context输入到解码器中解码得出预测结果；本发明简化了模型的复杂度，在仿真数据集上的测试结果显示，模型具有较好的预测精度。

Description

一种基于序列到序列模型的人群数量预测方法以及装置

技术领域

本发明涉及人群数量预测技术领域，特别涉及一种基于序列到序列模型的人群数量预测方法以及装置。

背景技术

深度学习由于其强大的非线性拟合能力，已经被广泛地应用于图像识别、语音处理、自然语言处理、推荐系统等领域。为了对机器翻译这种多对多映射问题进行建模，许多团队都各自独立提出了基于深度学习的序列到序列模型(Seq2Seq)。随着近几年的发展，Seq2Seq模型已经被迁移到各种领域当中，在语音识别、金融分析、气象预测、交通预测等领域都获得了成功的应用，具有巨大的经济价值。

近年来，人群行为建模逐渐引起业界的关注。对人群行为的准确预测能够给治安、人群疏导、出入口管制等工作提供精确的指导，能够提升行人的通行效率、防止踩踏、保障行人安全等。在机场、地铁、大型商场等公共场合都有巨大的应用前景。然而，相比于道路交通行驶路径的约束性，人群的行走具有相当大的自由度，加上行人个人意识、群体意志的影响，人群行为的建模十分复杂，具有相当的难度。目前对人群行为的建模仿真有基于流的方法、基于实体的方法等。但这些方法存在模型复杂、预测实时性不高、对数据的利用不充分等问题。

发明内容

本发明的目的在于克服现有技术中的上述缺陷，提供一种基于序列到序列模型的人群数量预测方法以及装置，简化了模型的复杂度，在仿真数据集上的测试结果显示，模型具有较好的预测精度。

为实现上述目的，本发明提供了一种基于序列到序列模型的人群数量预测方法，包括以下步骤：

步骤S1，在场景中选取K个监控点，所述监控点包括输入监控点K_in和预测监控点K_pred；

步骤S2，选取T个时刻的人群轨迹数据，对每个监控点半径R范围内的人数进行统计，得出每时刻各个监控点的人数数据；用形状为(T，K_in+K_pred)的矩阵A存储下来；

步骤S3，通过滑动窗口的方法，对矩阵A进行数据处理，生成模型训练的数据集；

步骤S4，将数据集输入至序列到序列模型中得出预测结果，所述序列到序列模型包括编码器和解码器，将数据集输入至编码器后，经过编码器编码生成上下文向量context；随后context输入到解码器中解码得出预测结果。

作为优选的，所述步骤S2中人群轨迹数据中每时刻的人数都在变化，在保证监控点数目不变的情况下，将不等长的数据处理成等长的数据。

作为优选的，所述步骤S3中所述滑动窗口包括输入窗口、间隔窗口和预测窗口；所述间隔窗口在输入窗口和预测窗口之间，所述间隔窗口用于增大输入窗口和预测窗口之间的因果关系关联度，所述滑动窗口的大小为W；所述输入窗口的大小为W_in；所述间隔窗口的大小为W_gap；所述预测窗口的大小为W_pred；所述输入窗口的作用是提取K_in个输入监控点集在历史W_in长度时间段内的人数数据；所述间隔窗口的作用是将输入窗口与预测窗口的位置间隔开，以让输入输出数据的因果关系能够对齐；所述间隔窗口的作用是提取K_pred个预测监控点在未来W_pred时间段内的人数数据。

作为优选的，所述滑动窗口W为输入窗口W_in、间隔窗口W_gap和预测窗口W_pred的和；如公式(1)：

W＝W_in+W_gap+W_pred (1)

所述滑动窗口产生一个形如(N，W，K)的三维张量B；其中N为数据集大小，K为监控点总个数，通过公式(2)(3)计算：

其中s为滑动窗口的步长；

K＝K_in+K_pred (3)

对张量B进行归一化，如公式(4)：

其中max为数据中人数的最大值；

对归一化后的三维张量B进行切分，将输入窗口中输入监控点的数据切分出来，得到训练数据的输入张量X，形状为(N，W_in，K_in)；将预测窗口中预测监控点的数据切分出来，得到训练数据的真实值张量Y，形状为(N，W_pred，K_pred)；由此得出的张量X和Y即为模型训练的数据集。

作为优选的，所述编码器由多层单向LSTM神经网络组成；输入窗口的数据输入编码器后，产生多个隐向量；

LSTM输入向量的长度等于K_in，隐向量的长度与输入向量长度相同，如公式(5)：

其中x_t为编码器t时间步的输入，总的时间步数等于输入窗口大小W_in；l为LSTM的层数；h与c分别为对应的LSTM单元的隐状态和Cell状态；

将编码器最后时刻的隐向量

作为编码器输出的上下文向量context；如公式(6)：

所述解码器由多层LSTM与多层全连接神经网络MLP组成；context与解码器前一时刻的解码器输出

进行合并后作为LSTM单元的输入向量，具体公式如(7)；

其中t为解码器的时间步，总共的时间步数等于预测窗口大小W_pred；对于解码器的每一时间步t，将LSTM最后一层输出的隐向量h_t与context再一次合并后作为多层全连接网络MLP的输入，激活函数为ReLU函数，如公式(8)；

MLP输入层的尺寸为context与h_t的长度的和；隐藏层的尺寸与LSTM隐向量h_t的长度相同；输出层的尺寸大小等于K_pred，其输出即为模型对预测监控点的预测结果，如公式(9)；

所述输出结果为预测监控点当前时间步的归一化预测人数。

作为优选的，还包括步骤S5，对上述方法进行训练，所述训练使用的损失函数为预测结果与真实值之间的均方误差MSELoss，通过梯度下降进行反向传播，调整方法中的参数；使用Adam优化器作为模型训练过程的优化器，并采用小批量方法mini-batch进行训练。

作为优选的，所述损失函数的计算公式为：

本发明还提供了一种基于序列到序列模型的人群数量预测装置，包括：

数据处理模块，用于在场景中选取K个监控点，所述监控点包括输入监控点K_in和预测监控点K_pred；选取T个时刻的人群轨迹数据，对每个监控点半径R范围内的人数进行统计，得出每时刻各个监控点的人数数据；用形状为(T，K_in+K_pred)的矩阵A存储下来；通过滑动窗口的方法，对矩阵A进行数据处理，生成模型训练的数据集；

算法模型模块，与数据处理模块相连接，所述算法模型采用序列到序列模型，将数据集输入至序列到序列模型中得出预测结果，所述序列到序列模型包括编码器和解码器，将数据集输入至编码器后，经过编码器编码生成上下文向量context；随后context输入到解码器中解码得出预测结果。

作为优选的，还包括训练测试模块，所述训练测试模块使用的损失函数为预测结果与真实值之间的均方误差MSELoss，通过梯度下降进行反向传播，调整方法中的参数；使用Adam优化器作为模型训练过程的优化器，并采用小批量方法mini-batch进行训练。

与现有技术相比，本发明的有益效果在于：

本发明针对人群轨迹数据进行统计和处理，用形状为(T，K_in+K_pred)的矩阵A将数据存储下来；所述矩阵A是一套完整的数据处理和数据输出的组织格式，利用滑动窗口的方法，对矩阵A进行数据处理，生成模型训练的数据集；改善了输入数据和输出数据之间因果关系的关联度，将数据集输入至序列到序列模型中得出预测结果，简化了模型的复杂度，在仿真数据集上的测试结果显示，模型具有较好的预测精度，在广州绿地缤纷商城的仿真测试表明，本发明所提出的方法是十分有效的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的生成模型训练的数据集的示意图；

图2是本发明提供的序列到序列模型框架图。

具体实施方式

下面将结合本发明本实施方式中的附图，对本发明本实施方式中的技术方案进行清楚、完整地描述，显然，所描述的本实施方式是本发明的一种实施方式，而不是全部的本实施方式。基于本发明中的本实施方式，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他本实施方式，都属于本发明保护的范围。

实施例一

请参考图1和图2，本发明实施例一提供了一种基于序列到序列模型的人群数量预测方法，包括以下步骤：

步骤S1，在场景中选取K个监控点，所述监控点包括输入监控点K_in和预测监控点K_pred。

具体的，人群轨迹数据为场景内所有行人在每个时刻的空间坐标，假定在一个场景中，共有K个监控点，分为输入监控点K_in和预测监控点K_pred两种。

由于行人的流入和流出与行人的走动，每时刻场地内的总人数与行人坐标的分布都不相同，各个监控点所统计到的人数也会发生改变，方法的任务即通过输入监控点在历史时间段内统计到的人数变化，预测出未来时间段内预测监控点范围内的人数。

步骤S2，选取T个时刻的人群轨迹数据，每个时刻数据中包含所有行人的坐标，对每个监控点半径R范围内的人数进行统计，得出每时刻各个监控点的人数数据；用形状为(T，K_in+K_pred)的矩阵A存储下来，具体的，所述矩阵A是一套完整的数据处理和数据输出的组织格式。

具体的，所述步骤S2中人群轨迹数据中每时刻的人数都在变化，在保证监控点数目不变的情况下，将不等长的数据处理成等长的数据，这样能大大降低时间序列建模的复杂度。

步骤S3，通过滑动窗口的方法，对矩阵A进行数据处理，生成模型训练的数据集。

具体的，由于各个监控点之间在空间上相隔一定的距离，行人在监控点间移动需要一定的时间，因此输入监控点的人数变化反映到预测监控点处需要一定的时间。

基于这个考虑，所述步骤S3中所述滑动窗口包括输入窗口、间隔窗口和预测窗口；所述间隔窗口在输入窗口和预测窗口之间，所述间隔窗口用于增大输入窗口和预测窗口之间的因果关系关联度。

进一步的，所述滑动窗口的大小为W；所述输入窗口的大小为W_in；所述间隔窗口的大小为W_gap；所述预测窗口的大小为W_pred；所述输入窗口的作用是提取K_in个输入监控点集在历史W_in长度时间段内的人数数据；所述间隔窗口的作用是将输入窗口与预测窗口的位置间隔开，以让输入输出数据的因果关系能够对齐；所述间隔窗口的作用是提取K_pred个预测监控点在未来W_pred时间段内的人数数据。

所述滑动窗口W为输入窗口W_in、间隔窗口W_gap和预测窗口W_pred的和；如公式(1)：

W＝W_in+W_gap+W_pred (1)

其中s为滑动窗口的步长；

K＝K_in+K_pred (3)

对张量B进行归一化，如公式(4)：

其中max为数据中人数的最大值；

对归一化后的三维张量B进行切分，如图1所示，将输入窗口中输入监控点的数据切分出来，得到训练数据的输入张量X，形状为(N，W_in，K_in)；将预测窗口中预测监控点的数据切分出来，得到训练数据的真实值张量Y，形状为(N，W_pred，K_pred)；由此得出的张量X和Y即为模型训练的数据集。

如图2所示，下面展开讨论序列到序列模型的细节。

所述编码器由多层单向LSTM神经网络组成；输入窗口的数据输入编码器后，产生多个隐向量；

将编码器最后时刻的隐向量

作为编码器输出的上下文向量context；如公式(6)：

进行合并后作为LSTM单元的输入向量，具体公式如(7)；

所述输出结果为预测监控点当前时间步的归一化预测人数。

MLP的输出即为K_pred个预测监控点的预测人数构成的向量，预测的时间步数等于预测窗口长度W_pred。

实施例二

本发明实施例二是对实施例一的方法进行模拟仿真。

数据的来源为广州绿地缤纷城购物中心中某一时段的人群行为，仿真的场景为广州绿地缤纷城购物中心；仿真持续三个小时，每秒为一个单位，总共产生的T＝10800时刻的数据；对生成的数据进行处理，数据处理设置的参数如下。

表1数据处理参数

R	监控点统计半径	10
			W<sub>in</sub>	输入窗口大小	60
W<sub>gap</sub>	间隔窗口大小	30
			W<sub>pred</sub>	预测窗口大小	3
s	滑动窗口步长	1

将生成的数据集经过滑动窗口的方法处理后，将80％的数据作为训练集，10％的数据作为验证集，10％的数据作为测试集。

所述序列到序列模型中网络结构的参数设置如表2。

表2网络结构参数

利用训练集的数据对实施例一中的方法进行训练，所述训练使用的损失函数为预测结果与真实值之间的均方误差MSELoss，通过梯度下降进行反向传播，调整方法中的参数。

所述训练的损失函数的计算公式为：

以最小化损失函数为目标，使用Adam优化器作为模型训练过程的优化器，具体是对序列到序列模型中网络结构的参数进行优化，并采用小批量方法(mini-batch)进行训练。

对训练集的所有批次进行打乱，训练超参数的设置如表3。

表3训练超参数

批大小	batch_size	80
			训练代数	epochs	20
正则化系数	weight_decacy	5e-5
			学习率	lr	0.001

最终结果显示，训练过程训练误差与验证误差都能够有效的降低到较低的数值，说明训练出来的模型有很好的精度与泛化能力。简化了模型的复杂度，在仿真数据集上的测试结果显示，模型具有较好的预测精度，在测试集上的测试结果显示模型对仿真数据预测的效果较好，这说明本发明中对人群数量预测的建模是十分有效的。

实施例三

本发明实施例三提供了一种基于序列到序列模型的人群数量预测装置，包括：

进一步的，还包括训练测试模块，所述训练测试模块使用的损失函数为预测结果与真实值之间的均方误差MSELoss，通过梯度下降进行反向传播，调整方法中的参数；使用Adam优化器作为模型训练过程的优化器，并采用小批量方法mini-batch进行训练。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于序列到序列模型的人群数量预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于序列到序列模型的人群数量预测方法，其特征在于，所述步骤S2中人群轨迹数据中每时刻的人数都在变化，在保证监控点数目不变的情况下，将不等长的数据处理成等长的数据。

3.根据权利要求1所述的一种基于序列到序列模型的人群数量预测方法，其特征在于，所述步骤S3中所述滑动窗口包括输入窗口、间隔窗口和预测窗口；所述间隔窗口在输入窗口和预测窗口之间，所述间隔窗口用于增大输入窗口和预测窗口之间的因果关系关联度，所述滑动窗口的大小为W；所述输入窗口的大小为W_in；所述间隔窗口的大小为W_gap；所述预测窗口的大小为W_pred；所述输入窗口的作用是提取K_in个输入监控点集在历史W_in长度时间段内的人数数据；所述间隔窗口的作用是将输入窗口与预测窗口的位置间隔开，以让输入输出数据的因果关系能够对齐；所述间隔窗口的作用是提取K_pred个预测监控点在未来W_pred时间段内的人数数据。

4.根据权利要求3所述的一种基于序列到序列模型的人群数量预测方法，其特征在于，所述滑动窗口W为输入窗口W_in、间隔窗口W_gap和预测窗口W_pred的和；如公式(1)：

W＝W_in+W_gap+W_pred (1)

其中s为滑动窗口的步长；

K＝K_in+K_pred (3)

对张量B进行归一化，如公式(4)：

其中max为数据中人数的最大值；

5.根据权利要求4所述的一种基于序列到序列模型的人群数量预测方法，其特征在于，所述编码器由多层单向LSTM神经网络组成；输入窗口的数据输入编码器后，产生多个隐向量；

将编码器最后时刻的隐向量

作为编码器输出的上下文向量context；如公式(6)：

进行合并后作为LSTM单元的输入向量，具体公式如(7)；

所述输出结果为预测监控点当前时间步的归一化预测人数。

6.根据权利要求5所述的一种基于序列到序列模型的人群数量预测方法，其特征在于，还包括步骤S5，对上述方法进行训练，所述训练使用的损失函数为预测结果与真实值之间的均方误差MSELoss，通过梯度下降进行反向传播，调整方法中的参数；使用Adam优化器作为模型训练过程的优化器，并采用小批量方法mini-batch进行训练。

7.根据权利要求6所述的一种基于序列到序列模型的人群数量预测方法，其特征在于，所述损失函数的计算公式为：

8.一种基于序列到序列模型的人群数量预测装置，其特征在于，包括：

9.根据权利要求8所述的一种基于序列到序列模型的人群数量预测装置，其特征在于，还包括训练测试模块，所述训练测试模块使用的损失函数为预测结果与真实值之间的均方误差MSELoss，通过梯度下降进行反向传播，调整方法中的参数；使用Adam优化器作为模型训练过程的优化器，并采用小批量方法mini-batch进行训练。