WO2024031520A1

WO2024031520A1 - 一种基于生成对抗网络的人群移动预测方法

Info

Publication number: WO2024031520A1
Application number: PCT/CN2022/111718
Authority: WO
Inventors: 李超; 李可汉; 陈积明; 贺诗波; 杨秦敏
Original assignee: 浙江大学
Priority date: 2022-08-09
Filing date: 2022-08-11
Publication date: 2024-02-15
Also published as: CN115238589A

Abstract

一种基于生成对抗网络的人群移动预测方法，以新冠肺炎(COVID-19)疫情期间城市人群流动预测为研究对象，研究多模态数据的时空特征融合的问题。由于复杂的社会背景、政策和疫情状况等复杂多模态数据的影响，使得预测疫情期间人群移动的模式变得十分困难。基于生成对抗网络的人群移动预测方法分析了国内三个城市的人群移动数据，发现尽管不同的城市之间有着很大的差距，但是它们在新冠肺炎疫情期间的人群移动模式呈现出很高的相似性。基于生成对抗网络的人群移动预测方法设计了基于条件生成对抗网络的预测模型，模型中融合建模了多模态数据对于人群移动时空特征的影响。基于条件生成对抗网络的预测模型还可以帮助政府更好地评估不同政策对人群移动性的潜在影响，优化政策制定。

Description

一种基于生成对抗网络的人群移动预测方法

技术领域

本发明属于人群移动预测领域，具体涉及涉及一种基于生成对抗网络的人群移动预测方法，该疫情期间人群移动预测方法能够帮助理解COVID-19疫情期间人群移动模式如何变化，特别揭示了疫情期间政府发布的限制出行政策和相关统计数据(如确诊病例)在新冠肺炎大流行期间主导了人群移动的规律。并精准的进行了人群移动水平的预测。

背景技术

理解COVID-19疫情期间人群移动模式如何变化对于控制流行病的传播非常重要。考虑到复杂的社会背景、个人行为的差异和极其有限的数据等因素的影响，疫情期间人群移动的模式似乎变的不可预测。

如果无法精准预测人群的移动规律，很难制定合理的政策，而过于严格的防疫政策会对经济产生较大的影响，太松散的防疫政策又会导致疫情难以控制，影响人民的生命健康。因此需要精准的预测来提供准确的政策制定参考。

当前基于深度学习模型解决城市人群移动预测的模型范式，主要是基于丰富历史数据进行训练，之后给定当前和历史时间上一段时间的观测数据，模型能够输出确定性预测结果。但是这种方式存在一定的局限性，首先，确定性的预测模型无法生成人群流动性的概率估计；此外，生成的结果比较固定，不方便灵活的改变一些条件进行多维度的仿真。新冠肺炎疫情期间，政府决策者的决策者需要更为灵活的模型，如生成式模型，它能够学习数据的分布并模拟不同政策下的多种潜在的人群流动规律，政府可以基于疫情期间的的模拟人群移动响应结果，制定分阶段的重新开放计划。因此，申请人提出了一个条件生成对抗网络，用于新增确诊病例、政策和人群移动之间的复杂动态建模。

发明内容

本发明目的在于对现有研究和技术存在的不足之处加以完善与规范化，提出一种基于生成对抗网络的人群移动预测方法。该方法通过建模疫情期间不同的政策和疫情状况的影响，来准确的预测人群移动的变化趋势，更具有实用价值；且有利于通过数据预测的结果对潜在政策影响进行分析，方法应用的扩展性高。

本发明的目的通过以下的技术方案实现：

一种基于生成对抗网络的人群移动预测方法，包括以下步骤：

步骤1，把一个城市划分为H×W个等面积的网格，每个网格代表城市中的一个区域；

步骤2，对步骤1中的区域划分，分别统计不同区域的人群移动水平m；

步骤3，利用步骤2中统计的区域人群移动水平得出城市中一片区域构成的人群移动热图M∈R ^H×W，矩阵中每个元素代表了相应区域的人群移动水平；

步骤4，收集疫情期间不同地区的每日统计数据和相关政策，得到每日新增确诊病例C作为疫情期间代表性的统计数据，获取每日政策的变化和强度，将这些政策的强度变量记为P；

步骤5，基于以上的分析对于特定的城市，给定历史和当前的人群移动热图{M _t-1，M _t}和相应的新冠肺炎疫情统计数据{C _t-1，C _t，C _t+1}以及政策{P _t-1，P _t，}，预测未来一段时间的人群移动水平热图{M _t+1}。

进一步地，所述步骤5中，通过疫情期间人群移动预测模型预测疫情期间人口流动的规律，生成未来一段时间的人群移动水平热图，该疫情期间人群移动预测模型包括生成器模块、判别器模块以及领域知识融合模块；

所述生成器模块基于过去一段时间的历史人群移动数据预测未来一段时间的人群移动规律；

所述判别起模块用于预测人类流动图的标签，判断生成的人口流动热图是否与真实分布一致；

所述领域知识融合模块用于融合疫情期间外部因素的影响。

进一步地，所述生成器模块通过建模不同时间步之间的人口流动变化值，来建模疫情期间不同区域人口流动强度对于政策变化的响应，生成器模块的输入可以表示为连续两个时间片段之间的人口移动水平变化：

ΔM _t-1＝M _t-M _t-1。

进一步地，所述疫情期间人群移动预测模型中引入基于transformer的编码器模块，来建模长距离的时空相关性，引入多头自注意力机制模块，提取得到特征图

经过transformer处理的特征记为

并将输出的特征与外部条件特征拼接在一起输送到解码器输出预测的人口流动结果。

进一步地，所述领域知识融合模块将疫情期间的政策、疫情统计数据作为条件，和时空人口移动特征融合，具体包括：引入一个全连接的神经网络，将不同种类的领域知识首先转化为隐变量

接着引入一个门控融合网络模块去激活不同区域的时空特征：

疫情期间人群移动预测模型在工作的时空同时引入一个噪声向量

和时空特征向量在特征维上拼接，最后疫情期间人群移动预测模型引入一个跨模型连接，得到对于下一个时间步的人口流动水平估计：

进一步地，所述疫情期间人群移动预测模型引入一个掩码矩阵

来减少缺少采样的区域带来的影响，可以从生成器模块中计算出带有掩码矩阵的损失函数：

得到判别器模块的损失函数为：

最终合并生成器和判别器的损失函数得到：

通过训练模型达到生成器和判别器损失函数的的鞍点，表明模型训练完成。

进一步地，所述每日政策包括出行限制和封锁政策、经济政策、卫生系统政策中的一种或多种指标。

与现有技术相比，本发明的有益效果为：

1)本发明采用了渐进式的学习方式，能够处理快速变化的疫情期间人口流动数据；

2)本发明引入了领域知识融合模块，能够很好的建模政策和疫情发展状况对人口流动变化的影响；

3)本发明中生成器模块和判别器模块构成了生成对抗网络，来建模人口流动过程中的不确定性。

附图说明

图1为本发明流程图；

图2为本发明中疫情期间人群移动预测模型结构示意图。

具体实施方式

在本发明的描述中，需要理解的是，术语“一端”、“另一端”、“外侧”、“上”、“内侧”、“水平”、“同轴”、“中央”、“端部”、“长度”、“外端”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

下面结合附图对本发明作进一步说明。

请参阅图1，一种基于生成对抗网络的人群移动预测方法，该方法包括以下步骤：

步骤5，基于以上的分析对于特定的城市，给定历史和当前的人群移动热图{M _t-1，M _t}和相应的新冠肺炎疫情统计数据{C _t-1，C _t，C _t+1}(大量文章已经实现了对新增确诊病例的准确实时预测)以及政策{P _t-1，P _t，}(可以由政策制定者提前制定)，预测未来一段时间的人群移动水平热图{M _t+1}。

请参阅图2，所述步骤5中，通过疫情期间人群移动预测模型预测疫情期间人口流动的规律，生成未来一段时间的人群移动水平热图，该疫情期间人群移动预测模型包括生成器模块、判别器模块以及领域知识融合模块；所述生成器模块基于过去一段时间的历史人群移动数据预测未来一段时间的人群移动规律；所述判别起模块用于预测人类流动图的标签，判断生成的人口流动热图是否与真实分布一致；所述领域知识融合模块用于融合疫情期间外部因素的影响。

其中，生成器模块和判别器模块构成生成对抗网络，用来建模人口流动过程中的不确定性。

结合疫情期间政策和新增确诊人数等统计情况进行人群移动估计的方法。本发明提出了一种基于深度生成网络的模型用于预测疫情期间人口流动的规律。生成式模型能够学习数据的分布并模拟不同政策下的多种潜在的人群流动规律，政府可以基于疫情期间的的模拟人群移动响应结果，制定分阶段的重新开放计划。本发明提出了一个条件生成对抗网络，用于新增确诊病例、政策和人群流动之间的复杂动态建模。模型不同于传统的模型对长期的时序依赖关系进行建模，而是专注于预测由潜在的疫情相关统计数据、政策和人群流动性的最新动态形成的相邻时间段之间的人群流动性转变。具体来说，本发明设计了一个Policy-Human Mobility Interplay Network(PHMIN)模型来估计人群的移动性变化。在这里，模型的条件输入主要来自于疫情期间的统计数据和政策。模型可以灵活地学习细粒度的人群移动动态，并准确地扩展到跨城市的多波疫情的预测，模型的结构如图1所示。

进一步地，所述生成器模块通过建模不同时间步之间的人口流动变化值，来高效的地建模疫情期间不同区域人口流动强度对于政策变化的响应，生成器模块的输入可以表示为连续两个时间片段之间的人口移动水平变化：ΔM _t-1＝M _t-M _t-1。

进一步地，所述疫情期间人群移动预测模型中另一方面，考虑到多尺度的时空人口移动特征，在这里引入基于transformer的编码器模块，来建模长距离的时空相关性，引入多头自注意力机制模块，提取得到特征图

经过transformer处理的特征记为

进一步地，所述领域知识融合模块通过将疫情期间的政策、疫情统计数据作为条件，和时空人口移动特征融合，来提高预测的精度。具体包括：引入一个全连接的神经网络，将不同种类的领域知识首先转化为隐变量

同时考虑到人口流动预测过程中的不确定性，疫情期间人群移动预测模型在工作的时空同时引入一个噪声向量

进一步地，所述疫情期间人群移动预测模型优化模型的过程中引入一个掩码矩阵

来减少缺少采样的区域带来的影响，因此可以从生成器模块中计算出带有掩码矩阵的损失函数：

更进一步可以得到判别器模块的损失函数为：

最终合并生成器和判别器的损失函数得到：

实施例

本实施例采用上述疫情期间人群移动预测方法对北京、大连、石家庄三座城市的疫情期间人群移动情况进行预测，其中BJ代表北京，DL代表大连，SJZ代表石家庄，后面的序号表明不同波次的疫情期间人口移动数据。考虑到上述三个城市共经历了七波新冠肺炎疫情，本实施例根据实际的情况把疫情划分为两种强度，进而得到三组实验：1)不同城市间相似强度下的实验；2)不同城市不同强度的实验；3)同一个城市相似或者不同强度场景下的实验的结果进行分层分析。这些实验的设计旨在回答一个基本问题：模型是否可以在不同的环境中有效的泛化，用于预测下一波疫情到来时政策对人群流动的影响。下文将详细地讨论这个问题。

表6.1：跨城市相似疫情强度预测实验

不同城市相似强度：根据表6.1中显示的实验结果，可以得到以下几个结论：

总体上来说，与基线模型相比，PHMIN模型达到了最好的性能，这证明了模型在跨城市的人群流动预测场景下具有良好泛化能力。具体来说，相对简单的HA和ARIMA模型表现出比DeepST和cGAN更好的性能，这在一定程度上意味着问题中最有价值的信息与人群流动的最新情况相关。此外，cGAN略优于DeepST，因为cGAN能够以生成方式对人群流动的未知因素进行建模。另一方面，DeepST给出的是基于丰富历史观察的确定性预测，在疫情场景中由于缺少历史数据不太适合。

给定相同的测试城市作为预测目标，发现基于不同城市训练集得到模型会有不同的表现。在DL1、SJZ1和SJZ2上进行测试时，基于BJ1训练的模型明显显示出比其他城市更好的结果。这可以归因于北京的数据质量更高，有着更多的可用样本和较高的人群密度。

城市地理分布相似性可能会影响模型跨城市预测的效果。从实验结果中发现，基于DL1训练的模型通常会导致更差的性能，以DL1-BJ1、DL1-SJZ1和DL1-SJZ2上的结果为例，它们的结果与传统的ARIMA相差不大(MAE更好，MAPE更差)。事实上，大连市区四面环海，地理上的分布也不是很规则，而北京和石家庄则有着非常规则的、类似棋盘式的布局的市区。据此可以推测出空间分布的差距可能会使模型在城市间的泛化变得更加困难。

表6.2：跨城市不同强度预测实验

不同城市不同强度：为了研究模型在不同强度疫情之间的泛化表现，进一步设计并进行了表6.2中所示的实验，实验的结果说明了：

在大多数情况下，与基线模型相比，PHMIN模型仍然表现更好。然而，对于同一个测试城市，不同强度的训练集预测的整体性能比从表6.1中相似强度得到的模型要差一些。这说明与不同的城市布局相比，疫情的强度是影响模型泛化能力更关键的指标。

基于大连市的数据训练的模型在其他城市上仍然表现不佳(例如，DL1-BJ2和DL2-SJZ2)，这再次说明了城市地理分布相似的重要性。此外，地理分布和疫情强度的双重差异导致提出的模型在DL2-SJZ2场景下的预测结果比基线方法ARIMA更差。

表6.3：同城市相似或者不同强度预测实验

同城相似或者不同强度：直观地来说，在同一个城市进行实验，模型应该更容易泛化取得更好的结果。但是表6.3中的实验数据揭示了一些不同的结果：

首先，PHMIN模型在所有的实验中都优于基线模型，此外，SJZ1-SJZ2、DL2-DL3、BJ1-BJ2三组实验与表6.1和6.2中的结果相比达到了更好的效果，这意味着同一个城市内的差距带来的负面影响可能还要小于疫情强度的作用。

但是在DL1-DL2和DL1-DL3两组实验中结果出现了异常，其结果分别比BJ2-DL2和BJ2-DL3还要差。这可以归因于BJ2、DL2和DL3，三个数据集尽管在不同的城市，但是经历的疫情强度相似。比较DL2-DL3和DL1-DL3之间的结果，可以推断出提出的模型在同一城市内的相似疫情强度的场景进行人群流动预测时，可以表现出更好的泛化性能。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

一种基于生成对抗网络的人群移动预测方法，包括以下步骤：

步骤1，把一个城市划分为H×W个等面积的网格，每个网格代表城市中的一个区域；

步骤2，对步骤1中的区域划分，分别统计不同区域的人群移动水平m；

步骤3，利用步骤2中统计的区域人群移动水平得出城市中一片区域构成的人群移动热图M∈R ^H×W，矩阵中每个元素代表了相应区域的人群移动水平；

步骤4，收集疫情期间不同地区的每日统计数据和相关政策，得到每日新增确诊病例C作为疫情期间代表性的统计数据，获取每日政策的变化和强度，将这些政策的强度变量记为P；

步骤5，对于特定的城市，给定历史和当前的人群移动热图{M _t-1，M _t}和相应的新冠肺炎疫情统计数据{C _t-1，C _t，C _t+1}以及政策{P _t-1，P _t，}，预测未来一段时间的人群移动水平热图{M _t+1}。
根据权利要求1所述的一种基于生成对抗网络的人群移动预测方法，其特征在于，所述步骤5中，通过疫情期间人群移动预测模型预测疫情期间人口流动的规律，生成未来一段时间的人群移动水平热图，该疫情期间人群移动预测模型包括生成器模块、判别器模块以及领域知识融合模块；

所述生成器模块基于过去一段时间的历史人群移动数据预测未来一段时间的人群移动规律；

所述判别起模块用于预测人类流动图的标签，判断生成的人口流动热图是否与真实分布一致；

所述领域知识融合模块用于融合疫情期间外部因素的影响。
根据权利要求2所述的一种基于生成对抗网络的人群移动预测方法，其特征在于，所述生成器模块通过建模不同时间步之间的人口流动变化值，来建模疫情期间不同区域人口流动强度对于政策变化的响应，生成器模块的输入可以表示为连续两个时间片段之间的人口移动水平变化：

ΔM _t-1＝M _t-M _t-1。
根据权利要求2所述的一种基于生成对抗网络的人群移动预测方法，其特征在于，所述疫情期间人群移动预测模型中引入基于transformer的编码器模块，来建模长距离的时空相关性，引入多头自注意力机制模块，提取得到特征图
经过transformer处理的特征记为
并将输出的特征与外部条件特征拼接在一起输送到解码器输出预测的人口流动结果。
根据权利要求2所述的一种基于生成对抗网络的人群移动预测方法，其特征在于，所述领域知识融合模块将疫情期间的政策、疫情统计数据作为条件，和时空人口移动特征融合，具体包括：引入一个全连接的神经网络，将不同种类的领域知识首先转化为隐变量
接着引入一个门控融合网络模块去激活不同区域的时空特征：

疫情期间人群移动预测模型在工作的时空同时引入一个噪声向量
和时空特征向量在特征维上拼接，最后疫情期间人群移动预测模型引入一个跨模型连接，得到对于下一个时间步的人口流动水平估计：
根据权利要求2所述的一种基于生成对抗网络的人群移动预测方法，其特征在于，所述疫情期间人群移动预测模型引入一个掩码矩阵
来减少缺少采样的区域带来的影响，可以从生成器模块中计算出带有掩码矩阵的损失函数：

得到判别器模块的损失函数为：

最终合并生成器和判别器的损失函数得到：

通过训练模型达到生成器和判别器损失函数的的鞍点，表明模型训练完成。
根据权利要求1所述的一种基于生成对抗网络的人群移动预测方法，其特征在于，所述每日政策包括出行限制和封锁政策、经济政策、卫生系统政策中的一种或多种指标。