CN113128772A - 一种基于序列到序列模型的人群数量预测方法以及装置 - Google Patents

一种基于序列到序列模型的人群数量预测方法以及装置 Download PDF

Info

Publication number
CN113128772A
CN113128772A CN202110444972.XA CN202110444972A CN113128772A CN 113128772 A CN113128772 A CN 113128772A CN 202110444972 A CN202110444972 A CN 202110444972A CN 113128772 A CN113128772 A CN 113128772A
Authority
CN
China
Prior art keywords
input
window
data
sequence
pred
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110444972.XA
Other languages
English (en)
Other versions
CN113128772B (zh
Inventor
钟竞辉
刘伟恒
蔡文桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sino Singapore International Joint Research Institute
Original Assignee
Sino Singapore International Joint Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sino Singapore International Joint Research Institute filed Critical Sino Singapore International Joint Research Institute
Priority to CN202110444972.XA priority Critical patent/CN113128772B/zh
Publication of CN113128772A publication Critical patent/CN113128772A/zh
Application granted granted Critical
Publication of CN113128772B publication Critical patent/CN113128772B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Business, Economics & Management (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于序列到序列模型的人群数量预测方法以及装置,包括以下步骤:在场景中选取K个监控点,所述监控点包括输入监控点Kin和预测监控点Kpred;选取T个时刻的人群轨迹数据,对每个监控点半径R范围内的人数进行统计;用矩阵A存储下来;通过滑动窗口的方法,对矩阵A进行数据处理,生成模型训练的数据集;将数据集输入至序列到序列模型中得出预测结果,所述序列到序列模型包括编码器和解码器,将数据集输入至编码器后,经过编码器编码生成上下文向量context;随后context输入到解码器中解码得出预测结果;本发明简化了模型的复杂度,在仿真数据集上的测试结果显示,模型具有较好的预测精度。

Description

一种基于序列到序列模型的人群数量预测方法以及装置
技术领域
本发明涉及人群数量预测技术领域,特别涉及一种基于序列到序列模型的人群数量预测方法以及装置。
背景技术
深度学习由于其强大的非线性拟合能力,已经被广泛地应用于图像识别、语音处理、自然语言处理、推荐系统等领域。为了对机器翻译这种多对多映射问题进行建模,许多团队都各自独立提出了基于深度学习的序列到序列模型(Seq2Seq)。随着近几年的发展,Seq2Seq模型已经被迁移到各种领域当中,在语音识别、金融分析、气象预测、交通预测等领域都获得了成功的应用,具有巨大的经济价值。
近年来,人群行为建模逐渐引起业界的关注。对人群行为的准确预测能够给治安、人群疏导、出入口管制等工作提供精确的指导,能够提升行人的通行效率、防止踩踏、保障行人安全等。在机场、地铁、大型商场等公共场合都有巨大的应用前景。然而,相比于道路交通行驶路径的约束性,人群的行走具有相当大的自由度,加上行人个人意识、群体意志的影响,人群行为的建模十分复杂,具有相当的难度。目前对人群行为的建模仿真有基于流的方法、基于实体的方法等。但这些方法存在模型复杂、预测实时性不高、对数据的利用不充分等问题。
发明内容
本发明的目的在于克服现有技术中的上述缺陷,提供一种基于序列到序列模型的人群数量预测方法以及装置,简化了模型的复杂度,在仿真数据集上的测试结果显示,模型具有较好的预测精度。
为实现上述目的,本发明提供了一种基于序列到序列模型的人群数量预测方法,包括以下步骤:
步骤S1,在场景中选取K个监控点,所述监控点包括输入监控点Kin和预测监控点Kpred
步骤S2,选取T个时刻的人群轨迹数据,对每个监控点半径R范围内的人数进行统计,得出每时刻各个监控点的人数数据;用形状为(T,Kin+Kpred)的矩阵A存储下来;
步骤S3,通过滑动窗口的方法,对矩阵A进行数据处理,生成模型训练的数据集;
步骤S4,将数据集输入至序列到序列模型中得出预测结果,所述序列到序列模型包括编码器和解码器,将数据集输入至编码器后,经过编码器编码生成上下文向量context;随后context输入到解码器中解码得出预测结果。
作为优选的,所述步骤S2中人群轨迹数据中每时刻的人数都在变化,在保证监控点数目不变的情况下,将不等长的数据处理成等长的数据。
作为优选的,所述步骤S3中所述滑动窗口包括输入窗口、间隔窗口和预测窗口;所述间隔窗口在输入窗口和预测窗口之间,所述间隔窗口用于增大输入窗口和预测窗口之间的因果关系关联度,所述滑动窗口的大小为W;所述输入窗口的大小为Win;所述间隔窗口的大小为Wgap;所述预测窗口的大小为Wpred;所述输入窗口的作用是提取Kin个输入监控点集在历史Win长度时间段内的人数数据;所述间隔窗口的作用是将输入窗口与预测窗口的位置间隔开,以让输入输出数据的因果关系能够对齐;所述间隔窗口的作用是提取Kpred个预测监控点在未来Wpred时间段内的人数数据。
作为优选的,所述滑动窗口W为输入窗口Win、间隔窗口Wgap和预测窗口Wpred的和;如公式(1):
W=Win+Wgap+Wpred (1)
所述滑动窗口产生一个形如(N,W,K)的三维张量B;其中N为数据集大小,K为监控点总个数,通过公式(2)(3)计算:
Figure BDA0003036507770000031
其中s为滑动窗口的步长;
K=Kin+Kpred (3)
对张量B进行归一化,如公式(4):
Figure BDA0003036507770000032
其中max为数据中人数的最大值;
对归一化后的三维张量B进行切分,将输入窗口中输入监控点的数据切分出来,得到训练数据的输入张量X,形状为(N,Win,Kin);将预测窗口中预测监控点的数据切分出来,得到训练数据的真实值张量Y,形状为(N,Wpred,Kpred);由此得出的张量X和Y即为模型训练的数据集。
作为优选的,所述编码器由多层单向LSTM神经网络组成;输入窗口的数据输入编码器后,产生多个隐向量;
LSTM输入向量的长度等于Kin,隐向量的长度与输入向量长度相同,如公式(5):
Figure BDA0003036507770000033
其中xt为编码器t时间步的输入,总的时间步数等于输入窗口大小Win;l为LSTM的层数;h与c分别为对应的LSTM单元的隐状态和Cell状态;
将编码器最后时刻的隐向量
Figure BDA0003036507770000047
作为编码器输出的上下文向量context;如公式(6):
Figure BDA0003036507770000046
所述解码器由多层LSTM与多层全连接神经网络MLP组成;context与解码器前一时刻的解码器输出
Figure BDA0003036507770000041
进行合并后作为LSTM单元的输入向量,具体公式如(7);
Figure BDA0003036507770000042
其中t为解码器的时间步,总共的时间步数等于预测窗口大小Wpred;对于解码器的每一时间步t,将LSTM最后一层输出的隐向量ht与context再一次合并后作为多层全连接网络MLP的输入,激活函数为ReLU函数,如公式(8);
Figure BDA0003036507770000043
MLP输入层的尺寸为context与ht的长度的和;隐藏层的尺寸与LSTM隐向量ht的长度相同;输出层的尺寸大小等于Kpred,其输出即为模型对预测监控点的预测结果,如公式(9);
Figure BDA0003036507770000044
所述输出结果为预测监控点当前时间步的归一化预测人数。
作为优选的,还包括步骤S5,对上述方法进行训练,所述训练使用的损失函数为预测结果与真实值之间的均方误差MSELoss,通过梯度下降进行反向传播,调整方法中的参数;使用Adam优化器作为模型训练过程的优化器,并采用小批量方法mini-batch进行训练。
作为优选的,所述损失函数的计算公式为:
Figure BDA0003036507770000045
本发明还提供了一种基于序列到序列模型的人群数量预测装置,包括:
数据处理模块,用于在场景中选取K个监控点,所述监控点包括输入监控点Kin和预测监控点Kpred;选取T个时刻的人群轨迹数据,对每个监控点半径R范围内的人数进行统计,得出每时刻各个监控点的人数数据;用形状为(T,Kin+Kpred)的矩阵A存储下来;通过滑动窗口的方法,对矩阵A进行数据处理,生成模型训练的数据集;
算法模型模块,与数据处理模块相连接,所述算法模型采用序列到序列模型,将数据集输入至序列到序列模型中得出预测结果,所述序列到序列模型包括编码器和解码器,将数据集输入至编码器后,经过编码器编码生成上下文向量context;随后context输入到解码器中解码得出预测结果。
作为优选的,还包括训练测试模块,所述训练测试模块使用的损失函数为预测结果与真实值之间的均方误差MSELoss,通过梯度下降进行反向传播,调整方法中的参数;使用Adam优化器作为模型训练过程的优化器,并采用小批量方法mini-batch进行训练。
与现有技术相比,本发明的有益效果在于:
本发明针对人群轨迹数据进行统计和处理,用形状为(T,Kin+Kpred)的矩阵A将数据存储下来;所述矩阵A是一套完整的数据处理和数据输出的组织格式,利用滑动窗口的方法,对矩阵A进行数据处理,生成模型训练的数据集;改善了输入数据和输出数据之间因果关系的关联度,将数据集输入至序列到序列模型中得出预测结果,简化了模型的复杂度,在仿真数据集上的测试结果显示,模型具有较好的预测精度,在广州绿地缤纷商城的仿真测试表明,本发明所提出的方法是十分有效的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的生成模型训练的数据集的示意图;
图2是本发明提供的序列到序列模型框架图。
具体实施方式
下面将结合本发明本实施方式中的附图,对本发明本实施方式中的技术方案进行清楚、完整地描述,显然,所描述的本实施方式是本发明的一种实施方式,而不是全部的本实施方式。基于本发明中的本实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他本实施方式,都属于本发明保护的范围。
实施例一
请参考图1和图2,本发明实施例一提供了一种基于序列到序列模型的人群数量预测方法,包括以下步骤:
步骤S1,在场景中选取K个监控点,所述监控点包括输入监控点Kin和预测监控点Kpred
具体的,人群轨迹数据为场景内所有行人在每个时刻的空间坐标,假定在一个场景中,共有K个监控点,分为输入监控点Kin和预测监控点Kpred两种。
由于行人的流入和流出与行人的走动,每时刻场地内的总人数与行人坐标的分布都不相同,各个监控点所统计到的人数也会发生改变,方法的任务即通过输入监控点在历史时间段内统计到的人数变化,预测出未来时间段内预测监控点范围内的人数。
步骤S2,选取T个时刻的人群轨迹数据,每个时刻数据中包含所有行人的坐标,对每个监控点半径R范围内的人数进行统计,得出每时刻各个监控点的人数数据;用形状为(T,Kin+Kpred)的矩阵A存储下来,具体的,所述矩阵A是一套完整的数据处理和数据输出的组织格式。
具体的,所述步骤S2中人群轨迹数据中每时刻的人数都在变化,在保证监控点数目不变的情况下,将不等长的数据处理成等长的数据,这样能大大降低时间序列建模的复杂度。
步骤S3,通过滑动窗口的方法,对矩阵A进行数据处理,生成模型训练的数据集。
具体的,由于各个监控点之间在空间上相隔一定的距离,行人在监控点间移动需要一定的时间,因此输入监控点的人数变化反映到预测监控点处需要一定的时间。
基于这个考虑,所述步骤S3中所述滑动窗口包括输入窗口、间隔窗口和预测窗口;所述间隔窗口在输入窗口和预测窗口之间,所述间隔窗口用于增大输入窗口和预测窗口之间的因果关系关联度。
进一步的,所述滑动窗口的大小为W;所述输入窗口的大小为Win;所述间隔窗口的大小为Wgap;所述预测窗口的大小为Wpred;所述输入窗口的作用是提取Kin个输入监控点集在历史Win长度时间段内的人数数据;所述间隔窗口的作用是将输入窗口与预测窗口的位置间隔开,以让输入输出数据的因果关系能够对齐;所述间隔窗口的作用是提取Kpred个预测监控点在未来Wpred时间段内的人数数据。
所述滑动窗口W为输入窗口Win、间隔窗口Wgap和预测窗口Wpred的和;如公式(1):
W=Win+Wgap+Wpred (1)
所述滑动窗口产生一个形如(N,W,K)的三维张量B;其中N为数据集大小,K为监控点总个数,通过公式(2)(3)计算:
Figure BDA0003036507770000081
其中s为滑动窗口的步长;
K=Kin+Kpred (3)
对张量B进行归一化,如公式(4):
Figure BDA0003036507770000082
其中max为数据中人数的最大值;
对归一化后的三维张量B进行切分,如图1所示,将输入窗口中输入监控点的数据切分出来,得到训练数据的输入张量X,形状为(N,Win,Kin);将预测窗口中预测监控点的数据切分出来,得到训练数据的真实值张量Y,形状为(N,Wpred,Kpred);由此得出的张量X和Y即为模型训练的数据集。
步骤S4,将数据集输入至序列到序列模型中得出预测结果,所述序列到序列模型包括编码器和解码器,将数据集输入至编码器后,经过编码器编码生成上下文向量context;随后context输入到解码器中解码得出预测结果。
如图2所示,下面展开讨论序列到序列模型的细节。
所述编码器由多层单向LSTM神经网络组成;输入窗口的数据输入编码器后,产生多个隐向量;
LSTM输入向量的长度等于Kin,隐向量的长度与输入向量长度相同,如公式(5):
Figure BDA0003036507770000091
其中xt为编码器t时间步的输入,总的时间步数等于输入窗口大小Win;l为LSTM的层数;h与c分别为对应的LSTM单元的隐状态和Cell状态;
将编码器最后时刻的隐向量
Figure BDA0003036507770000092
作为编码器输出的上下文向量context;如公式(6):
Figure BDA0003036507770000093
所述解码器由多层LSTM与多层全连接神经网络MLP组成;context与解码器前一时刻的解码器输出
Figure BDA0003036507770000094
进行合并后作为LSTM单元的输入向量,具体公式如(7);
Figure BDA0003036507770000095
其中t为解码器的时间步,总共的时间步数等于预测窗口大小Wpred;对于解码器的每一时间步t,将LSTM最后一层输出的隐向量ht与context再一次合并后作为多层全连接网络MLP的输入,激活函数为ReLU函数,如公式(8);
Figure BDA0003036507770000096
MLP输入层的尺寸为context与ht的长度的和;隐藏层的尺寸与LSTM隐向量ht的长度相同;输出层的尺寸大小等于Kpred,其输出即为模型对预测监控点的预测结果,如公式(9);
Figure BDA0003036507770000097
所述输出结果为预测监控点当前时间步的归一化预测人数。
MLP的输出即为Kpred个预测监控点的预测人数构成的向量,预测的时间步数等于预测窗口长度Wpred
实施例二
本发明实施例二是对实施例一的方法进行模拟仿真。
数据的来源为广州绿地缤纷城购物中心中某一时段的人群行为,仿真的场景为广州绿地缤纷城购物中心;仿真持续三个小时,每秒为一个单位,总共产生的T=10800时刻的数据;对生成的数据进行处理,数据处理设置的参数如下。
表1数据处理参数
R 监控点统计半径 10
W<sub>in</sub> 输入窗口大小 60
W<sub>gap</sub> 间隔窗口大小 30
W<sub>pred</sub> 预测窗口大小 3
s 滑动窗口步长 1
将生成的数据集经过滑动窗口的方法处理后,将80%的数据作为训练集,10%的数据作为验证集,10%的数据作为测试集。
所述序列到序列模型中网络结构的参数设置如表2。
表2网络结构参数
Figure BDA0003036507770000101
Figure BDA0003036507770000111
利用训练集的数据对实施例一中的方法进行训练,所述训练使用的损失函数为预测结果与真实值之间的均方误差MSELoss,通过梯度下降进行反向传播,调整方法中的参数。
所述训练的损失函数的计算公式为:
Figure BDA0003036507770000112
以最小化损失函数为目标,使用Adam优化器作为模型训练过程的优化器,具体是对序列到序列模型中网络结构的参数进行优化,并采用小批量方法(mini-batch)进行训练。
对训练集的所有批次进行打乱,训练超参数的设置如表3。
表3训练超参数
批大小 batch_size 80
训练代数 epochs 20
正则化系数 weight_decacy 5e-5
学习率 lr 0.001
最终结果显示,训练过程训练误差与验证误差都能够有效的降低到较低的数值,说明训练出来的模型有很好的精度与泛化能力。简化了模型的复杂度,在仿真数据集上的测试结果显示,模型具有较好的预测精度,在测试集上的测试结果显示模型对仿真数据预测的效果较好,这说明本发明中对人群数量预测的建模是十分有效的。
实施例三
本发明实施例三提供了一种基于序列到序列模型的人群数量预测装置,包括:
数据处理模块,用于在场景中选取K个监控点,所述监控点包括输入监控点Kin和预测监控点Kpred;选取T个时刻的人群轨迹数据,对每个监控点半径R范围内的人数进行统计,得出每时刻各个监控点的人数数据;用形状为(T,Kin+Kpred)的矩阵A存储下来;通过滑动窗口的方法,对矩阵A进行数据处理,生成模型训练的数据集;
算法模型模块,与数据处理模块相连接,所述算法模型采用序列到序列模型,将数据集输入至序列到序列模型中得出预测结果,所述序列到序列模型包括编码器和解码器,将数据集输入至编码器后,经过编码器编码生成上下文向量context;随后context输入到解码器中解码得出预测结果。
进一步的,还包括训练测试模块,所述训练测试模块使用的损失函数为预测结果与真实值之间的均方误差MSELoss,通过梯度下降进行反向传播,调整方法中的参数;使用Adam优化器作为模型训练过程的优化器,并采用小批量方法mini-batch进行训练。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (9)

1.一种基于序列到序列模型的人群数量预测方法,其特征在于,包括以下步骤:
步骤S1,在场景中选取K个监控点,所述监控点包括输入监控点Kin和预测监控点Kpred
步骤S2,选取T个时刻的人群轨迹数据,对每个监控点半径R范围内的人数进行统计,得出每时刻各个监控点的人数数据;用形状为(T,Kin+Kpred)的矩阵A存储下来;
步骤S3,通过滑动窗口的方法,对矩阵A进行数据处理,生成模型训练的数据集;
步骤S4,将数据集输入至序列到序列模型中得出预测结果,所述序列到序列模型包括编码器和解码器,将数据集输入至编码器后,经过编码器编码生成上下文向量context;随后context输入到解码器中解码得出预测结果。
2.根据权利要求1所述的一种基于序列到序列模型的人群数量预测方法,其特征在于,所述步骤S2中人群轨迹数据中每时刻的人数都在变化,在保证监控点数目不变的情况下,将不等长的数据处理成等长的数据。
3.根据权利要求1所述的一种基于序列到序列模型的人群数量预测方法,其特征在于,所述步骤S3中所述滑动窗口包括输入窗口、间隔窗口和预测窗口;所述间隔窗口在输入窗口和预测窗口之间,所述间隔窗口用于增大输入窗口和预测窗口之间的因果关系关联度,所述滑动窗口的大小为W;所述输入窗口的大小为Win;所述间隔窗口的大小为Wgap;所述预测窗口的大小为Wpred;所述输入窗口的作用是提取Kin个输入监控点集在历史Win长度时间段内的人数数据;所述间隔窗口的作用是将输入窗口与预测窗口的位置间隔开,以让输入输出数据的因果关系能够对齐;所述间隔窗口的作用是提取Kpred个预测监控点在未来Wpred时间段内的人数数据。
4.根据权利要求3所述的一种基于序列到序列模型的人群数量预测方法,其特征在于,所述滑动窗口W为输入窗口Win、间隔窗口Wgap和预测窗口Wpred的和;如公式(1):
W=Win+Wgap+Wpred (1)
所述滑动窗口产生一个形如(N,W,K)的三维张量B;其中N为数据集大小,K为监控点总个数,通过公式(2)(3)计算:
Figure FDA0003036507760000021
其中s为滑动窗口的步长;
K=Kin+Kpred (3)
对张量B进行归一化,如公式(4):
Figure FDA0003036507760000022
其中max为数据中人数的最大值;
对归一化后的三维张量B进行切分,将输入窗口中输入监控点的数据切分出来,得到训练数据的输入张量X,形状为(N,Win,Kin);将预测窗口中预测监控点的数据切分出来,得到训练数据的真实值张量Y,形状为(N,Wpred,Kpred);由此得出的张量X和Y即为模型训练的数据集。
5.根据权利要求4所述的一种基于序列到序列模型的人群数量预测方法,其特征在于,所述编码器由多层单向LSTM神经网络组成;输入窗口的数据输入编码器后,产生多个隐向量;
LSTM输入向量的长度等于Kin,隐向量的长度与输入向量长度相同,如公式(5):
Figure FDA0003036507760000031
其中xt为编码器t时间步的输入,总的时间步数等于输入窗口大小Win;l为LSTM的层数;h与c分别为对应的LSTM单元的隐状态和Cell状态;
将编码器最后时刻的隐向量
Figure FDA0003036507760000036
作为编码器输出的上下文向量context;如公式(6):
Figure FDA0003036507760000037
所述解码器由多层LSTM与多层全连接神经网络MLP组成;context与解码器前一时刻的解码器输出
Figure FDA0003036507760000032
进行合并后作为LSTM单元的输入向量,具体公式如(7);
Figure FDA0003036507760000033
其中t为解码器的时间步,总共的时间步数等于预测窗口大小Wpred;对于解码器的每一时间步t,将LSTM最后一层输出的隐向量ht与context再一次合并后作为多层全连接网络MLP的输入,激活函数为ReLU函数,如公式(8);
Figure FDA0003036507760000034
MLP输入层的尺寸为context与ht的长度的和;隐藏层的尺寸与LSTM隐向量ht的长度相同;输出层的尺寸大小等于Kpred,其输出即为模型对预测监控点的预测结果,如公式(9);
Figure FDA0003036507760000035
所述输出结果为预测监控点当前时间步的归一化预测人数。
6.根据权利要求5所述的一种基于序列到序列模型的人群数量预测方法,其特征在于,还包括步骤S5,对上述方法进行训练,所述训练使用的损失函数为预测结果与真实值之间的均方误差MSELoss,通过梯度下降进行反向传播,调整方法中的参数;使用Adam优化器作为模型训练过程的优化器,并采用小批量方法mini-batch进行训练。
7.根据权利要求6所述的一种基于序列到序列模型的人群数量预测方法,其特征在于,所述损失函数的计算公式为:
Figure FDA0003036507760000041
8.一种基于序列到序列模型的人群数量预测装置,其特征在于,包括:
数据处理模块,用于在场景中选取K个监控点,所述监控点包括输入监控点Kin和预测监控点Kpred;选取T个时刻的人群轨迹数据,对每个监控点半径R范围内的人数进行统计,得出每时刻各个监控点的人数数据;用形状为(T,Kin+Kpred)的矩阵A存储下来;通过滑动窗口的方法,对矩阵A进行数据处理,生成模型训练的数据集;
算法模型模块,与数据处理模块相连接,所述算法模型采用序列到序列模型,将数据集输入至序列到序列模型中得出预测结果,所述序列到序列模型包括编码器和解码器,将数据集输入至编码器后,经过编码器编码生成上下文向量context;随后context输入到解码器中解码得出预测结果。
9.根据权利要求8所述的一种基于序列到序列模型的人群数量预测装置,其特征在于,还包括训练测试模块,所述训练测试模块使用的损失函数为预测结果与真实值之间的均方误差MSELoss,通过梯度下降进行反向传播,调整方法中的参数;使用Adam优化器作为模型训练过程的优化器,并采用小批量方法mini-batch进行训练。
CN202110444972.XA 2021-04-24 2021-04-24 一种基于序列到序列模型的人群数量预测方法以及装置 Active CN113128772B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110444972.XA CN113128772B (zh) 2021-04-24 2021-04-24 一种基于序列到序列模型的人群数量预测方法以及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110444972.XA CN113128772B (zh) 2021-04-24 2021-04-24 一种基于序列到序列模型的人群数量预测方法以及装置

Publications (2)

Publication Number Publication Date
CN113128772A true CN113128772A (zh) 2021-07-16
CN113128772B CN113128772B (zh) 2023-01-17

Family

ID=76779610

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110444972.XA Active CN113128772B (zh) 2021-04-24 2021-04-24 一种基于序列到序列模型的人群数量预测方法以及装置

Country Status (1)

Country Link
CN (1) CN113128772B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114098679A (zh) * 2021-12-30 2022-03-01 中新国际联合研究院 基于深度学习和射频感知的生命体征监测波形的恢复方法
CN117177184A (zh) * 2023-10-30 2023-12-05 北京融信数联科技有限公司 基于手机信令的机场日活跃用户预测方法、系统和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018059300A1 (zh) * 2016-09-29 2018-04-05 北京市商汤科技开发有限公司 行走行为的预测方法和装置、数据处理装置和电子设备
CN109902880A (zh) * 2019-03-13 2019-06-18 南京航空航天大学 一种基于Seq2Seq生成对抗网络的城市人流预测方法
US20200043483A1 (en) * 2018-08-01 2020-02-06 Google Llc Minimum word error rate training for attention-based sequence-to-sequence models
CN111553543A (zh) * 2020-05-18 2020-08-18 润联软件系统(深圳)有限公司 基于TPA-Seq2Seq的电力负荷预测方法及相关组件
CN112269931A (zh) * 2020-10-28 2021-01-26 中山大学 数据驱动的群体智能交互关系推断与演化计算方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018059300A1 (zh) * 2016-09-29 2018-04-05 北京市商汤科技开发有限公司 行走行为的预测方法和装置、数据处理装置和电子设备
US20200043483A1 (en) * 2018-08-01 2020-02-06 Google Llc Minimum word error rate training for attention-based sequence-to-sequence models
CN109902880A (zh) * 2019-03-13 2019-06-18 南京航空航天大学 一种基于Seq2Seq生成对抗网络的城市人流预测方法
CN111553543A (zh) * 2020-05-18 2020-08-18 润联软件系统(深圳)有限公司 基于TPA-Seq2Seq的电力负荷预测方法及相关组件
CN112269931A (zh) * 2020-10-28 2021-01-26 中山大学 数据驱动的群体智能交互关系推断与演化计算方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MINGBI ZHAO ET AL.: ""Evaluation of Crowd Models in Low Density Scenarios Using Real-World Crowd Data"", 《2015 IEEE/ACM 19TH INTERNATIONAL SYMPOSIUM ON DISTRIBUTED SIMULATION AND REAL TIME APPLICATIONS》 *
王铭锋: ""基于HTM与Seq2Seq的农产品价格预测研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114098679A (zh) * 2021-12-30 2022-03-01 中新国际联合研究院 基于深度学习和射频感知的生命体征监测波形的恢复方法
CN114098679B (zh) * 2021-12-30 2024-03-29 中新国际联合研究院 基于深度学习和射频感知的生命体征监测波形的恢复方法
CN117177184A (zh) * 2023-10-30 2023-12-05 北京融信数联科技有限公司 基于手机信令的机场日活跃用户预测方法、系统和介质

Also Published As

Publication number Publication date
CN113128772B (zh) 2023-01-17

Similar Documents

Publication Publication Date Title
CN109492830B (zh) 一种基于时空深度学习的移动污染源排放浓度预测方法
CN104268594B (zh) 一种视频异常事件检测方法及装置
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
Venna et al. A novel data-driven model for real-time influenza forecasting
CN113128772B (zh) 一种基于序列到序列模型的人群数量预测方法以及装置
CN114330671A (zh) 一种基于Transformer时空图卷积网络的交通流预测方法
Nguyen et al. EO-CNN: an enhanced CNN model trained by equilibrium optimization for traffic transportation prediction
CN107529650A (zh) 网络模型的构建和闭环检测方法、相应装置及计算机设备
Hirata et al. Time series prediction using DBN and ARIMA
Peng et al. Hybrid learning clonal selection algorithm
Zhong et al. Density-based evolutionary framework for crowd model calibration
CN111862592B (zh) 一种基于rgcn的交通流预测方法
CN111445010A (zh) 一种基于证据理论融合量子网络的配网电压趋势预警方法
CN110110372B (zh) 一种用户时序行为自动切分预测方法
Wang et al. Predicting the epidemics trend of COVID-19 using epidemiological-based generative adversarial networks
Xiao et al. Addressing overfitting problem in deep learning-based solutions for next generation data-driven networks
Nourani et al. Forecasting stock prices using a hybrid artificial bee colony based neural network
Angelis et al. Energformer: A new transformer model for energy disaggregation
Hu et al. An edge intelligence-based generative data augmentation system for iot image recognition tasks
Li et al. A two-stream graph convolutional neural network for dynamic traffic flow forecasting
Hoomod et al. Temperature Prediction Using Recurrent Neural Network for Internet of Things Room Controlling Application
CN112541469B (zh) 基于自适应分类的人群计数方法及系统
Zhang et al. Security situation prediction based on hybrid rice optimization algorithm and back propagation neural network
Meir et al. Universality of underlying mechanism for successful deep learning
Rana Time series prediction of the COVID-19 outbreak in India using LSTM based deep learning models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant