CN113993153A

CN113993153A - 人群聚集预测方法、装置、设备和计算机可读存储介质

Info

Publication number: CN113993153A
Application number: CN202111253202.3A
Authority: CN
Inventors: 李勇路; 林敏�; 刘卉芳; 江俊昊; 叶海宁; 廖娟; 彭诗雅; 邹俊德; 闫猛; 黄茂松; 杨沛; 冯烨; 林德庆
Original assignee: China United Network Communications Group Co Ltd
Current assignee: China United Network Communications Group Co Ltd
Priority date: 2021-10-27
Filing date: 2021-10-27
Publication date: 2022-01-28
Anticipated expiration: 2041-10-27
Also published as: CN113993153B

Abstract

本发明提供一种人群聚集预测方法、装置、设备和计算机可读存储介质，包括：根据接入基站的终端的访问数据确定基站的基站向量；根据基站的预测时间段确定基站的独热向量；根据基站向量、独热向量以及预设模型预测基站在预测时间段内连接的终端的第一数量；根据各个访问数据获取基站在预测时间段所连接的终端的历史数量以及图模型，预测基站在预测时间段连接终端的第二数量；在第一数量以及第二数量线性融合得到的数量大于预设阈值时，基站在预测时间段发生人群聚集。本发明中，充分利用访问数据获取基站的基站向量以及基站连接的终端的历史数量，且第一数量以及第二数量的融合准确的预测基站是否发生人群聚集，提高了人群聚集预测的准确性。

Description

人群聚集预测方法、装置、设备和计算机可读存储介质

技术领域

本发明涉及通信技术领域，尤其涉及一种人群聚集预测方法、装置、设备和计算机可读存储介质。

背景技术

随着信息技术的发展，用户使用智能手机访问互联网的行为变得越来越普遍。常见的手机访问互联网除了通过无线局域网接入互联网之外，还有相当大一部分通过由运营商提供的移动互联网服务完成。而移动通信基站作为移动设备接入互联网的接口，在提供移动互联网服务的同时也保留了用户访问互联网的详细记录。从时间维度上看，用户通过手机使用移动互联网服务的访问行为近年来变得越来越频繁，尤其是一些网络访问密集型的手机软件，如导航软件、社交软件等的普及，由于需要在后台保持网络连接，更加促成了用户移动网络访问行为的密集性。这些记录内容详尽，体量大，而且采集方便，其中还包含着丰富的有关用户空间移动与互联网访问行为模式的信息，可用于进行各种用户行为相关属性的挖掘以及预测，使得基于大规模数据的人类移动行为研究成为可能。

在已有的人类移动行为的研究中，人类移动距离分布被多种形式的函数的拟合，如幂律函数、指数函数、指数截断的幂律函数等。尽管这些不同的函数体现着人类移动行为的多个不同的动力学因素，但其中一致的一点在于移动距离的分布P(d)随着d的增大而减小，即人的活动范围可被认为是有限的。现代城市生活也使得人类的主要活动区域相对集中，如家庭和工作地，这让人的日常活动有一定的区域特征。

当前，通过接入基站的终端的访问数据对基站覆盖区域是否发生人群聚集进行预测，这种预测方式并未充分运用访问数据，人群聚集预测准确性较低。

发明内容

本发明提供一种人群聚集预测方法、装置、设备和计算机可读存储介质，用以解决群聚集预测准确性较低的问题。

一方面，本发明提供一种人群聚集预测方法，包括：

获取接入待测基站的各个终端的第一访问数据，并根据各个所述第一访问数据确定所述待测基站的基站向量；

根据所述待测基站对应的预测时间段确定所述待测基站的独热向量；

根据所述基站向量、所述独热向量以及预设模型，预测所述待测基站在所述预测时间段内所连接的终端的第一数量；

根据各个所述第一访问数据获取所述待测基站在所述预测时间段所连接的终端的历史数量，并根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量；

对所述第一数量以及所述第二数量进行线性融合得到目标数量；

在所述目标数量大于预设阈值时，确定所述待测基站在所述预测时间段发生人群聚集。

可选地，所述待测基站为多个，所述对所述第一数量以及所述第二数量进行线性融合得到目标数量的步骤包括：

获取第一预设向量以及第二预设向量；

根据各个所述待测基站对应的第一数量确定第一向量，并确定所述第一预设向量与所述第一向量的第一哈达玛积；

根据各个所述待测基站对应的第二数量确定第二向量，并确定所述第二预设向量与所述第二向量的第二哈达玛积；

根据所述第一哈达玛积以及所述第二哈达玛积确定第三向量，其中，所述第三向量的每个维度的数值对应一个所述待测基站的目标数量。

可选地，所述根据各个所述第一访问数据确定所述待测基站的基站向量的步骤包括：

获取初始有向图，并从各个第一访问数据获取预设信息，其中，所述预设信息包括用户、时刻、基站ID以及访问内容；

将所述预设信息对应的基站节点添加至所述初始有向图得到目标有向图；

将所述目标有向图中的所述基站节点嵌入至维空间中，得到各个所述待测基站对应的基站向量。

可选地，所述根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量的步骤之前，还包括：

获取各个终端对应的基站轨迹以及初始的第一有权无向图，其中，所述基站轨迹是所述终端连接的各个基站以及所述终端连接的基站的时间点所构成的轨迹；

根据各个所述基站轨迹更新第一有权无向图得到第二有权无向图；

获取接入所述待测基站的各个终端的历史的第二访问数据，并根据各个所述第二访问数据确定第一训练数据；

根据所述第一训练数据以及所述第二有权无向图对第一模型进行训练得到所述图模型。

可选地，所述根据各个所述基站轨迹更新第一有权无向图得到第二有权无向图的步骤包括：

在各个所述基站轨迹中，获取每相邻的两个目标基站对应的连接时间点之间的间隔时长；

在第一有权无向图中，更新大于预设时长的所述间隔时长对应的目标基站的初始权重，得到第二有权无向图。

可选地，所述根据所述待测基站对应的预测时间段确定所述待测基站的独热向量的步骤包括：

将一天划分为多个第一时间段，并获取所述待测基站的预测时间段；

将与所述预测时间段相同的第一时间段对应的数值设置为第一预设值，并将与所述预测时间段不同的每个第一时间段对应的数值设置为第二预设值；

根据所述第一预设值以及各个第二预设值，构建所述待测基站在所述预测时间段对应的独热向量。

可选地，所述根据所述基站向量、所述独热向量以及预设模型，预测所述待测基站在所述预测时间段内所连接的终端的第一数量的步骤之前还包括：

获取接入所述待测基站的各个终端的历史的第二访问数据，并根据各个所述第二访问数据确定第二训练数据；

根据所述第二训练数据对第二模型进行训练得到所述预设模型。

另一方面，本发明还提供一种人群聚集预测装置，包括：

获取模块，用于获取接入待测基站的各个终端的第一访问数据，并根据各个所述第一访问数据确定所述待测基站的基站向量；

确定模块，用于根据所述待测基站对应的预测时间段确定所述待测基站的独热向量；

预测模块，用于根据所述基站向量、所述独热向量以及预设模型，预测所述待测基站在所述预测时间段内所连接的终端的第一数量；

所述获取模块，还用于根据各个所述第一访问数据获取所述待测基站在所述预测时间段所连接的终端的历史数量，并根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量；

融合模块，用于对所述第一数量以及所述第二数量进行线性融合得到目标数量；

所述确定模块，还用于在所述目标数量大于预设阈值时，确定所述待测基站在所述预测时间段发生人群聚集。

另一方面，本发明还提供一种人群聚集预测设备，包括：存储器以及处理器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，使得所述处理器执行如上所述的人群聚集预测方法。

另一方面，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如上所述的人群聚集预测方法。

本发明提供的人群聚集预测方法、装置、设备和计算机可读存储介质，获取接入待测基站的各个终端的访问数据，并根据各个第一访问数据确定待测基站的基站向量，且根据待测基站的预测时间段确定待测基站的独热向量，从而根据基站向量、独热向量以及预设模型预测待测基站在预测时间段连接的终端的第一数量，再根据各个访问数据获取待测基站在预设时间段所连接的终端的历史数量，并根据历史数量以及图模型预测待测基站在预测时间段连接的终端的第二数量，第一数量与第二数量进行线性融合得到目标数量，若是目标数量大于预设阈值，即可确定待测基站在预测时间段会发生人群聚集。本发明中，先基于访问数据获取待测基站的基站向量，再根据访问数据获取待测基站连接的终端的历史数量，充分的利用了终端的访问数据，提高了人群聚集预测的准确性；进一步的，待测基站的基站向量以及独热向量预测的第一数量结合待测基站连接的终端的历史数量所预测的第二数量，能够更加准确的确定待测基站在预测时间段内是否发生人群聚集，进一步提高了人群聚集预测的准确性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1为本发明实现人群聚集预测方法的系统构架图；

图2为本发明人群聚集预测方法第一实施例的流程示意图；

图3为本发明人群聚集预测方法第二实施例中步骤S50的细化流程示意图；

图4为本发明人群聚集预测方法第三实施例中步骤S10的细化流程示意图；

图5为本发明人群聚集预测装置的模块示意图；

图6为本发明人群聚集预测设备的硬件结构示意图。

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本发明提供一种人群聚集预测方法，可以通过图1所示的系统架构实现。如图1所示，手机100接入基站200，用户300通过基站200提供给手机100的网络进行冲浪，使得基站获取手机100所产生访问数据，基站200再将各个手机200所产生的访问数据发送至终端400。终端400通过访问数据即可预测出基站200在预测时间段连接的手机的数量，该数量表征基站200附近的用户的数量，从而可以基于预测的数量确定基站200附近是否发生人群聚集。

下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本发明的实施例进行描述。

参照图2，图2为本发明人群聚集预测方法的第一实施例，人群聚集预测方法包括以下步骤：

步骤S10，获取接入待测基站的各个终端的第一访问数据，并根据各个第一访问数据确定待测基站的基站向量。

在本实施例中，执行主体为人群聚集预测装置，人群聚集预测装置可以是任意具有数据处理能力的设备，例如，人群聚集预测装置可以为计算机。为了便于描述，以下采用装置指代人群聚集预测装置。

装置获取各个终端的访问数据，访问数据中包含有持有终端的用户、访问的时间、基站ID以及访问内容。通过基站ID即可确定需要预测的基站，并将需要预测的基站定义为待测基站，且将终端的访问数据定义为第一访问数据。可以理解的是，装置获取的是接入待测基站的各个终端的第一访问数据。

装置在根据各个第一访问数据确定待测基站的基站向量。基站向量可以理解为表征基站特征的向量，也即基于第一访问数据确定待测基站的特征，特征可通过待测基站的各个第一访问数据的访问内容的类型确定。装置将访问内容分为若干个类别，并将每个类别的访问内容进行统计，从而基于类别以及属于类别的访问内容构建基站向量。

步骤S20，根据待测基站对应的预测时间段确定待测基站的独热向量。

一天可以划分为多个时间段，划分的时间段定义为第一时间段。装置确定待测基站的预测时间段，预设时间段可以是任意一个第一时间段。装置可以基于预测时间段确定待测基站的独热向量，独热向量中每个维度对应一个第一时间段，且独热向量中与第一时间段相同的预测时间段的维度所对应的数值，和独热向量中其他维度对应的数值不同，且各个其他维度的数值均相同。例如，可以将各个第一时间段作为一个向量，第一时间段的数量为24，则向量为24维的向量，预测时间段对应的维度的数值与其他维度对应的数值均不同，且其他维度对应的数据均相同。

具体的，装置将一天划分为多个第一时间段，并获取待测基站的预测时间段。装置将与预测时间段相同的第一时间段对应的数值设置为第一预设值，并将预设时间段不同的每个第一时间段对应的数值设置为第二预设值，第一预设值与第二预设值不同。装置再根据第一预设值以及各个第二预设值构建待测基站在预测时间段所对应的独热向量。第一预设值可以为1，而第二预设值可以为0。

步骤S30，根据基站向量、独热向量以及预设模型，预测待测基站在预测时间段内所连接的终端的第一数量。

装置中设置有预设模型，预设模型是利用各个第二访问数据得到的训练数据训练得到的模型。预设模型是一个单层的神经网络。装置将基站向量以及独热向量输入至预设模型，预设模型输出的数值即为装置预测待测基站在预测时间段所连接的终端的数量，将该数量定义为第一数量。第一数量即为待测基站在预测时间段内所聚集的用户的数量

步骤S40，根据各个第一访问数据获取待测基站在预测时间段所连接的终端的历史数量，并根据历史数量以及图模型预测待测基站在预测时间段所连接的终端的第二数量。

在本实施例中，装置还需要考虑相邻或者距离较近的基站之间的用户的迁移，也即需要评估个基站间的可到达性。可到达性可以通过有权无向图进行表征。可到达性解释为：

如果两个基站之间因为某种原因而十分容易到达，比如因为距离近，或比如因为交通便利，则这两个基站的连接人数之间会有明显的相关性，此基站之流出人群与彼基站之流入人群有大量的重叠；相反，如果两个基站之间不容易到达，则它们的连接人数之间就不会有太大的相关性，此基站之流出人群与彼基站之流入人群不太可能存在重叠；因此可到达性的程度能够直接影响两个基站的连接人数的相关性。而由于可到达性一般只与地理位置、在交通网中的位置有关，比较稳定而且可以认为具有对称性，因此直接建立一个以连边权重表示基站之间的可到达性的有权无向图模型，可以较好地利用上述的可到达性与相关性的关系，描述出如此多基站之间错综复杂的关系。

装置可以基于各个有权无向图训练一个带有注意力机制的时空图卷积神经网络，也即为图模型，从而使得装置可以基于图模型考虑可到达性的因素。装置基于各个第一访问数据即可获取待测基站在各个第一时间段所连接的终端的历史数量，历史数量即为待测基站在第一时间段存在的用户的数量。装置可以将各个第一时间段所对应的历史数量输入至图模型，图模型输出的即为未来的各个第一时间段连接待测基站的数量，盖树亮定义为第二数量。而预测时间段为某个第一时间段，因此，装置可只获取待测基站在预测时间段所连接的终端的历史数量，从而将历史数量输入至图模型，图模型输出的数值即为待测基站在未来的预测时间段所连接的终端的第二数量。

步骤S50，对第一数量以及第二数量进行线性融合得到目标数量。

第一数量以及第二数量均是装置预测待测基站在预测时间段所连接的终端的数量。第一数量是装置基于用户的访问行为信息的预测结果，而第二数量是基于人员分布的时空特性的预测结果，装置对两者预测结果设置权重。装置基于第一数量、第二数量、第一数量对应的权重以及第二数量对应的权重进行加权计算即可得到目标数量，第一数量、第二数量加权计算即为线性融合，也即装置对第一数量以及第二数量进行线性融合得到目标数量。

步骤S60，在目标数量大于预设阈值时，确定待测基站在预测时间段发生人群聚集。

装置中设置有一个连接人数的阈值，该阈值即为预设阈值。目标数量是待测基站在预测时间段连接的终端的数量，一个终端对应一个用户，因此，目标数量即为待测基站在预测时间段内连接的用户的数量。装置判断目标数量是否大于预设阈值。若是目标数量大于预设阈值，即可确定待测基站在预测时间段内发生人群聚集。

在本实施例提供的技术方案中，获取接入待测基站的各个终端的访问数据，并根据各个第一访问数据确定待测基站的基站向量，且根据待测基站的预测时间段确定待测基站的独热向量，从而根据基站向量、独热向量以及预设模型预测待测基站在预测时间段连接的终端的第一数量，再根据各个访问数据获取待测基站在预设时间段所连接的终端的历史数量，并根据历史数量以及图模型预测待测基站在预测时间段连接的终端的第二数量，第一数量与第二数量进行线性融合得到目标数量，若是目标数量大于预设阈值，即可确定待测基站在预测时间段会发生人群聚集。本发明中，先基于访问数据获取待测基站的基站向量，再根据访问数据获取待测基站连接的终端的历史数量，充分的利用了终端的访问数据，提高了人群聚集预测的准确性；进一步的，待测基站的基站向量以及独热向量预测的第一数量结合待测基站连接的终端的历史数量所预测的第二数量，能够更加准确的确定待测基站在预测时间段内是否发生人群聚集，进一步提高了人群聚集预测的准确性。

参照图3，图3为本发明人群聚集预测方法的第二实施例，基于第一实施例，步骤S50包括：

步骤S51，获取第一预设向量以及第二预设向量；

步骤S52，根据各个待测基站对应的第一数量确定第一向量，并确定第一预设向量与第一向量的第一哈达玛积；

步骤S53，根据各个待测基站对应的第二数量确定第二向量，并确定第二预设向量与第二向量的第二哈达玛积；

步骤S54，根据第一哈达玛积以及第二哈达玛积确定第三向量，其中，第三向量的每个维度的数值对应一个待测基站的目标数量。

在本实施例中，待测基站有多个，第一数量与第二数量基于预设公式进行线性融合。预设公式为

其中，W_V是第一预设向量，W_N是第二预设向量，且第一预设向量以及第二预设向量为已知向量，Y_V是各个待测基站的第一数量构成的第一向量，Y_V是各个待测基站的第二数量构成的第二向量，⊙表示哈达玛积，

为各个待测基站的目标数量所构成的第三向量。W_V以及W_N可以训练得到，装置可以基于回归算法训练W_V以及W_N中的参数，使得

的误差达到最小。

在需要确定目标数量时，装置获取第一预设向量以及第二预设向量，在根据各个待测基站对应的第一数量构建第一向量，且计算第一向量与第一预设向量的第一哈达玛积；装置再基于各个待测基站的第二数量构建第二向量，且计算第二向量与第二预设向量之间的第二哈达玛积，从而基于第一哈达玛积与第二哈达玛积之和得到第三向量，第三向量每个维度的数值对应一个待测基站的目标数量。

在本实施例提供的技术方案中，装置获取第一预设向量以及第二预设向量，根据各个待测基站的第一数量确定第一向量，并确定第一预设向量与第一向量的第一哈达玛积，装置再根据各个待测基站的第二数量确定第二向量，从而确定第二预设向量与第二向量的第二哈达玛积，装置最后根据第一哈达玛积以及第二哈达玛积确定第三向量，第三向量的每个维度的数值对应一个待测基站的目标数量。

参照图4，图4为本发明人群聚集预测方法第三实施例，基于第一或第二实施例，步骤S10包括：

步骤S11，获取初始有向图，并从各个第一访问数据获取预设信息，其中，预设信息包括用户、时刻、基站ID以及访问内容。

步骤S12，将预设信息对应的基站节点添加至初始有向图得到目标有向图。

步骤S13，将目标有向图中的基站节点嵌入至维空间中，得到各个待测基站对应的基站向量。

在本实施例中，装置基于访问数据构建有向图，从而基于有向图得到待测基站的基站向量

具体的，装置先初始化一个图H＝(V，E)，其中，节点集合

边集合

也即装置得到一个初始有向图H。装置再遍历每一条第一访问数据，并从第一访问数据中提取预设信息，预设信息包括用户(U)、时刻(T)、基站ID(B)以及访问内容(C)，其中，时刻(T)信息以小时为单位，装置将访问内容(C)分为若干个类别，将访问内容(C)离散为类别进行统计，也即统计每个类别下访问内容的数量。

若表示其U、T、B或C的节点

则在节点集合V中添加对应的节点X，在遍历完所有的第一访问信息后，所有的基站节点均被添加于初始有向图中，也即装置将预设信息所对应的基站节点添加至初始有向图中得到目标有向图。需要说明的是，目标有向图中U、T、B和C对应的基站节点以元路径U-T-B-C连接。目标有向图H即为需要构建的异构信息网络。

装置利用HIN2Vec模型将异构信息网络中的基站节点嵌入到低维度的维空间中，得到各个待测基站的低维表征向量，也即得到各个待测基站对应的基站向量。HIN2Vec模型的神经网络结构基于基站向量进行设置。例如，欲将|B|个基站根据|r|种元路径关系嵌入为d维的向量，则将HIN2Vec模型的神经网络的输入层神经元数目设为(2|B|+|r|)，隐藏层的神经元数目设为d。

在本实施例提供的技术方案中，装置获取初始有向图，并从各个第一访问数据中获取预设信息，再将预设信息对应的基站节点添加至初始有向图中得到目标有向图，最后将目标有向图中的基站节点嵌入至维空间中，得到各个待测基站对应的基站向量。

在一实施例中，步骤S40之前，还包括：

获取各个终端对应的基站轨迹以及初始的第一有权无向图，其中，基站轨迹是终端连接的各个基站以及终端连接的基站的时间点所构成的轨迹；

根据各个基站轨迹更新第一有权无向图得到第二有权无向图；

获取接入待测基站的各个终端的历史的第二访问数据，并确定每个第二访问数据对应的训练数据；

根据训练数据以及第二有权无向图对第一模型进行训练得到图模型。

在本实施例中，装置在预测第二数量之前，需要训练得到图模型。装置先获取各个终端对应的基站轨迹以及初始的第一有权无线图。具体的，装置初始化一个有权无向图G＝(V，E，ε)，其中节点集合V＝{v₁，v₂，...，v_N}为基站节点的集合，E为连边集合用以描述基站间的可到达性，ω：E→R⁺为权重映射函数，初始化任意两个基站之间的权重w_i，j＝0。装置得到每个终端的基站轨迹，终端的基站轨迹即为用户终端所连接的基站的轨迹，基站轨迹记为T＝[l_t1，l_t2，...，l_tk]，l_t1，l_t2，...，l_tk是按照终端所连接的基站的时间点从早到晚进行排序的，也即基站轨迹是终端连接的各个基站以及终端连接的基站的时间点所构成的轨迹。装置按照基站的时序关系从T中分离出相邻的基站节点对T_par＝[[l_t1，l_t2]，[l_t2，l_t3]，...，[l_t(k-1)，l_tk]|。

装置再根据各个基站轨迹更新第一有权无向图得到第二有权无向图。也即将第一有权无向图中基站的权重w_i，j＝0进行更新得到第二有权无向图。具体的，装置在各个基站轨迹中获取两个目标基站对应的连接时间点的间隔时长，例如，获取[l_t1，lt₂]之间的间隔时长。装置中设置有一个最大时间间隔Δt，Δt即为预设时长。若是间隔时长大于Δt，则更新w_i，j＝w_i，j+1，若是间隔时长小于或等于Δt，则不进行权重的更新。可以理解的是，在第一有权无向图中，更新大于预设时长的间隔时长对应的目标基站的初始权重，得到第二有权无向图。当所有的基站节点对遍历完成，则第一有权无向图中的所有权重已经全部获得，也即得到第二有权无向图G，第二有权无向图G即为训练模型所需的数据。

装置再获取既接入待测基站的各个终端历史的第二访问数据，并对各个第二访问数据进行处理，得到图模型所需的第一训练数据。具体的，图模型的预测结果是基于人员分布的时空特性的预测结果。则第一训练数据是通过第二访问数据得到待测基站在各个第一时间段所连接的用户的历史数量。

装置再以第二有权无向图为基础，通过各个第一训练数据即可训练得到图模型，也即基于第一训练数据以及第二有权无向图对第一模型进行训练得到图模型。

在一实施例中，步骤S20之前，还包括：

获取接入待测基站的各个终端的历史的第二访问数据，并根据各个第二访问数据确定第二训练数据。

根据第二训练数据对第二模型进行训练得到预设模型。

在本实施例中，在确定第一数量之前，需要训练得到预设模型。具体的，装置获取接入待测基站的各个终端的历史的第二访问数据，并对各个第二访问数据进行处理得到第二训练数据。第一数量是预设模型是基于访问行为信息进行的预测结果。因此第二训练数据是基于第一访问数据得到独热向量以及基站向量。装置基于各个第二训练数据对第二模型进行训练即可得到预设模型。

本发明还提供一种人群聚集预测设备，参照图5，人群聚集预测设备500包括：

获取模块510，用于获取接入待测基站的各个终端的第一访问数据，并根据各个第一访问数据确定待测基站的基站向量；

确定模块520，用于根据待测基站对应的预测时间段确定待测基站的独热向量；

预测模块530，用于根据基站向量、独热向量以及预设模型，预测待测基站在预测时间段内所连接的终端的第一数量；

获取模块510，用于根据各个第一访问数据获取待测基站在预测时间段所连接的终端的历史数量，并根据历史数量以及图模型预测待测基站在预测时间段所连接的终端的第二数量；

融合模块540，用于对第一数量以及第二数量进行线性融合得到目标数量；

确定模块520，用于在目标数量大于预设阈值时，确定待测基站在预测时间段发生人群聚集。

在一实施例中，人群聚集预测设备500包括：

获取模块510，用于获取第一预设向量以及第二预设向量；

确定模块520，用于根据各个待测基站对应的第一数量确定第一向量，并确定第一预设向量与第一向量的第一哈达玛积；

确定模块520，用于根据各个待测基站对应的第二数量确定第二向量，并确定第二预设向量与第二向量的第二哈达玛积；

确定模块520，用于根据第一哈达玛积以及第二哈达玛积确定第三向量，其中，第三向量的每个维度的数值对应一个待测基站的目标数量。

在一实施例中，人群聚集预测设备500包括：

获取模块510，用于获取初始有向图，并从各个第一访问数据获取预设信息，其中，预设信息包括用户、时刻、基站ID以及访问内容；

添加模块，用于将预设信息对应的基站节点添加至初始有向图得到目标有向图；

添加模块，用于将目标有向图中的基站节点嵌入至维空间中，得到各个待测基站对应的基站向量。

在一实施例中，人群聚集预测设备500包括：

获取模块510，用于获取各个终端对应的基站轨迹以及初始的第一有权无向图，其中，基站轨迹是终端连接的各个基站以及终端连接的基站的时间点所构成的轨迹；

更新模块，用于根据各个基站轨迹更新第一有权无向图得到第二有权无向图；

获取模块510，用于获取接入待测基站的各个终端的历史的第二访问数据，并根据各个第二访问数据确定第一训练数据；

训练模块，用于根据第一训练数据以及第二有权无向图对第一模型进行训练得到图模型。

在一实施例中，人群聚集预测设备500包括：

获取模块510，用于在各个基站轨迹中，获取每相邻的两个目标基站对应的连接时间点之间的间隔时长；

更新模块，用于在第一有权无向图中，更新大于预设时长的间隔时长对应的目标基站的初始权重，得到第二有权无向图。

在一实施例中，人群聚集预测设备500包括：

获取模块510，用于将一天划分为多个第一时间段，并获取待测基站的预测时间段；

设置模块，用于将与预测时间段相同的第一时间段对应的数值设置为第一预设值，并将与预测时间段不同的每个第一时间段对应的数值设置为第二预设值；

构建模块，用于根据第一预设值以及各个第二预设值，构建待测基站在预测时间段对应的独热向量。

在一实施例中，人群聚集预测设备500包括：

获取模块510，用于获取接入待测基站的各个终端的历史的第二访问数据，并根据各个第二访问数据确定第二训练数据；

训练模块，用于根据第二训练数据对第二模型进行训练得到预设模型。

图6是根据一示例性实施例示出的一种人群聚集预测设备的硬件结构图。

人群聚集预测设备600可以包括：处理601，例如CPU，存储器602以及收发器603。本领域技术人员可以理解，图6中示出的结构并不构成对人群聚集预测设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。存储器602可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

处理器601可以调用存储器602内存储的计算机程序，以完成上述的人群聚集预测方法的全部或部分步骤。

收发器603用于接收外部设备发送的信息以及向外部设备发送信息。

一种非临时性计算机可读存储介质，当该存储介质中的指令由人群聚集预测设备的处理器执行时，使得人群聚集预测设备能够执行上述人群聚集预测方法。

一种计算机程序产品，包括计算机程序，当该计算机程序由人群聚集预测设备的处理器执行时，使得人群聚集预测设备能够执行上述人群聚集预测方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求书指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims

1.一种人群聚集预测方法，其特征在于，包括：

2.根据权利要求1所述的人群聚集预测方法，其特征在于，所述待测基站为多个，所述对所述第一数量以及所述第二数量进行线性融合得到目标数量的步骤包括：

获取第一预设向量以及第二预设向量；

3.根据权利要求1所述的人群聚集预测方法，其特征在于，所述根据各个所述第一访问数据确定所述待测基站的基站向量的步骤包括：

4.根据权利要求1所述的人群聚集预测方法，其特征在于，所述根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量的步骤之前，还包括：

5.根据权利要求4所述的人群聚集预测方法，其特征在于，所述根据各个所述基站轨迹更新第一有权无向图得到第二有权无向图的步骤包括：

6.根据权利要求1所述的人群聚集预测方法，其特征在于，所述根据所述待测基站对应的预测时间段确定所述待测基站的独热向量的步骤包括：

7.根据权利要求1所述的人群聚集预测方法，其特征在于，所述根据所述基站向量、所述独热向量以及预设模型，预测所述待测基站在所述预测时间段内所连接的终端的第一数量的步骤之前还包括：

8.一种人群聚集预测装置，其特征在于，包括：

9.一种人群聚集预测设备，其特征在于，包括：存储器以及处理器；

所述存储器存储计算机执行指令；

所述处理器执行所述存储器存储的计算机执行指令，使得所述处理器执行如权利要求1至7任一项所述的人群聚集预测方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的人群聚集预测方法。