CN113993153A - 人群聚集预测方法、装置、设备和计算机可读存储介质 - Google Patents

人群聚集预测方法、装置、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN113993153A
CN113993153A CN202111253202.3A CN202111253202A CN113993153A CN 113993153 A CN113993153 A CN 113993153A CN 202111253202 A CN202111253202 A CN 202111253202A CN 113993153 A CN113993153 A CN 113993153A
Authority
CN
China
Prior art keywords
base station
vector
time period
tested
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111253202.3A
Other languages
English (en)
Other versions
CN113993153B (zh
Inventor
李勇路
林敏�
刘卉芳
江俊昊
叶海宁
廖娟
彭诗雅
邹俊德
闫猛
黄茂松
杨沛
冯烨
林德庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China United Network Communications Group Co Ltd
Original Assignee
China United Network Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China United Network Communications Group Co Ltd filed Critical China United Network Communications Group Co Ltd
Priority to CN202111253202.3A priority Critical patent/CN113993153B/zh
Publication of CN113993153A publication Critical patent/CN113993153A/zh
Application granted granted Critical
Publication of CN113993153B publication Critical patent/CN113993153B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种人群聚集预测方法、装置、设备和计算机可读存储介质,包括:根据接入基站的终端的访问数据确定基站的基站向量;根据基站的预测时间段确定基站的独热向量;根据基站向量、独热向量以及预设模型预测基站在预测时间段内连接的终端的第一数量;根据各个访问数据获取基站在预测时间段所连接的终端的历史数量以及图模型,预测基站在预测时间段连接终端的第二数量;在第一数量以及第二数量线性融合得到的数量大于预设阈值时,基站在预测时间段发生人群聚集。本发明中,充分利用访问数据获取基站的基站向量以及基站连接的终端的历史数量,且第一数量以及第二数量的融合准确的预测基站是否发生人群聚集,提高了人群聚集预测的准确性。

Description

人群聚集预测方法、装置、设备和计算机可读存储介质
技术领域
本发明涉及通信技术领域,尤其涉及一种人群聚集预测方法、装置、设备和计算机可读存储介质。
背景技术
随着信息技术的发展,用户使用智能手机访问互联网的行为变得越来越普遍。常见的手机访问互联网除了通过无线局域网接入互联网之外,还有相当大一部分通过由运营商提供的移动互联网服务完成。而移动通信基站作为移动设备接入互联网的接口,在提供移动互联网服务的同时也保留了用户访问互联网的详细记录。从时间维度上看,用户通过手机使用移动互联网服务的访问行为近年来变得越来越频繁,尤其是一些网络访问密集型的手机软件,如导航软件、社交软件等的普及,由于需要在后台保持网络连接,更加促成了用户移动网络访问行为的密集性。这些记录内容详尽,体量大,而且采集方便,其中还包含着丰富的有关用户空间移动与互联网访问行为模式的信息,可用于进行各种用户行为相关属性的挖掘以及预测,使得基于大规模数据的人类移动行为研究成为可能。
在已有的人类移动行为的研究中,人类移动距离分布被多种形式的函数的拟合,如幂律函数、指数函数、指数截断的幂律函数等。尽管这些不同的函数体现着人类移动行为的多个不同的动力学因素,但其中一致的一点在于移动距离的分布P(d)随着d的增大而减小,即人的活动范围可被认为是有限的。现代城市生活也使得人类的主要活动区域相对集中,如家庭和工作地,这让人的日常活动有一定的区域特征。
当前,通过接入基站的终端的访问数据对基站覆盖区域是否发生人群聚集进行预测,这种预测方式并未充分运用访问数据,人群聚集预测准确性较低。
发明内容
本发明提供一种人群聚集预测方法、装置、设备和计算机可读存储介质,用以解决群聚集预测准确性较低的问题。
一方面,本发明提供一种人群聚集预测方法,包括:
获取接入待测基站的各个终端的第一访问数据,并根据各个所述第一访问数据确定所述待测基站的基站向量;
根据所述待测基站对应的预测时间段确定所述待测基站的独热向量;
根据所述基站向量、所述独热向量以及预设模型,预测所述待测基站在所述预测时间段内所连接的终端的第一数量;
根据各个所述第一访问数据获取所述待测基站在所述预测时间段所连接的终端的历史数量,并根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量;
对所述第一数量以及所述第二数量进行线性融合得到目标数量;
在所述目标数量大于预设阈值时,确定所述待测基站在所述预测时间段发生人群聚集。
可选地,所述待测基站为多个,所述对所述第一数量以及所述第二数量进行线性融合得到目标数量的步骤包括:
获取第一预设向量以及第二预设向量;
根据各个所述待测基站对应的第一数量确定第一向量,并确定所述第一预设向量与所述第一向量的第一哈达玛积;
根据各个所述待测基站对应的第二数量确定第二向量,并确定所述第二预设向量与所述第二向量的第二哈达玛积;
根据所述第一哈达玛积以及所述第二哈达玛积确定第三向量,其中,所述第三向量的每个维度的数值对应一个所述待测基站的目标数量。
可选地,所述根据各个所述第一访问数据确定所述待测基站的基站向量的步骤包括:
获取初始有向图,并从各个第一访问数据获取预设信息,其中,所述预设信息包括用户、时刻、基站ID以及访问内容;
将所述预设信息对应的基站节点添加至所述初始有向图得到目标有向图;
将所述目标有向图中的所述基站节点嵌入至维空间中,得到各个所述待测基站对应的基站向量。
可选地,所述根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量的步骤之前,还包括:
获取各个终端对应的基站轨迹以及初始的第一有权无向图,其中,所述基站轨迹是所述终端连接的各个基站以及所述终端连接的基站的时间点所构成的轨迹;
根据各个所述基站轨迹更新第一有权无向图得到第二有权无向图;
获取接入所述待测基站的各个终端的历史的第二访问数据,并根据各个所述第二访问数据确定第一训练数据;
根据所述第一训练数据以及所述第二有权无向图对第一模型进行训练得到所述图模型。
可选地,所述根据各个所述基站轨迹更新第一有权无向图得到第二有权无向图的步骤包括:
在各个所述基站轨迹中,获取每相邻的两个目标基站对应的连接时间点之间的间隔时长;
在第一有权无向图中,更新大于预设时长的所述间隔时长对应的目标基站的初始权重,得到第二有权无向图。
可选地,所述根据所述待测基站对应的预测时间段确定所述待测基站的独热向量的步骤包括:
将一天划分为多个第一时间段,并获取所述待测基站的预测时间段;
将与所述预测时间段相同的第一时间段对应的数值设置为第一预设值,并将与所述预测时间段不同的每个第一时间段对应的数值设置为第二预设值;
根据所述第一预设值以及各个第二预设值,构建所述待测基站在所述预测时间段对应的独热向量。
可选地,所述根据所述基站向量、所述独热向量以及预设模型,预测所述待测基站在所述预测时间段内所连接的终端的第一数量的步骤之前还包括:
获取接入所述待测基站的各个终端的历史的第二访问数据,并根据各个所述第二访问数据确定第二训练数据;
根据所述第二训练数据对第二模型进行训练得到所述预设模型。
另一方面,本发明还提供一种人群聚集预测装置,包括:
获取模块,用于获取接入待测基站的各个终端的第一访问数据,并根据各个所述第一访问数据确定所述待测基站的基站向量;
确定模块,用于根据所述待测基站对应的预测时间段确定所述待测基站的独热向量;
预测模块,用于根据所述基站向量、所述独热向量以及预设模型,预测所述待测基站在所述预测时间段内所连接的终端的第一数量;
所述获取模块,还用于根据各个所述第一访问数据获取所述待测基站在所述预测时间段所连接的终端的历史数量,并根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量;
融合模块,用于对所述第一数量以及所述第二数量进行线性融合得到目标数量;
所述确定模块,还用于在所述目标数量大于预设阈值时,确定所述待测基站在所述预测时间段发生人群聚集。
另一方面,本发明还提供一种人群聚集预测设备,包括:存储器以及处理器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如上所述的人群聚集预测方法。
另一方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上所述的人群聚集预测方法。
本发明提供的人群聚集预测方法、装置、设备和计算机可读存储介质,获取接入待测基站的各个终端的访问数据,并根据各个第一访问数据确定待测基站的基站向量,且根据待测基站的预测时间段确定待测基站的独热向量,从而根据基站向量、独热向量以及预设模型预测待测基站在预测时间段连接的终端的第一数量,再根据各个访问数据获取待测基站在预设时间段所连接的终端的历史数量,并根据历史数量以及图模型预测待测基站在预测时间段连接的终端的第二数量,第一数量与第二数量进行线性融合得到目标数量,若是目标数量大于预设阈值,即可确定待测基站在预测时间段会发生人群聚集。本发明中,先基于访问数据获取待测基站的基站向量,再根据访问数据获取待测基站连接的终端的历史数量,充分的利用了终端的访问数据,提高了人群聚集预测的准确性;进一步的,待测基站的基站向量以及独热向量预测的第一数量结合待测基站连接的终端的历史数量所预测的第二数量,能够更加准确的确定待测基站在预测时间段内是否发生人群聚集,进一步提高了人群聚集预测的准确性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明实现人群聚集预测方法的系统构架图;
图2为本发明人群聚集预测方法第一实施例的流程示意图;
图3为本发明人群聚集预测方法第二实施例中步骤S50的细化流程示意图;
图4为本发明人群聚集预测方法第三实施例中步骤S10的细化流程示意图;
图5为本发明人群聚集预测装置的模块示意图;
图6为本发明人群聚集预测设备的硬件结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本发明提供一种人群聚集预测方法,可以通过图1所示的系统架构实现。如图1所示,手机100接入基站200,用户300通过基站200提供给手机100的网络进行冲浪,使得基站获取手机100所产生访问数据,基站200再将各个手机200所产生的访问数据发送至终端400。终端400通过访问数据即可预测出基站200在预测时间段连接的手机的数量,该数量表征基站200附近的用户的数量,从而可以基于预测的数量确定基站200附近是否发生人群聚集。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
参照图2,图2为本发明人群聚集预测方法的第一实施例,人群聚集预测方法包括以下步骤:
步骤S10,获取接入待测基站的各个终端的第一访问数据,并根据各个第一访问数据确定待测基站的基站向量。
在本实施例中,执行主体为人群聚集预测装置,人群聚集预测装置可以是任意具有数据处理能力的设备,例如,人群聚集预测装置可以为计算机。为了便于描述,以下采用装置指代人群聚集预测装置。
装置获取各个终端的访问数据,访问数据中包含有持有终端的用户、访问的时间、基站ID以及访问内容。通过基站ID即可确定需要预测的基站,并将需要预测的基站定义为待测基站,且将终端的访问数据定义为第一访问数据。可以理解的是,装置获取的是接入待测基站的各个终端的第一访问数据。
装置在根据各个第一访问数据确定待测基站的基站向量。基站向量可以理解为表征基站特征的向量,也即基于第一访问数据确定待测基站的特征,特征可通过待测基站的各个第一访问数据的访问内容的类型确定。装置将访问内容分为若干个类别,并将每个类别的访问内容进行统计,从而基于类别以及属于类别的访问内容构建基站向量。
步骤S20,根据待测基站对应的预测时间段确定待测基站的独热向量。
一天可以划分为多个时间段,划分的时间段定义为第一时间段。装置确定待测基站的预测时间段,预设时间段可以是任意一个第一时间段。装置可以基于预测时间段确定待测基站的独热向量,独热向量中每个维度对应一个第一时间段,且独热向量中与第一时间段相同的预测时间段的维度所对应的数值,和独热向量中其他维度对应的数值不同,且各个其他维度的数值均相同。例如,可以将各个第一时间段作为一个向量,第一时间段的数量为24,则向量为24维的向量,预测时间段对应的维度的数值与其他维度对应的数值均不同,且其他维度对应的数据均相同。
具体的,装置将一天划分为多个第一时间段,并获取待测基站的预测时间段。装置将与预测时间段相同的第一时间段对应的数值设置为第一预设值,并将预设时间段不同的每个第一时间段对应的数值设置为第二预设值,第一预设值与第二预设值不同。装置再根据第一预设值以及各个第二预设值构建待测基站在预测时间段所对应的独热向量。第一预设值可以为1,而第二预设值可以为0。
步骤S30,根据基站向量、独热向量以及预设模型,预测待测基站在预测时间段内所连接的终端的第一数量。
装置中设置有预设模型,预设模型是利用各个第二访问数据得到的训练数据训练得到的模型。预设模型是一个单层的神经网络。装置将基站向量以及独热向量输入至预设模型,预设模型输出的数值即为装置预测待测基站在预测时间段所连接的终端的数量,将该数量定义为第一数量。第一数量即为待测基站在预测时间段内所聚集的用户的数量
步骤S40,根据各个第一访问数据获取待测基站在预测时间段所连接的终端的历史数量,并根据历史数量以及图模型预测待测基站在预测时间段所连接的终端的第二数量。
在本实施例中,装置还需要考虑相邻或者距离较近的基站之间的用户的迁移,也即需要评估个基站间的可到达性。可到达性可以通过有权无向图进行表征。可到达性解释为:
如果两个基站之间因为某种原因而十分容易到达,比如因为距离近,或比如因为交通便利,则这两个基站的连接人数之间会有明显的相关性,此基站之流出人群与彼基站之流入人群有大量的重叠;相反,如果两个基站之间不容易到达,则它们的连接人数之间就不会有太大的相关性,此基站之流出人群与彼基站之流入人群不太可能存在重叠;因此可到达性的程度能够直接影响两个基站的连接人数的相关性。而由于可到达性一般只与地理位置、在交通网中的位置有关,比较稳定而且可以认为具有对称性,因此直接建立一个以连边权重表示基站之间的可到达性的有权无向图模型,可以较好地利用上述的可到达性与相关性的关系,描述出如此多基站之间错综复杂的关系。
装置可以基于各个有权无向图训练一个带有注意力机制的时空图卷积神经网络,也即为图模型,从而使得装置可以基于图模型考虑可到达性的因素。装置基于各个第一访问数据即可获取待测基站在各个第一时间段所连接的终端的历史数量,历史数量即为待测基站在第一时间段存在的用户的数量。装置可以将各个第一时间段所对应的历史数量输入至图模型,图模型输出的即为未来的各个第一时间段连接待测基站的数量,盖树亮定义为第二数量。而预测时间段为某个第一时间段,因此,装置可只获取待测基站在预测时间段所连接的终端的历史数量,从而将历史数量输入至图模型,图模型输出的数值即为待测基站在未来的预测时间段所连接的终端的第二数量。
步骤S50,对第一数量以及第二数量进行线性融合得到目标数量。
第一数量以及第二数量均是装置预测待测基站在预测时间段所连接的终端的数量。第一数量是装置基于用户的访问行为信息的预测结果,而第二数量是基于人员分布的时空特性的预测结果,装置对两者预测结果设置权重。装置基于第一数量、第二数量、第一数量对应的权重以及第二数量对应的权重进行加权计算即可得到目标数量,第一数量、第二数量加权计算即为线性融合,也即装置对第一数量以及第二数量进行线性融合得到目标数量。
步骤S60,在目标数量大于预设阈值时,确定待测基站在预测时间段发生人群聚集。
装置中设置有一个连接人数的阈值,该阈值即为预设阈值。目标数量是待测基站在预测时间段连接的终端的数量,一个终端对应一个用户,因此,目标数量即为待测基站在预测时间段内连接的用户的数量。装置判断目标数量是否大于预设阈值。若是目标数量大于预设阈值,即可确定待测基站在预测时间段内发生人群聚集。
在本实施例提供的技术方案中,获取接入待测基站的各个终端的访问数据,并根据各个第一访问数据确定待测基站的基站向量,且根据待测基站的预测时间段确定待测基站的独热向量,从而根据基站向量、独热向量以及预设模型预测待测基站在预测时间段连接的终端的第一数量,再根据各个访问数据获取待测基站在预设时间段所连接的终端的历史数量,并根据历史数量以及图模型预测待测基站在预测时间段连接的终端的第二数量,第一数量与第二数量进行线性融合得到目标数量,若是目标数量大于预设阈值,即可确定待测基站在预测时间段会发生人群聚集。本发明中,先基于访问数据获取待测基站的基站向量,再根据访问数据获取待测基站连接的终端的历史数量,充分的利用了终端的访问数据,提高了人群聚集预测的准确性;进一步的,待测基站的基站向量以及独热向量预测的第一数量结合待测基站连接的终端的历史数量所预测的第二数量,能够更加准确的确定待测基站在预测时间段内是否发生人群聚集,进一步提高了人群聚集预测的准确性。
参照图3,图3为本发明人群聚集预测方法的第二实施例,基于第一实施例,步骤S50包括:
步骤S51,获取第一预设向量以及第二预设向量;
步骤S52,根据各个待测基站对应的第一数量确定第一向量,并确定第一预设向量与第一向量的第一哈达玛积;
步骤S53,根据各个待测基站对应的第二数量确定第二向量,并确定第二预设向量与第二向量的第二哈达玛积;
步骤S54,根据第一哈达玛积以及第二哈达玛积确定第三向量,其中,第三向量的每个维度的数值对应一个待测基站的目标数量。
在本实施例中,待测基站有多个,第一数量与第二数量基于预设公式进行线性融合。预设公式为
Figure BDA0003323061860000091
其中,WV是第一预设向量,WN是第二预设向量,且第一预设向量以及第二预设向量为已知向量,YV是各个待测基站的第一数量构成的第一向量,YV是各个待测基站的第二数量构成的第二向量,⊙表示哈达玛积,
Figure BDA0003323061860000092
为各个待测基站的目标数量所构成的第三向量。WV以及WN可以训练得到,装置可以基于回归算法训练WV以及WN中的参数,使得
Figure BDA0003323061860000101
的误差达到最小。
在需要确定目标数量时,装置获取第一预设向量以及第二预设向量,在根据各个待测基站对应的第一数量构建第一向量,且计算第一向量与第一预设向量的第一哈达玛积;装置再基于各个待测基站的第二数量构建第二向量,且计算第二向量与第二预设向量之间的第二哈达玛积,从而基于第一哈达玛积与第二哈达玛积之和得到第三向量,第三向量每个维度的数值对应一个待测基站的目标数量。
在本实施例提供的技术方案中,装置获取第一预设向量以及第二预设向量,根据各个待测基站的第一数量确定第一向量,并确定第一预设向量与第一向量的第一哈达玛积,装置再根据各个待测基站的第二数量确定第二向量,从而确定第二预设向量与第二向量的第二哈达玛积,装置最后根据第一哈达玛积以及第二哈达玛积确定第三向量,第三向量的每个维度的数值对应一个待测基站的目标数量。
参照图4,图4为本发明人群聚集预测方法第三实施例,基于第一或第二实施例,步骤S10包括:
步骤S11,获取初始有向图,并从各个第一访问数据获取预设信息,其中,预设信息包括用户、时刻、基站ID以及访问内容。
步骤S12,将预设信息对应的基站节点添加至初始有向图得到目标有向图。
步骤S13,将目标有向图中的基站节点嵌入至维空间中,得到各个待测基站对应的基站向量。
在本实施例中,装置基于访问数据构建有向图,从而基于有向图得到待测基站的基站向量
具体的,装置先初始化一个图H=(V,E),其中,节点集合
Figure BDA0003323061860000102
边集合
Figure BDA0003323061860000103
也即装置得到一个初始有向图H。装置再遍历每一条第一访问数据,并从第一访问数据中提取预设信息,预设信息包括用户(U)、时刻(T)、基站ID(B)以及访问内容(C),其中,时刻(T)信息以小时为单位,装置将访问内容(C)分为若干个类别,将访问内容(C)离散为类别进行统计,也即统计每个类别下访问内容的数量。
若表示其U、T、B或C的节点
Figure BDA0003323061860000111
则在节点集合V中添加对应的节点X,在遍历完所有的第一访问信息后,所有的基站节点均被添加于初始有向图中,也即装置将预设信息所对应的基站节点添加至初始有向图中得到目标有向图。需要说明的是,目标有向图中U、T、B和C对应的基站节点以元路径U-T-B-C连接。目标有向图H即为需要构建的异构信息网络。
装置利用HIN2Vec模型将异构信息网络中的基站节点嵌入到低维度的维空间中,得到各个待测基站的低维表征向量,也即得到各个待测基站对应的基站向量。HIN2Vec模型的神经网络结构基于基站向量进行设置。例如,欲将|B|个基站根据|r|种元路径关系嵌入为d维的向量,则将HIN2Vec模型的神经网络的输入层神经元数目设为(2|B|+|r|),隐藏层的神经元数目设为d。
在本实施例提供的技术方案中,装置获取初始有向图,并从各个第一访问数据中获取预设信息,再将预设信息对应的基站节点添加至初始有向图中得到目标有向图,最后将目标有向图中的基站节点嵌入至维空间中,得到各个待测基站对应的基站向量。
在一实施例中,步骤S40之前,还包括:
获取各个终端对应的基站轨迹以及初始的第一有权无向图,其中,基站轨迹是终端连接的各个基站以及终端连接的基站的时间点所构成的轨迹;
根据各个基站轨迹更新第一有权无向图得到第二有权无向图;
获取接入待测基站的各个终端的历史的第二访问数据,并确定每个第二访问数据对应的训练数据;
根据训练数据以及第二有权无向图对第一模型进行训练得到图模型。
在本实施例中,装置在预测第二数量之前,需要训练得到图模型。装置先获取各个终端对应的基站轨迹以及初始的第一有权无线图。具体的,装置初始化一个有权无向图G=(V,E,ε),其中节点集合V={v1,v2,...,vN}为基站节点的集合,E为连边集合用以描述基站间的可到达性,ω:E→R+为权重映射函数,初始化任意两个基站之间的权重wi,j=0。装置得到每个终端的基站轨迹,终端的基站轨迹即为用户终端所连接的基站的轨迹,基站轨迹记为T=[lt1,lt2,...,ltk],lt1,lt2,...,ltk是按照终端所连接的基站的时间点从早到晚进行排序的,也即基站轨迹是终端连接的各个基站以及终端连接的基站的时间点所构成的轨迹。装置按照基站的时序关系从T中分离出相邻的基站节点对Tpar=[[lt1,lt2],[lt2,lt3],...,[lt(k-1),ltk]|。
装置再根据各个基站轨迹更新第一有权无向图得到第二有权无向图。也即将第一有权无向图中基站的权重wi,j=0进行更新得到第二有权无向图。具体的,装置在各个基站轨迹中获取两个目标基站对应的连接时间点的间隔时长,例如,获取[lt1,lt2]之间的间隔时长。装置中设置有一个最大时间间隔Δt,Δt即为预设时长。若是间隔时长大于Δt,则更新wi,j=wi,j+1,若是间隔时长小于或等于Δt,则不进行权重的更新。可以理解的是,在第一有权无向图中,更新大于预设时长的间隔时长对应的目标基站的初始权重,得到第二有权无向图。当所有的基站节点对遍历完成,则第一有权无向图中的所有权重已经全部获得,也即得到第二有权无向图G,第二有权无向图G即为训练模型所需的数据。
装置再获取既接入待测基站的各个终端历史的第二访问数据,并对各个第二访问数据进行处理,得到图模型所需的第一训练数据。具体的,图模型的预测结果是基于人员分布的时空特性的预测结果。则第一训练数据是通过第二访问数据得到待测基站在各个第一时间段所连接的用户的历史数量。
装置再以第二有权无向图为基础,通过各个第一训练数据即可训练得到图模型,也即基于第一训练数据以及第二有权无向图对第一模型进行训练得到图模型。
在一实施例中,步骤S20之前,还包括:
获取接入待测基站的各个终端的历史的第二访问数据,并根据各个第二访问数据确定第二训练数据。
根据第二训练数据对第二模型进行训练得到预设模型。
在本实施例中,在确定第一数量之前,需要训练得到预设模型。具体的,装置获取接入待测基站的各个终端的历史的第二访问数据,并对各个第二访问数据进行处理得到第二训练数据。第一数量是预设模型是基于访问行为信息进行的预测结果。因此第二训练数据是基于第一访问数据得到独热向量以及基站向量。装置基于各个第二训练数据对第二模型进行训练即可得到预设模型。
本发明还提供一种人群聚集预测设备,参照图5,人群聚集预测设备500包括:
获取模块510,用于获取接入待测基站的各个终端的第一访问数据,并根据各个第一访问数据确定待测基站的基站向量;
确定模块520,用于根据待测基站对应的预测时间段确定待测基站的独热向量;
预测模块530,用于根据基站向量、独热向量以及预设模型,预测待测基站在预测时间段内所连接的终端的第一数量;
获取模块510,用于根据各个第一访问数据获取待测基站在预测时间段所连接的终端的历史数量,并根据历史数量以及图模型预测待测基站在预测时间段所连接的终端的第二数量;
融合模块540,用于对第一数量以及第二数量进行线性融合得到目标数量;
确定模块520,用于在目标数量大于预设阈值时,确定待测基站在预测时间段发生人群聚集。
在一实施例中,人群聚集预测设备500包括:
获取模块510,用于获取第一预设向量以及第二预设向量;
确定模块520,用于根据各个待测基站对应的第一数量确定第一向量,并确定第一预设向量与第一向量的第一哈达玛积;
确定模块520,用于根据各个待测基站对应的第二数量确定第二向量,并确定第二预设向量与第二向量的第二哈达玛积;
确定模块520,用于根据第一哈达玛积以及第二哈达玛积确定第三向量,其中,第三向量的每个维度的数值对应一个待测基站的目标数量。
在一实施例中,人群聚集预测设备500包括:
获取模块510,用于获取初始有向图,并从各个第一访问数据获取预设信息,其中,预设信息包括用户、时刻、基站ID以及访问内容;
添加模块,用于将预设信息对应的基站节点添加至初始有向图得到目标有向图;
添加模块,用于将目标有向图中的基站节点嵌入至维空间中,得到各个待测基站对应的基站向量。
在一实施例中,人群聚集预测设备500包括:
获取模块510,用于获取各个终端对应的基站轨迹以及初始的第一有权无向图,其中,基站轨迹是终端连接的各个基站以及终端连接的基站的时间点所构成的轨迹;
更新模块,用于根据各个基站轨迹更新第一有权无向图得到第二有权无向图;
获取模块510,用于获取接入待测基站的各个终端的历史的第二访问数据,并根据各个第二访问数据确定第一训练数据;
训练模块,用于根据第一训练数据以及第二有权无向图对第一模型进行训练得到图模型。
在一实施例中,人群聚集预测设备500包括:
获取模块510,用于在各个基站轨迹中,获取每相邻的两个目标基站对应的连接时间点之间的间隔时长;
更新模块,用于在第一有权无向图中,更新大于预设时长的间隔时长对应的目标基站的初始权重,得到第二有权无向图。
在一实施例中,人群聚集预测设备500包括:
获取模块510,用于将一天划分为多个第一时间段,并获取待测基站的预测时间段;
设置模块,用于将与预测时间段相同的第一时间段对应的数值设置为第一预设值,并将与预测时间段不同的每个第一时间段对应的数值设置为第二预设值;
构建模块,用于根据第一预设值以及各个第二预设值,构建待测基站在预测时间段对应的独热向量。
在一实施例中,人群聚集预测设备500包括:
获取模块510,用于获取接入待测基站的各个终端的历史的第二访问数据,并根据各个第二访问数据确定第二训练数据;
训练模块,用于根据第二训练数据对第二模型进行训练得到预设模型。
图6是根据一示例性实施例示出的一种人群聚集预测设备的硬件结构图。
人群聚集预测设备600可以包括:处理601,例如CPU,存储器602以及收发器603。本领域技术人员可以理解,图6中示出的结构并不构成对人群聚集预测设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。存储器602可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
处理器601可以调用存储器602内存储的计算机程序,以完成上述的人群聚集预测方法的全部或部分步骤。
收发器603用于接收外部设备发送的信息以及向外部设备发送信息。
一种非临时性计算机可读存储介质,当该存储介质中的指令由人群聚集预测设备的处理器执行时,使得人群聚集预测设备能够执行上述人群聚集预测方法。
一种计算机程序产品,包括计算机程序,当该计算机程序由人群聚集预测设备的处理器执行时,使得人群聚集预测设备能够执行上述人群聚集预测方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (10)

1.一种人群聚集预测方法,其特征在于,包括:
获取接入待测基站的各个终端的第一访问数据,并根据各个所述第一访问数据确定所述待测基站的基站向量;
根据所述待测基站对应的预测时间段确定所述待测基站的独热向量;
根据所述基站向量、所述独热向量以及预设模型,预测所述待测基站在所述预测时间段内所连接的终端的第一数量;
根据各个所述第一访问数据获取所述待测基站在所述预测时间段所连接的终端的历史数量,并根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量;
对所述第一数量以及所述第二数量进行线性融合得到目标数量;
在所述目标数量大于预设阈值时,确定所述待测基站在所述预测时间段发生人群聚集。
2.根据权利要求1所述的人群聚集预测方法,其特征在于,所述待测基站为多个,所述对所述第一数量以及所述第二数量进行线性融合得到目标数量的步骤包括:
获取第一预设向量以及第二预设向量;
根据各个所述待测基站对应的第一数量确定第一向量,并确定所述第一预设向量与所述第一向量的第一哈达玛积;
根据各个所述待测基站对应的第二数量确定第二向量,并确定所述第二预设向量与所述第二向量的第二哈达玛积;
根据所述第一哈达玛积以及所述第二哈达玛积确定第三向量,其中,所述第三向量的每个维度的数值对应一个所述待测基站的目标数量。
3.根据权利要求1所述的人群聚集预测方法,其特征在于,所述根据各个所述第一访问数据确定所述待测基站的基站向量的步骤包括:
获取初始有向图,并从各个第一访问数据获取预设信息,其中,所述预设信息包括用户、时刻、基站ID以及访问内容;
将所述预设信息对应的基站节点添加至所述初始有向图得到目标有向图;
将所述目标有向图中的所述基站节点嵌入至维空间中,得到各个所述待测基站对应的基站向量。
4.根据权利要求1所述的人群聚集预测方法,其特征在于,所述根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量的步骤之前,还包括:
获取各个终端对应的基站轨迹以及初始的第一有权无向图,其中,所述基站轨迹是所述终端连接的各个基站以及所述终端连接的基站的时间点所构成的轨迹;
根据各个所述基站轨迹更新第一有权无向图得到第二有权无向图;
获取接入所述待测基站的各个终端的历史的第二访问数据,并根据各个所述第二访问数据确定第一训练数据;
根据所述第一训练数据以及所述第二有权无向图对第一模型进行训练得到所述图模型。
5.根据权利要求4所述的人群聚集预测方法,其特征在于,所述根据各个所述基站轨迹更新第一有权无向图得到第二有权无向图的步骤包括:
在各个所述基站轨迹中,获取每相邻的两个目标基站对应的连接时间点之间的间隔时长;
在第一有权无向图中,更新大于预设时长的所述间隔时长对应的目标基站的初始权重,得到第二有权无向图。
6.根据权利要求1所述的人群聚集预测方法,其特征在于,所述根据所述待测基站对应的预测时间段确定所述待测基站的独热向量的步骤包括:
将一天划分为多个第一时间段,并获取所述待测基站的预测时间段;
将与所述预测时间段相同的第一时间段对应的数值设置为第一预设值,并将与所述预测时间段不同的每个第一时间段对应的数值设置为第二预设值;
根据所述第一预设值以及各个第二预设值,构建所述待测基站在所述预测时间段对应的独热向量。
7.根据权利要求1所述的人群聚集预测方法,其特征在于,所述根据所述基站向量、所述独热向量以及预设模型,预测所述待测基站在所述预测时间段内所连接的终端的第一数量的步骤之前还包括:
获取接入所述待测基站的各个终端的历史的第二访问数据,并根据各个所述第二访问数据确定第二训练数据;
根据所述第二训练数据对第二模型进行训练得到所述预设模型。
8.一种人群聚集预测装置,其特征在于,包括:
获取模块,用于获取接入待测基站的各个终端的第一访问数据,并根据各个所述第一访问数据确定所述待测基站的基站向量;
确定模块,用于根据所述待测基站对应的预测时间段确定所述待测基站的独热向量;
预测模块,用于根据所述基站向量、所述独热向量以及预设模型,预测所述待测基站在所述预测时间段内所连接的终端的第一数量;
所述获取模块,还用于根据各个所述第一访问数据获取所述待测基站在所述预测时间段所连接的终端的历史数量,并根据所述历史数量以及图模型预测所述待测基站在所述预测时间段所连接的终端的第二数量;
融合模块,用于对所述第一数量以及所述第二数量进行线性融合得到目标数量;
所述确定模块,还用于在所述目标数量大于预设阈值时,确定所述待测基站在所述预测时间段发生人群聚集。
9.一种人群聚集预测设备,其特征在于,包括:存储器以及处理器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如权利要求1至7任一项所述的人群聚集预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的人群聚集预测方法。
CN202111253202.3A 2021-10-27 2021-10-27 人群聚集预测方法、装置、设备和计算机可读存储介质 Active CN113993153B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111253202.3A CN113993153B (zh) 2021-10-27 2021-10-27 人群聚集预测方法、装置、设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111253202.3A CN113993153B (zh) 2021-10-27 2021-10-27 人群聚集预测方法、装置、设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113993153A true CN113993153A (zh) 2022-01-28
CN113993153B CN113993153B (zh) 2023-07-04

Family

ID=79742232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111253202.3A Active CN113993153B (zh) 2021-10-27 2021-10-27 人群聚集预测方法、装置、设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113993153B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108234198A (zh) * 2017-12-19 2018-06-29 清华大学 一种基站流量预测方法和设备
CN108376292A (zh) * 2017-12-12 2018-08-07 广州汇智通信技术有限公司 一种人群流量预测方法、系统及设备
CN111768031A (zh) * 2020-06-24 2020-10-13 中电科华云信息技术有限公司 一种基于arma算法预测人群聚集趋势的方法
CN112783941A (zh) * 2021-01-07 2021-05-11 合肥工业大学 一种大规模群体聚集事件的实时检测方法
WO2021130926A1 (ja) * 2019-12-25 2021-07-01 日本電信電話株式会社 人流予測装置、人流予測方法、及び人流予測プログラム
CN113497717A (zh) * 2020-03-19 2021-10-12 中国移动通信有限公司研究院 网络流量的预测方法、装置、设备及存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108376292A (zh) * 2017-12-12 2018-08-07 广州汇智通信技术有限公司 一种人群流量预测方法、系统及设备
CN108234198A (zh) * 2017-12-19 2018-06-29 清华大学 一种基站流量预测方法和设备
WO2021130926A1 (ja) * 2019-12-25 2021-07-01 日本電信電話株式会社 人流予測装置、人流予測方法、及び人流予測プログラム
CN113497717A (zh) * 2020-03-19 2021-10-12 中国移动通信有限公司研究院 网络流量的预测方法、装置、设备及存储介质
CN111768031A (zh) * 2020-06-24 2020-10-13 中电科华云信息技术有限公司 一种基于arma算法预测人群聚集趋势的方法
CN112783941A (zh) * 2021-01-07 2021-05-11 合肥工业大学 一种大规模群体聚集事件的实时检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄贺贺,曾园园,张毅等: "基于群体行为分析的人群异常聚集预测方法", 基于群体行为分析的人群异常聚集预测方法 *

Also Published As

Publication number Publication date
CN113993153B (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
Li et al. Deep reinforcement scheduling for mobile crowdsensing in fog computing
Chen et al. Spatio–temporal edge service placement: A bandit learning approach
Gong et al. Task assignment in mobile crowdsensing: Present and future directions
Labriji et al. Mobility aware and dynamic migration of MEC services for the Internet of Vehicles
Xu et al. Incentive mechanism for multiple cooperative tasks with compatible users in mobile crowd sensing via online communities
Qiao et al. A hybrid Markov-based model for human mobility prediction
Qiao et al. A mobility analytical framework for big mobile data in densely populated area
Kim et al. Extracting a mobility model from real user traces
CN106464706B (zh) 用于通过可从电信网络获得的数据识别显著地点的方法和系统
KR20190139130A (ko) 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법
CN108829766B (zh) 一种兴趣点推荐方法、系统、设备及计算机可读存储介质
Doyle et al. Population mobility dynamics estimated from mobile telephony data
WO2014203001A1 (en) Multiple device correlation
CN110166943A (zh) 终端位置信息的处理方法
EP3644580A1 (en) Human mobility measuring method
BR112017020831B1 (pt) Método e sistema para estimar um número de pessoas que se reuniram em uma área de interesse
CN108293193A (zh) 一种用于完成路测数据的高效计算方法
Yousefi et al. Mobile agents for route planning in internet of things using Markov decision process
CN111311193B (zh) 公共服务资源的配置方法和装置
CN110035393A (zh) 移动终端关系的识别方法
CN109618281A (zh) 一种高铁小区的识别方法及装置
Li et al. Multi-expertise aware participant selection in mobile crowd sensing via online learning
CN110992230B (zh) 基于终端信令数据的全量人口统计方法、装置及服务器
Wu et al. From intermittent to ubiquitous: Enhancing mobile access to online social networks with opportunistic optimization
Nadembega et al. A path prediction model to support mobile multimedia streaming

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant