CN116701551A - 异常预测方法、装置、设备及存储介质 - Google Patents

异常预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116701551A
CN116701551A CN202210483604.0A CN202210483604A CN116701551A CN 116701551 A CN116701551 A CN 116701551A CN 202210483604 A CN202210483604 A CN 202210483604A CN 116701551 A CN116701551 A CN 116701551A
Authority
CN
China
Prior art keywords
time
space
grid
region
crowd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210483604.0A
Other languages
English (en)
Inventor
武智晖
刘辉
李晓根
尚晶
江勇
陈卓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Information Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Information Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202210483604.0A priority Critical patent/CN116701551A/zh
Publication of CN116701551A publication Critical patent/CN116701551A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

本发明公开了一种异常预测方法、装置、设备及存储介质。其中,所述方法包括:获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据;第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;第二时空区域是以目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域;利用第一时空区域的第一用户轨迹数据,确定第一时空区域中各个时空网格的第一人群聚集量;并利用第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量;利用第一人群聚集量和第二人群聚集量,对第三时空区域中各个时空网格的人群聚集异常进行预测。

Description

异常预测方法、装置、设备及存储介质
技术领域
本发明涉及通信网络技术领域,尤其涉及一种异常预测方法、装置、设备及存储介质。
背景技术
目前,突发事件带来的人群异常聚集,通常会带来安全风险、资源拥塞等问题。通常,可以根据各个区域自身的历史人流量数据进行预测,或者,结合人流量时间分布特征和时序相关性来进行预测,或者,根据已有的人流量数据,通过提取序列的时序模式特征,对未来时刻的人流量进行预测,等等。但是,对于人群异常聚集的感知主要依赖于较为被动的实时检测,不能很好地形成预警机制,也没有考虑到人群活动的时空特性对不同区域、时间的异常聚集判断的影响,导致人群聚集异常预测结果的不全面、不精准。
发明内容
有鉴于此,本发明实施例期望提供一种异常预测方法、装置、设备及存储介质。
本发明实施例的技术方案是这样实现的:
本发明的至少一个实施例提供了一种异常预测方法,应用于终端,所述方法包括:
获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据;所述第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第二时空区域是以所述目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第一用户轨迹数据为在所述历史时间范围内在所述目标区域获取的用户轨迹点数据;所述第二用户轨迹数据为在所述当前时间范围内在所述目标区域获取的用户轨迹点数据;
利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量;并利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量;所述第三时空区域是以所述目标区域为空间轴、预测时间范围为时间轴,构建的包含M个时空网格的时空区域;
利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测;
其中,M为大于1的正整数。
此外,根据本发明的至少一个实施例,所述利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量,包括:
从所述当前时间范围内确定K个时间点;
从所述第二时空区域中确定与K个时间点分别对应的时空网格;
利用所述第二时空区域的第二用户轨迹数据,确定与K个时间点分别对应的时空网格的第三用户轨迹数据;
利用与K个时间点分别对应的时空网格的第三用户轨迹数据,确定转移到所述第三时空区域中各个时空网格的第二人群聚集量。
此外,根据本发明的至少一个实施例,所述利用与K个时间点分别对应的时空网格的第三用户轨迹数据,确定转移到所述第三时空区域中各个时空网格的第二人群聚集量,包括:
针对与第i个时间点对应的每个时空网格,确定相应时空网格向所述第三时空区域中各个时空网格转移的1到K步转移概率矩阵;
利用与所述相应时空网格对应的1到K步转移概率矩阵,确定所述相应时空网格的第三用户轨迹数据转移到所述第三时空区域中的目标时空网格;
以此类推,直至确定与K个时间点分别对应的时间网格的第三用户轨迹数据转移到所述第三时空区域中的目标时空网格;统计转移到所述第三时空区域中目标时空网格的用户总数目,得到目标时空网格的第二人群聚集量;
其中,i=1,,,,,K;K为大于1的正整数。
此外,根据本发明的至少一个实施例,所述利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测,包括:
将所述第一时空区域中各个第一时空网格与所述第三时空区域中各个第二时空网格建立对应关系;
将所述第三时空区域中每个第二时空网格的第二人群聚集量和各自对应的第一时空网格的第一人群聚集量求差,得到与每个第二时空网格对应的差值;
将每个第二时空网格对应的差值和与各自对应的第一时空网格的异常阈值进行比较,得到比较结果;
基于所述比较结果,对所述第三时空区域中每个第二时空网格的人群聚集异常进行预测。
此外,根据本发明的至少一个实施例,所述方法还包括:
利用所述第一时空区域中的第一用户轨迹数据,将所述第一时空区域划分为包含至少一个人群聚集异常事件的第一时空网格和未包含人群聚集异常事件的第一时空网格;
利用包含至少一个人群聚集异常事件的第一时空网格的第一用户轨迹数据,确定各个人群聚集异常事件的人群异常聚集量,得到至少一个人群异常聚集量;
利用所述至少一个人群异常聚集量和第一人群聚集量,确定包含至少一个人群聚集异常事件的第一时空网格的异常阈值;
利用各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集量和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值。
此外,根据本发明的至少一个实施例,所述利用所述至少一个人群异常聚集量和第一人群聚集量,确定包含至少一个人群聚集异常事件的第一时空网格的异常阈值,包括:
将所述至少一个人群异常聚集量和第一人群聚集量求差,得到至少一个差值;
将所述至少一个差值作为观测量;并对所述观测量进行估计,得到估计值;
将所述估计值作为包含至少一个人群聚集异常事件的第一时空网格的异常阈值。
此外,根据本发明的至少一个实施例,所述利用各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集量和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值,包括:
将至少一个人群异常聚集量求和,得到包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集总量;
将各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集总量分别和各自的第一人群聚集量求商,得到多个比值;
对所述多个比值求平均,得到平均值;
利用所述平均值和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值。
本发明的至少一个实施例提供一种异常预测装置,包括:
获取单元,用于获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据;所述第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第二时空区域是以所述目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第一用户轨迹数据为在所述历史时间范围内在所述目标区域获取的用户轨迹点数据;所述第二用户轨迹数据为在所述当前时间范围内在所述目标区域获取的用户轨迹点数据;
第一处理单元,用于利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量;并利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量;所述第三时空区域是以所述目标区域为空间轴、预测时间范围为时间轴,构建的包含M个时空网格的时空区域;
第二处理单元,用于利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测;
其中,M为大于1的正整数。
本发明的至少一个实施例提供一种终端,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行上述终端侧任一方法的步骤。
本发明的至少一个实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法的步骤。
本发明实施例提供的异常预测方法、装置、设备及存储介质,获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据;所述第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第二时空区域是以所述目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第一用户轨迹数据为在所述历史时间范围内在所述目标区域获取的用户轨迹点数据;所述第二用户轨迹数据为在所述当前时间范围内在所述目标区域获取的用户轨迹点数据;利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量;并利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量;所述第三时空区域是以所述目标区域为空间轴、预测时间范围为时间轴,构建的包含M个时空网格的时空区域;利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测;其中,M为大于1的正整数。采用本发明实施例提供的技术方案,考虑到人群活动的时空特性对不同区域、时间的异常聚集判断的影响,人群聚集异常预测结果的全面、精准。
附图说明
图1是本发明实施例异常预测方法的实现流程示意图;
图2是本发明实施例用户的历史轨迹中的轨迹点的示意图;
图3是本发明实施例目标区域的示意图;
图4是本发明实施例异常预测装置的组成结构示意图;
图5是本发明实施例终端的组成结构示意图。
具体实施方式
在对本发明实施例的技术方案进行介绍之前,先对相关技术进行说明。
相关技术中,突发事件带来的人群异常聚集,通常会带来安全风险、资源拥塞等问题。目前,对于人群异常聚集的感知主要依赖于较为被动的实时检测,不能很好地形成预警机制。海量的移动信令数据包含着用户的实时地理位置信息,很好地反映了城市人群活动的状态和规律。通过对信令数据的分析,可以实现对城市区域内的大规模人群聚集状态进行提前感知及预测,为城市交通相关部门制定人群流量控制决策和通信服务部门针对性加强应急通信保障提供支撑。
相关技术中,人群聚集预测的技术方案包括以下几种:
申请号为201711107770.6、发明名称为一种时空大数据下基于移动马尔可夫模型的预测方法公开了一种时空大数据环境下采用联合聚类算法和马尔科夫模型进行位置预测方法。该技术基于联合密度估计算法,对历史轨迹数据进行聚类,将用户的轨迹变化归类于若干个静态聚类簇代表的兴趣点,以兴趣点间转移的概率建立一阶马尔可夫预测模型,实现对用户位置和行为的预测。
申请号为201911081285.5、发明名称为基于城市空间结构的人群聚集度预测模型构建方法及装置公开了一种基于特征融合的人群聚集预测方法。该方法综合考虑了城市的空间结构信息、交通流量信息和商业信息对区域人群聚集度的影响,建立线性回归模型,形成对人群密集度的准确预测。
申请号为201910631245.7、发明名称为一种城市轨道交通站台聚集人数短期预测的方法提供了基于历史数据的列车发车时刻滚动预测算法。该算法对历史发车时刻数据建立最小二乘模型,计算估计值和偏差,用于当前时刻的预测任务;当前车流发车后,再根据真实时间和估计时间的偏差更新模型,以提高预测任务的精准性和时效性。
申请号为202010588491.1、发明名称为一种基于ARMA算法预测人群聚集趋势的方法提供了一种基于自回归滑动平均模型的人群聚集趋势估计方法。该技术利用人群数量时间序列数据对未来人群数量进行预测,通过数值迭代的方式提高预测的准确性。
申请号为202011443105.6、发明名称为一种基于模型集成的景区人群聚集预测方法公开了一种基于电信运营商基站数据、集成多种统计模型的景区人群聚集预测方法。方法囊括的模型有:泊松回归、梯度提升树、时间递归神经网络等,涉及深度学习等人工智能技术领域。
申请号为202110167010.4、发明名称为一种基于人员活动轨迹预测人员聚集风险的方法提出了一种基于信息抽取的轨迹预测和聚集风险预警方法。该方法通过对人员轨迹数据进行信息抽取,根据计算人员的流动方向变化趋势对未来聚集点进行预测。
申请号为202110142862.8、发明名称为一种基于深度神经网络的城市区域聚集度预测方法、设备及介质公开了一种基于城市私家车数据的城市区域聚集度预测模型。该模型采用深度学习方法对目标预测时段的聚集度进行滚动预测,具有可迁移性、表达力强的特点。
申请号为201610769009.8、发明名称为一种基于时间序列模型的人群聚集预测方法提出了一种融合多种时间序列模型的人群聚集预测方法,属于安防技术领域。该方法根据已有的人流量数据,通过提取序列的时序模式特征,对未来时刻的人流量进行预测。
申请号为202010383161.9、发明名称为一种目标对象聚集预测方法、装置以及电子设备公开了一种针对通信数据异常聚集现象的识别方法。该方法能对电子设备间通信时产生的的异常聚集行为进行识别,隶属于信息安全领域。
申请号为201811490106.9、发明名称为一种群体聚集场景的预测方法、装置、设备及存储介质公开了一种公共出行场景下,判断订单是否来自聚集场景用户的预测方法。该方法利用对用户关系网络等服务描述信息,通过梯度提升树等算法建立非线性模型进行优化,以提高预测准确率。
申请号为201910159609.6、发明名称为一种特殊群体聚集行为早期检测及聚集地预测方法和系统提出了一种针对特殊群体聚集行为的检测和预测算法。该算法根据成员信息和空间移动信息,对目标群体进行实时聚类,输入非线性规划模型,并转化为线性规划模型进行求解。最终,算法输出异常聚集事件的位置和参与者。
但是,第一,针对一种时空大数据环境下采用联合聚类算法和马尔科夫模型进行位置预测方法,该方法只能预测用户的下一个位置,并没有挖掘用户历史数据以设置异常聚集标准,来预测可能发生异常人群聚集的时间和区域,没有挖掘历史数据,设置异常聚集标准,不能用于异常人群聚集的时间和位置预测。第二,针对一种基于特征融合的人群聚集预测方法,该方法是基于城市空间结构的人群聚集度预测,没有挖掘用户历史数据以设置异常聚集标准,来预测可能发生异常聚集的时间和区域。并且该方法使用多种环境变量作为输入,不能用于较好地反应整个研究区域的所有用户位置转移情况,具有一定的局限性。第三,针对基于历史数据的列车发车时刻滚动预测算法,该方法局限于对交通站台的聚集人数进行短期预测。第四,针对一种基于自回归滑动平均模型的人群聚集趋势估计方法,该方法只能根据各个区域自身的历史人流量数据进行预测,不能考虑其他区域的用户转移情况对目标区域人流量的影响。第五,针对一种基于电信运营商基站数据、集成多种统计模型的景区人群聚集预测方法,该方法在输入特征中只考虑了人流量时间分布特征和时序相关性分析,不能考虑其他区域的用户转移情况对目标区域人流量的影响。第六,针对一种基于信息抽取的轨迹预测和聚集风险预警方法。该方法没有对出行方式进行区分,在预测人流量时会受到噪声数据影响预测精度。并且该方法从人员流动方向数据中筛选出某个时间段人员流动方向相同的人员来确定是否会发生聚集,没有考虑到多种移动方向相同的人员轨迹,由于速度和目的地不同,很可能不会在同一时间、区域发生聚集。没有考虑,移动的速度,目的。第七,针对一种基于城市私家车数据的城市区域聚集度预测模型,该方法没有区分用户出现方式,是根据城市私家车的停留数据建模的,不能直接用于人群异常聚集任务中。第八,针对一种融合多种时间序列模型的人群聚集预测方法,属于安防技术领域。该方法根据已有的人流量数据,通过提取序列的时序模式特征,对未来时刻的人流量进行预测。该方法只能根据各个区域自身的历史人流量数据进行预测,无法考虑其他区域的用户转移情况对目标区域人流量的影响。第九,一种对电子设备间通信时产生的异常聚集行为进行预测的方法,该方法只适用于多个指定目标对象的聚集预测,不能用于解决整个研究区域中人群异常聚集预测问题。第十,一种公共出行场景下判断订单是否来自聚集场景用户的预测方法。该方法利用对用户关系网络等服务描述信息,通过梯度提升树等算法建立非线性模型进行优化,该方法只能对产生服务订单的区域进行预测,不能解决没有发生服务订单的其他区域的人群聚集预测问题。第十一,一种针对特殊群体聚集行为的检测和预测算法,该方法无法预测未来聚集时间发生的时间,没有考虑到群体中个体的移动模式的不同,不能直接应用于人群聚集异常预测中;在检测聚集行为时,也不能考虑不同地理区域和时间区间的异常发现标准的差异。
综上,相关技术中,缺乏对群体中个体的时空移动模式的识别,没有考虑到人群活动的时空特性对不同区域、时间的异常聚集判断标准的影响,也未能利用用户移动轨迹的长期趋势对未来路径的影响,导致人群聚集异常预测结果的不全面、不精准。
基于此,本发明实施例中,获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据;所述第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第二时空区域是以所述目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第一用户轨迹数据为在所述历史时间范围内在所述目标区域获取的用户轨迹点数据;所述第二用户轨迹数据为在所述当前时间范围内在所述目标区域获取的用户轨迹点数据;利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量;并利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量;所述第三时空区域是以所述目标区域为空间轴、预测时间范围为时间轴,构建的包含M个时空网格的时空区域;利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测;其中,M为大于1的正整数。
图1是本发明实施例异常预测方法的实现流程示意图,应用于终端,如图1所示,所述方法包括步骤101至步骤103:
步骤101:获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据。
这里,所述第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第二时空区域是以所述目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域。
这里,所述第一用户轨迹数据为在所述历史时间范围内在所述目标区域获取的用户轨迹点数据;所述第二用户轨迹数据为在所述当前时间范围内在所述目标区域获取的用户轨迹点数据。
可以理解的是,可以在时间维度上,将所述历史时间范围划分为N个时间单元,在空间维度上,将所述目标区域划分为M个区域,如此,可以由时间维度的N个时间单元和空间维度的M个区域共同确定M个时空网格,这M个时空网格构成所述第一时空区域。所述时间单元可以为时刻、分钟等等。N个时间单元的长度可以相同,也可以不同。同样地,可以在时间维度上,将所述当前时间范围划分为N个时间单元,在空间维度上,将所述目标区域划分为M个区域,如此,可以由时间维度的N个时间单元和空间维度的M个区域共同确定M个时空网格,这M个时空网格构成所述第二时空区域。所述时间单元可以为天、时刻、分钟等等。N个时间单元的长度可以相同,也可以不同。N为大于1的正整数。
需要说明的是,所述第一时空区域和所述第二时空区域划分时空网格的方式相同,即,两个时空区域包含的多个时空网格的大小、数量均相同。两个时空区域的时空网格的编号可以是相同的。例如,第一时空区域中的时空网格1与第二时空区域中的时空网格1是对应的。
实际应用时,考虑到运营商设备可以从网络设备如基站获取第一信令数据并发送给终端,且所述第一信令数据中携带有各个用户在历史时间范围内在目标区域中的实时地理位置信息,如此,所述终端可以从运营商设备获取所述第一信令数据,首先,根据所述第一信令数据,生成各个用户的历史轨迹。然后,从各个用户的历史轨迹中筛选出至少一个属于特定移动模式的历史轨迹。最后,将至少一个属于特定移动模式的历史轨迹划分为多个轨迹点,将所述多个轨迹点存储至所述第一时空区域中对应的时空网格中。
基于此,在一实施例中,获取第一时空区域的第一用户轨迹数据,包括:
获取第一信令数据;所述第一信令数据表征各个用户在历史时间范围内在目标区域中的地理位置;
利用所述第一信令数据,生成各个用户的历史轨迹;从所述各个用户的历史轨迹中确定属于特定移动模式的历史轨迹,得到至少一个属于特定移动模式的历史轨迹;
对至少一个属于特定移动模式的历史轨迹分别进行重采样,得到多个轨迹点;
将所述多个轨迹点作为第一用户轨迹数据,存储至所述第一时空区域中对应的时空网格中。
可以理解的是,所述第一信令数据可以携带有以下参数:用户标识(ID)、业务流程开始时间、业务流程终止时间、经度、纬度、流程类型、卡类型。其中,所述经度和所述维度共同对应相应用户在所述目标区域中的实时地理位置。所述业务流程开始时间可以用于标记实时地理位置对应的轨迹点的时间戳。
实际应用时,由于网络设备如基站分布不均、地形差异明显等因素,导致运营商设备从网络设备如基站获取的第一信令数据中可能会存在一些异常值,因此,终端从运营商设备获取所述第一信令数据后,需要对所述第一信令数据中可能存在的异常数据进行预处理。
基于此,在一实施例中,利用所述第一信令数据,生成各个用户的历史轨迹,包括:
对所述第一信令数据进行预处理,得到预处理后的第一信令数据;
利用预处理后的第一信令数据,生成各个用户的历史轨迹。
可以理解的是,生成各个用户的历史轨迹后,还可以使用窗口均值滤波器,对各个用户的历史轨迹进行平滑操作。
其中,所述平滑操作,可以是指将历史轨迹中连续五个轨迹点的平均位置作为当前轨迹点的位置,以得到平滑处理后的各个用户的历史轨迹。五个轨迹点可以是指当前轨迹点、当前轨迹点的前两个轨迹点和当前估计点的后两个轨迹点。
这里,对所述第一信令数据进行预处理,包括:按照预设规则,删除所述第一信令数据中存在的无用数据。
这里,所述预设规则,具体包括以下至少之一:
(1)删除所述第一信令数据中经纬度在划定范围外的数据。
(2)删除所述第一信令数据中业务流程时间间隔大于或等于时间间隔阈值的数据。其中,所述业务流程时间间隔是指业务流程开始时间到业务流程终止时间之间的时间间隔。所述时间间隔阈值可以为3秒。
(3)删除所述第一信令数据中位置发生连续重复的数据。其中,位置连续重复可以是指2个及以上的位置发生重复。
(4)仅保留特定流程类型的数据。特定流程类型可以是指进行基站切换的流程。
(5)删除所述第一信令数据中用户记录总数异常的用户。其中,用户记录总数异常可以是指在预设时长内记录的用户总数小于预设阈值。比如,在24小时内记录的用户总数小于5条。
这里,对所述第一信令数据进行预处理之后,可以针对每个用户,利用与该用户ID对应的经度和维度,生成与该用户ID对应的多个轨迹点;再按照业务流程开始时间和业务流程结束时间,将与该用户ID对应的多个轨迹点进行串联,形成该用户的历史轨迹。
需要说明的是,按照预设规则删除所述第一信令数据中存在的无用数据之后,还可以删除所述第一信令数据中由于位置偏移导致速度计算异常的轨迹点。
具体地,对于每个用户ID,计算连续五个轨迹点(即当前轨迹点、当前轨迹点的前两个轨迹点和当前轨迹点的后两个轨迹点)的平均速度,将计算的平均速度作为当前轨迹点的速度。如果当前轨迹点的速度超过速度阈值,则删除该轨迹点。
这里,按照下面公式(1),计算当前轨迹点的速度,具体如下:
其中,vn表示当前轨迹点的速度;d(Pi,Pi+1)表示轨迹点Pi和轨迹点Pi+1之间的直线距离。tn+2-tn-2表示第五个轨迹点对应的时间点与第一个轨迹点对应的时间点之间的差值。
需要说明的是,按照预设规则删除所述第一信令数据中存在的无用数据之后,还可以删除所述第一信令数据中存在的乒乓点。
举例来说,图2是用户的历史轨迹中的轨迹点的示意图,如图2所示,假设用户的历史轨迹中包含连续的四个轨迹点,用A、B、C、D表示,计算这四个轨迹点中轨迹点A和轨迹点B之间形成的角度1,轨迹点B和轨迹点C之间形成的角度2,轨迹点C和轨迹点D之间形成的角度3,如果满足连续两个角度小于角度阈值如45°,则认为连续两个角度中第一个角度的中心点为异常点,将该轨迹点从所述第一信令数据中剔除。比如,角度1小于角度阈值且角度2小于角度阈值,则将角度1的中心点即轨迹点B删除。
实际应用时,得到各个用户的历史轨迹之后,还可以从各个用户的历史轨迹中筛选属于特定移动模式的历史轨迹。
基于此,在一实施例中,利用所述各个用户的历史轨迹,确定至少一个属于特定移动模式的历史轨迹,可以包括:
识别各个用户的历史轨迹中的驻留点;
利用所述各个用户的历史轨迹中的驻留点,判断各个用户的历史轨迹是否为属于特定移动模式的历史轨迹。
具体地,识别各个用户的历史轨迹中的驻留点,可以包括:
针对每个用户的历史轨迹,从第三个轨迹点开始,按照下面公式(2)和公式(3),分别计算每个轨迹点P3<t3,p3>与前两个轨迹点P1<t1,p1>、P2<t2,p2>之间的时间差,并按照下面公式(4),计算每个轨迹点P3<t3,p3>和后一个轨迹点P4<t4,p4>之间的时间差,具体如下:
Δt13=t3-t1 (2)
Δt23=t3-t2 (3)
Δt34=t4-t3 (4)
如果满足以下条件之一,则认为轨迹点为驻留点:
(1)当前轨迹点与前两个轨迹点之间的时间差Δt13和Δt23均小于第一时间阈值,且当前轨迹点与后一个轨迹点的时间差Δt34超过第二时间阈值。所述第一时间阈值小于所述第二时间阈值,例如,所述第一时间阈值为5分钟,所述第二时间阈值为30分钟。
(2)当前轨迹点与后一个轨迹点之间的距离超过距离阈值。所述距离阈值可以为5Km。
具体地,利用所述各个用户的历史轨迹中的驻留点,判断各个用户的历史轨迹是否为属于特定移动模式的历史轨迹,可以包括:
针对每个用户的历史轨迹中的驻留点,将相应历史轨迹划分为多个轨迹段;
确定与各个历史轨迹分别对应的各个轨迹段的出行特征;
利用与各个用户的历史轨迹分别对应的各个轨迹段的出行特征,判断各个用户的历史轨迹是否属于特定移动模式的历史轨迹。
这里,所述出行特征包括出行距离、平均速度、最高速度、轨迹段中速度超过速度阈值的轨迹点个数。其中,
出行距离,可以是指轨迹段的起始轨迹点和结束轨迹点之间的距离。
平均速度,可以是将轨迹段中每个轨迹点的速度求和,得到求和结果,再对求和结果求平均值得到的。按照下面公式(5),计算每个轨迹点的速度,具体如下:
其中,vi表示轨迹点Pi的速度;d(Pi,Pi+1)表示轨迹点Pi和轨迹点Pi+1之间的直线距离;△ti,i+1表示轨迹点Pi+1对应的时间点与轨迹点Pi对应的时间点之间的差值。
最高速度,可以是指从轨迹段中各个轨迹点的速度中选取的最大速度。
轨迹段中速度超过速度阈值的轨迹点个数,可以是轨迹段的各个轨迹点中速度大于或等于速度阈值的轨迹点的个数。
如果相应用户的历史轨迹的各个轨迹段中有至少一个轨迹段满足以下全部条件,则判定相应用户的历史轨迹属于特定移动模式的历史轨迹:
(1)平均速度小于第一速度阈值或最高速度小于第二速度阈值;其中,所述第一速度阈值可以为15km/h,所述第二速度阈值可以为30km/h。
(2)出行距离不超过距离阈值;其中,距离阈值可以为25km。
(3)轨迹段中速度超过速度阈值的轨迹点个数小于该轨迹段包含的轨迹点总数的三分之一。其中,速度阈值可以为25km/h。
其中,所述特定移动模式,也可以称为人员出行移动模式。
实际应用时,对至少一个属于特定移动模式的历史轨迹分别进行重采样,得到多个轨迹点,并将所述多个轨迹点作为第一用户轨迹数据,划分至所述第一时空区域中对应的时空网格中。
基于此,在一实施例中,对至少一个属于特定移动模式的历史轨迹分别进行重采样,得到多个轨迹点;将所述多个轨迹点作为第一用户轨迹数据,划分至所述第一时空区域中对应的时空网格中,包括:
按照固定的采样时间间隔长度,对至少一个属于特定移动模式的历史轨迹分别进行重采样,得到多个轨迹点;所述轨迹点携带有:历史轨迹ID、用户ID、经度、纬度、重采样的时间戳;
根据各个轨迹点携带的历史轨迹ID、用户ID、经度、纬度、重采样的时间戳,将所述各个轨迹点划分至第一时空区域中对应的时空网格中。
可以理解的是,所述固定的采样时间间隔长度,用Ttr表示。
可以理解的是,所述第一时空区域的M个时空网格,是以目标区域为空间轴,以历史时间范围为时间轴构建的,如此,可以利用各个轨迹点携带的经度、维度,确定所述各个轨迹点在所述第一时空区域中的空间坐标;利用所述各个轨迹点携带的重采样的时间戳,确定所述各个轨迹点在所述第一时空区域中的时间坐标。如此,可以将每个用户的历史轨迹对应的多个轨迹点,划分至所述第一时空区域中对应的时空网格中。
图3是目标区域的示意图,如图3所示,在空间维度上,将目标区域的地理空间划分为M个空间网格。网格的形状可以是任意封闭形状,如,等大小的正方形。在时间维度上,可以根据特定时间段用户活动的特点,将历史时间范围如一周划分为N个时间单元。
表1是将历史时间范围划分为N个时间单元的示意,如表1所示,针对历史时间范围为某个工作日的0点到24点和历史时间范围为某个周六日的0点到24点,两者各自划分的时间单元可以不同,目的是为了让各个时间单元内的人群移动特性尽可能稳定。
表1
实际应用时,考虑到运营商设备可以从网络设备如基站获取第二信令数据并发送给终端,且所述第二信令数据中携带有各个用户在当前时间范围内在目标区域中的实时地理位置信息,如此,所述终端可以从运营商设备获取所述第一信令数据,首先,根据所述第二信令数据,生成各个用户的当前轨迹。然后,从各个用户的当前轨迹中筛选出至少一个属于特定移动模式的当前轨迹。最后,将至少一个属于特定移动模式的当前轨迹划分为多个轨迹点,将所述多个轨迹点存储至所述第二时空区域中对应的时空网格中。
基于此,在一实施例中,获取第二时空区域的第二用户轨迹数据,包括:
获取第二信令数据;所述第二信令数据表征各个用户在当前时间范围内在目标区域中的地理位置;
利用所述第二信令数据,生成各个用户的当前轨迹;从所述各个用户的当前轨迹中确定属于特定移动模式的当前轨迹,得到至少一个属于特定移动模式的当前轨迹;
对至少一个属于特定移动模式的当前轨迹分别进行重采样,得到多个轨迹点;
将所述多个轨迹点作为第二用户轨迹数据,存储至所述第二时空区域中对应的时空网格中。
可以理解的是,可以用(tp-Ttr,tp)表示拉取的所述第二信令数据的时间范围;tp表示从所述第二信令数据中拉取数据的时刻,Ttr表示对属于特定移动模式的当前轨迹进行重采样的采样时间间隔长度。
需要说明的是,获取第二时空区域的第二用户轨迹数据的过程与获取第一时空区域的第一用户轨迹数据的过程类似,在此不再赘述。
步骤102:利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量;并利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量。
这里,所述第三时空区域是以所述目标区域为空间轴、预测时间范围为时间轴,构建的包含M个时空网格的时空区域。
可以理解的是,可以在时间维度上,将所述预测时间范围划分为N个时间单元,在空间维度上,将所述目标区域划分为M个区域,如此,可以由时间维度的N个时间单元和空间维度的M个区域共同确定M个时空网格,这M个时空网格构成所述第三时空区域。所述时间单元可以为天、时刻、分钟等等。
需要说明的是,所述第一时空区域、所述第二时空区域和所述第三时空区域划分时空网格的方式相同,即,三个时空区域包含的多个时空网格的大小、数量均相同。三个时空区域中的时空网格的编号可以是相同的。例如,第一时空区域中的时空网格1、第二时空区域中的时空网格1、第三时空区域中的时空网格1是一一对应的。
实际应用时,可以利用所述第一时空区域的第一用户轨迹数据,统计各个时空网格的第一人群聚集量。
基于此,在一实施例中,利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量,包括:
利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域的各个时空网格中的轨迹点;所述轨迹点携带有用户ID;
利用所述第一时空区域的各个时空网格中的轨迹点,确定各个时空网格的第一人群聚集量。
可以理解的是,针对所述第一时空区域中每个时空网格,可以根据相应时空网格中在特定时间段内采集的所有轨迹点的总数目、相应时空网格对应的时间单元的长度、相应时间网格中的轨迹点的采集的特定时间段,以及对属于特定移动模式的历史轨迹进行重采样的采样时间间隔长度,确定该时空网格的第一人群聚集量。
举例来说,假设所述第一时空区域的各个时空网格用(s,t)表示,空间序号s∈{1,2,...M},时间序号时空网格(s,t)中的所有轨迹点,用集合ζs,t表示。集合ζs,t内的所有轨迹点的总数目,用Vs,t表示。按照下面公式(6),计算时空网格(s,t)的历史人群聚集度平均值Es,t,即,第一人群聚集量,具体如下:
其中,Es,t表示时空网格(s,t)的历史人群聚集度平均值,即第一人群聚集量,可以表征在一个采样时间点的平均轨迹点数目,即,在一个采样时间点的平均用户数目。Vs,t表示时空网格(s,t)存储的在n天内采集的所有轨迹点的总数目。n表示时空网格(s,t)中的轨迹点的采集天数。Tt为时空网格(s,t)对应的时间单元的长度,比如,8点到9点,共1个小时。Ttr表示对属于特定移动模式的历史轨迹进行重采样的采样时间间隔长度,比如,0.5小时。
这里,所述第一时空区域中各个时空网格的历史人群聚集度平均值,即,第一人群聚集量,用E={Es,t|s∈{1,2,...M},t∈{1,2,...N}}表示。
实际应用时,可以从所述第二时空区域的第二用户轨迹数据中选取时间点距离当前时间范围的最大时间点比较近的第三用户轨迹数据,利用选取的第三用户轨迹数据,来确定转移到所述第三时空区域中各个时空网格的第二人群聚集量。
基于此,在一实施例中,所述利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量,包括:
从所述当前时间范围内确定K个时间点;
从所述第二时空区域中确定与K个时间点分别对应的时空网格;
利用所述第二时空区域的第二用户轨迹数据,确定与K个时间点分别对应的时空网格的第三用户轨迹数据;
利用与K个时间点分别对应的时空网格的第三用户轨迹数据,确定转移到所述第三时空区域中各个时空网格的第二人群聚集量。
其中,所述第三用户轨迹数据可以为与K个时间点分别对应的时间网格中的用户轨迹点数据。
这里,利用所述第二时空区域的第二用户轨迹数据,确定与K个时间点分别对应的时空网格的第三用户轨迹数据,包括:
利用所述第二时空区域的第二用户轨迹数据,确定所述第二时空区域的各个时空网格中的轨迹点;
利用所述第二时空区域的各个时空网格中的轨迹点,确定与K个时间点分别对应的时空网格中的轨迹点;
将与K个时间点分别对应的时空网格中的轨迹点作为第三用户轨迹数据。
这里,所述利用与K个时间点分别对应的时空网格的第三用户轨迹数据,确定转移到所述第三时空区域中各个时空网格的第二人群聚集量,包括:
针对与第i个时间点对应的每个时空网格,确定相应时空网格向所述第三时空区域中各个时空网格转移的1到K步转移概率矩阵;
利用与相应时空网格对应的1到K步转移概率矩阵,确定相应时空网格的第三用户轨迹数据转移到所述第三时空区域中的目标时空网格;
以此类推,直至确定与K个时间点分别对应的时间网格的第三用户轨迹数据转移到所述第三时空区域中的目标时空网格;统计转移到所述第三时空区域中目标时空网格的用户总数目,得到目标时空网格的第二人群聚集量;
其中,i=1,…,K;K为大于1的正整数。
可以理解的是,所述第三时空区域中未有用户发生转移的时空网格的第二人群聚集量为零。
具体地,确定所述第二人群聚集量的过程,可以包括:
第一,假设所述当前时间范围的最大时间点,用tn表示,以距离所述当前时间范围的最大时间点tn的固定时间间隔的K-1倍,从所述当前时间范围内选取K个时间点。所述固定时间间隔不大于tn-Ttr。也可以从所述当前时间范围内任意选取K个时间点。
举例来说,假设K=3,固定时间间隔等于1小时,当前时间范围为0点到9点,当前时间范围的最大时间点为9点,则针对K=1,取第一个时间点,即9点,距离最大时间点9点的固定时间间隔的K-1=0倍;针对K=2,取第二个时间点,即8点,距离最大时间点9点的固定时间间隔的K-1=1倍;针对K=3,取第三个时间点,即7点,距离最大时间点9点的固定时间间隔的K-1=2倍。
第二,从所述第二时空区域中确定与K个时间点分别对应的时空网格;针对与第i个时间点对应的每个时空网格,确定相应时空网格向所述第三时空区域中各个时空网格转移的1到K步转移概率矩阵。
举例来说,假设K个时间点分别用tn、tn-1,…,tn-K+1表示,与K个时间点分别对应的时空网格用{Stn,Stn-1,...,Stn-K+1}表示,转移概率矩阵可以用表示。
从转移概率矩阵数据库中,查询第二时空区域中的时空网格stn的1~K步转移概率矩阵,用表示表示,转移概率矩阵中的各元素表征第二时空区域中的时空网格stn中的轨迹点向第三时空区域中各个时空网格转移的转移概率。
以此类推,从转移概率矩阵数据库中,查询第二时空区域中的时空网格stn-K+1的1~K步转移概率矩阵。
第二,按照下面公式(7),将与权重系数{w1,w2,...,wk}进行加权求和:
其中,表示在预测时刻tn+1第二时空区域的时空网格中的轨迹点转移到第三时空区域中的下一到达点对应的时空网格Ss的可能性。/>越大,说明到达时空网格Ss的可能性越大。
因此,根据公式(7),在计算出在预测时刻tn+1第二时空区域的时空网格中的轨迹点转移到第三时空区域中所有时空网格的可能性后,找出中的最大值,即,/>对应的矩阵中的元素最大值。该最大值对应的时空网格可以作为目标时空网格,用Stn+1表示。
举例来说,假设K=3,第一个时间点对应第二时空区域中的时空网格1,第二个时间点对应第二时空区域中的时空网格2,第3个时间点对应第二时空区域中的时空网格3。按照公式(7),将时空网格1对应的1~3步转移概率矩阵和对应权重系数进行加权求和,最终确定第二时空区域中的时间网格1中的轨迹点转移到第三时空区域中的目标时空网格为时空网格3。按照公式(7),将时空网格2对应的1~3步转移概率矩阵和对应权重系数进行加权求和,最终确定第二时空区域中的时间网格2中的轨迹点转移到第三时空区域中的目标时空网格为时空网格5。按照公式(7),将时空网格3对应的1~3步转移概率矩阵和对应权重系数进行加权求和,最终确定第二时空区域中的时间网格3中的轨迹点转移到第三时空区域中的目标时空网格为时空网格3。
需要说明的是,由于越靠近tn+1时刻的用户轨迹点与下一到达点的关联越大,故权重系数的确定采用衰减形式,
以此类推,确定在预测时刻tn+1与K个时间点分别对应的时间网格中的轨迹点转移到所述第三时空区域中的目标时空网格。
这里,在预测时刻tn+1转移转移到所述第三时空区域中的目标时空网格分别用{Stn+1,Stn,…,Stn-K+2}表示。
第三,统计所述第三时空区域中的目标时空网格的用户数目,得到目标时空网格的第二人群聚集量。
首先,利用与K个时间点分别对应的时空网格的第三用户轨迹数据,确定与K个时间点分别对应的时空网格中的用户。
具体地,与第一个时间点对应的时空网格中的轨迹点用集合(用户ID,PTtn,tn)表示,统计用户ID的数目,得到与第一个时间点对应的时空网格中的用户,比如,用户ID1,用户ID2。
与第二个时间点对应的时空网格中的轨迹点用集合(用户ID,PTtn-1,tn-1)表示,统计不同用户ID的数目,得到与第二个时间点对应的时空网格中的用户,比如,用户ID4,用户ID5。
以此类推,与第K个时间点对应的时空网格中的轨迹点用集合(用户ID,PTtn-k+1,tn-k+1)表示,统计不同用户ID的数目,得到与第K个时间点对应的时空网格中的用户,比如,用户ID4,用户ID3。
其中,与K个时间点分别对应的时空网格中的用户均可以称为当前活跃用户。与K个时间点分别对应的时空网格中的第三用户轨迹数据,可以称为当前活跃用户的轨迹点。
然后,利用与第K个时间点对应的时空网格中的用户,统计第三时空区域中目标时空网格中的用户总数目,得到目标时空网格的第二人群聚集量。
举例来说,假设K=3,第一个时间点对应第二时空区域中的时空网格1,第二个时间点对应第二时空区域中的时空网格2表示,第3个时间点对应第二时空区域中的时空网格3。其中,第二时空区域中的时间网格1中包含用户1和用户3,第二时空区域中的时间网格1中的轨迹点转移到第三时空区域中的目标时空网格为时空网格3;第二时空区域中的时间网格2中包含用户2和用户3,第二时空区域中的时间网格2中的轨迹点转移到第三时空区域中的目标时空网格为时空网格5;第二时空区域中的时间网格3中包含用户1和用户4,第二时空区域中的时间网格3中的轨迹点转移到第三时空区域中的目标时空网格为时空网格3,则第三时空区域中的目标时空网格3中的用户总数目为3,为用户1、用户3、用户4;第三时空区域中的目标时空网格5中的用户总数目为2,为用户2、用户3。
这里,建立转移概率矩阵数据库的过程,可以包括:利用所述第一时空区域的第一用户轨迹数据,为每个时空网格建立1~K步转移概率矩阵。
具体地,首先,定义一个状态转移频数张量F={F1,F2,…,FN}∈RN×M×M
其中,为时空网格t的状态转移频数矩阵。
然后,根据所述第一用户轨迹数据中所有轨迹点携带的历史轨迹ID、用户ID、经度、纬度、重采样的时间戳,统计在时空网格t内的轨迹点从时空网格j经过Ttr转移到时空网格k的次数填入Ft。其中,Ttr表示对历史轨迹进行重采样的时间间隔长度,j=1,…,M;k=1,…,M。
按照下面所示的公式,使用Ft,计算马尔可夫单步转移概率矩阵。并按照所示的C-K方程,可以得到时空网格t的2~K步转移概率矩阵,具体如下:
P(K)=PK(12) k=2,…,K
这里,用Pt={Pt(1),Pt(2),…,Pt(K)}表示时空网格t的2~K步转移概率矩阵。
或者,统计在时空网格t内的轨迹点对应的用户从时空网格j经过2×Ttr转移到时空网格k的次数填入Ft;对Ft计算马尔可夫两步转移概率矩阵。以此类推,统计在时空网格t内的轨迹点对应的用户从时空网格j经过K×Ttr转移到时空网格k的次数/>填入Ft;对Ft计算马尔可夫K步转移概率矩阵。
如此,对每个时空网格,均计算1~K步转移概率矩阵Pt
步骤103:利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测。
实际应用时,可以将所述第一时空区域中各个时空网格和所属第三时空区域中各个时空网格建立一一对应关系,如此,可以将所述第一时空区域中各个时空网格的人群聚集量与各自对应的所述第三时空区域中的时空网格的人群聚集量进行比较,并结合所述第一时空区域中各个时空网格的异常阈值,确定所述第三时空区域中的时空网格对应的地理位置是否会发生人群异常聚集。
基于此,在一实施例中,所述利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测,包括:
将所述第一时空区域中各个第一时空网格与所述第三时空区域中各个第二时空网格建立对应关系;
将所述第三时空区域中每个第二时空网格的第二人群聚集量和各自对应的第一时空网格的第一人群聚集量求差,得到与每个第二时空网格对应的差值;
将每个第二时空网格对应的差值和与各自对应的第一时空网格的异常阈值进行比较,得到比较结果;
基于所述比较结果,对所述第三时空区域中每个第二时空网格的人群聚集异常进行预测。
这里,对所述第三时空区域中各个时空网格的人群聚集异常进行预测,具体可以包括:
第一,所述第三时空区域中的各个第二时空网格在下一时刻tn+1的第二人群聚集量,用表示。其中,t为下一时刻tn+1所属的时空网格的序号。
第二,计算第二时空网格的第二人群聚集量与其对应的第一时空网格的第一人群聚集量Es,t的差值,并将差值与其对应的第一时空网格的异常发现阈值THs,t进行比较。
这里,若则预测该时刻该区域将会发生人群异常聚集。然后,输出预测聚集时间发生地点s、预测聚集时间发生时间tn+1和预测聚集地人群规模/>
在一实施例中,所述方法还包括:
利用所述第一时空区域中的第一用户轨迹数据,将所述第一时空区域划分为包含至少一个人群聚集异常事件的第一时空网格和未包含人群聚集异常事件的第一时空网格;
利用包含至少一个人群聚集异常事件的第一时空网格的第一用户轨迹数据,确定各个人群聚集异常事件的人群异常聚集量,得到至少一个人群异常聚集量;
利用所述至少一个人群异常聚集量和第一人群聚集量,确定包含至少一个人群聚集异常事件的第一时空网格的异常阈值;
利用各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集量和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值。
可以理解的是,可以利用所述第一时空区域中的第一用户轨迹数据,确定所述第一时空区域的各个时空网格中的轨迹点;轨迹点携带有标识信息;所述标识信息用于指示轨迹点是否属于人群聚集异常事件;根据轨迹点携带的标识信息,将所述第一时空区域划分为包含至少一个人群聚集异常事件的第一时空网格和未包含人群聚集异常事件的第一时空网格。
举例来说,假设第一时空区域包括时空网格1、时空网格2。时空网格1包括轨迹点1、轨迹点2、轨迹点3;轨迹点1携带标识信息为0,表明轨迹点1不属于人群聚集异常事件,轨迹点2携带标识信息为1,表明轨迹点2属于人群聚集异常事件a1,轨迹点3携带标识信息为3,表明轨迹点1属于人群聚集异常事件a2,则时空网格1为包含两个人群聚集异常事件的第一时空网格。同样的,时空网格2包括轨迹点1、轨迹点2;轨迹点1携带标识信息为0,表明轨迹点1不属于人群聚集异常事件,轨迹点2携带标识信息为0,表明轨迹点2不属于人群聚集异常事件a1,则时空网格2为不包含人群聚集异常事件的第一时空网格。
可以理解的是,可以利用所述第一时空区域中的第一用户轨迹数据,确定所述第一时空区域的各个时空网格中的轨迹点;轨迹点携带有标识信息和用户ID;所述标识信息用于指示轨迹点是否属于人群聚集异常事件。根据轨迹点携带的标识信息,将所述第一时空区域划分为包含至少一个人群聚集异常事件的第一时空网格和未包含人群聚集异常事件的第一时空网格。针对包含至少一个人群聚集异常事件的第一时空网格,根据轨迹点携带的标识信息和用户ID,统计各个人群聚集异常事件的人群异常聚集量,得到至少一个人群异常聚集量。
在一实施例中,所述利用所述至少一个人群异常聚集量和第一人群聚集量,确定包含至少一个人群聚集异常事件的第一时空网格的异常阈值,包括:
将所述至少一个人群异常聚集量和第一人群聚集量求差,得到至少一个差值;
将所述至少一个差值作为观测量;并对所述观测量进行估计,得到估计值;
将所述估计值作为包含至少一个人群聚集异常事件的第一时空网格的异常阈值。
这里,确定包含至少一个人群聚集异常事件的第一时空网格的异常阈值的过程,可以包括:
第一,假设所述第一时空区域中包含至少一个人群聚集异常事件ai的第一时空网格用(s,ti)表示。第一时空网格(s,ti)中的轨迹点,用集合ζs,t表示。集合ζs,t内时间戳落在(ti,ti+Ttr)内属于人群聚集异常事件ai的轨迹点数目,用表示。
按照下面公式(8),计算与第一时空网格(s,ti)的第一人群聚集量Es,t的差值,也可以称为观测量,具体如下:
第二,采用加权最小二乘法,对包含至少一个人群聚集异常事件ai的第一时空网格(s,t)的异常发现阈值THs,t进行估计。即,按照下面公式(9),求解得到估计值,具体如下:
其中,THs,t为估计量,即,包含至少一个人群聚集异常事件的第一时空网格的异常阈值;为公式(8)计算得到的观测量。
需要说明的是,权值设置上,将按值大小进行排序,/>最大的一项的权值wi为1,/>更小的项的权值wi为其前一个/>较大项的权值的/>倍。
在一实施例中,所述利用各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集量和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值,包括:
将至少一个人群异常聚集量求和,得到包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集总量;
将各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集总量分别和各自的第一人群聚集量求商,得到多个比值;
对所述多个比值求平均,得到平均值;
利用所述平均值和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值。
这里,确定未包含人群聚集异常事件的第一时空网格的异常阈值的过程,可以包括:
按照下面公式(10),设置不存在人群聚集异常事件的时空网格(s,t)的异常阈值,具体如下:
THs,t=(rs,t-1)Es,t (10)
其中,THs,t表示不存在人群聚集异常事件的时空网格(s,t)的异常阈值。Es,t表示不存在人群聚集异常事件的时空网格(s,t)的第一人群聚集量。
rs,t的计算过程包括:先将包含至少一个人群聚集异常事件的时空网格上的所有人群聚集异常事件ai的人群异常聚集量求和,得到包含至少一个人群聚集异常事件的时空网格的人群异常聚集总量;再将各个包含至少一个人群聚集异常事件的时空网格的人群异常聚集总量与对应的时空网格的第一人群聚集量Es,t求商,得到多个比值;对多个比值求平均值,得到rs,t
需要说明的是,若所有时空网格上均不存在任何人群聚集异常事件,则rs,t设置为1.5。
本发明实施例中,具备以下优点:
(1)考虑了整个第三时空区域中的不同位置、不同时间可能出现的人群聚集情况,结合不同地区之间的用户转移情况,来进行人群异常聚集预测。
(2)考虑不同区域之间的转移特性与不同时间段的用户路径选择规律,来对用户的下一到达区域进行预测,从而更为精确地预测个体的轨迹路径,根据个体的移动轨迹计算各区域以及人流量的变化情况,对可能发生人群聚集的时间和地点进行预测。
(3)对用户时空移动模式进行识别,基于信令数据获得属于特定移动模式的轨迹数据。
(4)能够预测异常人群聚集的时间和位置,并且挖掘了时空区域正常状态下的人群分布统计特征,设定不同地区、时间下的人群聚集异常阈值,并且在预测时全面挖掘了用户的长期轨迹趋势,将利用轨迹长期趋势的用户下一到达点预测技术应用到人群异常聚集的时空预测,提高了异常状态预测的准确性。
(5)能够解决相关技术中人群异常聚集预测中噪声数据多、难以生成合理的异常聚集判断阈值等问题。
(6)使用加权多步转移概率模型对用户轨迹的趋势进行建模,考虑了人群在不同区域之间的转移特征与不同情况下用户路径选择规律,而不仅仅是根据某个区域自身的历史人流量数据预测该区域的未来人流量。
为实现本发明实施例异常预测方法,本发明实施例还提供一种异常预测装置。图4为本发明实施例异常预测装置的组成结构示意图,如图4所示,所述装置包括:
获取单元41,用于获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据;所述第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第二时空区域是以所述目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第一用户轨迹数据为在所述历史时间范围内在所述目标区域获取的用户轨迹点数据;所述第二用户轨迹数据为在所述当前时间范围内在所述目标区域获取的用户轨迹点数据;
第一处理单元42,用于利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量;并利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量;所述第三时空区域是以所述目标区域为空间轴、预测时间范围为时间轴,构建的包含M个时空网格的时空区域;
第二处理单元43,用于利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测;
其中,M为大于1的正整数。
在一实施例中,所述第一处理单元42,具体用于:
从所述当前时间范围内确定K个时间点;
从所述第二时空区域中确定与K个时间点分别对应的时空网格;
利用所述第二时空区域的第二用户轨迹数据,确定与K个时间点分别对应的时空网格的第三用户轨迹数据;
利用与K个时间点分别对应的时空网格的第三用户轨迹数据,确定转移到所述第三时空区域中各个时空网格的第二人群聚集量。
在一实施例中,所述第一处理单元42,具体用于:
针对与第i个时间点对应的每个时空网格,确定相应时空网格向所述第三时空区域中各个时空网格转移的1到K步转移概率矩阵;
利用与所述相应时空网格对应的1到K步转移概率矩阵,确定所述相应时空网格的第三用户轨迹数据转移到所述第三时空区域中的目标时空网格;
以此类推,直至确定与K个时间点分别对应的时间网格的第三用户轨迹数据转移到所述第三时空区域中的目标时空网格;统计转移到所述第三时空区域中目标时空网格的用户总数目,得到目标时空网格的第二人群聚集量;
其中,i=1,…,K;K为大于1的正整数。
在一实施例中,所述第二处理单元43,具体用于:
将所述第一时空区域中各个第一时空网格与所述第三时空区域中各个第二时空网格建立对应关系;
将所述第三时空区域中每个第二时空网格的第二人群聚集量和各自对应的第一时空网格的第一人群聚集量求差,得到与每个第二时空网格对应的差值;
将每个第二时空网格对应的差值和与各自对应的第一时空网格的异常阈值进行比较,得到比较结果;
基于所述比较结果,对所述第三时空区域中每个第二时空网格的人群聚集异常进行预测。
在一实施例中,所述第二处理单元43,还用于:
利用所述第一时空区域中的第一用户轨迹数据,将所述第一时空区域划分为包含至少一个人群聚集异常事件的第一时空网格和未包含人群聚集异常事件的第一时空网格;
利用包含至少一个人群聚集异常事件的第一时空网格的第一用户轨迹数据,确定各个人群聚集异常事件的人群异常聚集量,得到至少一个人群异常聚集量;
利用所述至少一个人群异常聚集量和第一人群聚集量,确定包含至少一个人群聚集异常事件的第一时空网格的异常阈值;
利用各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集量和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值。
在一实施例中,所述第二处理单元43,具体用于:
将所述至少一个人群异常聚集量和第一人群聚集量求差,得到至少一个差值;
将所述至少一个差值作为观测量;并对所述观测量进行估计,得到估计值;
将所述估计值作为包含至少一个人群聚集异常事件的第一时空网格的异常阈值。
在一实施例中,所述第二处理单元43,具体用于:
将至少一个人群异常聚集量求和,得到包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集总量;
将各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集总量分别和各自的第一人群聚集量求商,得到多个比值;
对所述多个比值求平均,得到平均值;
利用所述平均值和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值。
实际应用时,所述获取单元41可以由异常预测装置中的通信接口实现;所述第一处理单元42、第二处理单元43可以由异常预测装置中的处理器实现。
需要说明的是:上述实施例提供的异常预测装置在进行异常预测时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的异常预测装置与异常预测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本发明实施例还提供了一种终端,如图5所示,包括:
通信接口51,能够与其它设备进行信息交互;
处理器52,与所述通信接口51连接,用于运行计算机程序时,执行上述终端侧一个或多个技术方案提供的方法。而所述计算机程序存储在存储器53上。
需要说明的是:所述处理器52和通信接口51的具体处理过程详见方法实施例,这里不再赘述。
当然,实际应用时,终端50中的各个组件通过总线系统54耦合在一起。可理解,总线系统54用于实现这些组件之间的连接通信。总线系统54除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统54。
本申请实施例中的存储器53用于存储各种类型的数据以支持终端50的操作。这些数据的示例包括:用于在终端50上操作的任何计算机程序。
上述本申请实施例揭示的方法可以应用于所述处理器52中,或者由所述处理器52实现。所述处理器52可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过所述处理器52中的硬件的集成逻辑电路或者软件形式的指令完成。上述的所述处理器52可以是通用处理器、数字数据处理器(DSP,Digital SignalProcessor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。所述处理器52可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器53,所述处理器52读取存储器53中的信息,结合其硬件完成前述方法的步骤。
在示例性实施例中,终端50可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或者其他电子元件实现,用于执行前述方法。
可以理解,本申请实施例的存储器(存储器53)可以是易失性存储器或者非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(FlashMemory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,Random Access Memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,Synchronous Dynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random AccessMemory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random AccessMemory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本申请实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
在示例性实施例中,本发明实施例还提供了一种存储介质,即计算机存储介质,具体为计算机可读存储介质,例如包括存储计算机程序的存储器,上述计算机程序可由终端50的处理器52执行,以完成前述终端侧方法所述步骤。计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器。
需要说明的是:“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
另外,本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

Claims (10)

1.一种异常预测方法,其特征在于,应用于终端,所述方法包括:
获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据;所述第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第二时空区域是以所述目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第一用户轨迹数据为在所述历史时间范围内在所述目标区域获取的用户轨迹点数据;所述第二用户轨迹数据为在所述当前时间范围内在所述目标区域获取的用户轨迹点数据;
利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量;并利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量;所述第三时空区域是以所述目标区域为空间轴、预测时间范围为时间轴,构建的包含M个时空网格的时空区域;
利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测;
其中,M为大于1的正整数。
2.根据权利要求1所述的方法,其特征在于,所述利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量,包括:
从所述当前时间范围内确定K个时间点;
从所述第二时空区域中确定与K个时间点分别对应的时空网格;
利用所述第二时空区域的第二用户轨迹数据,确定与K个时间点分别对应的时空网格的第三用户轨迹数据;
利用与K个时间点分别对应的时空网格的第三用户轨迹数据,确定转移到所述第三时空区域中各个时空网格的第二人群聚集量。
3.根据权利要求2所述的方法,其特征在于,所述利用与K个时间点分别对应的时空网格的第三用户轨迹数据,确定转移到所述第三时空区域中各个时空网格的第二人群聚集量,包括:
针对与第i个时间点对应的每个时空网格,确定相应时空网格向所述第三时空区域中各个时空网格转移的1到K步转移概率矩阵;
利用与所述相应时空网格对应的1到K步转移概率矩阵,确定所述相应时空网格的第三用户轨迹数据转移到所述第三时空区域中的目标时空网格;
以此类推,直至确定与K个时间点分别对应的时间网格的第三用户轨迹数据转移到所述第三时空区域中的目标时空网格;统计转移到所述第三时空区域中目标时空网格的用户总数目,得到目标时空网格的第二人群聚集量;
其中,i=1,…,K;K为大于1的正整数。
4.根据权利要求1所述的方法,其特征在于,所述利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测,包括:
将所述第一时空区域中各个第一时空网格与所述第三时空区域中各个第二时空网格建立对应关系;
将所述第三时空区域中每个第二时空网格的第二人群聚集量和各自对应的第一时空网格的第一人群聚集量求差,得到与每个第二时空网格对应的差值;
将每个第二时空网格对应的差值和各自对应的第一时空网格的异常阈值进行比较,得到比较结果;
基于所述比较结果,对所述第三时空区域中每个第二时空网格的人群聚集异常进行预测。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
利用所述第一时空区域中的第一用户轨迹数据,将所述第一时空区域划分为包含至少一个人群聚集异常事件的第一时空网格和未包含人群聚集异常事件的第一时空网格;
利用包含至少一个人群聚集异常事件的第一时空网格的第一用户轨迹数据,确定各个人群聚集异常事件的人群异常聚集量,得到至少一个人群异常聚集量;
利用所述至少一个人群异常聚集量和第一人群聚集量,确定包含至少一个人群聚集异常事件的第一时空网格的异常阈值;
利用各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集量和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值。
6.根据权利要求5所述的方法,其特征在于,所述利用所述至少一个人群异常聚集量和第一人群聚集量,确定包含至少一个人群聚集异常事件的第一时空网格的异常阈值,包括:
将所述至少一个人群异常聚集量和第一人群聚集量求差,得到至少一个差值;
将所述至少一个差值作为观测量;并对所述观测量进行估计,得到估计值;
将所述估计值作为包含至少一个人群聚集异常事件的第一时空网格的异常阈值。
7.根据权利要求5所述的方法,其特征在于,所述利用各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集量和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值,包括:
将至少一个人群异常聚集量求和,得到包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集总量;
将各个包含至少一个人群聚集异常事件的第一时空网格的人群异常聚集总量分别和各自的第一人群聚集量求商,得到多个比值;
对所述多个比值求平均,得到平均值;
利用所述平均值和未包含人群聚集异常事件的第一时空网格的第一人群聚集量,确定未包含人群聚集异常事件的第一时空网格的异常阈值。
8.一种异常预测装置,其特征在于,包括:
获取单元,用于获取第一时空区域的第一用户轨迹数据和第二时空区域的第二用户轨迹数据;所述第一时空区域是以目标区域为空间轴、历史时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第二时空区域是以所述目标区域为空间轴、当前时间范围为时间轴,构建的包含M个时空网格的时空区域;所述第一用户轨迹数据为在所述历史时间范围内在所述目标区域获取的用户轨迹点数据;所述第二用户轨迹数据为在所述当前时间范围内在所述目标区域获取的用户轨迹点数据;
第一处理单元,用于利用所述第一时空区域的第一用户轨迹数据,确定所述第一时空区域中各个时空网格的第一人群聚集量;并利用所述第二时空区域的第二用户轨迹数据,确定转移到第三时空区域中各个时空网格的第二人群聚集量;所述第三时空区域是以所述目标区域为空间轴、预测时间范围为时间轴,构建的包含M个时空网格的时空区域;
第二处理单元,用于利用所述第一人群聚集量和所述第二人群聚集量,对所述第三时空区域中各个时空网格的人群聚集异常进行预测;
其中,M为大于1的正整数。
9.一种终端,其特征在于,包括处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
CN202210483604.0A 2022-05-05 2022-05-05 异常预测方法、装置、设备及存储介质 Pending CN116701551A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210483604.0A CN116701551A (zh) 2022-05-05 2022-05-05 异常预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210483604.0A CN116701551A (zh) 2022-05-05 2022-05-05 异常预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116701551A true CN116701551A (zh) 2023-09-05

Family

ID=87832752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210483604.0A Pending CN116701551A (zh) 2022-05-05 2022-05-05 异常预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116701551A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688505A (zh) * 2024-02-04 2024-03-12 河海大学 一种植被大范围区域化负异常的预测方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117688505A (zh) * 2024-02-04 2024-03-12 河海大学 一种植被大范围区域化负异常的预测方法及系统
CN117688505B (zh) * 2024-02-04 2024-04-19 河海大学 一种植被大范围区域化负异常的预测方法及系统

Similar Documents

Publication Publication Date Title
WO2018122804A1 (zh) 一种非等距时空划分的道路交通异常检测方法
CN107798876B (zh) 基于事件的道路交通异常拥堵判断方法
CN106878952B (zh) 区域人员数量的预测方法及装置
EP3132592B1 (en) Method and system for identifying significant locations through data obtainable from a telecommunication network
Fekih et al. A data-driven approach for origin–destination matrix construction from cellular network signalling data: a case study of Lyon region (France)
Wang et al. A big data approach for smart transportation management on bus network
CN107516417B (zh) 一种挖掘时空关联关系的实时高速公路流量估计方法
Li et al. Identifying important variables for predicting travel time of freeway with non-recurrent congestion with neural networks
EP2590151A1 (en) A framework for the systematic study of vehicular mobility and the analysis of city dynamics using public web cameras
CN109688532B (zh) 一种划分城市功能区域的方法及装置
EP2608181B1 (en) Method for detecting traffic
CN116012208A (zh) 用于智慧城市的风险区域预警信息生成方法和物联网系统
WO2015170289A1 (en) Method and system for vehicular traffic prediction
CN113077090A (zh) 客流预测方法、系统及计算机可读存储介质
CN113361825A (zh) 一种踩踏事故早期预警方法及系统
Habtie et al. Artificial neural network based real-time urban road traffic state estimation framework
Yao et al. Sampled trajectory data-driven method of cycle-based volume estimation for signalized intersections by hybridizing shockwave theory and probability distribution
CN110516866A (zh) 一种用于城市轨交地铁拥挤度的实时估计方法
US10706720B2 (en) Predicting vehicle travel times by modeling heterogeneous influences between arterial roads
CN111950798A (zh) 一种基于小波神经网络的区域短期人流量趋势预测方法及其系统
Breyer et al. Comparative analysis of travel patterns from cellular network data and an urban travel demand model
CN116701551A (zh) 异常预测方法、装置、设备及存储介质
Hongsakham et al. Estimating road traffic congestion from cellular handoff information using cell-based neural networks and K-means clustering
Nantes et al. Noisy Bluetooth traffic data?
Shen et al. Real-time road traffic fusion and prediction with GPS and fixed-sensor data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination