CN109947758A - 一种基于行为轨迹库的路线碰撞分析方法 - Google Patents
一种基于行为轨迹库的路线碰撞分析方法 Download PDFInfo
- Publication number
- CN109947758A CN109947758A CN201910267358.3A CN201910267358A CN109947758A CN 109947758 A CN109947758 A CN 109947758A CN 201910267358 A CN201910267358 A CN 201910267358A CN 109947758 A CN109947758 A CN 109947758A
- Authority
- CN
- China
- Prior art keywords
- route
- activities
- data
- target person
- crash analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Navigation (AREA)
Abstract
本发明公开一种基于行为轨迹库的路线碰撞分析方法,包括:设置目标人员以及路线碰撞分析参数;计算目标人员所覆盖的活动网格数量;过滤行为轨迹库中目标人员的轨迹数据;计算步骤S103输出的轨迹数据中的轨迹点到指定活动路线的距离,过滤掉上述距离超出指定活动距离的轨迹数据;统计每个目标人员去重后的活动网格数量,并判断目标人员是否满足路线碰撞条件;输出所有满足路线碰撞条件的路线频繁活动者;路线碰撞分析参数包括目标活动路线、目标活动距离、目标活动时间范围以及最少匹配活动网格数。本发明实现精准分析目标活动路线上的路线频繁活动者,可快速获得行为轨迹库中路线碰撞分析的分析结果。
Description
技术领域
本发明涉及安防与信息技术领域,尤其涉及一种基于行为轨迹库的路线碰撞分析方法。
背景技术
目前,安防系统中多种监控设备会采集大量行为轨迹数据,包括:人脸、MAC、IMSI和IMEI;而安防系统中采集设备本身只能对进入其侦测范围的目标信息进行识别,不能判断监控目标是从哪个方向进入设备侦测范围,也无法得到设备与监控目标之间的距离,因而无法得到目标的精准地理位置。通常系统以采集设备自身的地理位置作为探测目标的位置,而采集设备分为固定采集设备和移动采集设备,对于地理位置保持不变的固定采集设备,以其所处的地理位置作为探测目标的位置;对于移动采集设备,以其探测时刻所处的地理位置作为探测目标的位置。
此外,一个监控目标在同一时刻可能会被多个设备探测到,目标活动期间所有设备采集的数据组成了目标活动轨迹的时空信息(包括时间、经度和纬度的3维信息),其中,经纬度位置信息是不准确的。
为了后期能更有效的利用采集设备采集的海量行为轨迹数据,需要对海量地理位置不精确的轨迹数据进行清洗,因此,合理与高效的轨迹数据清洗方法以及信息存储格式成为亟待解决的问题。另一方面,如何利用数据清洗过的轨迹数据高效、精准的分析出在指定路线上频繁活动的目标人员是个亟待解决的问题。
路线碰撞分析是指在地理空间输入一条目标线路以及活动时间范围,找出在此活动范围内经常在该目标路线上活动的目标人员,其中若目标人员的活动地点离路线的直线距离不超过给定的阈值(如200米),即认为目标人员是在该目标路线上活动。
由于需要处理的数据量巨大,并且期望快速获得分析结果,特别是待处理的地理信息不精确,因此急需提出有效、快速的数据清洗方法,用以估计出监控目标精准的地理信息,并解决路线碰撞分析问题。
因此,现有技术存在缺陷,需要改进。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于行为轨迹库的路线碰撞分析方法。
本发明的技术方案如下:一种基于行为轨迹库的路线碰撞分析方法,包括以下步骤:
步骤S101,设置目标人员以及路线碰撞分析参数;
步骤S102,根据上述路线碰撞分析参数计算目标人员所覆盖的所有活动网格数量;
步骤S103,根据上述路线碰撞分析参数以及活动网格过滤行为轨迹库中目标人员的轨迹数据,并输出该轨迹数据至下一环节;
步骤S104,计算步骤S103输出的轨迹数据中的轨迹点到指定活动路线的距离,过滤掉上述距离超出指定活动距离的轨迹数据,并将过滤后的轨迹数据输出至下一环节;
步骤S105,统计每个目标人员去重后的活动网格数量,并判断目标人员是否满足路线碰撞条件;
步骤S106,输出所有满足路线碰撞条件的路线频繁活动者。
进一步地,所述步骤S101中的路线碰撞分析参数包括目标活动路线、目标活动距离、目标活动时间范围以及最少匹配活动网格数。
进一步地,所述步骤S102通过计算所述目标活动路线和目标活动距离所覆盖的所有活动网格,实现目标人员的所有活动网格数量的数据计算。
进一步地,所述步骤S103通过过滤处于所述目标活动时间范围内以及目标活动网格内的轨迹数据,实现目标人员的轨迹数据的数据过滤。
更加优选地,所述步骤S103通过filter函数执行在行为轨迹库中将处于所述目标活动时间范围内以及目标活动网格内的轨迹数据的数据过滤处理。
进一步地,所述步骤S104中的指定活动路线即为所述目标活动路线;所述步骤S104中的指定活动距离即为所述目标活动距离。
更加优选地,所述步骤S104通过filter函数执行过滤掉轨迹点到指定活动路线的距离超出目标活动距离的轨迹数据的数据过滤处理。
进一步地,所述步骤S105中的路线碰撞条件为目标人员去重后的活动网格数量大于或等于所述最少匹配活动网格数。
采用上述方案,本发明具有以下有益效果:
1、本发明实现精准分析目标活动路线上的路线频繁活动者,可快速获得行为轨迹库中路线碰撞分析的分析结果。
本发明通过路线碰撞分析参数计算目标人员所覆盖的活动网格数量,并通过路线碰撞分析参数以及目标活动网格过滤行为轨迹库中目标人员的轨迹数据,计算目标人员的轨迹数据中轨迹点到指定活动路线的距离,并过滤掉超出指定活动距离的轨迹数据,然后统计每个目标人员去重后的活动网格数量,判断并输出所有满足路线碰撞条件的路线频繁活动者,即可获得行为轨迹库中路线碰撞分析的分析结果,实现精准分析目标活动路线上的路线频繁活动者。
2、本发明实现对海量地理位置不精确的轨迹数据的高效清洗。
本发明通过map函数将海量行为轨迹数据切分成若干时间段和空间网格,并将切分好的数据转换成Key-value格式,通过groupByKey函数聚合属于同一时间段以及网格的轨迹数据,通过flatMap函数清洗groupByKey函数聚合的轨迹数据,所有操作基于ApacheSpark计算引擎,可快速完成海量行为轨迹数据的清洗;另一方面,经过清洗的轨迹数据将被压缩处理,入库存储效率高,利于轨迹数据的后续使用。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明基于行为轨迹库的路线碰撞分析方法的流程示意图;
图2为本发明用于搭建行为轨迹库的数据清洗方法的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
以下结合附图和具体实施例,对本发明进行详细说明。
参照图1所示,本发明提供一种基于行为轨迹库的路线碰撞分析方法,包括以下步骤:
步骤S101,设置目标人员以及路线碰撞分析参数;
步骤S102,根据上述路线碰撞分析参数计算目标人员所覆盖的所有活动网格数量;
步骤S103,根据上述路线碰撞分析参数以及活动网格过滤行为轨迹库中目标人员的轨迹数据,并输出该轨迹数据至下一环节;
步骤S104,计算步骤S103输出的轨迹数据中的轨迹点到指定活动路线的距离,过滤掉上述距离超出指定活动距离的轨迹数据,并将过滤后的轨迹数据输出至下一环节;
步骤S105,统计每个目标人员去重后的活动网格数量,并判断目标人员是否满足路线碰撞条件;
步骤S106,输出所有满足路线碰撞条件的路线频繁活动者;
所述步骤S101中的路线碰撞分析参数包括目标活动路线、目标活动距离、目标活动时间范围以及最少匹配活动网格数。
在本实施例中,所述步骤S102通过计算所述目标活动路线和目标活动距离所覆盖的所有活动网格,实现目标人员的所有活动网格数量的数据计算。
在本实施例中,所述步骤S103通过过滤处于所述目标活动时间范围内以及目标活动网格内的轨迹数据,实现目标人员的轨迹数据的数据过滤。
作为其中一种较佳实施例,所述步骤S103通过filter函数执行在行为轨迹库中将处于所述目标活动时间范围内以及目标活动网格内的轨迹数据的数据过滤处理。
值得一提的是,由于判断一个活动网格是否在目标活动网格内的计算量远远低于计算一个轨迹点到一系列以折线形式呈现的目标活动路线的最短距离,因此通过活动网格筛选轨迹数据降低了数据计算量,减少了大量的数据筛选时间,极大地提升数据筛选效率。
在本实施例中,所述步骤S104中的指定活动路线即为所述目标活动路线;所述步骤S104中的指定活动距离即为所述目标活动距离。
作为其中一种较佳实施例,所述步骤S104通过filter函数执行过滤掉轨迹点到指定活动路线的距离超出目标活动距离的轨迹数据的数据过滤处理。
在本实施例中,所述步骤S105中的路线碰撞条件为目标人员去重后的活动网格数量大于或等于所述最少匹配活动网格数;目标人员去重后的活动网格数量大于或等于所述最少匹配活动网格数时,说明此目标人员为路线频繁活动者。
参照图2所示,本发明还提供一种用于搭建行为轨迹库的数据清洗方法,包括以下步骤:
步骤S201,获取采集设备采集的海量原始行为轨迹数据;
步骤S202,对上述海量原始行为轨迹数据进行数据切分,并将切分好的轨迹数据输出至下一环节;
步骤S203,对上述切分后的轨迹数据进行数据聚合,并将聚合的轨迹数据输出至下一环节;
步骤S204,对上述聚合后的轨迹数据进行数据清洗,输出一组或多组轨迹数据;
步骤S205,将清洗后的轨迹数据入库存储,构成行为轨迹库。
作为一种实施例,所述步骤S201获取的数据包括人脸数据、MAC数据、IMSI数据、IMEI数据中的一种或多种。
作为一种实施例,所述步骤S202中的数据切分包括时间切分和空间切分;所述时间切分按指定的时间间隔将所述海量原始行为轨迹数据切分成若干时间段;所述空间切分按指定的空间刻度将所述海量原始行为轨迹数据切分成若干空间网格。
在本实施例中,所述步骤S202中的数据切分通过map函数执行对所述海量原始行为轨迹数据的切分,并确定轨迹数据所属的时间段以及网格,以及将切分的数据转换成Key-value格式输出至下一环节。
其中,Key包括目标、时间段以及网格;value包括时间、经度以及纬度。
作为一种较佳实施例,所述步骤S203中的数据聚合通过groupByKey函数执行对属于同一时间段以及网格的轨迹数据聚合。
作为一种较佳实施例,所述步骤S204中的数据清洗包括以下步骤:
步骤a,对步骤S203聚合的数据按时间排序,并对排序好的数据按给定的时间刻度进行数据切分;
步骤b,从上述切分好的数据中过滤出所有满足连续两条轨迹时间间隔的数据,且该数据的时间间隔不超过给定时间刻度,并将该数据划分为一组;
步骤c,取最早出现时间或者平均时间作为上述分组的采集时间,统计平均经纬度作为该分组的目标采集位置,根据所述采集时间和目标采集位置将每一组内的所有轨迹分别合并成一条轨迹。
在本实施例中,所述步骤S204中的数据清洗通过flatMap函数执行对所述步骤S203聚合的数据的清洗处理,并以组的形式输出清洗后的轨迹数据;输出的轨迹数据选自伴随目标、空间网格、时间、经度、纬度中的一种或多种。
在本实施例中,所述map函数、groupByKey函数和flatMap函数基于Apache Spark计算引擎实现各自的功能,使用Apache Spark可方便、快速的进行进行海量轨迹数据的数据清洗。
作为一种较佳实施例,所述步骤S205中的行为轨迹库可以是kudu数据库、HBase数据库中的一种或多种。
与现有技术相比,本发明具有以下有益效果:
1、本发明实现精准分析目标活动路线上的路线频繁活动者,可快速获得行为轨迹库中路线碰撞分析的分析结果。
本发明通过路线碰撞分析参数计算目标人员所覆盖的活动网格数量,并通过路线碰撞分析参数以及目标活动网格过滤行为轨迹库中目标人员的轨迹数据,计算目标人员的轨迹数据中轨迹点到指定活动路线的距离,并过滤掉超出指定活动距离的轨迹数据,然后统计每个目标人员去重后的活动网格数量,判断并输出所有满足路线碰撞条件的路线频繁活动者,即可获得行为轨迹库中路线碰撞分析的分析结果,实现精准分析目标活动路线上的路线频繁活动者。
2、本发明实现对海量地理位置不精确的轨迹数据的高效清洗。
本发明通过map函数将海量行为轨迹数据切分成若干时间段和空间网格,并将切分好的数据转换成Key-value格式,通过groupByKey函数聚合属于同一时间段以及网格的轨迹数据,通过flatMap函数清洗groupByKey函数聚合的轨迹数据,所有操作基于ApacheSpark计算引擎,可快速完成海量行为轨迹数据的清洗;另一方面,经过清洗的轨迹数据将被压缩处理,入库存储效率高,利于轨迹数据的后续使用。
以上仅为本发明的较佳实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于行为轨迹库的路线碰撞分析方法,其特征在于,包括以下步骤:
步骤S101,设置目标人员以及路线碰撞分析参数;
步骤S102,根据上述路线碰撞分析参数计算目标人员所覆盖的所有活动网格数量;
步骤S103,根据上述路线碰撞分析参数以及活动网格过滤行为轨迹库中目标人员的轨迹数据,并输出该轨迹数据至下一环节;
步骤S104,计算步骤S103输出的轨迹数据中的轨迹点到指定活动路线的距离,过滤掉上述距离超出指定活动距离的轨迹数据,并将过滤后的轨迹数据输出至下一环节;
步骤S105,统计每个目标人员去重后的活动网格数量,并判断目标人员是否满足路线碰撞条件;
步骤S106,输出所有满足路线碰撞条件的路线频繁活动者。
2.根据权利要求1所述的基于行为轨迹库的路线碰撞分析方法,其特征在于,所述步骤S101中的路线碰撞分析参数包括目标活动路线、目标活动距离、目标活动时间范围以及最少匹配活动网格数。
3.根据权利要求2所述的基于行为轨迹库的路线碰撞分析方法,其特征在于,所述步骤S102通过计算所述目标活动路线和目标活动距离所覆盖的所有活动网格,实现目标人员的所有活动网格数量的数据计算。
4.根据权利要求2所述的基于行为轨迹库的路线碰撞分析方法,其特征在于,所述步骤S103通过过滤处于所述目标活动时间范围内以及目标活动网格内的轨迹数据,实现目标人员的轨迹数据的数据过滤。
5.根据权利要求4所述的基于行为轨迹库的路线碰撞分析方法,其特征在于,所述步骤S103通过filter函数执行在行为轨迹库中将处于所述目标活动时间范围内以及目标活动网格内的轨迹数据的数据过滤处理。
6.根据权利要求2所述的基于行为轨迹库的路线碰撞分析方法,其特征在于,所述步骤S104中的指定活动路线即为所述目标活动路线;所述步骤S104中的指定活动距离即为所述目标活动距离。
7.根据权利要求6所述的基于行为轨迹库的路线碰撞分析方法,其特征在于,所述步骤S104通过filter函数执行过滤掉轨迹点到指定活动路线的距离超出目标活动距离的轨迹数据的数据过滤处理。
8.根据权利要求2所述的基于行为轨迹库的路线碰撞分析方法,其特征在于,所述步骤S105中的路线碰撞条件为目标人员去重后的活动网格数量大于或等于所述最少匹配活动网格数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910267358.3A CN109947758B (zh) | 2019-04-03 | 2019-04-03 | 一种基于行为轨迹库的路线碰撞分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910267358.3A CN109947758B (zh) | 2019-04-03 | 2019-04-03 | 一种基于行为轨迹库的路线碰撞分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109947758A true CN109947758A (zh) | 2019-06-28 |
CN109947758B CN109947758B (zh) | 2021-02-09 |
Family
ID=67013710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910267358.3A Active CN109947758B (zh) | 2019-04-03 | 2019-04-03 | 一种基于行为轨迹库的路线碰撞分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109947758B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489400A (zh) * | 2019-08-23 | 2019-11-22 | 武汉白虹软件科技有限公司 | 一种实现人车采集数据准实时关联的算法模型 |
CN110933605A (zh) * | 2019-11-26 | 2020-03-27 | 武汉虹旭信息技术有限责任公司 | 移动目标的挖掘方法及装置 |
CN111625591A (zh) * | 2020-05-15 | 2020-09-04 | 深圳市甲易科技有限公司 | 一种实现信息可视化的轨迹规律分析方法 |
CN112101234A (zh) * | 2020-09-16 | 2020-12-18 | 上海寰创通信科技股份有限公司 | 一种侦码匹配处理方法和图码联侦系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130046722A1 (en) * | 2008-04-11 | 2013-02-21 | Trevor Hanson | Message conduit systems with algorithmic data stream control and methods for processing thereof |
CN105427586A (zh) * | 2015-12-16 | 2016-03-23 | 武汉烽火众智数字技术有限责任公司 | 一种基于多轨迹碰撞的车辆落脚点分析方法 |
CN107133269A (zh) * | 2017-04-01 | 2017-09-05 | 中国人民解放军国防科学技术大学 | 基于移动目标的频繁位置轨迹生成方法及装置 |
CN108536851A (zh) * | 2018-04-16 | 2018-09-14 | 武汉大学 | 一种基于移动轨迹相似度比较的用户身份识别方法 |
-
2019
- 2019-04-03 CN CN201910267358.3A patent/CN109947758B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130046722A1 (en) * | 2008-04-11 | 2013-02-21 | Trevor Hanson | Message conduit systems with algorithmic data stream control and methods for processing thereof |
CN105427586A (zh) * | 2015-12-16 | 2016-03-23 | 武汉烽火众智数字技术有限责任公司 | 一种基于多轨迹碰撞的车辆落脚点分析方法 |
CN107133269A (zh) * | 2017-04-01 | 2017-09-05 | 中国人民解放军国防科学技术大学 | 基于移动目标的频繁位置轨迹生成方法及装置 |
CN108536851A (zh) * | 2018-04-16 | 2018-09-14 | 武汉大学 | 一种基于移动轨迹相似度比较的用户身份识别方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489400A (zh) * | 2019-08-23 | 2019-11-22 | 武汉白虹软件科技有限公司 | 一种实现人车采集数据准实时关联的算法模型 |
CN110933605A (zh) * | 2019-11-26 | 2020-03-27 | 武汉虹旭信息技术有限责任公司 | 移动目标的挖掘方法及装置 |
CN110933605B (zh) * | 2019-11-26 | 2021-09-28 | 武汉虹旭信息技术有限责任公司 | 移动目标的挖掘方法及装置 |
CN111625591A (zh) * | 2020-05-15 | 2020-09-04 | 深圳市甲易科技有限公司 | 一种实现信息可视化的轨迹规律分析方法 |
CN112101234A (zh) * | 2020-09-16 | 2020-12-18 | 上海寰创通信科技股份有限公司 | 一种侦码匹配处理方法和图码联侦系统 |
CN112101234B (zh) * | 2020-09-16 | 2022-11-22 | 上海寰创通信科技股份有限公司 | 一种侦码匹配处理方法和图码联侦系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109947758B (zh) | 2021-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109947758A (zh) | 一种基于行为轨迹库的路线碰撞分析方法 | |
CN109977109A (zh) | 一种轨迹数据清洗方法及伴随分析方法 | |
CN109977108A (zh) | 一种基于行为轨迹库的多种轨迹碰撞分析方法 | |
CN110019175A (zh) | 一种基于行为轨迹库的区域碰撞分析方法 | |
CN108961747B (zh) | 一种不完备卡口数据条件下的城市道路交通状态信息提取方法 | |
CN108322891B (zh) | 基于用户手机信令的交通区域拥堵识别方法 | |
CN106792523B (zh) | 一种基于大规模WiFi活动轨迹的异常行为检测方法 | |
CN104484993A (zh) | 用于交通小区划分的手机信令信息的处理方法 | |
CN105243844A (zh) | 一种基于手机信令的道路状态识别方法 | |
CN107610469A (zh) | 一种考虑多因素影响的日维度区域交通指数预测方法 | |
CN107548082A (zh) | 一种质差区域分析的方法、装置及系统 | |
CN107979809A (zh) | 一种根据分布式移动基站和边缘计算的指纹定位方法 | |
CN106921507A (zh) | 在无线通信网络中对用户投诉进行预测的方法和装置 | |
CN108519465B (zh) | 一种基于大数据的空气污染智能监测系统 | |
CN106651031B (zh) | 基于历史信息的雷击闪络预警方法及系统 | |
CN111294742B (zh) | 基于信令cdr数据识别伴随手机号码的方法与系统 | |
CN110516866B (zh) | 一种用于城市轨交列车拥挤度的实时估计方法 | |
CN103888961B (zh) | 一种用户监控方法及装置 | |
CN112816380A (zh) | 基于大数据分析的建筑工程工地施工环境在线监测方法及监测云平台 | |
CN105630842B (zh) | 建立空气质量信息数据库、确定受污染信息的方法及装置 | |
CN108733774A (zh) | 一种基于大数据的失业人口动态监测方法 | |
CN111950798A (zh) | 一种基于小波神经网络的区域短期人流量趋势预测方法及其系统 | |
CN110196215A (zh) | 花粉粉层浓度和种类实时监测系统及方法 | |
CN107330268B (zh) | 一种北半球阻塞高压活动的识别方法 | |
CN105118332A (zh) | 一种基于聚类分析法的空中交通管制模拟仿真异常检测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |