CN115422306A - 一种基于大数据结合地图进行多维数据碰撞挖掘的方法 - Google Patents
一种基于大数据结合地图进行多维数据碰撞挖掘的方法 Download PDFInfo
- Publication number
- CN115422306A CN115422306A CN202210733226.7A CN202210733226A CN115422306A CN 115422306 A CN115422306 A CN 115422306A CN 202210733226 A CN202210733226 A CN 202210733226A CN 115422306 A CN115422306 A CN 115422306A
- Authority
- CN
- China
- Prior art keywords
- collision
- information
- time
- space
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24552—Database cache management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Remote Sensing (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供一种基于大数据结合地图进行多维数据碰撞挖掘的方法,属于海量时空数据挖掘分析技术领域,本发明依托轨迹大数据、PGIS地图,以事件中心现场为基准,在地图上通过可视化图形拖拽选定搜索范围,筛选出指定时空范围内人、车、物、证、码的轨迹活动数据,对多个搜索结果集合进行碰撞研判,既支持对单一类型活动轨迹的碰撞,又支持根据人车物证码内在关联关系,对全数据类型进行多维碰撞;支持与目标人员、关联人员等重点人员库进行关联,优先展现碰撞命中率较高的重点人员,提供辅助决策。
Description
技术领域
本发明涉及海量时空数据挖掘分析技术领域,尤其涉及一种基于大数据结合地图进行多维数据碰撞挖掘的方法。
背景技术
随着各地信息化建设的快速推进,各地已经逐步建设了平台,通过各类专用应用,结合物联网的实时感知设备,例如:卡口、视频监控、电子围栏、网络围栏、卫星定位、RFID等,积累了海量的人员、车辆以及物品的时空轨迹与行为数据,但是这些数据的存储和使用都是在各个孤立的应用系统和专有网络内,形成了大量的信息孤岛。在当今互联网思维引导下,对于各类时空轨迹数据应进行融合统一,并深度挖掘不同类型轨迹行为之间的关联,数据联网共享已成为常态需求。
发明内容
为了解决以上技术问题,本发明提供了一种基于大数据结合地图进行多维数据碰撞挖掘的方法。深度探索不同类型轨迹行为之间的关联,缩小破解范围,提高搜索效率,为研判提供辅助决策。
本发明的技术方案是:
一种基于大数据结合地图进行多维数据碰撞挖掘的方法,包括以下步骤:
a)整合并预处理基础数据
b)基于地图进行交互式拖拽搜索
c)根据实际需求进行多次搜索
d)对缓存的多次碰撞结果集进行多维碰撞
e)对多维碰撞结果进行研判。
进一步的,
整合并预处理基础数据,整合并预处理人员基本信息、车辆基本信息、手机基本信息、目标人员信息、关联人员信息、物联网实时感知设备信息、时空轨迹信息、案件基本信息等相关数据。
进一步的,
基于地图进行交互式拖拽搜索,b1.输入案件编号,地图自动定位于事发中心,亦可直接缩放拖动地图至事发周边。b2.拖动鼠标在事发中心周边选定搜索区域,支持圆形、矩形、不规则多边形等区域搜索,基于GeoHash算法进行地理位置搜索,过滤出选定地理位置范围内感知设备信息集合。b3.对b2步骤中感知设备集合进行筛选,排除个别干扰条目,提高搜索效率。b4.选定轨迹活动时间搜索起止范围。b5.依据选定的感知设备信息、轨迹活动时间起止范围与时空轨迹信息进行碰撞,保留选定感知设备在所选时间范围内采集到的时空轨迹信息。b6.缓存b5 步骤中碰撞出的时空轨迹信息结果集R1。
进一步的,
根据实际需求进行多次搜索,上述步骤b1-b6为单次完整碰撞搜索过程,依据实际需求选取其他时空范围进行碰撞搜索,缓存每次碰撞搜索结果分别为R2、R3、 R4、R5……Rn,总次数记为n次。
进一步的,
对缓存的多次碰撞结果集进行多维碰撞,d1.单一类型碰撞,对前述步骤b、c 中缓存的结果集R1,R2,R3,R4,R5……Rn进行遍历,以时空轨迹信息中的轨迹活动对象唯一标识ID进行分组归类,记录该唯一标识ID所被包含在内的结果集 [Rx,Ry,Rz……],结果集个数记为m。d2.多类型复合碰撞,对前述步骤b、c中缓存的结果集R1,R2,R3,R4,R5……Rn进行遍历,首先根据车辆基本信息中的车主身份证号、手机基本信息中的机主身份证号作为关联标识,统一转换为人员身份证号作为唯一标识ID,然后将结果集R1,R2,R3,R4,R5……Rn所有时空轨迹信息以人员身份证号码进行分组归类,记录该身份证号所被包含在内的结果集[Rx,Ry,Rz……],结果集个数记为m。
进一步的,
对多维碰撞结果进行研判,对前述步骤c中的搜索次数n作为总次数,d中结果集个数m作为命中次数,求得轨迹碰撞命中率为(m/n*100%),根据命中率由高到低排列,同时将结果与目标人员信息、关联人员信息进行碰撞,优先选择命中率较高且是目标人员、关联人员或其他重点人员类型的轨迹活动对象作为进一步研判关注对象;对于多个同时命中率较高且命中集合相似的人员、车辆、手机等可进一步作为时空轨迹伴随研判的依据。
本发明的有益效果是
该方法能够整合现有多种类型的时空轨迹与行为数据,将时空轨迹活动的对象、时间、空间、行为等统一标准化,同时结合PGIS地图直观展现,利用地图的可视化交互简化操作,对时空轨迹数据进行碰撞挖掘,深度探索不同类型轨迹行为之间的关联,同时加入人员的主观研判,缩小破解范围,提高搜索效率,有利于对作案手法相似的串并案研判、轨迹碰撞、轨迹伴随等多种业务场景研判提供辅助决策。
附图说明
图1是本发明的工作流程示意图;
图2是单次基于地图进行交互式拖拽搜索的过程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于大数据结合地图进行多维数据碰撞挖掘的方法,包括以下步骤:
a)整合并预处理基础数据:
整合并预处理人员基本信息、车辆基本信息、手机基本信息、目标人员信息、关联人员信息、物联网实时感知设备信息、时空轨迹信息、案件基本信息等相关数据:
a1人员基本信息:包括人员姓名、身份证号、性别、年龄、民族、文化程度、籍贯、家庭住址等信息。
a2车辆基本信息:包括车辆号牌号码、号牌种类、车身颜色、品牌、型号、车主身份证号、车主姓名等信息。
a3手机基本信息:包括手机号码、机主身份证号、机主姓名、IMSI码、IMEI 码等信息。
a4目标人员信息:包括目标人员姓名、身份证号、性别等关键信息。
a5关联人员信息:包括关联人员姓名、身份证号、性别、关联案件类型等关键信息;可根据实际业务需求扩展为其他类型的重点人员、车辆、手机等信息,比如重点关注人员信息、被盗车辆信息、被盗手机信息等
a6物联网实时感知设备信息:包括设备类型(例如卡口、视频监控、电子围栏等)、设备编号、设备所在地点名称、设备所在地址、基于PGIS地图统一坐标系的坐标经纬度、所属行政区划等信息。
a7时空轨迹信息:包括
■轨迹活动对象唯一标识ID,例如身份证号、车辆号牌号码+号牌种类、手机号、手机IMSI码、手机IMEI码等;
■轨迹活动类型:例如卡口过车、人脸识别采集、入住宾馆、网吧上网、手机开机、手机关机、手机基站通信、电子围栏采集、银行卡刷卡、公交刷卡、医保刷卡等;
■轨迹活动发生时间:物联网实时感知设备采集数据的时间,例如卡口过车时间、人脸识别采集时间、宾馆入住登记时间、电子围栏采集时间;
■轨迹活动发生地点:即物联网实时感知设备所在地点坐标经纬度;
■其他信息:为提高搜索效率,冗余存储一些附加信息,比如人员姓名、地点名称、地址等;
a8案件基本信息:包括案件编号、名称、发生时间、发生地点、坐标经纬度等。
b)基于地图进行交互式拖拽搜索:
b1输入案件编号,地图自动定位于事发中心,亦可直接缩放拖动地图至事发周边。
b2拖动鼠标在事发中心周边选定搜索区域,支持圆形、矩形、不规则多边形等区域搜索,基于GeoHash算法进行地理位置搜索,过滤出选定地理位置范围内感知设备信息集合。
b3对b2步骤中感知设备集合进行筛选,排除个别干扰条目,提高搜索效率。
b4选定轨迹活动时间搜索起止范围。
b5依据选定的感知设备信息、轨迹活动时间起止范围与时空轨迹信息进行碰撞,保留选定感知设备在所选时间范围内采集到的时空轨迹信息。
b6缓存b5步骤中碰撞出的时空轨迹信息结果集R1
c)根据实际需求进行多次搜索
上述步骤b1-b6为单次完整碰撞搜索过程,依据实际需求选取其他时空范围进行碰撞搜索,缓存每次碰撞搜索结果分别为R2、R3、R4、R5……Rn,总次数记为 n次。
d)对缓存的多次碰撞结果集进行多维碰撞
d1单一类型碰撞
对前述步骤b、c中缓存的结果集R1,R2,R3,R4,R5……Rn进行遍历,以时空轨迹信息中的轨迹活动对象唯一标识ID进行分组归类,记录该唯一标识ID所被包含在内的结果集[Rx,Ry,Rz……],结果集个数记为m。
d2多类型复合碰撞
对前述步骤b、c中缓存的结果集R1,R2,R3,R4,R5……Rn进行遍历,首先根据车辆基本信息中的车主身份证号、手机基本信息中的机主身份证号作为关联标识,统一转换为人员身份证号作为唯一标识ID,然后将结果集R1,R2,R3,R4,R5…… Rn所有时空轨迹信息以人员身份证号码进行分组归类,记录该身份证号所被包含在内的结果集[Rx,Ry,Rz……],结果集个数记为m
e)对多维碰撞结果进行研判
对前述步骤c中的搜索次数n作为总次数,d中结果集个数m作为命中次数,求得轨迹碰撞命中率为(m/n*100%),根据命中率由高到低排列,同时将结果与目标人员信息、关联人员信息进行碰撞,优先选择命中率较高且是目标人员、关联人员或其他重点人员类型的轨迹活动对象作为进一步研判关注对象;对于多个同时命中率较高且命中集合相似的人员、车辆、手机等可进一步作为时空轨迹伴随研判的依据。
以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (8)
1.一种基于大数据结合地图进行多维数据碰撞挖掘的方法,其特征在于,
包括以下步骤:
a)整合并预处理基础数据;
b)基于地图进行交互式拖拽搜索;
c)根据实际需求进行多次搜索;
d)对缓存的多次碰撞结果集进行多维碰撞;
e)对多维碰撞结果进行研判。
2.根据权利要求1所述的方法,其特征在于,
整合并预处理基础数据,整合并预处理人员基本信息、车辆基本信息、手机基本信息、目标人员信息、关联人员信息、物联网实时感知设备信息、时空轨迹信息、案件基本信息。
3.根据权利要求1所述的方法,其特征在于,
基于地图进行交互式拖拽搜索
b1.输入案件编号,地图自动定位于事发中心,亦可直接缩放拖动地图至事发周边;
b2.拖动鼠标在事发中心周边选定搜索区域,支持圆形、矩形、不规则多边形等区域搜索,基于GeoHash算法进行地理位置搜索,过滤出选定地理位置范围内感知设备信息集合;
b3.对b2步骤中感知设备集合进行筛选,排除干扰条目;
b4.选定轨迹活动时间搜索起止范围;
b5.依据选定的感知设备信息、轨迹活动时间起止范围与时空轨迹信息进行碰撞,保留选定感知设备在所选时间范围内采集到的时空轨迹信息;
b6.缓存b5步骤中碰撞出的时空轨迹信息结果集R1。
4.根据权利要求3所述的方法,其特征在于,
根据实际需求进行一次以上的搜索,上述步骤b1-b6为单次完整碰撞搜索过程,依据实际需求选取其他时空范围进行碰撞搜索,缓存每次碰撞搜索结果分别为R2、R3、R4、R5……Rn,总次数记为n次。
5.根据权利要求4所述的方法,其特征在于,
对缓存的数次碰撞结果集进行多维碰撞
d1.单一类型碰撞,对前述步骤b)、c)中缓存的结果集R1,R2,R3,R4,R5……Rn进行遍历,以时空轨迹信息中的轨迹活动对象唯一标识ID进行分组归类,记录该唯一标识ID所被包含在内的结果集[Rx,Ry,Rz……],结果集个数记为m;
d2.多类型复合碰撞,对前述步骤b)、c)中缓存的结果集R1,R2,R3,R4,R5……Rn进行遍历,首先根据车辆基本信息中的车主身份证号、手机基本信息中的机主身份证号作为关联标识,统一转换为人员身份证号作为唯一标识ID,然后将结果集R1,R2,R3,R4,R5……Rn所有时空轨迹信息以人员身份证号码进行分组归类,记录该身份证号所被包含在内的结果集[Rx,Ry,Rz……],结果集个数记为m。
6.根据权利要求5所述的方法,其特征在于,
对多维碰撞结果进行研判,对前述步骤c)中的搜索次数n作为总次数,d)中结果集个数m作为命中次数,求得轨迹碰撞命中率为(m/n*100%),根据命中率由高到低排列。
7.根据权利要求6所述的方法,其特征在于,
将结果与目标人员信息、关联人员信息进行碰撞,优先选择命中率最高且是目标人员、关联人员或其他重点人员类型的轨迹活动对象作为进一步研判关注对象。
8.根据权利要求7所述的方法,其特征在于,
对于数个同时命中率较高且命中集合相似的人员、车辆、手机等可进一步作为时空轨迹伴随研判的依据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210733226.7A CN115422306A (zh) | 2022-06-27 | 2022-06-27 | 一种基于大数据结合地图进行多维数据碰撞挖掘的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210733226.7A CN115422306A (zh) | 2022-06-27 | 2022-06-27 | 一种基于大数据结合地图进行多维数据碰撞挖掘的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115422306A true CN115422306A (zh) | 2022-12-02 |
Family
ID=84196450
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210733226.7A Pending CN115422306A (zh) | 2022-06-27 | 2022-06-27 | 一种基于大数据结合地图进行多维数据碰撞挖掘的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115422306A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115687460A (zh) * | 2023-01-04 | 2023-02-03 | 北京码牛科技股份有限公司 | 利用轨迹数据挖掘重点人群的关联对象的方法及系统 |
CN118227856A (zh) * | 2023-11-24 | 2024-06-21 | 广东汇通信息科技股份有限公司 | 一种基于多维感知的态势预警分析可视化系统及方法 |
CN118227856B (zh) * | 2023-11-24 | 2024-10-22 | 广东汇通信息科技股份有限公司 | 一种基于多维感知的态势预警分析可视化系统及方法 |
-
2022
- 2022-06-27 CN CN202210733226.7A patent/CN115422306A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115687460A (zh) * | 2023-01-04 | 2023-02-03 | 北京码牛科技股份有限公司 | 利用轨迹数据挖掘重点人群的关联对象的方法及系统 |
CN118227856A (zh) * | 2023-11-24 | 2024-06-21 | 广东汇通信息科技股份有限公司 | 一种基于多维感知的态势预警分析可视化系统及方法 |
CN118227856B (zh) * | 2023-11-24 | 2024-10-22 | 广东汇通信息科技股份有限公司 | 一种基于多维感知的态势预警分析可视化系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Hunting or waiting? Discovering passenger-finding strategies from a large-scale real-world taxi dataset | |
Zhang et al. | Understanding taxi service strategies from taxi GPS traces | |
CN111582948B (zh) | 一种基于手机信令数据与poi兴趣点的个体行为分析方法 | |
CN106503714B (zh) | 一种基于兴趣点数据识别城市功能区的方法 | |
CN108280550B (zh) | 一种比较公共自行车站点社区划分的可视分析方法 | |
CN107832364B (zh) | 一种基于时空数据锁定目标对象的方法及装置 | |
CN110674238B (zh) | 一种基于大数据的禁毒情报研判系统 | |
CN104167092A (zh) | 一种确定出租车上下客热点区域中心的方法以及装置 | |
CN111930868A (zh) | 一种基于多维数据采集的大数据行为轨迹分析方法 | |
CN106339716A (zh) | 一种基于加权欧氏距离的移动轨迹相似度匹配方法 | |
CN109978215B (zh) | 巡防管理方法和装置 | |
CN110716935A (zh) | 基于网约车出行的轨迹数据分析与可视化方法及系统 | |
CN105991598A (zh) | 用户获取方法及装置 | |
CN109034187A (zh) | 一种用户家庭工作地址挖掘流程 | |
CN115422306A (zh) | 一种基于大数据结合地图进行多维数据碰撞挖掘的方法 | |
CN115311894A (zh) | 基于大数据分析的智慧停车管理方法、系统、终端及介质 | |
CN111475746B (zh) | 兴趣点位置挖掘方法、装置、计算机设备和存储介质 | |
CN111343419B (zh) | 基于社会面监控摄像头的城市安防系统 | |
CN114510826A (zh) | 车辆排放结构分解方法、装置、电子设备及存储介质 | |
Wan et al. | Taxi origin-destination areas of interest discovering based on functional region division | |
CN111651664A (zh) | 一种基于事故位置点的事故车辆定位方法、装置、存储介质及终端 | |
CN113470369B (zh) | 一种基于多维度信息判断套牌车辆真实号牌的方法及系统 | |
CN113313307A (zh) | 基于信令大数据的旅游路线挖掘方法 | |
CN112052405B (zh) | 一种基于司机经验的寻客区域推荐方法 | |
CN113573238A (zh) | 一种基于手机信令的联程旅客出行链识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |