CN114996598B - 一种基于通信大数据的时空关联分析方法、装置及设备 - Google Patents

一种基于通信大数据的时空关联分析方法、装置及设备 Download PDF

Info

Publication number
CN114996598B
CN114996598B CN202210913511.7A CN202210913511A CN114996598B CN 114996598 B CN114996598 B CN 114996598B CN 202210913511 A CN202210913511 A CN 202210913511A CN 114996598 B CN114996598 B CN 114996598B
Authority
CN
China
Prior art keywords
time
space
grid
mobile phone
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210913511.7A
Other languages
English (en)
Other versions
CN114996598A (zh
Inventor
乐鹏
于大宇
上官博屹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN202210913511.7A priority Critical patent/CN114996598B/zh
Publication of CN114996598A publication Critical patent/CN114996598A/zh
Application granted granted Critical
Publication of CN114996598B publication Critical patent/CN114996598B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提供一种基于通信大数据的时空关联分析方法、装置及设备,包括城市网格划分;时间区间划分;构建手机信令数据模型;构建时空轨迹数据模型;构建分布式数据库;实时手机信令流数据插值与入库;查询指定人员在指定时间范围内的活动过的时空轨迹与空间网格;并行查询一个空间网格中的信令到内存;计算空间网格中在内存中人员集合的时间轨迹;判断空间网格中的一条时间轨迹与指定人员的时间轨迹是否具有关联关系;对内存中人员集合的时间轨迹分块,直到寻找出所有的时空关联人员,能够实现千万级手机信令数据秒级入库,快速检索出指定人员的时空关联人员。

Description

一种基于通信大数据的时空关联分析方法、装置及设备
技术领域
本发明属于移动对象数据处理领域,尤其涉及一种基于通信大数据的时空关联分析方法、装置及设备。
背景技术
随着移动通信技术、智能手机和导航定位技术的发展与普及,高密度的通讯基站产生了海量、高频的手机信令数据。信令数据由手机号、时间戳和经纬度构成,隐含了每个手机使用者的时空轨迹。快速普及的移动设备、不断升级的通信技术和定位技术,极大地扩展了移动轨迹数据的来源,为时空关联分析、轨迹数据挖掘提供了重要的有利基础。
在这些大规模通信数据的积累下,有关时空关联分析、轨迹数据挖掘拥有巨大市场。依赖时空关联分析技术,一系列应用利用人类的迁徙或活动规律、车辆、动物、大气环境等的移动特征投入运用到诸多领域,如社交网络、交通管理、科学研究等。然而,目前尚未有高效的、快速的利用通信大数据进行时空关联分析的方法,已有部分研究通过计算两条轨迹的相似性来比较两条轨迹的实体对象是否具有关联,这些方法时间和空间复杂度较大,无法在直接用于通信大数据的时空关联分析问题。这主要是由于千万级人口的特大城市在5秒采样间隔下,多天累计的信令数据规模超万亿级。在这种大数据规模下,进行时空轨迹关联分析是一个极其耗时且复杂的工作。
发明内容
本发明提供了一种基于通信大数据的时空关联分析方法、装置及设备,能够实现千万级手机信令数据秒级入库,能够快速从特大城市的万亿级信令数据中检索出与指定人员的有时间关联的人员。
本发明通过以下技术方案实现的:
一种基于通信大数据的时空关联分析方法,包括以下步骤:
步骤1、城市网格划分,基于指定的网格划分方法与网格分辨率
Figure 171307DEST_PATH_IMAGE001
,将指定城市的 空间范围划分为
Figure 885185DEST_PATH_IMAGE002
个空间网格,并对所有空间网格进行编码;
步骤2、时间区间划分,基于指定的时间区间长度
Figure 71447DEST_PATH_IMAGE003
,划分
Figure 997814DEST_PATH_IMAGE004
个时间区间,并对所 有时间区间进行编码;
步骤3、构建面向人员活动轨迹快速查找的手机信令数据模型,手机信令数据模型中包括多个手机信令数据,所有的手机信令数据按时间节点分开组织;
步骤4、构建面向快速时空关联分析的时空轨迹数据模型,时空轨迹数据模型包括多个时空轨迹点,所有的时空轨迹点按时间节点分开组织,按所述步骤1和2划分的空间网格和时间区间,每一时间节点的手机信令数据生成的时空轨迹点被组织为一系列时空单元的集合;
步骤5、对所述步骤3中的手机信令数据模型和步骤4中的时空轨迹数据模型构建分布式数据库,并对手机信令数据和时空轨迹点分别建立索引结构;
步骤6、实时手机信令流数据插值与入库;
步骤7、查询指定人员a在指定时间范围内的时空轨迹
Figure 484291DEST_PATH_IMAGE005
与活动过的空间网格,人 员a活动过的空间网格编码集合为
Figure 978857DEST_PATH_IMAGE006
,空间网格编码集合
Figure 777049DEST_PATH_IMAGE007
包括多个空间网格
Figure 146588DEST_PATH_IMAGE008
步骤8、剔除人员a短暂停留的空间网格,更新空间网格编码集合
Figure 221991DEST_PATH_IMAGE009
步骤9、并行查询一个空间网格
Figure 746513DEST_PATH_IMAGE010
中与
Figure 172947DEST_PATH_IMAGE011
有交集的时空单元中的轨迹点到内存;
步骤10、计算空间网格
Figure 441117DEST_PATH_IMAGE010
中与
Figure 371027DEST_PATH_IMAGE012
有交集的时空单元中人员
Figure 994948DEST_PATH_IMAGE013
的时间轨迹;
步骤11、判断
Figure 33311DEST_PATH_IMAGE014
中的一条时间轨迹与人员a的时间轨迹是否具有关联关系;
步骤12、并行计算
Figure 714959DEST_PATH_IMAGE014
中人员a的时空关联人员,对人员集合
Figure 889589DEST_PATH_IMAGE014
分块,采用并行的方 法迭代计算所述步骤11,直至
Figure 631280DEST_PATH_IMAGE014
中的每个人员均被计算完毕;
步骤13、并行计算人员a的所有时空关联人员,对所述步骤8中更新后的空间网格 编码集合
Figure 32305DEST_PATH_IMAGE015
分块,采用并行的方法迭代所述步骤9-12,直至
Figure 642278DEST_PATH_IMAGE016
中每个空间网格被计算完 毕,以寻找出所有的时空关联人员。
进一步地,在步骤3中,构建面向人员活动轨迹快速查找的手机信令数据模型,手 机信令数据
Figure 45315DEST_PATH_IMAGE017
被组织为:
Figure 348121DEST_PATH_IMAGE018
其中,IMSI为国际移动用户识别码,TIME为UNIX时间戳,LONGITUDE为经度,LATITUDE为纬度,int64代表64位整型,double代表双精度浮点型;
所有的手机信令数据集合
Figure 970863DEST_PATH_IMAGE019
按时间节点分开组织:
Figure 384527DEST_PATH_IMAGE020
其中,
Figure 143535DEST_PATH_IMAGE021
为已有的手机信令数据所跨越的时间节点数,
Figure 758187DEST_PATH_IMAGE022
为第
Figure 727280DEST_PATH_IMAGE023
个时间节点的
Figure 318537DEST_PATH_IMAGE024
集合。
进一步地,在步骤4中,构建面向快速时空关联分析的时空轨迹数据模型,设人员 的一个时空轨迹点
Figure 322265DEST_PATH_IMAGE025
为:
Figure 842239DEST_PATH_IMAGE026
其中,GRID_IX为空间网格编码,string代表字符串类型;
所有的时空轨迹点集合
Figure 439573DEST_PATH_IMAGE027
按时间节点分开组织:
Figure 195040DEST_PATH_IMAGE028
其中,
Figure 663061DEST_PATH_IMAGE029
为已有的手机信令数据所跨越的时间节点数,
Figure 744150DEST_PATH_IMAGE030
为第
Figure 61736DEST_PATH_IMAGE031
个时间节点的
Figure 620894DEST_PATH_IMAGE032
集合;
按所述步骤1和2划分的空间网格和时间区间,每一时间节点的
Figure 209001DEST_PATH_IMAGE024
生成的
Figure 70778DEST_PATH_IMAGE032
数据被组织为一系列时空单元的集合
Figure 767338DEST_PATH_IMAGE033
Figure 739974DEST_PATH_IMAGE034
其中,
Figure 572800DEST_PATH_IMAGE035
对于
Figure 104014DEST_PATH_IMAGE036
Figure 897657DEST_PATH_IMAGE037
其中,GRID_IX和TIME_IX为所述步骤1和2中的空间网格和时间区间编码, TRACKPOINTS为隶属于该时空单元内的所有
Figure 64196DEST_PATH_IMAGE038
集合,array代表数组或者列 表类型。
进一步地,在步骤5中,将步骤3中的手机信令数据模型和步骤4中的时空轨迹数据模型转换为适应于指定分布式数据库的逻辑模型Schema,基于Schema构建分布式数据库,并对步骤3中的IMSI字段和步骤4中的GRID_IX字段分别建立索引结构。
进一步地,在步骤6中,设手机产生通讯过程中手机信令数据平均采样间隔为
Figure 361317DEST_PATH_IMAGE039
, 手机没有产生通讯过程中信令数据平均采样间隔为
Figure 830475DEST_PATH_IMAGE040
Figure 970470DEST_PATH_IMAGE041
,对来自移动电话基站 的手机信令流数据,在内存中分时间段
Figure 49022DEST_PATH_IMAGE042
缓存,由于采集的信令数据时间间隔并不完全 一致,因此
Figure 590861DEST_PATH_IMAGE042
时间段内存在部分人的信令数据过少,对这些人的信令数据进行插值,若一 个人在
Figure 230921DEST_PATH_IMAGE042
时间段内O域数据个数小于
Figure 858212DEST_PATH_IMAGE043
,则对该人在
Figure 976341DEST_PATH_IMAGE042
时间段内O域数据进行时间插值, 使其个数等于
Figure 513632DEST_PATH_IMAGE044
,之后,计算每个
Figure 183648DEST_PATH_IMAGE045
所属的空间网格和时间区间的编码,计算每个
Figure 672136DEST_PATH_IMAGE046
对应的
Figure 718589DEST_PATH_IMAGE038
,将这些
Figure 110388DEST_PATH_IMAGE047
Figure 951305DEST_PATH_IMAGE048
在内存中分别 按
Figure 694133DEST_PATH_IMAGE049
和时空单元
Figure 419643DEST_PATH_IMAGE050
组织,每间隔
Figure 790582DEST_PATH_IMAGE051
时间,将其并行插入到步骤5中的分布式数据库中。
进一步地,在步骤7中,已知人员a的IMSI为pid,在指定的时间范围内,利用步骤5 的分布式数据库快速寻找出人员a的时空轨迹
Figure 176301DEST_PATH_IMAGE052
,人员a活动过的空间网格编码集合
Figure 140846DEST_PATH_IMAGE053
为:
Figure 529102DEST_PATH_IMAGE054
其中,GRID_IX为空间网格编码;
在步骤8中,采用微分时间的思想,对于
Figure 895493DEST_PATH_IMAGE055
,判断
Figure 78212DEST_PATH_IMAGE056
空间网格中人员a停留的 时间是否超过共同停留时间
Figure 795633DEST_PATH_IMAGE057
Figure 361481DEST_PATH_IMAGE058
其中,
Figure 441432DEST_PATH_IMAGE059
函数用于计算指定IMSI的
Figure 201578DEST_PATH_IMAGE060
在指定空间网格出 现的次数,
Figure 875136DEST_PATH_IMAGE061
为信令数据的平均采样间隔。
进一步地,在步骤10中,计算空间网格
Figure 870774DEST_PATH_IMAGE062
中与
Figure 680598DEST_PATH_IMAGE063
有交集的时空单元中所有人员
Figure 470699DEST_PATH_IMAGE064
的时间轨迹:根据所述步骤9中的IMSI和TIME字段值,该空间网格与
Figure 395668DEST_PATH_IMAGE065
有交集的时空单元 中的人员数量为
Figure 539204DEST_PATH_IMAGE066
Figure 593748DEST_PATH_IMAGE067
中每个人员的时间轨迹为该人员在内存中所有的TIME字段 值的升序集合。
进一步地,在步骤11中,判断步骤10中的一条时间轨迹与人员a的时间轨迹是否具 有关联关系:设人员a的时间轨迹为
Figure 695696DEST_PATH_IMAGE068
,待判断的时间轨迹为
Figure 202901DEST_PATH_IMAGE069
,基于微分时间,对两条时 间轨迹求交,若相交时间大于
Figure 150128DEST_PATH_IMAGE070
且任意一条时间轨迹的时间长度大于
Figure 324758DEST_PATH_IMAGE071
,则
Figure 830563DEST_PATH_IMAGE072
对应的人员 为时空关联人员,计算公式为:
Figure 966009DEST_PATH_IMAGE073
其中,
Figure 575982DEST_PATH_IMAGE074
函数用于计算两条时间轨迹的交点,
Figure 746064DEST_PATH_IMAGE075
为指定的人员a或 待判断者在该网格内累计停留时长,card(.)函数用于计算一个集合的元素个数。
一种基于通信大数据的时空关联分析装置,包括:
网格划分模块,用于基于指定的网格划分方法和网格分辨率
Figure 924235DEST_PATH_IMAGE076
,将指定城市的空 间范围划分为
Figure 671611DEST_PATH_IMAGE077
个空间网格,并对所有空间网格进行编码;
时间划分模块,用于基于指定的时间区间长度
Figure 459177DEST_PATH_IMAGE078
,划分
Figure 342819DEST_PATH_IMAGE079
个时间区间,并对所 有时间区间进行编码;
手机信令数据模型构建模块,用于构建面向人员活动轨迹快速查找的手机信令数据模型,手机信令数据模型中包括多个手机信令数据,所有的手机信令数据按时间节点分开组织;
时空轨迹数据模型构建模块,用于构建面向快速时空关联分析的时空轨迹数据模型,时空轨迹数据模型包括多个时空轨迹点,所有的时空轨迹点按时间节点分开组织,按划分的空间网格和划分的时间区间,每一时间节点的手机信令数据生成的时空轨迹点被组织为一系列时空单元的集合;
数据库模块,用于对手机信令数据模型和时空轨迹数据模型构建分布式数据库,并对手机信令数据和时空轨迹点分别建立索引结构:
手机信令流数据插值与入库模块,用于实时手机信令流数据插值与入库;
轨迹与空间网格查询模块,用于查询人员a在指定时间范围内的时空轨迹
Figure 691892DEST_PATH_IMAGE080
与活 动过的空间网格,人员a活动过的空间网格编码集合为
Figure 926564DEST_PATH_IMAGE081
,空间网格编码集合
Figure 19285DEST_PATH_IMAGE082
包括多 个空间网格
Figure 898379DEST_PATH_IMAGE010
空间网格筛选模块,用于剔除人员a短暂停留的空间网格,更新空间网格编码集合
Figure 542987DEST_PATH_IMAGE015
时空单元读取模块,用于并行查询一个空间网格
Figure 373278DEST_PATH_IMAGE083
中与
Figure 128744DEST_PATH_IMAGE084
有交集的时空单元中 的轨迹点到内存;
时间轨迹计算模块,用于计算空间网格
Figure 127924DEST_PATH_IMAGE083
中与
Figure 818800DEST_PATH_IMAGE084
有交集的时空单元中人员
Figure 762485DEST_PATH_IMAGE085
的时间轨迹;
关联关系计算模块,用于判断
Figure 197008DEST_PATH_IMAGE086
中的一条时间轨迹与人员a的时间轨迹是否具有 关联关系;
单网格时空关联人员计算模块,用于并行计算
Figure 909749DEST_PATH_IMAGE086
中人员a的时空关联人员,对人 员集合
Figure 270061DEST_PATH_IMAGE086
分块,采用并行的方法迭代计算,直至
Figure 701043DEST_PATH_IMAGE086
中的每个人员均被计算完毕;
时空关联人员计算模块,用于并行计算人员的所有时空关联人员,对更新后的空 间网格编码集合
Figure 939257DEST_PATH_IMAGE009
分块,采用并行的方法进行迭代,直至
Figure 381871DEST_PATH_IMAGE007
中每个空间网格被计算完毕, 以寻找出所有的时空关联人员。
一种电子设备,包括分布式存储器、处理器以及在存储器中并可在处理器中运行的计算机程序,所述处理器执行计算机程序时实现所述的基于通信大数据的时空关联分析方法的步骤。
与现有技术相比,本发明的优点和有益效果如下:
本发明针对目前尚未提出有效的方法用于从海量的手机信令数据中挖掘出指定人员的时空关联人员,提出一种基于通信大数据的时空关联分析方法、装置及设备,能够实现指定人员的所有时空关联人员的快速计算,能够千万级手机信令数据秒级入库,可一小时内从千万级人口特大城市的万亿级信令数据中高效查找出指定人员的所有时空关联人员。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
图1是本发明实施例提供的一种基于通信大数据的时空关联分析方法的流程图;
图2是本发明实施例提供的一种基于通信大数据的时空关联分析装置的结构示意图;
图3是本发明的实施例提供的基于通信大数据的时空关联分析方法与装置的分析的部分时空关联人员的轨迹示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
第一方面,本发明提供一种基于通信大数据的时空关联分析方法,包括以下步骤:
步骤1、城市网格划分,基于指定的网格划分方法和网格分辨率
Figure 539183DEST_PATH_IMAGE076
,将指定城市的 空间范围划分为
Figure 332826DEST_PATH_IMAGE077
个空间网格,并对所有空间网格进行编码;
步骤2、时间区间划分,基于指定的时间区间长度
Figure 968207DEST_PATH_IMAGE078
,划分
Figure 295021DEST_PATH_IMAGE079
个时间区间,并对 所有时间区间进行编码;
步骤3、构建面向人员活动轨迹快速查找的手机信令数据模型,手机信令数据模型中包括多个手机信令数据,所有的手机信令数据按时间节点分开组织:
步骤4、构建面向快速时空关联分析的时空轨迹数据模型,时空轨迹数据模型包括多个时空轨迹点,所有的时空轨迹点按时间节点分开组织,按所述步骤1和2划分的空间网格和时间区间,每一时间节点的手机信令数据生成的时空轨迹点被组织为一系列时空单元的集合;
步骤5、对所述步骤3中的手机信令数据模型和步骤4中的时空轨迹数据模型构建分布式数据库,并对手机信令数据和时空轨迹点分别建立索引结构;
通过步骤5构建的分布式数据库用于存储海量的信令数据与轨迹点数据,且有利于人员轨迹的快速回溯、手机信令数据与时空轨迹数据的快速时空检索。
步骤6、实时手机信令流数据插值与入库;
通过步骤6在手机信令流式数据入库过程中进行插值,有利于后续步骤的快速计算。
步骤7、查询人员a在指定时间范围内的时空轨迹
Figure 623234DEST_PATH_IMAGE087
与活动过的空间网格,人员a 活动过的空间网格编码集合为
Figure 904174DEST_PATH_IMAGE016
,空间网格编码集合
Figure 484191DEST_PATH_IMAGE016
包括多个空间网格
Figure 26031DEST_PATH_IMAGE083
通过步骤7能够滤除与人员a无关的数据,大幅度减轻了后续步骤的计算量。
步骤8、剔除人员a短暂停留的空间网格,更新空间网格编码集合
Figure 400511DEST_PATH_IMAGE009
通过步骤8进一步缩小了后续步骤的数据量与计算量。
步骤9、并行查询一个空间网格
Figure 293381DEST_PATH_IMAGE083
中与
Figure 644466DEST_PATH_IMAGE084
有交集的时空单元中的轨迹点到内存;
通过步骤9将与人员a轨迹有交集的时空单元的数据导入到内存,便于快速地执行后续步骤。
步骤10、计算空间网格
Figure 306391DEST_PATH_IMAGE083
中与
Figure 851773DEST_PATH_IMAGE084
有交集的时空单元中人员
Figure 966360DEST_PATH_IMAGE086
的时间轨迹;
步骤11、判断
Figure 622600DEST_PATH_IMAGE086
中的一条时间轨迹与人员a的时间轨迹是否具有关联关系;
步骤12、并行计算
Figure 279978DEST_PATH_IMAGE086
中人员a的时空关联人员,对人员集合
Figure 120895DEST_PATH_IMAGE086
分块,采用并行的 方法迭代计算所述步骤11,直至
Figure 120116DEST_PATH_IMAGE086
中的每个人员均被计算完毕;
通过步骤12能够快速查找出人员a在一个空间网格中的所有时空关联人员。
步骤13、并行计算人员a的所有时空关联人员a,对所述步骤8中更新后的空间网格 编码集合
Figure 970260DEST_PATH_IMAGE009
分块,采用并行的方法迭代所述步骤9-12,直至
Figure 216565DEST_PATH_IMAGE007
中每个空间网格被计算完 毕,以寻找出所有的时空关联人员。
通过步骤13能够快速中查找出人员a的所有时空关联人员。
本发明针对目前尚未提出有效的方法用于从海量的手机信令数据中挖掘出指定人员的时空关联人员。本发明提出一种基于通信大数据的时空关联分析方法、装置及设备,实现了指定人员的时空关联人员的快速分析。
本发明设计的基于通信大数据的时空关联分析方法、装置及设备,实现了千万级手机信令数据秒级入库,可一小时内从千万级人口特大城市的万亿级信令数据中高效查找出指定人员的时空关联人员。
所述步骤1中,时空关联人员要求的空间网格分辨率
Figure 228383DEST_PATH_IMAGE088
通常为800×800米。空间网 格划分方法通常采用正四边形均匀网格划分,也可选用正六边形、正三边形空间划分。编码 方法可以采用行列号编码、Geohash、Google S2、Uber H3等方式。
所述步骤2中,时间区间长度
Figure 927349DEST_PATH_IMAGE089
可设置为5秒以上,由于整个城市的所有手机的信 令数据5秒内完成汇集。时间区间编码可采用区间的起始Unix时间戳编码或其它方式。
在本发明实施例中,在步骤3和步骤4中,时间节点为天。
在步骤3中,构建面向人员活动轨迹快速查找的手机信令数据模型,手机信令数据
Figure 456551DEST_PATH_IMAGE090
被组织为:
Figure 681996DEST_PATH_IMAGE091
其中,IMSI为国际移动用户识别码,TIME为UNIX时间戳,LONGITUDE为经度,LATITUDE为纬度,int64代表64位整型,double代表双精度浮点型;
所有的手机信令数据集合
Figure 238617DEST_PATH_IMAGE092
按时间节点分开组织:
Figure 815091DEST_PATH_IMAGE093
其中,
Figure 882405DEST_PATH_IMAGE094
为已有的手机信令数据所跨越的时间节点数,
Figure 962356DEST_PATH_IMAGE095
为第
Figure 456922DEST_PATH_IMAGE096
个时间节点的
Figure 396060DEST_PATH_IMAGE097
集合。
所述步骤3中,IMSI、TIME、LONGITUDE、LATITUDE为
Figure 860539DEST_PATH_IMAGE098
的四个字段,其中 IMSI为国际移动用户识别码,TIME为UNIX时间戳,LONGITUDE和LATITUDE为经纬度。
在步骤4中,构建面向快速时空关联分析的时空轨迹数据模型,设人员的一个时空 轨迹点
Figure 434478DEST_PATH_IMAGE099
为:
Figure 490158DEST_PATH_IMAGE101
其中,其中,GRID_IX为空间网格编码,string代表字符串类型;
所有的时空轨迹点集合
Figure 651012DEST_PATH_IMAGE102
按时间节点分开组织:
Figure 60128DEST_PATH_IMAGE103
其中,
Figure 114672DEST_PATH_IMAGE104
为已有的手机信令数据所跨越的时间节点数,
Figure 951041DEST_PATH_IMAGE105
为第
Figure 723825DEST_PATH_IMAGE106
个时间节点的
Figure 169587DEST_PATH_IMAGE107
集合;
按所述步骤1和2划分的空间网格和时间区间,每一时间节点的
Figure 219583DEST_PATH_IMAGE108
生成的
Figure 351487DEST_PATH_IMAGE109
数据被组织为一系列时空单元的集合
Figure 486933DEST_PATH_IMAGE110
Figure 503431DEST_PATH_IMAGE111
其中,
Figure 532566DEST_PATH_IMAGE112
对于
Figure 209273DEST_PATH_IMAGE113
Figure 956649DEST_PATH_IMAGE114
其中,GRID_IX和TIME_IX为所述步骤1和2中的空间网格和时间区间编码, TRACKPOINTS为隶属于该时空单元内的所有
Figure 511259DEST_PATH_IMAGE115
集合,array代表数组或者列表类 型。
所述步骤4中,IMSI、TIME和GRID_IX为
Figure 270267DEST_PATH_IMAGE116
的字段。GRID_IX、TIME_IX和 TRACKPOINTS为
Figure 478395DEST_PATH_IMAGE117
的字段。
在步骤5中,基于数据模型,建立分布式数据库,将步骤3中的手机信令数据模型和步骤4中的时空轨迹数据模型转换为适应于指定分布式数据库的逻辑模型Schema,基于Schema构建分布式数据库,并对所述步骤3中的IMSI字段和所述步骤4中的GRID_IX字段分别建立索引结构。
所述步骤5中,分布式数据库通常为HBase、Mongodb、Cassandra、OceanBase等NoSQL数据库,也可以为Google Spanner、CockroachDB、Couchbase、TiDB等NewSQL数据库。
所述步骤5中,将步骤3中的手机信令数据模型和步骤4中的时空轨迹数据模型转 换为适应于指定分布式数据库的Schema,具体为:针对指定的数据库特性,将步骤3中的手 机信令数据模型和步骤4中的时空轨迹数据模型转化为易于快速插入、检索的该数据库的 逻辑模式。如,若选用文档类型NoSQL,
Figure 322854DEST_PATH_IMAGE118
Figure 805788DEST_PATH_IMAGE119
可以文档(Document)存储,
Figure 917838DEST_PATH_IMAGE120
Figure 562446DEST_PATH_IMAGE121
可 以集合(Collection)存储;若选用宽列类型数据库,
Figure 159781DEST_PATH_IMAGE118
Figure 790613DEST_PATH_IMAGE122
以行存储,
Figure 648848DEST_PATH_IMAGE123
Figure 605302DEST_PATH_IMAGE124
可以 表存储。
所述步骤5中,索引结构可以选用B-tree、Hash-tree、HBase的Rowkey等结构。
在步骤6中,设手机产生通讯过程中手机信令数据平均采样间隔为
Figure 283408DEST_PATH_IMAGE125
,手机没有产 生通讯过程中信令数据平均采样间隔为
Figure 216467DEST_PATH_IMAGE042
Figure 929208DEST_PATH_IMAGE126
,对来自移动电话基站的手机信令 流数据,在内存中分时间段
Figure 56564DEST_PATH_IMAGE042
缓存,由于采集的信令数据时间间隔并不完全一致,因此
Figure 362912DEST_PATH_IMAGE042
时间段内存在部分人的信令数据过少,对这些人的信令数据进行插值,若一个人在
Figure 460181DEST_PATH_IMAGE042
时间段内O域数据个数小于
Figure 168374DEST_PATH_IMAGE044
,则对该人在
Figure 325686DEST_PATH_IMAGE127
时间段内O域数据进行时间插值,使其个数 等于
Figure 352285DEST_PATH_IMAGE128
,之后,计算每个
Figure 253245DEST_PATH_IMAGE129
所属的空间网格和时间区间的编码,计算每个
Figure 81524DEST_PATH_IMAGE130
对应的
Figure 550682DEST_PATH_IMAGE048
,将这些
Figure 690677DEST_PATH_IMAGE131
Figure 5115DEST_PATH_IMAGE048
在内存中分别 按
Figure 186435DEST_PATH_IMAGE132
和时空单元
Figure 685549DEST_PATH_IMAGE133
组织,每间隔
Figure 453785DEST_PATH_IMAGE134
时间,将其并行插入到步骤5中的分布式数据库中。
所述步骤6中,将
Figure 696548DEST_PATH_IMAGE135
Figure 499419DEST_PATH_IMAGE136
并行插入到分布式数据库中。
具体为:采用OpenMP、POSIX THreads等多线程并行方式,或采用MPI、Hadoop、 Spark等多进程并行方式,将某一
Figure 44801DEST_PATH_IMAGE137
时间段内的所有
Figure 893808DEST_PATH_IMAGE138
Figure 579742DEST_PATH_IMAGE139
划分为指定的线程数 或进程数,并行将这些数据插入到分布式数据库中。
在步骤7中,查询人员a在指定时间范围内的时空轨迹
Figure 96174DEST_PATH_IMAGE140
和活动过的空间网格。
在步骤7中,已知人员a的IMSI为pid,时空轨迹为
Figure 812457DEST_PATH_IMAGE141
,在指定的时间范围内,利用 步骤5的分布式数据库快速寻找出人员a的时空轨迹
Figure 148761DEST_PATH_IMAGE142
,人员a活动过的空间网格编码集合
Figure 608692DEST_PATH_IMAGE143
为:
Figure 120576DEST_PATH_IMAGE144
其中,GRID_IX为空间网格编码;
所述步骤7中,指定的时间范围通常为时空关联人员要求的时间范围,可为14天。
在步骤8中、剔除人员a短暂停留的空间网格:手机信令数据的时间分辨率为秒级,城市范围的所有信令数据可5秒内完成采集与汇聚。
采用微分时间的思想,对于
Figure 132394DEST_PATH_IMAGE145
,判断
Figure 861054DEST_PATH_IMAGE146
空间网格中人员a停留的时间是否超 过共同停留时间
Figure 983730DEST_PATH_IMAGE147
Figure 350121DEST_PATH_IMAGE148
其中,
Figure 532840DEST_PATH_IMAGE149
函数用于计算指定IMSI的
Figure 984681DEST_PATH_IMAGE150
在指定空 间网格出现的次数,
Figure 786415DEST_PATH_IMAGE151
为信令数据的平均采样间隔。
所述步骤8中,共同停留时间
Figure 131946DEST_PATH_IMAGE152
通常为10分钟,信令数据的平均采样间隔
Figure 125048DEST_PATH_IMAGE153
通常为 5秒。
步骤9,并行查询一个空间网格
Figure 923239DEST_PATH_IMAGE154
中与
Figure 794243DEST_PATH_IMAGE155
有交集的时空单元中的轨迹点数据到内 存:空间网格
Figure 869647DEST_PATH_IMAGE156
中所有的
Figure 394169DEST_PATH_IMAGE157
Figure 820602DEST_PATH_IMAGE158
,从所述步骤5中的分 布式数据库查询构成空间网格
Figure 354352DEST_PATH_IMAGE159
Figure 782797DEST_PATH_IMAGE160
个时空单元中的
Figure 478220DEST_PATH_IMAGE161
个与
Figure 391950DEST_PATH_IMAGE162
有交集的时空单元,采 用并行方式将
Figure 339177DEST_PATH_IMAGE163
个时空单元中的所有TRACKPOINTS数组中的所有IMSI和TIME字段值读取 到内存中。
所述步骤9中,并行将时空单元读取到内存,具体为:采用OpenMP、POSIX THreads 等多线程并行方式,或采用MPI、Hadoop、Spark等多进程并行方式,将
Figure 248227DEST_PATH_IMAGE164
个时空单元划分 为指定的线程数或进程数,并行将这些时空单元中的TIME和IMSI字段值读取到内存中以 key-value形式存储。
在步骤10中,计算空间网格
Figure 255498DEST_PATH_IMAGE165
中与
Figure 515578DEST_PATH_IMAGE166
有交集的时空单元中所有人员
Figure 765031DEST_PATH_IMAGE167
的时间轨 迹:根据所述步骤9中的IMSI和TIME字段值,该空间网格与
Figure 528588DEST_PATH_IMAGE166
有交集的时空单元中的人员 数量为
Figure 706759DEST_PATH_IMAGE168
Figure 188556DEST_PATH_IMAGE167
中每个人员的时间轨迹为该人员在内存中所有的TIME字段值的升 序集合;
步骤11,判断步骤10中的一条时间轨迹与人员a的时间轨迹是否具有关联关系:设 人员a的时间轨迹为
Figure 743165DEST_PATH_IMAGE065
,待判断的时间轨迹为
Figure 502174DEST_PATH_IMAGE169
,基于微分时间,对两条时间轨迹求交, 若相交时间大于
Figure 975881DEST_PATH_IMAGE170
且任意一条时间轨迹的时间长度大于
Figure 318875DEST_PATH_IMAGE171
,则
Figure 801809DEST_PATH_IMAGE172
对应的人员为时空关联 人员,计算公式为:
Figure 415324DEST_PATH_IMAGE173
其中,
Figure 59932DEST_PATH_IMAGE174
函数用于计算两条时间轨迹的交点,
Figure 391687DEST_PATH_IMAGE175
为人员a或待 判断者在该网格内累计停留时长,card(.)函数用于计算一个集合的元素个数。
所述步骤11中,人员a或待判断者在该网格内累计停留时长通常为30小时,card(.)函数用于计算一个集合的元素。
步骤12,并行计算空间网格
Figure 288099DEST_PATH_IMAGE176
中人员a的时空关联人员:对
Figure 146334DEST_PATH_IMAGE177
分块,采用并行的方 法迭代计算所述步骤11,直至
Figure 335745DEST_PATH_IMAGE067
中的每个人员均被计算完毕;
步骤13,并行计算人员a的所有时空关联人员:对所述步骤8中计算的人员a的空间 网格集合
Figure 279430DEST_PATH_IMAGE178
分块,采用并行的方法迭代所述步骤9-12,直至
Figure 713953DEST_PATH_IMAGE179
中每个空间网格被计算完 毕,以寻找出所有的时空关联人员。
在本发明的一个实施例中。
在步骤1中,网格分辨率
Figure 426694DEST_PATH_IMAGE076
为可800米,基于正四边形的均匀网格划分方法,将武 汉市的空间范围划分为
Figure 554050DEST_PATH_IMAGE180
个分辨率为800米的空间网格,并采用行列号对
Figure 594819DEST_PATH_IMAGE181
个空间网格 进行编码;
在步骤2中,时间区间划分,设置时间区间长度
Figure 692088DEST_PATH_IMAGE078
为5秒,将一天24小时划分成 17280时间区间,并采用区间的起始Unix时间戳编码对时间区间进行编码;
在步骤3中,建立分布式手机信令数据库:以文档型非关系型数据库NoSQL为例,构建分布式数据库,该数据库主要存储所有手机信令数据和基于信令数据生成的人员时空轨迹点两部分;
对于所有手机信令数据的存储,具体的,将单条手机信令数据组织
Figure 922253DEST_PATH_IMAGE182
其中,IMSI为国际移动用户识别码,TIME为UNIX时间戳,LONGITUDE为经度,LATITUDE为纬度,int64代表64位整型,double代表双精度浮点型;
所有的手机信令数据集合
Figure 345144DEST_PATH_IMAGE183
按时间节点分开组织:
Figure 873209DEST_PATH_IMAGE184
其中,
Figure 774169DEST_PATH_IMAGE185
为已有的手机信令数据所跨越的时间节点数,
Figure 602447DEST_PATH_IMAGE186
为第
Figure 806027DEST_PATH_IMAGE031
个时间节点的
Figure 211600DEST_PATH_IMAGE187
集合。
单个
Figure 24573DEST_PATH_IMAGE188
以document形式存储,
Figure 566413DEST_PATH_IMAGE189
以collection形式存储;
对于基于信令数据生成的人员时空轨迹点的存储,具体的,将时空轨迹
Figure 206473DEST_PATH_IMAGE048
组织为:
Figure 505867DEST_PATH_IMAGE190
其中,GRID_IX为空间网格编码,string代表字符串类型;
按步骤1和步骤2划分的空间网格和时间区间,每一天的
Figure 889575DEST_PATH_IMAGE191
被组织 为
Figure 659823DEST_PATH_IMAGE192
个时空单元的集合
Figure 595418DEST_PATH_IMAGE193
。每一天的
Figure 585371DEST_PATH_IMAGE038
集 合
Figure 631824DEST_PATH_IMAGE194
均以单独的collection形式存储,每个时空单元以document形式存储。
对于任一时空单元
Figure 23622DEST_PATH_IMAGE195
包含三个字段,即:
Figure 739905DEST_PATH_IMAGE196
其中,GRID_IX和TIME_IX为所述步骤1和2中的空间网格和时间区间编码, TRACKPOINTS为隶属于该时空单元内的所有
Figure 607367DEST_PATH_IMAGE038
集合,array代表数组或 者列表类型;
分别对存时空单元的GRID_IX字段和手机信令数据的IMSI字段建立索引结构,便于后续的快速数据查询;
在步骤4中,手机信令流数据实时入库:对来自武汉市移动电话基站的手机信令流 数据,计算每个
Figure 565834DEST_PATH_IMAGE197
所属的空间网格和时间区间的编码,计算每个
Figure 77718DEST_PATH_IMAGE198
对应的
Figure 89536DEST_PATH_IMAGE032
,将这些
Figure 319660DEST_PATH_IMAGE198
Figure 442337DEST_PATH_IMAGE032
在内存中分别按步骤3中的
Figure 543148DEST_PATH_IMAGE199
和 时空单元
Figure 630928DEST_PATH_IMAGE200
组织,每间隔
Figure 941823DEST_PATH_IMAGE201
秒时间,采用OpenMP并行方式,将该
Figure 9136DEST_PATH_IMAGE202
时间段内的所有
Figure 354667DEST_PATH_IMAGE203
Figure 849234DEST_PATH_IMAGE204
划分为指定的线程数,并行将这些数据插入到所述步骤5中所述的分布式数据库 中;
在步骤5中,查询人员a在指定时间范围内的时空轨迹
Figure 522791DEST_PATH_IMAGE205
和活动过的空间网格:查 询人员a在指定时间范围内的活动过的空间网格,具体的:已知人员a的IMSI为pid,在指定 的时间范围内,利用所述步骤5的分布式数据库快速寻找出人员a的时空轨迹
Figure 252850DEST_PATH_IMAGE206
,人员a活 动过的空间网格编码集合为
Figure 92368DEST_PATH_IMAGE207
其中,GRID_IX为空间网格编码;
在步骤6中,剔除人员a短暂停留的空间网格:采用微分时间的思想,对于
Figure 616890DEST_PATH_IMAGE208
,判断
Figure 43323DEST_PATH_IMAGE209
空间网格中人员a停留的时间是否超过共同停留时间
Figure 186860DEST_PATH_IMAGE210
分钟,若 不超过的从
Figure 241404DEST_PATH_IMAGE211
中剔除,即:
Figure 343352DEST_PATH_IMAGE212
其中,
Figure 116136DEST_PATH_IMAGE213
函数用于计算指定IMSI的信令数据在指定空间网格出现的 次数,
Figure 296319DEST_PATH_IMAGE214
秒为信令数据的平均采样间隔;
在步骤7中,并行查询一个空间网格
Figure 611894DEST_PATH_IMAGE215
中与
Figure 478219DEST_PATH_IMAGE216
有交集的时空单元中的数据到内存: 并行查询
Figure 879244DEST_PATH_IMAGE217
中的一个空间网格
Figure 489217DEST_PATH_IMAGE215
中在14天内与
Figure 393719DEST_PATH_IMAGE216
有交集的时空单元中所有的
Figure 696525DEST_PATH_IMAGE048
数据到内存,从所述步骤3中的分布式数据库查询构成空间网格
Figure 552223DEST_PATH_IMAGE215
的 17280个时空单元document中的与
Figure 106832DEST_PATH_IMAGE218
有交集的455个时空单元,采用并行方式将455个时空 单元document中的所有TRACKPOINTS数组中的所有IMSI和TIME字段值读取到内存中;
在步骤8中,计算空间网格
Figure 990474DEST_PATH_IMAGE219
中与
Figure 339547DEST_PATH_IMAGE220
有交集的时空单元中所有人员
Figure 574220DEST_PATH_IMAGE221
的时间轨 迹:根据步骤7中的IMSI和TIME字段值,设
Figure 401361DEST_PATH_IMAGE222
中与
Figure 405089DEST_PATH_IMAGE223
有交集的时空单元中的IMSI集合为
Figure 689178DEST_PATH_IMAGE224
,则
Figure 20933DEST_PATH_IMAGE225
的人员数量为
Figure 776400DEST_PATH_IMAGE226
Figure 244421DEST_PATH_IMAGE227
中每个人员的时间轨迹为该人员在
Figure 325510DEST_PATH_IMAGE228
中所有的TIME字 段值的升序集合;
在步骤9中,判断
Figure 144561DEST_PATH_IMAGE229
的一条时间轨迹与人员a的时间轨迹是否具有关联关系:对
Figure 703718DEST_PATH_IMAGE230
分块,采用并行的方法迭代判断每一时空轨迹与人员a的时空轨迹是否有时空潘绥关系。
具体的,两条时间轨迹是否有时空关联关系的方法为:设人员a的时间轨迹为
Figure 790361DEST_PATH_IMAGE223
, 待判断的时间轨迹为
Figure 652138DEST_PATH_IMAGE231
,基于微分时间,对两条时间轨迹求交,若相交时间大于10分钟且 任意一条时间轨迹的时间长度大于
Figure 348698DEST_PATH_IMAGE232
,则
Figure 321333DEST_PATH_IMAGE233
对应的人员为时空关联人员,即:
Figure 154160DEST_PATH_IMAGE234
其中,
Figure 186838DEST_PATH_IMAGE235
函数用于计算两条时间轨迹的交点,
Figure 479017DEST_PATH_IMAGE175
为人员a或待判 断者在该网格内累计停留时长,
Figure 379977DEST_PATH_IMAGE171
可为30小时,card(.)函数用于计算一个集合的元素个 数;
在步骤11中,并行计算人员a的所有时空关联人员:对所述步骤5中计算的人员a的 空间网格集合
Figure 677097DEST_PATH_IMAGE236
分块,采用并行的方法迭代所述步骤7到步骤9,直至
Figure 270890DEST_PATH_IMAGE237
中每个空间网格 被计算完毕,以寻找出所有的时空关联人员。
如图3所示,本申请的提供的一种基于通信大数据的时空关联分析方法,实现了千万级手机信令数据秒级入库,可一小时内从千万级人口特大城市的万亿级信令数据中高效查找出指定人员a的时空关联人员。
如图2所示,第二方面,本发明还提供了一种基于通信大数据的时空关联分析装置,应用于上述一种基于通信大数据的时空关联分析方法的步骤,所述装置包括:网格划分模块、时间划分模块、手机信令数据模型构建模块、时空轨迹数据模型构建模块、数据库模块、手机信令流数据插值与入库模块、轨迹与空间网格查询模块、空间网格筛选模块、时空单元读取模块、时间轨迹计算模块、关联关系计算模块、单网格时空关联人员计算模块、时空关联人员计算模块。
网格划分模块,用于基于指定的网格划分方法和网格分辨率
Figure 286250DEST_PATH_IMAGE076
,将指定城市的空 间范围划分为
Figure 131846DEST_PATH_IMAGE077
个空间网格,并对所有空间网格进行编码。
网格划分模块能够根据设置的城市空间范围和网格分辨率,将空间范围划分为
Figure 673686DEST_PATH_IMAGE238
个空间网格,并对划分的空间网格进行编码。
时间划分模块,用于基于指定的时间区间长度
Figure 812281DEST_PATH_IMAGE239
,划分
Figure 439572DEST_PATH_IMAGE240
个时间区间,并对所 有时间区间进行编码。
时间划分模块能够根据设置的时间区间长度,将输入的手机信令数据和轨迹点数 据划分为
Figure 557700DEST_PATH_IMAGE241
个时间区间,并对划分的时间区间进行编码。
手机信令数据模型构建模块,用于构建面向人员活动轨迹快速查找的手机信令数据模型,手机信令数据模型中包括多个手机信令数据,所有的手机信令数据按时间节点分开组织。
手机信令数据模型构建模块能够根据内置的手机信令数据模型,将输入的其它格式的手机信令数据组织为装置要求的信令数据模型。
时空轨迹数据模型构建模块,用于构建面向快速时空关联分析的时空轨迹数据模型,时空轨迹数据模型包括多个时空轨迹点,所有的时空轨迹点按时间节点分开组织,按划分的空间网格和划分的时间区间,每一时间节点的手机信令数据生成的时空轨迹点被组织为一系列时空单元的集合。
时空轨迹数据模型构建模块能够根据内置的时空轨迹数据模型,将输入的其它格式的轨迹数据组织为装置要求的时空轨迹数据模型。
数据库模块,用于对手机信令数据模型和时空轨迹数据模型构建分布式数据库,并对手机信令数据和时空轨迹点分别建立索引结构。
数据库模块能够存储海量、高频的手机信令数据,以及基于手机信令数据生成的海量时空轨迹点,具备快速的时空轨迹回溯、时空查询功能。
手机信令流数据插值与入库模块,用于实时手机信令流数据插值与入库。
手机信令流数据插值与入库模块能够实时接入来自基站或者运营商的大规模、高频手机信令数据,并执行插值、轨迹点生成等操作后,调用网格划分模块和时间划分模块对信令数据和轨迹数据划分与排序,之后调用手机信令数据模型构建模块和时空轨迹数据模型构建模块将数据组织为装置要求的模型,之后调用数据库模块,实时将信令数据和轨迹数据快速入库。
轨迹与空间网格查询模块,用于人员a在指定时间范围内的时空轨迹
Figure 954047DEST_PATH_IMAGE080
与活动过 的空间网格,人员a活动过的空间网格编码集合为
Figure 765008DEST_PATH_IMAGE081
,空间网格编码集合
Figure 754961DEST_PATH_IMAGE082
包括多个空 间网格
Figure 801414DEST_PATH_IMAGE083
轨迹与空间网格查询模块能够根据输入的IMSI和时间范围,调用数据库模块,查询IMSI对应的人员在时间范围内活动过的时空轨迹和空间网格的编码。
空间网格筛选模块,用于剔除人员a短暂停留的空间网格,更新空间网格编码集合
Figure 957327DEST_PATH_IMAGE009
空间网格筛选模块能够输入空间网格编码集合,剔除该集合中人员a短暂停留的空间网格的编码。
时空单元读取模块,用于并行查询一个空间网格
Figure 673610DEST_PATH_IMAGE010
中与
Figure 275492DEST_PATH_IMAGE084
有交集的时空单元中 的轨迹点到内存。
时空单元读取模块能够输入网格编码与人员a的时空轨迹,调用数据库模块,将该空间网格中与该时空轨迹有交集的所有时空单元中的轨迹点数据读取到内存中。
时间轨迹计算模块,用于计算空间网格
Figure 735424DEST_PATH_IMAGE010
中与
Figure 106362DEST_PATH_IMAGE012
有交集的时空单元中所有人员
Figure 259126DEST_PATH_IMAGE242
的时间轨迹。
时间轨迹计算模块能够输入一条时空轨迹,计算该人员的时间轨迹。
关联关系计算模块,用于判断
Figure 82726DEST_PATH_IMAGE242
中的一条时间轨迹与人员a的时间轨迹是否具有 关联关系。
关联关系计算模块能够输入两条时间轨迹,计算两条轨迹之间是否存在关联关系。
单网格时空关联人员计算模块,用于并行计算
Figure 844883DEST_PATH_IMAGE242
中人员a的时空关联人员,对人 员集合
Figure 211273DEST_PATH_IMAGE242
分块,采用并行的方法迭代计算,直至
Figure 393993DEST_PATH_IMAGE243
中的每个人员均被计算完毕。
单网格时空关联人员计算模块能够输入人员a时空轨迹和空间网格编码,调用时 空单元读取模块,将该网格中与人员a时空轨迹有交集的时空单元中的轨迹点数据读取到 内存,之后调用时间轨迹计算模块,计算人员a和这些时空单元中的所有人员的时间轨迹, 最后调用关联关系计算模块,判断时空单元中的每个人员的时间轨迹与人员a的时间轨迹 是否有关联关系,从而找出该网格内所有的时空关联人员。时空关联人员计算模块用于并 行计算人员a的所有时空关联人员,对所述步骤8中更新后的空间网格编码集合
Figure 845834DEST_PATH_IMAGE244
分块,采 用并行的方法迭代所述步骤9-12,直至
Figure 772202DEST_PATH_IMAGE053
中每个空间网格被计算完毕,以寻找出所有的时 空关联人员。
时空关联人员计算模块,用于并行计算人员a的所有时空关联人员,对更新后的空 间网格编码集合
Figure 993099DEST_PATH_IMAGE009
分块,采用并行的方法进行迭代,直至
Figure 612299DEST_PATH_IMAGE007
中每个空间网格被计算完 毕,以寻找出所有的时空关联人员。
时空关联人员计算模块能够输入人员a的IMSI和时间范围,先后调用轨迹与空间网格查询模块和空间网格筛选模块,获得人员a的时空轨迹与到访过的网格编码,之后对每个网格编码,调用单网格时空关联人员计算模块,从而找出该人员a所有的时空关联人员。
第三方面,本发明实施例提供了一种电子设备,所述设备包括分布式存储器、处理器以及在存储器中并可在处理器中运行的计算机程序,所述处理器执行计算机程序时实现如本发明第一方面所述基于通信大数据的时空关联分析方法的步骤;
第四方面,本发明实施例提供了一种计算机可读存储介质,用于储存为上述第二方面所提供的基于通信大数据的时空关联分析装置所用的计算机软件指令,或存储用于执行上述第二方面为基于通信大数据的时空关联分析装置所设计的程序,实现上述基于通信大数据的时空关联分析方法的步骤。
本发明实施例中的存储器用于存储各种类型的数据以支持本发明提供的电子设备的操作。这些数据的示例包括:用于在本发明提供的电子设备上操作的任何计算机程序。
本发明实施例揭示的基于通信大数据的时空关联分析方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,基于通信大数据的时空关联分析方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(DSP,Digital SignalProcessor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成本发明实施例提供的基于通信大数据的时空关联分析方法的步骤。
在示例性实施例中,本发明提供的电子设备可以被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex ProgrammableLogicDevice)、FPGA、通用处理器、控制器、微控制器(MCU,Micro Controller Unit)、微处理器(Microprocessor)、或者其他电子元件实现,用于执行前述方法。
在一应用示例中,本发明提供的电子设备包括笔记本电脑,笔记本电脑用于运行计算机程序时,实现前述任一实施例所述的基于通信大数据的时空关联分析方法。
可以理解,存储器可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM,Read Only Memory)、可编程只读存储器(PROM,Programmable Read-Only Memory)、可擦除可编程只读存储器(EPROM,Erasable Programmable Read-Only Memory)、电可擦除可编程只读存储器(EEPROM,Electrically Erasable Programmable Read-Only Memory)、磁性随机存取存储器(FRAM,ferromagnetic random access memory)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(CD-ROM,Compact Disc Read-Only Memory);磁表面存储器可以是磁盘存储器或磁带存储器。易失性存储器可以是随机存取存储器(RAM,RandomAccessMemory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(SRAM,Static Random Access Memory)、同步静态随机存取存储器(SSRAM,Synchronous Static Random Access Memory)、动态随机存取存储器(DRAM,Dynamic Random Access Memory)、同步动态随机存取存储器(SDRAM,SynchronousDynamic Random Access Memory)、双倍数据速率同步动态随机存取存储器(DDRSDRAM,Double Data Rate Synchronous Dynamic Random Access Memory)、增强型同步动态随机存取存储器(ESDRAM,Enhanced Synchronous Dynamic Random AccessMemory)、同步连接动态随机存取存储器(SLDRAM,SyncLink Dynamic Random AccessMemory)、直接内存总线随机存取存储器(DRRAM,Direct Rambus Random Access Memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
另外,本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

Claims (10)

1.一种基于通信大数据的时空关联分析方法,其特征在于,包括以下步骤:
步骤1、城市网格划分,基于指定的网格划分方法和网格分辨率
Figure 331999DEST_PATH_IMAGE001
,将指定城市的空间 范围划分为
Figure 734162DEST_PATH_IMAGE002
个空间网格,并对所有空间网格进行编码;
步骤2、时间区间划分,基于指定的时间区间长度
Figure 606303DEST_PATH_IMAGE003
,划分
Figure 68508DEST_PATH_IMAGE004
个时间区间,并对所有时 间区间进行编码;
步骤3、构建面向人员活动轨迹快速查找的手机信令数据模型,手机信令数据模型中包括多个手机信令数据,所有的手机信令数据按时间节点分开组织;
步骤4、构建面向快速时空关联分析的时空轨迹数据模型,时空轨迹数据模型包括多个时空轨迹点,所有的时空轨迹点按时间节点分开组织,按所述步骤1和2划分的空间网格和时间区间,每一时间节点的手机信令数据生成的时空轨迹点被组织为一系列时空单元的集合;
步骤5、对所述步骤3中的手机信令数据模型和步骤4中的时空轨迹数据模型构建分布式数据库,并对手机信令数据和时空轨迹点分别建立索引结构;
步骤6、实时手机信令流数据插值与入库;
步骤7、查询人员a在指定时间范围内的时空轨迹
Figure 26100DEST_PATH_IMAGE005
与活动过的空间网格,人员a活动过 的空间网格编码集合为
Figure 231953DEST_PATH_IMAGE006
,空间网格编码集合
Figure 224180DEST_PATH_IMAGE007
包括多个空间网格
Figure 857287DEST_PATH_IMAGE008
步骤8、剔除人员a短暂停留的空间网格,更新空间网格编码集合
Figure 36595DEST_PATH_IMAGE007
步骤9、并行查询一个空间网格
Figure 46140DEST_PATH_IMAGE008
中与
Figure 158452DEST_PATH_IMAGE009
有交集的时空单元中的轨迹点到内存;
步骤10、计算空间网格
Figure 962460DEST_PATH_IMAGE008
中与
Figure 891714DEST_PATH_IMAGE009
有交集的时空单元中人员
Figure 439370DEST_PATH_IMAGE010
的时间轨迹;
步骤11、判断
Figure 406189DEST_PATH_IMAGE010
中的一条时间轨迹与人员a的时间轨迹是否具有关联关系;
步骤12、并行计算
Figure 115519DEST_PATH_IMAGE010
中人员a的时空关联人员,对人员集合
Figure 800579DEST_PATH_IMAGE010
分块,采用并行的方法 迭代计算所述步骤11,直至
Figure 886346DEST_PATH_IMAGE010
中的每个人员均被计算完毕;
步骤13、并行计算人员a的所有时空关联人员,对所述步骤8中更新后的空间网格编码 集合
Figure 442093DEST_PATH_IMAGE006
分块,采用并行的方法迭代所述步骤9-12,直至
Figure 853482DEST_PATH_IMAGE007
中每个空间网格被计算完毕,以 寻找出所有的时空关联人员。
2.根据权利要求1所述的基于通信大数据的时空关联分析方法,其特征在于:在步骤3 中,构建面向人员活动轨迹快速查找的手机信令数据模型,手机信令数据
Figure 494679DEST_PATH_IMAGE011
被组织 为:
Figure 384138DEST_PATH_IMAGE012
其中,IMSI为国际移动用户识别码,TIME为UNIX时间戳,LONGITUDE为经度,LATITUDE为纬度,int64代表64位整型,double代表双精度浮点型;
所有的手机信令数据集合
Figure 59970DEST_PATH_IMAGE013
按时间节点分开组织:
Figure 111102DEST_PATH_IMAGE014
其中,
Figure 505175DEST_PATH_IMAGE015
为已有的手机信令数据所跨越的时间节点数,
Figure 201254DEST_PATH_IMAGE016
为第
Figure 731592DEST_PATH_IMAGE017
个时间节点的
Figure 484785DEST_PATH_IMAGE018
集合。
3.根据权利要求2所述的基于通信大数据的时空关联分析方法,其特征在于:在步骤4 中,构建面向快速时空关联分析的时空轨迹数据模型,设人员的一个时空轨迹点
Figure 366153DEST_PATH_IMAGE019
为:
Figure 331835DEST_PATH_IMAGE020
其中,GRID_IX为空间网格编码,string代表字符串类型;
所有的时空轨迹点集合
Figure 716680DEST_PATH_IMAGE021
按时间节点分开组织:
Figure 375194DEST_PATH_IMAGE022
其中,
Figure 743859DEST_PATH_IMAGE023
为已有的手机信令数据所跨越的时间节点数,
Figure 778811DEST_PATH_IMAGE024
为第
Figure 18162DEST_PATH_IMAGE017
个时间节点的
Figure 113157DEST_PATH_IMAGE025
集合;
按所述步骤1和2划分的空间网格和时间区间,每一时间节点的
Figure 969118DEST_PATH_IMAGE026
生成的
Figure 276603DEST_PATH_IMAGE025
数据被组织为一系列时空单元的集合
Figure 898689DEST_PATH_IMAGE027
Figure 899006DEST_PATH_IMAGE028
其中,
Figure 976684DEST_PATH_IMAGE029
对于
Figure 619018DEST_PATH_IMAGE030
Figure 832961DEST_PATH_IMAGE031
其中,GRID_IX和TIME_IX为所述步骤1和2中的空间网格和时间区间编码,TRACKPOINTS 为隶属于该时空单元内的所有
Figure 4180DEST_PATH_IMAGE025
集合,array代表数组或者列表类型。
4.根据权利要求3所述的基于通信大数据的时空关联分析方法,其特征在于:在步骤5中,将步骤3中的手机信令数据模型和步骤4中的时空轨迹数据模型转换为适应于指定分布式数据库的逻辑模型Schema,基于Schema构建分布式数据库,并对步骤3中的IMSI字段和步骤4中的GRID_IX字段分别建立索引结构。
5.根据权利要求3所述的基于通信大数据的时空关联分析方法,其特征在于:在步骤6 中,设手机产生通讯过程中手机信令数据平均采样间隔为
Figure 569153DEST_PATH_IMAGE032
,手机没有产生通讯过程中信 令数据平均采样间隔为
Figure 484020DEST_PATH_IMAGE033
Figure 818049DEST_PATH_IMAGE034
,对来自移动电话基站的手机信令流数据,在内存 中分时间段
Figure 425748DEST_PATH_IMAGE033
缓存,由于采集的信令数据时间间隔并不完全一致,因此
Figure 478017DEST_PATH_IMAGE035
时间段内存在 部分人的信令数据过少,对这些人的信令数据进行插值,若一个人在
Figure 930995DEST_PATH_IMAGE035
时间段内O域数据 个数小于
Figure 385111DEST_PATH_IMAGE036
,则对该人在
Figure 725280DEST_PATH_IMAGE035
时间段内O域数据进行时间插值,使其个数等于
Figure 999266DEST_PATH_IMAGE037
,之后,计算 每个
Figure 521515DEST_PATH_IMAGE038
所属的空间网格和时间区间的编码,计算每个
Figure 564557DEST_PATH_IMAGE039
对应的
Figure 514058DEST_PATH_IMAGE040
, 将这些
Figure 9762DEST_PATH_IMAGE041
Figure 335701DEST_PATH_IMAGE040
在内存中分别按
Figure 498829DEST_PATH_IMAGE042
和时空单元
Figure 353653DEST_PATH_IMAGE043
组织,每间隔
Figure 867811DEST_PATH_IMAGE044
时间, 将其并行插入到步骤5中的分布式数据库中。
6.根据权利要求2所述的基于通信大数据的时空关联分析方法,其特征在于:在步骤7 中,已知人员a的IMSI为pid,在指定的时间范围内,利用步骤5的分布式数据库快速寻找出 该人员a的时空轨迹
Figure 466282DEST_PATH_IMAGE045
,人员a活动过的空间网格编码集合
Figure 483917DEST_PATH_IMAGE007
为:
Figure 775221DEST_PATH_IMAGE046
其中,GRID_IX为空间网格编码;
在步骤8中,采用微分时间的思想,对于
Figure 508166DEST_PATH_IMAGE047
,判断
Figure 910328DEST_PATH_IMAGE048
空间网格中人员a停留的时间 是否超过共同停留时间
Figure 782469DEST_PATH_IMAGE049
Figure 510254DEST_PATH_IMAGE050
其中,
Figure 467846DEST_PATH_IMAGE051
函数用于计算指定IMSI的
Figure 673699DEST_PATH_IMAGE052
在指定空间网格出现 的次数,
Figure 665926DEST_PATH_IMAGE053
为信令数据的平均采样间隔。
7.根据权利要求6所述的基于通信大数据的时空关联分析方法,其特征在于:在步骤10 中,计算空间网格
Figure 299033DEST_PATH_IMAGE054
中与
Figure 743920DEST_PATH_IMAGE055
有交集的时空单元中所有人员
Figure 487885DEST_PATH_IMAGE056
的时间轨迹:根据所述步骤9 中的IMSI和TIME字段值,该空间网格与
Figure 334619DEST_PATH_IMAGE055
有交集的时空单元中的人员数量为
Figure 404206DEST_PATH_IMAGE057
Figure 70811DEST_PATH_IMAGE056
中每个人员的时间轨迹为该人员在内存中所有的TIME字段值的升序集合。
8.根据权利要求7所述的基于通信大数据的时空关联分析方法,其特征在于:在步骤11 中,判断步骤10中的一条时间轨迹与人员a的时间轨迹是否具有关联关系:设人员a的时间 轨迹为
Figure 884046DEST_PATH_IMAGE058
,待判断的时间轨迹为
Figure 853795DEST_PATH_IMAGE059
,基于微分时间,对两条时间轨迹求交,若相交时间大 于
Figure 563125DEST_PATH_IMAGE060
且任意一条时间轨迹的时间长度大于
Figure 248184DEST_PATH_IMAGE061
,则
Figure 599531DEST_PATH_IMAGE062
对应的人员为时空关联人员,计算公 式为:
Figure 155277DEST_PATH_IMAGE063
其中,
Figure 35508DEST_PATH_IMAGE064
函数用于计算两条时间轨迹的交点,
Figure 676705DEST_PATH_IMAGE065
为人员a或待判断者在 该网格内累计停留时长,card(.)函数用于计算一个集合的元素个数。
9.一种基于通信大数据的时空关联分析装置,其特征在于,包括:
网格划分模块,用于基于指定的网格划分方法和网格分辨率
Figure 831743DEST_PATH_IMAGE066
,将指定城市的空间范 围划分为
Figure 241996DEST_PATH_IMAGE067
个空间网格,并对所有空间网格进行编码;
时间划分模块,用于基于指定的时间区间长度
Figure 824287DEST_PATH_IMAGE068
,划分
Figure 218359DEST_PATH_IMAGE004
个时间区间,并对所有时间 区间进行编码;
手机信令数据模型构建模块,用于构建面向人员活动轨迹快速查找的手机信令数据模型,手机信令数据模型中包括多个手机信令数据,所有的手机信令数据按时间节点分开组织;
时空轨迹数据模型构建模块,用于构建面向快速时空关联分析的时空轨迹数据模型,时空轨迹数据模型包括多个时空轨迹点,所有的时空轨迹点按时间节点分开组织,按划分的空间网格和划分的时间区间,每一时间节点的手机信令数据生成的时空轨迹点被组织为一系列时空单元的集合;
数据库模块,用于对手机信令数据模型和时空轨迹数据模型构建分布式数据库,并对手机信令数据和时空轨迹点分别建立索引结构:
手机信令流数据插值与入库模块,用于实时手机信令流数据插值与入库;
轨迹与空间网格查询模块,用于查询人员a在指定时间范围内的时空轨迹
Figure 645929DEST_PATH_IMAGE069
与活动过 的空间网格,人员a活动过的空间网格编码集合为
Figure 441847DEST_PATH_IMAGE070
,空间网格编码集合
Figure 926530DEST_PATH_IMAGE070
包括多个空间 网格
Figure 542320DEST_PATH_IMAGE008
空间网格筛选模块,用于剔除人员a短暂停留的空间网格,更新空间网格编码集合
Figure 39160DEST_PATH_IMAGE007
时空单元读取模块,用于并行查询一个空间网格
Figure 424005DEST_PATH_IMAGE071
中与
Figure 348099DEST_PATH_IMAGE009
有交集的时空单元中的轨迹 点到内存;
时间轨迹计算模块,用于计算空间网格
Figure 451184DEST_PATH_IMAGE071
中与
Figure 486136DEST_PATH_IMAGE009
有交集的时空单元中所有人员
Figure 725487DEST_PATH_IMAGE072
的 时间轨迹;
关联关系计算模块,用于判断
Figure 554903DEST_PATH_IMAGE073
中的一条时间轨迹与人员a的时间轨迹是否具有关联 关系;
单网格时空关联人员计算模块,用于并行计算
Figure 879705DEST_PATH_IMAGE074
中人员a的时空关联人员,对人员集 合
Figure 718348DEST_PATH_IMAGE074
分块,采用并行的方法迭代计算,直至
Figure 77785DEST_PATH_IMAGE074
中的每个人员均被计算完毕;
时空关联人员计算模块,用于并行计算人员a的所有时空关联人员,对更新后的空间网 格编码集合
Figure 334893DEST_PATH_IMAGE006
分块,采用并行的方法进行迭代,直至
Figure 146991DEST_PATH_IMAGE007
中每个空间网格被计算完毕,以寻 找出所有的时空关联人员。
10.一种电子设备,其特征在于,包括分布式存储器、处理器以及在存储器中并可在处理器中运行的计算机程序,所述处理器执行计算机程序时实现权利要求1-8任一项所述的基于通信大数据的时空关联分析方法的步骤。
CN202210913511.7A 2022-08-01 2022-08-01 一种基于通信大数据的时空关联分析方法、装置及设备 Active CN114996598B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210913511.7A CN114996598B (zh) 2022-08-01 2022-08-01 一种基于通信大数据的时空关联分析方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210913511.7A CN114996598B (zh) 2022-08-01 2022-08-01 一种基于通信大数据的时空关联分析方法、装置及设备

Publications (2)

Publication Number Publication Date
CN114996598A CN114996598A (zh) 2022-09-02
CN114996598B true CN114996598B (zh) 2022-10-18

Family

ID=83021566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210913511.7A Active CN114996598B (zh) 2022-08-01 2022-08-01 一种基于通信大数据的时空关联分析方法、装置及设备

Country Status (1)

Country Link
CN (1) CN114996598B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115795115B (zh) * 2023-02-11 2023-05-02 云南师范大学 一种基于图存储的多轨迹集合相似性搜索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635059A (zh) * 2018-11-23 2019-04-16 武汉烽火众智数字技术有限责任公司 基于轨迹相似度匹配的人车关联分析方法及系统
CN112181980A (zh) * 2020-09-16 2021-01-05 武汉大学 一种面向大规模分析的时空大数据立方体组织方法及系统
CN113946575A (zh) * 2021-09-13 2022-01-18 中国电子科技集团公司第十五研究所 时空轨迹数据处理方法、装置、电子设备及存储介质
CN114265833A (zh) * 2021-12-24 2022-04-01 刘心亮 车辆轨迹引导地理时空特征可视化分析平台

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6032467B2 (ja) * 2012-06-18 2016-11-30 株式会社日立製作所 時空間データ管理システム、時空間データ管理方法、及びそのプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635059A (zh) * 2018-11-23 2019-04-16 武汉烽火众智数字技术有限责任公司 基于轨迹相似度匹配的人车关联分析方法及系统
CN112181980A (zh) * 2020-09-16 2021-01-05 武汉大学 一种面向大规模分析的时空大数据立方体组织方法及系统
CN113946575A (zh) * 2021-09-13 2022-01-18 中国电子科技集团公司第十五研究所 时空轨迹数据处理方法、装置、电子设备及存储介质
CN114265833A (zh) * 2021-12-24 2022-04-01 刘心亮 车辆轨迹引导地理时空特征可视化分析平台

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GeoCube:面向大规模分析的多源对地观测时空立方体;高凡 等;《遥感学报》;20220625;全文 *

Also Published As

Publication number Publication date
CN114996598A (zh) 2022-09-02

Similar Documents

Publication Publication Date Title
CN106649656B (zh) 一种面向数据库的时空轨迹大数据存储方法
Mahmood et al. Spatio-temporal access methods: a survey (2010-2017)
Pelanis et al. Indexing the past, present, and anticipated future positions of moving objects
CN107766433B (zh) 一种基于Geo-BTree的范围查询方法及装置
CN107798054B (zh) 一种基于Trie的范围查询方法及装置
CN114996598B (zh) 一种基于通信大数据的时空关联分析方法、装置及设备
Gao et al. Efficient mutual nearest neighbor query processing for moving object trajectories
CN110865992A (zh) 一种检索库管理方法、检索方法、装置及介质
Ma et al. Large-scale geo-tagged video indexing and queries
Whitman et al. Spatio-temporal join on apache spark
CN111324781A (zh) 一种数据分析方法、装置及设备
Kipf et al. Approximate geospatial joins with precision guarantees
CN110059149A (zh) 电子地图空间关键字查询分布式索引系统和方法
Abbasifard et al. Efficient indexing for past and current position of moving objects on road networks
Liu et al. Indexing Large Moving Objects from Past to Future with PCFI+-Index.
He et al. Spatial query processing for location based application on Hbase
CN114969567B (zh) 一种高性能时空轨迹关联分析方法、装置及设备
CN111563080A (zh) 一种空间数据索引和拓扑方法、装置及存储介质
CN113868465B (zh) 一种基于二维时间格网的可定位视频检索方法
Yang et al. Dynamic set similarity join: An update log based approach
Chen et al. Detecting trajectory outliers based on spark
CN114491061A (zh) 一种多维数据关联分析系统及方法
Akasapu et al. Efficient trajectory pattern mining for both sparse and dense dataset
Heiler et al. Comparing implementation variants of distributed spatial join on spark
Teng et al. GPU-based Real-time Contact Tracing at Scale

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant