CN112788524B - 对象查询方法、装置、设备及存储介质 - Google Patents
对象查询方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112788524B CN112788524B CN202011606095.3A CN202011606095A CN112788524B CN 112788524 B CN112788524 B CN 112788524B CN 202011606095 A CN202011606095 A CN 202011606095A CN 112788524 B CN112788524 B CN 112788524B
- Authority
- CN
- China
- Prior art keywords
- objects
- information
- time
- position information
- time information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/023—Services making use of location information using mutual or relative location information between multiple location based services [LBS] targets or of distance thresholds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种对象查询方法、装置、设备及存储介质,方法包括:获取第一查询请求,第一查询请求包括第一对象的第一位置信息及与第一位置信息对应的第一时间信息;根据第一位置信息,在预设的候选对象信息集合中确定多个第二对象;根据第一时间信息,在多个第二对象中确定多个第三对象;基于多个第三对象中每个第三对象关联的位置信息和时间信息,第一对象的第一位置信息和第一时间信息,计算多个第三对象中每个第三对象与第一对象的伴随得分;将伴随得分大于预设分值的第三对象,确定为第一对象的目标对象。根据本发明实施例的方法,在计算过程中参考了位置信息重合的时长,提升了查询结果的准确率。
Description
技术领域
本发明属于移动通信领域,尤其涉及一种对象查询方法、装置、设备及存储介质。
背景技术
很多场景中需要查询某个对象的同行对象(即一同出行的对象)。通过传统的走访调查的方式查询,费时费力且结果难以保障。
目前,运营商大数据(例如手机信令数据)为查询目标对象的同行对象提供了良好的数据基础。但是,在现有技术中在查询目标对象同行对象时,仅考虑了两者在相同时间的位置轨迹是否有交集,没有考虑位置轨迹重合的时长,因此,在实际应用中得到的同行对象准确率较低。例如,某一对象在某一时刻,路过目标对象所在小区,与目标对象连接了同一个基站,但是两个对象实际并无接触,此时将该对象判定为目标对象的同行对象结果就是错误的。
发明内容
本发明实施例提供一种对象查询方法、装置、设备及存储介质,能够提升查询结果的准确率。
第一方面,本发明实施例提供一种对象查询方法,方法包括:获取第一查询请求,第一查询请求包括第一对象的第一位置信息及与第一位置信息对应的第一时间信息;根据第一位置信息,在预设的候选对象信息集合中确定多个第二对象;根据第一时间信息,在多个第二对象中确定多个第三对象;基于多个第三对象中每个第三对象关联的位置信息和时间信息,第一对象的第一位置信息和第一时间信息,计算多个第三对象中每个第三对象与第一对象的伴随得分,伴随得分指示第三对象与第一对象在第一时间信息对应的时间范围内位置信息的相似度;将伴随得分大于预设分值的第三对象,确定为第一对象的目标对象。
在一种可选的实施方式中,基于多个第三对象中每个第三对象关联的位置信息和时间信息,第一对象的第一位置信息和第一时间信息,计算多个第三对象中每个第三对象与第一对象的伴随得分,包括:
基于多个第三对象中每个第三对象关联的位置信息,第一对象的第一位置信息,计算多个第三对象中每个第三对象的位置信息与第一对象的位置信息的位置相似度值;
基于多个第三对象中每个第三对象关联的时间信息和位置信息,第一对象的第一时间信息和第一位置信息,计算多个第三对象中每个第三对象与第一对象的时间相似度值;
根据位置相似度值与时间相似度值,计算多个第三对象中每个第三对象与第一对象的伴随得分。
在一种可选的实施方式中,第一位置信息包括对象的多个位置中每个位置对应的多个空间索引编码geohash码值;
多个空间索引编码geohash码值包括多个位置中每个位置的geohash码值及与geohash码值对应的网格相邻的至少一个近邻网格的geohash码值。
在一种可选的实施方式中,位置相似度值是第三对象和第一对象重合网格数量占第一对象的网格总数的比值。
在一种可选的实施方式中,第一时间信息包括与第一位置信息的多个位置中每个位置对应的多个geohash码值对应的子时间信息;
基于多个第三对象中每个第三对象关联的时间信息和位置信息,第一对象的第一时间信息和第一位置信息,计算多个第三对象中每个第三对象与第一对象的时间相似度值,包括:
计算每个第三对象和第一对象重合网格对应的第三对象的子时间信息,与重合网格对应的第一对象的子时间信息之间的重合时间;
基于第一时间信息的总时间和每个重合时间,计算多个第三对象中每个第三对象与第一对象的时间相似度值。
在一种可选的实施方式中,基于第一时间信息的总时间和每个重合时间,计算多个第三对象中每个第三对象与第一对象的时间相似度值,包括:
根据重合网格对应的第一对象的子时间信息和预设时长条件,计算每个重合时间的加权重合时间;
基于第一时间信息的总时间和每个加权重合时间,计算多个第三对象中每个第三对象与第一对象的时间相似度值。
在一种可选的实施方式中,时间相似度值是重合网格对应的第三对象的时间信息和第一时间信息之间的重合时间,与第一时间信息的总时间的比值。
在一种可选的实施方式中,根据第一位置信息,在预设的候选对象信息集合中确定多个第二对象之前,方法还包括:
获取多个候选对象的位置信息以及位置信息对应的时间信息;
基于每个候选对象的位置信息以及位置信息对应的时间信息,构建候选对象信息集合。
在一种可选的实施方式中,获取多个候选对象的位置信息以及位置信息对应的时间信息,包括:
获取多个信令数据和多个基站工参数据,信令数据包括对象位置数据和时间数据;
根据多个信令数据和多个基站工参数据,确定多个候选对象的位置信息以及位置信息对应的时间信息。
第二方面,本发明实施例提供了一种对象查询装置,装置包括:
第一获取模块,被配置为获取第一查询请求,第一查询请求包括第一对象的第一位置信息及与第一位置信息对应的第一时间信息;
第一判断模块,被配置为根据第一位置信息,在预设的候选对象信息集合中确定多个第二对象;
第二判断模块,被配置为根据第一时间信息,在多个第二对象中确定多个第三对象;
第一信息处理模块,被配置为基于多个第三对象中每个第三对象关联的位置信息和时间信息,第一对象的第一位置信息和第一时间信息,计算多个第三对象中每个第三对象与第一对象的伴随得分,伴随得分指示第三对象与第一对象在第一时间信息对应的时间范围内位置信息的相似度;
目标对象确定模块,被配置为将伴随得分大于预设分值的第三对象,确定为第一对象的目标对象。
第三方面,本发明实施例提供了一种对象查询设备,设备包括:处理器,以及存储有计算机程序指令的存储器;所述处理器读取并执行所述计算机程序指令,以实现第一方面及第一方面中任一可选实施方式提供的对象查询方法。
第四方面,本发明实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面及第一方面中任一可选实施方式提供的对象查询方法。
本发明实施例的对象查询方法、装置、设备及存储介质,能够根据第一对象的第一位置信息和第一时间信息,在预设的候选对象信息集合中确定多个第二对象,并在多个第二对象中确定多个第三对象,第三对象即在某一时刻与第一对象的位置信息有重合的对象;然后基于多个第三对象中每个第三对象关联的位置信息和时间信息,第一对象的第一位置信息和第一时间信息,计算多个第三对象中每个第三对象与第一对象的伴随得分;将得分满足预设要求的第三对象,确定为目标对象。由于第三对象与第一对象在某一时刻与位置信息有重合,所以后续计算伴随得分的过程中同时使用位置信息和时间信息,即参考了位置信息重合的时长,因此得到的目标对象相比传统方法更准确。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中的地图区域划分示意图;
图2是本发明实施例中的geohash编码过程示意图;
图3是本发明实施例提供的一种对象查询方法流程示意图;
图4是本发明实施例提供的一种对象查询装置的结构示意图;
图5是本发明实施例提供的一种对象查询设备的结构示意图。
具体实施方式
下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本发明,而不是限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
目前关于用户轨迹相似性的研究主要是基于位置的社交网络LBSN用户轨迹相似性推荐或基于最长公共子序列LCSS的用户轨迹相似性推荐,如结合TP数获得用户常驻区域解决用户轨迹随机性而改进的LCSS算法,基于位置的社交网络中用户通常访问时间和访问地点的规律性,利用GPS日志计算用户活动轨迹的相似性,由于LBSN是基于位置签到,仅通过位置来分析用户的相似性过于片面,而LCSS由于用户轨迹数据的稀疏性导致算法效率低下。
例如,在防控疫情的情景下,防疫部门通过运营商大数据可以快速的得到确诊人员或疑似确诊人员在一定时间段内的位置轨迹信息。与这些重点人员有过直接或者间接接触的人也存在很大的被感染风险,但是这部分人员通过传统方案却很难找到。
虽然普通人员可以根据防疫部门提供的信息去判断自己是否与这些重点人员有过接触,比如统一时间段乘坐过同一辆公交。但这始终是一个被动的手段。
基于上述问题,本申请提供了一种对象查询方法、装置、设备及存储介质,采用大数据追踪技术追踪确诊或疑似确诊人员的位置轨迹信息,便于查询出重点人员在时间段内的相关接触人员以及轨迹伴随得分,筛查不同程度的接触人员,对那些伴随得分高的接触人员重点监控,辅助防疫部门开展防控工作。
为了更好理解本申请,在介绍本申请的具体实施方式之前,首先介绍描述本申请实施方式时用到的技术术语。
(1)空间索引geohash及8近邻网格
geohash本质上是空间索引的一种方式,其基本原理是将地球理解为一个二维平面,将平面递归分解成更小的子块,每个子块在一定经纬度范围内拥有相同的编码。以geohash方式建立空间索引,可以提高对空间poi数据进行经纬度检索的效率。geohash具有如下特性:
1、层级空间数据结构,将地理位置用矩形网格划分,同一网格内地理编码相同;
2、可以表示任意精度的地理位置坐标,只要编码长度足够长;
3、编码前缀匹配的越长,地理位置越邻近。
由于geohash采用的是base32编码方式,即geohash中的每一个字母或者数字(如wx4g0e中的w)都是由5bits组成(2^5=32,base32),这5bits可以有32种不同的组合(0~31),这样我们可以将整个地图区域分为32个区域,通过00000~11111来标识这32个区域。第一次对地图划分后的情况如附图1所示(每个区域中的编号对应于该区域所对应的编码)。
参考附图2,geohash的0、1串序列是经度0、1序列和纬度0、1序列中的数字交替进行排列的,偶数位对应的序列为经度序列,奇数位对应的序列为纬度序列,在进行第一次划分时,geohash0、1序列中的前5个bits(11100),那么这5bits中有3bits是表示经度,2bits表示纬度,所以第一次划分时,是将经度划分成8个区段(2^3=8),将纬度划分为4个区段(2^2=4),这样就形成了32个区域。
同理,可以按照第一次划分所采用的方式对第一次划分所得的32个区域各自再次划分。
由于geohash是将区域划分为一个个规则矩形,并对每个矩形进行编码,这样在投影经纬度坐标的时候,会导致两个相近的位置点在不同的geohash网格,为解决这一问题,可以将网格周围8个近邻网格作为附属网格,合并平面位置信息,对于每一块区域的编码,从左往右依次对应了十进制的0~(2^n)-1,同样的,在纬度逼近的过程中,每一块区域从下往上同样依次对应0~(2^n)-1。
因此,任一个geohash网格周围区域的geohash值的计算步骤为:
1.将当前区域的geohash编码解码成经纬度对应的二进制串;
2.将二进制串+1或者-1就能得到左右经度(或上下纬度)区域对应的二进制串(注意边界);
3.得到的经纬度二进制串两两组合再进行geohash的编码,得到的就是周围区域的编码了。
基于上述技术术语,已对空间索引geohash及8近邻网格相关技术进行了简单介绍。
下面具体介绍本申请实施例提供的一种对象查询方法,该方法可以基于对象查询系统实现,请参考附图3一种对象查询方法流程示意图,该方法可以包括步骤S110-S150。
步骤S110,获取第一查询请求,第一查询请求包括第一对象的第一位置信息及与第一位置信息对应的第一时间信息。
系统获取用户输入的第一查询请求,用户输入的信息包括第一对象的第一位置信息和与第一位置信息对应的第一时间信息。其中,第一位置信息可以包括多个位置信息,第一时间信息与其相对,具体地,第一位置信息可以是基于信令数据得到的第一对象的轨迹数据,也可以是基于第一对象自主表达的信息得到时间段内即第一时间信息对应的位置信息。
在一个示例中,第一位置信息可以包括对象的多个位置中每个位置对应的多个空间索引编码geohash码值;
多个空间索引编码geohash码值包括多个位置中每个位置的geohash码值及与geohash码值对应的网格相邻的至少一个近邻网格的geohash码值。
在一个具体示例中,基于geohash网格与其8近邻关联网格,将目标用户的活动轨迹投影至二维平面上,计算轨迹驻留点经纬度坐标对应的平面子块(每个子块在一定经纬度范围内拥有相同的编码),以平面子块为中心,与之相邻的8个网格一起构成平面大网格。第一位置信息包括对象每个位置对应的geohash码值和与其相邻的8个近邻网格的geohash码值,即每个位置对应一个由9个geohash网格构成的大网格。
步骤S120,根据第一位置信息,在预设的候选对象信息集合中确定多个第二对象。
系统可以根据第一对象的第一位置信息在多个对象中找到位置有交集的对象,即第二对象。该步骤是基于位置信息确定伴随对象的初步集合,其中的对象是与第一对象在位置信息中有交叉的对象。
在一个具体示例中,第二对象的多个位置中至少一个位置与第一对象的大网格有交叉。即与第一对象的位置轨迹有重合。其重合可以是两个大网格之间有小网格重合。
步骤S130,根据第一时间信息,在多个第二对象中确定多个第三对象。
系统可以根据第一对象的第一时间信息,在伴随对象的初步集合中,即多个第二对象中,找到在相同时间出现在相同位置的对象,进一步缩小伴随对象的初步集合,剔除非伴随对象。
步骤S140,基于多个第三对象中每个第三对象关联的位置信息和时间信息,第一对象的第一位置信息和第一时间信息,计算多个第三对象中每个第三对象与第一对象的伴随得分,伴随得分指示第三对象与第一对象在第一时间信息对应的时间范围内位置信息的相似度。
系统可以根据第一对象和每个第三对象的位置信息及时间信息,计算每个第三对象与第一对象在相同位置的时长,并计算每个第三对象与第一对象的伴随得分。
在一个具体示例中,上述几个步骤研究每个大网格下的目标用户和关联用户的交叉打点时间和交叉网格数,进而计算目标用户与关联用户轨迹伴随得分,筛选出时间段内与目标用户接触程度较高的轨迹伴随人员。
步骤S150,将伴随得分大于预设分值的第三对象,确定为第一对象的目标对象。
系统在计算得到每个第三对象的伴随得分后,将其中得分大于预设分值的第三对象确定为第一对象的目标对象。
本申请实施例提供的对象查询方法,能够根据第一对象的第一位置信息和第一时间信息,在预设的候选对象信息集合中确定多个第二对象,并在多个第二对象中确定多个第三对象,第三对象即在某一时刻与第一对象的位置信息有重合的对象;然后基于多个第三对象中每个第三对象关联的位置信息和时间信息,第一对象的第一位置信息和第一时间信息,计算多个第三对象中每个第三对象与第一对象的伴随得分;将得分满足预设要求的第三对象,确定为目标对象。由于第三对象与第一对象在某一时刻与位置信息有重合,所以后续计算伴随得分的过程中同时使用位置信息和时间信息,即参考了位置信息重合的时长,因此得到的目标对象相比传统方法更准确。
在一个实施例中,步骤S140,可以包括步骤S141-S143。
步骤S141,基于多个第三对象中每个第三对象关联的位置信息,第一对象的第一位置信息,计算多个第三对象中每个第三对象的位置信息与第一对象的位置信息的位置相似度值。
在一个示例中,位置相似度值是第三对象和第一对象重合网格数量占第一对象的网格总数的比值。
步骤S142,基于多个第三对象中每个第三对象关联的时间信息和位置信息,第一对象的第一时间信息和第一位置信息,计算多个第三对象中每个第三对象与第一对象的时间相似度值。
在一个示例中,时间相似度值是重合网格对应的第三对象的时间信息和第一时间信息之间的重合时间,与第一时间信息的总时间的比值。
步骤S143,根据位置相似度值与时间相似度值,计算多个第三对象中每个第三对象与第一对象的伴随得分。
本申请实施例提供的对象查询方法,侧重比较相同时空下的伴随时长,按照伴随时间长短赋予关联对象不同的分值,分数越高,说明对象在时段内与第一对象的伴随的时间越长,在统计的过程中充分利用所有轨迹点的信息,并结合伴随对象的时间相关性和空间交叉性,综合度量第一对象与关联对象的轨迹伴随程度,提高时空伴随对象挖掘的时间效率以及准确度。
在一个实施例中,第一时间信息包括与第一位置信息的多个位置中每个位置对应的多个geohash码值对应的子时间信息。步骤S142,可以包括步骤S1421-S1422。
步骤S1421,计算每个第三对象和第一对象重合网格对应的第三对象的子时间信息,与重合网格对应的第一对象的子时间信息之间的重合时间。
步骤S1422,基于第一时间信息的总时间和每个重合时间,计算多个第三对象中每个第三对象与第一对象的时间相似度值。
在一个示例中,步骤S1422,包括如下步骤:
根据重合网格对应的第一对象的子时间信息和预设时长条件,计算每个重合时间的加权重合时间;
基于第一时间信息的总时间和每个加权重合时间,计算多个第三对象中每个第三对象与第一对象的时间相似度值。
本申请实施例提供的对象查询方法,可以基于一个对象的多个位置轨迹和时间信息,查询得到目标对象,速度快、效率高。
在一个实施例中,在步骤S120之前,对象查询方法还可以包括步骤S160-S170。
步骤S160,获取多个候选对象的位置信息以及位置信息对应的时间信息。
在一个示例中,步骤S160,可以包括步骤S161-S162。
步骤S161,获取多个信令数据和多个基站工参数据,信令数据包括对象位置数据和时间数据。
现在手机已经普及,在手机开机的状态下就会产生信令数据。信令数据和工参数据结合就可以得到多个对象的位置数据和时间数据。
步骤S162,根据多个信令数据和多个基站工参数据,确定多个候选对象的位置信息以及位置信息对应的时间信息。
步骤S170,基于每个候选对象的位置信息以及位置信息对应的时间信息,构建候选对象信息集合。
本申请实施例提供的对象查询方法,候选对象信息集合中每个对象的信息可以来源于信令数据和基站工参数据。因此,本申请的方法中的数据包含的对象更多,查询的目标对象结果更准确。
为便于理解,下面以一个具体的示例,介绍本申请提供的对象查询方法。首先,需要向对象查询系统中导入相关数据,包括:geohash网格与其8近邻关联网格(net,net_group);基站与geohash网格对应关系(lac,ci,lon,lat,net);目标号码、时间范围(start,end)。具体查询计算流程包括如下步骤:
步骤一:某市所有用户轨迹数据(天)--先取出天数据速度较快;
步骤二:轨迹数据匹配经纬度,匹配geohash网格,匹配不上经纬度的基站删掉,同时将该条的开始时间stime替换上一条的结束时间end_time,以保持打点时间的连续性;
步骤三:取时间范围内的数据,此时需要注意stime<start、end_time>end等多种情况。
例如:时间范围为(7:00-8:00),则6:30-7:30、7:30-8:20、6:20-8:20的数据都为时点内数据。
步骤四:构建中心大网格,取目标打点基站所属网格以及以所属网格为中心的8近邻网格,共计9个网格为中心大网格,注意此处删除重复项。
步骤五:所有用户在每个大网格打点上的轨迹数据,做时间连续踢重处理,不连续点分组标记,计算用户在大网格不同分组的最早时间和最晚时间。
例如:用户a在大网格A的打点数据,判断上一条end_time与下一条stime是否相同,相同为连续点,需做踢重处理。反之则做分组标记。计算组内最早时间和最晚时间。
步骤六:将目标用户在组内的最早时间和最晚时间关联所有用户的最早时间和最晚时间,筛选出时间交叉的网格,计算交叉时间,交叉情况如表1所示,其中st’为目标用户组内最早时间,et’为目标用户最内最晚时间;st为关联用户组内最早时间,et为关联用户最内最晚时间。
表1交叉时间表
情况类型 | 交叉时间x_time | |
1 | st<=st’and et>=et’ | et’-st’ |
2 | st<st’and st’<et<=et’ | et-st’ |
3 | et>et’and st’<=st<et’ | et’-st |
4 | st’<st<et’and st’<et<et’ | et-st |
步骤七:判断停留点,若目标用户在组内的打点时间大于1800s(30分钟),将在该组的交叉时间加倍,x_time*2。
步骤八:统计目标用户与关联用户交叉大网格数、交叉时间、目标用户总大网格数、给定时间范围长度,计算交叉网格数比值与交叉时间比值。
交叉网格数比值=交叉网格数/目标用户总大网格数
交叉时间比值=交叉时间/给定时间范围长度
步骤九:将两个比值进行标准化处理,(x-min(x))/(max(x)-min(x)),消除量纲影响,缩小值域范围为[0,1]。
表2 geo_code长度和距离的对照表
geohash length | width | height |
1 | 5009.4km | 4992.6km |
2 | 1252.3km | 624.1km |
3 | 156.5km | 156km |
4 | 39.1km | 19.5km |
5 | 4.9km | 4.9km |
6 | 1.2km | 609.4m |
7 | 152.9m | 152.4m |
8 | 38.2m | 19m |
9 | 4.8m | 4.8m |
10 | 1.2m | 59.5cm |
11 | 14.9cm | 14.9cm |
12 | 3.7cm | 1.9cm |
步骤十:计算轨迹伴随程度得分=scale(交叉网格数比值)*0.5+scale(交叉时间比值)*0.5
本次建模采用的是长度为6的geohash网格,每个网格涉及的平面范围为1.2km*609m,加入8近邻后构成的大网格涉及范围为1.2km*3*609m*3,geo_code长度和距离的对照表如下:
可以看出,geohash串的长度越短,网格涉及的范围越广,长度越长,网格涉及的范围越小,在识别伴随用户的过程中,是以目标用户每一个打点位置的所属网格作为参照,保留相同时刻属于同一网格的关联用户计算伴随度,若网格范围较大,会导致筛选出的关联用户精度较低,识别出的伴随用户群体相对较大,与其保持相同速度行进的道路用户也会判别为伴随用户;若网格范围较小,由于基站打点位置的不稳定性,即使为真实伴随状态的用户其所属网格也会差别很大,因此导致识别出来的伴随人数过低。
下面以该市的对象A为例,选取其一天上午(7:00-8:30)的轨迹数据为分析主体进行验证,从实际数据来看,由于硬件设备或基站信号微弱等原因,少量关联用户在库中的轨迹打点数据存在大量缺失,这些异常数据会影响模型阈值的设定以及后续模型效果评估,故在验证阶段,先清除异常用户数据,以下为模型测算结果:
从样本分值区间可以得出,将score阈值设置为0.7,满足条件的用户数为27,查全率为90%。
表3查全率表
score | cnt | 占比 |
0.2-0.3 | 1 | 0.033333 |
0.2-0.3 | 2 | 0.066667 |
0.2-0.3 | 12 | 0.4 |
0.2-0.3 | 11 | 0.366667 |
0.2-0.3 | 4 | 0.133333 |
总计 | 30 | 1 |
score在0.7以上 | 27 | 0.9 |
从全量用户中搜索满足score>=0.7的用户,具体人数分布如下:
表4人数分布表
基于上述实施例提供的对象查询方法,相应地,本申请实施例还提供一种对象查询装置,请参考图4,包括:
第一获取模块401,被配置为获取第一查询请求,第一查询请求包括第一对象的第一位置信息及与第一位置信息对应的第一时间信息;
第一判断模块402,被配置为根据第一位置信息,在预设的候选对象信息集合中确定多个第二对象;
第二判断模块403,被配置为根据第一时间信息,在多个第二对象中确定多个第三对象;
第一信息处理模块404,被配置为基于多个第三对象中每个第三对象关联的位置信息和时间信息,第一对象的第一位置信息和第一时间信息,计算多个第三对象中每个第三对象与第一对象的伴随得分,伴随得分指示第三对象与第一对象在第一时间信息对应的时间范围内位置信息的相似度;
目标对象确定模块405,被配置为将伴随得分大于预设分值的第三对象,确定为第一对象的目标对象。
本申请实施例的一种对象查询装置,在查询目标对象时侧重比较相同时空下的伴随时长,按照伴随时间长短赋予关联对象(即第三对象)不同的分值,分数越高,说明对象在时段内与第一对象的伴随的时间越长,在统计的过程中充分利用所有轨迹点的信息,并结合伴随对象的时间相关性和空间交叉性,综合度量第一对象与关联对象的轨迹伴随程度,提高时空伴随对象挖掘的时间效率以及准确度。
在一个实施例中,第一信息处理模块404,可以具体包括第一计算子模块、第二计算子模块和第三计算子模块。
第一计算子模块,被配置为基于多个第三对象中每个第三对象关联的位置信息,第一对象的第一位置信息,计算多个第三对象中每个第三对象的位置信息与第一对象的位置信息的位置相似度值;
第二计算子模块,被配置为基于多个第三对象中每个第三对象关联的时间信息和位置信息,第一对象的第一时间信息和第一位置信息,计算多个第三对象中每个第三对象与第一对象的时间相似度值;
第三计算子模块,被配置为根据位置相似度值与时间相似度值,计算多个第三对象中每个第三对象与第一对象的伴随得分。
在一个实施例中,第一获取模块401中的第一位置信息包括对象的多个位置中每个位置对应的多个空间索引编码geohash码值;多个空间索引编码geohash码值包括多个位置中每个位置的geohash码值及与geohash码值对应的网格相邻的至少一个近邻网格的geohash码值。
在一个示例中,第一计算子模块中的位置相似度值是第三对象和第一对象重合网格数量占第一对象的网格总数的比值。
在一个实施例中,第一获取模块401中的第一时间信息包括与第一位置信息的多个位置中每个位置对应的多个geohash码值对应的子时间信息。
第二计算子模块,可以具体包括第一计算单元和第二计算单元。
第一计算单元,被配置为计算每个第三对象和第一对象重合网格对应的第三对象的子时间信息,与重合网格对应的第一对象的子时间信息之间的重合时间。
第二计算单元,被配置为基于第一时间信息的总时间和每个重合时间,计算多个第三对象中每个第三对象与第一对象的时间相似度值。
在一个示例中,第二计算单元,可以具体包括第一计算子单元和第二计算子单元。
第一计算子单元,被配置为根据重合网格对应的第一对象的子时间信息和预设时长条件,计算每个重合时间的加权重合时间。
第二计算子单元,被配置为基于第一时间信息的总时间和每个加权重合时间,计算多个第三对象中每个第三对象与第一对象的时间相似度值。
在一个示例中,第二计算单元中的时间相似度值是重合网格对应的第三对象的时间信息和第一时间信息之间的重合时间,与第一时间信息的总时间的比值。
在一个实施例中,对象查询装置还可以包括第二获取模块和集合构建模块,其中第二获取模块和集合构建模块在第一获取模块401之前。
第二获取模块,被配置为获取多个候选对象的位置信息以及位置信息对应的时间信息。
集合构建模块,被配置为基于每个候选对象的位置信息以及位置信息对应的时间信息,构建候选对象信息集合。
在一个示例中,第二获取模块,可以具体包括第一获取子模块和第一判断子模块。
第一获取子模块,被配置为获取多个信令数据和多个基站工参数据,信令数据包括对象位置数据和时间数据;
第一判断子模块,被配置为根据多个信令数据和多个基站工参数据,确定多个候选对象的位置信息以及位置信息对应的时间信息。
上述各实施例提供的对象查询方法可以由图5所示的对象查询设备执行。
对象查询设备可以包括处理器501以及存储有计算机程序指令的存储器502。
具体地,上述处理器501可以包括CPU,或者特定集成电路(Application SpecificIntegrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。
存储器502可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器502可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器502可以包括可移除或不可移除(或固定)的介质,或者存储器502是非易失性固态存储器。存储器502可在综合网关容灾设备的内部或外部。
在一个实例中,存储器502可以是只读存储器(Read Only Memory,ROM)。在一个实例中,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
存储器502可以包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本公开的一方面的方法所描述的操作。
处理器501通过读取并执行存储器502中存储的计算机程序指令,以实现上述任一实施例提供的对象查询方法,并达到该方法达到的相应技术效果,为简洁描述在此不再赘述。
在一个示例中,对象查询设备还可包括通信接口503和总线510。其中,如图5所示,处理器501、存储器502、通信接口503通过总线510连接并完成相互间的通信。
通信接口503,主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。
总线510包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industry Standard Architecture,ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线510可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。
该对象查询设备在查询目标对象时侧重比较相同时空下的伴随时长,按照伴随时间长短赋予关联对象(即第三对象)不同的分值,分数越高,说明对象在时段内与第一对象的伴随的时间越长,在统计的过程中充分利用所有轨迹点的信息,并结合伴随对象的时间相关性和空间交叉性,综合度量第一对象与关联对象的轨迹伴随程度,提高时空伴随对象挖掘的时间效率以及准确度。
结合上述实施例中的对象查询方法,本发明实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种对象查询方法。
需要明确的是,本发明并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本发明的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本发明的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等。当以软件方式实现时,本发明的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RadioFrequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本发明中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本发明不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本公开的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本发明的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。
Claims (11)
1.一种对象查询方法,其特征在于,包括:
获取第一查询请求,所述第一查询请求包括第一对象的第一位置信息及与第一位置信息对应的第一时间信息;
根据所述第一位置信息,在预设的候选对象信息集合中确定多个第二对象;
根据所述第一时间信息,在所述多个第二对象中确定多个第三对象;
基于所述多个第三对象中每个第三对象关联的位置信息和时间信息,所述第一对象的第一位置信息和第一时间信息,计算所述多个第三对象中每个第三对象与所述第一对象的伴随得分,所述伴随得分指示所述第三对象与所述第一对象在所述第一时间信息对应的时间范围内位置信息的相似度;
将所述伴随得分大于预设分值的所述第三对象,确定为所述第一对象的目标对象;
所述基于所述多个第三对象中每个第三对象关联的位置信息和时间信息,所述第一对象的第一位置信息和第一时间信息,计算所述多个第三对象中每个第三对象与所述第一对象的伴随得分,包括:
基于所述多个第三对象中每个第三对象关联的位置信息,所述第一对象的第一位置信息,计算所述多个第三对象中每个第三对象的位置信息与所述第一对象的位置信息的位置相似度值;
基于所述多个第三对象中每个第三对象关联的时间信息和位置信息,所述第一对象的第一时间信息和第一位置信息,计算所述多个第三对象中每个第三对象与所述第一对象的时间相似度值;
根据所述位置相似度值与所述时间相似度值,计算所述多个第三对象中每个第三对象与所述第一对象的伴随得分。
2.根据权利要求1所述的方法,其特征在于,所述第一位置信息包括对象的多个位置中每个位置对应的多个空间索引编码geohash码值;
所述多个空间索引编码geohash码值包括所述多个位置中每个位置的geohash码值及与所述geohash码值对应的网格相邻的至少一个近邻网格的geohash码值。
3.根据权利要求2所述的方法,其特征在于,所述位置相似度值是所述第三对象和所述第一对象重合网格数量占所述第一对象的网格总数的比值。
4.根据权利要求2所述的方法,其特征在于,所述第一时间信息包括与所述第一位置信息的多个位置中每个位置对应的多个geohash码值对应的子时间信息;
所述基于所述多个第三对象中每个第三对象关联的时间信息和位置信息,所述第一对象的第一时间信息和第一位置信息,计算所述多个第三对象中每个第三对象与所述第一对象的时间相似度值,包括:
计算每个所述第三对象和所述第一对象重合网格对应的第三对象的子时间信息,与所述重合网格对应的第一对象的子时间信息之间的重合时间;
基于所述第一时间信息的总时间和每个所述重合时间,计算所述多个第三对象中每个第三对象与所述第一对象的时间相似度值。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一时间信息的总时间和每个所述重合时间,计算所述多个第三对象中每个第三对象与所述第一对象的时间相似度值,包括:
根据所述重合网格对应的第一对象的子时间信息和预设时长条件,计算每个所述重合时间的加权重合时间;
基于所述第一时间信息的总时间和每个所述加权重合时间,计算所述多个第三对象中每个第三对象与所述第一对象的时间相似度值。
6.根据权利要求4或5所述的方法,其特征在于,所述时间相似度值是所述重合网格对应的所述第三对象的时间信息和所述第一时间信息之间的重合时间,与所述第一时间信息的总时间的比值。
7.根据权利要求1所述的方法,其特征在于,所述根据所述第一位置信息,在预设的候选对象信息集合中确定多个第二对象之前,所述方法还包括:
获取多个候选对象的位置信息以及所述位置信息对应的时间信息;
基于每个候选对象的位置信息以及所述位置信息对应的时间信息,构建候选对象信息集合。
8.根据权利要求7所述的方法,其特征在于,所述获取多个候选对象的位置信息以及所述位置信息对应的时间信息,包括:
获取多个信令数据和多个基站工参数据,所述信令数据包括对象位置数据和时间数据;
根据所述多个信令数据和多个基站工参数据,确定多个候选对象的位置信息以及所述位置信息对应的时间信息。
9.一种对象查询装置,其特征在于,包括:
第一获取模块,被配置为获取第一查询请求,所述第一查询请求包括第一对象的第一位置信息及与第一位置信息对应的第一时间信息;
第一判断模块,被配置为根据所述第一位置信息,在预设的候选对象信息集合中确定多个第二对象;
第二判断模块,被配置为根据所述第一时间信息,在所述多个第二对象中确定多个第三对象;
第一信息处理模块,被配置为基于所述多个第三对象中每个第三对象关联的位置信息和时间信息,所述第一对象的第一位置信息和第一时间信息,计算所述多个第三对象中每个第三对象与所述第一对象的伴随得分,所述伴随得分指示所述第三对象与所述第一对象在所述第一时间信息对应的时间范围内位置信息的相似度;
目标对象确定模块,被配置为将所述伴随得分大于预设分值的所述第三对象,确定为所述第一对象的目标对象;
所述第一信息处理模块,还包括第一计算子模块、第二计算子模块和第三计算子模块;
所述第一计算子模块,被配置为基于所述多个第三对象中每个第三对象关联的位置信息,所述第一对象的第一位置信息,计算所述多个第三对象中每个第三对象的位置信息与所述第一对象的位置信息的位置相似度值;
所述第二计算子模块,被配置为基于所述多个第三对象中每个第三对象关联的时间信息和位置信息,所述第一对象的第一时间信息和第一位置信息,计算所述多个第三对象中每个第三对象与所述第一对象的时间相似度值;
第三计算子模块,被配置为根据所述位置相似度值与所述时间相似度值,计算所述多个第三对象中每个第三对象与所述第一对象的伴随得分。
10.一种对象查询设备,其特征在于,所述设备包括:处理器,以及存储有计算机程序指令的存储器;所述处理器读取并执行所述计算机程序指令,以实现如权利要求1-8任意一项所述对象查询方法。
11.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-8任意一项所述的对象查询方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011606095.3A CN112788524B (zh) | 2020-12-28 | 2020-12-28 | 对象查询方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011606095.3A CN112788524B (zh) | 2020-12-28 | 2020-12-28 | 对象查询方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112788524A CN112788524A (zh) | 2021-05-11 |
CN112788524B true CN112788524B (zh) | 2022-12-16 |
Family
ID=75753357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011606095.3A Active CN112788524B (zh) | 2020-12-28 | 2020-12-28 | 对象查询方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112788524B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113704378A (zh) * | 2021-09-02 | 2021-11-26 | 北京锐安科技有限公司 | 一种伴随信息的确定方法、装置、设备及存储介质 |
CN114339642B (zh) * | 2021-12-27 | 2023-06-02 | 恒安嘉新(北京)科技股份公司 | 伴随用户的识别方法、装置、设备及介质 |
CN114741612B (zh) * | 2022-06-13 | 2022-09-02 | 北京融信数联科技有限公司 | 一种基于大数据的消费习惯分类方法、系统和存储介质 |
CN115936331B (zh) * | 2022-11-01 | 2023-10-27 | 中科雨辰科技有限公司 | 一种基于距离获取目标任务对象的数据处理系统 |
CN117177185B (zh) * | 2023-11-02 | 2024-03-26 | 中国信息通信研究院 | 一种基于手机通信数据的号码伴随辅助识别方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109325089A (zh) * | 2018-10-10 | 2019-02-12 | 北京锐安科技有限公司 | 一种非定点对象查询方法、装置、终端设备及存储介质 |
CN110837582B (zh) * | 2019-11-28 | 2022-06-03 | 重庆紫光华山智安科技有限公司 | 数据关联方法、装置、电子设备和计算机可读存储介质 |
-
2020
- 2020-12-28 CN CN202011606095.3A patent/CN112788524B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN112788524A (zh) | 2021-05-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112788524B (zh) | 对象查询方法、装置、设备及存储介质 | |
CN109033011B (zh) | 计算轨迹频繁度的方法、装置、存储介质及电子设备 | |
CN108320501B (zh) | 基于用户手机信令的公交线路识别方法 | |
Li et al. | T-DesP: Destination prediction based on big trajectory data | |
CN112015835B (zh) | Geohash压缩的地图匹配方法 | |
CN109688532B (zh) | 一种划分城市功能区域的方法及装置 | |
CN107463585B (zh) | 指纹数据入库处理方法及装置 | |
CN108932310B (zh) | 空间服务提供方法、装置、服务器及存储设备 | |
CN110020224B (zh) | 地图兴趣点数据的关联方法、装置、设备及介质 | |
CN112487256B (zh) | 对象查询方法、装置、设备及存储介质 | |
CN111292356B (zh) | 运动轨迹与道路的匹配方法及装置 | |
CN111651681B (zh) | 云网融合环境下基于智能信息推荐的消息推送方法及装置 | |
CN112988936A (zh) | 出行轨迹预测方法、装置、计算设备及存储介质 | |
CN110263840B (zh) | 一种线路分析方法、装置及程序产品、存储介质 | |
CN112381078B (zh) | 基于高架的道路识别方法、装置、计算机设备和存储介质 | |
CN112050820A (zh) | 道路匹配方法、装置、电子设备及可读存储介质 | |
CN112328728A (zh) | 挖掘出行者轨迹的聚类方法、装置、电子装置和存储介质 | |
CN103744861A (zh) | 一种轨迹数据中的频繁子轨迹查找方法及装置 | |
Qian et al. | Detecting taxi trajectory anomaly based on spatio-temporal relations | |
CN114885369A (zh) | 网络覆盖质量检测处理方法、装置、电子设备和存储介质 | |
CN113483729A (zh) | 一种基于隐私保护和机器负载平衡的经纬测距方法 | |
CN115587503B (zh) | 基于多模式仿真的个体出行链还原方法 | |
CN116361327A (zh) | 一种基于二级时空索引的轨迹伴随关系挖掘方法和系统 | |
CN107103030A (zh) | 一种人与人相遇的确定方法和装置 | |
CN112234995A (zh) | 基于时空编码的信令压缩方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |