CN112653995A - 一种用户身份识别方法、装置和计算机可读存储介质 - Google Patents
一种用户身份识别方法、装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN112653995A CN112653995A CN201910968882.3A CN201910968882A CN112653995A CN 112653995 A CN112653995 A CN 112653995A CN 201910968882 A CN201910968882 A CN 201910968882A CN 112653995 A CN112653995 A CN 112653995A
- Authority
- CN
- China
- Prior art keywords
- track
- user
- data
- segment
- fingerprint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Collating Specific Patterns (AREA)
Abstract
本发明实施例提供了一种用户身份识别方法、装置和计算机可读存储介质,所述方法包括:确定预设周期内各用户与基站信息相关的轨迹数据;按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
Description
技术领域
本发明涉及移动通信技术领域,尤其涉及一种用户身份识别方法、装置和计算机可读存储介质。
背景技术
移动运营商的现网中存在多个虚拟身份对应同一个物理身份的情形,目前对用户身份的识别有两大类:一类为利用移动用户的通信信息构造呼叫指纹进行身份识别,这种方式随着即时APP的发展,用户采用传统的呼叫和短信进行通信的频率越来越多,对用户身份不容易快速识别,且存在不能识别的场景,对用户身份的识别准确率较低;另一类为利用移动用户的位置轨迹进行身份识别,基站切换时因信号的强度变化常常会出现异常跳变点,增加了数据处理的复杂度,且位置轨迹信息缺乏时间特性,丢失了重要的移动特征,降低了匹配的准确性。
发明内容
有鉴于此,本发明实施例期望提供一种用户身份识别方法、装置和计算机可读存储介质。
为达到上述目的,本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种用户身份识别方法,该方法包括:
确定预设周期内各用户与基站信息相关的轨迹数据;
按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;
将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;
基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;
将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;
基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
其中,所述确定预设周期内各用户与基站信息相关的轨迹数据,包括:
基于各用户的基站位置更新信令数据以及该用户的上网数据形成各用户的轨迹数据序列;所述轨迹数据序列中的每个元素包括基站标号以及切换到该基站的时间。
其中,所述轨迹片段数据集中的每个轨迹片段数据包括:
轨迹片段、用户切换到该轨迹片段的时间,以及在该轨迹片段的驻留时间。
其中,所述将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,包括:
将轨迹片段数据集中轨迹片段相同、且用户切换到相应轨迹片段的时间差值在预设时间内的轨迹片段数据进行汇聚,得到该用户的时域轨迹片段的集合;
每个时域轨迹片段包括:由用户切换到该轨迹片段的时间和轨迹片段组成的复合键、该轨迹片段的重复次数,以及在该轨迹片段驻留的累计时长。
其中,所述基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据之前,该方法还包括:
剔除所述集合中不满足预设阈值的时域轨迹片段。
可选的,该方法还包括:
基于轨迹片段的重复次数以及用户在该轨迹片段驻留的累计时长,确定所述时域轨迹片段对应的权重。
其中,所述基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份,包括:
生成待识别用户的移动轨迹指纹数据;
将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对;
依据比对结果确定用户身份。
其中,所述将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对,依据比对结果确定用户身份,包括:
将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理;
将预处理后两个用户的移动轨迹指纹数据采用余弦相似性比对算法比较两个用户的移动轨迹指纹相似度,得到相似度系数;
基于预设阈值和所述相似度系数判断所述两个用户是否为相同用户。
其中,所述将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理,包括:
比较两个用户移动轨迹指纹数据中的每对元素;
确定待识别用户移动轨迹指纹数据中一个元素的轨迹片段和另一用户移动轨迹指纹数据中一个元素的轨迹片段相同,且用户切换到该轨迹片段的时间差值在预设时间内,则认为两者是相同的轨迹;
将两个用户的对应元素中的用户切换到该轨迹片段的时间均修改为原来两个用户各自切换到对应轨迹片段时间的平均值。
本发明实施例还提供了一种用户身份识别装置,该装置包括:
确定模块,用于确定预设周期内各用户与基站信息相关的轨迹数据;
切片模块,用于按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;
汇聚模块,用于将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;
生成模块,用于基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;
识别模块,基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
本发明实施例还提供了一种用户身份识别装置,该装置包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行上述方法的步骤。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本发明实施例提供的用户身份识别方法、装置和计算机可读存储介质,确定预设周期内各用户与基站信息相关的轨迹数据;按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。相比传统方法,本发明实施例利用基站信息,用户只要开机,无论是否有通话都会有数据,因此仅仅需要较短的时间即可构建起用户的历史移动轨迹指纹数据库;而且不需要计算基站的绝对经纬度数据,简化了数据运算的复杂性;另外,基于预设步长划分得到的基站轨迹片段进行用户移动轨迹指纹数据的提取,一方面充分利用用户位置移动导致基站切换的时序特征,另一方面考虑到基站切换的不确定性,因而更能表征用户的位置以及移动的特异性,从而能更准确地识别用户。
此外,本发明实施例在移动轨迹数据中增加了时间特征,从时空两个维度强化了用户的移动特性,从而也能提高用户的识别准确性。
附图说明
图1为本发明实施例所述用户身份识别方法流程示意图;
图2为本发明实施例所述用户身份识别装置结构示意图;
图3为本发明场景实施例所述基站分布示意图;
图4为本发明场景实施例所述装置模块组成示意图。
具体实施方式
下面结合附图和实施例对本发明进行描述。
本发明实施例提供了一种用户身份识别方法,如图1所示,该方法包括:
步骤101:确定预设周期内各用户与基站信息相关的轨迹数据;
步骤102:按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;
步骤103:将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;
步骤104:基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;
步骤105:将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;
步骤106:基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
本发明实施例中,所述确定预设周期内各用户与基站信息相关的轨迹数据,包括:
基于各用户的基站位置更新信令数据以及该用户的上网数据形成各用户的轨迹数据序列;所述轨迹数据序列中的每个元素包括基站标号以及切换到该基站的时间。
本发明实施例中,所述轨迹片段数据集中的每个轨迹片段数据包括:
轨迹片段、用户切换到该轨迹片段的时间,以及在该轨迹片段的驻留时间。
本发明实施例中,所述将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,包括:
将轨迹片段数据集中轨迹片段相同、且用户切换到相应轨迹片段的时间差值在预设时间内的轨迹片段数据进行汇聚,得到该用户的时域轨迹片段的集合;
每个时域轨迹片段包括:由用户切换到该轨迹片段的时间和轨迹片段组成的复合键、该轨迹片段的重复次数,以及在该轨迹片段驻留的累计时长。
本发明一个实施例中,所述基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据之前,该方法还包括:
剔除所述集合中不满足预设阈值的时域轨迹片段。
本发明一个实施例中,该方法还包括:
基于轨迹片段的重复次数以及用户在该轨迹片段驻留的累计时长,确定所述时域轨迹片段对应的权重。
本发明实施例中,所述基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份,包括:
生成待识别用户的移动轨迹指纹数据;
将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对;
依据比对结果确定用户身份。
本发明实施例中,所述将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对,依据比对结果确定用户身份,包括:
将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理;
将预处理后两个用户的移动轨迹指纹数据采用余弦相似性比对算法比较两个用户的移动轨迹指纹相似度,得到相似度系数;
基于预设阈值和所述相似度系数判断所述两个用户是否为相同用户。
本发明实施例中,所述将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理,包括:
比较两个用户移动轨迹指纹数据中的每对元素;
确定待识别用户移动轨迹指纹数据中一个元素的轨迹片段和另一用户移动轨迹指纹数据中一个元素的轨迹片段相同,且用户切换到该轨迹片段的时间差值在预设时间内,则认为两者是相同的轨迹;
将两个用户的对应元素中的用户切换到该轨迹片段的时间均修改为原来两个用户各自切换到对应轨迹片段时间的平均值。
本发明实施例利用基站信息,用户只要开机,无论是否有通话都会有数据,因此仅仅需要较短的时间即可构建起用户的历史移动轨迹指纹数据库;而且不需要计算基站的绝对经纬度数据,简化了数据运算的复杂性;另外,基于预设步长划分得到的基站轨迹片段进行用户移动轨迹指纹数据的提取,一方面充分利用用户位置移动导致基站切换的时序特征,另一方面考虑到基站切换的不确定性,因而更能表征用户的位置以及移动的特异性,从而能更准确地识别用户。
为了实现上述方法实施例,本发明实施例还提供了一种用户身份识别装置,如图2所示,该装置包括:
确定模块201,用于确定预设周期内各用户与基站信息相关的轨迹数据;
切片模块202,用于按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;
汇聚模块203,用于将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;
生成模块204,用于基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;
识别模块205,基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
本发明实施例中,所述确定模块201确定预设周期内各用户与基站信息相关的轨迹数据,包括:
基于各用户的基站位置更新信令数据以及该用户的上网数据形成各用户的轨迹数据序列;所述轨迹数据序列中的每个元素包括基站标号以及切换到该基站的时间。
本发明实施例中,所述轨迹片段数据集中的每个轨迹片段数据包括:
轨迹片段、用户切换到该轨迹片段的时间,以及在该轨迹片段的驻留时间。
本发明实施例中,所述汇聚模块203将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,包括:
将轨迹片段数据集中轨迹片段相同、且用户切换到相应轨迹片段的时间差值在预设时间内的轨迹片段数据进行汇聚,得到该用户的时域轨迹片段的集合;
每个时域轨迹片段包括:由用户切换到该轨迹片段的时间和轨迹片段组成的复合键、该轨迹片段的重复次数,以及在该轨迹片段驻留的累计时长。
本发明一个实施例中,所述生成模块204基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据之前,还用于剔除所述集合中不满足预设阈值的时域轨迹片段。
本发明一个实施例中,所述生成模块204,还用于基于轨迹片段的重复次数以及用户在该轨迹片段驻留的累计时长,确定所述时域轨迹片段对应的权重。
本发明实施例中,所述识别模块205基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份,包括:
生成待识别用户的移动轨迹指纹数据;
将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对;
依据比对结果确定用户身份。
本发明实施例中,所述识别模块205将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对,依据比对结果确定用户身份,包括:
将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理;
将预处理后两个用户的移动轨迹指纹数据采用余弦相似性比对算法比较两个用户的移动轨迹指纹相似度,得到相似度系数;
基于预设阈值和所述相似度系数判断所述两个用户是否为相同用户。
本发明实施例中,所述识别模块205将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理,包括:
比较两个用户移动轨迹指纹数据中的每对元素;
确定待识别用户移动轨迹指纹数据中一个元素的轨迹片段和另一用户移动轨迹指纹数据中一个元素的轨迹片段相同,且用户切换到该轨迹片段的时间差值在预设时间内,则认为两者是相同的轨迹;
将两个用户的对应元素中的用户切换到该轨迹片段的时间均修改为原来两个用户各自切换到对应轨迹片段时间的平均值。
本发明实施例还提供了一种用户身份识别装置,该装置包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行:
确定预设周期内各用户与基站信息相关的轨迹数据;
按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;
将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;
基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;
将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;
基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
所述确定预设周期内各用户与基站信息相关的轨迹数据时,所述处理器还用于运行所述计算机程序时,执行:
基于各用户的基站位置更新信令数据以及该用户的上网数据形成各用户的轨迹数据序列;所述轨迹数据序列中的每个元素包括基站标号以及切换到该基站的时间。
其中,所述轨迹片段数据集中的每个轨迹片段数据包括:
轨迹片段、用户切换到该轨迹片段的时间,以及在该轨迹片段的驻留时间。
所述将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚时,所述处理器还用于运行所述计算机程序时,执行:
将轨迹片段数据集中轨迹片段相同、且用户切换到相应轨迹片段的时间差值在预设时间内的轨迹片段数据进行汇聚,得到该用户的时域轨迹片段的集合;
每个时域轨迹片段包括:由用户切换到该轨迹片段的时间和轨迹片段组成的复合键、该轨迹片段的重复次数,以及在该轨迹片段驻留的累计时长。
所述基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据之前,所述处理器还用于运行所述计算机程序时,执行:
剔除所述集合中不满足预设阈值的时域轨迹片段。
所述处理器还用于运行所述计算机程序时,执行:
基于轨迹片段的重复次数以及用户在该轨迹片段驻留的累计时长,确定所述时域轨迹片段对应的权重。
所述基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份时,所述处理器还用于运行所述计算机程序时,执行:
生成待识别用户的移动轨迹指纹数据;
将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对;
依据比对结果确定用户身份。
所述将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对,依据比对结果确定用户身份时,所述处理器还用于运行所述计算机程序时,执行:
将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理;
将预处理后两个用户的移动轨迹指纹数据采用余弦相似性比对算法比较两个用户的移动轨迹指纹相似度,得到相似度系数;
基于预设阈值和所述相似度系数判断所述两个用户是否为相同用户。
所述将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理时,所述处理器还用于运行所述计算机程序时,执行:
比较两个用户移动轨迹指纹数据中的每对元素;
确定待识别用户移动轨迹指纹数据中一个元素的轨迹片段和另一用户移动轨迹指纹数据中一个元素的轨迹片段相同,且用户切换到该轨迹片段的时间差值在预设时间内,则认为两者是相同的轨迹;
将两个用户的对应元素中的用户切换到该轨迹片段的时间均修改为原来两个用户各自切换到对应轨迹片段时间的平均值。
需要说明的是:上述实施例提供的装置在进行用户身份识别时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将设备的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的装置与相应方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
在示例性实施例中,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、Flash Memory、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备,如移动电话、计算机、平板设备、个人数字助理等。
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,执行:
确定预设周期内各用户与基站信息相关的轨迹数据;
按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;
将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;
基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;
将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;
基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
所述确定预设周期内各用户与基站信息相关的轨迹数据时,所述计算机程序被处理器运行时,还执行:
基于各用户的基站位置更新信令数据以及该用户的上网数据形成各用户的轨迹数据序列;所述轨迹数据序列中的每个元素包括基站标号以及切换到该基站的时间。
其中,所述轨迹片段数据集中的每个轨迹片段数据包括:
轨迹片段、用户切换到该轨迹片段的时间,以及在该轨迹片段的驻留时间。
所述将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚时,所述计算机程序被处理器运行时,还执行:
将轨迹片段数据集中轨迹片段相同、且用户切换到相应轨迹片段的时间差值在预设时间内的轨迹片段数据进行汇聚,得到该用户的时域轨迹片段的集合;
每个时域轨迹片段包括:由用户切换到该轨迹片段的时间和轨迹片段组成的复合键、该轨迹片段的重复次数,以及在该轨迹片段驻留的累计时长。
所述基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据之前,所述计算机程序被处理器运行时,还执行:
剔除所述集合中不满足预设阈值的时域轨迹片段。
所述计算机程序被处理器运行时,还执行:
基于轨迹片段的重复次数以及用户在该轨迹片段驻留的累计时长,确定所述时域轨迹片段对应的权重。
所述基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份时,所述计算机程序被处理器运行时,还执行:
生成待识别用户的移动轨迹指纹数据;
将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对;
依据比对结果确定用户身份。
所述将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对,依据比对结果确定用户身份时,所述计算机程序被处理器运行时,还执行:
将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理;
将预处理后两个用户的移动轨迹指纹数据采用余弦相似性比对算法比较两个用户的移动轨迹指纹相似度,得到相似度系数;
基于预设阈值和所述相似度系数判断所述两个用户是否为相同用户。
所述将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理时,所述计算机程序被处理器运行时,还执行:
比较两个用户移动轨迹指纹数据中的每对元素;
确定待识别用户移动轨迹指纹数据中一个元素的轨迹片段和另一用户移动轨迹指纹数据中一个元素的轨迹片段相同,且用户切换到该轨迹片段的时间差值在预设时间内,则认为两者是相同的轨迹;
将两个用户的对应元素中的用户切换到该轨迹片段的时间均修改为原来两个用户各自切换到对应轨迹片段时间的平均值。
下面结合场景实施例对本发明进行描述。
相关技术中,利用移动用户的通信信息构造呼叫指纹进行身份识别的方法存在的问题包括:
模型的即时性比较差,原因在于随着即时通讯APP的发展,用户采用传统的呼叫和短信进行通信的频率越来越低,因此往往需要2-3个月才能积累起足够样本数据以构建呼叫指纹数据库;
存在不能识别的场景,例如一个用户使用多个不同用途的手机,一个用于工作,一个用于生活,由于两者的朋友圈不同,因此呼叫指纹不能匹配;
用户呼叫朋友圈随着时间会发生变化,由于构建历史指纹数据库以及待匹配用户指纹数据库往往需要半年的数据,往往导致识别准确率降低。
利用移动用户的位置轨迹进行身份识别的方法大体有两种:
采用传统的最长公共子序列(Longest Common Subsequence,LCSS)算法计算最大相似路径,然后将移动轨迹中的各个点转换为经纬度并计算两条路径的欧式距离来判断相似性。
该类方法存在的问题包括:
基站切换由于信号的强度变化常常会出现异常跳变点,为得到基站的稳定最大相似路径就需要剔除这些异常跳变点,增加了数据处理的复杂性;
比较两条最大路径的相似性需要计算基站的绝对经纬度数据,而这同样带来数据运算的复杂性;
采用的位置轨迹信息仅有空间特性,没有时间特性,丢失了重要的移动特征,降低了匹配的准确性;
将移动轨迹每个点分到指定经纬度间隔的网格中,计算每个网格轨迹点出现的次数,提取出现次数最多的TopN网格数据进行相似度的计算。
该类方法存在的问题包括:
将用户访问的各个基站看作孤立的点,统一按照集合进行处理,忽略了用户轨迹中的顺序特征,丢失了重要的移动信息,降低了匹配的准确性;
由于需要将轨迹点映射到相应的经纬度网格,由此带来数据运算的复杂性;
采用的位置轨迹信息仅有空间特性,没有时间特性,丢失了重要的移动特征,降低了匹配的准确性。
本实施例利用移动用户的基站切换数据,构造出简单依赖基站信息(无需经纬度数据),包含时空特性并且能充分反映用户移动特性的指纹数据库,通过对指纹数据库的比对来实现用户身份的识别,降低用户身份识别算法的复杂性,提高识别效率以及满足用户的模型即时性要求。
如图3所示,假设ABCDMN是6个移动基站,A为某一地铁站,D为附近的某一个写字楼,每天有大量的人员要从A移动到D,假设用户1从A移动到D的基站切换次序为A->B->C->D,而用户2由于生活习惯的不同选择的路径更靠近基站B和M的交界点,我们知道在交接点由于信号强度的波动,可能存在基站B的M的多次切换,因此用户2的基站切换次序可能为A->B->M->B->C->D,同样而用户3由于某种原因可能存在基站C的N的多次切换,可能的基站切换次序可能为A->B->C->N->C->D;在传统的技术方案中,可能认为M或者N是异常跳变点予以滤除,从而三个用户的移动轨迹均变为A->B->C->D,如果应用于用户身份识别场景将发生误判。
在实施例中,我们认为这些异常跳变点非但不是异常,而且应该是表征用户特异性的重要数据,特别是如果这种跳变在长的时间周期反复发生。同样的,我们认为基站的切换时序相比单个离散基站能更好地表征用户的特异性,同时由于跳变点的存在,过长的轨迹对于重复模型的提取不利;因此建议将用户的轨迹数据(即基站切换次序)按照预设步长进行切片,对于每个轨迹片段再按照时间汇聚成时域轨迹片段并统计其发生次数和时长,然后提取所有发生频率高并且停留时间长的时域轨迹片段集合生成用户的移动轨迹指纹数据库,通过该方案生成轨迹指纹数据库的方式相比于传统的离散点或者最长匹配子序列方式能更好地标识用户的特异性,因此能提高用户身份识别的准确性,同时不需要进行经纬度计算,仅利用小步长切片及时域轨迹片段汇聚方式,大大简化了数据处理的难度。
图4为本发明实施例装置模块组成示意图,包括:用户轨迹数据提取模块、用户轨迹切片模块、轨迹片段汇聚模块、轨迹指纹数据生成模块、轨迹指纹数据入库模块和轨迹指纹比对模块;各模块执行功能如下:
(1)用户轨迹数据提取模块
提取预设时间内(如一个月)移动用户基站位置更新Update location信令数据以及上网数据,经过运算形成基站轨迹数据序列,{(t1,p1),(t2,p2),…(tn,pn)},输出的轨迹数据序列中每个元素包括基站标号p以及用户切换到该基站的时间t,如果基站标号以字母代替,则输出的用户的轨迹数据如下:
(10:01,A),(10:02,B),(11:10,C),(12:04,B),(12:12,A),(12:22,X),…。
(2)用户轨迹切片模块
假设某用户的基站轨迹数据序列包含N个元素,按照步长3(三个基站组成一个轨迹片段)进行切片生成N-2个轨迹片段序列,每个轨迹片段包含:轨迹片段,例如ABC,轨迹片段的开始时间(用户切换到该轨迹片段的时间,24小时制,如10:00:05),轨迹片段的驻留时间(从用户切换到该轨迹片段的时间到用户切换到该一个轨迹片段的时间之间的间隔,可以分钟为单位);以1中的基站序列为例,其轨迹片段序列为:
开始时间,轨迹片段,时长
10:01,ABC,123;
10:02,BCB,130;
11:10,CBA,72;
…
(3)轨迹片段汇聚模块
时空特征相同的轨迹片段(轨迹片段相同并且同一天开始时间相对时间相差2小时以内)进行汇聚生成时域轨迹片段数据集合,集合中每个元素包含开始时间+轨迹片段的复合键,例如10:38_ABC,轨迹片段重复的次数以及累计时长(分钟)。
时域轨迹片段示例如下:
时域轨迹片段复合键,轨迹片段重复次数,累计时长
10:38_ABC,3,222;
10:20_BCB,5,6000;
10:24_CBA,1,100;
…
所述时域轨迹片段的汇聚流程及算法如下:
假设四个轨迹片段分别为:
1.(10:02,ABC,60);
2.(10:22,ABC,122);
3.(11:30,ABC,40);
4.(13:10,ABC,50)。
第一个轨迹片段处理后,时域轨迹片段集合包含:
时域轨迹片段复合键,轨迹片段重复次数,累计时长
10:02_ABC,1,60。
第二个轨迹片段处理后,时域轨迹片段集合包含:
时域轨迹片段复合键,轨迹片段重复次数,累计时长
10:12_ABC,2,182(122+60)
因为10.22和10:02相差两个小时内,故进行聚合,其中时间10:12=(10:02*1+10.22)/2。
第三个轨迹片段处理后,时域轨迹片段集合包含:
时域轨迹片段复合键,轨迹片段重复次数,累计时长
10:38_ABC,3,222
因为11.30和前两个聚合后的时间10:12相差两个小时内,故进行聚合得到新时间:
10:38=(10:12*2+11.30)/3。
第四个轨迹片段处理后,时域轨迹片段集合包含:
时域轨迹片段复合键,轨迹片段重复次数,累计时长
10:38_ABC,3,222
13:10_ABC,1,50
因为13.10和前三个聚合后的时间10:38相差超过两个小时,故不进行聚合,新生成一个新的时域轨迹片段。
(4)轨迹指纹数据生成模块
设定时域轨迹片段重要性阈值(如:轨迹重复次数为2),剔除轨迹重复次数小于该阈值的时域轨迹片段,剩下的计算其轨迹权重,权重的计算公式:轨迹片段重复次数+log(累计时长(分钟)/60);提取复合键及其权重构建生成用户的移动轨迹指纹数据。移动轨迹指纹数据示例如下:
时域轨迹片段,轨迹权重
10:38_ABC,3+log(222/60)
10:20_BCB,5+log(6000/60)
…
(5)轨迹指纹数据入库模块
建议至少提取三周数据,基于上述四个模块生成历史移动轨迹指纹数据并入库;历史移动轨迹指纹数据可每两周更新一次,保证指纹数据可以反映用户行为的实时变化情况。
(6)轨迹指纹比对模块
对于每一个待匹配用户,提取最新一周数据并基于上述模块生成该用户的移动轨迹指纹,将待匹配用户和历史用户的移动轨迹指纹数据库进行比对(如果两者时域轨迹片段中轨迹相同并且时间相差2小时内则认为是相同轨迹),计算得到两者的移动特征的相似度系数,通过设定阈值来判定是否是相同用户。
这里,所述轨迹指纹相似度比对算法如下:
首先对于待比较的两个用户(逻辑用户)的指纹数据集进行预处理,假设两个用户的指纹特征数据集分别为A和B,两两比对两个集合中的每对元素,如果A中的某元素的轨迹片段和B中某元素的轨迹片段相同并且时间相差2小时内,则认为两者是相同轨迹,并且修改复合键中的时间为两个时间的平均值;
例如:A中某元素为{轨迹片段10:00_ABC,权重3.4},B中某元素为{轨迹片段10:20_ABC,权重4.5},则预处理后认为是相同轨迹从而修改A中该元素复合键为10:10_ABC,B中该元素复合键为10:10_ABC;预处理完成后采用余弦相似性比对算法比较两个用户的轨迹指纹相似度,得到相似度系数,根据预设阈值判断是否是相同用户。
本发明实施例利用基站信息,用户只要开机,无论是否有通话都会有数据,因此仅仅需要1-2周的时间即可构建起用户的基站移动特征库;另外研究表明每个用户的移动轨迹存在相当大的特异性,采用结合移动轨迹以及指纹数据库的模型识别相比于传统的呼叫指纹方法准确率提升10%-15%。
相比传统方法,本发明实施例不需要计算基站的绝对经纬度数据,简化了数据运算的复杂性;另外,基于预设步长划分得到的基站轨迹片段进行用户移动特征提取,一方面充分利用用户位置移动导致基站切换的时序特征,另一方面考虑到基站切换的不确定性,因而更能表征用户的位置以及移动的特异性,从而能更准确地识别用户;此外,本发明实施例在移动轨迹中增加了时间特征(切换到基站的时间,驻留时间等),从时空两个维度强化了用户的移动特性,从而也能提高用户的识别准确性。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (12)
1.一种用户身份识别方法,其特征在于,该方法包括:
确定预设周期内各用户与基站信息相关的轨迹数据;
按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;
将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;
基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;
将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;
基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
2.根据权利要求1所述的方法,其特征在于,所述确定预设周期内各用户与基站信息相关的轨迹数据,包括:
基于各用户的基站位置更新信令数据以及该用户的上网数据形成各用户的轨迹数据序列;所述轨迹数据序列中的每个元素包括基站标号以及切换到该基站的时间。
3.根据权利要求1所述的方法,其特征在于,所述轨迹片段数据集中的每个轨迹片段数据包括:
轨迹片段、用户切换到该轨迹片段的时间,以及在该轨迹片段的驻留时间。
4.根据权利要求1所述的方法,其特征在于,所述将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,包括:
将轨迹片段数据集中轨迹片段相同、且用户切换到相应轨迹片段的时间差值在预设时间内的轨迹片段数据进行汇聚,得到该用户的时域轨迹片段的集合;
每个时域轨迹片段包括:由用户切换到该轨迹片段的时间和轨迹片段组成的复合键、该轨迹片段的重复次数,以及在该轨迹片段驻留的累计时长。
5.根据权利要求1所述的方法,其特征在于,所述基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据之前,该方法还包括:
剔除所述集合中不满足预设阈值的时域轨迹片段。
6.根据权利要求1所述的方法,其特征在于,该方法还包括:
基于轨迹片段的重复次数以及用户在该轨迹片段驻留的累计时长,确定所述时域轨迹片段对应的权重。
7.根据权利要求1所述的方法,其特征在于,所述基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份,包括:
生成待识别用户的移动轨迹指纹数据;
将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对;
依据比对结果确定用户身份。
8.根据权利要求7所述的方法,其特征在于,所述将所述待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库进行比对,依据比对结果确定用户身份,包括:
将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理;
将预处理后两个用户的移动轨迹指纹数据采用余弦相似性比对算法比较两个用户的移动轨迹指纹相似度,得到相似度系数;
基于预设阈值和所述相似度系数判断所述两个用户是否为相同用户。
9.根据权利要求8所述的方法,其特征在于,所述将所述待识别用户的移动轨迹指纹数据和所述历史移动轨迹指纹数据库中一用户的移动轨迹指纹数据进行预处理,包括:
比较两个用户移动轨迹指纹数据中的每对元素;
确定待识别用户移动轨迹指纹数据中一个元素的轨迹片段和另一用户移动轨迹指纹数据中一个元素的轨迹片段相同,且用户切换到该轨迹片段的时间差值在预设时间内,则认为两者是相同的轨迹;
将两个用户的对应元素中的用户切换到该轨迹片段的时间均修改为原来两个用户各自切换到对应轨迹片段时间的平均值。
10.一种用户身份识别装置,其特征在于,该装置包括:
确定模块,用于确定预设周期内各用户与基站信息相关的轨迹数据;
切片模块,用于按预设步长对所述轨迹数据进行切片生成轨迹片段数据集;
汇聚模块,用于将轨迹片段数据集中时空特征相同的轨迹片段进行汇聚,得到时域轨迹片段的集合;
生成模块,用于基于所述集合中的时域轨迹片段及该时域轨迹片段对应的权重生成各用户的移动轨迹指纹数据;所述移动轨迹指纹数据中包括:用户在基站间切换的异常跳变对应的数据;将各用户的移动轨迹指纹数据入库形成历史移动轨迹指纹数据库;
识别模块,基于待识别用户的移动轨迹指纹数据与历史移动轨迹指纹数据库,确定该待识别用户的身份。
11.一种用户身份识别装置,其特征在于,该装置包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
其中,所述处理器用于运行所述计算机程序时,执行权利要求1-9中任一项所述方法的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-9中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910968882.3A CN112653995B (zh) | 2019-10-12 | 2019-10-12 | 一种用户身份识别方法、装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910968882.3A CN112653995B (zh) | 2019-10-12 | 2019-10-12 | 一种用户身份识别方法、装置和计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112653995A true CN112653995A (zh) | 2021-04-13 |
CN112653995B CN112653995B (zh) | 2023-03-28 |
Family
ID=75342962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910968882.3A Active CN112653995B (zh) | 2019-10-12 | 2019-10-12 | 一种用户身份识别方法、装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112653995B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114827902A (zh) * | 2022-03-09 | 2022-07-29 | 中国科学院软件研究所 | 一种基于移动轨迹的身份认证方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110301832A1 (en) * | 2010-06-04 | 2011-12-08 | Microsoft Corporation | Searching Similar Trajectories by Locations |
US20130243242A1 (en) * | 2012-03-16 | 2013-09-19 | Pixart Imaging Incorporation | User identification system and method for identifying user |
CN106778876A (zh) * | 2016-12-21 | 2017-05-31 | 广州杰赛科技股份有限公司 | 基于移动用户轨迹相似性的用户分类方法和系统 |
CN108536851A (zh) * | 2018-04-16 | 2018-09-14 | 武汉大学 | 一种基于移动轨迹相似度比较的用户身份识别方法 |
CN108764951A (zh) * | 2018-03-23 | 2018-11-06 | 广州杰赛科技股份有限公司 | 用户相似度获得方法和装置、设备、存储介质 |
CN109272032A (zh) * | 2018-09-05 | 2019-01-25 | 广州视源电子科技股份有限公司 | 出行方式识别方法、装置、计算机设备和存储介质 |
-
2019
- 2019-10-12 CN CN201910968882.3A patent/CN112653995B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110301832A1 (en) * | 2010-06-04 | 2011-12-08 | Microsoft Corporation | Searching Similar Trajectories by Locations |
US20130243242A1 (en) * | 2012-03-16 | 2013-09-19 | Pixart Imaging Incorporation | User identification system and method for identifying user |
CN106778876A (zh) * | 2016-12-21 | 2017-05-31 | 广州杰赛科技股份有限公司 | 基于移动用户轨迹相似性的用户分类方法和系统 |
CN108764951A (zh) * | 2018-03-23 | 2018-11-06 | 广州杰赛科技股份有限公司 | 用户相似度获得方法和装置、设备、存储介质 |
CN108536851A (zh) * | 2018-04-16 | 2018-09-14 | 武汉大学 | 一种基于移动轨迹相似度比较的用户身份识别方法 |
CN109272032A (zh) * | 2018-09-05 | 2019-01-25 | 广州视源电子科技股份有限公司 | 出行方式识别方法、装置、计算机设备和存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114827902A (zh) * | 2022-03-09 | 2022-07-29 | 中国科学院软件研究所 | 一种基于移动轨迹的身份认证方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112653995B (zh) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9756601B2 (en) | Human mobility rule-based device location tracking | |
US20190021068A1 (en) | Terminal Positioning Method and Network Device | |
RU2527754C2 (ru) | Система генерирования статистической информации и способ генерирования статистической информации | |
CN108882174B (zh) | 移动终端定位方法、装置、电子设备及存储介质 | |
WO2011123016A1 (en) | Method and apparatus for use of performance history data in positioning method selection | |
WO2015158399A1 (en) | Method and system for identifying significant locations through data obtainable from a telecommunication network | |
CN108712714B (zh) | 一种室内wlan指纹定位中ap的选择方法及装置 | |
CN111312406B (zh) | 一种疫情标签数据处理方法及系统 | |
CN106339769B (zh) | 一种面向移动社会网络的用户出行预测方法 | |
CN108271157B (zh) | 一种伪基站识别方法及装置 | |
CN108764951B (zh) | 用户相似度获得方法和装置、设备、存储介质 | |
Kulkarni et al. | Mobidict: A mobility prediction system leveraging realtime location data streams | |
CN110991525A (zh) | 基于运营商轨迹数据的伴随模式匹配方法 | |
CN112653995B (zh) | 一种用户身份识别方法、装置和计算机可读存储介质 | |
CN112954626A (zh) | 手机信令数据分析方法、装置、电子设备及存储介质 | |
CN106331060B (zh) | 一种基于wifi进行布控的方法和系统 | |
CN113793174A (zh) | 数据关联方法、装置、计算机设备和存储介质 | |
Gupta et al. | CELPB: A cache invalidation policy for location dependent data in mobile environment | |
CN105338487B (zh) | 用于多遍地理定位的技术 | |
CN110582091B (zh) | 定位无线质量问题的方法和装置 | |
CN116541721A (zh) | 一种面向信令数据的定位与路网匹配方法及系统 | |
CN111654808A (zh) | 一种更新指纹数据库的方法及系统、wifi定位方法及系统 | |
De Vita et al. | A deep learning approach for indoor user localization in smart environments | |
CN112307075B (zh) | 用户关系识别方法及装置 | |
CN110519686B (zh) | 预设地点识别方法、装置、设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |