CN111314851A - 一种识别一人多号的方法及装置 - Google Patents

一种识别一人多号的方法及装置 Download PDF

Info

Publication number
CN111314851A
CN111314851A CN201811519653.5A CN201811519653A CN111314851A CN 111314851 A CN111314851 A CN 111314851A CN 201811519653 A CN201811519653 A CN 201811519653A CN 111314851 A CN111314851 A CN 111314851A
Authority
CN
China
Prior art keywords
telephone card
activity
card
telephone
sampling time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811519653.5A
Other languages
English (en)
Other versions
CN111314851B (zh
Inventor
张璐
姜丽梅
郝英华
李巍
段辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Beijing Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Beijing Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811519653.5A priority Critical patent/CN111314851B/zh
Publication of CN111314851A publication Critical patent/CN111314851A/zh
Application granted granted Critical
Publication of CN111314851B publication Critical patent/CN111314851B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/021Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请提供了一种识别一人多号的方法及装置,用于减少识别一人多号的计算量。该方法包括:获得第一电话卡在N个采样时间段对应的N个第一位置集合,以及第二电话卡在N个采样时间段对应的N个第二位置集合;根据N个第一位置集合,获得第一电话卡的N个活动轨迹参数,以及根据N个第二位置集合,获得第二电话卡的N个活动轨迹参数;确定第一电话卡在N个采样时间段内的N个活动状态,以及确定第二电话卡在N个采样时间段内的N个活动状态;若第一电话卡在N个采样时间段内的N个活动状态,与第二电话卡在N个采样时间段内的N个活动状态均相同,则确定第一电话卡和第二电话卡属于同一个用户。

Description

一种识别一人多号的方法及装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种识别一人多号的方法及装置。
背景技术
随着通信技术的不断发展,越来越多的用户可能会使用多张电话卡。第三方需要识别一人多号的用户,以便于给该用户推荐更适合该用户的业务。对于通信网络而言,无论多张电话卡无论是属于同一终端,还是属于不同的终端,都是视为多个独立的终端。
目前,识别一人多号的方法如下。采集多个业务场景下多个电话卡与通信网络之间的交互信令数据,分析交互信令数据获得每个电话卡的识别特征,从而对比多个电话卡的识别特征进行一一对比,从而确定出哪些电话卡是属于同一个用户。但是,这种方法获取的交互信令数据的数据量本来就很大,根据交互信令数据获得的识别特征的计算量大,且获得交互信令数据的数据量也较大,在确定出多个终端的识别特征之后,还需对多个终端的识别特征进行一一对比,进一步增加了数据计算量。可见,目前技术识别一人多号的方法数据计算量大。
发明内容
本申请提供一种识别一人多号的方法及装置,用于减少识别一人多号的计算量。
第一方面,提供了一种识别一人多号的方法,包括:
在N个采样时间段的每个采样时间段内,获取第一电话卡所经过的基站的第一位置集合,以及第二电话卡所经过的基站的第二位置集合,从而获得所述第一电话卡在所述N个采样时间段对应的N个第一位置集合,以及所述第二电话卡在所述N个采样时间段对应的N个第二位置集合,N为正整数;
根据所述N个第一位置集合,获得所述第一电话卡的N个活动轨迹参数,以及根据所述N个第二位置集合,获得所述第二电话卡的N个活动轨迹参数,所述活动轨迹参数用于表征电话卡在所述每个采样时间段内的活动范围;
根据所述第一电话卡的N个活动轨迹参数,确定所述第一电话卡在所述N个采样时间段内的N个活动状态,以及根据所述第二电话卡的N个活动轨迹参数,确定所述第二电话卡在所述N个采样时间段内的N个活动状态,所述活动状态用于表示电话卡在所述每个采样时间段内处于静止状态或运动状态;
若所述第一电话卡在所述N个采样时间段内的N个活动状态,与所述第二电话卡在所述N个采样时间段内的N个活动状态均相同,则确定所述第一电话卡和所述第二电话卡属于同一个用户。
在上述方案中,通过两张电话卡在N个采样时间段内经过的基站的位置集合,来确定两张电话卡是否是属于同一个用户。一方面,选取N个采样时间段对应的数据,相对现有技术的方式,可以相对减少数据的输入量,进而可以减少数据的计算量;另一方面,直接选取电话卡经过的基站的位置来判断,可以进一步减少数据的输入量,进而可以减少数据的计算量。另外,根据基站的位置集合,获取电话卡的活动轨迹参数,将采集的采样时间段内对应的基站的位置集合的三维数据转换为活动轨迹参数的二维数据,降低了数据处理维度,进一步减少了数据的计算量。
在一种可能的设计中,在确定所述第一电话卡和所述第二电话卡属于同一个用户之前,包括:
在i个采样时间段内,根据至少两张电话卡中每张电话卡在所述i个采样时间段中每个采样时间段所经过的基站,获得所述每张电话卡对应的位置集合X(i,j),从而获得所述每张电话卡的i个位置集合;其中,X(i,j)={(i,j),i=2,3,4…n,j=1,2,3,4…k,n、k为正整数},i表示采样时间段的个数,j表示每个采样时间段的采样时长;
根据所述每张电话卡对应的所述i个位置集合,确定出所述每张电话卡的i个活动轨迹参数,并根据所述每张电话卡的i个活动轨迹参数,确定出所述每张电话卡在所述i个采样时间段内对应的i个活动状态;
若所述至少两张卡中的任意两张电话卡的i个活动状态均相同,则初次确定所述任意两张卡属于同一个用户,获得第X(i,j)个参考结果;
根据所述第X(i,j)个参考结果、以及标准结果,获得所述第X(i,j)个参考结果的置信度,从而获得i在不同取值下的多个置信度,所述标准结果用于表示所述至少两张电话卡中属于同一用户的判断结果;
从所述多个置信度中,确定出大于或等于预设置信度的目标置信度;
获得与所述目标置信度所对应的i的取值,从所述i的取值中确定出取值最小的i为N。
在上述方案中,选取不同的样本数据,根据不同的样本数据获得一人多号的参考结果,根据标准结果验证参考结果的置信度,将置信度高且数据量最少的样本数据对应的采样时间段的数量,作为下一次判断一人多号的采样时间段的数量。不仅减少了下一次判断一人多号的计算量,还保证了下一次判断一人多号的结果的准确性。
在一种可能的设计中,在获得所述第X(i,j)个参考结果的准确率之前,还包括:
根据所述至少两张电话卡中第三电话卡的i个位置集合中的M个位置集合,与所述至少两张电话卡中第四电话卡的对应的i个位置集合中的M个位置集合,获得所述第三电话卡的活动轨迹与所述第四电话卡的活动轨迹的相似度,i为大于或等于M的正整数;
若所述相似度大于或等于预设阈值,则确定所述第三电话卡和所述第四电话卡属于同一用户,从而确定所述标准结果。
在上述方案中,计算两张电话卡的相似度,如果相似度满足预设阈值,则判断两张电话卡属于同一个用户。也就是说,通过计算电话卡的相似度来获得标准结果,提高标准结果的可靠性。且,计算相似度的过程中,选取两张电话卡的部分样本数据来进行相似度计算,可以相对减少相似度计算过程中的计算量。
在一种可能的设计中,获得所述第三电话卡的活动轨迹与所述第四电话卡的活动轨迹的相似度,包括:
将所述第三电话卡的M个位置集合按照M个采样时间段的先后顺序进行排序,获得所述第三电话卡的第一位置序列,以及将所述第四电话卡的M个位置集合按照所述M个采样时间段的先后顺序进行排序,获得所述第四电话卡的第二位置序列;
获得所述第一位置序列和所述第二位置序列的最长公共子序列的长度,所述最长公共子序列为所述第一位置序列和所述第二位置序列的共有的子序列中的长度最长的子序列;
根据所述最长公共子序列的长度除以M,获得所述第三电话卡的活动轨迹和第四电话卡的活动轨迹的相似度。
在上述方案中,基于最长公共子序列算法,对两张电话卡经过的基站的位置集合来计算两张电话卡的相似度,相对于其他相似度算法,可以相对减少相似度的计算量,且能够保证标准结果的可靠性。
在一种可能的设计中,所述活动轨迹参数包括活动轨迹圆心和活动轨迹半径,在获得所述第三电话卡的活动轨迹与第四电话卡的活动轨迹的相似度之前,还包括:
确定所述至少两张卡中的第三电话卡的i个活动轨迹参数中的K个活动轨迹半径,与所述至少两张卡中的第四电话卡对应的i个活动轨迹参数中的K个活动轨迹半径的差值的平均值小于第一预设值,K为小于或等于i的正整数;和/或,
确定所述第三电话卡的i个活动轨迹参数中的K个活动轨迹圆心与所述第三电话卡对应的i个活动轨迹参数中的K个活动轨迹圆心的差值的平均值小于第二预设值。
在上述方案中,在获得计算两张电话卡的相似度之前,通过比较两张电话卡的活动轨迹参数中的活动半径和/或活动轨迹圆心的差值的大小,确定两张电话卡是否可能属于一个用户,从而只需计算可能属于一个用户的电话卡对进行相似度的计算,可以减少相似度的计算次数,进一步减少计算量。
在一种可能的设计中,所述活动轨迹参数包括活动轨迹圆心、活动轨迹半径、距离偏差值和活动轨迹重心,所述距离偏差值为所述活动轨迹圆心和所述活动轨迹重心之间的距离,获得所述第一电话卡在所述N个采样时间段内对应的N个活动轨迹参数,包括:
确定所述第一电话卡的N个活动轨迹参数中异常动轨迹参数,其中,所述异常活动轨迹参数为活动轨迹半径大于第三预设值,且距离偏差值大于所述第四预设值的活动轨迹参数;
根据所述第一电话卡的N个活动轨迹参数中除了所述异常动轨迹参数之外的活动轨迹参数,获得与所述异常活动轨迹参数对应的正常活动轨迹参数;
用所述正常活动轨迹参数替换所述第一电话卡的N个活动轨迹参数中的所述异常动轨迹参数。
在上述方案中,根据每张电话卡的活动轨迹半径以及距离偏差值的大小,筛选出每张电话卡中出现的异常活动轨迹参数,保证了判断一人多号的数据的可靠性,进而提高判断一人多号的准确性。且,根据每张电话卡的正常的那些活动轨迹参数,估计出异常活动轨迹参数对应的正常活动轨迹参数,保证了每张电话卡的活动轨迹参数的数量的相同,便于后期比较电话卡之间的活动轨迹参数等。
第二方面,提供一种识别一人多号的装置,所述装置包括获取模块和处理模块,其中:
所述获取模块,用于在N个采样时间段的每个采样时间段内,获取第一电话卡所经过的基站的第一位置集合,以及第二电话卡所经过的基站的第二位置集合,从而获得所述第一电话卡在所述N个采样时间段对应的N个第一位置集合,以及所述第二电话卡在所述N个采样时间段对应的N个第二位置集合,N为正整数;
所述处理模块,用于根据所述N个第一位置集合,获得所述第一电话卡的N个活动轨迹参数,以及根据所述N个第二位置集合,获得所述第二电话卡的N个活动轨迹参数,所述活动轨迹参数用于表征电话卡在所述每个采样时间段内的活动范围;以及,
根据所述第一电话卡的N个活动轨迹参数,确定所述第一电话卡在所述N个采样时间段内的N个活动状态,以及根据所述第二电话卡的N个活动轨迹参数,确定所述第二电话卡在所述N个采样时间段内的N个活动状态,所述活动状态用于表示电话卡在所述每个采样时间段内处于静止状态或运动状态;以及,
若所述第一电话卡在所述N个采样时间段内的N个活动状态,与所述第二电话卡在所述N个采样时间段内的N个活动状态均相同,则确定所述第一电话卡和所述第二电话卡属于同一个用户。
在一种可能的设计中,所述获取模块还用于,在确定所述第一电话卡和所述第二电话卡属于同一个用户之前,在i个采样时间段内,根据至少两张电话卡中每张电话卡在所述i个采样时间段中每个采样时间段所经过的基站,获得所述每张电话卡对应的位置集合X(i,j),从而获得所述每张电话卡的i个位置集合,其中,X(i,j)={(i,j),i=2,3,4…n,j=1,2,3,4…k,n、k为正整数},i表示采样时间段的个数,j表示每个采样时间段的采样时长;
所述处理模块还用于,根据所述每张电话卡对应的所述i个位置集合,确定出所述每张电话卡的i个活动轨迹参数,并根据所述每张电话卡的i个活动轨迹参数,确定出所述每张电话卡在所述i个采样时间段内对应的i个活动状态;以及,
若所述至少两张卡中的任意两张电话卡的i个活动状态均相同,则初次确定所述任意两张卡属于同一个用户,获得第X(i,j)个参考结果;以及,
根据所述第X(i,j)个参考结果、以及标准结果,获得所述第X(i,j)个参考结果的置信度,从而获得i在不同取值下的多个置信度,所述标准结果用于表示所述至少两张电话卡中属于同一用户的判断结果;以及,
从所述多个置信度中,确定出大于或等于预设置信度的目标置信度;以及,
获得与所述目标置信度所对应的i的取值,从所述i的取值中确定出取值最小的i为N。
在一种可能的设计中,所述处理模块还用于:
在获得所述第X(i,j)个参考结果的准确率之前,根据所述至少两张电话卡中第三电话卡的i个位置集合中的M个位置集合,与所述至少两张电话卡中第四电话卡的对应的i个位置集合中的M个位置集合,获得所述第三电话卡的活动轨迹与所述第四电话卡的活动轨迹的相似度,i为大于或等于M的正整数;
若所述相似度大于或等于预设阈值,则确定所述第三电话卡和所述第四电话卡属于同一用户,从而确定所述标准结果。
在一种可能的设计中,所述处理模块具体用于:
将所述第三电话卡的M个位置集合按照M个采样时间段的先后顺序进行排序,获得所述第三电话卡的第一位置序列,以及将所述第四电话卡的M个位置集合按照所述M个采样时间段的先后顺序进行排序,获得所述第四电话卡的第二位置序列;
获得所述第一位置序列和所述第二位置序列的最长公共子序列的长度,所述最长公共子序列为所述第一位置序列和所述第二位置序列的共有的子序列中的长度最长的子序列;
根据所述最长公共子序列的长度除以M,获得所述第三电话卡的活动轨迹和第四电话卡的活动轨迹的相似度。
在一种可能的设计中,所述活动轨迹参数包括活动轨迹圆心和活动轨迹半径,所述处理模块用于:
在获得所述第三电话卡的活动轨迹与第四电话卡的活动轨迹的相似度之前,确定所述至少两张卡中的第三电话卡的i个活动轨迹参数中的K个活动轨迹半径,与所述至少两张卡中的第四电话卡对应的i个活动轨迹参数中的K个活动轨迹半径的差值的平均值小于第一预设值,K为小于或等于i的正整数;和/或,
确定所述第三电话卡的i个活动轨迹参数中的K个活动轨迹圆心与所述第三电话卡对应的i个活动轨迹参数中的K个活动轨迹圆心的差值的平均值小于第二预设值。
第三方面,提供一种识别一人多号的装置,包括:
至少一个处理器,以及
与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如第一方面中及任一项所述的识别一人多号的方法。
第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如第一方面中及任一项所述的识别一人多号的方法。
附图说明
图1为本申请实施例提供的一种识别一人多号的方法的流程图;
图2为本申请实施例提供的电话卡A经过的基站的位置集合的示意图;
图3为本申请实施例提供的电话卡B经过的基站的位置集合的示意图;
图4为本申请实施例提供的一种识别一人多号的装置的结构图;
图5为本申请实施例提供的一种识别一人多号的装置的结构图。
具体实施方式
为了更好的理解本申请实施例提供的技术方案,下面将结合说明书附图以及具体的实施方式进行详细的说明。
为了减少识别一人多号的计算量,本申请实施例提供一种识别一人多号的方法,请参照图1,该方法由识别一人多号的装置来执行。识别一人多号的装置可以通过服务器来实现,服务器可以是实体服务器,也可以是虚拟服务器。该方法包括:
步骤101,确定N个采样时间中N的取值;
步骤102,在N个采样时间段的每个采样时间段内,获取第一电话卡所经过的基站的第一位置集合,以及第二电话卡所经过的基站的第二位置集合,从而获得第一电话卡在N个采样时间段对应的N个第一位置集合,以及第二电话卡在N个采样时间段对应的N个第二位置集合;
步骤103,根据N个第一位置集合,获得第一电话卡的N个活动轨迹参数,以及根据N个第二位置集合,获得第二电话卡的N个活动轨迹参数,活动轨迹参数用于表征电话卡在每个采样时间段内的活动范围;
步骤104,根据第一电话卡的N个活动轨迹参数,确定第一电话卡在N个采样时间段内的N个活动状态,以及根据第二电话卡的N个活动轨迹参数,确定第二电话卡在N个采样时间段内的N个活动状态,活动状态用于表示电话卡在每个采样时间段内处于静止状态或运动状态;
步骤105,若第一电话卡在N个采样时间段内的N个活动状态,与第二电话卡在N个采样时间段内的N个活动状态均相同,则确定第一电话卡和第二电话卡属于同一个用户。
应当说明的是,步骤101是可选的步骤。下面对各个步骤的执行过程进行分别描述。
识别一人多号的装置需要判断某两张卡是否是属于同一个用户,需要先执行步骤101,即确定N个采样时间中N的取值。
具体来说,识别一人多号的装置要判断两张电话卡是否是同一个用户的电话卡时,可以获得N个采样时间段的多张电话卡在每个采样时间段内的经过的基站的位置集合,那么需要先确定出N的取值。也就是说,先确定到底用几个采样时间段来对两张电话卡是否属于同一个用户进行判断。确定N的取值方式有很多种,下面对执行步骤101的方式进行示例说明。
第一种,确定N的取值方式为:
随机确定出N的取值。
具体来说,在需要判断两张电话卡是否为一个用户之前,直接随机确定出N个采样时间段,也就是随机确定N的取值。可以是识别一人多号的装置随机确定N的取值,也可以是识别一人多号的装置根据用户的输入确定N的取值。本申请实施例中确定N的取值的方式简单且灵活性强,无需识别一人多号的装置进行复杂计算来确定N的取值,可以相对减少识别一人多号的计算量。
第二种,确定N的取值方式为:
子步骤101a,通过抽样,获取不同样本;
子步骤101b,根据不同样本,获得在不同样本下,初步确定出的至少两张电话卡中属于同一个用户的多个参考结果;
子步骤101c,根据多个参考结果以及标准结果,获得多个参考结果对应的多个置信度;
子步骤101d,根据多个置信度以及不同样本,确定出N的取值。
其中,不同样本是指在采样时间段的数量取值不同情况下,至少两张电话卡中每张电话卡经过的基站的位置集合。至少两张电话卡是指选取的作为样本的电话卡,可以是全网中的部分电话卡。参考结果是指根据不同样本,初步确定的至少两张电话卡中属于同一个用户的结果,例如,初步确定出属于同一个用户的电话卡对的数量。标准结果是指确定的至少两张电话卡中属于同一个用户的结果,例如,确定出属于同一个用户的电话卡对的标准数量。置信度是指多个参考结果中每个参考结果落入标准结果的概率。置信度的表征方式有很多种,例如,用每个参考结果与标准结果的比值来表征。
下面对第二种执行步骤101的方式中的各个子步骤进行详细说明。
下面对子步骤101a,即通过抽样,获取不同样本的执行方式进行说明。执行步骤101a的方式有很多种,下面进行示例说明。
一种执行步骤101a的方式为:
在i个采样时间段内,根据至少两张电话卡中每张电话卡在i个采样时间段中每个采样时间段所经过的基站,获得每张电话卡对应的位置集合X(i,j),从而获得每张电话卡的i个位置集合,其中,X(i,j)={(i,j),i=2,3,4…n,j=1,2,3,4…k,n、k为正整数},i表示采样时间段的个数,j表示每个采样时间段的采样时长。
具体来说,在i个采样时间段内,识别一人多号的装置可以获取至少两张电话卡中每张电话卡的交互信令数据,从而确定出至少两张电话卡中每张电话卡在每个采样时间段内经过的所有基站,从而获得至少两张电话卡中每张电话卡在每个采样时间段内经过的基站的位置集合。以此类推,就可以获得i的取值不同的情况下,每张电话卡对应的i个位置集合。或者识别一人多号的装置可以从用户宽表中获取至少两张电话卡中每张电话卡的经过的基站的位置集合。
其中,交互信令数据可以通过基站信令平台获取,也可以通过终端的采集接口直接采集。采集接口,例如A口或控制平面(S1-MME)接口等。交互信令数据例如位置更新的交互信令。电话卡所处的基站发生变化,终端就向基站发送更新位置信令,因此,可以根据更新位置信令来获得电话卡经过的基站。
为了减少数据计算量,在i取值不同的情况下,采样时间段的时长j可以选择尽量小的固定的值,例如1小时,24小时等。
例如,以至少两张电话卡以电话卡A和电话卡B为例,请参照图2,电话卡A在i个采样时间段中的第一采样时间依次经过的基站为a,b,c,d,e,f,分别获得各个基站的经纬度,进而获得电话卡A在第一采样时间段的位置集合为{(Xa,Ya),(Xb,Yb),(Xc,Yc),(Xd,Yd),(Xe,Ye),(Xf,Yf)}。Xa、Xb、Xc、Xd、Xe、Xf依次分别表示基站a,b,c,d,e,f的经度,Ya、Yb、Xc、Yd、Ye、Yf依次分别表示基站a,b,c,d,e,f的纬度。请照图3,电话卡B在i个采样时间段中的第一采样时间依次经过基站为a,b,c1,d,c,f,从而获得电话卡B在第一采样时间段的位置集合为{(Xa,Ya),(Xb,Yb),(Xc1,Yc1),(Xd,Yd),(Xe,Ye),(Xf,Yf)}。
在执行步骤101a之后,执行步骤101b,即根据不同样本,获得在不同样本下,初步确定出的至少两张电话卡中属于同一个用户的多个参考结果。下面对步骤101b进行示例说明。
一种执行步骤101b的方式为:
根据每张电话卡对应的i个位置集合,确定出每张电话卡的i个活动轨迹参数,并根据每张电话卡的i个活动轨迹参数,确定出每张电话卡在i个采样时间段内对应的i个活动状态,如果至少两张电话卡中任意两张电话卡对应的i个活动状态均相同,那么就初次确定这两张卡是属于同一个用户的。以此类推,从而获得i在不同取值下,初次确定至少两张电话卡中属于一人多卡的多个参考结果。
其中,每个活动轨迹参数用于表示每张电话卡就在一个采样时间段的活动轨迹。活动轨迹参数包括活动轨迹圆心、活动轨迹半径以及活动轨迹重心、距离偏差距离。距离偏差距离是指活动轨迹圆心和活动轨迹重心之间的距离。活动状态用于表示电话卡在一个采样时间段内处于静止状态或运动状态。
具体来说,每张电话卡在一个采样时间段内可能经过了多个基站,将根据多个基站的位置从确定出每张电话卡在一个采样时间段内的活动范围,对活动范围进行拟合处理,从而获得每张电话卡在一个采样时间段内的活动轨迹。拟合处理例如,将电话卡的活动范围拟合处理为圆形,从而获得每张电话卡在一个采样时间段的圆形的活动轨迹,从而根据基站的位置集合获得活动轨迹对应的活动轨迹参数。
活动轨迹参数有多种获取方式,例如,活动重心的横坐标值为根据每张电话卡A的所有经过基站的经度的平均值,活动重心的纵坐标值为根据每张电话卡A的所有经过基站的纬度的平均值。
在获得活动轨迹参数之后,根据活动轨迹参数来确定电话卡在该采样时间段内的活动状态。下面对获得活动状态的方式进行示例说明。
一种根据活动轨迹参数获得活动状态的方式为:
若活动轨迹半径大于第三预设值,而距离偏差值小于第四预设值,则确定电话卡在该采样时间段内处于活动状态。第三预设值是根据基站之间的平均距离设置的。
若活动轨迹半径大于第三预设值,且距离偏差值大于第四预设值,则说明该活动轨迹参数为异常活动轨迹参数,可以舍弃该采样时间段内对应的活动轨迹参数。
若活动轨迹半径小于或等于第三预设值,则确定电话卡在该采样时间段内处于静止状态。
以此类推,从而获得电话卡在i个采样时间段的i个活动状态。
其中,若确定某个活动轨迹参数为异常活动轨迹参数,为了能够填补舍弃的采样时间段的活动轨迹参数,可以利用该电话卡的i个活动轨迹参数中除了异常活动轨迹参数之外的活动轨迹参数来预估该异常活动轨迹参数对应的正常活动轨迹参数,用正常活动轨迹参数来替换异常活动轨迹参数。
下面对预估该异常活动轨迹参数对应的正常活动轨迹参数的方法进行示例说明。
例如,根据相邻采样时间段内的活动轨迹参数,来估计该异常活动轨迹参数对应的正常活动轨迹参数。
具体来说,相邻采样时间段内包括该采样时间段的上一个采样时间段,该采样时间段的下一个采样时间段。如果上一个采样时间段内,电话卡的活动状态为静止状态,则将该上一个采样时间段的活动轨迹参数作为该异常活动轨迹参数对应的正常活动轨迹参数。
如果该上一个采样时间段内,电话卡的活动状态为运动状态,则确定该采样时间段的下一个采样时间段内电话卡的获得状态,如果下一个采样时间段内电话卡处于静止状态,则将以下一个采样时间段的活动轨迹参数作为该异常活动轨迹参数对应的正常活动轨迹参数。
如果该采样时间段的上一个采样时间段内,电话卡的活动状态为运动状态,下一个采样时间段内电话卡的活动状态为运动状态,则确定直接以上一个采样时间段内的活动轨迹参数和下一个采样时间段内的活动轨迹参数的平均值作为该异常活动轨迹参数对应的正常活动轨迹参数。
例如,请继续参照图2,将电话卡A的活动范围近似为一个圆,从而获得该电话卡A的活动轨迹圆心为基站a和基站d的中间位置。活动轨迹中心为基站a,b,c,d,e,f所有的经度的平均值以及a,b,c,d,e,f所有的纬度的平均值。进而根据活动轨迹圆心C、活动轨迹重心G可以获得活动轨迹半径R以及距离偏差值X。
同理,请继续参照图3,从而获得电话卡B的活动轨迹圆心C1、活动轨迹重心G1可以获得活动轨迹半径R1以及距离偏差值X1。
若电话卡A的活动轨迹半径R大于第三预设值,距离偏差X小于第四预设值,则确定电话卡A在该采样时间段内的活动状态为运动状态。若电话卡B的活动轨迹半径R1大于第三预设值,距离偏差X1小于第四预设值,则确定电话卡B在该采样时间段内的活动状态为运动状态。
如果电话卡A和电话卡B的i个活动状态均相同,则确定电话卡A和电话卡B属于同一个用户。
在执行步骤101b之后,识别一人多号的装置执行步骤101c,即根据多个参考结果以及标准结果,获得多个参考结果对应的多个置信度。
具体来说,根据第X(i,j)个参考结果、以及标准结果,获得第X(i,j)个参考结果的置信度,从而获得i在不同取值下的多个参考结果的多个置信度,标准结果用于表示至少两张电话卡中属于同一用户的判断结果。
其中,置信度可以是前文论述内容,此处不再赘述。标准结果可以是预存的结果,也可以是通过精确算法计算得到的。下面对获取标准结果的方式进行示例说明。
一种获得标准结果的方式为:
根据至少两张电话卡中第三电话卡的i个位置集合中的M个位置集合,与至少两张电话卡中第四电话卡的对应的i个位置集合中的M个位置集合,获得第三电话卡的活动轨迹与第四电话卡的活动轨迹的相似度,i为大于或等于M的正整数;
若相似度大于或等于预设阈值,则确定第三电话卡和第四电话卡属于同一用户,从而确定标准结果。
具体来说,根据两张电话卡的M个位置集合,根据相似度算法确定两张电话卡的活动轨迹的相似度,如果相似度大于或等于预设阈值,则确定两张电话卡是属于同一个用户,以此类推,从而获得标准结果。下面对相似度算法计算的过程进行示例说明。
具体来说,将至少两张电话卡中的第三电话卡的M个位置集合按照M个采样时间段的先后顺序进行排序,获得第三电话卡的第一位置序列,以及将至少两张卡中的第四电话卡的M个位置集合按照M个采样时间段的先后顺序进行排序,获得第四电话卡的第二位置序列;
获得第一位置序列和第二位置序列的最长公共子序列的长度,最长公共子序列为第一位置序列和第二位置序列的共有的子序列中的长度最长的子序列;
根据最长公共子序列的长度除以M,获得第三电话卡的活动轨迹和第四电话卡的活动轨迹的相似度。
其中,根据最长公共子序列(Longest Common Subsequence semblance,LCSs)算法,获得两个序列中的最长公共子序列的长度的公式LSCCδ,ε(TA,TB)如下:
Figure BDA0001902895950000121
其中,LSCCδ,ε(TA,TB)表示第三电话卡和第四电话卡的最长公共子序列的长度,TA表示第三电话卡经过的基站的位置坐标,TB表示第三电话卡经过的基站的位置坐标,δ和ε表示常数,am,1表示第三电话卡在m行第1列经过的基站的坐标位置,bk,1表示第四电话卡在k行第1列经过的基站的坐标位置,LSCCδ,ε(Head(TA)+Head(TB))表示第m-1行、第n-1列获得的两张电话卡的公共子序列的长度,LSCCδ,ε(Head(TA),TB)表示第m-1行、第n列获得的两张电话卡的公共子序列的长度,LSCCδ,ε(Head(TA),TB)表示第m+1行、第n列获得的两张电话卡的公共子序列的长度。
利用上述公式获得最长公共子序列的长度之后,就可以获得两张电话卡的相似度。
例如,请继续参照图2,电话卡A在i个采样时间段中的第一采样时间依次经过的基站为a,b,c,d,e,f,直接以基站编号代替基站的经纬度,那么获得电话卡A在第一采样时间段内经过的基站位置的第一序列为a,b,c,d,e,f。同样的,请继续参照图3,电话卡B在第一采样时间段内经过的基站位置的第一序列为a,b,c1,d,e,f,从而可以获得电话卡A和电话卡B的最长公共子序列为a,b,d,e,f,从而获得最长公共子序列的长度为5,进而获得电话卡A和电话卡B的相似度为5/6。预设相似度为50%,那么识别一人多号的装置确定电话卡A和电话卡B为属于同一个用户。
为了减少计算量,可以在计算两张电话卡的相似度之前,获得疑似电话卡对,疑似电话对是指至少一张电话卡中可能属于同一个用户的两张电话卡。直接对疑似电话卡对进行相似度计算,从而无需对至少两张电话卡中每两张电话卡都进行相似度计算,从而相对减少计算量。
获得疑似电话对的方式一为:
确定至少两张卡中的第三电话卡的i个活动轨迹参数中的K个活动轨迹半径,与至少两张卡中的第四电话卡对应的i个活动轨迹参数中的K个活动轨迹半径的差值的平均值小于第一预设值。第一预设值可以根据基站与基站之间的平均距离来设置。第一预设值的取值可以与前文中的第三预设值的取值相同。
具体来说,将至少两张电话卡中的每两张电话卡的K个活动轨迹半径进行一对一作差,从而获得K个活动轨迹半径对应的K个差值,获得K个差值的平均值。平均值例如算术平均值。如果该平均值小于第二预设值,则说明第三电话卡和第四电话卡可能是属于同一个用户的。以此类推,从而获得至少两张电话卡中所有的疑似电话对。
获得疑似电话对的方式二为:
确定第三电话卡的i个活动轨迹参数中的K个活动轨迹圆心与第三电话卡对应的i个活动轨迹参数中的K个活动轨迹圆心的差值的平均值小于第二预设值。第二预设值可以根据基站与基站之间的平均距离来设置,K为小于或等于i的正整数。
具体来说,将至少两张电话卡中的每两张电话卡的K个活动轨迹圆心进行一对一作差,从而获得K个差值,获得K个差值的平均值。平均值例如算术平均值。如果该平均值小于第二预设值,则说明第三电话卡和第四电话卡可能是属于同一个用户的。以此类推,从而获得至少两张电话卡中所有的疑似电话对。
获得疑似电话对的方式三为:
确定至少两张卡中的第三电话卡的i个活动轨迹参数中的K个活动轨迹半径,与至少两张卡中的第四电话卡对应的i个活动轨迹参数中的K个活动轨迹半径的差值的平均值小于第一预设值。第一预设值可以根据基站与基站之间的平均距离来设置,且确定第三电话卡的i个活动轨迹参数中的K个活动轨迹圆心与第三电话卡对应的i个活动轨迹参数中的K个活动轨迹圆心的差值的平均值小于第二预设值。第二预设值可以根据基站与基站之间的平均距离来设置。
具体来说,方式三也就是方式一和方式二的结合。也就是说,如果第三电话卡和第四电话卡的K个活动轨迹半径的差值的平均值小于第一预设值,且第三电话卡和第四电话卡的K个活动轨迹圆心的差值的平均值小于第二预设值,那么识别一人多卡的装置就确定出第三电话卡和第四电话卡为疑似电话对。
在执行步骤101c之后,执行步骤101d,即根据多个置信度以及不同样本,确定出N的取值。
具体来说,在获得多个参考结果之后,可以获得多个参考结果的多个置信度,从多个置信度中筛选出大于或等于预设置信度的目标置信度,获得与目标置信度所对应的i的取值,从i的取值中确定出取值最小的i为N。目标置信度可以多个,也可以是一个。
在执行步骤101之后,识别一人多号的装置执行步骤102,即在N个采样时间段的每个采样时间段内,获取第一电话卡所经过的基站的第一位置集合,以及第二电话卡所经过的基站的第二位置集合,从而获得第一电话卡在N个采样时间段对应的N个第一位置集合,以及第二电话卡在N个采样时间段对应的N个第二位置集合。
识别一人多卡的装置需要确定第一电话卡和第二电话卡是否是为同一个用户的时候,获取第一电话卡在N个采样时间段对应的N个第一位置集合,第二电话卡在N个采样时间段对应的N个第二位置集合。获取第一位置集合以及第二位置集合的方式可以参照前文论述的获取i个位置集合的方式的内容,此处不再赘述。
在执行步骤102之后,识别一人多号的装置执行步骤103,即根据N个第一位置集合,获得第一电话卡的N个活动轨迹参数,以及根据N个第二位置集合,获得第二电话卡的N个活动轨迹参数,活动轨迹参数用于表征电话卡在每个采样时间段内的活动范围。
具体来说,活动轨迹参数可以参照前文论述的内容,此处不再赘述。根据N个第一位置集合,获得第一电话卡的N个活动轨迹参数的方式可以参照前文论述步骤101b中的获取i个活动轨迹参数的方式的内容,此处不再赘述。
在执行步骤103之后,识别一人多号的装置执行步骤104,即根据第一电话卡的N个活动轨迹参数,确定第一电话卡在N个采样时间段所对应的N个活动状态,以及根据第二电话卡的N个活动轨迹参数,确定第二电话卡在N个采样时间段所对应的N个活动状态,活动状态用于表示电话卡在每个采样时间段内处于静止状态或运动状态。
根据活动轨迹参数获得活动状态的方式可以参照前文论述步骤101b中的获得活动状态的内容,此处不再赘述。活动状态可以参照前文论述的内容,此处不再赘述。N个活动轨迹参数可能也有异常活动轨迹参数,对异常活动轨迹参数的处理可以参照前文论述步骤101b中的用正常活动轨迹参数替换异常活动轨迹参数的方式的内容。
在执行步骤104之后,识别一人多号的装置执行步骤105,即若第一电话卡在N个采样时间段内的N个活动状态,与第二电话卡在N个采样时间段内的N个活动状态均相同,则确定第一电话卡和第二电话卡属于同一个用户。
具体来说,在获得第一电话卡在N个采样时间段内的N个活动状态,以及第二电话卡在N个采样时间段内的N个活动状态之后,如果第一电话卡的N个活动状态与第二电话卡的N个活动状态相同,则确定第一电话卡和第二电话卡属于同一个用户。
在执行步骤105之后,识别一人多号的装置可以根据终端库数据,确定第一地电话卡和第二电话卡是否是属于双卡槽中的两张电话卡。终端库数据例如,国际移动设备识别码(International Mobile Equipment Identity,IMEI)数据库。
在前文论述的一种识别一人多号的方法的基础上,请参照图4,本申请实施例提供一种识别一人多号的装置,该装置包括获取模块401和处理模块402。
具体来说,获取模块401,用于在N个采样时间段的每个采样时间段内,获取第一电话卡所经过的基站的第一位置集合,以及第二电话卡所经过的基站的第二位置集合,从而获得第一电话卡在N个采样时间段对应的N个第一位置集合,以及第二电话卡在N个采样时间段对应的N个第二位置集合,N为正整数;
处理模块402,用于根据N个第一位置集合,获得第一电话卡的N个活动轨迹参数,以及根据N个第二位置集合,获得第二电话卡的N个活动轨迹参数,活动轨迹参数用于表征电话卡在每个采样时间段内的活动范围;以及,
根据第一电话卡的N个活动轨迹参数,确定第一电话卡在N个采样时间段内的N个活动状态,以及根据第二电话卡的N个活动轨迹参数,确定第二电话卡在N个采样时间段内的N个活动状态,活动状态用于表示电话卡在每个采样时间段内处于静止状态或运动状态;以及,
若第一电话卡在N个采样时间段内的N个活动状态,与第二电话卡在N个采样时间段内的N个活动状态均相同,则确定第一电话卡和第二电话卡属于同一个用户。
在一种可能的设计中,获取模块401还用于,在确定第一电话卡和第二电话卡属于同一个用户之前,在i个采样时间段内,根据至少两张电话卡中每张电话卡在i个采样时间段中每个采样时间段所经过的基站,获得每张电话卡对应的位置集合X(i,j),从而获得每张电话卡的i个位置集合,其中,X(i,j)={(i,j),i=2,3,4…n,j=1,2,3,4…k,n、k为正整数},i表示采样时间段的个数,j表示每个采样时间段的采样时长;
处理模块402还用于,根据每张电话卡对应的i个位置集合,确定出每张电话卡的i个活动轨迹参数,并根据每张电话卡的i个活动轨迹参数,确定出每张电话卡在i个采样时间段内对应的i个活动状态;以及,
若至少两张卡中的任意两张电话卡的i个活动状态均相同,则初次确定任意两张卡属于同一个用户,获得第X(i,j)个参考结果;以及,
根据第X(i,j)个参考结果、以及标准结果,获得第X(i,j)个参考结果的置信度,从而获得i在不同取值下的多个参考结果的多个置信度,标准结果用于表示至少两张电话卡中属于同一用户的判断结果;以及,
从多个置信度中,确定出大于或等于预设置信度的目标置信度;以及
获得与目标置信度所对应的i的取值,从i的取值中确定出取值最小的i为N。
在一种可能的设计中,在获得第X(i,j)个参考结果的准确率之前,还包括:
根据至少两张电话卡中第三电话卡的i个位置集合中的M个位置集合,与至少两张电话卡中第四电话卡的对应的i个位置集合中的M个位置集合,获得第三电话卡的活动轨迹与第四电话卡的活动轨迹的相似度,i为大于或等于M的正整数;以及,
若相似度大于或等于预设阈值,则确定第三电话卡和第四电话卡属于同一用户,从而确定标准结果。
在一种可能的设计中,处理模块402具体用于:
将第三电话卡的M个位置集合按照M个采样时间段的先后顺序进行排序,获得第三电话卡的第一位置序列,以及将第四电话卡的M个位置集合按照M个采样时间段的先后顺序进行排序,获得第四电话卡的第二位置序列;
获得第一位置序列和第二位置序列的最长公共子序列的长度,最长公共子序列为第一位置序列和第二位置序列的共有的子序列中的长度最长的子序列;
根据最长公共子序列的长度除以M,获得第三电话卡的活动轨迹和第四电话卡的活动轨迹的相似度。
在一种可能的设计中,活动轨迹参数包括活动轨迹圆心和活动轨迹半径,处理模块402还用于:
在获得第三电话卡的活动轨迹与第四电话卡的活动轨迹的相似度之前,确定至少两张卡中的第三电话卡的i个活动轨迹参数中的K个活动轨迹半径,与至少两张卡中的第四电话卡对应的i个活动轨迹参数中的K个活动轨迹半径的差值的平均值小于第一预设值,K为小于或等于i的正整数;和/或,
确定第三电话卡的i个活动轨迹参数中的K个活动轨迹圆心与第三电话卡对应的i个活动轨迹参数中的K个活动轨迹圆心的差值的平均值小于第二预设值。
在一种可能的设计中,活动轨迹参数包括活动轨迹圆心、活动轨迹半径、距离偏差值和活动轨迹重心,距离偏差值为活动轨迹圆心和活动轨迹重心之间的距离,处理模块402具体用于:
确定第一电话卡的N个活动轨迹参数中异常动轨迹参数,其中,异常活动轨迹参数为活动轨迹半径大于第三预设值,且距离偏差值大于第四预设值的活动轨迹参数;
根据第一电话卡的N个活动轨迹参数中除了异常动轨迹参数之外的活动轨迹参数,获得与异常活动轨迹参数对应的正常活动轨迹参数;
用正常活动轨迹参数替换第一电话卡的N个活动轨迹参数中的异常动轨迹参数。
在前文论述的一种识别一人多号的方法的基础上,请参照图5,一种识别一人多号的装置,该装置包括处理器501和存储器502,其中:
至少一个处理器501,以及
与所述至少一个处理器501通信连接的存储器502;
其中,所述存储器502存储有可被所述至少一个处理器501执行的指令,所述至少一个处理器501通过执行所述存储器502存储的指令实现如图1中任一项所述的识别一人多号的方法。
图5中是以处理器501的数量为例,但是实际上不限制处理器501的个数。
作为一种实施例,图4中的处理模块402可以通过图5中的处理器501来实现。
在前文论述的一种识别一人多号的方法的基础上,本申请实施例一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如图1中任一项所述的识别一人多号的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (13)

1.一种识别一人多号的方法,其特征在于,包括:
在N个采样时间段的每个采样时间段内,获取第一电话卡所经过的基站的第一位置集合,以及第二电话卡所经过的基站的第二位置集合,从而获得所述第一电话卡在所述N个采样时间段对应的N个第一位置集合,以及所述第二电话卡在所述N个采样时间段对应的N个第二位置集合,N为正整数;
根据所述N个第一位置集合,获得所述第一电话卡的N个活动轨迹参数,以及根据所述N个第二位置集合,获得所述第二电话卡的N个活动轨迹参数,所述活动轨迹参数用于表征电话卡在所述每个采样时间段内的活动范围;
根据所述第一电话卡的N个活动轨迹参数,确定所述第一电话卡在所述N个采样时间段内的N个活动状态,以及根据所述第二电话卡的N个活动轨迹参数,确定所述第二电话卡在所述N个采样时间段内的N个活动状态,所述活动状态用于表示电话卡在所述每个采样时间段内处于静止状态或运动状态;
若所述第一电话卡在所述N个采样时间段内的N个活动状态,与所述第二电话卡在所述N个采样时间段内的N个活动状态均相同,则确定所述第一电话卡和所述第二电话卡属于同一个用户。
2.如权利要求1所述的方法,其特征在于,在确定所述第一电话卡和所述第二电话卡属于同一个用户之前,包括:
在i个采样时间段内,根据至少两张电话卡中每张电话卡在所述i个采样时间段中每个采样时间段所经过的基站,获得所述每张电话卡对应的位置集合X(i,j),从而获得所述每张电话卡的i个位置集合,其中,X(i,j)={(i,j),i=2,3,4…n,j=1,2,3,4…k,n、k为正整数},i表示采样时间段的个数,j表示每个采样时间段的采样时长;
根据所述每张电话卡对应的所述i个位置集合,确定出所述每张电话卡的i个活动轨迹参数,并根据所述每张电话卡的i个活动轨迹参数,确定出所述每张电话卡在所述i个采样时间段内对应的i个活动状态;
若所述至少两张卡中的任意两张电话卡的i个活动状态均相同,则初次确定所述任意两张卡属于同一个用户,获得第X(i,j)个参考结果;
根据所述第X(i,j)个参考结果、以及标准结果,获得所述第X(i,j)个参考结果的置信度,从而获得i在不同取值下的多个参考结果的多个置信度,所述标准结果用于表示所述至少两张电话卡中属于同一用户的判断结果;
从所述多个置信度中,确定出大于或等于预设置信度的目标置信度;
获得与所述目标置信度所对应的i的取值,从所述i的取值中确定出取值最小的i为N。
3.如权利要求2所述的方法,其特征在于,在获得所述第X(i,j)个参考结果的准确率之前,还包括:
根据所述至少两张电话卡中第三电话卡的i个位置集合中的M个位置集合,与所述至少两张电话卡中第四电话卡的对应的i个位置集合中的M个位置集合,获得所述第三电话卡的活动轨迹与所述第四电话卡的活动轨迹的相似度,i为大于或等于M的正整数;
若所述相似度大于或等于预设阈值,则确定所述第三电话卡和所述第四电话卡属于同一用户,从而确定所述标准结果。
4.如权利要求3所述的方法,其特征在于,获得所述第三电话卡的活动轨迹与所述第四电话卡的活动轨迹的相似度,包括:
将所述第三电话卡的M个位置集合按照M个采样时间段的先后顺序进行排序,获得所述第三电话卡的第一位置序列,以及将所述第四电话卡的M个位置集合按照所述M个采样时间段的先后顺序进行排序,获得所述第四电话卡的第二位置序列;
获得所述第一位置序列和所述第二位置序列的最长公共子序列的长度,所述最长公共子序列为所述第一位置序列和所述第二位置序列的共有的子序列中的长度最长的子序列;
根据所述最长公共子序列的长度除以M,获得所述第三电话卡的活动轨迹和第四电话卡的活动轨迹的相似度。
5.如权利要求3所述的方法,其特征在于,所述活动轨迹参数包括活动轨迹圆心和活动轨迹半径,在获得所述第三电话卡的活动轨迹与第四电话卡的活动轨迹的相似度之前,还包括:
确定所述至少两张卡中的第三电话卡的i个活动轨迹参数中的K个活动轨迹半径,与所述至少两张卡中的第四电话卡对应的i个活动轨迹参数中的K个活动轨迹半径的差值的平均值小于第一预设值,K为小于或等于i的正整数;和/或,
确定所述第三电话卡的i个活动轨迹参数中的K个活动轨迹圆心与所述第三电话卡对应的i个活动轨迹参数中的K个活动轨迹圆心的差值的平均值小于第二预设值。
6.如权利要求1-5任一所述的方法,其特征在于,所述活动轨迹参数包括活动轨迹圆心、活动轨迹半径、距离偏差值和活动轨迹重心,所述距离偏差值为所述活动轨迹圆心和所述活动轨迹重心之间的距离,获得所述第一电话卡在所述N个采样时间段内对应的N个活动轨迹参数,包括:
确定所述第一电话卡的N个活动轨迹参数中异常动轨迹参数,其中,所述异常活动轨迹参数为活动轨迹半径大于第三预设值,且距离偏差值大于所述第四预设值的活动轨迹参数;
根据所述第一电话卡的N个活动轨迹参数中除了所述异常动轨迹参数之外的活动轨迹参数,获得与所述异常活动轨迹参数对应的正常活动轨迹参数;
用所述正常活动轨迹参数替换所述第一电话卡的N个活动轨迹参数中的所述异常动轨迹参数。
7.一种识别一人多号的装置,其特征在于,所述装置包括获取模块和处理模块,其中:
所述获取模块,用于在N个采样时间段的每个采样时间段内,获取第一电话卡所经过的基站的第一位置集合,以及第二电话卡所经过的基站的第二位置集合,从而获得所述第一电话卡在所述N个采样时间段对应的N个第一位置集合,以及所述第二电话卡在所述N个采样时间段对应的N个第二位置集合,N为正整数;
所述处理模块,用于根据所述N个第一位置集合,获得所述第一电话卡的N个活动轨迹参数,以及根据所述N个第二位置集合,获得所述第二电话卡的N个活动轨迹参数,所述活动轨迹参数用于表征电话卡在所述每个采样时间段内的活动范围;以及,
根据所述第一电话卡的N个活动轨迹参数,确定所述第一电话卡在所述N个采样时间段内的N个活动状态,以及根据所述第二电话卡的N个活动轨迹参数,确定所述第二电话卡在所述N个采样时间段内的N个活动状态,所述活动状态用于表示电话卡在所述每个采样时间段内处于静止状态或运动状态;以及,
若所述第一电话卡在所述N个采样时间段内的N个活动状态,与所述第二电话卡在所述N个采样时间段内的N个活动状态均相同,则确定所述第一电话卡和所述第二电话卡属于同一个用户。
8.如权利要求7所述的装置,其特征在于,
所述获取模块还用于,在确定所述第一电话卡和所述第二电话卡属于同一个用户之前,在i个采样时间段内,根据至少两张电话卡中每张电话卡在所述i个采样时间段中每个采样时间段所经过的基站,获得所述每张电话卡对应的位置集合X(i,j),从而获得所述每张电话卡的i个位置集合,其中,X(i,j)={(i,j),i=2,3,4…n,j=1,2,3,4…k,n、k为正整数},i表示采样时间段的个数,j表示每个采样时间段的采样时长;
所述处理模块还用于,根据所述每张电话卡对应的所述i个位置集合,确定出所述每张电话卡的i个活动轨迹参数,并根据所述每张电话卡的i个活动轨迹参数,确定出所述每张电话卡在所述i个采样时间段内对应的i个活动状态;以及,
若所述至少两张卡中的任意两张电话卡的i个活动状态均相同,则初次确定所述任意两张卡属于同一个用户,获得第X(i,j)个参考结果;以及,
根据所述第X(i,j)个参考结果、以及标准结果,获得所述第X(i,j)个参考结果的置信度,从而获得i在不同取值下的多个参考结果的多个置信度,所述标准结果用于表示所述至少两张电话卡中属于同一用户的判断结果;以及,
从所述多个置信度中,确定出大于或等于预设置信度的目标置信度;以及,
获得与所述目标置信度所对应的i的取值,从所述i的取值中确定出取值最小的i为N。
9.如权利要求8所述的装置,其特征在于,所述处理模块还用于:
在获得所述第X(i,j)个参考结果的准确率之前,根据所述至少两张电话卡中第三电话卡的i个位置集合中的M个位置集合,与所述至少两张电话卡中第四电话卡的对应的i个位置集合中的M个位置集合,获得所述第三电话卡的活动轨迹与所述第四电话卡的活动轨迹的相似度,i为大于或等于M的正整数;
若所述相似度大于或等于预设阈值,则确定所述第三电话卡和所述第四电话卡属于同一用户,从而确定所述标准结果。
10.如权利要求9所述的装置,其特征在于,所述处理模块具体用于:
将所述第三电话卡的M个位置集合按照M个采样时间段的先后顺序进行排序,获得所述第三电话卡的第一位置序列,以及将所述第四电话卡的M个位置集合按照所述M个采样时间段的先后顺序进行排序,获得所述第四电话卡的第二位置序列;
获得所述第一位置序列和所述第二位置序列的最长公共子序列的长度,所述最长公共子序列为所述第一位置序列和所述第二位置序列的共有的子序列中的长度最长的子序列;
根据所述最长公共子序列的长度除以M,获得所述第三电话卡的活动轨迹和第四电话卡的活动轨迹的相似度。
11.如权利要求9所述的装置,其特征在于,所述活动轨迹参数包括活动轨迹圆心和活动轨迹半径,所述处理模块用于:
在获得所述第三电话卡的活动轨迹与第四电话卡的活动轨迹的相似度之前,确定所述至少两张卡中的第三电话卡的i个活动轨迹参数中的K个活动轨迹半径,与所述至少两张卡中的第四电话卡对应的i个活动轨迹参数中的K个活动轨迹半径的差值的平均值小于第一预设值,K为小于或等于i的正整数;和/或,
确定所述第三电话卡的i个活动轨迹参数中的K个活动轨迹圆心与所述第三电话卡对应的i个活动轨迹参数中的K个活动轨迹圆心的差值的平均值小于第二预设值。
12.一种识别一人多号的装置,其特征在于,包括:
至少一个处理器,以及
与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令实现如权利要求1-6中任一项所述的方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行如权利要求1-6中任一项所述的方法。
CN201811519653.5A 2018-12-12 2018-12-12 一种识别一人多号的方法及装置 Active CN111314851B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811519653.5A CN111314851B (zh) 2018-12-12 2018-12-12 一种识别一人多号的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811519653.5A CN111314851B (zh) 2018-12-12 2018-12-12 一种识别一人多号的方法及装置

Publications (2)

Publication Number Publication Date
CN111314851A true CN111314851A (zh) 2020-06-19
CN111314851B CN111314851B (zh) 2021-08-24

Family

ID=71157992

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811519653.5A Active CN111314851B (zh) 2018-12-12 2018-12-12 一种识别一人多号的方法及装置

Country Status (1)

Country Link
CN (1) CN111314851B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112954626A (zh) * 2021-03-04 2021-06-11 智慧足迹数据科技有限公司 手机信令数据分析方法、装置、电子设备及存储介质
CN114520969A (zh) * 2020-11-20 2022-05-20 中移动信息技术有限公司 一种号卡使用判断方法、装置、设备及计算机存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103052022A (zh) * 2011-10-17 2013-04-17 中国移动通信集团公司 基于移动行为的用户稳定点发现方法和系统
CN103841550A (zh) * 2012-11-21 2014-06-04 中国移动通信集团吉林有限公司 一种识别一人多卡用户的方法及装置
US20140378166A1 (en) * 2013-06-19 2014-12-25 Samsung Electronics Co., Ltd. Method, storage medium, server, and electronic device for implementing location based service within building
CN105095617A (zh) * 2014-04-29 2015-11-25 国际商业机器公司 构建对象的目标运动轨迹的缺失部分的方法和设备
CN105224912A (zh) * 2015-08-31 2016-01-06 电子科技大学 基于运动信息和轨迹关联的视频行人检测和跟踪方法
US20160192156A1 (en) * 2008-02-11 2016-06-30 Popular Metrics, Inc. System and method for determining audience characteristics of a music concert based on mobile phone tracking and mobile data transmission
CN106373145A (zh) * 2016-08-30 2017-02-01 上海交通大学 基于跟踪片段置信度和区分性外观学习的多目标跟踪方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160192156A1 (en) * 2008-02-11 2016-06-30 Popular Metrics, Inc. System and method for determining audience characteristics of a music concert based on mobile phone tracking and mobile data transmission
CN103052022A (zh) * 2011-10-17 2013-04-17 中国移动通信集团公司 基于移动行为的用户稳定点发现方法和系统
CN103841550A (zh) * 2012-11-21 2014-06-04 中国移动通信集团吉林有限公司 一种识别一人多卡用户的方法及装置
US20140378166A1 (en) * 2013-06-19 2014-12-25 Samsung Electronics Co., Ltd. Method, storage medium, server, and electronic device for implementing location based service within building
CN105095617A (zh) * 2014-04-29 2015-11-25 国际商业机器公司 构建对象的目标运动轨迹的缺失部分的方法和设备
CN105224912A (zh) * 2015-08-31 2016-01-06 电子科技大学 基于运动信息和轨迹关联的视频行人检测和跟踪方法
CN106373145A (zh) * 2016-08-30 2017-02-01 上海交通大学 基于跟踪片段置信度和区分性外观学习的多目标跟踪方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BOXUAN GU等: "D2Taint Differentiated and Dynamic Information Flow Tracking on Smartphones for Numerous Data Sources", 《2013 PROCEEDINGS IEEE INFOCOM》 *
孔庆双: "高精度人员定位系统在塔山矿的应用", 《煤矿机电》 *
王雅楠等: "室内移动对象轨迹重构与相似性度量研究", 《计算机科学与探索》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114520969A (zh) * 2020-11-20 2022-05-20 中移动信息技术有限公司 一种号卡使用判断方法、装置、设备及计算机存储介质
CN114520969B (zh) * 2020-11-20 2023-10-27 中移动信息技术有限公司 一种号卡使用判断方法、装置、设备及计算机存储介质
CN112954626A (zh) * 2021-03-04 2021-06-11 智慧足迹数据科技有限公司 手机信令数据分析方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN111314851B (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
CN105894028B (zh) 用户识别方法和装置
CN111314851B (zh) 一种识别一人多号的方法及装置
CN108876509B (zh) 利用poi分析用户标签的方法及系统
CN111312406B (zh) 一种疫情标签数据处理方法及系统
US11756205B2 (en) Methods, devices, apparatuses and storage media of detecting correlated objects involved in images
CN112214677A (zh) 一种兴趣点推荐方法、装置、电子设备及存储介质
CN107767155A (zh) 一种评估用户画像数据的方法及系统
CN115205736A (zh) 视频数据的识别方法和装置、电子设备和存储介质
CN114429644A (zh) 图像底库的更新方法、装置、设备及存储介质
CN113793174A (zh) 数据关联方法、装置、计算机设备和存储介质
CN113487163B (zh) 基于地理位置信息进行业务预测的方法及装置
CN116257885A (zh) 基于联邦学习的隐私数据通信方法、系统和计算机设备
CN110113708A (zh) 基于Wi-Fi位置指纹的定位方法和装置
CN106354736A (zh) 一种重复视频的判断方法及装置
CN109598190A (zh) 用于动作识别的方法、装置、计算机设备及存储介质
CN113987328A (zh) 一种题目推荐方法、设备、服务器及存储介质
CN112434629A (zh) 一种在线时序动作检测方法及设备
CN112632404A (zh) 基于多粒度自注意力的下一个兴趣点推荐方法
CN112035736A (zh) 信息推送方法、装置及服务器
CN113115200B (zh) 用户关系识别方法、装置及计算设备
CN110610206A (zh) 图片的低俗归因识别方法、装置及设备
CN117435963B (zh) 数字资产欺诈群体确定方法、装置、电子设备和存储介质
CN115115843B (zh) 数据处理方法及装置
CN115062695B (zh) 一种作弊判断方法、装置、设备及介质
CN112274920B (zh) 一种虚拟现实手势控制方法、平台、服务器及可读储存介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant