CN118101829A - 电话号码被盗用的识别方法及装置 - Google Patents
电话号码被盗用的识别方法及装置 Download PDFInfo
- Publication number
- CN118101829A CN118101829A CN202410205471.XA CN202410205471A CN118101829A CN 118101829 A CN118101829 A CN 118101829A CN 202410205471 A CN202410205471 A CN 202410205471A CN 118101829 A CN118101829 A CN 118101829A
- Authority
- CN
- China
- Prior art keywords
- terminal
- identified
- terminals
- determining
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000006399 behavior Effects 0.000 claims description 53
- 206010048669 Terminal state Diseases 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 7
- 230000003542 behavioural effect Effects 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 3
- 230000001010 compromised effect Effects 0.000 claims 2
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003405 preventing effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Landscapes
- Telephone Function (AREA)
Abstract
本申请公开了一种电话号码被盗用的识别方法及装置。其中,该方法包括:获取待识别号码,并确定待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;统计历史时段内待识别号码的终端使用次数,得到第一统计结果,从第一统计结果中确定终端使用次数最高的终端,得到第一终端;统计目标时段内待识别号码的终端使用次数,得到第二统计结果;从第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将多个初始终端中属于第一终端的终端剔除,得到多个第二终端;基于第一终端和第二终端的行为特征确定待识别号码是否被盗用。本申请解决了由于相关技术中采用主动接触的方式获取号码被冒用的情况造成的识别准确率低的技术问题。
Description
技术领域
本申请涉及大数据分析技术领域,具体而言,涉及一种电话号码被盗用的识别方法及装置。
背景技术
目前,利用老年人防范意识淡薄、感知能力滞后等特点,通过套取、骗取、盗取老年人相关身份信息,冒用老年人手机号码的事件时有发生,在相关技术中,对冒用、盗用他人电话卡实施诈骗的防范方法主要集中在通话场景下,分为通话后标记、通话中识别和通话前预警三类方式。
其中,通话后标记的方法可以利用通信请求中的身份凭证信息和举报结果进行判断,但后期通过黑名单拦截的防治效果十分有限,更无法防范手机号被盗取后用于诈骗的行为,通话中识别的方法通过声纹监测进行告警,但无法对借助微信、网站客服等其他通联工具实施新型诈骗的行为进行识别。通话前预警的方法借助行为数据分析识别一些潜在的冒用风险,但整网范围内主动侦查的识别效率低,或局限于单个网站范围内侦测覆盖度不足,面向老年群体的特征,相关技术中,采用老年目标用户的信令数据和户籍数据计算诈骗风险,但仅适用于老年人主动接触诈骗高相关的行为场景,无法识别老年人手机号码被冒用的情况。由于老年人常用老年机不具备智能机功能,手机号码被冒用后常伴随换机特征和使用特征的异常,采用相关技术中的方法识别准确率较低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种电话号码被盗用的识别方法及装置,以至少解决由于相关技术中采用主动接触的方式获取号码被冒用的情况造成的识别准确率低的技术问题。
根据本申请实施例的一个方面,提供了一种电话号码被盗用的识别方法,包括:获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端;统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用。
可选地,基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用,包括:采集所述第一终端和所述第二终端的行为特征,其中,所述行为特征数据包括:多种相关属性,所述多种相关属性至少包括:通话记录、应用程序使用记录和终端所处的位置信息;基于所述第一终端的行为特征和所述第二终端的行为特征确定所述待识别号码是否被盗用。
可选地,基于所述第一终端的行为特征和所述第二终端的行为特征确定所述待识别号码是否被盗用,包括:获取在所述历史时段内所述第一终端在多个时间点的第一特征数据;获取在所述目标时段内所述第二终端在多个时间点的第二特征数据;基于所述第一特征数据和所述第二特征数据确定所述待识别号码是否被盗用。
可选地,基于所述第一特征数据和所述第二特征数据确定所述待识别号码是否被盗用,包括:获取终端状态信息,所述终端状态信息至少包括:所述行为特征数据对应的终端状态是否正常的信息熵;根据所述终端状态信息剔除所述第一特征数据和所述第二特征数据中信息增益率低于预设增益率阈值的相关属性,得到第一目标特征数据和第二目标特征数据;根据所述第一目标特征数据和所述第二目标特征数据确定所述待识别号码是否被盗用。
可选地,根据所述第一目标特征数据和所述第二目标特征数据确定所述待识别号码是否被盗用,包括:根据所述第一目标特征数据和所述第二目标特征数据确定所述第一终端和所述第二终端的相似度;将相似度低于第一阈值的多个第二终端确定为多个目标终端;根据所述多个目标终端的相似度确定所述待识别号码是否被盗用。
可选地,根据所述多个目标终端的相似度确定所述待识别号码是否被盗用,包括:将所述多个目标终端的相似度倒数的和确定为风险分数;在所述风险分数大于第二阈值的情况下,确定所述待识别号码被盗用。
可选地,统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,包括检测所述待识别号码连接到的终端标识,将所述终端标识确定为终端轨迹信息;统计所述历史时段内的终端轨迹信息,得到所述第一统计结果,所述第一统计结果用于表示所述历史时段内的终端轨迹信息中每个终端出现的次数。
根据本申请实施例的另一方面,还提供了一种电话号码被盗用的识别装置,包括:获取模块,用于获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;第一统计模块,用于统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端,其中,所述终端使用次数为所述待识别号码更换终端的频率;第二统计模块,用于统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;筛选模块,用于从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;确定模块,用于基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用。
根据本申请实施例的又一方面,还提供了一种计算机设备,包括:存储器,用于存储程序指令;处理器,与所述存储器连接,用于执行以下功能的程序指令:获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端;统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用。
根据本申请实施例的又一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的计算机程序,其中,所述非易失性存储介质所在设备通过运行所述计算机程序执行上述电话号码被盗用的识别方法。
在本申请实施例中,采用获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端;统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用的方式,通过终端使用次数确定待识别号码是否被盗用,达到了无需主动接触进行被盗用号码识别的目的,从而实现了提高被盗用号码识别准确率的技术效果,进而解决了由于相关技术中采用主动接触的方式获取号码被冒用的情况造成的识别准确率低技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种用于实现电话号码被盗用的识别方法的计算机终端的硬件结构框图;
图2是根据本申请的一种电话号码被盗用的识别方法的示意图;
图3是根据本申请实施例的一种可选的第一终端和第二终端确定方法的流程图;
图4是根据本申请实施例的一种可选的电话号码被盗用的识别方法数据流动示意图;
图5是根据本申请实施例的另一种可选的电话号码被盗用的识别方法的示意图;
图6是根据本申请的一种电话号码被盗用的识别装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请实施例所提供的电话号码被盗用的识别方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现电话号码被盗用的识别方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及通过有线和/或无线网络连接的用于通信功能的传输模块106。除此以外,还可以包括:显示器、键盘、光标控制设备、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口、BUS总线。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的电话号码被盗用的识别方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的电话号码被盗用的识别方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输模块106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输模块106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输模块106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算机终端可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机终端中的部件的类型。
在上述运行环境下,本申请实施例提供了一种电话号码被盗用的识别方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2是根据本申请实施例的电话号码被盗用的识别方法的流程图,如图2所示,该方法包括如下步骤:
步骤S202,获取待识别号码,并确定待识别号码对应的终端集合,其中,待识别号码为目标用户的号码,目标用户具备预设特征;
步骤S204,统计历史时段内待识别号码的终端使用次数,得到第一统计结果,从第一统计结果中确定终端使用次数最高的终端;
步骤S206,统计目标时段内待识别号码的终端使用次数,得到第二统计结果;
步骤S208,从第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将多个初始终端中属于第一终端的终端剔除,得到多个第二终端;
步骤S210,基于第一终端和第二终端的行为特征确定待识别号码是否被盗用。
通过上述步骤,可以实现采用获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端,其中,所述终端使用次数为所述待识别号码更换终端的频率;统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用的方式,通过终端使用次数确定待识别号码是否被盗用,达到了无需主动接触进行被盗用号码识别的目的,从而实现了提高被盗用号码识别准确率的技术效果,进而解决了由于相关技术中采用主动接触的方式获取号码被冒用的情况造成的识别准确率低技术问题。
在步骤S202中,待识别号码对应的终端集合,包括:与待识别号码绑定过的终端,待识别号码可以是目标用户的号码,例如老年用户群体的号码,在经过授权后进行预测。例如通过居民社区联系老年用户群体。预设特征包括:APP(手机软件)使用情况、终端所处位置等,以老年用户群体为例,预设特征包括但不限于:使用APP的种类固定仅包含固定种类范围内的APP、APP的使用时段处于固定时段、终端所处范围处于预设范围内,在出现冒用情况下,APP的使用种类会发生改变,例如高频次使用社交软件、终端所处范围会离开常用范围。
在步骤S206中,目标时段为历史时段之后的时段,例如:历史时段为前三个月,目标时段为当前月。
在步骤S210中,终端的行为特征可以是终端检测并记录的用户针对该终端的使用行为信息所确定的特征。
表1
表1示出了第一终端和第二终端的换机行为统计表。
以下将通过实施例具体说明步骤S202至步骤S210。
在本申请的一些实施例中,终端使用次数可以通过以下方式确定:检测所述待识别号码连接到的终端标识,将所述终端标识确定为终端轨迹信息;统计所述历史时段内的终端轨迹信息,得到所述第一统计结果,所述第一统计结果用于表示所述历史时段内的终端轨迹信息中每个终端出现的次数。
需要进行说明的是,上述终端轨迹信息包括:待识别号码连接终端标识的记录(终端标识出现记录)。通过历史时段内的终端轨迹信息,按照待识别号码(用户号码)统计历史时段内的终端轨迹信息中每个终端出现的次数,待识别号码每连接一次终端标识则认为终端产生一次终端使用次数。
在另一种可选的方式中,终端使用次数可以通过终端使用天数确定,例如:终端使用天数增加一天则记录终端使用次数增加一次。
图3示出了一种第一终端和第二终端确定方法的流程图,如图3所示,获取检测到的用户标识(待识别号码),统计历史时段内用户标识使用不同终端标识的次数(终端使用次数),检测当前终端标识是否为出现次数最多的终端,确定为第一终端,统计目标时段(当前阶段)使用不同终端标识的次数,剔除其中的第一终端的换机记录,最终确定第二终端。
需要进行说明的是,历史阶段和当前阶段的区分目的是防止冒用终端干扰被盗用号码的判定,以历史时段为前三个月至上月为例,历史时段的终端轨迹数据用于判别待识别号码的真实终端,以目标时段为本月为例,目标时段终端轨迹数据用于圈定本月发现的疑似冒用终端。圈定第二统计结果中的次数阈值T0是为剔除偶发、自用的换机行为,其中,T0的下限为0,上限与目标时段的时间长短有关联性。
需要进一步说明的是,一个第一终端可以对应多个满足条件的第二终端,即用户存在近期被多次换机冒用的情况。
在步骤S210中,基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用的具体步骤如下:采集所述第一终端和所述第二终端的行为特征,其中,所述行为特征数据包括:多种相关属性,所述多种相关属性至少包括:通话记录、应用程序使用记录和终端所处的位置信息;基于所述第一终端的行为特征和所述第二终端的行为特征确定所述待识别号码是否被盗用。
需要进行说明的是,终端的行为特征可以通过以下方式确定,根据待识别的电话号码和用户终端的标识相关联采集终端的行为数据,例如:通话记录、APP使用信息和终端的位置信息。
对于第一终端的行为特征和第二终端的行为特征,可以通过以下方式获取,获取在所述历史时段内所述第一终端在多个时间点的第一特征数据;获取在所述目标时段内所述第二终端在多个时间点的第二特征数据;基于所述第一特征数据和所述第二特征数据确定所述待识别号码是否被盗用。
具体地,对于第一终端的行为特征数据,对历史时段中每个时间分割点间的行为数据统计提取相关属性,例如:通话记录、应用程序使用记录和终端所处的位置信息。
对于与第一终端相对应的第二终端的行为特征数据,对当前阶段中每个时间分割点间的行为数据统计提取相关属性,例如:通话记录、应用程序使用记录和终端所处的位置信息。
为了确定待识别号码自身的状态正常,加入了终端状态的区分,获取终端状态信息,所述终端状态信息至少包括:所述行为特征数据对应的终端状态是否正常的信息熵;根据所述终端状态信息剔除所述第一特征数据和所述第二特征数据中信息增益率低于预设增益率阈值的相关属性,得到第一目标特征数据和第二目标特征数据;根据所述第一目标特征数据和所述第二目标特征数据确定所述待识别号码是否被盗用。
具体地,通过终端状态分类进行区分。补充异常终端属性与正常终端属性,剔除掉信息增益率小的属性项,信息增益率可以通过下式确定:
Gain_ratio(S,A)=(H(S)-H(S|A))/H(A);
式中,Gain_ratio(S,A)表示信息增益率,H(S)表示每个终端状态的信息熵,其中,pi表示终端状态正常的概率,n表示终端的数目,H(A)表示属性为A的信息熵,H(S|A)表示属性A条件下中终端是否正常的信息熵,通过保留下的属性项训练终端状态分类模型,将嫌疑终端按照行为数据分类终端状态打标,并与原用户行为特征数据进行融合。第一目标特征数据和所述第二目标特征数据中包括保留的相关属性。
根据所述第一目标特征数据和所述第二目标特征数据确定所述待识别号码是否被盗用的具体过程如下:根据所述第一目标特征数据和所述第二目标特征数据确定所述第一终端和所述第二终端的相似度;将相似度低于第一阈值的多个第二终端确定为多个目标终端;根据所述多个目标终端的相似度确定所述待识别号码是否被盗用。
具体地,第一终端和所述第二终端的相似度,具体可以通过Tanimoto系数确定(一种用于计算两个集合之间相似度的指标),具体地,通过下式计算:
式中,T(Ai,Bij)表示第一终端和所述第二终端的相似度,Ai表示第一目标特征数据,Bij表示第二目标特征数据。
可以理解的是,特征数据由多种相关属性的特征向量组成。
最后,将所述多个目标终端的相似度倒数的和确定为风险分数,在所述风险分数大于第二阈值的情况下,确定所述待识别号码被盗用。
风险系数可以通过下式确定:
式中,Ri表示风险系数,j表示目标终端的编号,Tij表示第j个目标终端与第一终端的相似度。
在本申请的一些实施例中,终端的行为特征可以包含如社交类APP访问次数,视频类APP访问时长,通话次数,通话时段偏好、日工作地、日居住地等多属性特征向量,终端状态的分类方法可采用二分类方法,如决策树、逻辑回归、随机森林等。其中第一终端与第二终端的相似性阈值(第一阈值)用于区分终端行为显著变化的界限,可取(0,1)之间数值,第一阈值越小准确度越高,灵敏度越低。得到待识别号码的风险表如表2所示。
表2
在冒用风险预警阶段,将待识别号码进行分组,对待识别号码的风险来源表中的风险分数,可以将第二阈值,作为风险分数进行预警的分界线,其取值越大风险越高。如第二阈值为5,表2中待识别号码133XXXX0532风险分数为6.7,将被预警为存在冒用风险。预警结果推送接收人可选待识别号码对应的用户的关联人,例如:老年人所在社区管理员和子女。
图4示出了一种电话号码被盗用的识别方法数据流动示意图,如图4所示,第一步为数据采集,第二步将采集到的数据进行分析整合,得到待发送预警的号码,向待发送预警的号码的联系人发送预警信息。
图5示出了另一种电话号码被盗用的识别方法,如图5所示,通过社区侧提供的经过授权使用的老年群体对应的待识别号码,采集历史时段内待识别号码使用终端的次数,将使用次数最多的终端确定为第一终端,采集目标时段中待识别号码的使用记录,删除第一终端后的其余终端中使用次数大于次数阈值的终端确定为第二终端。通过待识别号码关联对应的用户,通过待识别号码和第一终端标识获取第一终端的行为特征数据,通过待识别号码和第二终端标识获取第二终端的行为特征数据,并将终端状态分为正常和异常,并根据终端状态融合得到第一目标特征数据和第二目标特征数据,根据第一目标特征数据和第二目标特征数据确定第一终端和第二终端的相似度,并根据第一阈值确定目标终端,根据目标终端的相似度倒数确定风险分数,最终确定预警号码。
需要进行说明的是,IMEI(International Mobile Equipment Identity,国际移动设备识别码):即通常所说的手机序列号、手机“串号”,用于在移动电话网络中识别每一部独立的手机等移动通信设备,相当于移动电话的身份证;MSISDN(Mobile StationIntegrated Services Digital Network,移动站综合业务数字网络):在蜂窝网络上,MSISDN是在呼叫或数据会话期间标识设备的电话号码,通常包含国家代码、地区代码和用户号码,它是一个全球唯一的标识符,用于识别移动电话用户。
根据本申请实施例的另一方面,还提供了一种电话号码被盗用的识别装置,如图6所示,包括:获取模块60,用于获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;第一统计模块62,用于统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端;第二统计模块64,用于统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;筛选模块66,用于从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;确定模块68,用于基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用。
其中,确定模块68,包括:确定子模块,用于采集所述第一终端和所述第二终端的行为特征,其中,所述行为特征数据包括:多种相关属性,所述多种相关属性至少包括:通话记录、应用程序使用记录和终端所处的位置信息;基于所述第一终端的行为特征和所述第二终端的行为特征确定所述待识别号码是否被盗用。
确定子模块,包括:确定单元,用于获取在所述历史时段内所述第一终端在多个时间点的第一特征数据;获取在所述目标时段内所述第二终端在多个时间点的第二特征数据;基于所述第一特征数据和所述第二特征数据确定所述待识别号码是否被盗用。
确定单元,包括:确定子单元、相似度子单元和风险分数子单元,确定子单元,用于获取终端状态信息,所述终端状态信息至少包括:所述行为特征数据对应的终端状态是否正常的信息熵;根据所述终端状态信息剔除所述第一特征数据和所述第二特征数据中信息增益率低于预设增益率阈值的相关属性,得到第一目标特征数据和第二目标特征数据;根据所述第一目标特征数据和所述第二目标特征数据确定所述待识别号码是否被盗用。
相似度子单元,用于根据所述第一目标特征数据和所述第二目标特征数据确定所述第一终端和所述第二终端的相似度;将相似度低于第一阈值的多个第二终端确定为多个目标终端;根据所述多个目标终端的相似度确定所述待识别号码是否被盗用。
风险分数子单元,用于将所述多个目标终端的相似度倒数的和确定为风险分数;在所述风险分数大于第二阈值的情况下,确定所述待识别号码被盗用。
第一统计模块62,包括:统计子模块,用于检测所述待识别号码连接到的终端标识,将所述终端标识确定为终端轨迹信息;统计所述历史时段内的终端轨迹信息,得到所述第一统计结果,所述第一统计结果用于表示所述历史时段内的终端轨迹信息中每个终端出现的次数。
需要说明的是,图6所示的电话号码被盗用的识别装置用于执行图2所示的电话号码被盗用的识别方法,因此上电话号码被盗用的识别方法中的相关解释说明也适用于该种电话号码被盗用的识别装置,此处不再赘述。
根据本申请实施例的又一方面,还提供了一种计算机设备,包括:存储器,用于存储程序指令;处理器,与所述存储器连接,用于执行以下功能的程序指令:获取待识别号码,并确定所述待识别号码对应的终端集合;统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端,其中,所述终端使用次数为所述待识别号码更换终端的频率;统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用。
需要说明的是,上述计算机设备用于执行图2所示的电话号码被盗用的识别方法,因此上电话号码被盗用的识别方法中的相关解释说明也适用于上述计算机设备,此处不再赘述。
根据本申请实施例的又一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的计算机程序,其中,所述非易失性存储介质所在设备通过运行所述计算机程序执行上述电话号码被盗用的识别方法。
需要说明的是,上述非易失性存储介质用于存储图2所示的电话号码被盗用的识别方法对应的计算机程序,因此上电话号码被盗用的识别方法中的相关解释说明也适用于上述非易失性存储介质,此处不再赘述。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (10)
1.一种电话号码被盗用的识别方法,其特征在于,包括:
获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;
统计历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端;
统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;
从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;
基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用。
2.根据权利要求1所述的方法,其特征在于,基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用,包括:
采集所述第一终端和所述第二终端的行为特征,其中,所述行为特征数据包括:多种相关属性,所述多种相关属性至少包括:通话记录、应用程序使用记录和终端所处的位置信息;
基于所述第一终端的行为特征和所述第二终端的行为特征确定所述待识别号码是否被盗用。
3.根据权利要求2所述的方法,其特征在于,基于所述第一终端的行为特征和所述第二终端的行为特征确定所述待识别号码是否被盗用,包括:
获取在所述历史时段内所述第一终端在多个时间点的第一特征数据;
获取在所述目标时段内所述第二终端在多个时间点的第二特征数据;
基于所述第一特征数据和所述第二特征数据确定所述待识别号码是否被盗用。
4.根据权利要求3所述的方法,其特征在于,基于所述第一特征数据和所述第二特征数据确定所述待识别号码是否被盗用,包括:
获取终端状态信息,所述终端状态信息至少包括:所述行为特征数据对应的终端状态是否正常的信息熵;
根据所述终端状态信息剔除所述第一特征数据和所述第二特征数据中信息增益率低于预设增益率阈值的相关属性,得到第一目标特征数据和第二目标特征数据;
根据所述第一目标特征数据和所述第二目标特征数据确定所述待识别号码是否被盗用。
5.根据权利要求4所述的方法,其特征在于,根据所述第一目标特征数据和所述第二目标特征数据确定所述待识别号码是否被盗用,包括
根据所述第一目标特征数据和所述第二目标特征数据确定所述第一终端和所述第二终端的相似度;
将相似度低于第一阈值的多个第二终端确定为多个目标终端;
根据所述多个目标终端的相似度确定所述待识别号码是否被盗用。
6.根据权利要求5所述的方法,其特征在于,根据所述多个目标终端的相似度确定所述待识别号码是否被盗用,包括:
将所述多个目标终端的相似度倒数的和确定为风险分数;
在所述风险分数大于第二阈值的情况下,确定所述待识别号码被盗用。
7.根据权利要求1所述的方法,其特征在于,统计所述历史时段内所述待识别号码的终端使用次数,得到第一统计结果,包括
检测所述待识别号码连接到的终端标识,将所述终端标识确定为终端轨迹信息;
统计所述历史时段内的终端轨迹信息,得到所述第一统计结果,所述第一统计结果用于表示所述历史时段内的终端轨迹信息中每个终端出现的次数。
8.一种电话号码被盗用的识别装置,其特征在于,包括:
获取模块,用于获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;
第一统计模块,用于统计历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端;
第二统计模块,用于统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;
筛选模块,用于从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;
确定模块,用于基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用。
9.一种计算机设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,与所述存储器连接,用于执行以下功能的程序指令:获取待识别号码,并确定所述待识别号码对应的终端集合,其中,所述待识别号码为目标用户的号码,所述目标用户具备预设特征;统计历史时段内所述待识别号码的终端使用次数,得到第一统计结果,从所述第一统计结果中确定所述终端使用次数最高的终端,得到第一终端;统计目标时段内所述待识别号码的终端使用次数,得到第二统计结果;从所述第二统计结果中确定终端使用次数高于预设次数阈值的终端,得到多个初始终端,并将所述多个初始终端中属于所述第一终端的终端剔除,得到多个第二终端;基于所述第一终端和所述第二终端的行为特征确定所述待识别号码是否被盗用。
10.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的计算机程序,其中,所述非易失性存储介质所在设备通过运行所述计算机程序执行权利要求1至7中任意一项所述电话号码被盗用的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410205471.XA CN118101829A (zh) | 2024-02-23 | 2024-02-23 | 电话号码被盗用的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410205471.XA CN118101829A (zh) | 2024-02-23 | 2024-02-23 | 电话号码被盗用的识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118101829A true CN118101829A (zh) | 2024-05-28 |
Family
ID=91162840
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410205471.XA Pending CN118101829A (zh) | 2024-02-23 | 2024-02-23 | 电话号码被盗用的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118101829A (zh) |
-
2024
- 2024-02-23 CN CN202410205471.XA patent/CN118101829A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110517097B (zh) | 识别异常用户的方法、装置、设备及存储介质 | |
CN108924333B (zh) | 诈骗电话识别方法、装置和系统 | |
CN110337059B (zh) | 一种用户家庭关系的分析算法、服务器及网络系统 | |
CN106658564B (zh) | 一种家庭用户的识别方法及装置 | |
CN110493476B (zh) | 一种检测方法、装置、服务器及存储介质 | |
CN113543178A (zh) | 基于用户感知的业务优化方法、装置、设备及存储介质 | |
CN113412607B (zh) | 内容推送方法、装置、移动终端及存储介质 | |
CA3152848A1 (en) | User identifying method and device, and computer equipment | |
CN111476596A (zh) | 基于同源设备的家庭人口数据处理方法、系统及存储介质 | |
CN112954626A (zh) | 手机信令数据分析方法、装置、电子设备及存储介质 | |
CN111782735A (zh) | 羊毛党流量识别方法及装置 | |
US8923841B2 (en) | Method for identifying a mobile telephone | |
CN108197050B (zh) | 一种设备识别方法、装置及系统 | |
CN110167030B (zh) | 识别骚扰电话的方法、装置、电子设备和存储介质 | |
CN113609389A (zh) | 一种社区平台信息推送方法及系统 | |
CN106878965A (zh) | 一种评估移动终端性能的方法和装置 | |
CN113032764A (zh) | 账户注册登录的业务风控系统和业务风控方法 | |
CN106982284A (zh) | 骚扰电话号码的识别方法及装置 | |
CN118101829A (zh) | 电话号码被盗用的识别方法及装置 | |
CN109121137B (zh) | 双卡终端的用户号码使用类型识别方法及装置 | |
CN110401959B (zh) | 检测蹭网终端的方法、装置、电子设备和存储介质 | |
CN107770734B (zh) | 移动用户常驻地识别方法及装置 | |
CN112559586A (zh) | 获取家庭用户特征数据的方法以及系统 | |
CN110417634A (zh) | 基于信息安全的防刷票作弊方法及相关设备 | |
CN112307075A (zh) | 用户关系识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |