CN113596260B - 异常电话号码检测方法和电子设备 - Google Patents
异常电话号码检测方法和电子设备 Download PDFInfo
- Publication number
- CN113596260B CN113596260B CN202010363135.XA CN202010363135A CN113596260B CN 113596260 B CN113596260 B CN 113596260B CN 202010363135 A CN202010363135 A CN 202010363135A CN 113596260 B CN113596260 B CN 113596260B
- Authority
- CN
- China
- Prior art keywords
- call
- numbers
- abnormal
- social
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2281—Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
Landscapes
- Engineering & Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Technology Law (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
本发明公开一种异常电话号码检测方法和电子设备,用以解决检测异常电话号码效率低、安全性低的问题。本申请方案包括:获取第一号码的历史通话话单数据;根据历史通话话单数据生成第一号码与多个第二号码的社交关系图;根据社交关系图生成第一号码的通话特征向量;确定第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度;在相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定第一号码是否是异常电话号码。本方案能高效确定第一号码的通话行为是否与异常号码相似,进而判断第一号码是否是异常。判断过程中无需获取第一号码的通话内容,有效避免通话内容泄露,提高检测过程中的信息安全性。
Description
技术领域
本发明涉及信息安全领域,尤其涉及一种异常电话号码检测方法和电子设备。
背景技术
现有一些不法分子通过电话对电信用户进行电信诈骗,用户的个人信息及财产安全受到威胁。
如果依靠用户投诉举报、公安立案等信息通过人工判断异常电话,则由于信息滞后,所以往往存在时效性差、更新缓慢等缺点。如果采集通话信息内容,通过语义分析通话内容,进而判断异常电话,则由于采集的通话信息内容本身是敏感信息,所以存在泄露用户信息的风险等问题。
因此,如何安全高效地检测异常电话号码,是现有技术中亟待解决的问题。
发明内容
本申请实施例的目的是提供一种异常电话号码检测方法和电子设备,用以解决检测异常电话号码效率低、安全性低的问题。
第一方面,提供了一种异常电话号码检测方法,包括:
获取第一号码的历史通话话单数据,所述历史通话数据包括所述第一号码与多个第二号码的通话记录;
根据所述历史通话话单数据生成所述第一号码与所述多个第二号码的社交关系图;
根据所述社交关系图生成所述第一号码的通话特征向量,所述通话特征向量用于表征所述第一号码的通话行为特征;
根据所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度确定所述第一号码是否是异常电话号码。
第二方面,提供了一种电子设备,包括:
获取模块,获取第一号码的历史通话话单数据,所述历史通话数据包括所述第一号码与多个第二号码的通话记录;
第一生成模块,根据所述历史通话话单数据生成所述第一号码与所述多个第二号码的社交关系图;
第二生成模块,根据所述社交关系图生成所述第一号码的通话特征向量,所述通话特征向量用于表征所述第一号码的通话行为特征;
第一确定模块,确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度;
第二确定模块,在所述相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定所述第一号码是否是异常电话号码,其中,所述社交圈号码列表包括与所述第二号码进行通话的对端号码。
第三方面,提供了一种电子设备,该电子设备包括处理器、存储器及存储在该存储器上并可在该处理器上运行的计算机程序,该计算机程序被该处理器执行时实现如第一方面的方法的步骤。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储计算机程序,该计算机程序被处理器执行时实现如第一方面的方法的步骤。
在本申请实施例中,通过获取第一号码的历史通话话单数据,所述历史通话数据包括所述第一号码与多个第二号码的通话记录;根据所述历史通话话单数据生成所述第一号码与所述多个第二号码的社交关系图;根据所述社交关系图生成所述第一号码的通话特征向量,所述通话特征向量用于表征所述第一号码的通话行为特征;确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度;在所述相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定所述第一号码是否是异常电话号码,其中,所述社交圈号码列表包括与所述第二号码进行通话的对端号码。本方案根据通话特征向量能高效确定第一号码的通话行为是否与异常号码相似,进而判断第一号码是否是异常。判断过程中无需获取第一号码的通话内容,有效避免了通话内容泄露,提高了检测过程中的信息安全性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1a是本发明的一个实施例异常电话号码检测方法的流程示意图之一;
图1b是本发明的一个实施例基于通话次数的社交关系图;
图1c是本发明的一个实施例基于通话时长的社交关系图;
图2是本发明的一个实施例异常电话号码检测方法的流程示意图之二;
图3是本发明的一个实施例异常电话号码检测方法的流程示意图之三;
图4是本发明的一个实施例异常电话号码检测方法的流程示意图之四;
图5是本发明的一个实施例异常电话号码检测方法的流程示意图之五;
图6是本发明的一个实施例异常电话号码检测方法的流程示意图之六;
图7是本发明的一个实施例异常电话号码检测方法的流程示意图之七;
图8是本发明的一个实施例异常电话号码检测方法的流程示意图之八;
图9是本申请的一个电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本申请中附图编号仅用于区分方案中的各个步骤,不用于限定各个步骤的执行顺序,具体执行顺序以说明书中描述为准。
为了解决现有技术中存在的问题,本申请实施例提供一种异常电话号码检测方法,如图1a所示,包括以下步骤:
S11:获取第一号码的历史通话话单数据,所述历史通话数据包括所述第一号码与多个第二号码的通话记录;
S12:根据所述历史通话话单数据生成所述第一号码与所述多个第二号码的社交关系图;
S13:根据所述社交关系图生成所述第一号码的通话特征向量,所述通话特征向量用于表征所述第一号码的通话行为特征;
S14:确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度;
S15:在所述相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定所述第一号码是否是异常电话号码,其中,所述社交圈号码列表包括与所述第二号码进行通话的对端号码。
本申请实施例方案中所述的电话号码可以是能执行通话功能的电话号码,该电话号码可以是座机电话号码也可以是手机电话号码,另外还可以是网络电话号码、虚拟运营商电话号码、物联网电话号码、卫星电话号码等。
上述步骤S11中,可以获取第一号码的通话记录,该号码的通话记录具体可以包括通话时间、通话时长、通话呼叫关系、通话对象等。其中通话呼叫关系例如可以包括主叫通话关系和被叫通话关系。如果由第一号码向第二号码拨打电话,则第一号码通话记录中这次通话的通话呼叫关系为主叫通话关系。如果第一号码接听了第二号码打来的电话,则第一号码通话记录中这次通话的通话呼叫关系为被叫通话关系。为了便于说明,本实施例中获取的历史通话话单数据为第一号码在历史N天内的通话记录,其中N为正整数。应理解的是,实际应用中可以根据实际需求调整获取的历史通话话单数据所对应的时间长度。
在实际应用中,可以获取第一号码一段时间内的全量话单,例如获取第一号码当天及前N天之内的全量话单,实现第一号码的历史通话话单数据的获取。通过获取历史通话话单数据,可以获取到这段时间内第一号码执行的通话的主叫号码、被叫号码、通话开始时间、通话时长等字段内容。
随后,在步骤S12中,可以对获取到的历史通话话单数据进行分析,以预设时间单位建立第一号码的社交关系图,例如可以将一天作为一个时间单位,建立第一号码每天的社交关系图。
首先,从历史通话话单数据中确定出第一号码一天之内的通话话单,以第一号码作为本端号码,记录为一个节点。将每个与第一号码进行通话的号码确定为对端号码,即第二号码。将对端号码作为新的节点与第一号码连接,生成第一号码的社交关系图架构。第一号码的社交关系图架构可以包括第一号码的节点以及与第一号码的节点连通的多个第二号码的节点。
在生成第一号码的社交关系图架构之后,统计上述通话话单中本端号码对各个对端号码的主叫次数与被叫次数。对于本端号码的主叫通话记录,在社交关系图中可以记录为本端号码节点指向对端号码节点的连线,连线上可以标记有本端号码对该对端号码的主叫次数的数值。对于本端号码的被叫通话记录,在社交关系图中可以记录为对端号码节点指向本端号码节点的连线,连线上可以标记有本端号码对该对端号码的被叫次数的数值。
举例而言,假设第一号码在一天之内的通话情况如下表1所示,则根据第一号码的历史通话话单数据的通话次数生成的社交关系图如图1b所示。其中,第一号码为A,第一号码共进行了5次通话,其中包括第一号码主叫的2次通话和第一号码被叫的3次通话。通话呼叫关系如图中箭头所示,通话次数如箭头上标记的数值所示。
表1历史通话话单数据
另外,还可以根据第一号码的历史通话话单数据的通话持续时长生成社交关系图,以上述表1为例,生成的社交关系图如图1c所示。其中,通话呼叫关系如图中箭头所示,通话时长如箭头上标记的数值所示。
本申请实施例中提供的社交关系图仅用于说明本方案,实际上,社交关系图中也可以包括其他历史通话话单数据中的信息。举例而言,在用于表征通话呼叫关系的箭头上还可以标记有通话开始时间、通话结束时间等信息。在本实施例提供的社交关系图中,用于表征通话呼叫关系的箭头上仅标记了一种信息,应理解的是,实际应用中还可以在用于表征通话呼叫关系箭头上标注多个信息,例如同时标注有通话次数和通话持续时长。
通过本申请上述方案生成的社交关系图能表征第一号码在一段时间内进行通话的具体情况,社交关系图中表征出的信息能为随后步骤中判断异常号码提供数据支持。
接着,在步骤S13中,根据所述社交关系图生成所述第一号码的通话特征向量,所述通话特征向量用于表征所述第一号码的通话行为特征。其中,可以根据社交关系图中的至少一种信息生成上述通话特征向量,例如根据第一号码与多个第二号码的通话次数生成通话特征向量,或者,根据第一号码与多个第二号码的通话时长生成通话特征向量。当然,也可以根据社交关系图中表征的多种信息生成多维的通话特征向量,用以表征第一号码的通话行为特征。
随后,在步骤S14中,确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度。其中的异常号码可以是记录在案的诈骗电话号码,或者,被多用户投诉举报的诈骗电话号码等。如果第一号码的通话特征向量与已标注异常号码的通话特征向量相似度较高,则表明第一号码的通话行为特征与异常号码的通话行为特征相接近,进而可以推断第一号码有可能是异常电话号码,并可以通过随后的步骤S15进一步判断该第一号码是否是异常电话号码。
最后,在步骤S15中,在所述相似度大于预设相似度时,通过多个第二号码对应的多个社交圈号码列表之间的重合度对第一号码做进一步检测,能有效提高检测准确性。由于生成的通话特征向量能表征第一号码的通话行为特征,因此通过比对第一号码的通话特征向量与已标注异常号码的通话特征向量的方式,能实现对第一号码通话行为特征与已标注异常号码行为特征的比对。如果第一号码的通话特征向量与已标注异常号码的通话特征向量相似度较高,则表明第一号码通话行为特征与已标注异常号码行为特征相接近,进而可以确定第一号码也属于异常电话号码。
一般情况下,诈骗份子的电话呼叫具有广撒网属性,即在当天某个时间段对某一批诈骗目标用户发起主叫拨打,尝试与用户建立电话联系的社交行为;同时,多个诈骗目标用户相互之间具有陌生属性,较少发生通话社交行为。通过本申请实施例提供的方案,能建立号码的通话社交关系,基于社交行为筛选出与已知诈骗号码较为相似的第一号码,进而实现对第一号码是否是异常号码的判断。本方案不涉及用户的敏感信息,方法通用易实现,能灵活准确地实现诈骗电话的筛选。在批量筛选异常号码时,可以通过上述方案获取多个电话号码的历史通话话单数据,分别确定每个号码的社交关系图并生成通话特征向量,进而比对多个通话特征向量与已标注异常号码的相似度,从而实现对异常电话号码的批量筛选。
基于上述实施例提供的方案,可选地,上述步骤S14,确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度,可以包括以下步骤:
确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的余弦相似度。
其中,余弦相似度的计算公式(1)如下:
对于有n个因子的特征向量x和y,余弦相似度值cos(θ)为:
上述因子因子可以通过以下方式确定:通过公安立案数据及投诉数据,获取已知诈骗电话号码,计算相关指标(因子)的特征向量,指标(因子)包括但不限于:出入度比例、主叫总次数、被叫总次数、主叫离散度、被叫离散度、主叫总时长、被叫总时长、平均每次主叫的通话时长、平均每次被叫的通话时长等。
在确定了上述余弦相似度之后,在步骤S15中,在余弦相似度大于预设相似度时,可以根据多个第二号码相对应的多个社交圈号码列表之间的重合度,对第一号码进一步检测。
本申请实施例提供的方案通过计算第一号码的通话特征向量与已标注异常号码的通话特征向量的余弦相似度,能比对得到第一号码的通话行为特征与已标注异常号码的通话行为特征的相似度。进而在第一号码的通话行为特征与已标注异常号码的通话行为特征相接近的情况下,确定第一号码是异常电话号码,从而高效准确地对号码进行检测。
基于上述实施例提供的方案,可选地,参见图1b或图1c,所述社交关系图包括所述第一号码与所述多个第二号码的通话呼叫关系,如图2所示,上述步骤S13,根据所述社交关系图生成所述第一号码的通话特征向量,包括以下步骤:
S21:根据所述社交关系图确定所述第一号码主叫的第二号码的数量和所述第一号码被叫的第二号码的数量;
S22:将所述第一号码主叫的第二号码的数量与所述第一号码被叫的第二号码的数量确定为所述第一号码的出入度比例值;
S23:根据所述第一号码的出入度比例值确定所述第一号码的通话特征向量。
在本实施例中,所述社交关系图中所述第一号码与所述多个第二号码的通话呼叫关系如图1b或图1c中箭头所示,箭头示出的方向为通话拨打方向,箭头起始端为主叫号码,箭头末尾端为被叫号码。
下面以上述表1示出的第一号码的历史通话话单数据为例进行说明,上述出入度比例值及第一号码的出度与入度的比例值,其中,出度可以指第一号码主动呼出的对端号码的数量,入度可以指第一号码被动接听的对端号码的数量。主叫离散度可以指出度与出度总值的比值,其中,出度总值可以指第一号码主动呼出的通话次数。
其中,可以基于通话次数确定出入度比例值。结合图1b,出度是指节点A呼出方向连线的条数,出度总值是指节点A呼出方向连线的数值之和,即主叫总次数;入度是指节点A呼入方向连线的条数,入度总值是指节点A呼入方向连线的数值之和,即被叫总次数。在图1b中,本端号码A的出度为2,入度为2,出入度比例值为1。
或者,还可以基于通话时长确定出入度比例值。结合图1c,出度总值是指节点A呼出方向连线的数值之和,即主叫总时长。被叫离散度可以指入度与入度总值的比值,其中,入度总值可以指第一号码被动接听的通话次数,结合图1c,入度总值是指节点A呼入方向连线的数值之和,即被叫总时长。计算每个号码的出度总值除以出度,则为平均每次主叫的通话时长;计算每个号码的入度总值除以入度,则为平均每次被叫的通话时长。本端号码A对应的主叫总时长为D1+D2,被叫总时长为D3+D4+D5;平均每次主叫的通话时长为(D1+D2)/2,平均每次被叫的通话时长为(D3+D5+D4)/3。
随后,在步骤S23中,根据所述第一号码的出入度比例值确定所述第一号码的通话特征向量。出入度比例值可以表征出第一号码主动拨打电话和被动接听电话的情况。由于异常电话号码往往具有“广撒网”的特点,因此通过出入度比例值能高效确定第一号码与异常电话号码通话行为特征是否相似,进而高效判断第一号码是否是异常电话号码。
基于上述实施例提供的方案,可选地,所述社交关系图包括所述第一号码的通话参数,所述通话参数包括以下至少一项:
主叫离散度、被叫离散度、主叫通话总时长、被叫通话总时长、主叫平均通话时长、被叫平均通话时长;
其中,所述主叫离散度包括所述第一号码主叫的第二号码的数量与所述第一号码主叫通话次数的比值,所述被叫离散度包括所述第一号码被叫的第二号码的数量与所述第一号码被叫通话次数的比值;
其中,上述步骤S23,根据所述第一号码的出入度比例值确定所述第一号码的通话特征向量,如图3所示,包括以下步骤:
S31:根据所述第一号码的出入度比例值和所述通话参数生成所述第一号码的通话特征向量。
本申请实施例提供的方案中,基于第一号码的出入度比例值和通话参数生成第一号码的通话特征向量。得到的通话特征向量不仅能表征出第一号码的出入度比例值的特征,还能表达出上述通话参数特征,从多方面表达第一号码的通话行为特征能在随后比对相似度的步骤中,从多方面比对第一号码与已标注异常号码的相似度,全面判断第一号码的通话行为特征是否与已标注异常号码相似,进而提高异常电话号码判断的准确性。
基于上述实施例提供的方案,可选地,如图4所示,在所述相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定所述第一号码是否是异常电话号码,包括以下步骤:
S41:在所述相似度大于预设相似度时,根据所述历史通话数据获取第一预设时间内与所述第一号码进行通话的第二号码列表;
S42:获取所述第二号码列表中的每个第二号码的社交圈号码列表,所述第二号码的社交圈号码列表包括在第一预设时间内与至少一个第二号码进行通话的第三号码列表;
S43:根据所述第二号码列表中的每个第二号码的社交圈号码列表,确定所述第一预设时间内的第二号码社交圈重合率,其中,所述第二号码社交圈重合率为目标第三号码在不同的第二号码的社交圈号码列表出现的次数之和与每个第三号码在不同的社交圈号码列表出现的次数之和的比值,所述目标第三号码包括与多个第二号码进行通话的第三号码;
S44:根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码。
在所述相似度大于预设相似度时,可以根据第一号码在预设单位时长主叫的号码对第一号码做进一步检测,以提高异常电话号码的检测准确性。在本实施例中,第一预设时间例如可以是一天,该第一预设时间可以根据实际情况预先设定。
其中,在步骤S51中,可以获取第一号码历史N天内呼叫过的对端号码列表,并对号码进行去重,得到第二号码列表,例如可以通过以下形式展现上述第二号码列表:{日期1:[号码A1,号码B1,...,号码N1],日期2:[号码A2,号码B2,...,号码N2],...},应理解的是,还可以通过图表或其他形式展现上述信息。随后,遍历每天的对端号码去重列表,获取每个第二号码当天的通话话单,分别统计与该第二号码存在通话的社交圈号码列表;以某一日期为例,得到的社交圈号码列表如下表2所示:
表2社交圈号码列表样例
对端号码 | 社交圈号码列表 |
号码A | 号码a1,号码a2,...,号码ax |
号码B | 号码b1,号码b2,...,号码by |
... | ... |
号码N | 号码n1,号码n2,...,号码nz |
其中号码a1至号码ax为在第一预设时间内与至少一个第二号码进行通话的第三号码,即号码a1至号码ax为号码A在该日期的社交圈号码列表。
随后,遍历每个第二号码的社交圈号码列表,确定所有社交圈号码列表的并集,记为[号码1,号码2,...,号码n],并计算每个号码的出现次数,如表3所示:
表3社交圈号码出现次数统计样例
去重社交圈号码 | 号码1 | 号码2 | 号码3 | … | 号码n |
号码出现次数 | 1 | 1 | 2 | … | 3 |
其中,表3中去重社交圈号码行的各个号码为第三号码,将所有出现次数大于1次的号码记录为目标第三号码,并计算所有目标第三号码对应的不同社交圈出现次数之和。在表3样例中,假设仅号码3与号码n对应的号码出现次数大于1次,则所有目标第三号码对应的不同社交圈出现次数之和为2+3=5次。
随后,计算当天所有第二号码的社交圈重合率。其中,任一第二号码的当天社交圈重合率为目标第三号码在不同的第二号码的社交圈号码列表出现的次数之和与每个第三号码在不同的社交圈号码列表出现的次数之和的比值。
在表3中,分母全部号码对应的不同社交圈出现次数之和,为号码1至号码n对应的号码出现次数之和。分子重合号码对应的不同社交圈出现次数之和,为表3对应步骤中计算得到的次数之和。
随后,计算每天的对端号码社交圈重合率,求其历史N天内平均值,作为第一号码的多天的第二号码社交圈重合率。若该第二号码社交圈重合率小于预设重合率,则可以确定第一号码是异常电话号码。
通过本申请实施例提供的方案,结合一段时间内与第一号码进行通话的第二号码进一步对第一号码进行检测,有效提高异常电话号码检测准确性。
基于上述实施例提供的方案,可选地,如图5所示,根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码,包括以下步骤:
S51:在所述余弦相似度大于所述预设相似度时,获取所述第一号码的通话时间间隔列表,所述第一号码的通话时间间隔列表包括多个由所述第一号码发起的通话间隔时长,所述通话间隔时长包括所述第一号码结束第一通话的时刻与所述第一号码开始第二通话的时刻之间的时间长度,所述第一通话与所述第二通话相邻;
S52:根据所述第一号码的通话时间间隔列表确定所述第一号码的通话时间间隔参数,所述通话时间间隔参数包括以下至少一项:通话间隔时长平均值、通话间隔时长标准差;
S53:根据所述第一号码的通话时间间隔参数,确定所述第一号码是否是异常电话号码。
其中,在步骤S61中,在所述余弦相似度大于所述预设相似度时,统计第一电话号码历史N天中,平均每天所有通话之间的间隔分布情况。具体的,首先基于通话开始时间对通话记录进行排序,并按日期划分每天的通话话单记录。然后,遍历每天的n条通话记录,从第1条通话记录开始,依次记录当天第n-1次通话的结束时间与第n次通话的开始时间之间的时间差值(单位例如为秒),记录格式如:[通话时间间隔1,通话时间间隔2,...,通话时间间隔n-1]。随后,计算每天的通话时间间隔平均值及标准差。若存在多天通话,则通话时间间隔平均值与标准差等于多天该值的平均值。最后,将通话时间间隔平均值低于预设平均值且标准差低于预设标准差的本端号码确定为异常电话号码。
由于诈骗电话的通话间隔时间往往比较均匀,所以通过本实施例提供的方案,能基于通话间隔时间进一步对第一电话号码进行检测,提高检测异常电话号码的准确性。
基于上述实施例提供的方案,可选地,如图6所示,根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码,包括以下步骤:
S61:在所述第二号码的社交圈重合率小于预设重合率时,基于预设通话频次从所述多个第二号码中确定所述第一号码的常用联系人;
S62:根据所述常用联系人的数量与第二号码的数量的比值,确定所述第一号码是否是异常电话号码。
首先,统计历史N天内与本端号码存在通话的对端号码列表,并对号码进行去重,得到对端号码去重列表,格式如:[号码1,号码2,....,号码n]。然后,统计每个对端号码的通话天数,并将通话天数大于或等于3天的号码记录为本端号码对应的常用联系人。应理解的是,本实施例以3天为例进行说明,在实际应用中,还可以根据实际情况预先设置上述通话频次。接着,计算常用联系人个数占比。其中,常用联系人个数占比为常用联系人个数与对端号码去重列表号码总数的比值。最后,将常用联系人个数占比低于指定阈值的本端号码确定为异常电话号码。
通过本实施例提供的方案,能根据第一电话号码的常用联系人数量对第一电话号码实现进一步检测,提高检测异常电话号码的准确性。
基于上述实施例提供的方案,可选地,如图7所示,根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码,包括以下步骤:
S71:在所述第二号码的社交圈重合率小于预设重合率时,基于第二预设时间获取所述第一号码的多组号码归属地列表,所述号码归属地列表包括所述第一号码在第二预设时间内主叫的第二号码的归属地信息;
S72:根据所述第一号码的归属地信息,确定所述第一号码是否是异常电话号码。
其中,本实施例中所述的第二预设时间可以与上述实施例中所述的第一预设时间相同或不同,在本实施例中第二预设时间与第一预设时间相同。
在步骤S71中,在所述余弦相似度大于所述预设相似度时,统计第一号码历史N天的通话记录中,对端被叫手机号码不同归属地的日均值以及最大值。在本实施例中以手机为例进行说明,具体的,首先统计所有本端号码每天呼叫过的被叫号码,筛选出长度为11位且是数字1开头的手机号码,依据号码前7位判断归属地,得到当天对端号码归属地去重个数。然后,分析历史N天内每一天的对端号码归属地去重个数,计算出多天对端号码归属地去重个数的日均值及最大值。若日均值及最大值均大于指定阈值,则确定第一号码是异常电话号码。
通过本申请实施例提供的方案,基于被叫号码的归属地对第一号码进一步进行检测,有效提高检测异常号码的准确性。
本申请实施例提供的方案,通过对比本端号码与已知电话诈骗号码的通话社交行为相似性,以及分析对端号码之间通话社交圈重合比例,能在海量通话中检测出可疑号码。具有适用性广、易于实现、不受具体的诈骗场景限制的优点,能灵活检测出不同类型的诈骗电话,有效提升诈骗电话识别覆盖率。而且,本实施例提供的方案具有较高的安全性,在检测过程中仅分析通话行为特征,不涉及用户通话内容,无信息泄露的风险。
另外,图8示出了一种较优的异常电话号码检测方法,在本申请实施例上述步骤S11~S15的基础上,可以结合上述实施例提供的方案进行通话时间间隔分析S81、常用联系人分析S82以及对端号码归属地分析S83。其中,步骤S81可以通过上述实施例的S51~S53步骤实现,步骤S82可以通过上述实施例的S61~S62实现,步骤S83可以通过上述实施例的S71~S72实现。当然,也可以根据实际情况采用符合需求的方案来执行上述步骤。
需要说明的是,本申请实施例中上述通话时间间隔分析、常用联系人分析和对端号码归属地分析这三个步骤的顺序可以根据实际应用需求调换,例如先执行对短号码归属地分析,然后再执行常用联系人分析和通话时间间隔分析等,本实施例对此不做限定。
通过本申请实施例提供的方案,能根据通话时间间隔、常用联系人和对端号码归属地从多方面对第一号码进一步进行检测,提高检测异常电话号码的准确性。
为了解决现有技术中存在的上述问题,本申请实施例还提供一种电子设备90,如图9所示,包括:
获取模块91,获取第一号码的历史通话话单数据,所述历史通话数据包括所述第一号码与多个第二号码的通话记录;
第一生成模块92,根据所述历史通话话单数据生成所述第一号码与所述多个第二号码的社交关系图;
第二生成模块93,根据所述社交关系图生成所述第一号码的通话特征向量,所述通话特征向量用于表征所述第一号码的通话行为特征;
第一确定模块94,确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度;
第二确定模块95,在所述相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定所述第一号码是否是异常电话号码,其中,所述社交圈号码列表包括与所述第二号码进行通话的对端号码。
通过本实施例提供的电子设备,能根据通话特征向量能高效确定第一号码的通话行为是否与异常号码相似,进而判断第一号码是否是异常。判断过程中无需获取第一号码的通话内容,有效避免了通话内容泄露,提高了检测过程中的信息安全性。
可选地,所述社交关系图包括所述第一号码与所述多个第二号码的通话呼叫关系,上述第二生成模块93,用于:
根据所述社交关系图确定所述第一号码主叫的第二号码的数量和所述第一号码被叫的第二号码的数量;
将所述第一号码主叫的第二号码的数量与所述第一号码被叫的第二号码的数量确定为所述第一号码的出入度比例值;
根据所述第一号码的出入度比例值确定所述第一号码的通话特征向量。
可选地,所述社交关系图包括所述第一号码的通话参数,所述通话参数包括以下至少一项:
主叫离散度、被叫离散度、主叫通话总时长、被叫通话总时长、主叫平均通话时长、被叫平均通话时长;
其中,所述主叫离散度包括所述第一号码主叫的第二号码的数量与所述第一号码主叫通话次数的比值,所述被叫离散度包括所述第一号码被叫的第二号码的数量与所述第一号码被叫通话次数的比值;
其中,上述第二生成模块93,用于:
根据所述第一号码的出入度比例值和所述通话参数生成所述第一号码的通话特征向量。
可选地,第二确定模块95,用于:
在所述相似度大于预设相似度时,根据所述历史通话数据获取第一预设时间内与所述第一号码进行通话的第二号码列表;
获取所述第二号码列表中的每个第二号码的社交圈号码列表,所述第二号码的社交圈号码列表包括在第一预设时间内与至少一个第二号码进行通话的第三号码列表;
根据所述第二号码列表中的每个第二号码的社交圈号码列表,确定所述第一预设时间内的第二号码社交圈重合率,其中,所述第二号码社交圈重合率为目标第三号码在不同的第二号码的社交圈号码列表出现的次数之和与每个第三号码在不同的社交圈号码列表出现的次数之和的比值,所述目标第三号码包括与多个第二号码进行通话的第三号码;
根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码。
可选地,第二确定模块95,用于:
在所述第二号码的社交圈重合率小于预设重合率时,获取所述第一号码在第二预设时间内的通话时间间隔列表,所述第一号码的通话时间间隔列表包括多个由所述第一号码在所述第二预设时间内发起的通话间隔时长,所述通话间隔时长包括所述第一号码结束第一通话的时刻与所述第一号码开始第二通话的时刻之间的时间长度,所述第一通话与所述第二通话相邻;
根据所述第一号码在第二预设时间内的通话时间间隔列表确定所述第一号码的通话时间间隔参数,所述通话时间间隔参数包括以下至少一项:通话间隔时长平均值、通话间隔时长标准差;
根据所述第一号码的通话时间间隔参数,确定所述第一号码是否是异常电话号码。
可选地,第二确定模块95,用于:
在所述第二号码的社交圈重合率小于预设重合率时,基于预设通话频次从所述多个第二号码中确定所述第一号码的常用联系人;
根据所述常用联系人的数量与第二号码的数量的比值,确定所述第一号码是否是异常电话号码。
可选地,第二确定模块95,用于:
在所述第二号码的社交圈重合率小于预设重合率时,基于第二预设时间获取所述第一号码的多组号码归属地列表,所述号码归属地列表包括所述第一号码在第二预设时间内主叫的第二号码的归属地信息;
根据所述第一号码的归属地信息,确定所述第一号码是否是异常电话号码。
本申请实施例提供的方案,通过对比本端号码与已知电话诈骗号码的通话社交行为相似性,以及分析对端号码之间通话社交圈重合比例,能在海量通话中检测出可疑号码。具有适用性广、易于实现、不受具体的诈骗场景限制的优点,能灵活检测出不同类型的诈骗电话,有效提升诈骗电话识别覆盖率。而且,本实施例提供的方案具有较高的安全性,在检测过程中仅分析通话行为特征,不涉及用户通话内容,无信息泄露的风险。
可选地,本发明实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序,该计算机程序被处理器执行时实现上述一种异常电话号码检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述一种异常电话号码检测方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (10)
1.一种异常电话号码检测方法,其特征在于,包括:
获取第一号码的历史通话话单数据,所述历史通话话单数据包括所述第一号码与多个第二号码的通话记录;
根据所述历史通话话单数据生成所述第一号码与所述多个第二号码的社交关系图;
根据所述社交关系图生成所述第一号码的通话特征向量,所述通话特征向量用于表征所述第一号码的通话行为特征;
确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度;
在所述相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定所述第一号码是否是异常电话号码,其中,所述社交圈号码列表包括与所述第二号码进行通话的对端号码。
2.如权利要求1所述的方法,其特征在于,所述社交关系图包括所述第一号码与所述多个第二号码的通话呼叫关系,所述根据所述社交关系图生成所述第一号码的通话特征向量,包括:
根据所述社交关系图确定所述第一号码主叫的第二号码的数量和所述第一号码被叫的第二号码的数量;
将所述第一号码主叫的第二号码的数量与所述第一号码被叫的第二号码的数量确定为所述第一号码的出入度比例值;
根据所述第一号码的出入度比例值确定所述第一号码的通话特征向量。
3.如权利要求2所述的方法,其特征在于,所述社交关系图包括所述第一号码的通话参数,所述通话参数包括以下至少一项:
主叫离散度、被叫离散度、主叫通话总时长、被叫通话总时长、主叫平均通话时长、被叫平均通话时长;
其中,所述主叫离散度包括所述第一号码主叫的第二号码的数量与所述第一号码主叫通话次数的比值,所述被叫离散度包括所述第一号码被叫的第二号码的数量与所述第一号码被叫通话次数的比值;
其中,根据所述第一号码的出入度比例值确定所述第一号码的通话特征向量,包括:
根据所述第一号码的出入度比例值和所述通话参数生成所述第一号码的通话特征向量。
4.如权利要求1~3任一项所述的方法,其特征在于,在所述相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定所述第一号码是否是异常电话号码,包括:
在所述相似度大于预设相似度时,根据所述历史通话数据获取第一预设时间内与所述第一号码进行通话的第二号码列表;
获取所述第二号码列表中的每个第二号码的社交圈号码列表,所述第二号码的社交圈号码列表包括在第一预设时间内与至少一个第二号码进行通话的第三号码列表;
根据所述第二号码列表中的每个第二号码的社交圈号码列表,确定所述第一预设时间内的第二号码社交圈重合率,其中,所述第二号码社交圈重合率为目标第三号码在不同的第二号码的社交圈号码列表出现的次数之和与每个第三号码在不同的社交圈号码列表出现的次数之和的比值,所述目标第三号码包括与多个第二号码进行通话的第三号码;
根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码。
5.如权利要求4所述的方法,其特征在于,根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码,包括:
在所述第二号码的社交圈重合率小于预设重合率时,获取所述第一号码在第二预设时间内的通话时间间隔列表,所述第一号码的通话时间间隔列表包括多个由所述第一号码在所述第二预设时间内发起的通话间隔时长,所述通话间隔时长包括所述第一号码结束第一通话的时刻与所述第一号码开始第二通话的时刻之间的时间长度,所述第一通话与所述第二通话相邻;
根据所述第一号码在第二预设时间内的通话时间间隔列表确定所述第一号码的通话时间间隔参数,所述通话时间间隔参数包括以下至少一项:通话间隔时长平均值、通话间隔时长标准差;
根据所述第一号码的通话时间间隔参数,确定所述第一号码是否是异常电话号码。
6.如权利要求4所述的方法,其特征在于,根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码,包括:
在所述第二号码的社交圈重合率小于预设重合率时,基于预设通话频次从所述多个第二号码中确定所述第一号码的常用联系人;
根据所述常用联系人的数量与第二号码的数量的比值,确定所述第一号码是否是异常电话号码。
7.如权利要求4所述的方法,其特征在于,根据所述第二号码社交圈重合率与预设重合率的大小关系,确定所述第一号码是否是异常电话号码,包括:
在所述第二号码的社交圈重合率小于预设重合率时,基于第二预设时间获取所述第一号码的多组号码归属地列表,所述号码归属地列表包括所述第一号码在第二预设时间内主叫的第二号码的归属地信息;
根据所述第一号码的归属地信息,确定所述第一号码是否是异常电话号码。
8.一种电子设备,其特征在于,包括:
获取模块,获取第一号码的历史通话话单数据,所述历史通话话单数据包括所述第一号码与多个第二号码的通话记录;
第一生成模块,根据所述历史通话话单数据生成所述第一号码与所述多个第二号码的社交关系图;
第二生成模块,根据所述社交关系图生成所述第一号码的通话特征向量,所述通话特征向量用于表征所述第一号码的通话行为特征;
第一确定模块,确定所述第一号码的通话特征向量与已标注异常号码的通话特征向量的相似度;
第二确定模块,在所述相似度大于预设相似度时,根据与多个第二号码相对应的多个社交圈号码列表之间的重合度,确定所述第一号码是否是异常电话号码,其中,所述社交圈号码列表包括与所述第二号码进行通话的对端号码。
9.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010363135.XA CN113596260B (zh) | 2020-04-30 | 2020-04-30 | 异常电话号码检测方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010363135.XA CN113596260B (zh) | 2020-04-30 | 2020-04-30 | 异常电话号码检测方法和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113596260A CN113596260A (zh) | 2021-11-02 |
CN113596260B true CN113596260B (zh) | 2022-12-16 |
Family
ID=78237224
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010363135.XA Active CN113596260B (zh) | 2020-04-30 | 2020-04-30 | 异常电话号码检测方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113596260B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114979369A (zh) * | 2022-04-14 | 2022-08-30 | 马上消费金融股份有限公司 | 异常通话检测方法、装置、电子设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107220316A (zh) * | 2017-05-17 | 2017-09-29 | 华为机器有限公司 | 一种通信数据分析方法及装置 |
CN107306306A (zh) * | 2016-04-25 | 2017-10-31 | 腾讯科技(深圳)有限公司 | 通信号码处理方法及装置 |
CN109698884A (zh) * | 2017-10-24 | 2019-04-30 | 中国电信股份有限公司 | 诈骗电话识别方法和系统 |
CN110213448A (zh) * | 2018-09-13 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 恶意号码识别方法、装置、存储介质和计算机设备 |
-
2020
- 2020-04-30 CN CN202010363135.XA patent/CN113596260B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107306306A (zh) * | 2016-04-25 | 2017-10-31 | 腾讯科技(深圳)有限公司 | 通信号码处理方法及装置 |
CN107220316A (zh) * | 2017-05-17 | 2017-09-29 | 华为机器有限公司 | 一种通信数据分析方法及装置 |
CN109698884A (zh) * | 2017-10-24 | 2019-04-30 | 中国电信股份有限公司 | 诈骗电话识别方法和系统 |
CN110213448A (zh) * | 2018-09-13 | 2019-09-06 | 腾讯科技(深圳)有限公司 | 恶意号码识别方法、装置、存储介质和计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CN113596260A (zh) | 2021-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11695869B2 (en) | System and method for identifying and handling unwanted callers using a call answering system | |
CN110995937B (zh) | 一种被骚扰用户的识别方法及装置 | |
CN108810290B (zh) | 一种诈骗电话的识别的方法及系统 | |
CN107092651B (zh) | 一种基于通信网络数据分析的关键人物挖掘方法及系统 | |
CN111131627B (zh) | 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质 | |
CN113596260B (zh) | 异常电话号码检测方法和电子设备 | |
CN110113748B (zh) | 骚扰电话监控方法、装置 | |
CN110167030B (zh) | 识别骚扰电话的方法、装置、电子设备和存储介质 | |
CN112351429B (zh) | 基于深度学习的有害信息检测方法及系统 | |
CN112307075B (zh) | 用户关系识别方法及装置 | |
CN114205462A (zh) | 一种诈骗电话识别方法、装置、系统及计算机存储介质 | |
CN111756910A (zh) | 来电免打扰方法、系统、计算机设备及存储介质 | |
EP3685570B1 (en) | System and method for identifying unwanted communications using communication fingerprinting | |
CN110830664B (zh) | 识别电信诈骗潜在受害用户的方法和装置 | |
CN106375583B (zh) | 一种移动终端的智能来电屏蔽方法及其装置 | |
CN112788016B (zh) | 一种非法用户识别方法、装置、电子设备及存储介质 | |
CN111131626B (zh) | 基于流数据图谱的群组有害呼叫检测方法、装置及可读介质 | |
CN113766069B (zh) | 骚扰电话拦截方法及装置 | |
CN116346984A (zh) | 诈骗预警方法、装置、电子设备和计算机可读介质 | |
CN116847025A (zh) | 一种策反呼叫识别方法、装置及计算机可读存储介质 | |
EP4203448A1 (en) | Systems and methods for use in blocking of robocall and scam call phone numbers | |
Lin et al. | Governance framework for voice spam detection and interception of telecom network | |
CN115277916A (zh) | 主呼号码拦截方法、装置、电子设备及存储介质 | |
CN115733924A (zh) | 一种呼叫中心电话拦截数据识别系统 | |
CN113890941A (zh) | 一种识别非法号码的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |