CN106686192B - 仿冒号码识别方法及装置 - Google Patents

仿冒号码识别方法及装置 Download PDF

Info

Publication number
CN106686192B
CN106686192B CN201510758079.9A CN201510758079A CN106686192B CN 106686192 B CN106686192 B CN 106686192B CN 201510758079 A CN201510758079 A CN 201510758079A CN 106686192 B CN106686192 B CN 106686192B
Authority
CN
China
Prior art keywords
identified
counterfeit
determining
similarity
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510758079.9A
Other languages
English (en)
Other versions
CN106686192A (zh
Inventor
张滨
赵刚
袁捷
冯运波
刘利军
廖奇
王馨裕
李斌
于乐
招斯喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201510758079.9A priority Critical patent/CN106686192B/zh
Publication of CN106686192A publication Critical patent/CN106686192A/zh
Application granted granted Critical
Publication of CN106686192B publication Critical patent/CN106686192B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种仿冒号码识别方法及装置,所述方法包括:按照预设策略提取待识别号码的号码属性;基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度;基于所述相似度,确定所述待识别号码是否为仿冒号码。

Description

仿冒号码识别方法及装置
技术领域
本发明涉及信息技术领域,尤其涉及一种仿冒号码识别方法及装置。
背景技术
随着通信技术的普及,电话和手机等广泛运用,很多不法分子进行电话诈骗或电话骚扰。这些诈骗电话或骚扰电话通常会仿冒一些特殊号码,例如移动客户电话10086,公众服务号码,例如有证、银行、火警、急救或匪警等公众号码,以提高诈骗和骚扰的成功率。
在现有技术中通常采用将待识别号码与特殊号码进行逐位匹配,精确的确定出哪些是仿造或冒充特殊号码的疑似号码。
然而依然还是存在这样的问题,不发分子在仿造号码是,可能会在号码中间段或后端加入特殊号码,也可以在特殊号码中增加或删除个别数字,以冒充客户人员拨打诈骗电话。以下以中国移动的客户号码10086为例,可能存在以下几种虚拟改好方式(x和y代表0-9的任意整数):
1 00xxx10086yyy
2 001xxx0086
3 0010086xxx
然而上述号码在现有技术中是无法被准确被识别出来的;且在现有技术中要求将待识别号码末端数字与每个特殊号码进行精确比对,而现网特殊号码长度为3-11位不等,随着特殊号码的增加,这种逐一比对的方式识别效率低,提示或拦截时延大。
发明内容
有鉴于此,本发明实施例期望提供一种仿冒号码识别方法及装置,以至少部分解决仿冒号码识别效率低的问题。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例第一方面提供一种仿冒号码识别方法,所述方法包括:
按照预设策略提取待识别号码的号码属性;
基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度;
基于所述相似度,确定所述待识别号码是否为仿冒号码。
基于上述方案,所述按照预设策略提取待识别号码的号码属性,包括以下至少其中之一:
确定所述待识别号码的唯一值数;其中,所述唯一值数为通信号码包括不重复数字的个数;
确定所述待识别号码的稳定排序;其中,所述稳定排序为待识别号码中各数字首次出现的排序;
确定所述待识别号码的号码长度;所述号码长度为通信号码包括的数字位数。
基于上述方案,所述基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度,包括:
查询索引树;所述索引树为依据所述特殊号码的号码属性建立的数据结构;所述索引树的第一层分支节点由所述特殊号码的唯一值数构成;所述索引树的第二层分支节点由所述特殊号码的稳定排序构成;所述索引树的叶子节点为所述特殊号码;
按照预设函数关系,计算所述待识别号码的唯一值数与所述第一层分支节点的相似值;
所述基于所述相似度,确定所述待识别号码是否为仿冒号码,包括:
判定是否有至少一个所述相似值位于第一阈值范围内;
若没有一个所述相似值位于所述第一阈值范围内,则确定所述待识别号码不是仿冒号码。
基于上述方案,所述基于所述相似度,确定所述待识别号码是否为仿冒号码,还包括:
若所述待识别号码至少有一个所述相似值位于所述第一阈值范围内,则查询位于所述第一阈值范围内的所述相似值对应的第一层分支节点下的第二层分支节点;
将所述待识别号码的稳定排序,与所述待识别号码所在的第一层分支下的第二层分支节点进行比对,形成比对结果;
结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码。
基于上述方案,所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值位于第二阈值范围内,则确定所述待识别号码为仿冒号码。
基于上述方案,所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值不在所述第二阈值范围内,则将所述待识别号码与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点进行匹配;
若所述待识别号码与所述叶子节点匹配成功,则确定所述待识别号码不是仿冒号码。
基于上述方案,所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述待识别号码与所述叶子节点匹配不成功,则将所述待识别号码的号码长度与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点的号码长度进行比较,形成比较结果;
若所述比较结果表明所述待识别号码的号码长度与所述叶子节点的号码长度的差值在差值阈值范围内,则确定所述待识别号码为仿冒号码。
基于上述方案,所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述比对结果表明没有所述第二层分支节点是所述待识别号码的稳定排序的子集,则确定所述待识别号码不是仿冒号码。
本发明实施例第二方面提供一种仿冒号码识别装置,所述装置包括:
提取单元,用于按照预设策略提取待识别号码的号码属性;
计算单元,用于基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度;
确定单元,用于基于所述相似度,确定所述待识别号码是否为仿冒号码。
基于上述方案,所述提取单元,具体用于确定所述待识别号码的唯一值数;其中,所述唯一值数为通信号码包括不重复数字的个数;和/或,确定所述待识别号码的稳定排序;其中,所述稳定排序为通信号码中各数字首次出现的排序;和/或,确定所述待识别号码的号码长度;所述号码长度为通信号码包括的数字位数。
基于上述方案,所述计算单元,包括:
查询模块,用于查询索引树;所述索引树为依据所述特殊号码的号码属性建立的数据结构;所述索引树的第一层分支节点由所述特殊号码的唯一值数构成;所述索引树的第二层分支节点由所述特殊号码的稳定排序构成;所述索引树的叶子节点为所述特殊号码;
计算模块,用于按照预设函数关系,计算所述待识别号码的唯一值数与所述第一层分支节点的相似值;
所述确定单元,包括:
判定模块,用于判定是否有至少一个所述相似值位于第一阈值范围内;
确定模块,用于若没有一个所述相似值位于所述第一阈值范围内,则确定所述待识别号码不是仿冒号码。
基于上述方案,所述查询模块,还用于若所述待识别号码至少有一个所述相似值位于所述第一阈值范围内,则查询位于所述第一阈值范围内的所述相似值对应的第一层分支节点下的第二层分支节点;
所述确定单元,还包括:
比对模块,用于将所述待识别号码的稳定排序,与所述待识别号码所在的第一层分支下的第二层分支节点进行比对,形成比对结果;
所述确定模块,还用于结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码。
基于上述方案,所述确定模块,还用于若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值位于第二阈值范围内,则确定所述待识别号码为仿冒号码。
基于上述方案,所述查询模块,还用于若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值不在所述第二阈值范围内,则将所述待识别号码与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点进行匹配;
所述确定模块,还用于若所述待识别号码与所述叶子节点匹配成功,则确定所述待识别号码不是仿冒号码。
基于上述方案,所述确定单元,还包括:
比较模块,用于若所述待识别号码与所述叶子节点匹配不成功,则将所述待识别号码的号码长度与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点的号码长度进行比较,形成比较结果;
所述确定模块,具体用于若所述比较结果表明所述待识别号码的号码长度与所述叶子节点的号码长度的差值在差值阈值范围内,则确定所述待识别号码为仿冒号码。
基于上述方案,所述确定模块,还用于若所述比对结果表明没有所述第二层分支节点是所述待识别号码的稳定排序的子集,则确定所述待识别号码不是仿冒号码。
本发明实施例所述的仿冒号码识别方法及装置,将提取待识别号码的号码属性;根据号码属性与特殊号码属性之间的相似度来确定所述待识别号码是否为仿冒号码;不用将所述待识别号码与特殊号码进行逐一逐位的比对,大大的提升了识别效率;这样完成识别后,能够尽快的执行通信拦截和或仿冒提醒,减少非仿冒号码因逐一逐位比对导致的呼叫延时大等现象。
附图说明
图1为本实施例提供的第一种仿冒号码识别方法的流程示意图
图2为本发明实施例提供的一种索引树的结构示意图;
图3为本发明实施例提供的第二种仿冒号码识别方法的流程示意图;
图4为本发明实施例提供的一种仿冒号码识别装置的结构示意图。
具体实施方式
以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。
实施例一:
如图1所示,本实施例提供一种仿冒号码识别方法,所述方法包括:
步骤S110:按照预设策略提取待识别号码的号码属性;
步骤S120:基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度;
步骤S130:基于所述相似度,确定所述待识别号码是否为仿冒号码。
本实施例所述的方法为识别仿冒号码的方法,通过将仿冒号码识别出来,减少电话诈骗和电话骚扰等。
在步骤S110中按照预设策略提取待识别号码的号码属性,这里的号码属性可包括号码长度、号码包括的数字个数等信息。这里的待识别号码可为主叫号码或发送短消息的号码。
在本实施例中所述的待识别号码或特殊号码一般均指的由数字形成的具有通信标识作用的数字串。例如,移动的客户号码10086。
所述步骤S110具体可包括以下的至少其中之一:
确定所述待识别号码的唯一值数;其中,所述唯一值数为通信号码包括不重复数字的个数。例如,10086包括数字长度为5,但是仅涉及了4个数字,且这4个数字为1、0、8和6。
确定所述待识别号码的稳定排序;其中,所述稳定排序为待识别号码中各数字首次出现的排序;这里的稳定排序可为数字串按照一定排序方向的排序,该一定排序方向可为从左至右,也可以从右至左。如图2中,特殊号码95533和95333的稳定排序为953。再比如假设通信号码为101045,则其稳定排序包括1045。确定所述待识别号码的号码长度;所述号码长度为通信号码包括的数字位数。例如,特殊号码10086的号码长度即为4。
在步骤S120中会将所述待识别号码的号码属性与特殊号码的号码属性进行比对计算,得到待识别号码与特殊号码之间的相似度。在步骤S130中根据该相似度来确定当前的待识别号码是否仿冒号码。本实施例所述的仿冒号码识别方法,相对于现有技术中,将待识别号码与海量的特殊号码进行逐一逐位的匹配,大大的提升了仿冒号码的识别效率,可以快速的筛选出并非仿冒号码的待识别号码,避免提示的通讯延时。
所述步骤S120可包括:
查询索引树;所述索引树为依据所述特殊号码的号码属性建立的数据结构;所述索引树的第一层分支节点由所述特殊号码的唯一值数构成;所述索引树的第二层分支节点由所述特殊号码的稳定排序构成;所述索引树的叶子节点为所述特殊号码;
按照预设函数关系,计算所述待识别号码的唯一值数与所述第一层分支节点的相似值;
所述步骤S130可包括:
判定是否有至少一个所述相似值位于第一阈值范围内;
若没有一个所述相似值位于所述第一阈值范围内,则确定所述待识别号码不是仿冒号码。
图2所示的为一个所述索引树,该索引树包括根节点,该根节点可为空节点或预留节点。图2所示的索引树包括三层,第一层分支节点为特殊号码的唯一值数;第二层分支节点的稳定排序;第三层分支节点为叶子节点,为特殊号码本身。在图2中所述第二层分支节点有4个节点,且这些节点的值为2、3、4及5。在具体的数字串构成的通信号码中,一般由0到9这10个阿拉伯数字构成。这样的话,所述第二层分支节点最多有9个,且目前唯一值数为1的号码都是保留号码,所以通常所述第二层分支节点一般不超过5个。
在本实施例中所述预设函数关系可为W=(待识别号码的唯一值数/X)*100%。这里的X为所述第一层分支节点的值,例如,图2中的2、3、4及5。所述W即为所述相似值,W的取值表征了所述待识别号码与对应的第一层分支节点所在分支节点中特殊号码的相似性。例如,当前待识别号码为95584。通过步骤S110可知,95584的唯一值数为4,将95584的唯一值数分别与图2中第一层分支节点一起,按照预设函数关系进行相似值的计算。
所述第一阈值范围可为系统预先存储的值,通常可为根据经验判断得到的值。例如,在本实施例中,若所述W的取值超过200%,表示待识别号码有一半以上的数字与对应第一层分支节点下的叶子节点不同,则冒充特殊号码的可能性较小。当然若W小于100%,也表示待识别号码中的数字与第一层分支节点下的叶子节点有很大的不同,仿冒的可能性也比较小。故在本实施例中所述第一阈值范围可为[100%,200]。即表示100%<=W<=200%时,表示相似度位于所述第一阈值范围内。
在步骤S130中判断出所述待识别号码的唯一数值与索引树中各个第一层分支节点的相似度都不再所述第一阈值范围内,则可认为待识别号码仿冒所述特殊号码的可能很小,排除所述待识别号码是仿冒号码的可能。显然在本实施例中可以通过简便的几个计算,就能很快的排除大部分非仿冒号码,大大的提升了判断待识别号码是否为仿冒号码的速率。
作为本实施例的进一步改进,所述步骤S130还包括:
若所述待识别号码至少有一个所述相似值位于所述第一阈值范围内,则查询位于所述第一阈值范围内的所述相似值对应的第一层分支节点下的第二层分支节点;
将所述待识别号码的稳定排序,与所述待识别号码所在的第一层分支下的第二层分支节点进行比对,形成比对结果;
结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码。
例如,前述例子中的95584,在当X=3时,所述W=4/3*100%,W的取值大于100%,且小于200%是位于前述的第一阈值范围内。这个时候,查询索引树中值为3的第一层分支节点下的第二层分支节点。图2中,在取值为3的第一层分支节点下的第二层分支节点有3个,取值依次为950、953及958。这个时候,将所述95584的稳定排序与第二分层分支节点进行比对。9584的稳定排序为9584。将9584分别和950、953及958进行比对,发现958是9584的子集,表明95584仿冒有稳定排序为958的特殊号码的可能性比较大,需要进一步判断。若所述比对结果表明在该第二层分支节点中,没有一个第二层分支节点能够与所述待识别号码的稳定排序匹配,这个时候可认为该待识别号码为仿冒号码的可能性很小,在本实施例中可视为该待识别号码不是仿冒号码。
进一步地,所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值位于第二阈值范围内,则确定所述待识别号码为仿冒号码。
所述相似值为前述步骤中计算出的W。这里的所述第二阈值范围可为前述第一阈值范围下的一个子区间,例如(100%,125%],即表示100%<W<=125%时,表示相似度位于所述第二阈值范围内。这个时候可能表示,当前的待识别号码与特殊号码可能仅1到2个数字的不同,导致用户混淆的可能性非常大,可认为有很大的嫌疑是伪冒号码。故在本实施例中若至少有一个第二层分支节点是待识别号码的稳定排序的子集,且W位于上述第二阈值范围内,则确定该待识别号码为仿冒号码。
当然,若所述W不在所述第二阈值范围内,则需要进一步确定。故在本实施例中,所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,还包括:
若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值不在所述第二阈值范围内,则将所述待识别号码与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点进行匹配;
若所述待识别号码与所述叶子节点匹配成功,则确定所述待识别号码不是仿冒号码。
例如,所述第一阈值范围为100%<=W<=200%,第二阈值范围为100%<W<=125%;若位于第一阈值范围内的相似度不在所述(100%,125%],则表示所述待识别号码与其所在第一层分支节点计算得到的W的取值可为100%及125%<W<=200%。
这个时候为了精确判断所述待识别号码是不是特殊号码或是特殊号码的方面号码,会将所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点进行匹配。例如所述95584的稳定排序包括索引树中取值为958的第二层分支节点。取值958的第二层分支节点为所述95584的子集,这个时候95584所在的第二层分支节点即为所述958。将所述95584与取值为958的第二层分支节点下的叶子节点进行匹配。以图2为例,则将95584分别与95558、95588及95888进行匹配,若95584与上述其中一个特殊号码完全匹配,显然当前的待识别号码就是特殊号码,不是仿冒号码。
但是95584并非上述任意一个特殊号码,但是这个时候还是不能判断是否为仿冒号码,需要进一步判断;故所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述待识别号码与所述叶子节点匹配不成功,则将所述待识别号码的号码长度与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点的号码长度进行比较,形成比较结果;
若所述比较结果表明所述待识别号码的号码长度与所述叶子节点的号码长度的差值在差值阈值范围内,则确定所述待识别号码为仿冒号码。
若待识别号码与特殊号码不同,但是非常相似,且待识别号码的号码长度与特殊号码的号码长度也很相近,这个时候就有可能是处于混淆用户试听的仿冒号码,故在本实施例中所述方法还包括将待识别号码与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点的号码长度进行比较,形成比较结果。例如将95584的号码长度与取值为958的第二层分支节点下的叶子节点进行比较。取值958的第二层分支节点下的叶子节点的号码长度为5,95584的号码长度也为5。采用公式N=│Ln-Lc│;所述│Ln-Lc│表示对Ln-Lc的差取绝对值。例如,若所述N小于或等于5,则可认为所述待识别号码是仿冒号码的可能性非常大,在本实施例中可将所述待识别号码视为所述仿冒号码。若所述N大于所述5,即所述差值位于差值阈值范围外,在本实施例中会认为所述待识别号码不是所述仿冒号码。在本例中将所述差值阈值范围假定为了小于或等于5。
此外,当然所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:若所述比对结果表明没有所述第二层分支节点是所述待识别号码的稳定排序的子集,则确定所述待识别号码不是仿冒号码。由于待识别号码的稳定排序并非当前数据库中记录的任意一个特殊号码的稳定排序相同,造成用户混淆的可能性较小,那么主叫方仿冒的可能性也较小,就能快速的排除是仿冒号码的可能性。
在执行所述步骤S110之前,本实施例所述的方法,当然还可以包括预先构建所述索引树;接收特殊号码的输入和等级;在通过提取所述特殊号码的号码属性,构建出所述索引树。索引树的构建方便后续快速的确定各个待识别号码是否为仿冒号码,减少仿冒号码拨打的电话或短信造成的诈骗结果的验证程度。在本实施例中若确定出对应的待识别号码为仿冒号码时,可以通过向被叫发送提示信息或提示语音来提示用户进行警惕。
以下结合上述实施例的任意技术方案,提供两个具体示例。
示例一:
第一阶段:定义通信号码属性、构建特殊号码基准库对应的索引树和仿冒判定共三个步骤组成。
定义通信号码属性
首先,对每个通信号码定义如下号码属性:
唯一值数 唯一数字数目
稳定排序 唯一数字自左至右排序数字串
号码长度 号码总数字数
对任意一串数字编码,根据以上号码属性可形成如下数据结构:
以10086为例:10086的唯一值数:1086;10086的稳定排序:1086;10086的号码长度:5。
第二阶段:构建索引树
基于运营商黄页记录的公众特殊号码(包括但不限于邮政、银行、税务、医保等公共服务类特殊号码,以及匪警、火警、急救等公共事业特殊号码),针对每个公众特殊号码生成号码属性,构建索引树。
索引树分三层结构,第一层由唯一值数构成第一层分支节点,第二层由稳定排序构成第二层分支节点,第三层为对应的特殊号码集合构成叶子节点。
仿冒号码的判定流程:
(1)计算待识别号码的号码属性,依次得出该待识别号码的唯一值数、稳定排序和号码长度。
(2)计算相似度,进行进入第一层分支节点的准入判断。
相似值计算公式为W=[当前待识别号码唯一值数/X]*100%,X为索引树第一层分支节点的取值。W表示待识别号码与特殊号码的相似值,如果W超过200%,则说明待识别号码中有一半以上的唯一值与特殊号码不同,则待识别号码冒充特殊号码的可能性相对较低。因此,在本示例中选择W为200%作为判断阈值。
当100%<W<=200%时X为选定分支,可进入下一步判定;
当W<=100%时,则进行下一步分支判定,直至所有分支计算结束;
若W>200%,则X值递增,进行下一分支判定,直至所有分支计算结束。
若待识别号码的唯一值数与所有第一层分支节点的相似值W都在小于等于100%或大于200%,则可以终止判断流程,确定该待识别号码不是仿冒号码。
(3)进行进入第二层分支节点的准入判断
将待识别号码的稳定排序与满足条件的第二层分支的所有分支节点逐一比对;若后者为前者的子集,且100%<W<=125%,仿冒度高,则将当前待识别号码判定为疑似诈骗号码。
若后者为前者子集,且125%<W<=200%,则进入下一步后续判定。
若所有满足条件的可选分支均比对失败,则说明待识别号码不在疑似特服类诈骗号码范围内,将退出判定流程。
(4)
将当前选定分支节点对应叶子节点中号码逐一提取并进行比对。
计算公式N=Lc-Ln,其中Lc为当前待识别号码属性号码长度值,Ln为当前叶子节点号码属性号码长度值。若N<5,则退出判定流程,将当前待识别号码判定为疑似诈骗号码
若N>=5,则继续下一轮判定。
示例二:
如图3所示,本示例提供一种仿冒号码识别方法,包括:
步骤S1:提取待识别号码;
步骤S2:判断所述待识别号码为仿冒号码,若是,进入步骤S14;若否,进入步骤S3。
步骤S3:判断所述待识别号码是否为疑似仿冒号码,若是进入步骤S15;若否进入步骤S4。
步骤S4:提取待识别号码的号码属性。
步骤S5:查询索引树的第一层分支节点。
步骤S6:判断待识别号码与所有第一层分支节点之间的判定是否完成,若是进入步骤S16,若否进入步骤S7。
步骤S7:计算待识别号码的唯一值数与第一层分支节点之间的相似度W,判断该相似度是否W>200%,若否返回步骤S5,若时进入步骤S8。
步骤S8:查询待识别号码所在的第一层分支节点下的第二层分支节点。
步骤S9:将待识别号码的稳定排序与第二层分支节点进行比对,判断待识别号码的稳定排序是否包括第二层分支节点,若否,进入步骤S17;若是进入步骤S9。
步骤S10:判断W是否小于120%,若是进入步骤S13,若否进入步骤S11。
步骤S11:进入待识别号码所在第二层节点下的叶子节点,将待识别号码的号码长度与叶子节点的号码长度做差值运算,得到差值N。
步骤S12:判断N是否大于5,若是,进入步骤S13,若否返回步骤S10。
步骤S13,判定为疑似仿冒号码。
步骤S14:仿冒号码拦截处理。
步骤S15:更新号码呼叫记录信息。
步骤S16:确定所述待识别号码不是仿冒号码。
步骤S17:确定所述待识别号码不是当前分支节点下的叶子节点的仿冒号码。值得注意的是:当然在本实施例中还可确定是疑似仿冒号码之前,还包括将待识别号码与其所在分支节点中的叶子节点的匹配确定是否为特殊号码本身。
实施例二:
如图4所示,本实施例提供一种仿冒号码识别装置,所述装置包括:
提取单元110,用于按照预设策略提取待识别号码的号码属性;
计算单元120,用于基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度;
确定单元130,用于基于所述相似度,确定所述待识别号码是否为仿冒号码。
本实施例所述的仿冒号码识别装置,可为运行通信系统的网络侧的任意一个网元,例如基站、例如移动管理实体MME等设备。
所述提取单元110和所述确定单元130对应的硬件结构可为处理器或处理电路。所述处理器可包括应用处理器、数字信号处理器、中央处理器、微处理器、可编程阵列等;所述处理电路可包括专用集成电路。所述提取单元110和确定单元130可以集成对应一个处理器或处理电路,也可以分别对应不同的处理器或处理电路。
所述计算单元120的具体结构可对应于计算器或计算电路或具有计算功能的处理器。
本实施例所述的装置,不再采用现有的逐一匹配的形式来确定是否为仿冒号码,大大的提升了判定速度,也提升了判断精确度;可以精确的判断出有些主叫号码或通信号码通过在特殊号码的尾部添加几位数字的仿冒号码。
进一步的,所述提取单元110,具体用于确定所述待识别号码的唯一值数;其中,所述唯一值数为通信号码包括不重复数字的个数;和/或,确定所述待识别号码的稳定排序;其中,所述稳定排序为通信号码中各数字首次出现的排序;和/或,确定所述待识别号码的号码长度;所述号码长度为通信号码包括的数字位数。这里的唯一值数可为待识别号码包括的不重叠数字的个数。这里的稳定排序和所述号码长度及唯一值数的描述可参见实施例一,在此就不重复了。
在本实施例中所述提取单元110可仅提取唯一值数和稳定排序,也可以唯一值数、稳定排序及号码长度都提取。
进一步地,所述计算单元120,包括:
查询模块,用于查询索引树;所述索引树为依据所述特殊号码的号码属性建立的数据结构;所述索引树的第一层分支节点由所述特殊号码的唯一值数构成;所述索引树的第二层分支节点由所述特殊号码的稳定排序构成;所述索引树的叶子节点为所述特殊号码;
计算模块,用于按照预设函数关系,计算所述待识别号码的唯一值数与所述第一层分支节点的相似值;
所述确定单元130,包括:
判定模块,用于判定是否有至少一个所述相似值位于第一阈值范围内;
确定模块,用于若没有一个所述相似值位于所述第一阈值范围内,则确定所述待识别号码不是仿冒号码。
所述查询模块可对应于具有信息读取的处理器或处理电路。所述计算模块可对应于计算器或具有计算功能的处理器或处理电路。
所述判定模块可包括比较器或比较电路或具有比较功能的处理器。所述确定模块可对应于处理器或处理电路。
在本实施例中为了进一步确定所述待识别号码是否为仿冒号码,所述查询模块,还用于若所述待识别号码至少有一个所述相似值位于所述第一阈值范围内,则查询位于所述第一阈值范围内的所述相似值对应的第一层分支节点下的第二层分支节点。这里的查询模块复用查询所述第一层分支节点。
所述确定单元130,还包括:
比对模块,用于将所述待识别号码的稳定排序,与所述待识别号码所在的第一层分支下的第二层分支节点进行比对,形成比对结果;
所述确定模块,还用于结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码。
在本实施例中所述比对模块可包括比较器或比较电路或具有比较功能的处理器等结构。所述确定模块将还将具体用于将相似值和比对结果来确定待识别号码是否为仿冒号码。这里的比对结果也表征了所述待识别号码与特殊号码的相似性,也可以体现为前述的相似度。
此外,所述确定模块,还用于若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值位于第二阈值范围内,则确定所述待识别号码为仿冒号码。
在这里的通过将待识别号码的稳定排序与索引树中的第二层分支节点的比对,可以快速的排除与特殊号码相似度小的通信号码为仿冒号码的可能性,再次提高了识别速率。
进一步地,所述查询模块,还用于若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值不在所述第二阈值范围内,则将所述待识别号码与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点进行匹配。此处,所述查询模块还被复用于查询所述第二层分支节点下的叶子节点,这里所述确定模块,还用于若所述待识别号码与所述叶子节点匹配成功,则确定所述待识别号码不是仿冒号码。这样的话,可以通过将待识别号码与少量特殊号码的匹配,快速的确定出所述待识别号码是否为特殊号码的仿冒号码。
所述确定单元,还包括:
比较模块,用于若所述待识别号码与所述叶子节点匹配不成功,则将所述待识别号码的号码长度与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点的号码长度进行比较,形成比较结果;
所述确定模块,具体用于若所述比较结果表明所述待识别号码的号码长度与所述叶子节点的号码长度的差值在差值阈值范围内,则确定所述待识别号码为仿冒号码。此处,所述确定模块还将根据待识别号码的号码长度及叶子节点的号码长度来判断待识别号码是否为仿冒号码,避免有一些不法分子在特殊号码后端加上一两位形成的仿冒号码,提升了仿冒号码的识别成功率。
此外,所述确定模块,还用于若所述比对结果表明没有所述第二层分支节点是所述待识别号码的稳定排序的子集,则确定所述待识别号码不是仿冒号码。若一个待识别号码的稳定排序与第二层分支节点都不匹配,导致用户混淆的可能性小,仿冒的可能性也小,故在本实施例中将不认为是所述仿冒号码。
总之,本实施例所述的仿冒号码识别装置,能够用于实现实施例一中所述的仿冒号码识别方法,同样的具有识别效率高、识别操作少及识别结果精确等特点。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (16)

1.一种仿冒号码识别方法,其特征在于,所述方法包括:
按照预设策略提取待识别号码的号码属性;
基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度;
基于所述相似度,确定所述待识别号码是否为仿冒号码;
其中,所述基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度,包括:
查询索引树;所述索引树为依据所述特殊号码的号码属性建立的数据结构;所述索引树的第一层分支节点由所述特殊号码的唯一值数构成;所述索引树的第二层分支节点由所述特殊号码的稳定排序构成;所述索引树的叶子节点为所述特殊号码;所述唯一值数为通信号码包括不重复数字的个数;所述稳定排序为各数字首次出现的排序;
按照预设函数关系,计算所述待识别号码的唯一值数与所述第一层分支节点的相似值。
2.根据权利要求1所述的方法,其特征在于,
所述按照预设策略提取待识别号码的号码属性,包括以下至少其中之一:
确定所述待识别号码的唯一值数;其中,所述唯一值数为通信号码包括不重复数字的个数;
确定所述待识别号码的稳定排序;其中,所述稳定排序为待识别号码中各数字首次出现的排序;
确定所述待识别号码的号码长度;所述号码长度为通信号码包括的数字位数。
3.根据权利要求2所述的方法,其特征在于,
所述基于所述相似度,确定所述待识别号码是否为仿冒号码,包括:
判定是否有至少一个所述相似值位于第一阈值范围内;
若没有一个所述相似值位于所述第一阈值范围内,则确定所述待识别号码不是仿冒号码。
4.根据权利要求3所述的方法,其特征在于,
所述基于所述相似度,确定所述待识别号码是否为仿冒号码,还包括:
若所述待识别号码至少有一个所述相似值位于所述第一阈值范围内,则查询位于所述第一阈值范围内的所述相似值对应的第一层分支节点下的第二层分支节点;
将所述待识别号码的稳定排序,与所述待识别号码所在的第一层分支下的第二层分支节点进行比对,形成比对结果;
结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码。
5.根据权利要求4所述的方法,其特征在于,
所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值位于第二阈值范围内,则确定所述待识别号码为仿冒号码。
6.根据权利要求4所述的方法,其特征在于,
所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值不在第二阈值范围内,则将所述待识别号码与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点进行匹配;
若所述待识别号码与所述叶子节点匹配成功,则确定所述待识别号码不是仿冒号码。
7.根据权利要求6所述的方法,其特征在于,
所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述待识别号码与所述叶子节点匹配不成功,则将所述待识别号码的号码长度与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点的号码长度进行比较,形成比较结果;
若所述比较结果表明所述待识别号码的号码长度与所述叶子节点的号码长度的差值在差值阈值范围内,则确定所述待识别号码为仿冒号码。
8.根据权利要求5所述的方法,其特征在于,
所述结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码,包括:
若所述比对结果表明没有所述第二层分支节点是所述待识别号码的稳定排序的子集,则确定所述待识别号码不是仿冒号码。
9.一种仿冒号码识别装置,其特征在于,所述装置包括:
提取单元,用于按照预设策略提取待识别号码的号码属性;
计算单元,用于基于所述待识别号码的号码属性及特殊号码的号码属性,计算所述待识别号码与特殊号码的相似度;
所述计算单元,包括:
查询模块,用于查询索引树;所述索引树为依据所述特殊号码的号码属性建立的数据结构;所述索引树的第一层分支节点由所述特殊号码的唯一值数构成;所述索引树的第二层分支节点由所述特殊号码的稳定排序构成;所述索引树的叶子节点为所述特殊号码;所述唯一值数为通信号码包括不重复数字的个数;所述稳定排序为各数字首次出现的排序;
计算模块,用于按照预设函数关系,计算所述待识别号码的唯一值数与所述第一层分支节点的相似值;
确定单元,用于基于所述相似度,确定所述待识别号码是否为仿冒号码。
10.根据权利要求9所述的装置,其特征在于,
所述提取单元,具体用于确定所述待识别号码的唯一值数;其中,所述唯一值数为通信号码包括不重复数字的个数;和/或,确定所述待识别号码的稳定排序;其中,所述稳定排序为通信号码中各数字首次出现的排序;和/或,确定所述待识别号码的号码长度;所述号码长度为通信号码包括的数字位数。
11.根据权利要求10所述的装置,其特征在于,
所述确定单元,包括:
判定模块,用于判定是否有至少一个所述相似值位于第一阈值范围内;
确定模块,用于若没有一个所述相似值位于所述第一阈值范围内,则确定所述待识别号码不是仿冒号码。
12.根据权利要求11所述的装置,其特征在于,
所述查询模块,还用于若所述待识别号码至少有一个所述相似值位于所述第一阈值范围内,则查询位于所述第一阈值范围内的所述相似值对应的第一层分支节点下的第二层分支节点;
所述确定单元,还包括:
比对模块,用于将所述待识别号码的稳定排序,与所述待识别号码所在的第一层分支下的第二层分支节点进行比对,形成比对结果;
所述确定模块,还用于结合所述相似值及所述比对结果,确定所述待识别号码是否为仿冒号码。
13.根据权利要求12所述的装置,其特征在于,
所述确定模块,还用于若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值位于第二阈值范围内,则确定所述待识别号码为仿冒号码。
14.根据权利要求12所述的装置,其特征在于,
所述查询模块,还用于若所述比对结果表明有所述第二层分支节点是所述待识别号码的稳定排序的子集,且所述相似值不在第二阈值范围内,则将所述待识别号码与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点进行匹配;
所述确定模块,还用于若所述待识别号码与所述叶子节点匹配成功,则确定所述待识别号码不是仿冒号码。
15.根据权利要求14所述的装置,其特征在于,
所述确定单元,还包括:
比较模块,用于若所述待识别号码与所述叶子节点匹配不成功,则将所述待识别号码的号码长度与所述待识别号码的稳定排序所在的第二层分支节点下的叶子节点的号码长度进行比较,形成比较结果;
所述确定模块,具体用于若所述比较结果表明所述待识别号码的号码长度与所述叶子节点的号码长度的差值在差值阈值范围内,则确定所述待识别号码为仿冒号码。
16.根据权利要求13所述的装置,其特征在于,
所述确定模块,还用于若所述比对结果表明没有所述第二层分支节点是所述待识别号码的稳定排序的子集,则确定所述待识别号码不是仿冒号码。
CN201510758079.9A 2015-11-09 2015-11-09 仿冒号码识别方法及装置 Active CN106686192B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510758079.9A CN106686192B (zh) 2015-11-09 2015-11-09 仿冒号码识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510758079.9A CN106686192B (zh) 2015-11-09 2015-11-09 仿冒号码识别方法及装置

Publications (2)

Publication Number Publication Date
CN106686192A CN106686192A (zh) 2017-05-17
CN106686192B true CN106686192B (zh) 2019-12-06

Family

ID=58863364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510758079.9A Active CN106686192B (zh) 2015-11-09 2015-11-09 仿冒号码识别方法及装置

Country Status (1)

Country Link
CN (1) CN106686192B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677848B (zh) * 2018-07-02 2022-08-30 中国电信股份有限公司 仿冒号码识别方法、装置和计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671369B2 (en) * 2001-11-20 2003-12-30 Royal Appliance Mfg. Co. Method and apparatus for returning a false special information tone for an incoming telephone call
CN1728655A (zh) * 2004-11-25 2006-02-01 刘文印 一种检测鉴别假冒网页的方法及系统
CN101035307A (zh) * 2007-03-05 2007-09-12 北京佳讯飞鸿电气有限责任公司 一种交换机中模糊号码分析的实现方法
CN103209126A (zh) * 2012-01-11 2013-07-17 深圳市东进软件开发有限公司 一种具有模糊识别功能的号码分析方法和系统
CN104809157A (zh) * 2015-03-25 2015-07-29 小米科技有限责任公司 号码识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671369B2 (en) * 2001-11-20 2003-12-30 Royal Appliance Mfg. Co. Method and apparatus for returning a false special information tone for an incoming telephone call
CN1728655A (zh) * 2004-11-25 2006-02-01 刘文印 一种检测鉴别假冒网页的方法及系统
CN101035307A (zh) * 2007-03-05 2007-09-12 北京佳讯飞鸿电气有限责任公司 一种交换机中模糊号码分析的实现方法
CN103209126A (zh) * 2012-01-11 2013-07-17 深圳市东进软件开发有限公司 一种具有模糊识别功能的号码分析方法和系统
CN104809157A (zh) * 2015-03-25 2015-07-29 小米科技有限责任公司 号码识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种改进的号码分析方法;宋茂强等;《北京邮电大学学报》;19961220;第19卷(第4期);第92页 *

Also Published As

Publication number Publication date
CN106686192A (zh) 2017-05-17

Similar Documents

Publication Publication Date Title
US11748463B2 (en) Fraud detection in interactive voice response systems
CN107767262B (zh) 信息处理方法、装置和计算机可读存储介质
CN111125118B (zh) 关联数据查询方法、装置、设备及介质
CN109547393B (zh) 恶意号码识别方法、装置、设备和存储介质
CN102438205B (zh) 一种基于移动用户行为的业务推送的方法与系统
US20150074254A1 (en) Crowd-sourced clustering and association of user names
CN106713579A (zh) 一种电话号码识别方法及装置
CN110609908A (zh) 案件串并方法及装置
WO2018027138A1 (en) Fraud detection in interactive voice response systems
CN108810290B (zh) 一种诈骗电话的识别的方法及系统
CN112818316A (zh) 基于声纹的身份识别及应用方法、装置与设备
US8413234B1 (en) Communications-service fraud detection using special social connection
CN106686192B (zh) 仿冒号码识别方法及装置
CN108777749B (zh) 一种诈骗电话识别方法及装置
CN106162586A (zh) 呼入限制方法、装置以及系统
CN106936807A (zh) 一种恶意操作的识别方法和装置
CN108984773B (zh) 数据缺失情况下的黑名单多维信息验证方法及系统及可读存储介质及设备
KR101033870B1 (ko) 스팸 전화 처리 방법 및 장치
CN106713581A (zh) 一种通讯号码识别方法、终端以及系统
CN109873908A (zh) 垃圾电话标识识别方法、装置、计算机设备及存储介质
CN109450660B (zh) 信令日志文本存入数据库的方法及装置
CN105577921A (zh) 一种业务控制的方法以及移动终端
KR101587418B1 (ko) 발신번호 변조 방지 기반의 호 차단 제어 장치 및 방법
CN115955528A (zh) 一种号码的识别方法、装置及可读存储介质
CN116684527A (zh) 模型训练方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant