CN106657549B - 一种基于号码模式的黑号码识别方法 - Google Patents

一种基于号码模式的黑号码识别方法 Download PDF

Info

Publication number
CN106657549B
CN106657549B CN201610941276.9A CN201610941276A CN106657549B CN 106657549 B CN106657549 B CN 106657549B CN 201610941276 A CN201610941276 A CN 201610941276A CN 106657549 B CN106657549 B CN 106657549B
Authority
CN
China
Prior art keywords
black
pattern
pattern table
symbol
numbers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610941276.9A
Other languages
English (en)
Other versions
CN106657549A (zh
Inventor
刘瑶
申正
吉立妍
张煊
王昊
王娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xinxun Digital Technology Hangzhou Co ltd
Original Assignee
Hangzhou Dongxin Beiyou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dongxin Beiyou Information Technology Co Ltd filed Critical Hangzhou Dongxin Beiyou Information Technology Co Ltd
Priority to CN201610941276.9A priority Critical patent/CN106657549B/zh
Publication of CN106657549A publication Critical patent/CN106657549A/zh
Application granted granted Critical
Publication of CN106657549B publication Critical patent/CN106657549B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/663Preventing unauthorised calls to a telephone set
    • H04M1/665Preventing unauthorised calls to a telephone set by checking the validity of a code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • H04M3/4365Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it based on information specified by the calling party, e.g. priority or subject

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Character Discrimination (AREA)

Abstract

一种基于号码模式的黑号码识别方法,包括有:步骤一、将位数相同的多条已知黑号码按一定顺序写入黑号码模式表中;步骤二、从黑号码模式表中逐一提取每两条相邻号码,并计算相邻号码之间的相似度,当其相似度值超过阈值时,则提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,并写入到黑号码模式表中;步骤三、将待识别号码和黑号码模式表中的所有黑号码模式逐一进行匹配,如果待识别号码和黑号码模式表中的一条黑号码模式匹配一致,则待识别号码是黑号码。本发明属于网络通信技术领域,能根据黑号码之间的相似规律来挖掘黑号码模式,从而有效识别现网中的未知黑号码。

Description

一种基于号码模式的黑号码识别方法
技术领域
本发明涉及一种基于号码模式的黑号码识别方法,属于网络通信技术领域。
背景技术
目前,一些诈骗骚扰份子通过改号软件生成大量连号号码进行电话诈骗或骚扰,同时,在现有的黑名单号码库中也发现了大量相似度极高的黑号码。这类黑号码通常长度固定,只更改其中某几位的号码,符合同一个号码模式。这类黑号码中,由于其单一号码的日呼叫频次极低,因此导致命中现有策略的概率不高,有大量黑号码并没有进行拦截。因此,如何根据这类号码之间的相似规律,找到表征其相似规律的号码模式,最终,能根据号码模式来识别其他未被拦截的号码同时对其进行治理,已成为技术人员急需解决的技术问题,目前还未发现相关技术解决方案。
发明内容
有鉴于此,本发明的目的是提供一种基于号码模式的黑号码识别方法,能根据黑号码之间的相似规律来挖掘黑号码模式,从而有效识别现网中的未知黑号码。
为了达到上述目的,本发明提供了一种基于号码模式的黑号码识别方法,包括有:
步骤一、将位数相同的多条已知黑号码按一定顺序写入黑号码模式表中;
步骤二、从黑号码模式表中逐一提取每两条相邻号码,并计算相邻号码之间的相似度,当其相似度值超过阈值时,则提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,并写入到黑号码模式表中;
步骤三、将待识别号码和黑号码模式表中的所有黑号码模式逐一进行匹配,如果待识别号码和黑号码模式表中的一条黑号码模式匹配一致,则待识别号码是黑号码,
步骤二中,当其相似度值超过阈值时,则提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,进一步包括有:
将相同的号码符写入到黑号码模式p的对应位序上,将不同的号码符替换成统一的号码模式符写入到黑号码模式p的对应位序上
与现有技术相比,本发明的有益效果是:本发明通过从大量相似度极高的黑号码之间挖掘黑号码模式,并根据黑号码模式来识别出现网中未被发现的黑号码,技术方案简单易行,并对现网无需任何改变,从而具有较高的实用性和有效性。
附图说明
图1是本发明一种基于号码模式的黑号码识别方法流程图。
图2是图1步骤二的具体操作流程图。
图3是图2步骤25的具体操作流程图。
图4是计算两个号码之间的相似度的具体操作流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
如图1所示,本发明一种基于号码模式的黑号码识别方法,包括有:
步骤一、将位数相同的多条已知黑号码按一定顺序写入黑号码模式表中;
步骤二、从黑号码模式表中逐一提取每两条相邻号码,并计算相邻号码之间的相似度,当其相似度值超过阈值时,则表明两条相邻号码符合同一号码模式,提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,并写入到黑号码模式表中;
步骤三、将待识别号码和黑号码模式表中的所有黑号码模式逐一进行匹配,如果待识别号码和黑号码模式表中的一条黑号码模式匹配一致,则待识别号码是黑号码。
步骤一中,黑号码可能是诈骗、骚扰等非法号码,可以根据手机、座机等号码位数的不同,将黑号码进一步细分为:手机黑号码模式表、座机黑号码模式表、和其他黑号码模式表等。
如图2所示,图1步骤二还可以进一步包括有:
步骤21、初始化迭代序号t为1;
步骤22、初始化号码模式标识符flag为0、号码序号i为1,并初始化第t次迭代的新增号码数Am(t)为0;
步骤23、从黑号码模式表中提取第i、i+1条号码;
在多次迭代后,黑号码模式表中的第i或i+1条号码是黑号码、或者带有号码模式符的黑号码模式;
步骤24、计算第i、i+1条号码之间的相似度,并判断第i、i+1条号码之间的相似度值是否超过一定阈值?如果是,则继续下一步;如果否,则转向步骤27;
步骤25、逐一从第i、i+1条号码中提取每一位号码符,并判断处于相同位序上的两个号码符是否相同,然后将相同的号码符写入到黑号码模式p的对应位序上,将不同的号码符替换成统一的号码模式符写入到黑号码模式p的对应位序上;
步骤26、将p作为一条新增号码保存到黑号码模式表中,更新flag为1,更新第t次迭代的新增号码数Am(t):Am(t)=Am(t)+1,然后转向步骤28;
步骤27、判断flag是否为0?如果是,则将第i条号码作为一条新增号码保存到黑号码模式表中,更新flag为0,更新第t次迭代的新增号码数Am(t):Am(t)=Am(t)+1,然后继续下一步;如果否,则更新flag为0,然后继续下一步;
步骤28、更新i:i=i+1,然后判断是否已提取完黑号码模式表中的所有号码?如果是,则继续下一步;如果否,则转向步骤23;
步骤29、判断第t次迭代的新增号码数Am(t)和第t-1次迭代的新增号码数Am(t-1)是否相同?如果是,则说明多次迭代后黑号码模式表中的所有结果处于收敛状态,删除黑号码模式表中不包含有号码模式符的黑号码,本流程结束;如果否,则更新t:t=t+1,然后转向步骤22。
步骤29中,删除黑号码模式表中不包含有号码模式符的黑号码后,黑号码模式表中所剩下的都是带有号码模式符的黑号码模式,将所有黑号码模式按正则表达式进行描述,将待识别号码和其一一匹配,并根据匹配结果判断待识别号码是否是黑号码。
如图3所示,图2步骤25还可以进一步包括有:
步骤251、设置号码位序n为1;
步骤252、判断第i、i+1条号码在第n位序上的号码符是否相同?如果是,则将相同的号码符写入到黑号码模式p的第n位序上,然后继续下一步;如果否,则将一个号码模式符(例如*)写入到黑号码模式p的第n位序上,然后继续下一步;
步骤253、更新n:n=n+1,并判断n是否大于第i条号码的号码位数?如果是,则本流程结束;如果否,则转向步骤252。
如图4所示,计算两条号码之间的相似度,还可以进一步包括有:
步骤A1、计算两条号码之间的海明距离:逐一比较两条号码在每一位上的号码符是否相同,并统计不同号码符的个数,所述不同号码符的个数即是两条号码之间的海明距离;
例如,两条黑号码13511223344、13521456874之间的海明距离为6,黑号码13511223344和黑号码模式135*1*53*74之间的海明距离为5,两条黑号码模式135*1*53*74、136*1**3*74之间的海明距离为2;
步骤A2、计算两条号码之间的相似度:其中Sim(Ni,Nj)是号码Ni、Nj之间的相似度,hm(Ni,Nj)是号码Ni、Nj之间的海明距离,L是号码Ni或Nj的号码位数。
例如,两条号码:13512134560和13512475670,分别在第6、7、8、9、10位上的号码符不同,不同号码符的个数为5,则它们之间的海明距离是5,相似度为
使用本发明方法对2016年6月6日获得的黑号码表进行号码模式训练,共得到14条黑号码模式。将第二天的黑号码表中的黑号码和这14条黑号码模式进行匹配,共发现7条符合黑号码模式的黑号码,占总数的95%左右,因此,经过实验验证,本发明可以在现网中有效地识别黑号码,并且进行拦截。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (8)

1.一种基于号码模式的黑号码识别方法,其特征在于,包括有:
步骤一、将位数相同的多条已知黑号码按一定顺序写入黑号码模式表中;
步骤二、从黑号码模式表中逐一提取每两条相邻号码,并计算相邻号码之间的相似度,当其相似度值超过阈值时,则提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,并写入到黑号码模式表中;
步骤三、将待识别号码和黑号码模式表中的所有黑号码模式逐一进行匹配,如果待识别号码和黑号码模式表中的一条黑号码模式匹配一致,则待识别号码是黑号码,
步骤二中,当其相似度值超过阈值时,则提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,进一步包括有:
将相同的号码符写入到黑号码模式p的对应位序上,将不同的号码符替换成统一的号码模式符写入到黑号码模式p的对应位序上。
2.根据权利要求1所述的方法,其特征在于,步骤一中,根据号码位数的不同,将黑号码进一步细分为:手机黑号码模式表、座机黑号码模式表、和其他黑号码模式表。
3.根据权利要求1所述的方法,其特征在于,步骤二进一步包括有:
步骤21、初始化号码模式标识符flag为0、号码序号i为1;
步骤22、从黑号码模式表中提取第i、i+1条号码;
步骤23、计算第i、i+1条号码之间的相似度,并判断第i、i+1条号码之间的相似度值是否超过一定阈值,如果是,则继续下一步;
步骤24、逐一从第i、i+1条号码中提取每一位号码符,并判断处于相同位序上的两个号码符是否相同,然后将相同的号码符写入到黑号码模式p的对应位序上,将不同的号码符替换成统一的号码模式符写入到黑号码模式p的对应位序上;
步骤25、将p作为一条新增号码保存到黑号码模式表中,更新flag为1,然后转向步骤26;
步骤26、更新i:i=i+1,然后判断是否已提取完黑号码模式表中的所有号码,如果否,则转向步骤22。
4.根据权利要求3所述的方法,其特征在于,步骤23中,当第i、i+1条号码之间的相似度值未超过一定阈值时,还包括有:
步骤A、判断flag是否为0,如果是,则将第i条号码作为一条新增号码保存到黑号码模式表中,更新flag为0,然后继续步骤26;如果否,则更新flag为0,然后继续步骤26。
5.根据权利要求4所述的方法,其特征在于,步骤21之前还包括有:
步骤20、初始化迭代序号t为1,这样,
步骤21中还包括有:初始化第t次迭代的新增号码数Am(t)为0,
步骤25和步骤A中,将p或第i条号码作为一条新增号码保存到黑号码模式表中,同时还包括有:更新第t次迭代的新增号码数Am(t):Am(t)=Am(t)+1,
步骤26中,当已提取完黑号码模式表中的所有号码时,还包括有:
步骤27、判断第t次迭代的新增号码数Am(t)和第t-1次迭代的新增号码数Am(t-1)是否相同,如果是,则删除黑号码模式表中不包含有号码模式符的黑号码,本流程结束;如果否,则更新t:t=t+1,然后转向步骤21。
6.根据权利要求3所述的方法,其特征在于,步骤24还进一步包括有:
步骤241、设置号码位序n为1;
步骤242、判断第i、i+1条号码在第n位序上的号码符是否相同,如果是,则将相同的号码符写入到黑号码模式p的第n位序上,然后继续下一步;如果否,则将一个号码模式符写入到黑号码模式p的第n位序上,然后继续下一步;
步骤243、更新n:n=n+1,并判断n是否大于第i条号码的号码位数,如果是,则本流程结束;如果否,则转向步骤242。
7.根据权利要求1所述的方法,其特征在于,步骤三中,将黑号码模式表中的所有黑号码模式按正则表达式进行描述,将待识别号码和其一一匹配,并根据匹配结果判断待识别号码是否是黑号码。
8.根据权利要求1所述的方法,其特征在于,计算两条号码之间的相似度,进一步包括有:
步骤B1、计算两条号码之间的海明距离:逐一比较两条号码在每一位上的号码符是否相同,并统计不同号码符的个数,所述不同号码符的个数即是两条号码之间的海明距离;
步骤B2、计算两条号码之间的相似度:其中Sim(Ni,Nj)是号码Ni、Nj之间的相似度,hm(Ni,Nj)是号码Ni、Nj之间的海明距离,L是号码Ni或Nj的号码位数。
CN201610941276.9A 2016-10-25 2016-10-25 一种基于号码模式的黑号码识别方法 Active CN106657549B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610941276.9A CN106657549B (zh) 2016-10-25 2016-10-25 一种基于号码模式的黑号码识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610941276.9A CN106657549B (zh) 2016-10-25 2016-10-25 一种基于号码模式的黑号码识别方法

Publications (2)

Publication Number Publication Date
CN106657549A CN106657549A (zh) 2017-05-10
CN106657549B true CN106657549B (zh) 2019-05-31

Family

ID=58821203

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610941276.9A Active CN106657549B (zh) 2016-10-25 2016-10-25 一种基于号码模式的黑号码识别方法

Country Status (1)

Country Link
CN (1) CN106657549B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677848B (zh) * 2018-07-02 2022-08-30 中国电信股份有限公司 仿冒号码识别方法、装置和计算机可读存储介质
CN110602304B (zh) * 2019-09-17 2021-06-11 卓尔智联(武汉)研究院有限公司 一种信息处理方法、装置和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1968302A (zh) * 2006-10-10 2007-05-23 中山大学 一种基于反垃圾号码过滤的通信装置
CN103139730A (zh) * 2011-11-23 2013-06-05 上海粱江通信系统股份有限公司 用于识别大量号码低频发送垃圾短信情况的方法
CN103796183A (zh) * 2012-10-26 2014-05-14 中国移动通信集团上海有限公司 一种垃圾短信识别方法及装置
CN103974214A (zh) * 2014-04-11 2014-08-06 武汉科技大学 低频垃圾短信号码识别系统
CN105025489A (zh) * 2015-07-06 2015-11-04 成都亿邻通科技有限公司 垃圾短信自动屏蔽方法
CN105704719A (zh) * 2014-11-28 2016-06-22 中国移动通信集团公司 一种实现骚扰电话监控策略优化的方法和装置
CN105898085A (zh) * 2016-04-05 2016-08-24 腾讯科技(深圳)有限公司 骚扰通信账号的识别方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100210241A1 (en) * 2009-02-18 2010-08-19 Alexander Sergeev Method for enabling communications sessions and supporting anonymity

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1968302A (zh) * 2006-10-10 2007-05-23 中山大学 一种基于反垃圾号码过滤的通信装置
CN103139730A (zh) * 2011-11-23 2013-06-05 上海粱江通信系统股份有限公司 用于识别大量号码低频发送垃圾短信情况的方法
CN103796183A (zh) * 2012-10-26 2014-05-14 中国移动通信集团上海有限公司 一种垃圾短信识别方法及装置
CN103974214A (zh) * 2014-04-11 2014-08-06 武汉科技大学 低频垃圾短信号码识别系统
CN105704719A (zh) * 2014-11-28 2016-06-22 中国移动通信集团公司 一种实现骚扰电话监控策略优化的方法和装置
CN105025489A (zh) * 2015-07-06 2015-11-04 成都亿邻通科技有限公司 垃圾短信自动屏蔽方法
CN105898085A (zh) * 2016-04-05 2016-08-24 腾讯科技(深圳)有限公司 骚扰通信账号的识别方法及装置

Also Published As

Publication number Publication date
CN106657549A (zh) 2017-05-10

Similar Documents

Publication Publication Date Title
CN107885999A (zh) 一种基于深度学习的漏洞检测方法及系统
CN108536851B (zh) 一种基于移动轨迹相似度比较的用户身份识别方法
CN109951289B (zh) 一种识别方法、装置、设备及可读存储介质
CN106657549B (zh) 一种基于号码模式的黑号码识别方法
CN102368853B (zh) 通信事件处理方法及系统
CN104660549A (zh) 身份验证方法及装置
CN103970733B (zh) 一种基于图结构的中文新词识别方法
CN106791221B (zh) 一种基于通话的亲友圈关系识别方法
CN109344263B (zh) 一种地址匹配方法
CN106970911A (zh) 一种基于大数据和机器学习的防范电信诈骗系统及方法
CN103415004B (zh) 一种检测垃圾短消息的方法及装置
CN107517463A (zh) 一种电话号码的识别方法和装置
CN110177179A (zh) 一种基于图嵌入的诈骗号码识别方法
CN108462785A (zh) 一种恶意呼叫电话的处理方法及装置
CN104239321B (zh) 一种面向搜索引擎的数据处理方法及装置
CN107122659A (zh) 一种快速定位Android应用软件中恶意代码或漏洞的方法
Min et al. K-means algorithm: fraud detection based on signaling data
CN105357673B (zh) 一种移动终端及其预防诈骗的方法
CN109905524B (zh) 电话号码识别方法、装置、计算机设备及计算机存储介质
CN110876072B (zh) 一种批量注册用户识别方法、存储介质、电子设备及系统
CN112399013A (zh) 异常话务识别方法和装置
CN106533955B (zh) 一种基于网络报文的序列号识别方法
CN109299402A (zh) 基于要素预分段的地址匹配方法
CN101840423A (zh) 基于成对下单原理与数据挖掘技术的话单准确性稽核系统
CN107026739B (zh) 短信签名认证方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 310013, Zhejiang, Xihu District, Wensanlu Road, No. 398, 4 floor, Hangzhou

Applicant after: EB Information Technology Ltd.

Address before: 100191 Beijing, Zhichun Road, No. 9, hearing the building on the floor of the 7 floor,

Applicant before: EB Information Technology Ltd.

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 310013 4th floor, No.398 Wensan Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee after: Xinxun Digital Technology (Hangzhou) Co.,Ltd.

Address before: 310013 4th floor, No.398 Wensan Road, Xihu District, Hangzhou City, Zhejiang Province

Patentee before: EB Information Technology Ltd.