CN106506769A - 一种利用实时算法实现恶意电话过滤的方法和系统 - Google Patents

一种利用实时算法实现恶意电话过滤的方法和系统 Download PDF

Info

Publication number
CN106506769A
CN106506769A CN201610877001.3A CN201610877001A CN106506769A CN 106506769 A CN106506769 A CN 106506769A CN 201610877001 A CN201610877001 A CN 201610877001A CN 106506769 A CN106506769 A CN 106506769A
Authority
CN
China
Prior art keywords
real time
malicious call
sample
call
calling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610877001.3A
Other languages
English (en)
Other versions
CN106506769B (zh
Inventor
陈晓莉
林建洪
徐菁
聂宜君
徐佳丽
肖炜
柴永恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Ponshine Information Technology Co Ltd
Original Assignee
Zhejiang Ponshine Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Ponshine Information Technology Co Ltd filed Critical Zhejiang Ponshine Information Technology Co Ltd
Priority to CN201610877001.3A priority Critical patent/CN106506769B/zh
Publication of CN106506769A publication Critical patent/CN106506769A/zh
Application granted granted Critical
Publication of CN106506769B publication Critical patent/CN106506769B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/26Devices for calling a subscriber
    • H04M1/27Devices whereby a plurality of signals may be stored simultaneously
    • H04M1/274Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc
    • H04M1/2745Devices whereby a plurality of signals may be stored simultaneously with provision for storing more than one subscriber number at a time, e.g. using toothed disc using static electronic memories, e.g. chips
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/10Network architectures or network communication protocols for network security for controlling access to devices or network resources
    • H04L63/101Access control lists [ACL]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明属于移动电话通信技术领域,具体涉及一种利用实时算法实现恶意电话过滤的方法,包括以下步骤:主叫号码对已申请恶意电话保护的被叫号码发起呼叫;主、被叫号码被传输至恶意电话实时分析过滤平台;恶意电话实时分析过滤平台将主、被叫号码与号码库进行匹配,再利用实时算法进行判断是否拦截;若不拦截则接通。本发明还公开了恶意电话过滤系统包括恶意电话拦截组件模块、支撑平台模块、算法模型模块和外联接口模块。通过被叫号码申请恶意电话保护,并将主、被叫号码传输至恶意电话实时分析过滤平台,先进行号码库匹配拦截,未被拦截的主叫号码再利用实时算法进行判断是否拦截,从而实现对恶意电话的过滤,排除被叫用户的烦恼。

Description

一种利用实时算法实现恶意电话过滤的方法和系统
技术领域
本发明属于移动电话通信技术领域,具体涉及一种利用实时算法实现恶意电话过滤的方法和系统。
背景技术
移动电话已经成为人们沟通的主要工具之一,用户使用手机等移动终端可以与其他用户进行电话拨打等通信行为。用户在享受手机等移动终端为工作或生活带来便利的同时,可能会受到诈骗、营销等骚扰电话的打扰,这些骚扰电话给人们的正常的工作和生活造成了严重影响。
为了识别骚扰电话号码,现有技术采用的方法是,由运营人员人工收集骚扰电话号码,生成黑名单列表,然后下发给终端,终端将黑名单列表在本地保存。当终端接收到呼入电话请求时,根据本地保存的黑名单列表,判断该呼入的电话号码是否为黑名单中的骚扰电话号码,如果是,则对用户做出提醒或对该呼入电话请求进行拦截处理。这种方法虽然能够在一定程度上帮助用户过滤掉一些骚扰电话,但是,因为在实际中骗子或者营销人员会经常更换电话号码,新的骚扰电话号码会源源不断的产生,导致终端中保存的黑名单列表存在严重的滞后性问题,经常会出现不能有效帮助用户对骚扰电话进行过滤的情况,用户体验较差。
如申请号为201310457733.3的中国发明专利申请公开了一种外来电话过滤的实现方法及系统,该方法的特征在于:提供一虚拟分机,接入的电话线分成两路,一路接到所述虚拟分机,另一路接到一延时器;所述延时器用于保证虚拟分机先获得并截获来电信号;所述的虚拟分机将所有来电号码分成四类:白名单、灰名单、黑名单、其余号码;并根据所述四类号码控制电话线路处于:全连通状态、选择性连通状态以及转接状态。该发明的方法和系统由于采用虚拟分机技术,可以根据带时间性的策略和对方号码来决定是拒绝(对方听到忙音),留言接听,还是接听并激发铃声。但是,该外来电话过滤的实现方法及系统针对的是固定电话,而且也没有具体说明是如何实现过滤的,只是提供了一个框架思路。
当前,网络上出现一种软件叫“呼死你”,又名网络电话自动追呼系统或者“手机轰炸软件”,是利用通讯费用低廉的网络电话作为呼叫平台,采用国际先进网络电话通讯技术,可以方便设置追呼的任何一部、任何区域的固定电话及手机号码。但时下,这种“呼死你”软件却成为不法分子的工具,作为恶意报复甚至敲诈勒索的手段。针对这种恶意电话,目前运营商和移动用户都缺乏有效的治理手段。
发明内容
针对现有技术中存在的不足,本发明提供一种利用实时算法实现恶意电话过滤的方法和系统。
为了达到上述发明目的,本发明采用以下技术方案:
一种利用实时算法实现恶意电话过滤的方法,包括以下步骤:
201,主叫号码对已申请恶意电话保护的被叫号码发起呼叫;
202,主、被叫号码被传输至恶意电话实时分析过滤平台;
203,恶意电话实时分析过滤平台将主、被叫号码与号码库进行匹配,再利用实时算法进行判断是否拦截;若不拦截则接通。通过被叫号码申请恶意电话保护,并将主、被叫号码传输至恶意电话实时分析过滤平台,先进行号码库匹配拦截,未被拦截的主叫号码再利用实时算法进行判断是否拦截,从而实现对恶意电话的过滤,排除被叫用户的烦恼。
优选的,所述恶意电话保护的申请流程包括以下步骤:
101,被叫号码在恶意电话实时分析过滤平台申请恶意电话保护;
102,恶意电话实时分析过滤平台将被叫号码信息传递至NGIN进行呼叫控制订阅;
103,恶意电话实时分析过滤平台通知被叫号码恶意电话保护开启。恶意电话保护的业务申请流程简单、方便,一键即可完成申请的过程。
优选的,所述实时算法包括序列后向选择和K-means聚类算法,能准确地判断号码是否需要拦截。
优选的,所述实时算法的具体流程如下:
步骤A1:确定指标与指标个数n,计算全集的特征组合,共有2n种特征组合,则K-means的参数K的初始值为2n
步骤A2:判断K是否为0,若K为0,则结束流程;若不为0,则转至下一步骤;
步骤A3:根据业务经验与实际情况逐步减小K的取值;
步骤A4:选择K个初始聚类中心;
步骤A5:计算每个样本Xi=(Xi1,Xi2,…Xin)到聚类中心Xk=(Xk1,Xk2,…Xkn)的欧几里得距离,并将样本划分到距离最近的簇中;
步骤A6:计算当前簇的均值作为新的聚类中心,并计算每个样本到新聚类中心的欧几里得距离,重复该步骤直到收敛,得到最终的聚类中心;
步骤A7:若聚类中心的指标大于0.5,则认为更接近于该指标为1的样本;若小于0.5,则认为更接近该指标为0的样本;若等于0.5,则与该指标为1和0的样本距离相等;
步骤A8:根据聚类中心找到距离近的样本的特征组合,保留距离近的样本的特征组合,剔除距离远的样本的特征组合;
步骤A9:根据特征组合得到判断规则;
步骤A10:计算对应规则的效果评估值;
步骤A11:返至步骤A2,重复步骤直至K为0,并结束流程。通过实时算法能很好地将恶意电话过滤。
优选的,所述指标包括主叫号码归属地、与上一通电话的时间间隔和主叫号码前三位号段。设置不同的过滤指标,更加准确地判断号码是否为恶意号码。
优选的,所述步骤A9还包括以下步骤:
步骤A91:通过融合聚类的序列后向选择算法得到不同K值下的特征组合以及评估值,根据业务目标选择相应的特征组合;
步骤A92:将所选的所有特征组合的并集作为恶意电话的实时分析上线规则;
步骤A93:分别计算每个被选择的特征的信息熵,信息熵越小的特征在流程上优先判断;
步骤A94:得到最终判断流程;
步骤A95:设计恶意电话号码实时分析初始样本获取流程;
步骤A96:设计恶意电话号码实时分析与拦截流程。
优选的,所述步骤A95还包括以下步骤:
步骤A951:被叫号码开启恶意电话保护;
步骤A952:判断是否在t段时间内至少打了s个电话;
步骤A953:提取t段时间内前m个号码的特征;
步骤A954:获取特征的包括m个号码的归属地、m个号码的前三位号段、计算m个号码的时间间隔的平均值和标准差σ,m个号码时间间隔范围为
优选的,所述步骤A96还包括以下步骤:
步骤A961:将第s+1个号码与个人黑白名单进行匹配;
步骤A962:将号码进行系统匹配,包括系统白名单匹配、恶意电话黑名单匹配、系统灰名单匹配和系统黑名单匹配;
步骤A963:若号码在个人白名单里则放行接通,若号码在个人黑名单里则进行拦截;若号码在系统白名单或系统灰名单里,则放行接通;若号码在系统黑名单或恶意电话黑名单里,则进行拦截;若号码不在以上名单中,则进入下一步骤;
步骤A964:提取号码的归属地、前三位号段、与上一通电话的时间间隔、前m个号码时间间隔均值与标准差;
步骤A965:判断该号码的归属地是否与样本归属地一致,若一致则拦截,其号段和时间间隔存储至样本表中,若不一致则进入下一步骤;
步骤A966:判断号段是否与样本号段表中已有的号段一致,若一致则拦截,其归属地和时间间隔加入到样本表中,若不一致则进入下一步骤;
步骤A967:时间间隔是否在前m个号码时间间隔的范围内,若属于该范围内则拦截,其号段和归属地加入到样本表中;若不属于该范围,则进入下一步骤;
步骤A968:号码接通。
本发明还公开了一种利用实时算法实现恶意电话的过滤系统,包括恶意电话拦截组件模块、支撑平台模块、算法模型模块和外联接口模块,恶意电话拦截组件模块实现对呼叫是否接续的判断;支撑平台模块实现包括对系统和号码库的管理;算法模型模块实现对呼叫是否为恶意电话的判断;外联接口模块用于连接外部系统。通过四大模块的协同作用实现恶意电话的过滤。
优选的,所述恶意电话拦截组件模块包括个人号码库拦截、系统号码库拦截和实时算法分析拦截。通过个人号码库和系统号码库进行过滤,可减轻实时算法拦截资源压力,且多重拦截设置能有效地过滤恶意电话。
本发明与现有技术相比,有益效果是:本发明利用实时算法实现恶意电话过滤的方法和系统,用户在恶意电话实时分析过滤平台申请恶意电话保护后,在保护期间有电话呼入时,经过号码库匹配与实时分析拦截两步为用户过滤恶意电话;号码库匹配是通过对比用户个人黑/白名单以及系统号码库进行过滤,可减轻实时算法分析拦截的压力;根据融合K-means聚类的序列后向选择算法得到判断恶意号码的特征组合,以特征组合的并集作为判断恶意电话号码的上线规则,过滤恶意电话效率高;实时分析拦截包括恶意号码实时分析初始样本获取流程以及恶意号码实时分析与拦截流程,准确拦截恶意号码。
附图说明
图1是本发明恶意电话保护申请流程图。
图2是本发明恶意电话过滤流程图。
图3是本发明利用实时算法实现恶意电话拦截的流程图。
图4是本发明利用实时算法实现电话正常接续的流程图。
图5是本发明融合K-means聚类算法的序列后向选择算法流程图。
图6是本发明恶意号码判断规则获取流程图。
图7是本发明不同特征组合策略下电话拦截比例图。
图8是本发明恶意号码实时分析初始样本获取流程图。
图9是本发明恶意号码实时分析与拦截流程图。
图10是本发明恶意号码实时分析智能开关流程图。
图11是本发明利用实时算法实现恶意电话的过滤系统的结构示意图。
图12是本发明利用实时算法实现恶意电话的过滤系统硬件的结构示意图。
具体实施方式
下面通过具体实施例对本发明的技术方案作进一步描述说明。
呼死你这种软件具有以下特点:(1)二十四小时不间断运行;(2)遇忙可自动重拨,重拨次数可任意设定;(3)系统工作时间可任意设定。不法份子利用呼死你软件具有的上述特点对移动电话用户进行恶意的骚扰,给用户带来了极大的困扰。针对上述情况,本发明开发了一种利用实时算法实现恶意电话过滤的方法和系统。
利用实时算法实现恶意电话过滤的方法和系统需要用户在恶意电话实时分析过滤平台申请呼死你保护的业务。该业务的受理范围包括所有电信、联通和移动手机,暂不包括固定电话。如图1所示,申请呼死你保护业务的流程包括以下步骤:
101,被叫用户在恶意电话实时分析过滤平台申请呼死你保护;
102,平台将用户信息传递至NGIN进行呼叫控制订阅;
103,恶意电话实时分析过滤平台通知用户呼死你保护开启。
其中,NGIN是一款全称为Next Generation Intelligent Network的可集成多种Service Enabler能力的融合通讯能力,解决传统话音业务的演进问题的智能网,NGIN为运营商提供。
图2为本发明的恶意电话过滤流程图,用户在恶意电话实时分析过滤平台申请呼死你保护后,在保护期间内有电话呼入时,依次进行个人黑白名单匹配拦截、系统号码库匹配拦截、呼死你号码实时分析与拦截,最后对过滤后的号码进行电话接通。经过号码库匹配与实时分析拦截两步为用户过滤呼死你电话;号码库匹配是通过对比用户个人黑/白名单以及系统号码库进行过滤,可减轻实时分析拦截资源压力。
本发明采用实时算法实现呼死你电话过滤,在用户申请呼死你保护后,NGIN为用户接续前先在恶意电话实时分析过滤平台对号码进行分析判断,若符合呼死你拦截规则,则将电话挂断,如图3所示,具体步骤如下:
201,主叫发起呼叫给已申请呼死你保护的用户,呼叫接入到运营商的NGIN;
202,NGIN将主、被叫号码传给恶意电话实时分析过滤平台进行是否需要拦截的判断;
203,恶意电话实时分析过滤平台将主、被叫号码与号码库进行匹配,再利用实时算法进行判断,如果符合拦截规则,通知NGIN挂断电话;
204,NGIN挂断电话,提示主叫您呼叫的用户占时无法接通;
205,恶意电话实时分析过滤平台具备合并拦截记录功能,将在拦截一定数据量后向用户推送拦截短信,避免因频繁推送消息对用户造成打扰。
若不符合呼死你拦截规则,本发明利用实时算法实现恶意电话过滤的方法并不影响正常呼叫的接续。正常的主叫经过实时算法的分析与号码库匹配,不符合拦截规则时通话接续,如图4所示,具体步骤如下:
301,主叫发起呼叫给已申请呼死你保护的用户,呼叫接入到运营商的NGIN;
302,NGIN将主、被叫号码传给恶意电话实时分析过滤平台进行是否需要拦截的判断;
303,恶意电话实时分析过滤平台将主、被叫号码与号码库进行匹配,再利用实时算法进行判断,如果不符合拦截规则,通知NGIN接通电话;
304,NGIN将电话接续到被叫用户,完成本次呼叫接续。
本发明的实时算法为序列后向和K-means聚类算法的结合。
序列后向选择(SBS,Sequential Backward Selection)是指从特征全集O开始,每次从特征集O中剔除一个特征y,计算每次剔除特征y后的评估值,选择最优评估值。
聚类是一种简单、高效且常用的数据挖掘技术,是把一些事物按照某个标准划分为若干个类别的过程。相似的聚为一类,不相近的聚为不同类。本发明主要采用的是K-means聚类算法。K-means聚类算法的具体步骤分为四步:
1、随机选择k个样本作为初始聚类中心;
2、将剩余样本划分到与之最相近的聚类中心所在的簇中;
3、计算当前簇的均值作为新的聚类中心;
4、不断循环上述2、3步,直到所有样本所属的类别不在变化为止。
本发明实时算法是针对呼死你号码进行实时分析并拦截,因此在指标选择上存在一定的限制,主要包括但不限于主叫号码归属地、主叫号码前三位号段、与上一通电话的时间间隔等。每一个指标需要与呼死你样本进行对比,是否与样本特征一致,若一致则标记为“1”,若不一致则标记为“0”。
实时算法描述:由于每个指标只有0和1两种水平并选择0.5为中间值,因此聚类中心的各个指标一般会出现两种情况即大于0.5或者小于0.5。若指标数量为n,则在全集状态下,一共有2n种特征组合情况。根据序列后向选择的原理,逐步剔除一部分特征,计算评估值,再融合K-means聚类算法,通过聚类个数K值的逐步减小得出不同K值的聚类中心,以聚类中心为依据选出邻近类的特征组合子集。若得到的聚类中心的指标大于0.5,则认为更接近于1;若小于0.5,则认为更接近0;若等于0.5,则与1和0的距离相等,仍分为两个聚类中心。保留邻近类的特征组合,剔除距离较远的类的特征组合,以邻近类的特征作为判断是否为呼死你号码的特征。随着K值的不断减小,特征也不断减小,判断呼死你号码的规则也更加严格苛刻。计算每一次特征选择后的规则的算法效果评估,包括但不限于拦截率、漏拦率等。如图5所示,实时算法的具体流程为:
步骤A1:确定指标与指标个数n,计算全集的特征组合,共有2n种特征组合,则K-means的参数K的初始值为2n
步骤A2:判断K是否=0,若为0则结束流程;若不为0则进行下一步骤;
步骤A3:当K不为0时,根据业务经验与实际情况逐步减小K的取值;
步骤A4:选择K个初始聚类中心;
步骤A5:计算每个样本Xi=(Xi1,Xi2,…Xin)到聚类中心Xk=(Xk1,Xk2,…Xkn)的欧几里得距离:
并将样本划分到距离最近的簇中;
步骤A6:计算当前簇的均值作为新的聚类中心并计算每个样本到新聚类中心的欧式距离,重复该步骤直到收敛,得到最终的聚类中心;
步骤A7:若聚类中心的指标大于0.5,则认为更接近于该指标为1的样本;若小于0.5,则认为更接近该指标为0的样本;若等于0.5,则与该指标为1和0的样本距离相等。
步骤A8:根据聚类中心找到距离近的样本的特征组合,保留距离近的样本的特征组合,剔除距离远的样本的特征组合;
步骤A9:根据特征组合得到判断规则;
步骤A10:计算对应规则的效果评估值,包括但不限于拦截率、漏拦率等。
步骤A11:返至步骤A2,重复步骤直至K为0,并结束流程。
在该实时算法的实际应用中,选择主叫号码归属地、主叫号码前三位号段、与上一通电话的时间间隔三个特征进行模型构建,因此全集状态下共有23=8种特征组合,随着K值的不断减小,一部分特征组合被剔除,以K=3为例,得到的聚类中心为:(0,0.43,0.43),(1,1,0.87),(1,0,0.75)。根据规则,与聚类中心距离最近的样本特征为:(0,0,0),(1,1,1),(1,0,1),其中(0,0,0)的三个特征与呼死你样本特征都不符合,因此该类不拦截;(1,1,1)表示三个特征都满足则拦截,(1,0,1)表示第一个与第三个特征同时满足则拦截。通过实时算法能很好地将恶意电话过滤。
根据融合K-means聚类的序列后向选择算法得到判断呼死你号码的特征组合,以特征组合的并集作为判断呼死你号码的上线规则。如图6所示,实时算法中的步骤A9还可以进一步细分为:
步骤A91:通过融合K-means聚类的序列后向选择算法得到不同K值下的特征组合以及评估值,根据业务目标选择相应的特征组合;
步骤A92:将所选的所有特征组合的并集作为呼死你的实时分析上线规则;
步骤A93:分别计算每个被选择的特征的信息熵,信息熵越小的特征在流程上优先判断;信息熵的具体计算公式为:
步骤A94:得到最终判断流程;
步骤A95:设计呼死你号码实时分析初始样本获取流程;
步骤A96:设计呼死你号码实时分析与拦截流程。
在实际应用中,根据实验结果,每一种特征组合策略下的拦截率如图7所示,在全集的状态下,拦截率最高,随K值减小,拦截率依次降低。在项目冷启动阶段,选择全集特征组合策略更为安全。按照流程全集策略的特征组合并集即为上线规则,因此上线规则为:三个特征只要有一个特征与样本特征符合则拦截。通过信息熵计算得到主叫号码归属地信息熵为0.209、主叫号码前三位号段信息熵为0.247、与上一通电话的时间间隔信息熵为0.288,因此上线流程中,三个指标的判断顺序依次为:主叫号码归属地、主叫号码前三位号段、与上一通电话的时间间隔。针对该实验结果设计对应的呼死你号码实时分析初始样本获取流程以及呼死你号码实时分析与拦截流程。
一、呼死你号码实时分析初始样本获取流程
由于呼死你号码实时分析判断规则在上线时需要一定的初始样本号码特征作为判断依据,因此需要首先定义用户在开启呼死你保护后是否已经处于被呼死你骚扰状态。当确认用户已经被呼死你骚扰后,提取相应的特征。如图8所示,实时算法流程中的步骤A95还可以进一步包括:
步骤A951:用户开启呼死你保护;
步骤A952:判断是否在t段时间内至少打了s个电话;
步骤A953:提取t段时间内前m个号码的特征;
步骤A954:获取包括但不限于以下特征:m个号码的归属省(去除被叫号码归属市)、m个号码的前三位号段(可根据业务建议去除一部分安全号段)、计算m个号码的时间间隔的平均值和标准差σ;其中,m个号码时间间隔均值的计算公式为:
m个号码时间间隔标准差的计算公式为:
m个号码时间间隔范围为:
二、呼死你号码实时分析与拦截流程
确认呼死你号码实时分析初始样本后,当第s+1个号码进入时,将对每一个号码进行特征提取并且与初始样本进行实时匹配。特征的匹配顺序按照步骤A93中的信息熵取值来确定。若该号码的特征与样本号码的其中一个特征一致,则认为是呼死你号码,对其进行拦截并且将该号码的其他特征加入到样本特征中,若该号码的特征与所有样本特征都不一致则放行接通。如图9所示,实时算法流程中的步骤A96进一步包括:
步骤A961:将该号码进行个人黑白名单匹配;
步骤A962:将该号码进行系统匹配,包括但不限于:系统白名单匹配、呼死你黑名单匹配、系统灰名单匹配、系统黑名单匹配等;
步骤A963:若该号码在个人白名单里则放行接通,若在个人黑名单里则进行拦截;若该号码在系统白名单或系统灰名单里,则放行接通,若在该号码在系统黑名单或呼死你黑名单里则进行拦截;若该号码不在以上任何名单中,则进入下一步流程;
步骤A964:提取该号码的归属地、前三位号段、与上一通电话的时间间隔、前m个号码时间间隔均值与标准差等特征;
步骤A965:判断该号码的归属地是否与样本归属地表中已有的省份一致且不属于被叫归属市,若一致则拦截,其号段和时间间隔加入到样本表中,若不一致则进入下一步流程;
步骤A966:判断该号段是否与样本号段表中已有的号段一致,若一致则拦截,其归属地和时间间隔加入到样本表中,若不一致则进入下一步骤;
步骤A967:时间间隔是否在前m个号码时间间隔的范围内,若属于该范围内则拦截,其号段和归属地加入到样本表中;若不属于该范围,则进入下一步骤;
步骤A968:该号码放行接通。
三、呼死你号码实时分析智能开关流程
申请呼死你保护后,平台会检测用户的被叫频率,当用户被叫频率到达高频状态时,进入分析拦截流程。同时判断每次呼叫的时间与上次的时间间隔,当时间间隔过长时,判断为非高频状态,则暂停拦截,开始高频检测状态。如图10所示,呼死你号码实时分析智能开关的详细流程为:
步骤A971:用户开启呼死你保护;
步骤A972:是否在t段时间内至少被拨打了s个电话;
转至实时算法步骤A95-A96:进入高频状态,开始呼死你号码实时分析初始样本获取流程与呼死你号码实时分析判断流程;
步骤A973:判断当前电话与上一次电话的时间间隔是否大于m;
步骤A973:若时间间隔是否大于m,则进入非高频状态,停止拦截,重新进入高频判断流程,达到呼死你拦截支持智能开关的效果。
如图11-12所示,本发明还设计了一种利用实时算法实现恶意电话的过滤系统,包括呼死你拦截组件模块、支撑平台模块、算法模型模块和外联接口模块。
呼死你拦截组件模块主要实现对呼叫是否接续的判断。对申请呼死你保护的用户,将其来电号码个人号码库、系统号码库进行对比,再采用实时算法分析出是否需要拦截的判断并通知NGIN拦截或接续。
支撑平台模块主要实现对业务、用户、号码库、统计等管理,用户管理用于管理申请呼死你保护的用户清单,支持为用户开通或取消业务;拦截记录查询,管理所有拦截记录,包括主叫号码、被叫号码、时间、原因等;号码库管理,定期入库或出库算法分析得到的黑白名单,管理号码清单,支持查询分类、入库时间、出库时间等信息;告警管理,对业务的情况进行监控,当异常时告警通知维护人员;统计分析,对用户情况、拦截效果、号码等做一个直观的图表展示,作为业务的效果分析模块;系统管理,主要用于对管理平台的账号、角色进行管理。
算法模型模块包括四个算法,系统黑名单算法用于分析通用呼死你号码并入库、系统白名单算法用于分析官方服务号码;个人号码库算法,即个人白名单算法通过分析用户近期的正常通话联系人号码;实时分析拦截算法用于实时分析用户呼入的电话是否符合呼死你样本特征。
外联接口模块主要用于连接外部系统,主要包括以下接口:短信接口用于实现对用户的拦截短信消息通知;呼叫事件订阅/取消接口用于将用户信息的订购或取消信息传到NGIN;呼叫控制接口用于通知NGIN呼叫是否需要转接到被叫手机;新业务订购/取消接口用于将用户在前台申请开通或取消业务的信息传递到恶意电话实时分析过滤平台。
呼死你拦截组件模块与外联接口模块之间通过业务接口管控模块连通,通过业务接口管控模块实现业务接口的选择,可选择外联接口中的一个或多个业务接口,可以适应不同用户的需求。
该利用实时算法实现恶意电话的过滤系统的硬件设备包括应用服务器集群、业务数据服务器集群和数据分析服务器集群,应用服务器集群外接CMNET,在应用服务器集群与CMNET之间设有负载均衡,负载均衡用于扩展网络设备和应用服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性;应用服务器集群与业务数据服务器集群信号连接,业务数据服务器集群与数据分析服务器集群信号连接,通过用服务器集群、业务数据服务器集群和数据分析服务器集群的协同作用实现恶意电话的过滤拦截。
以上对本发明的优选实施例及原理进行了详细说明,对本领域的普通技术人员而言,依据本发明提供的思想,在具体实施方式上会有改变之处,而这些改变也应视为本发明的保护范围。

Claims (10)

1.一种利用实时算法实现恶意电话过滤的方法,其特征在于,包括以下步骤:
201,主叫号码对已申请恶意电话保护的被叫号码发起呼叫;
202,主、被叫号码被传输至恶意电话实时分析过滤平台;
203,恶意电话实时分析过滤平台将主、被叫号码与号码库进行匹配,再利用实时算法进行判断是否拦截;若不拦截则接通。
2.根据权利要求1所述的利用实时算法实现恶意电话过滤的方法,其特征在于,所述恶意电话保护的申请流程包括以下步骤:
101,被叫号码在恶意电话实时分析过滤平台申请恶意电话保护;
102,恶意电话实时分析过滤平台将被叫号码信息传递至NGIN进行呼叫控制订阅;
103,恶意电话实时分析过滤平台通知被叫号码恶意电话保护开启。
3.根据权利要求1所述的利用实时算法实现恶意电话过滤的方法,其特征在于,所述实时算法包括序列后向选择和K-means聚类算法。
4.根据权利要求1或3所述的利用实时算法实现恶意电话过滤的方法,其特征在于,所述实时算法的具体流程如下:
步骤A1:确定指标与指标个数n,计算全集的特征组合,共有2n种特征组合,则K-means的参数K的初始值为2n
步骤A2:判断K是否为0,若K为0,则结束流程;若不为0,则转至下一步骤;
步骤A3:根据业务经验与实际情况逐步减小K的取值;
步骤A4:选择K个初始聚类中心;
步骤A5:计算每个样本Xi=(Xi1,Xi2,…Xin)到聚类中心Xk=(Xk1,Xk2,…Xkn)的欧几里得距离,并将样本划分到距离最近的簇中;
步骤A6:计算当前簇的均值作为新的聚类中心,并计算每个样本到新聚类中心的欧几里得距离,重复该步骤直到收敛,得到最终的聚类中心;
步骤A7:若聚类中心的指标大于0.5,则认为更接近于该指标为1的样本;若小于0.5,则认为更接近该指标为0的样本;若等于0.5,则与该指标为1和0的样本距离相等;
步骤A8:根据聚类中心找到距离近的样本的特征组合,保留距离近的样本的特征组合,剔除距离远的样本的特征组合;
步骤A9:根据特征组合得到判断规则;
步骤A10:计算对应规则的效果评估值;
步骤A11:返至步骤A2,重复步骤直至K为0,并结束流程。
5.根据权利要求4所述的利用实时算法实现恶意电话过滤的方法,其特征在于,所述指标包括主叫号码归属地、与上一通电话的时间间隔和主叫号码前三位号段。
6.根据权利要求4所述的利用实时算法实现恶意电话过滤的方法,其特征在于,所述步骤A9还包括以下步骤:
步骤A91:通过融合聚类的序列后向选择算法得到不同K值下的特征组合以及评估值,根据业务目标选择相应的特征组合;
步骤A92:将所选的所有特征组合的并集作为恶意电话的实时分析上线规则;
步骤A93:分别计算每个被选择的特征的信息熵,信息熵越小的特征在流程上优先判断;
步骤A94:得到最终判断流程;
步骤A95:设计恶意电话号码实时分析初始样本获取流程;
步骤A96:设计恶意电话号码实时分析与拦截流程。
7.根据权利要求6所述的利用实时算法实现恶意电话过滤的方法,其特征在于,所述步骤A95还包括以下步骤:
步骤A951:被叫号码开启恶意电话保护;
步骤A952:判断是否在t段时间内至少打了s个电话;
步骤A953:提取t段时间内前m个号码的特征;
步骤A954:获取特征的包括m个号码的归属地、m个号码的前三位号段、计算m个号码的时间间隔的平均值和标准差σ,m个号码时间间隔范围为
8.根据权利要求7所述的利用实时算法实现恶意电话过滤的方法,其特征在于,所述步骤A96还包括以下步骤:
步骤A961:将第s+1个号码与个人黑白名单进行匹配;
步骤A962:将号码进行系统匹配,包括系统白名单匹配、恶意电话黑名单匹配、系统灰名单匹配和系统黑名单匹配;
步骤A963:若号码在个人白名单里则放行接通,若号码在个人黑名单里则进行拦截;若号码在系统白名单或系统灰名单里,则放行接通;若号码在系统黑名单或恶意电话黑名单里,则进行拦截;若号码不在以上名单中,则进入下一步骤;
步骤A964:提取号码的归属地、前三位号段、与上一通电话的时间间隔、前m个号码时间间隔均值与标准差;
步骤A965:判断该号码的归属地是否与样本归属地一致,若一致则拦截,其号段和时间间隔存储至样本表中,若不一致则进入下一步骤;
步骤A966:判断号段是否与样本号段表中已有的号段一致,若一致则拦截,其归属地和时间间隔加入到样本表中,若不一致则进入下一步骤;
步骤A967:时间间隔是否在前m个号码时间间隔的范围内,若属于该范围内则拦截,其号段和归属地加入到样本表中;若不属于该范围,则进入下一步骤;
步骤A968:号码接通。
9.一种利用实时算法实现恶意电话的过滤系统,其特征在于,包括恶意电话拦截组件模块、支撑平台模块、算法模型模块和外联接口模块,恶意电话拦截组件模块实现对呼叫是否接续的判断;支撑平台模块实现包括对系统和号码库的管理;算法模型模块实现对呼叫是否为恶意电话的判断;外联接口模块用于连接外部系统。
10.根据权利要求9所述的利用实时算法实现恶意电话的过滤系统,其特征在于,所述恶意电话拦截组件模块包括个人号码库拦截、系统号码库拦截和实时算法分析拦截。
CN201610877001.3A 2016-10-08 2016-10-08 一种利用实时算法实现恶意电话过滤的方法和系统 Active CN106506769B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610877001.3A CN106506769B (zh) 2016-10-08 2016-10-08 一种利用实时算法实现恶意电话过滤的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610877001.3A CN106506769B (zh) 2016-10-08 2016-10-08 一种利用实时算法实现恶意电话过滤的方法和系统

Publications (2)

Publication Number Publication Date
CN106506769A true CN106506769A (zh) 2017-03-15
CN106506769B CN106506769B (zh) 2019-01-04

Family

ID=58294313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610877001.3A Active CN106506769B (zh) 2016-10-08 2016-10-08 一种利用实时算法实现恶意电话过滤的方法和系统

Country Status (1)

Country Link
CN (1) CN106506769B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107046593A (zh) * 2017-04-07 2017-08-15 北京安云世纪科技有限公司 一种骚扰电话拦截方法及装置
CN108696832A (zh) * 2017-04-06 2018-10-23 中国移动通信有限公司研究院 通话处理方法、装置及设备、计算机可读存储介质
CN109104702A (zh) * 2017-06-20 2018-12-28 中兴通讯股份有限公司 信息拦截方法、装置及存储介质
CN109451186A (zh) * 2018-11-06 2019-03-08 中国联合网络通信集团有限公司 一种语音拦截方法及系统
CN109587357A (zh) * 2018-11-14 2019-04-05 上海麦图信息科技有限公司 一种骚扰电话的识别方法
CN109995707A (zh) * 2017-12-29 2019-07-09 中国移动通信集团陕西有限公司 一种高清语音防骚扰和ddos攻击方法及装置
CN110809082A (zh) * 2019-10-30 2020-02-18 南京航空航天大学 一种基于私有云的骚扰电话拦截方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6330317B1 (en) * 1999-11-09 2001-12-11 Dean Garfinkel Call blocking system
CN103167500A (zh) * 2013-02-01 2013-06-19 杭州东信北邮信息技术有限公司 一种实现移动电话来电统一处理的方法和系统
CN104283851A (zh) * 2013-07-08 2015-01-14 中国电信股份有限公司 非法自动呼叫的屏蔽方法和系统以及语音鉴权设备
CN104469025A (zh) * 2014-11-26 2015-03-25 杭州东信北邮信息技术有限公司 一种基于聚类算法的实时拦截诈骗电话的方法和系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6330317B1 (en) * 1999-11-09 2001-12-11 Dean Garfinkel Call blocking system
CN103167500A (zh) * 2013-02-01 2013-06-19 杭州东信北邮信息技术有限公司 一种实现移动电话来电统一处理的方法和系统
CN104283851A (zh) * 2013-07-08 2015-01-14 中国电信股份有限公司 非法自动呼叫的屏蔽方法和系统以及语音鉴权设备
CN104469025A (zh) * 2014-11-26 2015-03-25 杭州东信北邮信息技术有限公司 一种基于聚类算法的实时拦截诈骗电话的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李建国: "优化聚类算法在异常检测中的应用", 《淮北师范大学学报(自然科学版)》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108696832A (zh) * 2017-04-06 2018-10-23 中国移动通信有限公司研究院 通话处理方法、装置及设备、计算机可读存储介质
CN107046593A (zh) * 2017-04-07 2017-08-15 北京安云世纪科技有限公司 一种骚扰电话拦截方法及装置
CN109104702A (zh) * 2017-06-20 2018-12-28 中兴通讯股份有限公司 信息拦截方法、装置及存储介质
CN109995707A (zh) * 2017-12-29 2019-07-09 中国移动通信集团陕西有限公司 一种高清语音防骚扰和ddos攻击方法及装置
CN109995707B (zh) * 2017-12-29 2021-11-02 中国移动通信集团陕西有限公司 一种高清语音防骚扰和ddos攻击方法及装置
CN109451186A (zh) * 2018-11-06 2019-03-08 中国联合网络通信集团有限公司 一种语音拦截方法及系统
CN109587357A (zh) * 2018-11-14 2019-04-05 上海麦图信息科技有限公司 一种骚扰电话的识别方法
CN109587357B (zh) * 2018-11-14 2021-04-06 上海麦图信息科技有限公司 一种骚扰电话的识别方法
CN110809082A (zh) * 2019-10-30 2020-02-18 南京航空航天大学 一种基于私有云的骚扰电话拦截方法
CN110809082B (zh) * 2019-10-30 2021-04-16 南京航空航天大学 一种基于私有云的骚扰电话拦截方法

Also Published As

Publication number Publication date
CN106506769B (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
CN106506769B (zh) 一种利用实时算法实现恶意电话过滤的方法和系统
CN108924333B (zh) 诈骗电话识别方法、装置和系统
CN104244216B (zh) 一种通话过程中实时拦截诈骗电话的方法和系统
JP3113521B2 (ja) 資源アクセス制御システム
CN106331390B (zh) 一种基于通话数据来识别诈骗号码的方法和系统
CN101472008B (zh) 对骚扰电话进行识别、控制的方法及相应的系统
CN104104772B (zh) 一种欺诈电话提示方法、服务器及系统
CN102075639A (zh) 一种国际业务通信网中恶意呼叫的拦截方法及装置
CN101217820A (zh) 一种骚扰号码的识别系统及识别方法
CN101472007A (zh) 一种确定骚扰电话的方法和系统
CN102223431A (zh) 一种防止骚扰电话的方法和系统
CN102892117A (zh) 一种骚扰电话监控系统方法及系统
CN106937007A (zh) 一种骚扰电话提醒的系统、方法及装置
CN106936997B (zh) 一种基于社交关系图谱的垃圾语音识别方法和系统
CN110072019A (zh) 一种屏蔽骚扰电话的方法及装置
CN110233940A (zh) 一种自动为用户建立通话白名单库系统
CN106302942A (zh) 一种智能拦截骚扰电话的方法
CN107295491A (zh) 呼叫转移时自动筛选主叫用户的方法及系统
CN101945006B (zh) 一种异常呼叫的检测方法
CN107733900B (zh) 一种通信网用户异常呼叫行为检测预警方法
CN102438243A (zh) 一种分析电话频次识别骚扰电话的方法
CN107026939A (zh) 一种外出活动情形应答处理来电呼叫的系统
CN110167030B (zh) 识别骚扰电话的方法、装置、电子设备和存储介质
CN114169438A (zh) 一种电信网络诈骗识别方法、装置、设备及存储介质
CN110445944A (zh) 呼叫中心防止电话骚扰的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant