CN107819924A - 一种垃圾电话号码的识别方法、装置及设备 - Google Patents

一种垃圾电话号码的识别方法、装置及设备 Download PDF

Info

Publication number
CN107819924A
CN107819924A CN201711079467.XA CN201711079467A CN107819924A CN 107819924 A CN107819924 A CN 107819924A CN 201711079467 A CN201711079467 A CN 201711079467A CN 107819924 A CN107819924 A CN 107819924A
Authority
CN
China
Prior art keywords
amount
caller
node
telephone number
called
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711079467.XA
Other languages
English (en)
Inventor
王阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201711079467.XA priority Critical patent/CN107819924A/zh
Publication of CN107819924A publication Critical patent/CN107819924A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • H04M1/663Preventing unauthorised calls to a telephone set
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明提供一种垃圾电话的识别方法、装置及设备,该识别方法通过获得通话记录,从而获取通话记录中各电话号码的主叫量和被叫量,以及各电话号码与其他电话号码之间的互拨量,由于一般情况下,垃圾电话号码具有主叫量很多,被叫量和互拨量很少的特点,因此,根据垃圾电话号码的特点和通话记录中所述电话号码的主叫量、被叫量以及互拨量,可以判断出所述电话号码是否为垃圾电话号码。这样,可以直接根据通话记录识别出垃圾号码,避免了在人为标记过程中用户通过接听电话来进行识别,导致用户已经受到了垃圾电话的干扰的问题,从而无需人为标记,实现垃圾电话号码的识别。

Description

一种垃圾电话号码的识别方法、装置及设备
技术领域
本发明涉及电话通信领域,特别涉及一种垃圾电话的识别方法、装置及设备。
背景技术
随着移动通信技术的快速发展,垃圾电话也越来越广泛,垃圾电话的呼出方向大量用户发起呼叫,被叫用户接听此类垃圾电话时,接听到的多为用户并不关心的广告或诈骗信息等垃圾信息,对被叫用户造成不必要的困扰。
目前,主要是通过标记的方式来标记垃圾电话号码,一种方式是在用户的移动终端中进行标记,在被叫用户接听电话之后,将认为是垃圾电话的号码标记为垃圾电话号码,之后,当该垃圾电话号码发起呼叫时,可以屏蔽或者呼入时提示该电话号码为垃圾电话,而该方法是基于被叫用户的终端进行的,用户仍需要通过接听电话来识别垃圾电话,不同用户间的标记信息也是孤立的。另一种方式是利用垃圾电话拦截软件进行标记,在用户终端中安装拦截软件,例如360手机卫士、百度手机卫士、金山手机毒霸等,当用户接听电话之后,将认为是垃圾电话的号码标记为垃圾电话号码,其他安装有相同拦截软件的用户,在接到相同的电话号码的来电时,将会显示该号码被标记为垃圾号码的数量,被叫用户可以根据标记情况决定是否接听该电话。
然而,这些识别方法都需要被叫用户进行标记,在标记过程中用户通过接听电话来进行识别,该过程中用户已经不可避免地受到了垃圾电话的干扰。
发明内容
有鉴于此,本发明的目的在于提供一种垃圾电话的识别方法、装置及设备,无需人为标记,实现垃圾电话号码的识别。
为实现上述目的,本发明有如下技术方案:
第一方面,本发明提供一种垃圾电话号码的识别方法,所述方法包括:
获取通话记录;
获得所述通话记录中各电话号码的主叫量、被叫量和互拨量,所述主叫量为一电话号码呼出的不同电话号码的数量,所述被叫量为一电话号码被呼叫的不同电话号码的数量,所述互拨量为一电话号码呼出并被呼叫的不同电话号码的数量;
根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码。
可选的,所述根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码,包括:
判断各所述电话号码的主叫量是否大于第一阈值,被叫量是否小于第二阈值,以及互拨量是否小于第三阈值,若是,则认为所述电话号码为垃圾电话号码。
可选的,所述根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码,包括:
获得各所述电话号码的被叫量与主叫量的比值;
判断所述比值是否小于第四阈值,以及互拨量是否小于第五阈值,若是,则认为所述电话号码为垃圾电话号码。
可选的,所述获得所述通话记录中各电话号码的主叫量、被叫量和互拨量,包括:
通过所述通话记录构建通话网络,其中,每个电话号码为所述通话网络中的一个节点,节点与节点之间通过有向边连接,所述有向边从主叫节点指向被叫节点;
通过统计所述通话网络中有向边的数量,获得所述通话记录中各电话号码的主叫量、被叫量和互拨量。
可选的,所述根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码,包括:
通过各所述电话号码的主叫量和被叫量,获得所述通话网络的平均主叫量和平均被叫量;
通过所述通话网络中的有向边,获得平均回拨率,其中,所述平均回拨率等于所述通话网络中双向有向边数量的两倍与所述通话网络中所有有向边数量的比值;
通过所述通话网络中各节点的主叫量和互拨量,获得各节点的节点回拨率,其中,所述节点回拨率等于节点的双向有向边数量与节点的主叫量的比值;
判断各所述电话号码的主叫量是否大于所述平均主叫量,被叫量是否小于所述平均被叫量,以及节点回拨率是否小于所述平均互拨率,若是,则认为所述电话号码为垃圾电话号码。
第二方面,本发明提供一种垃圾电话号码的识别装置,所述装置包括:
通话记录获取单元,用于获取通话记录;
通话量获取单元,用于获得所述通话记录中各电话号码的主叫量、被叫量和互拨量,所述主叫量为一电话号码呼出的不同电话号码的数量,所述被叫量为一电话号码被呼叫的不同电话号码的数量,所述互拨量为一电话号码呼出并被呼叫的不同电话号码的数量;
垃圾电话判断单元,用于根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码。
可选的,所述垃圾电话判断单元包括第一判断单元,用于判断各所述电话号码的主叫量是否大于第一阈值,被叫量是否小于第二阈值,以及互拨量是否小于第三阈值,若是,则认为所述电话号码为垃圾电话号码。
可选的,所述垃圾电话判断单元包括:
比值获取单元,用于获得各所述电话号码的被叫量与主叫量的比值;
第二判断单元,用于判断所述比值是否小于第四阈值,以及互拨量是否小于第五阈值,若是,则认为所述电话号码为垃圾电话号码。
可选的,所述通话量获取单元包括:
通话网络构建单元,用于通过所述通话记录构建通话网络,其中,每个电话号码为所述通话网络中的一个节点,节点与节点之间通过有向边连接,所述有向边从主叫节点指向被叫节点;
统计单元,用于通过统计所述通话网络中的有向边的数量,获得所述通话记录中各电话号码的主叫量和被叫量,以及各电话号码与其他电话号码之间的互拨量。
可选的,所述垃圾电话判断单元包括:
平均通话量获取单元,用于通过各所述电话号码的主叫量和被叫量,获得所述通话网络的平均主叫量和平均被叫量;
平均回拨率获取单元,用于通过所述通话网络中的有向边,获得平均回拨率,其中,所述平均回拨率等于所述通话网络中双向有向边数量的两倍与所述通话网络中所有有向边数量的比值;
节点回拨率获取单元,用于通过所述通话网络中各节点的主叫量和互拨量,获得各节点的节点回拨率,其中,所述节点回拨率等于节点的双向有向边数量与节点的主叫量的比值;
第三判断单元,用于判断各所述电话号码的主叫量是否大于所述平均主叫量,被叫量是否小于所述平均被叫量,以及节点回拨率是否小于所述平均互拨率,若是,则认为所述电话号码为垃圾电话号码。
第三方面,本发明提供一种存储介质,所述存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行第一方面所述方法中任一项所述的垃圾电话的识别方法。
第四方面,本发明提供一种服务器设备,包括存储器和处理器,
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行第一方面所述方法中任一项所述的垃圾电话的识别方法。
本发明实施例提供的垃圾电话的识别方法、装置及设备,由于运营商可以提供通话记录,通过该通话记录可以获得各个电话号码的通话情况。因此,该识别方法通过获得通话记录,从而获取通话记录中各电话号码的主叫量和被叫量,以及各电话号码与其他电话号码之间的互拨量,由于一般情况下,垃圾电话号码具有主叫量很多,被叫量和互拨量很少的特点,因此,根据垃圾电话号码的特点和通话记录中所述电话号码的主叫量、被叫量以及互拨量,可以判断出所述电话号码是否为垃圾电话号码。这样,可以直接根据通话记录识别出垃圾号码,避免了在人为标记过程中用户通过接听电话来进行识别,导致用户已经受到了垃圾电话的干扰的问题,从而无需人为标记,实现垃圾电话号码的识别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了根据本发明实施例的硬件场景示例图;
图2示出了根据本发明实施例的一种垃圾电话的识别方法的流程图;
图3示出了根据本发明实施例的通话网络示例图;
图4示出了根据本发明实施例的根据通话记录构建的通话网络示例图;
图5示出了根据本发明实施例的一种基于通话网络识别垃圾电话号码的方法的流程图;
图6示出了根据本发明实施例的一种垃圾电话的识别装置的结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
举例说明,本发明实施例可以应用到如图1所示的场景。在所述场景下,运营商服务器101与服务器102进行交互,也即,服务器102可以从运营商服务器101获取通话记录,服务器102根据获取的通话记录识别出通话记录包括的各电话号码中的垃圾电话号码。
具体地,运营商服务器101中记录有通话记录,服务器102从运营商服务器101获取通话记录,并获得所述通话记录中各电话号码的主叫量和被叫量,以及各电话号码与其他电话号码之间的互拨量,从而根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码,从而判断出通话记录中的电话号码是否为垃圾电话号码,若服务器102识别出该电话号码为垃圾电话号码,服务器102可以将该垃圾电话号码发送给运营商服务器101,以便在该垃圾电话号码进行主叫时,运营商服务器101可以对用户进行提示。
可以理解的是,服务器102可以是一个独立于运营商服务器101的服务器,也可以是运营商服务器101。
需要注意的是,上述应用场景仅是为了便于理解本发明而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
下面结合附图,详细说明本申请实施例是如何识别垃圾电话号码的。
参见图2,图2为本申请实施例提供的一种垃圾电话号码的识别方法的流程图包括:
S201、获取通话记录。
通话记录可以来自于运营商,运营商为提供电话服务的提供商,通话记录具体可以从运营商服务器上获取或者从其他的数据来源获取,通话记录可以来自于一个或多个不同的运营商。
以从运营商服务器上获取通话记录为例,通话记录可以是指固定电话用户、移动电话用户发起的主叫通话、被叫通话等通话行为在运营商服务器里记录的各种信息。其中,所述信息可以包括发起主叫的电话号码、以及与该主叫对应的被叫电话号码。
例如,电话号码A发起主叫,该主叫所呼叫的电话号码是B,那么,运营商服务器会记录该电话号码A以及该电话号码B,并记录该电话号码A为主叫,该电话号码B为被叫等信息。
所述通话记录可以是运营商提供的某一段时间的通话记录,也可以是运营商提供的某个区域的通话记录,也可以是运营商提供的来自某个服务器上的通话记录。
S202、获得所述通话记录中各电话号码的主叫量、被叫量和互拨量,所述主叫量为一电话号码呼出的不同电话号码的数量,所述被叫量为一电话号码被呼叫的不同电话号码的数量,所述互拨量为一电话号码呼出并被呼叫的不同电话号码的数量。
由于运营商提供的通话记录中记录了各电话号码,对于该各电话号码中的一个电话号码来说,该电话号码可以作为主叫,即该电话号码主动呼叫其他电话号码,该电话号码也可以被叫,即该电话号码被其他电话号码呼叫,该电话号码还可以与其他电话号码进行互拨,即该电话号码呼出其他号码并被该其他电话号码呼叫。因此,服务器在从运营商获取通话记录后,可以根据通话记录中记录的各电话号码等信息统计出各电话号码的主叫量、被叫量和互拨量。
需要说明的是,所述主叫量表示一电话号码呼出的不同电话号码的数量,即使该电话号码向同一个电话号码进行多次呼叫,由于该多次呼叫所针对的是同一个电话号码,因此,该多次呼叫的主叫量记作一;所述被叫量为一电话号码被呼叫的不同电话号码的数量,即使该电话号码多次被同一个电话号码呼叫,由于该多次被呼叫所针对的是同一个电话号码,因此,该多次被呼叫的被叫量记作一;所述互拨量为一电话号码呼出并被呼叫的不同电话号码的数量,即使该电话号码对同一个电话号码进行多次呼出并被呼叫,由于该多次呼出并被呼叫所针对的是同一个电话号码,因此,该多次呼出并被呼叫的互拨量记作一。
例如,该通话记录中包括了电话号码A、B、C和D,对于电话号码A来说,电话号码A主动呼叫电话号码B一次,电话号码A主动呼叫电话号码C三次,电话号码A主动呼叫电话号码D两次,电话号码A被电话号码D呼叫两次,那么,由于电话号码A呼出三个不同的电话号码,即电话号码B、C和D,所以电话号码A的主叫量为三;由于电话号码A被一个电话号码呼叫,即电话号码D,所以电话号码A的被叫量为一,由于电话号码A呼叫了电话号码D,电话号码A又被电话号码D呼叫,因此,电话号码A和电话号码D可以称为互拨,电话号码A呼出并被呼叫的电话号码为电话号码D这一个电话号码,因此,电话号码A的互拨量为一。
作为一种示例,在本实施例中,获得所述通话记录中各电话号码的主叫量、被叫量和互拨量的一种实现方式可以是:首先,利用从运营商服务器上获得的通话记录构建通话网络,所述通话网络可以由节点和有向边组成,其中,每个电话号码为所述通话网络中的一个节点,节点与节点之间可以通过有向边连接,所述有向边从主叫节点指向被叫节点。其中,通话网络中的有向边可以表示通话记录中各电话号码主叫、被叫以及互拨情况。然后,服务器可以统计所述通话网络中有向边的数量,获得所述通话记录中各电话号码的主叫量、被叫量,以及互拨量。
在本实施例中,有向边在通话网络中的存储方式可以是为每个节点设置ID,例如边e12由节点1和节点2确定,节点1的ID为ID1,节点2的ID为ID2,通过ID1和ID2确定有向边e12=(ID1,ID2),有向边e12可以存入边集合E。表现在图中,有向边可以由两个节点之间的有向线段表示,参见图3。
对于一个节点来说,与该节点直接连接的有向边可以包括由该节点指向其他节点的有向边,例如图3中的有向边AB和AC,由该节点指向其他节点的有向边可以用于统计该节点的主叫量,即统计该节点指向其他节点的有向边的数量;与该节点直接连接的有向边也可以包括由其他节点指向该节点的有向边,例如图3中的有向边CA和DA,由其他节点指向该节点的有向边可以用于统计该节点的被叫量,即统计其他节点指向该节点的有向边的数量;与该节点直接连接的有向边还可以包括该节点与其他节点相互指向的有向边,例如图3中节点A和节点C之间的双向线段,该节点与其他节点相互指向的有向边可以用于统计该节点的互拨量,即统计该节点与其他节点相互指向的有向边的数量。
下面结合具体示例说明通话网络的构建,以及如何获得所述通话记录中各电话号码的主叫量、被叫量,以及互拨量的。
作为一种示例,通话记录可以来自运营商服务器,运营商服务器中记录有如下通话记录:
A,B(第一条记录A,B表示主叫是A、被叫是B);
A,C(第二条记录A,C表示主叫是A、被叫是C);
A,D(第三条记录A,D表示主叫是A、被叫是D);
B,D(第四条记录B,D表示主叫是B、被叫是D);
D,A(第五条记录D,A表示主叫是D、被叫是A);
D,B(第六条记录D,B表示主叫是D、被叫是B)。
上述通话记录中出现电话号码A、B、C和D,将上述电话号码A、B、C和D作为构建通话网络的节点,通话网络中的有向边根据通话记录中各电话号码的主叫、被叫情况,由主叫节点指向被叫节点,最终得到该通话网络,如图4所示。
在上述通话记录中,前三条通话记录以电话号码A为主叫,电话号码B、C和D分别作为被叫,因此,在构建通话网络时,如图4所示,存在三条由节点A出发,分别指向节点B、C和D的有向边。第四条通话记录以电话号码B作为主叫,电话号码D作为被叫,因此,在构建通话网络时,如图4所示,存在一条由节点B出发,指向节点D的有向边。第五条通话记录和第六条通话记录以电话号码D作为主叫,电话号码A和B分别作为被叫,因此,在构建通话网络时,如图4所示,存在两条由节点D出发,分别指向节点A和B的有向边。因此,根据上述构建的通话网络,对于节点A来说,可以统计出由节点A出发的有向边为三条,即节点A的主叫量为3;指向节点A的有向边为一条,即节点A的被叫量为1;与节点A互相指向的有向边为一条,该有向边为节点A与节点D之间的双向有向边,即节点A的互拨量为1。采用类似的统计方法,可以统计出节点B的主叫量为1、被叫量为2、互拨量为1;节点C的主叫量为0、被叫量为1、互拨量为0;节点D的主叫量为2、被叫量为2、互拨量为2。
S203、根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码。
由于一般情况下,垃圾电话号码是由垃圾电话的呼出方向大量用户发起呼叫,从而向用户播放用户并不关心的广告或对用户进行诈骗行为或获取用户的信息,也就是说,垃圾电话号码一般是作为主叫方,以发起主叫为主,很少会有用户主动呼叫垃圾电话号码,也很少会有用户与垃圾电话号码进行互拨,因此,垃圾电话号码具有主叫量很多,被叫量和互拨量很少的特点,服务器可以根据获得的各所述电话号码的主叫量、被叫量以及互拨量,并结合垃圾电话号码的特点判断出所述电话号码是否为垃圾电话号码。
根据垃圾电话号码具有主叫量很多,被叫量和互拨量很少的特点,在本实施例的一种实现方式中,服务器根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码时,可以分别对主叫量、被叫量和互拨量进行判断,例如,服务器可以判断各所述电话号码的主叫量是否大于第一阈值,被叫量是否小于第二阈值,以及互拨量是否小于第三阈值,若服务器判断主叫量大于第一阈值,被叫量小于第二阈值,且互拨量小于第三阈值,则认为所述电话号码为垃圾电话号码。其中,所述第一阈值,第二阈值,以及第三阈值可以是根据经验预先设定的。
垃圾电话号码具有主叫量很多,被叫量和互拨量很少的特点,更进一步地,垃圾电话号码的主叫量不仅很多,而且远多于被叫量,在一些情况下,通话记录中的某个电话号码是垃圾电话号码,其主叫量可能并没有达到第一阈值,但是其主叫量远多于被叫量,在这种情况下,为了使得对该电话号码是否为垃圾电话号码的判断准确,服务器在根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码时,可以对该电话号码的被叫量与主叫量之间的差距进行判断,其中,所述被叫量与主叫量之间的差距可以用该电话号码的被叫量与主叫量的比值表示,例如,服务器可以获得各所述电话号码的被叫量与主叫量的比值,判断所述比值是否小于第四阈值,以及互拨量是否小于第五阈值,若所述比值小于第四阈值,且互拨量小于第五阈值,则认为所述电话号码为垃圾电话号码。其中,所述第四阈值,以及第五阈值可以是根据经验预先设定的。
当服务器根据上述判断,识别出通话记录中的某个或某些电话号码为垃圾电话号码时,该服务器可以将识别出的垃圾电话号码发送给运营商,例如运营商服务器,在运营商服务器上对该垃圾电话号码进行标定,这样,当有垃圾电话号码进行主叫时,运营商服务器可以同时向被叫用户发送垃圾电话的提示,避免用户受到垃圾电话的干扰。这样,利用本发明实施例所提供的识别垃圾电话号码方法识别出的垃圾电话号码可以被所有用户共享,只要是该垃圾电话号码进行主叫,无论被叫用户是谁,运营商服务器都可以给予被叫用户提示,避免用户收到垃圾电话的干扰。
本发明实施例提供的垃圾电话的识别方法,由于运营商可以提供通话记录,通过该通话记录可以获得各个电话号码的通话情况。因此,该识别方法通过获得通话记录,从而获取通话记录中各电话号码的主叫量和被叫量,以及各电话号码与其他电话号码之间的互拨量,由于一般情况下,垃圾电话号码具有主叫量很多,被叫量和互拨量很少的特点,因此,根据垃圾电话号码的特点和通话记录中所述电话号码的主叫量、被叫量以及互拨量,可以判断出所述电话号码是否为垃圾电话号码。这样,可以直接根据通话记录识别出垃圾号码,避免了在人为标记过程中用户通过接听电话来进行识别,导致用户已经受到了垃圾电话的干扰的问题,从而无需人为标记,实现垃圾电话号码的识别。
前述介绍了一种垃圾电话号码的识别方法,在该方法中,需要根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码,从而实现对垃圾电话号码的识别。由于统计各所述电话号码的主叫量、被叫量以及互拨量的一种实现方式可以是基于通话网络进行统计,因此,在通话网络的基础上,本实施例提供了一种基于通话网络识别垃圾电话号码的方法。
参见图5,图5示出了一种基于通话网络识别垃圾电话号码的方法的流程图,该方法包括:
S501、通过各所述电话号码的主叫量和被叫量,获得所述通话网络的平均主叫量和平均被叫量。
需要说明的是,所述平均主叫量可以根据所述通话网络中各个节点的主叫量之和与所述通话网络中节点个数进行计算,例如,所述平均主叫量可以为所述通话网络中各个节点的主叫量之和与所述通话网络中节点个数的比值。相应地,所述平均被叫量可以根据所述通话网络中各个节点的被叫量之和与所述通话网络中节点个数进行计算,例如,所述平均被叫量可以为所述通话网络中各个节点的被叫量之和与所述通话网络中节点个数的比值。
以前述提供的通话记录和图4中构建的通话网络为例,由前述介绍可知节点A的主叫量为3、被叫量为1;节点B的主叫量为1、被叫量为2;节点C的主叫量为0、被叫量为1;节点D的主叫量为2、被叫量为2。
因此,按照上述提供的平均主叫量的计算方法,该通话网络的平均主叫量为节点A的主叫量、节点B的主叫量、节点C的主叫量和节点D的主叫量之和与该通话网络中节点个数的比值,其中,节点A的主叫量、节点B的主叫量、节点C的主叫量和节点D的主叫量之和即(3+1+0+2),该通话网络中节点个数为4,因此,所述平均主叫量是(3+1+0+2)/4=1.5。
按照上述提供的平均被叫量的计算方法,该通话网络的平均被叫量为节点A的被叫量、节点B的被叫量、节点C的被叫量和节点D的被叫量之和与该通话网络中节点个数的比值,其中,节点A的被叫量、节点B的被叫量、节点C的被叫量和节点D的被叫量之和即(1+2+1+2),该通话网络中节点个数为4,因此,所述平均主叫量是(1+2+1+2)/4=1.5。
S502、通过所述通话网络中的有向边,获得平均回拨率,其中,所述平均回拨率等于所述通话网络中双向有向边数量的两倍与所述通话网络中所有有向边数量的比值。
以前述提供的通话记录和图4中构建的通话网络为例,在图4中所述双向有向边包括节点A和节点D之间的双向有向边,以及节点B和节点D之间的双向有向边,其中,所述节点A和节点D之间的双向有向边表示节点A和节点D之间相互给对方拨打过电话,所述节点B和节点D之间的双向有向边表示节点B和节点D之间相互给对方拨打过电话。因此,所述通话网络中双向有向边数量为2。
由于,有向边是指从主叫节点指向被叫节点,即存在从主叫节点指向被叫节点边则记作一条有向边,对于图4中例如节点A和节点D之间的双向有向边来说,该双向有向边既存在从节点A指向节点D,也存在从节点D指向节点A,因此,双向有向边记作两条有向边。即图4中所述通话网络中所有有向边包括有向边AB(节点A指向节点B),有向边AC(节点A指向节点C),有向边AD(节点A指向节点D),有向边BD(节点B指向节点D),有向边DA(节点D指向节点A)和有向边DB(节点D指向节点B),有向边数量为6。
通过上述分析,按照S502的平均回拨率的计算方法,在图4中,平均回拨率等于所述通话网络中双向有向边数量的两倍与所述通话网络中所有有向边数量的比值,即2×2/6=0.667。
S503、通过所述通话网络中各节点的主叫量和互拨量,获得各节点的节点回拨率,其中,所述节点回拨率等于节点的双向有向边数量与节点的主叫量的比值。
以前述提供的通话记录和图4中构建的通话网络为例,由前述介绍可知节点A的主叫量为3、互拨量为1;节点B的主叫量为1、互拨量为1;节点C的主叫量为0、互拨量为0;节点D的主叫量为2、互拨量为2。
在图4中节点A的双向有向边数量为1,节点B的双向有向边数量为1,节点C的双向有向边数量为0,节点D的双向有向边数量为2。
因此,按照S503提供的计算各节点的节点回拨率的方法,节点A的回拨率等于节点A的双向有向边数量与节点A的主叫量的比值,即1/3=0.33;节点B的回拨率等于节点B的双向有向边数量与节点B的主叫量的比值,即0/1=0;节点C的回拨率等于节点C的双向有向边数量与节点C的主叫量的比值,即0/0=0;节点D的回拨率等于节点D的双向有向边数量与节点D的主叫量的比值,即2/2=1。
S504、判断各所述电话号码的主叫量是否大于所述平均主叫量,被叫量是否小于所述平均被叫量,以及节点回拨率是否小于所述平均互拨率,若是,则认为所述电话号码为垃圾电话号码。
在本实施例中,以通话网络的平均主叫量、平均被叫量和平均互拨率作为判断所述电话号码是否为垃圾电话号码的条件,即所述平均主叫量可以作为所述第一阈值,所述平均被叫量可以作为所述第二阈值,所述平均互拨率可以作为所述第三阈值。
需要说明的是,本实施例对S501-S503的执行顺序不做限定,只要在执行S504之前通过执行S501-S503获得平均主叫量、平均被叫量、平均回拨率和节点回拨率即可。
在本实施例中,判断是否为垃圾电话号码的第一至第三阈值通过通话网络中的平均主叫量、平均被叫量和平均互拨率来确定,使得阈值的设置更为合理,这样,在对每个节点进行判断时,可以更为精准和有效地判断出该节点是否为垃圾电话号码。这样,可以直接根据通话记录识别出垃圾号码,避免了在人为标记过程中用户通过接听电话来进行识别,导致用户已经受到了垃圾电话的干扰的问题,从而无需人为标记,实现垃圾电话号码的识别。
基于前述提供的一种垃圾电话的识别方法,本实施例提供一种垃圾电话的识别装置。参见图6,图6示出了一种垃圾电话的识别装置的结构图,所述装置包括:
通话记录获取单元601,用于获取通话记录;
通话量获取单元602,用于获得所述通话记录中各电话号码的主叫量、被叫量和互拨量,所述主叫量为一电话号码呼出的不同电话号码的数量,所述被叫量为一电话号码被呼叫的不同电话号码的数量,所述互拨量为一电话号码呼出并被呼叫的不同电话号码的数量;
垃圾电话判断单元603,用于根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码。
可选的,所述垃圾电话判断单元603包括第一判断单元,用于判断各所述电话号码的主叫量是否大于第一阈值,被叫量是否小于第二阈值,以及互拨量是否小于第三阈值,若是,则认为所述电话号码为垃圾电话号码。
可选的,所述垃圾电话判断单元603包括:
比值获取单元,用于获得各所述电话号码的被叫量与主叫量的比值;
第二判断单元,用于判断所述比值是否小于第四阈值,以及互拨量是否小于第五阈值,若是,则认为所述电话号码为垃圾电话号码。
可选的,所述通话量获取单元602包括:
通话网络构建单元,用于通过所述通话记录构建通话网络,其中,每个电话号码为所述通话网络中的一个节点,节点与节点之间通过有向边连接,所述有向边从主叫节点指向被叫节点;
统计单元,用于通过统计所述通话网络中的有向边的数量,获得所述通话记录中各电话号码的主叫量和被叫量,以及各电话号码与其他电话号码之间的互拨量。
可选的,所述垃圾电话判断单元603包括:
平均通话量获取单元,用于通过各所述电话号码的主叫量和被叫量,获得所述通话网络的平均主叫量和平均被叫量;
平均回拨率获取单元,用于通过所述通话网络中的有向边,获得平均回拨率,其中,所述平均回拨率等于所述通话网络中双向有向边数量的两倍与所述通话网络中所有有向边数量的比值;
节点回拨率获取单元,用于通过所述通话网络中各节点的主叫量和互拨量,获得各节点的节点回拨率,其中,所述节点回拨率等于节点的双向有向边数量与节点的主叫量的比值;
第三判断单元,用于判断各所述电话号码的主叫量是否大于所述平均主叫量,被叫量是否小于所述平均被叫量,以及节点回拨率是否小于所述平均互拨率,若是,则认为所述电话号码为垃圾电话号码。
基于前述提供的一种垃圾电话的识别方法和装置,本实施例提供一种存储介质,所述存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行前述实施例中所述方法的任一项垃圾电话的识别方法。
基于前述提供的一种垃圾电话的识别方法、装置和存储介质,本实施例提供一种服务器设备,包括存储器和处理器,
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行前述实施例中所述方法的任一项垃圾电话的识别方法。
本发明实施例提供的垃圾电话的识别装置、存储介质及设备,通过获得通话记录,从而获取通话记录中各电话号码的主叫量和被叫量,以及各电话号码与其他电话号码之间的互拨量,由于一般情况下,垃圾电话号码具有主叫量很多,被叫量和互拨量很少的特点,因此,根据垃圾电话号码的特点和通话记录中所述电话号码的主叫量、被叫量以及互拨量,可以判断出所述电话号码是否为垃圾电话号码。这样,可以直接根据通话记录识别出垃圾号码,避免了在人为标记过程中用户通过接听电话来进行识别,导致用户已经受到了垃圾电话的干扰的问题,从而无需人为标记,实现垃圾电话号码的识别。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明实施例所提供的一种垃圾电话的识别方法、装置及设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种垃圾电话号码的识别方法,其特征在于,所述方法包括:
获取通话记录;
获得所述通话记录中各电话号码的主叫量、被叫量和互拨量,所述主叫量为一电话号码呼出的不同电话号码的数量,所述被叫量为一电话号码被呼叫的不同电话号码的数量,所述互拨量为一电话号码呼出并被呼叫的的不同电话号码的数量;
根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码。
2.根据权利要求1所述的识别方法,其特征在于,所述根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码,包括:
判断各所述电话号码的主叫量是否大于第一阈值,被叫量是否小于第二阈值,以及互拨量是否小于第三阈值,若是,则认为所述电话号码为垃圾电话号码。
3.根据权利要求1所述的识别方法,其特征在于,所述根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码,包括:
获得各所述电话号码的被叫量与主叫量的比值;
判断所述比值是否小于第四阈值,以及互拨量是否小于第五阈值,若是,则认为所述电话号码为垃圾电话号码。
4.根据权利要求1-3中任一项所述的识别方法,其特征在于,所述获得所述通话记录中各电话号码的主叫量、被叫量和互拨量,包括:
通过所述通话记录构建通话网络,其中,每个电话号码为所述通话网络中的一个节点,节点与节点之间通过有向边连接,所述有向边从主叫节点指向被叫节点;
通过统计所述通话网络中有向边的数量,获得所述通话记录中各电话号码的主叫量、被叫量和互拨量。
5.根据权利要求4所述的识别方法,其特征在于,所述根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码,包括:
通过各所述电话号码的主叫量和被叫量,获得所述通话网络的平均主叫量和平均被叫量;
通过所述通话网络中的有向边,获得平均回拨率,其中,所述平均回拨率等于所述通话网络中双向有向边数量的两倍与所述通话网络中所有有向边数量的比值;
通过所述通话网络中各节点的主叫量和互拨量,获得各节点的节点回拨率,其中,所述节点回拨率等于节点的双向有向边数量与节点的主叫量的比值;
判断各所述电话号码的主叫量是否大于所述平均主叫量,被叫量是否小于所述平均被叫量,以及节点回拨率是否小于所述平均互拨率,若是,则认为所述电话号码为垃圾电话号码。
6.一种垃圾电话号码的识别装置,其特征在于,包括:
通话记录获取单元,用于获取通话记录;
通话量获取单元,用于获得所述通话记录中各电话号码的主叫量、被叫量和互拨量,所述主叫量为一电话号码呼出的不同电话号码的数量,所述被叫量为一电话号码被呼叫的的不同电话号码的数量,所述互拨量为一电话号码呼出并被呼叫的的不同电话号码的数量;
垃圾电话判断单元,用于根据各所述电话号码的主叫量、被叫量以及互拨量,判断所述电话号码是否为垃圾电话号码。
7.根据权利要求6中任一项所述的装置,其特征在于,所述通话量获取单元包括:
通话网络构建单元,用于通过所述通话记录构建通话网络,其中,每个电话号码为所述通话网络中的一个节点,节点与节点之间通过有向边连接,所述有向边从主叫节点指向被叫节点;
统计单元,用于通过统计所述通话网络中的有向边的数量,获得所述通话记录中各电话号码的主叫量和被叫量,以及各电话号码与其他电话号码之间的互拨量。
8.根据权利要求7所述的装置,其特征在于,所述垃圾电话判断单元包括:
平均通话量获取单元,用于通过各所述电话号码的主叫量和被叫量,获得所述通话网络的平均主叫量和平均被叫量;
平均回拨率获取单元,用于通过所述通话网络中的有向边,获得平均回拨率,其中,所述平均回拨率等于所述通话网络中双向有向边数量的两倍与所述通话网络中所有有向边数量的比值;
节点回拨率获取单元,用于通过所述通话网络中各节点的主叫量和互拨量,获得各节点的节点回拨率,其中,所述节点回拨率等于节点的双向有向边数量与节点的主叫量的比值;
第三判断单元,用于判断各所述电话号码的主叫量是否大于所述平均主叫量,被叫量是否小于所述平均被叫量,以及节点回拨率是否小于所述平均互拨率,若是,则认为所述电话号码为垃圾电话号码。
9.一种存储介质,其特征在于,所述存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1-5中任一项所述的垃圾电话的识别方法。
10.一种服务器设备,其特征在于,包括存储器和处理器,
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
所述处理器用于根据所述程序代码中的指令,执行权利要求1-5中任一项所述的垃圾电话的识别方法。
CN201711079467.XA 2017-11-06 2017-11-06 一种垃圾电话号码的识别方法、装置及设备 Pending CN107819924A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711079467.XA CN107819924A (zh) 2017-11-06 2017-11-06 一种垃圾电话号码的识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711079467.XA CN107819924A (zh) 2017-11-06 2017-11-06 一种垃圾电话号码的识别方法、装置及设备

Publications (1)

Publication Number Publication Date
CN107819924A true CN107819924A (zh) 2018-03-20

Family

ID=61604781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711079467.XA Pending CN107819924A (zh) 2017-11-06 2017-11-06 一种垃圾电话号码的识别方法、装置及设备

Country Status (1)

Country Link
CN (1) CN107819924A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109474756A (zh) * 2018-11-16 2019-03-15 国家计算机网络与信息安全管理中心 一种基于协同网络表示学习的电信异常检测方法
WO2023182645A1 (ko) * 2022-03-23 2023-09-28 삼성전자 주식회사 스팸 통화를 탐지하는 전자 장치 및 그 동작 방법

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2241227A1 (en) * 1995-12-22 1997-06-26 Jens L. Moller Telephone fraud detection system
CN101674264A (zh) * 2009-10-20 2010-03-17 哈尔滨工程大学 基于用户关系挖掘及信誉评价的垃圾邮件检测装置及方法
KR20100058964A (ko) * 2008-11-25 2010-06-04 한국정보보호진흥원 스팸 지수를 이용한 인터넷 전화서비스 스팸 차단 장치
CN103095889A (zh) * 2013-01-07 2013-05-08 上海欣方智能系统有限公司 一种基于通话模式识别的垃圾呼叫拦截系统及其工作方法
CN104320525A (zh) * 2014-09-19 2015-01-28 小米科技有限责任公司 电话号码识别方法及装置
CN104469025A (zh) * 2014-11-26 2015-03-25 杭州东信北邮信息技术有限公司 一种基于聚类算法的实时拦截诈骗电话的方法和系统
CN106954218A (zh) * 2017-03-15 2017-07-14 中国联合网络通信集团有限公司 一种骚扰号码分类方法、装置和系统
CN107172264A (zh) * 2017-04-10 2017-09-15 广东小天才科技有限公司 一种移动终端的来电处理方法及装置
CN107220316A (zh) * 2017-05-17 2017-09-29 华为机器有限公司 一种通信数据分析方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2241227A1 (en) * 1995-12-22 1997-06-26 Jens L. Moller Telephone fraud detection system
KR20100058964A (ko) * 2008-11-25 2010-06-04 한국정보보호진흥원 스팸 지수를 이용한 인터넷 전화서비스 스팸 차단 장치
CN101674264A (zh) * 2009-10-20 2010-03-17 哈尔滨工程大学 基于用户关系挖掘及信誉评价的垃圾邮件检测装置及方法
CN103095889A (zh) * 2013-01-07 2013-05-08 上海欣方智能系统有限公司 一种基于通话模式识别的垃圾呼叫拦截系统及其工作方法
CN104320525A (zh) * 2014-09-19 2015-01-28 小米科技有限责任公司 电话号码识别方法及装置
CN104469025A (zh) * 2014-11-26 2015-03-25 杭州东信北邮信息技术有限公司 一种基于聚类算法的实时拦截诈骗电话的方法和系统
CN106954218A (zh) * 2017-03-15 2017-07-14 中国联合网络通信集团有限公司 一种骚扰号码分类方法、装置和系统
CN107172264A (zh) * 2017-04-10 2017-09-15 广东小天才科技有限公司 一种移动终端的来电处理方法及装置
CN107220316A (zh) * 2017-05-17 2017-09-29 华为机器有限公司 一种通信数据分析方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109474756A (zh) * 2018-11-16 2019-03-15 国家计算机网络与信息安全管理中心 一种基于协同网络表示学习的电信异常检测方法
CN109474756B (zh) * 2018-11-16 2020-09-22 国家计算机网络与信息安全管理中心 一种基于协同网络表示学习的电信异常检测方法
WO2023182645A1 (ko) * 2022-03-23 2023-09-28 삼성전자 주식회사 스팸 통화를 탐지하는 전자 장치 및 그 동작 방법

Similar Documents

Publication Publication Date Title
CN108924333B (zh) 诈骗电话识别方法、装置和系统
CN100579150C (zh) 恶意骚扰电话筛选和拦截方法
CN104038648B (zh) 骚扰电话的识别方法和装置
US9118779B2 (en) System and method for inbound call billing
CN108366173A (zh) 一种电话识别方法、相关设备及系统
CN104580717B (zh) 基于应用场景的来电管理方法和装置
CN104253908B (zh) 未知号码分级方法、未知号码标记方法及装置
CN104702804B (zh) 一种号码标记方法及装置
CN110072019A (zh) 一种屏蔽骚扰电话的方法及装置
CN110337059A (zh) 一种用户家庭关系的分析算法、服务器及网络系统
CN106936997B (zh) 一种基于社交关系图谱的垃圾语音识别方法和系统
CN109769244B (zh) 异常电话卡的识别方法、装置、设备及可读存储介质
CN107295491A (zh) 呼叫转移时自动筛选主叫用户的方法及系统
CN107819924A (zh) 一种垃圾电话号码的识别方法、装置及设备
US7352855B2 (en) Method and system for providing a privacy management service
CN104506743B (zh) 一种动态拦截电话的方法及装置
CN114169438A (zh) 一种电信网络诈骗识别方法、装置、设备及存储介质
CN110113748A (zh) 骚扰电话监控方法、装置
CN106162586A (zh) 呼入限制方法、装置以及系统
CN102547712B (zh) 一种垃圾来电检测方法及设备
CN102308602B (zh) 固话仿真的方法、平台及通信系统
CN101600026A (zh) 一种在通信网络中监控骚扰电话的方法
CN108769434A (zh) 来电处理方法、装置及系统
CN109309905A (zh) 一种伪基站短信识别和拦截方法及装置
CN107483702A (zh) 一种防骚扰电话方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180320