CN106954218B - 一种骚扰号码分类方法、装置和系统 - Google Patents
一种骚扰号码分类方法、装置和系统 Download PDFInfo
- Publication number
- CN106954218B CN106954218B CN201710153820.8A CN201710153820A CN106954218B CN 106954218 B CN106954218 B CN 106954218B CN 201710153820 A CN201710153820 A CN 201710153820A CN 106954218 B CN106954218 B CN 106954218B
- Authority
- CN
- China
- Prior art keywords
- called
- caller
- telephone
- telephone number
- harassing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 230000003252 repetitive effect Effects 0.000 claims description 47
- 230000010354 integration Effects 0.000 claims description 5
- 230000005611 electricity Effects 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 5
- 238000005516 engineering process Methods 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 102100037060 Forkhead box protein D3 Human genes 0.000 description 1
- 101000946191 Galerina sp Laccase-1 Proteins 0.000 description 1
- 101001029308 Homo sapiens Forkhead box protein D3 Proteins 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/12—Detection or prevention of fraud
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种骚扰号码分类方法、装置和系统,属于通信技术领域,其可解决现有的运营商平台无法对骚扰号码进行分类的问题。本发明的骚扰号码分类方法,包括:根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标;根据所述通信指标,判断所述电话号码是否为骚扰号码;若判断出所述电话号码为骚扰号码时,根据每个骚扰号码对应的通信指标对所述骚扰号码进行合并生成电话集合,以供运营商平台根据所述电话集合对所述骚扰号码进行分类。
Description
技术领域
本发明属于通信技术领域,具体涉及一种骚扰号码分类方法、装置和系统。
背景技术
近年来,以运营商网络为载体进行的各种类型的骚扰号码愈演愈烈,严重影响了运营商的品牌形象、造成运营商和用户的大量经济损失。其中,骚扰号码由于类型较多(如中介代理、广告推销、贷款理财等),一般的分类方法难以对骚扰号码的具体类型进行准确分类,因此,对用户的提醒价值不高。
目前,针对骚扰号码的治理主要有三种手段。第一种为众标众享;第二种为反向验证;第三种为欺诈号码举报。
对于第一种方案来说,由互联网厂商提供,其准确率不高,且易引发用户投诉;对于第二种方案来说,由运营商提供,其可发现虚假主叫,但现网部署的成本很高;对于第三种方案,由用户提供,但用户提供的数量少,应用周期长。
虽然,这些骚扰号码给大多数用户造成了困扰,但也有少部分用户存在对应需求,因此,如何能够对骚扰号码进行分类,以供用户选择性的接听与其需求对应的骚扰号码,成为本领域亟待解决的问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一,提出了一种能够对骚扰号码进行识别,并将骚扰号码进行分组以供运营商平台根据分组对骚扰号码进行分类的骚扰号码分类方法、装置和系统。
解决本发明技术问题所采用的技术方案是一种骚扰号码分类方法,包括:
根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标;
根据所述通信指标,判断所述电话号码是否为骚扰号码;
若判断出所述电话号码为骚扰号码时,根据每个骚扰号码对应的通信指标对所述骚扰号码进行合并生成电话集合,以供运营商平台根据所述电话集合对所述骚扰号码进行分类。
其中,所述语音详单包括:主叫次数、被叫次数、被叫的不同号码数量、每次主叫时长和每次被叫时长;
所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
所述根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标包括:
将所述主叫次数除以主叫次数和被叫次数的总数生成所述主叫次数占比;
将所述被叫次数除以主叫次数和被叫次数的总数生成所述被叫次数占比;
将所述被叫的不同号码数量除以所述主叫次数生成所述被叫不重复率;
将所述每次主叫时长相加生成所述主叫总时长;
将所述每次被叫时长相加生成所述被叫总时长;
将所述主叫总时长与所述被叫总时长的和除以主叫次数和被叫次数的和生成所述通话平均时长。
其中,所述根据所述通信指标,判断所述电话号码是否为骚扰号码包括:
根据每个电话号码的所述通信指标,计算出每个通信指标的平均值;
将每个电话号码的每个所述通信指标分别与对应的通信指标的平均值进行比较,判断所述电话号码是否为骚扰号码。
其中,所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
所述根据每个电话号码的所述通信指标,计算出每个通信指标的平均值包括:
将每个电话号码的主叫次数占比相加除以电话号码的数量生成主叫次数占比平均值;
将每个电话号码的主叫总时长相加除以电话号码的数量生成主叫总时长平均值;
将每个电话号码的被叫不重复率相加除以电话号码的数量生成被叫不重复率平均值;
将每个电话号码的被叫次数占比相加除以电话号码的数量生成被叫次数占比平均值;
将每个电话号码的被叫总时长相加除以电话号码的数量生成被叫总时长平均值;
将每个电话号码的平均通话时长相加除以电话号码的数量生成平均通话时长平均值;
所述将每个电话号码的每个所述通信指标分别与对应的通信指标的平均值进行比较包括:
将所述电话号码的主叫次数占比与主叫次数占比平均值进行比较,将所述电话号码的主叫总时长与主叫总时长平均值进行比较,将所述电话号码的被叫不重复率与被叫不重复率平均值进行比较,将所述电话号码的被叫次数占比与被叫次数占比平均值进行比较,将所述电话号码的被叫总时长与被叫总时长平均值进行比较,将所述电话号码的平均通话时长与平均通话时长平均值进行比较;
所述判断所述电话号码是否为骚扰号码包括:
若比较出所述电话号码的主叫次数占比、被叫不重复率和主叫总时长均大于对应的平均值,且被叫次数占比、被叫总时长和平均通话时长均小于对应的平均值,判断出所述电话号码为骚扰号码。
其中,所述根据每个骚扰号码对应的通信指标对所述骚扰号码进行合并生成电话集合包括:
统计每个基站下的每个时间段和每个号段的骚扰号码的数量;
将位于同一基站下的同一时间段且同一号段内的骚扰号码集成一个电话组;
将所述通信指标位于同一区间内的电话组进行合并,生成电话集合。
作为另一技术方案,本发明还提供一种骚扰号码分类装置,包括:
获取模块,用于根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标;
判断模块,用于根据所述通信指标,判断所述电话号码是否为骚扰号码;
生成模块,用于若判断出所述电话号码为骚扰号码时,根据每个骚扰号码对应的通信指标对所述骚扰号码进行合并生成电话集合,以供运营商平台根据所述电话集合对所述骚扰号码进行分类。
其中,所述语音详单包括:主叫次数、被叫次数、被叫的不同号码数量、每次主叫时长和每次被叫时长;
所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
所述获取模块具体用于:
将所述主叫次数除以主叫次数和被叫次数的总数生成所述主叫次数占比;
将所述被叫次数除以主叫次数和被叫次数的总数生成所述被叫次数占比;
将所述被叫的不同号码数量除以所述主叫次数生成所述被叫不重复率;
将所述每次主叫时长相加生成所述主叫总时长;
将所述每次被叫时长相加生成所述被叫总时长;
将所述主叫总时长与所述被叫总时长的和除以主叫次数和被叫次数的和生成所述通话平均时长。
其中,所述判断模块包括:
计算模块,用于根据每个电话号码的所述通信指标,计算出每个通信指标的平均值;
比较模块,用于将每个电话号码的每个所述通信指标分别与对应的通信指标的平均值进行比较,判断所述电话号码是否为骚扰号码。
其中,所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
所述计算模块具体用于将每个电话号码的主叫次数占比相加除以电话号码的数量生成主叫次数占比平均值;将每个电话号码的主叫总时长相加除以电话号码的数量生成主叫总时长平均值;将每个电话号码的被叫不重复率相加除以电话号码的数量生成被叫不重复率平均值;将每个电话号码的被叫次数占比相加除以电话号码的数量生成被叫次数占比平均值;将每个电话号码的被叫总时长相加除以电话号码的数量生成被叫总时长平均值;将每个电话号码的平均通话时长相加除以电话号码的数量生成平均通话时长平均值;
所述比较模块具体用于将所述电话号码的主叫次数占比与主叫次数占比平均值进行比较,将所述电话号码的主叫总时长与主叫总时长平均值进行比较,将所述电话号码的被叫不重复率与被叫不重复率平均值进行比较,将所述电话号码的被叫次数占比与被叫次数占比平均值进行比较,将所述电话号码的被叫总时长与被叫总时长平均值进行比较,将所述电话号码的平均通话时长与平均通话时长平均值进行比较;
所述判断模块还包括:子判断模块;
子判断模块,用于若比较出所述电话号码的主叫次数占比、被叫不重复率和主叫总时长均大于对应的平均值,且被叫次数占比、被叫总时长和平均通话时长均小于对应的平均值,判断出所述电话号码为骚扰号码。
其中,所述生成模块包括:
统计模块,用于统计每个基站下的每个时间段和每个号段的骚扰号码的数量;
所述集成模块,用于将位于同一基站下的同一时间段且同一号段内的骚扰号码集成一个电话组;
所述子生成模块,用于将所述通信指标位于同一区间内的电话组进行合并,生成电话集合。
作为另一技术方案,本发明还提供一种骚扰号码分类系统,包括运营商平台和上述任意一项所述的骚扰号码分类装置;
所述运营商平台根据电话集合对骚扰号码进行分类。
本发明的骚扰号码分类方法、装置和系统中,该骚扰号码分类方法包括:根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标;根据通信指标,判断电话号码是否为骚扰号码;若判断出电话号码为骚扰号码时,根据每个骚扰号码对应的通信指标对骚扰号码进行合并生成电话集合,运营商平台可以根据电话集合对该电话集合中的骚扰号码进行拨测或实际调查,以确定该电话集合中的骚扰号码对应的类别,即完成对骚扰号码的分类
附图说明
图1为本发明的实施例1的骚扰号码分类方法的流程示意图;
图2为本发明的实施例2的骚扰号码分类装置的结构示意图;
图3为本发明的实施例3的骚扰号码分类系统的结构示意图;
其中,附图标记为:1、获取模块;2、判断模块;21、计算模块;22、比较模块;23、子判断模块;3、生成模块;31、统计模块;32、集成模块;33、子生成模块;10、运营商平台;20、骚扰号码分类装置。
具体实施方式
为使本领域技术人员更好地理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步详细描述。
实施例1:
请参照图1,本实施例提供一种骚扰号码分类方法,包括:
步骤101,根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标。
其中,语音详单包括:主叫次数、被叫次数、被叫的不同号码数量、每次主叫时长和每次被叫时长。
当然,语音详单所包含的内容并不局限于此,还可以包括通话开始时间、通话结束时间等,在此不再赘述。
其中,通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长。
步骤101具体包括:
将主叫次数除以主叫次数和被叫次数的总数生成主叫次数占比,即,主叫次数占比=主叫次数÷(主叫次数+被叫次数)。
将被叫次数除以主叫次数和被叫次数的总数生成被叫次数占比即,被叫次数占比=主叫次数÷(主叫次数+被叫次数)。
将被叫的不同号码数量除以主叫次数生成被叫不重复率,即,被叫不重复率=被叫的不同号码数量÷主叫次数。换句话数,被叫不重复率即为由该骚扰号码打出的电话中,有多少被叫的号码是不重复的。
将每次主叫时长相加生成主叫总时长,即主叫总时长=∑每次主叫时长。
将每次被叫时长相加生成被叫总时长,即被叫总时长=∑每次被叫时长。
将主叫总时长与被叫总时长的和除以主叫次数和被叫次数的和生成通话平均时长,即通话平均时长=(主叫总时长+被叫总时长)÷(主叫次数+被叫次数)。
需要说明的是,上述的主叫是指通过骚扰号码打出的电话,被叫是指通过该骚扰号码接听的电话;上述通信指标的生成顺序并不限定,可以是同时生成的,也可以是按照一定的顺序生成的,在此不再赘述。
步骤102,根据通信指标,判断电话号码是否为骚扰号码。
步骤102具体包括:
步骤1021,根据每个电话号码的通信指标,计算出每个通信指标的平均值。
具体地,将每个电话号码的主叫次数占比相加除以电话号码的数量生成主叫次数占比平均值;将每个电话号码的主叫总时长相加除以电话号码的数量生成主叫总时长平均值;将每个电话号码的被叫不重复率相加除以电话号码的数量生成被叫不重复率平均值;将每个电话号码的被叫次数占比相加除以电话号码的数量生成被叫次数占比平均值;将每个电话号码的被叫总时长相加除以电话号码的数量生成被叫总时长平均值;将每个电话号码的平均通话时长相加除以电话号码的数量生成平均通话时长平均值。
需要说明的是,在计算通信指标的平均值时,电话号码的数量是指在全网范围内的所有电话号码,即求出每个通信指标在全网中的平均值。
步骤1022,将每个电话号码的每个通信指标分别与对应的通信指标的平均值进行比较,判断电话号码是否为骚扰号码。
具体地,将电话号码的主叫次数占比与主叫次数占比平均值进行比较,将电话号码的主叫总时长与主叫总时长平均值进行比较,将电话号码的被叫不重复率与被叫不重复率平均值进行比较,将电话号码的被叫次数占比与被叫次数占比平均值进行比较,将电话号码的被叫总时长与被叫总时长平均值进行比较,将电话号码的平均通话时长与平均通话时长平均值进行比较。
步骤103,若判断出电话号码为骚扰号码时,根据每个骚扰号码对应的通信指标对骚扰号码进行合并生成电话集合,以供运营商平台根据电话集合对骚扰号码进行分类。
步骤103具体包括:
步骤1031,判断出电话号码为骚扰号码。
具体地,若比较出电话号码的主叫次数占比、被叫不重复率和主叫总时长均大于对应的平均值,且被叫次数占比、被叫总时长和平均通话时长均小于对应的平均值,判断出电话号码为骚扰号码。
也就是说,只有同时满足电话号码的主叫次数占比、被叫不重复率和主叫总时长均大于对应的平均值,且被叫次数占比、被叫总时长和平均通话时长均小于对应的平均值的电话号码才被确认为是骚扰号码,之所以如此设置,是为了提高确认骚扰号码的准确率,避免发生误判,从而给用户带来不必要的麻烦。
步骤1032,统计每个基站下的每个时间段和每个号段的骚扰号码的数量。
可以理解的是,每一时间段可按小时区分,一个自然日有24个时间段,0点0分0秒至0点59分59秒为时间段1(timeslot1),依此类推;每一号段可以按号码的后两位进行划分,如移动电话号码10000000001至10000000099为号码段1(numslot1),依此类推。当然,每个时间段和每个号段的划分并不局限于此,在此不再赘述。
例如,统计在基站LAC1下,语音详单生成在0点0分0秒至0点59分59秒内的、移动电话号码为10000000001至10000000099范围内的骚扰号码的数量。
步骤1033,将位于同一基站下的同一时间段且同一号段内的骚扰号码集成一个电话组。
即,将步骤1032中获得的每个基站下的每个时间段和每个号段的骚扰号码集成一个电话组,可以理解的是,每个电话组中的骚扰号码的数量至少为一个。
之所以如此设置,是由于一般来说,一个公司对其业务进行电话扩散时,多个拨打电话的操作人员是同时工作的,因此,这些操作人员拨打电话的时间段应该相同,同时,公司一般会直接申请一定数量的电话号码,通常这些号码是连续的,即位于同一号段内,因此,统计某一基站下每个时间段和每个号段的骚扰号码,可以直接将同一公司的骚扰号码归为一组。
步骤1034,将通信指标位于同一区间内的电话组进行合并,生成电话集合,以供运营商平台根据电话集合对骚扰号码进行分类。
需要说明的是,位于同一区间内的电话组是指具有相似的通信指标的电话组,例如,在同一基站下,有N组电话组,其中,有n组电话组的被叫次数占比位于45%~50%之间,则将这n组进行合并,生成电话集合。当然,区间的划分可根据实际情况进行设定,而且,在对电话组进行合并时,所采用的通信指标的数量可根据实际情况进行设定,在此不再赘述。
在对电话组进行合并生成电话集合之后,运营商平台可根据电话集合对该电话集合中的骚扰号码进行拨测或实际调查,以确定该电话集合中的骚扰号码对应的类别,即完成对骚扰号码的分类。
本实施例的骚扰号码分类方法,包括:根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标;根据通信指标,判断电话号码是否为骚扰号码;若判断出电话号码为骚扰号码时,根据每个骚扰号码对应的通信指标对骚扰号码进行合并生成电话集合,运营商平台可以根据电话集合对该电话集合中的骚扰号码进行拨测或实际调查,以确定该电话集合中的骚扰号码对应的类别,即完成对骚扰号码的分类。
实施例2:
请参照图2,本实施例提供一种骚扰号码分类装置,包括:获取模块1、判断模块2和生成模块3。
获取模块1用于根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标。
判断模块2用于根据通信指标,判断电话号码是否为骚扰号码。
生成模块3用于若判断出电话号码为骚扰号码时,根据每个骚扰号码对应的通信指标对骚扰号码进行合并生成电话集合,以供运营商平台根据电话集合对骚扰号码进行分类。
其中,语音详单包括:主叫次数、被叫次数、被叫的不同号码数量、每次主叫时长和每次被叫时长。
其中,通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长。
获取模块1具体用于:将主叫次数除以主叫次数和被叫次数的总数生成主叫次数占比;将被叫次数除以主叫次数和被叫次数的总数生成被叫次数占比;将被叫的不同号码数量除以主叫次数生成被叫不重复率;将每次主叫时长相加生成主叫总时长;将每次被叫时长相加生成被叫总时长;将主叫总时长与被叫总时长的和除以主叫次数和被叫次数的和生成通话平均时长。
其中,判断模块2包括:计算模块21、比较模块22和子判断模块23。
计算模块21用于根据每个电话号码的通信指标,计算出每个通信指标的平均值。
计算模块21具体用于将每个电话号码的主叫次数占比相加除以电话号码的数量生成主叫次数占比平均值;将每个电话号码的主叫总时长相加除以电话号码的数量生成主叫总时长平均值;将每个电话号码的被叫不重复率相加除以电话号码的数量生成被叫不重复率平均值;将每个电话号码的被叫次数占比相加除以电话号码的数量生成被叫次数占比平均值;将每个电话号码的被叫总时长相加除以电话号码的数量生成被叫总时长平均值;将每个电话号码的平均通话时长相加除以电话号码的数量生成平均通话时长平均值。
比较模块22用于将每个电话号码的每个通信指标分别与对应的通信指标的平均值进行比较,判断电话号码是否为骚扰号码。
比较模块22具体用于将电话号码的主叫次数占比与主叫次数占比平均值进行比较,将电话号码的主叫总时长与主叫总时长平均值进行比较,将电话号码的被叫不重复率与被叫不重复率平均值进行比较,将电话号码的被叫次数占比与被叫次数占比平均值进行比较,将电话号码的被叫总时长与被叫总时长平均值进行比较,将电话号码的平均通话时长与平均通话时长平均值进行比较。
子判断模块23用于若比较出电话号码的主叫次数占比、被叫不重复率和主叫总时长均大于对应的平均值,且被叫次数占比、被叫总时长和平均通话时长均小于对应的平均值,判断出电话号码为骚扰号码。
其中,生成模块3包括:统计模块31、集成模块32和子生成模块33。
统计模块31用于统计每个基站下的每个时间段和每个号段的骚扰号码的数量。
集成模块32用于将位于同一基站下的同一时间段且同一号段内的骚扰号码集成一个电话组。
子生成模块33用于将通信指标位于同一区间内的电话组进行合并,生成电话集合。
本实施例的骚扰号码分类装置,用于实现实施例1的骚扰号码分类方法,详细描述可参照实施例1的骚扰号码分类方法,在此不再赘述。
本实施例的骚扰号码分类装置,用于实现实施例1的骚扰号码分类方法,若判断出电话号码为骚扰号码时,根据每个骚扰号码对应的通信指标对骚扰号码进行合并生成电话集合,以供商平台根据电话集合对该电话集合中的骚扰号码进行拨测或实际调查,以确定该电话集合中的骚扰号码对应的类别,即完成对骚扰号码的分类。
实施例3:
请参照图3,本实施例提供一种骚扰号码分类系统,包括运营商平台10和实施例2的骚扰号码分类装置20。
运营商平台10根据电话集合对骚扰号码进行分类。
本实施例的骚扰号码分类系统,包括实施例2的骚扰号码分类装置,详细描述可参照实施例2的骚扰号码分类装置,在此不再赘述。
本实施例的骚扰号码分类系统,包括实施例2的骚扰号码分类装置,可供平台根据电话集合对该电话集合中的骚扰号码进行拨测或实际调查,以确定该电话集合中的骚扰号码对应的类别,即完成对骚扰号码的分类。
可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。
Claims (8)
1.一种骚扰号码分类方法,其特征在于,包括:
根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标;
所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
根据每个电话号码的所述通信指标,计算出每个通信指标的平均值;将每个电话号码的每个所述通信指标分别与对应的通信指标的平均值进行比较,判断所述电话号码是否为骚扰号码;统计每个基站下的每个时间段和每个号段的骚扰号码的数量;
将位于同一基站下的同一时间段且同一号段内的骚扰号码集成一个电话组;
将所述通信指标位于同一区间内的电话组进行合并,生成电话集合,以供运营商平台根据所述电话集合对所述骚扰号码进行分类。
2.根据权利要求1所述的骚扰号码分类方法,其特征在于,所述语音详单包括:主叫次数、被叫次数、被叫的不同号码数量、每次主叫时长和每次被叫时长;
所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
所述根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标包括:
将所述主叫次数除以主叫次数和被叫次数的总数生成所述主叫次数占比;
将所述被叫次数除以主叫次数和被叫次数的总数生成所述被叫次数占比;
将所述被叫的不同号码数量除以所述主叫次数生成所述被叫不重复率;
将所述每次主叫时长相加生成所述主叫总时长;
将所述每次被叫时长相加生成所述被叫总时长;
将所述主叫总时长与所述被叫总时长的和除以主叫次数和被叫次数的和生成所述通话平均时长。
3.根据权利要求1所述的骚扰号码分类方法,其特征在于,所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
所述根据每个电话号码的所述通信指标,计算出每个通信指标的平均值包括:
将每个电话号码的主叫次数占比相加除以电话号码的数量生成主叫次数占比平均值;
将每个电话号码的主叫总时长相加除以电话号码的数量生成主叫总时长平均值;
将每个电话号码的被叫不重复率相加除以电话号码的数量生成被叫不重复率平均值;
将每个电话号码的被叫次数占比相加除以电话号码的数量生成被叫次数占比平均值;
将每个电话号码的被叫总时长相加除以电话号码的数量生成被叫总时长平均值;
将每个电话号码的平均通话时长相加除以电话号码的数量生成平均通话时长平均值;
所述将每个电话号码的每个所述通信指标分别与对应的通信指标的平均值进行比较包括:
将所述电话号码的主叫次数占比与主叫次数占比平均值进行比较,将所述电话号码的主叫总时长与主叫总时长平均值进行比较,将所述电话号码的被叫不重复率与被叫不重复率平均值进行比较,将所述电话号码的被叫次数占比与被叫次数占比平均值进行比较,将所述电话号码的被叫总时长与被叫总时长平均值进行比较,将所述电话号码的平均通话时长与平均通话时长平均值进行比较;
所述判断所述电话号码是否为骚扰号码包括:
若比较出所述电话号码的主叫次数占比、被叫不重复率和主叫总时长均大于对应的平均值,且被叫次数占比、被叫总时长和平均通话时长均小于对应的平均值,判断出所述电话号码为骚扰号码。
4.一种骚扰号码分类装置,其特征在于,包括:
获取模块,用于根据获取的每个电话号码的语音详单,生成每个电话号码的通信指标;所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
判断模块包括计算模块和比较模块;
所述计算模块,用于根据每个电话号码的所述通信指标,计算出每个通信指标的平均值;
所述比较模块,用于将每个电话号码的每个所述通信指标分别与对应的通信指标的平均值进行比较,判断所述电话号码是否为骚扰号码;
生成模块,统计每个基站下的每个时间段和每个号段的骚扰号码的数量;将位于同一基站下的同一时间段且同一号段内的骚扰号码集成一个电话组;将所述通信指标位于同一区间内的电话组进行合并,生成电话集合,以供运营商平台根据所述电话集合对所述骚扰号码进行分类。
5.根据权利要求4所述的骚扰号码分类装置,其特征在于,所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
所述获取模块具体用于:
将所述主叫次数除以主叫次数和被叫次数的总数生成所述主叫次数占比;
将所述被叫次数除以主叫次数和被叫次数的总数生成所述被叫次数占比;
将所述被叫的不同号码数量除以所述主叫次数生成所述被叫不重复率;
将每次主叫时长相加生成所述主叫总时长;
将所述每次被叫时长相加生成所述被叫总时长;
将所述主叫总时长与所述被叫总时长的和除以主叫次数和被叫次数的和生成所述通话平均时长。
6.根据权利要求4所述的骚扰号码分类装置,其特征在于,所述通信指标包括:主叫次数占比、主叫总时长、被叫不重复率、被叫次数占比、被叫总时长和平均通话时长;
所述计算模块具体用于将每个电话号码的主叫次数占比相加除以电话号码的数量生成主叫次数占比平均值;将每个电话号码的主叫总时长相加除以电话号码的数量生成主叫总时长平均值;将每个电话号码的被叫不重复率相加除以电话号码的数量生成被叫不重复率平均值;将每个电话号码的被叫次数占比相加除以电话号码的数量生成被叫次数占比平均值;将每个电话号码的被叫总时长相加除以电话号码的数量生成被叫总时长平均值;将每个电话号码的平均通话时长相加除以电话号码的数量生成平均通话时长平均值;
所述比较模块具体用于将所述电话号码的主叫次数占比与主叫次数占比平均值进行比较,将所述电话号码的主叫总时长与主叫总时长平均值进行比较,将所述电话号码的被叫不重复率与被叫不重复率平均值进行比较,将所述电话号码的被叫次数占比与被叫次数占比平均值进行比较,将所述电话号码的被叫总时长与被叫总时长平均值进行比较,将所述电话号码的平均通话时长与平均通话时长平均值进行比较;
所述判断模块还包括:子判断模块;
子判断模块,用于若比较出所述电话号码的主叫次数占比、被叫不重复率和主叫总时长均大于对应的平均值,且被叫次数占比、被叫总时长和平均通话时长均小于对应的平均值,判断出所述电话号码为骚扰号码。
7.根据权利要求4所述的骚扰号码分类装置,其特征在于,所述生成模块包括:
统计模块,用于统计每个基站下的每个时间段和每个号段的骚扰号码的数量;
集成模块,用于将位于同一基站下的同一时间段且同一号段内的骚扰号码集成一个电话组;
子生成模块,用于将所述通信指标位于同一区间内的电话组进行合并,生成电话集合。
8.一种骚扰号码分类系统,其特征在于,包括运营商平台和权利要求4至7任意一项所述的骚扰号码分类装置;
所述运营商平台根据电话集合对骚扰号码进行分类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710153820.8A CN106954218B (zh) | 2017-03-15 | 2017-03-15 | 一种骚扰号码分类方法、装置和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710153820.8A CN106954218B (zh) | 2017-03-15 | 2017-03-15 | 一种骚扰号码分类方法、装置和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106954218A CN106954218A (zh) | 2017-07-14 |
CN106954218B true CN106954218B (zh) | 2019-08-30 |
Family
ID=59472022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710153820.8A Active CN106954218B (zh) | 2017-03-15 | 2017-03-15 | 一种骚扰号码分类方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106954218B (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107819924A (zh) * | 2017-11-06 | 2018-03-20 | 东软集团股份有限公司 | 一种垃圾电话号码的识别方法、装置及设备 |
CN109873908B (zh) * | 2017-12-04 | 2020-11-20 | 中国移动通信集团湖北有限公司 | 垃圾电话标识识别方法、装置、计算机设备及存储介质 |
CN109951609B (zh) * | 2017-12-20 | 2021-07-23 | 中国移动通信集团广东有限公司 | 一种恶意电话号码处理方法和装置 |
CN108156332B (zh) * | 2017-12-26 | 2019-11-01 | 中国联合网络通信集团有限公司 | 诈骗电话的获取方法及装置 |
CN108366173A (zh) * | 2018-01-05 | 2018-08-03 | 腾讯科技(深圳)有限公司 | 一种电话识别方法、相关设备及系统 |
CN108198086B (zh) * | 2018-01-31 | 2021-06-25 | 海南海航信息技术有限公司 | 用于依据通信行为特征来识别骚扰源的方法和装置 |
CN110414543A (zh) * | 2018-04-28 | 2019-11-05 | 中国移动通信集团有限公司 | 一种电话号码危险级别的判别方法、设备以及计算机存储介质 |
CN108924840B (zh) * | 2018-06-26 | 2022-02-01 | 中国联合网络通信集团有限公司 | 黑名单管理方法、装置及终端 |
CN108810289B (zh) * | 2018-07-12 | 2021-03-19 | 中国联合网络通信集团有限公司 | 一种互联网标注取消方法及装置 |
CN108810290B (zh) * | 2018-07-17 | 2021-04-02 | 中国联合网络通信集团有限公司 | 一种诈骗电话的识别的方法及系统 |
CN110213448B (zh) * | 2018-09-13 | 2021-08-24 | 腾讯科技(深圳)有限公司 | 恶意号码识别方法、装置、存储介质和计算机设备 |
CN109274834B (zh) * | 2018-09-27 | 2021-04-20 | 杭州东信北邮信息技术有限公司 | 一种基于通话行为的快递号码识别方法 |
CN111083294A (zh) * | 2018-10-19 | 2020-04-28 | 中国移动通信集团有限公司 | 一种通信控制方法、管控平台、控制设备及存储介质 |
CN109195168A (zh) * | 2018-11-06 | 2019-01-11 | 中国联合网络通信集团有限公司 | 一种语音拦截处理方法及系统 |
CN109587357B (zh) * | 2018-11-14 | 2021-04-06 | 上海麦图信息科技有限公司 | 一种骚扰电话的识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009114795A2 (en) * | 2008-03-14 | 2009-09-17 | Medical Care Corporation | Non-natural pattern identification for cognitive assessment |
CN102148889A (zh) * | 2010-02-09 | 2011-08-10 | 阿里巴巴集团控股有限公司 | 一种识别骚扰对象的方法、装置及系统 |
CN104320525A (zh) * | 2014-09-19 | 2015-01-28 | 小米科技有限责任公司 | 电话号码识别方法及装置 |
CN105635404A (zh) * | 2016-03-11 | 2016-06-01 | 百度在线网络技术(北京)有限公司 | 终端设备、终端设备的通话处理方法和装置 |
CN106255113A (zh) * | 2015-06-10 | 2016-12-21 | 中兴通讯股份有限公司 | 骚扰电话的识别方法及装置 |
-
2017
- 2017-03-15 CN CN201710153820.8A patent/CN106954218B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009114795A2 (en) * | 2008-03-14 | 2009-09-17 | Medical Care Corporation | Non-natural pattern identification for cognitive assessment |
CN102148889A (zh) * | 2010-02-09 | 2011-08-10 | 阿里巴巴集团控股有限公司 | 一种识别骚扰对象的方法、装置及系统 |
CN104320525A (zh) * | 2014-09-19 | 2015-01-28 | 小米科技有限责任公司 | 电话号码识别方法及装置 |
CN106255113A (zh) * | 2015-06-10 | 2016-12-21 | 中兴通讯股份有限公司 | 骚扰电话的识别方法及装置 |
CN105635404A (zh) * | 2016-03-11 | 2016-06-01 | 百度在线网络技术(北京)有限公司 | 终端设备、终端设备的通话处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106954218A (zh) | 2017-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106954218B (zh) | 一种骚扰号码分类方法、装置和系统 | |
CN108924333B (zh) | 诈骗电话识别方法、装置和系统 | |
CN104038648A (zh) | 骚扰电话的识别方法和装置 | |
CN105636047A (zh) | 一种欺诈用户的检测方法、装置和系统 | |
CN101686444B (zh) | 垃圾短信发送号码实时检测系统及方法 | |
CN103369486A (zh) | 诈骗短信防范系统与防范方法 | |
CN101860822A (zh) | 垃圾短信监控方法和系统 | |
CN101179809B (zh) | 用于捕捉克隆sim卡的方法 | |
CN107707723A (zh) | 骚扰电话的拦截方法 | |
CN112866192B (zh) | 一种识别异常聚集行为的方法及装置 | |
CN101873618A (zh) | 一种通信监控方法及装置 | |
CN106296300A (zh) | 一种电信行业移动产品口碑营销效果的鉴定方法 | |
CN107231494A (zh) | 一种用户通信特征的获取方法、存储介质及电子设备 | |
CN108810290B (zh) | 一种诈骗电话的识别的方法及系统 | |
CN101729682B (zh) | 通信网络用户自动跟踪方法 | |
CN108198086B (zh) | 用于依据通信行为特征来识别骚扰源的方法和装置 | |
CN105516990B (zh) | 一种电信欺诈用户分析方法及装置 | |
CN111131627A (zh) | 基于流数据图谱的个人有害呼叫检测方法、装置及可读介质 | |
CN110677825A (zh) | 基于推广短信触达率的处理方法以及装置、存储介质 | |
CN102075873B (zh) | 对集团客户成员数据进行统计的方法及系统 | |
CN110213449B (zh) | 一种漫游诈骗号码的识别方法 | |
CN101150625A (zh) | 一种呼叫记录的分析方法及装置 | |
CN102547712B (zh) | 一种垃圾来电检测方法及设备 | |
CN110602228A (zh) | 基于推广短信触达率的处理方法以及装置、储存介质 | |
CN104581729B (zh) | 垃圾信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |