CN107331385A - 一种骚扰电话的识别与拦截方法 - Google Patents
一种骚扰电话的识别与拦截方法 Download PDFInfo
- Publication number
- CN107331385A CN107331385A CN201710552232.1A CN201710552232A CN107331385A CN 107331385 A CN107331385 A CN 107331385A CN 201710552232 A CN201710552232 A CN 201710552232A CN 107331385 A CN107331385 A CN 107331385A
- Authority
- CN
- China
- Prior art keywords
- msub
- harassing call
- mrow
- call
- harassing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000011664 signaling Effects 0.000 claims abstract description 26
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 22
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 22
- 238000004891 communication Methods 0.000 claims abstract description 12
- 238000004458 analytical method Methods 0.000 claims abstract description 11
- 238000007635 classification algorithm Methods 0.000 claims abstract description 6
- 238000007689 inspection Methods 0.000 claims abstract description 5
- 238000001228 spectrum Methods 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 9
- 239000012634 fragment Substances 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 7
- 238000009432 framing Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 102100028188 Cystatin-F Human genes 0.000 claims description 4
- 101710169749 Cystatin-F Proteins 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000001149 cognitive effect Effects 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 230000000903 blocking effect Effects 0.000 claims description 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 230000005611 electricity Effects 0.000 description 4
- 238000012098 association analyses Methods 0.000 description 3
- 238000012790 confirmation Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 241001074085 Scophthalmus aquosus Species 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/66—Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2281—Call monitoring, e.g. for law enforcement purposes; Call tracing; Detection or prevention of malicious calls
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42195—Arrangements for calling back a calling subscriber
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/436—Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/16—Communication-related supplementary services, e.g. call-transfer or call-hold
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Security & Cryptography (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Technology Law (AREA)
- Artificial Intelligence (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明涉及一种骚扰电话的识别与拦截方法本发明公开了一种骚扰电话的识别与拦截方法,所述方法包括:S1:采集通信网信令信息,原始数据经过解码合成、数据去重、协议分析,再根据各种协议规则进行CDR合成;S2:根据骚扰电话特征选择识别因子;S3:根据骚扰电话的识别因子采用加权朴素贝叶斯分类算法对所有通话进行分类,识别出骚扰电话和非骚扰电话;S4:然后对识别出的骚扰电话进行回拨检验。S5:最后进行骚扰电话的拦截。本发明能有效的对骚扰电话进行识别,而且提高了骚扰电话的拦截效率,提高了用户体验。
Description
技术领域
本发明属于通信技术领域,涉及一种骚扰电话的识别与拦截方法。
背景技术
随着通信行业的不断发展,广大用户开始逐渐享受到多样化的通信服务。但是与此同时,越来越多的诈骗电话出现在用户的日常生活中,部分地区在节假日期间更是出现诈骗案件频发的态势。频繁发生的诈骗电话不仅扰乱了电信运营的正常秩序,同时给受骗用户带来巨大的财产损失,影响社会的安定与和谐。因此对于骚扰电话进行识别和拦截的研究,具有重要的现实意义。针对骚扰电话行为,运营商虽在持续治理,但依然泛滥;互联网厂商虽也参与了骚扰电话治理,但仅限提醒,且覆盖范围有限。
发明内容
有鉴于此,本发明的目的在于提供一种基于信令数据深度挖掘的骚扰电话分析与治理整体解决方法,该方法具有全网覆盖、属性全面、数据精准等特点。
为达到上述目的,本发明提供如下技术方案:
一种骚扰电话的识别与拦截方法,该方法包括以下步骤:
S1:采集通信网信令信息,对采集到的数据进行解码合成、数据去重、协议分析,再根据各种协议规则进行CDR合成;
S2:根据骚扰电话特征选择呼叫频率、接通率、平均振铃时长、被叫时平均通话时间、号码集中度、拨打空号比例、电路交换(Circuit Switched,CS)呼叫量与包交换(PacketSwitched,PS)流量比作为骚扰电话的识别因子;
S3:根据骚扰电话的识别因子采用加权朴素贝叶斯分类算法对所有通话进行分类,识别出骚扰电话和非骚扰电话;
S4:对识别出的骚扰电话进行回拨检验;
S5:拦截骚扰电话。
进一步,所述步骤S1包括以下步骤:
S101:针对不同的通信网络选取不同的采集点;其中固网选择软交换(SoftSwitch,SS),C网选择移动软交换中心(Mobile Switching Center emulation,MSCE)、归属位置寄存器(Home LocationRegister,HLR)、MSCE之间的CMAP信令,MSCE、SS之间的ISUP信令,以及MSCE之间的SIP信令,IMS网选择代理/询问呼叫会话控制功能(Proxy/Inquiry-Call SessionControl Funtion,P/I-CSCF);
S102:对信令采集模块捕获的数据进行解码,在物理层和数据链路层完成解码重组后通过驱动回调方式将网络层数据发送至解码合成模块;
S103:提取消息特征字段信息,并封装到呼叫合成信息类中;
S104:交给协议分析器进行呼叫合成与协议关联解码;
S105:将同一用户的同一信令流程中相关联的消息组合在一起,形成完整的信令流程。
进一步,在步骤S2中,所述呼叫频率为主叫号码频繁向一个或多个被叫号码发起呼叫远超过正常范围的频率;
所述接通率为被叫号码接通主叫号码的概率;
所述平均振铃时长为主叫号码完成振铃的平均时间;
所述被叫时平均通话时间为被叫号码回拨后的通话平均时间;
所述号码集中度为骚扰软件自动生成的被叫用户号段区间;
所述拨打空号比例为被叫号码空号数与被叫号码拨打数的比值;
所述CS呼叫量与PS流量比为CS呼叫量与PS流量的比值。
进一步,所述步骤S3具体为:
S301:通过贝叶斯分类器分析呼叫话单,得到主叫号码是骚扰电话的概率P及主叫号码不是骚扰电话的概率P';
S302:通过比较P与P'的大小关系,判断出主叫号码是否是骚扰电话。
进一步,所述步骤S301具体为:
S301a:对于训练样本集合D,假设有p个属性指标n个样本,k表示的样本的第k个属性,第j个样本表示为Xj=(xj1+xj2,…,xjp),1≤j≤n,简记X=(x1+x2,…,xp),xi表示第i个属性指标;统计类Ci集合中的样本数si、其样本数count(xk)、属性对(xk,xj)的样本数count(xk,xj),1≤k,j≤p;
S301b:计算先验概率P(Ci)=si/n,其中n为样本容量,计算xk与xj的权重系数和P(xk/Ci)=count(xk)/si,其中为为样本X的属性指标xk与xj的相关系数,为xk与xj的权重系数,1≤k,j≤p;
S301c:选取类Ci集合中最大的3个条件概率P(xk/Ci)、P(xj/Ci)、P(xl/Ci)的3个属性xk、xj、xl,1≤i,j,k≤p,i、j、k分别表示的样本的第i、j、k个属性,;扫描数据集D,统计类Ci集合中包含值(xk,xj,xl)的样本数count(xk,xj,xl),计算
利用公式计算其中,表示相乘的个数,β是控制参数,取值范围为0.1~0.3,由样本大小决定;选择控制参数β使得weX的值尽可能取值为1;
确定控制参数β∈(0.1~0.3),使
S301d:计算P(X/Ci)(1≤i≤m),m为数据类别,假设数据集有m个类别,表示为C1,C2,…,Cm;
S301e:当P(Ck/X)>P(Ch/X),k≠h时,则X=(x1,x2,…,xp)∈Ck。
进一步,所述步骤S4包括以下步骤:
S401:去除确认的非骚扰电话号码,根据系统中建立的白名单对监控系统经过分析筛选出的可疑号码进行剔除;
S402:引入语音识别技术对可疑骚扰电话进行语音匹配,判断是否为骚扰电话;
S403:对语音匹配识别不出的可疑号码进一步提交进行人工甄别。
进一步,所述步骤S402包括以下步骤:
S402a:对语音信号进行预处理;
通过滤波器提升高频分量并消除工频干扰,其系统函数为:其中α是预加重系数,取值为0.95;
对语音进行分帧处理,分帧采用滑动的优先窗口进行加权,采用的窗口函数为汉明窗,其形式为
采用短时能量和短时过零率相结合的方法进行端点检测,L表示阶数;
S402b:特征提取MFCC;
首先对语音信号进行分帧、加窗,然后作离散傅立叶变换得频谱分布信息,求出频谱平方,即能量谱,再用Mel滤波器组进行滤波,得到功率谱;将每个滤波器的输出取对数并进行反离散余弦变换,得到MFCC系数,MFCC系数计算公式:其中L表示阶数,M为滤波器个数,S(m)为当m帧信号的对数频谱,N为总帧数,C(n)表示第n阶的MFCC系数;
对MFCC系数进行差分计算得到反映语音动态变化的差分参数;
S402c:模版匹配;
采用动态时间规整DTW算法,确定参考模版和测试模版的时间对应关系,
假设参考模型的特征矢量序列为:{R(1),R(2),…,R(m),…,R(M)},其中m为参考模版语音信号的第m帧,m=1时表示语音帧开始,m=M时表示语音帧结束,即M模版话音的帧数,R(m)为第m帧的特征向量;
假设测试模版的特征矢量序列为:{T(1),T(2),…,T(n),…,T(N)},其中,n为测试模版语音信号的第n帧,n=1时表示话音帧开始,n=M时表示语音帧结束,即M模版话音的帧数,T(n)为第n帧的特征向量;
模板训练阶段,首先对模板录音生成音频列表Addlist,然后对模板录音进行预处理,对音频进行去除静音和切分,将音频切分为数个音频片段,将预处理后的音频片段送入声学特征提取模块,将音频片段转换为对应的特征矢量MFCC,作为模板话音的识别特征,生成模板库Template;在实验中选择不同类别的录音进行模板训练,丰富模板库;
识别阶段,首先对待测录音生成音频列表Wavlist,然后将待测录音的特征矢量与模板库中话音模板逐一进行相似性度量的比较,从而得出最佳的匹配结果。
进一步,所述步骤S5包括以下步骤:
S501:将骚扰电话分为互联互通用户和外省移动用户进行相应处理;
S502:对于互联互通用户,将该号码的相关信息发送至话务网管系统通过话务网管系统在关口局设置黑名单进行屏蔽;对于外省移动用户,监控系统判断该主叫号码所在地址,若位于省内交换机,则通过话务网管系统向省内端局设置黑名单进行屏蔽,否则,监控系统判断该主叫号码在所在地为外省端局,将该号码的相关信息发送至汇接局通过话务网管系统向移动软交换长途汇接局设置黑名单进行屏蔽。
本发明的有益效果在于:首先通过软件系统利用数据挖掘技术主动对疑似骚扰电话进行识别监控,提升了骚扰电话识别准确率;其次引入语音匹配技术对已经筛选出的意思骚扰电话进行回拨确认,提升了回拨检测效率,降低客服人员的工作量;最后对于已确定的骚扰电话在对用户造成不良影响前,切断通话,减少了通信网络资源的浪费以及对用户可能造成的损失。
附图说明
为了使本发明的目的、技术方案和有益效果更加清楚,本发明提供如下附图进行说明:
图1为本发明流程图;
图2为数据解码流程图;
图3为数据合成流程图;
图4为回拨检测流程图;
图5为语音识别基本流程图;
图6为MFCC提取流程图;
图7为骚扰电话拦截流程框图。
具体实施方式
下面将结合附图,对本发明的优选实施例进行详细的描述。
如图1所示,本实施例包括以下步骤:
S1:采集通信网信令信息,原始数据经过解码合成、数据去重、协议分析,再根据各种协议规则进行CDR合成;
S2:根据骚扰电话特征选择呼叫频率、接通率、平均振铃时长、被叫时平均通话时间、号码集中度、拨打空号比例、CS呼叫量与PS流量比作为骚扰电话的识别因子;
S3:根据骚扰电话的识别因子采用加权朴素贝叶斯分类算法对所有通话进行分类,识别出骚扰电话和非骚扰电话;
S4:然后对识别出的骚扰电话进行回拨检验。
S5:最后进行骚扰电话的拦截。
进一步的,所述步骤S1中对数据进行采集和预处理,包括针对不同的通信子网络选择不同的采集方案,固网选择SS,C网选择MSCE与HLR,MSCE之间的CMAP信令,MSCE与SS之间的ISUP信令,以及MSCE与MSCE之间的SIP信令,IMS网络选择P/I-CSCF;对信令采集模块捕获的数据进行解码,在物理层和数据链路层完成解码重组后通过驱动回调方式将网络层数据发送至解码合成模块,提取消息特征字段信息,并封装到呼叫合成信息类中,再交给协议分析器进行呼叫合成与协议关联解码。协议合成将同一用户的同一信令流程中相关联的消息组合在一起,形成完整的信令流程。
进一步的,所述步骤S2中,根据大量训练数据的统计分析选择呼叫频率、接通率、平均振铃时长、被叫时平均通话时间、号码集中度、拨打空号比例、CS呼叫量与PS流量比作为骚扰电话的识别因子。
进一步的,所述步骤S3中选择用加权朴素贝叶斯分类算法对所有通话进行分类,识别出骚扰电话和非骚扰电话,包括,数据集中有p个属性指标n个样本,第j个样本表示为Xj=(xj1,xj2,…,xjp),1≤j≤n,简记Xj=(x1,x2,…,xp),xi表示第i个属性指标。假设m类别,表示为C1,C2,…,Cm,判别样本X=(x1,x2,…,xp)属于类别Ck(1≤k≤m)的概率可由贝叶斯公式计算。需要计算:即P(Ck/X)的值取决于计算P(X/Ck)和P(Ck)。计算P(Ck)≈sk/n,其中sk是类别Ck的训练样本数,n是总的训练样本数。
判别规则:当P(Ck/X)>P(Ch/X),k≠h时,则X=(x1,x2,…,xP)∈Ck,在本实施例中p=7,m=2。
对于式(1)需要假设p个属性是相互独立的,但实际问题中独立假设一般不能成立。本方法基于属性相关性分析在公式(1)中加权种系数以放松独立性的假设,即将式(1)修改为
问题的关键是恰当地构造权重系数w。
进一步的,基于卡方拟合统计量的构造思想构造样本属性指标xk、xj之间的相关系数。定义1:在类Ci集合中,定义样本X的属性指标xk与xj的相关系数:
其中,count(xk,xj)、count(xk)分别表示在类Ci集合中属性对(xk,xj)和xk出现的频数,Si为当前类中的样本总数,在xk、xj相互独立的假定下,count(xk)·count(xk)/si可以估计理论频数siP((xk,xj)/Ci)。
定义2:在类Ci集合中,定义xk与xj的权重系数:
特别地,当xk与xj之间相互独立时,有一般情况下
进一步的,计算出向来那个之间的加权系数。假设向量X=(x1,x2,…,xp),则向量X的相关度定义为:
显然weX的值越大,称向量X具有较大的相关性。特别地,如果x1,x2,…,xp间相互独立,则weX=1,因此可由weX来决定式(1)中的权重系数,但需要由样本去估计weX。通过分析可知,向量的相关度与两两属性之间的相关度成正比,定义向量的相关度估计:
其中,表示相乘的个数,β是控制参数,一般取值范围0.1~0.3,由样本大小决定。选择控制参数β使得weX的值尽可能取值于1的附近。
进一步的,所述步骤S4中对识别出的疑似骚扰电话进行检测确认。监控系统中分析筛选出的可疑号码,会通过BOSS(Business&Operation Support System)系统的接口传递给省客服系统,对于客服系统中已有的白名单,直接进行过滤处理,排除在骚扰电话号码之外,无需进行回拨确认。如果疑似号码在客服系统的黑名单之中,直接交由拦截系统进行拦截处理,也无需进行回拨处理。
进一步的,对于不在客服系统黑、白名单中的疑似骚扰电话号码,需要进行回拨确认,根据骚扰电话的一些特点,我们采用了语音识别技术进行智能识别,减少人工克服的工作量,并提高工作效率。
进一步的,对于语音识别系统不能识别的疑似骚扰电话需要进行人工回拨,以减少错误拦截的可能性。
进一步的,所述步骤S5中对于骚扰电话的拦截,根据骚扰号码以及呼叫位置,将其分为几种不同的情况进行相应的拦截处理。
1.数据采集和预处理
针对不同的通信网络选取不同的采集点,固网选择SS,C网选择MSCE与HLR,MSCE之间的CMAP信令,MSCE与SS之间的ISUP信令,以及MSCE与MSCE之间的SIP信令,IMS网络选择P/I-CSCF。
对采集到的数据进行预处理,主要是将采集到的信令信息进行协议分析,根据各种协议的规则进行CDR(Call Detail Record,呼叫详细记录)合成。解码合成模块实现对信令采集模块捕获的数据进行解码,在物理层和数据链路层完成解码重组后通过驱动回调方式将网络层数据发送至解码合成模块。解码流程如图2所示。
协议合成是将同一用户的同一信令流程中相关联的消息组合在一起,形成完整的信令流程。该模块按照协议类型,合成本协议事务详细记录,并提取协议类型、关联主键及取值、事务开始时间、事务结束时间等用于关联分析的关键信息,进一步合成关联分析CDR,发送到多协议关联分析模块。CDR合成流程如图3所示。
2.分类识别因子的选择
骚扰电话识别因子的选择。骚扰电话存在以下特点(我们选取这些识别因子作为骚扰电话分类是别的主要指标):
(1)呼叫频率高;主叫号码存在较高的呼叫频率,远远超过正常使用的频率范围。主叫号码频繁向一个(针对特定受众进行骚扰)或多个(针对大范围受众进行骚扰)被叫号码发起呼叫。
(2)接通率低;对于被叫来说,作为骚扰电话的主叫一般是陌生号码,很多情况下会直接挂断。
(3)平均振铃时间短:诱发骚扰的特点就是诱导用户进行回拨,因此在完成第一次振铃后,骚扰软件即会中止呼叫。
(4)被叫时平均通话时间短:一般情况下,被诱导的用户在回拨后发现是在播放骚扰信息时,会尽快挂断电话。
(5)号码集中度高:诱发骚扰是通过软件进行发起的,其目标用户号码是通过号段设置自动生成的。
(6)拨打空号比例大:由于存在用户销户、换号、挂失、欠费停机等情况,号码段中存在很多空号。被叫号码是用软件根据号段自动生成,因此会出现主叫号码拨打空号比例大的情况。
(7)CS呼叫量与PS流量严重不对等:由于骚扰电话作为特殊用途的电话,CS呼叫量和PS流量一般会严重不对等。
3.分类算法的实施
根据加权朴素贝叶斯分类算法对所有通话进行分类,识别出骚扰电话和非骚扰电话;
算法步骤:
步骤1:对于训练样本集合D,统计类Ci集合中的样本数si,属性xk的样本数count(xk),属性对(xk,xj)的样本数count(xk,xj)。
步骤2:计算先验概率P(Ci)=si/n(n为样本容量),计算和P(xk/Ci)=count(xk)/si。
步骤3:选取类Ci集合中最大的3个条件概率P(xk/Ci)、P(xj/Ci)、P(xl/Ci)的3个属性xk、xj、xl。扫描数据集D,统计类Ci集合中包含值(xk,xj,xl)的样本数count(xk,xj,xl)。类似于公式(2)和(3),计算
利用公式(5)计算确定控制参数β∈(0.1~0.3),使
步骤4:利用公式(5)和(6),计算P(X/Ci)(1≤i≤m)。
步骤5:当P(Ck/X)>P(Ch/X),k≠h时,则X=(x1,x2,…,xp)∈Ck。
4.对识别出的骚扰电话进行回拨检验
对筛选出的灰名单需要进行回拨检测,以减少错误拦截所造成的损失。回拨检测流程如图4所示。
白名单去除
信令监测系统在接口机上定时产生问题呼叫数据记录,并通过FTP的方式将文件定时发送至骚扰电话监测服务器上;监控系统经过分析筛选出可疑号码;然后将可疑号码生成话单文件,通过BOSS(Business&Operation Support System)系统的接口传递给省客服系统。
系统中建立有白名单,过滤掉移动运营商的VIP(钻、金、银卡)用户、被误停导致投诉的正常通信客户以及移动公司内部员工号码,同时还过滤掉移动业务平台外的短号、其他各种正常业务的外呼平台号码,这些号码排除在骚扰电话号码之外,无需给省客服人员回拨确认。
语音识别
疑似骚扰电话主要分为忙音、来电提醒等提示音和代孕、假中奖、诈骗类等骚扰电话,通过对录音的内容进行分类和识别,发现骚扰电话重复性很高,可以引入话音识别技术进行处理。语音识别流程如图5所示。
话音识别系统本质上是一种模版匹配系统,包括预处理、端点检测、特征提取、模版库、模版匹配等基本单元。
(1)预处理
语音信号的预处理包括预加重、分帧和加窗三个步骤。其主要目的是对语音信号采样、去噪、便于后期的特征提取。
预加重通过滤波器提升高频分量并消除工频干扰,常用一阶数字滤波器实现,其系统函数为:其中α是预加重系数,一般取值为0.95。
为了得到短时平稳信号,要对语音进行分帧处理,分帧采用滑动的优先窗口进行加权,保持话音流的连续性。采用的窗口函数为汉明窗,其形式:
话音的端点检测就是根据某些特征参数准确地判断出话音的起点和终点,排除话音的噪音段、静音段等。常用的端点检测参数是短时能量和短时过零率。为提取有效的话音信号,通常采用短时能量和短时过零率相结合的方法进行端点检测。
(2)特征提取(MFCC)
MFCC的提取流程如图6示。
Mel频率表示公式为:Mel(f)=2595×lg(1+f/700),式中f为频率,单位为Hz.
MFCC的提取过程中,首先对话音信号进行分帧、加窗,然后作离散傅立叶变换得频谱分布信息,求出频谱平方,即能量谱,再用Mel滤波器组(通常为三角形带通滤波器)进行滤波,得到功率谱。将每个滤波器的输出取对数并进行反离散余弦变换,得到MFCC系数,MFCC系数计算公式:
由于MFCC只反映了话音参数的静态特性,需对MFCC系数进行差分计算得到反映话音动态变化的差分参数。
(3)模版匹配
在模版匹配的过程中,为了确定参考模版和测试模版的时间对应关系,采用动态时间规整DTW算法,
假设参考模型的特征矢量序列为:{R(1),R(2),…,R(m),…,R(M)},其中m为参考模版语音信号的第m帧,m=1时表示语音帧开始,m=M时表示语音帧结束,即M模版话音的帧数,并且R(m)为第m帧的特征向量。
测试模版的特征矢量序列为:{T(1),T(2),…,T(n),…,T(N)},其中,n为测试模版语音信号的第n帧,n=1时表示话音帧开始,n=M时表示语音帧结束,即M模版话音的帧数,并且T(n)为第n帧的特征向量。
DTW就是通过寻找一个时间规整函数,将测试矢量的时间轴非线性的映射到参考模板的时间轴上。
模板训练过程中,首先对模板录音生成音频列表Addlist,然后对模板录音进行预处理,对音频进行去除静音和切分,将音频切分为数个音频片段,将预处理后的音频片段送入声学特征提取模块,将音频片段转换为对应的特征矢量MFCC,作为模板话音的识别特征,生成模板库Template。为了增强系统的鲁棒性和话音识别的准确率,在实验中选择不同类别的录音进行模板训练,不断丰富模板库。在识别阶段,首先也需要对待测录音生成音频列表Wavlist,然后对待测录音进行预处理和特征提取,提取话音的特征矢量MFCC,最后进行音频匹配,即将待测录音的特征矢量与模板库中话音模板逐一进行相似性度量的比较,从而得出最佳的匹配结果。
客服回拨:对于语音匹配识别不出的可疑号码进一步提交进行人工甄别。
5.骚扰电话的拦截
根据骚扰号码以及呼叫位置,将其分为几种不同的情况进行相应的拦截处理。骚扰电话拦截流程如图7所示。
当客服人员确认该骚扰电话号码为省内移动用户时,将该号码的相关信息发送至系统通过系统关闭骚扰电话号码语音呼叫功能,并短信告知。
当客服人员确认该骚扰电话号码为互联互通用户时,将该号码的相关信息发送至话务网管系统通过话务网管系统在关口局设置黑名单进行屏蔽。当客服人员确认该骚扰电话号码为外省移动用户时,监控系统判断该主叫号码所在地址,如为省内交换机,则通过话务网管系统向省内端局设置黑名单进行屏蔽否则监控系统判断该主叫号码在所在地为外省端局,将该号码的相关信息发送至汇接局通过话务网管系统向移动软交换长途汇接局设置黑名单进行屏蔽。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。
Claims (8)
1.一种骚扰电话的识别与拦截方法,其特征在于:该方法包括以下步骤:
S1:采集通信网信令信息,对采集到的数据进行解码合成、数据去重、协议分析,再根据各种协议规则进行CDR合成;
S2:根据骚扰电话特征选择呼叫频率、接通率、平均振铃时长、被叫时平均通话时间、号码集中度、拨打空号比例、电路交换(Circuit Switched,CS)呼叫量与包交换(PacketSwitched,PS)流量比作为骚扰电话的识别因子;
S3:根据骚扰电话的识别因子采用加权朴素贝叶斯分类算法对所有通话进行分类,识别出骚扰电话和非骚扰电话;
S4:对识别出的骚扰电话进行回拨检验;
S5:拦截骚扰电话。
2.根据权利要求1所述的一种骚扰电话的识别与拦截方法,其特征在于:所述步骤S1包括以下步骤:
S101:针对不同的通信网络选取不同的采集点;其中固网选择软交换(Soft Switch,SS),C网选择移动软交换中心(Mobile Switching Center emulation,MSCE)、归属位置寄存器(Home Location Register,HLR)、MSCE之间的CMAP信令,MSCE、SS之间的ISUP信令,以及MSCE之间的SIP信令,IMS网选择代理/询问呼叫会话控制功能(Proxy/Inquiry-CallSession Control Funtion,P/I-CSCF);
S102:对信令采集模块捕获的数据进行解码,在物理层和数据链路层完成解码重组后通过驱动回调方式将网络层数据发送至解码合成模块;
S103:提取消息特征字段信息,并封装到呼叫合成信息类中;
S104:交给协议分析器进行呼叫合成与协议关联解码;
S105:将同一用户的同一信令流程中相关联的消息组合在一起,形成完整的信令流程。
3.根据权利要求1所述的一种骚扰电话的识别与拦截方法,其特征在于:在步骤S2中,所述呼叫频率为主叫号码频繁向一个或多个被叫号码发起呼叫远超过正常范围的频率;
所述接通率为被叫号码接通主叫号码的概率;
所述平均振铃时长为主叫号码完成振铃的平均时间;
所述被叫时平均通话时间为被叫号码回拨后的通话平均时间;
所述号码集中度为骚扰软件自动生成的被叫用户号段区间;
所述拨打空号比例为被叫号码空号数与被叫号码拨打数的比值;
所述CS呼叫量与PS流量比为CS呼叫量与PS流量的比值。
4.根据权利要求1所述的一种骚扰电话的识别与拦截方法,其特征在于:所述步骤S3具体为:
S301:通过贝叶斯分类器分析呼叫话单,得到主叫号码是骚扰电话的概率P及主叫号码不是骚扰电话的概率P';
S302:通过比较P与P'的大小关系,判断出主叫号码是否是骚扰电话。
5.根据权利要求4所述的一种骚扰电话的识别与拦截方法,其特征在于:所述步骤S301具体为:
S301a:对于训练样本集合D,假设有p个属性指标n个样本,k表示的样本的第k个属性,第j个样本表示为Xj=(xj1+xj2,…,xjp),1≤j≤n,简记X=(x1+x2,…,xp),xi表示第i个属性指标;统计类Ci集合中的样本数si、其样本数count(xk)、属性对(xk,xj)的样本数count(xk,xj),1≤k,j≤p;
S301b:计算先验概率P(Ci)=si/n,其中n为样本容量,计算xk与xj的权重系数和P(xk/Ci)=count(xk)/si,其中为为样本X的属性指标xk与xj的相关系数,为xk与xj的权重系数,1≤k,j≤p;
S301c:选取类Ci集合中最大的3个条件概率P(xk/Ci)、P(xj/Ci)、P(xl/Ci)的3个属性xk、xj、xl,1≤i,j,k≤p,i、j、k分别表示的样本的第i、j、k个属性,;扫描数据集D,统计类Ci集合中包含值(xk,xj,xl)的样本数count(xk,xj,xl),计算
<mrow>
<msubsup>
<mi>we</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>j</mi>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>l</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>*</mo>
</msubsup>
<mo>=</mo>
<mrow>
<mo>|</mo>
<mfrac>
<mrow>
<mi>c</mi>
<mi>o</mi>
<mi>u</mi>
<mi>n</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>j</mi>
</msub>
<mo>,</mo>
<msub>
<mi>x</mi>
<mi>l</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>-</mo>
<mi>c</mi>
<mi>o</mi>
<mi>u</mi>
<mi>n</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>c</mi>
<mi>o</mi>
<mi>u</mi>
<mi>n</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>c</mi>
<mi>o</mi>
<mi>u</mi>
<mi>n</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>l</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>/</mo>
<msup>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mn>2</mn>
</msup>
</mrow>
<mrow>
<mi>c</mi>
<mi>o</mi>
<mi>u</mi>
<mi>n</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>c</mi>
<mi>o</mi>
<mi>u</mi>
<mi>n</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>k</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>&CenterDot;</mo>
<mi>c</mi>
<mi>o</mi>
<mi>u</mi>
<mi>n</mi>
<mi>t</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>x</mi>
<mi>l</mi>
</msub>
<mo>)</mo>
</mrow>
<mo>/</mo>
<msup>
<msub>
<mi>s</mi>
<mi>i</mi>
</msub>
<mn>2</mn>
</msup>
</mrow>
</mfrac>
<mo>|</mo>
</mrow>
<mo>;</mo>
</mrow>
利用公式计算其中,表示相乘的个数,β是控制参数,取值范围为0.1~0.3,由样本大小决定;选择控制参数β使得weX的值尽可能取值为1;
确定控制参数β∈(0.1~0.3),使
S301d:计算P(X/Ci)(1≤i≤m),m为数据类别,假设数据集有m个类别,表示为C1,C2,…,Cm;
S301e:当P(Ck/X)>P(Ch/X),k≠h时,则X=(x1,x2,…,xp)∈Ck。
6.根据权利要求1所述的一种骚扰电话的识别与拦截方法,其特征在于:所述步骤S4包括以下步骤:
S401:去除确认的非骚扰电话号码,根据系统中建立的白名单对监控系统经过分析筛选出的可疑号码进行剔除;
S402:引入语音识别技术对可疑骚扰电话进行语音匹配,判断是否为骚扰电话;
S403:对语音匹配识别不出的可疑号码进一步提交进行人工甄别。
7.根据权利要求6所述的一种骚扰电话的识别与拦截方法,其特征在于:所述步骤S402包括以下步骤:
S402a:对语音信号进行预处理;
通过滤波器提升高频分量并消除工频干扰,其系统函数为:其中α是预加重系数,取值为0.95;
对语音进行分帧处理,分帧采用滑动的优先窗口进行加权,采用的窗口函数为汉明窗,其形式为
采用短时能量和短时过零率相结合的方法进行端点检测,L表示阶数;
S402b:特征提取MFCC;
首先对语音信号进行分帧、加窗,然后作离散傅立叶变换得频谱分布信息,求出频谱平方,即能量谱,再用Mel滤波器组进行滤波,得到功率谱;将每个滤波器的输出取对数并进行反离散余弦变换,得到MFCC系数,MFCC系数计算公式:其中L表示阶数,M为滤波器个数,S(m)为当m帧信号的对数频谱,N为总帧数,C(n)表示第n阶的MFCC系数;
对MFCC系数进行差分计算得到反映语音动态变化的差分参数;
S402c:模版匹配;
采用动态时间规整DTW算法,确定参考模版和测试模版的时间对应关系,
假设参考模型的特征矢量序列为:{R(1),R(2),…,R(m),…,R(M)},其中m为参考模版语音信号的第m帧,m=1时表示语音帧开始,m=M时表示语音帧结束,即M模版话音的帧数,R(m)为第m帧的特征向量;
假设测试模版的特征矢量序列为:{T(1),T(2),…,T(n),…,T(N)},其中,n为测试模版语音信号的第n帧,n=1时表示话音帧开始,n=M时表示语音帧结束,即M模版话音的帧数,T(n)为第n帧的特征向量;
模板训练阶段,首先对模板录音生成音频列表Addlist,然后对模板录音进行预处理,对音频进行去除静音和切分,将音频切分为数个音频片段,将预处理后的音频片段送入声学特征提取模块,将音频片段转换为对应的特征矢量MFCC,作为模板话音的识别特征,生成模板库Template;在实验中选择不同类别的录音进行模板训练,丰富模板库;
识别阶段,首先对待测录音生成音频列表Wavlist,然后将待测录音的特征矢量与模板库中话音模板逐一进行相似性度量的比较,从而得出最佳的匹配结果。
8.根据权利要求1所述的一种骚扰电话的识别与拦截方法,其特征在于:所述步骤S5包括以下步骤:
S501:将骚扰电话分为互联互通用户和外省移动用户进行相应处理;
S502:对于互联互通用户,将该号码的相关信息发送至话务网管系统通过话务网管系统在关口局设置黑名单进行屏蔽;对于外省移动用户,监控系统判断该主叫号码所在地址,若位于省内交换机,则通过话务网管系统向省内端局设置黑名单进行屏蔽,否则,监控系统判断该主叫号码在所在地为外省端局,将该号码的相关信息发送至汇接局通过话务网管系统向移动软交换长途汇接局设置黑名单进行屏蔽。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710552232.1A CN107331385A (zh) | 2017-07-07 | 2017-07-07 | 一种骚扰电话的识别与拦截方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710552232.1A CN107331385A (zh) | 2017-07-07 | 2017-07-07 | 一种骚扰电话的识别与拦截方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107331385A true CN107331385A (zh) | 2017-11-07 |
Family
ID=60197044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710552232.1A Pending CN107331385A (zh) | 2017-07-07 | 2017-07-07 | 一种骚扰电话的识别与拦截方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107331385A (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108834149A (zh) * | 2018-06-29 | 2018-11-16 | 联想(北京)有限公司 | 一种处理方法、处理设备及系统 |
CN109377983A (zh) * | 2018-10-18 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 一种基于语音交互的骚扰电话拦截方法及相关设备 |
CN109587350A (zh) * | 2018-11-16 | 2019-04-05 | 国家计算机网络与信息安全管理中心 | 一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法 |
CN109996237A (zh) * | 2018-01-02 | 2019-07-09 | 中兴通讯股份有限公司 | 一种VoLTE网络中发现骚扰电话的方法及装置 |
CN110061974A (zh) * | 2019-03-28 | 2019-07-26 | 国家计算机网络与信息安全管理中心 | 一种信令管理系统及方法 |
CN110401779A (zh) * | 2018-04-24 | 2019-11-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN110414543A (zh) * | 2018-04-28 | 2019-11-05 | 中国移动通信集团有限公司 | 一种电话号码危险级别的判别方法、设备以及计算机存储介质 |
CN110505353A (zh) * | 2019-08-30 | 2019-11-26 | 北京泰迪熊移动科技有限公司 | 一种号码识别方法、设备及计算机存储介质 |
CN111708887A (zh) * | 2020-06-15 | 2020-09-25 | 国家计算机网络与信息安全管理中心 | 一种自定义规则的多模型融合的不良呼叫识别方法 |
CN111797942A (zh) * | 2020-07-23 | 2020-10-20 | 深圳壹账通智能科技有限公司 | 用户信息的分类方法及装置、计算机设备、存储介质 |
CN111970400A (zh) * | 2019-05-20 | 2020-11-20 | 中国移动通信集团陕西有限公司 | 骚扰电话识别方法及装置 |
CN113206909A (zh) * | 2021-04-30 | 2021-08-03 | 中国银行股份有限公司 | 骚扰电话拦截方法及装置 |
EP3873075A1 (en) * | 2020-02-26 | 2021-09-01 | AO Kaspersky Lab | System and method for call classification |
CN114006982A (zh) * | 2021-11-02 | 2022-02-01 | 号百信息服务有限公司 | 一种基于分类梯度提升算法的骚扰号码识别方法 |
CN114025041A (zh) * | 2021-11-29 | 2022-02-08 | 号百信息服务有限公司 | 一种基于信令的非频率特征快速识别骚扰电话系统和方法 |
US11380303B2 (en) | 2020-02-26 | 2022-07-05 | AO Kaspersky Lab | System and method for call classification |
CN115022464A (zh) * | 2022-05-06 | 2022-09-06 | 中国联合网络通信集团有限公司 | 号码处理方法、系统、计算设备、存储介质 |
CN115426435A (zh) * | 2022-11-07 | 2022-12-02 | 四川易景智能终端有限公司 | 骚扰电话拦截方法 |
CN116741151A (zh) * | 2023-08-14 | 2023-09-12 | 成都筑猎科技有限公司 | 一种基于呼叫中心的用户呼叫实时监测系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102647734A (zh) * | 2012-04-10 | 2012-08-22 | 重庆邮电大学 | Lte网络s1接口控制面cdr合成方法及合成装置 |
CN102724645A (zh) * | 2012-06-29 | 2012-10-10 | 深圳市博瑞得科技有限公司 | Gsm网络短信全流程多接口关联方法 |
CN104102875A (zh) * | 2014-07-22 | 2014-10-15 | 河海大学 | 基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统 |
CN104811928A (zh) * | 2015-05-25 | 2015-07-29 | 重庆重邮汇测通信技术有限公司 | 提高lte网络用户数据imsi关联率的方法和系统 |
-
2017
- 2017-07-07 CN CN201710552232.1A patent/CN107331385A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102647734A (zh) * | 2012-04-10 | 2012-08-22 | 重庆邮电大学 | Lte网络s1接口控制面cdr合成方法及合成装置 |
CN102724645A (zh) * | 2012-06-29 | 2012-10-10 | 深圳市博瑞得科技有限公司 | Gsm网络短信全流程多接口关联方法 |
CN104102875A (zh) * | 2014-07-22 | 2014-10-15 | 河海大学 | 基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统 |
CN104811928A (zh) * | 2015-05-25 | 2015-07-29 | 重庆重邮汇测通信技术有限公司 | 提高lte网络用户数据imsi关联率的方法和系统 |
Non-Patent Citations (3)
Title |
---|
刘剑: "基于数据挖掘技术实现骚扰电话识别", 《中国优秀硕士学位论文全文数据库,信息科技辑》 * |
李方: "关于朴素贝叶斯分类算法的改进", 《中国优秀硕士学位论文全文数据库,信息科技辑》 * |
杜海涛 等: "基于话音识别的骚扰电话呼叫检测技术分析", 《电信工程技术与标准化》 * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109996237A (zh) * | 2018-01-02 | 2019-07-09 | 中兴通讯股份有限公司 | 一种VoLTE网络中发现骚扰电话的方法及装置 |
WO2019134441A1 (zh) * | 2018-01-02 | 2019-07-11 | 中兴通讯股份有限公司 | 一种VoLTE网络中发现骚扰电话的方法及装置 |
CN110401779B (zh) * | 2018-04-24 | 2022-02-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN110401779A (zh) * | 2018-04-24 | 2019-11-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN110414543A (zh) * | 2018-04-28 | 2019-11-05 | 中国移动通信集团有限公司 | 一种电话号码危险级别的判别方法、设备以及计算机存储介质 |
CN108834149A (zh) * | 2018-06-29 | 2018-11-16 | 联想(北京)有限公司 | 一种处理方法、处理设备及系统 |
CN109377983A (zh) * | 2018-10-18 | 2019-02-22 | 深圳壹账通智能科技有限公司 | 一种基于语音交互的骚扰电话拦截方法及相关设备 |
CN109587350B (zh) * | 2018-11-16 | 2021-06-22 | 国家计算机网络与信息安全管理中心 | 一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法 |
CN109587350A (zh) * | 2018-11-16 | 2019-04-05 | 国家计算机网络与信息安全管理中心 | 一种基于滑动时间窗口聚合的电信诈骗电话的序列异常检测方法 |
CN110061974A (zh) * | 2019-03-28 | 2019-07-26 | 国家计算机网络与信息安全管理中心 | 一种信令管理系统及方法 |
CN111970400A (zh) * | 2019-05-20 | 2020-11-20 | 中国移动通信集团陕西有限公司 | 骚扰电话识别方法及装置 |
CN111970400B (zh) * | 2019-05-20 | 2021-11-30 | 中国移动通信集团陕西有限公司 | 骚扰电话识别方法及装置 |
CN110505353A (zh) * | 2019-08-30 | 2019-11-26 | 北京泰迪熊移动科技有限公司 | 一种号码识别方法、设备及计算机存储介质 |
US11380303B2 (en) | 2020-02-26 | 2022-07-05 | AO Kaspersky Lab | System and method for call classification |
EP3873075A1 (en) * | 2020-02-26 | 2021-09-01 | AO Kaspersky Lab | System and method for call classification |
CN111708887A (zh) * | 2020-06-15 | 2020-09-25 | 国家计算机网络与信息安全管理中心 | 一种自定义规则的多模型融合的不良呼叫识别方法 |
CN111797942A (zh) * | 2020-07-23 | 2020-10-20 | 深圳壹账通智能科技有限公司 | 用户信息的分类方法及装置、计算机设备、存储介质 |
CN113206909A (zh) * | 2021-04-30 | 2021-08-03 | 中国银行股份有限公司 | 骚扰电话拦截方法及装置 |
CN114006982A (zh) * | 2021-11-02 | 2022-02-01 | 号百信息服务有限公司 | 一种基于分类梯度提升算法的骚扰号码识别方法 |
CN114006982B (zh) * | 2021-11-02 | 2024-04-30 | 号百信息服务有限公司 | 一种基于分类梯度提升算法的骚扰号码识别方法 |
CN114025041A (zh) * | 2021-11-29 | 2022-02-08 | 号百信息服务有限公司 | 一种基于信令的非频率特征快速识别骚扰电话系统和方法 |
CN114025041B (zh) * | 2021-11-29 | 2023-10-13 | 号百信息服务有限公司 | 一种基于信令的非频率特征快速识别骚扰电话系统和方法 |
CN115022464A (zh) * | 2022-05-06 | 2022-09-06 | 中国联合网络通信集团有限公司 | 号码处理方法、系统、计算设备、存储介质 |
CN115426435A (zh) * | 2022-11-07 | 2022-12-02 | 四川易景智能终端有限公司 | 骚扰电话拦截方法 |
CN116741151A (zh) * | 2023-08-14 | 2023-09-12 | 成都筑猎科技有限公司 | 一种基于呼叫中心的用户呼叫实时监测系统 |
CN116741151B (zh) * | 2023-08-14 | 2023-11-07 | 成都筑猎科技有限公司 | 一种基于呼叫中心的用户呼叫实时监测系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107331385A (zh) | 一种骚扰电话的识别与拦截方法 | |
CN104469025B (zh) | 一种基于聚类算法的实时拦截诈骗电话的方法和系统 | |
CN109451182B (zh) | 一种诈骗电话的检测方法和装置 | |
JP6535706B2 (ja) | データセットの3値ビットマップを作成するための方法 | |
US20180082690A1 (en) | Methods and system for reducing false positive voice print matching | |
CN103578470B (zh) | 一种电话录音数据的处理方法及系统 | |
CN103701999B (zh) | 呼叫中心语音通话的监控方法与系统 | |
CN106550155A (zh) | 对可疑号码进行诈骗样本甄别归类及拦截的方法及系统 | |
US8219404B2 (en) | Method and apparatus for recognizing a speaker in lawful interception systems | |
CN108156331A (zh) | 一种智能自动拨号外呼系统及方法 | |
CN104936182B (zh) | 一种智能管控诈骗电话的方法和系统 | |
CN106936997B (zh) | 一种基于社交关系图谱的垃圾语音识别方法和系统 | |
CN103258535A (zh) | 基于声纹识别的身份识别方法及系统 | |
CN109600752A (zh) | 一种深度聚类诈骗检测的方法和装置 | |
CN109658939A (zh) | 一种电话录音未接通原因识别方法 | |
CN110070875B (zh) | 一种基于语音关键词检测和声纹的反电信诈骗方法 | |
CN104410973B (zh) | 一种播放录音的诈骗电话识别方法和系统 | |
CN105244031A (zh) | 说话人识别方法和装置 | |
CN107770777B (zh) | 一种录音诈骗电话的识别方法 | |
CN111131593B (zh) | 骚扰电话识别方法及其装置 | |
CN113794805A (zh) | 一种goip诈骗电话的检测方法、检测系统 | |
CN110337059A (zh) | 一种用户家庭关系的分析算法、服务器及网络系统 | |
CN111918226B (zh) | 基于实时信令的国际高结算盗打行为的分析方法及装置 | |
CN109145050B (zh) | 一种计算设备 | |
CN112511696A (zh) | 呼叫中心ai引擎不良内容鉴别系统及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20171107 |
|
RJ01 | Rejection of invention patent application after publication |