CN105827787B - 一种号码标记方法及装置 - Google Patents
一种号码标记方法及装置 Download PDFInfo
- Publication number
- CN105827787B CN105827787B CN201510002329.6A CN201510002329A CN105827787B CN 105827787 B CN105827787 B CN 105827787B CN 201510002329 A CN201510002329 A CN 201510002329A CN 105827787 B CN105827787 B CN 105827787B
- Authority
- CN
- China
- Prior art keywords
- marked
- sensitive
- preset
- audio
- matched
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 239000012634 fragment Substances 0.000 claims abstract description 28
- 238000004891 communication Methods 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims description 43
- 238000012545 processing Methods 0.000 claims description 31
- 230000011218 segmentation Effects 0.000 claims description 20
- 238000012544 monitoring process Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 19
- 230000006399 behavior Effects 0.000 description 13
- 230000006870 function Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 7
- 238000010295 mobile communication Methods 0.000 description 3
- 206010000117 Abnormal behaviour Diseases 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
本发明实施例公开了一种号码标记方法及装置,该方法包括:获取待标记号码;对待标记号码的通话音频进行分析,确定所述待标记号码的通话音频与预设的敏感文本和/或敏感音频片段相匹配时,使用匹配的敏感文本和/或与匹配的敏感音频片段对应的敏感文本对所述待标记号码进行标记;确定不存在与所述待标记号码的通话音频相匹配的敏感文本和/或敏感音频片段时,根据所述通话音频生成特征标签,并根据所述特征标签对所述待标记号码进行标记。本发明实施例由网络侧实现,与用户设备是否安装专用APP、是否能够实现通话和网络连接并发无关,从而扩大了号码标记的服务范围,提高了用户体验,另外,网络侧统一进行号码标记的方式相比于用户手工标记的方式准确性更高。
Description
技术领域
本发明涉及移动通信技术,尤其涉及一种号码标记方法及装置。
背景技术
随着移动通信的普及,移动电话成为人们随身携带的通信工具,移动电话在给人们生活带来便利的同时,也带来了很多烦恼,尤其是各种推销、广告、欺诈等骚扰电话日益猖獗,严重扰乱了人们的日常生活;同时,随着用户通信体验的加深,用户对移动电话服务质量的要求也越来越高,希望在休息、开会、开车等不同场合下,免受不必要电话的打扰,希望能得到更个性化、智能化的移动通信和移动信息服务。为了解决上述问题,目前出现了种类繁多的手机客户端防火墙软件,在终端上由用户对来电进行标记,一般将来电标记为诈骗、广告推销、快递或是根据在线黄页保持的信息进行提示,帮助用户判断是否应该接听,避免不必要的骚扰,现有实施例一种由用户对来电进行标记的操作界面如图1所示。
图2所示为现有终端对来电的处理流程示意图,如图2所示,来电模块接收到来电后需要根据本机存储的通讯录判断是否是陌生来电,如果判断是陌生来电,首先在本地的标记库中检索,检索不到再到网络侧进行查询,根据网络侧的反馈对来电进行标记,用户在通话结束后可以选择对来电进行主动标记。
现有技术虽然可以在一定程度上满足对骚扰电话拦截的需求,但是由于终端和网络的局限性可能存在如下问题:
1、标记数据的来源是用户手工标记,存在准确性问题,同时标记种类有限,无助于用户了解来电的详细信息,并增加了用户对软件或终端设备的学习使用成本,不利于用户体验;
2、需要安装专用的APP,但是大多数的用户并没有主动安装APP的习惯,导致标记功能不能服务所有用户。
3、实现陌生号码的标记功能时,需要在来电的时候实时到网络上去查这个号码是否被标记过,这个功能要求通话和网络连接并发,当用户在2G网络或者是使用通话时会回落到2G的4G终端时(iPhone就是这么处理的),标记功能将会失效,无法实现标记功能。
发明内容
有鉴于此,为解决现有存在的技术问题,本发明实施例提供:
一种号码标记方法,包括:
获取待标记号码;
对待标记号码的通话音频进行分析,确定所述待标记号码的通话音频与预设的敏感文本和/或敏感音频片段相匹配时,使用匹配的敏感文本和/或与匹配的敏感音频片段对应的敏感文本对所述待标记号码进行标记;确定不存在与所述待标记号码的通话音频相匹配的敏感文本和/或敏感音频片段时,根据所述通话音频生成特征标签,并根据所述特征标签对所述待标记号码进行标记。
一具体实施例中,所述获取待标记号码,包括:
进行呼叫监控;
确定满足以下至少一个条件时,确定主叫号码为待标记号码:主叫号码属于预设的号码段;主叫号码归属位置属于预设的归属位置;通信行为满足预设的告警策略,
和/或,
根据预设算法计算主叫号码的加权值,确定所述主叫号码的加权值不小于预设的风险阈值时,确定所述主叫号码为待标记号码。
一具体实施例中,所述对待标记号码的通话音频进行分析,包括:
将预设的敏感音频片段与待标记号码的通话音频进行扫描匹配,
和/或,
将待标记号码的通话音频转换为文本内容;对所述文本内容进行分词处理;将分词处理结果与预设的敏感文本进行匹配。
一具体实施例中,所述根据预设算法计算主叫号码的加权值,包括:
计算以下一项或多项的加权值作为主叫号码的加权值:主叫号码归属地、主叫号码所属人的特征、主叫号码拨号的频率、被叫号码的特点、通信行为、主被叫号码之间的关系。
一具体实施例中,待标记号码的通话音频与预设的一个以上敏感文本相匹配时,按照权重由高到低的顺序,选择至少一个匹配的敏感文本对所述待标记号码进行标记,其中,分词处理结果与预设的敏感文本进行匹配时,命中的次数越多,敏感文本的权重越大。
一具体实施例中,该方法还包括:
根据预设的提示策略,将号码标记提示给用户,所述提示策略涉及以下至少一项:提示时间、提示方式。
本发明实施例还提供一种号码标记装置,包括:待标记号码获取模块、通话音频分析模块、特征标签生成模块、敏感库和号码标记库;其中,
所述待标记号码获取模块,用于获取待标记号码;
所述通话音频分析模块,用于对待标记号码的通话音频进行分析,判断所述待标记号码的通话音频是否与预设的敏感文本和/或敏感音频片段相匹配,以及在确定所述待标记号码的通话音频与预设的敏感文本和/或敏感音频片段相匹配时,使用匹配的敏感文本和/或与匹配的敏感音频片段对应的敏感文本对所述待标记号码进行标记;
所述特征标签生成模块,用于在通话音频分析模块确定不存在与所述待标记号码的通话音频相匹配的敏感文本和/或敏感音频片段时,根据所述通话音频生成特征标签,并根据所述特征标签对所述待标记号码进行标记;
所述敏感库,用于存储预设的敏感文本和/或敏感音频片段;
所述号码标记库,用于存储号码及相应的标记。
一具体实施例中,所述待标记号码获取模块,具体用于:
进行呼叫监控;
确定满足以下至少一个条件时,确定主叫号码为待标记号码:主叫号码属于预设的号码段;主叫号码归属位置属于预设的归属位置;通信行为满足预设的告警策略,
和/或,
根据预设算法计算主叫号码的加权值,确定所述主叫号码的加权值不小于预设的风险阈值时,确定所述主叫号码为待标记号码。
一具体实施例中,所述通话音频分析模块,具体用于:
将预设的敏感音频片段与待标记号码的通话音频进行扫描匹配,
和/或,
将待标记号码的通话音频转换为文本内容;对所述文本内容进行分词处理;将分词处理结果与预设的敏感文本进行匹配。
一具体实施例中,所述待标记号码获取模块具体用于:
计算以下一项或多项的加权值作为主叫号码的加权值:主叫号码归属地、主叫号码所属人的特征、主叫号码拨号的频率、被叫号码的特点、通信行为、主被叫号码之间的关系。
一具体实施例中,所述通话音频分析模块具体用于:
当待标记号码的通话音频与预设的一个以上敏感文本相匹配时,按照权重由高到低的顺序,选择至少一个匹配的敏感文本对所述待标记号码进行标记,其中,分词处理结果与预设的敏感文本进行匹配时,命中的次数越多,敏感文本的权重越大。
一具体实施例中,该装置还包括提示模块,
所述提示模块,用于根据预设的提示策略,将号码标记提示给用户,所述提示策略涉及以下至少一项:提示时间、提示方式。
本发明实施例所述的号码标记方法及装置,获取待标记号码;对待标记号码的通话音频进行分析,确定所述待标记号码的通话音频与预设的敏感文本和/或敏感音频片段相匹配时,使用匹配的敏感文本和/或与匹配的敏感音频片段对应的敏感文本对所述待标记号码进行标记;确定不存在与所述待标记号码的通话音频相匹配的敏感文本和/或敏感音频片段时,根据所述通话音频生成特征标签,并根据所述特征标签对所述待标记号码进行标记。本发明实施例由网络侧实现,与用户设备是否安装专用APP、是否能够实现通话和网络连接并发无关,从而扩大了号码标记的服务范围,提高了用户体验,另外,网络侧统一进行号码标记的方式相比于用户手工标记的方式准确性更高。
附图说明
图1为现有实施例一种由用户对来电进行标记的操作界面示意图;
图2为现有终端对来电的处理流程示意图;
图3为本发明实施例一种号码标记方法流程示意图;
图4为本发明实施例一种号码标记装置结构示意图;
图5为本发明实施例再一种号码标记装置结构示意图;
图6为本发明实施例1所述的号码标记系统结构示意图;
图7为本发明实施例1所述的呼叫监控模块的结构示意图;
图8为本发明实施例1所述的敏感库结构示意图;
图9为本发明实施例1所述的声纹分析单元结构示意图;
图10为本发明实施例1所述的号码标记库结构示意图;
图11为本发明实施例2所述的号码标记方法流程示意图。
具体实施方式
图3为本发明实施例一种号码标记方法流程示意图,如图3所示,该方法包括:
步骤301:获取待标记号码;
步骤302:对待标记号码的通话音频进行分析,确定所述待标记号码的通话音频与预设的敏感文本和/或敏感音频片段相匹配时,转到步骤303;确定不存在与所述待标记号码的通话音频相匹配的敏感文本和/或敏感音频片段时,转到步骤304。
需要说明的是,预设的敏感文本和/或敏感音频片段一般存储于敏感库中,敏感库中敏感文本和敏感音频片段并不一定是一一对应的,可以有的敏感文本对应敏感音频片段,有的敏感文本不对应敏感音频片段,当然,还有可能敏感库中仅包括敏感文本,不包括敏感音频片段。
步骤303:使用匹配的敏感文本和/或与匹配的敏感音频片段对应的敏感文本对所述待标记号码进行标记;
步骤304:根据所述通话音频生成特征标签,并根据所述特征标签对所述待标记号码进行标记。
本发明一具体实施例中,所述获取待标记号码,可以包括:进行呼叫监控;确定满足以下至少一个条件时,确定主叫号码为待标记号码:主叫号码属于预设的号码段;主叫号码归属位置属于预设的归属位置;通信行为满足预设的告警策略(如预设时间段内,号码作为主叫,外呼的次数)。
本发明一具体实施例中,所述获取待标记号码,可以包括:进行呼叫监控;根据预设算法计算主叫号码的加权值,确定所述主叫号码的加权值不小于预设的风险阈值时,确定所述主叫号码为待标记号码。
这里,一般使用如下公式进行加权计算:
其中,N是象限ID,M是总象限,Pn是评价象限的分数,Qn是权重其中部分项的评分是负值,就是说此项可以降低号码的疑似风险。
这里,所述进行呼叫监控一般为记录一段时间内发生的所有呼叫信息。
需要说明的是,上述两个实施例也可以结合应用,即首先判断是否满足以下至少一个条件:主叫号码属于预设的号码段;主叫号码归属位置属于预设的归属位置;通信行为满足预设的告警策略,确定满足至少一个条件时,继续根据预设算法计算所述主叫号码的加权值,确定所述主叫号码的加权值不小于预设的风险阈值,才确定所述主叫号码为待标记号码。
本发明一具体实施例中,所述对待标记号码的通话音频进行分析,包括:将预设的敏感音频片段与待标记号码的通话音频进行扫描匹配,和/或,将待标记号码的通话音频转换为文本内容;对所述文本内容进行分词处理;将分词处理结果与预设的敏感文本进行匹配。
本发明一具体实施例中,所述根据预设算法计算主叫号码的加权值,包括:
计算以下一项或多项的加权值作为主叫号码的加权值:主叫号码归属地、主叫号码所属人的特征、主叫号码拨号的频率、被叫号码的特点、通信行为、主被叫号码之间的关系,上述各项内容的说明及权重可以如表1所示:
表1
本发明一具体实施例中,待标记号码的通话音频与预设的一个以上敏感文本相匹配时,按照权重由高到低的顺序,选择至少一个匹配的敏感文本对所述待标记号码进行标记,其中,分词处理结果与预设的敏感文本进行匹配时,命中的次数越多,敏感文本的权重越大。
本发明一具体实施例中,该方法还包括:
根据预设的提示策略,将号码标记提示给用户,所述提示策略涉及以下至少一项:提示时间、提示方式。
本发明实施例还相应地提出了一种号码标记装置,如图4所示,该装置包括:待标记号码获取模块41、通话音频分析模块42、特征标签生成模块43、敏感库44和号码标记库45;其中,
所述待标记号码获取模块41,用于获取待标记号码;
所述通话音频分析模块42,用于对待标记号码的通话音频进行分析,判断所述待标记号码的通话音频是否与预设的敏感文本和/或敏感音频片段相匹配,以及在确定所述待标记号码的通话音频与预设的敏感文本和/或敏感音频片段相匹配时,使用匹配的敏感文本和/或与匹配的敏感音频片段对应的敏感文本对所述待标记号码进行标记;
所述特征标签生成模块43,用于在通话音频分析模块确定不存在与所述待标记号码的通话音频相匹配的敏感文本和/或敏感音频片段时,根据所述通话音频生成特征标签,并根据所述特征标签对所述待标记号码进行标记;
所述敏感库44,用于存储预设的敏感文本和/或敏感音频片段;
所述号码标记库45,用于存储号码及相应的标记。
本发明一具体实施例中,所述待标记号码获取模块41,具体用于:
进行呼叫监控;
确定满足以下至少一个条件时,确定主叫号码为待标记号码:主叫号码属于预设的号码段;主叫号码归属位置属于预设的归属位置;通信行为满足预设的告警策略,
和/或,
根据预设算法计算主叫号码的加权值,确定所述主叫号码的加权值不小于预设的风险阈值时,确定所述主叫号码为待标记号码。
本发明一具体实施例中,所述通话音频分析模块42,具体用于:
将预设的敏感音频片段与待标记号码的通话音频进行扫描匹配,
和/或,
将待标记号码的通话音频转换为文本内容;对所述文本内容进行分词处理;将分词处理结果与预设的敏感文本进行匹配。
本发明一具体实施例中,所述待标记号码获取模块41具体用于:
计算以下一项或多项的加权值作为主叫号码的加权值:主叫号码归属地、主叫号码所属人的特征、主叫号码拨号的频率、被叫号码的特点、通信行为、主被叫号码之间的关系。
本发明一具体实施例中,所述通话音频分析模块42具体用于:
当待标记号码的通话音频与预设的一个以上敏感文本相匹配时,按照权重由高到低的顺序,选择至少一个匹配的敏感文本对所述待标记号码进行标记,其中,分词处理结果与预设的敏感文本进行匹配时,命中的次数越多,敏感文本的权重越大。
本发明一具体实施例中,如图5所示,该装置还包括提示模块46,
所述提示模块46,用于根据预设的提示策略,将号码标记提示给用户,所述提示策略涉及以下至少一项:提示时间、提示方式(如文本或语音)。
本发明实施例提供的号码标记方案主要由网络侧根据来电信息进行分析处理,并对来电进行智能标记,并可以将分析的结果通过普通的电话方式和用户进行交互,完成标记提醒及处理功能,无需用户安装APP,对通话时处于何种网络也没有要求,从而扩大了号码标记的服务范围,提高了用户体验。
下面通过具体实施例对本发明的技术方案作进一步详细说明。
实施例1
图6所示为本发明实施例1所述的号码标记系统结构示意图,如图6所示,该号码标记系统包括:移动核心网、号码标记装置、BOSS、集中管控平台和现有标记号码库,其中,号码标记装置进一步包括:呼叫监控模块(与待标记号码获取模块41对应)、号码分析模块(与通话音频分析模块42和特征标签生成模块43、敏感库44对应)、号码标记库和提示模块(对应信息提示模块46),其中:
呼叫监控模块用来进行呼叫行为的记录及分析,用于将可疑号码交由号码分析模块统进行分析,本实施例中,呼叫监控模块的结构如图7所示,其中,疑似号码单元保持的是有可能是骚扰电话的号码段及归属位置,根据对号码标记库中号码的分析,将多次出现的号码段或者是号码归属位置作为疑似号码存储进疑似号码单元,在监控过程中如果发现对象号码为疑似号码,将直接交给号码分析模块去做进一步分析;异常行为告警单元可以由后台直接配置告警规则,根据告警规则触发后续的分析流程,比如:单位时间内号码作为主叫,外呼的频率,如:20次/秒,当检查到号码出现如此的异常行为,将启动后续的分析过程。
号码分析模块,用于对号码进行分析、归类以便于给出合理的标签建议,参考图6,本模块包括如下单元:通信行为分析单元、声纹分析单元、敏感库、特征标签智能生成单元,下面将分别介绍各个单元:
通信行为分析单元,根据用户的通信记录及属性进行划分评价维度及权重,可参考表1,并具体计算系统将预置风险阀值H,当D>H时将进一步进行分析。
敏感库是用来对用户通信内容进行分析的依据,如图8所示,可以包括2部分,敏感文本单元和敏感音频单元,其中,敏感文本有一部分来自系统预置,比如保险及其相关同意词;另一部分由系统根据号码标记库的内容添加。敏感音频片段可以包括普通话、英文等版本。
声纹分析单元的主要作用是对可疑号码的通话内容进行分析,以判断号码的类型,参考图9,主要涉及音频片段分析、音频转文本、自然语言处理、关键字匹配,其中,音频片段分析即将敏感库中保存的敏感音频片段和疑似的通话音频进行扫描匹配,以判断是否包括存在的音频片段;音频转文本即将用户音频文件转换为文本内容;自然语言处理即将文本内容根据自然语言的特点进行分词;关键字匹配即根据自然语言处理的分词结果,对敏感库的敏感文本进行搜索,看是否能命中,如果能命中,将使用现有敏感文本,如果不能命中,将进行下一步处理。
特征标签智能生成单元是智能分析系统的自学习部分,根据声纹分析系统的分析结果,对分词结果进行智能处理,具体可以包括:合并近义内容、内容属性归类(推销、诈骗…);自动生成特征标签;标签保存到敏感库,标签的保存数据结构如表2所示:
标签项 | 权重 | 属性 |
保险 | 15 |
表2
其中,标签项表示给用户的通知内容;权重表示当一个可疑号码符合多个标签时,优先选择权重大的标签提示用户;标签的权重值根据可疑音频的分析命中情况增加,命中的次数越多,权重值越大。
之后,将号码及相应的标签存入号码标记库。
参考图10,号码标记库可以包括四个单元:网络请求处理单元、客户端请求处理单元、自学习标签库和标签数据库;其中,网络请求处理单元通过HTTP等网络接口返回相关标签详情;客户端请求处理单元通过HTTP等网络接口为客户端返回标签的详情;自学习标签库保存的是号码分析模块的分析结果;标签数据库从网络侧同步现有系统的标签数据。
信息提示模块用于将号码分析模块的分析结果通过文本、语音等多种方式提示给用户。
实施例2
图11为本发明实施例2所述的号码标记方法流程示意图,如图11所示,该流程包括:
步骤1101:用户A呼叫用户B,呼叫在传统的网络中进行
步骤1102:相比于之前呼叫流程,网络侧会先去号码标记库查询,确定A的号码是否存在于号码标记库中,如果是,转到步骤1107;否则,转到步骤1103。
步骤1103:判断A是否触发预警条件,确定A不符合预警触发条件,则按照原有流程进行,A可以直接呼叫B,否则,转到步骤1104。
步骤1104:根据号码的特征分析判断是否需要通知用户,如果是,转到步骤1105;否则,A可以直接呼叫B。
这里,分析方法参见号码分析模块的描述,如果号码A的加权值超过风险阈值,则需要通知被叫用户,如果不需要通知,则A可以直接呼叫B。
确定需要通知被叫用户后,需要进一步对A的历史通话内容进行声纹分析,再将声纹分析结果在敏感数据库中进行匹配,如匹配到敏感音频片段或敏感文本,则返回相关号码标记,并增加标记信息的权重;如匹配不到则生成特征标签,并将生成的特征标签保存到号码标记数据库中,并返回给用户。
步骤1105:通知放音设备将呼叫B,B接听之后会听见语音播报的A的标记信息,用户可以通过按键比如:按1接听,按2或挂机决绝,按#重新收听。
B选择接听之后,放音设备会通知移动网络将A、B接续起来。A、B之间可以直接接听。
本发明实施例基于用户行为,及自学习系统对来电进行智能分类及标记,有效的突破了用户依赖APP进行来电标记的问题,同时相比于用户手工标记的方法,本发明提供了一种更便捷、客观、标签内容更贴近来电实际情况的来电分析方法。
上述各单元可以由电子设备中的中央处理器(Central Processing Unit,CPU)、数字信号处理器(Digital Signal Processor,DSP)或可编程逻辑阵列(Field-Programmable Gate Array,FPGA)实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (10)
1.一种号码标记方法,其特征在于,该方法包括:
进行呼叫监控;
确定满足以下至少一个条件时,确定主叫号码为待标记号码:主叫号码属于预设的号码段;主叫号码归属位置属于预设的归属位置;通信行为满足预设的告警策略,
和/或,
根据预设算法计算主叫号码的加权值,确定所述主叫号码的加权值不小于预设的风险阈值时,确定所述主叫号码为待标记号码;
对待标记号码的通话音频进行分析,确定所述待标记号码的通话音频与预设的敏感文本和/或敏感音频片段相匹配时,使用匹配的敏感文本和/或与匹配的敏感音频片段对应的敏感文本对所述待标记号码进行标记;确定不存在与所述待标记号码的通话音频相匹配的敏感文本和/或敏感音频片段时,根据所述通话音频生成特征标签,并根据所述特征标签对所述待标记号码进行标记。
2.根据权利要求1所述的方法,其特征在于,所述对待标记号码的通话音频进行分析,包括:
将预设的敏感音频片段与待标记号码的通话音频进行扫描匹配,
和/或,
将待标记号码的通话音频转换为文本内容;对所述文本内容进行分词处理;将分词处理结果与预设的敏感文本进行匹配。
3.根据权利要求1所述的方法,其特征在于,所述根据预设算法计算主叫号码的加权值,包括:
计算以下一项或多项的加权值作为主叫号码的加权值:主叫号码归属地、主叫号码所属人的特征、主叫号码拨号的频率、被叫号码的特点、通信行为、主被叫号码之间的关系。
4.根据权利要求2所述的方法,其特征在于,待标记号码的通话音频与预设的一个以上敏感文本相匹配时,按照权重由高到低的顺序,选择至少一个匹配的敏感文本对所述待标记号码进行标记,其中,分词处理结果与预设的敏感文本进行匹配时,命中的次数越多,敏感文本的权重越大。
5.根据权利要求1至4任一项所述的方法,其特征在于,该方法还包括:
根据预设的提示策略,将号码标记提示给用户,所述提示策略涉及以下至少一项:提示时间、提示方式。
6.一种号码标记装置,其特征在于,该装置包括:待标记号码获取模块、通话音频分析模块、特征标签生成模块、敏感库和号码标记库;其中,
所述待标记号码获取模块,用于进行呼叫监控;
确定满足以下至少一个条件时,确定主叫号码为待标记号码:主叫号码属于预设的号码段;主叫号码归属位置属于预设的归属位置;通信行为满足预设的告警策略,
和/或,
根据预设算法计算主叫号码的加权值,确定所述主叫号码的加权值不小于预设的风险阈值时,确定所述主叫号码为待标记号码;
所述通话音频分析模块,用于对待标记号码的通话音频进行分析,判断所述待标记号码的通话音频是否与预设的敏感文本和/或敏感音频片段相匹配,以及在确定所述待标记号码的通话音频与预设的敏感文本和/或敏感音频片段相匹配时,使用匹配的敏感文本和/或与匹配的敏感音频片段对应的敏感文本对所述待标记号码进行标记;
所述特征标签生成模块,用于在通话音频分析模块确定不存在与所述待标记号码的通话音频相匹配的敏感文本和/或敏感音频片段时,根据所述通话音频生成特征标签,并根据所述特征标签对所述待标记号码进行标记;
所述敏感库,用于存储预设的敏感文本和/或敏感音频片段;
所述号码标记库,用于存储号码及相应的标记。
7.根据权利要求6所述的装置,其特征在于,所述通话音频分析模块,具体用于:
将预设的敏感音频片段与待标记号码的通话音频进行扫描匹配,
和/或,
将待标记号码的通话音频转换为文本内容;对所述文本内容进行分词处理;将分词处理结果与预设的敏感文本进行匹配。
8.根据权利要求6所述的装置,其特征在于,所述待标记号码获取模块具体用于:
计算以下一项或多项的加权值作为主叫号码的加权值:主叫号码归属地、主叫号码所属人的特征、主叫号码拨号的频率、被叫号码的特点、通信行为、主被叫号码之间的关系。
9.根据权利要求7所述的装置,其特征在于,所述通话音频分析模块具体用于:
当待标记号码的通话音频与预设的一个以上敏感文本相匹配时,按照权重由高到低的顺序,选择至少一个匹配的敏感文本对所述待标记号码进行标记,其中,分词处理结果与预设的敏感文本进行匹配时,命中的次数越多,敏感文本的权重越大。
10.根据权利要求6至9任一项所述的装置,其特征在于,该装置还包括提示模块,
所述提示模块,用于根据预设的提示策略,将号码标记提示给用户,所述提示策略涉及以下至少一项:提示时间、提示方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510002329.6A CN105827787B (zh) | 2015-01-04 | 2015-01-04 | 一种号码标记方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510002329.6A CN105827787B (zh) | 2015-01-04 | 2015-01-04 | 一种号码标记方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105827787A CN105827787A (zh) | 2016-08-03 |
CN105827787B true CN105827787B (zh) | 2019-12-17 |
Family
ID=56513497
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510002329.6A Active CN105827787B (zh) | 2015-01-04 | 2015-01-04 | 一种号码标记方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105827787B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107707776B (zh) * | 2016-08-08 | 2021-07-20 | 百度在线网络技术(北京)有限公司 | 用于拦截呼入电话的方法及装置 |
CN107181850B (zh) * | 2017-04-24 | 2021-01-15 | 北京小米移动软件有限公司 | 号码标记方法及装置 |
CN110166637B (zh) * | 2018-02-12 | 2021-07-23 | 深圳市六度人和科技有限公司 | 一种空号识别方法及装置 |
CN109151229A (zh) * | 2018-09-11 | 2019-01-04 | 南京辰睿秋实信息技术有限公司 | 异常呼叫自动识别预警系统及其工作方法、呼叫中心系统 |
CN109065069B (zh) * | 2018-10-10 | 2020-09-04 | 广州市百果园信息技术有限公司 | 一种音频检测方法、装置、设备及存储介质 |
CN114286343B (zh) * | 2021-12-31 | 2023-08-18 | 北京百度网讯科技有限公司 | 多路外呼系统、风险识别方法、设备、介质及产品 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060166661A1 (en) * | 2005-01-26 | 2006-07-27 | Inventec Appliances Corp. | Wireless communication device having a telephone number-limited back calling function |
CN101472007A (zh) * | 2007-12-28 | 2009-07-01 | 中国移动通信集团公司 | 一种确定骚扰电话的方法和系统 |
CN103458412B (zh) * | 2012-06-04 | 2017-03-15 | 百度在线网络技术(北京)有限公司 | 防止电话诈骗的系统、方法及移动终端、云端分析服务器 |
CN102917104A (zh) * | 2012-10-24 | 2013-02-06 | 广东欧珀移动通信有限公司 | 一种根据归属地拦截电话的方法及装置 |
CN103167167B (zh) * | 2013-02-01 | 2015-07-01 | 深圳市金立通信设备有限公司 | 一种移动终端及通信联系人信息的提取方法 |
CN103731832A (zh) * | 2013-12-26 | 2014-04-16 | 黄伟 | 防电话、短信诈骗的系统和方法 |
-
2015
- 2015-01-04 CN CN201510002329.6A patent/CN105827787B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN105827787A (zh) | 2016-08-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105827787B (zh) | 一种号码标记方法及装置 | |
CN112804400B (zh) | 客服呼叫语音质检方法、装置、电子设备及存储介质 | |
KR102366307B1 (ko) | 협력형 전화 평판 시스템 | |
US20110021178A1 (en) | Classification of voice messages based on analysis of the content of the message and user-provisioned tagging rules | |
CN104168560A (zh) | 显示陌生号码相关信息的方法、监测装置及云端服务器 | |
CN106303058A (zh) | 防诈骗语音识别方法及系统 | |
CN110138980B (zh) | 一种智能外呼方法、装置、存储介质和服务器 | |
US10659605B1 (en) | Automatically unsubscribing from automated calls based on call audio patterns | |
CN102497481A (zh) | 语音拨号方法、装置及系统 | |
CN111028834B (zh) | 语音信息提醒方法、装置、服务器和语音信息提醒设备 | |
US11973898B2 (en) | Identifying, screening, and blocking of calls from problematic telecommunications carriers and number blocks | |
WO2020017243A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
CN105045911B (zh) | 一种用于用户进行标记的标签生成方法及设备 | |
CN112637428A (zh) | 无效通话判断方法、装置、计算机设备及存储介质 | |
CN107247792B (zh) | 匹配职能部门的方法、装置及计算机设备 | |
CN110750626B (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN104394258B (zh) | 对通讯对象的联系方式变化进行处理的方法和装置 | |
EP2913822B1 (en) | Speaker recognition | |
CN114328867A (zh) | 一种人机对话中智能打断的方法及装置 | |
CN105869631B (zh) | 语音预测的方法和装置 | |
CN111210827B (zh) | 响应报警的方法、装置、电子设备及可读存储介质 | |
CN111640450A (zh) | 多人声音频处理方法、装置、设备及可读存储介质 | |
CN110740212A (zh) | 基于智能语音技术的通话接听方法、装置及电子设备 | |
CN107645613A (zh) | 服务转接的方法和装置 | |
CN110798576A (zh) | 一种来电身份识别方法、装置以及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |