CN102546992A - 一种垃圾语音消息过滤方法、过滤装置及过滤系统 - Google Patents

一种垃圾语音消息过滤方法、过滤装置及过滤系统 Download PDF

Info

Publication number
CN102546992A
CN102546992A CN2011104110172A CN201110411017A CN102546992A CN 102546992 A CN102546992 A CN 102546992A CN 2011104110172 A CN2011104110172 A CN 2011104110172A CN 201110411017 A CN201110411017 A CN 201110411017A CN 102546992 A CN102546992 A CN 102546992A
Authority
CN
China
Prior art keywords
message
speech message
voice
speech
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104110172A
Other languages
English (en)
Inventor
庞小红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2011104110172A priority Critical patent/CN102546992A/zh
Publication of CN102546992A publication Critical patent/CN102546992A/zh
Priority to PCT/CN2012/079116 priority patent/WO2013086860A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/436Arrangements for screening incoming calls, i.e. evaluating the characteristics of a call before deciding whether to answer it
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/50Centralised arrangements for answering calls; Centralised arrangements for recording messages for absent or busy subscribers ; Centralised arrangements for recording messages
    • H04M3/53Centralised arrangements for recording incoming messages, i.e. mailbox systems
    • H04M3/533Voice mail systems
    • H04M3/53333Message receiving aspects

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明实施例公开了一种垃圾语音消息过滤方法,包括:按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;分析所述获取的语音消息是否为垃圾语音消息;若分析结果为是,过滤所述获取的语音消息。本发明实施例还公开了一种垃圾语音消息过滤装置、过滤系统。采用本发明,可主动对语音邮箱业务数据包括的语音消息进行过滤,避免了出现现有技术中在接收到投诉工单后才对垃圾语音进行过滤的被动局面,降低了用户通过语音邮箱业务进行非法活动或不正当竞争活动的风险;同时,在垃圾语音消息的过滤过程中,由于不需要用户的投诉以及相应语音邮箱业务提供商的客户服务系统的参与,因此简化了处理流程,缩短了过滤垃圾语音消息所需的时间。

Description

一种垃圾语音消息过滤方法、过滤装置及过滤系统
技术领域
本发明涉及语音通信领域,尤其涉及一种垃圾语音消息的过滤方法、过滤装置及过滤系统。
背景技术
在现有语音邮箱业务的使用中发现,一些不法分子为一些移动号码开通语音邮箱业务,并对外公布这些移动号码。当用户拨打这些移动号码且无法接通时,呼叫便会转入语音邮箱业务系统。此时用户能听到这些不法分子设置的欢迎语。这些欢迎语的内容大多为传销、赌博等非法内容或不健康内容,这些不良的欢迎语称为垃圾语音消息。
在现有的语音邮箱业务系统中,处理这种垃圾语音消息的方法是:
某个用户听到这种垃圾语音消息之后,向语音邮箱业务提供商的客户服务系统投诉。客服服务系统接到用户的投诉后,再向语音邮箱系统下发一个投诉工单,包含投诉时间、投诉业务、投诉内容、相关移动号码等。语音邮箱业务系统管理员收到这个投诉工单且验证所述投诉工单描述的情况属实之后,则关闭所述移动号码开通的语音邮箱服务。
现有的这种垃圾语音消息处理方法,存在着以下缺点:
(1)若听到垃圾语音消息的用户不向语音邮箱业务提供商的客户服务系统投诉,那么语音邮箱系统管理员根本就不会收到投诉工单,也就不会关闭存在垃圾语音消息的移动号码开通的语音邮箱服务。
(2)采用上述处理方法,用户需要先向语音邮箱业务提供商的客户服务系统后,客户服务系统再将投诉工单转给语音邮箱业务系统管理员,流程复杂,处理垃圾语音消息所需的时间长。
发明内容
本发明实施例提供一种垃圾语音消息过滤方法、过滤装置及过滤系统,可主动过滤垃圾语音消息,缩短过滤垃圾语音消息所需的时间。
为了解决上述技术问题,本发明实施例提供了一种垃圾语音消息过滤方法,包括:
按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;
分析所述获取的语音消息是否为垃圾语音消息;
若分析结果为是,过滤所述获取的语音消息。
相应地,本发明实施例还提供了一种垃圾语音消息过滤装置,包括:
获取模块,用于按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;
分析模块,用于分析所述获取模块获取的语音消息是否为垃圾语音消息;
过滤模块,用于在所述分析模块的分析结果为是时,过来所述获取模块获取的语音消息。
相应地,本发明实施例还提供了一种垃圾语音消息过滤系统,包括上述任一所述的垃圾语音消息过滤装置。
实施本发明实施例,具有如下有益效果:
在满足预设的获取原则的情况下获取语音消息,并分析所述获取的语音消息是否为垃圾语音消息,以及在分析结果为是时,对所述获取的语音消息进行过滤。如此设计,在满足预设的获取原则时,可主动对语音邮箱业务数据包括的语音消息进行过滤,例如对录制的垃圾语音消息进行过滤,避免了出现现有技术中在接收到投诉工单后才对垃圾语音进行过滤的被动局面,降低了用户通过语音邮箱业务进行非法活动或不正当竞争活动的风险,增强了语音邮箱业务的健壮性;同时,在垃圾语音消息的过滤过程中,由于不需要用户的投诉以及语音邮箱业务提供商的客户服务系统的参与,因此简化了处理流程,缩短了过滤垃圾语音消息所需的时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的一种垃圾语音消息过滤方法的第一实施例的流程示意图;
图2是本发明图1中步骤S12的实施例的流程示意图;
图3是本发明提供的一种垃圾语音消息过滤方法的第二实施例的流程示意图;
图4是本发明提供的一种垃圾语音消息过滤方法的第三实施例的流程示意图;
图5是本发明提供的一种垃圾语音消息过滤装置的第一实施例的结构示意图;
图6是本发明图5中分析模块的实施例的结构示意图;
图7是本发明提供的一种垃圾语音消息过滤装置的第二实施例的结构示意图;
图8是本发明提供的一种垃圾语音消息过滤装置的第三实施例的结构示意图;
图9是本发明提供的一种垃圾语音消息过滤系统的实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种垃圾语音消息过滤方法,该方法的执行主体可以是语音邮箱业务系统中的语音邮箱业务服务器,当然,也可以是具有语音邮箱业务控制功能的其它网络设备。下面,将该方法的执行主体是语音邮箱业务服务器为例子进行说明。
请参考图1,是本发明提供的一种垃圾语音消息过滤方法的第一实施例的流程示意图,所述过滤方法包括:
步骤S11,按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;
本步骤具体实现时,包括:
当语音邮箱业务服务器接收到用户发来的呼叫消息且录制了所述用户发来的语音消息后,则从录制的用户发来的语音消息中获取语音消息;进一步地,语音邮箱业务服务器从所述录制的用户发来的语音消息中选取第一语音消息;语音邮箱业务服务器选取第一语音消息的原因是:有选择地分析录制的语音消息是否为垃圾语音消息,从而减少了语音邮箱业务服务器的开销。当然,在语音邮箱业务服务器的处理能力足够或者录制的语音消息比较少时,也可以选取所有的录制的语音消息。
具体实现中,语音邮箱业务服务器选取第一语音消息的方式为:按照预设的第一选取原则,从录制的用户发来的语音消息中选取第一语音消息。所述第一选取原则包括:随机选取原则,N选1选取原则等。
步骤S12,分析所述获取的语音消息是否为垃圾语音消息;
本步骤中,若分析结果为否,语音邮箱业务服务器判断所述获取的语音消息为合法的语音消息,不对其进行处理,退出过滤流程。若分析结果为是,语音邮箱业务服务器则判断所述获取的语音消息为垃圾语音消息,流程进入步骤S13;
步骤S13,过滤所述获取的语音消息。
本步骤中,语音邮箱业务服务器采用诸如拦截或屏蔽等方式对步骤S12中分析出的垃圾语音消息进行过滤。
本实施例中,语音邮箱业务服务器在满足预设的获取原则的情况下获取语音消息,并分析所述获取的语音消息是否为垃圾语音消息,以及在分析结果为是时,对所述获取的语音消息进行过滤。如此设计,在满足预设的获取原则时,语音邮箱业务服务器可主动对语音邮箱业务数据包括的语音消息进行过滤,例如对录制的用户发来的垃圾语音消息进行过滤,避免了出现现有技术中在接收到投诉工单后才对垃圾语音进行过滤的被动局面,降低了用户通过语音邮箱业务进行非法活动或不正当竞争活动的风险,增强了语音邮箱业务的健壮性;同时,语音邮箱业务服务器在过滤垃圾语音消息的过程中,由于不需要用户的投诉以及语音邮箱业务提供商的客户服务系统的参与,因此简化了处理流程,缩短了过滤垃圾语音消息所需的时间。
请参考图2,是本发明图1所示的实施例中步骤S12的第一实施例的流程示意图,当步骤S11中获取到的语音消息是第一语音消息时,所述步骤S12包括:分析所述获取的第一语音消息是否为垃圾语音消息,具体包括:
步骤S21,将由所述第一语音消息转换成的文本消息与预设的文本过滤列表进行匹配,得到文本匹配值;
其中,文本过滤列表是预设的,用于标识需要过滤的文字。一般地,文本过滤列表中列出了一些需要过滤的关键词,如“法轮功”等,当然,文本过滤列表也可以是一些较长的句子。
可以理解的是,在执行步骤S21之前,语音邮箱业务服务器还需要将选取出的第一语音消息转换为文本消息;具体实现中,包括:
语音邮箱业务服务器将所述第一语音消息传送给语音文本转换服务器;该语音文本服务器在接收到第一语音消息后,将所述第一语音消息转换为文本消息,并把转换得到的文本消息返回给语音邮箱业务服务器。其中,语音文本转换服务器可以与语音邮箱业务服务器集成在一起,也可以是独立的设备。
语音邮箱业务服务器接收所述语音文本转换服务器返回的、由所述第一语音消息转换成的文本消息。
步骤S21中,语音邮箱业务服务器将由第一语音消息转换成的文本消息与预设的文本过滤列表匹配之后,得到文本匹配值,该文本匹配值的大小反映文本消息与文本过滤列表的匹配程度。若该文本匹配值越大,则标识文本消息与文本过滤列表的匹配程度较高,文本消息中包含有较多的需要过滤的关键词,第一语音消息为垃圾语音消息的可能性越大;若该文本匹配值越小,则标识文本消息中没有包含或者包含较少需要过滤的关键词,该语音消息为垃圾语音消息的可能性较小。其中,还可以为不同的关键词设置不同的匹配值,从而使得包括匹配值高的关键词的语音消息可以更容易地被挑选出来。
步骤S22,判断所述得到的文本匹配值是否大于预设的匹配阈值;
其中,匹配阈值是预先设定的,用于作为采用文本匹配方式判断该第一语音消息是否为垃圾语音消息时的标准值。语音邮箱业务服务器判断步骤S21中得到的文本匹配值是否大于预设的匹配阈值;若判断结果为是,即判断得到的文本匹配值大于所述预设的匹配阈值时,流程进入步骤S23。
步骤S23,确定所述第一语音消息为垃圾语音消息;
进一步地,在步骤S22中得到的判断结果为否,即语音邮箱业务服务器判断得到的文本匹配值小于或等于所述预设的匹配阈值时,所述第一语音消息比较可疑,但是通过文本匹配方式不能立即判断所述第一语音消息是否为垃圾语音消息。因此,为了更加精确地判断所述第一语音消息是否为垃圾语音消息,流程还可以进入步骤S24。
步骤S24,将所述第一语音消息对应的链接信息传送给管理终端;
本步骤中,语音邮箱业务服务器将所述第一语音消息对应的链接信息传送给管理终端,其目的是:通过管理终端的管理员来检测所述第一语音消息是否为垃圾语音消息。
由于一条链接信息对应一条语音消息,因此在管理终端接收到第一语音消息对应的链接信息之后,管理员点击所述链接信息,即可链接到对应的第一语音消息。管理员通过试听的方式,可准确地检测所述第一语音消息是否为垃圾语音消息,并通过管理终端返回第一检测结果给语音邮箱业务服务器。
其中,需要说明的是,为了减轻管理员的处理负担,可以进一步设置一个发送阈值,该发送阈值小于上述的匹配阈值,从而在一条语音消息的文本匹配值小于匹配阈值但是却大于或等于发送阈值时,才将该语音消息发送给管理终端;可以理解的是,发送阈值的设置可以根据需要进行设置。
步骤S25,接收所述管理终端返回的第一检测结果,所述第一检测结果指示所述第一语音消息是否为垃圾语音消息。
管理终端返回的第一检测结果可以是下述两种情况中的任意一种:
(1)所述第一语音消息是否为垃圾语音消息;
(2)是否需要过滤所述第一语音消息的业务指示。
本步骤中,若语音邮箱业务服务器接收到的第一检测结果是(1)时,则可以直接判断所述第一语音消息是否为垃圾语音消息。若语音邮箱业务服务器接收到的第一检测结果是(2)时,则可以间接地判断第一语音消息是否为垃圾语音消息;具体地,若接收到的第一检测结果是需要过滤所述第一语音消息的业务指示,则语音邮箱业务服务器判断所述第一语音消息为垃圾语音消息;若接收到的第一检测结果是不需要过滤所述第一语音消息的业务指示,则语音邮箱业务服务器判断所述第一语音消息不是垃圾语音消息。
上述步骤中,只有在通过文本匹配方式不能准确地判断所述第一语音消息是否合法之后,语音邮箱业务服务器才将所述第一语音消息对应的链接信息发送给管理终端,由管理终端的管理员来判断所述第一语音消息是否为垃圾语音消息。如此设计,一方面保证了第一语音消息是否为垃圾语音消息的判断结果的准确性,另一方面,也减轻了管理终端管理员的负担与工作量。
本实施例中,语音邮箱业务服务器通过实时分析录制的第一语音消息是否为垃圾语音消息的方法,可主动从源头处(即在语音消息产生时)分析录制的语音消息是否为垃圾语音消息,避免了出现现有技术中在接收到投诉工单后才检测用户投诉的语音消息是否为垃圾语音消息的被动局面。
使用本发明实施例的判断方式,不但保证了第一语音消息是否为垃圾语音消息的判断结果的准确性,而且还减轻了管理终端管理员的负担与工作量。
请参考图3,是本发明提供的一种垃圾语音消息过滤方法的第二实施例的流程示意图,所述方法具体包括:
步骤S31,从录制的用户发来的语音消息中选取第一语音消息;
步骤S32,将由所述第一语音消息转换成的文本消息与预设的文本过滤列表进行匹配,得到文本匹配值;
步骤S33,判断所述得到的文本匹配值是否大于预设的匹配阈值;
步骤S34,若判断所述文本匹配值大于预设的匹配阈值,确定所述第一语音消息为垃圾语音消息。
其中,步骤S32-S34的操作与图2所示的实施例中步骤S21-S23的操作相同,在此不再重复描述。在执行完步骤S34之后,则进入步骤S37。
进一步地,若判断所述文本匹配值小于或等于预设的匹配阈值,所述方法还可以包括:
步骤S35,将所述第一语音消息对应的链接信息发送给管理终端;
步骤S36,接收管理终端返回的第一检测结果,所述第一检测结果指示所述第一语音消息是否为垃圾语音消息;
其中,步骤S35-S36的操作与图2所示的实施例中步骤S24-S25的操作相同,在此不再重复描述。若步骤S36中接收到的第一检测结果指示所述第一语音消息为垃圾语音消息,则进入步骤S37。
步骤S37,过滤所述第一语音消息;
本步骤的操作与图1所示的实施例中步骤S13的操作相同,在此不再详细描述。
当采用步骤S32-S34所述的方法时,不能完全检测出录制的用户发来的垃圾语音消息。其中,采用步骤S32-S34所述的方法不能检测的垃圾语音消息包括:文本匹配值小于预设的匹配阈值的垃圾语音消息,录制的用户发来的语音消息中除去第一语音消息以外的其它垃圾语音消息。当采用步骤S32-S36所述的方法时,同样也不能完全检测出录制的用户发来的垃圾语音消息。其中,采用步骤S32-S36所述的方法不能检测的垃圾语音消息包括:录制的用户发来的语音消息中除去第一语音消息以外的其它垃圾语音消息。因此,语音邮箱业务服务器在向用户播放语音消息时,则有可能向用户播放了垃圾语音消息。
为了进一步地避免出现现有技术中只有接收到投诉工单后才对垃圾语音进行过滤的被动局面,所述方法还可以包括:
步骤S38,将预设检测周期内播放的语音消息的日志数据发送给报表服务器;
其中,预设检测周期,是报表服务器提前预置的、用于检测播放的语音消息是否为垃圾语音消息的周期,例如半天、或者一天等。在预设检测周期到来时,报表服务器向语音邮箱业务服务器发送获取日志数据的请求,该请求指示报表服务器具体需要获取哪个检测周期内的日志数据。语音邮箱业务服务器根据接收到的所述请求的指示,将某一预设检测周期内播放的语音消息的日志数据发送给报表服务器。语音邮箱业务服务器将所述日志数据发送给报表服务器,其目的是:使报表服务器分别统计播放的语音消息对应的语音消息播放次数。
可以理解的是,在执行步骤S38之前,语音邮箱业务服务器需要记录所述预设检测周期内播放的语音消息的日志数据。一条日志数据可以包括:语音邮箱业务用户的号码、该号码对应的语音消息的链接信息、呼叫该语音邮箱业务用户的用户的号码,以及向该呼叫语音邮箱业务用户的用户播放语音消息的时间等。其中,语音邮箱业务用户是定制了语音邮箱业务的用户,呼叫语音邮箱业务用户的用户,是呼叫所述定制了语音邮箱业务的用户的用户。需要说明的是,在将日志数据发送给报表服务器时,语音邮箱业务服务器将预设检测周期内播放的所有语音消息的日志数据都发送给报表服务器。
步骤S39,接收管理终端返回的第二检测结果;
其中,所述第二检测结果指示热门链接信息对应的第二语音消息是否为垃圾语音消息,所述热门链接信息是所述报表服务器发送给所述管理终端的;所述热门链接信息对应的语音消息播放次数大于预设的检测阈值,所述语音消息播放次数是所述报表服务器统计所述日志数据之后得到的。
其中,报表服务器在接收到语音邮箱业务服务器发来的日志数据后,对接收到的日志数据进行统计,得到各条语音消息对应的语音消息播放次数。由于一条语音消息对应一条链接信息,一条链接信息对应一个语音消息播放次数。因此,报表服务器将统计得到的语音消息播放次数与预设的检测阈值进行比较之后,即可挑选出热门链接信息。具体地,报表服务器判断得到的语音消息播放次数是否大于预设的语音消息播放次数,若大于,则挑选出所述语音消息播放次数对应的链接信息,并将所述挑选出的链接信息作为热门链接信息。其中,预设的检测阈值,是预先设定的语音消息播放次数的标准值,该标准值用于确定是否需要检测某一播放的语音消息是否为垃圾语音消息。
由于热门链接信息对应第二语音消息,因此可以理解的是,第二语音消息对应的语音消息播放次数是大于预设的检测阈值的。因此,第二语音消息应当是重点检测的对象,因为在预设检测周期内该第二语音消息被播放的次数较多,为垃圾语音消息的可能性较大,所以报表服务器需要将热门链接信息发送给管理终端,由管理终端的管理员来判断该热门链接信息对应的第二语音消息是否为垃圾语音消息。
在管理终端接收到报表服务发来的热门链接信息后,管理员点击该热门链接信息,即可链接到对应的第二语音消息。管理员通过试听的方式来检测该第二语音消息是否为垃圾语音消息,并通过管理终端返回第二检测结果给语音邮箱业务服务器,该第二检测结果指示所述热门链接信息对应的第二语音消息是否为垃圾语音消息。
管理终端返回的第二检测结果可以是下述两种情况中的任意一种:
(1)所述第二语音消息是否为垃圾语音消息;
(2)是否需要过滤所述第二语音消息的业务指示。
本步骤中,若语音邮箱业务服务器接收到的第二检测结果是(1)时,则可以直接判断所述第二语音消息是否为垃圾语音消息。若语音邮箱业务服务器接收到的第二检测结果是(2)时,则可以间接地判断第二语音消息是否为垃圾语音消息;具体地,若接收到的第二检测结果是需要过滤所述第二语音消息的业务指示,则语音邮箱业务服务器判断所述第二语音消息为垃圾语音消息;若接收到的第二检测结果是不需要过滤所述第二语音消息的业务指示,则语音邮箱业务服务器判断所述第二语音消息不是垃圾语音消息。
步骤S310,若所述第二检测结果指示热门链接信息对应的第二语音消息为垃圾语音消息,过滤所述第二语音消息。
需要说明的是,在报表服务器选择出热门链接信息后,也可通过下述方式来判断该热门链接信息对应的第二语音消息是否为垃圾语音消息:
报表服务器将所述热门链接信息发送给语音邮箱业务服务器,指示语音邮箱业务服务器检测该热门链接信息对应的第二语音消息是否为垃圾语音消息。
语音邮箱业务服务器在接收到报表服务器的通知后,通过步骤S32-S34所述的文本匹配的方式来判断该第二语音消息是否为垃圾语音消息。
本实施例中,语音邮箱业务服务器能够分析获取的第一语音消息是否为垃圾语音消息,以及在分析结果为是时,过滤所述第一语音消息;同时语音邮箱业务服务器还能够在预设检测周期到达时,主动分析预设检测周期内播放的第二语音消息是否为垃圾语音消息,以及在分析结果为是时,过滤所述第二语音消息。如此,则进一步避免了出现现有技术中只有在接收到投诉工单后才对垃圾语音消息进行过滤的被动局面,降低了用户通过语音邮箱业务进行非法活动或不正当竞争活动的风险,增强了语音邮箱业务的健壮性;同时,语音邮箱业务服务器在过滤垃圾语音消息的过程中,由于不需要用户的投诉以及语音邮箱业务提供商的客户服务系统的参与,因此简化了处理流程,缩短了过滤垃圾语音消息所需的时间。
请参考图4,是本发明提供的一种垃圾语音消息过滤方法的第三实施例的流程示意图,所述方法包括:
步骤S41,接收语音网关转发的用户发来的呼叫消息;
用户可通过直接拨打语音邮箱业务接入码或转接语音邮箱业务接入码的方式,与语音邮箱业务服务器建立连接,发送呼叫消息。具体地,用户与语音网关建立连接,语音网关接收用户的呼叫消息,并将该呼叫消息转发给语音邮箱业务服务器。
步骤S42,检测所述呼叫消息指示的用户的类型;
其中,用户可能是定制了语音邮箱业务的用户,也可能是呼叫所述语音邮箱业务用户的用户。例如,假设A用户定制了语音邮箱业务,其在录制欢迎语时,需要拨打语音邮箱业务接入码。B用户在拨打A用户的移动号码且无法接通时,其呼叫会转接到语音邮箱业务服务器。这种情况下,B用户就是呼叫所述语音邮箱业务用户的用户。
在本步骤中,语音邮箱业务服务器可通过判断呼叫接入的电话号码的方式,检测所述用户的类型。若检测到所述呼叫消息指示的用户是语音邮箱业务用户,则流程进入步骤S43,若检测所述呼叫消息指示的用户是呼叫所述语音邮箱业务用户的用户,则流程进入步骤S44。
步骤S43,录制所述语音邮箱业务用户发来的语音消息;
其中,录制的用户发来的语音消息,包括录制的语音邮箱业务用户发来的、用来作为欢迎语的语音消息。不同的语音邮箱业务用户,其发来的欢迎语可能是不一样的。在录制了所述语音邮箱业务用户发来的语音消息之后,进入步骤S47。
步骤S44,向所述呼叫所述语音邮箱业务用户的用户播放语音消息,并记录所述播放的语音消息的日志数据;
步骤S47,按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;
步骤S48,分析所述获取的语音消息是否为垃圾语音消息;
步骤S49,过滤所述获取的语音消息。
其中,步骤S47-S49与图1所示的实施例中的步骤S11-S13的操作相同,在此不再赘述。可以这样理解,在分析获取到的语音消息是否为垃圾语音消息时,可以采用图2所示的实施例中步骤S21-S25所述的方法来分析。
进一步地,在执行步骤S44之后,呼叫语音邮箱业务用户的用户可以进行语音留言,因此该实施例还可以执行:
步骤S45,接收所述呼叫语音邮箱业务用户的用户发来的语音消息;
其中,录制的用户发来的语音消息,还可以包括呼叫所述语音邮箱业务用户的用户发来的语音消息。在步骤S44中,语音邮箱业务服务器向呼叫所述语音邮箱业务用户的用户播放完语音消息后,还提示所述呼叫所述语音邮箱业务用户的用户是否需要留言。若呼叫所述语音邮箱业务用户的用户需要留言,则语音邮箱业务服务器会接收到所述呼叫所述语音邮箱业务用户的用户发来的语音消息,流程进入步骤46,若呼叫所述语音邮箱业务用户的用户不需要留言,则不会接收到所述语音消息。
步骤S46,录制所述呼叫述语音邮箱业务用户的用户发来的语音消息。
本步骤中,在录制了所述呼叫所述语音邮箱业务用户的用户发来的语音消息之后,当语音邮箱业务用户开机时,则会将录制的所述呼叫语音邮箱业务用户的用户发来的语音消息发送给所述语音邮箱业务用户。
其中,需要说明的是,本实施例中步骤S45和步骤S46可以在步骤S47之前执行,也可以在步骤S47之后执行,也可以与步骤S47同时执行,只要步骤S45和步骤S46在步骤S44之后执行都不会影响本发明实施例的实现。
进一步地,本实施例所述的方法还可以包括:采用图3所示的实施例中步骤S38-S310所述的方法来判断播放的语音消息是否为垃圾语音消息。
上述图1-4对本发明提供的垃圾语音消息过滤方法进行了详细的介绍,下面结合附图5-10,对利用了上述方法进行垃圾语音消息过滤方法进行垃圾语音消息过滤的装置、系统进行详细分析。
请参考图5,是本发明提供的一种垃圾语音消息过滤装置的第一实施例的结构示意图,所述过滤装置包括:
获取模块51,用于按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;
其中,获取模块51获取语音邮箱业务数据包括的语音消息时,包括:
当接收到用户发来的呼叫消息且录制了所述用户发来的语音消息后,获取模块51从录制的用户发来的语音消息中获取语音消息;进一步地,获取模块51具体用于从所述录制的用户发来的语音消息中选取第一语音消息;获取模块51选取第一语音消息的原因是:使分析模块有选择地分析录制的语音消息是否为垃圾语音消息,从而减少了过滤装置的开销。当然,在分析模块的处理能力足够或者录制的语音消息比较少时,也可以选取所有的录制的语音消息。
具体实现中,获取模块51选取第一语音消息的方式为:按照预设的第一选取原则,从录制的用户发来的语音消息中选取第一语音消息。所述第一选取原则包括:随机选取原则,N选1选取原则等。
分析模块52,用于分析所述获取模块51获取的语音消息是否为垃圾语音消息;
其中,若分析模块52分析所述获取模块51获取的语音消息不是垃圾语音消息时,则不对所述获取的语音消息进行处理。若分析模块52分析所述获取的语音消息是垃圾语音消息,则控制过滤模块53过滤所述获取的语音消息。
过滤模块53,用于在所述分析模块52的分析结果为是时,过滤所述获取模块51获取的语音消息。
本实施例中,获取模块在满足预设的获取原则的情况下获取语音消息,并通过分析模块分析所述获取的语音消息是否为垃圾语音消息,以及在所述分析模块的分析结果为是时,使用过滤模块过滤所述获取模块获取的语音消息。如此设计,在满足预设的获取原则时,可主动对语音邮箱业务数据包括的语音消息进行过滤,例如对录制的用户发来的垃圾语音消息进行过滤,避免了出现现有技术中在接收到投诉工单后才对垃圾语音进行过滤的被动局面,降低了用户通过语音邮箱业务进行非法活动或不正当竞争活动的风险,增强了语音邮箱业务的健壮性;同时,在垃圾语音消息的过滤过程中,由于不需要用户的投诉以及语音邮箱业务提供商的客户服务系统的参与,因此简化了处理流程,缩短了过滤垃圾语音消息所需的时间。
进一步地,当获取模块51获取到的语音消息是第一语音消息时,图1中的分析模块52用于分析所述第一语音消息是否为垃圾语音消息。具体地,请参考图6,是本发明提供的一种分析模块52的实施例的结构示意图,所述分析模块52包括:
匹配单元61,用于将由所述第一语音消息转换成的文本消息与预设的文本过滤列表进行匹配,得到文本匹配值;
其中,文本过滤列表是预设的,用于标识需要过滤的文字。一般地,文本过滤列表中列出了一些需要过滤的关键词,如“法轮功”等,当然,文本过滤列表也可以是一些较长的句子。
其中,匹配单元61将由第一语音消息转换成的文本消息与预设的文本过滤列表匹配之后,得到文本匹配值,该文本匹配值的大小反映文本消息与文本过滤列表的匹配程度;若该文本匹配值越大,则标识文本消息与文本过滤列表的匹配程度较高,文本消息中包含有较多的需要过滤的关键词,第一语音消息不合法、为垃圾语音消息的可能性越大;若该文本匹配值越小,则标识文本消息中没有包含或者包含较少需要过滤的关键词,该语音消息为垃圾语音消息的可能性较小。其中,过滤装置还可以为不同的关键词设置不同的匹配值,从而使得包括匹配值高的关键词的语音消息可以更容易地被挑选出来。
判断单元62,用于判断所述匹配单元61得到的文本匹配值是否大于预设的匹配阈值;
其中,匹配阈值是预先设定的,用于作为采用文本匹配方式判断该第一语音消息是否为垃圾语音消息时的标准值。判断单元62判断匹配单元61得到的文本匹配值是否大于预设的匹配阈值,若判断结果为是,即判断得到的文本匹配值大于所述预设的匹配阈值时,控制确定单元63确定所述第一语音消息为垃圾语音消息。
确定单元63,用于在所述判断单元62的判断结果为是时,确定所述第一语音消息为垃圾语音消息。
进一步地,所述分析模块还可以包括:
收发单元64,用于在所述判断单元62的判断结果为否时,将所述第一语音消息对应的链接信息发送给管理终端;以及还用于接收管理终端返回的第一检测结果,所述第一检测结果指示所述第一语音消息是否为垃圾语音消息。
其中,当判断单元62的判断结果为否,即判断得到的文本匹配值小于或等于所述预设的匹配阈值时,所述第一语音消息比较可疑,通过文本匹配的方式不能立即判断所述第一语音消息是否为垃圾语音消息。因此,为了更加精确地判断所述第一语音消息是否为垃圾语音消息,所述收发单元64用于将第一语音消息对应的链接信息发送给管理终端,以由管理终端的管理员来判断该链接信息对应的第一语音消息是否为垃圾语音消息。由于一条语音消息对应一条链接信息,因此在管理终端在接收到链接信息之后,管理员点击所述链接信息,即可链接到对应的第一语音消息。管理员通过试听的方式,可准确地检测所述链接信息对应的第一语音消息是否为垃圾语音消息,并通过管理终端返回第一检测结果给收发单元64。
其中,需要说明的是,为了减轻管理员的处理负担,过滤装置可以进一步设置一个发送阈值,该发送阈值小于上述的匹配阈值,从而在一条语音消息的文本匹配值小于匹配阈值但是却大于或等于发送阈值时,收发单元64才将该语音消息发送给管理终端;可以理解的是,发送阈值的设置可以根据需要进行设置。
管理终端返回的第一检测结果可以是下述两种情况中的任意一种:
(1)所述第一语音消息是否为垃圾语音消息;
(2)是否需要过滤所述第一语音消息的业务指示。
本步骤中,若收发单元64接收到的第一检测结果是(1)时,则可以直接判断所述第一语音消息是否为垃圾语音消息。若收发单元64接收到的第一检测结果是(2)时,则可以间接地判断第一语音消息是否为垃圾语音消息。
从上述各单元的工作方式中可以看出,只有在通过文本匹配方式不能准确地判断所述第一语音消息是否合法之后,收发单元64才将所述第一语音消息对应的链接信息发送给管理终端,由管理终端的管理员来判断所述第一语音消息是否为垃圾语音消息。如此,一方面保证了第一语音消息是否为垃圾语音消息的判断结果的准确性,另一方面,也减轻了管理终端管理员的负担与工作量。
可以理解的是,过滤装置在选取出第一语音消息后,还需要将选出的第一语音消息转换为文本消息;具体实现中,包括:
收发单元64,还用于将所述第一语音消息传送给语音文本转换服务器,以及接收所述语音文本转换服务器返回的、由所述第一语音消息转换成文本消息;
其中,语音文本服务器在接收到第一语音消息后,将所述接收到的第一语音消息转换为文本消息,并把转换得到的文本消息返回给收发单元64。
所述匹配单元61,用于将所述收发单元64接收到的文本消息与预设的文本过滤列表进行匹配。
本实施例中,通过分析模块52分析获取模块51获取的第一语音消息是否为垃圾语音消息的方法,可主动从源头处(即在语音消息产生时)分析该录制的语音消息是否为垃圾语音消息,避免了出现现有技术中在接收到投诉工单后才检测用户投诉的语音消息是否为垃圾语音消息的被动局面。
使用本发明实施例的判断方式,不但保证了第一语音消息是否为垃圾语音消息的判断结果的准确性,而且还减轻了管理终端管理员的负担与工作量。
请参考图7,是本发明提供的一种过滤装置的第二实施例的结构示意图,所述过滤装置包括:
获取模块31,用于按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;
分析模块32,用于分析所述获取模块31获取的语音消息是否为垃圾语音消息;
过滤模块33,用于在所述分析模块32的分析结果为是时,过滤所述获取模块31获取的语音消息。
其中,本实施例中的分析模块32的结构可以为图6所描述的结构。当分析模块32中判断单元62的判断结果为否、且收发单元64没有将文本匹配值小于预设的匹配阈值的语音消息送给管理终端时,分析模块32不能完全检测出录制的用户发来的垃圾语音消息;具体地,分析模块32不能检测到的垃圾语音消息包括:文本匹配值小于预设的匹配阈值的语音消息,录制的用户发来的语音消息中除去第一语音消息以外的其它垃圾语音消息。当分析模块32中判断单元62的判断结果为否、且收发单元64将文本匹配值小于预设的匹配阈值的语音消息送给管理终端时,所述分析模块32仍然不能完全检测出录制的用户发来的垃圾语音消息。此时,分析模块32不能检测出的垃圾语音消息包括:录制的用户发来的语音消息中除去第一语音消息以外的其它垃圾语音消息。因此,过滤装置在向用户播放语音消息时,则有可能向用户播放了该垃圾语音消息。
为了进一步地避免出现现有技术中只有接收到投诉工单后才对垃圾语音进行过滤的被动局面,所述装置还包括:
周期收发模块54,用于将预设检测周期内播放的语音消息的日志数据发送给报表服务器;以及接收管理终端返回的第二检测结果;
所述过滤模块53,还用于在所述周期收发模块54接收到的第二检测结果指示热门链接信息对应的第二语音消息为垃圾语音消息时,过滤所述第二语音消息;
其中,所述热门链接信息是所述报表服务器发送给管理终端的;所述热门链接信息对应的语音消息播放次数大于预设的检测阈值,所述语音消息播放次数是所述报表服务器统计所述日志数据之后得到的。
其中,预设检测周期,是报表服务器提前预置的、用于检测播放的语音消息是否为垃圾语音消息的周期,例如半天、或者一天等。在预设检测周期到来时,报表服务器向过滤装置发送获取日志数据的请求,该请求指示报表服务器具体需要获取哪个检测周期内的日志数据。过滤装置的周期收发模块54根据接收到的所述请求的指示,将某一预设检测周期内播放的语音消息的日志数据发送给报表服务器。周期收发模块54将所述播放的语音消息的日志数据发送给报表服务器,其目的是:使报表服务器分别统计播放的语音消息对应的语音消息播放次数。
可以理解的是,在周期收发模块54发送播放的语音消息的日志数据给所述报表服务器之前,过滤装置还需要记录所述播放的语音消息的日志数据;其中,一条日志数据可以包括:语音邮箱业务用户的号码、该号码对应的语音消息的链接信息、呼叫语音邮箱业务用户的用户的号码,以及向该呼叫语音邮箱业务用户的用户播放语音消息的时间等。其中,语音邮箱业务用户是定制了语音邮箱业务的用户,呼叫语音邮箱业务用户的用户,是呼叫所述定制了语音邮箱业务的用户的用户。需要说明的是,在将日志数据发送给报表服务器时,周期收发模块54将预设检测周期内播放的所有语音消息的日志数据都发送给报表服务器。
其中,报表服务器在接收到语音邮箱业务服务器发来的日志数据后,对接收到的日志数据进行统计,得到各条语音消息对应的语音消息播放次数。由于一条语音消息对应一条链接信息,一条链接信息对应一个语音消息播放次数。因此,报表服务器将统计得到的语音消息播放次数与预设的检测阈值进行比较之后,即可挑选出热门链接信息。具体地,报表服务器判断得到的语音消息播放次数是否大于预设的语音消息播放次数,若大于,则挑选出所述语音消息播放次数对应的链接信息,并将所述挑选出的链接信息作为热门链接信息。其中,预设的检测阈值,是预先设定的语音消息播放次数的标准值,该标准值用于确定是否需要检测某一播放的语音消息是否为垃圾语音消息。
由于热门链接信息对应第二语音消息,因此可以理解的是,第二语音消息对应的语音消息播放次数是大于预设的检测阈值的。因此,第二语音消息应当是重点检测的对象,因为在预设检测周期内该第二语音消息被播放的次数较多,为垃圾语音消息的可能性较大,所以报表服务器需要将热门链接信息发送给管理终端,由管理终端的管理员来判断该热门链接信息对应的第二语音消息是否为垃圾语音消息。
在管理终端在接收到报表服务发来的热门链接信息后,管理员点击该热门链接信息,即可链接到对应的第二语音消息。管理员通过试听的方式来检测该第二语音消息是否为垃圾语音消息,并通过管理终端返回第二检测结果给周期收发单元,所述第二检测结果指示所述热门链接信息对应的第二语音消息是否为垃圾语音消息。
管理终端返回的第二检测结果可以是下述两种情况中的任意一种:
(1)所述第二语音消息是否为垃圾语音消息;
(2)是否需要过滤所述第二语音消息的业务指示。
本步骤中,若周期收发模块54接收到的第二检测结果是(1)时,则可以直接判断所述第二语音消息是否为垃圾语音消息。若周期收发模块54接收到的第二检测结果是(2)时,则可以间接地判断第二语音消息是否为垃圾语音消息。
本实施例中所述的过滤装置,能够分析获取的第一语音消息是否为垃圾语音消息,以及在分析结果为是时,过滤所述第一语音消息;同时,还能够在预设检测周期到达时,主动分析预设检测周期内播放的第二语音消息是否为垃圾语音消息,以及在分析结果为是时,过滤所述第二语音消息。如此,则进一步避免了出现现有技术中只有在接收到投诉工单后才对垃圾语音消息进行过滤的被动局面,降低了用户通过语音邮箱业务进行非法活动或不正当竞争活动的风险,增强了语音邮箱业务的健壮性;同时,语音邮箱业务服务器在过滤垃圾语音消息的过程中,由于不需要用户的投诉以及语音邮箱业务提供商的客户服务系统的参与,因此简化了处理流程,缩短了过滤垃圾语音消息所需的时间。
请参考图8,是本发明提供的一种垃圾语音消息过滤装置的第三实施例的结构示意图,所述装置与图6所示的实施例的区别在于,所述装置还包括:
接收模块55,用于接收语音网关转发的用户发来的呼叫消息;
其中,用户可通过直接拨打语音邮箱业务接入码或转接语音邮箱业务接入码的方式,与过滤装置建立连接,发送呼叫消息。具体地,用户与语音网关建立连接,语音网关接收到用户的呼叫消息,并将该呼叫消息转发给过滤装置。
检测模块56,用于检测所述呼叫消息指示的用户的类型,所述呼叫消息是所述接收模块55接收到的;
其中,用户可能是定制了语音邮箱业务的用户本身,也可能是呼叫所述语音邮箱业务用户的用户。检测模块56需要检测所述呼叫消息指示的用户的类型,例如,可通过判断呼叫接入的电话号码的方式,检测所述用户的类型。若检测到所述呼叫消息指示的用户是语音邮箱业务用户,则控制录制模块57录制语音消息;若检测所述呼叫消息指示的用户是呼叫所述语音邮箱业务用户的用户,则控制处理模块58播放语音消息并记录日志数据。
录制模块57,用于在所述检测模块56检测到所述呼叫消息指示的用户是语音邮箱业务用户,录制所述语音邮箱业务用户发来的语音消息;
处理模块58,用于在所述检测模块56检测到所述呼叫消息指示的用户是呼叫所述语音邮箱业务用户的用户,向所述呼叫所述语音邮箱业务用户的用户播放语音消息,并记录所述播放的语音消息的日志数据。
所述获取模块51,用于按照预设的选取原则,从所述录制模块56中获取语音邮箱业务数据包括的语音消息。
进一步地,所述装置还包括:
周期收发模块54,用于将预设检测周期内播放的语音消息的日志数据发送给报表服务器;以及接收管理终端返回的第二检测结果;其中,所述播放的语音消息的日志数据是处理模块58记录的;
所述过滤模块53,还用于在所述周期收发模块54接收到的第二检测结果指示热门链接信息对应的第二语音消息为垃圾语音消息时,过滤所述第二语音消息;
进一步地,所述接收模块55,还用于在所述处理模块58向所述呼叫所述语音邮箱业务用户的用户播放完语音之后,接收所述呼叫所述语音邮箱业务用户的用户发来的语音消息;
所述录制模块57,还用于录制所述呼叫所述语音邮箱业务用户的用户发来的语音消息,该语音消息是所述接收模块55接收到的。
其中,录制模块57录制的语音消息还可以包括呼叫所述语音邮箱业务用户的用户发来的语音消息。在处理模块58向所述呼叫语音邮箱业务用户的用户播放完语音消息后,过滤装置还提示所述呼叫所述语音邮箱业务用户的用户是否需要留言,并通过接收模块55接收所述呼叫所述语音邮箱业务用户的用户发来的语音消息,以及通过录制模块57录制所述呼叫所述语音邮箱业务用户的用户发来的语音消息。
需要说明的是,上述图5-图8实施例中所描述的垃圾语音消息过滤装置,其具体可以是语音邮箱业务系统中的语音邮箱业务服务器。
相应地,本发明实施例还提供了一种包括上述所述的垃圾语音消息过滤装置的系统,具体地,请参考图9,是本发明提供的一种垃圾语音消息过滤系统的实施例的结构示意图,所述系统包括:
语音邮箱业务服务器91,用于当接收到用户发来的呼叫消息且录制了所述用户发来的语音消息后,获取录制的第一语音消息,并将所述第一语音消息发送给语音文本转换服务器;
语音文本转换服务器92,用于接收所述语音邮箱业务服务器91发送的第一语音消息,以及将所述第一语音消息转换为文本消息并返回给所述语音邮箱业务服务器92;
所述语音邮箱业务服务器91,还用于接收所述语音文本转换服务器返回的文本消息,并将其与预设的文本过滤列表进行匹配,得到文本匹配值;以及判断所述得到的文本匹配值是否大于预设的匹配阈值;并在判断结果为是时,确定所述第一语音消息为垃圾语音消息并过滤所述第一语音消息。
其中,所述语音邮箱业务服务器,还用于在语音邮箱业务服务器的判断结果为否时,将所述第一语音消息对应的链接信息发送给管理终端;
进一步地,所述系统还包括:
管理终端93,用于接收所述语音邮箱业务服务器91发来的所述第一语音消息对应的链接信息,并返回第一检测结果给所述语音邮箱业务服务器91,所述第一检测结果指示所述第一语音消息是否为垃圾语音消息,以及在第一检测结果指示所述第一语音消息为垃圾语音消息,过滤所诉第一语音消息。
其中,所述语音邮箱业务服务器91,还用于将预设检测周期内播放的语音消息的日志数据发送给报表服务器;
进一步地,所述系统还包括:
报表服务器94,用于接收所述语音邮箱业务服务器91发来的日志数据;以及还用于统计所述日志数据,得到语音消息播放次数,并通过判断所述语音消息播放次数是否大于预设的检测阈值的方式选出热门链接信息,以及将所述热门链接信息发送给管理终端93,所述热门链接信息对应的语音消息播放次数大于预设的检测阈值;
所述管理终端93,还用于接收所述报表服务器94发来的热门链接信息,并返回第二检测结果给所述语音邮箱业务服务器91,所述第二检测结果指示所述热门链接信息对应的第二语音消息是否为垃圾语音消息。
所述语音邮箱业务服务器91,还用于在所述第二检测结果指示所述热门链接信息对应的第二语音消息为垃圾语音消息时,过滤所述第二语音消息。
进一步地,所述系统还包括:
语音网关95,用于接收用户发来的呼叫消息,并将所述呼叫消息转发所述给语音邮箱业务服务器91。
本实施例中,在满足预设的获取条件时获取语音消息,并分析所述获取的语音消息是否为垃圾语音消息,以及在分析结果为是时,对所述垃圾语音消息进行过滤。如此设计,在满足条件时,可主动对语音邮箱业务数据包括的语音消息进行过滤,例如对录制的用户发来的垃圾语音消息进行过滤,避免了出现现有技术中在接收到投诉工单后才对垃圾语音进行过滤的被动局面,降低了用户通过语音邮箱业务进行非法活动或不正当竞争活动的风险,增强了语音邮箱业务的健壮性;同时,在垃圾语音消息的过滤过程中,由于不需要用户的投诉以及相应语音邮箱业务提供商的客户服务系统的参与,因此简化了处理流程,缩短了过滤垃圾语音消息所需的时间。
进一步地,在预设检测周期到达时,还可以主动分析预设检测周期内播放的第二语音消息是否为垃圾语音消息,以及在分析结果为是时,过滤所述第二语音消息。如此,则进一步避免了出现现有技术中只有接收到投诉工单后才对垃圾语音进行过滤的被动局面,降低了用户通过语音邮箱业务进行非法活动或不正当竞争活动的风险,增强了语音邮箱业务的健壮性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (15)

1.一种垃圾语音消息过滤方法,其特征在于,包括:
按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;
分析所述获取的语音消息是否为垃圾语音消息;
若分析结果为是,过滤所述获取的语音消息。
2.如权利要求1所述的方法,其特征在于,所述按照预设的获取原则,获取语音邮箱业务数据包括的语音消息,包括:
从录制的用户发来的语音消息中选取第一语音消息。
3.如权利要求2所述的方法,其特征在于,所述分析所述获取的语音消息是否为垃圾语音消息包括:
将由所述第一语音消息转换成的文本消息与预设的文本过滤列表进行匹配,得到文本匹配值;
判断所述得到的文本匹配值是否大于预设的匹配阈值;
若判断所述文本匹配值大于预设的匹配阈值,确定所述第一语音消息为垃圾语音消息。
4.如权利要求3所述的方法,其特征在于,若判断所述文本匹配值小于或等于预设的匹配阈值,则
将所述第一语音消息对应的链接信息发送给管理终端;
接收管理终端返回的第一检测结果,所述第一检测结果指示所述第一语音消息是否为垃圾语音消息。
5.如权利要求3或4所述的方法,其特征在于,所述在将由所述第一语音消息转换成的文本消息与预设的文本过滤列表进行匹配,得到文本匹配值之前,还包括:
将所述第一语音消息传送给语音文本转换服务器;
接收所述语音文本转换服务器返回的、由所述第一语音消息转换成的文本消息。
6.如权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
将预设检测周期内播放的语音消息的日志数据发送给报表服务器;
接收管理终端返回的第二检测结果;
若所述第二检测结果指示热门链接信息对应的第二语音消息为垃圾语音消息,过滤所述第二语音消息;
其中,所述热门链接信息是所述报表服务器发送给所述管理终端的;所述热门链接信息对应的语音消息播放次数大于预设的检测阈值,所述语音消息播放次数是所述报表服务器统计所述日志数据之后得到的。
7.如权利要求1-6任一项所述的方法,其特征在于,在按照预设的获取原则,获取语音邮箱业务数据包括的语音消息之前,还包括:
接收语音网关转发的用户发来的呼叫消息;
检测所述呼叫消息指示的用户的类型;
若所述呼叫消息指示的用户是语音邮箱业务用户,录制所述语音邮箱业务用户发来的语音消息;
若所述呼叫消息指示的用户是呼叫所述语音邮箱业务用户的用户,向所述呼叫所述语音邮箱业务用户的用户播放语音消息,并记录所述播放的语音消息的日志数据。
8.一种垃圾语音消息过滤装置,其特征在于,包括:
获取模块,用于按照预设的获取原则,获取语音邮箱业务数据包括的语音消息;
分析模块,用于分析所述获取模块获取的语音消息是否为垃圾语音消息;
过滤模块,用于在所述分析模块的分析结果为是时,过滤所述获取模块获取的语音消息。
9.如权利要求8所述的装置,其特征在于,所述获取模块,
具体用于从录制的用户发来的语音消息中选取第一语音消息。
10.如权利要求9所述的装置,其特征在于,所述分析模块包括:
匹配单元,用于将由所述第一语音消息转换成的文本消息与预设的文本过滤列表进行匹配,得到文本匹配值;
判断单元,用于判断所述匹配单元得到的文本匹配值是否大于预设的匹配阈值;
确定单元,用于在所述判断单元的判断结果为是时,确定所述第一语音消息为垃圾语音消息。
11.如权利要求10所述的装置,其特征在于,所述分析模块还包括:
收发单元,用于在所述判断单元的判断结果为否时,将所述第一语音消息对应的链接信息发送给管理终端;以及还用于接收管理终端返回的第一检测结果,所述第一检测结果指示所述第一语音消息是否为垃圾语音消息。
12.如权利要求11所述的装置,其特征在于,所述收发单元,还用于将所述第一语音消息传送给语音文本转换服务器,以及接收所述语音文本转换服务器返回的由所述第一语音消息转换成的文本消息;
所述匹配单元,用于将所述收发单元接收到的文本消息与预设的文本过滤列表进行匹配。
13.如权利要求8-12任一项所述的装置,其特征在于,所述装置还包括:
周期收发模块,用于将预设检测周期内播放的语音消息的日志数据发送给报表服务器;以及接收管理终端返回的第二检测结果;
所述过滤模块,还用于在所述周期收发模块接收到的第二检测结果指示热门链接信息对应的第二语音消息为垃圾语音消息时,过滤所述第二语音消息;
其中,所述热门链接信息是所述报表服务器发送给管理终端的;所述热门链接信息对应的语音消息播放次数大于预设的检测阈值,所述语音消息播放次数是所述报表服务器统计所述日志数据之后得到的。
14.如权利要求8-13任一项所述的装置,其特征在于,所述装置还包括:
接收模块,用于接收语音网关转发的用户发来的呼叫消息;
检测模块,用于检测所述呼叫消息指示的用户的类型,所述呼叫消息是所述接收模块接收到的;
录制模块,用于在所述检测模块检测到所述呼叫消息指示的用户是语音邮箱业务用户时,录制所述语音邮箱业务用户发来的语音消息;
处理模块,用于在所述检测模块检测到所述呼叫消息指示的用户是呼叫所述语音邮箱业务用户的用户时,向所述呼叫所述语音邮箱业务用户的用户播放语音消息,并记录所述播放的语音消息的日志数据;
所述获取模块,用于按照预设的选取原则,从所述录制模块中获取语音邮箱业务数据包括的语音消息。
15.一种垃圾语音消息过滤系统,其特征在于,所述系统包括如权利要求8-14任一项所述的垃圾语音消息过滤装置。
CN2011104110172A 2011-12-12 2011-12-12 一种垃圾语音消息过滤方法、过滤装置及过滤系统 Pending CN102546992A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN2011104110172A CN102546992A (zh) 2011-12-12 2011-12-12 一种垃圾语音消息过滤方法、过滤装置及过滤系统
PCT/CN2012/079116 WO2013086860A1 (zh) 2011-12-12 2012-07-25 一种垃圾语音消息过滤方法、过滤装置及过滤系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104110172A CN102546992A (zh) 2011-12-12 2011-12-12 一种垃圾语音消息过滤方法、过滤装置及过滤系统

Publications (1)

Publication Number Publication Date
CN102546992A true CN102546992A (zh) 2012-07-04

Family

ID=46352917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104110172A Pending CN102546992A (zh) 2011-12-12 2011-12-12 一种垃圾语音消息过滤方法、过滤装置及过滤系统

Country Status (2)

Country Link
CN (1) CN102546992A (zh)
WO (1) WO2013086860A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102685151A (zh) * 2012-06-05 2012-09-19 陈云昊 语音过滤及转发的方法
WO2013086860A1 (zh) * 2011-12-12 2013-06-20 华为技术有限公司 一种垃圾语音消息过滤方法、过滤装置及过滤系统
CN105100366A (zh) * 2015-07-13 2015-11-25 小米科技有限责任公司 骚扰电话号码确定方法、装置和系统
CN105933289A (zh) * 2016-04-08 2016-09-07 苏州花坞信息科技有限公司 一种在线广播平台
CN107241617A (zh) * 2016-03-29 2017-10-10 北京新媒传信科技有限公司 视频文件的识别方法及装置
CN109858702A (zh) * 2019-02-14 2019-06-07 中国联合网络通信集团有限公司 客户升级投诉的预测方法、装置、设备及可读存储介质
CN112333321A (zh) * 2020-09-24 2021-02-05 咪咕文化科技有限公司 语音检测方法、装置、电子设备及存储介质
CN115037710A (zh) * 2022-06-06 2022-09-09 中国工商银行股份有限公司 一种消息传输方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101262524A (zh) * 2008-04-23 2008-09-10 沈阳东软软件股份有限公司 垃圾语音过滤的方法及系统
CN101288290A (zh) * 2005-06-28 2008-10-15 阿瓦雅综合内阁方案公司 可视语音邮件管理
CN101459718A (zh) * 2009-01-06 2009-06-17 华中科技大学 一种基于移动通信网的垃圾语音过滤方法及其系统
CN101729512A (zh) * 2008-10-27 2010-06-09 成都市华为赛门铁克科技有限公司 一种过滤垃圾电话的方法、装置、代理服务器及终端

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101095337A (zh) * 2004-12-30 2007-12-26 西门子公司 在通信系统中基于内容来区分语音消息的优先次序的方法
US7813482B2 (en) * 2005-12-12 2010-10-12 International Business Machines Corporation Internet telephone voice mail management
CN102196378B (zh) * 2010-03-02 2015-04-01 中兴通讯股份有限公司 短消息业务接入量的控制方法及基站子系统
CN102546992A (zh) * 2011-12-12 2012-07-04 华为技术有限公司 一种垃圾语音消息过滤方法、过滤装置及过滤系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101288290A (zh) * 2005-06-28 2008-10-15 阿瓦雅综合内阁方案公司 可视语音邮件管理
CN101262524A (zh) * 2008-04-23 2008-09-10 沈阳东软软件股份有限公司 垃圾语音过滤的方法及系统
CN101729512A (zh) * 2008-10-27 2010-06-09 成都市华为赛门铁克科技有限公司 一种过滤垃圾电话的方法、装置、代理服务器及终端
CN101459718A (zh) * 2009-01-06 2009-06-17 华中科技大学 一种基于移动通信网的垃圾语音过滤方法及其系统

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013086860A1 (zh) * 2011-12-12 2013-06-20 华为技术有限公司 一种垃圾语音消息过滤方法、过滤装置及过滤系统
CN102685151A (zh) * 2012-06-05 2012-09-19 陈云昊 语音过滤及转发的方法
CN105100366A (zh) * 2015-07-13 2015-11-25 小米科技有限责任公司 骚扰电话号码确定方法、装置和系统
CN105100366B (zh) * 2015-07-13 2018-03-20 小米科技有限责任公司 骚扰电话号码确定方法、装置和系统
US10291774B2 (en) 2015-07-13 2019-05-14 Xiaomi Inc. Method, device, and system for determining spam caller phone number
CN107241617A (zh) * 2016-03-29 2017-10-10 北京新媒传信科技有限公司 视频文件的识别方法及装置
CN105933289A (zh) * 2016-04-08 2016-09-07 苏州花坞信息科技有限公司 一种在线广播平台
CN109858702A (zh) * 2019-02-14 2019-06-07 中国联合网络通信集团有限公司 客户升级投诉的预测方法、装置、设备及可读存储介质
CN109858702B (zh) * 2019-02-14 2021-02-19 中国联合网络通信集团有限公司 客户升级投诉的预测方法、装置、设备及可读存储介质
CN112333321A (zh) * 2020-09-24 2021-02-05 咪咕文化科技有限公司 语音检测方法、装置、电子设备及存储介质
CN115037710A (zh) * 2022-06-06 2022-09-09 中国工商银行股份有限公司 一种消息传输方法和装置

Also Published As

Publication number Publication date
WO2013086860A1 (zh) 2013-06-20

Similar Documents

Publication Publication Date Title
CN102546992A (zh) 一种垃圾语音消息过滤方法、过滤装置及过滤系统
WO2016197675A1 (zh) 骚扰电话的识别方法及装置
US7330536B2 (en) Message indexing and archiving
CN102088520A (zh) 使用呼叫控制及通话录音功能的通话录音系统
CN102802133B (zh) 垃圾信息的识别方法、装置及系统
CN108133061A (zh) 一种诈骗群体识别系统
US7457396B2 (en) Automated call management
CN101262648A (zh) 一种处理垃圾短信的方法和系统
CN103095889A (zh) 一种基于通话模式识别的垃圾呼叫拦截系统及其工作方法
CN101373533A (zh) 基于移动通信信令网关的实时精确营销装置及数据处理方法
CN101335968B (zh) 一种垃圾短消息监控后续处理的方法及系统
CN101854609A (zh) 一种短消息监控系统和方法
CN102055826A (zh) 维护和通讯录中联系人有关的多维相关信息的方法和系统
CN104104772A (zh) 一种欺诈电话提示方法、服务器及系统
CN102036263A (zh) 一种垃圾短信的处理方法、装置和系统
CN102257786A (zh) 用于在不同电信网络中实现合法拦截的适配系统
CN104517191A (zh) 案件回访方法及系统
CN1997058B (zh) 一种高流量短信监控的方法
US20140120885A1 (en) System and method for handling undesired phone calls
CN1520214A (zh) 一种短信息防火墙系统及设立防火墙的方法
MXPA01012606A (es) Sistema y metodo para creacion y procesamiento de registro de llamada.
US10701205B2 (en) Communications network
CN101150625A (zh) 一种呼叫记录的分析方法及装置
CN103024206A (zh) 一种基于电信网防范疑似电话诈骗的实现方法
US8577009B2 (en) Automatic complaint registration for violations of telephonic communication regulations

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120704