CN112333321A - 语音检测方法、装置、电子设备及存储介质 - Google Patents

语音检测方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112333321A
CN112333321A CN202011015125.3A CN202011015125A CN112333321A CN 112333321 A CN112333321 A CN 112333321A CN 202011015125 A CN202011015125 A CN 202011015125A CN 112333321 A CN112333321 A CN 112333321A
Authority
CN
China
Prior art keywords
voice
harassing
voice data
redis
subscription
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011015125.3A
Other languages
English (en)
Inventor
郑娟娟
吴耀华
郑彬戈
李小海
孙凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
MIGU Culture Technology Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
MIGU Culture Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, MIGU Culture Technology Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN202011015125.3A priority Critical patent/CN112333321A/zh
Publication of CN112333321A publication Critical patent/CN112333321A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/66Substation equipment, e.g. for use by subscribers with means for preventing unauthorised or fraudulent calling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue

Abstract

本发明实施例公开了一种语音检测方法、装置、电子设备及存储介质,所述方法包括:基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据;基于预先得到的骚扰语音模板,判断语音数据是否为骚扰语音;如果语音数据是骚扰语音,则在语音数据发送到接收方之前,拦截语音数据。本发明实施例可以在接收方接收到发送方发送的语音数据之前,基于Redis订阅发布机制,将语音数据迅速发布给TTS系统,这样,TTS系统可以及时地验证发送方发送的语音数据是否为骚扰语音,并在验证其为骚扰语音的情况下,拦截掉该骚扰语音,接收方不会接收到骚扰语音,从而,接收方不需要额外的操作,也不会受到骚扰语音的骚扰,进而,提升用户的体验。

Description

语音检测方法、装置、电子设备及存储介质
技术领域
本发明涉及通信技术领域,具体涉及一种语音检测方法、装置、电子设备及存储介质。
背景技术
目前,用户的移动设备如手机中经常会接收到骚扰语音,为了避免被骚扰语音的骚扰,通常在手机中安装一些防骚扰软件,以通过标记骚扰号码或者直接加黑名单的方式,对骚扰语音进行处理。这种方式增加了用户的负担,用户需要下载防骚扰软件;另外,防骚扰软件一般要求用户开启多个权限,因此,可能增加用户信息二次泄露或感染病毒的风险;此外,标记的黑名单号码有被相应的电信运营商收回后洗白的可能,当被洗白后,在用户的手机中还是被标记为黑名单,导致不能够接收到该号码的消息。
发明内容
基于现有技术中存在的问题,本发明实施例提出了一种语音检测方法、装置、电子设备及存储介质。
第一方面,本发明实施例提供了一种语音检测方法,包括:
基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据;
基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音;
如果所述语音数据是骚扰语音,则在所述语音数据发送到接收方之前,拦截所述语音数据。
进一步地,所述基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据,包括:
所述TTS系统订阅所述Redis订阅发布机制中的第一频道,以通过所述第一频道接收通过所述Redis订阅发布机制发布到所述第一频道上的语音数据;其中,所述第一频道是所述Redis订阅发布机制发布语音数据的频道。
进一步地,所述TTS系统订阅所述Redis订阅发布机制中的第一频道,以通过所述第一频道接收通过所述Redis订阅发布机制发布到所述第一频道上的语音数据,包括:
所述TTS系统获取所述Redis订阅发布机制的Redis句柄;
根据所述Redis订阅发布机制的Redis句柄,创建订阅所述第一频道的第一订阅线程;
基于所述第一订阅线程,从所述第一频道中获得所述语音数据。
进一步地,在所述判断所述语音数据是否为骚扰语音之前,所述方法还包括:
获得所述骚扰语音模板;其中,所述骚扰语音模板包括根据多个骚扰语音样本得到的用于匹配骚扰语音的语音特征;
所述获得所述骚扰语音模板包括:
分别对所述多个骚扰语音样本进行语音特征提取,得到对应于每一个骚扰语音样本的语音特征;
根据对应于每一个骚扰语音样本的语音特征得到所述骚扰语音模板;
所述基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音,包括:
提取所述语音数据的语音特征;
对所述语音数据的语音特征和所述骚扰语音模板的语音特征进行特征匹配;
如果匹配成功,则确定所述语音数据是骚扰语音。
进一步地,在所述分别对所述多个骚扰语音样本进行语音特征提取之前,所述方法还包括:
获取所述多个骚扰语音样本;
获取所述多个骚扰语音样本,包括:
所述TTS系统通过订阅的所述Redis订阅发布机制中的第二频道接收电信运营商发送到所述第二频道的所述多个骚扰语音样本,其中,所述第二频道是电信运营商发送所述多个骚扰语音样本的频道,所述多个骚扰语音样本为所述电信运营商预先收集得到。
进一步地,所述TTS系统通过订阅的所述Redis订阅发布机制中的第二频道接收电信运营商发送到所述第二频道的所述多个骚扰语音样本,包括:
根据所述Redis订阅发布机制的Redis句柄,创建订阅所述第二频道的第二订阅线程;
基于所述第二订阅线程,从所述第二频道中获得所述多个骚扰语音样本。
进一步地,所述基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据,包括:
通过多个端口并行接收方式,获取所述Redis订阅发布机制发布的由多个发送方向一个或多个接收方发送的多个语音数据。
第二方面,本发明实施例还提供了一种语音检测装置,包括:
获取模块,用于基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据;
判断模块,用于基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音;
拦截模块,用于在所述判断模块判断所述语音数据是骚扰语音的情况下,在所述语音数据发送到接收方之前,拦截所述语音数据。
第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的语音检测方法。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的语音检测方法。
由上述技术方案可知,本发明实施例提供的语音检测、装置、电子设备及存储介质,可以在接收方接收到发送方发送的语音数据之前,基于Redis订阅发布机制,将语音数据迅速发布给TTS系统,这样,TTS系统可以及时地根据可匹配到是否为骚扰语音的骚扰语音模板验证发送方发送的语音数据是否为骚扰语音,并在验证其为骚扰语音的情况下,拦截掉该骚扰语音,接收方不会接收到骚扰语音,从而,在具有骚扰语音检测效率高的同时,接收方不需要额外的操作,也不会受到骚扰语音的骚扰,进而,提升用户的体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些图获得其他的附图。
图1是本发明一实施例提供的语音检测方法的流程图;
图2是本发明一实施例提供的语音检测方法的获取语音数据的示意图;
图3是本发明一实施例提供的语音检测方法中通过专用网卡获取语音数据的示意图;
图4是Redis订阅发布机制中Redis订阅发布架构示意图;
图5是Redis订阅发布机制的发布消息的示意图;
图6是本发明一实施例提供的语音检测方法的TTS系统与电信运营商通过Web平台进行骚扰语音样本的交互示意图;
图7是本发明一实施例提供的语音检测方法的提取骚扰语音样本的语音特征的示意图;
图8是本发明一实施例提供的语音检测装置的结构示意图;
图9是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
下面结合附图,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
以下结合附图描述根据本发明实施例的语音检测方法、系统、电子设备及存储介质。
图1示出了本发明一实施例提供的语音检测方法的流程图,如图1所示,本发明实施例提供的语音检测方法,具体包括如下内容:
S101:基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据。
其中,当发送方向接收方发送语音数据时,通过电信管道转发,Redis订阅发布机制可以从电信管道中获得语音数据,并将其发布给TTS系统。
电信管道指电信运营商提供的电信管道,具体可以是电信运营商的通信网络,发送方可以是使用电信运营商(简称为运营商)提供的第一电话号码的第一终端,接收方可以是使用电信运营商提供的第二电话号码的第二终端。在通信时,第一终端通过电信运营商提供的语音流通道转发语音数据给第二终端。即:第一终端向第二终端发送语音数据时,语音数据经过电信运营商的语音流通道,因此,可以在电信运营商的语音流通道中截获语音数据,或者在电信运营商的语音流通道中将语音数据通过引流的方式引流到语音流通道的外部而获取到。
在以上描述中,第一终端和第二终端例如为智能手机。
在具体应用中,如图2所示,当语音数据(也称为语音流)到达运营商语音流管道(即:电信运营商的语音流通道)时,Redis订阅发布机制通过引流的方式获得语音数据,并将其发布给TTS系统,即:通过Redis和TTS系统相结合,使语音数据达到TTS系统中。
在以上描述中,TTS系统可以内置在电信管道中,从而在发送方通过电信管道转发语音数据给接收方时,TTS系统可以更便捷地获取到语音数据;当然,TTS系统也可以独立于电信管道以外,例如一个独立的网元设备的形式存在,其中,图2所示的为TTS系统独立于电信管道以外,即:通过Redis订阅发布机制将语音流引流到TTS系统中。
在具体应用中,基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据,包括:TTS系统订阅所述Redis订阅发布机制中的第一频道,即:通过预先订阅的所述Redis订阅发布机制中的第一频道,其中,第一频道是Redis订阅发布机制发布语音数据的频道,接收电信管道发布到第一频道上的语音数据,即:通过Redis订阅发布机制,当有语音数据时,TTS系统可以实时地从电信管道中引流出语音数据。也就是说,TTS系统预先订阅Redis订阅发布机制中的第一频道,这样,便可以通过第一频道接收通过Redis订阅发布机制发布到第一频道上的语音数据。
具体地说,TTS系统订阅Redis订阅发布机制中的第一频道,以通过第一频道接收通过Redis订阅发布机制发布到所述第一频道上的语音数据,包括:TTS系统获取所述Redis订阅发布机制的Redis句柄;根据Redis订阅发布机制的Redis句柄,创建订阅第一频道的第一订阅线程;这样,便可以基于第一订阅线程,从第一频道中获得语音数据。
由于电信运营商的客户量庞大,同一时间或者同一时间段内通常会有很多的发送方向很多的接收方发送语音数据,即:电信运营商的语音数据通到中通常同时传输数量庞大的多个语音数据。
因此,在本发明的一个实施例中,基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据,包括:通过多个端口并行接收方式,获取Redis订阅发布机制发布的由多个发送方向一个或多个接收方发送的多个语音数据。具体来说,TTS系统可以通过预先设计好的专用网卡满足语音数据的传输数据量庞大的需求。例如:来自不同电话号码的多个发送方同一时间或者同一时间段内向一个或者多个不同的接收方发送语音数据,此时,通过多个端口并行接收方式,可以及时且快速地获取到这些语音数据。换言之,TTS系统包括多个处理节点,多个处理节点构成TTS系统中的处理节点进群,这些处理节点均订阅了Redis订阅发布机制作用的第一频道,这样,基于Redis订阅发布机制,每个处理节点均能够快速地得到语音数据,并且,当同时有多个语音数据时,可以在处理节点上实现均衡,即:均衡每个处理节点上的处理量。
当然,TTS系统也可以直接获取语音数据。如图3所示,专用网卡可以实现多端口并行接入,图3中示出了三个端口并行接入,三个端口为捕包口GE0、捕包口GE1和捕包口GE2,即:来自电信运营商的语音流通道的数据流量(即:多个语音数据)可以分别通过捕包口GE0、捕包口GE1和捕包口GE2发送给TTS系统,由此,TTS系统可以及时地获取到电信运营商的语音流通道中传输的多个语音数据,避免了丢包或者获取语音数据的延迟等问题的发生。
在以上描述中,电信运营商向TTS系统发送语音数据时,语音数据可以通过RTP(实时传输协议,Real-time Transport Protocol)协议承载,即:通过RTP协议进行语音数据的传输。
需要说明的是,图3中示出的包括三个端口的专用网卡仅是示例性的,在其它示例中,也可以根据需要添加或者减少端口的数量。
S102:基于预先得到的骚扰语音模板,判断语音数据是否为骚扰语音。
在本发明的一个实施例中,骚扰语音模板例如包括根据多个骚扰语音样本得到的用于匹配骚扰语音的语音特征。
在一个或多个示例中,多个骚扰语音样本可以是电信管道发送的。例如:在分别对多个骚扰语音样本进行语音特征提取之前,本发明实施例的方法还包括:获取多个骚扰语音样本;获取所述多个骚扰语音样本,包括:基于Redis订阅发布机制的消息通信模式,TTS系统通过通过订阅的Redis订阅发布机制中的第二频道接收电信运营商发送到所述第二频道的多个骚扰语音样本,其中,第二频道是电信运营商发送多个骚扰语音样本的频道,多个骚扰语音样本可以是电信运营商预先收集得到。
在该示例中,基于Redis订阅发布机制的消息通信模式,通过订阅的第二频道接收电信运营商发送到第二频道的所述多个骚扰语音样本,包括:根据Redis订阅发布机制的Redis句柄,创建订阅线程;基于订阅线程,从第二频道中获得多个骚扰语音样本。
具体来说,创建订阅线程包括:TTS系统启动时进行初始化操作,生成Redis句柄,Redis句柄例如为:g_redisHdl(g_redisHdl=redisConnect(g_redis_ip,g_redis_port)),其中g_redisHdl为函数返回的操作Redis的句柄,g_redis_ip为Redis服务器的ip地址,g_redis_port为Redis服务器的端口。另外,为了提高处理性能。
TTS系统启动后创建订阅线程,订阅线程通过上述初始化的句柄订阅频道channel,通过返回值reply判断是否订阅Redis成功,电信运营商通过channel1频道(即:频道1)发送骚扰语音样本,TTS系统通过channel1频道接收到骚扰语音样本后,基于骚扰语音样本得到骚扰语音模板。如图6所示,电信运营商可以订阅channel2频道(即:频道2),TTS系统基于骚扰语音样本得到骚扰语音模板后,可构造响应信息,通过channel2发送,即:创建一个发布线程,通过发布线程发送响应信息,由于电信运营商订阅了频道channel2,于是接收到TTS系统返回的响应消息,确定TTS系统已经获得了骚扰语音模板。其中,扰语音样本由一些被确定为骚扰语音的语音数据组成。
此外,还可以通过预先订阅第二频道的多个Redis接收端的方式,基于多个Redis接收端,接收电音运营商发送到第二频道的多个骚扰语音样本,即:TTS系统以集群的方式在Redis订阅发布机制中进行部署,例如:部署为Redis订阅发布机制的多个订阅者(sub),也可称为多个节点,这样,某一个节点存在问题或者接收异常中断等情况下,由于其它节点正常,因此,也可以保证接收到完整的多个骚扰语音样本,有效保证了数据接收的可靠性和稳定性。
具体来说,Redis订阅发布(发送者publisher、订阅者subscriber)是一种消息通信模式:发送者(简称:pub)发送消息,订阅者(简称:sub)接收消息。Redis客户端可以订阅任意数量的频道。如图4所示,并结合图6,展示了频道channel1与订阅这个频道的三个客户端client2(即:客户端2)、client5(即:客户端5)和client1(即:客户端1)之间的关系,其中,三个客户端client2、client5和client1可以是TTS系统。
如图5所示,并结合图6,当有消息通过PUBLISH命令(即:发送命令)发送给频道channel1时,即:电信运营商将收集到的多个骚扰语音样本通过PUBLISH命令发送给频道channel1时,多个骚扰语音样本就会被发送给订阅它的三个客户端,即:发送给TTS系统。
以上描述是TTS系统获取多个骚扰语音样本的过程。以下对基于多个骚扰语音样本获得骚扰语音模板、以及通过骚扰语音模板对语音数据进行判断进行描述,即:骚扰语音模板包括根据多个骚扰语音样本得到的用于匹配骚扰语音的语音特征,具体过程为:从多个骚扰语音样本中提取语音特征;根据语音特征得到所述骚扰语音模板,在具体应用中,可以通过线程实现,例如:创建特征提取线程;基于特征提取线程分别对所述多个骚扰语音样本进行语音特征提取,得到对应于每一个骚扰语音样本的语音特征;根据对应于每一个骚扰语音样本的语音特征得到所述骚扰语音模板。也就是说,骚扰语音模板是从骚扰语音样本中提取语音特征,并且将提取的语音特征组成或者存储在一个模板中的过程;相应地,基于预先得到骚扰语音模板,判断语音数据是否为骚扰语音,包括:提取所述语音数据的语音特征;对语音数据的语音特征和骚扰语音模板的语音特征(即:多个骚扰语音样本的语音特征)进行特征匹配;如果匹配成功,则确定语音数据是骚扰语音。
在该示例中,从多个骚扰语音样本中提取语音特征,包括:根据Mel频率倒谱系数法、线性预测系数法、线性预测倒谱系数法、线谱频率法、离散小波变换法或感知线性预测法从所述骚扰语音样本中提取语音特征。
以Mel频率倒谱系数法为例,提取语音特征的详细过程如图7所示,包括:
预滤波:经过带宽为300~3400Hz的抗混叠滤波器处理。
A/D(模拟讯号Analog转换成数字讯号Digital)变换:使用8kHz的采样频率,12bit的线性量化精度。
预加重:通过一阶有限激励响应高通滤波器,使信号的频谱变得平坦。
分帧:根据语音的短时平稳特性,使语音数据以帧为单位进行处理。
加窗:采用汉明窗对一帧语音加窗,以减小吉布斯效应的影响。
快速傅立叶变换(FFT,Fast Fourier transform):将时域信号变换成为信号的功率谱。
三角窗滤波:对频谱进行平滑化,并消除谐波。
求对数:三角窗滤波器组的输出求取对数,可以得到近似于同态变换的结果。
离散余弦变换(DCT,Discrete Cosine Transform):去除各维信号间的相关性,将信号映射到低维空间。
谱加权:抑制低阶以及高阶参数。
倒谱均值减:可以有效地减小语音输入信道对特征参数的影响。
骚扰语音模板中包括了多个骚扰语音的语音特征,由此,当从电信运营商的语音流管道中获取到语音数据后,提取语音数据的语音特征,然后将语音数据的语音特征与骚扰语音模板的语音特征进行匹配,如果匹配到,则表示语音数据为骚扰语音。
S103:如果语音数据是骚扰语音,则在语音数据发送到接收方之前,拦截语音数据。也就是说,在确定将要发送给接收方的语音数据为骚扰语音的情况下,及时拦截语音数据,这样,接收方将不会接收到语音数据,从而,避免骚扰语音对接收方的骚扰。
根据本发明实施例的语音检测方法,可以在接收方接收到发送方发送的语音数据之前,基于Redis订阅发布机制,将语音数据迅速发布给TTS系统,这样,TTS系统可以及时地根据可匹配到是否为骚扰语音的骚扰语音模板验证发送方发送的语音数据是否为骚扰语音,并在验证其为骚扰语音的情况下,拦截掉该骚扰语音,接收方不会接收到骚扰语音,从而,在具有骚扰语音检测效率高的同时,接收方不需要额外的操作,也不会受到骚扰语音的骚扰,进而,提升用户的体验。
图8示出了本发明一个实施例提供的语音检测装置的结构示意图,如图8所示,本发明实施例提供的语音检测装置,包括:获取模块810、判断模块820和拦截模块830。
其中,获取模块810用于用于基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据;判断模块820用于基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音;拦截模块830用于在所述判断模块判断所述语音数据是骚扰语音的情况下,在所述语音数据发送到接收方之前,拦截所述语音数据。
根据本发明实施例的语音检测装置,可以在接收方接收到发送方发送的语音数据之前,基于Redis订阅发布机制,将语音数据迅速发布给TTS系统,这样,TTS系统可以及时地根据可匹配到是否为骚扰语音的骚扰语音模板验证发送方发送的语音数据是否为骚扰语音,并在验证其为骚扰语音的情况下,拦截掉该骚扰语音,接收方不会接收到骚扰语音,从而,在具有骚扰语音检测效率高的同时,接收方不需要额外的操作,也不会受到骚扰语音的骚扰,进而,提升用户的体验。
需要说明的是,本发明实施例的语音检测装置的具体实现方式与本发明实施例的语音检测方法的具体实现方式类似,具体请参见方法部分的描述,为了减少冗余,具体此处不做赘述。
基于相同的发明构思,本发明又一个实施例提供了一种电子设备,参见图9,所述电子设备具体包括如下内容:处理器901、存储器902、通信接口903和通信总线904;
其中,所述处理器901、存储器902、通信接口903通过所述通信总线904完成相互间的通信;所述通信接口903用于实现各设备之间的信息传输;
所述处理器901用于调用所述存储器902中的计算机程序,所述处理器执行所述计算机程序时实现上述语音检测方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据;基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音;如果是,则在所述语音数据发送到接收方之前,拦截所述语音数据。
另外,根据本发明实施例的电子设备的其它构成以及作用对于本领域的普通技术人员而言都是已知的,此处不做赘述。
基于相同的发明构思,本发明又一实施例提供了一种非暂态计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述语音检测方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据;基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音;如果是,则在所述语音数据发送到接收方之前,拦截所述语音数据。
此外,上述的存储器中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的指标监控方法。
此外,在本发明中,诸如“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
此外,在本发明中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
此外,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种语音检测方法,其特征在于,包括:
基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据;
基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音;
如果所述语音数据是骚扰语音,则在所述语音数据发送到接收方之前,拦截所述语音数据。
2.根据权利要求1所述的语音检测方法,其特征在于,所述基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据,包括:
所述TTS系统订阅所述Redis订阅发布机制中的第一频道,以通过所述第一频道接收通过所述Redis订阅发布机制发布到所述第一频道上的语音数据;其中,所述第一频道是所述Redis订阅发布机制发布语音数据的频道。
3.根据权利要求2所述的语音检测方法,其特征在于,所述TTS系统订阅所述Redis订阅发布机制中的第一频道,以通过所述第一频道接收通过所述Redis订阅发布机制发布到所述第一频道上的语音数据,包括:
所述TTS系统获取所述Redis订阅发布机制的Redis句柄;
根据所述Redis订阅发布机制的Redis句柄,创建订阅所述第一频道的第一订阅线程;
基于所述第一订阅线程,从所述第一频道中获得所述语音数据。
4.根据权利要求1-3任一项所述的语音检测方法,其特征在于,在所述判断所述语音数据是否为骚扰语音之前,所述方法还包括:
获得所述骚扰语音模板;其中,所述骚扰语音模板包括根据多个骚扰语音样本得到的用于匹配骚扰语音的语音特征;
所述获得所述骚扰语音模板包括:
分别对所述多个骚扰语音样本进行语音特征提取,得到对应于每一个骚扰语音样本的语音特征;
根据对应于每一个骚扰语音样本的语音特征得到所述骚扰语音模板;
所述基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音,包括:
提取所述语音数据的语音特征;
对所述语音数据的语音特征和所述骚扰语音模板的语音特征进行特征匹配;
如果匹配成功,则确定所述语音数据是骚扰语音。
5.根据权利要求4所述的语音检测方法,其特征在于,在所述分别对所述多个骚扰语音样本进行语音特征提取之前,所述方法还包括:
获取所述多个骚扰语音样本;
所述获取所述多个骚扰语音样本,包括:
所述TTS系统通过订阅的所述Redis订阅发布机制中的第二频道接收电信运营商发送到所述第二频道的所述多个骚扰语音样本,其中,所述第二频道是电信运营商发送所述多个骚扰语音样本的频道,所述多个骚扰语音样本为所述电信运营商预先收集得到。
6.根据权利要求5所述的语音检测方法,其特征在于,所述TTS系统通过订阅的所述Redis订阅发布机制中的第二频道接收电信运营商发送到所述第二频道的所述多个骚扰语音样本,包括:
根据所述Redis订阅发布机制的Redis句柄,创建订阅所述第二频道的第二订阅线程;
基于所述第二订阅线程,从所述第二频道中获得所述多个骚扰语音样本。
7.根据权利要求1所述的语音检测方法,其特征在于,所述基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据,包括:
通过多个端口并行接收方式,获取所述Redis订阅发布机制发布的由多个发送方向一个或多个接收方发送的多个语音数据。
8.一种语音检测装置,其特征在于,包括:
获取模块,用于基于Redis订阅发布机制的消息通信模式,TTS系统接收Redis订阅发布机制发布的语音数据;
判断模块,用于基于预先得到的骚扰语音模板,判断所述语音数据是否为骚扰语音;
拦截模块,用于在所述判断模块判断所述语音数据是骚扰语音的情况下,在所述语音数据发送到接收方之前,拦截所述语音数据。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现根据权利要求1至7任一所述的语音检测方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现根据权利要求1至7任一所述的语音检测方法。
CN202011015125.3A 2020-09-24 2020-09-24 语音检测方法、装置、电子设备及存储介质 Pending CN112333321A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011015125.3A CN112333321A (zh) 2020-09-24 2020-09-24 语音检测方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011015125.3A CN112333321A (zh) 2020-09-24 2020-09-24 语音检测方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112333321A true CN112333321A (zh) 2021-02-05

Family

ID=74304035

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011015125.3A Pending CN112333321A (zh) 2020-09-24 2020-09-24 语音检测方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112333321A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102546992A (zh) * 2011-12-12 2012-07-04 华为技术有限公司 一种垃圾语音消息过滤方法、过滤装置及过滤系统
CN102932753A (zh) * 2011-08-08 2013-02-13 上海粱江通信系统股份有限公司 一种在多媒体系统的链路上实现垃圾彩信拦截的方法
CN111226274A (zh) * 2017-11-28 2020-06-02 国际商业机器公司 自动阻止音频流中包含的敏感数据

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102932753A (zh) * 2011-08-08 2013-02-13 上海粱江通信系统股份有限公司 一种在多媒体系统的链路上实现垃圾彩信拦截的方法
CN102546992A (zh) * 2011-12-12 2012-07-04 华为技术有限公司 一种垃圾语音消息过滤方法、过滤装置及过滤系统
CN111226274A (zh) * 2017-11-28 2020-06-02 国际商业机器公司 自动阻止音频流中包含的敏感数据

Similar Documents

Publication Publication Date Title
AU2016260156B2 (en) Method and device for improving audio processing performance
US11632298B2 (en) Methods and apparatus to convert router configuration data
CN104348811A (zh) 分布式拒绝服务攻击检测方法及装置
CN105024971A (zh) 一种通信协议转换方法及装置
KR102580418B1 (ko) 어쿠스틱 에코 제거 장치 및 방법
US11290903B2 (en) Spectrum monitoring
CN114143107B (zh) 一种低速DDoS攻击检测方法、系统及相关设备
CN113364804B (zh) 一种流量数据的处理方法和装置
CN109559756B (zh) 滤波系数确定方法、回声消除方法、相应装置及设备
CN108901035B (zh) 物联网终端的识别方法和装置
CN111294367B (zh) 音频信号后处理方法和装置、存储介质及电子设备
CN110113298B (zh) 数据传输方法、装置、信令服务器和计算机可读介质
KR20000064041A (ko) 멀티미디어 메세징 시스템 및 방법
CN111402914B (zh) 噪声消除方法、装置、电子设备和存储介质
CN112333321A (zh) 语音检测方法、装置、电子设备及存储介质
CN101420336A (zh) 在网络中识别网络电话流量的方法及其系统
US11949812B2 (en) ENUM server and congestion control method
CN111081269A (zh) 通话过程中的噪声检测方法及系统
CN113035226B (zh) 语音通话方法、通信终端和计算机可读介质
US10313405B2 (en) Dynamically configured conferencing
CN109215673B (zh) 一种VoIP电话网络RTP语音流降噪方法
RU82356U1 (ru) Система контроля передачи объектов интеллектуальной собственности в сети интернет
CN116436739B (zh) 一种信道估计方法、装置、设备及可读存储介质
JP2009182394A (ja) 迷惑電話検出方法、装置、システム、およびプログラム
TR201619423A2 (tr) Yakin gerçek zamanli kali̇te eği̇li̇mi̇ni̇ gösteren ve alarm üreten bi̇r si̇stem

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210205

RJ01 Rejection of invention patent application after publication