CN111724811B

CN111724811B - 基于亚音频的啸叫识别方法及设备

Info

Publication number: CN111724811B
Application number: CN201910216040.2A
Authority: CN
Inventors: 李琳; 鲜柯
Original assignee: Chengdu TD Tech Ltd
Current assignee: Chengdu TD Tech Ltd
Priority date: 2019-03-21
Filing date: 2019-03-21
Publication date: 2023-01-24
Anticipated expiration: 2039-03-21
Also published as: CN111724811A

Abstract

本发明实施例提供一种基于亚音频的啸叫识别方法及设备，该方法包括：第一终端向第二终端发送第一语音数据，第一语音数据包括语音信号和亚音频信号；第一语音数据用于被第二终端进行播放；第一终端能够采集到第二终端播放的语音数据；第一终端采集第二语音数据，并判断第二语音数据中是否包括亚音频信号；若第二语音数据中包括所述亚音频信号，则第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；第一时间点为第一终端向第二终端发送第一语音数据的时间点，第二时间点为所述第一终端采集到第二语音数据的时间点；第一终端根据确定的啸叫检测门限，判断当前是否存在啸叫，能够更加准确的识别啸叫。

Description

基于亚音频的啸叫识别方法及设备

技术领域

本发明实施例涉及通信技术领域，尤其涉及一种基于亚音频的啸叫识别方法及设备。

背景技术

目前，行业终端的语音业务主要使用外放模式。由于行业终端大部分工作在背景噪声较大的户外或厂房，要求音量大，因此终端的上下行音量增益通常调得较大，声音通过环路增益放大后，能量不断累积形成啸叫，而啸叫严重影响语音业务的正常使用，对客户感知引起极大的不适，因此对啸叫场景进行识别具有很大的意义。

现有技术中，通常是根据啸叫语音的频率和幅度特征，确定是否存在啸叫。具体的，可以根据语音数据的幅频特性曲线，判断幅频特性曲线是否满足固定的啸叫检测门限；若是，则认为存在啸叫，若否，则认为不存在啸叫。

但是，采用现有技术，存在对啸叫识别的准确率较差的问题。

发明内容

本发明实施例提供一种基于亚音频的啸叫识别方法及设备，以克服现有技术中存在对啸叫识别的准确率较差的问题。

第一方面，本发明实施例提供一种基于亚音频的啸叫识别方法，包括：

第一终端向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；所述第一终端能够采集到所述第二终端播放的语音数据；

所述第一终端采集第二语音数据，并判断所述第二语音数据中是否包括所述亚音频信号；

若所述第二语音数据中包括所述亚音频信号，则所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二语音数据的时间点；

所述第一终端根据确定的所述啸叫检测门限，判断当前是否存在啸叫。

在一种可能的设计中，所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限，包括：

若所述时间差大于第一时长阈值，则确定所述啸叫门限为第一啸叫检测门限；所述第一啸叫检测门限包括第一峰均比阈值，所述第一峰均比阈值小于第二峰均比阈值，所述第二峰均比阈值为所述时间差小于或等于所述第一时长阈值时进行啸叫检测所使用的峰均比阈值。

若所述时间差小于第二时长阈值，则确定所述啸叫门限为第二啸叫门限；所述第二啸叫检测门限包括第三峰均比阈值，所述第三峰均比阈值大于第二峰均比阈值，所述第二峰均比阈值为所述时间差大于或等于所述第二时长阈值时进行啸叫检测所使用的峰均比阈值。

在一种可能的设计中，所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限，还包括：

若所述时间差大于第二时长阈值且小于所述第一时长阈值，则确定所述啸叫门限为第三啸叫检测门限，所述第三啸叫检测门限包括第四峰均比阈值；所述第四峰均比阈值大于所述第一峰均比阈值且小于所述第三峰均比阈值。

在一种可能的设计中，所述方法还包括：

若当前存在啸叫，则所述第一终端对所述第二语音数据进行啸叫抑制。

在一种可能的设计中，所述方法还包括：

若所述第二语音数据中不包括所述亚音频信号，则所述第一终端判断是否已开启啸叫抑制功能；

若已开启啸叫抑制功能，则关闭所述啸叫抑制功能。

第二方面，本发明实施例提供一种基于亚音频的啸叫识别方法，包括：

第二终端从第一终端接收第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一终端能够采集到所述第二终端播放的语音数据；

所述第二终端对所述第一语音数据进行播放；所述第一语音数据用于所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二终端播放的且包括所述亚音频信号的第二语音数据的时间点。

第三方面，本发明实施例提供一种基于亚音频的啸叫识别设备，包括：

语音数据发送模块，用于向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；所述第一终端能够采集到所述第二终端播放的语音数据；

亚音频信号判断模块，用于采集第二语音数据，并判断所述第二语音数据中是否包括所述亚音频信号；

啸叫检测门限确定模块，用于确定所述第二语音数据中包括所述亚音频信号后，根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二语音数据的时间点；

啸叫判断模块，用于根据确定的所述啸叫检测门限，判断当前是否存在啸叫。

在一种可能的设计中，所述啸叫检测门限确定模块具体用于：

若所述时间差大于第一时长阈值，确定所述啸叫门限为第一啸叫检测门限；所述第一啸叫检测门限包括第一峰均比阈值，所述第一峰均比阈值小于第二峰均比阈值，所述第二峰均比阈值为所述时间差小于或等于所述第一时长阈值时进行啸叫检测所使用的峰均比阈值。

在一种可能的设计中，所述啸叫检测门限确定模块还具体用于：

在一种可能的设计中，所述啸叫判断模块还用于：

在一种可能的设计中，所述亚音频信号判断模块还用于：

若已开启啸叫抑制功能，则关闭所述啸叫抑制功能。

第四方面，本发明实施例提供一种基于亚音频的啸叫识别设备，包括：

语音数据接收模块，用于从第一终端接收第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一终端能够采集到所述第二终端播放的语音数据；

语音数据播放模块，用于对所述第一语音数据进行播放；所述第一语音数据用于所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二终端播放的且包括所述亚音频信号的第二语音数据的时间点。

第五方面，本发明实施例提供一种基于亚音频的啸叫识别设备，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如第一方面任一项所述的基于亚音频的啸叫识别方法。

第六方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如第一方面任一项所述的基于亚音频的啸叫识别方法。

第七方面，本发明实施例提供一种基于亚音频的啸叫识别设备，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如第二方面所述的基于亚音频的啸叫识别方法。

第八方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如第二方面所述的基于亚音频的啸叫识别方法。

本发明实施例提供一种基于亚音频的啸叫识别方法及设备，该方法包括：第一终端向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；所述第一终端能够采集到所述第二终端播放的语音数据；所述第一终端采集第二语音数据，并判断所述第二语音数据中是否包括所述亚音频信号；若所述第二语音数据中包括所述亚音频信号，则所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二语音数据的时间点；所述第一终端根据确定的所述啸叫检测门限，判断当前是否存在啸叫。本实施例提供的基于亚音频的啸叫识别方法，第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限，能够更加准确的识别啸叫。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于亚音频的啸叫识别系统的示意图；

图2为本发明实施例提供的基于亚音频的啸叫识别方法的流程示意图一；

图3为本发明实施例提供的基于亚音频的啸叫识别方法的流程示意图二；

图4为本发明实施例提供的基于亚音频的啸叫识别设备的结构示意图一；

图5为本发明实施例提供的基于亚音频的啸叫识别设备的结构示意图二；

图6为本发明实施例提供的第一终端的硬件结构示意图；

图7为本发明实施例提供的第二终端的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的基于亚音频的啸叫识别系统的示意图，本实施例提供的系统可以进行啸叫识别。如图1所示，该系统包括：第一终端11和第二终端12，其中，第一终端11和第二终端12通信连接。可选的，第一终端11和第二终端12之间可以通过专有网络、第三代合作伙伴计划(Third Generation Partnership Project，3GPP)网络、网管对接等实现通信连接。在第一终端11和第二终端通过专有网络网络通信连接时，第一终端11和第二终端12具体可以为支持集群业务、脱网直通模式(Dedicated Mode Occasion，DMO)业务、视频播放等的终端，并且支持外方功能。本实施例对第一终端11和第二终端12的具体形态不做限制，只要第一终端11和第二终端12之间可以传输并且播放语音数据即可。

并且，第一终端11可以向第二终端12发送语音数据，第二终端可以通过喇叭外放对接收到的语音数据进行播放。当第一终端11和第二终端12距离较近时，第一终端11例如可以通过麦克风采集到第二终端播放的语音数据。

在本实施例中，第一终端11向第二终端12发送的语音数据中可以包括亚音频信号，第二终端12接收到第一终端11发送的语音数据后进行播放。在第一终端11和第二终端12距离较近时，第二终端12播放的语音数据经过一定时延后可被第一终端11检测到，语音数据通过环路增益放大后，能量不断累积可能会形成啸叫，本发明实施例中，第一终端11可以根据采集到的语音数据包括该亚音频信号确定可能会形成啸叫。进一步的，第一终端11可以根据该语音数据的时延来确定啸叫检测门限，进而根据确定的啸叫检测门限识别语音数据是否存在啸叫。进一步的，在识别到语音数据中存在啸叫后，可以进行啸叫抑制。

其中，亚音频信号可以是指频率低于300Hz(67到250Hz间的44个频点)、人耳无法听到的频率的单音信号。亚音频信号的频率通常可以为67到250Hz间的44个频点中任意一个频点的信号。因此，本发明实施例中在语音数据中包括的亚音频信号不会被人耳听到，不影响正常语音传输。

需要说明的是，图1中以第二终端12的个数为一个为例，可以理解的是，第二终端12的个数也可以为多个(例如，大于或等于2个)，本发明对此不作限定。

需要说明的是，本发明实施例中以第一终端11作为语音数据发送方，第二终端12作为语音数据接收方为例。可以理解的是，一个时间段内，终端1可以作为语音数据发送方，终端2可以作为语音数据接收方，此时，终端1可以理解为第一终端11，终端2可以理解为第二终端12。另一个时间段内，终端1可以作为语音数据接收方，终端2可以作为语音数据发送方，此时，终端2可以理解为第一终端11，终端1可以理解为第二终端12。

下面结合具体的实施例，对本发明提供的基于亚音频的啸叫识别系统如何进行啸叫识别进行详细说明。

图2为本发明实施例提供的基于亚音频的啸叫识别方法的流程示意图一，如图2所示，该方法包括：

S201、第一终端向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；所述第一终端能够采集到所述第二终端播放的语音数据；

本步骤中，可选的，所述第一语音数据包括语音信号和亚音频信号，具体可以通过如下方式1或方式2实现。方式1，将该亚音频信号插入到由第一终端的麦克风拾取正常的语音信号中，再将插入了亚音频信号的语音信号转化为电信号，再将电信号转换为数字信号形成第一语音数据。

方式2，第一终端的麦克风拾取正常的语音信号，将该语音信号转化为电信号，再将电信号转换为数字信号，然后将亚音频信号插入到数字信号中形成第一语音数据。

第一语音数据用于被第二终端接收后，经过模数转化，再转化为电信号，然后将电信号转化为语音信号，通过喇叭外放进行播放。

需要说明的是，对于所述亚音频信号的频率、时长、信号波形等本发明可以不作限定。例如，所述亚音频信号可以为固定频率、固定时长的正弦信号。

可选的，对于所述第一终端得到所述亚音频信号的具体方式，本发明可以不作限定。可选的，第一终端可以预先存储所述亚音频信号；或者，可选的，所述第一终端可以通过数字信号发生器生成所述亚音频信号。

S202、所述第一终端采集第二语音数据，并判断所述第二语音数据中是否包括所述亚音频信号；若是，执行S203；

具体地，第一终端采集的第二语音数据为第一终端的麦克风拾取的第一终端周围的语音信号转换为电信号后，再由电信号转换为数字信号形成第二语音数据。然后对第二语音数据进行滤波处理，判断滤波处理后得到的亚音频信号是否跟第一语音数据中所包含的亚音频信号的频率是否一致。可选的，第一终端采用数字滤波器得到的亚音频信号频率准确度高、稳定性高，并且成本较低。

S203、所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二语音数据的时间点；

具体地，若滤波处理后得到的亚音频信号是否跟第一语音数据中所包含的亚音频信号的频率一致，则第一终端的麦克风拾取的语音信号即为第二终端通过喇叭播放的语音信号。

再通过第一终端向第二终端发送所述第一语音数据的第一时间点和第一终端采集到第二语音数据的第二时间点的时间差，确定第一终端和第二终端的距离。时间差越大，表明第一终端和第二终端之间的距离越远，第一终端和第二终端的距离不同，使用不同的啸叫检测门限。然后再根据第一时间点和第二时间点的时间差，确定要使用的啸叫检测门限。

S204、所述第一终端根据确定的所述啸叫检测门限，判断当前是否存在啸叫。

具体地，第一终端根据第一时间点和第二时间点的时间差确定啸叫检测门限后，识别第一终端采集到的第二语音数据中是否存在啸叫，能够更加准确的识别啸叫。

本实施例提供的基于亚音频的啸叫识别方法，第一终端向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；所述第一终端能够采集到所述第二终端播放的语音数据；第一终端向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；所述第一终端能够采集到所述第二终端播放的语音数据；若所述第二语音数据中包括所述亚音频信号，则所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二语音数据的时间点；所述第一终端根据确定的所述啸叫检测门限，判断当前是否存在啸叫。本实施例提供的基于亚音频的啸叫识别方法，第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限，能够更加准确的识别啸叫。进一步地，由于亚音频信号不会受到语音信号的同频干扰，因而提高了语音数据传输的可靠性。

下面结合具体的实施例，对本实施例提供的基于亚音频的啸叫识别方法进行进一步说明。图3为本发明实施例提供的基于亚音频的啸叫识别方法的流程示意图三。如图3所示，该方法包括：

S301、第一终端向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；所述第一终端能够采集到所述第二终端播放的语音数据；

本实施例提供的S301与图2实施例提供的S201类似，此处不再赘述。

S302、第二终端从第一终端接收第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一终端能够采集到所述第二终端播放的语音数据；

S303、所述第二终端对所述第一语音数据进行播放；

具体地，第二终端接收到第一终端发送的第一语音数据后，先将第一语音数据进行模数转化，再转化为电信号，然后将电信号转化为语音信号，通过喇叭进行播放。第一终端的麦克风能够拾取到第二终端通过喇叭播放的包含亚音频信号的第一语音数据。

S304、所述第一终端采集第二语音数据，并判断所述第二语音数据中是否包括所述亚音频信号；若是，执行S405；若否，执行S408；

具体地，第一终端采集的第二语音数据为第一终端的麦克风拾取的第一终端周围的语音信号转换为电信号后，再由电信号转换为数字信号形成第二语音数据。然后对第二语音数据进行滤波处理，判断滤波处理后得到的亚音频的信号是否跟第一语音数据中所包含的亚音频的信号的频率是否一致。

第一语音数据用于第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；第一时间点为第一终端向第二终端发送所述第一语音数据的时间点，第二时间点为第一终端采集到第二终端播放的且包括亚音频信号的第二语音数据的时间点。

S305、第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二语音数据的时间点；

下面对第一终端如何根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限进行进一步详细说明。本实施例以第一时间点和第二时间点的时间差以3个等级为例，进行说明。

若第一时间点和第二时间点之间的时间差大于第一时长阈值，则确定所述啸叫门限为第一啸叫检测门限；所述第一啸叫检测门限包括第一峰均比阈值，所述第一峰均比阈值小于第二峰均比阈值，所述第二峰均比阈值为所述时间差小于或等于所述第一时长阈值时进行啸叫检测所使用的峰均比阈值。

具体地，在本实施例中，第一时间点记为T1，第二时间点记为T2，第一时长阈值记为Max_Delay_High。若T2-T1>Max_Delay_High，则认为时延较大，第一终端与第二终端之间的距离相对较远，采用第一啸叫检测门限检测第一终端采集到语音数据是否存在啸叫。具体地，以第一啸叫检测门限中包括的第一峰均比阈值作为检测标准，确定第一终端采集到的语音数据中是否存在啸叫。

获取第一终端采集到的语音数据的幅频特性曲线图，然后在幅频特性曲线图上滑动固定阈值窗口，确定出语音数据中的峰值，然后确定该峰值与其左右固定宽度频率的信号的峰均比的值与第一峰均比阈值作比较，确定该语音数据中是否存在啸叫。

若T2-T1<＝Max_Delay_High，则认为时延不大，第一终端与第二终端之间的距离不远，以第二峰均比阈值作为检测标准，确定第一终端采集到的语音数据中是否存在啸叫。

获取第一终端采集到的语音数据的幅频特性曲线图，然后在幅频特性曲线图上滑动固定阈值窗口，确定出语音数据中的峰值，然后确定该峰值与其左右固定宽度频率的信号的峰均比的值与第二峰均比阈值作比较，确定该语音数据中是否存在啸叫，第一峰均比阈值小于第二峰均比阈值。

可选地，第二时长阈值记为Max_Delay_Low，当T2-T1<Max_Delay_Low时，则认为时延相对较小，第一终端与第二终端之间的距离相对较近，采用第二啸叫检测门限检测第一终端采集到语音数据是否存在啸叫。具体地，以第二啸叫检测门限中包括的第三峰均比阈值作为检测标准，确定第一终端采集到的语音数据中是否存在啸叫。

获取第一终端采集到的语音数据的幅频特性曲线图，然后在幅频特性曲线图上滑动固定阈值窗口，确定出语音数据中的峰值，然后确定该峰值与其左右固定宽度频率的信号的峰均比的值与第三峰均比阈值作比较，确定该语音数据中是否存在啸叫，第三峰均比阈值大于第二峰均比阈值。

可选地，当Max_Delay_Low<T2-T1<Max_Delay_High时，则认为时延正常，采用第三啸叫检测门限检测第一终端采集到语音数据是否存在啸叫。具体地，以第三啸叫检测门限中包括的第四峰均比阈值作为检测标准，确定第一终端采集到的语音数据中是否存在啸叫。

获取第一终端采集到的语音数据的幅频特性曲线图，然后在幅频特性曲线图上滑动固定阈值窗口，确定出语音数据中的峰值，然后确定该峰值与其左右固定宽度频率的信号的峰均比的值与第四峰均比阈值作比较，确定该语音数据中是否存在啸叫，第四峰均比阈值大于所述第一峰均比阈值且小于第三峰均比阈值。

S306、所述第一终端根据确定的所述啸叫检测门限，判断当前是否存在啸叫。

具体地，第一终端根据第一时间点和第二时间点之间的时间差确定啸叫检测门限后，获取第一终端采集到的第二语音数据的幅频特性曲线图，然后在幅频特性曲线图上滑动固定阈值窗口，确定出语音数据中的峰值，然后确定该峰值与其左右固定宽度频率的信号的峰均比的值与啸叫检测门限包含的峰均比阈值作比较，确定该第二语音数据中是否存在啸叫。若该峰值与其左右固定宽度频率的信号的峰均比的值大于或者等于峰均比阈值，则第二语音数据中存在啸叫。若该峰值与其左右固定宽度频率的信号的峰均比的值小于峰均比阈值，则第二语音数据中不存在啸叫。

S307、若当前存在啸叫，则所述第一终端对所述第二语音数据进行啸叫抑制。

具体地，若第二语音数据的峰值与其左右固定宽度频率的信号的峰均比的值大于或者等于峰均比阈值，确定第二语音数据中存在啸叫，第一终端对第二语音数据进行啸叫抑制，消除第二语音数据中存在的啸叫。

可选地，在对第二语音数据进行啸叫抑制之前，先开启啸叫抑制抑制功能。

S308、所述第一终端判断是否已开启啸叫抑制功能；

S309、若已开启啸叫抑制功能，则关闭所述啸叫抑制功能。

具体地，若对第二语音数据进行滤波处理后得到的亚音频的信号跟第一语音数据中所包含的亚音频的信号的频率不一致时，不需要进行啸叫抑制。此时，第一终端判断是否已经开启啸叫抑制功能。若已开启啸叫功能，则关闭啸叫抑制功能。

本实施例提供的基于亚音频的啸叫识别方法，根据第一时间点和第二时间点之间的时间差的不同选择不同的啸叫检测门限，能够更加准确的识别啸叫。进一步地，本实施例提供的亚音频的啸叫识别方法，能够灵活地根据需要开启或者关闭啸叫抑制功能，避免了对正常语音数据的影响，提供用户体验。

图4为本发明实施例提供的基于亚音频的啸叫识别设备的结构示意图一。如图4所示，该设备40包括：语音数据发送模块401、亚音频信号判断模块402、啸叫检测门限确定模块403以及啸叫判断模块404，其中：

语音数据发送模块401，用于向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；所述第一终端能够采集到所述第二终端播放的语音数据；

亚音频信号判断模块402，用于采集第二语音数据，并判断所述第二语音数据中是否包括所述亚音频信号；

啸叫检测门限确定模块403，用于确定所述第二语音数据中包括所述亚音频信号后，根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二语音数据的时间点；

啸叫判断模块404，用于根据确定的所述啸叫检测门限，判断当前是否存在啸叫。

可选地，啸叫检测门限确定模块403具体用于：

可选地，啸叫检测门限确定模块403还具体用于：

可选地，啸叫判断模块404还用于：

可选地，亚音频信号判断模块402还用于：

若已开启啸叫抑制功能，则关闭所述啸叫抑制功能。

本实施例提供的设备，可用于执行上述方法实施例的技术方案，其实现原理和技术效果类似，本实施例此处不再赘述。

图5为本发明实施例提供的基于亚音频的啸叫识别设备的结构示意图一。如图5所示，该设备50包括：语音数据接收模块501以及语音数据播放模块502，其中：

语音数据接收模块501，用于从第一终端接收第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一终端能够采集到所述第二终端播放的语音数据；

语音数据播放模块502，用于对所述第一语音数据进行播放；所述第一语音数据用于所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二终端播放的且包括所述亚音频信号的第二语音数据的时间点。

图6为本发明实施例提供的第一终端的硬件结构示意图，如图6所示，本实施例提供的第一终端60包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，以实现上述实施例中基于亚音频的啸叫识别设备所执行的各个步骤。具体可以参见前述方法实施例中的相关描述。

图7为本发明实施例提供的第一终端的硬件结构示意图，如图7所示，本实施例提供的第二终端70包括：至少一个处理器和存储器；

至少一个处理器和存储器；

所述存储器存储计算机执行指令；

本发明实施例还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上第二终端所执行的基于亚音频的啸叫识别。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(英文：processor)执行本申请各个实施例所述方法的部分步骤。

应理解，上述处理器可以是中央处理单元(英文：Central Processing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：Digital Signal Processor，简称：DSP)、专用集成电路(英文：Application Specific Integrated Circuit，简称：ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速RAM存储器，也可能还包括非易失性存储NVM，例如至少一个磁盘存储器，还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。

总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component，PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的存储介质耦合至处理器，从而使处理器能够从该存储介质读取信息，且可向该存储介质写入信息。当然，存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits，简称：ASIC)中。当然，处理器和存储介质也可以作为分立组件存在于电子设备或主控设备中。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于亚音频的啸叫识别方法，其特征在于，包括：

所述第一终端根据确定的所述啸叫检测门限，判断当前是否存在啸叫；

所述第一终端根据确定的所述啸叫检测门限，判断当前是否存在啸叫，包括：获取采集到的所述第二语音数据的幅频特性曲线图；

在所述幅频特性曲线图上滑动固定阈值窗口，确定出所述第二语音数据中的峰值；

确定所述峰值与其左右固定宽度频率的信号的峰均比的值与所述啸叫检测门限包含的峰均比阈值作比较，确定所述第二语音数据中是否存在啸叫。

2.根据权利要求1所述的方法，其特征在于，所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限，包括：

若所述时间差大于第一时长阈值，则确定所述啸叫检测门限为第一啸叫检测门限；所述第一啸叫检测门限包括第一峰均比阈值，所述第一峰均比阈值小于第二峰均比阈值，所述第二峰均比阈值为所述时间差小于或等于所述第一时长阈值时进行啸叫检测所使用的峰均比阈值。

3.根据权利要求2所述的方法，其特征在于，所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限，包括：

若所述时间差小于第二时长阈值，则确定所述啸叫检测门限为第二啸叫检测门限；所述第二啸叫检测门限包括第三峰均比阈值，所述第三峰均比阈值大于第二峰均比阈值，所述第二峰均比阈值为所述时间差大于或等于所述第二时长阈值时进行啸叫检测所使用的峰均比阈值，所述第二时长阈值小于所述第一时长阈值。

4.根据权利要求3所述的方法，其特征在于，所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限，还包括：

若所述时间差大于所述第二时长阈值且小于所述第一时长阈值，则确定所述啸叫检测门限为第三啸叫检测门限，所述第三啸叫检测门限包括第四峰均比阈值；所述第四峰均比阈值大于第一峰均比阈值且小于第三峰均比阈值。

5.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1-3任一项所述的方法，其特征在于，所述方法还包括：

若已开启啸叫抑制功能，则关闭所述啸叫抑制功能。

7.一种基于亚音频的啸叫识别方法，其特征在于，包括：

所述第二终端对所述第一语音数据进行播放；所述第一语音数据用于所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二终端播放的且包括所述亚音频信号的第二语音数据的时间点；所述啸叫检测门限用于所述第一终端判断当前是否存在啸叫；

所述第一终端判断当前是否存在啸叫，包括：

获取采集到的所述第二语音数据的幅频特性曲线图；

8.一种基于亚音频的啸叫识别设备，其特征在于，包括：

语音数据发送模块，用于向第二终端发送第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一语音数据用于被所述第二终端进行播放；第一终端能够采集到所述第二终端播放的语音数据；

啸叫判断模块，用于根据确定的所述啸叫检测门限，判断当前是否存在啸叫；

所述啸叫判断模块，具体用于获取采集到的所述第二语音数据的幅频特性曲线图；

9.一种基于亚音频的啸叫识别设备，其特征在于，包括：

语音数据接收模块，用于从第一终端接收第一语音数据，所述第一语音数据包括语音信号和亚音频信号；所述第一终端能够采集到第二终端播放的语音数据；

语音数据播放模块，用于对所述第一语音数据进行播放；所述第一语音数据用于所述第一终端根据第一时间点和第二时间点之间的时间差，确定啸叫检测门限；所述第一时间点为所述第一终端向所述第二终端发送所述第一语音数据的时间点，所述第二时间点为所述第一终端采集到所述第二终端播放的且包括所述亚音频信号的第二语音数据的时间点；

所述啸叫检测门限用于所述第一终端判断当前是否存在啸叫；

所述第一终端判断当前是否存在啸叫，包括：

获取采集到的所述第二语音数据的幅频特性曲线图；

10.一种基于亚音频的啸叫识别设备，其特征在于，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求1至6任一项所述的基于亚音频的啸叫识别方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1至6任一项所述的基于亚音频的啸叫识别方法。

12.一种基于亚音频的啸叫识别设备，其特征在于，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求7所述的基于亚音频的啸叫识别方法。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求7所述的基于亚音频的啸叫识别方法。