CN108449493A

CN108449493A - 语音通话数据处理方法、装置、存储介质及移动终端

Info

Publication number: CN108449493A
Application number: CN201810200188.2A
Authority: CN
Inventors: 郑志勇; 柳明; 李智豪
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2018-03-12
Filing date: 2018-03-12
Publication date: 2018-08-24
Anticipated expiration: 2038-03-12
Also published as: CN108449493B

Abstract

本申请实施例公开了语音通话数据处理方法、装置、存储介质及移动终端。该方法包括：预设应用程序中的语音通话组建立成功后，检测到啸叫检测事件被触发；获取移动终端中的语音通话数据；将所述语音通话数据输入至啸叫识别模型中，根据所述啸叫识别模型的输出结果确定所述语音通话数据中是否包含啸叫音，其中，所述啸叫识别模型基于对产生啸叫音时的啸叫特征的学习生成；当确定所述语音通话数据中包含啸叫音时，对所述语音通话数据进行啸叫抑制处理。本申请通过采用上述技术方案，可以在移动终端应用程序中的语音通话功能开启后，准确、快速地确定语音通话数据中是否包含啸叫音，并在确定包含啸叫音时，及时进行啸叫抑制。

Description

语音通话数据处理方法、装置、存储介质及移动终端

技术领域

本申请实施例涉及语音通话技术领域，尤其涉及语音通话数据处理方法、装置、存储介质及移动终端。

背景技术

目前，随着移动终端的快速普及，手机及平板电脑等移动终端已经成为人们必备的通信工具之一。移动终端用户之间的通信方式越来越丰富，早已不局限于移动通信运营商提供的传统的电话及短信息等服务，在许多场景下，用户更倾向于使用基于互联网的通信方式，如各种社交软件中的语音聊天及视频聊天功能等。

此外，移动终端中的应用程序(Application，APP)功能日益完善，许多应用程序中都设置了语音通话功能，方便使用同款应用程序的用户之间的沟通和交流。以游戏应用为例，一些需要玩家之间进行互动的游戏已经添加了内置的语音通话功能，用户可以在使用移动终端玩游戏的过程中，与其他玩家进行语音交流。然而，在语音通话过程中，语音通话数据中包含的声音种类较多，如包含各玩家说话的声音、应用程序本身的声音(如游戏的背景音或特效音等)以及移动终端所处环境中的其他声音等，由于声音比较复杂，很容易发生啸叫现象，严重影响用户的使用。

发明内容

本申请实施例提供一种语音通话数据处理方法、装置、存储介质及移动终端，可以在移动终端预设应用程序中的语音通话功能开启后，准确、快速地确定语音通话数据中是否包含啸叫音。

第一方面，本申请实施例提供了一种语音通话数据检测方法，包括：

预设应用程序中的语音通话组建立成功后，检测到啸叫检测事件被触发；

获取移动终端中的语音通话数据；

将所述语音通话数据输入至啸叫识别模型中，根据所述啸叫识别模型的输出结果确定所述语音通话数据中是否包含啸叫音，其中，所述啸叫识别模型基于对产生啸叫音时的啸叫特征的学习生成；

当确定所述语音通话数据中包含啸叫音时，对所述语音通话数据进行啸叫抑制处理。

第二方面，本申请实施例提供了一种语音通话数据检测装置，包括：

触发检测模块，用于预设应用程序中的语音通话组建立成功后，检测到啸叫检测事件被触发；

语音数据获取模块，用于获取移动终端中的语音通话数据；

啸叫音识别模块，用于将所述语音通话数据输入至啸叫识别模型中，根据所述啸叫识别模型的输出结果确定所述语音通话数据中是否包含啸叫音，其中，所述啸叫识别模型基于对产生啸叫音时的啸叫特征的学习生成；

防啸叫处理模块，用于当确定所述语音通话数据中包含啸叫音时，对所述语音通话数据进行啸叫抑制处理。

第三方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请实施例所述的语音通话数据检测方法。

第四方面，本申请实施例提供了一种移动终端，包括存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例所述的语音通话数据检测方法。

本申请实施例中提供的语音通话数据处理方案，预设应用程序中的语音通话组建立成功后，检测到啸叫检测事件被触发时，获取移动终端中的语音通话数据，并将所述语音通话数据输入至啸叫识别模型中，当根据啸叫识别模型的输出结果确定所述语音通话数据中包含啸叫音时，对所述语音通话数据进行啸叫抑制处理。通过采用上述技术方案，可以在移动终端中的预设应用程序的语音通话组建立成功后，准确、快速地确定语音通话数据中是否包含啸叫音，并在确定包含啸叫音时，及时进行啸叫抑制，减少啸叫音给用户使用带来的不便。

附图说明

图1为本申请实施例提供的一种语音通话数据处理方法的流程示意图；

图2为本申请实施例提供的另一种语音通话数据处理方法的流程示意图；

图3为本申请实施例提供的又一种语音通话数据处理方法的流程示意图；

图4为本申请实施例提供的一种语音通话数据处理装置的结构框图；

图5为本申请实施例提供的一种移动终端的结构示意图；

图6为本申请实施例提供的又一种移动终端的结构示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本申请的技术方案。可以理解的是，此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

图1为本申请实施例提供的一种语音通话数据处理方法的流程示意图，该方法可以由语音通话数据处理装置执行，其中该装置可由软件和/或硬件实现，一般可集成在移动终端中。如图1所示，该方法包括：

步骤101、预设应用程序中的语音通话组建立成功后，检测到啸叫检测事件被触发。

示例性的，本申请实施例中的移动终端可包括手机及平板电脑等移动设备。预设应用程序可以是内置语音群组通话功能的应用程序，如网络游戏应用、在线课堂应用、视频会议应用或者需要多人协作的其他应用程序等等。

示例性的，语音通话组中可以包含2个成员，但多数情况下，一般包含3个或3个以上的成员，即可实现3个或3个以上的移动终端之间的语音通话。语音通话组可以由在移动终端上使用预设应用程序的用户发起而建立，在语音通话组建立成功后，语音通话组中包含的所有移动终端之间可进行通信。一般的，当移动终端未处于静音模式，也未处于耳机模式时，可理解为移动终端处于外放模式，语音通话组中每个用户的声音会被自己正在使用的移动终端的麦克风采集，并经过网络传输及处理后通过其他用户的移动终端的扬声器进行播放。以游戏应用为例，如需要组队协战，可开启组队语音功能，假设队内有5个玩家，那么语音通话组建立成功后，这5个人相互之间可以进行通话，任意一个玩家可以同时听到另外4个玩家说的话，仿佛另外4个玩家在自己身边讲话一样，方便边交流边游戏。

一般的，当移动终端处于外放模式时，移动终端麦克风采集到的声音中不仅包含用户自身说话的声音，还可能包含扬声器播放的预设应用程序本身发出的声音，如背景音乐等，还可能包含周围环境的声音，还可能包含扬声器播放的语音通话组内其他人说话的声音，这样，当多个移动终端将各自采集的包含各种声音的数据经过网络发送至同一个移动终端时(例如语音通话组内包含5个移动终端，那么其中4个移动终端就会把各自采集的声音发送至服务器，服务器将4个移动终端的声音数据发送给第5个移动终端)，这些声音由会在该移动终端中混合起来播放，可能会产生啸叫现象。

本申请实施例中，为了在合适的时机进行啸叫检测，可以预先设置啸叫检测事件被触发的条件。可选的，为了及时有效地进行啸叫的实时检测，可在预设应用程序中的语音通话组建立成功后，立即触发啸叫检测事件；可选的，为了更有针对性的进行啸叫检测，同时节省啸叫检测操作所带来的额外功耗，可对容易发生啸叫的场景进行理论分析或调研等，设置合理的预设场景，在检测到移动终端处于预设场景时，触发啸叫检测事件。

步骤102、获取移动终端中的语音通话数据。

在本申请实施例中，语音通话数据可包括上行语音通话数据和/或下行语音通话数据，本申请不做具体限定。其中，上行语音通话数据可以包括移动终端的麦克风采集到的声音数据；下行语音通话数据可以是预设应用程序对应的服务器在接收到语音通话组内其他移动终端的声音数据后，经过混音等处理发送给移动终端的数据，或者直接转发给移动终端的数据，本申请对服务器处理语音通话数据的处理方式不做限定。相关现有技术中，移动终端的麦克风采集到声音数据时，直接将该声音数据作为上行语音通话数据发送至预设应用程序对应的服务器，而不会进行啸叫检测。而本申请中，在检测到啸叫检测事件被触发时，不会直接将上行语音通话数据发送至预设应用程序对应的服务器，而是对上行语音通话数据进行分析，以判断出上行语音通话数据中是否包含啸叫音。同样的，在相关现有技术中，移动终端从服务器接收到下行语音通话数据后，通过扬声器进行播放，而不会进行啸叫检测。本申请中，在检测到啸叫检测事件被触发后，不会直接播放下行语音通话数据，而是对下行语音通话数据进行分析，以判断出下行语音数据中是否存在啸叫音。

步骤103、将所述语音通话数据输入至啸叫识别模型中，根据所述啸叫识别模型的输出结果确定所述语音通话数据中是否包含啸叫音。

其中，所述啸叫识别模型基于对产生啸叫音时的啸叫特征的学习生成。

在本申请实施例中，将移动终端中的语音通话数据输入至啸叫识别模型，并根据啸叫识别模型的输出结果确定该语音通话数据中是否包含啸叫音。可以理解的是，当语音通话数据为上行语音通话数据时，也即移动终端的麦克风采集到声音数据时，不是直接将该声音数据作为上行语音通话数据发送至预设应用程序对应的服务器，以使服务器直接将该上行语音通话数据发送至语音通话组中其他的移动终端，而是先将该上行语音通话数据(麦克风采集的声音数据)输入至啸叫识别模型中，使啸叫识别模型对该上行语音通话数据进行分析，以判断该上行语音通话数据中是否包含啸叫音。并根据判断结果对该声音数据进行相应的处理操作后，再作为目标上行语音通话数据发送至预设应用程序对应的服务器。当语音通话数据为下行语音通话数据时，也即移动终端从服务器接收到下行语音通话数据后，不会直接通过扬声器进行播放，而是先将该下行语音通话数据发送至啸叫识别模型，使啸叫识别模型对该下行语音通话数据进行分析，以判断该下行语音通话数据中是否包含啸叫音。并根据判断结果对该下行语音通话数据进行相应的处理操作后，再通过扬声器进行播放。

啸叫识别模型可以理解为在输入语音通话数据后快速确定该语音通话数据是否包含啸叫音的学习模型。啸叫识别模型可以是基于对产生啸叫音时的啸叫特征的学习生成的，即将包含啸叫音的声音数据作为训练样本，对声音数据中的啸叫音的啸叫特征进行训练、学习，生成啸叫识别模型。

在本申请实施例中，根据啸叫识别模型的输出结果，判断语音通话数据中是否包含啸叫音。可以理解的是，将语音通话数据输入至啸叫识别模型后，啸叫识别模型会对该语音通话数据进行分析，如依次分析该语音通话数据的频率值、能量值、音色及频率响应(简称频响)等特征，并根据分析结果输出对语音通话数据中是否包含啸叫音的判断结果。当然，当啸叫识别模型对输入的语音通话数据进行分析，不仅会输出语音通话数据中包含啸叫音的判断结果，而且在确定语音通话数据中包含啸叫音时，还会输出对语音通话数据中包含的啸叫音的具体位置信息，也即啸叫音在语音通话数据中的具体位置，如语音通话数据中的某一频点对应的音频信号为啸叫点，又如，语音通话数据中某一时间长度对应的音频信号为啸叫音片段。可选的，将语音通话数据输入至啸叫识别模型，啸叫识别模型对该语音通话数据进行分析后，输出与该语音通话数据对应的目标语音通话数据。当语音通话数据中包含啸叫音时，目标语音通话数据中标记了啸叫点的具体位置，也即目标语音通话数据为对输入的语音通话数据进行了啸叫点标记的声音数据；当语音通话数据中未包含啸叫音时，目标语音通话数据未对语音通话数据进行任何标记，也即目标语音通话数据与输入的语音通话数据完全相同。

步骤104、当确定所述语音通话数据中包含啸叫音时，对所述语音通话数据进行啸叫抑制处理。

在本申请实施例中，当通过步骤103确定移动终端的语音通话数据中包含啸叫音时，对语音通话数据进行啸叫抑制处理。示例性的，在确定语音通话数据中存在啸叫音后，可以根据啸叫识别模型输出的语音通话数据中标记的啸叫点对该语音通话数据进行啸叫抑制处理。这样设置的好处在于，可以更加有针对性地进行啸叫抑制，防止啸叫音从扬声器或听筒播放出去，或者防止啸叫音再次通过与预设应用程序对应的服务器发送至语音通话组中其他移动终端，造成啸叫音的再次传播放大，影响用户使用。

可选的，根据啸叫点对所述语音通话数据进行啸叫抑制处理，包括：选取预设数量的对应能量值较高的啸叫点的频率，作为目标频率，对所述语音通话数据中与所述目标频率对应的音频信号进行衰减处理。预设数量可自由设置，如1个，3个，甚至更多，还可以根据啸叫点的数量来动态确定。可将啸叫点按照能量值从高到低的顺序进行排序，选取排在前面预设数量的啸叫点，将选取出来的啸叫点的频率确定为目标频率。能量值越高，啸叫声的声音越大，对用户的影响程度越高，这样设置的好处在于，能够更有针对性地对能量值较高的频率进行啸叫抑制，提高啸叫抑制效率，保证语音通话的时效性。

可选的，根据所述啸叫点对所述语音通话数据进行啸叫抑制处理，也可包括：对所述语音通话数据中与所有啸叫点的频率对应的音频信号进行衰减处理。这样设置的好处在于，能够全面地对所有啸叫点进行啸叫抑制，阻止啸叫音的播放。

示例性的，可采用陷波滤波器来对需要进行抑制的啸叫点的频率(即目标频率)所对应的音频信号进行衰减处理。陷波滤波器能够在某一个频率点迅速衰减输入信号，以达到阻碍该频率信号通过的滤波效果。本申请对陷波滤波器的类型以及具体参数值不做限定。一般的，将目标频率作为陷波滤波器的中心频率，陷波滤波器的处理带宽及增益等参数可根据实际需求进行设置。

需要说明的是，本申请实施例对语音通话数据进行啸叫抑制处理的具体方式不做限定。

在一些实施例中，在预设应用程序中的语音通话组建立成功之前，还包括：获取第一预设数量的样本声音数据，其中，所述样本声音数据中包含啸叫音；确定所述样本声音数据中的啸叫点，并对所述啸叫点进行标记；将标记啸叫点后的样本声音数据作为第一声音样本；基于设定的第一机器学习算法对所述第一声音样本进行训练，得到啸叫识别模型。这样设置的好处在于，可以准确确定样本声音数据中的啸叫点，并对啸叫点在声音数据中呈现的啸叫特征进行学习，可以大大提高啸叫识别模型训练的准确性。

本申请实施例中，第一预设数量可根据移动终端的具体配置、数据处理能力以及用户对确定语音通话数据中啸叫音判断的准确性的需求等因素来确定，本申请实施例不做限定。例如，第一预设数量可以为1000，即获取1000条样本声音数据。其中，样本声音数据中包含有啸叫音，本申请实施例对样本声音数据中包含啸叫音的长短及啸叫音的强度大小不做限定，另外本申请实施例对样本声音数据对应的时间长度也不做限定。

在一些实施例中，可采用如下方式确定样本声音数据中的啸叫点：

第一种，对所述样本声音数据进行分块处理；对于每个数据块，采用预设分析方式确定当前数据块中存在的疑似啸叫点；当存在呈现周期性特征的多个疑似啸叫点群，且疑似啸叫点对应的能量值依照所属数据块的顺序呈上升趋势时，将所述疑似啸叫点确定为所述样本声音数据中的啸叫点；其中，所述疑似啸叫点群为连续相邻数据块中的频率差异处于预设范围内的疑似啸叫点，所述连续相邻数据块的数量达到预设连续阈值。

第二种，对所述样本声音数据进行分块处理，得到M个数据块；采用预设分析方式依次分析当前数据块中是否存在疑似啸叫点，将首次出现疑似啸叫点的数据块确定为起始数据块；从所述起始数据块开始，依次以n个数据块为待分析的数据段，采用所述预设分析方式分析出当前数据段中包含的疑似啸叫点，当N个数据段中包含的疑似啸叫点之间的频率差异处于预设范围内时，将所述疑似啸叫点确定为所述样本声音数据中的啸叫点；其中，n＝2，3，…，N；N小于或等于M，大于或等于2；每个数据段的起始点均与所述起始数据块的起始点相同，所述起始数据块为第一个数据段。

当然，本申请实施例中还可采用其他方式来确定样本声音数据中的啸叫点，本申请不做限定。下面以上述两种方式为例进行详细的说明。

对于第一种方式，对样本声音数据进行分块处理可以是按照预设单位长度进行分块处理，预设单位长度例如可以是40毫秒。假设预设时间长度为1.2秒，预设单位长度为40毫秒，那么可以分为30个数据块。

本申请实施例对预设分析方式不作具体限定。例如，所述预设分析方式可包括：在频域上获取高频区域中能量值高于预设能量阈值的待判定频点，计算所述待判定频点周围预设数量的频点的能量差异值，当所述能量差异值大于预设差异阈值时，确定所述待判定频点为疑似啸叫点；所述高频区域为频率高于预设频率阈值的频率范围。

具体的，对于当前数据块，可先将其从时域变换到频域，便于进行频谱分析。变换方式本申请实施例不做限定，可以采用傅里叶变换方式，如离散傅氏变换的快速算法(FastFourier Transformation，FFT)。以40ms为例，40ms的音频数据(16bit,16k采样率)大小为40*16*16/2＝1280字节，适合于使用1024做FFT变换进行频谱分析，经过FFT处理后的频率分析中的频率范围为0～16K/2,步长为(16K/2)/1024，步长约为8Hz。

本申请实施例中，可以预设频率阈值作为分界值来划分高频区域和其他区域。预设频率阈值可根据实际情况进行设置，如可根据人声频率和容易出现啸叫声的频率特点进行设置，例如可以是1KHz，1.5KHz，或2KHz等等。例如预设频率阈值为2KHz，即大于2KHz的部分为高频区域。一般啸叫点的频率会出现在高频区域，且声音较大(即能量值较高)，本申请实施例能够根据能量值分布特点快速确定一个数据块中的疑似啸叫点。

示例性的，获取数据块中每个频率点(简称频点)对应的能量值，然后从高频区域中找到能量值高于预设能量阈值的待判定频点，计算待判定频点周围预设数量的频点的能量差异值。预设能量阈值和预设数量可根据实际需求设置，例如预设能量阈值可以是-10dB，预设数量可以是8个(待判定频点前面4个和后面4个)。以上文步长约为8Hz为例，假设待判定频点的频率值为3362Hz，那么其周围预设数量的频点的频率值约为3330Hz、3338Hz、3346Hz、3354Hz、3370Hz、3378Hz、3386Hz和3394Hz。能量差异值用于衡量待判定频点与周围预设数量的频点之间相差程度，具体可以是最大能量值和最小能量值的差值，还可以是能量方差值或能量均方差值等等，本申请不做限定。预设差异阈值与能量差异值相对应，例如，能量差异值为能量方差值时，预设差异阈值为预设方差阈值。当能量差异值大于预设差异阈值时，说明待判定频点比较突出，非常有可能是啸叫点，因此，确定待判定频点为疑似啸叫点。这样设置能够快速准确地识别出疑似啸叫点，为进一步确定是否为啸叫点打下基础。

示例性的，一个数据块中可能存在多个待判定频点，本申请可从对应能量最高的待判定频点开始进行疑似啸叫点的判定。

此外，所述预设分析方式还可包括：在频域上获取高频区域中能量值最大的第一频点和低频区域中能量值最大的第二频点，当所述第一频点满足预设疑似啸叫条件时，确定所述第一频点为当前数据块中的疑似啸叫点，所述预设疑似啸叫条件包括所述第一频点的能量值大于预设能量阈值，且所述第一频点与所述第二频点的能量差值大于预设差值阈值。

具体的，对于当前数据块，可先将其从时域变换到频域，便于进行频谱分析。同样也可以预设划分频率作为分界值来划分高频区域和低频区域。预设划分频率可根据实际情况进行设置，如可根据人声频率和容易出现啸叫声的频率特点进行设置，例如可以是1KHz，1.5KHz，或2KHz等等。例如预设划分频率为2KHz，即大于2KHz的部分为高频区域，小于或等于2KHz的部分为低频区域。

示例性的，获取数据块中每个频率点对应的能量值，然后从高频区域中找到能量值最大的第一频点，从低频区域找到能量值最大的第二频点，若第一频点的能量值大于预设能量阈值(如-30dB)，且第一频点的能量值与第二频点的能量值的差值大于预设差值阈值(如60)时，可认为第一频点为当前数据块中的疑似啸叫点。这样设置能够快速准确地识别出疑似啸叫点，为进一步确定是否为啸叫点打下基础。

示例性的，对于每个数据块，分别采用如上预设分析方式判断是否存在疑似啸叫点，若存在，则记录下疑似啸叫点，并进一步确定当前的样本声音数据中的啸叫点。

可以理解的是，若某个数据块中存在疑似啸叫点，并不能将该疑似啸叫点确认为整段样本声音数据中真正的啸叫点，还可能是由于某些特殊声音被误识别为啸叫音，例如物体摩擦时产生的刺耳的声音，一般频率较高且声音较大，很可能被识别为疑似啸叫音，但这种声音一般比较短促，持续时间较短，不属于啸叫音，容易将产生疑似啸叫音的疑似啸叫点误认为真正的啸叫点，因此，需要增加进一步的判定。

本申请实施例中，对各数据块中存在的疑似啸叫点的分布特点进行分析。当连续多个相邻数据块中存在频率差异较小的疑似啸叫点时，可将这几个疑似啸叫点成为疑似啸叫点群。即，疑似啸叫点群为连续相邻数据块中的频率差异处于预设范围内的疑似啸叫点，所述连续相邻数据块的数量达到预设连续阈值。其中，预设连续阈值可根据实际情况确定，例如3个；频率差异对应的预设范围也可根据实际情况确定，例如40Hz。发明人发现，啸叫声一般在短时间内表现出持续性特征，并周期性出现，另外声音逐渐变大。因此，本申请实施例中，将多个(可理解为大于或等于2个)疑似啸叫点群呈现周期性特征，以及疑似啸叫点对应的能量值依照所属数据块的顺序呈上升趋势作为判定条件，来确定当前的样本声音数据中产生啸叫音的啸叫点，若满足上述条件，则能够快速准确地识别出产生啸叫音的啸叫点。

示例性的，假设样本声音数据被分为30个数据块。例如，若第1、2、3、7、8、9、13、14、15、19、20、21、25、26和27这15个数据块中都检测到了频率在(A-40，A+40)区间内的疑似啸叫点，每3个数据块对应的疑似啸叫点成为一个疑似啸叫点群，5个疑似啸叫点群呈周期性特征，且疑似啸叫点对应的能量值依次增大，因此，确定样本声音数据中包含啸叫音。又如，若仅第1、2和3这3个数据块中检测到了频率在(B-40，B+40)区间内的疑似啸叫点，这3个数据块对应的疑似啸叫点成为一个疑似啸叫点群，但仅存在这一个，并未呈现周期性特征，因此，可确定该疑似啸叫点不是真正的啸叫点。

对于第二种方式，分块处理方式以及预设分析方式可参考第一种方式中的相关内容，本申请实施例不再赘述。

具体的，采用上述预设分析方式分析第一个数据块中是否存在疑似啸叫点，若存在，则疑似啸叫点首次出现，将第一个数据块确定为起始数据块；若不存在，则将当前数据块的下一个数据块作为新的当前数据块，并采用上述预设分析方式分析新的当前数据块中是否存在疑似啸叫点。依次类推，直到首次出现疑似啸叫点的数据块确定为起始数据块。

以上述分块方式为例，M＝30，2≤N≤30。在进行频谱分析时，待分析的数据长度对分析结果会产生影响，因为数据点较少时，精度可能不是太准确，所以，使用长度大一些的数据再次进行分析，相当于有一个修正的处理，能够更加准确地确定是否为啸叫点。本申请对N的具体取值不做限定，假设N＝4，一个数据块的长度为40ms，那么起始数据块的时间范围可记为0至40ms，由于起始数据块已经分析完毕，并作为第一数据段，所以从n＝2开始，为第二个数据段，第二个数据段的时间范围可记为0至80ms，依次类推，第三个数据段的时间范围可记为0至120ms，第三个数据段的时间范围可记为0至160ms。

示例性的，预设范围可以根据实际情况设置，例如可以是40Hz(如上述举例，可认为相当于5个步长)。假设4个数据段分析出来的疑似啸叫点的频率分别为A、B、C和D，而A、B、C和D相互之间的差异均在40Hz以内，那么可确定该疑似啸叫点为样本声音数据中真正的啸叫点。

可选的，若当前数据段中包含的疑似啸叫点与前面的数据段中包含的疑似啸叫点之间的频率差异未处于所述预设范围内，则从当前数据段的下一个数据块开始获取所述预设时间长度的样本声音数据，并重复执行对样本声音数据进行分块处理的相关操作。这样设置的好处在于，当任意两个数据段中包含的疑似啸叫点的频率差距较大时，可说明前面的疑似啸叫点可能不是真正的啸叫点，需要继续检测，而不需要对后面的数据段进行疑似啸叫点检测，节省功耗，提高确定啸叫点的效率及准确度。例如，当C与A或与B之间的差异超出40Hz时，则从120ms开始，重新获取移动终端中的预设时间长度的样本声音数据，并对所述样本声音数据进行分块处理，得到M个数据块，再确定新的起始数据块，并继续采用上述方式确定样本声音数据中的啸叫点。

在本申请实施例中，当确定样本声音数据中的啸叫点后，在样本声音数据中对该啸叫点进行标记，以标识啸叫点在样本声音数据中的具体位置。例如，某样本声音数据为1.2s的声音片段，而在该样本声音数据中的第10ms-50ms及第300ms-400ms对应的音频信号为啸叫音片段，则对该啸叫音片段进行啸叫点标记。对样本声音数据进行啸叫点标记可以在进行啸叫识别模型训练时，准确地区分出样本声音数据中的啸叫音和非啸叫音，进而快速确定啸叫音和非啸叫音的特征，并对相应的特征进行分析、学习，快速、准确生成啸叫识别模型。

将标记啸叫点后的样本声音数据作为第一声音样本，并基于设定的第一机器学习算法对第一声音样本进行训练，生成啸叫识别模型。因为，啸叫音产生时会表现出一些特有的啸叫特征，如能量集中、周期性以及频率高于预设频率阈值等，而非啸叫音并不具备能量集中、周期性及频率高等特征。因此，本申请实施例，基于第一机器学习算法对第一声音样本中的啸叫音和非啸叫音对应的数据特征进行学习，也即对啸叫特征和非啸叫进行训练、学习，生成啸叫识别模型。其中，设定的第一机器学习算法可以包括神经网络模型、决策树模型、随机森林模型及朴素贝叶斯模型中的任意一种。本申请实施例对第一机器学习算法的具体算法不做限定。

在一些实施例中，在预设应用程序中的语音通话组建立成功之前，还包括：获取第二预设数量的啸叫声音片段和第三预设数量的非啸叫声音片段；对所述啸叫声音片段和所述非啸叫声音片段进行特征标记，其中，特征标记包括啸叫音和非啸叫音；将特征标记后的啸叫声音片段和特征标记后的非啸叫声音片段作为第二声音样本；基于设定的第二机器学习算法对所述第二声音样本进行训练，得到所述啸叫识别模型。这样设置的好处在于，可以省去对啸叫点的确定及标记的过程，在保证啸叫识别模型对语音通话数据中是否包含啸叫音判断的准确性的前提下，能够大大提高对啸叫识别模型训练的速度。

本申请实施例中，第二预设数量和第三预设数量可根据移动终端的具体配置、数据处理能力以及用户对确定语音通话数据中啸叫音判断的准确性的需求等因素来确定，另外，第二预设数量和第三预设数量可以相同，也可以不同，本申请实施例不做限定。例如，第二预设数量可以为1000，第三预设数量为500，即获取1000条啸叫声音片段及500条非啸叫声音片段。其中，啸叫声音片段可以是既包含有啸叫音又包含有非啸叫音的混合声音片段，还可以是完全是啸叫音的声音片段，也即啸叫声音片段中完全是啸叫音。啸叫声音片段可以是采集的当前移动终端的扬声器播放的啸叫声音数据，或者是采集的其他终端设备的扬声器播放的啸叫声音数据，还可以是当前移动终端或其他终端设备制作生成的啸叫声音数据。非啸叫声音片段是未包含啸叫音的声音数据。非啸叫声音片段可以是采集的当前移动终端的扬声器播放的非啸叫声音数据，或者是采集的其他终端设备的扬声器播放的非啸叫声音数据，还可以是当前移动终端或其他终端设备制作生成的非啸叫声音数据。本申请实施例对啸叫声音片段和非啸叫声音片段的获取来源或获取方式不做限定。另外，本申请实施例对啸叫声音片段和非啸叫声音片段的长短及强度大小也不做限定。

在本申请实施例中，对获取的啸叫声音片段和非啸叫声音片段进行特征标记，其中，特征标记包括啸叫音和非啸叫音。可以理解的是，特征标记即对获取的声音片段(啸叫声音片段和非啸叫声音片段)标记啸叫音或非啸叫音，也即将啸叫声音片段标记为啸叫音，如用1表示，或者说将1作为啸叫声音片段的特征标记，对非啸叫声音片段标记为非啸叫音，如用0表示，或者说将0作为非啸叫声音片段的特征标记。将特征标记后的啸叫声音片段和特征标记后的非啸叫声音片段作为第二声音样本，并基于设定的第二机器学习算法对第二声音样本进行训练，生成啸叫识别模型。因为，啸叫音产生时会表现出一些特有的啸叫特征，如能量集中、周期性以及频率高于预设频率阈值等，而非啸叫音并不具备能量集中、周期性及频率高等特征。因此，本申请实施例，基于第二机器学习算法对第二声音样本中的啸叫声音片段和非啸叫声音片段中各自的数据特征进行学习，也即对啸叫特征和非啸叫进行训练、学习，生成啸叫识别模型。其中，设定的第二机器学习算法可以包括神经网络模型、决策树模型、随机森林模型及朴素贝叶斯模型中的任意一种。本申请实施例对第二机器学习算法的具体算法不做限定。

需要说明的是，第一机器学习算法和第二机器学习算法可以相同，也可以不同，本申请实施例对此不作限定。

在一些实施例中，在基于设定的机器学习算法对声音样本进行训练之前，还包括：对声音样本的啸叫等级进行评估，并将啸叫评估结果作为所述声音样本的啸叫等级标记；基于设定的机器学习算法对声音样本进行训练，得到所述啸叫识别模型，包括：基于设定的机器学习算法对标记啸叫等级后的声音样本进行训练，得到所述啸叫识别模型。这样设置的好处在于，不仅可以通过啸叫识别模型确定语音通话数据中是否包含啸叫音，还可以确定啸叫音的啸叫等级，以方便后期可以根据啸叫等级来选择不同的抑制策略，能够使得啸叫抑制处理更加有针对性，在节省功耗的同时，达到良好的啸叫音抑制效果，保证用户语音通话过程不受啸叫音的影响。

示例性的，在基于设定的第一机器学习算法对第一声音样本进行训练之前，还包括：对第一声音样本的啸叫等级进行评估，并将啸叫评估结果作为所述第一声音样本的啸叫等级标记；基于设定的第一机器学习算法对第一声音样本进行训练，得到所述啸叫识别模型，包括：基于设定的第一机器学习算法对标记啸叫等级后的第一声音样本进行训练，得到所述啸叫识别模型。或者，在基于设定的第二机器学习算法对第二声音样本进行训练之前，还包括：对第二声音样本的啸叫等级进行评估，并将啸叫评估结果作为所述第二声音样本的啸叫等级标记；基于设定的第二机器学习算法对第二声音样本进行训练，得到所述啸叫识别模型，包括：基于设定的第二机器学习算法对标记啸叫等级后的第二声音样本进行训练，得到所述啸叫识别模型。

其中，在对声音样本(第一声音样本或第二声音样本)的啸叫等级进行评估时，可依据啸叫音对应的频率高低、能量高低以及持续时长等特性对啸叫音进行等级评估。可选的，所述对声音样本的啸叫等级进行评估，包括：依据啸叫点对应的能量值对声音样本进行啸叫等级评估，所对应的能量值越高，啸叫等级越高。本申请实施例中采用能量值对啸叫等级进行评估的好处在于，能量越高，音量越大，若播放出去后，对用户产生的干扰越强，因此，采用能量值进行啸叫等级评估能够更加贴合用户的感受，从而更好地减少啸叫音对用户的影响。示例性的，可预先对能量值进行区间划分，不同能量值区间对应不同的啸叫等级，划分尺度的精细程度可根据实际需求进行设置。本申请实施例中，由于声音样本中包含的啸叫点可能有多个，当存在多个啸叫点时，可针对每个啸叫点分别进行啸叫等级评估，也可根据多个啸叫点的最高能量值或能量平均值进行评估，本申请不做限定。可以理解的是，当声音样本中不包含啸叫音时，如第二声音样本中的非啸叫声音片段，可以将该声音样本的啸叫等级视为零。

在本申请实施例中，对声音样本的啸叫等级评估后，将啸叫评估结果作为声音样本的啸叫等级标记。示例性的，可以用X0，X1，X2，…，Xn对啸叫等级进行标记。可以理解的是，X0可以表示声音样本的啸叫等级为0，即声音样本中不包含啸叫音，如声音样本为第二声音样本中的非啸叫声音片段；X1可以表示声音样本的啸叫等级为0；X2可以表示声音样本的啸叫等级为2；以此类推，Xn可以表示声音样本的啸叫等级为n，其中，n越大，表示啸叫等级越高。

基于设定的机器学习算法(第一机器学习算法或第二机器学习算法)对标记啸叫等级后的声音样本(第一声音样本或第二声音样本)进行训练，得到所述啸叫识别模型。可以理解的是，虽然啸叫音表现出特有的啸叫特征，但是啸叫音的啸叫等级不同，表现出的啸叫特征强度也不同，如不同啸叫等级的啸叫音，其能量集中的程度、周期性长短及频率高低程度不同。通常，啸叫等级越高，对应表现的啸叫特征越明显，如能量越集中，周期性越明显，频率越高。因此，本申请实施例，基于设定的机器学习算法对标记啸叫等级后的声音样本进行训练，也即对不同啸叫等级对应的啸叫特征进行学习，生成啸叫识别模型。

基于设定的机器学习算法对标记啸叫等级后的声音样本进行训练，得到啸叫识别模型，当将语音通话数据输入该啸叫识别模型后，根据啸叫识别模型的输出结果不仅可以确定语音通话数据中是否包含啸叫音，还可以确定啸叫音的啸叫等级。相应的，对语音通话数据进行啸叫抑制处理包括：根据确定的啸叫等级选择相应的抑制策略对所述语音通话数据进行啸叫抑制处理。本申请实施例中，可预先为不同的啸叫等级设定不同的抑制策略，例如以抑制策略列表的形式存在，抑制策略中可包括抑制方式以及抑制强度等信息，在前述步骤中得到语音通话数据的啸叫等级后，根据啸叫等级查询预设抑制策略列表，找到当前啸叫等级对应的抑制策略，再根据所找到的抑制策略对语音通话数据进行啸叫抑制处理。可以理解的是，抑制策略越复杂，抑制强度越高，通常处理器及相关器件的工作负担越重，产生的功耗越高，因此，本申请实施例根据啸叫等级来选择不同的抑制策略，能够使得啸叫抑制处理更加有针对性，在节省功耗的同时，达到良好的啸叫音抑制效果，保证用户语音通话过程不受啸叫音的影响。

在一些实施例中，所述检测到啸叫检测事件被触发，包括：判断所述语音通话组中是否存在与所述移动终端之间的距离小于预设距离值的目标移动终端，若存在，则确定检测到啸叫检测事件被触发。在多人语音的应用场景下，发明人发现，当存在两个移动终端之间的距离比较近时，极易发生啸叫。假设语音通话组中的移动终端甲和移动终端乙距离较近，移动终端甲的扬声器会放大并播放接收到的移动终端乙的麦克风采集的声音，而由于两个移动终端比较近，这个声音就会被移动终端乙的麦克风再次采集并发送到移动终端甲，该声音被继续放大并播放，极易形成声音的正反馈放大，从而产生啸叫音。因此，本申请实施例中，可先判断语音通话中是否存在一个其他移动终端与当前的移动终端的距离比较近，若存在，则触发啸叫检测事件，进而检测到啸叫检测事件被触发。其中，预设距离值例如可以是20米或10米等，可根据实际需求进行设置。

本申请实施例中，判断所述语音通话组中是否存在与所述移动终端之间的距离小于预设距离值的目标移动终端的具体判断方式可以有很多种，并不做限定，以下给出几种方式作为示意性说明。

1、采用预设方式播放预设声音片段，并接收所述语音通话组中其他移动终端的反馈信息，所述反馈信息包含所述其他移动终端尝试采集与所述预设声音片段对应的声音信号的结果；根据所述反馈信息判断所述语音通话组中是否存在与所述移动终端之间的距离小于预设距离值的目标移动终端。

这样设置的好处在于，能够快速准确地判断出是否存在目标移动终端，进而快速确定是否需要触发啸叫检测事件。示例性的，可通过扬声器以预设音量播放预先录制或预先获取的声音片段；或，通过超声波发射器播放预设频率及预设强度的超声波片段。可根据预设距离值对上述的预设音量，或预设频率及预设强度进行设置。反馈信息中包含的结果可以指其他移动终端是否能够采集到所述声音信号。当其他移动终端能够采集到预设声音片段对应的声音信号时，说明两个移动终端的距离小于预设距离值。反馈信息可由预设应用程序对应的服务器进行转发。此外，反馈信息中还可包括采集到的声音信号的属性信息，如声音强度等，由于移动终端播放的声音的强度是已知的，随着声音的传播会有所衰减，传播距离越远，衰减程度越高，可根据反馈信息中的声音信号的强度信息等来确定其他移动终端与当前移动终端的距离，并判断该距离是否小于预设距离值。

2、获取所述移动终端的第一定位信息以及所述语音通话组中其他移动终端的第二定位信息；根据所述第一定位信息和所述第二定位信息，判断所述语音通话组中是否存在与所述移动终端之间的距离小于所述预设距离值的目标移动终端。

这样设置的好处在于，移动终端普遍具备定位功能，能够利用定位信息快速准确地判断出是否存在目标移动终端，进而快速确定是否需要触发啸叫检测事件。示例性的，移动终端可通过全球定位系统(Global Positioning System，GPS)或北斗等定位方式获取定位信息，也可通过基站定位或网络定位等方式获取定位信息。定位信息可包括经纬度坐标等。语音通话组中的其他移动终端的第二定位信息可通过预设应用程序对应的服务器转发至当前移动终端。当前移动终端将自身的第一定位信息与服务器转发来的至少一个第二定位信息逐一进行比对，判断是否存在一个第二定位信息与第一定位信息之间的距离小于预设距离值。

3、获取所述移动终端连接的第一WiFi信息以及所述语音通话组中其他移动终端连接的第二WiFi信息；根据所述第一WiFi信息和所述第二WiFi信息，判断所述语音通话组中是否存在与所述移动终端之间的距离小于所述预设距离值的目标移动终端。

这样设置的好处在于，用户为了节约流量费用，一般采用连接WiFi热点的方式进行语音通话，可以利用这一特点快速准确地判断出是否存在目标移动终端，进而快速确定是否需要触发啸叫检测事件。示例性的，WiFi信息中可包括WiFi热点的属性信息，属性信息例如可以是WiFi热点名称或WiFi热点的媒介访问控制(Media Access Control，MAC)地址等，还可包括WiFi信号强度等。一般的，WiFi热点的信号有效范围有限，一般在50米左右，若预设距离值大于WiFi热点的信号有效范围，可根据是否存在一个第二WiFi信息的WiFi热点属性信息与第一WiFi信息的WiFi热点属性信息相同来确定所述语音通话组中是否存在与移动终端之间的距离小于预设距离值的目标移动终端，若存在任意一个第二WiFi信息的WiFi热点属性信息与第一WiFi信息的WiFi热点属性信息相同，则确定语音通话组中存在目标移动终端，也就是说，当语音通话组中有一个其他移动终端与当前移动终端连接同一个WiFi热点时，可认为该其他移动终端为目标移动终端。此外，若预设距离值小于WiFi热点的信号有效范围，如10米，那么可进一步根据WiFi信号强度估算连接同一个WiFi热点的移动终端分别与WiFi热点的距离，进而确定两个移动终端之间的距离，判断该距离是否小于预设距离值。

4、获取麦克风采集的第一声音数据，以及获取移动终端中的下行语音通话数据；其中，所述第一声音数据中不包含所述移动终端的扬声器播放的声音；根据所述第一声音数据和所述下行语音通话数据中是否包含同一个人的声音，判断所述语音通话组中是否存在与所述移动终端之间的距离小于所述预设距离值的目标移动终端。

这样设置的好处在于，可以不借助其他信息(如上述的定位信息或WiFi信息)快速准确地判断出是否存在目标移动终端，进而快速确定是否需要触发啸叫检测事件。示例性的，第一声音数据中不包含所述移动终端的扬声器播放的声音，可通过以下方式实现：在获取第一声音数据和下行语音通话数据的过程中移动终端的扬声器处于关闭状态；或者，在获取第一声音数据和下行语音通话数据的过程中移动终端的扬声器处于开启状态，第一声音数据为在麦克风采集的所有声音数据中，滤除扬声器播放的声音数据后得到的声音数据。当两个用户手持移动终端且距离较近时，假设用户甲使用移动终端甲，用户乙使用移动终端乙，用户甲说话的声音被移动终端甲的麦克风采集并发送至移动终端乙，移动终端乙的下行语音通话数据中会包含用户甲说话的声音，而由于用户甲和用户乙距离较近，用户甲说话的声音也会被移动终端乙的麦克风采集，因此，对于移动终端乙来说，其麦克风采集的第一声音数据和获取的下行语音通话数据中包含同一个人(用户甲)的声音，从而确定语音通话组中存在移动终端甲与移动终端乙之间的距离小于预设距离值，即对于移动终端乙来说，移动终端甲为目标移动终端。

可以理解的是，可根据实际情况选取上述的任意一种或多种方式的组合来判断是否存在目标移动终端，本申请实施例不做限定。此外，判断是否存在目标移动终端的相关步骤也可由预设应用程序对应的服务器完成，当服务器判断出存在目标移动终端时，将判断结果发送至移动终端，所述判断结果用于指示移动终端触发啸叫检测事件。相应的，本申请实施例的方法还包括，接收所述预设应用程序对应的服务器发送的判断结果，当所述判断结果中包含如下内容时，触发啸叫检测事件：所述语音通话组中存在与所述移动终端之间的距离小于预设距离值的目标移动终端。服务器的具体判断过程可参照上述提供的几种判断方式，本申请实施例不做赘述。

图2为本申请实施例提供的另一种语音通话数据检测方法的流程示意图，以预设应用程序为网络游戏应用程序为例，该方法包括如下步骤：

步骤201、获取第一预设数量的样本声音数据。

其中，样本声音数据中包含啸叫音。

步骤202、确定样本声音数据中的啸叫点，并对啸叫点进行标记。

步骤203、将标记啸叫点后的样本声音数据作为第一声音样本。

步骤204、依据啸叫点对应的能量值对第一声音样本的啸叫等级进行评估，并将啸叫评估结果作为第一声音样本的啸叫等级标记。

步骤205、基于设定的第一机器学习算法对标记啸叫等级后的第一声音样本进行训练，得到啸叫识别模型。

步骤206、检测到预设游戏应用中的语音通话组建立成功。

示例性的，以团队对战游戏为例，如王者荣耀，每队有5个玩家，红蓝两队进行对战，每个队伍的5个玩家之间需要进行沟通交流商量对战策略，因此，许多玩家会选择开启队内语音通话功能，如一个玩家申请开启队内语音通话功能后，语音通话组建立成功。此后，同一战队的5个玩家中的任意一个，可听到其余4个玩家说话的声音。一般的，玩家会将移动终端设置为外放模式，方便游戏。

步骤207、判断语音通话组中是否存在与移动终端之间的距离小于预设距离值的目标移动终端，若是，则执行步骤208；否则，重复执行步骤207。

若5个玩家中，有两个玩家的移动终端距离较近，如两个好朋友在家中一起玩，又同时将移动终端设置为外放模式，这样就非常容易引起啸叫。因此，本申请实施例中，可先判断语音通话组中是否存在与当前的移动终端距离较近的其他移动终端，若存在，则需要进行啸叫检测。

可选的，本申请实施例中可以采用上文的任意一种或多种方式的组合来判断是否存在目标移动终端，本申请实施例不做限定。

步骤208、获取移动终端中的语音通话数据。

其中，语音通话数据可包括上行语音通话数据和/或下行语音通话数据，本申请不做具体限定。示例性的，下行语音通话数据中包含其他4位队友的移动终端的麦克风采集到的声音，声音中一般不仅包含4位队友说话的声音，还包括4为队友的移动终端的扬声器播放的声音以及其他环境声音等。一般由游戏服务器收集其他4个移动终端上传的上行语音通话数据，并将4个移动终端的上行语音通话数据发送至当前的移动终端。上行语音通话数据中包含当前移动终端的麦克风采集的声音，声音中不仅包含当前移动终端对应的用户说话的声音，还包含当前移动终端所处位置的环境声音以及目标移动终端的扬声器播放的声音。

步骤209、将语音通话数据输入至啸叫识别模型中，根据啸叫识别模型的输出结果确定语音通话数据中是否包含啸叫音，若是，则执行步骤210，否则，执行步骤212。

其中，啸叫识别模型基于对产生啸叫音时的啸叫特征的学习生成。

步骤210、确定语音通话数据的啸叫等级。

步骤211、根据啸叫等级选择相应的抑制策略对语音通话数据进行啸叫抑制处理。

步骤212、进行正常的语音通话，不对语音通话数据进行啸叫抑制。

本申请实施例中，将包含啸叫音的样本声音数据作为啸叫识别模型的样本来源，并确定样本声音数据中的啸叫点，将标记啸叫点后的样本声音数据作为声音样本，然后基于啸叫点对应的能量值对声音样本进行啸叫等级评估，并对声音样本进行啸叫等级标记，将标记啸叫等级后的声音样本作为啸叫识别模型的训练样本，不仅可以准确确定样本声音数据中的啸叫点，并对啸叫点在声音数据中呈现的啸叫特征进行学习，不仅可以通过啸叫识别模型确定语音通话数据中是否包含啸叫音，还可以确定啸叫音的啸叫等级。

图3为本申请实施例提供的另一种语音通话数据检测方法的流程示意图，以预设应用程序为网络游戏应用程序为例，该方法包括如下步骤：

步骤301、获取第二预设数量的啸叫声音片段和第三预设数量的非啸叫声音片段。

步骤303、将啸叫声音片段标记为1，非啸叫声音片段标记为0。

可以理解的是，对啸叫声音片段和非啸叫声音片段进行特征标记，其中，特征标记包括啸叫音和非啸叫音。即用1表示啸叫音，用0表示非啸叫音。

步骤303、将标记后的啸叫声音片段和标记后的非啸叫声音片段作为第二声音样本。

步骤304、对第二声音样本的啸叫等级进行评估，并将啸叫评估结果作为第二声音样本的啸叫等级标记。

步骤305、基于设定的第二机器学习算法对标记啸叫等级后的第二声音样本进行训练，得到啸叫识别模型。

步骤306、检测到预设游戏应用中的语音通话组建立成功。

步骤307、判断语音通话组中是否存在与移动终端之间的距离小于预设距离值的目标移动终端，若是，则执行步骤308；否则，重复执行步骤307。

步骤308、获取移动终端中的语音通话数据。

步骤309、将语音通话数据输入至啸叫识别模型中，根据啸叫识别模型的输出结果确定语音通话数据中是否包含啸叫音，若是，则执行步骤310，否则，执行步骤312。

步骤310、确定语音通话数据的啸叫等级。

步骤311、根据啸叫等级选择相应的抑制策略对语音通话数据进行啸叫抑制处理。

步骤312、进行正常的语音通话，不对语音通话数据进行啸叫抑制。

本申请实施例中，直接将啸叫声音片段和非啸叫声音片段作为啸叫识别模型的样本来源，可以省去对啸叫点的确定及标记的过程，在保证啸叫识别模型对语音通话数据中是否包含啸叫音判断的准确性的前提下，能够大大提高对啸叫识别模型训练的速度，同时还通过对啸叫等级的标记，可以使啸叫识别模型确定语音通话数据的啸叫等级，以方便后期可以根据啸叫等级来选择不同的抑制策略，能够使得啸叫抑制处理更加有针对性，在节省功耗的同时，达到良好的啸叫音抑制效果，保证用户语音通话过程不受啸叫音的影响。

图4为本申请实施例提供的一种语音通话数据处理装置的结构框图，该装置可由软件和/或硬件实现，一般集成在移动终端中，可通过执行语音通话数据处理方法来对语音通话数据进行防啸叫处理。如图4所示，该装置包括：

触发检测模块401，用于预设应用程序中的语音通话组建立成功后，检测到啸叫检测事件被触发；

语音数据获取模块402，用于获取移动终端中的语音通话数据；

啸叫音识别模块403，用于将所述语音通话数据输入至啸叫识别模型中，根据所述啸叫识别模型的输出结果确定所述语音通话数据中是否包含啸叫音，其中，所述啸叫识别模型基于对产生啸叫音时的啸叫特征的学习生成；

防啸叫处理模块404，用于当确定所述语音通话数据中包含啸叫音时，对所述语音通话数据进行啸叫抑制处理。

本申请实施例中提供的语音通话数据处理装置，可以在移动终端中的预设应用程序的语音通话组建立成功后，准确、快速地确定语音通话数据中是否包含啸叫音，并在确定包含啸叫音时，及时进行啸叫抑制，减少啸叫音给用户使用带来的不便。

可选的，该装置还包括：

声音数据获取模块，用于在预设应用程序中的语音通话组建立成功之前，获取第一预设数量的样本声音数据，其中，所述样本声音数据中包含啸叫音；

啸叫点确定模块，用于确定所述样本声音数据中的啸叫点，并对所述啸叫点进行标记；

第一声音样本确定模块，用于将标记啸叫点后的样本声音数据作为第一声音样本；

第一样本训练模块，用于基于设定的第一机器学习算法对所述第一声音样本进行训练，得到啸叫识别模型。

可选的，该装置还包括：

声音片段获取模块，用于在预设应用程序中的语音通话组建立成功之前，获取第二预设数量的啸叫声音片段和第三预设数量的非啸叫声音片段；

特征标记模块，用于对所述啸叫声音片段和所述非啸叫声音片段进行特征标记，其中，特征标记包括啸叫音和非啸叫音；

第二声音样本确定模块，用于将特征标记后的啸叫声音片段和特征标记后的非啸叫声音片段作为第二声音样本；

第二样本训练模块，用于基于设定的第二机器学习算法对所述第二声音样本进行训练，得到所述啸叫识别模型。

可选的，该装置还包括：

啸叫等级评估模块，用于在基于设定的机器学习算法对声音样本进行训练之前，对声音样本的啸叫等级进行评估，并将啸叫评估结果作为所述声音样本的啸叫等级标记；

基于设定的机器学习算法对声音样本进行训练，得到所述啸叫识别模型，包括：

基于设定的机器学习算法对标记啸叫等级后的声音样本进行训练，得到所述啸叫识别模型。

可选的，所述啸叫等级评估模块，用于：

依据啸叫点对应的能量值对声音样本进行啸叫等级评估，所对应的能量值越高，啸叫等级越高。

可选的，所述检测到啸叫检测事件被触发，包括：

判断所述语音通话组中是否存在与所述移动终端之间的距离小于预设距离值的目标移动终端，若存在，则确定检测到啸叫检测事件被触发。

可选的，所述预设应用程序为网络游戏应用程序。

本申请实施例还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行语音通话数据处理方法，该方法包括：

获取移动终端中的语音通话数据；

存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括：安装介质，例如CD-ROM、软盘或磁带装置；计算机系统存储器或随机存取存储器，诸如DRAM、DDRRAM、SRAM、EDORAM，兰巴斯(Rambus)RAM等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的第一计算机系统中，或者可以位于不同的第二计算机系统中，第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然，本申请实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的语音通话数据处理操作，还可以执行本申请任意实施例所提供的语音通话数据处理方法中的相关操作。

本申请实施例提供了一种移动终端，该移动终端中可集成本申请实施例提供的语音通话数据处理装置。图5为本申请实施例提供的一种移动终端的结构示意图。移动终端500可以包括：存储器501，处理器502及存储在存储器501上并可在处理器502运行的计算机程序，所述处理器502执行所述计算机程序时实现如本申请实施例所述的语音通话数据处理方法。

本申请实施例提供的移动终端，可以在移动终端中的预设应用程序的语音通话组建立成功后，准确、快速地确定语音通话数据中是否包含啸叫音，并在确定包含啸叫音时，及时进行啸叫抑制，减少啸叫音给用户使用带来的不便。

图6为本申请实施例提供的另一种移动终端的结构示意图，该移动终端可以包括：壳体(图中未示出)、存储器601、中央处理器(central processing unit，CPU)602(又称处理器，以下简称CPU)、电路板(图中未示出)和电源电路(图中未示出)。所述电路板安置在所述壳体围成的空间内部；所述CPU602和所述存储器601设置在所述电路板上；所述电源电路，用于为所述移动终端的各个电路或器件供电；所述存储器601，用于存储可执行程序代码；所述CPU602通过读取所述存储器601中存储的可执行程序代码来运行与所述可执行程序代码对应的计算机程序，以实现以下步骤：

获取移动终端中的语音通话数据；

所述移动终端还包括：外设接口603、RF(Radio Frequency，射频)电路605、音频电路606、扬声器611、电源管理芯片608、输入/输出(I/O)子系统609、其他输入/控制设备610、触摸屏612、其他输入/控制设备610以及外部端口604，这些部件通过一个或多个通信总线或信号线607来通信。

应该理解的是，图示移动终端600仅仅是移动终端的一个范例，并且移动终端600可以具有比图中所示出的更多的或者更少的部件，可以组合两个或更多的部件，或者可以具有不同的部件配置。图中所示出的各种部件可以在包括一个或多个信号处理和/或专用集成电路在内的硬件、软件、或硬件和软件的组合中实现。

下面就本实施例提供的用于语音通话数据处理的移动终端进行详细的描述，该移动终端以手机为例。

存储器601，所述存储器601可以被CPU602、外设接口603等访问，所述存储器601可以包括高速随机存取存储器，还可以包括非易失性存储器，例如一个或多个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

外设接口603，所述外设接口603可以将设备的输入和输出外设连接到CPU602和存储器601。

I/O子系统609，所述I/O子系统609可以将设备上的输入输出外设，例如触摸屏612和其他输入/控制设备610，连接到外设接口603。I/O子系统609可以包括显示控制器6091和用于控制其他输入/控制设备610的一个或多个输入控制器6092。其中，一个或多个输入控制器6092从其他输入/控制设备610接收电信号或者向其他输入/控制设备610发送电信号，其他输入/控制设备610可以包括物理按钮(按压按钮、摇臂按钮等)、拨号盘、滑动开关、操纵杆、点击滚轮。值得说明的是，输入控制器6092可以与以下任一个连接：键盘、红外端口、USB接口以及诸如鼠标的指示设备。

触摸屏612，所述触摸屏612是用户移动终端与用户之间的输入接口和输出接口，将可视输出显示给用户，可视输出可以包括图形、文本、图标、视频等。

I/O子系统609中的显示控制器6091从触摸屏612接收电信号或者向触摸屏612发送电信号。触摸屏612检测触摸屏上的接触，显示控制器6091将检测到的接触转换为与显示在触摸屏612上的用户界面对象的交互，即实现人机交互，显示在触摸屏612上的用户界面对象可以是运行游戏的图标、联网到相应网络的图标等。值得说明的是，设备还可以包括光鼠，光鼠是不显示可视输出的触摸敏感表面，或者是由触摸屏形成的触摸敏感表面的延伸。

RF电路605，主要用于建立手机与无线网络(即网络侧)的通信，实现手机与无线网络的数据接收和发送。例如收发短信息、电子邮件等。具体地，RF电路605接收并发送RF信号，RF信号也称为电磁信号，RF电路605将电信号转换为电磁信号或将电磁信号转换为电信号，并且通过该电磁信号与通信网络以及其他设备进行通信。RF电路605可以包括用于执行这些功能的已知电路，其包括但不限于天线系统、RF收发机、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、CODEC(COder-DECoder，编译码器)芯片组、用户标识模块(Subscriber Identity Module，SIM)等等。

音频电路606，主要用于从外设接口603接收音频数据，将该音频数据转换为电信号，并且将该电信号发送给扬声器611。

扬声器611，用于将手机通过RF电路605从无线网络接收的语音信号，还原为声音并向用户播放该声音。

电源管理芯片608，用于为CPU602、I/O子系统及外设接口所连接的硬件进行供电及电源管理。

上述实施例中提供的语音通话数据处理装置、存储介质及移动终端可执行本申请任意实施例所提供的语音通话数据处理方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本申请任意实施例所提供的语音通话数据处理方法。

注意，上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

1.一种语音通话数据处理方法，其特征在于，包括：

获取移动终端中的语音通话数据；

2.根据权利要求1所述的方法，其特征在于，在预设应用程序中的语音通话组建立成功之前，还包括：

获取第一预设数量的样本声音数据，其中，所述样本声音数据中包含啸叫音；

确定所述样本声音数据中的啸叫点，并对所述啸叫点进行标记；

将标记啸叫点后的样本声音数据作为第一声音样本；

基于设定的第一机器学习算法对所述第一声音样本进行训练，得到啸叫识别模型。

3.根据权利要求1所述的方法，其特征在于，在预设应用程序中的语音通话组建立成功之前，还包括：

获取第二预设数量的啸叫声音片段和第三预设数量的非啸叫声音片段；

对所述啸叫声音片段和所述非啸叫声音片段进行特征标记，其中，特征标记包括啸叫音和非啸叫音；

将特征标记后的啸叫声音片段和特征标记后的非啸叫声音片段作为第二声音样本；

基于设定的第二机器学习算法对所述第二声音样本进行训练，得到所述啸叫识别模型。

4.根据权利要求2或3所述的方法，其特征在于，在基于设定的机器学习算法对声音样本进行训练之前，还包括：

对声音样本的啸叫等级进行评估，并将啸叫评估结果作为所述声音样本的啸叫等级标记；

5.根据权利要求4所述的方法，其特征在于，所述对声音样本的啸叫等级进行评估，包括：

6.根据权利要求1所述的方法，其特征在于，所述检测到啸叫检测事件被触发，包括：

7.根据权利要求1所述的方法，其特征在于，所述预设应用程序为网络游戏应用程序。

8.一种语音通话数据处理装置，其特征在于，包括：

语音数据获取模块，用于获取移动终端中的语音通话数据；

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的语音通话数据检测方法。

10.一种移动终端，其特征在于，包括存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1-7任一所述的语音通话数据检测方法。