CN104967960B

CN104967960B - 语音数据处理方法、游戏直播中的语音数据处理方法和系统

Info

Publication number: CN104967960B
Application number: CN201510134384.0A
Authority: CN
Inventors: 李广发; 李俊明; 张鼎源; 唐永春
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2015-03-25
Filing date: 2015-03-25
Publication date: 2018-03-20
Anticipated expiration: 2035-03-25
Also published as: CN104967960A

Abstract

本发明提供了一种语音数据处理方法，该方法包括：检测麦克风状态；当麦克风处于打开状态时，在应用的原始音频输出到扬声器之前拦截并复制所述应用的原始音频，并调节所述应用的原始音频的增益大小；采集麦克风输出的音频，并调节所述麦克风输出的音频的增益大小；调节复制得到的应用的原始音频的增益大小；将调节增益大小后的所述麦克风输出的音频和调节增益大小后的所述复制得到的应用的原始音频进行混音处理，采用该方法能够提高应用中声音的混音音效质量。此外，还提供了一种语音数据处理系统以及游戏直播中的语音数据处理方法和系统。

Description

语音数据处理方法、游戏直播中的语音数据处理方法和系统

技术领域

本发明涉及网络应用领域，特别是涉及一种语音数据处理方法和系统、游戏直播中的语音数据处理方法和系统。

背景技术

随着互联网技术的发展，网络与多媒体技术相互结合的应用在人们的日常生活中越来越常见。为了更好的交流互动，用户可以通过麦克风输入语音，同时与应用自身的音视频数据相结合，来进行娱乐、工作和学习。

当同时存在通过麦克风输入的语音和应用自身的音频时，现有的技术没有对通过麦克风输入的语音和应用自身的音频的音量进行调节，应用自身的音频音量可能超过通过麦克风输入的语音音量和应用自身的音频的声音很大，会通过麦克风再次被采集，从而不能提供高品质的混音效果。

游戏直播中游戏解说员或玩家可通过麦克风输入语音，在现场观看直播游戏时可同步听到游戏解说或玩家声音，为广大游戏玩家带来完美视听享受。游戏直播中往往存在游戏声音和解说员或玩家说话声音，也存在以上的问题。

发明内容

基于此，有必要针对上述问题，提供一种语音数据处理方法和系统，能提高应用中声音的混音音效质量。

一种语音数据处理方法，所述方法包括：

检测麦克风状态；

当麦克风处于打开状态时，在应用的原始音频输出到扬声器之前拦截并复制所述应用的原始音频，并调节所述应用的原始音频的增益大小；

采集麦克风输出的音频，并调节所述麦克风输出的音频的增益大小；

调节复制得到的应用的原始音频的增益大小；

将调节增益大小后的所述麦克风输出的音频和调节增益大小后的所述复制得到的应用的原始音频进行混音处理。

一种语音数据处理系统，所述系统包括：

检测模块，用于检测麦克风状态；

第一调节模块，用于当麦克风处于打开状态时，在应用的原始音频输出到扬声器之前拦截并复制所述应用的原始音频，并调节所述应用的原始音频的增益大小；

第二调节模块，用于采集麦克风输出的音频，并调节所述麦克风输出的音频的增益大小；

第三调节模块，用于调节复制得到的应用的原始音频的增益大小；

混音模块，用于将调节增益大小后的所述麦克风输出的音频和调节增益大小后的所述复制得到的应用的原始音频进行混音处理。

上述语音数据处理方法和系统，在应用的原始音频输出到扬声器之前调节应用的原始音频的增益，可以减小扬声器输出的应用的原始音频从麦克风输入影响音效质量。进行混音的应用的原始音频是通过复制得到的应用的原始音频，而不是通过扬声器输出的应用的原始音频又通过麦克风输入的音频，进一步提高了混音的音效质量。在混音前调节麦克风输出的音频和复制得到的应用的原始音频的增益大小，可以避免其中一个音频音量过大，能对声音进行精确控制，进一步提高了混音的音效质量。

此外，还提供一种游戏直播中的语音数据处理方法和系统，能提高游戏直播中声音的混音音效质量。

一种游戏直播中的语音数据处理方法，所述方法包括：

检测麦克风状态；

当麦克风处于打开状态时，在游戏原始音频输出到扬声器之前拦截并复制所述游戏原始音频，并调节所述游戏原始音频的增益大小；

调节复制得到的游戏原始音频的增益大小；

将调节增益大小后的所述麦克风输出的音频和调节增益大小后的所述复制得到的游戏原始音频进行混音处理得到游戏直播音频；

将所述游戏直播音频进行压缩编码；

获取游戏直播视频并将所述游戏直播视频进行压缩编码；

将所述压缩编码后的游戏直播音频和所述压缩编码后的游戏直播视频进行合成得到游戏直播多媒体数据。

一种游戏直播中的语音数据处理系统，所述系统包括：

语音数据处理模块，用于检测麦克风状态，当麦克风处于打开状态时，在游戏原始音频输出到扬声器之前拦截并复制所述游戏原始音频，并调节所述游戏原始音频的增益大小，采集麦克风输出的音频，并调节所述麦克风输出的音频的增益大小，调节复制得到的游戏原始音频的增益大小，将调节增益大小后的所述麦克风输出的音频和调节增益大小后的所述复制得到的游戏原始音频进行混音处理得到游戏直播音频；

音频压缩模块，用于将所述游戏直播音频进行压缩编码；

视频压缩模块，用于获取游戏直播视频并将所述游戏直播视频进行压缩编码；

合成模块，用于将所述压缩编码后的游戏直播音频和所述压缩编码后的游戏直播视频进行合成得到游戏直播多媒体数据。

上述游戏直播中的语音数据处理方法和系统，在游戏原始音频输出到扬声器之前调节游戏原始音频的增益，可以减小扬声器输出的游戏原始音频从麦克风输入影响音效质量。进行混音的游戏原始音频是通过复制得到的游戏原始音频，而不是通过扬声器输出的游戏原始音频又通过麦克风输入的音频，进一步提高了混音的音效质量。在混音前调节麦克风输出的音频和复制得到的游戏原始音频的增益大小，可以避免其中一个音频音量过大，能对声音进行精确控制，进一步提高了混音的音效质量。将压缩编码后的游戏直播音频和压缩编码后的游戏直播视频进行合成得到的游戏直播多媒体数据是具有高质量音效的包括音频和视频的多媒体数据。

附图说明

图1为一个实施例中语音数据处理方法、游戏直播中的语音数据处理方法运行的应用环境图；

图2为一个实施例中图1中的终端的内部结构图；

图3为一个实施例中语音数据处理方法的流程图；

图4为一个实施例中麦克风处于关闭状态时的语音数据处理方法的流程图；

图5为一个实施例中游戏直播中的语音数据处理方法的流程图；

图6为一个实施例中游戏直播中的语音数据处理方法的应用场景图；

图7为一个实施例中语音数据处理系统的结构框图；

图8为另一个实施例中语音数据处理系统的结构框图；

图9为一个实施例中第一调节模块的结构框图；

图10为一个实施例中游戏直播中的语音数据处理系统的结构框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

图1为一个实施例中语音数据处理方法和游戏直播中的语音数据处理方法运行的应用环境图。如图1所示，该应用环境包括终端110、服务器120、终端130。终端110、终端130都可以和服务器120通过网络进行通信。

终端110和终端130可为智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此。终端110可获取应用的原始音频，并通过扬声器输出，终端110有麦克风，可从麦克风输入语音也可采集麦克风输出的音频。终端110可以对各种音频的增益大小进行调节，和进行混音处理，并将混音处理后的音频经过压缩编码后发给服务器120。终端110还可获取应用的视频，将音频或视频进行压缩编码，将压缩编码后的音频和视频进行合成，并将合成后的数据发给服务器120。可以理解的是，终端110也可以将压缩编码后的混音处理后的音频和应用的视频直接发给服务器120，服务器120可以将接收到的压缩编码后的音频和视频进行合成。终端130可从服务器120获取数据，如混音数据或游戏直播多媒体数据，并将获取的数据进行播放。可以理解的是，终端110和终端130可以为同一终端。

图1中的终端110的内部结构如图2所示，该终端110包括通过系统总线连接的处理器、图形处理单元、存储介质、内存、网络接口、显示屏幕、扬声器和输入设备包括麦克风。其中，终端110的存储介质存储有操作系统，还包括一种语音数据处理系统，该语音数据处理系统用于实现一种语音数据处理方法。该处理器用于提供计算和控制能力，支撑整个终端110的运行。终端110中的图形处理单元用于至少提供视频图像的绘制，如直播游戏画面的绘制，内存为存储介质中的语音数据处理系统的运行提供环境，网络接口用于与服务器120进行网络通信，如接收应用的原始音频，如游戏的原始声音等。显示屏幕用于显示视频，如游戏视频画面。扬声器用于播放音频，如游戏声音、玩家声音等，输入设备用于接收用户输入的命令或数据等，输入设备包括麦克风用于接收用户输入的语音等。对于带触摸屏的终端110，显示屏幕可为触摸屏，输入设备包括触摸屏。

如图3所示，在一个实施例中，提供了一种语音数据处理方法，以应用于上述应用环境中的终端来举例说明，包括如下步骤：

步骤S210，检测麦克风状态。

具体的，麦克风状态包括打开状态和关闭状态，当麦克风处于打开状态时，可通过麦克风接收用户输入的语音。检测麦克风当前所处的状态，根据不同的检测结果，在进行音频的增益调节时进行不同的处理。

步骤S220，当麦克风处于打开状态时，在应用的原始音频输出到扬声器之前拦截并复制应用的原始音频，并调节应用的原始音频的增益大小。

具体的，在应用的原始音频输出到扬声器之前需要将语音数据写入播放缓冲中，对语音数据写入播放缓冲进行hook(挂钩)，hook是指改变原来程序的执行流程，即改变语音数据写入播放缓冲的执行流程，在语音数据写入播放缓冲之前先拦截并复制应用的原始音频，并调节应用的原始音频的增益大小。如将语音数据写入播放缓冲为函数write，通过hook的方式，使调用函数write时变成调用改写的函数mywrite，函数mywrite会先根据原始音频的内存地址和数据长度得到应用的原始音频，进行复制，并调节应用的原始音频的增益大小，然后再将调节后的语音数据写入播放缓冲。

可以理解的是，可以根据输入的麦克风的音频的增益的大小，调节应用的原始音频的增益大小。如根据玩家的说话声音音量的大小，自动调节应用的原始音频的增益大小。可以根据需要自定义调节后的增益大小需要满足的预设条件，自动调节应用的原始音频的增益大小直到满足自定义的预设条件，如将应用的原始音频的增益调小。调节的方式也可以根据需要选择，如渐变式或根据一定的运算公式进行调节。在应用的原始音频输出到扬声器之前将应用的原始音频的增益调小，可以避免扬声器输出的应用的原始音频音量大，再次从麦克风输入影响音效质量。

步骤S230，采集麦克风输出的音频，并调节麦克风输出的音频的增益大小。

具体的，麦克风输出的音频可包括用户从麦克风输入的语音和通过扬声器输出的调节后的应用的原始音频从麦克风输入的音频。由于在步骤S220中己经对应用的原始音频的增益大小进行了调节，减小了通过扬声器输出的应用的原始音频从麦克风输入时对音效质量的影响。在一个实施例中，调节麦克风输出的音频的增益大小前，将麦克风输出的音频进行回声消除处理。将麦克风输出的音频进行回声消除处理可消除麦克风输出的音频中的通过扬声器输出的应用的原始音频从麦克风输入的音频，进一步减少其对音效质量的影响。可以根据复制得到的应用的原始音频的增益大小调节麦克风输出的音频的增益大小。可以根据需要自定义调节后的麦克风输出的音频的增益大小需要满足的预设条件，自动调节麦克风输出的音频的增益大小直到满足自定义的预设条件，如预设条件为麦克风输出的音频的增益大小和复制得到的应用的原始音频的增益大小满足预设比例。

步骤S240，调节复制得到的应用的原始音频的增益大小。

具体的，可以根据麦克风输出的音频的增益大小调节复制得到的应用的原始音频的增益大小，可以根据需要自定义调节后的复制得到的应用的原始音频的增益大小需要满足的预设条件，自动调节复制得到的应用的原始音频的增益大小直到满足自定义的预设条件，如预设条件为麦克风输出的音频的增益大小和复制得到的应用的原始音频的增益大小满足预设比例，如麦克风输出的音频的增益比复制得到的应用的原始音频的增益大3至6db等。通过调节复制得到的应用的原始音频的增益大小，可以避免复制得到的应用的原始音频音量过大而听不清麦克风输出的音频。可以理解的是，在调节时，可以同时调节麦克风输出的音频的增益大小和复制得到的应用的原始音频的增益大小，也可以保持其中的一个音频的增益大小不变，调节另一个音频的增益大小。

步骤S250，将调节增益大小后的麦克风输出的音频和调节增益大小后的复制得到的应用的原始音频进行混音处理。

具体的，可采用传统的混音算法将调节增益大小后的麦克风输出的音频和调节增益大小后的复制得到的应用的原始音频进行混音，得到混音音频数据，还可对混音音频数据进行防止数据溢出的处理。进行混音处理后，就可得到既包括用户输入的语音又包括应用的原始音频的音频数据。由于进行混音的应用的原始音频是通过复制得到的应用的原始音频，而不是通过扬声器输出的应用的原始音频又通过麦克风输入的音频，保证了混音的音效质量。

本实施例中，通过检测麦克风状态，当麦克风处于打开状态时，在应用的原始音频输出到扬声器之前拦截并复制应用的原始音频，并调节应用的原始音频的增益大小，采集麦克风输出的音频，并调节麦克风输出的音频的增益大小，调节复制得到的应用的原始音频的增益大小，将调节增益大小后的麦克风输出的音频和调节增益大小后的复制得到的应用的原始音频进行混音处理。在应用的原始音频输出到扬声器之前调节应用的原始音频的增益，可以减小扬声器输出的应用的原始音频从麦克风输入影响音效质量。进行混音的应用的原始音频是通过复制得到的应用的原始音频，而不是通过扬声器输出的应用的原始音频又通过麦克风输入的音频，进一步提高了混音的音效质量。在混音前调节麦克风输出的音频和复制得到的应用的原始音频的增益大小，可以避免其中一个音频音量过大，能对声音进行精确控制，进一步提高了混音的音效质量。

在一个实施例中，如图4所示，所述方法还包括：

步骤S310，当麦克风处于关闭状态时，将调节增益大小后的应用的原始音频的增益进行反向调节，直到增益大小等于调节增益大小前的应用的原始音频的增益大小。

具体的，当麦克风处于关闭状态时，通过扬声器输出的应用的原始音频不会被麦克风采集再次输入，将调节增益大小后的应用的原始音频的增益进行反向调节，直到增益大小等于调节增益大小前的应用的原始音频的增益大小，恢复从扬声器输出的应用的原始音频的音量。

步骤S320，当麦克风处于关闭状态时，将调节增益大小后的复制得到的应用的原始音频的增益进行反向调节，直到增益大小等于调节增益大小前的复制得到的应用的原始音频的增益大小。

具体的，当麦克风处于关闭状态时，不需要进行混音，将调节增益大小后的复制得到的应用的原始音频的增益进行反向调节，直到增益大小等于调节增益大小前的复制得到的应用的原始音频的增益大小。调节的方式也可以根据需要选择，如渐变式或根据一定的运算公式进行调节。

在一个实施例中，所述调节应用的原始音频的增益大小的调节方式、将调节增益大小后的应用的原始音频的增益进行反向调节的调节方式以及将调节增益大小后的复制得到的应用的原始音频的增益进行反向调节的调节方式都为渐变式的调节方式。

具体的，采用渐变式的调节方式更符合主观听觉效果，如可以在固定的时间内调整到符合条件的增益大小。

在一个实施例中，调节所述应用的原始音频的增益大小的步骤包括：将应用的原始音频的增益大小调节为0，采集麦克风输出的音频，并计算音频的平均增益，根据平均增益调节应用的原始音频的增益大小。

具体的，先将应用的原始音频的增益大小调节为0，则采集得到的麦克风输出的音频是用户从麦克风输入的语音，可以避免应用的原始音频对评估用户从麦克风输入的语音的增益大小的影响。计算音频的平均增益，如有多个用户输入语音则可以在预设时间内统计多个语音的增益求平均值。根据平均增益调节应用的原始音频的增益大小，可以根据需要自定义调节后的应用的原始音频的增益大小需要满足的预设条件，自动调节应用的原始音频的增益大小直到满足自定义的预设条件，如预设条件为应用的原始音频的增益大小和平均增益大小满足预设比例，如应用的原始音频的增益比平均增益小12db以上。

在一个实施例中，调节麦克风输出的音频的增益大小，调节复制得到的应用的原始音频的增益大小的步骤包括：保持麦克风输出的音频的增益大小不变，将复制得到的应用的原始音频的增益大小调节到比麦克风输出的音频的增益小。

具体的，保持麦克风输出的音频的增益大小不变，只需要调节复制得到的应用的原始音频的增益大小，这种调节方式简单方便。将复制得到的应用的原始音频的增益大小调节到比麦克风输出的音频的增益小，可以避免复制得到的应用的原始音频音量过大听不清麦克风输出的音频。优先的，将复制得到的应用的原始音频的增益大小调节到比麦克风输出的音频的增益小3至6DB。

在一个实施例中，如图5所示，提供了一种游戏直播中的语音数据处理方法，包括以下步骤：

步骤S410，检测麦克风状态。

具体的，结合图6所示，检测麦克风510的状态，麦克风510的状态包括打开状态和关闭状态，当麦克风处于打开状态时，可以通过麦克风接收用户输入的语音，如游戏解说语音或玩家之间对话语音。游戏直播将游戏与解说同步结合，能满足玩家在游戏之时更好的进行交流互动。检测麦克风510当前所处的状态，根据不同的检测结果，在进行音频的增益调节时进行不同的处理。

步骤S420，当麦克风处于打开状态时，在游戏原始音频输出到扬声器之前拦截并复制游戏原始音频，并调节游戏原始音频的增益大小。

具体的，如图6所示，当麦克风510处于打开状态时，在游戏原始音频输出到扬声器520之前拦截并复制游戏原始音频，并调节游戏原始音频的增益大小。

可以理解的是，可以根据输入的麦克风的音频的增益的大小，调节游戏原始音频的增益大小。如根据玩家的说话声音音量的大小，自动调节游戏原始音频的增益大小。可以根据需要自定义调节后的增益大小需要满足的预设条件，自动调节游戏原始音频的增益大小直到满足自定义的预设条件，如将游戏原始音频的增益调小。调节的方式也可以根据需要选择，如渐变式或根据一定的运算公式进行调节。在游戏原始音频输出到扬声器之前将游戏原始音频的增益调小，可以避免扬声器输出的游戏原始音频音量大，再次从麦克风输入影响音效质量。

步骤S430，采集麦克风输出的音频，并调节麦克风输出的音频的增益大小。

具体的，采集麦克风510输出的音频，麦克风510输出的音频可包括用户从麦克风输入的语音和通过扬声器520输出的调节后的游戏原始音频从麦克风510输入的音频。在一个实施例中，调节麦克风输出的音频的增益大小前，将麦克风输出的音频进行回声消除处理。将麦克风输出的音频进行回声消除处理可消除麦克风输出的音频中的通过扬声器输出的游戏原始音频从麦克风输入的音频，进一步减少其对音效质量的影响。可以根据复制得到的游戏原始音频的增益大小调节麦克风输出的音频的增益大小。可以根据需要自定义调节后的麦克风输出的音频的增益大小需要满足的预设条件，自动调节麦克风输出的音频的增益大小直到满足自定义的预设条件，如预设条件为麦克风输出的音频的增益大小和复制得到的游戏原始音频的增益大小满足预设比例。

步骤S440，调节复制得到的游戏原始音频的增益大小。

具体的，可以根据麦克风510输出的音频的增益大小调节复制得到的游戏原始音频的增益大小，可以根据需要自定义调节后的复制得到的游戏原始音频的增益大小需要满足的预设条件，自动调节复制得到的游戏原始音频的增益大小直到满足自定义的预设条件，如预设条件为麦克风输出的音频的增益大小和复制得到的游戏原始音频的增益大小满足预设比例，如麦克风输出的音频的增益比复制得到的游戏原始音频的增益大3至6db等。通过调节复制得到的游戏原始音频的增益大小，可以避免复制得到的游戏原始音频音量过大而听不清麦克风输出的音频。可以理解的是，在调节时，可以同时调节麦克风输出的音频的增益大小和复制得到的游戏原始音频的增益大小，也可以保持其中的一个音频的增益大小不变，调节另一个音频的增益大小。

步骤S450，将调节增益大小后的麦克风输出的音频和调节增益大小后的复制得到的游戏原始音频进行混音处理得到游戏直播音频。

具体的，游戏直播音频包括从麦克风510输入的语音和游戏原始音频，如玩家说话声音和游戏音乐声音。可采用传统的混音算法将调节增益大小后的麦克风输出的音频和调节增益大小后的复制得到的游戏原始音频进行混音，得到混音音频数据，还可对混音音频数据进行防止数据溢出的处理。进行混音处理后，就可得到既包括用户输入的语音又包括游戏原始音频的音频数据。由于进行混音的游戏原始音频是通过复制得到的游戏原始音频，而不是通过扬声器输出的游戏原始音频又通过麦克风输入的音频，保证了混音的音效质量。

步骤S460，将游戏直播音频进行压缩编码。

具体的，可采用传统的音频压缩算法对游戏直播音频进行压缩编码。

步骤S470，获取游戏直播视频并将游戏直播视频进行压缩编码。

具体的，游戏直播视频是游戏直播画面的连续展示，记录了游戏过程中的图像信息。可采用传统的视频压缩算法对游戏直播视频进行压缩编码。

步骤S480，将压缩编码后的游戏直播音频和压缩编码后的游戏直播视频进行合成得到游戏直播多媒体数据。

具体的，可采用传统的合成算法对压缩编码后的游戏直播音频和压缩编码后的游戏直播视频进行合成。合成得到的游戏直播多媒体数据既包括音频数据又包括视频数据，并且在时间上是同步的。

本实施例中，在游戏原始音频输出到扬声器之前调节游戏原始音频的增益，可以减小扬声器输出的游戏原始音频从麦克风输入影响音效质量。进行混音的游戏原始音频是通过复制得到的游戏原始音频，而不是通过扬声器输出的游戏原始音频又通过麦克风输入的音频，进一步提高了混音的音效质量。在混音前调节麦克风输出的音频和复制得到的游戏原始音频的增益大小，可以避免其中一个音频音量过大，能对声音进行精确控制，进一步提高了混音的音效质量。将压缩编码后的游戏直播音频和压缩编码后的游戏直播视频进行合成得到的游戏直播多媒体数据是具有高质量音效的包括音频和视频的多媒体数据。

在一个实施例中，游戏直播中的语音数据处理方法还包括：

当麦克风处于关闭状态时，将调节增益大小后的游戏原始音频的增益进行反向调节，直到增益大小等于调节增益大小前的游戏原始音频的增益大小；

当麦克风处于关闭状态时，将调节增益大小后的复制得到的游戏原始音频的增益进行反向调节，直到增益大小等于调节增益大小前的复制得到的游戏原始音频的增益大小。

在一个实施例中，调节游戏原始音频的增益大小的调节方式、将调节增益大小后的游戏原始音频的增益进行反向调节的调节方式以及将调节增益大小后的复制得到的游戏原始音频的增益进行反向调节的调节方式都为渐变式的调节方式。

在一个实施例中，调节游戏原始音频的增益大小的步骤包括：将游戏原始音频的增益大小调节为0；采集麦克风输出的音频，并计算音频的平均增益；根据平均增益调节游戏原始音频的增益大小。

在一个实施例中，调节麦克风输出的音频的增益大小，调节复制得到的游戏原始音频的增益大小的步骤包括：保持麦克风输出的音频的增益大小不变，将复制得到的游戏原始音频的增益大小调节到比麦克风输出的音频的增益小。

在一个实施例中，如图7所示，提供了一种语音数据处理系统，包括：

检测模块610，用于检测麦克风状态。

第一调节模块620，用于当麦克风处于打开状态时，在应用的原始音频输出到扬声器之前拦截并复制应用的原始音频，并调节应用的原始音频的增益大小。

第二调节模块630，用于采集麦克风输出的音频，并调节麦克风输出的音频的增益大小。

第三调节模块640，用于调节复制得到的应用的原始音频的增益大小。

混音模块650，用于将调节增益大小后的麦克风输出的音频和调节增益大小后的复制得到的应用的原始音频进行混音处理。

在一个实施例中，如图8所示，所述系统还包括：

第一反向调节模块660，用于当麦克风处于关闭状态时，将调节增益大小后的应用的原始音频的增益进行反向调节，直到增益大小等于调节增益大小前的应用的原始音频的增益大小。

第二反向调节模块670，用于当麦克风处于关闭状态时，将调节增益大小后的复制得到的应用的原始音频的增益进行反向调节，直到增益大小等于调节增益大小前的复制得到的应用的原始音频的增益大小。

在一个实施例中，第一调节模块620调节应用的原始音频的增益大小的调节方式、第一反向调节模块660将调节增益大小后的应用的原始音频的增益进行反向调节的调节方式以及第二反向调节模块670将调节增益大小后的复制得到的应用的原始音频的增益进行反向调节的调节方式都为渐变式的调节方式。

在一个实施例中，如图9所示，第一调节模块620包括：

第一调节单元621，用于将应用的原始音频的增益大小调节为0。

计算单元622，用于采集麦克风输出的音频，并计算音频的平均增益。

第二调节单元623，用于根据平均增益调节应用的原始音频的增益大小。

在一个实施例中，第二调节模块630还用于保持麦克风输出的音频的增益大小不变，第三调节模块640还用于将复制得到的应用的原始音频的增益大小调节到比麦克风输出的音频的增益小。

在一个实施例中，如图10所示，提供了一种游戏直播中的语音数据处理系统，包括：

语音数据处理模块710，用于检测麦克风状态，当麦克风处于打开状态时，在游戏原始音频输出到扬声器之前拦截并复制游戏原始音频，并调节游戏原始音频的增益大小，采集麦克风输出的音频，并调节麦克风输出的音频的增益大小，调节复制得到的游戏原始音频的增益大小，将调节增益大小后的麦克风输出的音频和调节增益大小后的复制得到的游戏原始音频进行混音处理得到游戏直播音频。

音频压缩模块720，用于将游戏直播音频进行压缩编码。

视频压缩模块730，用于获取游戏直播视频并将游戏直播视频进行压缩编码。

合成模块740，用于将压缩编码后的游戏直播音频和压缩编码后的游戏直播视频进行合成得到游戏直播多媒体数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述程序可存储于一计算机可读取存储介质中，如本发明实施例中，该程序可存储于计算机系统的存储介质中，并被该计算机系统中的至少一个处理器执行，以实现包括如上述各方法的实施例的流程。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种语音数据处理方法，所述方法包括：

检测麦克风状态；

当麦克风处于打开状态时，在应用的原始音频输出到扬声器之前拦截并复制所述应用的原始音频，根据输入的麦克风的音频的增益的大小调节所述应用的原始音频的增益大小；

采集麦克风输出的音频，麦克风输出的音频包括用户从麦克风输入的语音和通过扬声器输出的调节后的应用的原始音频从麦克风输入的音频，并调节所述麦克风输出的音频的增益大小；

调节复制得到的应用的原始音频的增益大小；

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当麦克风处于关闭状态时，将调节增益大小后的所述应用的原始音频的增益进行反向调节，直到所述增益大小等于调节增益大小前的所述应用的原始音频的增益大小；

当麦克风处于关闭状态时，将调节增益大小后的所述复制得到的应用的原始音频的增益进行反向调节，直到所述增益大小等于调节增益大小前的所述复制得到的应用的原始音频的增益大小。

3.根据权利要求2所述的方法，其特征在于，所述调节所述应用的原始音频的增益大小的调节方式、所述将调节增益大小后的所述应用的原始音频的增益进行反向调节的调节方式以及所述将调节增益大小后的所述复制得到的应用的原始音频的增益进行反向调节的调节方式都为渐变式的调节方式。

4.根据权利要求1所述的方法，其特征在于，所述调节所述应用的原始音频的增益大小的步骤包括：

将所述应用的原始音频的增益大小调节为0；

采集麦克风输出的音频，并计算所述音频的平均增益；

根据所述平均增益调节所述应用的原始音频的增益大小。

5.根据权利要求1所述的方法，其特征在于，所述调节所述麦克风输出的音频的增益大小，调节复制得到的应用的原始音频的增益大小的步骤包括：

保持所述麦克风输出的音频的增益大小不变，将所述复制得到的应用的原始音频的增益大小调节到比所述麦克风输出的音频的增益小。

6.一种游戏直播中的语音数据处理方法，所述方法包括：

检测麦克风状态；

当麦克风处于打开状态时，在游戏原始音频输出到扬声器之前拦截并复制所述游戏原始音频，根据输入的麦克风的音频的增益的大小调节所述游戏原始音频的增益大小；

采集麦克风输出的音频，麦克风输出的音频包括用户从麦克风输入的语音和通过扬声器输出的调节后的游戏原始音频从麦克风输入的音频，并调节所述麦克风输出的音频的增益大小；

调节复制得到的游戏原始音频的增益大小；

将所述游戏直播音频进行压缩编码；

获取游戏直播视频并将所述游戏直播视频进行压缩编码；

7.一种语音数据处理系统，其特征在于，所述系统包括：

检测模块，用于检测麦克风状态；

第一调节模块，用于当麦克风处于打开状态时，在应用的原始音频输出到扬声器之前拦截并复制所述应用的原始音频，根据输入的麦克风的音频的增益的大小调节所述应用的原始音频的增益大小；

第二调节模块，用于采集麦克风输出的音频，麦克风输出的音频包括用户从麦克风输入的语音和通过扬声器输出的调节后的应用的原始音频从麦克风输入的音频，并调节所述麦克风输出的音频的增益大小；

8.根据权利要求7所述的系统，其特征在于，所述系统还包括：

第一反向调节模块，用于当麦克风处于关闭状态时，将调节增益大小后的所述应用的原始音频的增益进行反向调节，直到所述增益大小等于调节增益大小前的所述应用的原始音频的增益大小；

第二反向调节模块，用于当麦克风处于关闭状态时，将调节增益大小后的所述复制得到的应用的原始音频的增益进行反向调节，直到所述增益大小等于调节增益大小前的所述复制得到的应用的原始音频的增益大小。

9.根据权利要求8所述的系统，其特征在于，所述第一调节模块调节所述应用的原始音频的增益大小的调节方式、所述第一反向调节模块将调节增益大小后的所述应用的原始音频的增益进行反向调节的调节方式以及所述第二反向调节模块将调节增益大小后的所述复制得到的应用的原始音频的增益进行反向调节的调节方式都为渐变式的调节方式。

10.根据权利要求7所述的系统，其特征在于，所述第一调节模块包括：

第一调节单元，用于将所述应用的原始音频的增益大小调节为0；

计算单元，用于采集麦克风输出的音频，并计算所述音频的平均增益；

第二调节单元，用于根据所述平均增益调节所述应用的原始音频的增益大小。

11.根据权利要求7所述的系统，其特征在于，所述第二调节模块还用于保持所述麦克风输出的音频的增益大小不变，所述第三调节模块还用于将所述复制得到的应用的原始音频的增益大小调节到比所述麦克风输出的音频的增益小。

12.一种游戏直播中的语音数据处理系统，所述系统包括：

语音数据处理模块，用于检测麦克风状态，当麦克风处于打开状态时，在游戏原始音频输出到扬声器之前拦截并复制所述游戏原始音频，根据输入的麦克风的音频的增益的大小调节所述游戏原始音频的增益大小，采集麦克风输出的音频，麦克风输出的音频包括用户从麦克风输入的语音和通过扬声器输出的调节后的游戏原始音频从麦克风输入的音频，并调节所述麦克风输出的音频的增益大小，调节复制得到的游戏原始音频的增益大小，将调节增益大小后的所述麦克风输出的音频和调节增益大小后的所述复制得到的游戏原始音频进行混音处理得到游戏直播音频；

音频压缩模块，用于将所述游戏直播音频进行压缩编码；

13.一种终端，包括存储介质和处理器，所述存储介质中存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行权利要求1至6中任一项所述方法的步骤。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行权利要求1至6中任一项所述方法的步骤。