CN104133652B

CN104133652B - 一种音频播放控制方法，及终端

Info

Publication number: CN104133652B
Application number: CN201410256323.7A
Authority: CN
Inventors: 陈小荣; 徐凯; 韦龙凤
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2014-06-10
Filing date: 2014-06-10
Publication date: 2016-02-17
Anticipated expiration: 2034-06-10
Also published as: WO2015188745A1; US20160291929A1; US10235125B2; CN104133652A

Abstract

本发明实施例公开了一种音频播放控制方法，及终端，其中方法的实现包括：启动应用，并开始播放所述应用的背景音；获取前景音，并确定所述前景音的持续时间以及音量；若所述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低所述背景音的音量，并播放所述前景音。通过前景音的持续时间以及音量作为控制参数，来确定音频的播放选择方案；在所述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低所述背景音的音量；这样可以使前景音能够正常播放而不受背景音的影响；相对的，在其它情况下，则会正常播放背景音来反映或者模拟真实应用场景；以上音频播放控制自动完成，可以减少前景音与背景音相互干扰的情况。

Description

一种音频播放控制方法，及终端

技术领域

本发明涉及计算机技术领域，特别涉及一种音频播放控制方法，及终端。

背景技术

背景音是环境背景的音频，例如：在现实生活中，河流的流水声相对于河边人的说话声而言，流水声是河流这个自然环境下的背景音；学校里面的读书声，则是学校这个特定的人文环境下的背景音；在软件应用中，也存在背景音，例如：网络游戏中的背景音乐、模拟的环境音效等，均属于背景音。

除了背景音以外，处于应用环境内的人的与环境或者与人的交流活动，也会产生音频，与背景音相对的可以称之为前景音。例如：在网络游戏应用中，玩家进行相互交流的语音，相对于背景音乐来说，为前景音。用户在网络游戏过程中，播放的音乐也属于前景音。一个较为明显的区分标准是：背景音是应用自带的音频或者由服务器发送给应用的音频，前景音是在用户侧通过语音采集设备或者音频输入设备获取到的音频。

目前，在计算机技术领域，背景音是反映或者模拟真实应用场景的音频、可以用于反映或者模拟真实应用场景、还可以烘托气氛，属于较为重要的音频。前景音，则更多的体现了用户的当前需求，比如：交流的需求等；因此，前景音也是较为重要的音频。但是，两者在同时存在的时候，会存在相互干扰的情况，例如：麦克风采集的语音与应用自身的音效重叠播放，导致两者都不清晰的情况。

因此，在目前的应用使用过程中，存在前景音与背景音相互干扰的情况。

发明内容

本发明实施例提供了一种音频播放控制方法，及终端，用于减少前景音与背景音相互干扰的情况。

一种音频播放控制方法，包括：

启动应用，并开始播放所述应用的背景音；

获取前景音，并确定所述前景音的持续时间以及音量；

若所述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低所述背景音的音量，并播放所述前景音。

一种终端，包括：

音频播放单元，用于在启动应用后，开始播放所述应用的背景音；播放前景音；

音频采集单元，用于获取前景音；

音量控制单元，用于确定所述音频采集单元采集的所述前景音的持续时间以及音量；若所述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低所述背景音的音量。

从以上技术方案可以看出，本发明实施例具有以下优点：通过前景音的持续时间以及音量作为控制参数，来确定音频的播放选择方案；在所述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低所述背景音的音量；这样可以使前景音能够正常播放而不受背景音的影响；相对的，在其它情况下，则会正常播放背景音来反映或者模拟真实应用场景；以上音频播放控制自动完成，可以减少前景音与背景音相互干扰的情况。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例方法流程示意图；

图2为本发明实施例方法流程示意图；

图3为本发明实施例方法流程示意图；

图4为本发明实施例终端结构示意图；

图5为本发明实施例终端结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部份实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明实施例提供了一种音频播放控制方法，如图1所示，包括：

101：启动应用，并开始播放上述应用的背景音；

在本发明实施例中，应用可以是任意具有背景音的应用，例如：实施环境模拟应用，正在播放的实况视频播放器、游戏应用程序等；只要具有背景音的应用都是可以的，本发明实施例对其表现形式不予唯一性限定。

102：获取前景音，并确定上述前景音的持续时间以及音量；

除了背景音以外，处于应用环境内的人的与环境或者与人的交流活动，也会产生音频，与背景音相对的可以称之为前景音。前景音和背景音的一个较为明显的区分标准是：背景音是应用自带的音频或者由服务器发送给应用的音频，前景音是在用户侧通过语音采集设备或者音频输入设备获取到的音频。通常来说，前景音是除背景音以外的音频。

103：若上述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低上述背景音的音量，并播放上述前景音。

在本发明实施例中，第一阈值和第二阈值，可以由技术人员人员依据用户对应用的使用习惯进行自由设定，例如：第一阈值为1S，第二阈值为-30DB。具体的值本发明实施例不予唯一性限定。

本发明实施例，通过前景音的持续时间以及音量作为控制参数，来确定音频的播放选择方案；在上述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低上述背景音的音量；这样可以使前景音能够正常播放而不受背景音的影响；相对的，在其它情况下，则会正常播放背景音来反映或者模拟真实应用场景；以上音频播放控制自动完成，可以减少前景音与背景音相互干扰的情况。

本发明实施例还提供了如何获得背景音的具体实现方案，如下：上述开始播放上述应用的背景音包括：

使用第二音轨获取上述应用本身的声音作为背景音，并播放上述背景音。

本发明实施例还提供了如何获得前景音，以及如何确定前景音的持续时间以及音量的具体实现方案，如下：上述获取前景音，并确定上述前景音的持续时间以及音量包括：

使用第一音轨获取前景音，并监测上述第一音轨内的前景音的持续时间以及音量。

本发明实施例还提供了如何使用第一音轨获取前景音的实现方案，具体如下：上述使用第一音轨获取前景音包括：

使用第一音轨获取来自音频采集设备或者来自音频播放应用的前景音。

以上实施例通过两个音轨分别获取前景音和背景音，这样可以使前景音和背景音相互独立，可以方便本发明实施例对音量的控制。

在本发明实施例中，并不是只要前景音的持续时间大于第一阈值，且音量大于第二阈值就一定需要降低背景音的音量，例如在背景音的音量已经很低的情况下可以不降低，因此本发明实施例中降低背景音的控制方案还可以进一步加入背景音当前音量的判断，具体如下：上述降低上述背景音的音量之前，上述方法还包括：

确定上述应用的背景音是否低于初始值，若未低于初始值，则降低上述背景音的音量。

在本发明实施例中，背景音在被降低以后，如果前景音并不需要持续占据主导地位，那么可以提升背景音的音量来增强应用场景的模拟强度，具体实现如下：在降低上述背景音的音量之后还包括：

若上述前景音音量低于预定阈值时间超过设定阈值，则将上述背景音的音量恢复到初始值。

这里的音量的预定阈值是应该低于前述第二阈值的，可以是-5DB；这里低于预定阈值的持续时间的控制参数(设定阈值)可以由技术人员根据应用用户的使用习惯进行设定，例如设定为5S。

在本发明实施例中，音量的降低和恢复如果采用瞬时完成的方式是可行的，但是这样会存在音量的急剧变化引起听觉上的不适，为了将音频的播放更加自然，本发明实施例提供了如下实现方案，具体如下：上述降低上述背景音的音量包括：在预定时间段内组件降低上述背景音的音量；

上述将上述背景音的音量恢复到初始值包括：

在预定的时间段内将上述背景音的音量恢复到初始值。

上述预定的时间段，可以由技术人员预先设定，也可以在应用中提供选项由用户自行设定，时间越短则音量变化越灵敏，时间越长则音量变化越平顺；在本发明实施例中，可以设定为5S；但是其具体取值，本发明实施例不予唯一性限定。

以下实施例将以MMORPG(一种大型团战网络游戏的)为例对本发明实施例的具体实现过程进行举例说明。

通常在一些大型团战性质的MMORPG的游戏中，客户端通常会引入一些聊天工具供玩家互相沟通，使得玩家的行为可以互相配合或行动保持一致，例如QT(一种即时语音聊天工具)。本发明实施例用于实现将外部聊天工具产生的声音和游戏本身产生的声音进行良好的配合。以御龙在天中的QTalk(一种即时语音聊天工具)为例：

1)将聊天工具产生的声音视为音轨1，此音轨的声音可能时有时无(前景音)。将游戏本身产生的声音视为音轨2(背景音)，此音轨的声音可认为一直存在。

需要定义的声音参数：

音轨1音量大小；

音轨1声音出现时长；

音轨2音量大小(可调整)。

2)为了避免音轨2的声音对音轨1的声音产生干扰，需要实时的辨别音轨1中产生的声音的音量和时长，并且设定两个阀值(假设音量阀值为-30DB，时长阀值为1S)，当声音的音量和时长同时满足条件的情况下，开启闪避功能。

在本发明实施例中，闪避功能是将音轨2的音量降低，形成闪避效果的功能。本步骤是为了尽可能的保证音轨1中的声音都是有效信息，如果玩家自身的行为产生一些声音，比如拿东西、和旁边人聊天，喝水等动作产生的声音都可以视为无效声音，而通常这些声音的音量不会很大，且时长不会很长，所以当这些声音进入麦克风的时候，音量或者时长任意一项达不到阀值的情况下，闪避功能不起作用。当玩家对着麦克风说话的时候，此时的音量通常比无意产生的声音音量大，时间长，超过阀值，开启闪避功能。具体流程，如图2所示，可以如下：

201：玩家在QT讲话；

202：QT捕捉并发送给CrossProxy进程；

203：CrossProxy校验消息是否正常；如果是，进入下一步；

204：CrossProxy将玩家讲话事件通知给游戏客户端；

205：游戏客户端收到消息并做校验；

206：确定是否当前正在闪避中，如果是，那么可以结束流程，如果否，则进入下一步；

207：降低游戏音量。

3)在本发明实施例中，用户说话的(前景音)音量和时长都超过阀值的情况下，游戏中声音的音量会立刻降低，此时需要为游戏中声音音量的改变增加一个淡入淡出功能，使音量在增大、减小的时候过渡自然。

4)如果游戏中的声音已经被降低，此时需要增加一个延长时间(假设为5S)，在5S的时间内，玩家如果没有再说话，游戏中的声音音量也不会立刻增加，5S后还没有说话，则游戏声音音量升起。此功能是为了避免玩家在短时间内间断的说一些很简短的语句时(比如出发、加油、继续等...)，游戏声音不会频繁的减小、增大，过于频繁的触发也会影响玩家听感的舒适度。

301：玩家停止说话；

302：QT捕捉并发送给CrossProxy进程；

303：CrossProxy校验消息是否正常；如果是，进入下一步；

304：CrossProxy将消息通知给游戏客户端；

305：游戏客户端收到消息并做校验；

306：确定是否当前正在闪避中，如果否，那么可以结束流程，如果是，则进入下一步；

307：设置计时器，并等待计时器超时，计时器超时后进入下一步。

308：将游戏音量恢复正常。

本发明实施例的音效的综合了拼贴法，对游戏音频设计师有了更高的要求，他细分了游戏的声音类型，并且以排列组合的形式，把抽象的声音素材，具体实现到所需要的地方，对声音进行2次创作，这是一种新的游戏音效运用的理念。并具有如下效果：

1)可以让音效更加多种可能性的随机播放。

2)能够避免类似的音效重叠，节省制作时间、资金和客户端容量。

3)在客户端性能允许的前提下，可以自由的组合，让音频设计师可以直接在游戏编辑器里进行创作，而不是在最底层的音序器里。

4)一套成功的音效工程可以将来运用于多个类似的游戏，最大程度的保证了同品质的声音效果和控制了时间资金成本，控制了风险。

本发明实施例还提供了一种终端，如图4所示，包括：

音频播放单元401，用于在启动应用后，开始播放上述应用的背景音；播放前景音；

音频采集单元402，用于获取前景音；

音量控制单元403，用于确定上述音频采集单元402采集的上述前景音的持续时间以及音量；若上述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低上述背景音的音量。

本发明实施例还提供了如何获得背景音的具体实现方案，如下：可选地，上述音频播放单元401，用于使用第二音轨获取上述应用本身的声音作为背景音，并播放上述背景音。

本发明实施例还提供了如何获得前景音，以及如何确定前景音的持续时间以及音量的具体实现方案，如下：可选地，上述音频采集单元402，用于使用第一音轨获取前景音；

上述音量控制单元403，用于监测上述第一音轨内的前景音的持续时间以及音量。

本发明实施例还提供了如何使用第一音轨获取前景音的实现方案，具体如下：可选地，上述音频采集单元402，用于使用第一音轨获取来自音频采集设备或者来自音频播放应用的前景音。

在本发明实施例中，并不是只要前景音的持续时间大于第一阈值，且音量大于第二阈值就一定需要降低背景音的音量，例如在背景音的音量已经很低的情况下可以不降低，因此本发明实施例中降低背景音的控制方案还可以进一步加入背景音当前音量的判断，具体如下：可选地，上述音量控制单元403，还用于在降低上述背景音的音量之前，确定上述应用的背景音是否低于初始值，若未低于初始值，则降低上述背景音的音量。

在本发明实施例中，背景音在被降低以后，如果前景音并不需要持续占据主导地位，那么可以提升背景音的音量来增强应用场景的模拟强度，具体实现如下：可选地，上述音量控制单元403，还用于在降低上述背景音的音量之后，若上述前景音音量低于预定阈值时间超过设定阈值，则将上述背景音的音量恢复到初始值。

在本发明实施例中，音量的降低和恢复如果采用瞬时完成的方式是可行的，但是这样会存在音量的急剧变化引起听觉上的不适，为了将音频的播放更加自然，本发明实施例提供了如下实现方案，具体如下：可选地，上述音量控制单元403，用于降低上述背景音的音量包括：在预定时间段内组件降低上述背景音的音量；将上述背景音的音量恢复到初始值包括：在预定的时间段内将上述背景音的音量恢复到初始值。

本发明实施例还提供了另一种终端，如图5所示，为了便于说明，仅示出了与本发明实施例相关的部分，具体技术细节未揭示的，请参照本发明实施例方法部分。该终端可以为包括手机、平板电脑、PDA(PersonalDigitalAssistant，个人数字助理)、POS(PointofSales，销售终端)、车载电脑等任意终端设备，以终端为手机为例：

图5示出的是与本发明实施例提供的终端相关的手机的部分结构的框图。参考图5，手机包括：射频(RadioFrequency，RF)电路510、存储器520、输入单元530、显示单元540、传感器550、音频电路560、无线保真(wirelessfidelity，WiFi)模块570、处理器580、以及电源590等部件。本领域技术人员可以理解，图5中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图5对手机的各个构成部件进行具体的介绍：

RF电路510可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器580处理；另外，将设计上行的数据发送给基站。通常，RF电路510包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(LowNoiseAmplifier，LNA)、双工器等。此外，RF电路510还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(GlobalSystemofMobilecommunication，GSM)、通用分组无线服务(GeneralPacketRadioService，GPRS)、码分多址(CodeDivisionMultipleAccess，CDMA)、宽带码分多址(WidebandCodeDivisionMultipleAccess,WCDMA)、长期演进(LongTermEvolution，LTE)、电子邮件、短消息服务(ShortMessagingService，SMS)等。

存储器520可用于存储软件程序以及模块，处理器580通过运行存储在存储器520的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器520可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器520可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元530可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元530可包括触控面板531以及其他输入设备532。触控面板531，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板531上或在触控面板531附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板531可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器580，并能接收处理器580发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板531。除了触控面板531，输入单元530还可以包括其他输入设备532。具体地，其他输入设备532可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元540可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元540可包括显示面板541，可选的，可以采用液晶显示器(LiquidCrystalDisplay，LCD)、有机发光二极管(OrganicLight-EmittingDiode,OLED)等形式来配置显示面板541。进一步的，触控面板531可覆盖显示面板541，当触控面板531检测到在其上或附近的触摸操作后，传送给处理器580以确定触摸事件的类型，随后处理器580根据触摸事件的类型在显示面板541上提供相应的视觉输出。虽然在图5中，触控面板531与显示面板541是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板531与显示面板541集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器550，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板541的亮度，接近传感器可在手机移动到耳边时，关闭显示面板541和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路560、扬声器561，传声器562可提供用户与手机之间的音频接口。音频电路560可将接收到的音频数据转换后的电信号，传输到扬声器561，由扬声器561转换为声音信号输出；另一方面，传声器562将收集的声音信号转换为电信号，由音频电路560接收后转换为音频数据，再将音频数据输出处理器580处理后，经RF电路510以发送给比如另一手机，或者将音频数据输出至存储器520以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块570可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图5示出了WiFi模块570，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器580是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器520内的软件程序和/或模块，以及调用存储在存储器520内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器580可包括一个或多个处理单元；优选的，处理器580可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器580中。

手机还包括给各个部件供电的电源590(比如电池)，优选的，电源可以通过电源管理系统与处理器580逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本发明实施例中，该终端所包括的处理器580还具有以下功能：

上述处理器580，用于控制执行：启动应用，并开始播放上述应用的背景音；102：获取前景音，并确定上述前景音的持续时间以及音量；若上述前景音的持续时间大于第一阈值，且音量大于第二阈值，则降低上述背景音的音量，并播放上述前景音。

本发明实施例还提供了如何获得背景音的具体实现方案，如下：上述上述处理器580，用于控制执行：开始播放上述应用的背景音包括：使用第二音轨获取上述应用本身的声音作为背景音，并播放上述背景音。

本发明实施例还提供了如何获得前景音，以及如何确定前景音的持续时间以及音量的具体实现方案，如下：上述处理器580，用于控制执行：获取前景音，并确定上述前景音的持续时间以及音量包括：使用第一音轨获取前景音，并监测上述第一音轨内的前景音的持续时间以及音量。

本发明实施例还提供了如何使用第一音轨获取前景音的实现方案，具体如下：上述处理器580，用于控制执行：使用第一音轨获取前景音包括：使用第一音轨获取来自音频采集设备或者来自音频播放应用的前景音。

在本发明实施例中，并不是只要前景音的持续时间大于第一阈值，且音量大于第二阈值就一定需要降低背景音的音量，例如在背景音的音量已经很低的情况下可以不降低，因此本发明实施例中降低背景音的控制方案还可以进一步加入背景音当前音量的判断，具体如下：上述处理器580，用于控制执行：降低上述背景音的音量之前，还用于确定上述应用的背景音是否低于初始值，若未低于初始值，则降低上述背景音的音量。

在本发明实施例中，背景音在被降低以后，如果前景音并不需要持续占据主导地位，那么可以提升背景音的音量来增强应用场景的模拟强度，具体实现如下：在上述处理器580，用于控制执行降低上述背景音的音量之后，还用于若上述前景音音量低于预定阈值时间超过设定阈值，则将上述背景音的音量恢复到初始值。

在本发明实施例中，音量的降低和恢复如果采用瞬时完成的方式是可行的，但是这样会存在音量的急剧变化引起听觉上的不适，为了将音频的播放更加自然，本发明实施例提供了如下实现方案，具体如下：上述处理器580，用于控制执行：降低上述背景音的音量包括：在预定时间段内组件降低上述背景音的音量；

上述处理器580，用于控制执行：将上述背景音的音量恢复到初始值包括：

在预定的时间段内将上述背景音的音量恢复到初始值。

在本发明实施例方案被应用于游戏场景下时，玩家在游戏的任何阶段，任意场景说话的时候，游戏声音都不会覆盖玩家说话的声音。游戏中的声音不会对玩家产生任何干扰，便极大减少了玩家关闭游戏所有声音的概率。玩家用聊天工具播放音乐或者通过麦克风拾取外部设备的歌曲的时候，游戏中的声音音量会自动闪避，从而不会对听觉造成干扰。

值得注意的是，上述终端实施例中，所包括的各个单元只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

另外，本领域普通技术人员可以理解实现上述各方法实施例中的全部或部分步骤是可以通过程序来指令相关的硬件完成，相应的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

Claims

1.一种音频播放控制方法，其特征在于，包括：

终端启动终端内的应用，并开始播放所述应用的背景音；所述背景音是应用自带的音频或者由服务器发送给应用的音频；

获取前景音，并确定所述前景音的持续时间以及音量；所述前景音是在用户侧通过语音采集设备或者音频输入设备获取到的音频；

2.根据权利要求1所述方法，其特征在于，所述开始播放所述应用的背景音包括：

使用第二音轨获取所述应用本身的声音作为背景音，并播放所述背景音。

3.根据权利要求2所述方法，其特征在于，所述获取前景音，并确定所述前景音的持续时间以及音量包括：

使用第一音轨获取前景音，并监测所述第一音轨内的前景音的持续时间以及音量。

4.根据权利要求3所述方法，其特征在于，所述使用第一音轨获取前景音包括：

5.根据权利要求1所述方法，其特征在于，所述降低所述背景音的音量之前，所述方法还包括：

确定所述应用的背景音是否低于初始值，若未低于初始值，则降低所述背景音的音量。

6.根据权利要求1至5任意一项所述方法，其特征在于，在降低所述背景音的音量之后还包括：

若所述前景音音量低于预定阈值时间超过设定阈值，则将所述背景音的音量恢复到初始值。

7.根据权利要求6所述方法，其特征在于，所述降低所述背景音的音量包括：在预定时间段内逐渐降低所述背景音的音量；

所述将所述背景音的音量恢复到初始值包括：

在预定的时间段内将所述背景音的音量恢复到初始值。

8.一种终端，其特征在于，包括：

音频播放单元，用于在启动终端内的应用后，开始播放所述应用的背景音；播放前景音；所述背景音是应用自带的音频或者由服务器发送给应用的音频；

音频采集单元，用于获取前景音；所述前景音是在用户侧通过语音采集设备或者音频输入设备获取到的音频；

9.根据权利要求8所述终端，其特征在于，

所述音频播放单元，用于使用第二音轨获取所述应用本身的声音作为背景音，并播放所述背景音。

10.根据权利要求9所述终端，其特征在于，

所述音频采集单元，用于使用第一音轨获取前景音；

所述音量控制单元，用于监测所述第一音轨内的前景音的持续时间以及音量。

11.根据权利要求10所述终端，其特征在于，

所述音频采集单元，用于使用第一音轨获取来自音频采集设备或者来自音频播放应用的前景音。

12.根据权利要求8所述终端，其特征在于，

所述音量控制单元，还用于在降低所述背景音的音量之前，确定所述应用的背景音是否低于初始值，若未低于初始值，则降低所述背景音的音量。

13.根据权利要求8至12任意一项所述终端，其特征在于，

所述音量控制单元，还用于在降低所述背景音的音量之后，若所述前景音音量低于预定阈值时间超过设定阈值，则将所述背景音的音量恢复到初始值。

14.根据权利要求13所述终端，其特征在于，

所述音量控制单元，用于降低所述背景音的音量包括：在预定时间段内逐渐降低所述背景音的音量；将所述背景音的音量恢复到初始值包括：在预定的时间段内将所述背景音的音量恢复到初始值。