CN106356068A

CN106356068A - 音频播放方法和装置

Info

Publication number: CN106356068A
Application number: CN201610952725.XA
Authority: CN
Inventors: 熊焱
Original assignee: Vimicro Corp
Current assignee: Zhongxing Technology Co Ltd
Priority date: 2016-11-02
Filing date: 2016-11-02
Publication date: 2017-01-25

Abstract

本发明实施例提供了一种音频播放方法和装置，解决了现有的音频播放方式在播放静音部分时固有噪声过大而影响听觉体验的问题。该音频播放方法包括：识别所接收的音频流中的静音部分；以及在播放所述音频流时，减小所述静音部分的输出增益。

Description

音频播放方法和装置

技术领域

本发明涉及音频处理技术领域，具体涉及一种音频播放方法和装置。

背景技术

音频流的播放质量一般通过信噪比(Signal Noise Ratio，SNR)来衡量，信噪比越大，说明混在音频信号里的噪声越小，声音回放的质量越高。影响信噪比的因素有很多，其中有一项是放大器电路元件产生的固有噪声，这些固有噪声无法消除，与放大器的电路设计相关，固有噪声的幅度一般与当前数字模拟转换器(Digital to analog converter，DAC)的输出增益成正比。因此，如果当前的输出增益比较大，并且所播放的音频段落为静音部分时，固有噪声就会比较明显，从而影响用户的听觉体验。

发明内容

有鉴于此，本发明实施例提供了一种音频播放方法和装置，解决了现有的音频播放方式在播放静音部分时固有噪声过大而影响听觉体验的问题。

本发明一实施例提供的一种音频播放方法包括：

识别所接收的音频流中的静音部分；以及

在播放所述音频流时，减小所述静音部分的输出增益。

其中，识别所接收的音频流中的静音部分包括：

在播放的同时实时识别所述音频流中的静音部分。

其中，在播放的同时实时识别所述音频流中的静音部分包括：

实时选取所述音频流的待播放部分的多个采样点；以及

根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分。

其中，根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分包括：

将所述多个采样点的幅值做平方后取平均值；以及

若所述平均值小于预设的阈值，则判断为所述多个采样点所跨越的部分为静音部分。

其中，所述多个采样点所跨越的时间长度为0.06s～0.1s。

其中，减小所述静音部分的输出增益包括：

以渐变的形式减小所述静音部分的输出增益。

其中，以渐变的形式减小所述静音部分的输出增益包括：

所述渐变的初期的渐变速度要慢于后期的渐变速度。

其中，所述渐变的形式为阶梯渐变的形式。

本发明一实施例提供的一种音频播放装置：

静音识别模块，配置为识别所接收的音频流中的静音部分；以及

增益调整模块，配置为在播放所述音频流时，减小所述静音部分的输出增益。

其中，所述静音识别模块进一步配置为，在播放的同时实时识别所述音频流中的静音部分。

其中，所述静音识别模块包括：

采样点选取单元，配置为实时选取所述音频流的待播放部分的多个采样点；以及

静音判断单元，配置为根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分。

其中，所述静音判断单元包括：

计算子单元，配置为将所述多个采样点的幅值做平方后取平均值；以及

决策子单元，配置为若所述平均值小于预设的阈值，则判断为所述多个采样点所跨越的部分为静音部分。

其中，所述增益调整模块进一步配置为，以渐变的形式减小所述静音部分的输出增益。

其中，进一步包括：音频获取模块，配置为获取所述音频流。

其中，所述音频获取模块支持蓝牙通信。

本发明实施例提供的一种音频播放方法和装置，通过识别所接收的音频流中的静音部分，并在播放音频流时减小静音部分的输出增益，从而可以有效的降低静音部分的固有噪声，提高用户的听觉体验。

附图说明

图1所示为本发明一实施例提供的一种音频播放方法的流程示意图。

图2所示为本发明一实施例提供的一种音频播放方法中实时识别静音部分过程的流程示意图。

图3所示为本发明一实施例提供的一种音频播放装置的结构示意图。

图4所示为本发明另一实施例提供的一种音频播放装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明一实施例提供的一种音频播放方法的流程示意图。如图1所示，该方法包括：

步骤101：识别所接收的音频流中的静音部分。

音频流中的静音部分指的是音频流中音频信号为零的部分，此时若以正常的输出增益播放音频流时，用户听觉上感知到的并不是完全的静音状态，因为所播放的声音里还有固有噪声，因而会影响到用户的听觉体验。

应当理解，本发明实施例中所涉及的音频流的概念并非是单独的音频文件，而是所接收到的持续的由音频信号和噪声构成的音频流媒体。在本发明一实施例中，该音频流可能是由连续播放的多个音频文件构成。因此，音频流中的静音部分有可能是其中某一个音频文件中的静音段落，也有可能是不同音频文件之间的切换间隙。

步骤102：在播放音频流时，减小静音部分的输出增益。

由于音频流的静音部分仍是存在固有噪声的，因此通过减小静音部分的输出增益可有效降低静音部分的固有噪声，从而提高用户的听觉体验。而当静音部分被播放完毕后，音频流的输出增益可回到正常水平。

应当理解，如前所述，由于音频流的概念并非是单独的音频文件，因此这里播放音频流的概念也并不是播放某一个单独的音频文件。例如，当前所接收的音频流包括A歌曲和B歌曲两个音频文件，A歌曲中包含一段静音部分，A歌曲和B歌曲的切换间隙也为一段静音部分。因此采用本发明实施例所提供的技术方案播放该音频流的过程就为：先以正常的输出增益播放A歌曲，当播放至A歌曲的静音部分时降低输出增益，这样用户所听到的固有噪声也会降低；而当A歌曲的静音部分播放完毕后，用户又可以正常收听A歌曲的其余部分；当A歌曲播放完毕后，音频流又进入了静音部分，输出增益又被降低，直至B歌曲开始播放，用户继续收听B歌曲。

在本发明一实施例中，考虑到音频流的传输和播放经常是一个实时进行的过程，此时就需要在播放的同时实时识别所述音频流中的静音部分。

图2所示为本发明一实施例提供的一种音频播放方法中实时识别静音部分过程的流程示意图。如图2所示，该过程包括：

步骤1011：实时选取该音频流的接下来待播放部分的多个采样点。

每个采样点都对应着一个时刻下音频流的幅值，该幅值的绝对值大小反映当前时刻下音频信号和固有噪声所发出声音的能量大小。该幅值一般通过分贝来衡量，取值可正可负。因此，若当前时刻音频流处于静音部分，所播放的声音中就不应包含音频信号的部分，那么所对应的采样点的幅值的绝对值应该非常小。

步骤1012：根据该多个采样点的幅值判断该多个采样点所跨越的部分是否为静音部分。

具体而言，若所取的采样点的幅值的绝对值都比较小，则说明当前音频流的能量较小，则很可能音频流正处于仅包括固有噪声的静音部分，此时就需要降低输出增益。

在本发明一实施例中，考虑到采样点的幅值取值可正可负，若直接通过所有采样点的幅值的平均值来衡量可能会因正负抵消而误判为当前处于静音部分，同时考虑到所取的采样点还有可能会跨越实际的静音部分和非静音部分；因此可将所取的多个采样点的幅值做平方后再取平均值，若该平均值小于预设的阈值，则判断为该多个采样点所跨越的部分为静音部分。这样计算的过程中采样点的幅值并不会因为本身的正负而相互抵消；同时，即使所取的采样点跨越了实际的静音部分和非静音部分，若其中非静音部分的采样点较多而使得所计算出的平均值大于了预设的阈值，也并不会将采样点所跨越的部分作为静音部分。但应当理解，上述预设的阈值可由开发人员根据实际的应用场景和实验经验而确定，本发明对该预设的阈值大小并不做限定。

在本发明一实施例中，采样点之间是需要一定时间间隔的，考虑到采样点过少并不利于静音部分的准确判断，而采样点过多不仅会增加计算负担，而且所跨越的时间过长也可能会被用户从听觉上明显感知到后续输出增益的调整过程，因此根据人耳所能识别的声音间隔一般要高于0.1s，可将多个采样点所跨越的时间长度控制在0.06s～0.1s。

在减小静音部分的输出增益的过程中，若输出增益的调整速度过快，所播放声音的能量的骤变可能会产生一个明显的爆破声，这会影响用户的听觉体验。因此，在本发明一实施例中，可以渐变的形式减小静音部分的输出增益，这样所播放声音的能量减小也是一个渐变的过程，从而可避免爆破声的产生。在一进一步实施例中，渐变的初期的渐变速度可慢于后期的渐变速度，这是考虑到渐变的初期所播放声音的能量较大，此时输出增益的渐变速度如果过快则仍有可能会导致爆破声的出现，因此渐变的初期的调整速度可相对快一些；而渐变的整体时间过慢又可能会被用户听到该输出增益的调整过慢程，因此渐变的后期的调整速度可相对快一些。

在本发明一实施例中，静音部分输出增益的渐变调整形式可为阶梯渐变的形式。此时考虑到调整初期声音的能量比较大，阶梯渐变初期的阶梯的停留时间可相对后期的阶梯更为长一些。

图3所示为本发明一实施例提供的一种音频播放装置30的结构示意图。如图3所示，该装置30包括：

静音识别模块31，配置为识别所接收的音频流中的静音部分。

增益调整模块32，配置为在播放音频流时，减小静音部分的输出增益。

在本发明一实施例中，静音识别模块31进一步配置为，在播放的同时实时识别音频流中的静音部分。

在本发明一实施例中，如图4所示，静音识别模块31包括：

采样点选取单元311，配置为实时选取音频流的待播放部分的多个采样点；以及

静音判断单元312，配置为根据多个采样点的幅值判断多个采样点所跨越的部分是否为静音部分。

在本发明一实施例中，如图4所示，静音判断单元312包括：

计算子单元3121，配置为将多个采样点的幅值做平方后取平均值；以及

决策子单元3122，配置为若平均值小于预设的阈值，则判断为多个采样点所跨越的部分为静音部分。

在本发明一实施例中，增益调整模块32进一步配置为，以渐变的形式减小静音部分的输出增益。

在本发明一实施例中，进一步包括：音频获取模块，配置为获取音频流。在一进一步实施例中，音频获取模块可支持蓝牙通信。

应当理解，上述实施例所提供的音频播放装置30中记载的每个模块或单元都与前述的一个方法步骤相对应。由此，前述的方法步骤描述的操作和特征同样适用于装置30及其中所包含的对应的模块和单元，重复的内容在此不再赘述。

本发明的教导还可以实现为一种计算机可读存储介质的计算机程序产品，包括计算机程序代码，当计算机程序代码由处理器执行时，其使得处理器能够按照本发明实施方式的方法来实现如本文实施方式所述的音频播放方法。计算机存储介质可以为任何有形媒介，例如软盘、CD-ROM、DVD、硬盘驱动器、甚至网络介质等。

应当理解，虽然以上描述了本发明实施方式的一种实现形式可以是计算机程序产品，但是本发明的实施方式的方法或装置可以被依软件、硬件、或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行系统，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的方法和设备可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的方法和装置可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

应当理解，尽管在上文的详细描述中提及了装置的若干模块或单元，但是这种划分仅仅是示例性而非强制性的。实际上，根据本发明的示例性实施方式，上文描述的两个或更多模块/单元的特征和功能可以在一个模块/单元中实现，反之，上文描述的一个模块/单元的特征和功能可以进一步划分为由多个模块/单元来实现。此外，上文描述的某些模块/单元在某些应用场景下可被省略。

还应当理解，为了不模糊本发明的实施方式，说明书仅对一些关键、未必必要的技术和特征进行了描述，而可能未对一些本领域技术人员能够实现的特征做出说明。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换等，均应包含在本发明的保护范围之内。

Claims

1.一种音频播放方法，其特征在于，包括：

识别所接收的音频流中的静音部分；以及

在播放所述音频流时，减小所述静音部分的输出增益。

2.根据权利要求1所述的方法，其特征在于，识别所接收的音频流中的静音部分包括：

在播放的同时实时识别所述音频流中的静音部分。

3.根据权利要求2所述的方法，其特征在于，在播放的同时实时识别所述音频流中的静音部分包括：

实时选取所述音频流的接下来待播放部分的多个采样点；以及

4.根据权利要求3所述的方法，其特征在于，根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分包括：

将所述多个采样点的幅值做平方后取平均值；以及

5.根据权利要求3或4所述的方法，其特征在于，所述多个采样点所跨越的时间长度为0.06s～0.1s。

6.根据权利要求1至4中任一所述的方法，其特征在于，减小所述静音部分的输出增益包括：

以渐变的形式减小所述静音部分的输出增益。

7.根据权利要求6所述的方法，其特征在于，以渐变的形式减小所述静音部分的输出增益包括：

所述渐变的初期的渐变速度要慢于后期的渐变速度。

8.根据权利要求6所述的方法，其特征在于，所述渐变的形式为阶梯渐变的形式。

9.一种音频播放装置，其特征在于，包括：

10.根据权利要求9所述的装置，其特征在于，所述静音识别模块进一步配置为，在播放的同时实时识别所述音频流中的静音部分。

11.根据权利要求10所述的装置，其特征在于，所述静音识别模块包括：

12.根据权利要求11所述的装置，其特征在于，所述静音判断单元包括：

13.根据权利要求9至12中任一所述的装置，其特征在于，所述增益调整模块进一步配置为，以渐变的形式减小所述静音部分的输出增益。

14.根据权利要求9至12中任一所述的装置，其特征在于，进一步包括：音频获取模块，配置为获取所述音频流。

15.根据权利要求14所述的装置，其特征在于，所述音频获取模块支持蓝牙通信。