CN106356068A - 音频播放方法和装置 - Google Patents

音频播放方法和装置 Download PDF

Info

Publication number
CN106356068A
CN106356068A CN201610952725.XA CN201610952725A CN106356068A CN 106356068 A CN106356068 A CN 106356068A CN 201610952725 A CN201610952725 A CN 201610952725A CN 106356068 A CN106356068 A CN 106356068A
Authority
CN
China
Prior art keywords
audio stream
sampled point
mute part
mute
quiet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610952725.XA
Other languages
English (en)
Inventor
熊焱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongxing Technology Co Ltd
Original Assignee
Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vimicro Corp filed Critical Vimicro Corp
Priority to CN201610952725.XA priority Critical patent/CN106356068A/zh
Publication of CN106356068A publication Critical patent/CN106356068A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Abstract

本发明实施例提供了一种音频播放方法和装置,解决了现有的音频播放方式在播放静音部分时固有噪声过大而影响听觉体验的问题。该音频播放方法包括:识别所接收的音频流中的静音部分;以及在播放所述音频流时,减小所述静音部分的输出增益。

Description

音频播放方法和装置
技术领域
本发明涉及音频处理技术领域,具体涉及一种音频播放方法和装置。
背景技术
音频流的播放质量一般通过信噪比(Signal Noise Ratio,SNR)来衡量,信噪比越大,说明混在音频信号里的噪声越小,声音回放的质量越高。影响信噪比的因素有很多,其中有一项是放大器电路元件产生的固有噪声,这些固有噪声无法消除,与放大器的电路设计相关,固有噪声的幅度一般与当前数字模拟转换器(Digital to analog converter,DAC)的输出增益成正比。因此,如果当前的输出增益比较大,并且所播放的音频段落为静音部分时,固有噪声就会比较明显,从而影响用户的听觉体验。
发明内容
有鉴于此,本发明实施例提供了一种音频播放方法和装置,解决了现有的音频播放方式在播放静音部分时固有噪声过大而影响听觉体验的问题。
本发明一实施例提供的一种音频播放方法包括:
识别所接收的音频流中的静音部分;以及
在播放所述音频流时,减小所述静音部分的输出增益。
其中,识别所接收的音频流中的静音部分包括:
在播放的同时实时识别所述音频流中的静音部分。
其中,在播放的同时实时识别所述音频流中的静音部分包括:
实时选取所述音频流的待播放部分的多个采样点;以及
根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分。
其中,根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分包括:
将所述多个采样点的幅值做平方后取平均值;以及
若所述平均值小于预设的阈值,则判断为所述多个采样点所跨越的部分为静音部分。
其中,所述多个采样点所跨越的时间长度为0.06s~0.1s。
其中,减小所述静音部分的输出增益包括:
以渐变的形式减小所述静音部分的输出增益。
其中,以渐变的形式减小所述静音部分的输出增益包括:
所述渐变的初期的渐变速度要慢于后期的渐变速度。
其中,所述渐变的形式为阶梯渐变的形式。
本发明一实施例提供的一种音频播放装置:
静音识别模块,配置为识别所接收的音频流中的静音部分;以及
增益调整模块,配置为在播放所述音频流时,减小所述静音部分的输出增益。
其中,所述静音识别模块进一步配置为,在播放的同时实时识别所述音频流中的静音部分。
其中,所述静音识别模块包括:
采样点选取单元,配置为实时选取所述音频流的待播放部分的多个采样点;以及
静音判断单元,配置为根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分。
其中,所述静音判断单元包括:
计算子单元,配置为将所述多个采样点的幅值做平方后取平均值;以及
决策子单元,配置为若所述平均值小于预设的阈值,则判断为所述多个采样点所跨越的部分为静音部分。
其中,所述增益调整模块进一步配置为,以渐变的形式减小所述静音部分的输出增益。
其中,进一步包括:音频获取模块,配置为获取所述音频流。
其中,所述音频获取模块支持蓝牙通信。
本发明实施例提供的一种音频播放方法和装置,通过识别所接收的音频流中的静音部分,并在播放音频流时减小静音部分的输出增益,从而可以有效的降低静音部分的固有噪声,提高用户的听觉体验。
附图说明
图1所示为本发明一实施例提供的一种音频播放方法的流程示意图。
图2所示为本发明一实施例提供的一种音频播放方法中实时识别静音部分过程的流程示意图。
图3所示为本发明一实施例提供的一种音频播放装置的结构示意图。
图4所示为本发明另一实施例提供的一种音频播放装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的一种音频播放方法的流程示意图。如图1所示,该方法包括:
步骤101:识别所接收的音频流中的静音部分。
音频流中的静音部分指的是音频流中音频信号为零的部分,此时若以正常的输出增益播放音频流时,用户听觉上感知到的并不是完全的静音状态,因为所播放的声音里还有固有噪声,因而会影响到用户的听觉体验。
应当理解,本发明实施例中所涉及的音频流的概念并非是单独的音频文件,而是所接收到的持续的由音频信号和噪声构成的音频流媒体。在本发明一实施例中,该音频流可能是由连续播放的多个音频文件构成。因此,音频流中的静音部分有可能是其中某一个音频文件中的静音段落,也有可能是不同音频文件之间的切换间隙。
步骤102:在播放音频流时,减小静音部分的输出增益。
由于音频流的静音部分仍是存在固有噪声的,因此通过减小静音部分的输出增益可有效降低静音部分的固有噪声,从而提高用户的听觉体验。而当静音部分被播放完毕后,音频流的输出增益可回到正常水平。
应当理解,如前所述,由于音频流的概念并非是单独的音频文件,因此这里播放音频流的概念也并不是播放某一个单独的音频文件。例如,当前所接收的音频流包括A歌曲和B歌曲两个音频文件,A歌曲中包含一段静音部分,A歌曲和B歌曲的切换间隙也为一段静音部分。因此采用本发明实施例所提供的技术方案播放该音频流的过程就为:先以正常的输出增益播放A歌曲,当播放至A歌曲的静音部分时降低输出增益,这样用户所听到的固有噪声也会降低;而当A歌曲的静音部分播放完毕后,用户又可以正常收听A歌曲的其余部分;当A歌曲播放完毕后,音频流又进入了静音部分,输出增益又被降低,直至B歌曲开始播放,用户继续收听B歌曲。
在本发明一实施例中,考虑到音频流的传输和播放经常是一个实时进行的过程,此时就需要在播放的同时实时识别所述音频流中的静音部分。
图2所示为本发明一实施例提供的一种音频播放方法中实时识别静音部分过程的流程示意图。如图2所示,该过程包括:
步骤1011:实时选取该音频流的接下来待播放部分的多个采样点。
每个采样点都对应着一个时刻下音频流的幅值,该幅值的绝对值大小反映当前时刻下音频信号和固有噪声所发出声音的能量大小。该幅值一般通过分贝来衡量,取值可正可负。因此,若当前时刻音频流处于静音部分,所播放的声音中就不应包含音频信号的部分,那么所对应的采样点的幅值的绝对值应该非常小。
步骤1012:根据该多个采样点的幅值判断该多个采样点所跨越的部分是否为静音部分。
具体而言,若所取的采样点的幅值的绝对值都比较小,则说明当前音频流的能量较小,则很可能音频流正处于仅包括固有噪声的静音部分,此时就需要降低输出增益。
在本发明一实施例中,考虑到采样点的幅值取值可正可负,若直接通过所有采样点的幅值的平均值来衡量可能会因正负抵消而误判为当前处于静音部分,同时考虑到所取的采样点还有可能会跨越实际的静音部分和非静音部分;因此可将所取的多个采样点的幅值做平方后再取平均值,若该平均值小于预设的阈值,则判断为该多个采样点所跨越的部分为静音部分。这样计算的过程中采样点的幅值并不会因为本身的正负而相互抵消;同时,即使所取的采样点跨越了实际的静音部分和非静音部分,若其中非静音部分的采样点较多而使得所计算出的平均值大于了预设的阈值,也并不会将采样点所跨越的部分作为静音部分。但应当理解,上述预设的阈值可由开发人员根据实际的应用场景和实验经验而确定,本发明对该预设的阈值大小并不做限定。
在本发明一实施例中,采样点之间是需要一定时间间隔的,考虑到采样点过少并不利于静音部分的准确判断,而采样点过多不仅会增加计算负担,而且所跨越的时间过长也可能会被用户从听觉上明显感知到后续输出增益的调整过程,因此根据人耳所能识别的声音间隔一般要高于0.1s,可将多个采样点所跨越的时间长度控制在0.06s~0.1s。
在减小静音部分的输出增益的过程中,若输出增益的调整速度过快,所播放声音的能量的骤变可能会产生一个明显的爆破声,这会影响用户的听觉体验。因此,在本发明一实施例中,可以渐变的形式减小静音部分的输出增益,这样所播放声音的能量减小也是一个渐变的过程,从而可避免爆破声的产生。在一进一步实施例中,渐变的初期的渐变速度可慢于后期的渐变速度,这是考虑到渐变的初期所播放声音的能量较大,此时输出增益的渐变速度如果过快则仍有可能会导致爆破声的出现,因此渐变的初期的调整速度可相对快一些;而渐变的整体时间过慢又可能会被用户听到该输出增益的调整过慢程,因此渐变的后期的调整速度可相对快一些。
在本发明一实施例中,静音部分输出增益的渐变调整形式可为阶梯渐变的形式。此时考虑到调整初期声音的能量比较大,阶梯渐变初期的阶梯的停留时间可相对后期的阶梯更为长一些。
图3所示为本发明一实施例提供的一种音频播放装置30的结构示意图。如图3所示,该装置30包括:
静音识别模块31,配置为识别所接收的音频流中的静音部分。
增益调整模块32,配置为在播放音频流时,减小静音部分的输出增益。
在本发明一实施例中,静音识别模块31进一步配置为,在播放的同时实时识别音频流中的静音部分。
在本发明一实施例中,如图4所示,静音识别模块31包括:
采样点选取单元311,配置为实时选取音频流的待播放部分的多个采样点;以及
静音判断单元312,配置为根据多个采样点的幅值判断多个采样点所跨越的部分是否为静音部分。
在本发明一实施例中,如图4所示,静音判断单元312包括:
计算子单元3121,配置为将多个采样点的幅值做平方后取平均值;以及
决策子单元3122,配置为若平均值小于预设的阈值,则判断为多个采样点所跨越的部分为静音部分。
在本发明一实施例中,增益调整模块32进一步配置为,以渐变的形式减小静音部分的输出增益。
在本发明一实施例中,进一步包括:音频获取模块,配置为获取音频流。在一进一步实施例中,音频获取模块可支持蓝牙通信。
应当理解,上述实施例所提供的音频播放装置30中记载的每个模块或单元都与前述的一个方法步骤相对应。由此,前述的方法步骤描述的操作和特征同样适用于装置30及其中所包含的对应的模块和单元,重复的内容在此不再赘述。
本发明的教导还可以实现为一种计算机可读存储介质的计算机程序产品,包括计算机程序代码,当计算机程序代码由处理器执行时,其使得处理器能够按照本发明实施方式的方法来实现如本文实施方式所述的音频播放方法。计算机存储介质可以为任何有形媒介,例如软盘、CD-ROM、DVD、硬盘驱动器、甚至网络介质等。
应当理解,虽然以上描述了本发明实施方式的一种实现形式可以是计算机程序产品,但是本发明的实施方式的方法或装置可以被依软件、硬件、或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的方法和设备可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的方法和装置可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
应当理解,尽管在上文的详细描述中提及了装置的若干模块或单元,但是这种划分仅仅是示例性而非强制性的。实际上,根据本发明的示例性实施方式,上文描述的两个或更多模块/单元的特征和功能可以在一个模块/单元中实现,反之,上文描述的一个模块/单元的特征和功能可以进一步划分为由多个模块/单元来实现。此外,上文描述的某些模块/单元在某些应用场景下可被省略。
还应当理解,为了不模糊本发明的实施方式,说明书仅对一些关键、未必必要的技术和特征进行了描述,而可能未对一些本领域技术人员能够实现的特征做出说明。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种音频播放方法,其特征在于,包括:
识别所接收的音频流中的静音部分;以及
在播放所述音频流时,减小所述静音部分的输出增益。
2.根据权利要求1所述的方法,其特征在于,识别所接收的音频流中的静音部分包括:
在播放的同时实时识别所述音频流中的静音部分。
3.根据权利要求2所述的方法,其特征在于,在播放的同时实时识别所述音频流中的静音部分包括:
实时选取所述音频流的接下来待播放部分的多个采样点;以及
根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分。
4.根据权利要求3所述的方法,其特征在于,根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分包括:
将所述多个采样点的幅值做平方后取平均值;以及
若所述平均值小于预设的阈值,则判断为所述多个采样点所跨越的部分为静音部分。
5.根据权利要求3或4所述的方法,其特征在于,所述多个采样点所跨越的时间长度为0.06s~0.1s。
6.根据权利要求1至4中任一所述的方法,其特征在于,减小所述静音部分的输出增益包括:
以渐变的形式减小所述静音部分的输出增益。
7.根据权利要求6所述的方法,其特征在于,以渐变的形式减小所述静音部分的输出增益包括:
所述渐变的初期的渐变速度要慢于后期的渐变速度。
8.根据权利要求6所述的方法,其特征在于,所述渐变的形式为阶梯渐变的形式。
9.一种音频播放装置,其特征在于,包括:
静音识别模块,配置为识别所接收的音频流中的静音部分;以及
增益调整模块,配置为在播放所述音频流时,减小所述静音部分的输出增益。
10.根据权利要求9所述的装置,其特征在于,所述静音识别模块进一步配置为,在播放的同时实时识别所述音频流中的静音部分。
11.根据权利要求10所述的装置,其特征在于,所述静音识别模块包括:
采样点选取单元,配置为实时选取所述音频流的待播放部分的多个采样点;以及
静音判断单元,配置为根据所述多个采样点的幅值判断所述多个采样点所跨越的部分是否为静音部分。
12.根据权利要求11所述的装置,其特征在于,所述静音判断单元包括:
计算子单元,配置为将所述多个采样点的幅值做平方后取平均值;以及
决策子单元,配置为若所述平均值小于预设的阈值,则判断为所述多个采样点所跨越的部分为静音部分。
13.根据权利要求9至12中任一所述的装置,其特征在于,所述增益调整模块进一步配置为,以渐变的形式减小所述静音部分的输出增益。
14.根据权利要求9至12中任一所述的装置,其特征在于,进一步包括:音频获取模块,配置为获取所述音频流。
15.根据权利要求14所述的装置,其特征在于,所述音频获取模块支持蓝牙通信。
CN201610952725.XA 2016-11-02 2016-11-02 音频播放方法和装置 Pending CN106356068A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610952725.XA CN106356068A (zh) 2016-11-02 2016-11-02 音频播放方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610952725.XA CN106356068A (zh) 2016-11-02 2016-11-02 音频播放方法和装置

Publications (1)

Publication Number Publication Date
CN106356068A true CN106356068A (zh) 2017-01-25

Family

ID=57863491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610952725.XA Pending CN106356068A (zh) 2016-11-02 2016-11-02 音频播放方法和装置

Country Status (1)

Country Link
CN (1) CN106356068A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1971709A (zh) * 2004-01-07 2007-05-30 株式会社电装 噪音消除系统、语音识别系统以及汽车导航系统
CN1979639A (zh) * 2005-12-03 2007-06-13 鸿富锦精密工业(深圳)有限公司 静音处理装置及方法
CN101110217A (zh) * 2007-07-25 2008-01-23 北京中星微电子有限公司 一种音频信号的自动增益控制方法及装置
CN101719371A (zh) * 2009-11-20 2010-06-02 安凯(广州)微电子技术有限公司 一种语音变速的方法
JP2010156829A (ja) * 2008-12-26 2010-07-15 Fujitsu Ltd ソフトミュート装置
CN102117619A (zh) * 2009-12-31 2011-07-06 骅讯电子企业股份有限公司 白噪声阶段增益调整方法及装置
CN103198855A (zh) * 2013-02-26 2013-07-10 珠海市杰理科技有限公司 音频播放自动降噪方法、装置及音频播放器
CN104035826A (zh) * 2013-03-07 2014-09-10 安凯(广州)微电子技术有限公司 一种消除软件噪声方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1971709A (zh) * 2004-01-07 2007-05-30 株式会社电装 噪音消除系统、语音识别系统以及汽车导航系统
CN1979639A (zh) * 2005-12-03 2007-06-13 鸿富锦精密工业(深圳)有限公司 静音处理装置及方法
CN101110217A (zh) * 2007-07-25 2008-01-23 北京中星微电子有限公司 一种音频信号的自动增益控制方法及装置
JP2010156829A (ja) * 2008-12-26 2010-07-15 Fujitsu Ltd ソフトミュート装置
CN101719371A (zh) * 2009-11-20 2010-06-02 安凯(广州)微电子技术有限公司 一种语音变速的方法
CN102117619A (zh) * 2009-12-31 2011-07-06 骅讯电子企业股份有限公司 白噪声阶段增益调整方法及装置
CN103198855A (zh) * 2013-02-26 2013-07-10 珠海市杰理科技有限公司 音频播放自动降噪方法、装置及音频播放器
CN104035826A (zh) * 2013-03-07 2014-09-10 安凯(广州)微电子技术有限公司 一种消除软件噪声方法及装置

Similar Documents

Publication Publication Date Title
US9913056B2 (en) System and method to enhance speakers connected to devices with microphones
CA2699004C (en) A method and an apparatus of decoding an audio signal
CN104410379B (zh) 一种音量调节方法
US20220286781A1 (en) Method and apparatus for listening scene construction and storage medium
US8121307B2 (en) In-vehicle sound control system
CN104918177A (zh) 信号处理装置、信号处理方法和程序
KR20180132032A (ko) 객체 기반 오디오 신호 균형화
CN102165792A (zh) 环路增益推定装置以及啸叫防止装置
CN105390144B (zh) 一种音频处理方法和音频处理装置
JP4306708B2 (ja) オーディオ信号処理装置
JP2022552815A (ja) 音響システムにおけるスピーチのオーディオ品質の改善
CN101427314A (zh) 用于自动调整音频数据的播放速度的方法和装置
CN105828254B (zh) 一种音频调节方法及装置
CN110347366A (zh) 音量调节方法、终端设备、存储介质及电子设备
US10848888B2 (en) Audio data processing device and control method for an audio data processing device
CN1983804B (zh) 音频处理装置及音量管理方法
CN103839551A (zh) 音频处理系统与音频处理方法
CN110534079B (zh) 一种用于多声效卡拉ok的方法及系统
CN102571011A (zh) 一种调节音量的方法及装置
CN106356068A (zh) 音频播放方法和装置
CN113270082A (zh) 一种车载ktv控制方法及装置、以及车载智能网联终端
CN103945305B (zh) 一种信息处理的方法及电子设备
CN109243472A (zh) 一种音频处理方法及音频处理系统
WO2016131373A1 (zh) 一种控制高保真功能的方法和终端
KR20110008505A (ko) 사용자 개개인의 청력에 맞추어 오디오 기기의 음질을 제어하는 장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20171208

Address after: 519000 Guangdong city of Zhuhai province Hengqin Baohua Road No. 6, room 105, -23898 (central office)

Applicant after: Zhongxing Technology Co., Ltd.

Address before: 100191, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 16 floor

Applicant before: Beijing Vimicro Corporation

TA01 Transfer of patent application right
CB02 Change of applicant information

Address after: 519031 Guangdong city of Zhuhai province Hengqin Baohua Road No. 6, room 105, -23898 (central office)

Applicant after: Mid Star Technology Limited by Share Ltd

Address before: 519000 Guangdong city of Zhuhai province Hengqin Baohua Road No. 6, room 105, -23898 (central office)

Applicant before: Zhongxing Technology Co., Ltd.

CB02 Change of applicant information
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170125

RJ01 Rejection of invention patent application after publication