CN105810204A - 音频电平检测调整方法及装置 - Google Patents
音频电平检测调整方法及装置 Download PDFInfo
- Publication number
- CN105810204A CN105810204A CN201610148203.4A CN201610148203A CN105810204A CN 105810204 A CN105810204 A CN 105810204A CN 201610148203 A CN201610148203 A CN 201610148203A CN 105810204 A CN105810204 A CN 105810204A
- Authority
- CN
- China
- Prior art keywords
- level
- voice data
- audio
- adjustment
- variation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000001514 detection method Methods 0.000 claims description 24
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 abstract 1
- 239000000463 material Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241001269238 Data Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Television Receiver Circuits (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本发明提供一种音频电平检测调整方法及装置,所述方法包括以下步骤:获取待处理的音频数据;提取并计算该音频数据的瞬时电平,根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平;将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量,根据所述电平变化量调整所述音频数据的电平。本发明音频电平检测调整方法及装置实现了不同音视频内容中的音频电平进行一致化调整,增加了音视频内容的可听性,提升了终端用户的视听体验。
Description
技术领域
本发明涉及音频信号处理技术领域,尤其是涉及一种音频电平检测调整方法及装置。
背景技术
在音频信号中,电平是一个非常重要的信号参数,电平大小决定了声音音量的大小,一段音频通常包含具有相对完整的、独立内容的声音,比如一首音乐,一段录音等,在广播电视节目制作、播出过程中,对节目音频电平的调节和控制是节目质量的重要指标,其直接影响了节目受众的体验。而在互联网音视频内容平台中,音视频内容的音频电平也影响终端用户的体验。
无论是广播电视中的节目内容,还是互联网音视频内容网站,其音视频内容来源广泛,使用的录制设备型号多样,因此,每个音视频内容中音频电平大小可能存在很大差异,这样导致终端用户从一个内容切换到另外一个内容播放时,整体声音音量往往忽然变大或变小,用户需要针对播放内容,调整终端设备的播放音量,严重影响了终端用户的视听体验。
针对音视频内容中音频电平的检测及调整,现有技术的方法通常为测量一段音频中某一个时间点的瞬时电平,然而,该瞬时电平只能反映该时间点的音量大小,而不能反映整段音频的音量大小,因而无法根据瞬时电平确定一段音频的电平是否需要增大或减小。
发明内容
本发明的目的在于提供一种音频电平检测调整方法和装置,其能够实现不同音视频内容中的音频电平进行一致化调整,增加音视频内容的可听性,提升终端用户的视听体验。
为实现上述发明目的,本发明采用如下技术方案:
一种音频电平检测调整方法,所述方法包括以下步骤:
获取待处理的音频数据;
提取并计算该音频数据的瞬时电平,根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平;
将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量,根据所述电平变化量调整所述音频数据的电平。
进一步,在上述音频电平检测调整方法中,所述提取并计算该音频数据的瞬时电平的步骤之前还包括:
对所述音频数据进行预处理,所述预处理包括格式分析或解码。
进一步,在上述音频电平检测调整方法中,所述提取并计算该音频数据的瞬时电平,根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平的步骤具体包括:
步骤S301:提取音频数据的每一音频帧,计算该音频帧的瞬时电平;
步骤S302:判断是否有未处理的音频帧,若是,则重复步骤S301;若否,则进入步骤S303;
步骤S303:根据所述音频数据的所有音频帧对应的一系列瞬时电平,根据该一系列瞬时电平形成所述音频数据的电平直方图,根据所述电平直方图计算得到该音频数据的平均电平。
进一步,在上述音频电平检测调整方法中,所述将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量,根据所述电平变化量调整所述音频数据的电平的步骤具体包括:
将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量;
判断所述电平变化量是否大于预设的临界值,若是,则根据所述电平变化量调整所述音频数据的电平,否则结束处理。
进一步,在上述音频电平检测调整方法中,所述根据所述电平变化量调整所述音频数据的电平的步骤之后还包括:
将调整后的音频数据输出到存储设备进行存储。
另,本发明还提供一种音频电平检测调整装置,所述装置包括:
音频数据获取单元,用于获取待处理的音频数据;
瞬时电平计算单元,用于提取并计算该音频数据的瞬时电平;
平均电平计算单元,用于根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平;
电平变化量计算单元,用于将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量;
音频电平调整单元,用于根据所述电平变化量调整所述音频数据的电平。
进一步,在上述音频电平检测调整装置中,所述装置还包括:
预处理单元,用于对所述音频数据进行预处理,所述预处理包括格式分析或解码。
进一步,在上述音频电平检测调整装置中,所述装置还包括:
电平变化量判断单元,用于判断所述电平变化量是否大于预设的临界值;所述音频电平调整单元用于在判断所述电平变化量大于预设的临界值的情况下,根据所述电平变化量调整所述音频数据的电平。
本发明音频电平检测调整方法及装置实现了不同音视频内容中的音频电平进行一致化调整,增加了音视频内容的可听性,提升了终端用户的视听体验。
附图说明
图1为本发明音频电平检测调整方法的流程示意图;
图2为图1的步骤S3的具体流程示意图;
图3为本发明音频电平检测调整装置的结构示意图。
具体实施方式
为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施例。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
本发明提供一种音频电平检测调整方法,包括以下步骤:获取待处理的音频数据;提取并计算该音频数据的瞬时电平,根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平;将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量,根据所述电平变化量调整所述音频数据的电平。
请参阅图1,图1为本发明音频电平检测调整方法的流程示意图。本发明音频电平检测调整方法,包括以下步骤:
步骤S1:获取待处理的音频数据;
在具体实现时,在进行音频电平检测调整之前,先需要输入待处理的一段音频数据,可以由用户直接从外部输入该音频数据,也可以由系统自动读取内部存储或网络传输的音频数据。
步骤S2:对所述音频数据进行预处理,所述预处理包括格式分析或解码。
在具体实现时,由于获取到的音频数据格式、解码方式可能都不同,因此,在进行下一步分析处理之前,需要先分析该音频数据的格式或解码方式。
步骤S3:提取并计算该音频数据的瞬时电平,根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平;
在具体实现时,在对所述音频数据进行预处理获取音频数据的能量波形后,计算其对应的一系列瞬时电平,形成该段音频数据的电平直方图,根据所述电平直方图计算该段音频内容的平均电平,并且,对提取到的瞬时电平特征集合进行分析,计算得到该段音频内容的平均电平。
请参阅图3,所述步骤S3具体包括:
步骤S301:提取音频数据的每一音频帧,计算该音频帧的瞬时电平;
步骤S302:判断是否有未处理的音频帧,若是,则重复步骤S301;若否,则进入步骤S303;
步骤S303:根据所述音频数据的所有音频帧对应的一系列瞬时电平,根据该一系列瞬时电平形成所述音频数据的电平直方图,根据所述电平直方图计算得到该音频数据的平均电平。
步骤S4:将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量,根据所述电平变化量调整所述音频数据的电平。
在具体实现时,系统内部设有标准参考电平库,该标准参考电平库中预设有符合用户视听体验感的标准参考电平值,并且该标准参考电平值可进行修改、配置。在计算得到所述音频数据的平均电平后,从标准参考电平库读取标准参考电平,将所述音频数据的平均电平与预设的标准参考电平进行比较,计算得到所述音频数据需要增大或减小的电平变化量,从而进行电平调整。所述音频数据所有的音频电平按标准参考电平进行检测和调整后,不同音频数据之间的整体电平可达到一致化,从而增加了音视频内容的可听性,提升了终端用户的视听体验。
所述步骤S4具体包括:
将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量;
判断所述电平变化量是否大于预设的临界值,若是,则根据所述电平变化量调整所述音频数据的电平,否则结束处理。
所述步骤S4之后还包括:将调整后的音频数据输出到存储设备进行存储。
另,请参阅图3,本发明还提供一种音频电平检测调整装置,所述装置包括:
音频数据获取单元10,用于获取待处理的音频数据;
瞬时电平计算单元20,用于提取并计算该音频数据的瞬时电平;
平均电平计算单元30,用于根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平;
电平变化量计算单元40,用于将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量;
音频电平调整单元50,用于根据所述电平变化量调整所述音频数据的电平。
其中,所述装置还包括:
预处理单元60,用于对所述音频数据进行预处理,所述预处理包括格式分析或解码。
所述装置还包括:
电平变化量判断单元70,用于判断所述电平变化量是否大于预设的临界值;所述音频电平调整单元50用于在判断所述电平变化量大于预设的临界值的情况下,根据所述电平变化量调整所述音频数据的电平。
相比于现有技术,本发明音频电平检测调整方法及装置通过对一段音频数据的电平检测并计算得到该段音频数据的平均电平,并根据平均电平与预设的标准参考电平比较及调整,实现了不同内容音视频资源的音频进行归一化处理,解决播放不同内容时音量整体偏大或偏小而影响用户体验。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。
Claims (8)
1.一种音频电平检测调整方法,其特征在于,所述方法包括以下步骤:
获取待处理的音频数据;
提取并计算该音频数据的瞬时电平,根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平;
将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量,根据所述电平变化量调整所述音频数据的电平。
2.根据权利要求1所述的音频电平检测调整方法,其特征在于,所述提取并计算该音频数据的瞬时电平的步骤之前还包括:
对所述音频数据进行预处理,所述预处理包括格式分析或解码。
3.根据权利要求2所述的音频电平检测调整方法,其特征在于,所述提取并计算该音频数据的瞬时电平,根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平的步骤具体包括:
步骤S301:提取音频数据的每一音频帧,计算该音频帧的瞬时电平;
步骤S302:判断是否有未处理的音频帧,若是,则重复步骤S301;若否,则进入步骤S303;
步骤S303:根据所述音频数据的所有音频帧对应的一系列瞬时电平,根据该一系列瞬时电平形成所述音频数据的电平直方图,根据所述电平直方图计算得到该音频数据的平均电平。
4.根据权利要求3所述的音频电平检测调整方法,其特征在于,所述将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量,根据所述电平变化量调整所述音频数据的电平的步骤具体包括:
将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量;
判断所述电平变化量是否大于预设的临界值,若是,则根据所述电平变化量调整所述音频数据的电平,否则结束处理。
5.根据权利要求1所述的音频电平检测调整方法,其特征在于,所述根据所述电平变化量调整所述音频数据的电平的步骤之后还包括:
将调整后的音频数据输出到存储设备进行存储。
6.一种音频电平检测调整装置,其特征在于,所述装置包括:
音频数据获取单元,用于获取待处理的音频数据;
瞬时电平计算单元,用于提取并计算该音频数据的瞬时电平;
平均电平计算单元,用于根据所述音频数据的瞬时电平计算得到所述音频数据的平均电平;
电平变化量计算单元,用于将所述平均电平与预设的标准参考电平比较计算得到所述音频数据需要调整的电平变化量;
音频电平调整单元,用于根据所述电平变化量调整所述音频数据的电平。
7.根据权利要求6所述的音频电平检测调整装置,其特征在于,所述装置还包括:
预处理单元,用于对所述音频数据进行预处理,所述预处理包括格式分析或解码。
8.根据权利要求7所述的音频电平检测调整装置,其特征在于,所述装置还包括:
电平变化量判断单元,用于判断所述电平变化量是否大于预设的临界值;所述音频电平调整单元用于在判断所述电平变化量大于预设的临界值的情况下,根据所述电平变化量调整所述音频数据的电平。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610148203.4A CN105810204A (zh) | 2016-03-16 | 2016-03-16 | 音频电平检测调整方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610148203.4A CN105810204A (zh) | 2016-03-16 | 2016-03-16 | 音频电平检测调整方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105810204A true CN105810204A (zh) | 2016-07-27 |
Family
ID=56467571
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610148203.4A Pending CN105810204A (zh) | 2016-03-16 | 2016-03-16 | 音频电平检测调整方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105810204A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106412766A (zh) * | 2016-11-25 | 2017-02-15 | 西安烽火电子科技有限责任公司 | 一种短波信号幅度自动调整装置及方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1200645A (zh) * | 1997-05-23 | 1998-12-02 | 德国汤姆逊-布朗特公司 | 多声道音频信号中误差掩蔽的方法和装置 |
CN1212100A (zh) * | 1995-12-29 | 1999-03-24 | Dsc电讯有限合伙公司 | 话音增强系统和方法 |
CN1305661A (zh) * | 1998-04-14 | 2001-07-25 | 听觉增强有限公司 | 用户可调节的适应听力的音量控制 |
JP2009021834A (ja) * | 2007-07-12 | 2009-01-29 | Victor Co Of Japan Ltd | 音量調整装置 |
CN101764919A (zh) * | 2009-12-29 | 2010-06-30 | 广东九联科技股份有限公司 | 一种机顶盒及其调节电视频道之间音量差异的方法 |
JP2010251937A (ja) * | 2009-04-14 | 2010-11-04 | Alpine Electronics Inc | 音声処理装置 |
US20110317852A1 (en) * | 2010-06-25 | 2011-12-29 | Yamaha Corporation | Frequency characteristics control device |
CN102724462A (zh) * | 2012-06-01 | 2012-10-10 | Tcl集团股份有限公司 | 一种调节音量的方法、装置 |
CN103237258A (zh) * | 2013-03-29 | 2013-08-07 | 天脉聚源(北京)传媒科技有限公司 | 一种视频音量自动调节的系统及方法 |
-
2016
- 2016-03-16 CN CN201610148203.4A patent/CN105810204A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1212100A (zh) * | 1995-12-29 | 1999-03-24 | Dsc电讯有限合伙公司 | 话音增强系统和方法 |
CN1200645A (zh) * | 1997-05-23 | 1998-12-02 | 德国汤姆逊-布朗特公司 | 多声道音频信号中误差掩蔽的方法和装置 |
CN1136760C (zh) * | 1997-05-23 | 2004-01-28 | 德国汤姆逊-布朗特公司 | 多声道音频信号中误差掩蔽的方法和装置 |
CN1305661A (zh) * | 1998-04-14 | 2001-07-25 | 听觉增强有限公司 | 用户可调节的适应听力的音量控制 |
JP2009021834A (ja) * | 2007-07-12 | 2009-01-29 | Victor Co Of Japan Ltd | 音量調整装置 |
JP2010251937A (ja) * | 2009-04-14 | 2010-11-04 | Alpine Electronics Inc | 音声処理装置 |
CN101764919A (zh) * | 2009-12-29 | 2010-06-30 | 广东九联科技股份有限公司 | 一种机顶盒及其调节电视频道之间音量差异的方法 |
US20110317852A1 (en) * | 2010-06-25 | 2011-12-29 | Yamaha Corporation | Frequency characteristics control device |
CN102724462A (zh) * | 2012-06-01 | 2012-10-10 | Tcl集团股份有限公司 | 一种调节音量的方法、装置 |
CN103237258A (zh) * | 2013-03-29 | 2013-08-07 | 天脉聚源(北京)传媒科技有限公司 | 一种视频音量自动调节的系统及方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106412766A (zh) * | 2016-11-25 | 2017-02-15 | 西安烽火电子科技有限责任公司 | 一种短波信号幅度自动调整装置及方法 |
CN106412766B (zh) * | 2016-11-25 | 2019-11-22 | 西安烽火电子科技有限责任公司 | 一种短波信号幅度自动调整装置及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10123140B2 (en) | Dynamic calibration of an audio system | |
US9398335B2 (en) | Methods and apparatus for using user engagement to provide content presentation | |
US9047054B1 (en) | User location-based management of content presentation | |
EP2916557A1 (en) | Display apparatus and control method thereof | |
CN107316651B (zh) | 基于麦克风的音频处理方法和装置 | |
EP2538559B1 (en) | Audio controlling apparatus, audio correction apparatus, and audio correction method | |
CN103873919B (zh) | 一种信息处理方法及电子设备 | |
WO2020048217A1 (zh) | 音效调整方法、装置、电子设备以及存储介质 | |
US11863294B2 (en) | Methods and apparatus for increasing the robustness of media signatures | |
KR20190083216A (ko) | 영상의 출력 특성 조정을 위한 방법 및 장치 | |
CN113676592A (zh) | 录音方法、装置、电子设备及计算机可读介质 | |
US9749741B1 (en) | Systems and methods for reducing intermodulation distortion | |
WO2015144243A1 (en) | Image display device with automatic sound enhancement function | |
CN104978968A (zh) | 水印加载装置及水印加载的方法 | |
CN105810204A (zh) | 音频电平检测调整方法及装置 | |
CN111312287A (zh) | 一种音频信息的检测方法、装置及存储介质 | |
US11695379B2 (en) | Apparatus and method for automatic volume control with ambient noise compensation | |
CN106128474A (zh) | 一种音频处理方法和装置 | |
CN113613145B (zh) | 降噪处理方法及相关装置 | |
KR20170117786A (ko) | 영상매체에 등장하는 유명인사 얼굴 차단 및 대체 시스템 방법 | |
CN112333531A (zh) | 音频数据播放方法、设备及可读存储介质 | |
US20120117063A1 (en) | System and method of determining the appropriate mixing volume for an event sound corresponding to an impact related events and determining the enhanced event audio | |
GB2580821A (en) | Analysing speech signals | |
CN110366068B (zh) | 音频调节方法、电子设备以及装置 | |
CN110928515A (zh) | 分屏显示方法、电子设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160727 |
|
RJ01 | Rejection of invention patent application after publication |