CN117153174A - 音频动态均衡方法、电子设备及存储介质 - Google Patents
音频动态均衡方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117153174A CN117153174A CN202310901051.0A CN202310901051A CN117153174A CN 117153174 A CN117153174 A CN 117153174A CN 202310901051 A CN202310901051 A CN 202310901051A CN 117153174 A CN117153174 A CN 117153174A
- Authority
- CN
- China
- Prior art keywords
- preset
- audio signal
- equalization
- basic
- adjustment curve
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000005236 sound signal Effects 0.000 claims abstract description 172
- 238000001914 filtration Methods 0.000 claims abstract description 23
- 238000004590 computer program Methods 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 9
- 230000003247 decreasing effect Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 8
- 230000002238 attenuated effect Effects 0.000 abstract description 6
- 238000012545 processing Methods 0.000 description 13
- 230000001105 regulatory effect Effects 0.000 description 10
- 230000004044 response Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 239000003607 modifier Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000004304 visual acuity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本申请公开一种音频动态均衡方法、电子设备及存储介质,该音频动态均衡方法包括:获取初始音频信号及初始音频信号对应的幅值;在至少一个预设均衡曲线中,根据幅值与各所述预设均衡调节曲线的预设幅度阈值之间的关系,选择对应的预设均衡调节曲线作为目标均衡调节曲线;基于目标调节均衡曲线对应的目标滤波器系数组对初始音频信号进行滤波处理,得到均衡后的目标音频信号。本申请根据初始音频信号的幅值选择不同的目标均衡调节曲线实现不同的滤波:当幅值较大时,对初始音频信号进行衰减、不增强或者较少增强,当幅值较小时,对初始音频信号进行更多的增强。本申请可以保证不同幅度大小的初始音频信号都能获取最佳的均衡效果,避免出现削顶失真和破音,从而获取最佳的听感。
Description
技术领域
本申请涉及音频数据处理领域,具体涉及一种音频动态均衡方法、电子设备及存储介质。
背景技术
现我们通常所说的人声,歌声以及乐声等音频实际上都是一个复合音,也就是由声音的基音和一系列的泛音所构成的。这些泛音都是基音频率的倍数,物理学中叫分音,电声学中叫谐波,音乐中则把它们称作泛音。可以说,泛音对音色的特性有着非常重要的影响。它们的数量以及幅度的不同构成音色的频率特性曲线。这条曲线就体现了音色的表现力。
一般来说,泛音可分为低频泛音、中频泛音和高频泛音。如果低频泛音的幅度较强,音色就表现得混厚;中频泛音的幅度比较强,音色就表现得圆润、自然、和谐;高频泛音的幅度比较强,音色就表现得明亮、清透、解析力强。然而,在日常的音频处理过程中,为了能够得到使我们满意的声音,经常就需要借助均衡器(Equaliser,简称EQ)这一重要的工具。EQ是一种可以分别调节各种频率成分电信号放大量的电子设备,通过对各种不同频率的电信号的调节来补偿扬声器和声场的缺陷,补偿和修饰各种声源,从而达到调整音色的目的。
现有的音频均衡处理方法都是采用传统的图示均衡器或是参数均衡器,不考虑输入信号的幅度,不论何种幅度的输入信号,都统一进行静态的均衡处理。当输入信号接近满幅时,进行增强的均衡处理后,数字信号会超出表示范围,出现削顶失真,带来比较模糊的听感,甚至出现破音。
因此,现有技术存在不能根据输入的音频信号的幅度大小实现不同均衡处理,以实现动态的均衡的技术问题。
本背景技术描述的内容仅为了便于了解本领域的相关技术,不视作对现有技术的承认。
发明内容
为了解决上述技术问题,本申请提供了一种音频动态均衡方法、电子设备及存储介质,具体方案如下:
第一方面,本申请实施例提供了一种音频动态均衡方法,所述音频动态均衡方法包括:
获取初始音频信号及所述初始音频信号对应的幅值;
根据所述幅值确定预设均衡调节曲线,并将所述预设均衡调
节曲线确定为所述初始音频信号对应的所述初始音频信号对应的目标均衡调节曲线;
基于所述目标均衡调节曲线对应的目标滤波器系数组对所述初始音频信号进行滤波处理,得到动态均衡后的目标音频信号。
根据本申请公开的一种具体实施方式,所述获取初始音频信号及所述初始音频信号对应的幅值,包括:
获取初始音频信号;
对所述初始音频信号进行包络检测,得到所述初始音频信号对应的幅值。
根据本申请公开的一种具体实施方式,获取初始音频信号及所述初始音频信号对应的幅值的步骤之前,所述音频动态均衡方法还包括:
根据用户输入的第一指令设置预设数量(至少一个)的基础均衡调节曲线,其中,任一所述基础均衡调节曲线由不同频段的基础滤波器确定,各频段的滤波器对应不同的中心频率;
根据用户输入的第二指令设置各所述基础均衡调节曲线对应的预设幅度阈值(即设置各预设均衡调节曲线对应的预设幅度阈值),以及设置各所述基础均衡调节曲线中各频段的基础滤波器对应的基础增益值,得到对应的各预设均衡调节曲线,其中各所述基础均衡调节曲线对应的预设幅度阈值为各所述预设均衡调节曲线对应的预设幅度阈值。
根据本申请公开的一种具体实施方式,各所述基础均衡调节曲线对应多个倍频程中心频率的预设类型的基础滤波器,不同的基础滤波器作用于所述初始音频信号的不同频段。
根据本申请公开的一种具体实施方式,所述基于所述目标调节均衡曲线对应的目标滤波器系数组组对所述初始音频信号进行滤波处理,包括:
确定所述目标调节均衡曲线对应的各基础滤波器的基础滤波器系数;
将所述目标均调节衡曲线对应的各所述基础滤波器系数组合为所述目标滤波器系数组;
根据所述目标滤波器系数组调用对应的基础滤波器组对所述初始音频信号进行滤波处理。
根据本申请公开的一种具体实施方式,所述第二指令包括幅值子指令和基础增益值子指令,根据用户输入的第二指令设置各所述基础均衡调节曲线对应的预设幅度阈值,以及设置各所述基础均衡调节曲线中各频段的基础音频信号对应的基础增益值,包括:
根据所述幅值子指令设置各所述基础均衡调节曲线对应的预设幅度阈值,以及根据所述基础增益值子指令设置各所述基础均衡调节曲线中各频段的基础音频信号对应的基础增益值,使得按照对应的预设幅度阈值递增排列的各所述基础均衡调节曲线具有递减的增益总值。
根据本申请公开的一种具体实施方式,通过所述幅值确定所述初始音频信号对应的目标均衡调节曲线,包括:
判断所述初始音频信号对应的幅值是否小于全部所述预设幅度阈值中的最小预设幅度阈值,以及判断所述初始音频信号对应的幅值是否大于全部所述预设幅度阈值中的最大预设幅度阈值;
若所述初始音频信号对应的幅值小于全部所述预设幅度阈值中的最小预设幅度阈值,将最小预设幅度阈值对应的预设均衡调节曲线确定为目标均衡调节曲线;
若所述初始音频信号对应的幅值大于全部所述预设幅度阈值中的最大预设幅度阈值,将最大预设幅度阈值对应的预设均衡调节曲线确定为目标均衡调节曲线;
否则,通过预设匹配规则确定所述初始音频信号对应的目标均衡调节曲线。
根据本申请公开的一种具体实施方式,通过预设匹配规则确定所述初始音频信号对应的目标均衡调节曲线,包括:
若所述初始音频信号对应的幅值处于参考序列中任意两个相邻的预设幅度阈值范围内,利用所述两个相邻的预设幅度阈值对应的预设均衡调节曲线进行线性插值,得到所述初始音频信号对应的目标均衡调节曲线,其中,除了最小预设幅度阈值和最大预设幅度阈值外的剩余预设幅度阈值由小到大排列为所述参考序列。
第二方面,本申请实施例提供了一种音频动态均衡装置,包括:
获取单元,配置成获取初始音频信号及所述初始音频信号对应的幅值;
确定单元,配置成在至少一个预设均衡调节曲线中,根据所述幅值与各所述预设均衡调节曲线的预设幅度阈值之间的关系,选择对应的预设均衡调节曲线作为目标均衡调节曲线;
滤波单元,配置成基于所述目标均衡调节曲线对应的目标滤波器系数组对所述初始音频信号进行滤波处理,得到均衡后的目标音频信号。
第三方面,本申请实施例提供了一种电子设备,包括:处理器和存储有计算机程序的存储器,所述处理器被配置为在运行计算机程序时实现第一方面中任一项实施例所述的音频处理方法。
第四方面,本申请实施例提供了一种存储介质,其上存储有计算机程序,其中,所述程序被处理器运行时实现第一方面中任一项实施例所述的音频处理方法。
相对于现有技术而言,本申请具有以下有益效果:
本申请提供的音频动态均衡方法,获取初始音频信号及初始音频信号对应的幅值;在至少一个预设均衡调节曲线中,根据幅值确定初始音频信号对应的目标均衡调节曲线;基于目标均衡调节曲线对应的目标滤波器系数组对初始音频信号进行滤波处理,得到均衡后的目标音频信号。本申请根据初始音频信号的幅值选择不同的目标均衡调节曲线实现不同的滤波:当幅值较大时,对初始音频信号进行衰减、不增强或者较少增强,当幅值较小时,对初始音频信号进行更多的增强。本申请可以保证不同大小的初始音频信号都能获取最佳的均衡效果,避免出现削顶失真和破音,从而获取最佳的听感。
本申请实施例的其他可选特征和技术效果一部分在下文描述,一部分可通过阅读本文而明白。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本申请实施例提供的一种音频动态均衡方法的流程示意图;
图2为本申请实施例提供的一种音频动态均衡方法所涉及的预设均衡调节曲线的示意图;
图3为本申请实施例提供的一种音频动态均衡方法所涉及的动态均衡与传统均衡的效果对比图;
图4为本申请实施例提供的一种音频动态均衡装置的模块示意图;
图5为能实施根据本申请实施例的方法的电子设备的示例性结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
在下文中,可在本申请的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合,并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
除非另有限定,否则在这里使用的所有术语(包括技术术语和科学术语)具有与本申请的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义,除非在本申请的各种实施例中被清楚地限定。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互结合。
参见图1,图1为本申请实施例提供的一种音频动态均衡方法的流程示意图。如图1所示,所述音频动态均衡方法主要包括:
步骤S110,获取初始音频信号及初始音频信号对应的幅值。
具体实施时,初始音频信号可以是人声,歌声以及乐声等各种不同类型的音频信号。所述获取初始音频信号及所述初始音频信号对应的幅值的步骤,包括:
获取初始音频信号;对所述初始音频信号进行包络检测,得到所述初始音频信号对应的幅值。
具体实施时,可以通过对初始音频信号进行包络检测,得到初始音频信号对应的幅值。包络检测即成为包络检波,是一种是基于滤波检波的振动信号处理方法,通过将一段时间长度的高频信号的峰值点连线,就可以得到上方(正的)一条线和下方(负的)一条线,这两条线就叫包络线。包络线就是反映高频信号幅度变化的曲线。
获取初始音频信号及所述初始音频信号对应的幅值的步骤之前,所述音频动态均衡方法还包括:
根据用户输入的第一指令设置预设数量(至少一个)的基础均衡调节曲线,其中,任一所述基础均衡调节曲线由不同频段的基础滤波器确定,各频段的基础滤波器对应不同的中心频率;
根据用户输入的第二指令设置各所述基础均衡调节曲线对应的预设幅度阈值(即设置各预设均衡调节曲线对应的预设幅度阈值),以及设置各所述基础均衡调节曲线中各频段的基础滤波器对应的基础增益值,得到对应的各预设均衡调节曲线,其中各所述基础均衡调节曲线对应的预设幅度阈值为各所述预设均衡调节曲线对应的预设幅度阈值。
具体实施时,在获取初始音频信号之前,可以预先设置预设数量的基础均衡调节曲线,其中,预设数量可为一个或多个,并对应设置一个或多个门限值即预设幅度阈值与之对应。用户可以根据实际使用需求或者具体应用场景确定预设数量的具体数值,其中预设数量的具体数值为大于等于1的正整数,这里不做具体限定。需要说明的是,任一基础均衡调节曲线由不同频段的基础音频信号组成,任意两条基础均衡调节曲线对应的基础音频信号的数量可以相同或者不同。
参见图2,图2为本申请实施例提供的一种音频动态均衡方法所涉及的预设均衡调节曲线的示意图。如图2所示,以设置3条预设均衡调节曲线及其对应的门限值(预设幅度阈值)为例,设置与3条预设均衡调节曲线对应的r1,r2,r3三个门限值(预设幅度阈值),如图2所示,其中,门限值r1对应实线,即图2中所示预设均衡调节曲线1;门限值r2对应点线,即图2中所示预设均衡调节曲线2;门限值r3对应虚线,即图2中所示预设均衡调节曲线3。如果r3>r2>r1,则表示当初始音频信号的幅值达到r3的时候,初始音频信号较小,利用预设均衡调节曲线3进行均衡,对信号进行衰减的均衡;当初始音频信号接近r1时,初始音频信号较小,利用预设均衡调节曲线1进行均衡,可对信号进行更多的增强。
各所述基础均衡调节曲线对应多个倍频程中心频率的预设类型的基础滤波器,不同的基础滤波器作用于所述初始音频信号的不同频段。
其中所述倍频程中心频率为一种频率表示方法,在本申请实施例中,它表示所述基础滤波器组的中心频率以倍数递增或递减的。即,每个基础滤波器的中心频率的值是前一基础滤波器中心频率值的固定倍数,常见的倍频程为两倍(也称为二分音程),即每个中心频率是前一中心频率的两倍。
在本申请中,所述倍频程中心频率的使用可以使所述基础均衡曲线更方便地表示不同频段之间的频率间隔,并且所述倍频程中心频率的递增方式更符合人耳对音高的感知。
所述预设类型的基础滤波器包括但不限于无限长冲激响应(IIR,InfiniteImpulse Response)滤波器和/或有限长冲激响应(FIR,Finite Impulse Response)滤波器。
所述第二指令包括幅值子指令和基础增益值子指令,根据用户输入的第二指令设置各所述基础均衡调节曲线对应的预设幅度阈值,以及设置各所述基础均衡调节曲线中各频段的基础音频信号对应的基础增益值的步骤,包括:
根据所述幅值子指令设置各所述基础均衡调节曲线对应的预设幅度阈值;
根据所述基础增益值子指令设置各所述基础均衡调节曲线中各频段的基础音频信号对应的基础增益值。
在本发明实施例中,根据所述幅值子指令设置各所述基础均衡调节曲线对应的预设幅度阈值,以及根据所述基础增益值子指令设置各所述基础均衡调节曲线中各频段的基础音频信号对应的基础增益值,
使得按照对应的预设幅度阈值递增排列的各所述基础均衡调节曲线具有递减的增益总值,或,
使得按照对应的预设幅度阈值递减排列的各所述基础均衡调节曲线具有递增的增益总值。
参照本申请附图2,在一个具体实施例中,每条预设均衡调节曲线可以由9个倍频程中心频率的Bell滤波器(Peak EQ滤波器)组成,中心频率分别为62.5Hz,125Hz,250Hz,500Hz,1000Hz,2000Hz,4000Hz,8000Hz,16000Hz。例如,预设均衡调节曲线1中9个频段的基础音频信号对应的基础增益值可以按照基础增益值子指令分别设置为[-1,0,-1,-0.5,-1.3,-0.7,-2,-1,0],表示当初始音频信号较大的时候,可以对初始音频信号的各个频段的基础音频信号进行衰减或者不增强;预设均衡调节曲线2中9个频段的基础音频信号对应的基础增益值可以按照基础增益值子指令分别设置为[3,2,1,0,0,0,1,1,2],表示对初始音频信号的各个频段的基础音频信号进行较少的增强;同理,预设均衡调节曲线3中9个频段的基础音频信号对应的基础增益值可以按照基础增益值子指令分别设置为[6,3,2,1,1.2,1.3,2,3,4],表示当初始音频信号较小时,可以对初始音频信号的各个频段的基础音频信号进行较多的增强。
作为解释说明,前文所述“作用和”可以用于表征任一预设均衡调节曲线中各基础音频信号对应的基础增益值的集合概念。例如,作用和可以是任一预设均衡调节曲线中各基础音频信号对应的基础增益值的和,或对应的基础增益值的平均值等。具体实施时,“作用和”的具体类型可以根据用户的实际使用需求或具体应用场景自定义,这里不做进一步限定。
步骤S120,通过幅值确定初始音频信号对应的目标均衡调节曲线。
具体地,可以先判断初始音频信号对应的幅值是否小于全部预设幅度阈值中的最小预设幅度阈值,以及判断初始音频信号对应的幅值是否大于全部预设幅度阈值中的最大预设幅度阈值。若初始音频信号对应的幅值小于全部预设幅度阈值中的最小预设幅度阈值,将最小预设幅度阈值对应的预设均衡调节曲线确定为目标均衡调节曲线;若初始音频信号对应的幅值大于全部预设幅度阈值中的最大预设幅度阈值,将最大预设幅度阈值对应的预设均衡调节曲线确定为目标均衡调节曲线;否则,通过预设匹配规则确定初始音频信号对应的目标均衡调节曲线。
为了便于描述,将初始音频信号对应的幅值用Rf表示,ri为M个预设幅度阈值中的第i大的预设幅度阈值。换言之,上述步骤可以描述为:
判断初始音频信号对应的幅值Rf是否小于r1或大于rM,其中,r1为M个预设幅度阈值中的最小预设幅度阈值,rM为M个预设幅度阈值中的最大预设幅度阈值,M可以为正整数;
若初始音频信号对应的幅值Rf小于r1,将预设幅度阈值为r1的预设均衡调节曲线确定为目标均衡调节曲线;
若初始音频信号对应的幅值Rf大于rM,将预设幅度阈值为rM的预设均衡调节曲线确定为目标均衡调节曲线;否则,通过预设匹配规则确定初始音频信号对应的目标均衡调节曲线。
预设规则为:若所述初始音频信号对应的幅值处于参考序列中任意两个相邻的预设幅度阈值范围内,利用所述两个相邻的预设幅度阈值对应的预设均衡调节曲线进行线性插值,得到所述初始音频信号对应的目标均衡调节曲线,其中,除了最小预设幅度阈值和最大预设幅度阈值外的剩余预设幅度阈值由小到大排列为所述参考序列。
具体实施时,若所述初始音频信号对应的幅值Rf满足ri-1≤Rf<ri,利用预设幅度阈值为ri-1的预设均衡调节曲线和预设幅度阈值为ri的预设均衡调节曲线进行线性插值,得到所述初始音频信号对应的目标均衡调节曲线,其中,i为正整数,且2≤i<M,ri表示参考序列中第i个预设幅度阈值,除了最小预设幅度阈值r1和最大预设幅度阈值rM外的(M-2)个预设幅度阈值由小到大排列为所述参考序列;
或者,若所述初始音频信号对应的幅值Rf满足ri≤Rf<ri+1,利用预设幅度阈值为ri的预设均衡调节曲线和预设幅度阈值为ri+1的预设均衡调节曲线进行线性插值,得到所述初始音频信号对应的目标均衡调节曲线。
下面,以图2中所示的3条预设均衡调节曲线为例,详细说明预设均衡调节曲线的选择机制:
1.当初始音频信号对应的幅值Rf大于r3,将预设均衡调节曲线1确定为目标均衡调节曲线。此时,采用预设均衡调节曲线1进行均衡,表示初始音频信号的幅值很大,对初始音频信号进行动态衰减或者不增强的操作;
2.当初始音频信号对应的幅值Rf小于r3,大于r2,则利用预设均衡调节曲线2和预设均衡调节曲线1进行线性插值,以获得目标均衡调节曲线;
3.当初始音频信号对应的幅值Rf小于r2,大于r1,则利用预设均衡调节曲线2和预设均衡调节曲线3进行线性插值,以获得目标均衡调节曲线;
4.当初始音频信号对应的幅值Rf小于r1,将预设均衡调节曲线3确定为目标均衡调节曲线。此时,采用预设均衡调节曲线3进行均衡,表示初始音频信号的幅值很小,可以对初始音频信号进行更多的增强。
步骤S130,基于目标均衡调节曲线对应的目标滤波器系数组对初始音频信号进行滤波处理,得到均衡后的目标音频信号。
具体实施时,所述基于所述目标均衡调节曲线对应的目标滤波器系数组对所述初始音频信号进行滤波处理,包括:确定所述目标均衡调节曲线对应的各基础滤波器的基础滤波器系数;将所述目标均衡调节曲线对应的各所述基础滤波器系数组合为所述目标滤波器系数组;根据所述目标滤波器系数组调用对应的基础滤波器组对所述初始音频信号进行滤波处理。
通过中心频率、品质因素Q值、基础增益值即可计算出目标滤波器的系数,从而对初始音频信号进行滤波处理,达到均衡的目的。
在一些实施例中,用于各频段的基础滤波器可以为双二阶滤波器。
在一个具体示例中,所采用的基础滤波器可为Bell滤波器(Peak EQ滤波器),其传递函数计算公式如下:
上式中,H(Z)为基础滤波器的传递函数,z为复变量;b0,b1,b2为前馈系数,a0,a1,a2和为反馈系数,其统称为基础滤波器系数。
在示例性实施例中,基础滤波器的滤波过程如下:
在进一步的实施例中,可以通过增益(Gain DB)、品质因素(Q)、中心频率(f0)可以确定出对应初始音频信号采样率(Fs)的滤波器的系数。
在一个具体示例中,确定过程如下:
A=10dB/40
b0=1+αA
b1=-2cosω0
b2=1-αA
a1=-2cosω0
其中,A(Amplitude Gain)为基础滤波器的增益参数,其单位为分贝(dB);ω0为基础滤波器的中心频率参数,也称为角频率,其单位为弧度/秒(rad/s);α为基础滤波器设计中的用于控制滤波器的阻带衰减率或带通/带阻过渡带宽的宽窄程度的参数,其取值范围为0至1。
在一些实施例中,所采用的基础滤波器除Bell滤波器(Peak EQ滤波器)外,可进一步包括:无限长冲激响应(IIR,Infinite Impulse Response)滤波器和/或有限长冲激响应(FIR,Finite Impulse Response)滤波器等,具体实施时,所采用的基础滤波器的具体类型可以根据用户的实际使用需求或具体应用场景自定义。
参见图3,图3为本申请实施例提供的一种音频动态均衡方法所涉及的动态均衡与传统均衡的效果对比图。图3(a)表示输入信号即初始音频信号的峰值接近满幅,此时若采用传统的音频均衡方法进行滤波处理,会使得音频信号超过数字信号表示范围,出现了削顶,如图3(b)所示。而采用本申请中的音频动态均衡方法进行滤波,在初始音频信号接近满幅时,可以动态地选择合适的目标均衡调节曲线进行处理,不对初始音频信号进行增强,避免削顶失真,如图3(c)所示。
本申请提供的音频动态均衡方法,通过获取初始音频信号及初始音频信号对应的幅值;在至少一个预设均衡调节曲线中,根据幅值与各所述预设均衡调节曲线的预设幅度阈值之间的关系,选择对应的的预设均衡调节曲线作为目标均衡调节曲线;计算目标均衡调节曲线对应的目标滤波器系数组以对初始音频信号进行滤波处理,得到均衡后的目标音频信号。本申请根据初始音频信号的幅值选择不同的目标均衡调节曲线实现不同的滤波:当幅值较大时,对初始音频信号进行衰减、不增强或者较少增强,当幅值较小时,对初始音频信号进行更多的增强。本申请可以保证不同大小的初始音频信号都能获取最佳的均衡效果,避免出现削顶失真和破音,从而获取最佳的听感。
在本申请实施例中,提供了一种音频动态均衡装置。如图4所示,该音频动态均衡装置400可包括:获取单元430,配置成获取初始音频信号及所述初始音频信号对应的幅值;确定单元440,配置成在至少一个预设均衡调节曲线中,根据所述幅值与各所述预设均衡调节曲线的预设幅度阈值之间的关系,选择预设均衡调节曲线作为目标均衡调节曲线;滤波单元450,配置成基于所述目标均衡调节曲线对应的目标滤波器系数组对所述初始音频信号进行滤波处理,得到均衡后的目标音频信号。
在进一步的实施例中,获取单元430可包括音频获取子单元和包络检测子单元。该音频获取子单元配置成获取初始音频信号。该包络检测子单元配置成对所述初始音频信号进行包络检测,得到所述初始音频信号对应的幅值。
如图4所示,该音频动态均衡装置400可选地可包括第一设置单元410,配置成根据第一指令设置预设数量(至少一个)的基础均衡调节曲线;第二设置单元420,配置成根据第二指令设置各所述基础均衡调节曲线对应的预设幅度阈值,即,配置成根据第二指令设置各预设均衡调节曲线对应的预设幅度阈值,以及设置各所述基础均衡调节曲线中各频段的基础滤波器对应的基础增益值,得到对应的各预设均衡调节曲线,其中各所述基础均衡调节曲线对应的预设幅度阈值为各所述预设均衡调节曲线对应的预设幅度阈值。任一所述基础均衡调节曲线由不同频段的基础音频信号组成,各频段的基础音频信号对应不同的中心频率。
本领域技术人员将明白根据本申请实施例的音频动态均衡装置可以结合根据本申请实施例的音频动态均衡方法的特征,反之亦然。
在本申请实施例中,提供一种电子设备,包括:处理器和存储有计算机程序的存储器,所述处理器被配置为在运行计算机程序时执行任一本申请实施例所述的音频动态均衡方法。
图5示出了一种可以实施本申请实施例的方法或实现本申请实施例的电子设备500的示意图,在一些实施例中可以包括比图示更多或更少的电子设备。在一些实施例中,可以利用单个或多个电子设备实施。在一些实施例中,可以利用云端或分布式的电子设备实施。
如图5所示,电子设备500包括处理器501,其可以根据存储在只读存储器(ROM)502中的程序和/或数据或者从存储部分508加载到随机访问存储器(RAM)503中的程序和/或数据而执行各种适当的操作和处理。处理器501可以是一个多核的处理器,也可以包含多个处理器。在一些实施例中,处理器501可以包含一个通用的主处理器以及一个或多个特殊的协处理器,例如,中央处理器(CPU)、图形处理器(GPU)、神经网络处理器(NPU)、数字信号处理器(DSP)等等。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理器501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
上述处理器与存储器共同用于执行存储在存储器中的程序,所述程序被计算机执行时能够实现上述各实施例描述的方法、步骤或功能。
以下部件连接至I/O接口505:包括键盘、鼠标、触摸屏等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。图5中仅示意性示出部分组件,并不意味着计算机系统500只包括图5所示组件。
上述实施例阐明的系统、装置、模块或单元,可以由计算机或其关联部件实现。计算机例如可以为移动终端、智能电话、个人计算机、膝上型计算机、车载人机交互设备、个人数字助理、媒体播放器、导航设备、游戏控制台、平板电脑、可穿戴设备、智能电视、物联网系统、智能家居、工业计算机、服务器或者其组合。
尽管未示出,在本申请实施例中,提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序配置成被运行时执行任一本申请实施例的音频动态均衡方法。
在本申请的实施例的存储介质包括永久性和非永久性、可移动和非可移动的可以由任何方法或技术来实现信息存储的物品。存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
在本申请的实施例的方法、程序、系统、装置等,可以在单个或多个连网的计算机中执行或实现,也可以在分布式计算环境中实践。在本说明书实施例中,在这些分布式计算环境中,可以由通过通信网络而被连接的远程处理设备来执行任务。
所提供的电子设备和计算机可读存储介质的具体实施过程,可以参见上述实施例提供的音频动态均衡方法的具体实施过程,在此不再一一赘述。
本申请提供的电子设备和计算机可读存储介质,通过获取初始音频信号及初始音频信号对应的幅值;根据幅值与各所述预设均衡调节曲线的预设幅度阈值之间的关系确定初始音频信号对应的目标均衡调节曲线;计算目标均衡调节曲线对应的目标滤波器系数组以对初始音频信号进行滤波处理,得到均衡后的目标音频信号。本申请根据初始音频信号的幅值选择不同的目标均衡调节曲线实现不同的滤波:当幅值较大时,对初始音频信号进行衰减、不增强或者较少增强,当幅值较小时,对初始音频信号进行更多的增强。本申请可以保证不同大小的初始音频信号都能获取最佳的均衡效果,避免出现削顶失真和破音,从而获取最佳的听感。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本领域技术人员可想到,上述实施例阐明的功能模块/单元或控制器以及相关方法步骤的实现,可以用软件、硬件和软/硬件结合的方式实现。
除非明确指出,根据本申请实施例记载的方法、程序的动作或步骤并不必须按照特定的顺序来执行并且仍然可以实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本文中,针对本申请的多个实施例进行了描述,但为简明起见,各实施例的描述并不是详尽的,各个实施例之间相同或相似的特征或部分可能会被省略。在本文中,“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”意指适用于根据本申请的至少一个实施例或示例中,而非所有实施例。上述术语并不必然意味着指代相同的实施例或示例。在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
已参考上述实施例具体示出并描述了本申请的示例性系统及方法,其仅为实施本系统及方法的最佳模式的示例。本领域的技术人员可以理解的是可以在实施本系统及/或方法时对这里描述的系统及方法的实施例做各种改变而不脱离界定在所附权利要求中的本申请的精神及范围。
Claims (10)
1.一种音频动态均衡方法,其特征在于,所述音频动态均衡方法包括:
获取初始音频信号及所述初始音频信号对应的幅值;
在至少一个预设均衡调节曲线中,根据所述幅值与各所述预设均衡调节曲线的预设幅度阈值之间的关系,选择对应的预设均衡调节曲线作为目标均衡调节曲线;
基于所述目标均衡调节曲线对应的目标滤波器系数组对所述初始音频信号进行滤波处理,得到均衡后的目标音频信号。
2.根据权利要求1所述的音频动态均衡方法,其特征在于,所述获取初始音频信号及所述初始音频信号对应的幅值,包括:
获取初始音频信号;
对所述初始音频信号进行包络检测,得到所述初始音频信号对应的幅值。
3.根据权利要求1所述的音频动态均衡方法,其特征在于,获取初始音频信号及所述初始音频信号对应的幅值之前,所述音频动态均衡方法还包括:
根据第一指令设置至少一个基础均衡调节曲线,其中,任一所述基础均衡调节曲线由不同频段的基础滤波器确定,各频段的基础滤波器具有不同的中心频率;
根据第二指令设置各所述基础均衡调节曲线对应的预设幅度阈值,以及设置各所述基础均衡调节曲线中各频段的基础滤波器对应的基础增益值得到各预设均衡调节曲线,其中各所述基础均衡调节曲线对应的预设幅度阈值为各所述预设均衡调节曲线对应的预设幅度阈值。
4.根据权利要求3所述的音频动态均衡方法,其特征在于,各所述基础均衡调节曲线对应多个倍频程中心频率的预设类型的基础滤波器,不同的基础滤波器作用于所述初始音频信号的不同频段的音频信号。
5.根据权利要求3所述的音频动态均衡方法,其特征在于,所述基于所述目标均衡调节曲线对应的目标滤波器系数组对所述初始音频信号进行滤波处理,包括:
将所述目标均衡调节曲线对应的各基础滤波器的基础滤波器系数进行组合,得到所述目标滤波器系数组;
根据所述目标滤波器系数组对所述初始音频信号进行滤波处理。
6.根据权利要求3所述的音频动态均衡方法,其特征在于,所述第二指令包括幅值子指令和基础增益值子指令,
所述根据第二指令设置各所述基础均衡调节曲线对应的预设幅度阈值,以及设置各所述基础均衡调节曲线中各频段的基础音频信号对应的基础增益值,包括:
根据所述幅值子指令设置各所述基础均衡调节曲线对应的预设幅度阈值,以及根据所述基础增益值子指令设置各所述基础均衡调节曲线中各频段的基础音频信号对应的基础增益值,其中,任一所述基础均衡调节曲线对应的全部基础增益值的作用和为增益总值,使得按照对应的预设幅度阈值递增排列的各所述基础均衡调节曲线具有递减的增益总值。
7.根据权利要求1所述的音频动态均衡方法,其特征在于,所述根据所述幅值与各所述预设均衡调节曲线的预设幅度阈值之间的关系,选择对应的预设均衡调节曲线作为目标均衡调节曲线,包括:
判断所述初始音频信号对应的幅值是否小于全部所述预设均衡调节曲线的预设幅度阈值中的最小预设幅度阈值,以及判断所述初始音频信号对应的幅值是否大于全部所述预设均衡调节曲线的预设幅度阈值中的最大预设幅度阈值;
若所述初始音频信号对应的幅值小于全部预设均衡调节曲线的所述预设幅度阈值中的最小预设幅度阈值,将最小预设幅度阈值对应的预设均衡调节曲线确定为目标均衡调节曲线;
若所述初始音频信号对应的幅值大于全部所述预设均衡调节曲线的预设幅度阈值中的最大预设幅度阈值,将最大预设幅度阈值对应的预设均衡调节曲线确定为目标均衡调节曲线;
否则,通过预设匹配规则确定所述初始音频信号对应的目标均衡调节曲线。
8.根据权利要求7所述的音频动态均衡方法,其特征在于,通过预设匹配规则确定所述初始音频信号对应的目标均衡调节曲线,包括:
若所述初始音频信号对应的幅值处于参考序列中任意两个相邻的预设幅度阈值范围内,利用所述两个相邻的预设幅度阈值对应的预设均衡调节曲线进行线性插值,得到所述初始音频信号对应的目标均衡调节曲线,其中,除了最小预设幅度阈值和最大预设幅度阈值外的剩余预设幅度阈值由小到大排列为所述参考序列。
9.一种电子设备,其特征在于,包括:处理器和存储有计算机程序的存储器,所述处理器被配置为在运行计算机程序时实现权利要求1-8中任一项所述的音频动态均衡方法。
10.一种存储介质,其上存储有计算机程序,其中,所述程序被处理器运行时实现如权利要求1-8中任一项所述的音频动态均衡方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310901051.0A CN117153174A (zh) | 2023-07-20 | 2023-07-20 | 音频动态均衡方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310901051.0A CN117153174A (zh) | 2023-07-20 | 2023-07-20 | 音频动态均衡方法、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117153174A true CN117153174A (zh) | 2023-12-01 |
Family
ID=88905073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310901051.0A Pending CN117153174A (zh) | 2023-07-20 | 2023-07-20 | 音频动态均衡方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117153174A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117896655A (zh) * | 2024-03-14 | 2024-04-16 | 深圳前海深蕾半导体有限公司 | 均衡分频器电路和终端设备 |
-
2023
- 2023-07-20 CN CN202310901051.0A patent/CN117153174A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117896655A (zh) * | 2024-03-14 | 2024-04-16 | 深圳前海深蕾半导体有限公司 | 均衡分频器电路和终端设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10299040B2 (en) | System for increasing perceived loudness of speakers | |
JP4262597B2 (ja) | サウンドシステム | |
JP5694324B2 (ja) | スピーカーの知覚されるラウドネスを増加させるためのシステム | |
Välimäki et al. | Accurate cascade graphic equalizer | |
US7092537B1 (en) | Digital self-adapting graphic equalizer and method | |
US8645144B2 (en) | Audio signal shaping for playback by audio devices | |
CN117153174A (zh) | 音频动态均衡方法、电子设备及存储介质 | |
JP2012516646A (ja) | 臨界バンドに分けられたインパルス応答データから逆フィルタを決定する方法 | |
CN101577848A (zh) | 一种重低音增强方法及系统 | |
CN107682802B (zh) | 音频设备音效的调试方法及装置 | |
EP2590324B1 (en) | Numeric audio signal equalization | |
CN108831497B (zh) | 一种回声压缩方法及装置、存储介质、电子设备 | |
EP3444946B1 (en) | Acoustic processing device and acoustic processing method | |
US9696962B1 (en) | Harmonic tracking equalizer | |
CN107251574B (zh) | 相位控制信号生成设备、相位控制信号生成方法及计算机可读介质 | |
CN112489669A (zh) | 一种音频信号处理方法、装置、设备和介质 | |
TWI769766B (zh) | 音頻處理裝置及音頻處理方法 | |
CN106559722A (zh) | 基于人耳听觉特性的音频重放系统均衡方法 | |
Zhao | Analysis of FIR filter and IIR filter for human speech signal different effects | |
CN116013331A (zh) | 一种低音增强方法、装置、电子设备及存储介质 | |
JP6903242B2 (ja) | 周波数帯域拡張装置、周波数帯域拡張方法、及び周波数帯域拡張プログラム | |
CN114974196A (zh) | 可动态控制降噪范围的降噪方法、装置、计算机设备及存储介质 | |
JP3683978B2 (ja) | 飽和信号処理装置 | |
CN117579975A (zh) | 频响调节方法、装置、设备及存储介质 | |
CN114143667A (zh) | 音量调节方法、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |