CN116778949A - 个性化响度补偿方法、装置、计算机设备和存储介质 - Google Patents
个性化响度补偿方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN116778949A CN116778949A CN202210240842.9A CN202210240842A CN116778949A CN 116778949 A CN116778949 A CN 116778949A CN 202210240842 A CN202210240842 A CN 202210240842A CN 116778949 A CN116778949 A CN 116778949A
- Authority
- CN
- China
- Prior art keywords
- loudness
- audio signal
- personalized
- filtering
- filter bank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000005236 sound signal Effects 0.000 claims abstract description 94
- 238000001914 filtration Methods 0.000 claims abstract description 63
- 238000012360 testing method Methods 0.000 claims description 59
- 238000012545 processing Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 8
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 208000016354 hearing loss disease Diseases 0.000 abstract description 10
- 206010011878 Deafness Diseases 0.000 abstract description 8
- 230000010370 hearing loss Effects 0.000 abstract description 8
- 231100000888 hearing loss Toxicity 0.000 abstract description 8
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 101100024036 Mus musculus Moxd2 gene Proteins 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 208000009205 Tinnitus Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000012074 hearing test Methods 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 231100000886 tinnitus Toxicity 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本发明涉及一种个性化响度补偿方法方法、装置、计算机设备和存储介质,该方法包括:获取待响度补偿的音频信号;确定双二阶滤波器组中的各滤波模型的参数,双二阶滤波器组中包括多个滤波模型;采用双二阶滤波器组根据参数对音频信号进行滤波,得到响度补偿后的音频信号。上述方法可以针对电视或者手机等采用扬声器播放音频信号的这类大众化的产品的听力损失受众的个性化音频增强。
Description
技术领域
本发明涉及音频输出技术领域,特别是涉及个性化响度补偿方法、装置、计算机设备和存储介质。
背景技术
随着年龄的增长,有些倾听者会有一定的听力损伤,主要表现为:对不同频段的声音信号的强度感知会有所下降,其中对于高频段的声音信号的强度感知下降的尤为严重,从而导致倾听者对声音整体平衡感知的下降,进而严重影响了对声音信号的清晰度感知,造成了对声音信号内容的理解能力降低。
为了解决上述问题,相关技术中,采用了对倾听者的听力曲线进行测量,然后根据所测得的听力曲线过对音频信号进行响度补偿,改善了类倾听者由于听力损伤造成的声音感知清晰度下降问题。目前对音频信号进行响度补偿主要是通过对多通道子带信号分别进行动态范围控制。另外,当前听力曲线测量方法是通过专业人员基于听力计设备通过耳机播放不同频率的正弦(单频)信号对受试者的听力水平进行测量。目前,这种方案主要是应用在助听计上。
然而,对于电视或者手机等采用扬声器播放音频信号的这类大众化的产品,采用上述方法是不实用的。一方面是由于声学重放场景导致的听音环境的差异,采用听力计设备通过耳机播放信号测得到的听力曲线不一定适合扬声器重放,而且听力曲线的测试过程过于繁琐,不易于推广;另一方面,采用子带动态范围控制方法对音频信号进行响度补偿,同时也对子带内的本底噪声进行了放大,当子带对应的增益过大时,易产生可听的本底噪声,此外,响度补偿效果越精确,那么需要分离的子带信号要求更多,随之而来的是信号处理资源需求的增多,并且子带的获取也会带来额外的信号处理延时,这也限制了该类技术的应用。
因此,需要一种针对采用扬声播放音频信号的个性化音频增强方案。
发明内容
本申请提供了一种个性化响度补偿方法、装置、计算机设备和存储介质。
第一方面提供了一种个性化响度补偿方法,包括:
获取待响度补偿的音频信号;
确定双二阶滤波器组中的各滤波模型的参数,所述双二阶滤波器组中包括多个滤波模型;
采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号。
在一些实施例中,所述确定双二阶滤波器组中的各滤波模型的参数,包括:
生成多个测试信号;
采用音频播放设备播放各所述测试信号;
确定各所述测试信号对应的闻阈值,所述闻阈值是当用户能听到所述测试信号时,所述测试信号的最小幅度增益;
根据多个所述闻阈值,得到所述用户的闻阈曲线;
采用所述双二阶滤波器组对所述闻阈曲线进行拟合,得到所述双二阶滤波器组的参数。
在一些实施例中,所述生成多个测试信号,包括:
获取各测试信号的中心频率;
采用1/3倍频程、等效矩形宽度标度或bark标度计算各所述测试信号的上截止频率和下截止频率;
生成所述上截止频率和所述下截止频率的窄带信号。
在一些实施例中,所述确定各所述测试信号对应的闻阈值,包括:
在所述音频播放器播放各所述测试信号时,调整所述测试信号的幅度增益;
确定用户人耳能听到预设音量范围的所述测试信号对应的幅度增益,以所述幅度增益为所述测试信号对应的闻阈值。
在一些实施例中,所述采用所述双二阶滤波器组对所述闻阈曲线进行拟合,得到所述双二阶滤波器组的参数,包括:
将多个所述测试信号对应的闻阈值按照所述测试信号的中心频率由小到大依次排序;
随机选择一个闻阈值在序列中的位置为参考位,其中所述参考位没有对应的滤波模型;
位于所述参考位置前的闻阈值对应的滤波模型为低搁IIR滤波模型,所述低搁IIR滤波模型的截止频率为所述闻阈值对应的测试信号的中心频率,所述低搁IIR滤波模型的增益为当前闻阈值减去相邻的下一个闻阈值的差值;
位于所述参考位置后的闻阈值对应的滤波模型为高搁IIR滤波模型,所述高搁IIR滤波模型的截止频率为所述闻阈值对应的测试信号的中心频率,所述高搁IIR滤波模型的增益为当前闻阈值减去相邻的上一个闻阈值的差值。
在一些实施例中,所述采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号,包括:
根据各所述滤波模型的参数,确定各所述滤波模型的传输函数;
多个所述滤波模型依次根据所述传输函数对所述音频信号进行滤波,得到响度补偿后的音频信号。
在一些实施例中,在采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号之后,还包括:
确定响度补偿后的所述音频信号的幅值是否大于预设阈值;
若存在,则对所述对响度补偿后的音频信号进行压缩处理。
第二方面提供了一种个性化响度补偿装置,包括:
获取单元,用于获取待响度补偿的音频信号;
参数单元,用于确定双二阶滤波器组中的各滤波模型的参数,所述双二阶滤波器组中包括多个滤波模型;
补偿单元,用于采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号。
第三方面提供了一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述所述个性化响度补偿方法的步骤。
第四方面提供了一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述所述个性化响度补偿方法的步骤。
上述个性化响度补偿方法、装置、计算机设备和存储介质,该响度补偿方法,首先获取待响度补偿的音频信号;然后确定双二阶滤波器组中的各滤波模型的参数,所述双二阶滤波器组中包括多个滤波模型;最后采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号。该补偿方法能够对电视或者手机等采用扬声器播放音频信号的这类大众化产品的听力损失受众进行个性化音频增强。
附图说明
图1为本申请实施例中个性化响度补偿方法所适用的系统框架示意图;
图2为本申请实施例中个性化响度补偿方法的一种流程图;
图3为本申请实施例中个性化响度补偿方法的另一个流程图;
图4为本申请实施例中个性化响度补偿方法的动态范围控制输入输出幅度映射关系图;
图5为本申请实施例中个性化响度补偿装置的结构框图;
图6的本申请实施例中电子设备的硬件运行环境的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。
本发明的主要解决方案是:获取待响度补偿的音频信号;确定双二阶滤波器组中的各滤波模型的参数,所述双二阶滤波器组中包括多个滤波模型;采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号。
本申请的响度补偿方案中,采用的系统框架具体可以参见图1所示,具体可以包括:后台服务器和与后台服务器建立通信连接的若干数量的音频播放设备。其中,音频播放设备包括但不限于平板电脑、笔记本电脑、智能手机、个人电脑(personal computer,PC)或者其他专业设备,此处不做限定。
如图1所示,在一个实施例中,提出了一种个性化响度补偿方法,具体可以包括以下步骤:
步骤201、获取待响度补偿的音频信号;
其中,待补偿的音频信号为原始音频信号,原始音频信号可以为输入的音频信号Xin(t),获取原始音频信号的当前播放音量参数,该当前播放音量参数也可以称为用于对原始音频信号进行音量控制的音量控制参数,可以用于表示原始音频信号的播放音量的大小,可以用Loud进行表示。其中,原始音频信号可以为低音频信号。
步骤202、确定双二阶滤波器组中的各滤波模型的参数,双二阶滤波器组中包括多个滤波模型;
可以理解的是,在信号处理中,数字双二阶滤波器是二阶的递归线性滤波器,包含两个极点和两个零点。这里将使用缩写“双二阶”(或“双二阶”)滤波器以表示数字双二阶滤波器。
在本实施例中,双二阶滤波器组滤波器能够对原始音频信号的主要特性进行补偿,为达到最佳补偿效果,需要根据每个用户的听力状况确定双二阶滤波器组的参数。
在一些实施例中,上述步骤202可以包括:
步骤2021、生成多个测试信号;
可以理解的是,由于听觉系统可以等效成一系列具有临界频带宽度(criticalbandwidth,CB)的带通滤波器组,因而可以利用具有临界频带宽度的带通信号作为TV或者手机等音频设备播放预设的窄带(测试)信号。
在一种应用场景中,上述步骤2021可以包括:
步骤2021a、获取各测试信号的中心频率;
原则上,人类所能听到的声音的频率位于20Hz~20kHz之间,低于20Hz的声音为次声波,高于20kHz的声音为超声波。在正常的可听声音的频率范围内,人类耳朵对不同频率的声音的接受存在不同的增益,有的声音能敏感的捕捉到,有的声音却听不清。例如,按照标准进行定义,一般认为数值在25dBHL以内为正常听力,26~40dBHL为轻度听力损失,41~60dBHL为中度听力损失,61~80dBHL为重度听力损失,大于80dBHL为极重度听力损失,这种分类的方法可以快速知道受试者的听力状态大概所处的水平,但往往不适合那些听力在正常分级范围内但存在隐性听力损伤或者伴有耳鸣的受试者,临床实践的数据显示,按照听力分级显示正常的受试者,进行精细化的听力测试后可能存在不同程度的听力切迹,听力切迹的最低点与最高点之差大于等于15dBHL即可认为出现听力损失,所以听力图中的最低点和最高点之差往往暗示着受试者是否已经存在听力损失,可以弥补单看平均阈值来判断听力正常与否的不足。
在该步骤中,设定用于测试的窄带信号的中心频率组(范围20Hz至20kHz),其中一种可选的是设置包含6个中心频率的频率组,6个中心频率分别为:250Hz、500Hz、1000Hz、2000Hz、4000Hz和8000Hz。这里不对中心频率组中的的中心频率的个数以及频率大小做限制。
步骤2021b、采用1/3倍频程、等效矩形宽度标度或bark标度计算各测试信号的上截止频率和下截止频率;
该步骤中,通过设定的中心频率按照1/3倍频程或者等效矩形宽度(ERB)标度或者bark标度计算各个中心频率fm(Hz)对应的窄带信号的上截止频率f1(Hz)和下截止频率f2(Hz)。
当采用1/3倍频程时,上截止频率f1和下截止频率f2可通过以下的关系求出:
f2=2^(0.5*1/3)*fm;f1=0.5^(0.5*1/3)*fm.
当采用ERB标度时,上截止频率f1和下截止频率f2可通过以下的关系求出:
erb=24.7*(4.37*fm/2000+1);
f1=(sqrt(erb*erb+4*fm*fm)-erb)/2;f2=fm*fm/f1;
当采用Bark标度时,上截止频率f1和下截止频率f2可通过以下的关系求出:
bark=25+75*((1+1.4*fm/2000*fm/2000).^0.69);
f1=(sqrt(bark*bark+4*fm*fm)-bark)/2;f2=fm*fm/f1;
步骤2021c、生成上截止频率和下截止频率的窄带(测试)信号。
步骤2022、采用音频播放器播放各测试信号;
该步骤中,可以通过TV或者手机的音频播放设备分别播放上述6段窄带信号。其中,各个窄带信号的上下截止频率生成对应的窄带信号。一种可选的生成方法是利用上下截止频率为f1和f2的余弦扫频信号作为窄带信号。故步骤2021a中的6个中心频率可以得到6个窄带信号。每段窄带信号时长为0.6s,采样频率可以设置为TV等播放设备默认的采样频率。并且每段窄带信号均做淡入淡出处理(淡入淡出的时长为50ms——200ms)。这里值得指出的是,为了改善测试者的测试体验,实际中播放的测试信号也可以是对应的窄带信号和静音信号的组合。
步骤2023、确定各测试信号对应的闻阈值,闻阈值是当用户能听到测试信号时,测试信号的最小幅度增益;
在一些实施例中,上述步骤2023可以包括:
步骤2023a、在音频播放设备播放各测试信号时,调整测试信号的幅度增益;
步骤2023b、确定用户人耳能听到预设音量范围(刚刚听到音频信号)的测试信号对应的幅度增益,以该幅度增益为测试信号对应的闻阈值。
在该实施例中,用户可以通过可交互设备(例如TV遥控器手机UI界面等)调整每段窄带信号的增益(dB),将用户能恰好能听见各个段窄带信号的最小增益值作为该CB("临界带宽critical bandwidth"简称CB,可用等效矩形带宽(ERB)等价)的中心频率的闻阈值。最终得到由6个增益值组成的用户个性化闻阈曲线。
可以理解的是,心理声学模型通常把人耳的听觉滤波器看做由有限的频率带组成,这些频率带的宽度称之为临界带宽CB,在同一子带内,一个纯音可以被以它为中心频率,且具有一定带宽的连续噪声所抑制,如果在这一频带内噪声功率等于该纯音功率,此时该纯音处于刚好能被听到的临界状态,即成为这一带宽为临界带宽。人耳对音频信号的分析以临界带宽为基础,类似一个非等宽的子带滤波器组,因此,心理声学模型需要将信号从频域映射到临界带宽。
步骤2024、根据多个闻阈值,得到用户的闻阈曲线;
其中,每个频率的测试信号对应一闻阈值,则该步骤通过6个闻阈值,得到用户的闻阈曲线。
步骤2025、采用双二阶滤波器组对闻阈曲线进行拟合,得到双二阶滤波器组的参数。
该步骤提供了一种简单的对闻阈曲线进行拟合的算方法。
在一些实施例中,上述步骤2025可以包括:
步骤2025a、将多个测试信号对应的闻阈值按照测试信号的中心频率由小到大依次排序;
其中,6段窄带信号(编号id=1,2,...,6)的中心频率分别为f1,f2,f3,f4,f5,f6,其对应的闻阈值分别为L1,L2,L3,L4,L5,L6。
步骤2025b、随机选择一个闻阈值在序列中的位置为参考位,其中参考位没有对应的滤波模型;
该步骤中,以选择编号为2(id=2)的中心频率对应的闻阈值为参考位。由于参考位没有对应的滤波模型,故本实施例的双二阶滤波器组包括5个滤波模型。
步骤2025c、位于参考位置前的闻阈值对应的滤波模型为低搁IIR滤波模型,低搁IIR滤波模型的截止频率为闻阈值对应的测试信号的中心频率,低搁IIR滤波模型的增益为当前闻阈值减去相邻的下一个闻阈值的差值;
步骤2025d、位于参考位置后的闻阈值对应的滤波模型为高搁IIR滤波模型,高搁IIR滤波模型的截止频率为闻阈值对应的测试信号的中心频率,高搁IIR滤波模型的增益为当前闻阈值减去相邻的上一个闻阈值的差值。
其中,双二阶滤波器组的参数为各滤波模型的截止频率和增益。其中,截至频率和为闻阈值对应的测试信号的中心频率。
该步骤中,根据参考位的选择确定滤波模型的类型,具体规则为:将闻阈值的编号和参考位编号对比,排在参考位之前的为低搁IIR滤波模型,排在参考位之后的为高搁IIR滤波模型;低搁IIR滤波模型的增益为当前闻阈值减去相邻的下一个闻阈值的差值;高搁IIR滤波模型的增益为当前闻阈值减去相邻的上一个闻阈值的差值。
实现伪代码如下:
for i=1;i<id_max;i++
If i<id_ref
由低搁IIR滤波模型生成双二阶滤波器参数,低搁IIR滤波模型截止频率为fc=fi,增益gain=Li-Li+1;
end
If i>id_ref
由高搁IIR滤波模型生成双二阶滤波器参数,高搁IIR滤波模型截止频率为fc=fi,增益gain=Li-Li-1;
end
end
当然,如果将多个测试信号对应的闻阈值按照测试信号的中心频率由大到小依次排序;上述低搁IIR滤波模型和高搁IIR滤波模型互为相反即可,增益的计算方式还是高搁IIR滤波模型对应当前闻阈值减去相邻的上一个闻阈值的差值,低搁IIR滤波模型的增益对应当前闻阈值减去相邻的下一个闻阈值的差值。
当然,该步骤还可以采用其他方式对闻阈曲线进行拟合,例如,采用最小均方法或者最小二乘法等拟合算法。
步骤203、采用双二阶滤波器组根据参数对音频信号进行滤波,得到响度补偿后的音频信号。
在一些实施例中,上述步骤203可以包括:
步骤2031、根据各滤波模型的参数,确定各滤波模型的传输函数;
采用双二阶高搁和低搁IIR滤波器组对个性化闻阈曲线进行拟合,得到个性化双二阶IIR滤波器组的参数。
在Z域中,双二阶滤波器的传输函数是两个二次函数的比率,双二阶IIR滤波器的传输函数可以表示为:
式中,a0,a1,a2,b0,b1,b2为滤波器的系数,其共同作用决定了滤波器的频率响应。只要确定了a0,a1,a2,b0,b1,b2,那么该双二阶IIR滤波器就确定了。
高搁滤波器和低搁滤波器由其滤波器截止频率fc和滤波器的增益gain决定。由高搁滤波器和低搁滤波器到双二阶滤波器的参数的转换可通过下面的方式进行转换,表中K=tan(pi*fc/fs),V0=10gain/20,fs为信号的采样频率:
步骤2032、多个滤波模型依次根据传输函数对音频信号进行滤波,得到响度补偿后的音频信号。
其中,原始音频信号是待播放的音频信号,其可以是预先录制的音频信号,还可以是实时通过麦克风录制的音频信号。
可以将原始音频信号输入IIR滤波器中得到响度补偿后的音频信号,该音频信号转换为模拟信号后驱动声音播放系统的扬声器播放声音。
对于经过上述个性化响度补偿处理的音频信号,由于在某些频段可能存在幅度拉升,为了使得扬声器播放的信号不出现截幅失真,需要对响度补偿后的信号做动态范围控制(DRC)。
在一些实施例中,如图3所示,上述步骤203之后,还可以包括:
步骤204、确定响度补偿后的音频信号幅值是否大于预设阈值;
该步骤中,确定音频信号幅值是否大于预设阈值的方法可以是:预设音频信号的幅值阈限T,当音频输入信号小于或等于DRC处理预设的阈限T时,不存在幅值大于预设阈值;当音频输入信号大于T时,存在幅值大于预设阈值。
步骤205、若存在,则对响度补偿后的音频信号进行压缩处理。
该步骤中,当音频输入信号小于或等于DRC处理预设的阈限T时,输出信号幅度和输入信号的幅度相同;
当音频输入信号大于T时,对输入信号做压缩处理,如图4所示,输入和输出信号的幅度按照下面的线性映射公式得到:
式中,R为信号的压缩比:即当设定的信号输入幅度(对数阈)高于T时,信号输入幅度和输出幅度的比值。
其中,DRC处理的具体实现可以参考如下:
假设输入信号为假设n时刻的输入信号x(n),计算输入信号的对数阈的幅度xG(n)=20*log10(x(n))
根据公式线性映射公式计算yG;
计算xL(n)=xG(n)-yG(n);
利用设定的At(Attract Time)和Rt(Release Time)对输出信号做平滑,得到
其中(n-1)代表的是n时刻的前一时刻,yL的初始值为0.
得到最终的输出信号:
如图5所示,在一个实施例中,提供了一种个性化响度补偿装置,具体可以包括:
获取单元511,用于获取待响度补偿的音频信号;
参数单元512,用于确定双二阶滤波器组中的各滤波模型的参数,双二阶滤波器组中包括多个滤波模型;
补偿单元513,用于采用双二阶滤波器组根据参数对音频信号进行滤波,得到响度补偿后的音频信号。
在一个实施例中,提出了一种计算机设备硬件运行环境的结构示意图如图6所示。该计算机设备可以包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、存储器和网络接口。其中,该计算机设备的非易失性存储介质存储有操作系统、知识库和计算机可读指令,知识库中可存储有控件信息序列,该计算机可读指令被处理器执行时,可使得处理器实现一种个性化响度补偿方法。该计算机设备的处理器用于提供计算和控制能力,支撑整个计算机设备的运行。该计算机设备的存储器中可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种个性化响度补偿方法。该计算机设备的网络接口用于与终端连接通信。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
处理器执行计算机程序时实现以下步骤:获取待响度补偿的音频信号;确定双二阶滤波器组中的各滤波模型的参数,双二阶滤波器组中包括多个滤波模型;采用双二阶滤波器组根据参数对音频信号进行滤波,得到响度补偿后的音频信号。
在一些实施例中,得到响度补偿后的音频信号之后,处理器执行计算机程序时还实现以下步骤:确定响度补偿后的音频信号幅值是否大于预设阈值;若存在,则对对响度补偿后的音频信号进行压缩处理。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:获取待响度补偿的音频信号;确定双二阶滤波器组中的各滤波模型的参数,双二阶滤波器组中包括多个滤波模型;采用双二阶滤波器组根据参数对音频信号进行滤波,得到响度补偿后的音频信号。
在一些实施例中,得到响度补偿后的音频信号之后,该计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器还执行以下步骤:确定响度补偿后的音频信号幅值是否大于预设阈值;若存在,则对对响度补偿后的音频信号进行压缩处理。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种个性化响度补偿方法,其特征在于,包括:
获取待响度补偿的音频信号;
确定双二阶滤波器组中的各滤波模型的参数,所述双二阶滤波器组中包括多个滤波模型;
采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号。
2.根据权利要求1所述的个性化响度补偿方法,其特征在于,所述确定双二阶滤波器组中的各滤波模型的参数,包括:
生成多个测试信号;
采用音频播放器播放各所述测试信号;
确定各所述测试信号对应的闻阈值,所述闻阈值是当用户能听到所述测试信号时,所述测试信号的最小幅度增益;
根据多个所述闻阈值,得到所述用户的闻阈曲线;
采用所述双二阶滤波器组对所述闻阈曲线进行拟合,得到所述双二阶滤波器组的参数。
3.根据权利要求2所述的个性化响度补偿方法,其特征在于,所述生成多个测试信号,包括:
获取各测试信号的中心频率;
采用1/3倍频程、等效矩形宽度标度或bark标度计算各所述测试信号的上截止频率和下截止频率;
生成所述上截止频率和所述下截止频率的窄带信号。
4.根据权利要求2所述的个性化响度补偿方法,其特征在于,所述确定各所述测试信号对应的闻阈值,包括:
在所述音频播放设备播放各所述测试信号时,调整所述测试信号的幅度增益;
确定用户人耳能听到预设音量范围的所述测试信号对应的幅度增益,以所述幅度增益为所述测试信号对应的闻阈值。
5.根据权利要求2所述的个性化响度补偿方法,其特征在于,所述采用所述双二阶滤波器组对所述闻阈曲线进行拟合,得到所述双二阶滤波器组的参数,包括:
将多个所述测试信号对应的闻阈值按照所述测试信号的中心频率由小到大依次排序;
随机选择一个闻阈值在序列中的位置为参考位,其中所述参考位没有对应的滤波模型;
位于所述参考位置前的闻阈值对应的滤波模型为低搁IIR滤波模型,所述低搁IIR滤波模型的截止频率为所述闻阈值对应的测试信号的中心频率,所述低搁IIR滤波模型的增益为当前闻阈值减去相邻的下一个闻阈值的差值;
位于所述参考位置后的闻阈值对应的滤波模型为高搁IIR滤波模型,所述高搁IIR滤波模型的截止频率为所述闻阈值对应的测试信号的中心频率,所述高搁IIR滤波模型的增益为当前闻阈值减去相邻的上一个闻阈值的差值。
6.根据权利要求1所述的个性化响度补偿方法,其特征在于,所述采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号,包括:
根据各所述滤波模型的参数,确定各所述滤波模型的传输函数;
多个所述滤波模型依次根据所述传输函数对所述音频信号进行滤波,得到响度补偿后的音频信号。
7.根据权利要求1所述的个性化响度补偿方法,其特征在于,在采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号之后,还包括:
确定响度补偿后的所述音频信号幅值是否大于预设阈值;
若存在,则对所述对响度补偿后的音频信号进行压缩处理。
8.一种个性化响度补偿装置,其特征在于,包括:
获取单元,用于获取待响度补偿的音频信号;
参数单元,用于确定双二阶滤波器组中的各滤波模型的参数,所述双二阶滤波器组中包括多个滤波模型;
补偿单元,用于采用所述双二阶滤波器组根据所述参数对所述音频信号进行滤波,得到响度补偿后的音频信号。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项权利要求所述个性化响度补偿方法的步骤。
10.一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项权利要求所述个性化响度补偿方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210240842.9A CN116778949A (zh) | 2022-03-10 | 2022-03-10 | 个性化响度补偿方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210240842.9A CN116778949A (zh) | 2022-03-10 | 2022-03-10 | 个性化响度补偿方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116778949A true CN116778949A (zh) | 2023-09-19 |
Family
ID=87990187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210240842.9A Pending CN116778949A (zh) | 2022-03-10 | 2022-03-10 | 个性化响度补偿方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116778949A (zh) |
-
2022
- 2022-03-10 CN CN202210240842.9A patent/CN116778949A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9943253B2 (en) | System and method for improved audio perception | |
US9305568B2 (en) | Active acoustic filter with socially determined location-based filter characteristics | |
US9557960B2 (en) | Active acoustic filter with automatic selection of filter parameters based on ambient sound | |
EP2920880B1 (en) | Audio loudness control system | |
TWI535299B (zh) | 低音強化系統及其方法 | |
JP5149991B2 (ja) | 音声再生装置、音声再生方法及びプログラム | |
KR100636213B1 (ko) | 실시간 주파수 특성 보정 방법 및 그를 적용한 사운드재생 장치 | |
US9431982B1 (en) | Loudness learning and balancing system | |
US8712067B2 (en) | System and method of improving audio signals for the hearing impaired | |
CN111970628B (zh) | 音频信号的增强方法、装置、存储介质和处理器 | |
JP2008527882A (ja) | 音声信号の音響レベルを周波数に依存して増幅する信号処理装置及び音声システム及びその方法 | |
JP2009296298A (ja) | 音声信号処理装置および方法 | |
CN110840462A (zh) | 基于耳机的人耳助听方法、计算机可读存储介质、蓝牙耳机 | |
CN115314823A (zh) | 一种基于数字发声芯片的助听方法、系统及设备 | |
US20210384879A1 (en) | Acoustic signal processing device, acoustic signal processing method, and non-transitory computer-readable recording medium therefor | |
JP2023551222A (ja) | オーディオ信号の正規化を行う方法及びそのための装置 | |
CN116778949A (zh) | 个性化响度补偿方法、装置、计算机设备和存储介质 | |
JP7028613B2 (ja) | オーディオプロセッサおよびオーディオ再生装置 | |
JP2010068175A (ja) | 音響調整装置及びそれを用いた音響装置 | |
CN112673648B (zh) | 处理装置、处理方法、再现方法以及存储介质 | |
Lee et al. | Sound customizing system for high-quality TV sound based on hearing threshold measurement | |
PL225391B1 (pl) | Układ do poprawy jakości dźwięku cyfrowych urządzeń elektronicznych |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |