WO2023044608A1 - 音频调节方法、装置、设备及存储介质 - Google Patents

音频调节方法、装置、设备及存储介质 Download PDF

Info

Publication number
WO2023044608A1
WO2023044608A1 PCT/CN2021/119641 CN2021119641W WO2023044608A1 WO 2023044608 A1 WO2023044608 A1 WO 2023044608A1 CN 2021119641 W CN2021119641 W CN 2021119641W WO 2023044608 A1 WO2023044608 A1 WO 2023044608A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound effect
audio
frequency point
characteristic curve
abnormal
Prior art date
Application number
PCT/CN2021/119641
Other languages
English (en)
French (fr)
Inventor
梁静娴
沈艳
李中茹
Original Assignee
京东方科技集团股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 京东方科技集团股份有限公司 filed Critical 京东方科技集团股份有限公司
Priority to PCT/CN2021/119641 priority Critical patent/WO2023044608A1/zh
Priority to CN202180002617.5A priority patent/CN116157860A/zh
Publication of WO2023044608A1 publication Critical patent/WO2023044608A1/zh

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G5/00Tone control or bandwidth control in amplifiers
    • H03G5/16Automatic control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

本公开提供了一种音频调节方法、装置、设备及存储介质,用于调节音频信号,提高音效输出效果。所述方法包括:获取待调节的音频信号;获取所述待调节的音频信号的实际音效特征曲线,其中,所述实际音效特征曲线为所述待调节的音频信号的音效参数的实际值与各频点的关系曲线,所述音效参数包括用于表征音频信号频响特性的电平值;至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合;获取所述异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个所述音频补偿值对所述实际音效特征曲线进行调节,得到调节后的音效特征曲线;基于所述调节后的音效特征曲线输出调节后的音频信号。

Description

音频调节方法、装置、设备及存储介质 技术领域
本公开涉及控制领域,具体涉及一种音频调节方法、装置、设备及存储介质。
背景技术
高端显示终端除了在显示效果上具有高分辨率的突出优点外,在音效上也需要体现品质,但限于上述显示终端的产品尺寸,其采用的音响体积有限,造成音响效果不全面,在部分乐曲上的表现力不佳。
用户使用过程中,如果能通过显示终端自身的补偿手段,使音效达到最优,将会带来更好的用户体验。
发明内容
本公开实施例提供一种音频调节方法、音频调节装置、音频调节设备及计算机可读存储介质,用于调节音频信号,提高音效输出效果。
为了实现上述目的,本公开提供一种音频调节方法,包括:
获取待调节的音频信号;
获取所述待调节的音频信号的实际音效特征曲线,其中,所述实际音效特征曲线为所述待调节的音频信号的音效参数的实际值与各频点的关系曲线,所述音效参数包括用于表征音频信号频响特性的电平值;
至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合;
获取所述异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个所述音频补偿值对所述实际音效特征曲线进行调节,得到调节后的音效特征曲线;
基于所述调节后的音效特征曲线输出调节后的音频信号。
可选地,所述方法还包括:
获取所述待调节的音频信号的音频属性,并根据所述音频属性,确定所述待调节的音频信号的音频类型;
获取目标音频类型所对应的目标音效特征曲线,所述目标音效特征曲线为所述音效参数的目标值与各频点的关系曲线;
所述至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合,包括:
针对所述实际音效特征曲线所对应的每个频点,分别进行以下步骤:
根据所述目标音效特征曲线和所述实际音效特征曲线,确定所述频点所对应的音效参数的实际值与目标值之差;
当所述频点所对应的音效参数的实际值与目标值之差大于预设差值阈值时,将所述频点确定为所述异常频点集合中的一个异常频点。
可选地,所述获取所述异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个所述音频补偿值对所述实际音效特征曲线进行调节,得到调节后的音效特征曲线,包括:
以预先设置的参考音频补偿值,对所述异常频点集合中的每个异常频点分别进行音效参数补偿,得到每个异常频点所对应的音效参数的更新值;
针对补偿音频后的每个异常频点,计算所述音效参数的更新值与所述目标值之间的第一差值;
当所述第一差值不大于所述预设差值阈值时,将所述音效参数的实际值更新为所述更新值,并将所述异常频点剔除出所述异常频点集合;
根据剩余的异常频点,更新所述异常频点集合;
返回所述以预先设置的参考音频补偿值对所述异常频点集合中的每个异常频点分别进行音效参数补偿,直到所述异常频点集合中每个频点上的所述音效参数的更新值与目标值之间的第一差值均在所述预设差值阈值内。
可选地,所述根据所述音频属性,确定所述待调节的音频信号的音频 类型,包括:
根据所述音频属性确定所述待调节的音频信号中的人声时长;
将所述待调节的音频信号的播放时长与所述人声时长之差,确定为音乐时长;
根据第一比例、第二比例和第一预设比例之间的关系,确定所述音频信号的音频类型为第一类型或第二类型;其中,所述第一比例为所述人声时长与所述播放时长之比,所述第二比例为所述音乐时长与所述播放时长之比。
可选地,所述第一类型至少包括第一子类型、第二子类型和第三子类型,
在所述根据第一比例、第二比例和第一预设比例之间的关系,确定所述音频信号的音频类型为第一类型或第二类型之后,所述方法还包括:
在确定所述音频信号的类型为第一类型的情况下,分别确定所述音频信号中高频信号所占的第三比例、中频信号所占的第四比例以及低频信号所占的第五比例;
根据所述第三比例、所述第四比例、所述第五比例以及第二预设比例之间的关系,确定所述音频类型为所述第一子类型、所述第二子类型和所述第三子类型中的一个。
可选地,所述至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合,包括:
判断所述实际音效特征曲线中是否存在异常波段,所述异常波段包括波峰或波谷;
当存在所述异常波段时,将所述异常波段对应的各频点确定为异常频点。
可选地,所述方法还包括:存储所述调节后的音效特征曲线。
本公开还提供一种音频调节装置,其中,所述装置包括:
第一获取模块,配置为获取待调节的音频信号;
第二获取模块,配置为获取所述待调节的音频信号的实际音效特征曲线,其中,所述实际音效特征曲线为所述待调节的音频信号的音效参数的实际值与各频点的关系曲线,所述音效参数包括用于表征音频信号频响特性的电平值;
确定模块,配置为至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合;
调节模块,配置为获取所述异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个所述音频补偿值对所述实际音效特征曲线进行调节,得到调节后的音效特征曲线;
输出模块,配置为基于所述调节后的音效特征曲线输出调节后的音频信号。
本公开还提供一种音频调节设备,其中,所述设备包括:处理器,以及存储有计算机程序指令的存储器;所述处理器读取并执行所述计算机程序指令,以实现本公开实施例提供的音频调节方法。
本公开还提供一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现本公开实施例提供的音频调节方法。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1为本公开实施例提供的一种音频调节方法的流程示意图;
图2为本公开实施例提供的另一音频调节方法的流程示意图;
图3为本公开实施例提供的一种音频调节装置的结构示意图;
图4为本公开实施例提供的一种音频调节设备的结构示意图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
除非另作定义,本公开实施例使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
高端显示终端由于采用的音响体积有限,造成音响效果不全面,在部分乐曲上的表现力不佳。如果能通过音效补偿使音效达到最佳效果,将会给高端显示终端带来更好的用户体验。
现有技术中,通常是用户自行调节音效参数,以实现音效补偿,但这种人工调节方式无法快速将音效调节到最佳模式,需要反复调节才能输出较完美的音效,同时,人工调节音效参数可能暴露终端音频设备的瑕疵。
鉴于上述问题,本公开实施例提供一种音频调节方法,包括:
S101,获取待调节的音频信号。
在一些实施例中,可以通过多路音频采集设备采集音频信号,采集 时长可以在采集之前预先设置;也可以间隔预设时间采集一段音频信号,所采集的音频信号包括间隔的预设时段内的音频信号,本公开对此均不作限定。
S102,获取待调节的音频信号的实际音效特征曲线,其中,实际音效特征曲线为待调节的音频信号的音效参数的实际值与各频点的关系曲线,音效参数包括用于表征音频信号频响特性的电平值。
需要说明的是,通常情况下音效特征曲线可以是频响曲线。在一个示例中,在对音频信号的采集过程中,使信号发生器的输出信号频率发生连续变化,并保持幅度不变,在输出端通过示波器将放大器对于这种连续变化相应的输出电平记录下来,进而可以在一个坐标系上面描绘出电平对应频率的曲线,该曲线的横坐标为频率(Hz或KHz),纵坐标为电平(dB)。
S103,至少根据实际音效特征曲线,确定实际音效特征曲线中的异常频点集合。
异常频点集合中可以包括一个或多个异常频点,异常频点是指:与其余频点的音效参数存在较大差异的频点,例如,在实际音效特征曲线上,某一位置出现明显的尖峰,则该位置所对应的频点为异常频点。上述异常频点集合的具体确定方法将在下面实施例中作详细说明,此处不再赘述。
S104,获取异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个音频补偿值对实际音效特征曲线进行调节,得到调节后的音效特征曲线。
S105,所述调节后的音效特征曲线输出调节后的音频信号。
本公开实施例提供的音频调节方法,首先获取到待调节的音频信号,并获取其实际音效特征曲线,然后至少根据该曲线确定其中的异常频点集合,最后基于音频补偿值对异常频点集合中的每个异常频点进行调节, 得到调节后的音效特征曲线。上述音频调节方法,对于显示终端输出的音效不佳的场景,减少了人工修改音频参数的步骤,提升了参数调节的效率,提高了音频输出品质。
可选的,本公开实施例提供的音频调节方法还包括:
获取待调节的音频信号的音频属性,并根据音频属性,确定待调节的音频信号的音频类型;获取目标音频类型所对应的目标音效特征曲线,目标音效特征曲线为音效参数的目标值与各频点的关系曲线。
上述S103中,至少根据实际音效特征曲线,确定实际音效特征曲线中的异常频点集合,包括:针对实际音效特征曲线所对应的每个频点,分别进行以下步骤A1、A2:
步骤A1,根据目标音效特征曲线和实际音效特征曲线,确定频点所对应的音效参数的实际值与目标值之差。
步骤A2,当频点所对应的音效参数的实际值与目标值之差大于预设差值阈值时,将频点确定为异常频点集合中的一个异常频点。
在一些实施例中,目标音效特征曲线是根据基于实验室环境预先生成的最优音效参数确定的,上述最优音效参数是指调节到最优播放状态时所使用的参数。同时,不同音频类型下,均对应有该类型的目标音效特征曲线。每种音频类型对应的目标音效特征曲线可以预先存储在缓存模块中。
需要说明的是,上述预设差值阈值可以设置为3dB,也可以是本领域技术人员根据经验值设置的其他数值,本公开对此不作限定。
在一个示例中,以目标音效特征曲线为基准,将实际音效特征曲线中与其误差大于[-3dB,+3dB]的频点,均作为异常频点,对上述异常频点进行记录,以形成异常频点集合。
上述S104中,获取异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个音频补偿值对实际音效特征曲线进行调节,得到调 节后的音效特征曲线,包括以下步骤B1-B5:
步骤B1,以预先设置的参考音频补偿值,对异常频点集合中的每个异常频点分别进行音效参数补偿,得到每个异常频点所对应的音效参数的更新值。
步骤B2,针对补偿音频后的每个异常频点,计算音效参数的更新值与目标值之间的第一差值。
步骤B3,当第一差值不大于预设差值阈值时,将音效参数的实际值更新为更新值,并将异常频点剔除出异常频点集合。
步骤B4,根据剩余的异常频点,更新异常频点集合。
步骤B5,返回以预先设置的参考音频补偿值对异常频点集合中的每个异常频点分别进行音效参数补偿,直到异常频点集合中每个频点上的音效参数的更新值与目标值之间的第一差值均不大于预设差值阈值。
在上述对实际音效特征曲线中异常频点进行音效参数补偿的过程中,由于多个异常频点的实际值与目标值之差不一定相同,因此预先设置步进补偿单位,以参考音频补偿值对异常频点集合中的每个异常频点分别进行音效参数补偿,修改该频点上的音效参数,以使差值较小的异常频点先完成补偿,在多次循环补偿的过程中,逐渐完成对异常频点集合中所有频点的音频参数补偿。
需要说明的是,上述参考音频补偿值可以是本领域技术人员依据经验值预设的最小步进补偿单位,例如0.1dB,也可以是其他经验值,本公开实施例对此不作限定。
本公开实施例提供的音频调节方法,通过上述以步进补偿单位,逐渐完成所有异常频点进行音效参数补偿,可以有效消除终端播放音频时出现的爆音、失真等现象。在音频设备表现力不佳的情况下,及时修正音效,给用户提供更好的音效体验。
在一些实施例中,根据音频属性,确定待调节的音频信号的音频类 型,包括:
根据音频属性确定待调节的音频信号中的人声时长;将待调节的音频信号的播放时长与人声时长之差,确定为音乐时长;根据第一比例、第二比例和第一预设比例之间的关系,确定音频信号的音频类型为第一类型或第二类型;其中,第一比例为人声时长与播放时长之比,第二比例为音乐时长与播放时长之比。
其中,音频属性可以是频率分布、幅度变化等。
在一个示例中,根据音频属性确定待调节的音频信号中的人声时长T1,并将待调节音频信号的播放时长T0与人声时长T1之差,确定为音乐时长T2;计算人声时长与播放时长之比,即第一比例K1=T1/T0,计算音乐时长与播放时长之比,即第二比例K2=T2/T0,并设置第一预设比例K0。
如下表1所示,当人声时长比例、音乐时长比例均高于第一预设比例时,即K1>K0且K2>K0的情况下,如果人声时长T1<音乐时长T2(或者人声时长比例K1<音乐时长比例K2),说明当前播放的音频是以音乐为主,则判定音频信号的音频类型为第一类型,例如音乐(流行、古典、舞曲等);如果人声时长T1>音乐时长T2(或者人声时长比例K1>音乐时长比例K2),说明当前播放的音频以人声为主,则判定音频信号的音频类型为第二类型,例如电影、演讲、表演等。
当人声时长比例高于第一预设比例,即K1>K0,音乐时长比例低于第一预设比例,即K2<K0的情况下,则判定音频信号的音频类型为第二类型,例如电影(演讲、表演等)。
当音乐时长比例高于第一预设比例,即K2>K0,人声时长比例低于第一预设比例,即K1<K0的情况下,则判定音频信号的音频类型为第一类型,例如音乐(流行、古典、舞曲等)。
当音乐时长比例高于第一预设比例,即K2<K0,人声时长比例低于 第一预设比例,即K1<K0的情况下,则认为当前音频无效。
表1音频类型判断规则
人声比例 音乐比例 人声/音乐 判断结果
K 1>K 0 K 2>K 0 K 1>K 2 人声
K 1>K 0 K 2>K 0 K 1<K 2 音乐
K 1>K 0 K 2<K 0 / 人声
K 1<K 0 K 2>K 0 / 音乐
K 1<K 0 K 2<K 0 / 无效
在一些实施例中,第一类型至少包括第一子类型、第二子类型和第三子类型,在根据第一比例、第二比例和第一预设比例之间的关系,确定音频信号的音频类型为第一类型或第二类型之后,方法还包括:
在确定音频信号的类型为第一类型的情况下,分别确定音频信号中高频信号所占的第三比例、中频信号所占的第四比例以及低频信号所占的第五比例;根据第三比例、第四比例、第五比例以及第二预设比例之间的关系,确定音频类型为第一子类型、第二子类型和第三子类型中的一个。
在一个实施例中,在确定音频类型为第一类型的情况下,还需要通过计算音频主要集中的频段,进一步细分待调节的音频信号所属音频类型。
在一个示例中,计算高频信号的分布比例f1、中频信号的分布比例f2以及低频信号的分布比例f3,并且预先设置第二预设比例f0。
如表2所示,如果高中低频信号较为丰富,各频段相对比较均衡,即30%<f1<40%、30%<f2<40%、30%<f3<40%,则判定上述待调节的音频信号为流行音乐。
如果中频信号的分布比例大于第二预设比例即f2>f0,并且低频信号与高频信号较少,即f2>(f0+f1),说明频谱主要集中在中频段,则判定上述待调节的音频信号为古典音乐。
如果低频、高频信号较多,即f1>40%,f3>40%,则判定上述待调 节的音频信号为舞曲。
表2音乐子类型判断规则
Figure PCTCN2021119641-appb-000001
上述待调节的音频信号的音频类型的判断过程中,第一预设比例、第二预设比例、以及判断规则均为本领域技术人员依据经验参数进行设定的,本公开对此均不作限定。
在上述实施例中,是通过实际音效特征曲线和目标音效特征曲线进行对比,来确定异常频点集合的,当然,在其他实施例中,还可以通过其他方式来确定异常频点集合。例如,在一些实施例中,至少根据实际音效特征曲线,确定实际音效特征曲线中的异常频点集合,包括:
判断实际音效特征曲线中是否存在异常波段,异常波段包括波峰或波谷;当存在异常波段时,将异常波段对应的各频点确定为异常频点。
在一个示例中,检测实际音效特征曲线中每相邻第一频段之间的音效参数实际值的均值差值,第一频段中包括预设数量个频率点;在音效参数实际值的均值差值大于预设均值差值的情况下,将相邻第一频段中后一频段的各频点确定为异常频点集合中的至少一个频点。
例如,将每三个频点设置为一个频段,确定每一频段中多个频点的音效参数实际值的均值,检测相邻频段的均值之差,在上述均值之差大于预设均值差值的情况下,将后一频段中的三个频点确定为异常频点。
在一些实施例中,本公开实施例提供的音频调节方法还包括:存储调节后的音效特征曲线。
本公开实施例提供的音频调节方法,在对待调节的音效特征曲线调节完毕后,可以选择将调节后的音效特征曲线,存储至预设存储地址, 以便于下次直接调用其对应的音频参数。
需要说明的是,上述用于存储调节后的音效特征曲线的预设存储地址,与不同音频类型的目标音效特征曲线的存储地址,可以是同一存储地址,也可以是不同存储地址,本公开对此不作限定。
下面结合附图,以具体实施例对本公开提供的音频调节方法作详细说明。
如图2所示,S201,获取待调节的音频信号,并根据上述待调节的音频信号确定实际音效特征曲线。
S202,根据上述待调节的音频信号,确定其对应的音频类型。
在一些实施例中,根据音频属性,确定待调节的音频信号的音频类型,包括以下步骤C1-C3:
步骤C1,根据音频属性确定待调节的音频信号中的人声时长。
步骤C2,将待调节的音频信号的播放时长与人声时长之差,确定为音乐时长。
步骤C3,根据第一比例、第二比例和第一预设比例之间的关系,确定音频信号的音频类型为第一类型或第二类型;其中,第一比例为人声时长与播放时长之比,第二比例为音乐时长与播放时长之比。
其中,音频属性可以是频率分布、幅度变化等。
在一个示例中,根据音频属性确定待调节的音频信号中的人声时长T1,并将待调节音频信号的播放时长T0与人声时长T1之差,确定为音乐时长T2;计算人声时长与播放时长之比,即第一比例K1=T1/T0,计算音乐时长与播放时长之比,即第二比例K2=T2/T0,并设置第一预设比例K0。
如下表1所示,当人声时长比例、音乐时长比例均高于第一预设比例时,即K1>K0且K2>K0,如果人声时长T1<音乐时长T2,说明当前播放的音频是以音乐为主,则判定音频信号的音频类型为第一类型,例 如音乐(流行、古典、舞曲等);如果人声时长T1>音乐时长T2,说明当前播放的音频以人声为主,则判定音频信号的音频类型为第二类型,例如电影(演讲、表演等)。
当人声时长比例高于第一预设比例,即K1>K0,音乐时长比例低于第一预设比例,即K2<K0,则判定音频信号的音频类型为第二类型,例如电影(演讲、表演等)。
当音乐时长比例高于第一预设比例,即K2>K0,人声时长比例低于第一预设比例,即K1<K0,则判定音频信号的音频类型为第一类型,例如音乐(流行、古典、舞曲等)。
当音乐时长比例高于第一预设比例,即K2<K0,人声时长比例低于第一预设比例,即K1<K0,则认为当前音频无效。
表1音频类型判断规则
人声比例 音乐比例 人声/音乐 判断结果
K 1>K 0 K 2>K 0 K 1>K 2 人声
K 1>K 0 K 2>K 0 K 1<K 2 音乐
K 1>K 0 K 2<K 0 / 人声
K 1<K 0 K 2>K 0 / 音乐
K 1<K 0 K 2<K 0 / 无效
在一些实施例中,第一类型至少包括第一子类型、第二子类型和第三子类型,在根据第一比例、第二比例和第一预设比例之间的关系,确定音频信号的音频类型为第一类型或第二类型之后,方法还包括:
在确定音频信号的类型为第一类型的情况下,分别确定音频信号中高频信号所占的第三比例、中频信号所占的第四比例以及低频信号所占的第五比例;根据第三比例、第四比例、第五比例以及第二预设比例之间的关系,确定音频类型为第一子类型、第二子类型和第三子类型中的一个。
在一个实施例中,在确定音频类型为第一类型的情况下,还需要通过计算音频主要集中的频段,进一步细分待调节的音频信号所属音频类 型。
在一个示例中,计算高频信号的分布比例f1、中频信号的分布比例f2以及低频信号的分布比例f3,并且预先设置第二预设比例f0。
如表2所示,如果高中低频信号较为丰富,各频段相对比较均衡,即30%<f1<40%、30%<f2<40%、30%<f3<40%,则判定上述待调节的音频信号为流行音乐。如果中频信号的分布比例大于第二预设比例即f2>f0,并且低频信号与高频信号较少,即f2>(f0+f1),说明频谱主要集中在中频段,则判定上述待调节的音频信号为古典音乐。如果低频、高频信号较多,即f1>40%,f3>40%,则判定上述待调节的音频信号为舞曲。
表2音乐子类型判断规则
Figure PCTCN2021119641-appb-000002
上述待调节的音频信号的音频类型的判断过程中,第一预设比例、第二预设比例、以及判断规则中均为本领域技术人员依据经验参数进行设定的,本公开对此均不作限定。
S203,获取上述音频类型对应的目标音效特征曲线。
在一些实施例中,目标音效特征曲线是根据基于实验室环境预先生成的最优音效参数确定的,上述最优音效参数是指调节到最优播放状态时所使用的参数。同时,不同音乐类型下,均对应有该类型的目标音效特征曲线。
S204,根据实际音效特征曲线和目标音效特征曲线,确定异常频点集合。
在一些实施例中,确定异常频点集合可以包括:针对实际音效特征 曲线所对应的每个频点,分别进行以下步骤:
根据目标音效特征曲线和实际音效特征曲线,确定频点所对应的音效参数的实际值与目标值之差;当频点所对应的音效参数的实际值与目标值之差大于预设差值阈值时,将频点确定为异常频点集合中的一个异常频点。
在一些实施例中,确定异常频点集合还可以包括:
判断实际音效特征曲线中是否存在异常波段,异常波段包括波峰或波谷;当存在异常波段时,将异常波段对应的各频点确定为异常频点。
在一个示例中,检测实际音效特征曲线中每相邻第一频段之间的音效参数实际值的均值差值,第一频段中包括预设数量个频率点;在音效参数实际值的均值差值大于预设均值差值的情况下,将相邻第一频段中的后一频段确定为异常频点集合中的至少一个频点。
S205,针对异常频点集合中的每一频点,确定其音效补偿值,并将上述音效补偿值设置到实际音效特征曲线的音效参数中。
在一些实施例中,相同频点下,将目标音效特征曲线中的电平值和实际音效特征曲线中的电平值之差,作为音效补偿值。
S206,判断实际音效特征曲线是否调节至预设要求,即判断异常频点集合中,所有频点的音效参数实际值是否与目标值之差不大于预设差值阈值。若是,则执行S212,否则执行S207。
S207,以预先设置的参考音频补偿值对异常频点集合中的每个异常频点分别进行音效参数补偿,得到每个异常频点所对应的音效参数的更新值。
S208,针对补偿音频后的每个异常频点,计算音效参数的更新值与所述目标值之间的第一差值。
S209,针对第一差值不大于预设差值阈值的至少一个异常频点,将其音效参数的实际值更新为上述更新值。
S210,将上述第一差值不大于预设差值阈值的至少一个异常频点,剔除出异常频点集合,并根据剩余的异常频点,更新异常频点集合。
S211,判断更新后的异常频点集合中是否还存在异常频点,若是,返回S207,否则,执行S212。
S212,将每个频点的音效参数的更新值与目标值之间的差值,均不大于预设差值阈值的实际音效特征曲线,确定为调节后的音效特征曲线。
如图3所示,本公开实施例还提供一种音频调节装置,包括:第一获取模块301、第二获取模块302、确定模块303、调节模块304和输出模块305。
第一获取模块301配置为获取待调节的音频信号。第二获取模块302配置为获取待调节的音频信号的实际音效特征曲线,其中,实际音效特征曲线为待调节的音频信号的音效参数的实际值与各频点的关系曲线,音效参数包括用于表征音频信号频响特性的电平值。确定模块303配置为至少根据实际音效特征曲线,确定实际音效特征曲线中的异常频点集合。调节模块304配置为获取异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个音频补偿值对实际音效特征曲线进行调节,得到调节后的音效特征曲线。输出模块305配置为基于调节后的音效特征曲线输出调节后的音频信号。
需要说明的是,第一获取模块中可以包括声音采集单元,其可以通过高灵敏拾音设备,如多路音频采集设备,采集终端输出的声音;第二获取模块中可以包括缓存单元,配置为存储基于实验室环境下得到的目标音效特征曲线。确定模块和调节模块可以集成于DSP处理器中,并且结合SOC芯片,根据声音采集模块采集的音频数据,确定终端当前输出的实际音效,根据上述实际音效和理想音效,计算音效补偿参数,将音效参数传输给声音输出模块。
在一些实施例中,音频调节装置还包括:第三获取模块和第四获取 模块。第三获取模块配置为获取待调节的音频信号的音频属性,并根据音频属性,确定待调节的音频信号的音频类型。第四获取模块配置为获取目标音频类型所对应的目标音效特征曲线,目标音效特征曲线为音效参数的目标值与各频点的关系曲线。
在一些实施例中,确定模块具体配置为:针对实际音效特征曲线所对应的每个频点,分别进行以下步骤:
根据目标音效特征曲线和实际音效特征曲线,确定频点所对应的音效参数的实际值与目标值之差;当频点所对应的音效参数的实际值与目标值之差大于预设差值阈值时,将频点确定为异常频点集合中的一个异常频点。
在一些实施例中,调节模块具体配置为:以预先设置的参考音频补偿值,对异常频点集合中的每个异常频点分别进行音效参数补偿,得到每个异常频点所对应的音效参数的更新值;针对补偿音频后的每个异常频点,计算音效参数的更新值与目标值之间的第一差值;当第一差值不大于预设差值阈值时,将音效参数的实际值更新为更新值,并将异常频点剔除出异常频点集合;根据剩余的异常频点,更新异常频点集合;返回以预先设置的参考音频补偿值对异常频点集合中的每个异常频点分别进行音效参数补偿,直到异常频点集合中每个频点上的音效参数的更新值与目标值之间的第一差值均不大于预设差值阈值。
在一些实施例中,第三获取模块具体配置为:根据音频属性确定待调节的音频信号中的人声时长;将待调节的音频信号的播放时长与人声时长之差,确定为音乐时长;根据第一比例、第二比例和第一预设比例之间的关系,确定音频信号的音频类型为第一类型或第二类型;其中,第一比例为人声时长与播放时长之比,第二比例为音乐时长与播放时长之比。
在一些实施例中,第一类型至少包括第一子类型、第二子类型和第 三子类型。
第三获取模块具体还配置为:
在确定音频信号的类型为第一类型的情况下,分别确定音频信号中高频信号所占的第三比例、中频信号所占的第四比例以及低频信号所占的第五比例;根据第三比例、第四比例、第五比例以及第二预设比例之间的关系,确定音频类型为第一子类型、第二子类型和第三子类型中的一个。
在一些实施例中,确定模块具体配置为:
判断实际音效特征曲线中是否存在异常波段,异常波段包括波峰或波谷;当存在异常波段时,将异常波段对应的各频点确定为异常频点。
在一些实施例中,音频调节装置还包括:存储模块,配置为存储调节后的音效特征曲线。
图4示出了本公开实施例提供的音频调节设备的硬件结构示意图。
结合图1-图3描述的根据本公开实施例提供的音频调节方法和装置可以由音频调节设备来实现。图4是示出根据发明实施例的音频调节设备的硬件结构400示意图。
在音频调节设备中可以包括处理器401以及存储有计算机程序指令的存储器402。
具体地,上述处理器401可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本公开实施例的一个或多个集成电路。
存储器402可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器402可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器402可以包括可移除或不可移除(或固定)的介质,或者存储器402 是非易失性固态存储器。存储器402可在综合网关容灾设备的内部或外部。
在一个实例中,存储器402可以是只读存储器(Read Only Memory,ROM)。在一个实例中,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存或者两个或更多个以上这些的组合。
处理器401通过读取并执行存储器402中存储的计算机程序指令,以实现图1所示实施例中的方法/步骤S101至S105,并达到图1所示实例执行其方法/步骤达到的相应技术效果,为简洁描述在此不再赘述。
在一个示例中,音频调节设备还可包括通信接口403和总线410。其中,如图4所示,处理器401、存储器402、通信接口403通过总线410连接并完成相互间的通信。
通信接口403,主要用于实现本公开实施例中各模块、装置、单元和/或设备之间的通信。
总线410包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口
(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industry Standard Architecture,ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线410可包括一个或多个总线。尽管本公开实施例描述和示出了特定的总线,但本公开考虑任何合适的总线或互连。
本公开实施例提供的音频调节设备,首先获取到待调节的音频信号,并获取其实际音效特征曲线,然后至少根据该曲线确定其中的异常频点集合,最后基于音频补偿值对异常频点集合中的每个异常频点进行调节,得到调节后的音效特征曲线。上述音频调节设备,优化了人工修改音频参数的方式,提升了音频参数调节的效率,可以有效消除终端播放音频时出现的爆音、失真等现象,提高了音频输出品质。
另外,结合上述实施例中的音频调节方法,本公开实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种音频调节方法。
可以理解的是,以上实施方式仅仅是为了说明本公开的原理而采用的示例性实施方式,然而本公开并不局限于此。对于本领域内的普通技术人员而言,在不脱离本公开的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本公开的保护范围。

Claims (13)

  1. 一种音频调节方法,其中,所述方法包括:
    获取待调节的音频信号;
    获取所述待调节的音频信号的实际音效特征曲线,其中,所述实际音效特征曲线为所述待调节的音频信号的音效参数的实际值与各频点的关系曲线,所述音效参数包括用于表征音频信号频响特性的电平值;
    至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合;
    获取所述异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个所述音频补偿值对所述实际音效特征曲线进行调节,得到调节后的音效特征曲线;
    基于所述调节后的音效特征曲线输出调节后的音频信号。
  2. 根据权利要求1所述的方法,其中,所述方法还包括:
    获取所述待调节的音频信号的音频属性,并根据所述音频属性,确定所述待调节的音频信号的音频类型;
    获取目标音频类型所对应的目标音效特征曲线,所述目标音效特征曲线为所述音效参数的目标值与各频点的关系曲线;
    所述至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合,包括:
    针对所述实际音效特征曲线所对应的每个频点,分别进行以下步骤:
    根据所述目标音效特征曲线和所述实际音效特征曲线,确定所述频点所对应的音效参数的实际值与目标值之差;
    当所述频点所对应的音效参数的实际值与目标值之差大于预设差值阈值时,将所述频点确定为所述异常频点集合中的一个异常频点。
  3. 根据权利要求2所述的方法,其中,所述获取所述异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个所述音频补偿值对所述实际音效特征曲线进行调节,得到调节后的音效特征曲线,包括:
    以预先设置的参考音频补偿值,对所述异常频点集合中的每个异常频点分别进行音效参数补偿,得到每个异常频点所对应的音效参数的更新值;
    针对补偿音频后的每个异常频点,计算所述音效参数的更新值与所述目标值之间的第一差值;
    当所述第一差值不大于所述预设差值阈值时,将所述音效参数的实际值更新为所述更新值,并将所述异常频点剔除出所述异常频点集合;
    根据剩余的异常频点,更新所述异常频点集合;
    返回所述以预先设置的参考音频补偿值对所述异常频点集合中的每个异常频点分别进行音效参数补偿,直到所述异常频点集合中每个频点上的所述音效参数的更新值与目标值之间的第一差值均不大于所述预设差值阈值。
  4. 根据权利要求2所述的方法,其中,所述根据所述音频属性,确定所述待调节的音频信号的音频类型,包括:
    根据所述音频属性确定所述待调节的音频信号中的人声时长;
    将所述待调节的音频信号的播放时长与所述人声时长之差,确定为音乐时长;
    根据第一比例、第二比例和第一预设比例之间的关系,确定所述音频信号的音频类型为第一类型或第二类型;其中,所述第一比例为所述人声时长与所述播放时长之比,所述第二比例为所述音乐时长与所述播放时长之比。
  5. 根据权利要求4所述的方法,其中,所述第一类型至少包括第一子类型、第二子类型和第三子类型,
    在所述根据第一比例、第二比例和第一预设比例之间的关系,确定所述音频信号的音频类型为第一类型或第二类型之后,所述方法还包括:
    在确定所述音频信号的类型为第一类型的情况下,分别确定所述音频信号中高频信号所占的第三比例、中频信号所占的第四比例以及低频信号所占的第五比例;
    根据所述第三比例、所述第四比例、所述第五比例以及第二预设比例之间的关系,确定所述音频类型为所述第一子类型、所述第二子类型和所述第三子类型中的一个。
  6. 根据权利要求1至5中任意一项所述的方法,其中,所述至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合,包括:
    判断所述实际音效特征曲线中是否存在异常波段,所述异常波段包括波峰或波谷;
    当存在所述异常波段时,将所述异常波段对应的各频点确定为异常频点。
  7. 根据权利要求1至5中任意一项所述的方法,其中,所述方法还包括:
    存储所述调节后的音效特征曲线。
  8. 一种音频调节装置,其中,所述装置包括:
    第一获取模块,配置为获取待调节的音频信号;
    第二获取模块,配置为获取所述待调节的音频信号的实际音效特征 曲线,其中,所述实际音效特征曲线为所述待调节的音频信号的音效参数的实际值与各频点的关系曲线,所述音效参数包括用于表征音频信号频响特性的电平值;
    确定模块,配置为至少根据所述实际音效特征曲线,确定所述实际音效特征曲线中的异常频点集合;
    调节模块,配置为获取所述异常频点集合中每个异常频点所对应的音频补偿值,并基于至少一个所述音频补偿值对所述实际音效特征曲线进行调节,得到调节后的音效特征曲线。
  9. 根据权利要求8所述的装置,其中,所述装置还包括:
    第三获取模块,配置为获取所述待调节的音频信号的音频属性,并根据所述音频属性,确定所述待调节的音频信号的音频类型;
    第四获取模块,配置为获取目标音频类型所对应的目标音效特征曲线,所述目标音效特征曲线为所述音效参数的目标值与各频点的关系曲线;
    所述确定模块具体配置为:
    针对所述实际音效特征曲线所对应的每个频点,分别进行以下步骤:
    根据所述目标音效特征曲线和所述实际音效特征曲线,确定所述频点所对应的音效参数的实际值与目标值之差;
    当所述频点所对应的音效参数的实际值与目标值之差大于预设差值阈值时,将所述频点确定为所述异常频点集合中的一个异常频点。
  10. 根据权利要求9所述的装置,其中,所述调节模块具体配置为:
    以预先设置的参考音频补偿值,对所述异常频点集合中的每个异常频点分别进行音效参数补偿,得到每个异常频点所对应的音效参数的更新值;
    针对补偿音频后的每个异常频点,计算所述音效参数的更新值与所述目标值之间的第一差值;
    当所述第一差值不大于所述预设差值阈值时,将所述音效参数的实际值更新为所述更新值,并将所述异常频点剔除出所述异常频点集合;
    根据剩余的异常频点,更新所述异常频点集合;
    返回所述以预先设置的参考音频补偿值对所述异常频点集合中的每个异常频点分别进行音效参数补偿,直到所述异常频点集合中每个频点上的所述音效参数的更新值与目标值之间的第一差值均不大于所述预设差值阈值。
  11. 根据权利要求8所述的装置,其中,所述确定模块具体配置为:
    判断所述实际音效特征曲线中是否存在异常波段,所述异常波段包括波峰或波谷;
    当存在所述异常波段时,将所述异常波段对应的各频点确定为异常频点。
  12. 一种音频调节设备,其中,所述设备包括:处理器,以及存储有计算机程序指令的存储器;所述处理器读取并执行所述计算机程序指令,以实现如权利要求1-7任意一项所述的音频调节方法。
  13. 一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的音频调节方法。
PCT/CN2021/119641 2021-09-22 2021-09-22 音频调节方法、装置、设备及存储介质 WO2023044608A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/CN2021/119641 WO2023044608A1 (zh) 2021-09-22 2021-09-22 音频调节方法、装置、设备及存储介质
CN202180002617.5A CN116157860A (zh) 2021-09-22 2021-09-22 音频调节方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2021/119641 WO2023044608A1 (zh) 2021-09-22 2021-09-22 音频调节方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
WO2023044608A1 true WO2023044608A1 (zh) 2023-03-30

Family

ID=85719782

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/119641 WO2023044608A1 (zh) 2021-09-22 2021-09-22 音频调节方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN116157860A (zh)
WO (1) WO2023044608A1 (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150348562A1 (en) * 2014-05-29 2015-12-03 Apple Inc. Apparatus and method for improving an audio signal in the spectral domain
CN105405448A (zh) * 2014-09-16 2016-03-16 科大讯飞股份有限公司 一种音效处理方法及装置
CN106878866A (zh) * 2017-03-03 2017-06-20 广东欧珀移动通信有限公司 音频信号处理方法、装置及终端
CN109119088A (zh) * 2018-08-29 2019-01-01 歌尔科技有限公司 一种音频信号的调节方法、装置、设备及计算机存储介质
CN208353527U (zh) * 2018-06-14 2019-01-08 厦门盈点科技有限公司 自动补偿音效的演唱装置
CN109658942A (zh) * 2018-12-27 2019-04-19 腾讯音乐娱乐科技(深圳)有限公司 一种音频数据处理方法、装置以及相关设备
CN110191396A (zh) * 2019-05-24 2019-08-30 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、终端及计算机可读存储介质
CN110913325A (zh) * 2019-11-26 2020-03-24 科大讯飞股份有限公司 自动调音方法、相关设备及可读存储介质
WO2021038514A1 (en) * 2019-08-29 2021-03-04 Cosi Paolo Luigi Audio data processing method and system
CN113076075A (zh) * 2020-01-03 2021-07-06 北京小米移动软件有限公司 音频信号的调整方法、装置、终端及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150348562A1 (en) * 2014-05-29 2015-12-03 Apple Inc. Apparatus and method for improving an audio signal in the spectral domain
CN105405448A (zh) * 2014-09-16 2016-03-16 科大讯飞股份有限公司 一种音效处理方法及装置
CN106878866A (zh) * 2017-03-03 2017-06-20 广东欧珀移动通信有限公司 音频信号处理方法、装置及终端
CN208353527U (zh) * 2018-06-14 2019-01-08 厦门盈点科技有限公司 自动补偿音效的演唱装置
CN109119088A (zh) * 2018-08-29 2019-01-01 歌尔科技有限公司 一种音频信号的调节方法、装置、设备及计算机存储介质
CN109658942A (zh) * 2018-12-27 2019-04-19 腾讯音乐娱乐科技(深圳)有限公司 一种音频数据处理方法、装置以及相关设备
CN110191396A (zh) * 2019-05-24 2019-08-30 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、终端及计算机可读存储介质
WO2021038514A1 (en) * 2019-08-29 2021-03-04 Cosi Paolo Luigi Audio data processing method and system
CN110913325A (zh) * 2019-11-26 2020-03-24 科大讯飞股份有限公司 自动调音方法、相关设备及可读存储介质
CN113076075A (zh) * 2020-01-03 2021-07-06 北京小米移动软件有限公司 音频信号的调整方法、装置、终端及存储介质

Also Published As

Publication number Publication date
CN116157860A (zh) 2023-05-23

Similar Documents

Publication Publication Date Title
US10028055B2 (en) Audio signal correction and calibration for a room environment
US9716962B2 (en) Audio signal correction and calibration for a room environment
CN109360562B (zh) 回声消除方法、装置、介质以及语音唤醒方法和设备
CN111970628B (zh) 音频信号的增强方法、装置、存储介质和处理器
US10861472B2 (en) Algorithm-based audio optimization method, intelligent terminal and storage device
JP5085763B2 (ja) 音信号処理装置、及び音信号処理方法
CN110838301B (zh) 抑制啸叫的方法、装置终端和非临时性计算机可读存储介质
WO2003094576A1 (fr) Dispositif et procede de mesure de caracteristique d&#39;emission, et amplificateur
CN113949968A (zh) 一种频响校正方法、电子设备及信号处理方法
WO2023044608A1 (zh) 音频调节方法、装置、设备及存储介质
JP2013031125A (ja) 音信号処理装置、および音信号処理方法
US20110235815A1 (en) Method and arrangement for audio signal processing
TW202114349A (zh) 等化處理的調整系統及其調整方法
CN114067817A (zh) 低音增强方法、装置、电子设备及存储介质
US9514765B2 (en) Method for reducing noise and computer program thereof and electronic device
JP2001352594A (ja) 風音低減方法及び装置
CN108932953B (zh) 一种音频均衡函数确定方法、音频均衡方法及设备
TW201830381A (zh) 語音信號處理裝置及語音信號處理方法
CN117835118B (zh) 一种音频均衡方法及装置
CN113573205B (zh) 信号处理方法、设备及计算机存储介质
CN112584274B (zh) 等化处理的调整系统及其调整方法
CN115550819A (zh) 音频信号处理方法、装置、设备及存储介质
TWI584275B (zh) 電子裝置和聲音信號的分析與播放方法
JPH10173457A (ja) オーディオ装置及びその音量調整方法
JP2023022352A (ja) ゲイン制御装置、ゲイン制御方法及びオーディオ装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 17795217

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21957752

Country of ref document: EP

Kind code of ref document: A1