CN107333076B - 电视机及其音频信号中频点数据的调整方法、装置 - Google Patents

电视机及其音频信号中频点数据的调整方法、装置 Download PDF

Info

Publication number
CN107333076B
CN107333076B CN201710492641.7A CN201710492641A CN107333076B CN 107333076 B CN107333076 B CN 107333076B CN 201710492641 A CN201710492641 A CN 201710492641A CN 107333076 B CN107333076 B CN 107333076B
Authority
CN
China
Prior art keywords
frequency band
band group
weighting coefficient
data
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710492641.7A
Other languages
English (en)
Other versions
CN107333076A (zh
Inventor
邢文峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Visual Technology Co Ltd
Original Assignee
Hisense Visual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Visual Technology Co Ltd filed Critical Hisense Visual Technology Co Ltd
Priority to CN201710492641.7A priority Critical patent/CN107333076B/zh
Publication of CN107333076A publication Critical patent/CN107333076A/zh
Application granted granted Critical
Publication of CN107333076B publication Critical patent/CN107333076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/50Tuning indicators; Automatic tuning control

Abstract

本发明揭示了一种电视机及其音频信号中频点数据的调整方法、装置。所述方法包括:对输入的音频信号进行采样和时频变换得到若干帧频域数据,并针对当前帧频域数据中的频点数据进行频段组划分,得到若干包含至少一频点数据的频段组;如果目标频段组的平均能量小于该目标频段组的听觉阈值,则根据该目标频段组的调整系数以及所述当前帧频域数据的增益值调整该目标频段组的加权系数,所述目标频段组为若干频段组中的其中一频段组,所述调整系数由听觉等响度曲线设定;根据该加权系数调整该目标频段组中的频点数据。本发明能够避免小能量音频信号被同时衰减而影响音频信号的质量。

Description

电视机及其音频信号中频点数据的调整方法、装置
技术领域
本发明涉及音频信号处理技术领域,特别涉及一种电视机及其音频信号中频点数据的调整方法、装置。
背景技术
随着电视机的普及,用户对电视机的要求越来越高。一致音量技术是电视机内部必不可少的一种技术,主要是指在电视机的声音音量发生突变时减小音量变化的范围,以使电视机的音量保持一致。
目前,一致音量技术的实施主要是通过对输入的音频信号进行能量检测,并根据检测得到的能量进行平均能量计算,进而由计算得到的平均能量来调节音频信号的动态范围,进而调节电视机的音量变化范围。
然而,当电视机音量过大时对音频信号进行能量衰减,会导致其中能量较小的音频信号也同时被衰减,而影响了音频信号的质量,例如,爆炸场景中一些轻微的人声由于伴随爆炸声的衰减而同时被衰减,进而导致无法听清楚该人声。
由上可知,如何在大能量音频信号衰减的同时避免小能量音频信号被衰减仍亟待解决。
发明内容
为了解决上述技术问题,本发明提供了一种电视机及其音频信号中频点数据的调整方法、装置。
一方面,一种音频信号中频点数据的调整方法,包括:对输入的音频信号进行采样和时频变换得到若干帧频域数据,并针对当前帧频域数据中的频点数据进行频段组划分,得到若干包含至少一频点数据的频段组;如果目标频段组的平均能量小于该目标频段组的听觉阈值,则根据该目标频段组的调整系数以及所述当前帧频域数据的增益值调整该目标频段组的加权系数,所述目标频段组为若干频段组中的其中一频段组,所述调整系数由听觉等响度曲线设定;根据该加权系数调整该目标频段组中的频点数据。
另一方面,一种音频信号中频点数据的调整装置,包括:频段组划分模块,用于对输入的音频信号进行采样和时频变换得到若干帧频域数据,并针对当前帧频域数据中的频点数据进行频段组划分,得到若干包含至少一频点数据的频段组;加权系数调整模块,用于如果目标频段组的平均能量小于该目标频段组的听觉阈值,则根据该目标频段组的调整系数以及所述当前帧频域数据的增益值调整该目标频段组的加权系数,所述目标频段组为若干频段组中的其中一频段组,所述调整系数由听觉等响度曲线设定;频点数据更新模块,用于根据该加权系数调整该目标频段组中的频点数据。
另一方面,一种电视机,包括处理器及存储器,所述存储器上存储有操作指令,所述操作指令被所述处理器执行时实现如上所述的音频信号中频点数据的调整方法。
本发明的实施例提供的技术方案可以包括以下有益效果:
通过对输入的音频信号进行采样和时频变换得到若干帧频域数据,并将每一帧频域数据中的频点数据划分为若干频段组,使得每一频段组中至少包含一频点数据。针对当前帧频域数据,根据其中各频段组的加权系数分别对各频段组中的所有频点数据进行调整,以此实现对不同能量的音频信号分别进行调整。
具体而言,针对当前帧频域数据中的目标频段组,如果目标频段组的平均能量小于该目标频段组的听觉阈值,则根据该目标频段组的调整系数以及当前帧频域数据的增益值调整该目标频段组的加权系数,并通过调整的加权系数对该目标频段组中的所有频点数据进行调整,由此,仅当该目标频段组的平均能量小于该目标频段组的听觉阈值,即该目标频段组对应小能量音频信号时,才会进行加权系数的调整,以此实现对小能量音频信号的能量提升,从而避免在大能量音频信号被衰减的同时小能量音频信号也被衰减,提高了音频信号的质量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明所涉及的一种电视机的硬件结构示意图。
图2是根据一示例性实施例示出的一种音频信号中频点数据的调整处理方法的流程图。
图3是根据一示例性实施例示出的另一种音频信号中频点数据的调整方法的流程图。
图4是本发明所涉及的听觉等响度曲线的示意图。
图5是根据一示例性实施例示出的另一种音频信号中频点数据的调整方法的流程图。
图6是根据图2实施例所示出的步骤230在一示例性实施例中的流程图。
图7是一应用场景中一种音频信号中频点数据的调整方法的时序框图。
图8是根据一示例性实施例示出的一种音频信号中频点数据的调整装置的框图。
图9是根据一示例性实施例示出的另一种音频信号中频点数据的调整装置的框图。
图10是根据一示例性实施例示出的另一种音频信号中频点数据的调整装置的框图。
图11是根据图8实施例所示出的加权系数调整模块730在一示例性实施例中的框图。
通过上述附图,已示出本发明明确的实施例,后文中将有更详细的描述,这些附图和文字描述并不是为了通过任何方式限制本发明构思的范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种电视机100的硬件结构示意图。需要说明的是,该电视机100只是一个适配于本发明的示例,不能认为是提供了对本发明的使用范围的任何限制。该电视机100也不能解释为需要依赖于或者必须具有图1中示出的示例性的电视机100中的一个或者多个组件。
该电视机100的硬件结构可因配置或者性能的不同而产生较大的差异,如图1所示,电视机100包括:电源110、接口130、至少一存储介质150、以及至少一中央处理器(CPU,Central Processing Units)170。
其中,电源110用于为电视机100上的各硬件设备提供工作电压。
接口130包括至少一有线或无线网络接口131、至少一串并转换接口133、至少一输入输出接口135以及至少一USB接口137等,用于与外部设备通信。
存储介质150作为资源存储的载体,可以是随机存储介质、磁盘或者光盘等,其上所存储的资源包括操作系统151、应用程序153及数据155等,存储方式可以是短暂存储或者永久存储。其中,操作系统151用于管理与控制电视机100上的各硬件设备以及应用程序153,以实现中央处理器170对海量数据155的计算与处理,其可以是Windows ServerTM、MacOS XTM、UnixTM、LinuxTM、FreeBSDTM等。应用程序153是基于操作系统151之上完成至少一项特定工作的计算机程序,其可以包括至少一模块(图1中未示出),每个模块都可以分别包含有对电视机100的一系列操作指令。数据155可以是存储于磁盘中的照片、图片等等。
中央处理器170可以包括一个或多个以上的处理器,并设置为通过总线与存储介质150通信,用于运算与处理存储介质150中的海量数据155。
如上面所详细描述的,适用本发明的电视机100将通过中央处理器170读取存储介质150中存储的一系列操作指令的形式来进行音频信号中频点数据的调整。
此外,通过硬件电路或者硬件电路结合软件指令也能同样实现本发明,因此,实现本发明并不限于任何特定硬件电路、软件以及两者的组合。
请参阅图2,在一示例性实施例中,一种音频信号中频点数据的调整方法可以由图2中示出的电视机100执行,可以包括以下步骤:
步骤210,对输入的音频信号进行采样和时频变换得到若干帧频域数据,并针对当前帧频域数据中的频点数据进行频段组划分,得到若干包含至少一频点数据的频段组。
首先需要说明的是,采样是指按照预设采样频率由输入的音频信号中提取预设采样点数组成时域数据,该时域数据以帧为单位。其中,预设采样频率可以是32000Hz、44100Hz、48000Hz等等,预设采样点数的范围为[16,4096],在此并不进行限定,可以根据实际应用场景进行灵活地调整。
其次,时频变换是针对一帧时域数据而言,采用快速傅里叶变换(Fast FourierTransformation,FFT)将一帧时域数据变换为一帧频域数据。
具体地,快速傅里叶变换的计算公式如下:
Figure BDA0001331855120000051
其中,N为预设采样点数,x[n]表示时域数据中的第n个采样点数据,X[k]表示频域数据中的第k个频点数据。
由此,输入的音频信号经过采样和时频变换便可得到若干帧频域数据,以便基于当前帧频域数据进行频段组划分,以使每一频段组中至少包含一频点数据,进而根据频段组中的频点数据进行后续的能量衰减。
频段组划分是按照预设数目进行的,该预设数目包括预设频段组个数和预设频点数据个数。换而言之,频段数据被划分为预设频段组个数的频段组,每一频段组包含预设频点数据个数的频点数据。
其中,预设数目可以根据实际应用场景进行灵活地调整,例如,低频时,每一频段组包含的频点数据较少,高频时,每一频段组包含的频点数据较多,即预设频点数据个数可调节。又譬如,为了降低处理器的处理压力,频段组个数较少,为了提高对音频信号的处理精度,则频段组个数较多,即预设频段组个数可调节。
在上述过程中,通过频段组划分为后续针对不同能量音频信号对应的频段组进行不同的能量调整提供了有力基础。
应当说明的是,音频信号中频点数据的调整是针对每一帧频域数据进行的,即正在处理的频域数据为当前帧频域数据,待处理的频域数据为后若干帧频域数据,例如后一帧频域数据,已处理的频域数据为前若干帧频域数据,例如前一帧频域数据。
步骤230,如果目标频段组的平均能量小于该目标频段组的听觉阈值,则根据该目标频段组的调整系数以及当前帧频域数据的增益值调整该目标频段组的加权系数。
其中,目标频段组为步骤210中得到的若干频段组中的其中一频段组。
针对当前帧频域数据中的目标频段组,如果目标频段组的平均能量小于该目标频段组的听觉阈值,则视该目标频段组对应小能量音频信号,此时,将针对该目标频段组实现小能量音频信号的能量提升。
其中,频段组的听觉阈值与人耳对音频信号的敏感程度相关,即,人耳对音频信号越敏感,听觉阈值越小,而越靠近低频和高频,人耳对音频信号越不敏感,则听觉阈值越大。
具体地,通过该目标频段组的加权系数实施小能量音频信号的能量提升。该目标频段组的加权系数是根据该目标频段组的调整系数以及当前帧频域数据的增益值调整的,以区别于其余频段组的加权系数。
其中,增益值被用于指示当前帧频域数据的总能量,例如,当前帧频域数据的总能量越大,增益值越小,反之,当前帧频域数据的总能量越小,增益值越大。
调整系数是根据听觉等响度曲线设定的,即调整系数反映了人耳对音频信号的敏感程度,例如,人耳对音频信号越敏感,则调整系数的设定值越小,反之,人耳对音频信号越不敏感,则调整系数的设定值越大,以此有利于对小能量音频信号的能量进行提升。
也就是说,大能量音频信号对应的频段组,其加权系数不会进行调整仍为初始值,而小能量音频信号对应的频段组,其加权系数会进行调整将有别于初始值,进而使得不同能量的音频信号分别基于不同的加权系数进行调整,以此避免在大能量音频信号被衰减的同时小能量音频信号也被衰减。
进一步地,加权系数是与该目标频段组的调整系数成正比,而与当前帧频域数据的增益值成反比的,即人耳对音频信号越不敏感,调整系数越大,相应地,加权系数越大;当前帧频域数据的总能量越大,增益值越小,则加权系数越大。
具体地,Weight(l)=(1/Gain)×Coef(l)。 (2)
其中,l表示当前帧频域数据中的第l个频段组,Weight(l)表示第l个频段组的加权系数,Gain表示当前帧频域数据的增益值,Coef(l)表示第l个频段组的调整系数。
更进一步地,加权系数被初始化为1,即加权系数的初始值为1,相应地,经调整的加权系数区别于初始值,即大于1。由此,大能量音频信号不会受到加权系数的影响,仅有小能量音频信号与经调整的加权系数有关,进而使得不同能量的音频信号分别进行了调整。
步骤250,根据该加权系数调整该目标频段组中的频点数据。
待当前帧频域数据中所有频段组的加权系数均准备完毕,例如,大能量音频信号对应频段组的加权系数不调整,而小能量音频信号对应频段组的加权系数调整,此时,便可对当前帧频域数据中所有频段组包含的所有频点数据进行调整。
调整是指根据各频段组的加权系数和当前帧频域数据的增益值对各频段组对应的不同能量音频信号分别进行衰减或者提升。即,对大能量音频信号进行衰减,对小能量音频信号进行提升。
具体地,X(k)=X(k)×Weight(l)×Gain,k=Klow(l),…,Khigh(l)。 (3)
其中,l表示当前帧频域数据中的第l个频段组,Klow(l)表示第l个频段组的下边界频点数据索引值,Khigh(l)表示第l个频段组的上边界频点数据索引值,X[k]表示第l个频段组中的第k个频点数据,Weight(l)表示第l个频段组的加权系数,Gain表示当前帧频域数据的增益值。
进一步地,当加权系数的初始值为1,针对大能量音频信号,其对应频段组中所有频点数据的调整仅与当前帧频域数据的增益值有关,而针对小能量音频信号,其对应频段组中所有频点数据的调整还同时与频段组的加权系数有关,以此实现了对不同能量音频信号分别进行衰减或者提升。
更进一步地,待各频段组中的所有频点数据调整完毕,对当前帧频域数据进行频时变换后输出。
频时变换是针对一帧频域数据而言,采用快速傅里叶逆变换(Invert FastFourier Transformation,IFFT)将一帧频域数据变换为一帧时域数据。
具体地,快速傅里叶逆变换的计算公式如下:
Figure BDA0001331855120000071
其中,N为预设采样点数,x[k]表示频域数据中的第k个频点数据,X[n]表示频域数据中的第n个采样点数据。
由此,待当前帧频域数据中所有频点数据均调整完毕,即可通过频时变换得到相应的时域数据,以使能量衰减后的音频信号输出。
通过如上所述的过程,针对小能量音频信号进行了能量提升,以此解决了在大能量音频信号衰减的同时小能量音频信号也衰减的问题,进而提高了音频信号的质量。
请参阅图3,在一示例性实施例中,步骤250之前,如上所述的方法还可以包括以下步骤:
步骤310,判断目标频段组的平均能量是否小于目标频段组的听觉阈值。
首先说明的是,频段组的平均能量的计算公式如下:
Figure BDA0001331855120000081
其中,l表示当前帧频域数据中的第l个频段组,Klow(l)表示第l个频段组的下边界频点数据索引值,Khigh(l)表示第l个频段组的上边界频点数据索引值,X[k]表示第l个频段组中的第k个频点数据,Gain表示当前帧频域数据的增益值,Eavr(l)表示第l个频段组中所有频点数据的平均能量。
其次,频段组的听觉阈值与听觉等响度曲线相关,如图4所示,在频率4000Hz时,人耳对音频信号最敏感,听觉阈值最小,而越靠近低频和高频,人耳对音频信号最不敏感,听觉阈值最大。由此,听觉阈值的范围预先设定为[100,200],例如,包含对应频率20Hz频点数据的频段组,其听觉阈值设定为110。
由上可知,如果频段组中所有频点数据的平均能量低于频段组的听觉阈值,即表示人耳无法听清楚,此时,频段组对应的是小能量音频信号,以此为后续在对大能量音频信号进行能量衰减的同时,对该小能量音频信号进行能量提升提供了依据。
基于此,在进行步骤250之前,首先需要根据频段组的听觉阈值进行小能量音频信号的判断,即判断频段组的平均能量是否小于频段组的听觉阈值
如果频段组的平均能量小于频段组的听觉阈值,则跳转进入步骤230,对频段组的加权系数进行调整,以使后续该频段组中的所有频点数据按照调整的加权系数进行调整。
反之,如果频段组的平均能量大于频段组的听觉阈值,表示频段组对应的是大能量音频信号,不需要进行该频段组加权系数的调整,则跳转进入步骤330。
步骤330,判断目标频段组的加权系数是否为初始值。
如前所述,音频信号中频点数据的调整是针对连续不断的每一帧频域数据。
为了防止音量调节过程中出现噪声,需要保证电视机的音量能够连续缓慢地变化,可以理解,如果前一帧频域数据中目标频段组对应为小能量音频信号,则该目标频段组的加权系数被相应地调整过,此时,在当前帧频域数据中,该目标频段组的加权系数是沿用该调整过的加权系数,而不是使用初始值。
如果在当前帧频域数据中,该目标频段组对应的是大能量音频信号,则需要对该调整过的加权系数进行恢复,进而使得该大能量音频信号不会通过该调整过的加权系数进行能量提升,而是以恢复的加权系数开始能量衰减。
为此,当判断到该目标频段组对应的是大能量音频信号时,还需要进一步判断该目标频段组的加权系数是否为初始值,以此获知是否需要进行加权系数的恢复。
如果判断到该目标频段组的加权系数不为初始值,则跳转进入步骤350,对该目标频段组的加权系数进行恢复处理,以便于后续按照恢复的加权系数对该目标频段组中所有频点数据进行调整。
反之,如果判断到该目标频段组的加权系数为初始值,则跳转进入步骤370。
步骤350,根据预设恢复系数对目标频段组的加权系数进行恢复处理。
预设恢复系数被用于指示目标频段组的加权系数逐渐恢复至初始值的时长。预设恢复系数的范围为(0,1),例如,预设恢复系数为0.9996,相应地,经过恢复处理的加权系数将越来越小,直至小于1,则将该加权系数恢复至初始值。应当理解,预设恢复系数越小,则加权系数恢复至初始值的时长越短。
具体地,Weight(l)=Weight(l)×Cof。 (6)
其中,l表示当前帧频域数据中的第l个频段组,Weight(l)表示第l个频段组的加权系数,Cof表示预设恢复系数。
在上述实施例的作用下,进一步有利于保证音频信号的质量,进而保证电视机的音量能够连续缓慢地变化,有效地防止了音量调节过程中出现噪声,提升了用户的视听体验。
进一步地,如图3所示,在一示例性实施例中,步骤250之前,如上所述的方法还可以包括以下步骤:
步骤370,保持目标频段组的加权系数不变。
如果频段组对应为大能量音频信号,并且频段组的加权系数为初始值,则保持该加权系数不变,以使频段组中的所有频点数据按照保持不变的加权系数进行调整。
由此,保持不变的加权系数的初始值为1时,对于大能量音频信号而言,调整过程中仅和当前帧频域数据的增益值有关,即公式(3)简化为X(k)=X(k)×Gain,进而使得电视机的音量是等比例衰减的,有利于声音保真。
请参阅图5,在一示例性实施例中,步骤310之前,如上所述的方法还可以包括以下步骤:
步骤410,根据当前帧频域数据、前一帧频域数据的总能量预测后一帧频域数据的总能量。
具体而言,频域数据的总能量计算公式如下:
Figure BDA0001331855120000101
其中,E(M)表示第M帧频域数据的总能量,X(k)表示频域数据中第k个频点数据。
由此,假设E(M)为当前帧频域数据的总能量,E(M-1)为前一帧频域数据的总能量,则后一帧频域数据的总能量计算公式如下:
Eprid(M+1)=E(M)×2×Gainpre-E(M-1)。 (8)
其中,Eprid(M+1)表示后一帧频域数据的总能量,Gainpre表示前一帧频域数据的增益值。
应当说明的是,在计算后一帧频域数据的总能量时,当前帧频域数据的增益值还未计算得到,由此,公式(8)中是基于前一帧频域数据的增益值进行计算的。
此外,当前帧频域数据中所有频点数据调整完毕之后,将以当前帧频域数据的总能量对前一帧频域数据的总能量进行更新,以便于后续进行后一帧频域数据总能量预测,即E(M-1)=E(M)。
在上述过程中,采用线性预测方式,即假设前一帧频域数据的总能量、当前帧频域数据的总能量以及后一帧频域数据的总能量为线性关系,以此保证能够提早发现能量过大的音频信号,进而使得声音的表现更加平滑,避免引入噪声。
步骤430,判断后一帧频域数据的总能量是否大于总能量阈值。
其中,总能量阈值为当前帧频域数据之前若干帧频域数据的总能量中最大值。
如果判断到后一帧频域数据的总能量大于总能量阈值,表示存在能量过大的音频信号,则判定需要进行能量衰减,跳转进入步骤310。
反之,如果判断到后一帧频域数据的总能量小于总能量阈值,表示当前帧频域数据对应的仍为正常音频信号,无需进行能量衰减,则将其对应的正常音频信号输出。
在上述实施例的配合下,仅当存在能量过大的音频信号时才会进行能量衰减,以此降低处理器的处理压力,有利于提高处理器的处理效率。
此外,通过线性预测方式,有利于预防出现能量过大的音频信号,使得声音的表现更加平滑,避免引入噪声。
请参阅图6,在一示例性实施例中,步骤230可以包括以下步骤:
步骤231,根据总能量阈值以及后一帧频域数据的总能量计算当前帧频域数据的增益值。
其中,总能量阈值为当前帧频域数据之前若干帧频域数据的总能量中最大值。后一帧频域数据的总能量是由当前帧频域数据、前一帧频域数据的总能量预测得到的。
如前所述,当后一帧频域数据的总能量大于总能量阈值,便可针对大能量音频信号进行能量衰减,进一步地,当前帧频域数据中目标频段组的平均能量小于该目标频段组的听觉阈值,则针对小能量音频信号进行能量提升,即跳转进入步骤230。
由此,当Eprid>Emax时,当前帧频域数据的增益值的计算公式如下:
Figure BDA0001331855120000111
其中,Gain表示当前帧频域数据的增益值,Eprid表示后一帧频域数据的总能量,Emax表示总能量阈值。
由于当前帧频域数据的增益值是在满足Eprid>Emax的条件下计算得到的,因此,该增益值是位于0到1范围内的一个数值,即该增益值的作用在于使得当前帧频域数据的总能量不超过之前若干帧频域数据的总能量中的最大值,以进一步地使得声音的表现更加平滑。
步骤233,由听觉等响度曲线确定目标频段组中所有频点数据对应的声压级,并计算目标频段组中所有频点数据对应声压级的声压级平均值,通过声压级平均值进行调整系数运算。
如图4所示,听觉等响度曲线反映了等响条件下频率与声压级之间的关系,即听觉等响度曲线上有无数个等效的频率(Hz)——声压级(dB)。例如,响度级为20的响度曲线中,20Hz-80dB的声音和10KHz-30dB的声音对于人耳来说具有相同的响度。
由此,针对同一响度级(例如响度级为10)的响度曲线,目标频段组中所有频点数据对应的频率便可由该响度曲线确定出对应的声压级,进而计算得到目标频段组中所有频点数据对应声压级的声压级平均值,以此进行调整系数的运算。
具体地,频段组中所有频点数据对应声压级的声压级平均值的计算公式如下:
Figure BDA0001331855120000121
其中,l表示当前帧频域数据中第l个频段组,Klow(l)表示第l个频段组的下边界频点数据索引值,Khigh(l)表示第l个频段组的上边界频点数据索引值,Pavr(l)表示第l个频段组中所有频点数据对应声压级的声压级平均值,p(k)表示第l个频段组中第k个频点数据对应的声压级。
相应地,Coef(l)=(pavr(l)/77)+1。(11)
其中,Coef(l)表示第l个频段组的调整系数;77为在响度级为10的响度曲线中频率20Hz对应的声压级,该数值可以根据实际应用场景进行灵活地调整。
例如,在频率为4000Hz时,人耳对音频信号最敏感,此时Pavr(l)很小接近于1,则Coef(l)接近于1,即反映了人耳对音频信号最敏感。反之,在频率为20Hz时,人耳对音频信号最不敏感,此时Pavr(l)为77,则Coef(l)为2,即反映了人耳对音频信号最不敏感。
步骤235,按照与调整系数成正比、与当前帧频域数据的增益值成反比计算得到目标频段组的加权系数。
如前所述,Weight(l)=(1/Gain)×Coef(l)。 (2)
其中,l表示当前帧频域数据中的第l个频段组,Weight(l)表示第l个频段组的加权系数,Gain表示当前帧频域数据的增益值,Coef(l)表示第l个频段组的调整系数。
图7为一应用场景中一种音频信号中频点数据的调整方法的具体流程示意图。现结合图1中示出的电视机100和图7中所涉及的应用场景对本发明中各实施例所涉及的音频信号中频点数据的调整方法进行说明如下。
如图7所示,在该应用场景中,输入电视机100的音频信号经过若干时间的能量检测,得到总能量阈值Emax为1010
对于输入的音频信号而言,通过采样501和时频变换502之后,得到当前帧频域数据。
假如计算得到当前帧频域数据的总能量E(M)为0.9×1010,而前一帧频域数据的总能量E(M-1)为0.5×1010,前一帧频域数据的增益值Gainpre=1,那么通过公式(8),由预测后一帧能量水平503预测得到后一帧频域数据的总能量Eprid为1.3×1010。其中,前一帧频域数据的总能量E(M-1)在音频信号的能量检测过程中将通过前一帧能量水平更新509进行不断地更新。
此时,满足公式(9)的条件,则通过计算当前帧增益值504,计算得到当前帧频域数据的增益值Gain=0.877,也就是表示要将当前帧频域数据对应的音频信号的振幅衰减到原来的87.7%。可以理解,假如此时不满足公式(9)的条件,则直接跳转到频时变换508进行频时变换后输出。
假如对于包含对应频率20Hz频点数据的频段组l,其的听觉阈值T(l)为110。此时,通过计算频段组能量水平505,计算得到该频段组l中所有频点数据的平均能量Eavr(l)为50,那就满足Eavr(l)<T(l)。
进一步地,在确定频段组能量权重507中,通过公式(2)计算得出该频段组l的加权系数Weight(l)为(1/0.877)×1.1=1.254。其中,1.1为调整系数Coef,也就是由图4所示的听觉等响度曲线所设定的。
按照公式(3),对当前帧频域数据中各频段组的所有频点数据进行调整,即,对于非小能量音频信号对应的频段组,其的加权系数weight为1,也就是相当于仅乘以当前帧频域数据的增益值Gain,由于Gain的范围为[0,1],即对非小能量音频信号进行能量衰减,而对于小能量音频信号对应的频段组l,结合公式(2)和公式(3),最终公式(3)可以简化为X(k)=X(k)×Coef(l),也就是相当于仅乘以频段组的调整系数1.1,即对小能量音频信号进行能量提升。
待当前帧频域数据中的所有频点数据X(k)均调整完毕,便可通过频时变换508输出能量衰减后的音频信号。
此外,在加权系数的恢复506中,公式(6)是为了让某一频段组的加权系数逐渐恢复至初始值。
以上述为例,小能量音频信号对应的频段组l的加权系数Weight(l)为1.254,假设后面每一帧频域数据中该频段组l中所有频点数据的平均能量Eavr(l)均大于该频段组l的听觉阈值T(l),则Weight(l)在后面每一帧都会乘以0.9996,以使1.254逐渐恢复至1。其中,0.9996为预设恢复系数Cof。
也就是说,经过566帧之后加权系数Weight(l)会小于1,则将该加权系数Weight(l)恢复为1。假设预设采样频率为48000Hz,预设采样点数为256,则每秒有48000/256=187.5帧,即经过566/187.5=3s,加权系数Weight(l)恢复为1,以此保证了电视机100的音量能够连续缓慢地变化,有效地防止了音量调节过程中出现噪声,提升了用户的视听体验。
在上述实施例中,对于非小能量音频信号对应的频段组而言,加权系数为初始值1,则电视机100的音量按等比例衰减,以此保证声音的保证,而对于小能量音频信号对应的频段组而言,加权系数大于1,以此使得该频段组不会在原来的基础上直接衰减,反而能量将有所提升,以此解决了大能量音频信号衰减的同时小能量音频信号也被衰减的问题,从而有利于提升音频信号的质量。
请参阅图8,在一示例性实施例中,一种音频信号中频点数据的调整装置700包括但不限于:频段组划分模块710、加权系数调整模块730和频点数据更新模块750。
其中,频段组划分模块710用于对输入的音频信号进行采样和时频变换得到若干帧频域数据,并针对当前帧频域数据中的频点数据进行频段组划分,得到若干包含至少一频点数据的频段组。
加权系数调整模块730用于如果目标频段组的平均能量小于该目标频段组的听觉阈值,则根据该目标频段组的调整系数以及当前帧频域数据的增益值调整该目标频段组的加权系数。目标频段组为若干频段组中的其中一频段组,调整系数由听觉等响度曲线设定。
频点数据更新模块750用于根据该加权系数调整该目标频段组中的频点数据。
请参阅图9,在一示例性实施例中,如上所述的装置700还包括但不限于:平均能量判断模块810、加权系数判断模块830和加权系数恢复模块850。
其中,平均能量判断模块810用于判断目标频段组的平均能量是否小于目标频段组的听觉阈值。如果否,则通知加权系数判断模块830。
加权系数判断模块830用于进一步判断目标频段组的加权系数是否为初始值。
加权系数恢复模块850用于在目标频段组的加权系数不为初始值时,根据预设恢复系数对目标频段组的加权系数进行恢复处理,以使目标频段组中的频点数据按照恢复的加权系数进行调整。预设恢复系数被用于指示目标频段组的加权系数逐渐恢复至初始值的时长。
在一示例性实施例中,如上所述的装置700还包括但不限于:加权系数保持模块。
其中,加权系数保持模块用于如果判断到目标频段组的加权系数为初始值,则保持目标频段组的加权系数不变,以使目标频段组中的频点数据按照保持不变的加权系数进行调整。
请参阅图10,在一示例性实施例中,如上所述的装置700还包括但不限于:总能量预测模块910和总能量判断模块930。
其中,总能量预测模块910用于根据当前帧频域数据、前一帧频域数据的总能量预测后一帧频域数据的总能量。
总能量判断模块930用于判断后一帧频域数据的总能量是否大于总能量阈值。总能量阈值为当前帧频域数据之前若干帧频域数据的总能量中最大值。
如果是,则通知平均能量判断模块810。
请参阅图11,在一示例性实施例中,加权系数调整模块730包括但不限于:增益值计算单元731、声压级平均值计算单元733、调整系数计算单元735和加权系数计算单元737。
其中,增益值计算单元731用于根据总能量阈值以及后一帧频域数据的总能量计算当前帧频域数据的增益值。
声压级平均值计算单元733用于由听觉等响度曲线确定目标频段组中频点数据对应的声压级,并根据目标频段组中频点数据对应的声压级进行声压级平均值计算。
调整系数计算单元735用于根据计算得到的声压级平均值确定调整系数。
加权系数计算单元737用于按照与调整系数成正比、与当前帧频域数据的增益值成反比计算得到目标频段组的加权系数。
需要说明的是,上述实施例所提供的音频信号中频点数据的调整装置在进行音频信号中频点数据的调整处理时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即音频信号中频点数据的调整装置的内部结构将划分为不同的功能模块,以完成以上描述的全部或者部分功能。
另外,上述实施例所提供的音频信号中频点数据的调整装置与音频信号中频点数据的调整方法的实施例属于同一构思,其中各个模块执行操作的具体方式已经在方法实施例中进行了详细描述,此处不再赘述。
在一示例性实施例中,一种电视机,包括处理器及存储器。
其中,该存储器上存储有操作指令,该操作指令被处理器执行时实现如上所述各实施例的音频信号中频点数据的调整方法。
上述内容,仅为本发明的较佳示例性实施例,并非用于限制本发明的实施方案,本领域普通技术人员根据本发明的主要构思和精神,可以十分方便地进行相应的变通或修改,故本发明的保护范围应以权利要求书所要求的保护范围为准。

Claims (10)

1.一种音频信号中频点数据的调整方法,其特征在于,包括:
对输入的音频信号进行采样和时频变换得到若干帧频域数据,并针对当前帧频域数据中的频点数据进行频段组划分,得到若干包含至少一频点数据的频段组;
如果目标频段组的平均能量小于该目标频段组的听觉阈值,则根据该目标频段组的调整系数以及所述当前帧频域数据的增益值调整该目标频段组的加权系数,所述目标频段组为若干频段组中的其中一频段组,所述调整系数由听觉等响度曲线设定,调整系数越大,加权系数越大,当前帧频域数据的总能量越大,增益值越小,加权系数越大;
根据该加权系数调整该目标频段组中的频点数据。
2.如权利要求1所述的方法,其特征在于,所述根据该加权系数调整该目标频段组中的频点数据之前,所述方法还包括:
判断所述目标频段组的平均能量是否小于所述目标频段组的听觉阈值;
如果否,则进一步判断所述目标频段组的加权系数是否为初始值;
在所述目标频段组的加权系数不为初始值时,根据预设恢复系数对所述目标频段组的加权系数进行恢复处理,以使所述目标频段组中的频点数据按照恢复的加权系数进行调整,所述预设恢复系数被用于指示所述目标频段组的加权系数逐渐恢复至所述初始值的时长。
3.如权利要求2所述的方法,其特征在于,在进一步判断所述目标频段组的加权系数是否为初始值之后,所述方法还包括:
如果所述目标频段组的加权系数为所述初始值,则保持所述目标频段组的加权系数不变,以使所述目标频段组中的频点数据按照保持不变的加权系数进行调整。
4.如权利要求2所述的方法,其特征在于,所述判断所述目标频段组的平均能量是否小于所述目标频段组的听觉阈值之前,所述方法还包括:
根据所述当前帧频域数据的总能量、前一帧频域数据的总能量预测后一帧频域数据的总能量;
判断所述后一帧频域数据的总能量是否大于总能量阈值,所述总能量阈值为所述当前帧频域数据之前若干帧频域数据的总能量中最大值;
如果是,则执行所述判断所述目标频段组的平均能量是否小于所述目标频段组的听觉阈值步骤。
5.如权利要求4所述的方法,其特征在于,所述目标频段组的加权系数调整,具体包括:
根据所述总能量阈值以及所述后一帧频域数据的总能量计算所述当前帧频域数据的增益值;
由所述听觉等响度曲线确定所述目标频段组中频点数据对应的声压级,并根据所述目标频段组中频点数据对应的声压级进行声压级平均值计算;
根据计算得到的声压级平均值确定调整系数;
按照与所述调整系数成正比、与所述当前帧频域数据的增益值成反比计算得到所述目标频段组的加权系数。
6.一种音频信号中频点数据的调整装置,其特征在于,包括:
频段组划分模块,用于对输入的音频信号进行采样和时频变换得到若干帧频域数据,并针对当前帧频域数据中的频点数据进行频段组划分,得到若干包含至少一频点数据的频段组;
加权系数调整模块,用于如果目标频段组的平均能量小于该目标频段组的听觉阈值,则根据该目标频段组的调整系数以及所述当前帧频域数据的增益值调整该目标频段组的加权系数,所述目标频段组为若干频段组中的其中一频段组,所述调整系数由听觉等响度曲线设定,调整系数越大,加权系数越大,当前帧频域数据的总能量越大,增益值越小,加权系数越大;
频点数据更新模块,用于根据该加权系数调整该目标频段组中的频点数据。
7.如权利要求6所述的装置,其特征在于,所述装置还包括:
平均能量判断模块,用于判断所述目标频段组的平均能量是否小于所述目标频段组的听觉阈值;如果否,则通知加权系数判断模块;
所述加权系数判断模块,用于进一步判断所述目标频段组的加权系数是否为初始值;
加权系数恢复模块,用于在所述目标频段组的加权系数不为初始值时,根据预设恢复系数对所述目标频段组的加权系数进行恢复处理,以使所述目标频段组中的频点数据按照恢复的加权系数进行调整,所述预设恢复系数被用于指示所述目标频段组的加权系数逐渐恢复至所述初始值的时长。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
总能量预测模块,用于根据所述当前帧频域数据的总能量、前一帧频域数据的总能量预测后一帧频域数据的总能量;
总能量判断模块,用于判断所述后一帧频域数据的总能量是否大于总能量阈值,所述总能量阈值为所述当前帧频域数据之前若干帧频域数据的总能量中最大值;如果是,则通知所述平均能量判断模块。
9.如权利要求8所述的装置,其特征在于,所述加权系数调整模块包括:
增益值计算单元,用于根据所述总能量阈值以及所述后一帧频域数据的总能量计算所述当前帧频域数据的增益值;
声压级平均值计算单元,用于由所述听觉等响度曲线确定所述目标频段组中频点数据对应的声压级,并根据所述目标频段组中频点数据对应的声压级进行声压级平均值计算;
调整系数计算单元,用于根据计算得到的声压级平均值确定调整系数;
加权系数计算单元,用于按照与所述调整系数成正比、与所述当前帧频域数据的增益值成反比计算得到所述目标频段组的加权系数。
10.一种电视机,其特征在于,包括:
处理器;及
存储器,所述存储器上存储有操作指令,所述操作指令被所述处理器执行时实现如权利要求1至5中任一项所述的音频信号中频点数据的调整方法。
CN201710492641.7A 2017-06-26 2017-06-26 电视机及其音频信号中频点数据的调整方法、装置 Active CN107333076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710492641.7A CN107333076B (zh) 2017-06-26 2017-06-26 电视机及其音频信号中频点数据的调整方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710492641.7A CN107333076B (zh) 2017-06-26 2017-06-26 电视机及其音频信号中频点数据的调整方法、装置

Publications (2)

Publication Number Publication Date
CN107333076A CN107333076A (zh) 2017-11-07
CN107333076B true CN107333076B (zh) 2020-05-19

Family

ID=60196112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710492641.7A Active CN107333076B (zh) 2017-06-26 2017-06-26 电视机及其音频信号中频点数据的调整方法、装置

Country Status (1)

Country Link
CN (1) CN107333076B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110858487A (zh) * 2018-08-23 2020-03-03 北京嘉楠捷思信息技术有限公司 一种音频信号缩放处理方法及装置
CN109151562B (zh) * 2018-08-27 2020-12-29 深圳创维-Rgb电子有限公司 一种音效控制方法、装置、电视机及存储介质
CN109360577B (zh) * 2018-10-16 2022-11-04 广州酷狗计算机科技有限公司 对音频进行处理的方法、装置存储介质
CN109473115B (zh) * 2018-11-22 2022-04-12 四川长虹电器股份有限公司 数字音频信号音量等响度调节方法
CN110349595B (zh) * 2019-07-22 2021-08-31 浙江大华技术股份有限公司 一种音频信号自动增益控制方法、控制设备及存储介质
CN112152738B (zh) * 2020-09-25 2022-08-19 广州粒子微电子有限公司 基于NB-IoT的快速扫频方法及装置
CN113963726B (zh) * 2021-09-29 2023-11-07 稿定(厦门)科技有限公司 音频响度均衡方法及装置
CN114449339B (zh) * 2022-02-16 2024-04-12 深圳万兴软件有限公司 背景音效的转换方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000002639A (ko) * 1998-06-22 2000-01-15 윤종용 라우드니스 제어 방법 및 장치
CN1684143A (zh) * 2004-04-14 2005-10-19 华为技术有限公司 一种语音增强的方法
CN101483416A (zh) * 2009-01-20 2009-07-15 杭州火莲科技有限公司 一种语音的响度均衡处理方法
CN102378085A (zh) * 2010-08-21 2012-03-14 比亚迪股份有限公司 基于等响曲线的响度补偿方法、补偿装置及音频处理系统
CN106713794A (zh) * 2016-11-29 2017-05-24 青岛海信电器股份有限公司 一种调节音频均衡的方法及提供均衡调节的音频系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000002639A (ko) * 1998-06-22 2000-01-15 윤종용 라우드니스 제어 방법 및 장치
CN1684143A (zh) * 2004-04-14 2005-10-19 华为技术有限公司 一种语音增强的方法
CN101483416A (zh) * 2009-01-20 2009-07-15 杭州火莲科技有限公司 一种语音的响度均衡处理方法
CN102378085A (zh) * 2010-08-21 2012-03-14 比亚迪股份有限公司 基于等响曲线的响度补偿方法、补偿装置及音频处理系统
CN106713794A (zh) * 2016-11-29 2017-05-24 青岛海信电器股份有限公司 一种调节音频均衡的方法及提供均衡调节的音频系统

Also Published As

Publication number Publication date
CN107333076A (zh) 2017-11-07

Similar Documents

Publication Publication Date Title
CN107333076B (zh) 电视机及其音频信号中频点数据的调整方法、装置
US8744844B2 (en) System and method for adaptive intelligent noise suppression
US8615095B2 (en) Automatic volume control for audio signals
JP6290429B2 (ja) 音声処理システム
CN109285554B (zh) 一种回声消除方法、服务器、终端及系统
CN102549659A (zh) 抑制音频信号中的噪声
CN110650410B (zh) 一种麦克风自动增益控制方法、装置及存储介质
US10283134B2 (en) Sound-mixing processing method, apparatus and device, and storage medium
CN113170260B (zh) 音频处理方法、装置、存储介质及电子设备
CN107682802B (zh) 音频设备音效的调试方法及装置
JP2010212887A (ja) 信号特性変化装置
CN113613123B (zh) 音频数据的处理方法、装置、耳机及存储介质
CN112669878B (zh) 声音增益值的计算方法、装置和电子设备
US10200003B1 (en) Dynamically extending loudspeaker capabilities
CN112309418B (zh) 一种抑制风噪声的方法及装置
EP3444946B1 (en) Acoustic processing device and acoustic processing method
CN112954576B (zh) 基于滤波器组的数字助听器啸叫检测与抑制算法及硬件实现方法
KR20070084312A (ko) 적응 시간-기반 잡음 억제
US9514765B2 (en) Method for reducing noise and computer program thereof and electronic device
US9900689B2 (en) Adaptive detector and auto mode for dynamics processor
CN111478675A (zh) 一种音频信号处理系统、音频信号处理方法及电子设备
CN111724808A (zh) 音频信号处理方法、装置、终端及存储介质
CN113470692B (zh) 音频处理方法、装置、可读介质及电子设备
CN111405419B (zh) 音频信号处理方法、装置及可读存储介质
CN111145776B (zh) 音频处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 266000 Qianwan port, Qingdao Economic and Technological Development Zone, Shandong Province

Applicant after: Hisense Video Technology Co., Ltd

Address before: 266555 Qingdao economic and Technological Development Zone, Shandong, Hong Kong Road, No. 218

Applicant before: HISENSE ELECTRIC Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant