CN112449236A - 一种音量调节的方法及显示装置 - Google Patents

一种音量调节的方法及显示装置 Download PDF

Info

Publication number
CN112449236A
CN112449236A CN201910804664.6A CN201910804664A CN112449236A CN 112449236 A CN112449236 A CN 112449236A CN 201910804664 A CN201910804664 A CN 201910804664A CN 112449236 A CN112449236 A CN 112449236A
Authority
CN
China
Prior art keywords
signal
sound source
determining
energy
source object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910804664.6A
Other languages
English (en)
Other versions
CN112449236B (zh
Inventor
邢文峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Visual Technology Co Ltd
Original Assignee
Hisense Visual Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Visual Technology Co Ltd filed Critical Hisense Visual Technology Co Ltd
Priority to CN201910804664.6A priority Critical patent/CN112449236B/zh
Publication of CN112449236A publication Critical patent/CN112449236A/zh
Application granted granted Critical
Publication of CN112449236B publication Critical patent/CN112449236B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4852End-user interface for client configuration for modifying audio parameters, e.g. switching between mono and stereo

Abstract

本发明公开了一种音量调节的方法及显示装置,通过获取当前帧的音频信号,确定当前帧的音频信号的第一能量参数,根据当前帧的音频信号中包括的左、右声道信号,分别确定出多个子信号,根据预设的相关性算法确定每个子信号中包括的至少部分声源对象的第二能量参数,根据第一能量参数和第二能量参数,确定各声源对象的类型和不同类型对应的权重,对子信号中各声源对象进行加权处理和整合处理后再输出。因此,对音量调节时,是根据各声源对象的不同类型采用不同的处理方式,避免了现有技术中对不同声源对象采用相同的处理方式导致部分声源对象无法被用户感知的问题,提高了音量调节效果,大大的提高了用户的体验感受。

Description

一种音量调节的方法及显示装置
技术领域
本发明涉及音量控制技术领域,尤指一种音量调节的方法及显示装置。
背景技术
在现有技术中,在对电视机的音量进行调节时,是根据电视机的音量计算出一个音量的平均值,当电视机音量中的信号若高于音量的平均值称之为高能量信号;反之,则是低能量信号。当采用音量的平均值同时对高能量信号和低能量信号进行调节时,高能量信号被削弱,同时,低能量信号也会被削弱,如此可能会出现低能量信号无法被用户感知到,从而造成音量调节结果不理想,用户体验感受降低。
基于此,如何在对音量进行调节时,避免出现低能量信号无法被用户感知的问题出现,提高音量调节效果,是本领域技术人员亟待解决的技术问题。
发明内容
本发明实施例提供一种音量调节的方法及显示装置,用以解决现有技术中存在的对音量进行调节时,避免出现低能量信号无法被用户感知的问题。
第一方面,本发明实施例提供了一种音量调节的方法,包括:
获取当前帧的音频信号,所述音频信号包括左声道信号和右声道信号;
确定当前帧的所述音频信号的第一能量参数;
根据当前帧的所述音频信号中包括的左声道信号和右声道信号,分别确定出多个子信号;
根据预设的相关性算法,确定每个所述子信号中包括的至少部分声源对象的第二能量参数;
在根据所述第一能量参数判断出需要进行分类加权处理时,根据所述第一能量参数和所述第二能量参数,确定各所述声源对象的类型和不同类型对应的权重,并对各所述声源对象分别进行加权处理;
对加权处理后的所述子信号中的各所述声源对象进行整合处理后输出。
可选地,根据预设的相关性算法,确定每个所述子信号中包括的至少部分声源对象的第二能量参数,具体包括:
确定所述左声道信号和所述右声道信号中对应所述子信号中具有相同第一参数的第一相同信号,根据确定出的所述第一相同信号、以及所述左声道信号和所述右声道信号中对应所述子信号,确定第一残差信号和第二残差信号,并将所述第一相同信号确定为第一声源对象;其中,所述第一残差信号为:所述左声道信号的所述子信号中去除所述第一相同信号之后的信号,所述第二残差信号为:与所述左声道信号中的所述子信号对应的所述右声道信号中的所述子信号中去除所述第一相同信号之后的信号;所述第一参数包括信号的相位和幅值;
按照所述预设的相关性算法,确定所述第一残差信号和所述第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值;
根据所述最大相关值对应的相位移动值,对所述第一残差信号或所述第二残差信号进行相位移动,确定出具有相同相位的第二相同信号,根据所述第二相同信号,以及所述第一残差信号和所述第二残差信号,确定更新后的第一残差信号和更新后的第二残差信号,并将所述第二相同信号确定为第二声源对象;
根据确定出的所述最大相关值,判断是否满足预设的重复处理条件;
若是,继续按照所述预设的相关性算法,确定更新后的第一残差信号和更新后的第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值;
若否,确定所述第一声源对象和所述第二声源对象的第二能量参数。
可选地,按照所述预设的相关性算法,确定所述第一残差信号和所述第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值,具体包括:
根据如下公式,确定所述第一残差信号和所述第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值:
Figure BDA0002183289500000031
[y(k0)]=max([y(k1),y(k2),.......,y(ki)]);
其中,n表示所述第一残差信号和所述第二残差信号中第n个采样点,N表示所述第一残差信号和所述第二残差信号的采样点数量,SDL(n)表示所述第一残差信号中第n个采样点对应的幅值,SDR(n+ki)表示所述第二残差信号在移动k个相位后第n个采样点对应的幅值,Km表示相位可移动的最大值,y(ki)表示移动ki个相位时所述第一残差信号与所述第二残差信号的相关值,y(k0)表示所述第一残差信号与所述第二残差信号的最大相关值,k0表示所述第一残差信号与所述第二残差信号的最大相关值对应的相位移动值,Km大于0。
可选地,根据确定出的所述最大相关值,判断是否满足预设的重复处理条件,具体包括:
判断确定出的所述最大相关值是否不小于预设相关值;
或,判断已确定出的所述最大相关值的总数是否满足预设数量。
可选地,根据所述第一能量参数,判断是否需要进行分类加权处理,具体包括:
判断所述第一能量参数是否大于第一预设能量阈值;
若是,确定需要进行分类加权处理;
若否,确定不需要进行分类加权处理。
可选地,在根据所述第一能量参数判断出需要进行分类加权处理时,根据所述第一能量参数和所述第二能量参数,确定各所述声源对象的类型和不同类型对应的权重,并对各所述声源对象分别进行加权处理,具体包括:
根据各所述第二能量参数与第二预设能量阈值,确定所述子信号中的各所述声源对象的类型;
根据所述第一能量参数与所述第一预设能量阈值,确定不同类型的声源对象对应的权重;
根据确定出的所述子信号中的各所述声源对象的类型、以及不同类型的声源对象对应的权重,对所述子信号中的各所述声源对象分别进行加权处理。
可选地,根据各所述第二能量参数与第二预设能量阈值,确定所述子信号中的各所述声源对象的类型,具体包括:
在判断出所述第二能量参数小于所述第二预设能量阈值时,将所述第二能量参数小于所述第二预设能量阈值的所述声源对象确定为低能量声源对象;
在判断出所述第二能量参数不小于所述第二预设能量阈值时,将所述第二能量参数不小于所述第二预设能量阈值的所述声源对象确定为非低能量声源对象。
可选地,根据所述第一能量参数与所述第一预设能量阈值,确定不同类型的声源对象对应的权重,具体包括:
根据如下公式,确定所述非低能量声源对象对应的权重:
A=(N1/N2)1/2
其中,A表示所述非低能量声源对象对应的权重,N1表示所述第一预设能量阈值,N2表示所述第一能量参数;
根据如下规则,确定所述低能量声源对象对应的权重:
B=1;
或,B=(1+A)/2;
其中,B表示所述低能量声源对象对应的权重。
可选地,所述第一预设能量阈值根据位于当前帧之前的全部帧的第一能量参数的平均值确定;
所述第二预设能量阈值是用户对声音的感知程度预先设置的。
第二方面,本发明实施例提供了一种显示装置,包括扬声器,还包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的所述程序指令,按照获得的程序执行:
获取当前帧的音频信号,所述音频信号包括左声道信号和右声道信号;
确定当前帧的所述音频信号的第一能量参数;
根据当前帧的所述音频信号中包括的左声道信号和右声道信号,分别确定出多个子信号;
根据预设的相关性算法,确定每个所述子信号中包括的至少部分声源对象的第二能量参数;
在根据所述第一能量参数判断出需要进行分类加权处理时,根据所述第一能量参数和所述第二能量参数,确定各所述声源对象的类型和不同类型对应的权重,并对各所述声源对象分别进行加权处理;
对加权处理后的所述子信号中的各所述声源对象进行整合处理后输出至扬声器。
可选的,所述处理器具体用于:
确定所述左声道信号和所述右声道信号中对应所述子信号中具有相同第一参数的第一相同信号,根据确定出的所述第一相同信号、以及所述左声道信号和所述右声道信号中对应所述子信号,确定第一残差信号和第二残差信号,并将所述第一相同信号确定为第一声源对象;其中,所述第一残差信号为:所述左声道信号的所述子信号中去除所述第一相同信号之后的信号,所述第二残差信号为:与所述左声道信号中的所述子信号对应的所述右声道信号中的所述子信号中去除所述第一相同信号之后的信号;所述第一参数包括信号的相位和幅值;
按照所述预设的相关性算法,确定所述第一残差信号和所述第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值;
根据所述最大相关值对应的相位移动值,对所述第一残差信号或所述第二残差信号进行相位移动,确定出具有相同相位的第二相同信号,根据所述第二相同信号,以及所述第一残差信号和所述第二残差信号,确定更新后的第一残差信号和更新后的第二残差信号,并将所述第二相同信号确定为第二声源对象;
根据确定出的所述最大相关值,判断是否满足预设的重复处理条件;
若是,继续按照所述预设的相关性算法,确定更新后的第一残差信号和更新后的第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值;
若否,确定所述第一声源对象和所述第二声源对象的第二能量参数。
可选的,所述处理器具体用于:
根据各所述第二能量参数与第二预设能量阈值,确定所述子信号中的各所述声源对象的类型;
根据所述第一能量参数与所述第一预设能量阈值,确定不同类型的声源对象对应的权重;
根据确定出的所述子信号中的各所述声源对象的类型、以及不同类型的声源对象对应的权重,对所述子信号中的各所述声源对象分别进行加权处理。
第三方面,本发明实施例提供了一种计算机可读的非易失性存储介质,所述计算机可读的非易失性存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算执行上述的音量调节的方法。
本发明有益效果如下:
本发明实施例提供的一种音量调节的方法及显示装置,通过获取当前帧的音频信号,确定当前帧的音频信号的第一能量参数,根据当前帧的音频信号中包括的左、右声道信号,分别确定出多个子信号,根据预设的相关性算法确定每个子信号中包括的至少部分声源对象的第二能量参数,根据第一能量参数和第二能量参数,确定各声源对象的类型和不同类型对应的权重,对子信号中各声源对象进行加权处理和整合处理后再输出。因此,对音量调节时,是根据各声源对象的不同类型采用不同的处理方式,避免了现有技术中对不同声源对象采用相同的处理方式导致部分声源对象无法被用户感知的问题,提高了音量调节效果,大大的提高了用户的体验感受。
附图说明
图1为一段音频信号在时域上的示意图;
图2为一段音频信号的频率和音量变化的示意图;
图3为本发明实施例中提供的一种音量调节的方法的流程图;
图4为本发明实施例中提供的不同声源的位置的示意图;
图5为本发明实施例中提供的自适应滤波器的结构示意图;
图6为本发明实施例中提供的实施例的流程的示意图;
图7为本发明实施例中提供的一种显示装置的结构示意图;
图8为本发明实施例中提供的另一种显示装置的结构示意图;
图9为本发明实施例中提供的再一种显示装置的结构示意图。
具体实施方式
下面将结合附图,对本发明实施例提供的一种音量调节的方法及显示装置的具体实施方式进行详细地说明。需要说明的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
发明人在研究中发现,在对音量进行调节时,可以在时域上检测音频信号的能量,确定一定时间的能量的平均值。在音量过大需要进行降低音量时,若音频信号包括的声源对象增加(如加入歌声),且简单的根据平均值调节音量时,会引发声音的不自然。
例如,参见图1和图2所示,图1表示时域上的一段音频信号,图2表示一段音频信号的频率变化,其中,图1和图2表示的是相同的一段音频信号,只是采用了不同的表现方式。从图2中所示,横坐标表示频率,纵坐标表示强度,若该段音频信号为一段歌曲,图2中的白色线表示只有伴音的频谱,灰色线表示伴音加歌手的频谱,那么该段歌曲从开始只有伴音,所以音量较小,之后歌手开始唱歌,音量增加,且音量高的部分为歌手的歌声。
也就是说,音频信号的音量之所以发生变化,是因为在200Hz以上时加入了歌手的歌声,使得音量有了一个明显的增加(即图2中灰色线在200Hz以上比白色线的强度有很大的增加);在200Hz以下时,因只有伴音,所以音量变化不大(即图2中灰色线在200Hz以下与白色线的强度相似)。如果对加入歌声的该段音频信号进行降音调节时,会使得伴音的音量也会降低,使得整个音频信号听起来不连贯,用户体验感受下降。
为了解决上述问题,本发明实施例提供了一种音量调节的方法,用以提高音量调节的效果,提高用户的体验感受。
具体地,本发明实施例提供的一种音量调节的方法,如图3所示,可以包括:
S301、获取当前帧的音频信号,音频信号包括左声道信号和右声道信号;
其中,获取的音频信号可以是立体声信号,立体声信号包括左声道信号和右声道信号,并且左声道信号和右声道信号是数字信号,也就是说,输入的是两个声道的数字信号。
对于用户而言,听到的是一个具有环绕立体声感觉的音频。在制作具有环绕立体声感觉的音频时,将不同的乐器根据其位置信息,将不同强度和不同延迟的信号分别分配到不同的声道中,以重现音频中各乐器的定位信息。也就是说,不同位置的乐器,在两个声道中具有不同的延迟。
当然,获取到的音频信号除了可以是立体声信号,还可以是其他信号,只要能够通过本发明实施例提供的音量调节的方法提高音量调节效果即可,对于音频信号的形式并不做具体限定。
此外,在获取一帧音频信号时,一般但不限于是在32000Hz或48000Hz的采样率下获取到的,且可以将256个采样点确定为一帧音频信号。当然,一帧音频信号的采样点并不限于256个,还可以是其他值,如可以在[16,4096]之间,可以根据实际需要进行选择,在此并不限定。
S302、确定当前帧的音频信号的第一能量参数;
其中,在确定音频信号的第一能量参数时,可以采用本领域技术人员所熟知的任何方式,在此并不限定。
例如,根据音频信号对应的波形图,将各采样点对应的幅值的平方进行累加,即为该音频信号的第一能量参数。
S303、根据当前帧的音频信号中包括的左声道信号和右声道信号,分别确定出多个子信号;
其中,可以采用分帧处理的方式,划分出多个子信号,而关于具体的分帧处理方式,可以是本领域技术人员所熟知的任何可以划分出多个子信号的分帧处理方式,在此并不限定。
并且,在进行划分时,可以将左声道信号和右声道信号分别划分出相同数量的子信号。例如但不限于,一帧音频信号中的左声道信号可以分为50段信号,一帧音频信号中的右声道信号同样可以分为50段信号。如此,可以有利于后续处理,提高处理精确度。
此外,对于执行步骤S303的原因在于:
一方面,一帧音频信号对应的时间较长,进而不管是左声道信号还是右声道信号对应的时间也较长,如果不对左声道信号和右声道信号进行划分,那么在后续处理时是一帧一帧来处理的,此时可能会出现一帧的音频信号还没处理完该音频已经完成且过去时间较久,即使对该帧音频信号进行了较好地处理,却会造成较大的延迟,降低用户的感受。
另一方面,对于显示装置而言,一帧音频信号对应的数据量较大,若要完成处理需要显示装置具有较高的处理能力,如此需要对显示装置的硬件具有较高的要求,同时还会造成显示装置较高的功耗。
因此,基于上述两个方面的原因,对一帧音频信号中的左声道信号和右声道信号分别进行划分,以划分出多个子信号,之后显示装置对每个子信号进行分别处理,不仅可以大大降低延迟,还可以大大降低显示装置的处理量,降低对显示装置的硬件要求,同时降低显示装置的功耗,从而可以大大提高该方法的应用领域。
说明一点,可选地,步骤S302和步骤S303的执行顺序并不限于上述顺序,两个步骤的执行顺序可以互换,或者同时执行,只要能够确定出当前帧音频信号的第一能量参数,以及划分多个子信号即可,在此并不限定。
S304、根据预设的相关性算法,确定每个子信号中包括的至少部分声源对象的第二能量参数;
说明一点,可选地,在执行步骤S304时,可以是对左声道信号中的一个子信号,以及对右声道信号中与左声道信号中一个子信号对应的那个子信号进行处理,以保证后续处理的准确性,避免出现处理错误。
例如但不限于,若对左声道信号中的各子信号进行编号,同样也对右声道信号中的各子信号进行编号,且左声道信号和右声道信号中的子信号的编号方式相同时,那么在处理时,可以是对左声道信号和右声道信号中具有相同编号的子信号进行处理。
S305、在根据第一能量参数判断出需要进行分类加权处理时,根据第一能量参数和第二能量参数,确定各声源对象的类型和不同类型对应的权重,并对子信号中的各声源对象分别进行加权处理;
S306、对加权处理后的子信号中的各声源对象进行整合处理后输出。
如此,对于当前帧音频信号,根据不同的声源对象进行不同的调整,避免了现有技术中在不同类型的声源对象采用相同的处理方式而导致部分声源对象不能被用户识别的问题,从而提高了音量调节的效果,还大大的提升了用户的体验感受。
在具体实施时,为了确定各声源对象的第二能量参数,在本发明实施例中,根据预设的相关性算法,确定每个子信号中包括的至少部分声源对象的第二能量参数,具体包括:
确定左声道信号和右声道信号中对应子信号中具有相同第一参数的第一相同信号,根据确定出的第一相同信号、以及左声道信号和右声道信号中对应子信号,确定第一残差信号和第二残差信号,并将第一相同信号确定为第一声源对象;其中,第一残差信号为:左声道信号的子信号中去除第一相同信号之后的信号,第二残差信号为:与左声道信号中的子信号对应的右声道信号中的子信号中去除第一相同信号之后的信号;第一参数包括信号的相位和幅值;
按照预设的相关性算法,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值;
根据最大相关值对应的相位移动值,对第一残差信号或第二残差信号进行相位移动,确定出具有相同相位的第二相同信号,根据第二相同信号,以及第一残差信号和第二残差信号,确定更新后的第一残差信号和更新后的第二残差信号,并将第二相同信号确定为第二声源对象;
根据确定出的最大相关值,判断是否满足预设的重复处理条件;
若是,继续按照预设的相关性算法,确定更新后的第一残差信号和更新后的第二残差信号的最大相关值,以及最大相关值对应的相位移动值;
若否,确定第一声源对象和第二声源对象的第二能量参数。
其中,判断是否满足预设的重复处理条件这个步骤的作用为:判断是否要重复前述的按照预设的相关性算法确定第一残差信号和第二残差信号的最大相关值以及最大相关值对应的相位移动值。
也就是说,通过重复执行确定最大相关值的过程,可以在每确定出一个最大相关值时,均可确定出一个第二相同信号,即确定出一个第二声源对象,所以通过重复处理,可以确定出多个第二声源对象。
例如但不限于:
过程1、按照预设的相关性算法,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值;
过程2、根据确定出的最大相关值对应的相位移动值,从第一残差信号和第二残差信号中分离出第二相同信号,得到更新后的第一残差信号和更新后的第二残差信号,并将第二相同信号确定为第二声源对象;
过程3、根据确定出的最大相关值,判断是否满足预设的重复处理条件;若是,重复上述过程1和过程2;若否,则无需重复上述过程。
说明一点,在过程2中,每分离出一个第二相同信号,都会生成一个更新后的第一残差信号和更新后的第二残差信号。在重复过程1时,针对的是更新后的第一残差信号和更新后的第二残差信号;在重复过程2时,针对的也是更新后的第一残差信号和更新后的第二残差信号。
也就是说,对于过程3在判断的结果为是时,按照预设的相关性算法,确定更新后的第一残差信号和更新后的第二残差信号的最大相关值,以及最大相关值对应的相位移动值;之后,根据确定出的最大相关值对应的相位移动值,从更新后的第一残差信号和更新后的第二残差信号中再次分离出第二相同信号,得到再次更新后的第一残差信号和再次更新后的第二残差信号,并将再次分离出的第二相同信号确定为另一个第二声源对象。
如此,可以实现根据预设的相关性算法,确定子信号中包括的至少部分声源对象的第二能量参数,以便于后续对各声源对象进行分类和加权处理操作,提高音量调节的效果。
具体地,为了能够判断出是否满足预设的重复处理条件,在本发明实施例中,根据确定出的最大相关值,判断是否满足预设的重复处理条件,可以具体包括:
判断确定出的最大相关值是否不小于预设相关值;
或,判断已确定出的最大相关值的总数是否满足预设数量。
也就是说,在判断是否满足预设的重复处理条件时,可以通过两个方式进行判断,方式1为可以判断最大相关值与预设相关值的关系,方式2为可以判断已经确定出的最大相关值的总数与预设数量的关系。
其中,对于方式2,还可以理解为进行重复处理的次数是否达到规定次数,若未达到规定次数,则可以继续进行重复处理,若已达到规定次数,则可以停止进行重复操作。
当然,在判断是否满足预设的重复处理条件时,并不限于上述两种方式,还可以是其他方式,只要能够有利于确定出子信号中包括的各声源对象即可,在此并不限定。
具体地,为了确定出最大相关值和最大相关值对应的相位移动值,在本发明实施例中,按照预设的相关性算法,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值,具体包括:
根据如下公式,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值:
Figure BDA0002183289500000131
[y(k0)]=max([y(k1),y(k2),.......,y(ki)]);
其中,n表示第一残差信号和第二残差信号中第n个采样点,N表示第一残差信号和第二残差信号的采样点数量,SDL(n)表示第一残差信号中第n个采样点对应的幅值,SDR(n+k)表示第二残差信号在移动k个相位后第n个采样点对应的幅值,Km表示相位可移动的最大值,y(ki)表示移动k个相位时第一残差信号与第二残差信号的相关值,y(k0)表示第一残差信号与第二残差信号的最大相关值,k0表示第一残差信号与第二残差信号的最大相关值对应的相位移动值,Km大于0。
下面以具体实施例为例对上述提及的确定声源对象的第二能量参数的具体过程进行说明。
参见图4所示,图中示出了多个声源对象,以及各声源对象的位置。其中,1表示bongos(邦戈鼓),2表示bass(bass drum,低音大鼓),3表示gtr(guitar,吉他),4表示shake(摇奏),5表示tom(tom tom drum,嗵嗵鼓),6表示snare(snare drum,小军鼓),为不同的乐器且表示不同的声源对象,由于各声源对象在舞台中的位置不同,使得在左声道信号和右声道信号中存在不同的延迟。
以图中所示的bongos为例,图中的虚线a表示舞台的中间,bongos位于舞台的右侧,因此在将bongos的声音分配到左右声道信号中时,可以使得bongos在左声道信号中的幅值小于在右声道信号中的幅值,且bongos在左声道信号对应波形中的相位与右声道信号对应波形中的相位相比,延迟若干毫秒。
同样地,对于shake,位于舞台的左侧,因此在将shake的声音分配到左右声道信号中时,可以使得shake在左声道信号中的幅值大于在右声道信号中的幅值,且shake在左声道信号对应波形中的相位与右声道信号对应波形中的相位相比,提前若干毫秒。
说明一点,对于歌声部分(例如合唱时的合唱部分),在左声道信号和右声道信号中的幅值和相位是一样的,所以可以将歌声部分作为第一声源对象,并且,将该第一声源对象从左声道信号和右声道信号中对应子信号中分离出来,以得到第一残差信号和第二残差信号。
在第一残差信号和第二残差信号中,包括的相同声源对象的相位可能是不同的,幅值也可能是不同的,如图4中的bongos或shake。此时,为了能够确定出第二声源对象,需要确定出最大相关值对应的相位移动值,所以确定第一残差信号和第二残差信号的最大相关值和最大相关值对应的相位移动值就变得尤为重要。
其中,预设的相关性算法,可以理解为对第一残差信号和第二残差信号进行相位移动,使得相同声源对象具有相同相位,以找到最大相关值以及最大相关值对应的相位移动值。例如,利用公式1计算第一残差信号和第二残差信号的相关值:
公式1:
Figure BDA0002183289500000141
其中,Km表示相位可移动的最大值,可以根据显示装置中的处理器性能进行设置,且Km可以设置为不大于20,但并不限于此,以保证显示装置可以正常工作,且有利于提高音量调节效率。不同的相关值对应不同的相位移动值,也就是说,每对相位移动一个值就会得到对应的一个相关值。
利用公式2,找到各相关值中的最大值:
公式2:[y(k0)]=max([y(k1),y(k2),.......,y(ki)]);
其中,k1、k2、以及ki表示不同的相位移动值,k0表示最大相关值对应的相位移动值。
在通过上述公式1和2确定出最大相关值对应的相位移动值(用k0表示)时,可以对第一残差信号或第二残差信号移动k0个相位,确定出第一残差信号和第二残差信号中具有相同相位的第二相同信号,此时可以将该第二相同信号确定为第二声源对象并分离出来。
因此,通过上述方式,可以分离出bongos和shake,并依次将bongos和shake分别定义为第二声源对象,即可以确定出两个第二声源对象。当然,其他的第二声源对象均可以采用上述方式确定,在此不再赘述。
需要注意的是,通过相位移动值可以推算出声源对象所处的位置。例如但不限于,相位移动值为0,说明该声源对象位于舞台的中间,也即在左右扬声器的中心线上;如果相位移动值大于0,说明该声源对象位于舞台的左侧;如果相位移动值小于0,说明该声源对象位于舞台的右侧。并且,通过各相位移动值,可以推算出各声源对象之间的相对距离。
可选地,在分离具有相同相位的信号(例如作为第一声源对象的第一相同信号,以及作为第二声源对象的第二相同信号)时,可以通过自适应滤波器(如图5所示)来实现,其中,自适应滤波器由自适应部分和滤波器部分这两个部分来组成,自适应部分可以使用LMS(Least Mean Square,最小均方)或者NLMS(Normalized Least Mean Square,归一化最小均方)等算法来实现(如采用图5中的自适应算法模块实现),滤波部分可以采用传统的IIR(Infinite Impulse Response,无限脉冲响应)或者FIR(Finite Impulse Response,有限脉冲响应)滤波器(如图5中的FIR滤波器)来实现。
参见图5所示,CC表示分离出的具有相同相位的信号,Lch表示左声道信号中的子信号,Rch表示右声道信号中对应的子信号,SDL表示第一残差信号,SDR表示第二残差信号,LL表示第一残差信号,RR表示第二残差信号。
以左声道信号中的子信号Lch为例,对左声道信号中的子信号Lch进行处理时,以右声道信号中对应的子信号Rch为参考信号,经过滤波之后,得到的是与右声道信号中对应的子信号Rch中具有相同相位的信号CC和第一残差信号LL。
同样地,对右声道信号中对应的子信号Rch进行处理时,以左声道信号中的子信号Lch为参考信号,经过滤波后,得到的是与左声道信号中的子信号Lch中相位相同的信号CC和第二残差信号RR。
将具有相位相同的信号的幅值相加,具有相同相位的信号的幅值即增加了一倍,但其他信号(相位不同的信号)的幅值则没有增加,因此,可以提高信噪比,从而便于实现具有相同相位信号的分离。
在具体实施时,根据第一能量参数,判断是否需要进行分类加权处理,具体包括:
判断第一能量参数是否大于第一预设能量阈值;
若是,确定需要进行分类加权处理;
若否,确定不需要进行分类加权处理。
其中,若第一能量参数不大于第一预设能量阈值,此时可以判断出不需要进行分类加权处理,在这种情况下,可以采用本领域技术人员所熟知的任何方式进行处理,例如但不限于,将确定出来的各声源对象均采用相同的权重进行加权处理。如此,可以降低显示装置的运算复杂度,减少显示装置的处理量,提高音量调节效率。
若第一能量参数大于第一预设能量阈值,此时可以确定出需要进行分类加权处理,以便于对不同类型的声源对象采用不同的加权处理,从而提高音量调节的效果,提高用户的感受。
在具体实施时,为了能够对各声源对象分别进行加权处理,在本发明实施例中,在根据第一能量参数判断出需要进行分类加权处理时,根据第一能量参数和第二能量参数,确定各声源对象的类型和不同类型对应的权重,并对各声源对象分别进行加权处理,具体包括:
根据各第二能量参数与第二预设能量阈值,确定子信号中的各声源对象的类型;
根据第一能量参数与第一预设能量阈值,确定不同类型的声源对象对应的权重;
根据确定出的子信号中的各声源对象的类型、以及不同类型的声源对象对应的权重,对子信号中的各声源对象分别进行加权处理。
如此,可以首先确定出个声源对象的类型,再确定出不同类型的声源对象的权重,最后通过对不同类型的声源对象采用的不同的权重进行加权处理,可以避免在降低音量时低能量的信号进一步降低而造成无法被用户感知的问题出现,进而提高用户的体验感受,提高音量调节的效果。
具体地,在本发明实施例中,根据各第二能量参数与第二预设能量阈值,确定子信号中的各声源对象的类型,具体包括:
在判断出第二能量参数小于第二预设能量阈值时,将第二能量参数小于第二预设能量阈值的声源对象确定为低能量声源对象;
在判断出第二能量参数不小于第二预设能量阈值时,将第二能量参数不小于第二预设能量阈值的声源对象确定为非低能量声源对象。
如此,通过对子信号中的各声源对象进行分类,分成低能量声源对象和非低能量声源对象这两个类型,以便于根据不同声源对象的类型采取不同的处理,从而有利于避免现有技术中各个声源对象均采用相同的权重进行加权处理导致低能量信号不能被用户识别的问题,进而有利于提高对音量调节的效果。
在具体实施时,为了确定出不同类型的声源对象对应的权重,在本发明实施例中,根据第一能量参数与第一预设能量阈值,确定不同类型的声源对象对应的权重,具体包括:
根据如下公式,确定非低能量声源对象对应的权重:
A=(N1/N2)1/2
其中,A表示非低能量声源对象对应的权重,N1表示第一预设能量阈值,N2表示第一能量参数;
根据如下规则,确定低能量声源对象对应的权重:
B=1;
或,B=(1+A)/2;
其中,B表示低能量声源对象对应的权重。
可选地,在本发明实施例中,第一预设能量阈值根据位于当前帧之前的全部帧的第一能量参数的平均值确定;
第二预设能量阈值是用户对声音的感知程度预先设置的。
其中,第一预设能量阈值和第二预设能量阈值并不限于根据上述方式确定,还可以根据需要进行相应的设置,以满足不同用场景的需要,提高设计的灵活性。
例如但不限于,假设当前帧之前的全部帧的音频信号的平均第一能量参数为K,设定第一预设能量阈值为1.5K,在需要进行分类加权处理,且当前帧的第一能量参数为2K时,那么:
非低能量声源对象对应的权重为:(1.5K/2K)1/2=0.866;
低能量声源对象对应的权重可以为:1,或(1+0.866)/2=0.933,又或者是0.866-1之间的任意值。
也就是说,如果非低能量声源对象具有多个时,那么每个非低能量声源对象对应的权重均为0.866。
如果低能量声源对象具有多个时,那么每个低能量声源对象对应的权重可以均相同,均为1、0.933、或其他值。当然,各低能量声源对象对应的权重可以设置为不同,可以根据实际情况而定,在此并不限定。
如此,根据第一能量参数与第一预设能量阈值,可以确定出不同类型的声源对象对应的权重,以便于根据不同声源对象的类型采取不同的处理,从而有利于避免现有技术中各个声源对象均采用相同的权重进行加权处理导致低能量信号不能被用户识别的问题,进而有利于提高对音量调节的效果。
下面以具体实施例对本发明实施例提供的音量调节的方法进行说明。
实施例:结合图6所示的方法的流程图。
S601、获取当前帧的音频信号,音频信号包括左声道信号和右声道信号;
S602、确定当前帧的音频信号的第一能量参数;
S603、根据当前帧的音频信号中包括的左声道信号和右声道信号,分别确定出多个子信号;
S604、从左声道信号和右声道信号中对应子信号中分离出第一相同信号后得到第一残差信号和第二残差信号,并将第一相同信号确定为第一声源对象;
S605、根据预设的相关性算法,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值;并根据确定出的最大相关值对应的相位移动值,从第一残差信号和第二残差信号中分离出第二相同信号,并将第二相同信号确定为第二声源对象;
S606、判断确定出的最大相关值是否不小于预设相关值,若否,执行步骤S607,若是,回到步骤S605;
S607、确定第一声源对象和各第二声源对象的第二能量参数;
S608、判断第一能量参数是否大于第一预设能量阈值,若是,执行步骤S609,若否,结束流程;
S609、确定需要进行分类加权处理;
S610、将第二能量参数小于第二预设能量阈值的声源对象确定为低能量声源对象,将第二能量参数不小于第二预设能量阈值的声源对象确定为非低能量声源对象;
S611、分别确定低能量声源对象对应的权重,以及非低能量声源对象对应的权重;
S612、对低能量声源对象和非低能量声源对象分别进行加权处理;
S613、对加权处理后的低能量声源对象和非低能量声源对象进行累加处理后输出。
基于同一发明构思,本发明实施例提供一种显示装置,包括扬声器,如图7所示,还可以包括:
存储器701,用于存储程序指令;
处理器702,用于调用存储器中存储的程序指令,按照获得的程序执行:
获取当前帧的音频信号,音频信号包括左声道信号和右声道信号;
确定当前帧的音频信号的第一能量参数;
根据当前帧的音频信号中包括的左声道信号和右声道信号,分别确定出多个子信号;
根据预设的相关性算法,确定每个子信号中包括的至少部分声源对象的第二能量参数;
在根据第一能量参数判断出需要进行分类加权处理时,根据第一能量参数和第二能量参数,确定各声源对象的类型和不同类型对应的权重,并对各声源对象分别进行加权处理;
对加权处理后的子信号中的各声源对象进行整合处理后输出至扬声器703。
可选地,显示装置可以是电视,但并不限于电视,其中扬声器可以设置在电视的左右两侧,如图9所示,其中Y表示扬声器;当然,扬声器还可以设置于电视中的其他位置,未给出图示,只要能够使得用户有效地接收到电视发出的音频信息即可,对于扬声器的位置并不做具体限定。
可选地,在本发明实施例中,处理器702具体用于:
确定左声道信号和右声道信号中对应子信号中具有相同第一参数的第一相同信号,根据确定出的第一相同信号、以及左声道信号和右声道信号中对应子信号,确定第一残差信号和第二残差信号,并将第一相同信号确定为第一声源对象;其中,第一残差信号为:左声道信号的子信号中去除第一相同信号之后的信号,第二残差信号为:与左声道信号中的子信号对应的右声道信号中的子信号中去除第一相同信号之后的信号;第一参数包括信号的相位和幅值;
按照预设的相关性算法,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值;
根据最大相关值对应的相位移动值,对第一残差信号或第二残差信号进行相位移动,确定出具有相同相位的第二相同信号,根据第二相同信号,以及第一残差信号和第二残差信号,确定更新后的第一残差信号和更新后的第二残差信号,并将第二相同信号确定为第二声源对象;
根据确定出的最大相关值,判断是否满足预设的重复处理条件;
若是,继续按照预设的相关性算法,确定更新后的第一残差信号和更新后的第二残差信号的最大相关值,以及最大相关值对应的相位移动值;
若否,确定第一声源对象和第二声源对象的第二能量参数。
可选地,在本发明实施例中,处理器702具体用于:
根据如下公式,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值:
Figure BDA0002183289500000211
[y(k0)]=max([y(k1),y(k2),.......,y(ki)]);
其中,n表示第一残差信号和第二残差信号中第n个采样点,N表示第一残差信号和第二残差信号的采样点数量,SDL(n)表示第一残差信号中第n个采样点对应的幅值,SDR(n+k)表示第二残差信号在移动k个相位后第n个采样点对应的幅值,Km表示相位可移动的最大值,y(ki)表示移动k个相位时第一残差信号与第二残差信号的相关值,y(k0)表示第一残差信号与第二残差信号的最大相关值,k0表示第一残差信号与第二残差信号的最大相关值对应的相位移动值,Km大于0。
可选地,在本发明实施例中,处理器702具体用于:
判断确定出的最大相关值是否不小于预设相关值;
或,判断已确定出的最大相关值的总数是否满足预设数量。
可选地,在本发明实施例中,处理器702具体用于:
判断第一能量参数是否大于第一预设能量阈值;
若是,确定需要进行分类加权处理;
若否,确定不需要进行分类加权处理。
可选地,在本发明实施例中,处理器702具体用于:
根据各第二能量参数与第二预设能量阈值,确定子信号中的各声源对象的类型;
根据第一能量参数与第一预设能量阈值,确定不同类型的声源对象对应的权重;
根据确定出的子信号中的各声源对象的类型、以及不同类型的声源对象对应的权重,对子信号中的各声源对象分别进行加权处理。
可选地,在本发明实施例中,处理器702具体用于:
在判断出第二能量参数小于第二预设能量阈值时,将第二能量参数小于第二预设能量阈值的声源对象确定为低能量声源对象;
在判断出第二能量参数不小于第二预设能量阈值时,将第二能量参数不小于第二预设能量阈值的声源对象确定为非低能量声源对象。
可选地,在本发明实施例中,处理器702具体用于:
根据如下公式,确定非低能量声源对象对应的权重:
A=(N1/N2)1/2
其中,A表示非低能量声源对象对应的权重,N1表示第一预设能量阈值,N2表示第一能量参数;
根据如下规则,确定低能量声源对象对应的权重:
B=1;
或,B=(1+A)/2;
其中,B表示低能量声源对象对应的权重。
可选地,在本发明实施例中,第一预设能量阈值根据位于当前帧之前的全部帧的第一能量参数的平均值确定;
第二预设能量阈值是用户对声音的感知程度预先设置的。
基于同一发明构思,本发明实施例提供了一种显示装置,包括扬声器,结构如图8所示,还包括:
获取单元801,用于获取当前帧的音频信号,音频信号包括左声道信号和右声道信号;
确定单元802,用于确定当前帧的音频信号的第一能量参数;根据当前帧的音频信号中包括的左声道信号和右声道信号,分别确定出多个子信号;根据预设的相关性算法,确定每个子信号中包括的至少部分声源对象的第二能量参数;
处理单元803,用于在根据第一能量参数判断出需要进行分类加权处理时,根据第一能量参数和第二能量参数,确定各声源对象的类型和不同类型对应的权重,并对各声源对象分别进行加权处理;
输出单元804,用于对加权处理后的子信号中的各声源对象进行整合处理后输出至外放单元805;
可选地,外放单元805可以是扬声器,但并不限于此,还可以是其他能够实现外放功能的结构。
可选地,在本发明实施例中,确定单元802具体用于:
确定左声道信号和右声道信号中对应子信号中具有相同第一参数的第一相同信号,根据确定出的第一相同信号、以及左声道信号和右声道信号中对应子信号,确定第一残差信号和第二残差信号,并将第一相同信号确定为第一声源对象;其中,第一残差信号为:左声道信号的子信号中去除第一相同信号之后的信号,第二残差信号为:与左声道信号中的子信号对应的右声道信号中的子信号中去除第一相同信号之后的信号;第一参数包括信号的相位和幅值;
按照预设的相关性算法,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值;
根据最大相关值对应的相位移动值,对第一残差信号或第二残差信号进行相位移动,确定出具有相同相位的第二相同信号,根据第二相同信号,以及第一残差信号和第二残差信号,确定更新后的第一残差信号和更新后的第二残差信号,并将第二相同信号确定为第二声源对象;
根据确定出的最大相关值,判断是否满足预设的重复处理条件;
若是,继续按照预设的相关性算法,确定更新后的第一残差信号和更新后的第二残差信号的最大相关值,以及最大相关值对应的相位移动值;
若否,确定第一声源对象和第二声源对象的第二能量参数。
可选地,在本发明实施例中,确定单元802具体用于:
根据如下公式,确定第一残差信号和第二残差信号的最大相关值,以及最大相关值对应的相位移动值:
Figure BDA0002183289500000241
[y(k0)]=max([y(k1),y(k2),.......,y(ki)]);
其中,n表示第一残差信号和第二残差信号中第n个采样点,N表示第一残差信号和第二残差信号的采样点数量,SDL(n)表示第一残差信号中第n个采样点对应的幅值,SDR(n+k)表示第二残差信号在移动k个相位后第n个采样点对应的幅值,Km表示相位可移动的最大值,y(ki)表示移动k个相位时第一残差信号与第二残差信号的相关值,y(k0)表示第一残差信号与第二残差信号的最大相关值,k0表示第一残差信号与第二残差信号的最大相关值对应的相位移动值,Km大于0。
可选地,在本发明实施例中,确定单元802具体用于:
判断确定出的最大相关值是否不小于预设相关值;
或,判断已确定出的最大相关值的总数是否满足预设数量。
可选地,在本发明实施例中,处理单元803具体用于:
判断第一能量参数是否大于第一预设能量阈值;
若是,确定需要进行分类加权处理;
若否,确定不需要进行分类加权处理。
可选地,在本发明实施例中,处理单元803具体用于:
根据各第二能量参数与第二预设能量阈值,确定子信号中的各声源对象的类型;
根据第一能量参数与第一预设能量阈值,确定不同类型的声源对象对应的权重;
根据确定出的子信号中的各声源对象的类型、以及不同类型的声源对象对应的权重,对子信号中的各声源对象分别进行加权处理。
可选地,在本发明实施例中,处理单元803具体用于:
在判断出第二能量参数小于第二预设能量阈值时,将第二能量参数小于第二预设能量阈值的声源对象确定为低能量声源对象;
在判断出第二能量参数不小于第二预设能量阈值时,将第二能量参数不小于第二预设能量阈值的声源对象确定为非低能量声源对象。
可选地,在本发明实施例中,处理单元803具体用于:
根据如下公式,确定非低能量声源对象对应的权重:
A=(N1/N2)1/2
其中,A表示非低能量声源对象对应的权重,N1表示第一预设能量阈值,N2表示第一能量参数;
根据如下规则,确定低能量声源对象对应的权重:
B=1;
或,B=(1+A)/2;
其中,B表示低能量声源对象对应的权重。
可选地,在本发明实施例中,第一预设能量阈值根据位于当前帧之前的全部帧的第一能量参数的平均值确定;
第二预设能量阈值是用户对声音的感知程度预先设置的。
基于同一发明构思,本发明实施例提供了一种计算机可读的非易失性存储介质,计算机可读的非易失性存储介质存储有计算机可执行指令,计算机可执行指令用于使计算执行上述音量调节的方法。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器,使得通过该计算机或其他可编程数据处理设备的处理器执行的指令可实现流程图中的一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种音量调节的方法,其特征在于,包括:
获取当前帧的音频信号,所述音频信号包括左声道信号和右声道信号;
确定当前帧的所述音频信号的第一能量参数;
根据当前帧的所述音频信号中包括的左声道信号和右声道信号,分别确定出多个子信号;
根据预设的相关性算法,确定每个所述子信号中包括的至少部分声源对象的第二能量参数;
在根据所述第一能量参数判断出需要进行分类加权处理时,根据所述第一能量参数和所述第二能量参数,确定所述子信号中的各所述声源对象的类型和不同类型对应的权重,并对各所述声源对象分别进行加权处理;
对加权处理后的所述子信号中的各所述声源对象进行整合处理后输出。
2.如权利要求1所述的方法,其特征在于,根据预设的相关性算法,确定每个所述子信号中包括的至少部分声源对象的第二能量参数,具体包括:
确定所述左声道信号和所述右声道信号中对应所述子信号中具有相同第一参数的第一相同信号,根据确定出的所述第一相同信号、以及所述左声道信号和所述右声道信号中对应所述子信号,确定第一残差信号和第二残差信号,并将所述第一相同信号确定为第一声源对象;其中,所述第一残差信号为:所述左声道信号的所述子信号中去除所述第一相同信号之后的信号,所述第二残差信号为:与所述左声道信号中的所述子信号对应的所述右声道信号中的所述子信号中去除所述第一相同信号之后的信号;所述第一参数包括信号的相位和幅值;
按照所述预设的相关性算法,确定所述第一残差信号和所述第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值;
根据确定出的所述最大相关值对应的相位移动值,对所述第一残差信号或所述第二残差信号进行相位移动,确定出具有相同相位的第二相同信号,根据所述第二相同信号,以及所述第一残差信号和所述第二残差信号,确定更新后的第一残差信号和更新后的第二残差信号,并将所述第二相同信号确定为第二声源对象;
根据确定出的所述最大相关值,判断是否满足预设的重复处理条件;
若是,继续按照所述预设的相关性算法,确定更新后的第一残差信号和更新后的第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值;
若否,确定所述第一声源对象和所述第二声源对象的第二能量参数。
3.如权利要求2所述的方法,其特征在于,按照所述预设的相关性算法,确定所述第一残差信号和所述第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值,具体包括:
根据如下公式,确定所述第一残差信号和所述第二残差信号的最大相关值,以及所述最大相关值对应的相位移动值:
Figure FDA0002183289490000021
[y(k0)]=max([y(k1),y(k2),.......,y(ki)]);
其中,n表示所述第一残差信号和所述第二残差信号中第n个采样点,N表示所述第一残差信号和所述第二残差信号的采样点数量,SDL(n)表示所述第一残差信号中第n个采样点对应的幅值,SDR(n+k)表示所述第二残差信号在移动k个相位后第n个采样点对应的幅值,Km表示相位可移动的最大值,y(ki)表示移动k个相位时所述第一残差信号与所述第二残差信号的相关值,y(k0)表示所述第一残差信号与所述第二残差信号的最大相关值,k0表示所述第一残差信号与所述第二残差信号的最大相关值对应的相位移动值,Km大于0。
4.如权利要求2所述的方法,其特征在于,根据确定出的所述最大相关值,判断是否满足预设的重复处理条件,具体包括:
判断确定出的所述最大相关值是否不小于预设相关值;
或,判断已确定出的所述最大相关值的总数是否满足预设数量。
5.如权利要求1所述的方法,其特征在于,根据所述第一能量参数,判断是否需要进行分类加权处理,具体包括:
判断所述第一能量参数是否大于第一预设能量阈值;
若是,确定需要进行分类加权处理;
若否,确定不需要进行分类加权处理。
6.如权利要求5所述的方法,其特征在于,在根据所述第一能量参数判断出需要进行分类加权处理时,根据所述第一能量参数和所述第二能量参数,确定各所述声源对象的类型和不同类型对应的权重,并对各所述声源对象分别进行加权处理,具体包括:
根据各所述第二能量参数与第二预设能量阈值,确定所述子信号中的各所述声源对象的类型;
根据所述第一能量参数与所述第一预设能量阈值,确定不同类型的声源对象对应的权重;
根据确定出的所述子信号中的各所述声源对象的类型、以及不同类型的声源对象对应的权重,对所述子信号中的各所述声源对象分别进行加权处理。
7.如权利要求6所述的方法,其特征在于,根据各所述第二能量参数与第二预设能量阈值,确定所述子信号中的各所述声源对象的类型,具体包括:
在判断出所述第二能量参数小于所述第二预设能量阈值时,将所述第二能量参数小于所述第二预设能量阈值的所述声源对象确定为低能量声源对象;
在判断出所述第二能量参数不小于所述第二预设能量阈值时,将所述第二能量参数不小于所述第二预设能量阈值的所述声源对象确定为非低能量声源对象。
8.如权利要求7所述的方法,其特征在于,根据所述第一能量参数与所述第一预设能量阈值,确定不同类型的声源对象对应的权重,具体包括:
根据如下公式,确定所述非低能量声源对象对应的权重:
A=(N1/N2)1/2
其中,A表示所述非低能量声源对象对应的权重,N1表示所述第一预设能量阈值,N2表示所述第一能量参数;
根据如下规则,确定所述低能量声源对象对应的权重:
B=1;
或,B=(1+A)/2;
其中,B表示所述低能量声源对象对应的权重。
9.如权利要求6所述的方法,其特征在于,所述第一预设能量阈值根据位于当前帧之前的全部帧的第一能量参数的平均值确定;
所述第二预设能量阈值是用户对声音的感知程度预先设置的。
10.一种显示装置,包括扬声器,其特征在于,还包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的所述程序指令,按照获得的程序执行:
获取当前帧的音频信号,所述音频信号包括左声道信号和右声道信号;
确定当前帧的所述音频信号的第一能量参数;
根据当前帧的所述音频信号中包括的左声道信号和右声道信号,分别确定出多个子信号;
根据预设的相关性算法,确定每个所述子信号中包括的至少部分声源对象的第二能量参数;
在根据所述第一能量参数判断出需要进行分类加权处理时,根据所述第一能量参数和所述第二能量参数,确定各所述声源对象的类型和不同类型对应的权重,并对各所述声源对象分别进行加权处理;
对加权处理后的所述子信号中的各所述声源对象进行整合处理后输出至所述扬声器。
CN201910804664.6A 2019-08-28 2019-08-28 一种音量调节的方法及显示装置 Active CN112449236B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910804664.6A CN112449236B (zh) 2019-08-28 2019-08-28 一种音量调节的方法及显示装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910804664.6A CN112449236B (zh) 2019-08-28 2019-08-28 一种音量调节的方法及显示装置

Publications (2)

Publication Number Publication Date
CN112449236A true CN112449236A (zh) 2021-03-05
CN112449236B CN112449236B (zh) 2023-03-24

Family

ID=74741744

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910804664.6A Active CN112449236B (zh) 2019-08-28 2019-08-28 一种音量调节的方法及显示装置

Country Status (1)

Country Link
CN (1) CN112449236B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007018293A1 (ja) * 2005-08-11 2007-02-15 Asahi Kasei Kabushiki Kaisha 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
CN103684302A (zh) * 2012-09-12 2014-03-26 国基电子(上海)有限公司 音量控制装置及方法
US20170309289A1 (en) * 2016-04-26 2017-10-26 Nokia Technologies Oy Methods, apparatuses and computer programs relating to modification of a characteristic associated with a separated audio signal
CN109495649A (zh) * 2018-12-14 2019-03-19 深圳市沃特沃德股份有限公司 音量调节方法、系统及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007018293A1 (ja) * 2005-08-11 2007-02-15 Asahi Kasei Kabushiki Kaisha 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム
CN103684302A (zh) * 2012-09-12 2014-03-26 国基电子(上海)有限公司 音量控制装置及方法
US20170309289A1 (en) * 2016-04-26 2017-10-26 Nokia Technologies Oy Methods, apparatuses and computer programs relating to modification of a characteristic associated with a separated audio signal
CN109495649A (zh) * 2018-12-14 2019-03-19 深圳市沃特沃德股份有限公司 音量调节方法、系统及存储介质

Also Published As

Publication number Publication date
CN112449236B (zh) 2023-03-24

Similar Documents

Publication Publication Date Title
KR101387195B1 (ko) 오디오 신호의 공간 추출 시스템
US7672466B2 (en) Audio signal processing apparatus and method for the same
US10242692B2 (en) Audio coherence enhancement by controlling time variant weighting factors for decorrelated signals
US7650000B2 (en) Audio device and playback program for the same
TWI492640B (zh) 將一個具有數個麥克風的拾音器的麥克風信號混波的方法與裝置
EP2252083A1 (en) Signal processing apparatus
US8635077B2 (en) Apparatus and method for expanding/compressing audio signal
US9628907B2 (en) Audio device and method having bypass function for effect change
CN112449236B (zh) 一种音量调节的方法及显示装置
JP3888239B2 (ja) デジタル音声処理方法及び装置、並びにコンピュータプログラム
JP2001296894A (ja) 音声処理装置および音声処理方法
Rämö et al. Graphic delay equalizer
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP2004343590A (ja) ステレオ音響信号処理方法、装置、プログラムおよび記憶媒体
KR101745019B1 (ko) 오디오 시스템 및 그 제어방법
JP2008124848A (ja) オーディオ再生装置
WO2022018864A1 (ja) 音データ処理装置、音データ処理方法及び音データ処理プログラム
JPH05161198A (ja) 音楽音声処理装置
JP2002262385A (ja) 音像定位信号の生成方法、及び音像定位信号生成装置
JPH01223895A (ja) 音響再生装置
JP5998357B2 (ja) 車載用音響再生装置
JPH09130899A (ja) レベル調整装置
JP2023012347A (ja) 音響装置および音響制御方法
JP4471159B2 (ja) 音声処理装置
JP2000333299A (ja) サラウンド音響信号生成装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant