CN103210668B - 用于多通道音频再生的向上混合方法及系统 - Google Patents

用于多通道音频再生的向上混合方法及系统 Download PDF

Info

Publication number
CN103210668B
CN103210668B CN201080068956.5A CN201080068956A CN103210668B CN 103210668 B CN103210668 B CN 103210668B CN 201080068956 A CN201080068956 A CN 201080068956A CN 103210668 B CN103210668 B CN 103210668B
Authority
CN
China
Prior art keywords
signal
assembly
produce
audio
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080068956.5A
Other languages
English (en)
Other versions
CN103210668A (zh
Inventor
约翰·亚瑟
安东尼奥·马特奥斯索尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Publication of CN103210668A publication Critical patent/CN103210668A/zh
Application granted granted Critical
Publication of CN103210668B publication Critical patent/CN103210668B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/05Generation or adaptation of centre channel in multi-channel audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/07Generation or adaptation of the Low Frequency Effect [LFE] channel, e.g. distribution or signal processing

Abstract

一个音频信号增强装置以及增强立体声信号的一个对应方法被提供来产生以及增强具有改进的空间声音影像质量的信号,用于将一立体声输入信号做向上混合。当该装置与一中心声道处理器或LFE处理器组合使用,一个改进的输入信号的处理程序被提供且产生最终的中心声道以及至少一个LFE重低音声道,其中,背景技术里的一些问题与缺点可因此得到解决。结果是一个中心与LFE信号包含一个稳定的,非时间模糊的高质量精确自然声音影像。这些优点特别被实现于对于时间延迟或相位平移的立体声输入信号,不论其为矩阵编码或是非矩阵编码的输入信号。

Description

用于多通道音频再生的向上混合方法及系统
技术领域
本发明一般而言涉及音频信号处理,更具体而言,为一种新颖的且进步的音频向上混合器和向上混合立体声音频通道的方法。
背景技术
目前的音频应用已经由标准的双声道立体声音频录放系统发展至更复杂的系统,且通过一些扬声器能达成多个不同的效果并提供多个不同的感觉。不仅扬声器的数目增加,而且每个扬声器功能的数目也增加,具有不同的特性,使得这些年来产生越来越多不同的专业国内扬声器系统。
这些多声道的实现也发展到包括“环绕声”的效果。目前,这样的环绕声扬声器的音频系统已被应用在剧院,音乐演奏厅,汽车,国内的影院和计算机系统,或其他类似的地方。然而,这些实现通常包括各种各样的独立的全范围扬声器和重低音扬声器,每种扬声器都有其声音特性和输入/输出响应。
此外,也有各种各样的类型的音频信号被重现,例如音乐,电影原声音乐或声音来源均经过处理。然而,为了提供最佳的混合输入信号给特定的扬声器配置需要费力且熟练的手动信号处理操作,包括过滤和混合的熟练技术人员。
音频向上混合,或向上混合器等系统中已经提出了为了有效地向上混合N个原始音频信号分成M个向上混合过的音频信号,其中M>N。例如,系统存在且其生成至少两个环绕音频声道。其他的背景技术系统产生两个环绕音频声道检测硬产物来源并确保语音信号将始终位于前方声道即使它们只存在于一个输入声道。
更常见的是,用于家庭或专业影院系统的向上混合系统通常被配置为产生3个前置扬声器信号,2个环绕声信号,以及一个低频效果(LFE),或是重低音信号来驱动一个重低音扬声器,如图1所示。该3个前置扬声器信号通常是被用于输出所有的声音类型,包括语音,该2个环绕声信号用来产生环境声音且该LFE重低音信号被用于产生低频率的特殊效果。这种组合导致了一增强效果的经验给最终用户由于不同的声音组成被产生于不同的扬声器。特别是,声音图像被增强了,因为声音图像在聆听时产生在周围,与重现于两个前置扬声器相比,给人一种更自然的包覆感。
这些系统通常包括音频矩阵编码和解码操作。矩阵译码是一种自适应或非自适应音频向上混合,其中,一数量较多的音频信号(例如,6个信号对于一个5.1的系统)是由一个较少的输出信号(通常为2个)解码得到的。然而,系统包括非矩阵编码和解码也是存在的。
这些现有技术系统的一个缺点是显而易见的,当输入信号包含由使用相位影响产生的音频,例如作为一个低频率分量180度的相位在一个输入通道相对于另一相位的分量,被用来输入至向上混合器。这种倒相混合是一种很常见的使用于音乐和电影音效制作的音频技术且提供了广泛的空间意象。这些反相输入信号通常是累加的,并且由于外部相位信号之间的相互抵消,没有LFE信号的产生。因此,所需的重低音效果没有被实现。
现有系统的另一个缺点是,声音组成最初只存在于一个输入声道被产生作为输出且也是在中心声道因此产生一个的非现实的输出声音图像。例如,考虑一个音乐的音频信号对应于一个被录音的乐器信号只存在于左输入通到。如果向上混合的中心声道通过将左输入及右输入声道相加所产生,则此向上混合的中心声道也将包含被录音的乐器信号。这是一种不希望被产生的效果,因为它应该只被视为在左边当试音:亦即,试音的向上混合信号的空间声音影像质量将会很差。
其他的实现产生一个中央声道向上混合信号处理,然而他们都是有意构造成使得外部相位信号在输出时不会互相抵消,最终会存在向上混合的中心声道。然而这样的设计是次优的,在该外部相位声音通常被打算作为特殊的声音效果,是从环绕扬声器输出,或从LFE扬声器,但不是从中心声道。因为意图的特殊效果声音不打算从中央声道发射,结果会产生一个降级的原音重现。
音频信号处理设备需要考虑到的另一个效果是时间模糊。这是很常见的音乐录音,语音录音,从生活会议,或与现场对话,在电影和电视中,使用多个麦克风来收音。每个麦克风通常是位于房间内的不同角落。在这种情况下,较靠近的麦克风所录制的声音会较其他麦克风的信号包含音频产生时间延迟的效果,由于声音抵达最靠近的麦克风会较比抵达其他麦克风来得快。这种效应被称为时间延迟平移或时间模糊。当这样的信号被相加,或当这两个或其中一个信号被放大后再行将其相加,则得到的相加信号会包含有一时间模糊的信号,或一个暂时被模糊的影像,这会导致声音质量的降低,另一部分会产生外部声音相位的产物。这种效应可以被容易地理解,如果被记录的信号是一简单的“咔嗒”的声音。由于咔嗒声会先到达一个声道,那么如果一个非零的增益被应用到一个或两个声道且其结果是相加的,则会有两个咔嗒声会出现在所得的相加声道。这仍会导致一个不好的原音影像重现。
因此,现有技术的音频向上混合系统,其中的两个声道的音频材料包括时间延迟平移录音具有至少部分地的这些缺点,其中,原音并没有被重现,且特殊效果的重现没有被最佳地达成,或特殊效果是在错误的扬声器重现。这些缺点会导致给予聆听者一个整体的不自然的聆听体验。
发明内容
因此,本发明的一个目的是提供一种解决方案给上面提到的问题。特别是,本发明的目的是提供一种音频向上混合器以实现一种改进的前声音影像。
根据一个观点,本发明的增强的移动设备的音频信号,和相应的增强立体声信号的方法,被提供来产生具有改进的空间声音图像质量的一个增强的信号。当与中心声道处理器或低频效果重低音LFE处理器组合使用,一个改进的输入信号处理过程被提供以产生最终中心声道以及至少一个LFE重低音声道且背景技术中的缺点与问题以被解决。其结果是,中心声道和LFE信号包含一个稳定的,非时间模糊图像与高质量的自然声音精确度。这些优势特别是对于实现时间延迟或相位平移立体声输入信号,不论它们是否是矩阵编码或非矩阵编码的输入信号。
因此,在这种新颖的处理系统和一对音频信号的重现配置会自动地向上混合以最佳重现,经由3,或5或7个全范围扬声器至少与一个,甚至高达三个重低音信号的组合。本发明的向上混合方法是专为高质量且低延时的音频信号处理语音,音乐和电影原声音频信号源。
根据本发明的一个观点,一个音频信号增强装置是被定义用于增强一个立体声输入信号,它包括两个音频信号以产生至少一个增强信号。
根据本发明的另一个观点,增强立体声输入信号的一个方法被提供用来产生至少一个增强的信号。
根据本发明的另一个观点,中心声道生成装置,和相应的方法被提供用于产生一个中心声道信号从一个立体声输入信号包括两个音频信号的输入信号。
根据本发明的另一个观点,一个低频效果LFE重低音信号产生装置,和相应的方法被提供,用于从一包含两个音频信号的立体声输入信号产生一个重低音信号。
根据本发明的另一个观点,音频信号向上混合器,和一个相应的方法被提供,用于从一包含两个音频信号的立体声输入信号产生至少三个输出音频信号。
根据本发明的另一个观点,一种计算机程序,和一个实现该计算基程序的计算机可读介质被提供,用于执行本发明的不同观点以及不同实施例的不同功能。
本发明提供的方法和装置可实现于各个观点,实施例中,和本发明的特征,并通过各种方式实施。例如,这些技术可以被实施在硬件,软件,固件,或它们的组合。
对于硬件实现,处理单元可以被实现在一个或多个应用程序专用集成电路(ASIC),数字信号处理器(DSP)的数字信号处理装置(DSPD),可编程逻辑器件(PLD)的,可编程门阵列(FPGA),处理器,控制器,微控制器,微处理器,设计来执行本文所描述的所述功能的其它电子单元,或它们的组合。
对于软件实现,各种装置可包括执行本文中所描述的功能的模块(例如,过程,函数,等等)。软件代码可以被储存在一记忆单元中并且由处理器执行。该记忆单元可以被实现在处理器内部或处理器外部。
以下说明各个不同的观点,配置和本发明的实施例。特别是本发明提供的方法,装置,系统,处理器,程序代码,以及其他实现各个观点的装置和零件,本发明的配置和特征等,如下所述。
附图说明
本发明的特征和优点从下述的配合附图的详细描述中将变得更显而易见。其中类似的附图标记可与不同附图中的相应零件做辨识。相应的组件也可以是使用不同的附图标记。
图1A表示出了背景技术中的向上混合配置结构与2个输入声道和6个输出声道,输出声道或5.1输出声道,其通常也为已知的技术。
图1B表示出了背景技术中的前声道处理器的细节。
图2A表示出了本发明的一个实施例,包含由两个音频信号产生至少一个增强信号的音频增强装置的细节。
图2B表示了本发明的另一个实施例,包含用于产生一中心声道信号的前声道处理器的细节。
图2C表示了本发明的另一个实施例,包含了用于产生至少一个,或最佳地三个重低音信号的前声道处理器的细节。
图2D表示了本发明的另一个实施例,包含产生一中心声道信号以及至少一个或可选择地三个重低音信号的前声道处理器的细节。
图3表示了本发明的另一个观点,包含中央处理器以及控制处理器的细节。
图4是根据本发明一个观点,用来产生中央信号的方法的流程图。
图5表示了本发明的另一个观点,包含用于产生中心声道信号的前声道处理器的细节。
图6表示了根据本发明的一个观点的一中心声道的加权曲线。
图7是根据本发明的一观点,产生一中心声道信号的方法的流程图。
图8表示了本发明的另一观点,包含用于产生至少一个低频效果的重低音信号的前声道处理器的细节。
图9是根据本发明的一个观点,产生至少一个低频效果的重低音信号的方法的流程图。
具体实施方式
下列的词语“低频效应”和“重低音”可被一起或互换使用,因为它们都指向相同的特征,并且可以是概括为“LFE”。因此向上混合输出信号可以表示为低频信号或声道,LFE信号或声道,重低音信号或声道,LFE重低音信号或声道,或低频效果LFE重低音信号或声道,或是其它的组合方式。
从以下的说明中,本领域技术人员应当理解,虽然本发明的任何一个最佳的方面已经针对背景技术的至少一些装置的问题及方法提供了解决方案,在此处所揭露的多重观点的组合与背景技术相比产生了额外的协同有利效果,将被详细地描述如下。
图1A表示出了背景技术的一个5.1向上混合扬声器系统的配置的简单示意图,其中,所述两个原始左和右输入音频信号Lo102,Ro104被向上混合为6个新的信号。前声道处理器106除其他组件,包含了一个中心声道处理器122和一个LFE声道处理器124,用于分别产生中心声道信号112和重低音信号108,进一步的细节如图1B所示。因此,前声道处理器106处理该第一输入信号102和该第二输入信号104以得到至少四个输出信号,包括一个左边信号110,一个中心信号112,一的右边信号114,和一个低频效果音频信号LFE108,或称做重低音音频信号。
进一步的声道产生,其中,高达至少十个声道的产生可能是来自两个输入信号的向上混合,也可设想为使用本发明的新颖结构。由于本发明的目的之一是要改善中心声道和LFE声道处理的质量,本发明所教导之处可应用于任何配置,其中,至少3个输出信号被产生,只要至少一个中心通道或一个LFE声道也产生除了左和右输出信号。
一个后置声道处理器116产生一对音频信号Ls118和Rs120可由后“环绕”扬声器再现。由于本发明并不涉及改善背景技术系统的环绕声方面,本揭露不进一步详细解释该后声道处理器,或后方声道。那些本领域技术人员将可认识到,一个可行的环绕声扬声器的音频系统包括相关结构的零件的适当组合,机械系统,硬件,固件和软件,用于支持环绕声系统的功能和操作。
正如所提到的,图1A与图1B的配置遭遇到了问题,该些问题为背景技术的前声道处理器,或处理器当被实现作为多零件以被配置为产生一个时间模糊的中心声道信号且因此外部相位组成互相抵消成没有,或非常小,有意义的LFE音频信号被产生于重低音扬声器的输出端。因此,原信号是由背景技术中的音频处理所降级,产生一种不舒服的终端用户体验。
本发明通过提出一个前声道处理器解决了现有技术中的问题,该前声道处理器包括一种新的音频信号增强装置,作为一个中间阶段,共同的中心声道和LFE声道处理,用于产生增强的中间信号。这些增强的信号被产生,同时考虑到共同的声音组件之间的输入信号,作为自适应滤波器和延时线的配置,连同增益和滤波器系数的动态设置,可以使用允许的输入信号的相关组件和调整,根据所期望的效果。换句话说,加强装置混合只有最响亮的水平(“水平”在这里适用相对电压的大小,例如,dBV中的水平)的两个滤波的信号,因此外部相位信号不会被抵销,并且所得到的输出声道的水平正比于原始输入信号中的原始低频含量。这个部分的实现是通过选定一对最佳的过滤器,用于过滤两个输入信号,使得到该两信号相加时,得到的信号将不包含时间模糊且主要成分的水平(在给定频率)在两个信号中是相等的。
该音频信号增强装置,当与一中心声道处理器一起使用时,会导致中心声道音频信号没有任何时间模糊且接近地伴随着该输入信号的水平并精准的重现该原声影像。正如所提到的,自适应滤波器将输入信号成分中的相位与强度大小做校准以至于当该被未被过滤的信号相加时,总结出的信号是用最少的时间模糊产物和含有高比例的相关成分对比于不相关的成分。
该音频信号增强装置,当与一LFE声道处理器一起使用时,会产生一重低音音频信号,其中,因为两个过滤信号中只有最响亮的那个被输出,外部相位信号不会被抵销且所得的输出声道的水平正比于原输入信号中的原低频含量。
因此,增强的装置,当在与一个中心声道处理器或LFE处理器组合使用时,会产生增强的中心频道信号与LFE信号并解决背景技术中的问题。特别是,该中心与LFE信号包含一稳定的,非时间模糊的具有高质量且精确的自然声音影像。
根据在本发明的一个观点,一个前声道处理器106包括一个音频信号增强装置201,如图2A所示。增强装置201包括一个中间处理器202和一个控制处理器203。该中间处理器202在与控制处理器203一起使用的同时,处理该第一输入信号102和该第二输入信号104,以得到至少一个增强信号204a至204c。
根据本发明的一个实施例中,如图2B所示,该前声道处理器106包括音频信号增强装置201与一中心声道处理器205的组合。至少一个增强的信号204可以被中心声道处理器205进一步的处理以产生一个中心声道输出信号206。
根据本发明的另一个实施例中,如图2C所示,该前声道处理器106包括音频信号增强装置201与一个LFE处理器207的组合。至少一个增强的信号204可以被该LFE处理器207进一步的处理以产生一个重低音信号208c。可选择地,这些多个增强信号204也可被该LFE处理器207进一步的处理以产生至少三个输出信号,一个第一LFE信号208a,一个第二LFE信号208b,以及一个第三LFE信号208c。
根据本发明的另一个实施例中,如图2D所示,该前声道处理器106包含该音频信号增强装置201与一个中心声道处理器205及一个LFE处理器207的组合。至少一个增强信号204可被该LFE处理器207进一步处理以产生一个中心声道信号206以及一个重低音信号208c,或多个重低音信号208a,208b以及208c。
这将是显而易见的,该决定的数量和类型的输出信号是可配置的。设备制造商,或最终用户,可决定,根据特定的环境,其中,本发明的该向上混合系统将会被实现,不论一个中心声道产生与否,或是不论一个LFE声道产生与否,以及不论是只有一个LFE声道或多个LFE声道。因此,该创新的增强装置201实现了高质量的非时间模糊的中心声道和至少一个高质量的特殊效果LFE声道来产生具有稳定高质量的重低音效果的精确原始输入信号。
这也将是显而易见的,在中间处理器202和控制处理器203可以是单独的组件,或可以形成一个单独的处理器的一部分。该控制处理器也可以是专用处理器,用于控制产生该增强的中心以及LFE声道的必要操作,或者它可以是一个更广泛的向上混合系统的一般目的处理器的一部分,它具有分配给它的任务控制所必需的操作,用于产生改进的中心和LFE声道。
本发明提供的方法和装置实现各个方面,实施例,和本发明的特征,并通过各种方式实施。例如,这些技术可以被实施在硬件,软件,固件,或它们的组合。各种不同的装置,或配置用来执行本发明的特征,可被实施为组件,模块,装置或系统。例如,以一个组成部分为例,可以在一处理器上实现运行的进程,一个处理器,一个对象,一个可执行程序,一个执行线程,一个程序,和/或计算机。通过举例的方式,同时运行的应用程序在计算设备和计算设备都可以是部件。一个或多个组件可以驻留在一个过程和/或线程的执行和一个组件可以位于一计算机和/或分布在两个或多个计算机之间。此外,这些组件可以从各种计算机可读介质执行,具有各种数据结构储存在其上。根据一些方面,储存器可以被配置保留且一个处理器可以被配置为执行有关本发明的方法步骤及功能的指令。
图3中进一步根据本发明的一个方面详细地表示出了音频信号增强装置201。正如先前面图2A所描述的,该增强装置201包括一个中间处理器202和一个控制处理器203。中间处理器202包含了一个交换通话阶段301,其中该第一输入信号102的一部分被以一个增益系数gC1加权并与该二输入信号104组合以生成一个第三信号302。同样地,该第二输入信号104的一部分被以一个增益系数gC2加权并与该第一输入信号102组合以生成一个第四信号304。交换通话后,两个平行的处理线被打开了,每一个处理线包含两个处理分支。该第一处理线包括一个第一处理分支包括部件318和一个第二处理分支包含部件306和310。同样地,第二处理线包括一个第一处理分支包括部件320和一个第二处理分支包括部件308和312。
延续中间处理器202的解释,第三信号302由增益系数gD1306所加权并在延迟线310中延迟以产生一个第一延迟信号314。同样地,第四信号304由增益系数gD2308所加权并在延迟线312中延迟以产生一个第二延迟信号316。与延迟线的操作平行,第三信号302及第四信号304被一个第一自适应滤波器318以及第二自适应滤波器320所分别过滤以分别产生一个第一是适应信号322以及一个第二适应信号324。随后,第一适应信号322是与该第二延迟信号316在组合器326相结合,以产生第一相加信号340。同样地,第二适应信号324与该第一延迟信号314在组合器328相结合以产生第二相加信号342。最后,第一相加信号340和第二相加信号342分别由增益系数g1以及g2所加权,从而分别产生第一增强信号346a和第二增强信号346b。第一和第二增强信号接着在组合器344被结合并产生增强信号346c。这些增强的信号346中的至少一个用作输入到中心声道处理器205和/或LFE声道处理器207,根据最终的配置或执行。
组合器326,328和344,也被称为加权求和单元,执行一个加权求和运算,其中与输出信号O相关的两个输入信号A与B的关系可由表达式O=x(A)+y(B)表达,其中x和y是增益系数,或者权重,用于改变每个输入信号的分布,通过与输入信号A和B做乘法运算后相加。在向量的情况中,这将是一个向量点积运算。
图3也表示出控制处理器203,它是与中间处理器202的各种模块间通信并执行各种分析,监控,控制以及参数设定操作当它使用各种信号的分析结果以达成不同的有利效果。控制处理器203分析原始输入信号102或104中的至少一个,至少一个的自适应过滤器的向量AF_LS或AF_RS从第一自适应滤波器318或第二自适应滤波器320,或至少从求和单元326与328中的第一相加和第二相加信号之一。它随后使用这些结果设置不同的系数,在他们之中,增益系数gC1和gC2用于交换通话阶段,该增益系数gD1与gD2在延迟线上,该自适应滤波器系数,或该增益系数g1与g2。
在一个观点中,该中间处理器202的交换通话阶段中的增益系数gC1和gC2被设置在一个第一步骤由控制处理器203控制多少一个信号被增加到另外一个以维持原始信号的精确度。为了注重于原始声音的影像,控制处理器决定了每一个输入信号的相位与强度大小,并设定相应的增益系数,最终的聆听者将会有一个自然的聆听体验。
在本发明的一配置中,gC1和gC2的值决定了交换通话的增加程度,是依赖于输入信号相关性的水平或输入信号间的水平差异(“水平”,在这里适用相对电压的大小,例如dBV中的水平)。两个信号之间的相关性可被测量作为两个输入信号间的平均交换相关性缓冲器,或作为一个给定的最大延迟值,例如,±100毫秒。
在其它的配置中,该相关性可由该自适应滤波器选定的系数所消去。也就是说,输入信号实质地不相关于自适应滤波器(例如,以一个给定滤波器频率向量)的例子中将会是0。
在其它的配置中,gC1与gC2被增加至一个最大值(例如,-5dB),当该输入信号高度非相关(例如,正在运行的相关系介于-0.1与0.1之间),或当有一个巨大的内声道水平差异,例如,一个大于15dB的绝对水平差异。
在其它配置中,gC1与gC2对于高度相关性的信号而言等于一个-30dB的近似值(例如,当运行中的相关性绝对值在0.9以上),或当内声道水平差异为小,例如,一个少于5dB的绝对水平差异。
在一个配置中,该延迟线gD1与gD2的增益系数被控制处理器203所设置以控制相关性信号对于非相关性信号的比值。如先前所提到的,增益gD1306的值可以是相同于或不同于增益gD2308取决于中间输出信号346所需求的特性。这些增益的强度大小对于原始输入信号的影响程度会与平行的自适应滤波器线所过滤过的信号相加。因为原始信号的非相关信息被与已经被自适应滤波器所放大过的原始信号的相关成分所混合,该增益对于相关性信息对非相关性信息的比例有着控制的作用且可出现在中间处理器的输出端。在一个第一步骤中,相关性的程度会被确认,且在第二个步骤中,该增益与自适应滤波器的系数会接着被控制处理器203所设置以至于该延迟信号与该被过滤的信号会立即的相匹配。
相应地,若该增益有单一性,则该求和单元326或328的输出水平将会近似于+6dB对于高相关性的信号组成(也就是说,该组成为高度相关于输入声道Lo102以及Ro104),但少于非相关组成(由于随机相位相抵销)。在一实施例中,增益306与308是相同的且延迟线310,312均用于相同的延迟。
在其它的观点中,该控制处理器203更新该自适应滤波器的系数以便于将不同输出信号的水平以及输出与输入信号间的相关性做最小化。无论是最小均方算法LMS或其验证算法,例如标准化的LMS算法NLMS,可被用在此目的。在频率频谱上实行该NLMS具有计算较不复杂的优点,然而,其也可以被实行于时间频谱上。
使用该NLMS算法更新该自适应滤波器的步骤以产生第一或第二适应信号322或324的其中一个将在现在被描述。一个第一输入信号x(n)的旋积(也就是说,该信号在交换通话后会被增加,例如信号302)具有一个M长度的自适应滤波器h(例如,自适应滤波器318)给定一信号
y ^ ( n ) = Σ k = 0 M - 1 x ( n - k ) h k
= x T ( n ) h . - - - ( 1 )
其中
x(n)=[x(n),x(n-1),...,x(n-M+1)]T.
h=[h0,h1,...,hM-1]T.
此被过滤的信号近似于非过滤的信号。该延迟的输入音频信号y(n)(如范例,信号302)接着被由该过滤的信号所减去以得到该错误信号e(n)(例如,输出信号322):
e ( n ) = y ( n ) - y ^ ( n ) . - - - ( 2 )
该自适应滤波器随着时间被调整以便于减少错误信号的水平。这个目标正式表示作为一个“性能指针”或“成本”定标器J,其中,给定一个滤波器向量h:
J(h)=E{e2(n)}.
(3)
且E{·}是统计期望算子。该算法是需要被用来决定运算状况其中J为其最小值。这个自适应滤波器的状态被称为“优化状态”。当一个滤波器在该优化状态,错误信号的水平(此为J)相对于滤波器系数h的改变比例将被最小化。此改变比例(或称梯度算子)是一个长度为M的向量r,并将其实施在成本函数J,如下所示:
▿ J ( h ) = ∂ J ( h ) ∂ h ( n ) . - - - ( 4 )
最后方程序右手边是以根据来自方程式(3)的错误信号e(n)而使用偏导数展开:
∂ J ( h ) ∂ h ( n ) = 2 E { ∂ e ( n ) ∂ h ( n ) e ( n ) } . - - - ( 5 )
通过乘以一恒量常数的负的梯度运算来完成该滤波器向量h从时间取样(n-1)到时间(n)的更新且该滤波器更新(最速下降梯度算法)为:
h ( n ) = h ( n - 1 ) + α δ + x T ( n ) x ( n ) x ( n ) e ( n ) - - - ( 6 )
且0<α<2。
其中当该输入信号的功率估测太低(此更新版本为归一化LMS算法)时,delta是一正规化常数以确保应付计算误差。此外实现频域上(重复一次需要5个FFT;如每M输入取样)该滤波器-更新及信号滤波在计算效率的大幅增加,该频域与时域NLMS算法的效能是相等的。在一实施例中,该重迭保留法可使用二个或四个重迭因子。在该滤波器更新中,该时域限制(当M少于实际脉冲响应的长度时以确保应付环绕式误差)能有效的以便压迫新的系数少于稍早的一个;一种变型为“指数步阶”算法。此确保该脉冲响应的指数衰退。
在一配置当中,例如当一中心通道信号产生,增益系数g1及g2可通过该控制处理器203设定成一单一性的数值。在此配置中,提供相同比例的该第一及第二增强信号给该第三组合器。
在一配置中,例如当LFE低音信号产生时,增益系数g1及g2可通过该控制处理器203。在一实施例中,其中该控制处理器203分析该输入信号102及104,当该第一输入信号级数大于该第二输入信号级数(反之亦然)为了放大该增强信号最强的时,增益系数g1设定成一较大数值以及增益系数g2为一较低数值。在另一实施例中,其中该控制处理器203分析该适应性滤波器的输出,当该适应性滤波器的相对相位相差超过一预订量时,例如,10度相位角,增益系数g1设定成一较大数值以及增益系数g2为一较低数值。此配置通过保持该相位差异在一预定范围内以防止该增强信号之间的失真及时间模糊。
在另一配置中,g1及g2设定成相同数值,例如0.5,但是修改至少一适应性滤波器以便该二个滤波器的相对相位相等。这可以实现无论是修改该滤波器阀门以便一滤波器的虚分量改变以便匹配其他滤波器,或通过平均两滤波器相位,或通过一时域操作,藉以该时域滤波器的相位改变。因此,该适应性滤波器的群组延迟将可以修改,这样该第一340及第二342可相加信号在相加器344的输入之处是时间调准的,从而产生一非时间模糊的中间输出信号346。
在另一配置中,该控制处理器包含决定该控制处理器改变状态的点的逻辑,例如,从具有一最高信号级数的该第一相加信号的一第一状态到具有该最高信号级数的该第二相加信号的一第二状态。在状态转换之间,有该控制处理器缓慢改变该二增益系数g1及g2的增益的好处,在这样的时间常数下,它花费500ms从一相加信号离开到另一个。这种渐进式调整可以平稳的调整不同声道的声音组合,在没有中断终端用户的听觉体验以及减少任何失真作品,由于快速改变增益。
在另一配置中,该控制逻辑包含一滞后系统以在该控制逻辑改变状态时限制最小时间间隔,在一实施例中是500ms,正如图9中的该处理器900,将参照本发明的较佳实施例进一步详细解释。
因此,中间处理器202和控制处理器203的组合产生各种优点通过考虑输入信号之间的共同声音成分以产生增强的中间信号,以作为适应性滤波器和延迟线的结构,连同增益系数的动态设定,允许输入信号的相关成分根据所需的效果被利用及调谐。换句话说,该增强设备混合只有两个滤波信号最响亮的级数(“级数”在这里适用的相对电压的大小,例如,以dBV水平)以使外部相位信号不被删除,并且所得到的输出通道的级数是正比于原始输入信号中的原始低频内容。通过决定最佳的滤波器对以用于过滤两个输入信号,以使所得到的信号相加,将不包含时间混淆和主导组件的(在给定频率)在两个信号相等时,以部分的实现。
图4指出的程序400的一个实施例以根据本发明用于产生一个增强信号204。程序400被表示为功能块,其可以通过各种方式实施。例如,这些技术可以被实施在硬件,软件,固件,或它们的组合。左栏中的功能块可被考虑为一第一平行的处理线,而右侧列中的功能块可被考虑为一第二平行处理线。
最初二原始输入信号102,104对应于分别由区块402和区块403接收的一第一和第二声音信号。该二原始输入信号是每一个分别由一个串音阶段处理的,在区块404和405,组合部分该第二信号104到该第一信号102,以产生一第一串音信号302,以及组合部分的第一信号102到该第二信号104以产生一第二串音信号304,其中的串音成分的级数由增益系数gC1和gC2决定,其中gC1<1及gC2<1。
串音阶段404和405之后,该第一串音信号302被修改,在区块406中,具有增益gD1306(其中,增益gD1可以等于零和一之间的任何值)和延迟,在区块408中,具有一第一延迟单元310,其在本发明的一个实施例中是延迟等于10ms,以产生一第一延迟信号314。同样地,该第二串音信号304被修改,在区块407中,具有增益gD2308和延迟,在区块409中,具有第二延迟单元312,以产生一第二延迟信号316。
在平行的增益和延迟操作上,该第一串音信号302是被过滤的,在区块410中,使用一第一适应性滤波器318,以产生一第一适应信号322以及该第二串音信号304是被过滤的,在区块411中,使用一第二适应性滤波器320以产生一第二适应信号324。
在该第一组合器326中,该第一适应信号322是被组合的,在区块412中,具有该第二延迟信号316,以产生一第一相加信号340。如果增益gD2被设定为零,然后加法单元326直接从滤波器318通过该信号。同样地,在该第二组合器328中,该第二适应信号324是被组合的,在区块413中,具有该第一延迟信号314,以产生一第二相加信号342。同样地,如果增益gD1被设定为零,然后加法单元328直接从滤波器320通过该信号。
接着,在区块414中一第一增益系数g1被提供到该第一相加信号340以产生第一增强的信号420a。同样在区块415中一第二增益系数g2被提供到该第二相加信号342以产生一第二增强的信号420b。这些增强的信号最终在组合器344组合,以产生一第三增强信号420C。这些增强信号被使用在由中心通道处理器205和LFE通道处理器207组合,来实现本发明的向上混合输出信号。此时,如前面所解释的,该第一318和第二320适应性滤波器的滤波器系数也被更新。
因此,程序400产生至少一增强信号420,使高质量的非时间混淆中心通道和至少一个高质量特殊效果LFE通道产生关于稳定高质量低音效果增强的原始输入信号的保真度。在此程序400中的输出A,B和C连接的程序700和程序900,用于产生中心通道信号和该至少一低音声道信号。
图5指出本发明的一较佳实施例,在向上混合的系统中用于产生表现出本发明优点的一个中心通道信号,以及它对应于图2B的详细视图,其中图3的中间处理器202的详细组件也被描绘。正如看到的控制处理器203,作为输入的该输入信号102和104,及输出,其中包括其它参数,增益系数gC1,gC2,gD1,gD2,适应性滤波器系数和增益系数的g1,g2。
继续从图3解释,该第三增强信号346C是输入到中心通道处理器205。中心通道处理器205包括一个处理器,用于决定随着一中心通道加权处理器503的主要图像方向501。主要图像方向处理器501接受从适应性滤波器318和320中的至少一个作为输入信息,或通过该分析输入信号Lo102及Ro104。
在使用从该适应性滤波器的信息的情况下,如该适应性滤波器系数,主要方向可以只使用一个适应性滤波器决定。在这样的情况下,仅有一个过滤器相对于一的级数,是用来决定主要方向。然而,当仅使用一个滤波器时,主要方向被作为该滤波器的给定频带内的绝对能量级数的计算。这个方法是不理想的,因为有可能在一个通道中在给定频率的信号的能量为零,但在其他通道中是一非零级数,并在这种情况下,主要信号会被不正确地计算。
因此,在一个实施例中,主要方向被计算为两个滤波器可工作在频域或频带受限的时域的级数比,或者换句话说,为两个适应性滤波器的滤波器系数的平均,从而减少了不正确计算的风险及增加主要图像方向决定的质量。在另一实施例中,主要图像方向也可以原始输入信号的分析类似的方式计算。
一旦该主要影像方向被确定,这个信息将被传送到中心通道权重系数处理器503,又被称为空间滤波器,其中,空间滤波器用于该中心通道的强度的一系数已被确定。当该二自适应滤波器系数AF_LS及AF_RS具有实质相同值(举例来说,该二滤波器的第n个栓的强度在频域表示方式中具有相同值)时,对应于一中心位置中的一方向的一极高值系数在一种配置下将被决定。
在一种配置中,该中心通道权重系数将依据下列公式而被决定:
CCWC=max(0,cos(abs(d_wt/C)N)(7)
其中d_wt是该二自适应滤波器的滤波器系数的平均值,N是一提升余弦值的强度的数值,在一配置下是等于9,C则是一常数,在一种配置下,等于9分贝。这个公式也可表示成介于0到该余弦值的最大值,该余弦值的角度是该二自适应滤波器的滤波器系数的平均除以C的绝对值,再用N的威力提升余弦值。假如,一个较高的N值已被使用,该中心通道空间上的宽度将变得更窄,也就是说,输入信号必须以非常靠近由该中心扬声器再生的信号的中心而予以全景化。常数C同样是为了该中心通道而控制空间的宽度,然而,并不会改变该空间滤波器的形状。
可选择地,d_wt在每一自适应滤波器中的权重系数CCWC值可被计算两次的例子中,可以是单一自适应滤波器的绝对值。最后的权重系数CCWC将被决定为该二中间权重系数CCWC值的平均。
图6显示一个曲线以展现中心通道权重系数是如何被已决定的影像方向所影响。假如,该影像方向被决定以实质地相同于该实体扬声器的方向,当一自适应滤波器大于另一个20分贝时,一配置将被决定(这将发生在若一围绕的声源难以通过一混合工程师全景化到一通道上),接着,该中心通道权重系数将设置成一实质为零的数值,此确保对在此种“硬产出(hardpanned)”例子的中央通道的输出位阶为零,且支配的影像方向是察觉为单一前左或右喇叭的方向。
在另一配置中,假如该中间信号346中检测到语音,该影像方向被判定必须等于0度角(也就是说,该CCWC值被设定成它的最大值)。
再次参照图5,该已被决定的中心通道权重系数CCWC将通过中间处理器202的第三增强信号346c于乘法器505中进行乘法运算。产生的中心通道信号206将准备被运用到适合的换能器如:扬声器中。乘法器505可以如同熟知该领域的人士般地被实施于时域或频域中。举例说明的是,乘法器505可在时域中被实施成卷积的操作,或通过与频率相关的滤波器在频域中实现。
由于部分的同调数据串的总和将导致增加约3分贝的增益,一负增益507可以选择性地运用一配置中以等效减少3分贝,进而补偿这样增加的增益以产生一修正后的输出中心通道信号346c。
值得注意的是,自适应滤波器系数AF_LS与AF_RS、增益g1与g2、该已被决定的主要影像方向及中心通道权重系数CCWC可被表示成具有单一数值的向量或者具有一频率相关的表示方式(也就是说,对于一频率相关的表示方式而言,将有用于不同频率的不同向量值)。
总结地说,本发明产生中心通道信号是与连接自二输入信号产生的自适应滤波器信号的至少所述步骤相关以产生二个连接的信号,该二连接的信号混合以产生一第三总和信号,这样的混合可用不同的比例实现,且最后,第三总和信号将以依据该前影像的主要方向的向量CCWC调整权重,假如,该主要方向被决定实质等于0(也就是指该中心扬声器的方向),该向量CCWC将为一大值,假若,该主要方向的绝对值被判定为一大值,该向量CCWC即为一小值。
本发明用于产生一中心扬声器通道的新颖方法的优点在于自适应滤波器校准输入信号中的相位及强度的部分,如此一来,当滤波器信号是非过滤信号的总和,一总和信号将以最小时间模糊加工所制成,以及一关联部分对非关联部分的比例的增加(也就是说,原本输入信号102,104的部分是正相关)。因此,一中心通道信号被产生,其包含稳定的非时间模糊的高质量精确自然声音影像。
在接下来的一实施例将详细地描述以示范本发明产生的中心通道信号的优点。本实施例中,使用音频输入测试信号对于音乐、电影原声带及商业语音音频来说是极为典型的。
对于一给定的频率范围,可假设输入信号Ro对于输入信号Lo具有3分贝的提升及领先0.5毫秒,且输入信号Ro与输入信号Lo是相互关联的,如:二相分隔的麦克风录制单一的声音源,声音源相比于一麦克风是更接近另一麦克风,较接近的麦克风的输出是信号Lo,而另一麦克风的输出则为信号Ro。
在这样的信号状况下,第二自适应滤波器320将尝试利用3分贝及0.5毫秒校准该二信号(也就是说,假设信号Ro的延迟大于0.5毫秒,这代表着,第二自适应滤波器320的时域峰值也将如此,以使通道Lo等效领先信号Ro)。考虑到用于同样输入信号的第一自适应滤波器318系统,第一自适应滤波器318将具有相对于第二自适应滤波器320的一相反反应,也就是具有一负3分贝的强度,且将具有第一自适应滤波器中的一时域峰值,以使通道Ro等效落后信号Lo。
然而,依据本发明图5中的中心通道产生系统,对于同样的状况,信号Ro大于信号Lo3分贝(也可以说是0dBV),且第二自适应滤波器320的反应具有一响应峰值3分贝,接着,通过第二自适应滤波器320过滤的信号Lo具有+3分贝的信号位准(我们也假设利用增益gC1设定的串音位准是一极小值,如:负15分贝)。过滤后的信号Lo也将时间横移0.5毫秒而校准信号Ro,以产生一新的第一总和信号。
同样地,第二信号Ro通过负3分贝的第二自适应滤波器320运算,且加总延迟的第一信号Lo而得到一具有约0分贝位准的第二总合信号。然而,既然第一自适应滤波器318将具有一0.5毫秒的延迟,第二总合信号将相对于第一总和信号亦延迟0.5毫秒。
运用于中央通道中心通道权重系数将自该二通道的差值计算。这可以利用介于该两个输入信号的其中之一或两个的频率相关的位准差异进行计算,或自介于第一自适应滤波器318及第二自适应滤波器320的差异位准进行运算。
正如已经提到的,该中心通道的加权系数CCWC是根据下面的公式计算的:
CCWC=max(0,cos(abs(d_wt/C)N)(8)
其中,abs(D_WT)是定向加权值的绝对值,以分贝(dB)为单位。max()函数输出cos()函数和零的最大值,亦即,加权系数CCWC的边界界定为0和1之间。如所讨论的,进一步的增益减小系施加到加法器的该求和信号,进一步施加增益,也就是约为3分贝(dB)衰减(这是计算加总部分相关数据序列给出的水平增加了大约3dB的事实)。
从该曲线可看出,在图6中,CCWC是d_wt的一函数,其可看出对于d_wt=3分贝或-3分贝时,CCWC为-3.5分贝,且具有-3dB进一步增益减少,对于高度相关输入信号的中心通道信号的净水准为8.5-3.5-3=2分贝。因此,该中心通道较右声道的电平是稍软的(与左声道的0dB电平相比,在考虑部分其具有一个+3dB电平)。因此,一个感知的声音图像将被定位该中间和右侧扬声器信号之间。在上述CCWC公式中修改该指数值N会修改的CCWC“锐利度”,亦即,较小的值指数会增加CCWC的作为abs(d_wt)的函数,所以对于几乎像硬的平底锅的来源的中心通道水平高,使一个声音图像将被定位接近该中间扬声器。更改的指数的值可以被认为是发散控制,以控制一个单声道或一个几近单声道原始输入信号,有多少被发送到一个向上混合音频系统中相对左前方通道和右通道的中心通道。这具有优点让使用者根据个人喜好可以控制的中心通道的灵敏度。
图7是一个流程图,用于表示一处理程序700产生中央声道的信号的过程。在其他图中,图7也表示控制处理器203采取的步骤,以执行各种分析、监测、控制和参数设置操作。处理程序70被表示为功能方块,其可以通过各种方式实施。例如,该些技术可用硬件、软件、固件或上述的组合而予以实施。正如可以看到的,处理程序由确定步骤704开始,其定义该主图像方向,正如前面所解释,步骤706定义中心通道的加权系数。图3或图5中第三个增强的信号346c被接收,如图7所描述的圆C,相对于图4处理程序400的输出圆C。步骤708,第三个增强的信号346c被已经决定的CCWC,且在步骤710系数中被衰减,以在步骤712获得最终的中心通道输出信号206。
正如前面提到的,中心通道的加权系数是计算该被方向权重分量修改的第一及第二适应性滤波器的幅度。中心通道206输出的输出信号准备要施加到一个合适的换能器(如扬声器)。由于部分相干数据序列的加总结果产生在一个增加了大约3dB的水平,选择性地实施步骤708可以进一步的增加增益,在一个实施例中是基本上等于一个3分贝衰减,以补偿这种增加,从而产生一修改的输出中央声道的信号,以显示出本发明的优点。
增强的音频信号的装置,使用时结合一中心通道处理器,产生在中心声道没有任何时间拖尾的音频信号,其密切接近输入信号的水平,并再现原始声无失真图像。正如前面提到的,在适应性滤波器校准输入信号中相位和幅度构成要素,这样,当经滤波的信号与非滤波信号相加,产生具有最少的时间拖尾的一相加信号,且含有高比例的相关构成要素对不相关的构成要素之比。
图8示出本发明的另一实施例在向上混合的系统,用于产生至少一个LFE重低音扬声器的音频信号,以显示出本发明的优点,并且其对应于详细视图如图2C所示,其中图3的详细的中间处理器202也被描绘。虽然配置允许生成只有一个重低音LFE信号208c,它也允许生成三个重低音LFE信号208,其包含一第一LFE1208a,、一第二LFE2208b及一第三中心LEF208c的重低音(subwoofer)声道。可以看出,控制处理器203接收输入的两个信号102和104,并且在其它参数中输出增益系数gD1、gD2、适应性滤波器系数、增益系数g1、g2。
根据本实施例,Lo102和Ro104输入信号每个被由控制处理器203分析之前,将首先被每一低通滤波器801,803处理,使由控制处理器执行的电平分析时,只需要考虑低频率的能量。
为了产生不同的重低音声道208,LFE声道的处理器207其包括一个低通滤波器组合,在中间处理器202的不同点执行。从图8中可以看出,第三LEFc通道208c是由第三增强的信号807执行低通滤波所产生的,LEFc通道208a是由第二增强的信号809执行低通滤波所产生的,其中第二增强的信号809是增益系数g2对第二求和信号342应用产生。同样,LFE2通道208b是由第一增强的信号809执行低通滤波所产生的,其中第一增强的信号809是增益系数g1对第一求和信号3402应用产生。这些输出信号中的每一个都可以被一个在某些影院系统中可被发现的具有多重重低音设置的重低音扬声器装置再实现。
低通滤波可以在数字领域中被实施,如使用数字有限脉冲响应FIR滤波器、或无限脉冲响应IIR滤波器,或在模拟领域中被实施。截止频率可以由用户接口控制或自动设定,例如具有-3dB的截止频率为75Hz。控制处理器也可通过内部设定的滤波器系数而试图进行低频加权,以执行低通滤波通。
在只有一个单一的重低音扬声器的音频信号是必要的情况下,可以使用第三LEFc信号208c,因为其包含原来的左侧输入信号102和右侧输入信号104。
图9是一个流程图,以表示处理程序900用于产生至少一个LFE重低音信号。在其他图中,图9也表示控制处理器203采取的步骤,以执行各种分析、监测、控制和参数设置操作。处理程序900被表示为的功能方块,其可以通过各种方式实施。例如,该些技术可用硬件、软件、固件或上述的组合而予以实施。正如可以看到的,过程开始首先由低通滤波器904、905对每个接收到的输入信号902、903进行低通滤波。控制处理器203随后分析的水平的低通滤波后的信号的电平,其计算906、908的两个不同的信号的电平。在步骤908中进行比较,以决定两个信号中的哪一个具有更高电平,且该控制处理器203保有最响亮的增强信号,并丢弃较弱的增强信号。
在增强的信号有不同的电平的情况下,和一个电平连续超过其他电平时,丢弃最弱的信号是不可突然进行,但可缓慢的逐渐消失。
在比较的情况下,当第一信号L1具有高于第二信号L2的电平时,由最后更新的第一增益系数g1乘上一参数的值(mu),以计算第一增益系数g1,并由最后更新的第二增益系数g2乘上1减去该参数mu的值(1-mu),以计算第二增益系数g2。当第二信号L2具有高于第一信号L1的电平时,角色互换,由最后更新的第一增益系数g1乘上1减去该参数mu的值(1-mu),以计算第一增益系数g1,并由最后更新的第二增益系数g2乘上该参数mu的值(mu),以计算第二增益系数g2,其中,该参数mu大于1。
随后,这两个增益系数施加到图3中的合成器,以得到的信号805、807和809,其随后被低通滤波,以在一个在某些影院系统中可被发现的具有多重重低音设置的重低音扬声器装置再实现。
控制处理器203决定的两个输入信号的电平,并设增益系数置g1到一个较大的值,增益系数和g2到一个较低的值,其取决于两个输入信号的哪一个被确定为具有更大范围内的信号电平。这可以确保,当原始的左输入信号和右输入信号作为一种常见的音讯混合技术的结果有一个非同时协调的低频分量,所述第一和第二加总信号的求和不会取消非同时协调的低频分量。
音频信号增强装置以及相应的方法,与一个LFE声道处理器结合使用时,产生重低音的音频信号结果中,因为只有最响亮的两个滤波的信号电平是被输出,非同时协调信号(out-of-phase)不取消及所得到输出声道的电平是正比于在原始输入信号中的原始低频内容。
因此,本发明的装置和方法提供了各种有利的特性,在他们之间的增强的立体声音频信号包括两个信号到至少一个增强的信号,其中的非同时协调信号(out-of-phase)不取消,且输出声道的产生电平是正比于在原始输入信号中的原始低频内容。因此,所得到的信号将不包含时间拖尾,且两个信号在给定频率的主导组件是相等的,和新的主导信号的电平和原来的两个输入信号具有相同的电平。
在此,当施加的中心通道处理器生成一个中心通道信号,其包括一个平衡的主导成分没有任何时间拖尾,且其具有最小时间拖尾且紧密靠近输入信号的电平,并具有,且含有高比例的相关构成要素对不相关的构成要素之比。
同样,当这种增强的信号施加到低频效果处理器,产生至少一个重低音信号,其中的非同时协调信号(out-of-phase)并未被取消,并且输出声道的结果电平是正比于在原始输入信号中的原始低频内容。多个LFE信号也可以从本发明的讯信号增强装置所产生的多个增强信号来产生。
本领域技术人员可理解的是,由本发明的不同实施例的揭露意指非局限于本发明较佳实施例及实现,且因此本发明的特征可以于所描述的一般发明观念的范围内而容易地结合。
可以理解的是,在此所叙述的实施例可由此通过硬件、软件、固件、中间件、微代码或其任何组合来实施。当此系统和/或方法于软件、固件、中间件、或微代码、程序代码或代码段、一计算机程序中而实施,可被储存于一机器可读媒体,像是一储存组件。一计算机程序或一代码段可代表一流程、一函数、一子程序、一路径、一子路径、一模块、一软件程序集、一分类、或任何设备、数据结构、或程序叙述的组合。一代码段可与其他代码段、或与经由传送/接收信息、数据、变量、参数或一储存内容的一硬件电路作耦合。使用任何合适的方式,包括储存分享、信息传输、记号传输、网络传输等诸如此类,可通行、发送或传递信息、变量、参数等。
对于一软件安装启用,在此所描述的技术可以由执行所描述此功能的模块(例如,流程,及函数等等)来实施。此软件代码系可储存于记忆单元及通过处理器执行。记忆单元可于处理器内或外接处理器而实行,其中,这样情形下,可经由如该领域已知的不同方式来通信联络地耦合处理器。进一步,至少一处理器可包括一或多可操作以执行所描述的功能的模块。
此外,在此所描述不同的态样或特征可实行作为使用标准程序化或工程技术的一方法、装置、或制品(articleofmanufacture)。在此作使用的术语“制品(articleofmanufacture)”意以包括从任何计算机读取组件、载体或媒体进入的一计算机程序。举例来说,计算机读取组件可包括但不局限于磁性储存组件(如,磁盘、软性磁盘、磁条等)、光盘(如,光盘片(CD)、多功能数字激光视盘(DVD)等)、智能卡、及闪存组件(例如,可抹拭可程序只读存储器、卡、条、密钥驱动等)。此外,本文叙述的不同储存媒体可代表对于储存信息的一个或多个组件和/或其他机器可读媒体。此用语“机器可读媒体”可包括但不局限于能够储存、包含、和/或携带的指令和/或数据的不同媒体。并且,一计算机程序产品可包括具有一或多个指令或代码可操控以导致一计算机执行本文所叙述的功能的一计算机可读媒介。
如上所述中已经包含了一个或更多的实施例的例子。这边当然不可能为了描述上述实施例中的部件或方法而描述出每一个可能的组合,但在本领域中的原有技术人员可能会意识到许多进一步的各种实施例可能的组合和置换。因此,本文中所描述的实施例旨在包括所有这些改变,修改和落在所附权利要求的范围内的变化。在一定的范围内,词语“包含”被使用在详细描述或权利要求中,这样的词语是在某种程度上包含了类似于“包括”等相似用词,正如“包含”在权力要求范围中是作为一个过渡性的词语类似于“要求”来解释。
各种不同的逻辑区块,模块,以及线路被用来和此处所揭露的实施例一起描述可被实现或是以一个一般用途的处理器,一个数字信号处理器(DSP)以及运用一个特定的集成电路(ASIC),一个可编程门阵列(FPGA),或其他可程序化的逻辑设备,分散的逻辑门或晶体管,分散的硬件组成,或任何其中的组合方式被设计来执行所描述的功能。一个一般用途的处理器可以是一个微处理器,但在替代方案中,该处理器可以是任何传统的处理器,控制器,微控制器,或状态机。
所描述的方法或算法可被直接地于硬件中被实施,于一个由一处理器执行的软件模块中被实施,或于其两者的组合当中被实施。一个软件模块可存驻于随机存取内存RAM,闪存,只读存储器ROM,可抹除式只读存储器EPROM,可电子抹除式只读存储器EEPROM,缓存器,硬盘,外接式硬盘,光驱,或是其他的此领域中所被熟悉的平台介质。
本领域技术人员应该理解,上述所讨论的一个或多个实施例并不用于限制本发明,附图也不用于限制本发明。而是本发明仅可由下述的权利要求所限。

Claims (13)

1.一种音频信号增强装置(201),用于向上混合一个包含两个音频信号的立体声输入信号(102,104),所述装置包含:
用于处理所述两个输入信号(102,104)来产生至少一个增强信号(346)的信号增强组件,所述信号增强组件包含:
两个平行的处理线,其中每一个处理线包含两个平行的处理分支;
所述第一个处理分支包含自适应滤波器元组件(318,320);且
第二个处理分支包含用来延迟一个信号的组件(310,312);
组件(328)通过一个加权求和运算,来组合所述第一处理线的第一处理分支的输出信号(324)与所述第二处理线的第二处理分支的输出信号(314),以便产生一个第一增强信号(346a);
组件(326)通过一个加权求和运算,来组合所述第二处理线的第一处理分支的输出信号(322)与所述第一处理线的第二处理分支的输出信号(316),以便产生一个第二增强信号(346b);且
组件(344)通过一个加权求和运算,来组合所述第一与第二增强信号(346c)以产生一个第三增强信号;且控制组件(203)是用来控制所述信号增强组件,其中,所述控制组件适用于:
分析所述输入信号,所述第一与第二处理线的第一与第二处理分支的输出,至少一个增强信号,所述第一,第二以及第三增强信号;以及
动态地改变所述信号增强组件的一相乘组件的增益系数与用来延迟所述信号的所述组件的延迟量,以及
交换混合组件(301),用于使用一增益系数(gC1)将所述第一输入信号(102)的一部分加权并与所述第二输入信号(104)组合以产生一个用来馈入所述第一处理线的第三信号(302),且用来使用一增益系数(gC2)将所述第二输入信号(104)的一部分加权并与所述第一输入信号(102)组合以产生一个第四信号(304)用来馈入所述第二处理线;
其中,所述交换混合组件包含相乘组件以将所述至少一个增益系数(gC1,gC2)套用于所述输入信号(102,104)且其中所述至少一个增益系数是由所述控制组件(203)所设置。
2.根据权利要求1所述的音频信号增强装置,其中,所述自适应滤波器组件(318,320)包含自适应滤波器设置组件且其中所述自适应滤波器系数是由所述控制组件所设置。
3.根据权利要求1所述的音频信号增强装置,其中,所述第二处理分支更进一步包含相乘组件(306,308)以将至少一个增益系数(gD1,gD2)套用于所述第三与第四信号(302,304)且其中所述至少一个增益系数与用来延迟所述信号的所述组件的延迟量是由所述控制组件所设置。
4.根据权利要求1所述的音频信号增强装置,更进一步包含相乘组件(914,915)以将至少一个增益系数(g1,g2)套用于所述第一与第二增强信号且其中所述至少一个增益系数是由所述控制组件所设置。
5.根据权利要求1所述的音频信号增强装置,更进一步包含中心声道信号产生组件(205)用于由所述第三增强信号(346c)产生一个中心声道信号(206),所述中心声道信号产生组件包含中心声道加权组件(503)以及相乘组件(505)以将所述中心声道加权系数套用于所述第三增强信号且其中所述中心声道信号产生组件是由所述控制组件所控制。
6.根据权利要求1所述的音频信号增强装置,更进一步包含低频效果重低音信号产生组件(207)以由所述至少一个增强信号产生至少一个低频效果重低音信号(208),所述低频效果重低音信号产生组件包含低通滤波器组件(LPF)且其中所述低频效果重低音信号产生组件是由所述控制组件所控制。
7.根据权利要求1所述的音频信号增强装置,其中,所述控制组件(203)包含至少一个处理器与至少一个内存。
8.一种用来增强一个包含两个向上混合的音频信号的立体声输入信号(102,104)的方法,所述方法包含:
将所述两个输入信号(102,104)做处理以于两个平行的处理线中产生至少一个增强信号(346,420),所述平行的处理线分别包含两个平行的处理分支;
所述第一处理分支包含自适应的过滤(410,411)所述信号;且
所述第二处理分支包含延迟(408,409)所述信号;
处理所述两个输入信号的程序包含:
通过一个加权求和运算(412),组合所述第一处理线的第一处理分支的输出信号与所述第二处理线的第二处理分支的输出信号以产生一个第一增强信号(420a);
通过一个加权求和运算(413),组合所述第二处理线的第一处理分支的输出信号与所述第一处理线的第二处理分支的输出信号以产生一个第二增强信号(420b);以及
通过一个加权求和运算(418),组合所述第一及第二增强信号以产生一个第三增强信号(420c);以及
控制所述程序以产生至少一个增强信号,其中,控制所述程序包含分析所述输入信号,所述第一与第二处理线的第一与第二处理分支的输出,所述至少一个增强信号,所述第一,第二以及第三增强信号;以及
不断地改变所述信号增强组件的一相乘组件的增益系数与用来延迟所述信号的所述组件的延迟量;以及
使用一增益系数(gC1)将所述第一输入信号(102)的一部分加权并与所述第二输入信号(104)组合(404)以产生一个用于馈入所述第一处理线的一个第三信号(302),以及使用一增益系数(gC2)将所述第二输入信号(104)的一部分加权并与所述第一输入信号(102)组合(405)以产生一个用于馈入第二处理线的一个第四信号(304)。
9.根据权利要求8所述的方法,更进一步包含由所述第三增强信号所产生(700)的一个中心声道信号(206),通过决定一个中心声道加权系数并将所述中心声道加权系数乘以(708)所述第三增强信号以产生(712)一个中心声道信号。
10.根据权利要求8所述的方法,更进一步包含由所述至少一个增强信号产生的至少一个低频效果重低音信号(208),包含将所述输入信号以及所述至少一个增强信号做低通滤波(904,905,918)。
11.一个中心声道产生装置(205),用来由一个包含两个音频信号的立体声输入信号(102,104)产生一个中心声道信号(206),所述中心声道产生装置包含根据权利要求1至7中任一项所述的音频信号增强装置(201),且更进一步包含:
用来分析所述这些信号的组件(501);
用来决定一个声道加权系数的组件(503);
用来将所述第三增强信号(346c)相乘于所述声道加权系数的组件(505),以产生所述中心声道信号。
12.一个低频效果LFE重低音信号产生装置(207),用来从一个包含两个音频信号(102,104)的立体声输入信号产生一个重低音信号(208),所述LFE重低音信号产生装置包含根据权利要求1至7中任一项所述的音频信号增强装置(201),且进一步包含:
用来将所述两个音频信号做低通滤波的组件(801,803),以产生过滤信号,其中所述控制组件分析所述过滤信号以控制所述音频信号增强装置;以及
用来将所述至少一个增强信号(346,420)做低通滤波的组件(811,813,815),以产生至少一个低频效果信号(208)。
13.一个音频信号向上混合器,用来从一个包含两个音频信号的立体声输入信号产生至少三个输出音频信号,所述音频信号向上混合器包含根据权利要求1至7中任一项所述的音频信号增强装置(201),且适于执行根据权利要求8至10中任一项所述方法的步骤。
CN201080068956.5A 2010-09-06 2010-09-06 用于多通道音频再生的向上混合方法及系统 Active CN103210668B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2010/005450 WO2012031605A1 (en) 2010-09-06 2010-09-06 Upmixing method and system for multichannel audio reproduction

Publications (2)

Publication Number Publication Date
CN103210668A CN103210668A (zh) 2013-07-17
CN103210668B true CN103210668B (zh) 2016-05-04

Family

ID=43821781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080068956.5A Active CN103210668B (zh) 2010-09-06 2010-09-06 用于多通道音频再生的向上混合方法及系统

Country Status (5)

Country Link
US (1) US9307338B2 (zh)
EP (1) EP2614659B1 (zh)
JP (1) JP5802753B2 (zh)
CN (1) CN103210668B (zh)
WO (1) WO2012031605A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5689353B2 (ja) * 2011-04-22 2015-03-25 シャープ株式会社 フィルタ算出装置、送信装置、受信装置、プロセッサおよびフィルタ算出方法
EP2523472A1 (en) * 2011-05-13 2012-11-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
US9351069B1 (en) * 2012-06-27 2016-05-24 Google Inc. Methods and apparatuses for audio mixing
WO2014090277A1 (en) * 2012-12-10 2014-06-19 Nokia Corporation Spatial audio apparatus
EP2830332A3 (en) * 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
CN105594227B (zh) * 2013-07-30 2018-01-12 Dts(英属维尔京群岛)有限公司 利用恒定功率成对平移的矩阵解码器
CH709271A2 (de) * 2014-02-28 2015-08-28 Stormingswiss S Rl C O Fidacor S Rl Kodierung und Dekodierung eines niederfrequenten Kanals in einem Audiomultikanalsignal.
BR112016030345B1 (pt) * 2014-06-26 2022-12-20 Samsung Electronics Co., Ltd Método de renderização de um sinal de áudio, aparelho para renderização de um sinal de áudio, meio de gravação legível por computador, e programa de computador
US10932078B2 (en) 2015-07-29 2021-02-23 Dolby Laboratories Licensing Corporation System and method for spatial processing of soundfield signals
CN106572419B (zh) * 2015-10-08 2018-08-03 中国科学院声学研究所 一种立体声音效增强系统
US9928842B1 (en) 2016-09-23 2018-03-27 Apple Inc. Ambience extraction from stereo signals based on least-squares approach
CN106569780B (zh) * 2016-11-04 2021-12-07 北京飞利信电子技术有限公司 一种多通道数字音频信号实时音效处理方法及系统
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US10299039B2 (en) 2017-06-02 2019-05-21 Apple Inc. Audio adaptation to room
WO2020030304A1 (en) * 2018-08-09 2020-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An audio processor and a method considering acoustic obstacles and providing loudspeaker signals
KR20210072388A (ko) 2019-12-09 2021-06-17 삼성전자주식회사 오디오 출력 장치 및 오디오 출력 장치의 제어 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5610986A (en) * 1994-03-07 1997-03-11 Miles; Michael T. Linear-matrix audio-imaging system and image analyzer
US5854847A (en) * 1997-02-06 1998-12-29 Pioneer Electronic Corp. Speaker system for use in an automobile vehicle
CN101036414A (zh) * 2004-08-31 2007-09-12 Dts公司 用相关输出混合声道的方法
JP2008048324A (ja) * 2006-08-21 2008-02-28 Pioneer Electronic Corp パンニング自動調整装置及びパンニング自動調整方法
WO2010070016A1 (en) * 2008-12-19 2010-06-24 Dolby Sweden Ab Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters
CN1863416B (zh) * 2005-05-13 2010-08-18 阿尔派株式会社 音频装置和环绕声生成方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5770000A (en) * 1980-10-20 1982-04-30 Matsushita Electric Ind Co Ltd Stereo playback device
JPH05146000A (ja) * 1991-11-19 1993-06-11 Toshiba Corp 自動バランス調整回路
JPH0690500A (ja) * 1992-09-09 1994-03-29 Clarion Co Ltd 音像定位制御装置
US5633935A (en) * 1993-04-13 1997-05-27 Matsushita Electric Industrial Co., Ltd. Stereo ultradirectional microphone apparatus
KR100629513B1 (ko) * 2004-09-20 2006-09-28 삼성전자주식회사 외부음향의 멀티 채널 변환이 가능한 광재생장치 및 그의광재생방법
JP4402632B2 (ja) * 2005-08-29 2010-01-20 アルパイン株式会社 オーディオ装置
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
US8335330B2 (en) * 2006-08-22 2012-12-18 Fundacio Barcelona Media Universitat Pompeu Fabra Methods and devices for audio upmixing
JP5065784B2 (ja) * 2007-07-18 2012-11-07 株式会社DiMAGIC Corporation 同相成分抽出方法及び装置
JP5430263B2 (ja) * 2009-07-15 2014-02-26 アルパイン株式会社 オーディオ装置
RS1332U (en) 2013-04-24 2013-08-30 Tomislav Stanojević FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5610986A (en) * 1994-03-07 1997-03-11 Miles; Michael T. Linear-matrix audio-imaging system and image analyzer
US5854847A (en) * 1997-02-06 1998-12-29 Pioneer Electronic Corp. Speaker system for use in an automobile vehicle
CN101036414A (zh) * 2004-08-31 2007-09-12 Dts公司 用相关输出混合声道的方法
CN1863416B (zh) * 2005-05-13 2010-08-18 阿尔派株式会社 音频装置和环绕声生成方法
JP2008048324A (ja) * 2006-08-21 2008-02-28 Pioneer Electronic Corp パンニング自動調整装置及びパンニング自動調整方法
WO2010070016A1 (en) * 2008-12-19 2010-06-24 Dolby Sweden Ab Method and apparatus for applying reverb to a multi-channel audio signal using spatial cue parameters

Also Published As

Publication number Publication date
US20140010375A1 (en) 2014-01-09
JP5802753B2 (ja) 2015-11-04
JP2013539283A (ja) 2013-10-17
CN103210668A (zh) 2013-07-17
WO2012031605A1 (en) 2012-03-15
EP2614659A1 (en) 2013-07-17
EP2614659B1 (en) 2016-06-08
US9307338B2 (en) 2016-04-05

Similar Documents

Publication Publication Date Title
CN103210668B (zh) 用于多通道音频再生的向上混合方法及系统
AU747377B2 (en) Multidirectional audio decoding
US8345892B2 (en) Front surround sound reproduction system using beam forming speaker array and surround sound reproduction method thereof
EP1545154A2 (en) A virtual surround sound device
CN104604254B (zh) 声音处理装置、方法
JP5820806B2 (ja) スペクトル管理システム
KR102346935B1 (ko) 매칭되지 않은 트랜스오럴 라우드스피커 시스템용 강화된 가상 스테레오 재생
US8340303B2 (en) Method and apparatus to generate spatial stereo sound
US8077880B2 (en) Combined multirate-based and fir-based filtering technique for room acoustic equalization
KR0175515B1 (ko) 테이블 조사 방식의 스테레오 구현 장치와 방법
KR102185071B1 (ko) 크로스토크 처리 b 체인
KR20050115801A (ko) 와이드 스테레오 재생 방법 및 그 장치
CN111131970B (zh) 过滤音频信号的音频信号处理装置和方法
JP7370415B2 (ja) 空間オーディオ信号のクロストーク処理のためのスペクトル欠陥補償
KR20120067294A (ko) 가상 서라운드 렌더링을 위한 스피커 어레이
JP2008502200A (ja) ワイドステレオ再生方法及びその装置
JP6015146B2 (ja) チャンネルデバイダおよびこれを含む音声再生システム
US6507657B1 (en) Stereophonic sound image enhancement apparatus and stereophonic sound image enhancement method
JPH1042397A (ja) 音像定位装置及びステレオ音像拡大装置
Cecchi et al. Crossover Networks: A Review
Behler et al. A Loudspeaker Management System With FIR/IIR Filtering
JP5812842B2 (ja) オーディオ装置
JPH07184299A (ja) 車載用音場補正装置
JPH08317500A (ja) 音像制御装置及び音像拡大装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: DOLBY INTERNATIONAL CO., LTD.

Free format text: FORMER OWNER: IMM SOUND S. A.

Effective date: 20140312

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140312

Address after: Amsterdam

Applicant after: Dolby International AB

Address before: Spain Barcelona

Applicant before: IMM Sound S.A.

C14 Grant of patent or utility model
GR01 Patent grant