CN102246543A - 产生多信道音频信号的装置 - Google Patents
产生多信道音频信号的装置 Download PDFInfo
- Publication number
- CN102246543A CN102246543A CN2008801323277A CN200880132327A CN102246543A CN 102246543 A CN102246543 A CN 102246543A CN 2008801323277 A CN2008801323277 A CN 2008801323277A CN 200880132327 A CN200880132327 A CN 200880132327A CN 102246543 A CN102246543 A CN 102246543A
- Authority
- CN
- China
- Prior art keywords
- audio signal
- signal
- interval
- multi channel
- channel audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
一种基于输入音频信号(102)产生多信道音频信号(142)的装置(100),包括主信号上混装置(110)、区间选择器(120)、区间信号上混装置(110)和组合器(140)。主信号上混装置(110)构造成基于输入音频信号(102)提供主多信道音频信号(112)。区间选择器(120)构造成基于输入音频信号(102)的分析选择或不选择输入音频信号(102)的区间。输入音频信号(102)的选择区间、输入音频信号(102)的处理选择区间或与输入音频信号(102)的选择区间相关的参考信号被提供为区间信号(122)。区间信号上混装置(130)构造成基于区间信号(122)提供区间上混信号(132),组合器(140)构造成叠加主多信道音频信号(112)和区间上混信号(132)以获得多信道音频信号(142)。
Description
技术领域
根据本发明所述的实施例涉及一种基于输入音频信号产生多信道音频信号的装置和方法。
根据本发明所述的一些实施例涉及一种音频信号处理,尤其涉及一种产生多信道信号的概念,其中,不是为每个扬声器传输特有的信号。
背景技术
当具有N个音频信道的信号通过具有M(M>N)个再现信道的音频系统再现时,例如,存在以下的可能性:
(1)仅使用可用扬声器的一部分;
(2)产生一信号,该信号利用完整的可用再现系统。
第二种可能性是首选解决方案且在下文中也称为上混。
在上混的情况下,有两种不同的方法产生多信道信号。例如,现有的多信道信号被归结到更少数量的信道以便基于附加数据在接收器处重新产生原始信号。该方法也称为引导的上混。
另一种可能性是所谓的盲上混方法。该方法涉及无需在先知识的多信道延伸。没有用于控制过程的附加数据。也没有必须通过盲上混而再现或得到的原始声音效果或参考声音效果。
因此,存在实现盲上混的不同方法。
一种可能的方法称为直接音场概念。在这种情况下,直接声源最好由三个前信道(如所谓的5.1家庭影院系统)再现,这样听众可以在与原始双信道型式(如当输入信号为立体声信号时)相同的位置听到直接声源。
图2所示的是用于双信道系统的音频信号再现200的图解说明。显示了例如具有三个直接声源240(S1、S2、S3)的原始双信道型式。音频信号可以通过左扬声器220和右扬声器230为听众210再现,并且音频信号包括这三个直接声源的信号部分和由包围区域指示的音场部分250。这是例如标准的双信道立体声再现(三个源和音场)。
图3所示的是根据直接音场概念的盲上混的音频信号再现300的图解说明。示出了五个扬声器(中心310、左前320、右前330、左后340和右后350)用于再现多信道音频信号。
直接声源240由前面三个扬声器310、320和330再现。音频轨道中包含的音场部分250由前信道和环绕信道再现以便包围听众210。
音场部分是信号的不能分派给单个源而是分派给所有的声分量的组合,这产生了音响环境的效果。音场部分可以包括例如室内回声和室内混响,但是也包括听众的声音(如欢呼声)、自然的声音(如雨声)或人工音效(如乙烯裂开声)。
进一步可能的概念经常作为内带式概念提到。图4所示的是根据内带式概念所述的音频信号再现400的图解说明。扬声器的布置对应于图3所示的扬声器的布置。然而,每个声音类型,例如直接声源和像音场的声音是听众周围的位置。
由于所有的输出信号都是从相同输入信号产生的,输出信号应被进一步抗相关(decorrelate)。为此,可以使用很多已知的方法作为例如暂时延迟或全通滤波器的使用。提到的简单方法常常加剧了抗相关效应干扰缺陷。
例如,一个弊端是几乎所有的抗相关方法扭曲了输入信号的瞬时结构,使得暂时结构失去了瞬态特性。这将例如导致这样的效果:欢呼似的音场信号可能仅仅达到包围的效果,而不是身临其境的效果。
特殊信号类型(例如欢呼声或雨声)占据音场信号之中的特殊位置。它们是音场信号,未必产生空间效果。相反,它们通过独立部分的大量时间和空间叠加而产生包围感,这包括它们特有的直接声音特性,如单一掌声或单一雨滴声。通过叠加,形成的总信号大体得到了与从室内混响已知的相同统计特性。
尤其是这些信号类型难以用上混方法(通过引导上混以及盲上混)处理。而且经常导致有故障的上混,例如常常会听到类似梳齿型滤波器的效果。
已知的盲上混方法,其产生用于后信道的信号部分,因此不会发生这些非自然信号且产生声音效果,这是对效果的限制,例如,听众前面的拍手声,环绕信道仅仅产生发生欢呼的室内效果(包围音场)。但是尤其是在这些音场中,希望好像成为鼓掌听众的一员或呆在雨中(身临其境的音场)。为此,所有的部分(与内带式概念类似)应当分布在听众周围,但是无任何量度,这将再次导致非自然信号的声音效果。
在柏林2004年的美国电化学协会(AES)第116届大会中提出的A.Wagner、A.Walther、F.Melchior、M.Strauβ的“Generation of HighlyImmersive Atmospheres for Wave Field Synthesis Reproduction(用于波场合成再现的高度融入音场的产生)”中,描述了如何能产生用于波场合成的身临其境的音场的方法。为此,听众被360°抗相关的包围声场包围,这将产生描述的声环境的效果。
为了达到身临其境效果,添加了所谓的聚焦源。一个聚焦源是点声源,可作为单一源感知且表现出包围声场的特有单声。
根据出版物所述,单声(声音粒子)必须对大量音场中的每种音场有用,并且也可以是分别记录的声音或由合成器产生的人造声。
这种目标定向的方法具有这样的缺点:用于每种音场类型的不同音频信号必须已经生效。一方面,包围音场信号作为抗相关的单磁道,另一方面,单声源作为单独的音频文件。一种提到的选择是人工地生成(如利用合成器软件)这些用于每种音场类型(如果为已知的),这包括不适合再现音场的风险。此外,对于这种生成,例如,需要粒子声和很多计算时间的数学模型。通常,波场合成的劳动强度很高。
在Gerard Hotho;Steven van de Par;Jeroen Breebart的研究论文“Multichannel Coding of Applause Signals(掌声信号的多信道编码技术)”中,描述了用于掌声信号的多信道编码技术的方法,尤其包括用于随机音场(称为欢呼声、雨声和爆裂声)抗相关的方法。
在这里,提到了频率选择性编码器使信号质量更糟并且因此提出了基于唯一时域的编码器。
在这一点上,仅应当采用抗相关,这意味着几乎所有的信号听起来是同等的(或者截至输入时)。介绍了一种抗相关方法,通过该抗相关方法参考声的再现应当是成功的。
在申请号为EP08018793的早期非提前公开的欧洲专利申请书中,介绍了一种将类似欢呼的信号分解成前景声和背景声的方法。还请参考柏林2004年的美国电化学协会(AES)第116届大会中提出的A.Wagner、A.Walther、F.Melchior、M.Straub的“Generation of Highly ImmersiveAtmospheres for Wave Field Synthesis Reproduction(用于波场合成再现的高度融入音场的产生)”。包围音场从可感知单声中分离,从包含音场的声音中分离出,而后这两部分可以彼此分离地被处理。
在提到的非提前公开的欧洲专利申请书中,描述了一种方法,包括一个试图再现原始音场的实施例(引导模式)。原则上,背景声(不同于前景声)仅仅被抗相关,前景声仅放置于不同的时间不同的地点。因此可以说其仅涉及一种抗相关方法。
总信号被分解成前景和背景。可以假定仅分离部分的公共再现将听起来不错,但它们本身都包括非自然信号。
例如在Roy Irwan和Ronaldus Aarts的国际公开号为WO 02/052896A2的“Multi-Channel Audio Converter(多信道音频转换器)”、Carlos Avendano和Jean-Marc Jot的公开号为US 2007/0041592A1的“Stream Segregation ForStereo Signals(用于立体声信号的流分离)”、David Griesinger的专利号为US005870480A的“Multichannel Active Matrix Encoder And Decoder WithMaximum Lateral Separation(具有最大横向分离的多信道活跃基体编码器和解码器)”和Jan Petersen的国际公开号为WO 01/62045A1的“Multi-Channel Sound Reproduction System For Stereophonic Signal(用于立体音响信号的多信道声音再现系统)”中描述了其他已知的上混方法,它们并没有区分不同的输入信号。
发明内容
本发明的目的是提供一种用于产生多信道音频信号的装置,允许改进的灵活性和声音质量。
该目的通过根据权利要求1所述的装置和根据权利要求12所述的方法解决。
本发明的实施例提供了基于输入音频信号产生多信道音频信号的装置。该装置包括主信号上混装置、区间选择器、区间信号上混装置和组合器。
主信号上混装置被构造成用于基于输入音频信号提供主多信道音频信号。
区间选择器被构造成基于输入音频信号的分析而选择或不选择输入音频信号的区间。提供了输入音频信号的选择区间、输入音频信号的处理选择区间或与输入音频信号的选择区间相联系的参考信号作为区间信号。
区间信号上混装置被构造成用于基于区间信号提供区间上混信号,且组合器被构造成用于叠加主多信道音频信号和区间上混信号从而获得多信道音频信号。
根据本发明所述的实施例基于这样的中心思想:主信号上混装置产生的主多信道音频信号依据区间上混信号通过附加音频信号升级。该附加音频信号基于输入音频信号的区间的选择。
区间选择器和区间信号上混装置可以以非常灵活的方式影响多信道音频信号。
由于改善的灵活性和通过使用区间信号的聪明选择以及合适的区间信号上混规则,声音质量可以提高。
由于多信道音频信号无论如何都是人工信号,这是因为它是基于比多信道音频信号少的信道的输入音频信号产生的,且并不提供原始声音效果,因此可以提高多信道音频信号的声音效果来获得一信号,其可以通过灵活使用区间选择器和区间信号上混装置来产生与原始声音效果尽可能等同的声音效果。
主信号上混装置可以产生已经很好音响的主多信道音频信号,其通过与区间信号上混叠加来改进。
可以避免例如通过将输入音频信号分离为前景和背景信号而产生的非自然信号。
在根据本发明所述的一些实施例中,多次存储和使用选择区间信号以用于上混和叠加,以便获得改进的多信道音频信号。这样,多信道音频信号中的区间信号的数量可以变化。例如,区间信号对应于单个雨滴碰撞地面。因此阵雨中的单发声雨滴的密度可以变化。
在根据本发明所述的一些其他实施例中,为了识别输入音频信号的区间而分析输入音频信号。例如,可以识别特殊音场信号(像欢呼声或雨声),在这些信号中,单次鼓掌或雨滴可能是孤立的。
附图说明
将随后参考附图详细说明根据本发明所述的实施例,其中:
图1 是用于产生多信道音频信号的装置的方块图;
图2 是双信道系统的音频信号再现的示意图;
图3 是根据直接音场概念的盲上混的音频信号再现的示意图;
图4 是根据内带式概念所述的盲上混的音频信号再现的示意图;
图5 是包括多个单源的类似欢呼的信号的音频信号再现的示意图;
图6 是位置参数对音频信号再现的影响的示意图;
图7 是分配参数对音频信号再现的影响的示意图;
图8 是用于产生多信道音频信号的装置的方块图;
图9 是用于产生多信道音频信号的装置的方块图;且
图10 是用于产生多信道音频信号的方法的流程图。
具体实施方式
为了简化,以下大多实施例均涉及或显示具有两个信道(N=2)的输入音频信号和具有五个信道(M=5)的已生成多信道音频信号。这对应于普通实例,其中,双信道媒体(如CD)应通过五信道系统(常常是所谓的5.1家庭影院系统,其中,.1代表具有减小带宽的效果信道)再现。然而,对于本领域技术的人来说,所描述的概念很容易转换为任何数量的信道或目标定向的再现。
图1所示的是根据本发明实施例的用于基于输入音频信号102产生多信道音频信号142的装置100。该装置100包括主信号上混装置110、区间选择器120、区间信号上混装置130和组合器140。主信号上混装置110连接到组合器140,区间选择器120连接到区间信号上混装置130,并且区间信号上混装置130也连接到组合器140。
主信号上混装置110被构造成用于基于输入音频信号102提供主多信道音频信号112。
区间选择器120被构造成用于基于输入音频信号102的分析选择或不选择输入音频信号102的区间。提供了输入音频信号102的选择区间、输入音频信号102的处理选择区间或与输入音频信号102的选择区间相联系的参考信号作为区间信号122。
区间信号上混装置130被构造成基于区间信号122提供区间上混信号132。
组合器140被构造成用于叠加主多信道音频信号112和区间上混信号132以获得多信道音频信号142。
例如,用于特殊音场(像欢呼声或雨声)的输入音频信号的典型区间是基于输入音频信号的分析选择的。该选择区间122可能由参考信号处理或取代。选择区间122、处理的选择区间或参考信号随后被上混且与主多信道音频信号112叠加以获得改善的多信道音频信号142.
因此,可能将例如区间上混信号132方面的瞬态信号添加到主多信道音频信号112。
区间信号上混和叠加可采用使得多信道音频信号142可以为听众产生身临其境的音场的方式进行,且因此产生改善的多信道音频信号。
主信号上混装置110原则上可以根据任何上混方法工作。为了在前扬声器和环绕扬声器之间的收听距离内获得均匀的类似音场的声效,所有的扬声器信号且尤其是前声相对于环绕声必须抗相关。在盲混中,例如,只有N个输入信号时可用的,必须通过对输入信号各个部分的加权而从这些信号中产生具有其他特性的新输出信号。这样,例如,可能通过音场部分的衰减或相反来强调直接声源。
通常可认为常见的上混效应会产生类似欢呼信号的包围声效。
区间选择器120也可以称为粒子分离器,选择输入信号的区间也可以被描述为粒子分离。
区间选择器120例如通过切断(cut out)而选择输入信号的区间(也称为粒子或声音片段),这对于输入信号而言是典型的或特有的。这可以采用不同的方式完成。
例如,可能会切断输入信号波形(时域表征)的短区间。
一种替换方式也可以是从时频域到时域的单块或一组块的选择、任意处理和再变形。
进一步的选择是在时域和/或频域中标识块,所述块在随后的处理中被特别处理且在再变形之前再次加到整个信号。例如,输入音频信号的瞬态区间可能例如通过滤波器组被选出且分成多个频段。一个或多个不同频段可被处理,然后如果必要的话再变形以及例如与输入音频信号的未处理选择区间叠加。
通过处理输入音频信号的选择区间,声音粒子(选择区间)的质量可能会提高。例如,通过选择区间的处理,听众的听众鼓掌声可以是隔离出来。隔离出来的鼓掌声可被改进以产生例如更动听的鼓掌或各种听起来稍有不同的鼓掌声。
进一步的替换可以是通过参考信号取代选择区间。例如,选择区间包括听众的听众鼓掌并且由包含完美鼓掌声的参考信号取代。
组合器140例如将包含在一个或多个区间上混信号中的一个或多个分离粒子加到主多信道音频信号(也称为默认上混)。主多信道音频信号和区间上混信号可以例如直接添加或以合适的振幅和/或相位添加。
图5所示的是包括多个单源的类似欢呼信号的音频信号再现500的示意图。该实施例所示的是具有左扬声器220、右扬声器230和多个单源510的双信道系统,多个单源对应于应在这两个扬声器之间分离和分布的粒子,其中,这两个扬声器之间的位置取决于由左扬声器和右扬声器再现的信号部分。
区间信号上混装置130可以产生区间上混信号132,其包括例如一个或多个声音粒子。上混过程可以基于位置参数,其中,该位置参数例如表示听众在该位置将听到特殊粒子。该位置参数可由输入音频信号包含的位置信息确定或可由例如随机位置产生器随机产生。
多信道音频信号的不同信道中粒子的信号部分可由例如幅值相移法基于粒子的位置参数确定。
图6所示的是位置参数对音频信号再现的影响的示意图600。该图所示的是对应于五信道音频信号的五个扬声器。在该实例中,扬声器安装在圆的圆周610上。
当声音粒子的信号被发送至扬声器时,听众将听到该特殊声音粒子的虚拟位置取决于发送到每个扬声器的信号部分。例如,当信号仅仅发送至一个扬声器时,听众会认为声源位于该特殊扬声器。该实例显示了位于左前扬声器320的粒子630。如果信号在两个扬声器之间分享,声音粒子的虚拟位置会位于这两个扬声器之间。这由粒子640和650示出。大约均等分布于五个扬声器之间的信号会大约出现在扬声器阵列的中间,如参考数字660所示的。这样,声音粒子的虚拟位置可位于由每两个相邻扬声器之间的线620限定的区域内的任何点(如参考数字670和680所示)处。
可以在随机位置和/或随机时间添加区间信号或粒子。区间信号上混装置130也可以称作粒子上混装置。
该添加可取决于每个均具有可能随机设定的时间的静态位置、给定的路径或完全随机位置的音场(欢呼声、雨声或其他)类型。
根据本发明的一些实施例包括区间信号存储器(或中间存储器、或缓冲存储器)。该存储器可存储可多次使用的单个分离的粒子或区间信号、处理区间信号或参考信号。为了改变或变更提取的声音粒子的声音,可以使用滤波器或高质量工序,如M.Goodwin和C.Avendano的“Frequency-domain algorithms for audio signal enhancement based ontransient modification(用于基于瞬态改变的音频信号增强的频域算法)”(Journal of the Audio Engineering Society(音频工程学会杂志)54,(2006)No.9,第827页-840页)中所描述的瞬态形成方法。
在根据本发明所述的一些实施例中,区间上混信号到主多信道音频信号的添加也称为粒子到默认上混的添加,可由如密度参数和/或传播参数等参数控制。
密度参数,例如表示多少单声或粒子(每次)添加到主多信道音频信号(默认上混)。这些粒子可对应于输入音频信号的不同选择区间或存储于存储器中且多次使用的一种特殊分离粒子。
传播参数,例如确定了在多信道音频信号(上混声)产生的声音的哪个区域中粒子应当添加到该多信道音频信号(默认上混)。
图7所示的是传播参数对音频信号再现的影响的示意图700。图7中,传播参数的影响由虚线710表示。例如,对于一些声效,期望粒子仅仅添加到听众210的前面,而对于其他的声效,将粒子传播到整个区域或仅仅在背面传播可能会更好。
传播参数,例如可能影响多个粒子中每个的位置参数的随机产生。在图7所示的实例中,粒子的位置在听众前面的几率高于在听众后面的几率。
音场的密度和/或传播可能因参数而改变,例如,也独立于输入音频信号的密度和传播。
图7所示的是通过应用描述的概念图5所示信号的上混的实例。
在根据本发明所述的一些实施例中,分离粒子仅由一个单扬声器再现以避免回声效果,例如如果使用不同扬声器之间的延迟的话。
根据本发明所述的一些实施例包括分析器,也表示为分类块,被构造成执行输入音频信号的分析以便识别将要选择的输入音频信号的区间。该分析器可以是区间选择器的一部分或是独立的分离块。
图8所示的是根据本发明实施例的用于基于输入音频信号102产生多信道音频信号142的装置800。在该实例中,分析器810被示为分离块。
分析器810可被构造成用于基于输入音频信号中包含的识别参数、输入音频信号与参考信号的比较、输入音频信号的频率分析或类似方法来识别将要选择的的区间。例如,这样可以识别输入音频信号中类似音场的信号。一个实例可以是欢呼声检测器或雨声检测器。
分析器810或分类单元可以决定输入音频信号或输入音频信号的区间能否以描述的方式处理。根据分析或分类的结果,可改进其他块(例如主信号上混装置、区间选择器、区间信号上混装置或组合器)的参数值。
例如,分析器通过(分析)参数告知区间选择器应选择输入音频信号的哪个区间,或告知主信号上混装置衰减主多信道音频信号中将要选择的区间。
在该实例中示出了组合器140在主信号上混装置110的输出与区间信号上混装置130的输出之间的直接连接,这可能是组合主多信道音频信号与区间上混信号的一种可能性。另一种替换可为主多信道音频信号和/或区间上混信号的振幅和/或相位调整。
根据本发明的一些实施例包括控制器,被构造成用于使区间选择器、区间信号上混装置或组合器停用。通过将这三个单元中的一个从启用状态转换到停用状态,阻止主多信道音频信号和区间上混信号的叠加。因此,多信道音频信号基本(例如,除了振幅和相位差异以外)等于主多信道音频信号。
另一种替换可以是将控制器构造成在区间选择器、区间信号上混装置或组合器的完全启用状态和停用状态之间连续切换。这可在两个不同气氛之间提供连续衰减的可能性来获得更加包围或身临其境的声效。
控制器可由输入音频信号中包含的控制参数控制或通过用户界面控制。这将给制作人(通过输入音频信号包含的控制参数控制)或听众(通过用户界面控制)提供根据爱好和说明调整声效的可能性。
控制器可提供从包围(可能是默认的或低效率运行的)到身临其境的声效或从身临其境到包围的声效的连续衰减可能性。
在根据本发明的一些实施例中,环绕信号中出现的选择区间或粒子可能在前信号中衰减。这可产生非常离散感的沉醉效果。与输入信号相比粒子的瞬时偏移和粒子的再利用是不可能的。只有位置是可变的。
在根据本发明所述的一些其他实施例中,好的动听的声效基本由主信号上混装置(默认上混)产生,其仅代表一种特性且通过分离粒子升级。因此,相同的输入声音可能出现在抗相关的包围部分中以及身临其境的直接部分中。这是可能的,因为例如没有必须再现的信号,因为新信号总是通过上混产生。
在本发明的一些实施例中,前景声单元素的时序可能会改变,并且从包围到身临其境的音场的转变也是可能的。也可以使用自动信号分类。
音场的时间密度、所需的音色和空间传播(在导引模式中)可以独立于原始信号设置。
本发明的一些实施例涉及区间信号上混装置,其使用的上混规则不同于主信号上混装置的上混规则。
图9所示的是根据本发明实施例的用于基于输入音频信号102产生多信道音频信号142的装置900.
装置900对应于图8所示的装置。然而,该实例中的分析器810(分类单元)是区间选择器120的一部分且分析参数902被提供给主信号上混装置110和/或区间信号上混装置130。
此外,如上所述,也显示了控制器910、区间信号存储器920和随机位置产生器930。
该实例中的区间信号存储器920连接至区间选择器120上,且被构造成用于储存区间选择器120提供的储区间信号122以及被构造成用于给区间选择器120提供存储的区间信号。可替换地,该区间信号存储器920也可以将存储的区间信号直接提供给区间信号上混装置130。
随机位置产生器930例如连接到区间信号上混装置130且被构造成将随机位置参数提供给区间信号上混装置130。可替换地,随机位置产生器930也可以连接至区间选择器120且当选择了区间信号122时也可以提供随机位置参数。
该实例中的控制器910由控制参数912控制且连接(在参考数字914处示出)至区间选择器120、区间信号上混装置130和/或组合器140上。控制器910可以使区间选择器120、区间信号上混装置130和/或组合器140停用。
一般而言,所描述的本发明可以提供类似欢呼声的音场信号或带较少非自然信号的类似音场信号的较好且更加逼真的音响上混。
图10所示的是根据本发明实施例的用于基于输入音频信号产生多信道音频信号的方法1000。该方法1000包括:1010提供主多信道音频信号;1020选择或不选择输入音频信号的区间;1030提供区间上混信号;和1040叠加主多信道音频信号和区间上混信号。
所提供的主多信道音频信号基于输入音频信号。
1020输入音频信号的区间的选择基于输入音频信号的分析,其中,输入音频信号的选择区间、输入音频信号的处理选择区间或与输入音频信号的选择区间相联系的参考信号作为区间信号被提供。
所提供的区间上混信号基于区间信号。
通过1040叠加主多信道音频信号和区间上混信号而获得多信道音频信号。
根据本发明的一些实施例涉及一种方法,该方法提供了用于在没有传统非自然信号的情况下上混无附加信息(无制导上混)的类似欢呼声的声源的可能性。另外,所描述的方法可以提供在两种不同概念之间连续衰减的可能性,以获得包围或身临其境的声效。
根据本发明的一些其他实施例涉及可控上混效果。
根据本发明的一些实施例涉及一种方法,该方法提供了在上混中在音场和/或气氛的两种不同感觉的效果(也称为包围音场和身临其境音场)之间渐弱的可能性。
根据本发明的一些实施例涉及主信号上混装置,该主信号上混装置基于已知的上混方法。如果上混没有通过区间上混信号的叠加而延伸,该上混可能是默认工作点。这可能是这种情况,例如,如果控制器使区间选择器、区间信号上混装置或组合器停用。
一般而言,所描述的概念也适用于除作为示例使用的类似欢呼声信号以外的其他信号类型。例如,也可适用于发源于雨声、一群鸟的声音、海浪声、飞驰的马、行进中的士兵解散等的声音。
在本申请中,相同的参考数部分地用于具有相同或类似功能特性的物体或功能单元。
尤其应指出的是,本发明创造可以以软件实施。该实施可以在数字存储媒体上尤其是在具有可与可编程计算机系统配合的电子可读控制信号的软盘或CD上进行,这样来执行相应的方法。一般而言,当在计算机上执行计算机程序产品时,本发明也涉及计算机程序产品,其具有存储在机读载体上的程序代码以执行本发明方法。换句话说,当在计算机上执行该计算机程序产品时,本发明也可作为具有用于执行该方法的程序代码的计算机程序实现。
Claims (13)
1.一种基于输入音频信号(102)产生多信道音频信号(142)的装置(100),包括:
主信号上混装置(110),被构造成基于输入音频信号(102)提供主多信道音频信号(112);
区间选择器(120),被构造成基于输入音频信号(102)的分析选择或不选择输入音频信号(102)的区间,其中,提供输入音频信号(102)的选择区间、输入音频信号(102)的处理选择区间或与输入音频信号(102)的选择区间相联系的参考信号作为区间信号(122);
区间信号上混装置(130),被构造成基于区间信号(122)提供区间上混信号(132);以及
组合器(140),被构造成用于叠加主多信道音频信号(112)和区间上混信号(132)以获得多信道音频信号(142)。
2.根据权利要求1所述的产生多信道音频信号的装置,包括:分析器(810),被构造成用于执行输入音频信号(102)的分析以便识别待选择的输入音频信号(102)的区间。
3.根据权利要求2所述的产生多信道音频信号的装置,其中,所述分析器(810)被构造成基于输入音频信号(102)中包含的识别参数、输入音频信号与参考信号的比较或输入音频信号(102)的频率分析来识别输入音频信号(102)的区间。
4.根据权利要求2或3所述的产生多信道音频信号的装置,其中,所述分析器(810)提供分析参数,其中,主信号上混装置(110)基于所述分析参数提供主多信道音频信号,或者区间信号上混装置(130)基于所述分析参数提供区间上混信号(132)。
5.根据权利要求1至4中任一项所述的产生多信道音频信号的装置,包括区间信号存储器(920),所述区间信号存储器被构造成用于存储区间信号或处理区间信号,其中,所述区间信号上混装置(130)被构造成基于所存储的区间信号、所存储的处理区间信号、改进的所存储的区间信号或改进的所存储的处理区间信号提供多个区间上混信号(132)。
6.根据权利要求5所述的产生多信道音频信号的装置,其中,所述区间信号上混装置(130)被构造成基于所存储的区间信号或所存储的处理区间信号提供规定数量的区间上混信号(132),其中,区间上混信号(132)的规定数量由密度参数决定。
7.根据权利要求1至6中任一项所述的产生多信道音频信号的装置,其中,所述区间信号上混装置(130)被构造成基于位置参数提供区间上混信号(132),其中,对于多信道音频信号的每个信道,基于区间信号的多信道音频信号的一部分均基于位置参数。
8.根据权利要求7所述的产生多信道音频信号的装置,包括随机位置产生器(930),所述随机位置产生器被构造成用于产生随机位置参数。
9.根据权利要求7或8所述的产生多信道音频信号的装置,其中,所述区间信号上混装置(130)被构造成基于传播参数提供多个区间上混信号(132),其中,多个区间上混信号(132)中的每个区间上混信号(132)都基于独立的位置参数,其中多个位置参数基于传播参数。
10.根据权利要求1至10中任一项所述的产生多信道音频信号的装置,其中,所述主信号上混装置(110)被构造成用于衰减与输入音频信号(102)的选择区间相联系的输入音频信号(102)的一部分。
11.根据权利要求1-10中任一项所述的产生多信道音频信号的装置,包括控制器,所述控制器被构造成用于使区间选择器(120)、区间信号上混装置(130)或组合器(140)停用,以使得多信道音频信号(142)等于主多信道音频信号(112)或就是主多信道音频信号(112),其中,所述控制器由输入音频信号(102)中包含的控制参数控制或由用户界面控制。
12.一种基于输入音频信号产生多信道音频信号的方法(1000),包括:
(1010)基于输入音频信号提供主多信道音频信号;
(1020)基于输入音频信号的分析选择或不选择输入音频信号的区间,其中,提供输入音频信号的选择区间、输入音频信号的处理选择区间或与输入音频信号的选择区间相联系的参考信号作为区间信号;
(1030)基于区间信号提供区间上混信号;以及
(1040)叠加主多信道音频信号和区间上混信号来获得多信道音频信号。
13.一种计算机程序,具有当所述计算机程序在计算机或微控制器上运行时用于执行根据权利要求12所述方法的程序代码。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2008/010553 WO2010066271A1 (en) | 2008-12-11 | 2008-12-11 | Apparatus for generating a multi-channel audio signal |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102246543A true CN102246543A (zh) | 2011-11-16 |
CN102246543B CN102246543B (zh) | 2014-06-18 |
Family
ID=41076767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880132327.7A Active CN102246543B (zh) | 2008-12-11 | 2008-12-11 | 产生多信道音频信号的装置 |
Country Status (12)
Country | Link |
---|---|
US (1) | US8781133B2 (zh) |
EP (1) | EP2359608B1 (zh) |
JP (1) | JP5237463B2 (zh) |
KR (1) | KR101271972B1 (zh) |
CN (1) | CN102246543B (zh) |
AU (1) | AU2008365129B2 (zh) |
BR (1) | BRPI0823033B1 (zh) |
CA (1) | CA2746507C (zh) |
ES (1) | ES2875416T3 (zh) |
MX (1) | MX2011006186A (zh) |
RU (1) | RU2498526C2 (zh) |
WO (1) | WO2010066271A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103135147A (zh) * | 2013-01-23 | 2013-06-05 | 江汉大学 | 一种识别雨滴谱的方法及装置 |
CN105684466A (zh) * | 2013-10-25 | 2016-06-15 | 三星电子株式会社 | 立体声再现方法和设备 |
CN113611064A (zh) * | 2021-08-10 | 2021-11-05 | 厦门市弘威崇安科技有限公司 | 一种无人值守的震动-磁-声传感器节点 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2360681A1 (en) * | 2010-01-15 | 2011-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for extracting a direct/ambience signal from a downmix signal and spatial parametric information |
CN105612767B (zh) * | 2013-10-03 | 2017-09-22 | 杜比实验室特许公司 | 音频处理方法和音频处理设备 |
EP2892250A1 (en) | 2014-01-07 | 2015-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a plurality of audio channels |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1957640A (zh) * | 2004-04-16 | 2007-05-02 | 编码技术股份公司 | 用于生成对低位速率应用的参数表示的方案 |
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
US20080205676A1 (en) * | 2006-05-17 | 2008-08-28 | Creative Technology Ltd | Phase-Amplitude Matrixed Surround Decoder |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5870480A (en) | 1996-07-19 | 1999-02-09 | Lexicon | Multichannel active matrix encoder and decoder with maximum lateral separation |
AU2000226583A1 (en) | 2000-02-18 | 2001-08-27 | Bang And Olufsen A/S | Multi-channel sound reproduction system for stereophonic signals |
JP2004517538A (ja) | 2000-12-22 | 2004-06-10 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 多チャネル・オーディオ変換器 |
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
US6937737B2 (en) | 2003-10-27 | 2005-08-30 | Britannia Investment Corporation | Multi-channel audio surround sound from front located loudspeakers |
MX2007005262A (es) | 2004-11-04 | 2007-07-09 | Koninkl Philips Electronics Nv | Codificacion y decodificacion de senales de audio de varios canales. |
US7751572B2 (en) | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
JP5222279B2 (ja) * | 2006-03-28 | 2013-06-26 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | マルチチャネルオーディオ再構成における信号整形のための改善された方法 |
DE102006017280A1 (de) * | 2006-04-12 | 2007-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals |
US9014377B2 (en) * | 2006-05-17 | 2015-04-21 | Creative Technology Ltd | Multichannel surround format conversion and generalized upmix |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
DE102006050068B4 (de) * | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
KR20080058871A (ko) * | 2006-12-22 | 2008-06-26 | 에스케이텔레시스 주식회사 | 채널 모델링 방법 및 장치 |
KR20080082916A (ko) * | 2007-03-09 | 2008-09-12 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
EP2154911A1 (en) | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
-
2008
- 2008-12-11 ES ES08875078T patent/ES2875416T3/es active Active
- 2008-12-11 MX MX2011006186A patent/MX2011006186A/es active IP Right Grant
- 2008-12-11 KR KR1020117015862A patent/KR101271972B1/ko active IP Right Grant
- 2008-12-11 BR BRPI0823033-1A patent/BRPI0823033B1/pt active IP Right Grant
- 2008-12-11 CN CN200880132327.7A patent/CN102246543B/zh active Active
- 2008-12-11 JP JP2011539900A patent/JP5237463B2/ja active Active
- 2008-12-11 EP EP08875078.1A patent/EP2359608B1/en active Active
- 2008-12-11 RU RU2011126333/08A patent/RU2498526C2/ru active IP Right Revival
- 2008-12-11 WO PCT/EP2008/010553 patent/WO2010066271A1/en active Application Filing
- 2008-12-11 CA CA2746507A patent/CA2746507C/en active Active
- 2008-12-11 AU AU2008365129A patent/AU2008365129B2/en active Active
-
2011
- 2011-06-08 US US13/155,477 patent/US8781133B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
CN1957640A (zh) * | 2004-04-16 | 2007-05-02 | 编码技术股份公司 | 用于生成对低位速率应用的参数表示的方案 |
US20080205676A1 (en) * | 2006-05-17 | 2008-08-28 | Creative Technology Ltd | Phase-Amplitude Matrixed Surround Decoder |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103135147A (zh) * | 2013-01-23 | 2013-06-05 | 江汉大学 | 一种识别雨滴谱的方法及装置 |
CN103135147B (zh) * | 2013-01-23 | 2015-07-29 | 江汉大学 | 一种识别雨滴谱的方法及装置 |
CN105684466A (zh) * | 2013-10-25 | 2016-06-15 | 三星电子株式会社 | 立体声再现方法和设备 |
CN105684466B (zh) * | 2013-10-25 | 2017-11-28 | 三星电子株式会社 | 立体声再现方法和设备 |
US10091600B2 (en) | 2013-10-25 | 2018-10-02 | Samsung Electronics Co., Ltd. | Stereophonic sound reproduction method and apparatus |
US10645513B2 (en) | 2013-10-25 | 2020-05-05 | Samsung Electronics Co., Ltd. | Stereophonic sound reproduction method and apparatus |
US11051119B2 (en) | 2013-10-25 | 2021-06-29 | Samsung Electronics Co., Ltd. | Stereophonic sound reproduction method and apparatus |
CN113611064A (zh) * | 2021-08-10 | 2021-11-05 | 厦门市弘威崇安科技有限公司 | 一种无人值守的震动-磁-声传感器节点 |
Also Published As
Publication number | Publication date |
---|---|
BRPI0823033A2 (pt) | 2015-07-28 |
AU2008365129A1 (en) | 2011-07-07 |
EP2359608A1 (en) | 2011-08-24 |
BRPI0823033B1 (pt) | 2020-12-29 |
ES2875416T3 (es) | 2021-11-10 |
KR20110102446A (ko) | 2011-09-16 |
US20110261967A1 (en) | 2011-10-27 |
CA2746507A1 (en) | 2010-06-17 |
CN102246543B (zh) | 2014-06-18 |
KR101271972B1 (ko) | 2013-06-10 |
MX2011006186A (es) | 2011-08-04 |
RU2498526C2 (ru) | 2013-11-10 |
US8781133B2 (en) | 2014-07-15 |
AU2008365129B2 (en) | 2013-09-12 |
RU2011126333A (ru) | 2013-01-10 |
EP2359608B1 (en) | 2021-05-05 |
WO2010066271A1 (en) | 2010-06-17 |
WO2010066271A8 (en) | 2011-07-21 |
CA2746507C (en) | 2015-07-14 |
JP2012511845A (ja) | 2012-05-24 |
JP5237463B2 (ja) | 2013-07-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2774415C (en) | System for spatial extraction of audio signals | |
CN1747608B (zh) | 音频信号处理装置和方法 | |
CN101930742B (zh) | 对多声道音频信号进行编码/解码的系统和方法 | |
CN102246543B (zh) | 产生多信道音频信号的装置 | |
Avendano et al. | Frequency domain techniques for stereo to multichannel upmix | |
US10595144B2 (en) | Method and apparatus for generating audio content | |
CN103620673B (zh) | 用于处理已编码多声道音频信号的音频信号处理器和用于音频信号处理器的方法 | |
CN105075293A (zh) | 音频设备及其音频提供方法 | |
CN102007532A (zh) | 用于处理音频信号的方法和装置 | |
CN103518386B (zh) | 用于产生立体声输出信号以提供额外输出声道的装置、方法及计算机可读存储介质 | |
Roma et al. | Music remixing and upmixing using source separation | |
Melchior et al. | Spatial mastering-a new concept for spatial sound design in object-based audio scenes | |
Lee | Subjective evaluations of perspective control microphone array (PCMA) | |
WO2023118078A1 (en) | Multi channel audio processing for upmixing/remixing/downmixing applications | |
Rosen et al. | Automatic speaker directivity control for soundfield reconstruction | |
Yang et al. | Autogenous Spatialization for Arbitrary Loudspeaker Setups | |
CN102726066B (zh) | 空间声音再现 | |
Chétry et al. | A discussion about subjective methods for evaluating blind upmix algorithms | |
Keyes | The Dynamic Redistribution of Spectral Energies for Upmixing and Re-Animation of Recorded Audio | |
CN102726066A (zh) | 空间声音再现 | |
Guo | Going Immersive |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C56 | Change in the name or address of the patentee | ||
CP01 | Change in the name or title of a patent holder |
Address after: Munich, Germany Patentee after: Fraunhofer Application and Research Promotion Association Address before: Munich, Germany Patentee before: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. |