CN101658052B - 用于音频重构增强的方法和设备 - Google Patents

用于音频重构增强的方法和设备 Download PDF

Info

Publication number
CN101658052B
CN101658052B CN2008800088335A CN200880008833A CN101658052B CN 101658052 B CN101658052 B CN 101658052B CN 2008800088335 A CN2008800088335 A CN 2008800088335A CN 200880008833 A CN200880008833 A CN 200880008833A CN 101658052 B CN101658052 B CN 101658052B
Authority
CN
China
Prior art keywords
origin
audio
audio track
signal
respect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2008800088335A
Other languages
English (en)
Other versions
CN101658052A (zh
Inventor
V·普尔基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN101658052A publication Critical patent/CN101658052A/zh
Application granted granted Critical
Publication of CN101658052B publication Critical patent/CN101658052B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Abstract

重构一种音频信号,所述音频信号具有至少一个音频声道和指示相对于记录位置的音频声道的一部分的源点方向的相关联的方向参数,以导出重构音频信号。选择相对于记录位置的期望源点方向。修改音频声道的一部分,以导出重构音频信号的重构部分,其中所述修改包括:相对于具有指示远离期望源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近期望源点方向的源点方向的方向参数的音频声道的一部分的强度。

Description

用于音频重构增强的方法和设备
技术领域
本发明涉及一种关于如何提高对重构音频信号的源点方向的感知的技术。具体地,本发明提出了一种用于再现所记录的音频信号的设备和方法,使得相对于来自其他方向的音频信号可以对音频源的可选方向进行强化或过加权(over-weighted)。 
背景技术
通常,在多声道再现和收听中,收听者被多个扬声器环绕。存在捕获针对特定设置(set-up)的音频信号的各种方法。通常,再现的目标之一是再现原始记录的声音事件的空间合成,即各个音频源的源点(origin),如管弦乐队内喇叭的位置。相当常见的多个扬声器设置可以产生不同的空间感。不使用特殊的后生产技术,通常已知的两声道立体声设置可以仅在两个扬声器之间的线上重建听觉事件。这主要通过所谓的“振幅-平移(panning)”来实现,其中取决于音频源相对于扬声器的位置,与一个音频源相关的信号的振幅分布在两个扬声器之间。这通常在记录或后续的混音期间进行。即,来自相对于收听位置较远左侧的音频源将主要通过左扬声器再现,而在收听位置前面的音频源将通过这两个扬声器以相同的振幅(电平)再现。然而,不能再现从其他方向发出的声音。 
因此,通过使用分布在收听者周围的更多扬声器,可以覆盖更多方向,并且可以产生更加自然的空间感。可能最公知的多声道扬声器布局是5.1标准(ITU-R775-1),其包括5个扬声器,将这些扬声器相对于收听位置的方位角预先确定为0°、±30°和±110°。这表示,在记录或混音期间,将信号调整为特定扬声器配置,而且根据该标准的再现设置的偏差将导致再现质量降低。 
也提出了具有位于不同方向上的不同数目的扬声器的多个其他系统。专业 和专用系统(尤其在影院和声音装置中)也包括不同高度的扬声器。 
根据不同的再现设置,针对先前提及的扬声器系统设计并提出了若干不同的记录方法,以便记录和再现收听情况下如同记录环境中所感知到的空间感。理论上用于记录针对所选多声道扬声器系统的空间声音的的理想方式是使用与扬声器个数相同的麦克风。在这种情况下,麦克风的方向性图案(pattern)也应与扬声器布局相对应,使得只使用少量麦克风(1、2或更多)来记录来自任意的单方向的声音。每个麦克风与特定扬声器相关联。越多的扬声器用于再现,麦克风的方向性图案越窄。然而,窄方向麦克风相当昂贵,并具有典型非平坦的频率响应,以超出预期的方式使所记录的声音的质量发生恶化。此外,由于总是使用以比所需更多的麦克风来再现从单个方向发出的声音,使用具有过宽方向性图案的多个麦克风作为多声道再现的输入导致歪曲(colored)和模糊的听觉感知,好似其是以与不同扬声器相关联的麦克风而记录的。通常,当前可用的麦克风最适于两声道的记录和再现,即,这些麦克风并不是以再现环绕空间感为目标设计的。 
从麦克风设计的观点来看,讨论了各种方式以调整麦克风的方向性图案,以满足空间-音频-再现中的需求。通常,所有麦克风依据声音到达麦克风的方向来有差别地捕获声音。即,麦克风具有不同的灵敏度,这取决于所记录声音的到达方向。在一些麦克风中,该影响是微小的,因为这些麦克风捕获的是与方向几乎无关的声音。这些麦克风通常被称为全向麦克风。在典型的麦克风设计中,将圆形隔膜(circular diaphragm)附在小的气密(airtight)壳上。如果隔膜没有附在壳上,声音等同地从每一侧到达壳,其方向性图案具有两个波瓣。即,这种麦克风以相等的灵敏度从隔膜的前后捕获声音,然而极性相反。这种麦克风并不捕获来自与隔膜平面垂直(即与最大灵敏度方向垂直)的方向的声音。这种方向性图案被称为偶极子或八字。 
使用用于麦克风的非气密壳,也可以将全向麦克风修改为方向性麦克风。 该壳特别构造,使得允许声波通过该壳传播并到达隔膜,其中一些传播方向是优选的,从而这种麦克风的方向性图案成为全向和偶极子之间的图案。例如,这些图案可以具有两个波瓣。然而,这些波瓣可以具有不同强度。一些通常已知的麦克风具有仅仅单个波瓣的图案。最重要的示例是心形图案,其中可以将方向性函数D表示为D=1+cos(θ),θ是声音到达的方向。因而方向性函数依据方向来量化输入声音振幅中被捕获的部分。 
先前讨论的全向图案也被称为零阶图案,先前所提及的其他图案(偶极子和心形)被称为一阶图案。所有先前讨论的麦克风设计不允许方向性图案的任意成形,因为它们的方向性图案完全由其机械构造来确定。 
为了部分地克服该问题,设计了一些专用声学结构,可以用于产生比一阶麦克风的方向性图案更窄的方向性图案。例如,当将有孔的管附在全向麦克风上时,可以产生具有窄方向性图案的麦克风。这些麦克风被称为猎枪或步枪式麦克风。然而,它们典型不具有平坦的频率响应,即以所记录声音的质量为代价来使方向性图案变窄。此外,该方向性图案由几何构造预先确定,因而以这种麦克风执行的记录的方向性图案在该记录后不能得到控制。 
因此,提出了其他方法以部分地允许在实际记录之后改变方向性图案。通常,这依赖于以全向或方向性麦克风阵列记录声音、并在之后应用信号处理的基本思想。近来提出了各种这样的技术。相当简单的示例是使用彼此靠近的两个全向麦克风来记录声音,并从彼此中减去信号。这产生了具有等同于偶极子的方向性图案的虚拟麦克风信号。 
在其他更加复杂的方案中,也可以在将麦克风信号相加之前对其进行时延或滤波。使用波束形成(也是无线局域网中公知的技术),通过利用特别设计的滤波器对每个麦克风信号进行滤波,并在滤波之后将信号相加(滤波-求和波束形成),来形成与窄波束相对应的信号。然而,这些技术对于信号本身来说是隐蔽的(blind),即,它们不知道声音到达的方向。因而,必须定义预定的方向性 图案,这与声音源在预定方向的实际出现无关。通常,对声音的“到达方向”的估计是其自身的任务。 
通常,可以使用以上的技术来形成各种不同的空间方向特性。然而,形成任意的空间选择性灵敏度图案(即,形成窄的方向性图案)需要多个麦克风。 
产生多声道记录的可选方式是将麦克风定位在靠近要记录的每个声源(例如,乐器)处,并通过在最终混音中控制紧靠(close-up)麦克风信号的电平来重新产生空间感。然而,这种系统在产生最终的立体声缩混(downmix)的过程中需要大量麦克风和许多用户交互。 
近来已经提出了克服上述问题的方法,被称为方向性音频编码(DirAC),这种方法可以与不同的麦克风系统一起使用,并能够记录声音以便使用任意扬声器设置进行再现。DirAC的目的是使用具有任意几何设置的多声道扬声器系统,尽可能精确地再现现有声学环境的空间感。在记录环境中,以全向麦克风(W)和允许测量声音到达方向以及声音扩散的麦克风组来测量环境的响应(可以是连续记录的声音或脉冲响应)。在以下段落中以及在本申请中,术语“扩散”应被理解为针对声音的非方向性的测量。即,以相等的强度从所有方向到达收听或记录位置的声音是最大扩散的。量化扩散的通常方式是使用来自区间[0,…,1]的扩散值,其中,值1描述了最大扩散的声音,以及值0描述了理想的定向声音,即仅从一个可清晰辨识的方向到达的声音。通常测量一个已知的声音到达方向的方法是应用与笛卡尔坐标轴对齐的3个八字麦克风(XYZ)。设计了专用麦克风(所谓的“声场麦克风”),直接产生所有期望的响应。然而,如以上所提及的,W、X、Y和Z信号也可以根据离散全向麦克风组来计算。 
在DirAC分析中,将所记录的声音信号分至与人类听觉感知的频率选择性相对应的频道(frequency channel)。即例如,该信号通过滤波器组或傅立叶变换来处理,以将信号分至多个频道,具有适于人类听觉的频率选择性的带宽。然后,分析频带信号以确定声音源点的方向和针对具有预定时间分辨率 (resolution)的每个频道的扩散值。该时间分辨率并不需要是固定的,并且当然可以适合于记录环境。在DirAC中,在记录或传输所分析的方向和扩散数据时同时记录或传输一个或更多个音频声道。 
在合成或解码中,最终应用于扬声器的音频声道可以基于全向声道W(由于所使用的麦克风的全向方向性图案而以高质量记录),或者针对每个扬声器的声音可以被计算为W、X、Y和Z的加权和,因而形成针对每个扬声器的具有特定方向特性的信号。与编码相对应,将每个音频声道分为频道,可选地,还依据所分析的扩散,将频道分为扩散或非扩散流。如果测量扩散为高,则可以使用产生声音扩散感知的技术(例如也用于立体声提示编码中的去相关技术)来再现扩散流。使用致力于产生类似点的虚拟音频源(位于在分析中发现的方向数据所指示的方向上)的技术,即产生DirAC信号,来再现非扩散声音。即,如在现有技术中,并不使空间再现适合于一个特定的“理想”扬声器设置(例如,5.1)。这尤其是以下情况:使用与用于记录的麦克风的方向性图案有关的知识,根据方向参数(即通过矢量来描述)来确定声音的源点。如已经讨论的,以频率选择性方式来将三维空间中的声音源点参数化。这样,只要扬声器设置的几何结构是已知的,便可以以高质量针对任意扬声器设置来再现方向感。因此,DirAC并不限于特定的扬声器几何结构,并通常允许对空间的声音的更加灵活的再现。 
美国专利US 5,812,674中披露了一种对由虚拟音频源(virtual sound source)产生的音频品质进行仿真(simulation)并将这些音频源限定于一个或多个听众的方法。为了实现期望音频的自然再现,感知参数(perceptual)限定了被使用的虚拟音频源的空间大小、期望的音频品质以及定位情况。这些数值用来计算脉冲响应,其通过能量的分布来定义一时间与频率的函数。为了顾及到基于上述空间的情况所计算的主要信号的空间效果和不自热的回响,需执行前后补偿。一旦空间的音响效果在前述描绘方式中确定下来,录制下来的音频样本可能进行后处理,使得其听起来如同是在人工构造房里录制一般。 
尽管已经开发了许多技术来再现多声道音频记录,并记录用于之后的多声道再现的适合信号,但是现有技术中并不允许对已经记录的信号产生影响,使得可以在再现期间强化音频信号的源点方向,例如可以增强来自一个独特的期望方向的信号的清晰度。 
发明内容
根据本发明的一个实施例,可以重构具有至少一个音频声道和用于指示相对于记录位置的音频声道的一部分的源点方向的相关联的方向参数的音频信号,以允许增强来自特定方向或来自多个特定方向的信号的感知度。 
即,在再现中,可以选择相对于记录位置的期望源点方向。在导出重构音频信号的重构部分时,修改音频声道的该部分,使得相对于具有指示远离期望源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近期望源点方向的源点方向的方向参数的音频声道的一部分的强度。可以强化音频声道或多声道信号中一部分的源点方向,从而允许对在记录期间位于所选方向上的音频对象的更好地感知。 
根据本发明的另一实施例,用户可以在重构期间选择应当强化的一个或多个方向,从而强化与所选方向相关联的音频声道的部分或多个音频声道的部分,即相对于剩余部分增大其强度或振幅。根据实施例,可以使用比未实现方向参数的系统尖锐得多的空间分辨率对来自特定方向的声音进行强化或衰减。根据本发明的另一实施例,可以指定任意的空间加权函数,该函数以常规麦克风无法实现。此外,加权函数可以是随时间和频率而变化的,从而可以以高灵敏度使用本发明的其他实施例。此外,加权函数非常易于实现和更新,因为仅需将它们载入系统而不是更换硬件(例如,麦克风)。 
根据本发明的另一实施例,对具有相关联的扩散参数(该扩散参数指示音频声道的一部分的扩散)进行重构,使得相对于具有相关联的较低扩散的音频声道的其他部分,减小具有高扩散的音频声道的一部分的强度。 
因此,在音频信号的重构过程中,可以考虑音频信号的各个部分的扩散,以进一步增加重构信号的方向感知。此外,相对于仅使用扩散声音部分来增加信号的总扩散、而非利用针对音频源的更好重分布的扩散信息的技术,这可以增大音频源的重分布。应注意,本发明还允许相反地强化具有扩散源点的所记录声音的部分,例如环境信号。 
根据另一实施例,将至少一个音频声道上混音(upmix)至多个音频声道。多个音频声道可与用于回放的扬声器的数目相对应。可以使用任意扬声器设置增强音频源的重分布,同时可以保证总是尽可能好地使用现有设备再现音频源的方向,而不用考虑可用扬声器的数目。 
根据本发明的另一实施例,甚至可以经由单声道扬声器执行再现。当然,在这种情况下,信号源点方向将是扬声器的实际位置。然而,通过选择相对于记录位置的信号的期望源点方向,与简单的立体声缩混回放相比,可以显著地增大源于所选方向的信号的可听性。 
根据本发明的另一实施例,当将一个或更多个声道上混音至与扬声器相对 应的多个声道时,可以精确地再现信号的源点方向。例如,通过使用振幅平移技术,可以尽可能好地重构源点方向。为了进一步提高感知质量,也可以依据所选方向引入附加相移。 
另外,本发明的特定实施例可以减少用于记录音频信号的麦克风传声器头(capsule)的成本,而不会严重影响音频质量,这是因为至少用于确定方向/扩散估计的麦克风无需具有平坦的频率响应。 
附图说明
以下将参照附图对本发明的若干实施例进行描述。 
图1示出了用于重构音频信号的方法实施例; 
图2示出了用于重构音频信号的设备框图; 
图3示出了另一实施例的框图; 
图4示出了在电话会议场景中的本发明的方法或本发明的设备的应用示例; 
图5示出了用于增强音频信号的方向性感知的方法实施例; 
图6示出了用于重构音频信号的解码器实施例;以及 
图7示出了用于增强音频信号的方向性感知的系统实施例。 
具体实施方式
图1示出了用于重构音频信号的方法实施例,该音频信号具有至少一个音频声道和指示相对于记录位置的音频声道的一部分的源点方向的相关联的方向参数。在选择步骤10中,针对重构音频信号的重构部分,选择相对于记录位置的期望源点方向,其中重构部分与音频声道的一部分相对应。即,针对要处理的信号部分来选择源点方向,在重构之后应可从该源点方向清楚地听见该信号部分。可以直接通过用户输入或自动地做出该选择,如下所述。 
该部分可以是音频声道的时间部分、频率部分或特定频率间隔的时间部分。 在修改步骤12中,修改音频声道的该部分,以导出重构音频信号的重构部分,其中该修改包括:相对于具有指示远离期望的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近期望的源点方向的方向参数的音频声道的一部分的强度。即,通过增大强度或电平来强化音频声道的该部分,例如,可以通过把缩放因子与音频声道的该部分相乘实现。根据实施例,把大的缩放因子乘以源自靠近所选(期望)方向的方向的部分,以在重构过程中强化这些信号部分,并提高收听者所感兴趣的这些音频记录对象的可听性。通常,在该申请的上下文中,应将信号或声道强度的增大理解为使信号呈现更好的可听性的任何措施。例如,这可以是增大信号振幅、增大信号所携带的能量,或者把信号乘以大于单位1(unity)的缩放因子。可选地,可以减小竞争信号的响度以实现该效果。 
在收听地点,用户可以通过用户接口直接执行期望方向的选择。然而,根据可选实施例,该选择可以自动地执行,例如通过分析方向性参数而自动执行,从而强化了具有大致相同源点的频率部分,而抑制了音频声道的剩余部分。因此,可以使信号自动汇聚于主要音频源处,而不需要收听端处的额外的用户输入。 
根据其他实施例,由于已经设置了源点方向,所以省略选择步骤。即,增大具有指示靠近所设置方向的源点方向的方向参数的音频声道的一部分的强度。例如,所设置的方向可以是硬接线的(hardwired),即该方向可以是预定的。例如,如果仅对电话会议场景中的中心谈话者感兴趣,则可以使用预定设置方向来实现。可选实施例可以从存储器中读取设置方向,该存储器也可以存储多个待用作设置方向的可选方向。例如,在打开本发明的设备时,可以读取这些方向之一。 
根据可选实施例,也可以在编码器侧(即,在记录信号时)执行期望方向的选择,使得可以随音频信号一起传输附加参数,该附加参数指示用于再现的 期望方向。因此,可能已经在编码器侧选择重构信号的空间感知,而无需知道用于再现的特定扬声器设置。 
由于用于重构音频信号的方法独立于意在再现重构音频信号的特定扬声器设置,所以可以将该方法应用于单声道或立体声或多声道扬声器配置。即,根据另一实施例,可以对所再现的环境的空间感进行后处理,以增强信号的感知度。 
当用于单声道回放时,可以将该效果解释为以能够形成任意的方向性图案的新式麦克风来记录信号。然而,可以在接收端(即在信号回放期间)完全地获得该效果,而无需对记录设置做出任何改变。 
图2示出了用于重构音频信号的设备(解码器)的实施例,即用于重构音频信号的解码器20的实施例。解码器20包括方向选择器22和音频部分修改器24。根据图2的实施例,由方向分析器28来分析若干麦克风所记录的多声道音频输入26,该方向分析器28导出指示音频声道一部分的源点方向(即所分析的信号部分的源点方向)的方向性参数。根据本发明的一个实施例,选择将大部分能量入射到麦克风的方向。针对每个特定信号部分来确定记录位置。例如,这也可以使用先前所描述的DirAC-麦克风-技术来实现。当然,基于所记录的音频信息的其他方向性分析方法也可以用于实现该分析。因此,方向分析器28导出方向参数30,该方向参数30指示音频声道的一部分或多声道信号26的一部分的源点方向。此外,可以操作方向性分析器28以导出针对每个信号部分(例如,针对信号的每个频率间隔或每个时帧)的扩散参数32。 
将方向性参数30以及(可选地)扩散参数32传输至方向选择器22,该方向选择器22实现用于针对重构音频信号的重构部分选择关于记录位置的期望的源点方向。将与期望方向有关的信息传输至音频部分修改器24。音频部分修改器24接收至少一个音频声道34,具有针对其导出方向参数的一部分。例如,通过音频部分修改器修改的至少一个声道可以是由传统多声道立体声缩混算法 产生的多声道信号26的立体声缩混。一个极其简单的情况是多声道音频输入26的信号的直接求和。然而,因为本发明的实施例并不由输入声道的个数而限定,因而在可选实施例中,音频解码器20可以同时处理所有音频输入声道26。 
音频部分修改器24对音频部分进行修改,以导出重构音频信号的重构部分,其中该修改包括:相对于具有指示远离期望源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近期望源点方向的源点方向的方向参数的音频声道的一部分的强度。在图2的示例中,通过将缩放因子36(q)乘以要修改的音频声道部分来执行该修改。即,如果分析该音频声道部分源于靠近所选期望方向,将大的缩放因子36乘以该音频部分。因而在其输出38处,音频部分修改器输出与在其输入处提供的音频声道部分相对应的重构音频信号的重构部分。如在音频部分修改器24的输出38处的虚线所示,这不仅针对单输出信号执行,而且还针对多声道输出信号执行,针对该多声道输出信号的输出声道的个数是不固定或预定的。 
换言之,音频解码器20的实施例根据例如DirAC中使用的方向性分析来获取其输入。可以根据人类听觉系统的频率分辨率,把来自麦克风阵列的音频信号26分为频带。依据每个频道中的时间来分析声音的方向以及(可选的)声音的扩散。例如,这些属性以方向角(方位角(azi)和仰角(ele))和扩散索引Psi(在0和1之间改变)进行传递。 
然后,通过对所获取的信号使用加权操作(该操作取决于方向角azi和/或ele、以及(可选的)扩散(Psi)),对所获取的信号施加意欲或所选的方向特性。很明显,可以针对不同频带有所区别地指定该加权,并且该加权通常会随时间改变。 
图3示出了基于DirAC合成的本发明的另一实施例。在这种意义上,图3的实施例可以被解释为DirAC再现的增强,这允许依据所分析的方向来控制声音的电平。这使得可以强化来自一个或多个方向的声音、或者抑制来自一个或 多个方向的声音。当应用于多声道再现时,实现对所再现声音图像的后处理。如果仅使用一个声道作为输出,则该效果等同于在信号记录期间使用具有任意方向性图案的方向性麦克风。在图3中示出的实施例中,示出了方向参数的导出、以及一个传输音频声道的导出。例如,基于由声场麦克风所记录的B格式麦克风声道W、X、Y和Z来执行该分析。 
逐帧地(frame-wise)执行该过程。因此,将连续音频信号分为帧,通过窗函数来对帧进行缩放,从而避免帧边界处的不连续。在傅立叶变换块40中对加窗信号帧进行傅立叶变换,将麦克风信号分为N个频带。为了简单,将在以下段落中描述一个任意频带的处理,因为对余下的频带进行等同的处理。傅立叶变换块40导出描述所分析的加窗帧内每个B格式麦克风声道W、X、Y和Z中出现的频率分量的强度的系数。将这些频率参数42输入音频编码器44以导出音频声道和相关联的方向参数。在图3中示出的实施例中,选择所传输的音频声道为全向声道46,该全向声道46具有与来自所有方向的信号有关的信息。基于针对B格式麦克风声道的全向和定向部分的系数42,通过方向性分析块48执行方向性和扩散分析。 
将针对音频声道46的所分析部分的声音的源点方向传输至音频解码器50,以便对音频信号和全向声道46一同进行重构。当存在扩散参数52时,将信号路径分为非扩散路径54a和扩散路径54b。非扩散路径54a根据参数而进行缩放,从而在扩散Ψ为高时,大多数能量或振幅将保持在非扩散路径中。相反,当扩散为高时,大多数能量将移至扩散路径54b。在扩散路径54b中,使用去相关器56a或56b对信号进行去相关或扩散。可以使用传统已知技术来执行去相关,例如与白噪声信号进行卷积,其中白噪声信号可以逐频道而不同。只要去相关是保存能量的,便可以通过对输出处的非扩散信号路径54a和扩散信号路径54b的信号简单地相加,重新生成最终输出,因为已经对信号路径上的信号进行了缩放,如扩散参数Ψ所指示。可以依据扬声器个数,使用适合的缩放规则对扩 散信号路径54b进行缩放。例如,可以使扩散路径中的信号缩放 ,其中N是扬声器的个数。 
当针对多声道设置执行重构时,将直接信号路径54a和扩散信号路径54b分裂为与各个扬声器信号相对应的多个子路径(在分裂位置58a和58b处)。为此,可以将在分裂位置58a和58b处的分裂解释为等同于将至少一个音频声道上混音至多个声道以便经由具有多个扬声器的扬声器系统进行回放。因此,多个声道中的每一个都具有音频声道46的声道部分。通过重定向块60来重构各个音频部分的源点方向,其中重定向块60额外地增大或减小与用于回放的扬声器相对应的信道部分的强度或振幅。为此,重定向块60通常需要知道用于回放的扬声器设置。例如,可以使用如基于矢量的振幅平移的技术,实现相关联的加权因子的实际重分布(重定向)和导出。通过向重定向块60提供不同的几何扬声器设置,可以使用回放扬声器的任意配置来实现本发明的概念,而不会损坏再现质量。在处理之后,通过逆傅立叶变换块62,对频域信号执行多个逆傅立叶变换,以导出可以通过各个扬声器进行回放的时域信号。在回放之前,必须通过求和单元64来执行重叠和相加技术,以连接各个音频帧,从而导出连续的时域信号,准备好由扬声器进行回放。 
根据图3中示出的本发明的实施例,修改Dir-AC的信号处理,即引入音频部分修改器66来修改实际处理的音频声道的部分,这允许增大具有指示靠近期望方向的源点方向的方向参数的音频声道部分的强度。这通过将附加的加权因子应用于直接信号路径而实现。即,如果所处理的频率部分源于期望方向,则通过将附加增益应用于该特定信号部分来强化信号。可以在分裂点58a之前执行增益的应用,因为该效果应当对所有的声道部分产生同等的作用。 
在可选实施例中,附加加权因子的应用也可以在重分布块60中实现,在这种情况下,重分布块60应用增大或减小附加增益因子的重分布增益因子。 
当对多声道信号的重构中使用方向性增强时,可以用如图3所示的DirAC 呈现方式来执行再现。将要再现的音频声道分为等于方向性分析所使用的那些频带。然后将这些频带分为扩散流和非扩散流。例如,通过在与30ms的宽噪声脉冲串进行卷积之后将声音作用于每个扬声器,从而再现扩散流。每个扬声器的噪声脉冲串均不相同。将非扩撒流应用于从方向性分析所传递的方向,当然,该方向性分析取决于时间。为了实现多声道扬声器系统中的方向感知,可以使用简单的逐对或逐三元组的振幅移动。此外,每个频道乘以增益因子或缩放因子,这取决于所分析的方向。通常,可以指定函数,该函数定义了用于再现的期望的方向性图案。例如,这可以是应当被强化的仅仅一个方向。然而,任意的方向性图案都易于以图3的实施例来实现。 
在以下的方式中,将本发明的另一实施例描述为处理步骤的列表。该列表基于以下假设:以B格式麦克风记录声音,然后进行处理,以便使用DirAC样式的呈现或提供参数(指示音频声道部分的源点方向)的呈现,利用多声道或单声道扬声器设置进行收听。该过程如下: 
1.将麦克风信号分为多个频带并在每个频带处取决于频率来分析方向和(可选的)扩散。作为示例,可以通过方位角和仰角(azi、ele)来对方向进行参数化。 
2.指定函数F,该函数描述了期望的方向性图案。该函数可以具有任意形状。其典型地取决于方向。此外,如果扩散信息可用,该函数也可以取决于扩散。针对不同频率,该函数可以不同,也可以依据时间而更改。在每个频带处,针对每个时间实例,根据函数F导出方向性因子q,该方向性因子q用于后续的音频信号的加权(缩放)。 
3.将音频信号的采样值与和每个时间和频率部分相对应的方向性因子q值相乘,以形成输出信号。这可以用时间和/或频率域表示来进行。此外,例如,该过程可以实现为针对任意数目的期望输出声道的DirAC呈现的一部分。 
如先前所述,可以使用多声道或单声道扬声器系统收听结果。 
图4示出了关于如何利用本发明的方法和设备大大增加电话会议场景内参与者的感知度的示例。在记录侧100,示出了四个谈话者102a-102d,他们具有相对于记录位置104不同的朝向。即,源自谈话者102c的音频信号具有相对于记录位置104的固定的源点方向。假设在记录位置104处记录的音频信号具有来自谈话者102c的信号和例如一些源自谈话者102a和102b的讨论的“背景”噪声信号,那么所记录和传输至收听地点110的宽带信号将包括这两个信号分量。 
作为示例,描绘了具有六个扬声器112a-112f的收听设置,这六个扬声器环绕着位于收听位置114处的收听者。因此,原理上,可以通过图4所描述的设置来再现围绕收听者的位置114处源自大多数任意位置的声音。传统的多声道系统将使用这六个扬声器112a-112f来再现声音,以尽可能在记录期间重构在记录位置104处体验到的空间感。因此,在使用传统技术再现声音时,也可清晰地听见在正在讨论的谈话者102a和102b的“背景”下的谈话者102c的声音,这降低了谈话者102c的信号的清晰度。 
根据本发明的实施例,可以使用方向选择器来选择相对于记录位置的期望源点方向,其用于将由扬声器112a-112f回放的重构音频信号的重构版本。因此,收听者114可以选择与谈话者102c的位置相对应的期望方向116。因此,音频部分修改器可以修改音频声道的部分,以导出重构音频信号的重构部分,从而强化源自靠近所选方向116的方向的音频声道部分的强度。在接收端,收听者可以决定应当再现哪个源点方向。选择仅强化源自谈话者102c的方向的那些信号部分,正在讨论的谈话者102a和102b的干扰将变小。除了强化来自所选方向的信号之外,可以通过振幅平移来再现该方向,如波形120a和120b所示。因为谈话者102c将比扬声器112c更加靠近扬声器112d,所以振幅平移将导致经由扬声器112c和112d对强化信号的再现,而余下的扬声器将几乎是安静的(最终对扩散信号部分进行回放)。因为谈话者102c更加靠近扬声器112d,所 以振幅平移将增大扬声器112d相对于扬声器112c的电平。 
图5示出了用于增强音频信号的方向感知的方法实施例的框图。在第一分析步骤150中,导出至少一个音频声道和指示相对于记录位置的音频声道一部分的源点方向的相关联的方向参数。 
在选择步骤152中,针对重构音频信号的重构部分,选择相对于记录位置的期望的源点方向,所述重构部分与音频声道的一部分相对应。 
在修改步骤154中,对音频声道的该部分进行修改,以导出重构音频信号的重构部分,其中该修改包括:相对于具有指示远离期望源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近期望源点方向的源点方向的方向参数的音频声道的一部分的强度。 
图6示出了用于重构音频信号的音频解码器的实施例,所述音频信号具有至少一个音频声道160和指示相对于记录位置的音频声道部分的源点方向的相关联的方向参数162。 
音频解码器158包括方向选择器164,用于针对重构音频信号的重构部分,选择相对于记录位置的期望源点方向,所述重构部分与音频声道的一部分相对应。解码器158还包括音频部分修改器166,用于修改音频声道的一部分,以导出重构音频信号的重构部分,其中该修改包括:相对于具有指示远离期望源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近期望源点方向的源点方向的方向参数的音频声道的一部分的强度。 
如图6所示,当解码器用于多声道再现设置中时,可以导出单个重构部分168,或者可以同时导出多个重构部分170。如图7所示的用于增强音频信号180的方向感知的系统实施例基于图6的解码器158。因此,以下仅对额外引入的元件进行描述。用于增强音频信号的方向感知的系统180接收音频信号182作为输入,该音频信号182可以是多个麦克风所记录的单声道信号或多声道信号。音频编码器184导出音频信号,该音频信号具有至少一个音频声道160和指示 相对于记录位置的音频声道一部分的源点方向的相关联的方向参数162。此外,如已经针对图6的音频解码器所描述,对所述至少一个音频声道和相关联的方向参数进行处理,以导出在感知上增强的输出信号170。 
尽管主要在多声道音频再现领域描述了本发明,不同领域的应用也可以从本发明的方法和设备中获益。作为示例,本发明的概念可以用于集中(通过提升或衰减)电话会议场景下的特定个人发言。此外,其可以用于抑制(或放大)环境分量,以及用于去混响或混响增强。其他可能的应用场景包括环境噪声信号的噪声抵消。另一可能的用途可以是助听器信号的方向性增强。 
依据本发明方法的特定实现需求,可以用硬件或软件来实现本发明的方法。可以使用与可编程计算机系统协作的数字存储介质(尤其是具有电可读控制信号存储于其上的盘、DVD或CD)来执行该实现本发明方法。因而通常本发明是具有存储在机器可读载体上的程序代码的计算机程序产品,该程序代码操作用于在计算机程序产品运行在计算机上时执行本发明的方法。换言之,用于在计算机上运行的计算机程序是执行本发明方法中的至少一种。 
尽管已经参照特定实施例特别示出并描述了以上内容,但是本领域技术人员可以领会在不偏离本发明的精神和范围的情况下做出的形式和细节上的各种其他改变。应理解,可以在适合于不同实施例的过程中做出各种改变,而不偏离这里所公开的、并由所附权利要求所限定的更宽的概念。 

Claims (18)

1.一种用于重构音频信号的方法,所述音频信号具有至少一个音频声道和用于指示相对于记录位置的音频声道的一部分的源点方向的相关联的方向参数,所述方法包括步骤:
选择一组相对于记录位置的所设置源点方向;以及
修改音频声道的所述一部分,以导出(deriving)重构音频信号的重构部分,其中所述的修改包括:相对于具有指示远离所设置源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近所设置源点方向的源点方向的方向参数的音频声道的一部分的强度。
2.如权利要求1所述的方法,其中所述的选择步骤包括:从存储器读取所设置方向。
3.如权利要求1所述的方法,其中所述的修改包括:修改音频信号的一部分的频域表示。
4.如权利要求1所述的方法,其中所述的修改包括:修改音频信号的一部分的时域表示。
5.如权利要求1所述的方法,其中所述的修改包括:导出针对音频声道的每个部分的缩放因子,使得相对于具有指示远离期望源点方向的源点方向的相关联的方向参数的音频声道的另一已缩放部分,具有指示靠近期望源点方向的源点方向的相关联的方向参数的音频声道的已缩放部分,即通过把音频声道的该部分与所述缩放因子相乘而导出的缩放部分具有增大的强度。
6.如权利要求1所述的方法,还包括步骤:导出至少一个音频声道的频率表示。
7.如权利要求6所述的方法,其中所述导出步骤包括:导出至少一个音频声道的第一和第二有限宽度频率间隔的表示,其中所述第一频率间隔的宽度不同于所述第二频率间隔的宽度。
8.如权利要求1所述的方法,其中选择期望源点方向的步骤包括:接收指示期望方向的输入参数作为用户输入。
9.如权利要求1所述的方法,其中选择期望方向的步骤包括:接收与音频信号相关联的方向参数,所述方向参数指示期望方向。
10.如权利要求1所述的方法,其中选择期望方向的步骤包括:确定至少一个音频声道的有限宽度频率间隔的源点方向。
11.如权利要求1所述的方法,还包括步骤:
接收与音频声道相关联的扩散参数,所述扩散参数指示音频声道的一部分的扩散;以及
其中修改音频声道的一部分的步骤包括:相对于具有指示较低扩散的扩散参数的音频声道的其他部分,减小具有指示高扩散的扩散参数的音频声道的一部分的强度。
12.如权利要求1所述的方法,还包括步骤:
将至少一个音频声道上混音至多声道,以经由具有多个扬声器的扬声器系统进行回放,其中多声道中的每一个都具有与至少一个音频声道的一部分相对应的声道部分。
13.如权利要求12所述的方法,其中所述修改步骤包括:相对于从具有指示远离期望源点方向的源点方向的方向参数的音频声道的其他部分上混音得到的多声道的其他声道部分,增大从具有指示靠近源点期望方向的源点方向的方向参数的音频声道的一部分上混音的每个声道部分的强度。
14.如权利要求13所述的方法,还包括步骤:
移动声道部分的振幅,使得重构声道部分的所感知源点方向与使用预定扬声器设置进行回放时的源点方向相对应。
15.一种用于增强音频信号的方向感知的方法,所述方法包括:
导出至少一个音频声道和指示音频声道的一部分相对于记录位置的源点方向的相关联的方向参数;
选择一组相对于记录位置的所设置源点方向;以及
修改音频声道的一部分,以导出重构音频信号的重构部分,其中所述修改包括:相对于具有指示远离所设置源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近所设置源点方向的源点方向的方向参数的音频声道的一部分的强度。
16.一种用于重构音频信号的音频解码器,所述音频信号具有至少一个音频声道和指示相对于记录位置的音频声道的一部分的源点方向的相关联的方向参数,所述音频解码器包括:
一方向选择器,供选择一组相对于记录位置的所设置源点方向;和
一音频部分修改器,用于修改音频声道的一部分,以导出重构音频信号的重构部分,其中所述修改包括:相对于具有指示远离所设置源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近所设置源点方向的源点方向的方向参数的音频声道的一部分的强度。
17.一种用于增强音频信号的方向感知的音频编码器,该音频编码器包括:
一信号生成器,用于导出至少一个音频声道和指示了相对于记录位置的音频声道的一部分的源点方向的关联方向参数;
一方向选择器,供选择一组相对于记录位置的所设置源点方向;和
一信号修改器,用于修改音频声道的一部分,以便导出重构音频信号的重构部分,其中所述修改包括:相对于具有指示远离所设置源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近所设置源点方向的源点方向的方向参数的音频声道的一部分的强度。
18.一种用于增强重构音频信号的系统,所述系统包括:
一音频编码器,用于导出音频信号,所述音频信号具有至少一个音频声道和指示相对于记录位置的音频声道的一部分的源点方向的相关联的方向参数;
一方向选择器,供选择一组相对于记录位置的所设置源点方向;和
一具有音频部分修改器的音频解码器,用于修改音频声道的一部分,以导出重构音频信号的重构部分,其中所述修改包括:相对于具有指示远离所设置源点方向的源点方向的方向参数的音频声道的其他部分,增大具有指示靠近所设置源点方向的源点方向的方向参数的音频声道的一部分的强度。
CN2008800088335A 2007-03-21 2008-02-01 用于音频重构增强的方法和设备 Active CN101658052B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US89618407P 2007-03-21 2007-03-21
US60/896,184 2007-03-21
US11/742,488 US20080232601A1 (en) 2007-03-21 2007-04-30 Method and apparatus for enhancement of audio reconstruction
US11/742,488 2007-04-30
PCT/EP2008/000829 WO2008113427A1 (en) 2007-03-21 2008-02-01 Method and apparatus for enhancement of audio reconstruction

Publications (2)

Publication Number Publication Date
CN101658052A CN101658052A (zh) 2010-02-24
CN101658052B true CN101658052B (zh) 2013-01-30

Family

ID=39322757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800088335A Active CN101658052B (zh) 2007-03-21 2008-02-01 用于音频重构增强的方法和设备

Country Status (12)

Country Link
US (1) US20080232601A1 (zh)
EP (1) EP2130403B1 (zh)
JP (1) JP5455657B2 (zh)
KR (1) KR101096072B1 (zh)
CN (1) CN101658052B (zh)
AT (1) ATE476835T1 (zh)
BR (1) BRPI0808225B1 (zh)
DE (1) DE602008002066D1 (zh)
HK (1) HK1138977A1 (zh)
RU (1) RU2416172C1 (zh)
TW (1) TWI456569B (zh)
WO (1) WO2008113427A1 (zh)

Families Citing this family (55)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
US8180062B2 (en) * 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
PL2154677T3 (pl) * 2008-08-13 2013-12-31 Fraunhofer Ges Forschung Urządzenie do wyznaczania konwertowanego przestrzennego sygnału audio
CN102804806A (zh) * 2009-06-23 2012-11-28 诺基亚公司 用于处理音频信号的方法及装置
US9332346B2 (en) * 2010-02-17 2016-05-03 Nokia Technologies Oy Processing of multi-device audio capture
AU2011231565B2 (en) 2010-03-26 2014-08-28 Dolby International Ab Method and device for decoding an audio soundfield representation for audio playback
ES2656815T3 (es) * 2010-03-29 2018-02-28 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung Procesador de audio espacial y procedimiento para proporcionar parámetros espaciales en base a una señal de entrada acústica
CN101867853B (zh) * 2010-06-08 2014-11-05 中兴通讯股份有限公司 基于传声器阵列的语音信号处理方法及装置
WO2012004057A1 (en) * 2010-07-06 2012-01-12 Bang & Olufsen A/S A method and an apparatus for a user to select one of a multiple of audio tracks
WO2012025580A1 (en) * 2010-08-27 2012-03-01 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
US9313599B2 (en) 2010-11-19 2016-04-12 Nokia Technologies Oy Apparatus and method for multi-channel signal playback
US9456289B2 (en) 2010-11-19 2016-09-27 Nokia Technologies Oy Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof
US9055371B2 (en) * 2010-11-19 2015-06-09 Nokia Technologies Oy Controllable playback system offering hierarchical playback options
EP2600343A1 (en) * 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for merging geometry - based spatial audio coding streams
BR112014017457A8 (pt) * 2012-01-19 2017-07-04 Koninklijke Philips Nv aparelho de transmissão de áudio espacial; aparelho de codificação de áudio espacial; método de geração de sinais de saída de áudio espacial; e método de codificação de áudio espacial
CN104756524B (zh) * 2012-03-30 2018-04-17 巴科股份有限公司 用于创造音频系统中的邻近音响效果的设备和方法
EP2645749B1 (en) 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
EP2834995B1 (en) 2012-04-05 2019-08-28 Nokia Technologies Oy Flexible spatial audio capture apparatus
US20130315402A1 (en) 2012-05-24 2013-11-28 Qualcomm Incorporated Three-dimensional sound compression and over-the-air transmission during a call
WO2013186593A1 (en) * 2012-06-14 2013-12-19 Nokia Corporation Audio capture apparatus
US9268522B2 (en) 2012-06-27 2016-02-23 Volkswagen Ag Devices and methods for conveying audio information in vehicles
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
AU2013314299B2 (en) * 2012-09-12 2016-05-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for providing enhanced guided downmix capabilities for 3D audio
WO2014053875A1 (en) * 2012-10-01 2014-04-10 Nokia Corporation An apparatus and method for reproducing recorded audio with correct spatial directionality
US9396732B2 (en) * 2012-10-18 2016-07-19 Google Inc. Hierarchical deccorelation of multichannel audio
EP2733965A1 (en) * 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
CN103124386A (zh) * 2012-12-26 2013-05-29 山东共达电声股份有限公司 一种远讲用降噪、消回波、锐指向传声器
US9357306B2 (en) 2013-03-12 2016-05-31 Nokia Technologies Oy Multichannel audio calibration method and apparatus
CN105210389B (zh) * 2013-03-19 2017-07-25 皇家飞利浦有限公司 用于确定麦克风的位置的方法和装置
WO2014162171A1 (en) 2013-04-04 2014-10-09 Nokia Corporation Visual audio processing apparatus
RU2665214C1 (ru) 2013-04-05 2018-08-28 Долби Интернэшнл Аб Стереофонический кодер и декодер аудиосигналов
KR102547902B1 (ko) * 2013-04-26 2023-06-28 소니그룹주식회사 음성 처리 장치, 정보 처리 방법, 및 기록 매체
US9706324B2 (en) 2013-05-17 2017-07-11 Nokia Technologies Oy Spatial object oriented audio apparatus
TWI634798B (zh) * 2013-05-31 2018-09-01 新力股份有限公司 Audio signal output device and method, encoding device and method, decoding device and method, and program
CN104575515A (zh) * 2013-10-23 2015-04-29 中兴通讯股份有限公司 一种提高语音质量的方法及装置
RU2558642C2 (ru) * 2013-12-18 2015-08-10 Владимир Георгиевич Потёмкин Способ формирования сигнала для управления электроакустическим излучателем
EP2942982A1 (en) * 2014-05-05 2015-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
US9959876B2 (en) * 2014-05-16 2018-05-01 Qualcomm Incorporated Closed loop quantization of higher order ambisonic coefficients
JP6641304B2 (ja) * 2014-06-27 2020-02-05 ドルビー・インターナショナル・アーベー 非差分的な利得値を表現するのに必要とされる最低整数ビット数をhoaデータ・フレーム表現の圧縮のために決定する装置
CN105992120B (zh) * 2015-02-09 2019-12-31 杜比实验室特许公司 音频信号的上混音
US10176813B2 (en) 2015-04-17 2019-01-08 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
US11128978B2 (en) 2015-11-20 2021-09-21 Dolby Laboratories Licensing Corporation Rendering of immersive audio content
US20170264942A1 (en) * 2016-03-11 2017-09-14 Mediatek Inc. Method and Apparatus for Aligning Multiple Audio and Video Tracks for 360-Degree Reconstruction
JP6634976B2 (ja) * 2016-06-30 2020-01-22 株式会社リコー 情報処理装置、及びプログラム
WO2018064296A1 (en) 2016-09-29 2018-04-05 Dolby Laboratories Licensing Corporation Method, systems and apparatus for determining audio representation(s) of one or more audio sources
US10257633B1 (en) 2017-09-15 2019-04-09 Htc Corporation Sound-reproducing method and sound-reproducing apparatus
US10382878B2 (en) * 2017-10-18 2019-08-13 Htc Corporation Sound reproducing method, apparatus and non-transitory computer readable storage medium thereof
CN109688497B (zh) * 2017-10-18 2021-10-01 宏达国际电子股份有限公司 声音播放装置、方法及非暂态存储介质
AU2018368588B2 (en) 2017-11-17 2021-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions
GB2572419A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
GB2572420A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
GB2573537A (en) * 2018-05-09 2019-11-13 Nokia Technologies Oy An apparatus, method and computer program for audio signal processing
US11432069B2 (en) 2019-10-10 2022-08-30 Boomcloud 360, Inc. Spectrally orthogonal audio component processing
US11962989B2 (en) 2020-07-20 2024-04-16 Orbital Audio Laboratories, Inc. Multi-stage processing of audio signals to facilitate rendering of 3D audio via a plurality of playback devices

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812674A (en) * 1995-08-25 1998-09-22 France Telecom Method to simulate the acoustical quality of a room and associated audio-digital processor

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208860A (en) * 1988-09-02 1993-05-04 Qsound Ltd. Sound imaging method and apparatus
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
JPH07222299A (ja) * 1994-01-31 1995-08-18 Matsushita Electric Ind Co Ltd 音像移動処理編集装置
US5850453A (en) * 1995-07-28 1998-12-15 Srs Labs, Inc. Acoustic correction apparatus
US5870484A (en) * 1995-09-05 1999-02-09 Greenberger; Hal Loudspeaker array with signal dependent radiation pattern
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3594281B2 (ja) * 1997-04-30 2004-11-24 株式会社河合楽器製作所 ステレオ拡大装置及び音場拡大装置
AU735333B2 (en) * 1997-06-17 2001-07-05 British Telecommunications Public Limited Company Reproduction of spatialised audio
FI116990B (fi) * 1997-10-20 2006-04-28 Nokia Oyj Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi
EP1184676B1 (en) * 2000-09-02 2004-05-06 Nokia Corporation System and method for processing a signal being emitted from a target signal source into a noisy environment
KR100922910B1 (ko) * 2001-03-27 2009-10-22 캠브리지 메카트로닉스 리미티드 사운드 필드를 생성하는 방법 및 장치
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3810004B2 (ja) * 2002-03-15 2006-08-16 日本電信電話株式会社 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
WO2006003813A1 (ja) * 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US8873768B2 (en) * 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
JP4804014B2 (ja) * 2005-02-23 2011-10-26 沖電気工業株式会社 音声会議装置
JP4295798B2 (ja) * 2005-06-21 2009-07-15 独立行政法人科学技術振興機構 ミキシング装置及び方法並びにプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5812674A (en) * 1995-08-25 1998-09-22 France Telecom Method to simulate the acoustical quality of a room and associated audio-digital processor

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
VILLE PULKKI.Directional Audio Coding in Spatial Sound Reproduction and Stereo Upmixing.《AES 28TH INTERNATIONAL CONFERENCE》.2006,全文. *

Also Published As

Publication number Publication date
WO2008113427A1 (en) 2008-09-25
JP5455657B2 (ja) 2014-03-26
BRPI0808225A2 (pt) 2014-07-08
TW200841326A (en) 2008-10-16
EP2130403A1 (en) 2009-12-09
KR101096072B1 (ko) 2011-12-20
US20080232601A1 (en) 2008-09-25
HK1138977A1 (en) 2010-09-03
ATE476835T1 (de) 2010-08-15
BRPI0808225B1 (pt) 2019-12-24
RU2416172C1 (ru) 2011-04-10
CN101658052A (zh) 2010-02-24
DE602008002066D1 (de) 2010-09-16
KR20090121348A (ko) 2009-11-25
JP2010521909A (ja) 2010-06-24
TWI456569B (zh) 2014-10-11
EP2130403B1 (en) 2010-08-04

Similar Documents

Publication Publication Date Title
CN101658052B (zh) 用于音频重构增强的方法和设备
Zotter et al. Ambisonics: A practical 3D audio theory for recording, studio production, sound reinforcement, and virtual reality
US9015051B2 (en) Reconstruction of audio channels with direction parameters indicating direction of origin
US7489788B2 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener
Spors et al. Spatial sound with loudspeakers and its perception: A review of the current state
Merimaa et al. Spatial impulse response rendering I: Analysis and synthesis
KR101547035B1 (ko) 다중 마이크에 의한 3차원 사운드 포착 및 재생
Pulkki et al. First‐Order Directional Audio Coding (DirAC)
CN113170271B (zh) 用于处理立体声信号的方法和装置
Laitinen et al. Binaural reproduction for directional audio coding
Alexandridis et al. Capturing and reproducing spatial audio based on a circular microphone array
De Sena et al. Analysis and design of multichannel systems for perceptual sound field reconstruction
EP2368375B1 (en) Converter and method for converting an audio signal
Pulkki et al. Spatial effects
US20200059750A1 (en) Sound spatialization method
Masterson et al. Acoustic impulse response interpolation for multichannel systems using dynamic time warping
De Sena et al. Localization uncertainty in time-amplitude stereophonic reproduction
Faller Upmixing and beamforming in professional audio
US20240056735A1 (en) Stereo headphone psychoacoustic sound localization system and method for reconstructing stereo psychoacoustic sound signals using same
Pulkki Applications of directional audio coding in audio
AU2002325063B2 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener
Rosen et al. Automatic speaker directivity control for soundfield reconstruction
Alexandridis et al. Research Article Capturing and Reproducing Spatial Audio Based on a Circular Microphone Array
De Sena et al. Introduction to Sound Field Recording and Reproduction
AU2002325063A1 (en) Recording a three dimensional auditory scene and reproducing it for the individual listener

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant