CN114787912A - 用于确定虚拟声源的装置和方法 - Google Patents
用于确定虚拟声源的装置和方法 Download PDFInfo
- Publication number
- CN114787912A CN114787912A CN202080083053.8A CN202080083053A CN114787912A CN 114787912 A CN114787912 A CN 114787912A CN 202080083053 A CN202080083053 A CN 202080083053A CN 114787912 A CN114787912 A CN 114787912A
- Authority
- CN
- China
- Prior art keywords
- room
- source
- mirroring
- boundaries
- mirror
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 252
- 230000008569 process Effects 0.000 claims abstract description 140
- 238000012545 processing Methods 0.000 claims description 50
- 230000001419 dependent effect Effects 0.000 claims description 14
- 230000007717 exclusion Effects 0.000 claims description 12
- 230000005236 sound signal Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 4
- 239000013598 vector Substances 0.000 description 26
- 238000009877 rendering Methods 0.000 description 21
- 230000002829 reductive effect Effects 0.000 description 16
- 238000013459 approach Methods 0.000 description 11
- 230000004044 response Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000004088 simulation Methods 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000012804 iterative process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007654 immersion Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000004886 head movement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 108010052322 limitin Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K15/00—Acoustics not otherwise provided for
- G10K15/08—Arrangements for producing a reverberation or echo sound
- G10K15/12—Arrangements for producing a reverberation or echo sound using electronic time-delay networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Stereophonic System (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
通过将房间迭代地镜像处理(305)在先前迭代的房间的边界(例如,墙壁)周围来生成针对早期反射的声学图像源模型。通过特定的选择准则来确定(303)在每次迭代中要镜像处理到其周围的边界。所述选择准则包括以下要求:不能逆转镜像方向;不能在排除的方向上;并且不能重复,除非在一系列连续的镜像处理中。
Description
技术领域
本发明涉及用于确定表示房间中的声源反射的虚拟声源的装置和方法,并且特别地,但非排他性地涉及用于在增强/虚拟现实应用中呈现音响的虚拟声源。
背景技术
近年来,随着不断开发和引入新的利用和消费视听内容的服务和方式,基于视听内容的各种各样的体验大大增加。特别地,正在开发许多空间和互动服务、应用和体验,以给户带来更具参与感和沉浸感的体验。
此类应用的示例是虚拟现实(VR)应用、增强现实(AR)应用和混合现实(MR)应用,这些应用迅速变成主流,其中的许多解决方案针对消费者市场。许多标准化机构也正在开发许多标准。此类标准化活动正在积极制定针对VR/AR/MR系统的各个方面(例如,流媒体、广播、呈现等)的标准。
VR应用倾向于提供与用户处于不同的世界/环境/场景的情况相对应的用户体验,而AR(包括混合现实MR)应用倾向于提供与用户处于当前环境但具有添加的额外信息或虚拟对象或信息的情况相对应的用户体验。因此,VR应用倾向于提供完全沉浸式的以合成方式生成的世界/场景,而AR应用倾向于提供部分合成的世界/场景,这种部分合成的世界/场景被叠加在用户物理存在的现实场景上。然而,这些术语通常可以互换使用并且具有高度的重叠性。在下文中,将使用术语虚拟现实/VR来指代虚拟现实和增强/混合现实。
例如,一项越来越流行的服务是以以下这种方式提供图像和音响:使得用户能够主动且动态地与系统交互以改变呈现的参数,使得这将适应用户的位置和取向的移动和改变。在许多应用中,一个非常吸引人的特征是能够改变观看者的有效观看位置和观看方向的能力,例如允许观看者在正在展示的场景中移动并“环顾四周”。
这种特征能够特别允许为用户提供虚拟现实体验。这可以允许用户在虚拟环境中(相对)自由地到处移动并且动态地改变他的位置和他正在观看的地方。通常,此类虚拟现实应用基于场景的三维模型,其中,该模型被动态评价以提供特定的请求视图。这种用于计算机和控制台的方法在例如游戏应用中(例如,在第一人称射击游戏类别中)是众所周知的。
也希望在三维图像中展示图像,特别是对于虚拟现实应用。的确,为了优化观看者的沉浸感,通常优选将用户体验的场景展示为三维场景。的确,虚拟现实体验应当优选允许用户选择他/她自己的位置、相机视点以及相对于虚拟世界的时刻。
除了视觉呈现以外,大多数VR/AR应用还提供了对应的音响体验。在许多应用中,音响优选提供空间音响体验,其中,音响源被感知为是从与视觉场景中的对应对象的位置相对应的位置到达的。因此,音频场景和视频场景优选被感知为是一致的,并且这两者都提供了完整的空间体验。
例如,许多沉浸式体验都是通过使用双耳音响呈现技术的耳机重现生成的虚拟音响场景提供的。在许多场景中,这种耳机重现可以基于头部跟踪,使得能够响应于用户的头部移动而做出呈现,这大大提高了沉浸感。
然而,为了向用户提供高度沉浸式、个性化且自然的体验,尽可能逼真地呈现音响场景很重要,并且对于组合式视听体验(例如,许多VR体验)来说,音响体验紧密地匹配视觉体验(即,所呈现的音频场景和视频场景紧密匹配)非常重要。
为了提供高质量的体验,并且特别是为了感知到逼真的音响,用准确逼真的模型来表征声学环境非常重要。无论正在展示的音响场景是纯虚拟场景,还是希望音响场景与特定的现实世界场景相对应,上述要求都是必需的。
在模拟房间声学中或更一般地在模拟环境声学中,声波在环境的墙壁、地板和天花板上的反射(如果存在的话)会引起从不同方向到达听众的声源信号的延迟和衰减(通常是频率依赖性)版本。这会引起将被称为房间脉冲响应(RIR)的脉冲响应。
如图1所示,房间脉冲响应包括直接声音/无回声部分以及接下来的回响部分,该直接声音/无回声部分取决于声源到听众的距离,该回响部分表征房间的声学属性。房间的大小和形状、声源和听众在房间中的位置以及房间表面的反射属性在该回响部分的表征中都会起作用。
回响部分能够被分成两个时间区域,这两个时间区域通常是交叠的。第一区域包含所谓的早期反射,它是声源在到达听众之前在房间内部的墙壁或障碍物上的孤立反射。随着时滞的增大,固定时间间隔中存在的反射次数增加,现在还包含次级反射和更高阶的反射。
回响部分中的第二区域是其中的这些反射的密度增加到无法被人脑隔离和分离的程度的部分。该区域被称为漫射回响、晚期回响或回响尾巴。
回响部分包含给出关于声源的距离、房间大小和声学属性的听觉系统信息的提示。与无回声部分的能量有关的回响部分的能量在很大程度上决定了所感知的声源距离。最早的反射的水平和延迟可以给出声源到墙壁的接近程度的提示,并且通过人体测量对它的过滤可以加强关于是哪个墙壁、地板或天花板的评估。
(早期)反射的密度对感知房间大小有贡献。反射在能量水平上降低60dB所花费的时间(用T60指示,回响时间)是衡量反射在房间中的消散速度的衡量标准。回响时间给出了关于房间的声学属性的信息;房间墙壁的反射性很强(例如,浴室)还是对声音的吸收性很强(例如,具有家具、地毯和窗帘的卧室)。
为了提供回响以提供沉浸式体验,需要多个RIR来表达反射从哪个方向到达听众。这些内容可以与扬声器设置相关联,其中,每个RIR都与已知位置处的扬声器之一有关。可以采用像VBAP这样的平移算法来根据已知的反射方向生成RIR。
此外,由于RIR被头部、耳朵和肩膀过滤(即,头部相关脉冲响应(HRIR)),因此当沉浸式RIR是双耳房间脉冲响应(BRIR)的部分时,沉浸式RIR可以取决于用户的人体测量属性。
无法再对晚期回响中的反射进行隔离,因此能够利用参数仿真(例如,诸如Jot回响器之类的反馈延迟网络)对晚期回响中的反射进行参数模拟。对于早期反射,入射方向和距离依赖性延迟是人类提取关于房间和声源相对位置的信息的重要提示。因此,对于逼真的沉浸式体验来说,必须更多地利用早期反射模拟而不是晚期回响模拟。
一种对早期反射进行建模的方法是镜像反映房间边界中的每个房间边界中的声源,以生成表示反射的虚拟声源。这种模型被称为图像源模型,并且在Allen JB、BerkleyDA.的“Image method for efficiently simulating small-room acoustics”(TheJournal of the Acoustical Society of America 1979;65(4):943-950)中进行了描述。然而,虽然这种模型与诸如射线跟踪或有限元建模之类的受房间形状限制较小的方法相比可以为早期反射提供高效且高质量的建模,但是它往往也具有一些缺点。具体地,这种模型往往仍然相对复杂,并且具有不必要的高计算资源要求,特别是为了找到虚拟反射源。例如,该过程可能会导致许多生成的需要被进一步考虑、处理、破坏的源复制物。这些缺点往往会导致要考虑的反射数量升高,并且在许多实际应用中,反射数量相应地受到限制,从而导致模型的准确性和质量降低。
因此,改进的用于生成表示反射的虚拟源的模型和方法将是有利的。特别地,一种具有以下优点的方法/模型将是有利的:它允许改进操作,提高灵活性,降低复杂性,便于实施,改善音响体验,降低复杂性,降低计算负担,改善音响质量,提高模型准确性和质量和/或改善性能和/或操作。
发明内容
因此,本发明寻求优选以单独方式或以任何组合方式减轻、缓解或消除上面提到的缺点中的一个或多个缺点。
根据本发明的一个方面,提供了一种确定表示第一房间中的第一声源的反射的虚拟声源的方法,所述方法包括计算机执行以下步骤:接收描述所述第一房间的边界以及针对所述房间中的所述第一声源的声源位置的数据;通过对在先前迭代中确定的声源执行声源镜像处理来将所述虚拟声源迭代地确定为经镜像处理的声源,每次迭代包括:针对包括在前一次迭代中确定的镜像房间的一组源房间中的每个源房间,执行以下步骤:确定针对所述源房间的一组镜像边界;针对所述一组镜像边界中的每个镜像边界,通过将所述源房间镜像处理在所述镜像边界周围来确定镜像房间,并且通过将源声源镜像处理在所述镜像边界周围来确定镜像声源,所述源声源是所述源房间的镜像声源,所述镜像处理具有从所述源房间到所述镜像房间的镜像处理方向;其中,对所述一组镜像边界的所述确定包括根据选择准则来选择所述源房间的边界,所述选择准则包括:针对所述源房间的要被包括在所述一组镜像边界中的候选边界,要求针对所述候选边界的镜像处理的第一方向不得在针对任何通向所述源房间的先前镜像处理的镜像处理方向的相反方向上;针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在排除的方向上,所述排除的方向取决于所述第一房间的以下边界,执行到所述边界周围的镜像处理通向所述源房间;以及针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在与针对任何通向所述源房间的先前镜像处理的任何镜像处理方向相同的方向上,除了在前一次迭代中生成所述源房间的镜像处理的镜像处理方向以外。
本发明可以提供对表示房间中的反射的虚拟声源的改进的和/或便利的确定。该方法可以允许便利地和/或更高效地生成针对房间中的早期反射的模型。在许多实施例中,该方法可以防止生成重复的虚拟声源。在许多实施例中,该方法可以允许以降低的计算要求和/或降低的复杂性生成准确的表示房间中的反射的模型。
第一房间可以被表示为二维矩形和/或三维矩形。第一房间可以是二维或三维的棱正交的多胞形(也被称为直角矩形棱柱、矩形立方体或长方体)。
针对房间的边界可以是对房间进行标界/定界/划界的平面元素,例如,墙壁、地板或天花板。边界可以是声学反射元素,或者例如在一些情况下可以是其中不存在(显著)声学反射元素的虚拟或理论(任意)边界描绘。
房间可以是任何由基本上平面的且通常声学反射的元素标界的声学环境。平面元素可以是成对平行的,并且二维房间可以包括两个这种平行对,并且三维房间可以包括三个这种平行对(对应于四个墙壁、一个地板和一个天花板)。
跨边界对声源的镜像处理可以对应于通过将源声源的声源位置镜像处理在边界周围来确定经镜像处理的声源位置。
特别地,该方法可以包括通过将针对源房间的声源的反射声源位置镜像处理在边界周围来确定针对镜像房间中的反射声源的镜像声源位置。
根据本发明的任选特征,所述选择准则包括:如果针对任何通向所述源房间的先前镜像处理的镜像处理的第二方向垂直于所述排除的方向并且垂直于通向所述源房间的针对所述第一房间的所述镜像处理的镜像方向,则针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向必须与所述第二方向相同。
在许多实施例中,该方法可以提供对用于表示三维房间中的三维反射的模型的高效生成。该方法通常可以(与其他要求一起)防止生成重复的声源,并且通常可以允许由生成的虚拟声源来表示与给定阶次的反射相对应的所有虚拟声源。
根据本发明的任选特征,所述第一房间具有镜像处理的一对参考方向,所述一对参考方向在相反的方向上,并且所述选择准则包括:如果针对任何通向所述源房间的先前镜像处理的镜像处理的第二方向在属于镜像处理的相关联的所述一对参考方向的方向上,则针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向必须与所述第二方向相同。
在许多实施例中,该方法可以提供对用于表示三维房间中的三维反射的模型的高效生成。该方法通常可以(与其他要求一起)防止生成重复的声源,并且通常可以允许由生成的虚拟声源来表示与给定阶次的反射相对应的所有虚拟声源。
镜像处理的这对参考方向可以是第一房间的两条平行边界的方向。镜像处理的这对参考方向可以是镜像处理的预定的一对参考方向。
在一些实施例中,可以将第一房间的两条相对边界指定为具有参考镜像方向的参考边界,并且选择准则可以包括:针对要被包括在一组镜像边界中的候选边界,如果通向源房间的先前镜像处理已经在参考镜像方向上,则要求第一方向必须是参考镜像方向。
根据本发明的任选特征,针对首次迭代,所述第一房间被指定为所述一组源房间中的针对所述首次迭代的源房间。
这可以提供用于初始化/启动对虚拟声源的迭代生成的有利方法。
根据本发明的任选特征,所述第一房间的所有边界都被包括在针对所述首次迭代的所述一组镜像边界中。
在许多实施例中,这可以提供改善的性能和/或降低的复杂性/资源使用情况。通常,它可以允许以降低的复杂性和计算资源使用情况来生成改进的模型。此外,它还可以提供用于初始化/启动对虚拟声源的迭代生成的有利方法。
根据本发明的任选特征,所述第一房间的每条边界都与衰减因子相关联,并且所述方法包括通过将针对被包括在通向包括所述镜像声源的所述镜像房间的镜像处理中的所有边界的衰减因子进行组合来确定针对每个镜像声源的组合衰减因子。
这可以提供能够提供更逼真的音响呈现的改进的模型。
根据本发明的任选特征,所述选择准则包括:针对要被包括在所述一组镜像边界中的所述候选边界,要求与针对所述候选边界的衰减因子相组合的针对所述源声源的组合衰减因子必须指示低于阈值的衰减。
在许多实施例中,这可以提供改进的模型。
根据本发明的任选特征,所述组合衰减因子是频率依赖性的。
在许多实施例中,这可以提供改进的模型。
根据本发明的任选特征,针对声学无反射边界的衰减因子指示完全衰减。
在许多实施例中,这可以提供改进的模型。
根据本发明的任选特征,所述方法还包括呈现(309)针对所述第一房间中的倾听位置的音响信号,所述音响信号包括至少一个音响分量,所述至少一个音响分量表示从至少一个镜像音响源到达所述倾听位置的音响。
该方法可以提供改善的音响呈现,并且特别是可以对早期反射提供更准确的呈现。
根据本发明的任选特征,所述一组镜像边界包括满足所述选择准则的所有边界。
在许多实施例中,这可以提供改善的性能和/或降低的复杂性/资源使用情况。通常,它可以允许以降低的复杂性和计算资源使用情况来生成改进的模型。
根据本发明的任选特征,执行预定次数的迭代。
在许多实施例中,这可以提供改善的性能和/或降低的复杂性/资源使用情况。通常,它可以允许以降低的复杂性和计算资源使用情况来生成改进的模型。
根据本发明的任选特征,所述第一房间是棱正交的多胞形。
根据本发明的一个方面,提供了一种用于确定表示第一房间中的第一声源的反射的虚拟声源的装置,所述装置包括:接收器,其被布置为接收描述所述第一房间的边界以及针对所述房间中的所述第一声源的声源位置的数据;以及处理电路,其被布置为通过对在先前迭代中确定的声源执行声源镜像处理来将所述虚拟声源迭代地确定为经镜像处理的声源,
每次迭代包括:针对包括在前一次迭代中确定的镜像房间的一组源房间中的每个源房间,执行以下步骤:确定针对所述源房间的一组镜像边界;针对所述一组镜像边界中的每个镜像边界,通过将所述源房间镜像处理在所述镜像边界周围来确定镜像房间,并且通过将源声源镜像处理在所述镜像边界周围来确定镜像声源,所述源声源是所述源房间的镜像声源,所述镜像处理具有从所述源房间到所述镜像房间的镜像处理方向;
其中,对所述一组镜像边界的所述确定包括根据选择准则来选择所述源房间的边界,所述选择准则包括:针对所述源房间的要被包括在所述一组镜像边界中的候选边界,要求针对所述候选边界的镜像处理的第一方向不得在针对任何通向所述源房间的先前镜像处理的镜像处理方向的相反方向上;针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在排除的方向上,所述排除的方向取决于所述第一房间的以下边界,执行到所述边界周围的镜像处理通向所述源房间;以及针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在与针对任何通向所述源房间的先前镜像处理的任何镜像处理方向相同的方向上,除了在前一次迭代中生成所述源房间的镜像处理的镜像处理方向以外。
参考下文描述的(一个或多个)实施例,本发明的这些和其他方面、特征和优点将变得明显并且得到阐明。
附图说明
参考附图,将仅通过举例的方式来描述本发明的实施例,在附图中:
图1图示了声学房间响应的部件的示例;
图2图示了根据本发明的一些实施例的装置的元件的示例;
图3图示了根据本发明的一些实施例的方法的要素的示例;
图4图示了用于对房间的一条边界的声学反射进行建模的镜像处理的示例;
图5图示了用于对房间的两条边界的声学反射进行建模的镜像处理的示例;
图6图示了对房间进行镜像处理以获得针对房间中的声学反射的图像源模型的示例;
图7图示了对房间进行镜像处理以获得针对房间中的声学反射的图像源模型的示例;
图8图示了对房间进行镜像处理以获得针对房间中的声学反射的图像源模型的示例;
图9图示了表示通过根据本发明的一些实施例的方法生成的图像源模型的树的示例;并且
图10图示了通过根据本发明的一些实施例的方法来进行镜像处理以生成图像源模型的示例。
具体实施方式
音响呈现旨在为听众提供自然且逼真的效果,它通常包括对声学环境的呈现。所述呈现基于声学环境的模型,该模型通常包括对直接路径、(早期)反射和回响的建模。以下描述将聚焦于一种用于为现实房间或虚拟房间的(早期)反射生成合适模型的高效方法。
该方法将参考如在图2中所公开的音响呈现装置进行描述。该音响呈现装置包括接收器201,接收器201被布置为接收表征房间的房间数据,所述房间数据表示要通过所述呈现而仿真的声学环境。所述房间数据具体描述第一房间的边界以及针对该房间中的声源的至少一个声源位置。在下文中,房间也将被称为原始房间(或第一房间),并且原始房间中的声源也将被称为原始声源,以便与生成的虚拟(镜像处理的)房间和针对所描述的反射模型生成的虚拟(镜像处理的)声源进行区分。
接收器201可以以任何合适的形式来实施,包括例如使用离散的或专用的电子器件。处理电路203可以例如被实施为集成电路,例如,专用集成电路(ASIC)。在一些实施例中,电路可以被实施为经编程的处理单元,例如被实施为在合适的处理器(例如,中央处理单元、数字信号处理单元或微控制器等)上运行的固件或软件。将意识到,在此类实施例中,处理单元可以包括板载或外部存储器、时钟驱动电路、接口电路、用户接口电路等。这种电路还可以被实施为处理单元的部分、集成电路和/或离散的电子电路。
接收器201可以以任何合适的方式(例如作为音响信号的部分)从任何合适的来源接收房间数据。可以从内部来源或外部来源接收房间数据。接收器201可以例如经由与内部来源的网络连接、无线电连接或任何其他合适的连接来接收房间数据。在许多实施例中,接收器可以从本地来源(例如,本地存储器)接收数据。在许多实施例中,接收器201可以例如被布置为从本地存储器(例如,本地RAM或ROM存储器)中检索房间数据。
边界定义房间的轮廓,并且通常表示墙壁、天花板和地板(或者对于2D应用来说通常仅为墙壁)。房间是2D或3D的棱正交的多胞形,例如,2D矩形或3D矩形。边界是成对平行的,并且基本上是平面的。另外,一对平行边界的边界垂直于另外一对或多对平行边界的边界。边界具体定义棱正交的多胞形(2D或3D)。边界可以反映任何物理属性,例如,任何材料等。边界也可以表示任何声学属性。
由房间数据描述的房间对应于想要呈现的预期声学环境,并且因此可以表示现实房间/环境或虚拟房间/环境。房间可以是能够通过四个(对于2D)或六个(对于3D)基本上处于平面的边界进行标界/定界的任何区域/区/环境,这四个或六个基本上处于平面的边界是成对平行的并且各对之间基本上垂直。在一些实施例中,房间数据可以表示并不成对平行和/或在连接边界之间并不表现出直角的预期房间的合适近似结果。
在大多数实施例中,房间数据还可以包括一个或多个或通常所有边界的声学数据。声学属性数据可以特别包括针对每个墙壁的反射衰减度量,其指示当声音被边界反射时由该边界引起的衰减。替代地,反射系数可以指示信号能量的以镜面反射方式从边界表面反射回来的部分。在许多实施例中,衰减度量可以是频率依赖性的,以对反射对于不同的频率可以不同的情况进行建模。此外,声学属性也可以取决于边界表面上的位置。
接收器201被耦合到处理电路203,处理电路203被布置为生成针对房间/声学环境的反射模型,该反射模型表示房间中的(早期)反射并且在执行呈现时对这些(早期)反射进行仿真。特别地,处理电路203被布置为确定表示原始房间中的原始声源的反射的虚拟声源。
处理电路203可以以任何合适的形式来实施,包括例如使用离散的或专用的电子器件。例如,处理电路203可以例如被实施为集成电路,例如,专用集成电路(ASIC)。在一些实施例中,电路可以被实施为经编程的处理单元,例如被实施为在合适的处理器(例如,中央处理单元、数字信号处理单元或微控制器等)上运行的固件或软件。将意识到,在此类实施例中,处理单元可以包括板载或外部存储器、时钟驱动电路、接口电路、用户接口电路等。这种电路还可以被实施为处理单元的部分、集成电路和/或离散的电子电路。
处理电路203被耦合到呈现电路205,呈现电路205被布置为呈现表示音响源并且通常还表示多个其他音响源的音响信号,以提供对音响场景的呈现。呈现电路205可以特别接收表征来自原始声源的音响的音响数据,并且可以根据任何合适的呈现方法和技术来呈现音响数据。呈现原始声源的过程可以包括基于由处理电路203生成的反射模型来生成反射音响的过程。另外,通常还将呈现针对原始声源的与直接路径和回响相对应的信号分量。本领域技术人员将意识到用于呈现音响(包括用于空间扬声器配置和耳机,例如使用双耳处理)的许多不同方法,并且为了简洁起见,将不再进一步详细描述这些方法。
呈现电路205可以以任何合适的形式来实施,包括例如使用离散的或专用的电子器件。呈现电路205可以例如被实施为集成电路,例如,专用集成电路(ASIC)。在一些实施例中,电路可以被实施为经编程的处理单元,例如被实施为在合适的处理器(例如,中央处理单元、数字信号处理单元或微控制器等)上运行的固件或软件。将意识到,在此类实施例中,处理单元可以包括板载或外部存储器、时钟驱动电路、接口电路、用户接口电路等。这种电路还可以被实施为处理单元的部分、集成电路和/或离散的电子电路。
处理电路203被特别布置为生成针对反射的镜像源模型。在镜像源模型中,由单独的虚拟声源对反射进行建模,其中,每个虚拟声源是原始声源的复制物并且具有在原始房间外部但处于以下这种位置的(虚拟)位置:从虚拟位置到倾听位置的直接路径表现出与从原始声源到倾听位置的反射路径相同的属性。特别地,针对虚拟声源的表示反射的路径长度将等于从原始声源到倾听位置的反射路径的路径长度。另外,针对虚拟声源路径的到达倾听位置的方向将等于针对反射路径的到达方向。另外,针对反射路径的由边界(例如,墙壁)引起的每个反射,直接路径将穿过与反射边界相对应的边界。能够相应地使用透射通过模型边界的透射来对反射效果进行直接建模,例如,可以将与针对边界的反射衰减相对应的衰减分配给透射通过对应的模型边界的透射。
镜像源模型的特别重要的属性是:它能够独立于倾听位置。所确定的位置和房间结构使得它们将为原始房间中的所有位置提供正确的结果。特别地,生成虚拟镜像声源和虚拟镜像房间,并且这些项目能够用于对原始房间中的任何位置的反射性能进行建模,即,它们能够用于确定针对原始房间中的任何位置的路径长度、反射和到达方向。因此,可以在初始化过程中完成镜像源模型的生成,并且可以在例如用户被认为在原始房间中四处移动(平移和/或旋转)时连续且动态地使用和评价所生成的模型。因此,执行镜像源模型的生成,而无需考虑实际的倾听位置,而是生成更通用的模型。
生成镜像源模型的过程是迭代过程,并且在图3中示出了通过生成表示反射的虚拟声源来生成模型的方法的示例。
该方法开始于步骤301,其中,初始化该过程。这包括例如初始化该方法以使用房间的特定属性,即,初始化该方法以基于从房间数据中检索到的属性。
该过程基于:对房间的边界周围的房间的迭代的镜像处理,以及对房间的边界周围的声源的对应的镜像处理。在每次迭代中,通过对在先前迭代中生成的房间的边界(中的一些边界)周围的(在上一次迭代中生成的)房间和声源(以及特别是声源位置)进行镜像处理而生成了新的房间和声源。当初始化该过程时,原始房间被初始化为/被视为上一次迭代的房间,并且原始声源被初始化为/被视为上一次迭代的声源。因此,首次迭代基于将单个原始房间和声源视为上一次迭代的输出/结果。
首次迭代开始于步骤303,其中,针对在先前迭代中生成的房间确定一组镜像边界。特别地,将一组源房间确定为在先前迭代中生成的房间。针对首次迭代,这组源房间包括原始房间(仅此而已)。然后在步骤303中处理这些源房间中的一个源房间。
源房间的所有边界最初都是这组镜像边界的候选边界,并且其中的零个、一个、一些或所有边界都可以被选择为被包括在这组镜像边界中。将在稍后详细描述这种选择。
在步骤303之后是步骤305,在步骤305中,在这组镜像边界中的每条边界(此后被称为镜像边界)周围执行镜像处理。每个镜像都包括对在镜像边界周围的源房间的镜像处理。另外,它还包括对在镜像边界周围的源房间的声源的镜像处理。因此,在边界周围的镜像处理会生成新的(虚拟)镜像房间以及新的(虚拟)镜像声源。因此,这种镜像处理是将源房间和源声源处理成新的镜像房间和镜像声源(它们分别是源房间和源声源的经镜像处理的复制物)。
能够通过以下操作来完成对源声源的镜像处理:确定穿过边界和源声源的一条线,使得这条线垂直于边界表面,然后将镜像声源定位在距边界相同距离(但在相反侧,即,在镜像房间中)的距离处。
镜像处理固有地定义从镜像边界的一侧到另一侧的方向,即,从源房间到镜像房间的方向。能够将该方向视为垂直于镜像表面的方向,或者等同地,能够将镜像边界的相对位置视为指示方向。向可以例如与原始房间有关。例如,可以认为原始房间中的每条边界的位置表示一个方向,即,针对3D房间可以定义六个离散方向,而针对2D房间可以定义四个离散方向。由于镜像房间是通过镜像处理生成的,因此边界的对齐情况不会改变,因此镜像房间的边界也与原始房间的四个或六个方向保持对齐(但是镜像处理当然会反转边界的相对位置,例如,当在左边界或右边界进行镜像处理时,左边界和右边界的位置会发生反转)。
在首次迭代中,原始房间被视为前一次迭代的镜像房间,并且原始声源被视为前一次迭代的镜像声源,因此,可以生成一组镜像边界,这组镜像边界包括原始房间的边界。通常,首次迭代的这组镜像边界将包括原始房间的所有边界。
然后在这组镜像边界的边界周围执行镜像处理,这样就生成了多个(通常最多为四个或六个)新的镜像房间,每个新的镜像房间都包括一个新的镜像声源。
然后,该方法在步骤307中继续进行,确定这组源房间中的所有源房间是否都已经被处理,即,在先前迭代中生成的所有镜像房间是否都已经被处理。如果没有,则该方法在步骤309中继续进行,在步骤309中,选择下一源房间,然后该方法返回到步骤303。
否则,该方法将继续进行到步骤311,在步骤311中,确定是否要执行更多迭代。如果是,则该方法继续进行到步骤313,在步骤313中,例如通过确定一组新的源房间来设置下一次迭代,这组新的源房间包括在当前迭代中生成的所有镜像房间。然后,该方法返回到步骤303,其中,处理这组新的源房间并潜在地对这组新的源房间镜像进行镜像处理。因此,在每次迭代中,镜像房间/镜像声源的数量是基于对先前迭代结果的镜像处理而增长的。
例如,迭代可以继续进行,直到已经执行了预定次数的迭代为止。如果在步骤311中检测到这种情况,则该方法可以继续进行到步骤315,在步骤315中,可以例如停止该方法,或者例如可以执行基于所生成的模型的呈现。
该方法可以生成镜像源模型,其中,能够通过根据虚拟镜像声源的直接路径对原始房间中的反射进行仿真。
如图4所示,能够将反射的声音分量呈现为经镜像处理的声源的直接路径,其中,这表示针对听众的正确的距离和入射方向。这对于在原始房间中的所有位置来说都是正确的,并且不需要针对不同的倾听位置确定新的镜像声源位置。相反,虚拟镜像声源对于在原始房间内的每个用户位置来说都是有效的。
当生成这种虚拟镜像声源时,可以考虑到所提到的反射效应。通常,这可以通过以下操作来实现:向房间之间的每次转变分配表示声源能量的由相交的边界表面镜面反射的部分的衰减或频率依赖性过滤。
由于声音可以通过多条边界反射而到达用户,因此可以如图5所示重复该方法。所描述的迭代方法允许生成多“层”镜像房间和源,从而允许对多个反射进行建模。每次迭代都会增加路径的反射数量,即,首次代表示通过一个反射而达到倾听位置的声音分量,二次迭代表示通过两个反射而到达倾听位置的声音分量,以此类推。
当随后对房间进行镜像处理直到达到某个阶次(固定的迭代次数)时,该方法通常会得到原始房间和经镜像处理的房间的菱形表示。图6中以2D形式图示了这种情况(最多2阶,即,具有两次迭代)。在3D中,当观看通过原始房间的横截面时也会有类似的结构(即,在通过五个房间这行的垂直平面中会看到相同的图案)。
然而,虽然所描述的方法的原则似乎相对简单直接,但是实际实施方式并非如此,实际上,实际考量因素对于方法的性能至关重要。
例如,在许多应用中,用于表示房间和声源的坐标系可能为未与边界的方向对齐。这使得计算镜像处理不是非常简单直接,因为它一次影响了一个以上的维度。在此类情况下,要么必须旋转房间边界和声源以与坐标系对齐并且必须逆向旋转所有随后确定的虚拟镜像源,要么必须在一个以上的维度(例如使用边界的法向向量)执行镜像处理本身。在许多情形中,后一种方法将更加高效。
这种方法的特定问题是:它往往具有高资源要求,并且特别具有高计算资源要求。发明人已经认识到:实质性问题是生成了大量的复制的镜像房间,并且高资源使用不仅归因于执行许多镜像操作的资源使用,而且还归因于对所得到的镜像房间和镜像声源的后处理以识别和消除复制物的要求。
例如,图7图示了示出二阶镜像序列和四阶镜像序列如何得到镜像房间的复制物的2D示例。复制物的相对数量随着反射阶次的升高逐渐增长,并且实际上对于3D房间和五阶反射,简单直接地应用图像源方法最多可以找到7776个虚拟源,其中仅230个虚拟源是独特的。
在图3的方法中,使用特定方法来选择针对一组镜像边界的边界,使得能够减少复制的镜像房间和镜像声源的生成,并且在大多数应用中完全防止了复制的镜像房间和镜像声源的生成。
因此,该方法被配置为针对原始房间和每个经镜像处理的房间的后续镜像选择房间边界的子集。针对每个房间的子集被选择为使得不会生成复制的房间,因此避免了任何复制的虚拟镜像源。
这是通过根据选择准则针对这组镜像边界选择边界来实现的,所述选择准则包括针对选择的多个规则/约束。选择准则用于通过从原始房间开始的一定量的步骤内的房间阵列来控制房间/声源的镜像处理的进展。该方法可以被特别看作是选择去往每个(潜在)镜像房间的一条路径,并且排除去往该房间的所有其他路径。由于不同的可能路径都与对应的边界相交,因此不同的可能路径都包括相同的边界,但这些相同边界的阶次不同。然而,由于反射通常能够被视为线性操作,因此从声源到达听众的阶次并不重要,因此相交的边界的阶次并不重要。
首先可以针对2D应用考虑选择准则,在下文中,2D应用将被视为考虑四个方向,即,向上、下、向前和向后。向上和向下对应于两个成对的平行边界,而向后和向前对应于另外两个成对的平行边界(垂直于第一对)。
选择准则特别包括:针对源房间的要被包括在一组镜像边界中的候选边界,约束/要求针对候选边界的镜像处理的第一方向不得在针对任何通向源房间的先前镜像处理的镜像处理方向的相反方向上。
因此,该方法可以在步骤303中例如将在先前迭代中生成的所有镜像房间顺序地考虑为用于潜在的进一步镜像处理的源房间。然后,对于当前考虑的源房间,它可以评价包括的所有边界,例如,对于2D示例,它将考虑该源房间的所有墙壁,而对于3D示例,它可以进一步考虑天花板和地板。
另外,(除了首次迭代以外)当前的源房间是通过一个或多个镜像处理的序列已经生成的镜像房间,因此当前的源房间与反映出哪些镜像操作通向源房间的一个或多个镜像方向的序列相链接。
然后,该要求使得源房间的与以下镜像方向相对应的所有边界被排除出进一步考虑的范围,该镜像方向是与在过去的镜像方向的序列中已经包括的方向的相反方向。
例如,如果源房间是通过包括向上方向的镜像处理的序列生成的,则与向下镜像方向相对应的边界被排除出针对这组镜像边界进行选择的范围。类似地,如果先前的方向序列包括向前方向的镜像处理,则与向后镜像方向相对应的边界被排除。
因此,考虑到镜像房间是通过镜像处理的路径/序列而顺序生成的,一旦在给定方向上已经执行了镜像处理,就不允许在相反方向上的镜像处理。
选择准则还包括涉及针对原始房间执行的镜像处理的方向以及哪个方向通向当前的源房间的要求。
特别地,第一房间的边界中的每条边界都被链接到排除的链接方向。针对给定边界的排除的方向是垂直于针对该边界的镜像处理方向的方向。因此,属于第一对平行边界的边界是针对属于一对不同的平行边界的边界的排除的镜像方向。这两对边界对应于2D应用的两个维度,或者在3D情况下对应于三个维度中的两个维度。
特别地,属于源房间的两对平行边界的四条边界中的每条边界都具有链接的排除的方向,其中,针对每条边界的排除的方向是针对属于另一对平行边界的边界的镜像方向。另外,针对这四条边界的四个链接的排除的方向都是不同的,因此这四个排除的方向对应于四个镜像方向。
举个具体示例,链接的方向可以如下所示:
选择准则包括:针对要被包括在一组镜像边界中的候选边界,约束/要求针对候选边界的镜像处理方向不得在排除的方向上,其中,所述排除的方向取决于第一房间的以下边界,执行在该边界周围的镜像处理会通向源房间。
因此,当该方法在步骤303中考虑给定的源房间的所有边界以选择针对这组镜像边界的边界时,该方法特别考虑执行的第一镜像处理,即,最终通向当前的源房间的对原始房间的镜像处理。然后,该方法可以识别排除的方向。例如,如果第一镜像处理在向前方向上,则该方法确定链接的排除的方向是向右。然后,该方法继续排除具有与排除的方向相对应的镜像方向的边界。
然后,该要求使得源房间的与在排除的方向中的镜像方向相对应的边界被排除出进一步考虑的范围,并且不会被包括在这组镜像边界中。因此,不会在排除的方向上执行任何镜像处理。
例如,如果源房间是通过以在向左方向上的镜像处理开始的序列生成的,则与向前方向相对应的边界被排除出针对这组镜像边界进行选择的范围,由此镜像房间的生成进展将总是在针对与排除的方向相对应的维度/边界对的一个方向上。
选择准则还包括:针对要被包括在一组镜像边界中的候选边界,约束/要求针对候选边界的镜像处理方向不得在与任何已经通向源房间的先前镜像处理方向相同的方向上,除了在前一次迭代中生成的通向源房间的镜像处理方向以外。
因此,针对镜像边界的镜像处理方向不得与执行先前镜像处理的方向相同,除非该方向与在先前迭代中应用的镜像方向相同,即,除非该方向是与用于生成源房间本身的方向相同的方向。
因此,选择要求使得镜像处理方向决不会重复,除非在先前迭代中也使用了该镜像处理方向,即,除非该镜像处理方向是在给定方向上的镜像处理的延续。因此,选择准则包括这样的要求,使得给定的镜像处理序列决不会返回到先前应用的并在随后偏离的镜像处理方向。因此,一旦在第一方向上开始了镜像处理,只要需要就可以继续进行这种镜像处理,但是一旦在不同的方向上发生镜像处理,镜像处理就无法返回到第一方向。由于在一个方向上的镜像处理排除在相反方向上的镜像处理,因此这就产生了以下这种情况:针对每个维度只允许一个镜像处理方向,并且一旦镜像处理序列从一个维度切换到另一维度的方向上的镜像处理,则无法返回到第一维度,即,在一个维度中的镜像处理仅可能在一个方向上并且仅可能在连续的镜像处理序列中。
因此,当该方法在步骤303中考虑给定的源房间的所有边界以选择针对这组镜像边界的边界时,该方法特别考虑所有通向源房间的先前镜像方向,并且排除所有具有与先前镜像方向相同的镜像方向的边界,除了具有与生成源房间的镜像处理的镜像方向相同的镜像方向的边界以外。
例如,源房间可以是通过以下序列生成的:该序列开始于进行两次在向前方向上的镜像处理,然后进行两次在向左方向上的镜像处理,该序列对应于(F,F,L,L)的序列。该要求是不返回先前的镜像方向但除了最新的镜像方向以外,该要求然后使得排除具有向前的镜像方向的边界,但是该要求不会排除具有向左的镜像方向的边界。
所描述的约束和要求可以紧密地互通以确保在步骤305中执行的镜像处理不会生成任何复制的房间(在考虑2D应用时)。另外,所描述的约束和要求还允许生成所有可能的镜像房间,因此可以自动引起对所有潜在的反射(例如,最多达到给定的反射次数)进行建模。
特别地,在许多实施例中,这组镜像边界被选择为包括满足选择准则的所有边界。因此,对于任何镜像房间,当被视为源房间时,这组镜像边界被生成为包括所有未被该要求排除的边界。通常,在2D情况下,这包括一条或两条边界。
如前面所提到的,在首次迭代中,原始房间被视为唯一的源房间/镜像。另外,这组镜像边界被生成为包括原始房间的所有边界。还注意到,对于首次迭代,没有先前的方向或排除的方向,因此所有四条边界都将固有地符合所描述的标准。另外,首次迭代将确定针对每个新的镜像房间的排除的方向。
选择要求可以紧密协同地相互作用以允许在镜像房间和虚拟源的2D平面中进行确定,该镜像房间和虚拟源表示最高达到给定阶次而没有任何复制的所有反射。图8可以图示这种情况,图8示出了在四次迭代(即,表示最高达到四阶反射)之后通过所描述的过程生成的模型的房间。引入所排除的方向的要求实质上将空间分成四个象限,而其他要求确保只能通过镜像处理的一个特定的序列/路径来达到每个镜像房间。另外,它们提供了所有可能生成的镜像房间。
在许多实施例中,该方法可以用于生成3D模型,并且还包括包含例如原始房间的天花板和地板的反射建模。
在这种情况下,仍将使用上面关注于2D模型所描述的要求,但是选择准则还可以额外地包括处理第三维度的特定要求。
特别地,处理电路203可以包括以下要求:如果针对任何通向源房间的先前镜像处理的第二方向垂直于排除的方向并且垂直于针对通向源房间的第一房间的镜像方向,那么针对要被包括在一组镜像边界中的候选边界,要求针对候选边界的镜像处理方向必须与第二方向相同。
先前的要求主要考虑2D场景,其中每个房间具有两对平行边界。然而,在更典型的3D情况下,每个房间还具有第三对平行边界,能够在这第三对平行边界周围执行镜像处理。因此,每组镜像边界还能够包括在第三维度的两个方向上的额外边界,例如,具体是在与房间的天花板和地板相对应的向上方向和向下方向上。先前的要求不会阻止在原始的2D平面中的房间内执行任何这样的镜像处理。因此,对于在先前迭代中生成的原始2D平面中的每一个新的镜像房间,可以在当前迭代以上和以下分别生成新的镜像房间。
先前描述的要求在二维上操作并且提供了通过镜像处理先前生成的房间来扩展在二维中的模型的方法。特别地,只要满足要求,该要求就允许在两个维度上执行镜像处理,这将引起对2D平面的菱形覆盖。2D平面由针对执行的第一镜像处理的方向(即,通向被视为当前源房间的原始房间的镜像处理的方向)和与之相关联的排除的方向来确定。
在特定情况下,第一镜像处理的方向是(向前、向左、向后、向右)中的一个方向,类似地,排除的方向是(向前、向左、向后、向右)中的一个方向。因此,该要求考虑先前是否已经执行了任何其他镜像方向,即,先前是否在其他方向上进行了任何镜像处理,即,是否在向上方向或向下方向上进行了镜像处理。如果没有,该要求不施加任何限制,因此该要求不会限制在2D平面中的任何镜像处理,并且该要求也不会限制从2D平面中出来的第一镜像处理,即,该要求不会限制第一个向上或向下的镜像处理。
然而,如果先前已经执行了从2D平面出来的镜像处理(即,如果已经执行了第一向上或向下的镜像处理),则该要求施加以下严格约束:只能执行在相同方向上的镜像处理。因此,一旦已经执行了在向上(或向下)方向上的镜像处理,所有后续镜像处理就必须在向上(或向下)方向上。因此,一旦方向从2D平面中移出,就必须维持该方向,并且不允许改变方向。因此,第三维度中的镜像处理序列中的第一步骤的方向不允许在该第一步骤之后的任何其他方向。
在一些实施例中,第三维度可以不由排除的方向和第一镜像处理的方向特别确定。相反,第三维度可以只是指定的参考维度,并且特别可以是预定的参考维度。由于维度表示在相反边界周围的镜像处理,因此它表示在两个方向上(即,在相反方向上)的镜像处理方向。因此,原始房间可以与镜像处理的在相反方向上的一对参考方向相链接/相关联。在特定示例中,这对参考方向可以具体是向上方向和向下方向。
在这样的实施例中,选择准则可以包括以下要求:如果针对任何通向源房间的先前镜像处理的镜像处理的第二方向在作为镜像处理的两个参考方向中的一个参考方向上,那么针对要被包括在一组镜像边界中的候选边界,要求针对候选边界的镜像处理方向必须与第二方向相同。
因此,在这样的实施例中,一旦在参考方向上(在该示例中具体为向上或向下)已经执行了镜像处理,所有后续的镜像处理就必须在相同的方向上。因此,一旦已经执行了在向上方向上的镜像处理,后续的镜像处理就只能在向上方向上,并且不能执行任何其他方向(无论是向右、向左、向后、向前还是向下)上的镜像处理。
这种方法确保了该方法可以生成一组通常对称的镜像房间,以用于在三个维度中对反射进行建模。它可以与先前描述的要求紧密协同地相互作用以使得高效地生成3D模型,该3D模型可以包括对反射的准确建模,但复杂性较低。特别地,能够在没有复制的情况下生成镜像房间的3D模型。另外,它们还提供了所有可能生成的镜像房间。
用于确定执行多少次迭代的准则可以取决于个体应用的偏好和要求。在许多实施例中,可以执行与预定的最大反射次数相对应的预定次数的迭代。
在其他实施例中,可以使用更加自适应的准则,例如,继续进行迭代,直到针对所有生成的镜像声源的组合衰减因子(组合反射因子)低于阈值为止。因此,对于这样的实施方式,可以重复迭代,直到认为反射信号弱到能够被忽略为止。
将意识到,任何停止准则都可以用于生成具有所期望的属性的模型和/或确保该过程具有所期望的属性。例如,可以继续进行迭代,直到所有衰减因子都低于阈值或已经执行了预定次数的迭代为止。
在许多实施例中,所生成的模型可以用于呈现在原始房间中的给定倾听位置处的针对原始声源的音响信号。步骤315可以特别包括由呈现器205基于在前一步骤中生成的模型而进行的呈现。
所述呈现可以特别包括确定针对每个声源的与从每个源到倾听位置的直接(无反射)路径相对应的音响分量。另外,对于每条路径,可以通过衰减因子来衰减信号,该衰减因子被确定为与路径长度和组合衰减因子直接对应,该组合衰减因子与和路径相交的所有边界所引起的组合衰减相对应。此外,许多实施例可以使用声音速度来根据路径长度确定延迟并通过与路径长度直接对应的延迟来延迟信号,从而模拟从(虚拟)声源到听众的飞行时间。因此,每个音响分量都会对一个早期反射进行仿真,并且能够通过组合所有音响分量(包括直接来自原始源的音响分量)加上任选的晚期回响分量(可以使用任何合适的手段(例如,Jot回响器)来生成晚期回响分量)来生成到达倾听位置的组合音响。
对从虚拟声源发生的直接无反射传播的音响分量的呈现提供了对房间/声学环境中的反射的高效仿真,从而允许生成被感知为自然逼真的声音的呈现。
将意识到,许多呈现算法(包括使用空间扬声器配置或用于耳机重现的双耳处理的空间呈现算法)是已知的,并且可以使用任何合适的方法。
如上所述,原始房间的每条边界可以与声学属性相关联,并且特别地,房间数据可以描述针对每条边界的衰减或反射因子。衰减/反射因子可以特别指示被墙壁反射的声学信号的衰减,即,它可以指示传入的音响信号与反射的音响信号之间的水平差异/比率。衰减/反射因子可以是频率依赖性的,并且例如可以与传入的音响信号的频率依赖性过滤直接对应。
针对边界的衰减因子将取决于边界的声学属性,并且将特别取决于构成边界的元素的材料。一些材料会引起强烈反射(例如,瓷砖),而其他材料则更具声学死区(例如,毛茸茸的地毯)并会衰减声音而使得仅反射大幅减小的信号。这可以通过衰减因子来指示。
对于每个虚拟源,去往原始房间的路径会与许多边界相交,其中,边界数等于生成房间的迭代数。另外,相交的每条边界都对应于在现实房间中的反射/对现实房间中的反射进行建模。例如,为了到达原始房间,虚拟声源与两条边界相交对由两个反射形成的原始房间中的路径进行建模。另外,这两个反射具有衰减因子,并且在将这些衰减因子分配给镜像边界时,用于与镜像边界相交的衰减因子直接反映了该模型的反射效果。
在许多实施例中,可以通过对已经在其周围执行了镜像处理的边界的衰减因子进行组合来确定针对每个虚拟声源的组合反射/衰减因子,以便生成虚拟镜像声源和对应的镜像房间。因此,能够通过对在通向包括镜像声源的镜像房间的镜像处理中包括的所有边界的衰减因子进行组合来生成针对镜像声源的组合衰减因子。
因此,这种组合衰减因子反映了通过虚拟声源建模的针对早期反射的所有反射的组合反射衰减。因此,可以通过呈现来使用组合衰减因子来确定例如针对达到倾听位置的音响分量的信号水平和/或频率分布。另外,这可以独立于原始房间中的倾听位置的特定位置,因此只需要特别确定针对特定的当前倾听位置的距离依赖性路径损失衰减。
在一些实施例中,选择准则可以包括以下要求:与针对镜像边界的衰减因子相组合的针对源声源的组合衰减因子必须指示低于阈值的衰减。因此,为了使边界被接受为镜像边界以生成新的镜像房间和镜像声源,要求该镜像声源的衰减不会超过给定的量。因此,当这使反射路径对原始声源的衰减达到一定程度而使得能够认为原始声源不对原始声音的感知做出贡献时,终止镜像处理进程。在许多实施例中,这会使复杂性降低和资源需求降低。
使用衰减因子也可以允许对非常具体的场景进行建模。特别地,它可以允许对其中一个(或多个)边界是声学死区或是透明的而丝毫不产生反射的房间进行高效建模。
特别地,声学无反射边界可以用以下衰减因子来表示,该衰减因子指示完全衰减,即,没有生成反射信号。因此,对于形成边界的无反射元素,可以分配100%的衰减因子(对应于为零的反射系数)。因此,通过包括该边界作为镜像边界的镜像处理的序列生成的任何虚拟的经镜像处理的声源将引起100%的组合衰减因子,因此不会生成任何音响分量,对应于任何包括该边界的反射路径不会到达倾听位置的情况。实际上,将衰减因子设置为100%衰减的方法也可以应用于不包括任何物理元素的边界(例如,缺失的墙壁或天花板)。
在许多实施例中,这可以与以下操作进行组合:针对这组镜像边界选择不包括引起低于给定阈值的衰减因子的边界,使得当它到达非反射墙壁时停止任何镜像序列。
在一些实施例中,阈值可以是自适应的。例如,取决于反射的阶次,或者取决于原始声源信号的相对(当前的、时间限制的)水平。
因此,可以使用所描述的方法来通过迭代地镜像处理先前迭代的房间的边界(例如,墙壁)周围的房间来生成针对早期反射的声学图像源模型。在每次迭代中在其周围进行镜像处理的边界由特定的选择准则来确定,该特定的选择准则包括要求镜像方向不能逆转,不能在排除的方向上,并且不能重复,除非在一系列连续的镜像处理中。
该方法可以顺序地扩展模型以包括对阶次越来越高的(即,越多的)反射进行建模。图9示出了表示模型的树的示例,图9示出了具有表示算法的进程以找到针对三阶反射的所有经镜像处理的房间(即,3个镜像处理迭代的树深度)的树。在图9中,向上方向、向下方向、向左方向、向右方向、向前方向和向后方向分别由U、D、L、R、F和B来表示。在该示例中,维度和方向由前-后、左-右和上-下来表示。图中的每个节点都表示一个房间,其中,第一节点是原始房间,并且其余节点表示原始房间的62个经镜像处理的版本。
该方法可以允许使用非常高效的算法来生成模型,该模型可以高度准确并且可以用来呈现音响而使得这被感知为逼真自然的声音效果。
该方法特别可以降低计算复杂性和/或所要求的计算资源要求/使用。与典型应用相比,可以使用较小的计算能力来实施该方法。特别地,与用于生成图像源模型的另一方法相比,该方法通常可以减少确定经镜像处理的虚拟声源所要求的镜像操作的数量,从而大大降低计算资源要求。该方法还可以避免通常与必须解决复制的虚拟声源相关联的后处理。通常能够实现更加高效的过程。
所描述的用于生成图像源模型的方法通常是初始化部件/例程的部分,该初始化部件/例程的部分需要为房间运行至少一次并且导出一组表示原始声源的反射的虚拟镜像源。在声源正在移动的情况下,可以重新计算图像源模型,或者针对一个或多个移动的源部分地重新计算图像源模型。
因此,在许多实施例中,该方法可以基于迭代过程,其中,每个过程包括针对在先前迭代中定义的每个镜像房间的两个步骤。这些步骤针对给定的房间(源房间)可以包括:
1、确定一组镜像边界,跨这组镜像边界的源房间和该房间中的至少一个点要被镜像处理以找到高阶反射。
2、对跨这组镜像边界中的边界中的每条边界的源房间和至少一个(源)位置/声源进行进行镜像处理,并且更新组合反射系数(衰减因子)以包括跨越的经镜像处理的边界相对应的反射系数。
许多实施例可以利用递归过程来执行迭代,其中,经镜像处理的房间被用作针对接下来的迭代的源房间。在下面以伪代码形式提供了过程的示例:
可以利用以下内容对其进行初始化和启动:
房间通常是矩形的(又被称为鞋盒模型),或者能够通过等效的矩形进行近似。这种矩形房间模型的边界不一定与如图10所示的那样定义它们的坐标系相对齐。
这引入了两个使图像源方法复杂化的问题。
·对跨边界的点进行镜像处理并不是简单直接地在单个维度中进行减法和加法,而是同时影响在两个甚至三个维度中的测量和调节。
·源房间的三个镜像处理维度(前-后、左-右和上-下)不会直接映射到坐标系。
一种方法是通过旋转每一个房间定义坐标和源位置坐标来将房间与坐标系对齐,计算虚拟声源位置,并且利用逆向旋转将上述内容旋转回来。
另一种方法是将镜像处理维度任意定义为定义房间的三个平行边界对并使且用几何数学来执行镜像处理。
将在下文中描述基于后一选项的示例性方法。
作为第一步骤,必须找到定义原始房间的三对平行边界并将其分配给三个镜像处理维度。能够任意选择该映射。不需要特定阶次。
一个例外情况是:仅在水平面中计算反射,例如为了进一步降低计算复杂性。在这种情况下,必须检测地板和天花板对,这可以通过找到法向向量最接近坐标系的上轴的边界来实现。例如。归一化法向向量的边界具有最大绝对点积。
为了找到这个对,计算每条边界的法向向量(在下面关于镜像处理点上的章节中进行更详细的说明)。所有法向向量对的相关矩阵允许找到这个对,并且还允许验证房间模型是矩形的情况。
相关矩阵C的每个元素cij=cji都包含具有索引i和j的边界的法向向量的点积。对于矩形房间定义,所有值应当非常接近0、1或-1。该值接近1或-1的对是平行对,因此可以被视为沿其进行镜像处理的三个维度中的一个维度。
作为该过程的部分,必须通过源房间的边界中的一个边界来定义必须跨平面镜像处理的源房间定义。而且,对源房间内部的其他位置(例如,(反射)声源位置)的镜像处理能够跨同一平面进行镜像处理。
跨平面的镜像处理点是众所周知的数学流程,并且能够使用平面的法向向量来执行。该向量(方向向量)垂直于平面内的所有向量,能够用于确定平面中的与要被镜像处理的点相距最短的点。这是镜像点。找到该点允许通过翻转将镜像点连接到要被镜像处理的点的方向向量的符号或通过使将要被镜像处理的点连接到镜像点的方向向量的长度变成两倍来将该点镜像处理到平面的相反侧。
根据平面中的两个向量或三个点能够导出平面的法向向量。定义矩形房间的边界的特别有利的方法是定义(矩形)边界的四个角的坐标。因此,选择这四个坐标中的三个坐标足以计算法向向量。
在替代表示中,房间及其边界可以被定义为具有3点多边形的网格。类似地,定义边界的多边形中的一个多边形的三个顶点能够用于计算法向向量。
获取这两个向量的叉积得到了这种正交法向向量。
作为降低进一步计算中的复杂性的手段,能够对法向向量进行归一化。
解决该问题会得到:
利用该方法,通过计算来找到经镜像处理的点(s′):
在大多数实施例中,还针对镜像源中的每个镜像源计算反射所引起的衰减。因此,在许多实施例中,针对每个镜像处理操作,计算针对经镜像处理的房间中的源的反射衰减,并且通过组合衰减因子来表示该反射衰减。在下文中,可以直接通过反射系数来表示衰减因子,但是将意识到,在许多实施例中,衰减可以例如是频率依赖性的。
源房间的反射衰减与被镜像处理的边界的反射系数相组合。边界的反射系数可以是宽带或频率依赖性的。例如。可以通过频带/分箱中的FIR/IIR滤波系数或衰减系数来表示衰减因子。例如:
reflAtt(f)=reflAttIn(f)*reflCoeff(mirrorBoundIdx,f)
反射系数不一定跨整条边界都是均匀的。在这种情况下,通过计算房间边界的表面上的平均反射系数,可以使针对整条边界所使用的反射系数均匀。类似地,可以计算针对房间的所有边界的平均值。
遵循前面概述的规则,在迭代过程中,选择(通常)六条边界的子集作为针对每一个源房间的一组镜像边界。在每次迭代中,由前一次迭代生成的每个镜像房间都可以被视为源房间,即,可以评价每个刚刚创建的镜像房间,以在下一次迭代中进行潜在的进一步镜像处理。
原始房间的每条边界都指定/表示方向(例如,针对边界的法向向量的方向和从房间向外的方向)。由于边界是成对平行的,因此每对边界用两个方向定义一个维度(对应于定义镜像处理维度的两条边界)。
例如,可以通过以下公式(其中,bi表示边界i)来表示平行边界对:
D1=[b1,b5]
D2=[b2,b4]
D3=[b3,b6]
在首次迭代(即,生成一阶反射)中,允许所有方向,因此针对与原始房间相对应的源房间的这组镜像边界包括源房的所有边界。这将引起六个(或在2D建模的情况下为四个)分支,进一步的迭代从该分支计算更高阶的反射,例如,B=[b1,b5,b2,b4,b3,b6]。因此,在首次迭代中生成了六个新的镜像房间和六个新的镜像声源。
在这些分支中的任一个分支中(例如,在边界b4上的镜像处理之后的分支),下一次(即,二次)迭代可以关于原始房间在相同的方向上继续。这对应于跨对应维度边界对中的另一条边界的镜像(因为它是在通过镜像处理原始房间而生成的房间的边界上的镜像处理)。在该示例中为b2。在图6和图7中也示出了在每个维度中的边界的这种交替。
取决于分支中的先前迭代进行所沿的维度,方向会受到更多的限制。例如,如果先前步骤沿着第一维度,则凭借在第二维度中的排除的方向而仅允许第二维度的单个方向。然而,由于方向仅在两个维度中,因此第三维度的两个方向都是可接受的。例如,当在第一维度的第一方向上进行时,相关联的排除的方向因此使得在第二维度中仅允许第一方向,并且当在第一维度的第二方向上进行时,仅允许第二维度的第二方向。
在同一示例中,当第一步骤在第二维度的第一方向上进行时,仅允许第一个维度的第二方向,并且当第一步骤在第二维度的第二方向上进行时,仅允许第一维度的第一方向。第二步骤中的允许方向之间的这种反向关系取决于是在第一维度(第一-第一、第二-第二)中还是在第二维度(第一-第二、第二-第一)中的第一步骤在不忽略经镜像处理的房间的同时阻止了经镜像处理的房间的交叠。
在同一示例中,如果任一镜像处理步骤沿着第三维度,则所有后续的镜像处理只能在那个方向上,而不能沿着任何其他方向或维度。
应当清楚的是,上面的第一维度、第二维度和第三维度的概念不必与定义维度对的顺序相关,并且当与维度相关时,“第一”、“第二”和“第三”可以互换。类似地,当与维度内的方向相关时,“第一”和“第二”也可以互换。需要重复的是,在上面的示例中,维度内的方向被视为参考原始房间,而与维度中的某个方向相关的边界可以与在该方向上的每个镜像处理步骤进行替换。
所有已经改变维度的分支都不能回到早期维度中的镜像处理。例如。在第一步骤中在第二维度中镜像处理的和在第二步骤中沿着第一维度的分支只能在第一维度的那个方向上继续进行镜像处理,并且在第三维度中的任何方向上继续进行镜像处理。
在确定这组允许的方向时,高级实施例可以考虑衰减因子,例如,反射系数或总反射衰减。这可以进一步降低计算复杂性。例如,如果根据上述规则允许某个方向,但是对应边界的反射系数低于某个阈值(即,小于0.05或替代地小于或等于-20dB),则可以从这组镜像边界中排除该方向。
额外地或替代地,可以包括以下规则:当组合反射衰减低于某个阈值(例如小于0.02)时,将排除该边界。
对于频率依赖性系数,阈值可以是频率依赖性的,与所有频带上的加权平均系数、来自所有频段的最大系数或与某个频率相关的系数(例如,1000Hz)有关。
类似地,针对边界内的区域之间不同的反射系数,阈值可以应用于个体声源位置或在整个房间边界上使用平均反射系数。
将意识到,为了清楚起见,上述说明已经参考不同的功能电路、单元和处理器描述了本发明的实施例。然而,很明显,在不同的功能电路、单元或处理器之间的任何合适的功能分布都可以被使用而不会损害本发明。例如,被说明为由单独的处理器或控制器执行的功能也可以由同一处理器或控制器来执行。因此,引用特定的功能单元或电路仅被视为引用用于提供所述功能的合适手段,而不是指示严格的逻辑或物理结构或组织形式。
本发明能够以任何合适的形式来实施,包括硬件、软件、固件或这些项目的任何组合。本发明任选地可以至少部分被实施为在一个或多个数据处理器和/或数字信号处理器上运行的计算机软件。本发明的实施例的元件和部件可以以任何合适的方式在物理、功能和逻辑上实施。实际上,功能可以被实施在单个单元、多个单元上或者作为其他功能单元的部分来实施。正因如此,本发明可以被实施在单个单元中,也可以在物理和功能上被分布在不同的单元、电路和处理器之间。
通常,以下实施例指示了用于确定虚拟声源的装置和方法的示例。
实施例:
1、一种确定表示第一房间中的第一声源的反射的虚拟声源的方法,所述方法包括计算机执行以下步骤:
接收描述所述第一房间的边界以及针对所述房间中的所述第一声源的声源位置的数据;
通过对在先前迭代中确定的声源执行声源镜像处理来将所述虚拟声源迭代地确定为经镜像处理的声源,
每次迭代包括:针对包括在前一次迭代中确定的镜像房间的一组源房间中的每个源房间,执行以下步骤:
确定(303)针对所述源房间的一组镜像边界;
针对所述一组镜像边界中的每个镜像边界,通过将所述源房间镜像处理在所述镜像边界周围来确定(305)镜像房间,并且通过将源声源镜像处理在所述镜像边界周围来确定镜像声源,所述源声源是所述源房间的镜像声源,所述镜像处理具有从所述源房间到所述镜像房间的镜像处理方向;
其中,
对所述一组镜像边界的所述确定(303)包括根据选择准则来选择所述源房间的边界,所述选择准则包括:
针对所述源房间的要被包括在所述一组镜像边界中的候选边界,要求针对所述候选边界的镜像处理的第一方向不得在针对任何通向所述源房间的先前镜像处理的镜像处理方向的相反方向上;
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在排除的方向上,所述排除的方向取决于所述第一房间的以下边界,执行到所述边界周围的镜像处理通向所述源房间;以及
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在与针对任何通向所述源房间的先前镜像处理的任何镜像处理方向相同的方向上,除了在前一次迭代中生成所述源房间的镜像处理的镜像处理方向以外。
2、根据权利要求1所述的方法,其中,所述选择准则包括:如果针对任何通向所述源房间的先前镜像处理的镜像处理的第二方向垂直于所述排除的方向并且垂直于通向所述源房间的针对所述第一房间的所述镜像处理的镜像方向,则针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向必须与所述第二方向相同。
3、根据权利要求1所述的方法,其中,所述第一房间具有镜像处理的一对参考方向,所述一对参考方向在相反的方向上,并且所述选择准则包括:如果针对任何通向所述源房间的先前镜像处理的镜像处理的第二方向在属于镜像处理的相关联的所述一对参考方向的方向上,则针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向必须与所述第二方向相同。
4、根据任一前述权利要求所述的方法,其中,针对首次迭代,所述第一房间被指定为所述一组源房间中的针对所述首次迭代的源房间。
5、根据任一前述权利要求所述的方法,其中,所述第一房间的所有边界都被包括在针对所述首次迭代的所述一组镜像边界中。
6、根据任一前述权利要求所述的方法,其中,所述第一房间的每条边界都与衰减因子相关联,并且所述方法包括通过将针对被包括在通向包括所述镜像声源的所述镜像房间的镜像处理中的所有边界的衰减因子进行组合来确定针对每个镜像声源的组合衰减因子。
7、根据权利要求6所述的方法,其中,所述选择准则包括:针对要被包括在所述一组镜像边界中的所述候选边界,要求与针对所述候选边界的衰减因子相组合的针对所述源声源的组合衰减因子必须指示低于阈值的衰减。
8、根据权利要求6或7所述的方法,其中,所述组合衰减因子是频率依赖性的。
9、根据权利要求6至8中的任一项所述的方法,针对声学无反射边界的衰减因子指示完全衰减。
10、根据任一前述权利要求所述的方法,还包括呈现(309)针对所述第一房间中的倾听位置的音响信号,所述音响信号包括至少一个音响分量,所述至少一个音响分量表示从至少一个镜像音响源到达所述倾听位置的音响。
11、根据任一前述权利要求所述的方法,其中,所述一组镜像边界包括满足所述选择准则的所有边界。
12、根据任一前述权利要求所述的方法,其中,执行预定次数的迭代。
13、根据任一前述权利要求所述的方法,其中,所述第一房间是棱正交的多胞形。
14.一种用于确定表示第一房间中的第一声源的反射的虚拟声源的装置,所述装置包括:
接收器(201),其被布置为接收描述所述第一房间的边界以及针对所述房间中的所述第一声源的声源位置的数据;
处理电路(203),其被布置为通过对在先前迭代中确定的声源执行声源镜像处理来将所述虚拟声源迭代地确定为经镜像处理的声源,
每次迭代包括:针对包括在前一次迭代中确定的镜像房间的一组源房间中的每个源房间,执行以下步骤:
确定(303)针对所述源房间的一组镜像边界;
针对所述一组镜像边界中的每个镜像边界,通过将所述源房间镜像处理在所述镜像边界周围来确定(305)镜像房间,并且通过将源声源镜像处理在所述镜像边界周围来确定镜像声源,所述源声源是所述源房间的镜像声源,所述镜像处理具有从所述源房间到所述镜像房间的镜像处理方向;
其中,
对所述一组镜像边界的所述确定包括根据选择准则来选择所述源房间的边界,所述选择准则包括:
针对所述源房间的要被包括在所述一组镜像边界中的候选边界,要求针对所述候选边界的镜像处理的第一方向不得在针对任何通向所述源房间的先前镜像处理的镜像处理方向的相反方向上;
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在排除的方向上,所述排除的方向取决于所述第一房间的以下边界,执行到所述边界周围的镜像处理通向所述源房间;以及
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在与针对任何通向所述源房间的先前镜像处理的任何镜像处理方向相同的方向上,除了在前一次迭代中生成所述源房间的镜像处理的镜像处理方向以外。
15、一种包括计算机程序代码单元的计算机程序产品,当所述程序在计算机上运行时,所述计算机程序代码单元适于执行根据权利要求1-13所述的所有步骤。
1、一种确定表示第一房间中的第一声源的反射的虚拟声源的方法,所述方法包括计算机执行以下步骤:
接收描述所述第一房间的边界以及针对所述房间中的所述第一声源的声源位置的数据;
通过对在先前迭代中确定的声源执行声源镜像处理来将所述虚拟声源迭代地确定为经镜像处理的声源,
每次迭代包括:针对包括在前一次迭代中确定的镜像房间的一组源房间中的每个源房间,执行以下步骤:
确定(303)针对当前步骤/所述当前步骤的源房间的一组镜像边界;
针对所述一组镜像边界中的每个镜像边界,通过将所述源房间镜像处理在所述镜像边界周围来确定(305)镜像房间,并且通过将源声源镜像处理在所述镜像边界周围来确定镜像声源,所述源声源是所述源房间的镜像声源,所述镜像处理具有从所述源房间到所述镜像房间的镜像处理方向;
其中,
对所述一组镜像边界的所述确定(303)包括根据选择准则来选择所述源房间的边界,所述选择准则包括:
针对所述源房间的要被包括在所述一组镜像边界中的候选边界,要求针对所述候选边界的镜像处理的第一方向不得在针对任何通向所述源房间的先前镜像处理的镜像处理方向的相反方向上;
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在排除的方向上,所述排除的方向取决于所述第一房间的以下边界,执行到所述边界周围的镜像处理通向所述源房间;以及
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在与针对任何通向所述源房间的先前镜像处理的任何镜像处理方向相同的方向上,除了在前一次迭代中生成所述源房间的镜像处理的镜像处理方向以外。
1、一种确定表示第一房间中的第一声源的反射的虚拟声源的方法,所述方法包括:
接收描述所述第一房间的边界以及针对所述房间中的所述第一声源的声源位置的数据;
通过对在先前迭代中确定的声源执行声源镜像处理来将所述虚拟声源迭代地确定为经镜像处理的声源,
每次迭代包括:针对包括在前一次迭代中确定的镜像房间的一组源房间中的每个源房间,执行以下步骤:
确定(303)针对每个所述源房间的一组镜像边界;
针对所述一组镜像边界中的每个镜像边界,通过将每个所述源房间镜像处理在所述镜像边界周围来确定(305)镜像房间,并且通过将源声源镜像处理在所述镜像边界周围来确定镜像声源,所述源声源是每个所述源房间的镜像声源,所述镜像处理具有从每个所述源房间到所述镜像房间的镜像处理方向;
其中,
对所述一组镜像边界的所述确定(303)包括根据选择准则来选择每个所述源房间的边界,所述选择准则包括:
针对每个所述源房间的要被包括在所述一组镜像边界中的候选边界,要求针对所述候选边界的镜像处理的第一方向不得在针对任何通向每个所述源房间的先前镜像处理的镜像处理方向的相反方向上;
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在排除的方向上,所述排除的方向取决于所述第一房间的以下边界,执行到所述边界周围的镜像处理通向每个所述源房间;以及
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在与针对任何通向每个所述源房间的先前镜像处理的任何镜像处理方向相同的方向上,除了在前一次迭代中生成每个所述源房间的镜像处理的镜像处理方向以外。
更特别地,本发明是由权利要去来限定的。
虽然本发明是与一些实施例相关地描述的,但是这并不旨在将本发明限制于本文阐述的特定形式。相反,本发明的范围仅由权利要求来限定。另外,虽然特征表现为是与特定实施例相关地描述的,但是本领域技术人员将认识到,也可以结合根据本发明所描述的实施例的各种特征。在权利要求中,术语包括并不排除其他元件或步骤的存在。
另外,虽然被单独列出,但是多个模块、元件、电路或方法步骤也可以由例如单个电路、单元或处理器来实施。另外,虽然各个特征可能被包括在不同的权利要求中,但是可以有利地组合这些特征,并且这些特征被包括在不同的权利要求中并不意味着特征的组合是不可行和/或不利的。而且,特征被包括在一种类型的权利要求中并不意味着该特征限于该类型,而是指示该特征等同地适用于其他类型的权利要求。此外,权利要求中的特征的顺序并不意味着必须以此使用这些特征的任何特定顺序,特别地,方法权利要求中的各个步骤的顺序并不意味着必须按照该顺序执行这些步骤。相反,可以以任何合适的顺序执行这些步骤。另外,单数引用并不排除多个。因此,对“一”、“一个”、“第一”、“第二”等的引用并不排除多个。权利要求中的附图标记仅是为了澄清示例而提供的,不得被解释为以任何方式限制权利要求的范围。
Claims (15)
1.一种确定表示第一房间中的第一声源的反射的虚拟声源的方法,所述方法包括计算机执行以下步骤:
接收描述所述第一房间的边界以及针对所述房间中的所述第一声源的声源位置的数据;
通过对在先前迭代中确定的声源执行声源镜像处理来将所述虚拟声源迭代地确定为经镜像处理的声源,
每次迭代包括:针对包括在前一次迭代中确定的镜像房间的一组源房间中的每个源房间,执行以下步骤:
确定(303)针对所述源房间的一组镜像边界;
针对所述一组镜像边界中的每个镜像边界,通过将所述源房间镜像处理在所述镜像边界周围来确定(305)镜像房间,并且通过将源声源镜像处理在所述镜像边界周围来确定镜像声源,所述源声源是所述源房间的镜像声源,所述镜像处理具有从所述源房间到所述镜像房间的镜像处理方向;
其中,
对所述一组镜像边界的所述确定(303)包括根据选择准则来选择所述源房间的边界,所述选择准则包括:
针对所述源房间的要被包括在所述一组镜像边界中的候选边界,要求针对所述候选边界的镜像处理的第一方向不得在针对任何通向所述源房间的先前镜像处理的镜像处理方向的相反方向上;
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在排除的方向上,所述排除的方向取决于所述第一房间的以下边界,执行到所述边界周围的镜像处理通向所述源房间;以及
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在与针对任何通向所述源房间的先前镜像处理的任何镜像处理方向相同的方向上,除了在前一次迭代中生成所述源房间的镜像处理的镜像处理方向以外。
2.根据权利要求1所述的方法,其中,所述选择准则包括:如果针对任何通向所述源房间的先前镜像处理的镜像处理的第二方向垂直于所述排除的方向并且垂直于通向所述源房间的针对所述第一房间的所述镜像处理的镜像方向,则针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向必须与所述第二方向相同。
3.根据权利要求1所述的方法,其中,所述第一房间具有镜像处理的一对参考方向,所述一对参考方向在相反的方向上,并且所述选择准则包括:如果针对任何通向所述源房间的先前镜像处理的镜像处理的第二方向在属于镜像处理的相关联的所述一对参考方向的方向上,则针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向必须与所述第二方向相同。
4.根据任一前述权利要求所述的方法,其中,针对首次迭代,所述第一房间被指定为所述一组源房间中的针对所述首次迭代的源房间。
5.根据任一前述权利要求所述的方法,其中,所述第一房间的所有边界都被包括在针对所述首次迭代的所述一组镜像边界中。
6.根据任一前述权利要求所述的方法,其中,所述第一房间的每条边界都与衰减因子相关联,并且所述方法包括通过将针对被包括在通向包括所述镜像声源的所述镜像房间的镜像处理中的所有边界的衰减因子进行组合来确定针对每个镜像声源的组合衰减因子。
7.根据权利要求6所述的方法,其中,所述选择准则包括:针对要被包括在所述一组镜像边界中的所述候选边界,要求与针对所述候选边界的衰减因子相组合的针对所述源声源的组合衰减因子必须指示低于阈值的衰减。
8.根据权利要求6或7所述的方法,其中,所述组合衰减因子是频率依赖性的。
9.根据权利要求6至8中的任一项所述的方法,针对声学无反射边界的衰减因子指示完全衰减。
10.根据任一前述权利要求所述的方法,还包括呈现(309)针对所述第一房间中的倾听位置的音响信号,所述音响信号包括至少一个音响分量,所述至少一个音响分量表示从至少一个镜像音响源到达所述倾听位置的音响。
11.根据任一前述权利要求所述的方法,其中,所述一组镜像边界包括满足所述选择准则的所有边界。
12.根据任一前述权利要求所述的方法,其中,执行预定次数的迭代。
13.根据任一前述权利要求所述的方法,其中,所述第一房间是棱正交的多胞形。
14.一种用于确定表示第一房间中的第一声源的反射的虚拟声源的装置,所述装置包括:
接收器(201),其被布置为接收描述所述第一房间的边界以及针对所述房间中的所述第一声源的声源位置的数据;
处理电路(203),其被布置为通过对在先前迭代中确定的声源执行声源镜像处理来将所述虚拟声源迭代地确定为经镜像处理的声源,
每次迭代包括:针对包括在前一次迭代中确定的镜像房间的一组源房间中的每个源房间,执行以下步骤:
确定(303)针对所述源房间的一组镜像边界;
针对所述一组镜像边界中的每个镜像边界,通过将所述源房间镜像处理在所述镜像边界周围来确定(305)镜像房间,并且通过将源声源镜像处理在所述镜像边界周围来确定镜像声源,所述源声源是所述源房间的镜像声源,所述镜像处理具有从所述源房间到所述镜像房间的镜像处理方向;
其中,
对所述一组镜像边界的所述确定包括根据选择准则来选择所述源房间的边界,所述选择准则包括:
针对所述源房间的要被包括在所述一组镜像边界中的候选边界,要求针对所述候选边界的镜像处理的第一方向不得在针对任何通向所述源房间的先前镜像处理的镜像处理方向的相反方向上;
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在排除的方向上,所述排除的方向取决于所述第一房间的以下边界,执行到所述边界周围的镜像处理通向所述源房间;以及
针对要被包括在所述一组镜像边界中的所述候选边界,要求所述第一方向不得在与针对任何通向所述源房间的先前镜像处理的任何镜像处理方向相同的方向上,除了在前一次迭代中生成所述源房间的镜像处理的镜像处理方向以外。
15.一种包括计算机程序代码单元的计算机程序产品,当所述程序在计算机上运行时,所述计算机程序代码单元适于执行根据权利要求1-13所述的所有步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19212064.0 | 2019-11-28 | ||
EP19212064.0A EP3828882A1 (en) | 2019-11-28 | 2019-11-28 | Apparatus and method for determining virtual sound sources |
PCT/EP2020/081815 WO2021104881A1 (en) | 2019-11-28 | 2020-11-12 | Apparatus and method for determining virtual sound sources |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114787912A true CN114787912A (zh) | 2022-07-22 |
Family
ID=68731795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080083053.8A Pending CN114787912A (zh) | 2019-11-28 | 2020-11-12 | 用于确定虚拟声源的装置和方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US11943606B2 (zh) |
EP (2) | EP3828882A1 (zh) |
JP (1) | JP2023503986A (zh) |
KR (1) | KR20220104051A (zh) |
CN (1) | CN114787912A (zh) |
BR (1) | BR112022010270A2 (zh) |
MX (1) | MX2022006382A (zh) |
PL (1) | PL4066236T3 (zh) |
WO (1) | WO2021104881A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118678286A (zh) * | 2024-08-06 | 2024-09-20 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、系统、电子设备及存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4132012A1 (en) | 2021-08-05 | 2023-02-08 | Koninklijke Philips N.V. | Determining virtual audio source positions |
WO2024084998A1 (ja) * | 2022-10-19 | 2024-04-25 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響処理装置及び音響処理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3172391B2 (ja) | 1995-04-13 | 2001-06-04 | シャープ株式会社 | 音環境再現方法 |
NZ587483A (en) * | 2010-08-20 | 2012-12-21 | Ind Res Ltd | Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions |
CN103813260B (zh) | 2014-01-28 | 2015-09-16 | 哈尔滨工业大学 | 一种基于镜像源法的长空间混响时间获得方法 |
-
2019
- 2019-11-28 EP EP19212064.0A patent/EP3828882A1/en not_active Withdrawn
-
2020
- 2020-11-12 JP JP2022530758A patent/JP2023503986A/ja active Pending
- 2020-11-12 BR BR112022010270A patent/BR112022010270A2/pt unknown
- 2020-11-12 EP EP20803169.0A patent/EP4066236B1/en active Active
- 2020-11-12 CN CN202080083053.8A patent/CN114787912A/zh active Pending
- 2020-11-12 US US17/777,634 patent/US11943606B2/en active Active
- 2020-11-12 MX MX2022006382A patent/MX2022006382A/es unknown
- 2020-11-12 PL PL20803169.0T patent/PL4066236T3/pl unknown
- 2020-11-12 KR KR1020227021951A patent/KR20220104051A/ko unknown
- 2020-11-12 WO PCT/EP2020/081815 patent/WO2021104881A1/en unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118678286A (zh) * | 2024-08-06 | 2024-09-20 | 腾讯科技(深圳)有限公司 | 音频数据处理方法、装置、系统、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2023503986A (ja) | 2023-02-01 |
WO2021104881A1 (en) | 2021-06-03 |
US11943606B2 (en) | 2024-03-26 |
KR20220104051A (ko) | 2022-07-25 |
US20230007426A1 (en) | 2023-01-05 |
EP3828882A1 (en) | 2021-06-02 |
BR112022010270A2 (pt) | 2022-08-16 |
EP4066236C0 (en) | 2024-05-29 |
EP4066236B1 (en) | 2024-05-29 |
PL4066236T3 (pl) | 2024-08-12 |
EP4066236A1 (en) | 2022-10-05 |
MX2022006382A (es) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4066236B1 (en) | Apparatus and method for determining virtual sound sources | |
EP3595337A1 (en) | Audio apparatus and method of audio processing | |
US20240244391A1 (en) | Audio Apparatus and Method Therefor | |
Aspöck et al. | A real-time auralization plugin for architectural design and education | |
Kim et al. | Immersive audio-visual scene reproduction using semantic scene reconstruction from 360 cameras | |
JP7478100B2 (ja) | 反響利得正規化 | |
JP2023518200A (ja) | 有効中間回折経路を使用してオーディオシーンをレンダリングするための装置および方法 | |
EP4132012A1 (en) | Determining virtual audio source positions | |
EP4210352A1 (en) | Audio apparatus and method of operation therefor | |
EP4210353A1 (en) | An audio apparatus and method of operation therefor | |
EP4383755A1 (en) | An audio apparatus and method of rendering therefor | |
TWI852358B (zh) | 基於柵格路徑尋找之繞射模型化 | |
EP4383754A1 (en) | An audio apparatus and method of rendering therefor | |
EP4398607A1 (en) | An audio apparatus and method of operation therefor | |
Dias et al. | 3D reconstruction and spatial auralization of the Painted Dolmen of Antelas | |
WO2023199673A1 (ja) | 立体音響処理方法、立体音響処理装置及びプログラム | |
TW202435204A (zh) | 音訊設備及其操作方法 | |
TW202348048A (zh) | 基於柵格路徑尋找之繞射模型化 | |
CA3174767A1 (en) | Apparatus and method for rendering a sound scene comprising discretized curved surfaces |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |