CN114556971A - 对头部相关冲激响应进行建模 - Google Patents

对头部相关冲激响应进行建模 Download PDF

Info

Publication number
CN114556971A
CN114556971A CN202080072479.3A CN202080072479A CN114556971A CN 114556971 A CN114556971 A CN 114556971A CN 202080072479 A CN202080072479 A CN 202080072479A CN 114556971 A CN114556971 A CN 114556971A
Authority
CN
China
Prior art keywords
elevation
basis function
azimuth
filter
basis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080072479.3A
Other languages
English (en)
Inventor
厄兰多·卡尔森
张梦秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN114556971A publication Critical patent/CN114556971A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)

Abstract

一种用于声音信号滤波的方法(1900)。所述方法包括:生成(s1902)用于由仰角角度θ和方位角角度
Figure DDA0003598773530000011
指定的特定位置的滤波器对,所述滤波器对由右滤波器
Figure DDA0003598773530000012
和左滤波器
Figure DDA0003598773530000013
构成;使用所述右滤波器对声音信号滤波(s1904);以及使用所述左滤波器对所述声音信号滤波(s1906)。生成所述滤波器对包括:i)至少获得在所述仰角角度处的第一仰角基函数值集合;ii)至少获得在所述方位角角度处的第一方位角基函数值集合;iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数;以及iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数。

Description

对头部相关冲激响应进行建模
技术领域
本公开涉及渲染空间声音。
背景技术
我们有捕获朝着我们传播的声波的两只耳朵。图1示出了从由球坐标系中的仰角角度和方位角角度对指定的到达方向(DOA)朝着收听者传播的声波。在朝着我们的传播路径上,在到达我们的左耳鼓和右耳鼓之前,每个声波与我们的上躯干、头部、外耳和环境介质相互作用。这个相互作用导致到达左耳鼓和右耳鼓的波形的时间改变和频谱改变,其中的一些改变是DOA相关的。我们的听觉系统已经学会解释这些改变,以推断声波本身的各种空间特性以及收听者发现他自身/她自身所处的声音环境。这个能力称为空间听觉,其涉及我们如何评估嵌入在双耳信号(即右耳道和左耳道中的声音信号)中的空间线索,以推断由声音事件(物理声源)引发的听觉事件的位置和由我们所处的物理环境(例如,小房间、贴砖的浴室、礼堂、洞穴)导致的声音特性。人类的这个能力(空间听觉)进而可以被开发用于通过在双耳信号中重新引入将导致对声音的空间感知的空间线索来创建空间声音场景。
主空间线索包括:1)角度相关的线索:双耳线索(即耳间电平差(ILD)和耳间时差(ITD))和单耳(或频谱)线索;2)距离相关的线索:强度以及直接-混响(D/R)能量比。图2示出了朝着收听者传播的声波的ITD和频谱线索的示例。这两个图示出了在0度仰角和40度方位角处获得的HR滤波器对的幅度响应(所述数据来自CIPIC数据库:对象ID 28。所述数据库是公开可用的,其可以通过URLwww.ece.ucdavis.edu/cipic/spatial-sound/hrtf-data/访问)。在图1和图2中,使用正方位角方向向右的惯例,并且这也是在本文的其余部分中使用的惯例。然而,一些HR滤波器集合的确使用另一惯例(其中的正方位角方向向左)。波形的短时间的DOA相关的时间和频谱改变(1-5毫秒)的数学表示是所谓的头部相关(HR)滤波器。这些滤波器的频域(FD)表示是所谓的头部相关传递函数(HRTF)并且时域(TD)表示是头部相关冲激响应(HRIR)。已经逐渐建立了基于HR滤波器的双耳渲染方法,其中,通过直接利用希望位置的HR滤波器对对声源信号滤波而生成空间声音场景。这个方法对于许多新兴应用特别有吸引力,例如虚拟现实(VR)、增强现实(AR)、混合现实(MR)或扩展现实(XR)、以及移动通信系统,其中通常都使用耳机。
通常根据作为线性动态系统的冲激响应的测量结果来估计头部相关的(HR)滤波器,该线性动态系统将原始声音信号(输入信号)转换成可以在收听对象的耳道内测量到的左耳信号和右耳信号(输出信号),其中该收听对象在距该收听对象(例如,人造头部、人体模型或人体)恒定半径的球表面上的预定义仰角角度和方位角角度集合处。已估计的HR滤波器通常设置为FIR滤波器并且可以在该格式下直接使用。为了实现高效的双耳渲染,HRTF对可以转换成耳间传递函数(ITF)或经修改的ITF以防止陡峭的频谱峰。备选地,HRTF可以通过参数表示进行描述。这些参数化的HRTF易于与参数多通道声音编码器(例如MPEG环绕声和空间声音对象编码(SAOC))集成。
渲染空间声音信号以提供针对空间中任意位置的声音的令人信服的空间感知需要针对对应位置的HR滤波器对,因此需要针对在2D球体上的精细采样位置的HR滤波器集合。最小可听角度(MAA)将我们的听觉系统的灵敏度表征为声音事件的角位移。关于方位角的位置,所报告的是,对于宽带噪声突发,MAA在前向和后向上最小(约1度)并且对于侧向声源要大得多(约10度)。正中面中的MAA随仰角增大。所报告的是,对于宽带噪声突发,仰角上的平均MAA与4度一样小。当前,存在一些公开可用的在空间上密集采样的HR滤波器数据库,例如SADIE数据库、CIPIC数据库。然而,特别是在仰角的样本上,它们都不能完全满足MAA要求。即使人造头部Neumann(纽曼)KU100和KEMAR人体模型的SAIDE数据集包含多于8000个测量结果,但是其在-15度与15度之间的仰角上的采样分辨率是15度,而根据MAA研究则需要4度。不可避免的是,需要HR滤波器的角度插值,从而可以在没有经测量的实际滤波器的位置渲染声源。图3示出了在2D球体上对网格进行采样的示例,其中的各个点指示对HR滤波器进行测量的位置。
已经针对HR滤波器的角度插值开发了多个不同的插值方案。通常,根据在球上
Figure BDA0003598773510000031
处的测量结果估计M个HR滤波器对
Figure BDA0003598773510000032
其中,r表示右耳,l表示左耳,
Figure BDA0003598773510000033
表示仰角,
Figure BDA0003598773510000034
表示方位角。任务是找到函数
Figure BDA0003598773510000035
其中
Figure BDA0003598773510000036
Figure BDA0003598773510000037
其在未经采样的角度处提供传递具有良好感知准确度的声音渲染的左滤波器和右滤波器。一旦获得
Figure BDA0003598773510000038
就可以在由
Figure BDA0003598773510000039
指定的任何任意位置生成左耳和右耳HR滤波器。要注意,为了简单而不造成混淆有时省略了上标l或r。
用于HRTF角度插值的两个主要的方法如下:
(1)本地邻居法:通常采用的方法是线性插值,其中,通过在其周围最近位置测量的HRTF的贡献进行加权而推断缺失的HRTF。在插值之前可以对HRTF进行预处理,例如首先将在两个或更多个最近位置测量的HRTF转换成最小相位,然后应用线性插值。
(2)变化的方法:更复杂的数据驱动的方法是将已测量的HRTF线性变换到由基函数集合定义的另一个空间,其中,基函数的一个集合覆盖仰角角度维度和方位角角度维度并且另一个集合覆盖频率维度。可以通过对已测量的HRTF的协方差矩阵进行特征分解来获得基函数[1,2]。在[3]中,已经将完备并且在2D球体上正交的球谐函数(SH)用于覆盖仰角角度维度和方位角角度维度,并且已经将复指数函数用于覆盖频率维度。基于SH的HRTF模型在模型的平均均方误差(MSE)和感知响度稳定性方面产生了令人鼓舞的性能水平[4]。
发明内容
准确和高效地渲染空间位置的声源的能力是基于HR滤波器的空间声音渲染器的主要特征之一。渲染器中使用的HR滤波器集合的空间分辨率确定经渲染的声源的空间分辨率。使用在2D球体上进行粗采样的HR滤波器集合,VR/AR/MR/XR用户经常报告移动声音的空间不连续性。这些空间不连续性导致音频视频同步误差,其明显地降低了沉浸感。使用在球体上经精细采样的HR滤波器集合是一个解决方案。然而,根据在满足MAA要求的精细网格上的输入-输出测量结果估计HR滤波器集合可能非常耗时并且对于对象和实验人员两者而言很枯燥。备选地,更高效的是在给定经稀疏采样的HR滤波器数据集时推断与缺失的HR滤波器有关的空间相关信息。
最近邻HR滤波器插值法假设在每个采样位置HR滤波器仅最多影响某个有限距离的区域。然后将未采样位置的HR滤波器近似为在某个截止距离之内位置的HR滤波器的加权平均,或基于直线2D网格上的指定数量的最近点对未采样位置的HR滤波器进行近似,例如,
Figure BDA0003598773510000041
其中,
Figure BDA0003598773510000042
是在未采样位置
Figure BDA0003598773510000043
处估计的HR滤波器向量,并且
Figure BDA0003598773510000044
Figure BDA0003598773510000045
这个方法简单,并且计算复杂度低,其可以导致高效的实现。然而,插值准确度可能不足以产生令人信服的空间声音场景。这仅仅是由于样本点之间的情况的变化比滤波器的加权平均可以产生的更复杂的事实。
所述变化的方法将HR滤波器表示为基函数集合的线性组合(即
Figure BDA0003598773510000046
其中,ωp是第p基函数
Figure BDA0003598773510000047
的系数)。无论基函数是什么,系数通常都是通过使已测量的点集合
Figure BDA0003598773510000048
上的平方估计误差之和最小化而获得的最小二乘估计,即
Figure BDA0003598773510000049
给定基函数集合,认为所述系数是在求解二次最小问题意义下的“最佳”拟合。在原理上,对基函数的选择没有限制。然而,实际上,实际选择能够在估计准确度方面有效地表示以及在基函数的数量和基函数的复杂度方面有效地表示HR滤波器集合的基函数集合。
关于对HRTF幅度响应进行建模的早期工作使用主成分(PC)作为基函数,其中的PC是通过对根据10个收听者在265个源位置测量的HRTF幅度响应的协方差矩阵进行特征分解获得的。仅使用五个PC,所产生的模型达到了原始数据库中的方差的接近90%。这个模型是高效的。其很好地表示了原始数据集同时无需在缺失的位置对HRTF进行插值的机制。最近,提出了将主成分分析(PCA)与最近邻方法组合的混合方法,其中通过偏导数来近似模型系数。然而,该混合方法仅实现了与基于最近邻的双线性插值类似的结果。
已经将SH用于对HRTF集合的角度相关性进行建模。所产生的模型在模型的平均均方误差(MSE)方面产生了令人鼓舞的性能水平。然而,与基于特征分解的模型中的基函数(其是固定的PC向量)不同,SH基函数复杂并且评估代价高。将p次q阶的SH函数写为
Figure BDA0003598773510000051
是相关联的勒让德多项式,其实质上是P次三角多项式。对于整个模型,需要评估最高为P阶的(P+1)2个SH。
为了实现高空间分辨率,SH表示的阶应该尽可能的高。已经在所感知的空间响度稳定性的背景下研究了SH阶对空间混叠的影响,所感知的空间响度稳定性被定义为在不同的头部定向上感知的经渲染的声音场景的响度有多稳定。主观结果显示需要将高阶(P>10)SH HRTF表示用于促进高质量动态虚拟声音场景。这导致了L(P+1)2=15488个系数,其中,L=128与频率仓(bin)的数量相对应。另一个研究还利用复指数对HRTF频率部分进行了建模,并且系数的总数量是L(P+1)2,其中,L是频率部分表示的截短数量。结果显示,为了在MSE方面表示高达20kHz的整个频率范围上的HRTF,SH的阶需要达到与P=30一样大,并且经截短的频率部分是L=40。系数的数量是38440。使用这样的高阶SH HRTF模型来评估HRTF基本上不可能在实时VR/AR/MR/XR系统中实现。
本公开提供用于以下的过程:在空间中的任何任意位置生成对于实时VR/AR/MR/XR系统足够准确和高效的HR滤波器。在一个实施例中,采用变化的方法,其中,利用B样条基函数对HR滤波器集合的空间变化进行建模,以及根据时域FIR滤波器或频域上的某种映射对滤波器进行参数化,其中,DFT是这样的一个映射。所产生的模型在MSE测量和感知评估方面是准确的。它在如下方面是高效的:基于该模型评估HR滤波器所需要的基函数的总数量和计算量远小于使用球谐函数或其他这样的复杂基函数的模型的量。
因此,在一个方面,提供了一种用于声音信号滤波的方法。所述方法包括:生成用于由仰角角度
Figure BDA0003598773510000061
和方位角角度
Figure BDA0003598773510000062
指定的特定位置的滤波器对,所述滤波器对由右滤波器
Figure BDA0003598773510000063
和左滤波器
Figure BDA0003598773510000064
构成。所述方法还包括:使用所述右滤波器对声音信号滤波以及使用所述左滤波器对所述声音信号滤波。生成所述滤波器对包括:i)在所述仰角角度处至少获得第一仰角基函数值集合;ii)在所述方位角角度处至少获得第一方位角基函数值集合;iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数;以及iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数。
在另一个方面,提供了一种用于声音信号滤波的滤波装置。所述滤波装置被适配为执行方法,所述方法包括:生成由仰角角度
Figure BDA0003598773510000065
和方位角角度
Figure BDA0003598773510000066
指定的特定位置的滤波器对,所述滤波器对由右滤波器
Figure BDA0003598773510000067
和左滤波器
Figure BDA0003598773510000068
构成。所述方法还包括:使用所述右滤波器对声音信号滤波以及使用所述左滤波器对所述声音信号滤波。生成所述滤波器对包括:i)在所述仰角角度处至少获得第一仰角基函数值集合;ii)在所述方位角角度处至少获得第一方位角基函数值集合;iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数;以及iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数。
所提出的过程的主要优点包括:a)比基于双线性PC的解更准确,b)比基于SH的解更高效,c)建立模型无需对HR滤波器数据库密集采样,以及d)相对于原始HR滤波器数据库,该模型在存储器中占用更少的空间。以上优点使所提出的实施例对实时VR/AR/MR/XR系统具有吸引力。
附图说明
被并入本文且形成说明书的部分的附图示出各种实施例。
图1示出了从由球坐标系中的仰角角度和方位角角度对指定的到达方向(DOA)朝着收听者传播的声波。
图2示出了朝着收听者传播的声波的ITD和频谱线索的示例。
图3示出了在2D球体上对网格进行采样的示例。
图4示出了根据实施例的HR滤波单元。
图5是示出HR滤波器建模的一个实施例的流程图。
图6是根据实施例的描述用于获得零时延HR滤波器和ITD的预处理的过程的流程图。
图7A示出了具有0度仰角和从0度到360度方位角的水平平面上的右耳HRTF(实线)和左耳HRTF(虚线)的延迟估计。
图7B示出了90度方位角处的对应的右耳HRTF(实线)和左耳HRTF(虚线)。
图8描绘了根据实施例的建模过程的框图。
图9示出了B样条基函数的示例。
图10示出了周期性基函数的示例。
图11示出了根据实施例的过程。
图12示出了周期性B样条基函数的示例。
图13A示出了B样条基函数的示例。
图13B示出了标准B样条基函数的示例。
图14A示出了B样条基函数的另一个示例。
图14B示出了没有在节点(knot-point)0/180度处的平滑条件的标准B样条基函数。
图15示出了根据一个实施例的HR滤波器数据集的模型表示。
图16是根据一个实施例的用于生成零时延HR滤波器对和对应ITD的系统的框图。
图17示出了根据一个实施例的用于在给定HR滤波器模型表示时在位置
Figure BDA0003598773510000081
生成零时延HR滤波器对的过程。
图18示出了根据一个实施例的用于在给定ITD模型表示时在位置
Figure BDA0003598773510000082
生成ITD的过程。
图19是示出根据实施例的过程的流程图。
图20是示出根据实施例的过程的流程图。
图21是根据一个实施例的HR滤波装置2100的框图。
具体实施方式
图4示出了根据实施例的HR滤波单元400。HR滤波单元400包括渲染单元402。单元400还包括:在由渲染单元402实时请求的任意仰角和方位角角度处分别生成HR滤波器以及ITD的HR滤波器生成器404以及ITD生成器406。这需要基于已经加载进单元400的HR滤波器模型高效地评估左右HR滤波器对。这还需要基于已经加载进该单元的ITD模型高效地评估ITD。这个HR滤波单元400因此将具有用于从这些模型的数据库410加载HR滤波器模型和ITD模型的接口408。HR滤波器模型的数据库通过估计不同的HR滤波器数据库的HR滤波器模型而离线地生成。
1、HR滤波器集合建模
如上所述,HR滤波器是包括ITD、ILD和频谱线索的角度相关的空间线索的数学表示。ITD被定义为声音信号到达两耳的时间上的差异,如图2所示。我们从HR滤波器中移除与频率不相关的时间延迟,并将其单独保留为每对HR滤波器的纯延迟。其余的零时延HR滤波器包含耳间相位差(IPD)、ILD和频谱线索。滤波器和ITD根据方位角和仰角分别建模。
使用大多数都是公开可用的现有HR滤波器数据库来执行变化的方法。这些数据库中的HR滤波器是基于在不同的空间采样网格上完成的声音测量结果估计的,并且通常将它们以不同的文件格式进行存储,其对于提供数据库的实验室自然是有利的。最近,针对具有一致定义的自描述数据开发了面向空间的声学格式(SOFA)的格式,其统一了不同的HR滤波器数据库的表示。因此,在一个实施例中,采用了SOFA格式,因此无需在建模之前用于交换数据格式所需的额外的努力。可以在www.sofaconventions.org/mediawiki/index.php处找到关于SOFA格式的更多信息。
图5描述了HR滤波器建模的一个实施例的流程图,其中,经由SOFA API加载SOFA格式的HR滤波器集合。在预处理单元中,如果未在原始数据库中提供与频率不相关的时延,则针对每个HR滤波器估计这些信息。然后将HR滤波器分成零时延HR滤波器和ITD。最后,在对单元进行建模时,将零时延HR滤波器和ITD分别建模为仰角角度和方位角角度的连续基函数的线性求和。
在前三个小节中更详细地描述了预处理、HR滤波器模型估计和ITD模型估计的步骤。在其之后给出了整个模型表示的描述。
1.1预处理
用于基于测量结果估计HR滤波器集合的基本过程包括以下步骤:
(1)经由放置在指定的仰角
Figure BDA0003598773510000091
方位角
Figure BDA0003598773510000092
以及离对象的头部固定距离处的扬声器发射已知信号;
(2)使用放置在对象的耳道中或其入口处的麦克风记录对象的左耳信号和右耳信号;
(3)对已记录的原始数据进行后处理,其主要用于移除测量系统的响应;以及
(4)将已知的扬声器信号用作输入信号以及将预处理的耳信号用作输出信号,基于预处理的数据来估计作为线性动态系统的冲激响应的HR滤波器。
在冲激响应开始(onset)之前通常存在与频率不相关的延迟。一些数据库(例如,CIPIC数据库)提供开始信息。然而,大多数数据库不提供这样的信息。如上文提及的,HR滤波器集合可以被建模为类似于最小相位的系统和纯延迟线的组合。在这个情况下需要延迟估计。给定延迟信息,通过从右耳HR滤波器的延迟减去左耳HR滤波器的延迟简单地计算ITD。其次,通过对HR滤波器加窗移除延迟并获得零时延HR滤波器。在图6中示出了描述用于获得零时延HR滤波器和ITD的预处理过程的流程图。
在HRIR的时间结构中,很容易观察到在开始(onset)出现之后表现出幅度的突然的增大。基于这个时间特征,用于估计延迟的一个方法是使用遵从冲激响应(IR)的能量包络的开始(onset)检测函数。这种开始检测函数可以被构造为
Figure BDA0003598773510000101
其中,{W(l):l=1,…,L}是L个样本长的加窗函数并且R是两个窗之间的以样本为单位的时间步长。为了不导致模糊,为了简单在此处省略了角度参数和耳的表示。可以将覆盖HRIR的总能量的90%的部分的长度选择为窗的长度L。当HRIR中存在强冲击瞬态时,以上解决方案产生了满意的结果。然而,不总是这个情况,因此通过使用累积能量与总能量之比
Figure BDA0003598773510000102
n=1,···N优化所述解决方案,其中,N是HRIR的长度。累积能量被定义为
Figure BDA0003598773510000103
其中,w(l)是n个点的窗。总能量是
Figure BDA0003598773510000104
另一种优化采用比的导数,并且找到当导数超过某个阈值时的第一个样本的索引作为开始(onset)的索引。以样本为单位的时延τTD可以写为
Figure BDA0003598773510000105
其中η是阈值。通常,相对于对侧HRTF,同侧HRTF的阈值较高。图7A和图7B示出使用普林斯顿HRTF数据集——对象ID 27(数据库的URL是www.princeton.edu/3D3A/HRTFMeasurements.html)估计的HRTF的延迟的示例。图7A中的曲线示出了具有0度仰角和从0度到360度方位角的水平平面上的右耳HRTF(实线)和左耳HRTF(虚线)的延迟估计。在数据提示中示出了HRTF在90度方位角处的延迟。在图7B中示出了在90度方位角处对应的右耳HRTF(实线)和左耳HRTF(虚线)。星号强调了已检测到的开始(onset)。
当给定延迟估计时,可以通过对原始HR滤波器加窗而获得零时延HR滤波器。已知对HR滤波器的频谱内容的最明显的位置相关的影响可以追踪到外耳或耳廓,其持续约0.3毫秒。“肩部弹跳”影响稍后出现。位置相关的IR的总长度通常不会超过1毫秒。因此,1毫秒矩形窗对于保留主要的与频谱有关的线索而言足够长。如果没有增加另外的位置相关的信息,则可以不需要更长的窗。
1.2 HR滤波器模型估计
右耳和左耳的HR滤波器被分别建模。在下文以两个可能的扩展形式(仰角扩展形式和方位角扩展形式)给出了长度N的HR滤波器
Figure BDA0003598773510000111
的一般时域截短(TD)FIR模型,其中针对仰角和方位角使用单独的基函数。
Figure BDA0003598773510000112
在仰角扩展形式下,存在针对仰角维度的单个基函数集合{Θp:p=1,…,P}和针对方位角维度的P个基函数集合,每个集合针对一个仰角索引p,{φp,q:q=1,…,Qp}。K<N是滤波器参数向量的N维向量空间的基向量的数量,并且ek是长度为N的标准正交基向量:
Figure BDA0003598773510000113
α={αp,q,k:p=1,…,P;q=1,…,Qp;k=1,…,K}是需要估计的模型参数集合。因为FIR模型被截短,K<N,所以HR滤波器模型值
Figure BDA0003598773510000114
等于0。
方位角扩展形式是仰角扩展形式的镜像形式,具有对应的镜像术语。从现在开始我们将示出仰角扩展形式的性质。这些性质对于方位角扩展形式在镜像意义上也成立并且本领域普通技术人员可以基于仰角扩展形式的这些性质推导出那些镜像性质。
仰角扩展形式非常灵活之处在于其支持针对每个仰角索引p的方位角基函数的各个集合。不是始终需要这种全面的灵活性,但是使用多于一个方位角基函数集合的确是好主意。在分别在收听者正上方和正下方的+/-90度的仰角角度处,在不同的方位角角度处的HR滤波器都一样。这可以通过对仰角索引p使用等于1的单个方位角基函数来处理,该仰角索引p具有对仰角+/-90度有贡献的基函数。其他仰角索引可以共享单个不同的方位角基函数集合,其中基函数的数量Q>1,或者共享经仔细选择的方位角基函数的几个集合,以捕获所建模的滤波器集合的仰角-方位角变化。
在下文我们将得出一般仰角扩展形式的性质。然而,本领域技术人员将清楚,当方位角基函数的不同集合的数量小于P时如何修改这些性质。
为了估计模型参数{αp,q,k},需要两个东西。
(1)需要指定最小化准则,其通常采用时域、频域或两者的组合上的建模误差的测量的形式,并且这个准则甚至可以包括:用于减少过拟合所建模的数据的趋势的正则化项。
(2)用于估计使最小化准则最小化的参数的优化方法。
图8描绘了给定与对应的仰角角度和方位角角度(即
Figure BDA0003598773510000121
)相关联的零时延HR滤波器集合
Figure BDA0003598773510000122
时的建模过程的框图。给定仰角和方位角的列表,分别构造仰角角度和方位角角度上的基函数。然后采用最小二乘方法来估计模型参数。
在小节1.2.1中更详细地描述了这个模型估计过程。
在这个阶段,模型规定是相当通用的,因为还没有规定基函数的两个集合
Figure BDA0003598773510000123
Figure BDA0003598773510000124
获得可以输出准确的建模并且高效地评估HR滤波器模型的关键在于基函数的这两个集合的选择。在使用不同类型的函数试验之后,我们选择将我们称为周期性B样条基函数的基函数用作方位角基函数以及将标准B样条函数用作仰角基函数。在小节1.2.2中更详细地说明已选择的这些基函数。
1.2.1模型参数估计
给定基函数集合
Figure BDA0003598773510000131
Figure BDA0003598773510000132
以及在M个不同的角度位置上采样的右耳或左耳的零时延HR滤波器集合
Figure BDA0003598773510000133
时域上典型的最小化准则是M个HR滤波器构成的集合(右耳或左耳)上的建模误差的范数之和:
Figure BDA0003598773510000134
其中,
Figure BDA0003598773510000135
并且
Figure BDA0003598773510000136
所估计的参数的数量是
Figure BDA0003598773510000137
其应该远少于可用数据样本的数量M*N,以避免不确定系统。
因为标准正交基向量ek是正交向量,所以参数αk={αp,q,k:p=1,…,P;q=1,…,Qp}可以针对每个样本k独立求解。对于每个样本k,最小化准则变为:
Figure BDA0003598773510000138
其可以用矩阵形式表示为:
Figure BDA0003598773510000141
其中,
Figure BDA0003598773510000142
J(αk)是线性最小二乘准则。通过标准方程的求解αk=(BTB)-1BThk获得使J(αk)最小化的解。然而,直接使以上成本函数最小化导致对线性系统的准确解。该解对数据
Figure BDA0003598773510000143
中的噪声敏感并且可以导致过拟合。然后应用Tikhonov正则化,并且最小化准则变为:
Figure BDA0003598773510000144
其中I是尺寸为
Figure BDA0003598773510000145
的单位矩阵并且0是具有
Figure BDA0003598773510000146
个元素的0列向量。
J(αk)也是线性最小二乘准则。类似地,通过对标准方程的求解
Figure BDA0003598773510000147
获得使
Figure BDA0003598773510000148
最小化的解,其中,可以将λ的值确定为使矩阵
Figure BDA0003598773510000149
的条件数小于10或导致良好模型准确度的其他某个值。
为了更好的数值准确度,借助于
Figure BDA00035987735100001410
的奇异值分解(SVD)对αk进行实际求解:
Figure BDA00035987735100001411
Figure BDA00035987735100001412
和U跨越同一子空间。
Figure BDA00035987735100001413
在正交矩阵U上的投影由
Figure BDA00035987735100001414
给定并且等于
Figure BDA00035987735100001415
这得到
Figure BDA00035987735100001416
随后得到解
Figure BDA00035987735100001417
这个估计非常高效,因为其仅需要维度较小的矩阵
Figure BDA00035987735100001418
的一个SVD,然后将其用于评估针对k=1,…,K的解,其可以并行地完成。利用B替换
Figure BDA00035987735100001419
并且利用hk替换
Figure BDA00035987735100001420
这对于J(αk)同样成立。
给定右耳HR滤波器测量结果
Figure BDA0003598773510000151
我们获得由
Figure BDA0003598773510000152
表示的模型参数集合,其中,每个αr是维度为
Figure BDA0003598773510000153
的列向量。类似地,给定左耳HR滤波器测量结果
Figure BDA0003598773510000154
我们获得由
Figure BDA0003598773510000155
表示的模型参数集合,其中,每个αl是维度为
Figure BDA0003598773510000156
的列向量。
在时域上指定了最小化准则J(α)和
Figure BDA0003598773510000157
通过如下方式很容易将它们映射到频域:使用DFT变换或类似处理(例如,耳间传递函数(ITF))将时域向量
Figure BDA0003598773510000158
Figure BDA0003598773510000159
映射成频域向量,并且备选准则可以很容易地使用时域成分和频域成分的组合。
将向量v的平方范数定义为向量与自身的内积||v||2=<v,v>。内积的一般形式是<v,v>=vTΓv,其中Γ可以是任意正定矩阵并且其最简单的形式Γ是单位矩阵。使用与单位矩阵不同的Γ提供用于对时域和频域中的不同成分有差别地进行加权的机制,这在一些成分在感知上比其他成分更重要时可能有用。本领域技术人员应该清楚如何利用最小化准则的规定上的这些可能的变化。
1.2.2仰角和方位角基函数的规定
如之前所说明的,在使用不同类型的基函数试验之后,我们选择将标准B样条函数用作仰角基函数以及将我们称为周期性B样条基函数的基函数用作方位角基函数。
变量
Figure BDA00035987735100001510
的J阶单变量B样条基函数集合(其中
Figure BDA00035987735100001511
位于区间
Figure BDA00035987735100001512
中)是该区间上定义的J-1次分段多项式函数集合。这些多项式函数的范围使用所谓的节点序列(knotsequence)θ=(θ1,…,θU)(其中θ1=θA,θU=θB)来指定,并且这些多项式函数的子区间是
Figure BDA00035987735100001513
u=1,…,U-1。在每个子区间中,每个基函数是J-1次多项式函数,将其写为:
Figure BDA00035987735100001514
对于
Figure BDA00035987735100001515
函数(其是B样条基函数的线性和)在节点处的平滑性使用所谓的多重序列m=(m1,…,mU)进行控制,其是大于0的整数的序列,其中,值mu=i表示在节点θu处的(J-i)阶导数是连续的。这表示i=1给出最大平滑性,而i=J仅给出0阶导数连续性。给定节点序列和多重序列,从0次多项式开始通过迭代获得多项式模型系数
Figure BDA00035987735100001516
Figure BDA0003598773510000161
可以在Carl de Boor的文章“BsplineBasics(B样条基础知识)”(ftp://ftp.cs.wisc.edu/Approx/bsplbasic.pdf)中找到这个过程的细节。
在图9中示出了使用节点序列θ=(-90,-60,-30,0,30,60,90)和多重序列m=(4,1,1,1,1,1,3)评估的针对3度的仰角角度的B样条基函数的示例。
Figure BDA0003598773510000162
度的方位角角度在空间上是与
Figure BDA0003598773510000163
(对于任意整数值κ)度的方位角角度相同的点的意义上方位角角度是周期性的(例如,循环的),并且为了在方位角维度上获得高效的建模,以同样方式使用周期性的基函数(即
Figure BDA0003598773510000164
)很重要。在图10中示出了这样的周期性的基函数的示例,其中,使用实线绘制了函数在从0到360的角度范围的部分并且使用虚线绘制了函数在该范围之外的部分。
我们已经设计了用于生成0到360度的方位角范围上的周期性B样条基函数集合的方法。在图11中示出了该方法,其包括以下步骤。
(步骤1)指定从0到360度范围上的节点序列。将该节点序列的长度表示为L。
(步骤2)使用小于0度的J个值和大于360度的J-1值以周期性方式扩展该节点序列。
(步骤3)使用该扩展的节点序列和该节点的扩展的多重序列来生成扩展的B样条基函数集合,使用标准方法生成B样条函数集合。
(步骤4)选择扩展的基函数中自索引2开始的L-1个连续的扩展的基函数,以及以周期性方式将它们映射到0到360度的方位角范围。
这个方法提供了0到360度范围上的L-1个周期性的基函数集合。
方位角角度上的每个基函数也是J-1次多项式函数,并且被写为:
Figure BDA0003598773510000165
图12中示出了使用长度为L=11的节点序列φ=(0,30,70,110,150,180,210,250,290,330,360)进行评估的针对3度的方位角角度的周期性B样条基函数的示例。
1.3 ITD模型估计
ITD模型的一般形式由下式给出:
Figure BDA0003598773510000171
Figure BDA0003598773510000172
Figure BDA0003598773510000173
是分别针对仰角角度和方位角角度的B样条基函数。
Figure BDA0003598773510000174
是模型参数集合。
1.3.1模型参数估计
通过使最小二乘准则最小化而获得模型参数{cp′,q′},
Figure BDA0003598773510000175
其中,
Figure BDA0003598773510000176
Figure BDA0003598773510000177
是针对
Figure BDA0003598773510000178
的ITD。
Figure BDA0003598773510000179
是由原始数据库提供的或使用小节1.1中描述的方法所估计的与频率不相关的时延。
应用Tikhonov正则化以避免过拟合,最小化准则变为:
Figure BDA00035987735100001710
其中,
Figure BDA00035987735100001711
是尺寸为
Figure BDA00035987735100001712
的单位矩阵并且0是具有
Figure BDA00035987735100001713
个元素的0列向量。
可以将
Figure BDA00035987735100001714
的值确定为使矩阵
Figure BDA00035987735100001715
的条件数小于10或导致良好模型准确度的其他某个值。如小节1.2.1中所述,借助于
Figure BDA00035987735100001716
时的SVD,通过c=V′S′-1U′Tτ获得模型参数,其是具有
Figure BDA00035987735100001717
个元素的列向量。
1.3.2.仰角和方位角基函数的规定
当仰角从-90度向上移动到90度时,ITD从零增大到在仰角0度处的最大值并且随后减小到零。基于此,很自然地使用在+/-90度仰角处为零的基函数。这个要求相当于在+/-90度仰角处的至少一个平滑条件。如在小节1.2.2中所说明的,函数在节点处的平滑由多重序列m控制。将每个基函数写为:
Figure BDA0003598773510000181
在图13A中示出了使用节点序列
Figure BDA0003598773510000182
和多重序列m=(3,1,1,1,2)评估的针对3度的仰角角度的B样条基函数的示例。
考虑到由于测量设置中的不对称以及对象而导致ITD在+/-90度仰角处可能不正好为零,所以使用标准B样条基函数而无需在节点+/-90度处的平滑条件仍然是好的选择。在图13B中示出了使用节点序列θ=(-90,-45,0,45,90)和多重序列m=(4,1,1,1,3)评估的针对3度的仰角角度的标准B样条基函数的示例。
当方位角沿着圆周移动时,ITD的改变呈类似正弦的形状,其中,零ITD出现在0/180/360度的方位角处并且最大ITD出现在90/270度的方位角处。类似地,在0/180/360度的方位角处可以满足一个平滑条件。此外,可以认为在180度与360度之间的方位角处的ITD是在0与180度之间的方位角处的ITD的镜像。因此,我们将基函数的一个集合用于两个区间[0,180]和[180,360]的方位角角度。将每个基函数写为:
Figure BDA0003598773510000183
在图14A中示出了最初使用节点序列
Figure BDA0003598773510000184
和多重序列m=(3,1,···,1,2)评估的针对3度的方位角角度的B样条基函数的示例。
考虑到ITD在0/180/360度的方位角处可能不正好是零,可以使用标准B样条基函数而无需在节点0/180度处的平滑条件。在图14B中示出了这样的基函数的示例。
1.4模型表示
图15示出了HR滤波器数据集的模型表示。所述表示包括:均包括基函数和模型参数的一个零时延HR滤波器模型表示和一个ITD模型表示。建模解决方案的建模准确度和计算效率的关键是仔细地构造用于对HR滤波器集合的角度变化进行建模的B样条基函数集合,其足够简单地给出了良好计算效率并且足够丰富地给出了良好建模准确度。
对于零延迟HR滤波器模型,存在:P个仰角B样条基函数;均包含Qp个函数的方位角B样条基函数的P个集合;以及均为
Figure BDA0003598773510000191
乘K的矩阵的模型参数的两个集合。对于ITD模型,存在:
Figure BDA0003598773510000192
个仰角B样条基函数;均包含
Figure BDA0003598773510000193
个函数的方位角B样条基函数的
Figure BDA0003598773510000194
个集合;以及作为具有
Figure BDA0003598773510000195
个元素的向量的模型参数的一个集合。
B样条基函数的每个集合由节点序列和作为三维数组的多项式模型系数γ表示。第一维度与B样条的阶相对应,第二维度与节点区间的数量相对应,并且第三维度与基函数的数量相对应。
P或
Figure BDA0003598773510000196
远小于原始HR滤波器数据集中的仰角角度的数量。Q或
Figure BDA0003598773510000197
远小于数据集中的方位角角度的数量。K也小于原始滤波器的频率仓的长度或数量。因此,该模型表示在表示HR滤波器数据集方面是高效的。
此外,因为角度基函数连续,所以模型表示可以用于在由仰角和方位角指定的任何任意的位置生成HR滤波器对。
2、HR滤波器生成
图16是用于在给定模型表示时生成零时延HR滤波器对(即右耳滤波器和左耳滤波器)和对应的ITD的系统的框图。所述模型表示可以写到二进制文件或文本文件中。经由API加载文件以获取模型结构。下面描述如何使用该模型表示在指定的位置获得HR滤波器对和ITD。
2.1生成零时延HR滤波器
图17示出了在给定HR滤波器模型表示时在位置
Figure BDA0003598773510000201
生成零时延HR滤波器对的过程。如1.2.2节中所说明的,仰角B样条基函数集合的模型{Θp:p=1,···,P}包括:节点序列θ=(θ1,…,θU),其指定子区间
Figure BDA0003598773510000202
所述函数是所述子区间上的多项式;以及指示模型参数的3维数组
Figure BDA0003598773510000203
Figure BDA0003598773510000204
涉及评估P个仰角基函数在仰角角度
Figure BDA0003598773510000205
处的值
Figure BDA0003598773510000206
的步骤如下:
(1)找到满足
Figure BDA0003598773510000207
的索引u;以及
(2)根据下式评估第p仰角B样条基函数在仰角角度
Figure BDA0003598773510000208
处的值:
Figure BDA0003598773510000209
将类似的过程用于评估方位角B样条基函数集合在给定方位角角度
Figure BDA00035987735100002010
处的值
Figure BDA00035987735100002011
一旦获得基函数值的这些集合,就根据下式获得在位置
Figure BDA00035987735100002012
处的右耳零时延HR滤波器:
Figure BDA00035987735100002013
基于此,根据下式获得对
Figure BDA00035987735100002014
的评估也是清楚的:
Figure BDA00035987735100002015
根据下式获得在位置
Figure BDA00035987735100002016
处的左耳零时延HR滤波器:
Figure BDA00035987735100002017
根据下式获得对
Figure BDA00035987735100002018
的评估:
Figure BDA0003598773510000211
2.2生成ITD
图18示出了根据一个实施例的用于在给定ITD模型表示时在位置
Figure BDA0003598773510000212
处生成ITD的过程。
在小节2.1中描述的过程之后,分别评估
Figure BDA0003598773510000213
个仰角基函数在仰角角度
Figure BDA0003598773510000214
处的值和方位角B样条基函数集合在给定方位角角度
Figure BDA0003598773510000215
处的值
Figure BDA0003598773510000216
一旦对仰角基函数和方位角基函数的值进行了评估,就根据下式获得ITD:
Figure BDA0003598773510000217
在小节5.1.1中所提及的,我们将HR滤波器集合建模为类似于最小相位的系统和纯延迟线的组合。右耳HR滤波器的延迟是:
Figure BDA0003598773510000218
左耳HR滤波器的延迟是:
Figure BDA0003598773510000219
要注意,
Figure BDA00035987735100002110
Figure BDA00035987735100002111
的计算应该与所使用的ITD的定义和坐标系一致。
图19是示出根据实施例的过程1900的流程图。过程1900可以从步骤s1902开始。
步骤s1902包括:生成用于由仰角角度
Figure BDA00035987735100002112
和方位角角度
Figure BDA00035987735100002113
指定的特定位置的滤波器对,所述滤波器对由右滤波器
Figure BDA00035987735100002114
和左滤波器
Figure BDA00035987735100002115
构成。
步骤s1904包括:使用右滤波器对声音信号滤波。
步骤s1906包括:使用左滤波器对声音信号滤波。
如图20所示,步骤s1902包括:i)在所述仰角角度处至少获得第一仰角基函数值集合(步骤s2002);ii)在所述方位角角度处至少获得第一方位角基函数值集合(步骤s2004);iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数(步骤s2006);以及iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数(步骤s2008)。
在一些实施例中,获得所述第一方位角基函数值集合包括:获得方位角基函数值的P个集合,其中,所述方位角基函数值的P个集合包括所述第一方位角基函数值集合
Figure BDA0003598773510000221
以及
Figure BDA0003598773510000222
Figure BDA0003598773510000223
其中,
Figure BDA0003598773510000224
(p=1至P、q=1至Qp、以及k=1至K)是左模型参数集合,
Figure BDA0003598773510000225
(p=1至P、q=1至Qp、以及k=1至K)是右模型参数集合,
Figure BDA0003598773510000226
(p=1至P)定义在仰角角度
Figure BDA0003598773510000227
处的第一仰角基函数值集合,并且
Figure BDA0003598773510000228
(p=1至P、以及q=1至Qp)定义在方位角角度
Figure BDA0003598773510000229
处的方位角基函数值的P个集合;并且ek(k=1至K)是长度为N的标准正交基向量集合。
在一些实施例中,获得所述第一仰角基函数值集合包括:获得仰角基函数值的Q个集合,其中,所述仰角基函数值的Q个集合包括第一仰角基函数值集合
Figure BDA00035987735100002210
以及
Figure BDA00035987735100002211
其中,
Figure BDA00035987735100002212
(p=1至Pq、q=1至Q、以及k=1至K)是左模型参数集合,
Figure BDA00035987735100002213
(p=1至Pq、q=1至Q、以及k=1至K)是右模型参数集合,
Figure BDA00035987735100002214
(q=1至Q、以及p=1至Pq)定义在仰角角度
Figure BDA00035987735100002215
处的所述仰角基函数值的Q个集合,并且
Figure BDA00035987735100002216
(q=1至Q)定义方位角角度
Figure BDA00035987735100002217
处的第一方位角基函数值集合;并且ek(k=1至K)是长度为N的标准正交基向量集合。
在一些实施例中,获得第一仰角基函数值集合包括:针对第一仰角基函数集合中包括的每个仰角基函数,在所述仰角角度处评估该仰角基函数,以产生与所述仰角角度和该仰角基函数相对应的仰角基函数值,并且获得所述第一方位角基函数值集合包括:针对第一方位角基函数集合中包括的每个方位角基函数,在所述方位角角度处评估该方位角基函数,以产生与所述方位角角度和该方位角基函数相对应的方位角基函数值。
在一些实施例中,所述第一仰角基函数集合中包括的每个仰角基函数是B样条基函数,并且所述第一方位角基函数集合中包括的每个方位角基函数是周期性B样条基函数。
在一些实施例中,所述过程还包括:获得至少表示所述第一仰角基函数集合的模型,其中,所述模型包括:序列(θ),其中θ=(θ1,…,θU),其指定子区间
Figure BDA0003598773510000231
所述仰角基函数是所述子区间上的多项式;以及模型参数的三维数组
Figure BDA0003598773510000232
Figure BDA0003598773510000233
在一些实施例中,所述第一仰角基函数集合包括第p仰角基函数,在所述仰角角度处评估所述第一仰角基函数集合中包括的每个仰角基函数
Figure BDA0003598773510000234
包括:在所述仰角角度
Figure BDA0003598773510000235
处评估第p仰角基函数,并且在所述仰角角度
Figure BDA0003598773510000236
评估第p仰角基函数包括以下步骤:找到满足
Figure BDA0003598773510000237
的索引u;以及根据
Figure BDA0003598773510000238
评估所述第p仰角基函数在仰角角度
Figure BDA0003598773510000239
处的值。
在一些实施例中,所述过程还包括:获得至少表示所述第一方位角基函数集合的模型,其中,所述模型包括:序列(φ1),其中
Figure BDA00035987735100002310
其指定子区间
Figure BDA00035987735100002311
Figure BDA00035987735100002312
所述方位角基函数是所述子区间上的多项式;以及模型参数的三维数组
Figure BDA00035987735100002313
在一些实施例中,所述第一方位角基函数集合包括第q方位角基函数,在方位角角度
Figure BDA00035987735100002314
处评估所述第一方位角基函数集合中包括的每个方位角基函数包括:在方位角角度
Figure BDA00035987735100002315
处评估所述第q方位角基函数,并且在方位角角度
Figure BDA00035987735100002316
处评估所述第q方位角基函数包括以下步骤:找到满足
Figure BDA00035987735100002317
的索引l;以及根据
Figure BDA00035987735100002318
评估所述第q方位角基函数在该方位角角度
Figure BDA00035987735100002319
处的值。
在一些实施例中,所述过程还包括:至少生成第一方位角基函数集合,其中,生成所述第一方位角基函数集合包括:生成0到360度方位角范围上的周期性B样条基函数集合。在一些实施例中,生成所述0到360度方位角范围上的周期性B样条基函数集合包括:指定0到360度范围上长度为L的节点序列;基于长度为L的节点序列生成扩展的节点序列,其中,生成所述扩展的节点序列包括:使用小于0度的J个值和大于360度的J-1个值以周期性方式扩展长度为L的节点序列;获得节点的扩展的多重序列;使用所述扩展的节点序列和所述扩展的多重序列生成扩展的B样条基函数集合;选择扩展的基函数中自索引2开始的L-1个连续的扩展基函数;以及,以周期性方式将已选择的扩展基函数映射到0到360度的方位角范围。
在一些实施例中,所述过程还包括:针对仰角-方位角角度
Figure BDA0003598773510000241
确定耳间时差
Figure BDA0003598773510000242
在一些实施例中,所述过程还包括:基于
Figure BDA0003598773510000243
确定右延迟
Figure BDA0003598773510000244
以及基于
Figure BDA0003598773510000245
确定左延迟
Figure BDA0003598773510000246
在一些实施例中,使用所述右滤波器对所述声音信号滤波包括:使用所述右滤波器和右延迟
Figure BDA0003598773510000247
对所述声音信号滤波;使用所述左滤波器对所述声音信号滤波包括:使用所述左滤波器和所述左延迟
Figure BDA0003598773510000248
对所述声音信号滤波。在一些实施例中,使用所述右滤波器和
Figure BDA0003598773510000249
对所述声音信号滤波包括计算
Figure BDA00035987735100002410
使用所述左滤波器和
Figure BDA00035987735100002411
对所述声音信号滤波包括计算
Figure BDA00035987735100002412
其中u(n)是声音信号。
在一些实施例中,
Figure BDA00035987735100002413
并且
Figure BDA00035987735100002414
图21是根据一些实施例的用于实现HR滤波单元400的HR滤波装置2100的框图。即,装置2100可操作地执行本文公开的过程。如图21所示,装置2100可以包括:处理电路(PC)2102,其可以包括一个或多个处理器(P)2155,例如通用微处理器和/或一个或多个其他处理器,例如专用集成电路(ASIC)、现场可编程门阵列(FPGA)等,所述处理器可以共同位于单个壳体中或单个数据中心中,或者可以在地理上是分散的(即装置2100可以是分布式计算装置);网络接口2148,包括用于实现装置2100向连接到网络110(例如,互联网协议(IP)网络)的其他节点发送数据以及从其接收数据的发送器(Tx)2145和接收器(Rx)2147,其中网络接口2148被(直接或间接)连接到该网络110(例如,网络接口2148可以无线方式连接到网络110,在这个情况下网络接口2148被连接到天线布置);以及本地存储单元(也称为“数据存储系统”)2108,其可以包括一个或多个非易失性存储设备和/或一个或多个易失性存储设备。在PC 2102包括可编程处理器的实施例中,可以提供计算机程序产品(CPP)2141。CPP2141包括计算机可读介质(CRM)2142,计算机可读介质(CRM)2142存储计算机程序(CP)2143,计算机程序(CP)2143包括计算机可读指令(CRI)2144。CRM 2142可以是非暂时性计算机可读介质(例如,磁介质(例如硬盘)、光介质、存储器设备(例如随机存取存储器、闪存)等)。在一些实施例中,计算机程序2143的CRI 2144被配置为使得:当由PC 2102执行时,CRI导致装置2100执行本文描述的步骤(例如,参考流程图在本文描述的步骤)。在其他实施例中,装置2100可被配置为在不需要代码的情况下执行本文描述的步骤。也即是说,例如,PC2102可以仅由一个或多个ASIC构成。因此,本文描述的实施例的特征可以在硬件和/或软件中实现。
下面是本文描述的各种实施例的总结:
A1、一种用于声音信号滤波的方法,所述方法包括:生成用于由仰角角度
Figure BDA0003598773510000251
和方位角角度
Figure BDA0003598773510000252
指定的特定位置的滤波器对,所述滤波器对由右滤波器
Figure BDA0003598773510000253
和左滤波器
Figure BDA0003598773510000254
构成;使用所述右滤波器对声音信号滤波;以及使用所述左滤波器对所述声音信号滤波,其中,生成所述滤波器对包括:i)在所述仰角角度处至少获得第一仰角基函数值集合;ii)在所述方位角角度处至少获得第一方位角基函数值集合;iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数;以及iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数。
A2、根据权利要求A1所述的方法,其中,获得所述第一方位角基函数值集合包括:获得方位角基函数值的P个集合,其中所述方位角基函数值的P个集合包括所述第一方位角基函数值集合。
A3、根据权利要求A1所述的方法,其中,生成所述右滤波器包括计算
Figure BDA0003598773510000261
并且生成所述左滤波器包括计算
Figure BDA0003598773510000262
其中,
Figure BDA0003598773510000263
(p=1至P、q=1至Qp、以及k=1至K)是右模型参数集合,
Figure BDA0003598773510000264
(p=1至P、q=1至Qp、以及k=1至K)是左模型参数集合,
Figure BDA0003598773510000265
(p=1至P)定义在仰角角度
Figure BDA0003598773510000266
处的所述第一仰角基函数值集合,并且
Figure BDA0003598773510000267
(p=1至P、以及q=1至Qp)定义在所述方位角角度
Figure BDA0003598773510000268
处的方位角基函数值的P个集合,并且ek(k=1至K)是长度为N的标准正交基向量集合。
A4、根据权利要求A1所述的方法,其中,获得所述第一仰角基函数值集合包括:获得仰角基函数值的Q个集合,其中所述仰角基函数值的Q个集合包括所述第一仰角基函数值集合。
A5、根据权利要求A1所述的方法,其中,生成所述右滤波器包括计算
Figure BDA0003598773510000269
并且生成所述左滤波器包括计算
Figure BDA00035987735100002610
其中,
Figure BDA00035987735100002611
(p=1至Pq、q=1至Q、以及k=1至K)是右模型参数集合,
Figure BDA00035987735100002612
(p=1至Pq、q=1至Q、以及k=1至K)是左模型参数集合,
Figure BDA00035987735100002613
(q=1至Q、以及p=1至Pq)定义在仰角角度
Figure BDA00035987735100002614
处的仰角基函数值的Q个集合,并且
Figure BDA00035987735100002615
(q=1至Q)定义在方位角角度
Figure BDA00035987735100002616
处的所述第一方位角基函数值集合,并且ek(k=1至K)是长度为N的标准正交基向量集合。
A6、根据权利要求A1至A5中任一项所述的方法,其中,每个所述仰角基函数值取决于所述方位角角度,和/或每个所述方位角基函数值取决于所述仰角角度。
A7、根据权利要求A1至A5中任一项所述的方法,其中,获得所述第一仰角基函数值集合包括:针对第一仰角基函数集合中包括的每个仰角基函数,在所述仰角角度处评估该仰角基函数,以产生与所述仰角角度和该仰角基函数相对应的仰角基函数值,并且获得所述第一方位角基函数值集合包括:针对第一方位角基函数集合中包括的每个方位角基函数,在所述方位角角度处评估该方位角基函数,以产生与所述方位角角度和该方位角基函数相对应的方位角基函数值。
A8、根据权利要求A7所述的方法,其中,所述第一仰角基函数集合中包括的每个仰角基函数是B样条基函数,并且所述第一方位角基函数集合中包括的每个方位角基函数是周期性B样条基函数。
A9、根据权利要求A7或A8所述的方法,还包括:获得至少表示所述第一仰角基函数集合的模型,其中,所述模型包括:序列(θ),其中θ=(θ1,…,θU),其指定子区间
Figure BDA0003598773510000271
所述仰角基函数是所述子区间上的多项式;以及模型参数的三维数组
Figure BDA0003598773510000272
A10、根据权利要求A9所述的方法,其中,所述第一仰角基函数集合包括第P仰角基函数,在所述仰角角度
Figure BDA0003598773510000273
处评估所述第一仰角基函数集合中包括的每个仰角基函数包括:在所述仰角角度
Figure BDA0003598773510000274
处评估所述第p仰角基函数,并且在所述仰角角度
Figure BDA0003598773510000275
处评估所述第p仰角基函数包括以下步骤:找到满足
Figure BDA0003598773510000276
的索引u;以及根据
Figure BDA0003598773510000277
评估所述第p仰角基函数在该仰角角度
Figure BDA0003598773510000278
处的值。
A11、根据权利要求A7或A8所述的方法,还包括:获得至少表示所述第一方位角基函数集合的模型,其中,所述模型包括:序列(φ1),其中
Figure BDA0003598773510000279
其指定子区间
Figure BDA00035987735100002710
Figure BDA00035987735100002711
所述方位角基函数是所述子区间上的多项式;以及模型参数的三维数组
Figure BDA00035987735100002712
A12、根据权利要求A11所述的方法,其中,所述第一方位角基函数集合包括第q方位角基函数,在所述方位角角度
Figure BDA00035987735100002814
处评估所述第一方位角基函数集合中包括的每个方位角基函数包括:在所述方位角角度
Figure BDA00035987735100002813
处评估所述第q方位角基函数,并且在所述方位角角度
Figure BDA0003598773510000281
处评估所述第q方位角基函数包括以下步骤:找到满足
Figure BDA0003598773510000282
的索引l;以及根据
Figure BDA0003598773510000283
评估所述第q方位角基函数在所述方位角角度
Figure BDA0003598773510000284
处的值。
A13、根据权利要求A7至A12中任一项所述的方法,其中获得所述第一方位角基函数值集合的步骤还包括生成所述第一方位角基函数集合。
A14、根据权利要求A13所述的方法,其中,生成所述第一方位角基函数集合包括:生成0到360度方位角范围上的周期性B样条基函数集合。
A15、根据权利要求A14所述的方法,其中,生成所述0到360度方位角范围上的周期性B样条基函数集合包括:指定0到360度范围上长度为L的节点序列;基于长度为L的节点序列生成扩展的节点序列,其中,生成所述扩展的节点序列包括:使用小于0度的J个值和大于360度的J-1个值以周期性方式扩展长度为L的节点序列;获得节点的扩展的多重序列;使用所述扩展的节点序列和所述扩展的多重序列生成扩展的B样条基函数集合;选择扩展的基函数中自索引2开始的L-1个连续的扩展的基函数;以及以周期性方式将已选择的扩展的基函数映射到0到360度的方位角范围。
A16、根据权利要求A1至A15中任一项所述的方法,还包括:针对仰角-方位角角度
Figure BDA0003598773510000285
确定耳间时差
Figure BDA0003598773510000286
A17、根据权利要求A16所述的方法,还包括:基于
Figure BDA0003598773510000287
确定右延迟
Figure BDA0003598773510000288
以及基于
Figure BDA0003598773510000289
确定左延迟
Figure BDA00035987735100002810
A18、根据权利要求A17所述的方法,其中使用所述右滤波器对所述声音信号滤波包括:使用所述右滤波器和右延迟
Figure BDA00035987735100002811
对所述声音信号滤波;并且使用所述左滤波器对所述声音信号滤波包括:使用所述左滤波器和所述左延迟
Figure BDA00035987735100002812
对所述声音信号滤波。
A19、根据权利要求A18所述的方法,其中,使用所述右滤波器和
Figure BDA0003598773510000291
对所述声音信号滤波包括计算
Figure BDA0003598773510000292
使用所述左滤波器和
Figure BDA0003598773510000293
对所述声音信号滤波包括计算
Figure BDA0003598773510000294
Figure BDA0003598773510000295
其中,u(n)是声音信号。
A20、根据权利要求A17至A19中任一项所述的方法,其中,
Figure BDA0003598773510000296
并且
Figure BDA0003598773510000297
A21、根据权利要求A7至A15中任一项所述的方法,其中,所述方位角基函数具有以360度为周期的周期性。
虽然本文(包括存在的任意附录)描述了各种实施例,但应该理解,它们仅通过示例方式提出而非限制。因此,本公开的宽度和范围不应该由上述示例性实施例中的任何示例性实施例所限制。此外,按照上述要素的所有可能的变化的其任意组合被本公开包括,除非在本文另外指示或在上下文中另外明显矛盾。
此外,虽然上文所述和在附图中示出的过程被示出为一系列步骤,但这样做仅为了说明。因此,要考虑的是,可以增加一些步骤、可以省略一些步骤、可以重新安排步骤的顺序、并且可以并行地执行一些步骤。
缩写词:
AR 增强现实
DOA 到达方向
FIR 有限冲激响应
HR 头部相关的
HRIR 头部相关的冲激响应
HRTF 头部相关的传递函数
ILD 耳间强度差
IPD 耳间相位差
ITD 耳间时间差
ITF 耳间传递函数
MAA 最小可听角度
MPEG 活动图像专家组
MR 混合现实
MSE 均方误差
PCA 主成分分析
SAOC 空间声音对象编码
SH 球谐函数
SOFA 面向空间的声学格式
SVD 奇异值分解
VR 虚拟现实
XR 扩展现实
参考文献:
[1]Doris J.Kistler,Frederic L.Wightman,“A model of head-relatedtransfer functions based on principal components analysis and minimum-phasereconstruction(基于主成分分析和最小相位重构的头部相关传递函数的模型)”,Journalof Acoustical Society of America(美国声学学会学报),91(3):1637-1647,1992年3月。
[2]Fábio P.Freeland,Luiz W.P.Biscainho以及Paulo S.R.Diniz,"Interpolation of Head-Related Transfer Functions(HRTFS):A multi-sourceapproach(头部相关的传递函数(HRTFS)的插值:多源法)",in 12th European SignalProcessing Conference(第12次欧洲信号处理会议),第1761-1764页,维也纳,2004年9月。
[3]Mengqiu Zhang,Rodney A.Kennedy以及Thushara D.Abhayapala,"Empiricaldetermination of frequency representation in spherical harmonics-based HRTFfunctional modeling(基于球谐函数的HRTF函数建模中的频率表示的经验确定)",IEEE/ACM Transactions on Audio,Speech,和Language Processing(IEEE/ACM声音、语音及语言处理学报),第23(2)卷,第351-360页,2015年2月。
[4]Zamir Ben-Hur,David Lou Alon,Boaz Rafaely以及Ravish Mehra,"Loudness stability of binaural sound with spherical harmonic representationof sparse head-related transfer functions(使用稀疏头部相关传递函数的球谐函数表示的双耳声音的响度稳定性)",EURASIP Journal on Audio,Speech,and MusicProcessing(EURASIP声音、语音及音乐处理期刊)2019,2019年5月。

Claims (26)

1.一种用于声音信号滤波的方法(1900),所述方法包括:
生成(s1902)用于由仰角角度
Figure FDA0003598773500000011
和方位角角度
Figure FDA0003598773500000012
指定的特定位置的滤波器对,所述滤波器对由右滤波器
Figure FDA0003598773500000013
和左滤波器
Figure FDA0003598773500000014
构成;
使用所述右滤波器对声音信号滤波(s1904);以及
使用所述左滤波器对所述声音信号滤波(s1906),其中,
生成所述滤波器对包括:
i)在所述仰角角度处至少获得第一仰角基函数值集合;
ii)在所述方位角角度处至少获得第一方位角基函数值集合;
iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数;以及
iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数。
2.根据权利要求1所述的方法,其中,
获得所述第一方位角基函数值集合包括:获得方位角基函数值的P个集合,其中所述方位角基函数值的P个集合包括所述第一方位角基函数值集合。
3.根据权利要求1所述的方法,其中,
生成所述右滤波器包括以下计算:
Figure FDA0003598773500000015
以及
生成所述左滤波器包括以下计算:
Figure FDA0003598773500000016
其中
Figure FDA0003598773500000017
(p=1至P、q=1至Qp、以及k=1至K)是右模型参数集合,
Figure FDA0003598773500000018
(p=1至P、q=1至Qp、以及k=1至K)是左模型参数集合,
Figure FDA0003598773500000021
(p=1至P)定义在所述仰角角度
Figure FDA00035987735000000211
处的所述第一仰角基函数值集合,并且
Figure FDA0003598773500000022
(p=1至P、以及q=1至Qp)定义在所述方位角角度
Figure FDA0003598773500000023
处的所述方位角基函数值的P个集合,并且
ek(k=1至K)是长度为N的标准正交基向量集合。
4.根据权利要求1所述的方法,其中,
获得所述第一仰角基函数值集合包括:获得仰角基函数值的Q个集合,其中,所述仰角基函数值的Q个集合包括所述第一仰角基函数值集合。
5.根据权利要求1所述的方法,其中,
生成所述右滤波器包括以下计算:
Figure FDA0003598773500000024
以及
生成所述左滤波器包括以下计算:
Figure FDA0003598773500000025
其中
Figure FDA0003598773500000026
(p=1至Pq、q=1至Q、以及k=1至K)是右模型参数集合,
Figure FDA0003598773500000027
(p=1至Pq、q=1至Q、以及k=1至K)是左模型参数集合,
Figure FDA00035987735000000210
(q=1至Q、以及p=1至Pq)定义在所述仰角角度
Figure FDA00035987735000000212
处的所述仰角基函数值的Q个集合,并且
Figure FDA0003598773500000028
(q=1至Q)定义在所述方位角角度
Figure FDA0003598773500000029
处的所述第一方位角基函数值集合,并且
ek(k=1至K)是长度为N的标准正交基向量集合。
6.根据权利要求1至5中任一项所述的方法,其中,
每个所述仰角基函数值取决于所述方位角角度,和/或
每个所述方位角基函数值取决于所述仰角角度。
7.根据权利要求1至5中任一项所述的方法,其中,
获得所述第一仰角基函数值集合包括:针对第一仰角基函数集合中包括的每个仰角基函数,在所述仰角角度处评估该仰角基函数,以产生与所述仰角角度和该仰角基函数相对应的仰角基函数值,并且
获得所述第一方位角基函数值集合包括:针对第一方位角基函数集合中包括的每个方位角基函数,在所述方位角角度处评估该方位角基函数,以产生与所述方位角角度和该方位角基函数相对应的方位角基函数值。
8.根据权利要求7所述的方法,其中,
所述第一仰角基函数集合中包括的每个仰角基函数是B样条基函数,并且
所述第一方位角基函数集合中包括的每个方位角基函数是周期性B样条基函数。
9.根据权利要求7或8所述的方法,还包括:获得至少表示所述第一仰角基函数集合的模型,其中,所述模型包括:
序列(θ),其中,θ=(θ1,…,θU)指定子区间
Figure FDA0003598773500000031
Figure FDA0003598773500000032
所述仰角基函数是所述子区间上的多项式,以及
模型参数的三维数组
Figure FDA0003598773500000033
Figure FDA0003598773500000034
10.根据权利要求9所述的方法,其中,
所述第一仰角基函数集合包括第p仰角基函数,
在所述仰角角度
Figure FDA0003598773500000035
处评估所述第一仰角基函数集合中包括的每个仰角基函数包括:在所述仰角角度
Figure FDA0003598773500000036
处评估所述第p仰角基函数,并且
在所述仰角角度
Figure FDA0003598773500000037
处评估所述第p仰角基函数包括以下步骤:
找到满足
Figure FDA0003598773500000038
的索引u;以及
根据
Figure FDA0003598773500000039
评估所述第p仰角基函数在该仰角角度
Figure FDA00035987735000000310
处的值。
11.根据权利要求7或8所述的方法,还包括:获得至少表示所述第一方位角基函数集合的模型,其中,所述模型包括:
序列(φ1),其中,
Figure FDA00035987735000000315
指定子区间
Figure FDA00035987735000000311
Figure FDA00035987735000000312
所述方位角基函数是所述子区间上的多项式,以及
模型参数的三维数组
Figure FDA00035987735000000313
Figure FDA00035987735000000314
12.根据权利要求11所述的方法,其中,
所述第一方位角基函数集合包括第q方位角基函数,
在所述方位角角度
Figure FDA0003598773500000041
处评估所述第一方位角基函数集合中包括的每个方位角基函数包括:在所述方位角角度
Figure FDA0003598773500000042
处评估所述第q方位角基函数,并且
在所述方位角角度
Figure FDA0003598773500000043
处评估所述第q方位角基函数包括以下步骤:
找到满足
Figure FDA0003598773500000044
的索引l;以及
根据
Figure FDA0003598773500000045
评估所述第q方位角基函数在所述方位角角度处
Figure FDA0003598773500000046
的值。
13.根据权利要求7至12中任一项所述的方法,
其中,获得所述第一方位角基函数值集合的步骤还包括生成所述第一方位角基函数集合。
14.根据权利要求13所述的方法,其中,生成所述第一方位角基函数集合包括:生成0到360度方位角范围上的周期性B样条基函数集合。
15.根据权利要求14所述的方法,其中,生成0到360度方位角范围上的周期性B样条基函数集合包括:
指定0到360度范围上的长度为L的节点序列;
基于所述长度为L的节点序列生成扩展的节点序列,其中,生成所述扩展的节点序列包括:使用小于0度的J个值和大于360度的J-1个值以周期性方式扩展所述长度为L的节点序列;
获得节点的扩展的多重序列;
使用所述扩展的节点序列和所述扩展的多重序列生成扩展的B样条基函数集合;
选择扩展的基函数中自索引2开始的L-1个连续的扩展的基函数;以及
以周期性方式将已选择的扩展的基函数映射到0到360度方位角范围。
16.根据权利要求1至15中任一项所述的方法,还包括:针对仰角-方位角角度
Figure FDA0003598773500000047
确定耳间时差
Figure FDA0003598773500000048
17.根据权利要求16所述的方法,还包括:
基于
Figure FDA0003598773500000051
确定右延迟
Figure FDA0003598773500000052
以及
基于
Figure FDA0003598773500000053
确定左延迟
Figure FDA0003598773500000054
18.根据权利要求17所述的方法,其中,
使用所述右滤波器对所述声音信号滤波包括:使用所述右滤波器和所述右延迟
Figure FDA0003598773500000055
对所述声音信号滤波;并且
使用所述左滤波器对所述声音信号滤波包括:使用所述左滤波器和所述左延迟
Figure FDA0003598773500000056
对所述声音信号滤波。
19.根据权利要求18所述的方法,其中,
使用所述右滤波器和
Figure FDA0003598773500000057
对所述声音信号滤波包括计算
Figure FDA0003598773500000058
使用所述左滤波器和
Figure FDA0003598773500000059
对所述声音信号滤波包括计算
Figure FDA00035987735000000510
其中,
u(n)是所述声音信号。
20.根据权利要求17至19中任一项所述的方法,其中,
Figure FDA00035987735000000511
并且
Figure FDA00035987735000000512
21.根据权利要求7至15中任一项所述的方法,其中,所述方位角基函数具有以360度为周期的周期性。
22.一种包括指令(2144)的计算机程序(2143),当所述指令由滤波装置(2100)的处理电路(2102)执行时,使所述滤波装置(2100)执行根据权利要求1至21中任一项所述的方法。
23.一种包含根据权利要求22所述的计算机程序在内的载体,其中,所述载体是电信号、光信号、无线电信号和计算机可读存储介质(2142)之一。
24.一种用于声音信号滤波的滤波装置(2100),所述滤波装置(2100)被适配为执行包括以下的方法:
生成用于由仰角角度
Figure FDA00035987735000000513
和方位角角度
Figure FDA00035987735000000514
指定的特定位置的滤波器对,所述滤波器对由右滤波器
Figure FDA0003598773500000061
和左滤波器
Figure FDA0003598773500000062
构成;
使用所述右滤波器对声音信号滤波;以及
使用所述左滤波器对所述声音信号滤波,其中,
生成所述滤波器对包括:
i)在所述仰角角度处至少获得第一仰角基函数值集合;
ii)在所述方位角角度处至少获得第一方位角基函数值集合;
iii)使用以下生成所述右滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)右滤波器模型参数;以及
iv)使用以下生成所述左滤波器:a)至少所述第一仰角基函数值集合,b)至少所述第一方位角基函数值集合,以及c)左滤波器模型参数。
25.根据权利要求15所述的装置,还被配置为执行根据权利要求2至21中任一项所述的方法。
26.一种用于声音信号滤波的滤波装置(2100),所述滤波装置(2100)包括:
处理电路(2102);以及
存储器(2142),所述存储器包含能够由所述处理电路执行的指令(2144),所述滤波装置据此可操作地执行根据权利要求1至21中任一项所述的方法。
CN202080072479.3A 2019-10-16 2020-10-15 对头部相关冲激响应进行建模 Pending CN114556971A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962915992P 2019-10-16 2019-10-16
US62/915,992 2019-10-16
PCT/EP2020/079042 WO2021074294A1 (en) 2019-10-16 2020-10-15 Modeling of the head-related impulse responses

Publications (1)

Publication Number Publication Date
CN114556971A true CN114556971A (zh) 2022-05-27

Family

ID=73037929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080072479.3A Pending CN114556971A (zh) 2019-10-16 2020-10-15 对头部相关冲激响应进行建模

Country Status (4)

Country Link
US (2) US20230336936A1 (zh)
EP (1) EP4046398A1 (zh)
CN (1) CN114556971A (zh)
WO (1) WO2021074294A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115868179A (zh) 2020-07-07 2023-03-28 瑞典爱立信有限公司 高效的头部相关滤波器生成
WO2024104593A1 (en) 2022-11-18 2024-05-23 Telefonaktiebolaget Lm Ericsson (Publ) Detecting outliers in a head-related filter set

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100606734B1 (ko) * 2005-02-04 2006-08-01 엘지전자 주식회사 삼차원 입체음향 구현 방법 및 그 장치
CN102577441B (zh) * 2009-10-12 2015-06-03 诺基亚公司 用于音频处理的多路分析
KR101651419B1 (ko) * 2012-03-23 2016-08-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 머리 전달 함수들의 선형 믹싱에 의한 머리 전달 함수 생성을 위한 방법 및 시스템
EP3989605A4 (en) * 2019-06-21 2022-08-17 Sony Group Corporation SIGNAL PROCESSING DEVICE AND METHOD AND PROGRAM

Also Published As

Publication number Publication date
WO2021074294A1 (en) 2021-04-22
US20210358507A1 (en) 2021-11-18
EP4046398A1 (en) 2022-08-24
US20230336936A1 (en) 2023-10-19

Similar Documents

Publication Publication Date Title
Cuevas-Rodríguez et al. 3D Tune-In Toolkit: An open-source library for real-time binaural spatialisation
US10129681B2 (en) Calibrating listening devices
US10334357B2 (en) Machine learning based sound field analysis
Lehmann et al. Diffuse reverberation model for efficient image-source simulation of room impulse responses
TWI558228B (zh) 依據空間能量密度定位麥克風之設備及方法
US7590248B1 (en) Head related transfer function filter generation
WO2014189550A1 (en) Statistical modelling, interpolation, measurement and anthropometry based prediction of head-related transfer functions
US11668600B2 (en) Device and method for adaptation of virtual 3D audio to a real room
Richter et al. On the influence of continuous subject rotation during high-resolution head-related transfer function measurements
US20210358507A1 (en) Data sequence generation
Saarelma et al. Audibility of dispersion error in room acoustic finite-difference time-domain simulation as a function of simulation distance
KR101882423B1 (ko) 적어도 제1 쌍의 룸 임펄스 응답에 기초하여, 믹싱 시간 전체를 추정하는 장치 및 방법, 대응하는 컴퓨터 프로그램
US20240196151A1 (en) Error correction of head-related filters
Koyama Boundary integral approach to sound field transform and reproduction
Hammond et al. Robust full-sphere binaural sound source localization
WO2023036795A1 (en) Efficient modeling of filters
US20230254661A1 (en) Head-related (hr) filters
US20230336938A1 (en) Efficient head-related filter generation
Skarha Performance Tradeoffs in HRTF Interpolation Algorithms for Object-Based Binaural Audio
Iida et al. Acoustic VR System
Geldert Impulse Response Interpolation via Optimal Transport
Löytynoja et al. A real-time talker localization implementation using MULTI-PHAT and particle filter
Sinker Efficient and compact representations of head related transfer functions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination