CN102939771A - 用于依照形态参数在数据库中选择感知最优的hrtf滤波器的方法 - Google Patents

用于依照形态参数在数据库中选择感知最优的hrtf滤波器的方法 Download PDF

Info

Publication number
CN102939771A
CN102939771A CN2011800288066A CN201180028806A CN102939771A CN 102939771 A CN102939771 A CN 102939771A CN 2011800288066 A CN2011800288066 A CN 2011800288066A CN 201180028806 A CN201180028806 A CN 201180028806A CN 102939771 A CN102939771 A CN 102939771A
Authority
CN
China
Prior art keywords
database
hrtf
space
morphological parameters
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800288066A
Other languages
English (en)
Other versions
CN102939771B (zh
Inventor
布莱恩·Fg·卡茨
大卫·舍恩斯坦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Arkamys SA
Original Assignee
Centre National de la Recherche Scientifique CNRS
Arkamys SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Arkamys SA filed Critical Centre National de la Recherche Scientifique CNRS
Publication of CN102939771A publication Critical patent/CN102939771A/zh
Application granted granted Critical
Publication of CN102939771B publication Critical patent/CN102939771B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stereophonic System (AREA)

Abstract

本发明涉及一种用于依照形态参数在数据库中选择感知最优的HRTF的方法。所述方法使用:第一数据库,其包括多个受试者M的HRTF;第二数据库,其包括受试者的形态参数;以及第三数据库,其与HRTF的感知分类相应。依照本发明,通过将第二数据库和第三数据库相关拣选N个最有关的形态参数。创建多维空间,该多维空间依照HRTF在第三数据库中的分类优化这些HRTF之间的空间间隔,从而获得优化的空间。计算优化的投影模型MPO,该投影模型适合于将K个最优的形态参数与优化的空间中的HRTF滤波器的相应位置相关。本发明因此对于其HRTF不包含在数据库中的任何用户允许依照所述用户的参数K和优化的投影模型MPO从数据库BD1中选择至少一个HRTF。

Description

用于依照形态参数在数据库中选择感知最优的HRTF滤波器的方法
技术领域
本发明涉及一种依照形态参数在数据库中选择HRTF滤波器的方法。特别地,本发明旨在确保为特定用户选择的HRTF的可靠性。
背景技术
本发明在双耳合成应用领域中具有特别有利的应用,该领域涉及为双耳生成空间化的声音。因此,本发明用于例如电话会议、助听器、用于视障人士的助听设备、3D音频/视频游戏、移动电话、移动音频播放器、虚拟现实音频以及增强现实。
人类具有利用声学传递函数从入射声音中解码方向信息的能力。听者的头、外耳和身体借助于所称的头相关传递函数(HRTF)变换来自空间中的声音的谱信息,这允许我们基于声源的位置、距离等感知我们的声学环境并且从而定位它们。
HRTF滤波器由描述身体对给定位置处的声源的滤波的一对滤波器(左和右)组成。公认的是,一组大约200个位置足以描述个人感知的空间中的所有方向。这些HRTF滤波器基本上取决于耳朵的形态(尺寸、内腔的维度等等)以及个人身体的其他物理参数。
在本文的其余部分,术语“HRTF”代表给定受试者的用于所有HRTF型位置的滤波器。
在音频应用中使用最可能接近听者的HRTF滤波器的HRTF可以实现高质量再现(render)。文献中的若干研究证明了所谓的个性化HRTF的益处(例如参见发表于音频工程学会日报Journal of the Audio Engineering Society:44,451-469上的Moller等人的文章“双耳技术:我们需要个人录音吗?”“Binaural technique:do we need individual recordings?”),尤其是在位置检测精度方面的益处。
HRTF滤波器可以通过利用听者耳朵中的麦克风进行测量或者甚至通过数字仿真而获得。尽管这些方法的性能尚可,但是它们仍然非常乏味、非常昂贵并且不适合消费应用。
而且,文件WO-01/54453中描述的一种已知方法规定在数据库中选择与用户的HRTF最接近的HRTF。然而,不同于本发明的是,这种在统计学方面有效的方法没有将HRTF选择的感知质量作为验证标准,因而没有选择最佳的可能的HRTF。
发明内容
因此,本发明的新颖性在于以下事实:使用基于感知聆听测试的感知评估标准来创建优化的HRTF多维空间并且选择最相关的形态参数。本发明也允许开发建立空间和形态参数之间的与感知有关的相关性的预测模型。
对于任何用户而言,本发明将允许仅使用形态参数的测量来选择数据库中包含的最适当的HRTF。
选择的HRTF滤波器与空间感知强烈相关(并且不仅仅是一种数学计算),这提供了很好的舒适性和声音质量。
因此,本发明涉及一种用于依照形态参数在数据库中选择感知最优的HRTF的方法,该方法使用:
-第一数据库,其包括多个受试者的HRTF,
-第二数据库,其包括来自第一数据库的受试者的形态参数,
其中该方法进一步使用
-第三数据库,其与使用聆听测试执行的考虑到受试者的判断的、来自第一数据库的HRTF的感知分类相应,所述聆听测试与来自第一数据库的不同HRTF相应,
并且其中该方法包括以下步骤:
-通过将第二数据库和第三数据库相关在来自第二数据库的所有形态参数之间拣选N个最有关的形态参数,
-创建其维度是HRTF分量的组合的结果的多维空间,
-修改用于组合分量的规则以便依照其在第三数据库中的分类优化这些HRTF之间的空间间隔,从而获得优化的多维空间,
-计算优化的投影模型,该投影模型适合于将提取自第二数据库的K个拣选的形态参数与优化空间中的HRTF的相应位置相关,所述K个提取的参数优化所述投影模型,
-测量在第一数据库中没有HRTF的给定用户的K个形态参数,
-将先前计算的优化投影模型应用到提取的形态参数以便获得用户在优化空间中的位置,
-在优化空间中选择用户投影位置附近的至少一个HRTF。
依照一个实施例,为了执行感知分类,受试者在其对于相应于HRTF的声音的至少一个聆听标准的判断中具有至少两个选择(好或者差)。
依照一个实施例,例如从限定的声音路径的精度、总体空间质量、前面再现质量(用于位于前面的声音对象)以及前面/后面源的间隔(能够识别声音对象位于听者前面还是听者后面)之中选择聆听标准。
依照一个实施例,为了开发第三数据库:
-呈现声音信号,在该声音信号上将来自第一数据库的每个HRTF(包括受试者自身的HRTF)应用到每个受试者,
-用于测试的声音信号为通过汉宁窗获得的具有诸如0.23秒之类的短持续时间的宽带白噪声,
-在沿着按顺序呈现的两条轨线的点位置处再现声音信号:
-水平面(仰角=0度)内特别地增量为30度的圆,该轨线在0度方位角和0度仰角下开始,
-路径被重复一次,
-中垂面(方位角=0度)内特别地增量为15度的从前面-45度仰角向上通过90度仰角至后面-45的弧,
-声音路径在-45度仰角下开始向前,继续到所述后面的仰角并且然后沿着相同的路径返回到开始位置。
依照一个实施例,为了进行第二数据库和第三数据库之间的相关以便获得拣选的形态参数,
-形态数据借助于通过将来自第二数据库的形态值除以来自第二数据库的每个受试者的形态值创建子数据库而被归一化,
-对于相应的受试者将每个子数据库与来自第三数据库的分类关联,
-应用支持向量机(SVM)方法以便获得从最高到最低排序的形态参数,该排序为依照第三数据库中的类别的每个HRTF参数的分离质量的函数。
依照一个实施例,为了创建优化的多维空间,
-在第一步骤中,将HRTF转换成方向传递函数(DTF),所述方向传递函数仅包含具有方向依赖性的HRTF部分,
-在第二步骤中,对DTF进行平滑,
-在第三步骤中,对DTF进行预处理,
-在第四步骤中,变换数据维度以便根据使用的数据减少或者增加维度的数量,所述使用的数据是前一步骤的结果,
-在减少数据维度的选项中,在处理的DTF上执行主分量分析(PCA)以便获得代表原始数据投影到新轴(主分量)上的原始数据的新数据矩阵(评分),以及
-从代表多维空间的维度的评分矩阵的每列创建多维空间,或者
-在增加数据维度的选项中,使用多维缩放(MDS)创建多维空间,
-在第五步骤中,通过来自第三数据库的分类的空间间隔的显著水平评估优化水平,
-利用不同的预处理参数和/或通过限制创建的多维空间中的维度数量重复先前的步骤,以及
-保留具有最优的优化水平的空间。
依照一个实施例,依照听觉系统的频率分辨率极限执行DTF的临界频带平滑。
依照一个实施例,使用以下方法之一执行预处理:频率滤波、划定频率范围、提取频率峰和谷,或者计算频率调整因子。
依照一个实施例,通过以下方式评估优化水平:
-通过第三数据库中的分类之间的空间间隔的显著水平,该显著水平例如通过使用ANOVA测试评估,或者
-通过计算最高类别中排序的HRTF在空间EM中十个最接近的HRTF之间的百分比并且通过对于每个受试者使用例如学生测试将该百分比与高类别中排序的HRTF在第三数据库中的总百分比进行比较。
依照一个实施例,为了计算用于将提取自第二数据库的所述N个形态参数与优化空间中HRTF的相应位置相关的投影模型:
-在第一步骤中,通过优化的多维空间与排序的形态参数之间的多次线性回归以便根据来自第二数据库的排序的形态参数找到优化的多维空间中的位置,计算投影模型,
-在第二步骤中,评估投影模型的质量水平,
-在第三步骤中,将排序的形态参数的数量减少为前K个排序的形态参数,并且根据每个K的质量度量的第一和第二步骤从K等于1至K等于N重复模型的计算,该计算对于每个受试者进行重复,将其数据从第一数据库和第二数据库中移除,以及
-保留对于其而言质量水平最高的最优K。
依照一个实施例,为了在优化的多维空间中选择用户投影位置附近的至少一个HRTF,选择优化的多维空间中最接近该投影位置的HRTF。
附图说明
当阅读以下描述并且研究伴随它的附图时,将更好地理解本发明。这些附图仅仅被提供用于说明的目的并且对于本发明不是限制性的。它们示出:
图1:依照本发明的方法的功能框的框图;
图2:本发明一个实施例的详细实现的实例的框图;
图3:沿着水平轴示出受试者并且沿着竖直轴示出第三数据库中排序的HRTF的图形;
图4:来自CIPIC数据库上的文章的示出该数据库中使用的各种不同的形态参数的示意性表示。
从一幅图到下一幅图,相同、相似或者类似的元素保持相同的附图标记。
具体实施方式
数据库的创建
对于多个受试者,将麦克风置于受试者的耳朵中,并且将声源散布在空间中的各个不同的点上,以便确定每个受试者的HRTF。对于每个受试者也测量形态参数。第一数据库BD1包含HRTF,并且第二数据库BD2包含关联受试者的形态参数。
在我们的实例中,存储在第一数据库BD1中的HRTF出自来自LISTEN项目的公共数据库。来自该数据库中的前M个受试者的数据被使用(在一个实例中,M=45)。LISTEN HRTF测量在空间中的与范围从-45度到90度、增量为15度的仰角以及开始于0度、增量为15度的方位角相应的位置处进行。对于总共187个位置而言,针对超过45度的仰角逐渐增加方位角增量以便均匀地采样所述空间。
如图4中所示,第二数据库BD2包括每个受试者的以下形态参数:
x1:头宽度;
x2:头高度;
x3:头深度;
x4:耳廓向下偏移;
x5:耳廓向后偏移;
x6:颈宽度;
x7:颈高度;
x8:颈深度;
x9:躯干顶部宽度;
x0:躯干顶部高度;
x11:躯干顶部深度;
x12:肩宽;
x13:头围;
x14:肩围;
d1:耳甲腔高度;
d2:耳甲艇高度;
d3:耳甲腔宽度;
d4:窝高度;
d5:耳廓高度;
d6:耳廓宽度;
d7:耳屏间切迹宽度;
d8:耳甲腔深度;
Figure BDA00002563651800071
    耳廓旋转角度;
    耳廓角度参数。
存储在第二数据库BD2中的这些形态参数与受试者的HRTF相应。
而且,在步骤E1中,创建第三数据库BD3,其包含来自聆听测试的感知评价结果。对于每个受试者,发射测试信号,在该测试信号上应用了来自数据库BD1的HRTF。
在一个实例中,用于测试的声音信号为通过汉宁(Hanning)窗获得的具有诸如0.23秒之类的短持续时间的宽带白噪声,
-在沿着按顺序呈现的两条轨线的点位置处再现声音信号:
-水平面(仰角=0度)内特别地增量为30度的圆,该轨线在0度方位角和0度仰角下开始,
-路径被重复一次,
-中垂面(方位角=0度)内特别地增量为15度的从前面-45度仰角向上通过90度仰角至后面-45的弧,
-声音路径在-45度仰角下开始向前,继续到所述后面的仰角并且然后沿着相同的路径返回到开始位置。
每个受试者将所述HRTF中的每一个分类成以下三个类别之一:优、良或者差。优被认为是最高的判断类别。这些判断基于与HRTF相应的用于聆听声音的至少一个标准。该标准可以选自以下实例之一:先前限定的路径的精度、总体空间质量、前面再现质量(用于位于前面的声音对象)以及前面/后面源的间隔(能够识别声音对象位于听者前面还是听者后面)。
图3示出了对于所有受试者利用这种类型的聆听测试获得的结果类型(“+”为优,“o”为良并且“x”为差)。受试者在水平轴上示出,并且排序的HRTF在竖直轴上示出。
重要形态参数的选择
如图1和图2中所示,在步骤E2中,为了选择重要的形态参数,将第二数据库BD2与第三数据库BD3相关。
为此目的,在子步骤E2.1中,形态数据通过创建子数据库BD2i(i范围从1至M,M为数据库中受试者的数量)而被归一化,该子数据库BD2i通过将来自第二数据库BD2的形态值除以第二数据库中的每个受试者的形态值BD2[i]来创建。利用该归一化(normalization),所述值代表一个受试者的形态参数相对于另一个受试者的形态参数的百分比。
在子步骤E2.2中,将每个子数据库BD2i与相应的受试者的第三数据库中的分类BD3[i]关联。
接着,在子步骤E2.3中,应用特征选择方法以便获得从最高到最低排序的形态参数Pmc。该分类基于它们依照它们在第三数据库BD3中的分类分离HRTF的能力。
所选择的方法为支持向量机(SVM)方法。该方法基于在高维空间中构造一组超平面以便对归一化的数据分类。利用该方法,因而从最高到最低对参数排序。
两个变量控制利用SVM的分类。控制分析中的分类误差容限的复杂度值C引入惩罚函数。C的空值表明未考虑惩罚函数,并且C的高值(无限地增大C)表明惩罚函数是占优势的。Epsilon值ε为在要分类的数据距离超平面小于ε的情况下将惩罚函数设置为零的不敏感值。形态参数的分类依照C和ε的不同值而改变。在C=1和ε=1x10-25的情况下使用这种方法,在我们的实例中,从最高到最低排序的Pmc的前十个最高元素为x11、x2、x8、d5、x3、d4、x12、d2、d1和x6。
优化的多维空间的创建
在步骤E3中,创建其维度由来自HRTF滤波器的分量的组合而产生的多维空间EM。
为此目的,在第一步骤E3.1中,将HRTF转换成所称的方向传递函数(DTF),所述方向传递函数仅仅包含具有方向依赖性的HRTF部分。
在步骤E3.2中,依照听觉系统的频率分辨率极限对DTF进行临界频带平滑。
在步骤E3.3中,使用从以下选择的方法对DTF进行预处理:频率滤波、划定频率范围、提取频率的峰值和谷值,或者计算频率调整因子(frequency alignment factor)。
在步骤E3.4中,变换数据维度以便根据使用的数据减少或者增加维度的数量,所述使用的数据是步骤E3.3的结果。
为了减少数据维度,在处理的DTF上执行主分量分析(PCA)以便获得代表投影到新轴(主分量)上的原始数据的新数据矩阵(评分),并且从代表空间EM的维度的评分矩阵的每列创建空间EM。
为了增加数据维度,在处理的DTF上使用多维缩放(multidimensional scaling,MDS)分析,得到空间EM。
在步骤E3.5中,评估优化水平。在第一实例中,通过来自第三数据库BD3的分类之间的空间间隔的显著水平评估优化水平。在一个实例中,通过使用ANOVA测试以检查值分布平均对于每个不同的维度数量是否在统计上不同来评估显著水平。
在第二实例中,计算最高类别中排序的HRTF在空间EM中十个最接近的HRTF之间的百分比,并且对于每个受试者使用例如学生测试将该百分比与高类别中排序的HRTF在第三数据库中的总百分比进行比较。
利用不同的预处理参数和/或通过限制创建的空间中的维度数量重复先前的步骤。
保留具有最优的优化水平的空间。该空间在我们的实例中是具有最高显著水平的一个空间,或者在第二实例中是对于最接近的十个HRTF而言在最高类别中排序的HRTF的数量最大化的一个空间。
这样保留的空间是优化的多维空间EMO。
步骤E3.5的目的是依照其在第三数据库BD3中的分类优化HRTF之间的空间间隔以便获得优化的空间。事实上,在空间EMO中,对于给定位置处的受试者而言,位于该位置附近的区域中的HRTF对于该受试者将被认为是好的,而远离该位置的HRTF将被认为是差的。
换言之,用于组合HRTF分量的规则被改变以便最大化HRTF之间的空间间隔与第三数据库BD3中的HRTF的分类之间的相关性。
投影模型的开发
在步骤E4中,计算用于将提取自第二数据库BD2的所述N个形态参数与优化空间EMO中相应HRTF的位置相关的投影模型。
为此目的,在步骤E4.1中,使用第二数据库BD2通过EMO和Pmc之间的多次线性回归计算投影模型,以便基于排序的形态参数Pmc找到空间EMO中的位置。
在步骤E4.2中,评估投影模型的质量水平。该质量水平通过使用E3.5中使用的相同方法来计算。
在步骤E4.3中,将Pmc减少为前K个排序形态参数,并且根据每个K的质量度量的步骤E4.1和步骤E4.2从K等于1至K等于N重复模型的计算。优选地,对于每个受试者通过在步骤E3中将该受试者的数据从第一数据库BD1和第二数据库BD2中移除而重复该计算。
保留对于其而言质量水平最高的最优K。因此,K个提取的参数最大化了优化的多维空间EMO与由投影模型产生的空间之间的相关性。
这提供了优化的投影模型MPO。
方法的实现
在步骤E5中,在数据库BD1中,为在该数据库中没有HRTF的任何用户选择至少一个HRTF。
为此目的,在子步骤E5.1中,用户测量先前识别的K个形态参数。为此目的,用户在确定的位置拍摄其耳朵的照片,所述K个参数通过图像处理方法提取。
在步骤E5.2中,将这K个参数作为来自先前计算的投影模型MPO的输入注入提取的形态参数中,以便获得用户在优化空间EMO中的位置。
然后,在优化空间中的用户投影位置附近选择至少一个HRTF(标记为HRTF-S)。在一个实例中,选择最接近投影位置的HRTF。

Claims (11)

1.一种用于依照形态参数在数据库中选择感知最优的HRTF的方法,该方法使用:
-第一数据库(BD1),其包括多个受试者的HRTF,
-第二数据库(BD2),其包括来自第一数据库(BD1)的受试者的形态参数,
其中该方法进一步使用
-第三数据库(BD3),其与使用聆听测试执行的考虑到受试者的判断的、来自第一数据库(BD1)的HRTF的感知分类相应,所述聆听测试与来自第一数据库的不同HRTF相应,
并且其中该方法包括以下步骤:
-通过将第二数据库(BD2)和第三数据库(BD3)相关在来自第二数据库(BD2)的所有形态参数之间拣选N个最有关的形态参数,
-创建其维度是HRTF分量的组合的结果的多维空间(EM),
-修改用于组合分量的规则以便最大化这些HRTF之间的空间间隔与这些HRTF在第三数据库(BD3)中的分类之间的相关性,从而获得优化的多维空间(EMO),
-计算优化的投影模型(MPO),该投影模型适合于将提取自第二数据库(BD2)的K个拣选的形态参数与优化空间(EMO)中的HRTF的相应位置相关,所述K个提取的参数最大化优化的多维空间(EMO)与由投影模型产生的空间之间的相关性,
-测量在第一数据库(BD1)中没有HRTF的给定用户的K个形态参数,
-将先前计算的优化投影模型(MPO)应用到提取的形态参数以便获得用户在优化空间(EMO)中的位置,
-在优化空间(EMO)中选择用户投影位置附近的至少一个HRTF(HRTF-S)。
2.依照权利要求1的方法,其中为了执行感知分类,受试者在其对于相应于HRTF的声音的至少一个聆听标准的判断中具有至少两个选择(好或者差)。
3.依照权利要求2的方法,其中例如从限定的声音路径的精度、总体空间质量、前面再现质量(用于位于前面的声音对象)以及前面/后面源的间隔(能够识别声音对象位于听者前面还是听者后面)之中选择聆听标准。
4.依照权利要求1-3之一的方法,其中为了开发第三数据库(BD3):
-呈现声音信号,在该声音信号上将来自第一数据库的每个HRTF(包括受试者自身的HRTF)应用到每个受试者,
-用于测试的声音信号为通过汉宁窗获得的具有诸如0.23秒之类的短持续时间的宽带白噪声,
-在沿着按顺序呈现的两条轨线的点位置处再现声音信号:
-水平面(仰角=0度)内特别地增量为30度的圆,该轨线在0度方位角和0度仰角下开始,
-路径被重复一次,
-中垂面(方位角=0度)内特别地增量为15度的从前面-45度仰角向上通过90度仰角至后面-45的弧,
-声音路径在-45度仰角下开始向前,继续到所述后面的仰角并且然后沿着相同的路径返回到开始位置。
5.依照权利要求1-4之一的方法,其中为了进行第二数据库(BD2)和第三数据库(BD3)之间的相关以便获得拣选的形态参数,
-形态数据借助于通过将来自第二数据库(BD2)的形态值除以来自第二数据库的每个受试者的形态值(BD2[i])创建子数据库(BD2i)而被归一化,
-对于相应的受试者将每个子数据库(BD2i)与来自第三数据库的分类(BD3[i])关联,
-应用支持向量机(SVM)方法以便获得从最高到最低排序的形态参数(Pmc),该排序为依照第三数据库中的类别的每个HRTF参数的分离质量的函数。
6.依照权利要求5的方法,其中为了创建优化的多维空间(EMO),
-在步骤E 3.1中,将HRTF转换成方向传递函数(DTF),所述方向传递函数仅包含具有方向依赖性的HRTF部分,
-在步骤E 3.2中,对DTF进行平滑,
-在步骤E 3.3中,对DTF进行预处理,
-在步骤E3.4中,变换数据维度以便根据使用的数据减少或者增加维度的数量,所述使用的数据是步骤E3.3的结果,
-在减少数据维度的选项中,在处理的DTF上执行主分量分析(PCA)以便获得代表原始数据投影到新轴(主分量)上的新数据矩阵(评分),以及
-从代表空间EM的维度的评分矩阵的每列创建空间EM,或者
-在增加数据维度的选项中,使用多维缩放(MDS)创建空间EM,
-在步骤E 3.5中,通过来自第三数据库BD3的分类之间的空间间隔的显著水平评估优化水平,
-利用不同的预处理参数和/或通过限制创建的空间EM中的维度数量重复先前的步骤,以及
-保留具有最优的优化水平的空间。
7.依照权利要求6的方法,其中依照听觉系统的频率分辨率极限执行DTF的临界频带平滑。
8.依照权利要求6或7的方法,其中使用以下方法之一执行预处理:频率滤波、划定频率范围、提取频率峰和谷,或者计算频率调整因子。
9.依照权利要求6-8之一的方法,其中通过以下方式评估优化水平:
-通过第三数据库(BD3)中的分类之间的空间间隔的显著水平,该显著水平例如通过使用ANOVA测试评估,或者
-通过计算最高类别中排序的HRTF在空间EM中十个最接近的HRTF之间的百分比并且通过对于每个受试者使用例如学生测试将该百分比与最高类别中排序的HRTF在第三数据库(BD3)中的总百分比进行比较。
10.依照权利要求1-9之一的方法,其中为了计算用于将提取自第二数据库的所述N个形态参数与优化空间中HRTF的相应位置相关的投影模型:
-在步骤E4.1中,通过EMO与Pmc之间的多次线性回归以便根据来自第二数据库(BD2)的排序的形态参数Pmc找到空间EMO中的位置,计算投影模型,
-在步骤E4.2中,评估投影模型的质量水平,
-在步骤E4.3中,将Pmc减少为前K个排序的形态参数,并且根据每个K的质量度量的模型E4.1和步骤E4.2从K等于1至K等于N重复模型的计算,该计算对于每个受试者进行重复,将其数据从第一数据库(BD1)和第二数据库(BD2)中移除,以及
-保留对于其而言质量水平最高的最优K。
11.依照权利要求1-10之一的方法,其中为了在优化的空间(EMO)中选择用户投影位置附近的至少一个HRTF(HRTF-S),选择优化的空间(EMO)中最接近该投影位置的HRTF。
CN201180028806.6A 2010-04-12 2011-04-12 用于依照形态参数在数据库中选择感知最优的hrtf滤波器的方法 Active CN102939771B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1052767A FR2958825B1 (fr) 2010-04-12 2010-04-12 Procede de selection de filtres hrtf perceptivement optimale dans une base de donnees a partir de parametres morphologiques
FR1052767 2010-04-12
PCT/FR2011/050840 WO2011128583A1 (fr) 2010-04-12 2011-04-12 Procede de selection de filtres hrtf perceptivement optimale dans une base de donnees a partir de parametres morphologiques

Publications (2)

Publication Number Publication Date
CN102939771A true CN102939771A (zh) 2013-02-20
CN102939771B CN102939771B (zh) 2015-04-22

Family

ID=43736251

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180028806.6A Active CN102939771B (zh) 2010-04-12 2011-04-12 用于依照形态参数在数据库中选择感知最优的hrtf滤波器的方法

Country Status (7)

Country Link
US (1) US8768496B2 (zh)
EP (1) EP2559265B1 (zh)
JP (1) JP5702852B2 (zh)
KR (1) KR101903192B1 (zh)
CN (1) CN102939771B (zh)
FR (1) FR2958825B1 (zh)
WO (1) WO2011128583A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484844A (zh) * 2014-12-30 2015-04-01 天津迈沃医药技术有限公司 基于疾病圈数据信息的自我诊疗方法
CN104618843A (zh) * 2013-11-05 2015-05-13 奥迪康有限公司 包括头部相关传递函数数据库的双耳助听系统
CN105979441A (zh) * 2016-05-17 2016-09-28 南京大学 一种用于3d音效耳机重放的个性化优化方法
CN106874592A (zh) * 2017-02-13 2017-06-20 深圳大学 虚拟听觉重放方法及系统
CN107113524A (zh) * 2014-12-04 2017-08-29 高迪音频实验室公司 反映个人特性的双耳音频信号处理方法和设备
CN107734428A (zh) * 2017-11-03 2018-02-23 中广热点云科技有限公司 一种3d音频播放设备
CN108028998A (zh) * 2015-09-14 2018-05-11 雅马哈株式会社 耳形状分析装置、信息处理装置、耳形状分析方法以及信息处理方法
CN108476369A (zh) * 2015-09-07 2018-08-31 3D声音实验室 用于开发适用于个体的头部相关传递函数的方法和系统
CN109155896A (zh) * 2016-05-24 2019-01-04 S·M·F·史密斯 用于改进音频虚拟化的系统和方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9030545B2 (en) * 2011-12-30 2015-05-12 GNR Resound A/S Systems and methods for determining head related transfer functions
US9900722B2 (en) 2014-04-29 2018-02-20 Microsoft Technology Licensing, Llc HRTF personalization based on anthropometric features
US10609475B2 (en) 2014-12-05 2020-03-31 Stages Llc Active noise control and customized audio system
US9747367B2 (en) 2014-12-05 2017-08-29 Stages Llc Communication system for establishing and providing preferred audio
US9654868B2 (en) 2014-12-05 2017-05-16 Stages Llc Multi-channel multi-domain source identification and tracking
US9508335B2 (en) 2014-12-05 2016-11-29 Stages Pcs, Llc Active noise control and customized audio system
US9544706B1 (en) 2015-03-23 2017-01-10 Amazon Technologies, Inc. Customized head-related transfer functions
JP6596896B2 (ja) 2015-04-13 2019-10-30 株式会社Jvcケンウッド 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置
US9609436B2 (en) 2015-05-22 2017-03-28 Microsoft Technology Licensing, Llc Systems and methods for audio creation and delivery
FR3044459A1 (fr) * 2015-12-01 2017-06-02 Orange Decompositions successives de filtres audio
US10187740B2 (en) 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
US9980042B1 (en) 2016-11-18 2018-05-22 Stages Llc Beamformer direction of arrival and orientation analysis system
US10945080B2 (en) 2016-11-18 2021-03-09 Stages Llc Audio analysis and processing system
US9980075B1 (en) 2016-11-18 2018-05-22 Stages Llc Audio source spatialization relative to orientation sensor and output
US10278002B2 (en) 2017-03-20 2019-04-30 Microsoft Technology Licensing, Llc Systems and methods for non-parametric processing of head geometry for HRTF personalization
US10306396B2 (en) * 2017-04-19 2019-05-28 United States Of America As Represented By The Secretary Of The Air Force Collaborative personalization of head-related transfer function
CA3023880A1 (en) * 2017-11-13 2019-05-13 Royal Bank Of Canada System, methods, and devices for visual construction of operations for data querying
US10397725B1 (en) 2018-07-17 2019-08-27 Hewlett-Packard Development Company, L.P. Applying directionality to audio
WO2020152550A1 (en) * 2019-01-21 2020-07-30 Maestre Gomez Esteban Method and system for virtual acoustic rendering by time-varying recursive filter structures
EP3833043B1 (en) * 2019-12-03 2022-10-19 Oticon A/s A hearing system comprising a personalized beamformer
EP4085660A4 (en) 2019-12-30 2024-05-22 Comhear Inc. METHOD FOR PROVIDING A SPATIAL SOUND FIELD

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006075077A2 (fr) * 2005-01-10 2006-07-20 France Telecom Procede et dispositif d’individualisation de hrtfs par modelisation
WO2007048900A1 (fr) * 2005-10-27 2007-05-03 France Telecom Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif
CN101065990A (zh) * 2004-09-16 2007-10-31 松下电器产业株式会社 声像定位装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08111899A (ja) * 1994-10-13 1996-04-30 Matsushita Electric Ind Co Ltd 両耳聴装置
US5742689A (en) * 1996-01-04 1998-04-21 Virtual Listening Systems, Inc. Method and device for processing a multichannel signal for use with a headphone
US6996244B1 (en) * 1998-08-06 2006-02-07 Vulcan Patents Llc Estimation of head-related transfer functions for spatial sound representative
AUPQ514000A0 (en) * 2000-01-17 2000-02-10 University Of Sydney, The The generation of customised three dimensional sound effects for individuals
EP1667487A4 (en) * 2003-09-08 2010-07-14 Panasonic Corp AUDIO PICTURE DEVICE DEVICE TOOL AND AUDIO PICTURE CONTROLLER
CN101360359A (zh) * 2007-08-03 2009-02-04 富准精密工业(深圳)有限公司 产生立体音效的方法及装置
EP2258119B1 (fr) * 2008-02-29 2012-08-29 France Telecom Procede et dispositif pour la determination de fonctions de transfert de type hrtf

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101065990A (zh) * 2004-09-16 2007-10-31 松下电器产业株式会社 声像定位装置
WO2006075077A2 (fr) * 2005-01-10 2006-07-20 France Telecom Procede et dispositif d’individualisation de hrtfs par modelisation
WO2007048900A1 (fr) * 2005-10-27 2007-05-03 France Telecom Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104618843A (zh) * 2013-11-05 2015-05-13 奥迪康有限公司 包括头部相关传递函数数据库的双耳助听系统
CN104618843B (zh) * 2013-11-05 2019-04-09 奥迪康有限公司 包括头部相关传递函数数据库的双耳助听系统
CN107113524A (zh) * 2014-12-04 2017-08-29 高迪音频实验室公司 反映个人特性的双耳音频信号处理方法和设备
CN107113524B (zh) * 2014-12-04 2020-01-03 高迪音频实验室公司 反映个人特性的双耳音频信号处理方法和设备
CN104484844B (zh) * 2014-12-30 2018-07-13 天津迈沃医药技术股份有限公司 一种基于疾病圈数据信息的自我诊疗网站平台
CN104484844A (zh) * 2014-12-30 2015-04-01 天津迈沃医药技术有限公司 基于疾病圈数据信息的自我诊疗方法
CN108476369A (zh) * 2015-09-07 2018-08-31 3D声音实验室 用于开发适用于个体的头部相关传递函数的方法和系统
CN108028998A (zh) * 2015-09-14 2018-05-11 雅马哈株式会社 耳形状分析装置、信息处理装置、耳形状分析方法以及信息处理方法
CN108028998B (zh) * 2015-09-14 2020-11-03 雅马哈株式会社 耳形状分析装置和耳形状分析方法
CN105979441B (zh) * 2016-05-17 2017-12-29 南京大学 一种用于3d音效耳机重放的个性化优化方法
CN105979441A (zh) * 2016-05-17 2016-09-28 南京大学 一种用于3d音效耳机重放的个性化优化方法
CN109155896A (zh) * 2016-05-24 2019-01-04 S·M·F·史密斯 用于改进音频虚拟化的系统和方法
CN106874592A (zh) * 2017-02-13 2017-06-20 深圳大学 虚拟听觉重放方法及系统
CN106874592B (zh) * 2017-02-13 2020-05-19 深圳大学 虚拟听觉重放方法及系统
CN107734428A (zh) * 2017-11-03 2018-02-23 中广热点云科技有限公司 一种3d音频播放设备
CN107734428B (zh) * 2017-11-03 2019-10-01 中广热点云科技有限公司 一种3d音频播放设备

Also Published As

Publication number Publication date
KR20130098149A (ko) 2013-09-04
US20130046790A1 (en) 2013-02-21
JP2013524711A (ja) 2013-06-17
EP2559265B1 (fr) 2014-09-17
WO2011128583A1 (fr) 2011-10-20
EP2559265A1 (fr) 2013-02-20
CN102939771B (zh) 2015-04-22
FR2958825A1 (fr) 2011-10-14
US8768496B2 (en) 2014-07-01
KR101903192B1 (ko) 2018-11-22
JP5702852B2 (ja) 2015-04-15
FR2958825B1 (fr) 2016-04-01

Similar Documents

Publication Publication Date Title
CN102939771B (zh) 用于依照形态参数在数据库中选择感知最优的hrtf滤波器的方法
Eronen et al. Audio-based context recognition
EP2539892B1 (fr) Compression de flux audio multicanal
US20120330659A1 (en) Information processing device, information processing system, information processing method, and information processing program
Vallet et al. A multimodal approach to speaker diarization on TV talk-shows
EP2685450A1 (en) Device and method for recognizing content using audio signals
US11997456B2 (en) Spatial audio capture and analysis with depth
CN103024530A (zh) 智能电视语音应答系统及方法
CN110263220A (zh) 一种视频精彩片段识别方法及装置
EP2920979B1 (fr) Acquisition de données sonores spatialisées
Sgouros et al. A novel directional framework for source counting and source separation in instantaneous underdetermined audio mixtures
CN108038291B (zh) 一种基于人体参数适配算法的个性化头相关传递函数生成系统及方法
Barumerli et al. A Bayesian model for human directional localization of broadband static sound sources
CN113656258B (zh) 基于互联网的智能蓝牙耳机用场景分析管控系统
Härmä Classification of Time–Frequency Regions in Stereo Audio
McMullen et al. A machine learning tutorial for spatial auditory display using head-related transfer functions
Bomhardt et al. Required measurement accuracy of head dimensions for modeling the interaural time difference
CN116913328B (zh) 音频处理方法、电子设备及存储介质
Vargas et al. A compressed encoding scheme for approximate TDOA estimation
Grijalva et al. A recommender system for improving median plane sound localization performance based on a nonlinear representation of HRTFs
CN117437367B (zh) 一种基于耳廓关联函数预警耳机滑动及动态修正方法
CN115312067B (zh) 基于人声的声音信号识别方法、装置及存储介质
KR20220071412A (ko) 세그먼트 핑거프린트 생성 방법 및 이를 이용한 비디오 부분 복사 검출 장치
Qian et al. Speaker front‐back disambiguity using multi‐channel speech signals
Pirard Spatial Audio and Individualized HRTFs using a Convolutional Neural Network (CNN)

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant