CN108540925B

CN108540925B - 一种个性化头相关传递函数的快速匹配方法

Info

Publication number: CN108540925B
Application number: CN201810322157.4A
Authority: CN
Inventors: 王晶; 王进; 闫昭宇
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2018-04-11
Filing date: 2018-04-11
Publication date: 2019-07-26
Anticipated expiration: 2038-04-11
Also published as: CN108540925A

Abstract

本发明公开的一种个性化头相关传递函数的快速匹配方法，涉及一种基于主客观估计结果相似度的个性化头相关传递函数的快速匹配方法，属于三维音频技术领域。本发明按随机顺序生成各种方位的三维虚拟声信号；工作人员播放之前按随机顺序生成的各种方位的三维虚拟声信号；听音人员分别对三维虚拟声信号进行主观方位估计，得到n个三维虚拟声信号对应的"主观方位"；用客观估计算法结合不同人的头相关传递函数HRTF数据，对生成的三维虚拟声信号进行客观方位估计，得到n个三维虚拟声信号对应的"客观方位"；计算"主观方位"和"客观方位"的相似度，选取最大相似度对应的人头的HRTF数据作为听音人员的个性化HRTF，进而增强虚拟现实VR音频的方位感和沉浸感。

Description

一种个性化头相关传递函数的快速匹配方法

技术领域

本发明涉及一种个性化头相关传递函数的快速匹配方法，尤其涉及一种基于主客观估计结果相似度的个性化头相关传递函数的快速匹配方法，属于三维音频技术领域。

背景技术

随着虚拟现实(VR)技术的发展，可用于增强人在虚拟环境中的沉浸感的三维音频技术也得到了进一步的应用。在目前VR领域应用较多的三维音频技术中，采用头相关传递函数(HRTF)进行双耳合成处理可以得到具有较好空间听觉效果的三维音频。由于HRTF与个体有关，要生成听者主观感觉方位非常准确的虚拟声，就需要获取听者的个性化HRTF。

获取听者的个性化HRTF的方法一般有以下几类：1.实验测量：该方法可以获得最准确的个性化HRTF，但该方法对设备和环境有较高的要求，且测试较为耗时；2.数值建模：该方法将人体模型简化为球头模型或雪人模型，根据HRTF的定义来求解，简化的模型对低频特性的模拟较准确，但对高频特性的模拟不够准确；也可利用三维激光扫描头部和耳廓的精确几何模型，并求解HRTF，但复杂度高；3.生理参数匹配：该方法通过测量听者的生理参数，从已有的HRTF库中，找到生理参数与听者生理参数最接近的HRTF数据，作为听者的个性化HRTF的近似，该方法需要精确测量听者的生理参数；4.主观实验：Saito通过让听者主观听HRTF库中不同人头的HRTF数据生成的不同方位的三维音频，选出最适合听者的HRTF作为个性化HRTF，该方法不需要测量生理参数，相对简单，但当HRTF库包含较多样本时，工作量会增大。我国公开号为"CN104967952A"(公开日：2015年10月7日)的专利"一种基于HRTF结构化模型与主观反馈的个性化方法"，公开了一种基于HRTF结构化模型与主观反馈的个性化方法，该方法通过生成滤波器参数，合成声音并播放给被试者，根据被试者反馈的声像位置，修改参数，再次合成声音播放给被试者，直到被试者感知的声像与目标一致。该方法需要让被试者进行多组主观估计，工作量较大。我国公开号为"CN106682203A"(公开日：2017年5月17日)的专利"基于三维生理参数的HRTF个人化匹配方法"，公开了一种基于三维生理参数的HRTF个人化匹配方法，该方法对被试者进行生理参数测量，平移，计算与HRTF数据库中的各被试者的生理参数的距离，选取最小距离对应的HRTF作为匹配的HRTF。该方法需要精确测量被试者的生理参数，对实验设备要求较高。

发明内容

针对现有的各种头相关传递函数HRTF个性化方法中存在的复杂度高，对生理参数需要精确测量，工作量大的问题，本发明公开的一种个性化头相关传递函数的快速匹配方法要解决的技术问题为：在降低复杂度和无需精确测量被试者的生理参数条件下，实现基于主客观估计结果相似度的个性化HRTF的快速匹配，进而增强虚拟现实VR音频的方位感和沉浸感，并能够实现减小获取个性化HRTF的工作量。

本发明的目的是通过下述技术方案实现的。

本发明公开的一种个性化头相关传递函数的快速匹配方法，按随机顺序生成各种方位的三维虚拟声信号。工作人员播放之前按随机顺序生成的各种方位的三维虚拟声信号。听音人员分别对之前播放的三维虚拟声信号进行主观方位估计，得到n个三维虚拟声信号对应的"主观方位"。用客观估计算法结合不同人的头相关传递函数HRTF数据，对生成的三维虚拟声信号进行客观方位估计，得到n个三维虚拟声信号对应的"客观方位"。计算"主观方位"和"客观方位"的相似度，选取最大相似度对应的人头的HRTF数据作为听音人员的个性化HRTF，进而增强虚拟现实VR音频的方位感和沉浸感。

本发明公开的一种个性化头相关传递函数的快速匹配方法，包括如下步骤：

步骤一:按随机顺序生成各种方位的三维虚拟声信号。

步骤一具体实现方法为:按随机顺序生成n个不同方位的三维虚拟声信号，记录所述三维虚拟声对应的"生成方位"，记为{θ_A1,θ_A2,θ_A3...θ_An}，{θ_A1,θ_A2,θ_A3...θ_An}是一个长度为n的向量；

步骤二:工作人员播放步骤一随机顺序生成的各种方位的三维虚拟声信号。听音人员分别对步骤二播放的三维虚拟声信号进行主观方位估计，得到n个三维虚拟声信号对应的"主观方位"。

步骤二具体实现方法为:听音人员带上耳机，工作人员按步骤一中的"生成方位"播放n个三维虚拟声信号，听音人员根据听到的三维虚拟声信号，分别估计n个三维虚拟声信号对应的"主观方位"，记为{θ_S1,θ_S2,θ_S3...θ_Sn}，{θ_S1,θ_S2,θ_S3...θ_Sn}是一个长度为n的向量；

步骤三:用客观估计算法结合不同人的头相关传递函数HRTF数据，对步骤一生成的三维虚拟声信号进行客观方位估计，得到n个三维虚拟声信号对应的"客观方位″。

步骤三具体实现方法为:HRTF库中共有m个不同人头的HRTF数据，选择第x个人头的HRTF数据，按步骤一按随机顺序生成的方位，对步骤一生成的三维虚拟声信号进行客观方位估计，得到第x个人头的HRTF数据对声音估计的"客观方位"，记为{θ_Ox1,θ_Ox2,θ_Ox3...θ_Oxn}，{θ_Ox1,θ_Ox2,θ_Ox3...θ_Oxn}是一个长度为n的向量,当所有人头的HRTF数据都进行客观方位估计后，得到m个长度为n的向量。

步骤三所述的客观估计算法优选互通道算法或基于ITD、ILD的定位算法。

步骤四:计算步骤二中"主观方位"和步骤三中"客观方位"的相似度。

步骤四具体实现方法为:根据步骤二中得到的长度为n的"主观方位"向量{θ_S1,θ_S2,θ_S3...θ_Sn}，和步骤三中得到的第x个人头估计的长度为n的"客观方位"向量{θ_Ox1,θ_Ox2,θ_Ox3...θ_Oxn}，计算第x个主客观估计误差d_x，当所有主客观估计误差都计算完成后，得到m个主客观估计误差，即得到步骤二中"主观方位"和步骤三中"客观方位"的相似度。

步骤四中计算步骤二中"主观方位"和步骤三中"客观方位"的相似度优选均方误差，均方根误差或平均绝对误差。

步骤五：根据步骤四计算得到的"主观方位"和"客观方位"的相似度，选取最大相似度对应的人头的HRTF数据作为听音人员的个性化HRTF，进而增强虚拟现实VR音频的方位感和沉浸感。

步骤五具体实现方法为:在步骤四得到的m个主客观估计误差中，找到最小的主客观估计误差d_{x_min}，即最大的主客观相似度，其对应人头序号为x_min，该人头的HRTF数据作为听音人员的个性化HRTF，进而增强虚拟现实VR音频的方位感和沉浸感。

有益效果：

1、现有的"实验测量"，"数值建模"，"生理参数匹配"方法需要精确测量生理参数，测量过程繁琐，本发明公开的一种个性化头相关传递函数的快速匹配方法，利用已有的包含了不同人头HRTF数据的HRTF库，因此，不需要精确测量生理参数，省去繁琐的测量过程，减小获取个性化HRTF的工作量，提高个性化头相关传递函数的匹配效率。

2、当HRTF库包含较多样本时，现有的"主观实验"方法需要按顺序估计多组"主观方位"，工作量会增大，本发明公开的一种个性化头相关传递函数的快速匹配方法，当HRTF库包含较多样本时，根据计算得到的"主观方位"和"客观方位"的相似度，选取最大相似度对应的人头的HRTF数据作为听音人员的个性化HRTF，进而增强虚拟现实VR音频的方位感和沉浸感，同时，由于本发明仅需按照顺序估计一组"主观方位"，因此，降低估计"主观方位"的工作量。

附图说明

图1为本发明公开的一种个性化头相关传递函数的快速匹配方法的流程框图。

具体实施方式

下面结合附图和实施例对本发明作进一步详细描述。

实施例1：

本实施例公开的一种个性化头相关传递函数的快速匹配方法，包括如下步骤：

步骤一:选取HRTF库中一个人头的HRTF数据，按一定顺序生成n条不同方位的三维虚拟声，记录这些三维虚拟声对应的"生成方位"，记为{θ_A1,θ_A2,θ_A3...θ_An}，是一个长度为n的向量，对应图1中的(1)；

例如：假设正前方为0度，正左方为-90度，正右方为90度。n＝31个声音信号的方位具体为：-90，-80，-70，-60，-55，-50，-45，-40，-35，-30，-25，-20，-15，-10，-5，0，5，10，15，20，25，30，35，40，45，50，55，60，70，80，90。

步骤二:听音人员带上耳机，准备收听声音，协助人员按步骤一中的顺序播放三维虚拟声，听音人员根据听到的虚拟声，估计n条声音的"主观方位"，记为{θ_S1,θ_S2,θ_S3...θ_Sn}，是一个长度为n的向量，对应图1中的(2)；

例如：假设"主观方位"分别为：-90，-80，-70，-60，-55，-50，-45，-40，-35，-30，-25，-20，-15，-10，-5，0，5，10，15，20，25，30，35，40，45，50，55，60，70，80，90。

步骤三:HRTF库中共有m个不同人头的HRTF数据，选择第x个人头的HRTF数据，按步骤一中的顺序，对步骤一中的三维虚拟声进行客观方位估计，得到第x个人头对声音估计的"客观方位"，记为{θ_Ox1,θ_Ox2,θ_Ox3...θ_Oxn}，是一个长度为n的向量；当所有人头的HRTF数据都进行客观方位估计后，可以得到m个长度为n的向量，对应图1中的(3)；

例如：假设第1个人头的HRTF数据的客观方位为：-90，-80，-70，-60，-55，-50，-45，-40，-35，-30，-25，-20，-15，-10，-5，0，5，10，15，20，25，30，35，40，45，50，55，60，70，80，90。

第2个人头的HRTF数据的客观方位为：-85，-75，-65，-55，-50，-45，-40，-35，-30，-25，-20，-15，-10，-5，0，0，0，5，10，15，20，25，30，35，40，45，50，55，65，75，85

步骤四:根据步骤二中得到的长度为n的"主观方位"向量{θ_S1,θ_S2,θ_S3...θ_Sn}，步骤三中得到的第x个人头估计的长度为n的"客观方位"向量{θ_Ox1,θ_Ox2,θ_Ox3...θ_Oxn}，计算第x个主客观估计误差，例如计算均方误差当所有主客观估计误差都计算完成后，可以得到m个主客观估计误差，对应图1中的(4)；

例如：计算得到第一个主客观估计误差为：0，第二个主客观估计误差为：750/31

步骤五:在m个主客观估计误差中，找到最小的主客观估计误差d_{x_min}，即最大的主客观相似度，其对应人头序号为x_min，该人头的HRTF数据作为听音人员的个性化HRTF，对应图1中的(5)。

例如：找到最小的主客观估计误差为0，对应第一个人头的HRTF，所以选择第一个人头的HRTF数据作为听音人员的个性化HRTF。

以上所述的具体描述，对发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种个性化头相关传递函数的快速匹配方法，其特征在于：包括如下步骤，

步骤一:按随机顺序生成各种方位的三维虚拟声信号；

步骤二:工作人员播放步骤一随机顺序生成的各种方位的三维虚拟声信号；听音人员分别对步骤二播放的三维虚拟声信号进行主观方位估计，得到n个三维虚拟声信号对应的"主观方位"；

步骤三:用客观估计算法结合不同人的头相关传递函数HRTF数据，对步骤一生成的三维虚拟声信号进行客观方位估计，对于不同人的头相关传递函数HRTF，分别得到n个三维虚拟声信号对应的"客观方位"；

步骤四:计算步骤二中"主观方位"和步骤三中"客观方位"的相似度；

2.如权利要求1所述的一种个性化头相关传递函数的快速匹配方法，其特征在于：步骤一具体实现方法为，按随机顺序生成n个不同方位的三维虚拟声信号，记录所述三维虚拟声信号对应的"生成方位"，记为{θ_A1,θ_A2,θ_A3...θ_An}，{θ_A1,θ_A2,θ_A3...θ_An}是一个长度为n的向量。

3.如权利要求2所述的一种个性化头相关传递函数的快速匹配方法，其特征在于：步骤二具体实现方法为，听音人员带上耳机，工作人员按步骤一中的"生成方位"播放n个三维虚拟声信号，听音人员根据听到的三维虚拟声信号，分别估计n个三维虚拟声信号对应的"主观方位"，记为{θ_S1,θ_S2,θ_S3...θ_Sn}，{θ_S1,θ_S2,θ_S3...θ_Sn}是一个长度为n的向量。

4.如权利要求3所述的一种个性化头相关传递函数的快速匹配方法，其特征在于：步骤三具体实现方法为:HRTF库中共有m个不同人头的HRTF数据，选择第x个人头的HRTF数据，按步骤一按随机顺序生成的方位，对步骤一生成的三维虚拟声信号进行客观方位估计，得到第x个人头的HRTF数据对声音估计的"客观方位"，记为{θ_Ox1,θ_Ox2,θ_Ox3...θ_Oxn}，{θ_Ox1,θ_Ox2,θ_Ox3...θ_Oxn}是一个长度为n的向量,当所有人头的HRTF数据都进行客观方位估计后，得到m个长度为n的向量。

5.如权利要求4所述的一种个性化头相关传递函数的快速匹配方法，其特征在于：步骤四具体实现方法为，根据步骤二中得到的长度为n的"主观方位"向量{θ_S1,θ_S2,θ_S3...θ_Sn}，和步骤三中得到的第x个人头估计的长度为n的"客观方位"向量{θ_Ox1,θ_Ox2,θ_Ox3...θ_Oxn}，计算第x个主客观估计误差d_x，当所有主客观估计误差都计算完成后，得到m个主客观估计误差，即得到步骤二中"主观方位"和步骤三中"客观方位"的相似度。

6.如权利要求5所述的一种个性化头相关传递函数的快速匹配方法，其特征在于：步骤五具体实现方法为，在步骤四得到的m个主客观估计误差中，找到最小的主客观估计误差d_{x_min}，即最大的主客观相似度，其对应人头序号为x_min，该人头的HRTF数据作为听音人员的个性化HRTF，进而增强虚拟现实VR音频的方位感和沉浸感。

7.如权利要求4、5或6所述的一种个性化头相关传递函数的快速匹配方法，其特征在于：步骤三所述的客观估计算法为互通道算法或基于ITD、ILD的定位算法。

8.如权利要求5或6所述的一种个性化头相关传递函数的快速匹配方法，其特征在于：步骤四中计算步骤二中"主观方位"和步骤三中"客观方位"的相似度选均方误差，均方根误差或平均绝对误差。