CN105979441A

CN105979441A - 一种用于3d音效耳机重放的个性化优化方法

Info

Publication number: CN105979441A
Application number: CN201610333786.8A
Authority: CN
Inventors: 陈锴; 邱小军
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2016-05-17
Filing date: 2016-05-17
Publication date: 2016-09-28
Anticipated expiration: 2036-05-17
Also published as: CN105979441B

Abstract

本发明公开一种用于3D音效耳机重放的个性化优化方法，该方法基于包含人头传递函数(HRTF)数据库，对人的听音效果进行有效的训练，根据训练结果在HRTF数据库中匹配相应HRTF，然后，根据用户的体验效果和使用中的反馈信息微调HRTF，使得匹配并修正后的HRTF更好地满足听音者的3D音效需求，具有一定的个性化功能。该发明解决不同的耳机和不同的听者在使用3D耳机时，重放不同的虚拟声学环境的音效时出现的差异化问题，显著提高3D音效耳机的重放效果。

Description

一种用于3D音效耳机重放的个性化优化方法

技术领域

本发明涉及电声技术领域，具体涉及一种用于3D音效耳机重放的个性化优化方法。

背景技术

3D音效耳机采用相同的人头传递函数(HRTF)对音源进行处理，在耳机的双耳扬声器端产生具有特定声场信息的声信号，使听者感知到具有方位感的声学信号，进而产生3D音效(CN105263075A，一种带方位传感器耳机及其3D声场还原方法，CN 102665156B，一种基于耳机的虚拟3d重放方法)。传统的3D音效耳机所使用的HRTF往往是在专业消声室环境中采用人工头测试系统采集并分析得到的(CN101483797A，一种针对耳机音响系统的人脑音频变换函数(hrtf)的生成方法和设备)。使用该类HRTF虽然能够产生一定的声像信息和方位感，忽略了人耳的差异性，也忽略了耳机本身的差异性，听者对声源的方位信息感知出现偏差，降低了用户的3D音效体验(钟小丽、谢菠荪，2012，个性化头相关传输函数的近似获取——现状和问题，应用声学，31(6)，410-415)。这就需要对听者的HRTF进行必要的修正，甚至专门对特定听者定制HRTF。传统针对特定人的HRTF的专业测量需要使用消声室和人工头测试系统，并且费时又费力，该方法不可能用于消费类产品。因此，如何根据耳机的本身的特性以及使用者的特征进行快速有效的HRTF的定制和修正，提高3D耳机的听音效果，是本发明所要解决的问题。

发明内容

为了解决不同的耳机和不同的听者在使用3D耳机重放不同的虚拟声学环境的音效时出现的差异化问题，本发明提出了一种3D音效耳机重放的个性化优化方案。

本发明的技术方案如下：

一种用于3D音效耳机重放的个性化优化方法，包括：

服务器或本地设备存储了大量的HRTF构成HRTF数据库，这些HRTF涵盖了具有不同生理特征的人的HRTF，这些生理特征包括耳廓形状、头部特征和面部特征；

根据用户的实际听音感受进行训练；

根据训练结果对HRTF数据库进行匹配，选择合适的HRTF；

根据训练结果对匹配得到的HRTF进行微调。

其中，所述3D音效耳机重放个性化方法中，服务器所包含的HRTF数据库，该数据库的HRTF可以是但不限于：

1)通过专业方法实测得到的HRTF；

2)通过模型仿真和数值计算得到的HRTF；

3)根据用户使用反馈信息修正得到的HRTF；

4)其它机构或者用户共享的HRTF。

其中，所述3D音效耳机重放个性化方法包括训练模块，该训练模块可以通过蓝牙或者wifi等无线连接方案与控制台进行连接。

进一步的，控制台可以是硬件控制平台，也可以是在通用终端设备上实现的应用程序。

进一步的，在训练过程中，给耳机加载标准的或通用的HRTF参数，使用预先设定的标准音源放音。

其中，放音的内容包括基于当前HRTF的各个方向的3D音效，包括不同方向、不同仰角和不同的距离信息。在每次放音完成之后，让用户选择或判断感知到的方向、仰角和距离。系统将用户选择得到的参数与实际的参数进行比对，从而从HRTF数据库选择更为适合的HRTF。

进一步的，所示3D音效耳机重放个性化方法的训练模块可以在本地对匹配得到的HRTF进行微调。

进一步的，微调训练的过程可以通过播放相同音源但处理方式不同的声音，让用户选择效果最佳的声音来完成。

进一步的，微调的目标包括但不限于：

1)控制左右耳的时延，改进3D音效的方向和仰角的体验；

2)平衡左右耳能量感知的增益调整；

3)左右耳的交叉混音控制；

4)音效均衡和混响控制。

本发明的有益效果：

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一种用于3D音效耳机重放的个性化优化方法流程图；

图2是本发明一种用于3D音效耳机重放的个性化优化方法结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，其为本发明一种用于3D音效耳机重放的个性化优化方法的流程图。

在步骤[101]中，通过实际测量、仿真和数值计算得到大量的HRTF，在远端云服务器中建立HRTF数据库(3)；

在步骤[102]中，打开训练模块(4)，通过蓝牙或wifi与控制台(2)进行连接，该控制台(2)通过手机应用来实现，预设各种先验参数，并根据该先验参数在3D音效耳机(1)中加载适合的HRTF。

其中，在手机应用中或者耳机(1)中让用户对影响3D音效的生理特征，如耳廓形状、头部特征和面部特征等，进行初步设置。如脸型横向宽、中、窄和纵向长、中、短，共9种组合方式。

在步骤[103]中，用户将训练模块(4)与具有3D音效的耳机(1)相连接，保证训练模块可以实时地更新的HRTF(5)。

在步骤[104]中，在训练模块(4)控制下，耳机(1)通过HRTF对标准音源(6)进行处理，按照顺序播放各种3D音效，在用户未知实际加载的3D音效的方向、仰角和距离的情况下，进行下述操作：

1)让用户通过控制台(2)来选择或判断所感知到的3D音效的方向、仰角和距离；

2)如果3D音效耳机中含有方位角度信息(7)，如耳机包含陀螺仪、加速度计等，则用户通过简单转动头部以确定所感知到的3D音效的方向、仰角。

在步骤[105]中，训练模块(4)实时比对加载的3D音效的方向、仰角和距离与用户选择的3D音效的方向、仰角和距离的差别，进而估算用户可能影响3D音效听音效果的生理特征，这些生理特征包括耳廓形状、头部特征和面部特征等。

在步骤[106]中，训练模块(4)根据实时比对所估算的用户生理特征，这些生理特征包括耳廓形状、头部特征和面部特征等，在HRTF数据库(3)中选择和匹配适合的HRTF，并在用户未觉察的情况下更新HRTF(5)，继续进行训练和比对。当比对的结果正确度较高时，进入步骤[107]，否则，返回步骤[104]。

在步骤[107]中，训练模块(4)通过播放各种声源信号的不同处理结果，让用户通过控制台(2)选择最为满意的结果，根据用户选择结果，微调已匹配的HRTF(5)，使用户3D音效的主观听音感受达到最佳。其中，微调的参数包括：

1)控制左右耳的时延，改进3D音效的方向和仰角的体验；

2)平衡左右耳能量感知的增益调整；

3)左右耳的交叉混音控制；

4)音效均衡和混响控制。

在步骤[108]中，在3D音效耳机(1)和控制台(2)中固化微调后的HRTF，使其作为特定用户的专用个性化HRTF。

以上对本发明实施例所提供的一种用于3D音效耳机重放的个性化优化方法进行了详细介绍，对于本领域的一般技术人员，依据本发明实施例的思想，在具体实施方式及应用范围上均会有改变之处，因此，本说明书内容不应理解为对本发明的限制。

Claims

1.一种用于3D音效耳机重放的个性化优化方法，其特征在于：

该系统包含训练模块(4)，该训练模块(4)用于对用户的人头传递函数(HRTF)进行匹配和修正，使得用户使用3D音效耳机的舒适度和方位感知准确度明显提升。其中，服务器或本地设备存储了大量的HRTF构成HRTF数据库(3)，这些HRTF涵盖了具有不同生理特征的人的HRTF，这些生理特征包括耳廓形状、头部特征和面部特征等；根据用户的实际听音感受进行在线训练；根据训练的效果对服务器中的HRTF数据库(3)进行匹配，匹配最佳的HRTF；根据训练结果对匹配得到的HRTF进行微调。

2.如权利要求1所述的用于3D音效耳机重放的个性化优化方法，其特征在于：

1)在训练模块(4)控制下，耳机(1)通过HRTF对标准音源(6)进行处理，按照顺序播放各种3D音效，在用户未知实际加载的3D音效的方向、仰角和距离的情况下，让用户选择或判断所感知到的3D音效的方向、仰角和距离；

2)训练模块(4)比对加载的3D音效的方向、仰角和距离与用户选择的3D音效的方向、仰角和距离的差别，进而估算用户可能影响3D音效效果的生理特征，这些生理特征包括耳廓形状、头部特征和面部特征等；

3)训练模块(4)根据实时比对所估算的用户生理特征，这些生理特征包括耳廓形状、头部特征和面部特征等，在HRTF数据库(3)中匹配最佳的HRTF；

4)训练模块(4)通过播放各种声源信号的不同处理结果，让用户通过控制台(2)选择最为满意的结果，根据用户选择结果，微调已匹配的HRTF(5)，使用户3D音效的主观听音感受达到最优。