CN106231528A - 基于分段式多元线性回归的个性化头相关传递函数生成系统及方法 - Google Patents

基于分段式多元线性回归的个性化头相关传递函数生成系统及方法 Download PDF

Info

Publication number
CN106231528A
CN106231528A CN201610630472.4A CN201610630472A CN106231528A CN 106231528 A CN106231528 A CN 106231528A CN 201610630472 A CN201610630472 A CN 201610630472A CN 106231528 A CN106231528 A CN 106231528A
Authority
CN
China
Prior art keywords
hrir
module
data
personalized
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610630472.4A
Other languages
English (en)
Other versions
CN106231528B (zh
Inventor
胡瑞敏
陈玮
王晓晨
杨乘
杨玉红
孟恋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201610630472.4A priority Critical patent/CN106231528B/zh
Publication of CN106231528A publication Critical patent/CN106231528A/zh
Application granted granted Critical
Publication of CN106231528B publication Critical patent/CN106231528B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明提供了一种基于分段式多元线性回归的个性化头相关传递函数生成系统及方法。生成函数时,先对样本头相关传递函数信息库中的头相关脉冲响应数据进行时延移除、冗余信息精简、数据分组处理,再对分组数据同样本库中的人体测量参数数据进行多元线性回归分析,建立个性化模型。进行个性化计算时,通过录入个性化对象的人体测量参数信息,经过个性化模型运算得到对应于各方位的头相关脉冲响应数据,通过对人体测量参数进行校准微调最终生成适用于确定对象的个性化头相关传递函数。本发明对头相关传递函数样本库中的头相关脉冲响应直接进行处理,无需对数据进行频域分析,具有运算效率高,数据压缩率高,个性化效果明显的特点。

Description

基于分段式多元线性回归的个性化头相关传递函数生成系统 及方法
技术领域
本发明涉及三维音频效果增强领域,尤其涉及适用于双声道耳机设备的个性化头相关传递函数模型的建立以及利用该模型生成与使用者相匹配的个性化头相关函数的方法。
背景技术
随着虚拟现实(Virtual Reality,简称VR)技术的日渐发展,传统的立体声音效已经无法满足沉浸式声音体验的要求,而基于多声道的三维音频技术由于播放设备昂贵、部署要求复杂等原因很难进入个人使用领域。
头相关传递函数(Head Related Transfer Function,简称HRTF)描述了声音由特定方位传递入人耳的过程中经过耳廓、躯干等人体部位反射、衍射而发生的改变。因此利用HRTF可以计算出来自不同方位的声音传递到人耳时的效果,从而模拟出立体空间声音定位的效果。头相关脉冲响应(Head Related ImpulseResponse,简称HRIR)是HRTF的时域表示。
个性化HRTF可以显著增强三维音频的空间方位感,而HRTF与使用对象密切相关。目前有两种方法获取HRTF数据:一种是通过实验直接测量得到;另一种是通过建立人体参数模型从而计算出相关HRTF。对于实验测量获得HRTF数据,对实验所需设备和环境要求很高,且测量过程非常复杂,对于个体用户难以实施。而对于建立人体参数模型通过计算得到HRTF则存在建模难度大、计算复杂、精度不高的缺点。
发明内容
本发明的目的是提供通过人体测量参数信息而获得个性化HRTF的技术方案,使得个体使用用户能够获得良好的三维音频体验。
为达到上述目的,本发明提供一种适用于双声道耳机设备的,基于HRIR波形分组分析的个性化HRTF生成系统,包括:
模块1:HRIR前端时延移除模块,
模块2:HRIR数据冗余压缩模块,
模块3:HRIR数据分组模块,
模块4:人体测量参数提取模块,
模块5:个性化HRTF算子计算模块,
模块6:个性化HRIR生成模块,
模块7:三维音频生成及测试模块,
模块8:人体测量参数微调模块。
所述模块1:HRIR前端时延移除模块,用于对HRTF样本库中提取的HRIR时域数据进行分析,计算出样本中的双耳间时差信息,并将HRIR样本中由于声波到达人耳而导致的时延空白数据移除。该模块计算所得的信号输出给HRIR数据冗余压缩模块——模块2。
所述模块2:HRIR数据冗余压缩模块,用于对HRIR数据进行分析压缩,以降低后期计算的复杂度。该模块统计并分析出HRIR数据的后端冗余噪声信号,对该类信号进行删除,以达到压缩数据量并提升计算效率的目的。该模块计算所得的数据传输给HRIR数据分组模块——模块3。
所述模块3:HRIR数据分组模块,用于对来自于模块2的HRIR信号进行分组,将长信号切分为小规模的分组信号(可以将长信号切分为多个长度为8个采样的分组信号,在实际应用中分组的数量和每个分组的长度可根据情况进行选择)。分组后的信号传输给个性化HRTF算子计算模块——模块5。
所述模块4:人体测量参数提取模块,用于对HRTF样本库中的人体测量参数样本进行统计分析,提取出同HRIR具有显著相关性的部分人体测量参数数据(包括但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角)。该模块计算所得数据传输给个性化HRTF算子计算模块——模块5.
所述模块5:个性化HRTF算子计算模块,用于建立模块3和模块4输入数据间的映射关系。该模块将模块3输入的数据按照分组信息分别与模块4输入的人体参数信息进行建模分析,最终得到人体测量参数数据与HRIR数据之间的计算算子。利用该算子建立的模型能够通过任意个体的人体测量参数获取其个性化HRIR数据。该模块计算所得数据输入给个性化HRIR生成模块——模块6。
所述模块6:个性化HRIR生成模块,用于将模块5所得个性化算子结合使用用户提供的人体测量参数计算出适用于该用户的个性化HRIR信息。该模块计算所得数据传输给三维音频生成及测试模块——模块7。
所述模块7:三维音频生成及测试模块,用于利用模块6所得个性化HRIR信息对音频进行三维空间模拟,通过用户使用的主观感受情况,可以生成适用于当前用户的个性化HRTF数据;或者通过模块8对人体测量参数进行修正以达到三维音频效果的进一步改善。
所述模块8:人体测量参数微调模块,用于对当前用户提供的人体测量参数进行修正。由于人体参数的测量存在误差,该模块提供了对人体测量参数进行修正的功能。修正后的人体测量参数再次传输给模块6生成调整后的个性化HRIR信息。
本发明还提供了基于HRIR波形分组分析的个性化HRTF生成方法,包括以下步骤:
步骤1,对HRTF样本库按样本对象依次进行HRIR波形分析,得到HRIR中代表声波首次到达耳道对应的波峰位置T0,之后将T0之前的HRIR信号进行删除。
步骤2,对于来源于步骤1的HRIR数据,逐一进行波形分析,得到HRIR中最后波峰或波谷的位置T1,对超出T1长度的HRIR进行截断,对长度不足的HRIR进行补0。
通过步骤1和步骤2,将原始数据中的无效冗余信号删除,以压缩数据量和减少计算量。
步骤3,对来源于步骤2的HRIR进行切割分组。按照逐样本对象、逐声道、逐方位的顺序对来源于步骤2的HRIR进行分组,可根据步骤2中传输数据长度决定分组的大小。
步骤4,对待选用人体测量参数进行参数间的相关性分析,筛除过度相关的人体参数,选用适当的人体测量参数并提取出HRTF样本库中对应的人体测量参数数据。不同的类型的人体参数具有不同的测量复杂度,而人体参数的数量又关系到生成个性化HRTF的精确度,可以根据实际需要对人体参数的选取进行调整。
步骤5,对分组后的HRIR和人体测量参数进行多元线性回归计算。根据来源于步骤3和步骤4的数据,对二者的数据按照HRIR分组的顺序通过多元线性回归建立关系,从而得到各个方位对应的个性化算子。
步骤6,使用者按照步骤4中要求的人体参数提供相应的人体测量参数,通过与步骤5中获得的个性化算子进行计算,得到适用于该使用者的各个方位的个性化HRIR数据。
步骤7,将步骤6得到的个性化HRIR数据同测试音频序列进行卷积运算,即可得到相应方位的三维音频效果。使用者根据主观听音感受可以决定是否需要对个性化参数进行调整,或者选择保存当前个性化信息。
步骤8,对人体测量参数进行微调,再次经由步骤6生成新的个性化HRIR。经过若干次步骤6——步骤7——步骤8的迭代,最终用户可以得到最佳的三维音频体验效果。
所述步骤1中的HRTF样本库至少包括测试人体样本的左右耳HRIR测量数据以及包含人体样本的包括但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角的测量数据。
对其中步骤1中HRTF样本库的原始数据进行声波首次到达耳道前的延时移除,处理对象为针对样本库中所有方位的HRIR进行;该移除算法为对原始HRIR波形进行首次抵达耳道波峰分析,计算获得首次抵达耳道的波峰位置,从而移除该波峰之前的时延数据。
对其中步骤1和步骤2中进行冗余数据删除而实现压缩数据的方法,其方法为对经过移除前端时延的HRIR进行最末波峰/波谷位置分析,删除最末波峰/波谷位置之后的无效数据从而只保留下HRIR波形主体范围。
对其中步骤4中人体测量参数的选择包括但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角,也可以根据计算的复杂度要求选取部分人体测量参数进行计算。
对其中步骤5中的计算方式,强调的是依照分组后的HRIR数据,依次使用多元线性回归分析进行相关计算。
对其中步骤6中用户提供的人体测量参数,其参数的范围应与步骤4涉及的参数一致,其包含但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角,也可以根据计算的复杂度要求选取部分人体测量参数进行计算。
对其中步骤6中生成的个性化HRIR数据,是按照步骤3的HRIR分组信息重新进行重组得到的完整HRIR信息,其重组过程包含按分组信息进行HRIR分组拼接、HRIR前端时延信息添加,HRIR后端冗余信息恢复。
其中步骤6使用的音频测试序列为单声道音频序列,测试所使用的方位信息为预先规划的确定路线信息。
附图说明
图1是本发明实施例的系统结构框图。
图2是本发明实施例的方法流程图。
其中,1:HRIR前端时延移除模块、2:HRIR数据冗余压缩模块、3:HRIR数据分组模块、4:人体测量参数提取模块、5:个性化HRTF算子计算模块、6:个性化HRIR生成模块、7:三维音频生成及测试模块、8:人体测量参数微调模块。
具体实施方式
下面以具体实施例结合附图对本发明的技术方案作进一步说明:
参见图1,本发明提供一种适用于双声道耳机设备的,基于HRIR波形分组分析的个性化HRTF生成系统,该系统包括模块1:HRIR前端时延移除模块、模块2:HRIR数据冗余压缩模块、模块3:HRIR数据分组模块、模块4:人体测量参数提取模块、模块5:个性化HRTF算子计算模块、模块6:个性化HRIR生成模块、模块7:三维音频生成及测试模块、模块8:人体测量参数微调模块。
所述模块1:HRIR前端时延移除模块,用于对HRTF样本库中提取的HRIR时域数据进行分析,计算出样本中的双耳间时差信息,并将HRIR样本中由于声波到达人耳而导致的时延空白数据移除。该模块计算所得的信号传输给模块2。具体实施时,在HRTF样本库中按样本对象分别挑选出该对象所有空间方位的HRIR信息数据,对各方位的HRIR波形进行分析,得到声波首次到达耳道的采样波峰位置,从而确定出HRIR的前端时延,将前端时延的信息进行删除。
所述模块2:HRIR数据冗余压缩模块,用于对HRIR数据进行分析压缩,以降低后期计算的复杂度。该模块统计并分析出HRIR数据的后端冗余噪声信号,对该类信号进行删除,以达到压缩数据量并提升计算效率的目的。该模块计算所得的数据传输给模块3。具体实施时,将来源于模块1的HRIR数据按照逐对象、逐方位的顺序依次进行统计分析,统计出HRIR信号的平均最末波峰位置,再综合考虑HRIR的音频特性选取适当时长作为HRIR的有效时长,将其有效时长后的冗余数据进行删除。
所述模块3:HRIR数据分组模块,用于对来自于模块2的HRIR信号进行分组,将长信号切分为小规模的分组信号。分组后的信号传输给模块5。具体实施时,可根据HRIR有效时长选取不同的分组长度。例如将某样本对象的某方位HRIR信号平均划分为8个分组,则在当前方位应当划分为2×8=16个分组信息,分别对应左右耳的HRIR原始信号,每耳对应8个分组。
所述模块4:人体测量参数提取模块,用于对HRTF样本库中的人体测量参数样本进行统计分析,提取出与HRIR具有密切相关性的部分人体测量参数数据。该模块计算所得数据输入给模块5。具体实施时,对HRTF样本库中的样本对象进行人体测量参数相关度统计,挑选一定数量的人体测量参数传输给模块5与HRIR分组数据进行相关计算。
所述模块5:个性化HRTF算子计算模块,用于建立模块3和模块4输入数据间的映射关系。该模块对模块3输入的数据按照分组信息分别同模块4输入的人体参数信息进行建模分析,最终得到人体测量参数信息与HRIR数据之间的计算算子。利用该算子建立的模型能够使用任意个体的人体测量参数计算出其个性化HRTF数据。该模块计算所得数据传输给模块6。具体实施时,将来自于模块3的全部样本对象的HRIR数据进行汇总,并按照区分左右声道、区分分组类别的形式分别与来源于模块4的样本人体测量参数进行多元线性回归分析,从而获得对应于各声道、各方位的HRTF个性化算子。
所述模块6:个性化HRIR生成模块,用于使用模块5计算所得的个性化算子结合使用用户提供的人体测量参数计算出适用于该用户的个性化HRIR数据。该模块计算所得数据传输给模块7。具体实施时,用户提供相应的人体测量参数,该参数通过个性化算子计算可以得到适用于当前用户的各方位个性化HRIR信息。
所述模块7:三维音频生成及测试模块,用于利用模块6所得个性化HRIR数据对音频进行三维空间模拟,通过用户使用的主观感受情况,可以生成适用于当前用户的个性化HRTF数据;或者通过模块8对人体测量参数进行修正以达到三维音频效果的进一步改善。具体实施时,用户挑选测试单声道音频序列,该测试序列经过来源于模块6的个性化HRIR处理后生成具有三维效果的音效,用户根据自己的主观感受,可以选择是否需要对自己的人体参数进行微调以提升三维音效的定位效果。
所述模块8:人体测量参数微调模块,用于对当前用户提供的人体测量参数进行修正。由于人体参数测量存在误差,该模块提供了对测量参数进行修正的功能。修正后的人体测量参数再次传输给模块6,生成调整后的个性化HRIR数据。具体实施时,用户可以对人体测量参数进行修正,不同参数的修正对生成的三维音效会产生不同的影响,经过多次微调最终可达到最佳三维音效的定位效果。
参见图2,本发明实例提供的个性化HRTF生成方法可以通过计算机进行运行,具体包括以下步骤:
步骤S1,对HRTF样本库按样本对象依次进行HRIR波形分析,得到HRIR中代表声波首次到达耳道时对应的波峰位置T0,实施例中对HRIR进行振幅统计,得到当前HRIR波形中的最大振幅为Fmax,之后从HRIR起始位置依次进行分析,以首次超过0.8×|Fmax|的波峰作为首次抵达耳道的波峰位置,从而确定T0,之后将T0之前的HRIR信号进行删除,并对删除后的HRIR末端进行补0操作,使得HRIR的整体长度保持不变。
步骤S2,对于来源于S1的HRIR数据,逐一进行波形分析,得到HRIR中最后波峰或波谷的位置T1,实施例中对HRIR进行振幅统计,得到当前HRIR波形中的最大振幅为Fmax,之后从HRIR最终位置向前依次进行分析,以首次超过0.2×|Fmax|的振幅绝对值作为最后波峰或波谷位置,从而确定T1,移除T1后的数据。对获得的HRIR数据进行统计,结合HRIR的音频特性,确定最终保留的HRIR信号长度L,对超出长度的HRIR进行截断,对长度不足的HRIR进行补0。实施例中采用的HRIR长度为每声道64个采样点。
步骤S3,对来源于S2的HRIR进行切割分组。实施例中采用的分组数量为8,每声道HRIR长度为64采样点,即每声道HRIR被分为8个分组。
步骤S4,提取出HRTF样本库中的人体参数数据。实施例中提取的人体参数有15个,分别为:头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角。
步骤S5,对分组后的HRIR和人体测量参数进行相关度计算。实施实例中将来源于S3的数据按照区分声道、方位的方式进行组织,每声道每方位存在8个分组的HRIR矩阵,即每个HRIR分组为H(N×R)矩阵(N个样本对象,每个样本对象在当前分组有R个采样点数据);将来源于S4的人体参数组织为A(N×M)矩阵(N个样本对象,每样本对象M个人体参数)。之后进行多元线性回归计算出β(M×R)矩阵使得:
H ^ i = A · β i + E i i = 1 , 2 ... 8 - - - ( 1 )
其中为HRIR分组矩阵,A为人体测量参数矩阵,βi为当前方位的个性化算子矩阵,i为当前分组编号,E为计算所得残差。具体多元线性回归计算方法为现有技术,本发明不予赘述。
步骤S6,使用者提供人体参数,结合S5得到的个性化算子,生成该使用者的个性化HRIR数据。实施实例中按照如下计算规则计算:
H ^ i = A · β i i = 1 , 2...8 - - - ( 2 )
H ^ = H ^ 1 ∪ H ^ 2 ∪ ... ∪ H ^ 8 - - - ( 3 )
其中算式(2)中为HRIR分组矩阵,A为人体测量参数矩阵,βi为当前方位的个性化算子矩阵,i为当前分组编号。算式(3)中为将分组HRIR结果进行拼合得到的个性化HRIR结果。
步骤S7,将S6得到的个性化HRIR数据同测试音频序列进行卷积运算,即可得到相应方位的三维音频效果。实施实例中首先选择一系列连续角度的(如顺时针旋转360度)HRIR数据,然后对测试音频序列按照选取HRIR方位进行分组,之后按照方位顺序对相应的音频分组进行卷积运算得到顺时针旋转一周的三维音效。使用者可根据音效效果选择保存为个性化HRTF或者通过步骤S8进行人体测量参数调整。
W i = P i ⊗ H ^ i - - - ( 4 )
W=∪wi (5)
其中算式(4)中代表卷积运算,Pi代表测试音频分组,代表特定方位的HRIR信息,Wi代表当前音频分组运算得到的三维音频结果,i表示当前的分组编号。算式(5)中Wi代表(4)中所得的三维音频分组,W代表最终的三维音频效果,i表示当前的分组编号,运算符号∪代表将各个三维音频分组进行拼接运算。
步骤S8,由于使用者提供的人体测量参数可能存在一定的测量误差,当使用者在S7步骤中经过主观测试,认为三维音频效果不理想,则可以由S8步骤对人体测量参数进行微调。经过若干次步骤S6——步骤S7——步骤S8的迭代,最终用户可以得到最佳的三维音频体验效果。

Claims (10)

1.一种基于分段式多元线性回归的个性化头相关传递函数生成系统,其特征在于:包括HRIR前端时延移除模块(1)、HRIR数据冗余压缩模块(2)、HRIR数据分组模块(3)、人体测量参数提取模块(4)、个性化HRTF算子计算模块(5)、个性化HRIR生成模块(6)、三维音频生成及测试模块(7)、人体测量参数微调模块(8);其中,HRIR代表头相关脉冲响应,HRTF代表头相关传递函数;
所述模块(1),用于对HRTF样本库中提取的HRIR时域数据进行分析,计算出样本中的双耳间时差信息,并将HRIR样本中由于声波到达人耳而导致的时延空白数据移除;该模块计算所得的信号输出给HRIR数据冗余压缩模块(2);
所述模块(2):用于对HRIR数据进行分析压缩,以降低后期计算的复杂度;该模块统计并分析出HRIR数据的后端冗余噪声信号,对该类数据进行删除,以达到压缩数据量并提升计算效率的目的;该模块计算所得的数据传输给HRIR数据分组模块(3);
所述模块(3):用于对来自于模块(2)的HRIR数据进行分组,将长信号切分为小规模的分组信号;分组后的数据传输给个性化HRTF算子计算模块(5);
所述模块(4):用于对HRTF样本库中的人体测量参数样本进行统计分析,提取出与HRIR具有显著相关性的人体测量参数数据;该模块计算所得数据传输给个性化HRTF算子计算模块(5);
所述模块(5):用于建立模块(3)和模块(4)传入数据间的映射关系;该模块对模块(3)传入的分组数据按照分组信息分别与模块(4)传入的人体参数数据进行建模分析,最终得到人体测量参数数据与HRIR数据之间的计算算子;利用该算子建立的模型能够通过人体测量参数获取其个性化HRIR数据;该模块计算所得数据传输给个性化HRIR生成模块(6);
所述模块(6):用于利用模块(5)所得个性化算子结合使用用户提供的人体测量参数计算出适用于该用户的个性化HRIR信息;该模块计算所得数据传输给模块(7);
所述模块(7):用于利用模块(6)所得个性化HRIR信息对音频进行三维空间模拟,通过用户使用的主观感受情况,生成适用于当前用户的个性化HRTF数据;或者通过模块(8)对人体测量参数进行修正以达到三维音频效果的进一步改善;
所述模块(8):用于对当前用户提供的人体测量参数进行修正;修正后的人体测量参数再次传输给模块(6),生成调整后的个性化HRIR信息。
2.一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于,包括以下步骤:
步骤1,对HRTF样本库按样本对象依次进行HRIR波形分析,得到HRIR中代表声波首次到达耳道对应的波峰位置,之后将之前的HRIR信号进行删除;
步骤2,对于来源于步骤1的HRIR数据,逐一进行波形分析,得到HRIR中最后波峰或波谷的位置,对超出长度的HRIR进行截断,对长度不足的HRIR进行补0;
通过步骤1和步骤2,将原始数据中的无效冗余信号删除,以压缩数据量和减少计算量;
步骤3,对来源于步骤2的HRIR进行切割分组;按照逐样本对象、逐声道、逐方位的顺序对来源于步骤2的HRIR进行分组,根据步骤2中传输数据长度决定分组的大小;
步骤4,对待选用人体测量参数进行参数间的相关性分析,筛除过度相关的人体参数,选用适当的人体测量参数并提取出HRTF样本库中对应的人体测量参数数据;步骤5,对分组后的HRIR和人体测量参数进行多元线性回归计算;根据来源于步骤3和步骤4的数据,对二者的数据按照HRIR分组的顺序通过多元线性回归建立关系,得到各个方位对应的个性化算子;
步骤6,使用者按照步骤4中要求的人体参数提供相应的人体测量参数,通过与步骤5中获得的个性化算子进行计算,得到适用于该使用者的各个方位的个性化HRIR数据;
步骤7,将步骤6得到的个性化HRIR数据与测试音频序列进行卷积运算,即得到相应方位的三维音频效果;使用者根据主观听音感受可以决定是否需要对个性化参数进行调整,或者选择保存当前个性化信息;
步骤8,对人体测量参数进行微调,再次经由步骤6生成新的个性化HRIR;经过多次步骤6——步骤7——步骤8的迭代,最终用户得到最佳的三维音频体验效果。
3.根据权利要求2所述的一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于:所述步骤1中的HRTF样本库至少包括测试人体样本的左右耳HRIR测量数据以及包含人体样本的包括但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角的测量数据。
4.根据权利要求2所述的一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于:对其中步骤1中HRTF样本库的原始数据进行声波首次到达耳道前的延时移除,处理对象为针对样本库中所有方位的HRIR进行;该移除算法为对原始HRIR波形进行首次抵达耳道波峰分析,计算获得首次抵达耳道的波峰位置,从而移除该波峰之前的时延数据。
5.根据权利要求2所述的一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于:对其中步骤1和步骤2中进行冗余数据删除而实现压缩数据的方法,其方法为对经过移除前端时延的HRIR进行最末波峰/波谷位置分析,删除最末波峰/波谷位置之后的无效数据从而只保留下HRIR波形主体范围。
6.根据权利要求2所述的一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于:对其中步骤4中人体测量参数的选择包括但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角,也可以根据计算的复杂度要求选取部分人体测量参数进行计算。
7.根据权利要求2所述的一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于:对其中步骤5中的计算方式,强调的是依照分组后的HRIR数据,依次使用多元线性回归分析进行相关计算。
8.根据权利要求2所述的一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于:对其中步骤6中用户提供的人体测量参数,其参数的范围应与步骤4涉及的参数一致,其包含但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角,也可以根据计算的复杂度要求选取部分人体测量参数进行计算。
9.根据权利要求2所述的一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于:对其中步骤6中生成的个性化HRIR数据,是按照步骤3的HRIR分组信息重新进行重组得到的完整HRIR信息,其重组过程包含按分组信息进行HRIR分组拼接、HRIR前端时延信息添加,HRIR后端冗余信息恢复。
10.根据权利要求2所述的一种基于分段式多元线性回归的个性化头相关传递函数生成方法,其特征在于:其中步骤6使用的音频测试序列为单声道音频序列,测试所使用的方位信息为预先规划的确定路线信息。
CN201610630472.4A 2016-08-04 2016-08-04 基于分段式多元线性回归的个性化头相关传递函数生成系统及方法 Active CN106231528B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610630472.4A CN106231528B (zh) 2016-08-04 2016-08-04 基于分段式多元线性回归的个性化头相关传递函数生成系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610630472.4A CN106231528B (zh) 2016-08-04 2016-08-04 基于分段式多元线性回归的个性化头相关传递函数生成系统及方法

Publications (2)

Publication Number Publication Date
CN106231528A true CN106231528A (zh) 2016-12-14
CN106231528B CN106231528B (zh) 2017-11-10

Family

ID=57546813

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610630472.4A Active CN106231528B (zh) 2016-08-04 2016-08-04 基于分段式多元线性回归的个性化头相关传递函数生成系统及方法

Country Status (1)

Country Link
CN (1) CN106231528B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874592A (zh) * 2017-02-13 2017-06-20 深圳大学 虚拟听觉重放方法及系统
CN107734428A (zh) * 2017-11-03 2018-02-23 中广热点云科技有限公司 一种3d音频播放设备
CN107820158A (zh) * 2017-07-07 2018-03-20 大连理工大学 一种基于头相关脉冲响应的三维音频生成装置
CN108038291A (zh) * 2017-12-05 2018-05-15 武汉大学 一种基于人体参数适配算法的个性化头相关传递函数生成系统及方法
CN108805104A (zh) * 2018-06-29 2018-11-13 中国航空无线电电子研究所 个性化hrtf获取系统
CN110493701A (zh) * 2019-07-16 2019-11-22 西北工业大学 基于稀疏主成分分析的hrtf个人化方法
CN114283832A (zh) * 2021-09-09 2022-04-05 腾讯科技(深圳)有限公司 用于多通道音频信号的处理方法及装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3827603A1 (en) 2018-07-25 2021-06-02 Dolby Laboratories Licensing Corporation Personalized hrtfs via optical capture

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101212843A (zh) * 2006-12-27 2008-07-02 三星电子株式会社 基于个体听觉特性的再现两声道立体声音响的方法和装置
CN101263741A (zh) * 2005-09-13 2008-09-10 皇家飞利浦电子股份有限公司 产生和处理表示hrtf的参数的方法和设备
CN101483797A (zh) * 2008-01-07 2009-07-15 昊迪移通(北京)技术有限公司 一种针对耳机音响系统的人脑音频变换函数(hrtf)的生成方法和设备
CN104205878A (zh) * 2012-03-23 2014-12-10 杜比实验室特许公司 用于通过头相关传输函数的线性混合生成头相关传输函数的方法及系统
US20150010160A1 (en) * 2013-07-04 2015-01-08 Gn Resound A/S DETERMINATION OF INDIVIDUAL HRTFs
WO2015134658A1 (en) * 2014-03-06 2015-09-11 Dolby Laboratories Licensing Corporation Structural modeling of the head related impulse response

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101263741A (zh) * 2005-09-13 2008-09-10 皇家飞利浦电子股份有限公司 产生和处理表示hrtf的参数的方法和设备
US20080253578A1 (en) * 2005-09-13 2008-10-16 Koninklijke Philips Electronics, N.V. Method of and Device for Generating and Processing Parameters Representing Hrtfs
CN101212843A (zh) * 2006-12-27 2008-07-02 三星电子株式会社 基于个体听觉特性的再现两声道立体声音响的方法和装置
CN101483797A (zh) * 2008-01-07 2009-07-15 昊迪移通(北京)技术有限公司 一种针对耳机音响系统的人脑音频变换函数(hrtf)的生成方法和设备
CN104205878A (zh) * 2012-03-23 2014-12-10 杜比实验室特许公司 用于通过头相关传输函数的线性混合生成头相关传输函数的方法及系统
US20150010160A1 (en) * 2013-07-04 2015-01-08 Gn Resound A/S DETERMINATION OF INDIVIDUAL HRTFs
WO2015134658A1 (en) * 2014-03-06 2015-09-11 Dolby Laboratories Licensing Corporation Structural modeling of the head related impulse response

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
任鹏飞: "头相关传递函数个性化方法研究", 《中国优秀硕士学位论文(信息科技辑)》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874592A (zh) * 2017-02-13 2017-06-20 深圳大学 虚拟听觉重放方法及系统
CN106874592B (zh) * 2017-02-13 2020-05-19 深圳大学 虚拟听觉重放方法及系统
CN107820158A (zh) * 2017-07-07 2018-03-20 大连理工大学 一种基于头相关脉冲响应的三维音频生成装置
CN107734428A (zh) * 2017-11-03 2018-02-23 中广热点云科技有限公司 一种3d音频播放设备
CN108038291A (zh) * 2017-12-05 2018-05-15 武汉大学 一种基于人体参数适配算法的个性化头相关传递函数生成系统及方法
CN108038291B (zh) * 2017-12-05 2021-09-03 武汉大学 一种基于人体参数适配算法的个性化头相关传递函数生成系统及方法
CN108805104A (zh) * 2018-06-29 2018-11-13 中国航空无线电电子研究所 个性化hrtf获取系统
CN108805104B (zh) * 2018-06-29 2022-03-08 中国航空无线电电子研究所 个性化hrtf获取系统
CN110493701A (zh) * 2019-07-16 2019-11-22 西北工业大学 基于稀疏主成分分析的hrtf个人化方法
CN114283832A (zh) * 2021-09-09 2022-04-05 腾讯科技(深圳)有限公司 用于多通道音频信号的处理方法及装置

Also Published As

Publication number Publication date
CN106231528B (zh) 2017-11-10

Similar Documents

Publication Publication Date Title
CN106231528A (zh) 基于分段式多元线性回归的个性化头相关传递函数生成系统及方法
Katz Boundary element method calculation of individual head-related transfer function. II. Impedance effects and comparisons to real measurements
CN107027023B (zh) 基于神经网络的VoIP无参考视频通信质量客观评价方法
CN108596016B (zh) 一种基于深度神经网络的个性化头相关传输函数建模方法
He et al. On the preprocessing and postprocessing of HRTF individualization based on sparse representation of anthropometric features
CN105120418B (zh) 双声道3d音频生成装置及方法
CN107820158B (zh) 一种基于头相关脉冲响应的三维音频生成装置
Schönstein et al. HRTF selection for binaural synthesis from a database using morphological parameters
CN102405012A (zh) 对通过稀疏滤波链接的信号的分布式感测
CN112949865A (zh) 一种基于sigma协议的联邦学习贡献度评估方法
Shin et al. Enhanced vertical perception through head-related impulse response customization based on pinna response tuning in the median plane
Li et al. Fast estimation of 2D individual HRTFs with arbitrary head movements
CN111934852A (zh) 一种基于神经网络的aes密码芯片电磁攻击方法及系统
CN104967952A (zh) 一种基于hrtf结构化模型与主观反馈的个性化方法
CN107786936A (zh) 一种声音信号的处理方法及终端
Zhang et al. Personalized hrtf modeling using dnn-augmented bem
Spagnol Auditory model based subsetting of head-related transfer function datasets
CN105759964B (zh) 用于虚拟现实设备的声音输入方法、装置及虚拟现实设备
CN113038356A (zh) 一种个性化hrtf快速建模获取方法
CN109068262B (zh) 一种基于扬声器的声像个性化重现方法及装置
Meng et al. Individualization of head related transfer functions based on radial basis function neural network
CN106874592A (zh) 虚拟听觉重放方法及系统
CN102802111A (zh) 一种输出环绕声的方法和系统
Wang et al. Prediction of head-related transfer function based on tensor completion
Han et al. Time-shared channel identification for adaptive noise cancellation in breath sound extraction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant