CN104408040A - 头相关函数三维数据压缩方法与系统 - Google Patents

头相关函数三维数据压缩方法与系统 Download PDF

Info

Publication number
CN104408040A
CN104408040A CN201410505395.0A CN201410505395A CN104408040A CN 104408040 A CN104408040 A CN 104408040A CN 201410505395 A CN201410505395 A CN 201410505395A CN 104408040 A CN104408040 A CN 104408040A
Authority
CN
China
Prior art keywords
mtd
mtr
msub
mrow
hrir
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410505395.0A
Other languages
English (en)
Other versions
CN104408040B (zh
Inventor
陈喆
殷福亮
周文颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN201410505395.0A priority Critical patent/CN104408040B/zh
Publication of CN104408040A publication Critical patent/CN104408040A/zh
Application granted granted Critical
Publication of CN104408040B publication Critical patent/CN104408040B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • G06F17/175Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method of multidimensional data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Complex Calculations (AREA)

Abstract

本发明实施例提供一种头相关脉冲响应三维数据压缩处理方法。本发明方法,包括:将HRIR三维数据重建为最小相位化的HRIR;将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;所述处理器将所述低阶FIR形式的仰角平面滤波器以及所述IIR形式的水平角平面滤波器存储至本地缓存。本发明实施例克服了现有技术中HRIR三维数据压缩率低的问题。

Description

头相关函数三维数据压缩方法与系统
技术领域
本发明实施例涉及电通信领域,尤其涉及一种头相关脉冲响应三维数据压缩方法与系统。
背景技术
人类的听觉是三维感知,即不仅能感觉出声音的音调、音强、音色,还能分辨声源方向与距离。为了使不在现场的听众也能获得必要的“临场感”,从而发明了三维音频技术。三维音频技术可再现原始声场全部或部分信息,使听者产生“身临其境”的聆听体验。三维音频可通过双耳声学技术来实现,即采用头相关传递函数(Head Related Transfer function,以下简称:HRTF)对单通道声源信号进行滤波处理,将得到具有方向感的声音使用耳机或一对扬声器进行重放。双耳声学技术可应用于消费电子、移动终端、多媒体系统、虚拟现实、盲人听觉导航、飞行训练等领域。
HRTF的时域表示称为头相关脉冲响应(Head Related Impulse Responses,以下简称:HRIR)。HRIR描述了声音从声源传播到耳内的过程中,人的躯干、头部、耳部等对声音信号具有衍射、反射、遮挡等效应,这可以等效为滤波作用。实际中,通常采用经过精确实验测量得到的HRIR数据库,这种数据库是一个三维矩阵,该数据库存储了大量声源空间位置的HRIR。其中每个HRIR的冲激响应持续时间较长,等效FIR滤波器阶数很高,并且每个人的HRIR都不尽相同。因此,要存储多位测量者的HRIR数据,需要消耗巨大的存储空间。当基于嵌入式设备实现三维虚拟声时,其存储空间更为紧张,成为三维音频技术应用的瓶颈。为此,需要采用HRIR三维数据压缩技术,以难以察觉的听觉定位性能损失为代价,来大幅度减少HRIR数据库的存储空间。但现有技术中,采用HRIR三维数据压缩技术存在有压缩率低的问题。
发明内容
本发明实施例提供一种头相关脉冲响应三维数据压缩方法与系统,以克服现有技术中HRIR三维数据压缩率低的问题。
本发明实施例提供了一种头相关脉冲响应三维数据压缩方法,包括:
处理器将头相关脉冲响应HRIR三维数据重建为最小相位化的HRIR;
所述处理器将所述最小相位化的HRIR解卷为低阶有限冲击响应滤波器FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;
所述处理器将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;
所述处理器将所述低阶FIR形式的仰角平面滤波器以及无限冲击响应滤波器IIR形式的水平角平面滤波器存储至本地缓存。
进一步地,所述处理器将头相关脉冲响应HRIR三维数据重建为最小相位化的HRIR,包括:
选取基准信号,并将所述基准信号与所有HRIR三维数据相关,获取相关信号最大点的位置,所述位置即为每个HRIR对应于基准信号的时延;
移除所述每个HRIR的时延点,与所述基准信号进行对齐。
进一步地,所述将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器,包括:
步骤一、采用公式
c = D 1 D 2 . . . D I × h 1 h 2 . . . h I - - - ( 1 )
提取所述仰角平面的HRIR公用系数CF,其中,所述c为CF,所述h1为HRIR系数,所述I为HRIR系数的个数,所述D1为方位相关系数DF组合成矩阵的形式,采用公式
其中,所述N为N为向量d1的长度,所述d1(0)为HRIR的DF系数d1的第一个分量;
步骤二、通过J个所述CF得到矩阵A∈RM×J,其中,所述R为矩阵空间,所述每个CF系数的维数,所述J为CF系数个数,M为CF系数的长度;
将所述矩阵A作为所述水平角平面的HRIR专用系数DF,采用公式
c = D 1 D 2 . . . D I × h 1 h 2 . . . h I - - - ( 3 )
提取每个水平角平面的CF;
步骤三、通过I个所述CF得到矩阵E∈RN×I,其中,所述N为DF系数的维数,所述R为矩阵空间,所述I为DF个数;
步骤四、将所述矩阵E作为所述仰角平面的DF,采用公式(3)提取每个仰角平面的CF;
步骤五、通过J个所述CF得到矩阵A∈RM×J
步骤六、判断所述矩阵A与矩阵E是否收敛,若否,则重复步骤二至步骤五,若是,则通过矩阵A与矩阵E可得到其中,所述A为携带水平角位置信息的水平角CF矩阵,所述E为携带仰角位置信息的仰角CF矩阵,其中,所述为卷积运算符,所述hij:为HRIR三阶张量矩阵元素,所述i为矩阵行数,所述j为矩阵列数。
进一步地,所述将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器,包括:
计算无限冲击响应滤波器IIR建模重构误差
E i ( z ) = H i ( z ) - H ^ i ( z ) = H i ( z ) - A i ( z ) B ( z ) = H i ( z ) B ( z ) - A i ( z ) B ( z ) , i = 1,2 , . . . , I - - - ( 4 )
其中,所述为IIR滤波器的z域冲击响应函数,所述Hi(z)为FIR滤波器的z域冲击响应函数,所述Ai(z)为IIR滤波器的零点表达式,所述B(z)为IIR滤波器的极点表达式,所述i为第i个FIR滤波器,所述I为FIR滤波器个数;
假设第j次迭代的B(z)已知,当第j+1次迭代时,通过公式
E i ( j + 1 ) ( z ) = H i ( z ) B ( j + 1 ) ( z ) - A i ( j + 1 ) ( z ) B ( j ) ( z ) , i = 1,2 , . . . , I - - - ( 5 )
计算B(j+1)(z)与Ai (j+1)(z);
通过Z反变换将公式(5)转换为矩阵
G ( j ) ( z ) 0 . . . 0 F 1 ( j ) ( z ) 0 G ( j ) ( z ) . . . 0 F 2 ( j ) ( z ) . . . . . . . . . . . . . . . 0 0 . . . G ( j ) ( z ) F I ( j ) ( z ) - a 1 ( j + 1 ) - a 2 ( j + 1 ) . . . - a I ( j + 1 ) b ( j + 1 ) = - f 1 ( j ) - f 2 ( j ) . . . - f I ( j ) - - - ( 6 )
通过所述矩阵(6)求得IIR系数b和a,其中,所述G(j)(z)为B(j)(z)的倒数,所述F1 (j)(z)为Hi(z)与B(j)(z)的比值,所述f1 (j)为F1 (j)(z)的反z变换。
进一步地,所述迭代B(z)的初始值b(0)通过公式
c=(XTX)-1XTh       (7)
求得,其中, c = a 1 ( 0 ) a 2 ( 0 ) . . . a I ( 0 ) b ( 0 ) , h = h 1 h 2 . . . h I , X = Δ 0 . . . 0 0 H 1 0 Δ . . . 0 0 H 2 . . . . . . . . . . . . . . . . . . 0 0 . . . 0 . . . H I
Δ = δ ( 0 ) 0 . . . 0 δ ( 1 ) δ ( 0 ) . . . 0 . . . . . . . . . . . . δ ( L - 1 ) δ ( L - 2 ) . . . δ ( L - P - 1 ) H i = 0 0 . . . 0 h i ( 0 ) 0 . . . 0 h i ( 1 ) h i ( 0 ) . . . 0 . . . . . . . . . . . . h i ( L - 2 ) h i ( L - 3 ) . . . h i ( L - Q - 1 ) ,
P=Q=10,所述c为IIR滤波器零点与极点多项式的系数矩阵,所述X为变换矩阵,所述Δ为单位脉冲函数组成矩阵,所述H为HRIR系数组成矩阵,所述T为转置符号,所述δ(0)为单位脉冲函数,所述L为FIR滤波器长度,所述P为IIR滤波器零点个数,所述hi(0)为第i个HRIR系数的第一个分量,所述I为HRIR系数个数。
本发明实施例一种头相关脉冲响应三维数据压缩系统,包括:
最小相位重建模块,用于将HRIR三维数据重建为最小相位化的HRIR;
解卷模块,用于将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;
建模模块,用于将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;
存储模块,用于将所述低阶FIR形式的仰角平面滤波器以及所述IIR形式的水平角平面滤波器存储至本地缓存。
本发明实施例将HRIR三维数据重建为最小相位化的HRIR;将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;所述处理器将所述低阶FIR形式的仰角平面滤波器以及所述IIR形式的水平角平面滤波器存储至本地缓存。本发明实施例克服了现有技术中HRIR三维数据压缩率低的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明头相关脉冲响应三维数据压缩处理方法的流程图;
图2a为本发明CIPIC数据库中双耳原始HRIR示意图;
图2b为本发明经过最小相位重构后的HRIR示意图;
图3为本发明最小相位HRIR三维数据库分组示意图;
图4为本发明每一组HRIR三维矩阵的2D-CFD解卷结果示意图;
图5a为本发明仰角平面的CF系数提取示意图;
图5b为本发明水平角平面的CF系数提取示意图;
图6为本发明HRIR三维数据压缩处理系统结构示意图;
图7为本发明头相关坐标系示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明头相关脉冲响应三维数据压缩处理方法的流程图,如图1所示,本实施例的方法可以包括:
步骤101、处理器将头相关脉冲响应HRIR三维数据重建为最小相位化的HRIR;
步骤102、所述处理器将所述最小相位化的HRIR解卷为低阶有限冲击响应滤波器FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;
步骤103、所述处理器将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;
步骤104、所述处理器将所述低阶FIR形式的仰角平面滤波器以及无限冲击响应滤波器IIR形式的水平角平面滤波器存储至本地缓存。
进一步地,所述处理器将头相关脉冲响应HRIR三维数据重建为最小相位化的HRIR,包括:
选取基准信号,并将所述基准信号与所有HRIR三维数据相关,获取相关信号最大点的位置,所述位置即为每个HRIR对应于基准信号的时延;
移除所述每个HRIR的时延点,与所述基准信号进行对齐。
进一步地,所述将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器,包括:
步骤一、采用公式
c = D 1 D 2 . . . D I × h 1 h 2 . . . h I - - - ( 1 )
提取所述仰角平面的HRIR公用系数CF,其中,所述c为CF,所述h1为HRIR系数,所述I为HRIR系数的个数,所述D1为方位相关系数DF组合成矩阵的形式,采用公式
其中,所述N为N为向量d1的长度,所述d1(0)为HRIR的DF系数d1的第一个分量;
步骤二、通过J个所述CF得到矩阵A∈RM×J,其中,所述R为矩阵空间,所述每个CF系数的维数,所述J为CF系数个数,M为CF系数的长度;
将所述矩阵A作为所述水平角平面的HRIR专用系数DF,采用公式
c = D 1 D 2 . . . D I × h 1 h 2 . . . h I - - - ( 3 )
提取每个水平角平面的CF系数;
步骤三、通过I个所述CF得到矩阵E∈RN×I,其中,所述N为DF系数的维数,所述R为矩阵空间,所述I为DF个数;
步骤四、将所述矩阵E作为所述仰角平面的DF,采用公式(3)提取每个仰角平面的CF系数;
步骤五、通过J个所述CF得到矩阵A∈RM×J
步骤六、判断所述矩阵A与矩阵E是否收敛,若否,则重复步骤二至步骤五,若是,则通过矩阵A与矩阵E可得到其中,所述A为携带水平角位置信息的水平角CF矩阵,所述E为携带仰角位置信息的仰角CF矩阵,所述为卷积运算符,所述hij:为HRIR三阶张量矩阵元素,所述i为矩阵行数,所述j为矩阵列数。
进一步地,所述将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器,包括:
计算无限冲击响应滤波器IIR建模重构误差
E i ( z ) = H i ( z ) - H ^ i ( z ) = H i ( z ) - A i ( z ) B ( z ) = H i ( z ) B ( z ) - A i ( z ) B ( z ) , i = 1,2 , . . . , I - - - ( 4 )
其中,所述为IIR滤波器的z域冲击响应函数,所述Hi(z)为FIR滤波器的z域冲击响应函数,所述Ai(z)为IIR滤波器的零点表达式,所述B(z)为IIR滤波器的极点表达式,所述i为第i个FIR滤波器,所述I为FIR滤波器个数;
假设第j次迭代的B(z)已知,当第j+1次迭代时,通过公式
E i ( j + 1 ) ( z ) = H i ( z ) B ( j + 1 ) ( z ) - A i ( j + 1 ) ( z ) B ( j ) ( z ) , i = 1,2 , . . . , I - - - ( 5 )
计算B(j+1)(z)与Ai (j+1)(z);
通过Z反变换将公式(5)转换为矩阵
G ( j ) ( z ) 0 . . . 0 F 1 ( j ) ( z ) 0 G ( j ) ( z ) . . . 0 F 2 ( j ) ( z ) . . . . . . . . . . . . . . . 0 0 . . . G ( j ) ( z ) F I ( j ) ( z ) - a 1 ( j + 1 ) - a 2 ( j + 1 ) . . . - a I ( j + 1 ) b ( j + 1 ) = - f 1 ( j ) - f 2 ( j ) . . . - f I ( j ) - - - ( 6 )
通过所述矩阵(5)求得IIR系数b和a,其中,所述G(j)(z)为B(j)(z)的倒数,
所述F1 (j)(z)为Hi(z)与B(j)(z)的比值,所述f1 (j)为F1 (j)(z)的反z变换。
进一步地,所述迭代B(z)的初始值b(0)通过公式
c=(XTX)-1XTh          (7)
求得,其中, c = a 1 ( 0 ) a 2 ( 0 ) . . . a I ( 0 ) b ( 0 ) , h = h 1 h 2 . . . h I , X = Δ 0 . . . 0 0 H 1 0 Δ . . . 0 0 H 2 . . . . . . . . . . . . . . . . . . 0 0 . . . 0 . . . H I
Δ = δ ( 0 ) 0 . . . 0 δ ( 1 ) δ ( 0 ) . . . 0 . . . . . . . . . . . . δ ( L - 1 ) δ ( L - 2 ) . . . δ ( L - P - 1 ) H i = 0 0 . . . 0 h i ( 0 ) 0 . . . 0 h i ( 1 ) h i ( 0 ) . . . 0 . . . . . . . . . . . . h i ( L - 2 ) h i ( L - 3 ) . . . h i ( L - Q - 1 ) ,
P=Q=10,所述c为IIR滤波器零点与极点多项式的系数矩阵,所述X为变换矩阵,所述Δ为单位脉冲函数组成矩阵,所述H为HRIR系数组成矩阵,所述T为转置符号,所述δ(0)为单位脉冲函数,所述L为FIR滤波器长度,所述P为IIR滤波器零点个数,所述hi(0)为第i个HRIR系数的第一个0分量,所述I为HRIR系数个数。
具体来说,最小相位重建的具体步骤为:
将每一个头相关脉冲响应(Head Related Impulse Responses,以下简称:HRIR)重建为最小相位化的HRIR,即去除每个HRIR的时延,也就是去除每个HRIR最开始幅值几乎为零的样本点,如图2a和图2b所示。实现该模块的方法根5据具体情况而定,当HRIR数据库中给出了声音到达双耳的时间,即各个HRIR的时延,那么就根据这组数据将各个HRIR的时延移除。当HRIR数据库没有给出各个HRIR的时延,那么就采用相关法来进行最小相位化重建。
首先,选取一个基准信号,与所有HRIR作相关。相关信号最大点的位置就是各个HRIR相对于基准信号的时延。将各个HRIR前面的时延点移除,进行对齐。基准信号的选取应选择与HRIR相关性强的,例如,将方位θ=0°,φ=0°处HRIR的前面几乎为零的时延点进行人工移除,然后将其作为基准信号。
公用因子分解CFD方法的目的为,对于一组给定的HRIR,表示为hi,i=1,2,…,I,对这组hi进行解卷积,得到c与di,i=1,2,…,I。其中,c称为CF系数,为这组HRIR公用系数;di称为DF系数,为每个HRIR的系数,与每个HRIR的方位相关。两者均为向量,且长度分别为M和N。hi与c、di的关系为:
h i = c ⊗ d i , i = 1,2 , . . . , I - - - ( 8 )
其中,符号表示卷积。将式(8)写为矩阵相乘的形式,则有
hi=Cdi,i=1,2,…,I         (9)
其中,
其中,L为HRIR冲激响应长度,N为向量di的长度,M为向量c长度,三者之间的关系为L=M+N-1。
根据式(9),计算d(n),则有
其中,表示表示矩阵的伪逆。
在得到di后,用下式更新c
c = D 1 D 2 . . . D I × h 1 h 2 . . . h I - - - ( 11 )
其中,Di由di按照C的方式组合而成。
每当计算得到c后,将其带入式即可得到新的di,重复此过程,最终这组HRIR可解卷为CF与DF两部分系数,即c与di,i=1,2,…,I。
对于最小相位化的HRIR三维矩阵对其进行分组,如图3所示,为将其平均分为2组的示意图。本发明将该三维矩阵按照此分组方法分为6组,每一组HRIR仍然是一个三维矩阵,将每一组HRIR水平方向上的HRIR个数记为J,仰角方向上HRIR个数记为I。分组后,对每一组HRIR进行2D-CFD分解,经过2D-CFD后,如图4所示,在每个仰角方向上得到一个水平角平面滤波器其长度为M,在每个仰角方向上得到一个仰角平面滤波器其长度为N。
处理器将最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器的(2D-CFD算法)描述如下:
(1)如图5a所示,根据式(1)提取每个仰角平面的CF系数,j=1,2,…,J,DF系数初始值设为全1。将得到的J个组成矩阵A∈RM×J
(2)如图5b所示,将上一步得到的A作为每个水平角平面DF因子。采用式(2),提取每个水平角平面CF系数i=1,2,…,I。将得到的I个组成矩阵E∈RN×I
(3)如图5a所示,将上一步得到的E作为每个仰角平面的DF因子。采用式(4),提取每个仰角平面的CF系数j=1,2,…,J。将得到的J个CF组成矩阵A∈RM×J
(4)判断矩阵A与E是否收敛,若不收敛,则返回(2)-(3),继续迭代;若收敛,算法结束。
其中,本实施例将M取为189,将N取为12。
经过上述迭代过程后,每一组HRIR三维数据集都被分解为两个矩阵,A∈RM×J与E∈RN×I。计算出A与E后,每一个HRIR可通过下式重建;
h ij : = A ( : , j ) ⊗ E ( : , j ) - - - ( 12 )
其中,表示卷积,A(:,i)为CF矩阵,E(:,J)为DF矩阵。
为进一步减少存储量,将FIR滤波器形式的HRIR建模为共极点IIR滤波器,即零极点模型形式CAPZ的滤波器。FIR滤波器的数学表达式为
H i ( z ) = Σ l = 0 L - 1 c i ( l ) z - l - - - ( 13 )
其中,L为滤波器阶数,l为第l阶自变量,z为z域自变量,ci(l)为滤波器系数,
将其建模为IIR滤波器,数学表达式为
H ^ i ( z ) = A i ( z ) B ( z ) = Σ p = 0 P a i ( p ) z - p 1 - Σ q = 1 Q b ( q ) z - q - - - ( 14 )
其中,P和Q分别为建模后的IIR滤波器的分子多项式阶数和分母多项式阶数,q为第q极点下标b(q)为第q个极点系数,ai(p)为第p个零点系数。
将得到的6组水平角平面滤波器E1、E2、…、E6组,采用基于迭代线性最小二乘的方法。
图6为本发明HRIR三维数据压缩处理系统结构示意图,如图6所示,本实施例的系统,包括3个模块:最小相位重建模块、解卷模块、建模模块。
最小相位重建模块101,用于将HRIR三维数据重建为最小相位化的HRIR;
解卷模块102,用于将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;
建模模块103,用于将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;
存储模块104,用于将所述低阶FIR形式的仰角平面滤波器以及所述IIR形式的水平角平面滤波器存储至本地缓存。
具体来说,最小相位重建模块用于将HRIR重建为最小相位形式的信号,得到最小相位化的HRIR三维数据库;2D-CFD用于将三维HRIR数据集解卷为两组滤波器,一组为低阶FIR形式的仰角平面滤波器,另一组为高阶FIR形式的水平角平面滤波器;CAPZ模块用于将高阶FIR形式的水平角平面滤波器,建模为低阶IIR形式的水平角平面滤波器。已有的HRTF压缩方法压缩效果不够好,得到的数据存储量依然很大。本发明针对HRIR数据库耗费存储量大的问题,采用2D-CFD与基于迭代最小二乘的共极点IIR建模方法对HRIR数据库进行压缩,在相同的重构误差下,采用本发明对HRIR数据库压缩后所需要的存储量更小。
本发明实施例将HRIR三维数据重建为最小相位化的HRIR;将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;所述处理器将所述低阶FIR形式的仰角平面滤波器以及所述IIR形式的水平角平面滤波器存储至本地缓存。本发明实施例克服了现有技术中HRIR三维数据压缩率低的问题。
为了验证本发明的有效性,进行了计算机仿真实验。实验时采用的数据库为加州大学戴维斯分校影像处理计算中心(Center for Image Processing andIntegrated Computing,以下简称:CIPIC)HRIR数据库中测量个体subject_003的双耳HRIR数据,并将双耳数据合并为一个三维矩阵,三维HRIR矩阵尺寸为D1×D2×L,数值为50×50×200。
(1)本方法的压缩率与重构误差
本方案的压缩率DR2DCFD+CAPZ计算如下式所示,DR2DCFD+CAPZ越小,所需要存储量越小,压缩效果越好。
DR 2 DCFD + CAPZ = [ ( P + 1 ) × D 1 + Q ] × Nseg + N × D 2 D 1 × D 2 × L - - - ( 15 )
其中,P为IIR建模的零点个数,Q为IIR建模的极点个数,D1为三维HRIR矩阵的第一维大小,N为DF系数的向量长度,D2为三维HRIR矩阵的第二维大小,Nseg为分组数,本方案中将其设为6。
现有技术一的压缩率为
DR 1 DCFD + BMT = D 2 × M × D 1 + ( P + 1 + Q ) × D 1 D 1 × D 2 × L - - - ( 16 )
现有技术二的压缩率与本方案相同。
文献己经证明,当重构误差小于10%时,HRIR可以保持其声学定位性能不变。据此,当重构误差最大但不超过10%、并且三种重构误差相同的情况下下,本发明与现有技术一、现有技术二的压缩率比较如表1所示。从表1可以看出,与现有技术一、现有技术二相比,本方法压缩率最低。表1为本发明与现有技术压缩率比较表。
表1
方案 压缩率
1D-CFD+BMT(现有技术一) 3.21%
2D-CFD+基于最小二乘共极点IIR建模(现有技术二) 0.70%
2D-CFD+基于迭代最小二乘共极点IIR建模(本发明) 0.60%
(2)主观听音测试
测试HRIR集:两组,分别为CIPIC的subject_003的HRIR集数据,及其压缩重构数据集。
测试主体:4名听觉正常的测试者:2名女性、2名男性;
测试角度(φ,θ):对7个方位进行测试,分别为(0°,-35°)、(0°,0°)、(0°,35°)、(-22.5°,0°)、(33.8°,0°)、(61.9°,0°)、(90°,0°)。由于使用通用HRIR存在前后混淆这种可能性,因此选取的这7个方位均位于前半平面,头相关坐标系如图7所示。
测试音频:将采样率为44.1kHz的0.4秒白噪声与方位相同的两组HRIR分别卷积(原始HRIR、压缩后重建HRIR),得到0.4秒的双耳声。将其重复10次,以0.1s的静音做间隔,得到该方位两组5秒测试音频。
将每个方位两组测试音频分别播放给4名测试者,进行听音比较,选择两组间角度差异。然后根据表2中差异角度查找对应得分。将7个方位的得分做平均,得到表3所示的听音测试结果。由表3可见,三种方案经过压缩、重构后的HRIR在听音方面与原始HRIR区别。表2为感知角度距离选择表。表3为听音测试结果表。
表2
差异角度 描述 相似分数
完全相同 5
0°~5° 刚好可察觉的差异 3
5°~15° 显著的差异 2
15°~30° 非常不同 1
>30° 完全不同 0
表3
(3)计算量
当需要某个方位的HRIR时,需要将最终压缩得到的水平方位IIR滤波器与仰角方位FIR滤波器进行卷积,重构每个方位IIR形式的HRIR,三个方案的计算量如表4所示。从表4可以看出,现有技术一的计算量最少,其次是本方案。表4为计算复杂度比较表。
表4
(1)解卷模块中,也可以采用其他的三维矩阵分解方式。
(2)建模模块中,也可以采用其他的共极点IIR建模方法,如基于均衡模型截断(Balanced Model Truncation,简称:BMT)的共极点IIR建模方法。
本发明采用2D-CFD方法,提高了HRIR三维数据集的压缩效果,降低了数据集的存储量。本发明采用迭代最小二乘方法进行共极点IIR建模,提高了HRIR三维数据集的压缩效果,降低了数据集的存储量,并减少了重构运算量。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (6)

1.一种头相关脉冲响应三维数据压缩方法,其特征在于,包括:
处理器将头相关脉冲响应HRIR三维数据重建为最小相位化的HRIR;
所述处理器将所述最小相位化的HRIR解卷为低阶有限冲击响应滤波器FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;
所述处理器将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;
所述处理器将所述低阶FIR形式的仰角平面滤波器以及无限冲击响应滤波器IIR形式的水平角平面滤波器存储至本地缓存。
2.根据权利要求1所述的方法,其特征在于,所述处理器将头相关脉冲响应HRIR三维数据重建为最小相位化的HRIR,包括:
选取基准信号,并将所述基准信号与所有HRIR三维数据相关,获取相关信号最大点的位置,所述位置即为每个HRIR对应于基准信号的时延;
移除所述每个HRIR的时延点,与所述基准信号进行对齐。
3.根据权利要求1所述的方法,其特征在于,所述将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器,包括:
步骤一、采用公式
c = D 1 D 2 . . . D I × h 1 h 2 . . . h I - - - ( 1 )
提取所述仰角平面的HRIR公用系数CF,其中,所述c为CF,所述h1为HRIR系数,所述I为HRIR系数的个数,所述D1为方位相关系数DF组合成矩阵的形式,采用公式
其中,所述N为向量d1的长度,所述d1(0)为HRIR的DF系数d1的第一个分量;
步骤二、通过J个所述CF得到矩阵A∈RM×J,其中,所述R为矩阵空间,所述每个CF系数的维数,所述J为CF系数个数,M为CF系数的向量长度;
将所述矩阵A作为所述水平角平面的HRIR专用系数DF,采用公式
c = D 1 D 2 . . . D I × h 1 h 2 . . . h I - - - ( 3 )
提取每个水平角平面的CF;
步骤三、通过I个所述CF得到矩阵E∈RN×I,其中,所述N为DF的维数,所述R为矩阵空间,所述I为DF个数;
步骤四、将所述矩阵E作为所述仰角平面的DF,采用公式(3)提取每个仰角平面的CF;
步骤五、通过J个所述CF得到矩阵A∈RM×J
步骤六、判断所述矩阵A与矩阵E是否收敛,若否,则重复步骤二至步骤五,若是,则通过矩阵A与矩阵E可得到其中,所述A为携带水平角位置信息的水平角CF矩阵,所述E为携带仰角位置信息的仰角CF矩阵,所述为卷积运算符,所述hij:为HRIR三阶张量矩阵元素,所述i为矩阵行数,所述j为矩阵列数。
4.根据权利要求1所述的方法,其特征在于,所述将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器,包括:
计算无限冲击响应滤波器IIR建模重构误差
E i ( z ) = H i ( z ) - H ^ i ( z ) = H i ( z ) - A i ( z ) B ( z ) = H i ( z ) B ( z ) - A i ( z ) B ( z ) , i = 1,2 , . . . , I - - - ( 4 )
其中,所述为IIR滤波器的z域冲击响应函数,所述Hi(z)为FIR滤波器的z域冲击响应函数,所述Ai(z)为IIR滤波器的零点表达式,所述B(z)为IIR滤波器的极点表达式,所述i为第i个FIR滤波器,所述I为FIR滤波器个数;
假设第j次迭代的B(z)已知,当第j+1次迭代时,通过公式
E i ( j + 1 ) ( z ) = H i ( z ) B ( j + 1 ) ( z ) - A i ( j + 1 ) ( z ) B ( j ) ( z ) , i = 1,2 , . . . , I - - - ( 5 )
计算B(j+1)(z)与Ai (j+1)(z);
通过Z反变换将公式(5)转换为矩阵
G ( j ) ( z ) 0 . . . 0 F 1 ( j ) ( z ) 0 G ( j ) ( z ) . . . 0 F 2 ( j ) ( z ) . . . . . . . . . . . . . . . 0 0 . . . G ( j ) ( z ) F I ( j ) ( z ) - a 1 ( j + 1 ) - a 2 ( j + 1 ) . . . - a I ( j + 1 ) b ( j + 1 ) = - f 1 ( j ) - f 2 ( j ) . . . - f I ( j ) - - - ( 6 )
通过所述矩阵(6)求得IIR系数b和a,其中,所述G(j)(z)为B(j)(z)的倒数,所述F1 (j)(z)为Hi(z)与B(j)(z)的比值,所述f1 (j)为F1 (j)(z)的反z变换。
5.根据权利要求4所述的方法,其特征在于,所述迭代B(z)的初始值b(0)通过公式
c=(XTX)-1XTh         (7)
求得,其中, c = a 1 ( 0 ) a 2 ( 0 ) . . . a I ( 0 ) b ( 0 ) , h = h 1 h 2 . . . h I , X = Δ 0 . . . 0 0 H 1 0 Δ . . . 0 0 H 2 . . . . . . . . . . . . . . . . . . 0 0 . . . 0 . . . H I
Δ = δ ( 0 ) 0 . . . 0 δ ( 1 ) δ ( 0 ) . . . 0 . . . . . . . . . . . . δ ( L - 1 ) δ ( L - 2 ) . . . δ ( L - P - 1 ) H i = 0 0 . . . 0 h i ( 0 ) 0 . . . 0 h i ( 1 ) h i ( 0 ) . . . 0 . . . . . . . . . . . . h i ( L - 2 ) h i ( L - 3 ) . . . h i ( L - Q - 1 ) ,
P=Q=10,所述c为IIR滤波器零点与极点多项式的系数矩阵,所述X为变换矩阵,所述Δ为单位脉冲函数组成矩阵,所述H为HRIR系数组成矩阵,所述T为转置符号,所述δ(0)为单位脉冲函数,所述L为FIR滤波器长度,所述P为IIR滤波器零点个数,所述hi(0)为第i个HRIR系数的第一个分量,所述I为HRIR系数个数。
6.一种头相关脉冲响应三维数据压缩系统,其特征在于,包括:
最小相位重建模块,用于将HRIR三维数据重建为最小相位化的HRIR;
解卷模块,用于将所述最小相位化的HRIR解卷为低阶FIR形式的仰角平面滤波器、高阶FIR形式的水平角平面滤波器;
建模模块,用于将所述高阶FIR形式的水平角平面滤波器建模为低阶IIR形式的水平角平面滤波器;
存储模块,用于将所述低阶FIR形式的仰角平面滤波器以及所述IIR形式的水平角平面滤波器存储至本地缓存。
CN201410505395.0A 2014-09-26 2014-09-26 头相关函数三维数据压缩方法与系统 Active CN104408040B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410505395.0A CN104408040B (zh) 2014-09-26 2014-09-26 头相关函数三维数据压缩方法与系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410505395.0A CN104408040B (zh) 2014-09-26 2014-09-26 头相关函数三维数据压缩方法与系统

Publications (2)

Publication Number Publication Date
CN104408040A true CN104408040A (zh) 2015-03-11
CN104408040B CN104408040B (zh) 2018-01-09

Family

ID=52645672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410505395.0A Active CN104408040B (zh) 2014-09-26 2014-09-26 头相关函数三维数据压缩方法与系统

Country Status (1)

Country Link
CN (1) CN104408040B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874592A (zh) * 2017-02-13 2017-06-20 深圳大学 虚拟听觉重放方法及系统
CN107094277A (zh) * 2016-02-18 2017-08-25 谷歌公司 用于在虚拟扬声器阵列上渲染音频的信号处理方法和系统
CN107820158A (zh) * 2017-07-07 2018-03-20 大连理工大学 一种基于头相关脉冲响应的三维音频生成装置
CN108596016A (zh) * 2018-03-06 2018-09-28 北京大学 一种基于深度神经网络的个性化头相关传输函数建模方法
US10142755B2 (en) 2016-02-18 2018-11-27 Google Llc Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
CN114235411A (zh) * 2021-12-28 2022-03-25 频率探索智能科技江苏有限公司 轴承外圈缺陷定位方法
CN114235414A (zh) * 2021-12-28 2022-03-25 频率探索智能科技江苏有限公司 适用于外圈缺陷定位诊断的信号处理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664010A (zh) * 2012-05-04 2012-09-12 山东大学 一种基于多因素频率位移不变特征的鲁棒说话人辨别方法
CN102982805A (zh) * 2012-12-27 2013-03-20 北京理工大学 一种基于张量分解的多声道音频信号压缩方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102664010A (zh) * 2012-05-04 2012-09-12 山东大学 一种基于多因素频率位移不变特征的鲁棒说话人辨别方法
CN102982805A (zh) * 2012-12-27 2013-03-20 北京理工大学 一种基于张量分解的多声道音频信号压缩方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
EVRIM ACAR: "A scalable optimization approach for fitting canonical tensor decompositions", 《JOURNAL OF CHEMOMETRICS》 *
ZHIXIN WANG: "Two-Dimension Common Factor Decomposition of Head-Related Impulse Response", 《IEEE SIGNAL PROCESSING LETTERS》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107094277A (zh) * 2016-02-18 2017-08-25 谷歌公司 用于在虚拟扬声器阵列上渲染音频的信号处理方法和系统
US10142755B2 (en) 2016-02-18 2018-11-27 Google Llc Signal processing methods and systems for rendering audio on virtual loudspeaker arrays
CN107094277B (zh) * 2016-02-18 2019-02-05 谷歌有限责任公司 用于在虚拟扬声器阵列上渲染音频的信号处理方法和系统
CN106874592A (zh) * 2017-02-13 2017-06-20 深圳大学 虚拟听觉重放方法及系统
CN106874592B (zh) * 2017-02-13 2020-05-19 深圳大学 虚拟听觉重放方法及系统
CN107820158A (zh) * 2017-07-07 2018-03-20 大连理工大学 一种基于头相关脉冲响应的三维音频生成装置
CN108596016A (zh) * 2018-03-06 2018-09-28 北京大学 一种基于深度神经网络的个性化头相关传输函数建模方法
CN108596016B (zh) * 2018-03-06 2021-11-09 北京大学 一种基于深度神经网络的个性化头相关传输函数建模方法
CN114235411A (zh) * 2021-12-28 2022-03-25 频率探索智能科技江苏有限公司 轴承外圈缺陷定位方法
CN114235414A (zh) * 2021-12-28 2022-03-25 频率探索智能科技江苏有限公司 适用于外圈缺陷定位诊断的信号处理方法
CN114235414B (zh) * 2021-12-28 2023-08-04 频率探索智能科技江苏有限公司 适用于外圈缺陷定位诊断的信号处理方法

Also Published As

Publication number Publication date
CN104408040B (zh) 2018-01-09

Similar Documents

Publication Publication Date Title
CN104408040B (zh) 头相关函数三维数据压缩方法与系统
CN104041074B (zh) 处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置
Kulkarni et al. Infinite-impulse-response models of the head-related transfer function
Betlehem et al. Theory and design of sound field reproduction in reverberant rooms
US9113281B2 (en) Reconstruction of a recorded sound field
CN101512899B (zh) 滤波器压缩器以及用于产生压缩子带滤波器冲激响应的方法
CN103931211B (zh) 处理刚性球上的球面麦克风阵列的信号的方法及装置
Tylka et al. Soundfield navigation using an array of higher-order ambisonics microphones
Tylka et al. Fundamentals of a parametric method for virtual navigation within an array of ambisonics microphones
TW201110639A (en) Distributed sensing of signals linked by sparse filtering
Kitić et al. Physics-driven inverse problems made tractable with cosparse regularization
US20130282386A1 (en) Multi-channel encoding and/or decoding
EP2517201B1 (en) Sparse audio processing
CN106162499A (zh) 一种头相关传递函数的个性化方法及系统
Spors et al. Efficient realization of model-based rendering for 2.5-dimensional near-field compensated higher order Ambisonics
Richter et al. Spherical harmonics based HRTF datasets: Implementation and evaluation for real-time auralization
CN110301003B (zh) 改进解码用实际三维声内容的子频带中的处理
CN104318064B (zh) 基于典范多元分解的头相关脉冲响应三维数据压缩方法
CN107301153B (zh) 一种基于自适应傅里叶分解的头相关传输函数建模方法
Adams et al. State-space synthesis of virtual auditory space
Zaar Phase unwrapping for spherical interpolation of headrelated transfer functions
CN111193990B (zh) 一种抗高频空间混叠的3d音频系统及实现方法
CN107222808B (zh) 一种高保真扬声器重放系统设计方法
Shekarchi et al. Compression of head-related transfer function using autoregressive-moving-average models and Legendre polynomials
Koyama et al. Effect of multipole dictionary in sparse sound field decomposition for super-resolution in recording and reproduction

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant