CN107147975A - 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 - Google Patents
一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 Download PDFInfo
- Publication number
- CN107147975A CN107147975A CN201710283323.XA CN201710283323A CN107147975A CN 107147975 A CN107147975 A CN 107147975A CN 201710283323 A CN201710283323 A CN 201710283323A CN 107147975 A CN107147975 A CN 107147975A
- Authority
- CN
- China
- Prior art keywords
- spherical harmonic
- loudspeaker
- sound source
- harmonic signal
- spherical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000001788 irregular Effects 0.000 title claims abstract description 8
- 230000000644 propagated effect Effects 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 2
- 240000004282 Grewia occidentalis Species 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2205/00—Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
- H04R2205/026—Single (sub)woofer with two or more satellite loudspeakers for mid- and high-frequency band reproduction driven via the (sub)woofer
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法。本方法为:1)根据声源位置得到该声源的球谐信号;根据扬声器摆放位置得到扬声器的球谐信号;2)将声源的球谐信号和扬声器的球谐信号匹配投影,得到各扬声器的增益g。本发明解决了Ambisonics声重放系统对扬声器摆放位置固定的要求,重构声场稳定。
Description
技术领域
本发明属于虚拟声重放技术领域,本发明提出了一种新的Ambisonics解码方法匹配投影法,解决了Ambisonics声重放系统对扬声器摆放位置固定的要求。
背景技术
3D多媒体的时代已经到来,3D音视频系统也正迅速走向电影院,家庭影院,及手持终端设备,成为全球各大电子制造商的新焦点。环绕声重放技术在3D音视频系统占有重要的地位,目前主流的技术包括VBAP(Vector Base Amplitude Panning)、Ambisonics,WFS(WaveField Synthetize)。其中Ambisonics方法是1973年由牛津大学的Michael Gerzon提出的,主要是通过基于球谐函数对原始声场的分解与重建来控制虚拟声源的方位。
基于Ambisonics声重放系统技术特点是编解码分离,在编码阶段,根据虚拟声源的方向得到各球谐基函数的投影值;在声场重放阶段,根据重发扬声器的数量、方位和编码环节得到的投影值,得到不同通道信号的输出增益,把此增益输送给对应的扬声器重发,达到在扬声器阵列中心位置处重建源声场的目的。
尽管Ambisonics方法编解码分离的方案给3D声音录音和重放带来了很大的优势,但在走向市场的道路中却遇到困难,原因之一,Ambisonics阶数确定,扬声器数量和摆放位置不灵活。本发明提出一种应用于Ambisonics声重放系统的解码方法,解决扬声器摆放相对固定的情况。
发明内容
针对现有技术中存在的技术问题,本发明的目的在于提供一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法。
本发明的具体思想是根据声源位置得出球谐函数分量即声源的球谐信号,由扬声器摆放位置得到球谐函数分量即扬声器的球谐信号。将声源的球谐信号和扬声器的球谐信号相关得到各扬声器的增益gl。
本发明的技术方案为:
一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法,其步骤为:
1)根据声源位置得到该声源的球谐信号;根据扬声器摆放位置得到扬声器的球谐信号;
2)将声源的球谐信号和扬声器的球谐信号匹配投影,得到各扬声器的增益。
进一步的,根据各扬声器球谐信号与声源球谐信号的相关系数,选出最匹配的扬声器;然后将声源的球谐信号减去当前最匹配的扬声器的球谐信号,解出残差信号;然后将该残差信号赋值给声源的球谐信号;然后在剩余扬声器中继续挑选最匹配的扬声器并求解其增益,直至所有扬声器的增益均被匹配完毕,解码完成。
进一步的,根据公式将声源的球谐信号和扬声器的球谐信号相关;其中,为声源的球谐信号,声源摆放位置为和振幅为s;为扬声器的球谐信号,扬声器摆放位置为n为求解所述球谐信号时所用Fourier-Bessel级数展开式的阶数,m为求解所述球谐信号时所用Fourier-Bessel级数展开式的次数,l=1....L,L为扬声器个数。
进一步的,根据声源位置得到该声源的球谐信号的方法为:首先建立声源传播的振幅为s的平面波传播到内部没有声源的有限空间的波动方程为其中,为声源的球谐函数, 为角波数,λ为波长,θ为所求点的水平角,为所求点的高度角,r为所求点离圆心距离,jm(kr)为一类球贝塞尔函数;然后求解该波动方程得到声源的球谐信号
进一步的,根据扬声器摆放位置得到扬声器的球谐信号的方法为:首先建立扬声器传播的振幅为s的平面波传播到内部没有声源的有限空间的波动方程为 其中,为声源的球谐函数, 为角波束,λ为波长,θ为所求点的水平角,为所求点的高度角,r为所求点离圆心距离,jm(kr)为一类球贝塞尔函数;然后求解该波动方程得到扬声器的球谐信号
进一步的,将当前与声源球谐函数相关系数最大的扬声器作为最匹配的扬声器。
进一步的,各所述扬声器为规则摆放。
进一步的,各所述扬声器为不规则摆放。
与现有技术相比,本发明的积极效果为:
现有技术一般采用矩阵求逆方法进行解码,当扬声器摆放不规则时,现有技术重构出的声场不稳定,而本发明在扬声器摆放不规则时,重构声场稳定,具体效果对比数据如表1所示。
附图说明
图1为空间坐标系;
图2为发明流程框图;
图3为匹配投影解码方法
图4为高度角0度时各水平角指向图;
(a)水平角0度,(b)水平角60度,(c)水平角120度,
(d)水平角180度,(e)水平角240度,(f)水平角300度;
图5为高度角20度时各水平角指向图;
(a)水平角0度,(b)水平角60度,(c)水平角120度,
(d)水平角180度,(e)水平角240度,(f)水平角300度;
图6为被试1主观测试结果图;
(a)仰角0度,(b)仰角20度;
图7为被试2主观测试结果图;
(a)仰角0度,(b)仰角20度。
具体实施方式
下面结合附图对本发明进行进一步详细描述。
图2为发明流程图分为三个步骤
1.已知声源摆放位置和振幅s,假设声源发出平面波,在中心内部无声源区域的声场可以用球谐函数分量表达,根据平面波传播特性和波动方程Fourier-Bessel级表达,球谐信号由球谐函数分解得到。
2.已知扬声器摆放位置假设扬声器发出的为平面波,在中心内部无声源区域的声场可以用球谐函数分量表达,根据平面波传播特性和波动方程Fourier-Bessel级表达,球谐函数分量由球谐函数分解得到
3.将声源的球谐函数分量Y和各扬声器球谐函数分量做相关的到各扬声器增益g1,g2,…gL。
步骤1:虚拟声源的Ambisonics编码
声源在(x0,y0,z0)处即三维空间中任意一点的波动方程为:
其中是拉普拉斯算子,p是声压,t代表时间,c是声波的传播速度,r为所求点离圆心距离,θ为所求点的水平角,为所求点的高度角,为角波束,为波长。在如图1球坐标系中,根据声波的三维波动方程可以得到声压关于Fourier-Bessel级数形式的解:
式中n代表展开式的阶数,m代表展开式的次数,jm(kr)为一类球贝塞尔函数;球谐函数分量即为本发明所需要的球谐信号,为待求项。为球谐函数基函数,它有多种表示形式,在这里本发明由下式表示:
Nmn-斯密特半正则化系数
式中δ0,n——Delta函数,当n=0时,δ0,0=1
虚拟声源在处无源区域的声压可以用上面的公式(2)表示。
假设声源传播的是平面波,根据平面声波可以在球坐标系中用球谐函数无限展开的原理,振幅为s的平面波传播到内部没有声源的有限空间∩的波动方程可以写成:
由式(2)与(6)可得
在一维情况下,下列方程展示了处于相位角为θ的声源发出的信号s的编码规则:
前三行定义了水平面上的一阶声场编码,由三个成分组成:W,X,Y,即为水平面的一阶贝塞尔公式。阶数每增加一阶,都会有更多的高阶立体声(HOA)编码方程以及相关的贝塞尔系数。由于声源彼此之间的距离较近,而一阶编码对于相位的分辨率较低,这就导致了编码的精确度不够的问题。通过引进高阶立体声编码方程,使分辨率更高的编码成为可能。
步骤2:扬声器的Ambisonics编码
假设扬声器发出的波也为平面波,方向为传播到内部没有声源的有限空间∩的波动方程可以写成:
由式(2)与(7)可得
为声源方向,为声场中任意位置方向,为球谐函数分量即球谐信号。
步骤3:利用匹配投影法求解扬声器增益
匹配投影解码法的具体做法见图3,首先根据声源方向得到声源的球谐信号由扬声器摆放位置得到各扬声器的球谐信号其次,计算声源球谐信号与各扬声器的球谐信号的相关,选出最匹配的扬声器并求其增益gL。
然后,将声源球谐信号减去最匹配扬声器球谐信号解出残差信号。
随后,把残差信号赋值给声源的球谐信号,继续在剩余扬声器中挑选最匹配的扬声器并求解其系数,重复执行,直至所有扬声器的系数均被匹配完毕,解码完成。
4声场重构评价
客观评测
本方法针对扬声器不规则摆放,摆放规则与标准环绕声22.2的摆放位置相同。声源位置选择仰角0度,20度,水平角0度到360以60度为间隔。用指向图表示匹配投影法的声场重构效果。指向图如图4、5所示。
主观评测
本方法针对扬声器不规则摆放,摆放规则与标准环绕声22.2的摆放位置相同。声源位置选择仰角0度,20度,水平角0度到360以60度为间隔。分别用矩阵求逆法和匹配投影法解码,2名被试判别方向,总体误差如表1。
表1为总体误差表
图6和图7中三角形为匹配投影法主观评测结果,四角星为矩阵求逆法主观评测结果。
综合主客观评测结果,扬声器摆放不规则的情况下匹配投影法也能很好复现原声场,并且主观实验结果同时表明,匹配投影法的效果好于矩阵求逆法。
Claims (8)
1.一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法,其步骤为:
1)根据声源位置得到该声源的球谐信号;根据扬声器摆放位置得到扬声器的球谐信号;
2)将声源的球谐信号和扬声器的球谐信号匹配投影,得到各扬声器的增益g。
2.如权利要求1所述的方法,其特征在于,所述步骤2)中,根据各扬声器球谐函数与声源球谐函数的相关系数,选出最匹配的扬声器;然后将声源的球谐信号减去当前最匹配的扬声器的球谐信号,解出残差信号;然后将该残差信号赋值给声源的球谐信号;然后在剩余扬声器中继续挑选最匹配的扬声器并求解其增益,直至所有扬声器的增益均被匹配完毕,解码完成。
3.如权利要求2所述的方法,其特征在于,根据公式将声源的球谐信号和扬声器的球谐信号相关;其中,为声源的球谐信号,声源摆放位置为和振幅为s;为扬声器的球谐信号,扬声器摆放位置为n为求解所述球谐信号时所用Fourier-Bessel级数展开式的阶数,m为求解所述球谐信号时所用Fourier-Bessel级数展开式的次数,l=1….L,L为扬声器个数。
4.如权利要求3所述的方法,其特征在于,根据声源位置得到该声源的球谐信号的方法为:首先建立声源传播的振幅为s的平面波传播到内部没有声源的有限空间的波动方程为其中,为声源的球谐函数, 为角波数,λ为波长,θ为所求点的水平角,为所求点的高度角,r为所求点离圆心距离,jm(kr)为一类球贝塞尔函数;然后求解该波动方程得到声源的球谐信号
5.如权利要求3所述的方法,其特征在于,根据扬声器摆放位置得到扬声器的球谐信号的方法为:首先建立扬声器传播的振幅为s的平面波传播到内部没有声源的有限空间的波动方程为其中,为声源的球谐函数, 为角波束,λ为波长,θ为所求点的水平角,为所求点的高度角,r为所求点离圆心距离,jm(kr)为一类球贝塞尔函数;然后求解该波动方程得到扬声器的球谐信号
6.如权利要求2所述的方法,其特征在于,将与声源球谐函数相关系数最大的扬声器作为最匹配的扬声器。
7.如权利要求1~6任一所述的方法,其特征在于,各所述扬声器为规则摆放。
8.如权利要求1~6任一所述的方法,其特征在于,各所述扬声器为不规则摆放。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710283323.XA CN107147975B (zh) | 2017-04-26 | 2017-04-26 | 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710283323.XA CN107147975B (zh) | 2017-04-26 | 2017-04-26 | 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107147975A true CN107147975A (zh) | 2017-09-08 |
CN107147975B CN107147975B (zh) | 2019-05-14 |
Family
ID=59775330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710283323.XA Active CN107147975B (zh) | 2017-04-26 | 2017-04-26 | 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107147975B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108419174A (zh) * | 2018-01-24 | 2018-08-17 | 北京大学 | 一种基于扬声器阵列的虚拟听觉环境可听化实现方法及系统 |
CN110225431A (zh) * | 2018-03-02 | 2019-09-10 | 宏碁股份有限公司 | 低音扬声器的扩展系统及其设计方法 |
CN110708647A (zh) * | 2019-10-29 | 2020-01-17 | 扆亮海 | 一种球面分配引导的数据匹配立体声场重构方法 |
US10645485B2 (en) | 2018-02-07 | 2020-05-05 | Acer Incorporated | Extension system of woofer and design method thereof |
CN111263291A (zh) * | 2020-01-19 | 2020-06-09 | 西北工业大学太仓长三角研究院 | 一种基于高阶麦克风阵列的声场重构方法 |
CN111684822A (zh) * | 2018-02-09 | 2020-09-18 | 谷歌有限责任公司 | 环境立体声的定向增强 |
CN113314129A (zh) * | 2021-04-30 | 2021-08-27 | 北京大学 | 一种适应环境的声场重放空间解码方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101977349A (zh) * | 2010-09-29 | 2011-02-16 | 华南理工大学 | Ambisonic声重发系统解码的优化改进方法 |
WO2011117399A1 (en) * | 2010-03-26 | 2011-09-29 | Thomson Licensing | Method and device for decoding an audio soundfield representation for audio playback |
CN102333265A (zh) * | 2011-05-20 | 2012-01-25 | 南京大学 | 一种基于连续声源概念的三维局部空间声场重放方法 |
CN103453980A (zh) * | 2013-08-08 | 2013-12-18 | 大连理工大学 | 一种基于压缩感知的声场参数获取方法 |
CN103888889A (zh) * | 2014-04-07 | 2014-06-25 | 北京工业大学 | 一种基于球谐展开的多声道转换方法 |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
CN104349267A (zh) * | 2009-02-04 | 2015-02-11 | 理查德·福塞 | 声音系统 |
US20150289059A1 (en) * | 2014-04-07 | 2015-10-08 | Harman Becker Automotive Systems Gmbh | Adaptive filtering |
CN105072557A (zh) * | 2015-08-11 | 2015-11-18 | 北京大学 | 一种三维环绕声重放系统的扬声器环境自适应校准方法 |
CN106303843A (zh) * | 2016-07-29 | 2017-01-04 | 北京工业大学 | 一种多区域不同语音声源的2.5d重放方法 |
-
2017
- 2017-04-26 CN CN201710283323.XA patent/CN107147975B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104349267A (zh) * | 2009-02-04 | 2015-02-11 | 理查德·福塞 | 声音系统 |
WO2011117399A1 (en) * | 2010-03-26 | 2011-09-29 | Thomson Licensing | Method and device for decoding an audio soundfield representation for audio playback |
CN101977349A (zh) * | 2010-09-29 | 2011-02-16 | 华南理工大学 | Ambisonic声重发系统解码的优化改进方法 |
CN102333265A (zh) * | 2011-05-20 | 2012-01-25 | 南京大学 | 一种基于连续声源概念的三维局部空间声场重放方法 |
EP2765791A1 (en) * | 2013-02-08 | 2014-08-13 | Thomson Licensing | Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field |
CN104995926A (zh) * | 2013-02-08 | 2015-10-21 | 汤姆逊许可公司 | 用于确定在声场的高阶高保真立体声表示中不相关的声源的方向的方法和装置 |
CN103453980A (zh) * | 2013-08-08 | 2013-12-18 | 大连理工大学 | 一种基于压缩感知的声场参数获取方法 |
CN103888889A (zh) * | 2014-04-07 | 2014-06-25 | 北京工业大学 | 一种基于球谐展开的多声道转换方法 |
US20150289059A1 (en) * | 2014-04-07 | 2015-10-08 | Harman Becker Automotive Systems Gmbh | Adaptive filtering |
CN105072557A (zh) * | 2015-08-11 | 2015-11-18 | 北京大学 | 一种三维环绕声重放系统的扬声器环境自适应校准方法 |
CN106303843A (zh) * | 2016-07-29 | 2017-01-04 | 北京工业大学 | 一种多区域不同语音声源的2.5d重放方法 |
Non-Patent Citations (1)
Title |
---|
HAOHAI SUN,ET AL: "Optimal Higher Order Ambisonics Encoding With Predefined Constraints", 《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108419174A (zh) * | 2018-01-24 | 2018-08-17 | 北京大学 | 一种基于扬声器阵列的虚拟听觉环境可听化实现方法及系统 |
CN108419174B (zh) * | 2018-01-24 | 2020-05-22 | 北京大学 | 一种基于扬声器阵列的虚拟听觉环境可听化实现方法及系统 |
US10645485B2 (en) | 2018-02-07 | 2020-05-05 | Acer Incorporated | Extension system of woofer and design method thereof |
CN111684822A (zh) * | 2018-02-09 | 2020-09-18 | 谷歌有限责任公司 | 环境立体声的定向增强 |
CN111684822B (zh) * | 2018-02-09 | 2022-03-18 | 谷歌有限责任公司 | 环境立体声的定向增强 |
CN110225431A (zh) * | 2018-03-02 | 2019-09-10 | 宏碁股份有限公司 | 低音扬声器的扩展系统及其设计方法 |
CN110708647A (zh) * | 2019-10-29 | 2020-01-17 | 扆亮海 | 一种球面分配引导的数据匹配立体声场重构方法 |
CN110708647B (zh) * | 2019-10-29 | 2020-12-25 | 扆亮海 | 一种球面分配引导的数据匹配立体声场重构方法 |
CN111263291A (zh) * | 2020-01-19 | 2020-06-09 | 西北工业大学太仓长三角研究院 | 一种基于高阶麦克风阵列的声场重构方法 |
CN111263291B (zh) * | 2020-01-19 | 2021-06-11 | 西北工业大学太仓长三角研究院 | 一种基于高阶麦克风阵列的声场重构方法 |
CN113314129A (zh) * | 2021-04-30 | 2021-08-27 | 北京大学 | 一种适应环境的声场重放空间解码方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107147975B (zh) | 2019-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107147975B (zh) | 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 | |
US11948583B2 (en) | Method and device for decoding an audio soundfield representation | |
WO2017182714A1 (en) | Merging audio signals with spatial metadata | |
KR20220044973A (ko) | 다중-층 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념 | |
CN109314832A (zh) | 音频信号处理方法和设备 | |
US11122381B2 (en) | Spatial audio signal processing | |
JP2023164970A (ja) | 情報処理装置および方法、並びにプログラム | |
AU2018201133B2 (en) | Method and device for decoding an audio soundfield representation for audio playback | |
AU2014265108A1 (en) | Method and device for decoding an audio soundfield representation for audio playback |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |