CN1466401A - 立体音效的产生方法 - Google Patents
立体音效的产生方法 Download PDFInfo
- Publication number
- CN1466401A CN1466401A CNA021402493A CN02140249A CN1466401A CN 1466401 A CN1466401 A CN 1466401A CN A021402493 A CNA021402493 A CN A021402493A CN 02140249 A CN02140249 A CN 02140249A CN 1466401 A CN1466401 A CN 1466401A
- Authority
- CN
- China
- Prior art keywords
- hrtf
- sound effect
- stereo sound
- monaural
- itd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
本发明公开了一种立体音效的产生方法(implementation method of 3Daudio),可利用单耳头部对应转换演算法(HRTF)技术以自一单耳音源中合成一双声道音效;包含下列步骤:经由一单耳头部对应转换演算法(HRTF)测量操作来记录一只耳朵的一组HRTF系数,用以建立一单耳头部对应转换演算法(HRTF)资料库及一两耳闻声音时间差(ITD)补偿曲线,藉以根据所建立的上述单耳HRTF资料库及ITD补偿曲线,将一外部输入的单耳信号转换成一立体音效信号。
Description
技术领域
本发明涉及立体音效的处理,尤其是一种可利用单耳头部对应转换演算法(HRTF)技术以自一单耳音源中合成一双声道音效的立体音效的产生方法(implementation method of 3D audio)。
背景技术
一典型的环绕音效系统使用一些简单的延迟电路及相位滤波器将左右声道的资料混合处理,以模拟一立体音效。然而,这种方式通常会因为混合处理使左右声道的资料混淆,以致造成原始资料的失真。又,上述典型的环绕音效系统无法从一聆听者的前、后、上及下四个方向中产生立体音效,尤其是当聆听者不位于所谓的“甜点(sweet spot)时。因此,上述系统需在前后音的位置上安装滤波器,再提供一电性系统,以允许聆听者转头180度从左转至右时,可经由前面的滤波器听到前面的声音,并从右转至左时,可经由后面的滤波器听到后面的声音。根据数值分析所导出的系统计资料,将定标器(scaler)用于滤波器的输出入上,以调整音源产生的范围及位置,以消除例如ITD及两耳闻声音密度差(11D)(后述)。然而,这将需要大量的电路元件及滤波功率,以提供临场音效。因此,进而发展出目前常用于产生立体音效的HRTF技术。上述HRTF提供一资料库,资料库内建在360度空间中测量每个既定位置上所发出的声音传送至两耳时,耳朵及大脑感受到的频率响应特性。利用一数字信号处理器(DSP)将上述频多响应特性作运算,即可计算出具有立体音效持微的音波,此音波传送至耳朵,就可使大脑感受到360度的真实感而产生立体音的效果。图1显示一典型的360度HRTF测量。如图1所示,在一圆圈10的中心处摆放一个假人头12并将圆圈10分割成360段,每段指定一方位角控制参数(360度控制)并代表一个不重复的定位点。如此,当一光源的位置顺利地由一段转至下一段,假人头12可察觉到光源位置的连续性移动。根据上述HRTF测量,假设位置0对准着头12的左耳,以编号14代表。位置90在头12正前方,以编号16代表。同样地,位置180对准着头12的右耳,以编号18代表,位置270在头12正后方,以编号20代表。因为方位角位置参数环绕着圆圈10配置,因此,位置0及360会重叠在编号14的地方。使用一范围参数来表示声源的出声范围或距离。以头12的中心点为原点(位置0),从原点至圆圈10间分割成360个圆圈来代表声源距离。其中位置0至19为头12的范围,如图示编号22。其余位置20至359以图示编号24代表。其中上述位置359为能够听到声音范围上的极限。当然,上述极限可依实际需求做调整。
前述配置必须架构于一无响室(echoic chamber)内,分别在360度(段)不同的座标空间的各声源下执行双耳测量,以记录48或44.IKHZ取样速率下20HZ到20KHZ的声波。因为声波传送至两耳间的标准时间差约为音波走20公分亦即范围0-19)的时间,以致造成两耳闻声音时间差(ITD)。又,不同人的头、肩、臂会吸收不同的声波能量,这时两耳所听到的大小声音振幅是不同的,因而造成两耳间声音密度差(11D)。如此,利用一单声源分别对左右耳做HRTF测量及记录,以完成HRTF资料库的建立。但是,这种方式如熟知此项技术的人士所熟知的,声波碰到物体都会有反射的效应,经人躯体、肩、头及外耳改变的不同波长的音波会在外耳壳中产生绕射(diffractive)现象,进而使音鼓所感受到的声音的频率响应也是不同的。记录于HRTF资料库中的这些变化不但随着点声源方位角仰角、范围及频率而变,也因人而易,因此若要建立这类HRTF资料库通常相当辛苦,一般来说,加上来回的调整一套完整HRTF参数要花费数个月的时间才能完成。
发明内容
有鉴于此,本发明的一目的是提供一种立体音效的产生方法,其使用头部对应转换演算法(HRTF),以自一单耳音源中合成一双声道音效。
本发明的立体音效的产生方法包含下列步骤:经由一单耳头部对应转换演算法(HRTF)测量操作来记录一只耳朵的一组HRTF系数,用以建立一单耳头部对应转换演算法(HRTF)资料库及一两耳闻声音时间差(ITD)补偿曲线,藉以根据所建立的上述单耳HRTF资料库及ITD补偿曲线,将一外部输入的单耳信号转换成一立体音效信号。
上述立体音效的产生方法进一步包含下列步骤根据该ITD补偿曲线来调整该立体音效信号的ITD模组。上述立体音效的产生方法进一步包含提供一调整工具给一使用者,以设定头部阴影参数至所期待的立体音效环绕效果。
本发明可利用单耳头部对应转换演算法(HRTF)技术以自一单耳音源中合成一双声道音效,从而使立体音效的设定更加便捷,并节约了调整时间。
附图说明
图1显示一具有360度的典型HRTF测量图;
图2显示一本发明的单耳HRTF测量图;
图3显示一根据本发明的双声道合成结构图;
图4显示一根据本发明用于图3的ITD波器中的ITD补偿曲线图;
图5为一根据本发明图3的操作流程图。
具体实施方式
全文中,类似元件功能以相同元件编号代表。
图2显示一本发明的单耳HRTF测量图。在图2中上述单耳HRTF测量只记录左耳或右耳的测量资料(一组滤波器数),其不同于典型的HRTF测量,必须分别记录左耳及右耳两者的测量资料。如图2所示,一台扩音器21被放在距离头部22左耳(如同接收麦克风的作用)1.4米远的地方,用以传送声音至左耳中。由于人的脸部大致上呈现对称性,在进行HRTF测量时,可以只对右半面或左半面进行量测,在每一个量测点(例如,在预设好具有方位角θAC及仰角θAB的A点位置上)记录由麦克风以44.1kHZ取样从扩音器播出的声音,在频率领域中记录一组滤波器数(脉冲响应)并求出它们之间的转换函式(transferfunction)(从频率领域转换到时间领域),即可完成HRTF资料库。又,可以使用一时间等化器(未显示)来消除测量仪器的影响,例如扩音器21、头部22及接收麦克风(测量侧的耳朵)本身的频率响应。如此,储存于HRTF资料库的量测结果将是和包含头在内的量测仪器本身无关的转换函式。此外,如果想直接实施上述资料库实际上是有因难的,因为它必须用很长的FIR滤波器才有可能,通常是数百阶(tap)以上的程次,我们必须再做进一步的化简。由于到左耳的转换函式和到右耳的转换函式之间的相位差可以包含进ITD模组来补偿,所以我们对两耳的转换函式做最小相位转换,再观察转换后的结果发现大部份的能量都集中在前面32阶(tap)的地方。如此,到测量资料经由最小相位转换后产生的转换函式,只要储存这个转换函式的前32阶即可很有效的模拟出3-D的立体效果。上述包含前32阶的FIR滤波器数的HRTF资料库就可简单地利用一32阶FIR滤波器来实行。只是,考虑到实际应用时每个人的头形都不尽相同,为了把头部22对转换函式的影响去除,参考图3,不管是到左耳还是右耳的声音都会经由头部阴影效应的补偿滤波器32、34来补尝不同头形对3-D立体音效的不同感受。另外,根据音响心理学,近端扩音器至左右耳的延迟小到可被忽略,但远端扩音器至两耳间的时间差无法被忽略,所以需要使用一ITD滤波器来做补偿。这样,利用很简单的滤波器架构,就可达成个别不同的3-D立体音效的感受,以节省计算的花费及时间。图4显示一根据本发明用于图3的ITD滤波器中的ITD补偿曲线图。在图4中,上述补偿曲线在0度仰角(也就是图2中的C轴)时的ITD模组。如图4所示,取出原测量资料库中的同一个量测位置(方位角)上,由左耳测得的转换函式及由右耳测得的转换函式的延迟部分做互相关系运算(cross correlation)(可利用高斯函式(Gaussian function)乘以正弦函数(sine)得到),以找出最大的延迟值,这个值即为我们要补偿的ITD参考值。接着,将图4中导出的ITD补偿曲线以图3中显示的ITD滤波器配置于单耳HRTF资料库及远端IIR滤波器之间。又,基于上述每个人的不同头形,除了建立共同的32阶FIR滤波器来模拟立体音效外,还提供一调整工具给使用者,以设定近端及远端阴影效应波波器的头部阴影参数,藉此提供调整个别差异的方法以达到立体音效环绕效果。这个调整工具提供二个参数设定装置,以调整每个IIR滤波器的极点及零点值(pole and zero values)至一让使用者明显感受到立体音效的程度。
综合上述,将图3结构的操作流程显示于图5中。在图5中,该操作流程包含下列步骤:建立一单耳HRTF资料库及一ITD补偿曲线(S1);及根据所建立的单耳HRTF资料库及ITD补偿曲线来执行ITD调整及阴影效应调整(S2)。如图5所示,上述建立一单耳HRTF资料库包含32阶FIR滤波器系数及利用一32阶FIR滤波器来实施该单耳HRTF资料库。此处虽以32阶为说明例,然而实务上,可根据实际需求来决定用于配置上述资料库所需用到的阶数,并不限于32阶。所建立的ITD补偿曲线的斜率会呈现一近乎比例常数的曲线(如图4所示),如此,使用者可通过调整本发明ITD模组及远近端头部阴影效应滤波器(IIR滤波器),轻易地找到自己认为3-D效果最明显的设定。因此,经由本发明的立体音效产生方法,不须对个别差异做HRTF测量及/或改变储存于资料库中的滤波器数,就可产生令使用者满意的立体音效。
虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明,任何熟悉此项技艺者,在不脱离本发明之精神和范围内,当可做些许更动与润饰,因此本发明之保护范围当视权利要求书范围所界定者为准。
Claims (8)
1.一种立体音效的产生方法,其特征是:包括经由一单耳头部对应转换演算法(HRTF)测量操作来记录一只耳朵的一组HRTF系数,用以建立一单耳头部对应转换演算法(HRTF)资料库及一两耳闻声音时间差(ITD)补偿曲线,藉以根据所建立的上述单耳HRTF资料库及ITD补偿曲线,将一外部输入的单耳信号转换成一立体音效信号。
2.如权利要求1所述的立体音效的产生方法,其特征是:该建立一单耳头部对应转换演算法(HRTF)资料库包含有限脉冲响应(FIR)滤波器系数,且上述有限脉冲响应(FIR)滤波器系数以一FIR滤波器来实施。
3.如权利要求1所述的立体音效的产生方法,其特征是:进一步包括一步骤为根据该ITD补偿曲线来调整该立体音效信号的ITD模组。
4.如权利要求1所述的立体音效的产生方法,其特征是:进一步包括一步骤为提供一调整工具给一使用者,以设定头部阴影参数至所期待的立体音效环绕效果。
5.如权利要求4所述的立体音效的产生方法,其特征是:该头部阴影参数包括无限脉冲响(IIRs)。
6.一种立体音效的产生方法,其特征是:包括下列步骤:
经由一单耳HRTF测量操作来记录一只耳朵的一组HRTF系数,用以建立一单耳头部对应转换演算法(HRTF)资料库及一两耳间声音时间差(ITD)补偿曲线;
根据所建立的HRTF资料库来分开一外部输入单耳信号成为一近端双耳信号及一远端双耳信号;
根据所建立的HRTF资料库及ITD补偿曲线来调整上述远端双耳信号的一ITD模组;
提供一调整工具给一使用者,以设定上述近端双耳信号及上述具有调整过的ITD模组的远端双耳信号两者的头部阴影参数至所期待的立体音效环绕效果。
7.如权利要求6所述的立体音效的产生方法,其特征是:该建立一单耳头部对应转换演算法HRTF资料库包含有限脉冲响应(FIR)滤波器系数,且上述有限脉冲响应(FIR)滤波器系数以一FIR滤波器来实施。
8.如权利要求6所述的立体音效的产生方法,其特征是:该头部阴影参数包括无限脉冲响(IIRs)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 02140249 CN1236652C (zh) | 2002-07-02 | 2002-07-02 | 立体音效的产生方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 02140249 CN1236652C (zh) | 2002-07-02 | 2002-07-02 | 立体音效的产生方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1466401A true CN1466401A (zh) | 2004-01-07 |
CN1236652C CN1236652C (zh) | 2006-01-11 |
Family
ID=34147533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 02140249 Expired - Fee Related CN1236652C (zh) | 2002-07-02 | 2002-07-02 | 立体音效的产生方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1236652C (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105611481A (zh) * | 2015-12-30 | 2016-05-25 | 北京时代拓灵科技有限公司 | 一种基于空间声的人机交互方法和系统 |
CN107889044A (zh) * | 2017-12-19 | 2018-04-06 | 维沃移动通信有限公司 | 音频数据的处理方法及装置 |
CN108476369A (zh) * | 2015-09-07 | 2018-08-31 | 3D声音实验室 | 用于开发适用于个体的头部相关传递函数的方法和系统 |
CN109754825A (zh) * | 2018-12-26 | 2019-05-14 | 广州华多网络科技有限公司 | 一种音频处理方法、装置及设备 |
CN109769195A (zh) * | 2018-07-26 | 2019-05-17 | 西北工业大学 | 一种hrtf中垂面方位增强方法 |
CN114866948A (zh) * | 2022-04-26 | 2022-08-05 | 北京奇艺世纪科技有限公司 | 一种音频处理方法、装置、电子设备和可读存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101938686B (zh) * | 2010-06-24 | 2013-08-21 | 中国科学院声学研究所 | 一种普通环境中头相关传递函数的测量系统及测量方法 |
-
2002
- 2002-07-02 CN CN 02140249 patent/CN1236652C/zh not_active Expired - Fee Related
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108476369A (zh) * | 2015-09-07 | 2018-08-31 | 3D声音实验室 | 用于开发适用于个体的头部相关传递函数的方法和系统 |
CN105611481A (zh) * | 2015-12-30 | 2016-05-25 | 北京时代拓灵科技有限公司 | 一种基于空间声的人机交互方法和系统 |
CN105611481B (zh) * | 2015-12-30 | 2018-04-17 | 北京时代拓灵科技有限公司 | 一种基于空间声的人机交互方法和系统 |
CN107889044A (zh) * | 2017-12-19 | 2018-04-06 | 维沃移动通信有限公司 | 音频数据的处理方法及装置 |
CN107889044B (zh) * | 2017-12-19 | 2019-10-15 | 维沃移动通信有限公司 | 音频数据的处理方法及装置 |
CN109769195A (zh) * | 2018-07-26 | 2019-05-17 | 西北工业大学 | 一种hrtf中垂面方位增强方法 |
CN109769195B (zh) * | 2018-07-26 | 2020-04-03 | 西北工业大学 | 一种hrtf中垂面方位增强方法 |
CN109754825A (zh) * | 2018-12-26 | 2019-05-14 | 广州华多网络科技有限公司 | 一种音频处理方法、装置及设备 |
CN114866948A (zh) * | 2022-04-26 | 2022-08-05 | 北京奇艺世纪科技有限公司 | 一种音频处理方法、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN1236652C (zh) | 2006-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Brinkmann et al. | A high resolution and full-spherical head-related transfer function database for different head-above-torso orientations | |
Brown et al. | An efficient HRTF model for 3-D sound | |
KR100739776B1 (ko) | 입체 음향 생성 방법 및 장치 | |
US5438623A (en) | Multi-channel spatialization system for audio signals | |
US6078669A (en) | Audio spatial localization apparatus and methods | |
US7489788B2 (en) | Recording a three dimensional auditory scene and reproducing it for the individual listener | |
US6611603B1 (en) | Steering of monaural sources of sound using head related transfer functions | |
CN104010264B (zh) | 双声道音频信号处理的方法和装置 | |
US9237398B1 (en) | Motion tracked binaural sound conversion of legacy recordings | |
CN1937854A (zh) | 用于再现双声道虚拟声音的装置和方法 | |
JP2012004668A (ja) | 頭部伝達関数生成装置、頭部伝達関数生成方法及び音声信号処理装置 | |
JPH08507910A (ja) | 複数チャネルのサウンド・プロセッシング | |
TWI479905B (zh) | Multi-channel down mixing device | |
US7921016B2 (en) | Method and device for providing 3D audio work | |
Lee et al. | A real-time audio system for adjusting the sweet spot to the listener's position | |
Rothbucher et al. | Comparison of head-related impulse response measurement approaches | |
CN1236652C (zh) | 立体音效的产生方法 | |
Pausch et al. | SCaLAr–A surrounding spherical cap loudspeaker array for flexible generation and evaluation of virtual acoustic environments | |
Avendano et al. | Modeling the contralateral HRTF | |
Jakka | Binaural to multichannel audio upmix | |
Gardner | Spatial audio reproduction: Towards individualized binaural sound | |
US11589181B1 (en) | System and method for realistic rotation of stereo or binaural audio | |
Yuan et al. | Sound image externalization for headphone based real-time 3D audio | |
US20230403528A1 (en) | A method and system for real-time implementation of time-varying head-related transfer functions | |
Geronazzo et al. | A standardized repository of Head-Related and Headphone Impulse Response data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20060111 Termination date: 20100702 |