CN101184349A - 针对双声道耳机设备的三维环响音效技术 - Google Patents
针对双声道耳机设备的三维环响音效技术 Download PDFInfo
- Publication number
- CN101184349A CN101184349A CNA2007101756529A CN200710175652A CN101184349A CN 101184349 A CN101184349 A CN 101184349A CN A2007101756529 A CNA2007101756529 A CN A2007101756529A CN 200710175652 A CN200710175652 A CN 200710175652A CN 101184349 A CN101184349 A CN 101184349A
- Authority
- CN
- China
- Prior art keywords
- dimensional
- dual
- sound effect
- hrtf
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
一种针对耳机音响系统的三维环响音效方法和设备,能够使双声道的音频信号扩展为多声道三维环响的音频信号。本发明三维耳机环响音效法依据人体听觉的主观感知原理建立了一个新模型。虚拟声源位置可通过以下2个参数进行反映:(1)“模糊椎体”:由头中部环形组成,可以用HRTF(Head-Related Transfer Function,头部相关转换函数)进行描述;(2)耳间差异:可用耳间强度和时间差异进行描述。本发明实例充分考虑了HRTF滤波器与耳间差异处理系统间的关系,较之传统方法,能实现更好的实现主观环响音效。本发明所设计的三维耳机环响音效方法既便于实施又能高效重建双声道耳机音响系统的三维环响效果。
Description
技术领域
本发明涉及一种能够将双声道音频声源扩展为针对双声道耳机的三维环响音效的方法和设备,尤其涉及能够增强手持设备音效的方法和设备。
根据本发明实例,三维环响音效技术提供了一种双声道音频再建系统,只需将同一声源信号输送到两个声道中,经过滤波系统,并对一些可调参数进行调整,就能够改变这些重建虚拟声源的听觉位置。针对双声道耳机的三维环响音效技术的正常工作基于以下两项发现:(1)在耳机音频输出条件下,人的主观听觉系统可识别的声音空间方向可以用数学模型,头部相关传递函数(HRTF)与耳间差异进行描述;(2)头部相关传递函数(HRTF)与耳间差异是非并行处理系统,两个系统间串并行处理共用可获得更高精确度的主观音频环绕效果。本发明针对耳机声音空间化的三维环响音效技术通过使用HRTF及耳间差异模型提供高精确度的主观音频环绕效果。
原则上讲,本发明方法和设备所提供三维环响音效引擎可用于多种不同类型的电子设备,如手机,PDA,MP3/MP4播放器等。
背景技术
本发明致力于寻求扩展和增强双声道耳机系统的音效,旨在解决双声道耳机系统声音不够饱满的相关问题,增强用户的音频感受。
传统耳机三维环响音效法,如图1所示,对人体听觉系统的HRTF和耳间差异的描述是不够精确的。故这种方法不能为真实的双声道耳机系统提供准确的模型,无法模拟优质的三维环响音效。
根据上述方法,传统的耳机三维环响技术假设HRTF和耳间差异是不相关的音频处理系统,即HRTF所处理的音频信号无需经过耳间差异(由信号延迟实现)系统。
更具体地说,如图1所示,传统三维环响技术100包括一个左音频HRTF滤波器110,一个右音频HRTF滤波器135,一个左音频延迟估算器115,一个右音频延迟估算器130,一个左音频混合器120,一个右音频混合器140。上述两种估算器及两种HRTF滤波器的参数计算都基于虚拟声源的方位及高度。
若一种三维环响音效方法或设备是实用的,它应该具备:(1)简单:因为该方法要用于消费电子设备上,如手机、PDA等;(2)精确:因为该方法必须要逼真地再建真实的声音环境。本发明正是基于上述理念,在不增加硬件设备和计算复杂度的条件下,极大程度地改善了目前针对耳机三维环响系统的音效。
发明内容
本发明的第一目标是提供一种针对双声道耳机能再建三维环响音效系统的三维环响音效方法和设备。
本发明的第二目标是提供一种适用于任何消费电子设备,如手机、PDA等,并且能针对双声道耳机有效重建三维环响音效的方法和设备。
本发明的第三目标是在不需要大量系统资源的条件下,包括CPU和存储器,能够提供一种准确的双声道耳机三维环响音效环境的方法和设备。
根据本发明实例原则,通过提供三维耳机环响引擎,以其最宽的涵盖形式,基于已发现的人的听觉系统事实,通过HRTF滤波器和耳间差异系统,以实现上述目标。
本发明针对双声道耳机三维环响音效技术能高度准确地模拟三维环响环境是因为,本方法在建立人体听觉系统主观感知的模型时,考虑到了以下两个因素:(1)针对耳机系统的人体听觉系统可以用HRTF和耳间差异模型进行描述;(2)头部相关传递函数(HRTF)与耳间差异并非如传统方法所假设的那样是并行处理系统,两个系统间串并行处理共用可获得更高精确度的主观音频环绕效果。
由于本发明针对PCM音频信号进行处理,故可对任何音频和语音编解码标准进行信号的后处理,以提供三维环响音效。
附图说明
图1传统耳机系统三维环响音效法的方法示意图;
图2根据本发明原理建立的针对耳机三维环响音效结构示意图;
图3人的听觉系统模糊椎体示意图。
具体实施方式
如图2所示,本发明是通过三维耳机环响引擎实现的,适用于任何消费电子设备。三维环响引擎200由一个左声道HRTF滤波器210,一个右声道HRTF滤波器250,左声道延迟输入混音器215,右声道延迟输入混音器255,左声道延迟估算器220,右声道延迟估算器260,左声道输出混音器230,右声道输出混音器270组成。
不同于传统的三维耳机环响音效法,本发明中以原始音频输入和经滤波处理的音频混合信号作为延迟输入。原始音频代表直达声,经滤波处理的音频代表虚拟位置声源。这样,所得结果就更好地反映了人体听觉系统的主观感受。
为了解本发明三维耳机环响音效技术,有必要先了解一些三维耳机环响音效的基本原理,即如何对双声道信号的两个输入音频流实施处理。当多个声源在传播相关的或部分相关的信号时,有差异的、有时甚至是互相干扰的声源就会混叠,尤其是当听者听到的不同声源信号仅有微小振幅差异和微小时间差异时。这种情况下,不同的声源会合成为一个单音,这个单音的位置与原声源的实际位置会有很大不同。当传入的声源差异较大时,虚拟的声源镜像会混入其中的一个真实声源中。心理声学试验显示,当受到简单正弦波的刺激,听觉系统会使用两个线索来估算声源的方向。即:耳间强度和时间差异(IID和ITD)共同作用来达到该目的。然而,IID和ITD只能部分地解释区别不同空间方向的能力。实际上,如果声源沿环形横向运动,如图3所示,IID和ITD就不会改变。由头中部环形组成的椎体被称为“模糊锥体”。模糊椎体内横向及纵向的区别可用头相关传递函数(HRTF)来描述。系统pinna-head-torso担当来自给定方向的平面波的线性滤波器。该滤波器的幅度和相位响应是很复杂的,并由声源的方向和高度决定,所以听者可以在有着相同且稳定的ITD和IID的不同方向的音源之间消歧。
由简化的HRTF模型来描述相关的不同方向的声源是可能的。即使这些声源被简化了,当它们动态地改变时,它们可以提供很强的定位效果。在现实生活中,听者在听到一个声源时从来不会是静态的。甚至是很小的头部动作也可以对区别可能的模糊声源提供很大的帮助,例如位于听者不能确定声源在其正前方或正后方。因此,几个虚拟声源参数,如ITD,IID及HRTFs足以提供一个很强的方向效果,只要这些声源与听者的头部动作有关。
传统的三维耳机环响音效技术仅应用IID和ITD以及原始音频。虽然人体听觉系统有着“模糊椎体”效应,相较于原始音频信号,经HRTF滤波器处理的音频信号有了很大的变化,它也应使用于耳间强度的模拟。
好的三维环响音效法应能够准确、有效地在三维空间中再建声源的移动。本发明三维耳机环绕音效技术通过下列步骤来实现设计目标:(1)对输入音频应用HRTF滤波器;(2)对经过HRTF滤波器处理过的音频混合信号及原始输入音频应用延迟以实现更高精度心理声学模型;(3)将延迟的音频与HRTF滤波器的输出混合。
在双声道音响系统中,有两个音源或两个声道。本发明三维耳机环响音效技术的实现包括以下4个步骤:(1)每个声道的音频信号都经HRTF滤波器处理;(2)将每个声道中经步骤1处理后的输出信号与原始输入音频混合;(3)将每个声道中经步骤2处理后的输出信号通过一个延迟系统;(4)将步骤1和步骤3的输出信号合成,发送到相应的耳机。
业内人士应该可以看出,发明三维耳机环响音效的首要目的是再建双声道音响系统的虚拟三维耳机环响音效场景。由于整个方法的设计都基于人体听觉系统的主观感觉以及人体听觉系统的精确建模,故本发明三维耳机环响音效法能够生动再建真实的三维环响音效场景。
由于本发明三维耳机环响音效实例不需要专门的硬件支持,只通过软件即可实现其功能,但不排除专门的硬件实现方式,因此该技术可容易地应用于任何类型的消费电子产品上,如手机,PDA等。此外,本发明可用于任何音频和语音编解码系统,如AAC,AAC+,MP3,WMA,RA,AMR等。
前面已经十分详细地描述了本发明所提请的技术,使业内人士能够了解和使用本发明,但是,还要提请注意的是,在不偏离本发明实质的前提下,还可以对所提请的技术发明进行变更和改进,并且本发明不受以上说明或附图的限制,而是按照所附权利要求来予以限定。
Claims (4)
1.立体耳机音响系统三维环响音效法包括以下步骤:
a.输入每个声道的音频信号都经HRTF滤波器处理;
b.将步骤a的输出信号与原始输入音频混合;
c.将步骤b的输出信号经延迟系统处理;
d.将步骤a和步骤c的输出信号混合并发送到相应的耳机。
2.如权利要求1所属方法,其中步骤b和步骤c将原始音频信号和经HRTF滤波器处理的音频合成,并发送到延迟系统,获得更高精确度的耳间差异。
3.根据听者的位置,三维耳机环响音效设备包括以下步骤:
a.将每个声道的输入音频信号经HRTF滤波器处理;
b.将步骤a的输出信号与原始音频输入信号混合;
c.将步骤b的输出信号经延迟系统处理;
d.将步骤a和步骤c的输出信号混合,并发送到相应的耳机。
4.如权利要求3所述设备,步骤b和步骤c合成原始音频信号和经HRTF滤波器处理后的音频信号,并发送到延迟系统以获取更高精确度的耳间差异。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101756529A CN101184349A (zh) | 2007-10-10 | 2007-10-10 | 针对双声道耳机设备的三维环响音效技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA2007101756529A CN101184349A (zh) | 2007-10-10 | 2007-10-10 | 针对双声道耳机设备的三维环响音效技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101184349A true CN101184349A (zh) | 2008-05-21 |
Family
ID=39449379
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007101756529A Pending CN101184349A (zh) | 2007-10-10 | 2007-10-10 | 针对双声道耳机设备的三维环响音效技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101184349A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101938686A (zh) * | 2010-06-24 | 2011-01-05 | 中国科学院声学研究所 | 一种普通环境中头相关传递函数的测量系统及测量方法 |
CN103329576A (zh) * | 2011-01-05 | 2013-09-25 | 皇家飞利浦电子股份有限公司 | 音频系统及其操作方法 |
CN103631270A (zh) * | 2013-11-27 | 2014-03-12 | 中国人民解放军空军航空医学研究所 | 导轨旋转式链条传动声源位置调节载人hrtf测量转台 |
CN104581610A (zh) * | 2013-10-24 | 2015-04-29 | 华为技术有限公司 | 一种虚拟立体声合成方法及装置 |
CN105208495A (zh) * | 2015-11-09 | 2015-12-30 | 惠州Tcl移动通信有限公司 | 一种立体声耳机 |
US10237675B1 (en) | 2018-05-22 | 2019-03-19 | Microsoft Technology Licensing, Llc | Spatial delivery of multi-source audio content |
CN112019993A (zh) * | 2019-05-29 | 2020-12-01 | 诺基亚技术有限公司 | 音频处理 |
CN113038322A (zh) * | 2021-03-04 | 2021-06-25 | 聆感智能科技(深圳)有限公司 | 一种以听觉增强环境感知的方法与装置 |
-
2007
- 2007-10-10 CN CNA2007101756529A patent/CN101184349A/zh active Pending
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101938686A (zh) * | 2010-06-24 | 2011-01-05 | 中国科学院声学研究所 | 一种普通环境中头相关传递函数的测量系统及测量方法 |
CN101938686B (zh) * | 2010-06-24 | 2013-08-21 | 中国科学院声学研究所 | 一种普通环境中头相关传递函数的测量系统及测量方法 |
CN103329576A (zh) * | 2011-01-05 | 2013-09-25 | 皇家飞利浦电子股份有限公司 | 音频系统及其操作方法 |
CN103329576B (zh) * | 2011-01-05 | 2016-12-07 | 皇家飞利浦电子股份有限公司 | 音频系统及其操作方法 |
US9763020B2 (en) | 2013-10-24 | 2017-09-12 | Huawei Technologies Co., Ltd. | Virtual stereo synthesis method and apparatus |
CN104581610A (zh) * | 2013-10-24 | 2015-04-29 | 华为技术有限公司 | 一种虚拟立体声合成方法及装置 |
CN103631270B (zh) * | 2013-11-27 | 2016-01-13 | 中国人民解放军空军航空医学研究所 | 导轨旋转式链条传动声源位置调节载人hrtf测量转台 |
CN103631270A (zh) * | 2013-11-27 | 2014-03-12 | 中国人民解放军空军航空医学研究所 | 导轨旋转式链条传动声源位置调节载人hrtf测量转台 |
CN105208495A (zh) * | 2015-11-09 | 2015-12-30 | 惠州Tcl移动通信有限公司 | 一种立体声耳机 |
US10237675B1 (en) | 2018-05-22 | 2019-03-19 | Microsoft Technology Licensing, Llc | Spatial delivery of multi-source audio content |
US10952004B2 (en) | 2018-05-22 | 2021-03-16 | Microsoft Technology Licensing, Llc | Spatial delivery of multi-source audio content |
CN112019993A (zh) * | 2019-05-29 | 2020-12-01 | 诺基亚技术有限公司 | 音频处理 |
CN113038322A (zh) * | 2021-03-04 | 2021-06-25 | 聆感智能科技(深圳)有限公司 | 一种以听觉增强环境感知的方法与装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102395098B (zh) | 生成3d声音的方法和设备 | |
US6021206A (en) | Methods and apparatus for processing spatialised audio | |
CN101184349A (zh) | 针对双声道耳机设备的三维环响音效技术 | |
Hacihabiboglu et al. | Perceptual spatial audio recording, simulation, and rendering: An overview of spatial-audio techniques based on psychoacoustics | |
KR100606734B1 (ko) | 삼차원 입체음향 구현 방법 및 그 장치 | |
Hulusic et al. | Acoustic rendering and auditory–visual cross‐modal perception and interaction | |
CN101483797A (zh) | 一种针对耳机音响系统的人脑音频变换函数(hrtf)的生成方法和设备 | |
CN110192396A (zh) | 用于基于头部跟踪数据确定和/或使用音频滤波器的方法和系统 | |
Laitinen et al. | Parametric time-frequency representation of spatial sound in virtual worlds | |
RU2011105972A (ru) | Формирование бинауральных сигналов | |
CN1524399A (zh) | 声道转换 | |
CN104581610A (zh) | 一种虚拟立体声合成方法及装置 | |
US6738479B1 (en) | Method of audio signal processing for a loudspeaker located close to an ear | |
CN105392102A (zh) | 用于非球面扬声器阵列的三维音频信号生成方法及系统 | |
CN104969571B (zh) | 用于渲染立体声信号的方法 | |
Jot et al. | Binaural simulation of complex acoustic scenes for interactive audio | |
CN105594227A (zh) | 利用恒定功率成对平移的矩阵解码器 | |
Su et al. | Inras: Implicit neural representation for audio scenes | |
CN101155440A (zh) | 针对双声道音频信号的三维环绕音效技术 | |
Engel et al. | Perceptual comparison of ambisonics-based reverberation methods in binaural listening | |
Jakka | Binaural to multichannel audio upmix | |
Kothig et al. | A bayesian system for noise-robust binaural sound localisation for humanoid robots | |
Yuan et al. | Sound image externalization for headphone based real-time 3D audio | |
Frank et al. | What we already know about spatialization with compact spherical arrays as variable-directivity loudspeakers | |
Geronazzo et al. | Use of personalized binaural audio and interactive distance cues in an auditory goal-reaching task |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20080521 |