CN106211017A - 一种3d声场构建方法 - Google Patents
一种3d声场构建方法 Download PDFInfo
- Publication number
- CN106211017A CN106211017A CN201610448203.6A CN201610448203A CN106211017A CN 106211017 A CN106211017 A CN 106211017A CN 201610448203 A CN201610448203 A CN 201610448203A CN 106211017 A CN106211017 A CN 106211017A
- Authority
- CN
- China
- Prior art keywords
- sound source
- sound
- ear
- oracle listener
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/13—Application of wave-field synthesis in stereophonic audio systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
本发明所提供的一种3D声场构建方法,包括步骤:A、依据所拍摄的画面确定声音源数量,以及各声音源的坐标;B、依据所述数量和坐标所对应的声音源与监听程序的距离,构建3D声场;C、依据步骤A所拍摄画面的变化,实时更新步骤B所构建的3D声场。由上,依据所拍摄的画面场景和声音源位置,利用“双耳效应”原理构建出3D声场,以使用户有逼真的视听效果。
Description
技术领域
本发明涉及虚拟现实技术领域,特别涉及一种3D声场构建方法。
背景技术
虚拟现实技术是仿真技术的一个重要方向。虚拟现实技术丰要包括模拟环境、感知、自然技能等方面。
模拟环境是由计算机生成的、实时动态的三维立体逼真图像。
感知是指理想的VR应该具有一切人所具有的感知。除计算机图形技术所生成的视觉感知外,还有听觉,也称为多感知。
自然技能是指人的头部转动,眼睛、手势、或其他人体行为动作,由计算机来处理与参与者的动作相适应的数据,并对用户的输入作出实时响应,并分别反馈到用户的五官。传感设备是指三维交互设备。
然而,在虚拟现实技术中,如何实现环境、感知、自然技能的完美融合,即如何使虚拟视觉、听觉的融合,其中,虚拟视觉已属于较为常见的技术,而随用户的头部转向时虚拟视觉的变化而导致听觉的更新则是又一课题。
发明内容
有鉴于此,本发明的主要目的在于,提供一种3D声场构建方法,包括步骤:
A、依据所拍摄的画面确定声音源数量,以及各声音源的坐标;
B、依据所述数量和坐标所对应的声音源与监听程序的距离,构建3D声场;
C、依据步骤A所拍摄画面的变化,实时更新步骤B所构建的3D声场。
由上,依据所拍摄的画面场景和声音源位置,利用“双耳效应”原理构建出3D声场,以使用户有逼真的视听效果。
可选的,步骤B包括:
依据所述各声音源的坐标,判断所述各声音源相对于监听程序左耳、右耳的距离的步骤;
当所述距离大于阈值时,对声音源采用线性衰减,当所述距离小于阈值时,对声音源采用对数衰减;
依据各声音源到达监听程序左耳位置衰减的结果进行合成,得出监听程序左耳位置所接收到的声音;
依据各声音源到达监听程序右耳位置衰减的结果进行合成,得出监听程序右耳位置所接收到的声音;
将监听程序左耳、右耳所接收到的声音进行合成,以构建3D声场。
由上,由于距离较远时,声音在传播过程中的落差较为明显,采用线性衰减可以减缓声音的衰减速度,从而模拟出落差较大的效果。而声音源与监听位置较近时,则采用对数衰减,其原因在于:由于在短距离,人耳对声波强弱的感受大致上和声强(或声压)的对数成正比例。为适应人耳听觉这一特性以提高仿真度,故采用对数衰减计算。
可选的,步骤B包括:
声音源n相对于所述监听程序左耳、右耳的距离表示为rn左和rn右:rn左 2=(x左-xn)2+(y左-yn)2+(z左-zn)2、rn右 2=(x右-xn)2+(y右-yn)2+(z右-zn)2;
其中,(xn,yn,zn)表示声音源n的坐标,n为表示声音源的数量的标号,n∈(1,∞);(x左,y左,z左)为左耳的坐标;(x右,y右,z右)为右耳的坐标。
可选的,声音源n的所述线性衰减包括:wn左’=N*wn*log2rn左、wn右’=N*wn*log2rn右;
式中wn左’和wn右’分别表示声音源n线性衰减后左耳和右耳所接收到的音量;rn左和rn右分别表示声音源n相对于左耳、右耳的距离;wn表示声音源n发出的音量;N表示空气阻尼系数。
可选的,声音源n的所述对数衰减包括:qn左’=qn-N*rn左、qn右’=qn-N*rn右;
式中qn左’和qn右’分别表示声音源n在对数衰减后左耳和右耳所接收到的音量;rn左和rn右分别表示声音源n相对于左耳、右耳的距离;qn表示声音源n发出的音量;N表示空气阻尼系数。
可选的,步骤B中,还包括确定障碍物对于声音源的衰减量的步骤。
由上,当在声音源与监听程序之间出现障碍物时,势必也会对声音源的衰减造成影响。
可选的,该步骤包括:在声音源与监听程序左、右耳的中点设一连线m,另在声音源与监听程序的左耳和右耳分设一条连线n1、n2,m与n1、n2分别形成两个截面;
分别计算所述障碍物的横截面阻挡两个截面的面积,其阻挡面积与衰减量成正比。
由上,依据障碍物所在位置的不同,精确模拟出其对于声音源衰减的影响。
可选的,还包括:确定障碍物高度对于声音源的衰减量的步骤。
可选的,分别在声音源与监听程序左、右耳之间设置一高度区间,在所述高度区间内,障碍物的高度与衰减量成正比。
由上,依据障碍物高度的不同,精确模拟出其对于声音源衰减的影响。
附图说明
图1为本发明构建3D声场构建方法的流程图;
图2为本发明构建3D声场构建方法的原理示意图;
图3为出现障碍物时,构建3D声场构建方法的原理示意图;
图4为出现另一障碍物时,构建3D声场构建方法的原理示意图;
图5为确定障碍物对于声音源衰减量影响的原理示意图;
图6为确定障碍物高度对于声音源衰减量影响的原理示意图。
具体实施方式
为克服现有技术存在的缺陷,本发明提供一种3D声场构建方法,依据所模拟的视频场景和声音源位置,利用“双耳效应”原理构建出3D声场,以使用户有逼真的视听效果。
如图1所示,3D声场构建方法包括以下步骤:
S10:依据所拍摄的画面确定声音源。
如图2所示,本实施例所述画面为全景视频画面,将视频当做一种纹理,贴在三维球体的内表面上。用于拍摄全景视频画面的相机设在球体中心,在所述相机的正前方设置3D声场监听程序,用于构建3D声场。
利用鼠标点击屏幕中的画面,相机与鼠标点击位置会产生一条连线,该连线与全景视频所在的球体相交,其相交位置可确定为声音源位置的坐标。如图2所示的实施例中,设置了A、B两声音源,上述两声音源的坐标分别表示为A声音源:(xa,ya,za);B声音源:(xb,yb,zb)。
进一步的,本步骤还包括确认障碍物位置的步骤。
如图3所示,当拍摄的画面中出现障碍物时,通过Unity3D的类库函数GameObject.Find("障碍物名称").transform.position便可遍历画面,并确定出是否含有障碍物,以及障碍物所在位置的坐标。
S20:依据声音源和障碍物位置构建3D声场。
本步骤中,首先计算各声音源与监听程序之间的距离r,具体的,采用以下算法,仍以图2为例,设图中A声音源与监听程序的距离为r1,r12=(x0-xa)2+(y0-ya)2+(z0-za)2,其中,(x0,y0,z0)为监听程序的坐标。同理,计算出B声音源与监听程序的距离r2,r22=(x0-xb)2+(y0-yb)2+(z0-zb)2。
进一步的,依据“双耳效应”使监听程序模拟左右耳,即A声音源与监听程序的距离为r1左和r1右,r1左表示A声音源到监听程序左耳距离,r1右表示A声音源到监听程序右耳距离。同理,计算出B声音源与监听程序左耳和右耳的距离r2左和r2右。
其次,计算A声音源、B声音源到达监听程序的衰减量。本实施例中,设A声音源的发出音量大小为w,B声音源的发出音量大小为q,空气阻尼系数N。
针对声音源与监听位置较远的情况,例如超过10米,则采用线性衰减,其原因在于:由于距离较远,因此声音在传播过程中的落差较为明显,采用线性衰减可以减缓声音的衰减速度,从而模拟出落差较大的效果。而声音源与监听位置较近时,例如小于10米。则采用对数衰减,其原因在于:由于在短距离,人耳对声波强弱的感受大致上和声强(或声压)的对数成正比例。为适应人耳听觉这一特性以提高仿真度,故采用对数衰减计算。
本实施例中,对A声音源进行对数衰减计算,衰减后监听程序左耳音量表示为w左’:w’=N*w*log2r1左;衰减后监听程序右耳音量表示为w右’:w’=N*w*log2r1右。
对B声音源进行线性衰减,衰减后监听程序左耳音量表示为q左’:q左’=q-N*r2左;衰减后监听程序右耳音量表示为q右’:q右’=q-N*r2右。
依据所计算出的w左’、w右’、q左’和q右’进行声音合成,从而实现构建3D声场。
另外,当出现图3所示情况,即监听程序与A声音源间出现障碍物时,障碍物对于A声音源则产生进一步的衰减。具体的,首先分别计算障碍物距离A声音源和监听程序的距离,本实施例中采用r3表示A声音源与障碍物的距离,r4左表示障碍物与监听程序左耳的距离,r4右表示障碍物与监听程序左耳的距离。上述障碍物出现于监听程序与A声音源间,表示的是,假设监听程序与A声源之间有一条连线,则该障碍物处于该连线上。
计算距离方法与前述相同,不再赘述。
其次,依据r3、r4左和r4右的距离值,确定出选择线性衰减或对数衰减。举例来说,本实施例中r3、r4左和r4右均小于10米,则在障碍物所在位置的衰减音量表示为P1:P1=N*w*log2r3;而在监听位置的衰减音量表示为P2左和P2右,P2左=(Z+N)*P1*log2r4左、P2右=(Z+N)*P1*log2r4右,式中Z表示障碍物的阻尼系数。
需要特殊说明的是,当出现图3所示障碍物正巧挡在声音源与监听程序之间时,其对于声音的阻挡属于“完全阻挡”,而当障碍物出现如图4所示,仅有一部分挡在声音源与监听程序之间时,属于“部分阻挡”。如图5所示,首先在声音源与监听程序的中心设一连线m,另在声音源与监听程序的左耳和右耳分设一条连线n1、n2,则m与n1和n2分别形成两个截面。分别计算所述障碍物的横截面阻挡两个截面的面积,阻挡率记为ln1和ln2。
进一步的,计算障碍物与监听程序的衰减音量时,还需考虑阻挡率的影响,仍以上实施例举例,则衰减为P2左=ln1*(Z+N)*P1*log2r4左、P2右=ln2*(Z+N)*P1*log2r4右。
更进一步的,还需考虑障碍物高度的因素。如图6所示,以监听程序的左耳为例进行说明。在声音源与监听程序之间设置一最佳收听的高度区域,即图中h1、h2所围成的区域,在该区域内,障碍物高度越高,则对声音的衰减越明显,其阻挡率记为l’。则,左耳所接收到的声音表示为P2左=l’*ln1*(Z+N)*P1*log2r4左。右耳与左耳原理相同,不再赘述。
进而,依据所计算出的P2左和P2右进行声音合成,从而实现构建3D声场。
步骤S30:依据所拍摄画面的变化,实时更新所构建的3D声场。
当相机转向时,则A声音源、B声音源和障碍物的位置在球面上发生变化,依据转向后的画面,重复步骤S20,更新所构建的3D声场。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明。总之,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种3D声场构建方法,其特征在于,包括步骤:
A、依据所拍摄的画面确定声音源数量,以及各声音源的坐标;
B、依据所述数量、所述坐标所对应的声音源与监听程序的距离,构建3D声场;
C、依据步骤A所拍摄画面的变化,实时更新步骤B所构建的3D声场。
2.根据权利要求1所述的方法,其特征在于,步骤B包括:
依据所述各声音源的坐标,判断所述各声音源相对于监听程序左耳、右耳的距离的步骤;
当所述距离大于阈值时,对声音源采用线性衰减,当所述距离小于阈值时,对声音源采用对数衰减;
依据各声音源到达监听程序左耳位置衰减的结果进行合成,得出监听程序左耳位置所接收到的声音;
依据各声音源到达监听程序右耳位置衰减的结果进行合成,得出监听程序右耳位置所接收到的声音;
将监听程序左耳、右耳所接收到的声音进行合成,以构建3D声场。
3.根据权利要求2所述的方法,其特征在于,步骤B包括:
声音源n相对于所述监听程序左耳、右耳的距离表示为rn左和rn右:rn左 2=(x左-xn)2+(y左-yn)2+(z左-zn)2、rn右 2=(x右-xn)2+(y右-yn)2+(z右-zn)2;
其中,(xn,yn,zn)表示声音源n的坐标,n为表示声音源的数量的标号,n∈(1,∞);(x左,y左,z左)为左耳的坐标;(x右,y右,z右)为右耳的坐标。
4.根据权利要求3所述的方法,其特征在于,声音源n的所述线性衰减包括:wn左’=N*wn*log2rn左、wn右’=N*wn*log2rn右;
式中wn左’和wn右’分别表示声音源n线性衰减后左耳和右耳所接收到的音量;rn左和rn右分别表示声音源n相对于左耳、右耳的距离;wn表示声音源n发出的音量;N表示空气阻尼系数。
5.根据权利要求3所述的方法,其特征在于,声音源n的所述对数衰减包括:qn左’=qn-N*rn左、qn右’=qn-N*rn右;
式中qn左’和qn右’分别表示声音源n在对数衰减后左耳和右耳所接收到的音量;rn左和rn右分别表示声音源n相对于左耳、右耳的距离;qn表示声音源n发出的音量;N表示空气阻尼系数。
6.根据权利要求1所述的方法,其特征在于,步骤B中,还包括确定障碍物横截面积对于声音源的衰减量的步骤。
7.根据权利要求6所述的方法,其特征在于,该步骤包括:在声音源与监听程序左、右耳的中点设一连线m,另在声音源与监听程序的左耳和右耳分设一条连线n1、n2,m与n1、n2分别形成两个截面;
分别计算所述障碍物的横截面阻挡两个截面的面积,其阻挡面积与衰减量成正比。
8.根据权利要求6所述的方法,其特征在于,步骤B中,还包括:确定障碍物高度对于声音源的衰减量的步骤。
9.根据权利要求8所述的方法,其特征在于,分别在声音源与监听程序左、右耳之间设置一高度区间,在所述高度区间内,障碍物的高度与衰减量成正比。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610448203.6A CN106211017B (zh) | 2016-06-20 | 2016-06-20 | 一种3d声场构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610448203.6A CN106211017B (zh) | 2016-06-20 | 2016-06-20 | 一种3d声场构建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106211017A true CN106211017A (zh) | 2016-12-07 |
CN106211017B CN106211017B (zh) | 2018-10-19 |
Family
ID=57461465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610448203.6A Expired - Fee Related CN106211017B (zh) | 2016-06-20 | 2016-06-20 | 一种3d声场构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106211017B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109729109A (zh) * | 2017-10-27 | 2019-05-07 | 腾讯科技(深圳)有限公司 | 语音的传输方法和装置、存储介质、电子装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101695151A (zh) * | 2009-10-12 | 2010-04-14 | 清华大学 | 多声道音频信号变换为双声道音频信号的方法和设备 |
CN103257347A (zh) * | 2012-02-17 | 2013-08-21 | 中国人民解放军海军装备研究院舰艇作战系统论证研究所 | 一种实际使用环境下的声纳作用距离指标的获取方法 |
CN104363555A (zh) * | 2014-09-30 | 2015-02-18 | 武汉大学深圳研究院 | 一种5.1多声道声源方向重建方法与装置 |
CN105451152A (zh) * | 2015-11-02 | 2016-03-30 | 上海交通大学 | 基于听者位置跟踪的实时声场重建系统和方法 |
-
2016
- 2016-06-20 CN CN201610448203.6A patent/CN106211017B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101695151A (zh) * | 2009-10-12 | 2010-04-14 | 清华大学 | 多声道音频信号变换为双声道音频信号的方法和设备 |
CN103257347A (zh) * | 2012-02-17 | 2013-08-21 | 中国人民解放军海军装备研究院舰艇作战系统论证研究所 | 一种实际使用环境下的声纳作用距离指标的获取方法 |
CN104363555A (zh) * | 2014-09-30 | 2015-02-18 | 武汉大学深圳研究院 | 一种5.1多声道声源方向重建方法与装置 |
CN105451152A (zh) * | 2015-11-02 | 2016-03-30 | 上海交通大学 | 基于听者位置跟踪的实时声场重建系统和方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109729109A (zh) * | 2017-10-27 | 2019-05-07 | 腾讯科技(深圳)有限公司 | 语音的传输方法和装置、存储介质、电子装置 |
CN109729109B (zh) * | 2017-10-27 | 2020-11-10 | 腾讯科技(深圳)有限公司 | 语音的传输方法和装置、存储介质、电子装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106211017B (zh) | 2018-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9544706B1 (en) | Customized head-related transfer functions | |
CN101978707B (zh) | 计算机生成的三维虚拟环境中的真实音频通信 | |
CN107810646A (zh) | 用于会议应用的过滤声音 | |
US20160085305A1 (en) | Audio computer system for interacting within a virtual reality environment | |
JP2019527956A (ja) | 仮想、拡張、および複合現実 | |
CN104685858A (zh) | 沉浸式视频会议方法和系统 | |
CN112602053B (zh) | 音频装置和音频处理的方法 | |
US20140270182A1 (en) | Sound For Map Display | |
CN109640070A (zh) | 一种立体显示方法、装置、设备及存储介质 | |
US20230145605A1 (en) | Spatial optimization for audio packet transfer in a metaverse | |
US20230135750A1 (en) | Device and method for providing augmented reality interaction | |
CN106211017B (zh) | 一种3d声场构建方法 | |
CN110493703A (zh) | 虚拟观众的立体音频处理方法、系统和存储介质 | |
CN111243070B (zh) | 基于5g通信的虚拟现实呈现方法、系统及装置 | |
KR20190045696A (ko) | 가상 음향 합성 장치 및 방법 | |
KR101408921B1 (ko) | 가상 현실 시스템의 음향 처리 장치 및 방법 | |
TWI640983B (zh) | 室內聲響效應模擬方法 | |
Yilmaz et al. | Role of sounds in perception of enclosure in urban street canyons | |
CN105893452A (zh) | 一种呈现多媒体信息的方法及装置 | |
Chang et al. | Applying deep learning and building information modeling to indoor positioning based on sound | |
CN112927718B (zh) | 感知周围环境的方法、装置、终端和存储介质 | |
Steffens et al. | Acoustically driven orientation and navigation in enclosed spaces | |
CN106057207B (zh) | 远程立体声全方位实时传输和播放方法 | |
Chandak | Efficient geometric sound propagation using visibility culling | |
KR20210056414A (ko) | 혼합 현실 환경들에서 오디오-가능 접속된 디바이스들을 제어하기 위한 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181019 Termination date: 20200620 |