CN112989566B

CN112989566B - 基于a-加权方差的几何声音传播优化方法

Info

Publication number: CN112989566B
Application number: CN202110162275.5A
Authority: CN
Inventors: 任重; 周昆; 周洪杨
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2021-02-05
Filing date: 2021-02-05
Publication date: 2022-11-11
Anticipated expiration: 2041-02-05
Also published as: CN112989566A

Abstract

本发明公开了一套自适应的基于几何声学的声音传播仿真方法，该方法能够基于A‑加权方差指标动态调节所需的采样数，以减少冗余的运算量，提升运算效率，提高生成的声音传播仿真效果质量。该方法主要包括如下步骤：1)输入：获取需要进行传播的原始音频和虚拟场景；2)采样数估算：使用测试射线计算单个采样的A‑加权方差，并估算实际需要的采样数量；3)传播：使用上述估算的采样数进行虚拟场景的冲激响应计算；4)输出：得到人耳可听或可用于后续分析的，传播后的音频结果。本发明可以和普遍使用的各类几何声学声音传播仿真框架结合，运用在虚拟现实、建筑声学等领域中，适用于各种不同的声音传播场景、原始音频、采样方式，具有较高普适性和稳定性。

Description

基于A-加权方差的几何声音传播优化方法

技术领域

本发明涉及计算机图形学中的仿真领域，尤其涉及一种使用基于几何声学进行虚拟环境内声音传播的方法。

背景技术

虚拟场景的声音传播仿真，在建筑设计、虚拟现实、数字娱乐等领域都有广泛的需求。基于几何声学的声音传播仿真，由于其运算效率远高于其他方法，能够在短时间内生成高真实感的声音仿真结果，在上述领域得到大量应用。本发明背景的几何方法所使用的技术，主要为基于路径追踪的算法，从声源出发出射线以表示声音能量，经过场景的反射、折射、穿透后，在听众的位置被收集，得到声音传播后的结果；发出的射线数即采样数越高，声音传播的结果就越精确。然而目前还没有针对性的方法，来提升声音传播仿真的质量。在进行相应任务时，用户只能依靠个人经验和尝试来确定采样的数量，容易引起无用采样过多、无用开销过大、不同时间点上声音仿真质量上下波动等问题。因此，本发明通过使用A-加权方差指标，将声音传播的采样数这一参数，与最终生成的音频乃至听众的感知相联系，并在此基础上提出本发明的方法，以优化声音传播的质量。

发明内容

本发明的目的在于针对现有声音传播仿真在运算效率、质量稳定性的不足，提供一种基于A-加权方差的几何声音传播优化方法，以平衡采样数量，提升音频仿真质量，满足用户需求，提升用户体验。

本发明的目的是通过以下技术方案来实现的：一种基于A-加权方差的几何声音传播优化方法，包括以下步骤：

(1)输入：获取需要进行传播的原始音频和虚拟场景；

(2)采样数估算：使用测试射线计算单个采样的A-加权方差，并估算实际需要的采样数量；

(3)传播：使用上述估算的采样数来计算虚拟场景的冲激响应；

(4)输出：得到人耳可听或可用于后续分析的，传播后的音频结果。

进一步地，所述步骤(1)包括如下子步骤：

(1.1)通过演奏设备、录音设备、计算机合成等方式，采集输入音频F；

(1.2)通过三维扫描、计算机建模等方式，构建虚拟场景M；

(1.3)在虚拟场景M中，根据用户需要指定声源位置S，和听众位置L。

(1.4)给定基于几何的路径追踪方法P，它可以是前向、后向、双向等路径追踪方法。

进一步地，所述步骤(2)包括如下子步骤：

(2.1)指定测试射线的采样数量N_t，该数量远小于实际进行仿真所需的采样数量，如32。在声源S和听众L之间，使用路径追踪方法生成N_t条独立的射线，并以每条射线为单位，使用方法P生成对应的冲激响应IR1,IR2,……,IR_Nt。

(2.2)对(2.1)中的IR进行傅里叶变换，得到一组频率响应FR1,FR2,……,FR_Nt。计算这些频率响应的方差，得到不同频率上的方差函数V_T。

(2.3)对输入信号进行傅里叶变换，得到其频率FR_F。将其平方后与V_T相乘，再利用A-权重进行加权求和，得到当前声音传播条件(M,S,L)下的单个采样的A-加权方差V。

(2.4)给定期望的方差值V₀，通过V/V₀×N_t，计算出后续步骤需要的采样数N_E。

进一步地，所述步骤(3)包括如下子步骤：

(3.1)比较步骤(2.1)与(2.3)中的N_t与N_E。若N_E小于N_t，则把步骤(2.1)中测试射线采样生成的IR平均，得到表示场景声音传播效果的IR_E。

(3.2)若(3.1)中的N_E大于Nt，则使用数量为N_E的采样，使用方法P进行几何声音传播仿真，得到结果IR_E。

进一步地，所述步骤(4)包括如下子步骤：

(4.1)将IR_E与输入音频F卷积，得到传播后的音频F_E。

(4.2)将(4.1)得到的音频F_E通过扬声器、耳机等设备播放，即可使用户听到经过虚拟场景传播的、具有真实感的音频；或使用声学软件对F_E进行分析，可了解虚拟建筑等场景中声音传播的效果。

本发明的有益效果是，本发明能以相比已有方法更高的效率，对声音在空间中的传播进行仿真，并使得达到同样质量所需要的运算更快，成本更低。理论推导和实验结果都表明，本发明能与后向路径追踪、双向路径追踪等不同的声音传播方法结合，并都能得到理想的优化结果，具有较强的可扩展性和应用空间。在不同的声音传播场景和输入音频条件下进行测试，本发明都具备适用性，能起到动态分配采样数、减少不必要运算量、保证输出音频质量稳定的作用。心理学实验证明，经过本发明优化的声音传播结果，相比原始的声音传播结果，在听众感知中没有质量的差异，可见本发明能在满足听众实际感知需要的条件下，降低运算量，优化质量。

具体实施方式

本发明的具体实施方式如下：

1、输入：获取需要进行传播的原始音频和虚拟场景，包括以下子步骤：

1.1通过演奏设备、录音设备、计算机合成等方式，采集输入音频F：

音频在采集或生成后，保存为数据文件格式，并由程序解析为波形数据。音频可以是人声、自然音效或音乐演奏等。

1.2通过三维扫描、计算机建模等方式，构建虚拟场景M：

虚拟场景以三角形网格的方式表示。为提升后续运算的效率，虚拟场景需要经过程序自动简面，以及手工简化模型，去掉对声音传播影响较少而面数较为复杂的物件。

1.3在虚拟场景M中，根据用户需要指定声源位置S，和听众位置L：

该步骤中S与L都用三维坐标(x,y,z)表示，用来标注发出和接收声音的位置。

1.4给定基于几何的路径追踪方法P，它可以是前向、后向、双向等路径追踪方法：

该步骤的方法P，基于几何与路径追踪的声音传播方法都能够满足要求。P需要满足如下条件：1、通过蒙特卡洛方法，以大量采样，计算声音传播的结果；2、所有采样满足独立同分布条件。

2、采样数估算：使用测试射线计算单个采样的A-加权方差，并估算实际需要的采样数量，包括以下子步骤：

2.1指定测试射线的采样数量N_t，该数量远小于实际进行仿真所需的采样数量，如32。在声源S和听众L之间，使用路径追踪方法生成N_t条独立的射线，并以每条射线为单位，使用方法P生成对应的冲激响应IR1,IR2,……,IR_Nt：

在此步骤运用方法P的过程中，需要进行完整的声音传播流程，包括射线生成、反射、能量收集、带通滤波、HRTF等。由于该流程能量收集后的所有步骤都为卷积操作，故一次使用多条射线的仿真结果能被拆分成每一条射线独立的结果。

2.2对2.1中的IR进行傅里叶变换，得到一组频率响应FR1,FR2,……,FR_Nt。计算这些频率响应的方差，得到不同频率上的方差函数V_T：

该步骤计算方差时，每次取一个频域上的点，取出所有频率响应在该点的值，计算这组频率的方差，即为方差函数V_T在该频率上的值。当所有值都计算后，即可得到V_T。

2.3对输入信号进行傅里叶变换，得到其频率FR_F。将其平方后与V_T相乘，再利用A-权重进行加权求和，得到当前声音传播条件(M,S,L)下的单个采样的A-加权方差V：

该步骤在平方与相乘后仍然为频域上的函数的形式，而A-加权求和把函数上的方差汇总为一个值。加权求和时，由于求和的对象为方差，使用原始A-权重曲线的平方，作为实际的求和权重。

2.4给定期望的方差值V₀，通过V/V₀×N_t，计算出后续步骤需要的采样数N_E：

该步骤的V₀由用户根据需求给定。较小的V₀，意味着较小的方差，即仿真的声音传播精度较高，但需要较大的计算开销和较长的运算时间。反之亦然。

3、传播：使用上述估算的采样数来计算虚拟场景的冲激响应，包括以下步骤：

3.1比较步骤2.1与2.3中的N_t与N_E。若N_E小于N_t，则把步骤2.1中测试射线采样生成的IR平均，得到表示场景声音传播效果的IR_E：

该情形下，已经使用测试射线生成的仿真精度已经能够满足用户需求，使用已有的结果作为该次仿真的结果。

3.2若(3.1)中的N_E大于Nt，则使用数量为N_E的采样，使用方法P进行几何声音传播仿真，得到结果IR_E：

该情形下，仍需要更多的采样才能满足需求，使用基于几何的声音传播仿真算法进行仿真。但其中的采样数参数N，已经由步骤2得到，能够恰好满足用户对精度的需求，并可以随着声音传播条件(M,S,L)的变化起到动态调节的效果。

4、输出：得到人耳可听或可用于后续分析的，传播后的音频结果，包括以下步骤：

4.1将IR_E与输入音频F卷积，得到传播后的音频F_E：

如果在算法P中，将通过HRTF等方式，生成双耳或多个声道的响应，那么上述估算N_E可以采用双耳的估计值平均的方式，在本卷积步骤中，也可以将多个声道的IR分别与F进行卷积，得到多个通道的声音结果。

4.2将步骤4.1得到的音频F_E通过扬声器、耳机等设备播放，即可使用户听到经过虚拟场景传播的、具有真实感的音频；或使用声学软件对F_E进行分析，可了解虚拟建筑等场景中声音传播的效果。

该步骤为通过仿真方法生成的音频的应用。由于基于几何的声音传播仿真用途十分广泛，这些场景都是本发明能够与之协作的领域。

实施实例

在一台配备Intel Core i7-3770中央处理器，16GB内存的计算机上实现本发明的实施实例。程序使用Matlab编写，采用所有在具体实施方式中列出的参数值，得到了符合设计要求的实验结果。采用本发明的方法，能够把输出音频的A-加权方差指标，控制在用户给定指标之下，保证音频质量不低于用户的需求。而采用传统固定采样数的方法，在某些时候方差会过低，意味着过多的冗余运算；而另一些时候方差会过高，意味着采样数不足，音频仿真质量无法满足用户要求。本发明在不同的虚拟场景、输入音频条件下，都达到了理想的效果。使用后向路径追踪与双向路径追踪作为声音传播方法，都能够起到调节音频质量的作用。

Claims

1.一种基于A-加权方差的几何声音传播优化方法，其特征在于，包括如下步骤：

（1）获取需要进行传播的原始音频和虚拟场景；

（2）使用测试射线计算单个采样的A-加权方差，并估算实际需要的采样数量；

（3）使用步骤2估算的采样数来计算虚拟场景的冲激响应；

（4）得到人耳可听或可用于后续分析的，传播后的音频结果；

所述步骤（1）包括如下子步骤：

(1.1) 通过演奏设备、录音设备、计算机合成方式，采集输入音频F；

(1.2) 通过三维扫描、计算机建模方式，构建虚拟场景M；

(1.3) 在虚拟场景M中，根据用户需要指定声源位置S，和听众位置L；

(1.4) 给定基于几何的路径追踪方法P，它可以是前向、后向或双向路径追踪方法；

所述步骤（2）包括如下子步骤：

(2.1) 指定测试射线的采样数量N_t，该数量远小于实际进行仿真所需的采样数量；在声源S和听众L之间，使用路径追踪方法生成N_t条独立的射线，并以每条射线为单位，使用方法P生成对应的冲激响应IR₁, IR₂, ……, IR_Nt；

(2.2) 对步骤(2.1)中的IR进行傅里叶变换，得到一组频率响应FR₁, FR₂, ……, FR_Nt；计算这些频率响应的方差，得到不同频率上的方差函数V_T；

(2.3) 对输入信号进行傅里叶变换，得到其频率FR_F；将其平方后与V_T相乘，再利用A-权重进行加权求和，得到当前声音传播条件（M, S, L）下的单个采样的A-加权方差V；

(2.4) 给定期望的方差值V₀，通过V/V₀×N_t，计算出后续步骤需要的采样数N_E；

所述步骤（3）包括如下子步骤：

(3.1) 比较步骤(2.1)与(2.3)中的N_t与N_E；若N_E小于N_t，则把步骤(2.1)中测试射线采样生成的IR平均，得到表示场景声音传播效果的IR_E；

(3.2) 若(3.1)中的N_E大于N_t，则使用数量为N_E的采样，使用方法P进行几何声音传播仿真，得到结果IR_E。

2.根据权利要求1所述的基于A-加权方差的几何声音传播优化方法，其特征在于，所述步骤（4）包括如下子步骤：

(4.1) 将IR_E与输入音频F卷积，得到传播后的音频F_E；

(4.2) 将(4.1)得到的音频F_E通过扬声器、耳机播放，即可使用户听到经过虚拟场景传播的、具有真实感的音频；或使用声学软件对F_E进行分析，可了解虚拟建筑场景中声音传播的效果。