CN105916095A

CN105916095A - 反馈延迟网络音色优化的方法

Info

Publication number: CN105916095A
Application number: CN201610374440.2A
Authority: CN
Inventors: 杨维国; 侯欢; 周寅腾
Original assignee: Sound Man (beijing) Technology Co Ltd
Current assignee: Sound Man (beijing) Technology Co Ltd
Priority date: 2016-05-31
Filing date: 2016-05-31
Publication date: 2016-08-31
Anticipated expiration: 2036-05-31
Also published as: CN105916095B

Abstract

本发明涉及一种反馈延迟网络音色优化的方法，在选择反馈延迟网络延迟线的延迟系数时通过以下步骤进行：根据预设选择条件选择确定多个延迟系数组合；计算多个所述延迟系数组合所分别对应的多个频谱平整度值；比较多个所述频谱平整度值，将其中数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合。本发明通过比较多个延迟系数组合对应的多个所述频谱平整度值，将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合，可以使得输出信号的音色高度自然。

Description

反馈延迟网络音色优化的方法

技术领域

本发明属于音频信号处理技术领域，具体涉及一种反馈延迟网络音色优化的方法。

背景技术

基于耳机及扬声器的音频信号的渲染经常会用到对于房间混响模拟。其中基于耳机的渲染包括与扬声器同样的方法和耳机独有的耳机双声道虚拟环绕声的方法。其应用场景如在安静的室内，通过新品信号处理算法，可以通过扬声器播放进行混响处理的音频信号，已达到模拟剧场、山洞的效果。进行此类音频信号处理可以使用将原信号与期望房间的混响进行卷积的方法。但在实际应用中，由于房间混响(即冲击响应)通常为阶数极高的FIR滤波器，应用时导致算法复杂度升高，效率降低。

另外在很多应用中，对于房间的混响需要进行微调或实时变换。冲击响应卷积的方法不能满足此类需求。因此，在实际应用中常使用反馈延迟网络(Feedback DelayNetwork,FDN)的方法进行房间混响的模拟。含有3条延迟线的反馈延迟网络如图1所示。

其中，输入信号为i，输出信号为o，M为延迟线的延迟系数或参数(即延迟的采样点数)，Z为z变换符号，g为增益项，q为反馈矩阵元素。图2中的系统可以在时域或频域中使用。当在时域时，g、q为一实数。当在频域时，g、q为一维向量，维度表示频点。

在反馈延迟网络第一次有信号输入时，输入信号i(n)在进入反馈延迟网络时将分别输入至若干个延迟线中。如在图2中，延迟线的数量为3条。在经过延迟线时输入信号将被延迟输出j个采样点。在延迟线输出信号上将加入相应的增益值g_j，其取值将在后面详述。最后所有延迟线上的输出信号将被叠加输出，即o(n)。延迟线输出信号在被叠加之前，会被同时输入到反馈系统中。在延迟线的输出信号被反馈至输入端之前，延迟线的输出信号会经过反馈矩阵的混合处理。反馈矩阵的作用为将输入信号进行混合，使得最终输出结果的随机性增加。在房间混响模拟的应用中，这种处理将会使输出信号更具随机性、更像真实房间的混响。混合矩阵的输出信号将被反馈至下一帧的输入端，与下一帧的输入进行叠加。在叠加后的信号x(n)可以全面表征整个反馈延迟系统的性质：

图2系统中的x所在点的信号可用公式1表示：

[\begin{matrix} x_{1} (n) \\ x_{2} (n) \\ x_{3} (n) \end{matrix}] = [\begin{matrix} q_{11} & q_{12} & q_{13} \\ q_{21} & q_{22} & q_{23} \\ q_{31} & q_{32} & q_{33} \end{matrix}] [\begin{matrix} g_{1} & 0 & 0 \\ 0 & g_{2} & 0 \\ 0 & 0 & g_{3} \end{matrix}] [\begin{matrix} x_{1} (n - M_{1}) \\ x_{2} (n - M_{2}) \\ x_{3} (n - M_{3}) \end{matrix}] + [\begin{matrix} o_{1} (n) \\ o_{2} (n) \\ o_{3} (n) \end{matrix}]

其中，x、q已知。g可由期望的房间反射时间(T60)求得(dB域)：

g = - \frac{60 \cdot M}{T 60 \cdot f s}

其中fs为音频信号的采样率。

到这里，只有M的值还未确定。M的选择既影响反馈延迟网络内的增益，又影响延迟时间。实际上，M的选择最终会影响反馈延迟网络在还原房间声学特性的自然度-即人工生成的房间混响和真实房间的混响间在音色等方面的差别。M选择不良会导致最终结果音色失真，虽然目前有人提出M的一些选择条件，但根据该条件选择M后，在实际应用中，发现即使满足上述要求，最终输出的音频信号仍然会有一定的音色失真，严重影响听感。

发明内容

本发明的目的在于解决上述的技术问题而提供一种反馈延迟网络音色优化的方法，旨在利用优化算法得到使得输出信号音色高度自然的延迟线参数。

为实现上述目的，本发明采用如下技术方案：

一种反馈延迟网络音色优化的方法，在选择反馈延迟网络延迟线的延迟系数时通过以下步骤进行；

根据预设选择条件选择确定多个延迟系数组合；

计算多个所述延迟系数组合所分别对应的多个频谱平整度值；

比较多个所述频谱平整度值，将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合。

所述根据预设选择条件选择确定多个延迟系数组合满足下列条件：

∑_iM_i≥0.15fs·T60且Max(M_i)≤2.5·Min(M_i),

其中，1≤i≤I，I为延迟线数量,M表示延迟线系数，I条延迟线互质，T60为房间混响，fs为音频信号的采样率。

所述频谱平整度值的计算公式如下：

F l a t n e s s = \frac{\exp (\frac{1}{K} Σ_{k = 0}^{K - 1} \ln x (k))}{\frac{1}{K} Σ_{k = 0}^{K - 1} x (k)}

其中，Flatness为频谱平整度，取值范围为(0,1)，fs为音频信号的采样率，x(k)为反馈延迟网络的输出频率响应的幅值，k代表频率。

或者，所述频谱平整度值的计算采用如下公式：

F l a t n e s s = \frac{\exp (\frac{1}{K} Σ_{k = 0}^{K - 1} \ln Σ_{i = 1}^{I} G_{i} (w))}{\frac{1}{K} Σ_{k = 0}^{K - 1} Σ_{i = 1}^{I} G_{i} (w)}

其中,Flatness为频谱平整度，取值范围为(0,1)，w＝2πk,G_i(w)为延迟线的频率响应的幅值，fs为音频信号的采样率，k代表频率，1≤i≤I，I为延迟线数量。

本发明通过比较多个延迟系数组合对应的多个所述频谱平整度值，将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合，可以使得输出信号的音色高度自然。

附图说明

图1为含有3条延迟线的反馈延迟网络的示意图；

图2为含有3条延迟线的反馈延迟网络的具体实施示意图；

图3为满足现有条件的M对应的频率响应图；

图4为本发明优化M后的频率响应图；

图5为满足现有条件的M对应的时间频率响应图；

图6为本发明优化M后的时间频率响应图。

具体实施方式

下面，结合实例对本发明的实质性特点和优势作进一步的说明，但本发明并不局限于所列的实施例。

S101，根据预设选择条件选择确定多个延迟系数组合；

S102，计算多个所述延迟系数组合所分别对应的多个频谱平整度值；

S103，比较多个所述频谱平整度值，将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合。

本发明通过比较多个延迟系数组合对应的多个所述频谱平整度值，将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合，对输入信号按此延迟系数组合进行反馈延迟处理后输出，从而可以使得输出信号的音色高度自然。

本发明中，所述根据预设选择条件选择确定多个延迟系数组合满足下列条件：

∑_iM_i≥0.15fs·T60且Max(M_i)≤2.5·Min(M_i)，

其中，1≤i≤I，i为正整数，I为延迟线总数量,M表示延迟线系数(Delay LineLengths)，I条延迟线互质，T60为房间混响，fs为音频信号的采样率。

所述I条延迟线互质是指包括多条延迟线，如图2所示有3条延迟线，M₁，M₂，M₃，它们之间两两互质。M_i表示第i条延迟线的延迟系数或参数，即延迟的采样点数。该预设选择条件是意思是多条延迟线中的延迟项M的总和大于等于0.15*f s*T60。如图2所示，则为M₁+M₂+M₃大于等于0.15*fs*T60

通过使预先选择的延迟线的延迟系数组合满足上列条件，然后在利用频谱平整度对延迟线的延迟系数M组合进行选择，从而在该条件下选择计算出频谱平整度最接近理想状态的频谱平整度值所对应的延迟线的延迟系数M组合，并利用该延迟线的延迟系数M组合作为反馈延迟网络的延迟优化参数对音色进行优化输出，从而使得输出信号的音色高度自然。

本发明中，所述频谱平整度值的理想的计算公式如下：

F l a t n e s s = \frac{\exp (\frac{1}{K} Σ_{k = 0}^{K - 1} \ln x (k))}{\frac{1}{K} Σ_{k = 0}^{K - 1} x (k)}

其中，fs为音频信号的采样率，Flatness为频谱平整度，取值范围为(0,1)，1代表频谱的绝对平整，x(k)为反馈延迟网络的输出频率响应的幅值，k代表频率。

然而在上述优化过程中，通过生成冲击响应再进行优化的方式可能导致模拟时间变长，为缩短模拟时间，上述优化的方法可近似通过频率响应解析解的近似方式得到。因为单条延迟反馈线可等效于一个梳状滤波器，其频率响应解析解H(z)为：

H (z) = \frac{1}{1 - g \cdot z^{- M}}

g为增益如图1所示，M为延迟线延迟参数，故频率响应的幅值G(w)为：

G (w) = | H (e^{j w}) | = \frac{1}{1 - g \cdot e^{- j w M}}, - π \leq w \leq π

其中e为自然对数，j为虚数符号，w为角频率，故系统总频响x(k)可近似为：

x(k)≈∑_iG_i(w)

其中，w＝2πk,1≤i≤I,I为延迟线数量，所述频谱平整度Flatness的优化计算公式可以近似为如下：

F l a t n e s s = \frac{\exp (\frac{1}{K} Σ_{k = 0}^{K - 1} \ln Σ_{i = 1}^{I} G_{i} (w))}{\frac{1}{K} Σ_{k = 0}^{K - 1} Σ_{i = 1}^{I} G_{i} (w)}

通过此近似的优化公式可以大大缩短模拟时间，加快进程。

频率响应比较，参见图3‐6所示:

图3是满足预设选择条件下选择的M的频率响应，图4是满足预设选择条件且使频谱平整度值最大条件下的频率响应，可以看出通过频谱平整度优化的频谱更平整。

图5是满足预设选择条件下选择的M的时间频率响应，图6是满足预设选择条件且使频谱平整度值最大条件下的时间频率响应，可见通过频谱平整度优化的结果的时间频率谱更均匀、随机，即更自然，像真实测量的房间Late部分频响。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种反馈延迟网络音色优化的方法，其特征在于，在选择反馈延迟网络延迟线的延迟系数时通过以下步骤进行；

根据预设选择条件选择确定多个延迟系数组合；

2.根据权利要求1所述反馈延迟网络音色优化的方法，其特征在于，所述根据预设选择条件选择确定多个延迟系数组合满足下列条件：

∑_iM_i≥0.15fs·T60且Max(M_i)≤2.5·Min(M_i),

3.根据权利要求1或2所述反馈延迟网络音色优化的方法，其特征在于，所述频谱平整度值的计算公式如下：

F l a t n e s s = \frac{\exp (\frac{1}{K} Σ_{k = 0}^{K - 1} \ln x (k))}{\frac{1}{K} Σ_{k = 0}^{K - 1} x (k)}

4.根据权利要求1或2所述反馈延迟网络音色优化的方法，其特征在于，所述频谱平整度值的计算采用如下公式：

F l a t n e s s = \frac{\exp (\frac{1}{K} Σ_{k = 0}^{K - 1} \ln Σ_{i = 1}^{I} G_{i} (w))}{\frac{1}{K} Σ_{k = 0}^{K - 1} Σ_{i = 1}^{I} G_{i} (w)}

其中，Flatness为频谱平整度，取值范围为(0,1)，w＝2πk,G_i(w)为第i条延迟线的频率响应的幅值，fs为音频信号的采样率，k代表频率，1≤i≤I，I为延迟线数量。