CN105916095A - 反馈延迟网络音色优化的方法 - Google Patents

反馈延迟网络音色优化的方法 Download PDF

Info

Publication number
CN105916095A
CN105916095A CN201610374440.2A CN201610374440A CN105916095A CN 105916095 A CN105916095 A CN 105916095A CN 201610374440 A CN201610374440 A CN 201610374440A CN 105916095 A CN105916095 A CN 105916095A
Authority
CN
China
Prior art keywords
delay
delay line
frequency spectrum
feedback
sigma
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610374440.2A
Other languages
English (en)
Other versions
CN105916095B (zh
Inventor
杨维国
侯欢
周寅腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sound Man (beijing) Technology Co Ltd
Original Assignee
Sound Man (beijing) Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sound Man (beijing) Technology Co Ltd filed Critical Sound Man (beijing) Technology Co Ltd
Priority to CN201610374440.2A priority Critical patent/CN105916095B/zh
Publication of CN105916095A publication Critical patent/CN105916095A/zh
Application granted granted Critical
Publication of CN105916095B publication Critical patent/CN105916095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space

Abstract

本发明涉及一种反馈延迟网络音色优化的方法,在选择反馈延迟网络延迟线的延迟系数时通过以下步骤进行:根据预设选择条件选择确定多个延迟系数组合;计算多个所述延迟系数组合所分别对应的多个频谱平整度值;比较多个所述频谱平整度值,将其中数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合。本发明通过比较多个延迟系数组合对应的多个所述频谱平整度值,将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合,可以使得输出信号的音色高度自然。

Description

反馈延迟网络音色优化的方法
技术领域
本发明属于音频信号处理技术领域,具体涉及一种反馈延迟网络音色优化的方法。
背景技术
基于耳机及扬声器的音频信号的渲染经常会用到对于房间混响模拟。其中基于耳机的渲染包括与扬声器同样的方法和耳机独有的耳机双声道虚拟环绕声的方法。其应用场景如在安静的室内,通过新品信号处理算法,可以通过扬声器播放进行混响处理的音频信号,已达到模拟剧场、山洞的效果。进行此类音频信号处理可以使用将原信号与期望房间的混响进行卷积的方法。但在实际应用中,由于房间混响(即冲击响应)通常为阶数极高的FIR滤波器,应用时导致算法复杂度升高,效率降低。
另外在很多应用中,对于房间的混响需要进行微调或实时变换。冲击响应卷积的方法不能满足此类需求。因此,在实际应用中常使用反馈延迟网络(Feedback DelayNetwork,FDN)的方法进行房间混响的模拟。含有3条延迟线的反馈延迟网络如图1所示。
其中,输入信号为i,输出信号为o,M为延迟线的延迟系数或参数(即延迟的采样点数),Z为z变换符号,g为增益项,q为反馈矩阵元素。图2中的系统可以在时域或频域中使用。当在时域时,g、q为一实数。当在频域时,g、q为一维向量,维度表示频点。
在反馈延迟网络第一次有信号输入时,输入信号i(n)在进入反馈延迟网络时将分别输入至若干个延迟线中。如在图2中,延迟线的数量为3条。在经过延迟线时输入信号将被延迟输出j个采样点。在延迟线输出信号上将加入相应的增益值gj,其取值将在后面详述。最后所有延迟线上的输出信号将被叠加输出,即o(n)。延迟线输出信号在被叠加之前,会被同时输入到反馈系统中。在延迟线的输出信号被反馈至输入端之前,延迟线的输出信号会经过反馈矩阵的混合处理。反馈矩阵的作用为将输入信号进行混合,使得最终输出结果的随机性增加。在房间混响模拟的应用中,这种处理将会使输出信号更具随机性、更像真实房间的混响。混合矩阵的输出信号将被反馈至下一帧的输入端,与下一帧的输入进行叠加。在叠加后的信号x(n)可以全面表征整个反馈延迟系统的性质:
图2系统中的x所在点的信号可用公式1表示:
x 1 ( n ) x 2 ( n ) x 3 ( n ) = q 11 q 12 q 13 q 21 q 22 q 23 q 31 q 32 q 33 g 1 0 0 0 g 2 0 0 0 g 3 x 1 ( n - M 1 ) x 2 ( n - M 2 ) x 3 ( n - M 3 ) + o 1 ( n ) o 2 ( n ) o 3 ( n )
其中,x、q已知。g可由期望的房间反射时间(T60)求得(dB域):
g = - 60 · M T 60 · f s
其中fs为音频信号的采样率。
到这里,只有M的值还未确定。M的选择既影响反馈延迟网络内的增益,又影响延迟时间。实际上,M的选择最终会影响反馈延迟网络在还原房间声学特性的自然度-即人工生成的房间混响和真实房间的混响间在音色等方面的差别。M选择不良会导致最终结果音色失真,虽然目前有人提出M的一些选择条件,但根据该条件选择M后,在实际应用中,发现即使满足上述要求,最终输出的音频信号仍然会有一定的音色失真,严重影响听感。
发明内容
本发明的目的在于解决上述的技术问题而提供一种反馈延迟网络音色优化的方法,旨在利用优化算法得到使得输出信号音色高度自然的延迟线参数。
为实现上述目的,本发明采用如下技术方案:
一种反馈延迟网络音色优化的方法,在选择反馈延迟网络延迟线的延迟系数时通过以下步骤进行;
根据预设选择条件选择确定多个延迟系数组合;
计算多个所述延迟系数组合所分别对应的多个频谱平整度值;
比较多个所述频谱平整度值,将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合。
所述根据预设选择条件选择确定多个延迟系数组合满足下列条件:
iMi≥0.15fs·T60且Max(Mi)≤2.5·Min(Mi),
其中,1≤i≤I,I为延迟线数量,M表示延迟线系数,I条延迟线互质,T60为房间混响,fs为音频信号的采样率。
所述频谱平整度值的计算公式如下:
F l a t n e s s = exp ( 1 K Σ k = 0 K - 1 ln x ( k ) ) 1 K Σ k = 0 K - 1 x ( k )
其中,Flatness为频谱平整度,取值范围为(0,1),fs为音频信号的采样率,x(k)为反馈延迟网络的输出频率响应的幅值,k代表频率。
或者,所述频谱平整度值的计算采用如下公式:
F l a t n e s s = exp ( 1 K Σ k = 0 K - 1 ln Σ i = 1 I G i ( w ) ) 1 K Σ k = 0 K - 1 Σ i = 1 I G i ( w )
其中,Flatness为频谱平整度,取值范围为(0,1),w=2πk,Gi(w)为延迟线的频率响应的幅值,fs为音频信号的采样率,k代表频率,1≤i≤I,I为延迟线数量。
本发明通过比较多个延迟系数组合对应的多个所述频谱平整度值,将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合,可以使得输出信号的音色高度自然。
附图说明
图1为含有3条延迟线的反馈延迟网络的示意图;
图2为含有3条延迟线的反馈延迟网络的具体实施示意图;
图3为满足现有条件的M对应的频率响应图;
图4为本发明优化M后的频率响应图;
图5为满足现有条件的M对应的时间频率响应图;
图6为本发明优化M后的时间频率响应图。
具体实施方式
下面,结合实例对本发明的实质性特点和优势作进一步的说明,但本发明并不局限于所列的实施例。
一种反馈延迟网络音色优化的方法,在选择反馈延迟网络延迟线的延迟系数时通过以下步骤进行;
S101,根据预设选择条件选择确定多个延迟系数组合;
S102,计算多个所述延迟系数组合所分别对应的多个频谱平整度值;
S103,比较多个所述频谱平整度值,将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合。
本发明通过比较多个延迟系数组合对应的多个所述频谱平整度值,将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合,对输入信号按此延迟系数组合进行反馈延迟处理后输出,从而可以使得输出信号的音色高度自然。
本发明中,所述根据预设选择条件选择确定多个延迟系数组合满足下列条件:
iMi≥0.15fs·T60且Max(Mi)≤2.5·Min(Mi),
其中,1≤i≤I,i为正整数,I为延迟线总数量,M表示延迟线系数(Delay LineLengths),I条延迟线互质,T60为房间混响,fs为音频信号的采样率。
所述I条延迟线互质是指包括多条延迟线,如图2所示有3条延迟线,M1,M2,M3,它们之间两两互质。Mi表示第i条延迟线的延迟系数或参数,即延迟的采样点数。该预设选择条件是意思是多条延迟线中的延迟项M的总和大于等于0.15*f s*T60。如图2所示,则为M1+M2+M3大于等于0.15*fs*T60
通过使预先选择的延迟线的延迟系数组合满足上列条件,然后在利用频谱平整度对延迟线的延迟系数M组合进行选择,从而在该条件下选择计算出频谱平整度最接近理想状态的频谱平整度值所对应的延迟线的延迟系数M组合,并利用该延迟线的延迟系数M组合作为反馈延迟网络的延迟优化参数对音色进行优化输出,从而使得输出信号的音色高度自然。
本发明中,所述频谱平整度值的理想的计算公式如下:
F l a t n e s s = exp ( 1 K Σ k = 0 K - 1 ln x ( k ) ) 1 K Σ k = 0 K - 1 x ( k )
其中,fs为音频信号的采样率,Flatness为频谱平整度,取值范围为(0,1),1代表频谱的绝对平整,x(k)为反馈延迟网络的输出频率响应的幅值,k代表频率。
然而在上述优化过程中,通过生成冲击响应再进行优化的方式可能导致模拟时间变长,为缩短模拟时间,上述优化的方法可近似通过频率响应解析解的近似方式得到。因为单条延迟反馈线可等效于一个梳状滤波器,其频率响应解析解H(z)为:
H ( z ) = 1 1 - g · z - M
g为增益如图1所示,M为延迟线延迟参数,故频率响应的幅值G(w)为:
G ( w ) = | H ( e j w ) | = 1 1 - g · e - j w M , - π ≤ w ≤ π
其中e为自然对数,j为虚数符号,w为角频率,故系统总频响x(k)可近似为:
x(k)≈∑iGi(w)
其中,w=2πk,1≤i≤I,I为延迟线数量,所述频谱平整度Flatness的优化计算公式可以近似为如下:
F l a t n e s s = exp ( 1 K Σ k = 0 K - 1 ln Σ i = 1 I G i ( w ) ) 1 K Σ k = 0 K - 1 Σ i = 1 I G i ( w )
通过此近似的优化公式可以大大缩短模拟时间,加快进程。
频率响应比较,参见图3‐6所示:
图3是满足预设选择条件下选择的M的频率响应,图4是满足预设选择条件且使频谱平整度值最大条件下的频率响应,可以看出通过频谱平整度优化的频谱更平整。
图5是满足预设选择条件下选择的M的时间频率响应,图6是满足预设选择条件且使频谱平整度值最大条件下的时间频率响应,可见通过频谱平整度优化的结果的时间频率谱更均匀、随机,即更自然,像真实测量的房间Late部分频响。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种反馈延迟网络音色优化的方法,其特征在于,在选择反馈延迟网络延迟线的延迟系数时通过以下步骤进行;
根据预设选择条件选择确定多个延迟系数组合;
计算多个所述延迟系数组合所分别对应的多个频谱平整度值;
比较多个所述频谱平整度值,将其中的数值最大的频谱平整度值对应的延迟系数组合作为反馈延迟网络延迟线的延迟系数组合。
2.根据权利要求1所述反馈延迟网络音色优化的方法,其特征在于,所述根据预设选择条件选择确定多个延迟系数组合满足下列条件:
iMi≥0.15fs·T60且Max(Mi)≤2.5·Min(Mi),
其中,1≤i≤I,I为延迟线数量,M表示延迟线系数,I条延迟线互质,T60为房间混响,fs为音频信号的采样率。
3.根据权利要求1或2所述反馈延迟网络音色优化的方法,其特征在于,所述频谱平整度值的计算公式如下:
F l a t n e s s = exp ( 1 K Σ k = 0 K - 1 ln x ( k ) ) 1 K Σ k = 0 K - 1 x ( k )
其中,Flatness为频谱平整度,取值范围为(0,1),fs为音频信号的采样率,x(k)为反馈延迟网络的输出频率响应的幅值,k代表频率。
4.根据权利要求1或2所述反馈延迟网络音色优化的方法,其特征在于,所述频谱平整度值的计算采用如下公式:
F l a t n e s s = exp ( 1 K Σ k = 0 K - 1 ln Σ i = 1 I G i ( w ) ) 1 K Σ k = 0 K - 1 Σ i = 1 I G i ( w )
其中,Flatness为频谱平整度,取值范围为(0,1),w=2πk,Gi(w)为第i条延迟线的频率响应的幅值,fs为音频信号的采样率,k代表频率,1≤i≤I,I为延迟线数量。
CN201610374440.2A 2016-05-31 2016-05-31 反馈延迟网络音色优化的方法 Active CN105916095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610374440.2A CN105916095B (zh) 2016-05-31 2016-05-31 反馈延迟网络音色优化的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610374440.2A CN105916095B (zh) 2016-05-31 2016-05-31 反馈延迟网络音色优化的方法

Publications (2)

Publication Number Publication Date
CN105916095A true CN105916095A (zh) 2016-08-31
CN105916095B CN105916095B (zh) 2017-08-04

Family

ID=56742772

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610374440.2A Active CN105916095B (zh) 2016-05-31 2016-05-31 反馈延迟网络音色优化的方法

Country Status (1)

Country Link
CN (1) CN105916095B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570874A (zh) * 2018-06-05 2019-12-13 中国科学院声学研究所 一种用于监测野外鸟类鸣声强度及分布的系统及其方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050156771A1 (en) * 2004-01-16 2005-07-21 Melanson John L. Look-ahead delta sigma modulator having an infinite impulse response filter with multiple look-ahead outputs
CN101136197A (zh) * 2007-10-16 2008-03-05 得理微电子(上海)有限公司 基于时变延迟线的数字混响处理器
CN101421781A (zh) * 2006-04-04 2009-04-29 杜比实验室特许公司 音频信号的感知响度和/或感知频谱平衡的计算和调整
CN102257562A (zh) * 2008-12-19 2011-11-23 杜比国际公司 用空间线索参数对多通道音频信号应用混响的方法和装置
CN102543094A (zh) * 2010-12-07 2012-07-04 来得声有限公司 产生具有声音增强效果的音频信号的装置和方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050156771A1 (en) * 2004-01-16 2005-07-21 Melanson John L. Look-ahead delta sigma modulator having an infinite impulse response filter with multiple look-ahead outputs
CN101421781A (zh) * 2006-04-04 2009-04-29 杜比实验室特许公司 音频信号的感知响度和/或感知频谱平衡的计算和调整
CN101136197A (zh) * 2007-10-16 2008-03-05 得理微电子(上海)有限公司 基于时变延迟线的数字混响处理器
CN102257562A (zh) * 2008-12-19 2011-11-23 杜比国际公司 用空间线索参数对多通道音频信号应用混响的方法和装置
CN102543094A (zh) * 2010-12-07 2012-07-04 来得声有限公司 产生具有声音增强效果的音频信号的装置和方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570874A (zh) * 2018-06-05 2019-12-13 中国科学院声学研究所 一种用于监测野外鸟类鸣声强度及分布的系统及其方法
CN110570874B (zh) * 2018-06-05 2021-10-22 中国科学院声学研究所 一种用于监测野外鸟类鸣声强度及分布的系统及其方法

Also Published As

Publication number Publication date
CN105916095B (zh) 2017-08-04

Similar Documents

Publication Publication Date Title
CN102652337B (zh) 用于声通信的设备和方法
CN104219604B (zh) 一种扬声器阵列的立体声回放方法
CN106572419B (zh) 一种立体声音效增强系统
CN106604179A (zh) 处理音频信号
CN101577848B (zh) 一种重低音增强方法及系统
CN105900457A (zh) 用于设计和应用数值优化的双耳房间脉冲响应的方法和系统
CN103067629B (zh) 回声消除装置
CN101714861B (zh) 谐波产生装置及其产生方法
CN102610235A (zh) 混音处理方法、装置及智能设备
CN104581610A (zh) 一种虚拟立体声合成方法及装置
CN112565981B (zh) 啸叫抑制方法、装置、助听器及存储介质
CN106340303A (zh) 一种基于时间频率域的语音降噪方法
CN108886650A (zh) 用于音频再现的子带空间和串扰消除
CN106875953A (zh) 模拟混音音频处理方法及系统
CN102915741A (zh) 基于等响曲线的根据音量调整自动还原声音信号音色的方法
CN103413557A (zh) 语音信号带宽扩展的方法和装置
CN105516881A (zh) 耳机虚拟环绕声信号处理方法、装置及系统
CN101447189A (zh) 一种语音干扰方法
CN105916095B (zh) 反馈延迟网络音色优化的方法
CN108597531A (zh) 一种通过多声源活动检测来改进双通道盲信号分离的方法
US20110235815A1 (en) Method and arrangement for audio signal processing
EP1250830A1 (en) Method and device for determining the quality of a signal
US8059824B2 (en) Joint sound synthesis and spatialization
KR100684029B1 (ko) 푸리에 변환을 이용한 배음 생성 방법 및 이를 위한 장치,다운 샘플링에 의한 배음 생성 방법 및 이를 위한 장치와소리 보정 방법 및 이를 위한 장치
CN102523553B (zh) 一种针对移动终端设备并基于声源内容的全息音频方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20191213

Granted publication date: 20170804

PD01 Discharge of preservation of patent
PD01 Discharge of preservation of patent

Date of cancellation: 20200306

Granted publication date: 20170804