CN104392727A - 音频信号处理方法和相关装置 - Google Patents
音频信号处理方法和相关装置 Download PDFInfo
- Publication number
- CN104392727A CN104392727A CN201410637750.XA CN201410637750A CN104392727A CN 104392727 A CN104392727 A CN 104392727A CN 201410637750 A CN201410637750 A CN 201410637750A CN 104392727 A CN104392727 A CN 104392727A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- vector
- matrix
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 77
- 238000003672 processing method Methods 0.000 title claims abstract description 19
- 239000013598 vector Substances 0.000 claims abstract description 256
- 239000011159 matrix material Substances 0.000 claims abstract description 142
- 230000003044 adaptive effect Effects 0.000 claims abstract description 116
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims abstract description 71
- 238000012545 processing Methods 0.000 claims abstract description 62
- 238000000034 method Methods 0.000 claims description 53
- 238000001914 filtration Methods 0.000 claims description 30
- 238000010276 construction Methods 0.000 claims description 6
- 239000011248 coating agent Substances 0.000 claims 2
- 238000000576 coating method Methods 0.000 claims 2
- 239000000758 substrate Substances 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 108
- 238000009432 framing Methods 0.000 description 10
- 230000006399 behavior Effects 0.000 description 7
- 230000009286 beneficial effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000002349 favourable effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 229960001948 caffeine Drugs 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N trimethylxanthine Natural products CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例提供了一种音频信号处理方法和相关装置。一种音频信号处理方法,包括:根据音频输入信号构建输入矢量;根据参考音频输入信号构建参考输入矩阵;利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。本发明实施例提供的方案有利于扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围。
Description
技术领域
本发明涉及音频信号处理技术,具体涉及音频信号处理方法和相关装置。
背景技术
在通信等领域中,对回声和噪声进行处理都是非常常见且也是非常必要的技术手段。回声消除和噪声消除技术很多时候会用到自适应滤波技术。可以通过收敛速度、稳态误差和计算复杂度等参量来评价用于回声消除和噪声消除的自适应滤波技术的好坏。
随着自适应滤波技术的发展,出现了许多可以应用于回声消除和噪声消除的自适应滤波器。其中一类是基于最小均方原理的自适应滤波器,这种自适应滤波器的计算复杂度相对较低,但是收敛速度相对慢一些,收敛后的稳态误差也相对要大一些。另一类是基于最小二乘原理的自适应滤波器,这种自适应滤波器的计算复杂度相对较高,但收敛速度比基于最小均方原理的自适应滤波器相对要快些。综合计算复杂度和收敛速度等因素的考虑,业内有些学者提出基于仿射投影算法(英文:Affine Projection Algorithm,缩写:APA)的自适应滤波器,其稳态误差与基于最小均方原理的自适应滤波器基本相当,但是在收敛速度和计算复杂度方面达到了较好平衡。
测试发现,基于仿射投影算法的自适应滤波器的计算复杂度高于最小均方原理的自适应滤波器,但是低于基于最小二乘原理的自适应滤波器,其收敛速度在二者之间。然而,传统基于仿射投影算法的自适应滤波器使用固定的仿射投影阶数,实践过程中发现,使用固定仿射投影阶数通常使得滤波器系数矢量不同部分的更新速率的调整范围非常有限。
发明内容
本发明实施例提供了音频信号处理方法和相关装置,以期扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围。
本发明实施例第一方面提供一种音频信号处理方法,包括:
根据音频输入信号构建输入矢量;
根据参考音频输入信号构建参考输入矩阵;
利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
结合第一方面,在第一方面的第一种可能的实施方式中,
所述音频输入信号为近端音频输入信号,且所述参考音频输入信号为远端音频输入信号;或者所述音频输入信号为待降噪音频信号,且所述参考音频输入信号为参考噪声信号。
结合第一方面或第一方面的第一种可能的实施方式,在第一方面的第二种可能的实施方式中,所述自适应滤波器的滤波器系数矢量的总长度为L,所述自适应滤波器的滤波器系数矢量具有的所述N个分段中的第k个分段的长度为Lk,其中,k=1,2,...N,所述第k个分段对应的仿射投影阶数为pk,其中,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N}。
结合第一方面的第二种可能的实施方式,在第一方面的第三种可能的实施方式中,
所述参考输入矩阵为X(n),所述X(n)为L×pmax矩阵;
其中,
结合第一方面的第三种可能的实施方式,在第一方面的第四种可能的实施方式中,
所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
结合第一方面的第四种可能的实施方式,在第一方面的第五种可能的实施方式中,所述中的为Lk×pk矩阵,其中,
结合第一方面的第二种可能的实施方式或第一方面的第三种可能的实施方式或第一方面的第四种可能的实施方式或第一方面的第五种可能的实施方式,在第一方面的第六种可能的实施方式中,
D(n)表示所述输入矢量,其中,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T;
其中,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
结合第一方面的第二种可能的实施方式或第一方面的第三种可能的实施方式或第一方面的第四种可能的实施方式或第一方面的第五种可能的实施方式或第一方面的第六种可能的实施方式,在第一方面的第七种可能的实施方式中,所述利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,包括:
根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
结合第一方面的第七种可能的实施方式,在第一方面的第八种可能的实施方式中,所述输出矢量E(n)的前pk行通过如下算法计算得到:
结合第一方面的第八种可能的实施方式,在第一方面的第九种可能的实施方式中,所述H(n)表示所述自适应滤波器的滤波器系数矢量,
其中,H(n)=[h(0) h(1) … h(L-1)]T,
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
结合第一方面的第九种可能的实施方式,在第一方面的第十种可能的实施方式中,
所述方法还包括:对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T(n+1) H2 T(n+1) … HN T(n+1)]T。
结合第一方面的第十种可能的实施方式,在第一方面的第十一种可能的实施方式中,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
本发明实施例第二方面一种音频信号处理装置,包括:
第一构建单元,用于根据音频输入信号构建输入矢量;
第二构建单元,用于根据参考音频输入信号构建参考输入矩阵;
处理单元,用于利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
结合第二方面,在第二方面的第一种可能的实施方式中,
所述音频输入信号为近端音频输入信号,且所述参考音频输入信号为远端音频输入信号;或者所述音频输入信号为待降噪音频信号,且所述参考音频输入信号为参考噪声信号。
结合第二方面或第二方面的第一种可能的实施方式,在第二方面的第二种可能的实施方式中,所述自适应滤波器的滤波器系数矢量的总长度为L,所述自适应滤波器的滤波器系数矢量具有的所述N个分段中的第k个分段的长度为Lk,其中,k=1,2,...N,所述第k个分段对应的仿射投影阶数为pk,其中,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N};
结合第二方面的第二种可能的实施方式,在第二方面的第三种可能的实施方式中,
所述参考输入矩阵为X(n),所述X(n)为L×pmax矩阵;
其中,
结合第二方面的第三种可能的实施方式,在第二方面的第四种可能的实施方式中,
所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
结合第二方面的第四种可能的实施方式,在第二方面的第五种可能的实施方式中,所述中的为Lk×pk矩阵,其中,
结合第二方面的第二种可能的实施方式或第二方面的第三种可能的实施方式或第二方面的第四种可能的实施方式或第二方面的第五种可能的实施方式,在第二方面的第六种可能的实施方式中,
D(n)表示所述输入矢量,其中,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T;
其中,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
结合第二方面的第二种可能的实施方式或第二方面的第三种可能的实施方式或第二方面的第四种可能的实施方式或第二方面的第五种可能的实施方式或第二方面的第六种可能的实施方式,在第二方面的第七种可能的实施方式中,
所述处理单元具体用于,根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
结合第二方面的第七种可能的实施方式,在第二方面的第八种可能的实施方式中,所述处理单元通过如下算法计算得到所述输出矢量E(n)的前pk行:
结合第二方面的第八种可能的实施方式,在第二方面的第九种可能的实施方式中,所述H(n)表示所述自适应滤波器的滤波器系数矢量,
其中,H(n)=[h(0) h(1) … h(L-1)]T,
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
结合第二方面的第九种可能的实施方式,在第二方面的第十种可能的实施方式中,
所述处理单元还用于:对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T(n+1) H2 T(n+1) … HN T(n+1)]T。
结合第二方面的第十种可能的实施方式,在第二方面的第十一种可能的实施方式中,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
可以看出,本发明实施例的技术方案中,在根据音频输入信号和参考音频输入信号分别构建输入矢量和参考输入矩阵之后,利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,由于所述自适应滤波器的滤波器系数矢量具有N个分段,且所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等,这样有利于扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围,进而有利于实现自适应滤波器的滤波器系数矢量不同部分具有不同的更新速率,进而有利于在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种音频信号处理方法的流程示意图;
图2为本发明实施例提供的另一种音频信号处理方法的流程示意图;
图3为本发明实施例提供的另一种音频信号处理方法的流程示意图;
图4为本发明实施例提供的一种音频信号处理装置的示意图;
图5为本发明实施例提供的另一种音频信号处理装置的示意图。
具体实施方式
本发明实施例提供了音频信号处理方法和相关装置,以期扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚,完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
以下分别进行详细说明。
本发明的说明书和权利要求书及上述附图中的术语“第一”,“第二”,“第三”,“第四”等是用于区别不同的对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程,方法,系统,产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程,方法,产品或设备固有的其它步骤或单元。
下面介绍本发明实施例提供的音频信号处理方法,本发明实施例提供的音频信号处理方法的执行主体可为音频信号处理装置,该音频信号处理装置可为任何需要采集,存储或向外传输音频信号的装置,例如手机,平板电脑,个人电脑,笔记本电脑或语音服务器等。
本发明音频信号处理方法的一实施例,一种音频信号处理方法包括:根据音频输入信号构建输入矢量;根据参考音频输入信号构建参考输入矩阵;利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
首先请参见图1,图1为本发明的一个实施例提供的一种音频信号处理方法的流程示意图。其中,如图1所示,本发明实施例提供的一种音频信号处理方法可包括以下内容:
101、根据音频输入信号构建输入矢量。
102、根据参考音频输入信号构建参考输入矩阵。
例如,所述音频输入信号为近端音频输入信号,且所述参考音频输入信号为远端音频输入信号;或者所述音频输入信号为待降噪音频信号,且所述参考音频输入信号为参考噪声信号。当然,音频输入信号和参考音频输入信号也可以是具有关联关系的其他音频信号。
其中,音频输入信号和参考音频输入信号的长度可以是任意的,例如可以是一个音频帧的长度,也可以是一个音频帧中的一个子帧的长度或者也可以是其他长度。
具体例如,所述音频输入信号为第y个音频帧的近端音频输入信号,所述参考音频输入信号为第y个音频帧的远端音频输入信号。也就是说,所述音频输入信号为某个音频帧的近端音频输入信号,所述参考音频输入信号为该某个音频帧的远端音频输入信号。
又具体例如,所述音频输入信号为第y个音频帧中的第m个子帧的近端音频输入信号,所述参考音频输入信号为第y个音频帧中的第m个子帧的远端音频输入信号。也就是说,所述音频输入信号为某个音频帧中的某个子帧的近端音频输入信号,所述参考音频输入信号为该某个音频帧中的该某个子帧的远端音频输入信号。
又具体例如,所述音频输入信号为第y个音频帧的待降噪音频信号,且所述参考音频输入信号为第y个音频帧的参考噪声信号。也就是说,所述音频输入信号为某个音频帧的待降噪音频信号,且所述参考音频输入信号为该某个音频帧的参考噪声信号。
又具体例如,所述音频输入信号为第y个音频帧中的第m个子帧的待降噪音频信号,且所述参考音频输入信号为第y个音频帧中的第m个子帧的参考噪声信号。也就是说,所述音频输入信号为某个音频帧中的某个子帧的待降噪音频信号,且所述参考音频输入信号为该某个音频帧中的该某个子帧的参考噪声信号。
103、利用基于仿射投影算法(affine projection algorithm)的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量。
其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
例如所述N例如可等于2、3、4、5、6、8、10或其他值。
可选的,所述N个分段中的任意两个分段所对应的仿射投影阶数可以互不相等。
可以看出,本实施例的技术方案中,在根据音频输入信号和参考音频输入信号分别构建输入矢量和参考输入矩阵之后,利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,由于所述自适应滤波器的滤波器系数矢量具有N个分段,且所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等,这样有利于扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围,进而有利于实现自适应滤波器的滤波器系数矢量不同部分具有不同的更新速率,进而有利于在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
举例来说,所述自适应滤波器的滤波器系数矢量的总长度可为L。所述自适应滤波器的滤波器系数矢量具有的所述N个分段之中的第k个分段的长度可为Lk,其中,k=1,2,...N,
其中,所述第k个分段对应的仿射投影阶数为pk,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N}。
可选的,所述L可为正整数,例如所述L可等于40、50、55、60、70、90或其他值。
其中,所述pk可为正整数,例如所述pk可等于2、3、5、6、8、10、15或其他值。
可选的,在本发明的一些可能的实施方式中,
所述参考输入矩阵为X(n),所述X(n)例如可为L×pmax矩阵。
例如,
可选的,在本发明的一些可能的实施方式中,所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
可选的,在本发明的一些可能的实施方式中,所述中的为Lk×pk矩阵,其中,
可选的,在本发明的一些可能的实施方式中,
D(n)表示所述输入矢量,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T。
举例来说,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
可选的,在本发明的一些可能的实施方式中,所述利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量例如可包括:根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
可选的,在本发明的一些可能的实施方式中,所述输出矢量E(n)的前pk行例如可通过如下算法计算得到:
可选的,在本发明的一些可能的实施方式中,所述H(n)表示所述自适应滤波器的滤波器系数矢量,其中,H(n)=[h(0) h(1) … h(L-1)]T。
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
可选的,在本发明的一些可能的实施方式中,
所述方法还可进一步包括:对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T(n+1) H2 T(n+1) … HN T(n+1)]T。
可选的,在本发明的一些可能的实施方式中,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
可选的,在本发明的一些可能的实施方式中,N个分段中的至少两个分段对应的更新步长互不相同。例如N个分段中的任意两个分段对应的更新步长互不相同。
可选的,在本发明的一些可能的实施方式中,所述N个分段中的至少两个分段对应的矩阵稳定因子互不相同。例如所述N个分段中的任意两个分段对应的矩阵稳定因子互不相同。
其中,矩阵中的元素可能为音频信号采样值或矩阵。
其中,矢量中的元素可能为音频信号采样值或矢量。
测试和实践发现,在N个分段中的至少两个分段对应的矩阵稳定因子互不相同的情况下,以及在N个分段中的至少两个分段对应的更新步长互不相同的情况下,由于更新步长和矩阵稳定因子的灵活可变,有利于更好实现在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
可以理解,不同时刻均可按照上述方式进行操作,直到所有音频信号均被处理。
为便于更好的理解本发明实施例的上述方案,下面结合一些具体的应用场景进行举例说明。
请参见图2,图2为本发明的另一个实施例提供的另一种音频编码方法的流程示意图。图2所示举例中,主要针对回声消除场景。图2所示举例中主要以自适应滤波器的滤波器系数矢量具有2个分段为例。
201、根据第y帧音频帧中的第m子帧的近端音频输入信号构建输入矢量。
202、根据第y帧音频帧之中的第m子帧的远端音频输入信号构建参考输入矢量。
其中,例如可通过对连续的近端音频输入信号进行分帧处理得到第y帧音频帧的近端音频输入信号。可通过对连续的远端音频输入信号进行分帧处理得到第y帧音频帧的远端音频输入信号。
假设信号采样率为16KHz,信号帧长为Lframe(Lframe例如等于320)。分帧得到的第y帧音频帧的远端输入信号表示为Rin。分帧得到的第y帧音频帧的近端输入信号表示为Sin。
可选的,在本发明的一些可能的实施方式中,Rin可表示如下:
Rin=[x((y-1)*Lframe),...,x((y-1)*Lframe+Lframe-1)]。
可选的,在本发明的一些可能的实施方式中,Sin可表示如下:
Sin=[d((y-1)*Lframe),...,d((y-1)*Lframe+Lframe-1)]。
其中,第y帧音频帧可为分帧得到的任意一帧音频帧。
其中,Rin和Sin中的元素为音频信号采样值。
例如第y帧音频帧可包括多个子帧,第y帧音频帧中的第m子帧可为第y帧音频帧中的任意一个子帧。
假设第y帧音频帧可包括Lframe/pmax个子帧,则第y帧音频帧中的第m子帧的远端音频输入信号表示为Rin,m,第y帧音频帧中的第m子帧的近端音频输入信号表示为Sin,m。
可选的,在本发明的一些可能的实施方式中,Rin,m可表示如下:
Rin,m=[x((y-1)*Lframe+(m-1)*pmax),...,x((y-1)*Lframe+(m-1)*pmax+Lframe-1)]
可选的,在本发明的一些可能的实施方式中,Sin,m可表示如下:
Sin,m=[d((y-1)*Lframe+(m-1)*pmax),...,d((y-1)*Lframe+(m-1)*pmax+Lframe-1)]
其中,Rin,m和Sin,m中的元素为音频信号采样值。
203、利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有2个分段(即N等2)。
其中,上述2个分段为低阶分段和高阶分段,其中,所述自适应滤波器的滤波器系数矢量的总长度可为L。
以N等2为例进行描述,因此k的取值为k=1,2。
其中,所述第k个分段对应的仿射投影阶数为pk,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N}。
其中,当k=1时表示滤波器系数矢量的第k个分段为所述滤波器系数矢量的低阶分段,当k=2时表示滤波器系数矢量的第k个分段为所述滤波器系数矢量的高阶分段。其中,所述滤波器系数矢量的高阶分段的长度为L2(当然也可标记为Lhigh)。所述滤波器系数矢量的低阶分段的滤波器系数的长度为L1(当然也可标记为Llow)。其中,所述高阶分段对应的仿射投影阶数为p2(当然也可标记为phigh)。所述低阶分段对应的仿射投影阶数为p1(当然也可标记为plow)。
其中,plow大于或小于phigh。
可选的,在本发明的一些可能的实施方式中,
所述参考输入矩阵为X(n),所述X(n)例如可为L×pmax矩阵。
例如,
可选的,在本发明的一些可能的实施方式中,所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
可选的,在本发明的一些可能的实施方式中,所述中的为Lk×pk矩阵,其中,
可选的,在本发明的一些可能的实施方式中,
D(n)表示所述输入矢量,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T。
举例来说,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
可选的,在本发明的一些可能的实施方式中,所述利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量例如可包括:根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
可选的,在本发明的一些可能的实施方式中,所述输出矢量E(n)的前pk行例如可通过如下算法计算得到:
可选的,在本发明的一些可能的实施方式中,所述H(n)表示所述自适应滤波器的滤波器系数矢量,其中,H(n)=[h(0) h(1) … h(L-1)]T。
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
可选的,在本发明的一些可能的实施方式中,
所述方法还可进一步包括:对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T(n+1) H2 T(n+1) … HN T(n+1)]T。
可选的,在本发明的一些可能的实施方式中,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
可以理解,每个子帧均可按照上述方式进行相关计算。
可选的,在本发明的一些可能的实施方式中,N个分段中的至少两个分段对应的更新步长互不相同。例如N个分段中的任意两个分段对应的更新步长互不相同。
可选的,在本发明的一些可能的实施方式中,所述N个分段中的至少两个分段对应的矩阵稳定因子互不相同。例如所述N个分段中的任意两个分段对应的矩阵稳定因子互不相同。
其中,矩阵中的元素可能为音频信号采样值或矩阵。
其中,矢量中的元素可能为音频信号采样值或矢量。
测试和实践发现,在N个分段中的至少两个分段对应的矩阵稳定因子互不相同的情况下,以及在N个分段中的至少两个分段对应的更新步长互不相同的情况下,由于更新步长和矩阵稳定因子的灵活可变,有利于更好实现在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
其中,可以看出,本发明实施例的技术方案中,在根据近端音频输入信号和远端音频输入信号分别构建输入矢量和参考输入矩阵之后,利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,由于所述自适应滤波器的滤波器系数矢量具有2个分段,且所述2个分段中的所对应的仿射投影阶数互不相等,这样有利于扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围,进而有利于实现自适应滤波器的滤波器系数矢量不同部分具有不同的更新速率,进而有利于在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
可以理解,上述举例中主要是以基于仿射投影算法的自适应滤波器的滤波器系数矢量具有2个分段为例来进行说明的,对于自适应滤波器的滤波器系数矢量具有3个分段或更多分段的场景,可以此类推。
请参见图3,图3为本发明的另一个实施例提供的另一种音频编码方法的流程示意图。图3所示举例中,主要针对噪声消除场景。图3所示举例中主要以自适应滤波器的滤波器系数矢量具有2个分段(高阶分段和低阶分段)为例。
301、根据第y帧音频帧中的第m子帧的待降噪音频信号构建输入矢量。
302、根据第y帧音频帧之中的第m子帧的参考噪声信号构建参考输入矢量。
其中,例如可通过对连续的待降噪音频信号进行分帧处理得到第y帧音频帧的待降噪音频信号。可通过对连续的参考噪声信号进行分帧处理得到第y帧音频帧的参考噪声信号。
假设信号采样率为16KHz,信号帧长为Lframe(Lframe例如等于320)。分帧得到的第y帧音频帧的远端输入信号表示为Rin。分帧得到的第y帧音频帧的近端输入信号表示为Sin。
可选的,在本发明的一些可能的实施方式中,Rin可表示如下:
refin=[x((y-1)*Lframe),...,x((y-1)*Lframe+Lframe-1)]。
可选的,在本发明的一些可能的实施方式中,Sin可表示如下:
Sin=[d((y-1)*Lframe),...,d((y-1)*Lframe+Lframe-1)]。
其中,第y帧音频帧可为分帧得到的任意一帧音频帧。
其中,Rin和Sin中的元素为音频信号采样值。
例如第y帧音频帧可包括多个子帧,第y帧音频帧中的第m子帧可为第y帧音频帧中的任意一个子帧。
假设第y帧音频帧可包括Lframe/pmax个子帧,则第y帧音频帧中的第m子帧的参考噪声信号表示为Rin,m,第y帧音频帧中的第m子帧的待降噪音频信号表示为Sin,m。
可选的,在本发明的一些可能的实施方式中,Rin,m可表示如下:
refin,m=[x((y-1)*Lframe+(m-1)*pmax),...,x((y-1)*Lframe+(m-1)*pmax+Lframe-1)]
可选的,在本发明的一些可能的实施方式中,Sin,m可表示如下:
Sin,m=[d((y-1)*Lframe+(m-1)*pmax),...,d((y-1)*Lframe+(m-1)*pmax+Lframe-1)]
其中,Rin,m和Sin,m中的元素为音频信号采样值。
303、利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有2个分段(即N等2)。
其中,上述2个分段为低阶分段和高阶分段,其中,所述自适应滤波器的滤波器系数矢量的总长度可为L。
以N等2为例进行描述,因此k的取值为k=1,2。
其中,所述第k个分段对应的仿射投影阶数为pk,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N}。
其中,当k=1时表示滤波器系数矢量的第k个分段为所述滤波器系数矢量的低阶分段,当k=2时表示滤波器系数矢量的第k个分段为所述滤波器系数矢量的高阶分段。其中,所述滤波器系数矢量的高阶分段的长度为L2(当然也可标记为Lhigh)。所述滤波器系数矢量的低阶分段的滤波器系数的长度为L1(当然也可标记为Llow)。其中,所述高阶分段对应的仿射投影阶数为p2(当然也可标记为phigh)。所述低阶分段对应的仿射投影阶数为p1(当然也可标记为plow)。
其中,plow大于或小于phigh。
可选的,在本发明的一些可能的实施方式中,
所述参考输入矩阵为X(n),所述X(n)例如可为L×pmax矩阵。
例如,
可选的,在本发明的一些可能的实施方式中,所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
可选的,在本发明的一些可能的实施方式中,所述中的为Lk×pk矩阵,其中,
可选的,在本发明的一些可能的实施方式中,
D(n)表示所述输入矢量,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T。
举例来说,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
可选的,在本发明的一些可能的实施方式中,所述利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量例如可包括:根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
可选的,在本发明的一些可能的实施方式中,所述输出矢量E(n)的前pk行例如可通过如下算法计算得到:
可选的,在本发明的一些可能的实施方式中,所述H(n)表示所述自适应滤波器的滤波器系数矢量,其中,H(n)=[h(0) h(1) … h(L-1)]T。
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
可选的,在本发明的一些可能的实施方式中,
所述方法还可进一步包括:对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T(n+1) H2 T(n+1) … HN T(n+1)]T。
可选的,在本发明的一些可能的实施方式中,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
可以理解,每个子帧均可按照上述方式进行相关计算。
可选的,在本发明的一些可能的实施方式中,N个分段中的至少两个分段对应的更新步长互不相同。例如N个分段中的任意两个分段对应的更新步长互不相同。
可选的,在本发明的一些可能的实施方式中,所述N个分段中的至少两个分段对应的矩阵稳定因子互不相同。例如所述N个分段中的任意两个分段对应的矩阵稳定因子互不相同。
其中,矩阵中的元素可能为音频信号采样值或矩阵。
其中,矢量中的元素可能为音频信号采样值或矢量。
测试和实践发现,在N个分段中的至少两个分段对应的矩阵稳定因子互不相同的情况下,以及在N个分段中的至少两个分段对应的更新步长互不相同的情况下,由于更新步长和矩阵稳定因子的灵活可变,有利于更好实现在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
其中,可以看出,本发明实施例的技术方案中,在根据待降噪音频信号和参考噪声信号分别构建输入矢量和参考输入矩阵之后,利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,由于所述自适应滤波器的滤波器系数矢量具有2个分段,且所述2个分段中的所对应的仿射投影阶数互不相等,这样有利于扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围,进而有利于实现自适应滤波器的滤波器系数矢量不同部分具有不同的更新速率,进而有利于在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
可以理解,上述举例中主要是以基于仿射投影算法的自适应滤波器的滤波器系数矢量具有2个分段为例来进行说明的,对于自适应滤波器的滤波器系数矢量具有3个分段或更多分段的场景,可以此类推。
参见图4,本发明实施例一种音频信号处理装置400,可包括:
第一构建单元410,用于根据音频输入信号构建输入矢量。
第二构建单元420,用于根据参考音频输入信号构建参考输入矩阵。
处理单元430,用于利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
例如,所述音频输入信号为近端音频输入信号,且所述参考音频输入信号为远端音频输入信号;或者所述音频输入信号为待降噪音频信号,且所述参考音频输入信号为参考噪声信号。当然,音频输入信号和参考音频输入信号也可以是具有关联关系的其他音频信号。
其中,音频输入信号和参考音频输入信号的长度可以是任意的,例如可以是一个音频帧的长度,也可以是一个音频帧中的一个子帧的长度或者也可以是其他长度。
具体例如,所述音频输入信号为第y个音频帧的近端音频输入信号,所述参考音频输入信号为第y个音频帧的远端音频输入信号。也就是说,所述音频输入信号为某个音频帧的近端音频输入信号,所述参考音频输入信号为该某个音频帧的远端音频输入信号。
又具体例如,所述音频输入信号为第y个音频帧中的第m个子帧的近端音频输入信号,所述参考音频输入信号为第y个音频帧中的第m个子帧的远端音频输入信号。也就是说,所述音频输入信号为某个音频帧中的某个子帧的近端音频输入信号,所述参考音频输入信号为该某个音频帧中的该某个子帧的远端音频输入信号。
又具体例如,所述音频输入信号为第y个音频帧的待降噪音频信号,且所述参考音频输入信号为第y个音频帧的参考噪声信号。也就是说,所述音频输入信号为某个音频帧的待降噪音频信号,且所述参考音频输入信号为该某个音频帧的参考噪声信号。
又具体例如,所述音频输入信号为第y个音频帧中的第m个子帧的待降噪音频信号,且所述参考音频输入信号为第y个音频帧中的第m个子帧的参考噪声信号。也就是说,所述音频输入信号为某个音频帧中的某个子帧的待降噪音频信号,且所述参考音频输入信号为该某个音频帧中的该某个子帧的参考噪声信号。
例如所述N例如可等于2、3、4、5、6、8、10或其他值。
可选的,所述N个分段中的任意两个分段所对应的仿射投影阶数可以互不相等。
可选的,在本发明的一些可能的实施方式中,
所述音频输入信号为近端音频输入信号,且所述参考音频输入信号为远端音频输入信号;或者所述音频输入信号为待降噪音频信号,且所述参考音频输入信号为参考噪声信号。
可选的,在本发明的一些可能的实施方式中,所述自适应滤波器的滤波器系数矢量的总长度为L,所述自适应滤波器的滤波器系数矢量具有的所述N个分段中的第k个分段的长度为Lk,其中,k=1,2,...N,所述第k个分段对应的仿射投影阶数为pk,其中,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N};
可选的,在本发明的一些可能的实施方式中,
所述参考输入矩阵为X(n),所述X(n)为L×pmax矩阵;
其中,
可选的,在本发明的一些可能的实施方式中,所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
可选的,在本发明的一些可能的实施方式中,所述中的为Lk×pk矩阵,其中,
可选的,在本发明的一些可能的实施方式中,
D(n)表示所述输入矢量,其中,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T;
其中,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
可选的,在本发明的一些可能的实施方式中,
所述处理单元具体用于,根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
可选的,在本发明的一些可能的实施方式中,所述处理单元430通过如下算法计算得到所述输出矢量E(n)的前pk行:
可选的,在本发明的一些可能的实施方式中,所述H(n)表示所述自适应滤波器的滤波器系数矢量,
其中,H(n)=[h(0) h(1) … h(L-1)]T,
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
可选的,在本发明的一些可能的实施方式中,
所述处理单元还用于:对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T(n+1) H2 T(n+1) … HN T(n+1)]T。
可选的,在本发明的一些可能的实施方式中,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
可以理解的是,本实施例的音频信号处理装置400的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
可以看出,本实施例的音频信号处理装置400,在根据音频输入信号和参考音频输入信号分别构建输入矢量和参考输入矩阵之后,利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,由于所述自适应滤波器的滤波器系数矢量具有N个分段,且所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等,这样有利于扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围,进而有利于实现自适应滤波器的滤波器系数矢量不同部分具有不同的更新速率,进而有利于在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
参见图5,图5为本发明实施例提供的音频信号处理装置500的示意图,音频信号处理装置500可包括至少一个总线501、与总线501相连的至少一个处理器502以及与总线501相连的至少一个存储器503。
其中,处理器502通过总线501,调用存储器503中存储的代码以用于根据音频输入信号构建输入矢量;根据参考音频输入信号构建参考输入矩阵;利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
例如,所述音频输入信号为近端音频输入信号,且所述参考音频输入信号为远端音频输入信号;或者所述音频输入信号为待降噪音频信号,且所述参考音频输入信号为参考噪声信号。当然,音频输入信号和参考音频输入信号也可以是具有关联关系的其他音频信号。
其中,音频输入信号和参考音频输入信号的长度可以是任意的,例如可以是一个音频帧的长度,也可以是一个音频帧中的一个子帧的长度或者也可以是其他长度。
具体例如,所述音频输入信号为第y个音频帧的近端音频输入信号,所述参考音频输入信号为第y个音频帧的远端音频输入信号。也就是说,所述音频输入信号为某个音频帧的近端音频输入信号,所述参考音频输入信号为该某个音频帧的远端音频输入信号。
又具体例如,所述音频输入信号为第y个音频帧中的第m个子帧的近端音频输入信号,所述参考音频输入信号为第y个音频帧中的第m个子帧的远端音频输入信号。也就是说,所述音频输入信号为某个音频帧中的某个子帧的近端音频输入信号,所述参考音频输入信号为该某个音频帧中的该某个子帧的远端音频输入信号。
又具体例如,所述音频输入信号为第y个音频帧的待降噪音频信号,且所述参考音频输入信号为第y个音频帧的参考噪声信号。也就是说,所述音频输入信号为某个音频帧的待降噪音频信号,且所述参考音频输入信号为该某个音频帧的参考噪声信号。
又具体例如,所述音频输入信号为第y个音频帧中的第m个子帧的待降噪音频信号,且所述参考音频输入信号为第y个音频帧中的第m个子帧的参考噪声信号。也就是说,所述音频输入信号为某个音频帧中的某个子帧的待降噪音频信号,且所述参考音频输入信号为该某个音频帧中的该某个子帧的参考噪声信号。
其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
例如所述N例如可等于2、3、4、5、6、8、10或其他值。
可选的,所述N个分段中的任意两个分段所对应的仿射投影阶数可以互不相等。
举例来说,所述自适应滤波器的滤波器系数矢量的总长度可为L。所述自适应滤波器的滤波器系数矢量具有的所述N个分段之中的第k个分段的长度可为Lk,其中,k=1,2,...N,
其中,所述第k个分段对应的仿射投影阶数为pk,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N}。
可选的,所述L可为正整数,例如所述L可等于40、50、55、60、70、90或其他值。
其中,所述pk可为正整数,例如所述pk可等于2、3、5、6、8、10、15或其他值。
可选的,在本发明的一些可能的实施方式中,
所述参考输入矩阵为X(n),所述X(n)例如可为L×pmax矩阵。
例如,
可选的,在本发明的一些可能的实施方式中,所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
可选的,在本发明的一些可能的实施方式中,所述中的为Lk×pk矩阵,其中,
可选的,在本发明的一些可能的实施方式中,
D(n)表示所述输入矢量,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T。
举例来说,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
可选的,在本发明的一些可能的实施方式中,处理器502可根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
可选的,在本发明的一些可能的实施方式中,所述输出矢量E(n)的前pk行例如可通过如下算法计算得到:
可选的,在本发明的一些可能的实施方式中,所述H(n)表示所述自适应滤波器的滤波器系数矢量,其中,H(n)=[h(0) h(1) … h(L-1)]T。
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
可选的,在本发明的一些可能的实施方式中,
处理器502还可用于对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T(n+1) H2 T(n+1) … HN T(n+1)]T。
可选的,在本发明的一些可能的实施方式中,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
可选的,在本发明的一些可能的实施方式中,N个分段中的至少两个分段对应的更新步长互不相同。例如N个分段中的任意两个分段对应的更新步长互不相同。
可选的,在本发明的一些可能的实施方式中,所述N个分段中的至少两个分段对应的矩阵稳定因子互不相同。例如所述N个分段中的任意两个分段对应的矩阵稳定因子互不相同。
其中,矩阵中的元素可能为音频信号采样值或矩阵。
其中,矢量中的元素可能为音频信号采样值或矢量。
测试和实践发现,在N个分段中的至少两个分段对应的矩阵稳定因子互不相同的情况下,以及在N个分段中的至少两个分段对应的更新步长互不相同的情况下,由于更新步长和矩阵稳定因子的灵活可变,有利于更好实现在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
可以理解的是,本实施例的音频信号处理装置500的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
可以看出,本实施例的音频信号处理装置500,在根据音频输入信号和参考音频输入信号分别构建输入矢量和参考输入矩阵之后,利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,由于所述自适应滤波器的滤波器系数矢量具有N个分段,且所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等,这样有利于扩展自适应滤波器的滤波器系数矢量不同部分的更新速率的调整范围,进而有利于实现自适应滤波器的滤波器系数矢量不同部分具有不同的更新速率,进而有利于在计算复杂度更小的情况下实现更快的收敛速度以及更低的稳态误差。
其中,音频信号处理装置500例如可为任何需要采集,存储或者向外传输音频信号的装置,例如手机,平板电脑,个人电脑,笔记本电脑等等
本发明实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任意一种音频信号处理方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机,服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘,只读存储器(ROM,Read-Only Memory),随机存取存储器(RAM,Random Access Memory),移动硬盘,磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅仅是用以说明本发明的技术方案,而并非是对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (24)
1.一种音频信号处理方法,其特征在于,包括:
根据音频输入信号构建输入矢量;
根据参考音频输入信号构建参考输入矩阵;
利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
2.根据权利要求1所述的方法,其特征在于,
所述音频输入信号为近端音频输入信号,且所述参考音频输入信号为远端音频输入信号;或者所述音频输入信号为待降噪音频信号,且所述参考音频输入信号为参考噪声信号。
3.根据权利要求1或2所述的方法,其特征在于,所述自适应滤波器的滤波器系数矢量的总长度为L,所述自适应滤波器的滤波器系数矢量具有的所述N个分段中的第k个分段的长度为Lk,其中,k=1,2,...N,所述第k个分段对应的仿射投影阶数为pk,其中,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N}。
4.根据权利要求3所述的方法,其特征在于,
所述参考输入矩阵为X(n),所述X(n)为L×pmax矩阵;
其中,
5.根据权利要求4所述的方法,其特征在于,
所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
6.根据权利要求5所述的方法,其特征在于,所述中的为Lk×pk矩阵,其中,
7.根据权利要求3至6任一项所述的方法,其特征在于,
D(n)表示所述输入矢量,其中,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T;
其中,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
8.根据权利要求3至7任一项所述的方法,其特征在于,
所述利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,包括:
根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
9.根据权利要求8所述的方法,其特征在于,所述输出矢量E(n)的前pk行通过如下算法计算得到:
10.根据权利要求9所述的方法,其特征在于,所述H(n)表示所述自适应滤波器的滤波器系数矢量,
其中,H(n)=[h(0) h(1) … h(L-1)]T,
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
11.根据权利要求10所述的方法,其特征在于,
所述方法还包括:对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T(n+1) H2 T(n+1) … HN T(n+1)]T。
12.根据权利要求11所述的方法,其特征在于,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
13.一种音频信号处理装置,其特征在于,包括:
第一构建单元,用于根据音频输入信号构建输入矢量;
第二构建单元,用于根据参考音频输入信号构建参考输入矩阵;
处理单元,用于利用基于仿射投影算法的自适应滤波器对所述参考输入矩阵和所述输入矢量进行处理以得到输出矢量,其中,所述自适应滤波器的滤波器系数矢量具有N个分段,所述N为大于或等于2的整数,所述N个分段中的至少两个分段所对应的仿射投影阶数互不相等。
14.根据权利要求13所述的装置,其特征在于,
所述音频输入信号为近端音频输入信号,且所述参考音频输入信号为远端音频输入信号;或者所述音频输入信号为待降噪音频信号,且所述参考音频输入信号为参考噪声信号。
15.根据权利要求13或14所述的装置,其特征在于,所述自适应滤波器的滤波器系数矢量的总长度为L,所述自适应滤波器的滤波器系数矢量具有的所述N个分段中的第k个分段的长度为Lk,其中,k=1,2,...N,所述第k个分段对应的仿射投影阶数为pk,其中,所述N个分段对应的最大仿射投影阶数为pmax,pmax=max{pk,k=1,2,...,N}。
16.根据权利要求15所述的装置,其特征在于,
所述参考输入矩阵为X(n),所述X(n)为L×pmax矩阵;
其中,
17.根据权利要求16所述的装置,其特征在于,
所述参考输入矩阵X(n)的前pk列为与所述第k个分段对应的参考输入子矩阵所述为L×pk矩阵,
其中,
18.根据权利要求17所述的装置,其特征在于,所述中的为Lk×pk矩阵,其中,
19.根据权利要求15至18任一项所述的装置,其特征在于,
D(n)表示所述输入矢量,其中,D(n)=[d(n) d(n-1) … d(n-pmax+1)]T;
其中,所述输入矢量D(n)的前pk行为与所述第k个分段对应的输入子矩阵其中,
20.根据权利要求15至19任一项所述的装置,其特征在于,
所述处理单元具体用于,根据第n时刻的滤波器系数矢量对所述参考输入矩阵进行滤波处理以得到所述第n时刻对应的滤波处理结果,根据所述第n时刻的所述输入矢量和所述第n时刻对应的滤波处理结果得到输出矢量E(n);
其中,E(n)=[e(n) e(n-1) … e(n-pmax+1)]T,其中,与所述第k个分段对应的输出子矢量为所述输出矢量E(n)的前pk行,
其中,
21.根据权利要求20所述的装置,其特征在于,所述处理单元通过如下算法计算得到所述输出矢量E(n)的前pk行:
22.根据权利要求21所述的装置,其特征在于,所述H(n)表示所述自适应滤波器的滤波器系数矢量,
其中,H(n)=[h(0) h(1) … h(L-1)]T,
其中,所述Hk(n)表示所述自适应滤波器的滤波器系数矢量的第k个分段,
23.根据权利要求22所述的装置,其特征在于,
所述处理单元还用于:对所述滤波器系数矢量进行更新以得到第n+1时刻的自适应滤波器系数矢量H(n+1),
其中,H(n+1)=[H1 T (n+1) H2 T (n+1) … HN T (n+1)]T。
24.根据权利要求23所述的装置,其特征在于,所述H(n+1)中的Hk(n+1)表示第n+1时刻的滤波器系数矢量的第k个分段;
其中,
其中,所述μk表示第k个分段对应的更新步长,所述δk表示第k个分段对应的矩阵稳定因子。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410637750.XA CN104392727A (zh) | 2014-11-12 | 2014-11-12 | 音频信号处理方法和相关装置 |
PCT/CN2015/075943 WO2016074422A1 (zh) | 2014-11-12 | 2015-04-07 | 音频信号处理方法和相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410637750.XA CN104392727A (zh) | 2014-11-12 | 2014-11-12 | 音频信号处理方法和相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104392727A true CN104392727A (zh) | 2015-03-04 |
Family
ID=52610619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410637750.XA Pending CN104392727A (zh) | 2014-11-12 | 2014-11-12 | 音频信号处理方法和相关装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN104392727A (zh) |
WO (1) | WO2016074422A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106060295A (zh) * | 2016-05-17 | 2016-10-26 | 西南交通大学 | 一种凸组合系数差的成比例仿射投影回声消除方法 |
CN113113046A (zh) * | 2021-04-14 | 2021-07-13 | 杭州朗和科技有限公司 | 音频处理的性能检测方法、装置、存储介质及电子设备 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5267266A (en) * | 1992-05-11 | 1993-11-30 | Bell Communications Research, Inc. | Fast converging adaptive equalizer using pilot adaptive filters |
CN1351795A (zh) * | 1999-05-25 | 2002-05-29 | 英国电讯有限公司 | 回声消除 |
CN1451226A (zh) * | 2000-05-26 | 2003-10-22 | 皇家菲利浦电子有限公司 | 用于与自适应波束形成组合的回声抵消的方法和设备 |
CN1473403A (zh) * | 2000-09-08 | 2004-02-04 | ض� | 用于基于回波消除器的快速收敛仿射投影的装置和方法 |
US20040101131A1 (en) * | 2002-11-25 | 2004-05-27 | Anurag Bist | Echo cancellers for sparse channels |
CN1653713A (zh) * | 2002-05-21 | 2005-08-10 | 英特尔公司 | 具有双方交谈检测器的回声抵消器 |
CN1689072A (zh) * | 2002-08-16 | 2005-10-26 | 数字信号处理工厂有限公司 | 使用自适应滤波器处理子带信号的方法和系统 |
US20060262939A1 (en) * | 2003-11-06 | 2006-11-23 | Herbert Buchner | Apparatus and Method for Processing an Input Signal |
CN1937034A (zh) * | 2006-09-30 | 2007-03-28 | 南京大学 | 适用于定点实现的快速仿射投影自适应处理方法 |
CN102592601A (zh) * | 2011-01-10 | 2012-07-18 | 华为技术有限公司 | 一种信号处理方法和装置 |
CN103854657A (zh) * | 2012-12-05 | 2014-06-11 | 华为技术有限公司 | 消除干扰信号的处理方法及装置 |
CN103871420A (zh) * | 2012-12-13 | 2014-06-18 | 华为技术有限公司 | 麦克风阵列的信号处理方法及装置 |
-
2014
- 2014-11-12 CN CN201410637750.XA patent/CN104392727A/zh active Pending
-
2015
- 2015-04-07 WO PCT/CN2015/075943 patent/WO2016074422A1/zh active Application Filing
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5267266A (en) * | 1992-05-11 | 1993-11-30 | Bell Communications Research, Inc. | Fast converging adaptive equalizer using pilot adaptive filters |
CN1351795A (zh) * | 1999-05-25 | 2002-05-29 | 英国电讯有限公司 | 回声消除 |
CN1451226A (zh) * | 2000-05-26 | 2003-10-22 | 皇家菲利浦电子有限公司 | 用于与自适应波束形成组合的回声抵消的方法和设备 |
CN1473403A (zh) * | 2000-09-08 | 2004-02-04 | ض� | 用于基于回波消除器的快速收敛仿射投影的装置和方法 |
CN1653713A (zh) * | 2002-05-21 | 2005-08-10 | 英特尔公司 | 具有双方交谈检测器的回声抵消器 |
CN1689072A (zh) * | 2002-08-16 | 2005-10-26 | 数字信号处理工厂有限公司 | 使用自适应滤波器处理子带信号的方法和系统 |
US20040101131A1 (en) * | 2002-11-25 | 2004-05-27 | Anurag Bist | Echo cancellers for sparse channels |
US20060262939A1 (en) * | 2003-11-06 | 2006-11-23 | Herbert Buchner | Apparatus and Method for Processing an Input Signal |
CN1937034A (zh) * | 2006-09-30 | 2007-03-28 | 南京大学 | 适用于定点实现的快速仿射投影自适应处理方法 |
CN102592601A (zh) * | 2011-01-10 | 2012-07-18 | 华为技术有限公司 | 一种信号处理方法和装置 |
CN103854657A (zh) * | 2012-12-05 | 2014-06-11 | 华为技术有限公司 | 消除干扰信号的处理方法及装置 |
CN103871420A (zh) * | 2012-12-13 | 2014-06-18 | 华为技术有限公司 | 麦克风阵列的信号处理方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106060295A (zh) * | 2016-05-17 | 2016-10-26 | 西南交通大学 | 一种凸组合系数差的成比例仿射投影回声消除方法 |
CN106060295B (zh) * | 2016-05-17 | 2019-05-24 | 西南交通大学 | 一种凸组合系数差的成比例仿射投影回声消除方法 |
CN113113046A (zh) * | 2021-04-14 | 2021-07-13 | 杭州朗和科技有限公司 | 音频处理的性能检测方法、装置、存储介质及电子设备 |
CN113113046B (zh) * | 2021-04-14 | 2024-01-19 | 杭州网易智企科技有限公司 | 音频处理的性能检测方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2016074422A1 (zh) | 2016-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104952458B (zh) | 一种噪声抑制方法、装置及系统 | |
CN113436643B (zh) | 语音增强模型的训练及应用方法、装置、设备及存储介质 | |
US20170046153A1 (en) | Simd multiply and horizontal reduce operations | |
EP3050322B1 (en) | System and method for evaluating an acoustic transfer function | |
GB2510331A (en) | Echo suppression in an audio signal | |
CN106558314B (zh) | 一种混音处理方法和装置及设备 | |
CN104934035B (zh) | 语音频码流的解码方法及装置 | |
CN105489224A (zh) | 一种基于麦克风阵列的语音降噪方法及系统 | |
CN112201273B (zh) | 一种噪声功率谱密度计算方法、系统、设备及介质 | |
CN107248414A (zh) | 一种基于多帧频谱和非负矩阵分解的语音增强方法与装置 | |
CN104392727A (zh) | 音频信号处理方法和相关装置 | |
CN114936984A (zh) | 毫米波退化图像去噪去模糊方法、装置、设备及介质 | |
CN105336339A (zh) | 一种语音频信号的处理方法和装置 | |
JP2002518925A (ja) | 適応状態空間信号の分離、弁別、回復用アーキテクチャ、及び、動的環境における使用へのそれらの適用 | |
CN114596876B (zh) | 声源分离方法及装置 | |
CN112669870B (zh) | 语音增强模型的训练方法、装置和电子设备 | |
CN113593527B (zh) | 一种生成声学特征、语音模型训练、语音识别方法及装置 | |
CN104202018B (zh) | 确定自适应滤波器的稳定因子的方法和装置 | |
CN104242872B (zh) | 一种信号处理方法及装置 | |
JP4473709B2 (ja) | 信号推定方法、信号推定装置、信号推定プログラム及びその記録媒体 | |
CN108353241A (zh) | 渲染系统 | |
CN112802487A (zh) | 回声处理方法、装置及系统 | |
CN112447165A (zh) | 信息处理、模型训练和模型构建方法、电子设备、智能音箱 | |
CN111010566A (zh) | 一种基于非局部网络的视频压缩失真复原方法及系统 | |
CN113782047B (zh) | 语音分离方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20181102 |