CN105513601A - 一种音频编码带宽扩展中频带复制的方法及装置 - Google Patents

一种音频编码带宽扩展中频带复制的方法及装置 Download PDF

Info

Publication number
CN105513601A
CN105513601A CN201610054436.8A CN201610054436A CN105513601A CN 105513601 A CN105513601 A CN 105513601A CN 201610054436 A CN201610054436 A CN 201610054436A CN 105513601 A CN105513601 A CN 105513601A
Authority
CN
China
Prior art keywords
band
frequency sub
value
subband
rsqb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610054436.8A
Other languages
English (en)
Inventor
胡瑞敏
姜林
文彬
胡霞
杨玉红
王晓晨
涂卫平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201610054436.8A priority Critical patent/CN105513601A/zh
Publication of CN105513601A publication Critical patent/CN105513601A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/295Noise generation, its use, control or rejection for music processing

Abstract

本发明公开了一种音频编码带宽扩展中频带复制的方法及装置,本发明通过计算高频子带与各低频子带之间的皮尔逊相关系数选取最强相关子带,并通过判断最高相关系数数值是否低于阈值,找到频带间更合适、更具关联性的匹配组合,指导原始高频重建。同时对最大相关性相关程度不大的情况,引入高斯白噪声代替低频子带来复制高频子带,避免了由于信号的谐波特性不明显,频谱相关性比较弱,很容易出现最大相关的子带之间的相关性也很弱,如果此时仍然使用最大相关子带重建,反而会引入误差。因此本发明实施例技术方案能够更准确的进行高频重建。

Description

一种音频编码带宽扩展中频带复制的方法及装置
技术领域
本发明属于音频编码技术领域,具体涉及一种音频编码带宽扩展中频带复制的方法及装置。
背景技术
心理声学研究表明人们对于音频不同频率下的敏感性具有差异,对低频更敏感而对高频不敏感,因此在音频编码中常常不对高频进行编码以节省码率。而高频部分的完全缺失又会带来听感上的不适,因此往往采用带宽扩展的方式恢复高频。以利用高低频信号之间的相关性为代表的频带复制技术是目前为止效果比较好的一种高频重建方法,它在频域把低频信号整块复制到高频频段,再利用能量参数等边信息对复制的高频段进行修复,从而达到高频重建的目的。
现有方法在利用低频信号进行高频重建时,简单的按子带顺序选取低频频带对高频频带进行重建,没有选择性。难以根据信号自身特性,做出自适应的调整,影响高频重建的准确性。虽然高频频带与低频频带具有一定的相关性,但固定的匹配方式,不足以保证相关性最好的高频频带与低频子带能准确的对应,相反可能导致相关性较弱甚至不相关的子带匹配,导致高频重建效果不佳。
发明内容
为了解决上述技术问题,本发明提供了一种音频编码带宽扩展频带复制的方法及装置。
本发明的方法所采用的技术方案是:一种音频编码带宽扩展中频带复制的方法,其特征在于,包括以下步骤:
步骤1:计算音频信号各低频子带与高频子带之间的相关系数每个原始高频的最大相关系数max(Pn[k])用最大相关矩阵Pmax[n][k]记录,Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数;
步骤2:为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;
若是,则为高频子带选择相关系数最大的低频子带为最优复制子带;
若否,则用同长度的高斯白噪声作为高频子带的复制子带;
步骤3:提取频带复制所需能量信息,输出边信息。
作为优选,步骤1的具体实现过程是针对每一个原始高频子带,计算它与各个低频信号子带之间的皮尔逊相关系数,从而得到原始子带与各个待选子带之间的相关性;计算公式为:
P n ( k ) = Σ i = 0 N - 1 ( x [ n , i ] - Σ i = 0 N - 1 x [ n , i ] N ) ( y [ k , i ] - Σ i = 0 N - 1 y [ k , i ] N ) Σ i = 0 N - 1 ( x [ n , i ] - Σ i = 0 N - 1 x [ n , i ] N ) 2 Σ i = 0 N - 1 ( y [ k , i ] - Σ i = 0 N - 1 y [ k , i ] N ) 2 ;
式中Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数,x[n,i]表示高频子带样点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频子带序号,N表示子带长度。
作为优选,步骤2中所述判断相关系数值是否大于阈值,判断条件为:
|Pmax[n][k]|>γ;
式中Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数,阈值γ取值为0.2。
作为优选,步骤3中所述边信息包括频带对应信息和能量信息;
所述频带对应信息包括高频子带与相关性最大的低频子带或高斯白噪声之间的对应关系;
所述能量信息包括相关性最大的低频子带和高频子带之间的增益值r[i]和高频子带能量均值e[i];
r [ i ] = Σ i = 0 N - 1 x 2 [ n , i ] Σ i = 0 N - 1 y 2 [ k , i ] ;
e [ i ] = Σ i = 0 N - 1 x 2 [ n , i ] N ;
式中,r[i]表示第n个高频子带与第k个低频子带间的增益,e[i]表示第n个高频子带能量均值,x[n,i]表示高频子带样点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频子带序号,N表示子带长度;
若最大相关性值大于阈值,则用相关性最大的低频子带复制高频子带,输出相关性最大的低频子带和高频子带之间的增益值r[i];若最大相关性值小于等于阈值,则用高斯白噪声复制高频子带,输出高频子带能量均值e[i]。
本发明的装置所采用的技术方案是:一种音频编码带宽扩展中频带复制的装置,其特征在于:包括相关性计算模块、子带选取模块、能量信息提取模块;
所述相关性计算模块,用于计算音频信号各高频子带与各低频子带之间的相关系数;
所述子带选取模块,用于确定频带对应关系,为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;若最大相关系数的值大于阈值,则为高频子带选择相关系数最大的的低频子带为最优复制子带,若最大相关系数的值小于阈值,则用同长度的高斯白噪声作为高频子带的复制子带;
所述能量信息提取模块,用于提取频带复制所需能量信息,输出边信息。
本发明与现有技术相比的有益效果是,本发明实施例方案充分考虑到了低频子带和高频子带的相关性,通过计算高频子带与各低频子带之间的皮尔逊相关系数选取最强相关子带,并通过判断最高相关系数数值是否低于阈值,找到频带间更合适、更具关联性的匹配组合,指导原始高频重建。同时对最大相关性相关程度不大的情况,引入高斯白噪声代替低频子带来复制高频子带,避免了由于信号的谐波特性不明显,频谱相关性比较弱,很容易出现最大相关的子带之间的相关性也很弱,如果此时仍然使用最大相关子带重建,反而会引入误差。因此本发明实施例技术方案能够更准确的进行高频重建。
附图说明
图1是本发明实施例频带复制的方法流程图。
图2是本发明实施例的频带复制的装置模块图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种音频编码带宽扩展中频带复制的方法,包括以下步骤:
步骤1,针对每一个原始高频子带,通过下式计算它与各个低频信号子带之间的皮尔逊相关系数,从而得到原始子带与各个待选子带之间的相关性;
P n ( k ) = Σ i = 0 N - 1 ( x [ n , i ] - Σ i = 0 N - 1 x [ n , i ] N ) ( y [ k , i ] - Σ i = 0 N - 1 y [ k , i ] N ) Σ i = 0 N - 1 ( x [ n , i ] - Σ i = 0 N - 1 x [ n , i ] N ) 2 Σ i = 0 N - 1 ( y [ k , i ] - Σ i = 0 N - 1 y [ k , i ] N ) 2 ;
式中Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数,x[n,i]表示高频子带样点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频子带序号,N表示子带长度。
以上计算对所有的原始高频子带n进行,对每个原始高频子带选择出使得Pn(k)最大的k,即为原始高频子带相关度最高的低频子带。
记录每个原始高频的最大相关系数max(Pn[k])用最大相关矩阵Pmax[n][k]记录。
步骤2,对步骤S1的到的一组最大相关系数max(Pn[k]),判断最大相关系数值是否小于阈值γ。具体条件为:
|Pmax[n][k]|>γ;
阈值γ取值为0.2。
步骤3,根据步骤2的判决结果,确定高频重建频带的对应关系,若最大相关性值大于阈值,则用相关性最大的低频子带复制高频子带;若最大相关性值小于等于阈值,则用高斯白噪声复制高频子带。
步骤4,提取高频重建所需能量参数,能量信息具体为相关性最大的低频子带和高频子带之间的增益值r[i]和高频子带能量均值e[i];若最大相关性值大于阈值,则用相关性最大的低频子带复制高频子带,输出相关性最大的低频子带和高频子带之间的增益值r[i];若最大相关性值小于等于阈值,则用高斯白噪声复制高频子带,输出高频子带能量均值e[i]。
r [ i ] = Σ i = 0 N - 1 x 2 [ n , i ] Σ i = 0 N - 1 y 2 [ k , i ]
e [ i ] = Σ i = 0 N - 1 x 2 [ n , i ] N
式中,r[i]表示第n个高频子带与第k个低频子带间的增益,e[i]表示第n个高频子带能量均值,x[n,i]表示高频子带样点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频子带序号,N表示子带长度。
请见图2,本发明提供的一种音频编码带宽扩展中频带复制的装置,包括:相关性计算模块、子带选取模块、能量信息提取模块。相关性计算模块,用于计算音频信号各高频子带与各低频子带之间的相关系数;子带选取模块,用于确定频带对应关系,为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;若最大相关系数的值大于阈值,则为高频子带选择相关系数最大的的低频子带为最优复制子带,若最大相关系数的值小于阈值,则用同长度的高斯白噪声作为高频子带的复制子带;能量信息提取模块,用于提取频带复制所需能量信息,输出边信息。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (5)

1.一种音频编码带宽扩展中频带复制的方法,其特征在于,包括以下步骤:
步骤1:计算音频信号各低频子带与高频子带之间的相关系数,每个原始高频的最大相关系数max(Pn[k])用最大相关矩阵Pmax[n][k]记录,Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数;
步骤2:为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;
若是,则为高频子带选择相关系数最大的低频子带为最优复制子带;
若否,则用同长度的高斯白噪声作为高频子带的复制子带;
步骤3:提取频带复制所需能量信息,输出边信息。
2.根据权利要求1所述音频编码带宽扩展中频带复制的方法,其特征在于:步骤1的具体实现过程是针对每一个原始高频子带,计算它与各个低频信号子带之间的皮尔逊相关系数,从而得到原始子带与各个待选子带之间的相关性;计算公式为:
P n ( k ) = Σ i = 0 N - 1 ( x [ n , i ] - Σ i = 0 N - 1 x [ n , i ] N ) ( y [ k , i ] - Σ i = 0 N - 1 y [ k , i ] N ) Σ i = 0 N - 1 ( x [ n , i ] - Σ i = 0 N - 1 x [ n , i ] N ) 2 Σ i = 0 N - 1 ( y [ k , i ] - Σ i = 0 N - 1 y [ k , i ] N ) 2 ;
式中Pn[k]代表第n个高频子带与第k个低频子带之间的相关系数,x[n,i]表示高频子带样点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频子带序号,N表示子带长度。
3.根据权利要求1所述音频编码带宽扩展中频带复制的方法,其特征在于:步骤2中所述判断相关系数值是否大于阈值,判断条件为:
|Pmax[n][k]|>γ;
阈值γ取值为0.2。
4.根据权利要求1所述音频编码带宽扩展中频带复制的方法,其特征在于:步骤3中所述边信息包括频带对应信息和能量信息;
所述频带对应信息包括高频子带与相关性最大的低频子带或高斯白噪声之间的对应关系;
所述能量信息包括相关性最大的低频子带和高频子带之间的增益值r[i]和高频子带能量均值e[i];
r [ i ] = Σ i = 0 N - 1 x 2 [ n , i ] Σ i = 0 N - 1 y 2 [ k , i ] ;
e [ i ] = Σ i = 0 N - 1 x 2 [ n , i ] N ;
式中,r[i]表示第n个高频子带与第k个低频子带间的增益,e[i]表示第n个高频子带能量均值,x[n,i]表示高频子带样点,其中n表示高频子带序号,i表示子带样点序号,y[k,i]表示低频子带样点,k表示低频子带序号,N表示子带长度;
若最大相关性值大于阈值,则用相关性最大的低频子带复制高频子带,输出相关性最大的低频子带和高频子带之间的增益值r[i];若最大相关性值小于等于阈值,则用高斯白噪声复制高频子带,输出高频子带能量均值e[i]。
5.一种音频编码带宽扩展中频带复制的装置,其特征在于:包括相关性计算模块、子带选取模块、能量信息提取模块;
所述相关性计算模块,用于计算音频信号各高频子带与各低频子带之间的相关系数;
所述子带选取模块,用于确定频带对应关系,为高频子带选择值最大的相关系数,并判断相关系数值是否大于阈值;若最大相关系数的值大于阈值,则为高频子带选择相关系数最大的的低频子带为最优复制子带,若最大相关系数的值小于阈值,则用同长度的高斯白噪声作为高频子带的复制子带;
所述能量信息提取模块,用于提取频带复制所需能量信息,输出边信息。
CN201610054436.8A 2016-01-27 2016-01-27 一种音频编码带宽扩展中频带复制的方法及装置 Pending CN105513601A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610054436.8A CN105513601A (zh) 2016-01-27 2016-01-27 一种音频编码带宽扩展中频带复制的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610054436.8A CN105513601A (zh) 2016-01-27 2016-01-27 一种音频编码带宽扩展中频带复制的方法及装置

Publications (1)

Publication Number Publication Date
CN105513601A true CN105513601A (zh) 2016-04-20

Family

ID=55721528

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610054436.8A Pending CN105513601A (zh) 2016-01-27 2016-01-27 一种音频编码带宽扩展中频带复制的方法及装置

Country Status (1)

Country Link
CN (1) CN105513601A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107221334A (zh) * 2016-11-01 2017-09-29 武汉大学深圳研究院 一种音频带宽扩展的方法及扩展装置
CN107404625A (zh) * 2017-07-18 2017-11-28 青岛海信电器股份有限公司 终端的音效处理方法及装置
CN108630212A (zh) * 2018-04-03 2018-10-09 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
CN109243485A (zh) * 2018-09-13 2019-01-18 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
WO2022161475A1 (zh) * 2021-01-28 2022-08-04 维沃移动通信有限公司 音频处理方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101471072A (zh) * 2007-12-27 2009-07-01 华为技术有限公司 高频重建方法、编码模块和解码模块
CN101521014A (zh) * 2009-04-08 2009-09-02 武汉大学 音频带宽扩展编解码装置
CN101548318A (zh) * 2006-12-15 2009-09-30 松下电器产业株式会社 编码装置、解码装置以及其方法
CN101853664A (zh) * 2009-03-31 2010-10-06 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
CN102089817A (zh) * 2008-07-11 2011-06-08 弗劳恩霍夫应用研究促进协会 用于计算频谱包络数目的装置与方法
CN103718240A (zh) * 2011-09-09 2014-04-09 松下电器产业株式会社 编码装置、解码装置、编码方法和解码方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101548318A (zh) * 2006-12-15 2009-09-30 松下电器产业株式会社 编码装置、解码装置以及其方法
CN101471072A (zh) * 2007-12-27 2009-07-01 华为技术有限公司 高频重建方法、编码模块和解码模块
CN102089817A (zh) * 2008-07-11 2011-06-08 弗劳恩霍夫应用研究促进协会 用于计算频谱包络数目的装置与方法
CN101853664A (zh) * 2009-03-31 2010-10-06 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
CN101521014A (zh) * 2009-04-08 2009-09-02 武汉大学 音频带宽扩展编解码装置
CN103718240A (zh) * 2011-09-09 2014-04-09 松下电器产业株式会社 编码装置、解码装置、编码方法和解码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张勇: ""移动音频编解码关键技术研究"", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107221334A (zh) * 2016-11-01 2017-09-29 武汉大学深圳研究院 一种音频带宽扩展的方法及扩展装置
CN107404625A (zh) * 2017-07-18 2017-11-28 青岛海信电器股份有限公司 终端的音效处理方法及装置
CN108630212A (zh) * 2018-04-03 2018-10-09 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
CN109243485A (zh) * 2018-09-13 2019-01-18 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
CN109243485B (zh) * 2018-09-13 2021-08-13 广州酷狗计算机科技有限公司 恢复高频信号的方法和装置
WO2022161475A1 (zh) * 2021-01-28 2022-08-04 维沃移动通信有限公司 音频处理方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN105513601A (zh) 一种音频编码带宽扩展中频带复制的方法及装置
EP2337021B1 (en) Apparatus and method for data transmission in audible frequency band
US8063809B2 (en) Transient signal encoding method and device, decoding method and device, and processing system
KR102367538B1 (ko) 다중 채널 신호 인코딩 방법 및 인코더
CN101521014B (zh) 音频带宽扩展编解码装置
CN105513605A (zh) 手机麦克风的语音增强系统和语音增强方法
HK1143237A1 (en) Improved transform coding of speech and audio signals
CN105261359A (zh) 手机麦克风的消噪系统和消噪方法
CN104916289A (zh) 行车噪声环境下快速声学事件的检测方法
CN104900232A (zh) 一种基于双层gmm结构和vts特征补偿的孤立词识别方法
CN102142255B (zh) 一种在音频信号中嵌入及提取数字水印的方法
CN103632676A (zh) 一种低信噪比语音降噪方法
TW201332308A (zh) 用於增強調頻(fm)接收機的音頻品質的系統和方法
CN104485103A (zh) 一种基于矢量泰勒级数的多环境模型孤立词识别方法
CN101521010A (zh) 一种音频信号的编解码方法和装置
CN107293306A (zh) 一种基于输出的客观语音质量的评估方法
CN101908342B (zh) 利用频域滤波后处理进行音频暂态信号预回声抑制的方法
CN103730126A (zh) 噪声抑制方法和噪声抑制器
CN107221334A (zh) 一种音频带宽扩展的方法及扩展装置
CN102426837A (zh) 农业现场数据采集的移动设备语音识别的鲁棒性方法
CN102314883B (zh) 一种判断音乐噪声的方法以及语音消噪方法
CN105869652A (zh) 心理声学模型计算方法和装置
CN102637438A (zh) 一种语音滤波方法
CN105575401A (zh) 一种基于C-MAC特征的AACHuffman域隐写分析方法
US8935159B2 (en) Noise removing system in voice communication, apparatus and method thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160420

RJ01 Rejection of invention patent application after publication