CN108172239B - 频带扩展的方法及装置 - Google Patents

频带扩展的方法及装置 Download PDF

Info

Publication number
CN108172239B
CN108172239B CN201810119215.3A CN201810119215A CN108172239B CN 108172239 B CN108172239 B CN 108172239B CN 201810119215 A CN201810119215 A CN 201810119215A CN 108172239 B CN108172239 B CN 108172239B
Authority
CN
China
Prior art keywords
frequency
signal
low
excitation signal
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810119215.3A
Other languages
English (en)
Other versions
CN108172239A (zh
Inventor
刘泽新
苗磊
王宾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201810119215.3A priority Critical patent/CN108172239B/zh
Publication of CN108172239A publication Critical patent/CN108172239A/zh
Application granted granted Critical
Publication of CN108172239B publication Critical patent/CN108172239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • G10L2025/906Pitch tracking

Abstract

本发明实施例提出了频带扩展的方法及装置。其中,频带扩展的方法包括:获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。本发明实施例利用扩频参数及通过扩频参数计算得到的修正因子来对解码得到的低频信号进行频带扩展,从而恢复高频信号。通过本发明实施例的频带扩展的方法及装置恢复的高频信号接近原始高频信号,质量理想。

Description

频带扩展的方法及装置
技术领域
本发明涉及音频编解码领域,特别地,涉及中低速率宽带的代数码激励线性预测编码(ACELP,Algebraic Code Excited Linear Prediction)中频带扩展的方法及装置。
背景技术
盲带宽扩展技术是解码端技术,解码器根据低频解码信号及相应的预测方法进行盲带宽扩展。
在中低速率宽带ACELP编解码时,现有的算法都是先将16kHz采样的宽带信号下采样到12.8kHz采样,然后进行编码,这样编解码后输出的信号带宽只到6.4kHz。在不改变原有算法的情况下,6.4~8kHz或6.4~7kHz带宽部分的信息就需要通过盲带宽扩展的方式恢复出来,即只在解码端进行相应的恢复。
但是,现有的盲带宽扩展技术恢复的高频信号与原始高频信号偏差较多,导致高频信号不够理想。
发明内容
本发明提出了频带扩展的方法及装置,旨在解决现有的盲带宽扩展技术恢复的高频信号与原始高频信号偏差较多的问题。
第一方面,提出了一种频带扩展的方法,包括:获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
结合第一方面,在第一方面的第一实施方式中,所述根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号,包括:根据所述扩频参数,预测高频能量和高频激励信号;根据所述高频能量与所述高频激励信号,得到高频信号。
结合第一方面的第一实施方式,在第一方面的第二实施方式中,所述高频能量包括高频增益,所述根据所述扩频参数,预测高频能量和高频激励信号,包括:根据所述LPC,预测高频增益;根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第一方面的第二实施方式,在第一方面的第三实施方式中,所述根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号,包括:根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第一方面的第一实施方式,在第一方面的第四实施方式中,所述高频能量包括高频增益,所述根据所述扩频参数,预测高频能量和高频激励信号,包括:根据所述LPC,预测高频增益;根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第一方面的第四实施方式,在第一方面的第五实施方式中,所述根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号,包括:根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第一方面的第一实施方式,在第一方面的第六实施方式中,所述高频能量包括高频包络,所述根据所述扩频参数,预测高频能量和高频激励信号,包括:根据所述解码得到的低频信号或低频激励信号,预测高频包络,其中所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和;根据所述解码得到的低频信号或所述自适应码书贡献和所述代数码书贡献,预测高频激励信号。
结合第一方面的第六实施方式,在第一方面的第七实施方式中,所述根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,包括:根据所述解码速率和所述解码得到的低频信号,预测高频激励信号。
结合第一方面的第六实施方式,在第一方面的第八实施方式中,所述根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,包括:根据所述解码速率和所述低频激励信号,预测高频激励信号。
结合第一方面的第一至第八实施方式,在第一方面的第九实施方式中,在所述根据所述扩频参数,预测高频能量信号和高频激励信号之后,还包括:根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子;根据所述第一修正因子,修正所述高频能量。
结合第一方面的第九实施方式,在第一方面的第十实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子。
结合第一方面的第九实施方式,在第一方面的第十一实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:根据所述解码得到的低频信号,确定第一修正因子。
结合第一方面的第九实施方式,在第一方面的第十二实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子。
结合第一方面的第九至第十二实施方式,在第一方面的第十三实施方式中,还包括:根据所述基音周期,修正所述高频能量。
结合第一方面的第九至第十三实施方式,在第一方面的第十四实施方式中,还包括:根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第一方面的第十四实施方式,在第一方面的第十五实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,包括:根据所述扩频参数,确定第二修正因子。
结合第一方面的第十四实施方式,在第一方面的第十六实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,包括:根据所述解码得到的低频信号,确定第二修正因子。
结合第一方面的第十四实施方式,在第一方面的第十七实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,包括:所述根据所述扩频参数与所述解码得到的低频信号,确定第二修正因子。
结合第一方面的第九至第十七实施方式,在第一方面的第十八实施方式中,还包括:对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的低频信号的分类参数值和/或浊音度因子确定。
结合第一方面的第一至第十八实施方式,在第一方面的第十九实施方式中,所述根据所述高频能量与所述高频激励信号,得到高频信号,包括:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。
第二方面,提出了一种频带扩展的装置,包括:获取单元,用于获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;扩频单元,用于根据所述获取单元获取的扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
结合第二方面,在第二方面的第一实施方式中,所述扩频单元包括:预测子单元,用于根据所述扩频参数,预测高频能量和高频激励信号;合成子单元,用于根据所述高频能量与所述高频激励信号,得到高频信号。
结合第二方面的第一实施方式,在第二方面的第二实施方式中,所述高频能量包括高频增益,所述预测子单元具体用于:根据所述LPC,预测高频增益;根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第二方面的第一实施方式,在第二方面的第三实施方式中,所述高频能量包括高频增益,所述预测子单元具体用于:根据所述LPC,预测高频增益;根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第二方面的第一实施方式,在第二方面的第四实施方式中,所述高频能量包括高频增益,所述预测子单元具体用于:根据所述LPC,预测高频增益;根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第二方面的第一实施方式,在第二方面的第五实施方式中,所述高频能量包括高频增益,所述预测子单元具体用于:根据所述LPC,预测高频增益;根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第二方面的第一实施方式,在第二方面的第六实施方式中,所述高频能量包括高频包络,所述预测子单元具体用于:根据所述解码得到的低频信号,预测高频包络;根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,其中所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和。
结合第二方面的第六实施方式,在第二方面的第七实施方式中,所述预测子单元具体用于:根据所述解码得到的低频信号,预测高频包络;根据所述解码速率和所述低频激励信号,预测高频激励信号。
结合第二方面的第六实施方式,在第二方面的第八实施方式中,所述预测子单元具体用于:根据所述解码得到的低频信号,预测高频包络;根据所述解码速率和所述解码得到的低频信号,预测高频激励信号。
结合第二方面的第一至第八实施方式,在第二方面的第九实施方式中,所述扩频单元还包括:第一修正子单元,用于在所述根据所述扩频参数,预测高频能量信号和高频激励信号之后,根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子;根据所述第一修正因子,修正所述高频能量。
结合第二方面的第九实施方式,在第二方面的第十实施方式中,所述第一修正子单元具体用于:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
结合第二方面的第九实施方式,在第二方面的第十一实施方式中,所述第一修正子单元具体用于:根据所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
结合第二方面的第九实施方式,在第二方面的第十二实施方式中,所述第一修正子单元具体用于:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
结合第二方面的第九至第十二实施方式,在第二方面的第十三实施方式中,所述扩频单元还包括:第二修正子单元,用于根据所述基音周期,修正所述高频能量。
结合第二方面的第九至第十三实施方式,在第二方面的第十四实施方式中,所述扩频单元还包括:第三修正子单元,用于根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第二方面的第十四实施方式,在第二方面的第十五实施方式中,所述第三修正子单元具体用于根据所述扩频参数,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第二方面的第十四实施方式,在第二方面的第十六实施方式中,所述第三修正子单元具体用于根据所述解码得到的低频信号,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第二方面的第十四实施方式,在第二方面的第十七实施方式中,所述第三修正子单元具体用于所述根据所述扩频参数与所述解码得到的低频信号,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第二方面的第九至第十七实施方式,在第二方面的第十八实施方式中,所述扩频单元还包括:加权子单元,用于对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的低频信号的分类参数值和/或浊音度因子确定。
结合第二方面的第一至第十八实施方式,在第二方面的第十九实施方式中,所述合成子单元具体用于:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。
本发明实施例利用扩频参数及通过扩频参数对解码得到的低频信号进行频带扩展,从而恢复高频信号。通过本发明实施例的频带扩展的方法及装置恢复的高频信号接近原始高频信号,质量理想。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的频带扩展的方法的流程图。
图2是根据本发明实施例的频带扩展的方法的实现框图。
图3是根据本发明实施例的频带扩展的方法的时域和频域实现的框图。
图4是根据本发明实施例的频带扩展的方法的频域实现的框图。
图5是根据本发明实施例的频带扩展的方法的时域实现的框图。
图6是根据本发明实施例的频带扩展的装置的结构示意图。
图7是根据本发明一个实施例的频带扩展的装置中扩频单元的结构示意图。
图8是根据本发明另一实施例的频带扩展的装置中扩频单元的结构示意图。
图9是根据本发明另一实施例的频带扩展的装置中扩频单元的结构示意图。
图10是根据本发明另一实施例的频带扩展的装置中扩频单元的结构示意图。
图11是根据本发明另一实施例的频带扩展的装置中扩频单元的结构示意图。
图12是根据本发明实施例的解码器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
本发明实施例将根据解码速率,从码流中直接解码出的LPC系数(LSF参数)、基音周期,中间解码的自适应码书贡献、代数码书贡献,以及最终解码的低频信号中的任意一个或几个的组合,对低频信号进行频带扩展,从而恢复高频信号。
下面结合图1详细描述根据本发明实施例的一种频带扩展方法,可以包括如下步骤。
S11,解码器获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数(LPC,Linear Predictive coefficient)、线谱频率(LSF,Linear SpectralFrequencies)参数、基音周期、自适应码书贡献和代数码书贡献。
所述的解码器可以装置于手机,平板,计算机,电视机,机顶盒,游戏机等需要进行解码操作的硬件设备中,在这些硬件设备中的处理器的控制下工作。所述的解码器也可以是一个独立的硬件设备,该硬件设备包括处理器,该硬件设备在该处理器的控制下工作。
具体而言,LPC是线性预测滤波器的系数,线性预测滤波器能够描述声道模型的基本特征,并且LPC也体现了信号在频域的能量变化趋势。LSF参数是LPC的频域表示方式。
此外,人在发浊音时,气流通过声门使声带产生张驰振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量。这种声带振动的频率称为基频,相应的周期就称为基音周期。
解码速率是指在语音编码算法中,编码或解码都是根据事先设定好的速率(比特率)来进行处理的,不同的解码速率可能处理的方式或参数可能是不同的。
自适应码书贡献就是语音信号通过LPC分析后的残差信号中的类周期部分。代数码书贡献是指语音信号通过LPC分析后的残差信号中的类噪声部分。
这里,LPC与LSF参数可以从码流中直接解码得到;自适应码书贡献与代数码书贡献可以组合得到低频激励信号。
自适应码书贡献反映了信号的类周期成分,代数码书贡献反映了信号的类噪声成分。
S12,解码器根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
例如,首先,根据所述扩频参数,预测高频能量和高频激励信号,其中所述高频能量可以包括高频包络或高频增益;然后,根据所述高频能量与所述高频激励信号,得到高频信号。
进一步地,针对时域和频域的不同,预测高频能量或高频激励信号所涉及的扩频参数会有不同。
对于在时域和频域进行频带扩展的情况,所述根据所述扩频参数,预测高频能量和高频激励信号,可以包括:根据所述LPC,预测高频增益;根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。进一步地,还可以根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
可选地,对于在时域进行频带扩展的情况,所述根据所述扩频参数,预测高频能量和高频激励信号,可以包括:根据所述LPC,预测高频增益;根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。进一步地,也可以根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
可选地,对于在频域进行频带扩展的情况,所述根据所述扩频参数,预测高频能量和高频激励信号,可以包括:根据所述解码得到的低频信号,预测高频包络;根据所述解码得到的低频信号或低频激励信号,预测高频激励信号。这里,低频激励信号是自适应码书贡献和代数码书贡献的和。进一步地,也可以根据所述解码速率和所述解码得到的低频信号,预测高频激励信号;或者,还可以根据解码速率和低频激励信号,预测高频激励信号。
此外,在所述根据所述扩频参数,预测高频能量和高频激励信号之后,本发明实施例的频带扩展方法还可以包括:根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子;根据所述第一修正因子,修正所述高频能量。例如,可以根据扩频参数确定浊音度因子或噪声门因子,可以根据解码得到的低频信号确定谱倾斜因子。
其中,所述根据所述扩频参数和所述解码得到的低频信号,确定第一修正因子,可以包括:根据所述解码得到的低频信号,确定第一修正因子;或者,根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,确定第一修正因子;或者,根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子。
此外,本发明实施例的频带扩展方法还可以包括:根据所述基音周期,修正所述高频能量信号。
此外,本发明实施例的频带扩展方法还可以包括:根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
具体而言,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,可以包括:根据所述扩频参数,确定第二修正因子;或者,根据所述解码得到的低频信号,确定第二修正因子;或者,根据所述扩频参数与所述解码得到的低频信号,确定第二修正因子。
此外,本发明实施例的频带扩展方法还可以包括:根据随机噪声信号以及所述解码速率,修正所述高频激励信号。
并且,所述根据所述高频能量与所述高频激励信号,得到高频信号,可以包括:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。这里的宽带LPC中的“宽带”包括低频带和高频带。
由此可见,本发明实施例利用扩频参数来对解码得到的低频信号进行频带扩展,从而恢复高频信号。通过本发明实施例的频带扩展的方法恢复的高频信号接近原始高频信号,质量理想。
也就是说,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
以下将结合附图,详细描述本发明的具体实施例。
首先,图2示出了根据本发明具体实施例的频带扩展的方法的流程示意图。
如图2所示,首先,根据解码速率,从码流直接解码出的LPC(或LSF参数)、基音周期,中间解码参数如自适应码书贡献、代数码书贡献,最终解码的低频信号中的任意一个或几个的组合,计算浊音度因子、噪声门因子、谱倾斜因子及分类参数的值中任意一个或几个的组合。其中所述浊音度因子是所述自适应码书贡献与所述代数码书贡献的比值,所述噪声门因子是用于表示信号背景噪声大小的参数,所述谱倾斜因子用于表示信号频谱倾斜度或信号在不同频段间的能量变化趋势,其中所述分类参数是用于区分信号类型的参数。然后,预测高频带LPC或宽带LPC、高频能量(如高频增益,或高频包络)及高频激励信号。最后,由预测的高频能量和高频激励信号,或者预测的高频能量和高频激励信号和预测的LPC合成高频信号。
具体而言,可以由解码得到的LPC预测高频带LPC或宽带LPC。
可以通过以下方式预测高频包络或高频增益:
例如,利用预测的LPC和解码得到的LPC、或解码得到的低频信号本身的高低频之间的关系,预测高频增益或高频包络。
或者,例如,针对不同的信号类型,计算不同的修正因子来修正预测的高频增益或高频包络。例如,可以利用解码得到的低频信号的分类参数、谱倾斜因子、浊音度因子、噪声门因子中的任意一个或几个的加权值,对预测的高频包络或高频增益进行修正。或者,对于基音周期稳定的信号,还可以利用基音周期对预测的高频包络做进一步修正。
可以通过以下方式预测高频激励信号:
例如,对不同解码速率或不同类型的信号,自适应地选取不同频段的解码得到的低频信号或采用不同的预测算法预测高频激励信号。
进一步地,对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,权重由解码得到的低频信号的分类参数的值和/或浊音度因子确定。
最终,由预测的高频能量和高频激励信号,或者由预测的高频能量、高频激励信号和预测的LPC合成高频信号。
由此可见,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
针对时域和频域的不同,本发明实施例的频带扩展的方法的具体实现过程会有所区别。以下将参见图3至图5分别描述时域和频域,频域,时域的具体实施例。
如图3所示,在时域和频域进行频带扩展的具体实现过程中。
首先,由解码得到的LPC预测宽带LPC。
然后,利用预测的宽带LPC和解码得到的LPC之间的关系预测高频增益。并且,针对不同的信号类型,计算不同的修正因子修正预测的高频增益,例如利用解码得到的低频信号的分类参数、谱倾斜因子、浊音度因子、噪声门因子对预测的高频增益进行修正。修正的高频增益与最小噪声门因子ng_min成正比,与分类参数的值fmerit成正比,与谱倾斜因子tilt的相反数成正比,与浊音度因子voice_fac成反比。此时,高频增益越大,谱倾斜因子越小;背景噪声越大,噪声门因子越大;语音特性越强,分类参数的值越大。例如:修正的高频增益gain=gain*(1-tilt)*fmerit*(30+ng_min)*(1.6-voice_fac)。这里,由于每帧求出的噪声门因子要和一个给定阈值比较,当每帧求出的噪声门因子比给定阈值小时,最小噪声门因子就等于该每帧求出的噪声门因子,否则,最小噪声门因子就等于该给定阈值。
并且,对不同解码速率或不同类型的信号,自适应选取不同频段的解码得到的低频信号或采用不同的预测算法预测高频激励信号。例如,当解码速率大于给定值时,利用与高频信号相邻的频段的低频激励信号(自适应码书贡献和代数码书贡献的和)作为高频激励信号;否则,通过LSF参数的差值,自适应在低频激励信号中选择编码质量较好(即LSF参数的差值较小)的频段作为高频激励信号。可以理解,不同的解码器可以选取不同的给定值。比如,自适应多速宽带(AMR-WB,Adaptive Multi-Rate Wideband)编解码器支持12.65kbps、15.85kbps、18.25kbps、19.85kbps、23.05和23.85kbps等解码速率,那么amr-wb编解码器可以选19.85kbps作为给定值。
其中,ISF参数(ISF参数是一组数,和LPC系数的阶数一样)是LPC系数的频域表示方式,反映了语音频信号在频域上的能量变化,ISF的取值大体对应了语音频信号从低频到高频的整个频带,每个ISF参数值对应一个相应的频率值。
在本发明的一个实施例中,通过LSF参数的差值,自适应在低频激励信号中选择编码质量较好(即LSF参数的差值较小)的频段作为高频激励信号可以包括:两两计算LSF参数的差值,得到一组LSF参数的差值;查找最小的一个差值,根据最小的差值,确定LSF参数对应的频点,根据此频点,在频域的激励信号中,选择一定频段的频域激励信号作为高频带的激励信号。具体选择方式有很多种,假如此频点为F1,可以从频点F1-F开始,选择需要长度的频段作为高频激励信号,F>=0,具体选择的长度根据要恢复的高频带带宽及信号特点确定。
同时,自适应在低频激励信号中选择编码质量较好的频段时,对音乐或语音信号,选择不同的最低起始选择频点,例如,对语音信号可以从2~6kHz范围内自适应选取;对音乐信号可以从1~6kHz范围内自适应选取。还可以对预测的高频激励信号和随机噪声信号进行加权,得到最终的高频激励信号,其中,加权的权重由低频信号的分类参数的值和/或浊音度因子确定。
exc[n]=α*exc[n]+β*random[n],其中
Figure BDA0001571562940000091
β=1-α
其中,exc[n]是预测的高频激励信号,random[n]是随机噪声信号,α是预测的高频激励信号的权重,β是随机噪声信号的权重,γ是计算预测的高频激励信号的权重为α时预设的值,fmerit是分类参数的值,voice_fac是浊音度因子。
容易理解,由于信号的分类方法不同,自适应选取不同频段的解码得到的低频信号或采用不同的预测算法预测高频激励信号。例如,可以将信号分为语音信号和音乐信号,其中语音信号还可以进一步分为清音、浊音和过渡音。或者,信号还可以分为瞬态信号和非瞬态信号,等等。
最后,由预测的高频增益、高频激励信号和预测的LPC合成高频信号。用预测的高频增益修正高频激励信号,然后将修正后的高频激励信号通过LPC合成滤波器,得到最终输出的高频信号;或者高频激励信号通过LPC合成滤波器,得到高频信号,然后通过高频增益修正高频信号,得到最终输出的高频信号。因为LPC合成滤波器是线性滤波器,所以合成前的修正与合成后的修正是一样的,即:用高频增益修正合成前的高频激励信号与修正合成后的高频激励信号,其结果是一样的,所以修正不分先后顺序。
这里,合成的过程是将得到频域的高频激励信号转换为时域的高频激励信号,将时域的高频激励信号与时域的高频增益作为合成滤波器的输入,预测的LPC系数作为合成滤波器的系数,从而得到合成的高频信号。
由此可见,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
如图4所示,在频域进行频带扩展的具体实现过程中。
首先,由解码得到的LPC预测高频带LPC。
然后,将需要扩展出的高频信号分成M个子带,预测M个子带的高频包络。例如,在解码得到的低频信号中选取与高频信号相邻的N个频带,计算这N个频带的能量或幅度,根据这N个频带的能量或幅度的大小关系,预测M个子带的高频包络。这里,M和N都是预先设定好的值。例如,将高频信号分成M=2个子带,选取与高频信号相邻的N=2或4个子带。
进一步地,利用解码得到的低频信号的分类参数、基音周期、低频信号本身的高低频之间的能量或幅度的比值、浊音度因子、噪声门因子对预测的高频包络进行修正。这里,可以针对不同的低频信号对其高频和低频进行不同的划分。例如,假如低频信号的带宽为6kHz,那么可以取0~3kHz和3~6kHz分别作为低频信号的低频和高频,也可以取0~4kHz和4~6kHz分别作为低频信号的低频和高频。
修正的高频包络与最小噪声门因子ng_min成正比,与分类参数的值fmerit成正比,与谱倾斜因子tilt的相反数成正比,与浊音度因子voice_fac的成反比。此外,对基音周期pitch稳定的信号,修正的高频包络和基音周期成正比。此时,高频能量越大,谱倾斜因子越小;背景噪声越大,噪声门因子越大;语音特性越强,分类参数的值越大。例如:修正的高频包络gain*=(1-tilt)*fmerit*(30+ng_min)*(1.6-voice_fac)*(pitch/100)。
接着,当解码速率大于等于给定阈值时,选取和高频信号相邻的低频信号的频带预测高频激励信号;或者,当解码速率小于给定阈值时,自适应选取编码质量较好的子带预测高频激励信号。这里,给定阈值可以是经验值。
进一步地,将随机噪声信号对预测的高频激励信号做加权,加权值由低频信号的分类参数确定。随机噪声信号的权重和低频分类参数的大小成正比。
exc[n]=β*exc[n]+α*random[n],其中
Figure BDA0001571562940000101
其中,exc[n]是预测的高频激励信号,random[n]是随机噪声信号,α是预测的高频激励信号的权重,β是随机噪声信号的权重,γ是计算预测的高频激励信号的权重为α时预设的值,fmerit是分类参数的值。
最后,将预测的高频包络和高频激励信号合成高频信号。
这里,合成的过程可以是直接将频域的高频激励信号与频域的高频包络相乘得到合成的高频信号。
由此可见,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
如图5所示,在时域进行频带扩展的具体实现过程中。
首先,由解码得到的LPC预测宽带LPC。
然后,将需要扩展出的高频信号分成M个子帧,利用预测的宽带LPC和解码得到的LPC之间的关系预测M个子帧的高频增益。
然后,通过当前子帧或当前帧的低频信号或低频激励信号,预测当前子帧的高频增益。
进一步地,利用解码得到的低频信号的分类参数、基音周期、低频信号本身的高低频之间的能量或幅度的比值、浊音度因子、噪声门因子对预测的高频增益进行修正。修正的高频增益与最小噪声门因子ng_min成正比,与分类参数的值fmerit成正比,与谱倾斜因子tilt的相反数成正比,与浊音度因子voice_fac的成反比。此外,对基音周期pitch稳定的信号,修正的高频增益和基音周期成正比。此时,高频能量越大,谱倾斜因子越小;背景噪声越大,噪声门因子越大;语音特性越强,分类参数的值越大。例如:修正的高频增益gain*=(1-tilt)*fmerit*(30+ng_min)*(1.6-voice_fac)*(pitch/100)。
其中,tilt是谱倾斜因子,fmerit是分类参数的值,ng_min是最小噪声门因子,voice_fac是浊音度因子,pitch是基音周期。
接着,当解码速率大于等于给定阈值时,选取与高频信号相邻的解码得到的低频信号的频带预测高频激励信号;或者,当解码速率小于给定阈值时,自适应选取编码质量较好的频带预测高频激励信号。即可以利用与高频信号相邻的频段的低频激励信号(自适应码书贡献和代数码书贡献)作为高频激励信号。
进一步地,将随机噪声信号对预测的高频激励信号做加权,加权值由低频信号的分类参数以及浊音度因子的加权值确定。
最终,由预测的高频增益、高频激励信号和预测的LPC合成高频信号。
这里,合成的过程可以是将时域的高频激励信号与时域的高频增益作为合成滤波器的输入,预测的LPC系数作为合成滤波器的系数,从而得到合成的高频信号。
由此可见,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
图6至图11示出了根据本发明实施例的频带扩展的装置的结构图。如图6所示,频带扩展的装置60包括获取单元61和扩频单元62。其中,获取单元61,用于获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献。扩频单元62,用于根据所述获取单元61获取的扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
进一步地,如图7所示,扩频单元62包括预测子单元621和合成子单元622。其中,预测子单元621用于根据所述扩频参数,预测高频能量和高频激励信号。合成子单元622用于根据所述高频能量与所述高频激励信号,得到高频信号。具体而言,合成子单元622用于:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。
具体地,所述高频能量包括高频增益,预测子单元621用于根据所述LPC,预测高频增益;根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
或者,所述高频能量包括高频增益,预测子单元621用于根据所述LPC,预测高频增益;根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
或者,所述高频能量包括高频增益,预测子单元621用于根据所述LPC,预测高频增益;根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
或者,所述高频能量包括高频增益,预测子单元621用于根据所述LPC,预测高频增益;根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
或者,所述高频能量包括高频包络,预测子单元621用于根据所述解码得到的低频信号,预测高频包络;根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,其中所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和。
或者,所述高频能量包括高频包络,预测子单元621用于根据所述解码得到的低频信号,预测高频包络;根据所述解码速率和所述解码得到的低频信号,预测高频激励信号。
或者,所述高频能量包括高频包络,预测子单元621用于根据所述解码得到的低频信号,预测高频包络;根据所述解码速率和所述低频激励信号,预测高频激励信号。
此外,所述扩频单元62还包括第一修正子单元623,如图8所示。其中,第一修正子单元623用于在所述根据所述扩频参数,预测高频能量信号和高频激励信号之后,根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,并根据第一修正因子修正所述高频能量,其中所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子。
具体而言,第一修正子单元623用于根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。或者,第一修正子单元具体用于:根据所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。或者,第一修正子单元具体用于:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
此外,扩频单元62还包括第二修正子单元624,用于根据所述基音周期,修正所述高频能量,如图9所示。
另外,扩频单元62还包括第三修正子单元625,如图10所示,用于根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
具体而言,所述第三修正子单元625用于根据所述扩频参数,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。或者,第三修正子单元625用于根据所述解码得到的低频信号,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。第三修正子单元625用于所述根据所述扩频参数与所述解码得到的低频信号,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
进一步地,扩频单元62还包括加权子单元626,如图11所示,用于对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的低频信号的分类参数值和/或浊音度因子确定。
在本发明的一个实施例中,频带扩展的装置60还可以包括处理器,该处理器用于控制该频带扩展的装置所包括的单元。
由此可见,本发明实施例的频带扩展的装置充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
图12示出了根据本发明实施例的解码器120的结构示意图。其中,该解码器120包括处理器121和存储器122。
其中,处理器121实现根据本发明实施例的频带扩展的方法。即,处理器121用于获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。存储器122用于存储处理器121执行的指令。
应理解,本发明的每个权利要求所叙述的方案也应看做是一个实施例,并且是权利要求中的特征是可以结合的,如本发明中的判断步骤后的执行的不同分支的步骤可以作为不同的实施例。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (20)

1.一种频带扩展的方法,其特征在于,包括:
对码流进行解码以得到低频信号和扩频参数,所述扩频参数包括:线性预测系数LPC、多个线谱频率LSF参数、自适应码书贡献和代数码书贡献;
根据所述扩频参数,对解码得到的所述低频信号进行频带扩展,以获得高频信号;
其中,所述根据所述扩频参数对解码得到的低频信号进行频带扩展包括:
根据所述LPC,预测高频增益;
根据所述多个LSF参数、所述自适应码书贡献和所述代数码书贡献,预测高频激励信号;
根据所述高频增益和所述高频激励信号合成所述高频信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个LSF参数、所述自适应码书贡献和所述代数码书贡献,预测高频激励信号,包括:
当解码速率不大于设定阈值时,根据LSF参数的差值,从低频激励信号中选择一定频段的激励信号作为所述高频激励信号,所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和。
3.根据权利要求2所述的方法,其特征在于,所述根据LSF参数的差值,从低频激励信号中选择一定频段的激励信号作为所述高频激励信号,包括:
两两计算LSF参数的差值,得到一组LSF参数的差值;
查找最小的一个LSF参数差值,确定所述最小的LSF参数差值对应的频点;
根据所述频点,从所述低频激励信号中选择特定长度的频段作为所述高频激励信号。
4.根据权利要求2所述的方法,其特征在于,从所述低频激励信号中选择一定频段的激励信号时,选择的最低起始选择频点与信号类型相关,所述信号类型包括:音乐或语音。
5.根据权利要求1至4中任一项所述的方法,其特征在于,在预测高频增益之后,还包括:
使用修正因子修正所述高频增益,所述修正因子包括解码得到的所述低频信号的分类参数、谱倾斜因子、浊音度因子、噪声门因子中的一个或多个。
6.根据权利要求5所述的方法,其特征在于,在预测高频增益之后,还包括:还包括:
根据基音周期,修正所述高频增益,所述基音周期从所述码流中解码得到。
7.根据权利要求2至4任一项所述的方法,其特征在于,还包括:
根据随机噪声信号以及所述解码速率,修正所述高频激励信号。
8.根据权利要求5所述的方法,其特征在于,还包括:
对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的所述低频信号的分类参数值和/或浊音度因子确定。
9.根据权利要求1至4中任一项所述的方法,其特征在于,所述根据所述高频增益与所述高频激励信号,得到高频信号,包括:
用所述高频增益修正所述高频激励信号,然后将修正后的高频激励信号通过LPC合成滤波器,得到所述高频信号。
10.一种计算机可读取存储介质,其上存储有计算机指令,其特征在于,所述指令被处理器执行时实现权利要求1至9任一项所述方法的步骤。
11.一种解码器,其特征在于,包括:处理器和存储器;所述处理器被配置为执行所述存储器中存储的指令,以用于:
获取扩频参数,所述扩频参数包括以下参数:线性预测系数LPC、多个线谱频率LSF参数、自适应码书贡献和代数码书贡献;
根据所述扩频参数对解码得到的低频信号进行频带扩展,以获得高频信号;
其中,所述根据所述扩频参数对解码得到的低频信号进行频带扩展包括:
根据所述LPC,预测高频增益;
根据所述多个LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号;
根据所述高频增益与所述高频激励信号,得到所述高频信号。
12.根据权利要求11所述的解码器,其特征在于,所述处理器具体用于,当解码速率不大于设定阈值时,根据LSF参数的差值,从低频激励信号中选择一定频段的激励信号作为所述高频激励信号,所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和。
13.根据权利要求12所述的解码器,其特征在于,所述处理器具体用于:
两两计算LSF参数的差值,得到一组LSF参数的差值;
查找最小的一个LSF参数差值,确定所述最小的LSF参数差值对应的频点;
根据所述频点,从所述低频激励信号中选择特定长度的频段作为所述高频激励信号。
14.根据权利要求12所述的解码器,其特征在于,从所述低频激励信号中选择一定频段的激励信号时,选择的最低起始选择频点与信号类型相关,所述信号类型包括:音乐或语音。
15.根据权利要求11至14中任一项所述的解码器,其特征在于,所述处理器还用于:
使用修正因子修正所述高频增益,所述修正因子包括解码得到的所述低频信号的分类参数、谱倾斜因子、浊音度因子、噪声门因子中的一个或多个。
16.根据权利要求15所述的解码器,其特征在于,所述处理器还用于:
根据基音周期、所述自适应码书贡献和所述代数码书贡献,确定所述修正因子。
17.根据权利要求15所述的解码器,其特征在于,所述处理器还用于,根据基音周期修正所述高频增益,所述基音周期从码流中解码得到。
18.根据权利要求12至14任一项所述的解码器,其特征在于,所述处理器还用于,根据随机噪声信号以及所述解码速率,修正所述高频激励信号。
19.根据权利要求15所述的解码器,其特征在于,所述处理器还用于,对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的所述低频信号的分类参数值和/或浊音度因子确定。
20.根据权利要求11至14中任一项所述的解码器,其特征在于,所述根据所述高频增益与所述高频激励信号,得到高频信号,包括:
用所述高频增益修正所述高频激励信号,然后将修正后的高频激励信号通过LPC合成滤波器以得到所述高频信号。
CN201810119215.3A 2013-09-26 2013-09-26 频带扩展的方法及装置 Active CN108172239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810119215.3A CN108172239B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201310444398.3A CN104517610B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置
CN201810119215.3A CN108172239B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201310444398.3A Division CN104517610B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置

Publications (2)

Publication Number Publication Date
CN108172239A CN108172239A (zh) 2018-06-15
CN108172239B true CN108172239B (zh) 2021-01-12

Family

ID=52741937

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201810119215.3A Active CN108172239B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置
CN201310444398.3A Active CN104517610B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201310444398.3A Active CN104517610B (zh) 2013-09-26 2013-09-26 频带扩展的方法及装置

Country Status (11)

Country Link
US (2) US9666201B2 (zh)
EP (2) EP3611729B1 (zh)
JP (1) JP6423420B2 (zh)
KR (2) KR101893454B1 (zh)
CN (2) CN108172239B (zh)
BR (1) BR112016005850B1 (zh)
ES (2) ES2924905T3 (zh)
HK (1) HK1206140A1 (zh)
PL (1) PL3611729T3 (zh)
SG (1) SG11201601691RA (zh)
WO (1) WO2015043161A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103426441B (zh) 2012-05-18 2016-03-02 华为技术有限公司 检测基音周期的正确性的方法和装置
CN103928029B (zh) 2013-01-11 2017-02-08 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) * 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
MX371223B (es) * 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
CN105869653B (zh) * 2016-05-31 2019-07-12 华为技术有限公司 话音信号处理方法和相关装置和系统
CN105959974B (zh) * 2016-06-14 2019-11-29 深圳市海思半导体有限公司 一种预测空口带宽的方法和装置
US10475457B2 (en) 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
WO2019213965A1 (zh) * 2018-05-11 2019-11-14 华为技术有限公司 语音信号的处理方法和移动设备
CN110660402B (zh) 2018-06-29 2022-03-29 华为技术有限公司 立体声信号编码过程中确定加权系数的方法和装置
CN109150399B (zh) * 2018-08-14 2021-04-13 Oppo广东移动通信有限公司 数据传输方法、装置、电子设备及计算机可读介质
CN113421584B (zh) * 2021-07-05 2023-06-23 平安科技(深圳)有限公司 音频降噪方法、装置、计算机设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1185626C (zh) * 2000-01-28 2005-01-19 艾利森电话股份有限公司 修改语音信号的系统和方法
CN102576542A (zh) * 2009-10-23 2012-07-11 高通股份有限公司 从窄频带信号确定上频带信号
CN102812513A (zh) * 2010-03-31 2012-12-05 索尼公司 解码设备和解码方法、编码设备和编码方法、以及程序
CN102947881A (zh) * 2010-06-21 2013-02-27 松下电器产业株式会社 解码装置、编码装置和解码方法、编码方法
WO2013066238A2 (en) * 2011-11-02 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal
CN103314407A (zh) * 2011-01-14 2013-09-18 索尼公司 信号处理装置、方法以及程序

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
US6199040B1 (en) * 1998-07-27 2001-03-06 Motorola, Inc. System and method for communicating a perceptually encoded speech spectrum signal
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
DE60202881T2 (de) * 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
DE60303689T2 (de) * 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
WO2005093717A1 (en) * 2004-03-12 2005-10-06 Nokia Corporation Synthesizing a mono audio signal based on an encoded miltichannel audio signal
JPWO2006025313A1 (ja) * 2004-08-31 2008-05-08 松下電器産業株式会社 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
KR100707174B1 (ko) * 2004-12-31 2007-04-13 삼성전자주식회사 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법
WO2006107833A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US20080300866A1 (en) * 2006-05-31 2008-12-04 Motorola, Inc. Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
CN101304261B (zh) * 2007-05-12 2011-11-09 华为技术有限公司 一种频带扩展的方法及装置
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
CN101620854B (zh) * 2008-06-30 2012-04-04 华为技术有限公司 频带扩展的方法、系统和设备
ES2372014T3 (es) * 2008-07-11 2012-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.
JP5325293B2 (ja) * 2008-07-11 2013-10-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたオーディオ信号を復号化するための装置および方法
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN102044250B (zh) 2009-10-23 2012-06-27 华为技术有限公司 频带扩展方法及装置
EP2502230B1 (en) * 2009-11-19 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Improved excitation signal bandwidth extension
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
CN102339607A (zh) * 2010-07-16 2012-02-01 华为技术有限公司 一种频带扩展的方法和装置
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
WO2012108680A2 (ko) * 2011-02-08 2012-08-16 엘지전자 주식회사 대역 확장 방법 및 장치
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
DK3040988T3 (en) * 2011-11-02 2018-01-08 ERICSSON TELEFON AB L M (publ) AUDIO DECODING BASED ON AN EFFECTIVE REPRESENTATION OF AUTOREGRESSIVE COEFFICIENTS
WO2013066244A1 (en) * 2011-11-03 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Bandwidth extension of audio signals
US8666753B2 (en) * 2011-12-12 2014-03-04 Motorola Mobility Llc Apparatus and method for audio encoding
CN105469805B (zh) * 2012-03-01 2018-01-12 华为技术有限公司 一种语音频信号处理方法和装置
CN105551497B (zh) * 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US9319510B2 (en) * 2013-02-15 2016-04-19 Qualcomm Incorporated Personalized bandwidth extension
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN104517611B (zh) * 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1185626C (zh) * 2000-01-28 2005-01-19 艾利森电话股份有限公司 修改语音信号的系统和方法
CN102576542A (zh) * 2009-10-23 2012-07-11 高通股份有限公司 从窄频带信号确定上频带信号
CN102812513A (zh) * 2010-03-31 2012-12-05 索尼公司 解码设备和解码方法、编码设备和编码方法、以及程序
CN102947881A (zh) * 2010-06-21 2013-02-27 松下电器产业株式会社 解码装置、编码装置和解码方法、编码方法
CN103314407A (zh) * 2011-01-14 2013-09-18 索尼公司 信号处理装置、方法以及程序
WO2013066238A2 (en) * 2011-11-02 2013-05-10 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal

Also Published As

Publication number Publication date
US20170213564A1 (en) 2017-07-27
ES2745289T3 (es) 2020-02-28
CN108172239A (zh) 2018-06-15
KR20170117621A (ko) 2017-10-23
CN104517610A (zh) 2015-04-15
KR20160044025A (ko) 2016-04-22
EP3038105B1 (en) 2019-06-26
US20160196829A1 (en) 2016-07-07
JP6423420B2 (ja) 2018-11-14
WO2015043161A1 (zh) 2015-04-02
CN104517610B (zh) 2018-03-06
KR101787711B1 (ko) 2017-11-15
EP3038105A4 (en) 2016-08-31
EP3038105A1 (en) 2016-06-29
HK1206140A1 (zh) 2015-12-31
US10186272B2 (en) 2019-01-22
US9666201B2 (en) 2017-05-30
PL3611729T3 (pl) 2022-09-12
EP3611729B1 (en) 2022-06-08
EP3611729A1 (en) 2020-02-19
BR112016005850B1 (pt) 2020-12-08
ES2924905T3 (es) 2022-10-11
JP2016537662A (ja) 2016-12-01
SG11201601691RA (en) 2016-04-28
KR101893454B1 (ko) 2018-08-30

Similar Documents

Publication Publication Date Title
CN108172239B (zh) 频带扩展的方法及装置
US10885926B2 (en) Classification between time-domain coding and frequency domain coding for high bit rates
EP3301674B1 (en) Adaptive bandwidth extension and apparatus for the same
CN101496101B (zh) 用于增益因子限制的系统、方法及设备
CA2556797C (en) Methods and devices for low-frequency emphasis during audio compression based on acelp/tcx
JP6470857B2 (ja) 音声処理のための無声/有声判定
US20180166085A1 (en) Bandwidth Extension Audio Decoding Method and Device for Predicting Spectral Envelope
EP2951824B1 (en) Adaptive high-pass post-filter
Vaillancourt et al. New post-processing techniques for low bit rate celp codecs

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant