CN104517610A - 频带扩展的方法及装置 - Google Patents
频带扩展的方法及装置 Download PDFInfo
- Publication number
- CN104517610A CN104517610A CN201310444398.3A CN201310444398A CN104517610A CN 104517610 A CN104517610 A CN 104517610A CN 201310444398 A CN201310444398 A CN 201310444398A CN 104517610 A CN104517610 A CN 104517610A
- Authority
- CN
- China
- Prior art keywords
- frequency
- signal
- excitation signal
- contribution
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000003892 spreading Methods 0.000 title claims abstract description 32
- 238000001228 spectrum Methods 0.000 claims abstract description 102
- 230000005284 excitation Effects 0.000 claims description 201
- 230000003595 spectral effect Effects 0.000 claims description 8
- 238000012937 correction Methods 0.000 abstract description 16
- 230000008569 process Effects 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 239000002131 composite material Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 206010038743 Restlessness Diseases 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000005086 pumping Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 210000004704 glottis Anatomy 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0002—Codebook adaptations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
- G10L2025/906—Pitch tracking
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- External Artificial Organs (AREA)
- Vehicle Body Suspensions (AREA)
Abstract
本发明实施例提出了频带扩展的方法及装置。其中,频带扩展的方法包括:获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。本发明实施例利用扩频参数及通过扩频参数计算得到的修正因子来对解码得到的低频信号进行频带扩展,从而恢复高频信号。通过本发明实施例的频带扩展的方法及装置恢复的高频信号接近原始高频信号,质量理想。
Description
技术领域
本发明涉及音频编解码领域,特别地,涉及中低速率宽带的代数码激励线性预测编码(ACELP,Algebraic Code Excited Linear Prediction)中频带扩展的方法及装置。
背景技术
盲带宽扩展技术是解码端技术,解码器根据低频解码信号及相应的预测方法进行盲带宽扩展。
在中低速率宽带ACELP编解码时,现有的算法都是先将16kHz采样的宽带信号下采样到12.8kHz采样,然后进行编码,这样编解码后输出的信号带宽只到6.4kHz。在不改变原有算法的情况下,6.4~8kHz或6.4~7kHz带宽部分的信息就需要通过盲带宽扩展的方式恢复出来,即只在解码端进行相应的恢复。
但是,现有的盲带宽扩展技术恢复的高频信号与原始高频信号偏差较多,导致高频信号不够理想。
发明内容
本发明提出了频带扩展的方法及装置,旨在解决现有的盲带宽扩展技术恢复的高频信号与原始高频信号偏差较多的问题。
第一方面,提出了一种频带扩展的方法,包括:获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
结合第一方面,在第一方面的第一实施方式中,所述根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号,包括:根据所述扩频参数,预测高频能量和高频激励信号;根据所述高频能量与所述高频激励信号,得到高频信号。
结合第一方面的第一实施方式,在第一方面的第二实施方式中,所述高频能量包括高频增益,所述根据所述扩频参数,预测高频能量和高频激励信号,包括:根据所述LPC,预测高频增益;根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第一方面的第二实施方式,在第一方面的第三实施方式中,所述根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号,包括:根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第一方面的第一实施方式,在第一方面的第四实施方式中,所述高频能量包括高频增益,所述根据所述扩频参数,预测高频能量和高频激励信号,包括:根据所述LPC,预测高频增益;根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第一方面的第四实施方式,在第一方面的第五实施方式中,所述根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号,包括:根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第一方面的第一实施方式,在第一方面的第六实施方式中,所述高频能量包括高频包络,所述根据所述扩频参数,预测高频能量和高频激励信号,包括:根据所述解码得到的低频信号或低频激励信号,预测高频包络,其中所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和;根据所述解码得到的低频信号或所述自适应码书贡献和所述代数码书贡献,预测高频激励信号。
结合第一方面的第六实施方式,在第一方面的第七实施方式中,所述根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,包括:根据所述解码速率和所述解码得到的低频信号,预测高频激励信号。
结合第一方面的第六实施方式,在第一方面的第八实施方式中,所述根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,包括:根据所述解码速率和所述低频激励信号,预测高频激励信号。
结合第一方面的第一至第八实施方式,在第一方面的第九实施方式中,在所述根据所述扩频参数,预测高频能量信号和高频激励信号之后,还包括:根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子;根据所述第一修正因子,修正所述高频能量。
结合第一方面的第九实施方式,在第一方面的第十实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子。
结合第一方面的第九实施方式,在第一方面的第十一实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:根据所述解码得到的低频信号,确定第一修正因子。
结合第一方面的第九实施方式,在第一方面的第十二实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子。
结合第一方面的第九至第十二实施方式,在第一方面的第十三实施方式中,还包括:根据所述基音周期,修正所述高频能量。
结合第一方面的第九至第十三实施方式,在第一方面的第十四实施方式中,还包括:根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第一方面的第十四实施方式,在第一方面的第十五实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,包括:根据所述扩频参数,确定第二修正因子。
结合第一方面的第十四实施方式,在第一方面的第十六实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,包括:根据所述解码得到的低频信号,确定第二修正因子。
结合第一方面的第十四实施方式,在第一方面的第十七实施方式中,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,包括:所述根据所述扩频参数与所述解码得到的低频信号,确定第二修正因子。
结合第一方面的第九至第十七实施方式,在第一方面的第十八实施方式中,还包括:对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的低频信号的分类参数值和/或浊音度因子确定。
结合第一方面的第一至第十八实施方式,在第一方面的第十九实施方式中,所述根据所述高频能量与所述高频激励信号,得到高频信号,包括:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。
第二方面,提出了一种频带扩展的装置,包括:获取单元,用于获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;扩频单元,用于根据所述获取单元获取的扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
结合第二方面,在第二方面的第一实施方式中,所述扩频单元包括:预测子单元,用于根据所述扩频参数,预测高频能量和高频激励信号;合成子单元,用于根据所述高频能量与所述高频激励信号,得到高频信号。
结合第二方面的第一实施方式,在第二方面的第二实施方式中,所述高频能量包括高频增益,所述预测子单元具体用于:根据所述LPC,预测高频增益;根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第二方面的第一实施方式,在第二方面的第三实施方式中,所述高频能量包括高频增益,所述预测子单元具体用于:根据所述LPC,预测高频增益;根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第二方面的第一实施方式,在第二方面的第四实施方式中,所述高频能量包括高频增益,所述预测子单元具体用于:根据所述LPC,预测高频增益;根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第二方面的第一实施方式,在第二方面的第五实施方式中,所述高频能量包括高频增益,所述预测子单元具体用于:根据所述LPC,预测高频增益;根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
结合第二方面的第一实施方式,在第二方面的第六实施方式中,所述高频能量包括高频包络,所述预测子单元具体用于:根据所述解码得到的低频信号,预测高频包络;根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,其中所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和。
结合第二方面的第六实施方式,在第二方面的第七实施方式中,所述预测子单元具体用于:根据所述解码得到的低频信号,预测高频包络;根据所述解码速率和所述低频激励信号,预测高频激励信号。
结合第二方面的第六实施方式,在第二方面的第八实施方式中,所述预测子单元具体用于:根据所述解码得到的低频信号,预测高频包络;根据所述解码速率和所述解码得到的低频信号,预测高频激励信号。
结合第二方面的第一至第八实施方式,在第二方面的第九实施方式中,所述扩频单元还包括:第一修正子单元,用于在所述根据所述扩频参数,预测高频能量信号和高频激励信号之后,根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子;根据所述第一修正因子,修正所述高频能量。
结合第二方面的第九实施方式,在第二方面的第十实施方式中,所述第一修正子单元具体用于:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
结合第二方面的第九实施方式,在第二方面的第十一实施方式中,所述第一修正子单元具体用于:根据所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
结合第二方面的第九实施方式,在第二方面的第十二实施方式中,所述第一修正子单元具体用于:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
结合第二方面的第九至第十二实施方式,在第二方面的第十三实施方式中,所述扩频单元还包括:第二修正子单元,用于根据所述基音周期,修正所述高频能量。
结合第二方面的第九至第十三实施方式,在第二方面的第十四实施方式中,所述扩频单元还包括:第三修正子单元,用于根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第二方面的第十四实施方式,在第二方面的第十五实施方式中,所述第三修正子单元具体用于根据所述扩频参数,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第二方面的第十四实施方式,在第二方面的第十六实施方式中,所述第三修正子单元具体用于根据所述解码得到的低频信号,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第二方面的第十四实施方式,在第二方面的第十七实施方式中,所述第三修正子单元具体用于所述根据所述扩频参数与所述解码得到的低频信号,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
结合第二方面的第九至第十七实施方式,在第二方面的第十八实施方式中,所述扩频单元还包括:加权子单元,用于对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的低频信号的分类参数值和/或浊音度因子确定。
结合第二方面的第一至第十八实施方式,在第二方面的第十九实施方式中,所述合成子单元具体用于:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。
本发明实施例利用扩频参数及通过扩频参数对解码得到的低频信号进行频带扩展,从而恢复高频信号。通过本发明实施例的频带扩展的方法及装置恢复的高频信号接近原始高频信号,质量理想。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的频带扩展的方法的流程图。
图2是根据本发明实施例的频带扩展的方法的实现框图。
图3是根据本发明实施例的频带扩展的方法的时域和频域实现的框图。
图4是根据本发明实施例的频带扩展的方法的频域实现的框图。
图5是根据本发明实施例的频带扩展的方法的时域实现的框图。
图6是根据本发明实施例的频带扩展的装置的结构示意图。
图7是根据本发明一个实施例的频带扩展的装置中扩频单元的结构示意图。
图8是根据本发明另一实施例的频带扩展的装置中扩频单元的结构示意图。
图9是根据本发明另一实施例的频带扩展的装置中扩频单元的结构示意图。
图10是根据本发明另一实施例的频带扩展的装置中扩频单元的结构示意图。
图11是根据本发明另一实施例的频带扩展的装置中扩频单元的结构示意图。
图12是根据本发明实施例的解码器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
本发明实施例将根据解码速率,从码流中直接解码出的LPC系数(LSF参数)、基音周期,中间解码的自适应码书贡献、代数码书贡献,以及最终解码的低频信号中的任意一个或几个的组合,对低频信号进行频带扩展,从而恢复高频信号。
下面结合图1详细描述根据本发明实施例的一种频带扩展方法,可以包括如下步骤。
S11,解码器获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数(LPC,Linear Predictive coefficient)、线谱频率(LSF,Linear Spectral Frequencies)参数、基音周期、自适应码书贡献和代数码书贡献。
所述的解码器可以装置于手机,平板,计算机,电视机,机顶盒,游戏机等需要进行解码操作的硬件设备中,在这些硬件设备中的处理器的控制下工作。所述的解码器也可以是一个独立的硬件设备,该硬件设备包括处理器,该硬件设备在该处理器的控制下工作。
具体而言,LPC是线性预测滤波器的系数,线性预测滤波器能够描述声道模型的基本特征,并且LPC也体现了信号在频域的能量变化趋势。LSF参数是LPC的频域表示方式。
此外,人在发浊音时,气流通过声门使声带产生张驰振荡式振动,产生一股准周期脉冲气流,这一气流激励声道就产生浊音,又称有声语音,它携带着语音中的大部分能量。这种声带振动的频率称为基频,相应的周期就称为基音周期。
解码速率是指在语音编码算法中,编码或解码都是根据事先设定好的速率(比特率)来进行处理的,不同的解码速率可能处理的方式或参数可能是不同的。
自适应码书贡献就是语音信号通过LPC分析后的残差信号中的类周期部分。代数码书贡献是指语音信号通过LPC分析后的残差信号中的类噪声部分。
这里,LPC与LSF参数可以从码流中直接解码得到;自适应码书贡献与代数码书贡献可以组合得到低频激励信号。
自适应码书贡献反映了信号的类周期成分,代数码书贡献反映了信号的类噪声成分。
S12,解码器根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
例如,首先,根据所述扩频参数,预测高频能量和高频激励信号,其中所述高频能量可以包括高频包络或高频增益;然后,根据所述高频能量与所述高频激励信号,得到高频信号。
进一步地,针对时域和频域的不同,预测高频能量或高频激励信号所涉及的扩频参数会有不同。
对于在时域和频域进行频带扩展的情况,所述根据所述扩频参数,预测高频能量和高频激励信号,可以包括:根据所述LPC,预测高频增益;根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。进一步地,还可以根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
可选地,对于在时域进行频带扩展的情况,所述根据所述扩频参数,预测高频能量和高频激励信号,可以包括:根据所述LPC,预测高频增益;根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。进一步地,也可以根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
可选地,对于在频域进行频带扩展的情况,所述根据所述扩频参数,预测高频能量和高频激励信号,可以包括:根据所述解码得到的低频信号,预测高频包络;根据所述解码得到的低频信号或低频激励信号,预测高频激励信号。这里,低频激励信号是自适应码书贡献和代数码书贡献的和。进一步地,也可以根据所述解码速率和所述解码得到的低频信号,预测高频激励信号;或者,还可以根据解码速率和低频激励信号,预测高频激励信号。
此外,在所述根据所述扩频参数,预测高频能量和高频激励信号之后,本发明实施例的频带扩展方法还可以包括:根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子;根据所述第一修正因子,修正所述高频能量。例如,可以根据扩频参数确定浊音度因子或噪声门因子,可以根据解码得到的低频信号确定谱倾斜因子。
其中,所述根据所述扩频参数和所述解码得到的低频信号,确定第一修正因子,可以包括:根据所述解码得到的低频信号,确定第一修正因子;或者,根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,确定第一修正因子;或者,根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子。
此外,本发明实施例的频带扩展方法还可以包括:根据所述基音周期,修正所述高频能量信号。
此外,本发明实施例的频带扩展方法还可以包括:根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
具体而言,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,可以包括:根据所述扩频参数,确定第二修正因子;或者,根据所述解码得到的低频信号,确定第二修正因子;或者,根据所述扩频参数与所述解码得到的低频信号,确定第二修正因子。
此外,本发明实施例的频带扩展方法还可以包括:根据随机噪声信号以及所述解码速率,修正所述高频激励信号。
并且,所述根据所述高频能量与所述高频激励信号,得到高频信号,可以包括:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。这里的宽带LPC中的“宽带”包括低频带和高频带。
由此可见,本发明实施例利用扩频参数来对解码得到的低频信号进行频带扩展,从而恢复高频信号。通过本发明实施例的频带扩展的方法恢复的高频信号接近原始高频信号,质量理想。
也就是说,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
以下将结合附图,详细描述本发明的具体实施例。
首先,图2示出了根据本发明具体实施例的频带扩展的方法的流程示意图。
如图2所示,首先,根据解码速率,从码流直接解码出的LPC(或LSF参数)、基音周期,中间解码参数如自适应码书贡献、代数码书贡献,最终解码的低频信号中的任意一个或几个的组合,计算浊音度因子、噪声门因子、谱倾斜因子及分类参数的值中任意一个或几个的组合。其中所述浊音度因子是所述自适应码书贡献与所述代数码书贡献的比值,所述噪声门因子是用于表示信号背景噪声大小的参数,所述谱倾斜因子用于表示信号频谱倾斜度或信号在不同频段间的能量变化趋势,其中所述分类参数是用于区分信号类型的参数。然后,预测高频带LPC或宽带LPC、高频能量(如高频增益,或高频包络)及高频激励信号。最后,由预测的高频能量和高频激励信号,或者预测的高频能量和高频激励信号和预测的LPC合成高频信号。
具体而言,可以由解码得到的LPC预测高频带LPC或宽带LPC。
可以通过以下方式预测高频包络或高频增益:
例如,利用预测的LPC和解码得到的LPC、或解码得到的低频信号本身的高低频之间的关系,预测高频增益或高频包络。
或者,例如,针对不同的信号类型,计算不同的修正因子来修正预测的高频增益或高频包络。例如,可以利用解码得到的低频信号的分类参数、谱倾斜因子、浊音度因子、噪声门因子中的任意一个或几个的加权值,对预测的高频包络或高频增益进行修正。或者,对于基音周期稳定的信号,还可以利用基音周期对预测的高频包络做进一步修正。
可以通过以下方式预测高频激励信号:
例如,对不同解码速率或不同类型的信号,自适应地选取不同频段的解码得到的低频信号或采用不同的预测算法预测高频激励信号。
进一步地,对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,权重由解码得到的低频信号的分类参数的值和/或浊音度因子确定。
最终,由预测的高频能量和高频激励信号,或者由预测的高频能量、高频激励信号和预测的LPC合成高频信号。
由此可见,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
针对时域和频域的不同,本发明实施例的频带扩展的方法的具体实现过程会有所区别。以下将参见图3至图5分别描述时域和频域,频域,时域的具体实施例。
如图3所示,在时域和频域进行频带扩展的具体实现过程中。
首先,由解码得到的LPC预测宽带LPC。
然后,利用预测的宽带LPC和解码得到的LPC之间的关系预测高频增益。并且,针对不同的信号类型,计算不同的修正因子修正预测的高频增益,例如利用解码得到的低频信号的分类参数、谱倾斜因子、浊音度因子、噪声门因子对预测的高频增益进行修正。修正的高频增益与最小噪声门因子ng_min成正比,与分类参数的值fmerit成正比,与谱倾斜因子tilt的相反数成正比,与浊音度因子voice_fac成反比。此时,高频增益越大,谱倾斜因子越小;背景噪声越大,噪声门因子越大;语音特性越强,分类参数的值越大。例如:修正的高频增益gain=gain*(1-tilt)*fmerit*(30+ng_min)*(1.6-voice_fac)。这里,由于每帧求出的噪声门因子要和一个给定阈值比较,当每帧求出的噪声门因子比给定阈值小时,最小噪声门因子就等于该每帧求出的噪声门因子,否则,最小噪声门因子就等于该给定阈值。
并且,对不同解码速率或不同类型的信号,自适应选取不同频段的解码得到的低频信号或采用不同的预测算法预测高频激励信号。例如,当解码速率大于给定值时,利用与高频信号相邻的频段的低频激励信号(自适应码书贡献和代数码书贡献的和)作为高频激励信号;否则,通过LSF参数的差值,自适应在低频激励信号中选择编码质量较好(即LSF参数的差值较小)的频段作为高频激励信号。可以理解,不同的解码器可以选取不同的给定值。比如,自适应多速宽带(AMR-WB,Adaptive Multi-Rate Wideband)编解码器支持12.65kbps、15.85kbps、18.25kbps、19.85kbps、23.05和23.85kbps等解码速率,那么amr-wb编解码器可以选19.85kbps作为给定值。
其中,ISF参数(ISF参数是一组数,和LPC系数的阶数一样)是LPC系数的频域表示方式,反映了语音频信号在频域上的能量变化,ISF的取值大体对应了语音频信号从低频到高频的整个频带,每个ISF参数值对应一个相应的频率值。
在本发明的一个实施例中,通过LSF参数的差值,自适应在低频激励信号中选择编码质量较好(即LSF参数的差值较小)的频段作为高频激励信号可以包括:两两计算LSF参数的差值,得到一组LSF参数的差值;查找最小的一个差值,根据最小的差值,确定LSF参数对应的频点,根据此频点,在频域的激励信号中,选择一定频段的频域激励信号作为高频带的激励信号。具体选择方式有很多种,假如此频点为F1,可以从频点F1-F开始,选择需要长度的频段作为高频激励信号,F>=0,具体选择的长度根据要恢复的高频带带宽及信号特点确定。
同时,自适应在低频激励信号中选择编码质量较好的频段时,对音乐或语音信号,选择不同的最低起始选择频点,例如,对语音信号可以从2~6kHz范围内自适应选取;对音乐信号可以从1~6kHz范围内自适应选取。还可以对预测的高频激励信号和随机噪声信号进行加权,得到最终的高频激励信号,其中,加权的权重由低频信号的分类参数的值和/或浊音度因子确定。
exc[n]=α*exc[n]+β*random[n],其中 β=1-α
其中,exc[n]是预测的高频激励信号,random[n]是随机噪声信号,α是预测的高频激励信号的权重,β是随机噪声信号的权重,γ是计算预测的高频激励信号的权重为α时预设的值,fmerit是分类参数的值,voice_fac是浊音度因子。
容易理解,由于信号的分类方法不同,自适应选取不同频段的解码得到的低频信号或采用不同的预测算法预测高频激励信号。例如,可以将信号分为语音信号和音乐信号,其中语音信号还可以进一步分为清音、浊音和过渡音。或者,信号还可以分为瞬态信号和非瞬态信号,等等。
最后,由预测的高频增益、高频激励信号和预测的LPC合成高频信号。用预测的高频增益修正高频激励信号,然后将修正后的高频激励信号通过LPC合成滤波器,得到最终输出的高频信号;或者高频激励信号通过LPC合成滤波器,得到高频信号,然后通过高频增益修正高频信号,得到最终输出的高频信号。因为LPC合成滤波器是线性滤波器,所以合成前的修正与合成后的修正是一样的,即:用高频增益修正合成前的高频激励信号与修正合成后的高频激励信号,其结果是一样的,所以修正不分先后顺序。
这里,合成的过程是将得到频域的高频激励信号转换为时域的高频激励信号,将时域的高频激励信号与时域的高频增益作为合成滤波器的输入,预测的LPC系数作为合成滤波器的系数,从而得到合成的高频信号。
由此可见,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
如图4所示,在频域进行频带扩展的具体实现过程中。
首先,由解码得到的LPC预测高频带LPC。
然后,将需要扩展出的高频信号分成M个子带,预测M个子带的高频包络。例如,在解码得到的低频信号中选取与高频信号相邻的N个频带,计算这N个频带的能量或幅度,根据这N个频带的能量或幅度的大小关系,预测M个子带的高频包络。这里,M和N都是预先设定好的值。例如,将高频信号分成M=2个子带,选取与高频信号相邻的N=2或4个子带。
进一步地,利用解码得到的低频信号的分类参数、基音周期、低频信号本身的高低频之间的能量或幅度的比值、浊音度因子、噪声门因子对预测的高频包络进行修正。这里,可以针对不同的低频信号对其高频和低频进行不同的划分。例如,假如低频信号的带宽为6kHz,那么可以取0~3kHz和3~6kHz分别作为低频信号的低频和高频,也可以取0~4kHz和4~6kHz分别作为低频信号的低频和高频。
修正的高频包络与最小噪声门因子ng_min成正比,与分类参数的值fmerit成正比,与谱倾斜因子tilt的相反数成正比,与浊音度因子voice_fac的成反比。此外,对基音周期pitch稳定的信号,修正的高频包络和基音周期成正比。此时,高频能量越大,谱倾斜因子越小;背景噪声越大,噪声门因子越大;语音特性越强,分类参数的值越大。例如:修正的高频包络gain*=(1-tilt)*fmerit*(30+ng_min)*(1.6-voice_fac)*(pitch/100)。
接着,当解码速率大于等于给定阈值时,选取和高频信号相邻的低频信号的频带预测高频激励信号;或者,当解码速率小于给定阈值时,自适应选取编码质量较好的子带预测高频激励信号。这里,给定阈值可以是经验值。
进一步地,将随机噪声信号对预测的高频激励信号做加权,加权值由低频信号的分类参数确定。随机噪声信号的权重和低频分类参数的大小成正比。
exc[n]=β*exc[n]+α*random[n],其中
其中,exc[n]是预测的高频激励信号,random[n]是随机噪声信号,α是预测的高频激励信号的权重,β是随机噪声信号的权重,γ是计算预测的高频激励信号的权重为α时预设的值,fmerit是分类参数的值。
最后,将预测的高频包络和高频激励信号合成高频信号。
这里,合成的过程可以是直接将频域的高频激励信号与频域的高频包络相乘得到合成的高频信号。
由此可见,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
如图5所示,在时域进行频带扩展的具体实现过程中。
首先,由解码得到的LPC预测宽带LPC。
然后,将需要扩展出的高频信号分成M个子帧,利用预测的宽带LPC和解码得到的LPC之间的关系预测M个子帧的高频增益。
然后,通过当前子帧或当前帧的低频信号或低频激励信号,预测当前子帧的高频增益。
进一步地,利用解码得到的低频信号的分类参数、基音周期、低频信号本身的高低频之间的能量或幅度的比值、浊音度因子、噪声门因子对预测的高频增益进行修正。修正的高频增益与最小噪声门因子ng_min成正比,与分类参数的值fmerit成正比,与谱倾斜因子tilt的相反数成正比,与浊音度因子voice_fac的成反比。此外,对基音周期pitch稳定的信号,修正的高频增益和基音周期成正比。此时,高频能量越大,谱倾斜因子越小;背景噪声越大,噪声门因子越大;语音特性越强,分类参数的值越大。例如:修正的高频增益gain*=(1-tilt)*fmerit*(30+ng_min)*(1.6-voice_fac)*(pitch/100)。
其中,tilt是谱倾斜因子,fmerit是分类参数的值,ng_min是最小噪声门因子,voice_fac是浊音度因子,pitch是基音周期。
接着,当解码速率大于等于给定阈值时,选取与高频信号相邻的解码得到的低频信号的频带预测高频激励信号;或者,当解码速率小于给定阈值时,自适应选取编码质量较好的频带预测高频激励信号。即可以利用与高频信号相邻的频段的低频激励信号(自适应码书贡献和代数码书贡献)作为高频激励信号。
进一步地,将随机噪声信号对预测的高频激励信号做加权,加权值由低频信号的分类参数以及浊音度因子的加权值确定。
最终,由预测的高频增益、高频激励信号和预测的LPC合成高频信号。
这里,合成的过程可以是将时域的高频激励信号与时域的高频增益作为合成滤波器的输入,预测的LPC系数作为合成滤波器的系数,从而得到合成的高频信号。
由此可见,本发明实施例的频带扩展的方法充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
图6至图11示出了根据本发明实施例的频带扩展的装置的结构图。如图6所示,频带扩展的装置60包括获取单元61和扩频单元62。其中,获取单元61,用于获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献。扩频单元62,用于根据所述获取单元61获取的扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
进一步地,如图7所示,扩频单元62包括预测子单元621和合成子单元622。其中,预测子单元621用于根据所述扩频参数,预测高频能量和高频激励信号。合成子单元622用于根据所述高频能量与所述高频激励信号,得到高频信号。具体而言,合成子单元622用于:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。
具体地,所述高频能量包括高频增益,预测子单元621用于根据所述LPC,预测高频增益;根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
或者,所述高频能量包括高频增益,预测子单元621用于根据所述LPC,预测高频增益;根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
或者,所述高频能量包括高频增益,预测子单元621用于根据所述LPC,预测高频增益;根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
或者,所述高频能量包括高频增益,预测子单元621用于根据所述LPC,预测高频增益;根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
或者,所述高频能量包括高频包络,预测子单元621用于根据所述解码得到的低频信号,预测高频包络;根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,其中所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和。
或者,所述高频能量包括高频包络,预测子单元621用于根据所述解码得到的低频信号,预测高频包络;根据所述解码速率和所述解码得到的低频信号,预测高频激励信号。
或者,所述高频能量包括高频包络,预测子单元621用于根据所述解码得到的低频信号,预测高频包络;根据所述解码速率和所述低频激励信号,预测高频激励信号。
此外,所述扩频单元62还包括第一修正子单元623,如图8所示。其中,第一修正子单元623用于在所述根据所述扩频参数,预测高频能量信号和高频激励信号之后,根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,并根据第一修正因子修正所述高频能量,其中所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子。
具体而言,第一修正子单元623用于根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。或者,第一修正子单元具体用于:根据所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。或者,第一修正子单元具体用于:根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
此外,扩频单元62还包括第二修正子单元624,用于根据所述基音周期,修正所述高频能量,如图9所示。
另外,扩频单元62还包括第三修正子单元625,如图10所示,用于根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
具体而言,所述第三修正子单元625用于根据所述扩频参数,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。或者,第三修正子单元625用于根据所述解码得到的低频信号,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。第三修正子单元625用于所述根据所述扩频参数与所述解码得到的低频信号,确定第二修正因子;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
进一步地,扩频单元62还包括加权子单元626,如图11所示,用于对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的低频信号的分类参数值和/或浊音度因子确定。
在本发明的一个实施例中,频带扩展的装置60还可以包括处理器,该处理器用于控制该频带扩展的装置所包括的单元。
由此可见,本发明实施例的频带扩展的装置充分利用从码流直接解码的低频参数、中间解码参数或最终解码的低频信号来预测高频能量;并从低频激励信号自适应预测高频激励信号,使得最终输出的高频信号和原始高频信号更接近,从而提升输出信号的质量。
图12示出了根据本发明实施例的解码器120的结构示意图。其中,该解码器120包括处理器121和存储器122。
其中,处理器121实现根据本发明实施例的频带扩展的方法。即,处理器121用于获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。存储器122用于存储处理器121执行的指令。
应理解,本发明的每个权利要求所叙述的方案也应看做是一个实施例,并且是权利要求中的特征是可以结合的,如本发明中的判断步骤后的执行的不同分支的步骤可以作为不同的实施例。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (34)
1.一种频带扩展的方法,其特征在于,包括:
获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;
根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号,包括:
根据所述扩频参数,预测高频能量和高频激励信号;
根据所述高频能量与所述高频激励信号,得到高频信号。
3.根据权利要求2所述的方法,其特征在于,所述高频能量包括高频增益;
所述根据所述扩频参数,预测高频能量和高频激励信号,包括:
根据所述LPC,预测高频增益;
根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
4.根据权利要求3所述的方法,其特征在于,所述根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号,包括:
根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
5.根据权利要求2所述的方法,其特征在于,所述高频能量包括高频增益;
所述根据所述扩频参数,预测高频能量和高频激励信号,包括:
根据所述LPC,预测高频增益;
根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
6.根据权利要求5所述的方法,其特征在于,所述根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号,包括:
根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
7.根据权利要求2所述的方法,其特征在于,所述高频能量包括高频包络;
所述根据所述扩频参数,预测高频能量和高频激励信号,包括:
根据所述解码得到的低频信号,预测高频包络;
根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,其中所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和。
8.根据权利要求7所述的方法,其特征在于,所述根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,包括:
根据所述解码速率和所述解码得到的低频信号,预测高频激励信号。
9.根据权利要求7所述的方法,其特征在于,所述根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,包括:
根据所述解码速率和所述低频激励信号,预测高频激励信号。
10.根据权利要求2至9中任一项所述的方法,其特征在于,在所述根据所述扩频参数,预测高频能量信号和高频激励信号之后,还包括:
根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子;
根据所述第一修正因子,修正所述高频能量。
11.根据权利要求10所述的方法,其特征在于,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:
根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,确定第一修正因子。
12.根据权利要求10所述的方法,其特征在于,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:
根据所述解码得到的低频信号,确定第一修正因子。
13.根据权利要求10所述的方法,其特征在于,所述根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子,包括:
根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子。
14.根据权利要求10至13中任一项所述的方法,其特征在于,还包括:
根据所述基音周期,修正所述高频能量。
15.根据权利要求10至14中任一项所述的方法,其特征在于,还包括:
根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;
根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
16.根据权利要求10至15中任一项所述的方法,其特征在于,还包括:
对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的低频信号的分类参数值和/或浊音度因子确定。
17.根据权利要求2至16中任一项所述的方法,其特征在于,所述根据所述高频能量与所述高频激励信号,得到高频信号,包括:
合成所述高频能量与所述高频激励信号,得到高频信号;或者
合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。
18.一种频带扩展的装置,其特征在于,包括:
获取单元,用于获取扩频参数,所述扩频参数包括以下参数中的一个或多个:线性预测系数LPC、线谱频率LSF参数、基音周期、解码速率、自适应码书贡献和代数码书贡献;
扩频单元,用于根据所述获取单元获取的扩频参数,对解码得到的低频信号进行频带扩展,以获得高频信号。
19.根据权利要求18所述的装置,其特征在于,所述扩频单元包括:
预测子单元,用于根据所述扩频参数,预测高频能量和高频激励信号;
合成子单元,用于根据所述高频能量与所述高频激励信号,得到高频信号。
20.根据权利要求19所述的装置,其特征在于,所述高频能量包括高频增益;
所述预测子单元具体用于:
根据所述LPC,预测高频增益;
根据所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
21.根据权利要求19所述的装置,其特征在于,所述高频能量包括高频增益;
所述预测子单元具体用于:
根据所述LPC,预测高频增益;
根据所述解码速率、所述LSF参数、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
22.根据权利要求19所述的装置,其特征在于,所述高频能量包括高频增益;
所述预测子单元具体用于:
根据所述LPC,预测高频增益;
根据所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
23.根据权利要求19所述的装置,其特征在于,所述高频能量包括高频增益;所述预测子单元具体用于:
根据所述LPC,预测高频增益;
根据所述解码速率、所述自适应码书贡献和所述代数码书贡献,自适应地预测高频激励信号。
24.根据权利要求19所述的装置,其特征在于,所述高频能量包括高频包络;
所述预测子单元具体用于:
根据所述解码得到的低频信号,预测高频包络;
根据所述解码得到的低频信号或低频激励信号,预测高频激励信号,其中所述低频激励信号是所述自适应码书贡献和所述代数码书贡献的和。
25.根据权利要求24所述的装置,其特征在于,所述预测子单元具体用于:
根据所述解码得到的低频信号,预测高频包络;
根据所述解码速率和所述解码得到的低频信号,预测高频激励信号。
26.根据权利要求24所述的装置,其特征在于,所述预测子单元具体用于:
根据所述解码得到的低频信号,预测高频包络;
根据所述解码速率和所述低频激励信号,预测高频激励信号。
27.根据权利要求19至26中任一项所述的装置,其特征在于,所述扩频单元还包括:第一修正子单元,用于在所述根据所述扩频参数,预测高频能量信号和高频激励信号之后,根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第一修正因子;根据所述第一修正因子,修正所述高频能量;所述第一修正因子包括以下参数中的一个或多个:浊音度因子、噪声门因子、谱倾斜因子。
28.根据权利要求27所述的装置,其特征在于,所述第一修正子单元具体用于:
根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
29.根据权利要求27所述的装置,其特征在于,所述第一修正子单元具体用于:
根据所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
30.根据权利要求27所述的装置,其特征在于,所述第一修正子单元具体用于:
根据所述基音周期、所述自适应码书贡献和所述代数码书贡献,以及所述解码得到的低频信号,确定第一修正因子;根据所述第一修正因子,修正所述高频能量。
31.根据权利要求27至30中任一项所述的装置,其特征在于,所述扩频单元还包括:第二修正子单元,用于根据所述基音周期,修正所述高频能量。
32.根据权利要求27至31中任一项所述的装置,其特征在于,所述扩频单元还包括:第三修正子单元,用于根据所述扩频参数与所述解码得到的低频信号中的至少一个,确定第二修正因子,所述第二修正因子包括分类参数与信号类型中的至少一个;根据所述第二修正因子,修正所述高频能量和所述高频激励信号。
33.根据权利要求27至32中任一项所述的装置,其特征在于,所述扩频单元还包括:加权子单元,用于对预测的高频激励信号和随机噪声信号加权,得到最终的高频激励信号,所述加权的权重由解码得到的低频信号的分类参数值和/或浊音度因子确定。
34.根据权利要求19至33中任一项所述的装置,其特征在于,所述合成子单元具体用于:合成所述高频能量与所述高频激励信号,得到高频信号;或者合成所述高频能量、所述高频激励信号与预测的LPC,得到高频信号,其中所述预测的LPC包括预测的高频带LPC或预测的宽带LPC,所述预测的LPC是基于所述LPC获得。
Priority Applications (16)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810119215.3A CN108172239B (zh) | 2013-09-26 | 2013-09-26 | 频带扩展的方法及装置 |
CN201310444398.3A CN104517610B (zh) | 2013-09-26 | 2013-09-26 | 频带扩展的方法及装置 |
BR112016005850-0A BR112016005850B1 (pt) | 2013-09-26 | 2014-04-15 | método e aparelho de extensão de largura de banda |
EP14848724.2A EP3038105B1 (en) | 2013-09-26 | 2014-04-15 | Method and device for bandwidth extension |
PCT/CN2014/075420 WO2015043161A1 (zh) | 2013-09-26 | 2014-04-15 | 频带扩展的方法及装置 |
KR1020177029371A KR101893454B1 (ko) | 2013-09-26 | 2014-04-15 | 대역폭 확장 방법 및 장치 |
SG11201601691RA SG11201601691RA (en) | 2013-09-26 | 2014-04-15 | Bandwidth extension method and apparatus |
PL19168007.3T PL3611729T3 (pl) | 2013-09-26 | 2014-04-15 | Sposób i urządzenie do rozszerzania przepustowości |
EP19168007.3A EP3611729B1 (en) | 2013-09-26 | 2014-04-15 | Bandwidth extension method and apparatus |
JP2016517362A JP6423420B2 (ja) | 2013-09-26 | 2014-04-15 | 帯域幅拡張方法および装置 |
ES14848724T ES2745289T3 (es) | 2013-09-26 | 2014-04-15 | Procedimiento y dispositivo de extensión de ancho de banda |
ES19168007T ES2924905T3 (es) | 2013-09-26 | 2014-04-15 | Procedimiento y aparato de extensión del ancho de banda |
KR1020167007139A KR101787711B1 (ko) | 2013-09-26 | 2014-04-15 | 대역폭 확장 방법 및 장치 |
HK15106740.3A HK1206140A1 (zh) | 2013-09-26 | 2015-07-15 | 頻帶擴展的方法及裝置 |
US15/068,908 US9666201B2 (en) | 2013-09-26 | 2016-03-14 | Bandwidth extension method and apparatus using high frequency excitation signal and high frequency energy |
US15/481,306 US10186272B2 (en) | 2013-09-26 | 2017-04-06 | Bandwidth extension with line spectral frequency parameters |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310444398.3A CN104517610B (zh) | 2013-09-26 | 2013-09-26 | 频带扩展的方法及装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810119215.3A Division CN108172239B (zh) | 2013-09-26 | 2013-09-26 | 频带扩展的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104517610A true CN104517610A (zh) | 2015-04-15 |
CN104517610B CN104517610B (zh) | 2018-03-06 |
Family
ID=52741937
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310444398.3A Active CN104517610B (zh) | 2013-09-26 | 2013-09-26 | 频带扩展的方法及装置 |
CN201810119215.3A Active CN108172239B (zh) | 2013-09-26 | 2013-09-26 | 频带扩展的方法及装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810119215.3A Active CN108172239B (zh) | 2013-09-26 | 2013-09-26 | 频带扩展的方法及装置 |
Country Status (11)
Country | Link |
---|---|
US (2) | US9666201B2 (zh) |
EP (2) | EP3611729B1 (zh) |
JP (1) | JP6423420B2 (zh) |
KR (2) | KR101893454B1 (zh) |
CN (2) | CN104517610B (zh) |
BR (1) | BR112016005850B1 (zh) |
ES (2) | ES2924905T3 (zh) |
HK (1) | HK1206140A1 (zh) |
PL (1) | PL3611729T3 (zh) |
SG (1) | SG11201601691RA (zh) |
WO (1) | WO2015043161A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105869653A (zh) * | 2016-05-31 | 2016-08-17 | 华为技术有限公司 | 话音信号处理方法和相关装置和系统 |
CN107925388A (zh) * | 2016-02-17 | 2018-04-17 | 弗劳恩霍夫应用研究促进协会 | 用于增强瞬时处理的后置处理器、预处理器、音频编码器、音频解码器及相关方法 |
CN108630212A (zh) * | 2018-04-03 | 2018-10-09 | 湖南商学院 | 非盲带宽扩展中高频激励信号的感知重建方法与装置 |
WO2019213965A1 (zh) * | 2018-05-11 | 2019-11-14 | 华为技术有限公司 | 语音信号的处理方法和移动设备 |
CN110770825A (zh) * | 2017-07-03 | 2020-02-07 | 高通股份有限公司 | 时域通道间预测 |
CN115512709A (zh) * | 2021-06-07 | 2022-12-23 | 炬芯科技股份有限公司 | 一种音频数据的处理方法、对应装置、设备和存储介质 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103426441B (zh) * | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
CN103928029B (zh) | 2013-01-11 | 2017-02-08 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CN104217727B (zh) * | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
CN105761723B (zh) * | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
CN105959974B (zh) * | 2016-06-14 | 2019-11-29 | 深圳市海思半导体有限公司 | 一种预测空口带宽的方法和装置 |
CN110660402B (zh) | 2018-06-29 | 2022-03-29 | 华为技术有限公司 | 立体声信号编码过程中确定加权系数的方法和装置 |
CN109150399B (zh) * | 2018-08-14 | 2021-04-13 | Oppo广东移动通信有限公司 | 数据传输方法、装置、电子设备及计算机可读介质 |
CN113421584B (zh) * | 2021-07-05 | 2023-06-23 | 平安科技(深圳)有限公司 | 音频降噪方法、装置、计算机设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1397064A (zh) * | 2000-01-28 | 2003-02-12 | 艾利森电话股份有限公司 | 修改语音信号的系统和方法 |
CN101304261A (zh) * | 2007-05-12 | 2008-11-12 | 华为技术有限公司 | 一种频带扩展的方法及装置 |
CN102339607A (zh) * | 2010-07-16 | 2012-02-01 | 华为技术有限公司 | 一种频带扩展的方法和装置 |
CN102576542A (zh) * | 2009-10-23 | 2012-07-11 | 高通股份有限公司 | 从窄频带信号确定上频带信号 |
CN102612712A (zh) * | 2009-11-19 | 2012-07-25 | 瑞典爱立信有限公司 | 低频带音频信号的带宽扩展 |
WO2013066238A2 (en) * | 2011-11-02 | 2013-05-10 | Telefonaktiebolaget L M Ericsson (Publ) | Generation of a high band extension of a bandwidth extended audio signal |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
US6199040B1 (en) * | 1998-07-27 | 2001-03-06 | Motorola, Inc. | System and method for communicating a perceptually encoded speech spectrum signal |
US7003454B2 (en) * | 2001-05-16 | 2006-02-21 | Nokia Corporation | Method and system for line spectral frequency vector quantization in speech codec |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
ES2259158T3 (es) * | 2002-09-19 | 2006-09-16 | Matsushita Electric Industrial Co., Ltd. | Metodo y aparato decodificador audio. |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
EP1723639B1 (en) * | 2004-03-12 | 2007-11-14 | Nokia Corporation | Synthesizing a mono audio signal based on an encoded multichannel audio signal |
WO2006025313A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法 |
KR100707174B1 (ko) * | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
ATE485582T1 (de) * | 2005-04-01 | 2010-11-15 | Qualcomm Inc | Verfahren und vorrichtung zur vektorquantisierung einer spektralenvelop-repräsentation |
ES2705589T3 (es) | 2005-04-22 | 2019-03-26 | Qualcomm Inc | Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia |
US7734462B2 (en) * | 2005-09-02 | 2010-06-08 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
US20080300866A1 (en) * | 2006-05-31 | 2008-12-04 | Motorola, Inc. | Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
CN101620854B (zh) * | 2008-06-30 | 2012-04-04 | 华为技术有限公司 | 频带扩展的方法、系统和设备 |
MX2011000370A (es) * | 2008-07-11 | 2011-03-15 | Fraunhofer Ges Forschung | Un aparato y un metodo para decodificar una señal de audio codificada. |
EP2176862B1 (en) * | 2008-07-11 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CN102044250B (zh) | 2009-10-23 | 2012-06-27 | 华为技术有限公司 | 频带扩展方法及装置 |
CA2780971A1 (en) * | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget L M Ericsson (Publ) | Improved excitation signal bandwidth extension |
JP5651980B2 (ja) * | 2010-03-31 | 2015-01-14 | ソニー株式会社 | 復号装置、復号方法、およびプログラム |
US8600737B2 (en) | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
KR20130088756A (ko) * | 2010-06-21 | 2013-08-08 | 파나소닉 주식회사 | 복호 장치, 부호화 장치 및 이러한 방법 |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
US8924200B2 (en) | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN103460286B (zh) * | 2011-02-08 | 2015-07-15 | Lg电子株式会社 | 带宽扩展的方法和设备 |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
WO2013066236A2 (en) * | 2011-11-02 | 2013-05-10 | Telefonaktiebolaget L M Ericsson (Publ) | Audio encoding/decoding based on an efficient representation of auto-regressive coefficients |
EP2774148B1 (en) * | 2011-11-03 | 2014-12-24 | Telefonaktiebolaget LM Ericsson (PUBL) | Bandwidth extension of audio signals |
US8666753B2 (en) * | 2011-12-12 | 2014-03-04 | Motorola Mobility Llc | Apparatus and method for audio encoding |
CN103295578B (zh) * | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN103928031B (zh) * | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
US9601125B2 (en) * | 2013-02-08 | 2017-03-21 | Qualcomm Incorporated | Systems and methods of performing noise modulation and gain adjustment |
US9319510B2 (en) * | 2013-02-15 | 2016-04-19 | Qualcomm Incorporated | Personalized bandwidth extension |
US9666202B2 (en) * | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
CN105761723B (zh) * | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
US9595269B2 (en) * | 2015-01-19 | 2017-03-14 | Qualcomm Incorporated | Scaling for gain shape circuitry |
-
2013
- 2013-09-26 CN CN201310444398.3A patent/CN104517610B/zh active Active
- 2013-09-26 CN CN201810119215.3A patent/CN108172239B/zh active Active
-
2014
- 2014-04-15 ES ES19168007T patent/ES2924905T3/es active Active
- 2014-04-15 WO PCT/CN2014/075420 patent/WO2015043161A1/zh active Application Filing
- 2014-04-15 BR BR112016005850-0A patent/BR112016005850B1/pt active IP Right Grant
- 2014-04-15 SG SG11201601691RA patent/SG11201601691RA/en unknown
- 2014-04-15 ES ES14848724T patent/ES2745289T3/es active Active
- 2014-04-15 JP JP2016517362A patent/JP6423420B2/ja active Active
- 2014-04-15 EP EP19168007.3A patent/EP3611729B1/en active Active
- 2014-04-15 KR KR1020177029371A patent/KR101893454B1/ko active IP Right Grant
- 2014-04-15 KR KR1020167007139A patent/KR101787711B1/ko active IP Right Grant
- 2014-04-15 EP EP14848724.2A patent/EP3038105B1/en active Active
- 2014-04-15 PL PL19168007.3T patent/PL3611729T3/pl unknown
-
2015
- 2015-07-15 HK HK15106740.3A patent/HK1206140A1/zh unknown
-
2016
- 2016-03-14 US US15/068,908 patent/US9666201B2/en active Active
-
2017
- 2017-04-06 US US15/481,306 patent/US10186272B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1397064A (zh) * | 2000-01-28 | 2003-02-12 | 艾利森电话股份有限公司 | 修改语音信号的系统和方法 |
CN101304261A (zh) * | 2007-05-12 | 2008-11-12 | 华为技术有限公司 | 一种频带扩展的方法及装置 |
CN102576542A (zh) * | 2009-10-23 | 2012-07-11 | 高通股份有限公司 | 从窄频带信号确定上频带信号 |
CN102612712A (zh) * | 2009-11-19 | 2012-07-25 | 瑞典爱立信有限公司 | 低频带音频信号的带宽扩展 |
CN102339607A (zh) * | 2010-07-16 | 2012-02-01 | 华为技术有限公司 | 一种频带扩展的方法和装置 |
WO2013066238A2 (en) * | 2011-11-02 | 2013-05-10 | Telefonaktiebolaget L M Ericsson (Publ) | Generation of a high band extension of a bandwidth extended audio signal |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107925388A (zh) * | 2016-02-17 | 2018-04-17 | 弗劳恩霍夫应用研究促进协会 | 用于增强瞬时处理的后置处理器、预处理器、音频编码器、音频解码器及相关方法 |
CN107925388B (zh) * | 2016-02-17 | 2021-11-30 | 弗劳恩霍夫应用研究促进协会 | 后置处理器、预处理器、音频编解码器及相关方法 |
US11094331B2 (en) | 2016-02-17 | 2021-08-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Post-processor, pre-processor, audio encoder, audio decoder and related methods for enhancing transient processing |
WO2017206432A1 (zh) * | 2016-05-31 | 2017-12-07 | 华为技术有限公司 | 话音信号处理方法和相关装置和系统 |
CN105869653A (zh) * | 2016-05-31 | 2016-08-17 | 华为技术有限公司 | 话音信号处理方法和相关装置和系统 |
US10218856B2 (en) | 2016-05-31 | 2019-02-26 | Huawei Technologies Co., Ltd. | Voice signal processing method, related apparatus, and system |
US10885922B2 (en) | 2017-07-03 | 2021-01-05 | Qualcomm Incorporated | Time-domain inter-channel prediction |
CN110770825A (zh) * | 2017-07-03 | 2020-02-07 | 高通股份有限公司 | 时域通道间预测 |
CN108630212A (zh) * | 2018-04-03 | 2018-10-09 | 湖南商学院 | 非盲带宽扩展中高频激励信号的感知重建方法与装置 |
CN108630212B (zh) * | 2018-04-03 | 2021-05-07 | 湖南商学院 | 非盲带宽扩展中高频激励信号的感知重建方法与装置 |
CN112005300A (zh) * | 2018-05-11 | 2020-11-27 | 华为技术有限公司 | 语音信号的处理方法和移动设备 |
WO2019213965A1 (zh) * | 2018-05-11 | 2019-11-14 | 华为技术有限公司 | 语音信号的处理方法和移动设备 |
CN112005300B (zh) * | 2018-05-11 | 2024-04-09 | 华为技术有限公司 | 语音信号的处理方法和移动设备 |
CN115512709A (zh) * | 2021-06-07 | 2022-12-23 | 炬芯科技股份有限公司 | 一种音频数据的处理方法、对应装置、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
KR20160044025A (ko) | 2016-04-22 |
US9666201B2 (en) | 2017-05-30 |
KR101893454B1 (ko) | 2018-08-30 |
CN108172239B (zh) | 2021-01-12 |
EP3038105B1 (en) | 2019-06-26 |
US10186272B2 (en) | 2019-01-22 |
ES2924905T3 (es) | 2022-10-11 |
PL3611729T3 (pl) | 2022-09-12 |
WO2015043161A1 (zh) | 2015-04-02 |
HK1206140A1 (zh) | 2015-12-31 |
EP3038105A4 (en) | 2016-08-31 |
SG11201601691RA (en) | 2016-04-28 |
US20170213564A1 (en) | 2017-07-27 |
ES2745289T3 (es) | 2020-02-28 |
US20160196829A1 (en) | 2016-07-07 |
KR20170117621A (ko) | 2017-10-23 |
BR112016005850B1 (pt) | 2020-12-08 |
EP3611729B1 (en) | 2022-06-08 |
KR101787711B1 (ko) | 2017-11-15 |
CN108172239A (zh) | 2018-06-15 |
CN104517610B (zh) | 2018-03-06 |
JP6423420B2 (ja) | 2018-11-14 |
JP2016537662A (ja) | 2016-12-01 |
EP3611729A1 (en) | 2020-02-19 |
EP3038105A1 (en) | 2016-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104517610A (zh) | 频带扩展的方法及装置 | |
CN103151048B (zh) | 用于对无效帧进行宽带编码和解码的系统、方法和设备 | |
CN101496101B (zh) | 用于增益因子限制的系统、方法及设备 | |
CN102934163B (zh) | 用于宽带语音编码的系统、方法、设备 | |
EP3152755B1 (en) | Improving classification between time-domain coding and frequency domain coding | |
KR102626854B1 (ko) | 패킷 손실 은닉방법 및 장치와 이를 적용한 복호화방법 및 장치 | |
JP6470857B2 (ja) | 音声処理のための無声/有声判定 | |
EP2741288A2 (en) | Systems, methods, and apparatus for wideband encoding and decoding of active frames | |
US10141001B2 (en) | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding | |
CN103493129B (zh) | 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法 | |
KR102138320B1 (ko) | 통신 시스템에서 신호 코덱 장치 및 방법 | |
JP3353852B2 (ja) | 音声の符号化方法 | |
KR20220084294A (ko) | 생성 모델을 사용한 오디오 신호의 파형 코딩 방법 및 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1206140 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |