CN105976830A - 音频信号编码和解码方法、音频信号编码和解码装置 - Google Patents
音频信号编码和解码方法、音频信号编码和解码装置 Download PDFInfo
- Publication number
- CN105976830A CN105976830A CN201610581304.0A CN201610581304A CN105976830A CN 105976830 A CN105976830 A CN 105976830A CN 201610581304 A CN201610581304 A CN 201610581304A CN 105976830 A CN105976830 A CN 105976830A
- Authority
- CN
- China
- Prior art keywords
- signal
- preemphasis
- voiced sound
- factor
- sound degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 230000005236 sound signal Effects 0.000 title claims abstract description 57
- 230000005284 excitation Effects 0.000 claims abstract description 106
- 238000005086 pumping Methods 0.000 claims description 125
- 230000015572 biosynthetic process Effects 0.000 claims description 97
- 238000003786 synthesis reaction Methods 0.000 claims description 97
- 230000001737 promoting effect Effects 0.000 claims description 11
- 230000008901 benefit Effects 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims 6
- 238000004891 communication Methods 0.000 abstract description 10
- 230000000694 effects Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 239000002131 composite material Substances 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 241000208340 Araliaceae Species 0.000 description 5
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 5
- 235000003140 Panax quinquefolius Nutrition 0.000 description 5
- 235000008434 ginseng Nutrition 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000003313 weakening effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Spectroscopy & Molecular Physics (AREA)
Abstract
本发明实施例提供了一种音频信号编码和解码方法、音频信号编码和解码装置、发射机、接收机和通信系统,其能够提高编码和/或解码性能。该音频信号编码方法包括:将待编码的时域信号划分为低频带信号和高频带信号;对低频带信号进行编码而获得低频编码参数;根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示所述高频带信号表现为浊音特性的程度;利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;基于所述合成激励信号和所述高频带信号来获得高频编码参数。在本发明的各个实施例的技术方案,可以提高编码或解码效果。
Description
技术领域
本发明实施例涉及领域通信技术领域,并且更具体地,涉及一种音频信号编码方法、音频信号解码方法、音频信号编码装置、音频信号解码装置、发射机、接收机和通信系统。
背景技术
随着通信技术的不断进步,用户对话音质量的需求越来越高。通常,通过提高话音质量的带宽来提高话音质量。如果采用传统的编码方式来对带宽已增加的信息进行编码,则会大大提高码率,并因此拘囿于当前网络带宽的限制条件而难以实现。因此,要在码率不变或者码率变化不大的情况下对带宽更宽的信号进行编码,针对这个课题提出的解决方案就是采用频带扩展技术。所述频带扩展技术可以在时域或者频域完成,本发明是在时域完成频带扩展。
在时域进行频带扩展的基本原理为对低频带信号和高频带信号采取两种不同的处理方法完成。对于原始信号中的低频带信号,在编码端中根据需要利用各种编码器进行编码;在解码端中利用与编码端的编码器对应的解码器来解码并恢复低频带信号。对于高频带信号,在编码端中,利用用于低频带信号的编码器获得的低频编码参数来预测高频带激励信号,并对原始信号的高频带信号进行例如线性预测编码(LPC,linear PrencdictiveCoding)分析得到高频带LPC系数,所述高频带激励信号通过根据LPC系数确定的合成滤波器而得到预测的高频带信号,然后比较预测的高频带信号和原始信号中的高频带信号而获得高频带增益调整参数,所述高频带增益参数、LPC系数被传送到解码端来恢复高频带信号;在解码端,利用在低频带信号的解码时提取的低频编码参数来恢复所述高频带激励信号,利用LPC系数生成合成滤波器,所述高频带激励信号通过合成滤波器恢复所预测的高频带信号,其经过高频带增益调整参数调整而获得最终的高频带信号,合并高频带信号和低频带信号得到最终的输出信号。
上述的在时域进行频带扩展的技术中,在一定速率条件下恢复出了高频带信号,但是性能指标还不够完善。通过对比恢复的输出信号的频谱与原始信号的频谱可以看出,对于一般周期的浊音而言在恢复的高频带信号中经常有太强的谐波成分,然而真实的语音信号中的高频带信号的谐波性却没那么强,该差异导致所恢复的信号听起来有明显的机械声。
本发明实施例旨在改进上述的在时域进行频带扩展的技术,以减小甚或消除所恢复的信号中的机械声。
发明内容
本发明实施例提供一种音频信号编码方法、音频信号解码方法、音频信号编码装置、音频信号解码装置、发射机、接收机和通信系统,其能够减小甚或消除所恢复的信号中的机械声,从而提高编码和解码性能。
第一方面,提供了音频信号编码方法,包括:将待编码的时域信号划分为低频带信号和高频带信号;对低频带信号进行编码而获得低频编码参数;根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示所述高频带信号表现为浊音特性的程度;利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;基于所述合成激励信号和所述高频带信号来获得高频编码参数。
结合第一方面,在第一方面的一种实现方式中,所述利用浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号可包括:利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。
结合第一方面及其上述实现方式,在第一方面的另一实现方式中,所述去加重因子可基于所述预加重因子以及所述预加重噪声在所述预加重激励信号中的比例来确定。
结合第一方面及其上述实现方式,在第一方面的另一实现方式中,所述低频编码参数可包括基音周期,所述利用浊音度因子对所预测的高频带激励信号和随机噪声进行加权而获得合成激励信号可包括:利用所述基音周期来修正所述浊音度因子;利用修正后的浊音度因子来对所述高频带激励信号和随机噪声进行加权而获得合成激励信号。
结合第一方面及其上述实现方式,在第一方面的另一实现方式中,所述低频编码参数可包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期,所述根据低频编码参数来预测高频带激励信号可包括:利用所述基音周期来修正所述浊音度因子;利用修正后的浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而预测到所述高频带激励信号。
结合第一方面及其上述实现方式,在第一方面的另一实现方式中,所述利用所述基音周期来修正所述浊音度因子可根据下面的公式来进行:
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。
结合第一方面及其上述实现方式,在第一方面的另一实现方式中,所述音频信号编码方法还可包括:根据所述低频编码参数和高频编码参数来生成编码比特流,以发送给解码端。
第二方面,提供了一种音频信号解码方法,包括:从已编码信息中区分出低频编码参数和高频编码参数;对所述低频编码参数进行解码而获得低频带信号;根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;基于所述合成激励信号和高频编码参数来获得高频带信号;合并所述低频带信号和所述高频带信号而得到最终的解码信号。
结合第二方面,在第二方面的一种实现方式中,所述利用浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号可包括:利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。
结合第二方面及其上述实现方式,在第二方面的另一实现方式中,所述去加重因子可基于所述预加重因子以及所述预加重噪声在所述预加重激励信号中的比例来确定。
结合第二方面及其上述实现方式,在第二方面的另一实现方式中,所述低频编码参数可包括基音周期,所述利用浊音度因子对所预测的高频带激励信号和随机噪声进行加权而获得合成激励信号可包括:利用所述基音周期来修正所述浊音度因子;利用修正后的浊音度因子来对所述高频带激励信号和随机噪声进行加权而获得合成激励信号。
结合第二方面及其上述实现方式,在第二方面的另一实现方式中,所述低频编码参数可包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期,所述根据低频编码参数来预测高频带激励信号可包括:利用所述基音周期来修正所述浊音度因子;利用修正后的浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而预测到所述高频带激励信号。
结合第二方面及其上述实现方式,在第二方面的另一实现方式中,所述利用所述基音周期来修正所述浊音度因子是根据下面的公式来进行的:
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。
第三方面,提供了一种音频信号编码装置,包括:划分单元,用于将待编码的时域信号划分为低频带信号和高频带信号;低频编码单元,用于对低频带信号进行编码而获得低频编码参数;计算单元,用于根据低频编码参数来计算浊音度因子,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;预测单元,用于根据低频编码参数来预测高频带激励信号;合成单元,用于利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;高频编码单元,用于基于所述合成激励信号和所述高频带信号来获得高频编码参数。
结合第三方面,在第三方面的一种实现方式中,所述合成单元可包括:预加重部件,用于利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;加权部件,用于利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;去加重部件,用于利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。
结合第三方面及其上述实现方式,在第三方面的另一实现方式中,所述去加重因子是基于所述预加重因子以及所述预加重噪声在所述预加重激励信号中的比例来确定的。
结合第三方面及其上述实现方式,在第三方面的另一实现方式中,所述低频编码参数可包括基音周期,所述合成单元可包括:第一修正部件,用于利用所述基音周期来修正所述浊音度因子;加权部件,用于利用修正后的浊音度因子来对所述高频带激励信号和随机噪声进行加权而获得合成激励信号。
结合第三方面及其上述实现方式,在第三方面的另一实现方式中,所述低频编码参数可包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期,所述预测单元可包括:第二修正部件,用于利用所述基音周期来修正所述浊音度因子;预测部件,用于利用修正后的浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而预测到所述高频带激励信号。
结合第三方面及其上述实现方式,在第三方面的另一实现方式中,所述第一修正部件和第二修正部件中的至少一个可根据下面的公式来修正所述浊音度因子:
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。
结合第三方面及其上述实现方式,在第三方面的另一实现方式中,所述音频信号编码装置还可包括:比特流生成单元,用于根据所述低频编码参数和高频编码参数来生成编码比特流,以发送给解码端。
第四方面,提供了一种音频信号解码装置,包括:区分单元,用于从已编码信息中区分出低频编码参数和高频编码参数;低频解码单元,用于对所述低频编码参数进行解码而获得低频带信号;计算单元,用于根据低频编码参数来计算浊音度因子,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;预测单元,用于根据低频编码参数来预测高频带激励信号;合成单元,用于利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;高频解码单元,用于基于所述合成激励信号和高频编码参数来获得高频带信号;合并单元,用于合并所述低频带信号和所述高频带信号而得到最终的解码信号。
结合第四方面,在第四方面的一种实现方式中,所述合成单元可包括:预加重部件,用于利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;加权部件,用于利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;去加重部件,用于利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。
结合第四方面及其上述实现方式,在第四方面的另一实现方式中,所述去加重因子是基于所述预加重因子以及所述预加重噪声在所述预加重激励信号中的比例来确定的。
结合第四方面及其上述实现方式,在第四方面的另一实现方式中,所述低频编码参数可包括基音周期,所述合成单元可包括:第一修正部件,用于利用所述基音周期来修正所述浊音度因子;加权部件,用于利用修正后的浊音度因子来对所述高频带激励信号和随机噪声进行加权而获得合成激励信号。
结合第四方面及其上述实现方式,在第四方面的另一实现方式中,所述低频编码参数可包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期,所述预测单元可包括:第二修正部件,用于利用所述基音周期来修正所述浊音度因子;预测部件,用于利用修正后的浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而预测到所述高频带激励信号。
结合第四方面及其上述实现方式,在第四方面的另一实现方式中,所述第一修正部件和第二修正部件中的至少一个可根据下面的公式来修正所述浊音度因子:
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。
第五方面,提供了一种发射机,包括:如第三方面所述的音频信号编码装置;发射单元,用于为所述音频信号编码装置产生的高频编码参数和低频编码参数分配比特以生成比特流,并发射该比特流。
第六方面,提供了一种接收机,包括:接收单元,用于接收比特流,并从所述比特流中提取已编码信息;如第四方面所述的音频信号解码装置。
第七方面,提供了一种通信系统,包括第五方面所述的发射机或如第六方面所述的接收机。
在本发明实施例的上述技术方案中,在编码和解码时,通过利用浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号,可以基于浊音信号更准确地表征高频信号的特性,从而提高编码和解码效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是示意性图示了根据本发明实施例的音频信号编码方法的流程图;
图2是示意性图示了根据本发明实施例的音频信号解码方法的流程图;
图3是示意性图示了根据本发明实施例的音频信号编码装置的框图;
图4是示意性图示了根据本发明实施例的音频信号编码装置中的预测单元和合成单元的框图;
图5是示意性图示了根据本发明实施例的音频信号解码装置的框图;
图6是示意性图示了根据本发明实施例的发射机的框图;
图7是示意性图示了根据本发明实施例的接收机的框图;
图8是本发明另一实施例的装置的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在数字信号处理领域中,音频编解码器被广泛应用于各种电子设备中,例如:移动电话、无线装置、个人数据助理(PDA)、手持式或便携式计算机、GPS接收机/导航器、照相机、音频/视频播放器、摄像机、录像机、监控设备等。通常,这类电子设备中包括音频编码器或音频解码器以实现对音频信号的编解码,音频编码器或者解码器可以直接由数字电路或芯片例如DSP(digital signal processor)实现,或者由软件代码驱动处理器执行软件代码中的流程而实现。
此外,音频编解码器和编解码方法还可以应用于各种通信系统,例如:GSM,码分多址(CDMA,Code Division Multiple Access)系统,宽带码分多址(WCDMA,Wideband CodeDivision Multiple Access Wireless),通用分组无线业务(GPRS,General Packet RadioService),长期演进(LTE,Long Term Evolution)等。
图1是示意性图示了根据本发明实施例的音频信号编码方法的流程图。该音频信号编码方法包括:将待编码的时域信号划分为低频带信号和高频带信号(110);对低频带信号进行编码而获得低频编码参数(120);根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示所述高频带信号表现为浊音特性的程度(130);利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号(140);基于所述合成激励信号和所述高频带信号来获得高频编码参数(150)。
在110中,将待编码的时域信号划分为低频带信号和高频带信号。该划分是为了能够将所述时域信号分为两路进行处理,从而分开地处理所述低频带信号和高频带信号。可以采用现有的或将来出现的任何划分技术来实现该划分。这里的低频带和高频带的含义是相对的,例如可以设定一频率阈值,则低于该频率阈值的频率为低频带,高于该频率阈值的频率为高频带。在实践中,可以根据需要设定所述频率阈值,也可以采取其它方式来区分出信号中的低频带信号成分和高频带信号成分,从而实现划分。
在120中,对低频带信号进行编码而获得低频编码参数。通过所述编码,将低频带信号处理为低频编码参数,从而使得解码端根据所述低频编码参数来恢复所述低频带信号。所述低频编码参数是解码端恢复所述低频带信号所需要的参数。作为示例,可以采用使用代数码本线性预测(ACELP,Algebraic Code Excited Linear Prediction)算法的编码器(ACELP编码器)来进行编码,此时获得的低频编码参数例如可包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期等,并且还可以包括其它参数。所述低频编码参数可被传送到解码端以用于恢复低频带信号。此外,在从编码端向解码端传送代数码书、自适应码书时,可以仅传送代数码书索引和自适应码书索引,解码端根据代数码书索引和自适应码书索引得到对应的代数码书和自适应码书,从而实现恢复。
在实践中,可以根据需要采取合适的编码技术来对所述低频带信号进行编码;当编码技术改变时,所述低频编码参数的组成也会改变。在本发明的实施例中,以使用ACELP算法的编码技术为例进行说明。
在130中,根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示所述高频带信号表现为浊音特性的程度。因此,该130用于从所述低频编码参数获得所述浊音度因子和高频带激励信号,所述浊音度因子和高频带激励信号用于表示高频带信号的不同特性,即通过该130获得了输入的信号的高频特性,从而用于高频带信号的编码。下面以使用ACELP算法的编码技术为例,说明浊音度因子和高频带激励信号的计算。
浊音度因子voice_fac可根据下面的公式(1)来计算:
其中,eneradp为自适应码书的能量,enercd为代数码书的能量,a、b、c为预先设定的值。根据如下原则来设定所述参数a、b、c:使得voice_fac的值大小处于0到1之间;以及将线性变化的voice_factor变成非线性变化的voice_fac,从而更好地体现了浊音度因子voice_fac的特性。
此外,为了使所述浊音度因子voice_fac更好地体现高频带信号的特性,还可以利用低频编码参数中的基音周期来修正所述浊音度因子。作为示例,可根据据下面的公式(2)进一步修改公式(1)中的所述浊音度因子voice_fac:
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。作为示例,公式(2)中的各个参数可以取值如下:a1=0.0126,b1=1.23,a2=0.0087,b2=0,threshold_min=57.75,threshold_max=115.5,所述参数取值仅仅是示意性的,可以根据需要设置其它的值。相对于没有修正的浊音度因子,修正后的浊音度因子能够更准确地表示高频带信号表现为浊音特性的程度,从而有利于削弱一般周期的浊音信号扩展之后引入的机械声。
高频带激励信号Ex可根据下面的公式(3)或公式(4)来计算:
Ex=(FixCB+(1-voice_fac)*seed)*gc+AdpCB*ga 公式(3)
Ex=(voice_fac*FixCB+(1-voice_fac)*seed)*gc+AdpCB*ga 公式(4)
其中,所述FixCB为代数码书,所述seed为随机噪声,所述gc为代数码书增益,所述AdpCB为自适应码书,所述ga为自适应码书增益。可以看出,在所述公式(3)或(4)中,利用浊音度因子来对所述代数码书FixCB和随机噪声seed进行加权而得到加权结果,将所述加权结果与代数码书增益gc的乘积加上所述自适应码书AdpCB与自适应码书增益ga的乘积而得到所述高频带激励信号Ex。替换地,在所述公式(3)或(4)中,可以将所述浊音度因子voice_fac替换为公式(2)中的修正后的浊音度因子voice_fac_A,以更准确地表示高频带信号表现为浊音特性的程度,即更逼真地表示语音信号中的高频带信号,从而提高编码效果。
要注意,上述的计算浊音度因子和高频带激励信号的方式仅仅是示意性的,而不用于限制本发明实施例。在不使用ACELP算法的其它编码技术中,还可以采用其它的方式来计算所述浊音度因子和高频带激励信号。
在140中,利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号。如前所述,在现有技术中,对一般周期的浊音信号而言,由于根据低频带编码参数预测的高频带激励信号的周期性太强,导致所述恢复的音频信号听起来机械声强。通过该140,对于根据低频带信号预测的高频带激励信号,用浊音度因子将其与噪声进行加权,可以减弱根据低频带编码参数预测的高频带激励信号的周期性,从而削弱所恢复的音频信号中的机械声。
可以根据需要采取合适的权重来实现所述加权。作为示例,可以根据下面的公式(5)来获得合成激励信号SEx:
其中,Ex是所述高频带激励信号,seed是随机噪声,voice_fac是所述浊音度因子,pow1是高频带激励信号的能量,pow2是所述随机噪声的能量。替换地,在该公式(5),可以将所述浊音度因子voice_fac替换为公式(2)中的修正后的浊音度因子voice_fac_A,以更准确地表示语音信号中的高频带信号,从而提高编码效果。在公式(2)中的a1=0.0126、b1=1.23、a2=0.0087、b2=0、threshold_min=57.75、threshold_max=115.5的情况中,如果根据所述公式(5)来获得合成激励信号SEx,则基音周期T0大于阈值threshold_max及小于阈值threshold_min的高频带激励信号有较大的权重,其它的高频带激励信号有较小的权重。要注意,根据需要,还可以采用除了公式(5)之外的其它方式来计算所述合成激励信号。
此外,在利用浊音度因子对所述高频带激励信号和随机噪声进行加权时,还可以预先对所述随机噪声进行预加重,并在加权之后进行去加重。具体地,所述140可包括:利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。对于一般浊音,噪声成分通常是从低频到高频越来越强。基于此,对所述随机噪声进行预加重操作,以准确地表示浊音中的噪声信号特征,即抬高噪声中的高频部分,并降低其中的低频部分。作为预加重操作的示例,可以采用下面的公式(6)来对随机噪声seed(n)进行预加重操作:
seed(n)=seed(n)-αseed(n-1) 公式(6)
其中,n=1、2、……N,α为预加重因子并且0<α<1。可以基于随机噪声的特性适当地设置该预加重因子,以准确地表示浊音中的噪声信号特征。在以所述公式(6)进行预加重操作的情况下,可以利用如下的公式(7)对预加重激励信号S(i)进行去加重操作:
S(n)=S(n)+βS(n-1) 公式(7)
其中,n=1、2、……N,β为预设的去加重因子。要注意,上述的公式(6)所示的预加重操作仅仅是示意性的,在实践中可以采用其它的方式进行预加重;并且,当所采用的预加重操作变化时,去加重操作也要对应地改变。所述去加重因子β可基于所述预加重因子α以及所述预加重噪声在所述预加重激励信号中的比例确定。作为示例,在根据公式(5)来利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权时(此时所得到的是预加重激励信号,该预加重激励信号被去加重之后才得到合成激励信号),所述去加重因子β可根据如下的公式(8)或公式(9)来确定:
在150中,基于所述合成激励信号和所述高频带信号来获得高频编码参数。作为示例,高频编码参数包括高频带增益参数、高频带LPC系数,可以对原始信号中的高频带信号进行LPC分析得到高频带LPC系数,所述高频带激励信号通过根据LPC系数确定的合成滤波器而得到预测的高频带信号,然后比较预测的高频带信号和原始信号中的高频带信号而获得高频带增益调整参数,所述高频带增益参数、LPC系数被传送到解码端来恢复高频带信号。此外,还可以现有的或将来出现的各种技术来获得所述高频编码参数,具体的基于所述合成激励信号和所述高频带信号来获得高频编码参数的方式不构成对本发明的限制。在获得低频编码参数和高频编码参数之后,实现了信号的编码,从而能够传送到解码端进行恢复。
在获得低频编码参数和高频编码参数之后,所述音频信号编码方法100还可包括:根据所述低频编码参数和高频编码参数来生成编码比特流,以发送给解码端。
在本发明实施例的上述音频信号编码方法中,通过利用浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号,可以基于浊音信号更准确地表征高频信号的特性,从而提高编码效果。
图2是示意性图示了根据本发明实施例的音频信号解码方法200的流程图。该音频信号解码方法包括:从已编码信息中区分出低频编码参数和高频编码参数(210);对所述低频编码参数进行解码而获得低频带信号(220);根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示高频带信号表现为浊音特性的程度(230);利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号(240);基于所述合成激励信号和高频编码参数来获得高频带信号(250);合并所述低频带信号和所述高频带信号而得到最终的解码信号(260)。
在210中,从已编码信息中区分出低频编码参数和高频编码参数。所述低频编码参数和高频编码参数是从编码端传送来的用于恢复低频信号和高频信号的参数。所述低频编码参数例如可以包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期等以及其它参数,所述高频编码参数例如可以包括LPC系数、高频带增益参数等、以及其它参数。此外,根据编码技术的不同,所述低频编码参数和高频编码参数可以替换地包括其它的参数。
在220中,对所述低频编码参数进行解码而获得低频带信号。具体的解码方式与编码端的编码方式对应。作为示例,在编码端采用使用ACELP算法的ACELP编码器来进行编码时,在220中采用ACELP解码器来获得低频带信号。
在230中,根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示高频带信号表现为浊音特性的程度。该230用于根据低频编码参数获得了被编码信号的高频特性,从而用于高频带信号的解码(或恢复)。下面以与使用ACELP算法的编码技术对应的解码技术为例进行说明。
浊音度因子voice_fac可根据前述的公式(1)来计算,并且为了更好地体现高频带信号的特性,可以如上面的公式(2)所示、利用低频编码参数中的基音周期来修正所述浊音度因子voice_fac,并获得修正后的浊音度因子voice_fac_A。相对于没有修正的浊音度因子浊音度因子voice_fac,修正后的浊音度因子voice_fac_A能够更准确地表示高频带信号表现为浊音特性的程度,从而有利于削弱一般周期的浊音信号扩展之后引入的机械声。
高频带激励信号Ex可根据前述的公式(3)或公式(4)来计算。也就是说,利用浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而得到所述高频带激励信号Ex。类似地,可以将所述浊音度因子voice_fac替换为公式(2)中的修正后的浊音度因子voice_fac_A,以进一步提高解码效果。
上述的计算浊音度因子和高频带激励信号的方式仅仅是示意性的,而不用于限制本发明实施例。在不使用ACELP算法的其它编码技术中,还可以采用其它的方式来计算所述浊音度因子和高频带激励信号。
关于该230的描述,可以参见前面结合图1的130进行的描述。
在240中,利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号。通过该240,对于根据低频带编码参数预测的高频带激励信号,用浊音度因子将其与噪声进行加权,可以减弱根据低频带编码参数预测的高频带激励信号的周期性,从而削弱所恢复的音频信号中的机械声。
作为示例,在该240中,可以根据上面的公式(5)来获得合成激励信号Sex,并且可以将公式(5)中浊音度因子voice_fac替换为公式(2)中的修正后的浊音度因子voice_fac_A,以更准确地表示语音信号中的高频带信号,从而提高编码效果。根据需要,还可以采用其它的方式来计算所述合成激励信号。
此外,在利用浊音度因子voice_fac(或者修正后的浊音度因子voice_fac_A)对所述高频带激励信号和随机噪声进行加权时,还可以预先对所述随机噪声进行预加重,并在加权之后进行去加重。具体地,所述240可包括:利用预加重因子α对所述随机噪声进行用于提升其高频部分的预加重操作(例如通过公式(6)实现该预加重操作)而获得预加重噪声;利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;利用去加重因子β对所述预加重激励信号进行用于压低其高频部分的去加重操作(例如通过公式(7)实现该去加重操作)而获得所述合成激励信号。所述预加重因子α可以根据需要预先设定,以准确地表示浊音中的噪声信号特征,即噪声中的高频部分信号大、低频部分信号小。此外,还可以采用其它类型的噪声,此时预加重因子α要相应改变以表现一般浊音中的噪声特性。所述去加重因子β可基于所述预加重因子α以及所述预加重噪声在所述预加重激励信号中的比例确定。作为示例所述去加重因子β可根据前面的公式(8)或公式(9)来确定。
关于该240的描述,可以参见前面结合图1的140进行的描述。
在250中,基于所述合成激励信号和高频编码参数来获得高频带信号。与编码端中基于合成激励信号和高频带信号来获得高频编码参数的过程相反地,来实现该250。作为示例,高频编码参数包括高频带增益参数、高频带LPC系数,可以利用高频编码参数中的LPC系数生成合成滤波器,将240中获得的合成激励信号通过合成滤波器而恢复所预测的高频带信号,其经过高频编码参数中的高频带增益调整参数调整而获得最终的高频带信号。此外,还可以现有的或将来出现的各种技术来实现该240,具体的基于所述合成激励信号和高频编码参数来获得高频带信号的方式不构成对本发明的限制。
在260中,合并所述低频带信号和所述高频带信号而得到最终的解码信号。该合并方式与图1中的110中的划分方式对应,从而实现解码而得到最终的输出信号。
在本发明实施例的上述音频信号解码方法中,通过利用浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号,可以基于浊音信号更准确地表征高频信号的特性,从而提高解码效果。
图3是示意性图示了根据本发明实施例的音频信号编码装置300的框图。该音频信号编码装置300包括:划分单元310,用于将待编码的时域信号划分为低频带信号和高频带信号;低频编码单元320,用于对低频带信号进行编码而获得低频编码参数;计算单元330,用于根据低频编码参数来计算浊音度因子,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;预测单元340,用于根据低频编码参数来预测高频带激励信号;合成单元350,用于利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;高频编码单元360,用于基于所述合成激励信号和所述高频带信号来获得高频编码参数。
所述划分单元310在接收输入的时域信号之后,可以采用现有的或将来出现的任何划分技术来实现该划分。所述低频带和高频带的含义是相对的,例如可以设定一频率阈值,则低于该频率阈值的频率为低频带,高于该频率阈值的频率为高频带。在实践中,可以根据需要设定所述频率阈值,也可以采取其它方式来区分出信号中的低频带信号成分和高频带信号成分,从而实现划分。
所述低频编码单元320例如可以采用使用ACELP算法的ACELP编码器来进行编码,此时获得的低频编码参数例如可包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期等,并且还可以包括其它参数。在实践中,可以根据需要采取合适的编码技术来对所述低频带信号进行编码;当编码技术改变时,所述低频编码参数的组成也会改变。所获得的低频编码参数是恢复所述低频带信号所需要的参数,其被传送到解码器进行低频带信号恢复。
所述计算单元330根据低频编码参数来计算用于表示被编码信号的高频特性的参数,即浊音度因子。具体地,计算单元330根据通过低频编码单元320获得的低频编码参数来计算浊音度因子voice_fac,其例如可根据前述的公式(1)来计算该浊音度因子voice_fac。然后,所述浊音度因子被用于获得合成激励信号,该合成激励信号被传送到所述高频编码单元360以用于高频带信号的编码。图4是示意性图示了根据本发明实施例的音频信号编码装置中的预测单元340和合成单元350的框图。
预测单元340可仅仅包括图4中的预测部件460,或者可以包括图4中的第二修正部件450和预测部件460二者。
为了更好地体现高频带信号的特性从而削弱一般周期的浊音信号扩展之后引入的机械声,第二修正部件450例如根据上面的公式(2)所示、利用低频编码参数中的基音周期T0来修正所述浊音度因子voice_fac,并获得修正后的浊音度因子voice_fac_A2。
预测部件460例如根据前述的公式(3)或公式(4)来计算高频带激励信号Ex,即利用修正后的浊音度因子voice_fac_A2来对低频编码参数中的代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而得到所述高频带激励信号Ex。所述预测部件460也可以利用通过计算单元330计算的浊音度因子voice_fac来对低频编码参数中的代数码书和随机噪声进行加权而得到加权结果,此时则可以省略第二修正部件450。要注意,该预测部件460还可以采用其它的方式来计算所述高频带激励信号Ex。
作为示例,所述合成单元350可包括图4中的预加重部件410、加权部件420、和去加重部件430;或者可包括图4中的第一修正部件440和加权部件420,或者还可以包括图4中的预加重部件410、加权部件420、去加重部件430和第一修正部件440。
所述预加重部件410,例如通过公式(6),利用预加重因子α对随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声PEnoise。该随机噪声可以与输入到预测部件460的随机噪声相同。所述预加重因子α可以根据需要预先设定,以准确地表示浊音中的噪声信号特征,即噪声中的高频部分信号大、低频部分信号小。当采用其它类型的噪声时,预加重因子α要相应改变以表现一般浊音中的噪声特性。
加权部件420用于利用修正后的浊音度因子voice_fac_A1对来自预测部件460的高频带激励信号Ex和来自预加重部件410的预加重噪声PEnoise进行加权而生成预加重激励信号PEEx。作为示例,该加权部件420可以根据上面的公式(5)来获得预加重激励信号PEEx(用修正后的浊音度因子voice_fac_A1替换其中的浊音度因子voice_fac),还可以采用其它的方式来计算所述预加重激励信号。所述修正后的浊音度因子voice_fac_A1是通过所述第一修正部件440来产生的,所述第一修正部件440利用所述基音周期来修正所述浊音度因子而得到所述修正后的浊音度因子voice_fac_A1。所述第一修正部件440所进行的修正操作可以与所述第二修正部件450相同,也可以不同于所述第二修正部件450的修正操作。也就是说,该第一修正部件440可以采用除了上述的公式(2)之外的其它公式来基于基音周期修正浊音度因子voice_fac。
去加重部件430,例如通过公式(7),利用去加重因子β对来自加权部件420的预加重激励信号PEEx进行用于压低其高频部分的去加重操作而获得所述合成激励信号SEx。所述去加重因子β可基于所述预加重因子α以及所述预加重噪声在所述预加重激励信号中的比例确定。作为示例所述去加重因子β可根据前面的公式(8)或公式(9)来确定。
如前所述,代替修正后的浊音度因子voice_fac_A1或voice_fac_A2,可以将从计算单元330输出的浊音度因子voice_fac提供给加权部件420和预测部件460之一或二者。此外,还可以删除所述预加重部件410和去加重部件430,加权部分420利用修正后的浊音度因子(或浊音度因子voice_fac)来对所述高频带激励信号Ex和随机噪声进行加权而获得合成激励信号。
关于所述预测单元340或合成单元350的描述,可以参见前面结合图1的130和140进行的描述。
所述高频编码单元360基于所述合成激励信号SEx和来自划分单元310的高频带信号来获得高频编码参数。作为示例,所述高频编码单元360对高频带信号进行LPC分析得到高频带LPC系数,所述高频带激励信号通过根据LPC系数确定的合成滤波器而得到预测的高频带信号,然后比较预测的高频带信号和来自划分单元310的高频带信号而获得高频带增益调整参数,所述高频带增益参数、LPC系数即是所述高频编码参数的组成部分。此外,高频编码单元360还可以现有的或将来出现的各种技术来获得所述高频编码参数,具体的基于所述合成激励信号和所述高频带信号来获得高频编码参数的方式不构成对本发明的限制。在获得低频编码参数和高频编码参数之后,实现了信号的编码,从而能够传送到解码端进行恢复。
可选地,所述音频信号编码装置300还可以包括:比特流生成单元370,用于根据所述低频编码参数和高频编码参数来生成编码比特流,以发送给解码端。
关于图3中所示的音频信号编码装置的各个单元所执行的操作,可以参见结合图1的音频信号编码方法所进行的描述。
在本发明实施例的上述音频信号编码装置中,合成单元350利用浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号,可以基于浊音信号更准确地表征高频信号的特性,从而提高编码效果。
图5是示意性图示了根据本发明实施例的音频信号解码装置500的框图。该音频信号解码装置500包括:区分单元510,用于从已编码信息中区分出低频编码参数和高频编码参数;低频解码单元520,用于对所述低频编码参数进行解码而获得低频带信号;计算单元530,用于根据低频编码参数来计算浊音度因子,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;预测单元540,用于根据低频编码参数来预测高频带激励信号;合成单元550,用于利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;高频解码单元560,用于基于所述合成激励信号和高频编码参数来获得高频带信号;合并单元570,用于合并所述低频带信号和所述高频带信号而得到最终的解码信号。
所述区分单元510在接收到编码信号之后,将编码信号中的低频编码参数提供给低频解码单元520,并将编码信号中的高频编码参数提供给高频解码单元560。所述低频编码参数和高频编码参数是从编码端传送来的用于恢复低频信号和高频信号的参数。所述低频编码参数例如可以包括代数码书、代数码书增益、自适应码书、自适应码书增益、基音周期以及其它参数,所述高频编码参数例如可以包括LPC系数、高频带增益参数、以及其它参数。
所述低频解码单元520对所述低频编码参数进行解码而获得低频带信号。具体的解码方式与编码端的编码方式对应。此外,该低频解码单元520还将诸如代数码书、代数码书增益、自适应码书、自适应码书增益、基音周期等低频编码参数提供给计算单元530和预测单元540,计算单元530和预测单元540也可以从区分单元510中直接获取所需要的低频编码参数。
所述计算单元530,用于根据低频编码参数来计算浊音度因子,所述浊音度因子用于表示高频带信号表现为浊音特性的程度。具体地,计算单元530可根据通过低频解码单元520获得的低频编码参数来计算浊音度因子voice_fac,其例如可根据前述的公式(1)来计算该浊音度因子voice_fac。然后,所述浊音度因子被用于获得合成激励信号,该合成激励信号被传送到所述高频解码单元560以用于获得高频带信号。
所述预测单元540和合成单元550分别与图3中的音频信号编码装置300中的预测单元340和合成单元350相同,因此其结构也可以参见图4中的所示和描述。例如,在一个实现中,所述预测单元540包括第二修正部件450和预测部件460二者;在另一实现中,所述预测单元540仅仅包括所述预测部件460。对于所述合成单元550,在一个实现中,所述合成单元550包括预加重部件410、加权部件420、去加重部件430;在另一实现中,所述合成单元550包括第一修正部件440、和加权部件420;在又一实现中,所述合成单元550包括预加重部件410、加权部件420、去加重部件430、和第一修正部件440。
高频解码单元560基于所述合成激励信号和高频编码参数来获得高频带信号。高频解码单元560采用与音频信号编码装置300中的高频编码单元的编码技术对应的解码技术来进行解码。作为示例,高频解码单元560利用高频编码参数中的LPC系数生成合成滤波器,将来自合成单元550的合成激励信号通过所述合成滤波器而恢复所预测的高频带信号,该预测的高频带信号经过高频编码参数中的高频带增益调整参数调整而获得最终的高频带信号。此外,还可以现有的或将来出现的各种技术来实现该高频解码单元560,具体的解码技术不构成对本发明的限制。
所述合并单元570合并所述低频带信号和所述高频带信号而得到最终的解码信号。所述合并单元570的合并方式与图3中的划分单元310执行划分操作的划分方式对应,从而实现解码而得到最终的输出信号。
在本发明实施例的上述音频信号解码装置中,通过利用浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号,可以基于浊音信号更准确地表征高频信号的特性,从而提高解码效果。
图6是示意性图示了根据本发明实施例的发射机600的框图。图6的发射机600可包括如图3所示的音频信号编码装置300,因此适当省略重复的描述。此外,发射机600还可以包括发射单元610,用于为所述音频信号编码装置300产生的高频编码参数和低频编码参数分配比特以生成比特流,并发射该比特流。
图7是示意性图示了根据本发明实施例的接收机700的框图。图7的接收机700可包括如图5所示的音频信号解码装置500,因此适当省略重复的描述。此外,接收机700还可以包括接收单元710,用于接收编码信号以供所述音频信号解码装置500处理。
在本发明的另一个实施例中,还提供一种通信系统,其可包括结合图6描述的发射机600或结合图7描述的接收机700。
图8是本发明另一实施例的装置的示意框图。图8的装置800可用于实现上述方法实施例中各步骤及方法。装置800可应用于各种通信系统中的基站或者终端。图8的实施例中,装置800包括发射电路802、接收电路803、编码处理器804、解码处理器805、处理单元806、存储器807及天线801。处理单元806控制装置800的操作,处理单元806还可以称为CPU(Central Processing Unit,中央处理单元)。存储器807可以包括只读存储器和随机存取存储器,并向处理单元806提供指令和数据。存储器807的一部分还可以包括非易失行随机存取存储器(NVRAM)。具体的应用中,装置800可以嵌入或者本身可以就是例如移动电话之类的无线通信设备,还可以包括容纳发射电路802和接收电路803的载体,以允许装置800和远程位置之间进行数据发射和接收。发射电路802和接收电路803可以耦合到天线801。装置800的各个组件通过总线系统809耦合在一起,其中总线系统809除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图中将各种总线都标为总线系统809。装置800还可以包括用于处理信号的处理单元806,此外还包括编码处理器804、解码处理器805。
上述本发明实施例揭示的音频信号编码方法可以应用于编码处理器804或由其实现,上述本发明实施例揭示的音频信号解码方法可以应用于解码处理器805或由其实现。编码处理器804或解码处理器805可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过编码处理器804或解码处理器805中的硬件的集成逻辑电路或者软件形式的指令完成。这些指令可以通过处理器806以配合实现及控制。用于执行本发明实施例揭示的方法,上述的解码处理器可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器,译码器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件解码处理器执行完成,或者用解码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器807中,编码处理器804或解码处理器805读取存储器807中的信息,结合其硬件完成上述方法的步骤。例如,存储器807可存储所得到的低频编码参数,供编码处理器804或解码处理器805在编码或解码时使用。
例如,图3的音频信号编码装置300可以由编码处理器804实现,图5的音频信号解码装置500可以由解码处理器805实现。另外,图4的预测单元和合成单元可以由处理器806实现,也可以由编码处理器804或解码处理器805实现。
另外,例如,图6的发射机610可以由编码处理器804、发射电路802和天线801等实现。图7的接收机710可以由天线801、接收电路803和解码处理器805等实现。但上述例子仅仅是示意性的,并非将本发明实施例限于这样的具体实现形式。
具体地,存储器807存储使得处理器806和/或编码处理器804实现以下操作的指令:将待编码的时域信号划分为低频带信号和高频带信号;对低频带信号进行编码而获得低频编码参数;根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示所述高频带信号表现为浊音特性的程度;利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;基于所述合成激励信号和所述高频带信号来获得高频编码参数。存储器807存储使得处理器806或解码处理器805实现以下操作的指令:从已编码信息中区分出低频编码参数和高频编码参数;对所述低频编码参数进行解码而获得低频带信号;根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;利用所述浊音度因子对所述高频带激励信号和随机噪声进行加权而获得合成激励信号;基于所述合成激励信号和高频编码参数来获得高频带信号;合并所述低频带信号和所述高频带信号而得到最终的解码信号。
根据本发明实施例的通信系统或通信装置可包括上述音频信号编码装置300、发射机610、音频信号解码装置500、接收机710等中的部分或全部。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (24)
1.一种音频信号编码方法,其特征在于,包括:
将待编码的时域信号划分为低频带信号和高频带信号;
对低频带信号进行编码而获得低频编码参数;
根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示所述高频带信号表现为浊音特性的程度;
根据所述浊音度因子,所述高频带激励信号和随机噪声得到合成激励信号;
基于所述合成激励信号和所述高频带信号来获得高频编码参数。
2.根据权利要求1的方法,其特征在于,所述根据所述浊音度因子,所述高频带激励信号和所述随机噪声得到所述合成激励信号,包括:
利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;
根据所述浊音度因子,所述高频带激励信号和所述预加重噪声得到合成激励信号。
3.根据权利要求2的方法,其特征在于,所述根据所述浊音度因子,所述高频带激励信号和所述预加重噪声得到合成激励信号,包括::
利用所述浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;
利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。
4.根据权利要求3的方法,其特征在于,所述去加重因子是基于所述预加重因子以及所述预加重噪声在所述预加重激励信号中的比例来确定的。
5.根据权利要求1-4中任一项的方法,其特征在于,所述低频编码参数包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期,所述根据低频编码参数来预测高频带激励信号包括:
利用所述基音周期来修正所述浊音度因子;
利用修正后的浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而预测到所述高频带激励信号。
6.根据权利要求5的方法,其特征在于,所述利用所述基音周期来修正所述浊音度因子是根据下面的公式来进行的:
voice_fac_A=voice_fac*γ
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。
7.一种音频信号解码方法,其特征在于,包括:
从已编码信息中区分出低频编码参数和高频编码参数;
对所述低频编码参数进行解码而获得低频带信号;
根据低频编码参数来计算浊音度因子,并根据低频编码参数来预测高频带激励信号,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;
根据所述浊音度因子,所述高频带激励信号和随机噪声得到合成激励信号;
基于所述合成激励信号和高频编码参数来获得高频带信号;
合并所述低频带信号和所述高频带信号而得到最终的解码信号。
8.根据权利要求7的方法,其特征在于,所述根据所述浊音度因子,所述高频带激励信号和随机噪声得到合成激励信号,包括:
利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;
根据所述浊音度因子,所述高频带激励信号和所述预加重噪声得到合成激励信号。
9.根据权利要求8的方法,其特征在于,所述根据所述浊音度因子,所述高频带激励信号和所述预加重噪声得到合成激励信号,包括:
利用所述浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;
利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。
10.根据权利要求9的方法,其特征在于,所述去加重因子是基于所述预加重因子以及所述预加重噪声在所述预加重激励信号中的比例来确定的。
11.根据权利要求7-10中任一项的方法,其特征在于,所述低频编码参数包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期,所述根据低频编码参数来预测高频带激励信号包括:
利用所述基音周期来修正所述浊音度因子;
利用修正后的浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而预测到所述高频带激励信号。
12.根据权利要求11的方法,其特征在于,所述利用所述基音周期来修正所述浊音度因子是根据下面的公式来进行的:
voice_fac_A=voice_fac*γ
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。
13.一种音频信号编码装置,其特征在于,包括:
划分单元,用于将待编码的时域信号划分为低频带信号和高频带信号;
低频编码单元,用于对低频带信号进行编码而获得低频编码参数;
计算单元,用于根据低频编码参数来计算浊音度因子,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;
预测单元,用于根据低频编码参数来预测高频带激励信号;
合成单元,用于根据所述浊音度因子,所述高频带激励信号和随机噪声得到合成激励信号;
高频编码单元,用于基于所述合成激励信号和所述高频带信号来获得高频编码参数。
14.根据权利要求13所述的装置,其特征在于,所述合成单元具体用于:
利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;
根据所述浊音度因子,所述高频带激励信号和所述预加重噪声得到合成激励信号。
15.根据权利要求13的装置,其特征在于,所述合成单元包括:
预加重部件,用于利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;
加权部件,用于利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;
去加重部件,用于利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。
16.根据权利要求15的装置,其特征在于,所述去加重因子是基于所述预加重因子以及所述预加重噪声在所述预加重激励信号中的比例来确定的。
17.根据权利要求13-16中任一项的装置,其特征在于,所述低频编码参数包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期,所述预测单元包括:
第二修正部件,用于利用所述基音周期来修正所述浊音度因子;
预测部件,用于利用修正后的浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而预测到所述高频带激励信号。
18.根据权利要求17的装置,其特征在于,所述第一修正部件和第二修正部件中的至少一个根据下面的公式来修正所述浊音度因子:
voice_fac_A=voice_fac*γ
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。
19.一种音频信号解码装置,其特征在于,包括:
区分单元,用于从已编码信息中区分出低频编码参数和高频编码参数;
低频解码单元,用于对所述低频编码参数进行解码而获得低频带信号;
计算单元,用于根据低频编码参数来计算浊音度因子,所述浊音度因子用于表示高频带信号表现为浊音特性的程度;
预测单元,用于根据低频编码参数来预测高频带激励信号;
合成单元,用于根据所述浊音度因子,所述高频带激励信号和随机噪声得到合成激励信号;
高频解码单元,用于基于所述合成激励信号和高频编码参数来获得高频带信号;
合并单元,用于合并所述低频带信号和所述高频带信号而得到最终的解码信号。
20.根据权利要求19所述的装置,其特征在于,所述合成单元具体用于:
利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;
根据所述浊音度因子,所述高频带激励信号和所述预加重噪声得到合成激励信号。
21.根据权利要求19的装置,其特征在于,所述合成单元包括:
预加重部件,用于利用预加重因子对所述随机噪声进行用于提升其高频部分的预加重操作而获得预加重噪声;
加权部件,用于利用浊音度因子对所述高频带激励信号和所述预加重噪声进行加权而生成预加重激励信号;
去加重部件,用于利用去加重因子对所述预加重激励信号进行用于压低其高频部分的去加重操作而获得所述合成激励信号。
22.根据权利要求21的装置,其特征在于,所述去加重因子是基于所述预加重因子以及所述预加重噪声在所述预加重激励信号中的比例来确定的。
23.根据权利要求19-22中任一项的装置,其特征在于,所述低频编码参数包括代数码书、代数码书增益、自适应码书、自适应码书增益和基音周期,所述预测单元包括:
第二修正部件,用于利用所述基音周期来修正所述浊音度因子;
预测部件,用于利用修正后的浊音度因子来对所述代数码书和随机噪声进行加权而得到加权结果,将所述加权结果与代数码书增益的乘积加上所述自适应码书与自适应码书增益的乘积而预测到所述高频带激励信号。
24.根据权利要求23的装置,其特征在于,所述第一修正部件和第二修正部件中的至少一个根据下面的公式来修正所述浊音度因子:
voice_fac_A=voice_fac*γ
其中,voice_fac是浊音度因子,T0是基音周期,a1、a2、b1>0,b2≥0,threshold_min和threshold_max分别是预先设置的基音周期的最小值和最大值,voice_fac_A是修正后的浊音度因子。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610581304.0A CN105976830B (zh) | 2013-01-11 | 2013-01-11 | 音频信号编码和解码方法、音频信号编码和解码装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310010936.8A CN103928029B (zh) | 2013-01-11 | 2013-01-11 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CN201610581304.0A CN105976830B (zh) | 2013-01-11 | 2013-01-11 | 音频信号编码和解码方法、音频信号编码和解码装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310010936.8A Division CN103928029B (zh) | 2013-01-11 | 2013-01-11 | 音频信号编码和解码方法、音频信号编码和解码装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105976830A true CN105976830A (zh) | 2016-09-28 |
CN105976830B CN105976830B (zh) | 2019-09-20 |
Family
ID=51146227
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610581304.0A Active CN105976830B (zh) | 2013-01-11 | 2013-01-11 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CN201310010936.8A Active CN103928029B (zh) | 2013-01-11 | 2013-01-11 | 音频信号编码和解码方法、音频信号编码和解码装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310010936.8A Active CN103928029B (zh) | 2013-01-11 | 2013-01-11 | 音频信号编码和解码方法、音频信号编码和解码装置 |
Country Status (9)
Country | Link |
---|---|
US (3) | US9805736B2 (zh) |
EP (2) | EP2899721B1 (zh) |
JP (2) | JP6125031B2 (zh) |
KR (2) | KR101736394B1 (zh) |
CN (2) | CN105976830B (zh) |
BR (1) | BR112015014956B1 (zh) |
HK (1) | HK1199539A1 (zh) |
SG (1) | SG11201503286UA (zh) |
WO (1) | WO2014107950A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113196387A (zh) * | 2019-01-13 | 2021-07-30 | 华为技术有限公司 | 高分辨率音频编解码 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL4231291T3 (pl) * | 2008-12-15 | 2024-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
CN103426441B (zh) | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
CN105976830B (zh) * | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
US9384746B2 (en) * | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
CN105745706B (zh) * | 2013-11-29 | 2019-09-24 | 索尼公司 | 用于扩展频带的装置、方法和程序 |
CN105225671B (zh) | 2014-06-26 | 2016-10-26 | 华为技术有限公司 | 编解码方法、装置及系统 |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
CN106328153B (zh) * | 2016-08-24 | 2020-05-08 | 青岛歌尔声学科技有限公司 | 电子通信设备语音信号处理系统、方法和电子通信设备 |
US10825467B2 (en) * | 2017-04-21 | 2020-11-03 | Qualcomm Incorporated | Non-harmonic speech detection and bandwidth extension in a multi-source environment |
CN112767954B (zh) * | 2020-06-24 | 2024-06-14 | 腾讯科技(深圳)有限公司 | 音频编解码方法、装置、介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1328681A (zh) * | 1998-10-27 | 2001-12-26 | 沃斯艾格公司 | 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备 |
CN101083076A (zh) * | 2006-06-03 | 2007-12-05 | 三星电子株式会社 | 使用带宽扩展技术对信号编码和解码的方法和设备 |
CN101256771A (zh) * | 2007-03-02 | 2008-09-03 | 北京工业大学 | 嵌入式编码、解码方法、编码器、解码器及系统 |
CN101414462A (zh) * | 2007-10-15 | 2009-04-22 | 华为技术有限公司 | 音频编码方法和多点音频信号混音控制方法及相应设备 |
CN103928029A (zh) * | 2013-01-11 | 2014-07-16 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02230300A (ja) * | 1989-03-03 | 1990-09-12 | Nec Corp | 音声合成器 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JPH0954600A (ja) * | 1995-08-14 | 1997-02-25 | Toshiba Corp | 音声符号化通信装置 |
WO1997012328A1 (en) | 1995-09-25 | 1997-04-03 | Adobe Systems Incorporated | Optimum access to electronic documents |
US7260523B2 (en) * | 1999-12-21 | 2007-08-21 | Texas Instruments Incorporated | Sub-band speech coding system |
AU2001294974A1 (en) * | 2000-10-02 | 2002-04-15 | The Regents Of The University Of California | Perceptual harmonic cepstral coefficients as the front-end for speech recognition |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6691085B1 (en) | 2000-10-18 | 2004-02-10 | Nokia Mobile Phones Ltd. | Method and system for estimating artificial high band signal in speech codec using voice activity information |
EP1383113A1 (fr) * | 2002-07-17 | 2004-01-21 | STMicroelectronics N.V. | Procédé et dispositif d'encodage de la parole à bande élargie capable de contrôler indépendamment les distorsions à court terme et à long terme |
EP1383109A1 (fr) * | 2002-07-17 | 2004-01-21 | STMicroelectronics N.V. | Procédé et dispositif d'encodage de la parole à bande élargie |
KR100503415B1 (ko) * | 2002-12-09 | 2005-07-22 | 한국전자통신연구원 | 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법 |
WO2004084179A2 (en) * | 2003-03-15 | 2004-09-30 | Mindspeed Technologies, Inc. | Adaptive correlation window for open-loop pitch |
US20070299655A1 (en) * | 2006-06-22 | 2007-12-27 | Nokia Corporation | Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech |
RU2437170C2 (ru) * | 2006-10-20 | 2011-12-20 | Франс Телеком | Ослабление чрезмерной тональности, в частности, для генерирования возбуждения в декодере при отсутствии информации |
FR2907586A1 (fr) * | 2006-10-20 | 2008-04-25 | France Telecom | Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch. |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
JP5103880B2 (ja) * | 2006-11-24 | 2012-12-19 | 富士通株式会社 | 復号化装置および復号化方法 |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
CN101617362B (zh) * | 2007-03-02 | 2012-07-18 | 松下电器产业株式会社 | 语音解码装置和语音解码方法 |
US9177569B2 (en) * | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CN101903945B (zh) | 2007-12-21 | 2014-01-01 | 松下电器产业株式会社 | 编码装置、解码装置以及编码方法 |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
KR100998396B1 (ko) * | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
CN101572087B (zh) * | 2008-04-30 | 2012-02-29 | 北京工业大学 | 嵌入式语音或音频信号编解码方法和装置 |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
US8718804B2 (en) * | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
CN101996640B (zh) * | 2009-08-31 | 2012-04-04 | 华为技术有限公司 | 频带扩展方法及装置 |
AU2010309838B2 (en) * | 2009-10-20 | 2014-05-08 | Dolby International Ab | Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
CN102800317B (zh) | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
CN104221081B (zh) * | 2011-11-02 | 2017-03-15 | 瑞典爱立信有限公司 | 带宽扩展音频信号的高频带扩展的生成 |
US9728200B2 (en) * | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
TR201910989T4 (tr) * | 2013-03-04 | 2019-08-21 | Voiceage Evs Llc | Bir zaman-bölgesi kod çözücüsünde nicemleme gürültüsünün azaltılmasına yönelik cihaz ve yöntem. |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
EP3336841B1 (en) * | 2013-10-31 | 2019-12-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal |
US9697843B2 (en) * | 2014-04-30 | 2017-07-04 | Qualcomm Incorporated | High band excitation signal generation |
-
2013
- 2013-01-11 CN CN201610581304.0A patent/CN105976830B/zh active Active
- 2013-01-11 CN CN201310010936.8A patent/CN103928029B/zh active Active
- 2013-07-22 SG SG11201503286UA patent/SG11201503286UA/en unknown
- 2013-07-22 KR KR1020157013439A patent/KR101736394B1/ko active IP Right Grant
- 2013-07-22 EP EP13871091.8A patent/EP2899721B1/en active Active
- 2013-07-22 EP EP18172248.9A patent/EP3467826A1/en not_active Withdrawn
- 2013-07-22 JP JP2015543256A patent/JP6125031B2/ja active Active
- 2013-07-22 WO PCT/CN2013/079804 patent/WO2014107950A1/zh active Application Filing
- 2013-07-22 KR KR1020177012597A patent/KR20170054580A/ko not_active Application Discontinuation
- 2013-07-22 BR BR112015014956-1A patent/BR112015014956B1/pt active IP Right Grant
-
2014
- 2014-12-30 HK HK14113070.0A patent/HK1199539A1/zh unknown
-
2015
- 2015-05-05 US US14/704,502 patent/US9805736B2/en active Active
-
2017
- 2017-04-04 JP JP2017074548A patent/JP6364518B2/ja active Active
- 2017-09-28 US US15/717,952 patent/US10373629B2/en active Active
-
2019
- 2019-08-04 US US16/531,116 patent/US20190355378A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1328681A (zh) * | 1998-10-27 | 2001-12-26 | 沃斯艾格公司 | 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备 |
CN101083076A (zh) * | 2006-06-03 | 2007-12-05 | 三星电子株式会社 | 使用带宽扩展技术对信号编码和解码的方法和设备 |
CN101256771A (zh) * | 2007-03-02 | 2008-09-03 | 北京工业大学 | 嵌入式编码、解码方法、编码器、解码器及系统 |
CN101414462A (zh) * | 2007-10-15 | 2009-04-22 | 华为技术有限公司 | 音频编码方法和多点音频信号混音控制方法及相应设备 |
CN103928029A (zh) * | 2013-01-11 | 2014-07-16 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
Non-Patent Citations (3)
Title |
---|
EPPS,WHHOLMES J: "SPEECH ENHANCEMENT USING STC-BASED BANDWIDTH EXTENSION", 《THE 5TH INTERNATIONAL CONFERENCE ON SPOKEN LANGUAGE PROCESSING, INCORPORATING THE 7TH AUSTRALIAN INTERNATIONAL SPEECH SCIENCE AND TECHNOLOGY CONFERENCE》 * |
崔尚平 等: "调频广播中预加重和去加重问题的讨论", 《甘肃科学学报》 * |
邝永辉: "预加重及去加重在无线音频设备中的应用", 《电声技术》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113196387A (zh) * | 2019-01-13 | 2021-07-30 | 华为技术有限公司 | 高分辨率音频编解码 |
Also Published As
Publication number | Publication date |
---|---|
EP2899721A4 (en) | 2015-12-09 |
KR101736394B1 (ko) | 2017-05-16 |
JP6125031B2 (ja) | 2017-05-10 |
CN105976830B (zh) | 2019-09-20 |
CN103928029B (zh) | 2017-02-08 |
EP2899721A1 (en) | 2015-07-29 |
US20180018989A1 (en) | 2018-01-18 |
KR20170054580A (ko) | 2017-05-17 |
JP2017138616A (ja) | 2017-08-10 |
WO2014107950A1 (zh) | 2014-07-17 |
BR112015014956A2 (pt) | 2017-07-11 |
CN103928029A (zh) | 2014-07-16 |
JP2016505873A (ja) | 2016-02-25 |
US20150235653A1 (en) | 2015-08-20 |
EP2899721B1 (en) | 2018-09-12 |
JP6364518B2 (ja) | 2018-07-25 |
KR20150070398A (ko) | 2015-06-24 |
US20190355378A1 (en) | 2019-11-21 |
HK1199539A1 (zh) | 2015-07-03 |
EP3467826A1 (en) | 2019-04-10 |
BR112015014956A8 (pt) | 2019-10-15 |
US10373629B2 (en) | 2019-08-06 |
US9805736B2 (en) | 2017-10-31 |
SG11201503286UA (en) | 2015-06-29 |
BR112015014956B1 (pt) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105976830A (zh) | 音频信号编码和解码方法、音频信号编码和解码装置 | |
JP6616470B2 (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 | |
CN101189662A (zh) | 带多级码本和冗余编码的子带话音编解码器 | |
CN103050121A (zh) | 线性预测语音编码方法及语音合成方法 | |
CN1470051A (zh) | 非话音语音的高性能低比特率编码方法和设备 | |
CN106847297A (zh) | 高频带信号的预测方法、编/解码设备 | |
CN102855878B (zh) | 一种窄带语音子带清浊音度参数的量化方法 | |
CN105814631A (zh) | 盲带宽扩展系统和方法 | |
CN103050122B (zh) | 一种基于melp的多帧联合量化低速率语音编解码方法 | |
CN104956438A (zh) | 执行噪声调制和增益调节的系统和方法 | |
EP3040988B1 (en) | Audio decoding based on an efficient representation of auto-regressive coefficients | |
CN1192357C (zh) | 用于语音编码的自适应规则 | |
CN101496097A (zh) | 用于在与语音信号相关联的包中包含识别符的系统及方法 | |
CN104301064A (zh) | 处理丢失帧的方法和解码器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |