CN106228991B - 编解码方法、装置及系统 - Google Patents
编解码方法、装置及系统 Download PDFInfo
- Publication number
- CN106228991B CN106228991B CN201610617731.XA CN201610617731A CN106228991B CN 106228991 B CN106228991 B CN 106228991B CN 201610617731 A CN201610617731 A CN 201610617731A CN 106228991 B CN106228991 B CN 106228991B
- Authority
- CN
- China
- Prior art keywords
- signal
- full band
- band signal
- postemphasising
- characterization factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012512 characterization method Methods 0.000 claims abstract description 127
- 238000012545 processing Methods 0.000 claims abstract description 89
- 230000005236 sound signal Effects 0.000 claims abstract description 83
- 238000001228 spectrum Methods 0.000 claims description 75
- 238000005086 pumping Methods 0.000 claims description 27
- 238000001914 filtration Methods 0.000 claims description 16
- 238000011084 recovery Methods 0.000 claims description 7
- 230000005713 exacerbation Effects 0.000 claims 1
- 238000005070 sampling Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例提供一种编解码方法、装置及系统,该编码方法通过采用根据音频输入信号的特征因子确定的去加重参数对全带信号进行去加重处理后编码发送到解码端,使得解码端根据音频输入信号的特征因子对全带信号进行相应的去加重解码处理,恢复音频输入信号,解决了现有技术中解码端恢复的音频信号容易存在信号失真的问题,实现了根据音频信号的特征因子对全带信号进行自适应去加重处理,增强了编码性能,使得解码端恢复的音频输入信号具有较高的保真度,更接近原始信号。
Description
技术领域
本发明涉及音频信号处理技术,尤其涉及一种基于时域的编解码方法、装置及系统。
背景技术
为了节省信道容量和存储空间,人们通常利用人耳对音频信号高频信息的敏感性低于低频信息的特点,将高频信息直接截去,导致音频质量下降。因此引入频带扩展技术来重建被截去的高频信息,以提升音频质量。随着速率的提高,在保证编码性能的前提下,可编码的高频带部分的频带越宽,使得接收端可获得更宽频带、更高质量的音频信号。
现有技术中,在高速率条件下,利用频带扩展技术可将音频输入信号的频谱编码到全带,其基本原理是:采用带通滤波器(Band Pass Filter,简称:BPF)对音频输入信号进行带通滤波处理获得音频输入信号的全带信号,并对全带信号进行能量计算获得全带信号的能量Ener0;采用超宽带(Super Wide Band,简称:SWB)时域频带扩展(Time BandExtension,简称:TBE)编码器对高频带信号进行编码,获得高频带的编码信息,并根据高频带信号确定用于预测全带信号的全带线性预测编码(Linear Predictive Coding,简称:LPC)系数以及全带(Full Band,简称:FB)激励信号(Excitation),并根据LPC系数以及FB激励信号进行预测处理获得预测的全带信号,并对预测的全带信号进行去加重(de-emphasis)处理,确定去加重处理后的预测的全带信号的能量Ener1;计算Ener1与Ener0的能量比值。将上述高频带的编码信息、能量比值传送给解码端,以使解码端可根据高频带的编码信息以及能量比值恢复音频输入信号的全带信号,进而恢复音频输入信号。
上述方案中,解码端恢复的音频输入信号容易存在信号失真较大的问题。
发明内容
本发明实施例提供一种编解码方法、装置及系统,以缓解或者解决现有技术中解码端恢复的音频输入信号容易存在信号失真较大的问题。
第一方面,本发明提供一种编码方法,包括:
编码装置对音频输入信号的低频带信号进行编码,获得所述音频输入信号的特征因子;
所述编码装置对所述音频输入信号的高频带信号进行编码和扩频预测获得第一全带信号;
所述编码装置对所述第一全带信号进行去加重处理,其中,所述去加重处理中去加重参数根据所述特征因子确定;
所述编码装置计算获得去加重处理后的所述第一全带信号的第一能量;
所述编码装置对所述音频输入信号进行带通滤波处理,获得第二全带信号;
所述编码装置计算获得所述第二全带信号的第二能量;
所述编码装置计算获得所述第二全带信号的第二能量与所述第一全带信号的第一能量的能量比值;
所述编码装置向解码装置发送对所述音频输入信号编码后的码流,所述码流中包括所述音频输入信号的特征因子、高频带编码信息以及所述能量比值。
结合第一方面,在第一方面的第一种可能的实现方式中,所述方法还包括:
所述编码装置获得所述特征因子的个数;
所述编码装置根据所述特征因子以及所述特征因子的个数,确定所述特征因子的平均值;
所述编码装置根据所述特征因子的平均值确定所述去加重参数。
结合第一方面或第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述编码装置对所述音频输入信号的高频带信号进行扩频预测获得第一全带信号,包括:
所述编码装置根据所述高频带信号确定用于预测全带信号的LPC系数和全带激励信号;
所述编码装置对所述LPC系数和所述全带激励信号进行编码处理,获得所述第一全带信号。
结合第一方面以及第一方面的第一或第二种可能的实现方式中的任一项,在第一方面的第三种可能的实现方式中,所述编码装置对所述第一全带信号进行去加重处理,包括:
所述编码装置对所述第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
所述编码装置对频谱反折处理后的所述第一全带信号进行去加重处理。
结合第一方面以及第一方面的第一至第三种可能的实现方式中的任一项,在第一方面的第四种可能的实现方式中,所述特征因子用于体现音频信号的特征,包括浊音度因子、谱倾斜、短时平均能量或短时过零率。
第二方面,本发明提供一种解码方法,包括:
解码装置接收编码装置发送的音频信号码流,所述音频信号码流中包括所述音频信号码流对应的音频信号的特征因子、高频带编码信息以及能量比值;
所述解码装置使用所述特征因子对所述音频信号码流进行低频带解码,获得低频带信号;
所述解码装置使用所述高频带编码信息对所述音频信号码流进行高频带解码,获得高频带信号;
所述解码装置对所述高频带信号进行扩频预测获得第一全带信号;
所述解码装置对所述第一全带信号进行去加重处理,其中,所述去加重处理中加重参数根据所述特征因子确定;
所述解码装置计算获得去加重处理后的第一全带信号的第一能量;
所述解码装置根据所述音频信号码流中包括的所述能量比值、所述去加重处理后的第一全带信号以及所述第一能量获得第二全带信号,所述能力比值为所述第二全带信号的能量与所述第一能量的能量之比;
所述解码装置,根据所述第二全带信号、所述低频带信号以及所述高频带信号,恢复所述音频信号码流对应的音频信号。
结合第二方面,在第二方面的第一种可能的实现方式中,所述方法还包括:
所述解码装置解码获得所述特征因子的个数;
所述解码装置根据所述特征因子以及所述特征因子的个数,确定所述特征因子的平均值;
所述解码装置根据所述特征因子的平均值确定所述去加重参数。
结合第二方面或第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述解码装置对所述高频带信号进行扩频预测获得第一全带信号,包括:
所述解码装置根据所述高频带信号确定用于预测全带信号的LPC系数和全带激励信号;
所述解码装置对所述LPC系数和所述全带激励信号进行编码处理,获得所述第一全带信号。
结合第二方面以及第二方面的第一或第二种可能的实现方式中的任一项,在第二方面的第三种可能的实现方式中,所述解码装置对所述第一全带信号进行去加重处理,包括:
所述解码装置对所述第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
所述解码装置对频谱反折处理后的所述第一全带信号进行去加重处理。
结合第二方面以及第二方面的第一至第三种可能的实现方式中的任一项,在第二方面的第四种可能的实现方式中,所述特征因子用于体现音频信号的特征,包括浊音度因子、谱倾斜、短时平均能量或短时过零率。
第三方面,本发明提供一种编码装置,包括:
第一编码模块,用于对音频输入信号的低频带信号进行编码,获得所述音频输入信号的特征因子;
第二编码模块,用于对所述音频输入信号的高频带信号进行编码和扩频预测获得第一全带信号;
去加重处理模块,用于对所述第一全带信号进行去加重处理,其中,所述去加重处理中去加重参数根据所述特征因子确定;
计算模块,用于计算获得去加重处理后的所述第一全带信号的第一能量;
带通处理模块,用于对所述音频输入信号进行带通滤波处理,获得第二全带信号;
所述计算模块,还用于计算获得所述第二全带信号的第二能量;以及,
计算获得所述第二全带信号的第二能量与所述第一全带信号的第一能量的能量比值;
发送模块,用于向解码装置发送对所述音频输入信号编码后的码流,所述码流中包括所述音频输入信号的特征因子、高频带编码信息以及所述能量比值。
结合第三方面,在第三方面的第一种可能的实现方式中,还包括去加重参数确定模块,用于:
获得所述特征因子的个数;
根据所述特征因子以及所述特征因子的个数,确定所述特征因子的平均值;
根据所述特征因子的平均值确定所述去加重参数。
结合第三方面或第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式中,所述第二编码模块,具体用于:
根据所述高频带信号确定用于预测全带信号的LPC系数和全带激励信号;
对所述LPC系数和所述全带激励信号进行编码处理,获得所述第一全带信号。
结合第三方面以及第三方面的第一或第二种可能的实现方式中的任一项,在第三方面的第三种可能的实现方式中,所述去加重处理模块,具体用于:
对所述第二编码模块获得的第一全带信号进行频谱移动修正,并对修正后的所述第一全带信号进行频谱反折处理;
对频谱反折处理后的所述第一全带信号进行去加重处理。
结合第三方面以及第三方面的第一至第三种可能的实现方式中的任一项,在第三方面的第四种可能的实现方式中,所述特征因子用于体现音频信号的特征,包括浊音度因子、谱倾斜、短时平均能量或短时过零率。
第四方面,本发明提供一种解码装置,包括:
接收模块,用于接收编码装置发送的音频信号码流,所述音频信号码流中包括所述音频信号码流对应的音频信号的特征因子、高频带编码信息以及能量比值;
第一解码模块,用于使用所述特征因子对所述音频信号码流进行低频带解码,获得低频带信号;
第二解码模块,用于使用所述高频带编码信息对所述音频信号码流进行高频带解码,获得高频带信号;以及,
对所述高频带信号进行扩频预测获得第一全带信号;
去加重处理模块,用于对所述第一全带信号进行去加重处理,其中,所述去加重处理中加重参数根据所述特征因子确定;
计算模块,用于计算获得去加重处理后的第一全带信号的第一能量;以及,
根据所述音频信号码流中包括的所述能量比值、所述去加重处理后的第一全带信号以及所述第一能量获得第二全带信号,所述能力比值为所述第二全带信号的能量与所述第一能量的能量之比;
恢复模块,用于根据所述第二全带信号、所述低频带信号以及所述高频带信号,恢复所述音频信号码流对应的音频信号。
结合第四方面,在第四方面的第一种可能的实现方式中,还包括去加重参数确定模块,用于:
解码获得所述特征因子的个数;
根据所述特征因子以及所述特征因子的个数,确定所述特征因子的平均值;
根据所述特征因子的平均值确定所述去加重参数。
结合第四方面或第四方面的第一种可能的实现方式,在第四方面的第二种可能的实现方式中,所述第二解码模块,具体用于:
根据所述高频带信号确定用于预测全带信号的LPC系数和全带激励信号;
对所述LPC系数和所述全带激励信号进行编码处理,获得所述第一全带信号。
结合第四方面以及第四方面的第一或第二种可能的实现方式中的任一项,在第四方面的第三种可能的实现方式中,所述去加重处理模块,具体用于:
对所述第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
对频谱反折处理后的所述第一全带信号进行去加重处理。
结合第四方面以及第四方面的第一至第三种可能的实现方式中的任一项,在第四方面的第四种可能的实现方式中,所述特征因子用于体现音频信号的特征,包括浊音度因子、谱倾斜、短时平均能量或短时过零率。
第五方面,本发明提供一种编解码系统,包括:如第三方面以及第三方面的第一至第四种可能的实现方式中的任一项所述的编码装置以及如第四方面以及第四方面的第一至第四种可能的实现方式中的任一项所述的解码装置。
本发明实施例提供的编解码方法、装置及系统,通过采用根据音频输入信号的特征因子确定的去加重参数对全带信号进行去加重处理后编码发送到解码端,使得解码端根据音频输入信号的特征因子对全带信号进行相应的去加重解码处理,恢复音频输入信号,解决了现有技术中解码端恢复的音频信号容易存在信号失真的问题,实现了根据音频信号的特征因子对全带信号进行自适应去加重处理,增强了编码性能,使得解码端恢复的音频输入信号具有较高的保真度,更接近原始信号。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的编码方法实施例的流程图;
图2为本发明实施例提供的解码方法实施例的流程图;
图3为本发明实施例提供的编码装置实施例一的结构示意图;
图4为本发明实施例提供的解码装置实施例一的结构示意图;
图5为本发明实施例提供的编码装置实施例二的结构示意图;
图6为本发明实施例提供的编码装置实施例二的结构示意图;
图7为本发明提供的编解码系统实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的编码方法实施例的流程图,如图1所示,该方法实施例,包括:
S101、编码装置对音频输入信号的低频带信号进行编码,获得该音频输入信号的特征因子。
进行编码的信号为音频信号,其中,上述特征因子用于体现音频信号的特征,包括但不限于“浊音度因子”、“谱倾斜”、“短时平均能量”、或“短时过零率”,该特征因子可以通过编码装置对音频输入信号的低频带信号进行编码获得,具体的,以浊音度因子为例,该浊音度因子可以从对低频带信号编码获得的低频带编码信息中提取基因周期、代数码书以及各自增益计算得到。
S102、编码装置对音频输入信号的高频带信号进行编码和扩频预测获得第一全带信号。
其中,在对高频带信号进行编码时,还获得高频带编码信息。
S103、编码装置对第一全带信号进行去加重处理,其中,去加重处理中去加重参数根据上述特征因子确定;
S104、编码装置计算获得去加重处理后的第一全带信号的第一能量;
S105、编码装置对音频输入信号进行带通滤波处理,获得第二全带信号;
S106、编码装置计算获得第二全带信号的第二能量;
S107、编码装置计算获得第二全带信号的第二能量与第一全带信号的第一能量的能量比值;
S108、编码装置向解码装置发送对音频输入信号编码后的码流,该码流中包括音频输入信号的特征因子、高频带编码信息以及能量比值。
进一步地,该方法实施例,还包括:
编码装置获得特征因子的个数;
编码装置根据特征因子以及特征因子的个数,确定特征因子的平均值;
编码装置根据特征因子的平均值,确定去加重参数。
具体的,编码装置可以是获得上述特征因子中的其中一个,以特征因子为浊音度因子为例,编码装置获得浊音度子因子的个数,并根据浊音度因子以及浊音度因子的个数确定该音频输入信号的浊音度因子的平均值,进而根据浊音度因子的平均值确定去加重参数。
进一步地,S102中,编码装置对音频输入信号的高频带信号进行编码和扩频预测获得第一全带信号,包括:
编码装置根据高频带信号确定用于预测全带信号的LPC系数和全带激励信号;
编码装置对LPC系数和全带激励信号进行编码处理,获得第一全带信号。
进一步地,S103,包括:
编码装置对第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
编码装置对频谱反折处理后的第一全带信号进行去加重处理。
可选地,S103之后,还包括:
编码装置对去加重处理后的第一全带信号进行上采样和带通处理;
相应地,S104,包括:
编码装置计算获得经过上采样和带通处理后的上述去加重处理后的第一全带信号的第一能量。
下面以特征因子为浊音度因子为例,说明本方法实施例的具体实施方式,对于其他特征因子其实现过程是类似的,具体不再赘述。
具体来说,编码装置的信令编码装置在接收到音频输入信号后,从该音频输入信号中提取低频带信号,对应频谱范围为[0,f1],并对该低频带信号编码获得音频输入信号的浊音度因子,具体的,对低频带信号编码获得低频带编码信息,并根据低频带编码信息中包括的基因周期、代数码书以及各自增益计算获得浊音度因子,根据该浊音度因子确定去加重参数;从该音频输入信号中提取高频带信号,对应频谱范围为[f1,f2],对该高频带信号进行编码和扩频预测,获得高频带编码信息,以及根据该高频带信号确定用于预测全带信号的LPC系数和全带激励信号,对LPC系数和全带激励信号进行编码处理,获得预测的第一全带信号,接着,对该第一全带信号进行去加重处理,其中该去加重处理中的去加重参数是根据浊音度因子确定的。在确定第一全带信号之后,可以对该第一全带信号进行频谱移动修正和频谱反折处理,之后再进行去加重处理。可选地,可以对去加重处理后第一全带信号进行上采样和带通滤波处理。之后,编码装置计算获得处理后的第一全带信号的第一能量Ener0;对音频输入信号进行带通滤波处理,获得第二全带信号,频谱范围为[f2,f3],并确定该第二全带信号的第二能量Ener1;确定Ener1与Ener0的能量比值(ratio);将音频输入信号的特征因子、高频带编码信息以及能量比值包括在对音频输入信号编码后的码流中发送给解码装置,以使解码装置根据接收到的码流、特征因子、高频带编码信息以及能量比值恢复音频信号。
通常地,对于48千赫兹(Kilo Hertz,简称:KHz)音频输入信号,其低频带信号对应的频谱范围[0,f1]可以具体为[0,8KHz],高频带信号对应的频谱范围[f1,f2]可以具体为[8KHz,16KHz],第二全带信号对应的频谱范围[f2,f3]可以具体为[16KHz,20KHz],下面以上述具体的频谱范围为例,具体说明该方法实施例的实现方式,需说明的是,本发明适用于此,但不限于此。
具体实现时,对于[0,8KHz]的低频带信号,可采用码激励线性预测编码(CodeExcited Linear Prediction,简称:CELP)核心(core)编码器进行编码,以获得低频带编码信息其中core编码器采用的编码算法,可以是现有的代数码本激励线性预测(AlgebraicCode Excited Linear Prediction,简称:ACELP)编码算法,但不限于此。
从低频带编码信息中提取基音周期、代数码书及各自增益,采用现有的算法计算获得浊音度因子(voice_factor),具体算法不再赘述,确定浊音度因子后,确定用于计算去加重参数的去加重因子μ。下面以浊音度因子为例具体说明确定去加重因子μ的计算过程。
首先确定获得的浊音度因子的数量M,通常可以为4个或5个,对M个浊音度因子求和求平均,以确定浊音度因子的平均值varvoiceshape,根据该平均值确定去加重因子μ,进而根据μ可得到去加重参数H(Z),如下式(1)所示:
H(Z)=1/(1-μZ-1) (1)
其中,H(Z)为传递函数在Z域的表达式,Z-1表示一个延时单元,根据varvoiceshape确定μ,可以取μ为任意与varvoiceshape相关的一个值,具体可以为但不限于:μ=varvoiceshape3,μ=varvoiceshape2,μ=varvoiceshape,或者μ=1-varvoiceshape。
对于[8KHz,16KHz]的高频带信号的编码,可以通过超宽带(Super Wide Band)时域频带扩展(Time Band Extention,简称:TBE)编码器实现,包括:从core编码器中提取基音周期、代数码书及各自增益,恢复高频带激励信号,提取高频带信号成分做LPC分析得到高频带的LPC系数,对高频带激励信号以及高频带的LPC系数进行综合,得到恢复的高频带信号,比较恢复的高频带信号与音频输入信息中的高频带信号,获得增益调整参数gain,用少量比特将高频带的LPC系数和增益gain参数量化,以获得高频带编码信息。
进一步地,从SWB编码器中根据音频输入信号的高频带信号确定用于预测全带信号的全带LPC系数和全带激励信号,对全带LPC系数和全带激励信号进行综合处理,得到预测的第一全带信号,然后可采用下述公式(2)对该第一全带信号进行频谱移动修正:
S2k=S1k×cos(2×PI×fn×k/fs) (2)
其中,k表示第k个时间样点,k为正整数,S2为频谱移动修正后的第一频谱信号,S1为第一全带信号,PI为圆周率,fn表示频谱要移动的距离为n个时间样点,n为正整数,fs表示信号采样率。
频谱移动修正后,对S2进行频谱反折处理,得到频谱反折处理后的第一全带信号S3,将频谱移动前后对应的时间样点的频谱信号的幅度进行反折,其实现方式可以与通常的频谱反折相同,以使频谱排列结构与原始频谱排列结构一致,具体不再赘述。
之后,对S3采用根据浊音度因子确定的去加重参数H(Z)去加重处理得到去加重处理后的第一全带信号S4,然后确定S4的能量Ener0,具体的,可以采用具有该去加重参数的去加重滤波器进行去加重处理。
可选地,在获得S4之后,可通过插零对去加重处理后的第一全带信号S4进行上采样处理,得到上采样后的第一全带信号S5,然后将S5可通过具有通过范围为[16KHz,20KHz]的带通滤波器(Band Pass Filter,简称:BPF)进行带通滤波处理,得到第一全带信号S6,然后确定S6的能量Ener0。通过对去加重后的第一全带信号,进行上采样和带通处理,之后再确定其能量,可对高频带扩展信号的频谱能量及频谱结构进行调整,增强编码性能。
第二全带信号,编码装置可通过对音频输入信号采用通过范围为[16KHz,20KHz]的带通滤波器(Band Pass Filter,简称:BPF)进行带通滤波处理后得到。得到第二全带信号后,编码装置确定其能量Ener1,并计算能量Ener1和Ener0的能量比值。将该能量比值进行量化处理后,与音频输入信号的特征因子以及高频带编码信息打包成码流发送到解码装置。
现有技术中,去加重滤波参数H(Z)中的去加重因子μ,通常为一固定值,而不考虑音频输入信号的信号类型,使得解码装置恢复的音频输入信号容易存在信号失真的问题。
该方法实施例,通过采用根据音频输入信号的特征因子确定的去加重参数对全带信号进行去加重处理后编码发送到解码端,使得解码端根据音频输入信号的特征因子对全带信号进行相应的去加重解码处理,恢复音频输入信号,解决了现有技术中解码端恢复的音频信号容易存在信号失真的问题,实现了根据音频信号的特征因子对全带信号进行自适应去加重处理,增强了编码性能,使得解码端恢复的音频输入信号具有较高的保真度,更接近原始信号。
图2为本发明实施例提供的解码方法实施例的流程图,为图1所示方法实施例对应的解码端方法实施例,如图2所示,该方法实施例,包括如下步骤:
S201、解码装置接收编码装置发送的音频信号码流,所述音频信号码流中包括所述音频信号码流对应的音频信号的特征因子、高频带编码信息以及能量比值;
其中,上述特征因子用于体现音频信号的特征,包括但不限于浊音度因子、谱倾斜、短时平均能量或短时过零率,与图1所示方法实施例中的特征因子相同,具体不再赘述。
S202、解码装置使用特征因子对音频信号码流进行低频带解码,获得低频带信号;
S203、解码装置使用高频带编码信息对音频信号码流进行高频带解码,获得高频带信号;
S204、解码装置对高频带信号进行扩频预测获得第一全带信号;
S205、解码装置对第一全带信号进行去加重处理,其中,去加重处理中加重参数根据特征因子确定;
S206、解码装置计算获得去加重处理后的第一全带信号的第一能量;
S207、解码装置根据音频信号码流中包括的能量比值、去加重处理后的第一全带信号以及第一能量获得第二全带信号,该能力比值为第二全带信号的能量与第一能量的能量之比;
S208、解码装置,根据第二全带信号、低频带信号以及高频带信号,恢复音频信号码流对应的音频信号。
进一步地,该方法实施例,还包括:
解码装置解码获得特征因子的个数;
解码装置根据特征因子以及特征因子的个数,确定特征因子的平均值;
解码装置根据特征因子的平均值,确定去加重参数。
进一步地,S204,包括:
解码装置根据高频带信号确定用于预测全带信号的LPC系数和全带激励信号;
解码装置对LPC系数和全带激励信号进行编码处理,获得第一全带信号。
进一步地,S205,包括:
解码装置对第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
解码装置对频谱反折处理后的第一全带信号进行去加重处理。
可选地,S205之后,该方法实施例,还包括:
解码装置对去加重处理后的第一全带信号进行上采样和带通滤波处理;
相应地,S206包括:
解码装置确定上采样和带通滤波处理后的上述去加重处理后的第一全带信号的第一能量。
该方法实施例与图1所示方法实施例中的技术方案对应,以特征因子为浊音度因子为例来说明该方法实施例的具体实施方式,对于其他特征因子其实现过程是类似的,具体不再赘述。
具体来说,解码装置接收编码装置发送的音频信号码流,其中该音频信号码流中包括该音频信号码流对应的音频信号的特征因子、高频带编码信息以及能量比值。之后,解码装置从音频信号码流中提取音频信号的特征因子,使用音频信号的特征因子对音频信号码流进行低频带解码获得低频带信号,并使用高频带编码信息对音频信号码流进行高频带解码,获得高频带信号。解码装置根据特征因子确定去加重参数,并根据解码获得的高频带信号进行全带信号预测,获得第一全带信号S1,将信号S1经过频谱移动修正处理后,获得频谱移动修正处理后的第一全带信号S2,将信号S2经过频谱反折处理后,得到信号S3,然后采用根据特征因子确定的去加重参数对信号S3进行去加重处理,得到信号S4,计算获得S4的第一能量Ener0,可选地,对信号S4进行上采样处理得到信号S5,并对S5进行带通滤波处理得到信号S6,然后计算获得S6的第一能量Ener0。之后根据信号S4或S6、Ener0以及接收到的能量比值获得第二全带信号,然后根据该第二全带信号,解码获得的低频带信号以及高频带信号恢复音频信号码流对应的音频信号。
具体实现时,可采用core解码器使用特征因子对音频信号码流进行低频带解码以获得低频带信号,可采用SWB解码器对高频带编码信息进行高频带解码处理,以获得高频带信号,在获取高频带信号后,直接根据该高频带信号或者将该高频带信号乘以一个衰减因子后进行扩频预测获取第一全带信号,以及对该第一全带信号进行上述频谱移动修正处理,频谱反折处理,去加重处理,可选地,对去加重处理后的第一频带信号进行上采样处理和带通滤波处理,具体实现时可采用与图1所示方法实施例中的类似的处理实现方式,具体不再赘述。
上述根据信号S4或S6、Ener0以及接收到的能量比值获得第二全带信号,具体为根据能量比值R,和第一能量Ener0对第一全带信号进行能量调整,以恢复第二全带信号的能量Ener1=Ener0×R,进而根据第一全带信号的频谱与能量Ener1获得第二全带信号。
该方法实施例,通过解码装置使用音频信号码流中包括的音频信号的特征因子确定去加重参数对全带信号进行去加重处理,并且使用特征因子解码获得低频带信号,使得解码装置恢复的音频信号与原始音频输入信号更接近,具有更高的保真度。
图3为本发明实施例提供的编码装置实施例一的结构示意图,如图3所示,该编码装置300,包括:第一编码模块301、第二编码模块302、去加重处理模块303、计算模块304、带通处理模块305以及发送模块306,其中,
第一编码模块301,用于对音频输入信号的低频带信号进行编码,获得音频输入信号的特征因子;
其中,特征因子用于体现音频信号的特征,包括但不限于浊音度因子、谱倾斜、短时平均能量或短时过零率。
第二编码模块302,用于对音频输入信号的高频带信号进行编码和扩频预测获得第一全带信号;
去加重处理模块303,用于对第一全带信号进行去加重处理,其中,去加重处理中去加重参数根据特征因子确定;
计算模块304,用于计算获得去加重处理后的第一全带信号的第一能量;
带通处理模块305,用于对音频输入信号进行带通滤波处理,获得第二全带信号;
计算模块304,还用于计算获得第二全带信号的第二能量;以及,计算获得第二全带信号的第二能量与第一全带信号的第一能量的能量比值;
发送模块306,用于向解码装置发送对音频输入信号编码后的码流,码流中包括音频输入信号的特征因子、高频带编码信息以及能量比值。
进一步地,编码装置300,还包括去加重参数确定模块307,用于:
获得特征因子的个数;
根据特征因子以及特征因子的个数,确定特征因子的平均值;
根据特征因子的平均值确定去加重参数。
进一步地,第二编码模块302,具体用于:
根据高频带信号确定用于预测全带信号的LPC系数和全带激励信号;
对LPC系数和全带激励信号进行编码处理,获得第一全带信号。
进一步地,去加重处理模块303,具体用于:
对第二编码模块302获得的第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
对频谱反折处理后的第一全带信号进行去加重处理。
该实施例提供的编码装置,可用于执行图1所示方法实施例中的技术方案,其实现原理和技术效果类似,具体不再赘述。
图4为本发明实施例提供的解码装置实施例一的结构示意图,如图4所示,该解码装置400,包括:接收模块401、第一解码模块402、第二解码模块403、去加重处理模块404、计算模块405以及恢复模块406,其中,
接收模块401,用于接收编码装置发送的音频信号码流,音频信号码流中包括音频信号码流对应的音频信号的特征因子、高频带编码信息以及能量比值;
其中,特征因子用于体现音频信号的特征,包括但不限于浊音度因子、谱倾斜、短时平均能量或短时过零率。
第一解码模块402,用于使用特征因子对音频信号码流进行低频带解码,获得低频带信号;
第二解码模块403,用于使用高频带编码信息对音频信号码流进行高频带解码,获得高频带信号;以及,
对高频带信号进行扩频预测获得第一全带信号;
去加重处理模块404,用于对第一全带信号进行去加重处理,其中,去加重处理中加重参数根据特征因子确定;
计算模块405,用于计算获得去加重处理后的第一全带信号的第一能量;以及,根据音频信号码流中包括的能量比值、去加重处理后的第一全带信号以及第一能量获得第二全带信号,能力比值为第二全带信号的能量与第一能量的能量之比;
恢复模块406,用于根据第二全带信号、低频带信号以及高频带信号,恢复音频信号码流对应的音频信号。
进一步地,解码装置400,还包括去加重参数确定模块407,用于:
解码获得特征因子的个数;
根据特征因子以及特征因子的个数,确定特征因子的平均值;
根据特征因子的平均值确定去加重参数。
进一步地,第二解码模块403,具体用于:
根据高频带信号确定用于预测全带信号的LPC系数和全带激励信号;
对LPC系数和全带激励信号进行编码处理,获得第一全带信号。
进一步地,去加重处理模块404,具体用于:
对第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
对频谱反折处理后的第一全带信号进行去加重处理。
该实施例提供的解码装置,可用于执行图2所示方法实施例中的技术方案,其实现原理和技术效果类似,具体不再赘述。
图5为本发明实施例提供的编码装置实施例二的结构示意图,如图5所示,该编码装置500,包括:处理器501、存储器502以及通信接口503,其中,处理器501、存储器502以及通信接口503通过总线(图中粗实线所示)连接;
通信接口503用于接收音频信号的输入以及与解码装置进行通信,存储器502用于存储程序代码,处理器501用于调用存储器502存储的程序代码,以执行图1所示方法实施例中技术方案,其实现原理与技术效果类似,具体不再赘述。
图6为本发明实施例提供的编码装置实施例二的结构示意图,如图6所示,该解码装置600,包括:处理器601、存储器602以及通信接口603,其中,处理器601、存储器602以及通信接口603通过总线(图中粗实线所示)连接;
通信接口603用于与编码装置进行通信以及输出恢复的音频信号,存储器602用于存储程序代码,处理器601用于调用存储器602存储的程序代码,以执行图2所示方法实施例中技术方案,其实现原理与技术效果类似,具体不再赘述。
图7为本发明提供的编解码系统实施例的结构示意图,如图7所示,该编解码系统700,包括编码装置701,以及解码装置702,其中,编码装置701以及解码装置702,可以分别为图3所示的编码装置或图4所示的解码装置,可分别用于执行图1或图2所示的方法实施例中的技术方案,其实现原理和技术效果类似,具体不再赘述。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括RAM、ROM、EEPROM、CD-ROM或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外,任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光纤光缆、双绞线、数字用户线(DSL)或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电缆、光纤光缆、双绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在所属介质的定影中。如本发明所使用的,盘(Disk)和碟(disc)包括压缩光碟(CD)、激光碟、光碟、数字通用光碟(DVD)、软盘和蓝光光碟,其中盘通常磁性的复制数据,而碟则用激光来光学的复制数据。上面的组合也应当包括在计算机可读介质的保护范围之内。
此外,应理解,取决于实施例,本文中所述的方法中的任一者的某些动作或者事件可以按照不同的顺序执行,可以添加、合并或者一起省略(例如,为实现某些特定的目的,并非所有描述的动作或者事件都是必要的)。此外,在某些实施例中,动作或者事件可以经由多线程处理、中断处理或者多个处理器同时处理,上述同时处理可以是非顺序的执行。另外,处于清楚的考虑,本发明的具体实施例经描述为某单个步骤或者模块的功能,但应理解,本发明的技术可以是上述多个步骤或者模块的组合执行。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (20)
1.一种音频信号的编码方法,其特征在于,所述方法包括:
获得音频输入信号;
根据所述音频输入信号的低频带信号,获得所述音频输入信号的特征因子,根据所述音频输入信号的特征因子得到去加重参数;
对所述音频输入信号的高频带信号进行编码和预测,获得第一全带信号;
根据所述去加重参数对所述第一全带信号进行去加重处理,获得去加重后的第一全带信号;
计算获得所述去加重后的第一全带信号的能量;
对所述音频输入信号进行带通滤波处理,获得第二全带信号;
计算获得所述第二全带信号的能量;
计算获得所述第二全带信号的能量与所述去加重后的第一全带信号的能量的比值。
2.根据权利要求1所述的方法,所述音频输入信号的特征因子至少为两个,其特征在于,所述根据所述音频输入信号的特征因子得到去加重参数包括:
根据所述音频输入信号的特征因子获得特征因子平均值;
根据所述特征因子平均值得到所述去加重参数。
3.根据权利要求1所述的方法,其特征在于,所述对所述音频输入信号的高频带信号进行编码和预测,获得第一全带信号,包括:
确定线性预测编码LPC系数和全带激励信号;
对所述LPC系数和所述全带激励信号进行编码处理,获得所述第一全带信号。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述根据所述去加重参数对所述第一全带信号进行去加重处理包括:
对所述第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
对频谱反折处理后的第一全带信号进行去加重处理。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述特征因子包括浊音度因子或谱倾斜或短时平均能量或短时过零率。
6.一种音频信号的解码方法,其特征在于,所述方法包括:
接收音频信号码流,根据所述音频信号码流得到音频信号的特征因子、高频带编码信息以及能量比值;
根据所述特征因子获得低频带信号,根据所述特征因子得到去加重参数;
根据所述高频带编码信息获得高频带信号;
对所述高频带信号进行预测获得第一全带信号;
根据所述去加重参数对所述第一全带信号进行去加重处理;
计算获得去加重处理后的第一全带信号的能量;
根据所述能量比值、所述去加重处理后的第一全带信号以及所述去加重处理后的第一全带信号的能量获得第二全带信号,所述能量比值为所述第二全带信号的能量与所述去加重处理后的第一全带信号的的能量之比;
根据所述第二全带信号、所述低频带信号以及所述高频带信号,恢复所述音频信号码流对应的音频信号。
7.根据权利要求6所述的方法,所述特征因子至少为两个,其特征在于,所述根据所述特征因子得到去加重参数包括:
根据所述音频输入信号的特征因子获得特征因子平均值;
根据所述特征因子平均值得到所述去加重参数。
8.根据权利要求6所述的方法,其特征在于,所述对所述高频带信号进行预测获得第一全带信号,包括:
确定线性预测编码LPC系数和全带激励信号;
对所述LPC系数和所述全带激励信号进行编码处理,获得所述第一全带信号。
9.根据权利要求6至8任一项所述的方法,其特征在于,所述根据所述去加重参数对所述第一全带信号进行去加重处理,包括:
对所述第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
对频谱反折处理后的第一全带信号进行去加重处理。
10.根据权利要求6至8任一项所述的方法,其特征在于,所述特征因子包括浊音度因子或谱倾斜或短时平均能量或短时过零率。
11.一种音频信号的编码装置,其特征在于,所述装置包括:
第一编码模块,用于获得音频输入信号,
根据所述音频输入信号的低频带信号,获得所述音频输入信号的特征因子,根据所述音频输入信号的特征因子得到去加重参数;
第二编码模块,对所述音频输入信号的高频带信号进行编码和预测,获得第一全带信号;
去加重处理模块,根据所述去加重参数对所述第一全带信号进行去加重处理,获得去加重后的第一全带信号;
计算模块,用于计算获得所述去加重后的第一全带信号的能量;
带通处理模块,用于对所述音频输入信号进行带通滤波处理,获得第二全带信号;
所述计算模块,还用于计算获得所述第二全带信号的能量;以及,
计算获得所述第二全带信号的能量与所述去加重后的第一全带信号的能量的比值。
12.根据权利要求11所述编码装置,所述音频输入信号的特征因子至少为两个,其特征在于,所述第一编码模块具体用于:
获得音频输入信号,根据所述音频输入信号的低频带信号,获得所述音频输入信号的特征因子;
根据所述音频输入信号的特征因子获得特征因子平均值,根据所述特征因子平均值得到所述去加重参数。
13.根据权利要求11所述的编码装置,其特征在于,所述第二编码模块,具体用于:
确定线性预测编码LPC系数和全带激励信号;
对所述LPC系数和所述全带激励信号进行编码处理,获得所述第一全带信号。
14.根据权利要求11至13任一项所述的编码装置,其特征在于,所述去加重处理模块,具体用于:
对所述第二编码模块获得的第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
对频谱反折处理后的第一全带信号进行去加重处理。
15.根据权利要求11至13任一项所述的编码装置,其特征在于,所述特征因子包括浊音度因子或谱倾斜或短时平均能量或短时过零率。
16.一种音频信号的解码装置,其特征在于,包括:
接收模块,用于接收音频信号码流,根据所述音频信号码流得到音频信号的特征因子、高频带编码信息以及能量比值;
第一解码模块,用于根据所述特征因子获得低频带信号,根据所述特征因子得到去加重参数;
第二解码模块,用于根据所述高频带编码信息获得高频带信号;以及,
对所述高频带信号进行预测获得第一全带信号;
去加重处理模块,用于根据所述去加重参数对所述第一全带信号进行去加重处理;
计算模块,用于计算获得去加重处理后的第一全带信号的能量;以及,
根据所述能量比值、所述去加重处理后的第一全带信号以及所述去加重处理后的第一全带信号的能量获得第二全带信号,所述能量比值为所述第二全带信号的能量与所述去加重处理后的第一全带信号的能量的能量之比;
恢复模块,用于根据所述第二全带信号、所述低频带信号以及所述高频带信号,恢复所述音频信号码流对应的音频信号。
17.根据权利要求16所述的解码装置,所述特征因子至少为两个,其特征在于,所述第一解码模块具体用于:
根据所述特征因子获得低频带信号;
根据所述音频输入信号的特征因子获得特征因子平均值;
根据所述特征因子平均值得到所述去加重参数。
18.根据权利要求16所述的解码装置,其特征在于,所述第二解码模块,具体用于:
确定线性预测编码LPC系数和全带激励信号;
对所述LPC系数和所述全带激励信号进行编码处理,获得所述第一全带信号。
19.根据权利要求16至18任一项所述的解码装置,其特征在于,所述去加重处理模块,具体用于:
对所述第一全带信号进行频谱移动修正,并对修正后的第一全带信号进行频谱反折处理;
对频谱反折处理后的第一全带信号进行去加重处理。
20.根据权利要求16至18任一项所述的解码装置,其特征在于,所述特征因子包括浊音度因子或谱倾斜或短时平均能量或短时过零率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610617731.XA CN106228991B (zh) | 2014-06-26 | 2014-06-26 | 编解码方法、装置及系统 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410294752.3A CN105225671B (zh) | 2014-06-26 | 2014-06-26 | 编解码方法、装置及系统 |
CN201610617731.XA CN106228991B (zh) | 2014-06-26 | 2014-06-26 | 编解码方法、装置及系统 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410294752.3A Division CN105225671B (zh) | 2014-06-26 | 2014-06-26 | 编解码方法、装置及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106228991A CN106228991A (zh) | 2016-12-14 |
CN106228991B true CN106228991B (zh) | 2019-08-20 |
Family
ID=54936715
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410294752.3A Active CN105225671B (zh) | 2014-06-26 | 2014-06-26 | 编解码方法、装置及系统 |
CN201610617731.XA Active CN106228991B (zh) | 2014-06-26 | 2014-06-26 | 编解码方法、装置及系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410294752.3A Active CN105225671B (zh) | 2014-06-26 | 2014-06-26 | 编解码方法、装置及系统 |
Country Status (15)
Country | Link |
---|---|
US (3) | US9779747B2 (zh) |
EP (2) | EP3133600B1 (zh) |
JP (1) | JP6496328B2 (zh) |
KR (1) | KR101906522B1 (zh) |
CN (2) | CN105225671B (zh) |
AU (1) | AU2015281686B2 (zh) |
BR (1) | BR112016026440B8 (zh) |
CA (1) | CA2948410C (zh) |
DE (2) | DE202015009916U1 (zh) |
HK (1) | HK1219802A1 (zh) |
MX (1) | MX356315B (zh) |
MY (1) | MY173513A (zh) |
RU (1) | RU2644078C1 (zh) |
SG (1) | SG11201609523UA (zh) |
WO (1) | WO2015196835A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PT2951819T (pt) * | 2013-01-29 | 2017-06-06 | Fraunhofer Ges Forschung | Aparelho, método e meio computacional para sintetizar um sinal de áudio |
CN105978540B (zh) * | 2016-05-26 | 2018-09-18 | 英特格灵芯片(天津)有限公司 | 一种连续时间信号的去加重处理电路及其方法 |
CN106601267B (zh) * | 2016-11-30 | 2019-12-06 | 武汉船舶通信研究所 | 一种基于超短波fm调制的语音增强方法 |
CN112885364B (zh) * | 2021-01-21 | 2023-10-13 | 维沃移动通信有限公司 | 音频编码方法和解码方法、音频编码装置和解码装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1253418A (zh) * | 1998-10-29 | 2000-05-17 | 松下电器产业株式会社 | 用于音频变换编码的块尺寸确定和自适应方法 |
US6912496B1 (en) * | 1999-10-26 | 2005-06-28 | Silicon Automation Systems | Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
CN1957398A (zh) * | 2004-02-18 | 2007-05-02 | 沃伊斯亚吉公司 | 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备 |
KR100789368B1 (ko) * | 2005-05-30 | 2007-12-28 | 한국전자통신연구원 | 잔차 신호 부호화 및 복호화 장치와 그 방법 |
WO2009096717A2 (ko) * | 2008-01-29 | 2009-08-06 | Samsung Electronics Co., Ltd. | 오디오 신호의 부호화, 복호화 방법 및 장치 |
CN101611634A (zh) * | 2007-02-14 | 2009-12-23 | 松下电器产业株式会社 | Mems麦克风装置 |
CN101790757A (zh) * | 2007-08-27 | 2010-07-28 | 爱立信电话股份有限公司 | 语音与音频信号的改进的变换编码 |
CN102737646A (zh) * | 2012-06-21 | 2012-10-17 | 佛山市瀚芯电子科技有限公司 | 单一麦克风的实时动态语音降噪方法 |
US8457688B2 (en) * | 2009-02-26 | 2013-06-04 | Research In Motion Limited | Mobile wireless communications device with voice alteration and related methods |
EP2795618A1 (fr) * | 2011-12-20 | 2014-10-29 | Orange | Procédé de détection d'une bande de fréquence prédéterminée dans un signal de données audio, dispositif de détection et programme d'ordinateur correspondant |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9886959B2 (en) * | 2005-02-11 | 2018-02-06 | Open Invention Network Llc | Method and system for low bit rate voice encoding and decoding applicable for any reduced bandwidth requirements including wireless |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
WO2007040353A1 (en) * | 2005-10-05 | 2007-04-12 | Lg Electronics Inc. | Method and apparatus for signal processing |
US20070299655A1 (en) * | 2006-06-22 | 2007-12-27 | Nokia Corporation | Method, Apparatus and Computer Program Product for Providing Low Frequency Expansion of Speech |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
JP4984983B2 (ja) * | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
ATE518224T1 (de) | 2008-01-04 | 2011-08-15 | Dolby Int Ab | Audiokodierer und -dekodierer |
US8433582B2 (en) | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
JP4818335B2 (ja) * | 2008-08-29 | 2011-11-16 | 株式会社東芝 | 信号帯域拡張装置 |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
CN101521014B (zh) * | 2009-04-08 | 2011-09-14 | 武汉大学 | 音频带宽扩展编解码装置 |
EP2249334A1 (en) | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
EP2559028B1 (en) | 2010-04-14 | 2015-09-16 | VoiceAge Corporation | Flexible and scalable combined innovation codebook for use in celp coder and decoder |
TWI516138B (zh) * | 2010-08-24 | 2016-01-01 | 杜比國際公司 | 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品 |
CN102800317B (zh) | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
CN104221081B (zh) * | 2011-11-02 | 2017-03-15 | 瑞典爱立信有限公司 | 带宽扩展音频信号的高频带扩展的生成 |
CN105976830B (zh) | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
CN103928031B (zh) * | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
-
2014
- 2014-06-26 CN CN201410294752.3A patent/CN105225671B/zh active Active
- 2014-06-26 CN CN201610617731.XA patent/CN106228991B/zh active Active
-
2015
- 2015-03-20 RU RU2016151460A patent/RU2644078C1/ru active
- 2015-03-20 DE DE202015009916.5U patent/DE202015009916U1/de active Active
- 2015-03-20 DE DE202015009942.4U patent/DE202015009942U1/de active Active
- 2015-03-20 CA CA2948410A patent/CA2948410C/en active Active
- 2015-03-20 MY MYPI2016704099A patent/MY173513A/en unknown
- 2015-03-20 AU AU2015281686A patent/AU2015281686B2/en active Active
- 2015-03-20 JP JP2016574888A patent/JP6496328B2/ja active Active
- 2015-03-20 KR KR1020167032571A patent/KR101906522B1/ko active IP Right Grant
- 2015-03-20 WO PCT/CN2015/074704 patent/WO2015196835A1/zh active Application Filing
- 2015-03-20 EP EP15812214.3A patent/EP3133600B1/en active Active
- 2015-03-20 SG SG11201609523UA patent/SG11201609523UA/en unknown
- 2015-03-20 EP EP19177798.6A patent/EP3637416A1/en active Pending
- 2015-03-20 MX MX2016015526A patent/MX356315B/es active IP Right Grant
- 2015-03-20 BR BR112016026440A patent/BR112016026440B8/pt active IP Right Grant
-
2016
- 2016-07-05 HK HK16107771.2A patent/HK1219802A1/zh unknown
- 2016-12-27 US US15/391,339 patent/US9779747B2/en active Active
-
2017
- 2017-09-06 US US15/696,591 patent/US10339945B2/en active Active
-
2019
- 2019-05-22 US US16/419,777 patent/US10614822B2/en active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1253418A (zh) * | 1998-10-29 | 2000-05-17 | 松下电器产业株式会社 | 用于音频变换编码的块尺寸确定和自适应方法 |
US6912496B1 (en) * | 1999-10-26 | 2005-06-28 | Silicon Automation Systems | Preprocessing modules for quality enhancement of MBE coders and decoders for signals having transmission path characteristics |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
CN1957398A (zh) * | 2004-02-18 | 2007-05-02 | 沃伊斯亚吉公司 | 在基于代数码激励线性预测/变换编码激励的音频压缩期间低频加重的方法和设备 |
KR100789368B1 (ko) * | 2005-05-30 | 2007-12-28 | 한국전자통신연구원 | 잔차 신호 부호화 및 복호화 장치와 그 방법 |
CN101611634A (zh) * | 2007-02-14 | 2009-12-23 | 松下电器产业株式会社 | Mems麦克风装置 |
CN101790757A (zh) * | 2007-08-27 | 2010-07-28 | 爱立信电话股份有限公司 | 语音与音频信号的改进的变换编码 |
WO2009096717A2 (ko) * | 2008-01-29 | 2009-08-06 | Samsung Electronics Co., Ltd. | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US8457688B2 (en) * | 2009-02-26 | 2013-06-04 | Research In Motion Limited | Mobile wireless communications device with voice alteration and related methods |
EP2795618A1 (fr) * | 2011-12-20 | 2014-10-29 | Orange | Procédé de détection d'une bande de fréquence prédéterminée dans un signal de données audio, dispositif de détection et programme d'ordinateur correspondant |
CN102737646A (zh) * | 2012-06-21 | 2012-10-17 | 佛山市瀚芯电子科技有限公司 | 单一麦克风的实时动态语音降噪方法 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7177185B2 (ja) | 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス | |
CN101305423B (zh) | 自适应的基于时间/频率的音频编码和解码设备和方法 | |
RU2636685C2 (ru) | Решение относительно наличия/отсутствия вокализации для обработки речи | |
JP6185085B2 (ja) | 利得制御を行うシステムおよび方法 | |
CN109147806B (zh) | 基于深度学习的语音音质增强方法、装置和系统 | |
CN106228991B (zh) | 编解码方法、装置及系统 | |
JP2007523372A (ja) | エンコーダ、エンコーダを有するデバイス、エンコーダを有するシステム、周波数バンドのオーディオ信号を圧縮する方法、モジュール、およびコンピュータプログラム製品 | |
KR20160044025A (ko) | 대역폭 확장 방법 및 장치 | |
JP6526096B2 (ja) | 平均符号化レートを制御するためのシステムおよび方法 | |
CN100555414C (zh) | 一种dtx判决方法和装置 | |
CN104969291A (zh) | 执行用于增益确定的滤波的系统及方法 | |
JP6141443B2 (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 | |
KR101248535B1 (ko) | 배경 노이즈 생성 방법 및 노이즈 처리 장치 | |
JP2017517034A (ja) | 音声/オーディオ信号を処理するための方法および装置 | |
CN106463140B (zh) | 具有语音信息的改进型帧丢失矫正 | |
CN104637486B (zh) | 一种数据帧的内插方法及装置 | |
WO2021032719A1 (en) | Multi-lag format for audio coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200731 Address after: Houston, USA Patentee after: Chaoqing codec Co., Ltd Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd. |
|
TR01 | Transfer of patent right |