CN101518083A - 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法、介质和系统 - Google Patents
通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法、介质和系统 Download PDFInfo
- Publication number
- CN101518083A CN101518083A CNA200780035230XA CN200780035230A CN101518083A CN 101518083 A CN101518083 A CN 101518083A CN A200780035230X A CNA200780035230X A CN A200780035230XA CN 200780035230 A CN200780035230 A CN 200780035230A CN 101518083 A CN101518083 A CN 101518083A
- Authority
- CN
- China
- Prior art keywords
- signal
- coding
- band signal
- decoding
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 257
- 230000005236 sound signal Effects 0.000 title claims abstract description 108
- 238000013139 quantization Methods 0.000 claims abstract description 104
- 238000002156 mixing Methods 0.000 claims abstract description 83
- 238000006243 chemical reaction Methods 0.000 claims description 288
- 230000008859 change Effects 0.000 claims description 19
- 238000001914 filtration Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 17
- 230000011218 segmentation Effects 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 16
- 230000006872 improvement Effects 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 abstract 1
- 238000001228 spectrum Methods 0.000 description 84
- 230000015572 biosynthetic process Effects 0.000 description 35
- 238000003786 synthesis reaction Methods 0.000 description 35
- 230000003595 spectral effect Effects 0.000 description 16
- 230000008901 benefit Effects 0.000 description 13
- 230000001052 transient effect Effects 0.000 description 12
- 238000012545 processing Methods 0.000 description 11
- 239000002131 composite material Substances 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供了这样一种对音频信号编码和/或解码的方法、介质和系统:从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频,成为下混频的信号;将下混频的信号分割为低带信号和高带信号;将低带信号和高带信号中的每一个从时域转换到频域;通过对转换的低带信号执行量化和基于上下文的编码产生编码的位平面;通过使用转换的低带信号产生并编码表示转换的高带信号的特性的带宽扩展信息;输出编码的立体声参数、编码的位平面和编码的带宽扩展信息。因此,可以以潜在限制的位率对立体声分量和高频分量有效编码并解码,从而提高音频信号的质量。
Description
技术领域
本发明的一个或多个实施例涉及对音频信号编码和/或解码的方法、介质和系统,更具体地,涉及通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法、介质和系统。
背景技术
当音频信号被编码或解码时,通常应通过使用限制的位率最大化音频信号的质量。低位率的可用位的数量很小,从而必须通过减小音频信号的频带宽度来编码或解码音频信号。因此,音频信号的质量会恶化。
通常,与高频分量相比,低频分量对于人类识别音频信号更加重要。因此,如在此阐述的,本发明的发明人确定了通过增加分配用于对低频分量编码的位的数量并通过减少分配用于对高频分量编码的位的数量的方法是被期望和有效的。
此外,与具有单通道的单信号相比,更多数量的位被分配用于对具有两个或更多通道的立体声信号编码或解码。因此,类似地,如在此阐述的,本发明的发明人确定了减少分配用于对立体声信号编码的位的数量并提高立体声信号的质量的方法是被期望和有效的。
发明内容
技术问题
本发明的一个或多个实施例提供了一种使音频信号质量提高的对音频信号编码的方法、介质和系统,其中,以限制的位率对立体声分量和高频分量进行有效编码。
本发明的一个或多个实施例还提供了一种可对来自以限制的位率编码的位流的高频分量和立体声分量进行有效解码的方法、介质和系统。
技术方案
根据本发明的一方面,提供了一种对音频信号编码的方法,方法包括:(a)从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频,成为下混频的信号;(b)将下混频的信号分割为低带信号和高带信号;(c)将低带信号和高带信号中的每一个从时域转换到频域;(d)通过对转换的低带信号执行量化和基于上下文的编码产生编码的位平面;(e)通过使用转换的低带信号产生表示转换的高带信号的特性的带宽扩展信息,并对所述带宽扩展信息编码;以及(f)输出编码的立体声参数、编码的位平面和编码的带宽扩展信息作为对输入信号编码的结果。
根据本发明的另一方面,提供了一种对音频信号编码的方法,方法包括:(a)从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频以成为下混频的信号;(b)将下混频的信号分割为低带信号和高带信号;(c)通过使用第一转换方法将低带信号从时域转换到频域;(d)通过对通过使用第一转换方法转换到频域的低带信号执行量化和基于上下文的编码产生编码的位平面;(e)通过使用第二转换方法将低带信号和高带信号中的每一个从时域转换到频域或时/频域;(f)通过使用通过第二转换方法转换的低带信号产生表示通过第二转换方法转换的高带信号的特性的带宽扩展信息,并对所述带宽扩展信息编码;以及(g)输出编码的立体声参数、编码的位平面和编码的带宽扩展信息作为对输入信号编码的结果。
根据本发明的另一方面,提供了一种对音频信号编码的方法,方法包括:(a)从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频以成为下混频的信号;(b)将下混频的信号分割为低带信号和高带信号;(c)确定在时域中还是在频域中对低带信号编码;(d)如果确定在时域中对低带信号编码,则在时域中对低带信号编码;(e)如果确定在频域中对低带信号编码,则通过使用第一转换方法将低带信号从时域转换到频域来产生编码的位平面,并对通过使用第一转换方法被转换到频域的低带信号执行量化和基于上下文的编码;(f)通过使用第二转换方法将低带信号和高带信号中的每一个从时域转换到频域或时/频域;(g)通过使用通过第二转换方法转换的低带信号产生表示通过第二转换方法转换的高带信号的特性的带宽扩展信息,并对所述带宽扩展信息编码;以及(h)输出编码的立体声参数、编码的位平面和编码的带宽扩展信息作为对输入信号编码的结果。
根据本发明的另一方面,提供了一种具有实现对音频信号编码的方法的计算机可读代码的计算机可读介质,方法包括:(a)从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频,成为下混频的信号;(b)将下混频的信号分割为低带信号和高带信号;(c)确定在时域中还是在频域中对低带信号编码;(d)如果确定在时域中对低带信号编码,则在时域中对低带信号编码;(e)如果确定在频域中对低带信号编码,则通过使用第一转换方法将低带信号从时域转换到频域来产生编码的位平面,并对通过使用第一转换方法转换到频域的低带信号执行量化和基于上下文的编码;(f)通过使用第二转换方法将低带信号和高带信号中的每一个从时域转换到频域或时/频域;(g)通过使用通过第二转换方法转换的低带信号产生表示通过第二转换方法转换的高带信号的特性的带宽扩展信息,并对所述带宽扩展信息编码;以及(h)输出编码的立体声参数、编码的位平面和编码的带宽扩展信息作为对输入信号编码的结果。
根据本发明的另一方面,提供了一种对音频信号编码的方法,方法包括:(a)将输入信号从时域转换到频域;(b)从转换的信号提取立体声参数,对立体声参数编码,并对转换的信号执行下混频以成为下混频的信号;(c)从下混频的信号提取带宽扩展信息并对带宽扩展信息编码;(d)将下混频的信号逆转换到时域;(e)确定在时域中还是在频域中对逆转换的信号编码,并根据确定的结果通过子带将逆转换的信号转换到时域或频域;(f)如果确定在时域中对逆转换的信号编码,则在时域中对转换到时域的信号编码;(g)如果确定在频域中对逆转换的信号编码,则通过对转换到频域的信号执行量化和基于上下文的编码来产生编码的位平面;以及(h)输出编码的立体声参数、编码的带宽扩展信息、在时域中的编码结果和编码的位平面作为对输入信号编码的结果。
根据本发明的另一方面,提供了一种对音频信号编码的方法,方法包括:(a)确定在时域中还是在频域中对输入信号编码,并根据确定的结果通过子带将输入信号转换到时域或频域;(b)从转换的信号提取立体声参数,对立体声参数编码,并对转换的信号执行下混频以成为下混频的信号;(c)从下混频的信号提取带宽扩展信息并对带宽扩展信息编码;(d)如果确定在时域中对下混频的信号编码,则在时域中对下混频的信号编码;(e)如果确定在频域中对下混频的信号编码,则通过对下混频的信号执行量化和基于上下文的编码来产生编码的位平面;以及(f)输出编码的立体声参数、编码的带宽扩展信息、在时域中的编码结果和编码的位平面作为对输入信号编码的结果。
根据本发明的另一方面,提供了一种对音频信号解码的方法,方法包括:(a)接收编码的音频数据;(b)通过对包括在编码的音频信号中的编码的位平面执行基于上下文的解码和反量化来产生低带信号;(c)对包括在编码的音频信号中的编码的带宽扩展信息解码,并通过使用解码的带宽扩展信息从低带信号产生高带信号;(d)通过使用第一转换方法将低带信号和高带信号中的每一个从频域逆转换到时域;(e)将逆转换的低带信号与逆转换的高带信号组合;以及(f)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
根据本发明的另一方面,提供了一种对音频信号解码的方法,方法包括:(a)接收编码的音频数据;(b)通过对包括在编码的音频信号中的编码的位平面执行基于上下文的解码和反量化来产生低带信号;(c)通过使用第一逆转换方法将低带信号从频域逆转换到时域;(d)通过使用第一转换方法将通过第一逆转换方法逆转换的低带信号转换到频域或时/频域;(e)将包括在编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从通过第一转换方法转换到频域或时/频域的低带信号产生高带信号;(f)通过使用第二转换方法将高带信号逆转换到时域;(g)将转换的低带信号与逆转换的高带信号组合;以及(h)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
根据本发明的另一方面,提供了一种对音频信号解码的方法,方法包括:(a)接收时域或频域的解码的音频数据;(b)通过对包括在频域的编码的音频信号中的编码的位平面执行基于上下文的解码和反量化来产生低带信号;(c)通过使用第一逆转换方法将低带信号逆转换到时域;(d)将通过使用第一逆转换方法逆转换到时域的低带信号转换到频域或时/频域;(e)将包括在频域的编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从通过第一转换方法转换到频域或时/频域的低带信号产生高带信号;(f)通过使用第二逆转换方法将高带信号逆转换到时域;(g)通过对时域中的时域的编码的音频信号解码来产生低带信号;(h)对通过第一逆转换方法逆转换到时域的信号、通过第二逆转换方法逆转换到时域的高带信号以及在时域中解码的低带信号进行组合;以及(i)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
根据本发明的另一方面,提供了一种具有实现对音频信号解码的方法的计算机可读代码的计算机可读介质,方法包括:(a)接收时域或频域的解码的音频数据;(b)通过对包括在频域的编码的音频信号中的编码的位平面执行基于上下文的解码和反量化来产生低带信号;(c)通过使用第一逆转换方法将低带信号逆转换到时域;(d)将通过使用第一逆转换方法逆转换到时域的低带信号转换到频域或时/频域;(e)将包括在频域的编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从通过第一转换方法转换到频域或时/频域的低带信号产生高带信号;(f)通过使用第二逆转换方法将高带信号逆转换到时域;(g)通过对时域中的时域的编码的音频信号解码来产生低带信号;(h)对通过第一逆转换方法逆转换到时域的信号、通过第二逆转换方法逆转换到时域的高带信号以及在时域中解码的低带信号进行组合;以及(i)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
根据本发明的另一方面,提供了一种对音频信号解码的方法,方法包括:(a)接收时域或频域的编码的音频数据;(b)对包括在频域的编码的音频信号中的编码的位平面执行基于上下文的解码和反量化;(c)在时域中对时域的编码的音频信号解码;(d)通过对步骤(b)中反量化的信号或步骤(c)中解码的信号执行频变调制重叠变换(FV-MLT)来将步骤(b)中反量化的信号或步骤(c)中解码的信号逆转换到时域;(e)将逆转换的低带信号转换到频域或时/频域;(f)将包括在频域的编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从转换到频域或时/频域的信号产生全带信号;(g)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对全带信号执行上混频;以及(h)将执行了上混频的信号逆转换到时域。
根据本发明的另一方面,提供了一种对音频信号解码的方法,方法包括:(a)接收时域或频域的编码的音频数据;(b)对包括在频域的编码的音频信号中的编码的位平面执行基于上下文的解码和反量化;(c)在时域中对时域的编码的音频信号解码;(d)通过对步骤(c)中解码的信号执行改进离散余弦变换(MDCT)来将步骤(c)中解码的信号从时域转换到频域;(e)将包括在频域的编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从步骤(b)中执行了基于上下文的解码的信号或步骤(d)中转换到频域的信号产生全带信号;(f)将包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对全带信号执行上混频;以及(g)通过对执行了上混频的信号执行逆频变调制重叠变换(FV-MLT)来将执行了上混频的信号逆转换到时域。
根据本发明的另一方面,提供了一种对音频信号编码的系统,系统包括:立体声编码单元,从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频;带分割单元,将执行了下混频的信号分割为低带信号和高带信号;模式确定单元,确定在时域中还是在频域中对低带信号编码;码激励线性预测(CELP)编码单元,如果确定在时域中对低带信号编码,则通过使用CELP编码方法对低带信号编码;改进离散余弦变换(MDCT)应用单元,如果确定在频域中对低带信号编码,则通过对低带信号执行MDCT将低带信号从时域转换到频域;低带编码单元,通过对执行了MDCT的低带信号执行量化和基于上下文的编码来产生编码的位平面;转换单元,将低带信号和高带信号中的每一个从时域转换到频域或时/频域;带宽扩展编码单元,通过使用转换的低带信号产生并编码表示转换的高带信号的特性的带宽扩展信息。
根据本发明的另一方面,提供了一种对音频信号解码的系统,系统包括:低带解码单元,通过对在频域中编码的位平面执行基于上下文的解码和反量化来产生低带信号;逆改进离散余弦变换(MDCT)应用单元,通过对低带信号执行逆MDCT将低带信号逆转换到时域;转换单元,将执行了逆MDCT的低带信号转换到频域或时/频域;带宽扩展解码单元,将在频域中编码的编码的带宽扩展信息解码,并通过使用解码的带宽扩展信息从转换到频域或时/频域的低带信号产生高带信号;码激励线性预测(CELP)解码单元,通过使用CELP解码方法通过对CELP编码信息解码来产生低带信号;带组合单元,对执行了逆MDCT的信号、逆转换到时域的高带信号以及使用CELP解码方法解码的低带信号进行组合;立体声解码单元,对编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
附图说明
通过结合附图对实施例进行的以下描述,本发明的这些和/或其它方面和优点将会变得清楚并更加易于理解,其中:
图1到图6示出根据本发明示例性实施例的对音频信号编码的系统;
图7到图12示出根据本发明示例性实施例的对音频信号解码的系统;
图13到图17示出根据本发明示例性实施例的对音频信号编码的方法;和
图18到图22示出根据本发明示例性实施例的对音频信号解码的方法。
具体实施方式
发明模式
现在,详细描述本发明的实施例,其示例在附图中表示,其中,相同的标号始终表示相同的部件。这种情况下,本发明的实施例可以以各种不同形式实施,且不应理解为受限于在此列出的实施例。因此,以下的实施例仅是描述的目的,通过参照附图以解释本发明的各方面。
图1示出根据本发明实施例的对音频信号编码的系统。
参照图1,系统可包括立体声编码单元100、带分割单元110、第一改进离散余弦变换(MDCT)应用单元120、频率线性预测性能单元130、多分辨率分析单元140、量化单元150、基于上下文的位平面编码单元160、第二MDCT应用单元170、带宽扩展编码单元180和复用单元190,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
立体声编码单元100可从输入信号IN提取立体声或复数、参数,对立体声参数编码,并对输入信号IN执行下混频。这里,输入信号IN可以是其中模拟语音或音频信号被调制为数字信号的脉冲编码调制(PCM)信号,下混频例如是用于从具有两个或更多通道的立体声信号产生具有一个通道的单信号的断裂(collapsing)处理。通过执行这种下混频,分配用于对输入信号IN编码的位的总量可被减小。
更详细地,立体声参数可包括关于立体声信号的边信息。这里,还应该了解边信息可包括左通道和右通道信号的各条信息,诸如通道的相位差或强度差。
带分割单元110可将下混频的信号分割为低带信号LB和高带信号HB。这里,低带信号LB可以是例如比预定的阈值低的频率信号,高带信号HB可以是例如比示例预定的阈值高的频率信号,注意还有其它的选择。
第一MDCT应用单元120还可对带分割单元110分割的低带信号LB执行MDCT,从而将低带信号LB从时域转换到频域。这里,时域表示根据时间的输入信号IN(诸如,输入信号IN的能量或声压)在幅度的变化,频域表示根据频率的输入信号IN在幅度的变化。
频率线性预测性能单元130可对频域低带信号执行频率线性预测。这里,频率线性预测将当前频率信号逼近之前频率信号的线性组合。更详细地,频率线性预测性能单元130可计算线性预测滤波器的系数,从而将作为线性预测的信号与当前频率信号之间的差的预测误差最小化,并根据计算的系数对频域低带信号LB执行线性预测滤波。这里,频率线性预测性能单元130可通过对线性预测滤波器的系数的相应值执行矢量量化以使用矢量指教表示所述相应值来提高编码效率,注意其它可选实施例是可用的。
更详细地,如果频域低带信号LB是语音信号或基频(pitched)信号,则频率线性预测性能单元130可对语音信号或基频信号执行频率线性预测。也就是说,频率线性预测性能单元130还可根据接收信号的特性通过选择性地执行频率线性预测来提高编码效率。
多分辨率分析单元140可接收频域低带信号LB或频率线性预测性能单元130的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率分析。更详细地,多分辨率分析单元140可根据音频频谱变化的强度,通过将音频频谱划分为两种类型(例如,稳定类型和短类型)来对频率线性预测性能单元130滤波的音频频谱执行多分辨率分析。
更详细地,例如,如果频域低带信号LB或频率线性预测性能单元130的结果是瞬时信号,则多分辨率分析单元140可对瞬时信号执行多分辨率分析。也就是说,多分辨率分析单元140还可根据接收信号的特性通过执行多分辨率分析来选择性地提高编码效率。
量化单元150可量化例如频率线性预测性能单元130或多分辨率分析单元140的结果。
基于上下文的位平面编码单元160可对量化单元150的结果执行基于上下文的编码,从而产生编码的位平面。这里,基于上下文的位平面编码单元160可通过使用例如Huffman编码方法执行基于上下文的编码,注意还有其它选择。
因此,频率线性预测性能单元130、多分辨率分析单元140、量化单元150和基于上下文的位平面编码单元160可对频域低带信号LB编码,从而可被统称为低带编码单元。
第二MDCT应用单元170可对带分割单元110分割的高带信号HB执行MDCT,从而将高带信号HB从时域转换到频域。
为了发送频域高带信号HB的分量,带宽扩展编码单元180可通过使用例如通过第一MDCT应用单元120转换到频域的频域低带信号LB来产生和编码表示频域高带信号HB的特征的带宽扩展信息。这里,应该了解带宽扩展信息可包括高带信号HB的各条信息,诸如能级和包络。更详细地,带宽扩展编码单元180可基于低带信号LB与高带信号HB之间存在强相关性的事实通过使用关于低带信号LB的信息来产生带宽扩展信息。根据本发明的另一实施例,带宽扩展编码单元180可通过使用例如对低带信号LB编码的结果来产生带宽扩展信息。
复用单元190还可通过复用例如立体声编码单元100、频率线性预测性能单元130、位平面编码单元160和带宽扩展编码单元180的编码结果来产生位流,从而将位流输出为输出信号OUT。
图2示出根据本发明另一实施例的对音频信号编码的系统。
参照图2,系统可包括立体声编码单元200、带分割单元210、MDCT应用单元220、频率线性预测性能单元230、多分辨率分析单元240、量化单元250、基于上下文的位平面编码单元260、低带转换单元270、高带转换单元275、带宽扩展编码单元280和复用单元290,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
立体声编码单元200可从输入信号IN提取立体声或复数、参数,对立体声参数编码,并对输入信号IN执行下混频。
带分割单元210可将下混频的信号分割为示例的低带信号LB和高带信号HB。
MDCT应用单元220可对带分割单元210分割的低带信号LB执行MDCT,从而将低带信号LB从时域转换到频域。
频率线性预测性能单元230还可对频域低带信号LB执行频率线性预测。这里,频率线性预测可将当前频率信号逼近之前频率信号的线性组合。更详细地,在实施例中,频率线性预测性能单元230可计算线性预测滤波器的系数,从而将作为线性预测的信号与当前频率信号之间的差的预测误差最小化,并根据计算的系数对转换到频域的低带信号LB执行线性预测滤波。这里,例如,频率线性预测性能单元230还可通过对通过使用矢量指数表示线性预测滤波器的系数的相应值执行矢量量化以通过使用矢量指数表示所述相应值来提高编码效率。
更详细地,如果频域低带信号LB是语音信号或基频信号,则频率线性预测性能单元230可对语音信号或基频信号选择性地执行频率线性预测。也就是说,频率线性预测性能单元230可根据接收信号的特性通过执行频率线性预测来选择性地提高编码效率。
多分辨率分析单元240可接收MDCT应用单元220或频率线性预测性能单元230的输出结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率分析。更详细地,在一个实施例中,多分辨率分析单元240可根据例如音频频谱变化的强度,通过将音频频谱划分为两种类型(诸如,稳定类型和短类型)来对频率线性预测性能单元230滤波的音频频谱执行多分辨率分析。
更详细地,例如,如果频域低带信号LB或频率线性预测性能单元230的结果是瞬时信号,则多分辨率分析单元240可对瞬时信号执行多分辨率分析。也就是说,多分辨率分析单元240可根据接收信号的特性通过执行多分辨率分析来选择性地提高编码效率。
量化单元250可量化例如频率线性预测性能单元230或多分辨率分析单元240的结果。
基于上下文的位平面编码单元260还可对量化单元250的结果执行基于上下文的编码,从而产生编码的位平面。这里,基于上下文的位平面编码单元260可通过使用例如Huffman编码方法执行基于上下文的编码,注意还有其它选择。
因此,例如频率线性预测性能单元230、多分辨率分析单元240、量化单元250和基于上下文的位平面编码单元260可对频域低带信号LB编码,从而在实施例中可被统称为低带编码单元。
根据实施例,低带转换单元270可通过使用除MDCT方法之外的转换方法将例如由带分割单元210分割的低带信号LB从时域转换到频域或时/频域。例如,低带转换单元270可通过使用改进离散正弦变换(MDST)方法、快速傅里叶变换(FFT)方法或正交镜像滤波器(QMF)方法将低带信号LB从时域转换到频域或时/频域。这里,时域表示根据时间的低带信号LB(诸如,低带信号LB的能量或声压)在幅度的变化,频域表示根据频率的低带信号LB在幅度的变化,时/频域表示根据时间和频率的低带信号LB在幅度的变化。
相似地,根据实施例,高带转换单元275可通过使用除MDCT方法之外的转换方法将例如由带分割单元210分割的频域高带信号HB从时域转换到频域或时/频域。这里,高带转换单元275和低带转换单元270可使用相同的转换方法。例如,高带转换单元275可使用MDST方法、FFT方法或QMF方法,注意还有其它选择。
带宽扩展编码单元280可通过使用例如通过低带转换单元270转换到频域或时/频域的转换的低带信号LB来产生并编码表示例如通过高带转换单元275转换到频域或时/频域的转换的高带信号HB的特征的编码带宽扩展信息。这里,应该了解带宽扩展信息可包括高带信号HB的各条信息,诸如能级和包络。更详细地,带宽扩展编码单元280可基于低带信号LB与高带信号HB之间存在强相关性的事实通过使用关于低带信号LB的信息来产生带宽扩展信息。根据本发明的另一实施例,例如,带宽扩展编码单元280可通过使用对低带信号LB编码的结果来产生带宽扩展信息。
复用单元290还可通过复用例如立体声编码单元200、频率线性预测性能单元230、基于上下文的位平面编码单元260和带宽扩展编码单元280的编码结果来产生位流,从而将位流输出为例如输出信号OUT。
图3示出根据本发明另一实施例的对音频信号编码的系统。
参照图3,系统可包括立体声编码单元300、带分割单元310、模式确定单元320、MDCT应用单元325、频率线性预测性能单元330、多分辨率分析单元340、量化单元350、基于上下文的位平面编码单元360、低带转换单元370、高带转换单元375、带宽扩展编码单元380、码激励线性预测(CELP)编码单元385和复用单元390,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
立体声编码单元300可从输入信号IN提取立体声或复数、参数,对立体声参数编码,并对输入信号IN执行下混频。
带分割单元310可将下混频的信号分割为低带信号LB和高带信号HB。
模式确定单元320可根据预定的标准确定在时域还是在频域中对例如带分割单元310分割的低带信号LB编码。例如,模式确定单元320可根据例如从MDCT应用单元325输出的结果确定在时域还是在频域中对低带信号LB编码。
例如,如果模式确定单元320确定在频域中对低带信号LB编码,则MDCT应用单元325可对低带信号LB执行MDCT,从而将低带信号LB从时域转换到频域,模式确定单元320可使用MDCT的结果以确定编码域。
频率线性预测性能单元330可对频域低带信号LB执行频率线性预测。这里,频率线性预测可将当前频率信号逼近之前频率信号的线性组合。更详细地,例如,频率线性预测性能单元330可计算线性预测滤波器的系数,从而将作为线性预测的信号与当前频率信号之间的差的预测误差最小化,并根据计算的系数对频域低带信号LB执行线性预测滤波。这里,在实施例中,频率线性预测性能单元330还可通过对通过使用矢量指数表示线性预测滤波器的系数的相应值的相应值执行矢量量化来提高编码效率。
更详细地,如果频域低带信号LB是语音信号或基频信号,则频率线性预测性能单元330可对语音信号或基频信号执行频率线性预测。也就是说,频率线性预测性能单元330还可根据接收信号的特性通过执行频率线性预测来选择性地提高编码效率。
多分辨率分析单元340可接收例如MDCT应用单元325或频率线性预测性能单元330的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率分析。更详细地,在实施例中,多分辨率分析单元340可根据音频频谱变化的强度,通过将音频频谱划分为两种类型(诸如,稳定类型和短类型)来对频率线性预测性能单元330滤波的音频频谱执行多分辨率分析。
更详细地,在实施例中,例如,如果频域低带信号LB或频率线性预测性能单元330的结果是瞬时信号,则多分辨率分析单元340可对瞬时信号执行多分辨率分析。也就是说,多分辨率分析单元340可根据接收信号的特性通过执行多分辨率分析来选择性地提高编码效率。
量化单元350可量化例如频率线性预测性能单元330或多分辨率分析单元340的结果。
在实施例中,基于上下文的位平面编码单元360还可对量化单元350的结果执行基于上下文的编码,从而产生编码的位平面。这里,基于上下文的位平面编码单元360可通过使用例如Huffman编码方法执行基于上下文的编码。
在实施例中,频率线性预测性能单元330、多分辨率分析单元340、量化单元350和基于上下文的位平面编码单元360可被认为集体对频域低带信号LB编码,从而可被统称为低带编码单元。
根据实施例,低带转换单元370可通过使用除MDCT方法之外的转换方法将例如由带分割单元310分割的低带信号LB从时域转换到频域或时/频域。例如,低带转换单元370可通过使用MDST方法、FFT方法或QMF方法将低带信号LB从时域转换到频域或时/频域。这里,时域表示根据时间的低带信号LB(诸如,低带信号LB的能量或声压)在幅度的变化,频域表示根据频率的低带信号LB在幅度的变化,时/频域表示根据时间和频率的低带信号LB在幅度的变化。
相似地,根据实施例,高带转换单元375可通过使用除MDCT方法之外的转换方法将例如由带分割单元310分割的高带信号HB从时域转换到频域或时/频域。此外,例如,高带转换单元375和低带转换单元370可使用相同的转换方法。仅作为示例,高带转换单元375可使用MDST方法、FFT方法或QMF方法。
带宽扩展编码单元380可通过使用例如通过低带转换单元370转换到频域或时/频域的频域低带信号LB来产生并编码表示例如通过高带转换单元375转换到频域或时/频域的频域高带信号HB的潜在识别的特征的编码带宽扩展信息。这里,应该了解带宽扩展信息可包括高带信号HB的各条信息,诸如能级和包络。更详细地,在实施例中,带宽扩展编码单元380可基于低带信号LB与高带信号HB之间存在强相关性的事实通过使用关于低带信号LB的信息来产生带宽扩展信息。根据本发明的另一实施例,带宽扩展编码单元380可通过使用例如对低带信号LB编码的结果来产生带宽扩展信息。
如果模式确定单元320确定在时域中对低带信号LB编码,则CELP编码单元385可通过使用例如CELP编码方法对低带信号LB编码。这里,CELP编码方法是这样一种方法:对低带信号LB执行线性预测,通过使用计算的线性预测滤波器的系数通过对低带信号LB滤波来对共振峰(formant)分量编码,以及通过搜索自适应码书和固定码书对滤波的信号的基频分量编码。
复用单元390还可通过复用立体声编码单元300、频率线性预测性能单元330、基于上下文的位平面编码单元360、带宽扩展编码单元380和CELP编码单元385的编码结果来产生位流,从而将位流输出为例如输出信号OUT。
图4示出根据本发明另一实施例的对音频信号编码的系统。
参照图4,系统可包括立体声编码单元400、带分割单元410、模式确定单元420、第一MDCT应用单元425、频率线性预测性能单元430、多分辨率分析单元440、量化单元450、基于上下文的位平面编码单元460、第二MDCT应用单元470、第三MDCT应用单元475、带宽扩展编码单元480、CELP编码单元485和复用单元490,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
立体声编码单元400可从输入信号IN提取立体声或复数、参数,对立体声参数编码,并对输入信号IN执行下混频。
带分割单元410可将下混频的信号分割为例如低带信号LB和高带信号HB。
模式确定单元420可根据预定的标准确定在时域还是在频域中对例如带分割单元410分割的低带信号LB编码。例如,模式确定单元420可根据第一MDCT应用单元425的结果确定在时域还是在频域中对带分割单元410分割的低带信号LB编码。
如果模式确定单元420确定在频域中对低带信号LB编码,则第一MDCT应用单元425可对低带信号LB执行MDCT,从而将低带信号LB从时域转换到频域。这里,时域表示根据时间的低带信号LB(诸如,低带信号LB的能量或声压)在幅度的变化,频域表示根据频率的低带信号LB在幅度的变化。这里,应该注意,模式确定单元420可使用MDCT的结果以确定期望的编码域。
频率线性预测性能单元430可对频域低带信号LB执行频率线性预测。这里,频率线性预测可将当前频率信号逼近之前频率信号的线性组合。更详细地,在实施例中,频率线性预测性能单元430可计算线性预测滤波器的系数,从而将作为线性预测的信号与当前频率信号之间的差的预测误差最小化,并根据计算的系数对频域低带信号LB执行线性预测滤波。这里,在实施例中,频率线性预测性能单元430还可通过对通过使用矢量指数表示线性预测滤波器的系数的相应值的相应值执行矢量量化来提高编码效率。
更详细地,如果频域低带信号LB是语音信号或基频信号,则频率线性预测性能单元430可对例如语音信号或基频信号选择性地执行频率线性预测。也就是说,频率线性预测性能单元430还可根据接收信号的特性通过选择性地执行频率线性预测来提高编码效率。
多分辨率分析单元440可接收例如第一MDCT应用单元425或频率线性预测性能单元430的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率分析。更详细地,在实施例中,多分辨率分析单元440可根据例如音频频谱变化的强度,通过将音频频谱划分为两种类型(诸如,稳定类型和短类型)来对频率线性预测性能单元430滤波的音频频谱执行多分辨率分析。
更详细地,在实施例中,例如,如果频域低带信号LB或频率线性预测性能单元430的结果是例如瞬时信号,则多分辨率分析单元440可对瞬时信号选择性地执行多分辨率分析。也就是说,多分辨率分析单元440还可根据接收信号的特性通过选择性地执行多分辨率分析来提高编码效率。
量化单元450可量化例如频率线性预测性能单元430或多分辨率分析单元440的结果。
基于上下文的位平面编码单元460还可对量化单元450的结果执行基于上下文的编码,从而产生编码的位平面。这里,基于上下文的位平面编码单元460可通过使用例如Huffman编码方法执行基于上下文的编码。
在实施例中,频率线性预测性能单元430、多分辨率分析单元440、量化单元450和基于上下文的位平面编码单元460可被认为集体对频域低带信号LB编码,从而可被统称为低带编码单元。
第二MDCT应用单元470可对带分割单元410分割的低带信号LB执行MDCT,从而将低带信号LB从时域转换到频域。如果模式确定单元420确定在频域中对低带信号LB编码,则第二MDCT应用单元470可不对低带信号LB执行MDCT。在这种情况下,第二MDCT应用单元470的输出结果可被替换为第一MDCT应用单元425的结果。
第三MDCT应用单元475可对例如带分割单元410分割的高带信号HB执行MDCT,从而将高带信号HB从时域转换到频域。
带宽扩展编码单元480可通过使用例如通过第二MDCT应用单元470转换到频域的频域低带信号LB来产生并编码表示例如通过第三MDCT应用单元475转换到频域的频域高带信号HB的潜在可识别特征的编码带宽扩展信息。这里,应该了解带宽扩展信息可包括高带信号HB的各条信息,诸如能级和包络。更详细地,例如,带宽扩展编码单元480可基于低带信号LB与高带信号HB之间存在强相关性的事实通过使用关于低带信号LB的信息来产生带宽扩展信息。根据本发明的另一实施例,带宽扩展编码单元480可通过使用例如对低带信号LB编码的结果来产生带宽扩展信息。
如果模式确定单元420确定在时域中对低带信号LB编码,则CELP编码单元485可通过使用前述的CELP编码方法对低带信号LB编码。
复用单元490还可通过复用立体声编码单元400、频率线性预测性能单元430、基于上下文的位平面编码单元460、带宽扩展编码单元480和CELP编码单元485的编码结果来产生位流,从而将位流输出为例如输出信号OUT。
图5示出根据本发明另一实施例的对音频信号编码的系统。
参照图5,系统可包括转换单元500、立体声编码单元510、逆转换单元520、模式确定单元530、频变调制重叠变换(FV-MLT)应用单元535、频率线性预测性能单元540、多分辨率分析单元550、量化单元560、基于上下文的位平面编码单元570、带宽扩展编码单元580、CELP编码单元585和复用单元590,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
根据实施例,转换单元500可通过使用转换方法将输入信号IN从时域转换到频域或时/频域。例如,转换单元500可使用MDST方法、FFT方法或QMF方法转换输入信号IN,注意同样可用其它选择。例如,可使用MDCT方法。然而,如果使用了MDCT方法,则之前所述的图1到图4的实施例会比图5中的使用MDCT的实施例更有效。
这里,输入信号IN仍然可以是其中模拟语音或音频信号被调制为数字信号的PCM信号。如上所述,时域表示根据时间的输入信号IN(诸如,低带信号LB的能量或声压)在幅度的变化,频域表示根据频率的输入信号IN在幅度的变化,时/频域表示根据时间和频率的输入信号IN在幅度的变化。
因此,立体声编码单元510可从转换单元500输出的转换的信号提取立体声或复数、参数,对立体声参数编码,并对转换的信号执行下混频。
逆转换单元520可将下混频的信号从频域或时/频域逆转换到时域。在实施例中,逆转换单元520可使用与转换单元500使用的方法相应的逆方法。例如,如果转换单元已使用QMF方法,则逆转换单元520可使用逆QMF方法,注意同样可用其它选择。
模式确定单元530可根据预定的标准确定在时域还是在频域中对由逆转换单元520逆转换的逆转换的信号进行编码。例如,模式确定单元530可根据从FV-MLT应用单元535输出的结果确定在时域还是在频域中对逆转换的信号编码。
FV-MLT应用单元535可对输入信号执行FV-MLT,确定通过模式确定单元530在时域还是在频域中编码,从而通过子带将确定的信号转换到时域或频域。更详细地,FV-MLT是这样一种灵活的传输方法:可将在时域中表示的信号转换到频域,通过频带适当地控制转换的信号的时间分辨率,并在时域或频域中表示预定的子带信号。这里,模式确定单元530可使用FV-MLT的结果,以确定期望的编码域。
如果模式确定单元530确定期望在频域中对信号编码,则频率线性预测性能单元540可对由FV-MLT应用单元535转换到频域的信号执行频率线性预测。这里,频率线性预测可将当前频率信号逼近之前频率信号的线性组合。更详细地,频率线性预测性能单元540可计算线性预测滤波器的系数,从而将作为线性预测的信号与当前频率信号之间的差的预测误差最小化,并根据计算的系数对转换到频域的信号执行线性预测滤波。这里,在实施例中,频率线性预测性能单元540还可通过对线性预测滤波器的系数的相应值执行矢量量化通过使用矢量指数表示所述相应值来提高编码效率。
更详细地,在实施例中,如果通过FV-MLT应用单元535转换到频域的信号是语音信号或基频信号,则频率线性预测性能单元540可对语音信号或基频信号选择性地执行频率线性预测。也就是说,频率线性预测性能单元540还可根据接收信号的特性通过选择性地执行频率线性预测来提高编码效率。
多分辨率分析单元550可接收例如FV-MLT应用单元535或频率线性预测性能单元540的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率分析。更详细地,在实施例中,多分辨率分析单元550可根据音频频谱变化的强度,通过将音频频谱划分为两种类型(诸如,稳定类型和短类型)来对频率线性预测性能单元540滤波的音频频谱执行多分辨率分析。
更详细地,在实施例中,如果通过FV-MLT应用单元535转换到频域的信号或频率线性预测性能单元540的结果是瞬时信号,则多分辨率分析单元550还可对瞬时信号选择性地执行多分辨率分析。也就是说,多分辨率分析单元550还可根据接收信号的特性通过选择性地执行多分辨率分析来提高编码效率。
量化单元560可量化例如频率线性预测性能单元540或多分辨率分析单元550的结果。
基于上下文的位平面编码单元570还可对量化单元560的结果执行基于上下文的编码,从而产生编码的位平面。这里,基于上下文的位平面编码单元570可通过使用例如Huffman编码方法执行基于上下文的编码。
带宽扩展编码单元580可从下混频的信号提取编码带宽扩展信息并对编码带宽扩展信息编码。这里,应该了解带宽扩展信息可包括信号的各条信息,诸如能级和包络,注意还有其它选择。
如果模式确定单元530确定期望在时域中对信号编码,则CELP编码单元585可通过使用例如前述的CELP编码方法对通过FV-MLT应用单元535转换到时域的信号编码。
复用单元590还可通过复用立体声编码单元510、频率线性预测性能单元540、基于上下文的位平面编码单元570、带宽扩展编码单元580和CELP编码单元585的编码结果来产生位流,从而将位流输出为例如输出信号OUT。
图6示出根据本发明另一实施例的对音频信号编码的系统。
参照图6,系统可包括模式确定单元600、FV-MLT应用单元610、立体声编码单元620、频率线性预测性能单元630、多分辨率分析单元640、量化单元650、基于上下文的位平面编码单元660、带宽扩展编码单元670、CELP编码单元680和复用单元690,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
模式确定单元600根据预定标准确定在时域还是在频域中对输入信号IN编码。这里,输入信号IN仍然可以是其中模拟语音或音频信号被调制为数字信号的PCM信号。例如,模式确定单元600根据例如从FV-MLT应用单元610输出的结果确定在时域还是在频域中对输入信号IN编码。
因此,FV-MLT应用单元610可对输入信号执行FV-MLT,确定通过模式确定单元600在时域还是在频域中编码,从而通过频率子带将确定的信号转换到时域或频域。更详细地,如上所述,FV-MLT是这样一种灵活的传输方法:可将在时域中表示的信号转换到频域,通过频带适当地控制转换的信号的时间分辨率,并在时域或频域中表示预定的子带信号。这里,模式确定单元600可使用FV-MLT的结果,以确定编码域。
立体声编码单元620可从FV-MLT应用单元610输出的转换的信号提取立体声参数,对立体声参数编码,并对转换的信号执行下混频。
如果模式确定单元600确定在频域中对输入信号IN编码,则频率线性预测性能单元630可对通过FV-MLT应用单元610转换到频域的信号执行频率线性预测。这里,频率线性预测仍然可将当前频率信号逼近之前频率信号的线性组合。更详细地,频率线性预测性能单元630可计算线性预测滤波器的系数,从而将作为线性预测的信号与当前频率信号之间的差的预测误差最小化,并根据计算的系数对转换到频域的信号执行线性预测滤波。此外,频率线性预测性能单元630还可通过对通过使用矢量指数表示线性预测滤波器的系数的相应值的相应值执行矢量量化来提高编码效率。
更详细地,在实施例中,如果通过FV-MLT应用单元610转换到频域的信号是语音信号或基频信号,则频率线性预测性能单元630可对语音信号或基频信号选择性地执行频率线性预测。也就是说,频率线性预测性能单元630还可根据接收信号的识别的特性通过选择性地执行频率线性预测来提高编码效率。
多分辨率分析单元640可接收例如FV-MLT应用单元610或频率线性预测性能单元630的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率分析。更详细地,在实施例中,多分辨率分析单元640可根据例如音频频谱变化的强度,通过将音频频谱划分为两种类型(诸如,稳定类型和短类型)来对频率线性预测性能单元630滤波的音频频谱执行多分辨率分析。
更详细地,在实施例中,如果通过FV-MLT应用单元610转换到频域的信号或频率线性预测性能单元630的结果是例如瞬时信号,则多分辨率分析单元640还可对瞬时信号执行多分辨率分析。也就是说,多分辨率分析单元640还可根据接收信号的特性通过选择性地执行多分辨率分析来提高编码效率。
量化单元650还可量化频率线性预测性能单元630或多分辨率分析单元640的结果。
基于上下文的位平面编码单元660还可对量化单元650的结果执行基于上下文的编码,从而产生编码的位平面。这里,基于上下文的位平面编码单元660可通过使用例如Huffman编码方法执行基于上下文的编码,注意同样可用其它选择。
带宽扩展编码单元670可从例如由立体声编码单元620执行了下混频的信号提取带宽扩展信息并对编码带宽扩展信息编码。这里,应该了解带宽扩展信息可包括信号的各条信息,诸如能级和包络。
此外,如果模式确定单元600确定期望在时域中对输入信号IN编码,则CELP编码单元680可通过使用例如前述的CELP编码方法对下混频的信号编码。
复用单元690还可通过复用立体声编码单元620、频率线性预测性能单元630、基于上下文的位平面编码单元660、带宽扩展编码单元670和CELP编码单元680的编码结果来产生位流,从而将位流输出为例如输出信号OUT。
图7示出根据本发明另一实施例的对音频信号解码的系统。
参照图7,系统可包括解复用单元700、基于上下文的位平面解码单元710、反量化单元720、多分辨率合成单元730、反频率线性预测性能单元740、带宽扩展解码单元750、第一逆MDCT应用单元760、第二逆MDCT应用单元770、带组合单元780和立体声解码单元790,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
解复用单元700可接收并解复用位流,诸如当前从编码端输出的位流或之前从编码端输出的位流。这里,从解复用单元700输出的信息可包括例如关于音频频谱、量化值和其它重构信息的分析信息、量化频谱的重构信息、关于基于上下文的位平面解码的信息、信号类型信息、关于频率线性预测和矢量量化的信息、编码的带宽扩展信息和/或编码的立体声参数,注意根据需要还可包括附加信息。
基于上下文的位平面解码单元710可对编码的位平面执行基于上下文的解码。这里,基于上下文的位平面解码单元710可从解复用单元700接收信息并通过使用例如Huffman编码方法重构频谱、编码带模式信息和比例因子。更详细地,在实施例中,基于上下文的位平面解码单元710可接收偏(prejudice)编码带模式信息、偏编码的比例因子和偏编码的频谱,并输出例如编码带模式值、比例因子的解码修饰(cosmetic)指示和频谱的量化值。
反量化单元720可反量化基于上下文的位平面解码单元710的结果。
多分辨率合成单元730可接收反量化单元720的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率合成。更详细地,在实施例中,如果对从编码端接收的音频信号已经执行了多分辨率合成,则多分辨率合成单元730可通过对反量化单元720的结果执行多分辨率合成来提高解码效率。这里,多分辨率合成单元730可接收反量化频谱/差谱并输出重构频谱/差谱。
反频率线性预测性能单元740可将多分辨率合成单元730的结果与例如从解复用单元700接收到的通过编码端的频率线性预测的结果组合。更详细地,如果已经对从编码端接收的音频信号执行了频率线性预测,则可使用反频率线性预测性能单元740通过将频率线性预测的结果与从反量化单元720或多分辨率合成单元730输出的结果组合来提高解码效率。这里,反频率线性预测性能单元740可通过使用频域预测技术和预测系数的矢量量化技术有效提高解码效率。反频率线性预测性能单元740还可接收差谱系数和矢量指数并输出MDCT谱系数和低带信号。
带宽扩展解码单元750可随后对从例如解复用单元700接收的编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从反频率线性预测性能单元740输出的低带信号产生高带信号。这里,在实施例中,带宽扩展解码单元750可基于低带信号与高带信号之间存在强相关性的事实,或基于低带信号与高带信号之间存在强相关性的确定,通过将解码的带宽扩展信息应用到低带信号来产生高带信号。这里,带宽扩展信息可表示高带信号的特征,并且包括高带信号的各条信息,诸如能级和包络。
第一逆MDCT应用单元760可执行例如由原始编码端执行的转换的适当的逆转换。因此,第一逆MDCT应用单元760可对从反频率线性预测性能单元740输出的低带信号执行逆MDCT,从而将低带信号从频域逆转换到时域。这里,第一逆MDCT应用单元760可接收从通过反频率线性预测性能单元740的反量化的结果获得的频谱系数并可输出与低带相应的重构音频数据。
第二逆MDCT应用单元770可对由带宽扩展解码单元750解码的高带信号执行逆MDCT,从而将高带信号从频域逆转换到时域。
带组合单元780还可将例如通过第一逆MDCT应用单元760逆转换到时域的时域低带信号与例如通过第二逆MDCT应用单元770逆转换到时域的时域高带信号组合。
立体声解码单元790可随后对从解复用单元700接收的编码的立体声参数解码并通过使用解码的立体声参数对从带组合单元780输出的组合信号执行上混频,从而将结果输出为例如输出信号OUT。这里,上混频可被认为是下混频的逆断裂操作,并且是从信号(诸如具有单通道的单信号)产生具有两个或多个通道的信号的处理。
图8示出根据本发明另一实施例的对音频信号解码的系统。
参照图8,系统可包括解复用单元800、基于上下文的位平面解码单元810、反量化单元820、多分辨率合成单元830、反频率线性预测性能单元840、逆MDCT应用单元850、转换单元855、带宽扩展解码单元860、逆转换单元870、带组合单元880和立体声解码单元890,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
如上所述,解复用单元800可接收并解复用例如通过编码端产生的位流。更详细地,解复用单元800可将位流分割为与各个数据等级相应的数据段,并且分析和输出关于数据段的位流的信息。这里,从解复用单元800输出的信息仍然可包括例如关于音频频谱、量化值和其它重构信息的分析信息、量化谱的重构信息、关于基于上下文的位平面解码的信息、信号类型信息、关于频率线性预测和矢量量化的信息、编码的带宽扩展信息和编码的立体声参数。
基于上下文的位平面解码单元810可对编码的位平面执行基于上下文的解码。这里,基于上下文的位平面解码单元810可从解复用单元800接收信息并通过使用例如Huffman编码方法重构频谱、编码带模式信息和比例因子。更详细地,在实施例中,基于上下文的位平面解码单元810可接收偏编码带模式信息、偏编码的比例因子和偏编码的频谱,并输出例如编码带模式值、比例因子的解码修饰指示和频谱的量化值。
反量化单元820可反量化基于上下文的位平面解码单元810的结果。
多分辨率合成单元830可接收反量化单元820的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率合成。更详细地,如果之前已经对音频信号执行了多分辨率合成,则多分辨率合成单元830可通过对反量化单元820的结果执行多分辨率合成来提高解码效率。这里,多分辨率合成单元830可接收反量化谱/差谱并输出重构谱/差谱。
反频率线性预测性能单元840可将多分辨率合成单元830的结果与例如从解复用单元800接收到的通过编码端的频率线性预测的结果组合,并对组合结果执行反矢量量化。更详细地,在实施例中,如果对音频信号已经执行了频率线性预测,则反频率线性预测性能单元840可通过将例如频率线性预测的结果与反量化单元820或多分辨率合成单元830的结果组合来提高解码效率。这里,在实施例中,反频率线性预测性能单元840可通过使用频域预测技术和预测系数的矢量量化技术有效提高解码效率。因此,在实施例中,反频率线性预测性能单元840可接收差谱系数和矢量指数并输出MDCT谱系数和低带信号。
逆MDCT应用单元850还可对从反频率线性预测性能单元840输出的低带信号执行逆MDCT,从而将低带信号从频域逆转换到时域。这里,逆MDCT应用单元850可接收从反频率线性预测性能单元840的反量化的结果获得的频谱系数并可输出与低带相应的重构音频数据。
转换单元855可通过使用转换方法将由逆MDCT应用单元850逆转换到时域的低带信号从时域转换到频域或时/频域。例如,转换单元855可使用MDST方法、FFT方法或QMF方法(仅作为示例)转换低带信号。此外,还可使用MDCT方法。然而,在这种情况下,如果使用了MDCT方法,则图7中的实施例的操作会更有效。
带宽扩展解码单元860可对从如解复用单元800输出的编码带宽扩展信息解码,并通过使用例如解码的带宽扩展信息从通过转换单元855转换到频域或时/频域的转换的低带信号产生高带信号。这里,在实施例中,带宽扩展解码单元860可基于低带信号与高带信号之间可存在强相关性的事实通过将解码的带宽扩展信息应用到低带信号来产生高带信号。这里,带宽扩展信息可表示高带信号的特征,并且包括高带信号的各条信息,诸如能级和包络。
例如,在不同实施例中,逆转换单元870可随后通过使用除MDCT方法之外的转换方法将带宽扩展解码单元860解码的高带信号从频域或时/频域逆转换到时域。这里,转换单元855和逆转换单元870可使用相同的转换方法。例如,逆转换单元870可使用MDST方法、FFT方法或QMF方法,注意其它选择是同样可用的。
带组合单元880还可将例如由逆MDCT应用单元850逆转换到时域的时域低带信号与例如由逆转换单元870逆转换到时域的时域高带信号组合。
立体声解码单元890可随后对从解复用单元800输出的编码的立体声参数解码并通过使用解码的立体声参数对从带组合单元880输出的组合信号执行上混频,从而将结果输出为例如输出信号OUT。
图9示出根据本发明另一实施例的对音频信号解码的系统。
参照图9,系统可包括解复用单元900、基于上下文的位平面解码单元910、反量化单元920、多分辨率合成单元930、反频率线性预测性能单元940、逆MDCT应用单元950、转换单元955、带宽扩展解码单元960、逆转换单元965、CELP解码单元970、带组合单元980和立体声解码单元990,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
解复用单元900可接收并解复用如通过编码端产生的位流。更详细地,解复用单元900可将位流分割为与各个数据等级相应的数据段,并且分析和输出关于数据段的位流的信息。这里,从解复用单元900输出的信息可包括例如关于音频频谱、量化值和其它重构信息的分析信息、量化谱的重构信息、关于基于上下文的位平面解码的信息、信号类型信息、关于频率线性预测和矢量量化的信息、编码的带宽扩展信息、CELP编码信息和编码的立体声参数。
如果解复用单元900的解复用的结果指示或可被识别为在频域中已被编码,则基于上下文的位平面解码单元910可对编码的位平面执行基于上下文的解码。这里,基于上下文的位平面解码单元910可接收从解复用单元900输出的信息并通过使用例如Huffman编码方法重构频谱、编码带模式信息和比例因子。更详细地,在实施例中,基于上下文的位平面解码单元910可接收偏编码带模式信息、偏编码的比例因子和偏编码的频谱,并输出例如编码带模式值、比例因子的解码修饰指示和频谱的量化值。
反量化单元920可反量化基于上下文的位平面解码单元910的结果。
多分辨率合成单元930可接收反量化单元920的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率合成。更详细地,在实施例中,如果例如初始编码端已经对音频信号执行了多分辨率分析,则多分辨率合成单元930可通过对反量化单元920的结果执行多分辨率合成来提高解码效率。这里,多分辨率合成单元930可接收反量化谱/差谱并输出重构谱/差谱。
反频率线性预测性能单元940可将多分辨率合成单元930的结果与例如从解复用单元900接收到的通过编码端的频率线性预测的结果组合,并对组合结果执行反矢量量化。更详细地,例如,如果已经对音频信号执行了频率线性预测,则反频率线性预测性能单元940可通过将频率线性预测的结果与反量化单元920或多分辨率合成单元930的结果组合来提高解码效率。这里,在实施例中,因此,反频率线性预测性能单元940可通过使用频域预测技术和预测系数的矢量量化技术有效提高解码效率。反频率线性预测性能单元940可接收差谱系数和矢量指数并输出MDCT谱系数和低带信号。
逆MDCT应用单元950可对从反频率线性预测性能单元940输出的低带信号执行逆MDCT,从而将低带信号从频域逆转换到时域。这里,例如,逆MDCT应用单元950可接收从反频率线性预测性能单元940的反量化的结果获得的频谱系数并可输出与低带相应的重构音频数据。
转换单元955还可通过使用转换方法将通过逆MDCT应用单元950逆转换到时域的低带信号从时域转换到频域或时/频域。例如,转换单元955可使用例如MDST方法、FFT方法或QMF方法转换时域低带信号。此外,还可使用MDCT方法,但至少在本实施例中,如果使用MDCT方法,则图7中的实施例会比当前实施例更有效。
带宽扩展解码单元960可对从例如解复用单元900输出的编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从转换单元955转换到频域或时/频域的频域低带信号产生高带信号。这里,带宽扩展解码单元960可基于低带信号与高带信号之间可存在强相关性的事实通过将解码的带宽扩展信息应用到低带信号来产生高带信号。这里,带宽扩展信息可表示高带信号的特征,并且包括高带信号的各条信息,诸如能级和包络。
在实施例中,逆转换单元965可通过使用除MDCT方法之外的转换方法将带宽扩展解码单元960解码的高带信号从频域或时/频域逆转换到时域。与上述相似,转换单元955和逆转换单元965可使用相同的转换方法。例如,逆转换单元965可使用MDST方法、FFT方法或QMF方法。
如果在时域中对解复用单元900的解复用结果编码,则CELP解码单元970可用于通过使用合适的CELP解码方法对CELP编码信息解码,从而产生低带信号。与上述相似,CELP解码方法是这样一种方法:通过使用固定码书的索引和增益以及自适应码书的延迟和增益来恢复编码信号,通过使用线性预测滤波器的系数组合恢复的信号,以及通过使用前述的CELP编码方法对编码的信号解码。
带组合单元980可将例如从逆MDCT应用单元950输出的时域低带信号与例如由逆转换单元965逆转换的时域高带信号以及CELP解码单元970解码的信号组合。
立体声解码单元990可随后对从解复用单元900输出的编码的立体声参数解码并通过使用解码的立体声参数对从带组合单元980输出的组合信号执行上混频,从而将结果输出为例如输出信号OUT。
图10示出根据本发明另一实施例的对音频信号解码的系统。
参照图10,系统可包括解复用单元1000、基于上下文的位平面解码单元1010、反量化单元1020、多分辨率合成单元1030、反频率线性预测性能单元1040、第一逆MDCT应用单元1050、CELP解码单元1060、MDCT应用单元1065、带宽扩展解码单元1070、第二逆MDCT应用单元1075、带组合单元1080和立体声解码单元1090,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
解复用单元1000可接收并解复用如通过编码端产生的位流。更详细地,解复用单元1000可将位流分割为与各个数据等级相应的数据条,并且分析并输出关于数据条的位流的信息。这里,从解复用单元1000输出的信息可包括例如关于音频频谱、量化值和其它重构信息的分析信息、量化谱的重构信息、关于基于上下文的位平面解码的信息、信号类型信息、关于频率线性预测和矢量量化的信息、编码的带宽扩展信息、CELP编码信息和编码的立体声参数。
如果解复用单元1000的解复用的结果指示或可被识别为在频域中已被编码,则基于上下文的位平面解码单元1010可对编码的位平面执行基于上下文的解码。这里,基于上下文的位平面解码单元1010可接收从解复用单元1000输出的信息并通过使用例如Huffman编码方法重构频谱、编码带模式信息和比例因子。更详细地,在实施例中,基于上下文的位平面解码单元1010可接收偏编码带模式信息、偏编码的比例因子和偏编码的频谱,并输出例如编码带模式值、比例因子的解码修饰指示和频谱的量化值。
反量化单元1020可反量化基于上下文的位平面解码单元1010的结果。
例如,多分辨率合成单元1030可随后接收反量化单元1020的结果,并对瞬时变化的接收信号的音频频谱系数执行多分辨率合成。更详细地,在实施例中,如果例如在编码期间对音频信号已经执行了多分辨率分析,则多分辨率合成单元1030可通过对反量化单元1020的结果选择性地执行多分辨率合成来提高解码效率。这里,多分辨率合成单元1030可接收反量化谱/差谱并输出重构谱/差谱。
反频率线性预测性能单元1040可将多分辨率合成单元1030的结果与例如从解复用单元1000接收到的编码端的频率线性预测的结果组合。更详细地,如果例如在编码期间已经对音频信号执行了频率线性预测,则反频率线性预测性能单元1040可通过将频率线性预测的结果与例如反量化单元1020或多分辨率合成单元1030的结果组合来提高解码效率。这里,在实施例中,反频率线性预测性能单元1040可通过使用频域预测技术和预测系数的矢量量化技术有效提高解码效率。反频率线性预测性能单元1040可接收差谱系数和矢量指数并输出MDCT谱系数和低带信号。
第一逆MDCT应用单元1050可对从反频率线性预测性能单元1040输出的信号执行逆MDCT,从而将信号从频域逆转换到时域。这里,第一逆MDCT应用单元1050可接收从反频率线性预测性能单元1040的反量化的结果获得的频谱系数并可输出与低带相应的重构音频数据。
如果在时域中已对解复用单元1000的解复用结果编码,则CELP解码单元1060可用于通过使用前述的CELP解码方法对CELP编码信息解码,从而产生低带信号。
此外,如果这里在时域中已对解复用单元1000的解复用结果编码,则MDCT应用单元1065可对CELP解码单元1060解码的低带信号执行MDCT,从而将低带信号从时域转换到频域。如果在频域中已对解复用单元1000的解复用结果编码,则MDCT应用单元1065可不对低带信号执行MDCT。在这种情况下,MDCT应用单元1065的结果输出可被替换为反频率线性预测性能单元1040的结果输出。
带宽扩展解码单元1070可对从例如解复用单元1000输出的编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从MDCT应用单元1065输出的低带信号产生高带信号。这里,带宽扩展解码单元1070可基于低带信号与高带信号之间可存在强相关性的事实通过将解码的带宽扩展信息应用到低带信号来产生高带信号。这里,带宽扩展信息可表示高带信号的特征,并且包括高带信号的各条信息,诸如能级和包络。
第二逆MDCT应用单元1075可对带宽扩展解码单元1070解码的高带信号执行逆MDCT,从而将高带信号从频域逆转换到时域。
带组合单元1080还可将例如由第一逆MDCT应用单元1050逆转换到时域的时域低带信号与例如由第二逆MDCT应用单元1075逆转换到时域的时域高带信号组合。
立体声解码单元1090还可对从解复用单元1000输出的编码的立体声参数解码并通过使用解码的立体声参数对从带组合单元1080输出的组合信号执行上混频,从而将结果输出为例如输出信号OUT。
图11示出根据本发明另一实施例的对音频信号解码的系统。
参照图11,系统可包括解复用单元1100、基于上下文的位平面解码单元1110、反量化单元1120、多分辨率合成单元1130、反频率线性预测性能单元1140、CELP解码单元1150、逆FV-MLT应用单元1160、转换单元1065、带宽扩展解码单元1170、立体声解码单元1180和逆转换单元1190,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
解复用单元1100可接收并解复用例如由编码端产生的位流。解复用单元1100可将位流分割为与各个数据等级相应的数据段,并且分析和输出关于数据段的位流的信息。这里,从解复用单元1100输出的信息可包括例如关于音频频谱、量化值和其它重构信息的分析信息、量化谱的重构信息、关于基于上下文的位平面解码的信息、信号类型信息、关于频率线性预测和矢量量化的信息、CELP编码信息、编码的带宽扩展信息和编码的立体声参数。
如果解复用单元1100的解复用的结果指示或可被识别为在频域中已被编码,则基于上下文的位平面解码单元1110可对编码的位平面执行基于上下文的解码。这里,基于上下文的位平面解码单元1110可接收从解复用单元1100输出的信息并通过使用例如Huffman编码方法重构频谱、编码带模式信息和比例因子。更详细地,在实施例中,基于上下文的位平面解码单元1110可接收偏编码带模式信息、偏编码的比例因子和偏编码的频谱,并输出例如编码带模式值、比例因子的解码修饰指示和频谱的量化值。
反量化单元1120还可反量化基于上下文的位平面解码单元1110的结果。
多分辨率合成单元1130可接收反量化单元1120的结果,并对例如瞬时变化的接收信号的音频频谱系数执行多分辨率合成。更详细地,如果对例如初始编码的音频信号已经执行了多分辨率分析,则多分辨率合成单元1130可通过对反量化单元1120的结果执行多分辨率合成来提高解码效率。这里,多分辨率合成单元1130可接收反量化谱/差谱并输出重构谱/差谱。
反频率线性预测性能单元1140可将多分辨率合成单元1130的结果与例如从解复用单元1100接收到的编码端的频率线性预测的结果组合,并对组合结果执行反矢量量化。更详细地,在实施例中,如果对音频信号已经执行了频率线性预测,则反频率线性预测性能单元1140可通过将频率线性预测的结果与反量化单元1120或多分辨率合成单元1130的结果组合来提高解码效率。这里,反频率线性预测性能单元1140因此可通过使用例如频域预测技术和预测系数的矢量量化技术有效提高解码效率。反频率线性预测性能单元1140可接收差谱系数和矢量指数并输出MDCT谱系数。
如果解复用单元1100的解复用的结果指示或可被识别为在频域中已被编码,则CELP解码单元1150可对CELP编码信息解码。
逆FV-MLT应用单元1160可对从反频率线性预测性能单元1140输出的信号执行逆FV-MLT,从而将信号从频域逆转换到时域,并将逆转换到时域的信号与从CELP解码单元1150输出的信号组合,从而输出转换到时域的组合信号。
转换单元1165可通过使用转换方法将逆MDCT应用单元1160逆转换到时域的信号从时域转换到频域或时/频域。例如,与上述相似,转换单元1165可使用例如MDST方法、FFT方法或QMF方法转换低带信号。此外,还可使用MDCT方法,但是如果使用MDCT方法,则图10中示出的实施例会更有效。
带宽扩展解码单元1170可对从例如解复用单元1100输出的编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从通过转换单元1165转换到频域或时/频域的信号产生全带信号。这里,在实施例中,带宽扩展解码单元1170可基于低带信号与高带信号之间可存在强相关性的事实通过将解码的带宽扩展信息应用到从转换单元1165输出的信号来产生全带信号。这里,带宽扩展信息可表示高带信号的特征,并且包括高带信号的各条信息,诸如能级和包络。
立体声解码单元1180可对从例如解复用单元1100输出的编码的立体声参数解码并通过使用解码的立体声参数对从带宽扩展解码单元1170输出的信号执行上混频。
通过不同的实施例,逆转换单元1190还可随后通过使用除MDCT方法之外的转换方法将上混频的信号从频域或时/频域转换到时域,从而将结果输出为例如输出信号OUT。这里,转换单元1165和逆转换单元1190可使用相同的转换方法。例如,逆转换单元1190可使用MDST方法、FFT方法或QMF方法,注意其它可选实施例是同等可用的。
图12示出根据本发明另一实施例的对音频信号解码的系统。
参照图12,系统可包括解复用单元1200、基于上下文的位平面解码单元1210、反量化单元1220、多分辨率合成单元1230、反频率线性预测性能单元1240、CELP解码单元1250、MDCT应用单元1260、带宽扩展解码单元1270、立体声解码单元1280和逆FV-MLT应用单元1290,例如,系统还可以是来自包括潜在分布的网络的计算机系统实施例中的至少一个的单处理元件系统实施例,以实现之前不可实现的本发明的优点。
解复用单元1200可接收并解复用例如由编码端产生的位流。解复用单元1200可将位流分割为与各个数据等级相应的数据段,并且分析和输出关于数据段的位流的信息。这里,从解复用单元1200输出的信息可包括例如关于音频频谱、量化值和其它重构信息的分析信息、量化谱的重构信息、关于基于上下文的位平面解码的信息、信号类型信息、关于频率线性预测和矢量量化的信息、CELP编码信息、编码的带宽扩展信息和编码的立体声参数。
如果解复用单元1200的解复用的结果指示或可被识别为在频域中已被编码,则基于上下文的位平面解码单元1210可对编码的位平面执行基于上下文的解码。这里,基于上下文的位平面解码单元1210可接收从解复用单元1200输出的信息并通过使用例如Huffman编码方法重构频谱、编码带模式信息和比例因子。更详细地,在实施例中,基于上下文的位平面解码单元1210可接收偏编码带模式信息、偏编码的比例因子和偏编码的频谱,并输出例如编码带模式值、比例因子的解码修饰指示和频谱的量化值。
反量化单元1220可反量化基于上下文的位平面解码单元1210的结果。
多分辨率合成单元1230还可接收反量化单元1220的结果,并对例如瞬时变化的接收信号的音频频谱系数执行多分辨率合成。更详细地,在实施例中,如果例如在编码期间对音频信号已经执行了多分辨率分析,则多分辨率分析单元1230可通过对反量化单元1220的结果执行多分辨率分析来提高解码效率。这里,多分辨率分析单元1230可接收例如反量化谱/差谱并输出重构谱/差谱。
反频率线性预测性能单元1240可将多分辨率分析单元1230的结果与例如从解复用单元1100接收到的通过编码端的频率线性预测的结果组合,并对组合结果执行反矢量量化。更详细地,在实施例中,如果已经对音频信号执行了频率线性预测,则反频率线性预测性能单元1240可用于通过将频率线性预测的结果与反量化单元1220或多分辨率合成单元1230的结果组合来提高解码效率。这里,反频率线性预测性能单元1240因此可通过使用频域预测技术和预测系数的矢量量化技术有效提高解码效率。反频率线性预测性能单元1240可接收差谱系数和矢量指数并输出MDCT谱系数。
如果解复用单元1200的解复用的结果指示或可被识别为在频域中已被编码,则CELP解码单元1250可对CELP编码信息解码。
MDCT应用单元1260还可对从CELP解码单元1250输出的信号执行MDCT,从而将信号从时域转换到频域。
带宽扩展解码单元1270可对从例如解复用单元1200输出的编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从反频率线性预测性能单元1240输出的信号或通过MDCT应用单元1260转换到频域的信号产生全带信号。在实施例中,如果已经在频域中对解复用单元1200的解复用的结果编码,则带宽扩展解码单元1270可通过将解码的带宽扩展信息应用到从反频率线性预测性能单元1240输出的信号来产生全带信号。如果已经在时域中对解复用单元1200的解复用的结果编码,则带宽扩展解码单元1270可通过将解码的带宽扩展信息应用到通过MDCT应用单元1260转换到频域的信号来产生全带信号。这里,带宽扩展信息表示高带信号的特征,并且包括高带信号的各条信息,诸如能级和包络。
立体声解码单元1280还可对从例如解复用单元1200输出的编码的立体声参数解码并通过使用解码的立体声参数对从带宽扩展解码单元1270输出的信号执行上混频。
逆FV-MLT应用单元1290可对上混频的信号执行逆FV-MLT,从而将信号从频域转换到时域,从而将结果输出为例如输出信号OUT。
图13示出根据本发明实施例的对音频信号编码的方法。
仅作为一个示例,这样的实施例可与图1中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将用省略的重复描述通过结合图1对本实施例进行简要描述。
参照图13,在操作1300,立体声编码单元100可从输入信号IN提取立体声参数,对立体声参数编码,并对输入信号IN执行下混频。
在操作1310,带分割单元110可将下混频的信号分割为低带信号和高带信号。
在操作1320,第一MDCT应用单元120和第二MDCT应用单元170可分别将低带信号和高带信号从时域转换到频域。更详细地,第一MDCT应用单元120和第二MDCT应用单元170可分别通过对低带信号和高带信号执行MDCT来将低带信号和高带信号从时域转换到频域。
在操作1330,低带编码单元可对转换的低带信号执行量化和基于上下文的编码,从而产生编码的位平面。这里,在实施例中,低带编码单元可包括:频率线性预测性能单元130,通过执行频率线性预测对转换的低带信号滤波;多分辨率分析单元140,对转换的或滤波的低带信号执行多分辨率分析;量化单元150,量化执行了多分辨率分析的低带信号;基于上下文的位平面解码单元160,对量化的低带信号执行基于上下文的编码。
在操作1340,带宽扩展编码单元180可通过使用转换的低带信号来产生并编码表示转换的高带信号的特性的带宽扩展信息。
在操作1350,复用单元190还可复用并输出编码的立体声参数、编码的位平面和编码的带宽扩展信息,作为对输入信号编码的结果。
图14示出根据本发明另一实施例的对音频信号编码的方法。
仅作为一个示例,这样的实施例可与图2中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将用省略的重复描述通过结合图2对本实施例进行简要描述。
参照图14,在操作1400,立体声编码单元200可从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频。
在操作1410,带分割单元210可将下混频的信号分割为低带信号和高带信号。
在操作1420,MDCT应用单元220可对低带信号执行MDCT,从而将低带信号LB从时域转换到频域。
在操作1430,低带编码单元可对执行了MDCT的信号执行量化和基于上下文的编码,从而产生编码的位平面。
在操作1440,低带转换单元270和低带转换单元275可分别将低带信号和高带信号从时域转换到频域或时/频域。
在操作1450,带宽扩展编码单元280可通过使用转换的低带信号来产生并编码表示转换的高带信号的特性的带宽扩展信息。
在操作1460,复用单元290可复用并输出编码的立体声参数、编码的位平面和编码的带宽扩展信息,作为对输入信号编码的结果。
图15示出根据本发明另一实施例的对音频信号编码的方法。
仅作为一个示例,这样的实施例可与图3或图4中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将通过结合图3对本实施例进行简要描述,省略重复描述。
参照图15,在操作1500,立体声编码单元300可从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频。
在操作1510,带分割单元310可将下混频的信号分割为低带信号和高带信号。
在操作1520,模式确定单元320可确定在时域还是在频域中对低带信号编码。
在操作1530,如果确定在时域中对低带信号编码,则CELP编码单元385可通过使用CELP编码方法对低带信号编码。
在操作1540,如果确定在频域中对低带信号编码,则MDCT应用单元325可对低带信号执行MDCT,从而将低带信号从时域转换到频域,低带编码单元可对执行了MDCT的信号执行量化和基于上下文的编码,从而产生编码的位平面。
在操作1550,低带转换单元370和高带转换单元375可分别将低带信号和高带信号从时域转换到频域或时/频域。这里,低带转换单元370和高带转换单元375可分别通过对低带信号和高带信号执行MDCT来将低带信号和高带信号从时域转换到频域或时/频域。在这种情况下,如果确定在频域中对低带信号编码,则低带转换单元370的结果输出可被替换为MDCT应用单元325的结果输出
在操作1560,带宽扩展编码单元380可通过使用转换的低带信号来产生并编码表示转换的高带信号的特性的带宽扩展信息。
在操作1570,复用单元390可复用并输出编码的立体声参数、通过使用CELP编码方法的编码结果、编码的位平面和编码的带宽扩展信息,作为对输入信号编码的结果。
图16示出根据本发明另一实施例的对音频信号编码的方法。
仅作为一个示例,这样的实施例可与图5中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将通过结合图5对本实施例进行简要描述,省略重复描述。
参照图16,在操作1600,转换单元500可将输入信号从时域转换到频域。
在操作1610,立体声编码单元510可从转换的信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频。
在操作1620,带宽扩展编码单元580可从下混频的信号提取带宽扩展信息并对带宽扩展信息编码。
在操作1630,逆转换单元520可将下混频的信号逆转换到时域。
在操作1640,模式确定单元530可确定在时域还是在频域中对逆转换的信号编码,FV-MLT应用单元535可根据确定结果对逆转换的信号执行FV-MLT,从而通过频率子带将逆转换的信号转换到时域或频域。
在操作1650,如果确定在时域中对逆转换的信号编码,则CELP编码单元585可通过使用CELP编码方法对转换到时域的信号编码。
在操作1660,如果确定在频域中对逆转换的信号编码,则频域编码单元可对转换到频域的信号执行量化和基于上下文的编码,从而产生编码的位平面。
在操作1670,复用单元590可复用并输出编码的立体声参数、编码的带宽扩展信息、通过使用CELP编码方法的编码结果和编码的位平面,作为对输入信号编码的结果。
图17示出根据本发明另一实施例的对音频信号编码的方法。
仅作为一个示例,这样的实施例可与图6中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将通过结合图6对本实施例进行简要描述,省略重复描述。
参照图17,在操作1700,模式确定单元600可确定在时域还是在频域中对输入信号编码,FV-MLT应用单元610可根据确定结果对输入信号执行FV-MLT,从而通过频率子带将输入信号转换到时域或频域。
在操作1710,立体声编码单元620可从转换的信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频。
在操作1720,带宽扩展编码单元670可从下混频的信号提取带宽扩展信息并对带宽扩展信息编码。
在操作1730,如果确定在时域中对下混频的信号编码,则CELP编码单元680可通过使用CELP编码方法对下混频的信号编码。
在操作1740,如果确定在频域中对下混频的信号编码,则频域编码单元可对下混频的信号执行量化和基于上下文的编码,从而产生编码的位平面。
在操作1750,复用单元690还可复用并输出编码的立体声参数、编码的带宽扩展信息、通过使用CELP编码方法的编码结果和编码的位平面,作为对输入信号编码的结果。
图18示出根据本发明实施例的对音频信号解码的方法。
仅作为一个示例,这样的实施例可与图7中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将通过结合图7对本实施例进行简要描述,省略重复描述。
参照图18,在操作1800,解复用单元700可接收编码的音频信号。这里,编码的音频信号可包括通过对低带信号执行基于上下文的编码获得的编码的位平面、编码的带宽扩展信息和编码的立体声参数。
在操作1810,低带解码单元可通过对编码的位平面执行基于上下文的解码和反量化来产生低带信号。这里,在实施例中,仅作为示例,低带解码单元可包括:基于上下文的位平面解码单元710,对编码的位平面执行基于上下文的解码;反量化单元720,反量化解码的信号;多分辨率合成单元730,对反量化的信号执行多分辨率合成;反频率线性预测性能单元740,通过使用矢量指数将通过编码端的频率线性预测的结果与反量化的信号或执行了多分辨率合成的信号组合。
在操作1820,带宽扩展解码单元750可对编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从低带信号产生高带信号。
在操作1830,第一逆MDCT应用单元760和第二逆MDCT应用单元770可分别对低带信号和高带信号执行逆MDCT,从而将低带信号和高带信号从频域逆转换到时域。
在操作1840,带组合单元780还可将逆转换的低带信号与逆转换的高带信号组合。
在操作1850,立体声解码单元790可对编码的立体声参数解码并通过使用解码的立体声参数对组合信号执行上混频。
图19示出根据本发明另一实施例的对音频信号解码的方法。
仅作为一个示例,这样的实施例可与图8中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将用省略的重复描述通过结合图8对本实施例进行简要描述。
参照图19,在操作1900,解复用单元800可接收编码的音频信号。这里,编码的音频信号可包括例如通过对低带信号执行基于上下文的编码获得的编码的位平面、编码的带宽扩展信息和编码的立体声参数。
在操作1910,低带解码单元可通过对编码的位平面执行基于上下文的解码和反量化来产生低带信号。
在操作1920,逆MDCT应用单元850可对低带信号执行逆MDCT,从而将低带信号从频域逆转换到时域。
在操作1930,转换单元855可将执行了逆MDCT的低带信号转换到频域或时/频域。
在操作1940,带宽扩展解码单元860可对编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从转换到频域或时/频域的低带信号产生高带信号。
在操作1950,逆转换单元870可将高带信号逆转换到时域。
在操作1960,带组合单元880可将转换的低带信号与逆转换的高带信号组合。
在操作1970,立体声解码单元890可对编码的立体声参数解码并通过使用解码的立体声参数对组合信号执行上混频。
图20示出根据本发明另一实施例的对音频信号解码的方法。
仅作为一个示例,这样的实施例可与图9或图10中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将通过结合图9对本实施例进行简要描述,省略重复描述。
参照图20,在操作2000,解复用单元900可接收时域或频域的编码的音频信号。这里,编码的音频信号可包括例如通过对低带信号执行基于上下文的编码获得的编码的位平面、编码的带宽扩展信息、CELP编码信息和编码的立体声参数。
在操作2010,如果在频域中已对编码的位平面编码,则低带解码单元可通过对编码的位平面执行基于上下文的解码和反量化来产生低带信号。这里,在实施例中,低带解码单元可包括:基于上下文的位平面解码单元910,对编码的位平面执行基于上下文的解码;反量化单元920,反量化解码的信号;多分辨率合成单元930,对反量化的信号执行多分辨率合成;反频率线性预测性能单元940,通过使用矢量指数将通过编码端的频率线性预测的结果与反量化的信号或执行了多分辨率合成的信号组合。
在操作2020,逆MDCT应用单元950可对低带信号执行逆MDCT,从而将低带信号从频域逆转换到时域。
在操作2030,转换单元955可将执行了逆MDCT的低带信号转换到频域或时/频域。
在操作2040,带宽扩展解码单元960可对编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从转换到频域或时/频域的低带信号产生高带信号。
在操作2050,逆转换单元965可将高带信号逆转换到时域。
在操作2060,如果在时域中已对编码的位平面编码,则CELP解码单元970可通过对CELP编码信息解码来产生低带信号。
在操作2070,带组合单元980可将执行了逆MDCT的信号、逆转换的高带信号与通过使用CELP解码方法解码的低带信号组合。
在操作2080,立体声解码单元990可对编码的立体声参数解码并通过使用解码的立体声参数对组合信号执行上混频。
图21示出根据本发明另一实施例的对音频信号解码的方法。
仅作为一个示例,这样的实施例可与图11中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将通过结合图11对本实施例进行简要描述,省略重复描述。
参照图21,在操作2100,解复用单元1100可接收时域或频域的编码的音频信号。这里,编码的音频信号可包括例如通过对低带信号执行基于上下文的编码获得的编码的位平面、编码的带宽扩展信息、CELP编码信息和编码的立体声参数。
在操作2110,频域解码单元可对编码的位平面执行基于上下文的解码和反量化。
在操作2120,CELP解码单元1150可对CELP编码信息解码。
在操作2130,逆FV-MLT应用单元1160可对通过频域解码单元或CELP解码单元1150解码的信号执行逆FV-MLT,从而将解码的信号逆转换到时域。
在操作2140,转换单元1165可将逆转换的信号转换到频域或时/频域。
在操作2150,带宽扩展解码单元1170可对编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从转换到频域或时/频域的信号产生全带信号。
在操作2160,立体声解码单元1180可对编码的立体声参数解码并通过使用解码的立体声参数对全带信号执行上混频。
在操作2170,逆转换单元1190可将上混频的信号逆转换到时域。
图22示出根据本发明另一实施例的对音频信号解码的方法。
仅作为一个示例,这样的实施例可与图12中示出的示例系统的示例连续处理相应,但不限于此,其它可选实施例是同等可用的。现将通过结合图12对本实施例进行简要描述,省略重复描述。
参照图22,在操作2200,解复用单元1200可接收时域或频域的编码的音频信号。这里,编码的音频信号可包括例如通过对低带信号执行基于上下文的编码获得的编码的位平面、编码的带宽扩展信息、CELP编码信息和编码的立体声参数。
在操作2210,频域解码单元可对编码的位平面执行基于上下文的解码和反量化。
在操作2220,CELP解码单元1250可对CELP编码信息解码。
在操作2230,MDCT应用单元1260可对从CELP解码单元1250输出的信号执行MDCT,从而将信号从时域转换到频域。
在操作2240,带宽扩展解码单元1270可对编码带宽扩展信息解码,并通过使用解码的带宽扩展信息从由频域解码单元或MDCT应用单元1260输出的信号产生全带信号。
在操作2250,立体声解码单元1280可对编码的立体声参数解码并通过使用解码的立体声参数对全带信号执行上混频。
在操作2260,逆FV-MLT应用单元1290可对上混频的信号执行逆FV-MLT,从而将执行了逆FV-MLT的信号逆转换到时域。
除了上述的实施例,本发明的实施例还可通过介质(例如,计算机可读介质)中/上的计算机可读码/指令来实现,以控制至少一个处理元件以实现上述任意的实施例。介质可相应于允许计算机可读码的存储和/或传输的任意介质/媒体。
可以以各种方式在介质上记录/传送计算机可读码,介质的示例包括:记录媒体,诸如磁性存储介质(例如,ROM、软盘、硬盘等)、光学记录介质(例如,CD-ROM和DVD);传输介质,诸如,例如通过互联网的载波。因此,根据本发明的实施例,介质还可以是信号,诸如结果信号或位流。介质也可是分布的网络,从而以使计算机可读码可以以分布式方式被存储和执行。此外,仅作为示例,处理元件可包括处理器或计算机处理器处理元件可分布和/或包括在单个装置中。
虽然参照本发明的不同实施例已经具体示出并描述了本发明的各方面,但是应该了解:这些示例性实施例仅被认为用于描述的目的,而不是限制的目的。一个实施例中对功能性或能力方面的任意缩小或放大不应被认为是不同实施例中的相似特征的缩小或放大,即,每个实施例中的特征或方面的描述应被认为对剩余实施例中的其它相似特征或方面是可用的。
因此,虽然已经示出和描述了一些实施例,但是该领域中的技术人员应该了解:在不背离本发明的原理和精神的情况下,可对这些实施例进行改变,本发明由权利要求及其等同物限定。
Claims (23)
1、一种对音频信号编码的方法,方法包括:
(a)从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频,成为下混频的信号;
(b)将下混频的信号分割为低带信号和高带信号;
(c)将低带信号和高带信号中的每一个从时域转换到频域;
(d)通过对转换的低带信号执行量化和基于上下文的编码产生编码的位平面;
(e)通过使用转换的低带信号产生表示转换的高带信号的特性的带宽扩展信息,并对所述带宽扩展信息编码;以及
(f)输出编码的立体声参数、编码的位平面和编码的带宽扩展信息作为对输入信号编码的结果。
2、如权利要求1所述的方法,其中,(c)的步骤包括通过对低带信号和高带信号中的每一个执行改进离散余弦变换(MDCT)来将低带信号和高带信号中的每一个从时域转换到频域。
3、如权利要求1所述的方法,还包括以下的步骤(g)和步骤(h)中的至少一个:
(g)通过对转换的低带信号执行频率线性预测来滤波转换的低带信号;以及
(h)对转换的低带信号执行多分辨率分析,
其中,(d)的步骤包括对滤波的低带信号或执行了多分辨率分析的低带信号执行量化和基于上下文的编码。
4、如权利要求3所述的方法,其中,(g)的步骤包括通过对转换的低带信号执行频率线性预测来计算线性预测滤波器的系数,并通过使用矢量指数表示系数的相应值,以及
其中,(f)的步骤包括输出编码的立体声参数、编码的位平面、编码的带宽扩展信息和矢量指数作为对输入信号编码的结果。
5、一种对音频信号编码的方法,方法包括:
(a)从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频以成为下混频的信号;
(b)将下混频的信号分割为低带信号和高带信号;
(c)通过使用第一转换方法将低带信号从时域转换到频域;
(d)通过对通过使用第一转换方法转换到频域的低带信号执行量化和基于上下文的编码产生编码的位平面;
(e)通过使用第二转换方法将低带信号和高带信号中的每一个从时域转换到频域或时/频域;
(f)通过使用通过第二转换方法转换的低带信号产生表示通过第二转换方法转换的高带信号的特性的带宽扩展信息,并对所述带宽扩展信息编码;以及
(g)输出编码的立体声参数、编码的位平面、编码的带宽扩展信息和矢量指数作为对输入信号编码的结果。
6、一种对音频信号编码的方法,方法包括:
(a)从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频,成为下混频的信号;
(b)将下混频的信号分割为低带信号和高带信号;
(c)确定在时域中还是在频域中对低带信号编码;
(d)如果确定在时域中对低带信号编码,则在时域中对低带信号编码;
(e)如果确定在频域中对低带信号编码,则通过使用第一转换方法将低带信号从时域转换到频域来产生编码的位平面,并对通过使用第一转换方法被转换到频域的低带信号执行量化和基于上下文的编码;
(f)通过使用第二转换方法将低带信号和高带信号中的每一个从时域转换到频域或时/频域;
(g)通过使用通过第二转换方法转换的低带信号产生表示通过第二转换方法转换的高带信号的特性的带宽扩展信息,并对所述带宽扩展信息编码;以及
(h)输出编码的立体声参数、编码的位平面、编码的带宽扩展信息和矢量指数作为对输入信号编码的结果。
7、如权利要求6所述的方法,其中,(f)的步骤包括:
通过使用第一转换方法将低带信号和高带信号中的每一个从时域转换到频域;以及
如果确定在频域中对低带信号编码,则将通过使用第二转换方法转换低带信号的结果替换为通过使用步骤(e)中的第一转换方法将低带信号转换到频域的结果。
8、一种具有实现对音频信号编码的方法的计算机可读代码的计算机可读介质,方法包括:
(a)从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频,成为下混频的信号;
(b)将下混频的信号分割为低带信号和高带信号;
(c)确定在时域中还是在频域中对低带信号编码;
(d)如果确定在时域中对低带信号编码,则在时域中对低带信号编码;
(e)如果确定在频域中对低带信号编码,则通过使用第一转换方法将低带信号从时域转换到频域来产生编码的位平面,并对通过使用第一转换方法被转换到频域的低带信号执行量化和基于上下文的编码;
(f)通过使用第二转换方法将低带信号和高带信号中的每一个从时域转换到频域或时/频域;
(g)通过使用通过第二转换方法转换的低带信号产生表示通过第二转换方法转换的高带信号的特性的带宽扩展信息,并对所述带宽扩展信息编码;以及
(h)输出编码的立体声参数、编码的位平面、编码的带宽扩展信息和矢量指数作为对输入信号编码的结果。
9、一种对音频信号编码的方法,方法包括:
(a)将输入信号从时域转换到频域;
(b)从转换的信号提取立体声参数,对立体声参数编码,并对转换的信号执行下混频以成为下混频的信号;
(c)从下混频的信号提取带宽扩展信息并对带宽扩展信息编码;
(d)将下混频的信号逆转换到时域;
(e)确定在时域中还是在频域中对逆转换的信号编码,并根据确定的结果通过子带将逆转换的信号转换到时域或频域;
(f)如果确定在时域中对逆转换的信号编码,则在时域中对转换到时域的信号编码;
(g)如果确定在频域中对逆转换的信号编码,则通过对转换到频域的信号执行量化和基于上下文的编码来产生编码的位平面;以及
(h)输出编码的立体声参数、编码的带宽扩展信息、在时域中的编码结果和编码的位平面作为对输入信号编码的结果。
10、如权利要求9所述的方法,其中,(e)的步骤包括通过对逆转换的信号执行频变调制重叠变换(FV-MLT)来根据确定的结果通过子带将逆转换的信号转换到时域或频域。
11、一种对音频信号编码的方法,方法包括:
(a)确定在时域中还是在频域中对输入信号编码,并根据确定的结果通过子带将输入信号转换到时域或频域;
(b)从转换的信号提取立体声参数,对立体声参数编码,并对转换的信号执行下混频以成为下混频的信号;
(c)从下混频的信号提取带宽扩展信息并对带宽扩展信息编码;
(d)如果确定在时域中对下混频的信号编码,则在时域中对下混频的信号编码;
(e)如果确定在频域中对下混频的信号编码,则通过对下混频的信号执行量化和基于上下文的编码来产生编码的位平面;以及
(f)输出编码的立体声参数、编码的带宽扩展信息、在时域中的编码结果和编码的位平面作为对输入信号编码的结果。
12、如权利要求11所述的方法,其中,(a)的步骤包括通过对输入信号执行频变调制重叠变换(FV-MLT)来根据确定的结果通过子带将输入信号转换到时域或频域。
13、一种对音频信号解码的方法,方法包括:
(a)接收编码的音频数据;
(b)通过对包括在编码的音频信号中的编码的位平面执行基于上下文的解码和反量化来产生低带信号;
(c)对包括在编码的音频信号中的编码的带宽扩展信息解码,并通过使用解码的带宽扩展信息从低带信号产生高带信号;
(d)通过使用第一转换方法将低带信号和高带信号中的每一个从频域逆转换到时域;
(e)将逆转换的低带信号与逆转换的高带信号组合;以及
(f)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
14、如权利要求13所述的方法,其中,(b)的步骤还包括以下的步骤中的至少一个:
(b1)对反量化的信号执行多分辨率合成;
(b2)通过使用包括在编码的音频信号中的矢量指数将通过编码端的频率线性预测的结果与反量化的信号或执行了多分辨率合成的信号组合。
15、一种对音频信号解码的方法,方法包括:
(a)接收编码的音频数据;
(b)通过对包括在编码的音频信号中的编码的位平面执行基于上下文的解码和反量化来产生低带信号;
(c)通过使用第一逆转换方法将低带信号从频域逆转换到时域;
(d)通过使用第一转换方法将通过第一逆转换方法逆转换的低带信号转换到频域或时/频域;
(e)将包括在编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从通过第一转换方法转换到频域或时/频域的低带信号产生高带信号;
(f)通过使用第二转换方法将高带信号逆转换到时域;
(g)将转换的低带信号与逆转换的高带信号组合;以及
(h)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
16、一种对音频信号解码的方法,方法包括:
(a)接收时域或频域的解码的音频数据;
(b)通过对包括在频域的编码的音频信号中的编码的位平面执行基于上下文的解码和反量化来产生低带信号;
(c)通过使用第一逆转换方法将低带信号逆转换到时域;
(d)将通过使用第一逆转换方法逆转换到时域的低带信号转换到频域或时/频域;
(e)将包括在频域的编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从通过第一转换方法转换到频域或时/频域的低带信号产生高带信号;
(f)通过使用第二逆转换方法将高带信号逆转换到时域;
(g)通过对时域中的时域的编码的音频信号解码来产生低带信号;
(h)对通过第一逆转换方法逆转换到时域的信号、通过第二逆转换方法逆转换到时域的高带信号以及在时域中解码的低带信号进行组合;以及
(i)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
17、如权利要求16所述的方法,其中,(b)的步骤还包括以下的步骤(b1)和步骤(b2)中的至少一个:
(b1)对反量化的位平面执行多分辨率合成;
(b2)通过使用包括在编码的音频信号中的矢量指数将通过编码端的频率线性预测的结果与反量化的位平面或执行了多分辨率合成的位平面组合,以及
其中,(e)的步骤还包括通过使用解码的带宽扩展信息从(b1)中执行了多分辨率合成的信号或(b2)中组合的信号产生高带信号。
18、一种具有实现对音频信号解码的方法的计算机可读代码的计算机可读介质,方法包括:
(a)接收时域或频域的解码的音频数据;
(b)通过对包括在频域的编码的音频信号中的编码的位平面执行基于上下文的解码和反量化来产生低带信号;
(c)通过使用第一逆转换方法将低带信号逆转换到时域;
(d)通过使用第一逆转换方法将逆转换到时域的低带信号转换到频域或时/频域;
(e)将包括在频域的编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从通过第一转换方法转换到频域或时/频域的低带信号产生高带信号;
(f)通过使用第二逆转换方法将高带信号逆转换到时域;
(g)通过对时域中的时域的编码的音频信号解码来产生低带信号;
(h)对通过第一逆转换方法逆转换到时域的信号、通过第二逆转换方法逆转换到时域的高带信号以及在时域中解码的低带信号进行组合;以及
(i)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
19、一种对音频信号解码的方法,方法包括:
(a)接收时域或频域的编码的音频数据;
(b)对包括在频域的编码的音频信号中的编码的位平面执行基于上下文的解码和反量化;
(c)在时域中对时域的编码的音频信号解码;
(d)通过对步骤(b)中反量化的信号或步骤(c)中解码的信号执行频变调制重叠变换(FV-MLT)来将步骤(b)中反量化的信号或步骤(c)中解码的信号逆转换到时域;
(e)将逆转换的低带信号转换到频域或时/频域;
(f)将包括在频域的编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从转换到频域或时/频域的信号产生全带信号;
(g)对包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对全带信号执行上混频;以及
(h)将执行了上混频的信号逆转换到时域。
20、一种对音频信号解码的方法,方法包括:
(a)接收时域或频域的编码的音频数据;
(b)对包括在频域的编码的音频信号中的编码的位平面执行基于上下文的解码和反量化;
(c)在时域中对时域的编码的音频信号解码;
(d)通过对步骤(c)中解码的信号执行改进离散余弦变换(MDCT)来将步骤(c)中解码的信号从时域转换到频域;
(e)将包括在频域的编码的音频信号中的带宽扩展信息解码,并通过使用解码的带宽扩展信息从步骤(b)中执行了基于上下文的解码的信号或步骤(d)中转换到频域的信号产生全带信号;
(f)将包括在编码的音频信号中的编码的立体声参数解码,并通过使用解码的立体声参数对全带信号执行上混频;以及
(g)通过对执行了上混频的信号执行逆频变调制重叠变换(FV-MLT)来将执行了上混频的信号逆转换到时域。
21、一种对音频信号编码的系统,系统包括:
立体声编码单元,从输入信号提取立体声参数,对立体声参数编码,并对输入信号执行下混频;
带分割单元,将执行了下混频的信号分割为低带信号和高带信号;
模式确定单元,确定在时域中还是在频域中对低带信号编码;
码激励线性预测(CELP)编码单元,如果确定在时域中对低带信号编码,则通过使用CELP编码方法对低带信号编码;
改进离散余弦变换(MDCT)应用单元,如果确定在频域中对低带信号编码,则通过对低带信号执行MDCT将低带信号从时域转换到频域;
低带编码单元,通过对执行了MDCT的低带信号执行量化和基于上下文的编码来产生编码的位平面;
转换单元,将低带信号和高带信号中的每一个从时域转换到频域或时/频域;和
带宽扩展编码单元,通过使用转换的低带信号产生并编码表示转换的高带信号的特性的带宽扩展信息。
22、如权利要求21所述的系统,其中,转换单元通过对低带信号和高带信号中的每一个执行MDCT来将低带信号和高带信号中的每一个从时域转换到频域,以及
其中,如果确定在频域中对低带信号编码,则从转换单元输出的低带信号被替换为从MDCT应用单元输出的低带信号。
23、一种对音频信号解码的系统,系统包括:
低带解码单元,通过对在频域中编码的位平面执行基于上下文的解码和反量化来产生低带信号;
逆改进离散余弦变换(MDCT)应用单元,通过对低带信号执行逆MDCT将低带信号逆转换到时域;
转换单元,将执行了逆MDCT的低带信号转换到频域或时/频域;
带宽扩展解码单元,将在频域中编码的编码的带宽扩展信息解码,并通过使用解码的带宽扩展信息从转换到频域或时/频域的低带信号产生高带信号;
码激励线性预测(CELP)解码单元,通过使用CELP解码方法通过对CELP编码信息解码来产生低带信号;
带组合单元,对执行了逆MDCT的信号、逆转换到时域的高带信号以及使用CELP解码方法解码的低带信号进行组合;和
立体声解码单元,对编码的立体声参数解码,并通过使用解码的立体声参数对组合的信号执行上混频。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2006-0092459 | 2006-09-22 | ||
KR20060092459 | 2006-09-22 | ||
KR1020060092459 | 2006-09-22 | ||
KR1020070086337 | 2007-08-28 | ||
KR1020070086337A KR101435893B1 (ko) | 2006-09-22 | 2007-08-28 | 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치 |
KR10-2007-0086337 | 2007-08-28 | ||
PCT/KR2007/004653 WO2008035949A1 (en) | 2006-09-22 | 2007-09-21 | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101518083A true CN101518083A (zh) | 2009-08-26 |
CN101518083B CN101518083B (zh) | 2012-11-14 |
Family
ID=39414288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780035230XA Expired - Fee Related CN101518083B (zh) | 2006-09-22 | 2007-09-21 | 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和系统 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101435893B1 (zh) |
CN (1) | CN101518083B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106960672A (zh) * | 2017-03-30 | 2017-07-18 | 国家计算机网络与信息安全管理中心 | 一种立体声音频的带宽扩展方法与装置 |
CN109410966A (zh) * | 2013-04-05 | 2019-03-01 | 杜比国际公司 | 音频编码器和解码器 |
CN109599123A (zh) * | 2017-09-29 | 2019-04-09 | 中国科学院声学研究所 | 基于遗传算法优化模型参数的音频带宽扩展方法及系统 |
US10291195B2 (en) | 2006-02-07 | 2019-05-14 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10313791B2 (en) | 2013-10-22 | 2019-06-04 | Bongiovi Acoustics Llc | System and method for digital signal processing |
CN110010140A (zh) * | 2013-04-05 | 2019-07-12 | 杜比国际公司 | 立体声音频编码器和解码器 |
WO2020001570A1 (zh) * | 2018-06-29 | 2020-01-02 | 华为技术有限公司 | 立体声信号的编码方法、解码方法、编码装置和解码装置 |
CN110648674A (zh) * | 2013-09-12 | 2020-01-03 | 杜比国际公司 | 多声道音频内容的编码 |
US10666216B2 (en) | 2004-08-10 | 2020-05-26 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10701505B2 (en) | 2006-02-07 | 2020-06-30 | Bongiovi Acoustics Llc. | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US10848118B2 (en) | 2004-08-10 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10848867B2 (en) | 2006-02-07 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10959035B2 (en) | 2018-08-02 | 2021-03-23 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US10999695B2 (en) | 2013-06-12 | 2021-05-04 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two channel audio systems |
US11211043B2 (en) | 2018-04-11 | 2021-12-28 | Bongiovi Acoustics Llc | Audio enhanced hearing protection system |
US11284854B2 (en) | 2014-04-16 | 2022-03-29 | Bongiovi Acoustics Llc | Noise reduction assembly for auscultation of a body |
US11431312B2 (en) | 2004-08-10 | 2022-08-30 | Bongiovi Acoustics Llc | System and method for digital signal processing |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3162807C (en) | 2009-01-16 | 2024-04-23 | Dolby International Ab | Cross product enhanced harmonic transposition |
KR101622950B1 (ko) | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
AU2011237882B2 (en) | 2010-04-09 | 2014-07-24 | Dolby International Ab | MDCT-based complex prediction stereo coding |
KR101697550B1 (ko) | 2010-09-16 | 2017-02-02 | 삼성전자주식회사 | 멀티채널 오디오 대역폭 확장 장치 및 방법 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100668319B1 (ko) * | 2004-12-07 | 2007-01-12 | 삼성전자주식회사 | 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치 |
-
2007
- 2007-08-28 KR KR1020070086337A patent/KR101435893B1/ko not_active IP Right Cessation
- 2007-09-21 CN CN200780035230XA patent/CN101518083B/zh not_active Expired - Fee Related
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10666216B2 (en) | 2004-08-10 | 2020-05-26 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US11431312B2 (en) | 2004-08-10 | 2022-08-30 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10848118B2 (en) | 2004-08-10 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10701505B2 (en) | 2006-02-07 | 2020-06-30 | Bongiovi Acoustics Llc. | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
US10291195B2 (en) | 2006-02-07 | 2019-05-14 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10848867B2 (en) | 2006-02-07 | 2020-11-24 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US11425499B2 (en) | 2006-02-07 | 2022-08-23 | Bongiovi Acoustics Llc | System and method for digital signal processing |
CN109410966B (zh) * | 2013-04-05 | 2023-08-29 | 杜比国际公司 | 音频编码器和解码器 |
CN110010140A (zh) * | 2013-04-05 | 2019-07-12 | 杜比国际公司 | 立体声音频编码器和解码器 |
CN110010140B (zh) * | 2013-04-05 | 2023-04-18 | 杜比国际公司 | 立体声音频编码器和解码器 |
US11631417B2 (en) | 2013-04-05 | 2023-04-18 | Dolby International Ab | Stereo audio encoder and decoder |
CN109410966A (zh) * | 2013-04-05 | 2019-03-01 | 杜比国际公司 | 音频编码器和解码器 |
US10999695B2 (en) | 2013-06-12 | 2021-05-04 | Bongiovi Acoustics Llc | System and method for stereo field enhancement in two channel audio systems |
CN110648674A (zh) * | 2013-09-12 | 2020-01-03 | 杜比国际公司 | 多声道音频内容的编码 |
CN110648674B (zh) * | 2013-09-12 | 2023-09-22 | 杜比国际公司 | 多声道音频内容的编码 |
US11418881B2 (en) | 2013-10-22 | 2022-08-16 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US10917722B2 (en) | 2013-10-22 | 2021-02-09 | Bongiovi Acoustics, Llc | System and method for digital signal processing |
US10313791B2 (en) | 2013-10-22 | 2019-06-04 | Bongiovi Acoustics Llc | System and method for digital signal processing |
US11284854B2 (en) | 2014-04-16 | 2022-03-29 | Bongiovi Acoustics Llc | Noise reduction assembly for auscultation of a body |
CN106960672A (zh) * | 2017-03-30 | 2017-07-18 | 国家计算机网络与信息安全管理中心 | 一种立体声音频的带宽扩展方法与装置 |
CN109599123B (zh) * | 2017-09-29 | 2021-02-09 | 中国科学院声学研究所 | 基于遗传算法优化模型参数的音频带宽扩展方法及系统 |
CN109599123A (zh) * | 2017-09-29 | 2019-04-09 | 中国科学院声学研究所 | 基于遗传算法优化模型参数的音频带宽扩展方法及系统 |
US11211043B2 (en) | 2018-04-11 | 2021-12-28 | Bongiovi Acoustics Llc | Audio enhanced hearing protection system |
US11462223B2 (en) | 2018-06-29 | 2022-10-04 | Huawei Technologies Co., Ltd. | Stereo signal encoding method and apparatus, and stereo signal decoding method and apparatus |
WO2020001570A1 (zh) * | 2018-06-29 | 2020-01-02 | 华为技术有限公司 | 立体声信号的编码方法、解码方法、编码装置和解码装置 |
US11790923B2 (en) | 2018-06-29 | 2023-10-17 | Huawei Technologies Co., Ltd. | Stereo signal encoding method and apparatus, and stereo signal decoding method and apparatus |
US10959035B2 (en) | 2018-08-02 | 2021-03-23 | Bongiovi Acoustics Llc | System, method, and apparatus for generating and digitally processing a head related audio transfer function |
Also Published As
Publication number | Publication date |
---|---|
CN101518083B (zh) | 2012-11-14 |
KR20080027129A (ko) | 2008-03-26 |
KR101435893B1 (ko) | 2014-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101518083B (zh) | 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和系统 | |
KR100949232B1 (ko) | 인코딩 장치, 디코딩 장치 및 그 방법 | |
KR101171098B1 (ko) | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 | |
KR101393298B1 (ko) | 적응적 부호화/복호화 방법 및 장치 | |
KR101238239B1 (ko) | 인코더 | |
US20080077412A1 (en) | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding | |
JP2009524100A (ja) | 符号化/復号化装置及び方法 | |
CN101568959B (zh) | 用带宽扩展进行编码和/或解码的方法 | |
CN101371296B (zh) | 用于编码和解码信号的设备和方法 | |
JP4272897B2 (ja) | 符号化装置、復号化装置およびその方法 | |
KR20100086000A (ko) | 오디오 신호 처리 방법 및 장치 | |
KR101346358B1 (ko) | 대역폭 확장 기법을 이용한 오디오 신호의 부호화/복호화방법 및 장치 | |
US6678655B2 (en) | Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope | |
KR20090043921A (ko) | 멀티 채널 신호의 부호화/복호화 방법 및 장치 | |
CN104025189A (zh) | 编码语音信号的方法、解码语音信号的方法,及使用其的装置 | |
US20080071550A1 (en) | Method and apparatus to encode and decode audio signal by using bandwidth extension technique | |
JP5629319B2 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
US9830919B2 (en) | Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method | |
JP3297749B2 (ja) | 符号化方法 | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
CN103733256A (zh) | 音频信号处理方法、音频编码设备、音频解码设备和采用所述方法的终端 | |
KR101455648B1 (ko) | 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템 | |
Annadana et al. | A new low bit rate speech coding scheme for mixed content | |
KR20140042836A (ko) | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20121114 Termination date: 20190921 |