CN1942928B - 用于处理音频信号的模块和方法 - Google Patents
用于处理音频信号的模块和方法 Download PDFInfo
- Publication number
- CN1942928B CN1942928B CN2005800114923A CN200580011492A CN1942928B CN 1942928 B CN1942928 B CN 1942928B CN 2005800114923 A CN2005800114923 A CN 2005800114923A CN 200580011492 A CN200580011492 A CN 200580011492A CN 1942928 B CN1942928 B CN 1942928B
- Authority
- CN
- China
- Prior art keywords
- parameter
- signal
- module
- frequency band
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 58
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012545 processing Methods 0.000 title description 3
- 230000008859 change Effects 0.000 claims abstract description 21
- 238000005070 sampling Methods 0.000 claims description 36
- 230000005284 excitation Effects 0.000 claims description 22
- 238000005086 pumping Methods 0.000 claims description 10
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000004590 computer program Methods 0.000 abstract description 5
- 239000013598 vector Substances 0.000 description 14
- 239000002131 composite material Substances 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000007480 spreading Effects 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
本发明涉及一种编码器(1),包括用于输入频段内的音频信号帧的输入(1.2),用于将频段划分为至少较低频段和较高频段的分析滤波器(1.3),用于对较低频段的音频信号进行编码的第一编码块(1.4.1),用于对较高频段的音频信号进行编码的第二编码块(1.4.2),以及用于在至少第一模式和第二模式之间选择编码器的工作模式的模式选择器。在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。编码器(1)进一步包括缩放器,以关联于编码器的工作模式的变化,控制第二编码块(1.4.2)渐进地改变第二编码块(1.4.2)的编码属性。本发明还涉及一种设备、解码器、方法、模块、计算机程序产品和信号。
Description
技术领域
本发明涉及一种用于对包括参数的比特流进行处理以解码所述比特流的模块块,该比特流是从被划分的频段内的音频信号帧进行编码而来的,为该信号定义至少第一模式和第二模式,在第一模式中只对较低频段上的信号进行编码,在第二模式中对较低和较高频段上的信号进行编码。本发明还涉及一种设备,包括该模块。本发明进一步涉及一种用于处理频段内的音频信号的方法,将该频段划分为至少较低频段和较高频段,对较低频段的音频信号进行编码以形成与所述较低频段相关的该信号的参数,对较高频段的音频信号进行编码以形成与所述较高频段相关的该信号的参数,以及在至少第一模式和第二模式之间选择编码音频信号的模式,在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。本发明涉及一种包括机器可执行步骤的计算机程序产品,该步骤用于压缩被至少划分为较低频段和较高频段的频段内的音频信号,用于对较低频段的音频信号进行编码,用于对较高频段的音频信号进行编码,以及用于在至少第一模式和第二模式之间选择编码的模式,在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。本发明涉及一种包括比特流的信号,
其包括用于解码器解码比特流的参数,该比特流是由频段内的音频信号帧编码而来的,该频段被划分为至少较低频段和较高频段,并且为该信号定义至少第一模式和第二模式,在第一模式中,只对较低频段上的信号进行编码,在第二模式中,对较低和较高频段上的信号进行编码。
背景技术
在很多音频信号处理应用中,对音频信号进行压缩以降低处理音频信号时的处理能力要求。例如,在数字通信系统中,音频信号通常作为模拟信号被捕捉到,在模拟-数字(A/D)转换器中进行数字化,并继而进行编码,之后在移动站等用户设备和基站之间的无线空中接口上进行传输。编码的目的是压缩所数字化的信号,并且以最小的数据量在空中接口上传输,同时保持可接受的信号质量等级。由于在蜂窝通信网络中,无线空中接口上的无线信道容量有限,这点非常重要。还有一些应用中,将所数字化音频信号存储在存储介质中,用以日后对音频信号进行再现。
压缩可以是有损或者无损的。在有损压缩中,在压缩期间会丢失某些信息,其中,不可能从所压缩信号中完全重建原始信号。在无损压缩中,通常不会丢失信息。因此,通常可以从所压缩信号中完全重建原始信号。
在电话业务中,语音的带宽通常限制在大约200Hz和3400Hz之间。A/D转换器用以将模拟语音信号转换为数字信号的典型采样率或者是8kHz,或者是16kHz。音乐或者非语音信号可包含高于普通语音带宽的频率分量。在某些应用中,音频系统应当能够处理大约20Hz至20000kHz之间的频段。那种信号的采样率应当至少为40000kHz,以避免混叠。应当注意到,上述各值只是非限制的示例。例如,在某些系统中,音乐信号的较高限制可能远远低于所述20000kHz。
然后对所采样的数字信号进行编码,通常在一帧一帧的基础上,得到数字数据流,其比特率由用于编码的编解码器确定。比特率越高,所编码的数据就越多,这使得对输入帧的表示越准确。然后可以对所编码的音频信号进行解码,使其通过数字一模拟(D/A)转换器,以重建尽可能接近原始信号的信号。
理想的编解码器将使用尽可能少的比特对音频信号进行编码,由此优化信道容量,同时产生所解码的音频信号,该信号尽可能与原始音频信号接近。实际上,编解码器的比特率和所解码音频的质量之间通常存在一种折衷。
目前,存在多种不同的编解码器,例如,自适应多速率(AMR)编解码器、自适应多速率宽带(AMR-WB)编解码器以及扩展自适应多速率宽带(AMR-WB+)编解码器,其为用于对音频信号进行压缩和编码而开发。AMR由第三代合作伙伴计划(3GPP)开发,用于GSM/EDGE和WCDMA通信网络。另外,还考虑到,AMR将在分组交换网络中使用。AMR基于代数码激励线性预测(ACELP)编码。AMR、AMR WB和AMR WB+编解码器分别包括8、9和12激活比特率,并且还包括语音激活检测(VAD)和非连续传输(DTX)功能。目前,AMR编解码器中的采样率是8kHz,AMR-WB编解码器中的采样率是16kHz。显然,上述编解码器、编解码模式和采样率只是非限制性的示例。
音频编解码器带宽扩展算法通常应用编码功能以及来自核心编解码器的编码参数。也就是,将所编码的音频带宽分为两个,其中较低频段由核心编解码器处理,较高频段则使用来自核心频段(例如,较低频 段)的编码参数和信号的知识进行编码。由于在大多数情况下,低和高音频段彼此相关,也可以在某种程度上在高频段内使用低频段参数。使用来自低频段编码器的参数以有助于高频段编码显著降低了高频段编码的比特率。
分频段编码算法的一个示例是扩展AMR-WB(AMR-WB+)编解码器。核心编码器包含全部源信号编码算法,而高频段编码器的LPC激励信号是从核心编码器复制而来或者是在本地生成的随机信号。
低频段编码使用代数码激励线性预测(ACELP)类型或者基于变换的算法。基于输入信号特性在算法之间进行选择。ACELP算法通常用于语音信号以及用于短暂信号,而音乐和声调形式的信号通常使用变换编码进行编码,以更好地处理频率解析度。
高频段编码使用线性预测编码,以对高频段信号的频谱包络进行建模。为了节省比特率,激励信号是通过将低频段激励向上采样至高频段来生成的。也就是,通过将其变换至高频段,在高频段重新使用低频段激励。另一种方法用于生成高频段的随机激励信号。通过经由高频段LPC模型过滤该缩放了的激励信号,重建合成的高频段信号。
扩展AMR-WB(AMR-WB+)编解码器应用分频段结构,其中,在编码过程之前将音频带宽划分为两部分。对两个频段进行独立的编码。但是,为了最小化比特率,使用上述带宽扩展技术对较高频段进行编码,其中,高频段编码部分依赖于低频段编码。在这种情况下,用于线性预测编码(LPC)合成的高频段激励信号是从低频段编码器复制而来的。在AMR-WB+编解码器中,低频段范围是从0至6.4kHz,而高频段对于16kHz的采样频率是从6.4至8kHz,对于24kHz的采样率是从6.4至12kHz。
在音频流期间,AMR-WB+编解码器也能够在模式之间切换,只要采样频率没有发生变化。从而,可能在AMR-WB模式和使用16kHz采样频率的扩展模式之间进行切换。例如可以在传输条件需要从较高比特率模式(扩展模式)变化为较低比特率模式(AMR-WB模式)时使用这个功能,以降低网络中的拥塞。相似地,如果网络条件的变化允许从较低比特率模式变化为较高比特率模式以实现更好的音频质量,AMR-WB+可以从 AMR-WB模式变化为其中一种扩展模式。从使用高频段扩展编码的编码模式变化为仅仅使用核心频段编码的模式可以简单地通过在这种模式发生变化时立即切断高频段扩展来实现。相似地,当从核心频段模式变化为使用高频段扩展的模式时,通过开启高频段扩展,立即全面引入高频段。由于带宽扩展编码,AMR-WB+扩展模式所提供的音频带宽宽于AMR-WB模式的带宽,这可能在切换发生太快时引起令人讨厌的听觉效果。用户可能认为在从较宽音频段变化为较窄音频段时,也就是,从扩展模式变化为AMR-WB模式时,可听到音频带宽的这种变化尤其令人烦扰。
发明内容
本发明的一个目的在于提供一种改进的方法,用于在编码器中对音频信号进行编码,以用于在具有不同带宽的模式之间切换时降低令人烦扰的听觉效应。
本发明所基于的思想是,当从窄带模式(AMR-WB模式)到宽带模式(AMR-WB+)的变化发生时,不是立即开启高频段扩展,而只是缓慢地将幅度提高至最终值,以避免太快速的变化。相似地,当从宽带模式变化为窄带模式时,不是立即切断高频段扩展的影响,而是渐进地缩小,以避免干扰效应。
根据本发明,通过使用于高频段合成的激励增益乘以在所选时间窗口内从零到一以小步长增长的缩放因子,在参数等级上实现高频段扩展信号的这种渐进地引入。在例如AMR-WB+编解码器中,可以使用320ms(4个80ms的AMR-WB+帧)的窗口长度,以提供高频段音频影响足够缓的斜度。以高频段音频影响斜度的相同方式,在这种情况下,通过使用于高频段合成的扩展增益乘以在所选时间段内从一到零以小步长降低的缩放因子,可以在参数等级上实现高频段信号的渐进结束。但是,在这种情况下,我们并不在实际切换至核心频段模式发生时就更新可用高频段扩展的参数。但是,可以通过使用在切换为核心模式之前最后一帧所接收的高频段扩展参数以及从在核心模式中所接收的帧中获得的激励信号执行高频段合成。这个方法的一个稍作修改的版本将在切换之后修改用于高频段合成的LPC参数,其方式使得,LPC滤波器的频率响应渐进地逼近更平坦的频谱。例如,这可以通过计算实际所接收LPC滤波器和在ISP域内提供平坦频谱的LPC滤波器的加权平均值来实现。这种方法可能在具有高频段扩展参数的最后一帧碰巧包括清晰的频谱峰值的情况下提供改进的音频质量。
依照本发明的方法提供与时域中直接缩放相似的效果,而在参数等级上进行缩放是在计算上更加有效的解决方案。
依照本发明的模块主要特征在于,编码器进一步包括缩放器,以关联于编码器的工作模式的变化,渐进地改变与所述较高频段相关的该信号的至少一个参数。
依照本发明的方法主要特征在于,关联于工作模式的变化,渐进地改变与所述较高频段相关的该信号的至少一个参数。
依照本发明的计算机程序产品主要特征在于,计算机程序产品进一步包括机器可读步骤,用于关联于工作模式的变化,渐进地改变编码属性。
依照本发明的信号主要特征在于,在所述第一模式和所述第二模式之间变化时,渐进地改变有关所述较高频段的信号参数中的至少一个。与上述现有技术方法相比较,本发明提供一种用于降低由于在不同带宽模式之间切换而产生的听觉效果的解决方案。因此,可以改进音频信号质量。本发明提供与时域中直接缩放相似的功能,而且,在参数等 级上执行缩放是在计算上更加有效的解决方案。
附图说明
图1表示有关依照本发明使用两个频段滤波器组以及用于每个音频段的独立编码和解码块的分频段编码解码概念的简化图,
图2表示依照本发明的编码设备的一个示例性实施方式,
图3表示依照本发明的解码设备的一个示例性实施方式,
图4a表示在现有技术编码器中从窄带到宽带的频段切换的频谱图,
图4b表示在本发明一个实施方式的编码器中从窄带到宽带的频段切换的频谱图,
图4c表示当在现有技术编码器以及在本发明一个实施方式的编码器中频段从窄带切换为宽带时,时间轴上所编码高频段信号的能量,
图5a表示在现有技术编码器中从宽带到窄带的频段切换的频谱图,
图5b表示在本发明一个实施方式的编码器中从宽带到窄带的频段切换的频谱图,
图5c表示当在现有技术编码器以及在本发明一个实施方式的编码器中频段从宽带切换为窄带时,时间轴上所编码的高频段信号的能量,
图6表示依照本发明的一个系统示例。
具体实施方式
图1表示依照本发明一个示例实施方式使用两个频段滤波器组以及对于每个音频段使用独立编码和解码块的分频段编码和解码概念。来自信号源1.2的输入信号首先通过分析滤波器1.3进行处理,在分析滤波器1.3中,将音频段划分为至少两个音频段,也就是,划分为较低频率音频段和较高频率音频段,并且临界地进行向下采样。然后分别在第一编码块1.4.1中对较低频率音频段进行编码,并且在第二编码块1.4.2中对较高频率音频段进行编码。音频段基本上彼此独立地进行编码。将复用的比特流从发射设备1通过通信信道2传送至接收设备3,在接收设备3中,分别独立地在第一解码块3.3.1和第二解码块3.3.2中对低 频段和高频段进行解码。将所解码的信号进行向上采样至原始采样频率,在这之后,合成滤波器组3.4合并所解码的音频信号,以形成合成音频信号3.5。
在工作于16kHz采样音频信号的AMR-WB+的情况下,将8kHz音频段划分为0-6.4和6.4-8kHz频段。在分析滤波器1.3之后,使用临界向下采样。也就是,低频段向下采样至12.8kHz(=2*(0-6.4)),将高频段重新采样至3.2kHz(=2*(8-6.4))。
例如,第一编码块1.4.1(低频段编码器)和第一解码块3.3.1(低频段解码器)可以是AMR-WB标准编码器和解码器,而第二编码块1.4.2(高频段编码器)和第二解码器3.3.2(高频段解码器)可以实现为独立编码算法,实现为带宽扩展算法或者实现为这些的组合。
在下文中,将参考图2详细描述依照本发明一个示例性实施方式的编码设备1。编码设备1包括输入块1.2,用于在必要时对输入信号进行数字化、滤波以及成帧。输入信号的数字化由输入采样器1.2.1以输入采样频率实现。在一个示例性实施方式中,输入采样器频率或者是16kHz,或者是24kHz,但是显然也可以使用其它采样频率。在这里应当注意到,输入信号的形式可能已经适用于进行编码过程。例如,可能在前面的阶段已经对输入信号进行了数字化,并且存储在存储介质中(未示出)。将输入信号的帧输入到分析滤波器1.3。分析滤波器1.3包括滤波器组,其中,将音频段划分为两个或多个音频段。在这个实施方式中,滤波器组包括第一滤波器1.3.1和第二滤波器1.3.2。例如,第一滤波器1.3.1是在较低音频段的上限处具有截止频率的低通滤波器。例如,截止频率大约是6.4kHz。例如,第二滤波器1.3.2是带通滤波器,其带宽从第一滤波器1.3.1的截止频率上至音频段的上限。例如,对于16kHz采样频率带宽是6.4kHz-8kHz,对于24kHz采样频率带宽是6.4kHz-12kHz。如果在编码器1.4输入处,音频信号的频段上限小于或者等于采样频率的一半时,第二滤波器1.3.2也可能是高通滤波器,也就是,只有低于上限的频率通过分析滤波器1.3。也可能将音频段划分为多于两个的音频段,其中,分析滤波器可包括用于每个音频段的滤波 器。但是,在下文中假设,只使用两个音频段。
对滤波器组的输出进行临界向下采样,以降低传输音频信号所必要的比特率。在第一采样器1.3.3中对第一滤波器1.3.1的输出进行向下采样,在第二采样器1.3.4中对第二滤波器1.3.2的输出进行向下采样。例如,第一采样器1.3.3的采样频率是第一滤波器1.3.1带宽的一半。例如,第二采样器1.3.4的采样频率是第二滤波器1.3.2带宽的一半。在这个示例性实施方式中,第一采样器1.3.3的采样频率是1 2.8kHz,第二采样器1.3.4的采样频率对于16kHz的输入音频信号采样频率是6.4kHz,对于24kHz的输入音频信号采样频率是11.2kHz。
来自第一采样器1.3.3的采样输入到第一编码块1.4.1中进行编码。来自第二采样器1.3.4的采样分别输入到第二编码块1.4.2中进行编码。第一编码块1.4.1分析该采样,以确定哪种激励方法是最适合的一种用于对输入信号进行编码的方法。可能有两种或多种激励方法供选择。例如,对非语音(或者非语音形式)信号(例如,音乐)选择第一激励方法,对语音(或者语音形式)信号选择第二激励方法。第一激励方法产生例如TCX激励信号,并且第二激励方法产生例如ACELP激励信号。
在选择激励方法之后,在第一编码块1.4.1中在一帧一帧的基础上对采样进行LPC分析,以找到与输入信号最佳匹配的参数组。存在一些可供选择的方法实现这个目的,并且这些方法为本领域中熟练的技术人员所已知,其中不必在本申请中描述LPC分析的细节。
将所选激励方法的信息以及LPC参数传送至第二编码块1.4.2。在第二编码块1.4.2使用在第一编码块1.4.1中产生的相同激励。在这个示例性实施方式中,通过将较低频率音频段激励向上采样至较高频率音频段,产生第二编码块1.4.2的激励信号。也就是,通过将其变换至较高频率音频段,在高频段处重新使用低频段激励。用于描述AMR-WB+编解码器中较高频率音频信号的参数是LPC合成滤波器,其定义所合成信号的频谱特性,以及一组用于控制所合成音频的幅度的激励信号的增益参数。
例如,在量化和信道编码块1.5中对第一编码块1.4.1和第二编码块1.4.2所生成的LPC参数和激励参数进行量化和信道编码,并且在传输至传输信道,例如,通信网络604(图6)之前,将其由流生成块1.6合并(复用)在同一个传输流中。但是,不必传送参数,而是例如可以将其存储在存储介质中,并且在后面的阶段取回以进行传输和/或解码。
下面,将详细描述当在第一编码模式和第二编码模式之间进行切换时依照本发明一个示例实施方式的方法。第一编码块例如是窄带编码模式,第二编码模式例如是宽带编码模式。
定义指示模式变化持续时间长度的时间参数T。时间参数T用于渐进地改变编码模式。时间参数的值例如是320ms,其等于帧长度F(AMR-WB+编码器中为80ms)的四倍。显然,也可以对时间参数T使用其它值。还定义乘数M以及步长值S,以在模式变化期间由第二编码块使用。定义步长值,使得其指示在模式变化时使用多大的步长。例如,如果时间参数T等于四个帧(4*FL),则步长值等于0.25(=1/4),也就是,可以通过将帧长度除以时间参数计算步长值(=F/T)。
首先,假设编码器1使用第一编码模式,并且将进行到第二编码模式的变化。在第一编码块1.4.1中继续较低频率音频信号的编码,如上所述。将模式指示器(未示出)设定为一个状态,指示选择了第二编码模式。除此之外,如果必要,将编码模式的信息和LPC参数以及其它参数从第一编码块1.4.1传送至第二编码块1.4.2。在第二编码块1.4.2中,并未由此使用所接收的LPC参数,而是进行对至少某些参数的修改。将乘数M设置为零。在这之后,通过将LPC增益参数组乘以乘数M,对LPC增益参数组进行修改。在当前帧(一组采样)的编码过程中,第二编码块1.4.2使用所修改的LPC参数。然后,对于下一帧,乘数M增加步长值S,并且如上所述地对LPC增益参数组进行修改。对于每个连续帧重复上述过程,直至乘数M到达值1,从那开始使用1,并且继续编码器1的第二编码模式(宽带模式)工作。
接下来,假设编码器1正在使用第二编码模式,并且进行到第一编码模式的变化。在第一编码块1.4.1中继续较低频率音频信号的编码, 如上所述。将模式指示器设定为一个状态,指示选择了第一编码模式。在这个阶段,并未将编码模式的信息和LPC参数从第一编码块1.4.1正常传送至第二编码块1.4.2。因此,对于将要工作的编码模式的渐进变化,某些安排是必要的。在第一可供选择的实施方式中,第二编码块1.4.2已经存储了在对模式变化之前的最后一帧进行编码中所用的LPC参数。然后,将乘数M设定为一,LPC增益参数组乘以乘数M,并且在对模式变化之后的第一帧进行编码中使用修改的LPC增益参数组。对于后面的帧,乘数M减少步长值S,使LPC参数组乘以乘数M,并且对那个帧进行编码。重复上述步骤(改变乘数值,修改LPC参数组,以及对帧进行编码),直至乘数到达零值。在那之后,只有第一编码块1.4.1继续编码过程。
作为一个示例,用于放大和缩小的向量可以如下所示。向量包含64个元素,表示一个元素用于5ms子帧。这表示,在320ms期间进行放大/缩小。
gain_hf_ramp[64]=
{0.01538461538462,0.03076923076923,
0.04615384615385,0.06153846153846,
0.07692307692308,0.09230769230769,
0.10769230769231,0.12307692307692,
0.13846153846154,0.15384615384615,
0.16923076923077,0.18461538461538,
0.20000000000000,0.21538461538462,
0.23076923076923,0.24615384615385,
0.26153846153846,0.27692307692308,
0.29230769230769,0.30769230769231,
0.32307692307692,0.33846153846154,
0.35384615384615,0.36923076923077,
0.38461538461538,0.40000000000000,
0.41538461538462,0.43076923076923,
0.44615384615385,0.46153846153846,
0.47692307692308,0.49230769230769,
0.50769230769231,0.52307692307692,
0.53846153846154,0.55384615384615,
0.56923076923077,0.58461538461538,
0.60000000000000,0.61538461538462,
0.63076923076923,0.64615384615385,
0.66153846153846,0.67692307692308,
0.69230769230769,0.70769230769231,
0.72307692307692,0.73846153846154,
0.75384615384615,0.76923076923077,
0.78461538461538,0.80000000000000,
0.81538461538462,0.83076923076923,
0.84615384615385,0.86153846153846,
0.87692307692308,0.89230769230769,
0.90769230769231,0.92307692307692,
0.93846153846154,0.95384615384615,
0.96923076923077,0.98461538461538}
当在第二编码块1.4.2中对较高频段进行放大时,第二编码块1.4.2的激励增益乘以值1,其索引指向缩放向量。索引值是5ms编码子帧的个数。因此,在模式切换之后,在第一子帧(5ms)中,第二编码块1.4.2的激励增益乘以缩放向量的第一元素。在第二子帧(5ms)中,第二编码块1.4.2的激励增益乘以缩放向量的第二元素,等等。
当在第二编码块1.4.2中对较高频段进行缩小时,第二编码块1.4.2的激励增益也乘以值1,其索引指向缩放向量。索引值是5ms编码子帧的个数,但是反向索引指针。因此,在模式切换之后,在第一子帧(5ms)中,第二编码块1.4.2的激励增益乘以缩放向量的最后一个元素。在第二子帧(5ms)中,第二编码块1.4.2的激励增益乘以缩放向量的倒数第二个元素,等等。
当对较高频段进行缩小(例如,模式从AMR-WB+切换为AMR-WB)时,第二编码块1.4.2的最后一个编码语音参数(LPC参数、激励和激励增益)用于在不使用第二编码块1.4.2的工作模式时在第一个320ms期间生成较高频段。
一个示例伪代码可以如下所述:
ExcGain2=ExcGain2*gain_hf_ramp(ind)
Exc_hf(1:n)=ExcGain2*Exc_lf(1:n)
0utput_hf=synth(LPC_hf,exc_hf,mem),
其中
ExcGain2=Excitation_gain_in_the_second_encoding_block
gain_hf_ramp=缩放向量
Exc_lf=来自第一编码块的激励向量(带宽0-6,4kHz)
Exc_hf=来自第二编码块的激励向量(带宽6,4-8,0kHz)
0utput_hf=对于较高频段的合成信号
Synth=建立合成信号的函数
LPC=LP滤波器系数
Mem=LP滤波器的存储器
这个方法的一个稍作修改的版本将在切换之后修改用于高频率音频段合成的LPC参数,其方式使得,LPC滤波器的频率响应渐进地逼近更加平坦的频谱。例如,这可以通过计算实际所接收的LPC滤波器以及在ISP域中提供平坦频谱的LPC滤波器的加权平均来实现。在具有较宽带宽扩展参数的最后一帧碰巧包括清晰的频谱峰值的情况下,这种方法可能提供改进的音频质量。
也可以基于以诸如LPC或者其它参数为基础的音频信号特性,自适应地实现放大/缩小。代替线性的缩放向量,缩放向量也可以是非线性的。缩放向量也可以对于放大和缩小有所不同。
在下面,将参考图3详细描述依照本发明的解码设备3。从传输信道2接收到所编码的音频信号。解复用器3.1将属于较低频率音频段的参数信息解复用到第一比特流,将属于较高频率音频段的参数信息解复 用到第二比特流。然后在必要时,在信道解码和反量化块3.2中对比特流进行信道解码以及反量化。
第一信道解码比特流包含第一编码块1.4.1所生成的LPC参数和激励参数,并且在使用宽带模式时,第二信道解码比特流包含第二编码块1.4.2所生成的LPC增益组和其它LPC参数(描述LPC滤波器特性的参数)。
将第一比特流输入到第一解码块3.3中,其依照所接收的LPC增益和其它参数进行LPC滤波(低频段LPC合成滤波),以形成合成的较低频率音频段信号。在滤波器3.3.1之后有一个第一向上采样器3.3.2,用于将所解码和滤波的信号采样至原始采样频率。
当在比特流中存在时,将第二比特流输入到第二解码块3.4中,其依照所接收的LPC增益和其它参数进行LPC滤波(高频段LPC合成滤波),以形成合成的较高频率音频段信号。在乘法器3.4.1中,将第一比特流的激励参数乘以LPC增益参数组。将所乘的激励参数输入到滤波器3.4.2,其中,也输入第二比特流的其它LPC参数。滤波器3.4.2在输入到滤波器3.4.2的参数的基础上,重建较高频率音频段信号。在滤波器3.4.2之后有一个第二向上采样器3.4.3,用于将所解码和滤波的信号采样至原始采样频率。
第一向上采样器3.3.2的输出与合成滤波器组3.5的第一滤波器3.5.1相连。分别地,第二向上采样器3.4.3的输出与合成滤波器组3.5的第二滤波器3.5.2相连。第一滤波器3.5.1和第二滤波器3.5.2的输出相连,作为合成滤波器组3.5的输出,其中,输出信号是重建的音频信号,或者是宽带或者是窄带,取决于在对音频信号进行编码中所用的模式。
显然,所编码的音频信号不是必须如图1所示从通信信道2接收,而也可以是先前存储在存储器介质中的编码比特流。
如上所述,本发明提供一种方法,以在从使用高频段扩展编码的编码模式变化为仅仅使用核心频段编码的模式时渐进地切断高频段扩展的影响。在相对短的时间段内,例如,在几百毫秒内,从全值到零逐步 改变高频段影响的幅度将使音频带宽的变化更加平滑,对于用户更不明显,提供改进的音频质量。同样地,当发生从核心频段模式到使用高频段扩展编码的模式的变化时,不会立即全值引入高频段影响,而是其幅度在相对短时间窗口期间以小步长从零缩放到全值,以引入具有改进音频质量的平滑切换。
尽管本发明主要用于16kHz采样音频,但是,在图4a-5c中,24kHz采样音频信号作为切换的示例。因此,AMR-WB+工作在24kHz采样音频信号上。将12KHz音频段划分为0-6.4和6.4-12kHz频段。在滤波器组之后使用临界向下采样。也就是,将低频段向下采样至12.8kHz,将高频段重新采样至11.2kHz(=2*(12-6.4))。
分别地,图4a表示执行从窄带到宽带的现有技术切换的情况,图4b表示执行依照本发明的切换的情况。图4c表示在现有技术以及依照本发明的切换的情况下,所编码高频段信号的总能量。
分别地,图5a表示执行从宽带到窄带的现有技术切换的情况,图5b表示执行依照本发明的切换的情况。图5c表示在现有技术以及在依照本发明的切换的情况下,所编码高频段信号的总能量。
图6表示依照本发明的一个系统示例,其中,可以应用分频段编码和解码过程。系统包括一个或多个音频源601,产生语音和/或非语音音频信号。在必要时,由A/D转换器602将音频信号转换为数字信号。将数字信号输入到发射设备600的编码器603,在发射设备600中,依照本发明进行编码。必要时在编码器603中对所编码的信号也进行量化和编码,以用于传输。发射机604,例如,移动通信设备600的发射机,将经过压缩和编码的信号传送至通信网络605。接收设备606的接收机607从通信网络605接收信号。将所接收的信号从接收机607传送至解码器608,以进行解码、反量化以及解压缩。解码器608执行对所接收比特流的解压缩,以形成合成的音频信号。然后,可以在例如扩音器609中将所合成的音频信号转换为音频。
本发明可以实现在不同类型的系统中,尤其是在低速率传输中,用于获得比现有技术系统更有效的压缩。依照本发明的编码器1可以实现 在通信系统的不同部件中。例如,编码器1可以实现在可能具有有限的信号处理能力的移动通信设备中。
本发明至少可以部分地实现作为计算机程序产品,包括机器可执行步骤,用于执行本发明方法的至少某些部分。编码设备1和解码设备3包括控制块,例如,数字信号处理器和/或微处理器,其中,可以使用计算机程序。
显然,本发明并不仅仅限于上述的实施方式,而是可以在所附权利要求书的范围内对其进行修改。
Claims (22)
1.一种用于对接收的包括参数的比特流进行处理以解码所述比特流的模块,该比特流是从频段内的音频信号帧进行编码而来的,该频段被划分为至少较低频段和较高频段,并且为该信号定义至少第一模式和第二模式,在该第一模式中,只对该较低频段上的信号进行编码,在该第二模式中,对该较低和较高频段二者上的信号进行编码,其特征在于,该模块包括乘法器,以关联于该模块的工作模式的变化,渐进地改变音频信号的至少一个接收的参数,其中所述至少一个接收的参数用于对与所述较高频段相关的音频信号的合成。
2.根据权利要求1所述的模块,其特征在于,所述参数包括增益参数,其中,所述乘法器包括计算元件,以关联于该模块的工作模式的变化渐进地改变该增益参数。
3.根据权利要求1或2所述的模块,其特征在于,该模块是解码器的一部分。
4.根据权利要求1或2所述的模块,其特征在于,该模块是编码器的一部分。
5.根据权利要求1或2所述的模块,其特征在于,定义时间参数(T),指示该模块工作模式的变化持续时间的长度。
6.根据权利要求5所述的模块,其特征在于,为所述时间参数(T)定义的值为320ms。
7.根据权利要求5所述的模块,其特征在于,定义步长值(S),指示在该参数渐进变化时所用步长为多大。
8.根据权利要求7所述的模块,其特征在于,定义所述步长值(S),以指示在64个步长内渐进地执行所述参数的变化。
9.根据权利要求1或2所述的模块,其特征在于,其包括采样器(1.2),用于对音频信号进行采样以及形成所采样的音频信号帧。
10.根据权利要求4所述的模块,其特征在于,定义所述时间参数(T),指示该模块工作模式的变化所持续的帧个数。
11.根据权利要求1所述的模块,其特征在于,该渐进变化的参数包括激励信号、LPC和增益参数。
12.一种设备(600),包括根据权利要求1至2中任何一个权利要求所述的模块。
13.根据权利要求12所述的设备,其特征在于,该设备是无线通信设备。
14.一种编解码器,包括根据权利要求1至2中任何一个权利要求所述的模块。
15.一种用于解码或编码在频段内的音频信号的方法,将该频段划分为至少较低频段和较高频段,对该较低频段的音频信号进行编码以形成与所述较低频段相关的该信号的参数,对该较高频段的音频信号进行编码以形成与所述较高频段相关的该信号的参数,以及在至少第一模式和第二模式之间选择对音频信号编码的模式,在该第一模式中只对该较低频段上的信号进行编码,在该第二模式中对该较低和较高频段二者上的信号进行编码,其特征在于,关联于工作模式的变化渐进地改变与所述较高频段相关的该信号的至少一个接收的参数。
16.根据权利要求15所述的方法,其特征在于,所述参数包括增益参数,其中关联于工作模式的变化渐进地改变该增益参数。
17.根据权利要求16所述的方法,其特征在于,定义所述增益参数,以用于控制对所述较高频段信号的编码,其中渐进地改变该增益参数。
18.根据权利要求15、16或17所述的方法,其特征在于,定义时间参数(T),指示该工作模式的变化持续时间的长度。
19.根据权利要求18所述的方法,其特征在于,定义步长值(S),指示在该参数渐进变化时所用步长为多大。
20.根据权利要求15至17中任何一个权利要求所述的方法,其特征在于,对该音频信号进行采样,并且从所采样的音频信号形成帧。
21.根据权利要求20所述的方法,其特征在于,定义参数(T),指示该工作模式的变化所持续的帧个数。
22.根据权利要求15至17中任何一个权利要求所述的方法,其特征在于,在编码中使用LPC激励以产生一组LPC参数,其中渐进地改变其中至少一个该LPC参数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI20045135A FI119533B (fi) | 2004-04-15 | 2004-04-15 | Audiosignaalien koodaus |
FI20045135 | 2004-04-15 | ||
PCT/FI2005/050121 WO2005101372A1 (en) | 2004-04-15 | 2005-04-14 | Coding of audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1942928A CN1942928A (zh) | 2007-04-04 |
CN1942928B true CN1942928B (zh) | 2011-05-18 |
Family
ID=32104263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800114923A Expired - Fee Related CN1942928B (zh) | 2004-04-15 | 2005-04-14 | 用于处理音频信号的模块和方法 |
Country Status (14)
Country | Link |
---|---|
US (1) | US20050246164A1 (zh) |
EP (1) | EP1735776A4 (zh) |
JP (1) | JP4838235B2 (zh) |
KR (1) | KR100859881B1 (zh) |
CN (1) | CN1942928B (zh) |
AU (1) | AU2005234181B2 (zh) |
BR (1) | BRPI0509963A (zh) |
CA (1) | CA2562916C (zh) |
FI (1) | FI119533B (zh) |
HK (1) | HK1102036A1 (zh) |
MX (1) | MXPA06010825A (zh) |
RU (1) | RU2383943C2 (zh) |
WO (1) | WO2005101372A1 (zh) |
ZA (1) | ZA200607661B (zh) |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
DE602005025027D1 (de) * | 2005-03-30 | 2011-01-05 | Nokia Corp | Quellencodierung und/oder -decodierung |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8190425B2 (en) | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
EP2009623A1 (en) * | 2007-06-27 | 2008-12-31 | Nokia Siemens Networks Oy | Speech coding |
US8532984B2 (en) * | 2006-07-31 | 2013-09-10 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of active frames |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
US8639500B2 (en) * | 2006-11-17 | 2014-01-28 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus with bandwidth extension encoding and/or decoding |
JP4935329B2 (ja) * | 2006-12-01 | 2012-05-23 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
FR2911020B1 (fr) * | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
FR2911031B1 (fr) * | 2006-12-28 | 2009-04-10 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
KR101149449B1 (ko) * | 2007-03-20 | 2012-05-25 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치 |
US8982744B2 (en) * | 2007-06-06 | 2015-03-17 | Broadcom Corporation | Method and system for a subband acoustic echo canceller with integrated voice activity detection |
CN101325537B (zh) * | 2007-06-15 | 2012-04-04 | 华为技术有限公司 | 一种丢帧隐藏的方法和设备 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
JP5547081B2 (ja) * | 2007-11-02 | 2014-07-09 | 華為技術有限公司 | 音声復号化方法及び装置 |
CN101868821B (zh) | 2007-11-21 | 2015-09-23 | Lg电子株式会社 | 用于处理信号的方法和装置 |
EP2229677B1 (en) * | 2007-12-18 | 2015-09-16 | LG Electronics Inc. | A method and an apparatus for processing an audio signal |
CN101499278B (zh) * | 2008-02-01 | 2011-12-28 | 华为技术有限公司 | 音频信号切换处理方法和装置 |
CN101609679B (zh) * | 2008-06-20 | 2012-10-17 | 华为技术有限公司 | 嵌入式编解码方法和装置 |
EP2301026B1 (en) * | 2008-07-11 | 2020-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio signal synthesizer and audio signal encoder |
CA2871268C (en) * | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
RU2452044C1 (ru) | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
CO6440537A2 (es) * | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
GB2473267A (en) * | 2009-09-07 | 2011-03-09 | Nokia Corp | Processing audio signals to reduce noise |
GB2476041B (en) * | 2009-12-08 | 2017-03-01 | Skype | Encoding and decoding speech signals |
CN102222505B (zh) * | 2010-04-13 | 2012-12-19 | 中兴通讯股份有限公司 | 可分层音频编解码方法系统及瞬态信号可分层编解码方法 |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
US8600737B2 (en) * | 2010-06-01 | 2013-12-03 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for wideband speech coding |
KR20130036304A (ko) * | 2010-07-01 | 2013-04-11 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP3971893B1 (en) | 2010-07-02 | 2024-06-19 | Dolby International AB | Audio decoding with selective post filter |
KR101826331B1 (ko) | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
MY185753A (en) | 2010-12-29 | 2021-06-03 | Samsung Electronics Co Ltd | Coding apparatus and decoding apparatus with bandwidth extension |
EP2706766B1 (en) | 2011-06-09 | 2016-11-30 | Panasonic Intellectual Property Corporation of America | Network node, terminal, bandwidth modification determination method and bandwidth modification method |
CN103035248B (zh) | 2011-10-08 | 2015-01-21 | 华为技术有限公司 | 音频信号编码方法和装置 |
CN108831501B (zh) * | 2012-03-21 | 2023-01-10 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
PL2951821T3 (pl) | 2013-01-29 | 2017-08-31 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Koncepcja kompensacji przełączania trybu kodowania |
WO2014118136A1 (en) | 2013-01-29 | 2014-08-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
PT3058567T (pt) * | 2013-10-18 | 2017-07-27 | ERICSSON TELEFON AB L M (publ) | Codificação de posições de picos espectrais |
EP3182412B1 (en) * | 2014-08-15 | 2023-06-07 | Samsung Electronics Co., Ltd. | Sound quality improving method and device, sound decoding method and device, and multimedia device employing same |
KR20210003507A (ko) * | 2019-07-02 | 2021-01-12 | 한국전자통신연구원 | 오디오 코딩을 위한 잔차 신호 처리 방법 및 오디오 처리 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6349197B1 (en) * | 1998-02-05 | 2002-02-19 | Siemens Aktiengesellschaft | Method and radio communication system for transmitting speech information using a broadband or a narrowband speech coding method depending on transmission possibilities |
CN1488137A (zh) * | 2001-01-24 | 2004-04-07 | �����ɷ� | 宽带信号到窄带信号的增强型转换 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08166800A (ja) * | 1994-12-13 | 1996-06-25 | Hitachi Ltd | 複数種類の符号化方法を備える音声符号器および復号器 |
FI113571B (fi) * | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
JP3344962B2 (ja) * | 1998-03-11 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置、及びオーディオ信号復号化装置 |
JP3307875B2 (ja) * | 1998-03-16 | 2002-07-24 | 松下電送システム株式会社 | 符号化音声再生装置および符号化音声再生方法 |
US6480822B2 (en) * | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
JP2000322096A (ja) * | 1999-05-13 | 2000-11-24 | Mitsubishi Electric Corp | 音声伝送装置 |
US6826527B1 (en) * | 1999-11-23 | 2004-11-30 | Texas Instruments Incorporated | Concealment of frame erasures and method |
GB2357682B (en) * | 1999-12-23 | 2004-09-08 | Motorola Ltd | Audio circuit and method for wideband to narrowband transition in a communication device |
FI119576B (fi) * | 2000-03-07 | 2008-12-31 | Nokia Corp | Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin |
FI115329B (fi) * | 2000-05-08 | 2005-04-15 | Nokia Corp | Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US7031926B2 (en) * | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
SE521693C3 (sv) * | 2001-03-30 | 2004-02-04 | Ericsson Telefon Ab L M | En metod och anordning för brusundertryckning |
US20020163908A1 (en) * | 2001-05-07 | 2002-11-07 | Ari Lakaniemi | Apparatus, and associated method, for synchronizing operation of codecs operable pursuant to a communicaton session |
ATE320651T1 (de) * | 2001-05-08 | 2006-04-15 | Koninkl Philips Electronics Nv | Kodieren eines audiosignals |
US7319703B2 (en) * | 2001-09-04 | 2008-01-15 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts |
EP1374230B1 (en) * | 2001-11-14 | 2006-06-21 | Matsushita Electric Industrial Co., Ltd. | Audio coding and decoding |
FI20021936A (fi) * | 2002-10-31 | 2004-05-01 | Nokia Corp | Vaihtuvanopeuksinen puhekoodekki |
US20040243404A1 (en) * | 2003-05-30 | 2004-12-02 | Juergen Cezanne | Method and apparatus for improving voice quality of encoded speech signals in a network |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US7542899B2 (en) * | 2003-09-30 | 2009-06-02 | Alcatel-Lucent Usa Inc. | Method and apparatus for adjusting the level of a speech signal in its encoded format |
-
2004
- 2004-04-15 FI FI20045135A patent/FI119533B/fi not_active IP Right Cessation
-
2005
- 2005-04-14 JP JP2007507809A patent/JP4838235B2/ja not_active Expired - Fee Related
- 2005-04-14 CA CA2562916A patent/CA2562916C/en not_active Expired - Fee Related
- 2005-04-14 RU RU2006139790/09A patent/RU2383943C2/ru not_active IP Right Cessation
- 2005-04-14 BR BRPI0509963-3A patent/BRPI0509963A/pt not_active IP Right Cessation
- 2005-04-14 MX MXPA06010825A patent/MXPA06010825A/es active IP Right Grant
- 2005-04-14 EP EP05735286A patent/EP1735776A4/en not_active Withdrawn
- 2005-04-14 WO PCT/FI2005/050121 patent/WO2005101372A1/en active Application Filing
- 2005-04-14 KR KR1020067022237A patent/KR100859881B1/ko not_active IP Right Cessation
- 2005-04-14 CN CN2005800114923A patent/CN1942928B/zh not_active Expired - Fee Related
- 2005-04-14 AU AU2005234181A patent/AU2005234181B2/en not_active Ceased
- 2005-04-15 US US11/107,334 patent/US20050246164A1/en not_active Abandoned
-
2006
- 2006-09-13 ZA ZA2006/07661A patent/ZA200607661B/en unknown
-
2007
- 2007-09-17 HK HK07110120.5A patent/HK1102036A1/xx not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6349197B1 (en) * | 1998-02-05 | 2002-02-19 | Siemens Aktiengesellschaft | Method and radio communication system for transmitting speech information using a broadband or a narrowband speech coding method depending on transmission possibilities |
CN1488137A (zh) * | 2001-01-24 | 2004-04-07 | �����ɷ� | 宽带信号到窄带信号的增强型转换 |
Non-Patent Citations (1)
Title |
---|
Bruno Bessette et al.The Adaptive Multirate Wideband Speech Codec(AMR-WB).《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》.2002,第10卷(第9期),620-636. * |
Also Published As
Publication number | Publication date |
---|---|
US20050246164A1 (en) | 2005-11-03 |
RU2383943C2 (ru) | 2010-03-10 |
CA2562916A1 (en) | 2005-10-27 |
KR20070002068A (ko) | 2007-01-04 |
KR100859881B1 (ko) | 2008-09-24 |
WO2005101372A1 (en) | 2005-10-27 |
ZA200607661B (en) | 2010-11-24 |
BRPI0509963A (pt) | 2007-09-25 |
RU2006139790A (ru) | 2008-05-20 |
FI20045135A0 (fi) | 2004-04-15 |
EP1735776A4 (en) | 2007-11-07 |
CN1942928A (zh) | 2007-04-04 |
MXPA06010825A (es) | 2006-12-15 |
EP1735776A1 (en) | 2006-12-27 |
FI119533B (fi) | 2008-12-15 |
FI20045135A (fi) | 2005-10-16 |
AU2005234181B2 (en) | 2011-06-23 |
JP4838235B2 (ja) | 2011-12-14 |
AU2005234181A1 (en) | 2005-10-27 |
CA2562916C (en) | 2012-10-02 |
JP2007532963A (ja) | 2007-11-15 |
HK1102036A1 (en) | 2007-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1942928B (zh) | 用于处理音频信号的模块和方法 | |
CN101305423B (zh) | 自适应的基于时间/频率的音频编码和解码设备和方法 | |
CN101518083B (zh) | 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和系统 | |
JP2007532963A5 (zh) | ||
CN101421780B (zh) | 用于编码和解码时变信号的方法和设备 | |
CN101512639A (zh) | 用于语音/音频发送器和接收器的方法和设备 | |
KR20080093074A (ko) | 오디오신호들의 분류 | |
JP2001500344A (ja) | タンデム型ボコーダの音質を改良する方法および装置 | |
WO2002103685A1 (fr) | Appareil et procede de codage, appareil et procede de decodage et programme | |
WO1998000837A1 (fr) | Procedes de codage et de decodage de signaux audio, et codeur et decodeur de signaux audio | |
WO2009059631A1 (en) | Audio coding apparatus and method thereof | |
JP4464707B2 (ja) | 通信装置 | |
EP2057626B1 (en) | Encoding an audio signal | |
FI110729B (fi) | Menetelmä pakatun audiosignaalin purkamiseksi | |
CA2293165A1 (en) | Method for transmitting data in wireless speech channels | |
CN101740030B (zh) | 语音信号的发送及接收方法、及其装置 | |
JP4578145B2 (ja) | 音声符号化装置、音声復号化装置及びこれらの方法 | |
Choudhary et al. | Study and performance of amr codecs for gsm | |
CN1873777B (zh) | 具有语音解码功能的移动通信终端及其动作方法 | |
JP4373693B2 (ja) | 音響信号の階層符号化方法および階層復号化方法 | |
Bhatt | Implementation and overall performance evaluation of CELP based GSM AMR NB coder over ABE | |
JPH0573098A (ja) | 音声処理装置 | |
JPH11145846A (ja) | 信号圧縮伸張装置及び方法 | |
JP5098458B2 (ja) | 音声符号化装置、音声符号化方法、及び、プログラム | |
Mandal et al. | Digital Audio Compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1102036 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1102036 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110518 Termination date: 20150414 |
|
EXPY | Termination of patent right or utility model |