CN1922659B - 编码模式选择 - Google Patents

编码模式选择 Download PDF

Info

Publication number
CN1922659B
CN1922659B CN200580005610XA CN200580005610A CN1922659B CN 1922659 B CN1922659 B CN 1922659B CN 200580005610X A CN200580005610X A CN 200580005610XA CN 200580005610 A CN200580005610 A CN 200580005610A CN 1922659 B CN1922659 B CN 1922659B
Authority
CN
China
Prior art keywords
excitation
ltp
signal
parameter
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200580005610XA
Other languages
English (en)
Other versions
CN1922659A (zh
Inventor
雅里·马基南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN1922659A publication Critical patent/CN1922659A/zh
Application granted granted Critical
Publication of CN1922659B publication Critical patent/CN1922659B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Abstract

本发明涉及一种编码器(200),其包括用来输入音频信号的各帧的输入(201)、用来对所述音频信号的各帧执行LTP分析以形成基于所述音频信号的属性的LTP参数的LTP分析块(209)、以及至少一个用来为所述音频信号的各帧执行第一种激励的第一激励块(206)、以及用来为所述音频信号的各帧执行第二种激励的第二激励块(207)。所述编码器(200)还包括用于分析所述LTP参数的参数分析块(202)、以及激励选择块(203),所述激励选择块(203)用来基于所述参数分析在所述第一种励块(206)和所述第二激励块(207)中选择一个激励块为所述音频信号的各帧执行激励。本发明还涉及一种设备、系统、方法、模块和计算机程序产品。

Description

编码模式选择
技术领域
本发明涉及根据音频信号的属性来改变编码模式的音频编码。本发明涉及一种编码器,其包括用来输入音频信号的各帧的输入、用来对音频信号的各帧执行长期预测(LTP)分析以形成基于音频信号的属性的长期预测(LTP)参数的LTP分析块、以及至少一个用来为音频信号的各帧执行第一种激励的第一激励块、以及用来为音频信号的各帧执行第二种激励的第二激励块。本发明还涉及一种包括编码器的设备,所述编码器包括用来输入音频信号的各帧的输入、用来对音频信号的各帧执行LTP分析以形成基于音频信号的属性的LTP参数的LTP分析块、以及至少一个用来为音频信号的各帧执行第一种激励的第一激励块、以及用来为音频信号的各帧执行第二种激励的第二激励块。本发明还涉及一种包括编码器的系统,所述编码器包括用来输入音频信号的各帧的输入、用来对音频信号的各帧执行LTP分析以形成基于音频信号的属性的LTP参数的LTP分析块、以及至少一个用来为音频信号的各帧执行第一种激励的第一激励块、以及用来为音频信号的各帧执行第二种激励的第二激励块。本发明进一步涉及一种用来处理音频信号的方法,其中对音频信号的各帧执行LTP分析以形成基于音频信号的属性的LTP参数,并且可以选择为音频信号的各帧执行至少第一种激励和第二种激励。本发明涉及一种模块,其包括用来对音频信号的各帧执行LTP分析以形成基于音频信号的属性的LTP参数的LTP分析块。本发明涉及一种计算机程序产品,其包括用于对音频信号进行编码的机器可执行步骤,其中对音频信号的各帧执行LTP分析以形成基于该信号的属性的LTP参数,并且可以选择为音频信号的各帧执行至少第一种激励和第二种激励。
背景技术
在许多音频信号处理应用中,对音频信号进行压缩以减少处理该音频信号时的处理能力需求。例如,在数字通信系统中音频信号典型地被捕获成模拟信号、在模数(A/D)转换器中进行数字化并且接着在通过像移动站这样的用户装置与基站之间的无线空中接口传送之前进行编码。编码的目的是对数字化的信号进行压缩并且通过空中接口以最小的数据量且同时维持一个可接受的信号质量水平来对其进行传送。由于蜂窝通信网络中通过无线空中接口的无线信道容量是有限的,因此这一点特别重要。还存在一些应用,其中数字化的音频信号被存储到存储介质中以在以后再现音频信号。
压缩可以是有损的或者无损的。在有损压缩中一些信息在压缩期间丢失,其中不可能从压缩信号中完全重构原始信号。在无损压缩中正常情况下没有信息丢失。因此,通常可以从压缩信号中完全地重构原始信号。
术语“音频信号”通常被理解成包含语音、音乐(非语音)或二者的信号。语音和音乐的不同性质使得设计一个同时针对语音和音乐都能足够好地工作的压缩算法相当困难。因此,常常通过针对音频和语音设计不同的算法来解决这个问题,并且使用某类识别方法来识别音频是类似语音还是类似音乐并根据识别来选择恰当的算法。
总的来说,在语音信号与音乐或非语音信号间进行纯粹的分类是一件困难的工作。所需的精确性很大程度上依赖于应用。在一些应用中,精确性更为关键,就像在语音识别或在为了进行存储和检索目的的精确建档中。然而,如果分类是用来为输入信号选择最优的压缩方法,那情况就有点不同。在这种情况下,可能出现不存在一个针对语音一直是最优的压缩方法和另一个针对音乐或非语音信号一直是最优的压缩方法。实际上可能是,针对语音瞬态的压缩方法对于音乐瞬态而言也是很高效的。还可能是,针对强音调分量的音乐压缩对于发声的语音片段而言可能有效。因此,在这些例子中,只是纯粹地针对语音和音乐进行分类的方法不会产生选择最好的压缩方法的最优算法。
常常,语音可以看成是带限在近似200Hz到3400Hz之间。A/D转换器将模拟语音信号转换成数字信号所使用的典型采样速率是8kHz或16kHz。音乐或非语音信号可能包含远超过正常语音带宽的频率分量。在一些应用中,音频系统应该能够处理介于大约20Hz至20000kHz之间的频带。针对那种信号的采样速率应该是至少40000kHz以避免混叠。这里应当注意,上面所提及的值只是非限制性的例子。例如,在一些系统中针对音乐信号的上限可以是大约10000kHz或者甚至比那更低。
接下来通常一帧一帧地对已采样的数字信号进行编码,结果生成具有由进行编码的编解码器所确定的比特速率的数字数据流。比特速率越高,被编码的数据就越多,其导致产生对输入帧更准确的重现。接下来,已编码的音频信号被解码并且穿过数模(D/A)转换器以重构尽可能接近原始信号的信号。
理想的编解码器会用尽可能少的比特来编码音频信号,由此对信道容量进行最优化,同时产生听起来尽可能接近原始音频信号的已解码的音频信号。实际上,在编解码器的比特速率与已解码音频的质量之间常常存在折衷。
目前,存在许多不同的编解码器,诸如:自适应多速率(AMR)编解码器和自适应多速率宽带(AMR-WB)编解码器,其被开发用来对音频信号进行压缩和编码。AMR由第三代合作伙伴计划(3GPP)开发用于GSM/EDGE(全球移动通信/电子数据采集设备)和WCDMA(宽带码分多址通信网络。另外,还已经设想,AMR将被用于分组交换网络中。AMR基于代数码激励线性预测(ACELP)编码。AMR和AMR WB编解码器分别包括8和9个有效比特速率并且还包括语音活动检测(VAD)以及非连续传输(DTX)功能性。此刻,AMR编解码器中的采样速率是8kHz而AMR WB编解码器中的采样速率是16kHz。很明显,上面所提及的编解码器和采样速率只是非限制性的例子。
ACELP编码使用一种生成信号源的模型来工作,并且从信号中提取这种模型的参数。更为明确地,ACELP编码基于人类发声系统的模型,其中咽喉和口腔被模型化为线性滤波器而语音通过激励滤波器的空气的周期性振动来生成。编码器一帧一帧地对语音进行分析而且针对每帧由编码器生成并输出代表已经模型化的语音的一组参数。该组参数可以包括激励参数和滤波器的系数,同时还包括其他参数。来自语音编码器的输出通常可以看做是输入语音信号的参数表示。该组参数接下来由已进行适当配置的解码器用于生成输入语音信号。
变换编码广泛地用于非语音音频编码。用于非语音信号的变换编码的优越性建立在感官遮蔽和频域编码的基础上。即使变换编码技术给予音频信号出众的质量,但是对于周期性的语音信号而言性能并不好,并且由此进行了变换编码的语音的质量常常相当差。另一方面,基于人类语音产生系统的语音编解码器对于音频信号常常表现得很差。
对于某些输入信号,类似脉冲的ACELP激励产生较高的质量,而对于某些输入信号变换编码的激励(TCX)更理想。这里假设针对典型的语音内容主要使用ACELP激励作为输入信号,而针对典型的音乐和其他非语音音频主要使用TCX激励作为输入信号。然而,情况并不总是这样,也即有时语音信号具有类似音乐的部分而音乐信号具有类似语音的部分。在现有技术的系统中,还可能存在同时包含音乐和语音的信号,其中所选择的编码方法对于这种信号来说可能不是可选的。
可以以若干方式来进行激励的选择:最为复杂且相当好的方法是同时对ACELP和TCX激励进行编码并且接下来基于合成的音频信号来选择最好的激励。虽然这种合成分析类型的方法会提供好的结果,但是由于它的高复杂性,它在一些应用中并不可行。在这种方法中,可以使用例如SNR(信噪比)类型的算法来测量由两种激励所产生的质量。这种方法可被称作“暴力(brute force)”方法,原因是它尝试了不同激励的所有组合并且然后选择最好的一个。较不复杂的方法将通过预先分析信号属性只执行一次合成,并且接着选择最好的激励。这种方法也可以是预选择和“暴力”的组合以在质量和复杂度间进行折衷。
图1给出具有现有技术的高复杂度分类的简化了的编码器100。音频信号被输入输入信号块101,在其中对该信号进行数字化和滤波。输入信号块101还从已数字化和已滤波的信号形成帧。这些帧被输入到线性预测编码(LPC)分析块102。线性预测编码(LPC)分析块102一帧一帧地对已数字化了的输入信号执行LPC分析,以寻找与输入信号匹配得最好的参数组。所确定的参数(LPC参数)被量化并从编码器100中输出109。编码器100还用LPC合成块103、104来生成两路输出信号。第一LPC合成块103使用由TCX激励块105所生成的信号来对音频信号进行合成,为的是寻找针对TCX激励产生最好结果的码字矢量。第二LPC合成块104使用由ACELP激励块106所生成的信号来对音频信号进行合成,为的是寻找针对ACELP激励产生最好结果的码字矢量。在激励选择块107中,对由LPC合成块103、104所生成的信号进行比较以确定激励方法中的哪一个给出最好(最优的)激励。例如,在从编码器100输出109信号以供传输之前,对与已选择的激励有关的信息和已选激励信号的参数进行量化和信道编码108。
发明内容
本发明的一个目的是提供一种用来为音频信号的不同部分选择编码方法的一种改进的方法。在本发明中,使用一种算法在至少第一种和第二种编码方法(例如TCX或ACELP)中选择一种通过开环的方式进行编码的编码方法。执行该选择为的是针对源信号检测出最好的编码模型,其并不意味着语音和音乐的分离。根据本发明的一个实施例,一种算法尤其为具有高度的长期相关性的周期信号(例如,发声的语音信号)以及为信号瞬态来选择ACELP。另一方面,使用变换编码对某种类型的稳态信号、类似噪声的信号和类似谐音的信号进行编码以更好地处理频率分辨率。
本发明基于这样的思想:通过检查LTP分析所产生的参数来对输入信号进行分析以从音频信号中找出例如瞬态的、周期的部分,等等。根据本发明的编码器的特征主要在于该编码器还包括用于分析所述LTP参数的参数分析块、以及激励选择块,该激励选择块用来基于参数分析在所述第一激励块和所述第二激励块中选择一个激励块为音频信号的各帧执行激励;以及在于所述第二种激励是变换编码激励,而所述第一种激励不同于变换编码激励。根据本发明的设备的特征主要在于该设备还包括用于分析所述LTP参数的参数分析块以及激励选择块,该激励选择块用来基于参数分析在所述第一激励块和所述第二激励块中选择一个激励块为音频信号的各帧执行激励,以及在于所述第二种激励是变换编码激励,而所述第一种激励不同于变换编码激励。根据本发明的系统的特征主要在于该系统在所述编码器中还包括用于分析所述LTP参数的参数分析块以及激励选择块,该激励选择块用来基于参数分析在所述第一激励块和所述第二激励块中选择一个激励块为音频信号的各帧执行激励,以及在于所述第二种激励是变换编码激励,而所述第一种激励不同于变换编码激励。根据本发明的方法的特征主要在于该方法还包括分析所述LTP参数并基于参数分析在所述至少第一种激励和所述第二种激励中选择一个激励块为音频信号的各帧执行激励,以及在于所述第二种激励包括使用变换编码激励,而所述第一种激励包括使用不同于变换编码激励。根据本发明的模块的特征主要在于该模块还包括用于分析所述LTP参数的参数分析块、以及激励选择块,该激励选择块用来在第一激励块和第二激励块中选择一个激励块并向编码器指示所选择的激励方法,以及在于所述第二种激励是变换编码激励,而所述第一种激励不同于变换编码激励。根据本发明的计算机程序产品的特征主要在于该计算机程序产品还包括用来分析所述LTP参数并基于参数分析在至少所述第一种激励和所述第二种激励中选择一种激励为音频信号的各帧执行激励的机器可执行步骤,以及在于执行所述第二种激励包括用来使用变换编码激励的机器可执行步骤,而执行所述第一种激励包括用来使用不同于变换编码的激励的机器可执行步骤。
当将本发明与现有技术的方法和系统进行比较时,本发明提供了很多优点。通过使用根据本发明的分类方法,可改善再生的声音质量,同时又不会极大地影响压缩效率。本发明尤其改善了混合信号(也即同时包括类似于语音和类似于非语音的信号)的再生声音质量。
附图说明
图1给出具有现有技术高复杂度分类的简化了的编码器,
图2给出具有根据本发明的分类的编码器的示例性实施例,
图3示出一个发声的语音序列例子的按比例绘制的归一化相关性、延迟和按比例绘制的增益参数,
图4示出一个包含有单个乐器声音的音频信号例子的按比例绘制的归一化相关性、延迟和按比例绘制的增益参数,
图5示出一个包含有若干乐器音乐的音频信号例子的按比例绘制的归一化相关性、延迟和按比例绘制的增益参数,以及
图6示出一个根据本发明的系统的例子。
具体实施方式
下面,将参考图2更加详细地描述根据本发明的一个示例性实施例的编码器200。该编码器200包括用来在需要的时候对输入信号进行数字化、滤波和成帧的输入块201。这里应该注意,输入信号可以已经具有适合编码过程的形式。例如,输入信号可能在更早的阶段已经被数字化并且被存储到存储器介质(未示出)。将输入信号各帧输入LPC分析块208,其对该输入信号执行LPC分析并且形成基于该信号的属性的LPC参数。LTP分析块209基于该LPC参数形成LTP参数。在参数分析块202对该LPC参数和LTP参数进行检查。基于分析的结果,激励选择块203确定哪种激励方法是用来对输入信号的当前帧进行编码的最合适的一种方法。激励选择块203根据参数分析来产生用于控制选择装置205的控制信号204。如果确定对输入信号的当前帧进行编码的最好激励方法是第一种激励方法,那么就控制选择装置205来选择第一激励块206的信号(激励参数)作为量化和编码块212的输入。如果确定对输入信号的当前帧进行编码的最好激励方法是第二种激励方法,那么就控制选择装置205来选择第二激励块207的信号(激励参数)作为量化和编码块212的输入。虽然图2中的编码器只具有用于编码过程的第一激励块206和第二激励块207,然而显然,在编码器200中还可以存在可用于对输入信号进行编码的针对不同激励方法的多于两种不同激励块。
第一激励块206生成例如TCX激励信号(矢量)而第二激励块207生成例如ACELP激励信号(矢量)。还可能是所选激励块206、207首先试用两个或更多的激励矢量,其中生成最紧凑结果的矢量被选择用于传输。可以基于待传送比特的数量或编码误差(合成音频和实际音频输入之间的差值)来确定最紧凑结果。
LPC参数210、LTP参数211以及激励参数213在传送给例如通信网络604(图6)之前在量化和编码块212中被例如量化和编码。然而,并不一定传送这些参数,而是可以将其例如存储到一存储介质上并在稍后的阶段被提取用于传送和/或解码。
在扩展的AMR-WB(AMR-WB+)编解码器中,存在两类用于LP合成的激励:类似于ACELP脉冲的激励以及变换编码的TCX激励。ACELP激励与在原先的3GPP AMR-WB标准(3GPP TS 26.190)中使用时相同,而TCX激励是在扩展AMR-WB中实现的实质改进。
在AMR-WB+编解码器中,在每帧中都计算线性预测编码(LPC)以对频谱包络进行建模。LPC激励(已编码的LP滤波器的输出)或者用代数码激励线性预测(ACELP)类型来编码或者用基于变换编码的算法(TCX)来编码。作为一个例子,ACELP为LPC激励完成LTP和固定码本参数。例如,AMR-WB+的变换编码(TCX)采用FFT(快速傅立叶变换)。在AMR-WB+编解码器中,可以使用三种不同的帧长度(20ms、40ms和80ms)中之一来进行TCX编码。
下面,将更加详细地描述根据本发明的一种方法的例子。在该方法中,一种算法被用于确定音频信号的一些属性,诸如周期性和音调。音调是发声的语音的一个基本属性。对于发声的语音,声门按周期的方式打开和闭合,从而给予激励周期的特性。音调周期T0是声门顺序打开之间的时间间隔。发声的语音段具有尤其强的长期相关性。这种相关性归因于声带的振动,声带通常具有从2ms到20ms范围的音调周期。
针对LPC残差计算LTP参数:延迟和增益。LTP延迟与语音信号的基频紧密相关并且它常常被称作“音调延迟”参数、“音调延迟”参数或者“延迟”,其根据语音样本来描述语音信号的周期性。可以用自适应码本来计算音调延迟参数。可以进行开环音调分析来估计音调延迟。这么做的目的是为了简化音调分析并且将闭环音调搜寻限制在开环估计延迟的周围的少数延迟。与基频有关的另一LTP参数是增益,也称作LTP增益。LTP增益是一个重要参数,其连同LTP延迟被用于给出语音的真实重现。
通过例如归一化相关性来分析源信号的稳态属性,该归一化相关性可以如下计算:
NormCorr = Σ i = 0 N - 1 x i - T 0 * x i x i - T 0 * x i - - - ( 1 )
其中T0是长度为N的帧的开环延迟。Xi是已编码帧的第i个采样。Xi -T0是来自最近已编码帧的采样,其是从采样Xi开始往后算起的T0个采样。
在图3、图4和图5中,可以看见作为时间的函数的LTP参数特性的几个例子。在图中,曲线A示出信号的归一化相关性,曲线B示出延迟而曲线C示出按比例绘制的增益。归一化相关性和LTP增益被按比例绘出(乘以100)以使得它们可以被放入具有LTP延迟的同一幅图。此外在图3、图4和图5中,LTP延迟值被除以2。作为一个例子,发声的语音段(图3)包括高LTP增益和稳定的LTP延迟。此外,发声的语音段的归一化相关性和增益相匹配并且因此具有高相关性。根据本发明的该方法对这种类型的信号段进行分类,从而所选编码方法是ACELP(第一种编码方法)。如果虽然LTP延迟等值线(包括当前和以前的延迟)稳定但是LTP增益低或者不稳定,以及/或者LTP增益和已归一化相关性具有小的相关性,那么所选的编码方法是TCX(第二种编码方法)。在图4的例子中举例说明了这种类型的状况,其中示出了一个乐器(萨克斯)的音频信号的参数。如果当前和以前帧的LTP延迟等值线非常不稳定,那么在这种情况下所选的编码器还是TCX。这在图5的例子中进行了举例说明,其中示出了多个乐器的音频信号参数。词语“稳定”在这里意思是例如当前和以前帧的最小与最大延迟值间的差值在某个预定义阈值(第二阈值TH2)之下。因此,在当前和以前的帧中,延迟变化不大。在AMR-WB+编解码器中,LTP增益的范围在0到1.2之间。归一化相关性的范围在0到1.0之间。作为一个例子,指示高LTP增益的该阈值可以超过0.8。例如,通过他们的差值可以观察到LTP增益与归一化相关性的高相关性(或相似性)。如果该差值低于第三阈值TH3,例如在当前和/或过去的帧中是0.1,那么LTP增益和归一化相关性具有高相关性。
如果信号本质上是瞬态的,那么在本发明的示例性实施例中用第一种编码方法(例如用ACELP编码方法)来对其进行编码。可以通过使用相邻帧的谱距离SD来检测瞬态的序列。例如,如果在当前和以前帧中的从导抗谱对(ISP)系数(被转换到ISP形式的LP滤波器系数)计算而来的第n帧的频谱距离SDn超过预定义第一阈值TH1,那么信号被分类为瞬态的。可以如下这样从ISP参数来计算频谱距离SDn
SD ( n ) = Σ i = 0 N - 1 | ISP n ( i ) - ISP n - 1 ( i ) | - - - ( 2 )
其中,ISPn是第n帧的ISP系数矢量,而ISPn(i)是它的第i项。
使用第二种编码方法例如变换编码TCX来对类似噪声的序列进行编码。可以通过LTP参数以及在频域内沿着帧的平均频率来检测这些序列。如果LTP参数非常不稳定以及/或者平均频率超过一个预定义的阈值TH16,那么在该方法中就确定该帧包含类似噪声的信号。
下面描述了根据本发明的分类过程的一个示例算法。该算法可用于像AMR-WB+编解码器中的编码器这样的编码器200。
if(SDn>TH1)
     Mode=ACELP_MODE;
else
     if(LagDifBuf<TH2)
            if(Lagn==HIGH LIMIT or Lagn==LOW LIMIT){
                 if(Gainn-NormCorrn<TH3 and NormCorrn>TH4)
                       Mode=ACELP_MODE
                  else
                       Mode=TCX_MODE
     else if(Gainn-NormCorrn<TH3and NormCorrn>TH5)
             Mode=ACELP_MODE
     else if(Gainn-NormCorrn>TH6)
             Mode=TCX_MODE
     else
             NoMtcx=NoMtcx+1
if(MaxEnergybuf<TH7)
     if(SDn>TH8)
           Mode=ACELP_MODE;
     else
           NoMtcx=NoMtcx+1
if(LagDifbuf<TH2)
     if(NormCorrn<TH9 and SDn<TH10)
           Mode=TCX_MODE;
if(lphn>TH11 and SDn<TH10)
     Mode=TCX_MODE
if(vadFlagold==0 and vadFlag==1 and Mode==TCX_MODE))
     NoMtcx=NoMtcx+1
if(Gainn-NormCorrn<TH12 and NormCorrn>TH13 and Lagn>TH14)
     DFTSum=0;
     for(i=1;i<NO_of_elements;i++){/*First element left out*/
            DFTSum=DFTSum+mag[i];
     if(DFTSum>TH15and mag[0]<TH16){
            Mode=TCX_MODE;
else
     Mode=ACELP_MODE;
     NoMtcx=NoMtcx+1
上面的算法包含一些阈值TH1-TH15和常数HIGH_LIMIT、LOW_LIMIT、Buflimit、NO_of_elements。下面,示出了这些阈值和常数的一些范例值,但是显然,这些值不是限制性的而仅仅是例子。
TH1=0.2
TH2=2
TH3=0.1
TH4=0.9
TH5=0.88
TH6=0.2
TH7=60
TH8=0.15
TH9=0.80
TH10=0.1
TH11=200
TH12=0.006
TH13=0.92
TH14=21
TH15=95
TH16=5
NO_of_elements=40
HIGH_LIMIT=115
LOW_LIMIT=18
该算法的一些变量的含义如下:HIGH_LIMIT和LOW_LIMIT分别涉及最大和最小LTP延迟值、LagDifbuf是包含来自当前和以前的帧的LTP延迟的缓存器。Lagn是当前帧的一个或多个LTP延迟值(在AMR-WB+编解码器中,计算一个帧的两个开环延迟值)。Gainn是当前帧的一个或多个LTP增益值。NormCorrn是当前帧的一个或多个归一化相关性值。MaxEnergyout是包含当前和之前帧的能量值的缓存器的最大值。Iphn指示频谱倾斜。vadFlagold是先前帧的VAD标记而vadFlag是当前帧的VAD标记。如果选择了第二种编码模式TCX,那么NoMtcx是指示避免带有长帧长度(例如80ms)的TCX变换的标记。Mag是根据当前帧的LP滤波器系数Ap创建的离散傅立叶变换(DFT)频谱包络,其可根据下面的程序代码来计算。
for(i=0;i<DFTN*2;i++)
       cos_t[i]=cos[i*N_MAX/(DFTN*2)]
       sin_t[i]=sin[i*N_MAX/(DFTN*2)]
for(i=0;i<LPC_N;i++)
       ip[i]=Ap[i]
mag[0]=0.0;
for(i=0;i<DFTN;i++)         /*calc DFT*/
       x=y=0
       for(j=0;j<LPC_N;j++)x=x+ip[j]*cos_t[(i*j) & (DFTN*2-1)]
              y=y+ip[j]*sin_t[(i*j) & (DFTN*2-1)]
       Mag[i]=1/sqrt(x*x+y*y)
这里DFTN=62,N_MAX=1152、LPC_N=16。矢量cos和sin分别包含余弦函数和正弦函数的值。矢量cos和sin的长度是1152。DFTSum是矢量mag的前NO_of_elements(例如40)个项的和,不包括该矢量mag的第一项(mag(0))。
在上面的描述中,AMR-WB扩展(AMR-WB+)被作为一个实际的编码器例子来使用。然而,本发明不局限于AMR-WB编解码器或者ACELP激励方法和TCX激励方法。
虽然上面通过使用两种不同激励方法来给出本发明,但是可以使用多于两种激励方法并且在它们中间做出选择以用来压缩音频信号。
图6描述了可以应用本发明的一种系统的例子。该系统包括一个或多个产生语音和/或非语音音频信号的音频源601。音频信号在必要时通过AD转换器602转换成数字信号。将该数字化的信号输入发送设备600的编码器200,其中根据本发明来执行压缩。在必要时,在编码器200中对已压缩的信号又进行量化和编码以进行传送。发送器603,例如移动通信设备600的发送器,将已压缩和已编码的信号传送给通信网络604。通过接收设备606的一个接收机605从通信网络604接收该信号。将接收到的信号从接收机605传送给解码器607以进行解码、反量化和解压缩。解码器607包括用来确定针对当前帧在编码器200中使用的压缩方法的检测装置608。解码器607基于该确定来选择用来对当前帧进行解压缩的第一解压缩装置609或第二解压缩装置610。将已解压缩的信号从解压缩装置609、610连接到滤波器611和用来将数字信号转换成模拟信号的D/A转换器612。接下来例如在扬声器613中将模拟信号转换成音频。
本发明可以应用于不同种类的系统,尤其是应用于低速传送系统中,用于获得比现有技术系统(尤其在音频信号同时包括类似语音的信号和类似非语音的信号(例如混合的语音和音乐)的情况下)更高效的压缩和/或改善的再生(已解压缩/已解码)音频信号的音频质量。可以在通信系统的不同部分应用根据本发明的编码器200。例如,可以在具有有限的处理能力的移动通信终端中应用编码器200。
本发明还可以实现为模块202、203,可将其与编码器相连接以分析参数并对编码器200的激励方法的选择进行控制。
显然,本发明并不只局限于上述实施例,而且可以在所附权利要求书的范围内对其进行修改。

Claims (43)

1.一种编码器(200),其包括用来输入音频信号的各帧的输入(201)、用来对所述音频信号的各帧执行LTP分析以形成基于所述音频信号的属性的LTP参数的LTP分析块(209)、以及至少一个用来为所述音频信号的各帧执行第一种激励的第一激励块(206)、以及用来为所述音频信号的各帧执行第二种激励的第二激励块(207),所述编码器(200)的特征在于所述编码器(200)还包括用于分析所述LTP参数的参数分析块(202)、以及激励选择块(203),所述激励选择块(203)用来基于所述参数分析在所述第一激励块(206)和所述第二激励块(207)中选择一个激励块为所述音频信号的各帧执行激励,以及在于所述第二种激励是变换编码激励,而所述第一种激励不同于变换编码激励。
2.根据权利要求1所述的编码器(200),其特征在于所述参数分析块(202)还包括用来至少基于所述LTP参数来计算和分析归一化相关性的装置。
3.根据权利要求1或2所述的编码器(200),其特征在于所述LTP参数至少包括延迟和增益。
4.根据权利要求1或2所述的编码器(200),其特征在于安排所述参数分析块(202)检查至少有关所述音频信号的下列属性之一:
-信号瞬态,
-类似噪声的信号,
-稳态信号,
-周期信号,
-稳态周期信号。
5.根据权利要求4所述的编码器(200),其特征在于安排基于不稳定的LTP参数和/或超过预定阈值的平均频率来确定噪声。
6.根据权利要求4所述的编码器(200),其特征在于安排基于相当高的LTP增益以及相当稳定的LTP延迟和归一化相关性来确定稳态和周期信号。
7.根据权利要求1或2所述的编码器(200),其特征在于所述编码器(200)是扩展的自适应多速率宽带编解码器。
8.根据权利要求7所述的编码器(200),其特征在于所述LTP分析块(209)是所述扩展的自适应多速率宽带编解码器的LTP分析块。
9.根据权利要求1或2所述的编码器(200),其特征在于所述第一种激励是代数码激励线性预测激励(ACELP)而所述第二种激励是变换编码激励(TCX)。
10.一种包括编码器(200)的设备(600),所述编码器(200)包括用来输入音频信号的各帧的输入(201)、用来对所述音频信号的各帧执行LTP分析并用来形成基于所述音频信号的属性的LTP参数的LTP分析块(209)、以及至少一个用来为所述音频信号的各帧执行第一种激励的第一激励块(206)、以及用来为所述音频信号的各帧执行第二种激励的第二激励块(207),所述设备(600)的特征在于所述设备(600)还包括用于分析所述LTP参数的参数分析块(202)、以及激励选择块(203),所述激励选择块(203)用来基于所述参数分析在所述第一激励块(206)和所述第二激励块(207)中选择一个激励块为所述音频信号的各帧执行激励,以及所述第二种激励是变换编码激励,而所述第一种激励不同于变换编码激励。
11.根据权利要求10所述的设备(600),其特征在于所述参数分析块(202)还包括用来至少基于所述LTP参数来计算和分析归一化相关性的装置。
12.根据权利要求10或11所述的设备(600),其特征在于所述LTP参数至少包括延迟和增益。
13.根据权利要求10或11所述的设备(600),其特征在于安排所述参数分析块(202)检查至少有关所述音频信号的下列属性之一:
-信号瞬态,
-类似噪声的信号,
-稳态信号,
-周期信号,
-稳态周期信号。
14.根据权利要求13所述的设备(600),其特征在于安排基于不稳定的LTP参数和/或超过预定阈值的平均频率来确定噪声。
15.根据权利要求13所述的设备(600),其特征在于安排基于相当高的LTP增益以及相当稳定的LTP延迟和归一化相关性来确定稳态和周期信号。
16.根据权利要求10或11所述的设备(600),其特征在于所述编码器(200)是扩展的自适应多速率宽带编解码器。
17.根据权利要求16所述的设备(600),其特征在于所述LTP分析块(209)是所述扩展的自适应多速率宽带编解码器的LTP分析块。
18.根据权利要求10或11所述的设备(600),其特征在于所述第一种激励是代数码激励线性预测激励(ACELP)而所述第二种激励足变换编码激励(TCX)。
19.一种包括编码器(200)的系统,所述编码器包括用来输入音频信号的各帧的输入(201)、用来对所述音频信号的各帧执行LTP分析并用来形成基于所述音频信号的属性的LTP参数的LTPC分析块(209)、以及至少一个用来为所述音频信号的各帧执行第一种激励的第一激励块(206)、以及用来为所述音频信号的各帧执行第二种激励的第二激励块(207),所述系统的特征在于所述系统在所述编码器中还包括用于分析所述LTP参数的参数分析块(202)、以及激励选择块(203),所述激励选择块(203)用来基于所述参数分析在所述第一激励块(206)和所述第二激励块(207)中选择一个激励块为所述音频信号的各帧执行激励,以及在于所述第二种激励是变换编码激励,而所述第一种激励不同于变换编码激励。
20.根据权利要求19所述的系统,其特征在于所述参数分析块(202)还包括用来至少基于所述LTP参数来计算和分析归一化相关性的装置。
21.根据权利要求19或20所述的系统,其特征在于所述LTP参数至少包括延迟和增益。
22.根据权利要求19或20所述的系统,其特征在于安排所述参数分析块(202)检查至少有关所述音频信号的下列属性之一:
-信号瞬态,
-类似噪声的信号,
-稳态信号,
-周期信号,
-稳态周期信号。
23.根据权利要求22所述的系统,其特征在于安排基于不稳定的LTP参数和/或超过预定阈值的平均频率来确定噪声。
24.根据权利要求22所述的系统,其特征在于安排基于相当高的LTP增益以及相当稳定的LTP延迟和归一化相关性来确定稳态和周期信号。
25.根据权利要求19或20所述的系统,其特征在于所述编码器(200)是扩展的自适应多速率宽带编解码器。
26.根据权利要求25所述的系统,其特征在于所述LTP分析块(209)是所述扩展的自适应多速率宽带编解码器的LTP分析块。
27.根据权利要求19或20所述的系统,其特征在于所述第一种激励是代数码激励线性预测激励(ACELP)而所述第二种激励是变换编码激励(TCX)。
28.一种编码音频信号的方法,其中对所述音频信号的各帧执行LTP分析以形成基于所述信号的属性的LTP参数、以及可以选择为所述音频信号的各帧执行至少第一种激励和第二种激励,所述方法的特征在于所述方法还包括分析所述LTP参数、以及基于所述参数分析在所述第一种激励方法和所述第二种激励方法中选择一个激励块为所述音频信号的各帧执行激励,以及所述第二种激励包括使用变换编码激励,而所述第一种激励包括使用不同于变换编码激励的激励。
29.根据权利要求28所述的方法,其特征在于至少基于所述LTP参数来计算归一化相关性并且分析所计算的归一化相关性。
30.根据权利要求28或29所述的方法,其特征在于所述LTP参数至少包括延迟和增益。
31.根据权利要求28或29所述的方法,其特征在于检查有关所述音频信号的至少下列属性之一:
-信号瞬态,
-类似噪声的信号,
-稳态信号,
-周期信号,
-稳态周期信号。
32.根据权利要求31所述的方法,其特征在于基于不稳定的LTP参数和/或超过预定阈值的平均频率来确定噪声。
33.根据权利要求31所述的方法,其特征在于基于相当高的LTP增益以及相当稳定的LTP延迟和归一化相关性来确定稳态和周期信号。
34.根据权利要求28或29所述的方法,其特征在于所述第一种激励是代数码激励线性预测激励(ACELP)而所述第二种激励是变换编码激励(TCX)。
35.一种模块,其包括用来对音频信号的各帧执行LTP分析以形成基于所述音频信号的属性的LTP参数的LTP分析块(209),所述模块的特征在于所述模块还包括用于分析所述LTP参数的参数分析块(202)、以及激励选择块(203),所述激励选择块(203)用来在第一激励块(206)和第二激励块(207)中选择一个激励块并且用来向编码器(200)指示所述已选择的激励方法,以及在于所述第二种激励是变换编码激励,而所述第一种激励不同于变换编码激励。
36.根据权利要求35所述的模块,其特征在于所述参数分析块(202)还包括用来至少基于所述LTP参数来计算和分析归一化相关性的装置。
37.根据权利要求35或36所述的模块,其特征在于所述LTP参数至少包括延迟和增益。
38.根据权利要求35或36所述的模块,其特征在于安排所述参数分析块(202)检查有关所述音频信号的至少下列属性之一:
-信号瞬态,
-类似噪声的信号,
-稳态信号,
-周期信号,
-稳态周期信号。
39.根据权利要求38所述的模块,其特征在于安排基于不稳定的LTP参数和/或超过预定阈值的平均频率来确定噪声。
40.根据权利要求38所述的模块,其特征在于安排基于相当高的LTP增益以及相当稳定的LTP延迟和归一化相关性来确定稳态和周期信号。
41.根据权利要求35或36所述的模块,其特征在于所述编码器(200)是扩展的自适应多速率宽带编解码器。
42.根据权利要求41所述的模块,其特征在于所述LTP分析块(209)是所述扩展的自适应多速率宽带编解码器的LTP分析块。
43.根据权利要求35或36所述的模块,其特征在于所述第一种激励是代数码激励线性预测激励(ACELP)而所述第二种激励是变换编码激励(TCX)。
CN200580005610XA 2004-02-23 2005-02-22 编码模式选择 Active CN1922659B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FI20045052 2004-02-23
FI20045052A FI118835B (fi) 2004-02-23 2004-02-23 Koodausmallin valinta
PCT/FI2005/050043 WO2005081231A1 (en) 2004-02-23 2005-02-22 Coding model selection

Publications (2)

Publication Number Publication Date
CN1922659A CN1922659A (zh) 2007-02-28
CN1922659B true CN1922659B (zh) 2010-05-26

Family

ID=31725818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580005610XA Active CN1922659B (zh) 2004-02-23 2005-02-22 编码模式选择

Country Status (15)

Country Link
US (1) US7747430B2 (zh)
EP (1) EP1719120B1 (zh)
JP (1) JP2007523388A (zh)
KR (2) KR20080083718A (zh)
CN (1) CN1922659B (zh)
AU (1) AU2005215745A1 (zh)
BR (1) BRPI0508309A (zh)
CA (1) CA2555768A1 (zh)
FI (1) FI118835B (zh)
HK (1) HK1099960A1 (zh)
RU (1) RU2006129871A (zh)
SG (1) SG150572A1 (zh)
TW (1) TW200534599A (zh)
WO (1) WO2005081231A1 (zh)
ZA (1) ZA200606714B (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
WO2006063618A1 (en) * 2004-12-15 2006-06-22 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for encoding mode changing of encoded data streams
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
JP2009524101A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
US7813922B2 (en) * 2007-01-30 2010-10-12 Nokia Corporation Audio quantization
ES2394515T3 (es) * 2007-03-02 2013-02-01 Telefonaktiebolaget Lm Ericsson (Publ) Métodos y adaptaciones en una red de telecomunicaciones
US20090006081A1 (en) * 2007-06-27 2009-01-01 Samsung Electronics Co., Ltd. Method, medium and apparatus for encoding and/or decoding signal
EP2259253B1 (en) * 2008-03-03 2017-11-15 LG Electronics Inc. Method and apparatus for processing audio signal
DE102008022125A1 (de) * 2008-05-05 2009-11-19 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen
KR20100006492A (ko) 2008-07-09 2010-01-19 삼성전자주식회사 부호화 방식 결정 방법 및 장치
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
EP2301020B1 (en) * 2008-07-11 2013-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
BRPI0914056B1 (pt) * 2008-10-08 2019-07-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificação/decodificação de áudio comutado multi-resolução
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
CN101609677B (zh) 2009-03-13 2012-01-04 华为技术有限公司 一种预处理方法、装置及编码设备
CN101615910B (zh) * 2009-05-31 2010-12-22 华为技术有限公司 压缩编码的方法、装置和设备以及压缩解码方法
US9269366B2 (en) * 2009-08-03 2016-02-23 Broadcom Corporation Hybrid instantaneous/differential pitch period coding
PL2473995T3 (pl) * 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem
SG10201604880YA (en) 2010-07-02 2016-08-30 Dolby Int Ab Selective bass post filter
BR122021002104B1 (pt) * 2010-07-08 2021-11-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador que utiliza cancelamento de serrilhado futuro
PL3239978T3 (pl) 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
RU2585999C2 (ru) * 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование шума в аудиокодеках
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
CN103503062B (zh) 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用对齐的前瞻部分将音频信号编码及解码的装置与方法
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
KR101525185B1 (ko) * 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
CN103534754B (zh) 2011-02-14 2015-09-30 弗兰霍菲尔运输应用研究公司 在不活动阶段期间利用噪声合成的音频编解码器
KR101701081B1 (ko) 2013-01-29 2017-01-31 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법
CN107424621B (zh) 2014-06-24 2021-10-26 华为技术有限公司 音频编码方法和装置
JP6086999B2 (ja) 2014-07-28 2017-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737484A (en) * 1993-01-22 1998-04-07 Nec Corporation Multistage low bit-rate CELP speech coder with switching code books depending on degree of pitch periodicity
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5250940A (en) * 1991-01-18 1993-10-05 National Semiconductor Corporation Multi-mode home terminal system that utilizes a single embedded general purpose/DSP processor and a single random access memory
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
FR2729245B1 (fr) * 1995-01-06 1997-04-11 Lamblin Claude Procede de codage de parole a prediction lineaire et excitation par codes algebriques
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
ATE302991T1 (de) 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
US6510407B1 (en) * 1999-10-19 2003-01-21 Atmel Corporation Method and apparatus for variable rate coding of speech
US6640208B1 (en) * 2000-09-12 2003-10-28 Motorola, Inc. Voiced/unvoiced speech classifier
US6738739B2 (en) * 2001-02-15 2004-05-18 Mindspeed Technologies, Inc. Voiced speech preprocessing employing waveform interpolation or a harmonic model
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6785645B2 (en) 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5737484A (en) * 1993-01-22 1998-04-07 Nec Corporation Multistage low bit-rate CELP speech coder with switching code books depending on degree of pitch periodicity
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding

Also Published As

Publication number Publication date
BRPI0508309A (pt) 2007-07-24
FI20045052A (fi) 2005-08-24
JP2007523388A (ja) 2007-08-16
US20050192797A1 (en) 2005-09-01
ZA200606714B (en) 2007-11-28
FI20045052A0 (fi) 2004-02-23
EP1719120A1 (en) 2006-11-08
KR100879976B1 (ko) 2009-01-23
WO2005081231A1 (en) 2005-09-01
HK1099960A1 (en) 2007-08-31
FI118835B (fi) 2008-03-31
AU2005215745A1 (en) 2005-09-01
KR20080083718A (ko) 2008-09-18
EP1719120B1 (en) 2019-06-19
TW200534599A (en) 2005-10-16
KR20070015155A (ko) 2007-02-01
SG150572A1 (en) 2009-03-30
CN1922659A (zh) 2007-02-28
CA2555768A1 (en) 2005-09-01
RU2006129871A (ru) 2008-03-27
US7747430B2 (en) 2010-06-29

Similar Documents

Publication Publication Date Title
CN1922659B (zh) 编码模式选择
CN103177726B (zh) 音频信号的分类
CN101131817B (zh) 强壮语音分类方法和装置
US8244525B2 (en) Signal encoding a frame in a communication system
CN100362568C (zh) 用于预测量化有声语音的方法和设备
KR100798668B1 (ko) 무성 음성의 코딩 방법 및 장치
CN102089803A (zh) 用以将信号的不同段分类的方法与鉴别器
CN103258541A (zh) 音频解码方法
JPH05232996A (ja) 音声符号化装置
CN1189665A (zh) 改进的多模态编码激励线性预测编码器和方法
MXPA06009370A (en) Coding model selection

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1099960

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1099960

Country of ref document: HK

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160115

Address after: Espoo, Finland

Patentee after: Technology Co., Ltd. of Nokia

Address before: Espoo, Finland

Patentee before: Nokia Oyj