CN101138022A - 低复杂度码激励线性预测编码 - Google Patents
低复杂度码激励线性预测编码 Download PDFInfo
- Publication number
- CN101138022A CN101138022A CNA2005800489816A CN200580048981A CN101138022A CN 101138022 A CN101138022 A CN 101138022A CN A2005800489816 A CNA2005800489816 A CN A2005800489816A CN 200580048981 A CN200580048981 A CN 200580048981A CN 101138022 A CN101138022 A CN 101138022A
- Authority
- CN
- China
- Prior art keywords
- pumping signal
- signal
- pulse position
- candidate
- pumping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 53
- 238000005086 pumping Methods 0.000 claims description 138
- 238000000034 method Methods 0.000 claims description 53
- 238000001914 filtration Methods 0.000 claims description 7
- 238000009795 derivation Methods 0.000 claims 3
- 230000005284 excitation Effects 0.000 abstract description 18
- 230000002596 correlated effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 18
- 230000009467 reduction Effects 0.000 description 18
- 230000008569 process Effects 0.000 description 14
- 239000013598 vector Substances 0.000 description 10
- 239000011159 matrix material Substances 0.000 description 9
- 239000002131 composite material Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 239000004576 sand Substances 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- JEIPFZHSYJVQDO-UHFFFAOYSA-N ferric oxide Chemical compound O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 206010038743 Restlessness Diseases 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008521 reorganization Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
使用有关通过CELP编码的第一信号(sm(n))的激励信号的信息来导出第二相关的第二信号(SS(n))的候选激励信号的有限集合(10′)。优选地,使用第一编码的信号(sm(n))的激励信号的脉冲位置来确定候选激励信号的集合(10′)。更优选地,将该集合中的候选激励信号的脉冲位置设在第一编码的信号(sm(n))的激励信号的脉冲位置的附近。第一和第二信号(sm(n)、ss(n))可以是普通语音或音频信号的多通道信号。但是,第一和第二信号(sm(n)、ss(n))也可以是完全相同的,由此可以利用第二信号(ss(n))的编码来实现以较低比特率重新编码。
Description
技术领域
本发明一般涉及音频编码,更具体来说涉及码激励线性预测编码。
背景技术
现有立体声(一般为多通道)编码技术需要非常高的比特率。常常在非常低的比特率使用参量立体声。但是,这些技术是针对宽泛类的通用音频材料(即音乐、语言和混合内容)而设计的。
在多通道语音编码中,实现的非常少。大多数工作集中在通道间预测(ICP)方法。ICP技术利用左通道和右通道之间存在相关性的事实。在例如[1][2][3]的文献中描述了许多减少立体声信号中的冗余性的不同方法。
ICP方法对只有一个发言人的情况建模非常好,但是它无法对多个发言人和混杂声音源(例如混杂背景噪声)建模。因此,在许多情况中对ICP的余下部分编码是必须的,并且该编码对必需的比特率提出非常高的要求。
大多数现有语音编解码器是单声道的,并且基于码激励线性预测(CELP)编码模型。示例包括AMR-NB和AMR-WB(自适应多速率窄带和自适应多速率宽带)。在此模型中(即CELP),通过添加分别来自自适应和固定(主动)码书的两个激活矢量来构造短期LP合成滤波器的输入处的激励信号。通过将从两个码书选择的适合矢量馈送通过短期合成滤波器来合成语音。使用分析合成搜索过程来选择最优激励序列,该分析合成搜索过程中,根据感知加权的失真测量来将原始语音和合成的语音之间的误差最小化。
有两种类型的固定码书。第一种类型码书是所说的随机码书。这种码书常常涉及真实的物理存储装置。给定码书中的索引,通过常规的表查询来获得激励矢量。因此比特率和复杂性限制了码书的大小。
第二种类型码书是代数码书。与随机码书比较,代数码书不是随机的,且实质上无需任何存储装置。代数码书是索引的码矢量的集合,其中构成第k个码矢量的脉冲的振幅和位置直接由对应的索引k导出出。这实质上无需任何存储器需求。因此,代数码书的大小不受存储器要求的限制。此外,代数码书还较好地适用于有效率的搜索过程。
要格外注意的是,将语音编解码器可用比特的实质部分以及常常也是主要部分分配给固定码书激活编码。例如,在AMR-WB标准中,分配给固定码书过程的比特的量在从36%上至76%的范围。此外,它也是表示大多数编码器复杂度的固定码书激励搜索。
在[7]中,使用包含每个通道的个体固定码书和对于所有通道共有的共享码书的多部分固定码书。利用此策略,可以具有对通道相关性的较好表示。但是,这促使复杂度以及存储量的增加。此外,将固定码书激励编码所需的比特率非常大,因为除了每个通道码书索引外,还需要传输共享码书索引。在[8]和[9]中,描述了用于对多通道信号编码的相似方法,其中编码模式设为取决于不同通道的相关性的程度。在左/右和中/边编码中,这些技术已经是公知的,其中两种编码模式之间切换取决于余下部分,因此取决于相关性。
在[10]中,描述了一种用于对多通道信号编码的方法,它将单通道线性预测编解码器的不同部件通用化。该方法存在需要大量计算的缺点,这使得它无法用于例如通话应用的实时应用中。该技术的另一个缺点是为对用于编码的多种去相关性滤波器编码所需的比特量。
上文描述的先前引述的解决方案的另一个缺点在于,它们与现有标准化的单声道通话编解码器不可兼容,在此意义上而言不单独地对任何单声道信号编码,因此阻碍了直接仅对单声道信号解码的能力。
发明内容
现有技术的语音编码的一个总体问题是,它需要高比特率和复杂的编码器。
因此本发明的总体目的在于,提供用于语音编码的改进的方法和装置。本发明的从属目的在于,提供在比特率和编码器复杂度方面具有降低的要求的CELP方法和装置。
上文的目的通过根据如所含的专利权利要求所述的方法和装置来实现。一般而言,使用CELP编码的第一信号的激励信号来导出第二信号的有限的候选激励信号的集合。优选地,使第二信号与第一信号相关。在特定实施例中,按规则来导出有限的候选激励信号的集合,该规则是基于编码的第一信号和/或第二信号从预定规则的集合中选择的。优选地,使用第一编码的信号的激励信号的脉冲位置来确定候选激励信号的集合。更优选地,将该集合中的候选激励信号的脉冲位置设在第一编码的信号的激励信号的脉冲位置的附近。第一和第二信号可以是普通语音或音频信号的多通道信号。但是,第一和第二信号也可以是完全相同的,由此可以利用第二信号的编码来实现以较低比特率重新编码。
本发明的一个优点在于,降低编码的复杂度。而且,在多通道信号的情况中,降低了用于传输编码的信号所需的比特率。而且,本发明还可以有效率地应用于以较低速率对相同的信号重新编码。本发明的另一个优点在于,与单声道信号的兼容,以及能够以非常小的修改作为对现有语音编解码器的扩充来实现。
附图说明
通过参考结合附图的下文描述可以最好理解本发明以及其他目的和优点,其中:
图1A是码激励线性预测模型的示意图示;
图1B是导出激励信号的过程的示意图示;
图1C是在码激励线性预测模型中使用的激励信号的实施例的示意图示;
图2是根据码激励线性预测模型的编码器和解码器的实施例的框图;
图3A是图示根据本发明选择候选激励信号的原理的一个实施例的示意图;
图3B是图示根据本发明选择候选激励信号的原理的另一个实施例的示意图;
图4图示根据本发明实施例减少所需的数据实体的可能性;
图5A是根据本发明用于两个信号的编码器和解码器的实施例的框图;
图5B是根据本发明用于两个信号的编码器和解码器的另一个实施例的框图;
图6是根据本发明用于对信号重新编码的编码器和解码器的实施例的框图;
图7是根据本发明用于对不同比特率的信号进行并行编码的编码器和解码器的实施例的框图;
图8是图示本发明实施例实现的感知质量的示意图;
图9是根据本发明的编码方法的实施例的主要步骤的流程图;
图10是根据本发明的编码方法的另一个实施例的主要步骤的流程图;以及
图11是根据本发明的解码方法的实施例的主要步骤的流程图。
具体实施方式
图1A中说明一般性CELP语音合成模型。固定码书10包括多个候选激励信号30,由相应的索引k表征。在代数码书的情况中,索引k完全唯一地表征对应的候选激励信号30。每个候选激励信号30包括多个具有某个位置和振幅的脉冲32。索引k决定放大器11中放大而产生输出激励信号Ck(n)12的候选激励信号30。不是本发明的主题的自适应码书14通过放大器15提供自适应信号v(n)。在加法器17中将激励信号Ck(n)和自适应信号v(n)相加,得到复合激励信号u(n)。复合激励信号u(n)影响后续信号的自适应码书,如图虚线13所示。
将CELP语音合成模型用于对感兴趣的语音信号的分析合成编码。提供目标信号s(n),即将重组的信号。使用自适应码书,调整对当前目标信号的先前编码,给出自适应信号v(n)=gpu(n-δ),进行长期预测。留下的差值是固定码书激励信号的目标,由此对应于项Ck的码书索引k应当使通常根据目标函数(例如均方测量)的差值最小。一般来说,通过将加权的输入语音与加权的合成语音之间的均方差最小来搜索代数码书。固定码书搜索的目的在于查找对应于索引k的代数码书项ck,以便将
最大化。矩阵H是其元素由加权滤波器的脉冲响应导出的滤波矩阵。y2是取决于要编码的信号的分量的矢量。
固定码书过程可以如图1B所示,其中索引k从固定码书10中选择项Ck作为激励信号12。在随机固定码书中,索引k通常作为对表查询的输入,而在代数固定码书中,激励信号12直接由索引k导出。一般来说,多脉冲激励可以书写为:
其中Pi,k是索引k的脉冲位置,而bi,k是个体脉冲振幅,以及P是脉冲的数量和δ是狄拉克脉冲函数:
δ(0)=1,δ(n)=0 for n≠0
图1C图示固定码书10的候选激励信号30的示例。候选激励信号30由多个脉冲32表征,在本示例中为8个脉冲。脉冲32由它们的位置P(1)-P(8)和它们的振幅表征,在典型代数固定码书中它们的振幅是+1或-1。
在单个通道的编码器/解码器系统中,通常如图2所示地实现CELP模型。与图1A的CELP合成模型的不同功能对应的不同部分被赋予相同编号,因为这些部分主要由它们的功能表征,而通常并不在相同的程度上由它们的实际实现来表征。例如,未表示通过合成常常存在于线性预测分析的具体实现中的误差加权滤波器。
将要编码的信号s(n)33提供到编码器单元40。编码器单元包括根据上文论述的原理的CELP合成框25。(为了便于附图的阅读省略了后处理。)在比较器框31中将从CELP合成框25的输出与信号s(n)比较。将可以由加权滤波器加权的差值37提供到码书优化框35,码书优化框35是根据用于查找最优或至少合理地良好的激励信号ck(n)12的任何现有技术原理而设置的。码书优化框35向固定码书10提供对应的索引k。当找到最终的激励信号时,在索引编码器38中将自适应码书12的索引k和延迟δ编码,以提供表示索引k和延迟δ的输出信号45。
将索引k和延迟δ的表示提供到解码器单元50。解码器单元包括根据上文论述的原理的CELP合成框25。(为了便于附图的阅读这里也省略了后处理。)在索引解码器53中将索引k和延迟δ的表示解码,并将索引k和δ作为输入参数分别提供到固定码书和自适应代码,从而产生合成的信号21,假定它重组原始信号s(n)。
可以将索引k和延迟δ的表示存储在编码器与解码器之间的任何位置较短或较长的时间,这使得例如音频记录存储要求相对较小的存储容量。
本发明涉及语音,且一般来说涉及音频编码。在典型的情况中,它解决已经根据CELP技术将主信号sM(n)编码,并且期望的是将另一个信号ss(n)编码的情况。另一个信号可以是相同的主信号ss(n)=sM(n)(例如在以较低比特率重新编码期间或是主信号的编码版本 ),或是与另一个通道对应的信号(例如立体声、多通道5.1等)。
因此本发明可直接应用于立体声,以及一般来说可直接应用于电话会议应用中对语音的多通道编码。本发明的应用还可以包括作为开放回路或闭合回路内容相关的编码的一部分的音频编码。
在主信号和其他信号之间应该优选地存在相关性,以便本发明能够在最优条件中工作。但是,此类相关性的存在不是本发明适合工作的强制性要求。事实上,可以自适应地运作本发明并将其设为取决于主信号与其他信号之间的相关性的程度。因为立体声应用中左和右通道之间不存在任何因果关系,所以主信号sM(n)常常选择为左和右通道的和信号,以及将ss(n)选择为左和右通道的差信号。
本发明的假设是CELP编码的表示中有主信号sM(n)。本发明的一个基本理念是在将其他信号ss(n)编码成候选激励信号的一个子集期间限制固定码书中的搜索。根据主信号的CELP编码来选择该子集。在优选实施例中,将该子集的候选激励信号的脉冲限制于取决于主信号的脉冲位置的脉冲位置的集合。这相当于定义受约束的候选脉冲位置。通常可以将可用脉冲位置该集合设为主信号的脉冲位置加相邻脉冲位置。
这种候选脉冲数的减少大大减少了编码器的计算复杂度。
下文中,针对两个通道信号的一般性情况给出示范性示例。然而这容易地扩展到多个通道。然而在多个通道的情况中,每个通道上给定不同加权滤波器,则目标可能不同,而且每个通道上的目标可能彼此有延迟。
可以按如下公式构造主通道和侧(side)通道
其中sL(n)和sR(n)分别是左和右通道的输入。可以显然见到的是,即使左和右通道是彼此的延迟版本,但这对于主通道和侧通道来说可能并不是问题,因为它们一般会包含来自两个通道的信息。
下文中,假定主通道是第一编码的通道,以及有针对该编码的固定码书激励的脉冲位置可用。
将侧信号固定码书激励编码的目标作为侧信号与自适应码书激励之间的差值来计算:
sC(n)=ss(n)-gpv(n), n=0,...,L-1,
其中gpv(n)是自适应码书激励且sC(n)是用于自适应码书搜索的目标信号。
在本实施例中,相对于主信号脉冲位置来定义候选激励信号的潜在脉冲位置的数量。因为它们仅是所有可能位置的一部分,所以与出现所有脉冲位置的情况相比,大大减少了利用此候选激励信号的有限集合内的激励信号来对侧信号编码所需的比特数量。
相对于主脉冲位置选择脉冲候选位置是确定复杂度以及所需的比特率时的基础。
例如,如果帧长度是L,且主信号编码中的脉冲数是N,则需要约N*log2(L)个比特来对脉冲位置编码。但是为了对侧信号编码,如果仅保留主信号脉冲位置作为候选,且用于侧信号的候选激励信号中的脉冲数是P,则需要约P*log2(N)个比特。对于N、P和L的合理数目,这对应于比特率要求中的很大减少。
一个有趣的方面是当侧信号的脉冲位置设为等于主信号的脉冲位置时。这样就没有对脉冲位置编码的必要,而是仅需要对脉冲振幅编码。在具有+1/-1振幅的脉冲的代数码书的情况中,仅需要对信号(N个比特)编码。
如果以PM(i),i=1,…n来表示主信号脉冲位置。基于主信号脉冲位置和可能的附加参数来选择侧信号的候选激励信号的脉冲位置。附加参数可以由两个通道之间的时间延迟和/或自适应码书索引的差值组成。
在该实施例中,将侧信号候选激励信号的脉冲位置的集合构造为:
{PM(i)+J(i,k),k=1,…,kmaxi,i=1,…,n}
其中J(i,k)表示一些延迟索引。这意味着每个单脉冲位置生成用于为侧信号脉冲搜索过程构造候选激励信号的脉冲位置的集合。图3A图示了此情况。这里,PM表示主信号的激励信号的脉冲位置,以及Ps *表示用于侧信号分析的候选激励信号的可能脉冲位置。
当然在具有高度相关的信号的情况下,这是最优的情况。对于低相关或不相关的信号,采用反向策略。这在于采用脉冲候选作为所有不属于该集合的脉冲:
{PM(i)+J(i,k),k=1,…,kmaxi,i=1,…,n}
因为这是互补的情况,所以本领域技术人员容易地理解,两种策略是相似的,并且将只更详细地描述相关的情况。
容易地见到,脉冲候选的位置和数量取决于延迟索引J(i,k)。可以将延迟索引设为取决于两个通道之间的有效延迟和/或自适应码书索引。在图3A中,kmax=3,以及J(i,k)=J(k)∈{- 1,0,+1}。
在图3B中,设置另一个稍微不同的脉冲位置选择。这里,kmax=3,但是J(i,k)=J(k)∈{0,+1,+2}。
本领域技术人员认识到可以采用多种不同方式来构造如何选择脉冲位置的规则。可以调整要使用的实际规则来适应具体实现。但是,重要的特征是根据遵照某个规则由主信号分析产生的脉冲位置来选择脉冲位置候选。该规则可以是唯一的且固定的,或可以从取决于例如两个通道之间相关性的程度和/或两个通道之间的延迟的预定规则的集合中选择该规则。
根据使用的规则,构造侧信号的脉冲候选的集合。一般来说与整个帧长度相比,该侧信号脉冲候选的集合非常小。这使得能够基于十中抽一采样帧来对目标最大化问题再阐述。
在一般的情况中,使用例如[5]中描述的深度第一算法或在候选脉冲数量实际小的情况下使用穷举搜索来搜索脉冲。但是,即使具有小数量的候选,仍建议使用快速搜索过程。
一般使用如下公式预先计算后向滤波的信号。
矩阵Φ=HTH是h(n)的相关性的矩阵(加权滤波器的脉冲响应),其元素由如下公式计算:
因此可以将其目标函数书写为:
给定侧信号上的可能候选脉冲位置的集合,则仅需要后向滤波的矢量d的索引的子集和矩阵Φ。将该集合中的候选脉冲按升序排序,
如果表示十中抽一采样信号
以及表示十中抽一采样相关性矩阵Φ2
Φ2是对称的且是正定的。可以直接书写为
图4中图示了这些十中抽一采样操作的概况。在附图上部中,图示了将正常大小的代数码书10缩减到缩减大小的码书10’。在附图中部中,图示了将正常大小的加权滤波器协方差矩阵60缩减到缩减的加权滤波器协方差矩阵60’。最后,在附图底部中,图示了将正常大小的后向滤波的目标62缩减到缩减大小的后向滤波的目标62’。本领域技术人员认识到复杂度的降低是这种缩减的结果。
对十中抽一采样信号使目标函数最大化具有多个优点。其中之一是存储器需求的减少,例如矩阵Φ,需要较低的存储器。另一个优点是因为在所有情况中主信号脉冲位置都传输到接收器,所以十中抽一采样信号的索引对于解码器始终可用。这又使得相对于主信号脉冲位置对其他信号(次要)脉冲位置编码耗用远远更少的比特。另一个优点是降低了计算复杂度,因为最大化是对十中抽一采样信号来执行的。
在图5A中,图示了根据本发明的编码器40A、40B和解码器50A、50B的系统的实施例。许多细节与图2中图示的那些相似,因此如果它们的功能没有本质上改变,将不再详细论述。将主信号33Asm(n)提供到第一编码器40A。第一编码器40A根据任何现有技术CELP编码模型来工作,产生固定码书的索引Km,以及自适应码书的延迟测量值δm。这种编码的细节对于本发明不是要点,并且为了便于图5A的理解而将其省略。在第一索引编码器38A中将参数Km和δm编码,得到发送到第一解码器50A的参数的表示k* m和δ* m。在第一解码器中,将表示k* m和δ* m解码成第一索引解码器53A中的参数km和δm。从这些参数,根据现有技术的任何CELP解码模型复原原始信号。这种解码的细节对于本发明不是要点,并且为了便于图5A的理解而将其省略。提供复原的第一输出信号21A
将侧信号33B ss(n)作为输入信号提供到第二编码器40B。第二编码器40B大多数部件与图2的编码器相似。现在对这些信号赋予索引“s”以将它们与用于对主信号编码的任何信号相区分。第二编码器40B包括CELP合成框25。根据本发明,将索引km或其表示从第一编码器40A提供到第二编码器40B的固定码书10的输入45。候选导出部件47使用索引Km根据上文给出的原理提取缩减的固定码书10′。因此第二编码器40B的CELP合成框25′的合成基于表示来自缩减的固定码书10′的激励信号的索引k′s。因此找到索引k′s以表示CELP合成的最佳选择。在第二索引编码器38B中将参数k′s和δ s编码,得到发送到第二解码器50B的参数的表示k’* s和δ* s。
在第二解码器中,将表示k’* s和δ* s解码成第二索引解码器53B中的参数k′s和δs。而且,可从第一解码器得到索引参数km,并将其提供到第二解码器50B的固定码书10的输入55,以使缩减的固定码书10′的候选导出部件57所提取的等于第二编码器40B中所使用的。从参数K′s和δs和缩减的固定码书10′,根据常规CELP解码模型25″复原原始侧信号。这种解码的细节本质上与图2相似的方式执行,但是使用缩减的固定码书10′。因此提供复原的次要输出信号21B
可以有利地将用于构造候选脉冲的集合的规则(例如索引函数J(i,k))的选择设为自适应的,并且取决于附加的通道间特征,例如延迟参数、相关性的程度等。在此情况中,即自适应规则选择的情况中,编码器优选地需要向解码器传输选择了哪个规则来导出候选脉冲的集合以用于对其他信号编码。该规则选择可以由例如闭合回路过程来执行,其中测试多个规则并选择最终得到最佳结果的一个规则。
图5B图示使用规则选择方法的一个实施例。此处还附加地将单信号sm(n)以及优选地还有侧信号ss(n)提供到该规则选择单元39。作为单信号的备选方式,可以使用表示单信号的参数km。在规则选择单元39中,利用例如延迟参数或相关性的程度来分析这些信号。根据这些结果,从预定义规则的集合中选择例如索引r表示的规则。将所选规则的索引提供到候选导出部件47用于确定应该如何导出候选集合。还将规则索引r提供到第二索引编码器38B,第二索引编码器38B给出索引的表示r*,然后将其发送到第二解码器50B。第二索引解码器53B将规则索引r解码,然后使用它来控制候选导出部件57的操作。
由此,可以提供将适用于不同类型的信号的规则的集合。因此仅通过在数据的传输中添加单个规则索引,实现了进一步的灵活性。
所使用的特定规则以及所得到的候选侧信号脉冲的数量是控制比特率和算法的复杂度的主要参数。
如上文还提到的,可以非常等效地将相同原理应用于同一个通道重新编码。图6图示其中传输路径的不同部分允许使用不同比特率的实施例。因此它可以作为比特率转码解决方案的一部分来应用。信号s(n)作为输入信号33A提供到第一编码器40A,第一编码器40A产生根据第一比特率传输的参数的表示k*和δ*。在某个地方,降低可用的比特率,并且需要执行较低比特率的重新编码。第一解码器50A使用用于产生复原的信号21A的参数的表示k*和δ*。将此复原的信号21A作为输入信号33B提供到第二编码器40B。还将来自第一解码器50A的索引k提供到第二编码器40B。以与图6相似的方式使用索引k来提取缩减的固定码书10′。第二编码器40B将信号编码以用于较低比特率,给出表示选择的激励信号的索引然而,此索引在不相关的解码器中是没有用的,因为该解码器没有构造对应的缩减的固定码书所需的信息。因此需要将索引与索引关联,参考原始码书10。此操作优选地结合固定码书10来执行,它在图6中由分别图示输入和输出的箭头41和43来表示。然后根据候选激励信号的完整集合来执行索引的编码。
在典型的情况中,利用比特率n进行第一编码,并利用比特率m进行第二编码,其中n>m。
在某些应用中,例如通过具有不同容量的不同类型的网络进行现场内容的实时传输(例如电话会议)中,也可以对以不同比特率提供并行编码感兴趣,例如在需要以多个不同比特率对相同信号进行实时编码以便适应不同类型的网络的情况中,即所说的并行多速率编码。图7图示一种其中将信号s(n)提供到第一编码器40A和第二编码器40B的系统。与先前实施例相似,第二编码器基于表示第一编码的索引ka提供缩减的固定码书10′。这里第二编码由索引“b”表示。因此第二编码器40B变为独立于第一解码器50B。大多数其他部分与图6相似,只是各具有各自适合的索引方式。
对于这两个应用,以低比特率将相同信号重新编码,本发明提供复杂度上的实质性降低,因此允许利用低成本硬件实现这些应用。
已经结合AMIR-WB语言编解码器实现了上文描述的算法的实施例。对于编码侧信号,使用与用于编码单激励的自适应码书索引相同的自适应码书索引。未将LTP增益和创新矢量增益量化。
代数码书的算法基于单脉冲位置。例如[6]中所述的,可以在轨道(track)中构造码书。除最低模式外,轨道的数量等于4。对于每个模式,使用某个数量的脉冲位置。例如,对于模式5,即15.85 kbps,候选脉冲位置如下:
轨道 | 脉冲 | 位置 |
1 | i0,i4,i8 | 0,4,8,12,16,20,24,28,32,36,40,44,48,52,56,60 |
2 | I1,i5,i9 | 1,5,9,13,17,21,25,29,33,37,41,45,49,53,57,61 |
3 | i2,i6,i10 | 2,6,10,14,18,22,26,30,34,38,42,46,50,54,58,62 |
4 | i3,i7,i11 | 3,7,11,15,19,23,27,3 1,35,39,43,47,51,55,59,63 |
表1候选脉冲位置
实现的算法保留所有单脉冲作为侧信号的脉冲位置,即不将这些脉冲位置编码。而仅将这些脉冲的符号编码。
轨道 | 侧信号脉冲 | 单信号脉冲 |
1 | P0,P4,P8 | i0,i4,i8 |
2 | P1,P5,P9 | i1,i5,i9 |
3 | P2,P6,P10 | i2,i6,i10 |
4 | P3,P7,P11 | i3,i7, i11 |
表2次要和单信号脉冲
因此,每个脉冲将仅占用1个比特用于对符号编码,这使得总比特率等于单脉冲的数量。在上文示例中,每个子帧有12个脉冲,这使得总比特率等于12个比特×4×50=2.4kpbs用于对创新矢量编码。这是非常最低AMR-WB模式所需的相同比特数,(对于6.6kbps模式,2个脉冲),但是在此情况中,具有更高的脉冲密度。
应该注意无需任何附加算法延迟来对立体声信号编码。
图8示出利用PEAQ[4]获得用于评估感知质量的结果。选择PEAQ是因为就所能了解到的,它是唯一提供用于立体声信号的目标质量测量的工具。根据这些结果,明显看到立体声100事实上相对于单信号102提供质量的提升。使用的声音项有非常大的差异,声音1S1是从具有背景噪声的电影提取,声音2S2是1分钟无线电录音,声音3S3是从CART赛车比赛提取的,以及声音4S4是实时两个麦克风录音。
图9图示根据本发明的编码方法的实施例。过程起始于步骤200。在步骤210中,提供第一音频信号的CELP激励信号的表示。注意并非绝对需要提供整个第一音频信号,而只需提供CELP激励信号的表示。在步骤212中,提供第二音频信号,它与第一音频信号相关。在步骤214中根据第一CELP激励信号导出候选激励信号的集合。优选地,使候选激励信号的脉冲位置与第一音频信号的CELP激励信号的脉冲位置相关。在步骤216中,使用步骤214中导出的候选激励信号的缩减集合对第二音频信号执行CELP编码。最后,使用对该缩减的候选集合的引用来对第二音频信号的CELP激励信号的表示(即通常为索引)编码。该过程结束于步骤299。
图10图示根据本发明的编码方法的另一个实施例。过程起始于步骤200。在步骤211中,提供音频信号。在步骤213中,提供相同音频信号的第一CELP激励信号的表示。在步骤215中根据第一CELP激励信号导出候选激励信号的集合。优选地,将候选激励信号的脉冲位置与第一音频信号的CELP激励信号的脉冲位置相关。在步骤217中,使用步骤215中导出的候选激励信号的缩减集合对音频信号执行CELP重新编码。最后,使用对该非缩减的候选集合(即用于第一CELP编码的集合)的引用来对音频信号的第二CELP激励信号的表示(即通常为索引)编码。该过程结束于步骤299。
图11图示根据本发明的解码方法的实施例。过程起始于步骤200。在步骤210中,提供第一音频信号的第一CELP激励信号的表示。在步骤252中,提供第二音频信号的第二CELP激励信号的表示。在步骤254中,利用对第一激励信号的认识从第二激励信号导出第二激励信号。优选地,根据第一CELP激励信号导出候选激励信号的缩减集合,根据候选激励信号的缩减集合,使用第二CELP激励信号的索引选择第二激励信号。在步骤256中,使用第二激励信号重构第二音频信号。该过程结束于步骤299。
上文描述的实施例应理解为本发明的示范示例。本领域技术人员将理解,在不背离本发明范围的前提下可以对这些实施例进行多种修改、组合和更改。具体来说,在技术可行的情况下,可以按不同的配置将不同实施例中的不同部分解决方案进行组合。但是本发明的范围由所附权利要求限定。
当使用代数码书和CELP来对多个音频通道编码时,本发明能够大大地降低复杂度(同时包括存储器和算法操作)以及比特率。
参考文献
[1]H.Fuchs,″Improving joint stereo audio coding by adaptive inter-channel prediction″,in Proc.IEEE WASPAA,Mohonk,NY, Oct.1993
[2]S.A.Ramprashad,″Stereophonic CELP coding using crosschannel prediction″,in Proc.IEEE Workshop Speech Coding,pp.136-138,Sept.2000
[3]T. Liebschen,″Lossless audio coding using adaptivemultichannel prediction″,in Proc.AES 113th Conv.,Los Angeles,CA,Oct.2002
[4]ITU-RBS.1387
[5]WO 96/28810.
[6]3GPPTS 26.190,p.28,table7
[7]US 2004/0044524 A1
[8]US 2004/0109471 A1
[9]US 2003/0191635 A1
[10]US 6,393,392 B1
Claims (36)
1.一种用于对音频信号编码的方法,包括如下步骤:
提供第一音频信号(33、33A)的码激励线性预测的第一激励信号的表示(k、km、ka);
提供第二音频信号(33、33B);
基于所述第一激励信号导出候选激励信号(c′(n))的集合(10′);以及
使用所述候选激励信号(c′(n))的集合(10′)对所述第二音频信号(33、33B)执行码激励线性预测编码。
2.如权利要求1所述的方法,其特征在于,所述第二音频信号(33、33B)与所述第一音频信号(33、33A)相关。
3.如权利要求1或2所述的方法,其特征在于,所述导出所述候选激励信号(c′(n))的集合(10′)的步骤包括基于所述第一激励信号和/或所述第二音频信号从规则的预定集合中选择规则,由此根据所述选择的规则导出所述候选激励信号(c′(n))的集合(10′)。
4.如权利要求1至3中任一权利要求所述的方法,其特征在于,
所述第一激励信号具有N个可能脉冲位置的集合中的n个脉冲位置(PM);
所述候选激励信号(c′(n))具有仅在所述N个可能脉冲位置的子集中的脉冲位置(P* s);以及
所述子集的脉冲位置(P* s)是基于所述第一激励信号的n个脉冲位置(PM)选择的。
5.如权利要求4所述的方法,其特征在于,所述脉冲位置的子集的脉冲位置(P* s)位于位置Pj,其中索引j在区间{i+L,i+K}内,其中i是所述n个脉冲位置的索引,K和L是整数且K>L。
6.如权利要求5所述的方法,其特征在于,K=1和L=-1。
7.如权利要求1至6中任一权利要求所述的方法,其特征在于,在所述候选激励信号的集合(10′)内利用全局搜索来执行所述第二音频信号(33、33B)的所述码激励线性预测。
8.如权利要求1至7中任一权利要求所述的方法,还包括如下步骤:
参考所述候选激励信号的集合(10′)将所述第二音频信号(33、33B)的所述码激励线性预测的第二激励信号编码;以及
提供所述编码的第二激励信号以及所述第一激励信号的所述表示(k、km、ka)。
9.如权利要求3和8所述的方法,包括再一个步骤:提供表示所述选择的规则的标识的数据以及所述第一激励信号的所述表示(k、km、ka)。
10.如权利要求1至7中任一权利要求所述的方法,包括再一个步骤:
参考具有N个可能脉冲位置的候选激励信号的集合(10)将所述第二音频信号(33、33B)的所述码激励线性预测的第二激励信号编码。
11.如权利要求10所述的方法,其特征在于,所述第二音频信号(33)与所述第一音频信号(33)相同。
12.如权利要求1至11中任一权利要求所述的方法,其特征在于,所述第二激励信号具有m个脉冲位置,其中m<n。
13.一种用于对音频信号(33A、33B)解码的方法,包括如下步骤:
提供第一音频信号(33A)的码激励线性预测的第一激励信号的表示(k、km、ka);
提供第二音频信号(33B)的码激励线性预测的第二激励信号的表示(k’s);
所述第二激励信号是候选激励信号的集合(10′)的其中之一;
所述候选激励信号的集合(10′)基于所述第一激励信号;
根据所述第二激励信号的所述表示(k′s)并基于与所述候选激励信号的集合(10′)相关的信息导出所述第二激励信号(cks′′(n));以及
通过对所述第二激励信号(cks′′(n))预测滤波来重构所述第二音频信号(s(n))。
14.如权利要求13所述的方法,其特征在于,使所述第二音频信号(33B)与所述第一音频信号(33A)相关。
15.如权利要求13或14所述的方法,其特征在于,与所述候选激励信号的集合(10′)相关的所述信息包括规则的预定集合中的规则的标识,所述规则确定所述候选激励信号的集合(10′)的导出。
16.如权利要求13至15中任一权利要求所述的方法,其特征在于,
所述第一激励信号具有N个可能脉冲位置的集合中的n个脉冲位置(PM);
所述候选激励信号具有仅在所述N个可能脉冲位置的子集中的脉冲位置(P* s);以及
所述子集的脉冲位置(P* s)是基于所述第一激励信号的n个脉冲位置(PM)来选择的。
17.如权利要求16所述的方法,其特征在于,所述脉冲位置的子集的脉冲位置(P* s)位于位置Pj,其中索引j在区间{i+L,i+K)内,其中i是所述n个脉冲位置的索引,K和L是整数且K>L。
18.如权利要求17所述的方法,其特征在于,K=1且L=-1。
19.一种用于音频信号的编码器(40B),包括:
用于提供第一音频信号(33、33A)的码激励线性预测的第一激励信号的表示(k、km、ka)的部件(45);
用于提供第二音频信号(33、33B)的部件;
用于导出候选激励信号的集合(10′)的部件(47),所述部件(47)经连接以接收所述第一激励信号的所述表示(k、km、ka),所述候选激励信号的集合(10′)基于所述第一激励信号;以及
用于执行码激励线性预测的部件(25′),所述部件(25′)经连接以接收所述第二音频信号(33、33B)和所述候选激励信号的集合(10′)的表示,所述用于执行码激励线性预测的部件(25′)设置为使用所述候选激励信号的集合(10′)来对所述第二音频信号(33、33B)执行码激励线性预测。
20.如权利要求19所述的编码器,其特征在于,使所述第二音频信号(33、33B)与所述第一音频信号(33、33A)相关。
21.如权利要求19或20所述的编码器,其特征在于,所述用于导出候选激励信号的集合(10′)的部件(47)设置为基于所述第一激励信号和/或所述第二音频信号从规则的预定集合中选择规则,并根据所述选择的规则导出所述候选激励信号(c′(n))的集合(10′)。
22.如权利要求19至21中任一权利要求所述的编码器,其特征在于,
所述第一激励信号具有N个可能脉冲位置的集合中的n个脉冲位置(PM);
所述候选激励信号具有仅在所述N个可能脉冲位置的子集中的脉冲位置(P* s);以及
所述子集的脉冲位置(P* s)是基于所述第一激励信号的n个脉冲位置(PM)来选择的。
23.如权利要求22所述的编码器,其特征在于,所述脉冲位置的子集的脉冲位置(P* s)位于位置Pj,其中索引j在区间{i+L,i+K}内,其中i是所述n个脉冲位置的索引,K和L是整数且K>L。
24.如权利要求23所述的编码器,其特征在于,K=1且L=-1。
25.如权利要求19至24中任一权利要求所述的编码器,其特征在于,所述对所述第二音频信号(33、33b)执行码激励线性预测的部件(25′)设置为在所述候选激励信号的集合(10′)内执行全局搜索。
26.如权利要求19至25中任一权利要求所述的编码器,还包括:
用于参考所述候选激励信号的集合(10′)对所述第二音频信号(33B)的所述码激励线性预测的第二激励信号编码的部件(38B);以及
用于提供所述编码的第二激励信号以及所述第一激励信号的所述表示(k、km、ka)的部件。
27.如权利要求26和21所述的编码器,还包括:
用于提供表示所述选择的规则的标识的数据以及所述第一激励信号的所述表示((k、km、ka)的部件。
28.如权利要求19至25中任一权利要求所述的编码器,还包括:
用于参考具有N个可能脉冲位置的候选激励信号的集合(10)对所述第二音频信号(33、33B)的所述码激励线性预测的第二激励信号编码的部件(38B)。
29.如权利要求28所述的编码器,其特征在于,所述第二音频信号(33)与所述第一音频信号(33)相同,由此所述编码器是重新编码器。
30.如权利要求19至29中任一权利要求所述的编码器,其特征在于,所述第二激励信号具有m个脉冲位置,其中m<n。
31.一种用于音频信号的解码器(50B),包括:
用于提供第一音频信号(33A)的码激励线性预测的第一激励信号的表示(km)的部件(55);
用于提供第二音频信号(33B)的码激励线性预测的第二激励信号的表示(k’s)的部件(53B);
所述第二激励信号是候选激励信号的集合(10′)的其中之一;
所述候选激励信号的集合(10′)基于所述第一激励信号;
用于导出所述第二激励信号的部件(57),所述部件(57)经连接以接收与第一激励信号的所述表示(km)和所述第二激励信号的所述表示(k′s)关联的信息,所述用于导出的部件(57)设置为根据第二激励信号的所述表示(k′s)并基于与所述候选激励信号的集合(10′)相关的信息导出所述第二激励信号(cks′′(n));以及
用于对所述第二激励信号(cks′′(n))预测滤波来重构所述第二音频信号(s(n))的部件(25″)。
32.如权利要求31所述的解码器,其特征在于,使所述第二音频信号(33B)与所述第一音频信号(33A)相关。
33.如权利要求31或32所述的解码器,其特征在于,与所述候选激励信号的集合(10′)相关的所述信息包括规则的预定集合中的规则的标识,所述规则确定所述候选激励信号的集合(10′)的导出。
34.如权利要求31至33中任一权利要求所述的解码器,其特征在于,
所述第一激励信号具有N个可能脉冲位置的集合中的n个脉冲位置(PM);
所述候选激励信号具有仅在所述N个可能的脉冲位置的子集中的脉冲位置(P* s);以及
所述子集的脉冲位置(P* s)是基于所述第一激励信号的n个脉冲位置(PM)来选择的。
35.如权利要求34所述的解码器,其特征在于,所述脉冲位置的子集的脉冲位置(PM)位于位置Pj,其中索引j在区间{i+L,i+K)内,其中i是所述n个脉冲位置的索引,K和L是整数且K>L。
36.如权利要求35所述的解码器,其特征在于,K=1且L=-1。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/SE2005/000349 WO2006096099A1 (en) | 2005-03-09 | 2005-03-09 | Low-complexity code excited linear prediction encoding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101138022A true CN101138022A (zh) | 2008-03-05 |
CN101138022B CN101138022B (zh) | 2011-08-10 |
Family
ID=36953623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800489816A Expired - Fee Related CN101138022B (zh) | 2005-03-09 | 2005-03-09 | 低复杂度码激励线性预测编码及解码的方法及装置 |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP1859441B1 (zh) |
JP (1) | JP5174651B2 (zh) |
KR (1) | KR101235425B1 (zh) |
CN (1) | CN101138022B (zh) |
AT (1) | ATE513290T1 (zh) |
BR (1) | BRPI0520115B1 (zh) |
TW (1) | TW200639801A (zh) |
WO (1) | WO2006096099A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2827327B1 (en) | 2007-04-29 | 2020-07-29 | Huawei Technologies Co., Ltd. | Method for Excitation Pulse Coding |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3139602B2 (ja) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | 音響信号符号化方法及び復号化方法 |
JPH1097295A (ja) * | 1996-09-24 | 1998-04-14 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号符号化方法及び復号化方法 |
JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JP3329216B2 (ja) * | 1997-01-27 | 2002-09-30 | 日本電気株式会社 | 音声符号化装置及び音声復号装置 |
US7024355B2 (en) * | 1997-01-27 | 2006-04-04 | Nec Corporation | Speech coder/decoder |
JP3063668B2 (ja) * | 1997-04-04 | 2000-07-12 | 日本電気株式会社 | 音声符号化装置及び復号装置 |
JP3134817B2 (ja) * | 1997-07-11 | 2001-02-13 | 日本電気株式会社 | 音声符号化復号装置 |
US6161086A (en) * | 1997-07-29 | 2000-12-12 | Texas Instruments Incorporated | Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
JP3343082B2 (ja) * | 1998-10-27 | 2002-11-11 | 松下電器産業株式会社 | Celp型音声符号化装置 |
US6539349B1 (en) * | 2000-02-15 | 2003-03-25 | Lucent Technologies Inc. | Constraining pulse positions in CELP vocoding |
JP2004302259A (ja) * | 2003-03-31 | 2004-10-28 | Matsushita Electric Ind Co Ltd | 音響信号の階層符号化方法および階層復号化方法 |
-
2005
- 2005-03-09 WO PCT/SE2005/000349 patent/WO2006096099A1/en active Application Filing
- 2005-03-09 JP JP2008500663A patent/JP5174651B2/ja not_active Expired - Fee Related
- 2005-03-09 AT AT05722196T patent/ATE513290T1/de not_active IP Right Cessation
- 2005-03-09 CN CN2005800489816A patent/CN101138022B/zh not_active Expired - Fee Related
- 2005-03-09 KR KR1020077023047A patent/KR101235425B1/ko active IP Right Grant
- 2005-03-09 BR BRPI0520115A patent/BRPI0520115B1/pt not_active IP Right Cessation
- 2005-03-09 EP EP05722196A patent/EP1859441B1/en not_active Not-in-force
- 2005-12-15 TW TW094144472A patent/TW200639801A/zh unknown
Also Published As
Publication number | Publication date |
---|---|
ATE513290T1 (de) | 2011-07-15 |
JP5174651B2 (ja) | 2013-04-03 |
EP1859441A1 (en) | 2007-11-28 |
JP2008533522A (ja) | 2008-08-21 |
WO2006096099A1 (en) | 2006-09-14 |
BRPI0520115B1 (pt) | 2018-07-17 |
KR101235425B1 (ko) | 2013-02-20 |
EP1859441B1 (en) | 2011-06-15 |
TW200639801A (en) | 2006-11-16 |
BRPI0520115A2 (pt) | 2009-09-15 |
CN101138022B (zh) | 2011-08-10 |
KR20070116869A (ko) | 2007-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8000967B2 (en) | Low-complexity code excited linear prediction encoding | |
CN101218628B (zh) | 编码和解码音频信号的装置和方法 | |
US7778827B2 (en) | Method and device for gain quantization in variable bit rate wideband speech coding | |
CN101925950B (zh) | 音频编码器和解码器 | |
CN102265337B (zh) | 用于在多信道音频代码化系统内生成增强层的方法和装置 | |
CN102272831B (zh) | 基于峰值检测的选择性缩放掩码计算 | |
CN101996636B (zh) | 带多级码本和冗余编码的子带话音编解码器 | |
CN102272829B (zh) | 用于在多声道音频编码系统内生成增强层的方法和装置 | |
CN101518083B (zh) | 通过使用带宽扩展和立体声编码对音频信号编码和/或解码的方法和系统 | |
EP2209114B1 (en) | Speech coding/decoding apparatus/method | |
CN102272832B (zh) | 基于峰值检测的选择性缩放掩码计算 | |
CN102460570A (zh) | 用于对音频信号进行编码和解码的方法及设备 | |
CN102834862A (zh) | 用于包括通用音频和语音帧的音频信号的编码器 | |
EP1498873A1 (en) | Improved excitation for higher band coding in a codec utilizing band split coding methods | |
CN103229234A (zh) | 音频编码装置、方法和程序以及音频解码装置、方法和程序 | |
CN101111887A (zh) | 可扩展编码装置和可扩展编码方法 | |
JP3063668B2 (ja) | 音声符号化装置及び復号装置 | |
EP1847988B1 (en) | Voice coding | |
CN101138022B (zh) | 低复杂度码激励线性预测编码及解码的方法及装置 | |
CN100489966C (zh) | 合成分析语音编码器中用于进行语音编码的方法和装置 | |
Annadana et al. | New Results in Low Bit Rate Speech Coding and Bandwidth Extension | |
JP3954716B2 (ja) | 音源信号符号化装置、音源信号復号化装置及びそれらの方法、並びに記録媒体 | |
JP2000029499A (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP3715417B2 (ja) | 音声圧縮符号化装置,音声圧縮符号化方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Kamaruzzaman et al. | Embedded speech codec based on speex |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110810 Termination date: 20190309 |