CN107316647B - 频域包络的矢量量化方法和装置 - Google Patents
频域包络的矢量量化方法和装置 Download PDFInfo
- Publication number
- CN107316647B CN107316647B CN201710370044.7A CN201710370044A CN107316647B CN 107316647 B CN107316647 B CN 107316647B CN 201710370044 A CN201710370044 A CN 201710370044A CN 107316647 B CN107316647 B CN 107316647B
- Authority
- CN
- China
- Prior art keywords
- codebook
- vector
- quantized
- determining
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013598 vector Substances 0.000 title claims abstract description 443
- 238000013139 quantization Methods 0.000 title claims abstract description 90
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000000638 solvent extraction Methods 0.000 claims 5
- 230000000694 effects Effects 0.000 abstract description 8
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明实施例提出了频域包络的矢量量化方法和装置。其中,所述方法包括:将一帧中的N个频域包络划分为N1个矢量,其中N1个矢量中的每一个矢量包括M个频域包络;采用第一码本对N1个矢量中的第一矢量进行量化,以获得第一矢量量化的码字,其中第一码本被划分为2B1个部分;根据第一矢量量化的码字,确定量化后的第一矢量与第一码本的2B1个部分中的第i个部分相关联;根据第i个部分的码本确定第二码本;基于第二码本,对N1个矢量中第二矢量进行量化。本发明实施例通过将频域包络划分为多个具有更少维数的矢量,能够使用较少比特数的码本对频域包络矢量进行矢量量化,不但能够降低矢量量化的复杂度,并且能够保证矢量量化的效果。
Description
技术领域
本发明涉及编解码领域,特别地,涉及频域包络的矢量量化方法和装置。
背景技术
通常,将输入信号的一帧中的所有频点或者部分频点的值求平均能量再开根号就获得了这些频点的频域包络。
目前,编解码器中对频域包络进行量化的方法通常是指简单的标量量化或者矢量量化。但是,当一些特殊的情况,例如需要在一帧中求出很多个频域包络同时对于用于量化频域包络的比特数也存在一定限制时,如果每个频域包络都采用标量量化则会耗费大量比特。
对于现有的矢量量化方法而言,包括以下步骤:(1)将需要量化的频点根据矢量的维数划分成若干个矢量;(2)预先使用大量的矢量样本根据每个矢量量化的比特数B训练出一个2^B长度的码本,即这个码本有2^B个矢量,这些矢量是根据大量矢量样本事先训练好的;(3)用需要量化的矢量A与码本中的每个矢量进行比较,找出与矢量A最接近的矢量B;(4)这个矢量B在码本中的位置索引即为矢量A的量化值。因此,如果全部频域包络组合在一起做矢量量化则需要很大的码本,导致复杂度的提升。
如何设计一种简单有效的频域包络矢量量化方法同时又能保证量化质量是亟需解决的问题。
发明内容
本发明提出了频域包络的矢量量化方法和装置,旨在解决由于码本的比特数不够多而频域包络的数量较多所引起的量化精度不够或者复杂度过高的问题。
一方面,提出了一种频域包络的矢量量化方法,包括:将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;采用B比特的第一码本对所述N1个矢量中的第一矢量进行量化,以获得所述第一矢量量化的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联,其中i为正整数,i大于或等于1且小于或等于2B1;根据所述第i个部分的码本确定所述第二码本;基于所述第二码本,对所述N1个矢量中第二矢量进行量化。
结合第一方面,在第一方面的第一实施方式中,所述根据所述第i个部分的码本确定第二码本包括:采用所述第一码本中的第i个部分作为第二码本,其中所述第一码本中的第i个部分的比特数为B-B1。
结合第一方面,在第一方面的第二实施方式中,所述根据所述第i个部分的码本确定第二码本包括:采用预先训练的码本作为第二码本,其中所述预先训练的码本的比特数与所述第一码本中的第i个部分的比特数相同,均为B-B1。
结合第一方面或其第一、第二实施方式,在第一方面的第三实施方式中,当B1为1时,所述根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联包括:当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联;或者当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第一矢量与所述第一码本的所述后半部分相关联。
结合第一方面或其第一、第二实施方式,在第一方面的第四实施方式中,当M为2且B1为1时,所述根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联包括:确定与所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联;或者当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
结合第一方面或其第一至第四实施方式,在第一方面的第五实施方式中,所述将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络:当所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N,将所述M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络。
第二方面,提出了一种频域包络的矢量量化装置,包括:矢量划分单元,用于将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;第一量化单元,用于采用B比特的第一码本对所述矢量划分单元所划分的所述N1个矢量中的第一矢量进行量化,以获得所述第一矢量量化的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;第一确定单元,用于根据所述第一量化单元量化的所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联,其中i为正整数,i大于或等于1且小于或等于2B1;第二确定单元,用于根据所述第一确定单元确定的所述第i个部分的码本确定所述第二码本;第二量化单元,用于基于所述第二确定单元确定的所述第二码本,对所述N1个矢量中第二矢量进行量化。
结合第二方面,在第二方面的第一实施方式中,所述第二确定单元具体用于:采用所述第一码本中的第i个部分作为第二码本,其中所述第一码本中的第i个部分的比特数为B-B1。
结合第二方面,在第二方面的第二实施方式中,所述第二确定单元具体用于:采用预先训练的码本作为第二码本,其中所述预先训练的码本的比特数与所述第一码本中的第i个部分的比特数相同,均为B-B1。
结合第二方面或其第一、第二实施方式,在第二方面的第三实施方式中,当B1为1时,所述第一确定单元具体用于:当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联;或者当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第二矢量与所述第一码本的所述后半部分相关联。
结合第二方面或其第一、第二实施方式,在第二方面的第四实施方式中,当M为2且B1为1时,所述第一确定单元具体用于:确定所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联;或者当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
结合第二方面或其第一至第四实施方式,在第二方面的第五实施方式中,所述矢量划分单元具体用于:当所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N,将所述M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络。
本发明实施例通过将频域包络划分为多个具有更少维数的矢量,能够使用较少比特数的码本对频域包络矢量进行矢量量化,不但能够降低矢量量化的复杂度,并且能够保证矢量量化的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的频域包络的矢量量化方法的流程图。
图2是根据本发明实施例的频域包络的矢量量化装置的结构示意图。
图3是实现本发明实施例的频域包络的矢量量化方法的编解码器。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
本发明实施例针对在频域包络进行矢量量化时总比特数受限的情况,根据需要编码的频域包络的特点,利用子帧间各个频域包络相关性等关系,提出了一种简单而又节省比特同时也能保证量化效果的频域包络的矢量量化方法。本发明实施例的矢量量化方法均针对一帧包含多个频域包络的情况。
以下将参照图1描述根据本发明实施例的频域包络的矢量量化方法。该矢量量化方法包括以下步骤。
S101,将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数且大于或等于2,N大于N1。
例如,首先将一帧中的N个频域包络分为N1个M维矢量,于是N1×M=N。然后,对N1个矢量进行矢量量化。这样,由于维数减少,要达到合理的量化精度,单个矢量所需的比特数也不用太多,矢量量化的复杂度也同时减少。
当一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N,为了减少维数,还可以将所述M个子帧中的每个子帧中对应的包络组合成一个矢量。这里,对应的包络可以是对应位置的包络。例如,在该M个子帧中,每个子帧的第一个包络组合为第一矢量,每个子帧的第二个包络组合为第二矢量,依此类推。最后,得到N1个矢量,其中每个矢量包括M个频域包络。
一般地,对于不同的频域包络特性,可以采用不同的矢量组合方式:其一,当同一子帧有多于两个频域包络时,同时子帧数比较少,比如只有两个子帧时,则可以将不同子帧的同一个频域包络进行组合,这样得到多个2维矢量;其二,当存在多于两个子帧时,也可以将每个子帧的第一个频域包络组合成第一个矢量,每个子帧的第J个频域包络组合成第J个矢量。
S102,采用第一码本对所述N1个矢量中的第一矢量进行量化,以获得所述第一矢量量化的码字,其中所述第一码本的B比特被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1。
例如,对第一矢量进行矢量量化需要的比特数为B,那么需要训练得到一个具有2^B码字的第一码本。由于这N1个频域包络矢量属于同一帧,因此可以根据这些矢量的前后关系对N1个矢量的码本的顺序进行调整,从而根据前面的矢量的量化结果,估计出后续矢量的范围,减少对后续矢量进行矢量量化所需的比特数。
容易理解,若将第一码本分为2个部分,之后采用第一码本的其中一个部分对后续矢量进行量化,则量化后续矢量的码本只有B-1个比特;若将第一码本分为4个部分,之后采用第一码本的其中一个部分对后续矢量进行量化,则量化后续矢量的码本只有B-3个比特;依次类推。也就是说,可以使用较小的码本对频域包络矢量进行矢量量化,而且能够降低矢量量化的复杂度以及保证矢量量化的效果。
S103,根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联,其中i为正整数,i大于或等于1且小于或等于2B1。
例如,当B1为1时,第一码本被划分为2个部分。因此,将量化后的第一矢量与第一码本中的每个矢量进行比较,找出第一码本中的与第一矢量最接近的矢量,该矢量在第一码本中的位置索引即为第一矢量的量化值。
当确定该第一矢量的量化值位于第一码本的前半部分,则确定所述第一矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,即确定量化后的第一矢量与所述第一码本的前半部分相关联,可以采用第一码本的前半部分作为第二码本;否则,确定所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,即确定量化后的第一矢量与所述第一码本的后半部分相关联,可以采用第一码本的后半部分作为第二码本。
或者,例如,当M为2且B1为1时,第一码本被划分为2个部分,且每个矢量是2维的。因此,将量化后的第一矢量与第一码本中的每个矢量进行比较,找出第一码本中的与第一矢量最接近的矢量,该矢量在第一码本中的位置索引即为第一矢量的量化值。
然后,确定所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联;或者当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。这里,预定范围是根据经验预先设定的一个阈值范围。
假设二维矢量的第一码本为{(a1,b1),(a2,b2),(a3,b3),(a4,b4)},其中(a1,b1)的码字(也即(a1,b1)在第一码本中的位置索引)为1,(a2,b2)的码字为2,(a3,b3)的码字为3,(a4,b4)的码字为4。码字就是码本中的每个矢量在码本中对应的位置索引。若确定第一矢量量化后的码字为3,也就是说,所述码字对应的量化后的第一矢量为(a3,b3)。接着,将第一个值a3与第二个值b3的比值与预定范围[a,b]进行比较,若在该范围内,则确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联,可以采用第一码本的前半部分作为第二码本,否则确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联,可以采用第一码本的后半部分作为第二码本。
S104,根据所述第i个部分的码本确定第二码本。
例如,如上所述,可以采用所述第一码本中的第i个部分作为第二码本,其中所述第一码本中的第i个部分的比特数为B-B1。或者,例如,可以采用预先训练的码本作为第二码本,其中所述预先训练的码本的比特数与所述第一码本中的第i个部分的比特数相同,均为B-B1。
也就是说,第二矢量的码本都可以直接根据第一个矢量的量化码本取其一部分来确定。实际操作中,根据不同编解码器的要求,也可以重新训练一个或者多个只有第一码本的部分码字的码本(具有B-B1比特)作为第二个及后续矢量的码本,从而达到减少量化比特数和优化量化质量的效果。
S105,基于所述第二码本,对所述N1个矢量中第二矢量进行量化。
例如,可以基于第一个矢量量化的结果确定的第二码本对第二个以及后续的矢量进行量化。也就是,采用B比特的第一码本对所述N1个矢量中的第一个矢量进行量化,以获得所述第一个矢量量化的码字;然后,确定所述第一个矢量量化的码字属于所述第一码本的所述2B1个部分中的第i个部分;再根据所述第i个部分的码本确定第二码本;最后,采用所述第二码本,对所述N1个矢量中除第一个矢量之外的其他矢量进行量化。
或者,例如,也可以基于第一个矢量量化的结果确定的第二码本对第二个矢量进行量化,然后再基于第二个矢量量化的结果确定的第三码本对第三个矢量进行量化,以此类推。
由此可见,本发明实施例通过将频域包络划分为多个具有更少维数的矢量,能够使用较小的码本对频域包络矢量进行矢量量化,不但能够降低矢量量化的复杂度,并且能够保证矢量量化的效果。
在一种实施方式中,当B1为1时,在步骤S103的确定所述第一个矢量量化的码字属于所述第一码本的所述2B1个部分中的第i个部分,并在步骤S104中根据所述第i个部分的码本确定第二码本具体包括:
确定所述第一个矢量量化的码字是否属于所述第一码本的所述2个部分中的第一部分,例如前半部分;
当确定所述第一个矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,则确定量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联,进一步确定第二码本为所述第一码本的前半部分;或者
当确定所述第一个矢量量化的码字不属于所述第一码本的所述2个部分中的前半部分,则确定量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联,进一步确定第二码本为所述第一码本的后半部分。
此时,第二码本只需B-1个比特。
在另一实施方式中,当M为2且B1为1时,在步骤103的根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联,并在步骤S104中根据所述第i个部分的码本确定第二码本具体包括:
确定所述码字对应的量化后的第一个矢量(二维矢量)的前一个值与后一个值的比值是否在预定范围;
当确定所述比值在预定范围,则确定量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联,进一步确定第二码本为所述第一码本的前半部分;或者
当确定所述比值不在预定范围,则确定量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联,进一步确定第二码本为所述第一码本的后半部分。
此时,第二码本只需B-1个比特。
在上述两个实施方式中,示例性地描述了具有B个比特的第一码本被分为2个部分的情况,这也是比较容易实现的实施方式。应理解,本发明实施例中的第一码本并不限于仅被分为2个部分,还可以是4个部分、8个部分,甚至更多的2的整数次方个部分。一般而言,若第一码本被分为越多的部分,确定出的第二码本的准确性则越低,从而可能影响量化精度。因此,通常可以结合实际能使用的比特数来考虑B1的取值,即将第一码本分成几个部分可以保证量化质量。
以下给出了一些具体实施例,详细描述根据本发明实施例的频域包络的矢量量化方法。
第一具体实施例。若一帧中包括N个频域包络,该帧划分为N1个子帧,每个子帧里有相同的频域包络数M,那么每个子帧的频域包络(共M个频域包络)打包在一起作为一个矢量,则有N1个矢量:
首先,利用事先训练并排序好的2^B个码字的第一码本A,对第一个矢量用B比特进行量化,量化结果为ind(1);
然后,判断量化结果ind(1)在第一码本A中的位置是否在前半部分:
若是,则采用码本A的前半部分的码字作为新码本(即第二码本,包括B-1个比特),对第二个及后续矢量用B-1比特进行量化;
否则,若不是,则采用码本A的后半部分的码字作为新码本(即第二码本,包括B-1个比特),对第二个及后续矢量用B-1比特进行量化。
由此可见,该第一具体实施例首先对总码本(例如,第一码本)进行排序,然后结合第一个矢量的量化结果,估计后续矢量的量化结果,然后缩小码本范围对后续矢量进行量化。
第二具体实施例。如果矢量是2维的时候,还可以采用本具体实施例的方法:
首先,利用事先训练并排序好的2^B个码字的第一码本A,对第一个矢量用B比特进行量化,量化结果为ind(1);
然后,判断第一个矢量量化后的两个值的比值,即将量化后的第一个矢量的前一个值除以后一个值,判断是否在事先给定的范围[a,b]内:
若是,则采用第一码本A的前半部分的码字作为新码本(即第二码本,包括B-1个比特),对第二个及后续矢量用B-1比特进行量化;
否则,若不是,则采用第一码本A的后半部分的码字作为新码本(即第二码本,包括B-1个比特),对第二个及后续矢量用B-1比特进行量化。
由此可见,本具体实施例是根据二维向量的特点,估计后续矢量的量化结果,然后缩小码本范围对后续矢量进行量化。
以下将结合图2描述根据本发明实施例的频域包络的矢量量化装置。
在图2中,频域包络的矢量量化装置20包括矢量划分单元21、第一量化单元22、第一确定单元23、第二确定单元24和第二量化单元25。其中:
矢量划分单元21用于将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;
第一量化单元22用于采用B比特的第一码本对所述矢量划分单元21所划分的所述N1个矢量中的第一矢量进行量化,以获得所述第一矢量量化的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;
第一确定单元23用于根据所述第一量化单元22量化的所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联,其中i为正整数,i大于或等于1且小于或等于2B1;
第二确定单元24用于根据所述第一确定单元23确定的所述第i个部分的码本确定所述第二码本;
第二量化单元25用于基于所述第二确定单元24确定的所述第二码本,对所述N1个矢量中第二矢量进行量化。
具体地,第二确定单元24可以用于采用所述第一码本中的第i个部分作为第二码本,其中所述第一码本中的第i个部分的比特数为B-B1。或者,第二确定单元24可以用于采用预先训练的码本作为第二码本,其中所述预先训练的码本的比特数与所述第一码本中的第i个部分的比特数相同,均为B-B1。。
具体地,当B1为1时,第一确定单元23可以用于当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,则确定量化后的第一矢量与所述第一码本的所述前半部分相关联;或者当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,则确定量化后的第一矢量与所述第一码本的所述后半部分相关联。
或者,当M为2且B1为1时,第一确定单元23可以用于确定所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联;或者当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
具体地,矢量划分单元21还可以用于:当所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N,将所述M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络。
本发明实施例通过将频域包络划分为多个具有更少维数的矢量,能够使用较少比特数的码本对频域包络矢量进行矢量量化,不但能够降低矢量量化的复杂度,并且能够保证矢量量化的效果。
图3示出了实现本发明实施例的频域包络的矢量量化方法的编解码器。该编解码器30包括处理器31和存储器32。其中,处理器31用于将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;采用B比特的第一码本对所述N1个矢量中的第一矢量进行量化,以获得所述第一矢量量化的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联,其中i为正整数,i大于或等于1且小于或等于2B1;根据所述第i个部分的码本确定所述第二码本;基于所述第二码本,对所述N1个矢量中第二矢量进行量化。存储器32用于存储处理器31执行上述方法的指令。
具体而言,当所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N,处理器31可以将所述M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络。
处理器31可以采用所述第一码本中的第i个部分作为第二码本,其中所述第一码本中的第i个部分的比特数为B-B1;或者,采用预先训练的码本作为第二码本,其中所述预先训练的码本的比特数与所述第一码本中的第i个部分的比特数相同,均为B-B1。
当B1为1时,处理器31可以根据所述第一矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联;或者根据所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第一矢量与所述第一码本的所述后半部分相关联。或者,当M为2且B1为1时,处理器31可以根据所述与所述码字对应的量化后的第一矢量第一个值与第二个值的比值是否在预定范围,确定量化后的第一矢量与所述第一码本的所述前半部分或后半部分相关联;当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联;或者当确定所述比值不在预定范围,确定所述第二码本与所述第一码本的所述2个部分中的后半部分相关联。
由此可见,本发明实施例通过将频域包络划分为多个具有更少维数的矢量,能够使用较少比特数的码本对频域包络矢量进行矢量量化,不但能够降低矢量量化的复杂度,并且能够保证矢量量化的效果。
应理解,本发明的每个权利要求所叙述的方案也应看做是一个实施例,并且是权利要求中的特征是可以结合的,如本发明中的判断步骤后的执行的不同分支的步骤可以作为不同的实施例。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (43)
1.一种频域包络的矢量量化装置,其特征在于,所述装置包括:
矢量划分单元,用于将一帧中的N个频域包络划分为N1个矢量,其中,所述N1个矢量中的每一个矢量包括2个频域包络,N1、N为正整数,N大于N1;
第一量化单元,用于采用B比特的第一码本对所述N1个矢量中的第一矢量进行量化,以获得量化后的第一矢量的码字,其中所述第一码本被划分为2个部分,B为正整数且大于或等于2;
第一确定单元,用于确定所述量化后的第一矢量的码字位于所述第一码本的前半部分或者所述量化后的第一矢量的码字位于所述第一码本的后半部分;
第二确定单元,用于采用所述第一码本中的前半部分或所述第一码本中的后半部分作为第二码本,所述第二码本的比特数为B-1;
第二量化单元,用于基于所述第二码本,对所述N1个矢量中的第二矢量进行量化。
2.根据权利要求1所述的装置,其特征在于,所述一帧包括N1个子帧,每一个子帧的频域包络对应一个矢量。
3.根据权利要求1所述的装置,其特征在于,所述矢量划分单元用于:将2个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述一帧包括2个子帧,且所述2个子帧中每个子帧包括N1个包络。
4.根据权利要求1-3任意之一所述的装置,其特征在于,所述第一码本包括事先训练并排序的2B个码字,所述码字为码本中的每个矢量在码本中对应的位置索引。
5.一种频域包络的矢量量化方法,其特征在于,所述方法包括:
将一帧中的N个频域包络划分为N1个矢量,其中,所述N1个矢量中的每一个矢量包括2个频域包络,N1、N为正整数,N大于N1;
采用B比特的第一码本对所述N1个矢量中的第一矢量进行量化,以获得量化后的第一矢量的码字,其中所述第一码本被划分为2个部分,B为正整数且大于或等于2;
当所述量化后的第一矢量的码字位于所述第一码本的前半部分时,采用所述第一码本中的前半部分作为第二码本,所述第二码本的比特数为B-1;
当所述量化后的第一矢量的码字位于所述第一码本的后半部分时,采用所述第一码本中的后半部分作为第二码本,所述第二码本的比特数为B-1;
基于所述第二码本,对所述N1个矢量中的第二矢量进行量化。
6.根据权利要求5所述的方法,其特征在于,所述一帧包括N1个子帧,每一个子帧的频域包络对应一个矢量。
7.根据权利要求5所述的方法,其特征在于,所述矢量划分单元用于:将2个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述一帧包括2个子帧,且所述2个子帧中每个子帧包括N1个包络。
8.根据权利要求5-7任意之一所述的方法,其特征在于,所述第一码本包括事先训练并排序的2<B>个码字,所述码字为码本中的每个矢量在码本中对应的位置索引。
9.一种频域包络的矢量量化装置,其特征在于,所述装置包括:
矢量划分单元,用于将一帧中的N个频域包络划分为N1个矢量,其中,所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;
第一量化单元,用于采用B比特的第一码本对所述N1个矢量中的第一矢量进行量化,以获得量化后的第一矢量的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;
第一确定单元,用于确定所述量化后的第一矢量的码字位于所述第一码本的第i个部分,其中i为正整数,i大于或等于1且i小于或等于2B1;
第二确定单元,用于采用所述第一码本中的第i个部分作为第二码本,所述第二码本的比特数为B-B1;
第二量化单元,用于基于所述第二码本,对所述N1个矢量中的第二矢量进行量化。
10.根据权利要求9所述的装置,其特征在于,所述矢量划分单元用于:将所述M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N。
11.根据权利要求9所述的装置,其特征在于,所述一帧包括N1个子帧,每一个子帧的频域包络对应一个矢量。
12.根据权利要求11所述的装置,其特征在于,所述M=2。
13.根据权利要求9-12任意之一所述的装置,其特征在于,所述第一码本包括事先训练并排序的2<B>个码字,所述码字为码本中的每个矢量在码本中对应的位置索引。
14.一种频域包络的矢量量化方法,其特征在于,包括:
将一帧中的N个频域包络划分为N1个矢量,其中,所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;
采用B比特的第一码本对所述N1个矢量中的第一矢量进行量化,以获得量化后的第一矢量的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;
确定所述量化后的第一矢量的码字位于所述第一码本的第i个部分,其中i为正整数,i大于或等于1且i小于或等于2B1;
采用所述第一码本中的第i个部分作为第二码本,所述第二码本的比特数为B-B1;
基于所述第二码本,对所述N1个矢量中的第二矢量进行量化。
15.根据权利要求14所述的方法,其特征在于,所述将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,包括:
将M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N。
16.根据权利要求14所述的方法,其特征在于,所述将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,包括:
所述一帧包括N1个子帧,每一个子帧的频域包络对应一个矢量,所述N1个矢量中的每一个矢量包括M个频域包络。
17.根据权利要求16所述的方法,其特征在于,所述M=2。
18.根据权利要求14-17任意之一所述的方法,其特征在于,所述第一码本包括事先训练并排序的2B个码字,所述码字为码本中的每个矢量在码本中对应的位置索引。
19.一种频域包络的矢量量化装置,其特征在于,所述装置包括:
矢量划分单元,用于将一帧中的N个频域包络划分为N1个矢量,其中,所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;
第一量化单元,用于采用B比特的第一码本对所述N1个矢量中的第一矢量进行量化,以获得量化后的第一矢量的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;
第一确定单元,用于确定所述量化后的第一矢量的码字位于所述第一码本的第i个部分,其中i为正整数,i大于或等于1且i小于或等于2B1;
第二确定单元,用于根据所述第一码本中的第i个部分,采用预先训练的码本作为第二码本,所述第二码本的比特数为B-B1;
第二量化单元,用于基于所述第二码本,对所述N1个矢量中的第二矢量进行量化。
20.根据权利要求19所述的装置,其特征在于,所述矢量划分单元用于:将所述M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N。
21.根据权利要求19所述的装置,其特征在于,述一帧包括N1个子帧,每一个子帧的频域包络对应一个矢量。
22.根据权利要求21所述的装置,其特征在于,所述M=2。
23.根据权利要求19-22任意之一所述的装置,其特征在于,所述第一码本包括事先训练并排序的2<B>个码字,所述码字为码本中的每个矢量在码本中对应的位置索引。
24.一种频域包络的矢量量化方法,其特征在于,包括:
将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;
采用B比特的第一码本对所述N1个矢量中的第一矢量进行量化,以获得所述第一矢量量化的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;
根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联,其中i为正整数,i大于或等于1且小于或等于2B1;
根据所述第一码本的第i个部分的码本确定第二码本;
基于所述第二码本,对所述N1个矢量中第二矢量进行量化。
25.根据权利要求24所述的方法,其特征在于,所述根据所述第i个部分的码本确定第二码本包括:
采用所述第一码本中的第i个部分作为第二码本,其中所述第一码本中的第i个部分的比特数为B-B1。
26.根据权利要求24所述的方法,其特征在于,所述根据所述第i个部分的码本确定第二码本包括:
采用预先训练的码本作为第二码本,其中所述预先训练的码本的比特数与所述第一码本中的第i个部分的比特数相同,均为B-B1。
27.根据权利要求24所述的方法,其特征在于,当B1为1时,所述根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联包括:
当所述第一矢量量化的码字属于所述第一码本的2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联,
当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第一矢量与所述第一码本的所述后半部分相关联。
28.根据权利要求25所述的方法,其特征在于,当B1为1时,所述根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联包括:
当所述第一矢量量化的码字属于所述第一码本的2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联,
当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第一矢量与所述第一码本的所述后半部分相关联。
29.根据权利要求26所述的方法,其特征在于,当B1为1时,所述根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联包括:
当所述第一矢量量化的码字属于所述第一码本的2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联,
当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第一矢量与所述第一码本的所述后半部分相关联。
30.根据权利要求24所述的方法,其特征在于,当M为2且B1为1时,所述根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联包括:
确定与所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;
当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联,
当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
31.根据权利要求25所述的方法,其特征在于,当M为2且B1为1时,所述根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联包括:
确定与所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;
当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联,
当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
32.根据权利要求26所述的方法,其特征在于,当M为2且B1为1时,所述根据所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联包括:
确定与所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;
当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联,
当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
33.根据权利要求24至32中任一项所述的方法,其特征在于,所述将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,包括:
当所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N,将所述M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络。
34.一种频域包络的矢量量化装置,其特征在于,包括:
矢量划分单元,用于将一帧中的N个频域包络划分为N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络,N1、N、M为正整数,且M大于或等于2,N大于N1;
第一量化单元,用于采用B比特的第一码本对所述矢量划分单元所划分的所述N1个矢量中的第一矢量进行量化,以获得所述第一矢量量化的码字,其中所述第一码本被划分为2B1个部分,B为正整数且大于或等于2,B1为正整数且大于或等于1;
第一确定单元,用于根据所述第一量化单元量化的所述第一矢量量化的码字,确定量化后的第一矢量与所述第一码本的所述2B1个部分中的第i个部分相关联,其中i为正整数,i大于或等于1且小于或等于2B1;
第二确定单元,用于根据所述第一确定单元确定的所述第i个部分的码本确定第二码本;
第二量化单元,用于基于所述第二确定单元确定的所述第二码本,对所述N1个矢量中第二矢量进行量化。
35.根据权利要求34所述的装置,其特征在于,所述第二确定单元具体用于:
采用所述第一码本中的第i个部分作为第二码本,其中所述第一码本中的第i个部分的比特数为B-B1。
36.根据权利要求34所述的装置,其特征在于,所述第二确定单元具体用于:
采用预先训练的码本作为第二码本,其中所述预先训练的码本的比特数与所述第一码本中的第i个部分的比特数相同,均为B-B1。
37.根据权利要求34所述的装置,其特征在于,当B1为1时,所述第一确定单元具体用于:
当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联;或者当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第二矢量与所述第一码本的所述后半部分相关联。
38.根据权利要求35所述的装置,其特征在于,当B1为1时,所述第一确定单元具体用于:
当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联;或者当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第二矢量与所述第一码本的所述后半部分相关联。
39.根据权利要求36所述的装置,其特征在于,当B1为1时,所述第一确定单元具体用于:
当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的前半部分,确定量化后的第一矢量与所述第一码本的所述前半部分相关联;或者当所述第一矢量量化的码字属于所述第一码本的所述2个部分中的后半部分,确定量化后的第二矢量与所述第一码本的所述后半部分相关联。
40.根据权利要求34所述的装置,其特征在于,当M为2且B1为1时,所述第一确定单元具体用于:
确定所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;
当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联;或者
当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
41.根据权利要求35所述的装置,其特征在于,当M为2且B1为1时,所述第一确定单元具体用于:
确定所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;
当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联;或者
当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
42.根据权利要求36所述的装置,其特征在于,当M为2且B1为1时,所述第一确定单元具体用于:
确定所述码字对应的量化后的第一矢量的第一个值与第二个值的比值是否在预定范围;
当确定所述比值在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的前半部分相关联;或者
当确定所述比值不在预定范围,确定所述量化后的第一矢量与所述第一码本的所述2个部分中的后半部分相关联。
43.根据权利要求34至42中任一项所述的装置,其特征在于,所述矢量划分单元具体用于:
当所述一帧包括M个子帧,且所述M个子帧中每个子帧包括N1个包络,其中M与N1的乘积为N,将所述M个子帧中的每个子帧中对应的包络组合成一个矢量从而得到N1个矢量,其中所述N1个矢量中的每一个矢量包括M个频域包络。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710370044.7A CN107316647B (zh) | 2013-07-04 | 2013-07-04 | 频域包络的矢量量化方法和装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310279924.5A CN104282308B (zh) | 2013-07-04 | 2013-07-04 | 频域包络的矢量量化方法和装置 |
CN201710370044.7A CN107316647B (zh) | 2013-07-04 | 2013-07-04 | 频域包络的矢量量化方法和装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310279924.5A Division CN104282308B (zh) | 2013-07-04 | 2013-07-04 | 频域包络的矢量量化方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107316647A CN107316647A (zh) | 2017-11-03 |
CN107316647B true CN107316647B (zh) | 2021-02-09 |
Family
ID=52143115
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710370044.7A Active CN107316647B (zh) | 2013-07-04 | 2013-07-04 | 频域包络的矢量量化方法和装置 |
CN201310279924.5A Active CN104282308B (zh) | 2013-07-04 | 2013-07-04 | 频域包络的矢量量化方法和装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310279924.5A Active CN104282308B (zh) | 2013-07-04 | 2013-07-04 | 频域包络的矢量量化方法和装置 |
Country Status (16)
Country | Link |
---|---|
US (2) | US9805732B2 (zh) |
EP (3) | EP4231288A1 (zh) |
JP (1) | JP6301459B2 (zh) |
KR (1) | KR101725531B1 (zh) |
CN (2) | CN107316647B (zh) |
AU (1) | AU2014286716B2 (zh) |
BR (1) | BR112015031617B1 (zh) |
CA (1) | CA2911314C (zh) |
ES (2) | ES2954460T3 (zh) |
HK (1) | HK1206137A1 (zh) |
MX (1) | MX351967B (zh) |
MY (1) | MY170701A (zh) |
PL (1) | PL3594944T3 (zh) |
RU (1) | RU2635069C2 (zh) |
SG (1) | SG11201509155RA (zh) |
WO (1) | WO2015000416A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102168650B1 (ko) * | 2018-11-27 | 2020-10-21 | 한국과학기술원 | 다중 안테나 다중 사용자 간섭채널에서 기계학습 기반 빔포밍 방법 및 장치 |
CN113766150B (zh) * | 2021-08-31 | 2024-03-26 | 北京安酷智芯科技有限公司 | 一种降噪方法、电路系统、电子设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995010760A3 (en) * | 1993-10-08 | 1995-05-04 | Comsat Corp | Improved low bit rate vocoders and methods of operation therefor |
WO2007114290A1 (ja) * | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 |
US20100070269A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding Second Enhancement Layer to CELP Based Core Layer |
CN101911185A (zh) * | 2008-01-16 | 2010-12-08 | 松下电器产业株式会社 | 矢量量化装置、矢量反量化装置及其方法 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5680508A (en) * | 1991-05-03 | 1997-10-21 | Itt Corporation | Enhancement of speech coding in background noise for low-rate speech coder |
TW321810B (zh) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
US6014618A (en) | 1998-08-06 | 2000-01-11 | Dsp Software Engineering, Inc. | LPAS speech coder using vector quantized, multi-codebook, multi-tap pitch predictor and optimized ternary source excitation codebook derivation |
US6952671B1 (en) | 1999-10-04 | 2005-10-04 | Xvd Corporation | Vector quantization with a non-structured codebook for audio compression |
US7337110B2 (en) | 2002-08-26 | 2008-02-26 | Motorola, Inc. | Structured VSELP codebook for low complexity search |
CA2415105A1 (en) * | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
JP4382090B2 (ja) | 2003-06-16 | 2009-12-09 | パナソニック株式会社 | 符号化装置、符号化方法およびコードブック |
JP4963963B2 (ja) * | 2004-09-17 | 2012-06-27 | パナソニック株式会社 | スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法 |
EP1869673B1 (en) | 2005-04-01 | 2010-09-22 | Qualcomm Incorporated | Methods and apparatuses for encoding and decoding a highband portion of a speech signal |
US7805314B2 (en) * | 2005-07-13 | 2010-09-28 | Samsung Electronics Co., Ltd. | Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data |
US7602745B2 (en) | 2005-12-05 | 2009-10-13 | Intel Corporation | Multiple input, multiple output wireless communication system, associated methods and data structures |
EP1970900A1 (en) * | 2007-03-14 | 2008-09-17 | Harman Becker Automotive Systems GmbH | Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal |
US8125884B1 (en) * | 2007-07-11 | 2012-02-28 | Marvell International Ltd. | Apparatus for pre-coding using multiple codebooks and associated methods |
CN100585699C (zh) * | 2007-11-02 | 2010-01-27 | 华为技术有限公司 | 一种音频解码的方法和装置 |
CN101335004B (zh) | 2007-11-02 | 2010-04-21 | 华为技术有限公司 | 一种多级量化的方法及装置 |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
CN101483043A (zh) * | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
JPWO2009090875A1 (ja) * | 2008-01-16 | 2011-05-26 | パナソニック株式会社 | ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法 |
CN101261835B (zh) | 2008-04-25 | 2010-12-15 | 清华大学 | 基于超帧模式的多矢量多码本尺寸联合优化方法 |
US9037474B2 (en) * | 2008-09-06 | 2015-05-19 | Huawei Technologies Co., Ltd. | Method for classifying audio signal into fast signal or slow signal |
US8924222B2 (en) * | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
CN102208188B (zh) * | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
-
2013
- 2013-07-04 CN CN201710370044.7A patent/CN107316647B/zh active Active
- 2013-07-04 CN CN201310279924.5A patent/CN104282308B/zh active Active
-
2014
- 2014-07-03 RU RU2015155949A patent/RU2635069C2/ru active
- 2014-07-03 ES ES19162443T patent/ES2954460T3/es active Active
- 2014-07-03 AU AU2014286716A patent/AU2014286716B2/en active Active
- 2014-07-03 WO PCT/CN2014/081530 patent/WO2015000416A1/zh active Application Filing
- 2014-07-03 ES ES14819622T patent/ES2738883T3/es active Active
- 2014-07-03 KR KR1020157033916A patent/KR101725531B1/ko active IP Right Grant
- 2014-07-03 EP EP23175742.8A patent/EP4231288A1/en active Pending
- 2014-07-03 PL PL19162443.6T patent/PL3594944T3/pl unknown
- 2014-07-03 CA CA2911314A patent/CA2911314C/en active Active
- 2014-07-03 SG SG11201509155RA patent/SG11201509155RA/en unknown
- 2014-07-03 BR BR112015031617-4A patent/BR112015031617B1/pt active IP Right Grant
- 2014-07-03 EP EP14819622.3A patent/EP2983170B1/en active Active
- 2014-07-03 EP EP19162443.6A patent/EP3594944B1/en active Active
- 2014-07-03 MX MX2015017003A patent/MX351967B/es active IP Right Grant
- 2014-07-03 JP JP2016522247A patent/JP6301459B2/ja active Active
- 2014-07-03 MY MYPI2015704556A patent/MY170701A/en unknown
-
2015
- 2015-07-10 HK HK15106604.8A patent/HK1206137A1/zh unknown
- 2015-12-29 US US14/981,923 patent/US9805732B2/en active Active
-
2017
- 2017-09-26 US US15/715,179 patent/US10032460B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995010760A3 (en) * | 1993-10-08 | 1995-05-04 | Comsat Corp | Improved low bit rate vocoders and methods of operation therefor |
WO2007114290A1 (ja) * | 2006-03-31 | 2007-10-11 | Matsushita Electric Industrial Co., Ltd. | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 |
CN101911185A (zh) * | 2008-01-16 | 2010-12-08 | 松下电器产业株式会社 | 矢量量化装置、矢量反量化装置及其方法 |
US20100070269A1 (en) * | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding Second Enhancement Layer to CELP Based Core Layer |
Non-Patent Citations (1)
Title |
---|
《Conditional Vector Quantization for Speech Coding》;Yannis Agiomyrgiannakis et al.;《IEEE Transactions on Audio,Speech,and Language Processing》;20070229;第15卷(第2期);第377-386页 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2892052B1 (en) | Bit allocation method and device for audio signal | |
US20230238010A1 (en) | Signal Processing Method and Device | |
US20190057706A1 (en) | Signal Encoding And Decoding Methods and Devices | |
US9425820B2 (en) | Vector quantization with non-uniform distributions | |
CN107316647B (zh) | 频域包络的矢量量化方法和装置 | |
KR20200012861A (ko) | 디지털 오디오 신호에서의 차분 데이터 | |
CN101577551A (zh) | 一种生成格型矢量量化码书的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200722 Address after: Houston, USA Applicant after: Chaoqing codec Co., Ltd Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen Applicant before: HUAWEI TECHNOLOGIES Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |