CN1181150A - 用于语音快速编码的被选信号脉冲幅度的代数码本 - Google Patents
用于语音快速编码的被选信号脉冲幅度的代数码本 Download PDFInfo
- Publication number
- CN1181150A CN1181150A CN96193095A CN96193095A CN1181150A CN 1181150 A CN1181150 A CN 1181150A CN 96193095 A CN96193095 A CN 96193095A CN 96193095 A CN96193095 A CN 96193095A CN 1181150 A CN1181150 A CN 1181150A
- Authority
- CN
- China
- Prior art keywords
- pulse
- amplitude
- advance
- cloth
- code book
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims description 94
- 239000004744 fabric Substances 0.000 claims description 69
- 238000000034 method Methods 0.000 claims description 42
- 238000001914 filtration Methods 0.000 claims description 26
- 230000001413 cellular effect Effects 0.000 claims description 23
- 230000006854 communication Effects 0.000 claims description 19
- 238000004891 communication Methods 0.000 claims description 18
- 230000010267 cellular communication Effects 0.000 claims description 9
- 238000013139 quantization Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 19
- 238000005516 engineering process Methods 0.000 description 11
- 230000007774 longterm Effects 0.000 description 10
- 238000011045 prefiltration Methods 0.000 description 10
- 230000004044 response Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 8
- 239000002131 composite material Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 230000007704 transition Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000035807 sensation Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 238000005086 pumping Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
- G10L2019/0008—Algebraic codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
对码本进行搜索以对声音信号进行编码。该码本由一个脉冲幅度/位置组合的集合组成,每一个脉冲幅度/位置组合定义了L个不同的位置,包括分配给该组合的各个位置p=1,2,...,L的零幅脉冲和非零幅脉冲组成,其中每一个非零幅脉冲具有q种可能幅度中的至少一种幅度。为减小搜索的复杂性,从码本中预先选择出与声音信号有关的一个脉冲幅度/位置组合子集,并且只搜索这一组合子集。该组合子集的预选过程包括与声音信号相关预先建立一个在各自位置p=1,2,...,L和q种可能幅度之间的函数Sp,搜索限制在具有满足预先建立的函数关系的非零幅脉冲的码本中的组合的范围内。能够通过给每个位置p预先分配q种可能幅度中的一种幅度来预先建立该函数,当一个组合中的每一个非零幅脉冲都具有与预先分配该脉冲位置的幅度相等的幅度时,该预先建立的函数即得到了满足。
Description
这是1995年2月6日提交的美国专利申请序号为No.08/383,968,题为“用于语音快速编码的被选信号脉冲幅度的代数码本”的发明的部分继续申请。
本发明涉及一种对声音信号,尤其是对不仅仅是语音信号的声音信号进行数字编码的改进技术,以对这种声音信号进行传送和合成。
在诸如通过卫星,地面移动台、数字无线电或分组网络进行的声音传送、声音存储、声音响应和无线电话等许多应用领域,对具有良好的主观质量/比特率的折衷的高效数字语音编码技术的需求正日益增长。
目前具有良好的主观质量比特率的折衷的最好的现有技术中有一种所谓的码激励线性预测编码(CELP)技术。按照这一技术,语音信号以含L个样值的数据块(即矢量)的形式被采样和处理,其中L是某个预先设定的数值。CELP技术采用一码本(code book)。
在CELP技术中的码本是被称为L维码矢量(定义L个不同位置的脉冲组合,并且包括分配给组合中各个位置p=1,2……,L的零幅脉冲和非零幅脉冲)的长为L个样值的序列的一个附标集合。该码本包括一个从1至M变化的标引K,其中M表示码本的大小,有时表示为比特数b:
M=2b
一个码本可以被贮存在物理存储器(如查寻表)中,或者指的是将标引与相应码矢量联系起来的一种机理(例如一个公式)。
为按照CELP技术合成语音,通过模拟语音信号的频谱特性的时间变化滤波器从码本中筛选出适当的码矢量来合成每一块语音样值。在编码器端,对来自码本的所有候选码矢量或候选码矢量的一个子集计算合成的输出信号(码本搜索)。得以保留的码矢量为根据感觉加权失真方法,产生的合成输出信号最接近于原始语音信号的那个码矢量。
一种类型的码本为所谓的“随机”码本。这些码本的一个缺点是它们经常需要相当大的物理存储空间。从标引到相关的码矢量的路径涉及到查寻表,这些查寻表是随机产生的数字或者对大量的语音训练集合应用统计技术的结果。从这个意义来讲,这些码本是随机的,即无规则的。随机码本的容量容易受到存储空间和/或搜索复杂程度的限制。
另一种类型的码本为代数码本。与随机码本相比,代数码本不是随机的且不需要存储空间。一个代数码本是一个附标码矢量的集合,其中第K个码矢量的各脉冲的幅度和位置可通过一种不需要或只需要极少的物理存储空间的规则来根据其标引K推导出来。因而,代数码本的容量不受存储需求的限制。代数码本也能设计用于高效搜索。
因而,本发明的一个目的是提供一种能显著减少对语音信号进行编码时的码本检索复杂程度的方法和装置。这些方法和装置适用于一大类码本。
本发明的另一个目的是提供一种能先验地选择一个码本脉冲组合子集并将待检索的组合限制在该子集内以减少码本搜索复杂程度的方法和装置。
本发明的又一个目的是通过让码矢量的各个非零幅脉冲取q种可能幅度中的至少一种幅度以增加码本容量,而不增加搜索复杂程度。
具体而言,在本发明中,提出了一种在码本中进行搜索以对声音信号编码的方法,该码本由一个脉冲组合的集合组成,并且每一脉冲组合定义了多个不同的位置,并包括分配给该组合中各个位置的脉冲。这一方法包括以下步骤:
从码本中预选一个与声音信号有关的脉冲组合子集;以及
只搜索该脉冲组合子集以对声音信号编码;
由于仅搜索码本中的一个脉冲组合子集,因而在操作中搜索的复杂程度就得以减小。
本发明还提供一种在码本中进行搜索以声音信号编码的方法,其中的码本由一个脉冲幅度/位置组合的集合组成,每一脉冲幅度/位置组合定义了L个不同的位置,并包括分配给该组合中各个位置p=1,2,…,L的零幅脉冲和非零幅脉冲,并且每一个非零幅脉冲至少具有q种可能幅度中的一种。这一方法包括以下步骤:
从码本中预选一个与该声音信号有关的脉冲幅度/位置组合子集;以及
只搜索该脉冲幅度/位置组合子集以对声音信号编码。
由于只搜索码本中的一个脉冲幅度/位置组合子集,搜索的复杂程度再次得以减小。
在本发明中,还提供一种在码本中进行搜索以对声音信号编码的装置,其中的码本由一个脉冲组合的集合组成,并且每一脉冲组合定义了多个不同的位置,并包括分配给该组合中各个位置的脉冲。该装置包括:
从码本中预选出一个与该声音信号有关的脉冲组合子集的装置;以及
只搜索该脉冲组合子集以对声音信号编码的装置。
因为仅搜索码本中的一个脉冲组合子集,因而操作中的搜索的复杂程度就得以减小。
本发明还提供一种对码本进行搜索以对声音信号编码的装置。其中的码本由一个脉冲幅度/位置组合的集合组成,每一脉冲幅度/位置组合定义了L个不同的位置,并包括分配给该组合中各个位置p=1,2,…,L的零幅脉冲和非零幅脉冲,并且每一个非零幅脉冲至少具有q种可能幅度中的一种幅度。该装置包括从码本中预选一个与声音信号有关的脉冲幅度/位置组合子集的装置;以及只搜索该脉冲幅度/位置组合子集以对声音信号编码的装置,因为只搜索码本中的一个脉冲幅度/位置组合子集,因而搜索的复杂程度得以减小。
在本发明中,还进一步提供一种用于服务于一个被划分为多个小区的大的地理区域的蜂窝通信系统,该系统包括:
多个移动的便携式发射机/接收机单元;
位于各个小区内的多个蜂窝基站;
控制各蜂窝基站之间的通信的装置;
位于一个小区内的每个移动单元和该小区内的蜂窝基站之间的一个双向无线通信子系统,该双向无线通信子系统包括在移动单元和蜂窝基站之内都有的(a)发射机,该发射机包括对语音信号进行编码的装置和发射编码的语音信号的装置,以及(b)一台接收机,该接收机包括接收被发射的编码语音信号的装置和对接收到的编码语音信号进行解码的装置;
其中,语音信号编码装置包含一用于在码本内进行搜索以对语音信号进行编码的装置,该码本由一个脉冲组合的集合组成,并且每一脉冲组合定义了多个不同的位置,并包括分配给该组合中各个位置的脉冲,该搜索执行装置包括:
用于从码本中预选一个与语音信号有关的脉冲组合子集的装置;以及
用于只搜索该脉冲组合子集以对语音信号编码的装置;
因为仅搜索码本中的一个脉冲组合子集,因而,操作中的搜索的复杂程度仍得以减小。
最后,本发明提供一种用于服务于一个被划分为多个小区的大的地理区域的蜂窝通信系统,该系统包括:
多个移动的便携式发射机/接收机单元;
位于各个小区内的蜂窝基站;
控制各蜂窝基站之间的通信的装置;
位于一个小区内的每个移动单元与该小区内的蜂窝基站之间的一个双向无线通信子系统,该双向无线通信子系统包括在移动单元和蜂窝基站之内都有的(a)发射机,该发射机包含对语音信号进行编码的装置和发射该编码语音信号的装置,和(b)接收机,该接收机包含接收被发射的编码语音信号的装置和对接收到的编码语音信号进行解码的装置;
其中该语音信号编码装置包含一用于在码本内进行搜索的以对语音信号编码的装置,该码本由一个脉冲幅度/位置组合的集合组成,每一脉冲幅度/位置组合定义了L个不同的位置,并包括分配给该组合中的各个位置p=1,2,…,L的零幅脉冲和非零幅脉冲,并且每一个非零幅脉冲至少具有q种可能幅度中的一种幅度,该搜索执行装置包括:
用于从码本中预选出一个与语音信号有关的脉冲幅度/位置组合子集的装置;以及
用于只搜索该脉冲幅度/位置组合以对语音信号编码的装置。
因为仅搜索码本中的脉冲幅度/位置组合的一个子集,因而实际操作中的搜索的复杂程度得以减小。
按照本发明的一个优选实施例,(a)通过预先建立一个与声音信号有关的、所述各个位置p=1,2,…,L和所述q种可能幅度之间的函数Sp来预选脉冲幅度/位置组合的子集,(b)只搜索码本中的具有满足预先建立的函数关系的非零幅脉冲的脉冲幅度/位置组合。
最好是,通过与声音信号相关地给每一个位置p预先分配q种可能幅度中的一种幅度,就可以很方便地预先建立函数Sp,并且当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与预先分配给位置p的非零幅脉冲的幅度Sp相等的幅度时,该预先建立的函数即得到了满足。
最好是,给每一个位置预先分配q种可能幅度中的一种幅度的过程包括以下步骤:
对声音信号进行处理以产生经逆向滤波(backward-filtered)的目标信号D和已去掉音调的残留信号R′;
根据经逆向滤波的目标信号D和已去掉音调的残留信号R′计算幅度估算矢量B;以及
对每一个位置p,量化矢量B的幅度估算值Bp以获取位置p的待选幅度。
幅度估算矢量B的计算最好包括以下步骤:对具有归一化形式 的逆向滤波目标信号D和具有归一化形式 的去音调残留信号求和以由此得到如下形式的幅度预测矢量β: 其中β为一个固定常数,最好取位于0和1之间的一值。
按照本发明的另一个优选实施例,采用下述表达式: 来对矢量B的峰值归一化的幅度预测值Bp进行量化。其中分母 为表示非零幅脉冲的峰值幅度的一个归一化因子。
每一个脉冲组合都可以包含N个非零幅脉冲,并且最好根据至少一个N交织(N-interleaved)的单脉冲置换码对非零幅脉冲的位置p加以约束。
对码本的搜索最好包含以下步骤:使一个给定比例值最大,该比例值的分母α2 k根据下述关系式采取N层嵌套循环的方式计算而来:
α2 k=U′(p1,p2)
+U′(p2,p2)+2U′(p1,p2)
+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)
…………
+U′(pN,pN)+2U′(p1,pN)+2U′(p2,pN)+…+2U′(pN-1,pN)其中每一循环的计算都被写入一条从N层嵌套循环的最外层循环至最内层循环的不同线上,pn为该组合中第n个非零幅脉冲的位置,U′(px,py)为取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。在上面的计算中,当下述不等式成立时,至少可以跳过此N层嵌套循环中的最内层循环。 其中Spn为预先分配给位置pn的幅度,Dpn为目标矢量D的第pn个分量。Tp为与经逆向滤波的目标矢量D有关的一个阈值。
通过阅读下面的关于优选实施例的叙述,参照附图,就可以对本发明的目的,优点和其它特征有一个更清晰的了解。
在附图中:
图1是一个根据本发明的包括一个幅度选择器和一个最佳控制器的声音信号编码装置的示意方框图;
图2是一个与图1中的编码装置相关的解码装置的示意方框图;
图3a是根据本发明的基于信号选择的脉冲幅度进行快速码本搜索的基本操作步骤的顺序图;
图3b是给脉冲幅度/位置组合的每一位置p预先分配q种幅度中的一种幅度的操作步骤的顺序图;
图3c是N层嵌套循环搜索过程中包含的操作步骤的顺序图,其中,当认为第一组N-1个脉冲对分子DAT K的贡献不够充分时,跳过最内层循环;
图4是在码本搜索过程中采用的N层嵌套循环的示意图;
图5是说明一个典型蜂窝通信系统的基础结构的示意方框图。
图5图解说明了一个典型蜂窝通信系统1的基础结构。
尽管在本说明书中,作为一个非限制性的例子,对根据本发明的搜索执行方法和装置应用于一个蜂窝通信系统的情况作了说明,但是,应指出这些方法和装置可以被应用到许多其它类型的需要对声音信号进行编码的通信系统中,并具有同样的优点。
对于诸如1的蜂窝通信系统,通过将一个大的地理区域划分成许多较小的小区,可以在这个大的区域内提供通信服务。每一小区有一个蜂窝基站2(图5),用于提供无线电信令信道,以及音频和数据信道。
无线电信令通道用于在蜂窝基站的覆盖区域范围(小区)内呼叫诸如3的移动无线电话机(移动发射机/接收机单元),以及与基站所在小区内或外的其它无线电话机通话,或与另外的网络如公共交换电话网(PSTN)4通话。
一旦无线电话机3成功地打通电话或接到电话,音频或数据信道就对于与无线电话机3所处的小区相对应的蜂窝基站2而建立,则基站2和无线电话机3之间的通信就通过该音频或数据通道进行。无线电话机3还可以在通话进行时,通过信令信道接收控制或定时信息。
如果无线电话机3在通话过程中离开某一小区进入另一小区,无线电话机就将电话过区切换到新小区内的可用的音频或数据信道上。类似地,如果没有通话,就通过信令信道发送一条控制信息使得无线电话机登录在与新小区相关的基站2上。采用这种方式,就可能实现在一个宽阔的地域内的移动通信。
蜂窝通信系统1还包含一个终端5,用于在诸如无线电话机3与PSTN4通信期间或者在一第一小区内无线电话机3和第二小区内的无线电话机3之间的通信期间,控制蜂窝基站2和公共交换电话网络4之间的通信。
当然,需要一个双向无线通信子系统来建立位于一个小区内的每一台无线电话机3和该小区内的蜂窝基站2之间的通信。这样一种双向无线通信系统一般包含在无线电话机3和蜂窝基站内都有的(a)发射机,用于对语音信号编码,并通过如6或7的天线发送已被编码的语音信号,以及(b)接收机,用于通过同一天线6或7接收被发送的编码语音信号,并对接收到的编码语音信号进行解码。对本领域普通技术人员都知道,需要对声音编码以减少带宽,这对于通过双向无线通信系统即在无线电话机3和基站2之间发送语音信号来说是必须的。
本发明的目的是提供一种具有良好的主观质量/比特率的折衷的高效数字语音编码技术,例如用于在蜂窝基站2和无线电话机3之间通过音频数据信道进行语音信号的双向传送。图1是适合于实现这一高效技术的一种数字语音编码装置的示意方框图。
图1中的语音编码装置与专利号为No.07/927,528的美国专利中的图1所示的编码装置相同,只是在本发明中增加了一个幅度选择器112。美国专利申请No.07/927,528申请日为1992年9月10日,题为“基于代数码的用于高效语音编码的动态码本”的发明。
模拟语音信号被采样并成块处理。必须明白的是,本发明并不局限于只应用于语音信号。也可以考虑应用本发明对其它类型的声音信号进行编码。在图示的例子中,输入的采样语音的数据块S(图1)由L个样值组成。在CELP的文献中,L表示“子帧”长度,一般位于20和80之间。含L个样值的块也被称为L维矢量。在编码处理过程中会产生各种各样的L维矢量。下面给出了一个在图1和2中出现的矢量的列表,以及一个发送参数的列表:
关于主要L维矢量的列表
S 输入语音矢量;
R′ 去掉音调的残留信号;
X 目标矢量;
D 经逆向滤波的目标矢量;
Ak 代数码本中标引为k的码矢量;
Ck 修正矢量(Innovation vector)(经滤波的码矢量);
发送参数的列表
k 码矢量的标引(代数码本的输入);
g 增益;
STP 短期预测参数(定义A(Z));以及
LTP 长期预测参数(定义音调增益b和音调延时T)解码原理:
最好是首先叙述图2中的语言解码装置,以说明在数字输入(多路信号分离器205的输入)和输出的取样语音(合成滤波器204的输出)之间进行的各个步骤。
多路信号分离器205从接收自数字输入信道的二进制信息中提取四种不同的参数,即标引k、增益g、短期预测参数STP和长期预测参数LTP。在这四种参数的基础上合成语音信号的当前L维矢量S,在下面的叙述中将对此加以解释。
图2中的语音解码装置包含动态码本208、放大器206、加法器207、长期预测器203和合成滤波器204,其中动态码本208由一个代数码发生器206和一个自适应前置滤波器202组成。
第一步,代数码产生器201响应标引k产生一个码矢量Ak。
第二步,给自适应前置滤波器202提供长期预测参数LTP,由其对码矢量Ak进行处理,以产生输出修正矢量Ck。采用自适应前置滤波器202的目的是对输出修正矢量Ck的频率成分进行动态控制以提高语音质量,也就是减少由刺耳的频率引起的声音失真。下面给出了自适应前置滤波器202的典型传输函数F(Z):
Fa(Z)是一种共振峰(formant)前置滤波器,γ1和γ2为常数,且0<γ1<γ2<1。这种滤波器能增强共振峰区域的频率成分,并且在编码速率低于5k比特/s时能非常有效地工作。
Fb(Z)是一种音调前置滤波器,其中T是时变音调延时,bo或是常数或者是等于根据当前或以前的子帧量化的长期音调预测参数。Fb(Z)用于加强各种码速率F的音调谐波频率非常有效。因此,F(Z)一般包括一个有时与一个共振峰前置滤波器相结合的音调前置滤波器,即:
F(Z)=Fa(Z)Fb(Z)
按照CELP技术,首先用经放大器206的增益g来放大码本208中的修正矢量Ck来获得输出的取样语音信号S。然后,由加法器207将放大的波形gck加到提供有LTP参数的长期预测器203的输出E上(合成滤波器204的信号激励的长期预测部分),长期预测器203置于反馈环中,并具有如下的传输函数B(Z):
B(Z)=bZ其中b和T分别为所述的音调增益和延时。
预测器203是一个模拟语音的音调周期性的滤波器,具有基于最新接收到的LTP参数b和T的传输函数。它引入样值的适当的音调增益b和延时T。复合信号E+gCk构成合成滤波器204的信号激励,合成滤波器的传输函数为1/A(Z)(A(Z)将在下面的叙述中定义)。滤波器204根据最新接收到的STP参数进行正确的频谱整形。具体而言,滤波器204模拟语音的共振频率(共振峰)。输出的样值组S为合成取样语音信号,根据在本技术领域中的公知技术,采用合适的去混叠滤波,可以将该合成取样语音信号转化为模拟信号。
有许多方式来设计代数码发生器201。在所述的专利申请号为No.07/927,528的美国专利中提出了一种较好的方法,该方法采用至少一种N交织的单脉冲置换码。
用一个简单的代数码发生器201来对这一概念加以说明。在这个例子中,L=40并且40维的码矢量集合中只包含N=5个非零幅脉冲,称之为Sp1,Sp2,Sp3,Sp4,Sp5。在这种更细致的标注法中,pi表示子帧内的第i个脉冲的位置(即pi在0至L-1范围内取值)。假设脉冲Spi被限制在如下的8种可能位置p1:
p1=0,5,10,15,20,25,30,35=0+8m1;m1=0,1,…,7
在被称为“轨迹”#1的这八种可能的位置内,Sp1和7个零幅脉冲可以自由置换。称之为“单脉冲置换码”。现在让我们通过用类似的方式对余下的脉冲的位置也加以限制来交织五个这种“单脉冲置换码”(即轨迹#2,轨迹#3、轨迹#4和轨迹#5)。
p1=0,5,10,15,20,25,30,35=0+8m1
p2=1,6,11,16,21,26,31,36=1+8m2
p3=2,7,12,17,22,27,32,37=2+8m3
p4=3,8,13,18,23,28,33,38=3+8m4
p5=4,9,14,19,24,29,34,39=4+8m5
注意整数m1=0,1,…,7可以完全确定每一个脉冲Spi的位置pi。因而,采用下述关系式,通过对各mi直接倍乘,就可以推导出一种简单的位置标引Kp:
Kp=4096m1+512m2+64m3+8m4+m5
必须指出的是,采用上述脉冲轨迹也能推导出其它的码本。例如,只采用4个脉冲,其中前三个脉冲分别占据前三条轨迹的位置,同时第四个脉冲或者占据第四条轨迹或者占据第五条轨迹,用一个比特来说明其处于哪一个轨迹。这种设计能得到一个13位位置码本。
在现有技术中,由于码矢量搜索的复杂性的缘故,假定非零幅脉冲在各种实际应用中都具有固定的幅度。事实上,如果脉冲Spi可以取q种可能幅度中的一种的话,在搜索中就必须考虑有qN种之多的脉冲一幅度组合。例如,如果允许第一个例子中的5个脉冲取q=4种可能幅度,如Spi=+1,-1,+2,-2而不是固定幅度的话,代数码本的大小就会从15位跳至15+(5×2)位=25位;也就是说,搜索将复杂一千倍。
本发明的目的是指出这样一个令人惊讶的方案,即在不用付出很大代价的情况下,采用有q种幅度的脉冲能取得非常好的性能。这种方案是将搜索范围限制在码矢量的一个限定的子集内。选择码矢量的方法与输入语音信号有关,下面的叙述中将对此加以说明。
本发明的有用之处在于:通过允许单个脉冲取不同的可能幅度,能够增加动态代数码本208的大小,而不增加码矢量搜索的复杂性。编码原理:
取样语音信号S由图1中的编码系统按块编码在一块上。图1中的解码系统可被分解为标号从102至112的11个模块。大多数这些模块的功能和操作相对于美国专利和申请号为No.07/927,528的母专利中的描述来说没有变化。因而,在下面的叙述中尽管将不得不对每一个模块的功能和操作一些简要的解释。但主要将叙述对于美国专利申请号为No.07/927,528的母专利而言为新的内容。
按照现有技术,通过一个LPC频谱分析器102,给语音信号的每一个含L个样值的数据块,产生一组被称为短期预测(STP)参数的线性预测编码(LPC)参数。具体而言,分析器102模拟L个样值的每一块S的频谱特性。
L个样值S的输入块S由“白化”滤波器103白化,“白化”滤波器103具有下述基于STP参数的当前值的传输函数: 其中a0=1,Z为所谓的Z变换中的一般变量。如图1所示,“白化”滤波器103产生残留矢量R。
音调提取器104用于计算和量化LTP参数,即音调延时T和音调增益g。提取器104的初始状态也被设置为来自初始状态提取器110的一个值FS。在美国专利申请号为No.07/927,528的母专利中对计算和量化LTP参数的详细过程已有叙述,并且相信对本领域普通技术人员是熟知的。因而,在本文中不再对此作进一步的叙述。
给滤波器响应特性计算器105(图1)提供STP和LTP参数以计算滤波器的响应特性FRC供后续步骤使用。FRC信息包括下述三个组成部分,其中n=1,2,…,L。·f(n):F(Z)的响应
注意F(Z)一般包括音调前置滤波器。 对f(n)的响应
其中γ是一个感觉因子。更一般而言,h(n)是前置滤波器F(Z),感
觉加权滤波器W(Z)和合成滤波器1/A(Z)的级联F(Z)W(Z)/A(Z)脉冲
响应。注意F(Z)和1/A(Z)与在图2的解码器中采用的滤波器相同。U(i,j):基于下述表达式的h(n)的自相关
1≤i≤L且i≤j≤L;当n<1时h(n)=0
给长期预测器106输入以前的激励信号(即前面子帧的E+gCk),以采用适当的音调延时T和增益b形成新的E成分。
感觉滤波器(perceptual filter)107的初始状态被设置成由初始状态提取器110输入的值FS。然后,将由减法器121(图1)计算出的已去掉音调的残留矢量R′=R-E输入至感觉滤波器107以使感觉滤波器107输出一个目标矢量X。如图1所示,将STP参数输入滤波器107中以改变其与这些参数相关的传输函数。实质上,X=R′-p,其中p表示包含由以前的激励信号引起的“振铃”的长期预测(LTP)的贡献。适用于Δ的MSE判据现在能用下述的矩阵符号表述: 其中M为由如下的h(n)响应形成的一个L×L下三角托普利兹(Toeplitz)矩阵。h(0)项位于矩阵的对角线,h(1)、h(2)……h(L-1)位于相应较低的对角线。
由图1中的滤波器108来完成逆向滤波步骤。设上式对增益g的微分等于0,就可得到如下的最佳增益: 取g为这一值,最小值就变为: 目的是寻找一个特定的标引k,使得到最小值。注意由于‖X‖2为一固定的数值。因而可以通过使下述数值最大来寻找同一标引:
其中D=(XH)且α2 k=‖AkHT‖2
在逆向滤波器108中计算经逆向滤波的目标矢量D=(XH)。把此运算称为术语“逆向滤波”是因为将(XH)解释为时间反演X的滤波。
只在所述美国专利申请号为No.07/927;528的母专利的图1中增加了一个幅度选择器112。幅度选择器112的功能是通过最佳控制器109将待搜索的码矢量Ak限制在最可能的码矢量Ak的范围内从而减小码矢量搜索的复杂性。如前面的描叙所述。每一个码矢量Ak是一个脉冲幅度/位置组合波形。它定义了L个不同的位置p,并包括分配给该组合中各个位置p=1,2,…,L的零幅脉冲和非零幅脉冲,其中每一个非零幅脉冲具有q种不同的可能幅度中的至少一种幅度。
现在参照图3a、3b和3c,幅度选择器112的作用是预先建立码矢量波形的位置p和各脉冲幅度的q种可能值之间的函数关系Sp。在码本搜索之前与语音信号相关联推导出预先建立的函数关系Sp。具体而言,这一函数的预先建立过程包括与语音信号相关地,给波形的每一个位置p预先分配q种可能幅度中的至少一种幅度(图3a中的步骤301)。
为给波形的每一个位置p预先分配q种可能幅度中的一种,响应于经逆向滤波的目标矢量D和已去除音调的残留矢量R′来计算幅度预估矢量B。具体而言,通过对归一化形式的经逆向滤波的目标矢量D: 和归一化形式的已去除音调的残留矢量R′ 求和来计算幅度预估矢量B(图3b中的子步骤301-1)从而得到如下形式的幅度预估矢量B: 其中β是一个固定常数,其典型值为1/2(β值根据在代数码本中采用的非零幅脉冲的百分比在0和1之间选择)。
对波形的每一个位置p来说,通过量化矢量B的相应的幅度预估值Bp来获取要预先分配给该位置p的幅度Sp。具体而言,对波形的每一个位置p,采用下述表达式来量化矢量B的经峰值归一化的幅度预估值Bp(图3b中的子步骤301-2): 其中Q(.)为量化函数而且 是一个归一化因子,表示非零幅脉冲的峰值幅度。
在下述重要的特殊情形中:
-q=2,即脉冲幅度只能取两个值(即Spi=±1);以及
-非零幅脉冲密度N/L小于等于15%
β值可以等于零;因而幅度预估矢量B就简化为只与经逆向滤波的目标矢量D有关,结果为sP=sign(Dp)。
最佳控制器119的作用是从代数码本中选择出最佳码矢量Ak。选择判据以定额(ration)的形式给出,对每一个码矢量Ak计算其定额,并从所有码矢量中寻找最大值(步骤303):
其中D=(XH)且α2 k=‖AkHT‖2
由于Ak是一个代数码矢量,它具有N个非零幅脉冲,且各个脉冲的幅度分别为Spi,因而分子为下式的平方: 且分母为能够表示为如下形式的一个能量项: 其中U(pi,pj)是与两个单位幅度脉冲有关的相关量,一个脉冲位于位置pi,另一个脉冲位于位置pj。在滤波器响应特性计算器105中根据上式计算该矩阵。该矩阵被包括在图1的方框图中称FRC的一组参数中。
一种用于计算这一分母的快速方法包含如图4所示的N层嵌套循环。在图4中用对齐符号S(i)和SS(i,j)分别代替参数“Spi”和“SpiSpj”。分母α2 k的计算是最费时的过程。对α2 k有贡献的在每一个循环中完成的计算可以用如下形式写在从最外层循环至最内层循环的不同线上: 其中pi是第i个非零幅脉冲的位置。值得注意的是图4中的N层嵌套循环能够根据N交织单脉冲置换码来约束码矢量Ak的非零幅脉冲。
在本发明中,通过将待搜索的码矢量Ak的子集限制为其N个非零幅脉冲满足在图3a的步骤301中预先建立的函数关系的码矢量,可以显著减小搜索的复杂程度。当码矢量Ak的N个非零幅脉冲中的每一个都具有与预先分配给处于位置p的非零幅脉冲的幅度相等的幅度时,预先建立的函数关系就得到了满足。
所述码矢量子集的限制过程通过首先将预先建立的函数Sp与矩阵元U(i,j)相结合(图3a中的步骤302)。然后采用假定为固定位置,极性为正、具有单位幅度的所有脉冲S(i)进行N层嵌套循环(步骤303)。因而,即使代数码本中的非零幅脉冲的幅度可以取q种可能值中的任意一种,也可以将搜索的复杂程度减小至固定脉冲幅度的情形。更准确地说,根据下述关系式将由滤波器响应特性计算器105提供的矩阵U(i,j)与预先建立的函数相组合(步骤302):
U′(i,j)=SiSjU(i,j)其中Si来源于幅度选择器102的选择方法,即Si为在对相应的幅度预估值量化之后给每个位置i所选择的幅度。
采用这个新的矩阵,该快速算法的每一循环中的计算可以如下形式写在从最外层至内层循环的不同线上:
α2 k=U′(p1,p1)
+U′(p2,p2)+2U′(p1,p2)
+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)
…………
+U′(pN,pN)+2U′(p1,pN)+2U′(p2,p1)+…+2U′(pN-1,pN)其中px为波形中第X个非零幅脉冲的位置,U′(px,py)为取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
为了更进一步减小搜索的复杂性,只要下述不等式成立,就可以跳过最内层循环(参照图3c)。而且跳过最内层循环只是个特例,而不是仅仅只指最内层循环: 其中Spn是预先分配给位置pn的幅度,Dpn是目标矢量D的第pn个分量,TD是与经逆向滤波的目标矢量D有关的一个阈值。
全局的信号激励信号E+gCk由加法器120(图1)根据来自控制器109的信号gCk和来自预测器106的输出E来计算。由具有随STP参数变化的传输函数1/A(Zγ-1)的感觉滤波器构成的初始状态提供模块110,从残留信号R中减去信号激励信号E+gCk,以获取最终滤波器状态FS,供滤波器107和音调提取器104作为初始状态使用。
四种参数k,g,LTP和STP的集合通过多路复用器111转换为合适的数字信道格式,从而完成对语音信号的样值块S的编码过程。
尽管上面已经参照优选实施例对本发明进行了描述,在不偏离本发明的精神和实质的情形下,在后附的权利要求所声明的范围之内,还可以对这些实施例进行修改。
Claims (33)
1.一种对码本进行搜索以对声音信号编码的方法,所述码本由一个脉冲组合的集合组成,每个脉冲组合定义了多个不同的位置并且包括分配给该组合中各个位置的脉冲,所述方法包括以下步骤:
从所述码本中预选一个与所述声音信号有关的脉冲组合子集;以及
仅搜索所述脉冲组合子集以对声音信号编码;
由于仅搜索所述码本的一个脉冲组合子集,因而在操作中搜索的复杂程度就得以减小。
2.一种对码本进行搜索以对声音信号编码的方法,所述码本由一个脉冲幅度/位置组合的集合组成,每一个脉冲幅度/位置组合定义了L个不同的位置并且包括分配给该组合中的各个位置p=1,2,…,L的零幅脉冲和非零幅脉冲组合,每一个非零幅脉冲具有q种可能幅度中的至少一种幅度,所述方法包括以下步骤:
从所述码本中预选一个与所述声音信号有关的脉冲幅度/位置组合子集;以及
仅搜索所述脉冲幅度/位置组合子集以对声音信号编码;
由于仅搜索所述码本中的一个脉冲幅度/位置组合子集,因而在操作中搜索的复杂程度就得以减小。
3.如权利要求2所述的方法,其中:
所述预选步骤包括与所述声音信号相关预先建立所述各个位置p=1,2,…,L和q种的幅度之间的函数Sp;以及
所述搜索步骤包括仅搜索所述码本中的具有满足预先建立的函数的非零幅脉冲的脉冲幅度/位置组合。
4.如权利要求3所述的方法,其中所述函数的预先建立步骤包括与所述声音信号相关给每一位置p预先分配q种可能幅度中的一种幅度的步骤,而且其中当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与预先分配给所述非零幅脉冲的位置p的幅度相等的幅度时,所述预先建立的函数即得到了满足。
5.如权利要求4所述的方法,其中给每一位置p预先分配q种可能幅度中的一种幅度的步骤包括以下步骤:
对所述声音信号进行处理以产生一个经逆向滤波的目标信号D和一个去除音调的残留信号R′;
根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B;以及
对所述的每一个位置p,量化所述矢量B的幅度预估值Bp以获取准备为所述位置p选择的幅度。
6.如权利要求5所述的方法,其中计算幅度预估矢量B的步骤包括以下步骤:对归一化形式的经逆向滤波的目标信号D: 和归一化形式的已去除音调的残留信号R′: 求和以获取如下形式的幅度预估矢量B: 其中β为一固定常数。
7.如权利要求6所述的方法,其中的β是一个其值位于0和1之间的固定常数。
8.如权利要求5所述的方法,其中对所述的每一位置p的量化步骤包括采用下述表达式对所述矢量B的经峰值归一化的幅度预估值Bp进行量化; 其中分母 为归一化因子,表示所述非零幅脉冲的峰值幅度。
9.如权利要求1所述的方法,其中所述的每一个脉冲组合都包括N个非零幅脉冲,所述的方法还包括用至少一个N交织的单脉冲置换码来约束所述非零幅脉冲的位置p的步骤。
10.如权利要求5所述的方法,其中所述的每一个脉冲幅度/位置组合都包含N个非零幅脉冲,而且其中的所述搜索步骤包括对根据下述关系式通过N层嵌套循环的方法计算的分母为α2 k的给定比率进行最大化的步骤:
α2 k=U′(p1,p1)
+U′(p2,p2)+2U′(p1,p2)
+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)
…………
+U′(pN,pN)+2U′(p1,pN)+2U′(p2,pN)+…+2U′(pN-1,pN)其中每一循环中的计算写在从N层嵌套循环的最外层循环至最内层循环的不同线上,pn是所述组合中第n个非零幅脉冲的位置,U′(px,py)是取决于预先分配给位置p中间的某一位置px的幅度Spx和预先分配给位置p中间的某一位置py的幅度Spy的一个函数。
11.如权利要求10所述的方法,其中对所述给定比率的最大化步骤包括当下述不等式成立时至少跳过N层嵌套循环的最内层循环的步骤: 其中Spn是预先分配给位置pn的幅度,Dpn是目标矢量D的第pn个分量,TD是与经逆向滤波的目标矢量D有关的一个阈值。
12.一种对码本进行搜索以对声音信号编码的装置,所述码本由一个脉冲组合的集合组成,每个脉冲组合定义了多个不同的位置并且包括分配给该组合中各个位置的脉冲,所述装置包含:
用于从所述码本中预选出一个与所述声音信号有关的脉冲组合子集的装置;以及
用于仅搜索所述脉冲组合子集以对声音信号编码的装置;
由于仅搜索码本中的一个脉冲组合子集,因而在操作中搜索的复杂程度就得以减小。
13.一种对码本进行搜索以对声音信号编码的装置,所述码本由一个脉冲幅度/位置组合的集合组成,每个脉冲幅度/位置组合定义了L个不同的位置并且包括分配给该组合中各个位置p=1,2,…,L的零幅脉冲和非零幅脉冲,每个非零幅脉冲具有q种可能幅度中的至少一种幅度,所述装置包括:
用于从所述码本中预选出一个与所述声音信号有关的脉冲幅度/位置组合子集的装置;以及
用于仅搜索所述脉冲幅度/位置组合子集以对声音信号编码的装置;
由于仅搜索码本中的一个脉冲幅度/位置组合子集,因而在操作中搜索的复杂程度就得以减小。
14.如权利要求13所述的装置,其中:
所述预选装置包括用于根据所述声音信号预先建立各个位置p=1,2,…,L和q种可能幅度之间的函数Sp的装置;以及
所述搜索装置包括用于将搜索限制在所述码本中具有满足所述预先建立的函数的非零幅脉冲的脉冲幅度/位置组合的范围内。
15.如权利要求14所述的装置,其中的函数预先建立装置包括用于与所述声音信号相关给每个位置p预先分配q种可能幅度中的一种幅度的装置,并且其中当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与预先分配给所述非零幅脉冲所处的位置p的幅度Sp相等的幅度时,该预先建立的函数即得到了满足。
16.如权利要求15所述的装置,其中用于给每个位置p预先分配q种可能幅度中的一种幅度的装置包括:
用于对所述声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′的装置;
用于根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B的装置;以及
用于对所述矢量B的每个位置p的幅度预估值Bp进行量化以获取要为所述位置p选择的幅度的装置。
17.如权利要求16所述的装置,其中用于计算幅度预估矢量B的所述装置包括用于对归一化形式的经逆向滤波的目标信号D: 和归一化形式的已去除音调的残留信号R′: 求和以获取如下形式的幅度预估矢量B的装置: 其中β为一固定常数。
18.如权利要求17所述的装置,其中β是一个其值位于0和1之间的固定常数。
19如权利要求16所述的装置,其中的所述量化装置包括用于采用下述表达式对所述矢量B的所述每个位置p的经峰值归一化的幅度预估值Bp进行量化的装置:
其中分母 是一个归一化因子,表示所述非零幅脉冲的峰值幅度。
20.如权利要求12所述的装置,其中所述的每一个脉冲组合都包含N个非零幅脉冲,所述的装置还包括根据至少一种N交织单脉冲置换码来约束所述非零幅脉冲的位置的装置。
21.如权利要求16所述的装置,其中所述的每一个脉冲幅度/位置组合都包含N个非零幅脉冲,并且所述搜索装置包括用于对分母为α2 k的给定比率进行最大化处理的装置和用于根据下述关系式通过N层嵌套循环的方法计算所述分母α2 k的装置:
α2 k=U′(p1,p1)
+U′(p2,p2)+2U′(p1,p2)
+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)
…………
+U′(pN,pN)+2U′(p1,pN)+2U′(p2,pN)+…+2U′(pN-1,pN)其中每一循环中的计算都写在从N层嵌套循环的最外层循环至最内层循环的不同线上,pn是所述组合中第n个非零幅脉冲的位置,并且其中U′(px,py)是取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
22.如权利要求21所述的装置,其中用于计算分母α2 k的所述装置包括用于每当下述不等式成立时至少跳过N层嵌套循环的最内层循环的装置: 其中Spn是预先分配给位置pn的幅度,Dpn是目标矢量D的第pn个分量,TD是与所述经逆向滤波的目标矢量D有关的一个阈值。
23.一种用于服务于一个被划分成多个小区的大的地理区域的蜂窝通信系统,包括:
移动的便携式发射机/接收机单元;
分别位于所述各个小区内的蜂窝基站;
用于控制所述各蜂窝基站之间的通信的装置;
位于一个小区内的每个移动单元和所述一个小区内的蜂窝基站之间的一种双向无线通信子系统,所述双向无线通信子系统包括在所述移动单元和所述蜂窝基站内都具有的(a)发射机,该发射机包括用于对语音信号进行编码的装置和用于发送编码语音信号的装置,和(b)接收机,该接收机包括用于接收编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置;其中所述语音信号编码装置包括一用于对一个码本进行搜索以对语音信号编码的装置,所述码本由一个脉冲组合的集合组成,每个脉冲组合定义了多个不同的位置并且包括分配给该组合中各个位置的脉冲,所述搜索执行装置包括:
用于从所述码本中预选一个与所述语音信号有关的脉冲组合子集;以及
用于仅搜索所述脉冲组合子集以对所述语音信号编码的装置;
由于仅搜索码本中的一个脉冲组合子集,因而在操作中的搜索复杂程度就得以减小了。
24.一种用于服务于一个被划分成多个小区的大的地理区域的蜂窝通信系统,包括:
移动的便携式发射机/接收机单元;
分别位于各个小区内的蜂窝基站;
用于控制所述各蜂窝基站之间的通信的装置;
位于一个小区内的每个移动单元和所述一个小区的蜂窝基站之间的一种双向无线通信子系统,所述双向无线通信子系统包括在所述移动单元和所述蜂窝基站内都具有的(a)发射机,该发射机包括用于对语音信号进行编码的装置和用于发送该编码语音信号的装置;和(b)接收机,该接收机包括用于接收编码语音信号的装置和用于对接收的编码语音信号进行解码的装置,
其中所述的语音信号编码装置包含一用于对一个码本进行搜索以对语音信号编码的装置,所述码本由一个脉冲幅度/位置组合的集合组成,每一个脉冲幅度/位置组合定义了L个不同的位置并且包括分配给该组合中各个位置p=1,2,…,L的零幅脉冲和非零幅脉冲,每个非零幅脉冲具有q种可能幅度中的至少一种幅度,所述搜索执行装置包括:
用于从所述码本中预选出一个与所述语音信号有关的一个脉冲幅度/位置组合的装置;以及
用于仅搜索所述脉冲幅度/位置组合子集以对语音信号编码的装置;
由于仅搜索码本中一个脉冲幅度/位置组合子集,因而在操作中搜索的复杂程度就得以减小。
25.如权利要求24所述的系统,其中:
所述预选装置包括用于与所述语音信号相关预先建立各个位置p=1,2,…,L和q种可能幅度之间的函数Sp的装置;以及
所述搜索装置包括用于将搜索限制在所述码本中具有满足预先建立的函数的非零幅脉冲的脉冲幅度/位置组合的范围内的装置。
26.如权利要求25所述的系统,其中的函数预先建立装置包括用于与所述语音信号相关给每个位置p预先分配q种可能幅度中的一种幅度的装置,而且当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与预先分配给所述非零幅脉冲所处位置p的幅度Sp相等的幅度时,该预先建立的函数即得到了满足。
27.如权利要求26所述的系统,其中所述用于给每一位置p预先分配q种可能幅度中的一种幅度的装置包括:
用于对所述语音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′的装置;
用于根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B的装置;以及
用于对所述矢量B的所述每个位置p的幅度预估值Bp进行量化以获取要为所述位置p选择的幅度的装置。
28.如权利要求27所述的系统,其中用于计算幅度预估矢量B的所述装置包括用于对归一化形式的经逆向滤波的目标信号D: 和归一化形式的残留信号R′: 求和以获取如下形式的幅度预估矢量B的装置: 其中β是一个固定常数。
29.如权利要求28所述的系统,其中的β是一个其值位于0和1之间的固定常数。
30.如权利要求27所述的系统,其中的所述量化装置包括用于采用下述表达式对所述矢量B的所述每个位置p的经峰值归一化的幅度预估值Bp进行量化的装置: 其中分母 是一个归一化因子,表示所述各非零幅脉冲的峰值幅度。
31.如权利要求23所述的系统,其中的所述每个脉冲组合都包括N个非零幅脉冲,所述装置还包括用于用至少一个N交织单脉冲置换码来约束所述非零幅脉冲的位置p的装置。
32.如权利要求27所述的系统,其中的所述每个脉冲幅度/位置组合都包括N个非零幅脉冲,其中所述搜索装置包括用于对分母为α2 k的给定比率进行最大化处理的装置和用于根据下述关系式通过N层嵌套循环的方法计算所述分母α2 k的装置:
α2 k=U′(p1,p1)
+U′(p2,p2)+2U′(p1,p2)
+U′(p3,p3)+2U′(p1,p3)+2U′(p2,p3)
+U′(pN,pN)+2U′(p1,pN)+2U′(p2,pN)+…+2U′(pN-1,pN)其中每个循环中的计算都写在从N层嵌套循环的最外层循环至最内层循环的不同线上,pn为该组合中第n个非零幅脉冲的位置,U′(px,py)是取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
33.如权利要求32所述的系统,其中用于计算分母α2 k的所述装置包括用于当下述不等式成立时至少跳过最内层循环的装置: 其中Spn是预先分配给位置pn的幅度,Dpn是目标矢量D的第pn个分量,TD是与所述经逆向滤波的目标矢量D有关的一个阈值。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38396895A | 1995-02-06 | 1995-02-06 | |
US08/383,968 | 1995-02-06 | ||
US08/508,801 | 1995-07-28 | ||
US08/508,801 US5754976A (en) | 1990-02-23 | 1995-07-28 | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB021079072A Division CN1220178C (zh) | 1995-02-06 | 2002-03-21 | 在码本中进行搜索以对声音信号编码的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1181150A true CN1181150A (zh) | 1998-05-06 |
CN1198262C CN1198262C (zh) | 2005-04-20 |
Family
ID=27010408
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB961930950A Expired - Lifetime CN1198262C (zh) | 1995-02-06 | 1996-02-02 | 在代数码本中进行搜索以对声音信号编码的方法和装置 |
CNB021079072A Expired - Lifetime CN1220178C (zh) | 1995-02-06 | 2002-03-21 | 在码本中进行搜索以对声音信号编码的方法和设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB021079072A Expired - Lifetime CN1220178C (zh) | 1995-02-06 | 2002-03-21 | 在码本中进行搜索以对声音信号编码的方法和设备 |
Country Status (26)
Country | Link |
---|---|
US (1) | US5754976A (zh) |
EP (2) | EP0808496B1 (zh) |
JP (2) | JP3430175B2 (zh) |
KR (2) | KR100388751B1 (zh) |
CN (2) | CN1198262C (zh) |
AR (1) | AR000871A1 (zh) |
AT (2) | ATE248423T1 (zh) |
AU (1) | AU708392C (zh) |
BR (1) | BR9607026A (zh) |
CA (1) | CA2210765C (zh) |
DE (1) | DE19604273C5 (zh) |
DK (2) | DK0808496T3 (zh) |
ES (1) | ES2112807B1 (zh) |
FI (2) | FI117994B (zh) |
FR (1) | FR2730336B1 (zh) |
GB (1) | GB2297671B (zh) |
HK (2) | HK1002492A1 (zh) |
IN (1) | IN187453B (zh) |
IT (1) | IT1305724B1 (zh) |
MX (1) | MX9705997A (zh) |
MY (2) | MY119038A (zh) |
NO (1) | NO318595B1 (zh) |
PT (1) | PT1225568E (zh) |
RU (1) | RU2142166C1 (zh) |
SE (1) | SE520553C2 (zh) |
WO (1) | WO1996024925A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100416652C (zh) * | 2005-10-31 | 2008-09-03 | 连展科技(天津)有限公司 | 增强的amr编码器快速固定码本搜索方法 |
CN101286321B (zh) * | 2006-12-26 | 2013-01-09 | 华为技术有限公司 | 双脉冲激励的线性测编码 |
US9336790B2 (en) | 2006-12-26 | 2016-05-10 | Huawei Technologies Co., Ltd | Packet loss concealment for speech coding |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE508788C2 (sv) * | 1995-04-12 | 1998-11-02 | Ericsson Telefon Ab L M | Förfarande att bestämma positionerna inom en talram för excitationspulser |
US5822724A (en) * | 1995-06-14 | 1998-10-13 | Nahumi; Dror | Optimized pulse location in codebook searching techniques for speech processing |
US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
TW317051B (zh) * | 1996-02-15 | 1997-10-01 | Philips Electronics Nv | |
CA2283187A1 (en) * | 1997-03-12 | 1998-09-17 | Mitsubishi Denki Kabushiki Kaisha | A method and apparatus for speech encoding, speech decoding, and speech coding/decoding |
FI114248B (fi) * | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
US7092885B1 (en) * | 1997-12-24 | 2006-08-15 | Mitsubishi Denki Kabushiki Kaisha | Sound encoding method and sound decoding method, and sound encoding device and sound decoding device |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
FI113571B (fi) | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
JP3180762B2 (ja) * | 1998-05-11 | 2001-06-25 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
US6714907B2 (en) * | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
KR100409167B1 (ko) * | 1998-09-11 | 2003-12-12 | 모토로라 인코포레이티드 | 정보 신호를 부호화하는 방법 및 장치 |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
JP4173940B2 (ja) * | 1999-03-05 | 2008-10-29 | 松下電器産業株式会社 | 音声符号化装置及び音声符号化方法 |
US6295520B1 (en) | 1999-03-15 | 2001-09-25 | Tritech Microelectronics Ltd. | Multi-pulse synthesis simplification in analysis-by-synthesis coders |
JP2001075600A (ja) * | 1999-09-07 | 2001-03-23 | Mitsubishi Electric Corp | 音声符号化装置および音声復号化装置 |
US7272553B1 (en) * | 1999-09-08 | 2007-09-18 | 8X8, Inc. | Varying pulse amplitude multi-pulse analysis speech processor and method |
EP1221694B1 (en) * | 1999-09-14 | 2006-07-19 | Fujitsu Limited | Voice encoder/decoder |
CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
KR100576024B1 (ko) * | 2000-04-12 | 2006-05-02 | 삼성전자주식회사 | 에이켈프 음성 압축기의 코드북 검색 장치 및 방법 |
US6728669B1 (en) * | 2000-08-07 | 2004-04-27 | Lucent Technologies Inc. | Relative pulse position in celp vocoding |
US7363219B2 (en) * | 2000-09-22 | 2008-04-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
KR100438175B1 (ko) * | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
US7236928B2 (en) * | 2001-12-19 | 2007-06-26 | Ntt Docomo, Inc. | Joint optimization of speech excitation and filter parameters |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP2003255976A (ja) * | 2002-02-28 | 2003-09-10 | Nec Corp | 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法 |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
US7054807B2 (en) * | 2002-11-08 | 2006-05-30 | Motorola, Inc. | Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters |
KR100503414B1 (ko) * | 2002-11-14 | 2005-07-22 | 한국전자통신연구원 | 고정 코드북의 집중 검색 방법 및 장치 |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
US8352254B2 (en) * | 2005-12-09 | 2013-01-08 | Panasonic Corporation | Fixed code book search device and fixed code book search method |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
JP3981399B1 (ja) * | 2006-03-10 | 2007-09-26 | 松下電器産業株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
ES2529292T3 (es) | 2007-04-29 | 2015-02-18 | Huawei Technologies Co., Ltd. | Método de codificación y de decodificación |
CN100530357C (zh) * | 2007-07-11 | 2009-08-19 | 华为技术有限公司 | 固定码书搜索方法及搜索器 |
CN101842833B (zh) * | 2007-09-11 | 2012-07-18 | 沃伊斯亚吉公司 | 语音和音频编码中快速代数码本搜索的方法和设备 |
CN100578619C (zh) * | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
EP2227806A4 (en) * | 2007-12-21 | 2013-08-07 | Nvoq Inc | DISTRIBUTED DICTÉE / TRANSCRIPTION SYSTEM |
US7889103B2 (en) * | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
PL2242045T3 (pl) * | 2009-04-16 | 2013-02-28 | Univ Mons | Sposób kodowania i syntezy mowy |
CN101931414B (zh) * | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
US8280729B2 (en) * | 2010-01-22 | 2012-10-02 | Research In Motion Limited | System and method for encoding and decoding pulse indices |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
CN102623012B (zh) | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US8880404B2 (en) * | 2011-02-07 | 2014-11-04 | Qualcomm Incorporated | Devices for adaptively encoding and decoding a watermarked signal |
US9263053B2 (en) | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9070356B2 (en) | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
CN103456309B (zh) * | 2012-05-31 | 2016-04-20 | 展讯通信(上海)有限公司 | 语音编码器及其代数码表搜索方法和装置 |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US20140334564A1 (en) * | 2013-05-09 | 2014-11-13 | Samsung Electronics Co., Ltd | Method and system for providing low-complexity hybrid precoding in wireless communication systems |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4401855A (en) * | 1980-11-28 | 1983-08-30 | The Regents Of The University Of California | Apparatus for the linear predictive coding of human speech |
CA1164569A (en) * | 1981-03-17 | 1984-03-27 | Katsunobu Fushikida | System for extraction of pole/zero parameter values |
WO1983003917A1 (en) * | 1982-04-29 | 1983-11-10 | Massachusetts Institute Of Technology | Voice encoder and synthesizer |
US4625286A (en) * | 1982-05-03 | 1986-11-25 | Texas Instruments Incorporated | Time encoding of LPC roots |
US4520499A (en) * | 1982-06-25 | 1985-05-28 | Milton Bradley Company | Combination speech synthesis and recognition apparatus |
JPS5922165A (ja) * | 1982-07-28 | 1984-02-04 | Nippon Telegr & Teleph Corp <Ntt> | アドレス制御回路 |
EP0111612B1 (fr) * | 1982-11-26 | 1987-06-24 | International Business Machines Corporation | Procédé et dispositif de codage d'un signal vocal |
US4764963A (en) * | 1983-04-12 | 1988-08-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech pattern compression arrangement utilizing speech event identification |
US4667340A (en) * | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
DE3335358A1 (de) * | 1983-09-29 | 1985-04-11 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung |
US4799261A (en) * | 1983-11-03 | 1989-01-17 | Texas Instruments Incorporated | Low data rate speech encoding employing syllable duration patterns |
CA1236922A (en) * | 1983-11-30 | 1988-05-17 | Paul Mermelstein | Method and apparatus for coding digital signals |
CA1223365A (en) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Method and apparatus for speech coding |
US4724535A (en) * | 1984-04-17 | 1988-02-09 | Nec Corporation | Low bit-rate pattern coding with recursive orthogonal decision of parameters |
US4680797A (en) * | 1984-06-26 | 1987-07-14 | The United States Of America As Represented By The Secretary Of The Air Force | Secure digital speech communication |
US4742550A (en) * | 1984-09-17 | 1988-05-03 | Motorola, Inc. | 4800 BPS interoperable relp system |
CA1252568A (en) * | 1984-12-24 | 1989-04-11 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
US4858115A (en) * | 1985-07-31 | 1989-08-15 | Unisys Corporation | Loop control mechanism for scientific processor |
IT1184023B (it) * | 1985-12-17 | 1987-10-22 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4873723A (en) * | 1986-09-18 | 1989-10-10 | Nec Corporation | Method and apparatus for multi-pulse speech coding |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
US4815134A (en) * | 1987-09-08 | 1989-03-21 | Texas Instruments Incorporated | Very low rate speech encoder and decoder |
IL84902A (en) * | 1987-12-21 | 1991-12-15 | D S P Group Israel Ltd | Digital autocorrelation system for detecting speech in noisy audio signal |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
CA1321646C (en) * | 1988-05-20 | 1993-08-24 | Eisuke Hanada | Coded speech communication system having code books for synthesizing small-amplitude components |
US5008965A (en) * | 1988-07-11 | 1991-04-23 | Kinetic Concepts, Inc. | Fluidized bead bed |
IT1232084B (it) * | 1989-05-03 | 1992-01-23 | Cselt Centro Studi Lab Telecom | Sistema di codifica per segnali audio a banda allargata |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
US5097508A (en) * | 1989-08-31 | 1992-03-17 | Codex Corporation | Digital speech coder having improved long term lag parameter determination |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5144671A (en) * | 1990-03-15 | 1992-09-01 | Gte Laboratories Incorporated | Method for reducing the search complexity in analysis-by-synthesis coding |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JP3089769B2 (ja) * | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
DE4315313C2 (de) * | 1993-05-07 | 2001-11-08 | Bosch Gmbh Robert | Vektorcodierverfahren insbesondere für Sprachsignale |
-
1995
- 1995-07-28 US US08/508,801 patent/US5754976A/en not_active Expired - Lifetime
-
1996
- 1996-01-27 MY MYPI96000300A patent/MY119038A/en unknown
- 1996-01-27 MY MYPI20021290A patent/MY130529A/en unknown
- 1996-02-02 PT PT02075797T patent/PT1225568E/pt unknown
- 1996-02-02 AT AT02075797T patent/ATE248423T1/de active
- 1996-02-02 BR BR9607026A patent/BR9607026A/pt not_active Application Discontinuation
- 1996-02-02 JP JP52385296A patent/JP3430175B2/ja not_active Expired - Lifetime
- 1996-02-02 KR KR1019970705372A patent/KR100388751B1/ko not_active IP Right Cessation
- 1996-02-02 WO PCT/CA1996/000069 patent/WO1996024925A1/en active IP Right Grant
- 1996-02-02 CA CA002210765A patent/CA2210765C/en not_active Expired - Lifetime
- 1996-02-02 RU RU97114804A patent/RU2142166C1/ru active
- 1996-02-02 CN CNB961930950A patent/CN1198262C/zh not_active Expired - Lifetime
- 1996-02-02 DK DK96900816T patent/DK0808496T3/da active
- 1996-02-02 AT AT96900816T patent/ATE230888T1/de active
- 1996-02-02 EP EP96900816A patent/EP0808496B1/en not_active Expired - Lifetime
- 1996-02-02 AU AU44796/96A patent/AU708392C/en not_active Expired
- 1996-02-02 IT IT1996UD000012A patent/IT1305724B1/it active
- 1996-02-02 EP EP02075797A patent/EP1225568B1/en not_active Expired - Lifetime
- 1996-02-02 DK DK02075797T patent/DK1225568T3/da active
- 1996-02-02 MX MX9705997A patent/MX9705997A/es unknown
- 1996-02-05 IN IN198CA1996 patent/IN187453B/en unknown
- 1996-02-05 AR ARP960101276A patent/AR000871A1/es unknown
- 1996-02-06 DE DE19604273A patent/DE19604273C5/de not_active Expired - Lifetime
- 1996-02-06 FR FR9601426A patent/FR2730336B1/fr not_active Expired - Lifetime
- 1996-02-06 GB GB9602391A patent/GB2297671B/en not_active Expired - Lifetime
- 1996-02-06 SE SE9600437A patent/SE520553C2/sv not_active IP Right Cessation
- 1996-08-15 ES ES09650025A patent/ES2112807B1/es not_active Expired - Fee Related
-
1997
- 1997-07-28 NO NO19973472A patent/NO318595B1/no not_active IP Right Cessation
- 1997-08-06 FI FI973241A patent/FI117994B/fi not_active IP Right Cessation
-
1998
- 1998-02-24 HK HK98101406A patent/HK1002492A1/xx not_active IP Right Cessation
-
2002
- 2002-02-18 FI FI20020320A patent/FI118396B/fi not_active IP Right Cessation
- 2002-03-21 CN CNB021079072A patent/CN1220178C/zh not_active Expired - Lifetime
- 2002-05-02 KR KR1020020024078A patent/KR100393910B1/ko not_active IP Right Cessation
-
2003
- 2003-03-26 JP JP2003085959A patent/JP4187556B2/ja not_active Expired - Lifetime
- 2003-10-13 HK HK03107310A patent/HK1055007A1/xx not_active IP Right Cessation
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100416652C (zh) * | 2005-10-31 | 2008-09-03 | 连展科技(天津)有限公司 | 增强的amr编码器快速固定码本搜索方法 |
CN101286321B (zh) * | 2006-12-26 | 2013-01-09 | 华为技术有限公司 | 双脉冲激励的线性测编码 |
US9336790B2 (en) | 2006-12-26 | 2016-05-10 | Huawei Technologies Co., Ltd | Packet loss concealment for speech coding |
US9767810B2 (en) | 2006-12-26 | 2017-09-19 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
US10083698B2 (en) | 2006-12-26 | 2018-09-25 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1198262C (zh) | 在代数码本中进行搜索以对声音信号编码的方法和装置 | |
CN1114900C (zh) | 快速语音编码的代数码书深度优先搜索方法 | |
CN1021938C (zh) | 控制代码激发信号编码器的方法和装置 | |
CN1150516C (zh) | 语音编码方法和语音编码器 | |
CN1244907C (zh) | 宽带语音编解码器中的高频增强层编码方法和装置 | |
CN1179324C (zh) | 改善串联声码器话音质量的方法与设备 | |
CN1199151C (zh) | 语音编码器 | |
CN1218295C (zh) | 语音解码中语音帧差错隐蔽的方法和系统 | |
CN1172292C (zh) | 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备 | |
CN1241170C (zh) | 语音编解码器中用于线频谱频率矢量量化的方法和系统 | |
RU2509379C2 (ru) | Устройство и способ квантования и обратного квантования lpc-фильтров в суперкадре | |
CN1692408A (zh) | 码分多址无线系统的可变比特率宽带语音编码中的有效带内半空白-突发序列信令及半速率最大操作的方法和装置 | |
CN1795495A (zh) | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 | |
CN1144179C (zh) | 声音信号解码方法和装置、声音信号编码方法和装置 | |
CN1820306A (zh) | 可变比特率宽带语音编码中增益量化的方法和装置 | |
CN1152776A (zh) | 复制语言信号、解码语音、合成语音的方法和装置 | |
CN1167048C (zh) | 语音编码设备和语音解码设备 | |
CN1910657A (zh) | 声频信号编码方法、声频信号解码方法、发送器、接收器和无线传声系统 | |
CN1167046C (zh) | 矢量编码方法及其利用该方法的编码器和解码器 | |
CN1435817A (zh) | 语音编码转换方法和装置 | |
CN1139912C (zh) | 码激励线性预测编码型语音编码装置 | |
CN1290077C (zh) | 用来对相位谱信息进行子抽样的方法和设备 | |
CN1293535C (zh) | 声音编码设备和方法以及声音解码设备和方法 | |
CN1218296C (zh) | 音调周期搜索范围设置装置 | |
CA2618002C (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20050420 |
|
EXPY | Termination of patent right or utility model |