CN1410970A - 用于语音快速编码的被选信号脉冲幅度的代数码本 - Google Patents

用于语音快速编码的被选信号脉冲幅度的代数码本 Download PDF

Info

Publication number
CN1410970A
CN1410970A CN02107907A CN02107907A CN1410970A CN 1410970 A CN1410970 A CN 1410970A CN 02107907 A CN02107907 A CN 02107907A CN 02107907 A CN02107907 A CN 02107907A CN 1410970 A CN1410970 A CN 1410970A
Authority
CN
China
Prior art keywords
pulse
amplitude
prime
cloth
advance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02107907A
Other languages
English (en)
Other versions
CN1220178C (zh
Inventor
让-皮埃尔·阿杜尔
克劳德·拉弗雷米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universite de Sherbrooke
Original Assignee
Universite de Sherbrooke
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27010408&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN1410970(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Universite de Sherbrooke filed Critical Universite de Sherbrooke
Publication of CN1410970A publication Critical patent/CN1410970A/zh
Application granted granted Critical
Publication of CN1220178C publication Critical patent/CN1220178C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本发明涉及对码本进行搜索以对声音信号进行编码的方法和设备。该码本由一个脉冲幅度/位置组合的集合组成,每个脉冲幅度/位置组合定义了L个不同的位置,并包括分配给该组合的各个位置的零幅脉冲和非零幅脉冲。每个非零幅脉冲有q种可能幅度。该方法从码本中预选脉冲幅度/位置组合的一个子集,并将该搜索限制在该子集内。预选该子集前预先建立幅度/位置函数。预先建立幅度/位置函数包括通过a)对声音信号进行处理以产生目标信号D和残留信号R′;b)根据目标信号D和残留信号R′计算幅度预估矢量B;以及c)对每一位置p,量化矢量B的幅度预估值Bp以得出为位置p选择的幅度,来给每个位置p预先分配q种可能幅度之一的步骤。

Description

用于语音快速编码的被选信号 脉冲幅度的代数码本
本申请是1996年2月2日提交的中国专利申请号为No.96193095.0,题为“用于语音快速编码的被选信号脉冲幅度的代数码本”的发明的分案申请。
                        发明背景
发明领域:
本发明涉及一种用于对声音信号尤其是语音信号(但不排除其他信号)进行数字编码的改进技术,以对这种声音信号进行传送和合成。
现有技术简介:
在诸如通过卫星、地面移动台、数字无线电或分组网络进行的声音传送、声音存储、声音响应和无线电话等许多应用领域,对具有良好的主观质量/比特率的折衷的高效数字语音编码技术的需求正日益增长。
目前具有良好的主观质量/比特率的折衷的最好的现有技术中有一种所谓的码激励线性预测编码(CELP)技术。按照这一技术,语音信号以含L个样值的数据块(即矢量)的形式被采样和处理,其中L是某个预先设定的数值。CELP技术采用一码本(code book)。
在CELP技术中的码本是被称为L维码矢量(定义L个不同位置的脉冲组合,并且包括分配给组合中各个位置p=1,2......,L的零幅脉冲和非零幅脉冲)的长为L个样值的序列的一个附标集合。该码本包括一个从1至M变化的标引K,其中M表示码本的大小,有时表示为比特数b:
                        M=2b
一个码本可以被贮存在物理存储器(如查寻表)中,或者指的是将标引与相应码矢量联系起来的一种机理(例如一个公式)。
为按照CELP技术合成语音,通过模拟语音信号的频谱特性的时变滤波器从码本中筛选出适当的码矢量来合成每一块语音样值。在编码器端,对来自码本的所有候选码矢量或候选码矢量的一个子集计算合成的输出信号(码本搜索)。得以保留的码矢量为根据感觉加权失真方法,产生的合成输出信号最接近于原始语音信号的那个码矢量。
一种类型的码本为所谓的“随机”码本。这些码本的一个缺点是它们经常需要相当大的物理存储空间。从标引到相关的码矢量的路径涉及到查寻表,这些查寻表是随机产生的数字或者对大量的语音训练集合应用统计技术的结果。从这个意义来讲,这些码本是随机的,即无规则的。随机码本的容量容易受到存储空间和/或搜索复杂程度的限制。
另一种类型的码本为代数码本。与随机码本相比,代数码本不是随机的且不需要存储空间。一个代数码本是一个附标码矢量的集合,其中第K个码矢量的各脉冲的幅度和位置可通过一种不需要或只需要极少的物理存储空间的规则来根据其标引K推导出来。因而,代数码本的容量不受存储需求的限制。代数码本也能设计用于高效搜索。
                      本发明的目的
本发明的一个目的是提供一种能显著减少对声音信号进行编码时的码本检索复杂程度的方法和装置。这些方法和装置适用于一大类码本。
                      本发明的内容
具体而言,本发明提供了一种在码本中进行搜索以对声音信号编码的方法。该码本由一个脉冲幅度/位置组合的集合组成,每个脉冲幅度/位置组合定义了L个不同的位置p,并包括分配给该组合中各个位置p=1,2,...,L的零幅脉冲和非零幅脉冲。每一非零幅脉冲采用(assume)q种可能的幅度之一。该码本搜索实施方法包括:从码本中预选与该声音信号有关的脉冲幅度/位置组合的一个子集的步骤;以及仅搜索脉冲幅度/位置组合的该子集以对声音信号编码,从而由于仅搜索码本中脉冲幅度/位置组合的一个子集,而降低搜索复杂度的步骤。预选脉冲幅度/位置组合的一个子集步骤包括与该声音信号相关地在位置p=1,2,...,L和q种可能幅度之间预先建立一个幅度/位置函数。预先建立一个幅度/位置函数步骤包括给每个位置p预先分配q种可能幅度之一作为有效幅度。给每个位置p预先分配q种可能幅度之一的步骤包括:a)对声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′;b)响应经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B;以及c)对每一位置p,量化矢量B的幅度预估值Bp以得出准备给该位置p选取的幅度。最后,搜索脉冲幅度/位置组合的一个子集的步骤包括将该搜索限制在对码本中具有满足该预先建立的函数的非零幅脉冲的脉冲幅度/位置组合。
本发明还涉及一种用于在码本中进行搜索以对声音信号编码的设备。该码本包含脉冲幅度/位置组合的一个集合,每个脉冲幅度/位置组合定义了L个不同的位置,并包括分配给该组合中的各个位置p=1,2,...L的零幅脉冲和非零幅脉冲。每一非零幅脉冲取q种可能幅度之一。该码本搜索实施装置包括:用于从码本中预选出与声音信号有关的脉冲幅度/位置组合的一个子集的装置;以及用于仅搜索脉冲幅度/位置组合的该子集以对声音信号编码,从而由于仅搜索码本中的脉冲幅度/位置组合的一个子集,而降低搜索复杂度的装置。该预选装置包括用于与该声音信号有关地、在位置p=1,2,...,L和q种可能幅度之间预先建立一个幅度/位置函数的装置,并且该预先建立装置包括给每个位置p预先分配q种可能幅度之一作为有效幅度的装置。给每个位置p预先分配q种可能幅度之一的装置包括:a)用于对声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′的装置;b)用于响应经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B的装置;以及c)用于对每一位置p,量化矢量B的幅度预估值Bp以得出准备给该位置p选取的幅度的装置。最后,该搜索装置包括用于将搜索限制在对码本中具有满足该预先建立的函数的非零幅脉冲的脉冲幅度/位置组合的装置。
当一个脉冲幅度/位置组合中的每一个非零幅脉冲都具有与由预先建立的函数预先分配给所述非零幅脉冲的位置p的幅度相等的幅度时,该预先建立的函数得以满足是非常具有好处的。
按照一个优选实施例,幅度预估矢量B可以通过将归一化形式的经逆向滤波的目标信号D: ( 1 - β ) D | | D | | 加到归一化形式的已去除音调的残留信号R′: β R ′ | | R ′ | | 从而得到如下形式的幅度预估矢量B: B = ( 1 - β ) D | | D | | + β R ′ | | R ′ | | 来进行计算,其中β是一个固定常数,其值位于0和1之间。
按照另一优选实施例,通过对每个位置p,采用下述表达式 B p / max n | B n | 对矢量B的已经峰值归一化的幅度预估值Bp进行量化来量化该幅度矢量预估,其中分母 max n | B n | 是一个归一化因子,表示非零幅脉冲的峰值幅度。
按照第三优选实施例,该方法还包括根据一组脉冲位置的轨迹来限制码本的组合的非零幅脉冲的位置p的步骤。每个轨迹的脉冲位置与其他轨迹的脉冲位置相互交织。该脉冲组合中的每一个都包括N个非零幅脉冲,该组轨迹包括N个分别与N个非零幅脉冲关联的脉冲位置的轨迹,并且每一个非零幅脉冲的脉冲位置限制于所关联的轨迹位置。
按照第四优选实施例:
-每一个脉冲幅度/位置组合包括N个非零幅脉冲;
-通过使具有分母为α2 k的一个给定比值最大化搜索脉冲幅度/位置组合的该子集,α2 k通过N层嵌套循环根据下述关系式来计算: α k 2 = U ′ ( p 1 , p 1 ) + U ′ ( p 2 , p 2 ) + 2 U ′ ( p 1 , p 2 ) + U ′ ( p 3 , p 3 ) + 2 U ′ ( p 1 , p 3 ) + 2 U ′ ( p 2 , p 3 ) ...   ...   ...   ... + U ′ ( p N , p N ) + 2 U ′ ( p 1 , p N ) + 2 U ′ ( p 2 , p N ) + . . . + 2 U ′ ( p N - 1 , p N ) 其中每一循环的计算内容写在从N层嵌套循环的最外层循环至最内层循环的不同线上,pn是组合中第n个非零幅脉冲的位置,U′(px,py)是取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数;以及
-使给定比值最大化的步骤包括当下述不等式成立时,至少可以跳过N层嵌套循环中的最内层循环的步骤: &Sigma; n = 1 N - 1 S Pn D Pn < T D 其中Spn是预先分配给位置pn的幅度,Dpn是目标矢量D的第pn个分量。TD为与经逆向滤波的目标矢量D有关的一个阈值。
本方面还涉及一种蜂窝通信系统,服务于被划分为多个小区的大地理区域,该系统包括:
移动发射机/接收机单元;
分别位于所述小区内的蜂窝基台;
用于控制所述各蜂窝基台之间通信的装置;
位于一个小区内的每一移动单元与所述小区内的蜂窝基台之间的一个双向无线通信子系统,所述双向无线通信子系统包括在移动单元和蜂窝基台内都具备的(a)发射机,包括用于对语音信号编码的装置和用于发送编码语音信号的装置;和(b)接收机,包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置。所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置,这些语音信号编码参数产生装置包括如上所述,用于在码本内进行搜索以产生至少一个语音信号编码参数的设备,在其中语音信号构成声音信号。
按照本发明,还提供:
-蜂窝网络元件,它包括:(a)发射机,包括用于对语音信号编码的装置和用于发送编码语音信号的装置;和(b)接收机,包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置。所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置,这些语音信号编码参数产生装置包括如上所述,用于在码本内进行搜索以产生至少一个语音信号编码参数的设备,在其中语音信号构成声音信号。
-蜂窝移动发射机/接收机单元,它包括:(a)发射机,包括用于对语音信号编码的装置和用于发送编码语音信号的装置;和(b)接收机,包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置。所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置,这些语音信号编码参数产生装置包括如上所述,用于在码本内进行搜索以产生至少一个语音信号编码参数的设备,在其中语音信号构成声音信号。
-服务于一个被划分为多个小区的大地理区域的一种蜂窝通信系统,包括移动发射机/接收机单元、分别位于所述小区内的蜂窝基台以及用于控制所述各蜂窝基台之间通信的装置;
位于一个小区内的每一移动单元与所述小区内的蜂窝基台之间的双向无线通信子系统,这个双向无线通信子系统包括在移动单元和蜂窝基台内都具备的(a)发射机,包括用于对语音信号编码的装置和用于发送编码语音信号的装置;和(b)接收机,包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置。所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置,这些语音信号编码参数产生装置包括如上所述,用于在码本内进行搜索以产生至少一个语音信号编码参数的设备,在其中语音信号构成声音信号。
通过阅读下面的关于优选实施例的非限制性叙述,参照附图,就可以对本发明的目的、优点和其它特征有一个更清晰的了解。
                       附图简要说明
在附图中:
图1是一个根据本发明的包括一个幅度选择器和一个最佳控制器的声音信号编码装置的示意方框图;
图2是一个与图1中的编码装置相关的解码装置的示意方框图;
图3a是根据本发明的基于信号选择的脉冲幅度进行快速码本搜索的基本操作步骤的顺序图;
图3b是给脉冲幅度/位置组合的每一位置p预先分配q种幅度中的一种幅度的操作步骤的顺序图;
图3c是N层嵌套循环搜索过程中包含的操作步骤的顺序图,其中,当认为第一组N-1个脉冲对分子DAT K的贡献不够充分时,跳过最内层循环;
图4是在码本搜索过程中采用的N层嵌套循环的示意图;
图5是说明一个典型蜂窝通信系统的基础结构的示意方框图。
                 优选实施例的详细说明
图5图解说明了一个典型蜂窝通信系统1的基础结构。
尽管在本说明书中,作为一个非限制性的例子,对根据本发明的搜索执行方法和装置应用于一个蜂窝通信系统的情况作了说明,但是,应指出这些方法和装置可以被应用到许多其它类型的需要对声音信号进行编码的通信系统中,并具有同样的优点。
对于诸如1的蜂窝通信系统,通过将一个大的地理区域划分成许多较小的小区,可以在这个大的区域内提供通信服务。每一小区有一个蜂窝基站2(图5),用于提供无线电信令信道,以及音频和数据信道。
无线电信令通道用于在蜂窝基站的覆盖区域范围(小区)内呼叫诸如3的移动无线电话机(移动发射机/接收机单元),以及与基站所在小区内或外的其它无线电话机通话,或与另外的网络如公共交换电话网(PSTN)4通话。
一旦无线电话机3成功地打通电话或接到电话,音频或数据信道就对于与无线电话机3所处的小区相对应的蜂窝基站2而建立,则基站2和无线电话机3之间的通信就通过该音频或数据通道进行。无线电话机3还可以在通话进行时,通过信令信道接收控制或定时信息。
如果无线电话机3在通话过程中离开某一小区进入另一小区,无线电话机就将电话过区切换到新小区内的可用的音频或数据信道上。类似地,如果没有通话,就通过信令信道发送一条控制信息使得无线电话机登录在与新小区相关的基站2上。采用这种方式,就可能实现在一个宽阔的地域内的移动通信。
蜂窝通信系统1还包含一个终端5,用于在诸如无线电话机3与PSTN4通信期间或者在一第一小区内无线电话机3和第二小区内的无线电话机3之间的通信期间,控制蜂窝基站2和公共交换电话网络4之间的通信。
当然,需要一个双向无线通信子系统来建立位于一个小区内的每一台无线电话机3和该小区内的蜂窝基站2之间的通信。这样一种双向无线通信系统一般包含在无线电话机3和蜂窝基站内都有的(a)发射机,用于对语音信号编码,并通过如6或7的天线发送已被编码的语音信号,以及(b)接收机,用于通过同一天线6或7接收被发送的编码语音信号,并对接收到的编码语音信号进行解码。对本领域普通技术人员都知道,需要对声音编码以减少带宽,这对于通过双向无线通信系统即在无线电话机3和基站2之间发送语音信号来说是必须的。
本发明的目的是提供一种具有良好的主观质量/比特率的折衷的高效数字语音编码技术,例如用于在蜂窝基站2和无线电话机3之间通过音频数据信道进行语音信号的双向传送。图1是适合于实现这一高效技术的一种数字语音编码装置的示意方框图。
图1中的语音编码装置与专利号为No.07/927,528的美国专利中的图1所示的编码装置相同,只是在本发明中增加了一个幅度选择器112。美国专利申请No.07/927,528申请日为1992年9月10日,题为“基于代数码的用于高效语音编码的动态码本”的发明。
模拟语音信号被采样并成块处理。必须明白的是,本发明并不局限于只应用于语音信号。也可以考虑应用本发明对其它类型的声音信号进行编码。
在图示的例子中,输入的采样语音的数据块S(图1)由L个样值组成。在CELP的文献中,L表示“子帧”长度,一般位于20和80之间。含L个样值的块也被称为L维矢量。在编码处理过程中会产生各种各样的L维矢量。下面给出了一个在图1和2中出现的矢量的列表,以及一个发送参数的列表:
                 关于主要L维矢量的列表
      S    输入语音矢量;
      R′  去掉音调的残留信号;
      X    目标矢量;
      D    经逆向滤波的目标矢量;
      Ak  代数码本中标引为k的码矢量;
      Ck  修正矢量(Innovation vector)(经滤波的码矢
           量);
      发送参数的列表
      k    码矢量的标引(代数码本的输入);
      g    增益;
      STP  短期预测参数(定义A(Z));以及
      LTP  长期预测参数(定义音调增益b和音调延时T)解码原理:
最好是首先叙述图2中的语言解码装置,以说明在数字输入(多路信号分离器205的输入)和输出的取样语音(合成滤波器204的输出)之间进行的各个步骤。
多路信号分离器205从接收自数字输入信道的二进制信息中提取四种不同的参数,即标引k、增益g、短期预测参数STP和长期预测参数LTP。在这四种参数的基础上合成语音信号的当前L维矢量S,在下面的叙述中将对此加以解释。
图2中的语音解码装置包含动态码本208、放大器206、加法器207、长期预测器203和合成滤波器204,其中动态码本208由一个代数码发生器206和一个自适应前置滤波器202组成。
第一步,代数码产生器201响应标引k产生一个码矢量Ak
第二步,给自适应前置滤波器202提供短期预测参数STP和/或长期预测参数LTP,由其对码矢量Ak进行处理,以产生一个输出修正矢量Ck。采用自适应前置滤波器202的目的是对输出修正矢量Ck的频率成分进行动态控制以提高语音质量,也就是减少由刺耳的频率引起的声音失真。下面给出了自适应前置滤波器202的典型传输函数F(Z): F a ( Z ) = ( A ( z / &gamma; 1 ) A ( z / &gamma; 2 ) ) F b ( Z ) = 1 ( 1 - b 0 z T )
Fa(Z)是一种共振峰(formant)前置滤波器,γ1和γ2为常数,且0<γ1<γ2<1。这种前置滤波器能增强共振峰区域的频率成分。并且在编码速率低于5k比特/s时能非常有效地工作。
Fb(Z)是一个音调前置滤波器,其中T是时变音调延时,bo或是常数或是等于根据当前或以前的子帧量化的长期音调预测参数。Fb(Z)用于加强各种码速率F的音调谐波频率非常有效。因此,F(Z)一般包括一个有时与一个共振峰前置滤波器相结合的音调前置滤波器,即:
                        F(z)=Fa(z)Fb(z)
按照CELP技术,首先用经放大器206的增益g来放大码本208中的修正矢量Ck来获得输出的取样语音信号S。然后,由加法器207将放大的波形gck加到提供有LTP参数的长期预测器203的输出E上(合成滤波器204的信号激励的长期预测部分),长期预测器203置于反馈环中,并具有如下的传输函数B(Z):
                         B(Z)=bZ-T其中b和T分别为所述的音调增益和延时。
预测器203是一个模拟语音的音调周期性的滤波器,具有基于最新接收到的LTP参数b和T的传输函数。它引入样值的适当的音调增益b和延时T。复合信号E+gCk构成合成滤波器204的信号激励,合成滤波器的传输函数为1/A(Z)(A(Z)将在下面的叙述中定义)。滤波器204根据最新接收到的STP参数进行正确的频谱整形。具体而言,滤波器204模拟语音的共振频率(共振峰)。输出的样值组S为合成取样语音信号,根据在本技术领域中的公知技术,采用合适的去混叠滤波,可以将该合成取样语音信号转化为模拟信号。
有许多方式来设计代数码发生器201。在所述的专利申请号为No.07/927,528的美国专利中提出了一种较好的方法,该方法采用至少一种N交织的单脉冲置换码。
用一个简单的代数码发生器201来对这一概念加以说明。在这个例子中,L=40并且40维的码矢量集合中只包含N=5个非零幅脉冲,称之为Sp1、Sp2、Sp3、Sp4、Sp5。在这种更细致的标注法中,pi表示子帧内的第i个脉冲的位置(即pi在0至L-1范围内取值)。假设脉冲Spi被限制在如下的8种可能位置p1
p1=0,5,10,15,20,25,30,35=0+8m1;m1=0,1,...,7
在被称为“轨迹”#1的这八种可能的位置内,Sp1和7个零幅脉冲可以自由置换。称之为“单脉冲置换码”。现在让我们通过用类似的方式对余下的脉冲的位置也加以限制来交织五个这种“单脉冲置换码”(即轨迹#2,轨迹#3、轨迹#4和轨迹#5)。
        p1=0,5,10,15,20,25,30,35=0+8m1
        p2=1,6,11,16,21,26,31,36=1+8m2
        p3=2,7,12,17,22,27,32,37=2+8m3
        p4=3,8,13,18,23,28,33,38=3+8m4
        p5=4,9,14,19,24,29,34,39=4+8m5
注意整数m1=0,1,...,7可以完全确定每一个脉冲Spi的位置pi。因而,采用下述关系式,通过对各mi直接倍乘,就可以推导出一种简单的位置标引Kp
        Kp=4096m1+512m2+64m3+8m4+m5
必须指出的是,采用上述脉冲轨迹也能推导出其它的码本。例如,只采用4个脉冲,其中前三个脉冲分别占据前三条轨迹的位置,同时第四个脉冲或者占据第四条轨迹或者占据第五条轨迹,用一个比特来说明其处于哪一个轨迹。这种设计能得到一个13位位置码本。
在现有技术中,由于码矢量搜索的复杂性的缘故,假定非零幅脉冲在各种实际应用中都具有固定的幅度。事实上,如果脉冲Spi可以取q种可能幅度中的一种的话,在搜索中就必须考虑有qN种之多的脉冲一幅度组合。例如,如果允许第一个例子中的5个脉冲取q=4种可能幅度,如Spi=+1,-1,+2,-2而不是固定幅度的话,代数码本的大小就会从15位跳至15+(5×2)位=25位;也就是说,搜索将复杂一千倍。
本发明的目的是指出这样一个令人惊讶的方案,即在不用付出很大代价的情况下,采用有q种幅度的脉冲能取得非常好的性能。这种方案是将搜索范围限制在码矢量的一个限定的子集内。选择码矢量的方法与输入语音信号有关,下面的叙述中将对此加以说明。
本发明的有用之处在于:通过允许单个脉冲取不同的可能幅度,能够增加动态代数码本208的大小,而不增加码矢量搜索的复杂性。编码原理:
取样语音信号S由图1中的编码系统按块编码在一块上。图1中的解码系统可被分解为标号从102至112的11个模块。大多数这些模块的功能和操作相对于美国专利和申请号为No.07/927,528的母专利中的描述来说没有变化。因而,在下面的叙述中尽管将不得不对每一个模块的功能和操作一些简要的解释。但主要将叙述对于美国专利申请号为No.07/927,528的母专利而言为新的内容。
按照现有技术,通过一个LPC频谱分析器102,给语音信号的每一个含L个样值的数据块,产生一组被称为短期预测(STP)参数的线性预测编码(LPC)参数。具体而言,分析器102模拟L个样值的每一块S的频谱特性。
L个样值S的输入块S由“白化”滤波器103白化,“白化”滤波器103具有下述基于STP参数的当前值的传输函数: A ( z ) = &Sigma; i = 0 M a i z - i 其中a0=1,Z为所谓的Z变换中的一般变量。如图1所示,“白化”滤波器103产生残留矢量R。
音调提取器104用于计算和量化LTP参数,即音调延时T和音调增益g。提取器104的初始状态也被设置为来自初始状态提取器110的一个值FS。在美国专利申请号为No.07/927,528的母专利中对计算和量化LTP参数的详细过程已有叙述,并且相信对本领域普通技术人员是熟知的。因而,在本文中不再对此作进一步的叙述。
给滤波器响应特性计算器105(图1)提供STP和LTP参数以计算滤波器的响应特性FRC供后续步骤使用。FRC信息包括下述三个组成部分,其中n=1,2,...,L。·f(n):F(Z)的响应
注意F(Z)一般包括音调前置滤波器。·h(n): 对f(n)的响应
其中γ是一个感觉因子。更一般而言,h(n)是前置滤波器F(Z),感觉加权滤波器W(Z)和合成滤波器1/A(Z)的级联F(Z)W(Z)/A(Z)脉冲响应。注意F(Z)和1/A(Z)与在图2的解码器中采用的滤波器相同。·U(i,j):基于下述表达式的h(n)的自相关 u ( i , j ) = &Sigma; k = 1 L h ( k - i + 1 ) h ( k - j + 1 )
          1≤i≤L且i≤j≤L;当n<1时h(n)=0
给长期预测器106输入以前的激励信号(即前面子帧的E+gCk),以采用适当的音调延时T和增益b形成新的E成分。
感觉滤波器(perceptual filter)107的初始状态被设置成由初始状态提取器110输入的值FS。然后,将由减法器121(图1)计算出的已去掉音调的残留矢量R′=R-E输入至感觉滤波器107以使感觉滤波器107输出一个目标矢量X。如图1所示,将STP参数输入滤波器107中以改变其与这些参数相关的传输函数。实质上,X=R′-p,其中p表示包含由以前的激励信号引起的“振铃”的长期预测(LTP)的贡献。适用于Δ的MSE判据现在能用下述的矩阵符号表述: min k | | &Delta; | | 2 = min k | | S &prime; - S ^ &prime; | | 2 = min k | | S &prime; - &lsqb; P - g A k H T &rsqb; | | 2 = min k | | X - g A k H T | | 2 其中M为由如下的h(n)响应形成的一个L×L下三角托普利兹(Toeplitz)矩阵。h(0)项位于矩阵的对角线,h(1),h(2),...,h(L-1)位于相应较低的对角线。
由图1中的滤波器108来完成逆向滤波步骤。设上式对增益g的微分等于0,就可得到如下的最佳增益: &PartialD; | | &Delta; | | 2 &PartialD; g = 0 g = X ( A k H T ) T | | A k H T | | 2 取g为这一值,最小值就变为: min k | | &Delta; | | 2 = min k { | | X | | 2 - ( X ( A k H T ) T ) 2 | | A k H T | | 2 } 目的是寻找一个特定的标引k,使得到最小值。注意由于‖X‖2为一固定的数值。因而可以通过使下述数值最大来寻找同一标引: max k ( X ( A k H T ) T ) 2 | | A k H T | | 2 max k ( ( XH ) A k T ) 2 &infin; k 2 = max k ( DA k T ) 2 &infin; k 2
              其中D=(XH)且α2 k=‖AkHT2
在逆向滤波器108中计算经逆向滤波的目标矢量D=(XH)。把此运算称为术语“逆向滤波”是因为将(XH)解释为时间反演X的滤波。
只在所述美国专利申请号为No.07/927,528的母专利的图1中增加了一个幅度选择器112。幅度选择器112的功能是通过最佳控制器109将待搜索的码矢量Ak限制在最可能的码矢量Ak的范围内从而减小码矢量搜索的复杂性。如前面的描叙所述。每一个码矢量Ak是一个脉冲幅度/位置组合波形。它定义了L个不同的位置p,并包括分配给该组合中各个位置p=1,2,...,L的零幅脉冲和非零幅脉冲,其中每一个非零幅脉冲具有q种不同的可能幅度中的至少一种幅度。
现在参照图3a、3b和3c,幅度选择器112的作用是预先建立码矢量波形的位置p和各脉冲幅度的q种可能值之间的函数关系Sp。在码本搜索之前与语音信号相关联推导出预先建立的函数关系Sp。具体而言,这一函数的预先建立过程包括与语音信号相关地,给波形的每一个位置p预先分配q种可能幅度中的至少一种幅度(图3a中的步骤301)。
为给波形的每一个位置p预先分配q种可能幅度中的一种,响应于经逆向滤波的目标矢量D和已去除音调的残留矢量R′来计算幅度预估矢量B。具体而言,通过对归一化形式的经逆向滤波的目标矢量D: ( 1 - &beta; ) D | | D | | 和归一化形式的已去除音调的残留矢量R′ &beta; R &prime; | | R &prime; | | 求和来计算幅度预估矢量B(图3b中的子步骤301-1)从而得到如下形式的幅度预估矢量B: B = ( 1 - &beta; ) D | | D | | + &beta; R &prime; | | R &prime; | | 其中β是一个固定常数,其典型值为1/2(β值根据在代数码本中采用的非零幅脉冲的百分比在0和1之间选择)。
对波形的每一个位置p来说,通过量化矢量B的相应的幅度预估值Bp来获取要预先分配给该位置p的幅度Sp。具体而言,对波形的每一个位置p,采用下述表达式来量化矢量B的经峰值归一化的幅度预估值Bp(图3b中的子步骤301-2): S p = Q ( B p / max n | B n | 其中Q(.)为量化函数而且 max n | B n | 是一个归一化因子,表示非零幅脉冲的峰值幅度。
在下述重要的特殊情形中:
-q=2,即脉冲幅度只能取两个值(即Spi=±1);以及
-非零幅脉冲密度N/L小于等于15%
β值可以等于零;因而幅度预估矢量B就简化为只与经逆向滤波的目标矢量D有关,结果为Sp=Sign(Dp)。
最佳控制器119的作用是从代数码本中选择出最佳码矢量Ak。选择判据以定额(ration)的形式给出,对每一个码矢量Ak计算其定额,并从所有码矢量中寻找最大值(步骤303): max k ( DA k T ) 2 &alpha; k 2
其中D=(XH)且α2 k=‖AkHT2
由于Ak是一个代数码矢量,它具有N个非零幅脉冲,且各个脉冲的幅度分别为Spi,因而分子为下式的平方: DA k T = &Sigma; i = 1 N D Pi S Pi 且分母为能够表示为如下形式的一个能量项: &alpha; k 2 = &Sigma; i = 1 N S Pi 2 U ( p i , p j ) + 2 &Sigma; i = 1 N - 1 &Sigma; j - i + 1 N S Pi S Pi U ( p i , p j ) 其中U(pi,pj)是与两个单位幅度脉冲有关的相关量,一个脉冲位于位置pi,另一个脉冲位于位置pj。在滤波器响应特性计算器105中根据上式计算该矩阵。该矩阵被包括在图1的方框图中称FRC的一组参数中。
一种用于计算这一分母的快速方法包含如图4所示的N层嵌套循环。在图4中用对齐符号S(i)和SS(i,j)分别代替参数“Spi”和“SpiSpj”。分母α2 k的计算是最费时的过程。对α2 k有贡献的在每一个循环中完成的计算可以用如下形式写在从最外层循环至最内层循环的不同线上: &alpha; k 2 = S P 1 2 U &prime; ( p 1 , p 1 ) + S P 2 2 U ( p 2 , p 2 ) + 2 S P 1 S P 2 U ( p 1 , p 2 ) + S P 3 2 U ( p 3 , p 3 ) + 2 &lsqb; S P 1 S P 3 U ( p 1 , p 3 ) + S P 2 S P 3 U ( p 2 , p 3 ) &rsqb; ...   ...   ...   ... + S PN 2 U ( p N , p N ) + 2 &lsqb; S P 1 S PN U ( p 1 , p N ) + S P 2 S PN U ( p 2 , p N ) + . . . + S PN - 1 S PN U ( p N - 1 , p n ) &rsqb; 其中pi是第i个非零幅脉冲的位置。值得注意的是图4中的N层嵌套循环能够根据N交织单脉冲置换码来限制码矢量Ak的非零幅脉冲。
在本发明中,通过将待搜索的码矢量Ak的子集限制为其N个非零幅脉冲满足在图3a的步骤301中预先建立的函数关系的码矢量,可以显著减小搜索的复杂程度。当码矢量Ak的N个非零幅脉冲中的每一个都具有与预先分配给处于位置p的非零幅脉冲的幅度相等的幅度时,预先建立的函数关系就得到了满足。
所述码矢量子集的限制过程通过首先将预先建立的函数Sp与矩阵元U(i,j)相结合(图3a中的步骤302)。然后采用假定为固定位置,极性为正、具有单位幅度的所有脉冲S(i)进行N层嵌套循环(步骤303)。因而,即使代数码本中的非零幅脉冲的幅度可以取q种可能值中的任意一种,也可以将搜索的复杂程度减小至固定脉冲幅度的情形。更准确地说,根据下述关系式将由滤波器响应特性计算器105提供的矩阵U(i,j)与预先建立的函数相组合(步骤302):
                  U′(i,j)=SiSjU(i,j)其中Si来源于幅度选择器102的选择方法,即Si为在对相应的幅度预估值量化之后给每个位置i所选择的幅度。
采用这个新的矩阵,该快速算法的每一循环中的计算可以如下形式写在从最外层至内层循环的不同线上: &alpha; k 2 = U &prime; ( p 1 , p 1 ) + U &prime; ( p 2 , p 2 ) + 2 U &prime; ( p 1 , p 2 ) + U &prime; ( p 3 , p 3 ) + 2 U &prime; ( p 1 , p 3 ) + 2 U &prime; ( p 2 , p 3 ) ...   ...   ...   ... + U &prime; ( p N , p N ) + 2 U &prime; ( p 1 , p N ) + 2 U &prime; ( p 2 , p N ) + . . . + 2 U &prime; ( p N - 1 , p n ) 其中px为波形中第X个非零幅脉冲的位置,U′(px,py)为取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
为了更进一步减小搜索的复杂性,只要下述不等式成立,就可以跳过最内层循环(参照图3c)。而且跳过最内层循环只是个特例,而不是仅仅只指最内层循环:其中Spn是预先分配给位置pn的幅度,Dpn是目标矢量D的第pn个分量,TD是与经逆向滤波的目标矢量D有关的一个阈值。
全局的信号激励信号E+gCk由加法器120(图1)根据来自控制器109的信号gCk和来自预测器106的输出E来计算。由具有随STP参数变化的传输函数1/A(Zγ-1)的感觉滤波器构成的初始状态提供模块110,从残留信号R中减去信号激励信号E+gCk,以获取最终滤波器状态FS,供滤波器107和音调提取器104作为初始状态使用。
四种参数k,g,LTP和STP的集合通过多路复用器111转换为合适的数字信道格式,从而完成对语音信号的样值块S的编码过程。
尽管上面已经参照优选实施例对本发明进行了描述,在不偏离本发明的精神和实质的情形下,在后附的权利要求所声明的范围之内,还可以对这些实施例进行修改。

Claims (24)

1.一种在码本中进行搜索以对声音信号编码的方法,其中
-所述码本包含脉冲幅度/位置组合(Ak)的一个集合;
-每个脉冲幅度/位置组合(Ak)定义L个不同的位置,并且包括分配给该组合中各个位置p=1,2,...,L的零幅脉冲和非零幅脉冲;
-每一非零幅脉冲采用q种可能的幅度之一;以及
-所述码本搜索实施方法包括:
与所述声音信号相关地从所述码本中预选脉冲幅度/位置组合(Ak)的一个子集;以及
仅搜索所述脉冲幅度/位置组合(Ak)的所述子集以对声音信号编码,从而由于仅搜索码本中脉冲幅度/位置组合的一个子集,而降低搜索复杂度;
其中所述预选脉冲幅度/位置组合(Ak)步骤包括与所述声音信号相关地、在位置p=1,2,...,L和q种可能幅度之间预先建立一个幅度/位置函数(Sp);
预先建立幅度/位置函数(Sp)的步骤包括给每一位置p预先分配q种可能幅度之一作为有效幅度;以及
给每一位置p预先分配q种可能幅度之一的步骤包括:
对所述声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′;
根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B;以及
对所述的每一位置p,量化所述矢量B的幅度预估值Bp以得出准备为所述位置p选择的幅度;以及
搜索脉冲幅度/位置组合(Ak)的所述子集的步骤包括将搜索限制在所述码本中具有满足所述预先建立的函数(Sp)的非零幅脉冲的脉冲幅度/位置组合(Ak)的范围内的步骤。
2.如权利要求1所述的方法,其中当脉冲幅度/位置组合(Ak)中的每一个非零幅脉冲都具有与由预先建立的函数(Sp)预先分配给所述非零幅脉冲的位置p的幅度相等的幅度时,满足该预先建立的函数(Sp)。
3.如权利要求1或2所述的方法,其中所述计算幅度预估矢量B的步骤包括:将归一化形式的经逆向滤波的目标信号D: ( 1 - &beta; ) D | | D | | 与归一化形式的已去除音调的残留信号R′; &beta; R &prime; | | R &prime; | | 相加从而得到如下形式的幅度预估计矢量B: B = ( 1 - &beta; ) D | | D | | + &beta; R &prime; | | R &prime; | | 其中β是一个固定常数。
4.如权利要求3所述的方法,其中β是一个固定常数,其值位于0和1之间。
5.如权利要求1至4之一所述的方法,其中对每个所述位置p,所述量化幅度矢量预估值的步骤包括用下述表达式量化所述矢量B的已经峰值归一化的幅度预估值Bp B p / max n | B n | 其中分母 max n | B n | 是一个归一化因子,表示所述非零幅脉冲的峰值幅度。
6.如权利要求1至5之一所述的方法,还包括根据一组脉冲位置的轨迹限制该码本中的组合(Ak)的非零幅脉冲的位置p的步骤。
7.如权利要求6所述的方法,其中每个轨迹的脉冲位置与其他轨迹的脉冲位置相互交织。
8.如权利要求6所述的方法,其中
-所述脉冲组合(Ak)中的每一个都包括N个非零幅脉冲;
-该组轨迹包括分别与N个非零幅脉冲关联的脉冲位置的N个轨迹;
-每个轨迹的脉冲位置与其他N-1个轨迹的脉冲位置相互交织;以及
-限制位置p包括将每一个非零幅脉冲的脉冲位置限制于所关联的轨迹的位置。
9.如权利要求1至8之一所述的方法,其中所述的每一个脉冲幅度/位置组合(Ak)都包含N个非零幅脉冲,并且其中搜索所述脉冲幅度/位置组合(Ak)的步骤包含使分母为α2 k的给定比值最大化的步骤,α2 k通过N层嵌套循环根据下述关系式来计算: &alpha; k 2 = U &prime; ( p 1 , p 1 ) + U &prime; ( p 2 , p 2 ) + 2 U &prime; ( p 1 , p 2 ) + U &prime; ( p 3 , p 3 ) + 2 U &prime; ( p 1 , p 3 ) + 2 U &prime; ( p 2 , p 3 ) ...   ...   ...   ... + U &prime; ( p N , p N ) + 2 U &prime; ( p 1 , p N ) + 2 U &prime; ( p 2 , p N ) + . . . + 2 U &prime; ( p N - 1 , p n ) 其中每一循环的计算内容写在从N层嵌套循环的最外层循环至最内层循环的不同线上,pn是该组合中第n个非零幅脉冲的位置,U′(px,py)是取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
10.如权利要求9所述的方法,其中使所述给定比值最大化的步骤包含当下述不等式成立时至少跳过N层嵌套循环的最内层循环的步骤: &Sigma; n = 1 N - 1 S Pn D Pn < T D 其中Spn是预先分配给位置pn的幅度,Dpn是目标矢量D的第pn个分量,TD是与经逆向滤波的目标矢量D有关的一个阈值。
11.一种在码本中进行搜索以对声音信号编码的设备,其中:
-所述码本包含脉冲幅度/位置组合(Ak)的一个集合,每个脉冲幅度/位置组合(Ak)定义了L个不同的位置,并包括分配给该组合中各个位置p=1,2,...,L的零幅脉冲和非零幅脉冲;
-每一非零幅脉冲采用q种可能的幅度之一;
-所述码本搜索实施装置包括:
用于与所述声音信号相关地从所述码本中预选脉冲幅度/位置组合(Ak)的一个子集的装置;以及
用于仅搜索所述脉冲幅度/位置组合(Ak)子集以对声音信号编码,从而由于仅搜索码本中一个脉冲幅度/位置组合(Ak)的一个子集,而降低搜索复杂度的装置;
其中所述预先选择装置包括用于与所述声音信号相关地、在位置p=1,2,...,L和所述q种可能幅度之间预先建立一个幅度/位置函数(Sp)的装置;
该预先建立的装置包括给每一位置p预先分配q种可能幅度之一作为有效幅度的装置;以及
给每一位置p预先分配q种可能幅度之一的装置包括:
对所述声音信号进行处理以产生一个经逆向滤波的目标信号D和一个已去除音调的残留信号R′的装置;
根据经逆向滤波的目标信号D和已去除音调的残留信号R′计算幅度预估矢量B的装置;以及
对所述的每一位置p,量化所述矢量B的幅度预估值Bp以得出准备为所述位置p选择的幅度的装置;以及
该搜索装置包括将搜索限制在所述码本中具有满足所述预先建立的函数(Sp)的非零幅脉冲的脉冲幅度/位置组合(Ak)的范围内的装置。
12.如权利要求11所述的设备,其中当脉冲幅度/位置组合(Ak)中的每一个非零幅脉冲都具有与由预先建立的函数Sp预先分配给所述非零幅脉冲的位置p的幅度相等的幅度时,满足该预先建立的函数。
13.如权利要求11或12所述的设备,其中所述用于计算幅度预估矢量B的装置包括用于将归一化形式的经逆向滤波的目标信号D: ( 1 - &beta; ) D | | D | | 和归一化形式的已去除音调的残留信号R′: &beta; R &prime; | | R &prime; | | 相加从而得到如下形式的幅度预估矢量B的装置: B = ( 1 - &beta; ) D | | D | | + &beta; R &prime; | | R &prime; | | 其中β是一个固定常数。
14.如权利要求13所述的设备,其中β是一个固定常数,其值位于0和1之间。
15.如权利要求11至14之一所述的设备,其中所述量化幅度矢量预估装置包括用于对所述每一位置p,采用下述表达式来量化所述矢量B的已经峰值归一化的幅度预估值Bp的装置: B p / max n | B n | 其中分母 max n | B n | 是一个归一化因子,表示非零幅脉冲的峰值幅度。
16.如权利要求11至15之一所述的设备,还包含用于根据一组脉冲位置的轨迹来限制码本中的组合(Ak)的非零幅脉冲的位置p的装置。
17.如权利要求16所述的设备,其中每个轨迹的脉冲位置与其他轨迹的脉冲位置相互交织。
18.如权利要求16所述的设备,其中
-所述脉冲组合(Ak)中的每一个都包括N个非零幅脉冲;
-该组轨迹包括分别与N个非零幅脉冲关联的脉冲位置的N个轨迹;
-每个轨迹的脉冲位置与其他N-1个轨迹的脉冲位置相互交织;以及
-限制位置p的装置包括用于将每一个非零幅脉冲的脉冲位置限制于所关联的轨迹的位置。
19.如权利要求11至18之一所述的设备,其中所述的每一脉冲幅度/位置组合(Ak)包括N个非零幅脉冲,其中搜索搜索脉冲幅度/位置组合(Ak)的所述子集的装置包括用于使分母为α2 k的给定比值最大化的装置,分母α2 k是通过N层嵌套循环根据下述关系式计算的: &alpha; k 2 = U &prime; ( p 1 , p 1 ) + U &prime; ( p 2 , p 2 ) + 2 U &prime; ( p 1 , p 2 ) + U &prime; ( p 3 , p 3 ) + 2 U &prime; ( p 1 , p 3 ) + 2 U &prime; ( p 2 , p 3 ) ...   ...   ...   ... + U &prime; ( p N , p N ) + 2 U &prime; ( p 1 , p N ) + 2 U &prime; ( p 2 , p N ) + . . . + 2 U &prime; ( p N - 1 , p N ) 其中每一循环的计算内容写在从N层嵌套循环的最外层循环到最内层循环的不同线内,其中pn是所述组合中第n个非零幅脉冲的位置,U′(px,py)是取决于预先分配给位置p中的某一位置px的幅度Spx和预先分配给位置p中的某一位置py的幅度Spy的一个函数。
20.如权利要求19所述的设备,其中所述用于最大化所述给定比率的装置包括每当下述不等式成立时至少跳过N层嵌套循环的最内层循环的装置: &Sigma; n = 1 N - 1 S Pn D Pn < T D 其中Spn是预先分配给位置pn的幅度,Dpn是目标矢量D的第pn个分量,TD是与经逆向滤波的目标矢量D有关的一个阈值。
21.一种服务于一个被划分为多个小区的大地理区域的蜂窝通信系统,包括:
移动发射机/接收机单元(3);
分别位于所述小区内的蜂窝基台(2);
用于控制所述各蜂窝基台(2)之间通信的装置(5);
位于一个小区内的每一移动单元(3)与所述一个小区内的蜂窝基台(2)之间的双向无线通信子系统,所述双向无线通信子系统包括在移动单元(3)和蜂窝基台(2)内都具备的(a)发射机,包括用于对语音信号编码的装置和用于发送编码语音信号的装置;和(b)接收机,包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置;
-其中所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置,并且其中所述语音信号编码参数产生装置包括权利要求11至20中的任何一个叙述的设备,用于在码本内进行搜索以产生至少一个所述语音信号编码参数,其中语音信号构成所述声音信号。
22.一种蜂窝网络元件(2),它包括:(a)发射机,包括用于对语音信号编码的装置和用于发送编码语音信号的装置;和(b)接收机,包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置;
-其中所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置,和其中所述语音信号编码参数产生装置包括权利要求11至20中的任何一个叙述的设备,用于在码本内进行搜索以产生至少一个所述语音信号编码参数,在其中语音信号构成所述声音信号。
23.一种蜂窝移动发射机/接收机单元(3),它包括:(a)发射机,包括用于对语音信号编码的装置和用于发送编码语音信号的装置;和(b)接收机,包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置;
-所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置,其中所述语音信号编码参数产生装置包括权利要求11至20中的任何一个叙述的设备,用于在码本内进行搜索以产生至少一个所述语音信号编码参数,其中语音信号构成所述声音信号。
24.一种服务于被划分为多个小区的大地理区域的蜂窝通信系统,包括移动发射机/接收机单元(3)、分别位于所述小区内的蜂窝基台(2)以及用于控制所述各蜂窝基台(2)之间通信的装置(5);
-位于一个小区内的每一移动单元(3)与所述一个小区内的蜂窝基台(2)之间的双向无线通信子系统,所述双向无线通信子系统包括在移动单元(3)和蜂窝基台(2)内都具备的(a)发射机,包括用于对语音信号编码的装置和用于发送编码语音信号的装置;和(b)接收机,包括用于接收被发送的编码语音信号的装置和用于对接收到的编码语音信号进行解码的装置;
-其中所述语音信号编码装置包括用于响应该语音信号产生语音信号编码参数的装置,和其中所述语音信号编码参数产生装置包括权利要求11至20中的任何一个叙述的设备,用于在码本内进行搜索以产生至少一个所述语音信号编码参数,其中语音信号构成所述声音信号。
CNB021079072A 1995-02-06 2002-03-21 在码本中进行搜索以对声音信号编码的方法和设备 Expired - Lifetime CN1220178C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US38396895A 1995-02-06 1995-02-06
US383968 1995-02-06
US508801 1995-07-28
US08/508,801 US5754976A (en) 1990-02-23 1995-07-28 Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB961930950A Division CN1198262C (zh) 1995-02-06 1996-02-02 在代数码本中进行搜索以对声音信号编码的方法和装置

Publications (2)

Publication Number Publication Date
CN1410970A true CN1410970A (zh) 2003-04-16
CN1220178C CN1220178C (zh) 2005-09-21

Family

ID=27010408

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB961930950A Expired - Lifetime CN1198262C (zh) 1995-02-06 1996-02-02 在代数码本中进行搜索以对声音信号编码的方法和装置
CNB021079072A Expired - Lifetime CN1220178C (zh) 1995-02-06 2002-03-21 在码本中进行搜索以对声音信号编码的方法和设备

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB961930950A Expired - Lifetime CN1198262C (zh) 1995-02-06 1996-02-02 在代数码本中进行搜索以对声音信号编码的方法和装置

Country Status (26)

Country Link
US (1) US5754976A (zh)
EP (2) EP1225568B1 (zh)
JP (2) JP3430175B2 (zh)
KR (2) KR100388751B1 (zh)
CN (2) CN1198262C (zh)
AR (1) AR000871A1 (zh)
AT (2) ATE230888T1 (zh)
AU (1) AU708392C (zh)
BR (1) BR9607026A (zh)
CA (1) CA2210765C (zh)
DE (1) DE19604273C5 (zh)
DK (2) DK0808496T3 (zh)
ES (1) ES2112807B1 (zh)
FI (2) FI117994B (zh)
FR (1) FR2730336B1 (zh)
GB (1) GB2297671B (zh)
HK (2) HK1002492A1 (zh)
IN (1) IN187453B (zh)
IT (1) IT1305724B1 (zh)
MX (1) MX9705997A (zh)
MY (2) MY130529A (zh)
NO (1) NO318595B1 (zh)
PT (1) PT1225568E (zh)
RU (1) RU2142166C1 (zh)
SE (1) SE520553C2 (zh)
WO (1) WO1996024925A1 (zh)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
US6393391B1 (en) * 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
TW317051B (zh) * 1996-02-15 1997-10-01 Philips Electronics Nv
JP3523649B2 (ja) * 1997-03-12 2004-04-26 三菱電機株式会社 音声符号化装置、音声復号装置及び音声符号化復号装置、及び、音声符号化方法、音声復号方法及び音声符号化復号方法
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
CN1494055A (zh) * 1997-12-24 2004-05-05 ������������ʽ���� 声音编码方法和声音译码方法以及声音编码装置和声音译码装置
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP3180762B2 (ja) * 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
WO2000016501A1 (en) * 1998-09-11 2000-03-23 Motorola Inc. Method and apparatus for coding an information signal
SE521225C2 (sv) * 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
US6295520B1 (en) 1999-03-15 2001-09-25 Tritech Microelectronics Ltd. Multi-pulse synthesis simplification in analysis-by-synthesis coders
JP2001075600A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 音声符号化装置および音声復号化装置
US7272553B1 (en) * 1999-09-08 2007-09-18 8X8, Inc. Varying pulse amplitude multi-pulse analysis speech processor and method
WO2001020595A1 (en) * 1999-09-14 2001-03-22 Fujitsu Limited Voice encoder/decoder
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
KR100438175B1 (ko) * 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US7236928B2 (en) * 2001-12-19 2007-06-26 Ntt Docomo, Inc. Joint optimization of speech excitation and filter parameters
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
KR100503414B1 (ko) * 2002-11-14 2005-07-22 한국전자통신연구원 고정 코드북의 집중 검색 방법 및 장치
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
CN100416652C (zh) * 2005-10-31 2008-09-03 连展科技(天津)有限公司 增强的amr编码器快速固定码本搜索方法
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
US20080120098A1 (en) * 2006-11-21 2008-05-22 Nokia Corporation Complexity Adjustment for a Signal Encoder
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
CN101286321B (zh) * 2006-12-26 2013-01-09 华为技术有限公司 双脉冲激励的线性测编码
EP2157573B1 (en) 2007-04-29 2014-11-26 Huawei Technologies Co., Ltd. An encoding and decoding method
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
US8566106B2 (en) * 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
CN101903946B (zh) * 2007-12-21 2012-09-26 Nvoq股份有限公司 分布式听写/转录系统
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
DK2242045T3 (da) * 2009-04-16 2012-09-24 Univ Mons Talesyntese og kodningsfremgangsmåder
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
CN102623012B (zh) * 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
US8880404B2 (en) * 2011-02-07 2014-11-04 Qualcomm Incorporated Devices for adaptively encoding and decoding a watermarked signal
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9070356B2 (en) 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US20140334564A1 (en) * 2013-05-09 2014-11-13 Samsung Electronics Co., Ltd Method and system for providing low-complexity hybrid precoding in wireless communication systems

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
CA1164569A (en) * 1981-03-17 1984-03-27 Katsunobu Fushikida System for extraction of pole/zero parameter values
WO1983003917A1 (en) * 1982-04-29 1983-11-10 Massachusetts Institute Of Technology Voice encoder and synthesizer
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
JPS5922165A (ja) * 1982-07-28 1984-02-04 Nippon Telegr & Teleph Corp <Ntt> アドレス制御回路
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
US4764963A (en) * 1983-04-12 1988-08-16 American Telephone And Telegraph Company, At&T Bell Laboratories Speech pattern compression arrangement utilizing speech event identification
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
DE3335358A1 (de) * 1983-09-29 1985-04-11 Siemens AG, 1000 Berlin und 8000 München Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung
US4799261A (en) * 1983-11-03 1989-01-17 Texas Instruments Incorporated Low data rate speech encoding employing syllable duration patterns
CA1236922A (en) * 1983-11-30 1988-05-17 Paul Mermelstein Method and apparatus for coding digital signals
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4724535A (en) * 1984-04-17 1988-02-09 Nec Corporation Low bit-rate pattern coding with recursive orthogonal decision of parameters
US4680797A (en) * 1984-06-26 1987-07-14 The United States Of America As Represented By The Secretary Of The Air Force Secure digital speech communication
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4858115A (en) * 1985-07-31 1989-08-15 Unisys Corporation Loop control mechanism for scientific processor
IT1184023B (it) * 1985-12-17 1987-10-22 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4873723A (en) * 1986-09-18 1989-10-10 Nec Corporation Method and apparatus for multi-pulse speech coding
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
CA1321646C (en) * 1988-05-20 1993-08-24 Eisuke Hanada Coded speech communication system having code books for synthesizing small-amplitude components
US5008965A (en) * 1988-07-11 1991-04-23 Kinetic Concepts, Inc. Fluidized bead bed
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JP3089769B2 (ja) * 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
DE4315313C2 (de) * 1993-05-07 2001-11-08 Bosch Gmbh Robert Vektorcodierverfahren insbesondere für Sprachsignale

Also Published As

Publication number Publication date
MY119038A (en) 2005-03-31
CN1181150A (zh) 1998-05-06
EP0808496A1 (en) 1997-11-26
PT1225568E (pt) 2004-01-30
IT1305724B1 (it) 2001-05-15
HK1002492A1 (en) 1998-08-28
SE9600437D0 (sv) 1996-02-06
KR19980701975A (ko) 1998-06-25
US5754976A (en) 1998-05-19
ATE248423T1 (de) 2003-09-15
GB9602391D0 (en) 1996-04-03
DE19604273C2 (de) 2000-06-29
NO318595B1 (no) 2005-04-18
FI20020320A (fi) 2002-02-18
NO973472L (no) 1997-10-06
FR2730336A1 (fr) 1996-08-09
MX9705997A (es) 1997-11-29
EP1225568B1 (en) 2003-08-27
GB2297671B (en) 2000-01-19
FI118396B (fi) 2007-10-31
FI973241A (fi) 1997-10-06
WO1996024925A1 (en) 1996-08-15
NO973472D0 (no) 1997-07-28
CA2210765C (en) 2001-08-21
AR000871A1 (es) 1997-08-06
JP3430175B2 (ja) 2003-07-28
HK1055007A1 (en) 2003-12-19
GB2297671A (en) 1996-08-07
DE19604273C5 (de) 2004-05-27
EP0808496B1 (en) 2003-01-08
ES2112807B1 (es) 1999-04-16
KR100393910B1 (ko) 2003-08-02
ITUD960012A0 (it) 1996-02-02
AU4479696A (en) 1996-08-27
SE520553C2 (sv) 2003-07-22
DK0808496T3 (da) 2003-04-22
AU708392B2 (en) 1999-08-05
JP4187556B2 (ja) 2008-11-26
FI117994B (fi) 2007-05-15
MY130529A (en) 2007-06-29
CA2210765A1 (en) 1996-08-15
JP2003308100A (ja) 2003-10-31
CN1198262C (zh) 2005-04-20
IN187453B (zh) 2002-04-27
FR2730336B1 (fr) 1997-08-14
KR100388751B1 (ko) 2003-11-28
EP1225568A1 (en) 2002-07-24
ITUD960012A1 (it) 1997-08-02
ES2112807A1 (es) 1998-04-01
DE19604273A1 (de) 1996-08-29
ATE230888T1 (de) 2003-01-15
BR9607026A (pt) 1997-11-04
JPH10513571A (ja) 1998-12-22
DK1225568T3 (da) 2003-11-24
AU708392C (en) 2003-01-09
RU2142166C1 (ru) 1999-11-27
FI973241A0 (fi) 1997-08-06
CN1220178C (zh) 2005-09-21

Similar Documents

Publication Publication Date Title
CN1198262C (zh) 在代数码本中进行搜索以对声音信号编码的方法和装置
CN1114900C (zh) 快速语音编码的代数码书深度优先搜索方法
CN1021938C (zh) 控制代码激发信号编码器的方法和装置
CN1154086C (zh) Celp转发
CN1199151C (zh) 语音编码器
CN1241170C (zh) 语音编解码器中用于线频谱频率矢量量化的方法和系统
CN1218295C (zh) 语音解码中语音帧差错隐蔽的方法和系统
CN1121683C (zh) 语音编码
CN1201289C (zh) 数字信号的编码和解码方法
CN1144179C (zh) 声音信号解码方法和装置、声音信号编码方法和装置
CN1739142A (zh) 用于可变比特率语音编码中的线性预测参数的稳健预测向量量化的方法和设备
CN1655236A (zh) 用于预测量化有声语音的方法和设备
CN1109697A (zh) 矢量量化器方法和设备
CN1795495A (zh) 音频编码设备、音频解码设备、音频编码方法和音频解码方法
CN1692408A (zh) 码分多址无线系统的可变比特率宽带语音编码中的有效带内半空白-突发序列信令及半速率最大操作的方法和装置
CN101044552A (zh) 语音编码装置和语音编码方法
CN1167046C (zh) 矢量编码方法及其利用该方法的编码器和解码器
CN101030377A (zh) 提高声码器基音周期参数量化精度的方法
CN1290077C (zh) 用来对相位谱信息进行子抽样的方法和设备
CN1193344C (zh) 语音解码器和一种语音解码方法
CN1192357C (zh) 用于语音编码的自适应规则
CN1293535C (zh) 声音编码设备和方法以及声音解码设备和方法
CN100346577C (zh) 信号编码装置和信号解码装置,以及信号编码方法和信号解码方法
CN101059958A (zh) 利用缓存来加快量化数据取得的编码和解码方法
KR100736504B1 (ko) 확률적 코드북의 음원 부호화 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20050921

EXPY Termination of patent right or utility model