CN100336101C - 减少对于码本搜索的存储要求的装置和方法 - Google Patents
减少对于码本搜索的存储要求的装置和方法 Download PDFInfo
- Publication number
- CN100336101C CN100336101C CNB02815360XA CN02815360A CN100336101C CN 100336101 C CN100336101 C CN 100336101C CN B02815360X A CNB02815360X A CN B02815360XA CN 02815360 A CN02815360 A CN 02815360A CN 100336101 C CN100336101 C CN 100336101C
- Authority
- CN
- China
- Prior art keywords
- pulse
- vector
- crosscorrelation
- vectors
- code book
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000013598 vector Substances 0.000 title claims abstract description 170
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000004044 response Effects 0.000 claims description 53
- 239000011159 matrix material Substances 0.000 claims description 17
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 10
- 238000005070 sampling Methods 0.000 claims description 3
- 230000005284 excitation Effects 0.000 abstract description 8
- 238000004891 communication Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 238000003860 storage Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 239000002131 composite material Substances 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000008447 perception Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 238000005086 pumping Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 241001597008 Nomeidae Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
这里介绍了用于从码本中迅速选择最佳激励波形的方法和装置。为了减少选择该最佳码本矢量所要求的计算数量,可根据最佳脉冲位置来选择一个码矢量的子集(425),其中,这个码矢子集形成一子码本。不是搜索整个码本,而是只搜索该子码本的各个表项(400)。
Description
技术领域
本发明通常涉及通信系统,更具体地说,涉及通信系统内的语音处理。
背景技术
无线通信领域的应用广泛,包括(例如)无绳电话、寻呼、无线本地环路、个人数字助理(PDAs)、因特网电话技术和卫星通信系统。一项特别重要的应用是为移动订户提供的蜂窝(cellular)移动电话系统。如这里所使用的,术语“蜂窝(cellular)”系统包含蜂窝和个人通信服务(PCS)各频率。已为这类移动电话系统开发了各种通过空中的接口,包括(例如)频分多址(FDMA)、时分多址(TDMA)和码分多址(CDMA)系统。已建立与其有关的各种国内和国际标准,包括(例如)“高级移动电话服务”(AMPS)、“全球移动系统”(GSM)和“临时标准95”(IS-95)。特别是,“电信工业协会”(TIA)和其他众所周知的标准团体公布了IS-95及其衍生物——IS-95A、IS-95B、ANSI J-STD-008(在这里经常共同被称作“IS-95”),以及为提议的用于数据的高数据速率系统等。
根据IS-95标准的使用来加以配置的移动电话系统采用CDMA信号处理技术,以便提供非常有效率和稳健的移动电话服务。第5,103,459号和第4,901,307号美国专利中描述了实质上根据IS-95标准的使用来加以配置的示范移动电话系统,这些美国专利被转让于本发明的受让人,并通过引用被包括于此。利用CDMA技术的示范系统是由TIA发行的“cdma2000 ITU-R无线电传输技术(RTT)候选提案”(这里被称作“cdma2000”)。IS-2000的草案版本中提供了cdma2000的标准,并且,TIA已批准该标准。Cdma2000提议在许多方面与IS-95系统相兼容。如号码为3G TS 25.211、3G TS 25.212、3G TS 25.213和3G TS 25.214的文档《
第3代合作计划“3GPP”》中所具体表现的另一种CDMA标准是W-CDMA标准。
随着数字通信系统的发展,不断需要有效率地使用频率。用于提高系统效率的一种方法是:发送压缩的信号。在常规的陆上通讯线电话系统中,使用64千比特/秒(kbps)的采样率来再建数字传输过程中的模拟声音信号的质量。但是,通过使用开发语音信号的冗余的压缩技术,可以减少在空中传送的信息量,同时仍然保持高质量。
通常,由编码器来执行从模拟声音信号到数字信号的转换,而由解码器来执行将该数字信号转换回到声音信号。在示范CDMA系统中,包括编码部分和解码部分的声码器位于远程站和基站内。标题为《可变速率声码器》的第5,414,796号美国专利中描述了一种示范声码器,该美国专利被受让于本发明的受让人,并被包括于此,用作参考。在声码器中,编码部分提取涉及人类语音发生模型的参数。解码部分使用在传输通路上所接收的参数来重新合成该语音。该模型不断变化,以便精确地建模时变语音信号。这样,该语音被分成时间块或分析帧,在此期间对这些参数进行计算。然后,为每个新的帧更新这些参数。如这里所使用的,单词“解码器”指的是可以被用来转换已通过传输介质被接收的数字信号的任何设备或设备的任何部分。单词“编码器”指的是可以被用来将声信号转换成数字信号的任何设备或设备的任何部分。因此,可以利用CDMA系统的声码器或(作为选择)非CDMA系统的编码器和解码器来执行这里所描述的各个实施例。
在各种语音编码器种类中,“代码激励线性预测编码”(CELP)编码器、“随机编码”编码器或“矢量激励语音编码”编码器属于一个种类。标题为《增强的可变速率编码器》(EVRC)的“临时标准127”(IS-127)中描述了这种特定一种类的编码算法的一个例子。待批的提议草案《宽频带扩频通信系统的可选模式声码器服务选项》(号码为3GPP2 C.P9001的文档)中描述了这种特殊种类的编码器的另一个例子。该声码器的功能是:通过除去语音中所固有的所有自然冗余,将该数字化语音信号压缩成低比特率信号。在CELP编码器中,利用短期共振峰(或LPC)滤波器来除去冗余。一旦除去这些冗余,最后得到的残留信号可以被建模成白高斯噪声(white Gaussian noise)或白周期信号(whiteperiodic signal),也必须对该信号进行编码。因此,通过使用语音分析,随后经过在接收器处的适当的编码、传输和再合成,可以大大减小数据速率。
通过首先确定线性预测编码(LPC)滤波器的系数,来确定给定的语音帧的编码参数。适当地选择系数将会除去该帧中的语音信号的短期冗余。通过确定该语音信号的音调滞后L和音调增益gp,可以除去该信号中的长期周期冗余。可能的音调滞后值和音调增益值的组合作为矢量被存储在自适应的码本中。然后,从被存储在激励波形码本中的许多波形中选择激励信号。如果这个合适的激励信号由给定的音调滞后和音调增益来激励,然后被输入LPC滤波器,则可以产生很接近原始语音的信号。这样,通过传送LPC滤波器系数、自适应的码本矢量的标识以及固定的码本激励矢量的标识,可以执行压缩语音传输。
有效的激励码本结构被称作“代数码本”。代数码本的实际结构在该技术领域中众所周知,并且在J.P.Adoul等人的论文《基于代数编码的快速CELP编码》(1987年4月6-9日的ICASSP学报)中有所描述。标题为《基于代数编码的有效语音编码的动态码本》的第5,444,816号美国专利中进一步揭示了代数编码的使用,该美国专利的揭示说明被包括用作参考。
由于执行有关最佳激励矢量的码本搜索的高强度的计算要求和存储要求,因此,经常需要减少在进行码本搜索的过程中所涉及的存储要求。
发明内容
介绍了用于在编码器中执行快速码矢搜索的新颖的方法和装置。在一个方面中,介绍了一种方法,用于减少在码本中搜索矢量所需要的存储要求。
在另一个方面中,介绍了用于从脉冲矢量码本中选择最佳脉冲矢量的一种装置,其中,线性预测编码器使用该最佳脉冲矢量来为残留波形编码。该装置包括:脉冲响应发生器,用于生成脉冲响应;交叉相关元件,它被配置成确定交叉相关矢量,该交叉相关矢量将该脉冲响应和来自滤波器的多个目标信号采样联系起来,并使用该交叉相关矢量来确定多个脉冲位置,以便若将这多个脉冲位置插入该交叉相关矢量,则可提供预定数量的高交叉相关值;脉冲码本发生器,它被配置成从该交叉相关元件接收表示这多个脉冲位置的指示信号并且响应于该指示信号来输出多个脉冲矢量,其中,这多个脉冲矢量是该脉冲矢量码本的一个子集;以及计算元件,用于根据脉冲响应和确定的脉冲位置来确定自相关子矩阵,其中,使用该自相关子矩阵和交叉相关矢量来从码本中选择最佳脉冲矢量。
在另一个方面中,介绍了一种用于减少码本搜索的存储器要求的装置。该装置包括:脉冲响应发生器,用于生成脉冲响应信号;交叉相关元件,它被配置成确定交叉相关矢量,该交叉相关矢量将该脉冲响应信号和目标信号联系起来;选择元件,它被配置成接收该交叉相关矢量、使用该交叉相关矢量来识别最佳的一组脉冲位置并且生成携带最佳的这组脉冲位置的标识的指示信号;脉冲码本发生器,它被配置成从该选择元件接收该指示信号并生成多个脉冲矢量,其中,根据由指示信号携带的最佳的这组脉冲位置来生成这多个脉冲矢量;以及计算元件,用于根据脉冲响应信号和标识的脉冲位置集来确定自相关子矩阵,其中,使用该自相关子矩阵来替代自相关矩阵,从而降低了码本搜索的存储器要求。
在另一方面中,介绍了一种用于从多个脉冲矢量中选择最佳适配的脉冲矢量用于对残留波形编码的方法,该方法包括:根据目标信号与脉冲响应之间的交叉相关矢量来确定一最佳的脉冲位置集;确定与该最佳的脉冲位置集相对应的多个脉冲矢量,其中,这多个脉冲矢量小于脉冲波形码本;只根据脉冲响应和确定的脉冲位置集来计算自相关子矩阵;使用该自相关子矩阵来确定多个能量值,其中,每个能量值对应于这多个脉冲矢量中的一个脉冲矢量;以及从所述多个脉冲矢量中选择具有最高标准值的脉冲矢量作为最佳适配的脉冲矢量,其中,根据这多个能量值和该交叉相关矢量来确定该最高标准值。
在另一个方面中,介绍了一种用于从码本中选择最佳脉冲矢量的方法。该方法包括:确定目标信号与脉冲响应之间的交叉相关矢量,其中,该交叉相关矢量中的每个分量对应于分析帧中的一个位置;确定与该交叉相关矢量的P个最大分量相对应的P个脉冲位置;从该码本中选择多个脉冲矢量,以形成子码本(subcodebook),其中,这多个脉冲矢量中的每个脉冲矢量对应于这P个脉冲位置中的至少一个;根据这P个脉冲位置来确定自相关子矩阵;以及,根据该自相关子矩阵和交叉相关矢量来从这多个脉冲矢量中选择最佳脉冲矢量。
在另一方面中,介绍了一种用于从码本中选择最佳脉冲矢量的装置,它包括:用于确定目标信号与脉冲响应之间的交叉相关矢量的装置,其中,该交叉相关矢量中的每个分量对应于分析帧中的一个位置;用于确定与该交叉相关矢量的P个最大分量相对应的P个脉冲位置的装置;用于从码本中生成多个脉冲矢量以便形成子码本的装置,其中,这多个脉冲矢量中的每个脉冲矢量对应于这P个脉冲位置中的至少一个;用于根据这P个脉冲位置来确定自相关子矩阵的装置;以及用于根据该自相关子矩阵和交叉相关矢量来从这多个脉冲矢量中选择该最佳脉冲矢量的装置。
附图说明
图1是示范通信系统的框图。
图2是用于执行码本搜索的常规装置的框图。
图3是从脉冲码本中预先选择脉冲矢量的一个子集的方法步骤的流程图。
图4是用于通过预先选择并搜索子码本来执行码本搜索的装置的框图。
图5是用于在使用音调增强的脉冲响应的编码器中执行码本搜索的装置的框图。
图6是用于通过预先选择并搜索子码本而在使用音调增强的脉冲响应的编码器中执行码本搜索的装置的框图。
图7是用于通过使用查找表来执行快速码本搜索的方法步骤的流程图。
具体实施方式
如图1所示,无线通信网络10通常包括多个远程站(也被称作“移动站”或“订户单元”或“用户设备”)12a-12d、多个基站(也被称作“基站收发器(BTSs)”或“节点B”)14a-14c、基站控制器(BSC)(也被称作“无线电网络控制器”或“分组控制功能16”)、移动交换中心(MSC)或交换机18、分组数据服务节点(PDSN)或网络互连功能(IWF)20、公共交换电话网络(PSTN)22(通常是电话公司)和“互联网协议”(IP)网络24(通常是因特网)。为简单起见,示出四个远程站12a-12d、三个基站14a-14c、一个BSC 16、一个MSC 18和一个PDSN 20。精通该技术领域的人将会理解:可以有任何数量的远程站12、基站14、BSC 16、MSC 18和PDSN 20。
在一个实施例中,无线通信网络10是分组数据服务网络。远程站12a-12d可能是许多不同类型的无线通信设备(例如,便携式电话、与运行基于IP的Web浏览器应用程序的便携式计算机连接的移动电话、具有与免提汽车成套工具相关联的移动电话、运行基于IP的Web浏览器应用程序的个人数据助理(PDA)、被并入便携式计算机的无线通信模块或例如可能在无线本地环路或仪表读取系统中找得到的固定位置通信模块)中的任何无线通信设备。在最一般的实施例中,远程站可能是任何类型的通信单元。
可以将远程站12a-12d配置成执行例如EIA/TIA/IS-707标准中所描述的一个或多个无线分组数据协议。在特殊的实施例中,远程站12a-12d生成为IP网络24指定的IP分组,并使用点到点协议(PPP)将这些IP分组封装成帧。
在一个实施例中,根据几个已知协议(包括(例如)E1、T1、“异步传输模式”(ATM)、IP、“帧中继”、HDSL、ADSL或xDSL)中的任何协议,并且经由为声音和/或数据分组的传输而配置的有线线路,IP网络24被耦合到PDSN 20,PDSN 20被耦合到MSC 18,MSC 18被耦合到BSC 16和PSTN 22,BSC 16被耦合到基站14a-14c。在另一实施例中,BSC 16被直接耦合到PDSN 20,而MSC 18没有被耦合到PDSN 20。在另一个实施例中,远程站12a-12d通过RF接口与基站14a-14c进行通信;在将要作为TIA/EIA/IS-2000-2-A而公布的《
第3代合 作计划2“3GPP2”》和《cdma2000扩频系统的物理层标准》(号码为C.P0002-A、TIA PN-4694的3GPP2文档)(草案,编辑版本30)(1999年11月19日)中,对此RF接口有所定义,该文档被完全包括于此,用作参考。在另一个实施例中,远程站12a-12d通过RF接口与基站14a-14c进行通信;在《
第3代合作计划 “3GPP”》(号码为3G TS 25.211、3G TS 25.212、3G TS 25.213和3G TS 25.214的文档)中,对此RF接口有所定义。
在无线通信网络10的典型操作期间,基站14a-14c从从事处理电话呼叫、Web浏览或其他数据通信的各个远程站12a-12d接收各组反向链接信号,并对这些反向链接信号进行解调。在给定的基站14a-14c内处理由那个基站14a-14c接收的每个反向链接信号。通过调制各组前向链接信号并将其传送到远程站12a-12d,每个基站14a-14c可以与多个远程站12a-12d进行通信。例如,如图1所示,基站14a同时跟第一远程站12a和第二远程站12b进行通信,基站14c同时跟第三远程站12c和第四远程站12d进行通信。将最后得到的分组发送到BSC 16,BSC 16将提供呼叫资源分配和移动性管理功能(包括关于特定远程站12a-12d的从一个基站14a-14c提供给另一个基站14a-14c呼叫的软切换(soft handoffs)的指挥)。例如,远程站12c正在同时跟两个基站14a和14c进行通信。最后,当远程站12c离开基站14c之一足够远时,该呼叫用将被切换到另一个基站14b。
如果传输是常规的电话呼叫,则BSC 16将所接收的数据路由到MSC 18,MSC 18为与PSTN 22的接口提供附加的路由服务。如果传输是基于分组的传输(例如,为IP网络24指定的数据调用),则MSC 18将把这些数据分组路由到PDSN 20,PDSN 20将把这些分组发送到IP网络24。作为选择,BSC 16将把这些分组直接路由到PDSN 20,PDSN 20将这些分组发送到IP网络24。
如上所述,语音信号可以被分割成各个帧,然后通过使用LPC滤波器系数、自适应的码本矢量和固定码本矢量来加以建模。为了创建该语音信号的最佳模型,实际语音与再造语音之间的差异必须最小。用于确定该差异是否最小的一项技术是:确定实际语音与再造语音之间的相关值,然后选择具有最大相关属性的一组分量。
减少不使用音调增强的编码器的存储要求
图2是用于从码本中选择最佳激励矢量的常规编码器中的一种装置的框图。这种编码器被设计成将通过利用滤波器的脉冲响应卷积输入信号来搜索波形码本的过程中所涉及的计算复杂性减到最小,由于需要搜索多个波形,以便确定哪个波形会导致与目标信号的最接近的匹配,因此,进一步提高了所述复杂性。卷积的存储要求是M×M,其中的M是分析帧的尺寸。
一个帧的语音采样s(n)由感知的权重滤波器230来进行过滤,以产生目标信号x(n)。前述的第5,414,796号美国专利中描述了感知的权重滤波器的设计和实施。脉冲响应发生器210生成脉冲响应h(n)。通过使用脉冲响应h(n)和目标信号x(n),并根据以下的关系,在计算元件290处生成交叉相关矢量d(n):
计算元件250也使用脉冲响应h(n)来生成自相关矩阵:
将自相关矩阵φ的各个表项发送到计算元件240。脉冲码本发生器200生成多个脉冲矢量{ck,k=1,…,CBsize},这些脉冲矢量也被输入计算元件240。CBsize是将要从其中选择最佳码本矢量的码本的尺寸。Np是代表脉冲矢量中的脉冲数量的值。可以响应于多个脉冲位置信号{pi k,i=0,….,Np-1}(图中未示出)来生成激励波形码本(作为替代,在这里被称作“脉冲波形码本”或“脉冲码本”),其中,pi k是脉冲矢量ck中的第i个单位脉冲的位置。关于每个脉冲pi k,将对应的符号si k分配给该脉冲。以下的方程式提供了最后得到的码矢ck:
根据以下公式,计算元件240利用自相关矩阵φ来过滤这些脉冲矢量:
根据以下方程式,计算元件290也使用脉冲矢量{ck,k=1,…,CBsize}来确定d(n)与ck(n)之间的交叉相关:
一旦知道Eyy和Exy的值,计算元件260就使用以下的关系来确定值Tk:
与Tk的最大值相对应的脉冲矢量被选为最佳矢量,以对残留波形编码。
可以使用这里所描述的各个实施例来减少以上方案的存储要求。这里所描述的实施例确实可以使任何码本搜索在计算上更有效率。在一个实施例中,通过一个步骤来减少选择最佳码本矢量所要求的计算数量,该步骤是:从完整的码本中预先选择一个子集的脉冲矢量,然后只对预先选择的这个子集执行搜索。在一个实施例中,由交叉相关矢量d(n)来确定该预先选择。如果进行预先选择,那么,对应地使用较小的自相关矩阵φ来确定能量值Eyy。对于掌握该技术领域的普通技能的人而言,使用较小的、不完整的自相关矩阵φ可能似乎是不合需要的,因为可能不使用利用递归的、在计算上有效的方法。递归通常依靠过去值来计算将来值。故意省略递归中的某些值将会导致不合需要的结果。
但是,这里的实施例要求使用较小的自相关矩阵,以便以在计算中以牺牲使用递归的能力为代价,来减少码本搜索的存储要求。当预先选择的子集的尺寸很小时,在存储器减少方面的收获要远远超过提高计算复杂性的代价。
图3是一个实施例的流程图,在该实施例中,从该脉冲码本中预先选择脉冲矢量的一个子集。在步骤300中,为0≤n≤M-1而确定交叉相关矢量d(n),其中,M是该矢量的维数,它对应于分析帧的长度。在步骤302中,根据矢量d(n)(0≤n≤M-1)的P个最高值来选择长度为M的目标信号中的P(使P<M)个位置。出于说明的目的,用P’来表示这些预先选择的脉冲位置集合。为了进一步方便用符号表示,让p’i k成为脉冲矢量ck中的第i个单位脉冲,以便使p’i k属于集合P’。另外,让p’(i)(0≤i≤P-1)代表集合P’中的每个元件。例如,在尺寸M=80的帧中,可以预先选择该帧中的P=20个位置(p’(i),0≤i≤19),以便d(p’(i))在d(n)(0≤n≤79)的最高的20个值以内。
在步骤304中,根据多个码矢量是否只包含p’(i)(0≤i≤P-1)处的脉冲,来从该码本中选择这些码矢量。在步骤306中,根据以下公式来确定尺寸为P×P的子矩阵φ’:
在步骤308中,使用自相关子矩阵来为该子码本中的这些脉冲矢量确定能量项Eyy。不需要为该码本中的未被选择的脉冲矢量执行能量确定。在步骤310中,为该子码本的每个脉冲矢量确定标准值Tk。在步骤312中,与Tk的最大值相对应的该子码本的脉冲矢量被选为用于为语音信号编码的最佳脉冲矢量。可以交换这里所描述的各个方法步骤,而不会影响这里所描述的实施例的范围。
通过使用以上所描述的实施例,将码本矢量搜索所要求的存储空间从(M×M)减小到(P×P)。例如,如果分析帧长80个采样,那么,当根据20个脉冲位置来选择子码本时,分析帧的80×80=6400个位置的要求被减少到只有20×20=400。P的选择是一种实施细节,它可以根据其中执行这些实施例的编码器的存储器限制而变化。因此,P的可能的值的范围可以从1到M不等。
图4是一种装置,它被配置成:通过预先选择并搜索子码本来执行码本搜索。由感知的权重滤波器430来过滤一个帧的语音采样s(n),以产生目标信号x(n)。脉冲响应发生器410生成脉冲响应h(n)。通过使用脉冲响应h(n)和目标信号x(n),并根据以下的关系,在计算元件415处生成交叉相关矢量d(n):
通过使用由脉冲码本发生器400生成的脉冲矢量,选择元件425确定脉冲位置p’(i)(0≤i≤P-1),关于这些脉冲位置,d(p’(i))具有d(n)的P个最大值。根据以下公式,计算元件435使用脉冲位置p’(i)来确定交叉相关值(Exy’)2:
应该注意,脉冲数量仍然是Np,但这些脉冲位置只从集合P’中取值。
在一个实施例中,将交叉相关元件490配置成执行计算元件415、435和选择元件425的各项功能。在另一个实施例中,可以对该装置进行配置,以便由与执行计算元件415、435的功能的部件分开的部件来执行选择元件425的功能。可以在该装置内具有许多部件配置,而不会影响这里所描述的实施例的范围。
计算元件450进一步使用脉冲位置p’(i)来确定维数P×P的自相关子矩阵φ’,并且,脉冲码本发生器400进一步使用脉冲位置p’(i)来为该子码本确定搜索参数。
根据以下公式,计算元件450使用脉冲位置p’(i)’和脉冲响应h(n)来生成自相关子矩阵φ’:
将自相关子矩阵φ’的各个表项发送到计算元件440。
响应于来自选择元件425的多个脉冲位置信号{p’i k,i=0,….,Np-1},由脉冲码本发生器400生成脉冲子码本,其中,p’i k是脉冲矢量ck中的第i个单位脉冲的位置,以便p’i k是集合P’的一个元素。Np是代表脉冲矢量中的脉冲数量的值。脉冲码本发生器400生成多个脉冲矢量{ck,k=1,…,CB1size}其中,作为预先选择的结果,CB1size小于CBsize。
根据以下公式,计算元件440利用自相关子矩阵φ’来过滤这些脉冲矢量:
计算元件490也使用脉冲矢量{ck,k=1,…,CB1size)来确定如上所述的d(n)与ck(n)之间的交叉相关。
一旦知道Eyy和Exy的值,计算元件460就使用以下的关系来确定值Tk:
与Tk的最大值相对应的脉冲矢量被选为最佳矢量,以便为残留波形编码。在一个实施例中,在对最佳码本矢量的搜索期间,没有对该帧中的所有位置来索引这些脉冲位置。相反,只通过预先选择的位置来索引这些脉冲位置。
在另一个实施例中,可以将单一处理器和存储器配置成执行图4中的各个单独部件的所有功能。
减少使用音调增强的编码器的存储要求
在新一代的编码器(例如,“增强性可变速率多媒体数字信号编解码器”(EVRC)和“可选模式声码器”(SMV)))中,通过将经增益调整的前向和后向音调锐化过程加入语音信号的分析帧,来增强这些码本脉冲的音调周期性贡献。
其中,P是该子帧(subframe)中所包含的长度为L的音调滞后期(全部或局部)的数量,L是音调滞后,gp是音调增益。
图5是用于搜索激励码本的一种装置的框图,其中,该滤波器的脉冲响应已被音调增强。由感知的权重滤波器530来过滤一个帧的语音采样s(n),以产生目标信号x(n)。脉冲响应发生器510生成脉冲响应h(n)。脉冲响应h(n)被输入音调锐化器元件570,并产生合成脉冲响应
将合成脉冲响应
和目标信号x(n)输入计算元件590,以便根据以下的关系来确定交叉相关矢量d(n):
将自相关矩阵φ的各个项目发送到计算元件540。脉冲码本发生器500生成多个脉冲矢量{ck,k=1,…,CBsize},这些脉冲矢量也被输入计算元件540。CBsize是将要从其中选择最佳码本矢量的码本的尺寸。Np是代表脉冲矢量中的脉冲数量的值。根据以下公式,计算元件540利用该自相关矩阵来过滤这些脉冲矢量:
计算元件590也使用脉冲矢量{ck,k=1,…,CBsize}来根据以下公式确定d(n)与ck(n)之间的交叉相关:
一旦知道Eyy和Exy的值,计算元件560就使用以下的关系来确定值Tk:
与Tk的最大值相对应的脉冲矢量被选为最佳矢量,以便为残留波形编码。
图6是将执行编码器的快速码本搜索的一种装置的框图,该编码器在脉冲响应中加入音调增强。由感知的权重滤波器630来过滤一个帧的语音采样s(n),以产生目标信号x(n)。脉冲响应发生器610生成脉冲响应h(n)。脉冲响应h(n)被输入音调锐化器元件670,并产生合成脉冲响应
将合成脉冲响应
和目标信号x(n)输入计算元件615,以便根据以下的关系来确定交叉相关矢量d(n):
通过使用由脉冲码本发生器600生成的脉冲矢量,选择元件625确定脉冲位置p’(i)(0≤i≤P-1),关于这些脉冲位置,d(p’(i))具有d(n)的P个最大值。根据以下公式,计算元件635使用脉冲位置p’(i)来确定交叉相关值(Exy’)2:
在一个实施例中,将交叉相关元件690配置成执行计算元件615、635和选择元件625的各项功能。在另一个实施例中,可以对该装置进行配置,以便由与执行计算元件615、635的功能的部件分开的部件来执行选择元件625的功能。可以在该装置内具有许多部件配置,而不会影响这里所描述的各个实施例的范围。
计算元件650进一步使用脉冲位置p’(i)来确定维数P×P的自相关子矩阵φ’,并且,脉冲码本发生器600进一步使用脉冲位置p’(i)来为该子码本确定搜索参数。根据以下公式,计算元件650使用脉冲位置p’(i)和合成脉冲响应
来生成自相关子矩阵φ’:
将自相关子矩阵φ’的各个表项发送到计算元件640。
响应于来自选择元件425的多个脉冲位置信号{p’i k,i=0,….,Np-1),由脉冲码本发生器600生成脉冲子码本,其中,p’i k是脉冲矢量ck中的第i个单位脉冲的位置,使得p’i k是集合P’的一个元件。Np是代表脉冲矢量中的脉冲数量的值。脉冲码本发生器600生成多个脉冲矢量{ck,k=1,…,CB1size}。
根据以下公式,计算元件640利用自相关子矩阵φ’来过滤这些脉冲矢量:
计算元件635也使用脉冲矢量{ck,k=1,…,CB1size}来确定如上所述的d(n)与ck(n)之间的交叉相关Exy。
一旦知道Eyy和Exy的值,计算元件660就使用以下的关系来确定值Tk:
与Tk的最大值相对应的脉冲矢量被选为最佳矢量,以对残留波形编码。Eyy的以上计算的优点是:将前向和后向音调锐化加入码本搜索,而不需要进行存储器的密集计算。因此,这些实施例将关于M×M存储空间的现存要求转换成只关于P×P存储空间的要求。
降低2脉冲码本搜索的复杂性
在另一个实施例中,通过预先计算Eyy矩阵而不是自相关矩阵φ,来降低2脉冲(Np=2)搜索的复杂性。与以上为图6而描述的各个实施例相比来描述这个实施例,但应该注意,可以单独实行这个实施例,而不需有不适当的实验。仅仅出于说明的目的,使用图6的说明中的符号表示法。
图7是流程图,展示了使用存储查找表格(而不是密集计算)来确定最佳码矢。在步骤700中,使用LPC滤波器的脉冲响应h(n)和目标信号x(n)来确定交叉相关矢量d(n)。在步骤702中,根据以下公式来确定能量矢量Eyy:
Eyy(p′(i),p′(j))=
φ′(p′(i),i)+φ′(p′(j),p′(j))+2c(p′(i))c(p′(i))φ′(p′(i),p′(j)),
其中,0≤i,j≤P-1,并且,根据以下公式来计算φ’(i,j)值:
因此,不是计算整个矩阵φ’,而是计算矩阵φ’的特殊表项,并使用这些特殊表项来生成矩阵Eyy。在步骤704中,使用存储值Eyy(i,j)的查找表来执行对最佳码矢量的搜索。通过使用具有被存储的Eyy值的查找表,可以降低该搜索的复杂性,因为该系统不再需要相加矩阵φ的许多值来确定正在该码本中被加以搜索的每个脉冲矢量的Eyy值。
精通该技术领域的人将会理解:可以使用任何各种不同的技术和技能来表示信息和信号。例如,在整个上文中可能被参考的数据、指令、命令、信息、信号、位、符号和码片可以由电压、电流、电磁波、磁场或磁性粒子、光场或光粒子、或其任何组合来表示。
精通该技术领域的人将会进一步理解:联合这里所描述的各个实施例而描述的各种说明性逻辑块、模块、电路和运算步骤可以作为电子硬件、计算机软件或两者的组合来加以执行。为了清楚地展示硬件和软件的这种互换性,以上通常已在其功能性方面描述了部件、方框、模块、电路和步骤。这种功能性是作为硬件还是作为软件来加以执行则取决于被强加于总系统上的特定的应用程序和设计限制。技术娴熟的技工可以用不同的方法来为每个特定的应用程序执行所描述的功能性,但这类实施决定不应该被解释成会导致脱离本发明的范围。
可以利用通用处理器、数字信号处理器(DSP)、特定用途集成电路(ASIC)、域可编程门阵列(FPGA)或其他可编程逻辑设备、离散门电路或晶体管逻辑、离散硬件部件或被设计成用于执行这里所描述的各项功能的其任何组合来实施或执行联合这里所描述的各个实施例而描述的各种说明性逻辑块、模块和电路。通用处理器可能是微处理器,但作为替换,该处理器也可能是任何常规处理器、控制器、微控制器或状态机。处理器也可以作为计算设备的组合(例如,DSP和微处理器的组合、多个微处理器、结合DSP核心的一个或多个微处理器或其他任何这类配置)来加以执行。
联合这里所描述的各个实施例而描述的方法或运算的各个步骤可以在硬件中、在处理器所执行的软件模块中或在两者的组合中直接得到具体表现。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动磁盘、CD-ROM或该技术领域中已知的其他任何形式的存储介质中。示范存储介质被耦合到该处理器,以便该处理器可以从该存储介质读取信息并将信息写入该存储介质。作为另外的选择,该存储介质可以是该处理器不可分割的一部分。该处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。作为选择,该处理器和存储介质可以作为离散部件驻留在用户终端中。
通过提供有关所揭示的实施例的前面的描述,可使精通该技术领域的任何人能够制作或使用本发明。精通该技术领域的人将会容易明白对这些实施例所进行的各种修改;并且,在不脱离本发明的精神或范围的前提下,可以将这里所定义的普通原理应用于其他实施例。这样,本发明并不意在局限于这里所示的实施例,而是要符合跟这里所揭示的原理和新颖的特点相一致的最广泛的范围。
Claims (6)
1.一种用于从脉冲矢量码本中选择最佳脉冲矢量的装置,其中,线性预测编码器使用该最佳脉冲矢量来对残留波形编码,该装置的特征在于包括:
脉冲响应发生器,用于生成脉冲响应;
交叉相关元件,它被配置成确定将该脉冲响应与来自滤波器的多个目标信号采样联系起来的交叉相关矢量,并使用该交叉相关矢量来确定多个脉冲位置,使得若将所述多个脉冲位置插入该交叉相关矢量,则可提供预定数量的高交叉相关值;
脉冲码本发生器,它被配置成从该交叉相关元件接收表示所述多个脉冲位置的指示信号并且响应于该指示信号来输出多个脉冲矢量,其中,所述多个脉冲矢量是该脉冲矢量码本的一个子集;以及,
计算元件,用于根据脉冲响应和确定的脉冲位置来确定自相关子矩阵,其中,使用该自相关子矩阵和交叉相关矢量来从该码本中选择该最佳脉冲矢量。
2.权利要求1的装置,其中,该交叉相关元件包括:
至少一个计算元件,用于确定该交叉相关矢量;以及,
选择元件,用于确定所述多个脉冲位置,并用于生成该指示信号。
3.一种用于减少码本搜索的存储器要求的装置,包括:
脉冲响应发生器,用于生成脉冲响应信号;
交叉相关元件,它被配置成确定将该脉冲响应信号和目标信号联系起来的交叉相关矢量;
选择元件,它被配置成接收该交叉相关矢量、使用该交叉相关矢量来识别一最佳的脉冲位置集并且生成携带所述最佳的脉冲位置集的标识的指示信号;
脉冲码本发生器,它被配置成从该选择元件接收该指示信号并生成多个脉冲矢量,其中,根据指示信号所携带的最佳脉冲位置集的标识来生成所述多个脉冲矢量;以及,
计算元件,用于根据脉冲响应信号和标识的脉冲位置集来确定自相关子矩阵,其中,使用该自相关子矩阵来替代自相关矩阵,从而降低了该码本搜索的存储器要求。
4.一种用于从多个脉冲矢量中选择最佳适配的脉冲矢量用于对残留波形编码的方法,该方法包括:
根据目标信号与脉冲响应之间的交叉相关矢量来确定一最佳的脉冲位置集;
确定与该最佳的脉冲位置集相对应的多个脉冲矢量,其中,所述多个脉冲矢量小于脉冲波形码本;
只根据脉冲响应和确定的脉冲位置集来计算自相关子矩阵;
使用该自相关子矩阵来确定多个能量值,其中,每个能量值对应于所述多个脉冲矢量中的一个脉冲矢量;以及
从所述多个脉冲矢量中选择具有最高标准值的脉冲矢量作为最佳适配的脉冲矢量,其中,根据所述多个能量值和该交叉相关矢量来确定该最高标准值。
5.一种用于从码本中选择最佳脉冲矢量的方法,包括:
确定目标信号与脉冲响应之间的交叉相关矢量,其中,该交叉相关矢量中的每个分量对应于分析帧中的一个位置;
确定与该交叉相关矢量的P个最大分量相对应的P个脉冲位置;
从该码本中选择多个脉冲矢量,以形成子码本,其中,所述多个脉冲矢量中的每个脉冲矢量对应于所述P个脉冲位置中的至少一个;
根据所述P个脉冲位置来确定自相关子矩阵;以及,
根据该自相关子矩阵和交叉相关矢量来从所述多个脉冲矢量中选择该最佳脉冲矢量。
6.一种用于从码本中选择最佳脉冲矢量的装置,包括:
用于确定目标信号与脉冲响应之间的交叉相关矢量的装置,其中,该交叉相关矢量中的每个分量对应于分析帧中的一个位置;
用于确定与该交叉相关矢量的P个最大分量相对应的P个脉冲位置的装置;
用于从码本中生成多个脉冲矢量以便形成子码本的装置,其中,所述多个脉冲矢量中的每个脉冲矢量对应于所述P个脉冲位置中的至少一个;
用于根据所述P个脉冲位置来确定自相关子矩阵的装置;以及,
用于根据该自相关子矩阵和交叉相关矢量来从所述多个脉冲矢量中选择该最佳脉冲矢量的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/876,352 | 2001-06-06 | ||
US09/876,352 US6789059B2 (en) | 2001-06-06 | 2001-06-06 | Reducing memory requirements of a codebook vector search |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1539139A CN1539139A (zh) | 2004-10-20 |
CN100336101C true CN100336101C (zh) | 2007-09-05 |
Family
ID=25367508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB02815360XA Expired - Fee Related CN100336101C (zh) | 2001-06-06 | 2002-06-05 | 减少对于码本搜索的存储要求的装置和方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US6789059B2 (zh) |
EP (1) | EP1419500B1 (zh) |
KR (1) | KR100926599B1 (zh) |
CN (1) | CN100336101C (zh) |
AT (1) | ATE410770T1 (zh) |
DE (1) | DE60229270D1 (zh) |
HK (1) | HK1067222A1 (zh) |
TW (1) | TW561454B (zh) |
WO (1) | WO2002099788A1 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6714907B2 (en) * | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
EP1394773B1 (en) * | 2002-08-08 | 2006-03-29 | Alcatel | Method of coding a signal using vector quantization |
KR20050008356A (ko) * | 2003-07-15 | 2005-01-21 | 한국전자통신연구원 | 음성의 상호부호화시 선형 예측을 이용한 피치 지연 변환장치 및 방법 |
US7788091B2 (en) * | 2004-09-22 | 2010-08-31 | Texas Instruments Incorporated | Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs |
US7860710B2 (en) * | 2004-09-22 | 2010-12-28 | Texas Instruments Incorporated | Methods, devices and systems for improved codebook search for voice codecs |
US7752039B2 (en) * | 2004-11-03 | 2010-07-06 | Nokia Corporation | Method and device for low bit rate speech coding |
US8265929B2 (en) * | 2004-12-08 | 2012-09-11 | Electronics And Telecommunications Research Institute | Embedded code-excited linear prediction speech coding and decoding apparatus and method |
US7778826B2 (en) * | 2005-01-13 | 2010-08-17 | Intel Corporation | Beamforming codebook generation system and associated methods |
KR100813260B1 (ko) | 2005-07-13 | 2008-03-13 | 삼성전자주식회사 | 코드북 탐색 방법 및 장치 |
US7571094B2 (en) * | 2005-09-21 | 2009-08-04 | Texas Instruments Incorporated | Circuits, processes, devices and systems for codebook search reduction in speech coders |
KR20080052813A (ko) * | 2006-12-08 | 2008-06-12 | 한국전자통신연구원 | 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법 |
CN101039137B (zh) * | 2007-04-19 | 2010-04-14 | 上海交通大学 | Mimo-ofdm系统基于码本搜索减少预编码反馈比特数的方法及装置 |
MX2009013519A (es) * | 2007-06-11 | 2010-01-18 | Fraunhofer Ges Forschung | Codificador de audio para codificar una señal de audio que tiene una porcion similar a un impulso y una porcion estacionaria, metodos de codificacion, decodificador, metodo de decodificacion, y señal de audio codificada. |
KR101594815B1 (ko) * | 2008-10-20 | 2016-02-29 | 삼성전자주식회사 | 적응적으로 코드북을 생성하고 사용하는 다중 입출력 통신 시스템 및 통신 방법 |
US8516349B2 (en) | 2010-09-02 | 2013-08-20 | Microsoft Corporation | Generation and application of a sub-codebook of an error control coding codebook |
WO2012027819A1 (en) * | 2010-09-02 | 2012-03-08 | Nortel Networks Limited | Generation and application of a sub-codebook of an error control coding codebook |
ES2627410T3 (es) | 2011-01-14 | 2017-07-28 | Iii Holdings 12, Llc | Aparato para codificar una señal de voz/sonido |
CN104254886B (zh) * | 2011-12-21 | 2018-08-14 | 华为技术有限公司 | 自适应编码浊音语音的基音周期 |
US9972325B2 (en) * | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
US9112565B2 (en) * | 2013-12-18 | 2015-08-18 | Intel Corporation | User equipment and method for precoding for MIMO codebook-based beamforming using an autocorrelation matrix for reduced quantization noise |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4962536A (en) * | 1988-03-28 | 1990-10-09 | Nec Corporation | Multi-pulse voice encoder with pitch prediction in a cross-correlation domain |
US5327519A (en) * | 1991-05-20 | 1994-07-05 | Nokia Mobile Phones Ltd. | Pulse pattern excited linear prediction voice coder |
US5414796A (en) * | 1991-06-11 | 1995-05-09 | Qualcomm Incorporated | Variable rate vocoder |
EP0658877A2 (en) * | 1993-12-14 | 1995-06-21 | Nec Corporation | Speech coding apparatus |
CN1188557A (zh) * | 1996-02-15 | 1998-07-22 | 菲利浦电子有限公司 | 具有减少复杂性的合成滤波器的celp语音编码器 |
CN1189263A (zh) * | 1996-02-15 | 1998-07-29 | 菲利浦电子有限公司 | 复杂度减小的信号传输系统 |
CN1189264A (zh) * | 1996-02-15 | 1998-07-29 | 菲利浦电子有限公司 | 降低了复杂度的信号传输系统 |
CN1229509A (zh) * | 1997-06-18 | 1999-09-22 | 株式会社奥普特罗姆 | 具有电路的记录介质以及使用该记录介质的方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4901307A (en) | 1986-10-17 | 1990-02-13 | Qualcomm, Inc. | Spread spectrum multiple access communication system using satellite or terrestrial repeaters |
US5109390A (en) | 1989-11-07 | 1992-04-28 | Qualcomm Incorporated | Diversity receiver in a cdma cellular telephone system |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
JP2776050B2 (ja) * | 1991-02-26 | 1998-07-16 | 日本電気株式会社 | 音声符号化方式 |
US5265190A (en) * | 1991-05-31 | 1993-11-23 | Motorola, Inc. | CELP vocoder with efficient adaptive codebook search |
JPH11513813A (ja) * | 1995-10-20 | 1999-11-24 | アメリカ オンライン インコーポレイテッド | 反復的な音の圧縮システム |
US5751901A (en) * | 1996-07-31 | 1998-05-12 | Qualcomm Incorporated | Method for searching an excitation codebook in a code excited linear prediction (CELP) coder |
US5924062A (en) * | 1997-07-01 | 1999-07-13 | Nokia Mobile Phones | ACLEP codec with modified autocorrelation matrix storage and search |
US6067515A (en) * | 1997-10-27 | 2000-05-23 | Advanced Micro Devices, Inc. | Split matrix quantization with split vector quantization error compensation and selective enhanced processing for robust speech recognition |
US6714907B2 (en) * | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
US6219642B1 (en) * | 1998-10-05 | 2001-04-17 | Legerity, Inc. | Quantization using frequency and mean compensated frequency input data for robust speech recognition |
US6347297B1 (en) * | 1998-10-05 | 2002-02-12 | Legerity, Inc. | Matrix quantization with vector quantization error compensation and neural network postprocessing for robust speech recognition |
-
2001
- 2001-06-06 US US09/876,352 patent/US6789059B2/en not_active Expired - Lifetime
-
2002
- 2002-06-05 WO PCT/US2002/017816 patent/WO2002099788A1/en not_active Application Discontinuation
- 2002-06-05 CN CNB02815360XA patent/CN100336101C/zh not_active Expired - Fee Related
- 2002-06-05 EP EP02734694A patent/EP1419500B1/en not_active Expired - Lifetime
- 2002-06-05 AT AT02734694T patent/ATE410770T1/de not_active IP Right Cessation
- 2002-06-05 KR KR1020037015931A patent/KR100926599B1/ko not_active IP Right Cessation
- 2002-06-05 DE DE60229270T patent/DE60229270D1/de not_active Expired - Lifetime
- 2002-06-06 TW TW091112216A patent/TW561454B/zh not_active IP Right Cessation
-
2004
- 2004-12-24 HK HK04110238A patent/HK1067222A1/xx not_active IP Right Cessation
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4962536A (en) * | 1988-03-28 | 1990-10-09 | Nec Corporation | Multi-pulse voice encoder with pitch prediction in a cross-correlation domain |
US5327519A (en) * | 1991-05-20 | 1994-07-05 | Nokia Mobile Phones Ltd. | Pulse pattern excited linear prediction voice coder |
US5414796A (en) * | 1991-06-11 | 1995-05-09 | Qualcomm Incorporated | Variable rate vocoder |
EP0658877A2 (en) * | 1993-12-14 | 1995-06-21 | Nec Corporation | Speech coding apparatus |
CN1188557A (zh) * | 1996-02-15 | 1998-07-22 | 菲利浦电子有限公司 | 具有减少复杂性的合成滤波器的celp语音编码器 |
CN1189263A (zh) * | 1996-02-15 | 1998-07-29 | 菲利浦电子有限公司 | 复杂度减小的信号传输系统 |
CN1189264A (zh) * | 1996-02-15 | 1998-07-29 | 菲利浦电子有限公司 | 降低了复杂度的信号传输系统 |
CN1229509A (zh) * | 1997-06-18 | 1999-09-22 | 株式会社奥普特罗姆 | 具有电路的记录介质以及使用该记录介质的方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20040044411A (ko) | 2004-05-28 |
WO2002099788A1 (en) | 2002-12-12 |
HK1067222A1 (en) | 2005-04-01 |
US20030046066A1 (en) | 2003-03-06 |
ATE410770T1 (de) | 2008-10-15 |
EP1419500B1 (en) | 2008-10-08 |
KR100926599B1 (ko) | 2009-11-11 |
CN1539139A (zh) | 2004-10-20 |
TW561454B (en) | 2003-11-11 |
EP1419500A1 (en) | 2004-05-19 |
US6789059B2 (en) | 2004-09-07 |
DE60229270D1 (de) | 2008-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100336101C (zh) | 减少对于码本搜索的存储要求的装置和方法 | |
CN1306473C (zh) | 快速码向量搜索装置和方法 | |
CN1021938C (zh) | 控制代码激发信号编码器的方法和装置 | |
CN1432176A (zh) | 用于预测量化有声语音的方法和设备 | |
CN1347550A (zh) | Celp转发 | |
CN1167048C (zh) | 语音编码设备和语音解码设备 | |
CN1432175A (zh) | 可变速率语音编码器中的帧擦除补偿方法 | |
CN1922659A (zh) | 编码模式选择 | |
JP2011188510A (ja) | 帯域幅適応性量子化方法と装置 | |
CN1292914A (zh) | 语音编码 | |
CN1290077C (zh) | 用来对相位谱信息进行子抽样的方法和设备 | |
CN1266671C (zh) | 估算声音编码器的谐波的装置和方法 | |
JP3343082B2 (ja) | Celp型音声符号化装置 | |
CN101573752B (zh) | 用于将与第一位速率相关联的第一包弱化成与第二位速率相关联的第二包的系统和方法 | |
CN1784716A (zh) | 代码转换方法和设备 | |
JP2002073097A (ja) | Celp型音声符号化装置とcelp型音声復号化装置及び音声符号化方法と音声復号化方法 | |
CN1203411A (zh) | 矢量搜索方法 | |
JP3284874B2 (ja) | 音声符号化装置 | |
Chen et al. | Complexity scalability for ACELP and MP-MLQ speech coders | |
JP2001134298A (ja) | 音声符号化装置と音声復号化装置、及び音声符号化復号化システム | |
JP3205161B2 (ja) | 音声符号化装置 | |
Gersho | Linear prediction techniques in speech coding | |
JPH10161695A (ja) | 音声符号化装置 | |
JP2003015699A (ja) | 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置 | |
JP2005062410A (ja) | 音声信号の符号化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1067222 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1067222 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070905 Termination date: 20190605 |