CN101523484B - 用于帧擦除恢复的系统、方法和设备 - Google Patents
用于帧擦除恢复的系统、方法和设备 Download PDFInfo
- Publication number
- CN101523484B CN101523484B CN2007800368454A CN200780036845A CN101523484B CN 101523484 B CN101523484 B CN 101523484B CN 2007800368454 A CN2007800368454 A CN 2007800368454A CN 200780036845 A CN200780036845 A CN 200780036845A CN 101523484 B CN101523484 B CN 101523484B
- Authority
- CN
- China
- Prior art keywords
- frame
- pumping signal
- signal
- gain factor
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 134
- 238000011084 recovery Methods 0.000 title description 16
- 238000005086 pumping Methods 0.000 claims description 318
- 238000001228 spectrum Methods 0.000 claims description 93
- 238000007493 shaping process Methods 0.000 claims description 33
- 239000012634 fragment Substances 0.000 claims description 32
- 230000004044 response Effects 0.000 claims description 26
- 230000003044 adaptive effect Effects 0.000 abstract description 71
- 230000002459 sustained effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 46
- 230000000875 corresponding effect Effects 0.000 description 39
- 230000008569 process Effects 0.000 description 22
- 230000005540 biological transmission Effects 0.000 description 14
- 230000005284 excitation Effects 0.000 description 13
- 230000001413 cellular effect Effects 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 7
- 108010025037 T140 peptide Proteins 0.000 description 6
- 239000002131 composite material Substances 0.000 description 6
- 230000001747 exhibiting effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 102000003712 Complement factor B Human genes 0.000 description 5
- 108090000056 Complement factor B Proteins 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 230000002045 lasting effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 206010038743 Restlessness Diseases 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Control Of Amplification And Gain Control (AREA)
- Television Systems (AREA)
- Circuits Of Receivers In General (AREA)
- Electrolytic Production Of Metals (AREA)
- Manufacture, Treatment Of Glass Fibers (AREA)
- Detergent Compositions (AREA)
Abstract
在一种配置中,检测持续有声片段的重要帧的擦除。基于先前帧而计算用于所述经擦除帧的自适应码簿增益值。如果所述计算值小于(或者,不大于)阈值,则针对所述经擦除帧使用较高的自适应码簿增益值。所述较高值可从所述计算值导出或从一个或一个以上预定值中选择。
Description
相关申请案
本申请案主张2006年10月6日申请的代理人案号为061680P1且标题为“用于帧擦除恢复的系统、方法和设备(SYSTEMS,METHODS,AND APPARATUS FOR FRAMEERASURE RECOVERY)”的第60/828,414号美国临时专利申请案的优先权。
技术领域
本发明涉及语音信号的处理。
背景技术
通过数字技术来传输音频(例如话音和音乐)已变得较为普遍,尤其是在长距离电话、例如IP话音(还称为VoIP,其中IP表示因特网协议)等包交换式电话和例如蜂窝式电话等数字无线电电话中。此迅速扩散已使得产生了对减少用以经由传输信道传送话音通信的信息量且同时维持经重构语音的感知质量的关注。举例来说,需要最佳地利用可用无线系统带宽。一种用以有效地使用系统带宽的方式是采用信号压缩技术。对于载运语音信号的无线系统来说,语音压缩(或“语音编码”)技术通常用于此目的。
经配置以通过提取与人类语音产生模型有关的参数来压缩语音的装置经常称为声码器、“音频编码装置”或“语音编码装置”。音频编码装置通常包括编码器和解码器。编码器通常将传入的语音信号(表示音频信息的数字信号)划分为称为“帧”的时间片段,分析每一帧以提取某些相关参数,且将所述参数量化为经编码帧。经由传输信道(即,有线或无线网络连接)将经编码帧传输到包括解码器的接收器。解码器接收并处理经编码帧,对其进行解量化以产生参数,且使用经解量化参数来重建语音帧。
在典型会话中,每一说话者在约百分之六十的时间内是静默的。语音编码器通常经配置以区分语音信号的含有语音的帧(“有效帧”)与语音信号的仅含有静默或背景噪声的帧(“无效帧”)。此编码器可经配置以使用不同的编码模式和/或速率来编码有效帧和无效帧。举例来说,语音编码器通常经配置以使用比编码有效帧所使用的位少的位来编码无效帧。语音编码装置可对无效帧使用较低位速率,以支持以较低平均位速率进行语音信号传送,其中存在极少到毫无感知质量损失。
用以编码有效帧的位速率的实例包括171位/帧、80位/帧和40位/帧。用以编码无效帧的位速率的实例包括16位/帧。在蜂窝式电话系统(尤其是符合如由弗吉尼亚州阿灵顿电信工业协会(Telecommunications Industry Association,Arlington,VA)发布的暂用标准(IS)-95或类似工业标准的系统)的情形中,这四个位速率还分别称为“全速率”、“半速率”、“四分之一速率”和“八分之一速率”。
采用语音编码装置的许多通信系统(例如蜂窝式电话和卫星通信系统)依靠无线信道来传递信息。在传递此信息期间,无线传输信道可能遭受若干错误来源,例如多路径衰退。传输错误可能导致帧的不可恢复的讹误(还称为“帧擦除”)。在典型的蜂窝式电话系统中,帧擦除以百分之一到百分之三的比率发生,且可能甚至达到或超过百分之五。
采用音频编码布置(例如,因特网协议话音或“VoIP”)的包交换式网络中的包损失的问题非常类似于无线情形中的帧擦除。也就是说,由于包损失的缘故,音频解码器可能未能接收到帧或可能接收到具有大量位错误的帧。在任一情况下,音频解码器呈现有相同问题:不管经压缩语音信息的损失,仍需要产生经解码音频帧。出于此描述的目的,术语“帧擦除”可视为包括“包损失”。
帧擦除可在解码器处根据校验功能(例如CRC(循环冗余校验)功能或使用(例如)一个或一个以上校验和及/或奇偶校验位的其它错误检测功能)的失败而被检测到。此功能通常由信道解码器执行(例如,在多路复用子层中),所述信道解码器还可执行例如卷积解码和/或解交错等任务。在典型解码器中,帧错误检测器在接收到帧中存在不可校正错误的指示后便设定帧擦除旗标。解码器可经配置以选择帧擦除恢复模块来处理设定帧擦除旗标所针对的帧。
发明内容
根据一种配置的语音解码方法包括在经编码语音信号中检测持续有声片段的第二帧的擦除。所述方法还包括基于持续有声片段的第一帧而计算用于所述第二帧的替换帧。在此方法中,计算替换帧包括获得高于第一帧的对应增益值的增益值。
根据另一配置的获得经解码语音信号的帧的方法包括基于来自经编码语音信号的第一经编码帧的信息和第一激励信号而计算经解码语音信号的第一帧。此方法还包括响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且基于第二激励信号而计算所述经解码语音信号的紧跟在所述第一帧之后的第二帧。此方法还包括基于第三激励信号而计算在所述经解码语音信号的所述第一帧之前的第三帧。在此方法中,第一激励信号基于(A)基于来自第三激励信号的信息的第一值序列与(B)第一增益因数的乘积。在此方法中,计算第二帧包括根据阈值与基于第一增益因数的值之间的关系而产生第二激励信号,使得第二激励信号基于(A)基于来自所述第一激励信号的信息的第二值序列与(B)大于第一增益因数的第二增益因数的乘积。
根据另一配置的获得经解码语音信号的帧的方法包括产生第一激励信号,所述第一激励信号基于第一增益因数与第一值序列的乘积。此方法还包括基于第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧。此方法还包括响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且根据阈值与基于第一增益因数的值之间的关系而产生第二激励信号,所述第二激励信号基于(A)大于第一增益因数的第二增益因数与(B)第二值序列的乘积。此方法还包括基于第二激励信号而计算紧跟在经解码语音信号的所述第一帧之后的第二帧。此方法还包括基于第三激励信号而计算在经解码语音信号的所述第一帧之前的第三帧。在此方法中,第一序列基于来自第三激励信号的信息,且第二序列基于来自第一激励信号的信息。
根据另一配置的用于获得经解码语音信号的帧的设备包括激励信号产生器,其经配置以产生第一、第二和第三激励信号。此设备还包括频谱整形器,其经配置以:(A)基于第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧;(B)基于第二激励信号而计算紧跟在经解码语音信号的所述第一帧之后的第二帧;和(C)基于第三激励信号而计算在经解码语音信号的所述第一帧之前的第三帧。此设备还包括逻辑模块,其(A)经配置以评估阈值与基于第一增益因数的值之间的关系,且(B)经布置以接收经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示。在此设备中,激励信号产生器经配置以产生第一激励信号,所述第一激励信号基于(A)第一增益因数与(B)基于来自第三激励信号的信息的第一值序列的乘积。在此设备中,逻辑模块经配置以响应于所述擦除指示且根据所评估的关系而致使激励信号产生器产生第二激励信号,所述第二激励信号基于(A)大于第一增益因数的第二增益因数与(B)基于来自第一激励信号的信息的第二值序列的乘积。
根据另一配置的用于获得经解码语音信号的帧的设备包括用于产生基于第一增益因数与第一值序列的乘积的第一激励信号的装置。此设备还包括用于基于第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧的装置。此设备还包括用于响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且根据阈值与基于第一增益因数的值之间的关系而产生基于(A)大于第一增益因数的第二增益因数与(B)第二值序列的乘积的第二激励信号的装置。此设备还包括用于基于第二激励信号而计算紧跟在经解码语音信号的所述第一帧之后的第二帧的装置。此设备还包括用于基于第三激励信号而计算在经解码语音信号的所述第一帧之前的第三帧的装置。在此设备中,第一序列基于来自第三激励信号的信息,且第二序列基于来自第一激励信号的信息。
根据另一配置的计算机程序产品包括计算机可读媒体,其包括用于致使至少一个计算机产生基于第一增益因数与第一值序列的乘积的第一激励信号的代码。此媒体还包括用于致使至少一个计算机基于第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧的代码。此媒体还包括用于致使至少一个计算机响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且根据阈值与基于第一增益因数的值之间的关系而产生基于(A)大于第一增益因数的第二增益因数与(B)第二值序列的乘积的第二激励信号的代码。此媒体还包括用于致使至少一个计算机基于第二激励信号而计算紧跟在经解码语音信号的所述第一帧之后的第二帧的代码。此媒体还包括用于致使至少一个计算机基于第三激励信号而计算在经解码语音信号的所述第一帧之前的第三帧的代码。在此产品中,第一序列基于来自第三激励信号的信息,且第二序列基于来自第一激励信号的信息。
附图说明
图1为基于激励式合成滤波器的通用语音解码器的框图。
图2为表示有声语音片段随时间的振幅的图。
图3为具有固定和自适应码簿的CELP解码器的框图。
图4说明解码以CELP格式编码的帧系列的过程中的数据相依性。
图5展示多模式可变速率语音解码器的实例的框图。
图6说明解码跟随有CELP帧的NELP帧(例如,静默或无声语音帧)的序列的过程中的数据相依性。
图7说明处置跟随在以CELP格式编码的帧之后的帧擦除的过程中的数据相依性。
图8展示符合EVRC服务选项3的帧擦除方法的流程图。
图9展示包括持续有声片段的开始的时间帧序列。
图10a、图10b、图10c和图10d分别展示根据本发明的数种配置的方法M110、M120、M130和M140的流程图。
图11展示方法M120的实施方案M180的流程图。
图12展示根据一配置的语音解码器的实例的框图。
图13A展示根据通用配置的获得经解码语音信号的帧的方法M200的流程图。
图13B展示根据通用配置的用于获得经解码语音信号的帧的设备F200的框图。
图14说明方法M200的实施方案的应用中的数据相依性。
图15A展示方法M200的实施方案方法M201的流程图。
图15B展示对应于图15A的方法M201的设备F201的框图。
图16说明方法M201的典型应用中的一些数据相依性。
图17说明方法M201的实施方案的应用中的数据相依性。
图18展示方法M200的实施方案方法M203的流程图。
图19说明图18的方法M203的典型应用中的一些数据相依性。
图20说明图18的方法M203的应用的一些数据相依性。
图21A展示根据通用配置的用于获得经解码语音信号的帧的设备A100的框图。
图21B说明设备A100的典型应用。
图22展示描述逻辑模块110的实施方案112的操作的逻辑示意图。
图23展示逻辑模块110的实施方案114的操作的流程图。
图24展示逻辑模块110的另一实施方案116的操作的描述。
图25展示逻辑模块116的实施方案118的操作的描述。
图26A展示设备A100的实施方案A100A的框图。
图26B展示设备A100的实施方案A100B的框图。
图26C展示设备A100的实施方案A100C的框图。
图27A展示激励信号产生器120的实施方案122的框图。
图27B展示激励信号产生器122的实施方案124的框图。
图28展示语音参数计算器230的实施方案232的框图。
图29A展示包括擦除检测器210、格式检测器220、语音参数计算器230和设备A100的实施方案的系统的实例的框图。
图29B展示包括格式检测器220的实施方案222的系统的框图。
具体实施方式
本文中所描述的配置包括用于帧擦除恢复的系统、方法和设备,其可用以针对其中持续有声片段的重要帧被擦除的情况提供改进的效能。或者,持续有声片段的重要帧可被表示为关键帧。明确地预期且特此揭示,此类配置可适于在包交换式网络(例如,经布置以根据例如VoIP等协议来载运话音传输的有线和/或无线网络)和/或电路交换式网络中使用。还明确地预期且特此揭示,此类配置可适于在窄带编码系统(例如,编码约四千赫兹或五千赫兹的音频频率范围的系统)以及包括全带编码系统和分带编码系统的宽带编码系统(例如,编码大于五千赫兹的音频频率的系统)中使用。
除非受其上下文明确地限制,否则术语“产生”在本文中用以指示其普通意义中的任一者,例如计算或以其它方式生成。除非受其上下文明确地限制,否则术语“计算”在本文中用以指示其普通意义中的任一者,例如计算、评估和/或从值集合中选择。除非受其上下文明确地限制,否则术语“获得”用以指示其普通意义中的任一者,例如计算、导出、接收(例如,从外部装置)和/或检索(例如,从存储元件阵列)。在本描述和权利要求书中使用术语“包含”的情况下,其并不排除其它元件或操作。术语“基于”(如在“A基于B”中)用以指示其普通意义中的任一者,包括以下情况:(i)“基于至少”(例如,“A基于至少B”);以及如果在特定上下文中适当的话,则(ii)“等于”(例如,“A等于B”)。
除非另有指示,否则具有特定特征的语音解码器的任何揭示还明确地希望揭示具有类似特征的语音解码方法(且反之亦然),且根据特定配置的语音解码器的任何揭示还明确地希望揭示根据类似配置的语音解码方法(且反之亦然)。
出于语音编码目的,语音信号通常经数字化(或量化)以获得样本流。数字化过程可根据此项技术中已知的各种方法中的任一者来执行,所述方法包括(例如)脉冲码调制(PCM)、压扩μ法则PCM和压扩A法则PCM。窄带语音编码器通常使用8kHz的取样速率,而宽带语音编码器通常使用较高取样速率(例如,12kHz或16kHz)。
经数字化语音信号被处理为帧系列。此系列通常被实施为非重叠系列,但处理帧或帧片段(还称为子帧)的操作还可在其输入中包括一个或一个以上相邻帧的片段。语音信号的帧通常足够短以使得可预期信号的频谱包络在所述帧内保持相对稳定。一帧通常对应于语音信号的5毫秒与35毫秒之间(或约40到200个样本),其中10毫秒、20毫秒和30毫秒为常见帧大小。经编码帧的实际大小可随编码位速率而逐帧改变。
20毫秒的帧长度对应于处于七千赫兹(kHz)的取样速率下的140个样本、处于8kHz的取样速率下的160个样本和处于16kHz的取样速率下的320个样本,但可使用被视为适合于特定应用的任何取样速率。可用于语音编码的取样速率的另一实例为12.8kHz,且另外实例包括在从12.8kHz到38.4kHz的范围内的其它速率。
通常,所有帧具有相同长度,且在本文中所描述的特定实例中假定均一帧长度。然而,还明确地预期且特此揭示,可使用非均一帧长度。举例来说,方法M100和M200的实施方案还可在针对有效帧和无效帧和/或针对有声帧和无声帧采用不同帧长度的应用中使用。
经编码帧通常含有可从其重构语音信号的对应帧的值。举例来说,经编码帧可包括所述帧内的能量在频谱上的分布的描述。此能量分布还称为帧的“频率包络”或“频谱包络”。经编码帧通常包括描述所述帧的频谱包络的有序值序列。在一些情况下,所述有序序列中的每一值指示信号在对应频率处或在对应频谱区域内的振幅或量值。此描述的一个实例为有序傅立叶(Fourier)变换系数序列。
在其它情况下,有序序列包括编码模型的参数的值。此有序序列的一个典型实例为线性预测编码(LPC)分析的系数的值的集合。这些系数编码经编码语音的共振(还称为“共振峰”)且可经配置作为滤波器系数或作为反射系数。最现代的语音编码装置的编码部分包括提取用于每一帧的LPC系数值集合的分析滤波器。所述集合(其通常经布置为一个或一个以上向量)中的系数值的数目还称为LPC分析的“阶”。如由通信装置(例如蜂窝式电话)的语音编码器所执行的LPC分析的典型阶的实例包括4、6、8、10、12、16、20、24、28和32。
频谱包络的描述通常以量化形式出现在经编码帧内(例如,作为进入对应查找表或“码簿”中的一个或一个以上索引)。因此,习惯上使解码器接收呈对于量化更有效的形式的LPC系数值集合,例如线谱对(LSP)、线谱频率(LSF)、导抗谱对(ISP)、导抗谱频率(ISF)、倒谱系数或对数面积比的值的集合。语音解码器通常经配置以将此集合转换成对应LPC系数值集合。
图1展示包括激励式合成滤波器的语音解码器的通用实例。为了解码经编码帧,使用经解量化LPC系数值以在解码器处配置合成滤波器。经编码帧还可包括时间信息或描述帧周期内随时间的能量分布的信息。举例来说,时间信息可描述用以激励合成滤波器以再生语音信号的激励信号。
语音信号的有效帧可经分类为两个或两个以上不同类型中的一者,例如有声(例如,表示元音声)、无声(例如,表示摩擦音)或过渡(例如,表示词的开头或结尾)。有声语音的帧倾向于具有长期(即,持续一个以上帧周期)且与音调有关的周期性结构,且通常更有效的是使用编码此长期频谱特征的描述的编码模式来编码有声帧(或有声帧序列)。此类编码模式的实例包括代码激励线性预测(CELP)、原型音调周期(PPP)和原型波形内插(PWI)。另一方面,无声帧和无效帧通常缺乏任何显著的长期频谱特征,且语音编码器可经配置以使用并不试图描述此特征的编码模式来编码这些帧。噪声激励线性预测(NELP)是此编码模式的一个实例。
图2展示有声语音片段(例如元音)随时间的振幅的一个实例。对于有声帧来说,激励信号通常酷似在音调频率处为周期性的脉冲系列,而对于无声帧来说,激励信号通常类似于白高斯(Gaussian)噪声。CELP编码装置可利用作为有声语音片段的特性的较高周期性来实现更好的编码效率。
CELP编码装置是使用一个或一个以上码簿来编码激励信号的合成式分析语音编码装置。在编码器处,选择一个或一个以上码簿条目。解码器接收这些条目的码簿索引以及增益因数的对应值(其还可为进入一个或一个以上增益码簿中的索引)。解码器通过增益因数来缩放码簿条目(或基于其的信号)以获得激励信号,所述激励信号用以激励合成滤波器且获得经解码语音信号。
一些CELP系统使用音调预测性滤波器来模型化周期性。其它CELP系统使用自适应码簿(或ACB,还称为“音调码簿”)来模型化激励信号的周期性或音调相关分量,其中固定码簿(还称为“创新码簿”)通常用以将非周期性分量模型化为(例如)脉冲位置系列。一般来说,高有声片段是最为感知相关的。对于使用自适应CELP方案来编码的高有声语音帧来说,激励信号的大部分由ACB模型化,所述ACB通常为强周期性的,其中主要频率分量对应于音调滞后。
对激励信号的ACB贡献表示当前帧的残余部分与来自一个或一个以上过去帧的信息之间的相关性。ACB通常被实施为存储过去语音信号的样本或其导出物(例如语音残余或激励信号)的存储器。举例来说,ACB可含有被延迟不同量的先前残余部分的复本。在一个实例中,ACB包括先前合成的语音激励波形的不同音调周期的集合。
经自适应编码的帧的一个参数是音调滞后(还称为延迟或音调延迟)。此参数通常经表达为最大化所述帧的自相关功能的语音样本数目且可包括分数分量。人类话音的音调频率通常在从40Hz到500Hz的范围内,其对应于约200到16个样本。自适应CELP解码器的一个实例通过音调滞后来转译选定ACB条目。解码器还可内插经转译条目(例如,使用有限脉冲响应或FIR滤波器)。在一些情况下,音调滞后可充当ACB索引。自适应CELP解码器的另一实例经配置以根据音调滞后参数的对应连续但不同的值而使自适应码簿的片段平滑(或“时间扭曲”)。
经自适应编码的帧的另一参数是ACB增益(或音调增益),其指示长期周期性的强度且通常针对每一子帧来评估。为了获得对用于特定子帧的激励信号的ACB贡献,解码器将内插信号(或其对应部分)乘以对应ACB增益值。图3展示具有ACB的CELP解码器的一个实例的框图,其中gc和gp分别表示码簿增益和音调增益。另一常见ACB参数是Δ延迟,其指示当前帧与先前帧之间的延迟差值且可用以计算经擦除或讹误帧的音调滞后。
众所周知的时域语音编码装置是L.B.拉比纳(L.B.Rabiner)和R.W.夏佛(R.W.Schafer)的“语音信号的数字处理(Digital Processing of Speech Signals)”第396到453页(1978年)中所描述的代码激励线性预测(CELP)编码装置。示范性可变速率CELP编码装置在第5,414,796号美国专利中描述,所述专利转让给本发明的受让人且以引用的方式全部并入本文中。存在CELP的许多变型。代表性实例包括下列各项:AMR语音编解码器(自适应多速率,第三代合作伙伴计划(3GPP)技术规格(TS)26.090,第4、5和6章,2004年12月);AMR-WB语音编解码器(AMR-宽带,国际电信联盟(ITU)-T建议G.722.2,第5和6章,2003年7月);以及EVRC(增强型可变速率编解码器,电子工业联盟(EIA)/电信工业协会(TIA)暂用标准IS-127,第4章和第5章,1997年1月)。
图4说明解码CELP帧系列的过程中的数据相依性。经编码帧B提供自适应增益因数B,且自适应码簿提供基于来自先前激励信号A的信息的序列A。解码过程产生基于自适应增益因数B和序列A的激励信号B,所述激励信号B根据来自经编码帧B的频谱信息而经频谱整形以产生经解码帧B。解码过程还基于激励信号B而更新自适应码簿。下一经编码帧C提供自适应增益因数C,且自适应码簿提供基于激励信号B的序列B。解码过程产生基于自适应增益因数C和序列B的激励信号C,所述激励信号C根据来自经编码帧C的频谱信息而经频谱整形以产生经解码帧C。解码过程还基于激励信号C而更新自适应码簿,等等,直到遇到以不同编码模式(例如,NELP)编码的帧为止。
可能需要使用可变速率编码方案(例如,以平衡网络需求和容量)。还可能需要使用多模式编码方案,其中根据基于(例如)周期性或发声的分类而使用不同模式来编码帧。举例来说,可能需要使语音编码装置针对有效帧和无效帧使用不同的编码模式和/或位速率。还可能需要使语音编码装置针对不同类型的有效帧使用不同的位速率与编码模式组合(还称为“编码方案”)。此语音编码装置的一个实例针对含有有声语音的帧和过渡帧使用全速率CELP方案,针对含有无声语音的帧使用半速率NELP方案,且针对无效帧使用八分之一速率NELP方案。此语音编码装置的其它实例支持用于一个或一个以上编码方案(例如全速率与半速率CELP方案和/或全速率与四分之一速率PPP方案)的多个编码速率。
图5展示接收包和对应包类型指示符(例如,从多路复用子层)的多模式可变速率解码器的实例的框图。在此实例中,帧错误检测器根据包类型指示符来选择对应速率(或擦除恢复),且解包化器分解包且选择对应模式。或者,帧擦除检测器可经配置以选择正确编码方案。此实例中的可用模式包括全速率与半速率CELP、全速率与四分之一速率PPP(原型音调周期,用于强有声帧)、NELP(用于无声帧)和静默。解码器通常包括经配置以减少量化噪声(例如,通过强调共振峰频率和/或衰减频谱谷)的后置滤波器且还可包括自适应增益控制。
图6说明解码跟随有CELP帧的NELP帧的过程中的数据相依性。为了解码经编码NELP帧N,解码过程产生噪声信号作为激励信号N,所述激励信号N根据来自经编码帧N的频谱信息而经频谱整形以产生经解码帧N。在此实例中,解码过程还基于激励信号N而更新自适应码簿。经编码CELP帧C提供自适应增益因数C,且自适应码簿提供基于激励信号N的序列N。NELP帧N的激励信号与CELP帧C的激励信号之间的相关性可能非常低,使得序列N与帧C的激励信号之间的相关性也可能非常低。因此,自适应增益因数C可能具有接近于零的值。解码过程产生名义上基于自适应增益因数C和序列N但可能更大量地基于来自经编码帧C的固定码簿信息的激励信号C,且激励信号C根据来自经编码帧C的频谱信息而经频谱整形以产生经解码帧C。解码过程还基于激励信号C而更新自适应码簿。
在一些CELP编码装置中,针对每一帧而更新LPC系数,而针对每一子帧而更新例如音调滞后和/或ACB增益等激励参数。在AMR-WB中,举例来说,针对四个子帧中的每一者而将例如音调滞后和ACB增益等CELP激励参数更新一次。在EVRC的CELP模式中,160样本帧的三个子帧(分别具有长度53、53和54个样本)中的每一者具有对应ACB和FCB增益值以及对应FCB索引。单个编解码器内的不同模式还可以不同方式处理帧。在EVRC编解码器中,举例来说,CELP模式根据具有三个子帧的帧来处理激励信号,而NELP模式根据具有四个子帧的帧来处理激励信号。还存在根据具有两个子帧的帧来处理激励信号的模式。
可变速率语音解码器可经配置以从例如帧能量等一个或一个以上参数确定经编码帧的位速率。在一些应用中,编码系统经配置以针对特定位速率仅使用一个编码模式,使得经编码帧的位速率还指示编码模式。在其它情况下,经编码帧可包括例如一个或一个以上位的集合等信息,其识别编码所述帧所根据的编码模式。此位集合还称为“编码索引”。在一些情况下,编码索引可明确地指示编码模式。在其它情况下,编码索引可(例如)通过指示对于另一编码模式将为无效的值来隐含地指示编码模式。在此描述和所附权利要求书中,术语“格式”或“帧格式”用以指示经编码帧的可从中确定编码模式的一个或一个以上方面,所述方面可包括如上所述的位速率和/或编码索引。
图7说明处置跟随在CELP帧之后的帧擦除的过程中的数据相依性。如在图4中,经编码帧B提供自适应增益因数B,且自适应码簿提供基于来自先前激励信号A的信息的序列A。解码过程产生基于自适应增益因数B和序列A的激励信号B,所述激励信号B根据来自经编码帧B的频谱信息而经频谱整形以产生经解码帧B。解码过程还基于激励信号B而更新自适应码簿。响应于下一经编码帧被擦除的指示,解码过程继续以先前编码模式(即,CELP)进行操作,使得自适应码簿提供基于激励信号B的序列B。在此情况下,解码过程产生基于自适应增益因数B和序列B的激励信号X,所述激励信号X根据来自经编码帧B的频谱信息而经频谱整形以产生经解码帧X。
图8展示符合3GPP2标准C.S0014-Av1.0(EVRC服务选项3)(第5章,2004年4月)的帧擦除恢复方法的流程图。第2002/0123887号美国专利申请公开案(恩诺(Unno))描述根据ITU-T建议G.729的类似过程。此方法可(例如)通过如图5所示的帧错误恢复模块来执行。所述方法以检测到当前帧为不可用(例如,用于当前帧的帧擦除旗标[FER(m)]的值为真)来起始。任务T110确定先前帧是否也为不可用。在此实施方案中,任务T110确定用于先前帧的帧擦除旗标[FER(m-1)]的值是否也为真。
如果先前帧未被擦除,则任务T120将用于当前帧的平均自适应码簿增益[gpavg(m)]的值设定为用于先前帧的平均自适应码簿增益[gpavg(m-1)]的值。否则(即,如果先前帧也被擦除),则任务T130将用于当前帧的平均ACB增益[gpavg(m)]的值设定为用于先前帧的平均ACB增益[gpavg(m-1)]的经衰减版本。在此实例中,任务T130将平均ACB增益设定为gpavg(m-1)的值的0.75倍。任务T140接着将用于当前帧的子帧的ACB增益[gp(m.i),其中i=0,1,2]的值设定为gpavg(m)的值。通常,针对经擦除帧而将FCB增益因数设定为零。3GPP2标准C.S0014-Cv1.0的章节5.2.3.5针对EVRC服务选项68而描述此方法的变型,其中如果先前帧被擦除或经处理为静默或NELP帧,则将用于当前帧的子帧的ACB增益[gp(m.i),其中i=0,1,2]的值设定为零。
跟随在帧擦除之后的帧可仅在无记忆系统或编码模式中毫无错误地进行解码。对于利用与一个或一个以上过去帧的相关性的模式来说,帧擦除可能致使错误传播到后续帧中。举例来说,自适应解码器的状态变量可能需要一些时间来从帧擦除中恢复。对于CELP编码装置来说,自适应码簿引入强帧间相依性且通常是此错误传播的主因。因此,典型的是使用不高于先前平均值的ACB增益(如在任务T120中)或甚至使ACB增益衰减(如在任务T130中)。然而,在某些情况下,此实践可能会不利地影响后续帧的再生。
图9说明包括跟随有持续有声片段的非有声片段的帧序列的实例。所述持续有声片段可出现在例如“crazy”或“feel”等单词中。如此图中所指示,持续有声片段的第一帧对过去具有低相依性。具体地说,如果使用自适应码簿来编码所述帧,则用于所述帧的自适应码簿增益值将较低。对于持续有声片段中的其余帧来说,ACB增益值将由于邻近帧之间的强相关性而通常较高。
在此情形中,如果持续有声片段的第二帧被擦除,则可能出现问题。因为此帧对先前帧具有高相依性,所以其自适应码簿增益值应较高,从而加强周期性分量。然而,因为帧擦除恢复将通常从先前帧重构经擦除帧,所以经恢复帧将具有低自适应码簿增益值,使得来自先前有声帧的贡献将不适当地低。此错误可传播穿过接下来的若干帧。出于此些原因,持续有声片段的第二帧还称为重要帧。或者,持续有声片段的第二帧还可称为关键帧。
图10a、图10b、图10c和图10d展示根据本发明的相应配置的方法M110、M120、M130和M140的流程图。这些方法中的第一任务(任务T11、T12和T13)检测在帧擦除之前的两个帧中的一个或一个以上特定模式序列或(任务T14)检测持续有声片段的重要帧的擦除。在任务T11、T12和T13中,通常参考编码那些帧所根据的模式来确定特定序列。
在方法M110中,任务T11检测序列(非有声帧、有声帧、帧擦除)。“非有声帧”的类别可包括静默帧(即,背景噪声)以及例如摩擦音等无声帧。举例来说,类别“无声帧”可经实施为包括以NELP模式或静默模式(其通常也为NELP模式)编码的帧。如图10b所示,“有声帧”的类别可在任务T12中限于使用CELP模式(例如,在还具有一个或一个以上PPP模式的解码器中)而编码的帧。此类别还可进一步限于使用具有自适应码簿的CELP模式(例如,在还支持仅具有固定码簿的CELP模式的解码器中)而编码的帧。
方法M130的任务T13按照用于帧中的激励信号来特性化目标序列,其中第一帧具有非周期性激励(例如,如在NELP或静默编码中所使用的随机激励),且第二帧具有自适应周期性激励(例如,如在具有自适应码簿的CELP模式中所使用)。在另一实例中,任务T13经实施以使得所检测序列还包括不具有激励信号的第一帧。方法M140的任务T14(其检测持续有声片段的重要帧的擦除)可经实施以检测紧跟在序列(NELP或静默帧、CELP帧)之后的帧擦除。
任务T20至少部分地基于擦除之前的帧来获得增益值。举例来说,所获得的增益值可为针对经擦除帧而预测(例如,通过帧擦除恢复模块)的增益值。在特定实例中,增益值为通过帧擦除恢复模块而针对经擦除帧所预测的激励增益值(例如ACB增益值)。图8的任务T110到T140展示一个实例,其中基于在擦除之前的帧而预测若干ACB值。
如果检测到所指示序列(或所指示序列中的一者),则任务T30将所获得的增益值与阈值进行比较。如果所获得的增益值小于(或者,不大于)所述阈值,则任务T40增加所获得的增益值。举例来说,任务T40可经配置以将正值添加到所获得的增益值或将所获得的增益值乘以大于一的因数。或者,任务T40可经配置以用一个或一个以上较高值来替换所获得的增益值。
图11展示方法M120的配置M180的流程图。任务T110、T120、T130和T140如上文所描述。在已设定gpavg(m)的值(任务T120或T130)之后,任务N210、N220和N230测试与当前帧和近来历史有关的某些条件。任务N210确定先前帧是否经编码为CELP帧。任务N220确定先前帧之前的帧是否经编码为非有声帧(例如,经编码为NELP或静默)。任务N230确定gpavg(m)的值是否小于阈值Tmax。如果任务N210、N220和N230中的任一者的结果为否定的,则如上所述来执行任务T140。否则,任务N240将新增益轮廓指派给当前帧。
在图11所示的特定实例中,任务N240将值T1、T2和T3分别指派给gp(m.i)(其中i=0,1,2)的值。这些值可经布置以使得T1≥T2≥T3,从而产生为水平或渐减的增益轮廓,其中T1接近于(或等于)Tmax。
任务N240的其它实施方案可经配置以将gp(m.i)的一个或一个以上值乘以相应增益因数(至少一个增益因数大于一)或共用增益因数,或将正偏移添加到gp(m.i)的一个或一个以上值。在此些情况下,可能需要对gp(m.i)的每一值强加上限(例如,Tmax)。任务N210到N240可经实施为帧擦除恢复模块内的硬件、固件和/或软件例行程序。
在一些技术中,从在一个或一个以上先前帧和(可能)一个或一个以上跟随帧期间所接收的信息外推经擦除帧。在一些配置中,先前帧与未来帧两者中的语音参数用于重构经擦除帧。在此情况下,任务T20可经配置以基于擦除之前的帧与擦除之后的帧两者来计算所获得的增益值。另外或替代地,任务T40的实施方案(例如,任务N240)可使用来自未来帧的信息来选择增益轮廓(例如,经由内插增益值)。举例来说,任务T40的此实施方案可选择水平或渐增的增益轮廓代替渐减的增益轮廓,或选择渐增的增益轮廓代替水平的增益轮廓。此种类的配置可使用抖动缓冲器来指示未来帧是否可用于此用途。
图12展示根据一配置的包括帧擦除恢复模块100的语音解码器的框图。此模块100可经配置以执行如本文中所描述的方法M110、M120、M130或M180。
图13A展示根据通用配置的获得经解码语音信号的帧的方法M200的流程图,所述方法包括任务T210、T220、T230、T240、T245和T250。任务T210产生第一激励信号。基于第一激励信号,任务T220计算经解码语音信号的第一帧。任务T230产生第二激励信号。基于第二激励信号,任务T240计算紧跟在经解码语音信号的第一帧之后的第二帧。任务T245产生第三激励信号。依据特定应用而定,任务T245可经配置以产生基于所产生噪声信号和/或基于来自自适应码簿的信息(例如,基于来自一个或一个以上先前激励信号的信息)的第三激励信号。基于第三激励信号,任务T250计算紧接在经解码语音信号的第一帧之前的第三帧。图14说明方法M200的典型应用中的一些数据相依性。
任务T210响应于经编码语音信号的第一经编码帧具有第一格式的指示而执行。第一格式指示将使用基于对过去激励信息的记忆的激励信号来解码所述帧(例如,使用CELP编码模式)。对于在第一经编码帧的位速率下仅使用一个编码模式的编码系统来说,位速率的确定可足以确定编码模式,使得位速率的指示还可用以指示帧格式。
对于在第一经编码帧的位速率下使用一个以上编码模式的编码系统来说,经编码帧可包括编码索引,例如识别编码模式的一个或一个以上位的集合。在此情况下,格式指示可基于编码索引的确定。在一些情况下,编码索引可明确地指示编码模式。在其它情况下,编码索引可(例如)通过指示对于另一编码模式将为无效的值来隐含地指示编码模式。
响应于格式指示,任务T210产生基于第一值序列的第一激励信号。第一值序列基于来自第三激励信号的信息,例如第三激励信号的片段。第一序列与第三激励信号之间的此关系由图13A中的虚线指示。在典型实例中,第一序列基于第三激励信号的最后子帧。任务T210可包括从自适应码簿检索第一序列。
图13B展示根据通用配置的用于获得经解码语音信号的帧的设备F200的框图。设备F200包括用于执行图13A的方法M200的各种任务的装置。装置F210产生第一激励信号。基于第一激励信号,装置F220计算经解码语音信号的第一帧。装置F230产生第二激励信号。基于第二激励信号,装置F240计算紧跟在经解码语音信号的第一帧之后的第二帧。装置F245产生第三激励信号。依据特定应用而定,装置F245可经配置以产生基于所产生噪声信号和/或基于来自自适应码簿的信息(例如,基于来自一个或一个以上先前激励信号的信息)的第三激励信号。基于第三激励信号,装置F250计算紧接在经解码语音信号的第一帧之前的第三帧。
图14展示其中任务T210产生基于第一增益因数和第一序列的第一激励信号的实例。在此情况下,任务T210可经配置以产生基于第一增益因数与第一序列的乘积的第一激励信号。第一增益因数可基于来自第一经编码帧的信息,例如自适应增益码簿索引。任务T210可经配置以产生基于来自第一经编码帧的其它信息(例如指定对第一激励信号的固定码簿贡献的信息(例如,一个或一个以上码簿索引和对应增益因数值或码簿索引))的第一激励信号。
基于第一激励信号和来自第一经编码帧的信息,任务T220计算经解码语音信号的第一帧。通常,来自第一经编码帧的信息包括频谱参数值集合(例如,一个或一个以上LSF或LPC系数向量),使得任务T220经配置以根据所述频谱参数值来整形第一激励信号的频谱。任务T220还可包括对第一激励信号、来自第一经编码帧的信息和/或所计算的第一帧执行一个或一个以上其它处理操作(例如,滤波、平滑、内插)。
任务T230响应于紧跟在经编码语音信号中的第一经编码帧之后的经编码帧的擦除的指示而执行。所述擦除指示可基于下列条件中的一者或一者以上:(1)所述帧含有过多位错误要恢复;(2)针对所述帧而指示的位速率为无效或无支持的;(3)所述帧的所有位均为零;(4)针对所述帧而指示的位速率为八分之一速率,且所述帧的所有位均为一;(5)所述帧为空白的且上一有效位速率不为八分之一速率。
任务T230还根据阈值与基于第一增益因数的值(还称为“基线增益因数值”)之间的关系而执行。举例来说,任务T230可经配置以在基线增益因数值小于(或者,不大于)阈值的情况下执行。尤其对于其中第一经编码帧仅包括一个自适应码簿增益因数的应用来说,基线增益因数值可仅仅为第一增益因数的值。对于其中第一经编码帧包括若干自适应码簿增益因数(例如,用于每一子帧的不同因数)的应用来说,基线增益因数值还可基于其它自适应码簿增益因数中的一者或一者以上。在此情况下,举例来说,如在参看图11而论述的值gpavg(m)中,基线增益因数值可为第一经编码帧的自适应码簿增益因数的平均值。
任务T230还可响应于第一经编码帧具有第一格式且在第一经编码帧之前的经编码帧(“先前帧”)具有不同于第一格式的第二格式的指示而执行。第二格式指示将使用基于噪声信号的激励信号来解码所述帧(例如,使用NELP编码模式)。对于在先前帧的位速率下仅使用一个编码模式的编码系统来说,位速率的确定可足以确定编码模式,使得位速率的指示还可用来指示帧格式。或者,先前帧可包括指示编码模式的编码索引,使得格式指示可基于编码索引的确定。
任务T230产生基于大于第一增益因数的第二增益因数的第二激励信号。第二增益因数还可大于基线增益因数值。举例来说,第二增益因数可等于或甚至大于阈值。对于其中任务T230经配置以产生第二激励信号作为一系列子帧激励信号的情况来说,可针对每一子帧激励信号使用第二增益因数的不同值,其中所述值中的至少一者大于基线增益因数值。在此情况下,第二增益因数的不同值可能需要经布置以在帧周期内上升或下降。
任务T230通常经配置以产生基于第二增益因数与第二值序列的乘积的第二激励信号。如图14所示,第二序列基于来自第一激励信号的信息,例如第一激励信号的片段。在典型实例中,第二序列基于第一激励信号的最后子帧。因此,任务T210可经配置以基于来自第一激励信号的信息而更新自适应码簿。对于将方法M200应用于支持松弛CELP(RCELP)编码模式的编码系统来说,任务T210的此实施方案可经配置以根据音调滞后参数的对应值来使片段时间扭曲。此扭曲操作的实例在上文所引用的3GPP2文献C.S0014-Cv1.0的章节5.2.2(参看章节4.11.5)中描述。任务T230的其它实施方案可包括如上所述的方法M110、M120、M130、M140和M180中的一者或一者以上。
基于第二激励信号,任务T240计算紧跟在经解码语音信号的第一帧之后的第二帧。如图14所示,任务T240还可经配置以基于来自第一经编码帧的信息(例如,如上所述的频谱参数值集合)而计算第二帧。举例来说,任务T240可经配置以根据频谱参数值集合来整形第二激励信号的频谱。
或者,任务T240可经配置以根据基于所述频谱参数值集合的第二频谱参数值集合来整形第二激励信号的频谱。举例来说,任务T240可经配置以将第二频谱参数值集合计算为来自第一经编码帧的频谱参数值集合与初始频谱参数值集合的平均值。此计算为加权平均值的实例在上文所引用的3GPP2文献C.S0014-Cv1.0的章节5.2.1中描述。任务T240还可包括对第二激励信号、来自第一经编码帧的信息和所计算的第二帧中的一者或一者以上执行一个或一个以上其它处理操作(例如,滤波、平滑、内插)。
基于第三激励信号,任务T250计算在经解码语音信号中的第一帧之前的第三帧。任务T250还可包括通过存储第一序列来更新自适应码簿,其中第一序列基于第三激励信号的至少一片段。对于方法M200应用于支持松弛CELP(RCELP)编码模式的编码系统的应用来说,任务T250可经配置以根据音调滞后参数的对应值来使片段时间扭曲。此扭曲操作的实例在上文所引用的3GPP2文献C.S0014-Cv1.0的章节5.2.2(参看章节4.11.5)中描述。
经编码帧的至少一些参数可经布置以将对应经解码帧的一方面描述为子帧系列。举例来说,常见的是使根据CELP编码模式而格式化的经编码帧包括用于所述帧的频谱参数值集合和用于所述子帧中的每一者的独立时间参数集合(例如,码簿索引和增益因数值)。对应解码器可经配置以通过子帧递增地计算经解码帧。在此情况下,任务T210可经配置以产生第一激励信号作为子帧激励信号系列,使得所述子帧激励信号中的每一者可基于不同增益因数和/或序列。任务T210还可经配置以用来自子帧激励信号中的每一者的信息来连续地更新自适应码簿。同样地,任务T220可经配置以基于第一激励信号的不同子帧而计算第一经解码帧的每一子帧。任务T220还可经配置以在帧之间内插子帧内的频谱参数集合或以其它方式使其平滑。
图15A展示解码器可经配置以使用来自基于噪声信号的激励信号(例如,响应于NELP格式的指示而产生的激励信号)的信息来更新自适应码簿。明确地说,图15A展示方法M200(来自图13A且上文论述)的此实施方案M201的流程图,所述实施方案M201包括任务T260和T270。任务T260产生噪声信号(例如,近似白高斯噪声的伪随机信号),且任务T270产生基于所产生的噪声信号的第三激励信号。再次,第一序列与第三激励信号之间的关系由图15A中的虚线指示。可能需要使任务T260使用基于来自对应经编码帧的其它信息(例如,频谱信息)的种子值来产生噪声信号,因为此技术可用以支持在编码器处已使用的相同噪声信号的产生。方法M201还包括任务T250(来自图13A且上文论述)的实施方案T252,其基于第三激励信号而计算第三帧。任务T252还经配置以基于来自紧接在第一经编码帧之前(“先前帧”)且具有第二格式的经编码帧的信息而计算第三帧。在此些情况下,任务T230可基于(A)先前帧具有第二格式和(B)第一经编码帧具有第一格式的指示。
图15B展示对应于上文相对于图15A所论述的方法M201的设备F201的框图。设备F201包括用于执行方法M201的各种任务的装置。各种元件可根据能够执行此些任务的任何结构(包括用于执行本文中所揭示的此些任务的结构中的任一者)来实施(例如,作为一个或一个以上指令集合、一个或一个以上逻辑元件阵列,等等)。图15B展示解码器可经配置以使用来自基于噪声信号的激励信号(例如,响应于NELP格式的指示而产生的激励信号)的信息来更新自适应码簿。图15B的设备F201类似于图13B的设备F200,其中添加了装置F260、F270和F252。装置F260产生噪声信号(例如,近似白高斯噪声的伪随机信号),且装置F270产生基于所产生的噪声信号的第三激励信号。再次,第一序列与第三激励信号之间的关系由所说明的虚线指示。可能需要使装置F260使用基于来自对应经编码帧的其它信息(例如,频谱信息)的种子值来产生噪声信号,因为此技术可用以支持在编码器处已使用的相同噪声信号的产生。设备F201还包括对应于装置F250(来自图13A且上文论述)的装置F252。装置F252基于第三激励信号而计算第三帧。装置F252还经配置以基于来自紧接在第一经编码帧之前(“先前帧”)且具有第二格式的经编码帧的信息而计算第三帧。在此情况下,装置F230可基于(A)先前帧具有第二格式和(B)第一经编码帧具有第一格式的指示。
图16说明方法M201的典型应用中的一些数据相依性。在此应用中,紧接在第一经编码帧之前的经编码帧(在此图中被指示为“第二经编码帧”)具有第二格式(例如,NELP格式)。如图16所示,任务T252经配置以基于来自第二经编码帧的信息而计算第三帧。举例来说,任务T252可经配置以根据基于来自第二经编码帧的信息的频谱参数值集合来整形第三激励信号的频谱。任务T252还可包括对第三激励信号、来自第二经编码帧的信息和所计算的第三帧中的一者或一者以上执行一个或一个以上其它处理操作(例如,滤波、平滑、内插)。任务T252还可经配置以基于来自第三激励信号的信息(例如,第三激励信号的片段)而更新自适应码簿。
语音信号通常包括期间说话者静默的周期。可能需要使编码器在此周期期间针对不到全部的无效帧传输经编码帧。此操作还称为不连续传输(DTX)。在一个实例中,语音编码器通过针对具有32个连续无效帧的每一串传输一个经编码无效帧(还称为“静默描述符”、“静默描述”或SID)来执行DTX。在其它实例中,语音编码器通过针对具有不同数目的连续无效帧(例如,8个或16个)的每一串传输一个SID和/或通过在某其它事件(例如帧能量改变或频谱倾斜)后即传输SID来执行DTX。对应解码器针对尚未接收到经编码帧时的后续帧周期使用所述SID中的信息(通常,频谱参数值和增益轮廓)来合成无效帧。
可能需要在还支持DTX的编码系统中使用方法M200。图17说明方法M201的此应用的一些数据相依性,其中第二经编码帧为SID帧,且此帧与第一经编码帧之间的帧被消隐(此处被指示为“DTX时间间隔”)。将第二经编码帧连接到任务T252的线为虚线,以指示来自第二经编码帧的信息(例如,频谱参数值)用以计算经解码语音信号的一个以上帧。
如上所述,任务T230可响应于在第一经编码帧之前的经编码帧具有第二格式的指示而执行。对于如图17所示的应用来说,第二格式的此指示可为紧接在第一经编码帧之前的帧对于DTX而被消隐的指示,或NELP编码模式用以计算经解码语音信号的对应帧的指示。或者,第二格式的此指示可为第二经编码帧的格式的指示(即,在第一经编码帧之前的最后SID帧的格式的指示)。
图17展示特定实例,其中第三帧紧接在经解码语音信号中的第一帧之前且对应于DTX时间间隔内的最后帧周期。在其它实例中,第三帧对应于DTX时间间隔内的另一帧周期,使得一个或一个以上帧将经解码语音信号中的第三帧与第一帧分离。图17还展示其中在DTX时间间隔期间不更新自适应码簿的实例。在其它实例中,在DTX时间间隔期间所产生的一个或一个以上激励信号用以更新自适应码簿。
对基于噪声的激励信号的记忆可能对于产生用于后续帧的激励信号没有用。因此,可能需要使解码器不使用来自基于噪声的激励信号的信息来更新自适应码簿。举例来说,此解码器可经配置以仅在解码CELP帧时或仅在解码CELP、PPP或PWI帧时且不在解码NELP帧时更新自适应码簿。
图18展示方法M200(图13A)的此实施方案方法M203的流程图,所述方法M203包括任务T260、T280和T290。任务T280产生基于由任务T260所产生的噪声信号的第四激励信号。在此特定实例中,任务T210和T280经配置以根据第二经编码帧具有第二格式的指示而执行,如实线所指示。基于第四激励信号,任务T290计算经解码语音信号的紧接在第三帧之前的第四帧。方法M203还包括任务T250(图13A)的实施方案T254,其基于来自任务T245的第三激励信号而计算经解码语音信号的第三帧。
任务T290基于来自在第一经编码帧之前的第二经编码帧的信息(例如频谱参数值集合)而计算第四帧。举例来说,任务T290可经配置以根据频谱参数值集合来整形第四激励信号的频谱。任务T254基于来自在第二经编码帧之前的第三经编码帧的信息(例如频谱参数值集合)而计算第三帧。举例来说,任务T254可经配置以根据频谱参数值集合来整形第三激励信号的频谱。任务T254还可经配置以响应于第三经编码帧具有第一格式的指示而执行。
图19说明方法M203(图18)的典型应用中的一些数据相依性。在此应用中,第三经编码帧可通过其激励信号不用以更新自适应码簿的一个或一个以上经编码帧(例如,具有NELP格式的经编码帧)来与第二经编码帧分离。在此情况下,第三与第四经解码帧将通常通过使第二与第三经编码帧分离的相同数目的帧来分离。
如上所述,可能需要在还支持DTX的编码系统中使用方法M200。图20说明方法M203(图18)的此应用的一些数据相依性,其中第二经编码帧为SID帧,且此帧与第一经编码帧之间的帧被消隐。将第二经编码帧连接到任务T290的线为虚线,以指示来自第二经编码帧的信息(例如,频谱参数值)用以计算经解码语音信号的一个以上帧。
如上所述,任务T230可响应于在第一经编码帧之前的经编码帧具有第二格式的指示而执行。对于如图20所示的应用来说,第二格式的此指示可为紧接在第一经编码帧之前的帧针对DTX而被消隐的指示,或NELP编码模式用以计算经解码语音信号的对应帧的指示。或者,第二格式的此指示可为第二经编码帧的格式的指示(即,在第一经编码帧之前的最后SID帧的格式的指示)。
图20展示特定实例,其中第四帧紧接在经解码语音信号中的第一帧之前且对应于DTX时间间隔内的最后帧周期。在其它实例中,第四帧对应于DTX时间间隔内的另一帧周期,使得一个或一个以上帧将经解码语音信号中的第四帧与第一帧分离。
在方法M200(图13A)的实施方案的典型应用中,逻辑元件阵列(例如,逻辑门)经配置以执行所述方法的各种任务中的一者、一者以上或甚至全部。所述任务中的一者或一者以上(可能为全部)还可被实施为包含于计算机程序产品(例如,一个或一个以上数据存储媒体,例如磁盘、快闪或其它非易失性存储卡、半导体存储器芯片,等等)中的代码(例如,一个或一个以上指令集合),所述代码可由包括逻辑元件阵列(例如,处理器、微处理器、微控制器或其它有限状态机)的机器(例如,计算机)读取且/或执行。方法M200(图13A)的实施方案的任务还可通过一个以上此阵列或机器来执行。在这些或其它实施方案中,所述任务可在用于无线通信的装置(例如蜂窝式电话或具有此通信能力的其它装置)内执行。此装置可经配置以与电路交换式和/或包交换式网络通信(例如,使用例如VoIP等一个或一个以上协议)。举例来说,此装置可包括经配置以接收经编码帧的RF电路。
图21A展示根据通用配置的用于获得经解码语音信号的帧的设备A100的框图。举例来说,设备A100可经配置以执行包括如本文中所述的方法M100或M200的实施方案的语音解码方法。图21B说明设备A100的典型应用,所述设备经配置以基于(A)经编码语音信号的第一经编码帧和(B)紧跟在经编码语音信号中的第一经编码帧之后的帧的擦除的指示而计算经解码语音信号的连续第一和第二帧。设备A100包括:逻辑模块110,其经布置以接收擦除指示;激励信号产生器120,其经配置以如上所述产生第一、第二和第三激励信号;以及频谱整形器130,其经配置以计算经解码语音信号的第一和第二帧。
包括设备A100的通信装置(例如蜂窝式电话)可经配置以从有线、无线或光学传输信道接收包括经编码语音信号的传输。此装置可经配置以对载波信号进行解调且/或对传输执行预处理操作以获得经编码语音信号,例如解交错和/或解码错误校正码。此装置还可包括设备A100和用于编码且/或传输双工会话的另一语音信号的设备(例如,如在收发器中)的两者的实施方案。
逻辑模块110经配置且经布置以致使激励信号产生器120输出第二激励信号。第二激励信号基于大于基线增益因数值的第二增益因数。举例来说,逻辑模块110与激励信号产生器120的组合可经配置以执行如上所述的任务T230。
逻辑模块110可经配置以根据若干条件而从两个或两个以上选项中选择第二增益因数。这些条件包括:(A)最近经编码帧具有第一格式(例如,CELP格式);(B)在最近经编码帧之前的经编码帧具有第二格式(例如,NELP格式);(C)当前经编码帧被擦除;以及(D)阈值与基线增益因数值之间的关系具有特定状态(例如,阈值大于基线增益因数值)。图22展示描述使用AND门140和选择器150的逻辑模块110的此实施方案112的操作的逻辑示意图。如果所有所述条件均为真,则逻辑模块112选择第二增益因数。否则,逻辑模块112选择基线增益因数值。
图23展示逻辑模块110的另一实施方案114的操作的流程图。在此实例中,逻辑模块114经配置以执行如图8所示的任务N210、N220和N230。逻辑模块114的实施方案还可经配置以执行如图8所示的任务T110到T140中的一者或一者以上(可能全部)。
图24展示逻辑模块110的包括状态机的另一实施方案116的操作的描述。对于每一经编码帧来说,状态机根据当前经编码帧的格式或擦除的指示来更新其状态(其中状态1为初始状态)。如果状态机在其接收到当前帧被擦除的指示时处于状态3,则逻辑模块116确定基线增益因数值是否小于(或者,不大于)阈值。依据此比较的结果而定,逻辑模块116在基线增益因数值或第二增益因数中选择一者。
激励信号产生器120可经配置以产生第二激励信号作为子帧激励信号系列。逻辑模块110的对应实施方案可经配置以针对每一子帧激励信号选择或以其它方式产生第二增益因数的不同值,其中所述值中的至少一者大于基线增益因数值。举例来说,图25展示逻辑模块116的经配置以执行如图8所示的任务T140、T230和T240的此实施方案118的操作的描述。
逻辑模块120可经布置以从包括在设备A100内或在设备A100外部(例如,在包括设备A100的装置(例如蜂窝式电话)内)的擦除检测器210接收擦除指示。擦除检测器210可经配置以在检测到下列条件中的任何一者或一者以上后即产生用于帧的擦除指示:(1)所述帧含有过多位错误要恢复;(2)针对所述帧而指示的位速率为无效或无支持的;(3)所述帧的所有位均为零;(4)针对所述帧而指示的位速率为八分之一速率,且所述帧的所有位均为一;(5)所述帧为空白的,且上一有效位速率不为八分之一速率。
逻辑模块110的另外实施方案可经配置以执行擦除处理的额外方面,例如由如上所述的帧擦除恢复模块100所执行的那些方面。举例来说,逻辑模块110的此实施方案可经配置以执行例如计算基线增益因数值和/或计算用于对第二激励信号进行滤波的频谱参数值集合等任务。对于其中第一经编码帧仅包括一个自适应码簿增益因数的应用来说,基线增益因数值可仅仅为第一增益因数的值。对于其中第一经编码帧包括若干自适应码簿增益因数(例如,用于每一子帧的不同因数)的应用来说,基线增益因数值还可基于其它自适应码簿增益因数中的一者或一者以上。在此情况下,举例来说,逻辑模块110可经配置以将基线增益因数值计算为第一经编码帧的自适应码簿增益因数的平均值。
逻辑模块110的实施方案可根据其致使激励信号产生器120输出第二激励信号的方式来分类。逻辑模块110的一个类别110A包括经配置以将第二增益因数提供到激励信号产生器120的实施方案。图26A展示设备A100的实施方案A100A的框图,所述实施方案A100A包括逻辑模块110的此实施方案和激励信号产生器120的对应实施方案120A。
逻辑模块110的另一类别110B包括经配置以致使激励信号产生器110从两个或两个以上选项中选择第二增益因数(例如,作为输入)的实施方案。图26B展示设备A100的实施方案A100B的框图,所述实施方案A100B包括逻辑模块110的此实施方案和激励信号产生器120的对应实施方案120B。在此情况下,在图22中经展示为在逻辑模块112内的选择器150改为位于激励信号产生器120B内。明确地预期且特此揭示,逻辑模块110的实施方案112、114、116、118中的任一者可根据类别110A或类别110B来进行配置和布置。
图26C展示设备A100的实施方案A100C的框图。设备A100C包括逻辑模块110的类别110B的实施方案,其经布置以致使激励信号产生器120从两个或两个以上激励信号中选择第二激励信号。激励信号产生器120C包括激励信号产生器120的两个子实施方案120C1、120C2,其中一者经配置以产生基于第二增益因数的激励信号,且另一者经配置以产生基于另一增益因数值(例如,基线增益因数值)的激励信号。激励信号产生器120C经配置以通过选择基于第二增益因数的激励信号而根据从逻辑模块110B到选择器150的控制信号来产生第二激励信号。应注意,激励信号产生器120的类别120C的配置与类别120A或120B的对应实施方案相比可能消耗较多的处理循环、功率和/或存储量。
激励信号产生器120经配置以产生基于第一增益因数和第一值序列的第一激励信号。举例来说,激励信号产生器120可经配置以执行如上所述的任务T210。第一值序列基于来自第三激励信号的信息,例如第三激励信号的片段。在典型实例中,第一序列基于第三激励信号的最后子帧。
激励信号产生器120的典型实施方案包括经配置以接收和存储第一序列的存储器(例如,自适应码簿)。图27A展示激励信号产生器120的包括此存储器160的实施方案122的框图。或者,自适应码簿的至少一部分可位于在设备A100内部或外部的其它地方的存储器中,使得第一序列的一部分(可能为全部)经提供作为到激励信号产生器120的输入。
如图27A所示,激励信号产生器120可包括乘法器170,其经配置以计算当前增益因数与序列的乘积。第一增益因数可基于来自第一经编码帧的信息,例如增益码簿索引。在此情况下,激励信号产生器120可包括增益码簿以及经配置以检索第一增益因数作为对应于此索引的值的逻辑。激励信号产生器120还可经配置以接收指示第一序列在自适应码簿内的位置的自适应码簿索引。
激励信号产生器120可经配置以产生基于来自第一经编码帧的额外信息的第一激励信号。此信息可包括指定对第一激励信号的固定码簿贡献的一个或一个以上固定码簿索引和对应增益因数值或码簿索引。图27B展示激励信号产生器122的实施方案124的框图,所述实施方案124包括经配置以存储所产生的激励信号可基于的其它信息的码簿180(例如,固定码簿)、经配置以计算固定码簿序列与固定码簿增益因数的乘积的乘法器190和经配置以将激励信号计算为固定码簿贡献与自适应码簿贡献的总和的加法器195。激励信号产生器124还可包括经配置以根据对应索引而从相应码簿检索序列和增益因数的逻辑。
激励信号产生器120还经配置以产生基于第二增益因数和第二值序列的第二激励信号。第二增益因数大于第一增益因数且可大于基线增益因数值。第二增益因数还可等于或甚至大于阈值。对于其中激励信号产生器120经配置以产生第二激励信号作为子帧激励信号系列的情况来说,可针对每一子帧激励信号使用第二增益因数的不同值,其中所述值中的至少一者大于基线增益因数值。在此情况下,可能需要使第二增益因数的不同值经布置以在帧周期内上升或下降。
第二值序列基于来自第一激励信号的信息,例如第一激励信号的片段。在典型实例中,第二序列基于第一激励信号的最后子帧。因此,激励信号产生器120可经配置以基于来自第一激励信号的信息而更新自适应码簿。对于设备A100应用于支持松弛CELP(RCELP)编码模式的编码系统的应用来说,激励信号产生器120的此实施方案可经配置以根据音调滞后参数的对应值来使片段时间扭曲。此扭曲操作的实例在上文所引用的3GPP2文献C.S0014-Cv1.0的章节5.2.2(参看章节4.11.5)中描述。
激励信号产生器120还经配置以产生第三激励信号。在一些应用中,激励信号产生器120经配置以产生基于来自自适应码簿(例如,存储器160)的信息的第三激励信号。
激励信号产生器120可经配置以产生基于噪声信号的激励信号(例如,响应于NELP格式的指示而产生的激励信号)。在此些情况下,激励信号产生器120可经配置以包括经配置以执行任务T260的噪声信号产生器。可能需要使噪声产生器使用基于来自对应经编码帧的其它信息(例如频谱信息)的种子值,因为此技术可用以支持在编码器处已使用的相同噪声信号的产生。或者,激励信号产生器120可经配置以接收所产生的噪声信号。依据特定应用而定,激励信号产生器120可经配置以产生基于所产生的噪声信号的第三激励信号(例如,以执行任务T270)或产生基于所产生的噪声信号的第四激励信号(例如,以执行任务T280)。
激励信号产生器120可经配置以根据帧格式的指示来产生基于来自自适应码簿的序列的激励信号或产生基于所产生的噪声信号的激励信号。在此情况下,激励信号产生器120通常经配置以在当前帧被擦除的情况下根据上一有效帧的编码模式来继续操作。
激励信号产生器122通常经实施以更新自适应码簿,使得存储在存储器160中的序列基于用于先前帧的激励信号。如上所述,自适应码簿的更新可包括根据音调滞后参数的值来执行时间扭曲操作。激励信号产生器122可经配置以在每一帧处(或甚至在每一子帧处)更新存储器160。或者,激励信号产生器122可经实施以仅在使用基于来自存储器的信息的激励信号而解码的帧处更新存储器160。举例来说,激励信号产生器122可经实施以基于来自用于CELP帧的激励信号的信息而不基于来自用于NELP帧的激励信号的信息来更新存储器160。对于其中不更新存储器160的帧周期来说,存储器160的内容可保持不变或可甚至复位到初始状态(例如,设定为零)。
频谱整形器130经配置以基于第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧。举例来说,频谱整形器130可经配置以执行任务T220。频谱整形器130还经配置以基于第二激励信号而计算经解码语音信号的紧跟在第一帧之后的第二帧。举例来说,频谱整形器130可经配置以执行任务T240。频谱整形器130还经配置以基于第三激励信号而计算经解码语音信号的在第一帧之前的第三帧。举例来说,频谱整形器130可经配置以执行任务T250。依据应用而定,频谱整形器130还可经配置以基于第四激励信号而计算经解码语音信号的第四帧(例如,以执行任务T290)。
频谱整形器130的典型实施方案包括根据用于帧的频谱参数值集合(例如LPC系数值集合)而配置的合成滤波器。频谱整形器130可经布置以从如本文中所述的语音参数计算器和/或从逻辑模块110(例如,在帧擦除的情况下)接收频谱参数值集合。频谱整形器130还可经配置以根据激励信号的不同子帧系列和/或不同频谱参数值集合系列来计算经解码帧。频谱整形器130还可经配置以对激励信号、对经整形激励信号和/或对频谱参数值执行一个或一个以上其它处理操作(例如其它滤波操作)。
包括在设备A100内或在设备A100外部(例如,在包括设备A100的装置(例如蜂窝式电话)内)的格式检测器220可经布置以将第一经编码帧和其它经编码帧的帧格式的指示提供到逻辑模块110、激励信号产生器120和频谱整形器130中的一者或一者以上。格式检测器220可含有擦除检测器210,或可独立地实施这两个元件。在一些应用中,编码系统经配置以针对特定位速率仅使用一个编码模式。对于这些情况来说,经编码帧的位速率(如(例如)从例如帧能量等一个或一个以上参数所确定)还指示帧格式。对于在经编码帧的位速率下使用一个以上编码模式的编码系统来说,格式检测器220可经配置以从编码索引(例如,经编码帧内的识别编码模式的一个或一个以上位的集合)确定格式。在此情况下,格式指示可基于编码索引的确定。在一些情况下,编码索引可明确地指示编码模式。在其它情况下,编码索引可(例如)通过指示对于另一编码模式将为无效的值来隐含地指示编码模式。
设备A100可经布置以从包括在设备A100内或在设备A100外部(例如,在包括设备A100的装置(例如蜂窝式电话)内)的语音参数计算器230接收经编码帧的语音参数(例如,频谱参数值、自适应和/或固定码簿索引、增益因数值和/或码簿索引)。图28展示语音参数计算器230的实施方案232的框图,所述实施方案232包括剖析器310(还称为“解包化器”)、解量化器320和330以及转换器340。剖析器310经配置以根据经编码帧的格式来剖析所述经编码帧。举例来说,剖析器310可经配置以根据各种类型的信息在帧内的位位置来区分帧中的各种类型的信息,如由格式所指示。
解量化器320经配置以解量化频谱信息。举例来说,解量化器320通常经配置以将从经编码帧所剖析的频谱信息作为索引应用于一个或一个以上码簿以获得频谱参数值集合。解量化器330经配置以解量化时间信息。举例来说,解量化器330还通常经配置以将从经编码帧中剖析的时间信息作为索引应用于一个或一个以上码簿以获得时间参数值(例如,增益因数值)。或者,激励信号产生器120可经配置以执行一些或所有时间信息(例如,自适应和/或固定码簿索引)的解量化。如图28所示,解量化器320和330中的一者或两者可经配置以根据特定帧格式来解量化对应帧信息,因为不同编码模式可使用不同量化表或方案。
如上所述,LPC系数值在量化之前通常被转换为另一形式(例如,LSP、LSF、ISP和/或ISF值)。转换器340经配置以将经解量化频谱信息转换为LPC系数值。对于经擦除帧来说,语音参数计算器230的输出可依据特定设计选择而为空值、未定义或不变。图29A展示包括擦除检测器210、格式检测器220、语音参数计算器230和设备A100的实施方案的系统的实例的框图。图29B展示包括还执行擦除检测的格式检测器220的实施方案222的类似系统的框图。
设备A100的实施方案的各种元件(例如,逻辑模块110、激励信号产生器120和频谱整形器130)可以被视为适合于既定应用的硬件、软件和/或固件的任何组合来实施。举例来说,此些元件可被制造为驻存(例如)在同一芯片上或在芯片组中的两个或两个以上芯片之间的电子和/或光学装置。此装置的一个实例为例如晶体管或逻辑门等逻辑元件的固定或可编程阵列,且这些元件中的任一者可被实施为一个或一个以上此类阵列。这些元件中的任何两者或两者以上或者甚至全部可实施于相同的一个或多个阵列内。所述一个或多个阵列可实施于一个或一个以上芯片内(例如,实施于包括两个或两个以上芯片的芯片组内)。
如本文中所述的设备A100的各种实施方案的一个或一个以上元件(例如,逻辑模块110、激励信号产生器120和频谱整形器130)还可全部或部分地实施为一个或一个以上指令集合,所述指令集合经布置以在一个或一个以上固定或可编程逻辑元件阵列上执行,所述逻辑元件例如为微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA(现场可编程门阵列)、ASSP(专用标准产品)和ASIC(专用集成电路)。设备A100的实施方案的各种元件中的任一者还可实施为一个或一个以上计算机(例如,包括经编程以执行一个或一个以上指令集合或序列的一个或一个以上阵列的机器,还称为“处理器”),且这些元件中的任何两者或两者以上或者甚至全部可实施于相同的所述一或多个计算机内。
设备A100的实施方案的各种元件可包括在用于无线通信的装置(例如蜂窝式电话或具有此通信能力的其它装置)内。此装置可经配置以与电路交换式和/或包交换式网络通信(例如,使用例如VoIP等一个或一个以上协议)。此装置可经配置以对载运经编码帧的信号执行操作,例如一个或一个以上卷积码的解交错、解穿孔、解码、一个或一个以上错误校正码的解码、一个或一个以上网络协议(例如,以太网、TCP/IP、cdma2000)层的解码、射频(RF)解调和/或RF接收。
有可能使设备A100的实施方案的一个或一个以上元件用以执行任务或执行不直接与所述设备的操作有关的其它指令集合,例如与嵌入有所述设备的装置或系统的另一操作有关的任务。还有可能使设备A100的实施方案的一个或一个以上元件具有共同的结构(例如,用以在不同时间执行代码的对应于不同元件的部分的处理器、经执行以在不同时间执行对应于不同元件的任务的指令集合,或在不同时间针对不同元件执行操作的电子和/或光学装置的布置)。在一个此实例中,逻辑模块110、激励信号产生器120和频谱整形器130被实施为经布置以在同一处理器上执行的指令集合。在另一此实例中,这些元件以及擦除检测器210、格式检测器220和语音参数计算器230中的一者或一者以上(可能为全部)被实施为经布置以在同一处理器上执行的指令集合。在又一实例中,激励信号产生器120C1和120C2被实施为在不同时间执行的相同指令集合。在又一实例中,解量化器320和330被实施为在不同时间执行的相同指令集合。
用于无线通信的装置(例如蜂窝式电话或具有此通信能力的其它装置)可经配置以包括设备A100和语音编码器两者的实施方案。在此情况下,有可能使设备A100与语音编码器具有共同的结构。在一个此实例中,设备A100和语音编码器经实施以包括经布置以在同一处理器上执行的指令集合。
提供先前对所描述的配置的呈现是为了使得所属领域的技术人员能够制造或使用本文中所揭示的方法和其它结构。本文中所展示和描述的流程图、框图、状态图和其它结构仅为实例,且这些结构的其它变型也属于本发明的范围内。有可能对这些配置做出各种修改,且本文中所呈现的一般原理同样可应用于其它配置。举例来说,尽管所述实例主要描述对跟随在CELP帧之后的经擦除帧的应用,但明确地预期且特此揭示,此些方法、设备和系统还可应用于其中经擦除帧跟随在根据使用基于对过去激励信息的记忆的激励信号的另一编码模式(例如PPP或其它PWI编码模式)而编码的帧之后的情况。因此,本发明并不希望限于上文所展示的特定实例或配置,而是应符合与本文中以任何方式所揭示的原理和新颖特征一致的最广范围,所述原理和新颖特征包括在如所申请的所附权利要求书中,所述权利要求书形成原始揭示内容的一部分。
可与如本文中所述的语音解码器和/或语音解码方法一起使用或适于与其一起使用的编解码器的实例包括:增强型可变速率编解码器(EVRC),如文献3GPP2C.S0014-C版本1.0“用于宽带展频数字系统的增强型可变速率编解码器、语音服务选项3、68和70(Enhanced Variable Rate Codec,Speech Service Options 3,68,and 70for WidebandSpread Spectrum Digital Systems)”(第5章,2007年1月)中所描述;自适应多速率(AMR)语音编解码器,如文献ETSI TS 126092V6.0.0(第6章,2004年12月)中所描述;以及AMR宽带语音编解码器,如文献ETSI TS 126192V6.0.0(第6章,2004年12月)中所描述。
所属领域的技术人员将了解,信息和信号可使用多种不同技艺和技术中的任一者来表示。举例来说,在整个上述描述中可能提及的数据、指令、命令、信息、信号、位和符号可由电压、电流、电磁波、磁场或磁性粒子、光场或光学粒子或者其任一组合表示。虽然从中导出经编码帧的信号和所解码的信号被称为“语音信号”,但还预期且特此揭示,这些信号可在有效帧期间载运音乐或其它非语音信息内容。
所属领域的技术人员将进一步了解,结合本文中所揭示的配置而描述的各种说明性逻辑区块、模块、电路和操作可实施为电子硬件、计算机软件或所述两者的组合。此类逻辑区块、模块、电路和操作可用通用处理器、数字信号处理器(DSP)、ASIC、FPGA或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或经设计以执行本文所描述的功能的其任何组合来实施或执行。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规的处理器、控制器、微控制器或状态机。处理器还可经实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。
本文所描述的方法和算法的任务可直接以硬件、由处理器执行的软件模块或所述两者的组合实施。软件模块可驻存于RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移除式盘、CD-ROM或此项技术中已知的任何其它形式的存储媒体中。说明性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息和将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体式。处理器和存储媒体可驻存于ASIC中。ASIC可驻存于用户终端中。在替代方案中,处理器和存储媒体可作为离散组件而驻存于用户终端中。
本文所描述的配置中的每一者可至少部分地实施为硬连线电路、经制造到专用集成电路中的电路配置或者经加载到非易失性存储装置中的固件程序或作为机器可读代码(此类代码为可由例如微处理器或其它数字信号处理单元等逻辑元件阵列执行的指令)而从数据存储媒体加载或加载到数据存储媒体中的软件程序。数据存储媒体可为例如半导体存储器(其可包括但不限于动态或静态RAM(随机存取存储器)、ROM(只读存储器)和/或快闪RAM)或者铁电、磁阻、双向、聚合或相变存储器等存储元件的阵列;或例如磁盘或光盘等盘媒体。应将术语“软件”理解为包括源代码、汇编语言代码、机器代码、二进制代码、固件、宏代码、微代码、可由逻辑元件阵列执行的任何一个或一个以上指令集合或序列以及此类实例的任何组合。
Claims (23)
1.一种获得经解码语音信号的帧的方法,所述方法包含:
产生第一激励信号,所述第一激励信号基于第一增益因数与第一值序列的乘积;基于所述第一激励信号和来自经编码语音信号的第一经编码帧的信息,计算所述经解码语音信号的第一帧;
响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示,且根据阈值与基于所述第一增益因数的值之间的关系,产生第二激励信号,所述第二激励信号基于(A)大于所述第一增益因数的第二增益因数与(B)第二值序列的乘积;
基于所述第二激励信号,计算紧跟在所述经解码语音信号的所述第一帧之后的第二帧;和
基于第三激励信号,计算在所述经解码语音信号的所述第一帧之前的第三帧,其中所述第一值序列基于来自所述第三激励信号的信息,且其中所述第二值序列基于来自所述第一激励信号的信息。
2.根据权利要求1所述的获得经解码语音信号的帧的方法,其中所述第二值序列基于所述第一激励信号的至少一片段。
3.根据权利要求1所述的获得经解码语音信号的帧的方法,其中所述第一增益因数基于来自所述第一经编码帧的信息。
4.根据权利要求1所述的获得经解码语音信号的帧的方法,其中所述计算所述经解码语音信号的第一帧包括根据第一多个频谱参数值来处理所述第一激励信号,其中所述第一多个频谱参数值基于来自所述第一经编码帧的所述信息,且
其中所述计算所述经解码语音信号的第二帧包括根据第二多个频谱参数值来处理所述第二激励信号,其中所述第二多个频谱参数值基于所述第一多个频谱参数值。
5.根据权利要求1所述的获得经解码语音信号的帧的方法,其中所述产生所述第一激励信号包括根据至少一个音调参数来处理所述第一值序列,其中所述至少一个音调参数基于来自所述第一经编码帧的信息。
6.根据权利要求1所述的获得经解码语音信号的帧的方法,其中所述方法包含:产生噪声信号;和
产生基于所述所产生的噪声信号的所述第三激励信号。
7.根据权利要求6所述的获得经解码语音信号的帧的方法,其中所述第三帧紧接在所述经解码语音信号中的所述第一帧之前。
8.根据权利要求7所述的获得经解码语音信号的帧的方法,其中所述计算第三帧包括根据多个频谱参数值来处理所述第三激励信号,其中所述多个频谱参数值基于来自所述经编码语音信号中的所述第一经编码帧之前的第二经编码帧的信息。
9.根据权利要求8所述的获得经解码语音信号的帧的方法,其中至少一个帧周期将所述经编码语音信号中的所述第二经编码帧与所述第一经编码帧分离。
10.根据权利要求6所述的获得经解码语音信号的帧的方法,其中所述产生所述第一激励信号由于经编码语音信号的第一经编码帧具有第一格式的指示而发生,且
其中所述产生基于所述所产生的噪声信号的所述第三激励信号由于所述经编码语音信号中的所述第一经编码帧之前的第二经编码帧具有第二格式的指示而发生,且
其中所述产生所述第二激励信号由于(A)所述第一经编码帧具有所述第一格式和(B)所述第二经编码帧具有所述第二格式的指示而发生。
11.根据权利要求1所述的获得经解码语音信号的帧的方法,其中所述产生所述第一激励信号由于所述第一经编码帧具有第一格式的指示而发生,且
其中所述方法包含产生噪声信号,且
其中所述方法包含基于(A)来自在所述经编码语音信号中的所述第一经编码帧之前的第二经编码帧的信息和(B)基于所述所产生的噪声信号的第四激励信号,计算紧接在所述经解码语音信号中的所述第三帧之前的第四帧,且
其中所述计算第三帧包括根据多个频谱参数值来处理所述第三激励信号,其中所述多个频谱参数值基于来自第三经编码帧的信息,所述第三经编码帧(A)在所述经编码语音信号中的所述第二经编码帧之前且(B)具有所述第一格式。
12.根据权利要求11所述的获得经解码语音信号的帧的方法,其中所述方法包含由于所述第二经编码帧具有第二格式的指示而产生基于所述所产生的噪声信号的所述第四激励信号,且
其中所述产生所述第二激励信号由于(A)所述第一经编码帧具有所述第一格式和(B)所述第二经编码帧具有所述第二格式的指示而发生。
13.根据权利要求1所述的获得经解码语音信号的帧的方法,其中所述方法包含:
将基于所述第一增益因数的值与阈值进行比较;和
基于所述比较的结果,执行以下至少一者:(A)从多个增益因数值中选择所述第二增益因数;以及(B)基于所述第一增益因数和基于所述第一增益因数的所述值中的至少一者而计算所述第二增益因数。
14.根据权利要求1所述的获得经解码语音信号的帧的方法,其中所述经解码语音信号的所述第一帧包括多个子帧,所述多个子帧中的每一者基于多个子帧激励信号中的对应一者,且
其中所述多个子帧激励信号中的每一者基于(A)多个子帧增益因数中的对应一者与(B)多个子帧序列中的对应一者的乘积,且
其中所述第一激励信号包括所述多个子帧激励信号,所述第一增益因数是所述多个子帧增益因数中的一者,且所述第一值序列是所述多个子帧序列中的一者。
15.根据权利要求14所述的获得经解码语音信号的帧的方法,其中基于所述第一增益因数的所述值基于所述子帧增益因数的平均值。
16.根据权利要求15所述的获得经解码语音信号的帧的方法,其中所述第二增益因数大于所述子帧增益因数的所述平均值。
17.一种用于获得经解码语音信号的帧的设备,所述设备包含:
激励信号产生器,其经配置以产生第一、第二和第三激励信号;
频谱整形器,其经配置以(A)基于所述第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧,(B)基于所述第二激励信号而计算紧跟在所述经解码语音信号的所述第一帧之后的第二帧,且(C)基于所述第三激励信号而计算在所述经解码语音信号的所述第一帧之前的第三帧;和逻辑模块,其(A)经配置以评估阈值与基于第一增益因数的值之间的关系,且(B)经布置以接收所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示,
其中所述激励信号产生器经配置以产生基于(A)第一增益因数与(B)基于来自所述第三激励信号的信息的第一值序列的乘积的所述第一激励信号,且其中,响应于所述擦除指示且根据所述所评估的关系,所述逻辑模块经配置以致使所述激励信号产生器产生基于(A)大于所述第一增益因数的第二增益因数与(B)基于来自所述第一激励信号的信息的第二值序列的乘积的所述第二激励信号。
18.根据权利要求17所述的用于获得经解码语音信号的帧的设备,其中所述频谱整形器经配置以基于第一多个频谱参数值而计算所述第一帧,其中所述第一多个频谱参数值基于来自所述第一经编码帧的信息,且
其中所述频谱整形器经配置以基于第二多个频谱参数值而计算所述第二帧,其中所述第二多个频谱参数值基于所述第一多个频谱参数值。
19.根据权利要求17所述的用于获得经解码语音信号的帧的设备,其中所述逻辑模块经配置以通过将所述阈值与(A)所述第一增益因数和(B)基于所述第一增益因数的值中的至少一者进行比较来评估所述阈值与基于所述第一增益因数的所述值之间的所述关系。
20.根据权利要求17所述的用于获得经解码语音信号的帧的设备,其中所述第一经解码帧包括多个子帧,所述多个子帧中的每一者基于多个子帧激励信号中的对应一者,且
其中所述多个子帧激励信号中的每一者基于(A)多个子帧增益因数中的对应一者与(B)多个子帧序列中的对应一者的乘积,且
其中所述第一激励信号包括所述多个子帧激励信号,所述第一增益因数是所述多个子帧增益因数中的一者,且所述第一值序列是所述多个子帧序列中的一者,且
其中基于所述第一增益因数的所述值基于所述子帧增益因数的平均值。
21.根据权利要求17所述的用于获得经解码语音信号的帧的设备,其中所述激励信号产生器经配置以响应于所述第一经编码帧具有第一格式的指示而产生所述第一激励信号,且
其中,响应于第三经编码帧具有不同于所述第一格式的第二格式的指示,所述激励信号产生器经配置以产生基于所产生的噪声信号的所述第三激励信号,且
所述逻辑模块经配置以致使所述激励信号产生器响应于(A)所述第一经编码帧具有所述第一格式和(B)所述第三经编码帧具有所述第二格式的指示而产生所述第二激励信号。
22.一种用于获得经解码语音信号的帧的设备,所述设备包含:
用于产生基于第一增益因数与第一值序列的乘积的第一激励信号的装置;
用于基于所述第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算所述经解码语音信号的第一帧的装置;
用于响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且根据阈值与基于所述第一增益因数的值之间的关系而产生基于(A)大于所述第一增益因数的第二增益因数与(B)第二值序列的乘积的第二激励信号的装置;
用于基于所述第二激励信号而计算紧跟在所述经解码语音信号的所述第一帧之后的第二帧的装置;和
用于基于第三激励信号而计算在所述经解码语音信号的所述第一帧之前的第三帧的装置,
其中所述第一值序列基于来自所述第三激励信号的信息,且其中所述第二值序列基于来自所述第一激励信号的信息。
23.根据权利要求22所述的用于获得经解码语音信号的帧的设备,其中所述用于产生第一激励信号的装置经配置以响应于所述第一经编码帧具有第一格式的指示而产生所述第一激励信号,且
其中所述设备包含用于响应于第三经编码帧具有不同于所述第一格式的第二格式的指示而产生基于所产生的噪声信号的所述第三激励信号的装置,且
其中所述用于产生第二激励信号的装置经配置以响应于(A)所述第一经编码帧具有所述第一格式和(B)所述第三经编码帧具有所述第二格式的指示而产生所述第二激励信号。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US82841406P | 2006-10-06 | 2006-10-06 | |
US60/828,414 | 2006-10-06 | ||
US11/868,351 | 2007-10-05 | ||
US11/868,351 US7877253B2 (en) | 2006-10-06 | 2007-10-05 | Systems, methods, and apparatus for frame erasure recovery |
PCT/US2007/080653 WO2008043095A1 (en) | 2006-10-06 | 2007-10-07 | Systems, methods, and apparatus for frame erasure recovery |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101523484A CN101523484A (zh) | 2009-09-02 |
CN101523484B true CN101523484B (zh) | 2012-01-25 |
Family
ID=39052629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800368454A Active CN101523484B (zh) | 2006-10-06 | 2007-10-07 | 用于帧擦除恢复的系统、方法和设备 |
Country Status (11)
Country | Link |
---|---|
US (2) | US7877253B2 (zh) |
EP (2) | EP2423916B1 (zh) |
JP (1) | JP5265553B2 (zh) |
KR (1) | KR101092267B1 (zh) |
CN (1) | CN101523484B (zh) |
AT (1) | ATE548726T1 (zh) |
BR (1) | BRPI0717495B1 (zh) |
CA (1) | CA2663385C (zh) |
RU (1) | RU2419167C2 (zh) |
TW (1) | TWI362031B (zh) |
WO (1) | WO2008043095A1 (zh) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100900438B1 (ko) * | 2006-04-25 | 2009-06-01 | 삼성전자주식회사 | 음성 패킷 복구 장치 및 방법 |
US7877253B2 (en) * | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
WO2008103087A1 (en) * | 2007-02-21 | 2008-08-28 | Telefonaktiebolaget L M Ericsson (Publ) | Double talk detector |
ES2391360T3 (es) * | 2007-09-21 | 2012-11-23 | France Telecom | Ocultación de error de transmisión en una señal digital con distribución de la complejidad |
TWI350653B (en) * | 2007-10-19 | 2011-10-11 | Realtek Semiconductor Corp | Automatic gain control device and method |
CN101437009B (zh) * | 2007-11-15 | 2011-02-02 | 华为技术有限公司 | 丢包隐藏的方法及其系统 |
KR100998396B1 (ko) * | 2008-03-20 | 2010-12-03 | 광주과학기술원 | 프레임 손실 은닉 방법, 프레임 손실 은닉 장치 및 음성송수신 장치 |
US8706479B2 (en) * | 2008-11-14 | 2014-04-22 | Broadcom Corporation | Packet loss concealment for sub-band codecs |
US8238861B2 (en) * | 2009-01-26 | 2012-08-07 | Qualcomm Incorporated | Automatic gain control in a wireless communication network |
US8838819B2 (en) * | 2009-04-17 | 2014-09-16 | Empirix Inc. | Method for embedding meta-commands in normal network packets |
US8924207B2 (en) * | 2009-07-23 | 2014-12-30 | Texas Instruments Incorporated | Method and apparatus for transcoding audio data |
US8321216B2 (en) * | 2010-02-23 | 2012-11-27 | Broadcom Corporation | Time-warping of audio signals for packet loss concealment avoiding audible artifacts |
US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
MX2013009345A (es) | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio. |
CA2827266C (en) | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result |
JP5712288B2 (ja) | 2011-02-14 | 2015-05-07 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 重複変換を使用した情報信号表記 |
ES2529025T3 (es) | 2011-02-14 | 2015-02-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para procesar una señal de audio decodificada en un dominio espectral |
PL2661745T3 (pl) * | 2011-02-14 | 2015-09-30 | Fraunhofer Ges Forschung | Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio |
MX2013009346A (es) | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral. |
NO2669468T3 (zh) * | 2011-05-11 | 2018-06-02 | ||
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
JP5805601B2 (ja) * | 2011-09-30 | 2015-11-04 | 京セラ株式会社 | 装置、方法、及びプログラム |
US9728200B2 (en) * | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US9208775B2 (en) * | 2013-02-21 | 2015-12-08 | Qualcomm Incorporated | Systems and methods for determining pitch pulse period signal boundaries |
US9842598B2 (en) * | 2013-02-21 | 2017-12-12 | Qualcomm Incorporated | Systems and methods for mitigating potential frame instability |
EP2976768A4 (en) * | 2013-03-20 | 2016-11-09 | Nokia Technologies Oy | AUDIO SIGNAL ENCODER COMPRISING A MULTI-CHANNEL PARAMETER SELECTOR |
US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
ES2635027T3 (es) | 2013-06-21 | 2017-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para el desvanecimiento de señales mejorado para sistemas de codificación de audio cambiados durante el ocultamiento de errores |
CN107818789B (zh) * | 2013-07-16 | 2020-11-17 | 华为技术有限公司 | 解码方法和解码装置 |
US10614816B2 (en) | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
US10157620B2 (en) * | 2014-03-04 | 2018-12-18 | Interactive Intelligence Group, Inc. | System and method to correct for packet loss in automatic speech recognition systems utilizing linear interpolation |
KR20160145711A (ko) * | 2014-04-17 | 2016-12-20 | 아우디맥스, 엘엘씨 | 정보 손실을 감소시킨 전자 통신들을 위한 시스템들, 방법들 및 디바이스들 |
US10770087B2 (en) * | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1212606C (zh) * | 2000-07-14 | 2005-07-27 | 康奈克森特系统公司 | 处理丢失帧的语音通信系统及方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3194481B2 (ja) * | 1991-10-22 | 2001-07-30 | 日本電信電話株式会社 | 音声符号化法 |
BR9206143A (pt) | 1991-06-11 | 1995-01-03 | Qualcomm Inc | Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados |
SE501340C2 (sv) * | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
JP3199142B2 (ja) * | 1993-09-22 | 2001-08-13 | 日本電信電話株式会社 | 音声の励振信号符号化方法および装置 |
US5502713A (en) | 1993-12-07 | 1996-03-26 | Telefonaktiebolaget Lm Ericsson | Soft error concealment in a TDMA radio system |
CN1100396C (zh) * | 1995-05-22 | 2003-01-29 | Ntt移动通信网株式会社 | 语音解码器 |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
JP3095340B2 (ja) * | 1995-10-04 | 2000-10-03 | 松下電器産業株式会社 | 音声復号化装置 |
US5960386A (en) * | 1996-05-17 | 1999-09-28 | Janiszewski; Thomas John | Method for adaptively controlling the pitch gain of a vocoder's adaptive codebook |
US6014622A (en) | 1996-09-26 | 2000-01-11 | Rockwell Semiconductor Systems, Inc. | Low bit rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization |
US6810377B1 (en) | 1998-06-19 | 2004-10-26 | Comsat Corporation | Lost frame recovery techniques for parametric, LPC-based speech coding systems |
US6691092B1 (en) * | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
DE60233283D1 (de) | 2001-02-27 | 2009-09-24 | Texas Instruments Inc | Verschleierungsverfahren bei Verlust von Sprachrahmen und Dekoder dafer |
JP3628268B2 (ja) * | 2001-03-13 | 2005-03-09 | 日本電信電話株式会社 | 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体 |
EP1425562B1 (en) * | 2001-08-17 | 2007-01-10 | Broadcom Corporation | Improved bit error concealment methods for speech coding |
US7590525B2 (en) * | 2001-08-17 | 2009-09-15 | Broadcom Corporation | Frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
US7379865B2 (en) * | 2001-10-26 | 2008-05-27 | At&T Corp. | System and methods for concealing errors in data transmission |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
WO2005117366A1 (ja) * | 2004-05-26 | 2005-12-08 | Nippon Telegraph And Telephone Corporation | 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体 |
JP3936370B2 (ja) * | 2005-05-09 | 2007-06-27 | 富士通株式会社 | 音声復号化装置及びその方法 |
FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
US8165224B2 (en) * | 2007-03-22 | 2012-04-24 | Research In Motion Limited | Device and method for improved lost frame concealment |
-
2007
- 2007-10-05 US US11/868,351 patent/US7877253B2/en active Active
- 2007-10-07 AT AT07843945T patent/ATE548726T1/de active
- 2007-10-07 CA CA2663385A patent/CA2663385C/en not_active Expired - Fee Related
- 2007-10-07 BR BRPI0717495-0A2 patent/BRPI0717495B1/pt active IP Right Grant
- 2007-10-07 EP EP11175820.7A patent/EP2423916B1/en active Active
- 2007-10-07 RU RU2009117181/09A patent/RU2419167C2/ru active
- 2007-10-07 CN CN2007800368454A patent/CN101523484B/zh active Active
- 2007-10-07 EP EP07843945A patent/EP2070082B1/en active Active
- 2007-10-07 WO PCT/US2007/080653 patent/WO2008043095A1/en active Application Filing
- 2007-10-07 KR KR1020097009177A patent/KR101092267B1/ko active IP Right Grant
- 2007-10-07 JP JP2009531638A patent/JP5265553B2/ja active Active
- 2007-10-08 TW TW096137743A patent/TWI362031B/zh not_active IP Right Cessation
-
2010
- 2010-12-13 US US12/966,960 patent/US8825477B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1212606C (zh) * | 2000-07-14 | 2005-07-27 | 康奈克森特系统公司 | 处理丢失帧的语音通信系统及方法 |
EP1577881A2 (en) * | 2000-07-14 | 2005-09-21 | Mindspeed Technologies, Inc. | A speech communication system and method for handling lost frames |
Also Published As
Publication number | Publication date |
---|---|
US20080086302A1 (en) | 2008-04-10 |
TW200832356A (en) | 2008-08-01 |
BRPI0717495B1 (pt) | 2019-12-10 |
CA2663385A1 (en) | 2008-04-10 |
JP2010506221A (ja) | 2010-02-25 |
RU2009117181A (ru) | 2010-11-20 |
EP2423916A3 (en) | 2012-05-16 |
EP2070082B1 (en) | 2012-03-07 |
WO2008043095A1 (en) | 2008-04-10 |
RU2419167C2 (ru) | 2011-05-20 |
BRPI0717495A2 (pt) | 2014-04-22 |
EP2423916B1 (en) | 2013-09-04 |
JP5265553B2 (ja) | 2013-08-14 |
US20110082693A1 (en) | 2011-04-07 |
ATE548726T1 (de) | 2012-03-15 |
TWI362031B (en) | 2012-04-11 |
EP2423916A2 (en) | 2012-02-29 |
EP2070082A1 (en) | 2009-06-17 |
KR20090082383A (ko) | 2009-07-30 |
US7877253B2 (en) | 2011-01-25 |
CA2663385C (en) | 2013-07-02 |
CN101523484A (zh) | 2009-09-02 |
US8825477B2 (en) | 2014-09-02 |
KR101092267B1 (ko) | 2011-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101523484B (zh) | 用于帧擦除恢复的系统、方法和设备 | |
CN101496100B (zh) | 用于对无效帧进行宽带编码和解码的系统、方法和设备 | |
US8862463B2 (en) | Adaptive time/frequency-based audio encoding and decoding apparatuses and methods | |
CN101681627B (zh) | 使用音调规则化及非音调规则化译码的信号编码方法及设备 | |
US8532984B2 (en) | Systems, methods, and apparatus for wideband encoding and decoding of active frames | |
EP1747554B1 (en) | Audio encoding with different coding frame lengths | |
CN101622666B (zh) | 非因果后置滤波器 | |
RU2607260C1 (ru) | Системы и способы для определения набора коэффициентов интерполяции | |
KR20230129581A (ko) | 음성 정보를 갖는 개선된 프레임 손실 보정 | |
Gersho | Advances in speech and audio compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |