CN104040622A - 用于关键性阈值控制的系统、方法、设备和计算机可读媒体 - Google Patents

用于关键性阈值控制的系统、方法、设备和计算机可读媒体 Download PDF

Info

Publication number
CN104040622A
CN104040622A CN201280066721.1A CN201280066721A CN104040622A CN 104040622 A CN104040622 A CN 104040622A CN 201280066721 A CN201280066721 A CN 201280066721A CN 104040622 A CN104040622 A CN 104040622A
Authority
CN
China
Prior art keywords
frame
information
equipment
arbitrary
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280066721.1A
Other languages
English (en)
Other versions
CN104040622B (zh
Inventor
文卡特什·克里希南
丹尼尔·J·辛德尔
维韦克·拉金德朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN104040622A publication Critical patent/CN104040622A/zh
Application granted granted Critical
Publication of CN104040622B publication Critical patent/CN104040622B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0009Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the channel coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/007Unequal error protection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/08Arrangements for detecting or preventing errors in the information received by repeating transmission, e.g. Verdan system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Telephonic Communication Services (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Traffic Control Systems (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Radio Relay Systems (AREA)
  • Telephone Function (AREA)

Abstract

可实施如本文中揭示的系统、方法和设备以基于信道条件调整话音帧的关键性阈值。此阈值可用以响应于信道状态的改变而控制重传频率。

Description

用于关键性阈值控制的系统、方法、设备和计算机可读媒体
根据35U.S.C.§119主张优先权
本专利申请案主张2012年1月12日申请且已转让给本受让人的题为“用于冗余传输的位分配的系统、方法、设备和计算机可读媒体(SYSTEMS,METHODS,APPARATUS,AND COMPUTER-READABLE MEDIA FOR BIT ALLOCATION FOR REDUNDANTTRANSMISSION)”的第61/586,007号临时申请案的优先权。本专利申请案还主张2012年1月17日申请且已转让给本受让人的题为“用于关键性阈值控制的系统、方法、设备和计算机可读媒体(SYSTEMS,METHODS,APPARATUS,ANDCOMPUTER-READABLE MEDIA FOR CRITICALITY THRESHOLD CONTROL)”的临时申请案第61/587,507号的优先权。本专利申请案还主张2012年5月1日申请且已转让给本受让人的题为“用于冗余传输的位分配的系统、方法、设备和计算机可读媒体(SYSTEMS,METHODS,APPARATUS,AND COMPUTER-READABLE MEDIA FOR BITALLOCATION FOR REDUNDANT TRANSMISSION)”的临时申请案第61/641,093号的优先权。
技术领域
本发明涉及音频通信。
背景技术
已在电路交换式网络上执行数字音频电信。电路交换式网络为在通话的持续时间中在两个终端之间建立物理路径的网络。在电路交换式应用中,发射终端在物理路径上将一连串含有音频(例如,语音)信息的包发送到接收终端。接收终端使用包中含有的音频信息(例如,语音信息)合成对应的音频信号(例如,话音信号)。
已开始在包交换式网络上执行数字音频电信。包交换式网络为基于目的地地址而经由网络路由包的网络。在包交换式通信的情况下,路由器个别地确定用于每一包的路径,将包沿着任一可利用的路径发送以到达其目的地。结果,包可能不能同时或按相同次序到达接收终端。去抖动缓冲器可在接收终端中用以使包按次序排列,且按连续依序方式播放。
有时,在从发射终端转运到接收终端时,包被丢失。丢失的包可使合成的音频信号的质量降级。因而,可通过提供用以解决帧内(例如,话音帧内)的信息丢失的系统和方法来实现益处。
发明内容
一种根据一般配置的音频信号处理的方法包括计算音频信号的第二帧对在所述音频信号中在所述第二帧之前的第一帧的译码相依性的估计。此方法还包括基于与发射信道的状态有关的信息计算阈值。此方法还包括将所述计算出的估计与所述计算出的阈值进行比较;及基于所述比较的结果,决定发射所述第一帧的冗余副本。还揭示具有有形特征的计算机可读存储媒体(例如,非暂时性媒体),所述有形特征使读取所述特征的机器执行此方法。
一种用于根据一般配置的音频信号处理的设备包括用于计算音频信号的第二帧对在所述音频信号中在所述第二帧之前的第一帧的译码相依性的估计的装置。此设备还包括用于基于与发射信道的状态有关的信息计算阈值的装置;用于将所述计算出的估计与所述计算出的阈值进行比较的装置;及用于基于所述比较的结果决定发射所述第一帧的冗余副本的装置。
一种用于根据另一一般配置的音频信号处理的设备包括第一计算器,其经配置以计算音频信号的第二帧对在所述音频信号中在所述第二帧之前的第一帧的译码相依性的估计。此设备还包括第二计算器,其经配置以基于与发射信道的状态有关的信息计算阈值。此设备还包括模式选择器,其经配置以(A)将所述计算出的估计与所述计算出的阈值进行比较,及(B)基于所述比较的结果决定发射所述第一帧的冗余副本。
附图说明
图1为说明经由网络NW10通信的发射终端102和接收终端104的实例的方框图。
图2A展示具有各种终端设备的网络NW10的实施方案NW20的方框图。
图2B展示音频编码器AE10的实施方案AE20的方框图。
图3为帧编码器FE10的实施方案FE20的方框图。
图4A展示根据一般配置的方法M100的流程图。
图4B展示方法M100的实施方案M110的流程图。
图5A和图5B展示如本文中描述的信道状态信息与其它系统参数之间的关系的实例。
图5C展示音频信号的一连串帧的实例。
图6A展示方法M100的实施方案M120的流程图。
图6B展示任务T200的实施方案T210的流程图。
图7A展示方法M100的实施方案M200的流程图。
图7B展示方法M200的实施方案M210的流程图。
图8展示方法M110、M120和M210的实施方案M300的流程图。
图9A为IPv4包的图。
图9B为IPv6包的图。
图9C展示通信装置D10的方框图。
图10展示RTP包的有效负载的实例。
图11为音频解码器AD10的实施方案AD20的方框图。
图12A展示根据一般配置的设备MF100的方框图。
图12B展示设备MF100的实施方案MF110的方框图。
图13A展示设备MF100的实施方案MF120的方框图。
图13B展示设备MF100的实施方案MF200的方框图。
图14A展示装置F200的实施方案F210的方框图。
图14B展示设备MF100的实施方案MF210的方框图。
图15展示设备MF110、MF120和MF210的实施方案MF300的方框图。
图16A展示根据一般配置的设备AP100的方框图。
图16B展示设备AP100的实施方案AP110的方框图。
图16C展示第二计算器A200的实施A210的方框图。
图16D展示设备AP100的实施方案AP120的方框图。
图16E展示第二计算器A200的实施方案的实例A220的方框图。
图17A展示设备AP100的实施方案AP200的方框图。
图17B展示设备AP100的实施方案AP210的方框图。
图17C展示设备AP210的实施方案AP220的方框图。
图18A展示设备AP110、AP120和AP210的实施方案AP300的方框图。
图18B展示无线装置1102的方框图。
图19展示设备AP300的实施方案AP400的方框图。
图20展示手持机H100的前视图、后视图和侧视图。
具体实施方式
如本文中揭示的系统、方法和设备可经实施以针对使用阈值控制话音帧的重传频率的话音译码应用,基于信道条件调整一或多个关键性阈值。
除非明确地受到其上下文限制,否则术语“信号”在本文中用以指示其普通意义中的任一者,包括如在电线、总线或其它传输媒体上表达的存储器位置(或存储器位置的集合)的状态。除非明确地受到其上下文限制,否则术语“产生”在本文中用以指示其普通意义中的任一者,例如,计算或以其它方式产生。除非明确地受到其上下文限制,否则术语“计算”在本文中用以指示其普通意义中的任一者,例如,计算、评估、平滑化和/或从多个值选择。除非明确地受到其上下文限制,否则术语“获得”用以指示其普通意义中的任一者,例如,计算、导出、接收(例如,从外部装置)和/或检索(例如,从存储元件阵列)。除非明确地受到其上下文限制,否则术语“选择”用以指示其普通意义中的任一者,例如,识别、指示、应用和/或使用两者或两者以上的集合中的至少一者和少于全部者。在术语“包含”用于本发明描述和权利要求书中时,其并不排除其它元件或操作。术语“基于”(如在“A是基于B”中)用以指示其普通意义中的任一者,包括以下情况:(i)“从……导出”(例如,“B为A的前驱体”),(ii)“基于至少”(例如,“A是基于至少B”),及如果在特定上下文中适当,(iii)“等于”(例如,“A等于B”)。类似地,术语“响应于”用以指示其普通意义中的任一者,包括“响应于至少”。除非另有指示,否则术语“A、B和C中的至少一者”和“A、B和C中的一或多者”指示“A和/或B和/或C”。
除非另有指示,否则术语“系列”用以指示一连串的两个或两个以上项。术语“对数”用以指示基数为十的对数,但将此运算扩展到其它基数在本发明的范围内。术语“频率分量”用以指示信号的一组频率或频带中的一者,例如,信号的频域表示的样本(例如,如由快速傅立叶变换或MDCT产生)或信号的子频带(例如,巴克尺度(Bark scale)或梅尔尺度(mel scale)子频带)。
除非另有指示,否则对具有特定特征的设备的操作的任何揭示还明确地意欲揭示具有相似特征的方法(且反之亦然),且对根据特定配置的设备的操作的任何揭示还明确地意欲揭示根据相似配置的方法(且反之亦然)。可关于如由其特定上下文指示的方法、设备和/或系统来使用术语“配置”。按一般意义且可互换地使用术语“方法”、“过程”、“程序”和“技术”,除非特定上下文另有指示。具有多个子任务的“任务”还为方法。还按一般意义且可互换地使用术语“设备”和“装置”,除非特定上下文另有指示。术语“元件”和“模块”通常用以指示较大配置的一部分。除非受其上下文明确地限制,否则术语“系统”在本文中用以指示其普通意义中的任一者,包括“相互作用以服务于共同目的的元件群组”。术语“多个”意谓“两个或两个以上”。通过引用文献的一部分的任何并入还应理解为并入在所述部分内引用的项或变量的定义,其中这些定义在文献中的别处出现,以及在所并入的部分中引用的任何图。
除非另有指示,否则术语“编解码器”、“声码器”、“音频译码器”和“话音译码器”指音频编码器与对应的音频解码器的组合。除非另有指示,否则术语“译码”指示经由编解码器转变音频信号,包括编码和随后的解码。除非另有指示,否则术语“发射”指示传播(例如,信号)到发射信道内。
如本文中描述的译码方案可适用于译码任何音频信号(例如,包括非话音音频)。或者,可能需要将此译码方案仅用于话音。在此情况下,译码方案可与分类方案一起使用以确定音频信号的每一帧的内容的类型且选择合适的译码方案。
如本文中使用的译码方案可用作主要编解码器,或用作多层或多级编解码器中的一层或一级。在一个此实例中,此译码方案用以译码音频信号的频率内容的一部分(例如,低频带或高频带),且另一译码方案用以译码信号的频率内容的另一部分。在另一此实例中,此译码方案用以译码为另一译码层的残差(即,原始信号与经编码信号之间的误差)(例如,线性预测译码(LPC)分析运算的残差)的音频信号。
如本文中描述的方法、系统和设备可经配置以将音频信号作为一系列区段处理。典型的区段长度范围从约五毫秒或十毫秒到约四十毫秒或五十毫秒,且区段可重叠(例如,其中邻近区段重叠25%或50%)或不重叠。在一特定实例中,将音频信号分割成一系列不重叠区段或“帧”,每一者具有十毫秒的长度。在另一特定实例中,每一帧具有二十毫秒的长度。音频信号的取样速率的实例包括(但不限于)8千赫、12千赫、16千赫、32千赫、44.1千赫、48千赫和192千赫。
音频电信应用可实施于包交换式网络中。举例来说,音频电信应用可实施于因特网协议语音(VoIP)网络中。包可包括经编码的音频信号的一或多个帧,且具有音频(例如,语音)信息的包可在网络上从第一装置发射到第二装置。然而,在包的发射期间,所述包中的一些可能丢失。举例来说,多个包的丢失(有时被称作突发包丢失)可能为在接收装置处感知的话音质量的降级的原因。
为了缓解由VoIP网络中的包丢失造成的感知的话音质量的降级,存在两个类型的解决方案。第一解决方案为基于接收器的包丢失隐藏(PLC)方法。可使用PLC方法遮蔽VoIP通信中的包丢失的效应。举例来说,PLC方法可经实施以建立取代包,代替在发射期间丢失的包。此PLC方法可试图建立与丢失的包尽可能类似的包。基于接收器的PLC方法可能不需要来自发送者的任何额外资源或帮助以便建立取代包。然而,当丢失了重要的话音帧时,PLC方法在遮蔽包丢失的效应方面可能无效。
第二解决方案为基于发送者的包丢失复原方法。此方法包括前向错误校正(FEC)方法,其可包括与每一包一起发送一些额外数据。可使用额外数据恢复由在发射期间的数据丢失造成的错误。举例来说,FEC方案可发射冗余音频帧。换句话说,由发送者发射音频帧的一个以上副本(典型地,两个)。这些两个帧可被称作主要副本和冗余副本。
虽然基于发送者的包丢失复原方案可改进经解码的话音的感知质量,但这些方案还可增加在话音的发射期间使用的带宽。传统的FEC方案还可增加端对端延迟,此对于实时对话而言可能不能容忍。举例来说,常规基于发送者的方案在两个不同时段发送同一话音帧两次。此方法可至少使数据速率加倍。一些常规方案可将低位速率编解码器用于冗余副本,以便减小数据速率。然而,低位速率编解码器的使用可增加编码器处的复杂性。此外,一些常规方案可将同一低位速率编解码器用于帧的主要副本和帧的冗余副本两者。虽然此方法可减少编码器处的复杂性以及减小数据速率,但基线话音质量(即,当无帧丢失时的话音质量)可能大大地降低。另外,常规基于发送者的方案通常在假定有至少一个帧时间间隔的额外延迟的情况下操作。
如本文中描述的系统、方法和设备可经实施以提供源控制和信道控制的FEC方案,以便获得话音质量、延迟与数据速率之间的最佳取舍。FEC方案可经配置以使得不引入额外延迟。可在适度数据速率增加的情况下实现话音质量的高质量改进。如本文中描述的FEC方案还可在任一目标数据速率下操作。在一个实例中,可基于发射信道的条件以及外部控制自适应地调整FEC方案和目标数据速率。所提议的FEC方案还可经实施以与旧式通信装置(例如,旧式手持机)相容。
对于用于音频(例如,语音)通信的一些编解码器,用以编码每一帧的位的总数为预定常数。这些编解码器的实例包括自适应多速率(AMR)话音编解码器(例如,如在可从欧洲电信标准学会(ETSI)www-dot-etsi-dot-org(法国Sophia Antipolis)获得的3GPP技术规范(TS)26.071版本11.0.0(2012年9月)中所描述)和AMR宽频带话音编解码器(例如,如在ITU-T推荐G.722.2(2003年7月,国际电信联合会www-dot-itu-dot-int)和/或可从ETSI获得的3GPP技术规范26.190v11.0.0(2012年9月)中所描述),其中位的数目由被选择用于帧的译码模式确定。在这些情况下,发射过去帧的冗余副本可能要求可用于在当前帧中译码信号信息的位数目的对应减少。此减少可对经解码话音的感知质量具有负面影响。
可能需要实施仅针对关键帧发射冗余副本的灵活方法。“关键帧”为预期其丢失会对经解码信号的感知质量具有显著影响的帧。此外,仅在预期背负冗余副本对目前帧的影响最小的情况下,才可能需要发射此冗余副本。对于固定位速率系统,可能需要确定待用于译码当前帧的位的数目,使得用于译码当前帧的位的数目与用于译码过去帧的冗余副本(例如,部分副本)的位的数目的总数符合目标固定位速率T。
图1为说明经由发射信道TC10和RC10在网络NW10上通信的发射终端102和接收终端104的一实例的方框图。终端102和104中的每一者可经实施以执行如本文中描述的方法和/或包括如本文中描述的设备。发射终端102和接收终端104可为能够支持语音通信的任何装置,包括电话(例如,智能手持机)、计算机、音频广播和接收设备、视频会议设备或类似者。可(例如)通过例如码分多址(CDMA)能力的无线多址技术实施发射终端102和接收终端104。CDMA为基于展频通信的调制和多址方案。
发射终端102包括音频编码器AE10,且接收终端104包括音频解码器AD10。音频编码器AE10可用以通过根据人类话音产生的模型提取参数的值而压缩来自第一用户接口U110(例如,麦克风和音频前端)的音频信息(例如,话音)。信道编码器CE10将参数值装配到包内,且发射器TX10经由发射信道TC10在网络NW10(其可包括基于包的网络,例如,因特网或内联网)上发射包括这些参数值的包。发射信道TC10可为有线和/或无线发射信道,且视确定信道质量的方式和地方而定,发射信道TC10可被视为延伸到网络NW10的入口点(例如,基站控制器)、到网络NW10内的另一实体(例如,信道质量分析器)和/或到接收终端104的接收器RX10。
接收终端104的接收器RX10用以经由发射信道从网络NW10接收包。信道解码器CD10解码包以获得参数值,且音频解码器AD10使用来自包的参数值合成音频信息。将合成的音频(例如,话音)提供到在接收终端104上的第二用户接口U120(例如,音频输出级和扬声器)。虽未展示,但各种信号处理功能可在信道编码器CE10和信道解码器CD10中执行(例如,卷积译码,包括循环冗余检查(CRC)功能、交错)和在发射器TX10和接收器RX10中执行(例如,数字调制和对应的解调、展频处理、模拟/数字和数字/模拟转换)。
通信的每一方可发射以及接收,且每一终端可包括音频编码器AE10和解码器AD10的实例。音频编码器与解码器可为分开的装置或集成到被称作“语音译码器”或“声码器”的单一装置内。如图1中所示,描述终端102、104在网络NW10的终端处具有音频编码器AE10且在另一终端处具有音频解码器AD10。
在发射终端102的至少一个配置中,可在帧中将音频信号(例如,话音)从第一用户接口U110输入到音频编码器AE10,其中每一帧被进一步分割成子帧。在执行某一块处理的情况下,可使用这些任意帧边界。然而,如果实施连续处理而非块处理,则可省略音频样本到帧(和子帧)的此分割。在描述的实例中,视特定应用和总体设计约束而定,在网络NW10上发射的每一包可包括一或多个帧。
音频编码器AE10可为可变速率或单一固定速率编码器。视音频内容而定(例如,视是否存在话音和/或存在何类型的话音而定),可变速率编码器可在不同帧间在多个编码器模式(例如,不同固定速率)间动态切换。音频解码器AD10还可按对应的方式在不同帧间在对应的解码器模式之间动态切换。可针对每一帧选择一特定模式,以在接收终端104处维持可接受的信号再现质量的同时实现可利用的最低位速率。
接收终端104还可将信道状态信息120反馈到发射终端102。在一个此实例中,接收终端104经配置以收集与载运来自发射终端102的包的发射信道的质量有关的信息。接收终端104可使用收集的信息估计信道的质量。接着可将收集的信息和/或信道质量估计反馈到发射终端102作为信道状态信息120。举例来说,如在图1中所示,信道编码器CE10的一实例CE11可将收集的信息和/或质量估计(例如,来自音频解码器AD10)装配到包内,以用于经由发射器TX10的实例TX11和发射信道RC10发射回到发射终端102,在发射终端102处,包由接收器RX10的实例RX11接收且由信道解码器CD10的实例CD11解装配,且将信息和/或估计提供到音频编码器AE10。发射终端102(例如,音频编码器AE10)可使用信道状态信息120来调适与如本文中描述的基于发送者的包丢失复原方案相关联的一或多个功能(例如,关键性阈值)。
图2A展示包括基站收发器BTS1-BTS3的网络NW10的实施方案NW20的一实例,基站收发器BTS1-BTS3与移动台在无线电上行链路和下行链路发射信道上通信。网络NW20还包括核心网络CNW1(其连接到公众交换电话网络PSTN和因特网INT)和核心网络CNW2(其还连接到因特网INT)。网络NW20还包括使收发器站与核心网络接口连接的基站控制器BSC1-BSC3。网络NW20可经实施以提供终端装置之间的包交换式通信。核心网络CNW1还可经由基站收发器BTS1、BTS2提供终端装置MS1与MS2之间的电路交换式通信,和/或提供此终端装置与在PSTN上的终端装置之间的电路交换式通信。
图2A还展示可经由网络NW20相互通信(例如,在包交换式通信链路上)的不同终端装置的实例:移动台MS1-MS3;因特网协议语音(VoIP)电话VP;及计算机CP,其经配置以执行电信程序(例如,来自Microsoft Skype Division,LU的Skype软件)。终端装置MS1-MS3、VP和CP中的任一者可经实施以包括发射终端102的一实例和接收终端104的一实例。移动装置MS1-MS3经由无线无线电上行链路和下行链路发射信道与网络通信。终端VP和CP经由有线发射信道(例如,以太网缆线)和/或无线发射信道(例如,IEEE802.11或“WiFi”链路)与网络通信。网络NW20还可包括中间实体,例如,网关和/或TRAU(代码转换器和速率适配器单元)。
音频编码器AE10通常按时间或“帧”将输入信号作为一系列不重叠区段进行处理,其中针对每一帧计算新的编码帧。帧周期通常为可预期信号局部稳定的周期;普通实例包括二十毫秒(等效于按16kHz的取样速率320个样本、按12.8kHz的取样速率256个样本或按8kHz的取样速率160个样本)和十毫秒。还可能实施音频编码器AE10而将输入信号作为一系列重叠帧进行处理。
图2B展示包括帧编码器FE10的音频编码器AE10的一实施方案AE20的方框图。帧编码器FE10经配置以编码输入信号的一连串帧CF(“核心音频帧”)中的每一者以产生一连串经编码音频帧EF中的对应者。音频编码器AE10还可经实施以执行额外任务,例如,将输入信号分成帧且选择用于帧编码器FE10的译码模式(例如,选择初始位分配的重新分配,如本文中参考任务T400描述)。选择译码模式(例如,速率控制)可包括执行语音活动检测(VAD)和/或另外分类帧的音频内容。在此实例中,音频编码器AE20还包括语音活动检测器VAD10,其经配置以处理核心音频帧CF以产生语音活动检测信号VS(例如,如在可在ETSI获得的3GPP TS26.194v11.0.0(2012年9月)中所描述)。
通常根据源滤波器模型来实施帧编码器FE10,所述源滤波器模型将输入音频信号的每一帧编码为:(A)描述滤波器的一组参数,和(B)将在解码器处用以驱动所描述的滤波器以产生音频帧的经合成再现的激励信号。话音信号的频谱包络通常由表示声道(例如,咽喉和嘴)的共振且称为共振峰的峰值表征。多数话音译码器至少将此粗略频谱结构编码为例如滤波器系数的一组参数。剩余残差信号可模型化为驱动滤波器以产生话音信号且通常由其强度和音调表征的源(例如,如由声带产生)。
帧编码器FE10通常经实施以执行基于码簿的方案(例如,码簿激励线性预测或CELP)和/或原型波形内插(PWI)方案(例如,原型音调周期或PPP),但帧编码器FE10还可经实施以执行其它方案(例如,正弦话音译码和/或基于变换的译码)。可由帧编码器FE10用以产生经编码帧EF的编码方案的特定实例包括(但不限于)G.726、G.728、G.729A、AMR、AMR-WB、AMR-WB+(例如,如在2012年9月的3GPP TS26.290v11.0.0(可从ETSI获得)中所描述)、VMR-WB(例如,如在2005年4月的第三代合作伙伴计划2(3GPP2)文献C.S0052-A v1.0(可在线上于www-dot-3gpp2-dot-org处获得)中所描述)、增强型可变速率编解码器(EVRC,如在2011年12月的3GPP2文献C.S0014-E v1.0(可在线上于www-dot-3gpp2-dot-org处获得)中所描述)、可选择模式声码器话音编解码器(如在2004年1月的3GPP2文献C.S0030-0,v3.0(可在线上于www-dot-3gpp2-dot-org处获得)中所描述)和增强型语音服务编解码器(EVS,例如,如在可从ETSI获得的3GPP TR22.813v10.0.0(2010年3月)中所描述)。
图3展示帧编码器FE10的基本实施方案FE20的方框图,其包括预处理模块PP10、线性预测译码(LPC)分析模块LA10、开放环路音调搜索模块OL10、自适应码簿(ACB)搜索模块AS10、固定码簿(FCB)搜索模块FS10和增益向量量化(VQ)模块GV10。可实施预处理模块PP10,例如,如在3GPP TS26.190v11.0.0的第5.1章中所描述。在一个此实例中,预处理模块PP10经实施以执行核心音频帧的减少取样(例如,从16kHz到12.8kHz)、减少取样的帧的高通滤波(例如,通过50Hz的截止频率)和经滤波的帧的预强调(例如,使用一阶高通滤波器)。
线性预测译码(LPC)分析模块LA10将每一核心音频帧的频谱包络编码为一组线性预测(LP)系数(例如,全极滤波器的系数1/A(z))。在一个实例中,LPC分析模块LA10经配置以计算十六个LP滤波器系数的一集合以表征每一20毫秒帧的共振峰结构。可实施分析模块LA10,例如,如在3GPP TS26.190v11.0.0的第5.2章中所描述。
分析模块LA10可经配置以直接分析每一帧的样本,或可首先根据开窗函数(例如,汉明(Hamming)窗)将所述样本加权。还可在大于帧的窗(例如,30msec窗)上执行分析。此窗可对称(例如,5-20-5,使得其包括紧接在20毫秒帧前和后的5毫秒)或不对称(例如,10-20,使得其包括先前帧的最后10毫秒)。LPC分析模块通常经配置以使用Levinson-Durbin递归或Leroux-Gueguen算法来计算LP滤波器系数。虽然LPC编码非常适合于话音,但其还可用以编码一般的音频信号(例如,包括非话音,例如,音乐)。在另一实施方案中,分析模块可经配置以计算每一帧的一组倒频谱系数,而非一组LP滤波器系数。
线性预测滤波器系数通常难以有效率地量化,且通常映射成用于量化和/或熵编码的另一表示,例如,线频谱对(LSP)或线谱频率(LSF),或导抗频谱对(ISP)或导抗谱频率(ISF)。在一个实例中,分析模块LA10将所述组LP滤波器系数变换成一组对应的ISF。LP滤波器系数的其它一对一表示包括部分自相关系数和对数面积比值。通常,一组LP滤波器系数与一组对应的LSF、LSP、ISF或ISP之间的变换为可逆的,但实施例还包括变换在无错误时不可逆的分析模块LA10的实施方案。
分析模块LA10经配置以量化所述组ISF(或LSF或其它系数表示),且帧编码器FE20经配置以将此量化的结果作为LPC索引XL输出。此量化器通常包括向量量化器,其将输入向量编码为到表或码簿中的对应的向量条目的索引。
帧编码器FE20还包括任选的开放环路音调搜索模块OL10,其可用以简化音调分析并减小自适应码簿搜索模块AS10中的闭合环路音调搜索的范围。模块OL10可经实施以经由基于未量化的LP滤波器系数的加权滤波器滤波输入信号、二中选一地抽取经加权的信号且每帧产生音调估计一次或两次(视当前速率而定)。可实施模块OL10,例如,如在3GPP TS26.190v11.0.0的第5.4章中所描述。
自适应码簿(ACB)搜索模块AS10经配置以搜索自适应码簿(基于过去激励且还称作“音调码簿”)以产生音调滤波器的延迟和增益。模块AS10可经实施以对目标信号(如(例如)通过经由基于经量化和未量化的LP滤波器系数的加权的合成滤波器滤波LP残差来获得)基于子帧而围绕开放环路音调估计执行闭合环路音调搜索,且接着通过在指示的分数音调滞后处内插过去激励来计算自适应码向量且计算ACB增益。模块AS10还可经实施以使用LP残差来扩展过去激励缓冲器以简化闭合环路音调搜索(尤其对于少于64个样本的子帧大小的延迟)。模块AS10可经实施以产生ACB增益(例如,对于每一子帧)和经量化的索引,所述经量化的索引指示第一子帧的音调延迟(或第一和第三子帧的音调延迟,视当前速率而定)和其它子帧的相对音调延迟。可实施模块AS10,例如,如在3GPPTS26.190v11.0.0的第5.7章中所描述。
固定码簿(FCB)搜索模块FS10经配置以产生指示固定码簿(还称作“创新码簿”、“创新性码簿”、“随机码簿”或“代数码簿”)的向量的索引,所述向量表示激励的未由自适应码向量模型化的部分。模块FS10可经实施以产生码簿索引以作为含有再现FCB向量所需要的所有信息的码字(例如,表示脉冲位置和正负号),使得不需要码簿。可实施模块FS10,例如,如在3GPP TS26.190v11.0.0的第5.8章中所描述。
增益向量量化模块GV10经配置以量化FCB和ACB增益,其可包括每一子帧的增益。可实施模块GV10,例如,如在3GPP TS26.190v11.0.0的第5.9章中所描述。
作为对基于码簿的方法的替代,可使用基于变换的方法来编码LPC残差信号。举例来说,可使用修改的离散余弦变换(MDCT)来将残差编码成包括一组MDCT系数的参数,如在Calliope超宽频编解码器(加利福尼亚州圣地亚哥市高通公司(QUALCOMM Inc.,San Diego,CA))和AMR-WB+编解码器的TCX选项中。在另一实例中,使用基于变换的方法来编码音频信号,而不执行LPC分析。
可能需要在一或多个包交换式网络上执行终端A(例如,发射用户设备或UE,例如,终端102)与终端B(例如,接收UE,例如,终端104)之间的实时语音通信。例如AMR和AMR-WB的先前解决方案通过减小位速率而适宜于不良信道条件(还称作“速率调适”)。对于用于在VoIP(因特网协议语音)中使用的下一代编解码器,位速率的减小可能不会帮助显著减少网络中的堵塞(例如,归因于RTP额外开销,其中RTP为实时输送协议,如在(例如)RFC3550,标准64(2003年7月),因特网工程任务组(IETF)中所描述)。如本文中揭示的方法可对声码器赋予较大稳健性和/或解决归因于信道缺陷的编解码器性能问题。
从发射终端A到接收终端B的发射信道的质量可由网络中的一或多个实体(例如,由在上行链路无线电信道的网络端处的基站收发器、由核心网络中的业务分析器等)估计和/或由接收终端B估计(例如,通过分析包丢失率)。可能需要使接收终端B和/或一或多个这些实体使用带内消息接发经由控制信号(例如,使用RTP控制协议(RTCP)的控制包,如在(例如)RFC1889(1996年1月,IETF)中所描述)和/或经由另一服务质量(QoS)反馈机制将此信道状态信息120传递回到发射UE。可实施发射终端A以通过切换到对于在有缺陷信道下实现良好性能最佳化的操作模式(即,“信道感知”模式)来应用此信息。而且,发射UE可经配置以在可预期不良信道条件(例如,难管理的网络)的情况下在呼叫设置时间选择信道感知操作模式。
可实施声码器以响应于不良信道条件的指示(例如,包错误、高抖动等)而切换到“信道缺陷稳健模式”。在“信道缺陷稳健模式”下,话音编解码器可选择部分或全部地重传输入信号的某些关键帧。举例来说,在“信道缺陷稳健模式”下操作的话音译码器可经配置以在帧的关键性超过某一预定阈值的情况下发射帧的冗余副本。可依据特定帧的丢失对经解码的话音的感知影响(如在编码器处估计)来确定彼帧的关键性。信道感知编解码器可经配置以响应于信道状态的指示而在信道缺陷稳健模式与正常操作模式(即,其中不发送冗余副本)之间切换。
如本文中揭示的系统、方法和设备可经实施以依据信道质量估计而设定用于重传决策的阈值。此阈值可用以(例如)确定一帧对于音频信号的后续帧的译码而言是否关键。对于非常好的信道,可将阈值设定得非常高。随着信道质量降级,可降低阈值,使得将更多的帧视为关键的。
图4A展示根据一般配置的处理音频信号的方法M100的流程图,其包括任务T100、T200、T300和T350。任务T100计算音频信号的第二帧(“相依”帧)对在音频信号中在第二帧之前的第一帧(“模型”帧,可能为“关键”帧)的译码相依性的估计。任务T200基于与发射信道的状态有关的信息计算阈值。任务T300将计算出的估计与计算出的阈值进行比较。基于任务T300中的比较的结果,任务T350决定发射第一帧的冗余副本。决定发射冗余副本可包括指示第一帧为关键帧。在一些情况下,方法M100可经实施以使得不需要额外编码延迟来确定是否要重传一帧。
可能需要减少相依帧也将为关键帧(即,对在其后的另一帧而言关键)的可能性。通常,此可能性对于紧接在模型帧后的帧最高,且接着针对后续帧迅速降低。对于有声话音,典型地,话音突峰中的开始帧为关键的,且紧接在其后的帧也为关键的(例如,为了涵盖开始帧丢失时的情况)。然而,话音突峰中的另一帧也可能为关键的(例如,对于音调滞后发生漂移的情况)。
帧偏移k可用以指示模型帧与相依帧之间的距离。在一个此实例中,帧偏移k的值为模型帧n与相依帧(n+k)之间的帧号的差(例如,比介入帧的数目多1)。图5C展示典型实例,其中k的值为三。在另一实例中,k的值为四。其它可能值包括一、二、三、五和大于五的整数。
方法M100可经实施以使得偏移k固定(例如,在系统实施期间或在呼叫设置期间)。可根据原始时域信号中的帧的长度(例如,单位:毫秒)和最大容许延迟来选择k的值。举例来说,k的值可受到最大容许值约束(例如,以限制帧延迟)。可能需要最大容许延迟具有八十或一百毫秒的值。在此情况下,对于使用二十毫秒帧的方案,k可具有四或五的最大值,或对于使用十毫秒帧的方案,可具有八、九或十的最大值。
还可根据信道条件(例如,如由来自接收器的反馈指示)在呼叫期间选择和/或更新偏移k的值。举例来说,在正引起连续帧的频繁丢失(例如,归因于长的衰落)的环境下,可能需要使用较高k值。
任务T100可经实施以基于范围从模型和/或相依帧的一般表征到特定丢失影响评价的一或多个准则来计算相依帧对模型帧的译码相依性的估计(还称作“关键性测量”)。此估计可基于模型和/或相依帧内的信息,且还可基于来自输入信号中的邻近模型帧的一或多个帧的信息。
关键帧可为当丢失时可造成显著的质量降级的帧。不同模型帧可具有不同级别的关键性。举例来说,对于两个模型帧n1和n2,如果非常容易从帧n1预测帧(n1+1)(即,帧n1旁的帧)而帧(n2+1)(即,帧n2旁的帧)并不非常依赖于帧n2,则帧n1可比帧n2关键,这是因为丢失帧n1可造成一个以上帧中的质量降级。
任务T100可经实施以基于模型帧和(可能地)相依帧和/或邻近模型帧的一或多个帧中的每一者的译码类型(即,待用以编码帧的译码过程)的指示来计算译码相依性的估计。此译码类型的实例可包括码激励线性预测(CELP)、噪声激励线性预测(NELP)、原型波形内插(PWI)或原型音调周期(PPP)等。举例来说,依据此准则,可将CELP模型帧视为比NELP模型帧关键。
额外或替代性地,任务T100可经实施以基于模型帧和(可能地)相依帧和/或邻近模型帧的一或多个帧中的每一者的话音模式(即,帧的话音内容的分类)来计算译码相依性的估计。话音模式的实例可包括有声、无声、静默和瞬态。“有声”的分类可进一步分成开始和稳定。瞬态的分类可进一步分成在瞬态中和不在瞬态中。举例来说,依据此准则,语音开始帧(话音突峰中的初始帧)可比稳定有声帧关键,这是因为话音突峰中的后续帧的编码可大量依赖于开始帧中的信息。在一个实例中,任务T100经实施以响应于模型帧为话音开始帧且相依帧为稳定有声帧的指示来计算译码相依性的估计以指示高的相依性程度。
额外或替代性地,任务T100可经配置以基于模型帧(和可能地相依帧和/或邻近模型帧的一或多个帧中的每一者)的一或多个其它性质来计算译码相依性的估计。举例来说,如果模型帧的一些重要参数的值与先前帧的对应值显著不同(例如,大于某一预定阈值),则模型帧可为关键帧,这是由于可能不易于从在模型帧前面的帧预测所述模型帧,且模型帧的丢失可不利地影响更类似于模型帧而非先前帧的后续帧。
此类性质的一个实例为自适应码簿(ACB)增益。模型帧的低ACB增益值可指示所述帧与在其前面的帧显著不同,而相依帧的高ACB增益值可指示所述帧非常依赖于模型帧。图4B展示包括任务T50和T60的方法M100的一实施方案M110的流程图。任务T50使用来自模型帧的信息(例如,激励信号)产生用于相依帧的自适应码向量,且任务T60计算相依帧的经编码版本的ACB增益值。在此实例中,任务T100经实施以至少基于计算出的ACB增益值来计算译码相依性的估计。
此类性质的另一实例为感知加权SNR(信噪比),在此情况下其可表达为
C n = Σ i = 0 L - 1 c i 2 Σ i = 0 L - 1 e i 2 ,
其中L以样本计的帧长度,c为通过用感知加权滤波器W(z)滤波模型帧n的经解码版本而获得的感知加权信号,且e为感知加权误差。举例来说,可将误差e计算为(A)模型帧n的W(z)滤波的经解码版本与(B)模型帧n的W(z)滤波的消除误差版本(即,假设所述帧在解码器处不可用)之间的差。可根据帧消除误差算法基于来自先前帧的信息来计算消除误差的版本。举例来说,可根据在3GPP TS26.091,v.11.0.0(2012年9月,“丢失帧的误差消除(Error concealment of lost frames)”,可从ETSI获得)中描述的程序计算消除误差版本。在一个实例中,W(z)=A(z/γ)H(z),其中
A ( z ) = 1 + Σ i = 1 p a i z - i ,
a1到ap为模型帧n的LPC滤波器系数,γ=0.92,且H(z)=1/(1-0.68z-1)。在一替代实例中,通过将滤波器W(z)应用到经解码版本与消除误差版本之间的差来计算误差e。
额外或替代性地,任务T100可经配置以将译码相依性的估计作为模型帧的丢失对一或多个后续帧(例如,相依帧)的译码质量的影响的估计加以计算。举例来说,关键性测量可基于来自相依帧和(可能地)在模型帧后的一或多个其它帧的经编码版本的信息(例如,模型帧和/或后续帧中的一或多者的自适应码簿增益)。额外或替代性地,此测量可基于相依帧和(可能地)在模型帧后的一或多个其它帧中的每一者的经解码版本的信息(例如,经解码版本的感知加权SNR),其中在不使用模型帧的信息的情况下编码相依和/或其它后续帧。
可将相依帧(n+k)相对于模型帧n的此测量的一个实例表达为
C n : n + k = Σ i = 0 L - 1 c i 2 Σ i = 0 L - 1 e i 2 ,
其中L为以样本计的帧长度,c为通过用感知加权滤波器W(z)滤波相依帧(n+k)的经解码版本而获得的感知加权信号,且e为感知加权误差。在此情况下可将误差e(例如)作为(A)无模型帧n的丢失时相依帧(n+k)的W(z)滤波的经解码版本与(B)假定模型帧n的消除误差版本时帧(n+k)的W(z)滤波的经解码版本之间的差加以计算。可如上所述使用相依帧(n+k)的LPC滤波器系数计算滤波器W(z)。在一替代实例中,通过将滤波器W(z)应用到相依帧(n+k)的正常解码版本与假定有丢失的解码版本之间的差来计算误差e。
任务T200用以计算阈值的信息可包括下列测量中的一或多者,可针对一系列时间间隔中的每一者更新所述测量:包丢失率、包丢失分数、预期的包数目、每秒的丢失率、接收的包计数、丢失估计有效性(例如,基于样本大小(例如,针对间隔所预期的包数目)的测量的加权测量)、视在处理量和抖动。如上指出,网络中(例如,沿着发射信道)的接收器和/或其它实体可经配置以使用带内消息接发经由控制信号(RTCP消息接发为一种此控制信令方法的实例)和/或经由另一服务质量(QoS)反馈机制将此信道状态信息120传递回到发射UE。可经由RTCP消息接发(实时输送控制协议,如在(例如)IETF规范RFC3550中定义)提供的信息的实例包括发射的八元组计数、发射的包计数、预期的包计数、丢失的包的计数和/或分数、抖动(例如,延迟的变化)和往返延迟。图6A展示包括任务T70的方法M100的一实施方案M120的流程图,任务T70接收信道状态信息,如在本文中所描述。
任务T200还可经配置以基于与发射信道的状态有关的信息120计算一个以上阈值。在此情况下,决策任务T300可经配置以使用来自帧(和/或一或多个邻近帧)的信息选择适当的经更新阈值。举例来说,可能需要使用关键性阈值确定是否要重传经确定含有话音的帧,且使用另一关键性阈值确定是否要重传经确定含有噪声的帧。在另一实例中,将不同阈值用于过渡(例如,开始)和稳定话音帧,和/或将不同阈值用于有声话音和无声话音帧。对于使用一个以上关键性阈值的情况,任务T200可经配置以从两个或两个以上关键性阈值中选择对应于待用于模型帧的阈值的关键性测量。
T300经配置以将计算出的估计与计算出的阈值进行比较。任务T350基于比较的结果决定是否发射模型帧的冗余副本。举例来说,任务T300可经实施以当计算出的估计超过(或者,不小于)计算出的阈值时决定重传。
可实施方法M100以使得仅当相依帧为作用中的话音帧时才执行任务T350(和(可能地)任务T100和/或T200)。或者,可实施方法M100以将非话音帧视为潜在关键帧。通常,在双向对话中,每一方在一些时间中说话(在此期间,通信系统发射所述方的话音)(例如,少于一半的时间)和在其它时间暂停(在此期间,通信系统发射静默或背景噪声)。在静默(或背景噪声)周期期间的不经常发射或不连续发射(DTX)对对话的感知质量具有极少影响,但提供减少相互干扰/小区间干扰(因此潜在增大系统容量)且节省用于对话的移动单元的电池电力的益处。
典型的DTX方案由使用语音活动检测(VAD)的话音编码器实现。通过使用VAD,编码器可将作用中的话音与背景噪声区分开来。编码器用供发射的目标位速率包编码每一作用中的话音区段(通常,20ms长),且用相对小的包表示关键背景噪声区段(再次,通常20ms长)。此小的包可为指示静默的静默描述符(SID)。关键背景噪声区段可能为紧接在话音突峰后的背景噪声区段,或与其先前噪声区段具有显著不同特性的背景噪声区段。其它类型的背景噪声区段(或非关键背景噪声区段)可用零位来表示,或留下空白,或不被发射,或受抑制而不发射。当输出包的此模式(即,一或多个作用中区段,接着为一或多个关键背景噪声区段,接着为一或多个非关键背景噪声区段)纯粹取决于话音编码器的输入或来源时,此DTX方案称作源控制的DTX方案。
图5A和图5B展示信道状态信息、基于那个信息的关键性阈值与所得的将作出重传的决策的可能性之间的关系的实例。在图5B的实例中,信道的所报告质量低于图5A中的信道的所报告质量。因此,图5B中的关键性阈值不如图5A中的关键性阈值挑剔,且所得的作出重传的决策的可能性较高。如果信道的所报告质量变得过低,则所得的作出重传的决策的可能性可变得过高。
可能需要实施方法M100以限制可被重传的帧的数目或比例。举例来说,可能需要平衡改进在不良信道条件下的性能与保持原生话音译码质量和/或阻止归因于重传(其可归因于过度包括性的关键性确定而被触发)的容量丢失。
限制重传频率的一种方法为实施任务T200,使得阈值受限于下限值(即,下边界值或底值),下限值限制了可重传的帧的数目。举例来说,可实施任务T200以强制计算出的阈值具有最小值。图6B展示任务T200的包括子任务T210a、T210b和T210c的此实施方案T210的流程图。任务T210a如本文中所描述(即,基于信道状态信息)计算候选阈值。任务T210b将计算出的候选阈值与边界值(例如,下限值)进行比较。基于比较的结果,任务T210c在以下各者中选择一者,使得任务T210产生选定值作为计算出的阈值:(A)计算出的候选阈值,和(B)边界值。举例来说,任务T210c可经实施以在计算出的候选值大于(或者,不小于)边界值的情况下选择计算出的候选值,否则,选择边界值。以此方式,任务T210可经配置以使计算出的阈值修剪到极限值。任务T210还可经配置使得当比较结果为否时(例如,当修剪发生时),任务T210向另一模块指示此条件(例如,用于记录所述条件、向基站报告所述条件和/或执行另一补救动作)。
当然,还可能替代地实施任务T100以使得关键性测量的计算出的值与关键性成反比例。在此情况下,任务T350可经配置以当关键性测量低于(或者,未超过)计算出的阈值时决定重传帧,且任务T210可经配置以将计算出的阈值与上限值(即,上边界值或顶值)进行比较(且可能地将计算出的阈值修剪到上限值)。
图7A展示方法M100的包括任务T400的实施方案M200的流程图。任务T400产生模型帧的冗余副本。冗余副本通常具有比经编码信号中的模型帧的主要副本(即,正常编码时的模型帧的副本)少的位,且可由解码器用以执行前向错误校正(FEC)操作以校正由主要副本的部分或全部丢失导致的错误。可实施任务T400以在决策任务T350前,或者响应于任务T350的发射冗余副本的决策而产生冗余副本。
通常,需要冗余副本提供可用于解码后续帧的良好参考(例如,良好的自适应码簿)。模型帧的冗余副本可包括模型帧的主要副本的参数中的一些或全部。可实施任务T400以产生冗余副本,作为模型帧的主要副本的精简的版本。举例来说,主要副本可为模型帧的经编码版本,其包括例如频率包络信息(例如,LPC或MDCT系数)和/或时间包络信息(例如,用于CELP编解码器的固定码簿索引、固定码簿增益、自适应码簿增益、音调滞后和/或音调增益;用于PWI或PPP编解码器的原型参数和/或音调信息)的分量。可实施任务T400以产生冗余副本以包括一或多个这些分量中的每一者的部分或全部的副本。举例来说,可实施任务T400以产生冗余副本以包括一或多个码簿索引,所述一或多个码簿索引识别量化的LPC滤波器参数和/或量化的时间包络(例如,激励信号)参数。
在这些情况下,可实施任务T400以使用(例如,复制和/或聚合)模型帧的主要副本的已经计算的分量来装配冗余副本。可实施任务T400以按满足位约束或遵照与速率约束相关联的结构的方式产生冗余副本。此结构可包括用于帧或用于帧的一或多个子帧中的每一者、用于例如以上提到的参数(即,LPC滤波器信息、音调延迟、固定/自适应码簿索引/增益等)的多个参数中的每一者的指定数目个位。
额外或替代性地,可实施任务T400以通过使用与用以产生模型帧的主要副本的译码方法不同的译码方法编码模型帧来产生冗余副本的部分或全部。在此情况下,此不同译码方法将通常具有比用以产生模型帧的主要副本的方法低的速率(例如,使用较低阶LPC分析、使用窄频带编解码器而非宽频带编解码器等)。此不同译码方法可为不同的位速率和/或不同的译码方案(例如,对于主要副本为CELP,而对于冗余副本为PPP或PWI)。在一个实例中,任务T400经实施以将模型帧和所指示的分配Nm(例如,作为位的数目或作为位速率)提供到帧编码器(例如,帧编码器FE20)。
可将冗余副本的大小指示为位的数目或位速率,且冗余副本的大小可为固定的或可调整的。在一个实例中,作为在音频信号中在模型帧后且在其上背负冗余副本的帧(“载波”帧)的初始位分配T的重新分布的部分来指示冗余副本的大小。载波帧可与相依帧相同,或可实施方法M200以使得相依帧与载波帧可不同。T值的特定实例包括253个位(其对应于(例如)12.65kbps(每秒千位)的位速率和二十毫秒的帧长度)和192个位(其对应于(例如)9.6kbps的位速率和二十毫秒的帧长度)。
在一个此情况下,选定重新分配分布Nm指示将针对载波帧的初始位分配T分裂成将Nm个位分配到模型帧的冗余副本且将(T-Nm)个位分配到载波帧的副本。对T个位的分配的一组分布中的一者的选择可实施为选定载波帧的位速率的改变和用以编码模型帧的冗余副本的低位速率方案的选择。举例来说,可通过将载波帧的位速率从12.65kbps的开始位速率改变到9.6kbps的减小的位速率、根据现有9.6kbps方案编码载波帧且使用3.05kbps方案编码模型帧的冗余副本来(例如,在AMR编解码器内)实施将T个位的分配分布为大小为Nm个位的一部分以载运模型帧的冗余副本和大小为(T-Nm)个位的一部分以载运载波帧的主要副本(其中T=253且Nm=61)。
可能需要针对冗余编码实施若干个这些低位速率方案,每一者对应于所述组分布中的不同者。其它开始位速率的实例包括8.85kbps、8.55kbps、6.6kbps、6.2kbps、4kbps、2.7kbps和2kbps,其分别对应于177、171、132、124、80、54和40的T值(例如,对于二十毫秒的帧长度)。其它开始位速率的另外实例包括23.85kbps、23.05kbps、19.85kbps、18.25kbps、15.85kbps、14.25kbps和12.65kbps,其分别对应于477、461、397、365、317、285和253的T值(例如,对于二十毫秒的帧长度)。可根据如(例如)本文中引用的AMR-WB编解码器的版本10(例如,使用CELP译码模型)中所描述的此速率编码帧。
任务T400可经实施以根据载波帧的可压缩性的测量的值选择冗余副本的大小(例如,以选择T的特定重新分配)。举例来说,此任务可经配置以响应于指示高可压缩性的值来选择冗余副本的较大大小(例如,以选择对应的重新分配),且响应于指示低可压缩性的值来选择冗余副本的较小大小(例如,以选择对应的重新分配)。可压缩性的静态测量的一个实例为可作为载波帧的子帧相互间的相关性(例如,在子帧的所有可能滞后值和所有对(或所有邻近对)上的最大相关性,或在子帧的每一对(或每一邻近对)的所有可能滞后值上的最大相关性的平均值)而计算的开放环路度量。可压缩性的动态测量的一个实例为闭合环路度量,其针对多个冗余副本大小候选者和/或载波帧候选者中的每一者指示载波帧的感知质量的相关联改变(例如,减少)的测量。举例来说,可将此度量作为以下者的差(例如,绝对差)或比率而计算:(A)使用全部初始位分配T进行编码时载波帧的感知质量的测量,及(B)仅使用初始位分配的在应用了冗余副本大小候选者后剩余的部分进行编码时载波帧的感知质量的测量。
任务T400可包括:根据选定的重新分配候选者将用于后续帧的初始位分配T重新分配成第一部分和第二部分,将载波帧的副本编码成第一部分,且将模型帧的冗余副本编码成第二部分。可实施任务T400以在选择重新分配候选者(例如,作为对重新分配决策度量计算的输入参数)前或响应于对重新分配候选者的选择而产生载波帧的副本。
虽然以上提及将本文中描述的原理应用于固定位速率方案(例如,其中每一帧接收相同初始位分配T),但还可能将这些原理应用于T个位的总帧分配可在帧间改变的方案。举例来说,可用以编码载波帧的位的数目T可根据载波帧含有话音还是噪声,或根据载波帧含有有声话音还是无声话音等而变化。
在重新分配位以编码冗余副本以外或作为其替代,在不良信道条件下,可能需要增加用以编码关键帧的冗余副本的位的数目。举例来说,响应于关于信道条件的输入(例如,如本文中参考任务T70描述的信道状态信息),方法M200可经实施以调整可在有缺陷信道上发射的冗余的程度和频率。在任务T400中用以编码冗余副本的位的数目可受限于上限,所述上限反映在改进不良信道条件下的性能与保持原生话音译码质量和/或减少归因于重传的容量丢失之间的平衡。在这些情况下,用以编码冗余副本的位的数目可为相对于主要帧来说是额外的,而非从后续帧(即,从载波帧)重新分配。举例来说,用于冗余副本的位的数目可独立于用于主要帧的位的数目,且可参考例如信道容量和/或网络状态(例如,堵塞)的所接收(例如,经由发射信道)信息来确定。
方法M200还包括任务T500,其产生包括模型帧的冗余副本的经编码信号。举例来说,可实施任务T500以将冗余副本背负于如上所述的一或多个载波帧(例如,经编码信号中的对应于在原始信号中在模型帧后的帧的帧)上。在一个此实例中,冗余副本被包括于指派到在输入音频信号中在模型帧后的载波帧的包中。在此情况下,任务T500可包括确定载波偏移p的值,其通过指示原始信号中模型帧与载波帧之间的帧数目来识别将要载运冗余副本的后续帧。替代性或额外地,任务T400可包括选择将若干位从编码后续帧重新分配到编码冗余副本,所述选择可基于解码时所得后续帧的感知质量的测量。还可能需要实施任务T500以在经编码信号内包括指示偏移的值和/或重新分配的位的数目的信息。或者,可由解码器从经编码信号中的其它信息导出此信息。
载波偏移p的值指示模型帧n与载波帧(n+p)之间的距离。偏移p的值可与偏移k的值相同(即,使得相依帧为载波帧),或方法M200可经实施以允许相依偏移k具有与载波偏移p不同的值。方法M200可经实施使得模型帧与载波帧之间的偏移p(例如,帧号的差的指示,或比介入帧的数目多1)为固定的。在一典型实例中,p的值为三。在另一实例中,p的值为四。其它可能值包括一、二、三、五和大于五的整数。
图7B展示包括任务T500的实施方案T510的方法M200的实施方案M210的流程图。任务T510包括子任务T510a,其产生含有模型帧n的主要副本的第一包。任务T510还包括子任务T510b,其产生含有载波帧(n+p)的副本和如由任务T400产生的模型帧n的冗余副本的第二包。可能需要实施任务T510b以产生第二包以包括指示其载运模型帧的冗余副本,指示偏移p的值和/或指示重新分配的位数目Nm的信息。或者,此信息可由解码器从经编码信号中的其它信息导出。任务T510可经实施以响应于重传决策T350而执行任务T510b。图8展示方法M110、M120和M210的实施方案M300的流程图。
可实施任务T500以基于载波帧(例如,帧(n+p))也将为关键帧的估计的可能性来选择载波帧(例如,选择载波偏移p的值),这是因为可能需要避免将另一关键帧的主要副本的位重新分配。通常,此可能性对于紧接在关键帧后的帧(即,帧(n+1))最高,且随着p增大而迅速降低。对于有声话音,开始帧和紧接在其后的帧(例如,为了涵盖当开始帧丢失时的情况)通常关键。然而,另一后续帧还可能为关键的(例如,对于音调滞后发生漂移的情况)。
额外或替代性地,可实施任务T500以根据原始时域信号中的帧的长度(例如,单位:毫秒)和最大容许延迟选择载波帧(例如,以选择载波偏移p的值)。举例来说,p的值可受到最大容许值约束(例如,以限制帧延迟)。可能需要最大容许延迟具有八十或一百毫秒的值。在此情况下,对于使用二十毫秒帧的方案,p可具有四或五的最大值,或对于使用十毫秒帧的方案,p可具有八、九或十的最大值。
额外或替代性地,可实施任务T500以根据信道条件(例如,如由来自接收器的反馈和/或如本文中描述的其它信道状态信息指示)选择载波帧(例如,以选择载波偏移p的值)。举例来说,载波偏移p的值指示帧的主要副本的发射时间与所述帧的冗余副本的发射时间之间的间隔的长度,且在正造成连续帧的频繁丢失(例如,归因于长的衰落)的环境下,可能需要使用较高p值。通常,包交换式网络中的包丢失为突发性的,且突发长度可在不同网络条件下不同。因此,使用动态调整的载波偏移值可导致较好的错误保护性能。可使用信道状态信息(例如,如由接收器和/或另一实体发送)估计最佳载波偏移值。举例来说,可基于信道条件自适应地调整(例如,在执行时间)载波偏移值。或者,载波偏移值可为预定的。
额外或替代性地,可实施任务T500以基于可压缩性的相关联的测量的值选择载波帧(例如,以选择载波偏移p的值)。举例来说,可实施任务T500以从在输入音频信号中在模型帧后的多个P个帧中选择一载波帧(例如,以选择p的对应值,其中1<p<P)。在此情况下,可实施任务T500以选择载波帧作为P个候选帧中的最可压缩帧,如由P个帧中的每一者的可压缩性测量的对应值指示。可用于此帧选择的可压缩性测量的实例包括如上论述的静态测量(例如,开放环路度量)和动态测量(例如,闭合环路度量)。
可实施方法M200以包括使用T个位编码多个P个载波帧候选者中的至少一者(例如,非载波帧)。此方法可甚至包括使用T个位编码多个P个候选帧中的非载波帧中的每一者。然而,信号还可能包括两个邻近关键帧或以其它方式相互靠近的两个关键帧,使得相对于一关键帧的P个载波帧候选者的集合重叠相对于另一关键帧的P个载波帧候选者的集合(即,具有与相对于另一关键帧的P个载波帧候选者的集合共同的至少一个帧)。在此情况下,共同后续帧中的一者可经选择以载运关键帧的冗余副本,且共同后续帧中的另一者可经选择以载运另一关键帧的冗余副本,使得使用少于T个位编码这些两个后续帧中的每一者。选定后续帧自身也可能为关键帧。举例来说,在一些情况下,可预期相对于关键帧的P个载波帧候选者的集合在约百分之二十的时间可包括至少一个其它关键帧。
一包可包括一或多个帧。可能需要将包长度限制为20毫秒(例如,以减小滞后)。图9A展示使用用于VoIP通信的典型协议堆栈(其包括因特网协议版本4(IPv4)、用户数据报协议(UDP)和RTP)编码的包的额外开销的一实例。图9B展示IP版本6(IPv6)包的类似实例。有效负载大小的实例包括用于G.711编解码器的160个字节、用于G.729编解码器的20个字节和用于G.723.1编解码器的24个字节。可与如本文中描述的自适应关键性指示的方法一起使用的其它编解码器包括(但不限于)如上列举的G.726、G.728、G.729A、AMR、AMR-WB、AMR-WB+、VMR-WB、EVRC、SMV和EVS。
图10展示载运模型帧的冗余副本和在模型帧后的帧的副本的RTP包的有效负载的实例。在AMR-WB8.85kbps模式下编码冗余副本(位r(0)到r(176)),如由对应的帧类型指示符FT的值1指示,且在AMR-WB6.6kbps模式下编码载波帧的副本(位p(0)到p(131)),如由对应的帧类型指示符FT的值0指示。在此实例中,编解码器模式请求指示符CMR请求接收终端处的编码器采用8.85kbps模式,且有效负载以三个填补位P结束以填满最后的八位。在另一实例中,有效负载可含有两个以上经编码帧,和/或冗余副本可具有比载波帧的副本少的位(即,可按较低速率编码),和/或冗余副本的位可在包中的载波帧的副本的位之前(其中副本的对应的目录条目的次序相应地被切换)。
可能需要实施任务T510以使用标头压缩:例如,以将RTP标头从十二个字节压缩减到四个字节。RTP标头包括时戳,其可用以计算发射时间;且包括序号,序号可用以正确呈现无序地接收的包和/或检测包丢失。稳健标头压缩(ROHC;如在IETF RFC3095、RFC3843和/或RFC4815中所描述)可用以支持较大压缩率(例如,将一或多个且可能全部包标头压缩减到一到四个字节)。
在一个配置中,任务T510b经实施以将载波帧(即,当前话音帧(n+p))的副本和模型话音帧n的冗余副本包化成实时协议(RTP)包以用于发射到接收终端。在任务T510b的另一配置中,后续帧(n+p)的副本和模型话音帧n的冗余副本虽然同时产生,但仍被封装到不同的对应RTP包且发射到接收终端。使用哪一格式的决策可基于两个终端的能力。如果在每一终端中支持两个格式,则可使用引起较低数据速率的格式。
图11为音频解码器AD10的实施方案AD20的方框图。音频解码器AD20可实施为声码器的部分,或实施为独立实体,或分布于接收终端104内的一或多个实体上。音频解码器AD20还可实施为VoIP订户端的部分。
音频解码器AD20将在下文就其功能性来予以描述。音频解码器AD20可实施为硬件、固件、软件或其任何组合,且实施其的方式可视特定应用和强加于总体系统上的设计约束而定。以实例说明,音频解码器AD20可用微处理器、数字信号处理器(DSP)、可编程逻辑、专用硬件或任一其它基于硬件和/或软件的处理实体来实施。
在此实例中,音频解码器AD20包括去抖动缓冲器DB10(还称作“抖动缓冲器”)。去抖动缓冲器DB10可为减少或消除由包到达时间的变化(例如,归因于网络堵塞、时序漂移和/或路由改变)造成的抖动的硬件装置或软件过程。去抖动缓冲器DB10可以包为单位接收音频帧。去抖动缓冲器DB10可经实施以延迟新到达的包,使得可按正确次序(例如,如由包的时戳指示)将先前到达的包中的帧连续提供到帧解码器FD20,从而导致清晰的连线而具有极少音频失真。去抖动缓冲器DB10可为固定的或自适应的。固定去抖动缓冲器可将固定延迟引入到包。另一方面,自适应去抖动缓冲器可适应于网络延迟的改变。去抖动缓冲器DB10可按适当次序将经编码音频帧(例如,包括索引XL、XF、XG和XP)提供到帧解码器FD20。
如果帧的副本未由去抖动缓冲器接收到,则在未使用FEC的情况下可造成帧丢失。当使用FEC且当前待播放的帧的副本丢失时,去抖动缓冲器DB10可确定缓冲器中是否存在所述帧的冗余副本。如果当前帧的冗余副本可用时,可将冗余副本提供到帧解码器FD20进行解码以产生音频样本。
此外,可修改去抖动缓冲器DB10以不同地处理主要帧(即,原始关键帧)和冗余帧(即,原始关键帧中的一些或全部的副本)。缓冲器DB10可不同地处理这些两个帧,使得与实施如本文中描述的FEC操作相关联的平均延迟不大于当不实施方案FEC操作时的平均延迟。举例来说,可实施缓冲器DB10以检测传入的包含有冗余副本(例如,包含有两个帧)和响应于此检测而起始冗余副本的解码。
从去抖动缓冲器DB10释放的音频帧可被提供到帧解码器FD20以产生解码的核心音频帧DF(例如,合成的话音)。一般而言,可实施帧解码器FD20以执行将话音解码成此项技术中已知的合成话音的任一方法。在图11的实例中,帧解码器FD20使用对应于如上文参看图3描述的编码方法的CELP解码方法。在此实例中,固定码向量产生器VG10解码FCB索引XF和增益索引XG的对应部分以产生每一子帧的固定码向量,反量化器IA10和向量产生器A50解码ACB索引XP和增益索引XG的对应部分以产生每一子帧的自适应码向量,且加法器AD10组合对应的码向量以产生激励信号且更新存储器ME10(例如,如在3GPP TS26.190v11.0.0的第6.1章的步骤1-8中所描述)。反量化器IL10和反变换模块IM10解码LPC索引XL以产生LP滤波器系数向量,LP滤波器系数向量由合成滤波器SF10应用到激励以产生合成信号(例如,如在3GPP TS26.190v11.0.0的初始段落和第6.1章的步骤4中所描述)。将原始合成信号提供到后滤波器PF10,后滤波器PF10可经实施以执行例如高通滤波、增量和内插的操作(例如,如在3GPPTS26.190v11.0.0的第6.2章中所描述)以产生经解码的核心音频帧DF。或者(且不受限制),帧解码器FD20可使用NELP或PPP全帧解码方法。
可将包括主要副本的参数值中的一些(即,一部分集合)的帧的冗余副本从去抖动缓冲器DB10传递到部分帧解码模块。举例来说,可实施帧解码器FD20以在冗余副本可利用之前产生对应于关键帧的帧(例如,根据如在如上文引用的3GPP TS26.091,v.11.0.0中所描述的消除误差程序)。在此情况下,帧解码器FD20可包括一部分帧解码模块,其经配置以在解码载波帧(n+p)之前更新存储器ME10(例如,根据来自冗余副本的固定和自适应码簿索引和增益)。
在接收器侧,可将话音帧存储于可为自适应的去抖动缓冲器DB10中。如先前提到,去抖动缓冲器DB10可经设计以使得话音帧的平均延迟不大于不使用FEC技术时的平均延迟。可按适当次序将帧从去抖动缓冲器DB10发送到帧解码器(例如,解码器FD20)。如果冗余副本为主要副本的参数的一部分集合,则可使用部分帧解码模块。
如本文中描述的源控制和信道控制的FEC方案可减少包丢失的数目和丢失的突发性,同时数据速率极少增加或不增加。关键帧识别可帮助确保话音感知质量与数据速率之间的良好取舍。可实施此FEC方案以便有效率地使用可利用的带宽且与旧式通信装置向后兼容。
可实施音频编码器AE10以包括动态速率控制模块。此模块可实施两个步骤以接近预定目标速率。在第一步骤中,确定两个邻近操作点。选择这些两个邻近操作点(其可为数据速率)以使得目标数据速率的值在两个操作点的值之间。可基于容量需求在外部指定目标数据速率。或者,可基于(例如)信道状态信息在内部指定目标数据速率。可实施此速率控制以允许按任何指定数据速率进行如本文中描述的FEC方案,使得运营商可基于容量需求来决定数据速率。
图12A展示根据一般配置的用于信号处理的设备MF100的方框图。设备MF100包括用于计算音频信号的第二帧对在所述音频信号中在所述第二帧之前的第一帧的译码相依性的估计(例如,如本文中参考任务T100所描述)的装置F100。设备MF100还包括用于基于与发射信道的状态有关的信息计算阈值(例如,如本文中参考任务T200所描述)的装置F200。设备MF100还包括用于将所述计算出的估计与所述计算出的阈值进行比较(例如,如本文中参考任务T300所描述)的装置F300。设备MF100还包括用于基于所述比较的结果决定发射所述第一帧的冗余副本(例如,如本文中参考任务T350所描述)的装置F350。
图12B展示设备MF100的实施方案MF110的方框图,其还包括用于使用来自第一帧的信息产生用于第二帧的自适应码向量(例如,如本文中参考任务T50所描述)的装置F50和用于计算第二帧的经编码版本的ACB增益值(例如,如本文中参考任务T60所描述)的装置F60。在此情况下,装置F100经配置以基于自适应码向量和ACB增益值计算计算出的估计。
图13A展示设备MF100的实施方案MF120的方框图,其还包括用于接收信道状态信息(例如,如本文中参考任务T70所描述)的装置F70。图13B展示设备MF100的实施方案MF200的方框图,其还包括用于产生第一帧的冗余副本(例如,如本文中参考任务T400所描述)的装置F400和用于产生包括冗余副本的经编码信号(例如,如本文中参考任务T500所描述)的装置F500。
图14A展示可任选地在如本文中描述的设备MF100的任一实施方案中使用的装置F200的实施方案的实例F210的方框图。装置F210包括用于将基于与发射信道的状态有关的信息的计算出的值与边界值进行比较(例如,如本文中参考任务T210a所描述)的装置F210a,和用于响应于与边界值的所述比较的结果选择边界值作为计算出的阈值(例如,如本文中参考任务T210b和T210c所描述)的装置F210b。
图14B展示包括装置F500的实施方案F510的设备MF200的实施方案MF210的方框图。装置F510包括用于产生包括第一帧的主要副本的第一包(例如,如本文中参考任务T510a所描述)的装置F510a,和用于响应于所述决定产生包括第一帧的冗余副本和第二帧的副本的第二包(例如,如本文中参考任务T510b所描述)的装置F510b。图15展示设备MF110、MF120和MF210的实施方案MF300的方框图。
图16A展示根据一般配置的设备AP100的方框图,其包括第一计算器A100、第二计算器A200和模式选择器A300。第一计算器A100经配置以计算音频信号的第二帧对在所述音频信号中在所述第二帧之前的第一帧的译码相依性的估计(例如,如本文中参考任务T100所描述)。第二计算器A200经配置以基于与发射信道的状态有关的信息计算阈值(例如,如本文中参考任务T200所描述)。模式选择器A300经配置以(A)将计算出的估计与计算出的阈值进行比较,和(B)基于所述比较的结果决定发射所述第一帧的冗余副本(例如,如本文中参考任务T300和T350所描述)。
图16B展示设备AP100的实施方案AP110的方框图,所述实施AP110还包括:向量产生器A50,其经配置以使用来自第一帧的信息产生用于第二帧的自适应码向量(例如,如本文中参考任务T50所描述);及自适应码簿增益计算器A60,其经配置以计算第二帧的经编码版本的ACB增益值(例如,如本文中参考任务T60所描述)。在此情况下,第一计算器A100经配置以基于自适应码向量和ACB增益值来计算计算出的估计。
图16C展示可任选地在如本文中描述的设备AP100的任一实施方案中使用的第二计算器A200的实施方案的实例A210的方框图。计算器A210包括:比较器A210a,其经配置以将基于与发射信道的状态有关的信息的计算出的值与边界值进行比较(例如,如本文中参考任务T210a所描述);及选择器A210b,其经配置以响应于与边界值的所述比较的结果选择边界值作为计算出的阈值(例如,如本文中参考任务T210b和T210c所描述)。
图16D展示设备AP100的实施方案AP120的方框图,其还包括经配置以接收信道状态信息(例如,如本文中参考任务T70所描述)的信道解码器CD11。图16E展示可任选地在如本文中描述的设备AP100的任一实施方案中使用的第二计算器A200的实施方案的实例A220的方框图。第二计算器A220包括:阈值计算器A210c,其经配置以基于信道状态信息计算第一阈值和第二阈值;及阈值选择器A210d,其经配置以基于来自第一帧和在音频信号中邻近第一帧的帧中的至少一者的信息从第一和第二阈值中选择计算出的阈值(例如,如本文中参考任务T200所描述)。第二计算器A200可实施为计算器A210与A220两者的实施方案(例如,使得阈值选择器A210d将选定值提供到比较器A210a作为计算出的值)。
图17A展示设备AP100的实施方案AP200的方框图,所述实施AP200还包括:帧编码器FE10的(例如,帧编码器FE20的)实施方案A400,其经配置以产生第一帧的冗余副本(例如,如本文中参考任务T400所描述);及信道编码器CE10的实施方案A500,其经配置以产生包括冗余副本的经编码信号(例如,如本文中参考任务T500所描述)。帧编码器A400可经配置以选择冗余副本的大小或从设备AP200的经配置以执行此选择的另一模块接收所述大小的指示(例如,如本文中参考任务T400所描述)。
图17B展示包括信道编码器A500的实施方案A510的设备AP200的实施方案AP210的方框图。信道编码器A510包括包装配器A510a,其经配置以产生包括第一帧的主要副本的第一包(例如,如本文中参考任务T510a所描述),且响应于所述决定产生包括第一帧的冗余副本和第二帧的副本的第二包(例如,如本文中参考任务T510b所描述)。图17C展示设备AP210的实施方案AP220的方框图,所述实施AP220包括偏移计算器A520,其经配置以确定指示第一帧与第二帧之间的音频信号的帧总数的偏移值(例如,如本文中参考任务T500所描述,例如,基于信道状态信息和/或第二帧的可压缩性)。
图18A展示设备AP110、AP120和AP210的实施方案AP300的方框图。图19展示设备AP300的实施方案AP400的方框图,所述实施AP400包括第一用户接口U110的实例和音频编码器AE10的(例如,音频编码器AE20的)实施方案AE30,所述音频编码器AE30包括设备AP110的实例且经布置以压缩来自接口U110的音频信息。在此情况下,帧编码器A400可经配置以选择冗余副本的大小或从音频编码器AE30的经配置以执行此选择的另一模块接收所述大小的指示(例如,如本文中参考任务T400所描述)。
图9C展示包括芯片或芯片组CS10(例如,移动台调制解调器(MSM)芯片组)的通信装置D10的方框图,所述芯片或芯片组CS10可经实施以体现如本文中描述的设备AP100(或MF100)的实施方案中的任何一或多者的元件。芯片/芯片组CS10可包括一或多个处理器,其可经配置以执行设备A100或MF100的软件和/或固件部分(例如,作为指令)。可将发射终端102实现为装置D10的实施方案。
芯片/芯片组CS10包括:无线电接收器(例如,RX10的实施方案),其经配置以接收射频(RF)通信信号且解码并再现在RF信号内编码的音频信号(和信道状态信息);及无线电发射器(例如,TX10的实施方案),其经配置以将基于经由麦克风MV10-1和/或MV10-3接收(例如,如本文中参考第一用户接口U110所描述)的音频信息的经编码的音频信号(例如,如由任务T500产生)作为描述经编码音频信号的RF通信信号发射到发射信道内。此装置可经配置以经由本文中参考的编解码器中的任何一或多者无线地发射和接收语音通信数据。
装置D10经配置以经由天线C30接收且发射RF通信信号。在到天线C30的路径中,装置D10还可包括双工器和一或多个功率放大器。芯片/芯片组CS10还经配置以经由小键盘C10接收用户输入且经由显示器C20显示信息。在此实例中,装置D10还包括一或多个天线C40以支持全球定位系统(GPS)位置服务和/或与例如无线(例如,BluetoothTM)耳机的外部装置的短程通信。在另一实例中,此通信装置自身为BluetoothTM耳机且没有小键盘C10、显示器C20和天线C30。
通信装置D10可体现于包括智能手持机和膝上型计算机和平板计算机的各种各样的通信装置中。图20展示一个此实例的前视图、后视图和侧视图:手持机H100(例如,智能手持机)具有布置于前面上的两个语音麦克风MV10-1和MV10-3、布置于后面上的语音麦克风MV10-2、位于前面的顶角中的另一麦克风ME10(例如,用于增强型方向选择性和/或在用户的耳朵处捕获声学误差以用于输入到主动噪声消除操作)和位于后面上的另一麦克风MR10(例如,用于增强型方向选择性和/或捕获背景噪声参考)。扬声器LS10布置于前面的顶部中心、在误差麦克风ME10附近,且还提供两个其它扬声器LS20L、LS20R(例如,用于扬声电话应用)。此手持机的麦克风之间的最大距离通常为约十或十二厘米。
图18B展示无线装置1102的方框图,其可经实施以执行如本文中描述的方法(例如,方法M100、M110、M120、M200、M210和M300中的任何一或多者)。可将发射终端102实现为无线装置1102的实施方案。无线装置1102可为远端台、接入终端、手持机、个人数字助理(PDA)、蜂窝式电话等。
无线装置1102包括控制装置的操作的处理器1104。处理器1104还可被称作中央处理单元(CPU)。可包括只读存储器(ROM)和随机存取存储器(RAM)两者的存储器1106将指令和数据提供到处理器1104。存储器1106的一部分还可包括非易失性随机存取存储器(NVRAM)。处理器1104通常基于存储于存储器1106内的程序指令执行逻辑和算术运算。可执行存储器1106中的指令以实施如本文中描述的所述或所述方法。
无线装置1102包括外壳1108,其可包括发射器1110和接收器1112以允许在无线装置1102与远端位置之间的发射和接收数据。发射器1110与接收器1112可经组合为收发器1114。天线1116可附接到外壳1108或电耦合到收发器1114。无线装置1102还可包括(未图示)多个发射器、多个接收器、多个收发器和/或多个天线。
在此实例中,无线装置1102还包括信号检测器1118,其可用以检测和量化由收发器1114接收的信号的电平。信号检测器1118可将这些信号检测为总能量、每伪噪声(PN)码片的导频能量、功率谱密度和其它信号。无线装置1102还包括数字信号处理器(DSP)1120以用于在处理信号时使用。
无线装置1102的各种组件由总线系统1122耦合在一起,除了数据总线之外,总线系统1122还可包括电力总线、控制信号总线和状态信号总线。为了清晰起见,各种总线在图18B中被说明为总线系统1122。
本文中揭示的方法和设备可大体上应用于任何收发和/或音频感测应用中,尤其是这些应用的移动或其它便携式实例。举例来说,本文中揭示的配置的范围包括驻留于经配置以使用码分多址(CDMA)空中接口的无线电话通信系统中的通信装置。然而,所属领域的技术人员应理解具有如本文中所描述的特征的方法和设备可驻留于使用所属领域的技术人员已知的广泛范围的技术的各种通信系统中的任何者中,例如在有线和/或无线(例如,CDMA、TDMA、FDMA和/或TD-SCDMA)发射信道上使用因特网协议语音(VoIP)的系统。
明确地设想且特此揭示:本文中所揭示的通信装置可经调适用于在包交换(例如,经布置以载运根据例如VoIP的协议的音频发射的有线和/或无线网络)和/或电路交换的网络中使用。还明确地设想且特此揭示:本文中所揭示的通信装置可经调适以用于在窄频译码系统(例如,编码约四或五千赫的音频频率范围的系统)中使用,和/或用于在宽频译码系统(例如,编码大于五千赫的音频频率的系统)中使用,包括全频带宽频译码系统和分割频带宽频译码系统。
提供所描述配置的陈述以使任何所属领域的技术人员能够制造或使用本文中揭示的方法和其它结构。本文中所展示和描述的流程图、方框图和其它结构仅为实例,且这些结构的其它变型还处于本发明的范围内。对这些配置的各种修改为可能的,且本文中所呈现的一般原理还可适用于其它配置。因此,本发明无意限于以上所展示的配置,而是将被赋予与本文中以任何方式揭示的包括于所申请的附加权利要求书中的原理和新颖特征相一致的最广泛范围,所述权利要求书形成本原创发明的一部分。
所属领域的技术人员将理解,可使用各种各样的不同技术和技艺中的任一者来表示信息和信号。举例来说,贯穿以上描述可能提及的数据、指令、命令、信息、信号、位和符号可由电压、电流、电磁波、磁场或磁粒子、光场或光粒子或者其任何组合来表示。
对于如本文中揭示的配置的实施来说是重要的设计要求可包括使处理延迟和/或计算复杂性(通常按每秒百万个指令或MIPS测量)最小化,对于计算密集式应用,例如,压缩的音频或视听信息的播放(例如,根据压缩格式编码的文件或串流,例如,本文中识别的实例中的一者),或用于宽频通信的应用(例如,按例如12kHz、16kHz、32kHz、44.1kHz、48kHz或192kHz的高于八千赫的取样速率的语音通信)尤其如此。
如本文中揭示的设备(例如,设备MF100、MF110、MF120、MF200、MF210、MF300、AP100、AP110、AP120、AP200、AP210、AP300和AP400中的任何者)可按被视为适合于既定的应用的硬件与软件和/或与固件的任何组合来实施。举例来说,可将此设备的元件制造为驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片上的电子和/或光学装置。此装置的一个实例为固定或可编程逻辑元件(例如,晶体管或逻辑门)的阵列,且这些元件中的任一者可实施为一或多个这些阵列。这些元件的任两者或两者以上或甚至所有者可实施于同一阵列或若干相同阵列内。此或这些阵列可实施于一或多个芯片内(例如,包括两个或两个以上芯片的芯片组内)。
本文中揭示的设备(例如,设备MF100、MF110、MF120、MF200、MF210、MF300、AP100、AP110、AP120、AP200、AP210、AP300和AP400中的任何者)的各种实施方案的一或多个元件还可整个或部分地实施为一或多个指令集,所述一或多个指令集经布置以执行于一或多个固定或可编程逻辑元件阵列上,例如,微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA(现场可编程门阵列)、ASSP(专用标准产品)和ASIC(专用集成电路)。如本文中揭示的设备的实施方案的各种元件中的任一者还可被体现为一或多个计算机(例如,包括经编程以执行一或多个指令集或指令序列的一或多个阵列的机器,还被称为“处理器”),且这些元件中的任何两者或两者以上或甚至所有者可实施于相同的此或这些计算机内。
用于如本文中揭示的处理的处理器或其它装置可制造为驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片上的电子和/或光学装置。此装置的一个实例为固定或可编程逻辑元件(例如,晶体管或逻辑门)的阵列,且这些元件的任一者可实施为一或多个这些阵列。此或这些阵列可实施于一或多个芯片内(例如,包括两个或两个以上芯片的芯片组内)。这些阵列的实例包括逻辑元件的固定或可编程阵列,例如微处理器、嵌入式处理器、IP核心、DSP、FPGA、ASSP和ASIC。用于如本文中揭示的处理的处理器或其它装置还可体现为一或多个计算机(例如,包括经编程以执行一或多个指令集或序列的一或多个阵列的机器)或其它处理器。如本文中描述的处理器可能被用以执行不直接与方法M100的实施程序有关的任务或其它指令集,例如,与处理器所嵌入的装置或系统(例如,音频感测装置)的另一操作有关的任务。如本文中揭示的方法的部分还可能由音频感测装置的处理器执行,且所述方法的另一部分还可能在一或多个其它处理器的控制下执行。
所属领域的技术人员应了解,结合本文中所揭示的配置而描述的各种说明性模块、逻辑块、电路和测试和其它操作可被实施为电子硬件、计算机软件或两者的组合。可通过通用处理器、数字信号处理器(DSP)、ASIC或ASSP、FPGA或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其经设计以产生如本文中所揭示的配置的任何组合来实施或执行这些模块、逻辑块、电路和操作。举例来说,此配置可至少部分地实施为硬连线电路、实施为制造于专用集成电路中的电路配置、或实施为载入到非易失性存储器中的固件程序或作为机器可读码(此码为可由逻辑元件的阵列(例如,通用处理器或其它数字信号处理单元)执行的指令)从数据存储媒体载入或加载到数据存储媒体中的软件程序。通用处理器可为微处理器,但在替代方案中,处理器可为任一常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器的组合、结合DSP核心的一或多个微处理器,或任何其它此配置。软件模块可驻留于例如RAM(随机存取存储器)、ROM(只读存储器)、例如快闪RAM的非易失性RAM(NVRAM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可移除磁盘或CD-ROM的非暂时性存储媒体中;或此项技术中已知的任何其它形式的存储媒体中。将说明性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息和将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体。处理器和存储媒体可驻留于ASIC中。ASIC可驻留于用户终端中。在替代方案中,处理器和存储媒体可作为离散组件驻留于用户终端中。
注意,本文中揭示的各种方法(例如,方法M100、M110、M120、M200、M210和M300中的任一者)可由例如处理器的逻辑元件阵列执行,且如本文中描述的设备的各种元件可实施为经设计以在此阵列上执行的模块。如本文中所使用,术语“模块”或“子模块”可指包括呈软件、硬件或固件形式的计算机指令(例如,逻辑表达)的任何方法、设备、装置、单元或计算机可读数据存储媒体。应理解,可将多个模块或系统组合到模块或系统中且可将模块或系统分离为多个模块或系统来执行同样的功能。当以软件或其它计算机可执行指令实施时,过程的元素基本上为执行相关任务的程序码段,例如,例程、程序、对象、组件、数据结构和其类似者。术语“软件”应理解为包括原始程序码、组合语言程序码、机器码、二元码、固件、宏码、微码、可由逻辑元件阵列执行的任何一或多个指令集或指令序列,和这些实例的任何组合。程序或码段可存储于处理器可读媒体中或在传输媒体或通信链路上通过体现于载波中的计算机数据信号来传输。
本文中揭示的方法、方案和技术的实施还可有形地体现(举例来说,在如本文中列出的一或多个计算机可读存储媒体的有形计算机可读特征中)为可由包括逻辑元件阵列(例如,处理器、微处理器、微控制器或其它有限状态机)的机器执行的一或多个指令集。术语“计算机可读媒体”可包括可存储或转移信息的任一媒体,包括易失性、非易失性、可移除和非可移除存储媒体。计算机可读媒体的实例包括电子电路、半导体存储器装置、ROM、快闪存储器、可擦除ROM(EROM)、软盘或其它磁性存储器、CD-ROM/DVD或其它光学存储器、硬盘或可用以存储所要的信息的任何其它媒体、光纤媒体、射频(RF)链路或可用以载运所要的信息且可加以存取的任一其它媒体。计算机数据信号可包括可在例如电子网络信道、光纤、空气、电磁、RF链路等的传输媒体上传播的任何信号。可经由例如因特网或内联网的计算机网络下载程序码段。在任一情况下,本发明的范围不应被认作受到这些实施例限制。
本文中所描述的方法的任务中的每一者可直接体现于硬件中、由处理器执行的软件模块中或两者的组合中。在如本文中揭示的方法的实施的典型应用中,逻辑元件(例如,逻辑门)的阵列经配置以执行方法的各种任务中的一者、一者以上或甚至所有任务。还可将任务中的一或多者(可能所有者)实施为体现于计算机程序产品(例如,一或多个数据存储媒体,例如,磁盘、快闪记忆卡或其它非易失性存储器卡、半导体存储器芯片等)中的代码(例如,一或多个指令集),所述代码可由包括逻辑元件阵列(例如,处理器、微处理器、微控制器或其它有限状态机)的机器(例如,计算机)读取和/或执行。如本文中揭示的方法的实施方案的任务还可由一个以上此阵列或机器执行。在这些或其它实施方案中,所述任务可在用于无线通信的装置(例如,蜂窝式电话或具有此通信能力的其它装置)内执行。此装置可经配置以与电路交换和/或包交换式网络通信(例如,使用例如VoIP的一或多个协议)。举例来说,此装置可包括经配置以接收和/或发射经编码帧的RF电路。
明确地揭示,本文中揭示的各种方法可由例如手持机、耳机或便携式数字助理(PDA)的便携式通信装置执行,且本文中描述的各种设备可包括于此装置内。典型的实时(例如,在线)应用为使用此移动装置进行的电话对话。
在一或多个示范性实施例中,本文中描述的操作可实施于硬件、软件、固件或其任何组合中。如果实施于软件中,则可将这些操作作为一或多个指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行传输。术语“计算机可读媒体”包括计算机可读存储媒体和通信(例如,发射)媒体两者。举例来说且不受限制,计算机可读存储媒体可包含存储元件阵列,例如,半导体存储器(其可包括(但不限于)动态或静态RAM、ROM、EEPROM和/或快闪RAM),或铁电、磁阻、双向、聚合或相变存储器;CD-ROM或其它光盘存储器;及/或磁盘存储器或其它磁性存储装置。这些存储媒体可存储呈可由计算机存取的指令或数据结构的形式的信息。通信媒体可包含可用以载运呈指令或数据结构的形式的所要程序代码且可由计算机存取的任一媒体,包括有助于将计算机程序从一处转移到另一处的任一媒体。而且,将任何连接恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字订户线(DSL)或无线技术(例如红外线、无线电和/或微波)而从网站、服务器或其它远端源发射软件,则同轴电缆、光缆、双绞线、DSL或无线技术(例如红外线、无线电和/或微波)包括于媒体的定义中。如本文中所使用,磁盘和光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能光盘(DVD)、软性磁盘和Blu-ray DiscTM(Blu-Ray Disc Association,Universal City,CA),其中磁盘通常以磁性的方式再现数据,而光盘通过激光光学地再现数据。以上各者的组合还应包括于计算机可读媒体的范围内。
如本文中描述的声学信号处理设备可被并入到接受话音输入以便控制某些操作或可以其它方式受益于所要噪声与背景噪声的分离的电子装置(例如,通信装置)中。许多应用可受益于增强清楚的所要声音或将清楚的所要声音与源从多个方向的背景声音分离。这些应用可包括在并入例如语音辨识和检测、话音增强和分离、语音启动控制等的能力的电子或计算装置中的人机接口。可能需要实施此声学信号处理设备以适合于仅提供有限的处理能力的装置中。
本文中描述的模块、元件和装置的各种实施方案的元件可制造为驻留于(例如)同一芯片上或芯片组中的两个或两个以上芯片上的电子和/或光学装置。此装置的一个实例为固定或可编程的逻辑元件(例如,晶体管或门)的阵列。本文中描述的设备的各种实施方案的一或多个元件还可整个或部分地实施为一或多个指令集,所述一或多个指令集经布置以在一或多个固定或可编程逻辑元件阵列上执行,例如,微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA、ASSP和ASIC。
可能将如本文中描述的设备的实施方案的一或多个元件用以执行不直接与设备的操作有关的任务或指令集,例如,与所述设备所嵌入的装置或系统的另一操作有关的任务。此设备的实施方案的一或多个元件还可能具有共同结构(例如,用以执行在不同时间对应于不同元件的代码部分的处理器,经执行以执行在不同时间对应于不同元件的任务的指令集,或在不同时间执行不同元件的操作的电子和/或光学装置的布置)。

Claims (52)

1.一种音频信号处理的方法,所述方法包含:
计算音频信号的第二帧对在所述音频信号中在所述第二帧之前的第一帧的译码相依性的估计;
基于与发射信道的状态有关的信息计算阈值;
将所述计算出的估计与所述计算出的阈值进行比较;及
基于所述比较的结果,决定发射所述第一帧的冗余副本。
2.根据权利要求1所述的方法,其中所述计算出的估计是基于来自所述第一帧的信息。
3.根据权利要求2所述的方法,其中所述方法包括使用来自所述第一帧的所述信息产生自适应码向量,且
其中所述计算出的估计是基于来自所述自适应码向量的信息。
4.根据权利要求1到3中任一权利要求所述的方法,其中所述计算出的估计是基于来自所述第二帧的经编码版本的信息。
5.根据权利要求1到3中任一权利要求所述的方法,其中所述计算出的估计是基于所述第二帧的经编码版本的自适应码簿增益值。
6.根据权利要求1所述的方法,其中所述计算出的估计是基于来自所述第二帧的第一经编码版本的信息且基于来自所述第二帧的第二经编码版本的信息,
其中所述第一经编码版本是使用来自所述第一帧的经编码版本的信息而编码,且
其中所述第二经编码版本是不使用来自所述第一帧的所述经编码版本的所述信息而编码。
7.根据权利要求1到6中任一权利要求所述的方法,其中与所述发射信道的所述状态有关的所述信息包括丢失的包的数目,且
其中所述计算出的阈值是基于丢失的包的所述数目。
8.根据权利要求1到7中任一权利要求所述的方法,其中与所述发射信道的所述状态有关的所述信息包括基于接收的包的转运次数的抖动值,且
其中所述计算出的阈值是基于所述抖动值。
9.根据权利要求1到8中任一权利要求所述的方法,其中所述方法包括经由无线发射信道接收与所述发射信道的所述状态有关的所述信息。
10.根据权利要求1到9中任一权利要求所述的方法,其中所述计算所述阈值包含强制所述计算出的阈值具有最小值。
11.根据权利要求1到9中任一权利要求所述的方法,其中所述计算所述阈值包含:
将基于与所述发射信道的所述状态有关的所述信息的计算出的值与边界值进行比较;及
响应于与所述边界值的所述比较的结果,选择所述边界值作为所述计算出的阈值。
12.根据权利要求1到11中任一权利要求所述的方法,其中所述方法包含:
编码所述第一帧以产生所述第一帧的主要副本;
产生所述第一帧的所述冗余副本;及
产生包括所述主要副本和所述冗余副本的经编码信号。
13.根据权利要求12所述的方法,其中所述第一帧的所述主要副本包括第一码字,所述第一码字指示长度为L的第一代数码向量的总数P1个单位脉冲中的每一者的位置,且
其中所述第一帧的所述冗余副本包括第二码字,所述第二码字指示长度为L的第二代数码向量的总数P2个单位脉冲中的每一者的位置,且
其中P1大于P2。
14.根据权利要求12和13中任一权利要求所述的方法,其中所述产生所述经编码信号包含:
产生包括所述第一帧的所述主要副本的第一包;及
响应于所述决定,产生包括所述第一帧的所述冗余副本和所述第二帧的副本的第二包,且
其中所述经编码信号包括所述第一包和所述第二包。
15.根据权利要求12到14中任一权利要求所述的方法,其中所述方法包括将所述经编码信号发射到所述发射信道内。
16.根据权利要求1到15中任一权利要求所述的方法,其中所述方法包括确定偏移的值,所述值指示在所述第一帧与所述第二帧之间的所述音频信号的帧的总数。
17.根据权利要求1到16中任一权利要求所述的方法,其中所述计算所述阈值包含:
基于与所述发射信道的所述状态有关的所述信息,计算第一阈值和第二阈值;及
基于来自所述第一帧和在所述音频信号中邻近所述第一帧的帧中的至少一者的信息,从所述第一阈值和所述第二阈值中选择所述计算出的阈值。
18.一种用于音频信号处理的设备,所述设备包含:
用于计算音频信号的第二帧对在所述音频信号中在所述第二帧之前的第一帧的译码相依性的估计的装置;
用于基于与发射信道的状态有关的信息计算阈值的装置;
用于将所述计算出的估计与所述计算出的阈值进行比较的装置;及
用于基于所述比较的结果决定发射所述第一帧的冗余副本的装置。
19.根据权利要求18所述的设备,其中所述计算出的估计是基于来自所述第一帧的信息。
20.根据权利要求19所述的设备,其中所述设备包括用于使用来自所述第一帧的所述信息产生自适应码向量的装置,且
其中所述计算出的估计是基于来自所述自适应码向量的信息。
21.根据权利要求18到20中任一权利要求所述的设备,其中所述计算出的估计是基于来自所述第二帧的经编码版本的信息。
22.根据权利要求18到20中任一权利要求所述的设备,其中所述计算出的估计是基于所述第二帧的经编码版本的自适应码簿增益值。
23.根据权利要求18所述的设备,其中所述计算出的估计是基于来自所述第二帧的第一经编码版本的信息且基于来自所述第二帧的第二经编码版本的信息,
其中所述第一经编码版本是使用来自所述第一帧的经编码版本的信息而编码,且
其中所述第二经编码版本是不使用来自所述第一帧的所述经编码版本的所述信息而编码。
24.根据权利要求18到23中任一权利要求所述的设备,其中与所述发射信道的所述状态有关的所述信息包括丢失的包的数目,且
其中所述计算出的阈值是基于丢失的包的所述数目。
25.根据权利要求18到24中任一权利要求所述的设备,其中与所述发射信道的所述状态有关的所述信息包括基于接收的包的转运次数的抖动值,且
其中所述计算出的阈值是基于所述抖动值。
26.根据权利要求18到25中任一权利要求所述的设备,其中所述设备包括用于经由无线发射信道接收与所述发射信道的所述状态有关的所述信息的装置。
27.根据权利要求18到26中任一权利要求所述的设备,其中所述用于计算所述阈值的装置经配置以强制所述计算出的阈值具有最小值。
28.根据权利要求18到26中任一权利要求所述的设备,其中所述用于计算所述阈值的装置包含:
用于将基于与所述发射信道的所述状态有关的所述信息的计算出的值与边界值进行比较的装置;及
用于响应于与所述边界值的所述比较的结果选择所述边界值作为所述计算出的阈值的装置。
29.根据权利要求18到28中任一权利要求所述的设备,其中所述设备包含:
用于编码所述第一帧以产生所述第一帧的主要副本的装置;
用于产生所述第一帧的所述冗余副本的装置;及
用于产生包括所述主要副本和所述冗余副本的经编码信号的装置。
30.根据权利要求29所述的设备,其中所述第一帧的所述主要副本包括第一码字,所述第一码字指示长度为L的第一代数码向量的总数P1个单位脉冲中的每一者的位置,且
其中所述第一帧的所述冗余副本包括第二码字,所述第二码字指示长度为L的第二代数码向量的总数P2个单位脉冲中的每一者的位置,且
其中P1大于P2。
31.根据权利要求29和30中任一权利要求所述的设备,其中所述用于产生所述经编码信号的装置包含:
用于产生包括所述第一帧的所述主要副本的第一包的装置;及
用于响应于所述决定而产生包括所述第一帧的所述冗余副本和所述第二帧的副本的第二包的装置,且
其中所述经编码信号包括所述第一包和所述第二包。
32.根据权利要求29到31中任一权利要求所述的设备,其中所述设备包括用于将所述经编码信号发射到所述发射信道内的装置。
33.根据权利要求18到32中任一权利要求所述的设备,其中所述设备包括用于确定偏移的值的装置,所述值指示在所述第一帧与所述第二帧之间的所述音频信号的帧的总数。
34.根据权利要求18到33中任一权利要求所述的设备,其中所述用于计算所述阈值的装置包含:
用于基于与所述发射信道的所述状态有关的所述信息计算第一阈值和第二阈值的装置;及
用于基于来自所述第一帧和在所述音频信号中邻近所述第一帧的帧中的至少一者的信息从所述第一阈值和所述第二阈值中选择所述计算出的阈值的装置。
35.一种用于音频信号处理的设备,所述设备包含:
第一计算器,其经配置以计算音频信号的第二帧对在所述音频信号中在所述第二帧之前的第一帧的译码相依性的估计;
第二计算器,其经配置以基于与发射信道的状态有关的信息计算阈值;及
模式选择器,其经配置以(A)将所述计算出的估计与所述计算出的阈值进行比较,及(B)基于所述比较的结果决定发射所述第一帧的冗余副本。
36.根据权利要求35所述的设备,其中所述计算出的估计是基于来自所述第一帧的信息。
37.根据权利要求36所述的设备,其中来自所述第一帧的所述信息包括激励信号,且
其中所述设备包括向量产生器,其经配置以使用来自所述激励信号的信息产生自适应码向量,且
其中所述计算出的估计是基于所述自适应码向量。
38.根据权利要求35到37中任一权利要求所述的设备,其中所述计算出的估计是基于来自所述第二帧的经编码版本的信息。
39.根据权利要求35到37中任一权利要求所述的设备,其中所述计算出的估计是基于所述第二帧的经编码版本的自适应码簿增益值。
40.根据权利要求35所述的设备,其中所述计算出的估计是基于来自所述第二帧的第一经编码版本的信息且基于来自所述第二帧的第二经编码版本的信息,
其中所述第一经编码版本是使用来自所述第一帧的经编码版本的信息而编码,且
其中所述第二经编码版本是不使用来自所述第一帧的所述经编码版本的所述信息而编码。
41.根据权利要求35到40中任一权利要求所述的设备,其中与所述发射信道的所述状态有关的所述信息包括丢失的包的数目,且
其中所述计算出的阈值是基于丢失的包的所述数目。
42.根据权利要求35到41中任一权利要求所述的设备,其中与所述发射信道的所述状态有关的所述信息包括基于接收的包的转运次数的抖动值,且
其中所述计算出的阈值是基于所述抖动值。
43.根据权利要求35到42中任一权利要求所述的设备,其中所述设备包括信道解码器,其经配置以经由无线发射信道接收与所述发射信道的所述状态有关的所述信息。
44.根据权利要求35到43中任一权利要求所述的设备,其中所述第二计算器经配置以强制所述计算出的阈值具有最小值。
45.根据权利要求35到43中任一权利要求所述的设备,其中所述第二计算器包含:
比较器,其经配置以将基于与所述发射信道的所述状态有关的所述信息的计算出的值与边界值进行比较;及
选择器,其经配置以响应于与所述边界值的所述比较的结果选择所述边界值作为所述计算出的阈值。
46.根据权利要求35到45中任一权利要求所述的设备,其中所述设备包含:
帧编码器,其经配置以编码所述第一帧以产生(A)所述第一帧的主要副本和(B)所述第一帧的所述冗余副本;及
信道编码器,其经配置以产生包括所述主要副本和所述冗余副本的经编码信号。
47.根据权利要求46所述的设备,其中所述第一帧的所述主要副本包括第一码字,所述第一码字指示长度为L的第一代数码向量的总数P1个单位脉冲中的每一者的位置,且
其中所述第一帧的所述冗余副本包括第二码字,所述第二码字指示长度为L的第二代数码向量的总数P2个单位脉冲中的每一者的位置,且
其中P1大于P2。
48.根据权利要求46和47中任一权利要求所述的设备,其中所述信道编码器包含包装配器,所述包装配器经配置以产生(A)包括所述第一帧的所述主要副本的第一包,及(B)包括所述第一帧的所述冗余副本和所述第二帧的副本的第二包,且
其中所述经编码信号包括所述第一包和所述第二包。
49.根据权利要求46到48中任一权利要求所述的设备,其中所述设备包括无线电发射器,其经配置以将所述经编码信号发射到所述发射信道内。
50.根据权利要求35到49中任一权利要求所述的设备,其中所述设备包括偏移计算器,其经配置以确定偏移的值,所述值指示在所述第一帧与所述第二帧之间的所述音频信号的帧的总数。
51.根据权利要求35到50中任一权利要求所述的设备,其中所述第二计算器包含:
阈值计算器,其经配置以基于与所述发射信道的所述状态有关的所述信息计算第一阈值和第二阈值;及
阈值选择器,其经配置以基于来自所述第一帧和在所述音频信号中邻近所述第一帧的帧中的至少一者的信息从所述第一阈值和所述第二阈值中选择所述计算出的阈值。
52.一种具有有形特征的非暂时性计算机可读数据存储媒体,所述有形特征致使读取所述特征的机器执行根据权利要求1到17中任一权利要求所述的方法。
CN201280066721.1A 2012-01-12 2012-12-19 用于关键性阈值控制的系统、方法、设备和计算机可读媒体 Active CN104040622B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201261586007P 2012-01-12 2012-01-12
US61/586,007 2012-01-12
US201261587507P 2012-01-17 2012-01-17
US61/587,507 2012-01-17
US201261641093P 2012-05-01 2012-05-01
US61/641,093 2012-05-01
US13/718,797 2012-12-18
US13/718,797 US9047863B2 (en) 2012-01-12 2012-12-18 Systems, methods, apparatus, and computer-readable media for criticality threshold control
PCT/US2012/070721 WO2013106181A1 (en) 2012-01-12 2012-12-19 Systems, methods, apparatus, and computer-readable media for criticality threshold control

Publications (2)

Publication Number Publication Date
CN104040622A true CN104040622A (zh) 2014-09-10
CN104040622B CN104040622B (zh) 2017-08-11

Family

ID=48780607

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280066721.1A Active CN104040622B (zh) 2012-01-12 2012-12-19 用于关键性阈值控制的系统、方法、设备和计算机可读媒体
CN201280066664.7A Active CN104040621B (zh) 2012-01-12 2012-12-20 用于音频数据的冗余发射的位分配的系统、方法和设备

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201280066664.7A Active CN104040621B (zh) 2012-01-12 2012-12-20 用于音频数据的冗余发射的位分配的系统、方法和设备

Country Status (13)

Country Link
US (2) US9047863B2 (zh)
EP (2) EP2812895B1 (zh)
JP (3) JP2015510313A (zh)
KR (2) KR101570631B1 (zh)
CN (2) CN104040622B (zh)
BR (2) BR112014017120B1 (zh)
DK (2) DK2812895T3 (zh)
ES (2) ES2653949T3 (zh)
HU (2) HUE037362T2 (zh)
IN (1) IN2014CN04644A (zh)
SI (1) SI2803065T1 (zh)
TW (1) TWI499247B (zh)
WO (2) WO2013106181A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107431569A (zh) * 2015-03-12 2017-12-01 瑞典爱立信有限公司 电路交换系统中的速率控制
CN107528668A (zh) * 2016-06-21 2017-12-29 中兴通讯股份有限公司 一种数据传输方法及设备
CN108352928A (zh) * 2015-10-29 2018-07-31 高通股份有限公司 指示解码包的主要译码抑或冗余译码的包承载发信信息
CN108764469A (zh) * 2018-05-17 2018-11-06 普强信息技术(北京)有限公司 一种降低神经网络所需功耗的方法和设备

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9047863B2 (en) 2012-01-12 2015-06-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for criticality threshold control
US9178778B2 (en) 2012-03-23 2015-11-03 Avaya Inc. System and method for end-to-end RTCP
US9356917B2 (en) 2012-03-23 2016-05-31 Avaya Inc. System and method for end-to-end encryption and security indication at an endpoint
US9860296B2 (en) 2012-03-23 2018-01-02 Avaya Inc. System and method for end-to-end call quality indication
EP2950459B1 (en) * 2012-04-11 2019-10-02 Huawei Technologies Co., Ltd. Method and apparatus for configuring transmission mode
WO2014094204A1 (en) * 2012-12-17 2014-06-26 Intel Corporation Leveraging encoder hardware to pre-process video content
TWI528777B (zh) * 2012-12-28 2016-04-01 鴻海精密工業股份有限公司 音量調節方法與系統
US9831898B2 (en) * 2013-03-13 2017-11-28 Analog Devices Global Radio frequency transmitter noise cancellation
FR3007230B1 (fr) 2013-06-17 2015-07-31 Sdmo Ind Procede de communication dans un reseau interconnectant au moins deux groupes electrogenes, et dispositif d’interfacage correspondant.
US10614816B2 (en) * 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
NO2780522T3 (zh) * 2014-05-15 2018-06-09
GB2527365B (en) 2014-06-20 2018-09-12 Starleaf Ltd A telecommunication end-point device data transmission controller
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9680507B2 (en) * 2014-07-22 2017-06-13 Qualcomm Incorporated Offset selection for error correction data
US9712287B2 (en) 2014-07-31 2017-07-18 Qualcomm Incorporated System and method of redundancy based packet transmission error recovery
TWI602172B (zh) * 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
US9948578B2 (en) * 2015-04-14 2018-04-17 Qualcomm Incorporated De-jitter buffer update
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
IL239333B (en) * 2015-06-10 2020-06-30 Elta Systems Ltd A system for creating, transmitting and receiving additional signals and the useful methods by the way
KR102420450B1 (ko) 2015-09-23 2022-07-14 삼성전자주식회사 음성인식장치, 음성인식방법 및 컴퓨터 판독가능 기록매체
US10504525B2 (en) * 2015-10-10 2019-12-10 Dolby Laboratories Licensing Corporation Adaptive forward error correction redundant payload generation
US10049681B2 (en) * 2015-10-29 2018-08-14 Qualcomm Incorporated Packet bearing signaling information indicative of whether to decode a primary coding or a redundant coding of the packet
EP3427258B1 (en) 2016-03-07 2021-03-31 Fraunhofer Gesellschaft zur Förderung der Angewand Error concealment unit, audio decoder, and related method and computer program using characteristics of a decoded representation of a properly decoded audio frame
CA3016949C (en) 2016-03-07 2021-08-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Error concealment unit, audio decoder, and related method and computer program fading out a concealed audio frame out according to different damping factors for different frequency bands
CN107845385B (zh) * 2016-09-19 2021-07-13 南宁富桂精密工业有限公司 信息隐藏的编解码方法及系统
KR102214440B1 (ko) * 2016-10-07 2021-02-09 삼성전자주식회사 통화 기능을 수행하는 단말 장치 및 방법
US11088941B2 (en) * 2017-03-23 2021-08-10 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method for transmitting data, terminal device, and network device
US10574830B2 (en) * 2017-06-05 2020-02-25 Qualcomm Incoporated Methods for increasing VoIP network coverage
US10645228B2 (en) * 2017-06-26 2020-05-05 Apple Inc. Adaptability in EVS codec to improve power efficiency
CN109286952B (zh) * 2017-07-19 2022-08-02 中兴通讯股份有限公司 数据传输方法、装置及存储介质
US11456007B2 (en) 2019-01-11 2022-09-27 Samsung Electronics Co., Ltd End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization
EP4035288A1 (en) 2019-09-25 2022-08-03 Mixhalo Corp. Packet payload mapping for robust transmission of data
CN110890945B (zh) * 2019-11-20 2022-02-22 腾讯科技(深圳)有限公司 数据传输方法、装置、终端及存储介质
CN112820306B (zh) * 2020-02-20 2023-08-15 腾讯科技(深圳)有限公司 语音传输方法、系统、装置、计算机可读存储介质和设备
CN112767955B (zh) * 2020-07-22 2024-01-23 腾讯科技(深圳)有限公司 音频编码方法及装置、存储介质、电子设备
JP2024022698A (ja) * 2020-10-30 2024-02-21 株式会社Preferred Networks 通信装置及び通信方法
US20230073839A1 (en) * 2021-09-09 2023-03-09 Toyota Motor North America, Inc. Hardware timer data expiration

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0936772A2 (en) * 1998-02-11 1999-08-18 Lucent Technologies Inc. Unequal error protection for perceptual audio coders
CN1269923A (zh) * 1997-02-07 2000-10-11 诺基亚流动电话有限公司 利用纠错和检错的信息编码方法和装置
CN101072083A (zh) * 2007-06-04 2007-11-14 深圳市融合视讯科技有限公司 一种优化网络数据传输冗余纠错率的方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69528255T2 (de) 1994-04-08 2003-08-07 Echelon Corp Verfahren und gerät zur sicheren winkelmodulationsbasierten kommunikation
TW271524B (zh) * 1994-08-05 1996-03-01 Qualcomm Inc
US5732389A (en) 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
JP3254126B2 (ja) * 1996-02-13 2002-02-04 株式会社日立国際電気 可変レート符号化方式
US6445686B1 (en) * 1998-09-03 2002-09-03 Lucent Technologies Inc. Method and apparatus for improving the quality of speech signals transmitted over wireless communication facilities
US20010041981A1 (en) * 2000-02-22 2001-11-15 Erik Ekudden Partial redundancy encoding of speech
JP2002314597A (ja) * 2001-04-09 2002-10-25 Mitsubishi Electric Corp 音声パケット通信装置
JP4022427B2 (ja) * 2002-04-19 2007-12-19 独立行政法人科学技術振興機構 エラー隠蔽方法、エラー隠蔽プログラム、送信装置、受信装置及びエラー隠蔽装置
FI116016B (fi) 2002-12-20 2005-08-31 Oplayo Oy Puskurointijärjestely
WO2004095825A2 (en) * 2003-04-21 2004-11-04 Rgb Networks, Inc. Time-multiplexed multi-program encryption system
US7546508B2 (en) 2003-12-19 2009-06-09 Nokia Corporation Codec-assisted capacity enhancement of wireless VoIP
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
DE602004004376T2 (de) 2004-05-28 2007-05-24 Alcatel Anpassungsverfahren für ein Mehrraten-Sprach-Codec
CN101292459B (zh) 2005-10-17 2011-06-08 艾利森电话股份有限公司 用于估计语音质量的方法和设备
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US20080077410A1 (en) 2006-09-26 2008-03-27 Nokia Corporation System and method for providing redundancy management
TWI382657B (zh) 2007-03-01 2013-01-11 Princeton Technology Corp 音訊處理系統
WO2008119043A1 (en) 2007-03-27 2008-10-02 Armida Technologies Wireless integrated security controller
US8352252B2 (en) 2009-06-04 2013-01-08 Qualcomm Incorporated Systems and methods for preventing the loss of information within a speech frame
EP2346028A1 (en) 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
US9047863B2 (en) 2012-01-12 2015-06-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for criticality threshold control

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1269923A (zh) * 1997-02-07 2000-10-11 诺基亚流动电话有限公司 利用纠错和检错的信息编码方法和装置
EP0936772A2 (en) * 1998-02-11 1999-08-18 Lucent Technologies Inc. Unequal error protection for perceptual audio coders
CN101072083A (zh) * 2007-06-04 2007-11-14 深圳市融合视讯科技有限公司 一种优化网络数据传输冗余纠错率的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GERARDO RUBINO ET AL: "Evaluating the utility of media{dependent FEC in VoIP flows", 《LNCS 3266, PROCEEDINGS OF THE FIFTH INTERNATIONAL WORKSHOP ON QUALITY OF FUTURE INTERNET SERVICES》 *
HENNING SANNECK AND NGUYEN TUONG LONG LE: "Speech Property-Based FEC for Internet Telephony Applications", 《MULTIMEDIA COMPUTING AND NETWORKING CONFERENCE》 *
VENKAT RAJU GANDIKOTA ET AL: "Adaptive FEC-Based Packet Loss Resilience Scheme for Supporting Voice Communication over Ad Hoc Wireless Networks", 《IEEE TRANSACTIONS ON MOBILE COMPUTING》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107431569A (zh) * 2015-03-12 2017-12-01 瑞典爱立信有限公司 电路交换系统中的速率控制
CN107431569B (zh) * 2015-03-12 2020-10-09 瑞典爱立信有限公司 用于电路交换系统中的速率控制的方法和设备
CN108352928A (zh) * 2015-10-29 2018-07-31 高通股份有限公司 指示解码包的主要译码抑或冗余译码的包承载发信信息
CN108352928B (zh) * 2015-10-29 2019-08-16 高通股份有限公司 无线通信方法及设备
CN107528668A (zh) * 2016-06-21 2017-12-29 中兴通讯股份有限公司 一种数据传输方法及设备
CN107528668B (zh) * 2016-06-21 2021-09-24 中兴通讯股份有限公司 一种数据传输方法及设备
CN108764469A (zh) * 2018-05-17 2018-11-06 普强信息技术(北京)有限公司 一种降低神经网络所需功耗的方法和设备

Also Published As

Publication number Publication date
US20130185062A1 (en) 2013-07-18
BR112014017119A2 (pt) 2017-06-13
US20130185084A1 (en) 2013-07-18
BR112014017120A8 (pt) 2017-07-04
WO2013106181A1 (en) 2013-07-18
EP2803065B1 (en) 2017-01-18
SI2803065T1 (sl) 2017-03-31
EP2812895B1 (en) 2017-11-01
US9047863B2 (en) 2015-06-02
KR101585367B1 (ko) 2016-01-13
KR20140111035A (ko) 2014-09-17
BR112014017120B1 (pt) 2021-06-15
HUE037362T2 (hu) 2018-08-28
TW201338468A (zh) 2013-09-16
JP5996670B2 (ja) 2016-09-21
ES2621417T3 (es) 2017-07-04
BR112014017119A8 (pt) 2017-07-04
DK2812895T3 (en) 2018-01-08
US9053702B2 (en) 2015-06-09
WO2013106187A1 (en) 2013-07-18
JP2015510313A (ja) 2015-04-02
HUE032016T2 (en) 2017-08-28
BR112014017119B1 (pt) 2020-12-22
CN104040621A (zh) 2014-09-10
JP2015507221A (ja) 2015-03-05
EP2812895A1 (en) 2014-12-17
CN104040622B (zh) 2017-08-11
TWI499247B (zh) 2015-09-01
BR112014017120A2 (pt) 2017-06-13
EP2803065A1 (en) 2014-11-19
CN104040621B (zh) 2017-06-30
JP6151405B2 (ja) 2017-06-21
IN2014CN04644A (zh) 2015-09-18
ES2653949T3 (es) 2018-02-09
KR20140119735A (ko) 2014-10-10
JP2016174383A (ja) 2016-09-29
KR101570631B1 (ko) 2015-11-19
DK2803065T3 (en) 2017-03-13

Similar Documents

Publication Publication Date Title
CN104040622A (zh) 用于关键性阈值控制的系统、方法、设备和计算机可读媒体
US10424306B2 (en) Frame erasure concealment for a multi-rate speech and audio codec

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant