CN101617361B - 用于编码的语音业务的速率降低的方法和设备 - Google Patents

用于编码的语音业务的速率降低的方法和设备 Download PDF

Info

Publication number
CN101617361B
CN101617361B CN2007800431744A CN200780043174A CN101617361B CN 101617361 B CN101617361 B CN 101617361B CN 2007800431744 A CN2007800431744 A CN 2007800431744A CN 200780043174 A CN200780043174 A CN 200780043174A CN 101617361 B CN101617361 B CN 101617361B
Authority
CN
China
Prior art keywords
present frame
parameter
higher rate
rate parameter
relevant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2007800431744A
Other languages
English (en)
Other versions
CN101617361A (zh
Inventor
L·布罗克巴
余汉生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ericsson AB
Original Assignee
Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson AB filed Critical Ericsson AB
Publication of CN101617361A publication Critical patent/CN101617361A/zh
Application granted granted Critical
Publication of CN101617361B publication Critical patent/CN101617361B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

用于将较高速率语音参数转换为包括模糊激励参数的较低速率参数的转换实体和方法。该转换实体包括第一解码器,第一解码器被配置成根据第一固定组成和第一自适应组成,从较高速率参数产生目标激励。该转换实体还包括第二解码器,第二解码器被配置成产生第二自适应组成,并且被配置成可选择地工作在第一或者第二模式下。在第一模式下,根据先前帧的第一固定组成来生成第二自适应组分,而在第二模式下,根据先前帧的第二固定组成来生成第二自适应组分。第二解码器响应于速率降低请求而工作在第二模式下。处理模块根据目标激励和第二自适应组成来确定模糊激励参数,以用于生成当前帧的第二固定组成。

Description

用于编码的语音业务的速率降低的方法和设备
技术领域
本发明大体上涉及语音编码,并且特别地,涉及用于在分组网中传播(travel)的编码语音业务(voice traffic)的速率降低的方法和设备。
背景技术
在移动电话系统中,需要辅助信息(例如,信令信息、开销、增强的前向纠错信道编码)来调整、控制以及协调系统的配置与操作。在一些情况下,当在使用远端移动设备时,可能需要将辅助信息传递给远端移动设备。当这种情况出现时,移动设备和基站将辅助信息与语音业务组合。如果通向远端移动设备的无线链路的带宽完全地被占据,则语音业务的编码速率将需要被降低以便为辅助信息留出空间。
在另一种情形中,分组网络中的拥塞可能需要速率降低以便允许呼叫在两个端点之间继续被至少最低限度地支持以使得该呼叫不掉线。这样的对于速率降低的需求可能在任意时间出现,而与在分组网络中传播的语音业务的编码速率无关。
为了在承载编码语音业务的分组中实现速率降低,已经提出了几种方法。一种实现在分组网络中传播的编码语音业务的速率降低的更根本的方法是丢弃分组。在该操作模式下,编码语音业务的分组(或者多个分组)被抑制(即不被发送,或“空白”)以便或者在分组网络中的下游或者在与远端移动设备的无线链路上释放带宽。然而,这样的对分组的激烈删除的结果是所恢复语音的退化,这会导致可识度(intelligibility)的严重损失。
稍微更复杂的用于在分组网络中传播的编码语音业务的速率降低的复用技术包括解码(即,合成)接收到的以原始(即,较高)速率编码的编码语音业务的分组。该完全地合成的语音信号然后被以较低的速率重新编码,由此保存某些原始语音的特征,同时释放带宽以插入辅助信息或者减轻网络拥塞。将编码语音业务解码为恢复的语音和以不同(即,较低的)速率重新编码所恢复的语音的操作被称为转码(transcoding)(或者“串联(tandem)操作”),其具有如下缺点:其需要用于全编解码器的处理和存储器资源,仅仅用来提供速率降低的功能。就大多数编解码器而言,与提供如上所述的类型的速率降低的功能相关联的额外的资源/成本对于大多数实施方式而言被认为过高。另外,当语音被合成并然后被重新编码时,转码使语音承受可能的退化。
此外,上述两种技术可能导致在所需的速率降低的延长时段期间语音质量的严重退化,当例如两个空中接口对于移动到移动呼叫而言需要以不同的分组速率运行时可能出现这样的情况。在此情况下,发源自近端移动设备的编码语音业务可能需要在被传送到远端移动设备之前由网络进行减少直到无线电条件得以改善为止。这样的状况可能持续几秒乃至几分钟,当使用传统的速率降低的方法时,其趋向于对可识度造成显著的不利影响。
因此,在行业中存在对用于降低在分组网络中传播的编码语音业务的编码速率而又不显著地影响语音质量的改进的机制的需要。
发明内容
本发明的第一主要方面是设法提供用于将用于当前帧的较高速率语音参数转换为用于当前帧的较低速率语音参数的转换实体。该转换实体包括第一解码器,其被配置成产生用于一系列帧中的每一个帧的相应目标激励信号,所述一系列帧包括当前帧和先前帧,用于给定帧的目标激励信号基于给定帧的相应第一固定组成(contribution)和给定帧的相应第一自适应(adaptive)组成。该转换实体还包括第二解码器,其被配置成产生当前帧的第二自适应组成并且还被配置成可选择地工作在第一模式或者第二模式下。在第一模式下,根据先前帧的第一固定组成来生成当前帧的第二自适应组成。在第二模式下,根据先前帧的第二固定组成来生成当前帧的第二自适应组成。第二解码器被配置成响应于对当前帧的速率降低请求而工作在第二模式下。该转换实体还包括处理模块,其被配置成确定用于当前帧的模糊(dimmed)激励参数,其被包含在用于当前帧的较低速率语音参数中。根据用于当前帧的目标激励信号和当前帧的第二自适应组成来生成用于当前帧的模糊激励参数,用于当前帧的模糊激励参数被用来生成当前帧的第二固定组成。用于当前帧的模糊激励参数。
本发明的第二主要方面是设法提供一种设备,其包括上述的转换实体和分组化(packetizing)实体,所述分组化实体被配置成将用于当前帧的较低速率语音参数插入输出分组中。
本发明的第三主要方面是设法提供用于将用于当前帧的较高速率语音参数转换为用于当前帧的较低速率语音参数的转换实体。该转换实体包括第一装置,用于产生用于一系列帧中的每一个帧的相应目标激励信号,所述一系列帧包括当前帧和先前帧,用于给定帧的目标激励信号基于当前帧的相应第一固定组成和给定帧的相应第一自适应组成。该转换实体还包括第二装置,用于产生当前帧的第二自适应组成并且还被配置成可选择地工作在第一模式或者第二模式下。在第一模式下,根据先前帧的第一固定组成来生成当前帧的第二自适应组成。在第二模式下,根据先前帧的第二固定组成来生成第一帧的第二自适应组成。第二装置被配置成响应于对当前帧的速率降低请求而工作在第二模式下。该转换实体还包括第三装置,用于确定用于当前帧的模糊激励参数,所述模糊激励参数被包含在用于当前帧的较低速率语音参数中。根据用于当前帧的目标激励信号和当前帧的第二自适应组成,生成用于当前帧的模糊激励参数,用于当前帧的模糊激励参数被用来生成当前帧的第二固定组成。
本发明的第四主要方面设法提供包括计算机可读程序代码的计算机可读介质,所述计算机可读程序代码能被计算设备执行以使得计算设备执行将用于当前帧的较高速率语音参数转换为用于当前帧的较低速率语音参数的方法。计算机可读程序代码包括第一计算机可读程序代码,用于使得计算设备产生用于一系列帧中的每一个帧的相应目标激励信号,所述一系列帧包括当前帧和先前帧,用于给定帧的目标激励信号基于给定帧的相应第一固定组成和给定帧的相应第一自适应组成。计算机可读程序代码还包括第二计算机可读程序代码,用于使得计算设备在第一和第二模式之一下产生当前帧的第二自适应组成,其中在所述第二模式下的操作响应于对当前帧的速率降低请求。在第一模式下,根据先前帧的第一固定组成来生成当前帧的第二自适应组成。在第二模式下,根据先前帧的第二固定组成来生成当前帧的第二自适应组成。计算机可读程序代码还包括第三计算机可读程序代码,用于使得计算设备确定用于当前帧的模糊激励参数,所述模糊激励参数被包含在用于当前帧的较低速率语音参数中。根据用于当前帧的目标激励信号和当前帧的第二自适应组成,生成用于当前帧的模糊激励参数,用于当前帧的模糊激励参数被用来生成当前帧的第二固定组成。
本发明的第五主要方面设法提供将与共振峰(formant)频率含量相关的N个编码的较高速率参数的集合转换为与共振峰频率含量相关的N个编码的较低速率参数的集合的方法。该方法包括识别在N个编码的较高速率参数的集合中编码的较高速率参数的多个子集。针对在N个编码的较低速率参数的集合中的编码的较低速率参数的多个子集中的每个特定子集,该方法包括从在编码的较高速率参数的子集中的一个或多个对应子集中的编码的较高速率参数得到(derive)在编码的较低速率参数的所述特定子集中的编码的较低速率参数,其中N个编码的较低速率参数能够使用比N个编码的较高速率参数更少的位(bit)来表示。
本发明的第六主要方面设法提供包括计算机可读程序代码的计算机可读介质,所述计算机可读程序代码能被计算设备执行以使得计算设备执行将与共振峰频率含量相关的N个编码的较高速率参数的集合转换为与共振峰频率含量相关的N个编码的较低速率参数的集合的方法。计算机可读程序代码包括第一计算机可读程序代码,其使得计算设备识别在N个编码的较高速率参数的集合中的编码的较高速率参数的多个子集;第二计算机可读程序代码,其使得计算设备针对在N个编码的较低速率参数的集合中的编码的较低速率参数的多个子集中的每个特定子集,从在编码的较高速率参数的子集中的一个或多个对应子集中的编码的较高速率参数得到在编码的较低速率参数的所述特定子集中的编码的较低速率参数;其中N个编码的较低速率参数能够使用比N个编码的较高速率参数更少的位来表示。
本发明的第七主要方面设法提供处理语音帧的原始参数表示的方法,语音帧的原始参数表示包括与共振峰频率含量相关的较高速率参数和与激励信号相关的较高速率参数。该方法包括:接收对语音帧的速率降低请求;通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与共振峰频率含量相关的较高速率参数来产生与共振峰频率含量相关的较低速率参数;通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与激励信号相关的较高速率参数来产生与激励信号相关的较低速率参数;输出语音帧的模糊参数表示,其包括所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数;所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数的组合比所述与共振峰频率含量相关的较高速率参数和所述与激励信号相关的较高速率参数的组合占据更少的位。
本发明的第八主要方面设法提供用于处理语音帧的原始参数表示的转换实体,语音帧的原始参数表示包括与共振峰频率含量相关的较高速率参数和与激励信号相关的较高速率参数,该转换实体包括:用于接收对语音帧的速率降低请求的装置;用于通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与共振峰频率含量相关的较高速率参数来产生与共振峰频率含量相关的较低速率参数的装置;用于通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与激励信号相关的较高速率参数来产生与激励信号相关的较低速率参数的装置;用于输出语音帧的模糊参数表示的装置,语音帧的模糊参数表示包括所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数;其中所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数的组合比所述与共振峰频率含量相关的较高速率参数和所述与激励信号相关的较高速率参数的组合占据更少的位。
本发明的第九主要方面设法提供包括计算机可读程序代码的计算机可读介质,所述计算机可读程序代码能被计算设备执行以使得计算设备执行处理语音帧的原始参数表示的方法,语音帧的原始参数表示包括与共振峰频率含量相关的较高速率参数和与激励信号相关的较高速率参数。计算机可读程序代码包括第一计算机可读程序代码,其用于使得计算设备接收对语音帧的速率降低请求;第二计算机可读程序代码,其用于使得计算设备通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与共振峰频率含量相关的较高速率参数来产生与共振峰频率含量相关的较低速率参数;第三计算机可读程序代码,其用于使得计算设备通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与激励信号相关的较高速率参数来产生与激励信号相关的较低速率参数;第四计算机可读程序代码,其用于使得计算设备输出语音帧的模糊参数表示,其包括所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数;其中所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数的组合比所述与共振峰频率含量相关的较高速率参数和所述与激励信号相关的较高速率参数的组合占据更少的位。
本发明的第十主要方面设法提供将用于当前帧的较高速率语音参数转换为用于当前帧的较低速率语音参数的方法。该方法包括产生用于一系列帧中的每一个帧的相应目标激励信号,所述一系列帧包括当前帧和先前帧,用于给定帧的目标激励信号基于给定帧的相应第一固定组成和给定帧的相应第一自适应组成。该方法还包括在第一和第二模式之一下产生当前帧的第二自适应组成,其中,在第一模式下,根据先前帧的第一固定组成来生成当前帧的第二自适应组成,其中在第二模式下,根据先前帧的第二固定组成来生成当前帧的第二自适应组成,并且其中在所述第二模式下的操作响应于对当前帧的速率降低请求。该方法还包括确定用于当前帧的模糊激励参数,用于当前帧的模糊激励参数被包含在用于当前帧的较低速率语音参数中,用于当前帧的模糊激励参数是根据用于当前帧的目标激励信号和当前帧的第二自适应组成来生成的,用于当前帧的模糊目标激励参数被用来生成当前帧的第二固定组成。
在结合附图阅读了本发明具体实施例的以下描述后,本发明的这些及其他方面和特征对于本领域普通技术人员来说将变得很明显。
附图说明
在附图中:
图1是根据本发明的具体的非限制性实施例的移动电话体系结构的框图,其包括用于把包含在所接收的分组中的语音帧的示例性原始参数表示转换为被置于输出分组中的示例性模糊参数表示的转换实体;
图2是示出对语音帧的示例性原始参数表示中的各种参数的位分配的表;
图3除了描述将辅助信息插入所接收的分组之外,还描绘了语音帧的示例性模糊参数表示中的减少的位数;
图4示出示例性原始参数表示中的在示例性模糊参数表示中不存在的某些参数;
图5A指示与共振峰频率含量相关的参数,其存在于示例性原始参数表示中,并且也存在于示例性模糊参数表示中,但是对示例性模糊参数表示分配较少的位;
图5B图示出转换实体如何实现将与共振峰频率含量相关的参数分解成单独的谱信息;
图5C示出在示例性原始参数表示中的谱信息的集合,其被用于创建示例性模糊参数表示中的谱信息的集合;
图6A示出与激励信号相关的参数,其存在于原始参数表示中,并且也存在于模糊参数表示中,但是对模糊参数表示分配较少的总体位;
图6B是图示出转换实体在将与激励信号相关的参数从示例性原始参数表示转换为示例性模糊参数表示中的功能。
应当明确地理解,描述和附图仅为了对本发明的某些实施例进行说明,并且辅助理解。它们并非是对本发明的限制。
具体实施方式
参考图1,示出了移动电话体系结构,其中无线设备10与无线设备12通过核心分组网络14进行通信。为简单起见仅仅示出一个方向的通信(从无线设备10到无线设备12),但是应该理解的是通信通常预期是双向的。为了清楚起见,无线设备10将被称为近端无线设备,无线设备12将被称为远端无线设备。
在核心分组网络14的边缘是两个基站/控制器16、18。基站/控制器16担当近端无线设备10和核心分组网络14之间的网关,而基站/控制器18担当核心分组网络14和远端无线设备12之间的网关。由此,为了使由近端无线设备10发送的分组到达远端无线设备12,近端无线设备10通过无线链路20将分组传送到基站/控制器16,其通过核心分组网络14将分组转发到基站/控制器18,其接着通过第二无线链路22将分组转发到远端无线设备12。
本领域技术人员将理解涉及基站/控制器16和18的物理配置以及因此名称对于本发明来说不是至关重要的。由此,在不脱离本发明精神的情况下可以使用术语网关、路由器、开关、控制器、网络实体等等。
近端无线设备10包括声码器(vocoder)(或者语音编解码器)24,其将连续的语音帧26(例如,持续时间为二十(20)毫秒)编码成相应的编码语音业务的分组28。编码语音业务的分组28包含语音帧26的参数(而不是采样)表示,编码语音业务的分组28是从语音帧26得到的。参数表示被优化以包含某些临界(critical)参数,所述临界参数允许远端声码器(例如远端无线设备12中的声码器30)以足够的可识度再生语音帧26。使用参数表示的主要优势是当与采样的语音相比较时,它需要的带宽量减少。由此,声码器(诸如声码器24、30)的使用在移动环境中是流行的。然而,应该理解的是本发明不限于移动环境。
不同的声码器设法使用不同的准确度来编码不同的参数。事实上,一些声码器(诸如声码器24)甚至允许该编码方案从一个语音帧到下一个语音帧变化,这取决于所讨论的语音帧的测得特征。一个简单的方法是确定语音帧(诸如语音帧26)是有声的、还是无声的、还是在转移中(in transition),也就是说,是包含强的共振峰频率含量、还是不包含强的共振峰频率含量、还是落在中间的某处。如果语音帧26是有声的或者是在某些转移中(例如,沉默到语音),那么需要更多的参数(以较高的准确度),但是如果语音帧26是无声的或者在某些其他转移中(例如,语音到沉默),那么需要较少的参数(以较低的准确度),以便当在远端声码器处(在本例中是声码器30)恢复语音时获得语音的可比拟的(comparable)可识度。由此,可以利用能够以多个不同速率操作的声码器,声码器的适当的非限制性实例包括EVRC-A(增强的可变速率编解码器修订版A)、QCELP 13K(TIA-733)、SMV(可选模式声码器)、EVRC-B、AMR(自适应多速率)、ITU-T G.729、ITU-T G723.1,以及其他可能的声码器。虽然在整个说明书中EVRC-A将被用作实例,但是本领域技术人员将理解,本发明可以同样适用于其他上述的声码器和可以为本领域技术人员所知的或者正在为(或者将为)将来使用所开发的其他声码器。
因此考虑EVRC-A的具体的非限制性实例,实际存在三种工作模式,即全速率、半速率和八分之一速率。为了获得关于EVRC-A声码器和输入特定模式的决策的更多信息,读者可参考http://www.3gpp2.com/Public html/specs/C.S0014-A v1.0040426.pdf,其在此引用作为参考。图2在左手列中且以总结的方式示出对于每个语音帧26而言可得到的参数,在相邻列示出当声码器24工作在全速率模式下时分配给每个参数的位数。将观察到,谱转移参数被分配一(1)位、线谱信息被分配二十八(28)位、基音(pitch)延迟被分配七(7)位、增量(delta)延迟被分配五(5)位、自适应码本(ACB)增益被分配九(9)位、固定码本(FCB)形状(shape)被分配一百零五(105)位、固定码本(FCB)增益被分配十五(15)位、帧能量不被分配任何位、一(1)位被保留,总共为一百七十一(171)个“基本(primary)业务”位。
在接下来的相邻列中,图2示出当声码器24工作在半速率模式下时分配给每个参数的位数。将观察到,谱转移参数不被分配任何位、线谱信息被分配二十二(22)位、基音延迟被分配七(7)位、增量延迟不被分配任何位、自适应码本(ACB)增益被分配九(9)位、固定码本(FCB)形状被分配三十(30)位、固定码本(FCB)增益被分配十二(12)位、帧能量不被分配任何位、没有任何位被保留,总共为八十(80)个基本业务位。
在最右边的列中,图2示出当声码器24工作在八分之一速率模式下时分配给每个参数的位数。将观察到,仅向以下参数分配位,包括:线谱信息和帧能量,每个具有八(8)位,总共十六(16)个基本业务位。
在图1的移动电话体系结构中,可能需要辅助信息32(包括但不限于信令信息、开销、增强的前向纠错信道编码)来调整、控制和协调该体系结构的各种元件的配置与操作,诸如无线设备10、12和基站/控制器16、18。辅助信息32还可以包括诸如文本消息、即时消息和/或电子邮件消息之类的通信数据。当远端无线设备12涉及于利用基站/控制器18和远端无线设备12之间的无线链路上的全部可用带宽的呼叫中(即,在生成的语音帧需要使用全速率参数表示期间)时,则需要速率降低的方法以允许辅助信息32在该呼叫期间到达远端无线设备12。类似地,当在核心分组网络14中存在拥塞(这减少了可以用来支持与远端无线设备12的呼叫的带宽)时,需要速率降低方法来保持该呼叫仍在进行。
相应地,在该具体非限制性实例中,并且根据本发明的非限制性实施例,基站/控制器18包括处理实体52,其包括转换实体34和分组化实体50。转换实体34被配置成执行“模糊(dimming)”操作,也就是说,将包含在所接收的分组28中的语音帧的原始参数表示转换为语音帧的模糊参数表示。分组化实体50被配置成将模糊参数表示置于输出分组38中。分组化实体50还可以将辅助信息32置于输出分组38中。
执行模糊操作的转换实体34对“速率降低请求”40进行响应,该速率降低请求指示:希望降低所接收的分组28的语音编码速率。速率降低请求40,在非限制性实例中可以体现为模糊和突发(dim-and-burst)的请求,可以由基站/控制器18或者另一网络实体视情况而定地生成,其多个原因对于本领域技术人员来说将是很明显的。速率降低请求40可以影响一个单独的接收分组28或者一系列连续接收的分组42。
虽然在图1中基站/控制器18被示为包括用于执行模糊操作的转换实体34,但是应当理解可以由在基站/控制器16中实施的转换实体和/或在近端无线设备10和远端无线设备12之间的任何其他网络实体执行该模糊操作。在核心分组网络14内可能出现对转换实体34的需要,例如用来减轻网络拥塞。
图3图示出就示例性接收分组28和对应的示例性输出分组38而言转换实体34的功能。本领域技术人员将会理解:分组28、38中的每一个具有各自的首部28A、38A和各自的有效载荷28B、38B。正如所看到的,所接收的分组28的有效载荷28B包括语音帧的原始参数表示320,在该具体示例中,它是由近端无线设备10中的声码器24所产生的全速率表示。由此,在原始参数表示320中存在一百七十一(171)个业务位。额外的模式位(未示出)可以放在该171个业务位之前,其指示分组28包括语音帧的原始参数表示(而不是模糊参数表示)。
由转换实体34执行的模糊操作包含通过将原始参数表示320转换为具有更少位的模糊参数表示330来对速率降低请求40进行响应。在这种情况下,模糊参数表示330具有与半速率参数表示相同的位数,即八十(80)位。这些八十(80)位被置于输出分组38中,留下九十一(91)个附加位,如果所接收的分组28已经由基站/控制器18仅仅以它的原始形式被转发,那么九十一(91)个附加位将已经被消耗。然而,模糊操作现在已经释放了这些位,从而使得它们可用来传输辅助信息32,或者干脆不被传输,由此减少了基站/控制器18与远端无线设备12之间的无线链路22上的带宽。在非限制性示例性实施例中,上述的模式位(未示出)可以被用于指示:分组38包含语音帧的模糊参数表示(而不是原始参数表示)。
现在将描述一个如下方式的具体的非限制性实例,其中转换实体34将原始参数表示320转换为模糊参数表示330。
忽略的参数
原始参数表示320中的某些参数被忽略并且由此不出现在模糊参数表示330中。如图4所示,这是具有一(1)位的谱转移参数、五(5)位的增量延迟和保留位的情形,这些位都没有出现在模糊参数表示330中。
与共振峰频率含量相关的参数
与共振峰频率含量相关的参数包括线谱信息,参考图5A,线谱信息在原始参数表示320中占据二十八(28)位,但在模糊参数表示330中仅仅占据二十二(22)位。现在参考图5B描述这样的方式,其中单独的位被分配给每个参数表示中的线谱信息。在本实例中,线谱信息包含线谱对,但是这不应被视为限制。
具体地,与共振峰频率含量相关的参数包括十(10)个组分(component)线谱对,表示为Ω1、Ω2...Ω10。当然,不同的声码器可以利用不同数目的线谱对,并且由此此处所使用的数目仅仅是特定说明,而不应被视为限制。具体参考图5B,因此,注意到原始参数表示320中的十(10)个线谱对被分组为四个线谱对集合,即第一集合中的Ω1和Ω2,第二集合中的Ω3和Ω4,第三集合中的Ω5、Ω6和Ω7,和第四集合中的Ω8、Ω9和Ω10。每个线谱对集合分别使用单独的“码本”来编码,即,码本1用于第一集合,等等。码本能够被定义为可加索引的(indexable)数据库,其存储与每个条目相关联的某些特征。
每个码本的内容被优化以便产生相关联集合中的线谱对的高效联合编码。由此,码本大小不同。就被用于联合编码线谱对Ω1和Ω2的码本1而言,六十四(64)个条目(即,六位)被认为是足够的。由此,每六位的组合用来索引码本1中的不同条目,对于线谱对Ω1和Ω2,其包含64个可能的特征组合。这有时称为分裂(split)矢量量化。类似地,用来联合编码线谱对Ω3和Ω4的码本2也包含六十四个条目(即,六位)。就用来联合编码线谱对Ω5、Ω6和Ω7的码本3而言,其具有五百一十二(512)个条目,其对应于九位的索引。最后,用来联合编码线谱对Ω8、Ω9和Ω10的码本4具有一百二十八(128)个条目,其对应七位的索引。
继续参考图5B,模糊参数表示320中的十(10)个线谱对被分为三个线谱对集合,即第一集合中的Ω1、Ω2和Ω3,第二集合中的Ω4、Ω5和Ω6,第三集合中的Ω7、Ω8、Ω9和Ω10。每个线谱对集合通过使用单独的码本来分别编码,即,码本5用于第一集合,码本6用于第二集合并且码本7用于第三集合。每个码本的内容被优化以便产生相关联集合中的线谱对的高效联合编码。由此,如同码本1、2、3和4的情况一样,码本5、6和7也大小不同,但是与码本1、2、3和4具有很少相似性。就用来联合编码线谱对Ω1、Ω2和Ω3的码本5而言,一百二十八(128)个条目(即,七位)被认为是足够的。就用来联合编码线谱对Ω4、Ω5和Ω6的码本6而言,其也包含一百二十八(128)个条目(即七位)。最后,用来联合编码线谱对Ω7、Ω8、Ω9和Ω10的码本7具有两百五十六个条目,其对应于八位的索引。注意到,码本5、6和7应该是由声码器30使用来对与已经在由近端无线设备10的声码器24产生的半速率表示中被编码的共振峰频率含量相关联的参数进行解码的那些码本。
为了减少位的数目,转换实体34包括适当的电路、软件和/或控制逻辑以用于实施输入-输出变换,该输入-输出变换根据以下参考图5C所描述的技术来生成。具体地,在原始参数表示320中的线谱对的第一集合和第二集合的一部分被映射到模糊参数表示330中的线谱对的第一集合。第一映射530可以用于此目的。第一映射530的结果基本上忽略了线谱对Ω4的组成,该结果引起选择对模糊参数表示330中的线谱对Ω1、Ω2和Ω3进行编码的七位索引。另外,在原始参数表示320中的线谱对的第二集合的一部分和第三集合的一部分被映射到模糊参数表示330中的线谱对的第二集合。第二映射540可以用于此目的。第二映射540的结果基本上忽略了线谱对Ω3和Ω7的组成,该结果引起选择对模糊参数表示330中的线谱对Ω4、Ω5和Ω6进行编码的七位索引。最后,在原始参数表示320中的线谱对的第三集合的一部分连同第四集合被映射到模糊参数表示330中的线谱对的第三集合和最后集合。第三映射550可以用于此目的。第三映射550的结果基本上忽略了线谱对Ω5和Ω6的组成,该结果引起选择对模糊参数表示330中的线谱对Ω7、Ω8、Ω9和Ω10进行编码的八位索引。
映射530、540和550的内容能够以离线的方式被优化以确保例如就原始参数表示320中的线谱对的所有可能的组合而言稳定性因素得以满足。稳定性因素的实例不应被视为限制,其确保线谱对是递增顺序并且确保两个连续线谱对之间是最短距离。可替换地,因为在执行稳定性检查时牵涉到的处理很小,这样的处理能够针对线谱对Ω1...Ω10的特定集合实时执行。
注意到,输入-输出变换不需要从原始参数表示320中的线谱对来合成语音(乃至其共振峰频率含量)。因而,与语音合成相关联的计算资源被节省下来。
当然,本领域技术人员将会理解,待执行的映射530、540、550的数目取决于原始参数表示320和模糊参数表示330中的线谱对的组群之间的关系。并且,线谱对的数目本身是设计选择,本领域技术人员将理解不存在对于从原始参数表示320映射到模糊参数表示330的线谱对的数目的具体限制。在某些情况下,可以做出设计选择以使得原始参数表示320中的一个或多个线谱对被忽略,并且由此不出现在模糊参数表示330中。
与激励信号相关的参数
与激励信号相关的参数包括基音延迟、ACB增益、FCB形状和FCB增益。它们是也被称为“激励参数”。参考图6A,在具体实施例中,不视为限制,基音延迟的七(7)位和ACB增益的九(9)位被未改变地置于模糊参数表示330中。另一方面,分配给FCB形状的位数从一百零五(105)个减少到三十(30)个,而分配给FCB增益的位数从十五(15)个减少到十二(12)个。现在将参考图6B来描述通过转换实体34实现位数减少的方式。
具体地,转换实体34还包括适当的电路、软件和/或控制逻辑,用于实施第一解码器602和第二解码器604。
第一解码器602包括固定组分信号发生器606,其对用于当前帧的原始参数表示320中的FCB形状和FCB增益起作用以生成当前帧的固定码本组成608。本领域技术人员熟悉用于生成诸如固定码本组成608之类的信号的技术,因此在这里不需要详述这样的技术。当前帧的固定码本组成608由固定组分信号发生器606产生,然后被馈送到双输入求和块610的输入端。求和块610的另一个输入此后被称为当前帧的“全速率自适应码本组成”609,其包含由用于当前帧的原始参数表示320中的基音延迟(或者“基音滞后”)延迟的并由用于当前帧的原始参数表示320中的ACB增益放大的求和块610的先前存储的输出。(在求和块610的先前存储的输出变换为当前帧的全速率自适应码本组成609的过程中,也可以对求和块610的先前存储的输出执行诸如平滑和滤波之类的其他操作)。
求和块610的输出然后被重新计算并被存储在存储器中以供下一个帧使用等等。此后被称为用于当前帧的“目标激励信号”611的求和块610的输出因此是下列各项的组合:(i)当前帧的固定码本组成608和(ii)当前帧的全速率自适应码本组成609,其本身基于用于先前帧的目标激励信号611但是受到用于当前帧的原始参数表示320中的ACB增益和基音延迟的影响。
对第二解码器604的操作而言,其取决于是否存在速率降低请求40。
情况1:没有速率降低请求
如果尚未有速率降低请求40,则将会理解不需要模糊参数表示330并且不使用转换实体34。然而,为了对可能发生的速率降低请求40做准备,转换实体34仍然尝试跟踪远端无线设备12处的远端声码器30的状态。
为此目的,当不存在对所接收的分组28的速率降低请求40时,第二解码器604工作在第一模式下,由此,由固定组分信号发生器606产生的当前帧的固定码本组成608被馈送到双输入求和614的第一输入端。求和块614的另一个输入,此后被称为当前帧的“模糊自适应码本组成”613,其包含由用于当前帧的原始参数表示320中的基音延迟(或者“基音滞后”)延迟并且由用于当前帧的原始参数表示320中的ACB增益放大的、求和块614的先前存储的输出614A。(在求和块614的先前存储的输出变换为当前帧的模糊自适应码本组成613的过程中,也可以对求和块614的先前存储的输出614A执行诸如平滑和滤波之类的其他操作)。求和块614的输出614A然后被重新计算并被存储在存储器中,以供与速率降低请求相关联的或不相关联的下一个帧使用。
情况2:接收到速率降低请求
当转换实体34接收到对所接收的分组28的速率降低请求40时,第二解码器604进入第二工作模式。
在该第二工作模式下,第一步是生成用于当前帧的“模糊FCB形状”622和“模糊FCB增益”624,其被用作用于当前帧的模糊参数表示330中的FCB形状和FCB增益。用于当前帧的模糊FCB形状622和模糊FCB增益624由包括向量量化器618和比较器612的处理模块生成。具体地,比较器612被馈送以(i)用于当前帧的目标激励信号611(接收自第一解码器602)和(ii)用于当前帧的模糊自适应码本组成613(接收自第二解码器604)。在具体的非限制性实施例中,比较器612的输出(此后称为“差异信号”615)表示用于当前帧的目标激励信号611与当前帧的模糊自适应码本组成613之间的差异。
现在,回想起来,用于当前帧的目标激励信号611是当前帧的固定码本组成608和当前帧的全速率自适应码本组成609的和。也应注意到,直到接收到速率降低请求40之前,第二解码器604已经一直工作在第一模式下,这意味着当前帧的全速率自适应码本组成609将与当前帧的模糊自适应码本组成613相同,这是因为在各解码器602、604中曾使用相同的系数(ACB增益和基音延迟)。因此,直到接收到速率降低请求40之前,比较器612的输出处的差异信号615将跟踪固定码本组成608。
现在考虑:用于当前帧的模糊FCB形状622和模糊FCB增益624被用于驱动第二固定组分信号发生器616以产生输出617。还考虑:提供开关装置620(可以以例如硬件、软件和/或控制逻辑来实现),该开关装置620能够有选择地用输出617而不是第一组分信号608来馈入求和块614的第一输入端。
在这些条件下,显然:差异信号615表示想要第二固定组分信号发生器616的输出617处的信号是什么样的,如果想要求和块614的输出614A尽可能地(根据某一准则,例如最小二乘方)类似用于当前帧的目标激励信号611,从而最小化语音质量损伤。为此目的,使用与远端无线设备12中的远端声码器30相同的码本,向量量化器618将差异信号615编码为上述的模糊FCB形状622和模糊FCB增益624。根据本发明的具体的非限制性实施例,向量量化器618是被用来确定模糊FCB形状622和模糊FCB增益624的半速率向量量化器618。
第二固定组分信号发生器616的输出617基于模糊FCB形状622和模糊FCB增益624,该输出617然后被传递通过求和块614,在此处它被添加到当前帧的模糊自适应码本组成613中(如上所示计算的)。求和块614的输出614A然后被重新计算并被存储在存储器中,以供与速率降低请求相关联的或不相关联的下一个帧使用。
在非限制性实施例中,模糊FCB形状622和模糊FCB增益624只限于能够通过分配给模糊参数表示330中的相应参数的位数来编码的值。在该具体的非限制性实例中,模糊FCB形状622是能够通过分配给其的三十(30)位来编码的值,而模糊FCB增益624是能够通过分配给其的十二(12)位来编码的值。
将会理解,模糊FCB形状622和模糊FCB增益624可以取决于下面的所有四个:原始参数表示320中的FCB形状、FCB增益、基音延迟和ACB增益。
还应当理解,如果接收到针对在所接收分组的系列42中的第二连续的接收分组的速率降低请求40,则第二解码器604将继续工作在第二模式下,由此求和块614的第一输入由第二固定组分信号发生器616的输出617提供。如果没有针对所接收分组的系列42中的给定接收分组请求速率降低请求40,那么第二解码器604中的开关单元620恢复到第一模式,由此求和块614的第一输入由固定信号分量信号发生器606产生的固定码本组成608来提供。
因此将会理解,通过使用图6B的系统,更具体地说,通过即使当不存在速率降低请求40时仍保持第二解码器604活动(active),可以跟踪远端声码器30的存储器状态,当速率降低请求40最终被接收时,这允许对模糊FCB形状622和模糊FCB增益624的更优化选择。这使得当速率降低在进行中时所感知的语音质量得以改善。因此将会理解,根据本发明的实施例从语音帧的较高速率参数表示创建语音帧的较低速率参数表示引起可与不存在速率降低的情况相比较的感知语音质量。同时,此处描述的技术比转码(即,恢复全速率语音和以半速率重新编码)需要更少的计算工作量。
可以通过简化向量量化器618的设计来获得计算性能的进一步改进。例如,向量量化器618可以使用查找表来确定模糊FCB增益624,并且可以使用经验的脉冲抽选(decimation)(即,除去一半的非零脉冲)来确定模糊FCB形状622。所感知的语音质量的额外改进也是可能的,这要以更大的计算复杂度为代价。例如,能够选择不仅自适应地确定模糊FCB增益624和模糊FCB形状622,还可以确定ACB增益和/或基音延迟。计算复杂度与语音质量之间的权衡因此是固有的约束条件并且能够向一方或另一方倾斜,这取决于设计选择。
应该重申:EVRC-A仅仅是作为实例来使用的,并且其他声码器将由其他位分配和其他参数一起来表征。本领域技术人员因此将理解,如上所述的技术仍然有效并且可以被用于设计用于以在计算上高效的方式从语音帧的较高速率参数表示创建语音帧的较低速率参数表示的技术,该方式不需要整个语音采样被恢复并且因此不需要与共振峰频率含量(即线谱信息)相关的参数被识别和重新编码。这样,本发明能够应用于其他声码器,例如QCELP 13K(TIA-733)、SMV(可选模式声码器)、EVRC-B、AMR(自适应多速率)、ITU-T G.729和ITU-T G723.1,这是几个具体的非限制性实例。
本领域技术人员还将理解:虽然上面的描述集中于语音帧的全速率参数表示已经降为半速率参数表示的情况,但是本发明也适用于其他速率降低方案,例如但不限于:全速率到八分之一速率、半速率到八分之一速率和一般地(N/M)th速率到(n/m)th速率(其中,N/M>n/m),只要(n/m)th速率仍然适用于语音帧。
本领域技术人员还将理解的是,在一些实施例中,转换实体34的功能可以被实现为预编程的硬件或者固件元件(例如,专用集成电路(ASIC)、电可擦可编程只读存储器(EEPROM)等)或者其他相关部件。在其他实施例中,转换实体34可以被实现为能访问用来存储用于ALU操作的程序指令的代码存储器(未示出)的运算逻辑单元(ALU)。所述程序指令可被存储在固定的、有形的并且能被转换实体34直接读取的介质上(例如,可拆装的磁盘、CD-ROM、ROM、固定磁盘、USB驱动器),或者所述程序指令可以被远程地存储但是可经由通过传输介质连接到网络的调制解调器或者其他接口装置(例如,通信适配器)而传送到转换实体34。该传输介质可以是有形的介质(例如,光学或者模拟通信线路)或者是使用无线技术(例如,微波、红外线或者其他传输方案)实施的介质。
虽然已经描述并且示出了本发明的具体实施例,但对于本领域技术人员而言将很明显的是在不背离所附权利要求所限定的本发明的范围的情况下能够进行大量的修改和变化。

Claims (44)

1.一种用于将用于当前帧的较高速率语音参数转换为用于当前帧的较低速率语音参数的转换设备,所述转换设备包括:
-第一解码器,被配置成产生用于一系列帧中的每一个帧的相应目标激励信号,所述一系列帧包括当前帧和先前帧,用于给定帧的目标激励信号基于给定帧的相应第一固定组成和给定帧的相应第一自适应组成;
-第二解码器,被配置成产生当前帧的第二自适应组成并且还被配置成可选择地工作在第一模式或者第二模式下;
-在第一模式下,根据先前帧的第一固定组成来生成当前帧的第二自适应组成;
-在第二模式下,根据先前帧的第二固定组成来生成当前帧的第二自适应组成;
-第二解码器被配置成响应于对当前帧的速率降低请求而工作在第二模式下;
-处理模块,被配置成确定用于当前帧的模糊激励参数,所述用于当前帧的模糊激励参数是根据用于当前帧的目标激励信号和当前帧的第二自适应组成来生成的,所述用于当前帧的模糊激励参数被用来生成当前帧的第二固定组成;
-其中用于当前帧的模糊激励参数被包含在用于当前帧的较低速率语音参数中。
2.如权利要求1所述的转换设备,其中用于当前帧的较高速率语音参数包括用于当前帧的较高速率参数的第一子集,其中用于当前帧的较高速率参数的第一子集被用来生成当前帧的第一固定组成。
3.如权利要求2所述的转换设备,其中用于当前帧的较高速率语音参数还包括用于当前帧的较高速率参数的第二子集,其中用于当前帧的较高速率参数的第二子集被用来生成当前帧的第一自适应组成。
4.如权利要求3所述的转换设备,其中当前帧的第一自适应组成是另外根据先前帧的第一固定组成来生成的。
5.如权利要求4所述的转换设备,其中用于当前帧的目标激励信号是当前帧的第一固定组成与当前帧的第一自适应组成的和。
6.如权利要求4所述的转换设备,其中用于先前帧的较高速率语音参数包括用于先前帧的较高速率参数的第一子集,并且其中用于先前帧的较高速率参数的第一子集被用来生成先前帧的第一固定组成。
7.如权利要求6所述的转换设备,其中用于当前帧的模糊激励参数比用于当前帧的较高速率参数的第一子集占据更少的位。
8.如权利要求7所述的转换设备,其中用于当前帧的较高速率参数的第一子集包括固定码本形状和固定码本增益。
9.如权利要求8所述的转换设备,其中用于当前帧的模糊激励参数包括第二固定码本形状和第二固定码本增益。
10.如权利要求9所述的转换设备,其中用于当前帧的较高速率参数的第二子集也被包含在用于当前帧的较低速率语音参数中。
11.如权利要求10所述的转换设备,其中用于当前帧的较高速率语音参数的第二子集包括自适应码本增益和基音滞后。
12.如权利要求1所述的转换设备,其中第二解码器被配置成在没有速率降低请求的情况下工作在第一模式下。
13.如权利要求6所述的转换设备,其中用于先前帧的较高速率语音参数还包括用于先前帧的较高速率激励参数的第二子集,并且其中用于先前帧的较高速率激励参数的第二子集被用来生成先前帧的第二固定组成。
14.如权利要求13所述的转换设备,其中所述用于先前帧的较高速率语音参数的第二子集包括自适应码本增益和基音滞后。
15.如权利要求1所述的转换设备,其中所述处理模块包括向量量化器和比较器。
16.如权利要求15所述的转换设备,其中所述比较器被配置成确定在用于当前帧的目标激励信号与当前帧的第二自适应组成之间的差异。
17.如权利要求16所述的转换设备,其中所述向量量化器被配置成执行向量量化以根据所述差异确定用于当前帧的模糊激励参数。
18.如权利要求17所述的转换设备,其中用于当前帧的模糊激励参数包括固定码本形状和固定码本增益。
19.如权利要求1所述的转换设备,其中用于当前帧的较高速率语音参数是全速率语音参数并且其中用于当前帧的较低速率语音参数是半速率语音参数。
20.如权利要求1所述的转换设备,其中用于当前帧的较高速率语音参数不是全速率语音参数或者其中用于当前帧的较低速率语音参数不是半速率语音参数。
21.如权利要求1所述的转换设备,其中用于当前帧的较高速率语音参数包括用于当前帧的与共振峰频率含量相关的较高速率参数,并且其中用于当前帧的较低速率语音参数还包括用于当前帧的与共振峰频率含量相关的模糊参数,用于当前帧的与共振峰频率含量相关的模糊参数比用于当前帧的与共振峰频率含量相关的较高速率参数占据更少的位。
22.如权利要求21所述的转换设备,还被配置成根据所述用于当前帧的与共振峰频率含量相关的较高速率参数来产生所述用于当前帧的与共振峰频率含量相关的较低速率参数。
23.如权利要求22所述的转换设备,其中所述用于当前帧的与共振峰频率含量相关的较低速率参数是在不合成语音信号的情况下根据所述用于当前帧的与共振峰频率含量相关的较高速率参数来产生的。
24.一种用于语音编码的设备,包括如权利要求1所述的转换设备,和被配置成将用于当前帧的较低速率语音参数插入输出分组中的分组化设备。
25.如权利要求24所述的设备,其中分组化设备还被配置成将辅助信息插入输出分组中。
26.如权利要求25所述的设备,辅助信息包括信令信息、开销和增强的前向纠错信道编码中的至少一个。
27.如权利要求25所述的设备,辅助信息包括文本消息、即时消息和电子邮件消息中的至少一个。
28.一种将与共振峰频率含量相关的N个编码的较高速率参数的集合转换为与共振峰频率含量相关的N个编码的较低速率参数的集合的方法,所述方法包括:
-识别在N个编码的较高速率参数的集合中的编码的较高速率参数的多个子集;
-针对在N个编码的较低速率参数的集合中的编码的较低速率参数的多个子集中的每个特定子集,从编码的较高速率参数的子集中的一个或多个对应子集中的编码的较高速率参数得到在编码的较低速率参数的所述特定子集中的编码的较低速率参数;
-其中N个编码的较低速率参数能够使用比N个编码的较高速率参数更少的位来表示。
29.如权利要求28所述的方法,其中所述得到包括执行映射。
30.如权利要求28所述的方法,其中在编码的较低速率参数的所述特定子集中的编码的较低速率参数共同地表示进入码本中的条目。
31.如权利要求30所述的方法,其中编码的较高速率参数的子集中的所述一个或多个对应子集中的每一个中的编码的较高速率参数共同地表示相应码本中的相应条目。
32.如权利要求28所述的方法,其中编码的较高速率参数表示线谱信息。
33.如权利要求32所述的方法,其中编码的较高速率参数对线谱对进行标识。
34.如权利要求32所述的方法,其中N个编码的较高速率参数与全编码速率对应并且其中N个编码的较低速率参数与半编码速率对应。
35.如权利要求32所述的方法,其中N个编码的较高速率参数不与全编码速率对应或者其中N个编码的较低速率参数不与半编码速率对应。
36.如权利要求28所述的方法,其中N=10。
37.一种用于将与共振峰频率含量相关的N个编码的较高速率参数的集合转换为与共振峰频率含量相关的N个编码的较低速率参数的集合的装置,包括:
-第一部件,识别N个编码的较高速率参数的集合中的编码的较高速率参数的多个子集;
-第二部件,针对在N个编码的较低速率参数的集合中的编码的较低速率参数的多个子集中的每个特定子集,从在编码的较高速率参数的子集中的一个或多个对应子集中的编码的较高速率参数得到在编码的较低速率参数的所述特定子集中的编码的较低速率参数;
-其中N个编码的较低速率参数能够使用比N个编码的较高速率参数更少的位来表示。
38.一种处理当前语音帧的原始参数表示的方法,当前帧的原始参数表示包括与共振峰频率含量相关的较高速率参数和与激励信号相关的较高速率参数,所述方法包括:
-接收对当前帧的速率降低请求;
-通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与共振峰频率含量相关的较高速率参数来产生与共振峰频率含量相关的较低速率参数;
-通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与激励信号相关的较高速率参数来产生与激励信号相关的较低速率参数;
-输出当前帧的模糊参数表示,所述当前帧的模糊参数表示包括所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数;
-所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数的组合比所述与共振峰频率含量相关的较高速率参数和所述与激励信号相关的较高速率参数占据更少的位。
39.如权利要求38所述的方法,其中所述处理所述与激励信号相关的较高速率参数包括处理与关联于当前帧的原始参数表示的激励信号相关的较高速率参数的版本。
40.如权利要求39所述的方法,其中所述处理所述与激励信号相关的较高速率参数还包括处理与关联于先前帧的相应参数表示的激励信号相关的较高速率参数的至少一个版本。
41.如权利要求38所述的方法,其中所述产生所述与共振峰频率含量相关的较低速率参数包括执行映射。
42.如权利要求38所述的方法,其中所述产生所述与激励信号相关的较低速率参数包括:
-产生用于一系列帧中的每一个帧的相应目标激励信号,所述一系列帧包括当前帧和先前帧,用于给定帧的目标激励信号基于给定帧的相应第一固定组成和给定帧的相应第一自适应组成;
-产生当前帧的第二自适应组成,其中或者根据先前帧的第一固定组成或者响应于所述对当前帧的速率降低请求根据先前帧的第二固定组成来生成当前帧的第二自适应组成;
-确定用于当前帧的模糊激励参数,根据用于当前帧的目标激励信号和当前帧的第二自适应组成来生成用于当前帧的模糊激励参数,用于当前帧的模糊激励参数被用来生成当前帧的第二固定组成;
-其中用于当前帧的模糊激励参数被包含在与激励信号相关的较低速率参数中。
43.一种用于处理当前语音帧的原始参数表示的转换设备,当前帧的原始参数表示包括与共振峰频率含量相关的较高速率参数和与激励信号相关的较高速率参数,所述转换设备包括:
-用于接收对当前帧的速率降低请求的装置;
-用于通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与共振峰频率含量相关的较高速率参数来产生与共振峰频率含量相关的较低速率参数的装置;
-用于通过在不从所述与共振峰频率含量相关的较高速率参数合成共振峰频率含量的情况下处理所述与激励信号相关的较高速率参数来产生与激励信号相关的较低速率参数的装置;
-用于输出当前帧的模糊参数表示的装置,所述当前帧的模糊参数表示包括所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数;
-其中所述与共振峰频率含量相关的较低速率参数和所述与激励信号相关的较低速率参数的组合比所述与共振峰频率含量相关的较高速率参数和所述与激励信号相关的较高速率参数的组合占据更少的位。
44.一种将用于当前帧的较高速率语音参数转换为用于当前帧的较低速率语音参数的方法,包括:
-产生用于一系列帧中的每一个帧的相应目标激励信号,所述一系列帧包括当前帧和先前帧,用于给定帧的目标激励信号基于给定帧的相应第一固定组成和给定帧的相应第一自适应组成;
-在第一和第二模式之一下产生当前帧的第二自适应组成;
-在第一模式下,根据先前帧的第一固定组成来生成当前帧的第二自适应组成;
-在第二模式下,根据先前帧的第二固定组成来生成当前帧的第二自适应组成;
-其中在所述第二模式下的工作响应于对当前帧的速率降低请求;
-确定用于当前帧的模糊激励参数,用于当前帧的模糊激励参数被包含在用于当前帧的较低速率语音参数中,用于当前帧的模糊激励参数是根据用于当前帧的目标激励信号和当前帧的第二自适应组成来生成的,用于当前帧的模糊激励参数被用来生成当前帧的第二固定组成。
CN2007800431744A 2006-09-28 2007-09-28 用于编码的语音业务的速率降低的方法和设备 Expired - Fee Related CN101617361B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/536,261 2006-09-28
US11/536,261 US7725311B2 (en) 2006-09-28 2006-09-28 Method and apparatus for rate reduction of coded voice traffic
PCT/CA2007/001732 WO2008037081A1 (en) 2006-09-28 2007-09-28 Method and apparatus for rate reduction of coded voice traffic

Publications (2)

Publication Number Publication Date
CN101617361A CN101617361A (zh) 2009-12-30
CN101617361B true CN101617361B (zh) 2012-10-03

Family

ID=39232741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800431744A Expired - Fee Related CN101617361B (zh) 2006-09-28 2007-09-28 用于编码的语音业务的速率降低的方法和设备

Country Status (4)

Country Link
US (1) US7725311B2 (zh)
CN (1) CN101617361B (zh)
HK (1) HK1140304A1 (zh)
WO (1) WO2008037081A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
WO2011035813A1 (en) * 2009-09-25 2011-03-31 Nokia Corporation Audio coding
TWI759223B (zh) * 2010-12-03 2022-03-21 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
US20130235724A1 (en) * 2012-03-09 2013-09-12 Sevis Systems, Inc. System and Method for Optimizing and Eliminating Congestion for WAN Interfaces within the Access Domain
CN103929595A (zh) * 2014-04-29 2014-07-16 深圳市大拿科技有限公司 通过移动终端声音播放设置安防器材参数的方法
WO2022179406A1 (zh) * 2021-02-26 2022-09-01 腾讯科技(深圳)有限公司 音频转码方法、装置、音频转码器、设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5519779A (en) * 1994-08-05 1996-05-21 Motorola, Inc. Method and apparatus for inserting signaling in a communication system
WO2005006687A1 (en) * 2003-07-10 2005-01-20 Samsung Electronics Co., Ltd. Method and system for multiplexing and transmitting signaling message and supplementary data in a mobile communication system
WO2005078707A1 (en) * 2004-02-16 2005-08-25 Koninklijke Philips Electronics N.V. A transcoder and method of transcoding therefore

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
US6829579B2 (en) 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
US20030202475A1 (en) 2002-04-25 2003-10-30 Qingxin Chen Multiplexing variable-rate data with data services
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7433815B2 (en) * 2003-09-10 2008-10-07 Dilithium Networks Pty Ltd. Method and apparatus for voice transcoding between variable rate coders

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5519779A (en) * 1994-08-05 1996-05-21 Motorola, Inc. Method and apparatus for inserting signaling in a communication system
WO2005006687A1 (en) * 2003-07-10 2005-01-20 Samsung Electronics Co., Ltd. Method and system for multiplexing and transmitting signaling message and supplementary data in a mobile communication system
WO2005078707A1 (en) * 2004-02-16 2005-08-25 Koninklijke Philips Electronics N.V. A transcoder and method of transcoding therefore

Also Published As

Publication number Publication date
WO2008037081A1 (en) 2008-04-03
CN101617361A (zh) 2009-12-30
HK1140304A1 (en) 2010-10-08
US20080082324A1 (en) 2008-04-03
US7725311B2 (en) 2010-05-25

Similar Documents

Publication Publication Date Title
KR100919868B1 (ko) 패킷 손실 보상
US5995923A (en) Method and apparatus for improving the voice quality of tandemed vocoders
CN101617361B (zh) 用于编码的语音业务的速率降低的方法和设备
AU733156B2 (en) Audio coding method and apparatus
US6970479B2 (en) Encoding and decoding of a digital signal
CN1110791C (zh) 数字信息编码的方法和装置
KR20070038041A (ko) 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치
US7486207B2 (en) Method and device for changing an encoding mode of encoded data streams
WO2007063910A1 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
WO2006075605A1 (ja) 長期予測符号化方法、長期予測復号化方法、これら装置、そのプログラム及び記録媒体
AU717993B2 (en) Adaptive transform coding system, adaptive transform decoding system and adaptive transform coding/decoding system
JP2002229599A (ja) 音声符号列の変換装置および変換方法
JP3193515B2 (ja) 音声符号化通信方式及びその装置
CN1316771C (zh) 用于速率匹配的装置和方法
CN1135529C (zh) 传送语音信号的通信网络
JP2853824B2 (ja) 音声のパラメータ情報符号化法
JP4638895B2 (ja) 復号方法、復号器、復号装置、プログラムおよび記録媒体
Erdmann et al. Embedded speech coding based on pyramid CELP
JPH02305114A (ja) 音声符号化方式
JP2000047695A (ja) 符号化装置及び復号化装置
JP2002351497A (ja) 符号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: ERISSON

Free format text: FORMER OWNER: NORTHERN TELECOM LTD.

Effective date: 20100816

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: QUEBEC, CANADA TO: STOCKHOLM, SWEDEN

TA01 Transfer of patent application right

Effective date of registration: 20100816

Address after: Stockholm

Applicant after: ERICSSON AB

Address before: Quebec

Applicant before: NORTEL NETWORKS Ltd.

REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1140304

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1140304

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20121003

CF01 Termination of patent right due to non-payment of annual fee