CN101939658A

CN101939658A - 在无线通信终端中的语音编码方案的选择

Info

Publication number: CN101939658A
Application number: CN200880123204.7A
Authority: CN
Inventors: 茂尔·马格里特; 戴维·本-伊莱; 保罗·S·斯宾塞
Original assignee: Mawier International Trade Co Ltd
Current assignee: Kaiwei International Co; Marvell International Ltd; Marvell Asia Pte Ltd
Priority date: 2007-12-26
Filing date: 2008-12-21
Publication date: 2011-01-05
Anticipated expiration: 2028-12-21
Also published as: EP2232281B1; WO2009081398A3; EP2232281A4; CN101939658B; US20090171658A1; EP2232281A2; US8972247B2; WO2009081398A2; JP2011514020A

Abstract

一种用于通信的方法，包括接收传送已编码的语音的已调制的信号。估计了与所接收的信号相关联的信息熵的度量。响应于所估计的信息熵的度量来选择语音编码方案。将利用5种所选的语音编码方案对随后的语音进行编码的请求发送至发射机(28)。

Description

在无线通信终端中的语音编码方案的选择

技术领域

本发明通常涉及通信系统，具体地，涉及用于在无线通信系统中编码语音的方法和系统。

背景技术

许多通信系统提供语音通信业务，即，在用户之间传送语音。在发送所传送的语音之前，常常使用合适的语音编码方案来压缩所传送的语音。一些通信协议使用多种不同的语音编码方案。例如，全球移动通信系统(GSM)标准、通用移动通信业务(UMTS)标准和GSM EDGE无线接入网(GERAN)标准使用一组被称为自适应多速率(AMR)的语音编码方案。例如，AMR在标题为“Technical Specification Group Service and System Aspects；Mandatory Speech CODEC Speech Processing Functions；AMR Speech CODEC；General Description(Release 6)”的第三代合作伙伴计划(3GPP)技术规范26.071((3GPP TS 26.071)，版本6.0.0，2004年12月)中以及在标题为“Technical Specification Group GSM/EDGE Radio Access Network；Link Adaptation(Release 6)”的3GPP技术规范45.009((3GPP TS 45.009)，版本6.2.0，2005年6月)中被定义，这两个规范通过引用被结合于此。

在一些通信协议中，基于发射机和接收机之间的信道状况来选择合适的语音编码方案。例如，上面所引用的3GPP TS 45.009的第3.3.1节提出使用载波干扰比(CIR)作为选择合适AMR编码方案的标准。

发明内容

本发明的实施例提供用于通信的方法，包括：

接收传送已编码的语音的已调制的信号；

估计与所接收的信号相关联的信息熵的度量；

响应于所估计的信息熵的度量来选择语音编码方案；以及

向发射机发送请求以利用所选择的语音编码方案来编码随后的语音。

在一个实施例中，估计所述信息熵的度量包括估计所接收的信号的互信息(MI)。可替换地，估计所述信息熵的度量包括估计对所接收的信号计算的指数有效信号干扰和噪声比映射(EESM)函数。

在一些实施例中，接收所述已调制的信号包括接收被划分为多个组的一序列已调制的符号，以及估计所述信息熵的度量包括估计在各组内所述信息熵的多个度量。接收所述序列包括接收在各个不同时隙内的所述多组符号。在公开的实施例中，估计所述信息熵的度量包括计算在所述各组中的所述符号的信噪比(SNR)，以及响应于各个SNR来计算所述信息熵的度量。

选择所述语音编码方案可包括对所述信息熵的度量取平均值，以及响应于所述信息熵的平均度量来选择所述语音编码方案。在一个实施例中，选择所述语音编码方案包括响应于所述信息熵的平均度量来计算等价的载波干扰(C/I)比，以及响应于所述等价的C/I比来选择所述语音编码方案。在另一个实施例中，选择所述语音编码方案包括响应于所述信息熵的平均度量来计算估计的误帧率(FER)，以及响应于所述估计的FER来选择所述语音编码方案。

在一些实施例中，估计所述信息熵的度量包括响应于所述信息熵的度量来估计所接收的信号的误帧率(FER)，并且选择所述语音编码方案包括预先定义目标FER值，以及选择所述语音编码方案使得所接收的信号的所述估计的FER满足所述目标FER值。

根据本发明的实施例，另外提供通信装置，该通信装置包括：

收发机，该收发机被配置成接收传送已编码的语音的已调制的信号；以及

处理器，该处理器被配置成估计与所接收的信号有关的信息熵的度量，响应于所估计的信息熵的度量来选择语音编码方案，以及经由所述收发机向发射机发送请求以利用所选择的语音编码方案来编码随后的语音。

根据本发明的实施例，还提供用于通信的方法，该方法包括：

接收传送已编码的语音的已调制的信号；

估计与所接收的信号相关联的信息熵的度量；

响应于所估计的信息熵的度量来估计所接收的信号的误块率；以及

响应于所估计的误块率来选择语音编码方案。

结合附图理解，从其中实施例的下面详细描述中将更充分理解本发明，其中：

附图说明

图1是示意地示出根据本发明的实施例的无线通信系统的框图；

图2是根据本发明的实施例将互信息(MI)示为信噪比(SNR)的函数的曲线；以及

图3是示意地示出根据本发明的实施例的用于选择语音编码方案的方法的流程图。

具体实施方式

一些语音通信系统利用一组多个语音编码方案，并且基于信道状况来选择在发射机和接收机之间使用的合适的方案。每种语音编码方案的特征在于一定的输出数据速率，并且提供在语音质量和通信鲁棒性之间的一定折衷。选择较低数据速率的语音编码方案实现改良的信道编码，由此以语音质量为代价提高通信鲁棒性，反之亦然。例如，在GERAN中的全速率AMR方案的输出数据速率范围在对良好信道状况的12.2Kbps和对不良信道状况的4.75Kbps之间。

按照惯例，期望的语音编码方案可基于由接收机测量的信噪比(SNR)或载波干扰比(CIR)来选择。然而，这些标准并不总是反映用户所经历的实际语音质量。例如，在给定SNR或CIR处的语音质量可能变化很大，取决于通信信道的不同传播特性，例如多路径等级或延迟传播。

语音编码过程通常产生一序列语音帧。另一个用于选择语音编码方案的可能标准是由接收机所接收的语音帧的误帧率，这个标准通常提供较好的语音质量指示。然而，按照惯例，可靠的FER测量通常包括测量大量语音帧中的语音帧的错误率。因为在许多应用中信道状况随时间而快速变化，大量帧的FER测量常常太慢以至于无法适应变化的信道状况。而且，直接FER测量常常依赖于所发送的语音帧的具体格式，并且可能并不适合。

在下文描述的本发明的实施方式提供用于选择合适的语音编码方案的改进的方法和系统，该语音编码方案用于将语音从发射机传送到接收机。在本文描述的方法和系统不直接测量FER，而是计算信息熵的度量，该信息熵的度量即使在短时间间隔内被测量和取平均值时也很好地表示FER。所计算的信息熵的度量可被容易地应用以产生CIR值。注意，根据一些蜂窝电信标准，语音编码方案基于CIR被选择。在本文描述了信息熵度量的几个示例，例如互信息(MI)和指数有效信号干扰和噪声比映射(EESM)。

根据实施例，收发机接收传送已编码的语音的已调制的信号。收发机估计与所接收的信号相关联的信息熵的度量，并且基于所估计的信息熵度量来选择合适的语音编码方案。在实施例中，基于所估计的信息熵度量来计算CIR值。此外或可选地，基于所估计的信息熵度量来估计信号的误块率(BLER)或FER。在一些实施例中，收发机向发射机发送请求以利用所选择的语音编码方案对随后的语音进行编码。

在本文描述的方法允许收发机基于精密地遵循实际FER的标准来选择合适的语音编码方案，而不考虑信道传播特性。采用这些方法的通信系统能够使它们的语音编码和信道编码配置适应快速变化的信道状况，同时保持期望的语音质量和用户体验。

图1是示意地示出根据本发明的实施例的无线通信系统20的框图。在系统20中，无线通信终端24(还被称为用户设备-UE)通过无线信道与基站(BS)28通信。系统20可符合任何合适的通信标准或协议。例如，系统可包括诸如全球移动通信系统(GSM)，通用移动通信业务(UMTS)或者GSM EDGE无线接入网(GERAN)系统之类的蜂窝通信系统。虽然为了清楚，下面的描述指单个BS和单个UE，但是系统20通常包括多个BS和多个UE。

从BS 28传送到UE 24的语音被提供至BS语音编码器/解码器(编解码器)32，该编解码器32利用从一组可能的编码方案中选择出的某个语音编码方案来编码语音。在这一组中的每个编码方案的特征在于一定的输出数据速率。例如，编解码器32可应用上面所引用的全速率AMR方案之一，其数据速率的范围在4.75和12.2Kbps之间。通常，编解码器32产生含有已编码的语音的一序列语音帧。

在图1的例子中，BS 28被示为有多个编解码器(CODEC)32，选择其中一个来编码给定的语音。然而，在许多实际情况下，BS包括可配置成应用所选择的方案的单个语音CODEC。在一些实施例中，CODEC可应用在不同编码方案中的相同编码，并且这些方案在语音被编码之后量化不同的信息的方式方面可彼此不同。例如，在一种语音编码方案中采用6比特量化可发送关键参数，在另一种方案中则采用3比特量化。

语音帧被提供至BS调制器/解调器(调制解调器)36，其调制已编码的语音来产生一序列已调制的符号。在一些实施例中，调制解调器36包括纠错码(ECC)编码器(在图中未显示)，该ECC编码器对已编码的语音应用信道编码。调制解调器36的输出符合在系统20的通信协议中所定义的格式。例如，在GSM或GERAN系统中，每个信道被划分为帧，帧进一步被划分为时隙，且指定用于给定UE的已调制的符号占据每个帧的特定时隙。

调制解调器36的输出被提供给BS无线频率前端(RF FE)40，该RFFE 40通常利用合适的数模转换器(DAC)将数字调制解调器输出转换为模拟信号，将模拟信号上变频至RF，并且将RF信号放大至合适的传输功率。如在本领域中已知的，RF FE还可执行诸如滤波和功率控制之类的功能。在RF FE 40的输出处的RF信号借助于BS天线44被发送到UE 24。

BS 28还包括BS处理器，BS处理器配置和控制BS的不同元件。具体地，如下面将更详细地说明的，处理器48指示语音编解码器32选择给定的语音编码方案。

从BS发送的RF信号由UE天线52在UE处接收，并且被提供至UERF FE 56。RF FE 56将所接收的RF信号下变频至合适的低频(例如，基带)，并且利用合适的模数转换器(ADC)来数字化信号。已数字化的信号被提供至UE调制解调器60，该UE调制解调器解调信号并且尝试重构提供至BS处的BS调制解调器36的语音帧。在一些实施例中，UE调制解调器包括ECC解码器(在图中未显示)，该ECC解码器解码由BS应用的信道码。已重构的语音帧被提供至UE语音编解码器64，该UE语音编解码器解码在每个帧中传送的已编码的语音。然后，已解码的语音被转换为声音，并且输出至用户。

UE 24还包括UE控制器68，改UE控制器68配置和控制UE的不同元件。具体地，控制器68利用在下文描述的方法，选择将被BS-28使用的用于向UE发送随后的语音的合适的语音编码方案。

如将在下面详细描述的，UE选择将被UE应用以用于编码随后的语音的合适的语音编码方案。UE通过计算与从BS接收的信号有关的信息熵(IE)的度量来选择合适的语音编码方案。UE向BS发出请求，请求BS利用所选方案来编码随后的语音。在一些实施例中，UE控制器68包括UE CODEC选择器66，该UE CODEC选择器计算IE度量，并且选择期望的语音编码方案。BS处理器48包括BS CODEC选择器67，该BS CODEC选择器控制语音CODEC 32以应用由UE请求的编码方案。

上面的描述指下行链路传输，即，从BS到UE的传输。在上行链路传输中，UE和BS的不同元件通常执行相反的功能。换句话说，UE编解码器64编码上链路语音以产生上链路语音帧，而UE调制解调器60调制和格式化上行链路信号，并且应用信道编码。UE RF FE将信号上变频为RF，并且经由UE天线52向BS发送信号。上行链路RF信号由BS天线44接收，由BS RF FE 40下变频，并由BS调制解调器36解调，该BS调制解调器还解码ECC。BS编解码器32解码上行链路语音帧以重构提供至UE处的编解码器64的语音。

在本文中描述的实施例主要处理在下行链路中的语音编码方案选择。在这些实施例中，基于由UE调制解调器60对所接收的下行链路信号执行的测量，UE控制器68选择将在下行链路中使用的合适的语音编码方案。然后，UE控制器向BS发出请求(通过上行链路)，请求BS利用所选方案来编码随后的下行链路语音。然而，在可替换的实施例中，本文所述的方法和系统可用在上行链路中。在这样的可选的实施例中，基于由BS调制解调器36对所接收的上行链路信号执行的测量，BS处理器选择用于上行链路的合适的语音编码方案。然后，BS处理器指示UE控制器在发送随后的上行链路语音时应用所选方案。

通常，BS处理器和UE控制器68包括通用处理器，该通用处理器用软件被编程以实现在本文中所描述的功能。软件可例如通过网络以电子形式下载至处理器，或者可替换地或另外地，软件可被提供或存储在诸如磁性、光学或者电子存储器之类的有形介质上。

UE 24和BS 28的配置是示例性配置，其纯粹为了概念上清楚而被选择。在可替换的实施例中，可使用任何其它合适的UE和BS配置。

本发明的实施例提供了用于选择语音编码方案的方法和系统，该语音编码方案将用于将语音从BS 28传送到UE 24。在随后的描述中，系统20包括使用AMR语音编码的GERAN系统。BS的下行链路传输包括一序列时间帧，每个时间帧都被划分为8个时隙。时隙还被称为脉冲串。指定用于给定UE的语音在多个时间帧内在每个时间帧内的特定脉冲串处被发送。通常，给定的已编码的语音帧在4个或8个脉冲串中发送。在一些实施例中，BS应用跳频，使得在不同的频率上发送不同的时间帧。

在大多数实际情况下，UE 24的用户所体验的语音质量与提供至UE语音编解码器64的语音帧的误帧率(FER)相关。(在本文中，语音帧有时也被称为语音块，且术语FER和误块率(BLER)在本文中可互换地使用。)因此，期望利用遵循语音帧的FER的标准来选择语音编码方案。

原则上，UE控制器68可能通过测量在每个脉冲串中的所接收的信号的信噪比(SNR)或载波干扰比(CIR)并接着对在几个脉冲串内的SNR取平均值来估计FER。然而，这类基于SNR平均的估计通常是不准确的，因为FER和SNR之间的关系通常是非线性的。一般地，在高SNR值的很宽范围内，FER为0，或者接近于0。然而，当SNR恶化而超出某个阙值时，在SNR值的很窄范围内FER急剧增加。(注意，术语SNR和CIR在本文中有时可互换地使用。这两个术语通常都被使用，并且指期望信号与不希望有的噪声、失真和/或干扰的各种其它比率。)

例如，考虑到一序列语音帧，大多数的语音帧以非常高的SNR被接收，只有一个或两个帧以边缘SNR被接收。在这种情景下，此帧序列的FER由具有边缘SNR的帧的小子集来控制。然而，测量每个脉冲串的SNR并接着对脉冲串级别的SNR取平均值将产生FER的不切实际的优良(低)的估计，因为大量的高脉冲串级别的SNR将控制平均SNR。实际上，这个帧序列的实际平均FER比由上述估计所预计的要高得多。

根据本文所描述的方法，UE控制器68不取原始SNR或CIR测量的平均值。替代地，UE控制器计算每个所接收的脉冲串的信息熵的度量，然后对信息熵度量取平均值。信息熵通常展示对SNR的非线性相关性，其类似于FER/SNR相关性。因此，平均信息熵度量产生了精密地遵循实际FER的估计，且不由过高的SNR来控制。相似的论点对于低SNR也成立，即，基于平均信息熵度量的估计将不由过低的SNR控制。

被表示为H(X)的信息熵是信息论中的已知概念，其量化与随机变量X有关的不确定性的量。在通信系统中，所接收的信号的信息熵量化信息内容的量，该信息内容是由于事先不知道所发送的信号的准确值而被遗漏的。换句话说，所接收的信号的信息熵表示最佳接收机能够从信号中解码的信息比特的数量。

不同于量化影响所接收的信号的噪声或失真量的诸如如CIR和SNR之类的度量，信息熵度量量化可能从所接收的信号中可提取的信息的量。诸如CIR和SNR的噪声和失真度量通常线性地依赖于噪声或失真的程度。另一方面，信息熵度量通常是不线性地依赖于噪声或失真的程度。

在SNR/CIR度量和信息熵度量之间的明显区别可用两种示例性情景来证明。例如，考虑一种情景，其中给定的所接收的信号的SNR/CIR从高值到非常高的值增加很大的量。首先因为可能从信号中可提取的比特数已经很高了，SNR/CIR的增加只会引起信号的任何信息熵度量的很小的增加。另一方面，考虑一种情景，其中SNR/CIR增加相同的量，但是从低值到高值。在后面的情景中，可能从信号中提取的信息比特数增加很多。因此，信号的任何信息熵度量将增加很多。

互信息(MI)量化所接收的信号Y对所发送的信号X的相关性的量，并且被定义为：

I (X, Y) = Σ_{y &Element; Y} Σ_{x &Element; X} p (x, y) \log (\frac{p (x, y)}{p_{1} (x) p_{2} (y)})

方程1

其中p(x，y)表示X和Y的联合概率分布。p1(x)和p₂(y)分别表示X和Y的边缘概率分布。

在一些实施例中，UE控制器68估计在每个脉冲串中的所发送和接收的信号的MI，并且使用所估计的MI值作为信息熵度量。UE控制器取在多个脉冲串上对MI值取平均值，从而产生FER的估计。然后，FER估计用作选择合适的语音编码方案的标准。根据实施例，FER估计可表示为CIR值。

在一些实施例中，UE处理器保持MI值到SNR值的预先计算出的映射。UE处理器接受与来自UE调制解调器60的不同脉冲串相对应的SNR测量，并且通过对脉冲串的所测量的SNR应用预先计算出的映射来确定每个脉冲串的MI。该映射可用各种方式来表示，例如使用MI值的查找表，使用函数表达式，或者任何其它合适的表达式。MI和SNR之间的关系依赖于用于发送信号的具体调制。因此，控制器68所使用的映射依赖于在下行链路中使用的调制。

图2是根据本发明的实施例将互信息(MI)示为信噪比(SNR)的函数的曲线。在本例子中，曲线70示出对于高斯最小频移键控(GMSK)或者二进制相位键控(BPSK)调制和加性高斯白噪声(AWGN)通信信道MI对SNR的相关性。如在图中所看到的，MI对SNR的相关性是非线性的，而更像FER对SNR的相关性。曲线70在大约SNR＝7dB处达到饱和。因此，当对MI值取平均值时，过高和/或过低的SNR值不能控制平均MI。作为结果，估计在每个脉冲串中的MI并接着对所估计的MI值取平均值产生了精密遵循实际可达到的误差特性的估计，即，FER，且不会被高或低的SNR偏斜。

图3是示意地示出根据本发明的实施例的用于选择语音编码方案的方法的流程图。本方法是在蜂窝电信的背景下描述的，该蜂窝电信与GSM标准兼容，并且以在接收步骤80UE 24接收传送已编码的语音的信号开始。根据实施例，信号作为一序列脉冲串而被发送。每个脉冲串起源于某个GERAN时隙，该时隙指定用于正被讨论的UE。脉冲串由RF FE56接收，并且由调制解调器60解调。调制解调器60在脉冲串SNR估计步骤84由估计在每个脉冲串中的SNR(或CIR)。调制解调器将脉冲串SNR值提供至UE控制器68。

调制解调器可采用任何合适的方式来估计脉冲串SNR。例如，在一些系统中，每个脉冲串包含已知的训练序列(例如，前同步码)。调制解调器可从已知的训练序列减去在给定脉冲串中接收到的训练序列，并且基于所接收的序列和已知序列之间的差异来估计SNR(例如通过计算噪声变化)。

可替换地，调制解调器可测量在给定脉冲串中的误比特概率(BEP)，然后将所测量的BEP转换为所估计的SNR，例如使用在这两个量之间的预定映射。例如，对于BPSK调制和无存储器的AWGN信道，可以示出BEP可被写为：

BEP = Q (\sqrt{2 SNR})

方程2

进一步可替换地，调制解调器可计算在脉冲串内的平均对数似然比(LLR)或LLR²，并且将这个值转换为估计的SNR，例如使用在这两个量之间的预定映射。例如，对于BPSK调制和无存储器的AWGN信道，可以示出LLR和SNR之间的关系可被写为：

SNR \approx \frac{\sqrt{1 + E ({LLR}^{2})} - 1}{4}

方程3

其中E(LLR²)表示LLR²的平均值。

对于每个脉冲串，UE控制器在转换步骤88将脉冲串SNR转换为相应的熵度量(例如MI值)。UE控制器基于所接收的脉冲串的熵度量估计下行链路语音帧的FER。在一些实施例中，控制器68对属于给定语音块(语音帧)的这组熵度量取平均值，从而在等价CIR计算步骤92产生语音块的等价CIR值。注意，等价CIR不由具有高或低的SNR值的脉冲串控制，因为它是通过对熵度量而不是SNR测量取平均值来计算的。

在一些实施例中，等价CIR可被定义为需要达到在AWGN信道中的期望FER的CIR值。换句话说，等价CIR实质上不明确信道类型(例如，信道传播特性)。可替换地，等价CIR可被定义为需要达到在任何其它预先定义的参考信道模型中的期望FER的CIR值，例如采用跳频和3Km/hUE速度的典型城市信道。在GSM术语中，这个参考信道模型被称为TU3。

UE控制器对不同的语音块重复步骤92，使得产生多个等价CIR值，一个值对应于每个语音块。然后，UE控制器在CIR平均步骤96对在多个语音块内的等价CIR值取平均值。步骤96的输出是平均CIR，该平均CIR通过取信息熵度量的平均值而获得。

现在，UE控制器基于平均CIR值在选择步骤100从一组可能的编码方案中选择语音编码方案。通常，高的平均CIR值将对应于高速率的语音编码方案，反之亦然。

在一些实施例中，UE控制器将平均CIR值的全部范围划分为对应于不同的可能语音编码方案的多个区间。UE控制器选择对应于在上面步骤100中计算得到的平均CIR所落入的区间的语音编码方案。可替换地，UE控制器可保持函数关系，或者任何其它类型的映射，其将平均CIR值映射到语音编码方案。

在选择所期望的语音编码方案之后，UE在请求步骤104通过上行链路向BS发送请求消息。消息请求BS使用在上面步骤100选择的语音编码方案，用于将随后的语音发送至UE。这个请求通常由BS处理器48来处理，该BS处理器配置BS语音编解码器32以应用所选择的编码方案。

在可替换的实施例中，UE控制器不必计算每个语音块的等价CIR值。例如，UE控制器可对在多个脉冲串内的信息熵度量取平均值，然后基于平均信息熵度量来计算FER的估计。接着可在多个语音块内对FER估计取平均值以产生平均CIR。进一步可替换地，UE控制器可基于平均信息熵度量应用任何其它合适的计算以用于选择合适的语音编码方案。

在一些通信系统中，属于给定语音块的脉冲串使用对角交错来分布在B个时间帧内。当利用对角交错时，每C个时间帧可利用一个新的语音块。例如，在使用全速率AMR语音编码的GERAN系统中，B＝8且C＝4。当在此类系统中实现所公开的方法时，UE控制器可将最后N个测量的脉冲串SNR值存储在具有如下结构的表格中：

1 2 3 4 5 6 7 8

语音块 SNR i SNR SNR SNR SNR SNR SNR SNR

1 i-1 i-2 i-3 i-4 i-5 i-6 i-7

语音块 SNR SNR SNR SNR SNR SNR SNR SNR

2 i-4 i-5 i-6 i-7 i-8 i-9 i-10 i-11

语音块 SNR SNR SNR SNR SNR SNR SNR SNR

3 i-8 i-9 i-10 i-11 i-12 i-13 i-14 i-15

语音块 SNR SNR SNR SNR SNR SNR SNR SNR

4 i-12 i-13 i-14 i-15 i-16 i-17 i-18 i-19

在本示例中，UE控制器以交错方式存储最后N＝20个脉冲串SNR。在这个阵列中，SNR i表示最近所测量的脉冲串SNR，SNR i-1表示前一个脉冲串SNR，依此类推。阵列的每一行对应于某个语音块。通常，阵列以循环方式填充，使得最新测量的脉冲串SNR覆写在阵列中的最老的SNR。

使用这种数据结构，UE控制器通过(1)将在阵列的给定行中的B个脉冲串SNR转换为各自的信息熵度量，(2)对每行中的信息熵度量取平均值，以及然后(3)对在多行上的平均信息熵度量取平均值，来执行图3的方法的步骤92和96。

可替换地，为了使用互信息(MI)，UE控制器可评估每个脉冲串的指数有效信号干扰和噪声比映射(EESM)函数，并使用这些值作为信息熵度量。EESM函数可被视为MI的近似，并且可被写为：

EESM (SNR) \approx 1 - e^{- \frac{SNR}{β}}

方程4

其中β表示参数。在不同工作条件下，不同的β值使得EESM函数更加精确地逼近MI函数。

例如，当使用BPSK调制时，对于具有低数据速率的AMR语音编码方案，范围在0.7-0.75的β值一般是优选的(即，提供MI函数的更好近似)。对于具有高数据速率的AMR语音编码方案，范围在0.8-0.85的β值一般是优选的。对于具有0.5码率的编码方案，范围在0.75-0.8的β值可产生更好的结果。可替换地，还可使用任何其它合适的β设置。

当使用EESM时，给定语音块的等价SNR(代替在图3的方法的步骤92计算的等价CIR)可被写为：

SNR_EQ＝EESM^-1{mean(EESM(SNR(burst_i)))} 方程5

换句话说，UE控制器基于所估计的脉冲串SNR计算不同脉冲串的EESM，对EESM取平均值，然后应用逆EESM函数以产生等价SNR。这个操作可被视为将所估计的SNR转换至EESM平面上，在EESM平面中求平均值，然后将结果转换回到SNR平面。

利用上面提到的EESM定义，等价块SNR可被写为：

{SNR}_{EQ} = - β \cdot 1 n [mean (e^{- \frac{SNR}{β}})]

方程6

上面所描述的实施例指将MI和EESM用作信息熵度量。然而，在可选的实施例，可使用任何其它合适的信息熵度量，例如基于所估计的容量的度量。在本文所描述的实施例主要处理与脉冲串的不同时隙相对应的熵度量。然而，可替换地，UE控制器可计算与任何其它合适的比特组相对应的熵度量，这些比特组指定用于正被讨论的UE。因此，在本文中描述的方法决不限于使用时分多址(TDMA)来区分开UE的通信系统，而是可用在其它类型的系统中，例如在不同频率上发送至不同UE的频分多址(FDMA)系统，以及利用不同代码序列发送至不同UE的码分多址(CDMA)系统。

当利用所公开的方法时，利用精密地与语音帧的FER有关的标准来选择合适的语音编码方案。例如，UE控制器可选择语音编码方案，使得FER保持在期望目标值附近(例如1％)，而不考虑信道状况和传播特性。因此，用户所感受的语音质量在期望水平上维持实质上不变。因为信息熵度量即使在短时期内被取平均也提供FER的可靠指示，所公开的方法很好地适合于传播特性随时间而快速变化的通信信道。

注意，上面所描述的实施例作为示例被引用，且本发明并不限于在上文中具体示出和说明的例子。更确切地，本发明的范围包括在上文中说明的不同特征的组合和子组合，以及本领域的技术人员在阅读前述说明时想到的和在现有技术没有公开的变化和修改。

Claims

1.一种用于通信的方法，包括：

接收传送已编码的语音的已调制的信号；

估计与所接收的信号相关联的信息熵的度量；

响应所估计的信息熵的度量来选择语音编码方案；以及

2.根据权利要求1所述的方法，其中，估计所述信息熵的度量包括估计所述所接收的信号的互信息(MI)。

3.根据权利要求1所述的方法，其中，估计所述信息熵的度量包括估计对所述所接收的信号计算的指数有效信号干扰和噪声比映射(EESM)函数。

4.根据权利要求1到3中任意一项所述的方法，其中，接收所述已调制的信号包括接收被划分为多个组的一序列已调制的符号，以及其中，估计所述信息熵的度量包括估计在各组内的所述信息熵的多个度量。

5.根据权利要求4所述的方法，其中，接收所述序列包括接收在各个不同时隙内的所述多组符号。

6.根据权利要求4所述的方法，其中，估计所述信息熵的度量包括计算在所述各组中的所述符号的信噪比(SNR)，以及响应于各个SNR来计算所述信息熵的度量。

7.根据权利要求4所述的方法，其中，选择所述语音编码方案包括对所述信息熵的度量取平均值，以及响应于所述信息熵的平均度量来选择所述语音编码方案。

8.根据权利要求7所述的方法，其中，选择所述语音编码方案包括响应于所述信息熵的平均度量来计算等价载波干扰(C/I)比，以及响应于所述等价C/I比来选择所述语音编码方案。

9.根据权利要求7所述的方法，其中，选择所述语音编码方案包括响应于所述信息熵的平均度量来计算估计的误帧率(FER)，以及响应于所述估计的FER来选择所述语音编码方案。

10.根据权利要求1到3中任意一项所述的方法，其中，估计所述信息熵的度量包括响应于所述信息熵的度量来估计所述所接收的信号的误帧率(FER)，并且其中，选择所述语音编码方案包括预先定义目标FER，以及选择所述语音编码方案使得所述所接收的信号的所述估计的FER满足所述目标FER值。

11.一种通信装置，包括：

收发机，所述收发机被配置成接收传送已编码的语音的已调制的信号；以及

处理器，所述处理器被配置成估计与所接收的信号相关联的信息熵的度量，响应于所估计的信息熵的度量来选择语音编码方案，以及经由所述收发机向发射机发送请求以利用所选择的语音编码方案来编码随后的语音。

12.根据权利要求11所述的装置，其中，所述信息熵的度量包括所述所接收的信号的互信息(MI)。

13.根据权利要求11所述的装置，其中，所述信息熵的度量包括对所述所接收的信号计算的指数有效信号干扰和噪声比映射(EESM)函数。

14.根据权利要求11到13中任意一项所述的装置，其中，所述收发机被配置成接收被划分为多个组的一序列已调制的符号，以及其中，所述处理器被配置成估计在各组内的所述信息熵的多个度量。

15.根据权利要求14所述的装置，其中，所述收发机被配置成接收在各个不同时隙内的所述多组符号。

16.根据权利要求14所述的装置，其中，所述处理器被配置成计算在所述各组中的所述符号的信噪比(SNR)，并且响应于各个SNR来计算所述信息熵的度量。

17.根据权利要求14所述的装置，其中，所述处理器配置成对所述信息熵的度量取平均值，并且响应于所述信息熵的平均度量来选择所述语音编码方案。

18.根据权利要求17所述的装置，其中，所述处理器被配置成响应于所述信息熵的平均度量来计算等价载波干扰(C/I)比，并且响应于所述等价C/I比来选择所述语音编码方案。

19.根据权利要求17所述的装置，其中，所述处理器被配置成响应于所述信息熵的平均度量来计算估计的误帧率(FER)，并且响应于所述估计的FER来选择所述语音编码方案。

20.根据权利要求11到13中任意一项所述的装置，其中，所述处理器被配置成响应于所述信息熵的度量来估计所述所接收的信号的误帧率(FER)，以及选择所述语音编码方案使得所述所接收的信号的所述估计的FER满足预先定义的目标FER值。

21.一种用于通信的方法，包括：

接收传送已编码的语音的已调制的信号；

估计与所接收的信号相关联的信息熵的度量；

响应于所估计的信息熵的度量来估计所述所接收的信号的误块率；以及

响应于所估计的误块率来选择语音编码方案。