CN105825860B

CN105825860B - 确定加权函数的设备和方法以及量化设备和方法

Info

Publication number: CN105825860B
Application number: CN201610304632.6A
Authority: CN
Inventors: 成昊相; 吴殷美
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2010-10-18
Filing date: 2011-10-18
Publication date: 2020-05-26
Anticipated expiration: 2031-10-18
Also published as: US20160225380A1; US9773507B2; EP3869508C0; EP2630641A2; SG10201401664XA; CN105741846B; WO2012053798A2; JP2018120241A; US20120095756A1; US20170358309A1; EP4195203A1; JP2016130868A; MY183019A; US10580425B2; MX342308B; JP6571827B2; JP5918249B2; SG189452A1; CA2814944C; JP2013541737A

Abstract

提出一种用于确定加权函数的设备和方法以及量化设备和方法。加权函数确定设备可将输入信号的中间子帧的LPC系数转换为导抗谱频率(ISF)系数和线谱频率(LSF)系数之一，并可基于转换后的ISF系数或LSF系数确定与ISF系数或LSF系数的重要性相关联的加权函数。

Description

确定加权函数的设备和方法以及量化设备和方法

本申请是申请日为2011年10月18日，申请号为“201180061021.9”，标题为“确定用于线性预测编码(LPC)系数量化的具有低复杂度的加权函数的设备和方法”的发明专利申请的分案申请。

技术领域

实施例涉及一种确定用于线性预测编码(LPC)系数量化的加权函数的设备和方法，更具体地讲，涉及一种用于确定具有低复杂度的加权函数以提高线性预测技术中的LPC系数的量化效率的设备和方法。

背景技术

在传统技术中，线性预测编码已应用于对语音信号和音频信号进行编码。码激励线性预测(CELP)编码技术已用于线性预测。CELP编码技术可使用激励信号和关于输入信号的线性预测编码(LPC)系数。当对输入信号进行编码时，可对LPC系数进行量化。然而，LPC的量化会具有窄的动态范围并且会难以确认稳定性。

另外，可在编码中选择用于恢复输入信号的码本索引。当使用相同的重要性对所有LPC系数进行量化时，在最终产生的输入信号的质量中会发生恶化。也就是说，由于所有LPC系数具有不同的重要性，因此当重要的LPC系数的误差小时，输入信号的质量会提高。然而，当通过应用相同的重要性而不考虑具有不同的重要性的LPC系数来执行量化时，输入信号的质量会恶化。

因此，存在对这样的方法的需求：当使用解码器恢复输入信号时，可有效地对LPC系数进行量化并可提高合成信号的质量。另外，存在对这样的技术的需求：可以以类似的复杂度具有良好的编码性能。

发明内容

技术方案

根据一个或多个实施例的一方面，提供一种用于提高线性预测编码中的量化效率的编码设备，所述设备包括：第一转换器，用于将输入信号的中间子帧的线性预测编码(LPC)系数转换为线谱频率(LSF)系数和导抗谱频率(ISF)系数之一；加权函数确定单元，用于使用转换后的ISF系数或LSF系数确定与中间子帧的LPC系数的重要性相关联的加权函数；量化单元，用于使用确定的加权函数对转换后的ISF系数或LSF系数进行量化；第二系数转换器，用于使用至少一个处理器将量化的ISF系数或LSF系数转换为量化的LPC系数，其中，量化的LPC系数被输出到编码设备的编码器。

加权函数确定单元可基于与从LPC系数转换的ISF系数或LSF系数的频率对应的插值的频谱幅度，确定关于ISF系数或LSF系数的加权函数。

加权函数确定单元可基于与从LPC系数转换的ISF系数或LSF系数的频率对应的LPC频谱幅度，确定关于ISF系数或LSF系数的加权函数。

根据一个或多个实施例的一方面，提供一种用于提高线性预测编码中的量化效率的编码方法，所述方法包括：将输入信号的中间子帧的线性预测编码(LPC)系数转换为线谱频率(LSF)系数和导抗谱频率(ISF)系数之一；使用转换后的ISF系数或LSF系数确定与中间子帧的LPC系数的重要性相关联的加权函数；使用确定的加权函数对转换后的ISF系数或LSF系数进行量化；使用至少一个处理器将量化的ISF系数或LSF系数转换为量化的LPC系数，其中，将量化的LPC系数输出到编码器。

所述确定的步骤可包括：基于与从LPC系数转换的ISF系数或LSF系数的频率对应的插值的频谱幅度，确定关于ISF系数或LSF系数的加权函数。

所述确定的步骤可包括：基于与从LPC系数转换的ISF系数或LSF系数的频率对应的LPC频谱幅度，确定关于ISF系数或LSF系数的加权函数。

根据一个或多个实施例，可通过将LPC系数转换为ISF系数或LSF系数从而对LPC系数进行量化，来提高LPC系数的量化效率。

根据一个或多个实施例，可通过确定与LPC系数的重要性相关联的加权函数来基于LPC系数的重要性提高合成信号的质量。

根据一个或多个实施例，可通过对用于对当前帧的LPC系数和先前帧的LPC系数进行量化以便对中间子帧的LPC系数进行量化的加权函数进行插值，来提高输入信号的质量。

根据一个或多个实施例，可通过将按照幅度的加权函数和按照频率的加权函数结合来提高LPC系数的量化效率并准确地导出LPC系数的权重。按照幅度的加权函数指示ISF或LSF实质上影响输入信号的频谱包络。按照频率的加权函数可使用频域的感知特性和共振峰分布。

根据一个或多个实施例的一方面，提供一种用于提高线性预测编码中的量化效率的编码设备，所述设备包括：加权函数确定单元，用于使用与线性预测编码(LPC)系数对应的导抗谱频率(ISF)系数或线谱频率(LSF)系数来确定与输入信号的中间子帧的LPC系数的重要性相关联的加权函数；量化单元，使用确定的加权函数对转换的ISF系数或LSF系数进行量化；第二系数转换器，用于将量化的ISF系数或LSF系数转换为量化的LPC系数，其中，量化的LPC系数被输出到编码设备的编码器。

根据一个或多个实施例的一方面，提供一种用于提高线性预测编码中的量化效率的编码方法，所述方法包括：使用与线性预测编码(LPC)系数对应的导抗谱频率(ISF)系数或线谱频率(LSF)系数，确定与输入信号的中间子帧的LPC系数的重要性相关联的加权函数；使用确定的加权函数对ISF系数或LSF系数进行量化；将量化的ISF系数或LSF系数转换为量化的LPC系数，其中，将量化的LPC系数输出到编码器。

根据一个或多个实施例的另一方面，提供至少一个存储用于实现一个或多个实施例的方法的计算机可读指令的非暂时性计算机可读介质。

附图说明

从下面结合附图的实施例的描述，这些和/或其它方面将变得更加清楚并更容易理解，其中：

图1示出根据一个或多个实施例的音频信号编码设备的配置；

图2示出根据一个或多个实施例的线性预测编码(LPC)系数量化器的配置；

图3a、图3b和图3c示出根据一个或多个实施例的对LPC系数进行量化的处理；

图4示出根据一个或多个实施例的通过图2的加权函数确定单元确定加权函数的处理；

图5示出根据一个或多个实施例的基于输入信号的编码模式和带宽信息确定加权函数的处理；

图6示出根据一个或多个实施例的通过转换LPC系数而获得的导抗谱频率(ISF)；

图7a和图7b示出根据一个或多个实施例的基于编码模式的加权函数；

图8示出根据其它一个或多个实施例的通过图2的加权函数确定单元确定加权函数的处理；

图9示出根据一个或多个实施例的中间子帧(mid-subframe)的LPC编码方案。

具体实施方式

现将详细参照实施例，实施例的示例在附图中示出，其中，相同的标号始终表示相同的元素。下面通过参照附图描述实施例以解释本公开。

图1示出根据一个或多个实施例的音频信号编码设备100的配置。

参照图1，音频信号编码设备100可包括预处理单元101、频谱分析器102、线性预测编码(LPC)系数提取和开环基音分析单元103、编码模式选择器104、LPC系数量化器105、编码器106、误差恢复单元107和比特流产生器108。音频信号编码设备100可应用于语音信号。

预处理单元101可对输入信号进行预处理。通过预处理，可完成用于编码的输入信号的准备。具体地讲，预处理单元101可通过高通滤波、预加重(pre-emphasis)和采样转换来对输入信号进行预处理。

频谱分析器102可通过时频映射处理分析关于输入信号的频域的特性。频谱分析器102可通过语音活动检测处理确定输入信号是活跃的信号还是静音。频谱分析器102可去除输入信号中的背景噪声。

LPC系数提取和开环基音分析单元103可通过输入信号的线性预测分析来提取LPC系数。一般来说，每一帧执行一次线性预测分析，然而，为了额外的语音增强可执行至少两次线性预测分析。在这种情况下，可执行一次对于帧尾的线性预测(即，现有线性预测分析)，可额外地执行剩余次数的用于声音质量提高的对于中间子帧的线性预测。当前帧的帧尾指示构成当前帧的子帧中的最后一个子帧，先前帧的帧尾指示构成上一帧的多个子帧中的最后一个子帧。

中间子帧指示在作为先前帧的帧尾的最后一个子帧与作为当前帧的帧尾的最后一个子帧之间的子帧中存在的至少一个子帧。因此，LPC系数提取和开环基音分析单元103总共可提取至少两个集合的LPC系数。

LPC系数提取和开环基音分析单元103可通过开环对输入信号的基音进行分析。分析的基音信息可用于搜索自适应码本。

编码模式选择器104可基于基音信息、频域的分析信息等来选择输入信号的编码模式。例如，可基于被分类为通用模式、有声模式、无声模式或过渡模式的编码模式对输入信号进行编码。

LPC系数量化器105可对由LPC系数提取和开环基音分析单元103提取的LPC系数进行量化。将参照图2至图9进一步描述LPC系数量化器105。

编码器106可基于选择的编码模块对LPC系数的激励信号进行编码。用于对LPC系数的激励信号进行编码的参数可包括自适应码本索引、自适应码本增益、固定码本索引、固定码本增益等。编码器106可基于子帧单位对LPC系数的激励信号进行编码。

当在输入信号的帧中发生误差时，误差恢复单元107可通过恢复或隐藏输入信号的帧来提取用于总体声音质量提高的边信息。

比特流产生器108可使用编码的信号产生比特流。在本实例中，比特流可用于存储或传输。

图2示出根据一个或多个实施例的LPC系数量化器的配置。

参照图2，可执行包括两个操作的量化处理。一个操作涉及对于当前帧或先前帧的帧尾的线性预测的执行。另一操作涉及用于声音质量提高的对于中间子帧的线性预测的执行。

关于当前帧或先前帧的帧尾的LPC系数量化器200可包括第一系数转换器202、加权函数确定单元203、量化器和第二系数转换器205。

第一系数转换器202可对通过执行输入信号的当前帧或先前帧的帧尾的线性预测分析而提取的LPC系数进行转换。例如，第一系数转换器202可将关于当前帧或先前帧的帧尾的LPC系数转换为线谱频率(LSF)系数和导抗谱频率(ISF)系数之一的格式。ISF系数或LSF系数指示可更容易地量化LPC系数的格式。

加权函数确定单元203可基于从LPC系数转换的ISF系数或LSF系数确定加权函数，其中，所述加权函数与关于当前帧的帧尾和先前帧的帧尾的LPC系数的重要性相关联。例如，加权函数确定单元203可确定按照幅度的加权函数和按照频率的加权函数。加权函数确定单元203可基于频带、编码模式和频谱分析信息中的至少一个确定加权函数。

例如，加权函数确定单元203可导出针对每个编码模式的最佳加权函数。加权函数确定单元203可基于输入信号的频带导出最佳加权函数。加权函数确定单元203可基于输入信号的频率分析信息导出最佳加权函数。频率分析信息可包括频谱倾斜信息。

可将使用加权函数确定单元203导出的用于对当前帧的帧尾的LPC系数进行量化的加权函数以及用于对先前帧的帧尾的LPC系数进行量化的加权函数传送到加权函数确定单元207，以便确定用于对中间子帧的LPC系数进行量化的加权函数。

将参照图4至图8进一步描述加权函数确定单元203的操作。

量化器204可使用关于从当前帧的帧尾的LPC系数或先前帧的帧尾的LPC系数转换的ISF系数或LSF系数的加权函数，对转换后的ISF系数或LSF系数进行量化。作为量化的结果，可导出关于当前帧的帧尾或先前帧的帧尾的量化的ISF系数或LSF系数的索引。

第二转换器205可将量化的ISF系数或量化的LSF系数转换为量化的LPC系数。使用第二系数转换器205导出的量化的LPC系数可不指示简单的频谱信息而指示反射系数(reflection coefficient)，因此可使用固定的权值。

参照图2，针对中间子帧的LPC系数量化器201可包括第一系数转换器206、加权函数确定单元207、量化器208和第二系数转换器209。

第一系数转换器206可将中间子帧的LPC系数转换为ISF系数或LSF系数之一。

加权函数确定单元207可使用转换后的ISF系数或LSF系数确定与中间子帧的LPC系数的重要性相关联的加权函数。

例如，加权函数确定单元207可通过对当前帧的参数和先前帧的参数进行插值来确定用于对中间子帧的LPC系数进行量化的加权函数。具体地讲，加权函数确定单元207可通过对第一加权函数和第二加权函数进行插值来确定用于对中间子帧的LPC系数进行量化的加权函数，其中，第一加权函数用于对先前帧的帧尾的LPC系数进行量化，第二加权函数用于对当前帧的帧尾的LPC系数进行量化。

加权函数确定单元207可使用线性插值和非线性插值中的至少一个来执行插值。例如，加权函数确定单元207可执行以下方案之一：将线性插值和非线性插值两者应用于所有阶(order)的矢量的方案、将线性插值和非线性插值不同地应用于每个子矢量的方案以及根据每个LPC系数不同地应用线性插值和非线性插值的方案。

加权函数确定单元207可使用关于当前帧的帧尾的第一加权函数和关于先前结束的帧尾的第二加权函数两者执行插值，并还可通过分析用于导出加权函数的等式并通过采用构成元素的部分来执行插值。例如，使用插值，加权函数确定单元207可获得用于确定按照幅度的加权函数的频谱信息。

作为一示例，加权函数确定单元207可基于插值的频谱幅度确定关于ISF系数或LSF系数的加权函数，其中，所述插值的频谱幅度与从LPC系数转换的ISF系数或LSF系数的频率对应。插值的频谱幅度可与通过对当前帧的帧尾的频谱幅度以及先前帧的帧尾的频谱幅度进行插值而获得的结果对应。具体地讲，加权函数确定单元207可基于频谱幅度确定关于ISF系数或LSF系数的加权函数，其中，所述频谱幅度与从LPC系数转换的ISF系数或LSF系数的频率以及该频率的邻近频率对应。加权函数确定单元207可基于频谱幅度的最大值、平均值或中值确定加权函数，所述频率幅度与从LPC系数转换的ISF系数或LSF系数的频率以及该频率的邻近频率对应。

将参照图5描述使用插值的频谱幅度确定加权函数的处理。

作为另一示例，加权函数确定单元207可基于LPC频谱幅度确定关于ISF系数或LSF系数的加权函数，其中，LPC频谱幅度与从LPC系数转换的ISF系数或LSF系数的频率对应。可基于作为从中间子帧的LPC系数转换的频率的LPC频谱确定LPC频谱幅度。具体地讲，加权函数确定单元207可基于频谱幅度确定关于ISF系数或LSF系数的加权函数，其中，所述频谱幅度与从LPC系数转换的ISF系数或LSF系数的频率以及该频率的邻近频率对应。加权函数确定单元207可基于频谱幅度的最大值、平均值或中值确定加权函数，其中，所述频率幅度与从LPC系数转换的ISF系数或LSF系数的频率以及该频率的邻近频率对应。

将参照图8进一步描述使用LPC频谱幅度确定关于中间子帧的加权函数的处理。

加权函数确定单元207可基于中间子帧的频带、编码模式信息和频率分析信息中的至少一个确定加权函数。频率分析信息可包括频谱倾斜信息。

加权函数确定单元207可通过将基于LPC频谱幅度和插值的频谱幅度中的至少一个确定的按照幅度的加权函数和按照频率的加权函数结合，来确定最终的加权函数。按照频率的加权函数可以是与从中间子帧的LPC系数转换的ISF系数或LSF系数的频率对应的加权函数。可通过bark尺度(bark scale)表示按照频率的加权函数。

量化器208可使用关于从中间子帧的LPC系数转换的ISF系数或LSF系数的加权函数，来对转换后的ISF系数或LSF系数进行量化。作为量化的结果，可导出关于中间子帧的量化的ISF系数或LSF系数的索引。

第二转换器209可将量化的ISF系数或量化的LSF系数转换为量化的LPC系数。使用第二系数转换器209导出的量化的LPC系数可不指示简单的频谱信息而指示反射系数，因此可使用固定的权值。

在下文中，将进一步描述LPC系数和加权函数之间的关系。

在时域上对语音信号和音频信号进行编码时可用的技术之一可包括线性预测技术。线性预测技术指示短期预测。可通过时域中的邻近采样点之间的相关性来表示线性预测结果，并可通过频域中的频谱包络来表示线性预测结果。

线性预测技术可包括码激励线性预测(CELP)技术。使用CELP技术的语音编码技术可包括G.729、自适应多速率(AMR)、AMR-宽带(WB)、增强型可变速率编解码器(EVRC)等。为了使用CELP技术对语音信号和音频信号进行编码，可使用LPC系数和激励信号。

LPC系数可指示邻近采样点之间的相关性，并可通过谱峰来表示LPC系数。当LPC系数具有16阶时，可最多导出16个采样点之间的相关性。可基于输入信号的带宽确定LPC系数的阶，并且通常可基于语音信号的特性确定LPC系数。可基于共振峰的幅度和位置确定输入信号的主要发声。为了表示输入信号的共振峰，可针对作为窄带的300Hz到3400Hz的输入信号使用10阶的LPC系数。可针对作为宽带的50Hz至7000Hz的输入信号使用16阶至20阶的LPC系数。

可由等式1来表示合成滤波器H(z)。

[等式1]

p＝10或16～20

其中，a_j表示LPC系数，p表示LPC系数的阶。

可由等式2来表示由解码器合成的合成信号。

[等式2]

其中，

表示合成信号，

表示激励信号，N表示使用相同的阶的编码帧的幅度。可使用自适应码本和固定码本的和来确定激励信号。解码设备可使用解码的激励信号和量化的LPC系数来产生合成信号。

LPC系数可表示被表示为谱峰的频谱的共振峰信息，并可用于对总频谱的包络进行编码。在此实例中，编码设备可将LPC系数转换为ISF系数或LSF系数，以便提高LPC系数的效率。

ISF系数可通过简单的稳定性确认来避免由量化引起的发散。当发生稳定性问题时，可通过调整量化的ISF系数的间隔来解决稳定性问题。LSF系数可具有与ISF系数相同的特性，LSF系数的最后一个系数是反射系数，与ISF系数不同。ISF或LSF是从LPC系数转换的系数，因此，可保持LPC系数的频谱的共振峰信息相同。

具体地讲，可在将LPC系数转换为导抗谱对(ISP)或线谱对(LSP)之后，执行LPC系数的量化，其中，ISP或LSP可具有窄动态范围，容易地确认稳定性，并容易地执行插值。可通过ISF系数或LSF系数来表示ISP或LSP。可通过等式3来表示ISF系数和ISP之间的关系或LSF系数和LSP之间的关系。

[等式3]

q_i＝cos(ω_i) n＝0，...，N-1

其中，q_i表示LSP或ISP，ω_i表示LSF系数或ISF系数。LSF系数可以是为量化效率而量化的矢量。LSF系数可以是为提高量效率而量化的预测矢量。当执行矢量量化时，并且当维数增加时，比特率会提高而码本大小会增加，从而降低处理速率。因此，可通过多级矢量量化或分裂式矢量量化减小码本大小。

矢量量化指示这样的处理：将矢量内的所有项看作具有相同的重要性的处理，并使用方差距离测量来选择具有最小误差的码本索引。然而，在LPC系数的情况下，所有系数具有不同的重要性，因此可通过减小重要系数的误差来提高最终的合成信号的感知质量。当对LSF系数进行量化时，解码设备可通过将表示每个LPC系数的重要性的加权函数应用于方差距离测量，来选择最佳码本索引。因此，可提高合成信号的性能。

根据一个或多个实施例，可基于ISF系数或LSF系数的实质频谱幅度和频率信息，针对对于频谱包络的每个ISF系数或lSF系数的实质影响确定按照幅度的加权函数。另外，可通过将按照频率的加权函数和按照幅度的加权函数结合来获得额外的量化效率。按照频率的加权函数基于共振峰分布和频域的感知特性。此外，由于使用实质频域幅度，因此可良好地使用所有频率的包络信息，并可准确地导出每个ISF系数或LSF系数的权值。

根据一个或多个实施例，当从LPC系数转换的ISF系数或LSF系数被矢量量化时，并且当每个系数的重要性不同时，可确定指示矢量内的相对重要项的加权函数。通过分析期望被编码的帧的频谱，并通过确定可将相对大的权重给予具有大的能量的部分的加权函数，可提高编码的准确性。大的频谱能量指示时域中的相关性高。

图3a、图3b和图3c示出根据一个或多个实施例的对LPC系数进行量化的处理。

图3a、图3b和图3c示出对LPC系数进行量化的两种类型的处理。当输入信号的可变性小时，图3a是可应用的。根据输入信号的特性，图3a和图3b可被切换，从而图3a和图3b是可应用的。图3示出对中间子帧的LPC系数进行量化的处理。

LPC系数量化器301可使用标量量化(SQ)、矢量量化(VQ)、分裂式矢量量化(SVQ)和多级矢量量化(MSVQ)对ISF系数进行量化，其中，它们同样可应用于LSF系数。

预测器302可执行自回归(AR)预测或移动平均(MA)预测。这里，预测阶表示大于或等于“1”的整数。

可通过等式4提供用于通过图3a的量化的ISF系数搜索码本索引的误差函数。可通过等式5表示用于通过图3b的量化的ISF系数搜索码本索引的误差函数。码本索引表示误差函数的最小值。

可通过等式6表示图3c的通过中间子帧的量化导出的在国际电信联盟电信标准化部(ITU-T)G.718中使用的误差函数。参照等式6，可使用ISF值

和ISF值

导出用于最小化关于中间子帧的量化误差的插值权重集的索引，其中，针对当前帧的帧尾对ISF值

进行量化，针对先前帧的帧尾对ISF值

进行量化。

[等式4]

[等式5]

[等式6]

这里，w(n)表示加权函数，z(n)表示从ISF(n)去除平均值的矢量，c(n)表示码本，p表示ISF系数的阶，并且在窄带中使用10，在宽带中使用16至20。

根据一个或多个实施例，编码设备可通过将按照幅度的加权函数和按照频率的加权函数结合来确定最佳加权函数，其中，按照幅度的加权函数使用与从LPC系数转换的ISF系数或LSF系数的频率对应的频谱幅度，按照频率的加权函数使用输入信号的感知特性和共振峰分布。

图4示出根据一个或多个实施例的通过图2的加权函数确定单元207确定加权函数的处理。

图4示出频谱分析器102的详细配置。频谱分析器102可包括插值器401和幅度计算器402。

插值器401可通过对作为频谱分析器102的执行结果的关于当前帧的帧尾的频谱幅度以及关于先前帧的帧尾的频谱幅度进行插值，来导出中间子帧的插值的频谱幅度。可通过线性插值或非线性插值导出中间子帧的插值的频谱幅度。

幅度计算器402可基于中间子帧的插值的频谱幅度计算频谱点(bin)的幅度。频谱点的数量可被确定为与和由加权函数确定单元207设置以便对ISF系数或LSF系数进行归一化的范围对应的频谱点的数量相同。

当加权函数确定单元207确定按照幅度的加权函数时，可使用作为由幅度计算器402导出的频谱分析信息的频谱点的幅度。

加权函数确定单元207可对从中间子帧的LPC系数转换的ISF系数或LSF系数进行归一化。在该处理期间，ISF系数的最后一个系数是反射系数，因此相同的权值可被应用。以上方案可不应用于LSF系数。在p阶ISF中，本处理可应用于0至p-2的范围。为了采用频谱分析信息，加权函数确定单元207可使用与由幅度计算器402导出的频谱点的数量相同的数量K来执行归一化。

加权函数确定单元207可基于经由幅度计算器402传输的频谱分析信息，确定影响关于中间子帧的频谱包络的ISF系数或LSF系数的按照幅度的加权函数W₁(n)。例如，加权函数确定单元207可基于ISF系数或LSF系数的频率信息和输入信号的实际频谱幅度，确定按照幅度的加权函数。可针对从LPC系数转换的ISF系数或LSF系数确定按照幅度的加权函数。

加权函数确定单元207可基于与ISF系数或LSF系数中的每个频率对应的频谱点的幅度，确定按照幅度的加权函数。

加权函数确定单元207可基于与ISF系数或LSF系数的每个频率对应的频谱点的幅度以及与该频谱区邻近的至少一个邻近频谱点的幅度，确定按照幅度的加权函数，。在本实例中，加权函数确定单元207可通过提取频谱点和至少一个邻近频谱点的代表值来确定与频谱包络相关联的按照幅度的加权函数。例如，代表值可以是与ISF系数或lSF系数的每个频率对应的频谱点以及与该频谱点邻近的至少一个邻近频谱点的最大值、平均值或中值。

例如，加权函数确定单元207可基于ISF系数或LSF系数的频率信息确定按照频率的加权函数W₂(n)。具体地讲，加权函数确定单元207可基于输入信号的感知特性和共振峰分布确定按照频率的加权函数。加权函数确定单元207可按照bark尺度提取输入信号的感知特性。加权函数确定单元207可基于共振峰分布的第一共振峰确定按照频率的加权函数。

作为一个示例，按照频率的加权函数可在极低频率和较高频率中示出相对低的权重，并在低频率的预定频带(例如，与第一共振峰对应的频带)中示出相同的权重。

加权函数确定单元207可通过将按照幅度的加权函数和按照频率的加权函数进行组合来确定最终的加权函数。加权函数确定单元207可通过将按照幅度的加权函数和按照频率的加权函数相乘或相加来确定最终的加权函数。

作为另一示例，加权函数确定单元207可基于输入信号的编码模式和频带信息确定按照幅度的加权函数和按照频率的加权函数，这将参照图5进一步描述。

图5示出根据一个或多个实施例的基于输入信号的编码模式和带宽信息确定加权函数的处理。

在操作501，加权函数确定单元207可确认输入信号的带宽。在操作502，加权函数确定单元207可确定输入信号的带宽是否与宽带对应。当输入信号的带宽不与宽带对应时，在操作511，加权函数确定单元207可确定输入信号的带宽是否与窄带对应。当输入信号的带宽不与窄带对应时，加权函数确定单元207可不确定加权函数。相反，当输入信号的带宽与窄带对应时，在操作512，加权函数确定单元207可使用通过操作503至510的处理来基于带宽处理相应的子块(例如，中间子帧)。

当输入信号的带宽与宽带对应时，在操作503，加权函数确定单元207可确认输入信号的编码模式。在操作504，加权函数确定单元207可确定输入信号的编码模式是否是无声模式。当输入信号的编码模式是无声模式时，在操作505，加权函数确定单元207可确定关于无声模式的按照幅度的加权函数，在操作506，加权函数确定单元207可确定关于无声模式的按照频率的加权函数，并在操作507，加权函数确定单元207可将按照幅度的加权函数和按照频率的加权函数结合。

相反，当输入信号的编码模式不是无声模式时，在操作508，加权函数确定单元207可确定关于有声模式的按照幅度的加权函数，在操作509，加权函数确定单元207可确定关于有声模式的按照频率的加权函数，在操作510，加权函数确定单元207可将按照幅度的加权函数和按照频率的加权函数结合。当输入信号的编码模式是一般模式或过渡模式时，加权函数确定单元2007可通过与有声模式相同的处理来确定加权函数。

例如，当输入信号是根据快速傅里叶变换(FFT)方案转换的频率时，可根据等式7确定使用FFT系数的频谱幅度的按照频率的加权函数。

[等式7]

Min＝w_j(n)的最小值

其中，

当n＝0,…,M-2,1≤norm_isf(n)≤126时，

W_f(n)=10log(max(E_bin(norm_isf(n)),E_bin(norm_isf(n)+1)，E_bin(norm_isf(n)-1)))

当norm_isf(n)＝0或127时，

W_f(n)=10log(E_bin(norm_isf(n)))

norm_isf(n)＝isf(n)/50，随后，0≤isf(n)≤6350且0≤norm_isf(n)≤127

图6示出根据一个或多个实施例的通过转换LPC系数而获得的ISF。

具体地讲，图6示出在输入信号根据FFT被转换到频域时的频谱结果、从频谱导出的LPC系数以及从LPC系数转换的ISF系数。当通过将FFT应用到输入信号而获得256个采样点时，并且当执行16阶线性预测时，可导出16个LPC系数，可将16个LPC系数转换为16个ISF系数。

图7a和图7b示出根据一个或多个实施例的基于编码模式的加权函数。

具体地讲，图7a和图7b示出基于图5的编码模式确定的按照频率的加权函数。图7a示出显示有声模式下的按照频率的加权函数的曲线图701，图7b示出显示无声模式下的按照频率的加权函数的曲线图702。

例如，可根据等式8确定曲线图701，并可根据等式9确定曲线图702。等式8和等式9中的常数可基于输入信号的特性而改变。

[等式8]

当norm_isf(n)＝[0,5]时，

当norm_isf(n)＝[6,20]时，W₂(n)＝1.0

当norm_isf(n)＝[21,127]时，

[等式9]

当norm_isf(n)＝[0,5]时，

当norm_isf(n)＝[6,127]时，

可根据等式10确定通过将按照幅度的加权函数和按照频率的加权函数结合而最终导出的加权函数。

[等式10]

当n＝0,…,M-2时，W(n)＝W₁(n)·W₂(n)

W(M-1)＝1.0

图8示出根据一个或多个实施例的通过图2的加权函数确定单元102确定加权函数的处理。

图8示出频谱分析器102的详细配置。频谱分析器102可包括频率映射器801和幅度计算器802。

频率映射器801可将中间子帧的LPC系数映射到频域信号。例如，频率映射器801可使用FFT、改进的离散余弦变换(MDST)等来对中间子帧的LPC系数进行频率变换，并可确定关于中间子帧的LPC频谱信息。在本实例中，当频率映射器801使用64点FFT而不是256点FFT时，可以以很小的复杂度执行频率变换。频率映射器801可使用LPC频谱信息确定中间子帧的频谱幅度。

幅度计算器802可基于中间子帧的频谱幅度计算频谱点的幅度。频谱点的数量可被确定为和与由加权函数确定单元207设置以对ISF系数或LSF系数进行归一化的范围对应的频谱点的数量相同。

当加权函数确定单元207确定按照幅度的加权函数时，可使用作为由幅度计算器802导出的频谱分析信息的频谱点的幅度。

以上参照图5描述了通过加权函数确定单元207确定加权函数的处理，因此在此将省略进一步的详细描述。

图9示出根据一个或多个实施例的中间子帧的LPC编码方案。

CELP编码技术可使用关于输入信号的LPC系数以及激励信号。当输入信号被编码时，LPC系数可被量化。然而，在对LPC系数进行量化的情况下，动态范围可以是宽的，并且不可容易地确认稳定性。因此，可将LPC系数转换为动态范围是窄的且可容易地确认稳定性的LSF(或LSP)系数或ISF(或ISP)系数。

在本实例中，转换为ISF系数或LSF系数的LPC系数为了量化的效率可被矢量量化。当在以上处理期间通过针对所有LPC系数应用相同的重要性来执行量化时，最终合成的输入信号的质量会发生恶化。具体地讲，由于所有的LPC系数具有不同的重要性，因此，当重要的LPC系数的误差小时，可提高最终合成的输入信号的质量。当通过应用相同的重要性而不使用对应的LPC系数的重要性执行量化时，输入信号的质量会恶化。加权函数可用于确定重要性。

一般来说，用于通信的语音编码器可包括5ms的子帧和20ms的帧。作为全球移动通信系统(GSM)和第三代合伙伙伴项目(3GPP)的语音编码器的AMR和AMR-WB可包括由四个5ms的子帧构成的20ms的帧。

如在图9中所示，可基于每个作为构成先前帧和当前帧的子帧中的最后一个帧的第四子帧(帧尾)执行一次LPC系数量化。可通过对关于先前帧的帧尾和当前帧的帧尾的量化的LPC系数进行插值，来确定当前帧的第一子帧、第二子帧和第三子帧的LPC系数。

根据一个或多个实施例，可为了声音质量提高，对通过在第二子帧中执行线性预测分析而导出的LPC系数进行编码。加权函数确定单元207可使用关于先前帧的帧尾的LPC系数和关于当前帧的帧尾的LPC系数，针对作为中间子帧的当前帧的第二帧使用闭环搜索最佳插值权重。可导出并发送使关于16阶LPC系数的加权失真最小化的码本索引。

关于16阶LPC系数的加权函数可用于计算加权失真。可通过等式11表示将使用的加权函数。根据等式11，通过分析ISF系数之间的间隔，可将相对大的权重应用于ISF系数之间具有窄间隔的部分。

[等式11]

当d_i<450时，

否则，

d_i＝f_i+1-f_i-1

如等式12所示，可额外应用低频加重(emphasis)。低频加重与包括线性函数的等式对应。

[等式12]

w_mid(15)＝2.0

根据一个或多个实施例，由于仅使用ISF系数或LSF系数之间的间隔导出加权函数，因此由于方案很简单使得复杂度较低。一般来说，在ISF系数之间的间隔窄的部分中频谱能量会高，因此对应分量是重要的概率会高。然而，当实质上执行频谱分析时，以上结果没有准确匹配的情况会频繁发生。

因此，提出了一种以类似的复杂度具有良好的性能的量化技术。第一个提出的方案可以是对先前帧信息和当前帧信息进行插值和量化的技术。第二个提出的方案可以是确定用于基于频谱信息对LPC系数进行量化的最佳加权函数的技术。

上述实施例可被记录在包括计算机可读指令(诸如，计算机程序)的非暂时性计算机可读介质，用于通过执行计算机可读指令来实现各种操作以控制作为通用计算机、计算装置、计算机系统或网络的部件的一个或多个处理器。所述介质还可在其上记录有单独的计算机可读指令、数据文件、数据结构等或它们的组合。记录在介质上的计算机可读指令可以是为实施例的目的而专门设计和构造的，或者它们可以是计算机软件领域的技术人员熟知和可用的。计算机可读介质还可被实现在至少一个专用集成电路(ASIC)或现场可编程门阵列(FPGA)中，ASIC和FPGA执行(像处理器一样处理)计算机可读指令。非暂时性计算机可读介质的示例包括：磁介质(诸如，硬盘、软盘和磁带)；光介质(诸如，CD ROM盘和DVD)；磁光介质(诸如，光盘)；专门配置为存储和执行计算机指令的硬件装置(诸如，只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。计算机可读指令的示例包括机器代码(诸如，由编译器产生的)和包含可由计算机使用解释器执行的高级代码的文件两者。所述硬件装置可被配置为用作一个或多个软件模块，以便执行上述实施例的操作，反之亦然。所述介质的另一示例还可以是分布式网络，从而，计算机可读指令以分布的方式被存储和执行。

虽然已示出和描述了所述，但本领域的技术人员将理解，在不脱离本公开的原理和精神的情况下，可在这些实施例中进行改变，本公开的范围由权利要求及其等同物限定。

Claims

1.一种用于确定在对包括语音信号和音频信号中的至少一个的信号的量化中使用的加权函数的设备，所述设备包括：

系数转换单元，被配置为从线性预测编码(LPC)系数获得所述信号的线谱频率(LSF)系数或导抗谱频率(ISF)系数；

幅度计算单元，被配置为基于所述信号的频谱确定频谱点的数量和频谱点的幅度；以及

加权函数确定单元，被配置为：基于确定的频谱点的数量对LSF系数或ISF系数进行归一化，并基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度来确定加权函数，

其中，LPC系数是从帧的帧尾子帧或中间子帧获得的。

2.如权利要求1所述的设备，其中，加权函数基于与ISF系数或LSF系数的频率相应的频谱点的幅度和至少一个相邻频谱点的幅度之中的最大值。

3.如权利要求1所述的设备，其中，加权函数基于所述信号的频谱包络。

4.如权利要求1所述的设备，其中，加权函数根据所述信号的带宽和编码模式中的至少一个而改变。

5.如权利要求1所述的设备，其中，加权函数是通过至少将第一加权函数和第二加权函数进行结合来确定的，其中，第一加权函数基于与ISF系数或LSF系数相应的频谱点的幅度，第二加权函数基于ISF系数或LSF系数的频率信息。

6.如权利要求5所述的设备，其中，频率信息基于所述信号的感知模型、所述信号的编码模式以及所述信号的带宽中的至少一个。

7.如权利要求5所述的设备，其中，频率信息基于与所述信号的编码模式相应的共振峰分布，其中，所述编码模式是基于信号特性而确定的。

8.一种用于确定在对包括语音信号和音频信号中的至少一个的信号的量化中使用的加权函数的方法，所述方法包括：

从线性预测编码(LPC)系数获得所述信号的线谱频率(LSF)系数或导抗谱频率(ISF)系数；

基于所述信号的频谱确定频谱点的数量和频谱点的幅度；

基于确定的频谱点的数量对LSF系数或ISF系数进行归一化；以及

由处理器执行以下操作：基于与归一化的ISF系数或归一化的LSF系数的频率相应的频谱点的幅度来确定加权函数。

9.如权利要求8所述的方法，其中，加权函数基于与ISF系数或LSF系数的频率相应的频谱点的幅度和至少一个相邻频谱点的幅度之中的最大值。

10.如权利要求8所述的方法，其中，加权函数基于所述信号的频谱包络。

11.如权利要求8所述的方法，其中，加权函数根据所述信号的带宽和编码模式中的至少一个而改变。

12.如权利要求8所述的方法，其中，加权函数是通过至少将第一加权函数和第二加权函数进行结合来确定的，其中，第一加权函数基于与ISF系数或LSF系数相应的频谱点的幅度，第二加权函数基于ISF系数或LSF系数的频率信息。

13.如权利要求12所述的方法，其中，频率信息基于所述信号的感知模型、所述信号的编码模式以及所述信号的带宽中的至少一个。

14.如权利要求13所述的方法，其中，频率信息基于与所述信号的编码模式相应的共振峰分布，其中，所述编码模式是基于信号特性而确定的。