CN102568489B - 编码器 - Google Patents

编码器 Download PDF

Info

Publication number
CN102568489B
CN102568489B CN201210012088.XA CN201210012088A CN102568489B CN 102568489 B CN102568489 B CN 102568489B CN 201210012088 A CN201210012088 A CN 201210012088A CN 102568489 B CN102568489 B CN 102568489B
Authority
CN
China
Prior art keywords
frequency
frequency components
scrambler
designator
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210012088.XA
Other languages
English (en)
Other versions
CN102568489A (zh
Inventor
L·拉克索南
M·塔米
A·瓦西拉彻
A·拉莫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Priority claimed from CN200780101913.0A external-priority patent/CN101896967A/zh
Publication of CN102568489A publication Critical patent/CN102568489A/zh
Application granted granted Critical
Publication of CN102568489B publication Critical patent/CN102568489B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

一种用于编码音频信号的编码器,其中所述编码器配置用于:定义单频分量的集合;从所述单频分量的集合的第一子集中选择至少一个单频分量。

Description

编码器
本发明是国际申请日为2007年11月6日、国际申请号为PCT/EP2007/061917、进入中国国家阶段日为2010年6月12日、国家申请号为200780101913.0、名称为“编码器”的发明专利申请的分案申请。
技术领域
本发明涉及编码,并且具体但非排他地,涉及语音或者音频编码。
背景技术
语音或音乐之类的音频信号被编码,例如以支持该音频信号的有效传输或存储。
音频编码器和解码器用来表示基于音频的信号,诸如音乐和背景噪声。这些类型的编码器通常没有将语音模型用于编码过程,而是使用用于表示所有类型的音频信号(包括语音)的过程。
语音编码器和解码器(编解码器)通常针对语音信号进行优化,并且可以按照固定比特率或者可变比特率进行操作。
音频编解码器还可以配置用于利用变化的比特率来操作。在较低比特率处,这种音频编解码器可以按照与纯语音编解码器等效的编码速率对语音信号进行操作。在较高比特率处,音频编解码器可以以较高的质量和性能来对任何信号进行编码,包括音乐、背景噪声和语音。
在某些音频编解码器中,输入信号被划分为有限数目的频带。每个频带信号可以被量化。根据心理声学的理论可知,频谱中的最高频率在感官上没有低频重要。这在某些音频编解码器中反映为比特分配,其中为高频信号分配的比特少于低频信号。
此外,在某些编解码器中,使用音频信号的低频与高频频带或者区域之间的相关来改进编解码器的编码效率。
由于频谱的较高频带通常非常类似于较低频带,因此某些编解码器可以仅对较低频带进行编码,并且将较高频带再现成经过缩放的较低频带的副本。由此,通过仅使用少量的附加控制信息,可以实现可观地节省编解码器的总比特率。
用于编码高频区域的一个此类编解码器公知为高频区域(HFR)编码。高频区域编码的一种形式是频带复制(SBR),其已经由CodingTechnologies开发。在SBR中,诸如移动图像专家组MPEG-4高级音频编码(AAC)或者MPEG-1 Layer III(MP3)编码器之类的已知音频编码器对低频区域进行编码。使用经过编码的低频区域来独立地生成高频区域。
在SBR编码中,通过将低频区域调换到高频来获得高频区域。调换是基于具有32个频带的正交镜像滤波器(QMF),并且被执行以从而预定义根据哪些频带样本来构造每个高频频带样本。这独立于输入信号的特性而完成。
基于附加信息对高频频带进行修改。进行滤波以使得经过合成的高频区域的特定特征与原始特征更为相似。向高频区域添加诸如正弦波或者噪声的附加分量,以增加与原始高频区域的相似度。最后,调节包络以符合原始高频频谱的包络。
然而,高频区域编码没有产生原始高频区域的等同副本。特别地,在输入信号为声调(换言之,不具有类似于噪声的频谱)的情况下,已知的高频区域编码机制的执行相对较弱。
发明内容
本发明的出发点基于以下考虑,即目前提出的编解码器缺少能够对信号进行有效编码和精确近似的灵活性。
本发明的实施方式旨在解决上述问题。
按照本发明的第一方面,提供一种用于编码音频信号的编码器,其中所述编码器配置用于:定义单频分量的集合;从所述单频分量的集合的第一子集中选择至少一个单频分量。
该编码器可以进一步配置用于:生成至少一个第一指示符以代表该至少一个选择的单频分量。
该编码器可以进一步配置用于:从所述单频分量的集合的至少第二子集中选择至少一个其他单频分量。
该编码器可以进一步配置用于:生成至少一个第二指示符以代表该至少一个选择的其他单频分量。
该编码器可以进一步配置用于:将所述单频分量的集合至少划分为单频分量的第一子集和第二子集。
该编码器可以进一步配置用于:根据所述集合内的所述单频分量的频率,将所述单频分量的集合至少划分为所述单频分量的第一子集和第二子集。
该编码器可以进一步配置用于:根据所述集合内的所述单频分量的感官重要性,将所述单频分量的集合至少划分为所述单频分量的第一子集和第二子集。
所述单频分量优选地是正弦波。
按照本发明的第二方面,提供一种用于编码音频信号的方法,包括:定义单频分量的集合;从所述单频分量的集合的第一子集中选择至少一个单频分量。
该方法可以进一步包括:生成至少一个第一指示符,以代表该至少一个选择的单频分量。
该方法可以进一步包括:从所述单频分量的集合的至少第二子集中选择至少一个其他单频分量。
该方法可以进一步包括:生成至少一个第二指示符以代表该至少一个选择的其他单频分量。
该方法可以进一步包括:将所述单频分量的集合至少划分为单频分量的第一子集和第二子集。
将所述单频分量的集合至少划分为所述单频分量的第一子集和第二子集可以根据所述集合内的所述单频分量的频率。
将所述单频分量的集合至少划分为所述单频分量的第一子集和第二子集可以进一步根据所述集合中的所述单频分量的感官重要性。
所述单频分量可以是正弦波。
按照本发明的第三方面,提供一种用于解码音频信号的解码器,其中所述解码器配置用于:接收至少一个指示符,其代表来自单频分量的集合的第一子集的至少一个单频分量;以及根据接收的所述指示符来插入所述单频分量。
该解码器可以进一步配置用于:接收至少一个其他指示符,其代表来自所述单频分量的集合的至少一个其他子集的至少一个其他单频分量;以及根据接收的所述其他指示符来插入所述其他单频分量。
该解码器可以进一步配置用于:接收符号指示符,其代表来自单频分量的集合的第一子集的该至少一个单频分量的符号。
按照本发明的第四方面,提供一种用于解码音频信号的方法,包括:接收至少一个指示符,其代表来自单频分量的集合的第一子集的至少一个单频分量;以及根据接收的所述指示符来插入所述单频分量。
该方法可以进一步包括:接收至少一个其他指示符,其代表来自所述单频分量的集合的至少一个其他子集的至少一个其他单频分量;以及根据接收的所述其他指示符来插入所述至少一个其他单频分量。
该方法可以进一步包括:接收符号指示符,其代表来自单频分量的集合的第一子集的该至少一个单频分量的符号。
按照本发明的第五方面,提供一种装置,包括如上所述的编码器。
按照本发明的第六方面,提供一种装置,包括如上所述的解码器。
按照本发明的第七方面,提供一种电子设备,包括如上所述的编码器。
按照本发明的第八方面,提供一种电子设备,包括如上所述的解码器。
按照本发明的第九方面,提供一种计算机程序产品,配置用于执行用于编码音频信号的方法,包括:定义单频分量的集合;从所述单频分量的集合的第一子集中选择至少一个单频分量。
按照本发明的第十方面,提供一种计算机程序产品,配置用于执行用于解码音频信号的方法,包括:接收至少一个指示符,其代表来自单频分量的集合的第一子集的至少一个单频分量;以及根据接收的所述指示符来插入所述至少一个单频分量。
按照本发明的第十一方面,提供一种用于编码音频信号的编码器,包括:用于定义单频分量的集合的装置;选择装置,用于从所述单频分量的集合的第一子集中选择至少一个单频分量。
按照本发明的第十二方面,提供一种用于解码音频信号的解码器,包括:接收装置,用于接收至少一个指示符,其代表来自单频分量的集合的第一子集的至少一个单频分量;以及插入装置,用于根据接收的所述指示符来插入所述单频分量。
按照本发明的第十三方面,提供一种用于编码音频信号的编码器,其中所述编码器配置用于:选择至少两个单频分量;生成指示符,所述指示符配置用于代表所述至少两个单频分量,并且配置为取决于这两个单频分量之间的频率间隔。
该编码器可以进一步配置用于:选择至少一个其他单频分量;其中所述指示符优选地进一步配置用于代表所述至少一个其他单频分量;并且其中所述指示符进一步优选地配置为取决于所述至少一个其他单频分量与所述至少两个单频分量之一之间的频率间隔。
所述指示符优选地进一步配置为取决于所述至少两个单频分量之一的频率。
该编码器可以进一步配置用于:确定两个单频分量之间的频率间隔。
该编码器可以进一步配置用于:在频率间隔值列表中搜索两个单频分量之间的已确定频率间隔;以及在所述列表中选择与所述两个单频分量之间的所述已确定频率间隔更接近匹配的一个频率间隔值,其中所述指示符取决于所述频率间隔值列表中选择的一个频率间隔值。
该编码器可以进一步配置用于:确定所述频率间隔值列表中选择的一个频率间隔值与所述已确定频率间隔值之间的差异;其中所述指示符优选地进一步取决于所述差异。
该编码器可以进一步配置用于:在另一差异值列表中搜索所述频率间隔值列表中选择的一个频率间隔值与所述已确定频率间隔值之间的已确定差异;在所述另一差异值列表中选择与所述已确定差异更接近匹配的一个差异值,其中所述指示符优选地取决于所述另一差异值列表中选择的一个差异值。
按照本发明的第十四方面,提供一种用于编码音频信号的方法,包括:选择至少两个单频分量;生成指示符,所述指示符配置用于代表所述至少两个单频分量,并且配置为取决于这两个单频分量之间的频率间隔。
该方法可以进一步包括:选择至少一个其他单频分量;其中所述指示符优选地进一步配置用于代表所述至少一个其他单频分量;并且其中所述指示符进一步优选地配置为取决于所述至少一个其他单频分量与所述至少两个单频分量之一之间的频率间隔。
所述指示符可以进一步取决于所述至少两个单频分量之一的频率。
该方法可以进一步包括:确定两个单频分量之间的频率间隔。
该方法可以进一步包括:在频率间隔值列表中搜索两个单频分量之间的已确定频率间隔;以及在所述列表中选择与所述两个单频分量之间的所述已确定频率间隔更接近匹配的一个频率间隔值,其中所述指示符取决于所述频率间隔值列表中选择的一个频率间隔值。
该方法可以进一步包括:确定所述频率间隔值列表中选择的一个频率间隔值与所述已确定频率间隔值之间的差异;其中所述指示符优选地进一步取决于所述差异。
该方法可以进一步包括:在另一差异值列表中搜索所述频率间隔值列表中选择的一个频率间隔值与所述已确定频率间隔值之间的已确定差异;在所述另一差异值列表中选择与所述已确定差异更接近匹配的一个差异值,其中所述指示符优选地取决于所述另一差异值列表中选择的一个差异值。
按照本发明的第十五方面,提供一种用于解码音频信号的解码器,其中所述解码器配置用于:接收代表至少两个单频分量的至少一个指示符,其中所述指示符代表两个单频分量之间的频率间隔;以及根据接收的所述指示符来插入所述至少两个单频分量。
所述至少一个指示符优选地进一步配置用于代表至少一个其他单频分量,所述指示符优选地进一步配置为取决于所述至少一个其他单频分量与所述至少两个单频分量之一之间的频率间隔;并且所述解码器优选地进一步配置用于:根据所述指示符来插入所述至少一个其他单频分量。
按照本发明的第十六方面,提供一种用于解码音频信号的方法,包括:接收代表至少两个单频分量的至少一个指示符,其中所述指示符代表两个单频分量之间的频率间隔;以及根据接收的所述指示符来插入所述至少两个单频分量。
所述至少一个指示符优选地进一步配置用于代表至少一个其他单频分量,所述指示符优选地进一步配置为取决于所述至少一个其他单频分量与所述至少两个单频分量之一之间的频率间隔;并且所述方法可以进一步包括:根据所述指示符来插入所述至少一个其他单频分量。
按照本发明的第十七方面,提供一种装置,包括如上所述的编码器。
按照本发明的第十八方面,提供一种装置,包括如上所述的解码器。
按照本发明的第十九方面,提供一种电子设备,包括如上所述的编码器。
按照本发明的第二十方面,提供一种电子设备,包括如上所述的解码器。
按照本发明的第二十一方面,提供一种计算机程序产品,配置用于执行用于编码音频信号的方法,包括:选择至少两个单频分量;生成指示符,所述指示符配置用于代表所述至少两个单频分量,并且配置为取决于两个单频分量之间的频率间隔。
按照本发明的第二十二方面,提供一种计算机程序产品,配置用于执行用于解码音频信号的方法,包括:接收代表至少两个单频分量的至少一个指示符,其中所述指示符代表两个单频分量之间的频率间隔;以及根据接收的所述指示符来插入所述至少两个单频分量。
按照本发明的第二十三方面,提供一种用于编码音频信号的编码器,包括:选择装置,用于选择至少两个单频分量;指示生成装置,用于生成指示符,所述指示符配置用于代表所述至少两个单频分量,并且配置为取决于两个单频分量之间的频率间隔。
按照本发明的第二十四方面,提供一种用于解码音频信号的解码器,包括:接收装置,用于接收代表至少两个单频分量的至少一个指示符,其中所述指示符代表两个单频分量之间的频率间隔;以及插入装置,用于根据接收的所述指示符来插入所述至少两个单频分量。
附图说明
为了更好地理解本发明,现在将以示例的方式参考附图,其中:
图1示意性地示出了采用本发明实施方式的电子设备;
图2示意性地示出了采用本发明实施方式的音频编解码器系统;
图3示意性地示出了图2中所示的音频编解码器系统的编码器部分;
图4示出了图3中所示的编码器的高频区域编码器部分的示意图;
图5示意性地示出了音频编解码器系统的解码器部分;
图6示出了说明按照本发明的、图3和图4中所示的音频编码器的实施方式的操作的流程图;
图7示出了说明按照本发明的、图5中所示的音频解码器的实施方式的操作的流程图;
图8示出了按照本发明实施方式的音频信号的频谱表示、插入的正弦波位置以及正弦波位置的编码的示例;以及
图9示出了按照本发明实施方式的音频信号的频谱表示以及插入的正弦波位置的其他示例。
具体实施方式
下面较为详细地描述用于提供分层式或者可伸缩可变码率音频编解码器的可行编解码机制。在此方面,首先参考图1,其示出了可以包含按照本发明实施方式的编解码器的示例性电子设备10的示意框图。
电子设备10例如可以是无线通信系统的移动终端或者用户设备。
电子设备10包括麦克风11,其经由模数转换器(ADC)14链接至处理器21。处理器21进一步经由数模转换器(DAC)32链接至扬声器33。处理器21进一步链接至收发机(TX/RX)13、用户接口(UI)15以及存储器22。
处理器21可以配置用于执行各种程序代码。实现的程序代码包括音频编码代码,用于对音频信号的低频频带和音频信号的高频频带进行编码。实现的程序代码23还包括音频解码代码。实现的程序代码23例如可以存储在存储器22中,以供处理器21在需要时随时取回。存储器22还可以提供部分24以用于存储数据,例如已经按照本发明进行编码的数据。
在本发明的实施方式中,编码和解码代码可以实现在硬件或固件中。
用户接口15使用户能够例如经由小键盘来向电子设备10输入命令,和/或例如经由显示器来从电子设备10获得信息。收发机13允许例如经由无线通信网络来与其他电子设备进行通信。
将会再次理解,电子设备10的结构可以按照多种方式来补充和变化。
电子设备10的用户可以使用麦克风11来输入语音,该语音将被传输至某些其他电子设备,或者将被存储在存储器22的数据部分24中。为此,用户已经经由用户接口15激活了相应的应用。该应用可以由处理器21来运行,其致使处理器21执行存储器22中所存储的编码代码。
模数转换器14将输入模拟音频信号转换为数字音频信号,并且向处理器21提供该数据音频信号。
处理器21继而可以按照与参考图2和图3描述的相同方式来处理数字音频信号。
得到的比特流被提供给收发机13,以便向另一电子设备传输。备选地,编码的数据可以存储在存储器22的数据部分24中,例如以供稍后传输或者稍后由同一电子设备10来呈现。
电子设备10还可以经由其收发机13从另一电子设备接收具有相应编码的数据的比特流。在这种情况下,处理器21可以执行存储器22中所存储的解码程序代码。处理器21解码接收的数据,并且将解码的数据提供给数模转换器32。数模转换器32将数字解码的数据转换为模拟音频数据,并且经由扬声器33将其输出。解码程序代码的执行同样可以由已由用户经由用户接口15调用的应用来触发。
接收的已编码数据也可以存储在存储器22的数据部分24中而不是经由扬声器33立即呈现,以便例如允许稍后呈现或者向又一电子设备转发。
将会理解,图2到图4中描述的示意性结构以及图7和图8中的方法步骤只代表被示例性示出为在图1中所示的电子设备中实现的完整音频编解码器的部分操作。
图2中示出了本发明的实施方式所采用的音频编解码器的一般性操作。如图2中示意性示出的,一般性的音频编码/解码系统包括编码器和解码器。示出了一个系统102,其具有编码器104、存储或者媒体信道106以及解码器108。
编码器104对输入音频信号110进行压缩以产生比特流112,其被存储或者通过媒体信道106进行传输。比特流112可以在解码器108内接收。解码器108解压缩比特流112并且产生输出音频信号114。比特流112的比特率以及输出音频信号114关于输入信号110的质量是主要的特征,其定义了编码系统102的性能。
图3示意性地示出了按照本发明一个实施方式的编码器104。编码器104包括输入203,其被布置用于接收音频信号。输入203连接至低通滤波器230以及高通/带通滤波器235。低通滤波器230还向低频区域(LFR)编码器(或者称为核心编解码器)231输出信号。低频区域编码器231配置用于向高频区域(HFR)编码器232输出信号。高通/带通滤波器235连接至HFR编码器232。LFR编码器231和HFR编码器232配置用于向比特流格式化器234(其在本发明的某些实施方式中也称为比特流多路复用器)输出信号。比特流格式化器234配置用于经由输出205对输出比特流112进行输出。
在本发明的某些实施方式中,高通/带通滤波器235可以是可选的,并且音频信号被直接传递至HFR编码器232。
这些组件的操作将结合示出编码器104的操作的图6的流程图加以详述。
音频信号由编码器104接收。在本发明的第一实施方式中,音频信号是数字采样的信号。在本发明的其他实施方式中,音频输入可以是例如来自麦克风6的模拟音频信号,其被进行模数(A/D)转换。在本发明的又一些实施方式中,将音频输入从脉冲编码调制数字信号转换为幅度调制数字信号。音频信号的接收在图6中由步骤601示出。
低通滤波器230和高通/带通滤波器235接收音频信号,并且定义对输入信号110进行滤波的截止频率。接收的截止频率之下的音频信号频率由低通滤波器230向低频区域(LFR)编码器231传递。接收的截止频率之上的音频信号频率由高通滤波器235向高频区域(HFR)编码器232传递。在本发明的某些实施方式中,可选地对信号进行下采样,以便进一步改进低频区域编码器231的编码效率。
LFR编码器231接收低频(并且可选地经过下采样的)音频信号,并且对该信号应用适当的低频编码。在本发明的第一实施方式中,低频编码器231应用量化和具有32个低频子带的霍夫曼(Huffman)编码。使用分析滤波器组结构将输入信号110划分为若干子带。可以使用心理声学模型提供的信息对每个子带进行量化和编码。量化设置以及编码方案可以由所应用的心理声学模型来指示。将经过量化、编码的信息发送至比特流格式化器234,以用于创建比特流112。
此外,LFR编码器231使用修正的离散余弦变换(MDCT)对低频内容进行转换,以产生合成LFR信号的频域实现。这些频域实现被传递至HFR编码器232。
该低频区域编码在图6中由步骤606示出。
在本发明的其他实施方式中,可以采用其他低频编解码器,以便生成向比特流格式化器234输出的核心编码输出。这些其他实施方式的低频编解码器的示例包括但不限于:高级音频编码(AAC)、MPEG Layer 3(MP3)、ITU-T嵌入式可变速率(EV-VBR)语音编码基线编解码器以及ITU-T G.729.1。
在低频区域编码器231没有有效地输出作为编码过程的一部分的频域合成输出的情况下,低频区域(LFR)编码器231可以进一步包括低频解码器和频域转换器(图3中未示出)以生成低频信号的合成再现。并且在本发明的实施方式中,该低频信号的合成再现继而被转换为频域表示,并且在需要的情况下被分割为向HFR编码器232发送的一系列低频子带。
在本发明的实施方式中,这允许从很多可行编码器/解码器中选择低频区域编码器231,由此本发明不限于产生频域信号作为输出的一部分的特定低频或者核心编码算法。
高频区域(HFR)编码器232在图4中更为详细地示出。
高频区域编码器232从高通/带通滤波器235接收信号,这被输入到修正的离散余弦变换(MDCT)/移位离散傅里叶变换(SDFT)处理器301。
来自MDCT/SDFT变换器301的频域输出被传递至音调选择控制器303、高频区域(HFR)频带复制选择处理器305、高频区域频带复制缩放处理器307以及正弦波注入选择/编码处理器309。
音调选择控制器303配置用于控制或者配置HFR频带复制选择处理器305、HFR频带复制缩放处理器307、正弦波注入选择/编码处理器309以及多路复用器311。此外,HFR频带复制选择处理器305从LFR编码器231接收频域形式的合成低频区域信号。HFR频带复制选择处理器305输出来自LFR编码器的选定HFR频带(这将在后文描述),并且将该选择传递至HFR频带复制缩放处理器307。
HFR频带复制缩放处理器305向多路复用器311传输已编码形式的选择和缩放元素,以便插入在数据流112中。此外,HFR频带复制缩放处理器307还向正弦波注入选择/编码处理器309传递选择和缩放的HFR区域的表示。正弦波注入选择/编码处理器309还向多路复用器311传递信号以便包括在输出数据流112中。
现在将参考图6和图4详细阐释HFR编码器是如何操作的。
MDCT/SDFT处理器301将接收自HP/BP滤波器235的高频区域音频信号转换为该信号的频域表示。
在本发明的某些实施方式中,MDCT/SDFT处理器还将高频音频信号划分为较短的子频带。这些子频带可以为500-800Hz量级的宽度。在本发明的某些实施方式中,子频带具有不相等的频带宽度。在另一实施方式中,子频带的带宽为750Hz。在本发明的其他实施方式中,相等或者不等的子频带带宽取决于高频区域的带宽分配。
在本发明的第一实施方式中,子频带带宽是恒定的。换言之,帧之间不存在改变。在本发明的其他实施方式中,子频带带宽不是恒定的,并且子频带可以具有随时间改变的带宽。
在本发明的某些实施方式中,该可变子带带宽分配可以基于音频信号的心理声学建模来确定。而且,在本发明的各实施方式中,这些子带可以是连续的(换言之,一个接一个,并且产生连续谱实现)或者是部分重叠的。
时域到频域变换以及子带组织步骤在图6中由步骤607示出。
音调选择控制器303可以配置用于控制HFR频带复制选择、缩放、正弦波注入选择和编码以及多路复用,以便可以执行对高频区域的更为有效的编码。
在音调选择控制器303处接收来自MDCT/SDFT处理器301的移位离散傅里叶变换输出。
公式1示出了针对两个N样本而定义的移位离散傅里叶变换(SDFT)的一个示例(其可以认为是用于本发明优选实施方式的帧):
Y ( k ) = Σ n = 0 2 N - 1 h ( n ) x ( n ) exp ( i 2 π ( n + u ) ( k + v ) / 2 N ) - - - 1
其中h(n)是缩放窗口,x(n)是原始输入信号,而u和v分别表示时域和频域移位。
在本发明的一个实施方式中,由于所选SDFT变换的实数部分也可以用作MDCT变换,因此可以选择u和v使得u=(N+1)/2并且v=1/2。因此,这允许在单个时域到频域操作中实现MDCT变换器和SDFT变换器,并因此降低了设备的复杂性。
音调选择控制器303可以配置用于检测输入的高频区域信号是正常的还是音调。音调选择控制器303可以通过将当前帧和先前帧的SDFT输出进行比较来确定信号的特性。
例如,如果当前和先前SDFT帧分别定义为Yb(k)和Yb-1(k),则帧之间的相似度可以通过索引S来测量。S在公式2中定义。
S = Σ k = N L + 1 N ( | Y b ( k ) | - | Y b - 1 ( k ) | ) 2 Σ k = N L + 1 N ( | Y b ( k ) | ) 2 - - - 2
其中NL+1对应于高频编码的限制频率。参数S越小,高频频谱就越相似。
音调选择控制器可以包括决策逻辑,其基于S的值来指派信号特性或者模式。此外,信号的特性或模式还用于控制HFR编码器的其余部分,这将在下文详述。
下面示出定义音频信号的两个特性或者模式的本发明实施方式。这些特性或者模式是正常的或者是音调。
如果S的值大于或者等于预定阈值Sllm,则音调选择控制器303中的决策逻辑可以配置用于指派正常的特性(其可以向HFR编码器的其余部分指示:将使用正常编码,并且可能与某些正弦波插入一起使用)。
如果S的值小于预定阈值Sllm,则音调选择控制器303中的决策逻辑可以进一步配置用于指派音调的特性(其可以向HFR编码器的其余部分指示:可以仅使用正弦波插入来对音频信号进行编码)。
尽管已经描述了两个操作模式,但是将会理解,音调选择控制器可以具有多于两个可能的操作模式(可指派的特性),其中的每一个使用预定义的阈值区域,并且每一个向HFR编码器的其余部分提供有关如何对音频信号进行编码的指示符。
音调选择控制器303向多路复用器传递指派给当前帧的特性或者模式,以提供有关已经选择了哪个操作模式的指示,以便该指示也可以被传递给解码器。
由于模式的数目通常将较低,因此编码这些操作模式所需的比特的数目同样较低。
音调检测模式选择在图6中由步骤609示出。
下面的示例描述了如下情况:音调选择控制器303指示音调特性针对当前帧而定义,并且执行了频带复制选择(图6的步骤611)、频带复制缩放(图6的步骤613)以及正弦波注入和编码(图6的步骤615)的操作。
如果音调选择控制器303指示音频信号是音调,则不执行频带复制选择或者频带复制缩放操作,而仅执行正弦波注入和编码操作。为复制选择和复制缩放操作而预留的比特分配可以用于附加正弦波的选择和编码。
如果音调选择控制器303指示音频信号是正常的,则执行频带复制选择和频带复制缩放操作。正常模式的性能可以通过正弦波注入而进一步改进。
HFR频带复制选择器305接收高频区域的每个子频带的频谱分量以及低频区域已编码信号的频域表示,并且从低频区域部分中选择哪个与每个高频区域子带相匹配。
在本发明的某些实施方式中,子带能量用来确定最接近匹配的低频区域子带。
在本发明的其他实施方式中,确定高频区域子带的不同或者附加属性,并将其用于搜索匹配的低频区域部分。其他属性包括但不限于:每个子带的峰谷能量比以及信号带宽。
在本发明的某些实施方式中,在HFR频带复制选择器305中对音频信号的分析包括对已编码低频区域的分析以及对原始高频区域的分析。因此,在本发明的又一些实施方式中,能量估计器通过接收已编码低频信号并将其划分为有待分析的短子带来确定有效完整频谱的属性,以便例如确定每个“完整”频谱子带的能量和/或每个“完整”频谱子带的峰谷能量比。
在本发明的又一些实施方式中,能量估计器还接收已编码低频信号,并且(在需要的情况下)将其划分为待分析的短子带。继而,按照与对高频域信号相同的方式对从编码器输出的低频域信号进行分析,例如以确定每个低频域子带的能量和/或每个低频域子带的峰谷能量比。
在本发明的一个实施方式中,HFR频带复制选择器305可以执行对低频频谱值的选择,这些低频频谱值可以被调换以形成高频频谱值的可接受复制。将在例如WO 2007/052088中详述的方法中使用的频带的数目和宽度可以是固定的,或者可以在HFR频带复制选择器305中确定。
相关LFR频谱值的选择在图6中由步骤611示出。
此外,HFR频带复制缩放器307接收选择的低频频谱值,并且确定是否可以对这些值进行缩放以降低每个高频区域子频带与选择的低频频谱值之间的差异。
在本发明的某些实施方式中,HFR频带复制缩放器307可以执行诸如缩放因子量化之类的编码,以减少需要向解码器发送的比特数目。向多路复用器311传递用来得到经过缩放的所选LFR频谱值的缩放因子的指示。此外,向正弦波注入选择/编码设备309传递经过缩放的所选LFR频谱值的副本。
复制缩放在图6中由步骤613示出。
由正弦波注入和编码器309执行的正弦波注入和编码的概念是为了通过添加正弦波、使用LFR信号分量来改善HFR编码的保真度。添加至少一个正弦波可以改进编码的精度。
例如,如果和XH(ki)分别表示当前编码的高频区域频谱和原始的高频区域频谱,则正弦波注入和编码器309可以在根据公式3获得的频谱索引k1处添加第一正弦波:
换言之,可以在具有原始高频区域频谱值与已编码高频区域频谱值之间最大差异的索引处插入正弦波。
此外,正弦波注入和编码器309可以按照公式4来确定所插入正弦波的振幅:
正弦波注入和编码器309继而使用公式5来产生更新的已编码高频区域频谱:
正弦波注入和编码器309继而可以重复选择和缩放正弦波的操作以及更新已编码高频区域的操作,以便进一步添加正弦波,直到已经添加了期望数目的正弦波。在本发明的一个优选实施方式中,正弦波的期望数目为4。
在本发明的某些实施方式中,重复这些操作直到正弦波注入和编码器309检测到原始高频区域信号和已编码高频区域信号之间的总体误差已经降低到编码误差阈值之下。
在选择和缩放正弦波之后,正弦波注入和编码器309继而执行对所选正弦波进行编码的操作,以便正弦波的指示可以按照比特有效的方式向解码器传递。
因此,正弦波注入和编码器309可以量化所选正弦波的振幅Ai,并且向多路复用器提交量化的振幅值<Ai>。
此外,正弦波注入和编码器309可以编码所选一个或多个正弦波的一个和/或多个位置。
在本发明的第一实施方式中,对所选正弦波的位置和符号进行量化。然而,已经发现,对位置和符号的量化不是最优的。
参考图8,示出了在正弦波注入和编码器309中执行的、按照本发明的实施方式对位置和符号进行编码的操作的效果。
图8(a)示出了由MDCT系数值801表示的从7000Hz到7800Hz的典型高频区域子带的频谱的示例。
图8(b)示出了关于索引值而示出可以插入所选正弦波的可能位置的示例。32个可能的索引位置中可以具有定位于其上的零个、一个或多个正弦波。
图8(c)示出了将32个可能索引位置划分为至少两个轨道的本发明的实施方式。轨道是交错的,使得图8(c)中所示的两个轨道中每个轨道的每个索引定位在另一轨道的两个索引之间。在具有多于两个轨道的实施方式中,每个索引由来自其他轨道中每一个的索引隔开。例如,在图8(c)中,32个可能的索引位置被划分为轨道1 803和轨道2 805。
此外,实施方式可以具有多于2个交错的轨道。例如,对于三个交错的轨道来说,位置可以是:pos1(n-1),pos2(n-1),pos3(n-1),pos1(n),pos2(n),pos3(n),pos1(n+1),pos2(n+1),pos3(n+1),其中posk(n)是第k个轨道上的第n个位置。
此外,实施方式可以将轨道布置到区域中,使得对于每个具有共计N个位置的2个轨道来说,轨道可以布置在位置pos1(1),pos1(2),...,pos1(N),pos2(1),pos2(2),...,pos2(N)。
在本发明的其他实施方式中,轨道可被组织为不仅覆盖子带而是覆盖整个频率区域。
正弦波注入和编码器309使用索引到轨道的这一分隔来改进位置编码,这可以通过以下示例以及参考图9来阐释。
图9(a)示出了从7000Hz到14000Hz的高频区域信号的频谱。图9(b)示出了单个轨道索引方法中的所选正弦波,其中在达到比特编码限度之前可以编码8个正弦波。图9(c)示出了按照本发明实施方式的两个轨道索引方法中的所选正弦波,其中在达到比特编码限度之前可以编码10个正弦波。
对于本发明的实施方式来说,HFR编码比特分配通常为4k比特/秒(或者说每帧80比特)(其中每帧约20到25比特可以用于量化MDCT值或者正弦波振幅)。
针对每个子带的比特分配参照公式6来描述:
BRsub-band=Nsin(Bind+Bsign)                6
其中Nsin是所选正弦波的数目,而Bind和Bsign分别是用于位置(索引)和符号信息的所需比特数目。
在图9(b)和图9(c)所示的示例中,四个子带长度分别为64、64、64和32个位置。
按照图9(b)中所示的实施方式,正弦波注入和编码器309可以分别指派每个子带每个正弦波以下数目的比特:6、6、6和5。该比特数目唯一地定义了每个索引,并且由此分别确定了子带中的每个正弦波。正弦波注入和编码器309继而可以指派额外比特以定义正弦波的符号,换言之,正弦波是同相还是180度反相。由此,帧的比特率由公式7给出:
BRtotal,method1=Nsb,1(6+1)+Nsb,2(6+1)+Nsb,3(6+1)+Nsb,4(5+1)        7
其中Nsb,i是第i个子带中正弦波的数目。从图9(b)中可见,Nsb,1=3,Nsb,2=3,Nsb,3=1,Nsb,4=1,由此编码8个正弦波所需的比特是55比特/帧。
在使用每个子带2个轨道的改进编码方法中,正弦波注入和编码器309降低了每个子带的每个正弦波使用的比特数目,这归因于子带中每个正弦波较少的可能个体位置,并且归因于按照每个轨道上个体正弦波的排序的冗余性。
在每个子带和轨道中选择正弦波,并且按照已知的顺序对其进行编码,使得解码器可以识别正确的位置索引。
比特节省是基于选择和传输轨道上的正弦波的顺序是无关的这一事实。在单个轨道上具有正弦波位置P和R(并且在本发明的实施方式中,符号可以被指定为相反)还是R和P(并且在本发明的实施方式中符号可以被指定为相同)无关紧要。
在使用每个子带2个轨道的改进编码方法中,正弦波注入和编码器309降低了每个子带的每个正弦波使用的比特数目,这归因于子带中每个正弦波较少的可能个体位置,并且归因于按照每个轨道上个体正弦波的排序的冗余性。
从图9(c)中可见,对于前两个子带,可以在第一轨道和第二轨道二者上对2个正弦波进行编码。如第一方法中所示,子带3和4具有相同数目的正弦波。子带1和2中每个轨道(每个具有2个正弦波)的比特率为(5+1)+(5+0)。对于子带3,比特需求为(6+1),而对于子带4则为(5+1)。由此,10个正弦波需要的总计比特率为每帧57比特。由此,在此改进方法中,正弦波注入和编码器309可以仅以每帧2比特的代价添加两个附加的正弦波。
对于此示例,第一和第二方法中每个正弦波的比特率分别为6.875比特和5.7比特。
正弦波注入和编码器309可以基于子带长度来选择将要在子带中使用的轨道的数目。如果子带大小是自适应的(也即,可以逐帧改变),则所选的长度应当为方法提供性能改进。
例如,长度为32的子带可以容易地划分为2个16的轨道。类似地,长度48可以划分为3个16的轨道。长度64可以划分为2个32的轨道或者4个16的轨道。可以基于可变比特率来确定选择。
正弦波注入和编码器309可以选择允许插入后继正弦波的轨道结构,并且优选地可以在每个轨道上放置不止一个正弦波。
由此,例如,在本发明的实施方式中,在将要选择两个正弦波并且每个来自一个轨道的情况下,可以这样来选择轨道的布置,使得可能的正弦波位置P和P+1(其在感官上是重要的)在不同轨道中,从而可以选择二者。
在子频带长度可变的情况下,应当这样来选择子频带长度,使得已编码高频区域的总体能量将不会逐帧显著波动。
由此,从上可以看出,按照轨道索引对插入正弦波的位置的编码改进了指示任何插入的正弦波所需的编码率。
在本发明的其他实施方式中,正弦波注入和编码器309可以进一步改进对插入正弦波的位置的编码。
在本发明的某些实施方式中,在确定感官上最重要的正弦波的位置和振幅之后,正弦波注入和编码器309分析正弦波子集之间的相对位置差异。这些相对位置继而用来确定是否可以仅使用几个比特来对正弦波的布置进行编码。如果没有检测到正弦波布置中的模式,则之前描述的用于编码正弦波位置的方法之一可以用来对所选正弦波的位置进行编码。
如前所述,可以将已编码高频区域划分为一系列子频带。继而可以搜索每个子频带,以确定每个子频带中可以插入所选正弦波的位置。与原始高频区域信号相比,这些所选正弦波可以改进已编码高频区域信号的精度。
在本发明的第一实施方式中,频谱可以划分成的子频带的数目为6。在本发明的其他实施方式中,子频带的数目可以如前所述是可变的。
针对每个子频带,正弦波注入和编码器309对所选正弦波及其在每个子带中的位置进行比较,以确定哪里可以被认为是结构的开始点。例如,在本发明的一个实施方式中,正弦波注入和编码器309选择具有最低频率的所选正弦波作为开始点正弦波。在本发明的其他实施方式中,开始点正弦波被选择为子带中的中间正弦波或者高频正弦波。
一旦选择了开始点正弦波,就检查开始点位置与子带中其他所选正弦波位置之间的差异。继而可以对开始点位置与子带中其余所选正弦波之间的任何关系进行编码。
例如,如果第一正弦波位于子带中的索引5处,并且两个其他正弦波位于索引12和19处,则正弦波注入和编码器309继而可以将正弦波位置编码为绝对索引5以及相对索引7和进一步的相对索引7。在本发明的其他实施方式中,正弦波注入和编码器309对绝对索引(5)、相对索引(7)以及结构中的正弦波总数(3)进行编码。
此外,随着每个子频带的所选正弦波数目的增加,上面提供的示例将更为有效。对于上面示出的绝对、相对、相对编码实施方式就是如此,因为随着添加更多的正弦波,正弦波之间的平均距离将减小,并且因此对正弦波之间的相对距离进行编码所需的平均比特数目将减少,由此降低了每个正弦波所需的指示比特数。
类似地,对于绝对、相对、总计编码实施方式,随着所选正弦波数目的增加,每个正弦波的平均比特数目降低,因为每个额外的正弦波只需要增加总计数。
尽管正弦波注入和编码器309将需要搜索所选正弦波以确定相对差异,但是由于正弦波的总数有限,因此这不会显著增加复杂性。
在本发明的另一些实施方式中,正弦波注入和编码器309使用开始点正弦波,并且在子带内相对于开始点来搜索正弦波,以确定与预定义候选结构相匹配或者接近匹配的正弦波结构。
按照本发明的实施方式,用于确定正弦波结构的标准可以是可选的或可变的。例如,在一个实施方式中,正弦波注入和编码器309可以简单地选择具有最大数目的匹配正弦波的候选结构,或者具有候选正弦波匹配的重要性的候选结构(例如,如果一个结构具有“匹配的”N个正弦波而另一个具有“匹配的”N-1个,则可以选择N-1候选,因为该候选结构更精确地匹配在感官上重要的所选正弦波)。
此外,正弦波注入和编码器309可以包括每个正弦波的符号信息,并且如上所述地对正弦波振幅进行编码(例如,使用矢量量化来减少用来表示振幅的比特数目)。
在本发明的某些实施方式中,在结构具有相同数目的“匹配”正弦波的情况下,正弦波注入和编码器309可以选择在高频区域的较低频中具有较多“匹配”正弦波的匹配。
在本发明另一些实施方式中,在选择开始点正弦波的候选以及相对索引之后,正弦波注入和编码器309使用此预定义的正弦波位置模板,从其检测与模板正弦波位置/索引的任何偏离。在本发明的一个实施方式中,可以通过搜索预定义的偏离查找表(也称为小位置偏离码本)来对检测到的偏离进行编码,并且继而输出与偏离相关联的代码。
尽管此实施方式中的正弦波注入和编码器309在潜在正弦波的位置方面具有较大的灵活性,但是对偏离的搜索增加了所需的搜索处理。
尽管此实施方式产生的结果可以更为精确地指示最优正弦波的实际位置,但是与每个正弦波相关联的比特率也有所增加。由此,该另一实施方式在较低比特率时使用未必是最有效的。此外,此实施方式可能使用甚至更多的处理器资源,因为必须对结构和误差进行搜索和编码。
在与之前描述的实施方式相关联的另一些实施方式中,正弦波注入和编码器309可以容忍正弦波结构或偏离与针对正弦波结构或偏离的编码之间的小程度误差。换言之,为了加速对结构和偏离位置二者的搜索和编码,在结构和/或从结构的偏离的有限子集上进行搜索。在要对编码速度和每个正弦波的比特流进行优化、并且正弦波结构和/或偏离中的误差是可接受或者可容忍的情况下,此实施方式是可接受的。
然而,这种实施方式需要考虑到:正弦波位置逐帧的延长移位或者波动可能使得可以感知到误差。
尽管已将上面的示例描述为针对每个子频带执行,但是其也可以同时横跨整个高频区域信号来应用。由此,可以对固定或者可变结构执行相关式编码、结构化编码以及小偏离编码,其中子带可以是整个高频区域信号。
继而可以向多路复用器311传递正弦波指示信息,以便包括在比特流输出中。
正弦波的选择和编码操作在图6中由步骤615示出。
比特流格式化器234接收低频编码器231输出、高频区域处理器232输出,并且对比特流进行格式化以产生比特流输出。在本发明的某些实施方式中,比特流格式化器234可以对接收的输入进行交织,并且可以生成要插入到比特流输出112中的检错和纠错代码。
将HFR编码器232与LFR编码器231信息多路复用到输出比特流中的步骤在图6中由步骤617示出。
为了进一步帮助理解本发明,将参照图5中示意性示出的解码器以及图7中示出的解码器操作的流程图,来示出关于本发明实施方式的解码器108的操作。
解码器包括输入413,可以从其接收已编码比特流112。输入413连接至比特流解包器401。
比特流解包器将已编码比特流112解多路复用、分割或者解包为三个独立的比特流。低频已编码比特流被传递至低频区域解码器403、频谱带副本比特流被传递至高频重建器407(也称为高频区域解码器),而控制数据被传递至解码器控制器405。
该解包过程在图7中由步骤701示出。
低频区域解码器403接收低频已编码数据,并且通过执行低频区域编码器231中所执行过程的逆过程来构建合成低频信号。将该合成低频信号向高频区域解码器407和重建解码器409传递。
该低频区域解码过程在图7中由步骤707示出。
解码器控制器405从比特流解包器401接收控制信息。对于本发明,解码器控制器405接收关于HFR编码过程中是否使用了频谱复制的信息,如先前关于HFR频带复制选择处理器305和HFR频带复制缩放处理器307所描述的。继而,向HFR解码器传递配置HFR解码器以使用此方法来重建HFR区域所需的任何具体信息,该方法包括如下所述的步骤705。
此外,解码器控制器405从比特流解包器401接收针对在HFR编码器和HFR正弦波注入和编码器309中选择的任何正弦波选择和注入过程的控制信息。
HFR解码器的设置在图7中由步骤703示出。
在本发明的某些实施方式中,解码器控制器405可以是高频解码器407的一部分。
HFR解码器407例如可以通过针对频带选择信息所指示的频带、按照高频重建比特流的指示对来自合成低频信号的低频分量进行复制和缩放,从而执行复制HFR重建操作。该操作根据解码器控制器405提供的信息来执行。
该高频复制构建或高频重建在图7中由步骤705示出。
HFR解码器407还可以根据解码器控制器405提供的信息来执行正弦波选择和注入操作,以改进HFR重建操作的精度。由此,按照本发明的实施方式,解码器控制器405可以控制HFR解码器407不要添加任何正弦波、按照解码器控制器405指示的比特流格式来添加正弦波。由此,非限制性示例包括:按照提供的索引和轨道信息、按照正弦波布置的结构、按照正弦波布置的相对间隔以及按照距正弦波的固定或可变布置或结构的偏离来插入正弦波。
正弦波的注入操作在图7中由步骤709示出。
向重建解码器409传递重建的高频分量比特流。
重建解码器409接收已解码低频比特流和重建的高频比特流,以形成表示原始信号的比特流,并且通过解码器输出415来对输出音频信号114进行输出。
该信号的重建在图7中由步骤711示出。
本发明的上述实施方式针对分离的编码器104和解码器108装置对编解码器进行了描述,以便辅助对所涉及过程的理解。然而,将会理解,装置、结构和操作可以实现为单个编码器-解码器装置/结构/操作。此外,在本发明的某些实施方式中,编码器和解码器可以共享某些或者全部公共元件。
尽管上文示例描述了在电子设备10中的编解码器内操作的本发明的实施方式,但是将会理解,下面描述的本发明可以实现为任何可变速率/自适应速率音频(或者语音)编解码器的一部分。由此,例如,本发明的实施方式可以实现在如下音频编解码器中,该音频编解码器可以在固定的或者有线的通信路径上实现音频编码。
由此,用户设备可以包括诸如在本发明上述实施方式中描述的那些音频编解码器。
应当理解,术语“用户设备”意在涵盖任何适当类型的无线用户设备,诸如移动电话、便携式数据处理设备或者便携式web浏览器。
此外,公共陆地移动网络(PLMN)的元件也可以包括如上所述的音频编解码器。
一般地,本发明的各种实施方式可以通过硬件或专用电路、软件、逻辑或者其任意组合来实现。例如,某些方面可以通过硬件实现,而其他方面可以通过可由控制器、微处理器或者其他计算设备执行的固件或者软件来实现,当然,本发明不限于此。尽管本发明的各方面可以作为框图、流程图或者使用某些其他图形化表示来进行说明和描述,但是将会理解,作为非限制性示例,在此描述的这些框、装置、系统、技术或者方法可以通过硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备或者其某些组合来实现。
本发明的实施方式可以由移动设备的数据处理器可执行的计算机软件来实现,例如实现在处理器实体中,或由硬件实现,或由软件和硬件的结合来实现。此外,在此方面,应当注意,附图中逻辑流的任何框可以表示程序步骤,或者互连的逻辑电路、块和功能,或者程序步骤和逻辑电路、块和功能的结合。
存储器可以是适合本地技术环境的任何类型,并且可以使用任何适当的数据存储技术来实现,诸如基于半导体的存储器器件、磁性存储器器件和系统、光学存储器器件和系统、固定存储器以及可拆卸存储器。数据处理器可以是适合本地技术环境的任何类型,并且可以包括以下一个或多个:通用计算机、专用计算机、微处理器、数字信号处理器(DSP)以及基于多核处理器架构的处理器,这些是作为非限制性示例。
本发明的实施方式可以通过诸如集成电路模块的各种组件来实践。集成电路的设计基本上是高度自动化过程。复杂而强大的软件工具可用于将逻辑级设计转换成准备好将要在半导体衬底上蚀刻和形成的半导体电路设计。
例如加利福尼亚州芒廷维尤市Synopsys公司和加利福尼亚州圣何塞市Cadence Design公司所提供的程序之类的程序使用建立好的设计规则以及预存设计模块库在半导体芯片上自动地对导体进行布线和对部件进行定位。一旦已经完成半导体电路的设计,可以将标准化电子格式(例如Opus、GDSII等)的所得设计发送到半导体制造工厂或者“加工厂”进行制造。
上文描述已经通过示例性而非限制性示例的方式提供了对本发明示例性实施方式的全面、有益的描述。然而,通过结合附图和所附权利要求阅读上文描述,各种修改和调整对于相关领域技术人员而言将变得易见。然而,对本发明教导的所有这种或者类似的修改仍将落入由所附权利要求限定的本发明范围之内。

Claims (12)

1.一种用于对音频信号的较低频区域进行编码以及通过向较高频区域添加单频分量来对所述音频信号的所述较高频区域进行编码的编码器,其中所述编码器配置用于:
选择至少两个所述单频分量;
确定所述两个单频分量之间的频率间隔;
在频率间隔值列表中搜索所述两个单频分量之间的已确定频率间隔;
在所述列表中选择与所述两个单频分量之间的所述已确定频率间隔更接近匹配的一个频率间隔值;以及
生成指示符,所述指示符配置用于代表所述至少两个单频分量,其中所述指示符取决于所述频率间隔值列表中选择的一个频率间隔值。
2.根据权利要求1所述的编码器,进一步配置用于:
选择至少一个其他单频分量;其中所述指示符进一步配置用于代表所述至少一个其他单频分量;并且其中所述指示符进一步配置为取决于所述至少一个其他单频分量与所述至少两个单频分量之一之间的频率间隔。
3.根据权利要求1或2所述的编码器,其中所述指示符进一步配置为取决于所述至少两个单频分量之一的频率。
4.根据权利要求1所述的编码器,进一步配置用于:
确定所述频率间隔值列表中所选择的一个频率间隔值与所述已确定频率间隔值之间的差异;其中所述指示符进一步取决于所述差异。
5.根据权利要求4所述的编码器,进一步配置用于:
在另一差异值列表中搜索所述频率间隔值列表中所选择的一个频率间隔值与所述已确定频率间隔值之间的已确定差异;
在所述另一差异值列表中选择与所述已确定差异更接近匹配的一个差异值,其中所述指示符取决于所述另一差异值列表中选择的一个差异值。
6.一种用于对音频信号的较低频区域进行编码以及通过向较高频区域添加单频分量来对所述音频信号的所述较高频区域进行编码的方法,包括:
选择至少两个单频分量;
确定两个单频分量之间的频率间隔;
在频率间隔值列表中搜索两个单频分量之间的已确定频率间隔;
在所述列表中选择与所述两个单频分量之间的所述已确定频率间隔更接近匹配的一个频率间隔值;以及
生成指示符,所述指示符配置用于代表所述至少两个单频分量,其中所述指示符取决于所述频率间隔值列表中所选择的一个频率间隔值。
7.根据权利要求6所述的方法,进一步包括:选择至少一个其他单频分量;其中所述指示符进一步配置用于代表所述至少一个其他单频分量;并且其中所述指示符进一步配置为取决于所述至少一个其他单频分量与所述至少两个单频分量之一之间的频率间隔。
8.根据权利要求6或7所述的方法,其中所述指示符进一步取决于所述至少两个单频分量之一的频率。
9.根据权利要求6所述的方法,进一步包括:
确定所述频率间隔值列表中所选择的一个频率间隔值与所述已确定频率间隔值之间的差异;其中所述指示符进一步取决于所述差异。
10.根据权利要求9所述的方法,进一步包括:
在另一差异值列表中搜索所述频率间隔值列表中选择的一个频率间隔值与所述已确定频率间隔值之间的已确定差异;以及
在所述另一差异值列表中选择与所述已确定差异更接近匹配的一个差异值,其中所述指示符取决于所述另一差异值列表中所选择的一个差异值。
11.一种包括根据权利要求1到5所述的编码器的装置。
12.一种电子设备,包括根据权利要求1到5之任一权利要求所述的编码器。
CN201210012088.XA 2007-11-06 2007-11-06 编码器 Active CN102568489B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200780101913.0A CN101896967A (zh) 2007-11-06 2007-11-06 编码器

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN200780101913.0A Division CN101896967A (zh) 2007-11-06 2007-11-06 编码器

Publications (2)

Publication Number Publication Date
CN102568489A CN102568489A (zh) 2012-07-11
CN102568489B true CN102568489B (zh) 2015-09-16

Family

ID=46413739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210012088.XA Active CN102568489B (zh) 2007-11-06 2007-11-06 编码器

Country Status (1)

Country Link
CN (1) CN102568489B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5797121A (en) * 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法
CN1585972A (zh) * 2002-08-01 2005-02-23 松下电器产业株式会社 音频解码装置和音频解码方法
WO2007011115A1 (en) * 2005-07-15 2007-01-25 Samsung Electronics Co., Ltd. Method and apparatus to encode/decode low bit-rate audio signal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5797121A (en) * 1995-12-26 1998-08-18 Motorola, Inc. Method and apparatus for implementing vector quantization of speech parameters
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法
CN1585972A (zh) * 2002-08-01 2005-02-23 松下电器产业株式会社 音频解码装置和音频解码方法
WO2007011115A1 (en) * 2005-07-15 2007-01-25 Samsung Electronics Co., Ltd. Method and apparatus to encode/decode low bit-rate audio signal

Also Published As

Publication number Publication date
CN102568489A (zh) 2012-07-11

Similar Documents

Publication Publication Date Title
KR101238239B1 (ko) 인코더
JP6407928B2 (ja) オーディオ処理システム
KR101161866B1 (ko) 오디오 코딩 장치 및 그 방법
CN101583994B (zh) 对音频和/或语音信号进行编码和/或解码的方法和设备
CN103548080B (zh) 声音信号混合编码器、声音信号混合解码器、声音信号编码方法以及声音信号解码方法
CN101371447A (zh) 使用扩展带频率编码的复变换信道编码
US20090319278A1 (en) Efficient coding of overcomplete representations of audio using the modulated complex lapped transform (mclt)
CN101031961B (zh) 对编码信号进行处理的方法和装置
CN102396024A (zh) 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备
KR20070037945A (ko) 오디오 신호의 부호화/복호화 방법 및 장치
CN101162584A (zh) 使用带宽扩展技术对音频信号编码和解码的方法和设备
US9230551B2 (en) Audio encoder or decoder apparatus
JP5629319B2 (ja) スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法
CN105745703A (zh) 信号编码方法和装置以及信号解码方法和装置
CN102568489B (zh) 编码器
KR20100114450A (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
CN107924683A (zh) 正弦编码和解码的方法和装置
US20100280830A1 (en) Decoder
CN103733256A (zh) 音频信号处理方法、音频编码设备、音频解码设备和采用所述方法的终端

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20160115

Address after: Espoo, Finland

Patentee after: Technology Co., Ltd. of Nokia

Address before: Espoo, Finland

Patentee before: Nokia Oyj