CN101836254A - 频带扩大装置和方法、编码装置和方法、解码装置和方法及程序 - Google Patents
频带扩大装置和方法、编码装置和方法、解码装置和方法及程序 Download PDFInfo
- Publication number
- CN101836254A CN101836254A CN200980100820A CN200980100820A CN101836254A CN 101836254 A CN101836254 A CN 101836254A CN 200980100820 A CN200980100820 A CN 200980100820A CN 200980100820 A CN200980100820 A CN 200980100820A CN 101836254 A CN101836254 A CN 101836254A
- Authority
- CN
- China
- Prior art keywords
- frequency band
- mentioned
- subband
- signals
- envelope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 239000000284 extract Substances 0.000 claims abstract description 50
- 238000000605 extraction Methods 0.000 claims abstract description 21
- 238000004088 simulation Methods 0.000 claims description 136
- 239000000203 mixture Substances 0.000 claims description 58
- 238000012937 correction Methods 0.000 claims description 33
- 238000013507 mapping Methods 0.000 claims description 19
- 238000000638 solvent extraction Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000008676 import Effects 0.000 claims description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 abstract 2
- 238000012545 processing Methods 0.000 description 29
- 230000006870 function Effects 0.000 description 28
- 238000001228 spectrum Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 239000000654 additive Substances 0.000 description 6
- 230000000996 additive effect Effects 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 4
- 108010022579 ATP dependent 26S protease Proteins 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000012467 final product Substances 0.000 description 3
- 241001269238 Data Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000010339 dilation Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000001172 regenerating effect Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及通过扩大频带,能够更高音质再生音乐信号的频带扩大装置和方法、编码装置和方法、解码装置和方法及程序。带通滤波器(13)根据输入信号得到多个子带信号。频率包络提取电路(14)从利用多个带通滤波器得到的多个子带信号中提取频率包络。高频带信号生成电路(15)基于利用频率包络提取电路(14)得到的频率包络和利用带通滤波器(13)得到的多个子带信号生成高频带信号成分,频率扩大装置(10)使用利用上述高频带信号生成电路(15)所生成的高频带信号成分,扩大输入信号的频带。本发明例如可以应用于频率扩大装置、编码装置、及解码装置等中。
Description
技术领域
本发明涉及频带扩大装置和方法、编码装置和方法、解码装置和方法及程序,特别地,涉及通过扩大频带,能够更高音质再生音乐信号的频带扩大装置和方法、编码装置和方法、解码装置和方法及程序。
背景技术
近年,通过互联网等分发音乐数据的音乐分发服务正在扩展。在该音乐分发服务中,把通过对音乐信号进行编码而得到的编码数据作为音乐数据进行分发。为了在下载的时候不花费时间,作为音乐信号的编码方法,抑制编码数据的文件容量并降低比特率的编码方法成为主流。
作为这样的音乐信号的编码方法,大致存在MP3(MPEG(MovingPicture Experts Group)Audio Layer3)(国际标准规格ISO/IEC 11172-3)等编码方法和HE-AAC(High Efficiency MPEG4AAC)(国际标准规格ISO/IEC 14496-3)等编码方法。
MP3所代表的编码方法是删除音乐信号之中人耳难以觉察的大约15kHz以上的高频频带(以下,称为高频带)信号成分,把剩余的低频频带(以下,称为低频带)信号成分进行编码。这样的编码方法,以下称为高频带删除编码方法。该高频带删除编码方法能够抑制编码数据的文件容量。但是,对于高频带声音,虽然微小但是人类是可觉察的,所以,若根据通过对编码数据进行解码而得到的解码后的音乐信号生成语音并输出,则有时会发生失去原声具有的临场之感或者声音不清的音质劣化。
对此,在HE-AAC所代表的编码方法中,从高频带信号成分中提取特征性信息并与低频带信号成分合成进行编码。将这样的编码方法,以下称为高频带特征编码方法。在该高频带特征编码方法中,只是把高频带信号成分的特征性信息作为与高频带信号成分有关的信息进行编码,所以能够抑制音质的劣化,同时提高了编码效率。
在对利用该高频带特征编码方法编码的编码数据进行解码时,对低频带信号成分和特征性信息进行解码,根据解码后的低频带信号成分和特征性信息生成高频带信号成分。对于通过这样根据低频带信号成分生成高频带信号成分来扩大低频带信号成分的频率频带的技术,以下称为频带扩大技术。
作为该频带扩大技术的一个应用例,有对利用上述的高频带删除编码方法编码的编码数据解码后的后处理。在该后处理中,根据解码后的低频带信号成分生成因编码而失去的高频带信号成分,由此扩大低频带信号成分的频率频带(例如,参照专利文献1)。此外,以下将专利文献1的频率频带扩大的方法称为专利文献1的频带扩大方法。
在专利文献1的频带扩大方法中,装置把解码后的低频带信号成分作为输入信号,根据输入信号的功率谱推定高频带的功率谱(以下称为高频带的频率包络),根据低频带信号成分生成具有该高频带的频率包络的高频带信号成分。
图1表示作为输入信号的解码后的低频带的功率谱和所推定的高频带的频率包络的一例。
在图1中,纵轴利用对数表示功率,横轴表示频率。
装置,根据与输入信号有关的编码方式的种类和采样率、比特率等信息(以下,称为边信息(side information))决定高频带信号成分的低频带端的频带(以下称为扩大开始频带)。其次,装置把作为低频带信号成分的输入信号分割成多个子带信号。装置,求出分割后的多个子带信号、即在扩大开始频带的低频带侧(以下只称为低频带侧)的多个子带信号的各个功率的关于时间方向的每个组的平均(以下,称为组功率)。如图1所示那样,装置,将把低频带侧的多个子带的信号的各个组功率的平均作为功率,并且,把扩大开始频带的下端的频率作为频率的点当作起点。装置,把通过该起点的规定的斜率的一次直线作为在扩大开始频带的高频带侧(以下,只称为高频带侧)的频率包络进行推定。此外,关于起点的功率方向的位置,可以由用户调整。以成为所推定的高频带侧的频率包络的方式,装置根据低频带侧的多个子带信号生成高频带侧的多个子带信号的每个。装置把所生成的高频带侧的多个子带信号进行加法运算并设为高频带信号成分,进而,把低频带信号成分进行加法运算并输出。据此,频率频带扩大后的音乐信号成为与本来的音乐信号更接近的音乐信号。从而,能够再生更高音质的音乐信号。
上述的专利文献1的频带扩大方法,具有如下的特征:关于各种各样的高频带删除编码方法和各种各样的比特率的编码数据,能够扩大关于该编码数据解码后的音乐信号的频率频带。
专利文献1:日本特开2008-139844号公报
但是,专利文献1的频带扩大方法在如下的点有改进的余地:所推定的高频带侧的频率包络成为规定的斜率的一次直线、即频率包络的形状固定。
也就是说,音乐信号的功率谱具有各种各样的形状,由于音乐信号的种类不同,较大程度地偏离利用专利文献1的频带扩大方法推定的高频带侧的频率包络的情况也不少。
图2表示伴随时间性急剧变化的冲击性的音乐信号的本来的功率谱的一例。
此外,在图2中也一起表示了利用专利文献1的频带扩大方法,把冲击性的音乐信号之中的低频带侧的信号成分作为输入信号,并根据该输入信号推定出的高频带侧的频率包络。
如图2所示那样,冲击性的音乐信号的本来的高频带侧的功率谱大体上是平坦的。
相对于此,推定出的高频带侧的频率包络具有规定的负的斜率,在起点,即使调节到与本来的功率谱接近的功率,随着频率变高与本来的功率谱之间的差变大。
这样,对于专利文献1的频带扩大方法,所推定出的高频带侧的频率包络不能高精度地再现本来的高频带侧的频率包络。其结果,若根据频带扩大后的音乐信号生成语音并输出,在听觉上,则会损失原声声音的清晰性。
另外,在上述的HE-AAC等的编码方法中,使用高频带侧的频率包络作为被编码的高频带信号成分的特征性信息。但是,如果在解码侧能够高精度地再现本来的高频带侧的频率包络,则不需要高频带信号成分的特征性信息的编码本身。据此,可以更进一步地提高编码效率。
发明内容
本发明是鉴于这样的情况完成的,通过频率频带的扩大,能够以高音质再生音乐信号。
本发明的一个方面的频带扩大装置,具备:多个带通滤波器,根据输入信号得到多个子带信号;频率包络提取电路,从利用上述多个带通滤波器得到的多个子带信号中提取频率包络;和高频带信号生成电路,基于利用上述频率包络提取电路得到的频率包络和利用上述带通滤波器得到的多个子带信号生成高频带信号成分,其中,使用利用上述高频带信号生成电路所生成的上述高频带信号成分,扩大上述输入信号的频带。
上述频率包络提取电路根据利用上述多个带通滤波器得到的多个子带信号得到频率包络的一次倾斜。
在上述频率包络提取电路中,在从利用上述多个带通滤波器得到的多个子带信号中提取频率包络时,使用多个子带信号的功率。
在上述频率包络提取电路中,在从利用上述多个带通滤波器得到的多个子带信号中提取频率包络时,使用多个子带信号的振幅。
对于上述频率包络,频率包络的计算区间与上述输入信号的稳定性相应而改变。
上述频率包络提取电路根据利用上述多个带通滤波器得到的多个子带信号得到频率包络的多个一次倾斜。
上述高频带信号生成电路,具备增益量计算电路,该增益量计算电路根据利用上述频率包络提取电路得到的频率包络按每个子带求出增益量,把上述增益量应用于利用上述多个带通滤波器得到的多个子带信号。
上述增益量计算电路,根据利用时间轴上的多个块所计算出的频率包络按每个子带求出增益量。
根据利用上述多个带通滤波器得到的多个子带信号通过加权计算出上述频率包络的一次倾斜。
上述增益量计算电路,利用预先通过把宽频带信号作为教师数据进行学习而得到的映射函数计算出增益量。
上述映射函数把一次倾斜作为输入,把增益量作为输出。
上述映射函数把多个一次倾斜作为输入并把增益量作为输出。
上述映射函数把对数上的一次倾斜作为输入并把对数上的增益量作为输出。
还具备高频带子带强度生成电路,该高频带子带强度生成电路根据利用上述多个带通滤波器得到的多个子带信号生成频率扩大频带的各高频带子带强度。
上述高频带子带强度生成电路,根据利用上述多个带通滤波器得到的多个子带信号强度的线性结合,计算出频率扩大频带的各高频带子带的强度。
上述高频带子带强度生成电路,根据利用时间轴上的多个块所计算出的多个子带信号强度的线性结合,计算出频率扩大频带的各高频带子带的强度。
上述高频带子带强度生成电路,使用把利用时间轴上的多个块所计算出的多个子带信号强度按每个子带置换为一个变量的子带信号强度,计算出频率扩大频带的各高频带子带的强度。
上述高频带子带强度生成电路,根据利用上述多个带通滤波器得到的多个子带信号强度,通过使用非线性函数计算出频率扩大频带的各高频带子带的强度。
上述高频带子带强度生成电路,根据利用时间轴上的多个块所计算出的多个子带信号强度,通过使用非线性函数计算出频率扩大频带的各高频带子带的强度。
上述非线性函数是任意次数的函数。
上述高频带子带强度生成电路的输入和输出,分别是利用上述多个带通滤波器得到的多个子带信号的功率以及高频带子带的功率。
上述高频带子带强度生成电路的输入和输出分别是利用上述多个带通滤波器所得到的多个子带信号的振幅和高频带子带的振幅。
上述增益量计算电路,利用映射函数计算出增益量,该映射函数具有预先通过把宽频带信号作为教师数据进行学习而得到的系数。
关于本发明的一个方面的频带扩大方法,频带扩大装置根据输入信号得到多个子带信号,从所得到的多个子带信号中提取频率包络,基于提取出的上述频率包络和所得到的上述多个子带信号生成高频带信号成分,使用所生成的上述高频带信号成分扩大上述输入信号的频率频带。
本发明的一个方面的程序,使控制频带扩大装置的计算机执行包含下列步骤的控制处理:根据输入信号得到多个子带信号,从所得到的多个子带信号中提取频率包络,基于提取出的上述频率包络和所得到的上述多个子带信号,生成高频带信号成分,使用所生成的上述高频带信号成分,扩大上述输入信号的频率频带。
在本发明的一个方面的频带扩大装置和方法以及程序中,根据输入信号得到了多个子带信号,从所得到的多个子带信号中提取了频率包络,基于所提取的上述频率包络和所得到的上述多个子带信号生成了高频带信号成分,使用所生成的上述高频带信号成分,扩大了上述输入信号的频率频带。
本发明的一个方面的编码装置具备:子带分割电路,把输入信号分割成多个子带,生成由低频带侧的多个子带所构成的低频带子带信号和由高频带侧的多个子带所构成的高频带子带信号;低频带编码电路,对上述低频带子带信号进行编码,生成低频带编码数据;频率包络提取电路,从上述低频带子带信号中提取频率包络;模拟高频带信号生成电路,根据利用上述频率包络提取电路所得到的频率包络和上述低频带子带信号生成模拟高频带信号;模拟高频带信号修正信息计算电路,比较利用上述子带分割电路所得到的高频带子带信号和利用上述模拟高频带信号生成电路所生成的模拟高频带信号,得到模拟高频带信号修正信息;高频带编码电路,对上述模拟高频带信号修正信息进行编码,生成高频带编码数据;和多路复用电路,对利用上述低频带编码电路所生成的低频带编码数据和利用上述高频带编码电路所生成的高频带编码数据进行多路复用,得到输出代码串。
本发明的一个方面的编码方法包含如下步骤:信号编码装置把输入信号分割成多个子带,生成由低频带侧的多个子带构成的低频带子带信号和由高频带侧的多个子带构成的高频带子带信号,对上述低频带子带信号进行编码,生成低频带编码数据,从上述低频带子带信号中提取频率包络,根据提取出的上述频率包络和上述低频带子带信号生成模拟高频带信号,比较上述高频带子带信号和所生成的上述模拟高频带信号,得到模拟高频带信号修正信息,并对上述模拟高频带信号修正信息进行编码,生成高频带编码数据,把所生成的低频带编码数据和所生成的上述高频带编码数据进行多路复用而得到输出代码串。
本发明的一个方面的程序使控制信号编码装置的计算机执行包含下列步骤的控制处理:把输入信号分割成多个子带,生成由低频带侧的多个子带构成的低频带子带信号和由高频带侧的多个子带构成的高频带子带信号,对上述低频带子带信号进行编码,生成低频带编码数据,从上述低频带子带信号中提取频率包络,根据提取出的上述频率包络和上述低频带子带信号生成模拟高频带信号,比较上述高频带子带信号和所生成的上述模拟高频带信号,得到模拟高频带信号修正信息,并对上述模拟高频带信号修正信息进行编码,生成高频带编码数据,把所生成的低频带编码数据和所生成的上述高频带编码数据进行多路复用而得到输出代码串。
在本发明的一个方面的编码装置和方法及程序中,把输入信号分割成了多个子带,生成了由低频带侧的多个子带构成的低频带子带信号和由高频带侧的多个子带构成的高频带子带信号,对上述低频带子带信号进行了编码,生成了低频带编码数据,从上述低频带子带信号中提取出频率包络,根据提取出的上述频率包络和上述低频带子带信号生成了模拟高频带信号,比较上述高频带子带信号和所生成的上述模拟高频带信号,得到模拟高频带信号修正信息,并对上述模拟高频带信号修正信息进行了编码,生成了高频带编码数据,把所生成的低频带编码数据和所生成的上述高频带编码数据进行了多路复用而得到输出代码串。
本发明的一个方面的解码装置具备:解复用电路,对所输入的编码数据进行解复用生成低频带编码数据和高频带编码数据;低频带解码电路,对上述低频带编码数据进行解码,生成低频带子带信号;频率包络提取电路,从上述低频带子带信号的多个子带信号中提取频率包络;模拟高频带信号生成电路,根据利用上述频率包络提取电路所得到的频率包络和上述低频带子带信号生成模拟高频带信号;高频带解码电路,对上述高频带编码数据进行解码,生成模拟高频带信号修正信息;和模拟高频带信号修正电路,使用上述模拟高频带信号修正信息修正上述模拟高频带信号并生成修正模拟高频带信号。
本发明的一个方面的解码方法包含如下步骤:解码装置对所输入的编码数据进行解复用,生成低频带编码数据和高频带编码数据,对上述低频带编码数据进行解码,生成低频带子带信号,从上述低频带子带信号的多个子带信号中提取频率包络,根据提取出的频率包络和上述低频带子带信号生成模拟高频带信号,对上述高频带编码数据进行解码,生成模拟高频带信号修正信息,使用上述模拟高频带信号修正信息修正上述模拟高频带信号并生成修正模拟高频带信号。
本发明的一个方面的计算机,使控制解码装置的计算机执行包含如下的步骤处理:对所输入的编码数据进行解复用,生成低频带编码数据和高频带编码数据,对上述低频带编码数据进行解码,生成低频带子带信号,从上述低频带子带信号的多个子带信号中提取频率包络,根据提取出的频率包络和上述低频带子带信号生成模拟高频带信号,对上述高频带编码数据进行解码,生成模拟高频带信号修正信息,使用上述模拟高频带信号修正信息修正上述模拟高频带信号并生成修正模拟高频带信号。
在本发明的一个方面的解码装置和方法及程序中,对所输入的编码数据进行了解复用,生成了低频带编码数据和高频带编码数据,对上述低频带编码数据进行了解码,生成了低频带子带信号,从上述低频带子带信号的多个子带信号中提取出频率包络,根据提取出的频率包络和上述低频带子带信号生成了模拟高频带信号,对上述高频带编码数据进行了解码,生成了模拟高频带信号修正信息,使用上述模拟高频带信号修正信息修正了上述模拟高频带信号并生成了修正模拟高频带信号。
根据本发明的一个方面,通过频率频带的扩大,能够以更高音质再生音乐信号。
附图说明
图1是表示作为输入信号的解码后的低频带功率谱和所推定的高频带频率包络的一例的图。
图2是表示伴随着时间上急剧的变化的冲击性的音乐信号的本来功率谱的一例的图。
图3是表示基于本发明的第1实施方式中的频带扩大装置的功能性构成例的功能方框图。
图4是说明基于图3的频带扩大装置的频带扩大处理的一例的流程图。
图5是表示了输入到图3的频带扩大装置的信号的频谱和带通滤波器的频率轴上的配置的图。
图6是表示用于对图3的频带扩大装置的高频带信号生成电路中所使用的系数进行学习的系数学习装置的功能性构成例的功能方框图。
图7是表示了输入到图6的系数学习装置的宽频带的教师信号的频谱和带通滤波器的频率轴上的配置的图。
图8是表示了某时间序列信号的波形的图。
图9是表示把较短的时间帧用于非稳定的帧的例的图。
图10是表示基于本发明的第2实施方式中的频带扩大装置的功能性构成例的功能方框图。
图11是表示基于本发明的第3实施方式中的编码装置的功能性构成例的功能方框图。
图12是说明基于图11的编码装置的编码处理的一例的流程图。
图13是表示图11的编码装置输出的代码串的一例的图。
图14是表示基于本发明的第3实施方式中的解码装置的功能性构成例的方框图。
图15是说明基于图14的解码装置的解码处理的一例的流程图。
图16是表示图11的编码装置输出的代码串的另外的例的图。
图17是表示通过程序执行应用了本发明的处理的计算机的硬件构成例的方框图。
图中符号:
10频带扩大装置,11低通滤波器,12延迟电路,13带通滤波器,14频率包络提取电路,15高频带信号生成电路,16高通滤波器,17信号加法器,20频带扩大装置,21带通滤波器,22增益量计算电路,23频率包络提取电路,24系数推定电路,30频带扩大装置,31低通滤波器,32延迟电路,33带通滤波器,34高频带信号生成电路,35高通滤波器,36信号加法器,40编码装置,41子带分割电路,42低频带编码电路,43频率包络提取电路,44模拟高频带信号生成电路,45模拟高频带信号修正信息计算电路,46高频带编码电路,47多路复用电路,50解码装置,51解复用电路,52低频带解码电路,53频率包络提取电路,54模拟高频带信号生成电路,55高频带解码电路,56模拟高频带信号修正电路,57子带合成电路,101CPU,102ROM,103RAM,104总线,105输入输出接口,106输入部,107输出部,108存储部,109通信部,110驱动器,111可移动媒体
具体实施方式
以下,参照附图对应用本发明的实施方式进行说明。
1.第1实施方式(在频带扩大装置中应用了本发明的情况)
2.第2实施方式(在频带扩大装置中应用了本发明的情况)
3.第3实施方式(在编码装置和解码装置中应用了本发明的情况)
<第1实施方式>
首先,对第1实施方式进行说明。
在第1实施方式中,对通过对利用上述的高频带删除编码方法编码的编码数据进行解码而得到的解码后的低频带信号成分,实施使频带扩大的处理(以下,称为频带扩大处理)。
[第1实施方式的频带扩大装置的功能性构成例]
图3表示应用了本发明的频带扩大装置的功能性构成例。
频带扩大装置10,把解码后的低频带信号成分作为输入信号,对该输入信号,实施频带扩大处理,其结果,把所得到的频带扩大处理后的音乐信号作为输出信号进行输出。
频带扩大装置10由低通滤波器11、延迟电路12、带通滤波器13、频率包络提取电路14、高频带信号生成电路15、高通滤波器16和信号加法器17构成。
[第1实施方式的频带扩大装置的处理例]
图4是说明图3的频带扩大装置的处理(以下,称为频带扩大处理)的一例的流程图。
在步骤S1中,低通滤波器11,利用具有规定的截止频率的低通滤波器对输入信号进行滤波,把滤波后的信号向延迟电路12提供。
低通滤波器11可以设定任意的频率作为截止频率。但是,在本实施方式中,将后述的规定的频带作为扩大开始频带,对应此扩大开始频带的下端的频率来设定截止频率。因此,低通滤波器11把比扩大开始频带低的低频带信号成分(以下,称为低频带信号成分)作为滤波后的信号向延迟电路12提供。
另外,低通滤波器11也能够根据输入信号的高频带删除编码方法和比特率等的编码参数,把最佳的频率作为截止频率进行设定。作为该编码参数,例如,能够利用在专利文献1的频带扩大方法中所采用的边信息。
在步骤S2中,为了取得对低频带信号成分和后述的高频带信号成分进行加法运算时的同步,延迟电路12把低频带信号成分延迟规定的延迟时间向信号加法器17提供。
在步骤S3中,带通滤波器13把输入信号分割成多个子带信号,把分割后的多个子带信号的每个向频率包络提取电路14和高频带信号生成电路15提供。
也就是说,带通滤波器13由具有各不相同的通过频带的带通滤波器13-1至13-N构成。带通滤波器13-i(1≤i≤N)使输入信号之中的通过频带的信号通过,把通过后的信号作为多个子带信号之中的规定的1个进行输出。
在步骤S4中,频率包络提取电路14从来自带通滤波器13的多个子带信号中提取频率包络并向高频带信号生成电路15提供。
在步骤S5中,高频带信号生成电路15基于来自带通滤波器13的多个子带信号和来自频率包络提取电路14的频率包络,生成高频带信号成分。所谓高频带信号成分就是比扩大开始频带高的高频带的信号成分。
高通滤波器16作为具有与低通滤波器11中的截止频率相对应的截止频率的高通滤波器而构成。因此,在步骤S6中,高通滤波器16,利用高通滤波器对来自高频带信号生成电路15的高频带信号成分进行滤波,由此,来除去该高频带信号成分中包含的向低频带的返回成分等噪声,并向信号加法器17提供。
在步骤S7中,信号加法器17对来自延迟电路12的低频带信号成分和来自高通滤波器16的高频带信号成分进行加法运算,把加法运算后的信号作为输出信号向后级输出。
在本实施方式中,为了取得子带信号,采用了带通滤波器13。但是,用于取得子带信号的滤波器的构成不特别限定于图3的例。例如,作为其他的实施方式,也可以采用如专利文献1所记载的那样的频带分割滤波器。
另外,在本实施方式中,为了合成子带信号,采用了信号加法器17。但是,用于合成子带信号的构成不特别地限定于图3的例。例如,作为其他的实施方式可以采用如专利文献1所记载的那样的频带合成滤波器。
下面,就带通滤波器13至高频带信号生成电路15的各自的详细的处理例进行说明。
[带通滤波器13的详细的处理例]
首先,就带通滤波器13的处理例进行说明。
此外,为了说明的方便,在之后的说明中,设带通滤波器13的个数N=8。
例如,将把输入信号的尼奎斯特频率分割为32等分而得到的32个子带之中的1个作为扩大开始频带,把这些32个子带之中的比扩大开始频带低的低频带的规定的8个子带的每个作为8个带通滤波器13-1至13-8的通过频带的每个而采用。
图5表示8个带通滤波器13-1至13-8的各通过频带的每个在频率轴上的配置。
如图5所示那样,作为8个带通滤波器的各自的通过频带,从比扩大开始频带低的低频带的频带(子带)之中的高频带开始,分别分配了第1个子带sb-1至第8个子带sb-8。此外,所谓频率sb是扩大开始频带的下端的子带。因此,以下,为了与其他子带区别开来而把这些8个子带使用sb表示。
此外,在本实施方式中,将8个带通滤波器13-1至13-8的通过频带的每个设为把输入信号的尼奎斯特频率进行32等分而得到的32个子带之中的规定的8个的每个。但是,带通滤波器13不限定于本例。例如,8个带通滤波器13-1至13-8的通过频带的每个也可以是把输入信号的尼奎斯特频率进行256等分而得到的256个子带之中的规定的8个的每个。另外,8个带通滤波器13-1至13-8的各自的带宽也可以各不相同。
[频率包络提取电路14的处理例]
下面,就频率包络提取电路14的处理例进行说明。
频率包络提取电路14从由带通滤波器13输出的多个子带信号中提取频率包络。因此,以下,作为频率包络提取电路14的处理的一实施例,对把频率包络的一次倾斜作为频率包络进行利用的例进行说明。
首先,频率包络提取电路14根据由带通滤波器13输出的sb-8至sb-1为止的8个子带信号x(ib,n),求出某个一定的时间帧的功率。在此,ib是子带的索引,n表示离散时间的索引。
若将关于某个时间帧编号J的子带ib的子带信号的功率记述为power(ib,J),则用下面的式(1)表示power(ib,J)。
数学公式1
(sb-8≤ib≤sb-1) …(1)
使用该power(ib,J),利用下面的式(2)表示某个时间帧编号J的频率包络的一次倾斜slope(J)。
数学公式2
在式(2)中,W(ib)表示有关子带ib的加权系数。通过使用该加权系数W(ib)求出slope(J),能够减轻因编码而使特定的子带的信号成分丢失的情况的影响。此外,关于因编码而使特定的子带的信号成分丢失的情况的影响,在上述的专利文献1中详细地进行了记述。
如以上所述,在本例中,使用各子带信号的功率求出频率包络的一次倾斜slope(J)。但是,频率包络包络线的一次倾斜slope(J)的求法不限定于使用功率的求法。除此以外,例如,也可以使用各子带信号的振幅求出频率包络的一次倾斜slope(J)。
另外,频率包络提取电路14也可以构成为,根据从带通滤波器13输出的多个子带信号得到频率包络的多个一次倾斜。
[高频带信号生成电路15的处理例]
下面,对高频带信号生成电路15的处理例进行说明。
高频带信号生成电路15,基于从带通滤波器13输出的多个子带信号和从频率包络提取电路14输出的频率包络,生成高频带信号成分。因此,以下,作为高频带信号生成电路15的一实施例,说明把上述的频率包络的一次倾斜作为频率包络而生成高频带信号成分的例。
首先,高频带信号生成电路15把扩大开始频带sb之后的要扩大的频带(以下,称为频率扩大频带)的子带信号的每个设为映射目的地的子带信号。另外,高频带信号生成电路15把与该映射目的地的子带信号相对应的从带通滤波器13输出的多个子带信号之中的规定的1个子带信号设为映射源。高频信号生成电路15使用频率包络的一次倾斜slope(J)运算(推定)与映射源的子带信号相对的映射目的地的子带信号的增益量G(ib,J)。作为把针对频率包络的一次倾斜slope(J)的对数上的一次式进行线性变换后的形式,利用下面的式(3)表示该增益量G(ib,J)。
数学公式3
在式(3)中,αib、βib是具有按每个ib不同的值的系数。优选适当地设定各系数αib、βib,以针对各种各样的输入信号得到最佳的G(ib,J)。另外,优选各系数αib、βib也根据sb的改变而改变成最佳的值。此外,关于各系数αib、βib的运算方法的具体例将后述。
如上所述,在本例中使用针对slope(J)的对数上的一次式运算增益量G(ib,J)。但是,增益量G(ib,J)的求法不限定于使用一次式的求法。除此以外,例如,如果能够使用的计算资源有余量的话,可以使用针对slope(J)的对数上的n次式计算出增益量G(ib,J)。进而,不只是连续或者曲线函数近似,也可以使用代码库(cord book),根据频率包络计算出增益量G(ib,J)。
另外,增益量G(ib,J)也可以是把频率包络的多个一次倾斜作为输入,把增益量作为输出的函数。
然后,高频带信号生成电路15,通过使用下面的式(4),将利用式(3)得到的增益量G(ib,J)与带通滤波器13的输出相乘,来计算出增益调整后的子带信号x2(ib,n)。
数学公式4
x2(ib,n)=G(ib,J)*x(sbmap(ib),n)
(J*FSIZE≤n≤(J+1)*FSIZE-1,sb≤ib≤eb) …(4)
在式(4)中,eb表示频率扩大频带的最高频带的子带。另外,利用下面的式(5)表示把子带ib作为映射源的子带的情况下的映射目的地的子带sbmap(ib)。
数学公式5
sbmap(ib)=ib-8*INT((ib-sb)/8+1) …(5)
在此,高频带信号生成电路15对从sb到eb的频率扩大频带之中的每8个子带的频带内的各个子带信号进行加法运算。
以下把该每8个子带的频带设为jb,进行表示。
jb=0(sb<=ib<=sb+7)
jb=1(sb+8<=ib<=sb+15)
jb=2(sb+16<=ib<=eb)
此外,每8个子带的频带个数在上述的例中为3个。但是,每8个子带的频带的个数当然不限定于3个。
高频带信号生成电路15,按照下面的式(6),根据增益调整后的子带信号x2(ib,n)计算出子带信号x3(jb,n)。
数学公式6
(J*FSIZE≤n≤(J+1)*FSIZE-1,sb≤ib≤eb) …(6)
接着,高频带信号生成电路15按照下面的式(7),从与sb-8相对应的频率到与sb相对应的频率进行余弦调制,由此根据x3(jb,n)计算出x4(jb,n)。
数学公式7
x4(jb,n)=x3(jb,n)*2*cos(n*8*(jb+1)*pi/32)
(J*FSIZE≤n≤(J+1)*FSIZE-1.0≤jb≤2) …(7)
在式(7)中,pi表示圆周率。该式(7)意味着将增益调整后的子带信号x2(ib,n)分别以8个频带量向高频带进行了频率移位。
接着,高频带信号生成电路15按照下面的式(8),根据x4(jb,n)计算出高频带信号成分xhigh(n)。
数学公式8
这样,能够基于根据多个子带信号得到的频率包络,相适应地生成高频带信号成分。另外,能够根据输入信号的性质使频率扩大频带的频率包络的强度和形状发生变化。其结果,可生成高音质的信号。
[在式(3)中的系数αib、βib的求法]
接着,就上述的式(3)中的系数αib、βib的求法进行说明。
作为这些系数αib、βib的求法的方法,优选采用如下的方法:为了针对各种各样的输入信号得到适当的增益量G(ib,J),预先利用宽频带的教师信号(以下,称为宽频带教师信号)进行学习,基于该学习结果进行决定。
当进行系数αib、βib的学习时,采用系数学习装置,该系数学习装置配置了在比扩大开始频带sb高的高频带具有与图5中的带通滤波器13-1至13-8相同的通过带宽的带通滤波器。而且,系数学习装置在输入了宽频带教师信号后进行学习。
[系数学习装置的功能性构成例]
图6表示了用于进行系数αib、βib的学习的系数学习装置20的功能性构成例。
系数学习装置20由带通滤波器21、增益计算电路22、频率包络提取电路23和系数推定电路24构成。
带通滤波器21由具有各不相同的通过频带的多个带通滤波器21-1至21-(K+N)构成。带通滤波器21把输入信号(宽频带教师信号)分割为(K+N)个子带信号。带通滤波器21-(K+1)至21-(K+N)的输出信号、即比扩大开始频带sb低的低频带的多个子带信号被提供给频率包络提取电路23。另外,带通滤波器21-1至21-(K+N)的全部输出信号、即全部的子带信号被提供给增益计算电路22。
增益计算电路22每隔一定的时间帧计算比扩大开始频带sb低的低频带的子带信号和与在频带扩大装置10中该子带信号的频率移位目的地相当的频带的子带信号的增益量,并向系数推定电路24提供。
使用图7进一步说明增益计算电路22中的增益量的计算方法。
图7表示了与图5所示的输入信号相对应的时间帧中的宽频带信号的功率谱。
例如,在图7的例中,计算sb-8子带信号和与在频带扩大装置10中该子带信号的频率移位目的地相当的sb子带信号的增益量。这相当于,在频带扩大装置10中,sb-8子带信号在增益调整后被映射到sb子带。同样地计算sb-7子带信号和与在频带扩大装置10中该子带信号的频率移位目的地相当的sb+1子带信号的增益量。这相当于,sb-7子带信号在增益调整后被映射到sb+1子带。
在系数学习装置20中,如上述那样,在比扩大开始频带sb高的高频带配置了具有与图5中的带通滤波器13-1至13-8相同的带宽的带通滤波器21-1至21-K(K=8)。而且,在系数学习装置20中,输入了宽频带教师信号作为输入信号。由此,可能根据该映射源和映射目的地的子带信号计算增益量Gdb(ib,J)。具体地,例如,按照下面的式(9)计算增益量Gdb(ib,J)。
数学公式9
Gdb(ib,J)=10*log10〔power(ib,J)/power(sbmap(ib),J)〕…(9)
回到图6,频率包络提取电路23,每隔与在增益计算电路22中计算增益量时的一定的时间帧相同的时间帧,与图3的频率包络提取电路14同样地从多个子带信号中提取频率包络,并向系数推定电路24提供。
系数推定电路24,基于从增益计算电路22和频率包络提取电路23在同一时刻输出的频率包络和增益量的多个数量的组合,进行系数αib、βib的推定。具体地,例如,对于某个子带,根据把频率包络设为x轴,把增益量设为y轴的dB上的二维平面上的分布,利用最小二乘法决定式(3)中的系数αib、βib。此外,当然,对于系数αib、βib的决定方法不限定于使用最小二乘法,也可以采用一般的各种参数估计法。
通过这样预先使用宽频带教师信号进行学习,在频带扩大装置10中针对各种各样的信号能够得到适当的输出结果。
此外,作为时间帧J中的增益量,在上述的例中,采用了使用同一时间帧中的频率包络的增益量。但是,时间帧J中的增益量不限定于上述的例,除此以另外,例如,也可以采用使用了时间帧J的前后数帧中的频率包络的增益量。
在此,例如,在分别使用前后1帧的频率包络的情况下,能够如以下的式(10)那样求出式(3)中的G(ib,J)。
数学公式10
通过以这样的形式求出增益量G(ib,J),能够考虑时间轴上的频率包络的变化,进行更高精度的推定。该实施例,是利用前后1帧的频率包络的方式,但是,能够根据计算量设定该帧数,本发明不限定前后的帧数。
另外,也可以考虑时间帧J的前后的帧的功率等,使用按稳定/非稳定的情况而不同的映射函数进行运算的各增益量。另外,也可以考虑稳定、非稳定,适应地改变计算功率和频率包络的时间间隔FSIZE,由此计算出最优的增益量。
在此,关于稳定/非稳定,使用图8和图9的具体例进行说明。
图8是表示某个时间序列信号的波形的图。
将时间帧J至时间帧J+3的4个时间帧之中的、时间帧J、时间帧J+2和时间帧J+3设为稳定的时间帧。与此相对,将时间帧J+1设为非稳定的时间帧。
一般地,打击乐器的冲击部分和语音的子音部分被称为非稳定的的信号波形。在上述的MP3和AAC等一般性的音频编码方式中,为了对应这种稳定/非稳定的信号波形,采用了对非稳定的时间帧使用较短的时间帧等的对策。
图9图示了把这样短的时间帧应用到非稳定的帧中的例。
在本发明中,通过使用这样的稳定/非稳定的技术,能够适应性地改变时间间隔FSIZE。另外,在本发明中,能够使用按稳定/非稳定的情况而不同的映射函数来求出增益量Gdb(ib,J)。也就是说,能够计算出最优的增益量。
<第2实施方式>
接着,对第2实施方式进行说明。
第2实施方式也与第1实施方式同样,能够以更加高的音质再生输入信号。
[第2实施方式的频带扩大装置的功能性构成例]
图10表示应用了本发明的频带扩大装置的功能性构成例。
频带扩大装置30,把解码后的低频带信号成分作为输入信号,对该输入信号实施频带扩大处理,其结果,把所得到的频带扩大处理后的音乐信号作为输出信号进行输出。
频带扩大装置30由低通滤波器31、延迟电路32、带通滤波器33、高频带信号生成电路34、高通滤波器35和信号加法器36构成。
在此,第2实施方式的频带扩大装置30之中的低通滤波器31、延迟电路32、带通滤波器33、高通滤波器35和信号加法器36分别具有与第1实施方式的低通滤波器11、延迟电路12、带通滤波器13、高通滤波器16和信号加法器17同样的构成和功能。
因此,在此,省略这些处理的说明,以下,只说明高频带信号生成电路34的处理。
[高频带信号生成电路34的处理例]
首先,高频带信号生成电路34,对于从带通滤波器33输出的sb-8至sb-1的8个子带信号x(ib,n),按照式(1)求出某个一定的时间帧J中的功率power(ib,J)。
接着,高频带信号生成电路34使用子带信号的功率power(ib,J)进行线性结合,根据下面的式(11)推定频率扩大频带中的子带信号的所推定的功率power(ib,J)。
数学公式11
(J*FSIZE<=n<=(J+1)*FSIZE-1,sb<=ib<=eb)…(11)
在式(11)中,Aib,0,1(kb)和Bib是具有按每个子带ib而不同的值的系数。优选,适当地设定系数Aib,0,1(kb)和系数Bib,以针对各种各样的输入信号得到最佳的值。另外,优选,系数Aib,0,1(kb)和Bib也根据sb的改变而改变为最佳的值。
对于系数Aib,0,1(kb)和系数Bib的运算方法,与第1实施方式同样,可以通过使用宽频带教师信号进行学习来进行决定。
此外,在本例中,利用使用了从带通滤波器33输出的多个子带信号的各自功率的一次线性结合式计算出频率扩大频带中的子带信号的所推定的功率。但是,频率扩大频带中的子带信号的所推定的功率的计算方法不限定于本例,例如,与第一实施例同样,也可以采用使用时间帧J的前后多个帧的线性结合的方法,还可以采用使用非线性函数的方法。
式(12)是使用时间帧J的前后1帧的子带信号的功率的线性结合,计算出频率扩大频带中的子带信号功率的公式。
数学公式12
(J*FSIZE<=n<=(J+1)*FSIZE-1,sb<=ib<=eb)…(12)
通过以这样的形式求出功率power(ib,J),能够考虑时间轴上的子带信号的功率变化,从而进行更高精度的推定。该实施例是利用前后1帧的子带信号功率的方式,但是,可以根据计算量设定该帧数,本发明不限定前后的帧数。
式(13)是作为非线性函数的实施例而使用3次函数计算出频率扩大频带中的子带信号功率的公式。
数学公式13
(J*FSIZE<=n<=(J+1)*FSIZE-1,sb<=ib<=eb)…(13)
通过以这样的形式求出功率power(ib,J),能够以更高精度推定频率扩大频带中的子带信号功率。在该实施例中,使用了3次式的非线性函数,但是,可以根据计算量设定该次数,优选,在计算资源丰富的机器中采用多的次数。另外,本发明也可以应用把式(12)和式(13)组合的方式,可以根据机器的计算资源对该前后帧数和非线性函数的次数进行最优设定。另外,本发明,不限定该非线性的函数的次数和种类,能够应用各种各样的非线性函数。
接着,高频带信号生成电路34按照下面的式(14),使用从带通滤波器33输出的子带信号的功率power(sbmap(ib),J)和利用式(11)(或者式(12)或者式(13))所求出的频率扩大频带中的子带信号的所推定的功率power(ib,J),求出增益量G(ib,J)。
数学公式14
G(ib,J)=sqrt〔power(ib,J)/power(sbmap,J)〕
…(14)
(sb≤ib≤eb)
高频带信号生成电路34使用所求出的增益量G(ib,J)生成高频带信号成分。此外,作为使用增益量G(ib,J)生成高频带信号成分的方法,可以采用与第1实施方式同样的方法、即与使用式(4)至式(8)进行说明的方法同样的方法。
此外,第2实施方式也与第1实施方式同样,不只是连续或者曲线函数近似,也可以使用把根据带通滤波器33的输出得到的多个子带信号的功率作为输入并把增益量G(ib,J)作为输出那样的代码库。
这样,能够根据从带通滤波器33输出的多个子带信号的功率直接求出频率扩大频带的多个子带信号的各自的功率。而且,能够根据输入信号的性质使频率扩大频带的功率谱的强度和形状进行变化。其结果,能够生成高音质的信号。
[频率扩大频带中的子带信号的功率推定的其他例]
以上,说明了使用时间帧J的前后多个帧的例,但是在这种情况下,例如,对于式(12),必须准备具有与如下数量相等的要素数的系数A,即将频率扩大频带中的子带数和用于频率扩大频带中的子带信号的功率的推定的子带数以及前后帧数全部进行乘法运算而得到的数。系数A的要素数的增大导致运算所需要的存储器量的增大。
可是,在式(12)中,通过对各帧的各子带信号的功率乘以系数A的各要素并把这些乘积进行求和运算来推定频率扩大频带中的子带信号的功率。
也就是说,系数A的各要素的值的大小表示各帧的各子带信号的功率对频率扩大频带中的子带信号的功率的推定的贡献度,另外,可以考虑该贡献度包含表示时间方向(帧方向)的贡献度的成分和表示子带方向的贡献度的成分两方面。
可以将系数A分割为表示时间方向的贡献度的系数S和表示子带方向的贡献度的系数R,另外,若假定时间方向的贡献度在全部子带中是共同的,则能够减少系数S的要素数,其结果,能够减少用于推定的系数的全部要素数。
例如,高频带信号生成电路34能够如以下的式(15)那样使表示时间方向的贡献度的系数S在全部子带中共同化来运算式(12)。式(15)是使用时间帧J的前后1帧的子带信号的功率的线性结合,计算出频率扩大频带中的子带信号功率的公式。
数学公式15
(J*FSIZE<=n<=(J+1)*FSIZE-1,sb<=ib<=eb)…(15)
在式(15)中,系数Rib(kb)是表示进行线性结合的子带信号的功率的子带方向的贡献度的系数。系数S-1、系数S0和系数S+1是表示进行线性结合的子带信号的功率的时间方向的贡献度的系数。
如式(15)所示那样,在全部的子带中共同地使用表示时间方向的贡献度的系数S-1、系数S0和系数S+1。
在式(15)中,系数Rib(kb)和系数Cib是具有按由ib所指定的每个子带而不同的值的系数。优选适当地设定系数Rib(kb)、系数S-1、系数S0、系数S+1和系数Cib,以针对各种各样的输入信号得到最佳的值。另外,优选,也根据sb的改变,使系数Rib(kb)、系数S-1、系数S0、系数S+1和系数Cib改变为最佳的值。
与第1实施方式相同,可以通过使用宽频带教师信号进行学习来决定这些系数Rib(kb)、系数S-1、系数S0、系数S+1和系数Cib。
例如,把帧J的某个子带的前后1帧的功率PJ-1、PJ和PJ+1设为说明变量,把帧J的某个子带的功率P′J设为被说明变量进行最小二乘法等的回归分析,分别计算出系数S-1、系数S0和系数S+1。
此时,使用哪个子带计算出这些系数S都可以(在哪个子带中计算出系数S都得到大致相同的值)。
接着,关于各子带,把应用了该系数S-1、系数S0和系数S+1的功率{S-1*PJ-1+S0*PJ+S+1*PJ+1}设为说明变量,把推定频带的各子带功率设为被说明变量进行最小二乘法等的回归分析,计算出系数Rib(kb)和系数Cib。
这样,假定时间方向的贡献度在全部子带中是共同的,通过把表示该时间方向的贡献度的系数在全子带中共同使用,能够减少系数的全部要素数。例如,式(12)是使用3帧的3个子带推定频率扩大频带中的子带信号的功率的公式,但是,在这种情况下,用于推定的系数的全部要素数为(eb-sb+1)*10个。相对于此,在式(15)的方法中,用于推定的系数的全部要素数为(eb-sb+1)*2+3个。
这样,通过减少推定所需要的系数的全部要素数,能够减少对高频带功率的推定的运算所需要的存储器量。
另外,利用频带扩大装置30所推定的高频带功率存在其时间变动变大的倾向。存在由于该高频带成分的时间变动而给用户带来“吱啦吱啦”这样的听感的情况。
如式(15)所示那样,把多个时间帧的功率按每个子带置换为一个变量,与按每个子带进行功率的时间方向的平滑是等价的。因此,通过进行这样的运算,抑制了推定所使用的变量亦即功率的时间变动,抑制了利用功率所推定的值的时间变动。由此,能够缓和给用户带来的“吱啦吱啦感”。
此外,所推定出的功率的残差平方平均值的差,在使用式(15)进行推定的情况和使用式(12)进行推定的情况下,大体上没有变化。也就是说,如式(15)那样,即使使表示各子带的时间方向的贡献度的系数共同化,也得到大体上同等的推定精度(推定精度大体上不变化)。
<第3实施方式>
接着,对第3实施方式进行说明。
第3实施方式是对信号的编码和解码应用本发明进行高效率的编码的实施方式。
[第3实施方式的编码装置的功能性构成例]
图11表示应用了本发明的编码装置的功能性构成例。
编码装置40由子带分割电路41、低频带编码电路42、频率包络提取电路43、模拟高频带信号生成电路44、模拟高频带信号修正信息计算电路45、高频带编码电路46和多路复用电路47构成。
[第3实施方式的编码装置的处理例]
图12是说明图11的编码装置的处理(以下,称为编码处理)的一例的流程图。
在步骤S121中,子带分割电路41把输入信号等分割成具有某个已决定的带宽的多个子带信号。把这些多个子带信号之中的比某个频率低的频带的子带信号(以下,称为低频带子带信号)向低频带编码电路42、频率包络提取电路43和模拟高频带信号生成电路44提供。相对于此,把比某个频率高的频带的子带信号(以下,称为高频带子带信号)向模拟高频带信号修正信息计算电路45提供。
在步骤S122中,低频带编码电路42对从子带分割电路41输出的低频带子带信号进行编码,将作为其结果而得到的低频带编码数据提供给多路复用电路47。
有关该低频带子带信号的编码,根据编码效率和所要求的电路规模选择适当的编码方式即可,本发明不依赖于该编码方式。
在步骤S123中,频率包络提取电路43从由子带分割电路41所输出的低频带子带信号之中的多个子带信号中提取频率包络并向模拟高频带信号生成电路44提供。此外,频率包络提取电路43具有与第1实施的方式的频率包络提取电路14基本同样的结构和功能。因此,在此省略其处理等的说明。
在步骤S124中,模拟高频带信号生成电路44基于由子带分割电路41所输出的低频带子带信号之中的多个子带信号和由频率包络提取电路43所输出的频率包络,生成模拟高频带信号并向模拟高频带信号修正信息计算电路45提供。模拟高频带信号生成电路44进行基本上与第1实施的方式的高频带信号生成电路15相同的动作即可。不同之处只在于不需要用于改变子带信号的频率的余弦调制处理这一点。因此,在此省略其处理等的说明。
在步骤S125中,模拟高频带信号修正信息计算电路45基于由子带分割电路41所输出的高频带子带信号和由模拟高频带信号生成电路44所输出的模拟高频带信号,计算模拟高频带信号修正信息并向高频带编码电路46提供。
在此,对模拟高频带信号修正信息计算电路45的处理例进行说明。
首先,模拟高频带信号修正信息计算电路45,对由子带分割电路41所输出的高频带子带信号,计算某个一定的时间帧J中的功率power(ib,J)。此外,在该实施方式中,使用ib识别全部的低频带子带信号的子带和高频带子带信号的子带。对于功率的计算方法,能够采用与第1实施方式的计算方法相同的方法、即使用了式(1)的方法。
接着,模拟高频带信号修正信息计算电路45求出高频带子带信号的功率power(ib,J)和由模拟高频带信号生成电路44所输出的模拟高频带信号的某个一定的时间帧中的功率的差分powerdiff(ib,J)。能够利用下面的式(16)求出差分powerdiff(ib,J)。
数学公式16
powerdiff(ib,J)=power(ib,J)-powerlh(ib,J)
(sb≤ib≤eb) …(16)
在式(16)中,powerlh(ib,J)表示关于构成由模拟高频带信号生成电路44所输出的模拟高频带信号的子带信号(以下,称为模拟高频带子带信号)之中的子带ib的关于模拟高频带子带信号的时间帧J中的功率。在本实施方式中,sb表示高频带子带信号中的最低的子带。eb表示在高频带子带信号中进行编码的最高的子带。
接着,模拟高频带信号修正信息计算电路45对各子带ib中的差分powerdiff(ib,J)的绝对值是否在某个阈值A以下进行判定。
模拟高频带信号修正信息计算电路45在对全部的子带判定为powerdiff(ib,J)的绝对值在阈值A以下的情况下,将模拟高频带信号修正标志设为00。而且,模拟高频带信号修正信息计算电路45只把该模拟高频带信号修正标志作为模拟高频带信号修正信息向高频带编码电路46提供。
与此相对,模拟高频带信号修正信息计算电路45,在判定为某个子带ib中的powerdiff(ib,J)的绝对值超过了阈值A的情况下,将模拟高频带信号修正标志设为01。模拟高频带信号修正信息计算电路45把该子带ib中的powerdiff(ib,J)本身作为模拟高频带信号修正数据,和模拟高频带信号修正标志一起向高频带编码电路46提供。
另外,模拟高频带信号修正信息计算电路45,在判定为某个子带ib中的powerdiff(ib,J)的绝对值在比阈值A更大的某个阈值B以上的情况下,将模拟高频带信号修正标志设为10。模拟高频带信号修正信息计算电路45把该子带ib中的power(ib,J)本身作为高频带信号数据,与模拟高频带信号修正标志一起向高频带编码电路46提供。
在步骤S126中,高频带编码电路46对模拟高频带信号修正信息进行编码。据此,因为高频带子带信号被编码成数据量较少的模拟高频带信号修正标志、模拟高频带信号修正数据或者高频带信号数据,所以实现了高效率编码。高频带编码电路46把通过编码而得到的高频带编码数据向多路复用电路47提供。
此外,作为高频带编码电路46的编码方式,与低频带子带信号的编码方式相同,可以根据编码效率和电路规模采用周知的一般的编码方式。
在步骤S127中,多路复用电路47把由低频带编码电路42所输出的低频带编码数据和由高频带编码电路46所输出的高频带编码数据进行多路复用,并输出输出代码串。
图13表示输出代码串的一例。
在时间帧J中,因为只对模拟高频带信号修正标志00进行了编码而未对模拟高频带信号修正数据进行编码,所以能够把更多的比特用于低频带子带信号的编码。
另外,在高频带信号和模拟高频带信号有很大不同那样的时间帧J+2的例中,作为高频带信号数据,记录power(ib,J)其本身,由此能够防止音质的劣化。
[第3实施方式的解码装置的功能性构成例]
图14表示与图11的第3实施方式的编码装置相对应的解码装置的功能性构成例。也就是说,图14表示应用了本发明的解码装置50的构成例。
解码装置50由解复用电路51、低频带解码电路52、频率包络提取电路53、模拟高频带信号生成电路54、高频带解码电路55、模拟高频带信号修正电路56和子带合成电路57构成。
[第3实施方式的解码装置的处理例]
图15是说明图14的解码装置的处理(以下,称为解码处理)的一例的流程图。
在步骤S141中,解复用电路51,把输入代码串解复用成高频带编码数据和低频编带码数据。把低频带编码数据向低频带解码电路52提供,把高频带编码数据向高频带解码电路55提供。
在步骤S142中,低频带解码电路52进行由解复用电路51所输出的低频带编码数据的解码。将作为其结果而得到的低频带子带信号向频率包络提取电路53、模拟高频带信号生成电路54和子带合成电路57提供。
在步骤S143中,频率包络提取电路53从由低频带解码电路52所输出的低频带子带信号之中的多个子带信号中提取频率包络,并向模拟高频带信号生成电路54提供。频率包络提取电路53具有与编码装置40的频率包络提取电路43基本上同样的结构和功能。因此,在此,省略了对其处理等的说明。
在步骤S144中,模拟高频带信号生成电路54基于由低频带解码电路52所输出的低频带子带信号之中的多个子带信号和由频率包络提取电路53所输出的频率包络,生成模拟高频带信号。把模拟高频带信号向模拟高频带信号修正电路56提供。模拟高频带信号生成电路54具有与编码装置40的模拟高频带信号生成电路44基本上同样的结构和功能。因此,在此,省略了其处理等的说明。
在步骤S145中,高频带解码电路55进行由解复用电路51所输出的高频带编码数据的解码,将作为其结果而得到的模拟高频带信号修正信息向模拟高频带信号修正电路56提供。
在步骤S146中,模拟高频带信号修正电路56使用由高频带解码电路55所输出的模拟高频带信号修正信息,修正由模拟高频带信号生成电路54所输出的模拟高频带信号。其结果,得到高频带子带信号,并向子带合成电路57提供。
在此,如果模拟高频带信号修正信息中的模拟高频带信号修正标志为00,则把模拟高频带信号作为高频带子带信号进行输出。如果模拟高频带信号修正标志为01,则使用模拟高频带信号修正数据进行模拟高频带信号的修正,如果模拟高频带信号修正标志为10,则使用高频带信号数据进行模拟高频带信号的修正,输出作为其结果而得到的高频带子带信号。
在步骤S147中,子带合成电路57根据低频带解码电路52所输出的低频带子带信号和模拟高频带信号修正电路56所输出的高频带子带信号进行子带合成。将作为其结果而得到的信号作为输出信号进行输出。
这样,关于高频带的信号成分,通常,能够使用来自低频带的模拟高频带信号进行编码,以使只在需要的情况下以较少的比特量进行其修正。其结果,即使在低比特率时也能够对各种各样的音源进行高效率的编码。
进而,关于信号的编码和解码,也可以以如下方式处理在编码装置40和解码装置50的模拟高频带信号生成电路44、54所执行的式(3)和式(11)那样的函数的系数数据。也就是说,也可以根据输入信号的种类使用不同的系数数据,并把该系数记录于代码串的前头。
例如,可以根据语音或爵士乐等信号来改变系数数据,由此来实现编码效率的提高。
图16是表示这样得到的代码串的图。
图16的A的代码串是把语音进行了编码的代码串,将对语音最佳的系数数据α记录于头。
相对于此,图16的B的代码串,是把爵士乐进行了编码的代码串,将对爵士乐最佳的系数数据β记录于头。
也可以,通过预先利用同种的音乐信号进行学习来准备这样的多个系数数据,在编码装置40中,利用记录于输入信号的头中那样的种类信息选择其系数数据。或者还可以通过进行信号的波形分析来判定种类,选择系数数据。也就是说,不特别限定这样的信号种类分析方法。
另外,如果计算时间容许的话,也可以将上述的学习装置内置于编码装置40中,使用其信号专用的系数进行处理,最后把其系数记录于头。
另外,也可以采用把这样的系数数据在数帧中插入一次那样的方式。
在以前所述的第3实施方式中的模拟高频带信号生成电路44和模拟高频带信号生成电路54进行与第1实施方式的高频带信号生成电路15基本上相同的动作即可,但是本发明也能够使用第2实施方式的高频带信号生成电路34进行该模拟高频带信号生成电路的动作。另外,也可以,对模拟高频带信号修正信息设定模拟高频带信号生成方法的选择标志,根据标志的值不同,对模拟高频带信号生成的方法,选择利用与第一实施方式相应的方法进行,还是利用与第二实施方式相应的方法进行。
对于上述的一系列的处理,可以利用硬件来执行,也可以利用软件来执行。在利用软件执行一系列的处理的情况下,把构成该软件的程序从程序记录介质向专用的硬件中的计算机、或者通过安装各种程序能够执行各种功能例如通用的个人计算机等中进行安装。
图17是通过程序执行上述的一系列的处理的计算机的硬件的构成例的方框图。
在计算机中,CPU101、ROM(Read Only Memory只读存储器)102、RAM(Random Access Memory随机访问存储器)103通过总线104相互连接。
进而,输入输出接口105与总线104连接。由键盘、鼠标、麦克风等构成的输入部106、由显示器、扬声器等构成的输出部107、由硬盘和非易失性存储器等构成的存储部108、由网络接口等构成的通信部109及驱动磁盘、光盘、光磁盘或者半导体存储器等的可移动介质111的驱动器110与输入输出接口105连接。
如以上那样构成的计算机,例如,CPU101将存储部108中所存储的程序,通过输入输出接口105和总线104下载到RAM103并执行,由此进行上述的一系列的处理。
将计算机(CPU101)执行的程序,例如,记录于作为由磁盘(包含软盘)、光盘(CD-ROM(Compact Disc-Read Only Memory小型盘-只读存储器)、DVD(Digital Versatile Disc数字通用盘)等)、光磁盘或半导体存储器等构成的可换型封装存储介质的可移动介质111,或者通过所谓局域网、互联网、数字卫星广播之类的有线或者无线的传输介质来提供。
而且,能够通过把可移动介质111装入驱动器110中借助于输入输出接口105,将程序安装在存储部108。另外,能够通过有线或者无线的传输介质,利用通信部109接收程序,并安装在存储部108。另外,能够在ROM102和存储部108中预先安装程序。
此外,计算机执行的程序,可以是按着本说明书中说明的顺序进行时间序列处理的程序,并列地,或者也可以是在进行了调用时等需要的时刻进行处理的程序。
此外,本发明的实施方式不限定于上述的实施方式,在不脱离本发明的主旨的范围内,可以进行各种改变。
Claims (31)
1.一种频带扩大装置,其中,具备:
多个带通滤波器,根据输入信号得到多个子带信号;
频率包络提取电路,从利用上述多个带通滤波器得到的多个子带信号中提取频率包络;和
高频带信号生成电路,基于利用上述频率包络提取电路得到的频率包络和利用上述带通滤波器得到的多个子带信号生成高频带信号成分,
其中,使用利用上述高频带信号生成电路所生成的上述高频带信号成分,扩大上述输入信号的频带。
2.根据权利要求1记载的频带扩大装置,其中,
上述频率包络提取电路根据利用上述多个带通滤波器得到的多个子带信号得到频率包络的一次倾斜。
3.根据权利要求1或者权利要求2记载的频带扩大装置,其中,
在上述频率包络提取电路中,在从利用上述多个带通滤波器得到的多个子带信号中提取频率包络时,使用多个子带信号的功率。
4.根据权利要求1或者权利要求2记载的频带扩大装置,其中,
在上述频率包络提取电路中,在从利用上述多个带通滤波器得到的多个子带信号中提取频率包络时,使用多个子带信号的振幅。
5.根据权利要求2记载的频带扩大装置,其中,
对于上述频率包络,频率包络的计算区间与上述输入信号的稳定性相应而改变。
6.根据权利要求1记载的频带扩大装置,其中,
上述频率包络提取电路根据利用上述多个带通滤波器得到的多个子带信号得到频率包络的多个一次倾斜。
7.根据权利要求1记载的频带扩大装置,其中,
上述高频带信号生成电路,具备增益量计算电路,该增益量计算电路根据利用上述频率包络提取电路得到的频率包络按每个子带求出增益量,
把上述增益量应用于利用上述多个带通滤波器得到的多个子带信号。
8.根据权利要求7记载的频带扩大装置,其中,
上述增益量计算电路,根据利用时间轴上的多个块所计算出的频率包络按每个子带求出增益量。
9.根据权利要求2记载的频带扩大装置,其中,
根据利用上述多个带通滤波器得到的多个子带信号通过加权计算出上述频率包络的一次倾斜。
10.根据权利要求7记载的频带扩大装置,其中,
上述增益量计算电路,利用预先通过把宽频带信号作为教师数据进行学习而得到的映射函数计算出增益量。
11.根据权利要求10记载的频带扩大装置,其中,
上述映射函数把一次倾斜作为输入并把增益量作为输出。
12.根据权利要求10记载的频带扩大装置,其中,
上述映射函数把多个一次倾斜作为输入并把增益量作为输出。
13.根据权利要求10记载的频带扩大装置,其中,
上述映射函数把对数上的一次倾斜作为输入并把对数上的增益量作为输出。
14.根据权利要求2记载的频带扩大装置,其中,
还具备高频带子带强度生成电路,该高频带子带强度生成电路根据利用上述多个带通滤波器得到的多个子带信号生成频率扩大频带的各高频带子带强度。
15.根据权利要求14记载的频带扩大装置,其中,
上述高频带子带强度生成电路,根据利用上述多个带通滤波器得到的多个子带信号强度的线性结合,计算出频率扩大频带的各高频带子带的强度。
16.根据权利要求14记载的频带扩大装置,其中,
上述高频带子带强度生成电路,根据利用时间轴上的多个块所计算出的多个子带信号强度的线性结合,计算出频率扩大频带的各高频带子带的强度。
17.根据权利要求16记载的频带扩大装置,其中,
上述高频带子带强度生成电路,使用把利用时间轴上的多个块所计算出的多个子带信号强度按每个子带置换为一个变量后的子带信号强度,计算出频率扩大频带的各高频带子带的强度。
18.根据权利要求14记载的频带扩大装置,其中,
上述高频带子带强度生成电路,根据利用上述多个带通滤波器得到的多个子带信号强度,通过使用非线性函数计算出频率扩大频带的各高频带子带的强度。
19.根据权利要求14记载的频带扩大装置,其中,
上述高频带子带强度生成电路,根据利用时间轴上的多个块所计算出的多个子带信号强度,通过使用非线性函数计算出频率扩大频带的各高频带子带的强度。
20.根据权利要求18或者权利要求19记载的频带扩大装置,其中,
上述非线性函数是任意次数的函数。
21.根据权利要求14至16之中任意一项记载的频带扩大装置,其中,
上述高频带子带强度生成电路的输入和输出,分别是利用上述多个带通滤波器得到的多个子带信号的功率以及高频带子带的功率。
22.根据权利要求14至16之中任意一项记载的频带扩大装置,其中,
上述高频带子带强度生成电路的输入和输出分别是利用上述多个带通滤波器所得到的多个子带信号的振幅和高频带子带的振幅。
23.根据权利要求15记载的频带扩大装置,其中,
上述增益量计算电路,利用映射函数计算出增益量,该映射函数具有预先通过把宽频带信号作为教师数据进行学习而得到的系数。
24.一种频带扩大方法,其中,
频带扩大装置,
根据输入信号得到多个子带信号,
从所得到的多个子带信号中提取频率包络,
基于提取出的上述频率包络和所得到的上述多个子带信号生成高频带信号成分,
使用所生成的上述高频带信号成分扩大上述输入信号的频率频带。
25.一种程序,其中,
使控制频带扩大装置的计算机执行包含下列步骤的控制处理:
根据输入信号得到多个子带信号,
从所得到的多个子带信号中提取频率包络,
基于提取出的上述频率包络和所得到的上述多个子带信号,生成高频带信号成分,
使用所生成的上述高频带信号成分,扩大上述输入信号的频率频带。
26.一种编码装置,其中,具备:
子带分割电路,把输入信号分割成多个子带,生成由低频带侧的多个子带所构成的低频带子带信号和由高频带侧的多个子带所构成的高频带子带信号;
低频带编码电路,对上述低频带子带信号进行编码,生成低频带编码数据;频率包络提取电路,从上述低频带子带信号中提取频率包络;
模拟高频带信号生成电路,根据利用上述频率包络提取电路所得到的频率包络和上述低频带子带信号生成模拟高频带信号;
模拟高频带信号修正信息计算电路,比较利用上述子带分割电路所得到的高频带子带信号和利用上述模拟高频带信号生成电路所生成的模拟高频带信号,得到模拟高频带信号修正信息;
高频带编码电路,对上述模拟高频带信号修正信息进行编码,生成高频带编码数据;和
多路复用电路,对利用上述低频带编码电路所生成的低频带编码数据和利用上述高频带编码电路所生成的高频带编码数据进行多路复用,得到输出代码串。
27.一种编码方法,其中,包含如下步骤:
信号编码装置,
把输入信号分割成多个子带,生成由低频带侧的多个子带构成的低频带子带信号和由高频带侧的多个子带构成的高频带子带信号,
对上述低频带子带信号进行编码,生成低频带编码数据,
从上述低频带子带信号中提取频率包络,
根据提取出的上述频率包络和上述低频带子带信号生成模拟高频带信号,
比较上述高频带子带信号和所生成的上述模拟高频带信号,得到模拟高频带信号修正信息,
并对上述模拟高频带信号修正信息进行编码,生成高频带编码数据,
把所生成的低频带编码数据和所生成的上述高频带编码数据进行多路复用而得到输出代码串。
28.一种程序,其中,使控制编码装置的计算机执行包含下列步骤的控制处理:
把输入信号分割成多个子带,
生成由低频带侧的多个子带构成的低频带子带信号和由高频带侧的多个子带构成的高频带子带信号,
对上述低频带子带信号进行编码,生成低频带编码数据,
从上述低频带子带信号中提取频率包络,
根据提取出的上述频率包络和上述低频带子带信号生成模拟高频带信号,
比较上述高频带子带信号和所生成的上述模拟高频带信号,得到模拟高频带信号修正信息,
并对上述模拟高频带信号修正信息进行编码,生成高频带编码数据,
把所生成的低频带编码数据和所生成的上述高频带编码数据进行多路复用而得到输出代码串。
29.一种解码装置,其中,具备:
解复用电路,对所输入的编码数据进行解复用生成低频带编码数据和高频带编码数据;
低频带解码电路,对上述低频带编码数据进行解码,生成低频带子带信号;频率包络提取电路,从上述低频带子带信号的多个子带信号中提取频率包络;
模拟高频带信号生成电路,根据利用上述频率包络提取电路所得到的频率包络和上述低频带子带信号生成模拟高频带信号;
高频带解码电路,对上述高频带编码数据进行解码,生成模拟高频带信号修正信息;和
模拟高频带信号修正电路,使用上述模拟高频带信号修正信息修正上述模拟高频带信号并生成修正模拟高频带信号。
30.一种解码方法,其中,包含如下步骤:
解码装置,
对所输入的编码数据进行解复用,生成低频带编码数据和高频带编码数据,
对上述低频带编码数据进行解码,生成低频带子带信号,
从上述低频带子带信号的多个子带信号中提取频率包络,
根据提取出的频率包络和上述低频带子带信号生成模拟高频带信号,
对上述高频带编码数据进行解码,生成模拟高频带信号修正信息,
使用上述模拟高频带信号修正信息修正上述模拟高频带信号并生成修正模拟高频带信号。
31.一种程序,其中,使控制解码装置的计算机执行包含如下的步骤处理:
对所输入的编码数据进行解复用,生成低频带编码数据和高频带编码数据,
对上述低频带编码数据进行解码,生成低频带子带信号,
从上述低频带子带信号的多个子带信号中提取频率包络,
根据提取出的频率包络和上述低频带子带信号生成模拟高频带信号,
对上述高频带编码数据进行解码,生成模拟高频带信号修正信息,
使用上述模拟高频带信号修正信息修正上述模拟高频带信号并生成修正模拟高频带信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008-221655 | 2008-08-29 | ||
JP2008221655 | 2008-08-29 | ||
PCT/JP2009/065033 WO2010024371A1 (ja) | 2008-08-29 | 2009-08-28 | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101836254A true CN101836254A (zh) | 2010-09-15 |
Family
ID=41721534
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200980100820A Pending CN101836254A (zh) | 2008-08-29 | 2009-08-28 | 频带扩大装置和方法、编码装置和方法、解码装置和方法及程序 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20110137659A1 (zh) |
EP (1) | EP2317509A4 (zh) |
JP (1) | JP2010079275A (zh) |
CN (1) | CN101836254A (zh) |
BR (1) | BRPI0905368A2 (zh) |
RU (1) | RU2454738C2 (zh) |
WO (1) | WO2010024371A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102576544A (zh) * | 2009-10-07 | 2012-07-11 | 索尼公司 | 频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序 |
CN103001652A (zh) * | 2011-09-13 | 2013-03-27 | 株式会社日立制作所 | 数据多路复用传送系统、多路复用传送信号接收装置及多路复用传送信号发送装置 |
CN103155031A (zh) * | 2010-10-15 | 2013-06-12 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CN104299614A (zh) * | 2013-07-16 | 2015-01-21 | 华为技术有限公司 | 解码方法和解码装置 |
TWI498885B (zh) * | 2011-01-14 | 2015-09-01 | Sony Corp | The signal processing apparatus and method, and a signal processing program |
CN105122359A (zh) * | 2013-04-10 | 2015-12-02 | 杜比实验室特许公司 | 语音去混响的方法、设备和系统 |
CN105229738A (zh) * | 2013-01-29 | 2016-01-06 | 弗劳恩霍夫应用研究促进协会 | 用于使用能量限制操作产生频率增强信号的装置及方法 |
CN104584428B (zh) * | 2012-06-19 | 2017-10-27 | 无线电广播技术研究所有限公司 | 子带分裂器单元和提供有子带分裂器单元的包络曲线检测器 |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5928539B2 (ja) * | 2009-10-07 | 2016-06-01 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5850216B2 (ja) * | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) * | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6103324B2 (ja) * | 2010-04-13 | 2017-03-29 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
ES2942867T3 (es) * | 2010-07-19 | 2023-06-07 | Dolby Int Ab | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
US8560330B2 (en) * | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
AR085895A1 (es) * | 2011-02-14 | 2013-11-06 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio |
JP5975243B2 (ja) | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6037156B2 (ja) * | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) * | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
GB2500392B (en) * | 2012-03-19 | 2014-05-14 | Broadcom Corp | Filtering |
JP2014026138A (ja) | 2012-07-27 | 2014-02-06 | Sony Corp | 周波数帯域拡大装置および方法、並びにプログラム |
MY197063A (en) | 2013-04-05 | 2023-05-23 | Dolby Int Ab | Companding system and method to reduce quantization noise using advanced spectral extension |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
DE102014202220B3 (de) | 2013-12-03 | 2015-05-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur Herstellung eines Deckelsubstrats und gehäustes strahlungsemittierendes Bauelement |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
JP6452591B2 (ja) * | 2015-10-27 | 2019-01-16 | 日本電信電話株式会社 | 合成音声品質評価装置、合成音声品質評価方法、プログラム |
CN110556122B (zh) * | 2019-09-18 | 2024-01-19 | 腾讯科技(深圳)有限公司 | 频带扩展方法、装置、电子设备及计算机可读存储介质 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581653A (en) * | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3189598B2 (ja) * | 1994-10-28 | 2001-07-16 | 松下電器産業株式会社 | 信号合成方法および信号合成装置 |
JP3189614B2 (ja) * | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
JP3538122B2 (ja) * | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US7400651B2 (en) * | 2001-06-29 | 2008-07-15 | Kabushiki Kaisha Kenwood | Device and method for interpolating frequency components of signal |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
EP1939862B1 (en) * | 2004-05-19 | 2016-10-05 | Panasonic Intellectual Property Corporation of America | Encoding device, decoding device, and method thereof |
JP2006023658A (ja) * | 2004-07-09 | 2006-01-26 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置及びオーディオ信号符号化方法 |
WO2007052088A1 (en) * | 2005-11-04 | 2007-05-10 | Nokia Corporation | Audio compression |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
ATE528750T1 (de) * | 2006-05-10 | 2011-10-15 | Panasonic Corp | Kodierungsvorrichtung und -verfahren |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
DE602006009927D1 (de) * | 2006-08-22 | 2009-12-03 | Harman Becker Automotive Sys | Verfahren und System zur Bereitstellung eines Tonsignals mit erweiterter Bandbreite |
US8295507B2 (en) * | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
EP1947644B1 (en) * | 2007-01-18 | 2019-06-19 | Nuance Communications, Inc. | Method and apparatus for providing an acoustic signal with extended band-width |
GB0704622D0 (en) * | 2007-03-09 | 2007-04-18 | Skype Ltd | Speech coding system and method |
-
2009
- 2009-08-07 JP JP2009184711A patent/JP2010079275A/ja active Pending
- 2009-08-20 RU RU2010115883/08A patent/RU2454738C2/ru not_active IP Right Cessation
- 2009-08-28 US US12/739,106 patent/US20110137659A1/en active Granted
- 2009-08-28 BR BRPI0905368-9A patent/BRPI0905368A2/pt not_active IP Right Cessation
- 2009-08-28 EP EP09810019.1A patent/EP2317509A4/en not_active Withdrawn
- 2009-08-28 WO PCT/JP2009/065033 patent/WO2010024371A1/ja active Application Filing
- 2009-08-28 CN CN200980100820A patent/CN101836254A/zh active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102576544B (zh) * | 2009-10-07 | 2014-06-25 | 索尼公司 | 频带扩展设备和方法、编码设备和方法、解码设备和方法 |
CN102576544A (zh) * | 2009-10-07 | 2012-07-11 | 索尼公司 | 频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序 |
CN103155031A (zh) * | 2010-10-15 | 2013-06-12 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CN103155031B (zh) * | 2010-10-15 | 2015-04-01 | 索尼公司 | 音乐信号编码装置和方法以及音乐信号解码装置和方法 |
TWI498885B (zh) * | 2011-01-14 | 2015-09-01 | Sony Corp | The signal processing apparatus and method, and a signal processing program |
CN103001652A (zh) * | 2011-09-13 | 2013-03-27 | 株式会社日立制作所 | 数据多路复用传送系统、多路复用传送信号接收装置及多路复用传送信号发送装置 |
CN104584428B (zh) * | 2012-06-19 | 2017-10-27 | 无线电广播技术研究所有限公司 | 子带分裂器单元和提供有子带分裂器单元的包络曲线检测器 |
CN105229738B (zh) * | 2013-01-29 | 2019-07-26 | 弗劳恩霍夫应用研究促进协会 | 用于使用能量限制操作产生频率增强信号的装置及方法 |
CN105229738A (zh) * | 2013-01-29 | 2016-01-06 | 弗劳恩霍夫应用研究促进协会 | 用于使用能量限制操作产生频率增强信号的装置及方法 |
US10354665B2 (en) | 2013-01-29 | 2019-07-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands |
CN105122359A (zh) * | 2013-04-10 | 2015-12-02 | 杜比实验室特许公司 | 语音去混响的方法、设备和系统 |
CN104299614A (zh) * | 2013-07-16 | 2015-01-21 | 华为技术有限公司 | 解码方法和解码装置 |
CN104299614B (zh) * | 2013-07-16 | 2017-12-29 | 华为技术有限公司 | 解码方法和解码装置 |
US10102862B2 (en) | 2013-07-16 | 2018-10-16 | Huawei Technologies Co., Ltd. | Decoding method and decoder for audio signal according to gain gradient |
RU2628159C2 (ru) * | 2013-07-16 | 2017-08-15 | Хуавэй Текнолоджиз Ко., Лтд. | Способ декодирования и устройство декодирования |
WO2015007114A1 (zh) * | 2013-07-16 | 2015-01-22 | 华为技术有限公司 | 解码方法和解码装置 |
US10741186B2 (en) | 2013-07-16 | 2020-08-11 | Huawei Technologies Co., Ltd. | Decoding method and decoder for audio signal according to gain gradient |
Also Published As
Publication number | Publication date |
---|---|
BRPI0905368A2 (pt) | 2015-06-30 |
US20110137659A1 (en) | 2011-06-09 |
JP2010079275A (ja) | 2010-04-08 |
RU2010115883A (ru) | 2011-10-27 |
RU2454738C2 (ru) | 2012-06-27 |
EP2317509A1 (en) | 2011-05-04 |
EP2317509A4 (en) | 2014-06-11 |
WO2010024371A1 (ja) | 2010-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101836254A (zh) | 频带扩大装置和方法、编码装置和方法、解码装置和方法及程序 | |
KR101681860B1 (ko) | 복호 장치 및 방법, 및 기록 매체 | |
US20180330746A1 (en) | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program | |
CN1992533B (zh) | 信号编码设备和方法、信号译码设备和方法、程序及介质 | |
CN103155031B (zh) | 音乐信号编码装置和方法以及音乐信号解码装置和方法 | |
CN103765509B (zh) | 编码装置及方法、解码装置及方法 | |
KR101801996B1 (ko) | 신호 처리 장치 및 방법, 부호화 장치 및 방법, 복호 장치 및 방법, 및 컴퓨터로 판독가능한 기록 매체 | |
EP1377966B9 (en) | Audio compression | |
CN101006496B (zh) | 可分级音频编码 | |
CN103050126A (zh) | 音频信号处理设备、音频信号处理方法及程序 | |
JPH066236A (ja) | 高能率符号化及び/又は復号化装置 | |
CN102099855A (zh) | 频谱平滑化装置、编码装置、解码装置、通信终端装置、基站装置以及频谱平滑化方法 | |
CN104575487A (zh) | 一种语音信号的处理方法及装置 | |
US8788277B2 (en) | Apparatus and methods for processing a signal using a fixed-point operation | |
JP4441989B2 (ja) | 符号化装置および符号化方法 | |
JP5189760B2 (ja) | 信号処理方法、信号処理装置及びプログラム | |
US8086448B1 (en) | Dynamic modification of a high-order perceptual attribute of an audio signal | |
KR100592399B1 (ko) | 디지털 압축오디오에 있어서 입체음향효과 생성방법 | |
JP5569476B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
JP4993992B2 (ja) | 信号処理方法、信号処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100915 |
|
RJ01 | Rejection of invention patent application after publication |