CN103996401B - 解码设备和解码方法 - Google Patents
解码设备和解码方法 Download PDFInfo
- Publication number
- CN103996401B CN103996401B CN201410208805.5A CN201410208805A CN103996401B CN 103996401 B CN103996401 B CN 103996401B CN 201410208805 A CN201410208805 A CN 201410208805A CN 103996401 B CN103996401 B CN 103996401B
- Authority
- CN
- China
- Prior art keywords
- frequency
- band
- frequency sub
- sub
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 127
- 238000004364 calculation method Methods 0.000 claims description 112
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 162
- 230000014509 gene expression Effects 0.000 description 117
- 239000013598 vector Substances 0.000 description 96
- 238000011156 evaluation Methods 0.000 description 65
- 230000008859 change Effects 0.000 description 35
- 238000001228 spectrum Methods 0.000 description 31
- 238000000611 regression analysis Methods 0.000 description 22
- 238000007665 sagging Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 19
- 239000012634 fragment Substances 0.000 description 17
- 230000006870 function Effects 0.000 description 13
- 230000005611 electricity Effects 0.000 description 11
- 230000015654 memory Effects 0.000 description 11
- 230000001755 vocal effect Effects 0.000 description 11
- 238000001914 filtration Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000010606 normalization Methods 0.000 description 8
- 230000007480 spreading Effects 0.000 description 8
- 238000003892 spreading Methods 0.000 description 8
- 230000005484 gravity Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000000205 computational method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 229940075591 dalay Drugs 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000005111 flow chemistry technique Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000023886 lateral inhibition Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
本发明公开了一种解码设备和解码方法。该解码设备包括:多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成至少低频编码数据和索引;低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成所述低频子带的每一个的低频子带信号;以及生成装置,所述生成装置被配置成基于所述索引和所述低频子带信号来生成所述高频信号。
Description
本申请为2010年9月29日提交的国际申请号为PCT/JP2010/066882、发明名称为“频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序”的PCT申请的分案申请,该PCT申请进入中国国家阶段日期为2012年4月6日,国家申请号为201080045206.6。
技术领域
本发明涉及频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序,具体地涉及其中由于频带的扩展而使得音乐信号能够以较高的音质进行播放的频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序。
背景技术
近年来,通过网络等来分发音乐数据的音乐分发服务越来越被广泛地使用。对于这样的音乐分发服务,通过编码音乐信号而获得的编码数据被作为音乐数据分发。作为音乐信号的编码方法,抑制编码数据的文件容量并降低比特率以便于减小降低在下载事件中花费的时间量的编码方法已成为主流。
这样的音乐信号编码方法大体上分为:例如MP3(MPEG(运动图像专家组)音频层3)(国际标准ISO/IEC11172-3)等的编码方法;以及例如HE-AAC(高效MPEG4AAC)(国际标准ISO/IEC14496-3)等的编码方法。
在由MP3代表的编码方法中,删除了很难被人耳检测到的、大约15kHz或更高的高频带(下文称为“高频”)的音乐信号分量,并对剩余的低频带(下文称为“低频”)的信号分量进行编码。这种编码方法在下文中将被称为高频删除编码方法。关于该高频删除编码方法,可以抑制编码数据的文件容量。然而,高频声音可以尽管极细微地被人检测到,所以如果根据通过解码所述编码数据获得的解码后的音乐信号来生成并输出声音,会发生音质的劣化,例如丢失原始声音所具有的真实感或声音变得低沉。
相反地,在由HE-AAC代表的编码方法中,从高频信号分量中提取特征信息,并且该特征信息与低频信号分量一起编码。这种编码方法将在下文中称为高频特征编码方法。在高频特征编码方法中,只有高频信号分量的特征信息被编码为与高频信号分量相关的信息,由此可以在抑制音质的劣化的同时提高编码效率。
在解码已使用高频特征编码方法进行编码的编码数据中,低频信号分量和特征信息被解码,并且根据解码之后的低频信号分量和特征信息来生成高频信号分量。从而,通过根据低频信号分量生成高频信号分量,这种扩展低频信号分量的频带的技术在下文将被称为频带扩展技术。
作为频带扩展技术的应用示例,会存在在对使用上述高频删除编码方法的编码数据进行解码之后的后处理。在该后处理中,通过从解码之后的低频信号分量中生成在编码中丢失的高频信号分量来对低频信号分量的频带进行扩展(参见PTL1)。注意,在PTL1中的用于频带扩展的方法在下文中将被称为PTL1带扩展方法。
关于PTL1带扩展方法,设备根据输入信号的功率谱来估计高频功率谱(下文在适用的情况下称为高频包络),其中使用解码之后的低频信号分量作为输入信号,并根据所述低频信号分量生成具有所述高频的频率包络的高频信号分量。
图1示出了作为输入信号的解码后的低频功率谱以及估计的高频包络的示例。
在图1中,竖轴表示对数方式的功率,而横轴表示频率。
设备根据与输入信号相关的编码格式的类型以及例如为采样率、比特率等的信息(下文称为“边信息”)来确定高频信号分量的低频端的频段(下文称为“扩展起始频段”)。接着,设备将作为低频信号分量的输入信号划分成多个子带信号。设备求出划分之后的多个子带信号,即,从扩展起始频段开始的、在低频率侧(下文简称为“低频侧”)上的多个子带信号的每一个子带信号的功率的时间方向的每个组的平均值(下文称为“组功率”)。如图1所示,设备使用在低频侧的多个子带信号的各个组功率的平均值来作为功率,并使用扩展起始频段的下边缘上的频率处的点来作为起点。设备估计以预定的斜率通过起点的线性线来作为从扩展起始频段开始的在高频率侧(下文称为高频侧)的频率包络。注意,用于起点的功率方向的位置可以由用户来调节。设备根据在低频侧的多个子带信号生成在高频侧的多个子带信号的每一个,以如所估计的那样变成在高频侧的频率包络。设备将添加在高频侧的多个生成的子带信号,以作为高频信号分量,并且进一步地添加低频信号分量并进行输出。从而,在频带扩展之后的音乐信号变得更接近原始音乐信号。因此,可以播放具有较高音质的音乐信号。
以上描述的PTL1频段扩展方法具有如下优点:能够在解码音乐信号的编码数据之后扩展音乐信号的频带,其中这样的编码数据具有各种高频删除编码方法和各种比特率。
引用列表
专利文献
PTL1:日本未审查专利申请公报No.2008-139844
发明内容
技术问题
然而,PTL1频段扩展方法可以对于如下点进行改进:估计的高频侧频率包络是具有预定斜率的线性线,即,对于频率包络的形状是固定的这点。
也就是说,音乐信号的功率谱具有各种形状,并且取决于音乐信号的类型不少情况将会从使用PTL1频段扩展方法估计的高频侧频率包络发生较大的变化。
图2示出了攻击型的音乐信号(攻击型音乐信号)的原始功率谱的示例,其伴随有时间上的突变,例如当大声击鼓一次时。
注意,图2还一起示出了作为输入信号的攻击性音乐信号的低频侧信号分量以及按照PTL1频段扩展方法根据该输入信号估计的高频侧频率包络。
如图2中所示,攻击型音乐信号的原始高频侧功率谱近似平坦。
相反地,估计的高频侧频率包络具有预定的负斜率,即使在起点处将它调整到更接近原始功率谱的功率,与原始功率谱的差异也会随着频率的增加而增加。
从而,对于PTL1频段扩展方法,估计的高频侧频率包络不能够以高的精确度实现原始高频侧频率包络。因此,如果声音从频带扩展之后的音乐信号中生成并输出,则从听的角度来看,与原始声音相比,将会丢失声音的清晰度。
另外,对于例如上述HE-ACC等的高频特征编码方法,高频侧频率包络被用作为待编码的高频信号分量的特征信息,但是,需要解码侧以高度精确的方式来再生原始高频侧频率包络。
本发明已将这样的情况纳入考虑,并使得音乐信号能够由于频带的扩展而以高音质播放。
问题的解决方案
根据本发明的第一方面的频带扩展设备,包括:信号划分装置,所述信号划分装置被配置成将输入信号划分成多个子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述信号划分装置所划分的多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;高频子带功率估计装置,所述高频子带功率估计装置被配置成基于由所述特征量计算装置所计算的特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及高频信号分量生成装置,所述高频信号分量生成装置被配置成基于由所述信号划分装置所划分的多个子带信号和由所述高频子带功率估计装置所计算的高频子带功率的估计值来生成高频信号分量;从而使用由所述高频信号分量生成装置所生成的高频信号分量来扩展所述输入信号的频带。
特征量计算装置可以计算作为所述多个子带信号的功率的低频子带功率,以作为特征量。
特征量计算装置可以计算作为所述多个子带信号的功率的低频子带功率的时间变化,以作为特征量。
特征量计算装置可以计算所述输入信号在预定频带中的最大功率与最小功率之间的差异,以作为特征量。
特征量计算装置可以计算所述输入信号在预定频带中的功率的最大值与最小值之间的差异的时间变化,以作为特征量。
特征量计算装置可以计算所述输入信号在预定频带中的功率的斜率,以作为特征量。
特征量计算装置可以计算所述输入信号在预定频带中的功率的斜率的时间变化,以作为特征量。
高频子带功率估计装置可以基于所述特征量和预先通过学习获得的用于每个高频子带的系数来计算所述高频子带功率的估计值。
可以通过对利用通过使用多个教学信号的回归分析所获得的每个高频子带的系数计算的所述高频信号分量的残差向量执行聚类以及针对通过所述聚类所获得的每个簇使用属于所述簇的所述教学信号执行回归分析来生成所述每个高频子带的系数。
可以使用多个所述残差向量的每个分量的离差值来归一化所述残差向量,并且对归一化后的所述向量进行聚类。
高频子带功率估计装置可以基于所述特征量、用于每个所述高频子带的系数和常量来计算所述高频子带功率的估计值;所述常量是根据通过使用利用属于所述簇的所述教学信号进行的回归分析所获得的每个高频子带的系数进一步计算所述残差向量并执行将所述残差向量聚类为多个新簇所获得的所述新簇的重心向量来计算的。
高频子带功率估计装置可以以相关联的方式记录用于每个所述高频子带的系数和用于确定所述每个高频子带的系数的指针,并且还记录多组所述指针和所述常量,所述多组中的一些组可包括具有相同值的指针。
高频信号生成装置可以根据作为所述多个子带信号的功率的低频子带功率和所述高频子带功率的估计值来生成所述高频信号分量。
根据本发明的第一方面的频带扩展方法,包括:信号划分步骤,所述信号划分步骤被设置成将输入信号划分成多个子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述信号划分步骤中的处理所划分的所述多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;高频子带功率估计步骤,所述高频子带功率估计步骤被设置成基于由在所述特征量计算步骤中的处理所计算的所述特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及高频信号分量生成步骤,所述高频信号分量生成步骤被设置成基于由所述信号划分步骤中的处理所划分的所述多个子带信号和由所述高频子带功率估计步骤中的处理所计算的所述高频子带功率的所述估计值来生成高频信号分量;从而使用由所述高频信号分量生成步骤中的处理所生成的所述高频信号分量来扩展所述输入信号的频带。
根据本发明的第一方面的程序,包括:信号划分步骤,所述信号划分步骤被设置成将输入信号划分成多个子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述信号划分步骤中的处理所划分的所述多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;高频子带功率估计步骤,所述高频子带功率估计步骤被设置成基于由在所述特征量计算步骤中的处理所计算的特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及高频信号分量生成步骤,所述高频信号分量生成步骤被设置成基于由在所述信号划分步骤中的处理所划分的所述多个子带信号和由在所述高频子带功率估计步骤中的处理所计算的所述高频子带功率的估计值来生成高频信号分量;从而使得计算机执行用于使用由在所述高频信号分量生成步骤中的处理所生成的所述高频信号分量来扩展所述输入信号的频带的处理。
关于本发明的第一方面,将输入信号划分成多个子带信号;使用所述输入信号和多个划分的子带信号中的至少一个来计算表示所述输入信号的特征的特征量;基于所计算的特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;基于多个所划分的子带信号和所计算的高频子带功率的估计值来生成高频信号分量;以及使用所生成的高频信号分量来生成所述输入信号的频带。
根据本发明的第二方面的编码设备,包括:子带划分装置,所述子带划分装置被配置成将输入信号划分成多个子带,并生成由在低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述子带划分装置生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;伪高频子带功率计算装置,所述伪高频子带功率计算装置被配置成基于由所述特征量计算装置所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;伪高频子带功率差异计算装置,所述伪高频子带功率差异计算装置被配置成根据由所述子带划分装置所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由所述伪高频子带功率计算装置所计算的所述伪高频子带功率的差异;高频编码装置,所述高频编码装置被配置成对由所述伪高频子带功率差异计算装置所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;低频编码装置,所述低频编码装置被配置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及多路复用装置,所述多路复用装置被配置成对由所述低频编码装置生成的所述低频编码数据和由所述高频编码装置生成的所述高频编码数据进行多路复用,以获得输出代码串。
所述编码设备还可以包括低频解码装置,所述低频解码装置被配置成对由所述低频编码装置生成的所述低频编码数据进行解码,以生成低频信号;所述子带划分装置根据由所述低频解码装置所生成的低频信号来生成低频子带信号。
所述高频编码装置可以计算在所述伪高频子带功率差异与在预定的多个伪高频子带功率差异空间中的代表向量或代表值之间的相似度,以生成与其相似度是最大值的代表向量或代表值对应的索引,以作为所述高频编码数据。
所述伪高频子带功率差异计算装置可以基于每个子带的所述伪高频子带功率和所述高频子带功率来针对用于计算所述伪高频子带功率的多个系数中的每一个计算评价值;所述高频编码装置生成指示作为最高评价值的所述评价值的系数的索引,以作为所述高频编码数据。
伪高频子带功率差异计算装置可以基于每个子带的所述伪高频子带功率差异的平方和、所述子带的所述伪高频子带功率的绝对值的最大值或每个子带的所述伪高频子带功率差异的平均值中的至少任何一个来计算所述评价值。
伪高频子带功率差异计算装置可以基于不同帧的所述伪高频子带功率差异来计算所述评价值。
伪高频子带功率差异计算装置可以使用乘以权重的所述伪高频子带功率差异来计算所述评价值,所述权重是针对每个子带的权重,使得所述子带越处于低频侧,所述子带的权重就越大。
伪高频子带功率差异计算装置可以使用乘以权重的所述伪高频子带功率差异来计算所述评价值,所述权重是针对每个子带的权重,使得子带的所述高频子带功率越大,所述子带的权重就越大。
根据本发明的第二部分的编码方法,包括:子带划分步骤,所述子带划分步骤被设置成将输入信号划分成多个子带,并生成由低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和在所述子带划分步骤中的处理所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;伪高频子带功率计算步骤,所述伪高频子带功率计算步骤被设置成基于在所述特征量计算步骤中的处理所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;伪高频子带功率差异计算步骤,所述伪高频子带功率差异计算步骤被设置成根据由在所述子带划分步骤中的处理所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由在所述伪高频子带功率计算步骤中的处理所计算的所述伪高频子带功率的差异;高频编码步骤,所述高频编码步骤被设置成对在所述伪高频子带功率差异计算步骤中的处理所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;低频编码步骤,所述低频编码步骤被设置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及多路复用步骤,所述多路复用步骤被设置成对在所述低频编码步骤中的处理所生成的所述低频编码数据和在所述高频编码步骤中的处理所生成的所述高频编码数据进行多路复用,以获得输出代码串。
根据本发明的第二方面的使得计算机执行如下处理的程序,所述处理包括:子带划分步骤,所述子带划分步骤被设置成将输入信号划分成多个子带,并生成由低频侧的多个子带组成的低频子带信号和由高频侧的多个子带组成的高频子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述子带划分步骤中的处理所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;伪高频子带功率计算步骤,所述伪高频子带功率计算步骤被设置成基于由在所述特征量计算步骤中的处理所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;伪高频子带功率差异计算步骤,所述伪高频子带功率差异计算步骤被设置成根据在所述子带划分步骤中的处理所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由在所述伪高频子带功率计算步骤中的处理所计算的所述伪高频子带功率的差异;高频编码步骤,所述高频编码步骤被设置成对在所述伪高频子带功率差异计算步骤中的处理所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;低频编码步骤,所述低频编码步骤被设置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及多路复用步骤,所述多路复用步骤被设置成对在所述低频编码步骤中的处理所生成的所述低频编码数据和在所述高频编码步骤中的处理所生成的所述高频编码数据进行多路复用,以获得输出代码串。
关于本发明的第二方面,将输入信号划分成多个子带;生成由低频侧的多个子带组成的低频子带信号和由高频侧的多个子带组成的高频子带信号;使用所述输入信号和所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;基于所计算的特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;根据所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率;计算伪高频子带功率差异,所述伪高频子带功率差异是相对于所计算的伪高频子带功率的差异;对所计算的伪高频子带功率差异进行编码,以生成高频编码数据;对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及对所生成的低频编码数据和所生成的高频编码数据进行多路复用,以获得输出代码串。
根据本发明的第三方面的解码设备,包括:多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成至少低频编码数据和索引;低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成所述低频子带的每一个的低频子带信号;以及生成装置,所述生成装置被配置成基于所述索引和所述低频子带信号来生成所述高频信号。
所述索引可以在对输入信号进行编码并输出所述编码数据的设备处基于在编码之前的所述输入信号和根据所述输入信号估计的所述高频信号来获得。
所述索引可以不被编码。
所述索引可以是是指示用于生成所述高频信号的估计系数的信息。
所述生成装置可以基于多个所述估计系数中的由所述索引所指示的所述估计系数来生成所述高频信号。
所述生成装置可以包括:特征量计算装置,所述特征量计算装置被配置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;高频子带功率计算装置,所述高频子带功率计算装置被配置成通过使用所述特征量和所述估计系数的计算来关于组成所述高频信号的频段的多个高频子带的每一个高频子带,计算所述高频子带的高频子带信号的高频子带功率;以及高频信号生成装置,所述高频信号生成装置被配置成基于所述高频子带功率和所述低频子带信号来生成所述高频信号。
所述高频子带功率计算装置可以通过通过使用为每个所述高频子带准备的所述估计系数来线性组合多个所述特征量以计算所述高频子带的所述高频子带功率。
所述特征量计算装置可以计算每个所述低频子带的所述低频子带信号的低频子带功率,以作为所述特征量。
所述索引可以是指示多个所述估计系数中如下的估计系数的信息,作为根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数生成的所述高频子带功率之间的比较的结果,获得最接近根据在编码之前的所述输入信号的所述高频信号所获得的所述高频子带功率的所述高频子带功率。
所述索引可以是指示如下的估计系数的信息,对于每个所述高频子带获得的在根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数而生成的所述高频子带功率之间的差异的平方和变为最小。
所述编码数据还可以包括表示在根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数而生成的所述高频子带功率之间的差异的差异信息。
所述差异信息可以是已编码的。
所述高频子带功率计算装置将包括在所述编码数据中的以所述差异信息表示的所述差异加到由使用所述特征量和所述估计系数的计算而获得的所述高频子带功率上;所述高频信号生成装置基于所述低频子带信号和已加上所述差异的所述高频子带功率来生成所述高频信号。
所述估计系数可以通过使用最小二乘法的回归分析来获得,其中,所述特征量作为解释变量,而所述高频子带功率作为被解释变量。
解码设备还可以包括系数输出装置,其中所述索引是指示由每个所述高频子带的所述差异所组成的差异向量的信息,其中所述差异向量以在根据编码前的所述输入信号的所述高频信号所获得的所述高频子带功率与基于所述估计系数所生成的所述高频子带功率之间的差异来作为元素,所述系数输出装置被配置成获得在所述差异的特征空间中的代表向量或代表值与由所述索引所指示的所述差异向量之间的距离,所述代表向量或代表值以预先针对每个所述估计系数所获得的所述高频子带的所述差异作为元素,并将多个所述估计系数中的所述距离最短的所述代表向量或所述代表值的所述估计系数提供给所述高频子带功率计算装置。
所述索引可以是指示多个所述估计系数中的如下估计系数的信息,作为编码前的所述输入信号的所述高频信号与基于所述估计系数而生成的所述高频信号之间的比较的结果,获得最接近编码前的所述输入信号的所述高频信号的所述高频信号。
所述估计系数可以通过回归分析来获得。
所述生成装置可以基于对编码的所述索引进行解码所获得的信息来生成所述高频信号。
所述索引可以已经进行熵编码。
根据第三方面的解码方法或程序,包括:多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成至少低频编码数据和索引;低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;以及生成步骤,所述生成步骤被设置成基于所述索引和所述低频子带信号来生成所述高频信号。
关于本发明的第三方面,将输入编码数据多路解复用成至少低频编码数据和索引;对所述低频编码数据进行解码,以生成低频信号;将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信;以及基于所述索引和所述低频子带信号来生成所述高频信号。
根据本发明的第四方面的解码设备,包括:多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;高频子带功率计算装置,所述高频子带功率计算装置被配置成通过将所述特征量乘以估计系数并获得已乘以所述估计系数的所述特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带的预先准备的多个所述估计系数的所述索引来确定;以及高频信号生成装置,所述高频信号生成装置被配置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
所述特征量计算装置可以计算每个所述低频子带的所述低频子带信号的低频子带功率,以作为所述特征量。
所述索引可以是用于获得所述多个估计系数中的如下估计系数的信息,针对每个所述高频子带获得的差异的平方和变为最小,所述差异是在根据所述高频信号的真实值获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异。
所述索引还可以包括差异信息,所述差异信息表示在根据所述真实值获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异;所述高频子带功率计算装置还将包括在所述索引中的所述差异信息所表示的所述差异加到通过获得已乘以所述估计系数的所述特征量的总和从而获得的所述高频子带功率上;并且其中,所述高频信号生成装置使用所述低频子带信号和已经通过所述高频子带功率计算装置加上所述差异的所述高频子带功率来生成所述高频信号。
所述索引可以是指示所述估计系数的信息。
所述索引可以是通过对指示所述估计系数的信息进行熵编码所获得的信息;所述高频子带功率计算装置使用由通过解码所述索引所获得的信息所指示的估计系数来计算所述高频子带功率。
所述多个估计系数可以预先通过使用最小二乘法的回归分析来获得,其中,所述特征量作为解释变量,而所述高频子带功率作为被解释变量。
所述解码设备还可以包括系数输出装置,其中,所述索引是指示由每个所述高频子带的所述差异所组成的所述差异向量的信息,所述差异向量以根据所述高频信号的真实值所获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异作为元素,所述系数输出装置被配置成获得在所述差异的特征空间中的代表向量或代表值与由所述索引所指示的差异向量之间的距离,所述代表向量或代表值以预先针对每个所述估计系数所获得的所述高频子带的所述差异作为元素,以及所述系数输出装置还被配置成将多个所述估计系数中的所述距离最短的所述代表向量或所述代表值的所述估计系数提供给所述高频子带功率计算装置。
根据本发明的第四方面的解码方法或程序,包括:多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个低频子带的低频子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;高频子带功率计算步骤,所述高频子带功率计算步骤被设置成通过将所述特征量乘以估计系数并获得已乘以所述估计系数的所述特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带预先准备的多个所述估计系数的所述索引来确定;以及高频信号生成步骤,所述高频信号生成步骤被设置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
关于本发明的第四方面,将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;对所述低频编码数据进行解码,以生成低频信号;将所述低频信号的频段划分成多个低频子带,以生成每个低频子带的低频子带信号;使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;通过将所述特征量乘以估计系数并获得已乘以所述估计系数的所述特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带预先准备的多个所述估计系数的所述索引来确定;以及使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
本发明的有益效果
根据本发明的第一方面至第四方面,音乐信号可以由于频带的扩展而以较高的音质来播放。
附图说明
图1是示出了用作输入信号的、解码后的低频功率谱和估计的高频包络的示例的图。
图2是示出了伴随有时间突变的攻击型音乐信号的原始功率谱的示例的图。
图3是示出了根据本发明的第一实施例的频带扩展设备的功能配置示例的框图。
图4是描述通过图3中的频带扩展设备的频带扩展处理的示例的流程图。
图5是示出了输入到图3中的频带扩展设备中的信号的功率谱以及带通滤波在频率轴上的定位的图。
图6是示出声乐段的频率特征以及估计高频功率谱的示例的图。
图7是示出了输入到图3的频带扩展设备中的信号的功率谱的示例的图。
图8是示出了图7的输入信号在同态滤波之后的功率谱的示例的图。
图9是示出了执行对在图3的频带扩展设备的高频信号生成电路中使用的系数的学习的系数学习设备的功能配置示例的框图。
图10是描述图9中的系数学习设备的系数学习处理的示例的流程图。
图11是示出根据本发明的第二实施例的编码设备的功能配置示例的框图。
图12是通过描述图11中的编码设备的编码处理的示例的流程图。
图13是示出了根据本发明的第二实施例的解码设备的功能配置示例的框图。
图14是描述了通过图13中的解码设备的解码处理的示例的流程图。
图15是示出了执行对在图11中的编码设备的高频编码电路中使用的代表向量以及在图13的解码设备的高频解码电路中使用的解码高频子带功率估计系数的学习的系数学习设备的功能配置示例的框图。
图16是描述通过图15中的系数学习设备的系数学习处理的示例的流程图。
图17是示出由图11中的编码设备输出的代码串的示例的图。
图18是示出了编码设备的功能配置示例的框图。
图19是描述编码处理的流程图。
图20是示出解码设备的功能配置示例的框图。
图21是描述解码处理的流程图。
图22是描述编码处理的流程图。
图23是描述解码处理的流程图。
图24是描述编码处理的流程图。
图25是描述编码处理的流程图。
图26是描述编码处理的流程图。
图27是描述编码处理的流程图。
图28是示出系数学习设备的配置示例的框图。
图29是描述系数学习处理的流程图。
图30是示出了通过程序执行应用了本发明的处理的计算机硬件的配置示例的框图。
具体实施方式
将参照附图来描述本发明的实施例。注意,将会以如下顺序给出描述。
1.第一实施例(将本发明应用于频带扩展设备的情况)
2.第二实施例(将本发明应用于编码设备和解码设备的情况)
3.第三实施例(在高频编码数据中包括系数索引的情况)
4.第四实施例(在高频编码数据中包括系数索引和伪高频子带功率差异的情况)
5.第五实施例(使用估计值来选择系数索引的情况)
6.第六实施例(共享一部分系数的的情况)
<1.第一实施例>
根据第一实施例,对于通过解码使用高频删除编码方法编码的编码数据而获得的解码后低频信号分量来执行扩展频带的处理(下文称为频带扩展处理)。
[频带扩展设备的功能配置示例]
图3示出应用了本发明的频带扩展设备的功能配置示例。
对于作为输入信号的、解码后的低频信号分量,频带扩展设备10对于其输入信号执行频带扩展处理,并且输出作为结果获得的频带扩展处理后的信号,作为输出信号。
频带扩展设备10包括低通滤波器11、延迟电路12、带通滤波器13、特征量计算电路14、高频子带功率估计电路15、高频信号生成电路16、高通滤波器17以及信号相加单元18。
低通滤波器11以预定的截止频率对输入信号进行滤波,并将低频信号分量(即,低频率的信号分量)作为滤波后信号提供给延迟电路12。
为了在将来自低通滤波器11的低频信号分量与之后描述的高频信号分量相加时进行同步,延迟电路12将低频信号分量延迟一定量的延迟时间并随后将它提供给信号相加单元18。
带通滤波器13包括每一个具有不同通带的带通滤波器13-1至13-N。带通滤波器13-i(1≤i≤N)允许输入信号的预定通带信号通过,以作为多个子带信号中的一个子带信号,并将它提供给特征量计算电路14和高频信号生成电路16。
特征量计算电路14使用输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算一个或更多个特征量,并将所述特征量提供给高频子带功率估计电路15。现在,特征量是表示输入信号的信号特征的信息。
高频子带功率估计电路15基于来自特征量计算电路14的一个或多个特征量来计算每个高频子带的高频子带功率(即,高频子带信号的功率)的估计值,并将它们提供给高频信号生成电路16。
高频信号生成电路16基于来自带通滤波器13的多个子带信号和来自高频子带功率估计电路15的多个子带功率的估计值来生成高频信号分量(即,高频率的信号分量),并将它们提供给高通滤波器17。
高通滤波器17以对应于在低通滤波器11中的截止频率的截止频率来对来自高频信号生成电路16的高频信号分量进行滤波,并将它提供给信号相加单元18。
信号相加单元18将来自延迟电路12的低频信号分量与来自高通滤波器17的高频信号分量进行相加,并将它输出为输出信号。
注意,根据图3中的配置,使用带通滤波器13来获得子带信号,但是该配置不局限于此,例如,可以使用例如在PTL1中公开的频段划分滤波器。
另外,类似地,根据图3中的配置,使用信号相加单元18来对子带信号进行合成,但是该配置不局限于此,例如,可以使用例如在PTL1中公开的频段合成滤波器。
[频带扩展设备的频带扩展处理]
接下来,将参照图4中的流程图来描述使用图3中的频带扩展设备的频带扩展处理。
在步骤S1中,低通滤波器11以预定的截止频率对输入信号进行滤波,并将作为滤波后信号的低频信号分量提供给延迟电路12。
低通滤波器11可以设置可选频率来作为截止频率,但是根据本实施例,其中以预定的频段来作为之后描述的扩展起始频段,截止频率被设置成对应于扩展起始频段的下端的频率。因此,低通滤波器11将作为滤波后信号的低频信号分量(频段低于扩展起始频段的信号分量)提供给延迟电路12。
另外,低通滤波器11还可以根据输入信号的编码参数例如高频删除编码方法和比特率等来设置作为截止频率的最佳频率。例如,可以将在PTL1中的频段扩展方法所使用的边信息用作编码参数。
在步骤S2中,延迟电路12将来自低通滤波器11的低频信号分量延迟正好一定量的延迟时间,并将它提供给信号相加单元18。
在步骤S3中,带通滤波器13(带通滤波器13-1至13-N)将输入信号划分成多个子带信号,并将划分后的多个子带信号中的每个子带信号提供给特征量计算电路14和高频信号生成电路16。注意,将会在之后描述使用带通滤波器13来划分输入信号的处理的细节。
在步骤S4中,特征量计算电路14使用所述输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算一个或多个特征量,并将所述特征量提供给高频子带功率估计电路15。注意,将在之后描述使用特征量计算电路14来计算特征量的处理的细节。
在步骤S5中,高频子带功率估计电路15基于来自特征量计算电路14的一个或多个特征量来计算多个高频子带功率的估计值,并将这些估计值提供给高频信号生成电路16。注意,将会在之后描述使用高频子带功率估计电路15来计算高频子带功率的估计值的处理的细节。
在步骤S6中,高频信号生成电路16基于来自带通滤波器13的多个子带信号和来自高频子带功率估计电路15的多个高频子带功率的估计值来生成高频信号分量,并将这些高频信号分量提供给高通滤波器17。高频信号分量在此处为频段高于扩展起始频段的信号分量。注意,将在之后描述使用高频信号生成电路16来生成高频信号分量的处理的细节。
在步骤S7中,高通滤波器17对来自高频信号生成电路16的高频信号分量进行滤波,由此去除从重复分量到包括在高频信号分量中的低频的的噪声,并将高频信号分量提供给信号相加单元18。
在步骤S8中,信号相加单元18将来自延迟电路12的低频信号分量和来自高通滤波器17的高频信号分量进行相加,并输出相加后的信号以作为输出信号。
根据以上处理,可以在解码之后针对解码后的低频信号分量来扩展频带。
接下来,将描述图4的流程图中的步骤S3至S6中的每一个步骤的处理的细节。
[带通滤波器的处理的细节]
首先,将描述图4的流程图的步骤S3中的带通滤波器13的处理的细节。
注意,为了便于说明,下文中,带通滤波器13的数量N将会为:N=4。
例如,可以将通过将输入信号的奈奎斯特频率划分成16个相等部分从而获得的16个子带中的一个子带设置为扩展起始频段,在所述16个子带中,分别将频段低于扩展起始频段的四个子带中的每一个子带设置为带通滤波器13-1至13-4的通带。
图5示出了带通滤波器13-1至13-4的每个通带在频率轴上的位置。
如图5所示,如果来自频段低于扩展起始频段的频带(子带)的高频的第一子带索引被表示为sb,并且第二子带索引表示为sb-1,第I个子带索引表示为sb-(I-1),则带通滤波器13-1至13-4的每一个被指派为低于扩展起始频段的子带中的、具有sb至sb-3的索引的每个子带的通带。
注意,根据本发明,将带通滤波器13-1至13-4的每一个通带描述为通过将输入信号的奈奎斯特频率划分成16个相等部分从而获得的16个子带中的预定的四个通带,但是不局限于此,通带可以是通过将输入信号的奈奎斯特频率划分成256个相等部分从而获得的256个子带中的预定的四个子带。另外,带通滤波器13-1至13-4中的每一个带通滤波器的带宽可以互不相同。
[特征量计算电路的处理的细节]
接下来,将描述在图4的流程图的步骤S4中的特征量计算电路14的处理的细节。
特征量计算电路14使用输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算被高频子带功率估计电路15用来计算高频子带功率估计值的一个或多个特征量。
更具体地,特征量计算电路14根据来自带通滤波器13的四个子带信号来计算每个子带的子带信号的功率(子带功率(下文中,还称为低频子带功率))作为特征量,并将它们提供给高频子带功率估计电路15。
也就是说,特征量计算电路14使用下面的表达式(1)根据从带通滤波器13提供的四个子带信号x(ib,n)求出某一预定时间帧内的低频子带功率,该低频子带功率称为power(ib,J)。此处,ib表示子带索引,n表示离散时间索引。注意,一个帧的样本数量为FSIZE,而功率以分贝表达。
[表达式1]
从而,使用特征量计算电路14求出的低频子带功率power(ib,J)被作为特征量提供给高频子带功率估计电路15。
[使用高频子带功率估计电路的处理的细节]
接下来,将描述在图4的流程图的步骤S5中的使用高频子带功率估计电路15的处理的细节。
高频子带功率估计电路15基于从特征量计算电路14提供的四个子带功率来计算待扩展到索引为sb+1的子带(扩展起始频段)之上的频段(频率扩展频段)的子带功率(高频子带功率)的估计值。
也就是说,如果假定频率扩展频段的最高频段的子带索引为eb,则高频子带功率估计电路15估计其中索引为sb+1至eb的(eb-sb)个子带的子带功率。
在索引为ib的频率扩展频段的子带功率的估计值powerest(ib,J)使用从特征量计算电路14提供的四个子带功率power(ib,J),并且例如可以以下面的表达式(2)来表达。
[表达式2]
现在,在表达式(2)中,系数Aib(kb)和Bib是针对每个子带ib而具有不同的值的系数。系数Aib(kb)和Bib是合适地设置从而使得可以对于各种输入信号获得良好的值的系数。另外,通过改变子带sb来将系数Aib(kb)和Bib改变到最佳值。注意,将在后面描述系数Aib(kb)和Bib的产生。
在表达式(2)中,使用来自带通滤波器13的多个子带信号中的每一个子带信号的功率以线性组合的方式来计算高频子带功率估计值,但是该设置方式不局限于此,例如,可以使用时间帧J之前和之后的若干帧的多个低频子带功率的线性组合来执行计算,或者可以使用非线性函数来执行计算。
从而,将使用高频子带功率估计电路15计算的高频子带功率估计值提供给高频信号生成电路16。
[高频信号生成电路的处理的细节]
接下来,将描述在图4的流程图的步骤S6中的高频信号生成电路16的处理的细节。
高频信号生成电路16基于上述表达式(1)来计算从带通滤波器13提供的多个子带信号的每个子带的低频子带功率power(ib,J)。高频信号生成电路16使用计算的多个低频子带功率power(ib,J)和由高频子带功率估计电路15基于上述表达式(2)计算的高频子带功率估计值powerest(ib,J)来根据下面的表达式(3)求出增益量G(ib,J)。
[表达式3]
现在,在表达式(3)中,sbmap(ib)表示在子带ib是映射目的地的子带的情况下映射源的子带索引,并以下面的表达式(4)表示。
[表达式4]
注意,在表达式(4)中,INT(a)是对值a的小数点后的数进行四舍五入的函数。
接下来,高频信号生成电路16使用下面的表达式(5)通过将以表达式(3)求出的增益量G(ib,J)乘以带通滤波器13的输出来计算增益调节后的子带信号x2(ib,n)。
[表达式5]
x2(ib,n)=G(ib,J)×(sbmap(ib),n)
(J*FSIZE≤n≤(J+1)FSIZE-1,sb+1≤ib≤eb)
…(5)
另外,高频信号生成电路16使用下面的表达式(6)通过执行从与索引为sb-3的子带的下端频率对应的频率到与索引为sb的子带的上端频率对应的频率的余弦调节从而从增益调节后子带信号x2(ib,n)计算出经过余弦变换的增益调节后子带信号x3(ib,n)。
[表达式6]
x3(ib,n)=x2(ib,n)*2cos(n)*{4(ib+1)π/32}(sb+1≤ib≤eb)
…(6)
注意,在表达式(6)中,示出了圆周率。表达式(6)在此处表示增益调节后子带信号x2(ib,n)朝向高频侧频率平移四个频段值。
高频信号生成电路16然后使用下面的表达式(7)从朝向高频侧平移后的增益调节后子带信号x3(ib,n)计算出高频信号分量xhigh(n)。
[表达式7]
从而,基于根据来自带通滤波器13的四个子带信号计算的四个低频子带功率以及基于来自高频子带功率估计电路15的高频子带功率估计值,高频信号生成电路16生成高频信号分量,并将所述高频信号分量提供给高通滤波器17。
根据以上处理,针对在解码通过高频删除编码方法进行编码的编码数据之后获得的输入信号,通过使用从多个子带信号计算出的低频子带功率来作为特征量,并基于该特征量和适当设置的系数,计算出了高频子带功率估计值,并且根据低频子带功率和高频子带功率估计值适当地生成了高频信号分量,由此可以以高的精确度来估计频率扩展频段子带功率,从而可以以较高的音质播放音乐信号。
上面已针对如下示例给出了描述:特征量计算电路14只将从多个子带信号计算出的低频子带功率计算为特征量,但是在该情况下,取决于输入信号的类型,可能会不能够以高的精确度来估计频率扩展频段的子带功率。
从而,特征量计算电路14计算与频率扩展频段子带功率的形式(高频功率谱的形状)具有强相关性的特征量,由此,可以在高频子带功率估计电路15处以高的精确度估计频率扩展频段子带功率。
[由特征量计算电路计算的特征量的其他示例]
图6示出了关于某一输入信号其中声乐占用声乐段的大部分的声乐段的频率特征的示例以及通过只计算低频子带功率作为特征量来估计高频子带功率所获得的高频功率谱。
如图6所示,在声乐段的频率特征中,估计的高频功率谱通常定位成高于原始信号的高频功率谱。人的歌声的不舒适感很容易被人耳感测到,因此,在声乐段中需要特别精确地执行高频子带功率估计。
另外,如图6中所示,在声乐段的频率特征中,在4.9kHz和11.025kHZ之间通常会看到一个大的凹陷。
现在,将会在下面描述一个示例,在该示例中,使用在频域中在4.9kHz与11.025kHZ之间的凹陷的程度来作为用于估计在声乐段中的高频子带功率的特征量。注意,表示凹陷度的特征量在下文中被称为下陷(dip)。
下面,将描述在时间帧J中的下陷dip(J)的计算示例。
首先,针对包括在输入信号的帧J的之前和之后的一系列若干帧(包括帧J)内的2048个样本分段中的信号来执行2048个点的FFT(快速傅里叶变换),并且计算在频率轴上的系数。通过对计算的各个系数的绝对值进行db变换来获得功率谱。
图7示出了根据上述描述获得的功率谱的示例。现在,为了去除功率谱的细小分量,执行同态滤波处理以去除例如为1.3kHz或更小频率的分量。根据同态滤波处理,功率谱的各个维度可以被视为时间序列,并且通过施加低通滤波器来执行滤波处理,由此来平滑谱峰的细小分量。
图8示出了同态滤波后输入信号的功率谱的示例。在图8的同态滤波后功率谱中,将包括在对应于4.9kHz至11.025kHZ的范围内的功率谱的最小值与最大值之间的差设置为下陷dip(J)。
从而,计算了与频率扩展频段的子带功率具有强相关性的特征量。注意,下陷dip(J)的计算示例不局限于上述示例,可以使用另外的方法。
接下来,将描述计算与频率扩展频段的子带功率具有强相关性的特征量的另一个示例。
[使用特征量计算电路计算的特征量的又一个示例]
对于攻击片段(即,包括攻击型音乐信号的片段)的频率特征,在某一输入信号中高频侧功率谱通常是近似平坦的,如参照图2所描述。在只计算低频子带功率来作为特征量的方法中,对频率扩展频段子带功率进行估计,但不使用表示包括攻击片段的输入信号所特有的时间变化的特征量,因此,很难以高的精确度来估计例如在攻击片段中所看到的近似平坦的频率扩展频段子带功率。
从而,下面,将会描述将低频子带功率时间变化用作在估计攻击片段的高频子带功率中使用的特征量的示例。
使用例如下面的表达式(8)来求出在某一时间帧J中低频子带功率的时间变化powerd(J)。
[表达式8]
根据表达式(8),低频子带功率的时间变化powerd(J)表示在时间帧J中的四个低频子带功率之和与在时间帧(J-1)(即,时间帧J的前一帧)中的四个低频子带功率之和的比值,并且该值越大,则在帧之间的功率的时间变化就越大,即,认为包括在时间帧J中的信号的攻击性越强。
同样,比较在图1中示出的统计平均功率谱与在图2中示出的攻击片段(攻击型音乐信号)中的功率谱,攻击片段中的功率谱在中频中朝着右侧上升。这种频率特征通常在攻击片段中示出。
现在,下面将描述应用中频的斜率来作为在估计攻击片段的高频子带功率中使用的特征量的示例。
使用例如下面的表达式(9)来获得在某一时间帧J的中频中的斜率slope(J)。
[表达式9]
在表达式(9)中,系数w(ib)是被调节成由高频子带功率加权的加权系数。根据表达式(9),slope(J)表示在由高频加权的四个低频子带功率之和与四个低频子带功率之和之间的比值。例如,在所述四个低频子带功率变成对应于中频子带的功率的情况下,当中频功率谱向右上升时,slope(J)取较大的值,并且当向右下降时,slope(J)取较小的值。
另外,在许多情况下,在攻击片段之前和之后,中频斜率变化较大,由此可以将以下面的表达式(10)表示的斜率时间变化sloped(J)设置为用于估计攻击片段的高频子带功率的特征量。
[表达式10]
sloped(J)=slope(J)/slope(J-1)
(J*FSIZE≤n≤(J+1)FSIZE-1)
…(10)
另外,类似地,可以将在下面的表达式(11)中表达的上述下陷dip(J)的时间变化dipd(J)设置为用于估计攻击片段的高频子带功率的特征量。
[表达式11]
dipd(J)=dip(J)-dip(J-1)
(J*FSIZE≤n≤(J+1)FSIZE-1)
…(11)
根据以上方法,计算了与频率扩展频段子带功率具有强相关性的特征量,因此,通过使用这些,可以以较高的精确度来执行使用高频子带功率估计电路15的频率扩展频段子带功率的估计。
上面描述了计算与频率扩展频段子带功率具有强相关性的特征量的示例,而下面将描述使用由此计算的特征量来估计高频子带功率的示例。
[使用高频子带功率估计电路的处理的细节]
现在,将描述使用参照图8描述的下陷以及低频子带功率作为特征量来估计高频子带功率的示例。
也就是说,在图4的流程图中的步骤S4中,特征量计算电路14根据来自带通滤波器13的四个子带信号来针对每个子带计算低频子带功率和下陷以作为特征量,并将这些提供给高频子带功率估计电路15。
在步骤S5中,高频子带功率估计电路15基于下陷和来自特征量计算电路14的四个低频子带功率来计算高频子带功率的估计值。
现在,关于子带功率和下陷,因为可以取的值的范围(比例)不同,所以高频子带功率估计电路15执行例如如下所示的下陷值的变换。
高频子带功率估计电路15预先针对大量的输入信号来计算四个低频子带功率的最大频率子带功率以及下陷值,并且针对每个求出平均值和标准偏差。现在,子带功率的平均值以powerave表示,子带功率的标准偏差以powerstd表示,下陷的平均值以dipave表示,下陷的标准偏差以dipstd表示。
高频子带功率估计电路15使用这些值以下面的表达式(12)来对下陷值dip(J)进行变换,并获得变换后下陷dips(J)。
[表达式12]
通过执行表达式(12)中示出的变换,高频子带功率估计电路15可以将下陷值dip(J)变换为变量(下陷)dips(J),变量dips(J)等价于低频子带功率的统计平均值和离差(dispersion),并且可以引起下陷可取值的范围近似地与子带功率可取值的范围相同。
根据特征量计算电路14和在表达式(12)中示出的下陷dips(J),使用四个低频子带功率power(ib,J)的线性组合,在频带扩展频段中索引为ib的子带功率的估计值powerest(ib,J)以例如下面的表达式(13)来表达。
表达式[13]
现在,在表达式(13)中,系数Cib(kb)、Dib和Eib是对于每个子带ib具有不同的值的系数。系数Cib(kb)、Dib和Eib是被合适地设置以使得可以获得关于各种输入信号的良好的值的系数。另外,取决于子带sb的变化,系数Cib(kb)、Dib和Eib还可以变化到最佳值。注意,将在之后描述系数Cib(kb)、Dib和Eib的产生。
在表达式(13)中,使用线性组合来计算高频子带功率估计值,但不局限于此,可以使用在时间帧J之前和之后的若干帧的多个特征量的线性组合来计算,或者可以使用例如非线性函数来计算。
根据以上处理,在高频子带功率的估计中,使用声乐段特有的下陷值来作为特征量,由此,与只有低频子带功率是特征量的情况相比,可以提高声乐段的高频子带功率估计的精确度,并且降低了容易被人耳感测到的由高频率功率谱被使用只有低频子带功率作为特征量的方法估计为大于原始信号的高频功率谱而产生的不舒适感,由此,可以以较高的音质播放音乐信号。
现在,关于使用上述方法计算为特征量的下陷(在声乐段频率特征中的凹陷度),在子带划分的数量为16的情况下,频率分辨率低,因此,此处的凹陷度不能够只使用低频子带功率来表达。
现在,通过增加子带划分的数量(例如,增加到16倍,即256个划分),使用带通滤波器13来增加子带划分的数量(例如,增加到16倍,即64个),以及增加使用特征量计算电路14计算的低频子带功率的数量(例如,增加到16倍,即64个),可以提高频率分辨率,并且此处的凹陷度可以只使用低频子带功率来表达。
从而,可以想到的是,可以只使用低频子带功率以与使用上述下陷作为特征量的高频子带功率的估计近似相同的精确度来估计高频子带功率。
然而,通过增加子带划分的数量、频段划分的数量以及低频子带功率的数量,增加了计算量。如果我们考虑可以针对每种方法以相似的精确度来估计高频子带功率,那么,从计算量的观点看,不增加子带划分的数量并使用下陷作为特征量来估计高频子带功率的方法是更高效的。
上述描述已给出了使用下陷和低频子带功率来估计高频子带功率的方法,但是在高频子带功率的估计中使用的特征量不局限于该组合,而是可以使用上述描述的特征量(低频子带功率、下陷、低频子带功率时间变化、斜率、斜率的时间变化和下陷的时间变化)中的一个或多个。从而,可以进一步提高估计高频子带功率的精确度。
另外,如以上所描述的,在输入信号中,通过使用其中由于用于估计高频子带功率的特征量而很难估计高频子带功率的片段所特有的参数,可以提高该片段的估计精确度。例如,低频子带功率时间变化、斜率、斜率的时间变化以及下陷的时间变化是攻击片段特有的参数,并且通过使用这些参数作为特征量,可以提高在攻击片段中的高频子带功率的估计精确度。
注意,在使用除了低频子带功率和下陷之外的特征量(即,使用低频子带功率时间变化、斜率、斜率的时间变化以及下陷的时间变化)来执行高频子带功率的估计的情况下,可以使用如上所述的相同方法来估计高频子带功率。
注意,此处示出的特征量的每一种计算方法不局限于以上描述的方法,而是可以使用其他方法。
[求出系数Cib(kb)、Dib、Eib的方法]
接下来,将描述求出上述表达式(13)中的系数Cib(kb)、Dib和Eib的方法。
作为求出系数Cib(kb)、Dib和Eib的方法,使用了如下方法:预先使用具有宽带(下文称为宽带教学信号)的教学信号来执行学习,使得在估计频率扩展频段子带功率中系数Cib(kb)、Dib和Eib可以是对于各种输入信号的良好值,并且可以基于学习结果来确定它们。
在执行学习系数Cib(kb)、Dib和Eib的事件中,使用设置了具有类似于参照图5描述的带通滤波器13-1至13-4的通带宽度的、具有高于扩展起始频段的频率的带通滤波器的系数学习设备。当宽带教学信号被输入时,系数学习设备执行学习。
[系数学习设备的功能配置示例]
图9示出了执行系数Cib(kb)、Dib和Eib的学习的系数学习设备的功能配置示例。
关于频率低于输入到图9中的系数学习设备20中的宽带教学信号的扩展起始频段的信号分量,有利的是输入到图3中的频带扩展设备10中的频段受限的输入信号是以与在编码时执行的编码格式相同的格式进行编码的信号。
系数学习设备20包括带通滤波器21、高频子带功率计算电路22、特征量计算电路23以及系数估计电路24。
带通滤波器21包括每个具有不同的通带的带通滤波器21-1至21-(K+N)。带通滤波器21-i(1≤i≤K+N)允许输入信号的预定通带信号通过,并将它作为多个子带信号中的一个提供给高频子带功率计算电路22或特征量计算电路23。注意,带通滤波器21-1至21-(K+N)的带通滤波器21-1至21-K允许频率高于扩展起始频段的信号通过。
高频子带功率计算电路22针对来自带通滤波器21的多个高频子带信号来计算每个特定时间帧的每个子带的高频子带功率,并将它们提供给系数估计电路24。
特征量计算电路23针对与由高频子带功率计算电路22对其计算高频子带功率的特定时间帧相同的每个时间帧来计算与通过图3中的频带扩展设备10的特征量计算电路14计算的特征量相同的特征量。也就是说,特征量计算电路23使用宽带教学信号和来自带通滤波器21的多个子带信号中的至少一个来计算一个或多个特征量,并将所述特征量提供给系数估计电路24。
系数估计电路24针对每个特定时间帧基于来自高频子带功率计算电路22的高频子带功率和来自特征量计算电路23的特征量来估计图3中的频带扩展设备10的高频子带功率估计电路15所使用的系数。
[系数学习设备的系数学习处理]
接下来,将参照图10中的流程图来描述图9中的系数学习设备的系数学习处理。
在步骤S11中,带通滤波器21将输入信号(宽带教学信号)划分成(K+N)个子带信号。带通滤波器21-1至21-K将频率高于扩展起始频段的多个子带信号提供给高频子带功率计算电路22。另外,带通滤波器21-(K+1)至21-(K+N)将频率低于扩展起始频段的多个子带信号提供给特征量计算电路23。
在步骤S12中,高频子带功率计算电路22对于来自带通滤波器21(带通滤波器21-1至21-K)的多个高频子带信号来计算每个特定时间帧的每个子带的高频子带功率power(ib,J)。高频子带功率power(ib,J)使用上述表达式(1)来求出。高频子带功率计算电路22将计算的高频子带功率提供给系数估计电路24。
在步骤S13中,特征量计算电路23计算每个时间帧的特征量,所述时间帧与高频子带功率计算电路22对其计算高频子带功率的特定时间帧相同。
注意,在图3中的频带扩展设备10的特征量计算电路14中,假设将四个低频子带功率和下陷计算为特征量,并且类似于系数学习设备20的特征量计算电路23,下面给出了计算四个低频子带功率和下陷的描述。
也就是说,特征量计算电路23使用来自于带通滤波器21(带通滤波器21-(K+1)至21-(K+4))的四个子带信号来计算四个低频子带功率,其中所述四个子带信号每个具有与输入到频带扩展设备10的特征量计算电路14中的四个子带信号相同的频段。另外,特征量计算电路23计算来自宽带教学信号的下陷,并基于上述表达式(12)来计算下陷dips(J)。特征量计算电路23将计算的四个低频子带功率和下陷dips(J)作为特征量提供给系数估计电路24。
在步骤S14中,系数估计电路24基于来自高频子带功率计算电路22和特征量计算电路23的针对相同时间帧提供的(eb-sb)个高频子带功率与特征量(四个低频子带功率和下陷dips(J))的多个组合来执行系数Cib(kb)、Dib和Eib的估计。例如,针对某一高频子带,系数估计电路24设置五个特征量(四个低频子带功率和下陷dips(J))作为解释变量,以及设置高频子带功率power(ib,J)作为被解释变量,并使用最小二乘法来执行回归分析,由此确定在表达式(13)中的系数Cib(kb)、Dib和Eib。
注意,不言而喻,系数Cib(kb)、Dib和Eib的估计方法不局限于上述方法,而是可以使用各种类型的普通参数识别方法。
根据上述处理,预先使用宽带教学信号执行用于估计高频子带功率的系数的学习,由此可以针对在频带扩展设备10中输入的各种输入信号获得良好的输出结果,因此,可以以较高的音质播放音乐信号。
注意,也可以使用上述系数学习方法来获得上述表达式(2)中的系数Aib(kb)和Bib。
上面描述的系数学习处理发生在如下前提下:在频带扩展设备10的高频子带功率估计电路15中,使用四个低频子带功率和下陷的线性组合来计算高频子带功率的每个估计值。然而,在高频子带功率估计电路15中的高频子带功率估计方法不局限于上述示例,例如特征量计算电路14可以计算除了下陷之外的一个或多个特征量(低频子带功率时间变化、斜率、斜率时间变化以及下陷时间变化)来计算高频子带功率,或者可以使用在时间帧J之前和之后的多个帧的多个特征量的线性组合,或者可以使用非线性函数。也就是说,在系数学习处理中,系数估计电路24应当能够在类似的条件下计算(学习)系数,所述类似的条件指的是:与在使用频带扩展设备10的高频子带功率估计电路15来计算高频子带功率时使用的特征量、时间帧和函数的条件类似的条件。
<2.第二实施例>
关于第二实施例,使用编码设备和解码设备来执行使用高频特征编码方法的编码处理和解码处理。
[编码设备的功能配置示例]
图11示出了应用了本发明的编码设备的功能配置示例。
编码设备30包括低通滤波器31、低频编码电路32、子带划分电路33、特征量计算电路34、伪高频子带功率计算电路35、伪高频子带功率差异计算电路36、高频编码电路37、多路复用电路38以及低频解码电路39。
低通滤波器31以预定的截止频率对输入信号进行滤波,并将频率低于截止频率的信号(下文称为低频信号)作为滤波后信号提供给低频编码电路32、子带划分电路33以及特征量计算电路34。
低频编码电路32对来自低通滤波器31的低频信号进行编码,并将作为结果获得的低频编码数据提供给多路复用电路38和低频解码电路39。
子带划分电路33将来自输入信号和低通滤波器31的低频信号划分成具有预定带宽的均等的多个子带信号,并将这些子带信号提供给特征量计算电路34或伪高频子带功率差异计算电路36。更具体地,子带划分电路33将根据低频信号获得的多个子带信号作为输入(下文称为低频子带信号)提供给特征量计算电路34。另外,子带划分电路33将根据输入信号获得的多个子带信号的、频率高于由低通滤波器31设置的截止频率的子带信号(下文称为高频子带信号)作为输入提供给伪高频子带功率差异计算电路36。
特征量计算电路34使用来自低通滤波器31的低频信号或来自子带划分电路33的低频子带信号的多个子带信号中的至少一个来计算一个或多个特征量,并将所述特征量提供给伪高频子带功率计算电路35。
伪高频子带功率计算电路35基于来自特征量计算电路34的一个或多个特征量来生成伪高频子带功率,并将所述伪高频子带功率提供给伪高频子带功率差异计算电路36。
伪高频子带功率差异计算电路36基于来自子带划分电路33的高频子带信号和来自伪高频子带功率计算电路35的伪高频子带功率来计算随后描述的伪高频子带功率差异,并将所述伪高频子带功率差异提供给高频编码电路37。
高频编码电路37对来自伪高频子带功率差异计算电路36的伪高频子带功率差异进行编码,并将作为结果获得的高频编码数据提供给多路复用电路38。
多路复用电路38将来自低频编码电路32的低频编码数据和来自高频编码电路37的高频编码数据进行多路复用,并将其输出为输出代码串。
低频解码电路39视情况对来自低频编码电路32的低频编码数据进行解码,并将作为结果获得的解码数据提供给子带划分电路33和特征量计算电路34。
[编码设备的编码处理]
接下来,将参照图12中的流程图来描述使用图11中编码设备30的编码处理。
在步骤S111中,低通滤波器31以预定的截止频率对输入信号进行滤波,并将作为滤波后信号的低频信号提供给低频编码电路32、子带划分电路33和特征量计算电路34。
在步骤S112中,低频编码电路32对来自低通滤波器31的低频信号进行编码,并将作为结果获得的低频编码数据提供给多路复用电路38。
注意,关于在步骤S112中的低频信号的编码,根据待求出的电路规模和编码效率来选择合适的编码格式是足够的,并且本发明不依赖于该编码格式。
在步骤S113中,子带划分电路33将输入信号和低频信号均等地划分成具有预定带宽的多个子带信号。子带划分电路33将根据低频信号获得的低频子带信号作为输入提供给特征量计算电路34。另外,在根据作为输入的输入信号获得的多个子带信号中,子带划分电路33将具有高于由低通滤波器31设置的频段受限频率的频段的高频子带信号提供给伪高频子带功率差异计算电路36。
在步骤S114中,特征量计算电路34使用来自低通滤波器31的低频信号或来自子带划分电路33的低频子带信号的多个子带信号中的至少一个来计算一个或多个特征量,并将所述特征量提供给伪高频子带功率计算电路35。注意,图11中的特征量计算电路34基本上与图3中的特征量计算电路14具有相同的配置和功能,因此,在步骤S114中的处理基本上与在图4的流程图中的步骤S4中的处理相同,因此将省略对它的详细描述。
在步骤S115中,伪高频子带功率计算电路35基于来自特征量计算电路34的一个或多个特征量来生成伪高频子带功率,并将所述伪高频子带功率提供给伪高频子带功率差异计算电路36。注意,在图11中的伪高频子带功率计算电路35基本上与图3中的高频子带功率估计电路15具有相同的配置和功能,并且在步骤S115中的处理基本上与在图4的流程图的步骤S5中的处理相同,所以将省略详细描述。
在步骤S116中,伪高频子带功率差异计算电路36基于来自子带划分电路33的高频子带信号和来自伪高频子带功率计算电路35的伪高频子带功率来计算伪高频子带功率差异,并将所述伪高频子带功率差异提供给高频编码电路37。
更具体地,伪高频子带功率差异计算电路36计算来自子带划分电路33的高频子带信号在某一时间帧J内的(高频)子带功率power(ib,J)。注意,根据本实施例,低频子带信号的子带和高频子带信号的子带全部使用索引ib来识别。子带功率的计算方法可以是类似于第一实施例的方法,即,可以应用用于表达式(1)的方法。
接下来,伪高频子带功率差异计算电路36求出在时间帧J中在高频子带功率power(ib,J)与来自伪高频子带功率计算电路35的伪高频子带功率power1h(ib,J)之间的差异powerdiff(ib,J)(伪高频子带功率差异)。伪高频子带功率差异powerdiff(ib,J)使用下面的表达式(14)求出。
[表达式14]
powerdiff(ib,J)=power(ib,J)-powerIh(ib,J)
(J*FSTZE≤n≤(J+1)FSIZE-1,sb+1≤ib≤eb)
…(14)
在表达式(14)中,索引sb+1表示在高频子带信号中的最小频率子带索引。另外,索引eb表示在高频子带信号中的最大频率子带索引。
从而,将使用伪高频子带功率差异计算电路36计算的伪高频子带功率差异提供给高频编码电路37。
在步骤S117,高频编码电路37对来自伪高频子带功率差异计算电路36的伪高频子带功率差异进行编码,并将作为结果获得的高频编码数据提供给多路复用电路38。
更具体地,高频编码电路37确定来自伪高频子带功率差异计算电路36的向量化的伪高频子带计算差异(下文称为伪高频子带功率差异向量)应当属于预设的伪高频子带功率差异的特征空间中的多个簇中的哪个簇。现在,在某一时间帧J中的伪高频子带功率差异向量表示对于每个索引ib的伪高频子带功率差异powerdiff(ib,J)的值作为向量的元素的(eb-sb)维的向量。另外,用于伪高频子带功率差异的特征空间同样具有(eb-sb)维的空间。
在用于伪高频子带功率差异的特征空间中,高频编码电路37测量在多个预设的簇的各个代表向量与伪高频子带功率差异向量之间的距离,并求出用于具有最短距离的簇的索引(下文称为伪高频子带功率差异ID),并将其作为高频编码数据提供给多路复用电路38。
在步骤S118中,多路复用电路38将从低频编码电路32输出的低频编码数据和从高频编码电路37输出的高频编码数据进行多路复用,并输出输出代码串。
现在,关于用于高频特征编码方法的编码设备,在日本未审查专利申请公报No.2007-17908中公开了一种技术,在该技术中,从低频子带信号生成伪高频子带信号,针对每个子带比较伪高频子带信号功率与高频子带信号功率,计算每个子带的功率增益以匹配伪高频子带信号功率和高频子带信号功率,并且将功率增益包括在代码串中以作为高频特征信息。
另一方面,根据上述处理,在解码时,只有伪高频子带功率差异ID必须包括在输出代码串中以作为用于估计高频子带功率的信息。也就是说,在预设的簇的数量例如是64的情况下,作为用于使用解码设备来解码高频信号的信息,对于一个时间帧,只有6-bit的信息必须被添加到代码串中,与在日本未审查专利申请公报No.2007-17908中公开的方法相比,可以降低包括在代码串中的信息量,提高编码效率,并因此可以以较高的音质播放音乐信号。
另外,关于上述处理,如果在计算量中存在裕量(leeway),则低频解码电路39可以将通过解码来自低频编码电路32的低频编码数据而获得的低频信号输入到子带划分电路33和特征量计算电路34。对于通过解码设备的解码处理,从通过解码低频编码数据而获得的低频信号中计算特征量,并基于所述特征量来估计高频子带功率。因此,关于还包括基于根据代码串中的解码低频信号计算出的特征量来计算的伪高频子带功率差异ID的编码处理,使得能够在使用解码设备的解码处理中以较高的精确度来估计高频子带功率。因此,可以以较高的音质播放音乐信号。
[解码设备的功能配置示例]
接下来,将参照图13来描述对应于图11中的编码设备30的解码设备的功能配置示例。
解码设备40包括多路解复用电路41、低频解码电路42、子带划分电路43、特征量计算电路44、高频解码电路45、解码高频子带功率计算电路46、解码高频信号生成电路47和合成电路48。
多路解复用电路41将输入代码串多路解复用成高频编码数据和低频编码数据,并将低频编码数据提供给低频解码电路42以及将高频编码数据提供给高频解码电路45。
低频解码电路42执行对来自多路解复用电路41的低频编码数据的解码。低频解码电路42将作为解码结果获得的低频信号(文中称为解码低频信号)提供给子带划分电路43、特征量计算电路44和合成电路48。
子带划分电路43将来自低频解码电路42的解码低频信号均等地划分成具有预定带宽的多个子带信号,并将获得的子带信号(解码低频子带信号)提供给特征量计算电路44和解码高频信号生成电路47。
特征量计算电路44使用来自低频解码电路42的解码低频信号和来自子带划分电路43的解码低频子带信号的多个子带信号中的至少一个来计算一个或多个特征量,并将所述特征量提供给解码高频子带功率计算电路46。
高频解码电路45执行对来自多路解复用电路41的高频编码数据的解码,并使用作为结果获得的伪高频子带功率差异ID将针对每个ID(索引)预先准备的用于估计高频子带功率的系数(下文称为解码高频子带功率估计系数)提供给解码高频子带功率计算电路46。
解码高频子带功率计算电路46基于来自特征量计算电路44的一个或多个特征量和来自高频解码电路45的解码高频子带功率估计系数来计算解码高频子带功率,并将所述解码高频子带功率提供给解码高频信号生成电路47。
解码高频信号生成电路47基于来自子带划分电路43的解码低频子带信号和来自解码高频子带功率计算电路46的解码高频子带功率来生成解码高频信号,并将解码高频信号提供给合成电路48。
合成电路48将来自低频解码电路42的解码低频信号和来自解码高频信号生成电路47的解码高频信号进行合成,并作为输出信号输出。
[解码设备的解码处理]
接下来,将参照图14的流程图来描述使用图13中的解码设备的解码处理。
在步骤S131中,多路解复用电路41将输入代码串多路解复用成高频编码数据和低频编码数据,将低频编码数据提供给低频解码电路42,以及将高频编码数据提供给高频解码电路45。
在步骤S132中,低频解码电路42执行对来自多路解复用电路41的低频编码数据的解码,并将作为结果获得的解码低频信号提供给子带划分电路43、特征量计算电路44和合成电路48。
在步骤S133中,子带划分电路43将来自低频解码电路42的解码低频信号均等地划分成具有预定带宽的多个子带信号,并将获得的解码低频子带信号提供给特征量计算电路44和解码高频信号生成电路47。
在步骤S134中,特征量计算电路44根据来自低频解码电路42的解码低频信号和来自子带划分电路43的解码低频子带信号的多个子带信号中的至少一个来计算一个或多个特征量,并将所述特征量提供给解码高频子带功率计算电路46。注意,在图13中的特征量计算电路44基本上与图3中的特征量计算电路14具有相同的配置和功能,并且在步骤S134中的处理基本上与在图4的流程图的步骤S4中的处理相同,因此,将省略对它们的详细描述。
在步骤S135中,高频解码电路45执行对来自多路解复用电路41的高频编码数据的解码,并且,使用作为结果获得的伪高频子带功率差异ID将预先为每个ID(索引)准备的解码高频子带功率估计系数提供给解码高频子带功率计算电路46。
在步骤S136中,解码高频子带功率计算电路46基于来自特征量计算电路44的一个或多个特征量和来自高频解码电路45的解码高频子带功率估计系数来计算解码高频子带功率。注意,在图13中的解码高频子带功率计算电路46具有与图3中的高频子带功率估计电路15基本上相同的配置和功能,并且在步骤S136中的处理基本上与在图4的流程图的步骤S5中的处理相同,因此,将省略对它们的详细描述。
在步骤S137中,解码高频信号生成电路47基于来自子带划分电路43的解码低频子带信号和来自解码高频子带功率计算电路46的解码高频子带功率来输出解码高频信号。注意,在图13中的解码高频信号生成电路47具有与图3中的高频信号生成电路16基本上相同的配置和功能,并且在步骤S137中的处理基本上与在图4的流程图的步骤S6中的处理相同,因此将省略对它们的详细描述。
在步骤138中,合成电路48将来自低频解码电路42的解码低频信号和来自解码高频信号生成电路47的解码高频信号进行合成,并对其进行输出以作为输出信号。
根据上述处理,通过在解码时使用对应于在编码时预先计算的伪高频子带功率与实际高频子带功率之间的差异的特征的高频子带功率估计系数,可以提高在解码时估计高频子带功率的精确度,并且因此可以以较高的音质播放音乐信号。
另外,根据上述处理,包括在代码串中的用于生成高频信号的仅有信息是伪高频子带功率差异ID,而这并不多,因此,可以高效地执行解码处理。
针对应用了本发明的编码处理和解码处理进行了以上描述,但是将在下面描述对于图11中的编码设备30的高频编码电路37预设的伪高频子带功率差异的特征空间中的多个簇中的每一个簇的代表向量以及由图13中的解码设备40的高频解码电路45输出的解码高频子带功率估计系数的计算方法。
[在伪高频子带功率差异的特征空间中的多个簇的代表向量,以及对应于每个簇的解码高频子带功率估计系数的计算方法]
作为求出多个簇的代表向量和每个簇的解码高频子带功率估计系数的方法,需要准备能够根据在编码时计算的伪高频子带功率差异向量来在解码时精确地估计高频子带功率的系数。因此,应用如下技术:在该技术中,预先使用宽带教学信号来执行学习,并且这些可以基于学习结果来确定。
[系数学习设备的功能配置示例]
图15示出了执行对多个簇的代表向量和每个簇的解码高频子带功率估计系数的学习的系数学习设备的功能配置示例。
当编码设备30的输入信号通过低通滤波器31并被低频编码电路32编码并进一步通过解码设备40的低频解码电路42解码为解码低频信号时,在输入到图15中的系数学习设备50的宽带教学信号中的低于由编码设备30的低通滤波器31设置的截止频率的信号分量是有利的。
系数学习设备50包括低通滤波器51、子带划分电路52、特征量计算电路53、伪高频子带功率计算电路54、伪高频子带功率差异计算电路55、伪高频子带功率差异聚类电路56和系数估计电路57。
注意,图15中的系数学习设备50的低通滤波器51、子带划分电路52、特征量计算电路53和伪高频子带功率计算电路54中的每一个具有基本上与图11中的编码设备30中的相应低通滤波器31、子带划分电路33、特征量计算电路34和伪高频子带功率计算电路35相同的配置和功能,因此,将适当地省略对它们的描述。
也就是说,伪高频子带功率差异计算电路55具有类似于图11中的伪高频子带功率差异计算电路36的配置和功能,但是,计算的伪高频子带功率差异被提供给伪高频子带功率差异聚类电路56,并且在计算伪高频子带功率差异时计算的高频子带功率被提供给系数估计电路57。
伪高频子带功率差异聚类电路56将根据伪高频子带功率差异计算电路55的伪高频子带功率差异获得的伪高频子带功率差异向量进行聚类,并且计算每个簇的代表向量。
系数估计电路57基于来自伪高频子带功率差异计算电路55的高频子带功率和来自特征量计算电路53的一个或多个特征量来计算已使用伪高频子带功率差异聚类电路56进行聚类的每个簇的高频子带功率估计系数。
[系数学习设备的系数学习处理]
接下来,将参照图16中的流程图来描述使用图15中的系数学习设备50的系数学习处理。
注意,除了输入到系数学习设备50中的信号是宽带教学信号以外,在图16的流程图中的步骤S151至S155中的处理类似于图12中的流程图中的步骤S111以及S113至S116中的处理,因此将省略对它们的描述。
也就是说,在步骤S156中,伪高频子带功率差异聚类电路56将从来自伪高频子带功率差异计算电路55的伪高频子带功率差异中获得的多个(大量的时间帧)伪高频子带功率差异向量聚类成例如64个簇,并计算每个簇的代表向量。例如,聚类方法的示例可以是使用k-均值聚类。伪高频子带功率差异聚类电路56将作为执行k-均值聚类的结果而获得的每个簇的重心向量设置为每个簇的代表向量。注意,聚类的方法和簇的数量不局限于以上描述,而是可以使用其他方法。
另外,伪高频子带功率差异聚类电路56使用在时间帧J中根据来自伪高频子带功率差异计算电路55的伪高频子带功率差异而获得的伪高频子带功率差异向量来测量64个代表向量的距离,并确定具有最短距离的代表向量所属于的簇的索引CID(J)。注意,索引CID(J)取自从1到簇的数量(在该示例中为64)的整数。伪高频子带功率差异聚类电路56因此输出代表向量,并将索引CID(J)提供给系数估计电路57。
在步骤S157中,系数估计电路57针对具有同一索引CID(J)(属于同一簇)的每个组执行每个簇的解码高频子带功率估计系数的计算,所述解码高频子带功率估计系数是从伪高频子带功率差异计算电路55和特征量计算电路53提供给相同时间帧的特征量和(eb-sb)数量个高频子带功率的多个组合的系数。注意,用于使用系数估计电路57来计算系数的方法类似于图9中的系数学习设备20的系数估计电路24的方法,但不言而喻,可以使用其他方法。
根据上述处理,预先使用宽带教学信号来针对图11中的编码设备30的高频编码电路37中预设的伪高频子带功率差异的特征空间中的多个簇的每个簇的代表向量以及针对在图13中的解码设备40的高频解码电路45输出的解码高频子带功率估计系数来执行学习,由此,可以获得关于输入到编码设备30中的各种输入信号以及输入到解码设备40中的各种输入代码串的良好输出结果,并且因此,可以以较高的音质播放音乐信号。
另外,用于在编码设备30的伪高频子带功率计算电路35和解码设备40的解码高频子带功率计算电路46中计算高频子带功率的系数数据可以对于信号编码和解码按照以下处理。也就是说,通过使用根据输入信号的类型而不同的系数数据,其系数可以记录在代码串的开始部分。
例如,通过根据用于讲话或爵士音乐等的信号来修改系数数据,可以提高编码效率。
图17示出了以此方式获得的代码串。
图17中的代码串A是编码讲话的代码串,并且对于讲话最优的系数数据α记录在报头中。
相反地,图17中的代码串B是编码爵士音乐的代码串,并且对于爵士音乐最优的系数数据β记录在报头中。
这样的多种类型的系数数据可以通过预先学习相似类型的音乐信号来准备,并且编码设备30可以使用流派信息(例如记录在输入信号的报头中的流派信息)来选择系数数据。可替代地,可以通过执行信号的波形分析来确定该流派,从而来选择系数数据。也就是说,这样的用于信号的流派分析方法不局限于特定方法。
另外,如果计算时间允许,则可以将上述学习设备构建到编码设备30中,使用它的专用信号的系数来执行处理,并且如最终在图17的代码串C中示出的,可以将所述系数记录到报头中。
下面,将描述使用该方法的优点。
一个输入信号中存在其中高频子带功率的形式是类似的多个位置。通过使用这种许多输入信号具有的特征以及通过对每个输入信号分别学习用于估计高频子带功率的系数,使得能够降低由高频子带功率的相似位置的存在而引起的冗余度。另外,与使用多个信号来统计地估计高频子带功率的系数的学习相比,可以以较高的精确度来执行高频子带功率估计。
另外,如上所示,可以进行如下布置:将编码时从输入信号学习的系数数据一次插入到若干帧中。
<3.第三实施例>
[编码设备的功能配置示例]
注意,根据以上描述,伪高频子带功率差异ID被作为高频编码数据从编码设备30输出到解码设备40,但是可以将用于获得解码高频子带功率估计系数的系数索引设置为高频编码数据。
在这样的情况下,编码设备30被配置为例如如图18所示。注意,在图18中,对应于图11中的情况的部分具有相同的附图标记,因此将适当地省略对它们的描述。
图18中的编码设备30与图11中的编码设备30的不同之处在于:没有设置低频解码电路39,但其他设计点相同。
关于图18中的编码设备30,特征量计算电路34使用从子带划分电路33提供的低频子带信号来计算低频子带功率以作为特征量,并将其提供给伪高频子带功率计算电路35。
另外,将预先通过回归分析求出的多个解码高频子带功率估计系数和识别这样的解码高频子带功率估计系数的系数索引进行相关联并记录在伪高频子带功率计算电路35中。
具体地,预先准备用于计算上述表达式(2)的各种子带的多组系数Aib(kb)和系数Bib,以作为解码高频子带功率估计系数。例如,这些Aib(kb)和系数Bib被预先使用最小二乘法的回归分析求出,其中,以低频子带功率作为解释变量,高频子带功率作为被解释变量。在回归分析中,使用由低频子带信号和高频子带信号组成的输入信号来作为宽带教学信号。
伪高频子带功率计算电路35使用针对每个记录的解码高频子带功率估计系数的来自特征量计算电路34的特征量和解码高频子带功率估计系数来计算每个高频侧子带的伪高频子带功率,并将所述伪高频子带功率提供给伪高频子带功率差异计算电路36。
伪高频子带功率差异计算电路36比较从子带划分电路33提供的高频子带信号获得的高频子带功率与来自伪高频子带功率计算电路35的伪高频子带功率。
作为所述多个解码高频子带功率估计系数的比较结果,伪高频子带功率差异计算电路36向高频编码电路37提供获得最接近高频子带功率的伪高频子带功率的解码高频子带功率估计系数的系数索引。换句话说,选择在解码时实现输入信号的高频信号(即,获得最接近真实值的解码高频信号)的解码高频子带功率估计系数的系数索引。
[编码设备的编码处理]
接下来,将参照图19的流程图来描述由图18的编码设备30执行的编码处理。注意,步骤S181至步骤S183中的处理类似于图12的步骤S111至S113,因此,将省略对它们的详细描述。
在步骤S184中,特征量计算电路34使用来自子带划分电路33的低频子带信号来计算特征量,并将所述特征量提供给伪高频子带功率计算电路35。
具体地,特征量计算电路34执行上述表达式(1)中的计算来计算在低频侧的每个子带ib(其中sb-3≤ib≤sb)的帧J(其中0≤J)的低频子带功率power(ib,J)来作为特征量。也就是说,通过将组成帧J的低频子带信号的每个样本的样本值的均方根求对数来计算低频子带功率power(ib,J)。
在步骤S185中,伪高频子带功率计算电路35基于从特征量计算电路34提供的特征量来计算伪高频子带功率,并将所述伪高频子带功率提供给伪高频子带功率差异计算电路36。
例如,伪高频子带功率计算电路35使用预先记录的系数Aib(kb)和系数Bib作为解码高频子带功率估计系数和低频子带功率power(kb,J)(其中sb-3≤kb≤sb)来执行上面描述的表达式(2)中的计算,并计算伪高频子带功率powerest(ib,J)。
也就是说,将每个子带的系数Aib(kb)乘以被作为特征量提供的每个低频侧子带的低频子带功率power(kb,J),并且进一步地将系数Bib加到乘以系数的低频子带功率的总和上,从而成为伪高频子带功率powerest(ib,J)。针对其中索引为sb+1至eb的每个高频侧子带来计算伪高频子带功率。
另外,伪高频子带功率计算电路35执行针对预先记录的每个解码高频子带功率估计系数的伪高频子带功率的计算。例如,假设系数索引为1至K(其中2≤K),并且预先准备K个解码高频子带功率估计系数。在该情况下,针对K个解码高频子带功率估计系数中的每一个,计算每个子带的伪高频子带功率。
在步骤S186中,伪高频子带功率差异计算电路36基于来自子带划分电路33的高频子带信号和来自伪高频子带功率计算电路35的伪高频子带功率来计算伪高频子带功率差异。
具体地,伪高频子带功率差异计算电路36针对来自于子带划分电路33的高频子带信号执行类似于上述表达式(1)中的计算的计算,并计算在帧J中的高频子带功率power(ib,J)。注意,根据本实施例,低频子带信号的子带和高频子带信号的子带全部使用索引ib来识别。
接下来,伪高频子带功率差异计算电路36执行类似于上述表达式(14)中的计算的计算,并且求出在帧J中的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,J)之间的差异。从而,对于每个解码高频子带功率估计系数,获得其中索引为sb+1至eb的每个高频侧子带的伪高频子带功率差异powerdiff(ib,J)。
在步骤S187中,伪高频子带功率差异计算电路36针对每个解码高频子带功率估计系数计算下面的表达式(15),并计算伪高频子带功率差异的平方和。
[表达式15]
注意,在表达式(15)中,差异平方和E(J,id)示出了针对系数索引为id的解码高频子带功率估计系数求出的帧J的伪高频子带功率差异的平方和。另外,在表达式(15)中,powerdiff(ib,J,id)表示针对系数索引为id的解码高频子带功率估计系数求出的索引为ib的子带的帧J的伪高频子带功率差异powerdiff(ib,J)。针对k个解码高频子带功率估计系数的每一个来计算差异平方和E(J,id)。
由此获得的差异平方和E(J,id)示出了在从实际高频信号计算的高频子带功率与使用系数索引为id的解码高频子带功率估计系数来计算的伪高频子带功率之间的相似度。
也就是说,表示了估计值对于高频子带功率的真实值的误差。因此,差异平方和E(J,id)越小,使用解码高频子带功率估计系数的计算获得的解码高频信号就越接近实际的高频信号。换句话说,具有最小差异平方和E(J,id)的解码高频子带功率估计系数可以被说成是在解码输出代码串的时候执行的频带扩展处理的最佳估计系数。
从而,伪高频子带功率差异计算电路36选择k个差异平方和E(J,id)中的值为最小的差异平方和E(J,id),并将表示对应于该差异平方和的解码高频子带功率估计系数的系数索引提供给高频编码电路37。
在步骤S188中,高频编码电路37对从伪高频子带功率差异计算电路36提供的系数索引进行编码,并将作为结果获得的高频编码数据提供给多路复用电路38。
例如,在步骤S188中,对系数索引执行熵编码等。从而,可以压缩输出到解码设备40的高频编码数据的信息量。注意,高频编码数据可以是任何类型的信息,只要该信息可以获得最佳解码高频子带功率估计系数即可,并且例如,可以将系数索引用作高频编码数据,而无需进行变化。
在步骤S189中,多路复用电路38对从低频编码电路32提供的低频编码数据和从高频编码电路37提供的高频编码数据进行多路复用,并输出作为结果获得的输出代码串,并且结束编码处理。
从而,通过将通过对系数索引进行编码获得的高频编码数据与低频编码数据一起作为输出代码串进行输出,接收该输出代码串的输入的解码设备40可以获得对于频带扩展处理为最佳的解码高频子带功率估计系数。从而,可以获得具有较高音质的信号。
[解码设备的功能配置示例]
另外,输入作为输入代码串的从图18中的编码设备30输出的输出代码串并对其解码的解码设备40被配置为例如图20所示。注意,在图20中,与图13中的情况对应的部分具有相同的附图标记,将省略对它们的描述。
从由多路解复用电路41至合成电路48组成的观点看,图20中的解码设备40与图13中的解码设备40相同,但是从来自低频解码电路42的解码低频信号没有提供给特征量计算电路44的观点看,则不同于图13中的解码设备40。
在图20中的解码设备40处,高频解码电路45预先记录与由图18中的伪高频子带功率计算电路35所记录的解码高频子带功率估计系数相同的解码高频子带功率估计系数。也就是说,用作解码高频子带功率估计系数的由回归分析预先求出的一组系数Aib(kb)和系数Bib与系数索引相关联并被记录。
高频解码电路45解码从多路解复用电路41提供的高频编码数据,并将与作为结果获得的系数索引一起示出的解码高频子带功率估计系数提供给解码高频子带功率计算电路46。
[解码设备的解码处理]
接下来,将参照图21的流程图来描述使用图20中的解码设备40执行的解码处理。
当从编码设备30输出的输出代码串被作为输入代码串提供给解码设备40时开始所述解码处理。注意,在步骤S211至步骤S213中的处理类似于图14中的步骤S131至步骤S133中的处理,因此将省略对它们的详细描述。
在步骤S214中,特征量计算电路44使用来自子带划分电路43的解码低频子带信号来计算特征量,并将所述特征量提供给解码高频子带功率计算电路46。具体地,特征量计算电路44执行上述表达式(1)中的计算,并针对各个低频侧子带ib来计算帧J(其中0≤J)的低频子带功率power(ib,J),以作为特征量。
在步骤S215中,高频解码电路45执行从多路解复用电路41提供的高频编码数据的解码,并将由作为结果获得的系数索引所示出的解码高频子带功率估计系数提供给解码高频子带功率计算电路46。也就是说,在预先在高频解码电路45中记录的多个解码高频子带功率估计系数中,输出了通过解码所获得的系数索引示出的解码高频子带功率估计系数。
在步骤S216中,解码高频子带功率计算电路46基于从特征量计算电路44提供的特征量和从高频解码电路45提供的解码高频子带功率估计系数来计算解码高频子带功率,并将所述解码高频子带功率提供给解码高频信号生成电路47。
也就是说,解码高频子带功率计算电路46使用用作解码高频子带功率估计系数的系数Aib(kb)和Bib以及低频子带功率power(kb,J)(其中sb-3≤kb≤sb)作为特征量来执行在上述表达式(2)中的计算,并计算解码高频子带功率。从而,获得了索引为sb+1至eb的每个高频侧子带的解码高频子带功率。
在步骤S217中,解码高频信号生成电路47基于从子带划分电路43提供的解码低频子带信号和从解码高频子带功率计算电路46提供的解码高频子带功率来生成解码高频信号。
具体地,解码高频信号生成电路47使用解码低频子带信号来执行在上述表达式(1)中的计算,并且计算每个低频侧子带的低频子带功率。解码高频信号生成电路47然后使用获得的低频子带功率和解码高频子带功率来执行上述表达式(3)中的计算,并计算每个高频侧子带的增益量G(ib,J)。
另外,解码高频信号生成电路47使用增益量G(ib,J)和解码低频子带信号来执行在上述表达式(5)和表达式(6)中的计算,并生成每个高频侧子带的高频子带信号x3(ib,n)。
也就是说,解码高频信号生成电路47根据低频子带功率与解码高频子带功率之间的比值来使解码低频子带信号x(ib,n)经受幅度调节,并且作为其结果,还使获得的解码低频子带信号x2(ib,n)经受频率调制。从而,将低频侧子带频率分量的信号转换成高频侧子带的频率分量信号,并且获得高频子带信号x3(ib,n)。
由此获得每个子带的高频子带信号的处理在下面进行细节描述。
假定在频域中的连续排列的四个子带被称为频段块,并且将频带划分成使得一个频段块由在低频侧的索引为sb至sb-3的四个子带组成(下文特别称为低频块)。此时,例如,将由在高频侧的索引为sb+1至sb+4的子带组成的频段视为一个频段块。注意,下文中,将高频侧(即,由索引为sb+1或更大的子带组成)的频段块被特别地称为高频块。
现在,让我们关注组成高频块的一个子带,并生成该子带(下文称为关注子带)的高频子带信号。首先,解码高频信号生成电路47识别与在高频块中感兴趣的子带的位置处于相同位置关系的低频块的子带。
例如,如果感兴趣的子带的索引是sb+1,则感兴趣的子带是具有高频块的最低频率的频段,由此,与感兴趣的子带处于相同位置关系的低频块子带变成索引是sb-3的子带。
从而,当与感兴趣的子带处于相同位置关系的低频块的子带被识别时,该子带的低频子带功率和解码低频子带信号以及感兴趣的子带的解码高频子带功率被用来生成感兴趣的子带的高频子带信号。
也就是说,在表达式(3)中解码高频子带功率和低频子带功率被代入,并且计算了根据其功率的比率的增益量。计算的增益量被乘以解码低频子带信号,并且进一步地,使用在表达式(6)中的计算使已乘以增益量的解码低频子带信号经受频率调制,从而成为感兴趣的子带的高频子带信号。
利用上述处理,获得了每个高频侧子带的高频子带信号。随后,解码高频信号生成电路47还执行上述表达式(7)中的计算,求出获得的各个高频子带信号的和,并生成解码高频信号。解码高频信号生成电路47将获得的解码高频信号提供给合成电路48,并且处理从步骤S217前进到步骤S218。
在步骤S218中,合成电路48对来自低频解码电路42的解码低频信号和来自解码高频信号生成电路47的解码高频信号进行合成,并将其作为输出信号输出。随后,解码处理结束。
如上所述,根据解码设备40,从通过多路解复用输入代码串所获得的高频编码数据获得系数索引,使用通过所述系数索引示出的解码高频子带功率估计系数来计算解码高频子带功率,由此,可以改善对高频子带功率的估计精确度。从而,可以以较高的音质播放音乐信号。
<4.第四实施例>
[编码设备的编码处理]
另外,针对如下情况来描述示例:只有系数索引包括在高频编码数据中,但是其他信息可以包括在其中。
例如,如果在高频编码数据中包括系数索引,则可以在解码设备40侧知道获得最接近真实高频信号的高频子带功率的解码高频子带功率的解码高频子带功率估计系数。
然而,大致与使用伪高频子带功率差异计算电路36计算的伪高频子带功率差异powerdiff(ib,J)具有大体相同值的差异出现在真实高频子带功率(真实值)和解码设备40侧的解码高频子带功率(估计值)中。
现在,如果在高频编码数据中不但包含有系数索引而且还包含有每个子带的伪高频子带功率差异,则可以在解码设备40侧知道解码高频子带功率对于实际高频子带功率的总误差。从而,可以使用该误差来进一步提高高频子带功率的估计精确度。
下面,将参照图22和图23中的流程图来描述在高频编码数据中包括伪高频子带功率差异的情况下的编码处理和解码处理。
首先,将参照图22中的流程图来描述使用图18中的编码设备30执行的编码处理。注意,在步骤S241至步骤S246中的处理类似于在图19中的步骤S181至步骤S186中的处理,因此将省略对它们的详细描述。
在步骤S247中,伪高频子带功率差异计算电路36执行上述表达式(15)中的计算,并且计算每个解码高频子带功率估计系数的差异平方和E(J,id)。
伪高频子带功率差异计算电路36选择在差异平方和E(J,id)中为最小值的差异平方和,并将示出对应于该差异平方和的解码高频子带功率估计系数的系数索引提供给高频编码电路37。
另外,伪高频子带功率差异计算电路36将针对与选择的差异平方和对应的解码高频子带功率估计系数求出的、每个子带的伪高频子带计算差异powerdiff(ib,J)提供给高频编码电路37。
在步骤S248中,高频编码电路37对从伪高频子带功率差异计算电路36提供的系数索引和伪高频子带计算差异进行编码,并将作为结果获得的高频编码数据提供给多路复用电路38。
从而,在高频侧的其中索引为sb+1至eb的每个子带的伪高频子带功率差异(即,高频子带功率的估计误差)被作为高频编码数据提供给解码设备40。
当已获得高频编码数据时,随后,执行在步骤S249中的处理,并结束编码处理,但是在步骤S249中的处理类似于在图19的步骤S189中的处理,因此将省略对其的详细描述。
如上所述,当在高频编码数据中包括伪高频子带功率差异时,可以在解码设备40处进一步提高高频子带功率的估计精确度,并且可以获得具有更高音质的音乐信号。
[解码设备的解码处理]
接下来,将参照图23中的流程图来描述使用在图20中的解码设备40来执行解码处理。注意,在步骤S271至步骤S274中的处理类似于在图21的步骤S211至步骤S214中的处理,因此将省略对它们的详细描述。
在步骤S275中,高频解码电路45执行对从多路解复用电路41提供的高频编码数据的解码。高频解码电路45然后将由通过解码获得的系数索引表示的解码高频子带功率估计系数和通过解码获得的每个子带的伪高频子带功率差异提供给解码高频子带功率计算电路46。
在步骤S276中,解码高频子带功率计算电路46基于从特征量计算电路44提供的特征量和从高频解码电路45提供的解码高频子带功率估计系数来计算解码高频子带功率。注意,在步骤S276中,执行类似于在图21的步骤S216中的处理。
在步骤S277中,解码高频子带功率计算电路46将从高频解码电路45提供的伪高频子带功率差异加到解码高频子带功率上,将其设置为最终解码高频子带功率,以及将其提供给解码高频信号生成电路47。也就是说,每个计算的子带的解码高频子带功率被加上同一子带的伪高频子带功率差异。
随后,执行在步骤S278和步骤S279中的处理,并结束解码处理,但是此处的处理与在图21中的步骤S217和步骤S218中的处理相同,因此将省略对它们的描述。
如上所述,解码设备40根据通过多路解复用输入代码串获得的高频编码数据获得系数索引和伪高频子带功率差异。解码设备40然后使用由系数索引表示的解码高频子带功率估计系数和伪高频子带功率差异来计算解码高频子带功率。从而,可以提高高频子带功率的估计精确度,并且可以以更高的音质播放音乐信号。
注意,可以考虑在编码设备30和解码设备40之间出现的高频子带功率的估计值中的差异,即,在伪高频子带功率与解码高频子带功率中的差异(下文称为设备间估计差异)。
在这样的情况下,例如,可以使用设备间估计差异来修正用作高频编码数据的伪高频子带功率差异,或者可以在高频编码数据中包括设备间估计差异,并且可以在解码设备40侧通过设备间估计差异来修正伪高频子带功率差异。另外,可以预先在解码设备40侧记录设备间估计差异,其中解码设备40将设备间估计差异加到伪高频子带功率差异上,并执行修正。从而,可以获得更接近实际高频信号的解码高频信号。
<5.第五实施例>
注意,在图18中的编码设备30被描述成使得伪高频子带功率差异计算电路36从多个系数索引中选择最佳差异平方和来作为用作指标的差异平方和E(J,id),但是可以使用不同于差异平方和的指标来选择系数索引。
例如,可以使用考虑了在高频子带功率与伪高频子带功率之间的残差的均方值、最大值和平均值等的评价值作为指标来选择系数索引。在这样的情况中,在图18中的编码设备30执行在图24中的流程图中示出的编码处理。
下面将参照图24中的流程图来描述使用编码设备30的编码处理。注意,在步骤S301至步骤S305中的处理类似于在图19中的步骤S181至步骤S185中的处理,因此将省略对它们的详细描述。在步骤S301至步骤S305中的处理已执行时,针对K个解码高频子带功率估计系数中的每一个来计算每个子带的伪高频子带功率。
在步骤S306中,伪高频子带功率差异计算电路36使用经受处理的当前帧J来针对K个解码高频子带功率估计系数中的每一个计算评价值Res(id,J)。
具体地,伪高频子带功率差异计算电路36使用从子带划分电路33提供的每个子带的高频子带信号来执行类似于在上述表达式(1)中计算的计算,并且计算帧J中的高频子带功率power(ib,J)。注意,根据本实施例,低频子带信号的子带和高频子带信号的子带全部使用索引ib来识别。
当已获得高频子带功率power(ib,J)时,伪高频子带功率差异计算电路36计算下面的表达式(16),并计算残差均方值Resstd(id,J)。
[表达式16]
也就是说,对于其中索引是sb+1至eb的高频侧的每个子带,求出帧J的高频子带功率power(ib,J)和伪高频子带功率的差异powerest(ib,id,J),而它们的差异的平方和成为残差均方值Resstd(id,J)。注意,伪高频子带功率powerest(ib,id,J)表示其中索引为ib的子带的帧J的伪高频子带功率,其是针对其中系数索引为id的解码高频子带功率估计系数求出的。
接下来,伪高频子带功率差异计算电路36计算下面的表达式(17),计算残差最大值Resmax(id,J)。
[表达式17]
Resmax(id,J)=maxib{|power(ib,J)-powerest(ib,id,J)|}
…(17)
注意,在表达式(17)中,maxib{|power(ib,J)-powerest(ib,id,J)|}表示其中索引为sb+1至eb的每个子带的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之前的差异的绝对值的最大值。因此,在帧J中的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之间的差异的绝对值的最大值成为残差最大值Resmax(id,J)。
另外,伪高频子带功率差异计算电路36计算下面的表达式(18),计算残差平均值Resave(id,J)。
[表达式18]
也就是说,对于其中索引为sb+1至eb的高频侧的每个子带,求出在帧J的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之间的差异,并且求出这些差异的总和。通过将获得的差异的总和除以在高频侧的子带的数量(eb-sb)而获得的值的绝对值成为残差平均值Resave(id,J)。此处的残差平均值Resave(id,J)表示已考虑了符号的各个子带的估计差异的平均值的大小。
另外,当获得残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)时,伪高频子带功率差异计算电路36计算下面的表达式(19),从而计算最终评价值Res(id,J)。
[表达式19]
Res(id,J)=Resstd(id,J)+Wmax×Resmax(id,J)+Wave×Resave(id,J)
…(19)
也就是说,将残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)加权相加,从而变成最终评价值Res(id,J)。注意,在表达式(19)中,Wmax和Wave是预设权重值,并且例如可以是Wmax=0.5、Wave=0.5等。
伪高频子带功率差异计算电路36执行上述处理,并针对K个解码高频子带功率估计系数中的每一个(即,针对K个系数索引id中的每一个)计算评价值Res(id,J)。
在步骤S307中,伪高频子带功率差异计算电路36基于每个求出的系数索引id的评价值Res(id,J)来选择系数索引id。
使用以上处理获得的评价值Res(id,J)表示根据实际高频信号计算的高频子带功率与使用其中系数索引是id的解码高频子带功率估计系数计算的伪高频子带功率之间的相似度。也就是说,这示出了高频分量估计误差的大小。
因此,由于使用解码高频子带功率估计系数的计算,评价值Res(id,J)越小,将会获得越接近实际高频信号的解码高频信号。从而,伪高频子带功率差异计算电路36选择在K个评价值Res(id,J)中值为最小的评价值,并将表示对应于该评价值的解码高频子带功率估计系数的系数索引提供给高频编码电路37。
当系数索引输出到高频编码电路37时,随后执行在步骤S308和步骤S309中的处理,并且结束编码处理,但是该处理类似于在图19的步骤S188和步骤S189中的处理,因此将省略对它们的详细描述。
如上所述,关于编码设备30,使用根据残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)计算的评价值Res(id,J),从而选择解码高频子带功率估计系数的最佳系数索引。
通过使用评价值Res(id,J),可以使用与使用差异平方和的情况相比更多的评价尺度来评价高频子带功率的估计精确度,由此,可以选择更准确的解码高频子带功率估计系数。从而,关于接收输出代码串的输入的解码设备40,可以获得对于频带扩展处理来说最佳的解码高频子带功率估计系数,并且可以获得具有较高音质的信号。
<修改1>
另外,通过针对每个输入信号帧执行上述编码处理,可以在对于输入信号的每个高频侧子带具有高频子带功率的很小时间变化的恒定区域处选择针对每个连续帧而不同的系数索引。
也就是说,关于组成输入信号的恒定区域的连续帧,每个帧的高频子带功率近似地具有相同的值,因此对于这些帧,可以连续地选择相同的系数索引。然而,在这些连续帧的片段中,由帧选择的系数索引可以变化,并且因此,在解码设备40侧播放的音频的高频分量会停止保持恒定不变。播放的音频会引起听觉的不舒适感。
现在,在使用编码设备30来选择系数索引的情况中,还会考虑时间在前的帧的高频分量的估计结果。在这样的情况中,图18中的编码设备30执行在图25中的流程图中示出的编码处理。
下面,将参照图25中的流程图来描述使用编码设备30的编码处理。注意,在步骤S331至步骤S336中的处理类似于在图24的步骤S301至步骤S306中的处理,因此将省略对它们的详细描述。
在步骤S337中,伪高频子带功率差异计算电路36计算使用过去帧和当前帧的评价值ResP(id,J)。
具体地,伪高频子带功率差异计算电路36记录使用针对帧(J-1)(即,在时间上先于待处理的帧J一个帧)最终选择的系数索引的解码高频子带功率估计系数所获得的每个子带的伪高频子带功率。现在,最终选择的系数索引是通过高频编码电路37编码并通过解码设备40输出的系数索引。
下文中,假定在帧(J-1)中特定选择的系数索引id被称为idselected(J-1)。另外,描述将会继续,其中,将使用系数索引idselected(J-1)的解码高频子带功率估计系数获得的索引为ib(其中sb+1≤ib≤eb)的子带的伪高频子带功率称为powerest(ib,idselected(J-1),J-1)。
伪高频子带功率差异计算电路36首先计算下面表达式(20),从而计算估计残差均方值Resstd(id,J)。
[表达式20]
也就是说,对于其中索引为sb+1至eb的高频侧的每个子带,求出在帧(J-1)的伪高频子带功率powerest(ib,idselected(J-1),J-1)与帧J的伪高频子带功率powerest(ib,id,J)之间的差异。其差异的平方和然后变成估计残差均方值ResPstd(id,J)。注意,伪高频子带功率powerest(ib,id,J)表示其中索引为ib的子带的帧J的伪高频子带功率,其是针对其中系数索引为id的解码高频子带功率估计系数求出的。
此处估计残差均方值ResPstd(id,J)是在时间上连续的帧之间的伪高频子带功率的差异平方和,由此,该估计残差均方值ResPstd(id,J)越小,则在高频分量估计值中存在越小的时间变化。
接下来,伪高频子带功率差异计算电路36计算下面的表达式(21),从而计算估计残差最大值ResPmax(id,J)。
[表达式21]
ResPmax(id,J)=maxib{|powerest(ib,idselected(J-1),J-1)-powerest(ib,id,J)|}…(21)
注意,在表达式(21)中,maxib{|powerest(ib,idselected(J-1),J-1)-powerest(ib,id,J)|}表示在索引为sb+1至eb的每个子带的伪高频子带功率powerest(ib,idselected(J-1),J-1)与伪高频子带功率powerest(ib,id,J)之间的差异的绝对值的最大值。因此,在时间上连续的帧之间的伪高频子带功率中的差异的绝对值的最大值成为估计残差最大值ResPmax(id,J)。
估计残差最大值ResPmax(id,J)的值越小,在连续的帧之间的高频分量的估计结果就越接近。
当已获得估计残差最大值ResPmax(id,J)时,接下来,伪高频子带功率差异计算电路36计算下面的表达式(22),从而计算估计残差平均值ResPave(id,J)。
[表达式22]
也就是说,对于索引为sb+1至eb的高频侧的每个子带,求出在帧(J-1)的伪高频子带功率powerest(ib,idselected(J-1),J-1)与帧J的伪高频子带功率powerest(ib,id,J)之间的差异。通过将各个子带中的差异和除以在高频侧的子带的数量(eb-sb)而获得的值的绝对值成为估计残差平均值ResPave(id,J)。估计残差平均值ResPave(id,J)此处表示考虑了符号的帧之间的子带的估计值中的差异的平均值的大小。
另外,当获得估计残差均方值ResPstd(id,J)、估计残差最大值ResPmax(id,J)和估计残差平均值ResPave(id,J)时,伪高频子带功率差异计算电路36计算下面的表达式(23),从而计算评价值ResP(id,J)。
[表达式23]
ResP(id,J)=ResPstd(id,J)+Wmax×ResPmax(id,J)
+Wave×ResPave(id,J)…(23)
也就是说,将估计残差均方值ResPstd(id,J)、估计残差最大值ResPmax(id,J)和估计残差平均值ResPave(id,J)进行加权相加,从而变成评价值ResP(id,J)。注意,在表达式(23)中,Wmax和Wave是预设的权重值,并且例如可以是Wmax=0.5、Wave=0.5等。
从而,当使用过去帧和当前帧的评价值ResP(id,J)已被计算时,处理从步骤S337前进到步骤S338。
在步骤S338,伪高频子带功率差异计算电路36计算下面的表达式(24),并计算最终评价值Resall(id,J)。
[表达式24]
Resall(id,J)=Res(id,J)+Wp(J)×ResP(id,J)…(24)
也就是说,将求出的评价值Res(id,J)和评价值ResP(id,J)进行加权相加。注意,在表达式(24)中,Wp(J)是由例如下面的表达式(25)定义的权重值。
[表达式25]
另外,在表达式(25)中的powerr(J)是由下面的表达式(26)定义的值。
[表达式26]
powerr(J)在此处表示在帧(J-1)与帧J的高频子带功率之间的差异的平均值。另外,根据表达式(25),当powerr(J)接近0时,Wp(J)是预定范围内的值,当powerr(J)变得越来越小时,Wp(J)变为接近1的值,并且到powerr(J)是大于预定范围的值时Wp(J)变为0。
现在,当powerr(J)是在0附近的预定范围内的值时,在连续的帧之间的高频子带功率差异的平均值变小一定的量。换句话说,输入信号的高频分量的时间变化很小,由此输入信号的当前帧处于恒定区域。
输入信号的高频分量越稳定,权重Wp(J)越是越靠近1的值,相反地,高频分量越不稳定,该值越接近0。因此,关于在表达式(24)中示出的评价值Resall(id,J),输入信号高频分量的时间变化越小,评价值ResP(id,J)的贡献率就变得越大,其中来自与紧接着的前一帧的高频分量估计结果的比较结果用作评价尺度。
因此,关于输入信号的恒定区域,选择能够获得在紧接着的前一帧的高频分量附近的估计结果的解码高频子带功率估计系数,并且可以在解码设备40侧以更自然的高音质播放音频。相反地,关于输入信号的非恒定区域,在评价值Resall(id,J)中的用于评价值ResP(id,J)的项变为0,从而获得更接近实际高频信号的解码高频信号。
伪高频子带功率差异计算电路36执行以上处理,并针对K个解码高频子带功率估计系数中的每一个来计算评价值Resall(id,J)。
在步骤S339中,伪高频子带功率差异计算电路36基于求出的每个解码高频子带功率估计系数的评价值Resall(id,J)来选择系数索引id。
使用上述处理获得的评价值Resall(id,J)使用权重值将评价值Res(id,J)和评价值ResP(id,J)进行线性组合。如上所述,评价值Res(id,J)的值越小,可以获得越接近真实高频信号的解码高频信号。另外,评价值ResP(id,J)的值越小,可以获得越接近紧接着的前一帧的解码高频信号的解码高频信号。
因此,评价值Resall(id,J)越小,可以获得越准确的解码高频信号。从而,在K个评价值Resall(id,J)中,伪高频子带功率差异计算电路36选择具有最小值的评价值,并将表示对应于所述评价值的解码高频子带功率估计系数的系数索引提供给高频编码电路37。
当已选择系数索引时,随后,执行步骤S340和步骤S341中的处理,并结束编码处理,但是此处的处理类似于在图24中的步骤308至步骤S309中的处理,因此将省略对它们的详细描述。
如以上所示,关于编码设备30,使用通过线性组合评价值Res(id,J)和评价值ResP(id,J)获得的评价值Resall(id,J),从而选择解码高频子带功率估计系数的最佳系数索引。
通过使用评价值Resall(id,J),类似于使用评价值Res(id,J)的情况,可以以更多的估计尺度来选择更准确的解码高频子带功率估计系数。此外,通过使用评价值Resall(id,J),可以在解码设备40侧抑制待播放的信号的高频分量的恒定区域中的时间变化,并且可以获得具有较高音质的信号。
<修改2>
现在,关于频带扩展处理,如果要获得音频的较高音质,从听的角度来看,在低频侧的子带变得更重要。也就是说,在高频侧的各个子带中,接近低频侧的子带的估计精确度越高,就可以以越高的音频质量播放。
现在,在针对每个解码高频子带功率估计系数来计算评价值的情况中,在甚低频侧上的子带会被加权。在这样的情况中,在图18中的编码设备30执行在图26的流程图中示出的编码处理。
下面将参照图26中的流程图来描述通过编码设备30的编码处理。注意,在步骤S371至步骤S375中的处理中类似于在图25中的步骤S331至步骤S335中的处理,因此将省略对它们的详细描述。
在步骤S376中,伪高频子带功率差异计算电路36使用待处理的当前帧J来针对K个解码高频子带功率估计系数中的每一个来计算评价值ResWband(id,J)。
具体地,伪高频子带功率差异计算电路36使用从子带划分电路33提供的各个子带的高频子带信号来执行类似于在上述表达式(1)中的计算,从而计算在帧J中的高频子带功率power(ib,J)。
当已获得高频子带功率power(ib,J)时,伪高频子带功率差异计算电路36计算下面的表达式(27),并计算残差均方值ResstdWband(id,J)。
[表达式27]
也就是说,对于其中索引为sb+1至eb的每个高频侧子带,求出在帧J的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之间的差异,并且将每个子带的权重Wband(ib)乘以所述差异。被乘以权重Wband(ib)的差异平方和成为残差均方值ResstdWband(id,J)。
现在,权重Wband(ib)(其中sb+1≤ib≤eb)例如由下面的表达式(28)定义。子带越靠近低频侧,权重Wband(ib)的值就变得越大。
[表达式28]
接下来,伪高频子带功率差异计算电路36计算残差最大值ResmaxWband(id,J)。具体地,已使索引为sb+1至eb的各个子带的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之间的差异乘以权重Wband(ib)的那些的绝对值的最大值成为残差最大值ResmaxWband(id,J)。
另外,伪高频子带功率差异计算电路36计算残差平均值ResaveWband(id,J)。
具体地,针对其中索引为sb+1至eb的每个子带,求出在高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之间的差异,并将该差异乘以权重Wband(ib),并求出乘以权重Wband(ib)的差异的总和。通过将获得的差异的总和除以在高频侧的子带的数量(eb-sb)而获得的值的绝对值是残差平均值ResaveWband(id,J)。
另外,伪高频子带功率差异计算电路36计算评价值ResWband(id,J)。也就是说,残差均方值ResstdWband(id,J)、已乘以权重Wmax的残差最大值ResmaxWband(id,J)以及已乘以权重Wave的残差平均值ResaveWband(id,J)的和是评价值ResWband(id,J)。
在步骤S377中,伪高频子带功率差异计算电路36计算使用过去帧和当前帧的评价值ResPWband(id,J)。
具体地,伪高频子带功率差异计算电路36记录针对在时间上先于待处理的帧J的一个帧的帧(J-1)使用最终选择的系数索引的解码高频子带功率估计系数获得的每个子带的伪高频子带功率。
伪高频子带功率差异计算电路36首先计算估计残差均方值ResPstdWband(id,J)。也就是说,对于其中索引为sb+1至eb的在高频侧的每个子带,求出在伪高频子带功率powerest(ib,idselected(J-1),J-1)和伪高频子带功率powerest(ib,id,J)之间的差异,并将该差异乘以权重Wband(ib)。乘以权重Wband(ib)的差异平方和是估计残差均方值ResPstdWband(id,J)。
接下来,伪高频子带功率差异计算电路36计算估计残差最大值ResPmaxWband(id,J)。具体地,将通过将权重Wband(ib)乘以在其中索引为sb+1至eb的每个子带的伪高频子带功率powerest(ib,idselected(J-1),J-1)与伪高频子带功率powerest(ib,id,J)之间的差异而获得的绝对值的最大值来作为估计残差最大值ResPmaxWband(id,J)。
接下来,伪高频子带功率差异计算电路36计算估计残差平均值ResPaveWband(id,J)。具体地,求出在其中索引为sb+1至eb的每个子带的伪高频子带功率powerest(ib,idselected(J-1),J-1)与伪高频子带功率powerest(ib,id,J)之间的差异,并将所述差异乘以权重Wband(ib)。通过将乘以权重Wband(ib)的差异的总和除以在高频侧的子带的数量(eb-sb)而获得的值的绝对值是估计残差平均值ResPaveWband(id,J)。
另外,伪高频子带功率差异计算电路36求出估计残差均方值ResPstdWband(id,J)、已乘以权重Wmax的估计残差最大值ResPmaxWband(id,J)以及已乘以权重Wave的估计残差平均值ResPaveWband(id,J)的总和,并将它作为评价值ResWband(id,J)。
在步骤S378中,伪高频子带功率差异计算电路36将评价值ResWband(id,J)与已乘以表达式(25)中的权重Wp(J)的评价值ResPWband(id,J)相加,并计算最终评价值ResallWband(id,J)。评价值ResallWband(id,J)此处是针对K个解码高频子带功率估计系数的每一个计算的。
随后,执行在步骤S379至步骤S381中的处理,并结束编码处理,但是此处的处理类似于在图25中的步骤S339至步骤S341中的处理,因此将省略对它们的详细描述。注意在步骤S379中,在K个系数索引中,选择具有最小评价值ResallWband(id,J)的系数索引。
从而,每个子带被加权,使得权重被安置成进一步朝向在低频侧的子带,由此可以在解码设备40侧获得具有较高音质的音频。
注意,关于以上描述,基于评价值ResallWband(id,J)来执行对解码高频子带功率估计系数的选择,但是可以基于评价值ResWband(id,J)来选择解码高频子带功率估计系数。
<修改3>
另外,人类的听觉具有当频带的幅度(功率)大时更好地感知频带的特性,因此可以针对每个解码高频子带功率估计系数来计算评价值,以使得权重被安置在具有较大功率的子带上。
在这样的情况下,图18中的编码设备30执行在图27中的流程图中示出的编码处理。下面将参照图27中的流程图来描述使用编码设备30的编码处理。注意,在步骤S401至步骤S405中的处理类似于在图25中的步骤S331至步骤S335中的处理,因此将省略对它们的详细描述。
在步骤S406中,伪高频子带功率差异计算电路36针对K个解码高频子带功率估计系数中的每一个来计算使用经受处理的当前帧J的评价值ResWpower(id,J)。
具体地,伪高频子带功率差异计算电路36使用从子带划分电路33提供的每个子带的高频子带信号来执行类似于上述表达式(1)的计算,从而计算在帧J中的高频子带功率power(ib,J)。
当已获得高频子带功率power(ib,J)时,伪高频子带功率差异计算电路36计算下面的表达式(29),从而计算残差均方值ResstdWpower(id,J)。
[表达式29]
也就是说,针对其中索引为sb+1至eb的在高频侧的每个子带求出在高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之间的差异,并且将每个子带的权重Wpower(power(ib,J))乘以这些差异。乘以权重Wpower(power(ib,J))的差异平方和是残差均方值ResstdWpower(id,J)。
现在,例如由下面的表达式(30)来定义权重Wpower(power(ib,J))(其中,sb+1≤ib≤eb)。权重Wpower(power(ib,J))的值随着它的子带的高频子带功率power(ib,J)的增加而增加。
[表达式30]
接下来,伪高频子带功率差异计算电路36计算残差最大值ResmaxWpower(id,J)。具体地,即通过将权重Wpower(power(ib,J))乘以在索引为sb+1至eb的每个子带的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之间的差异而获得的绝对值的最大值是残差最大值ResmaxWpower(id,J)。
另外,伪高频子带功率差异计算电路36计算残差平均值ResaveWpower(id,J)。
具体地,求出索引为sb+1至eb的每个子带的高频子带功率power(ib,J)与伪高频子带功率powerest(ib,id,J)之间的差异,并将所述差异乘以权重Wpower(power(ib,J)),并求出乘以权重Wpower(power(ib,J))的差异的总和。通过将获得的差异总和除以在高频侧的子带的数量(eb-sb)而获得的值的绝对值是残差平均值ResaveWpower(id,J)。
另外,伪高频子带功率差异计算电路36计算评价值ResWpower(id,J)。也就是说,残差均方值ResstdWpower(id,J)、已乘以权重Wmax的残差最大值ResmaxWpower(id,J)以及已乘以权重Wave的残差平均值ResaveWpower(id,J)的总和是评价值ResWpower(id,J)。
在步骤S407中,伪高频子带功率差异计算电路36计算使用过去帧和当前帧的评价值ResPWpower(id,J)。
具体地,伪高频子带功率差异计算电路36针对在时间上先于待处理的帧J一个帧的帧(J-1)来记录使用最终选择的系数索引的解码高频子带功率估计系数而获得的每个子带的伪高频子带功率。
伪高频子带功率差异计算电路36首先计算估计残差均方值ResPstdWpower(id,J)。也就是说,对于索引为sb+1至eb的在高频侧的每个子带,求出在伪高频子带功率powerest(ib,idselected(J-1),J-1)与伪高频子带功率powerest(ib,id,J)之间的差异,并将该差异乘以权重Wpower(power(ib,J))。乘以权重Wpower(power(ib,J))的差异的平方和是估计残差均方值ResPstdWpower(id,J)。
接着,伪高频子带功率差异计算电路36计算估计残差最大值ResPmaxWpower(id,J)。具体地,乘以权重Wpower(power(ib,J))的在伪高频子带功率powerest(ib,id,J)与索引为sb+1至eb的每个子带的伪高频子带功率powerest(ib,idselected(J-1),J-1)之间的差异的最大值的绝对值是估计残差最大值ResPmaxWpower(id,J)。
接下来,伪高频子带功率差异计算电路36计算估计残差平均值ResPaveWpower(id,J)。具体地,求出在伪高频子带功率powerest(ib,id,J)与索引为sb+1至eb的每个子带的伪高频子带功率powerest(ib,idselected(J-1),J-1)之间的差异,并将该差异乘以权重Wpower(power(ib,J))。通过将乘以权重Wpower(power(ib,J))的差异的总和除以在高频侧的子带的数量(eb-sb)而获得的值的绝对值是估计残差平均值ResPaveWpower(id,J)。
另外,伪高频子带功率差异计算电路36求出估计残差均方值ResPstdWpower(id,J)、已乘以权重Wmax的估计残差最大值ResPmaxWpower(id,J)、以及已乘以权重Wave的估计残差平均值ResPaveWpower(id,J)的总和,并将该总和作为评价值ResWpower(id,J)。
在步骤S408中,伪高频子带功率差异计算电路36将评价值ResWpower(id,J)与已乘以表达式(25)中的权重Wp(J)的评价值ResPWpower(id,J)进行相加,并计算最终评价值ResallWpower(id,J)。评价值ResallWpower(id,J)此处是针对K个解码高频子带功率估计系数的每一个而计算的。
随后,执行在步骤S409至步骤S411中的处理,并结束编码处理,但是此处的处理类似于在图25中的步骤S339至步骤S341中的处理,因此将省略对它们的详细描述。注意,在步骤S409中,选择K个系数索引中具有最小评价值ResallWpower(id,J)的系数索引。
从而,使得权重可以进一步安置到具有较大的功率的子带上,每个子带被加权,由此可以在解码设备40侧获得具有较音质的音频。
注意,关于以上描述,基于评价值ResallWpower(id,J)来执行对解码高频子带功率估计系数的选择,但是也可以基于评价值ResWpower(id,J)来选择解码高频子带功率估计系数。
<6.第六实施例>
[系数学习设备的配置]
现在,将用作解码高频子带功率估计系数的一组系数Aib(kb)和系数Bib与系数索引相关联并记录到图20中的解码设备40中。例如,当128个系数索引的解码高频子带功率估计系数已记录到解码设备40处时,需大的区域来作为记录这些解码高频子带功率估计系数等的存储器的记录区域。
从而,可以使若干解码高频子带功率估计系数的一部分成为共享系数,从而记录解码高频子带功率估计系数所需的记录区域可以变得较小。在这样的情况下,通过学习求出解码高频子带功率估计系数的系数学习设备被配置为例如如图28中所示。
系数学习设备81包括子带划分电路91、高频子带功率计算电路92、特征量计算电路93和系数估计电路94。
用于学习的多段音调数据等被提供给系数学习设备81,以作为宽带教学信号。宽带教学信号是包括多个高频子带分量和多个低频子带分量的信号。
子带划分电路91由带通滤波器等组成,将提供的宽带教学信号划分成多个子带信号,并将这些提供给高频子带功率计算电路92和特征量计算电路93。具体地,将索引为sb+1至eb的在高频侧的每个子带的高频子带信号提供给高频子带功率计算电路92,并且将索引为sb-3至sb的在低频侧的每个子带的低频子带信号提供给特征量计算电路93。
高频子带功率计算电路92计算从子带划分电路91提供的各个高频子带信号的高频子带功率,并将所述高频子带功率提供给系数估计电路94。特征量计算电路93基于从子带划分电路91提供的各个低频子带信号来计算低频子带功率以作为特征量,并将其提供给系数估计电路94。
系数估计电路94通过使用来自高频子带功率计算电路92的高频子带功率和来自特征量计算电路93的特征量来执行回归分析以生成解码高频子带功率估计系数,并将其输出给解码设备40。
[系数学习处理的描述]
接下来,将参照图29中的流程图来描述通过系数学习设备81执行的系数学习处理。
在步骤S431中,子带划分电路91将提供的多个宽带教学信号中的每一个划分成多个子带信号。子带划分电路91将索引为sb+1至eb的子带的高频子带信号提供给高频子带功率计算电路92,并将索引为sb-3至sb的子带的低频子带信号提供给特征量计算电路93。
在步骤S432中,高频子带功率计算电路92执行类似于上述表达式(1)中的计算,并计算从子带划分电路91提供的各个高频子带信号的高频子带功率,并将其提供给系数估计电路94。
在步骤S433中,特征量计算电路93执行类似于上述表达式(1)中的计算,并针对从子带划分电路91提供的各个低频子带信号来计算低频子带功率以作为特征量,并将其提供给系数估计电路94。
从而,针对所述多个宽带教学信号的各个帧将高频子带功率和低频子带功率提供给系数估计电路94。
在步骤S434中,系数估计电路94使用最小二乘法来执行回归分析,并计算索引为sb+1至eb的每个高频侧子带ib(其中sb+1≤ib≤eb)的系数Aib(kb)和系数Bib。
注意,关于回归分析,从特征量计算电路93提供的低频子带功率是解释变量,而从高频子带功率计算电路92提供的高频子带功率是被解释变量。另外,使用组成了提供给系数学习设备81的宽带教学信号的全部的所有帧的低频子带功率和高频子带功率来执行回归分析。
在步骤S435中,系数估计电路94使用针对每个子带ib求出的系数Aib(kb)和系数Bib来求出宽带教学信号的每个帧的残差向量。
例如,系数估计电路94从帧J的每个子带ib(其中sb+1≤ib≤eb)的高频子带功率power(ib,J)中减去已乘以系数Aib(kb)(其中sb-3≤kb≤sb)的低频子带功率power(kb,J)的总和与系数Bib之和,从而获得残差。由帧J的每个子带ib的残差组成的向量是残差向量。
注意,残差向量是针对组成提供给系数学习设备81的所有宽带教学信号的全部的所有帧来计算的。
在步骤S436中,系数估计电路94使各个帧的求出的残差向量归一化。例如,系数估计电路94通过求出所有帧的残差向量的子带ib的残差的离差值、并将各个残差向量的子带ib的残差除以每个子带的离差值的平方根来归一化残差向量。
在步骤S437中,系数估计电路94对归一化的所有帧的残差向量进行K-平均等的聚类。
例如,在使用系数Aib(kb)和系数Bib执行高频子带功率的估计时获得的所有帧的平均频率包络被称为平均频率包络SA。另外,将假定具有大于平均频率包络SA的功率的功率的预定频率包络是频率包络SH,并且具有低于平均频率包络SA的功率的功率的预定频率包络是频率包络SL。
此时,执行残差向量聚类,使得获得接近平均频率包络SA、频率包络SH、频率包络SL的频率包络的系数的残差向量中的每一个分别属于簇CA、簇CH和簇CL。换句话说,执行聚类,使得每个帧的残差向量属于簇CA、簇CH或簇CL中的一个。
关于基于低频分量和高频分量之间的相关性来估计高频分量的频带扩展处理,当使用回归分析获得的系数Aib(kb)和系数Bib来计算残差向量时,根据其特性,子带越远离高频侧,残差就越大。因此,如果残差向量被聚类,但不进行变化,较大的权重将安置在远离高频侧的子带上,并且执行处理。
相反地,关于系数学习设备81,通过使用每个子带的残差值的离差值来归一化残差向量,明显地每个子带的残差的离差是均等的,并且通过对各个子带均等地加权来执行聚类。
在步骤S438中,系数估计电路94选择簇CA、簇CH或簇CL中的一个簇来作为待处理的簇。
在步骤S439中,系数估计电路94使用属于被选择为待处理的簇的簇的残差向量的帧通过回归分析来计算各个子带ib(其中sb+1≤ib≤eb)的系数Aib(kb)和系数Bib。
也就是说,如果假定属于待处理的簇的残差向量的帧被称为待处理的帧,则待处理的所有帧的低频子带功率和高频子带功率是解释变量和被解释变量,并使用最小二乘法来执行回归分析。从而,针对每个子带ib来获得系数Aib(kb)和系数Bib。
在步骤S440中,系数估计电路94使用在步骤S439中的针对所有待处理的帧的处理而获得的系数Aib(kb)和系数Bib,并求出残差向量。注意,在步骤S440中,执行类似于步骤S435中的处理,并且求出待处理的各个帧的残差向量。
在步骤S441中,系数估计电路94通过执行类似于在步骤S436中的处理来对在步骤S440中的处理中获得的待处理的各个帧的残差向量进行归一化。也就是说,将残差除以离差值的平方根,并且针对每个子带来执行残差向量的归一化。
在步骤S442中,系数估计电路94通过K-平均等对已被归一化的所有待处理帧的残差向量进行聚类。簇的数量此处被定义如下。例如,在系数学习设备81处,在生成128个系数索引解码高频子带功率估计系数的情况下,待处理帧的数量被乘以128,并且通过将获得的数除以所有帧的数量所获得的数量是簇的数量。现在,所有帧的数量是提供给系数学习设备81的全部宽带教学信号的全部帧的总数量。
在步骤S443中,系数估计电路94求出使用步骤S442中的处理获得的各个簇的重心向量。
例如,通过在步骤S442中的聚类获得的簇对应于系数索引,并且在系数学习设备81处,系数索引被指派给每个簇,并且求出每个系数索引的解码高频子带功率估计系数。
具体地,假定在步骤S438中,簇CA被选择为待处理簇,并且在步骤S442中,通过在步骤S442中的聚类来获得的F个簇。现在,如果关注于F个簇中的一个簇CF,则簇CF的系数索引的解码高频子带功率估计系数被设置为作为针对在步骤S439中的簇CA求出的系数Aib(ib)的线性相关项的系数Aib(kb)。另外,执行对于在步骤S443中求出的簇CF的重心向量在步骤441中执行的归一化的反处理(反归一化)的向量和在步骤S439中求出的系数Bib的和是作为解码高频子带功率估计系数的常量项的系数Bib。此处,所述反归一化是:例如在步骤S411中执行的归一化将残差除以每个子带的离差值的平方根的情况下,乘以与在归一化簇CF的重心向量的元素的时候相同的值(每个子带的离差值的平方根)的处理。
也就是说,在步骤S439中获得的系数Aib(kb)和如上所述求出的系数Bib的集合变成簇CF的系数索引的解码高频子带功率的估计系数。因此,通过聚类获得的F个簇的每一个具有针对簇CA求出的共享系数Aib(kb),以作为解码高频子带功率估计系数的线性相关项。
在步骤S444中,系数学习设备81确定是否簇CA、簇CH和簇CL全部已作为待处理的簇被处理。在步骤S444中,在已确定仍非所有的簇都已被处理的情况下,处理返回步骤S438,并且重复上述处理。也就是说,下一个簇被选择为待处理的簇,并计算解码高频子带功率估计系数。
相反地,在步骤S444中,在已确定所有的簇都已被处理的情况下,获得预定数量的待求解码高频子带功率估计系数,由此处理前进到步骤S445。
在步骤S445中,系数估计电路94将求出的系数索引和解码高频子带功率估计系数输出到解码设备40并使得它被记录,并且结束系数学习处理。
例如,在输出到解码设备40的解码高频子带功率估计系数中,若干解码高频子带功率估计系数具有相同的系数Aib(kb),以作为线性相关项。从而,关于它们共享的系数Aib(kb),系数学习设备81对应作为识别系数Aib(kb)的信息的线性相关项索引(指针),而关于系数索引,对应线性相关项索引和作为常量项的系数Bib。
系数学习设备81将相应的线性相关项索引(指针)和系数Aib(kb)以及相应的系数索引和线性相关项索引(指针)和系数Bib提供给解码设备40,并将这记录到解码设备40的高频解码电路45内的存储器中。从而,在记录多个解码高频子带功率估计系数中,关于共享的线性相关项,如果线性相关项索引(指针)被存储在用于各种解码高频子带功率估计系数的记录区域中,则记录区域可以保持相当地小。
在这种情况下,线性相关项索引和系数Aib(kb)被进行相关并记录在高频解码电路45内的存储器中,由此可以根据系数索引获得线性相关项索引和系数Bib,并且进一步可以根据线性相关项索引获得系数Aib(kb)。
注意,作为本申请人的分析结果,可以看出,即使共享了多个解码高频子带功率估计系数的线性相关项的三种模式等,从倾听经过频带扩展处理的音频的角度讲,存在非常微小的音质劣化。因此,根据系数学习设备81,在频带扩展处理之后的声音的音质没有劣化,并且用于记录解码高频子带功率估计系数所需要的记录区域可以较小。
如上所示,系数学习设备81生成并输出来自提供的宽带教学信号的每个系数索引的解码高频子带功率估计系数。
注意,在图29的系数学习处理被描述为归一化残差向量,但是在步骤S436或步骤S441中的一个或两者中,不必执行对残差向量的归一化。
另外,可以进行如下布置:执行残差向量的归一化,但不执行解码高频子带功率估计系数的线性相关项的共享。在这样的情况中,在步骤S436的归一化处理之后,归一化的残差向量被聚类成与待求出的解码高频子带功率估计系数的数量相同数量的簇。使用属于各个簇的残差向量的帧,针对每一个簇执行回归分析,并且针对各个簇生成解码高频子带功率估计系数。
上述的一系列处理可以使用硬件执行或可以使用软件执行。在使用软件来执行该一系列处理的情况下,组成所述软件的程序被从程序记录介质安装到具有专用内置硬件的计算机或通用个人计算机等中,例如,可以通过安装的各种类型的程序来执行各种功能的通用个人计算机。
图30是示出了使用程序来执行上述一系列处理的计算机的硬件的配置示例的框图。
在计算机中,通过总线104相互连接有CPU101、ROM(只读存储器)102以及RAM(随机存取存储器)103。
总线104还连接有输入/输出接口105。输入/输出接口105连接有:包括键盘、鼠标、麦克风等的输入单元106;包括显示器、扬声器等的输出单元107;包括硬盘或非易失性存储器等的存储单元108;包括网络接口等的通信单元109;以及用于驱动可移除介质111(例如磁盘、光盘、磁-光盘或半导体存储器等)的驱动器110。
关于如上配置的计算机,例如,CPU101通过输入/输出接口105和总线104将存储在存储器单元108中的程序加载到RAM103中,并且执行该程序,由此执行上述一系列处理。
计算机(CPU101)执行的程序记录在可移除介质111中,所述可移除介质111是如下封装介质,包括:例如磁盘(包括软盘)、光盘((CD-ROM(压缩盘-只读存储器)、DVD(数字多功能盘)等)、磁-光盘或半导体存储器等,或者通过例如线缆或无线通信介质(诸如局域网、互联网或数字卫星广播)来提供。
通过将可移除介质111安装在驱动器110上,程序通过输入/输出接口105安装到存储单元108中。另外,可以通过线缆或无线传输介质使用通信单元109来接收程序并将其安装在存储器108中。此外,程序可以预先安装在ROM102或存储单元108中。
注意,计算机执行的程序可以是以在本说明书中描述的顺序的时间序列方式执行处理的程序,或者可以是其中处理以并行方式执行的程序,或者以需要的时序例如被调用时等来执行的程序。
注意,本发明的实施例不局限于上述实施例,并且可以在本发明的本质的范围内进行各种修改。
附图标记列表
10 频带扩展设备
11 低通滤波器
12 延迟电路
13 13-1至13-N 带通滤波器
14 特征量计算电路
15 高频子带功率估计电路
16 高频信号生成电路
17 高通滤波器
18 信号相加单元
20 系数学习设备
21 21-1至21-(K+N)带通滤波器
22 高频子带功率计算电路
23 特征量计算电路
24 系数估计电路
30 编码设备
31 低通滤波器
32 低频编码电路
33 子带划分电路
34 特征量计算电路
35 伪高频子带功率计算电路
36 伪高频子带功率差异计算电路
37 高频编码电路
38 多路复用电路
40 解码设备
41 多路解复用电路
42 低频解码电路
43 子带划分电路
44 特征量计算电路
45 高频解码电路
46 解码高频子带功率计算电路
47 解码高频信号生成电路
48 合成电路
50 系数学习设备
51 低通滤波器
52 子带划分电路
53 特征量计算电路
54 伪高频子带功率计算电路
55 伪高频子带功率差异计算电路
56 伪高频子带功率差异聚类电路
57 系数估计电路
101 CPU
102 ROM
103 RAM
104 总线
105 输入/输出接口
106 输入单元
107 输出单元
108 存储单元
109 通信单元
110 驱动器
111 可移除介质
附记:
1.一种频带扩展设备,包括:
信号划分装置,所述信号划分装置被配置成将输入信号划分成多个子带信号;
特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述信号划分装置所划分的所述多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;
高频子带功率估计装置,所述高频子带功率估计装置被配置成基于由所述特征量计算装置所计算的所述特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及
高频信号分量生成装置,所述高频信号分量生成装置被配置成基于由所述信号划分装置所划分的所述多个子带信号以及由所述高频子带功率估计装置所计算的所述高频子带功率的所述估计值来生成高频信号分量;
其中,使用由所述高频信号分量生成装置所生成的所述高频信号分量来扩展所述输入信号的频带。
2.根据附记1所述的频带扩展设备,其中,所述特征量计算装置计算作为所述多个子带信号的功率的低频子带功率,以作为所述特征量。
3.根据附记1所述的频带扩展设备,其中,所述特征量计算装置计算作为所述多个子带信号的功率的低频子带功率的时间变化,以作为所述特征量。
4.根据附记1所述的频带扩展设备,其中,所述特征量计算装置计算所述输入信号的预定频带中的最大功率与最小功率之间的差异,以作为所述特征量。
5.根据附记1所述的频带扩展设备,其中,所述特征量计算装置计算所述输入信号的预定频带中的功率的最大值与最小值之间的差异的时间变化,以作为所述特征量。
6.根据附记1所述的频带扩展设备,其中,所述特征量计算装置计算所述输入信号的预定频带中的功率的斜率,以作为所述特征量。
7.根据附记1所述的频带扩展设备,其中,所述特征量计算装置计算所述输入信号的预定频带中的功率的斜率的时间变化,以作为所述特征量。
8.根据附记1所述的频带扩展设备,其中,所述高频子带功率估计装置基于所述特征量和通过学习预先获得的每个高频子带的系数来计算所述高频子带功率的估计值。
9.根据附记8所述的频带扩展设备,其中,通过对利用通过使用多个教学信号的回归分析所获得的每个高频子带的系数计算的所述高频信号分量的残差向量执行聚类以及针对通过所述聚类所获得的每个簇使用属于所述簇的所述教学信号执行回归分析来生成所述每个高频子带的系数。
10.根据附记9所述的频带扩展设备,其中,使用多个所述残差向量的每个分量的离差值来归一化所述残差向量,并且对归一化后的所述向量进行聚类。
11.根据附记9所述的频带扩展设备,其中,所述高频子带功率估计装置基于所述特征量、用于每个所述高频子带的系数和常量来计算所述高频子带功率的估计值;
其中所述常量是根据通过使用利用属于所述簇的所述教学信号进行的回归分析所获得的每个高频子带的系数进一步计算所述残差向量并执行将所述残差向量聚类为多个新簇所获得的所述新簇的重心向量来计算的。
12.根据附记11所述的频带扩展设备,其中,所述高频子带功率估计装置以相关联的方式记录用于每个所述高频子带的系数和用于确定所述每个高频子带的系数的指针,并且还记录多组所述指针和所述常量,所述多组中的一些组包括具有相同值的指针。
13.根据附记1所述的频带扩展设备,其中,所述高频信号生成装置根据作为所述多个子带信号的功率的低频子带功率和所述高频子带功率的估计值来生成所述高频信号分量。
14.一种频带扩展方法,包括:
信号划分步骤,所述信号划分步骤被设置成将输入信号划分成多个子带信号;
特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述信号划分步骤中的处理所划分的所述多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;
高频子带功率估计步骤,所述高频子带功率估计步骤被设置成基于由在所述特征量计算步骤中的处理所计算的所述特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及
高频信号分量生成步骤,所述高频信号分量生成步骤被设置成基于由所述信号划分步骤中的处理所划分的所述多个子带信号和由所述高频子带功率估计步骤中的处理所计算的所述高频子带功率的所述估计值来生成高频信号分量;
其中,使用由所述高频信号分量生成步骤中的处理所生成的所述高频信号分量来扩展所述输入信号的频带。
15.一种程序,包括:
信号划分步骤,所述信号划分步骤被设置成将输入信号划分成多个子带信号;
特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述信号划分步骤中的处理所划分的所述多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;
高频子带功率估计步骤,所述高频子带功率估计步骤被设置成基于由在所述特征量计算步骤中的处理所计算的特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及
高频信号分量生成步骤,所述高频信号分量生成步骤被设置成基于由在所述信号划分步骤中的处理所划分的所述多个子带信号和由在所述高频子带功率估计步骤中的处理所计算的所述高频子带功率的估计值来生成高频信号分量;
使得计算机执行用于使用由在所述高频信号分量生成步骤中的处理所生成的所述高频信号分量来扩展所述输入信号的频带的处理。
16.一种编码设备,包括:
子带划分装置,所述子带划分装置被配置成将输入信号划分成多个子带,并生成由在低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号;
特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述子带划分装置生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;
伪高频子带功率计算装置,所述伪高频子带功率计算装置被配置成基于由所述特征量计算装置所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;
伪高频子带功率差异计算装置,所述伪高频子带功率差异计算装置被配置成根据由所述子带划分装置所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由所述伪高频子带功率计算装置所计算的所述伪高频子带功率的差异;
高频编码装置,所述高频编码装置被配置成对由所述伪高频子带功率差异计算装置所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;
低频编码装置,所述低频编码装置被配置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及
多路复用装置,所述多路复用装置被配置成对由所述低频编码装置生成的所述低频编码数据和由所述高频编码装置生成的所述高频编码数据进行多路复用,以获得输出代码串。
17.根据附记16所述的编码设备,还包括:
低频解码装置,所述低频解码装置被配置成对由所述低频编码装置生成的所述低频编码数据进行解码,以生成低频信号;
其中,所述子带划分装置根据由所述低频解码装置生成的所述低频信号来生成所述低频子带信号。
18.根据附记16所述的编码设备,其中,所述高频编码装置计算在所述伪高频子带功率差异与在预定的多个伪高频子带功率差异空间中的代表向量或代表值之间的相似度,以生成与其相似度是最大值的代表向量或代表值对应的索引,以作为所述高频编码数据。
19.根据附记16所述的编码设备,其中,所述伪高频子带功率差异计算装置基于每个子带的所述伪高频子带功率和所述高频子带功率来针对用于计算所述伪高频子带功率的多个系数中的每一个计算评价值;
并且其中,所述高频编码装置生成指示作为最高评价值的所述评价值的系数的索引,以作为所述高频编码数据。
20.根据附记19所述的编码设备,其中,所述伪高频子带功率差异计算装置基于每个子带的所述伪高频子带功率差异的平方和、所述子带的所述伪高频子带功率的绝对值的最大值或每个子带的所述伪高频子带功率差异的平均值中的至少任何一个来计算所述评价值。
21.根据附记20所述的编码设备,其中,所述伪高频子带功率差异计算装置基于不同帧的所述伪高频子带功率差异来计算所述评价值。
22.根据附记20所述的编码设备,其中,所述伪高频子带功率差异计算装置使用乘以权重的所述伪高频子带功率差异来计算所述评价值,所述权重是针对每个子带的权重,使得所述子带越处于低频侧,所述子带的权重就越大。
23.根据附记20所述的编码设备,其中,所述伪高频子带功率差异计算装置使用乘以权重的所述伪高频子带功率差异来计算所述评价值,所述权重是针对每个子带的权重,使得子带的所述高频子带功率越大,所述子带的权重就越大。
24.一种编码方法,包括:
子带划分步骤,所述子带划分步骤被设置成将输入信号划分成多个子带,并生成由低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号;
特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和在所述子带划分步骤中的处理所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;
伪高频子带功率计算步骤,所述伪高频子带功率计算步骤被设置成基于在所述特征量计算步骤中的处理所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;
伪高频子带功率差异计算步骤,所述伪高频子带功率差异计算步骤被设置成根据由在所述子带划分步骤中的处理所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由在所述伪高频子带功率计算步骤中的处理所计算的所述伪高频子带功率的差异;
高频编码步骤,所述高频编码步骤被设置成对在所述伪高频子带功率差异计算步骤中的处理所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;
低频编码步骤,所述低频编码步骤被设置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及
多路复用步骤,所述多路复用步骤被设置成对在所述低频编码步骤中的处理所生成的所述低频编码数据和在所述高频编码步骤中的处理所生成的所述高频编码数据进行多路复用,以获得输出代码串。
25.一种使得计算机执行如下处理的程序,所述处理包括:
子带划分步骤,所述子带划分步骤被设置成将输入信号划分成多个子带,并生成由低频侧的多个子带组成的低频子带信号和由高频侧的多个子带组成的高频子带信号;
特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述子带划分步骤中的处理所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;
伪高频子带功率计算步骤,所述伪高频子带功率计算步骤被设置成基于由在所述特征量计算步骤中的处理所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;
伪高频子带功率差异计算步骤,所述伪高频子带功率差异计算步骤被设置成根据在所述子带划分步骤中的处理所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由在所述伪高频子带功率计算步骤中的处理所计算的所述伪高频子带功率的差异;
高频编码步骤,所述高频编码步骤被设置成对在所述伪高频子带功率差异计算步骤中的处理所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;
低频编码步骤,所述低频编码步骤被设置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及
多路复用步骤,所述多路复用步骤被设置成对在所述低频编码步骤中的处理所生成的所述低频编码数据和在所述高频编码步骤中的处理所生成的所述高频编码数据进行多路复用,以获得输出代码串。
26.一种解码设备,包括:
多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成至少低频编码数据和索引;
低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;
子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成所述低频子带的每一个的低频子带信号;以及
生成装置,所述生成装置被配置成基于所述索引和所述低频子带信号来生成所述高频信号。
27.根据附记26所述的解码设备,其中,所述索引在对输入信号进行编码并输出所述编码数据的设备处基于在编码之前的所述输入信号和根据所述输入信号估计的所述高频信号来获得。
28.根据附记26所述的解码设备,其中,所述索引未被编码。
29.根据附记26所述的解码设备,其中,所述索引是指示用于生成所述高频信号的估计系数的信息。
30.根据附记29所述的解码设备,其中,所述生成装置基于多个所述估计系数中的由所述索引所指示的所述估计系数来生成所述高频信号。
31.根据附记29所述的解码设备,其中,所述生成装置包括:
特征量计算装置,所述特征量计算装置被配置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;
高频子带功率计算装置,所述高频子带功率计算装置被配置成通过使用所述特征量和所述估计系数的计算来关于组成所述高频信号的频段的多个高频子带的每一个高频子带,计算所述高频子带的高频子带信号的高频子带功率;以及
高频信号生成装置,所述高频信号生成装置被配置成基于所述高频子带功率和所述低频子带信号来生成所述高频信号。
32.根据附记31所述的解码设备,其中,所述高频子带功率计算装置通过使用为每个所述高频子带准备的所述估计系数来线性组合多个所述特征量以计算所述高频子带的所述高频子带功率。
33.根据附记32所述的解码设备,其中,所述特征量计算装置计算每个所述低频子带的所述低频子带信号的低频子带功率,以作为所述特征量。
34.根据附记31所述的解码设备,其中,所述索引是指示多个所述估计系数中如下的估计系数的信息,作为根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数生成的所述高频子带功率之间的比较的结果,获得最接近根据在编码之前的所述输入信号的所述高频信号所获得的所述高频子带功率的所述高频子带功率。
35.根据附记34所述的解码设备,其中,所述索引是指示如下的估计系数的信息,对于每个所述高频子带获得的在根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数而生成的所述高频子带功率之间的差异的平方和变为最小。
36.根据附记34所述的解码设备,其中,所述编码数据还包括表示在根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数而生成的所述高频子带功率之间的差异的差异信息。
37.根据附记36所述的解码设备,其中,所述差异信息已被编码。
38.根据附记36所述的解码设备,其中,所述高频子带功率计算装置将包括在所述编码数据中的以所述差异信息表示的所述差异加到由使用所述特征量和所述估计系数的计算而获得的所述高频子带功率上;
并且其中,所述高频信号生成装置基于所述低频子带信号和已加上所述差异的所述高频子带功率来生成所述高频信号。
39.根据附记31所述的解码设备,其中,所述估计系数通过使用最小二乘法的回归分析来获得,其中,所述特征量作为解释变量,而所述高频子带功率作为被解释变量。
40.根据附记31所述的解码设备,还包括系数输出装置,其中所述索引是指示由每个所述高频子带的所述差异所组成的差异向量的信息,其中所述差异向量以在根据编码前的所述输入信号的所述高频信号所获得的所述高频子带功率与基于所述估计系数所生成的所述高频子带功率之间的差异来作为元素,
所述系数输出装置被配置成获得在所述差异的特征空间中的代表向量或代表值与由所述索引所指示的所述差异向量之间的距离,所述代表向量或代表值以预先针对每个所述估计系数所获得的所述高频子带的所述差异作为元素,并将多个所述估计系数中的所述距离最短的所述代表向量或所述代表值的所述估计系数提供给所述高频子带功率计算装置。
41.根据附记29所述的解码设备,其中,所述索引是指示多个所述估计系数中的如下估计系数的信息,作为编码前的所述输入信号的所述高频信号与基于所述估计系数而生成的所述高频信号之间的比较的结果,获得最接近编码前的所述输入信号的所述高频信号的所述高频信号。
42.根据附记29所述的解码设备,其中,所述估计系数通过回归分析来获得。
43.根据附记26所述的解码设备,其中,所述生成装置基于对编码的所述索引进行解码所获得的信息来生成所述高频信号。
44.根据附记43所述的解码设备,其中,所述索引已经进行熵编码。
45.一种解码方法,包括:
多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成至少低频编码数据和索引;
低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;
子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;以及
生成步骤,所述生成步骤被设置成基于所述索引和所述低频子带信号来生成所述高频信号。
46.一种使得计算机执行如下处理的程序,所述处理包括:
多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成至少低频编码数据和索引;
低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;
子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;以及
生成步骤,所述生成步骤被设置成基于所述索引和所述低频子带信号来生成所述高频信号。
47.一种解码设备,包括:
多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;
低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;
子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;
特征量计算装置,所述特征量计算装置被配置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;
高频子带功率计算装置,所述高频子带功率计算装置被配置成通过将所述特征量乘以估计系数并获得已乘以所述估计系数的所述特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带的预先准备的多个所述估计系数的所述索引来确定;以及
高频信号生成装置,所述高频信号生成装置被配置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
48.根据附记47所述的解码设备,其中,所述特征量计算装置计算每个所述低频子带的所述低频子带信号的低频子带功率,以作为所述特征量。
49.根据附记48所述的解码设备,其中,所述索引是用于获得所述多个估计系数中的如下估计系数的信息,针对每个所述高频子带获得的差异的平方和变为最小,所述差异是在根据所述高频信号的真实值获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异。
50.根据附记49所述的解码设备,其中,所述索引还包括差异信息,所述差异信息表示在根据所述真实值获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异;
并且其中,所述高频子带功率计算装置还将包括在所述索引中的所述差异信息所表示的所述差异加到通过获得已乘以所述估计系数的所述特征量的总和从而获得的所述高频子带功率上;
并且其中,所述高频信号生成装置使用所述低频子带信号和已经通过所述高频子带功率计算装置加上所述差异的所述高频子带功率来生成所述高频信号。
51.根据附记47所述的解码设备,其中,所述索引是指示所述估计系数的信息。
52.根据附记47所述的解码设备,其中,所述索引是通过对指示所述估计系数的信息进行熵编码所获得的信息;
并且其中所述高频子带功率计算装置使用由通过解码所述索引所获得的信息所指示的估计系数来计算所述高频子带功率。
53.根据附记47所述的解码设备,其中,所述多个估计系数预先通过使用最小二乘法的回归分析来获得,其中,所述特征量作为解释变量,而所述高频子带功率作为被解释变量。
54.根据附记47所述的解码设备,还包括系数输出装置,其中,所述索引是指示由每个所述高频子带的所述差异所组成的所述差异向量的信息,所述差异向量以根据所述高频信号的真实值所获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异作为元素,
所述系数输出装置被配置成获得在所述差异的特征空间中的代表向量或代表值与由所述索引所指示的差异向量之间的距离,所述代表向量或代表值以预先针对每个所述估计系数所获得的所述高频子带的所述差异作为元素,以及所述系数输出装置还被配置成将多个所述估计系数中的所述距离最短的所述代表向量或所述代表值的所述估计系数提供给所述高频子带功率计算装置。
55.一种解码方法,包括:
多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;
低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;
子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个低频子带的低频子带信号;
特征量计算步骤,所述特征量计算步骤被设置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;
高频子带功率计算步骤,所述高频子带功率计算步骤被设置成通过将所述特征量乘以估计系数并获得已乘以所述估计系数的所述特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带预先准备的多个所述估计系数的所述索引来确定;以及
高频信号生成步骤,所述高频信号生成步骤被设置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
56.一种使得计算机执行如下处理的程序,所述处理包括:
多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;
低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;
子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;
特征量计算步骤,所述特征量计算步骤被设置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;
高频子带功率计算步骤,所述高频子带功率计算步骤被设置成通过将所述特征量乘以估计系数并获得已乘以所述估计系数的特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带预先准备的多个所述估计系数的所述索引来确定;以及
高频信号生成步骤,所述高频信号生成步骤被设置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
Claims (8)
1.一种解码设备,包括:
多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成至少低频编码数据和索引;
低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;
子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成所述低频子带的每一个的低频子带信号;以及
生成装置,所述生成装置被配置成基于所述索引和所述低频子带信号来生成高频信号;
其中,所述索引是指示用于生成所述高频信号的估计系数的信息;
其中,所述生成装置包括:
特征量计算装置,所述特征量计算装置被配置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;
高频子带功率计算装置,所述高频子带功率计算装置被配置成通过使用所述特征量和所述估计系数的计算来关于组成所述高频信号的频段的多个高频子带的每一个高频子带,计算所述高频子带的高频子带信号的高频子带功率;以及
高频信号生成装置,所述高频信号生成装置被配置成基于所述高频子带功率和所述低频子带信号来生成所述高频信号;
其中,所述高频子带功率计算装置通过使用为每个所述高频子带准备的所述估计系数来线性组合多个所述特征量以计算所述高频子带的所述高频子带功率。
2.根据权利要求1所述的解码设备,其中,所述生成装置基于多个所述估计系数中的由所述索引所指示的所述估计系数来生成所述高频信号。
3.根据权利要求1所述的解码设备,其中,所述特征量计算装置计算每个所述低频子带的所述低频子带信号的低频子带功率,以作为所述特征量。
4.根据权利要求1所述的解码设备,其中,所述生成装置基于对编码的所述索引进行解码所获得的信息来生成所述高频信号。
5.一种解码方法,包括:
多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成至少低频编码数据和索引;
低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;
子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;以及
生成步骤,所述生成步骤被设置成基于所述索引和所述低频子带信号来生成高频信号;
其中,所述索引是指示用于生成所述高频信号的估计系数的信息;
其中,所述生成步骤包括:
使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;
通过使用所述特征量和所述估计系数的计算来关于组成所述高频信号的频段的多个高频子带的每一个高频子带,计算所述高频子带的高频子带信号的高频子带功率;以及
基于所述高频子带功率和所述低频子带信号来生成所述高频信号;
其中,通过使用为每个所述高频子带准备的所述估计系数来线性组合多个所述特征量以计算所述高频子带的所述高频子带功率。
6.一种解码设备,包括:
多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;
低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;
子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;
特征量计算装置,所述特征量计算装置被配置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;
高频子带功率计算装置,所述高频子带功率计算装置被配置成通过使用关于组成所述高频信号的频段的多个高频子带的每一个高频子带的预先准备的多个所述估计系数中的由所述索引确定的估计系数来线性组合多个所述特征量来关于组成所述高频信号的频段的多个高频子带的每一个高频子带,计算所述高频子带的高频子带信号的高频子带功率;以及
高频信号生成装置,所述高频信号生成装置被配置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号;
其中,所述索引是指示用于生成所述高频信号的估计系数的信息。
7.根据权利要求6所述的解码设备,其中,所述特征量计算装置计算每个所述低频子带的所述低频子带信号的低频子带功率,以作为所述特征量。
8.一种解码方法,包括:
多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;
低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;
子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个低频子带的低频子带信号;
特征量计算步骤,所述特征量计算步骤被设置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;
高频子带功率计算步骤,所述高频子带功率计算步骤被设置成通过使用关于组成所述高频信号的频段的多个高频子带的每一个高频子带的预先准备的多个所述估计系数中的由所述索引确定的估计系数来线性组合多个所述特征量来关于组成所述高频信号的频段的多个高频子带的每一个高频子带,计算所述高频子带的高频子带信号的高频子带功率;以及
高频信号生成步骤,所述高频信号生成步骤被设置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号;
其中,所述索引是指示用于生成所述高频信号的估计系数的信息。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009233814 | 2009-10-07 | ||
JP2009-233814 | 2009-10-07 | ||
JP2010-092689 | 2010-04-13 | ||
JP2010092689 | 2010-04-13 | ||
JP2010-162259 | 2010-07-16 | ||
JP2010162259A JP5754899B2 (ja) | 2009-10-07 | 2010-07-16 | 復号装置および方法、並びにプログラム |
CN201080045206.6A CN102576544B (zh) | 2009-10-07 | 2010-09-29 | 频带扩展设备和方法、编码设备和方法、解码设备和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080045206.6A Division CN102576544B (zh) | 2009-10-07 | 2010-09-29 | 频带扩展设备和方法、编码设备和方法、解码设备和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103996401A CN103996401A (zh) | 2014-08-20 |
CN103996401B true CN103996401B (zh) | 2018-01-16 |
Family
ID=43856685
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080045206.6A Expired - Fee Related CN102576544B (zh) | 2009-10-07 | 2010-09-29 | 频带扩展设备和方法、编码设备和方法、解码设备和方法 |
CN201410208805.5A Expired - Fee Related CN103996401B (zh) | 2009-10-07 | 2010-09-29 | 解码设备和解码方法 |
CN201410208486.8A Active CN103996402B (zh) | 2009-10-07 | 2010-09-29 | 编码设备和编码方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080045206.6A Expired - Fee Related CN102576544B (zh) | 2009-10-07 | 2010-09-29 | 频带扩展设备和方法、编码设备和方法、解码设备和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410208486.8A Active CN103996402B (zh) | 2009-10-07 | 2010-09-29 | 编码设备和编码方法 |
Country Status (14)
Country | Link |
---|---|
US (2) | US9208795B2 (zh) |
EP (5) | EP3584794B1 (zh) |
JP (1) | JP5754899B2 (zh) |
KR (7) | KR101654402B1 (zh) |
CN (3) | CN102576544B (zh) |
AU (6) | AU2010304440A1 (zh) |
BR (1) | BR112012007389B1 (zh) |
CA (1) | CA2775387C (zh) |
CO (1) | CO6541531A2 (zh) |
HK (3) | HK1172139A1 (zh) |
MY (1) | MY161609A (zh) |
RU (1) | RU2549116C2 (zh) |
TW (1) | TWI480862B (zh) |
WO (1) | WO2011043227A1 (zh) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1279512C (zh) * | 2001-11-29 | 2006-10-11 | 编码技术股份公司 | 用于改善高频重建的方法和装置 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) * | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
EP2523357B1 (en) * | 2011-05-12 | 2013-09-18 | Siemens Aktiengesellschaft | Subsea data communication system and method |
JP5975243B2 (ja) * | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6037156B2 (ja) * | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) * | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN103035248B (zh) | 2011-10-08 | 2015-01-21 | 华为技术有限公司 | 音频信号编码方法和装置 |
RU2652468C2 (ru) | 2012-07-02 | 2018-04-26 | Сони Корпорейшн | Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа |
US10083700B2 (en) | 2012-07-02 | 2018-09-25 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
KR101632238B1 (ko) | 2013-04-05 | 2016-06-21 | 돌비 인터네셔널 에이비 | 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더 |
EP2984650B1 (en) * | 2013-04-10 | 2017-05-03 | Dolby Laboratories Licensing Corporation | Audio data dereverberation |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
JP2015050685A (ja) * | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
CN105745706B (zh) * | 2013-11-29 | 2019-09-24 | 索尼公司 | 用于扩展频带的装置、方法和程序 |
JP6593173B2 (ja) | 2013-12-27 | 2019-10-23 | ソニー株式会社 | 復号化装置および方法、並びにプログラム |
JP2016038435A (ja) * | 2014-08-06 | 2016-03-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
KR102438228B1 (ko) | 2015-10-07 | 2022-08-31 | 주식회사 에이치엘클레무브 | 차량용 레이더 장치와 이를 이용한 타겟의 각도 추정 방법 |
US10121487B2 (en) | 2016-11-18 | 2018-11-06 | Samsung Electronics Co., Ltd. | Signaling processor capable of generating and synthesizing high frequency recover signal |
EP3435376B1 (en) * | 2017-07-28 | 2020-01-22 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
US11289070B2 (en) | 2018-03-23 | 2022-03-29 | Rankin Labs, Llc | System and method for identifying a speaker's community of origin from a sound sample |
US11341985B2 (en) | 2018-07-10 | 2022-05-24 | Rankin Labs, Llc | System and method for indexing sound fragments containing speech |
JP7533440B2 (ja) | 2019-03-05 | 2024-08-14 | ソニーグループ株式会社 | 信号処理装置および方法、並びにプログラム |
WO2021183421A2 (en) | 2020-03-09 | 2021-09-16 | John Rankin | Systems and methods for morpheme reflective engagement response |
CN111916090B (zh) * | 2020-08-17 | 2024-03-05 | 北京百瑞互联技术股份有限公司 | 一种lc3编码器近奈奎斯特频率信号检测方法、检测器、存储介质及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007052088A1 (en) * | 2005-11-04 | 2007-05-10 | Nokia Corporation | Audio compression |
CN1992533A (zh) * | 2005-12-26 | 2007-07-04 | 索尼株式会社 | 信号编码设备和方法、信号译码设备和方法、程序及介质 |
Family Cites Families (176)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4628529A (en) | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
JPH03254223A (ja) * | 1990-03-02 | 1991-11-13 | Eastman Kodak Japan Kk | アナログデータ伝送方式 |
JP2655485B2 (ja) | 1994-06-24 | 1997-09-17 | 日本電気株式会社 | 音声セル符号化装置 |
JP3498375B2 (ja) | 1994-07-20 | 2004-02-16 | ソニー株式会社 | ディジタル・オーディオ信号記録装置 |
JP3189598B2 (ja) | 1994-10-28 | 2001-07-16 | 松下電器産業株式会社 | 信号合成方法および信号合成装置 |
JPH1020888A (ja) | 1996-07-02 | 1998-01-23 | Matsushita Electric Ind Co Ltd | 音声符号化・復号化装置 |
JP3328532B2 (ja) * | 1997-01-22 | 2002-09-24 | シャープ株式会社 | デジタルデータの符号化方法 |
US6073100A (en) | 1997-03-31 | 2000-06-06 | Goodridge, Jr.; Alan G | Method and apparatus for synthesizing signals using transform-domain match-output extension |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
WO1999003096A1 (fr) | 1997-07-11 | 1999-01-21 | Sony Corporation | Procede et dispositif de codage et decodage d'informations et support de distribution |
JP4132154B2 (ja) * | 1997-10-23 | 2008-08-13 | ソニー株式会社 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
US6445750B1 (en) * | 1998-04-22 | 2002-09-03 | Lucent Technologies Inc. | Technique for communicating digitally modulated signals over an amplitude-modulation frequency band |
US6424938B1 (en) * | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6829360B1 (en) | 1999-05-14 | 2004-12-07 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for expanding band of audio signal |
JP3454206B2 (ja) | 1999-11-10 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
DE60110796T2 (de) * | 2000-06-14 | 2006-02-23 | Kabushiki Kaisha Kenwood | Frequenzinterpolationseinrichtung und frequenzinterpolationsverfahren |
SE0004163D0 (sv) | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
US7430212B2 (en) * | 2001-02-13 | 2008-09-30 | Paradyne Corporation | System and method for improved data transmission speed by fixing the lower corner frequency at a frequency above voice band in a symmetric DSL transmission system |
JP2002268698A (ja) * | 2001-03-08 | 2002-09-20 | Nec Corp | 音声認識装置と標準パターン作成装置及び方法並びにプログラム |
SE0101175D0 (sv) | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
JP4231987B2 (ja) | 2001-06-15 | 2009-03-04 | 日本電気株式会社 | 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体 |
MXPA03002115A (es) | 2001-07-13 | 2003-08-26 | Matsushita Electric Ind Co Ltd | DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO. |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
ES2268112T3 (es) * | 2001-11-14 | 2007-03-16 | Matsushita Electric Industrial Co., Ltd. | Codificacion y descodificacion de audio. |
JP3926726B2 (ja) | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
EP1444688B1 (en) * | 2001-11-14 | 2006-08-16 | Matsushita Electric Industrial Co., Ltd. | Encoding device and decoding device |
CN1279512C (zh) | 2001-11-29 | 2006-10-11 | 编码技术股份公司 | 用于改善高频重建的方法和装置 |
WO2003065353A1 (en) | 2002-01-30 | 2003-08-07 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device and methods thereof |
JP2003255973A (ja) | 2002-02-28 | 2003-09-10 | Nec Corp | 音声帯域拡張システムおよび方法 |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
CA2453814C (en) | 2002-07-19 | 2010-03-09 | Nec Corporation | Audio decoding apparatus and decoding method and program |
BRPI0305710B1 (pt) * | 2002-08-01 | 2017-11-07 | Panasonic Corporation | "apparatus and method of decoding of audio" |
JP4728568B2 (ja) | 2002-09-04 | 2011-07-20 | マイクロソフト コーポレーション | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 |
JP3881943B2 (ja) | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
US7330812B2 (en) | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
EP2665294A2 (en) | 2003-03-04 | 2013-11-20 | Core Wireless Licensing S.a.r.l. | Support of a multichannel audio extension |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US20050004793A1 (en) | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
KR20050027179A (ko) | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
US7844451B2 (en) | 2003-09-16 | 2010-11-30 | Panasonic Corporation | Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums |
DE10345995B4 (de) * | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
EP2221808B1 (en) | 2003-10-23 | 2012-07-11 | Panasonic Corporation | Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof |
KR100587953B1 (ko) | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
EP1744139B1 (en) | 2004-05-14 | 2015-11-11 | Panasonic Intellectual Property Corporation of America | Decoding apparatus and method thereof |
WO2005112001A1 (ja) | 2004-05-19 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
ATE474310T1 (de) | 2004-05-28 | 2010-07-15 | Nokia Corp | Mehrkanalige audio-erweiterung |
KR100608062B1 (ko) | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
US7716046B2 (en) | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US20060106620A1 (en) | 2004-10-28 | 2006-05-18 | Thompson Jeffrey K | Audio spatial environment down-mixer |
SE0402651D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
BRPI0517780A2 (pt) | 2004-11-05 | 2011-04-19 | Matsushita Electric Ind Co Ltd | aparelho de decodificação escalável e aparelho de codificação escalável |
JP4977471B2 (ja) * | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | 符号化装置及び符号化方法 |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
WO2006075563A1 (ja) | 2005-01-11 | 2006-07-20 | Nec Corporation | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
KR100708121B1 (ko) * | 2005-01-22 | 2007-04-16 | 삼성전자주식회사 | 음성 신호의 대역 확장 방법 및 장치 |
SG161223A1 (en) * | 2005-04-01 | 2010-05-27 | Qualcomm Inc | Method and apparatus for vector quantizing of a spectral envelope representation |
KR100933548B1 (ko) | 2005-04-15 | 2009-12-23 | 돌비 스웨덴 에이비 | 비상관 신호의 시간적 엔벨로프 정형화 |
US20070005351A1 (en) | 2005-06-30 | 2007-01-04 | Sathyendra Harsha M | Method and system for bandwidth expansion for voice communications |
JP4899359B2 (ja) | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR100813259B1 (ko) | 2005-07-13 | 2008-03-13 | 삼성전자주식회사 | 입력신호의 계층적 부호화/복호화 장치 및 방법 |
WO2007026821A1 (ja) | 2005-09-02 | 2007-03-08 | Matsushita Electric Industrial Co., Ltd. | エネルギー整形装置及びエネルギー整形方法 |
EP1926083A4 (en) | 2005-09-30 | 2011-01-26 | Panasonic Corp | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
EP1953737B1 (en) | 2005-10-14 | 2012-10-03 | Panasonic Corporation | Transform coder and transform coding method |
JP4863713B2 (ja) | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7590523B2 (en) | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
US20090248407A1 (en) | 2006-03-31 | 2009-10-01 | Panasonic Corporation | Sound encoder, sound decoder, and their methods |
EP2323131A1 (en) | 2006-04-27 | 2011-05-18 | Panasonic Corporation | Audio encoding device, audio decoding device, and their method |
JP5190359B2 (ja) | 2006-05-10 | 2013-04-24 | パナソニック株式会社 | 符号化装置及び符号化方法 |
JP2007316254A (ja) | 2006-05-24 | 2007-12-06 | Sony Corp | オーディオ信号補間方法及びオーディオ信号補間装置 |
KR20070115637A (ko) | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
JP2007333785A (ja) | 2006-06-12 | 2007-12-27 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
WO2007148925A1 (en) | 2006-06-21 | 2007-12-27 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
WO2008032828A1 (fr) | 2006-09-15 | 2008-03-20 | Panasonic Corporation | Dispositif de codage audio et procédé de codage audio |
JP4918841B2 (ja) | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
US8295507B2 (en) | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
JP5141180B2 (ja) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
US8560328B2 (en) | 2006-12-15 | 2013-10-15 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
JP4984983B2 (ja) | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
JP2008261978A (ja) | 2007-04-11 | 2008-10-30 | Toshiba Microelectronics Corp | 再生音量自動調整方法 |
US8015368B2 (en) | 2007-04-20 | 2011-09-06 | Siport, Inc. | Processor extensions for accelerating spectral band replication |
KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
US8788264B2 (en) | 2007-06-27 | 2014-07-22 | Nec Corporation | Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system |
WO2009004727A1 (ja) | 2007-07-04 | 2009-01-08 | Fujitsu Limited | 符号化装置、符号化方法および符号化プログラム |
JP5045295B2 (ja) | 2007-07-30 | 2012-10-10 | ソニー株式会社 | 信号処理装置及び方法、並びにプログラム |
US8041577B2 (en) | 2007-08-13 | 2011-10-18 | Mitsubishi Electric Research Laboratories, Inc. | Method for expanding audio signal bandwidth |
ES2704286T3 (es) | 2007-08-27 | 2019-03-15 | Ericsson Telefon Ab L M | Método y dispositivo para la descodificación espectral perceptual de una señal de audio, que incluyen el llenado de huecos espectrales |
PT2186090T (pt) | 2007-08-27 | 2017-03-07 | ERICSSON TELEFON AB L M (publ) | Detetor de transitórios e método para suportar codificação de um sinal de áudio |
EP2571024B1 (en) | 2007-08-27 | 2014-10-22 | Telefonaktiebolaget L M Ericsson AB (Publ) | Adaptive transition frequency between noise fill and bandwidth extension |
US8554349B2 (en) | 2007-10-23 | 2013-10-08 | Clarion Co., Ltd. | High-frequency interpolation device and high-frequency interpolation method |
KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
JP4733727B2 (ja) | 2007-10-30 | 2011-07-27 | 日本電信電話株式会社 | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 |
JP5404412B2 (ja) | 2007-11-01 | 2014-01-29 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
BRPI0818927A2 (pt) | 2007-11-02 | 2015-06-16 | Huawei Tech Co Ltd | Método e aparelho para a decodificação de áudio |
US20090132238A1 (en) | 2007-11-02 | 2009-05-21 | Sudhakar B | Efficient method for reusing scale factors to improve the efficiency of an audio encoder |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
EP2220646A1 (en) | 2007-11-06 | 2010-08-25 | Nokia Corporation | Audio coding apparatus and method thereof |
JP2009116275A (ja) | 2007-11-09 | 2009-05-28 | Toshiba Corp | 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置 |
AU2008326957B2 (en) | 2007-11-21 | 2011-06-30 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
US8688441B2 (en) | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
EP2224432B1 (en) | 2007-12-21 | 2017-03-15 | Panasonic Intellectual Property Corporation of America | Encoder, decoder, and encoding method |
JPWO2009084221A1 (ja) | 2007-12-27 | 2011-05-12 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
ATE500588T1 (de) | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
CN101925953B (zh) | 2008-01-25 | 2012-06-20 | 松下电器产业株式会社 | 编码装置、解码装置以及其方法 |
KR101413968B1 (ko) | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
US8433582B2 (en) | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
CA2716817C (en) | 2008-03-03 | 2014-04-22 | Lg Electronics Inc. | Method and apparatus for processing audio signal |
KR101449434B1 (ko) | 2008-03-04 | 2014-10-13 | 삼성전자주식회사 | 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치 |
EP3273442B1 (en) | 2008-03-20 | 2021-10-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for synthesizing a parameterized representation of an audio signal |
KR20090122142A (ko) | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8498344B2 (en) | 2008-06-20 | 2013-07-30 | Rambus Inc. | Frequency responsive bus coding |
AU2009267525B2 (en) | 2008-07-11 | 2012-12-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio signal synthesizer and audio signal encoder |
EP4407613A1 (en) | 2008-07-11 | 2024-07-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
JP5203077B2 (ja) | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
JP5419876B2 (ja) | 2008-08-08 | 2014-02-19 | パナソニック株式会社 | スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
US8532983B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8407046B2 (en) | 2008-09-06 | 2013-03-26 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
GB2466201B (en) | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
CN101770776B (zh) | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
EP2380172B1 (en) | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
US8463599B2 (en) | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
JP5564803B2 (ja) | 2009-03-06 | 2014-08-06 | ソニー株式会社 | 音響機器及び音響処理方法 |
CN101853663B (zh) | 2009-03-30 | 2012-05-23 | 华为技术有限公司 | 比特分配方法、编码装置及解码装置 |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
CO6440537A2 (es) | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
JP5223786B2 (ja) | 2009-06-10 | 2013-06-26 | 富士通株式会社 | 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機 |
US8515768B2 (en) | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
US8600749B2 (en) | 2009-12-08 | 2013-12-03 | At&T Intellectual Property I, L.P. | System and method for training adaptation-specific acoustic models for automatic speech recognition |
US8447617B2 (en) | 2009-12-21 | 2013-05-21 | Mindspeed Technologies, Inc. | Method and system for speech bandwidth extension |
EP2357649B1 (en) | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
JP5375683B2 (ja) * | 2010-03-10 | 2013-12-25 | 富士通株式会社 | 通信装置および電力補正方法 |
EP2555188B1 (en) | 2010-03-31 | 2014-05-14 | Fujitsu Limited | Bandwidth extension apparatuses and methods |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8793126B2 (en) | 2010-04-14 | 2014-07-29 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
PL4016527T3 (pl) | 2010-07-19 | 2023-05-22 | Dolby International Ab | Przetwarzanie sygnałów audio podczas rekonstrukcji wysokich częstotliwości |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
US8560330B2 (en) | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP2012058358A (ja) | 2010-09-07 | 2012-03-22 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US9230551B2 (en) | 2010-10-18 | 2016-01-05 | Nokia Technologies Oy | Audio encoder or decoder apparatus |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6024077B2 (ja) | 2011-07-01 | 2016-11-09 | ヤマハ株式会社 | 信号送信装置および信号処理装置 |
JP5975243B2 (ja) | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6037156B2 (ja) | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
KR101585852B1 (ko) | 2011-09-29 | 2016-01-15 | 돌비 인터네셔널 에이비 | Fm 스테레오 라디오 신호들에서 고품질의 검출 |
JPWO2013154027A1 (ja) | 2012-04-13 | 2015-12-17 | ソニー株式会社 | 復号装置および方法、オーディオ信号処理装置および方法、並びにプログラム |
JP5997592B2 (ja) | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
US10083700B2 (en) | 2012-07-02 | 2018-09-25 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
WO2014007096A1 (ja) | 2012-07-02 | 2014-01-09 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、並びにプログラム |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
RU2652468C2 (ru) | 2012-07-02 | 2018-04-26 | Сони Корпорейшн | Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа |
JP2014123011A (ja) | 2012-12-21 | 2014-07-03 | Sony Corp | 雑音検出装置および方法、並びに、プログラム |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
-
2010
- 2010-07-16 JP JP2010162259A patent/JP5754899B2/ja active Active
- 2010-09-29 KR KR1020127008330A patent/KR101654402B1/ko active IP Right Grant
- 2010-09-29 RU RU2012112445/08A patent/RU2549116C2/ru active
- 2010-09-29 BR BR112012007389-3A patent/BR112012007389B1/pt active IP Right Grant
- 2010-09-29 KR KR1020157034574A patent/KR101665283B1/ko active IP Right Grant
- 2010-09-29 US US13/499,559 patent/US9208795B2/en active Active
- 2010-09-29 MY MYPI2012001460A patent/MY161609A/en unknown
- 2010-09-29 CA CA2775387A patent/CA2775387C/en active Active
- 2010-09-29 EP EP19188057.4A patent/EP3584794B1/en active Active
- 2010-09-29 EP EP10821898.3A patent/EP2472512B1/en not_active Not-in-force
- 2010-09-29 KR KR1020167032867A patent/KR101786416B1/ko active IP Right Grant
- 2010-09-29 WO PCT/JP2010/066882 patent/WO2011043227A1/ja active Application Filing
- 2010-09-29 KR KR1020187020930A patent/KR101982999B1/ko active IP Right Grant
- 2010-09-29 CN CN201080045206.6A patent/CN102576544B/zh not_active Expired - Fee Related
- 2010-09-29 KR KR1020197014609A patent/KR102110727B1/ko active IP Right Grant
- 2010-09-29 EP EP15184417.2A patent/EP2993667B1/en active Active
- 2010-09-29 CN CN201410208805.5A patent/CN103996401B/zh not_active Expired - Fee Related
- 2010-09-29 CN CN201410208486.8A patent/CN103996402B/zh active Active
- 2010-09-29 EP EP21204344.2A patent/EP3968322A3/en active Pending
- 2010-09-29 KR KR1020157034573A patent/KR101681860B1/ko active IP Right Grant
- 2010-09-29 EP EP17170369.7A patent/EP3232438B1/en active Active
- 2010-09-29 AU AU2010304440A patent/AU2010304440A1/en not_active Abandoned
- 2010-09-29 KR KR1020177027731A patent/KR101882002B1/ko active IP Right Grant
- 2010-09-30 TW TW099133438A patent/TWI480862B/zh active
-
2012
- 2012-05-04 CO CO12073183A patent/CO6541531A2/es unknown
- 2012-12-10 HK HK12112699.5A patent/HK1172139A1/zh unknown
-
2015
- 2015-01-19 HK HK15100567.6A patent/HK1200236A1/zh unknown
- 2015-01-20 HK HK15100623.8A patent/HK1200237A1/zh unknown
- 2015-09-30 US US14/870,268 patent/US9691410B2/en active Active
-
2016
- 2016-11-04 AU AU2016253695A patent/AU2016253695B2/en active Active
-
2019
- 2019-07-18 AU AU2019206091A patent/AU2019206091B2/en active Active
-
2021
- 2021-08-13 AU AU2021215291A patent/AU2021215291B2/en active Active
-
2022
- 2022-12-08 AU AU2022283728A patent/AU2022283728B2/en active Active
-
2024
- 2024-02-13 AU AU2024200903A patent/AU2024200903A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007052088A1 (en) * | 2005-11-04 | 2007-05-10 | Nokia Corporation | Audio compression |
CN1992533A (zh) * | 2005-12-26 | 2007-07-04 | 索尼株式会社 | 信号编码设备和方法、信号译码设备和方法、程序及介质 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103996401B (zh) | 解码设备和解码方法 | |
RU2563160C2 (ru) | Устройство и способ обработки сигналов, кодер и способ кодирования, декодер и способ декодирования и программа | |
KR101835910B1 (ko) | 부호화 장치 및 방법, 복호 장치 및 방법, 및 컴퓨터 판독가능한 기록 매체 | |
RU2571565C2 (ru) | Устройство обработки сигналов и способ обработки сигналов, кодер и способ кодирования, декодер и способ декодирования и программа | |
JP5928539B2 (ja) | 符号化装置および方法、並びにプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1200236 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1200236 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180116 Termination date: 20210929 |