CN102822891B - 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序 - Google Patents

信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序 Download PDF

Info

Publication number
CN102822891B
CN102822891B CN201180018001.3A CN201180018001A CN102822891B CN 102822891 B CN102822891 B CN 102822891B CN 201180018001 A CN201180018001 A CN 201180018001A CN 102822891 B CN102822891 B CN 102822891B
Authority
CN
China
Prior art keywords
band
subband
coefficient
signal
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201180018001.3A
Other languages
English (en)
Other versions
CN102822891A (zh
Inventor
山本优树
知念彻
本间弘幸
光藤祐基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN102822891A publication Critical patent/CN102822891A/zh
Application granted granted Critical
Publication of CN102822891B publication Critical patent/CN102822891B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Abstract

公开了使得能够通过扩展频率带宽来以较高音质再现音乐信号的信号处理装置及信号处理方法、编码器及编码方法、解码器及解码方法、以及程序。高频解码电路对高频编码数据进行解码,并且输出由作为解码的结果而获得的系数索引指定的系数表,所述系数表包括每个高频子带的系数。解码高频子带功率计算电路基于低频信号和系数表来计算各个高频子带的解码高频子带功率,并且,解码高频信号产生单元根据这些解码高频子带功率产生已解码高频信号。此时,扩展和缩小单元通过新产生或删除系数表中的各个子带的系数,根据所计算的解码高频子带功率的子带的数目来扩展或缩小系数表。该方法可以应用于解码装置。

Description

信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序
技术领域
本发明涉及信号处理装置及信号处理方法、编码器及编码方法、解码器及解码方法、以及程序,并且更具体地涉及用于通过扩展频带来再现具有改进的音质的音乐信号的信号处理装置及信号处理方法、编码器及编码方法、解码器及解码方法、以及程序。
背景技术
近来,用于通过互联网来分发音乐数据的音乐分发服务已经有所增加。音乐分发服务分发通过对音乐信号进行编码而获得的编码数据,作为音乐数据。作为音乐信号的编码方法,以下编码方法已被广泛使用:所述方法抑制编码数据文件大小以减小比特率,从而节省下载时间。
音乐信号的这种编码方法大体上分为诸如MP3(MPEG(运动图片专家组)音频层3)(国际标准ISO/IEC 11172-3)的编码方法、以及诸如HE-AAC(高效MPEG4 AAC)(国际标准ISO/IEC 14496-3)的编码方法。
MP3所代表的编码方法消除了音乐信号中的人类几乎感觉不到的具有大约15kHz或大于15kHz的高频带(在下文中称为高带)的信号分量,并且对其余的低频带(在下文中称为低带)的信号分量进行编码。因此,该编码方法被称为高带消除编码方法。这种高带消除编码方法能够抑制编码数据的文件大小。然而,由于人类可以轻微地感知高带中的声音,因此,如果根据通过对编码数据进行解码而获得的解码音乐信号产生声音并输出声音,则会遭受音质的损失,由此,损失了原始声音的真实感并且出现诸如声音模糊的音质退化。
与此不同,HE-AAC所代表的编码方法从高带的信号分量提取特定信息,并且结合低带的信号分量对该信息进行编码。以下将该编码方法称为高带特征编码方法。由于高带特征编码方法仅对高带的信号分量的特征信息进行编码,作为关于高带的信号分量的信息,所以抑制了音质的退化并且可以提高编码效率。
在对高带特征编码方法所编码的数据进行解码时,对特征信息和低带的信号分量进行解码,并且根据被解码后的特征信息和低带的信号分量产生高带的信号分量。因此,将以下技术称为带扩展技术:其通过根据低带的信号分量产生高带的信号分量来扩展高带的信号分量的频带。
作为带扩展方法的应用示例,在对高带消除编码方法所编码的数据进行解码后,进行后处理。在后处理中,编码时的高带信号分量损失是从解码的低带信号分量生成的,从而扩展了低带的信号分量的频带(参见专利文献1)。现有技术的频带扩展方法以下将称为专利文献1的带扩展方法。
在专利文献1的带扩展方法中,装置通过将解码后的低带的信号分量设置为输入信号来根据输入信号的功率谱估计高带的功率谱(下文中,适当地称为高带的频率包络),并且根据低带的信号分量产生具有高带的频率包络的高带的信号分量。
图1示出了作为输入信号的解码后的低带的功率谱和估计的高带的频率包络的示例。
在图1中,竖直轴示出了作为对数的功率,并且水平轴示出了频率。
装置根据关于输入信号的编码系统的种类以及信息(诸如采样速率、比特率等)(下文中称为边信息)确定高带的信号分量的低带中的频带(下文中称为扩展起始带)。接着,装置将作为低带的信号分量的输入信号分割为多个子带信号。装置获得分割后的多个子带信号,即,获得了在比扩展起始带低的低带侧(在下文中简称为低带侧)的多个子带信号的每个功率的时间方向上的各个组(在下文中称为组功率)的平均。如图1中示出的,根据这些装置,假定低带侧的多个子带的信号的各个组功率的平均是功率,并且使得扩展起始带的较低端的频率为频率的点是起始点。装置估计通过起始点的预定斜率的基本直线作为高于扩展起始带的高带(在下文中,简称为高带侧)的频率包络。此外,可以由用户调整起始点的功率方向上的位置。装置根据低带侧的子带的多个信号来产生高带侧的子带的多个信号中的每个,作为估计的高带侧的频率包络。装置将高带侧的子带的多个产生的信号彼此相加成高带的信号分量,并且将低带的信号分量彼此相加以输出相加的信号分量。因此,扩展频带后的音乐信号接近于原始音乐信号。然而,可以产生更好质量的音乐信号。
专利文献1中公开的带扩展方法具有以下优点:在对关于各种高带消除编码方法的编码数据以及各种比特率的编码数据进行解码之后,针对音乐信号可以扩展频带。
引用列表
专利文献
专利文献1:日本专利申请公开第2008-139844号
发明内容
本发明要解决的问题
因此,可以改进专利文献1中公开的带扩展方法,在于:估计的高带侧的频率包络是预定斜率的基本直线,即,频率包络的形状是固定的。
换言之,音乐信号的功率谱具有各种形状,并且音乐信号具有许多以下情况:专利文献1中所公开的带扩展方法所估计的高带侧的频率包络显著地偏离。
图2示出了随着用力击打一次鼓而具有时间上快速变化的起奏音乐信号(起奏音乐信号)的原始功率谱的示例。
此外,图2还示出了通过用专利文献1中公开的带扩展方法将起奏相对音乐信号的低带侧的信号分量设置为输入信号来根据输入信号估计的高带侧的频率包络。
如图2中所示出的,起奏音乐信号的原始高带侧的功率谱具有基本上平坦的形状。
与此不同,估计的高带侧的频率包络具有预定的负斜率,并且即使该频率被调节为具有接近原始功率谱的功率,该功率与原始功率谱之间的差也随着频率变高而变大。
因此,在专利文献1中公开的带扩展方法中,估计的高带侧的频率包络不能够以高精确度再现原始高带侧的频率包络。因此,如果扩展频带后的来自音乐信号的声音被再现和输出,则声音的清晰度在听觉上低于原始声音。
此外,在如上所述的HE-AAC等高带特征编码方法中,高带侧的频率包络用作编码的高带信号分量的特征信息。然而,需要在解码侧以高精确度再现原始高带侧的频率包络。
本发明是考虑了这样的情况而做出的,并且通过扩展频带来提供具有更好音质的音乐信号。
问题的解决方案
根据本发明的第一方面的信号处理装置包括:解复用单元,其将输入编码数据解复用为至少低带编码数据和系数信息;低带解码单元,其对低带编码数据进行解码以产生低带信号;选择单元,其在用于产生高带信号且具有高带侧的各个子带的系数的多个系数表之中,选择基于系数信息获得的系数表;扩展和缩小单元,其删除一些子带的系数以缩小系数表,或基于一些子带的系数来产生预定子带的系数以扩展系数表;高带子带功率计算单元,其基于构成低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表来计算构成高带信号的各个子带的高带子带信号的高带子带功率;以及高带信号产生单元,其基于高带子带功率和低带子带信号来产生高带信号。
扩展和缩小单元可以复制包括在系数表中的具有最高频率的子带的系数,以及将所复制的系数设置为频率高于最高频率的子带的系数以扩展系数表。
扩展和缩小单元可以从系数表中删除下述子带的系数以缩小所述系数表:所述子带的频率高于所述高带子带信号的子带之中的具有最高频率的子带的频率。
根据本发明的第一方面的信号处理方法或程序包括步骤:将输入编码数据解复用为至少低带编码数据和系数信息;对低带编码数据进行解码以产生低带信号;在用于产生高带信号且具有高带侧的各个子带的系数的多个系数表之中,选择基于系数信息获得的系数表;删除一些子带的系数以缩小系数表,或基于一些子带的系数生成预定子带的系数以扩展系数表;基于构成低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表,计算构成高带信号的各个子带的高带子带信号的高带子带功率;基于高带子带功率和低带子带信号来生成高带信号。
根据本发明的第一方面,输入的编码数据被解复用为至少低带编码数据和系数信息;低带编码数据被解码以产生低带信号;从用于产生高带信号并且具有高带侧的各个子带的系数的多个系数表中,选择了基于系数信息获得的系数表;删除了某些子带的系数以缩小系数表,或基于某些子带的系数产生了预定子带的系数以扩展系数表;基于构成低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表,计算了构成高带信号的各个子带的高带子带信号的高带子带功率;以及基于高带子带功率和低带子带信号来产生高带信号。
根据本发明的第二方面的信号处理装置包括:子带分割单元,其产生输入信号的低带侧的多个子带的低带子带信号、以及输入信号的高带侧的多个子带的高带子带信号;扩展和缩小单元,其删除某些子带的系数以缩小系数表,或基于某些子带的系数产生预定子带的系数以扩展系数表,该系数表具有高带侧的各个子带的系数;伪高带子带功率计算单元,其基于所述扩展或缩小的系数表和低带子带信号,来计算高带侧的各个子带的伪高带子带功率,该伪高带子带功率是高带子带信号的功率的估计值;选择单元,其将高带子带信号的高带子带功率与伪高带子带功率相互比较,并且选择多个系数表中的一个;以及产生单元,其产生包括用于获取所选择的系数表的系数信息的数据。
扩展和缩小单元可以复制包括在系数表中的具有最高频率的子带的系数,并且将所复制的系数设置为频率高于最高频率的子带的系数以扩展系数表。
扩展和缩小单元可以从系数表中删除下述子带的系数以缩小系数表:所述子带的频率高于高带子带信号的子带之中的具有最高频率的子带的频率。
根据本发明的第二方面的信号处理方法或程序包括步骤:生成输入信号的低带侧的多个子带的低带子带信号、以及输入信号的高带侧的多个子带的高带子带信号;删除某些子带的系数以缩小系数表,或基于某些子带的系数生成预定子带的系数以扩展系数表,该系数表具有高带侧的各个子带的系数;基于所述扩展或缩小的系数表和低带子带信号来计算高带侧的各个子带的伪高带子带功率,该伪高带子带功率是高带子带信号的功率的估计值;将高带子带信号的高带子带功率与伪高带子带功率相互比较并且选择多个系数表中的一个;以及生成包括用于获取所选择的系数表的系数信息的数据。
根据本发明的第二方面,产生了输入信号的低带侧的多个子带的低带子带信号、以及输入信号的高带侧的多个子带的高带子带信号;删除了某些子带的系数以缩小系数表,或基于某些子带的系数产生了预定子带的系数以扩展系数表,该系数表具有高带侧的各个子带的系数;基于所述扩展或缩小的系数表和低带子带信号,针对高带侧的各个子带计算伪高带子带功率,该伪高带子带功率是高带子带信号的功率的估计值;对高带子带信号的高带子带功率与伪高带子带功率相互比较并且选择了多个系数表中的一个;以及产生了包括用于获取所选系数表的系数信息的数据。
根据本发明的第三方面的解码器包括:解复用单元,其将输入的编码数据解复用为至少低带编码数据和系数信息;低带解码单元,其对低带编码数据进行解码以产生低带信号;选择单元,其在用于产生高带信号并且具有高带侧的各个子带的系数的多个系数表之中选取基于该系数信息获得的系数表;扩展和缩小单元,其删除某些子带的系数以缩小系数表,或基于某些子带的系数产生预定子带的系数以扩展系数表;高带子带功率计算单元,其基于构成低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表,计算构成高带信号的各个子带的高带子带信号的高带子带功率;高带信号产生单元,其基于高带子带功率和低带子带信号来产生高带信号;以及合成单元,其将低带信号和高带信号彼此合成以产生输出信号。
根据本发明的第三方面的解码方法包括步骤:将输入的编码数据解复用为至少低带编码数据和系数信息;对低带编码数据进行解码以产生低带信号;在用于产生高带信号并且具有高带侧的各个子带的系数的多个系数表之中选择基于该系数信息获得的系数表;删除某些子带的系数以缩小系数表,或基于某些子带的系数生成预定子带的系数以扩展系数表;基于构成低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表,计算构成高带信号的各个子带的高带子带信号的高带子带功率;基于高带子带功率和低带子带信号来生成高带信号;以及将低带信号和高带信号彼此合成以产生输出信号。
根据本发明的第三方面,输入的编码数据被解复用为至少低带编码数据和系数信息;对低带编码数据进行解码以产生低带信号;在用于产生高带信号并且具有高带侧的各个子带的系数的多个系数表之中选择基于该系数信息获得的系数表;删除了某些子带的系数以缩小系数表,或基于某些子带的系数产生了预定子带的系数以扩展系数表;基于构成低带信号的各个子带的低带子带信号所述扩展或缩小的系数表,计算了构成高带信号的各个子带的高带子带信号的高带子带功率;基于高带子带功率和低带子带信号产生了高带信号;以及低带信号和高带信号被彼此合成以产生输出信号。
根据本发明的第四方面的编码器包括:子带分割单元,其产生输入信号的低带侧的多个子带的低带子带信号、以及输入信号的高带侧的多个子带的高带子带信号;扩展和缩小单元,其删除某些子带的系数以缩小系数表,或基于某些子带的系数产生预定子带的系数以扩展系数表,该系数表具有高带侧的各个子带的系数;伪高带子带功率计算单元,其基于所述扩展或缩小的系数表和低带子带信号来计算高带侧的各个子带的伪高带子带功率,该伪高带子带功率是高带子带信号的功率的估计值;选择单元,其将高带子带信号的高带子带功率与伪高带子带功率相互比较,并且选择多个系数表中的一个;高带编码单元,其对用于获取所选择的系数表的系数信息进行编码以产生高带编码数据;低带编码单元,其对输入信号的低带信号进行编码以产生低带编码数据;以及复用单元,其将低带编码数据与高带编码数据进行复用以产生输出代码串。
根据本发明的第四方面的编码方法包括步骤:生成输入信号的低带侧的多个子带的低带子带信号、以及输入信号的高带侧的多个子带的高带子带信号;删除某些子带的系数以缩小系数表,或基于某些子带的系数生成预定子带的系数以扩展系数表,该系数表具有高带侧的各个子带的系数;基于所述扩展或缩小的系数表和低带子带信号来计算高带侧的各个子带的伪高带子带功率,该伪高带子带功率是高带子带信号的功率的估计值;将高带子带信号的高带子带功率与伪高带子带功率相互比较,并且选择多个系数表中的一个;对用于获取所选择的系数表的系数信息进行编码以产生高带编码数据;对输入信号的低带信号进行编码以产生低带编码数据;以及将低带编码数据与高带编码数据进行复用以产生输出代码串。
根据本发明的第四方面,产生了输入信号的低带侧的多个子带的低带子带信号、以及输入信号的高带侧的多个子带的高带子带信号;删除了某些子带的系数以缩小系数表,或基于某些子带的系数产生了预定子带的系数以扩展系数表,该系数表具有高带侧的各个子带的系数;基于所述扩展或缩小的系数表和低带子带信号,针对高带侧的各个子带计算伪高带子带功率,该伪高带子带功率是高带子带信号的功率的估计值;将高带子带信号的高带子带功率与伪高带子带功率相互比较,并且选择了多个系数表中的一个;对用于获取所选择的系数表的系数信息进行编码以产生高带编码数据;对输入信号的低带信号进行编码以产生低带编码数据;以及将低带编码数据与高带编码数据进行复用以产生输出代码串。
本发明的效果
根据第一实施例至第四实施例,可以通过扩展频带来以高音质再现音乐信号。
附图说明
图1是示出了对输入信号进行解码后的低带的功率谱和估计的高带的频率包络的示例的视图。
图2是示出了根据时间的快速变化的起奏音乐信号的原始功率谱的示例的视图。
图3是示出了根据本发明的第一实施例的频带扩展装置的功能配置示例的框图。
图4是示出了图3中的频带扩展装置进行的频带扩展处理的示例的流程图。
图5是示出了输入到图3中的频带扩展装置的信号的功率谱的布置以及带通滤波器的频率轴上的布置的视图。
图6是示出了图示声音区域的频率特征和估计的高带的功率谱的示例的视图;
图7是示出了输入到图3中的频带扩展装置的信号的功率谱的示例的视图。
图8是示出了在对图7中的输入信号进行升降后的功率矢量的示例的视图。
图9是示出了系数学习装置的功能配置示例的框图,该系数学习装置用于进行图3中的频带扩展装置的高带信号产生电路中使用的系数的学习。
图10是描述了由图9中的系数学习装置进行的系数学习处理的示例的流程图。
图11是示出了本发明的第二实施例的编码器的功能配置示例的框图。
图12是描述了由图11中的编码器进行的编码处理的示例的流程图。
图13是示出了本发明的第二实施例的解码器的功能配置示例的框图。
图14是描述了由图13中的解码器进行的解码处理的示例的流程图。
图15是示出了系数学习装置的功能配置示例的框图,该系数学习装置用于进行图11中的编码器的高带编码电路中使用的代表矢量的学习以及进行图13中的解码器的高带解码电路中使用的解码的高带子带功率估计系数的学习。
图16是描述了由图15中的系数学习装置进行的系数学习处理的示例的流程图。
图17是示出了图11中的编码器输出的编码串的示例的图。
图18是示出了编码器的功能配置示例的框图。
图19是描述了编码处理的流程图。
图20是示出了解码器的功能配置示例的框图。
图21是描述了解码处理的流程图。
图22是描述了编码处理的流程图。
图23是描述了解码处理的流程图。
图24是描述了编码处理的流程图。
图25是描述了编码处理的流程图。
图26是描述了编码处理的流程图。
图27是描述了编码处理的流程图。
图28是示出了系数学习装置的配置示例的视图。
图29是描述了系数学习处理的流程图。
图30是示出了系数表的图。
图31是示出了系数表的扩展的图。
图32是示出了系数表的缩小的图。
图33是示出了编码器的功能配置示例的框图。
图34是描述了编码处理的流程图。
图35是示出了解码器的功能配置示例的框图。
图36是描述了解码处理的流程图。
图37是示出了使用混合学习来共享系数表的图。
图38是示出了系数学习装置的配置示例的视图。
图39是描述了系数学习处理的流程图。
图40是示出了通过程序执行应用本发明的处理的计算机的硬件的配置示例的框图。
具体实施方式
将参照附图来描述本发明的实施例。此外,按以下顺序进行其描述。
1.第一实施例(当本发明应用于频带扩展装置时)
2.第二实施例(当本发明应用于编码器和解码器时)
3.第三实施例(当系数索引包括在高带编码数据中时)
4.第四实施例(当系数索引与伪高带子带功率之间的差包括在高带编码数据中时)
5.第五实施例(当使用估计值来选择系数索引时)
6.第六实施例(当系数的一部分公用时)
7.第七实施例(在扩展或缩小系数表的情况下)
8.第八实施例(在使用具有不同条件的宽带指示信号来执行学习的情况下)
<1.第一实施例>
在第一实施例中,关于通过对用高带消除编码方法得到的编码数据进行解码而获得的解码后的低带的信号分量,执行扩展频带的处理(在下文中称为频带扩展处理)。
[频带扩展装置的功能配置示例]
图3示出了根据本发明的频带扩展装置的功能配置示例。
频带扩展装置10通过将解码后的低带的信号分量设置为输入信号而关于输入信号进行频带扩展处理,并且输出由该结果获得的频带扩展处理后的信号作为输出信号。
频带扩展装置10包括低通滤波器11、延迟电路12、带通滤波器13、特征量计算电路14、高带子带功率估计电路15、高带信号产生电路16、高通滤波器17和信号加法器18。
低通滤波器11通过预定截止频率对输入信号进行滤波并且向延迟电路12提供低带信号分量(其是低带的信号分量)作为滤波后的信号。
由于当将来自低通滤波器11的低带信号分量与稍后将描述的高带信号分量彼此相加时使延迟电路12同步,所以其将低带信号分量仅延迟了特定时间,并且该低带信号分量被提供至信号加法器18。
带通滤波器13包括具有彼此不同的通带的带通滤波器13-1到13-N。带通滤波器13-i(1≤i≤N)使输入信号的预定通带的信号通过,并且将通过的信号作为多个子带信号中的一个提供给特征量计算电路14和高带信号产生电路16。
特征量计算电路14通过使用输入信号和来自带通滤波器13的多个子带信号中的至少任意一个来计算一个或更多个特征量,并且将计算的特征量提供给高带子带功率估计电路15。在本文中,特征量是表示作为信号的输入信号的特征的信息。
高带子带功率估计电路15基于来自特征量计算电路14的一个或更多个特征量来计算作为每个高带子带的高带子带信号的功率的、高带子带功率的估计值,并且将计算的估计值提供给高带信号产生电路16。
高带信号产生电路16基于来自带通滤波器13的多个子带信号和来自高带子带功率估计电路15的多个高带子带功率的估计值,来产生作为高带的信号分量的高带信号分量,并且将产生的高带信号分量提供给高通滤波器17。
高通滤波器17使用与低通滤波器11中的截止频率对应的截止频率对来自高带信号产生电路16的高带信号分量进行滤波,并且将经滤波的高带信号分量提供给信号加法器18。
信号加法器18将来自延迟电路12的低带信号分量与来自高通滤波器17的高带信号分量相加,并且输出相加的分量作为输出信号。
此外,在图3中的配置中,为了获得子带信号,应用了带通滤波器13,但不限于此。例如,可以应用专利文献1中公开的带分割滤波器。
此外,同样地,在图3中的配置中,应用了信号加法器18以合成子带信号,但是不限于此。例如,可以应用专利文献1中公开的带合成滤波器。
[频带扩展装置的频带扩展处理]
接下来,参照图4中的流程图,将描述由图3中的频带扩展装置进行的频带扩展处理。
在步骤S1中,低通滤波器11通过预定截止频率对输入信号进行滤波,并且将低带信号分量作为滤波后的信号提供给延迟电路12。
低通滤波器11可以设置任选频率作为截止频率。然而,在本发明的实施例中,作为下述的扩展起始带,低通滤波器可以通过设置预定频率而被设置为对应于扩展起始带的低端的频率。因此,低通滤波器11将作为比扩展起始带更低的带的信号分量的低带信号分量提供给延迟电路12,作为滤波后的信号。
此外,低通滤波器11可以响应于编码参数(如高带消除编码方法或输入信号的比特率等)将最优频率设置为截止频率。作为编码参数,例如,可以使用专利文献1中公开的带扩展方法中采用的边信息。
在步骤S2中,延迟电路12将来自低通滤波器11的低带信号分量仅延迟了特定延长时间,并且将延迟的低带信号分量提供给信号加法器18。
在步骤S3中,带通滤波器13(带通滤波器13-1至13-N)将输入信号分割成多个子带信号并且将分割后的多个子带信号中的每个提供给特征量计算电路14和高带信号产生电路16。此外,下面将描述由带通滤波器13进行的输入信号的分割处理。
在步骤S4中,特征量计算电路14通过输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算一个或更多个特征量,并且将计算的特征量提供给高带子带功率估计电路15。此外,下面将详细描述由特征量计算电路14进行的对特征量的计算处理。
在步骤S5中,高带子带功率估计电路15基于一个或更多个特征量来计算多个高带子带功率的估计值,并且将计算的估计值从特征量计算电路14提供给高带信号产生电路16。此外,下面将详细地描述由高带子带功率估计电路15进行的对高带子带功率的估计值的计算处理。
在步骤S6中,高带信号产生电路16基于来自带通滤波器13的多个子带信号和来自高带子带功率估计电路15的多个高带子带功率的估计值来产生高带信号分量,并且将产生的高带信号分量提供给高通滤波器17。在该情况下,高带信号分量是比扩展起始带更高的带的信号分量。此外,下面将详细描述由高带信号产生电路16进行的高带信号分量的产生处理。
在步骤S7中,高通滤波器17通过对来自高带信号产生电路16的高带信号分量进行滤波来去除高带信号分量中包括的低带中的诸如假频(alias)分量的噪声,并且将该高带信号分量提供给信号加法器18。
在步骤S8中,信号加法器18将来自延迟电路12的低带信号分量和来自高通滤波器17的高带信号分量彼此相加,并且将相加后的分量作为输出信号输出。
根据上述处理,可以关于解码后的低带的信号分量来扩展频带。
接下来,将描述针对图4中的流程图的步骤S3到S6的每个处理的说明。
[由带通滤波器进行的处理的描述]
首先,将描述图4的流程图中的步骤S3中由带通滤波器13进行的处理。
此外,为了便于说明,如下所述,假设带通滤波器13的数目N为N=4。
例如,假定通过将输入信号的奈奎斯特(Nyquist)频率分成16个部分而获得的16个子带中的一个子带是扩展起始带,并且16个子带中的比扩展起始带更低的带的4个子带中的每个是带通滤波器13-1至13-4的每个通带。
图5示出了关于对于带通滤波器13-1至13-4的每个通带的每个频率轴的布置。
如图5中示出的,如果假定从比扩展起始带更低的带的频带(子带)的高带开始的第一子带的索引是sb,第二子带的索引是sb-1,并且第I子带的索引是sb-(I-1),带通滤波器13-1到13-4中的每个指定低于扩展起始带的低带的子带中的索引为sb至sb-3的每个子带作为通带。
在本实施例中,带通滤波器13-1至13-4的每个通带是通过将输入信号的奈奎斯特频率分割成16个部分而获得的16个子带的4个预定子带,但是不限于此,并且可以是通过将输入信号的奈奎斯特频率分割成256个部分而获得的256个子带中的4个预定子带。此外,带通滤波器13-1至13-4的每个带宽可以彼此不同。
[由特征量计算电路进行的处理的描述]
接下来,将描述图4中的流程图的步骤S4中由特征量计算电路14进行的处理。
特征量计算电路14通过使用输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算所使用的一个或更多个特征量,以使得高带子带功率估计电路15计算高带子带功率的估计值。
更详细地,特征量计算电路14针对来自带通滤波器13的4个子带信号的每个子带计算子带信号的功率(在下文中称为低带子带功率)作为特征量,并且将计算的子带信号的功率提供给高带子带功率估计电路15。
换言之,特征量计算电路14通过使用以下公式(1)、根据从带通滤波器13提供的4个子带信号x(ib,n)来计算预定时间帧J中的低带子带功率power(ib,J)。本文中,ib是子带的索引,n被表示为离散时间的索引。此外,一个帧的样本的数量被表示为FSIZE,并且功率被表示为分贝。
[公式1]
power ( ib , J ) = 10 log 10 { ( &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 x ( ib , n ) 2 ) / FSIZE }
( sb - 3 &le; ib &le; sb ) . . . ( 1 )
因此,将由特征量计算电路14获得的低带子带功率power(ib,J)作为特征量提供给高带子带功率估计电路15。
[由高带子带功率估计电路进行的处理的描述]
接下来,将描述图4中的流程图的步骤S5的由高带子带功率估计电路15进行的处理。
高带子带功率估计电路15基于从特征量计算电路14提供的4个子带功率,来计算将在索引为sb+1的子带(扩展起始带)之后被扩展的带(频率扩展带)的子带功率(高带子带功率)的估计值。
即,如果高带子带功率估计电路15认为频率扩展带的最大带的子带的索引为eb,则关于索引从sb+1到eb的子带来估计(eb-sb)个子带功率。
在频率扩展带中,使用从特征量计算电路14提供的4个子带功率power(ib,j),通过以下公式(2)表示索引为ib的子带功率的估计值powerest(ib,J)。
[公式2]
power est ( ib , J ) = ( &Sigma; kb = sb - 3 sb { A ib ( kb ) power ( kb , J ) } ) + B ib
( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 2 )
本文中,在公式(2)中,系数Aib(kb)以及Bib是对于各个子带ib具有不同值的系数。系数Aib(kb)以及Bib是这样的系数:其被适当地设置以获得关于各个输入信号的适当值。此外,系数Aib(kb)以及Bib还通过改变子带sb而改变为最优值。下面将描述Aib(kb)以及Bib的推导。
在公式(2)中,高带子带功率的估计值是使用来自带通滤波器13的多个子带信号中的每个的功率、通过基本线性组合来计算的,但是不限于此,例如,可以使用时间帧J之前和之后的帧的多个低带子带功率的线性组合来计算,并且可以使用非线性函数来计算。
如上所述,将由高带子带功率估计电路15计算的高带子带功率的估计值提供给将要描述的高带信号产生电路16。
[由高带信号产生电路进行的处理的描述]
接下来,将对图4中的流程图的步骤S6中由高带信号产生电路16进行的处理进行描述。
高带信号产生电路16根据从带通滤波器13提供的多个子带信号,基于上述公式(1)来计算每个子带的低带子带功率power(ib,J)。高带信号产生电路16使用所计算的多个低带子带功率power(ib,J)以及由高带子带功率估计电路15基于上述公式(2)计算的高带子带功率的估计值powerest(ib,J),通过下述公式(3)来获得增益量G(ib,J)。
[公式3]
G ( ib , J ) = 10 { ( power est ( ib , J ) - power ( sb map ( ib ) , J ) ) / 20 }
( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 3 )
本文中,在公式(3)中,sbmap(ib)表示在子带ib被认为是原始图的子带的情况下的原始图的子带的索引,并且由以下公式4表示。
[公式4]
sb map ( ib ) = ib - 4 INT ( ib - sb - 1 4 + 1 )
( sb + 1 &le; ib &le; eb ) . . . ( 4 )
此外,在公式(4)中,INT(a)是切掉值a的小数点的函数。
接着,高带信号产生电路16通过使用以下公式(5)将由公式3获得的增益量G(ib,J)与带通滤波器13的输出相乘,来计算增益控制后的子带信号x2(ib,n)。
[公式5]
x2(ib,n)=G(ib,J)x(sbmap(ib),n)
(J*FSIZE≤n≤(J+1)FSIZE-1,sb+1≤ib≤eb)
                                             ···(5)
此外,高带信号产生电路16通过以下公式(6),通过从与索引为sb-3的子带的下端的频率对应的频率执行到与索引为sb的子带的上端的频率对应的频率的余弦变换,来计算从增益调整后的子带信号x2(ib,n)余弦变换的、增益控制后的子带信号x3(ib,n)。
[公式6]
x3(ib,n)=x2(ib,n)*2cos(n)*{4(ib+1)π/32}(sb+1≤ib≤eb)
               ···(6)
此外,在公式(6)中,π表示圆周率。公式(6)表示增益控制后的子带信号x2(ib,n)转移到4个带部分高带侧中的每个的频率。
因此,高带信号产生电路16根据以下公式7,根据转移到高带侧的增益控制后的子带信号x3(ib,n)来计算高带信号分量xhigh(n)。
[公式7]
x high ( n ) = &Sigma; ib = sb + 1 eb x 3 ( ib , n ) . . . ( 7 )
因此,由高带信号产生电路16基于根据来自带通滤波器13的4个子带信号而获得的4个低带子带功率以及来自高带子带功率估计电路15的高带子带功率的估计值来产生高带信号分量,并且将所产生的高带信号分量提供给高通滤波器17。
根据上述处理,由于关于对用高带消除编码方法得到的编码数据进行解码之后获得的输入信号,将根据多个子带信号计算的低带子带功率设置为特征量,所以基于对其适当地设置的系数来计算高带子带功率的估计值,并且根据低带子带功率和高带子带功率的估计值来自适应地产生高带信号分量,由此可以以高精确度来估计频率扩展带的子带功率并且可以以较好的音质来再现音乐信号。
如上所述,特征量计算电路14示出了仅计算根据多个子带信号计算出的低带子带功率作为特征量的示例。然而,在这种情况下,通过输入信号的类型不能以高精确度来估计频率扩展带的子带功率。
本文中,因为特征量计算电路14计算与频率扩展带(高带的功率谱形状)的子带功率的输出系统具有强的相关性的特征量,所以能够以高精确度进行高带子带功率估计电路15中的频率扩展带的子带功率的估计。
[由特征量计算电路计算的特征量的另一个示例]
图6示出了大部分声音被占据的声音区域的频率特征和高带的功率谱的示例,该高带的功率谱是通过经由仅计算低带子带功率作为特征量来估计高带子带功率而获得的。
如在图6中示出的,在声音区域的频率特征中,具有许多以下情况:所估计的高带的功率谱具有比原始信号的高带的功率谱高的位置。由于人的歌声的不协调感容易被人耳感知,所以必须在声音区域中以高精确度对高带子带功率进行估计。
此外,如图6中示出的,在声音区域的频率特征中,具有许多以下情况:从4.9kHz到11.025kHz布置有较大的凹陷。
本文中,如下所述,将描述如下示例:可以应用频率区间中的4.9kHz到11.025kHz的凹陷程度作为用于估计声音区域的高带子带功率的特征量。此外,表示凹陷程度的特征量以下被称为凹谷(dip)。
以下将描述时间帧J中的凹谷dip(J)的计算示例。
关于包括在输入信号的时间帧J之前和之后的几个帧的范围中的2048个采样区间的信号,进行2048个点的快速傅里叶变换(FFT),并且计算频率轴上的系数。功率谱是关于所计算的系数中的每一个的绝对值进行db转换而获得的。
图7示出了上述方法中获得的功率谱的一个示例。在本文中,为了去除功率谱中的微小分量,例如,为了去除1.3kHz或更小的分量,进行升降处理。如果进行升降处理,则可以通过根据时间序列选择功率谱的每个维数以及借助应用低通滤波器进行滤波器处理,来平滑谱峰的微小分量。
图8示出了升降后的输入信号的功率谱的示例。在图8中示出的恢复后的功率谱中,包括在对应于4.9kHz到11.025kHz的范围中的最小值与最大值之间的差被设置为凹谷dip(J)。
如上所述,计算了与频率扩展带的子带功率具有强的相关性的特征量。此外,凹谷dip(J)的计算示例不限于上述方法,也可以执行其它方法。
接下来,将描述与频率扩展带的子带功率具有强的相关性的特征量的计算的其它示例。
[由特征量计算电路计算的特征量的又一个示例]
在作为包括任何输入信号中的起奏型音乐信号的区域的起奏区域的频率特征中,存在许多以下情况:高带的功率谱基本上是平坦的,如参照图2所描述的。仅计算低带子带功率作为特征量的方法难以在没有指示具有包括起奏区域的特定输入信号的时间变化的特征量的情况下以高精确度估计从起奏区域看到的几乎平坦的频率扩展带的子带功率,以便估计频率扩展带的子带功率。
在本文中,下面将描述应用低带子带功率的时间变化的示例,作为用于估计起奏区域的高带子带功率的特征量。
例如,某些时间帧J中的低带子带功率的时间变化powerd(J)是根据以下公式(8)来获得的。
[公式8]
power d ( J ) = &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 ( x ( ib , n ) 2 )
/ &Sigma; ib = sb - 3 sb &Sigma; n = ( J - 1 ) FSIZE J * FSIZE - 1 ( x ( ib , n ) 2 ) . . . ( 8 )
根据公式8,低带子带功率的时间变化powerd(J)表示时间帧J-1中的4个低带子带功率的和与时间帧J中的一个帧前面的时间帧(J-1)中的4个低带子带功率的和之间的比率,如果该值变大,则帧之间的功率的时间变化是大的,即,包括在时间帧J中的信号被认为具有很强的起奏。
此外,如果将在图1中示出的为统计上平均的功率谱与在图2中示出的起奏区域(起奏型音乐信号)的功率谱进行比较,则起奏区域中的功率谱朝向中带的右方上升。在起奏区域之间,存在示出频率特征的许多情况。
因此,下面将描述以下示例:其应用中带中的斜率作为用于估计起奏区域之间的高带子带功率的特征量。
例如,某些时间帧J中的中带的斜率slope(J)是根据以下公式(9)来获得的。
[公式9]
slope ( J ) = &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 { W ( ib ) * x ( ib , n ) 2 ) }
/ &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 ( x ( ib , n ) 2 ) . . . ( 9 )
在公式(9)中,系数w(ib)是被调节以对高带子带功率进行加权的权重因子。根据公式(9),slope(J)表示加权到高带的4个低带子带功率的和与4个低带子带功率的和之间的比率。例如,如果将4个低带子带功率设置为关于中带的子带的功率,则slope(J)在中带的功率谱向右方上升时具有大的值,并且功率谱在功率谱向右方下降时具有小的值。
由于存在中带的斜率在起奏区间之前和之后显著地变化的许多情况,所以可以假设由以下公式(10)表示的斜率的时间变化sloped(J)是在估计起奏区域的高带子带功率时使用的特征量。
[公式10]
sloped(J)=slope(J)/slope(J-1)
(J*FSIZE≤n≤(J+1)FSIZE-1)
                           ···(10)
此外,可以假设上述凹谷dip(J)的由以下公式(11)表示的时间变化dipd(J)是在估计起奏区域的高带子带功率时使用的特征量。
[公式11]
dipd(J)=dip(J)-dip(J-1)
(J*FSIZE≤n≤(J+1)FSIZE-1)
                           ···(11)
根据上述方法,因为计算了与频率扩展带的子带功率具有强的相关性的特征量,因此,如果使用该方法,则能够以高精确度进行高带子带功率估计电路15中的对频率扩展带的子带功率的估计。
如上所述,描述了用于计算与频率扩展带的子带功率具有强的相关性的特征量的示例。然而,下面将使用由上述方法计算的特征量来描述用于估计高带子带功率的示例。
[由高带子带功率估计电路进行的处理的描述]
在本文中,将描述用于使用参照图8描述的凹谷和低带子带功率作为特征量来估计高带子带功率的示例。
即,在图4的流程图中的步骤S4中,特征量计算电路14针对来自带通滤波器13的4个子带信号的每个子带,计算低带子带功率和凹谷作为特征量,并且将所计算的低带子带功率和凹谷提供给高带子带功率估计电路15。
因此,在步骤S5中,高带子带功率估计电路15基于来自特征量计算电路14的凹谷和4个低带子带功率来计算高带子带功率的估计值。
在本文中,在子带功率和凹谷中,因为所获得的值的范围(比例)彼此不同,所以高带子带功率估计电路15例如关于凹谷值来进行以下转换。
高带子带功率估计电路15关于预定的大量输入信号来计算凹谷值和4个低带子带功率的最大带的子带功率,并且分别获得平均值和标准偏差。在本文中,假设子带功率的平均值是powerave,子带功率的标准偏差是powerstd,凹谷的平均值是dipave,并且凹谷的标准偏差是dipstd
高带子带功率估计电路15使用如在以下公式(12)中的值来转换凹谷的值dip(J),并且获得转换后的凹谷dips(J)。
[公式12]
dip s ( J ) = dip ( J ) - dip ave dip std power std + power ave . . . ( 12 )
通过进行公式(12)中描述的转换,高带子带功率估计电路15可以将凹谷的值dip(J)统计地转换为低带子带功率的平均和离差的等同变量(凹谷)dips(J),并且使得根据凹谷获得的值的范围近似地等于根据子带功率获得的值的范围。
在频率扩展带中,根据公式13,通过来自特征量计算电路14的4个低带子带功率power(ib,J)与在公式(12)中示出的凹谷dips(J)的线性组合来表示索引为ib的子带功率的估计值powerest(ib,J)。
[公式13]
power est ( ib , J ) = ( &Sigma; kb = sb - 3 sb { c ib ( kb ) power ( kb , J ) } ) + D ib dip s ( J ) + E ib
( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 13 )
在本文中,在公式(13)中,系数Cib(kb)、Dib、Eib是对于每个子带ib具有不同值的系数。系数Cib(kb)、Dib和Eib是这样的系数:其被适当地设置以获得关于各个输入信号的有利值。此外,还将系数Cib(kb)、Dib和Eib改变到最优值以改变子带sb。此外,下面将描述系数Cib(kb)、Dib和Eib的推导。
在公式(13)中,通过线性组合来计算高带子带功率的估计值,但是不限于此。例如,可以使用时间帧J之前和之后的几个帧的多个特征量的线性组合来计算估计值,也可以使用非线性函数来计算估计值。
根据上述处理,可以再现具有较好质量的音乐信号,因为在对高带子带功率进行估计时使用声音区域的特定凹谷的值作为特征量相比于假定只有低带子带功率是特征量的情况提高了声音区域处的高带子带功率估计精确度,高带的功率谱是通过被估计为大于原始信号的高带功率谱来产生的,并且使用仅将低带子带作为特征量的方法,人耳能够容易地感知不协调感。
因此,在子带的分割数量是16的情况下,因为关于由上述方法计算为特征量的凹谷(在声音区域的频率特征中的凹陷的程度),频率分辨率是低的,所以凹陷的程度不能仅用低带子带功率来表示。
在本文中,提高了频率分辨率,并且可以仅用低带子带功率来表示凹陷的程度,这是因为子带的分割数量增加(例如,16倍的256个分割),带通滤波器13的带分割数量增加(例如,16倍的64),并且特征量计算电路14计算的低带子带功率的数量增加(16倍的64)。
仅通过低带子带功率,假定可以以基本上等于对用作特征量的高带子带功率和上述凹谷的估计的精确度的精确度来估计高带子带功率。
然而,计算量通过增加子带的分割数量,带的分割数量和低带子带功率的数量的增加而增加。如果假定能够以等于任何方法的精确度的精确度来估计高带子带功率,则使用凹谷作为特征量对高带子带功率进行估计而不增加子带分割数量的方法被认为在计算量的方面是有效的。
如上所述,描述了使用凹谷和低带子带功率来估计高带子带功率的方法,但是作为用于估计高带子带功率的特征量,上述一个或更多个特征量(低带子带功率、凹谷、低带子带功率的时间变化、斜率、斜率的时间变化和凹谷的时间变化)都可以,而不限于该组合。在这种情况下,可以提高对高带子带功率进行的估计的精确度。
此外,如上所述,在输入信号中,可以通过使用特定参数作为估计高带子带功率时使用的特征量来提高估计高带子带功率困难的区间的估计精确度。例如,低带子带功率的时间变化、斜率、斜率的时间变化和凹谷的时间变化是起奏区域中的特定参数,并且能够通过使用其参数作为特征量来提高起奏区域中的高带子带功率的估计精确度。
此外,即使使用除了低带子带功率和凹谷外的特征量(即,低带子带功率的时间变化、斜率、斜率的时间变化和凹谷的时间变化)来进行高带子带功率的估计,也能够以与上述方法相同的方式来估计高带子带功率。
此外,本说明书所描述的特征量的每种计算方法不限于上述方法,并且可以使用其它方法。
[用于获得系数Cib(kb)、Dib、Eib的方法]
接下来,将在上述公式(13)中描述用于获得系数Cib(kb)、Dib和Eib的方法。
应用基于学习结果来确定系数的方法,其使用具有预定宽带的指示信号(在下文中,称为宽带指示信号)进行学习,以使得作为用于获得系数Cib(kb)、Dib和Eib的方法,系数Cib(kb)、Dib和Eib变为关于估计频率扩展带的子带功率时的各种输入信号的适合的值。
当进行系数Cib(kb)、Dib和Eib的学习时,将包括具有与参照图5描述的带通滤波器13-1至13-4相同的通带宽度的带通滤波器的系数学习装置应用于比扩展起始带更高的高带。该系数学习装置在输入宽带指示时进行学习。
[系数学习装置的功能配置示例]
图9示出了执行系数Cib(kb)、Dib和Eib的学习的系数学习装置的功能配置示例。
输入到图9中的系数学习装置20的宽带指示信号的比扩展起始带更低的低带的信号分量是这样的信号:该信号是按照与当对输入到图3中的频带扩展装置10的具有有限带的输入信号进行编码时执行的编码方法相同的方式而编码的。
系数学习装置20包括带通滤波器21、高带子带功率计算电路22、特征量计算电路23和系数估计电路24。
带通滤波器21包括具有彼此不同的通带的带通滤波器21-1至21-(K+N)。带通滤波器21-i(1≤i≤K+N)使输入信号的预定通带的信号通过,并且将通过的信号提供给高带子带功率计算电路22或特征量计算电路23,以作为多个子带信号中的一个。此外,带通滤波器21-1至21-(K+N)中的带通滤波器21-1至21-K使比扩展起始带更高的高带的信号通过。
高带子带功率计算电路22关于来自带通滤波器21的高带的多个子带信号来计算针对每个恒定时间帧的每个子带的高带子带功率,并且将所计算的高带子带功率提供给系数估计电路24。
特征量计算电路23针对与高带子带功率由高带子带功率计算电路22计算的恒定时间帧相同的各个时间帧,来计算与由图3中的频带扩展装置10的特征量计算电路14计算的特征量相同的特征量。即,特征量计算电路23使用宽带指示信号和来自带通滤波器21的多个子带信号中的至少一个来计算一个或更多个特征量,并且将所计算的特征量提供给系数估计电路24。
系数估计电路24针对每个恒定时间帧,基于来自高带子带功率计算电路22的高带子带功率和来自特征量计算电路23的特征量,来估计在图3中的频带扩展装置10的高带子带功率估计电路15处使用的系数(系数数据)。
[系数学习装置的系数学习处理]
接下来,参照图10中的流程图,将描述由图9中的系数学习装置进行的系数学习处理。
在步骤S11中,带通滤波器21将输入信号(扩展带指示信号)分成(K+N)个子带信号。带通滤波器21-1至21-K将比扩展起始带更高的高带的多个子带信号提供给高带子带功率计算电路22。此外,带通滤波器21-(K+1)至21-(K+N)将比扩展起始带更低的低带的多个子带信号提供给特征量计算电路23。
在步骤S12中,高带子带功率计算电路22关于来自带通滤波器21(带通滤波器21-1至21-K)的高带的多个子带信号来计算针对每个恒定时间帧的每个子带的高带子带功率power(ib,J)。高带子带功率power(ib,J)是通过上述公式(1)来获得的。高带子带功率计算电路22将所计算的高带子带功率提供给系数估计电路24。
在步骤S13中,特征量计算电路23针对与高带子带功率由高带子带功率计算电路22来计算的恒定时间帧相同的每个时间帧,计算特征量。
此外,如下所述,在图3中的频带扩展装置10的特征量计算电路14中,假定计算低带的4个子带功率和凹谷作为特征量,并且将描述:在系数学习装置20的特征量计算电路23中类似地计算低带的凹谷和4个子带功率。
即,特征量计算电路23使用来自带通滤波器21(带通滤波器21-(K+1)至21-(K+4))的、输入到频带扩展装置10的特征量计算电路14的同样的相应的4个子带信号的4个子带信号,来计算4个低带子带功率。此外,特征量计算电路23从扩展带指示信号计算凹谷并且基于上述公式(12)来计算凹谷dips(J)。此外,特征量计算电路23将4个低带子带功率和凹谷dips(J)作为特征量提供给系数估计电路24。
在步骤S14中,系数估计电路24基于对于相同时间帧的从高带子带功率计算电路22提供的(eb-sb)个高带子带功率和从特征量计算电路23提供的特征量(4个低带子带功率和凹谷dips(J))的多个组合,来进行系数Cib(kb)、Dib和Eib的估计。例如,系数估计电路24通过以下方式确定公式(13)中的系数Cib(kb)、Dib和Eib:使5个特征量(4个低带子带功率和凹谷dips(J))作为关于高带的子带中的一个的解释变量,使高带子带功率power(ib,J)作为被解释变量以及使用最小二乘法来进行回归分析。
此外,系数Cib(kb)、Dib和Eib的估计方法自然不限于上述方法并且可以应用各种常见参数识别方法。
根据上述处理,因为用于估计高带子带功率的系数的学习被设置为通过使用预定的扩展带指示信号来进行,所以存在获得关于输入到频带扩展装置10的各种输入信号的优选输出结果的可能性,从而可以再现具有较好质量的音乐信号。
此外,可以通过系数学习方法来计算上述公式(2)中的系数Aib(kb)和Bib
如上所述,在通过诸如4个低带子带功率和凹谷的线性组合在频带扩展装置10的高带子带功率估计电路15中计算高带子带功率的每个估计值的前提下,描述了系数学习处理。
然而,用于在高带子带功率估计电路15中估计高带子带功率的方法不限于上述示例。例如,因为特征量计算电路14计算除了凹谷以外的一个或更多个特征量(低带子带功率的时间变化、斜率、斜率的时间变化和凹谷的时间变化),所以可以计算高带子带功率,可以使用时间帧J之前和之后的多个帧的多个特征量的线性组合,或可以使用非线性函数。即,在系数学习处理中,系数估计电路24可以在与关于由频带扩展装置10的高带子带功率估计电路15计算高带子带功率时所使用的特征量、时间帧和函数相同的条件下计算(学习)系数。
<2.第二实施例>
在第二实施例中,执行了由编码器和解码器在高带特征编码方法中进行的编码处理和解码处理。
[编码器的功能配置示例]
图11示出了应用本发明的编码器的功能配置示例。
编码器30包括低通滤波器31、低带编码电路32、子带分割电路33、特征量计算电路34、伪高带子带功率计算电路35、伪高带子带功率差计算电路36、高带编码电路37、复用电路38和低带解码电路39。
低通滤波器31使用预定截止频率来对输入信号进行滤波,并且将低于截止频率的低带的信号(下文中,被称作低带信号)作为滤波后的信号提供给低带编码电路32、子带分割电路33和特征量计算电路34。
低带编码电路32对来自低通滤波器31的低带信号进行编码,并且将从结果获得的低带编码数据提供给复用电路38和低带解码电路39。
子带分割电路33将输入信号和来自低通滤波器31的低带信号均等地分为具有预定带宽的多个子带信号,并且将分割的信号提供给特征量计算电路34或伪高带子带功率差计算电路36。具体地,子带分割电路33将通过输入低带信号获得的多个子带信号(在下文中,称为低带子带信号)提供给特征量计算电路34。此外,子带分割电路33将通过输入输入信号获得的多个子带信号之中的、高于低通滤波器31设置的截止频率的高带的子带信号(在下文中,称为高带子带信号)提供给伪高带子带功率差计算电路36。
特征量计算电路34使用来自低通滤波器31的低带信号和来自子带分割电路33的低带子带信号的多个子带信号中的任意一个,来计算一个或更多个特征量,并且将所计算的特征量提供给伪高带子带功率计算电路35。
伪高带子带功率计算电路35基于来自特征量计算电路34的一个或更多个特征量来产生伪高带子带功率,并且将产生的伪高带子带功率提供给伪高带子带功率差计算电路36。
伪高带子带功率差计算电路36基于来自子带分割电路33的高带子带信号和来自伪高带子带功率计算电路35的伪高带子带功率来计算下述伪高带子带功率差,并且将所计算的伪高带子带功率差提供给高带编码电路37。
高带编码电路37对来自伪高带子带功率差计算电路36的伪高带子带功率差进行编码,并且将从结果中获得的高带编码数据提供给复用电路38。
复用电路38对来自低带编码电路32的低带编码数据和来自高带编码电路37的高带编码数据进行复用,并且作为输出代码串而输出。
低带解码电路39恰当地对来自低带编码电路32的低带编码数据进行解码,并且将从结果获得的解码数据提供给子带分割电路33和特征量计算电路34。
[编码器的编码处理]
接下来,参照图12中的流程图,将描述由图11中的编码器30进行的编码处理。
在步骤S111,低通滤波器31使用预定截止频率来对输入信号进行滤波,并且将低带信号作为滤波后的信号提供给低带编码电路32、子带分割电路33和特征量计算电路34。
在步骤S112,低带编码电路32对来自低通滤波器31的低带信号进行编码,并且将从结果获得的低带编码数据提供给复用电路38。
此外,对于步骤S112中的低带信号的编码,应根据编码效率和所获得的电路尺寸来选择合适的编码方法,并且本发明不取决于这些编码方法。
在步骤S113中,子带分割电路33将输入信号和低带信号均等地分为具有预定带宽的多个子带信号。子带分割电路33将通过输入低带信号获得的低带子带信号提供给特征量计算电路34。此外,子带分割电路33将通过输入输入信号获得的多个子带信号中的、比由低通滤波器31设置的带限制的频率更高的带的高带子带信号提供给伪高带子带功率差计算电路36。
在步骤S114中,特征量计算电路34使用来自低通滤波器31的低带信号和来自子带分割电路33的低带子带信号的多个子带信号中的至少任意一个,来计算一个或更多个特征量,并且将所计算的特征量提供给伪高带子带功率计算电路35。此外,图11中的特征量计算电路34具有与图3中的特征量计算电路14基本上相同的配置和功能。因为步骤S114中的处理基本上与图4中的流程图的步骤S4的处理相同,所以省略其描述。
在步骤S115中,伪高带子带功率计算电路35基于来自特征量计算电路34的一个或更多个特征量来产生伪高带子带功率,并且将所产生的伪高带子带功率提供给伪高带子带功率差计算电路36。此外,图11中的伪高带子带功率计算电路35具有与图3中的高带子带功率估计电路15基本上相同的配置和功能。因此,因为步骤S115中的处理基本上与图4中的流程图的步骤S5相同,所以省略其描述。
在步骤S116中,伪高带子带功率差计算电路36基于来自子带分割电路33的高带子带信号和来自伪高带子带功率计算电路35的伪高带子带功率来计算伪高带子带功率差,并且将所计算的伪高带子带功率差提供给高带编码电路37。
具体地,伪高带子带功率差计算电路36关于来自子带分割电路33的高带子带信号来计算恒定时间帧J中的(高带)子带功率power(ib,J)。此外,在本发明的实施例中,使用索引ib来区分所有的低带子带信号的子带和高带子带信号的子带。子带功率的计算方法能够应用于与第一实施例的方法(即,由第一实施例的公式(1)使用的方法)相同的方法。
接下来,伪高带子带功率差计算电路36计算时间帧J中的高带子带功率power(ib,J)与来自伪高带子带功率计算电路35的伪高带子带功率power1h(ib,J)之间的差值(伪高带子带功率差)powerdiff(ib,J)。伪高带子带功率差powerdiff(ib,J)是通过以下公式(14)来获得的。
[公式14]
powerdiff(ib,J)=power(ib,J)-power1h(ib,J)
(J*FSIZE≤n≤(J+1)FSIZE-1,sb+1≤ib≤eb)
                                                ···(14)
在公式(14)中,索引sb+1表示高带子带信号中的最低带的子带的索引。此外,索引eb表示被编码在高带子带信号中的最高带的子带的索引。
如上所述,将由伪高带子带功率差计算电路36计算的伪高带子带功率差提供给高带编码电路37。
在步骤S117中,高带编码电路37对来自伪高带子带功率差计算电路36的伪高带子带功率差进行编码,并且将从结果获得的高带编码数据提供给复用电路38。
具体地,高带编码电路37通过以下处理来编码:确定对来自伪高带子带功率差计算电路36的伪高带子带功率差进行矢量化所得到的矢量(在下文中称为伪高带子带功率差矢量)属于预定的伪高带子带功率差的特征空间中的多个聚类之中的哪个聚类。本文中,时间帧J中的伪高带子带功率差矢量具有作为矢量元素的每个索引ib的伪高带子带功率差powerdiff(ib,J)的值,并且显示了(eb-sb)维度的矢量。此外,伪高带子带功率差的特征空间以相同的方式被设置为(eb-sb)维度的空间。
因此,高带编码电路37在伪高带子带功率差的特征空间中测量多个预定的聚类的多个各代表矢量与伪高带子带功率差矢量之间的距离,获得具有最短距离的聚类的索引(在下文中,称为伪高带子带功率差ID),并且将所获得的索引作为高带编码数据提供给复用电路38。
在步骤S118中,复用电路38对从低带编码电路32输出的低带编码数据和从高带编码电路37输出的高带编码数据进行复用,并且输出输出代码串。
因此,作为高带特征编码方法中的编码器,日本专利申请公开第2007-17908号公开了这样的技术:其从低带子带信号产生伪高带子带信号,针对每个子带将伪高带子带信号的功率与高带子带信号的功率相互比较,计算针对每个子带的功率增益以将伪高带子带信号的功率与高带子带信号的功率匹配,并且使所计算的增益作为高带特征的信息包括在代码串中。
根据上述处理,仅伪高带子带功率差ID可以包括在输出代码串中,作为用于在解码时估计高带子带功率的信息。即,例如,如果预定的聚类的数量是64,作为用于在解码器中恢复高带信号的信息,可以将6比特信息添加到每时间帧的代码串,并且能够减小包括在代码串中的信息量以相比在日本专利申请公开第2007-17908号中公开的方法提高解码效率,并且可以再现具有较好音质的音乐信号。
此外,在上述处理中,如果存在计算量的余量,则低带解码电路39可以将通过对来自低带编码电路32的低带编码数据进行解码而获得的低带信号输入到子带分割电路33和特征量计算电路34。在由解码器进行的解码处理中,特征量是根据对低带编码数据进行解码的低带信号而计算的,并且高带子带的功率是基于特征量来估计的。因此,甚至在编码处理中,在代码串中包括伪高带子带功率差ID(其是基于根据已解码低带信号计算的特征量而计算的),则在由解码器进行的解码处理中,能够估计出具有更好的精确度的高带子带功率。因此,可以再现具有较好音质的音乐信号。
[解码器的功能配置示例]
接着,参照图13,将描述与图11中的编码器30对应的解码器的功能配置示例。
解码器40包括解复用电路41、低带解码电路42、子带分割电路43、特征量计算电路44、高带解码电路45、已解码高带子带功率计算电路46、已解码高带信号产生电路47和合成电路48。
解复用电路41将输入代码串解复用为高带编码数据和低带编码数据,并且将低带编码数据提供给低带解码电路42以及将高带编码数据提供给高带解码电路45。
低带解码电路42对来自解复用电路41的低带编码数据进行解码。低带解码电路42将从解码结果获得的低带的信号(在下文中,称为已解码低带信号)提供给子带分割电路43、特征量计算电路44和合成电路48。
子带分割电路43将来自低带解码电路42的已解码低带信号均等地分为具有预定带宽的多个子带信号,并且将子带信号(已解码低带子带信号)提供给特征量计算电路44和已解码高带信号产生电路47。
特征量计算电路44使用来自低带解码电路42的已解码低带信号和来自子带分割电路43的已解码低带子带信号的多个子带信号中的任意一个来计算一个或更多个特征量,并且将所计算的特征量提供给已解码高带子带功率计算电路46。
高带解码电路45对来自解复用电路41的高带编码数据进行解码,并且使用从结果获得的伪高带子带功率差ID的为每个预定的ID(索引)准备的用于估计高带子带功率的系数(在下文中,称为已解码高带子带功率估计系数)提供给已解码高带子带功率计算电路46。
已解码高带子带功率计算电路46基于来自特征量计算电路44的一个或更多个特征量和来自高带解码电路45的已解码高带子带功率估计系数来计算已解码高带子带功率,并且将所计算的已解码高带子带功率提供给已解码高带信号产生电路47。
已解码高带信号产生电路47基于来自子带分割电路43的已解码低带子带信号和来自已解码高带子带功率计算电路46的已解码高带子带功率来产生已解码高带信号,并且将产生的信号和功率提供给合成电路48。
合成电路48对来自低带解码电路42的已解码低带信号和来自已解码高带信号产生电路47的已解码高带信号进行合成,并且将合成的信号作为输出信号输出。
[解码器的解码处理]
接下来,将参照图14中的流程图来描述使用图13中的解码器的解码处理。
在步骤S131中,解复用电路41将输入代码串解复用为高带编码数据和低带编码数据,将低带编码数据提供给低带解码电路42,以及将高带编码数据提供给高带解码电路45。
在步骤S132中,低带解码电路42对来自解复用电路41的低带编码数据进行解码,并且将从结果获得的已解码低带信号提供给子带分割电路43、特征量计算电路44和合成电路48。
在步骤S133中,子带分割电路43将来自低带解码电路42的已解码低带信号均等地分成具有预定带宽的多个子带信号,并且将获得的已解码低带子带信号提供给特征量计算电路44和已解码高带信号产生电路47。
在步骤S134中,特征量计算电路44根据来自低带解码电路42的已解码低带信号和来自子带分割电路43的已解码低带子带信号的多个子带信号中的任意一个来计算一个或更多个特征量,并且将这些信号提供给已解码高带子带功率计算电路46。此外,图13中的特征量计算电路44基本上具有与图3中的特征量计算电路14相同的配置和功能,并且步骤134中的处理与图4中的流程图中的步骤S4的处理相同。因此,省略其描述。
在步骤S135中,高带解码电路45对来自解复用电路41的高带编码数据进行解码,并且使用从结果获取的伪高带子带功率差ID的为每个预定ID(索引)准备的已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46。
在步骤S136中,已解码高带子带功率计算电路46基于来自特征量计算电路44的一个或更多个特征量和来自高带解码电路45的已解码高带子带功率估计系数来计算已解码高带子带功率,并且将该功率提供给已解码高带信号产生电路47。此外,因为图13中的已解码高带子带功率计算电路46具有与图3中的高带子带功率估计电路15相同的配置和功能,并且步骤S136中的处理与图4中的流程图的步骤S5中的处理相同,所以省略详细描述。
在步骤S137中,已解码高带信号产生电路47基于来自子带分割电路43的已解码低带子带信号和来自已解码高带子带功率计算电路46的已解码高带子带功率来输出已解码高带信号。此外,因为图13中的已解码高带信号产生电路47基本上具有与图3中的高带信号产生电路16相同的配置和功能以及步骤S137中的处理与图4中的流程图的步骤S6的处理相同,所以省略其详细描述。
在步骤S138中,合成电路48对来自低带解码电路42的已解码低带信号和来自已解码高带信号产生电路47的已解码高带信号进行合成,并且将合成的信号作为输出信号输出。
根据上述处理,可以提高高带子带功率的估计精确度,由此可以响应于编码时预先计算的伪高带子带功率与实际的高带子带功率之间的差特征,通过在解码时使用高带子带功率估计系数来在解码中再现具有良好质量的音乐信号。
此外,根据该处理,因为包括在代码串中的用于产生高带信号的信息仅具有伪高带子带功率差ID,所以可以有效地进行解码处理。
如上所述,尽管描述了根据本发明的编码处理和解码处理,但是在下文中,将描述下述方法:计算图11中的编码器30的高带编码电路37中预定伪高带子带功率差的具体空间中的多个聚类的每个代表矢量、以及由图13中的解码器40的高带解码电路45输出的已解码高带子带功率估计系数。
[计算伪高带子带功率差的特定空间中的多个聚类中的代表矢量以及与每个聚类对应的已解码高带子带功率估计系数的计算方法]
作为用于获取多个聚类的代表矢量和每个聚类的已解码高带子带功率估计系数的方式,需要准备该系数以响应于在编码中计算的伪高带子带功率差矢量来在解码中以高精确度估计高带子带功率。因此,通过宽带指示信号预先进行学习,并且基于该学习结果来应用确定学习的方法。
[系数学习装置的功能配置示例]
图15示出了进行多个聚类的代表矢量和每个聚类的已解码高带子带功率估计系数的学习的系数学习装置的功能配置示例。
优选地,输入到图15中的系数学习装置50的宽带指示信号的、以及具有由编码器30的低通滤波器31设置的截止频率或更小频率的信号分量是下述已解码低带信号:其中,到编码器30的输入信号通过低通滤波器31,该输入信号由低带编码电路32编码并且由解码器40的低带解码电路42来解码。
系数学习装置50包括低通滤波器51、子带分割电路52、特征量计算电路53、伪高带子带功率计算电路54、伪高带子带功率差计算电路55、伪高带子带功率差聚类电路56和系数估计电路57。
此外,因为图15中的系数学习装置50中的低通滤波器51、子带分割电路52、特征量计算电路53和伪高带子带功率计算电路54中的每一个基本上具有与图11中的编码器30中的低通滤波器31、子带分割电路33、特征量计算电路34和伪高带子带功率计算电路35中的每一个的配置和功能相同的配置和功能,所以适当地省略其描述。
换言之,尽管伪高带子带功率差计算电路55提供了与图11中的伪高带子带功率差计算电路36相同的功能和配置,但是计算的伪高带子带功率差被提供给伪高带子带功率差聚类电路56,并且当计算伪高带子带功率差时计算的高带子带功率被提供给系数估计电路57。
伪高带子带功率差聚类电路56对从来自伪高带子带功率差计算电路55的伪高带子带功率差获得的伪高带子带功率差矢量进行聚类,并且计算每个聚类处的代表矢量。
系数估计电路57基于来自伪高带子带功率差计算电路55的高带子带功率和来自特征量计算电路53的一个或更多个特征量,针对由伪高带子带功率差聚类电路56聚类的每个聚类,计算高带子带功率估计系数。
[系数学习装置的系数学习处理]
接下来,将参照图16中的流程图来描述图15中的系数学习装置50进行的系数学习处理。
此外,除了输入到系数学习装置50的信号是宽带指示信号外,图16中的流程图的步骤S151至S155的处理与图12中的流程图的步骤S111、S113至S116的处理相同,因此,省略其描述。
即,在步骤S156中,伪高带子带功率差聚类电路56对从来自伪高带子带功率差计算电路55至64的伪高带子带功率差获得的多个伪高带子带功率差矢量(大量时间帧)进行聚类,并且计算每个聚类的代表矢量。作为聚类方法的示例,例如,能够应用使用k-means(k均值)方法的聚类。伪高带子带功率差聚类电路56将从通过k-means方法进行聚类的结果获得的每个聚类的中心矢量设置为每个聚类的代表矢量。此外,聚类的方法或聚类的数量不限于此,还可以应用其它方法。
此外,伪高带子带功率差聚类电路56测量时间帧J中的64个代表矢量与从来自伪高带子带功率差计算电路55的伪高带子带功率差获得的伪高带子带功率差矢量之间的距离,并且确定具有最短距离的代表矢量中包括的聚类的索引CID(J)。此外,索引CID(J)取1到聚类的数量(例如,64)的整数值。因此,伪高带子带功率差聚类电路56输出代表矢量并且将索引CID(J)提供给系数估计电路57。
在步骤S157中,系数估计电路57计算每个聚类处的已解码高带子带功率估计系数,每组聚类在从伪高带子带功率差计算电路55和特征量计算电路53提供的针对相同时间帧的数目为(eb-sb)的高带子带功率和特征量的多个组合中具有相同的索引CID(J)(包括在同一聚类中)。用于通过系数估计电路57计算系数的方法与由图9中的系数学习装置20的系数估计电路24进行的方法相同。然而,可以使用其它方法。
根据通过使用预定的宽带指示信号的上述处理,因为进行了针对图11中的编码器30的高带编码电路37中预定的伪高带子带功率差的特定空间中的多个聚类的每个代表矢量的学习,并且进行了针对由图13中的解码器40的高带解码电路45输出的已解码高带子带功率估计系数的学习,所以可以关于输入到编码器30的各个输入信号和输入到解码器40的各个输入代码串来获得期望的输出结果,并且可以再现具有高质量的音乐信号。
此外,关于信号的编码和解码,用于在编码器30的伪高带子带功率计算电路35和解码器40的已解码高带子带功率计算电路46中计算高带子带功率的系数数据可以如下处理。即,可以通过基于输入信号的类型使用不同的系数数据来将该系数记录在代码串的前面的位置中。
例如,可以通过用信号(如语音和爵士乐)改变系数数据来实现编码效率的改进。
图17示出了根据上述方法获得的代码串。
图17中的代码串A对语音进行编码,并且在报头中记录讲话中的最优系数数据α。
与此相反,因为图17中的代码串B对爵士乐进行编码,所以爵士乐中的最优系数数据β被记录在报头中。
能够预先通过相同类型的音乐信号来容易地学习上述多个系数数据,并且编码器30可以根据记录在输入信号的报头中的种类信息来选择系数数据。此外,可以通过进行信号的波形分析来确定种类并且可以选择系数数据。即,信号的种类分析方法不受具体限制。
当计算时间允许时,编码器30配备有上述学习装置,因此,通过使用该信号专用的系数来进行处理,如在图17中的代码串C中示出的,最终,也可以将系数记录在报头中。
如下将描述使用该方法的优点。
高带子带功率的形状包括一个输入信号中的多个类似位置。通过使用多个输入信号的特征以及通过单独地进行对用于每个输入信号的高带子带功率的估计的系数的学习,减小了由于高带子带功率的相似位置中产生的冗余,从而提高了编码效率。此外,相比统计地使用多个信号对用于估计高带子带功率的系数进行学习,可以以更高的精确度来进行高带子带功率的估计。
此外,如上所述,在解码中从输入信号学习的系数数据可以采取一次插入每若干帧中的形式。
<3.第三实施例>
[编码器的功能配置示例]
此外,尽管描述了将伪高带子带功率差ID从编码器30作为高带编码数据输出到解码器40,用于获取已解码高带子带功率估计系数的系数索引可以设置为高带编码数据。
在该情况下,例如,如图18所示那样配置编码器30。此外,在图18中,与图11中的部件对应的部件具有相同的附图标记,并且适当地省略其描述。
图18中的编码器30与图11中的编码器30相同,除了没有设置低带解码电路39以外,剩下的部分是相同的。
在图18中的编码器30中,特征量计算电路34通过使用从子带分割电路33提供的低带子带信号来计算低带子带功率作为特征量,并且将低带子带功率提供给伪高带子带功率计算电路35。
此外,在伪高带子带功率计算电路35中,通过预定的回归分析获得的多个已解码高带子带功率估计系数对应于指定待记录的已解码高带子带功率估计系数的系数索引。
具体地,预先准备在上述公式(2)的运算中使用的针对每个子带的系数Aib(kb)和系数Bib的集合,作为已解码高带子带功率估计系数。例如,系数Aib(kb)和系数Bib是通过预先将低带子带功率设置为解释变量以及将高带子带功率设置为被解释变量,借助使用最小二乘法的归回分析来计算的。在回归分析中,包括低带子带信号和高带子带信号的输入信号被用作宽带指示信号。
伪高带子带功率计算电路35通过使用已解码高带子带功率估计系数和来自特征量计算电路34的特征量,针对记录的已解码高带子带功率估计系数中的每个来计算高带侧的每个子带的伪高带子带功率,并且将子带功率提供给伪高带子带功率差计算电路36。
伪高带子带功率差计算电路36将根据从子带分割电路33提供的高带子带信号获得的高低子带功率与来自伪高带子带功率计算电路35的伪高带子带功率进行比较。
此外,伪高带子带功率差计算电路36将已解码高带子带功率估计系数的系数索引提供给高带编码电路37,其中,与最高的伪高带子带功率接近的伪高带子带功率是从比较的结果和多个已解码高带子带功率估计系数中获得的。即,选择可获得要在解码时再现的输入信号的高带信号(即,最接近真实值的已解码高带信号)的已解码高带子带功率估计系数的系数索引。
[编码器的编码处理]
接下来,参照图19中的流程图,将描述图18中的编码器30进行的编码处理。此外,步骤S181至步骤S183的处理与图12中的步骤S111至步骤S113的处理是相同的。因此,省略其描述。
在步骤S184中,特征量计算电路34通过使用来自子带分割电路33的低带子带信号来计算特征量,并且将特征量提供给伪高带子带功率计算电路35。
具体地,特征量计算电路34通过进行上述公式(1)的运算,计算关于低带侧中的每个子带ib(其中,sb-3≤ib≤sb)的帧J(其中,0≤J)的低带子带功率power(ib,J),作为特征量。即,低带子带功率power(ib,J)是通过对构成帧J的低带子带信号的每个样本的样本值的均方值进行数字化而计算的。
在步骤S185中,伪高带子带功率计算电路35基于从特征量计算电路34提供的特征量来计算伪高带子带功率,并且将伪高带子带功率提供给伪高带子带功率差计算电路36。
例如,伪高带子带功率计算电路35计算通过使用预先记录为已解码高带子带功率系数的系数Aib(kb)和系数Bib来执行上述公式(2)的运算的伪高带子带功率powerest(ib,J)、以及通过使用低带子带功率power(kb,J)(其中,sb-3≤kb≤sb)来执行上述公式(2)的运算的伪高带子带功率powerest(ib,J)。
即,每个子带的系数Aib(kb)乘以作为特征量提供的低带侧的每个子带的低带子带功率power(kb,J),并且将系数Bib与低带子带功率乘以系数的和相加,然后变为伪高带子带功率powerest(ib,J)。该伪高带子带功率是针对索引为sb+1至eb的高带侧的每个子带来计算的。
此外,伪高带子带功率计算电路35计算预先记录的每个已解码高带子带功率估计系数的伪高带子带功率。例如,假定系数索引允许1到K(其中,2≤K)数量的已解码高带子带估计系数被预先准备。在这种情况下,针对K个已解码高带子带功率估计系数来计算每个子带的伪高带子带功率。
在步骤S186中,伪高带子带功率差计算电路36基于来自子带分割电路33的高带子带信号和来自伪高带子带功率计算电路35的伪高带子带功率,来计算伪高带子带功率差。
具体地,伪高带子带功率差计算电路36不进行与上述公式(1)的运算相同的运算,并且关于来自子带分割电路33的高带子带信号来计算帧J中的高带子带功率power(ib,J)。此外,在实施例中,低带子带信号和高带子带信号的全部子带是通过使用索引ib来区分的。
接下来,伪高带子带功率差计算电路36进行与上述公式(14)相同的运算,并且计算帧J中的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,J)之间的差。在该情况下,伪高带子带功率差powerdiff(ib,J)是针对关于索引为sb+1至eb的高带侧的每个子带的每个已解码高带子带功率估计系数来获得的。
在步骤S187中,伪高带子带功率差计算电路36针对每个已解码高带子带功率估计系数来计算以下公式(15),并且计算伪高带子带功率差的平方和。
[公式15]
E ( J , id ) = &Sigma; ib = sb + 1 eb { power diff ( ib , J , id ) } 2 . . . ( 15 )
此外,在公式(15)中,对于差E(J,id)的平方和是关于系数索引为id的已解码高带子带功率估计系数和帧J来获得的。此外,在公式(15)中,powerdiff(id,J,id)是关于系数索引为id的已解码高带子带功率估计系数来获得的,并且表示索引为ib的子带的帧J的伪高带子带功率差powerdiff(ib,J)。差E(J,id)的平方和是关于每个已解码高带子带功率估计系数的数量K来计算的。
以上获得的针对差E(J,id)的平方和表示根据实际高带信号计算的高带子带功率与使用系数索引为id的已解码高带子带功率估计系数计算的伪高带子带功率之间的相似度。
即,估计值的误差是关于高带子带功率的真实值来表示的。因此,针对差E(J,id)的平方和越小,则使用已解码高带子带功率估计系数通过运算获得的已解码高带信号越接近实际高带信号。即,对于差E(J,id)的平方和最小的已解码高带子带功率估计系数是最适合于在对输出代码串进行解码时进行的频带扩展处理的估计系数。
伪高带子带功率差计算电路36从针对差E(J,id)的K个平方和之中选择具有最小值的差的平方和,并且将表示与针对差的平方和对应的已解码高带子带功率估计系数的系数索引提供给高带编码电路37。
在步骤S188中,高带编码电路37对从伪高带子带功率差计算电路36提供的系数索引进行编码,并且将获得的高带编码数据提供给复用电路38。
例如,步骤S188中,关于系数索引进行加密编码等。因此,可以压缩输出到解码器40的高带编码数据的信息量。此外,如果高带编码数据是获得了最优的已解码高带子带功率估计系数的信息,则任何信息都是优选的;例如,索引可以是如原样的高带编码数据。
在步骤S189中,复用电路38对从低带编码电路32提供的低带编码数据与从高带编码电路37提供的高带编码数据进行复用,并且将输出输出代码串,从而完成编码处理。
如上所述,能够通过输出以下数据来获得最适合处理的已解码高带子带功率估计系数:通过对系数索引进行编码作为接收输出代码串的输入的解码器40中的输出代码串而获得的高带编码数据、以及低带编码数据。因此,可以获得具有较高质量的信号。
[解码器的功能配置示例]
此外,从图18中的编码器30输出的输出代码串是作为输入代码串而输入的,例如,用于解码的解码器40具有图20中所示的配置。此外,在图20中,对应于图13的情况的部件使用相同的附图标记,并且省略描述。
图20中的解码器40与图13中的解码器40的相同之处在于配置了解复用电路41到合成电路48,而与图13中的解码器40的不同之处在于:来自低带解码电路42的已解码低带信号被提供给特征量计算电路44。
在图20中的解码器40中,高带解码电路45记录了与预先记录图18中的伪高带子带功率计算电路35的已解码高带子带功率估计系数相同的已解码高带子带功率估计系数。即,通过回归分析得到的作为已解码高带子带功率估计系数的系数Aib(kb)和系数Bib的集合被记录为与系数索引对应。
高带解码电路45对从解复用电路41提供的高带编码数据进行解码,并且将由从结果中获得的系数索引表示的已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46。
[解码器的解码处理]
接下来,将参照图21中的流程图来描述由图20中的解码器40进行的解码处理。
如果将从编码器30输出的输出代码串作为输入代码串提供给解码器40,则解码处理开始。此外,因为步骤S211至步骤S213的处理与图14中的步骤S131至步骤S133的处理相同,所以省略描述。
在步骤S214中,特征量计算电路44通过使用来自子带分割电路43的已解码低带子带信号来计算特征量,并且将其提供给已解码高带子带功率计算电路46。具体地,特征量计算电路44关于低带侧的每个子带ib通过进行上述公式(1)的运算,来计算帧J(但是,0≤J)的低带子带功率power(ib,J)的特征量。
在步骤S215中,高带解码电路45对从解复用电路41提供的高带编码数据进行解码,并且将由从结果中获得的系数索引表示的已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46。即,输出已解码高带子带功率估计系数,其由预先记录到高带解码电路45中的多个已解码高带子带功率估计系数中的、通过解码获得的系数索引来表示。
在步骤S216中,已解码高带子带功率计算电路46基于从特征量计算电路44提供的特征量和从高带解码电路45提供的已解码高带子带功率估计系数,来计算已解码高带子带功率,并且将其提供给已解码高带信号产生电路47。
即,已解码高带子带功率计算电路46使用作为已解码高带子带功率估计系数的系数Aib(kb)和系数Bib、作为特征量的低带子带功率power(kb,J)(其中,sb-3≤kb≤sb),来进行上述公式(2)中的运算,并且计算已解码高带子带功率。因此,已解码高带子带功率是关于索引为sb+1到eb的高带侧的每个子带来获得的。
在步骤S217中,已解码高带信号产生电路47基于从子带分割电路43提供的已解码低带子带信号和从已解码高带子带功率计算电路46提供的已解码高带子带功率,来产生已解码高带信号。
具体地,已解码高带信号产生电路47使用已解码低带子带信号来进行上述公式(1)的运算,并且计算关于低带侧的每个子带的低带子带功率。此外,已解码高带信号产生电路47使用所获得的低带子带功率和已解码高带子带功率,通过进行上述公式(3)的运算,来计算针对高带侧的每个子带的增益量G(ib,J)。
此外,已解码高带信号产生电路47关于高带侧的每个子带,使用增益量G(ib,J)和已解码低带子带信号,通过进行上述公式(5)和公式(6)的运算,来产生高带子带信号x3(ib,n)。
即,已解码高带信号产生电路47响应于低带子带功率与已解码高带子带功率的比率来进行已解码高带子带信号x(ib,n)的幅度调制,因此,对获得的已解码低带子带信号x2(ib,n)进行幅度调制。因此,低带侧的子带的频率分量的信号被转换为高带侧的子带的频率分量的信号,并且获得了高带子带信号x3(ib,n)。
如上所述,用于获取每个子带的高带子带信号的处理是下面更详细描述的处理。
频率区中成行的4个子带称为带块,并且将频带分割,以使得由在低侧存在的索引是sb到sb-3的4个子带来配置一个带块(下文中,称为低带块)。在该情况下,例如,包括高带侧的索引包含sb+1至sb+4的子带的带是一个带块。此外,高带侧,即,包括索引为sb+1或更大的子带的带块被具体称为高带块。
此外,关注构成高带块的一个子带,并且产生该子带(下文中,称为关注子带)的高带子带信号。首先,已解码高带信号产生电路47指定了具有与高带块中的关注子带的位置相同的位置关系的低带块的子带。
例如,如果关注子带的索引是sb+1,则将具有与关注子带的相同位置关系的低带块的子带被设置为索引为sb-3的子带,因为关注子带是高带块中频率最低的带。
如上所述,如果低带块子带的子带中的与关注子带具有相同的位置关系的子带是特定的,则使用低带子带功率和已解码低带子带信号和已解码高带子带功率,并且产生关注子带的高带子带信号。
也就是说,将已解码高带子带功率和低带子带功率带入公式(3),使得根据其功率的比率计算增益量。此外,将算出的增益量乘以已解码低带子带信号,与增益量相乘的已解码低带子带信号被设为通过公式(6)的运算进行的频率调制,以被设为关注子带的高带子带信号。
在处理中,获得了高带侧的每个子带的高带子带信号。此外,已解码高带信号产生电路47执行上述公式(7),以获得每个高带子带信号的和并且产生已解码高带信号。已解码高带信号产生电路47将所获得的已解码高带信号提供给合成电路48,并且处理从步骤S217进行至步骤S218,然后解码处理结束。
在步骤S218中,合成电路48对来自低带解码电路42的已解码低带信号和来自已解码高带信号产生电路47的已解码高带信号合成,并且作为输出信号而输出。
如上所述,由于解码器40根据通过输入代码串的解复用获得的高带编码数据来获取系数索引,并且根据使用系数索引表示的已解码高带子带功率估计系数来计算已解码高带子带功率,所以可以提高高带子带功率的估计精确度。因此,可以产生具有高质量的音乐信号。
<4.第四实施例>
[编码器的编码处理]
首先,如上所述,对高带编码数据中仅包括系数索引的情况进行描述。然而,也可以包括其它信息。
例如,如果高带编码数据中包括系数索引,则向解码器40侧通知最接近实际高带信号的高带子带功率的已解码高带子带功率的已解码高带子带功率估计系数。
因此,从解码器40获得的已解码高带子带功率(估计值)和实际高带子带功率(真实值)产生基本上等于根据伪高带子带功率差计算电路36计算的伪高带子带功率差powerdiff(ib,J)的差。
本文中,如果高带编码数据中包括子带的伪高带子带功率差和系数索引,则解码器40侧大致获知关于实际高带子带功率的已解码高带子带功率的误差。如果是这样,则可以使用差来提高高带子带功率的估计精确度。
将参照图22和23的流程图来描述高带编码数据中包括伪高带子带功率差的情况下的编码处理和解码处理。
首先,将参照图22中的流程图对由图18中的编码器30执行的编码处理进行描述。此外,步骤S241至步骤S246的处理与图19中的步骤S181至步骤S186的处理相同。因此,省略其描述。
在步骤S247中,伪高带子带功率差计算电路36执行上述公式(15)的运算,以计算每个已解码高带子带功率估计系数的差的平方和E(J,id)。
此外,伪高带子带功率差计算电路36选择如下差的平方和:其中,该差的平方和被设置为差的平方和E(J,id)之中的差的平方和的最小值,并且伪高带子带功率差计算电路36将表示与该差的平方和对应的已解码高带子带功率估计系数的系数索引提供给高带编码电路37。
此外,伪高带子带功率差计算电路36将关于与所选择的残差的平方和对应的已解码高带子带功率估计系数获得的每个子带的伪高带子带功率差powerdiff(ib,J)提供给高带编码电路37。
在步骤S248中,高带编码电路37对从伪高带子带功率差计算电路36提供的伪高带子带功率差和系数索引进行编码,并且将根据该结果获得的高带编码数据提供给复用电路38。
因此,将在索引为sb+1至eb的高带侧的每个子带功率的伪高带子带功率差(即高带子带功率的估计差)提供给解码器40作为高带编码数据。
如果获得了高带编码数据,则此后执行步骤S249的编码处理,以结束编码处理。然而,步骤S249的处理与图19中的步骤S189的处理相同。因此,省略描述。
如上所述,如果高带编码数据中包括伪高带子带功率差,则在解码器40中可以提高高带子带功率的估计精度,并且可以获得具有良好质量的音乐信号。
[解码器的解码处理]
接着,将参考图23中的流程图对由图20中的解码器40执行的解码处理进行描述。此外,步骤S271至步骤S274的处理与图21中的步骤S211至步骤S214的处理相同。因此,将省略其描述。
在步骤S275中,高带解码电路45执行对从解复用电路41提供的高带编码数据的解码。此外,高带解码电路45将由通过解码获得的系数索引表示的已解码高带子带功率估计系数和通过解码获得的每个子带的伪高带子带功率差提供给已解码高带子带功率计算电路46。
在步骤S276中,已解码高带子带功率计算电路46基于从特征量计算电路44提供的特征量和从高带解码电路45提供的已解码高带子带功率估计系数216,计算已解码高带子带功率。此外,步骤S276与图21中的步骤S216具有相同的处理。
在步骤S277中,已解码高带子带功率计算电路46将从高带解码电路45提供的伪高带子带功率差与已解码高带子带功率相加,并且将相加的结果提供给已解码高带信号产生电路47作为最终的已解码高带子带功率。
也就是说,向所计算的每个子带的解码高带子带功率加上同一子带的伪高带子带功率差。
此外,之后,执行步骤S278和步骤S279的处理,并且终止解码处理。然而,步骤S278和步骤S279的处理与图21中的步骤S217和步骤S218的处理相同。因此,将省略其描述。
由此,解码器40根据通过对输入代码串进行解复用而获得的高带编码数据来获得系数索引和伪高带子带功率。此外,解码器40使用由系数索引表示的已解码高带子带功率估计系数和伪高带子带功率差来计算已解码高带子带功率。因此,可以提高高带子带功率的估计精度,并且可以再现具有高声音质量的音乐信号。
此外,可以考虑编码器30与解码器40之间产生的高带子带功率的估计值的差,即伪高带子带功率与已解码高带子带功率之间的差(下文中,称为设备间估计差)。
在这种情况下,例如,根据设备间差估计来对作为高带编码数据的伪高带子带功率差进行修正,并且,高带编码数据中包括设备间估计差,根据解码器40侧的设备间估计差来对伪高带子带功率差进行修正。此外,可以事先在解码器40侧记录设备间估计差,并且,解码器40可以通过将设备间估计差与伪高带子带功率差相加来进行修正。因此,可以获得接近实际高带信号的已解码高带信号。
<5.第五实施方式>
此外,在图18的编码器30中,描述了:伪高带子带功率差计算电路36使用差的平方和E(J,id)来从多个系数索引中选择最优索引。然而,电路可以通过使用与差的平方和不同的索引来选择系数索引。
例如,作为用于选择系数索引的索引,可以使用高带子带功率和伪高带子带功率的残差的均方值、最大值和平均值。在这种情况下,图18中的编码器30执行图24中的流程图所示的编码处理。
将参考图24中的流程图对使用编码器30的编码处理进行描述。此外,步骤S301至步骤S305的处理与图19中的步骤S181至步骤S185的处理相同。因此,将省略其描述。如果执行步骤S301至步骤S305的处理,则对于每K个已解码高带子带功率估计系数,计算每个子带的伪高带子带功率。
在步骤S306中,伪高带子带功率差计算电路36针对每K个已解码高带子带功率估计系数使用要处理的当前帧J来计算估计值Res(id,J)。
具体地,伪高带子带功率差计算电路36通过使用从子带分割电路33提供的每个子带的高带子带信号执行与以上描述的公式(1)相同的操作来计算帧J中的高带子带功率power(ib,J)。此外,在本发明的实施方式中,可以使用索引ib来区分高带子带信号与低带子带信号的所有子带。
如果获得了高带子带功率power(ib,J),则伪高带子带功率差计算电路36计算以下公式(16),并且计算残差均方值Resstd(id,J)。
[公式16]
Res std ( id , J ) = &Sigma; ib = sb + 1 eb { power ( ib , J ) - power est ( ib , id , J ) } 2 . . . ( 16 )
也就是说,关于索引为sb+1至eb的高带侧的每个子带获得高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,并且,差的平方和成为残差均方值Resstd(id,J)。此外,伪高带子带功率powerest(ib,id,J)表示关于索引为ib的已解码高带子带功率估计系数获得的、索引为ib的子带的帧J的伪高带子带功率。
接着,伪高带子带功率差计算电路36计算以下公式(17),并且计算残差最大值Resmax(id,J)。
[公式17]
Resmax(id,J)=maxib{|power(ib,J)-powerest(ib,id,J)|}
                                                         ···(17)
此外,在公式(17)中,maxib{|power(ib,J)-powerest(ib,id,J)|}表示索引为sb+1至eb的每个子带的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差的绝对值中的最大值。因此,将帧J中的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差的绝对值中的最大值设置为残差最大值Resmax(id,J)。
此外,伪高带子带功率差计算电路36计算以下公式(18),并且计算残差平均值Resave(id,J)。
[公式18]
Res ave ( id , J ) = I ( &Sigma; ib = sb + 1 eb { power ( ib , J ) - power est ( ib , id , J ) } )
/ ( eb - sb ) | . . . ( 18 )
也就是说,对于索引为sb+1至eb的高带侧的每个子带,获得了帧J的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,并且获得了差的和。此外,将通过把所获得的差的和除以高带侧的子带的数量(eb-sb)所获得的值的绝对值设置为残差平均值Resave(id,J)。残差平均值Resave(id,J)表示在考虑到符号的情况下每个子带的估计误差的平均值的大小。
此外,如果获得了残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J),则伪高带子带功率差计算电路36计算以下公式(19),并且计算最终估计值Res(id,J)。
[公式19]
Res(id,J)=Resstd(id,J)+Wmax×Resmax(id,J)+Wave×Resave(id,J)
                                                       ···(19)
也就是说,将残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)加权相加,并且设置为最终估计值Res(id,J)。此外,在公式(19)中,Wmax和Wave是预定权值,例如,Wmax=0.5,Wave=0.5。
伪高带子带功率差计算电路36执行以上处理,并且针对K个已解码高带子带功率估计系数即K个系数索引id中的每个,计算估计值Res(id,J)。
在步骤S307中,伪高带子带功率差计算电路36基于所获得的系数索引id中的每个的估计值Res(id,J),选择系数索引id。
通过上述处理获得的估计值Res(id,J)示出了根据实际高带信号计算的高带子带功率与使用系数索引为id的已解码高带子带功率估计系数计算的伪高带子带功率之间的相似度。也就是说,表示高带分量的估计误差的大小。
因而,当评价值Res(id,J)变小时,通过使用已解码高带子带功率估计系数的操作获得了更接近实际高带信号的已解码高带信号。因此,伪高带子带功率差计算电路36选择被设置为K个估计值Res(id,J)中的最小值的估计值,并且将表示与该估计值对应的已解码高带子带功率估计系数的系数索引提供给高带编码电路37。
如果系数索引被输出给高带编码电路37,则之后,执行步骤S308和步骤S309的处理,终止编码处理。然而,由于这些处理与图19中的步骤S188和步骤S189的处理相同,因此,将省略其描述。
如上所述,在编码器30中,使用通过使用残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)计算出的估计值Res(id,J),并且,选择最优已解码高带子带功率估计系数的系数索引。
如果使用估计值Res(id,J),则由于能够使用与使用差的平方和的情况相比更多的估计标准来评价高带子带功率的估计精度,所以,可以选择更合适的已解码高带子带功率估计系数。因此,在使用时,解码器40接收输出代码串的输入,可以获得已解码高带子带功率估计系数,其通常适合于频带扩展处理和具有更高声音质量的信号。
<修改示例1>
此外,如果针对输入信号的每个帧执行上述编码处理,则可能存在如下情况:在输入信号的高带侧的每个子带的高带子带功率的时间变化很小的固定区域中选择每个连续帧中的不同的系数索引。
也就是说,由于每个帧的高带子带功率在构成输入信号的固定区域的连续帧中几乎具有相同的值,所以,应当在它们的帧中持续选择相同的系数索引。然而,连续帧的一部分中的每个帧的所选系数索引变化,并且从而解码器40侧再现的语音的高带分量会不再固定。如果是这样,则再现的声音中出现听觉不一致。
因而,如果在编码器30中选择系数索引,则可以考虑时间上之前的帧中的高带分量的估计结果。在这种情况下,图18中的编码器30执行图25中的流程图所示的编码处理。
如下所述,将参考图25中的流程图对由编码器30执行的编码处理进行描述。此外,步骤S331至步骤S336的处理与图24中的步骤S301至步骤S306的处理相同。因此,将省略其描述。
在步骤S337中,伪高带子带功率差计算电路36使用之前的帧和当前帧来计算估计值ResP(id,J)。
具体地,伪高带子带功率差计算电路36关于时间上早于要处理的帧J一帧的帧J-1记录通过最终选择的系数索引的已解码高带子带功率估计系数获得的每个子带的伪高带子带功率。本文中,最终选择的系数索引称为通过使用高带编码电路37进行编码而输出给解码器40的系数索引。
如下所述,具体地,将在帧(J-1)中选择的系数索引id设置为idselected(J-1)。此外,将通过使用系数索引idselected(J-1)的已解码高带子带功率估计系数获得的系数为ib(其中,sb+1≤ib≤eb)的子带的伪高带子带功率持续解释为powerest(ib,idselected(J-1),J-1)。
伪高带子带功率差计算电路36首先计算以下公式(20),接着计算估计残差均方值ResPstd(id,J)。
[公式20]
ResP std ( id , J ) = &Sigma; ib = sb + 1 eb { power est ( ib , id selected ( J - 1 ) , J - 1 )
- power est ( ib , id , J ) } 2 . . . ( 20 )
也就是说,关于索引为sb+1至eb的高带侧的每个子带获得帧J的伪高带子带功率powerest(ib,id,J)与帧J-1的伪高带子带功率powerest(ib,idselected(J-1),J-1)之间的差。此外,将其差的平方和设置为估计误差均方值ResPstd(id,J)。此外,伪高带子带功率powerest(ib,id,J)示出了关于系数索引为id的已解码高带子带功率估计系数获得的索引为ib的子带的帧(J)的伪高带子带功率。
由于该估计残差均方值ResPstd(id,J)是时间上连续的帧之间的伪高带子带功率的差的平方和,估计残差均方值ResPstd(id,J)越小,高带分量的估计值的时间变化越小。
接着,伪高带子带功率差计算电路36计算以下公式(21),并且计算估计残差最大值ResPmax(id,J)。
[公式21]
ResPmax(id,J)=maxib{|powerest(ib,idselected(J-1),J-1)-powerest(ib,id,J)|}              ···(21)
此外,在公式(21)中,maxib{|powerest(ib,idselected(J-1),J-1)-powerest(ib,id,J)|}表示索引为sb+1至eb的每个子带的伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差的最大绝对值。因此,将在时间上连续的帧之间的差的绝对值的最大值设置为估计残差最大值ResPmax(id,J)。
估计残差最大值ResPmax(id,J)越小,连续的帧之间的高带分量的估计结果越接近。
如果获得了估计残差最大值ResPmax(id,J),则接着,伪高带子带功率差计算电路36计算以下公式(22),并且计算估计残差平均值ResPave(id,J)。
[公式22]
ResP ave ( id , J ) = I ( &Sigma; ib = sb + 1 eb { power est ( ib , id selected ( J - 1 ) , J - 1 ) )
- power est ( ib , id , J ) } ) / ( eb - sb ) | . . . ( 22 )
也就是说,关于索引为sb+1至eb的高带侧的每个子带,获得了帧(J-1)的伪高带子带功率powerest(ib,idselected(J-1),J-1)与帧J的伪高带子带功率powerest(ib,id,J)之间的差。此外,将通过用每个子带的差的和除以高带侧的子带数(eb-sb)获得的值的绝对值设置为估计残差平均值ResPave(id,J)。估计残差平均值ResPave(id,J)示出了在考虑符号的情况下帧之间的子带的估计值的差的平均值的大小。
此外,如果获得了估计残差均方值ResPstd(id,J)、估计残差最大值ResPmax(id,J)和估计残差平均值ResPave(id,J),则伪高带子带功率差计算电路36计算以下公式(23),并且计算平均值ResP(id,J)。
[公式23]
ResP(id,J)=ResPstd(id,J)+Wmax×ResPmax(id,J)+Wave×ResPave(id,J)                   ···(23)
也就是说,将估计残差均方值ResPstd(id,J)、估计残差最大值ResPmax(id,J)和估计残差平均值ResPave(id,J)加权相加,并且设置为估计值ResP(id,J)。此外,在公式(23)中,Wmax和Wave是预定权值,例如,Wmax=0.5,Wave=0.5。
因此,如果使用之前的帧和当前帧计算了估计值ResP(id,J),则处理从步骤S337继续进行至S338。
在步骤S338中,伪高带子带功率差计算电路36计算公式(24),并且计算最终估计值Resall(id,J)。
[公式24]
Resall(id,J)=Res(id,J)+Wp(J)×ResP(id,J)     ···(24)
也就是说,将所获得的估计值Res(id,J)与估计值ResP(id,J)加权相加。此外,在公式(24)中,例如,Wp(J)为通过以下公式(25)限定的权值。
[公式25]
Figure BDA00002229069500501
此外,公式(25)中的powerr(J)是由以下公式(26)限定的值。
[公式26]
power r ( J ) = ( &Sigma; ib = sb + 1 eb { power ( ib , J ) - power ( ib , J - 1 ) } 2 ) / ( eb - sb ) . . . ( 26 )
该powerr(J)示出了帧(J-1)与帧(J)的高带子带功率之间的差的平均值。此外,根据公式(25),当powerr(J)为0附近的预定范围内的值时,powerr(J)越小,Wp(J)越接近1,当powerr(J)大于预定范围值时,其被设置为0。
这里,当powerr(J)为0附近的预定范围内的值时,连续的帧之间的高带子带功率的差的平均值在一定程度上变小。也就是说,输入信号的高带分量的时间变化很小,并且,输入信号的当前帧变为稳定区域。
当输入信号的高带分量稳定时,权值Wp(J)变为接近1的值,而当高带分量不稳定时,权值Wp(J)变为接近0的值。因此,在公式(24)所示的估计值Resall(id,J)中,当输入信号的高带分量的时间变化变小时,在将高带分量的估计结果和比较结果认为是之前的帧的评价标准的情况下,估计值ResP(id,J)的确定的系数变大。
因此,在输入信号的稳定区域内,选择在之前的帧中的高带分量的估计结果的附近获得的已解码高带子带功率估计系数,在解码器40侧,可以更自然地再现具有高质量的声音。然而,在输入信号的非稳定区域,估计值Resall(id,J)中的估计值ResP(id,J)的项被设置为0,并且,获得了接近实际高带信号的已解码高带信号。
伪高带子带功率差计算电路36通过执行上述处理来计算K个已解码高带子带功率估计系数中的每个的估计值Resall(id,J)。
在步骤S339中,伪高带子带功率差计算电路36基于所获得的每个已解码高带子带功率估计系数的估计值Resall(id,J)来选择系数索引id。
从上述处理获得的估计值Resall(id,J)使用权值线性地组合估计值Res(id,J)和估计值ResP(id,J)。如上所述,估计值Res(id,J)越小,可以获得越接近实际高带信号的已解码高带信号。此外,估计值ResP(id,J)越小,可以获得越接近之前的帧的已解码高带信号的已解码高带信号。
因此,估计值Resall(id,J)越小,获得更合适的已解码高带信号。因此,伪高带子带功率差计算电路36选择K个估计值Resall(id,J)中的具有最小值的估计值,并且将表示与该估计值对应的已解码高带子带功率估计系数的系数索引提供给高带编码电路37。
如果选择了系数索引,则之后,执行步骤S340和步骤S341的处理,以完成编码处理。然而,由于这些处理与图24中的步骤S308和步骤S309的处理相同,因此,将省略其描述。
如上所述,在编码器30中,使用通过对估计值Res(id,J)和估计值ResP(id,J)进行线性组合所获得的估计值Resall(id,J),使得能够选择最优已解码高带子带功率估计系数的系数索引。
如果使用估计值Resall(id,J),则与使用估计值Res(id,J)的情况相同,可以根据更多的估计标准来选择更合适的已解码高带子带功率估计系数。然而,如果使用估计值Resall(id,J),则可以对要在解码器40中再现的信号的高带分量的稳定区域内的时间变化进行控制,并且可以获得具有高质量的信号。
<修改示例2>
以这种方式,在频带扩展处理中,如果期望获得具有高质量的声音,则低带侧的子带的能听度也很重要。也就是说,在当接近低带侧的子带的估计精度变大时的高带侧的子带中,可以再现具有高质量的声音。
本文中,当关于每个已解码高带子带功率估计系数计算估计值时,可以对低带侧的子带设置权值。在这种情况下,图18中的编码器30执行图26中的流程图所示的编码处理。
下文中,将参考图26的流程图来对由编码器30执行的编码处理进行描述。此外,步骤S371至步骤S375的处理与图25中的步骤S331至步骤S335的处理相同。因此,将省略其描述。
在步骤S376中,伪高带子带功率差计算电路36使用要处理的当前帧J针对K个已解码高带子带功率估计系数的中的每个计算估计值ResWband(id,J)。
具体地,伪高带子带功率差计算电路36使用从子带分割电路33提供的每个子带的高带子带信号执行与上述公式(1)相同的操作来计算帧J中的高带子带功率power(ib,J)。
如果获得了高带子带功率power(ib,J),则伪高带子带功率差计算电路36计算以下公式(27),并且计算残差均方值ResstdWband(id,J)。
[公式27]
Res std W band ( ib , J ) = &Sigma; ib = sb + 1 eb { W band ( ib ) &times; { power ( ib , J )
- power est ( ib , id , J ) } } 2 . . . ( 27 )
也就是说,针对索引为sb+1至eb的高带侧的每个子带,获得帧(J)的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,并且将该差乘以每个子带的权值Wband(ib)。此外,将与权值Wband(ib)相乘的差的平方和设置为残差均方值ResstdWband(id,J)。
本文中,权值Wband(ib)(其中,sb+1≤ib≤eb)由以下公式(28)来限定。例如,权值Wband(ib)的值变为与低带侧的子带一样大。
[公式28]
W band ( ib ) = - 3 &times; ib 7 + 4 . . . ( 28 )
接着,伪高带子带功率差计算电路36计算残差最大值ResmaxWband(id,J)。具体地,将索引为sb+1至eb的每个子带的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wband(ib)获得的值的绝对值的最大值设置为残差最大值ResmaxWband(id,J)。
此外,伪高带子带功率差计算电路36计算残差平均值ResaveWband(id,J)。
具体地,在索引为sb+1至eb的每个子带中,获得高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,并且从而乘以权值Wband(ib),使得获得乘以权值Wband(ib)的差的总和。此外,将通过将所获得的差的总和除以高带侧的子带数量(eb-sb)而获得的值的绝对值设置为残差平均值ResaveWband(id,J)。
此外,伪高带子带功率差计算电路36计算评价值ResWband(id,J)。也就是说,将残差均方值ResstdWband(id,J)、乘以权值(Wmax)的残差最大值ResmaxWband(id,J)、乘以权值(Wave)的残差平均值ResaveWband(id,J)之和设置为平均值ResWband(id,J)。
在步骤S377中,伪高带子带功率差计算电路36使用之前的帧和当前帧计算平均值ResPWband(id,J)。
具体地,伪高带子带功率差计算电路36关于比要处理的帧(J)在时间上早一帧的帧(J-1)对通过使用最终选择的系数索引的已解码高带子带功率估计系数获得的每个子带的伪高带子带功率进行记录。
伪高带子带功率差计算电路36首先计算估计残差平均值ResstdWband(id,J)。也就是说,对于索引为sb+1至eb的高带侧的每个子带,将获得的伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wband(ib)。此外,将用于计算权值Wband(ib)的差的平方和设置为估计残差平均值ResPstdWband(id,J)。
接着,伪高带子带功率差计算电路36计算估计残差最大值ResmaxWband(id,J)。具体地,将通过将索引为sb+1至eb的每个子带的伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wband(ib)获得的绝对值的最大值设置为估计残差最大值ResPmaxWband(id,J)。
接着,伪高带子带功率差计算电路36计算估计残差平均值ResPaveWband(id,J)。具体地,针对索引为sb+1至eb的每个子带,获取伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差,并且乘以权值Wband(ib)。此外,乘以权值Wband(ib)的差的总和为通过将其除以高带侧的子带的数量(eb-sb)获得的值的绝对值。然而,将其设置为估计残差平均值ResPaveWband(id,J)。
此外,伪高带子带功率差计算电路36获得乘以权值Wmax的估计残差最大值ResPmaxWband(id,J)的估计残差均方值ResPstdWband(id,J)与乘以权值Wave的估计残差平均值ResPaveWband(id,J)之和,并且将该和设置为估计值ResPWband(id,J)。
在步骤S378中,伪高带子带功率差计算电路36将评价值ResWband(id,J)与乘以公式(25)的权值Wp(J)的估计值ResPWband(id,J)相加,以计算最终估计值ResallWband(id,J)。针对K个已解码高带子带功率估计系数中的每个,计算该估计值ResallWband(id,J)。
此外,之后,执行步骤S379至步骤S381的处理,以终止编码处理。然而,由于它们的处理与图25中的步骤S339至步骤S341的处理相同,所以,将省略其描述。此外,在步骤S379中,将估计值ResallWband(id,J)选择为K个系数索引中的最小值。
如上所述,为了对低带侧的子带进行加权,可以通过提供每个子带的权值来在解码器40侧获得具有高质量的声音。
此外,如上所述,已经将已解码高带子带功率估计系数的数量的选择描述为基于估计值ResallWband(id,J)来执行。然而,也可以基于估计值ResWband(id,J)来选择已解码高带子带功率估计系数。
<修改示例3>
此外,由于人的听觉具有适当地感知幅度(功率)的较大频带的属性,因此,计算每个已解码高带子带功率估计系数的估计值,使得可以对具有较大功率的子带进行加权。
在这种情况下,图18中的编码器30执行图27中的流程图所示的编码处理。将参考图27的流程图来对由编码器30执行的编码处理进行描述。此外,由于步骤S401至步骤S405的处理与图25中的步骤S331至步骤S335的处理相同,所以将省略其描述。
在步骤S406中,伪高带子带功率差计算电路36针对K个已解码高带子带功率估计系数使用要处理的当前帧J来计算估计值ResWpower(id,J)。
具体地,伪高带子带功率差计算电路36通过使用从子带分割电路33提供的每个子带的高带子带信号执行与以上描述的公式(1)相同的操作来计算帧J中的高带子带功率power(ib,J)。
如果获得了高带子带功率power(ib,J),则伪高带子带功率差计算电路36计算以下公式(29),并且计算残差均方值ResstdWpower(id,J)。
[公式29]
Res std W power ( id , J ) = &Sigma; ib = sb + 1 eb { W power ( power ( ib , J ) )
&times; { power ( ib , J ) - power est ( ib , id , J ) } 2 . . . ( 29 )
也就是说,关于索引为sb+1至eb的高带侧的每个子带,获得高带子带功率powerest(ib,J)与伪高带子带功率powers(ib,id,J)之间的差,并且将该差乘以每个子带的权值Wpower(power(ib,J))。此外,将与权值Wpower(power(ib,J))相乘的差的平方和设置为残差均方值ResstdWpower(id,J)。
本文中,例如,权值Wpower(power(ib,J))(其中,sb+1≤ib≤eb)由以下公式(30)来限定。当子带的高带子带功率power(ib,J)变大时,权值Wpower(power(ib,J))的值变大。
[公式30]
W power ( power ( ib , J ) ) = 3 &times; power ( ib , J ) 80 + 35 8 . . . ( 30 )
接着,伪高带子带功率差计算电路36计算残差最大值ResmaxWpower(id,J)。具体地,将索引为sb+1至eb的每个子带的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wpower(power(ib,J))获得的值的绝对值的最大值设置为残差最大值ResmaxWpower(id,J)。
此外,伪高带子带功率差计算电路36计算残差平均值ResaveWpower(id,J)。
具体地,在索引为sb+1至eb的每个子带中,获得高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,乘以权值Wpower(power(ib,J)),并且获得乘以权值Wpower(power(ib,J))的差的总和。此外,将通过将所获得的差的总和除以高带侧的子带数量(eb-sb)而获得的值的绝对值设置为残差平均值ResaveWpower(id,J)。
此外,伪高带子带功率差计算电路36计算估计值ResWpower(id,J)。也就是说,将残差均方值ResstdWpower(id,J)、乘以权值(Wmax)的残差最大值ResmaxWpower(id,J)、乘以权值(Wave)的残差均值ResaveWpower(id,J)之和设置为估计值ResWpower(id,J)。
在步骤S407中,伪高带子带功率差计算电路36使用之前的帧和当前帧计算估计值ResPWpower(id,J)。
具体地,伪高带子带功率差计算电路36关于在时间上比要被处理的帧(J)早一帧的帧(J-1)对通过使用最终选择的系数索引的已解码高带子带功率估计系数获得的每个子带的伪高带子带功率进行记录。
伪高带子带功率差计算电路36首先计算估计残差均方值ResPstdWpower(id,J)。也就是说,关于索引为sb+1至eb的高带侧的每个子带,获取伪高带子带功率powerest(ib,id,J)与伪高带子带功率powerest(ib,idselected(J-1),J-1)之间的差,并且将该差乘以权值Wpower(power(ib,J))。将乘以权值Wpower(power(ib,J))的差的平方和设置为估计残差均方值ResPstdWpower(id,J)。
接着,伪高带子带功率差计算电路36计算估计残差最大值ResPmaxWpower(id,J)。具体地,将索引为sb+1至eb的每个子带的伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wpower(power(ib,J))获得的值的最大值的绝对值设置为估计残差最大值ResPmaxWpower(id,J)。
接着,伪高带子带功率差计算电路36计算估计残差平均值ResPaveWpower(id,J)。具体地,针对索引为sb+1至eb的每个子带,获取伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差,并且乘以权值Wpower(power(ib,J))。此外,将与权值Wpower(power(ib,J))相乘的差的总和除以高带侧的子带的数量(eb-sb)获得的值的绝对值设置为估计残差平均值ResPaveWpower(id,J)。
此外,伪高带子带功率差计算电路36获得估计残差均方值ResPstdWpower(id,J)、乘以权值(Wmax)的估计残差最大值ResPmaxWpower(id,J)与乘以权值(Wave)的估计残差平均值ResPaveWpower(id,J)之和,并且将该和设置为估计值ResPWpower(id,J)。
在步骤S408中,伪高带子带功率差计算电路36将估计值ResWpower(id,J)与乘以公式(25)的权值WP(J)的估计值ResPWpower(id,J)相加,以计算最终估计值ResallWpower(id,J)。根据K个已解码高带子带功率估计系数中的每个,计算该估计值ResallWpower(id,J)。
此外,之后,执行步骤S409至步骤S411的处理,以终止编码处理。然而,由于它们的处理与图25中的步骤S339至步骤S341的处理相同,所以,将省略其描述。此外,在步骤S409中,在K个系数索引中选择其中估计值ResallWpower(id,J)被设置为最小值的系数索引。
如上所述,为了对大功率的子带进行加权,可以通过提供每个子带的权值来在解码器40侧获得具有高质量的声音。
此外,如上所述,已经将已解码高带子带功率估计系数的选择描述为基于估计值ResallWpower(id,J)来进行。然而,也可以基于估计值ResWpower(id,J)来选择已解码高带子带功率估计系数。
<6.第六实施方式>
[系数学习装置的配置]
顺便一提,对应于系数索引,在图20的解码器40中记录作为已解码高带子带功率估计系数的一组系数Aib(kb)和系数Bib。例如,如果在解码器40中记录系数索引128的已解码高带子带功率估计系数,则需要大的区域作为记录区域,如用于记录其已解码高带子带功率估计系数的存储器。
本文中,将若干已解码高带子带功率估计系数中的一部分设置为公共系数,并且,可以使得记录已解码高带子带功率估计系数所需要的记录区域较小。在这种情况下,如图28所示对通过学习已解码高带子带功率估计系数获得的系数学习装置进行配置。
系数学习装置81包括子带分割电路91、高带子带功率计算电路92、特征量计算电路93和系数估计电路94。
多个系数学习装置81中设置有用于学习的多个乐曲数据,作为宽带教学信号。宽带教学信号是包括有低带的多个子带分量和高带的多个子带分量的信号。
子带分割电路91包括带通滤波器等,将所提供的宽带教学信号分割成多个子带信号并且将其提供给高带子带功率计算电路92和特征量计算电路93。具体地,将索引为sb+1至eb的高带侧的每个子带的高带子带信号提供给高带子带功率计算电路92,并且将索引为sb-3至sb的低带侧的每个子带的低带子带信号提供给特征量计算电路93。
高带子带功率计算电路92计算从子带分割电路91提供的每个高带子带信号的高带子带功率,并且将其提供给系数估计电路94。特征量计算电路93基于从子带分割电路91提供的每个低带子带信号,计算低带子带功率,作为特征量,并且将其提供给系数估计电路94。
系数估计电路94通过使用来自高带子带功率计算电路92的高带子带功率和来自特征量计算电路93的特征量执行回归分析来产生已解码高带子带功率估计系数,并且将其输出给解码器40。
[对系数学习处理的描述]
接着,将参考图29中的流程图对由系数学习装置81执行的系数学习处理进行描述。
在步骤S431中,子带分割电路91将所提供的多个宽带教学信号中的每个分割成多个子带信号。此外,子带分割电路91将索引为sb+1至eb的子带的高带子带信号提供给高带子带功率计算电路92,并且将索引为sb-3至sb的子带的低带子带信号提供给特征量计算电路93。
在步骤S432中,高带子带功率计算电路92对于从子带分割电路91提供的每个高带子带信号通过执行与上述公式(1)相同的操作来计算高带子带功率,并将其提供给系数估计电路94。
在步骤S433中,特征量计算电路93对于从子带分割电路91提供的每个低带子带信号通过执行上述公式(1)的操作来计算低带子带功率,作为特征量,并将其提供给系数估计电路94。
因而,关于多个宽带教学信号的每个帧,将高带子带功率和低带子带功率提供给系数估计电路94。
在步骤S434中,系数估计电路94对于索引为sb+1至eb的高带的每个子带ib(其中,sb+1≤ib≤eb)通过使用最小二乘法执行回归分析来计算系数Aib(kb)和系数Bib
在回归分析中,假定从特征量计算电路93提供的低带子带功率为解释变量,从高带子带功率计算电路92提供的高带子带功率为被解释变量。此外,使用构成提供给系数学习装置81的整个宽带教学信号的整个帧的低带子带功率和高带子带功率来执行回归分析。
在步骤S435中,系数估计电路94使用每个获得的子带ib的系数Aib(kb)和系数Bib获得宽带教学信号的每个帧的残差矢量。
例如,系数估计电路94对于帧J的每个子带ib(其中,sb+1≤ib≤eb)通过从高带功率(power(ib,J))减去系数Aib(kb)乘以低带子带功率power(kb,J)(其中,sb-3≤kb≤sb)的总和与系数Bib的和来获得残差。此外,将包括有帧J的每个子带ib的残差的矢量设置为残差矢量。
此外,关于构成提供给系数学习装置81的宽带教学信号的帧,计算残差矢量。
在步骤S436中,系数估计电路94对关于每个帧获得的残差矢量进行归一化。例如,针对每个子带ib,系数估计电路94通过获取整个帧的残差矢量的子带ib的残差方差并且将每个残差矢量中的子带ib的残差除以方差的平方根来对残差矢量进行归一化。
在步骤S437中,系数估计电路94通过k平均方法等对整个归一化的帧的残差矢量进行聚类。
例如,将在使用系数Aib(kb)和系数Bib执行对高带子带功率的估计时获得的整个帧的平均频率包络称为平均频率包络SA。此外,假定功率大于平均频率包络SA的预定频率包络为频率包络SH,并且,功率小于平均频率包络SA的预定频率包络为频率包络SL。
在这种情况下,其中获得了接近平均频率包络SA、频率包络SH和频率包络SL的频率包络的系数的每个残差矢量执行残差矢量的聚类,以使其包括在簇CA、簇CH和簇CL中。也就是说,每个帧的残差矢量执行聚类,以包括在簇CA、簇CH或簇CL中的任一个中。
在用于基于低带分量和高带分量的相关性估计高带分量的频带扩展处理中,就这方面而言,如果使用从回归分析获得的系数Aib(kb)和系数Bib来计算残差矢量,则残差随着高带侧的子带增大而增多。因此,对残差矢量进行聚类而不改变,进行高带侧的子带的数量的次数的加权,以执行处理。
相反,在系数学习装置81中,通过对残差矢量以作为子带的残差的方差进行归一化,使每个子带的残差的方差明显相等,并且,可以通过将相等的权值提供给每个子带来执行聚类。
在步骤S438中,系数估计电路94选择簇CA、簇CH和簇CL中的任意一个作为要处理的簇。
在步骤S439中,系数估计电路94通过使用包括在被选择作为要处理的簇的簇中的残差矢量的帧进行回归分析来计算每个子带ib(其中,sb+1≤ib≤eb)的系数Aib(kb)和系数Bib
也就是说,如果包括在要处理的簇中的残差矢量的帧被称为要处理的帧,则将要处理的整个帧的低带子带功率和高带子带功率设置为解释变量和被解释变量,并且执行使用最小二乘法的回归分析。因而,获得了每个子带ib的系数Aib(kb)和系数Bib
在步骤S440中,系数估计电路94关于要处理的整个帧使用通过步骤S439的处理获得的系数Aib(kb)和系数Bib来获得残差矢量。此外,在步骤S440中,执行与步骤S435相同的处理,并且从而获得每个要处理的帧的残差矢量。
在步骤S441中,系数估计电路94通过执行与步骤S436相同的处理来对通过步骤S440的处理获得的每个要处理的帧的残差矢量进行归一化。也就是说,通过用残差除以每个子带的方差来执行对残差矢量的归一化。
在步骤S442中,系数估计电路94使用k平均方法等对要处理的整个归一化的帧的残差矢量进行聚类。簇的数量限定如下。例如,在系数学习装置81中,当产生了128个系数索引的已解码高带子带功率估计系数时,将128乘以要处理的帧的数量,并且将通过除以整个帧的数量获得的数设置为簇数量。本文中,整个帧的数量称为提供给系数学习装置81的宽带教学信号的整个帧之和。
在步骤S443中,系数估计电路94获得通过步骤S442的处理获得的每个簇的重心矢量。
例如,通过步骤S442的聚类获得的簇与系数索引对应,并且,在系数学习装置81中,将系数索引分配给每个簇,以获得每个系数索引的已解码高带子带功率估计系数。
具体地,在步骤S438中,假定选择簇CA作为要处理的簇,并且,通过步骤S442的聚类来获得F个簇。当关注F个簇中的一个簇CF时,将簇CF的系数索引的已解码高带子带功率估计系数设置为系数Aib(kb),其中,在步骤439中关于簇CA获得的系数Aib(kb)为线性相关项。此外,将关于从步骤S443获得的簇CF的重心矢量在步骤S441处执行的归一化的逆处理(逆归一化)的矢量与在步骤S439中获得的系数Bib之和设置为作为已解码高带子带功率估计系数的常数项的系数Bib。将逆归一化设置为乘以在如在步骤S441处执行的归一化将每个子带的残差除以方差的平方根时关于簇CF的重心矢量的每个元素归一化的相同值(每个子带的平方根)的处理。
也就是说,将在步骤S439处获得的系数Aib(kb)和所述获得的系数Bib设置为簇CF的系数索引的已解码高带子带功率估计系数。因而,通过聚类获得的F个簇中的每个共同具有关于簇CA获得的系数Aib(kb)作为已解码高带子带功率估计系数的线性关联项。
在步骤S444中,系数学习装置81确定是否对簇CA、簇CH和簇CL的整个簇作为要处理的簇进行处理。此外,在步骤S444中,如果确定不对整个簇进行处理,则处理返回步骤S438,并且重复所述处理。也就是说,选择下一个簇作为要处理的簇,并且计算已解码高带子带功率估计系数。
相反,在步骤S444中,如果确定对整个簇进行处理,则由于计算了要获得的预定数量的已解码高带子带功率,因此,处理继续进行至步骤S445。
在步骤S445中,系数估计电路94将所获得的系数索引和已解码高带子带功率估计系数输出给解码器40,并且从而系数学习处理终止。
例如,在输出给解码器40的已解码高带子带功率估计系数中,存在若干相同的系数Aib(kb)作为线性相关项。本文中,系数学习装置81使作为指出系数Aib(kb)的信息的线性相关项索引(指针)与其共同的系数Aib(kb)对应,并且学习装置81使作为线性相关索引的系数Bib和常数项与系数索引对应。
此外,系数学习装置81将相应的线性相关项索引(指针)和系数Aib(kb)以及相应的系数索引和线性相关索引(指针)和系数Bib提供给解码器40,并且将它们记录在解码器40的高带解码电路45中的存储器中。与此类似,当记录多个已解码高带子带功率估计系数时,如果关于共同线性相关项,线性相关项索引(指针)存储在每个已解码高带子带功率估计系数的记录区域中,则可以显著缩小记录区域。
在这种情况下,由于线性相关项索引和系数Aib(kb)记录在高带解码电路45中的存储器中以彼此对应,所以,根据系数索引来获得线性相关项索引和系数Bib,并且,从而可以根据线性相关项索引获得系数Aib(kb)。
此外,根据申请人的分析的结果,即使在三模式程度上使多个已解码高带子带功率估计系数的线性相关项公用,已知,几乎不会出现进行频带扩展处理的声音的能听度的声音质量的恶化。因此,系数学习装置81可以缩小记录已解码高带子带功率估计系数所需要的记录区域,而没有使频带扩展处理之后的声音的声音质量恶化。
如上所述,系数学习装置81根据所提供的宽带教学信号来产生每个系数索引的已解码高带子带功率估计系数,并且输出所产生的系数。
此外,在图29的系数学习处理中,描述对残差矢量进行归一化。然而,在步骤S436和步骤S441中的一个或两个步骤中可以不执行对残差矢量的归一化。
此外,执行对残差矢量的归一化,并且从而可以不执行对已解码高带子带功率估计系数的线性相关项的公用化。在这种情况下,在步骤S436中执行归一化处理,并且接着,在与要获得的已解码高带子带功率估计系数相同的数量的簇中对已归一化残差矢量进行聚类。此外,使用每个簇中所包括的残差的帧来执行对每个簇的回归分析,并且产生每个簇的已解码高带子带功率估计系数。
<7.第七实施方式>
[关于系数表的共享]
顺便提及,在以上描述中,已经描述了:为了获得索引为ib(其中,sb+1≤ib≤eb)的高带侧的子带ib的高带子带信号,使用系数Aib(sb-3)至Aib(kb)和系数Bib作为解码高带子带功率估计系数。
由于高带分量包括子带sb+1至eb的(eb-sb)个子带,所以,为了获得包括有各个子带的高带子带信号的已解码高带信号,需要例如图30所示的系数组。
也就是说,图30的最上一行中的系数Asb+1(sb-3)至Asb+1(sb)为乘以低带侧的子带sb-3至sb的各个低带子带功率以获得子带sb+1的解码高带子带功率的系数。此外,图的最上一行中的系数Bsb+1为用于获取子带sb+1的解码高带子带功率的低带子带功率的线性组合的常数项。
类似地,图的最下一行中的系数Aeb(sb-3)至Aeb(sb)为乘以低带侧的子带sb-3至sb的各个低带子带功率以获得子带eb的解码高带子带功率的系数。此外,图的最下一行中的系数Beb为用于获取子带eb的解码高带子带功率的低带子带功率的线性组合的常数项。
以这种方式,在编码器30和解码器40中,事先记录5×(eb-sb)个系数组作为由一个系数索引指出的解码高带子带功率估计系数。下文中,将作为解码高带子带功率估计系数的这些5×(eb-sb)个系数组称为系数表。
例如,当尝试获得包括有多于(eb-sb)个子带的已解码高带信号时,图30所示的系数表缺少系数,因此,不能适当地获得已解码高带信号。相反,当尝试获得包括有少于(eb-sb)个子带的已解码高带信号时,图30所示的系数表具有许多冗余的系数。
因此,在编码器30和解码器40中,应当事先记录对应于构成已解码高带信号的子带的个数的很多系数表,从而,存在如下情况:记录系数表的记录区域的大小增加。
因此,通过记录用于获取预定数量的子带的已解码高带信号的系数表并且扩展或者减少系数表,可以处理具有不同数量的子带的已解码高带信号。
具体地,例如,假定编码器30和解码器40中记录索引eb=sb+8的情况下的系数表。在这种情况下,当使用构成系数表的各个系数时,可以获得具有8个子带的已解码高带信号。
在此,例如,如图31的左侧所示,当尝试获得包括有子带sb+1至sb+10的10个子带的已解码高带信号时,记录在编码器30和解码器40中的系数表缺少系数。也就是说,缺少子带sb+9和sb+10的系数Aib(kb)和Bib
因此,当如图右侧所示通过使用高带侧有8个子带的情况下的系数表来扩展系数表时,可以合适地获得包括有10个子带的已解码高带信号。在此,在图中,水平轴表示频率,竖直轴表示功率。此外,图的左侧示出了输入信号的各个频率分量,竖直方向上的线表示高带侧的各个子带的边界位置。
在图31的示例中,使用作为解码高带子带功率估计系数的子带sb+8的系数Asb+8(sb-3)到Asb+8(sb)和系数Bsb+8,作为子带sb+9和sb+10的系数,而没有任何变化。
也就是说,在系数表中,子带sb+8的系数Asb+8(sb-3)至Asb+8(sb)和系数Bsb+8被复制并且用作子带sb+9的系数Asb+9(sb-3)至Asb+9(sb)和系数Bsb+9,而没有任何变化。类似地,在系数表中,子带sb+8的系数Asb+8(sb-3)至Asb+8(sb)和系数Bsb+8被复制并且用作子带sb+10的系数Asb+10(sb-3)至Asb+10(sb)和系数Bsb+10,而没有任何变化。
以这种方式,当对系数表进行扩展时,将系数表中具有最高频率的子带的系数Aib(kb)和Bib用作不足的子带的系数,而没有任何变化。
此外,即使如子带sb+9和sb+10的高带分量的具有高频率的子带的分量的估计精度恶化到某种程度,在包括有已解码高带信号和已解码低带信号的输出信号的再现的过程中,能听度没有恶化。
此外,对系数表的扩展不限于复制具有最高频率的子带的系数Aib(kb)和Bib并且将复制的系数设置为其它子带的系数的示例。系数表的某些子带的系数可以被复制并且设置为要扩展(缺少)的子带的系数。此外,要复制的系数不限于一个子带的系数。多个子带的系数可以被复制并且分别设置为要扩展的多个子带的系数。此外,可以基于某些子带的系数来计算要扩展的子带的系数。
另一方面,例如,假定编码器30和解码器40中记录索引为eb=sb+8的情况下的系数表,并且,例如,如图32的左侧所示,产生包括有6个子带的已解码高带信号。在此,在图中,水平轴表示频率,竖直轴表示功率。此外,图的左侧示出了输入信号的各个频率分量,并且,竖直方向上的线表示高带侧的各个子带的边界位置。
在这种情况下,高带侧有6个子带的系数表没有记录在编码器30和解码器40中。因此,当如图的右侧所示缩小系数表时,可以使用高带侧有8个子带的系数表来获得包括有6个子带的已解码高带信号。
在图32的示例中,根据作为解码高带子带功率估计系数的系数表,删除子带sb+8的系数Asb+8(sb-3)至Asb+8(sb)和系数Bsb+8以及子带sb+7的系数Asb+7(sb-3)至Asb+7(sb)和系数Bsb+7。此外,使用删除了子带sb+7和sb+8的系数的子带sb+1至sb+6的六个子带的系数的新系数表作为解码高带子带功率估计系数以产生已解码高带信号。
以这种方式,当缩小系数表时,删除系数表中的不需要的子带的系数Aib(kb)和系数Bib,即没有用于产生已解码高带信号的子带被删除,并且,从而获得缩小的系数表。
如上所述,通过适当地扩展或者缩小记录在编码器和解码器中的系数表,以对应于要产生的已解码高带信号的子带的数目,可以共享使用预定数量的子带的系数表。因此,可以缩小系数表的记录区域的大小。
[编码器的功能配置示例]
当根据需要扩展或缩小系数表时,如图33所示配置编码器。在图33中,与图18所示的情况对应的部分被给予相同的附图标记,并且将适当地省略其描述。
图33的编码器111与图18的编码器30的不同之处在于,编码器111的伪高带子带功率计算电路35设置有扩展/缩小单元121,其他配置相同。
扩展/缩小单元121对由伪高带子带功率计算电路35记录的系数表进行扩展或缩小,以对应于输入信号的高带分量所分割成的子带的数量。根据需要,伪高带子带功率计算电路35使用由扩展/缩小单元121扩展或缩小的系数表来计算伪高带子带功率。
[对编码处理的描述]
接着,将参考图34的流程图来对由编码器111执行的编码处理进行描述。在此,由于步骤S471至步骤S474的处理与图19的步骤S181至S184的处理相同,因此,将省略其描述。
在步骤S475中,扩展/缩小单元121对作为由伪高带子带功率计算电路35记录的解码高带子带功率估计系数的系数表进行扩展或缩小,以对应于输入信号的高带子带的数量,即高带子带信号的数量。
例如,假定将输入信号的高带分量分割成子带sb+1至sb+q的q个子带的高带子带信号。也就是说,假定基于低带子带信号来计算q个子带的伪高带子带功率。
此外,假定在伪高带子带功率计算电路35中记录具有子带sb+1至sb+r的r个子带的系数Aib(kb)和Bib的系数表,作为解码高带子带功率估计系数。
在这种情况下,当q大于r(q>r)时,扩展/缩小单元121对记录在伪高带子带功率计算电路35中的系数表进行扩展。也就是说,扩展/缩小单元121对包括在系数表中的子带sb+r的系数Asb+r(kb)和Bsb+r进行复制,并且将所复制的系数设置为子带sb+r+1至sb+q的各个子带的系数,而没有任何变化。因此,获得了具有q个子带的系数Aib(kb)和Bib的系数表。
在这种情况下,当q小于r(q<r)时,扩展/缩小单元121对记录在伪高带子带功率计算电路35中的系数表进行缩小。也就是说,扩展/缩小单元121删除包括在系数表中的子带sb+q+1至sb+r的各个子带的系数Aib(kb)和Bib。因此,获得了具有子带sb+1至sb+q的各个子带的系数Aib(kb)和Bib的系数表。
此外,当q等于r(q=r)时,扩展/缩小单元121对记录在伪高带子带功率计算电路35中的系数表既不扩展也不缩小。
在步骤S476中,伪高带子带功率计算电路35基于从特征量计算电路34提供的特征量来计算伪高带子带功率差,以将其提供给伪高带子带功率差计算电路36。
例如,伪高带子带功率计算电路35使用系数表和低带子带功率power(kb,J)(其中,s-3≤kb≤sb)来执行根据上述表达式(2)的计算,并且系数表被记录作为解码高带子带功率估计系数并且根据需要由扩展/缩小单元121来扩展或缩小;并且计算伪高带子带功率powerest(ib,J)。
也就是说,将被作为特征量提供的低带侧的各个子带的低带子带功率乘以各个子带的系数Aib(kb),再将系数Bib与乘以系数之后的低带子带功率之和相加,从而获得伪高带子带功率powerest(ib,J)。
针对高带侧的各个子带计算伪高带子带功率。
此外,伪高带子带功率计算电路35执行对事先记录的各个解码高带子带功率估计系数(系数表)的伪高带子带功率的计算。例如,假定事先准备系数索引为1至K的K个解码高带子带功率估计系数(其中,2≤K)。在这种情况下,对于K个解码高带子带功率估计系数,根据需要,对系数表进行扩展或缩小,并且计算各个子带的伪高带子带功率。
以这种方式,当根据需要对系数表进行扩展或缩小时,可以使用事先记录的系数表来适当地计算子带sb+1至eb的伪高带子带功率,而不管高带侧的子带的数量。此外,可以用较少的解码高带子带功率估计系数和更高的效率来获得伪高带子带功率。
在在步骤S476中计算伪高带子带功率之后,执行步骤S477和S478的处理,并且计算伪高带子带功率差的平方和。在此,由于这些处理与图19的步骤S186和步骤S187的处理相同,因此将省略其描述。
此外,在步骤S478中,对于K个解码高带子带功率估计系数,计算平方差E(J,id)之和。伪高带子带功率差计算电路36从所计算的K个平方差E(J,id)之和中选择最小的平方差之和,并且将表示与所选平方差之和对应的解码高带子带功率估计系数的系数索引提供给高带编码电路37。
在能够以最高精度估计高带信号的系数索引被选择并且提供给高带编码电路37之后,执行步骤S479和步骤S480的处理,并且结束编码处理。在此,由于这些处理与图19的步骤S188和步骤S189的处理相同,因此将省略其描述。
以这种方式,通过输出低带编码数据和高带编码数据作为输出代码串,可以在接收输出代码串的输入的解码器中,获得对于频带扩展处理而言为最优的解码高带子带功率估计系数。因此,可以获得具有较高声音质量的信号。
此外,编码器111不需要记录输入信号的高带分量被分割成的子带的数量的系数表,从而,可以用更少的系数表和较高的效率来对声音进行编码。
此外,可以在高带编码数据中包括表示输入信号的高带分量被分割成的子带的数目的信息,或者可以将表示子带数目的信息作为与输出代码串分离的数据发送给解码器。
[解码器的功能配置示例]
此外,例如如图35所示对接收从图33的编码器111输出的输出代码串作为要解码的输入代码串的解码器进行配置。在图35中,与图20所示的情况对应的部分被给予相同的附图标记。并且将适当地省略其描述。
图35的解码器151与图20的解码器40的相同之处在于:设置有解复用电路41至合成单元48,但是与图20的解码器40的不同之处在于:解码高带子带功率计算电路46设置有扩展和缩小单元161。
根据需要,扩展和缩小单元161对作为从高带解码电路45提供的解码高带子带功率估计系数的系数表进行扩展或缩小。解码高带子带功率计算电路46根据需要使用已扩展或缩小的系数表来计算已解码高带子带功率。
[对解码处理的描述]
接着,将参考图36的流程图对图35的解码器151执行的解码处理进行描述。由于步骤S511至步骤S515的处理与图21的步骤S211至步骤S215的处理相同,所以将省略其描述。
在步骤S516中,根据需要,扩展和缩小单元161对作为从高带解码电路45提供的解码高带子带功率估计系数的系数表进行扩展或缩小。
具体地,解码高带子带功率计算电路46计算高带侧的子带sb+1至sb+q的q个子带的已解码高带子带功率。也就是说,假定已解码高带信号包括q个子带的分量。
在此,可以在解码器151中事先指定高带侧的子带的数量“q”,或者由用户来指定。此外,可以在高带编码数据中包括表示高带侧的子带数目的信息,或者,可以将表示高带侧的子带数目的信息从编码器111发送给解码器151作为与输入代码串分离的数据。
此外,假定在高带解码电路45中记录具有子带sb+1至sb+r的r个子带的系数Aib(kb)和系数Bib的系数表,作为解码高带子带功率估计系数。
在这种情况下,当q大于r(q>r)时,扩展和缩小单元161对从高带解码电路45提供的系数表进行扩展。也就是说,扩展和缩小单元161对包括在系数表中的子带sb+r的系数Asb+r(kb)和Bsb+r进行复制,并且将所复制的系数设置为子带sb+r+1至sb+q的各个子带的系数,而没有任何变化。因此,获得了具有q个子带的系数Aib(kb)和Bib的系数表。
在这种情况下,当q小于r(q<r)时,扩展和缩小单元161对从高带解码电路45提供的系数表进行缩小。也就是说,扩展和缩小单元161删除包括在系数表中的子带sb+q+1至sb+r的各个子带的系数Aib(kb)和Bib。因此,获得了具有子带sb+1至sb+q的各个子带的系数Aib(kb)和Bib的系数表。
此外,当q等于r(q=r)时,扩展和缩小单元161对从高带解码电路45提供的系数表既不扩展也不缩小。
在根据需要对系数表进行扩展或缩小之后,执行步骤S517至步骤S519的处理,并且结束解码处理。然而,由于这些处理与图21中的步骤S216至步骤S218的处理相同,因此将省略其描述。
以这种方式,根据解码器151,根据从输入代码串的解复用获得的高带编码数据来获得系数索引;通过使用由系数索引表示的解码高带子带功率估计系数,计算已解码高带子带功率;从而,可以提高高带子带功率的估计精度。因此,可以再现具有较高质量的声音信号。
此外,在解码器151中,不需要针对构成已解码高带信号的子带数量来记录系数表;因此,可以用较少的系数表和较高的效率来对声音进行解码。
<8.第八实施方式>
[关于混合学习方法]
在上述情况下,准备能够处理带限频率、采样频率、编码和解码算法的不同的系数组,但是存在表的尺寸增大的问题。为了解决该问题,提出了如下方法:使用各种带限频率、采样频率、编码和解码算法作为输入,解释变量(sb-3至sb),被解释变量(sb+1至eb),将这些进行混合以执行学习。根据本方法,对于各种采样频率、编码和解码算法的信号,可以用一个表来平均精确地估计高带功率。
具体地,例如,如图37所示,对于各个条件A至D,根据宽带教学信号获得解释变量和被解释变量,并且通过学习来获得解码高带子带功率估计系数(系数表)。
此外,在图37中,带限频率表示包括在低带信号或解码低带信号中的分量的频率中的最高频率,并且,采样频率表示输入信号或输出信号的采样频率。此外,编码表示输入信号的编码系统,编码算法表示声音的编码方法。例如,当编码算法不同时,解码低带信号不同。因此,例如,用作解释变量的低带子带功率的值不同。
在获得各个条件下的系数表的情况下,当对声音进行编码或解码时,根据如编码或解码算法的条件从所获得的用于这些条件下的系数表中选择一个系数表。
当如上所述获得了各个条件下的系数表时,在编码器或者解码器中,应当事先记录各种条件下的很多系数表。因此,存在如下情况:记录系数表的记录区域的大小增加。
因此,可以混合根据各个条件下的宽带教学信号获得的解释变量和被解释变量,并且执行学习;并且可以通过使用从而获得的系数表,平均精确地估计高带功率,而不管条件如何。
[系数学习装置的功能配置示例]
在这种情况下,如图38所示配置通过学习产生作为解码高带子带功率估计系数的系数表的系数学习装置。
系数学习装置191包括子带分割电路201、高带子带功率计算电路202、特征量计算电路203和系数估计电路204。
对于该系数学习装置191,提供了多个条件下的多个音乐数据作为宽带教学信号,多个音乐数据具有不同的条件,如图37所示的条件A至D。宽带教学信号表示包括有多个高带子带分量和多个低带子带分量的信号。
子带分割电路201包括带通滤波器,并且将所提供的宽带教学信号分割成要输出给高带子带功率计算电路202和特征量计算电路203的多个子带信号。具体地,索引为sb+1至eb的高带侧的各个子带的高带子带信号被提供给高带子带功率计算电路202,并且,索引为sb-3至sb的低带侧的各个子带的低带子带信号被提供给特征量计算电路203。
高带子带功率计算电路202计算从子带分割电路201提供的各个高带子带信号的高带子带功率,以将其输出给系数估计电路204。
特征量计算电路203基于从子带分割电路201提供的低带子带信号来计算作为特征量的低带子带功率,以将其输出给系数估计电路204。
系数估计电路204使用从高带子带功率计算电路202提供的高带子带功率和从特征量计算电路203提供的特征量来执行回归分析,从而生成并输出解码高带子带功率估计系数。
[对系数学习处理的描述]
接着,将参考图39的流程图对由系数学习装置191执行的系数学习处理进行描述。
在步骤S541中,子带分割电路201将所提供的多个宽带教学信号分别分割成多个子带信号。此外,子带分割电路201将索引为sb+1至eb的子带的高带信号提供给高带子带功率计算电路202,并且将索引为sb-3至sb的子带的低带信号提供给特征量计算电路203。
提供给子带分割电路201的宽带教学信号包括具有不同条件如采样率的多个音乐数据。此外,根据不同条件对宽带教学信号进行分割,例如,根据不同的带限频率,分割成低带子带信号和高带子带信号。
在步骤S542中,高带子带功率计算电路202关于从子带分割电路201提供的各个高带子带信号,执行与上述表达式(1)相同的计算;从而计算高带子带功率,以将其输出给系数估计电路204。
在步骤S543中,特征量计算电路203关于从子带分割电路201提供的各个低带子带信号,执行与上述表达式(1)相同的计算;从而计算低带子带功率,作为要输出给系数估计电路204的特征量。
因此,关于多个宽带教学信号的各个帧,将高带子带功率和低带子带功率提供给系数估计电路204。
在步骤S544中,系数估计电路204使用最小二乘法来执行回归分析,以计算索引为sb+1至eb的高带侧的各个子带ib(其中,sb+1≤ib≤eb)的系数Aib(kb)和Bib
在回归分析中,将从特征量计算电路203提供的低带子带功率设置为解释变量,将从高带子带功率计算电路202提供的高带子带功率设置为被解释变量。此外,使用构成被提供给系数学习装置191的所有宽带教学信号的所有帧的高带子带功率和低带子带功率来执行回归分析。
在步骤S545中,系数估计电路204使用所获得的各个子带ib的系数Aib(kb)和Bib来获得宽带教学信号的各个帧的残差矢量。
例如,系数估计电路204从帧J的各个子带ib(其中,sb+1≤ib≤eb)的高带子带功率power(ib,J)减去乘以系数Aib(kb)的低带子带功率power(kb,J)(其中,sb-3≤kb≤sb)的总和与系数Bib的和之和,从而计算残差。此外,将包括有帧J的各个子带ib的残差的矢量设置为残差矢量。
此外,对于构成被提供给系数学习装置191的所有宽带教学信号的所有帧,计算残差矢量。
在步骤S546中,系数估计电路204根据k平均方法等将对于各个帧获得的残差矢量聚类为一些簇。
此外,系数估计电路204关于各个帧的残差矢量,计算各个簇的中心矢量,并且计算簇的中心矢量与残差矢量之间的距离。此外,系数估计电路204基于所计算的距离,指定属于各个帧的簇。也就是说,将具有与帧的残差矢量的最短距离的中心矢量的簇设置为属于该帧的簇。
在步骤S547中,系数估计电路204选择通过聚类获得的多个簇中的一个簇作为处理目标簇。
在步骤S548中,系数估计电路204使用属于被选作处理目标簇的簇的残差矢量的帧通过回归分析来计算各个子带ib(其中,sb+1≤ib≤eb)的系数Aib(kb)和Bib
也就是说,当属于处理目标簇的残差矢量的帧被称为处理目标帧时,将所有处理目标帧的高带子带功率和低带子带功率设置为解释变量和被解释变量,从而使用最小二乘法来执行回归分析。因此,获得了各个子带ib的系数Aib(kb)和Bib
将从而获得的具有各个子带的系数Aib(kb)和Bib的系数表设置为解码高带子带功率估计系数,并且,将系数索引给予该解码高带子带功率估计系数。
在步骤S549中,系数学习装置191确定是否所有簇都作为处理目标簇被处理。在步骤S549中,当确定要处理所有簇时,处理返回步骤S547,并且重复上述处理。也就是说,选择下一个簇作为处理目标,并且,计算解码高带子带功率估计系数。
另一方面,在步骤S549中,当确定处理所有簇时,获得期望获得的预定数量的解码高带子带功率估计系数。因此,处理继续进行至步骤S550。
在步骤S550中,系数估计电路204将所获得的系数索引和所获得的解码高带子带功率估计系数输出给编码器或者解码器以进行记录,并且,系数学习处理结束。
以这种方式,系数学习装置191根据所提供的要输出的宽带教学信号来产生各个系数索引的解码高带子带功率估计系数(系数表)。以这种方式,使用具有不同条件的多个宽带教学信号来执行学习,以产生系数表;并且,作为结果,可以缩小系数表的记录区域的大小,并且,可以平均精确地估计高带子带功率。
用硬件或软件来执行上述系列处理。当用软件来执行系列处理时,在结合有专用硬件的计算机或通用个人计算机中安装由软件构成的程序,通用个人计算机能够通过从程序记录介质安装各种程序来执行各种功能。
图40是示出了执行上述系列处理的计算机的硬件的配置示例的框图。
在计算机中,CPU 501、ROM(只读存储器)502和RAM(随机存取存储器)503通过总线504彼此连接。
此外,输入/输出接口505连接至总线504。输入/输出接口505连接有:输入单元506、输出单元507、存储单元508、通信单元509和驱动器510,其中,输入单元506包括键盘、鼠标、麦克风等,输出单元507包括显示器,扬声器等,存储单元508包括硬盘或非易失性存储器等,通信单元509包括网络接口等,驱动器510驱动磁盘、光盘、磁光盘和半导体存储器等可移除介质511。
在如上配置的计算机中,例如,CPU501经由输入/输出接口505和总线504将存储在存储单元508中的程序装载到RAM 503中并执行,以执行上述系列处理。
例如,要由计算机(CPU 501)执行的程序记录在如封装介质的可移除介质511中,封装介质包括磁盘(包括软盘)、光盘((CD-ROM(压缩盘只读存储器))、DVD(数字多功能盘)等)、磁光盘或半导体存储器,或者通过包括局域网、互联网和数字卫星广播的有线或无线传输介质提供。
此外,可以通过给驱动器510安装可移除介质511来经由输入/输出接口505给存储单元508安装程序。此外,通过有线或无线传输介质在通信单元509中接收程序,并且,可以将程序安装至存储单元508。此外,可以事先在ROM 502或者存储单元508中安装程序。
此外,由计算机执行的程序可以是如下程序:处理根据说明书中描述的顺序按照时间顺序来执行,也可以是如下程序:处理在进行调用时并行或者在必要的时刻执行。
此外,本发明的实施方式不限于上述实施方式,在不偏离本发明的主旨的范围内的各种修改都是可以的。
附图标记列表
10频带扩展装置
11低通滤波器
12延迟电路
13、13-1至13-N带通滤波器
14特征量计算电路
15高带子带功率估计电路
16高带信号产生电路
17高通滤波器
18信号加法器
20系数学习装置
21、21-1至21-(K+N)带通滤波器
22高带子带功率计算电路
23特征量计算电路
24系数估计电路
30编码器
31低通滤波器
32低带编码电路
33子带分割电路
34特征量计算电路
35伪高带子带功率计算电路
36伪高带子带功率差计算电路
37高带编码电路
38复用电路
40解码器
41解复用电路
42低带解码电路
43子带分割电路
44特征量计算电路
45高带解码电路
46已解码高带子带功率计算电路
47已解码高带信号产生电路
48合成电路
50系数学习装置
51低通滤波器
52子带分割电路
53特征量计算电路
54伪高带子带功率计算电路
55伪高带子带功率差计算电路
56伪高带子带功率差聚类电路
57系数估计电路
101 CPU
102 ROM
103 RAM
104总线
105输入/输出接口
106输入单元
107输出单元
108存储单元
109通信单元
110驱动器
111可移除介质

Claims (12)

1.一种信号处理装置,包括:
解复用单元,所述解复用单元将输入的编码数据解复用为至少低带编码数据和系数信息;
低带解码单元,所述低带解码单元对所述低带编码数据进行解码以产生低带信号;
选择单元,所述选择单元在用于产生高带信号且具有高带侧的各个子带的系数的多个系数表之中选择基于所述系数信息而获得的系数表;
扩展和缩小单元,所述扩展和缩小单元删除一些子带的系数以缩小所述系数表,或者基于一些子带的系数产生预定子带的系数以扩展所述系数表;
高带子带功率计算单元,所述高带子带功率计算单元基于构成所述低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表,来计算构成所述高带信号的各个子带的高带子带信号的高带子带功率;以及
高带信号产生单元,所述高带信号产生单元基于所述高带子带功率和所述低带子带信号来产生所述高带信号。
2.根据权利要求1所述的信号处理装置,其中,所述扩展和缩小单元对包括在所述系数表中的具有最高频率的子带的系数进行复制,并且将所述复制的系数设置为频率高于所述最高频率的子带的系数,以扩展所述系数表。
3.根据权利要求1所述的信号处理装置,其中,所述扩展和缩小单元从所述系数表中删除下述子带的系数以缩小所述系数表:所述子带的频率高于所述高带子带信号的子带之中的具有最高频率的子带的频率。
4.一种信号处理装置的信号处理方法,所述信号处理装置包括:
解复用单元,所述解复用单元将输入的编码数据解复用为至少低带编码数据和系数信息,
低带解码单元,所述低带解码单元对所述低带编码数据进行解码以产生低带信号,
选择单元,所述选择单元在用于产生高带信号且具有高带侧的各个子带的系数的多个系数表之中选择基于所述系数信息而获得的系数表,
扩展和缩小单元,所述扩展和缩小单元删除一些子带的系数以缩小所述系数表,或者基于一些子带的系数产生预定子带的系数以扩展所述系数表,
高带子带功率计算单元,所述高带子带功率计算单元基于构成所述低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表,来计算构成所述高带信号的各个子带的高带子带信号的高带子带功率,以及
高带信号产生单元,所述高带信号产生单元基于所述高带子带功率和所述低带子带信号来产生所述高带信号,
所述方法包括步骤:
使所述解复用单元对所述编码数据进行解复用;
使所述低带解码单元产生所述低带信号;
使所述选择单元选择所述系数表;
使所述扩展和缩小单元缩小或扩展所述系数表;
使所述高带子带功率计算单元计算所述高带子带功率;以及
使所述高带信号产生单元产生所述高带信号。
5.一种信号处理装置,包括:
子带分割单元,所述子带分割单元产生输入信号的低带侧的多个子带的低带子带信号和所述输入信号的高带侧的多个子带的高带子带信号;
扩展和缩小单元,所述扩展和缩小单元删除一些子带的系数以缩小系数表,或者基于一些子带的系数产生预定子带的系数以扩展系数表,所述系数表具有所述高带侧的各个子带的系数;
伪高带子带功率计算单元,所述伪高带子带功率计算单元基于所述扩展或缩小的系数表和所述低带子带信号,来计算所述高带侧的各个子带的伪高带子带功率,所述伪高带子带功率是所述高带子带信号的功率的估计值;
选择单元,所述选择单元将所述高带子带信号的高带子带功率与所述伪高带子带功率相互比较,并且选择多个系数表中的一个;以及
产生单元,所述产生单元产生包含用于获得所选择的系数表的系数信息的数据。
6.根据权利要求5所述的信号处理装置,其中,所述扩展和缩小单元对包括在所述系数表中的具有最高频率的子带的系数进行复制,并且将所述复制的系数设置为频率高于所述最高频率的子带的系数,以扩展所述系数表。
7.根据权利要求5所述的信号处理装置,其中,所述扩展和缩小单元从所述系数表中删除下述子带的系数以缩小所述系数表:所述子带的频率高于所述高带子带信号的子带之中的具有最高频率的子带的频率。
8.一种信号处理装置的信号处理方法,所述信号处理装置包括:
子带分割单元,所述子带分割单元产生输入信号的低带侧的多个子带的低带子带信号和所述输入信号的高带侧的多个子带的高带子带信号;
扩展和缩小单元,所述扩展和缩小单元删除一些子带的系数以缩小系数表,或者基于一些子带的系数产生预定子带的系数以扩展系数表,所述系数表具有所述高带侧的各个子带的系数;
伪高带子带功率计算单元,所述伪高带子带功率计算单元基于所述扩展或缩小的系数表和所述低带子带信号,来计算高带侧的各个子带的伪高带子带功率,所述伪高带子带功率是所述高带子带信号的功率的估计值;
选择单元,所述选择单元将所述高带子带信号的高带子带功率与所述伪高带子带功率相互比较,并且选择多个系数表中的一个;以及
产生单元,所述产生单元产生包含用于获得所选择的系数表的系数信息的数据,
所述方法包括步骤:
使所述子带分割单元产生所述低带子带信号和所述高带子带信号;
使所述扩展和缩小单元缩小或扩展所述系数表;
使所述伪高带子带功率计算单元计算所述伪高带子带功率;
使所述选择单元选择所述系数表;以及
使所述产生单元产生包含系数信息的数据。
9.一种解码器,包括:
解复用单元,所述解复用单元将输入的编码数据解复用为至少低带编码数据和系数信息;
低带解码单元,所述低带解码单元对所述低带编码数据进行解码以产生低带信号;
选择单元,所述选择单元在用于产生高带信号且具有高带侧的各个子带的系数的多个系数表之中选择基于所述系数信息而获得的系数表;
扩展和缩小单元,所述扩展和缩小单元删除一些子带的系数以缩小所述系数表,或者基于一些子带的系数产生预定子带的系数以扩展所述系数表;
高带子带功率计算单元,所述高带子带功率计算单元基于构成所述低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表,来计算构成所述高带信号的各个子带的高带子带信号的高带子带功率;
高带信号产生单元,所述高带信号产生单元基于所述高带子带功率和所述低带子带信号来产生所述高带信号;以及
合成单元,所述合成单元将所述低带信号与所述高带信号彼此合成以产生输出信号。
10.一种解码器的解码方法,所述解码器包括:
解复用单元,所述解复用单元将输入的编码数据解复用为至少低带编码数据和系数信息;
低带解码单元,所述低带解码单元对所述低带编码数据进行解码以产生低带信号;
选择单元,所述选择单元在用于产生高带信号且具有高带侧的各个子带的系数的多个系数表之中选择基于所述系数信息而获得的系数表;
扩展和缩小单元,所述扩展和缩小单元删除一些子带的系数以缩小所述系数表,或者基于一些子带的系数产生预定子带的系数以扩展所述系数表;
高带子带功率计算单元,所述高带子带功率计算单元基于构成所述低带信号的各个子带的低带子带信号和所述扩展或缩小的系数表,来计算构成所述高带信号的各个子带的高带子带信号的高带子带功率;
高带信号产生单元,所述高带信号产生单元基于所述高带子带功率和所述低带子带信号来产生所述高带信号;以及
合成单元,所述合成单元将所述低带信号与所述高带信号彼此合成以产生输出信号,
所述方法包括步骤:
使所述解复用单元对所述编码数据进行解复用;
使所述低带解码单元产生所述低带信号;
使所述选择单元选择所述系数表;
使所述扩展和缩小单元缩小或扩展所述系数表;
使所述高带子带功率计算单元计算所述高带子带功率;
使所述高带信号产生单元产生所述高带信号;以及
使所述合成单元产生所述输出信号。
11.一种编码器,包括:
子带分割单元,所述子带分割单元产生输入信号的低带侧的多个子带的低带子带信号和所述输入信号的高带侧的多个子带的高带子带信号;
扩展和缩小单元,所述扩展和缩小单元删除一些子带的系数以缩小系数表,或者基于一些子带的系数产生预定子带的系数以扩展系数表,所述系数表具有所述高带侧的各个子带的系数;
伪高带子带功率计算单元,所述伪高带子带功率计算单元基于所述扩展或缩小的系数表和所述低带子带信号,来计算高带侧的各个子带的伪高带子带功率,所述伪高带子带功率是所述高带子带信号的功率的估计值;
选择单元,所述选择单元将所述高带子带信号的高带子带功率与所述伪高带子带功率相互比较,并且选择多个系数表中的一个;
高带编码单元,所述高带编码单元对用于获得所选择的系数表的系数信息进行编码以产生高带编码数据;
低带编码单元,所述低带编码单元对所述输入信号的低带信号进行编码以产生低带编码数据;以及
复用单元,所述复用单元对所述低带编码数据和所述高带编码数据进行复用以产生输出代码串。
12.一种编码器的编码方法,所述编码器包括:
子带分割单元,所述子带分割单元产生输入信号的低带侧的多个子带的低带子带信号和所述输入信号的高带侧的多个子带的高带子带信号;
扩展和缩小单元,所述扩展和缩小单元删除一些子带的系数以缩小系数表,或者基于一些子带的系数产生预定子带的系数以扩展系数表,所述系数表具有所述高带侧的各个子带的系数;
伪高带子带功率计算单元,所述伪高带子带功率计算单元基于所述扩展或缩小的系数表和所述低带子带信号,来计算高带侧的各个子带的伪高带子带功率,所述伪高带子带功率是所述高带子带信号的功率的估计值;
选择单元,所述选择单元将所述高带子带信号的高带子带功率与所述伪高带子带功率相互比较,并且选择多个系数表中的一个;
高带编码单元,所述高带编码单元对用于获得所选择的系数表的系数信息进行编码以产生高带编码数据;
低带编码单元,所述低带编码单元对所述输入信号的低带信号进行编码以产生低带编码数据;以及
复用单元,所述复用单元对所述低带编码数据和所述高带编码数据进行复用以产生输出代码串,
所述方法包括步骤:
使所述子带分割单元产生所述低带子带信号和所述高带子带信号;
使所述扩展和缩小单元缩小或扩展所述系数表;
使所述伪高带子带功率计算单元计算所述伪高带子带功率;
使所述选择单元选择所述系数表;
使所述高带编码单元产生所述高带编码数据;
使所述低带编码单元产生所述低带编码数据;以及
使所述复用单元产生所述输出代码串。
CN201180018001.3A 2010-04-13 2011-04-11 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序 Expired - Fee Related CN102822891B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2010092689 2010-04-13
JP2010-092689 2010-04-13
JP2011017230 2011-01-28
JP2011-017230 2011-01-28
JP2011072381A JP5609737B2 (ja) 2010-04-13 2011-03-29 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP2011-072381 2011-03-29
PCT/JP2011/059030 WO2011129305A1 (ja) 2010-04-13 2011-04-11 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
CN102822891A CN102822891A (zh) 2012-12-12
CN102822891B true CN102822891B (zh) 2014-05-07

Family

ID=44798678

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180018001.3A Expired - Fee Related CN102822891B (zh) 2010-04-13 2011-04-11 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序

Country Status (12)

Country Link
US (2) US8949119B2 (zh)
EP (1) EP2562754B1 (zh)
JP (1) JP5609737B2 (zh)
KR (1) KR101801996B1 (zh)
CN (1) CN102822891B (zh)
BR (1) BR112012025580A2 (zh)
CO (1) CO6561766A2 (zh)
ES (1) ES2534749T3 (zh)
MY (1) MY168695A (zh)
RU (1) RU2563160C2 (zh)
TW (1) TWI484482B (zh)
WO (1) WO2011129305A1 (zh)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8284955B2 (en) 2006-02-07 2012-10-09 Bongiovi Acoustics Llc System and method for digital signal processing
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
RU2610293C2 (ru) 2012-03-29 2017-02-08 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
AU2013284703B2 (en) 2012-07-02 2019-01-17 Sony Corporation Decoding device and method, encoding device and method, and program
CN103474079A (zh) * 2012-08-06 2013-12-25 苏州沃通信息科技有限公司 一种语音编码方法
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
US10200711B2 (en) 2015-03-27 2019-02-05 Qualcomm Incorporated Motion vector derivation in video coding
US11565365B2 (en) * 2017-11-13 2023-01-31 Taiwan Semiconductor Manufacturing Co., Ltd. System and method for monitoring chemical mechanical polishing
JP2019164106A (ja) * 2018-03-20 2019-09-26 本田技研工業株式会社 異音検出装置および検出方法
JP2019164107A (ja) * 2018-03-20 2019-09-26 本田技研工業株式会社 異音判定装置および判定方法
KR20200143707A (ko) 2018-04-11 2020-12-24 본지오비 어커스틱스 엘엘씨 오디오 향상 청력 보호 시스템
CN110660409A (zh) * 2018-06-29 2020-01-07 华为技术有限公司 一种扩频的方法及装置
US10959035B2 (en) 2018-08-02 2021-03-23 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
KR20210153455A (ko) 2020-06-10 2021-12-17 김승찬 농가용 간편 비가림 시설
TWI763207B (zh) * 2020-12-25 2022-05-01 宏碁股份有限公司 聲音訊號處理評估方法及裝置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1734555A (zh) * 2004-08-04 2006-02-15 三星电子株式会社 恢复音频数据的高频分量的方法和设备
CN100338649C (zh) * 2002-03-28 2007-09-19 杜比实验室特许公司 处理音频信号、生成重建的音频信号的方法、设备及媒体
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
WO2009054393A1 (ja) * 2007-10-23 2009-04-30 Clarion Co., Ltd. 高域補間装置および高域補間方法
WO2009081568A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation 符号化装置、復号装置および符号化方法
WO2010024371A1 (ja) * 2008-08-29 2010-03-04 ソニー株式会社 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム

Family Cites Families (156)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
JPH03254223A (ja) * 1990-03-02 1991-11-13 Eastman Kodak Japan Kk アナログデータ伝送方式
JPH1020888A (ja) 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
US6073100A (en) 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
WO1999003096A1 (fr) 1997-07-11 1999-01-21 Sony Corporation Procede et dispositif de codage et decodage d'informations et support de distribution
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
WO2000070769A1 (fr) 1999-05-14 2000-11-23 Matsushita Electric Industrial Co., Ltd. Procede et appareil d'elargissement de la bande d'un signal audio
TW453046B (en) * 1999-10-11 2001-09-01 Jang Jen Cheng A technique for speech camouflage based on sub-band division
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
JP4231987B2 (ja) 2001-06-15 2009-03-04 日本電気株式会社 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
WO2003007480A1 (fr) 2001-07-13 2003-01-23 Matsushita Electric Industrial Co., Ltd. Dispositif de decodage de signaux audio et dispositif de codage de signaux audio
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
CN1279512C (zh) 2001-11-29 2006-10-11 编码技术股份公司 用于改善高频重建的方法和装置
CN1288625C (zh) 2002-01-30 2006-12-06 松下电器产业株式会社 音频编码与解码设备及其方法
JP2003255973A (ja) 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
KR100602975B1 (ko) 2002-07-19 2006-07-20 닛본 덴끼 가부시끼가이샤 오디오 복호 장치와 복호 방법 및 프로그램을 기록한 컴퓨터 판독가능 기록매체
JP4728568B2 (ja) 2002-09-04 2011-07-20 マイクロソフト コーポレーション レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7069212B2 (en) 2002-09-19 2006-06-27 Matsushita Elecric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing adjustment
US7330812B2 (en) 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
JP4657570B2 (ja) * 2002-11-13 2011-03-23 ソニー株式会社 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
EP1611772A1 (en) 2003-03-04 2006-01-04 Nokia Corporation Support of a multichannel audio extension
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
KR20050027179A (ko) 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7844451B2 (en) 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
KR20060090995A (ko) 2003-10-23 2006-08-17 마쓰시다 일렉트릭 인더스트리얼 컴패니 리미티드 스펙트럼 부호화 장치, 스펙트럼 복호화 장치, 음향 신호송신 장치, 음향 신호 수신장치 및 이들의 방법
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
JP4810422B2 (ja) 2004-05-14 2011-11-09 パナソニック株式会社 符号化装置、復号化装置、およびこれらの方法
BRPI0510400A (pt) 2004-05-19 2007-10-23 Matsushita Electric Ind Co Ltd dispositivo de codificação, dispositivo de decodificação e método dos mesmos
EP1749296B1 (en) 2004-05-28 2010-07-14 Nokia Corporation Multichannel audio extension
TWI243615B (en) * 2004-10-11 2005-11-11 Ind Tech Res Inst System for enhancing compression ratio of scalable video coding and method thereof
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US20060106620A1 (en) 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
SE0402651D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
CN102201242B (zh) 2004-11-05 2013-02-27 松下电器产业株式会社 编码装置、解码装置、编码方法及解码方法
BRPI0517780A2 (pt) 2004-11-05 2011-04-19 Matsushita Electric Ind Co Ltd aparelho de decodificação escalável e aparelho de codificação escalável
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US8082156B2 (en) 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
MX2007012187A (es) 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para deformacion en tiempo de banda alta.
DE602006004959D1 (de) 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
US20070005351A1 (en) * 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100813259B1 (ko) 2005-07-13 2008-03-13 삼성전자주식회사 입력신호의 계층적 부호화/복호화 장치 및 방법
KR101228630B1 (ko) 2005-09-02 2013-01-31 파나소닉 주식회사 에너지 정형 장치 및 에너지 정형 방법
CN101273404B (zh) 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
KR20080047443A (ko) 2005-10-14 2008-05-28 마츠시타 덴끼 산교 가부시키가이샤 변환 부호화 장치 및 변환 부호화 방법
WO2007052088A1 (en) 2005-11-04 2007-05-10 Nokia Corporation Audio compression
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4863713B2 (ja) 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7590523B2 (en) 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
WO2007114291A1 (ja) 2006-03-31 2007-10-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、およびこれらの方法
EP2323131A1 (en) 2006-04-27 2011-05-18 Panasonic Corporation Audio encoding device, audio decoding device, and their method
JP2007316254A (ja) 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
WO2008032828A1 (fr) 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
JP5141180B2 (ja) * 2006-11-09 2013-02-13 ソニー株式会社 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
CN101548318B (zh) 2006-12-15 2012-07-18 松下电器产业株式会社 编码装置、解码装置以及其方法
RU2406166C2 (ru) * 2007-02-14 2010-12-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования основывающихся на объектах ориентированных аудиосигналов
JP2008261978A (ja) 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
US8015368B2 (en) 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
EP2159790B1 (en) 2007-06-27 2019-11-13 NEC Corporation Audio encoding method, audio decoding method, audio encoding device, audio decoding device, program, and audio encoding/decoding system
JP5071479B2 (ja) 2007-07-04 2012-11-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
JP5045295B2 (ja) 2007-07-30 2012-10-10 ソニー株式会社 信号処理装置及び方法、並びにプログラム
US8041577B2 (en) 2007-08-13 2011-10-18 Mitsubishi Electric Research Laboratories, Inc. Method for expanding audio signal bandwidth
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
CN101939782B (zh) 2007-08-27 2012-12-05 爱立信电话股份有限公司 噪声填充与带宽扩展之间的自适应过渡频率
US9495971B2 (en) 2007-08-27 2016-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
JP4733727B2 (ja) 2007-10-30 2011-07-27 日本電信電話株式会社 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
WO2009057329A1 (ja) 2007-11-01 2009-05-07 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
KR101290622B1 (ko) 2007-11-02 2013-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 복호화 방법 및 장치
US20090132238A1 (en) 2007-11-02 2009-05-21 Sudhakar B Efficient method for reusing scale factors to improve the efficiency of an audio encoder
WO2009059632A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
US8527282B2 (en) * 2007-11-21 2013-09-03 Lg Electronics Inc. Method and an apparatus for processing a signal
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
WO2009084221A1 (ja) 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
EP2077551B1 (en) 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
EP2239731B1 (en) 2008-01-25 2018-10-31 III Holdings 12, LLC Encoding device, decoding device, and method thereof
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2259253B1 (en) 2008-03-03 2017-11-15 LG Electronics Inc. Method and apparatus for processing audio signal
KR101449434B1 (ko) 2008-03-04 2014-10-13 삼성전자주식회사 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
EP3296992B1 (en) 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
KR20090122142A (ko) 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8498344B2 (en) 2008-06-20 2013-07-30 Rambus Inc. Frequency responsive bus coding
JP2010007927A (ja) 2008-06-25 2010-01-14 Sumitomo Heavy Ind Ltd 駆動回路
CA2730198C (en) 2008-07-11 2014-09-16 Frederik Nagel Audio signal synthesizer and audio signal encoder
KR101518532B1 (ko) 2008-07-11 2015-05-07 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 신호, 오디오 스트림을 부호화 및 복호화하는 장치 및 컴퓨터 프로그램
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
EP2320416B1 (en) 2008-08-08 2014-03-05 Panasonic Corporation Spectral smoothing device, encoding device, decoding device, communication terminal device, base station device, and spectral smoothing method
WO2010028299A1 (en) 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8532983B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
MY180550A (en) * 2009-01-16 2020-12-02 Dolby Int Ab Cross product enhanced harmonic transposition
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
JP4945586B2 (ja) 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP5564803B2 (ja) 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
JP5223786B2 (ja) 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
US8515768B2 (en) 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US8600749B2 (en) * 2009-12-08 2013-12-03 At&T Intellectual Property I, L.P. System and method for training adaptation-specific acoustic models for automatic speech recognition
US8447617B2 (en) 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
EP2357649B1 (en) 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
JP5375683B2 (ja) 2010-03-10 2013-12-25 富士通株式会社 通信装置および電力補正方法
WO2011121782A1 (ja) 2010-03-31 2011-10-06 富士通株式会社 帯域拡張装置および帯域拡張方法
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
WO2011127832A1 (en) 2010-04-14 2011-10-20 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CA3203400C (en) 2010-07-19 2023-09-26 Dolby International Ab Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP2012058358A (ja) 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012052802A1 (en) 2010-10-18 2012-04-26 Nokia Corporation An audio encoder/decoder apparatus
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
IN2014CN01270A (zh) 2011-09-29 2015-06-19 Dolby Int Ab
WO2013154027A1 (ja) 2012-04-13 2013-10-17 ソニー株式会社 復号装置および方法、オーディオ信号処理装置および方法、並びにプログラム
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
AU2013284705B2 (en) 2012-07-02 2018-11-29 Sony Corporation Decoding device and method, encoding device and method, and program
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
CN103748629B (zh) 2012-07-02 2017-04-05 索尼公司 解码装置和方法、编码装置和方法以及程序
AU2013284703B2 (en) 2012-07-02 2019-01-17 Sony Corporation Decoding device and method, encoding device and method, and program
JP2014123011A (ja) 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
CN100338649C (zh) * 2002-03-28 2007-09-19 杜比实验室特许公司 处理音频信号、生成重建的音频信号的方法、设备及媒体
CN1734555A (zh) * 2004-08-04 2006-02-15 三星电子株式会社 恢复音频数据的高频分量的方法和设备
WO2009054393A1 (ja) * 2007-10-23 2009-04-30 Clarion Co., Ltd. 高域補間装置および高域補間方法
WO2009081568A1 (ja) * 2007-12-21 2009-07-02 Panasonic Corporation 符号化装置、復号装置および符号化方法
WO2010024371A1 (ja) * 2008-08-29 2010-03-04 ソニー株式会社 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム

Also Published As

Publication number Publication date
EP2562754B1 (en) 2015-03-18
EP2562754A1 (en) 2013-02-27
BR112012025580A2 (pt) 2016-06-28
TW201209807A (en) 2012-03-01
US20150120307A1 (en) 2015-04-30
WO2011129305A1 (ja) 2011-10-20
RU2563160C2 (ru) 2015-09-20
KR20130042474A (ko) 2013-04-26
JP5609737B2 (ja) 2014-10-22
CO6561766A2 (es) 2012-11-15
RU2012142674A (ru) 2014-04-10
US20130030818A1 (en) 2013-01-31
US9659573B2 (en) 2017-05-23
MY168695A (en) 2018-11-29
CN102822891A (zh) 2012-12-12
JP2012168495A (ja) 2012-09-06
US8949119B2 (en) 2015-02-03
ES2534749T3 (es) 2015-04-28
KR101801996B1 (ko) 2017-11-27
EP2562754A4 (en) 2013-12-18
TWI484482B (zh) 2015-05-11

Similar Documents

Publication Publication Date Title
CN102822891B (zh) 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序
CN102834864B (zh) 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法
CN102859593B (zh) 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法
KR101835910B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 컴퓨터 판독가능한 기록 매체
CN102576544B (zh) 频带扩展设备和方法、编码设备和方法、解码设备和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140507

Termination date: 20210411