CN102834864B - 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法 - Google Patents

信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法 Download PDF

Info

Publication number
CN102834864B
CN102834864B CN201180018948.4A CN201180018948A CN102834864B CN 102834864 B CN102834864 B CN 102834864B CN 201180018948 A CN201180018948 A CN 201180018948A CN 102834864 B CN102834864 B CN 102834864B
Authority
CN
China
Prior art keywords
band
subband
signal
coefficient
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180018948.4A
Other languages
English (en)
Other versions
CN102834864A (zh
Inventor
山本优树
知念彻
本间弘幸
光藤祐基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to CN201410216102.7A priority Critical patent/CN104021794B/zh
Publication of CN102834864A publication Critical patent/CN102834864A/zh
Application granted granted Critical
Publication of CN102834864B publication Critical patent/CN102834864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

本发明涉及能够通过频带的放大再现具有较高音质的音乐信号的信号处理设备及方法、编码设备及方法、解码设备及方法、以及程序。编码设备的目标处理区间是包括帧(16个)的区间,并且编码设备针对每个目标处理区间输出用于获得输入信号的高带分量的高带编码数据以及其中输入信号中的低带信号已被编码的低带编码数据。此时针对每个帧选择用于估计高带分量的系数,并且将目标处理区间分成如下的连续帧区间,这些帧区间包括具有相同的所选择的系数的连续帧。生成了表示每个连续帧区间的长度的信息,表示目标处理区间中包括的连续帧区间的数目的信息,以及包括表示针对每个连续帧区间选择的系数的系数索引的高带编码数据。该方法可以应用于编码设备。

Description

信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法
技术领域
本发明涉及信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法、以及程序,并且更具体地涉及用于通过频带的扩展以重现具有改善的音质的音乐信号的信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法、以及程序。
背景技术
近来,用于通过互联网来分发音乐数据的音乐分发服务已经有所增加。音乐分发服务分发通过对音乐信号进行编码而获得的编码数据,作为音乐数据。作为音乐信号的编码方法,以下编码方法已被广泛使用:所述方法抑制编码数据文件大小以减小比特率,从而节省下载时间。
音乐信号的这种编码方法大体上分为诸如MP3(MPEG(运动图片专家组)音频层3)(国际标准ISO/IEC11172-3)的编码方法、以及诸如HE-AAC(高效MPEG4AAC)(国际标准ISO/IEC14496-3)的编码方法。
MP3所代表的编码方法消除了音乐信号中的人类几乎感觉不到的具有大约15kHz或大于15kHz的高频带(在下文中称为高带)的信号分量,并且对其余的低频带(在下文中称为低带)的信号分量进行编码。因此,该编码方法被称为高带消除编码方法。这种高带消除编码方法能够抑制编码数据的文件大小。然而,由于人类可以轻微地感知高带中的声音,因此,如果根据通过对编码数据进行解码而获得的解码音乐信号产生声音并输出声音,则会遭受音质的损失,由此,损失了原始声音的真实感并且出现诸如声音模糊的音质退化。
与此不同,HE-AAC所代表的编码方法从高带的信号分量提取特定信息,并且结合低带的信号分量对该信息进行编码。以下将该编码方法称为高带特征编码方法。由于高带特征编码方法仅对高带的信号分量的特征信息进行编码,作为关于高带的信号分量的信息,所以抑制了音质的退化并且可以提高编码效率。
在对高带特征编码方法所编码的数据进行解码时,对特征信息和低带的信号分量进行解码,并且根据被解码后的特征信息和低带的信号分量产生高带的信号分量。因此,将以下技术称为带扩展技术:其通过根据低带的信号分量产生高带的信号分量来扩展高带的信号分量的频带。
作为带扩展方法的应用示例,在对高带消除编码方法所编码的数据进行解码后,进行后处理。在后处理中,编码时的高带信号分量损失是从解码的低带信号分量生成的,从而扩展了低带的信号分量的频带(参见专利文献1)。现有技术的频带扩展方法以下将称为专利文献1的带扩展方法。
在专利文献1的带扩展方法中,装置通过将解码后的低带的信号分量设置为输入信号来根据输入信号的功率谱估计高带的功率谱(下文中,适当地称为高带的频率包络),并且根据低带的信号分量产生具有高带的频率包络的高带的信号分量。
图1示出了作为输入信号的解码后的低带的功率谱和估计的高带的频率包络的示例。
在图1中,竖直轴示出了作为对数的功率,并且水平轴示出了频率。
装置根据关于输入信号的编码系统的种类以及信息(诸如采样速率、比特率等)(下文中称为边信息)确定高带的信号分量的低带中的频带(下文中称为扩展起始带)。接着,装置将作为低带的信号分量的输入信号分割为多个子带信号。装置获得分割后的多个子带信号,即,获得了在比扩展起始带低的低带侧(在下文中简称为低带侧)的多个子带信号的每个功率的时间方向上的各个组(在下文中称为组功率)的平均。如图1中示出的,根据这些装置,假定低带侧的多个子带的信号的各个组功率的平均是功率,并且使得扩展起始带的较低端的频率为频率的点是起始点。装置估计通过起始点的预定斜率的基本直线作为高于扩展起始带的高带(在下文中,简称为高带侧)的频率包络。此外,可以由用户调整起始点的功率方向上的位置。装置根据低带侧的子带的多个信号来产生高带侧的子带的多个信号中的每个,作为估计的高带侧的频率包络。装置将高带侧的子带的多个产生的信号彼此相加成高带的信号分量,并且将低带的信号分量彼此相加以输出相加的信号分量。因此,扩展频带后的音乐信号接近于原始音乐信号。然而,可以产生更好质量的音乐信号。
专利文献1中公开的带扩展方法具有以下优点:在对关于各种高带消除编码方法的编码数据以及各种比特率的编码数据进行解码之后,针对音乐信号可以扩展频带。
引用文献列表
专利文献
专利文献1:日本专利申请公开第2008-139844号
发明内容
因此,可以改进专利文献1中公开的带扩展方法,在于:估计的高带侧的频率包络是预定斜率的基本直线,即,频率包络的形状是固定的。
换言之,音乐信号的功率谱具有各种形状,并且音乐信号具有许多以下情况:专利文献1中所公开的带扩展方法所估计的高带侧的频率包络显著地偏离。
图2示出了在用力击打一次鼓时具有时间上快速变化的攻击型音乐信号(attack music signal)的原始功率谱的示例。
此外,图2还示出了通过用专利文献1中公开的带扩展方法将攻击型相对音乐信号的低带侧的信号分量设置为输入信号来根据输入信号估计的高带侧的频率包络。
如图2中所示出的,攻击型音乐信号的原始高带侧的功率谱具有基本上平坦的形状。
与此不同,估计的高带侧的频率包络具有预定的负斜率,并且即使该频率被调节为具有接近原始功率谱的功率,该功率与原始功率谱之间的差也随着频率变高而变大。
因此,在专利文献1中公开的带扩展方法中,估计的高带侧的频率包络不能够以高精确度再现原始高带侧的频率包络。因此,如果扩展频带后的来自音乐信号的声音被再现和输出,则声音的清晰度在听觉上低于原始声音。
此外,在如上所述的HE-AAC等高带特征编码方法中,高带侧的频率包络用作编码的高带信号分量的特征信息。然而,需要在解码侧以高精确度再现原始高带侧的频率包络。
本发明是考虑了这样的情况而做出的,并且通过扩展频带来提供具有更好音质的音乐信号。
问题的解决方案
根据本发明的第一方面的一种信号处理装置,包括:解复用单元,将输入编码数据解复用为低带编码数据和如下数据:该数据包括:关于包括多个帧的待处理区间中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息;低带解码单元,对低带编码数据进行解码以产生低带信号;选择单元,基于数据从多个系数中选择待处理的帧的系数;高带子带功率计算单元,基于构成待处理的帧的低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成待处理的帧的高带信号的每个子带的高带子带信号的高带子带功率;以及高带信号产生单元,基于高带子带功率和低带子带信号来产生待处理的帧的高带信号。
待处理区间可以被分割成区间,使得其中选择不同系数的、彼此相邻的帧的位置被设置成区间的边界位置,并且表示区间中的每个区间的长度的信息被设置成关于区间的信息。
待处理区间可以被分割成具有相同长度的若干区间,使得区间的长度最长,并且表示长度的信息以及表示所选择的系数是否在区间的每个边界位置之前或之后变化的信息被设置成关于区间的信息。
当在连续的若干区间中选择相同的系数时,数据可以包括用于获得在若干连续的区间中选择的系数的一条系数信息。
可以通过在第一方式和第二方式之间的具有较少数据量的方式来针对每个待处理区间产生数据,其中,在第一方式中,待处理区间被分割成区间,使得其中选择不同系数的、彼此相邻的帧的位置被设置成区间的边界位置,并且表示区间中的每个区间的长度的信息被设置成关于区间的信息,其中,在第二方式中,待处理区间被分割成具有相同长度的若干区间,使得区间的长度最长,并且表示长度的信息以及表示所选择的系数是否在区间的边界位置之前或之后变化的信息被设置成关于区间的信息,以及其中,数据可以进一步包括表示数据是通过第一方式获得还是通过第二方式获得的信息。
数据可以进一步包括表示待处理区间中的初始帧的系数是否与初始帧的紧前面的帧的系数相同的再利用信息,以及当数据包括表示系数相同的再利用信息时,数据可以不包括待处理区间的初始区间的系数信息。
当指定其中系数信息被再利用的模式时,数据可以包括再利用信息,并且当指定其中系数信息的再利用被禁止的模式时,数据可以不包括再利用信息。
根据本发明的第一方面的信号处理方法或程序包括如下步骤:将输入编码数据解复用为低带编码数据和如下数据:该数据包括:关于包括多个帧的待处理帧中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息;对低带编码数据进行解码以产生低带信号;基于数据从多个系数中选择待处理的帧的系数;基于构成待处理的帧的低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成待处理的帧的高带信号的每个子带的高带子带信号的高带子带功率;以及基于高带子带功率和低带子带信号来产生待处理的帧的高带信号。
在本发明的第一方面中,输入编码数据被解复用为低带编码数据和如下数据:该数据包括:关于包括多个帧的待处理帧中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息,低带编码数据被解码以产生低带信号,基于数据从多个系数中选择待处理的帧的系数,基于构成待处理的帧的低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成待处理的帧的高带信号的每个子带的高带子带信号的高带子带功率,并且基于高带子带功率和低带子带信号来产生待处理的帧的高带信号。
根据本发明的第二方面的一种信号处理装置,包括:子带分割单元,产生在输入信号的低带侧的多个子带的低带子带信号,以及在输入信号的高带侧的多个子带的高带子带信号;伪高带子带功率计算单元,基于低带子带信号和预定系数来计算作为高带子带信号的功率的估计值的伪高带子带功率;选择单元,通过将高带子带信号的高带子带功率与伪高带子带功率相比较,来选择用于输入信号的各个帧的多个系数中的任何系数;以及产生单元,产生如下数据:该数据包括:关于具有输入数据的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息。
产生单元可以将待处理区间分割成区间,使得其中选择不同系数的、彼此相邻的帧的位置被设置成区间的边界位置,并且将表示区间中的每个区间的长度的信息设置成关于区间的信息。
产生单元可以将待处理区间分割成具有相同长度的若干区间,使得区间的长度最长,并且表示长度的信息以及表示所选择的系数是否在区间的边界位置之前或之后变化的信息被设置成关于区间的信息。
当在若干连续的区间中选择相同的系数时,产生单元可以产生包括用于获得在若干连续的区间中选择的系数的一条系数信息的数据。
产生单元可以使用在第一方式和第二方式之间的具有较少数据量的方式针对每个待处理区间产生数据,其中,在第一方式中,待处理区间被分割成区间,使得其中选择不同系数的、彼此相邻的帧的位置被设置成区间的边界位置,并且表示区间中的每个区间的长度的信息被设置成关于区间的信息,并且其中,在第二方式中,待处理区间被分割成具有相同长度的若干区间,使得区间的长度最长,并且表示长度的信息以及表示所选择的系数是否在区间的边界位置之前或之后变化的信息被设置成关于区间的信息。
数据可以进一步包括表示数据是通过第一方式获得还是通过第二方式获得的信息。
产生单元产生包括表示待处理区间中的初始帧的系数是否与初始帧的紧前面的帧的系数相同的再利用信息的数据,以及当数据中包括表示系数相同的再利用信息时,产生其中不包括待处理区间的初始区间的系数信息的数据。
当指定其中系数信息被再利用的模式时,产生单元产生包括再利用信息的数据,并且当指定其中系数信息的再利用被禁止的模式时,产生单元产生其中不包括再利用信息的数据。
根据本发明的第二方面的信号处理方法或程序包括如下步骤:产生在输入信号的低带侧的多个子带的低带子带信号和在输入信号的高带侧的多个子带的高带子带信号;基于低带子带信号和预定系数来计算作为高带子带信号的功率的估计值的伪高带子带功率;通过将高带子带信号的高带子带功率与伪高带子带功率相比较,来选择用于输入信号的各个帧的多个系数中的任何系数;以及产生如下数据:该数据包括:关于具有输入数据的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息。
在本发明的第二方面中,提供在输入信号的低带侧的多个子带的低带子带信号和在输入信号的高带侧的多个子带的高带子带信号,基于低带子带信号和预定系数来计算作为高带子带信号的功率的估计值的伪高带子带功率,通过将高带子带信号的高带子带功率与伪高带子带功率相比较,来选择用于输入信号的各个帧的多个系数中的任何系数,以及产生如下数据:该数据包括:关于具有输入数据的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息。
根据本发明的第三方面的一种解码器包括:解复用单元,将输入编码数据解复用为低带编码数据和如下数据:该数据包括:关于包括多个帧的待处理区间中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息;低带解码单元,对低带编码数据进行解码以产生低带信号;选择单元,基于数据从多个系数中选择待处理的帧的系数;高带子带功率计算单元,基于构成待处理的帧的低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成待处理的帧的高带信号的每个子带的高带子带信号的高带子带功率;高带信号产生单元,基于高带子带功率和低带子带信号来产生待处理的帧的高带信号;以及合成单元,将低带信号与高带信号进行合成以产生输出信号。
本发明的第三方面的解码方法包括如下步骤:将输入编码数据解复用为低带编码数据和如下数据:该数据包括:关于包括多个帧的待处理区间中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息,对低带编码数据进行解码以产生低带信号,基于数据从多个系数中选择待处理的帧的系数,基于构成待处理的帧的低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成待处理的帧的高带信号的每个子带的高带子带信号的高带子带功率,基于高带子带功率和低带子带信号来产生待处理的帧的高带信号,并且将低带信号与高带信号进行合成以产生输出信号。
在本发明的第三方面中,输入编码数据被解复用为低带编码数据和如下数据:该数据包括:关于包括多个帧的待处理区间中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在区间的帧中所选择的系数的系数信息,对低带编码数据进行解码以产生低带信号,基于数据从多个系数中选择待处理的帧的系数,基于构成待处理的帧的低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成待处理的帧的高带信号的每个子带的高带子带信号的高带子带功率,基于高带子带功率和低带子带信号来产生待处理的帧的高带信号,并且将低带信号与高带信号进行合成以产生输出信号。
根据本发明的第四方面的一种编码器包括:子带分割单元,产生在输入信号的低带侧的多个子带的低带子带信号,以及在输入信号的高带侧的多个子带的高带子带信号;伪高带子带功率计算单元,基于低带子带信号和预定系数来计算作为高带子带信号的功率的估计值的伪高带子带功率;选择单元,通过将高带子带信号的高带子带功率与伪高带子带功率相比较,来选择用于输入信号的各个帧的多个系数中的任何系数;高带编码单元,通过对关于包括输入数据的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息以及用于获得在区间的帧中所选择的系数的系数信息进行编码,来产生高带编码数据;低带编码单元,对输入信号的低带信号进行编码并且产生低带编码数据;以及复用单元,通过对低带编码数据和高带编码数据进行复用来产生输出代码串。
本发明的第四方面的编码方法包括:产生在输入信号的低带侧的多个子带的低带子带信号,以及在输入信号的高带侧的多个子带的高带子带信号,基于低带子带信号和预定系数来计算作为高带子带信号的功率的估计值的伪高带子带功率,通过将高带子带信号的高带子带功率与伪高带子带功率相比较,来选择用于输入信号的各个帧的多个系数中的任何系数,通过对关于包括输入数据的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息以及用于获得在区间的帧中所选择的系数的系数信息进行编码,来产生高带编码数据,对输入信号的低带信号进行编码并且产生低带编码数据,并且通过对低带编码数据和高带编码数据进行复用来产生输出代码串。
在本发明的第四方面中,提供在输入信号的低带侧的多个子带的低带子带信号,以及在输入信号的高带侧的多个子带的高带子带信号,基于低带子带信号和预定系数来计算作为高带子带信号的功率的估计值的伪高带子带功率,通过将高带子带信号的高带子带功率与伪高带子带功率相比较,来选择用于输入信号的各个帧的多个系数中的任何系数,通过对关于包括输入数据的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息以及用于获得在区间的帧中所选择的系数的系数信息进行编码,来产生高带编码数据,对输入信号的低带信号进行编码并且产生低带编码数据,并且通过对低带编码数据和高带编码数据进行复用来产生输出代码串。
发明效果
根据第一至第四实施例,可以通过频带的扩展以重现具有改善的音质的音乐信号。
附图说明
图1是示出了对输入信号进行解码后的低带的功率谱以及估计的高带的频率包络的示例的视图。
图2是示出了根据时间的快速变化的攻击型音乐信号的原始功率谱的示例的视图。
图3是示出了本发明的第一实施例的频带扩展装置的功能配置示例的框图。
图4是示出了通过图3中的频带扩展装置进行的频带扩展处理的示例的流程图。
图5是示出了输入至图3中的频带扩展装置的信号的功率谱的布置以及带通滤波器的频率轴上的布置的视图。
图6是示出了图示声音区间的频率特性以及估计的高带的功率谱的示例的视图。
图7是示出了输入至图3中的频带扩展装置的信号的功率谱的示例的视图。
图8是示出了在对图7中输入信号的同态滤波后的功率矢量的示例的视图。
图9是示出了系数学习装置的功能配置示例的框图,该系数学习装置用于进行图3中的频带扩展装置的高带信号产生电路中使用的系数的学习。
图10是描述了由图9中的系数学习装置进行的系数学习处理的示例的流程图。
图11是示出了本发明的第二实施例的编码器的功能配置示例的框图。
图12是描述了由图11中的编码器进行的编码处理的示例的流程图。
图13是示出了本发明的第二实施例的解码器的功能配置示例的框图。
图14是描述了由图13中的解码器进行的解码处理的示例的流程图。
图15是示出了系数学习装置的功能配置示例的框图,该系数学习装置用于进行图11中的编码器的高带编码电路中使用的代表矢量的学习以及进行图13中的解码器的高带解码电路中使用的已解码高带子带功率估计系数的学习。
图16是描述了由图15中的系数学习装置进行的系数学习处理的示例的流程图。
图17是示出了图11中的编码器输出的编码串的示例的视图。
图18是示出了编码器的功能配置示例的框图。
图19是描述编码处理的流程图。
图20是示出了解码器的功能配置示例的框图。
图21是描述解码处理的流程图。
图22是描述编码处理的流程图。
图23是描述解码处理的流程图。
图24是描述编码处理的流程图。
图25是描述编码处理的流程图。
图26是描述编码处理的流程图。
图27是描述编码处理的流程图。
图28是示出了系数学习装置的配置示例的视图。
图29是描述系数学习处理的流程图。
图30是描述系数索引串的编码量缩减的视图。
图31是描述系数索引串的编码量缩减的视图。
图32是描述系数索引串的编码量缩减的视图。
图33是示出了编码器的功能配置示例的框图。
图34是描述编码处理的流程图。
图35是示出了解码器的功能配置示例的框图。
图36是描述解码处理的流程图。
图37是描述系数索引串的编码量缩减的视图。
图38是示出了解码器的功能配置示例的框图。
图39是描述编码处理的流程图。
图40是示出了解码器的功能配置示例的框图。
图41是描述编码处理的流程图。
图42是示出了编码器的功能配置示例的框图。
图43是描述编码处理的流程图。
图44是示出了解码器的功能配置示例的框图。
图45是描述解码处理的流程图。
图46是描述系数索引串的循环的视图。
图47是描述编码处理的流程图。
图48是描述解码处理的流程图。
图49是描述编码处理的流程图。
图50是描述解码处理的流程图。
图51是示出了通过程序执行应用本发明的处理的计算机的硬件的配置示例的框图。
具体实施方式
将参照附图描述本发明的实施例。此外,关于实施例的描述按以下顺序进行。
1.第一实施例(当本发明应用于频带扩展装置时)
2.第二实施例(当本发明应用于编码器和解码器时)
3.第三实施例(当系数索引包括在高带编码数据中时)
4.第四实施例(当系数索引与伪高带子带功率之间的差包括在高带编码数据中时)
5.第五实施例(当使用估计值来选择系数索引时)
6.第六实施例(当系数的一部分是公用时)
7.第七实施例(当通过可变长度方法在时间方向上缩减系数索引串的编码量时)
8.第八实施例(当通过固定长度方法在时间方向上缩减系数索引串的编码量时)
9.第九实施例(当选择可变长度方法或固定长度方法中的任一方法时)
10.第十实施例(当通过可变长度方法执行信息的循环时)
11.第十一实施例(当通过固定长度方法执行信息的循环时)
<1.第一实施例>
在第一实施例中,关于通过对用高带消除编码方法得到的编码数据进行解码而获得的解码后的低带的信号分量,执行扩展频带的处理(在下文中称为频带扩展处理)。
[频带扩展装置的功能配置示例]
图3示出了根据本发明的频带扩展装置的功能配置示例。
频带扩展装置10通过将解码后的低带的信号分量设置为输入信号而关于输入信号进行频带扩展处理,并且输出由该结果获得的频带扩展处理后的信号作为输出信号。
频带扩展装置10包括低通滤波器11、延迟电路12、带通滤波器13、特征量计算电路14、高带子带功率估计电路15、高带信号产生电路16、高通滤波器17和信号加法器18。
低通滤波器11通过预定截止频率对输入信号进行滤波并且向延迟电路12提供低带信号分量(其是低带的信号分量)作为滤波后的信号。
由于当将来自低通滤波器11的低带信号分量与稍后将描述的高带信号分量彼此相加时使延迟电路12同步,所以其将低带信号分量仅延迟了特定时间,并且该低带信号分量被提供至信号加法器18。
带通滤波器13包括具有彼此不同的通带的带通滤波器13-1到13-N。带通滤波器13-i(1≤i≤N)使输入信号的预定通带的信号通过,并且将通过的信号作为多个子带信号中的一个提供给特征量计算电路14和高带信号产生电路16。
特征量计算电路14通过使用输入信号和来自带通滤波器13的多个子带信号中的至少任意一个来计算一个或更多个特征量,并且将计算的特征量提供给高带子带功率估计电路15。在本文中,特征量是表示作为信号的输入信号的特征的信息。
高带子带功率估计电路15基于来自特征量计算电路14的一个或更多个特征量来计算作为每个高带子带的高带子带信号的功率的、高带子带功率的估计值,并且将计算的估计值提供给高带信号产生电路16。
高带信号产生电路16基于来自带通滤波器13的多个子带信号和来自高带子带功率估计电路15的多个高带子带功率的估计值,来产生作为高带的信号分量的高带信号分量,并且将产生的高带信号分量提供给高通滤波器17。
高通滤波器17使用与低通滤波器11中的截止频率对应的截止频率对来自高带信号产生电路16的高带信号分量进行滤波,并且将经滤波的高带信号分量提供给信号加法器18。
信号加法器18将来自延迟电路12的低带信号分量与来自高通滤波器17的高带信号分量相加,并且输出相加的分量作为输出信号。
此外,在图3中的配置中,为了获得子带信号,应用了带通滤波器13,但不限于此。例如,可以应用专利文献1中公开的带分割滤波器。
此外,同样地,在图3中的配置中,应用了信号加法器18以合成子带信号,但是不限于此。例如,可以应用专利文献1中公开的带合成滤波器。
[频带扩展装置的频带扩展处理]
接下来,参照图4中的流程图,将描述由图3中的频带扩展装置进行的频带扩展处理。
在步骤S1中,低通滤波器11通过预定截止频率对输入信号进行滤波,并且将低带信号分量作为滤波后的信号提供给延迟电路12。
低通滤波器11可以设置任选频率作为截止频率。然而,在本发明的实施例中,作为下述的扩展起始带,低通滤波器可以通过设置预定频率而被设置为对应于扩展起始带的低端的频率。因此,低通滤波器11将作为比扩展起始带更低的带的信号分量的低带信号分量提供给延迟电路12,作为滤波后的信号。
此外,低通滤波器11可以响应于编码参数(如高带消除编码方法或输入信号的比特率等)将最优频率设置为截止频率。作为编码参数,例如,可以使用专利文献1中公开的带扩展方法中采用的边信息。
在步骤S2中,延迟电路12将来自低通滤波器11的低带信号分量仅延迟了特定延长时间,并且将延迟的低带信号分量提供给信号加法器18。
在步骤S3中,带通滤波器13(带通滤波器13-1至13-N)将输入信号分割成多个子带信号并且将分割后的多个子带信号中的每个提供给特征量计算电路14和高带信号产生电路16。此外,下面将描述由带通滤波器13进行的输入信号的分割处理。
在步骤S4中,特征量计算电路14通过输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算一个或更多个特征量,并且将计算的特征量提供给高带子带功率估计电路15。此外,下面将详细描述由特征量计算电路14进行的对特征量的计算处理。
在步骤S5中,高带子带功率估计电路15基于一个或更多个特征量来计算多个高带子带功率的估计值,并且将计算的估计值从特征量计算电路14提供给高带信号产生电路16。此外,下面将详细地描述由高带子带功率估计电路15进行的对高带子带功率的估计值的计算处理。
在步骤S6中,高带信号产生电路16基于来自带通滤波器13的多个子带信号和来自高带子带功率估计电路15的多个高带子带功率的估计值来产生高带信号分量,并且将产生的高带信号分量提供给高通滤波器17。在该情况下,高带信号分量是比扩展起始带更高的带的信号分量。此外,下面将详细描述由高带信号产生电路16进行的高带信号分量的产生处理。
在步骤S7中,高通滤波器17通过对来自高带信号产生电路16的高带信号分量进行滤波来去除高带信号分量中包括的低带中的诸如假频(alias)分量的噪声,并且将该高带信号分量提供给信号加法器18。
在步骤S8中,信号加法器18将来自延迟电路12的低带信号分量和来自高通滤波器17的高带信号分量彼此相加,并且将相加后的分量作为输出信号输出。
根据上述处理,可以关于解码后的低带的信号分量来扩展频带。
接下来,将描述针对图4中的流程图的步骤S3到S6的每个处理的说明。
[由带通滤波器进行的处理的描述]
首先,将描述图4的流程图中的步骤S3中由带通滤波器13进行的处理。
此外,为了便于说明,如下所述,假设带通滤波器13的数目N为N=4。
例如,假定通过将输入信号的奈奎斯特(Nyquist)频率分成16个部分而获得的16个子带中的一个子带是扩展起始带,并且16个子带中的比扩展起始带更低的带的4个子带中的每个是带通滤波器13-1至13-4的每个通带。
图5示出了关于对于带通滤波器13-1至13-4的每个通带的每个频率轴的布置。
如图5中示出的,如果假定从比扩展起始带更低的带的频带(子带)的高带开始的第一子带的索引是sb,第二子带的索引是sb-1,并且第I子带的索引是sb-(I-1),带通滤波器13-1到13-4中的每个指定低于扩展起始带的低带的子带中的索引为sb至sb-3的每个子带作为通带。
在本实施例中,带通滤波器13-1至13-4的每个通带是通过将输入信号的奈奎斯特频率分割成16个部分而获得的16个子带的4个预定子带,但是不限于此,并且可以是通过将输入信号的奈奎斯特频率分割成256个部分而获得的256个子带中的4个预定子带。此外,带通滤波器13-1至13-4的每个带宽可以彼此不同。
[由特征量计算电路进行的处理的描述]
接下来,将描述图4中的流程图的步骤S4中由特征量计算电路14进行的处理。
特征量计算电路14通过使用输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算所使用的一个或更多个特征量,以使得高带子带功率估计电路15计算高带子带功率的估计值。
更详细地,特征量计算电路14针对来自带通滤波器13的4个子带信号的每个子带计算子带信号的功率(在下文中称为低带子带功率)作为特征量,并且将计算的子带信号的功率提供给高带子带功率估计电路15。
换言之,特征量计算电路14通过使用以下公式(1)、根据从带通滤波器13提供的4个子带信号x(ib,n)来计算预定时间帧J中的低带子带功率power(ib,J)。本文中,ib是子带的索引,n被表示为离散时间的索引。此外,一个帧的样本的数量被表示为FSIZE,并且功率被表示为分贝。
[公式1]
power ( ib , J ) = 10 log 10 { ( &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 x ( ib , n ) 2 ) / FSIZE } ( sb - 3 &le; ib &le; sb ) . . . ( 1 )
因此,将由特征量计算电路14获得的低带子带功率power(ib,J)作为特征量提供给高带子带功率估计电路15。
[由高带子带功率估计电路进行的处理的描述]
接下来,将描述图4中的流程图的步骤S5的由高带子带功率估计电路15进行的处理。
高带子带功率估计电路15基于从特征量计算电路14提供的4个子带功率,来计算将在索引为sb+1的子带(扩展起始带)之后被扩展的带(频率扩展带)的子带功率(高带子带功率)的估计值。
即,如果高带子带功率估计电路15认为频率扩展带的最大带的子带的索引为eb,则关于索引从sb+1到eb的子带来估计(eb-sb)个子带功率。
在频率扩展带中,使用从特征量计算电路14提供的4个子带功率power(ib,j),通过以下公式(2)表示索引为ib的子带功率的估计值powerest(ib,J)。
[公式2]
power est ( ib , J ) = ( &Sigma; kb = sb - 3 sb { A ib ( kb ) power ( kb , J ) } ) + B ib ( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 2 )
本文中,在公式(2)中,系数Aib(kb)以及Bib是对于各个子带ib具有不同值的系数。系数Aib(kb)以及Bib是这样的系数:其被适当地设置以获得关于各个输入信号的适当值。此外,系数Aib(kb)以及Bib还通过改变子带sb而改变为最优值。下面将描述Aib(kb)以及Bib的推导。
在公式(2)中,高带子带功率的估计值是使用来自带通滤波器13的多个子带信号中的每个的功率、通过基本线性组合来计算的,但是不限于此,例如,可以使用时间帧J之前和之后的帧的多个低带子带功率的线性组合来计算,并且可以使用非线性函数来计算。
如上所述,将由高带子带功率估计电路15计算的高带子带功率的估计值提供给将要描述的高带信号产生电路16。
[由高带信号产生电路进行的处理的描述]
接下来,将对图4中的流程图的步骤S6中由高带信号产生电路16进行的处理进行描述。
高带信号产生电路16根据从带通滤波器13提供的多个子带信号,基于上述公式(1)来计算每个子带的低带子带功率power(ib,J)。高带信号产生电路16使用所计算的多个低带子带功率power(ib,J)以及由高带子带功率估计电路15基于上述公式(2)计算的高带子带功率的估计值powerest(ib,J),通过下述公式(3)来获得增益量G(ib,J)。
[公式3]
G ( ib , J ) = 10 { ( power est ( ib . J ) - power ( sb map ( ib ) , J ) ) / 20 } ( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 3 )
本文中,在公式(3)中,sbmap(ib)表示在子带ib被认为是原始图的子带的情况下的原始图的子带的索引,并且由以下公式4表示。
[公式4]
sb map ( ib ) = ib - 4 INT ( ib - sb - 1 4 + 1 ) ( sb + 1 &le; ib &le; eb ) . . . ( 4 )
此外,在公式(4)中,INT(a)是删去值a的小数点的函数。
接着,高带信号产生电路16通过使用以下公式(5)将由公式3获得的增益量G(ib,J)与带通滤波器13的输出相乘,来计算增益控制后的子带信号x2(ib,n)。
[公式5]
x2(ib,n)=G(ib,J)x(sbmap(ib),n)
(J*FSIZE≤n≤(J+1)FSIZE-1,sb+1≤ib≤eb)
                         ...(5)
此外,高带信号产生电路16通过以下公式(6),通过从与索引为sb-3的子带的下端的频率对应的频率执行到与索引为sb的子带的上端的频率对应的频率的余弦变换,来计算从增益调整后的子带信号x2(ib,n)余弦变换的、增益控制后的子带信号x3(ib,n)。
[公式6]
x3(ib,n)=x2(ib,n)*2cos(n)*{4(ib+1)π/32}
(sb+1≤ib≤eb)
                              ...(6)
此外,在公式(6)中,π表示圆周率。公式(6)表示增益控制后的子带信号x2(ib,n)转移到4个带部分高带侧中的每个的频率。
因此,高带信号产生电路16根据以下公式7,根据转移到高带侧的增益控制后的子带信号x3(ib,n)来计算高带信号分量xhigh(n)。
[公式7]
x high ( n ) = &Sigma; ib = sb + 1 eb x 3 ( ib , n ) . . . ( 7 )
因此,由高带信号产生电路16基于根据来自带通滤波器13的4个子带信号而获得的4个低带子带功率以及来自高带子带功率估计电路15的高带子带功率的估计值来产生高带信号分量,并且将所产生的高带信号分量提供给高通滤波器17。
根据上述处理,由于关于对用高带消除编码方法得到的编码数据进行解码之后获得的输入信号,将根据多个子带信号计算的低带子带功率设置为特征量,所以基于对其适当地设置的系数来计算高带子带功率的估计值,并且根据低带子带功率和高带子带功率的估计值来自适应地产生高带信号分量,由此可以以高精确度来估计频率扩展带的子带功率并且可以以较好的音质来再现音乐信号。
如上所述,特征量计算电路14示出了仅计算根据多个子带信号计算出的低带子带功率作为特征量的示例。然而,在这种情况下,通过输入信号的类型不能以高精确度来估计频率扩展带的子带功率。
本文中,因为特征量计算电路14计算与频率扩展带(高带的功率谱形状)的子带功率的输出系统具有强的相关性的特征量,所以能够以高精确度进行高带子带功率估计电路15中的频率扩展带的子带功率的估计。
[由特征量计算电路计算的特征量的另一个示例]
图6示出了占据大部分声音的声音区间的频率特征和高带的功率谱的示例,该高带的功率谱是通过经由仅计算低带子带功率作为特征量来估计高带子带功率而获得的。
如在图6中示出的,在声音区间的频率特征中,具有许多以下情况:所估计的高带的功率谱具有比原始信号的高带的功率谱高的位置。由于人的歌声的不协调感容易被人耳感知,所以必须在声音区间中以高精确度对高带子带功率进行估计。
此外,如图6中示出的,在声音区间的频率特征中,具有许多以下情况:从4.9kHz到11.025kHz布置有较大的凹陷。
本文中,如下所述,将描述如下示例:可以应用频率区间中的4.9kHz到11.025kHz的凹陷程度作为用于估计声音区间的高带子带功率的特征量。此外,表示凹陷程度的特征量以下被称为凹谷(dip)。
以下将描述时间帧J中的凹谷dip(J)的计算示例。
关于包括在输入信号的时间帧J之前和之后的几个帧的范围中的2048个采样区间的信号,进行2048个点的快速傅里叶变换(FFT),并且计算频率轴上的系数。功率谱是关于所计算的系数中的每一个的绝对值进行db转换而获得的。
图7示出了上述方法中获得的功率谱的一个示例。在本文中,为了去除功率谱中的微小分量,例如,为了去除1.3kHz或更小的分量,进行升降处理。如果进行升降处理,则可以通过根据时间序列选择功率谱的每个维数以及借助应用低通滤波器进行滤波器处理,来平滑谱峰的微小分量。
图8示出了升降后的输入信号的功率谱的示例。在图8中示出的恢复后的功率谱中,包括在对应于4.9kHz到11.025kHz的范围中的最小值与最大值之间的差被设置为凹谷dip(J)。
如上所述,计算了与频率扩展带的子带功率具有强的相关性的特征量。此外,凹谷dip(J)的计算示例不限于上述方法,也可以执行其它方法。
接下来,将描述与频率扩展带的子带功率具有强的相关性的特征量的计算的其它示例。
[由特征量计算电路计算的特征量的又一个示例]
在作为包括任何输入信号中的攻击型音乐信号的区间的攻击区间的频率特征中,存在许多以下情况:高带的功率谱基本上是平坦的,如参照图2所描述的。仅计算低带子带功率作为特征量的方法难以在没有指示具有包括攻击区间的特定输入信号的时间变化的特征量的情况下以高精确度估计从攻击区间看到的几乎平坦的频率扩展带的子带功率,以便估计频率扩展带的子带功率。
在本文中,下面将描述应用低带子带功率的时间变化的示例,作为用于估计攻击区间的高带子带功率的特征量。
例如,某些时间帧J中的低带子带功率的时间变化powerd(J)是根据以下公式(8)来获得的。
[公式8]
power d ( J ) = &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 ( x ( ib , n ) 2 ) / &Sigma; ib = sb - 3 sb &Sigma; n = ( J - 1 ) FSIZE J * FSIZE - 1 ( x ( ib , n ) 2 ) . . . ( 8 )
根据公式8,低带子带功率的时间变化powerd(J)表示时间帧J-1中的4个低带子带功率的和与时间帧J中的一个帧前面的时间帧(J-1)中的4个低带子带功率的和之间的比率,如果该值变大,则帧之间的功率的时间变化是大的,即,包括在时间帧J中的信号被认为具有很强的攻击型。
此外,如果将在图1中示出的为统计上平均的功率谱与在图2中示出的攻击区间(攻击型音乐信号)的功率谱进行比较,则攻击区间中的功率谱朝向中带的右方上升。在攻击区间之间,存在示出频率特征的许多情况。
因此,下面将描述以下示例:其应用中带中的斜率作为用于估计攻击区间之间的高带子带功率的特征量。
例如,某些时间帧J中的中带的斜率slope(J)是根据以下公式(9)来获得的。
[公式9]
slope ( J ) = &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 { W ( ib ) * x ( ib , n ) 2 ) } / &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 ( x ( ib , n ) 2 ) . . . ( 9 )
在公式(9)中,系数w(ib)是被调节以对高带子带功率进行加权的权重因子。根据公式(9),slope(J)表示加权到高带的4个低带子带功率的和与4个低带子带功率的和之间的比率。例如,如果将4个低带子带功率设置为关于中带的子带的功率,则slope(J)在中带的功率谱向右方上升时具有大的值,并且功率谱在功率谱向右方下降时具有小的值。
由于存在中带的斜率在攻击区间之前和之后显著地变化的许多情况,所以可以假设由以下公式(10)表示的斜率的时间变化sloped(J)是在估计攻击区间的高带子带功率时使用的特征量。
[公式10]
sloped(J)=slope(J)/slope(J-1)
(J*FSIZE≤n≤(J+1)FSIZE-1)
                   ...(10)
此外,可以假设上述凹谷dip(J)的由以下公式(11)表示的时间变化dipd(J)是在估计攻击区间的高带子带功率时使用的特征量。
[公式11]
dipd(J)=dip(J)-dip(J-1)
(J*FSIZE≤n≤(J+1)FSZIE-1)
                    ...(11)
根据上述方法,因为计算了与频率扩展带的子带功率具有强的相关性的特征量,因此,如果使用该方法,则能够以高精确度进行高带子带功率估计电路15中的对频率扩展带的子带功率的估计。
如上所述,描述了用于计算与频率扩展带的子带功率具有强的相关性的特征量的示例。然而,下面将使用由上述方法计算的特征量来描述用于估计高带子带功率的示例。
[由高带子带功率估计电路进行的处理的描述]
在本文中,将描述用于使用参照图8描述的凹谷和低带子带功率作为特征量来估计高带子带功率的示例。
即,在图4的流程图中的步骤S4中,特征量计算电路14针对来自带通滤波器13的4个子带信号的每个子带,计算低带子带功率和凹谷作为特征量,并且将所计算的低带子带功率和凹谷提供给高带子带功率估计电路15。
因此,在步骤S5中,高带子带功率估计电路15基于来自特征量计算电路14的凹谷和4个低带子带功率来计算高带子带功率的估计值。
在本文中,在子带功率和凹谷中,因为所获得的值的范围(比例)彼此不同,所以高带子带功率估计电路15例如关于凹谷值来进行以下转换。
高带子带功率估计电路15关于预定的大量输入信号来计算凹谷值和4个低带子带功率的最大带的子带功率,并且分别获得平均值和标准偏差。在本文中,假设子带功率的平均值是powerave,子带功率的标准偏差是powerstd,凹谷的平均值是dipave,并且凹谷的标准偏差是dipstd
高带子带功率估计电路15使用如在以下公式(12)中的值来转换凹谷的值dip(J),并且获得转换后的凹谷dips(J)。
[公式12]
dip s ( J ) = dip ( J ) - dip ave dip std power std + power ave . . . ( 12 )
通过进行公式(12)中描述的转换,高带子带功率估计电路15可以将凹谷的值dip(J)统计地转换为低带子带功率的平均和离差的等同变量(凹谷)dips(J),并且使得根据凹谷获得的值的范围近似地等于根据子带功率获得的值的范围。
在频率扩展带中,根据公式13,通过来自特征量计算电路14的4个低带子带功率power(ib,J)与在公式(12)中示出的凹谷dips(J)的线性组合来表示索引为ib的子带功率的估计值powerest(ib,J)。
[公式13]
power est ( ib , J ) = ( &Sigma; kb = sb - 3 sb { C ib ( kb ) power ( kb , J ) } ) + D ib dip s ( J ) + E ib ( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 13 )
在本文中,在公式(13)中,系数Cib(kb)、Dib、Eib是对于每个子带ib具有不同值的系数。系数Cib(kb)、Dib和Eib是这样的系数:其被适当地设置以获得关于各个输入信号的有利值。此外,还将系数Cib(kb)、Dib和Eib改变到最优值以改变子带sb。此外,下面将描述系数Cib(kb)、Dib和Eib的推导。
在公式(13)中,通过线性组合来计算高带子带功率的估计值,但是不限于此。例如,可以使用时间帧J之前和之后的几个帧的多个特征量的线性组合来计算估计值,也可以使用非线性函数来计算估计值。
根据上述处理,可以再现具有较好质量的音乐信号,因为在对高带子带功率进行估计时使用声音区间的特定凹谷的值作为特征量相比于假定只有低带子带功率是特征量的情况提高了声音区间处的高带子带功率估计精确度,高带的功率谱是通过被估计为大于原始信号的高带功率谱来产生的,并且使用仅将低带子带作为特征量的方法,人耳能够容易地感知不协调感。
因此,在子带的分割数量是16的情况下,因为关于由上述方法计算为特征量的凹谷(在声音区域的频率特征中的凹陷的程度),频率分辨率是低的,所以凹陷的程度不能仅用低带子带功率来表示。
在本文中,提高了频率分辨率,并且可以仅用低带子带功率来表示凹陷的程度,这是因为子带的分割数量增加(例如,16倍的256个分割),带通滤波器13的带分割数量增加(例如,16倍的64),并且特征量计算电路14计算的低带子带功率的数量增加(16倍的64)。
仅通过低带子带功率,假定可以以基本上等于对用作特征量的高带子带功率和上述凹谷的估计的精确度的精确度来估计高带子带功率。
然而,计算量通过增加子带的分割数量,带的分割数量和低带子带功率的数量的增加而增加。如果假定能够以等于任何方法的精确度的精确度来估计高带子带功率,则使用凹谷作为特征量对高带子带功率进行估计而不增加子带分割数量的方法被认为在计算量的方面是有效的。
如上所述,描述了使用凹谷和低带子带功率来估计高带子带功率的方法,但是作为用于估计高带子带功率的特征量,上述一个或更多个特征量(低带子带功率、凹谷、低带子带功率的时间变化、斜率、斜率的时间变化和凹谷的时间变化)都可以,而不限于该组合。在这种情况下,可以提高对高带子带功率进行的估计的精确度。
此外,如上所述,在输入信号中,可以通过使用特定参数作为估计高带子带功率时使用的特征量来提高估计高带子带功率困难的区间的估计精确度。例如,低带子带功率的时间变化、斜率、斜率的时间变化和凹谷的时间变化是攻击区域中的特定参数,并且能够通过使用其参数作为特征量来提高攻击区域中的高带子带功率的估计精确度。
此外,即使使用除了低带子带功率和凹谷外的特征量(即,低带子带功率的时间变化、斜率、斜率的时间变化和凹谷的时间变化)来进行高带子带功率的估计,也能够以与上述方法相同的方式来估计高带子带功率。
此外,本说明书所描述的特征量的每种计算方法不限于上述方法,并且可以使用其它方法。
[用于获得系数Cib(kb)、Dib、Eib的方法]
接下来,将在上述公式(13)中描述用于获得系数Cib(kb)、Dib和Eib的方法。
应用基于学习结果来确定系数的方法,其使用具有预定宽带的指示信号(在下文中,称为宽带指示信号)进行学习,以使得作为用于获得系数Cib(kb)、Dib和Eib的方法,系数Cib(kb)、Dib和Eib变为关于估计频率扩展带的子带功率时的各种输入信号的适合的值。
当进行系数Cib(kb)、Dib和Eib的学习时,将包括具有与参照图5描述的带通滤波器13-1至13-4相同的通带宽度的带通滤波器的系数学习装置应用于比扩展起始带更高的高带。该系数学习装置在输入宽带指示时进行学习。
[系数学习装置的功能配置示例]
图9示出了执行系数Cib(kb)、Dib和Eib的学习的系数学习装置的功能配置示例。
输入到图9中的系数学习装置20的宽带指示信号的比扩展起始带更低的低带的信号分量是这样的信号:该信号是按照与当对输入到图3中的频带扩展装置10的具有有限带的输入信号进行编码时执行的编码方法相同的方式而编码的。
系数学习装置20包括带通滤波器21、高带子带功率计算电路22、特征量计算电路23和系数估计电路24。
带通滤波器21包括具有彼此不同的通带的带通滤波器21-1至21-(K+N)。带通滤波器21-i(1≤i≤K+N)使输入信号的预定通带的信号通过,并且将通过的信号提供给高带子带功率计算电路22或特征量计算电路23,以作为多个子带信号中的一个。此外,带通滤波器21-1至21-(K+N)中的带通滤波器21-1至21-K使比扩展起始带更高的高带的信号通过。
高带子带功率计算电路22关于来自带通滤波器21的高带的多个子带信号来计算针对每个恒定时间帧的每个子带的高带子带功率,并且将所计算的高带子带功率提供给系数估计电路24。
特征量计算电路23针对与高带子带功率由高带子带功率计算电路22计算的恒定时间帧相同的各个时间帧,来计算与由图3中的频带扩展装置10的特征量计算电路14计算的特征量相同的特征量。即,特征量计算电路23使用宽带指示信号和来自带通滤波器21的多个子带信号中的至少一个来计算一个或更多个特征量,并且将所计算的特征量提供给系数估计电路24。
系数估计电路24针对每个恒定时间帧,基于来自高带子带功率计算电路22的高带子带功率和来自特征量计算电路23的特征量,来估计在图3中的频带扩展装置10的高带子带功率估计电路15处使用的系数(系数数据)。
[系数学习装置的系数学习处理]
接下来,参照图10中的流程图,将描述由图9中的系数学习装置进行的系数学习处理。
在步骤S11中,带通滤波器21将输入信号(扩展带指示信号)分成(K+N)个子带信号。带通滤波器21-1至21-K将比扩展起始带更高的高带的多个子带信号提供给高带子带功率计算电路22。此外,带通滤波器21-(K+1)至21-(K+N)将比扩展起始带更低的低带的多个子带信号提供给特征量计算电路23。
在步骤S12中,高带子带功率计算电路22关于来自带通滤波器21(带通滤波器21-1至21-K)的高带的多个子带信号来计算针对每个恒定时间帧的每个子带的高带子带功率power(ib,J)。高带子带功率power(ib,J)是通过上述公式(1)来获得的。高带子带功率计算电路22将所计算的高带子带功率提供给系数估计电路24。
在步骤S13中,特征量计算电路23针对与高带子带功率由高带子带功率计算电路22来计算的恒定时间帧相同的每个时间帧,计算特征量。
此外,如下所述,在图3中的频带扩展装置10的特征量计算电路14中,假定计算低带的4个子带功率和凹谷作为特征量,并且将描述:在系数学习装置20的特征量计算电路23中类似地计算低带的凹谷和4个子带功率。
即,特征量计算电路23使用来自带通滤波器21(带通滤波器21-(K+1)至21-(K+4))的、输入到频带扩展装置10的特征量计算电路14的同样的相应的4个子带信号的4个子带信号,来计算4个低带子带功率。此外,特征量计算电路23从扩展带指示信号计算凹谷并且基于上述公式(12)来计算凹谷dips(J)。此外,特征量计算电路23将4个低带子带功率和凹谷dips(J)作为特征量提供给系数估计电路24。
在步骤S14中,系数估计电路24基于对于相同时间帧的从高带子带功率计算电路22提供的(eb-sb)个高带子带功率和从特征量计算电路23提供的特征量(4个低带子带功率和凹谷dips(J))的多个组合,来进行系数Cib(kb)、Dib和Eib的估计。例如,系数估计电路24通过以下方式确定公式(13)中的系数Cib(kb)、Dib和Eib:使5个特征量(4个低带子带功率和凹谷dips(J))作为关于高带的子带中的一个的解释变量,使高带子带功率power(ib,J)作为被解释变量以及使用最小二乘法来进行回归分析。
此外,系数Cib(kb)、Dib和Eib的估计方法自然不限于上述方法并且可以应用各种常见参数识别方法。
根据上述处理,因为用于估计高带子带功率的系数的学习被设置为通过使用预定的扩展带指示信号来进行,所以存在获得关于输入到频带扩展装置10的各种输入信号的优选输出结果的可能性,从而可以再现具有较好质量的音乐信号。
此外,可以通过系数学习方法来计算上述公式(2)中的系数Aib(kb)和Bib
如上所述,在通过诸如4个低带子带功率和凹谷的线性组合在频带扩展装置10的高带子带功率估计电路15中计算高带子带功率的每个估计值的前提下,描述了系数学习处理。
然而,用于在高带子带功率估计电路15中估计高带子带功率的方法不限于上述示例。例如,因为特征量计算电路14计算除了凹谷以外的一个或更多个特征量(低带子带功率的时间变化、斜率、斜率的时间变化和凹谷的时间变化),所以可以计算高带子带功率,可以使用时间帧J之前和之后的多个帧的多个特征量的线性组合,或可以使用非线性函数。即,在系数学习处理中,系数估计电路24可以在与关于由频带扩展装置10的高带子带功率估计电路15计算高带子带功率时所使用的特征量、时间帧和函数相同的条件下计算(学习)系数。
<2.第二实施例>
在第二实施例中,执行了由编码器和解码器在高带特征编码方法中进行的编码处理和解码处理。
[编码器的功能配置示例]
图11示出了应用本发明的编码器的功能配置示例。
编码器30包括低通滤波器31、低带编码电路32、子带分割电路33、特征量计算电路34、伪高带子带功率计算电路35、伪高带子带功率差计算电路36、高带编码电路37、复用电路38和低带解码电路39。
低通滤波器31使用预定截止频率来对输入信号进行滤波,并且将低于截止频率的低带的信号(下文中,被称作低带信号)作为滤波后的信号提供给低带编码电路32、子带分割电路33和特征量计算电路34。
低带编码电路32对来自低通滤波器31的低带信号进行编码,并且将从结果获得的低带编码数据提供给复用电路38和低带解码电路39。
子带分割电路33将输入信号和来自低通滤波器31的低带信号均等地分为具有预定带宽的多个子带信号,并且将分割的信号提供给特征量计算电路34或伪高带子带功率差计算电路36。具体地,子带分割电路33将通过输入低带信号获得的多个子带信号(在下文中,称为低带子带信号)提供给特征量计算电路34。此外,子带分割电路33将通过输入输入信号获得的多个子带信号之中的、高于低通滤波器31设置的截止频率的高带的子带信号(在下文中,称为高带子带信号)提供给伪高带子带功率差计算电路36。
特征量计算电路34使用来自低通滤波器31的低带信号和来自子带分割电路33的低带子带信号的多个子带信号中的任意一个,来计算一个或更多个特征量,并且将所计算的特征量提供给伪高带子带功率计算电路35。
伪高带子带功率计算电路35基于来自特征量计算电路34的一个或更多个特征量来产生伪高带子带功率,并且将产生的伪高带子带功率提供给伪高带子带功率差计算电路36。
伪高带子带功率差计算电路36基于来自子带分割电路33的高带子带信号和来自伪高带子带功率计算电路35的伪高带子带功率来计算下述伪高带子带功率差,并且将所计算的伪高带子带功率差提供给高带编码电路37。
高带编码电路37对来自伪高带子带功率差计算电路36的伪高带子带功率差进行编码,并且将从结果中获得的高带编码数据提供给复用电路38。
复用电路38对来自低带编码电路32的低带编码数据和来自高带编码电路37的高带编码数据进行复用,并且作为输出代码串而输出。
低带解码电路39恰当地对来自低带编码电路32的低带编码数据进行解码,并且将从结果获得的解码数据提供给子带分割电路33和特征量计算电路34。
[编码器的编码处理]
接下来,参照图12中的流程图,将描述由图11中的编码器30进行的编码处理。
在步骤S111,低通滤波器31使用预定截止频率来对输入信号进行滤波,并且将低带信号作为滤波后的信号提供给低带编码电路32、子带分割电路33和特征量计算电路34。
在步骤S112,低带编码电路32对来自低通滤波器31的低带信号进行编码,并且将从结果获得的低带编码数据提供给复用电路38。
此外,对于步骤S112中的低带信号的编码,应根据编码效率和所获得的电路尺寸来选择合适的编码方法,并且本发明不取决于这些编码方法。
在步骤S113中,子带分割电路33将输入信号和低带信号均等地分为具有预定带宽的多个子带信号。子带分割电路33将通过输入低带信号获得的低带子带信号提供给特征量计算电路34。此外,子带分割电路33将通过输入输入信号获得的多个子带信号中的、比由低通滤波器31设置的带限制的频率更高的带的高带子带信号提供给伪高带子带功率差计算电路36。
在步骤S114中,特征量计算电路34使用来自低通滤波器31的低带信号和来自子带分割电路33的低带子带信号的多个子带信号中的至少任意一个,来计算一个或更多个特征量,并且将所计算的特征量提供给伪高带子带功率计算电路35。此外,图11中的特征量计算电路34具有与图3中的特征量计算电路14基本上相同的配置和功能。因为步骤S114中的处理基本上与图4中的流程图的步骤S4的处理相同,所以省略其描述。
在步骤S115中,伪高带子带功率计算电路35基于来自特征量计算电路34的一个或更多个特征量来产生伪高带子带功率,并且将所产生的伪高带子带功率提供给伪高带子带功率差计算电路36。此外,图11中的伪高带子带功率计算电路35具有与图3中的高带子带功率估计电路15基本上相同的配置和功能。因此,因为步骤S115中的处理基本上与图4中的流程图的步骤S5相同,所以省略其描述。
在步骤S116中,伪高带子带功率差计算电路36基于来自子带分割电路33的高带子带信号和来自伪高带子带功率计算电路35的伪高带子带功率来计算伪高带子带功率差,并且将所计算的伪高带子带功率差提供给高带编码电路37。
具体地,伪高带子带功率差计算电路36关于来自子带分割电路33的高带子带信号来计算恒定时间帧J中的(高带)子带功率power(ib,J)。此外,在本发明的实施例中,使用索引ib来区分所有的低带子带信号的子带和高带子带信号的子带。子带功率的计算方法能够应用于与第一实施例的方法(即,由第一实施例的公式(1)使用的方法)相同的方法。
接下来,伪高带子带功率差计算电路36计算时间帧J中的高带子带功率power(ib,J)与来自伪高带子带功率计算电路35的伪高带子带功率power1h(ib,J)之间的差值(伪高带子带功率差)powerdiff(ib,J)。伪高带子带功率差powerdiff(ib,J)是通过以下公式(14)来获得的。
[公式14]
power diff ( ib , J ) = power ( ib , J ) - power 1 h ( ib , J ) ( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 14 )
在公式(14)中,索引sb+1表示高带子带信号中的最低带的子带的索引。此外,索引eb表示被编码在高带子带信号中的最高带的子带的索引。
如上所述,将由伪高带子带功率差计算电路36计算的伪高带子带功率差提供给高带编码电路37。
在步骤S117中,高带编码电路37对来自伪高带子带功率差计算电路36的伪高带子带功率差进行编码,并且将从结果获得的高带编码数据提供给复用电路38。
具体地,高带编码电路37通过以下处理来编码:确定对来自伪高带子带功率差计算电路36的伪高带子带功率差进行矢量化所得到的矢量(在下文中称为伪高带子带功率差矢量)属于预定的伪高带子带功率差的特征空间中的多个聚类之中的哪个聚类。本文中,时间帧J中的伪高带子带功率差矢量具有作为矢量元素的每个索引ib的伪高带子带功率差powerdiff(ib,J)的值,并且显示了(eb-sb)维度的矢量。此外,伪高带子带功率差的特征空间以相同的方式被设置为(eb-sb)维度的空间。
因此,高带编码电路37在伪高带子带功率差的特征空间中测量多个预定的聚类的多个各代表矢量与伪高带子带功率差矢量之间的距离,获得具有最短距离的聚类的索引(在下文中,称为伪高带子带功率差ID),并且将所获得的索引作为高带编码数据提供给复用电路38。
在步骤S118中,复用电路38对从低带编码电路32输出的低带编码数据和从高带编码电路37输出的高带编码数据进行复用,并且输出输出代码串。
因此,作为高带特征编码方法中的编码器,日本专利申请公开第2007-17908号公开了这样的技术:其从低带子带信号产生伪高带子带信号,针对每个子带将伪高带子带信号的功率与高带子带信号的功率相互比较,计算针对每个子带的功率增益以将伪高带子带信号的功率与高带子带信号的功率匹配,并且使所计算的增益作为高带特征的信息包括在代码串中。
根据上述处理,仅伪高带子带功率差ID可以包括在输出代码串中,作为用于在解码时估计高带子带功率的信息。即,例如,如果预定的聚类的数量是64,作为用于在解码器中恢复高带信号的信息,可以将6比特信息添加到每时间帧的代码串,并且能够减小包括在代码串中的信息量以相比在日本专利申请公开第2007-17908号中公开的方法提高解码效率,并且可以再现具有较好音质的音乐信号。
此外,在上述处理中,如果存在计算量的余量,则低带解码电路39可以将通过对来自低带编码电路32的低带编码数据进行解码而获得的低带信号输入到子带分割电路33和特征量计算电路34。在由解码器进行的解码处理中,特征量是根据对低带编码数据进行解码的低带信号而计算的,并且高带子带的功率是基于特征量来估计的。因此,甚至在编码处理中,在代码串中包括伪高带子带功率差ID(其是基于根据已解码低带信号计算的特征量而计算的),则在由解码器进行的解码处理中,能够估计出具有更好的精确度的高带子带功率。因此,可以再现具有较好音质的音乐信号。
[解码器的功能配置示例]
接着,参照图13,将描述与图11中的编码器30对应的解码器的功能配置示例。
解码器40包括解复用电路41、低带解码电路42、子带分割电路43、特征量计算电路44、高带解码电路45、已解码高带子带功率计算电路46、已解码高带信号产生电路47和合成电路48。
解复用电路41将输入代码串解复用为高带编码数据和低带编码数据,并且将低带编码数据提供给低带解码电路42以及将高带编码数据提供给高带解码电路45。
低带解码电路42对来自解复用电路41的低带编码数据进行解码。低带解码电路42将从解码结果获得的低带的信号(在下文中,称为已解码低带信号)提供给子带分割电路43、特征量计算电路44和合成电路48。
子带分割电路43将来自低带解码电路42的已解码低带信号均等地分为具有预定带宽的多个子带信号,并且将子带信号(已解码低带子带信号)提供给特征量计算电路44和已解码高带信号产生电路47。
特征量计算电路44使用来自低带解码电路42的已解码低带信号和来自子带分割电路43的已解码低带子带信号的多个子带信号中的任意一个来计算一个或更多个特征量,并且将所计算的特征量提供给已解码高带子带功率计算电路46。
高带解码电路45对来自解复用电路41的高带编码数据进行解码,并且使用从结果获得的伪高带子带功率差ID的为每个预定的ID(索引)准备的用于估计高带子带功率的系数(在下文中,称为已解码高带子带功率估计系数)提供给已解码高带子带功率计算电路46。
已解码高带子带功率计算电路46基于来自特征量计算电路44的一个或更多个特征量和来自高带解码电路45的已解码高带子带功率估计系数来计算已解码高带子带功率,并且将所计算的已解码高带子带功率提供给已解码高带信号产生电路47。
已解码高带信号产生电路47基于来自子带分割电路43的已解码低带子带信号和来自已解码高带子带功率计算电路46的已解码高带子带功率来产生已解码高带信号,并且将产生的信号和功率提供给合成电路48。
合成电路48对来自低带解码电路42的已解码低带信号和来自已解码高带信号产生电路47的已解码高带信号进行合成,并且将合成的信号作为输出信号输出。
[解码器的解码处理]
接下来,将参照图14中的流程图来描述使用图13中的解码器的解码处理。
在步骤S131中,解复用电路41将输入代码串解复用为高带编码数据和低带编码数据,将低带编码数据提供给低带解码电路42,以及将高带编码数据提供给高带解码电路45。
在步骤S132中,低带解码电路42对来自解复用电路41的低带编码数据进行解码,并且将从结果获得的已解码低带信号提供给子带分割电路43、特征量计算电路44和合成电路48。
在步骤S133中,子带分割电路43将来自低带解码电路42的已解码低带信号均等地分成具有预定带宽的多个子带信号,并且将获得的已解码低带子带信号提供给特征量计算电路44和已解码高带信号产生电路47。
在步骤S134中,特征量计算电路44根据来自低带解码电路42的已解码低带信号和来自子带分割电路43的已解码低带子带信号的多个子带信号中的任意一个来计算一个或更多个特征量,并且将这些信号提供给已解码高带子带功率计算电路46。此外,图13中的特征量计算电路44基本上具有与图3中的特征量计算电路14相同的配置和功能,并且步骤134中的处理与图4中的流程图中的步骤S4的处理相同。因此,省略其描述。
在步骤S135中,高带解码电路45对来自解复用电路41的高带编码数据进行解码,并且使用从结果获取的伪高带子带功率差ID的为每个预定ID(索引)准备的已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46。
在步骤S136中,已解码高带子带功率计算电路46基于来自特征量计算电路44的一个或更多个特征量和来自高带解码电路45的已解码高带子带功率估计系数来计算已解码高带子带功率,并且将该功率提供给已解码高带信号产生电路47。此外,因为图13中的已解码高带子带功率计算电路46具有与图3中的高带子带功率估计电路15相同的配置和功能,并且步骤S136中的处理与图4中的流程图的步骤S5中的处理相同,所以省略详细描述。
在步骤S137中,已解码高带信号产生电路47基于来自子带分割电路43的已解码低带子带信号和来自已解码高带子带功率计算电路46的已解码高带子带功率来输出已解码高带信号。此外,因为图13中的已解码高带信号产生电路47基本上具有与图3中的高带信号产生电路16相同的配置和功能以及步骤S137中的处理与图4中的流程图的步骤S6的处理相同,所以省略其详细描述。
在步骤S138中,合成电路48对来自低带解码电路42的已解码低带信号和来自已解码高带信号产生电路47的已解码高带信号进行合成,并且将合成的信号作为输出信号输出。
根据上述处理,可以提高高带子带功率的估计精确度,由此可以响应于编码时预先计算的伪高带子带功率与实际的高带子带功率之间的差特征,通过在解码时使用高带子带功率估计系数来在解码中再现具有良好质量的音乐信号。
此外,根据该处理,因为包括在代码串中的用于产生高带信号的信息仅具有伪高带子带功率差ID,所以可以有效地进行解码处理。
如上所述,尽管描述了根据本发明的编码处理和解码处理,但是在下文中,将描述下述方法:计算图11中的编码器30的高带编码电路37中预定伪高带子带功率差的具体空间中的多个聚类的每个代表矢量、以及由图13中的解码器40的高带解码电路45输出的已解码高带子带功率估计系数。
[计算伪高带子带功率差的特定空间中的多个聚类中的代表矢量以及与每个聚类对应的已解码高带子带功率估计系数的计算方法]
作为用于获取多个聚类的代表矢量和每个聚类的已解码高带子带功率估计系数的方式,需要准备该系数以响应于在编码中计算的伪高带子带功率差矢量来在解码中以高精确度估计高带子带功率。因此,通过宽带指示信号预先进行学习,并且基于该学习结果来应用确定学习的方法。
[系数学习装置的功能配置示例]
图15示出了进行多个聚类的代表矢量和每个聚类的已解码高带子带功率估计系数的学习的系数学习装置的功能配置示例。
优选地,输入到图15中的系数学习装置50的宽带指示信号的、以及具有由编码器30的低通滤波器31设置的截止频率或更小频率的信号分量是下述已解码低带信号:其中,到编码器30的输入信号通过低通滤波器31,该输入信号由低带编码电路32编码并且由解码器40的低带解码电路42来解码。
系数学习装置50包括低通滤波器51、子带分割电路52、特征量计算电路53、伪高带子带功率计算电路54、伪高带子带功率差计算电路55、伪高带子带功率差聚类电路56和系数估计电路57。
此外,因为图15中的系数学习装置50中的低通滤波器51、子带分割电路52、特征量计算电路53和伪高带子带功率计算电路54中的每一个基本上具有与图11中的编码器30中的低通滤波器31、子带分割电路33、特征量计算电路34和伪高带子带功率计算电路35中的每一个的配置和功能相同的配置和功能,所以适当地省略其描述。
换言之,尽管伪高带子带功率差计算电路55提供了与图11中的伪高带子带功率差计算电路36相同的功能和配置,但是计算的伪高带子带功率差被提供给伪高带子带功率差聚类电路56,并且当计算伪高带子带功率差时计算的高带子带功率被提供给系数估计电路57。
伪高带子带功率差聚类电路56对从来自伪高带子带功率差计算电路55的伪高带子带功率差获得的伪高带子带功率差矢量进行聚类,并且计算每个聚类处的代表矢量。
系数估计电路57基于来自伪高带子带功率差计算电路55的高带子带功率和来自特征量计算电路53的一个或更多个特征量,针对由伪高带子带功率差聚类电路56聚类的每个聚类,计算高带子带功率估计系数。
[系数学习装置的系数学习处理]
接下来,将参照图16中的流程图来描述图15中的系数学习装置50进行的系数学习处理。
此外,除了输入到系数学习装置50的信号是宽带指示信号外,图16中的流程图的步骤S151至S155的处理与图12中的流程图的步骤S111、S113至S116的处理相同,因此,省略其描述。
即,在步骤S156中,伪高带子带功率差聚类电路56对从来自伪高带子带功率差计算电路55至64的伪高带子带功率差获得的多个伪高带子带功率差矢量(大量时间帧)进行聚类,并且计算每个聚类的代表矢量。作为聚类方法的示例,例如,能够应用使用k-means(k均值)方法的聚类。伪高带子带功率差聚类电路56将从通过k-means方法进行聚类的结果获得的每个聚类的中心矢量设置为每个聚类的代表矢量。此外,聚类的方法或聚类的数量不限于此,还可以应用其它方法。
此外,伪高带子带功率差聚类电路56测量时间帧J中的64个代表矢量与从来自伪高带子带功率差计算电路55的伪高带子带功率差获得的伪高带子带功率差矢量之间的距离,并且确定具有最短距离的代表矢量中包括的聚类的索引CID(J)。此外,索引CID(J)取1到聚类的数量(例如,64)的整数值。因此,伪高带子带功率差聚类电路56输出代表矢量并且将索引CID(J)提供给系数估计电路57。
在步骤S157中,系数估计电路57计算每个聚类处的已解码高带子带功率估计系数,每组聚类在从伪高带子带功率差计算电路55和特征量计算电路53提供的针对相同时间帧的数目为(eb-sb)的高带子带功率和特征量的多个组合中具有相同的索引CID(J)(包括在同一聚类中)。用于通过系数估计电路57计算系数的方法与由图9中的系数学习装置20的系数估计电路24进行的方法相同。然而,可以使用其它方法。
根据通过使用预定的宽带指示信号的上述处理,因为进行了针对图11中的编码器30的高带编码电路37中预定的伪高带子带功率差的特定空间中的多个聚类的每个代表矢量的学习,并且进行了针对由图13中的解码器40的高带解码电路45输出的已解码高带子带功率估计系数的学习,所以可以关于输入到编码器30的各个输入信号和输入到解码器40的各个输入代码串来获得期望的输出结果,并且可以再现具有高质量的音乐信号。
此外,关于信号的编码和解码,用于在编码器30的伪高带子带功率计算电路35和解码器40的已解码高带子带功率计算电路46中计算高带子带功率的系数数据可以如下处理。即,可以通过基于输入信号的类型使用不同的系数数据来将该系数记录在代码串的前面的位置中。
例如,可以通过用信号(如语音和爵士乐)改变系数数据来实现编码效率的改进。
图17示出了根据上述方法获得的代码串。
图17中的代码串A对语音进行编码,并且在报头中记录讲话中的最优系数数据α。
与此相反,因为图17中的代码串B对爵士乐进行编码,所以爵士乐中的最优系数数据β被记录在报头中。
能够预先通过相同类型的音乐信号来容易地学习上述多个系数数据,并且编码器30可以根据记录在输入信号的报头中的种类信息来选择系数数据。此外,可以通过进行信号的波形分析来确定种类并且可以选择系数数据。即,信号的种类分析方法不受具体限制。
当计算时间允许时,编码器30配备有上述学习装置,因此,通过使用该信号专用的系数来进行处理,如在图17中的代码串C中示出的,最终,也可以将系数记录在报头中。
如下将描述使用该方法的优点。
高带子带功率的形状包括一个输入信号中的多个类似位置。通过使用多个输入信号的特征以及通过单独地进行对用于每个输入信号的高带子带功率的估计的系数的学习,减小了由于高带子带功率的相似位置中产生的冗余,从而提高了编码效率。此外,相比统计地使用多个信号对用于估计高带子带功率的系数进行学习,可以以更高的精确度来进行高带子带功率的估计。
此外,如上所述,在解码中从输入信号学习的系数数据可以采取一次插入每若干帧中的形式。
<3.第三实施例>
[编码器的功能配置示例]
此外,尽管描述了将伪高带子带功率差ID从编码器30作为高带编码数据输出到解码器40,用于获取已解码高带子带功率估计系数的系数索引可以设置为高带编码数据。
在该情况下,例如,如图18所示那样配置编码器30。此外,在图18中,与图11中的部件对应的部件具有相同的附图标记,并且适当地省略其描述。
图18中的编码器30与图11中的编码器30相同,除了没有设置低带解码电路39以外,剩下的部分是相同的。
在图18中的编码器30中,特征量计算电路34通过使用从子带分割电路33提供的低带子带信号来计算低带子带功率作为特征量,并且将低带子带功率提供给伪高带子带功率计算电路35。
此外,在伪高带子带功率计算电路35中,通过预定的回归分析获得的多个已解码高带子带功率估计系数对应于指定待记录的已解码高带子带功率估计系数的系数索引。
具体地,预先准备在上述公式(2)的运算中使用的针对每个子带的系数Aib(kb)和系数Bib的集合,作为已解码高带子带功率估计系数。例如,系数Aib(kb)和系数Bib是通过预先将低带子带功率设置为解释变量以及将高带子带功率设置为被解释变量,借助使用最小二乘法的归回分析来计算的。在回归分析中,包括低带子带信号和高带子带信号的输入信号被用作宽带指示信号。
伪高带子带功率计算电路35通过使用已解码高带子带功率估计系数和来自特征量计算电路34的特征量,针对记录的已解码高带子带功率估计系数中的每个来计算高带侧的每个子带的伪高带子带功率,并且将子带功率提供给伪高带子带功率差计算电路36。
伪高带子带功率差计算电路36将根据从子带分割电路33提供的高带子带信号获得的高低子带功率与来自伪高带子带功率计算电路35的伪高带子带功率进行比较。
此外,伪高带子带功率差计算电路36将已解码高带子带功率估计系数的系数索引提供给高带编码电路37,其中,与最高的伪高带子带功率接近的伪高带子带功率是从比较的结果和多个已解码高带子带功率估计系数中获得的。即,选择可获得要在解码时再现的输入信号的高带信号(即,最接近真实值的已解码高带信号)的已解码高带子带功率估计系数的系数索引。
[编码器的编码处理]
接下来,参照图19中的流程图,将描述图18中的编码器30进行的编码处理。此外,步骤S181至步骤S183的处理与图12中的步骤S111至步骤S113的处理是相同的。因此,省略其描述。
在步骤S184中,特征量计算电路34通过使用来自子带分割电路33的低带子带信号来计算特征量,并且将特征量提供给伪高带子带功率计算电路35。
具体地,特征量计算电路34通过进行上述公式(1)的运算,计算关于低带侧中的每个子带ib(其中,sb-3≤ib≤sb)的帧J(其中,0≤J)的低带子带功率power(ib,J),作为特征量。即,低带子带功率power(ib,J)是通过对构成帧J的低带子带信号的每个样本的样本值的均方值进行数字化而计算的。
在步骤S185中,伪高带子带功率计算电路35基于从特征量计算电路34提供的特征量来计算伪高带子带功率,并且将伪高带子带功率提供给伪高带子带功率差计算电路36。
例如,伪高带子带功率计算电路35计算通过使用预先记录为已解码高带子带功率系数的系数Aib(kb)和系数Bib来执行上述公式(2)的运算的伪高带子带功率powerest(ib,J)、以及通过使用低带子带功率power(kb,J)(其中,sb-3≤kb≤sb)来执行上述公式(2)的运算的伪高带子带功率powerest(ib,J)。
即,每个子带的系数Aib(kb)乘以作为特征量提供的低带侧的每个子带的低带子带功率power(kb,J),并且将系数Bib与低带子带功率乘以系数的和相加,然后变为伪高带子带功率powerest(ib,J)。该伪高带子带功率是针对索引为sb+1至eb的高带侧的每个子带来计算的。
此外,伪高带子带功率计算电路35计算预先记录的每个已解码高带子带功率估计系数的伪高带子带功率。例如,假定系数索引允许1到K(其中,2≤K)数量的已解码高带子带估计系数被预先准备。在这种情况下,针对K个已解码高带子带功率估计系数来计算每个子带的伪高带子带功率。
在步骤S186中,伪高带子带功率差计算电路36基于来自子带分割电路33的高带子带信号和来自伪高带子带功率计算电路35的伪高带子带功率,来计算伪高带子带功率差。
具体地,伪高带子带功率差计算电路36不进行与上述公式(1)的运算相同的运算,并且关于来自子带分割电路33的高带子带信号来计算帧J中的高带子带功率power(ib,J)。此外,在实施例中,低带子带信号和高带子带信号的全部子带是通过使用索引ib来区分的。
接下来,伪高带子带功率差计算电路36进行与上述公式(14)相同的运算,并且计算帧J中的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,J)之间的差。在该情况下,伪高带子带功率差powerdiff(ib,J)是针对关于索引为sb+1至eb的高带侧的每个子带的每个已解码高带子带功率估计系数来获得的。
在步骤S187中,伪高带子带功率差计算电路36针对每个已解码高带子带功率估计系数来计算以下公式(15),并且计算伪高带子带功率差的平方和。
[公式15]
E ( J , id ) = &Sigma; ib = sb + 1 eb { power diff ( ib , J , id ) } 2 . . . ( 15 )
此外,在公式(15)中,对于差E(J,id)的平方和是关于系数索引为id的已解码高带子带功率估计系数和帧J来获得的。此外,在公式(15)中,powerdiff(id,J,id)是关于系数索引为id的已解码高带子带功率估计系数来获得的,并且表示索引为ib的子带的帧J的伪高带子带功率差powerdiff(ib,J)。差E(J,id)的平方和是关于每个已解码高带子带功率估计系数的数量K来计算的。
以上获得的针对差E(J,id)的平方和表示根据实际高带信号计算的高带子带功率与使用系数索引为id的已解码高带子带功率估计系数计算的伪高带子带功率之间的相似度。
即,估计值的误差是关于高带子带功率的真实值来表示的。因此,针对差E(J,id)的平方和越小,则使用已解码高带子带功率估计系数通过运算获得的已解码高带信号越接近实际高带信号。即,对于差E(J,id)的平方和最小的已解码高带子带功率估计系数是最适合于在对输出代码串进行解码时进行的频带扩展处理的估计系数。
伪高带子带功率差计算电路36从针对差E(J,id)的K个平方和之中选择具有最小值的差的平方和,并且将表示与针对差的平方和对应的已解码高带子带功率估计系数的系数索引提供给高带编码电路37。
在步骤S188中,高带编码电路37对从伪高带子带功率差计算电路36提供的系数索引进行编码,并且将获得的高带编码数据提供给复用电路38。
例如,步骤S188中,关于系数索引进行加密编码等。因此,可以压缩输出到解码器40的高带编码数据的信息量。此外,如果高带编码数据是获得了最优的已解码高带子带功率估计系数的信息,则任何信息都是优选的;例如,索引可以是如原样的高带编码数据。
在步骤S189中,复用电路38对从低带编码电路32提供的低带编码数据与从高带编码电路37提供的高带编码数据进行复用,并且将输出输出代码串,从而完成编码处理。
如上所述,能够通过输出以下数据来获得最适合处理的已解码高带子带功率估计系数:通过对系数索引进行编码作为接收输出代码串的输入的解码器40中的输出代码串而获得的高带编码数据、以及低带编码数据。因此,可以获得具有较高质量的信号。
[解码器的功能配置示例]
此外,从图18中的编码器30输出的输出代码串是作为输入代码串而输入的,例如,用于解码的解码器40具有图20中所示的配置。此外,在图20中,对应于图13的情况的部件使用相同的附图标记,并且省略描述。
图20中的解码器40与图13中的解码器40的相同之处在于配置了解复用电路41到合成电路48,而与图13中的解码器40的不同之处在于:来自低带解码电路42的已解码低带信号被提供给特征量计算电路44。
在图20中的解码器40中,高带解码电路45记录了与预先记录图18中的伪高带子带功率计算电路35的已解码高带子带功率估计系数相同的已解码高带子带功率估计系数。即,通过回归分析得到的作为已解码高带子带功率估计系数的系数Aib(kb)和系数Bib的集合被记录为与系数索引对应。
高带解码电路45对从解复用电路41提供的高带编码数据进行解码,并且将由从结果中获得的系数索引表示的已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46。
[解码器的解码处理]
接下来,将参照图21中的流程图来描述由图20中的解码器40进行的解码处理。
如果将从编码器30输出的输出代码串作为输入代码串提供给解码器40,则解码处理开始。此外,因为步骤S211至步骤S213的处理与图14中的步骤S131至步骤S133的处理相同,所以省略描述。
在步骤S214中,特征量计算电路44通过使用来自子带分割电路43的已解码低带子带信号来计算特征量,并且将其提供给已解码高带子带功率计算电路46。具体地,特征量计算电路44关于低带侧的每个子带ib通过进行上述公式(1)的运算,来计算帧J(但是,0≤J)的低带子带功率power(ib,J)的特征量。
在步骤S215中,高带解码电路45对从解复用电路41提供的高带编码数据进行解码,并且将由从结果中获得的系数索引表示的已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46。即,输出已解码高带子带功率估计系数,其由预先记录到高带解码电路45中的多个已解码高带子带功率估计系数中的、通过解码获得的系数索引来表示。
在步骤S216中,已解码高带子带功率计算电路46基于从特征量计算电路44提供的特征量和从高带解码电路45提供的已解码高带子带功率估计系数,来计算已解码高带子带功率,并且将其提供给已解码高带信号产生电路47。
即,已解码高带子带功率计算电路46使用作为已解码高带子带功率估计系数的系数Aib(kb)和系数Bib、作为特征量的低带子带功率power(kb,J)(其中,sb-3≤kb≤sb),来进行上述公式(2)中的运算,并且计算已解码高带子带功率。因此,已解码高带子带功率是关于索引为sb+1到eb的高带侧的每个子带来获得的。
在步骤S217中,已解码高带信号产生电路47基于从子带分割电路43提供的已解码低带子带信号和从已解码高带子带功率计算电路46提供的已解码高带子带功率,来产生已解码高带信号。
具体地,已解码高带信号产生电路47使用已解码低带子带信号来进行上述公式(1)的运算,并且计算关于低带侧的每个子带的低带子带功率。此外,已解码高带信号产生电路47使用所获得的低带子带功率和已解码高带子带功率,通过进行上述公式(3)的运算,来计算针对高带侧的每个子带的增益量G(ib,J)。
此外,已解码高带信号产生电路47关于高带侧的每个子带,使用增益量G(ib,J)和已解码低带子带信号,通过进行上述公式(5)和公式(6)的运算,来产生高带子带信号x3(ib,n)。
即,已解码高带信号产生电路47响应于低带子带功率与已解码高带子带功率的比率来进行已解码高带子带信号x(ib,n)的幅度调制,因此,对获得的已解码低带子带信号x2(ib,n)进行幅度调制。因此,低带侧的子带的频率分量的信号被转换为高带侧的子带的频率分量的信号,并且获得了高带子带信号x3(ib,n)。
如上所述,用于获取每个子带的高带子带信号的处理是下面更详细描述的处理。
频率区中成行的4个子带称为带块,并且将频带分割,以使得由在低侧存在的索引是sb到sb-3的4个子带来配置一个带块(下文中,称为低带块)。在该情况下,例如,包括高带侧的索引包含sb+1至sb+4的子带的带是一个带块。此外,高带侧,即,包括索引为sb+1或更大的子带的带块被具体称为高带块。
此外,关注构成高带块的一个子带,并且产生该子带(下文中,称为关注子带)的高带子带信号。首先,已解码高带信号产生电路47指定了具有与高带块中的关注子带的位置相同的位置关系的低带块的子带。
例如,如果关注子带的索引是sb+1,则将具有与关注子带的相同位置关系的低带块的子带被设置为索引为sb-3的子带,因为关注子带是高带块中频率最低的带。
如上所述,如果低带块子带的子带中的与关注子带具有相同的位置关系的子带是特定的,则使用低带子带功率和已解码低带子带信号和已解码高带子带功率,并且产生关注子带的高带子带信号。
也就是说,将已解码高带子带功率和低带子带功率带入公式(3),使得根据其功率的比率计算增益量。此外,将算出的增益量乘以已解码低带子带信号,与增益量相乘的已解码低带子带信号被设为通过公式(6)的运算进行的频率调制,以被设为关注子带的高带子带信号。
在处理中,获得了高带侧的每个子带的高带子带信号。此外,已解码高带信号产生电路47执行上述公式(7),以获得每个高带子带信号的和并且产生已解码高带信号。已解码高带信号产生电路47将所获得的已解码高带信号提供给合成电路48,并且处理从步骤S217进行至步骤S218,然后解码处理结束。
在步骤S218中,合成电路48对来自低带解码电路42的已解码低带信号和来自已解码高带信号产生电路47的已解码高带信号合成,并且作为输出信号而输出。
如上所述,由于解码器40根据通过输入代码串的解复用获得的高带编码数据来获取系数索引,并且根据使用系数索引表示的已解码高带子带功率估计系数来计算已解码高带子带功率,所以可以提高高带子带功率的估计精确度。因此,可以产生具有高质量的音乐信号。
<4.第四实施例>
[编码器的编码处理]
首先,如上所述,对高带编码数据中仅包括系数索引的情况进行描述。然而,也可以包括其它信息。
例如,如果高带编码数据中包括系数索引,则向解码器40侧通知最接近实际高带信号的高带子带功率的已解码高带子带功率的已解码高带子带功率估计系数。
因此,从解码器40获得的已解码高带子带功率(估计值)和实际高带子带功率(真实值)产生基本上等于根据伪高带子带功率差计算电路36计算的伪高带子带功率差powerdiff(ib,J)的差。
本文中,如果高带编码数据中包括子带的伪高带子带功率差和系数索引,则解码器40侧大致获知关于实际高带子带功率的已解码高带子带功率的误差。如果是这样,则可以使用差来提高高带子带功率的估计精确度。
将参照图22和23的流程图来描述高带编码数据中包括伪高带子带功率差的情况下的编码处理和解码处理。
首先,将参照图22中的流程图对由图18中的编码器30执行的编码处理进行描述。此外,步骤S241至步骤S246的处理与图19中的步骤S181至步骤S186的处理相同。因此,省略其描述。
在步骤S247中,伪高带子带功率差计算电路36执行上述公式(15)的运算,以计算每个已解码高带子带功率估计系数的差的平方和E(J,id)。
此外,伪高带子带功率差计算电路36选择如下差的平方和:其中,该差的平方和被设置为差的平方和E(J,id)之中的差的平方和的最小值,并且伪高带子带功率差计算电路36将表示与该差的平方和对应的已解码高带子带功率估计系数的系数索引提供给高带编码电路37。
此外,伪高带子带功率差计算电路36将关于与所选择的残差的平方和对应的已解码高带子带功率估计系数获得的每个子带的伪高带子带功率差powerdiff(ib,J)提供给高带编码电路37。
在步骤S248中,高带编码电路37对从伪高带子带功率差计算电路36提供的伪高带子带功率差和系数索引进行编码,并且将根据该结果获得的高带编码数据提供给复用电路38。
因此,将在索引为sb+1至eb的高带侧的每个子带功率的伪高带子带功率差(即高带子带功率的估计差)提供给解码器40作为高带编码数据。
如果获得了高带编码数据,则此后执行步骤S249的编码处理,以结束编码处理。然而,步骤S249的处理与图19中的步骤S189的处理相同。因此,省略描述。
如上所述,如果高带编码数据中包括伪高带子带功率差,则在解码器40中可以提高高带子带功率的估计精度,并且可以获得具有良好质量的音乐信号。
[解码器的解码处理]
接着,将参考图23中的流程图对由图20中的解码器40执行的解码处理进行描述。此外,步骤S271至步骤S274的处理与图21中的步骤S211至步骤S214的处理相同。因此,将省略其描述。
在步骤S275中,高带解码电路45执行对从解复用电路41提供的高带编码数据的解码。此外,高带解码电路45将由通过解码获得的系数索引表示的已解码高带子带功率估计系数和通过解码获得的每个子带的伪高带子带功率差提供给已解码高带子带功率计算电路46。
在步骤S276中,已解码高带子带功率计算电路46基于从特征量计算电路44提供的特征量和从高带解码电路45提供的已解码高带子带功率估计系数216,计算已解码高带子带功率。此外,步骤S276与图21中的步骤S216具有相同的处理。
在步骤S277中,已解码高带子带功率计算电路46将从高带解码电路45提供的伪高带子带功率差与已解码高带子带功率相加,并且将相加的结果提供给已解码高带信号产生电路47作为最终的已解码高带子带功率。
也就是说,向所计算的每个子带的解码高带子带功率加上同一子带的伪高带子带功率差。
此外,之后,执行步骤S278和步骤S279的处理,并且终止解码处理。然而,步骤S278和步骤S279的处理与图21中的步骤S217和步骤S218的处理相同。因此,将省略其描述。
由此,解码器40根据通过对输入代码串进行解复用而获得的高带编码数据来获得系数索引和伪高带子带功率。此外,解码器40使用由系数索引表示的已解码高带子带功率估计系数和伪高带子带功率差来计算已解码高带子带功率。因此,可以提高高带子带功率的估计精度,并且可以再现具有高音质的音乐信号。
此外,可以考虑编码器30与解码器40之间产生的高带子带功率的估计值的差,即伪高带子带功率与已解码高带子带功率之间的差(下文中,称为设备间估计差)。
在这种情况下,例如,根据设备间差估计来对作为高带编码数据的伪高带子带功率差进行修正,并且,高带编码数据中包括设备间估计差,根据解码器40侧的设备间估计差来对伪高带子带功率差进行修正。此外,可以事先在解码器40侧记录设备间估计差,并且,解码器40可以通过将设备间估计差与伪高带子带功率差相加来进行修正。因此,可以获得接近实际高带信号的已解码高带信号。
<5.第五实施例>
此外,在图18的编码器30中,描述了:伪高带子带功率差计算电路36使用差的平方和E(J,id)来从多个系数索引中选择最优索引。然而,电路可以通过使用与差的平方和不同的索引来选择系数索引。
例如,作为用于选择系数索引的索引,可以使用高带子带功率和伪高带子带功率的残差的均方值、最大值和平均值。在这种情况下,图18中的编码器30执行图24中的流程图所示的编码处理。
将参考图24中的流程图对使用编码器30的编码处理进行描述。此外,步骤S301至步骤S305的处理与图19中的步骤S181至步骤S185的处理相同。因此,将省略其描述。如果执行步骤S301至步骤S305的处理,则对于每K个已解码高带子带功率估计系数,计算每个子带的伪高带子带功率。
在步骤S306中,伪高带子带功率差计算电路36针对每K个已解码高带子带功率估计系数使用要处理的当前帧J来计算估计值Res(id,J)。
具体地,伪高带子带功率差计算电路36通过使用从子带分割电路33提供的每个子带的高带子带信号执行与以上描述的公式(1)相同的操作来计算帧J中的高带子带功率power(ib,J)。此外,在本发明的实施例中,可以使用索引ib来区分高带子带信号与低带子带信号的所有子带。
如果获得了高带子带功率power(ib,J),则伪高带子带功率差计算电路36计算以下公式(16),并且计算残差均方值Resstd(id,J)。
[公式16]
Res std ( id , J ) = &Sigma; ib = sb + 1 eb { power ( ib , J ) - power est ( ib , id , J ) } 2 . . . ( 16 )
也就是说,关于索引为sb+1至eb的高带侧的每个子带获得高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,并且,差的平方和成为残差均方值Resstd(id,J)。此外,伪高带子带功率powerest(ib,id,J)表示关于索引为ib的已解码高带子带功率估计系数获得的、索引为ib的子带的帧J的伪高带子带功率。
接着,伪高带子带功率差计算电路36计算以下公式(17),并且计算残差最大值Resmax(id,J)。
[公式17]
Resmax(id,J)=maxib{|power(ib,J)-powerest(ib,id,J)|}
                               ...(17)
此外,在公式(17)中,maxib{|power(ib,J)-powerest(ib,id,J)|}表示索引为sb+1至eb的每个子带的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差的绝对值中的最大值。因此,将帧J中的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差的绝对值中的最大值设置为残差最大值Resmax(id,J)。
此外,伪高带子带功率差计算电路36计算以下公式(18),并且计算残差平均值Resave(id,J)。
[公式18]
Res ave ( id , J ) = | ( &Sigma; ib = sb + 1 eb { power ( ib , J ) - power est ( ib , id , J ) } ) / ( eb - sb ) | . . . ( 18 )
也就是说,对于索引为sb+1至eb的高带侧的每个子带,获得了帧J的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,并且获得了差的和。此外,将通过把所获得的差的和除以高带侧的子带的数量(eb-sb)所获得的值的绝对值设置为残差平均值Resave(id,J)。残差平均值Resave(id,J)表示在考虑到符号的情况下每个子带的估计误差的平均值的大小。
此外,如果获得了残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J),则伪高带子带功率差计算电路36计算以下公式(19),并且计算最终估计值Res(id,J)。
[公式19]
Res(id,J)=Resstd(id,J)+Wmax×Resmax(id,J)+Wave×Resave(id,J)
                       ...(19)
也就是说,将残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)加权相加,并且设置为最终估计值Res(id,J)。此外,在公式(19)中,Wmax和Wave是预定权值,例如,Wmax=0.5,Wave=0.5。
伪高带子带功率差计算电路36执行以上处理,并且针对K个已解码高带子带功率估计系数即K个系数索引id中的每个,计算估计值Res(id,J)。
在步骤S307中,伪高带子带功率差计算电路36基于所获得的系数索引id中的每个的估计值Res(id,J),选择系数索引id。
通过上述处理获得的估计值Res(id,J)示出了根据实际高带信号计算的高带子带功率与使用系数索引为id的已解码高带子带功率估计系数计算的伪高带子带功率之间的相似度。也就是说,表示高带分量的估计误差的大小。
因而,当评价值Res(id,J)变小时,通过使用已解码高带子带功率估计系数的操作获得了更接近实际高带信号的已解码高带信号。因此,伪高带子带功率差计算电路36选择被设置为K个估计值Res(id,J)中的最小值的估计值,并且将表示与该估计值对应的已解码高带子带功率估计系数的系数索引提供给高带编码电路37。
如果系数索引被输出给高带编码电路37,则之后,执行步骤S308和步骤S309的处理,终止编码处理。然而,由于这些处理与图19中的步骤S188和步骤S189的处理相同,因此,将省略其描述。
如上所述,在编码器30中,使用通过使用残差均方值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)计算出的估计值Res(id,J),并且,选择最优已解码高带子带功率估计系数的系数索引。
如果使用估计值Res(id,J),则由于能够使用与使用差的平方和的情况相比更多的估计标准来评价高带子带功率的估计精度,所以,可以选择更合适的已解码高带子带功率估计系数。因此,在使用时,解码器40接收输出代码串的输入,可以获得已解码高带子带功率估计系数,其通常适合于频带扩展处理和具有更高音质的信号。
<修改示例1>
此外,如果针对输入信号的每个帧执行上述编码处理,则可能存在如下情况:在输入信号的高带侧的每个子带的高带子带功率的时间变化很小的固定区域中选择每个连续帧中的不同的系数索引。
也就是说,由于每个帧的高带子带功率在构成输入信号的固定区域的连续帧中几乎具有相同的值,所以,应当在它们的帧中持续选择相同的系数索引。然而,连续帧的一部分中的每个帧的所选系数索引变化,并且从而解码器40侧再现的语音的高带分量会不再固定。如果是这样,则再现的声音中出现听觉不一致。
因而,如果在编码器30中选择系数索引,则可以考虑时间上之前的帧中的高带分量的估计结果。在这种情况下,图18中的编码器30执行图25中的流程图所示的编码处理。
如下所述,将参考图25中的流程图对由编码器30执行的编码处理进行描述。此外,步骤S331至步骤S336的处理与图24中的步骤S301至步骤S306的处理相同。因此,将省略其描述。
在步骤S337中,伪高带子带功率差计算电路36使用之前的帧和当前帧来计算估计值ResP(id,J)。
具体地,伪高带子带功率差计算电路36关于时间上早于要处理的帧J一帧的帧J-1记录通过最终选择的系数索引的已解码高带子带功率估计系数获得的每个子带的伪高带子带功率。本文中,最终选择的系数索引称为通过使用高带编码电路37进行编码而输出给解码器40的系数索引。
如下所述,具体地,将在帧(J-1)中选择的系数索引id设置为idselected(J-1)。此外,将通过使用系数索引idselected(J-1)的已解码高带子带功率估计系数获得的系数为ib(其中,sb+1≤ib≤eb)的子带的伪高带子带功率持续解释为powerest(ib,idselected(J-1),J-1)。
伪高带子带功率差计算电路36首先计算以下公式(20),接着计算估计残差均方值ResPstd(id,J)。
[公式20]
ResP std ( id , J ) = &Sigma; ib = sb + 1 eb { power est ( ib , id selected ( J - 1 ) , J - 1 ) - power est ( ib , id , J ) } 2 . . . ( 20 )
也就是说,关于索引为sb+1至eb的高带侧的每个子带获得帧J的伪高带子带功率powerest(ib,id,J)与帧J-1的伪高带子带功率powerest(ib,idselected(J-1),J-1)之间的差。此外,将其差的平方和设置为估计误差均方值ResPstd(id,J)。此外,伪高带子带功率powerest(ib,id,J)示出了关于系数索引为id的已解码高带子带功率估计系数获得的索引为ib的子带的帧(J)的伪高带子带功率。
由于该估计残差均方值ResPstd(id,J)是时间上连续的帧之间的伪高带子带功率的差的平方和,估计残差均方值ResPstd(id,J)越小,高带分量的估计值的时间变化越小。
接着,伪高带子带功率差计算电路36计算以下公式(21),并且计算估计残差最大值ResPmax(id,J)。
[公式21]
ResPmax(id,J)=maxib{|powerest(ib,idselected(J-1),J-1)
-powerest(ib,id,J)|}        ...(21)
此外,在公式(21)中,maxib{|powerest(ib,idselected(J-1),J-1)-powerest(ib,id,J)|}表示索引为sb+1至eb的每个子带的伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差的最大绝对值。因此,将在时间上连续的帧之间的差的绝对值的最大值设置为估计残差最大值ResPmax(id,J)。
估计残差最大值ResPmax(id,J)越小,连续的帧之间的高带分量的估计结果越接近。
如果获得了估计残差最大值ResPmax(id,J),则接着,伪高带子带功率差计算电路36计算以下公式(22),并且计算估计残差平均值ResPave(id,J)。
[公式22]
ResP ave ( id , J ) = | ( &Sigma; ib = sb + 1 eb { power est ( ib , id selected ( J - 1 ) , J - 1 ) - power est ( ib , id , J ) } ) / ( eb - sb ) | . . . ( 22 )
也就是说,关于索引为sb+1至eb的高带侧的每个子带,获得了帧(J-1)的伪高带子带功率powerest(ib,idselected(J-1),J-1)与帧J的伪高带子带功率powerest(ib,id,J)之间的差。此外,将通过用每个子带的差的和除以高带侧的子带数(eb-sb)获得的值的绝对值设置为估计残差平均值ResPave(id,J)。估计残差平均值ResPave(id,J)示出了在考虑符号的情况下帧之间的子带的估计值的差的平均值的大小。
此外,如果获得了估计残差均方值ResPstd(id,J)、估计残差最大值ResPmax(id,J)和估计残差平均值ResPave(id,J),则伪高带子带功率差计算电路36计算以下公式(23),并且计算平均值ResP(id,J)。
[公式23]
ResP(id,J)=ResPstd(id,J)+Wmax×ResPmax(id,J)
+Wave×ResPave(id,J)              ...(23)
也就是说,将估计残差均方值ResPstd(id,J)、估计残差最大值ResPmax(id,J)和估计残差平均值ResPave(id,J)加权相加,并且设置为估计值ResP(id,J)。此外,在公式(23)中,Wmax和Wave是预定权值,例如,Wmax=0.5,Wave=0.5。
因此,如果使用之前的帧和当前帧计算了估计值ResP(id,J),则处理从步骤S337继续进行至S338。
在步骤S338中,伪高带子带功率差计算电路36计算公式(24),并且计算最终估计值Resall(id,J)。
[公式24]
ReSall(id,J)=Res(id,J)+Wp(J)×ResP(id,J)        ...(24)
也就是说,将所获得的估计值Res(id,J)与估计值ResP(id,J)加权相加。此外,在公式(24)中,例如,Wp(J)为通过以下公式(25)限定的权值。
[公式25]
Figure GDA0000411972720000521
此外,公式(25)中的powerr(J)是由以下公式(26)限定的值。
[公式26]
power r ( J ) = ( &Sigma; ib = sb + 1 eb { power ( ib , J ) - power ( ib , J - 1 ) } 2 ) / ( eb - sb ) . . . ( 26 )
该powerr(J)示出了帧(J-1)与帧(J)的高带子带功率之间的差的平均值。此外,根据公式(25),当powerr(J)为0附近的预定范围内的值时,powerr(J)越小,Wp(J)越接近1,当powerr(J)大于预定范围值时,其被设置为0。
这里,当powerr(J)为0附近的预定范围内的值时,连续的帧之间的高带子带功率的差的平均值在一定程度上变小。也就是说,输入信号的高带分量的时间变化很小,并且,输入信号的当前帧变为稳定区域。
当输入信号的高带分量稳定时,权值Wp(J)变为接近1的值,而当高带分量不稳定时,权值Wp(J)变为接近0的值。因此,在公式(24)所示的估计值Resall(id,J)中,当输入信号的高带分量的时间变化变小时,在将高带分量的估计结果和比较结果认为是之前的帧的评价标准的情况下,估计值ResP(id,J)的确定的系数变大。
因此,在输入信号的稳定区域内,选择在之前的帧中的高带分量的估计结果的附近获得的已解码高带子带功率估计系数,在解码器40侧,可以更自然地再现具有高质量的声音。然而,在输入信号的非稳定区域,估计值Resall(id,J)中的估计值ResP(id,J)的项被设置为0,并且,获得了接近实际高带信号的已解码高带信号。
伪高带子带功率差计算电路36通过执行上述处理来计算K个已解码高带子带功率估计系数中的每个的估计值Resall(id,J)。
在步骤S339中,伪高带子带功率差计算电路36基于所获得的每个已解码高带子带功率估计系数的估计值Resall(id,J)来选择系数索引id。
从上述处理获得的估计值Resall(id,J)使用权值线性地组合估计值Res(id,J)和估计值ResP(id,J)。如上所述,估计值Res(id,J)越小,可以获得越接近实际高带信号的已解码高带信号。此外,估计值ResP(id,J)越小,可以获得越接近之前的帧的已解码高带信号的已解码高带信号。
因此,估计值Resall(id,J)越小,获得更合适的已解码高带信号。因此,伪高带子带功率差计算电路36选择K个估计值Resall(id,J)中的具有最小值的估计值,并且将表示与该估计值对应的已解码高带子带功率估计系数的系数索引提供给高带编码电路37。
如果选择了系数索引,则之后,执行步骤S340和步骤S341的处理,以完成编码处理。然而,由于这些处理与图24中的步骤S308和步骤S309的处理相同,因此,将省略其描述。
如上所述,在编码器30中,使用通过对估计值Res(id,J)和估计值ResP(id,J)进行线性组合所获得的估计值Resall(id,J),使得能够选择最优已解码高带子带功率估计系数的系数索引。
如果使用估计值Resall(id,J),则与使用估计值Res(id,J)的情况相同,可以根据更多的估计标准来选择更合适的已解码高带子带功率估计系数。然而,如果使用估计值Resall(id,J),则可以对要在解码器40中再现的信号的高带分量的稳定区域内的时间变化进行控制,并且可以获得具有高质量的信号。
<修改示例2>
以这种方式,在频带扩展处理中,如果期望获得具有高质量的声音,则低带侧的子带的能听度也很重要。也就是说,在当接近低带侧的子带的估计精度变大时的高带侧的子带中,可以再现具有高质量的声音。
本文中,当关于每个已解码高带子带功率估计系数计算估计值时,可以对低带侧的子带设置权值。在这种情况下,图18中的编码器30执行图26中的流程图所示的编码处理。
下文中,将参考图26的流程图来对由编码器30执行的编码处理进行描述。此外,步骤S371至步骤S375的处理与图25中的步骤S331至步骤S335的处理相同。因此,将省略其描述。
在步骤S376中,伪高带子带功率差计算电路36使用要处理的当前帧J针对K个已解码高带子带功率估计系数的中的每个计算估计值ResWband(id,J)。
具体地,伪高带子带功率差计算电路36使用从子带分割电路33提供的每个子带的高带子带信号执行与上述公式(1)相同的操作来计算帧J中的高带子带功率power(ib,J)。
如果获得了高带子带功率power(ib,J),则伪高带子带功率差计算电路36计算以下公式(27),并且计算残差均方值ResstdWband(id,J)。
[公式27]
Res std W band ( ib , J ) = &Sigma; ib = sb + 1 eb { W band ( ib ) &times; { power ( ib , J ) - power est ( ib , id , J ) } } 2 . . . ( 27 )
也就是说,针对索引为sb+1至eb的高带侧的每个子带,获得帧(J)的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,并且将该差乘以每个子带的权值Wband(ib)。此外,将与权值Wband(ib)相乘的差的平方和设置为残差均方值ResstdWband(id,J)。
本文中,权值Wband(ib)(其中,sb+1≤ib≤eb)由以下公式(28)来限定。例如,权值Wband(ib)的值变为与低带侧的子带一样大。
[公式28]
W band ( ib ) = - 3 &times; ib 7 + 4 . . . ( 28 )
接着,伪高带子带功率差计算电路36计算残差最大值ResmaxWband(id,J)。具体地,将索引为sb+1至eb的每个子带的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wband(ib)获得的值的绝对值的最大值设置为残差最大值ResmaxWband(id,J)。
此外,伪高带子带功率差计算电路36计算残差平均值ResaveWband(id,J)。
具体地,在索引为sb+1至eb的每个子带中,获得高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,并且从而乘以权值Wband(ib),使得获得乘以权值Wband(ib)的差的总和。此外,将通过将所获得的差的总和除以高带侧的子带数量(eb-sb)而获得的值的绝对值设置为残差平均值ResaveWband(id,J)。
此外,伪高带子带功率差计算电路36计算评价值ResWband(id,J)。也就是说,将残差均方值ResstdWband(id,J)、乘以权值(Wmax)的残差最大值ResmaxWband(id,J)、乘以权值(Wave)的残差平均值ResaveWband(id,J)之和设置为平均值ResWband(id,J)。
在步骤S377中,伪高带子带功率差计算电路36使用之前的帧和当前帧计算平均值ResPWband(id,J)。
具体地,伪高带子带功率差计算电路36关于比要处理的帧(J)在时间上早一帧的帧(J-1)对通过使用最终选择的系数索引的已解码高带子带功率估计系数获得的每个子带的伪高带子带功率进行记录。
伪高带子带功率差计算电路36首先计算估计残差平均值ResstdWband(id,J)。也就是说,对于索引为sb+1至eb的高带侧的每个子带,将获得的伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wband(ib)。此外,将用于计算权值Wband(ib)的差的平方和设置为估计残差平均值ResPstdWband(id,J)。
接着,伪高带子带功率差计算电路36计算估计残差最大值ResmaxWband(id,J)。具体地,将通过将索引为sb+1至eb的每个子带的伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wband(ib)获得的绝对值的最大值设置为估计残差最大值ResPmaxWband(id,J)。
接着,伪高带子带功率差计算电路36计算估计残差平均值ResPaveWband(id,J)。具体地,针对索引为sb+1至eb的每个子带,获取伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差,并且乘以权值Wband(ib)。此外,乘以权值Wband(ib)的差的总和为通过将其除以高带侧的子带的数量(eb-sb)获得的值的绝对值。然而,将其设置为估计残差平均值ResPaveWband(id,J)。
此外,伪高带子带功率差计算电路36获得乘以权值Wmax的估计残差最大值ResPmaxWband(id,J)的估计残差均方值ResPstdWband(id,J)与乘以权值Wave的估计残差平均值ResPaveWband(id,J)之和,并且将该和设置为估计值ResPWband(id,J)。
在步骤S378中,伪高带子带功率差计算电路36将评价值ResWband(id,J)与乘以公式(25)的权值Wp(J)的估计值ResPWband(id,J)相加,以计算最终估计值ResallWband(id,J)。针对K个已解码高带子带功率估计系数中的每个,计算该估计值ResallWband(id,J)。
此外,之后,执行步骤S379至步骤S381的处理,以终止编码处理。然而,由于它们的处理与图25中的步骤S339至步骤S341的处理相同,所以,将省略其描述。此外,在步骤S379中,将估计值ResallWband(id,J)选择为K个系数索引中的最小值。
如上所述,为了对低带侧的子带进行加权,可以通过提供每个子带的权值来在解码器40侧获得具有高质量的声音。
此外,如上所述,已经将已解码高带子带功率估计系数的数量的选择描述为基于估计值ResallWband(id,J)来执行。然而,也可以基于估计值ResWband(id,J)来选择已解码高带子带功率估计系数。
<修改示例3>
此外,由于人的听觉具有适当地感知幅度(功率)的较大频带的属性,因此,计算每个已解码高带子带功率估计系数的估计值,使得可以对具有较大功率的子带进行加权。
在这种情况下,图18中的编码器30执行图27中的流程图所示的编码处理。将参考图27的流程图来对由编码器30执行的编码处理进行描述。此外,由于步骤S401至步骤S405的处理与图25中的步骤S331至步骤S335的处理相同,所以将省略其描述。
在步骤S406中,伪高带子带功率差计算电路36针对K个已解码高带子带功率估计系数使用要处理的当前帧J来计算估计值ResWpower(id,J)。
具体地,伪高带子带功率差计算电路36通过使用从子带分割电路33提供的每个子带的高带子带信号执行与以上描述的公式(1)相同的操作来计算帧J中的高带子带功率power(ib,J)。
如果获得了高带子带功率power(ib,J),则伪高带子带功率差计算电路36计算以下公式(29),并且计算残差均方值ResstdWpower(id,J)。
[公式29]
Res std W power ( id , J ) = &Sigma; ib = sb + 1 eb { W power ( power ( ib , J ) ) &times; { power ( ib , J ) - power est ( ib , id , J ) } } 2 . . . ( 29 )
也就是说,关于索引为sb+1至eb的高带侧的每个子带,获得高带子带功率powerest(ib,J)与伪高带子带功率powers(ib,id,J)之间的差,并且将该差乘以每个子带的权值Wpower(power(ib,J))。此外,将与权值Wpower(power(ib,J))相乘的差的平方和设置为残差均方值ResstdWpower(id,J)。
本文中,例如,权值Wpower(power(ib,J))(其中,sb+1≤ib≤eb)由以下公式(30)来限定。当子带的高带子带功率power(ib,J)变大时,权值Wpower(power(ib,J))的值变大。
[公式30]
W power ( power ( ib , J ) ) = 3 &times; power ( ib , J ) 80 + 35 8 . . . ( 30 )
接着,伪高带子带功率差计算电路36计算残差最大值ResmaxWpower(id,J)。具体地,将索引为sb+1至eb的每个子带的高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wpower(power(ib,J))获得的值的绝对值的最大值设置为残差最大值ResmaxWpower(id,J)。
此外,伪高带子带功率差计算电路36计算残差平均值ResaveWpower(id,J)。
具体地,在索引为sb+1至eb的每个子带中,获得高带子带功率power(ib,J)与伪高带子带功率powerest(ib,id,J)之间的差,乘以权值Wpower(power(ib,J)),并且获得乘以权值Wpower(power(ib,J))的差的总和。此外,将通过将所获得的差的总和除以高带侧的子带数量(eb-sb)而获得的值的绝对值设置为残差平均值ResaveWpower(id,J)。
此外,伪高带子带功率差计算电路36计算估计值ResWpower(id,J)。也就是说,将残差均方值ResstdWpower(id,J)、乘以权值(Wmax)的残差最大值ResmaxWpower(id,J)、乘以权值(Wave)的残差均值ResaveWpower(id,J)之和设置为估计值ResWpower(id,J)。
在步骤S407中,伪高带子带功率差计算电路36使用之前的帧和当前帧计算估计值ResPWpower(id,J)。
具体地,伪高带子带功率差计算电路36关于在时间上比要被处理的帧(J)早一帧的帧(J-1)对通过使用最终选择的系数索引的已解码高带子带功率估计系数获得的每个子带的伪高带子带功率进行记录。
伪高带子带功率差计算电路36首先计算估计残差均方值ResPstdWpower(id,J)。也就是说,关于索引为sb+1至eb的高带侧的每个子带,获取伪高带子带功率powerest(ib,id,J)与伪高带子带功率powerest(ib,idselected(J-1),J-1)之间的差,并且将该差乘以权值Wpower(power(ib,J))。将乘以权值Wpower(power(ib,J))的差的平方和设置为估计残差均方值ResPstdWpower(id,J)。
接着,伪高带子带功率差计算电路36计算估计残差最大值ResPmaxWpower(id,J)。具体地,将索引为sb+1至eb的每个子带的伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差乘以权值Wpower(power(ib,J))获得的值的最大值的绝对值设置为估计残差最大值ResPmaxWpower(id,J)。
接着,伪高带子带功率差计算电路36计算估计残差平均值ResPaveWpower(id,J)。具体地,针对索引为sb+1至eb的每个子带,获取伪高带子带功率powerest(ib,idselected(J-1),J-1)与伪高带子带功率powerest(ib,id,J)之间的差,并且乘以权值Wpower(power(ib,J))。此外,将与权值Wpower(power(ib,J))相乘的差的总和除以高带侧的子带的数量(eb-sb)获得的值的绝对值设置为估计残差平均值ResPaveWpower(id,J)。
此外,伪高带子带功率差计算电路36获得估计残差均方值ResPstdWpower(id,J)、乘以权值(Wmax)的估计残差最大值ResPmaxWpower(id,J)与乘以权值(Wave)的估计残差平均值ResPaveWpower(id,J)之和,并且将该和设置为估计值ResPWpower(id,J)。
在步骤S408中,伪高带子带功率差计算电路36将估计值ResWpower(id,J)与乘以公式(25)的权值WP(J)的估计值ResPWpower(id,J)相加,以计算最终估计值ResallWpower(id,J)。根据K个已解码高带子带功率估计系数中的每个,计算该估计值ResallWpower(id,J)。
此外,之后,执行步骤S409至步骤S411的处理,以终止编码处理。然而,由于它们的处理与图25中的步骤S339至步骤S341的处理相同,所以,将省略其描述。此外,在步骤S409中,在K个系数索引中选择其中估计值ResallWpower(id,J)被设置为最小值的系数索引。
如上所述,为了对大功率的子带进行加权,可以通过提供每个子带的权值来在解码器40侧获得具有高质量的声音。
此外,如上所述,已经将已解码高带子带功率估计系数的选择描述为基于估计值ResallWpower(id,J)来进行。然而,也可以基于估计值ResWpower(id,J)来选择已解码高带子带功率估计系数。
<6.第六实施例>
[系数学习装置的配置]
顺便一提,对应于系数索引,在图20的解码器40中记录作为已解码高带子带功率估计系数的一组系数Aib(kb)和系数Bib。例如,如果在解码器40中记录系数索引128的已解码高带子带功率估计系数,则需要大的区域作为记录区域,如用于记录其已解码高带子带功率估计系数的存储器。
本文中,将若干已解码高带子带功率估计系数中的一部分设置为公共系数,并且,可以使得记录已解码高带子带功率估计系数所需要的记录区域较小。在这种情况下,如图28所示对通过学习已解码高带子带功率估计系数获得的系数学习装置进行配置。
系数学习装置81包括子带分割电路91、高带子带功率计算电路92、特征量计算电路93和系数估计电路94。
多个系数学习装置81中设置有用于学习的多个乐曲数据,作为宽带教学信号。宽带教学信号是包括有低带的多个子带分量和高带的多个子带分量的信号。
子带分割电路91包括带通滤波器等,将所提供的宽带教学信号分割成多个子带信号并且将其提供给高带子带功率计算电路92和特征量计算电路93。具体地,将索引为sb+1至eb的高带侧的每个子带的高带子带信号提供给高带子带功率计算电路92,并且将索引为sb-3至sb的低带侧的每个子带的低带子带信号提供给特征量计算电路93。
高带子带功率计算电路92计算从子带分割电路91提供的每个高带子带信号的高带子带功率,并且将其提供给系数估计电路94。特征量计算电路93基于从子带分割电路91提供的每个低带子带信号,计算低带子带功率,作为特征量,并且将其提供给系数估计电路94。
系数估计电路94通过使用来自高带子带功率计算电路92的高带子带功率和来自特征量计算电路93的特征量执行回归分析来产生已解码高带子带功率估计系数,并且将其输出给解码器40。
[对系数学习处理的描述]
接着,将参考图29中的流程图对由系数学习装置81执行的系数学习处理进行描述。
在步骤S431中,子带分割电路91将所提供的多个宽带教学信号中的每个分割成多个子带信号。此外,子带分割电路91将索引为sb+1至eb的子带的高带子带信号提供给高带子带功率计算电路92,并且将索引为sb-3至sb的子带的低带子带信号提供给特征量计算电路93。
在步骤S432中,高带子带功率计算电路92对于从子带分割电路91提供的每个高带子带信号通过执行与上述公式(1)相同的操作来计算高带子带功率,并将其提供给系数估计电路94。
在步骤S433中,特征量计算电路93对于从子带分割电路91提供的每个低带子带信号通过执行上述公式(1)的操作来计算低带子带功率,作为特征量,并将其提供给系数估计电路94。
因而,关于多个宽带教学信号的每个帧,将高带子带功率和低带子带功率提供给系数估计电路94。
在步骤S434中,系数估计电路94对于索引为sb+1至eb的高带的每个子带ib(其中,sb+1≤ib≤eb)通过使用最小二乘法执行回归分析来计算系数Aib(kb)和系数Bib
在回归分析中,假定从特征量计算电路93提供的低带子带功率为解释变量,从高带子带功率计算电路92提供的高带子带功率为被解释变量。此外,使用构成提供给系数学习装置81的整个宽带教学信号的整个帧的低带子带功率和高带子带功率来执行回归分析。
在步骤S435中,系数估计电路94使用每个获得的子带ib的系数Aib(kb)和系数Bib获得宽带教学信号的每个帧的残差矢量。
例如,系数估计电路94对于帧J的每个子带ib(其中,sb+1≤ib≤eb)通过从高带功率(power(ib,J))减去系数Aib(kb)乘以低带子带功率power(kb,J)(其中,sb-3≤kb≤sb)的总和与系数Bib的和来获得残差。此外,将包括有帧J的每个子带ib的残差的矢量设置为残差矢量。
此外,关于构成提供给系数学习装置81的宽带教学信号的帧,计算残差矢量。
在步骤S436中,系数估计电路94对关于每个帧获得的残差矢量进行归一化。例如,针对每个子带ib,系数估计电路94通过获取整个帧的残差矢量的子带ib的残差方差并且将每个残差矢量中的子带ib的残差除以方差的平方根来对残差矢量进行归一化。
在步骤S437中,系数估计电路94通过k平均方法等对整个归一化的帧的残差矢量进行聚类。
例如,将在使用系数Aib(kb)和系数Bib执行对高带子带功率的估计时获得的整个帧的平均频率包络称为平均频率包络SA。此外,假定功率大于平均频率包络SA的预定频率包络为频率包络SH,并且,功率小于平均频率包络SA的预定频率包络为频率包络SL。
在这种情况下,其中获得了接近平均频率包络SA、频率包络SH和频率包络SL的频率包络的系数的每个残差矢量执行残差矢量的聚类,以使其包括在簇CA、簇CH和簇CL中。也就是说,每个帧的残差矢量执行聚类,以包括在簇CA、簇CH或簇CL中的任一个中。
在用于基于低带分量和高带分量的相关性估计高带分量的频带扩展处理中,就这方面而言,如果使用从回归分析获得的系数Aib(kb)和系数Bib来计算残差矢量,则残差随着高带侧的子带增大而增多。因此,对残差矢量进行聚类而不改变,进行高带侧的子带的数量的次数的加权,以执行处理。
相反,在系数学习装置81中,通过对残差矢量以作为子带的残差的方差进行归一化,使每个子带的残差的方差明显相等,并且,可以通过将相等的权值提供给每个子带来执行聚类。
在步骤S438中,系数估计电路94选择簇CA、簇CH和簇CL中的任意一个作为要处理的簇。
在步骤S439中,系数估计电路94通过使用包括在被选择作为要处理的簇的簇中的残差矢量的帧进行回归分析来计算每个子带ib(其中,sb+1≤ib≤eb)的系数Aib(kb)和系数Bib
也就是说,如果包括在要处理的簇中的残差矢量的帧被称为要处理的帧,则将要处理的整个帧的低带子带功率和高带子带功率设置为解释变量和被解释变量,并且执行使用最小二乘法的回归分析。因而,获得了每个子带ib的系数Aib(kb)和系数Bib
在步骤S440中,系数估计电路94关于要处理的整个帧使用通过步骤S439的处理获得的系数Aib(kb)和系数Bib来获得残差矢量。此外,在步骤S440中,执行与步骤S435相同的处理,并且从而获得每个要处理的帧的残差矢量。
在步骤S441中,系数估计电路94通过执行与步骤S436相同的处理来对通过步骤S440的处理获得的每个要处理的帧的残差矢量进行归一化。也就是说,通过用残差除以每个子带的方差来执行对残差矢量的归一化。
在步骤S442中,系数估计电路94使用k平均方法等对要处理的整个归一化的帧的残差矢量进行聚类。簇的数量限定如下。例如,在系数学习装置81中,当产生了128个系数索引的已解码高带子带功率估计系数时,将128乘以要处理的帧的数量,并且将通过除以整个帧的数量获得的数设置为簇数量。本文中,整个帧的数量称为提供给系数学习装置81的宽带教学信号的整个帧之和。
在步骤S443中,系数估计电路94获得通过步骤S442的处理获得的每个簇的重心矢量。
例如,通过步骤S442的聚类获得的簇与系数索引对应,并且,在系数学习装置81中,将系数索引分配给每个簇,以获得每个系数索引的已解码高带子带功率估计系数。
具体地,在步骤S438中,假定选择簇CA作为要处理的簇,并且,通过步骤S442的聚类来获得F个簇。当关注F个簇中的一个簇CF时,将簇CF的系数索引的已解码高带子带功率估计系数设置为系数Aib(kb),其中,在步骤439中关于簇CA获得的系数Aib(kb)为线性相关项。此外,将关于从步骤S443获得的簇CF的重心矢量在步骤S441处执行的归一化的逆处理(逆归一化)的矢量与在步骤S439中获得的系数Bib之和设置为作为已解码高带子带功率估计系数的常数项的系数Bib。将逆归一化设置为乘以在如在步骤S441处执行的归一化将每个子带的残差除以方差的平方根时关于簇CF的重心矢量的每个元素归一化的相同值(每个子带的平方根)的处理。
也就是说,将在步骤S439处获得的系数Aib(kb)和所述获得的系数Bib设置为簇CF的系数索引的已解码高带子带功率估计系数。因而,通过聚类获得的F个簇中的每个共同具有关于簇CA获得的系数Aib(kb)作为已解码高带子带功率估计系数的线性关联项。
在步骤S444中,系数学习装置81确定是否对簇CA、簇CH和簇CL的整个簇作为要处理的簇进行处理。此外,在步骤S444中,如果确定不对整个簇进行处理,则处理返回步骤S438,并且重复所述处理。也就是说,选择下一个簇作为要处理的簇,并且计算已解码高带子带功率估计系数。
相反,在步骤S444中,如果确定对整个簇进行处理,则由于计算了要获得的预定数量的已解码高带子带功率,因此,处理继续进行至步骤S445。
在步骤S445中,系数估计电路94将所获得的系数索引和已解码高带子带功率估计系数输出给解码器40,并且从而系数学习处理终止。
例如,在输出给解码器40的已解码高带子带功率估计系数中,存在若干相同的系数Aib(kb)作为线性相关项。本文中,系数学习装置81使作为指出系数Aib(kb)的信息的线性相关项索引(指针)与其共同的系数Aib(kb)对应,并且学习装置81使作为线性相关索引的系数Bib和常数项与系数索引对应。
此外,系数学习装置81将相应的线性相关项索引(指针)和系数Aib(kb)以及相应的系数索引和线性相关索引(指针)和系数Bib提供给解码器40,并且将它们记录在解码器40的高带解码电路45中的存储器中。与此类似,当记录多个已解码高带子带功率估计系数时,如果关于共同线性相关项,线性相关项索引(指针)存储在每个已解码高带子带功率估计系数的记录区域中,则可以显著缩小记录区域。
在这种情况下,由于线性相关项索引和系数Aib(kb)记录在高带解码电路45中的存储器中以彼此对应,所以,根据系数索引来获得线性相关项索引和系数Bib,并且,从而可以根据线性相关项索引获得系数Aib(kb)。
此外,根据申请人的分析的结果,即使在三模式程度上使多个已解码高带子带功率估计系数的线性相关项公用,已知,几乎不会出现进行频带扩展处理的声音的能听度的音质恶化。因此,系数学习装置81可以缩小记录已解码高带子带功率估计系数所需要的记录区域,而没有使频带扩展处理之后的声音的音质恶化。
如上所述,系数学习装置81根据所提供的宽带教学信号来产生每个系数索引的已解码高带子带功率估计系数,并且输出所产生的系数。
此外,在图29的系数学习处理中,描述对残差矢量进行归一化。然而,在步骤S436和步骤S441中的一个或两个步骤中可以不执行对残差矢量的归一化。
此外,执行对残差矢量的归一化,并且从而可以不执行对已解码高带子带功率估计系数的线性相关项的公用化。在这种情况下,在步骤S436中执行归一化处理,并且接着,在与要获得的已解码高带子带功率估计系数相同的数量的簇中对已归一化残差矢量进行聚类。此外,使用每个簇中所包括的残差的帧来执行对每个簇的回归分析,并且产生每个簇的已解码高带子带功率估计系数。
<7.第七实施例>
[系数索引串的高效编码]
此外,如上所述,在高带编码数据(比特流)中包括用于获得已解码高带子带功率估计系数的系数索引,并针对每个帧将该系数索引发送至解码器40。然而,在这种情况下,比特流中包括的系数索引串的比特量增加,并且编码效率下降。也就是说,能够执行具有良好效率的声音编码或解码。
这里,当比特流中包括系数索引串时,通过包括其中系数索引发生变化的时间信息以及已变化的系数索引的值而不是按原样包括每个帧的系数索引的值来对系数索引串进行编码,使得可以减少比特量。
也就是说,如上所述,每帧一个系数索引被设置为高带编码数据并被包括在比特流中。然而,当对真实世界中的信号特别是静止信号进行编码时,存在如图30所示的系数索引沿时间方向连续为相同值的许多情况。使用特性发明了系数索引的时间方向的信息量缩减方法。
具体地,存在如下方法:每隔多个帧(例如,16),该方法就发送关于索引被切换的时间信息及其索引值。
以下考虑两条时间信息。
(a)发送索引的长度和数量(见图30);
(b)发送长度的索引和切换标志(见图31)。
此外,能够将(a)、(b)中的每一个或(a)、(b)二者如下所述地对应于一个索引。
将描述选择性地使用每个(a)和(b)以及(a)和(b)二者的情况的详细实施例。
首先,将描述“(a)发送索引的长度和数量的情况”。
例如,如图32所描述的,假设以多个帧为单位从编码器输出包括低带编码数据和高带编码数据的输出代码串(比特流)。此外,在图32中,横向表示时间,并且一个矩形表示一个帧。此外,在表示帧的矩形内的数值表示指定该帧的已解码高带子带功率估计系数的系数索引。
在图32的示例中,输出代码串以每16个帧为单位进行输出。例如,假设从位置FST1到位置FSE1的区间是待处理区间,并且认为输出包括在待处理区间中的16个帧的输出代码串。
首先,将待处理区间划分为如下区间:所述区间包括选择了相同系数索引的连续帧(以下,称为连续帧区间)。也就是说,假设彼此相邻的帧的边界位置是选择了不同系数索引的各连续帧区间的边界位置。
在示例中,将待处理区间划分为三个区间,即:从位置FST1到位置FC1的区间、从位置FC1到位置FC2的区间、以及从位置FC2到位置FSE1的区间。
例如,在从位置FST1到位置FC1的连续帧区间的每帧中选择系数索引“2”。
因此,当将待处理区间划分为连续帧区间时,产生如下数据:该数据包括表示待处理区间内连续帧区间的数量的数量信息、在每个连续帧区间中选择的系数索引以及表示每个连续帧区间的长度的区间信息。
例如,在图32的示例中,由于待处理区间被划分为三个连续帧区间,因此将表示连续帧区间的数量的信息“3”设置为数量信息并在图32中表达为“num_length=3”。例如,考虑连续帧区间的帧为一个单元,则待处理帧中的初始连续帧区间的区间信息被设置为长度“5”,并且在图32中表达为“length0=5”。
此外,每条区间信息可以被指定其是否被包括在从待处理区间头部起的连续帧区间的任一区间信息中。也就是说,区间信息包括用于指定连续帧区间在待处理区间中的位置的信息。
因此,在待处理区间中,当产生包括数量信息、系数索引和区间信息的数据时,对该数据进行编码以将其设置为高带编码数据。在这种情况下,当在多个帧中连续地选择相同的系数索引时,由于不必针对每个帧发送系数索引,因而能够减少发送的比特流的数据量从而可以更加高效地执行编码和解码。
[编码器的功能配置示例]
当产生包括数量信息、系数索引和区间信息的高带编码数据时,例如如图33所示配置编码器。此外,在图33中,针对与图18中的情况对应的部分提供相同的附图标记,因此适当地省略其描述。
图33中的编码器111和图18中的编码器30的不同之处在于在编码器111的伪高带子带功率差计算电路36中布置有产生单元121,而其它配置相同。
伪高带子带功率差计算电路36的产生单元121基于待处理区间的每个帧中的系数索引的选择结果产生包括数量信息、系数索引和区间信息的数据,并且向高带编码电路37提供所产生的数据。
[编码处理的描述]
接下来,将关于图34的流程图来描述由编码器111执行的编码处理。针对预定数量的帧(即,待处理区间)的每个帧执行编码处理。
此外,由于步骤S471到步骤S477的处理与图19中的步骤S181到步骤S187的处理相同,所以省略了其描述。在步骤S471到步骤S477的处理中,依次将构成待处理区间的每个帧设置为待处理的帧,并且关于待处理的帧针对每个已解码高带子带功率估计系数计算伪高带子带功率差的平方和E(J,id)。
在步骤S478中,伪高带子带功率差计算电路36基于关于待处理的帧所计算的、针对每个解码高带子带功率估计系数的伪高带子带功率差的平方和(差的平方和)来选择系数索引。
也就是说,伪高带子带功率差计算电路36选择多个差的平方和中具有最小值的差的平方和,并且将表示对应于差的平方和的已解码高带子带功率估计系数的系数索引设置为所选择的系数索引。
在步骤S479中,伪高带子带功率差计算电路36确定是否仅执行预定帧的长度的处理。也就是说,确定是否关于构成待处理区间的全部帧来选择系数索引。
在步骤S479中,当确定仍未执行预定帧的长度的处理时,处理返回步骤S471并重复上述处理。也就是说,在待处理区间中,将仍未处理的帧设置为接下来要处理的帧并且选择该帧的系数索引。
与此相反,在步骤S479中,如果确定执行了预定帧的长度的处理,也就是说,如果已关于待处理区间中的全部帧选择了系数索引,则处理进行到步骤S480。
在步骤S480中,产生单元121基于待处理区间内的每个帧的系数索引的选择结果产生包括系数索引、区间信息以及数量信息的数据,并将所产生的数据提供给高带编码电路37。
例如,在图32的示例中,产生单元121将从位置FST1到位置FSE1的待处理区间划分为三个连续帧区间。此外,产生单元121产生如下数据:该数据包括表示连续帧区间的数量“3”的数量信息“num_length=3”、表示每个连续帧区间的长度的区间信息“length0=5”、“length1=7”和“length2=4”以及连续帧区间的系数索引“2”、“5”和“1”。
此外,连续帧区间中的每个连续帧区间的系数索引与区间信息相对应,并且能够指定哪个连续帧区间包括该系数索引。
再次参照图34中的流程图,在步骤S481中,高带编码电路37对由产生单元121提供的包括系数索引、区间信息和数量信息的数据进行编码,并产生高带编码数据。高带编码电路37将所产生的高带编码数据提供给复用电路38。
例如,在步骤S481中,对系数索引、区间信息和数量信息中的一些或全部信息执行熵编码。此外,如果高带编码数据是从其获得最佳已解码高带子带功率估计系数的信息,则优选任何信息,例如可以在高带编码数据中按照原样设置包括系数索引、区间信息和数量信息的数据。
在步骤S482中,复用电路38将由低带编码电路32提供的低带编码数据和由高带编码电路37提供的高带编码数据进行复用,并输出根据该结果获得的输出代码串,然后终止编码处理。
因此,通过将高带编码数据和低带编码数据一起作为输出代码串输出,在接收输出代码串的输入的解码器中可以获得最适于执行频带扩展处理的已解码高带子带功率估计系数。因此,能够获得具有更好音质的信号。
此外,在编码器111中,关于包括一个或更多个帧的连续帧区间选择一个系数索引,并且输出包括其系数索引的高带编码数据。鉴于该原因,当连续选择相同的系数索引时,能够减少输出代码串的编码量,从而更加高效地执行声音的编码或解码。
[解码器的功能配置示例]
例如如图35所示的那样地配置以从图33中的编码器111输出的输出代码串作为输入并对其进行解码的解码器。此外,在图35中,针对与图20中的情况相对应的部分提供相同的附图标记。因此,适当省略了其描述。
图35中的解码器151与图20中的解码器40的相同之处在于:解码器151包括解复用电路41到合成电路48,但与图20中的解码器40的不同之处在于:在已解码高带子带功率计算电路46中设置有选择单元161。
在解码器151中,当通过高带解码电路45对高带编码数据进行解码时,将根据该结果获得的区间信息和数量信息以及由通过对高带编码数据进行解码获得的系数索引指定的已解码高带子带功率估计系数提供给选择单元161。
选择单元161基于从高带解码电路45提供的关于待处理的帧的区间信息和数量信息选择在计算已解码高带子带功率中使用的已解码高带子带功率估计系数。
[解码处理的描述]
接下来,将参照图36的流程图描述由图35中的解码器151执行的解码处理。
当从编码器111输出的输出代码串被作为输入代码串提供给解码器151时启动解码处理,并且针对预定数量的帧(即,待处理区间)中的每个帧执行该解码处理。此外,由于步骤S511中的处理与图21的步骤S211中的处理相同,因而省略了其描述。
在步骤S512中,高带解码电路45对从解复用电路41提供的高带编码数据执行解码,并将已解码高带子带功率估计系数、区间信息以及数量信息提供给已解码高带子带功率计算电路46的选择单元161。
也就是说,高带解码电路45从预先记录的已解码高带子带功率估计系数中读取如下已解码高带子带功率估计系数,并使得该已解码高带子带功率估计系数对应于区间信息:该已解码高带子带功率估计系数由通过对高带编码数据进行解码而获得的系数索引表示。此外,高带解码电路45将对应的已解码高带子带功率估计系数、区间信息和数量信息提供给选择单元161。
在步骤S513中,在从解复用电路41提供的待处理区间的每个帧的低带编码数据中,低带解码电路42通过将一个帧设置为待处理的帧,来对待处理的帧的低带编码数据进行解码。例如,按照从待处理区间的头部到结尾的次序选择待处理区间的每个帧作为待处理的帧,并且对待处理的帧的低带编码数据执行解码。
低带解码电路42将通过对低带编码数据进行解码而获得的已解码低带信号提供给子带分割电路43和合成电路48。
对低带编码数据进行解码,然后,执行步骤S514和步骤S515的处理,从而根据已解码低带子带信号计算特征量。然而,由于该处理与图21中的步骤S213和步骤S214的处理相同,因而省略其描述。
在步骤S516中,选择单元161基于从高带解码电路45提供的区间信息和数量信息,从由高带解码电路45提供的已解码高带子带功率估计系数中选择待处理的帧的已解码高带子带功率估计系数。
例如,在图32的示例中,当将从待处理区间的头部起的第七帧设置为待处理的帧时,选择单元161根据数量信息“num_length=3”、区间信息“length0=5”和“length1=7”指定其中包括待处理的帧的连续帧区间。
在这种情况下,由于待处理区间的头部的连续帧区间包括5个帧且第二个连续帧区间包括7个帧,将要理解的是从待处理区间的头部起的第七帧被包括在从待处理区间的头部起的第二连续帧区间中。因此,选择单元161选择由对应于第二连续帧区间的区间信息的系数索引“5”指定的、已解码高带子带功率估计系数,作为待处理的帧的已解码高带子带功率估计系数。
选择了待处理的帧的已解码高带子带功率估计系数,然后,执行步骤S517到步骤S519的处理。然而,由于这些处理与图21的步骤S216到步骤S218的处理相同,因而省略其描述。
在步骤S517到步骤S519的处理中,使用所选择的已解码高带子带功率估计系数来产生待处理的帧的已解码高带信号,并且将所产生的已解码高带信号和已解码低带信号进行合成和输出。
在步骤S520中,解码器151确定是否执行了预定帧长度的处理。也就是说,确定是否关于构成待处理区间的全部帧产生了包括已解码高带信号和已解码低带信号的输出信号。
在步骤S520中,当确定未执行预定帧长度的处理时,处理返回步骤S513并重复上述处理。也就是说,将尽管正在处理但仍未完成处理的帧设置为接下来要处理的帧以产生帧的输出信号。
与此相反,在步骤S520中,如果确定执行了预定帧长度的处理,也就是说,如果关于待处理区间中的全部帧产生了输出信号,则终止解码处理。
如上所述,根据解码器151,由于根据由对输入代码串进行解复用获得的高带编码数据来获得系数索引,因此通过使用由系数索引表示的已解码高带子带功率估计系数来计算已解码高带子带功率,能够改进高带子带功率的估计精度。因此,能够再现具有高品质的声音信号。
此外,由于在高带编码数据中包括与具有一个或更多个帧的连续帧区间相关的一个系数索引,因而能够根据具有较少数据量的输入代码串来获得具有良好效率的输出信号。
<8.第八实施例>
[系数索引串的高效编码]
接下来,描述如下情况:在该情况下,通过发送上述的长度(b)的索引(b)和切换标志来减少高带编码数据的编码量,并改进声音的编码或解码效率。例如,在这种情况下,如图37所示,将多个帧设置为单元,并因而从编码器输出包括低带编码数据和高带编码数据的输出代码串(比特流)。
此外,在图37中,横向表示时间,而一个矩形表示一个帧。此外,在表示帧的矩形中的数值表示用于指定帧的已解码高带子带功率估计系数的系数索引。此外,在图37中,使用相同的附图标记来表示与图32中的情况对应的部分。因此,省略了其描述。
在图37的示例中,将16个帧设置为一个单元来输出输出代码串。例如,将从位置FST1到位置FSE1的区间设置为待处理区间,从而输出待处理区间中包括的16个帧的输出代码串。
具体地,首先,将待处理区间均等地划分为包括预定数量的帧的区间(以下,称为固定长度区间)。这里,从固定长度区间中的每个帧选择的系数索引是相同的,限定固定长度区间的长度,使得固定长度区间的长度最长。
在图37的示例中,将固定长度区间的长度(以下,简称为固定长度)设置为4个帧,并且将待处理区间均等地划分为4个固定长度区间。也就是说,将待处理区间划分为从位置FST1到位置FC21的区间、从位置FC21到位置FC22的区间、从位置FC22到位置FC23的区间以及从位置FC23到位置FSE1的区间。按照从待处理区间的头部的固定长度区间起的顺序,将这些固定长度区间中的系数索引设置为系数索引“1”、“2”、“2”、“3”。
因此,当将待处理区间划分为若干个固定长度区间时,产生包括表示待处理区间的固定长度区间的固定长度的固定长度索引、系数索引和切换标志的数据。
这里,切换标志是指用于表示系数索引在固定长度区间的边界位置(即预定的固定帧的结束帧和固定长度区间的下一固定长度区间的起始帧)处是否发生改变的信息。例如,当在从待处理区间的头部起的第i+1个和第i+2个固定长度区间的边界位置处系数索引发生变化时,将第i(i=0,1,2…)个切换标志gridflg_i设置为“1”,当系数索引未发生变化时,则将切换标志gridflg_i设置为“0”。
在图37的示例中,由于第一固定长度区间的系数索引“1”和第二固定长度区间的系数索引“2”彼此不同,因而将在待处理区间的第一固定长度区间的边界位置(位置FC21)处的切换标志(gridflg_0)的值设置为“1”。
此外,由于第二固定长度区间的系数索引“2”与第三固定长度区间的系数索引“2”相同,因而将位置FC22处的切换标志gridflg_1设置为“0”。
此外,将固定长度索引的值设置为根据固定长度获得的值。具体地,例如,将固定长度索引(length-id)设置为满足fixed_length=16/2length-id的固定长度的值。在图37的示例中,由于固定长度满足fixed_length=4,因此固定长度索引满足length_id=2。
将待处理区间划分为固定长度区间,并且产生包括固定长度索引、系数索引和切换标志的数据,对该数据进行编码以将其设置为高带编码数据。
在图37的示例中,对包括在位置FC21到位置FC23处的切换标志(gridflg_0=1,gridflg_1=0,gridflg_2=1)、固定长度索引“2”和每个固定长度区间的系数“1”、“2”和“3”的数据进行编码,从而将其设置为高带编码数据。
这里,每个固定长度区间的边界位置的切换标志指定该边界位置的切换标志在从待处理区间的头部起的序号。也就是说,切换标志可以包括用于指定固定长度区间在待处理区间中的边界位置的信息。
此外,将高带编码数据中包括的每个系数索引按照选择其系数的顺序进行布置,也就是说,将固定长度区间按次序并排布置。例如,在图37的示例中,按照“1”、“2”和“3”的次序来布置系数索引,从而其系数索引包括在该数据中。
此外,在图37的示例中,从待处理区间的头部起的第二固定长度区间和第三固定长度区间的系数索引均为“2”,然而,设置系数索引“2”使得仅包括1个系数索引“2”。当连续的固定长度区间的系数索引相同时,也就是说,在连续的固定长度区间的边界位置处的切换标志为0时,在高带编码数据中不包括与固定长度区间的数量一样多的相同系数索引,而是在高带编码数据中包括一个系数索引。
如上所述,当根据包括固定索引、系数索引和切换标志的数据产生高带编码数据时,由于不必发送针对各个帧的系数索引,因而能够减少待发送的比特流的数据量。
因此,能够更加有效地执行编码和解码。
[编码器的功能配置示例]
对于产生包括上述固定长度索引、系数索引以及切换标志的高带编码数据的情况,例如,如图38所示的那样地对编码器进行配置。此外,在图38中,与图18中的部分对应的部分具有相同的附图标记。因此,适当地省略其描述。
图38中的编码器191和图18中的编码器30的不同配置在于:在编码器191的伪高带子带功率差计算电路36中设置有产生单元201,其它配置相同。
产生单元201基于待处理区间的每个帧中的系数索引的选择结果产生包括固定长度索引、系数索引和切换标志的数据,并向高带编码电路37提供所产生的数据。
[编码处理的描述]
接下来,将参照图39的流程图描述由编码器191执行的编码处理。针对预定数量的帧的每个帧(即,每个待处理区间)来执行编码处理。
此外,由于步骤S551到步骤S559的处理与图34的步骤S471到步骤S479的处理相同,因而省略其描述。在步骤S551到步骤S559的处理中,依次将构成待处理区间的每个帧设置为待处理的帧,并选择关于待处理的帧的系数索引。
在步骤S559中,当确定仅执行了预定帧长度的处理时,处理进行到步骤S560。
在步骤S560中,产生单元201基于待处理的每个帧的系数索引的选择结果产生包括固定长度索引、系数索引和切换标志的数据,并向高带编码电路37提供所产生的数据。
例如,在图37所示的示例中,产生单元201将固定长度设置为四帧以将从位置FST1到位置FSE1的待处理区间划分为4个固定长度区间。此外,产生单元201产生包括固定长度索引“2”、系数索引“1”、“2”和“3”以及切换标志“1”、“0”和“1”的数据。
此外,在图37中,从待处理区间的头部起的第二固定长度区间和第三固定长度区间的系数索引均是“2”。然而,由于固定长度区间是连续布置的,因而在由产生单元201输出的数据中仅包括一个系数索引“2”。
再次参照图39的流程图的描述,在步骤S561中,高带编码电路37对从产生单元201提供的包括系数索引和切换标志的数据进行编码,并产生高带编码数据。高带编码电路37将所产生的高带编码数据提供给复用电路38。例如,如果需要,针对固定长度索引、系数索引和切换标志中的一些或全部信息执行熵编码。
执行步骤S561的处理,然后,执行步骤S562的处理以终止编码处理。由于步骤S562的处理具有与图34的步骤S482中的处理相同的处理,因而省略其描述。
因此,通过将高带编码数据和低带编码数据一起作为输出代码串输出,在接收输出代码串输入的解码器处可以获得最适于执行频带扩展处理的、已解码高带子带功率估计系数。因此,能够获得具有良好品质的信号。
此外,在编码器191中,关于一个或更多个固定长度区间选择一个系数索引,并且输出包括该系数索引的高带编码数据。因此,特别地,当连续选择相同的系数索引时,能够减小输出代码串的编码量,从而更加高效地执行声音的编码或解码。
[解码器的功能配置示例]
此外,输入从图38中的编码器191输出的输出代码串作为输入代码串,并且执行解码的解码器例如如图40那样地配置。在图40中对于与图20中的情况对应的部分使用相同的附图标记,并适当省略了其描述。
图40中的解码器231与图20中的解码器40的相同之处在于:包括解复用电路41至合成电路48,但是与图20中的解码器40的不同之处在于:在已解码高带子带功率估计电路46中布置有选择单元241。
在解码器231中,当通过高带解码电路45对高带编码数据进行解码时,将根据该结果获得的固定长度索引和切换标志以及由通过对高带编码数据进行解码而获得的系数索引所指定的、已解码高带子带功率估计系数提供给选择单元241。
选择单元241基于从高带解码电路45提供的固定长度索引和切换标志,来选择在计算关于待处理的帧的已解码高带子带功率时使用的、已解码高带子带功率估计系数。
[解码处理的描述]
接下来,将参照图41中的流程图描述由图40中的解码器231执行的解码处理。
当将从编码器191输出的输出代码串提供给解码器231作为输入代码串时启动解码处理,并且针对预定数量的帧(即待处理区间)中的每个帧执行该解码处理。此外,由于步骤S591的处理与图36中的步骤S511的处理相同,因而省略其描述。
在步骤S592中,高带解码电路45对从解复用电路41提供的高带编码数据执行解码,将已解码高带子带功率估计系数、固定索引以及切换标志提供给已解码高带子带功率计算电路46的选择单元241。
也就是说,高带解码电路45从预先记录的已解码高带子带功率估计系数中读取由通过对高带编码数据进行解码而获得的系数索引所表示的、已解码高带子带功率估计系数。在这种情况下,已解码高带子带功率估计系数被以与布置系数索引的顺序相同的顺序来布置。此外,高带解码电路45将已解码高带子带功率估计系数、固定长度索引和切换标志提供给选择单元241。
对高带编码数据进行解码,然后,执行步骤S593到步骤S595的处理。然而,由于这些处理与图36的步骤S513到步骤S515中的处理相同,因而省略其描述。
在步骤S596中,选择单元241基于从高带解码电路45提供的固定长度索引和切换标志,来从由高带解码电路45提供的已解码高带子带功率估计系数中选择待处理的帧的、已解码高带子带功率估计系数。
例如,在图37的示例中,当将从待处理区间头部起的第五帧设置为待处理的帧时,选择单元241根据固定长度索引2指定待处理的帧包括在从待处理区间的头部起的哪个固定长度区间中。在这种情况下,由于固定长度是“4”,指定第五帧被包括在第二固定长度区间中。
接下来,选择单元241根据位置FC21处的切换标志(gridflg_0=1),在按顺序提供的已解码高带子带功率估计系数中,指定从头部起的第二个已解码高带子带功率估计系数为待处理的帧的已解码高带子带功率估计系数。也就是说,由于切换标志为“1”,因此系数索引在位置FC21之前和之后发生改变,从头部起的第二个已解码高带子带功率估计系数被指定为待处理的帧的、已解码高带子带功率估计系数。在这种情况下,选择由系数索引“2”指定的已解码高带子带功率估计系数。
此外,在图37的示例中,当将从待处理区间的头部起的第九个帧设置为待处理的帧时,选择单元241根据固定长度索引“2”指定从待处理区间的头部起的哪个固定长度区间包括待处理的帧。在这种情况下,由于固定长度是“4”,第九个帧被指定为包括在第三个固定长度区间中。
接下来,选择单元241根据位置FC22处的切换标志gridflg_1=0,在按顺序提供的已解码高带子带功率估计系数中,指定从头部起的第二已解码高带子带功率估计系数为待处理的帧的、已解码高带子带功率估计系数。也就是说,由于切换标志是“0”,因此指定在位置FC22之前和之后未发生变化的索引,将从头部起的第二已解码高带子带功率估计系数指定为待处理的帧的、已解码高带子带功率估计系数。在这种情况下,选择由系数索引“2”指定的已解码高带子带功率估计系数。
当选择了待处理的帧的已解码高带子带功率估计系数时,执行步骤S597和步骤S600的处理以完成解码处理。然而,由于这些处理与在图36的步骤S517到步骤S520中的处理相同,因而省略了其描述。
在步骤S597到步骤S600的处理中,使用所选择的已解码高带子带功率估计系数来产生待处理的帧的已解码高带信号,将所产生的已解码高带信号和已解码低频带信号进行合成和输出。
如上所述,根据解码器231,由于根据通过对输入代码串进行解复用处理获得的高带编码数据获得了系数索引,因此使用由该系数索引表示的已解码高带子带功率估计系数来产生已解码高带子带功率,从而,能够改进高带子带功率估计精度。因此,能够再现具有更好音质的音乐信号。
此外,由于在关于一个或更多个固定长度区间的高带编码数据中包括了一个系数索引,因而能够根据更小数据量的输入代码串更加高效地获得输出信号。
<9.第九实施例>
[编码器的功能配置示例]
此外,如上所述,描述了如下方法:产生包括系数索引、区间信息和数量信息的数据以作为用于获得声音的高带分量的数据的方法(以下称为可变长度方法),以及产生包括固定长度索引、系数索引和切换标志的数据的方法(以下称为固定长度方法)。
这些方法还可以类似地减少高带编码数据的编码量。然而,可以通过在针对每个处理区间的这些方法中选择更少编码量来减少高带编码数据的编码量。
在这种情况下,如图42所示地配置编码器。此外,在图42中,针对与在图18中的情况对应的部分使用相同的附图标记。因此,适当地省略了其描述。
图42的编码器271和图18的编码器30的不同之处在于:在编码器271的伪高带子带功率差计算电路36中布置有产生单元281,其余部分的配置具有相同的配置。
产生单元281通过如下选择的方法产生用于获得高带编码数据的数据,并将该数据提供给高带编码电路37:基于待处理区间的每个帧中的系数索引的选择结果执行可变长度方法或固定长度方法之间的切换。
[编码处理的描述]
接下来,将参照图43中的流程图描述由编码器271执行的编码处理。针对预定数量的帧(即待处理区间)的每个帧执行编码处理。
此外,步骤S631到步骤S639的处理与图34中的步骤S471到S479的处理相同,因此省略了其描述。在步骤S631到步骤S639的处理中,将构成待处理区间的每个帧按顺序设置为待处理的帧,并关于待处理的帧选择系数索引。
在步骤S639中,仅当确定执行了预定帧长度的处理时,处理进行到步骤S640。
在步骤S640中,产生单元281确定是否将产生高带编码数据的方法设置为固定长度方法。
也就是说,产生单元281将由固定长度方法产生高带编码数据时高带编码数据的编码量和通过可变长度方法产生高带编码数据时高带编码数据的编码量进行比较。此外,当固定长度方法的高带编码数据的编码量小于可变长度方法的高带编码数据的编码量时,产生单元281确定设置固定长度方法。
在步骤S640中,当确定设置固定长度方法时,处理进行到步骤S641。在步骤S641中,产生单元281产生包括表示选择固定长度方法的方法标志、固定长度索引、系数索引和切换标志的数据,并将该数据提供给高带编码电路37。
在步骤S642中,高带编码电路37对从产生单元281提供的包括方法标志、固定长度索引、系数索引和切换标志的数据进行编码,并产生高带编码数据。高带编码电路37将所产生的高带编码数据提供给复用电路38,然后处理进行到步骤S645。
与此相反,在步骤S640中,当确定不设置固定长度方法(即,确定设置可变长度方法)时,处理进行到步骤S643。在步骤S643中,产生单元281产生包括表示选择可变长度方法的方法标志、系数索引、区间信息以及数量信息的数据,并且将所产生的数据提供给高带编码电路37。
在步骤S644中,高带编码电路37对包括从产生单元281提供的方法标志、系数索引、区间信息以及数量信息的数据进行编码并且产生高带编码数据。高带编码电路37将所产生的高带编码数据提供给复用电路38并且之后处理进行到步骤S645。
在步骤S642或步骤S644中,当产生了高带编码数据时,然后执行步骤S645的处理以完成编码处理。但是,由于该处理与图34中的步骤S482的处理相同,因而省略其描述。
如上所述,通过在固定长度方式与可变长度方式之间选择针对每个待处理区间的编码量较少的方式来产生高带编码数据,能够减少输出代码串的编码量,从而能够更有效地执行声音的编码或解码。
[解码器的功能配置示例]
此外,例如如图44所示配置以从图42中的编码器271输出的输出代码串作为输入代码串并对其进行解码的解码器。此外,在图44中,相同的附图标记被用于与图20中的情况相对应的部分。因此,省略其描述。
图44中的解码器311与图20中的解码器40的相同之处在于:包括解复用电路41至合成电路48;但是与图20中的解码器40的不同之处在于:在已解码高带子带功率计算电路46中布置有选择电路321。
在解码器311中,当通过高带解码电路45对高带编码数据进行解码时,将根据结果获得的数据以及由通过对高带编码数据进行解码所获得的系数索引所指定的、已解码高带子带功率估计系数提供给选择单元321。
基于从高带解码电路45提供的数据,选择单元321指定是通过固定长度方法还是通过可变长度方法来产生待处理区间的高带编码数据。此外,选择单元321基于用于产生高带编码数据的方法的指定结果以及从高带解码电路45提供的数据,来关于待处理的帧选择在计算已解码高带子带功率时使用的、已解码高带子带功率估计系数。
[解码处理的描述]
接下来,将参考图45的流程图描述由图44中的解码器311所执行的解码处理。
当从编码器271输出的输出代码串被作为输入代码串提供给解码器311时,启动解码处理并且针对预定数量的帧(即,待处理区间)中的每一个进行该解码处理。此外,由于步骤S671的处理与图41中的步骤S591的处理相同,因此,省略其描述。
在步骤S672中,高带解码电路45对从解复用电路41提供的高带编码数据执行解码,并且将根据该结果获得的数据及已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46的选择单元321。
即,高带解码电路45从预先记录的已解码高带子带功率估计系数中读取由通过对高带编码数据进行解码而获得的系数索引所表示的、已解码高带子带功率估计系数。此外,高带解码电路45将已解码高带子带功率估计系数及通过对高带编码数据进行解码而获得的数据提供给选择单元321。
在这种情况下,如果通过方式标志表示了固定长度方式,则将已解码高带子带功率估计系数、方法标志、固定长度索引及切换标志提供给选择单元321。此外,如果方法标志表示可变长度方法,则将已解码高带子带功率估计系数、方法标志、区间信息及数量信息提供给选择单元321。
在对高带编码数据进行解码之后,执行步骤S673至步骤S675的处理。但是,这些处理与图41中的步骤S593至步骤S595相同,因而省略其描述。
在步骤S676中,选择单元321基于从高带解码电路45提供的数据,从由高带解码电路45提供的已解码高带子带功率估计系数中选择待处理的帧的已解码高带子带功率估计系数。
例如,如果从高带解码电路45提供的方法标志表示固定长度方法,则执行与图41中的步骤S596相同的处理,并且从固定长度索引和切换标志中选择已解码高带子带功率估计系数。与此不同,如果从高带解码电路45提供的方法标志表示可变长度方法,则执行与图36中的步骤S516中相同的处理,并且从区间信息和数量信息中选择已解码高带子带功率估计系数。
如果选择了待处理的帧的已解码高带子带功率估计系数,此后,执行步骤S677至S680的处理,完成解码处理。但是,由于这些处理与图41中的步骤S597至步骤S600中的处理相同,因此,省略其描述。
使用所选择的已解码高带子带功率估计系数,并且因此,在步骤S677至步骤S680的处理中产生待处理的帧的已解码高带信号,并且对所产生的已解码高带信号及已解码低带信号进行合成并输出。
如所述的,通过解码量小于固定长度方法和可变长度方法的方法来产生高带编码数据。由于在高带编码数据中包括关于一个或更多个帧的一个系数索引,因此,能够通过具有较少的数据量的输入代码串获得具有良好效率的输出信号。
<10.第十实施例>
[系数索引串的高性能编码]
现在,在编码声音的编码方法中,用于对预定帧的数据进行解码的信息被再利用为用于对该帧之后的帧的数据进行解码的信息。在这种情况下,选择其中执行时间方向上的信息再利用的模式及其中禁止再利用的模式。
这里,将沿时间方向被再利用的信息设置成索引等。具体地,例如,将多个帧设置为单元,并且因此如图46所示,从编码器输出包括低带编码数据和高带编码数据的输出代码串。
此外,在图46中,横向表示时间,而一个矩形表示一个帧。此外,在表示帧的矩形内的数值表示指定该帧的已解码高带子带功率估计系数的系数索引。此外,在图46中,相同的附图标记用于与图32中的情况相对应的部分。省略其描述。
在图46的示例中,将16个帧设置成一个单元来输出输出代码串。例如,将从位置FST1至位置FSE1的区间设置成待处理区间,因此输出该待处理区间中包括的16个帧的输出代码串。
在这种情况下,在执行信息的再利用的模式中,如果待处理区间的引导帧(leading frame)的系数索引与前一个帧的系数索引相同,则将表示系数索引再利用的再利用标记“1”包括在高带编码数据中。在图46的示例中,由于待处理区间的引导帧的系数索引与前一个帧的系数索引两者都为“2”,因此,再利用标记被设置成“1”。
当再利用标记被设置成“1”时,由于再利用了待处理的前一个区间的最后一个帧的系数索引,因此,待处理区间的高带编码数据中不包括待处理区间的初始帧的系数索引。
与此不同,如果待处理区间的引导帧的系数索引与在该帧的一个帧之前的帧的系数索引不同,则将表示系数索引没有再利用的再利用标记“0”包括在高带编码数据中。在这种情况下,由于系数索引不能再利用,因此,高带编码数据中包括待处理的初始帧的系数索引。
此外,在禁止信息再利用的模式中,在高带编码数据中不包括再利用标记。当使用再利用标记时,能够减少输出代码串的编码量,从而能够更有效地执行声音的编码或解码。
此外,通过再利用标记再利用的信息可以是任意信息,而并非限制于系数索引。
[解码处理的描述]
接下来,将描述在使用再利用标记的情况下所执行的编码和解码处理。首先,将描述通过可变长度方法产生高带编码数据的情况。在这种情况下,通过图33中的编码器111及图35中的解码器151执行编码处理及解码处理。
将参考图47中的流程图描述编码器111的编码处理。针对预定数量的帧中的每个帧(即,待处理区间)执行该编码处理。
由于步骤S711至步骤S719的处理与图34中的步骤S471至步骤S479的处理相同,因此,省略其描述。在步骤S711至步骤S719的处理中,依次将构成待处理区间的每个帧设置成待处理的帧并且关于待处理的帧选择系数索引。
在步骤S719中,当仅确定了预定帧长度的处理时,处理进行到步骤S720。
在步骤S720中,产生单元121确定是否执行信息的再利用。例如,如果指定了通过用户执行信息的再利用的模式,则确定执行信息的再利用。
在步骤S720中,如果确定执行信息的再利用,则处理进行到S721。
在步骤S721中,产生单元121基于在待处理区间中的每个帧的系数索引的选择结果产生包括再利用标记、作为区间信息的系数索引及数量信息的数据,并且将所产生的数据提供给高带编码电路37。
例如,在图32的示例中,由于待处理区间的引导帧的系数索引为“2”,而该帧的紧前面的帧的系数索引为“3”并且再利用标记被设置成“0”而不再利用系数索引。
产生单元121产生包括如下内容的数据:再利用标记“0”;数量信息“num_length=3”;每个连续帧区间的区间信息“length0=5”、“length1=7”和“length2=4”以及连续帧区间的系数索引“2”、“5”和“1”。
此外,如果再利用标记被设置成“1”,则产生不包括在待处理区间的初始连续帧的系数索引中的数据。例如,在图32中的示例中,当待处理区间的再利用标记被设置成“1”时,数据包括:再利用标记;数量信息;区间信息“length0=5”、“length1=7”和“length2=4”以及系数索引“5”和“1”。
在步骤S722中,高带编码电路37对从产生单元121提供的、包括再利用标记、系数索引、区间信息、系数信息以及数量信息的数据进行编码,并且产生高带编码数据。高带编码电路37将所产生的高带编码数据提供给复用电路38,然后处理进行到步骤S725。
与此不同,在步骤S720中,如果确定不执行信息的再利用,即,指定了通过用户禁止信息的再利用的模式,则处理进行到步骤S723。
在步骤S723中,产生单元121基于待处理区间中的每个帧的系数索引的选择结果产生包括系数索引、区间信息以及数量信息的数据,并且将它们提供给高带编码电路37。执行与图34中的步骤S480的处理相同的步骤S723的处理。
在步骤S724中,高带编码电路37对从产生单元121提供的包括系数索引、区间信息以及数量信息的数据进行编码,并且产生高带编码数据。高带编码电路37将所产生的高带编码数据提供给复用电路38,然后处理进行到步骤S725。
在步骤S722或步骤S724中,在产生高带编码数据之后,执行步骤S725的处理以终止编码处理。但是,由于该处理与图34中的步骤S482的处理相同,因此,省略其描述。
如上所述,如果指定了执行信息的再利用的模式,则能够通过产生包括再利用标记的高带编码数据来减少输出代码串的编码量,从而能够更有效地执行声音的编码或解码。
[解码处理的描述]
接下来,将参考图48中的流程图描述通过图35中的解码器151执行的解码处理。
当执行参考图47描述的编码处理并且将从编码器111输出的输出代码串提供给解码器151作为输入代码串时,启动解码处理,并且针对预定的帧数(待处理区间)中的每个执行该解码处理。此外,步骤S751的处理与图36中的步骤S511的处理相同,并且省略其描述。
在步骤S752中,高带解码电路45对从解复用电路41提供的高带编码数据执行解码,并且将根据该结果获得的数据及已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46的选择单元161。
即,高带解码电路45在预先记录的已解码高带子带功率估计系数中读取利用通过对高带编码数据进行解码而获得的系数索引所表示的已解码高带子带功率估计系数。此外,高带解码电路45将已解码高带子带功率估计系数及通过对高带编码数据进行解码所获得的数据提供给选择单元161。
在这种情况下,如果指定了执行信息再利用的模式,则将已解码高带子带功率估计系数、再利用标记、区间信息以及数量信息提供给选择单元161。此外,如果指定了禁止信息再利用的模式,则将已解码高带子带功率估计系数、区间信息以及数量信息提供给选择单元161。
当对高带编码数据进行了解码时,此后,执行步骤S753至步骤S755的处理。但是,由于这些处理与图36中的步骤S513至步骤S515的处理相同,因此,省略其描述。
在步骤S756中,基于由从高带解码电路45提供的数据,选择单元161从由高带解码电路45提供的已解码高带子带功率估计系数中选择待处理的帧的已解码高带子带功率估计系数。
即,当从高带解码电路45提供了再利用标记、区间信息以及数量信息时,选择单元161基于再利用标记、区间信息以及数量信息选择待处理的帧的已解码高带子带功率估计系数。例如,当待处理区间的引导帧为待处理的帧并且再利用标记为“1”时,选择待处理的帧的紧前面的帧的已解码高带子带功率估计系数作为待处理帧的已解码高带子带功率估计系数。
在这种情况下,在待处理区间的头部的连续帧区间中,在每个帧中选择与在待处理区间的紧前面的帧的已解码高带子带功率估计系数相同的已解码高带子带估计系数。此外,在第二帧区间后面的连续帧区间中,通过与图36中的步骤S516的处理相同的处理(即,基于区间信息和数量信息)来选择每个帧的已解码高带子带功率估计系数。
此外,在这种情况下,选择单元161保持在待处理区间的紧前面的帧的已解码高带子带功率估计系数,该已解码高带子带功率估计系数是在启动解码处理之前从高带解码电路45所提供的。
此外,如果再利用标记为“0”或者从高带解码电路45提供已解码高带子带功率估计系数、区间信息以及数量信息,则执行与图36中的步骤S516相同的处理并且选择待处理的帧的已解码高带子带功率估计系数。
如果选择了待处理的帧的已解码高带子带功率估计系数,则,此后执行步骤S757至步骤S760中的处理以完成解码处理。但是,由于这些处理与图36中的步骤S517至步骤S520中的处理相同,因此,省略其描述。
在步骤S757至步骤S760的处理中,使用所选择的已解码高带子带功率估计系数来产生待处理的帧的已解码高带信号,并且对所产生的已解码高带信号和已解码低带信号进行合成和输出。
如上所述,如果需要,则使用包括再利用标记的高带编码数据,从而能够更有效地从较少量数据的输入代码串中获得输出信号。
<11.第十一实施例>
[解码处理的描述]
接下来,将描述必要时执行信息再利用并且通过固定长度方法产生高带编码数据的情况。在这种情况下,通过图38中的编码器191和图40中的解码器231执行编码处理和解码处理。
如下所述,将参考图49中的流程图描述编码器191的编码处理。针对预定数量的帧(即,待处理区间)中的每个帧执行编码处理。
此外,由于步骤S791至步骤S799中的处理与图39中的步骤S551至步骤S559中的处理相同,因此,省略其描述。在步骤S791至步骤S799的处理中,依次将组成待处理区间的每个帧设置成待处理的帧并且关于待处理的帧选择系数索引。
在步骤S799中,如果确定仅执行了预定帧长度的处理,则处理进行到步骤S800。
在步骤S800中,产生单元201确定是否执行信息再利用。例如,如果指定了通过用户执行信息再利用的模式,则确定执行信息再利用。
在步骤S800中,确定执行信息再利用,处理进行到步骤S801。
在步骤S801中,产生单元201基于待处理区间中的每个帧的系数索引的选择结果产生包括再利用标记、系数索引、固定长度索引及切换索引的数据,并且将所产生的数据提供给高带编码电路37。
例如,在图37的示例中,由于处理区间的引导帧的系数索引为“1”,而在该帧的紧前面的帧的系数索引为“3”,因此,再利用标记被设置为“0”而不再利用系数索引。产生单元201产生包括再利用标记“0”、固定长度索引“2”、系数索引“1”、“2”、“3”以及切换标志“1”、“0”、“1”的数据。
此外,如果再利用标记为“1”,则产生不包括待处理区间的初始定长区间的系数索引的数据。例如,在图37的示例中,当待处理区间的再利用标记被设置为“1”时,产生如下数据:该数据包括再利用标记“0”,固定长度索引为“2”,系数索引为“2”、“3”并且切换标志为“1”、“0”、“1”。
在步骤S802中,高带编码电路37对从产生单元201提供的包括再利用标记、系数索引、固定长度索引以及切换标志的数据进行编码,并且产生高带编码数据。高带编码电路37将所产生的高带编码数据提供给复用电路38,此后,处理进行到步骤S805。
与此不同,在步骤S800中,如果确定不执行信息再利用,即,如果指定了用户禁止信息再利用的模式,则处理进行到步骤S803。
在步骤S803中,产生单元201基于待处理区间中的每个帧的系数索引的选择结果产生包括系数索引、固定长度索引以及切换标志的数据,并且将它们提供给高带编码电路37。在步骤S803中,执行与图39中的步骤S560的处理相同的处理。
在步骤S804中,高带编码电路37对从产生单元201提供的包括系数索引、固定长度索引以及切换标志的数据进行编码,并且产生高带编码信号。高带编码电路37将所产生的高带编码数据提供给复用电路38,然后处理进行到步骤S805。
在步骤S802或步骤S804中,当产生了高带编码数据时,此后,执行步骤S805的处理以终止编码处理。但是,由于这些处理与图39中的步骤S562的处理相同,因此,省略其描述。
如上所述,当指定了执行信息再利用的模式时,能够通过产生包括再利用标记的高带编码数据来减少输出代码串的编码量,从而能够更有效地执行声音的编码和解码。
[解码处理的描述]
接下来,将参考图50的流程图描述由图40中的解码器231执行的解码处理。
当执行了参考图49描述的编码处理并且将从编码器191输出的输出代码串提供给解码器231作为输入代码串时,启动解码处理,并且针对预定数量的帧(即,待处理区间)中的每个帧执行该解码处理。此外,由于步骤S831的处理与图41中的步骤S591的处理相同,因此,省略其描述。
在步骤S832中,高带解码电路45对从解复用电路41提供的高带编码数据执行解码,并且将根据该结果获得的数据及已解码高带子带功率估计系数提供给已解码高带子带功率计算电路46的选择单元241。
也就是说,高带解码电路45从预先记录的已解码高带子带功率估计系数中读取由通过对高带编码数据进行解码而获得的系数索引所表示的、已解码高带子带功率估计系数。此外,高带解码电路45将已解码高带子带功率估计系数及通过对高带编码数据进行解码而获得的数据提供给选择单元241。
在这种情况下,如果指定了执行信息再利用的模式,则将已解码高带子带功率估计系数、再利用标记、固定长度索引以及切换标志提供给选择单元241。此外,如果指定了禁止信息再利用的模式,则将已解码高带子带功率估计系数、固定长度索引以及切换标志提供给选择单元241。
当对高带编码数据解码时,此后,执行步骤S833至步骤S835的处理。但是,由于这些处理与图41中的步骤S593至步骤S595的处理相同,因此,省略其描述。
在步骤S836中,基于从高带解码电路45提供的数据,选择单元241从由高带解码电路45提供的已解码高带子带功率估计系数中选择待处理的帧的、已解码高带子带功率估计系数。
也就是说,当从高带解码电路45提供了再利用标记、固定长度索引以及切换标志时,选择单元241基于再利用标记、固定长度索引以及切换标志选择待处理的帧的已解码高带子带功率估计系数。例如,当待处理区间的引导帧为待处理的帧并且再利用标记为“1”时,选择待处理的帧的紧前面的帧的已解码高带子带功率估计系数作为待处理的帧的已解码高带子带功率估计系数。
在这种情况下,在待处理区间的头部的固定长度区间中,在每个帧中选择与在待处理区间的紧前面的帧的已解码高带子带功率估计系数相同的已解码高带子带估计系数。此外,在第二帧区间后面的固定长度区间中,通过与图41中的步骤S596的处理中相同的处理(即,基于固定长度索引和切换标志),来选择每个帧的已解码高带子带功率估计系数。
此外,在这种情况下,选择单元241保持在启动解码处理之前从高带解码电路45提供的、在待处理区间的紧前面的帧的已解码高带子带功率估计系数。
此外,当再利用标记为“0”且从高带解码电路45提供了已解码高带子带功率估计系数、固定长度索引以及切换标志时,执行与图41中的步骤S596相同的处理,并且选择待处理的帧的已解码高带子带功率估计系数。
如果选择了待处理的帧的已解码高带子带功率估计系数,则,此后执行步骤S837至步骤S840中的处理以完成解码处理。但是,由于这些处理与图41中的步骤S597至步骤S600中的处理相同,因此,省略其描述。
在步骤S837至步骤S840的处理中,使用所选择的已解码高带子带功率估计系数产生待处理的帧的已解码高带信号,并且对所产生的已解码高带信号和已解码低带信号进行合成和输出。
如上所述,如果需要,当使用包括再利用标记的高带编码数据时,能够更有效地从较少量数据的输入代码串中获得输出信号。
此外,如上所述,作为通过使用可变长度方式与固定长度方式中的任一种来使用再利用标记的示例,描述了产生高带编码数据的情况。但是,即使在这些方式中选择了编码量小的方式的情况下,也可以使用再利用标记。
利用硬件或软件来执行上述系列处理。当利用软件来执行系列处理时,在结合有专用硬件的计算机或通用个人计算机中安装由软件构成的程序,通用个人计算机能够通过从程序记录介质安装各种程序来执行各种功能。
图51为示出通过计算机执行上述系列处理的计算机的硬件的配置示例的框图。
在该计算机中,CPU501、ROM(只读存储器)502以及RAM(随机存取存储器)503通过总线504彼此连接。
此外,输入/输出接口505连接至总线504。输入/输出接口505连接有:输入单元506、输出单元507、存储单元508、通信单元509和驱动器510,其中,输入单元506包括键盘、鼠标、麦克风等,输出单元507包括显示器、扬声器等,存储单元508包括硬盘或非易失性存储器等,通信单元509包括网络接口等,驱动器510驱动磁盘、光盘、磁光盘和半导体存储器等可移除介质511。
在如上配置的计算机中,例如,CPU501经由输入/输出接口505和总线504将存储在存储单元508中的程序装载到RAM503中并执行该程序,以执行上述系列处理。
例如,要由计算机(CPU501)执行的程序记录在如封装介质的可移除介质511中,封装介质包括磁盘(包括软盘)、光盘((CD-ROM(压缩盘只读存储器))、DVD(数字多功能盘)等)、磁光盘或半导体存储器,或者通过包括局域网、互联网和数字卫星广播的有线或无线传输介质提供。
此外,可以通过给驱动器510安装可移除介质511来经由输入/输出接口505给存储单元508安装程序。此外,通过有线或无线传输介质在通信单元509中接收程序,并且,可以将程序安装至存储单元508。此外,可以事先在ROM502或者存储单元508中安装程序。
此外,由计算机执行的程序可以是如下程序:处理根据说明书中描述的顺序按照时间顺序来执行,也可以是如下程序:处理在进行调用时并行地或者在必要的定时执行。
此外,本发明的实施例不限于上述实施例,并且在不偏离本发明的主旨的范围内能够进行各种修改。
附图标记列表
10 频带扩展装置
11 低通滤波器
12 延迟电路
13、13-1至13-N 带通滤波器
14 特征量计算电路
15 高带子带功率估计电路
16 高带信号产生电路
17 高通滤波器
18 信号加法器
20 系数学习装置
21、21-1至21-(K+N) 带通滤波器
22 高带子带功率计算电路
23 特征量计算电路
24 系数估计电路
30 编码器
31 低通滤波器
32 低带编码电路
33 子带分割电路
34 特征量计算电路
35 伪高带子带功率计算电路
36 伪高带子带功率差计算电路
37 高带编码电路
38 复用电路
40 解码器
41 解复用电路
42 低带解码电路
43 子带分割电路
44 特征量计算电路
45 高带解码电路
46 已解码高带子带功率计算电路
47 已解码高带信号产生电路
48 合成电路
50 系数学习装置
51 低通滤波器
52 子带分割电路
53 特征量计算电路
54 伪高带子带功率计算电路
55 伪高带子带功率差计算电路
56 伪高带子带功率差聚类电路
57 系数估计电路
101 CPU
102 ROM
103 RAM
104 总线
105 输入/输出接口
106 输入单元
107 输出单元
108 存储单元
109 通信单元
110 驱动器
111 可移除介质

Claims (21)

1.一种信号处理装置,包括:
解复用单元,将输入编码数据解复用为低带编码数据和如下数据:所述数据包括:关于包括多个帧的待处理区间中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在所述区间的帧中所选择的系数的系数信息;
低带解码单元,对所述低带编码数据进行解码以产生低带信号;
选择单元,基于所述数据从多个所述系数中选择待处理的帧的系数;
高带子带功率计算单元,基于构成所述待处理的帧的所述低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成所述待处理的帧的所述高带信号的每个子带的高带子带信号的高带子带功率;以及
高带信号产生单元,基于所述高带子带功率和所述低带子带信号来产生所述待处理的帧的所述高带信号。
2.根据权利要求1所述的信号处理装置,
其中,所述待处理区间被分割成所述区间,使得其中选择不同系数的、彼此相邻的帧的位置被设置成所述区间的边界位置,并且表示所述区间中的每个区间的长度的信息被设置成关于所述区间的信息。
3.根据权利要求1所述的信号处理装置,
其中,所述待处理区间被分割成具有相同长度的若干区间,使得所述区间的长度最长,并且表示所述长度的信息以及表示所选择的系数是否在所述区间的每个边界位置之前或之后变化的信息被设置成关于所述区间的信息。
4.根据权利要求3所述的信号处理装置,
其中,当在连续的若干区间中选择相同的系数时,所述数据包括用于获得在所述若干连续的区间中选择的所述系数的一条系数信息。
5.根据权利要求1所述的信号处理装置,
其中,通过在第一方式和第二方式之间的具有较少数据量的方式来针对每个待处理区间产生所述数据,
其中,在所述第一方式中,所述待处理区间被分割成所述区间,使得其中选择不同系数的、彼此相邻的帧的位置被设置成所述区间的边界位置,并且表示所述区间中的每个区间的长度的信息被设置成关于所述区间的信息,
其中,在所述第二方式中,所述待处理区间被分割成具有相同长度的若干区间,使得所述区间的长度最长,并且表示所述长度的信息以及表示所选择的系数是否在所述区间的边界位置之前或之后变化的信息被设置成关于所述区间的信息,以及
其中,所述数据进一步包括表示所述数据是通过所述第一方式获得还是通过所述第二方式获得的信息。
6.根据权利要求1所述的信号处理装置,
其中,所述数据进一步包括表示所述待处理区间中的初始帧的系数是否与所述初始帧的紧前面的帧的系数相同的再利用信息,以及
当所述数据包括表示所述系数相同的再利用信息时,所述数据不包括所述待处理区间的所述初始帧的系数信息。
7.根据权利要求6所述的信号处理装置,
其中,当指定其中所述系数信息被再利用的模式时,所述数据包括所述再利用信息,并且当指定其中所述系数信息的再利用被禁止的模式时,所述数据不包括所述再利用信息。
8.一种用于信号处理装置的信号处理方法,所述信号处理装置包括:
解复用单元,将输入编码数据解复用为低带编码数据和如下数据:所述数据包括:关于包括多个帧的待处理区间中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在所述区间的帧中所选择的系数的系数信息;
低带解码单元,对所述低带编码数据进行解码以产生低带信号;
选择单元,基于所述数据从多个所述系数中选择待处理的帧的系数;
高带子带功率计算单元,基于构成所述待处理的帧的所述低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成所述待处理的帧的所述高带信号的每个子带的高带子带信号的高带子带功率;以及
高带信号产生单元,基于所述高带子带功率和所述低带子带信号来产生所述待处理的帧的所述高带信号,
所述信号处理方法包括如下步骤:
通过所述解复用单元将所述编码数据解复用为所述数据和所述低带编码数据;
通过所述低带解码单元对所述低带编码数据进行解码;
通过所述选择单元选择所述待处理的帧的所述系数;
通过所述高带子带功率计算单元计算所述高带子带功率;以及
通过所述高带信号产生单元产生所述高带信号。
9.一种信号处理装置,包括:
子带分割单元,产生在输入信号的低带侧的多个子带的低带子带信号,以及在所述输入信号的高带侧的多个子带的高带子带信号;
伪高带子带功率计算单元,基于所述低带子带信号和预定系数来计算作为所述高带子带信号的高带子带功率的估计值的伪高带子带功率;
选择单元,通过将所述高带子带信号的所述高带子带功率与所述伪高带子带功率相比较,来选择用于所述输入信号的各个帧的多个所述系数中的任何系数;以及
产生单元,产生如下数据:所述数据包括:关于具有所述输入信号的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息,以及用于获得在所述区间的帧中所选择的系数的系数信息。
10.根据权利要求9所述的信号处理装置,
其中,所述产生单元将所述待处理区间分割成所述区间,使得其中选择不同系数的、彼此相邻的帧的位置被设置成所述区间的边界位置,并且将表示所述区间中的每个所述区间的长度的信息设置成关于所述区间的信息。
11.根据权利要求9所述的信号处理装置,
其中,所述产生单元将所述待处理区间分割成具有相同长度的若干区间,使得所述区间的长度最长,并且表示所述长度的信息以及表示所选择的系数是否在所述区间的边界位置之前或之后变化的信息被设置成关于所述区间的信息。
12.根据权利要求11所述的信号处理装置,
其中,当在若干连续的区间中选择相同的系数时,所述产生单元产生包括用于获得在所述若干连续的区间中选择的所述系数的一条系数信息的所述数据。
13.根据权利要求9所述的信号处理装置,
其中,所述产生单元使用在第一方式和第二方式之间的具有较少数据量的方式针对每个待处理区间产生所述数据,
其中,在所述第一方式中,所述待处理区间被分割成所述区间,使得其中选择不同系数的、彼此相邻的帧的位置被设置成所述区间的边界位置,并且表示所述区间中的每个区间的长度的信息被设置成关于所述区间的信息,
其中,在所述第二方式中,所述待处理区间被分割成具有相同长度的若干区间,使得所述区间的长度最长,并且表示所述长度的信息以及表示所选择的系数是否在所述区间的边界位置之前或之后变化的信息被设置成关于所述区间的信息。
14.根据权利要求13所述的信号处理装置,
其中,所述数据进一步包括表示所述数据是通过所述第一方式获得还是通过所述第二方式获得的信息。
15.根据权利要求9所述的信号处理装置,
其中,所述产生单元产生包括表示所述待处理区间中的初始帧的系数是否与所述初始帧的紧前面的帧的系数相同的再利用信息的所述数据,以及
当所述数据中包括表示所述系数相同的再利用信息时,产生其中不包括所述待处理区间的初始帧的系数信息的所述数据。
16.根据权利要求15所述的信号处理装置,
其中,当指定其中所述系数信息被再利用的模式时,所述产生单元产生包括所述再利用信息的所述数据,并且当指定其中所述系数信息的再利用被禁止的模式时,所述产生单元产生其中不包括所述再利用信息的所述数据。
17.一种用于信号处理装置的信号处理方法,所述信号处理装置包括:
子带分割单元,产生在输入信号的低带侧的多个子带的低带子带信号,以及在所述输入信号的高带侧的多个子带的高带子带信号;
伪高带子带功率计算单元,基于所述低带子带信号和预定系数来计算作为所述高带子带信号的高带子带功率的估计值的伪高带子带功率;
选择单元,通过将所述高带子带信号的所述高带子带功率与所述伪高带子带功率相比较,来选择用于所述输入信号的各个帧的多个所述系数中的任何系数;以及
产生单元,产生如下数据:所述数据包括:关于具有所述输入信号的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息,以及用于获得在所述区间的帧中所选择的系数的系数信息,
所述信号处理方法包括如下步骤:
通过所述子带分割单元产生所述低带子带信号和所述高带子带信号;
通过所述伪高带子带功率计算单元计算所述伪高带子带功率;
通过所述选择单元选择多个所述系数中的任何系数;以及
通过所述产生单元产生所述数据。
18.一种解码器,包括:
解复用单元,将输入编码数据解复用为低带编码数据和如下数据:所述数据包括:关于包括多个帧的待处理区间中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在所述区间的帧中所选择的系数的系数信息;
低带解码单元,对所述低带编码数据进行解码以产生低带信号;
选择单元,基于所述数据从多个所述系数中选择待处理的帧的系数;
高带子带功率计算单元,基于构成所述待处理的帧的所述低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成所述待处理的帧的所述高带信号的每个子带的高带子带信号的高带子带功率;
高带信号产生单元,基于所述高带子带功率和所述低带子带信号来产生所述待处理的帧的所述高带信号;以及
合成单元,将所述低带信号与所述高带信号进行合成以产生输出信号。
19.一种用于解码器的解码方法,所述解码器包括:
解复用单元,将输入编码数据解复用为低带编码数据和如下数据:所述数据包括:关于包括多个帧的待处理区间中的、包含其中选择与产生高带信号时使用的系数相同的系数的帧的区间的信息,以及用于获得在所述区间的帧中所选择的系数的系数信息;
低带解码单元,对所述低带编码数据进行解码以产生低带信号;
选择单元,基于所述数据从多个所述系数中选择待处理的帧的系数;
高带子带功率计算单元,基于构成所述待处理的帧的所述低带信号的每个子带的低带子带信号以及所选择的系数,来计算构成所述待处理的帧的所述高带信号的每个子带的高带子带信号的高带子带功率;
高带信号产生单元,基于所述高带子带功率和所述低带子带信号来产生所述待处理的帧的所述高带信号;以及
合成单元,将所述低带信号与所述高带信号进行合成以产生输出信号,
所述解码方法包括如下步骤:
通过所述解复用单元将所述编码数据解复用为所述数据和所述低带编码数据;
通过所述低带解码单元对所述低带编码数据进行解码;
通过所述选择单元选择所述待处理的帧的所述系数;
通过所述高带子带功率计算单元计算所述高带子带功率;
通过所述高带信号产生单元产生所述高带信号;以及
通过所述合成单元产生所述输出信号。
20.一种编码器,包括:
子带分割单元,产生在输入信号的低带侧的多个子带的低带子带信号,以及在所述输入信号的高带侧的多个子带的高带子带信号;
伪高带子带功率计算单元,基于所述低带子带信号和预定系数来计算作为所述高带子带信号的高带子带功率的估计值的伪高带子带功率;
选择单元,通过将所述高带子带信号的所述高带子带功率与所述伪高带子带功率相比较,来选择用于所述输入信号的各个帧的多个所述系数中的任何系数;
高带编码单元,通过对关于包括所述输入信号的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息以及用于获得在所述区间的帧中所选择的系数的系数信息进行编码,来产生高带编码数据;
低带编码单元,对所述输入信号的低带信号进行编码并且产生低带编码数据;以及
复用单元,通过对所述低带编码数据和所述高带编码数据进行复用来产生输出代码串。
21.一种用于编码器的编码方法,所述编码器包括:
子带分割单元,产生在输入信号的低带侧的多个子带的低带子带信号,以及在所述输入信号的高带侧的多个子带的高带子带信号;
伪高带子带功率计算单元,基于所述低带子带信号和预定系数来计算作为所述高带子带信号的高带子带功率的估计值的伪高带子带功率;
选择单元,通过将所述高带子带信号的所述高带子带功率与所述伪高带子带功率相比较,来选择用于所述输入信号的各个帧的多个所述系数中的任何系数;
高带编码单元,通过对关于包括所述输入信号的多个帧的待处理区间中的、具有其中选择相同的系数的帧的区间的信息以及用于获得在所述区间的帧中所选择的系数的系数信息进行编码,来产生高带编码数据;
低带编码单元,对所述输入信号的低带信号进行编码并且产生低带编码数据;以及
复用单元,通过对所述低带编码数据和所述高带编码数据进行复用来产生输出代码串,
所述编码方法包括如下步骤:
通过所述子带分割单元产生所述低带子带信号和所述高带子带信号;
通过所述伪高带子带功率计算单元计算所述伪高带子带功率;
通过所述选择单元选择多个所述系数中的任何系数;
通过所述高带编码单元产生所述高带编码数据;
通过所述低带编码单元产生所述低带编码数据;以及
通过所述复用单元产生所述输出代码串。
CN201180018948.4A 2010-04-13 2011-04-11 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法 Active CN102834864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410216102.7A CN104021794B (zh) 2010-04-13 2011-04-11 信号处理装置和信号处理方法以及解码器和解码方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2010-092689 2010-04-13
JP2010092689 2010-04-13
JP2011017230 2011-01-28
JP2011-017230 2011-01-28
JP2011-072380 2011-03-29
JP2011072380A JP5850216B2 (ja) 2010-04-13 2011-03-29 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
PCT/JP2011/059028 WO2011129303A1 (ja) 2010-04-13 2011-04-11 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410216102.7A Division CN104021794B (zh) 2010-04-13 2011-04-11 信号处理装置和信号处理方法以及解码器和解码方法

Publications (2)

Publication Number Publication Date
CN102834864A CN102834864A (zh) 2012-12-19
CN102834864B true CN102834864B (zh) 2014-06-25

Family

ID=44798676

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201180018948.4A Active CN102834864B (zh) 2010-04-13 2011-04-11 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法
CN201410216102.7A Active CN104021794B (zh) 2010-04-13 2011-04-11 信号处理装置和信号处理方法以及解码器和解码方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201410216102.7A Active CN104021794B (zh) 2010-04-13 2011-04-11 信号处理装置和信号处理方法以及解码器和解码方法

Country Status (14)

Country Link
US (6) US9406312B2 (zh)
EP (4) EP2560165B1 (zh)
JP (1) JP5850216B2 (zh)
KR (3) KR101916619B1 (zh)
CN (2) CN102834864B (zh)
AU (1) AU2011242000B2 (zh)
BR (1) BR112012025570B1 (zh)
CA (1) CA2794890C (zh)
ES (4) ES2939770T3 (zh)
HK (2) HK1175288A1 (zh)
RU (1) RU2550550C2 (zh)
TR (1) TR201808257T4 (zh)
TW (1) TWI484484B (zh)
WO (1) WO2011129303A1 (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2649944C2 (ru) 2012-07-02 2018-04-05 Сони Корпорейшн Устройство декодирования, способ декодирования, устройство кодирования, способ кодирования и программа
US11146903B2 (en) 2013-05-29 2021-10-12 Qualcomm Incorporated Compression of decomposed representations of a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
US10469969B2 (en) 2013-09-17 2019-11-05 Wilus Institute Of Standards And Technology Inc. Method and apparatus for processing multimedia signals
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
US10580417B2 (en) 2013-10-22 2020-03-03 Industry-Academic Cooperation Foundation, Yonsei University Method and apparatus for binaural rendering audio signal using variable order filtering in frequency domain
EP3934283B1 (en) 2013-12-23 2023-08-23 Wilus Institute of Standards and Technology Inc. Audio signal processing method and parameterization device for same
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
CN106105269B (zh) 2014-03-19 2018-06-19 韦勒斯标准与技术协会公司 音频信号处理方法和设备
KR102216801B1 (ko) 2014-04-02 2021-02-17 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
JP6546351B2 (ja) 2016-01-19 2019-07-17 ブームクラウド 360 インコーポレイテッド ヘッドマウントスピーカのためのオーディオエンハンスメント
CN106057220B (zh) * 2016-05-19 2020-01-03 Tcl集团股份有限公司 一种音频信号的高频扩展方法和音频播放器
US10313820B2 (en) 2017-07-11 2019-06-04 Boomcloud 360, Inc. Sub-band spatial audio enhancement
US10764704B2 (en) 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1734555A (zh) * 2004-08-04 2006-02-15 三星电子株式会社 恢复音频数据的高频分量的方法和设备
CN101093670A (zh) * 2002-03-28 2007-12-26 杜比实验室特许公司 根据频率变换重建具有不完全频谱的音频信号的频谱
CN101178898A (zh) * 2006-11-09 2008-05-14 索尼株式会社 频带扩展装置及方法、播放装置、方法、程序及记录介质

Family Cites Families (198)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4817151A (en) 1987-11-09 1989-03-28 Broadcast Technology Partners Selective decoder for compatible FM stereophonic system utilizing companding of difference signal
JPH03254223A (ja) 1990-03-02 1991-11-13 Eastman Kodak Japan Kk アナログデータ伝送方式
US6022222A (en) 1994-01-03 2000-02-08 Mary Beth Guinan Icon language teaching system
JP2655485B2 (ja) 1994-06-24 1997-09-17 日本電気株式会社 音声セル符号化装置
JP3498375B2 (ja) 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
JP3189598B2 (ja) 1994-10-28 2001-07-16 松下電器産業株式会社 信号合成方法および信号合成装置
US5664055A (en) 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH1020888A (ja) 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
US6073100A (en) 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
WO1999003096A1 (fr) 1997-07-11 1999-01-21 Sony Corporation Procede et dispositif de codage et decodage d'informations et support de distribution
JPH11168622A (ja) 1997-12-05 1999-06-22 Canon Inc 画像処理装置、画像処理方法および記憶媒体
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
WO2000070769A1 (fr) 1999-05-14 2000-11-23 Matsushita Electric Industrial Co., Ltd. Procede et appareil d'elargissement de la bande d'un signal audio
JP4218134B2 (ja) 1999-06-17 2009-02-04 ソニー株式会社 復号装置及び方法、並びにプログラム提供媒体
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP3454206B2 (ja) 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US6782366B1 (en) 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
TW499670B (en) * 2000-06-01 2002-08-21 Tenx Technology Inc Speech signal synthesizing method and device
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
JP4231987B2 (ja) 2001-06-15 2009-03-04 日本電気株式会社 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
CN1235192C (zh) 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
DE60230856D1 (de) 2001-07-13 2009-03-05 Panasonic Corp Audiosignaldecodierungseinrichtung und audiosignalcodierungseinrichtung
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
EP1444688B1 (en) 2001-11-14 2006-08-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
AU2002352182A1 (en) 2001-11-29 2003-06-10 Coding Technologies Ab Methods for improving high frequency reconstruction
DE60323331D1 (de) 2002-01-30 2008-10-16 Matsushita Electric Ind Co Ltd Verfahren und vorrichtung zur audio-kodierung und -dekodierung
JP3815347B2 (ja) 2002-02-27 2006-08-30 ヤマハ株式会社 歌唱合成方法と装置及び記録媒体
JP2003255973A (ja) 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
JP2003316394A (ja) 2002-04-23 2003-11-07 Nec Corp 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
JP3579047B2 (ja) 2002-07-19 2004-10-20 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
JP4728568B2 (ja) * 2002-09-04 2011-07-20 マイクロソフト コーポレーション レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
CN100492492C (zh) 2002-09-19 2009-05-27 松下电器产业株式会社 音频解码设备和方法
US7330812B2 (en) 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
EP1586045A1 (en) 2002-12-27 2005-10-19 Nielsen Media Research, Inc. Methods and apparatus for transcoding metadata
US7787632B2 (en) 2003-03-04 2010-08-31 Nokia Corporation Support of a multichannel audio extension
CN1458646A (zh) 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
KR20050027179A (ko) 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7844451B2 (en) 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
US7949057B2 (en) 2003-10-23 2011-05-24 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
JP3912389B2 (ja) * 2004-03-24 2007-05-09 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
US8417515B2 (en) 2004-05-14 2013-04-09 Panasonic Corporation Encoding device, decoding device, and method thereof
ATE394774T1 (de) 2004-05-19 2008-05-15 Matsushita Electric Ind Co Ltd Kodierungs-, dekodierungsvorrichtung und methode dafür
WO2006000842A1 (en) 2004-05-28 2006-01-05 Nokia Corporation Multichannel audio extension
TWI294119B (en) 2004-08-18 2008-03-01 Sunplus Technology Co Ltd Dvd player with sound learning function
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US20060106620A1 (en) 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
MX2007005103A (es) * 2004-11-02 2007-07-04 Koninkl Philips Electronics Nv Codificacion y decodificacion de senales de audio utilizando bancos de filtros de valor complejo.
SE0402651D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
EP1798724B1 (en) 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
US7983904B2 (en) 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
WO2006075563A1 (ja) 2005-01-11 2006-07-20 Nec Corporation オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
KR100708121B1 (ko) 2005-01-22 2007-04-16 삼성전자주식회사 음성 신호의 대역 확장 방법 및 장치
NZ562188A (en) 2005-04-01 2010-05-28 Qualcomm Inc Methods and apparatus for encoding and decoding an highband portion of a speech signal
DE602006004959D1 (de) 2005-04-15 2009-03-12 Dolby Sweden Ab Zeitliche hüllkurvenformgebung von entkorrelierten signalen
US20070005351A1 (en) 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100813259B1 (ko) 2005-07-13 2008-03-13 삼성전자주식회사 입력신호의 계층적 부호화/복호화 장치 및 방법
KR101228630B1 (ko) 2005-09-02 2013-01-31 파나소닉 주식회사 에너지 정형 장치 및 에너지 정형 방법
US8396717B2 (en) 2005-09-30 2013-03-12 Panasonic Corporation Speech encoding apparatus and speech encoding method
JP4954080B2 (ja) 2005-10-14 2012-06-13 パナソニック株式会社 変換符号化装置および変換符号化方法
AU2005337961B2 (en) 2005-11-04 2011-04-21 Nokia Technologies Oy Audio compression
JP5030789B2 (ja) * 2005-11-30 2012-09-19 パナソニック株式会社 サブバンド符号化装置およびサブバンド符号化方法
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4863713B2 (ja) 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
EP1977312A2 (en) 2006-01-16 2008-10-08 Zlango Ltd. Iconic communication
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7590523B2 (en) 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US20090248407A1 (en) 2006-03-31 2009-10-01 Panasonic Corporation Sound encoder, sound decoder, and their methods
EP2012305B1 (en) 2006-04-27 2011-03-09 Panasonic Corporation Audio encoding device, audio decoding device, and their method
WO2007129728A1 (ja) 2006-05-10 2007-11-15 Panasonic Corporation 符号化装置及び符号化方法
JP2007316254A (ja) 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
JP2007333785A (ja) 2006-06-12 2007-12-27 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
WO2007148925A1 (en) 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101244310B1 (ko) * 2006-06-21 2013-03-18 삼성전자주식회사 광대역 부호화 및 복호화 방법 및 장치
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8239191B2 (en) 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
JP4930320B2 (ja) 2006-11-30 2012-05-16 ソニー株式会社 再生方法及び装置、プログラム並びに記録媒体
US8560328B2 (en) 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
JP4984983B2 (ja) 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
JP2008261978A (ja) 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
US8015368B2 (en) 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
WO2009001874A1 (ja) 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
WO2009004727A1 (ja) 2007-07-04 2009-01-08 Fujitsu Limited 符号化装置、符号化方法および符号化プログラム
JP5045295B2 (ja) 2007-07-30 2012-10-10 ソニー株式会社 信号処理装置及び方法、並びにプログラム
US8041577B2 (en) 2007-08-13 2011-10-18 Mitsubishi Electric Research Laboratories, Inc. Method for expanding audio signal bandwidth
MX2010001394A (es) 2007-08-27 2010-03-10 Ericsson Telefon Ab L M Frecuencia de transicion adaptiva entre llenado de ruido y extension de anchura de banda.
CN101790756B (zh) 2007-08-27 2012-09-05 爱立信电话股份有限公司 瞬态检测器以及用于支持音频信号的编码的方法
CN101809657B (zh) 2007-08-27 2012-05-30 爱立信电话股份有限公司 用于噪声填充的方法和设备
CN101868823B (zh) 2007-10-23 2011-12-07 歌乐株式会社 高频插值装置和高频插值方法
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
JP4733727B2 (ja) 2007-10-30 2011-07-27 日本電信電話株式会社 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体
EP2214163A4 (en) 2007-11-01 2011-10-05 Panasonic Corp CODING DEVICE, DECODING DEVICE AND METHOD THEREFOR
US20090132238A1 (en) 2007-11-02 2009-05-21 Sudhakar B Efficient method for reusing scale factors to improve the efficiency of an audio encoder
EP2207166B1 (en) 2007-11-02 2013-06-19 Huawei Technologies Co., Ltd. An audio decoding method and device
EP2220646A1 (en) 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof
JP2009116275A (ja) 2007-11-09 2009-05-28 Toshiba Corp 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置
EP2218068A4 (en) 2007-11-21 2010-11-24 Lg Electronics Inc METHOD AND APPARATUS FOR SIGNAL PROCESSING
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
EP2224432B1 (en) 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
US20100280833A1 (en) 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
JP5448850B2 (ja) 2008-01-25 2014-03-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
AU2009220321B2 (en) 2008-03-03 2011-09-22 Intellectual Discovery Co., Ltd. Method and apparatus for processing audio signal
KR101449434B1 (ko) 2008-03-04 2014-10-13 삼성전자주식회사 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
EP3273442B1 (en) 2008-03-20 2021-10-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synthesizing a parameterized representation of an audio signal
KR20090122142A (ko) 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
EP2294770B1 (en) 2008-06-20 2013-08-07 Rambus, Inc. Frequency responsive bus coding
AU2009267525B2 (en) 2008-07-11 2012-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio signal synthesizer and audio signal encoder
MY178597A (en) 2008-07-11 2020-10-16 Fraunhofer Ges Forschung Audio encoder, audio decoder, methods for encoding and decoding an audio signal, and a computer program
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
BRPI0917953B1 (pt) 2008-08-08 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho de atenuação de espectro, aparelho de codificação, aparelho terminal de comunicação, aparelho de estação base e método de atenuação de espectro.
JP2010079275A (ja) * 2008-08-29 2010-04-08 Sony Corp 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US8532983B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8407046B2 (en) 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
CA3231911A1 (en) 2009-01-16 2010-07-22 Dolby International Ab Cross product enhanced harmonic transposition
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
JP4945586B2 (ja) 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US8983831B2 (en) * 2009-02-26 2015-03-17 Panasonic Intellectual Property Corporation Of America Encoder, decoder, and method therefor
JP5564803B2 (ja) 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
CN101853663B (zh) 2009-03-30 2012-05-23 华为技术有限公司 比特分配方法、编码装置及解码装置
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
US8392200B2 (en) * 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks
TWI643187B (zh) * 2009-05-27 2018-12-01 瑞典商杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8971551B2 (en) * 2009-09-18 2015-03-03 Dolby International Ab Virtual bass synthesis using harmonic transposition
JP5223786B2 (ja) 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
US8515768B2 (en) 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5928539B2 (ja) 2009-10-07 2016-06-01 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102081927B (zh) * 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8600749B2 (en) 2009-12-08 2013-12-03 At&T Intellectual Property I, L.P. System and method for training adaptation-specific acoustic models for automatic speech recognition
US8447617B2 (en) 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
EP2357649B1 (en) 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
TWI529703B (zh) 2010-02-11 2016-04-11 杜比實驗室特許公司 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
CN103038819B (zh) * 2010-03-09 2015-02-18 弗兰霍菲尔运输应用研究公司 用以使用补丁边界对准处理输入音频信号的装置及方法
JP5375683B2 (ja) 2010-03-10 2013-12-25 富士通株式会社 通信装置および電力補正方法
JP5598536B2 (ja) 2010-03-31 2014-10-01 富士通株式会社 帯域拡張装置および帯域拡張方法
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
WO2011127832A1 (en) 2010-04-14 2011-10-20 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
US8560330B2 (en) 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
KR101709095B1 (ko) 2010-07-19 2017-03-08 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP2012058358A (ja) 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9230551B2 (en) 2010-10-18 2016-01-05 Nokia Technologies Oy Audio encoder or decoder apparatus
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9240191B2 (en) 2011-04-28 2016-01-19 Telefonaktiebolaget L M Ericsson (Publ) Frame based audio signal classification
JP6024077B2 (ja) 2011-07-01 2016-11-09 ヤマハ株式会社 信号送信装置および信号処理装置
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
BR112014007481A2 (pt) 2011-09-29 2017-04-04 Dolby Int Ab detecção de alta qualidade em sinais de rádio fm estéreo
JPWO2013154027A1 (ja) 2012-04-13 2015-12-17 ソニー株式会社 復号装置および方法、オーディオ信号処理装置および方法、並びにプログラム
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
RU2652468C2 (ru) 2012-07-02 2018-04-26 Сони Корпорейшн Декодирующее устройство, способ декодирования, кодирующее устройство, способ кодирования и программа
CA2843223A1 (en) 2012-07-02 2014-01-09 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
RU2649944C2 (ru) 2012-07-02 2018-04-05 Сони Корпорейшн Устройство декодирования, способ декодирования, устройство кодирования, способ кодирования и программа
JP2014123011A (ja) 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
KR20240055146A (ko) 2013-01-21 2024-04-26 돌비 레버러토리즈 라이쎈싱 코오포레이션 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
JP6259930B2 (ja) 2014-03-25 2018-01-10 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ダイナミックレンジ制御における効率的なゲイン符号化を有するオーディオ符号化装置及びオーディオ復号化装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093670A (zh) * 2002-03-28 2007-12-26 杜比实验室特许公司 根据频率变换重建具有不完全频谱的音频信号的频谱
CN1734555A (zh) * 2004-08-04 2006-02-15 三星电子株式会社 恢复音频数据的高频分量的方法和设备
CN101178898A (zh) * 2006-11-09 2008-05-14 索尼株式会社 频带扩展装置及方法、播放装置、方法、程序及记录介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JP特开2003-216190A 2003.07.30
JP特开2010-79275A 2010.04.08

Also Published As

Publication number Publication date
AU2011242000B2 (en) 2014-12-11
ES2667243T3 (es) 2018-05-10
JP5850216B2 (ja) 2016-02-03
EP3093845A1 (en) 2016-11-16
EP2560165A4 (en) 2013-12-04
US20170236530A1 (en) 2017-08-17
EP3605533A1 (en) 2020-02-05
RU2550550C2 (ru) 2015-05-10
US20160140982A1 (en) 2016-05-19
US20170229139A1 (en) 2017-08-10
CN104021794A (zh) 2014-09-03
RU2012142677A (ru) 2014-04-10
TW201220302A (en) 2012-05-16
AU2011242000A1 (en) 2012-10-25
HK1175288A1 (zh) 2013-06-28
EP3093845B1 (en) 2018-03-14
ES2585807T3 (es) 2016-10-10
US10224054B2 (en) 2019-03-05
HK1200971A1 (zh) 2015-08-14
KR102015233B1 (ko) 2019-08-27
KR20170120727A (ko) 2017-10-31
BR112012025570A2 (pt) 2017-03-28
US20190180768A1 (en) 2019-06-13
US10381018B2 (en) 2019-08-13
TR201808257T4 (tr) 2018-07-23
EP3330965A1 (en) 2018-06-06
TWI484484B (zh) 2015-05-11
CA2794890C (en) 2017-09-19
US9679580B2 (en) 2017-06-13
US9406312B2 (en) 2016-08-02
KR101916619B1 (ko) 2018-11-07
CA2794890A1 (en) 2011-10-20
CN104021794B (zh) 2019-11-26
EP3330965B1 (en) 2019-11-06
US10297270B2 (en) 2019-05-21
EP3605533B1 (en) 2022-12-14
US10546594B2 (en) 2020-01-28
BR112012025570B1 (pt) 2020-11-17
WO2011129303A1 (ja) 2011-10-20
EP2560165B1 (en) 2016-07-13
US20130028427A1 (en) 2013-01-31
CN102834864A (zh) 2012-12-19
JP2012168494A (ja) 2012-09-06
ES2939770T3 (es) 2023-04-26
KR20180018852A (ko) 2018-02-21
EP2560165A1 (en) 2013-02-20
ES2761023T3 (es) 2020-05-18
US20180330746A1 (en) 2018-11-15
KR20130042473A (ko) 2013-04-26
KR101830996B1 (ko) 2018-02-21

Similar Documents

Publication Publication Date Title
CN102834864B (zh) 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法
CN102822891B (zh) 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序
CN102859593B (zh) 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法
KR101835910B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 컴퓨터 판독가능한 기록 매체
KR20120082414A (ko) 주파수 대역 확대 장치 및 방법, 부호화 장치 및 방법, 복호 장치 및 방법, 및 프로그램
JP6341306B2 (ja) 信号処理装置および方法、並びにプログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1175288

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1175288

Country of ref document: HK