CN103155031B - 音乐信号编码装置和方法以及音乐信号解码装置和方法 - Google Patents

音乐信号编码装置和方法以及音乐信号解码装置和方法 Download PDF

Info

Publication number
CN103155031B
CN103155031B CN201180048799.6A CN201180048799A CN103155031B CN 103155031 B CN103155031 B CN 103155031B CN 201180048799 A CN201180048799 A CN 201180048799A CN 103155031 B CN103155031 B CN 103155031B
Authority
CN
China
Prior art keywords
frequency
band
power
frequency sub
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180048799.6A
Other languages
English (en)
Other versions
CN103155031A (zh
Inventor
山本优树
知念彻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN103155031A publication Critical patent/CN103155031A/zh
Application granted granted Critical
Publication of CN103155031B publication Critical patent/CN103155031B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种通过对频带进行扩展而能够以较高的声音质量播放音乐信号的编码装置和方法、解码装置和方法以及程序。带通滤波器将输入信号分割成多个子带信号,特征量计算电路使用分割后的多个子带信号和输入信号中的至少任何一个来计算特征量,高频子带功率估计电路基于计算出的特征量来计算高频子带功率的估计值,以及高频信号生成电路基于由带通滤波器所分割的多个子带信号和有高频子带功率估计电路所计算的高频子带功率来生成高频信号分量。频带扩展装置使用由高频信号生成电路所生成的高频信号分量来对输入信号的频带进行扩展。本发明可以应用至例如频带扩展装置、编码装置、解码装置等。

Description

音乐信号编码装置和方法以及音乐信号解码装置和方法
技术领域
本发明涉及一种编码装置和方法、解码装置和方法以及程序,并且具体地,涉及一种通过对频带进行扩展而能够以高声音质量播放音乐信号的编码装置和方法、解码装置和方法以及程序。
背景技术
近年来,经由因特网等分发音乐数据的音乐分发服务已经普及。采用此音乐分发服务,通过对音乐信号进行编码而获得的编码数据被分发作为音乐数据。作为音乐信号编码技术,其中在抑制编码数据的文件容量以使下载时不费时间的同时比特率降低的编码技术变为了主流。
这样的音乐信号编码技术被粗略地划分为诸如MP3(MPEG(运动图像专家组)音频层3)(国际标准ISO/IEC 11172-3)等编码技术,以及诸如HE-AAC(高效率MPEG4 AAC)(国际标准ISO/IEC 14496-3)等编码技术。
采用由MP3所代表的编码技术,删除音乐信号中的难以由人耳所感受的等于或大于大约15kHz的高频带(在下文中称为高频)中的信号分量,并且对剩余的低频带(在下文中称为低频)中的信号分量进行编码。这样的编码技术将被称为高频消除编码技术。采用此高频消除编码技术,可以抑制编码数据的文件容量。但是,高频声音可以由人耳轻微地感受到,并且因此,在根据通过对编码数据进行解码所获得的解码之后的音乐信号生成并且输出声音时,可能存在声音质量的劣化(诸如原始声音所具有的现场感的损失、或声音可能是压抑的)。
另一方面,采用由HE-AAC所代表的编码技术,从高频信号分量中提取特征信息,并且对特征信息和低频信号分量一起进行编码。在下文中,这样的编码技术将被称为高频特征编码技术。采用此高频特征编码技术,仅将高频信号分量的特征信息编码作为与高频信号分量相关的信息,并且因此,可以在抑制声音质量的劣化的同时改进编码效率。
通过对由该高频特征编码技术编码的编码数据进行解码,对低频信号分量和特征信息进行解码,并且根据解码之后的低频信号分量和特征信息生成高频信号分量。因此,通过根据低频信号分量生成高频信号分量来对低频信号分量的频带进行扩展的技术将在下文中被称为频带扩展技术。
作为频带扩展技术的一个应用,存在对经过上述高频消除编码技术编码的编码数据进行解码之后的后处理。采用此后处理,根据解码之后的低频信号分量来生成通过编码而损失的高频信号分量,由此对低频信号分量的频带进行扩展(参见PTL 1)。注意,根据PTL 1的频带扩展技术在下文中将被称为根据PTL 1的频带扩展技术。
通过根据PTL 1的频带扩展技术,装置采用解码之后的低频信号分量作为输入信号,根据输入信号的功率谱来估计高频功率谱(在下文中,视情况称为高频频率包络线),以及根据低频信号分量生成具有高频频率包络线的高频信号分量。
图1示出解码之后的低频功率谱(用作输入信号)以及所估计的高频频率包络线的示例。
在图1中,垂直轴指示功率的对数,水平轴指示频率。
装置根据与输入信号相关的编码方法的类型、采样率、比特率等的信息(在下文中称为边信息)来确定高频信号分量的低频端的频带(在下文中称为扩展起始频带)。接下来,装置将用作低频信号分量的输入信号分割成多个子带信号。装置获得每个群组关于分割之后的多个子带信号(即,在与扩展起始频带相比较低频侧的多个子带信号(在下文中,简单地称为低频侧))中的每个子带信号的功率的时域方向的平均值(在下文中,被称为群组功率)。如图1所示,装置采用下述点作为原点:该点以低频侧的多个子带信号中的每个子带信号的群组功率的平均值作为功率,并且还以扩展起始频带的较低端的频率作为频率。装置采用通过其原点的、具有预定倾斜度的一次直线作为在与扩展起始频带相比的较高频率侧(在下文中,简单地称为高频侧)的频率包络线来执行估计。注意,用户可以对关于原点的功率方向的位置进行调整。装置根据低频侧的多个子带信号来生成在高频侧的多个子带信号中的每一个以获得高频侧的所估计的频率包络线。装置将所生成的高频侧的多个子带信号相加以获得高频信号分量,并且进一步将低频信号分量相加到其上并且将它们输出。从而,在对频带进行扩展之后的音乐信号近似于原始音乐信号。因此,可以以高声音质量的播放音乐信号。
以上提及的根据PTL 1的频带扩展技术具有下述特征:可以关于各种高频消除编码技术和具有各种比特率的编码数据,对关于对编码数据进行解码之后的音乐信号的频带进行扩展。
引用列表
专利文献
PTL 1:日本未经审查专利申请公布第2008-139844号
发明内容
技术问题
但是,采用根据PTL 1的频带扩展技术,由于所估计的高频侧的频率包络线变为具有预定的倾斜度的一次直线,即,频率包络线的形状是固定的,因此存在改进空间。
具体地,音乐信号的功率谱具有各种形状,根据音乐信号的类型,存在很多极大地偏离由根据PTL 1的频带扩展技术所估计的高频侧的频率包络线的情况。
图2示出了伴随有时域快速改变(诸如猛击鼓一次)的打击性质的音乐信号(具有打击的音乐信号)的原始功率谱的示例。
注意,图2还示出了由根据PTL 1的频带扩展技术根据在用作输入信号的、具有打击的音乐信号的低频侧的信号分量所估计的高频侧的频率包络线。
如图2所示,具有打击的音乐信号的高频侧的原始功率谱通常为平坦的。
另一方面,所估计的高频侧的频率包络线具有预定的负倾斜度,并且因此,即使当调整原点处的功率接近于原始功率谱时,随着频率增加,与原始功率谱的差异仍增加。
因此,采用根据PTL 1的频带扩展技术,根据所估计的高频侧的频率包络线,不能以高精确度再生高频侧的原始频率包络线。作为其结果,在根据对频带进行扩展之后的音乐信号来生成并且输出声音时,就可听性而言,与原始声音相比,声音的清晰度受到损失。
另外,采用以上提及的高频特征编码技术(诸如HE-AAC等),尽管高频侧的频率包络线被用作要被编码的高频信号分量的特征信息,但是要求解码侧以高精确度再生高频侧的频率包络线。
鉴于此情形而形成本发明,并且本发明通过对频带进行扩展而能够以高声音质量播放音乐信号。
问题的解决方案
根据本发明的第一方面的编码装置包括:子带分割部件,被配置成将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号;特征量计算部件,被配置成基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量;平滑部件,被配置成对所述特征量进行平滑;拟似高频子带功率计算部件,被配置成基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值;选择部件,被配置成根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个;高频编码部件,被配置成对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关;低频编码部件,被配置成对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及复用部件,被配置成对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。
平滑部件可以通过对所述输入信号的预定数目的连续帧的特征量执行加权平均来对所述特征量进行平滑。
平滑信息可以是指示用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个的信息。
编码装置可以包括参数确定部件,该参数确定部件被配置成基于所述高频子带信号来确定用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个。
以从宽带监视信号获得的所述特征量和所述高频子带功率作为解释变量和被解释变量,通过学习生成所述系数。
宽带监视信号可以是通过依照编码方法和编码算法对预定的信号进行编码并且对编码后的预定信号进行解码而获得的信号;并且其中,对于多个不同的编码方法和编码算法中的每一个,使用所述宽带监视信号通过学习生成所述系数。
根据本发明的第一方面的编码方法或程序包括下述步骤:将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号;基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量;对所述特征量进行平滑;基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值;根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个;对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关;对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。
采用本发明的第一方面,将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号;基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量;对所述特征量进行平滑;基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值;根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个;对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关;对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。
根据本发明的第二方面的解码装置包括:解复用部件,被配置成将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息;低频解码部件,被配置成对所述低频编码数据进行解码以生成低频信号;子带分割部件,被配置成将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号;特征量计算部件,被配置成基于所述低频子带信号来计算特征量;平滑部件,被配置成基于所述平滑信息对所述特征量进行平滑;以及生成部件,被配置成基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。
平滑装置部件可以通过对所述低频信号的预定数目的连续帧的特征量执行加权平均来对所述特征量进行平滑。
平滑信息可以是指示用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个的信息。
生成部件可以包括:解码高频子带功率计算部件,被配置成基于平滑后的特征量和所述系数来计算解码高频子带功率,所述解码高频子带功率是构成所述高频信号的子带功率的估计值,以及高频信号生成部件,被配置成基于所述解码高频子带功率和所述低频子带信号来生成所述高频信号。
以从宽带监视信号获得的所述特征量和与构成所述宽带监视信号的高频信号的子带相同的子带的功率作为解释变量和被解释变量,通过学习生成所述系数。
所述宽带监视信号是依照预定的编码方法和编码算法对预定的信号进行编码并且对编码后的预定信号进行解码而获得的信号;且其中,对于多个不同的编码方法和编码算法中的每一个,使用所述宽带监视信号通过学习生成所述系数。
根据本发明的第二方面的解码方法或程序包括下述步骤:将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息;对所述低频编码数据进行解码以生成低频信号;将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号;基于所述低频子带信号计算特征量;基于所述平滑信息对所述特征量进行平滑;以及基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。
采用本发明的第二方面,将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息;对所述低频编码数据进行解码以生成低频信号;将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号;基于所述低频子带信号计算特征量;基于所述平滑信息对所述特征量进行平滑;以及基于从所述系数信息所获得的所述系数、平滑后的所述特征量以及所述低频子带信号来生成高频信号。
本发明的有利效果
根据本发明的第一方面和第二方面,通过对频带进行扩展可以以较高的声音质量播放音乐信号。
附图说明
图1是示出用作输入信号的解码之后的低频功率谱和所估计的高频频率包络线的示例的图。
图2是示出伴随有时域上快速改变的具有打击的音乐信号的原始功率谱的示例的图。
图3是示出根据本发明的第一实施例的频带扩展装置的功能配置示例的框图。
图4是用于描述通过图3中的频带扩展装置进行的频带扩展处理的流程图。
图5是示出要被输入到图3中的频带扩展装置的信号的功率谱和带通滤波器在频率轴上的位置的图。
图6是示出在声音部分中的频率特征和所估计的高频功率谱的示例。
图7是示出要被输入到图3中的频带扩展装置的信号的功率谱的示例的图。
图8是示出对图7中的输入信号进行滤波之后的功率谱的示例的图。
图9是示出用于执行在图3中的频带扩展装置的高频信号生成电路处要被使用的系数的学习的系数学习装置功能配置示例的框图。
图10是用于描述由图9中的系数学习装置进行的系数学习处理的示例的流程图。
图11是示出根据本发明的第二实施例的编码装置的功能配置示例的框图。
图12是用于描述由图11中的编码装置进行的编码处理的示例的流程图。
图13是示出根据本发明的第二实施例的解码装置的功能配置示例的框图。
图14是用于描述由图13中的解码装置进行的解码处理的示例的流程图。
图15是示出用于执行在图11中的编码装置的高频编码电路处使用的典型的矢量和在图13中的解码装置的高频解码电路处使用的解码高频子带功率估计系数的学习的系数学习装置的功能配置示例。
图16是用于描述由图15中的系数学习装置进行的系数学习处理的示例的流程图。
图17是示出图11中的编码装置输出的代码串的示例的图。
图18是示出编码装置的功能配置示例的框图。
图19是用于描述解码处理的流程图。
图20是示出解码装置的功能配置示例的框图。
图21是用于描述解码处理的流程图。
图22是用于描述编码处理的流程图。
图23是用于描述解码处理的流程图。
图24是用于描述编码处理的流程图。
图25是用于描述编码处理的流程图。
图26是用于描述编码处理的流程图。
图27是用于描述编码处理的流程图。
图28是示出系数学习处理的配置示例的图。
图29是用于描述系数学习处理的流程图。
图30是示出编码装置的功能配置示例的框图。
图31是用于描述解码处理的流程图。
图32是示出解码装置的功能配置示例的框图。
图33是用于描述解码处理的流程图。
图34是示出使用程序执行本发明所应用至的处理的计算机硬件的配置示例的框图。
具体实施方式
在下文中,将参照附图描述本发明的实施例。注意,将按照以下顺序进行描述。
1.第一实施例(将本发明应用至频带扩展装置的情况)
2.第二实施例(将本发明应用至编码装置和解码装置的情况)
3.第三实施例(高频编码数据中包括系数指标的情况)
4.第四实施例(高频编码数据中包括系数指标和拟似高频子带功率差的情况)
5.第五实施例(使用评估值来选择系数指标的情况)
6.第六实施例(共享部分系数的情况)
7.第七实施例(使特征量受到平滑处理的情况)
<1.第一实施例>
采用第一实施例,通过对使用高频消除编码技术获得的编码数据进行解码而获得的解码之后的低频信号分量受到处理以扩展频带(在下文中称为频带扩展技术)。
[频带扩展装置的功能配置示例]
图3示出了应用了本发明的频带扩展装置的功能配置示例。
频带扩展装置10采用解码之后的低频信号分量作为输入信号,并且使其输入信号受到频带扩展处理,以及输出作为频带扩展处理的结果而获得的、频带扩展处理之后的信号作为输出信号。
频带扩展装置10由下述组件构成:低通滤波器11、延时电路12、带通滤波器13、特征量计算单元14、高频子带功率估计电路15、高频信号生成电路15、高频信号生成电路16、高通滤波器17以及信号加法器18。
低通滤波器11以预定的截止频率对输入信号执行滤波,并且将为低频的信号分量的低频信号分量提供至延时电路12作为滤波之后的信号。
为了对将来自低通滤波器11的低频信号分量与稍后描述的高频信号分量相加的时间进行同步,延时电路12以固定的延时时间对低频信号分量进行延时以提供至信号加法器18。
带通滤波器13由各自具有不同通频带的带通滤波器13-1至13-N构成。带通滤波器13-i(1≤i≤N)使输入信号的预定的通频带信号通过,并且将该信号作为多个子带信号中的一个提供至特征量计算电路14和高频信号生成电路16。
特征量计算电路14使用输入信号或来自带通滤波器13的多个子带信号中的至少一个来计算单个或多个特征量以提供至高频子带功率估计电路15。在此,特征量是代表作为输入信号的信号的特征的信息。
高频子带功率估计电路15基于来自特征量计算电路14的单个或多个特征量来对每个高频子带计算作为高频子带信号的功率的高频子带功率的估计值,并且将这些估计值提供至高频信号生成电路16。
高频信号生成电路16基于来自带通滤波器13的多个子带信号和来自高频子带功率估计电路15的多个高频子带功率估计值,生成高频信号分量以提供至高通滤波器17。
高通滤波器17采用与低通滤波器11处的截止频率对应的截止频率使来自高频信号生成电路16的高频信号分量受到滤波以提供至信号加法器18。
信号加法器18将来自延时电路12的低频信号分量和来自高通滤波器17的高频信号分量相加,并且将其作为输出信号输出。
注意,采用图3的配置,为了获得子带信号而应用了带通滤波器13,但是不限于此,并且例如可以应用如PTL 1中所描述的频带分割滤波器。
另外,类似地,采用图3的配置,为了使子带信号同步而应用了信号加法器18,但是不限于此,可以应用如PTL 1中所描述的频带同步滤波器。
[频带扩展装置的频带扩展处理]
接下来,将参照图4的流程图描述由图3中的频带扩展装置进行的频带扩展处理。
在步骤S1,低通滤波器11采用预定的截止频率使输入信号受到滤波处理,并且将作为滤波之后的信号的低频信号分量提供至延时电路12。
低通滤波器11可以将任意频率设置为截止频率,但是以本实施例,获取预定的频带作为下文描述的扩展起始频带,并且对应于其扩展起始频带的较低端频率来设置截止频率。因此,低通滤波器11将作为与扩展起始频带相比较低频率的信号分量的低频信号分量提供至延时电路12作为滤波之后的信号。
另外,低通滤波器11还可以根据对输入信号的高频消除编码技术和编码参数(诸如比特率等)将最优频率设置为截止频率。作为编码参数,例如可以使用由根据PTL 1的频带扩展技术所使用的边信息。
在步骤S2中,延时电路12以预定的延时时间对来自低通滤波器11的低频信号分量进行延时,并且将其提供至加法器18。
在步骤S3中,带通滤波器13(带通滤波器13-1至13-N)将输入信号分割成多个子带信号,并且将分割之后的多个子带信号中的每一个提供至特征量计算电路14和高频信号生成电路16。注意,关于由带通滤波器13进行的输入信号分割处理,下文将对其细节进行描述。
在步骤S4中,特征量计算电路14使用输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算单个或多个特征量以提供至高频子带功率估计电路15。注意,关于由特征量计算电路14进行的特征量计算处理,下文将对其细节进行描述。
在步骤S5中,高频子带功率估计电路15基于来自特征量计算电路14的单个或多个特征量来计算多个高频子带功率估计值,并且将这些估计值提供至高频信号生成电路16。注意,关于由高频子带功率估计电路15进行的用于计算高频子带功率估计值的处理,下文将对其细节进行描述。
在步骤S6中,高频信号生成电路16基于来自带通滤波器13的多个子带信号和来自高频子带功率估计电路15的多个高频子带功率估计值来生成高频信号分量,并且将其提供至高通滤波器17。在此所提及的高频信号分量是与扩展起始频带相比较高频率的信号分量。注意,关于由高频信号生成电路16进行的高频信号分量生成处理,下文将对其细节进行描述。
在步骤S7中,高通滤波器17使来自高频信号生成电路16的高频信号分量受到滤波,由此去除高频信号分量中所包括的噪声(诸如低频的混叠分量),并且将其高频信号分量提供至信号加法器18。
在步骤S8中,信号加法器18将来自延时电路12的低频信号分量和来自高通滤波器17的高频信号分量相加以将其作为输出信号提供。
根据以上提及的处理,可以对于解码之后的低频信号分量进行频带扩展。
接下来,将描述在图4的流程图中的步骤S3至步骤S6中的每个处理的细节。
[由带通滤波器进行的处理的细节]
首先,将描述图4的流程图的步骤S3中由带通滤波器进行的处理的细节。
注意,出于描述的方便,在下文中将带通滤波器13的数目N作为N=4。
例如,将通过将输入信号的Nyquist频率相等地分割为16个而获得的16个子带中的一个作为扩展起始频带,将16个子带中频率低于扩展起始频带的4个子带分别作为带通滤波器13-1至13-4的通频带。
图5分别示出带通滤波器13-1至13-4的通频带在频率轴上的位置。
如图5所示,如果说其频带(子带)低于扩展起始频带,则从高频起,第一子带的指标为sb,第二子带的指标为sb-1,以及第I子带的指标是sb-(I-1),带通滤波器13-1至13-4分别地将具有比扩展起始频带低的频率、其指标为sb至sb-3的子带指定为通频带。
注意,采用本实施例,带通滤波器13-1至13-4的通频带分别是通过将输入信号的Nyquist频率相等地分割为16个而获得的16个子带中的预定的4个子带,但是不限于此,并且可以分别是通过将输入信号的Nyquist频率相等地分割为256个而获得的256个子带中的预定的4个子带。另外,带通滤波器13-1至13-4的带宽可以不同。
[由特征量计算电路进行的处理的细节]
接下来,将进行关于在图4的流程图的步骤S4中由特征量计算电路14进行的处理的细节的描述。
特征量计算电路14使用来自带通滤波器13的多个子带信号和输入信号中的至少任意一个,计算要用于高频子带功率估计电路15的单个或多个特征量。
更具体地,特征量计算电路14根据来自带通滤波器13的4个子带信号,计算用于每个子带的子带信号功率(子带功率(在下文中还称为低频子带功率))作为特征量以提供至高频子带功率估计电路15。
具体地,特征量计算电路14使用下述表达式(1)根据由带通滤波器13所提供的4个子带信号x(ib,n)来获得在某一预定时间帧J中的低频子带功率power(ib,J)。在此,ib代表子带指标,并且n代表离散的时间指标。现在,假设在一个帧中的样本数目为FSIZE,并且用分贝来代表功率。
[数学表达式1]
power ( ib , J ) = 10 log 10 { ( &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 &times; ( ib , n ) 2 ) / FSIZE } ( sb - 3 &le; ib &le; sb ) . . . ( 1 )
以此方式,将由特征量计算电路14所获得的低频子带功率power(ib,J)作为特征量提供至高频子带功率估计电路15。
[由高频子带功率估计电路进行的处理的细节]
接下来,将进行关于在图4的流程图的步骤S5中由高频子带功率估计电路15进行的处理的细节的描述。
高频子带功率估计电路15基于从特征量计算电路14所提供的4个子带功率来计算子指标为sb+1的子带(扩展起始频带)及之后的子带的要扩展的频带(频率扩展频带)的子带功率(高频子带功率)估计值。
具体地,如果假定频率扩展频带的最高频率子带的指标为eb,则高频子带功率估计电路15关于其指标为sb+1至eb的子带来估计(eb-sb)个子带功率。
例如使用从特征量电路14所提供的4个子带功率power(ib,J)通过下述表达式(2),表示在频率扩展频带中指标为ib的估计值子带功率powerest(ib,J)。
[数学表达式2]
power est ( ib , J ) ( &Sigma; kb = sb - 3 sb { A ib ( kb ) power ( kb , J ) } ) + B ib ( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 2 )
在此,在表达式(2)中,对于每个子带ib,系数Aib(kb)和Bib是具有不同值的系数。假定系数Aib(kb)和Bib是被适当地设置以获得用于各种输入信号的合适值的系数。另外,根据子带sb的改变,系数Aib(kb)和Bib同样地改变至最优值。注意,下文将描述系数Aib(kb)和Bib的推导。
在表达式(2)中,尽管使用来自带通滤波器13的多个子带信号的各个功率通过一次线性耦合来计算高频子带功率的估计值,但是不限于此,并且可以使用例如在时间帧J之前和之后的若干个帧的多个低频子带功率的线性耦合来进行计算,或可以使用非线性函数进行计算。
以此方式,由高频子带功率估计电路15计算出的高频子带功率估计值被提供至高频信号生成电路16。
[由高频信号生成电路进行的处理的细节]
接下来,将进行关于在图4的流程图的步骤S6中由高频信号生成电路16进行的处理的细节的描述。
高频信号生成电路16根据从带通滤波器13所提供的多个子带信号、基于以上提及的表达式(1)来计算每个子带的低频子带功率power(ib,J)。高频信号生成电路16使用计算出的多个低频子带功率power(ib,J)和由高频子带功率估计电路15基于以上提及的表达式(2)计算出的高频子带估计值powerest(ib,J)、通过下述表达式(3)获得增益量G(ib,J)。
[数学表达式3]
G ( ib , J ) = 10 { ( power est ( ib , J ) - power ( sb map ( ib ) , J ) ) / 20 } ( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 3 )
在此,在表达式(3)中,如果子带ib被取作映射目的子带,则sbmap(ib)表示映射源子带,并且sbmap(ib)由下述表达式(4)所表示。
[数学表达式4]
sb map ( ib ) = ib - 4 INT ( ib - sb - 1 4 + 1 ) ( sb + 1 &le; ib &le; eb ) . . . ( 4 )
注意,在表达式(4)中,INT(a)是用于截去值a的小数点之后的部分的函数。
接下来,高频信号生成电路16使用下述表达式(5)通过将带通滤波器13的输出乘以通过表达式(3)获得的增益量G(ib,J)来计算增益调整之后的子带信号x2(ib,n)。
[数学表达式5]
x2(ib,n)=G(ib,J)x(sbmap(ib),n)
(J*FSIZE≤n≤(J+1)FSIZE-1,sb+1≤ib≤eb)
                                           ···(5)
此外,高频信号生成电路16通过执行从对应于指标为sb-3的子带的较低端频率的频率到对应于指标为sb的子带的较高端频率的频率的余弦调制、根据增益调整之后的x2(ib,n)来计算余弦变换的增益调整之后的子带信号x3(ib,n)。
[数学表达式6]
x 3 ( ib , n ) = x 2 ( ib , n ) * 2 cos ( n ) * { 4 ( ib + 1 ) &pi; / 32 } ( sb + 1 &le; ib &le; eb ) . . . ( 6 )
注意,在表达式(6)中,π代表圆周率。此表达式(6)意味着在增益调整之后的子带信号x2(ib,n)各自向高频侧的频率变动4个频带的值。
高频信号生成电路16使用下述表达式(7)根据增益调整之后变动至高频侧的子带信号x3(ib,n)来计算高频信号分量xhigh(n)。
[数学表达式7]
x high ( n ) = &Sigma; ib = sb + 1 eb x 3 ( ib , n ) . . . ( 7 )
以此方式,根据高频信号生成电路16,基于4个低频子带功率和高频子带功率来生成高频信号分量并且将其提供至高通滤波器17,其中,4个低频子带功率是基于来自带通滤波器13的4个子带信号而计算出的,高频子带信号是来自高频子带功率估计带电路15的估计值。
根据以上提及的处理,对于对通过高频消除编码技术而获得的编码数据进行解码之后所获得的输入信号,采取根据多个子带信号而计算出的低频子带功率作为特征量,并且基于这些特征量和适当设置的系数,计算高频子带功率估计值,以及以自适应的方式根据低频子带功率和高频子带功率估计值生成高频信号分量,以及因此,可以以高精确度估计频率扩展频带中的子带功率,并且可以以较高的声音质量播放音乐信号。
尽管目前为止关于其中特征量计算电路14仅计算根据多个子带信号计算出的低频子带功率作为特征量的示例进行了描述,但是在此情况下,能够根据输入信号的类型以高精确度对在频率扩展频带中的子带功率进行估计。
因此,特征量计算电路14还对与如何输出频率扩展频带中的声音功率紧密相关的特征量进行计算,由此能够以较高精确度执行在高频子带功率估计电路15处的频率扩展频带中的子带功率的估计。
[由特征量计算电路计算出的特征量的另一示例]
图6示出了声音部分的频率特征和高频功率谱,其中,声音部分是在某个输入信号中声音占据大多数的部分,并且高频功率谱是通过仅计算低频子带信号作为特征量来估计高频子带功率而获得的。
如图6所示,通过声音部分的频率特征,所估计出的高频功率谱经常位于原始信号的高频功率谱之上。人耳容易感受到关于人歌唱声音的不自然感,并且因此,在声音部分中需要以尤其高的精确度执行高频子带功率的估计。
另外,如图6所示,关于声音部分的频率特征,从4.9kHz到11.025kHz经常存在较大的凹陷部分。
因此,在下文中,将关于下述示例进行描述:其中,应用了从频率区域中的4.9kHz至112.025kHz的凹陷程度作为要用于声音部分的高频子带功率的估计的特征量。现在,在下文中,指示该凹陷程度的特征量将被称为倾角(dip)。
在下文中,将描述在时间帧J中的倾角dip(J)的计算示例。
首先,对于输入信号,使在包括时间帧J的之前和之后的若干帧中所包括的2048个样本部分中的信号受到2048点FFT(快速傅里叶变换)以计算频率轴上的系数。使所计算的系数的绝对值受到db变换以获得功率谱。
图7示出了因此而获得的功率谱的示例。在此,为了去除功率谱的细微分量,例如执行滤波处理以去除1.3kHz或更小的分量。根据同态滤波处理,采取功率谱的每个维度被取作时间序列,并且被经受低通滤波器以执行滤波处理,借此可以对光谱峰的细微分量进行平滑。
图8示出了滤波之后的输入信号的功率谱的示例。通过图8所示的滤波之后的功率谱,采用等同于4.9kHz至11.025kHz的范围中所包括的功率谱的最小值与最大值之间的差作为倾角dip(J)。
以此方式,计算与频率扩展频带中的子带功率有密切相关性的特征量。注意,倾角dip(J)的计算示例不限于以上提及的技术,并且可以使用另外的技术。
接下来,将描述关于与频率扩展频带中的子带功率有密切相关性的特征量的计算的另一示例。
[由特征量计算电路所计算出的特征量的计算的又一示例]
对于某一输入信号,采用打击部分(其是包括具有打击的音乐信号的部分)的频率特征,如参照图2所描述地,高频侧的功率谱一般经常为平坦的。通过仅计算低频子带功率作为特征量的技术,在不使用代表包括打击部分的输入信号所特有的时域波动的特征量的情况下,对频率扩展频带的子带功率进行估计,并且因此,难于以高精确度对在打击部分中所观测到的通常为平坦的频率扩展频带的子带功率进行估计。
因此,在下文中,将进行关于下述示例的描述:其中,将低频子带功率的时域波动作为要用于打击部分的高频子带功率的估计的特征量。
例如,通过下述表达式(8)获得在某一时间帧J中的低频子带功率的时域波动powerd(J)。
[数学表达式8]
power d ( J ) = &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 ( x ( ib , n ) 2 ) / &Sigma; ib = sb - 3 sb &Sigma; n = ( J - 1 ) FSIZE J * FSIZE - 1 ( x ( ib , n ) 2 ) . . . ( 8 )
根据表达式(8),低频子带功率的时域波动powerd(J)代表时间帧J中的4个低频子带功率的和与时间帧J的前一帧时间帧(J-1)中的4个低频子带功率的和之间的比例,并且此值越大则帧间功率的时域波动越大,即,可以设想在时间帧J中所包括的信号具有强的打击性质。
另外,当将图1所示的统计学平均的功率谱与图2所示的打击部分(具有打击的音乐信号)的功率谱进行比较时,打击部分的功率谱朝着中间频率处的右侧增加。通过打击部分,经常地展现这样的频率特征。
因此,在下文中,将关于下述示例进行描述:其中,采用中间频率中的倾斜度作为要用于打击部分的高频子带功率的估计的特征量。
例如,通过下述表达式(9)获得在某一时间帧J中的中间频率的倾斜度slope(J)。
[数学表达式9]
slope ( J ) = &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 { W ( ib ) * x ( ib , n ) 2 ) } / &Sigma; ib = sb - 3 sb &Sigma; n = J * FSIZE ( J + 1 ) FSIZE - 1 ( x ( ib , n ) 2 ) . . . ( 9 )
在表达式(9)中,系数w(ib)是调整后的加权系数以对高频带功率进行加权。根据表达式(9),slope(J)代表被加权至高频的4个低频子带功率的和与4个低频子带功率的和之间的比例。例如,如果4个低频子带功率变为用于中间频率子带的功率,则当中间频率功率谱沿右上方向上升时,slope(J)具有较大的值,并且当中间频率功率谱沿右下方向下降时,slope(J)具有较小的值。
另外,中间频率的倾斜度经常在打击部分之前和之后大幅度地波动,并且因此,可以采用由下述表达式(10)所代表的倾斜度的时域波动sloped(J)作为要用于打击部分的高频子带功率的估计的特征量。
[数学表达式10]
sloped(J)=slope(J)/slope(J-1)
(J*FSIZE≤n≤(J+1)FSIZE-1)
                                               ···(10)
另外,类似地,可以采用由下述表达式(11)所表示的上述的dip(J)的时域波动dipd(J)作为要用于打击部分的高频子带功率的估计的特征量。
[数学表达式11]
dipd(J)=dip(J)-dip(J-1)
(J*FSIZE≤n≤(J+1)FSIZE-1)
                                                ···(11)
根据以上提及的技术,计算与频率扩展频带的子带功率有密切相关性的特征量,并且因此,可以以高精确度在高频子带功率估计单元15处执行频率扩展频带的子带功率的估计。
尽管目前为止进行了关于计算与频率扩展频带的子带功率有密切相关性的特征量的示例的描述,但是在下文中将进行关于使用这样计算出的特征量来估计高频子带功率的示例的描述。
[由高频子带功率估计电路进行的处理的细节]
现在,将进行关于如下示例的描述:其中,使用参照图8所描述的倾角和低频子带功率作为特征量来估计高频子带功率。
具体地,在图4的流程图的步骤S4中,特征量计算电路14根据来自带通滤波器13的用于每个子带的4个子带信号,计算低频子带功率和倾角作为特征量,以提供至高频子带功率估计电路15。
在步骤S5中,高频子带功率估计电路15基于来自特征量计算电路14的4个低频子带功率和倾角来计算用于高频子带功率的估计值。
在此,在子带功率与倾角之间,要获得的值的范围(数值范围)不同,并且因此,例如高频带功率估计电路15对于倾角值执行下述转换。
高频子带功率估计电路15关于大数量的输入信号计算4个低频子带功率的最高频子带功率和倾角的值,并且预先获得关于其每个的平均值和标准差。现在,假定子带功率的平均值是powerave,子带功率的标准差是powerstd,倾角的平均值是dipave以及倾角的标准差是dipstd
高频子带功率估计电路15使用这些值按照下述表达式(12)对倾角的值dip(J)进行转换以获得转换之后的倾角dips(J)。
[数学表达式12]
dip s ( J ) = dip ( J ) - dip ave dip std powe r std + power ave . . . ( 12 )
根据执行的表达式(12)所表示的转换,高频子带功率估计电路15可以将倾角的值dip(J)转换为统计学上等同于低频子带功率的平均值和离差的变量(倾角)dips(J),并且因此,通常可以将倾角所具有的值的平均值设置为等同于子带功率所具有的值的范围。
采用频率扩展频带,例如使用来自特征量计算电路14的4个低频子带功率power(id,J)与表达式(12)所表示的倾角dips(J)之间的线性耦合、通过下述表达式(13)表示指标为ib的子带功率的估计值powerest(ib,J)。
[数学表达式13]
power est ( ib , J ) = ( &Sigma; kb = sb - 3 sb { C ib ( kb ) power ( kb , J ) } ) + D ib dip s ( J ) + E ib ( J * FSIZE &le; n &le; ( J + 1 ) FSIZE - 1 , sb + 1 &le; ib &le; eb ) . . . ( 13 )
在此,在表达式(13)中,系数Cib(kb)、Dib以及Eib是对于每个子带id具有不同值的系数。假定系数Cib(kb)、Dib以及Eib是被合适地设置以获得用于各种输入信号的合适值的系数。另外,根据子带sb的改变,系数Cib(kb)、Dib以及Eib也改变至最优值。注意,下文将描述系数Cib(kb)、Dib以及Eib的推导。
在表达式(13)中,尽管通过一次线性耦合计算高频子带功率的估计值,但是不限于此,并且例如,可以使用时间帧J之前和之后的若干个帧的多个特征量的线性耦合进行计算,或可以使用非线性函数进行计算。
根据以上提及的处理,声音部分所特有的倾角的值被用于高频子带功率的估计,由此与仅采取低频子带功率作为特征量的情况相比,改进了在声音部分的高频子带功率的估计的精确度,并且减少了人耳容易感受到的不自然感(该不自然感由使用仅采取低频子带功率作为特征量的技术而被估计为大于原始信号的高频功率谱的高频子带功率谱所导致),并且因此,可以以较高声音质量播放音乐信号。
顺便提及,关于通过以上提及的技术而被计算为特征量的倾角(在声音部分的频率特征中的凹陷程度),如果子带的分割数目为16,则频率的分辨率较低,并且因此,不可以仅用低频子带功率来表示此凹陷程度。
因此,增加子带分割的数目(例如,相当于16倍的256个分割),增加由带通滤波器13进行的带分割的数目(例如,相当于16倍的64个),以及增加要由特征量计算电路14所计算的低频子带功率的数目(例如,相当于16倍的64个),由此改进频率分辨率,并且能够单独用低频子带功率来表示凹陷程度。
因此,想到可以单独使用低频子带功率,以与使用上述提及的倾角作为特征量的高频子带功率进行的估计具有基本上相同的精确度来对高频子带功率进行估计。
但是,通过增加子带分割的数目、频带分割的数目以及低频子带功率的数目而增加了计算量。如果考虑到任何技术可以以相似的精确度对高频子带功率进行估计,则可以想到使用倾角作为特征量、在不增加子带分割的数目的情况下对高频子带功率进行估计的技术在计算量方面是有效的。
尽管到目前为止进行了关于使用倾角和低频子带功率来估计高频子带功率的技术的说明,但是用于高频子带功率的估计的特征量不限于此组合,可以采用以上描述的一个或更多个特征量(低频子带功率、倾角、低频子带功率的时域波动、倾角、倾斜度的时域波动以及倾角的时域波动)。因此,采用高频子带功率的估计可以进一步改进精确度。
另外,如上所述,采用输入信号,使用难于进行高频子带功率估计的部分所特有的参数作为要用于高频子带功率的估计的特征量,由此能够改善该部分的估计精确度。例如,低频子带功率的时域波动、倾斜度、倾角的时域波动以及倾角的时域波动是打击部分所特有的参数,并且使用这些参数作为特征量,由此能够改善打击部分的高频子带功率的估计精确度。
注意,如果还使用除低频子带功率和倾角之外的特征量,即,低频子带功率的时域波动、倾斜度、倾斜度的时域波动以及倾角的时域波动来执行高频子带功率的估计,则可以通过与上述提及的技术相同的技术来对高频子带功率进行估计。
注意,在此所提及的特征量计算技术不限于上述提及的技术,并且可以使用另外的技术。
[如何获取系数系数Cib(kb)、Dib以及Eib]
接下来,将进行关于如何获取以上提及的表达式(13)中的系数Cib(kb)、Dib以及Eib的描述。
作为获得系数Cib(kb)、Dib以及Eib的方法,为了获得当对频率扩展频带的子带功率进行估计时用于各种输入信号的系数Cib(kb)、Dib以及Eib的合适系数,将采用下述方法:其中,使用带宽监视信号(在下文中,被称为带宽监视信号)预先执行学习,并且基于其学习结果来确定系数Cib(kb)、Dib以及Eib
在执行系数Cib(kb)、Dib以及Eib的学习时,将应用下述系数学习装置:其中,具有与参照图5所描述的带通滤波器13-1至13-14相同的通频带的带通滤波器被布置在高于扩展起始频带的频率。当输入宽带监视信号时,系数学习装置执行学习。
[系数学习装置的功能配置示例]
图9是示出了执行系数Cib(kb)、Dib以及Eib的学习的系数学习装置的功能配置示例。
关于比要输入到图9中的系数学习装置20的扩展起始频带更低频率的信号分量,期望的是要输入到图3中的频带扩展装置10的频带限制输入信号是通过与编码时所经受的编码方法相同的编码方法编码的信号。
系数学习装置20由下述组件构成:带通滤波器21、高频子带功率计算电路22、特征量计算电路23以及系数估计电路24。
带通滤波器21由各自具有不同通频带的带通滤波器21-1至21-(K+N)构成。带通滤波器21-i(1≤i≤k+N)使输入信号中的预定通频带信号通过,并且将其作为多个子带信号中的一个提供至高频子带功率计算电路22或特征量计算电路23。注意,在带通滤波器21-1至21-(K+N)中,带通滤波器21-1至21-K使得比扩展起始频带更高频率的信号通过。
高频子带功率计算电路22对于来自子带通滤波器21的多个高频子带信号计算各个固定时间帧各个子带的高频子带功率以提供至系数估计电路24。
特征量计算电路23对于与固定时间帧(在固定时间帧中高频子带功率计算电路22计算出了高频子带功率)相同的每个帧,计算与由图3中的频带扩展装置10的特征量计算电路14所计算出的特征量相同的特征量。即,特征量计算电路23使用宽带监视信号和来自带通滤波器21的多个信号中的至少一个来计算一个或更多个特征量以提供至系数估计电路24。
系数估计电路24基于用于每个固定时间帧的、来自高频子带功率计算电路22的高频子带功率和来自特征量计算电路23的特征量来估计在图3的频带扩展装置10的高频子带功率估计电路15处使用的系数(系数数据)。
[系数学习装置的系数学习处理]
接下来,将参照图10的流程图描述由图9中的系数学习装置进行的系数学习处理。
在步骤S11中,带通滤波器21将输入信号(宽带监视信号)分割成(K+N)个子带信号。带通滤波器21-1至21-K将比扩展起始频带更高频率的多个子带信号提供至高频子带功率计算电路22。另外,带通滤波器21-(K+1)至21-(K+N)将比扩展起始带更低频率的多个子带信号提供至特征量计算电路23。
在步骤S12中,高频子带功率电路22为来自带通滤波器21(带通滤波器21-1至21-K)的多个高频子带信号的计算每个子带在每个固定时间帧的高频子带功率power(ib,J)。高频子带功率power(ib,J)是通过以上提及的表达式(1)而获得的。高频子带功率计算电路22将所计算出的高频子带功率提供至系数估计电路24。
在步骤S13中,特征量计算电路23对于与固定时间帧(在固定时间帧中高频子带功率电路22计算出了高频子带功率)相同的每个时间帧计算特征量。
采用图3中的频带扩展装置10的特征量计算电路14,假定计算4个低频子带功率和倾角作为特征量,并且类似地,还采用系数学习装置20的特征量计算电路23,将进行假定计算了4个低频子带功率和倾角的描述。
具体地,特征量计算电路23使用来自带通滤波器21(带通滤波器21-(K+1)至21-(K+1))的、具有与要输入到频带扩展装置10的特征量计算电路14的4个子带信号相同的频带的4个子带信号来计算4个低频子带功率。另外,特征量计算电路23计算来自宽带监视信号的倾角,并且基于以上提及的表达式(12)计算倾角dips(J)。特征量计算电路23将所计算出的4个低频子带功率和倾角dips(J)作为特征量提供至系数估计电路24。
在步骤S14中,系数估计电路24基于在该时间帧从高频子带功率计算电路22和特征量计算电路23所提供的(eb-sb)个高频子带功率和特征量(例如,4个低频子带功率和倾角dips(J))之间的大量组合,执行系数Cib(kb)、Dib以及Eib的估计。例如,关于某一高频子带,系数估计电路24采用5个特征量(4个低频子带功率和倾角dips(J))作为解释变量,并且采用高频子带功率power(ib,J)作为被解释变量以使用最小二乘法来执行回归分析,由此确定表达式(13)中的系数Cib(kb)、Dib以及Eib
注意,用于系数Cib(kb)、Dib以及Eib的估计技术不限于以上提及的技术,并且可以使用一般的各种参数识别方法。
根据以上提及的处理,预先使用宽带监视信号来执行要用于高频子带功率的估计的系数的学习,并且因此,可以对于要被输入到频带扩展装置10的各种输入信号获得合适的输出结果,以及结果,可以以较高的声音质量播放音乐信号。
注意,还可以通过以上提及的系数学习方法来获得在以上提及的表达式(2)中的系数Aib(kb)和Bib
到目前为止,假定采用频带扩展装置10的高频子带功率估计电路15、承诺通过4个低频子带功率与倾角之间的线性耦合来计算每个高频子带功率的估计值,而进行了关于系数学习处理的描述。但是用于在高频子带功率估计电路15处估计高频子带功率的技术不限于以上提及的示例,并且可以通过特征量计算电路14计算除倾角之外的一个或更多个特征量(低频子带功率的时域波动、倾斜度、倾斜度的时域波动以及倾角的时域波动)来计算高频子带功率,或使用在时间帧J之前和之后的多个时间帧的多个特征量之间的线性耦合,或使用非线性函数。即,采用系数学习处理,对于系数估计电路24足以通过与关于特征量、时间帧以及函数(该函数将在由频带扩展装置10的高频子带功率估计电路15计算高频子带功率时使用)的情况相同的情况计算(学习)系数。
<2.第二实施例>
采用第二实施例,使输入信号受到在高频特征编码技术中由编码装置和解码装置进行的编码处理和解码处理。
[编码装置的功能配置示例]
图11示出了应用了本发明的编码装置的功能配置示例。
编码装置30由下述组件构成:低通滤波器21、低频编码电路32、子带分割电路33、特征量计算电路34、拟似高频子带功率计算电路35、拟似高频子带功率差计算电路、高频编码电路37、复用电路38以及低频解码电路39。
低通滤波器31以预定的截止频率使输入信号受到滤波,并且将比截止频率更低的频率信号(在下文中称为低频信号)作为滤波处理之后的信号提供至低频编码电路32、子带分割电路33以及特征量计算电路34。
低频编码电路32对来自低通滤波器31的低频信号进行编码,并且将作为其结果而获得的低频编码数据提供至复用电路38和低频解码电路39。
子带分割电路33将来自低通滤波器31的输入信号和低频信号相等地分割为具有预定带宽的多个子带信号以提供至特征量计算电路34或拟似高频子带功率差计算电路36。更具体地,子带分割电路33将以低频信号而获得的多个子带信号(在下文中称为低频子带信号)作为输入提供至特征量计算电路34。另外,对于通过作为输入的输入信号而获得的多个子带信号,子带分割电路33将比在低通滤波器31处所设置的截止频率更高频率的子带信号(在下文中称为高频子带信号)提供至拟似高频子带功率差计算电路36。
特征量计算电路34使用来自低通滤波器31的低频信号和来自子带分割电路33的低频子带信号的多个子带信号中的至少一个来计算多个特征量以提供至拟似高频子带功率计算电路35。
拟似高频子带功率计算电路35基于来自特征量计算电路34的一个或更多个特征量来生成拟似高频子带功率以提供至拟似高频子带功率差计算电路36。
拟似高频子带功率差计算电路36基于来自子带分割电路33的高频子带信号和来自拟似高频子带功率计算电路35的拟似高频子带功率来计算下文描述的拟似高频子带功率差以提供至高频编码电路37。
高频编码电路37对来自拟似高频子带功率差计算电路36的拟似高频子带功率差进行编码以将作为其结果而获得的高频编码数据提供至复用电路38。
复用电路38对来自低频编码电路32的低频编码数据和来自高频编码电路37的高频编码数据进行复用以作为输出代码串输出。
低频解码电流39对来自低频编码电路32的低频编码数据适当地解码以将作为其结果而获得的解码数据提供至子带分割电路33和特征量计算电路34。
[编码装置的编码处理]
接下来,将参照图12的流程图对由图11中的编码装置30进行的编码处理进行描述。
在步骤S111中,低频滤波器31以预定的截止频率使输入信号受到滤波处理以将用作滤波之后的信号的低频信号提供至低频编码电路32、子带分割电路33以及特征量计算电路34。
在步骤S112中,低频编码电路32对来自低通滤波器31的低频信号进行编码以将作为其结果而获得的低频编码数据提供至复用电路38。
注意,关于在步骤S112中的低频信号的编码,能够根据编码效率或所要求的电路规模选择合适的编码系统,并且本发明不依赖于此编码系统。
在步骤S113中,子带分割电路33将输入信号和低频信号分割成具有预定带宽的多个子带信号。子带分割电路33将通过低频信号而获得的低频子带信号作为输入提供至特征量计算电路34。另外,对于采用输入信号作为输入的多个子带信号,子带分割电路33将具有比在低通滤波器31处所设置的带限的频率更高的频带的高频子带信号提供至拟似高频子带功率差计算电路36。
在步骤S114中,特征量计算电路34使用来自低通滤波器31的低频信号和来自子带分割电路33的低频子带信号的多个子带信号中的至少一个来计算一个或多个特征量以提供至拟似高频子带功率计算电路35。注意,图11中的特征量计算电路34具有与图3中的特征量计算电路14基本上相同的配置和功能,并且步骤S114中的处理与图4的流程图中的步骤S4中的处理基本上相同,并且因此将省略对其的详细说明。
在步骤S115中,拟似高频子带功率计算电路35基于来自特征计算电路34的一个或多个特征量来生成拟似高频子带功率以提供至拟似高频子带功率差计算电路36。注意,图11中的拟似高频子带功率计算电路35具有与图3中的高频子带功率估计电路15基本上相同的配置和功能,并且步骤S115中的处理与图4的流程图中的步骤S5中的处理基本上相同,并且因此将省略对其的详细说明。
在步骤S116中,拟似高频子带功率差计算电路36基于来自子带分割电路33的高频子带信号和来自拟似高频子带功率计算电路35的拟似高频子带功率来计算拟似高频子带功率差以提供至高频编码电路37。
更具体地,拟似高频子带功率差计算电路36关于来自子带分割电路33的高频子带信号计算在某一固定的时间帧J中的高频子带功率power(ib,J)。现在,采用本实施例,假定使用指标ib识别了所有低频子带信号的子带和高频子带信号的子带。子带功率计算技术与第一实施例中的技术是相同的技术,即,可以应用使用表达式(1)的技术。
接下来,拟似高频子带功率差计算电路36获得在时间帧J中高频子带功率power(ib,J)与来自拟似高频子带功率计算电路35的拟似高频子带功率powerlh(ib,J)之间的差(拟似高频子带功率差)powerdiff(ib,J)。拟似高频子带功率差powerdiff(ib,J)是通过下述表达式(14)而获得的。
[数学表达式14]
powerdiff(ib,J)=power(ib,J)-powerlh(ib,J)
(J*FSIZE≤n≤(J+1)FSIZE-1,sb+1≤ib≤eb)
                                               ···(14)
在表达式(14)中,指标sb+1代表高频子带信号的最低频率子带的指标。另外,指标eb代表高频子带信号中要被编码的最高频率子带的指标。
以此方式,由拟似高频子带功率差计算电路36所计算出的拟似高频子带功率差被提供至高频编码电路37。
在步骤S117中,高频编码电路37对来自拟似高频子带功差计算电路36的拟似高频子带功率差进行编码以将作为其结果而获得的高频编码数据提供至复用电路38。
更具体地,高频编码电路37确定由来自拟似高频子带功率差计算电路36的拟似高频子带功率差转换来的矢量(在下文中称为拟似高频子带差矢量)属于预先设置的拟似高频子带功率差的特征空间中的多个聚类中的那个聚类。在此,在某一时间帧J中的拟似高频子带功率差矢量表示(eb-sb)维矢量,该(eb-sb)维矢量具有用于各个指标ib的拟似高频子带功率差powerdiff(ib,j)作为各个元素。另外,拟似高频子带功率差的特征空间也是(eb-sb)维空间。
高频编码电路37采用拟似高频子带功率差的特征空间来测量预先设置的多个聚类的各个典型矢量与拟似高频子带功率差矢量之间的距离,获得具有最短距离的聚类的指标(在下文中称为拟似高频子带功率差ID),以及将其作为高频编码数据提供至复用电路38。
在步骤S118中,复用电路38对从低频编码电路32输出的低频编码数据和从高频编码电路37输出的高频编码数据进行复用,并且输出输出代码串。
顺便提及,作为根据高频特征编码技术的编码装置,在日本未审专利申请公布第2007-17908号中公开了一种技术,其中,根据低频子带信号来生成拟似高频子带信号,并且对于每个子带将拟似高频子带信号的功率进行比较,计算用于每个子带的功率增益以将拟似高频子带的功率与高频子带信号的功率进行匹配,以及将其作为高频特征信息而包括在代码串中。
另一方面,根据以上提及的处理,作为用于估计解码时高频子带功率的信息,仅仅将拟似高频子带功率差ID包括在输出代码串中就足够了。具体地,例如,如果预先设置的聚类的数目为64,作为用于解码装置中的复原高频信号的信息,将每一个时间帧的仅6比特的信息添加至代码串就足够了,并且与日本未审专利申请公布第2007-17908号中所公开的技术相比,可以减少在代码串中所包括的信息量,以及因此,可以改进编码效率,并且结果,可以以较高的声音质量播放音乐信号。
另外,采用以上提及的处理,如果存在计算量空间,则可以将通过低频解码电路39对来自低频编码电路32的低频编码数据进行解码而获得的低频信号输入到子带分割电路33和特征量计算电路34。采用由解码装置进行的解码处理,根据从低频编码数据解码出的低频信号来计算特征量,并且基于其特征量来估计高频子带的功率。因此,同样采用编码处理,如果基于根据解码低频信号计算出的特征量而计算出的拟似高频子带功率差ID被包括在代码串中,则采用由解码装置进行的解码处理,可以以较高的精确度估计高频子带功率。因此,可以以较高的声音质量播放音乐信号。
[解码装置的功能配置示例]
接下来,将参照图13描述对应于图11中的编码装置30的解码装置的功能配置示例。
解码装置40由下述组件构成:解复用电路41、低频解码电路42、子带分割电路43、特征量计算电路44、高频解码电路45、解码高频子带功率计算电路46、解码高频信号生成电路47以及同步电路48。
解复用电路41将输入代码串解复用为高频编码数据和低频编码数据,将低频编码数据提供至低频解码电路42,以及将高频编码数据提供至高频解码电路45。
低频解码电路42对来自解复用电路41的低频编码数据执行解码。低频解码电路42将作为解码结果而获得的低频信号(在下文中称为解码低频信号)提供至子带分割电路43、特征量计算电路44以及同步电路48。
子带分割电路43将来自低频解码电路42的解码低频信号相等地分割为具有预定带宽的多个子带信号,并且将所获得的子带信号(解码低频子带信号)提供至特征量计算电路44和解码高频信号生成电路47。
特征量计算电路44使用解码低频信号和来自子带分割电路43的解码低频子带信号的多个子带信号中的至少任意一个来计算一个或多个特征量以提供至解码高频子带功率计算电路46。
高频解码电路45对来自解复用电路41的高频编码数据执行解码,并且使用作为其结果而获得的拟似高频子带功率差ID以将为每个ID(指标)而预先准备的、用于估计高频子带功率的系数(在下文中称为解码高频子带功率估计系数)提供至解码高频子带功率计算电路46。
解码高频子带功率计算电路46基于一个或多个特征量和来自高频解码电路45的解码高频子带功率估计系数来计算解码高频子带功率以提供至解码高频信号生成电路47。
解码高频信号生成电路47基于来自子带分割电路43的解码低频子带信号和来自解码高频子带功率计算电路46的解码高频子带功率来生成解码高频信号以提供至同步电路48。
同步电路48对来自低频解码电路42的解码低频信号和来自解码高频信号生成电路47的解码高频信号进行同步,并且将其作为输出信号而输出。
[解码装置的解码处理]
接下来,将参照图14的流程图描述由图13中的解码装置进行的解码处理。
在步骤S131中,解复用电路41将输入代码串解复用为高频编码数据和低频编码数据,将低频编码数据提供至低频解码电路42以及将高频编码数据提供至高频解码电路45。
在步骤S132中,低频解码电路42对来自解复用电路41的低频编码数据执行解码,并且将作为其结果而获得的解码低频信号提供至子带分割电路43、特征量计算电路44以及同步电路48。
在步骤S133中,子带分割电路43将来自低频解码电路42的解码低频信号相等地分割为具有预定带宽的多个子带信号,并且将所获得的解码低频子带信号提供至特征量计算电路44和解码高频信号生成电路47。
在步骤S134中,特征量计算电路44使用来自低频解码电路42的解码低频信号和来自子带分割电路43的解码低频子带信号的多个子带信号中的至少任意一个来计算一个或多个特征量以提供至解码高频子带功率计算电路46。注意,图13中的特征量计算电路44与图3中的特征量计算电路14具有基本上相同的配置和功能,并且在步骤S134中的处理与在图4的流程图的步骤S4中的处理基本上相同,以及因此,将省略对其的详细说明。
在步骤S135中,高频解码电路45对来自解复用电路41的高频编码数据执行解码,使用作为其结果而获得的拟似高频子带功率差ID来将为每个ID(指标)预先准备的解码高频子带功率估计系数提供至解码高频子带功率计算电路46。
在步骤S136中,解码高频子带功率计算电路46基于来自特征量计算电路44的一个或多个特征量和来自高频解码电路45的解码高频子带功率估计系数来计算解码高频子带功率以提供至解码高频信号生成电路47。注意,图13中的解码高频子带功率计算电路46与图3中的高频子带功率估计电路15具有基本上相同的配置和功能,并且步骤S136中的处理与图4中步骤S5中的处理基本上相同,以及因此,省略对其的详细说明。
在步骤S137中,解码高频信号生成电路47基于来自子带分割电路43的解码低频子带信号和来自解码高频子带功率计算电路46的解码高频子带功率来输出解码高频信号。注意,图13中的解码高频信号生成电路47与图3中的高频信号生成电路具有基本上相同的配置和功能,并且步骤S137中的处理与图4的流程图的步骤S6中的处理基本上相同,以及因此,省略对其的详细说明。
在步骤S138中,同步电路48将来自低频解码电路42的解码低频信号与来自解码高频信号生成电路47的解码高频信号进行同步,并且将其作为输出信号而输出。
根据以上提及的处理,根据编码时预先计算出的拟似高频子带功率与实际的高频子带功率之间的差的特征,在解码时使用了高频子带功率估计系数,并且因此,可以改进解码时对高频子带功率的估计精确度,以及结果,可以以较高的声音质量播放音乐信号。
另外,根据以上提及的处理,代码串中所包括的用于生成高频信号的信息仅为拟似高频子带功率差ID,并且因此,可以有效地执行解码处理。
尽管进行了关于应用了本发明的编码处理和解码处理的描述,但是在下文中,将进行关于下述技术的描述:该技术计算在图11的编码装置30的高频编码电路37处预先设置的拟似高频子带功率差的特征空间中的多个聚类中的每一个的典型矢量,以及要由图13中的解码装置40的高频解码电路45输出的解码高频子带功率估计系数。
[拟似高频子带功率差的特征空间中的多个聚类的典型矢量和对应于每个聚类的解码高频子带功率估计系数的计算技术]
作为用于获得多个聚类的典型矢量和每个聚类的解码高频子带功率估计系数的方法,需要准备系数以根据编码时要计算的拟似高频子带功率差矢量来在解码时以高精确度估计高频子带功率。因此,将应用下述技术:预先使用宽带监视信号进行学习,并且基于其学习结果而决定上述系数。
[系数学习装置的功能配置示例]
图15示出了执行多个聚类的典型矢量和每个聚类的解码高频子带功率估计系数的学习的系数学习装置的功能配置示例。
期望对于要输入到图15中的系数学习装置50的宽带监视信号,等于或小于在解码装置30的低通滤波器处所设置的截止频率的信号分量是通过使编码装置30的输入信号通过低通滤波器31、由低频编码电路32对其进行编码、以及进一步由解码装置40的低频解码电路42对其解码所获得的解码低频信号。
系数学习装置50由下述组件构成:低通滤波器51、子带分割电路52、特征量计算电路53、拟似高频子带功率计算电路54、拟似高频子带功率差计算电路55、拟似高频子带功率差聚类电路56以及系数估计电路57。
注意,图15中的系数学习装置50的低通滤波器51、子带分割电路52、特征量计算电路53以及拟似高频子带功率计算电路54分别地与图11中的低通滤波器31、子带分割电路33、特征量计算电路34以及拟似高频子带功率计算电路35具有基本上相同的配置和功能,以及因此,将省略对其的描述。
具体地,拟似高频子带功率差计算电路55与图11中的拟似高频子带功率差计算电路36具有相同的配置和功能,并且不仅将所计算的拟似高频子带功率差提供至拟似高频子带功率差聚类电路56,而且还将计算拟似高频子带功率差时计算的高频子带功率提供至系数估计电路57。
拟似高频子带功率差聚类电路56使根据来自拟似高频子带功率差计算电路55的拟似高频子带功率差而获得的拟似高频子带功率差矢量受到聚类以计算每个聚类中的典型矢量。
系数估计电路57基于来自拟似高频子带功率差计算电路55的高频子带功率和来自特征量计算电路53的一个或多个特征量,对受到由拟似高频子带功率差聚类电路56进行的聚类的每个聚类计算高频子带功率估计系数。
[系数学习装置的系数学习处理]
接下来,将参照图16的流程图来描述由系数学习装置50进行的系数学习处理。
注意,除了要输入到系数学习装置50的信号是宽带监视信号之外,图16的流程图中的步骤S151至步骤S155中的处理与图12的流程图中的步骤S111以及S113至S116相同,并且因此,将省略对其的描述。
具体地,在步骤S156中,拟似高频子带功率差聚类电路56通过根据来自拟似高频子带功率差计算电路55的拟似高频子带功率差所获得的、受到聚类(例如,聚类为64个聚类)的大量的拟似高频子带功率差矢量(许多时间帧)来计算每个聚类的典型矢量。作为聚类技术的示例,例如可以应用根据k-means方法的聚类技术。拟似高频子带功率差聚类电路56采取作为执行根据k-mean方法的聚类的结果而获得的每个聚类的重心矢量作为每个聚类的典型矢量。注意,用于聚类的技术和聚类的数目不限于以上所提及的技术和数目,并且可以使用另外的技术。
另外,拟似高频子带功率差聚类电路56采用根据在时间帧J中来自拟似高频子带功率差计算电路55的拟似高频子带功率差而获得的拟似高频子带功率差矢量来测量距离,以确定提供最短距离的典型矢量所属的聚类的指标CID(J)。现在,假定指标CID(J)采取从1至聚类数目(在此示例中为64)的整数。拟似高频子带功率差聚类电路56以此方式输出典型矢量,并且还将指标CID(J)提供至系数估计电路17。
在步骤S157中,对于相同时间帧中从拟似高频子带功率差计算电路55和特征量计算电路53所提供的(eb-sb)个高频子带功率和特征量之间的许多组合,系数估计电路57对于具有相同指标CID(J)的各个群组(属于相同聚类)执行各个聚类的解码高频子带功率估计系数计算。现在,假定由系数估计电路57来计算系数的技术与由图9中的系数学习装置20中的系数估计电路24执行的技术相同,但是并不意味着不可以使用另外的技术。
根据以上提及的处理,进行在图11的编码装置30的高频解码电路37处预先设置的拟似高频子带功率差的特征空间中的多个聚类中的每个聚类的典型矢量以及要由图13中的解码装置40的高频解码电路45输出的解码高频子带功率估计系数的学习,并且因此,可以对于要输入到编码装置30的各种输入信号和用于要输入到解码装置40的各种输入代码串获得合适的输出,以及结果,可以以较高的声音质量播放音乐信号。
此外,关于信号的解码和编码,用于在编码装置30的拟似高频子带功率计算电路35或解码装置40的解码高频子带功率计算电路46处计算高频子带功率的系数数据可以按照下述方式进行处理。具体地,假定根据输入信号的类型使用不同系数数据,并且其系数数据还可以被记录在代码串的报头中。
例如,通过使用诸如演讲或爵士乐等信号改变系数数据来实现编码效率的改进。
图17示出了由此获得的代码串。
图17中的代码串A是编码后的演讲,其中,针对演讲最优的系数数据α被记录在报头中。
另一方面,图17中的代码串B是编码后的爵士乐,针对爵士乐最优的系数数据β记录被在报头中。
可以采用如下布置:其中,通过使用相同类型的音乐信号进行学习来准备这样的多个系数数据,采用编码装置30,通过在输入信号的报头中记录的流派信息选择系数数据。替选地,可以通过执行信号波形分析而确定流派以选择系数数据。即,信号流派分析技术不限于具体的技术。
另外,如果计算时间允许,可以采用如下布置:其中,以上提及的学习装置被容纳在编码装置30中,使用信号专用的系数来执行处理,以及如图17中的代码串C所示,其系数最终被记录在报头中。
以下将描述使用本技术的优势。
关于高频子带功率的形状,在一个输入信号中存在很多类似部分。使用许多输入信号所具有的该特征来为每个输入信号单独地执行用于估计高频子带功率的系数的学习,并且因此,可以减少由于类似的高频子带功率部分的存在所引起的冗余,以及可以改进编码效率。另外,与使用多个信号来统计地学习用于估计高频子带功率的系数相比,可以以较高的精确度执行高频子带功率的估计。
另外,以此方式,可以采用如下布置:其中,对于若干帧,在编码时根据输入信号所学习的系数被一次地插入。
<3.第三实施例>
注意,尽管已经进行了对其中将拟似高频子带功率差ID作为高频编码数据从编码装置30输入至解码装置40的描述,但是可以采用用于获得解码高频子带功率估计系数的系数指标作为高频编码数据。
在这样的情况下,例如如图18所示来配置编码装置30。注意,在图18中,用相同的附图标记表示与图11的情况对应的部分,并且将省略对其的描述。
图18中的编码装置30与图11中的编码装置30的不同之处在于:未设置有低频解码电路39,但是其它部分相同。
采用图18中的编码装置30,特征量计算电路34使用从子带分割电路33提供的低频子带信号来计算低频子带功率作为特征量以提供至拟似高频子带功率计算电路35。
另外,采用拟似高频子带功率计算电路55,以相关的方式记录通过预先的回归分析所获得的多个解码高频子带能量估计系数和用于识别这些解码高频子带功率估计系数的系数指标。
具体地,预先准备用于以上提及的表达式(2)的计算的每个子带的系数Aib(kb)和系数Bib的多个集合作为多个解码高频子带功率估计系数。例如,通过回归分析使用最小二乘法以低频子带功率作为被解释变量并且以高频子带功率作为非解释变量已经获得了这些系数Aib(kb)和系数Bib。采用回归分析,使用由低频子带信号和高频子带信号构成的输入信号作为宽带监视信号。
拟似高频子带功率计算电路35使用解码高频子带功率估计系数和来自特征量计算电路34的特征量来计算在高频侧的每个子带的拟似高频子带功率以提供至拟似高频子带功率差计算电路36。
拟似高频子带功率差计算电路36将根据从子带分割电路33所提供的高频子带信号而获得的高频子带功率与来自高频子带功率计算电路35的拟似高频子带功率进行比较。
作为比较结果,对于多个解码高频子带功率估计系数,拟似高频子带功率差计算电路36将借以已经获得了近似于最高频率子带功率的拟似高频子带功率的解码高频子带功率估计系数的系数指标提供至高频编码电路37。换言之,选择了借以解码高频信号最近似于在解码时要再生的输入信号的高频信号(即,获得了真值)的解码高频子带功率估计系数的系数指标。
[解码装置的解码处理]
接下来,将参照图19中的流程图描述要由图18中的编码装置30所执行的编码处理。注意,在步骤S181至S183中的处理与在图12中步骤S111至S113中的处理相同,并且因此,将省略对其的描述。
在步骤S184中,特征量计算电路34使用来自子带分割电路33的低频子带信号来计算特征量以提供至拟似高频子带功率计算电路35。
具体地,特征量计算电路34执行以上提及的表达式(1)的计算,以关于每个子带ib(但是,sb-3≤ib≤sb)计算帧J(但是,0≤J)的低频子带功率power(ib,J)作为特征量。即,通过将构成帧J的低频子带信号中的每个样本的样本值的平方平均值(square mean value)转换为对数来计算低频子带功率power(ib,J)。
在步骤S185中,拟似高频子带功率计算电路35基于从特征量计算电路34提供的特征量计算拟似高频子带功率以将其提供至拟似高频子带功率差计算电路36。
例如,拟似高频子带功率计算电路35使用预先记录的作为解码高频子带功率估计系数的系数Aib(kb)和Bib以及低频子带功率power(kb,J)(但是,sb-3≤ib≤sb)来执行以上提及的表达式(2)的计算以计算拟似高频子带功率powerest(ib,J)。
具体地,将作为特征量而提供的在低频侧的各个子带的低频子带功率power(kb,J)乘以用于各个子带的系数Aib(kb),进一步将系数Bib相加至与系数相乘之后的低频子带功率的和,并且其被用作拟似高频子带功率powerest(ib,J)。关于高频侧的指标为sb+1至eb的每个子带计算此拟似高频子带功率。
另外,拟似高频子带功率计算电路35对于预先记录的每个解码高频子带功率估计系数执行拟似高频子带功率的计算。例如,假定预先准备了指标为1至K(但是,2≤K)的K个解码高频子带功率估计系数。在这种情况下,针对K个高频子带功率估计系数中的每个来计算每个子带的拟似高频子带功率。
在步骤S186中,拟似高频子带功率差计算电路36基于来自子带分割电路33的高频子带信号和来自拟似高频子带功率计算电路35的拟似高频子带功率来计算拟似高频子带功率差。
具体地,拟似高频子带功率差计算电路36对于来自子带分割电路33的高频子带信号执行与以上提及的表达式(1)相同的计算以计算在帧J中的高频子带功率power(ib,J)。注意,采用本实施例,假定采用指标ib来识别低频子带信号和高频子带信号的所有子带。
接下来,拟似高频子带功率差计算电路36执行与以上提及的表达式(14)相同的计算以获得在时间帧J中高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,J)之间的差。因此,关于在高频侧的指标为sb+1到eb的每个子带,对于每个解码高频子带功率估计系数,获得拟似高频子带功率powerest(ib,J)。
在步骤S187中,拟似高频子带功率差计算电路36对于每个解码高频子带功率估计系数计算下述表达式(15)以计算拟似高频子带功率差的平方和。
[数学表达式15]
E ( J , id ) = &Sigma; ib = sb + 1 eb { power diff ( ib , J , id ) } 2 . . . ( 15 )
注意,在表达式(15)中,差平方和E(J,id)表示关于系数指标为id的高频子带功率估计系数获得的帧J的拟似高频子带功率差的平方和。另外,在表达式(15)中,powerdiff(ib,J,id)表示关于系数指标为id的高频子带功率估计系数获得的指标为ib的子带的帧J的拟似高频子带功率差powerdiff(ib,J)。关于K个解码高频子带功率估计系数来计算差平方和E(J,id)。
由此所获得的差平方和E(J,id)表示根据实际高频信号所计算出的高频子带功率与使用系数指标为id的解码高频子带功率估计系数所计算出的拟似高频子带功率之间的相似程度。
具体地,差平方和E(J,id)表示拟似高频子带功率的估计值与真值的误差。因此,差平方和E(J,id)越小,则通过使用解码高频子带功率估计系数计算获得的解码高频信号越近似于实际高频信号。换言之,可以说使差平方和E(J,id)变得最小的解码高频子带功率估计系数是最适合于要在对输出代码串解码时执行的频带扩展处理的估计系数。
因此,拟似高频子带功率差计算电路36在K个差平方和E(J,id)中选择值变为最小的差平方和,并且将表示对应于该差平方和的解码高频子带功率估计系数提供至高频解码电路37。
在步骤S188中,高频编码电路37对从拟似高频子带功率差电路36所提供的系数指标进行编码,并且将作为其结果而获得的高频编码数据提供至复用电路38。
例如,在步骤S188中,对于系数指标执行熵编码。因此,可以对输出到解码装置40的高频编码数据的信息量进行压缩。注意,高频编码数据可以是任何信息,只要从该信息获得最优的解码高频子带功率估计系数,例如,该系数指标可变为高频编码数据而不发生改变。
在步骤S189中,复用电路38对从低频编码电路单元32所获得低频编码数据和从高频编码电路37所提供的高频编码数据进行复用,将作为其结果而获得的代码串输出,以及结束编码处理。
以此方式,通过对系数指标进行编码而获得的高频编码数据被作为输出代码串而连同低频编码数据一起输出,并且因此,可以在接收此输出代码串的输入的解码装置40处获得最适合于频带扩展处理的解码高频子带功率估计系数。因此,可以获得具有较高声音质量的信号。
[解码装置的功能配置的示例]
另外,例如,如图20所示对于将从图18中的编码装置30所输出的代码串作为输入代码串输入、并且对其进行解码的解码装置40进行配置。注意,在图20中,采用相同的附图标记来表示对应于图20中的情况的部件,并且将省略对其的描述。
图20中的解码装置40与图13中的解码装置40的相同之处在于解码装置40由解复用电路41至同步电路48构成,但是与图13中的解码装置40的不同之处在于来自低频解码电路42的解码低频信号不被提供至特征量计算电路44。
采用图20中的解码装置40,高频解码电路45预先记录了与图18中的拟似高频子带功率计算电路35所记录的解码高频子带估计系数相同的解码高频子带估计系数。具体地,通过回归分析而获得的用作解码高频子带功率估计系数的系数Aib(kb)和系数Bib的集合被以系数指标的形式而记录。
高频解码电路45对从解复用电路41所提供的高频编码数据进行解码,并且将作为其结果而获得的由系数指标所指示的解码高频子带功率估计系数提供至解码高频子带功率计算电路46。
[解码装置的解码处理]
接下来,将参照图21中的流程图描述由图20中的解码装置40执行的解码处理。
当从编码装置30所输出的输出代码串作为输入代码串而被提供至解码装置40时,此解码处理开始。注意,在步骤S211至S213中的处理与图14中的步骤S131至S133中的处理相同,并且因此,将省略对其的描述。
在步骤S214中,特征量计算电路44使用来自子带分割电路43的解码低频子带信号来计算特征量,并且将其提供至解码高频子带功率计算电路46。具体地,特征量计算电路44执行以上提及的表达式(1)的计算以关于在低频侧的每个子带ib计算帧J(但是,0≤J)中低频子带功率power(ib,J)作为特征量。
在步骤S215中,高频解码电路45对从解复用电路41所提供的高频编码数据执行解码,并且将作为其结果而获得的由系数指标所指示的解码高频子带功率估计系数提供至解码高频子带功率计算电路46。即,对于预先记录在高频解码电路45中的多个解码高频子带功率估计系数,输出通过解码而获得的由系数指标所表示的解码高频子带功率估计系数。
在步骤S216中,解码高频子带功率计算电路46基于从特征量计算电路44所提供的特征量和从高频解码电路45所提供的解码高频子带功率估计系数来计算解码高频子带功率,并且将其提供至解码高频信号生成电路47。
具体地,解码高频子带功率计算电路46使用用作解码高频子带功率估计系数的系数Aib(kb)和系数Bib以及用作特征量的低频子带功率power(kb,J)(但是,sb-3≤kb≤sb)来执行以上提及的表达式(2)的计算以计算解码高频子带功率。因此,获得了关于在高频侧的其指标为sb+1到eb的每个子带的解码高频子带功率。
在步骤S217中,解码高频信号生成电路47基于从子带分割电路43所提供的解码低频子带信号和从解码高频子带功率计算电路46所提供的解码高频子带功率来生成解码高频信号。
具体地,解码高频信号生成电路47使用解码低频子带信号执行以上提及的表达式(1)的计算以计算关于在低频侧的每个子带的低频子带功率。解码高频信号生成电路47使用所获得的低频子带功率和解码高频子带功率来执行以上提及的表达式(3)的计算以计算对于在高频侧的每个子带的增益量G(ib,J)。
此外,解码高频信号生成电路47使用增益量G(ib,J)和解码低频子带信号来执行以上提及的表达式(5)和表达式(6)的计算以生成关于在高频侧的每个子带的高频子带信号x3(ib,n)。
具体地,解码高频信号生成电路47根据低频子带功率与解码高频子带功率之间的比例使解码低频子带信号x(ib,n)受到幅度调制,并且进一步使作为其结果而获得的解码低频子带信号x2(ib,n)受到频率调制。因此,在低频侧的子带中的频率分量信号被转换为在高频侧的子带中的频率分量以获得高频子带信号x3(ib,n)。
以此方式,获得在每个子带中的高频子带信号的处理更详细地为以下处理。
假定在频率区域内连续地排列的4个子带被称为带阻,并且分割频带以使得一个带阻(在下文中,特定地称为低频带阻)由在低频侧的指标为sb-3至sb的4个子带构成。此时,例如,由在高频侧的指标为sb+1至sb+4的子带构成的频带被用作一个带阻。现在,在下文中,高频侧,即由指标大于等于sb+1的子带所构成的带阻被特定地称为高频带阻。
现在,假定关注构成高频带阻的一个子带(在下文中,被称为兴趣子带)以生成该子带的高频子带信号。首先,解码高频信号生成电路47识别与高频带阻中的兴趣子带的位置具有相同的位置关系的低频带阻的子带。
例如,如果兴趣子带的指标是sb+1,则兴趣子带是具有高频带阻的最低频率的子带,并且因此,与兴趣子带具有相同的位置关系的低频带阻的子带是指标为sb-3的子带。
以此方式,如果低频带阻的子带与所识别的兴趣子带具有相同的位置关系,则兴趣子带的高频子带信号是使用该子带的低频子带功率、解码低频子带信号和该兴趣子带的解码高频子带信号生成的。
具体地,解码高频子带功率和低频子带功率被代入表达式(3),并且计算根据这些功率的配给量的增益量。将解码低频子带信号乘以所计算出的增益量,并且另外,乘以了增益量的解码低频子带信号受到通过表达式(6)的计算的频率调制,以及被当作兴趣子带的高频子带信号。
根据以上提及的处理,获得在高频侧的每个子带的高频子带信号。响应于此,解码高频信号生成电路47进一步执行以上提及的表达式(7)的计算以获得所获得的高频子带信号的总和并且生成解码高频信号。解码高频信号生成电路47将所获得的解码高频信号提供至合成电路48,并且处理从步骤S217继续至步骤S218。
在步骤S218中,合成电路48将来自低频解码电路42的解码低频信号和来自解码高频信号生成电路47的解码高频信号进行合成以将此作为输出信号而输出。之后,结束解码处理。
如上所述,根据解码装置40,根据通过对输入代码串进行解复用而获得的高频编码数据获得系数指标,并且使用由其系数指标所指示的解码高频子带功率估计系数来计算解码高频子带功率,以及因此,可以改进高频子带功率的估计精确度。因此,可以以较高的声音质量播放音乐信号。
<4.第四实施例>
[编码装置的编码处理]
另外,尽管目前为止关于仅系数指标被包括在高频编码数据中作为示例进行了描述,但是其它信息也可以被包括在高频编码数据中。
例如,如果采用系数指标被包括在高频编码数据中的布置,则在解码装置40侧,可知道解码高频子带功率估计系数,借此,获得最近似于实际高频信号的高频子带功率的解码高频子带功率。
但是,实际高频子带功率(真值)与在解码装置40侧所获得的解码高频子带功率(估计值)之间产生了差别,该差别通常与通过拟似高频子带功率差计算电路36所计算出的拟似高频子带功率差powerdiff(ib,J)是相同的值。
因此,如果采用不仅系数指标而且子带之间的拟似高频差也被包括在高频编码数据中的布置,则在解码装置40侧可知用于实际高频子带功率的解码高频子带功率的粗略误差。因此,使用此误差可以改进用于高频子带功率的估计精确度。
在下文中,将参照图22和图23中的流程图,对在拟似高频子带功率差被包括在高频编码数据中的情况下的编码处理和解码处理进行了描述。
首先,将参照图22中的流程图描述由图18中的编码装置30所执行的编码处理。注意,在步骤S241至步骤S246中的处理与在图19中的步骤S181至步骤S186中的处理相同,并且因此,将省略对其的描述。
在步骤S247中,拟似高频子带功率差计算电路36执行表达式(15)的计算以对于每个解码高频子带功率估计系数计算差平方和E(J,id)。
拟似高频子带功率差计算电路36选择在差平方和E(J,id)中的值最小的差平方和,并且将指示对应于该最小的差平方和的解码高频子带功率估计系数的系数指标提供至高频编码电路37。
此外,拟似高频子带功率差计算电路36将关于对应于所选择的差平方和的解码高频子带功率估计系数而获得的子带的拟似高频子带功率差powerdiff(ib,J)提供至高频编码电路37。
在步骤S248中,高频编码电路37对从拟似高频子带功率差计算电路36提供的系数指标和拟似高频子带功率差进行编码,并且将作为其结果而获得的高频编码数据提供至复用电路38。
因此,在高频侧的其指标为sb+1至eb子带的拟似高频子带功率差(即,高频子带功率的估计误差)被作为高频编码数据而提供至解码装置40。
在已经获得高频编码数据的情况下,之后,执行步骤S249中的处理,并且结束编码处理,但是在步骤S249中的处理与在图19中步骤S189中的处理相同,以及因此,将省略对其的描述。
如上所述,如果采用拟似高频子带功率差被包括在高频编码数据中的布置,则采用解码装置40,可以进一步改进高频子带功率的估计精确度,并且可以获得具有较高声音质量的音乐信号。
[解码装置的解码处理]
接下来,将参照图23中的流程图描述由图20中的解码装置40执行的解码处理。注意,在步骤S271至步骤S274中的处理与步骤S211至步骤S214中的处理相同,并且因此,将省略对其的描述。
在步骤S275中,高频解码电路45对从解复用电路41所提供的高频编码数据执行解码。高频解码电路45然后将通过解码而获得的系数指标所指示的解码高频子带功率估计系数和通过解码而获得的子带的拟似高频子带功率差提供至解码高频子带功率计算电路46。
在步骤S276中,解码高频子带功率计算电路46基于从特征量计算电路44所提供的特征量和从高频解码电路45所提供的解码高频子带功率估计系数来计算解码高频子带功率。注意,在步骤S276中,执行与图21中的步骤S216相同的处理。
在步骤S277中,解码高频子带功率计算电路46将从高频解码电路45所提供的拟似高频子带功率差相加至解码高频子带功率,将此提供至解码高频信号生成电路47作为最终解码高频子带功率。即,相同子带的拟似高频子带功率差被相加至计算出的每个子带的解码高频子带功率。
之后,执行步骤S278至步骤S279中的处理,并且解码处理结束,但是这些处理与图21中的步骤S217和步骤S218中相同,以及因此,将省略对其的说明。
以此方式,解码装置40根据通过对输入代码串解复用而获得的高频编码数据来获得系数指标和拟似高频子带功率差。解码装置40然后使用由系数指标所指示的解码高频子带功率估计系数和拟似高频子带功率差来计算解码高频子带功率。因此,可以改进用于高频子带功率的估计精确度,并且可以以较高的声音质量播放音乐信号。
注意,可以考虑编码装置30与解码装置40所生成的高频子带功率估计值之间的差,即,拟似高频子带功率与解码高频子带功率之间的差(在下文中被称为装置之间的估计差)。
在这样的情况下,例如,采用装置之间的估计差来校正用作高频编码数据的拟似高频子带功率差,或拟似高频子带功率差被包括在高频编码数据中,以及关于解码装置40侧,采用装置之间的所估计差来校正拟似高频子带功率差。此外,可以采用下述布置,其中关于解码装置40侧,记录装置之间的估计差,并且解码装置40将装置之间的估计差相加至拟似高频子带功率差以执行校正。因此,可以获得更加近似于实际高频信号的解码高频信号。
<5.第五实施例>
注意,已经进行了如下描述,其中,采用图18中的编码装置30,拟似高频子带差计电路36通过差平方和E(J,id)从多个系数指标中选择最优的一个作为指标,但是可以使用除差平方和之外的指标来选择系数指标。
例如,可以采用考虑到高频子带功率和拟似高频子带功率之间的残差平方平均值、最大值、平均值等的评估值。在这样的情况下,图18中的编码装置30执行图24中的流程图所示的编码处理。
在下文中,将参照图24的流程图描述由编码装置30进行的编码处理。注意,步骤S301至步骤S305中的处理与在图19中步骤S181至步骤S185中的处理相同,并且将省略对其的描述。如果已经执行了步骤S301至步骤S305中的处理,则对于每个K个解码高频子带功率估计系数计算了各个子带的拟似高频子带功率。
在步骤S306中,拟似高频子带功率差计算电路36通过当前帧J来计算应用于每个K个解码高频子带功率估计系数的评估值Res(id,J),其中当前帧J用作要被处理的对象。
具体地,拟似高频子带功率差计算电路36使用从子带分割电路33所提供的每个子带的高频子带信号来执行与以上提及的表达式(1)相同的计算以计算在帧J中的高频子带功率power(ib,J)。注意,采用本实施例,使用指标ib可以识别低频子带信号的子带和高频子带信号的子带中的所有子带。
如果获得了高频子带功率power(ib,J),则拟似高频子带功率差计算电路36计算下面的表达式(16)以计算残差平方平均值Resstd(id,J)。
[数学表达式16]
Res std ( id , J ) = &Sigma; ib = sb + 1 eb { power ( ib , J ) - power est ( ib , id , J ) } 2 . . . ( 16 )
具体地,关于在高频侧的指标为sb+1至eb的每个子带获得了帧J中的高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,id,J)之间的差,并且采取其差平方和作为残差平方平均值Resstd(id,J)。注意,拟似高频子带功率powerest(ib,id,J)指示关于系数指标为id的解码高频子带功率估计系数而获得的帧J中的指标为ib的子带的拟似高频子带功率powerest(ib,id,J)。
接下来,拟似高频子带功率差计算电路36计算下述表达式(17)以计算残差最大值Resmax(id,J)。
[数学表达式17]
Resmax(id,J)=maxib{|power(ib,J)-powerest(ib,id,J)|}
                                                      ···(17)
注意,在表达式(17)中,maxib{|power(ib,J)-{powerest(ib,id,J)}|}指示指标为sb+1至eb的每个子带的高频子带功率power(ib,J)之间的差的绝对值中的最大的一个。因此,采用帧J中高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,id,J)之间的差的绝对值的最大值作为残差最大值Resmax(id,J)。
另外,拟似高频子带功率差计算电路36计算下述表达式(18)以计算残差平均值Resave(id,J)。
[数学表达式18]
Res ave ( id , J ) = | ( &Sigma; ib = sb + 1 eb { power ( ib , J ) - power est ( ib , id , J ) } ) / ( eb - sb ) | . . . ( 18 )
具体地,关于在高频测的指标为sb+1至eb的每个子带获得在帧J中高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,id,J)之间的差,并且获得该差的总和。采用通过将所获得的差的总和除以在高频侧的子带数目(eb-sb)所获得的值的绝对值作为残差平均值Resave(id,J)。此残差平均值Resave(id,J)指示考虑到正负号的子带估计误差的平均值的大小。
此外,如果已经获得了残差平方平均值Resstd(id,J)、残差最大值Resmax(id,J)以及残差平均值Resave(id、J),则拟似高频子带功率差计算电路36计算下述表达式(19)以计算最终评估值Res(id,J)。
[数学表达式19]
Res(id,J)=Resstd(id,J)+Wmax×Resmax(id,J)+Wave×Resave(if,J)
                                                   ···(19)
具体地,残差平方平均值Resstd(id,J)、残差最大值Resmax(id,J)以及残差平均值Resave(id,J)被加权相加以获得最终评估值Res(id,J)。注意,在表达式(19)中,Wmax和Wave是预先确定的权重,并且它们的示例为Wmax=0.5并且Wave=0.5。
拟似高频子带功率差计算电路36执行以上提及的处理以计算用于每个K个解码高频子带功率估计系数(即,用于每个K个系数指标id)的评估值Res(id,J)。
在步骤S307中,拟似高频子带功率差计算电路36基于用于每个所获得的系数指标id的评估值Res(id,J)来选择系数指标id。
在以上提及的处理中所获得的评估值Res(id,J)指示从实际高频信号所计算出的高频子带功率与使用系数指标为id的解码高频子带功率估计系数所计算出的拟似高频子带功率之间的相似度,即,指示高频分量的估计误差的大小。
因此,评估值Res(id,J)越小,通过以解码高频子带功率估计系数进行的计算而获得的解码高频信号越近似于实际高频信号。因此,拟似高频子带功率差计算电路36在K个评估值Res(id,J)中选择值最小的评估值,并且将指示对应于该评估值的、解码高频子带功率估计系数的系数指标提供至高频解码电路37。
在系数指标已经被输出至高频编码电路37的情况下,之后,执行在步骤S308和步骤S309中的处理,并且结束编码处理,但是这些处理与图19中的步骤S188和S189相同,以及因此,将省略对其的描述。
如上所述,采用编码装置30,使用根据残差平方平均值Resstd(id,J)、残差最大值Resmax(id,J)以及残差平均值Resave(id,J)所计算出的评估值Res(id,J),并且选择最优的解码高频子带功率估计系数的系数指标。
如果使用评估值Res(id,J),则与采用差平方和的情况相比,可以使用更多的评估尺度来评估高频子带功率的估计精确度。并且因此,可以选择更适合的解码高频子带功率估计系数。因此,通过接收输出代码串的输入的解码装置40,可以获得最适用于频带扩展处理的解码高频子带功率估计系数,并且可以获得具有较高声音质量的信号。
[修改例1]
另外,如果对于输入信号的每帧执行了上述的编码处理,则采用关于输入信号的高频侧的子带的高频子带功率存在很少时域波动的恒定区域,可以对于每个连续帧选择不同的系数指标。
具体地,采用构成输入信号的恒定区域的连续帧,帧的高频子带功率几乎相同,并且因此,通过这些帧可以连续地选择相同的系数指标。但是,采用这些连续帧中的一部分,对于每个帧要选择的系数指标发生改变,并且作为其结果,在解码装置40上要播放的音频高频分量可以是不稳定的。结果,对于要播放的音频,导致了可感知的异常感。
因此,如果在编码装置30处选择系数指标,则可以考虑时域上的之前帧中的高频分量的估计结果。在这样的情况下,图18中的编码装置30执行图25的流程图中所示的编码处理。
在下文中,将参照图25中的流程图描述由编码设备30进行的编码处理。注意,在步骤S331至S336中的处理与在图24中步骤S301至步骤S306中的处理相同,并且因此,将省略对其的描述。
在步骤S337中,拟似高频子带功率差计算电路36使用过去的帧和当前帧来计算评估值ResP(id,J)。
具体地,拟似高频子带差计算电路36关于在帧J之后要处理的时域上的之前帧(J-1),记录通过使用具有最终选择的系数指标的解码高频子带功率估计系数而获得的每个子带的拟似高频子带功率。在此提及的最终选择的系数指标是由高频编码电路37编码的并且被输出到解码装置40的系数指标。
在下文中,假定在帧(J-1)中所选择的系数指标id具体是idselected(J-1)。另外,假定通过使用系数指标idselected(J-1)的解码高频子带估计系数所获得的指标为ib(但是,sb+1≤ib≤eb)的子带的拟似高频子带功率是powerest(ib,idselected(J-1),J-1),将继续描述。
拟似高频子带功率差计算电路36首先计算下述表达式(20)以计算估计的残差平方平均值ResPstd(id,J)。
[数学表达式20]
ResP std ( id , J ) = &Sigma; ib = sb + 1 eb { power est ( ib , id selected ( J - 1 ) , J - 1 ) - power est ( ib , id , J ) } 2 . . . ( 20 )
具体地,关于在高频侧的指标为sb+1至eb的每个子带,获得帧(J-1)的拟似高频子带功率powerest(ib,idselected(J-1),J-1)与帧J的拟似高频子带功率powerest(ib,id,J)之间的差。采用该差的平方和作为估计的残差平方平均值ResPstd(id,J)。注意,拟似高频子带功率powerest(ib,id,J)指示关于系数指标为id的解码高频子带功率估计系数所获得的指标为ib的子带的帧J的拟似高频子带功率powerest(ib,id,J)。
此估计残差平方平均值ResPstd(id,J)是时域连续帧之间的拟似高频子带功率的差的平方和,并且因此,所估计的残差平方平均值ResPstd(id,J)越小,高频分量的估计值的时域改变越小。
接下来,拟似高频子带功率差计算电路36计算下述表达式(21)以计算所估计的残差最大值ResPmax(id,J)。
[数学表达式21]
ResPmax(id,J)=maxib{|powerest(ib,jdselected(J-1),J-1)
-powerest(ib,id,J)|}           ···(21)
注意,在表达式(21)中,maxib{|powerest(ib,idselected(J-1),J-1)-powerest(ib,id,J)|}指示指标为sb+1至eb的每个子带的拟似高频子带功率powerest(ib,idselected(J-1),J-1)与拟似高频子带功率powerest(ib,id,J)之间的差的绝对值中的最大的一个。因此,采取在时域连续帧之间的拟似高频子带功率的差的绝对值的最大值作为估计的残差最大值ResPmax(id,J)。
所估计的残差最大值ResPmax(id,J)表示其值越小,则连续帧之间的高频分量的估计结果越近似。
如果获得了所估计的残差最大值ResPmax(id,J),则接下来,拟似高频子带功率差计算电路36计算下述表达式(22)以计算所估计的残差平均值ResPave(id,J)。
[数学表达式22]
ResP ave ( id , J ) = | ( &Sigma; ib = sb + 1 eb { power est ( ib , id selected ( J - 1 ) , J - 1 ) - power est ( ib , id , J ) } ) / ( eb - sb ) | . . . ( 22 )
具体地,关于在高频侧的指标为sb+1至eb的每个子带,获得帧(J-1)的拟似高频子带功率powerest(ib,idselected(J-1),J-1)与帧J的拟似高频子带功率powerest(ib,idJ,J)之间的差。通过将子带的差的和除以在高频侧的子带数目(eb-sb)而获得的值的绝对值作为估计的残差平均值ResPave(id,J)。该估计残差平均值ResPave(id,J)表示考虑到正负号,帧之间的子带的估计的差的平均值的大小。
此外,如果获得了估计的残差平方平均值ResPstd(id,J)、估计的残差最大值ResPmax(id,J)以及估计的残差平均值值ResPave(id,J),则拟似高频子带功率差计算电路35计算下述表达式(23)以计算评估值ResP(id,J)。
[数学表达式23]
ResP(id,J)=ResPstd(id,J)+Wmax×ResPmax(id,J)
+Wave×ResPave*id,J)        ···(23)
具体地,将估计的残差平方平均值ResPstd(id,J)、估计的残差最大值ResPmax(id,J)以及估计的残差平均值值ResPave(id,J)加权相加以获得评估值ResP(id,J)。注意,在表达式(23)中,Wmax和Wave是预先确定的权重,并且它们的示例为Wmax=0.5并且Wave=0.5。
以此方式,在使用过去的帧和当前帧计算了评估值ResP(id,J)之后,处理从步骤S337继续至步骤S338。
在步骤S338中,拟似高频子带功率差计算电路36计算下述表达式(24)以计算最终评估值Resall(id,J)。
[数学表达式24]
Resall(id,J)=Res(id,J)+Wp(J)×ResP(id,J)  ···(24)
具体地,将所获得的评估值Res(id,J)和评估值ResP(id,J)加权相加。注意,在表达式(24)中,例如Wp(J)是通过下述表达式(25)定义的权重。
[数学表达式25]
W p ( J ) = - power r ( J ) 50 + 1 ( 0 &le; power r ( J ) &le; 50 ) 0 ( otherwise ) . . . ( 25 )
另外,在表达式(25)中的powerr(J)是通过下述表达式(26)所确定的值。
[数学表达式26]
power r ( J ) = ( &Sigma; ib = sb + 1 eb { power ( ib , J ) - power ( ib , J - 1 ) } 2 ) / ( eb - sb ) . . . ( 26 )
该powerr(J)指示帧(J-1)与帧J的高频子带功率的差的平均值。另外,根据表达式(25),当powerr(J)是在接近0的预定范围中的值时,powerr(J)越小,则Wp(J)变为越接近1的值,并且当powerr(J)大于预定范围中的值时,Wp(J)变为0。
在此,如果powerr(J)是在接近0的预定范围中的值,则连续帧之间的高频子带功率的差的平均值小到一定程度。换言之,输入信号的高频分量的时域波动很小,并且结果,输入信号的当前帧是恒定区域。
输入信号的高频分量越接近常量,则权重Wp(J)变为越接近1的值,并且相反,输入信号的高频分量越不接近常量,则权重Wp(J)变为越接近0的值。因此,采用表达式(24)中所指示的评估值Resall(id,J),输入信号的高频分量的时域波动越小,则对于用于后一帧的高频分量的估计结果的比较结果作为评估尺度的估计值ResP贡献比例越大。
作为其结果,通过输入信号的恒定区域,选择了下述解码高频子带功率估计系数:借由该系数可以获得高频分量近似于后一帧的高频分量的估计结果,并且即使通过解码装置40侧,也可以播放具有更自然地高的声音质量的音频。相反地,通过输入信号的非恒定区域,评估值Resall(id,J)中的评估值ResP(id,J)项变为0,并且更近似于实际高频信号的解码高频信号被获得。
拟似高频子带功率差计算电路36执行以上提及的处理来为每个K个解码高频子带功率估计系数计算评估值Resall(id,J)。
在步骤S339中,拟似高频子带功率差计算电路36基于评估值Resall(id,J)为每个获得的解码高频子带功率估计系数选择系数指标id。
在以上提及的处理中所获得的评估值Resall(id,J)是通过使用权重对于评估值Res(id,J)和评估值ResP(id,J)执行线性耦合而获得的评估值。如上所述,评估值Res(id,J)的值越小,则获得越近似于实际高频信号的解码高频信号。另外,评估值ResP(id,J)的值越小,获得了越近似于上一帧的解码高频信号的高频信号。
因此,评估值Resall(id,J)越小,获得了越适合得解码高频信号。因此,拟似高频子带功率差计算电路36在K个评估值Resall(id,J)中,选择值变为最小的评估值,并且将指示对应于该评估值的解码高频子带功率估计系数的系数指标提供至高频编码电路37。
在选择了系数指标之后,执行在步骤S340和步骤S341中的处理,并且结束编码处理,但是这些编码处理与图24中的步骤S308和步骤S309中的处理相同,以及因此,将省略对其的描述。
如上所述,采用编码装置30,使用通过对于评估值Res(id,J)和评估值ResP(id,J)执行线性耦合而获得的评估值Resall(id,J),并且选择最优的解码高频子带功率估计系数的系数指标。
在使用评估值Resall(id,J)的情况下,以与使用评估值Res(id,J)的情况相同的方式,可以通过更多的估计尺度来选择更适合的解码高频子带功率估计系数。此外,如果使用评估值Resall(id,J),则通过解码装置40,可以抑制要播放的信号的高频分量的恒定区域的时域波动,并且可以获得具有较高声音质量的信号。
<修改例2>
顺便提及,通过频带扩展处理,当欲获得具有较高声音质量的音频时,较低频侧的子带关于可听性而言变为重要。具体地,在高频侧的子带中,越接近低频侧的子带的估计精确度越高,可以以越高的声音质量播放音频。
因此,如果,计算出关于解码高频子带功率估计系数中的每个的评估值,则可以将权重施加在低频侧的子带上。在这样的情况下,图18中的编码装置30执行图26中的流程图所示的编码处理。
在下文中,将参照图26中的流程图描述由编码装置30进行的编码处理。注意,在步骤S371至步骤S375中的处理与图25中的步骤S331至步骤S335中的处理相同,并且因此,将省略对其的描述。
在步骤S376中,拟似高频子带功率差计算电路36对于每个K解码高频子带功率估计系数,通过用作要处理的对象的当前帧J来计算评估值ResWband(id,J)。
具体地,拟似高频子带功率差计算电路36使用从子带分割电路33所提供的每个子带的高频子带信号执行与上述提及的表达式(1)相同的计算来计算在帧J中的高频子带功率power(ib,J)。
在获得了高频子带功率power(ib,J)的情况下,拟似高频子带功率差计算电路36计算下述表达式(27)以计算残差平方平均值ResstdWband(id,J)。
[数学表达式27]
Res std W band ( ib , J ) = &Sigma; ib = sb + 1 eb { W band ( ib ) &times; { power ( ib , J ) - power est ( ib , id , J ) } } 2 . . . ( 27 )
具体地,关于在高频侧的指标为sb+1至eb的每个子带,获得在帧J中的高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,id,J)之间的差,并且对于每个子带将其差乘以权重Wband(ib)。将差的平方与权重Wband(ib)的乘积的和作为残差平方平均值ResstdWhand(id,J)。
在此,权重Wband(ib)(但是,sb+1≤ib≤eb)例如是由下述表达式(28)所限定的。如果其子带处于较低频侧,则增加此权重Wband(ib)的值。
[数学表达式28]
W band ( ib ) = - 3 &times; ib 7 + 4 . . . ( 28 )
接下来,拟似高频子带功率差计算电路36计算残差最大值ResmaxWband(id,J)。具体地,将通过将指标为sb+1至eb的高频子带功率power(ib,J)与每个子带的拟似高频子带功率powerest(ib,id,J)之间的差乘以权重Wband(ib)而获得的值的绝对值的最大值,作为残差最大值ResmaxWband(id,J)。
另外,拟似高频子带功率差计算电路36计算残差平均值ResaveWband(id,J)。
具体地,关于指标为sb+1至eb的每个子带,获得高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,id,J)之间的差,并且将其乘以权重Wband(ib),以及获得与权重Wband(ib)相乘之后的差的和。将通过将所获得的差的和除以在高频侧的子带的数目(eb-sb)而获得的值的绝对值,作为残差平均值ResaveWband(id,J)。
此外,拟似高频子带功率差计算电路36计算评估值ResWband(id,J)。具体地,将将残差平方平均值ResstdWband(id,J)、残差最大值ResmaxWband(id,J)与权重Wmax的乘积以及残差平均值ResaveWband(id,J)与权重Wave的乘积的总和作为评估值ResWband(id,J)。
在步骤S377中,拟似高频子带功率差计算电路36使用过去的帧和当前帧来计算评估值ResPWband(id,J)。
具体地,拟似高频子带功率差计算电路36,关于在帧J之后要处理的时域上的前一帧(J-1),记录通过使用具有最终选择的系数指标的解码高频子带功率估计系数而获得的每个子带的拟似高频子带功率。
拟似高频子带功率差计算电路36首先计算估计的残差平方平均值ResPstdWband(id,J)。具体地,关于在高频侧的指标为sb+1至eb每个子带,获得拟似高频子带功率powerest(ib,idselected(J-1),J-1)与拟似高频子带功率powerest(ib,id,J)之间的差,并且将该差乘以权重Wband(ib)。然后将差的平方与权重Wband(ib)的乘积的和作为估计的残差平方平均值ResPstdWband(id,J)。
接下来,拟似高频子带功率差计算电路36计算估计的残差最大值ResPmaxWband(id,J)。具体地,将指标为sb+1至eb的每个子带的拟似高频子带功率powerest(ib,idselected(J-1),J-1)与拟似高频子带功率powerest(ib,id,J)之间的差乘以权重Wband(ib)而获得的值的绝对值的最大值作为估计的残差最大值ResPmaxWband(id,J)。
接下来,拟似高频子带功率差计算电路36计算估计的残差平均值ResPaveWband(id,J)。具体地,关于指标为sb+1至eb的每个子带,获得拟似高频子带功率powerest(ib,idselected(J-1),J-1)与拟似高频子带功率powerest(ib,id,J)之间的差,并且将该差乘以权重Wband(ib)。将通过将差与权重Wband(ib)的乘积的和除以在高频侧的子带的数目所获的值的绝对值作为估计的残差平均值ResPaveWband(id,J)。
此外,拟似高频子带功率差计算电路36获得估计的残差平方平均值ResPstdWband(id,J)、估计的残差最大值ResPmaxWband(id,J)与权重Wmax的乘积以及估计的残差平均值ResPaveWband(id,J)与权重Wave的乘积的和,并且将该和作为估计值ResPWband(id,J)。
在步骤S378中,拟似高频子带功率差计算电路36将评估值ResWband(id,J)和评估值ResPWband(id,J)与表达式(25)中的权重Wp(J)的乘积相加以计算最终评估值ResallWband(id,J)。为每个K个解码高频子带功率估计系数计算此评估值ResallWband(id,J)。
之后,执行步骤S379至步骤S381中的处理,并且结束编码处理。但是这些处理与图25中的步骤S339至步骤S341中的处理相同,以及因此,将省略对其的描述。注意,在步骤S379中,在K个系数指标中,选择可以使评估值ResallWband(id,J)变为最小的系数指标。
以此方式,对于每个子带执行加权以使得将权重施加在低频侧的子带上,由此能够在解码装置40侧获得具有较高的声音质量的音频。
注意,虽然以上描述了基于评估值ResallWband(id,J)选择解码高频子带功率估计系数,但是也可以基于评估值ResWband(id,J)来选择解码高频子带功率估计系数。
<修改例3>
此外,人类听觉感受具有如下特征,频带所具有的振幅(功率)越大,人类听觉能够越多的感受到此频带,并且因此,可以计算关于每个解码高频子带功率估计系数的估计值,以将权重施加在具有更高功率的子带上。
在这样的情况下,图18中的解码装置30执行图27中的流程图所示的编码处理。在下文中,将参照图27中的流程图描述由编码装置30进行的编码处理。注意,在步骤S401至步骤S405中的处理与在图25中的步骤S331至步骤S335中的处理相同,并且因此,将省略对其的描述。
在步骤S406中,拟似高频子带功率差计算电路36对于每个K个解码高频子带功率估计系数通过用作要处理对象的当前帧J来计算评估值ResWpower(id,J)。
具体地,拟似高频子带功率差计算电路36执行与以上提及的表达式(1)相同的计算以使用从子带分割电路33所提供的每个子带的高频子带信号来计算帧J中的高频子带功率power(ib,J)。
如果获得了高频子带功率power(ib,J),则拟似高频子带功率差计算电路36计算下述表达式(29)以计算残差平方平均值ResstdWpower(id,J)。
[数学表达式29]
Res std W power ( id , J ) = &Sigma; ib = sb + 1 eb { W power ( power ( ib , J ) ) &times; { power ( ib , J ) - p ower est ( ib , id , J ) } } 2 . . . ( 29 )
具体地,关于在在高频侧的指标为sb+1至eb的每个子带,获得高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,id,J)之间的差,并且对于每个子带将其差乘以权重Wpower(power(ib,J))。然后将差与权重Wpower(power(ib,J))的乘积的平方和作为残差平方平均值ResstdWpower(id,J)。
在此,例如权重Wpower(power(ib,J))(但是,sb+1≤ib≤eb)是由下述表达式(30)所定义的。在其子带的高频子带功率power(ib,J)较大的情况下,权重Wpower(power(ib,J))的值增加。
[数学表达式30]
W power ( power ( ib , J ) ) = 3 &times; power ( ib , J ) 80 + 35 8 . . . ( 3 )
接下来,拟似高频子带功率差计算电路36计算残差最大值ResmaxWpower(id,J)。具体地,将通过将指标为sb+1至eb的每个子带的高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,id,J)之间的差乘以权重Wpower(power(ib,J)所获得的值的绝对值的最大值作为残差最大值ResmaxWpower(id,J)。
另外,拟似高频子带功率差计算电路36计算残差平均值ResaveWpower(id,J)。
具体地,关于从sb+1至eb的每个子带,获得高频子带功率power(ib,J)与拟似高频子带功率powerest(ib,id,J)之间的差,并且将该差乘以权重Wpower(power(ib,J)),以及获得差与权重Wpower(power(ib,J))的乘积的和。将通过将获得的差的和除以在高频侧的子带的数目(eb-sb)所获得的值的绝对值作为残差平均值ResaveWpower(id,J)。
此外,拟似高频子带功率差计算电路36计算评估值ResWpower(id,J)。具体地,将残差平方平均值的ResstdWpower(id,J)、残差最大值ResmaxWpower(id,J)与权重Wmax的乘积以及乘以残差平均值ResaveWpower(id,J)与权重Wave的乘积的和作为评估值ResWpower(id,J)。
在步骤S407中,拟似高频子带功率差计算电路36通过过去的帧和当前帧来计算评估值ResPWpower(id,J)。
具体地,拟似高频子带功率差计算电路36,关于在帧J之后要处理的时域上的前一帧(J-1),记录通过使用具有最终选择的系数指标的解码高频子带功率估计系数所获得的每个子带的拟似高频子带功率。
拟似高频子带功率差计算电路36,首先计算估计的残差平方平均值ResPstdWband(id,J)。具体地,关于在高频侧的指标为sb+1至eb、每个子带,获得拟似高频子带功率powerest(ib,idselected(J-1),J-1)与拟似高频子带功率powerest(ib,id,J)之间的差,并且将该差乘以权重Wpower(power(ib,J))。然后将差的平方与权重Wpower(power(ib,J))的乘积的和作为估计的残差平方平均值ResPstdWpower(id,J)。
接下来,拟似高频子带功率差计算电路36计算估计的残差最大值ResPmaxWpower(id,J)。具体地,采用通过将其指标为sb+1至eb的每个子带的拟似高频子带功率powerest(ib,idselected(J-1),J-1)与拟似高频子带功率powerest(ib,id,J)之间的差乘以权重Wpower(power(ib,J))而获得的值的绝对值的最大值作为估计的残差最大值ResPmaxWpower(id,J)。
接下来,拟似高频子带功率差计算电路36计算估计的残差平均值ResPaveWpower(id,J)。具体地,关于指标为sb+1至eb的每个子带,获得拟似高频子带功率powerest(ib,idselected(J-1),J-1)与拟似高频子带功率powerest(ib,id,J)之间的差,并且将该差乘以权重Wpower(power(ib,J))。将通过将差与权重Wpower(power(ib,J))的乘积的求和除以在高频侧的子带的数目(eb-sb)所获的值的绝对值作为估计的残差平均值ResPaveWpower(id,J)。
此外,拟似高频子带功率差计算电路36获得估计的残差平方平均值ResPstdWpower(id,J)、估计的残差最大值ResPmaxWpower(id,J)与权重Wmax的乘积以及估计的残差平均值ResPaveWpower(id,J)与权重Wave的乘积的和,并且将该和作为估计值ResPWpower(id,J)。
在步骤S408中,拟似高频子带功率差计算电路36将评估值ResWpower(id,J)和评估值ResPWpower(id,J)与表达式(25)中的权重Wp(J)的乘积相加以计算最终评估值ResallWpower(id,J)。为每个K个解码高频子带估计系数计算此评估值ResallWpower(id,J)。
之后,执行在步骤S409至步骤S411中的处理,并且结束编码处理。但是这些处理与图25中的步骤S339至步骤S341中的处理相同,以及因此,将省略对其的描述。注意,在步骤S409中,在K个系数指标中,选择可以使评估值ResallWpower(id,J)变为最小的系数指标。
以此方式,对于每个子带执行加权以将权重施加在具有较大的功率的子带上,由此能够在解码装置40侧获得具有较高的声音质量的音频。
注意,虽然目前为止描述了基于评估值ResallWpower(id,J)执行解码高频子带功率估计系数的选择,但是也可以基于评估值ResWpower(id,J)来选择解码高频子带功率估计系数。
<第六修改例>
[系数学习装置的配置]
顺便提及,以与系数指标相关的方式将用作解码高频子带功率估计系数的系数Aib(kb)和系数Bib的集合记录在图20中的解码装置40中。例如,在128个系数指标的解码高频子带功率估计系数被记录在解码装置40中的情况下,需要准备较大的区域作为记录区域(诸如存储器)以记录这些解码高频子带功率估计系数等。
因此,可以实施其中采取若干个解码高频子带功率估计系数中的一部分作为公用系数的布置,并且因此,减少用于记录解码高频子带功率估计系数的记录区域。在这样的情况下,例如通过学习而获得解码高频子带功率估计系数的系数学习装置被配置为如图28所示。
系数学习装置81由下述组件构成:子带分割电路91、高频子带功率计算电路92、特征量计算电路93以及系数估计电路94。
要用于学习的多个音乐数据等被作为宽带监视信号而提供至此系数学习装置。宽带监视信号是包括多个高频子带分量和多个低频带子带分量的信号。
子带分割电路91由带通滤波器等构成,将所提供的宽带监视信号分割为多个子带信号,并且所分割的多个子带信号被提供至高频子带功率计算电路92和特征量计算电路93。具体地,在高频侧的指标为sb+1至eb的每个子带的高频子带信号被提供至高频子带功率计算电路92,并且在低频侧的指标为sb-3至sb的每个子带的低频子带信号被提供至特征量计算电路93。
高频子带功率计算电路92计算从子带分割电路91所提供的每个高频子带信号的高频子带功率以提供至系数估计电路94。特征量计算电路93基于从子带分割电路91所提供的每个低频子带信号来计算作为特征量的低频带子带功率以提供至系数估计电路94。
系数估计电路94使用来自高频子带功率计算电路92的高频子带功率和来自特征量计算电路93的特征量通过执行回归分析来生成解码高频子带功率估计系数以输出至解码装置40。
[系数学习装置的描述]
接下来,将参照图29中的流程图描述由系数学习装置81进行的系数学习处理。
在步骤S431中,子带分割电路91将所提供的多个宽带监视信号中的每一个分割为多个子带信号。子带分割电路91然后将指标为sb+1至eb的子带的高频子带信号提供至高频子带功率计算电路92,并且将指标为sb-3至sb的子带的低频子带信号提供至特征量计算电路93。
在步骤S432中,高频子带功率计算电路92对于从子带分割电路91所提供的每个高频子带信号执行与以上提及的表达式(1)相同的计算以计算高频子带功率从而提供至系数估计电路94。
在步骤S433中,特征量计算电路93对于从子带分割电路91所提供的每个低频子带信号执行与上述表达式(1)相同的计算以计算作为特征量的低频子带功率从而提供至系数估计电路94。
因此关于多个宽带监视信号的每帧的高频子带功率和低频子带功率被提供至系数估计电路94。
在步骤S43中,系数估计电路94使用最小二乘法执行回归分析,以计算用于指标为sb+1至eb的每个子带ib(但是,sb+1≤ib≤eb)的系数Aib(kb)和Bib
注意,通过回归分析,采取从特征量计算电路93所提供的低频子带功率作为解释变量,并且采取从高频子带功率计算电路92所提供的高频子带功率作为被解释变量。另外,通过使用构成被提供至系数学习装置81的所有宽带监视信号的所有帧的低频子带功率和高频子带功率来执行回归分析。
在步骤S435中,系数估计电路94使用为每个子带ib所获得的系数Aib(kb)和系数Bib来获得宽带监视信号的每帧的残差矢量。
例如,系数估计电路94从用于帧J的每个子带ib(但是,sb+1≤ib≤eb)的高频子带功率power(ib,J)中减去低频子带功率power(kb,J)(但是,sb-3≤kb≤sb)与系数Aib(kb)的乘积的和以及Bib以获得残差。将由帧J的每个子带ib的残差所构成的矢量作为残差矢量。
注意,关于构成被提供至系数学习装置81的所有宽带监视信号的所有帧来计算残差矢量。
在步骤S436中,系数估计电路94对关于每个帧而获得的残差矢量进行归一化。例如,系数估计电路94关于每个子带ib获得所有帧的残差矢量的子带ib的残差离差值,并且将在每个残差矢量中的子带ib的残差除以其离差值的平方根,由此对残差矢量进行归一化。
在步骤S437中,系数估计电路94通过k-means方法等对于所有帧的归一化的残差矢量执行聚类。
例如,假定在使用系数Aib(kb)和系数Bib执行高频子带功率估计时所获得的所有帧的平均频率包络线将被称为平均频率包络线SA。另外,假定功率大于平均频率包络线SA的预定的频率包络线被将被称为频率包络线SH,并且功率小于平均频率包络线SA的预定的频率包络线被将被称为频率包络线SL。
此时,执行残差矢量的聚类以使得获得分别地属于聚类CA、聚类CH以及聚类CL的系数的残差矢量,借由该系数的残差矢量频率包络线近似于平均频率包络线SA、频率包络线SH以及频率包络线SL。换言之,执行聚类以使得每帧的残差矢量属于聚类CA、聚类CH以及聚类CL中的任意一个。
通过基于低频分量与高频分量之间的相关性对高频分量进行估计的频带扩展处理,关于其特征,当使用通过回顾分析而获得的系数Aib(kb)和系数Bib来计算残差矢量时,如果子带属于较高频侧,则残差误差增加。因此,当对于残差矢量不加改变的执行聚类时,执行处理以使得将权重施加在较高频侧的子带上。
另一方面,通过系数学习装置81,使用每个子带的残差离差值对残差矢量进行归一化,从而假定每个子带的残差离差具有相同的表象而对每个子带施加平均的权重从而执行聚类。
在步骤S438中,系数估计电路94选择聚类CA、聚类CH或聚类CL中的任何一个聚类作为要处理的聚类。
在步骤S439中,系数估计电路94使用属于所选择的作为要处理的聚类的聚类的残差矢量的帧通过回归分析来计算每个子带ib(但是,sb+1≤ib≤eb)的系数Aib(kb)和系数Bib
具体地,如果假定属于要处理的聚类的残差矢量的帧将被称为要处理的帧,则将要处理的所有帧的低频子带功率和高频子带功率作为解释变量和被解释变量,并且执行使用最小二乘法的回归分析。因此,为每个子带ib获得系数Aib(kb)和系数Bib
在步骤S440中,系数估计电路94关于要被处理的所有帧使用通过在步骤S439中的处理所获得的系数Aib(kb)和Bib来获得残差矢量。注意,在步骤S440中执行与步骤S435中相同的处理,并且获得要被处理的每帧的残差矢量。
在步骤S441中,系数估计电路94对通过执行与步骤S436的相同的处理而在步骤S440中的处理中获得的要被处理的每帧的残差矢量执行归一化。即,通过将残差误差除以每个子带的离差值的平方根而执行残差矢量的归一化。
在步骤S442中,系数估计电路94对要由k-means方法等处理的所有帧的归一化的残差矢量执行聚类。在此所提及的聚类的数目被确定如下。例如,如果尝试在系数学习装置81处生成128个系数指标的解码高频子带功率估计系数,则通过将要被处理的帧的数目乘以128来获得一个数目,并且此外,采取将此数目除以所有帧的总数目作为聚类的数目。在此,所有帧的总数目是提供至系数学习装置81的所有宽带监视信号的所有帧的总数目。
在步骤S443,系数估计电路94获得通过在步骤S442中的处理所获得的每个聚类的重心矢量。
例如,通过在步骤S442中进行聚类而获得的聚类对应于系数指标,在系数学习装置81中该系数指标被分配给各个聚类,并且获得每个系数指标的解码高频子带功率估计系数。
具体地,假定在步骤S438中,聚类CA被选择为要被处理的聚类,并且通过在步骤S442中的聚类处理获得了F个聚类。现在,如果关注F个聚类中的一个聚类CF,则将聚类CF的系数指标的解码高频子带功率估计系数作为在步骤S439中关于聚类CA而获得的系数Aib(kb),该系数为线性相关项。另外,通过使在步骤S443中所获得聚类CF的重心矢量经受步骤S441中执行的归一化的逆处理(逆归一化)来获得矢量的和,并且将在步骤S439中所获的系数Bib作为解码高频子带功率估计系数的常数项的系数Bib。例如在此提及的逆归一化是下述处理:如果在步骤S441中执行了归一化,则将聚类CF的重心矢量的每个因子乘以与在归一化中相同的值(每个子带的离差值的平方根)以将残差误差除以每个子带的离差值的平方根。
具体地,如上所述获得的系数Bib和在步骤S439中所获的系数Aib(kb)的集合变为了聚类CF的系数指标的解码高频子带功率估计系数。因此,通过聚类所获得F个聚类中的每一个通常具有关于聚类CA所获得的系数Aib(kb)作为解码高频子带功率估计系数的线性相关项。
在步骤S444中,系数学习装置81确定是否聚类CA、聚类CH以及聚类CL中的所有均作为要被处理的聚类而被处理。如果在步骤S444中确定还未处理所有的聚类,则处理返回至步骤S438,并且重复以上提及的处理。即,将下一聚类选择为要处理的目标,并且计算解码高频子带功率估计系数。
另一方面,如果在步骤S444中确定处理了所有聚类,则获得了期望的预定数目的解码高频子带功率估计系数,并且因此,处理继续至步骤S445。
在步骤S445中,系数估计电路94将所获得的系数指标和解码高频子带功率估计系数输出到解码装置40以将其记录在该装置中,并且结束系数学习处理。
例如,要输出到解码装置40的解码高频子带功率估计系数包括具有相同的系数Aib(kb)作为线性关系项的若干个解码高频子带功率估计系数。因此,系数学习装置81将这些共用的系数Aib(kb)与是用于识别系数Aib(kb)的信息的线性关系项指标(指针)相关联,并且还将系数指标与线性关系项指标和是常数项的系数Bib相关联。
系数学习装置81然后将相关联的线性关系项指标(指针)和系数Aib(kb)以及相关联的系数指标和线性关系项指标(指针)和系数Bib提供至解码装置40以将其存储在解码装置40的高频解码电路45的存储器中。以此方式,在记录多个解码高频子带功率估计系数时,关于公用的线性关系项,如果线性关系项指标(指针)被存储在用于解码高频子带功率估计系数的记录区域,则可以显著地减小记录区域。
在此情况下,线性关系项指标和系数Aib(kb)被以相关联的方式记录在高频解码电路45的存储器中,并且因此,可以从系数指标获得线性关系项指标和系数Bib,并且此外,可以从线性关系项指标获得系数Aib(kb)。
注意,作为申请人分析的结果,即使多个解码高频子带功率估计系数的线性关系项在三种模式中共用,但是已知的是几乎不存在关于经受了频带扩展处理的音频的可听性方面的声音质量的劣化。因此,根据系数学习装置81,在不使频带扩展处理之后的音频声音质量劣化的情况下,可以进一步减小用于解码高频子带功率估计系数的记录的记录区域。
如上所述,系数学习装置81生成并且输出来自所提供的宽带监视信号的每个系数指标的解码高频子带功率估计系数。
注意,通过图29中的系数学习处理,对于对残差矢量进行归一化进行了描述,但是在步骤S436或步骤S441的一个或两者中,可以不执行残差矢量的归一化。
替选地,当可以执行残差矢量的归一化时,可以不执行解码高频子带功率估计系数的线性关系项的共享。在这样的情况下,在步骤S436的归一化处理之后,将归一化后的残差矢量经受聚类至与要获得的解码高频子带功率估计系数的数目相同的数目的聚类。使用属于每个聚类的残差矢量的帧对于每个聚类执行回归分析,并且生成每个聚类的解码高频子带功率估计系数。
<7.第七实施例>
[编码装置的功能配置的示例]
顺便提及,到目前为止进行了下述说明,其中,在对输入信号进行编码时,从输入信号的低频包络线中选择可以以最好的精确度对高频包络线进行估计的系数Aib(kb)和Bib。在此情况下,指示系数Aib(kb)和Bib的系数指标的信息被包括在输出代码串中,并且被发送至解码侧,以及在对输入代码串进行解码时,通过使用对应于系数指标的系数Aib(kb)和Bib生成高频包络线。
但是,如果低频包络线的时域波动较大,则即使使用用于输入信号的连续帧的相同的系数Aib(kb)和Bib执行了高频包络线的估计,但是高频信号的时域波动可能增加。
换言之,如果低频子带功率的时域波动较大,则即使使用了相同的系数Aib(kb)和Bib计算了解码高频子带功率,但是解码高频子带功率的时域波动也可能增加。这是因为使用低频子带功率用于解码高频子带功率的计算,并且因此,当低频子带的时域波动较大时,要获得的解码高频子带功率也在时域上极大的波动。
另外,尽管目前为止进行了下述描述:其中,通过采用宽带监视信号进行学习预先准备了系数Aib(kb)和系数Bib的多个集合,此宽带监视信号是通过对输入信号进行解码并且此外对编码之后的输入信号进行解码所获得的信号。
通过这样的学习所获得的系数Aib(kb)和系数Bib的集合是适合于如下情况的系数:在该情况中,当在学习时对输入信号进行编码时,使用编码系统和编码算法对实际输入信号进行编码。
在生成宽带监视信号时,取决于针对对于输入信号进行的编码/解码采用了哪种编码系统,获得了不同的宽带监视信号。另外,如果尽管使用了相同编码系统但是编码器(编码算法)不相同,则可以获得不同的宽带监视信号。
因此,如果通过使用具体的编码系统和编码算法对输入信号进行编码/解码而获得的仅仅一个信号被用作宽带监视信号,则可能难以根据所获得系数Aib(kb)和系数Bib以高精确度估计高频包络线。即,可能不能够充分地处置编码系统之间或编码算法之间的差异。
因此,可以采用对低频包络线进行平滑并且执行合适的参数的生成的布置,由此能够与低频包络线的时域波动、编码系统等无关地、以高精确度对高频包络线进行估计。
在这样的情况下,对输入信号进行编码的编码装置被配置为如图30所示。注意,在图30中,以相同的附图标记来表示对应于图18中的情况的部分,并且将省略对其的描述。图30中的编码装置不同于图18中的编码装置30之处在于,新设置了参数确定单元121和平滑单元122,其它部分是相同的。
参数确定单元121基于从子带分割电路33所提供的高频子带信号来生成与要计算的低频子带功率的平滑相关的参数作为特征量(在下文中,被称为平滑参数)。参数确定单元121将所生成平滑参数提供至拟似高频子带功率差计算电路36和平滑单元122。
在此,平滑参数是指示时域连续低频子带功率的多少帧值(framesworth)被用于对用作要处理的目标的当前帧的低频子带功率进行平滑的信息等。即,通过参数确定单元121来确定要用于低频子带功率的平滑处理的参数。
平滑单元122使用从参数确定单元121所提供的平滑参数对用作从特征量计算电路34所提供的用作特征量的低频子带功率进行平滑以提供至拟似高频子带功率计算电路35。
采用拟似高频子带功率计算电路35,以相关联地方式记录通过回归分析所获得的多个解码高频子带功率估计系数以及用于识别这些解码高频子带功率估计系数的系数群组指标以及系数指标。
具体地,依照多个不同编码系统和编码算法中的每个对一个输入信号执行编码,通过进一步对通过编码所获的信号进行解码所获的信号被准备为宽带监视信号。
对于多个宽带监视信号中的每个,将低频子带功率作为解释变量,并且将高频子带功率作为被解释变量。根据使用最小二乘法的回归分析(学习),获得每个子带的系数Aib(kb)和系数Bib的多个集合并且将其记录在拟似高频子带功率计算电路35中。
在此,通过使用一个宽带监视信号的学习,获得了每个子带的系数Aib(kb)和系数Bib的多个集合(在下文中称为系数集合)。假定以此方式从一个宽带监视信号所获得的多个系数集合的群组将被称为系数群组,用于识别系数群组的信息将被称为系数群组指标,以及用于识别属于系数群组的系数集合将被称为系数指标。
通过拟似高频子带功率计算电路35,以与用于识别系数集合的系数群组指标和系数指标相关联的方式记录多个系数群组的系数集合。即,通过系数群组指标和系数指标来识别记录在拟似高频子带功率计算电路35中的、用作解码高频子带功率估计系数的系数集合(系数Aib(kb)和系数Bib)。
注意,在系数集合的学习时,可以通过与在平滑单元122处对用作特征量的低频子带功率进行平滑的处理相同的处理来对用作解释变量的低频子带功率进行平滑。
拟似高频子带功率计算电路35使用每个所记录的解码高频子带功率估计系数的解码高频子带功率估计系数以及平滑之后从平滑单元122所提供的特征量,计算在高频侧的每个子带的拟似高频子带功率,以提供至拟似高频子带功率差计算电路36。
拟似高频子带功率差计算电路36将根据从子带分割电路33所提供的高频子带分割信号所获得的高频子带功率与来自拟似高频子带功率计算电路35的拟似高频子带信号进行比较。
作为比较的结果,拟似高频子带功率差计算电路36然后将在多个解码高频子带功率估计系数中能获得最近似于高频子带功率的拟似高频子带功率的解码高频子带功率估计系数的系数群组指标和系数指标提供至高频编码电路37。另外,拟似高频子带功率差计算电路36还将指示从参数确定单元121所提供的平滑参数的平滑信息提供值高频编码电路37。
以此方式,通过学习预先准备多个系数群组以处理编码系统或编码算法的差别,并且将多个系数群组记录在拟似高频子带功率计算电路35中,借此可以使用更合适的解码高频子带功率估计系数。因此,通过输入代码串的解码侧,可以与编码系统或编码算法无关地、以较高的精确度执行高频包络线的估计。
[编码装置的编码处理]
接下来,将参照图31中的流程图描述由图30中的解码装置30所要执行的编码处理。注意,步骤S471至步骤S474中的处理与步骤S181至步骤S184中的处理相同,并且因此省略对其的描述。
但是,在步骤S473中所获得的高频子带信号被从子带分割电路33提供至拟似高频子带功率差计算电路36和参数确定单元121。另外,在步骤S474中,计算在用作要被处理的对象的帧J的低频侧的每个子带(sb-3≤ib≤sb)的低频子带功率power(ib,J)作为特征量,并且将其提供至平滑单元122.
在步骤S475中,参数确定单元121基于从子带分割电路33所提供的在高频侧的每个子带的高频子带信号来确定要用于特征量的平滑的帧的数目。
例如,参数确定单元121关于在用作要被处理的对象的帧J的高频侧的每个子带ib(但是,sb+1≤ib≤eb)执行以上提及的表达式(1)的计算以获得子带功率,并且进一步获得这些子带功率的的和。
类似的,参数确定单元121关于时域上在帧J之前的前一帧(J-1),获得高频侧的每个子带ib的子带功率,并且进一步获得这些子带功率的和。参数决定单元121将通过从关于帧J所获得的子带功率的和中减去关于帧(J-1)所获得的子带功率的和(在下文中,被成为子带功率求和的差)所获的值与预定的阈值进行比较。
例如,如果子带功率和的差等于或大于阈值,则参数确定单元121确定用于特征量的平滑的帧的数目(在下文中称为帧数目ns)为ns=4,并且如果子带功率和的差小于阈值,则参数确定单元121确定帧数目ns为ns=16。参数确定121将确定的帧数目ns作为平滑参数提供至拟似高频子带功率差计算电路36和平滑单元122。
现在,将实施如下布置:其中,将子带功率和的差与多个阈值进行比较,并且帧数目ns被确定为三个或更多个值中的任何一个。
在步骤S476中,平滑单元122使用从参数确定单元121所提供的平滑参数来计算下述表达式(31)以对从特征量计算电路34所提供的特征量进行平滑,并且将其提供至拟似高频子带功率计算电路35。即,对作为特征量而提供的、要被处理的在帧J的低频侧的每个子带的低频子带功率power(ib,J)进行平滑。
[数学表达式31]
power smooth ( ib , J ) = &Sigma; ti = 0 ns - 1 ( power ( ib , J - ti ) &CenterDot; SC ( ti ) ) . . . ( 31 )
注意,在表达式(31)中,ns是用作平滑参数的帧数目ns,并且此帧数目ns越大,用于作为特征量的低频子带功率的平滑的帧越多。另外,假定在平滑单元122中保存在帧J之前的若干个帧值的子带的低频子带功率。
另外,例如与低频子带功率power(ib,J)相乘的权重SC(1)是通过下述表达式(32)所确定的权重。用于各个帧的权重SC(1)具有与要被处理的、在时域上接近帧J的帧相乘的权重SC(1)一样大的值。
[数学表达式32]
SC ( l ) = cos ( 2 &CenterDot; &pi; &CenterDot; l 4 &CenterDot; ns ) &Sigma; li = 0 ns - 1 cos ( 2 &CenterDot; &pi; &CenterDot; li 4 &CenterDot; ns ) . . . ( 32 )
因此,采用平滑单元122,通过以权重SC(1)对要由包括当前帧J的帧数目ns确定的低频子带功率的过去的ns帧值执行加权和来对特征量进行平滑。具体地,获得从帧J到帧(J-ns+1)的相同的子带的低频子带功率的加权平均值作为平滑之后的低频子带功率powersmooth(ib,J)。
在此,要用于平滑的帧数目ns越大,则低频子带功率powersmooth(ib,J)的时域波动越小。因此,如果使用低频子带功率powersmooth(ib,J)来估计在高频侧的子带功率,则可以减小在高频侧的子带功率的估计值的时域波动。
但是,对于瞬时输入信号(诸如打击等),即,其高频分量的时域波动较大的输入信号,除非帧数目ns被设置为尽可能小的值,否则对于输入信号的时域改变的追踪将被延时。结果,通过解码侧,当播放通过解码而获得的输出信号时,可能导致可听性中的不自然感。
因此,通过参数确定单元121,如果以上提及的子带功率和的差等于或大于阈值,则输入信号被认为是瞬时信号(其中在高频侧的子带功率的时域波动极大),并且帧数目被确定为较小的值(例如,ns=4)。因此,即使当输入信号为瞬时信号(具有打击的音乐)时,也可以合适地对低频子带功率进行平滑,减少在高频侧的子带功率的估计值的时域波动,以及另外,可以抑制对于高频分量中的改变的追踪的延时。
另一方面,如果子带功率和的差小于阈值,则通过参数确定单元121,输入信号被认为是具有在高频侧的子带的较少的时域波动的恒定信号,并且帧数目ns被确定为较大的值(例如,ns=16)。因此,合适地对低频子带功率进行平滑,并且可以减少在高频侧的子带功率的估计值的时域波动
在步骤S477中,拟似高频子带功率计算电路35基于从平滑单元122所提供的子低频侧的每个子带的低频子带功率powersmooth(ib,J)来计算拟似高频子带功率,并且将其提供至拟似高频子带功率差计算电路36。
例如,拟似高频子带功率计算电路35使用作为高频子带功率估计系数而预先记录的系数Aib(kb)和系数Bib和低频子带功率powersmooth(ib,J)(但是,sb-3≤ib≤eb)来执行以上提及的表达式(2)的计算以计算拟似高频子带功率powerest(ib,J)。
注意,这里,在表达式(2)中的低频子带功率power(kb,J)被替换为平滑的低频子带功率powersmooth(kb,J)(但是,sb-3≤kb≤eb)。
具体地,将在低频侧的每个子带的低频子带功率powersmooth(kb,J)乘以用于每个子带的系数Aib(kb),并且此外,将系数Bib相加至低频子带功率与系数的乘积的和,以及将其作为拟似高频子带功率powerest(ib,J)。关于在高频侧的指标为sb+1至eb的子带来计算此拟似高频子带功率。
另外,拟似高频子带功率计算电路35对于预先记录的每个解码高频子带功率估计系数来执行拟似高频子带功率的计算。具体地,关于所有的记录的系数群组,对于系数群组的每个系数集合(系数Aib(kb)和系数Bib)执行拟似高频子带功率的计算。
在步骤S478中,拟似高频子带功率差计算电路36基于来自子带分割电路33的高频子带信号和来自拟似高频子带功率计算电路35的拟似高频子带功率来计算拟似高频子带功率差。
在步骤S479中,拟似高频子带功率差计算电路36对于每个解码高频子带功率估计系数来计算以上提及的表达式(15)以计算拟似高频子带功率差的平方的和(差的平方和E(J,id))。
注意,在步骤S478和步骤S479中的处理与在图19中的步骤S186和步骤S187中的处理相同,并且因此,将省略对其的详细描述。
当对于预先记录的每个解码高频子带功率估计系数来计算差的平方和E(J,id)时,拟似高频子带功率差电路36在其差的平方和中选择值变为最小的差的平方和。
拟似高频子带差计算电路36然后将用于识别对应于所选择的差的平方和的解码高频子带功率估计系数的系数指标和系数群组指标、以及指示平滑参数的平滑信息提供至高频解码电路37。
在此,平滑信息可以是由参数确定单元121所确定的、用作平滑参数的帧数目ns的自身的值,或可以是指示帧数目ns的标志等。例如,如果采取指示帧数目ns的2比特标志作为平滑信息,则当帧数目n=1时标志的值被设置为0;当帧数目ns=4时标志的值被设置为1;当帧数目ns=8时标志的值被设置为2;以及当帧数目ns=16时标志的值被设置为3。
在步骤S480中,高频编码电路37对来自拟似高频子带功率差计算电路36的系数群组指标、系数指标以及平滑信息进行编码,并且将作为其结果而获得的高频编码数据提供至复用电路38。
例如,在步骤S480中,对于系数群组指标、系数指标以及平滑信息执行熵编码等。注意,高频编码数据可以是任何一种信息,只要数据是可以从其中获得最优的解码高频子带功率估计系数或最优的平滑参数的信息,例如,可以采取系数群组指标等作为高频编码数据而不进行改变。
在步骤S481中,复用电路38对从低频编码电路32所提供的低频编码数据和从高频编码电路37所提供的高频编码数据进行复用,将作为其结果而获得的输出代码串输出,以及结束编码处理。
以此方式,通过对系数群组指标、系数指标以及平滑信息进行编码而获得的高频编码数据被作为输入代码串而输出,借此接收此输出代码串的输入的解码装置40可以以较高的精确度来估计高频分量。
具体地,基于系数群组指标和系数指标,可以在多个编码高频子带功率估计系数中,获得对于频带扩展处理最合适的系数,并且可以与编码系统或编码算法无关地以高精确度对高频分量进行估计。此外,如果根据平滑信息对用作特征量的低频子带功率进行平滑,则可以减小通过估计而获得的高频分量的时域波动,并且无论输入信号是常量还是瞬时的都可以获得在可听性上不存在不自然感的音频。
[解码装置的功能配置的示例]
另外,例如,将从图30中的编码装置30所输出的输出代码串作为输入代码串而输入的解码装置40如图32所示地进行配置。注意,用相同的附图标记来表示对应于图20中的情况的部分,并且省略对其的描述。
图32中的解码装置40与图20中的解码装置40的不同之处在于新设置了平滑单元151,并且其它部分保持相同。
通过图32中的解码装置40,高频解码电路45预先记录与图30中的拟似高频子带功率计算电路35所记录的解码高频子带功率估计系数相同的解码高频子带功率估计系数。具体地,以与系数群组指标和系数指标相关的方式记录通过回归分析而预先获得的、用作解码高频子带功率估计系数的系数Aib(kb)和系数Bib的集合。
高频解码电路45对从复用电路41所提供的高频编码数据进行解码,并且作为其结果,获得系数群组指标、系数指标以及平滑信息。高频解码电路45将从所获得的系数群组指标和系数指标中所识别的解码高频子带功率估计系数提供至解码高频子带功率计算电路46,并且还将平滑信息提供至平滑单元151。
另外,特征量计算电路44将作为特征量而计算出的低频子带功率提供至平滑单元151。平滑单元15依照来自高频解码电路45的平滑信息对从特征量计算单元44所提供的低频子带功率进行平滑,并且将其提供至解码高频子带功率计算电路46。
[解码装置的解码处理]
接下来,将参照图33中的流程图描述要由图32中的解码装置40执行的解码处理。
当从编码装置30所输出的输出代码串被作为输入代码串提供至解码装置40时,此解码处理开始。注意,步骤S511和步骤S513中的处理与图21中的步骤S211和步骤S213中的处理相同,并且因此,将省略对其的描述。
在步骤S514中,高频解码电路45对从解复用电路41所提供的高频编码数据执行解码。
高频解码电路45将在已经记录的多个解码高频子带功率估计系数中,由通过对高频编码数据进行解码而获得的系数群组指标和系数指标所指示的解码高频子带功率估计系数提供至解码高频子带功率计算电路46。另外,高频解码电路45将通过对高频编码数据进行解码而获得的平滑信息提供至平滑单元151。
在步骤S515中,特征量计算电路44使用来自子带分割电路43的解码低频子带信号来计算特征量,并且将其提供至平滑单元151。具体地,根据以上提及的表达式(1)的计算,关于在低频侧的每个子带ib来计算作为特征量的低频子带功率power(ib,J)。
在步骤S516中,平滑单元151基于从高频解码电路45所提供的平滑信息对从特征量计算电路44所提供的作为特征量的低频子带功率power(ib,J)进行平滑。
具体地,平滑单元151基于由平滑信息所指示的帧数目ns来执行以上提及的表达式(31)的计算,以关于在低频侧的每个子带ib来计算低频子带功率powersmooth(ib,J),并且将其提供至解码高频子带功率计算电路46。现在,假定在帧J之前的若干个帧的子带的低频子带功率被保存在平滑单元151中。
在步骤S517中,解码高频子带功率计算电路46基于来自平滑单元151的低频子带功率和来自高频解码电路45的解码高频子带功率估计系数来计算解码高频子带功率,并且将其提供至解码高频信号生成电路47。
具体地,解码高频子带功率计算电路46使用用作解码高频子带估计系数的系数Aib(kb)和系数Bib和低频子带功率powersmooth(ib,J)来执行以上提及的表达式(2)的计算以计算解码高频子带功率。
注意,在表达式(2)中的低频子带功率power(kb,J)被替换为平滑后的低频子带功率powersmooth(kb,J)(但是,sb-3≤kb≤eb)。根据此计算,关于在高频侧的指标为sb+1至eb的每个子带获得解码高频子带功率powerest(ib,J)。
在步骤S518中,解码高频信号生成电路47基于从子带分割电路43所提供的解码低频子带信号和从解码高频子带功率计算电路46所提供的解码高频子带功率来生成解码高频信号。
具体地,解码高频信号生成电路47使用解码低频子带信号执行以上提及的表达式(1)的计算以关于在低频侧的每个子带来计算低频子带功率。解码高频信号生成电路47然后使用所获得的低频子带功率和解码高频子带功率来执行以上提及的表达式(3)的计算以对于在高频侧的每个子带计算增益量G(ib,J)。
另外,解码高频信号生成电路47使用增益量G(ib,J)和解码低频子带信号来执行以上提及的表达式(5)和表达式(6)的计算以关于在高频侧的每个子带生成高频子带信号x3(ib,n)。
此外,解码高频信号生成电路47执行以上提及的表达式(7)的计算以获得所获得的高频子带信号的和,并且生成解码高频信号。解码高频信号生成电路47将所获得的解码高频信号提供至合成电路48,并且处理从步骤S518继续至步骤S519。
在步骤S519,合成电路48对来自低频解码电路42的解码低频信号和来自解码高频信号生成电路47的解码高频信号进行合成,并且将其作为输出信号而输出。之后,结束解码处理。
如上所述,根据解码装置40,使用由从高频编码数据所获得的系数群组指标和系数指标所指示的解码高频子带功率估计系数来计算解码高频子带功率,借此可以改进高频子带功率的估计精确度。具体地,借以能够处理编码系统或编码算法之间的差异的多个解码高频子带功率估计系数被预先记录在解码装置40中。因此,在这些系数中,选择并且使用由系数群组指标和系数指标所指示的最优的解码高频子带功率估计系数,借此可以以高精确度估计高频分量。
另外,通过解码装置40,依照平滑信息对低频子带功率进行平滑以计算解码高频子带功率。因此,高频包络线的时域波动可以被抑制为很小,并且无论输入信号是恒定的还是瞬时的都可以获得在可听性中不存在不自然感的音频。
尽管目前为止描述了其中帧数目ns作为平滑参数而发生改变,但是,以帧数目ns作为固定值,在平滑时与低频子带功率相乘的权重SC(1)可以被用作平滑参数。在这样的情况下,参数确定单元121将权重SC(1)作为平滑参数而改变,由此改变平滑特征。
以此方式,权重SC(1)也被取为平滑参数,借此对于在解码侧的常量恒定的信号或瞬时输入信号可以合适地抑制高频包络线的时域波动。
例如,如果采取表达式(31)中的权重SC(1)作为要由下述表达式(33)中所示的函数所确定的权重,则相比于采用在表达式(32)中所指示的权重的情况可以改进对于更多瞬时信号的追踪程度。
[数学表达式33]
SC ( l ) = cos ( 2 &CenterDot; &pi; &CenterDot; l 4 &CenterDot; ns ) &Sigma; li = 0 ns - 1 cos ( 2 &CenterDot; &pi; &CenterDot; li 4 &CenterDot; ns ) . . . ( 33 )
注意,在表达式(33)中,ns指示要用于平滑的输入信号的帧数目ns。
如果采取SC(1)作为平滑参数,则参数确定单元121基于高频子带信号确定用作平滑参数的权重SC(1)。将指示用作平滑参数的权重SC(1)的平滑信息作为高频编码数据,并且其被发送至解码装置40。
也是在此情况下,例如,权重SC(1)的自身值,即权重SC(0)至权重(ns-1),可以被作为平滑信息,或多个权重SC(1)被预先准备,并且在这些权重中,可以采取指示所选择的SC(1)的指标作为平滑信息。
通过解码装置40,使用通过对高频编码数据进行解码而获得的并且通过平滑信息所识别的权重SC(1)来执行低频子带功率的平滑。此外,权重SC(1)和帧数目ns二者均被作为平滑参数,并且指示权重SC(1)的指标和指示帧数目ns的标志等均被作为平滑信息。
此外,尽管关于应用第三实施例作为示例的情况(其中,预先准备多个系数群组,并且对用作特征量的低频子带功率进行平滑)进行了描述,但是此示例也可以应用到以上提及的第一实施例至第五实施例中的任何一个。即,通过将此示例应用至的任何一个实施例的情况同样地,依照平滑参数对特征量进行平滑,并使用平滑之后的特征量来计算在高频侧的每个子带的子带功率的估计值。
以上提及的处理序列可以不仅由硬件并且也可以由软件所执行。如果使用软件执行处理序列,则构成其软件的程序被从程序记录介质安装到被构建为专用硬件的计算机,或例如通用个人计算机等,从而可以通过安装各种程序凭借执行各种功能)。
图34是示出使用程序执行以上提及的处理序列的计算机的硬件的配置示例。
采用计算机,通过总线504将CPU 501、ROM(只读存储器)502、以及RAM(随机访问存储器)互相连接。
此外,输入/输出接口505连接至总线504。在输入/输出接口505上连接有:由键盘、鼠标、扩音器等构成的输入单元506;由显示器、扬声器等构成的输出单元507;由硬盘、非易失性存储器等构成的存储单元508;由网络接口等构成的通信单元509;以及驱动可移除介质511(诸如磁盘、光盘、磁光盘、半导体存储器等)的驱动器510。
采用由此而配置的计算机,将存储单元508中所存储的程序经由输入/输出接口505和总线504载入到RAM 503通过CPU 501执行以上提及的处理序列,并且执行此程序。
计算机(CPU 501)所执行的程序是通过记录在可移除介质511中而提供的,可移除介质511是由例如磁盘(包括软盘)、光盘(CD-ROM(光盘只读存储器)、DVD(数字通用光盘)等)、磁光盘、半导体存储器等构成的封装介质;或是经由线缆或无线传输介质而提供的,诸如,局域网、因特网、数字卫星广播等。
程序可以通过将可移除介质511挂载在驱动器510上而经由输入/输出接口505安装在存储单元508上。另外,程序可以经由线缆或无线传输介质而在通信单元509处接收。额外地,程序可以预先地安装在ROM 502或存储单元508中。
注意,计算机所执行的程序可以是以本说明书中所描述的按顺序的时间序列方式而执行的程序,或是并行执行的程序,或是在需要时(诸如调用时)执行的程序等。
注意,本发明的实施例不限于以上提及的实施例,并且可以进行各种修改而不背离本发明的实质。
参考标记列表
10   频带扩展装置
11   低通滤波器
12   延时电路
13、13-1至13-N 带通滤波器
14   特征量计算电路
15   高频子带功率估计电路
16   高频信号生成电路
17   高通滤波器
18   信号加法器
20   系数学习装置
21、21-1至21-(K+N) 带通滤波器
22   高频子带功率计算电路
23   特征量计算电路
24   系数估计电路
30   编码装置
31   低通滤波器
32   低频编码电路
33   子带分割电路
34   特征量计算电路
35   拟似高频子带功率计算电路
36   拟似高频子带功率差计算电路
37   高频编码电路
38   复用电路
40   解码装置
41   解复用电路
42   低频解码电路
43   子带分割电路
44   特征量计算电路
45   高频解码电路
46   解码高频子带功率计算电路
47   解码高频子带信号生成电路
48   合成电路
50   系数学习装置
51   低通滤波器
52   子带分割电路
53   特征量计算电路
55   拟似高频子带功率计算电路
56   拟似高频子带功率差计算电路
57   系数估计电路
121  参数确定单元
122  平滑单元
151  平滑单元

Claims (13)

1.一种音乐信号编码装置,包括:
子带分割部件,被配置成将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号;
特征量计算部件,被配置成基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量;
平滑部件,被配置成对所述特征量进行平滑;
拟似高频子带功率计算部件,被配置成基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值;
选择部件,被配置成根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个;
高频编码部件,被配置成对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关;
低频编码部件,被配置成对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及
复用部件,被配置成对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。
2.根据权利要求1所述的音乐信号编码装置,其中,所述平滑部件通过对所述输入信号的预定数目的连续帧的特征量执行加权平均来对所述特征量进行平滑。
3.根据权利要求2所述的音乐信号编码装置,其中,所述平滑信息是指示用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个的信息。
4.根据权利要求3所述的音乐信号编码装置,进一步包括:
参数确定部件,被配置成基于所述高频子带信号来确定用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个。
5.根据权利要求1所述的音乐信号编码装置,其中,以从宽带监视信号获得的所述特征量和所述高频子带功率作为解释变量和被解释变量,通过学习生成所述系数。
6.根据权利要求5所述的音乐信号编码装置,其中,所述宽带监视信号是通过依照编码方法和编码算法对预定的信号进行编码并且对编码后的预定信号进行解码而获得的信号;
并且其中,对于多个不同的编码方法和编码算法中的每一个,使用所述宽带监视信号通过学习生成所述系数。
7.一种音乐信号编码方法,包括如下步骤:
将输入信号分割成多个子带,并且生成由低频侧的多个子带构成的低频子带信号和由高频侧的多个子带构成的高频子带信号;
基于所述低频子带信号和所述输入信号中的至少任意一个,计算代表所述输入信号的特征的特征量;
对所述特征量进行平滑;
基于平滑后的特征量和预定的系数来计算拟似高频子带功率,所述拟似高频子带功率是所述高频子带信号的功率的估计值;
根据所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并且将所述高频子带功率与所述拟似高频子带功率进行比较以选择多个所述系数中的任意一个;
对系数信息和平滑信息进行编码以生成高频编码数据,所述系数信息用于获得所选择的系数,所述平滑信息与所述平滑相关;
对低频信号进行编码以生成低频编码数据,所述低频信号是所述输入信号的低频信号;以及
对所述低频编码数据和所述高频编码数据进行复用以获得输出代码串。
8.一种音乐信号解码装置,包括:
解复用部件,被配置成将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息;
低频解码部件,被配置成对所述低频编码数据进行解码以生成低频信号;
子带分割部件,被配置成将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号;
特征量计算部件,被配置成基于所述低频子带信号来计算特征量;
平滑部件,被配置成基于所述平滑信息对所述特征量进行平滑;
高频子带功率计算部件,被配置成基于平滑后的特征量和从所述系数信息所获得的所述系数来计算高频子带功率,所述高频子带功率是构成高频信号的子带功率的估计值,以及
高频信号生成部件,被配置成基于所述高频子带功率和所述低频子带信号来生成所述高频信号。
9.根据权利要求8所述的音乐信号解码装置,其中,所述平滑部件通过对所述低频信号的预定数目的连续帧的特征量执行加权平均来对所述特征量进行平滑。
10.根据权利要求9所述的音乐信号解码装置,其中,所述平滑信息是指示用于所述加权平均的所述帧的数目和用于所述加权平均的权重中的至少一个的信息。
11.根据权利要求8所述的音乐信号解码装置,其中,以从宽带监视信号获得的所述特征量和与构成所述宽带监视信号的高频信号的子带相同的子带的功率作为解释变量和被解释变量,通过学习生成所述系数。
12.根据权利要求11所述的音乐信号解码装置,其中,所述宽带监视信号是依照预定的编码方法和编码算法对预定的信号进行编码并且对编码后的预定信号进行解码而获得的信号;
并且其中,对于多个不同的编码方法和编码算法中的每一个,使用所述宽带监视信号通过学习生成所述系数。
13.一种音乐信号解码方法,包括如下步骤:
将输入编码数据解复用为低频编码数据、用于获得系数的系数信息以及与平滑相关的平滑信息;
对所述低频编码数据进行解码以生成低频信号;
将所述低频信号分割为多个子带以生成用于所述子带中的每个子带的低频子带信号;
基于所述低频子带信号计算特征量;
基于所述平滑信息对所述特征量进行平滑;
基于平滑后的特征量和从所述系数信息所获得的所述系数来计算高频子带功率,所述高频子带功率是构成高频信号的子带功率的估计值;以及
基于所述高频子带功率和所述低频子带信号来生成所述高频信号。
CN201180048799.6A 2010-10-15 2011-10-05 音乐信号编码装置和方法以及音乐信号解码装置和方法 Active CN103155031B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2010-232106 2010-10-15
JP2010232106A JP5707842B2 (ja) 2010-10-15 2010-10-15 符号化装置および方法、復号装置および方法、並びにプログラム
PCT/JP2011/072957 WO2012050023A1 (ja) 2010-10-15 2011-10-05 符号化装置および方法、復号装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
CN103155031A CN103155031A (zh) 2013-06-12
CN103155031B true CN103155031B (zh) 2015-04-01

Family

ID=45938252

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180048799.6A Active CN103155031B (zh) 2010-10-15 2011-10-05 音乐信号编码装置和方法以及音乐信号解码装置和方法

Country Status (13)

Country Link
US (4) US9177563B2 (zh)
EP (3) EP3579230B1 (zh)
JP (1) JP5707842B2 (zh)
KR (2) KR101979557B1 (zh)
CN (1) CN103155031B (zh)
AR (1) AR083365A1 (zh)
AU (1) AU2011314848B2 (zh)
BR (1) BR112013008490B1 (zh)
CA (1) CA2811085C (zh)
MX (1) MX2013003952A (zh)
RU (2) RU2630384C1 (zh)
TW (1) TWI479481B (zh)
WO (1) WO2012050023A1 (zh)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5975243B2 (ja) * 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
KR20150032614A (ko) * 2012-06-04 2015-03-27 삼성전자주식회사 오디오 부호화방법 및 장치, 오디오 복호화방법 및 장치, 및 이를 채용하는 멀티미디어 기기
US10083700B2 (en) 2012-07-02 2018-09-25 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
JP6305694B2 (ja) * 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
US9489959B2 (en) * 2013-06-11 2016-11-08 Panasonic Intellectual Property Corporation Of America Device and method for bandwidth extension for audio signals
WO2015036348A1 (en) 2013-09-12 2015-03-19 Dolby International Ab Time- alignment of qmf based processing data
WO2015041477A1 (ko) * 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program
EP3062534B1 (en) 2013-10-22 2021-03-03 Electronics and Telecommunications Research Institute Method for generating filter for audio signal and parameterizing device therefor
US9524720B2 (en) * 2013-12-15 2016-12-20 Qualcomm Incorporated Systems and methods of blind bandwidth extension
WO2015099430A1 (ko) 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序
US9832585B2 (en) 2014-03-19 2017-11-28 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and apparatus
WO2015152663A2 (ko) 2014-04-02 2015-10-08 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP3818528A1 (en) * 2018-07-03 2021-05-12 Soclip! Beat decomposition to facilitate automatic video editing
KR20200142787A (ko) 2019-06-13 2020-12-23 네이버 주식회사 멀티미디어 신호 인식을 위한 전자 장치 및 그의 동작 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1822508A (zh) * 2005-01-19 2006-08-23 三星电子株式会社 对数字信号进行编码和解码的方法和设备
CN1849648A (zh) * 2003-09-16 2006-10-18 松下电器产业株式会社 编码装置和译码装置
CN101178898A (zh) * 2006-11-09 2008-05-14 索尼株式会社 频带扩展装置及方法、播放装置、方法、程序及记录介质
CN101836254A (zh) * 2008-08-29 2010-09-15 索尼公司 频带扩大装置和方法、编码装置和方法、解码装置和方法及程序

Family Cites Families (176)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
JPH03254223A (ja) 1990-03-02 1991-11-13 Eastman Kodak Japan Kk アナログデータ伝送方式
JP2655485B2 (ja) 1994-06-24 1997-09-17 日本電気株式会社 音声セル符号化装置
JP3498375B2 (ja) 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
JP3189598B2 (ja) * 1994-10-28 2001-07-16 松下電器産業株式会社 信号合成方法および信号合成装置
JPH1020888A (ja) 1996-07-02 1998-01-23 Matsushita Electric Ind Co Ltd 音声符号化・復号化装置
US6073100A (en) 1997-03-31 2000-06-06 Goodridge, Jr.; Alan G Method and apparatus for synthesizing signals using transform-domain match-output extension
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6415251B1 (en) 1997-07-11 2002-07-02 Sony Corporation Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
EP1126620B1 (en) 1999-05-14 2005-12-21 Matsushita Electric Industrial Co., Ltd. Method and apparatus for expanding band of audio signal
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
JP3454206B2 (ja) 1999-11-10 2003-10-06 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
JP4231987B2 (ja) 2001-06-15 2009-03-04 日本電気株式会社 音声符号化復号方式間の符号変換方法、その装置、そのプログラム及び記憶媒体
JP2004521394A (ja) 2001-06-28 2004-07-15 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 広帯域信号伝送システム
EP1351401B1 (en) 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
DE60214027T2 (de) * 2001-11-14 2007-02-15 Matsushita Electric Industrial Co., Ltd., Kadoma Kodiervorrichtung und dekodiervorrichtung
ES2237706T3 (es) 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
EP1470550B1 (en) 2002-01-30 2008-09-03 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
JP2003255973A (ja) 2002-02-28 2003-09-10 Nec Corp 音声帯域拡張システムおよび方法
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP2003316394A (ja) 2002-04-23 2003-11-07 Nec Corp 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7555434B2 (en) 2002-07-19 2009-06-30 Nec Corporation Audio decoding device, decoding method, and program
JP4728568B2 (ja) 2002-09-04 2011-07-20 マイクロソフト コーポレーション レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
DE60303689T2 (de) 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
US7330812B2 (en) 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
AU2003219430A1 (en) 2003-03-04 2004-09-28 Nokia Corporation Support of a multichannel audio extension
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050004793A1 (en) 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
KR20050027179A (ko) 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7844451B2 (en) 2003-09-16 2010-11-30 Panasonic Corporation Spectrum coding/decoding apparatus and method for reducing distortion of two band spectrums
EP2221807B1 (en) 2003-10-23 2013-03-20 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
KR100587953B1 (ko) 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
EP2991075B1 (en) 2004-05-14 2018-08-01 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
CN102280109B (zh) 2004-05-19 2016-04-27 松下电器(美国)知识产权公司 编码装置、解码装置及它们的方法
WO2006000842A1 (en) 2004-05-28 2006-01-05 Nokia Corporation Multichannel audio extension
KR100608062B1 (ko) 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US20060106620A1 (en) 2004-10-28 2006-05-18 Thompson Jeffrey K Audio spatial environment down-mixer
SE0402651D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
RU2404506C2 (ru) 2004-11-05 2010-11-20 Панасоник Корпорэйшн Устройство масштабируемого декодирования и устройство масштабируемого кодирования
BRPI0517716B1 (pt) 2004-11-05 2019-03-12 Panasonic Intellectual Property Management Co., Ltd. Aparelho de codificação, aparelho de decodificação, método de codificação e método de decodificação.
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
JP5224017B2 (ja) * 2005-01-11 2013-07-03 日本電気株式会社 オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
KR100708121B1 (ko) 2005-01-22 2007-04-16 삼성전자주식회사 음성 신호의 대역 확장 방법 및 장치
NZ562183A (en) 2005-04-01 2010-09-30 Qualcomm Inc Systems, methods, and apparatus for highband excitation generation
EP1829424B1 (en) 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
US20070005351A1 (en) 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
JP4899359B2 (ja) 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR100813259B1 (ko) 2005-07-13 2008-03-13 삼성전자주식회사 입력신호의 계층적 부호화/복호화 장치 및 방법
WO2007026821A1 (ja) 2005-09-02 2007-03-08 Matsushita Electric Industrial Co., Ltd. エネルギー整形装置及びエネルギー整形方法
WO2007037361A1 (ja) * 2005-09-30 2007-04-05 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
CN101283407B (zh) 2005-10-14 2012-05-23 松下电器产业株式会社 变换编码装置和变换编码方法
BRPI0520729B1 (pt) 2005-11-04 2019-04-02 Nokia Technologies Oy Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
EP1959433B1 (en) 2005-11-30 2011-10-19 Panasonic Corporation Subband coding apparatus and method of coding subband
JP4876574B2 (ja) 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP4863713B2 (ja) 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
RU2414009C2 (ru) * 2006-01-18 2011-03-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ для кодирования и декодирования сигнала
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7590523B2 (en) 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US20090248407A1 (en) 2006-03-31 2009-10-01 Panasonic Corporation Sound encoder, sound decoder, and their methods
ATE501505T1 (de) 2006-04-27 2011-03-15 Panasonic Corp Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür
EP2200026B1 (en) 2006-05-10 2011-10-12 Panasonic Corporation Encoding apparatus and encoding method
JP2007316254A (ja) 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
KR20070115637A (ko) 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
JP2007333785A (ja) 2006-06-12 2007-12-27 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置およびオーディオ信号符号化方法
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
KR101244310B1 (ko) 2006-06-21 2013-03-18 삼성전자주식회사 광대역 부호화 및 복호화 방법 및 장치
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
JP5061111B2 (ja) 2006-09-15 2012-10-31 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4918841B2 (ja) 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8295507B2 (en) 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
JP4930320B2 (ja) 2006-11-30 2012-05-16 ソニー株式会社 再生方法及び装置、プログラム並びに記録媒体
US8560328B2 (en) 2006-12-15 2013-10-15 Panasonic Corporation Encoding device, decoding device, and method thereof
JP4984983B2 (ja) 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
JP2008261978A (ja) 2007-04-11 2008-10-30 Toshiba Microelectronics Corp 再生音量自動調整方法
US8015368B2 (en) 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
KR101355376B1 (ko) 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
JP5434592B2 (ja) 2007-06-27 2014-03-05 日本電気株式会社 オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
JP5071479B2 (ja) * 2007-07-04 2012-11-14 富士通株式会社 符号化装置、符号化方法および符号化プログラム
JP5045295B2 (ja) 2007-07-30 2012-10-10 ソニー株式会社 信号処理装置及び方法、並びにプログラム
US8041577B2 (en) 2007-08-13 2011-10-18 Mitsubishi Electric Research Laboratories, Inc. Method for expanding audio signal bandwidth
PL2186090T3 (pl) 2007-08-27 2017-06-30 Telefonaktiebolaget Lm Ericsson (Publ) Detektor stanów przejściowych i sposób wspierający kodowanie sygnału audio
EP2571024B1 (en) 2007-08-27 2014-10-22 Telefonaktiebolaget L M Ericsson AB (Publ) Adaptive transition frequency between noise fill and bandwidth extension
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
CN101868823B (zh) 2007-10-23 2011-12-07 歌乐株式会社 高频插值装置和高频插值方法
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
JP4733727B2 (ja) 2007-10-30 2011-07-27 日本電信電話株式会社 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体
JP5404412B2 (ja) 2007-11-01 2014-01-29 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
US20090132238A1 (en) 2007-11-02 2009-05-21 Sudhakar B Efficient method for reusing scale factors to improve the efficiency of an audio encoder
RU2449386C2 (ru) 2007-11-02 2012-04-27 Хуавэй Текнолоджиз Ко., Лтд. Способ и устройство для аудиодекодирования
EP2220646A1 (en) 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof
JP2009116275A (ja) 2007-11-09 2009-05-28 Toshiba Corp 雑音抑圧、音声スペクトル平滑化、音声特徴抽出、音声認識及び音声モデルトレーニングための方法及び装置
WO2009066960A1 (en) 2007-11-21 2009-05-28 Lg Electronics Inc. A method and an apparatus for processing a signal
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
EP2224432B1 (en) 2007-12-21 2017-03-15 Panasonic Intellectual Property Corporation of America Encoder, decoder, and encoding method
WO2009084221A1 (ja) 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
ATE500588T1 (de) 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
US8422569B2 (en) 2008-01-25 2013-04-16 Panasonic Corporation Encoding device, decoding device, and method thereof
KR101413968B1 (ko) 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2259253B1 (en) 2008-03-03 2017-11-15 LG Electronics Inc. Method and apparatus for processing audio signal
KR101449434B1 (ko) 2008-03-04 2014-10-13 삼성전자주식회사 복수의 가변장 부호 테이블을 이용한 멀티 채널 오디오를부호화/복호화하는 방법 및 장치
EP2104096B1 (en) 2008-03-20 2020-05-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
KR20090122142A (ko) 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2009154797A2 (en) 2008-06-20 2009-12-23 Rambus, Inc. Frequency responsive bus coding
EP4372745A1 (en) 2008-07-11 2024-05-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
CA2730198C (en) 2008-07-11 2014-09-16 Frederik Nagel Audio signal synthesizer and audio signal encoder
JP5203077B2 (ja) 2008-07-14 2013-06-05 株式会社エヌ・ティ・ティ・ドコモ 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法
WO2010016271A1 (ja) 2008-08-08 2010-02-11 パナソニック株式会社 スペクトル平滑化装置、符号化装置、復号装置、通信端末装置、基地局装置及びスペクトル平滑化方法
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8532983B2 (en) 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8407046B2 (en) 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
CN101770776B (zh) 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
ES2966639T3 (es) 2009-01-16 2024-04-23 Dolby Int Ab Transposición armónica mejorada de producto cruzado
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
JP4945586B2 (ja) 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
EP2402940B9 (en) 2009-02-26 2019-10-30 Panasonic Intellectual Property Corporation of America Encoder, decoder, and method therefor
JP5564803B2 (ja) 2009-03-06 2014-08-06 ソニー株式会社 音響機器及び音響処理方法
CN101853663B (zh) 2009-03-30 2012-05-23 华为技术有限公司 比特分配方法、编码装置及解码装置
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
JP5223786B2 (ja) 2009-06-10 2013-06-26 富士通株式会社 音声帯域拡張装置、音声帯域拡張方法及び音声帯域拡張用コンピュータプログラムならびに電話機
US8515768B2 (en) 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5928539B2 (ja) 2009-10-07 2016-06-01 ソニー株式会社 符号化装置および方法、並びにプログラム
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8600749B2 (en) 2009-12-08 2013-12-03 At&T Intellectual Property I, L.P. System and method for training adaptation-specific acoustic models for automatic speech recognition
US8447617B2 (en) 2009-12-21 2013-05-21 Mindspeed Technologies, Inc. Method and system for speech bandwidth extension
EP2357649B1 (en) 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
TWI447709B (zh) 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
JP5375683B2 (ja) 2010-03-10 2013-12-25 富士通株式会社 通信装置および電力補正方法
JP5598536B2 (ja) 2010-03-31 2014-10-01 富士通株式会社 帯域拡張装置および帯域拡張方法
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103069484B (zh) 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
US8560330B2 (en) 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
KR102304093B1 (ko) 2010-07-19 2021-09-23 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP2012058358A (ja) 2010-09-07 2012-03-22 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012052802A1 (en) 2010-10-18 2012-04-26 Nokia Corporation An audio encoder/decoder apparatus
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5704397B2 (ja) 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
JP6024077B2 (ja) 2011-07-01 2016-11-09 ヤマハ株式会社 信号送信装置および信号処理装置
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6037156B2 (ja) 2011-08-24 2016-11-30 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5975243B2 (ja) 2011-08-24 2016-08-23 ソニー株式会社 符号化装置および方法、並びにプログラム
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
RU2584009C2 (ru) 2011-09-29 2016-05-20 Долби Интернешнл Аб Обнаружение высокого качества в стереофонических радиосигналах с частотной модуляцией
CN104205210A (zh) 2012-04-13 2014-12-10 索尼公司 解码设备和方法、音频信号处理设备和方法以及程序
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
EP2741286A4 (en) 2012-07-02 2015-04-08 Sony Corp DECODING DEVICE AND METHOD, CODING DEVICE AND METHOD AND PROGRAM
US10083700B2 (en) 2012-07-02 2018-09-25 Sony Corporation Decoding device, decoding method, encoding device, encoding method, and program
EP2743921A4 (en) 2012-07-02 2015-06-03 Sony Corp DEVICE AND METHOD FOR DECODING, DEVICE AND METHOD FOR CODING AND PROGRAM
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
JP2014123011A (ja) 2012-12-21 2014-07-03 Sony Corp 雑音検出装置および方法、並びに、プログラム
EP3048609A4 (en) 2013-09-19 2017-05-03 Sony Corporation Encoding device and method, decoding device and method, and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1849648A (zh) * 2003-09-16 2006-10-18 松下电器产业株式会社 编码装置和译码装置
CN1822508A (zh) * 2005-01-19 2006-08-23 三星电子株式会社 对数字信号进行编码和解码的方法和设备
CN101178898A (zh) * 2006-11-09 2008-05-14 索尼株式会社 频带扩展装置及方法、播放装置、方法、程序及记录介质
CN101836254A (zh) * 2008-08-29 2010-09-15 索尼公司 频带扩大装置和方法、编码装置和方法、解码装置和方法及程序

Also Published As

Publication number Publication date
US20130208902A1 (en) 2013-08-15
US20170352365A1 (en) 2017-12-07
US20170076737A1 (en) 2017-03-16
EP3579230A1 (en) 2019-12-11
CN103155031A (zh) 2013-06-12
WO2012050023A1 (ja) 2012-04-19
EP2608199A1 (en) 2013-06-26
EP3579230B1 (en) 2023-06-07
JP5707842B2 (ja) 2015-04-30
EP2608199A4 (en) 2016-04-20
CA2811085C (en) 2019-01-08
EP2608199B1 (en) 2019-08-21
BR112013008490B1 (pt) 2021-06-22
RU2013115770A (ru) 2014-10-20
EP4220638A1 (en) 2023-08-02
KR20130141478A (ko) 2013-12-26
RU2589293C2 (ru) 2016-07-10
AU2011314848B2 (en) 2014-11-20
RU2630384C1 (ru) 2017-09-07
US20160012829A1 (en) 2016-01-14
US9767824B2 (en) 2017-09-19
AR083365A1 (es) 2013-02-21
US9536542B2 (en) 2017-01-03
CA2811085A1 (en) 2012-04-19
KR20180026791A (ko) 2018-03-13
US9177563B2 (en) 2015-11-03
MX2013003952A (es) 2013-06-03
AU2011314848A1 (en) 2013-03-28
TWI479481B (zh) 2015-04-01
TW201227719A (en) 2012-07-01
KR101835910B1 (ko) 2018-03-07
US10236015B2 (en) 2019-03-19
BR112013008490A2 (pt) 2016-08-09
JP2012083678A (ja) 2012-04-26
KR101979557B1 (ko) 2019-05-16

Similar Documents

Publication Publication Date Title
CN103155031B (zh) 音乐信号编码装置和方法以及音乐信号解码装置和方法
CN102576544B (zh) 频带扩展设备和方法、编码设备和方法、解码设备和方法
EP2562754B1 (en) Signal processing device and method, encoding device and method, decoding device and method, and programs therefor
KR102015233B1 (ko) 복호 장치 및 복호 방법
RU2571565C2 (ru) Устройство обработки сигналов и способ обработки сигналов, кодер и способ кодирования, декодер и способ декодирования и программа

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant