CN103733258A - 编码装置和方法、解码装置和方法以及程序 - Google Patents
编码装置和方法、解码装置和方法以及程序 Download PDFInfo
- Publication number
- CN103733258A CN103733258A CN201280040030.4A CN201280040030A CN103733258A CN 103733258 A CN103733258 A CN 103733258A CN 201280040030 A CN201280040030 A CN 201280040030A CN 103733258 A CN103733258 A CN 103733258A
- Authority
- CN
- China
- Prior art keywords
- frequency
- frame
- signal
- data
- estimation coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 104
- 238000004364 calculation method Methods 0.000 claims abstract description 28
- 238000004064 recycling Methods 0.000 claims description 45
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 7
- 230000000052 comparative effect Effects 0.000 claims description 6
- 238000003786 synthesis reaction Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 21
- 239000003550 marker Substances 0.000 description 18
- 230000005236 sound signal Effects 0.000 description 8
- 101100281682 Danio rerio fsta gene Proteins 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000009434 installation Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011551 log transformation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本技术涉及使得能够以较小的代码量实现高音频质量的音频的编码装置和方法、解码装置和方法以及程序。编码装置对通过对输入信号的低频分量进行编码获得的低频编码数据和对包括用于通过估计来获取输入信号的高频分量的估计系数的数据进行编码所获得的高频编码数据进行复用,并输出复用后的数据。当对输入信号进行编码时,计算单元根据在处理目标的帧的紧前帧中选择的估计系数和输入信号的高频分量来计算伪高频子带功率作为高频分量的功率的估计值。此外,确定单元基于所计算的伪高频子带功率与实际的高频分量功率的比较结果来确定是否在处理目标的帧中启用对所述紧前帧的估计系数的重复利用。可以将本发明应用于编码装置。
Description
技术领域
本技术涉及编码装置和方法、解码装置和方法以及程序,更具体地涉及使得能够以较小的代码量获得高音频质量的音频的编码装置和方法、解码装置和方法以及程序。
背景技术
在相关技术中,HE-AAC(高效MPEG(运动图像专家组)4AAC(高级音频编码))(国际标准ISO/IEC14496-3)或AAC(MPEG2AAC)(国际标准ISO/IEC13818-7)已被认为是对音频信号进行编码的方法。
例如,已建议将如下方法作为对音频信号进行编码的方法:输出通过对低频分量进行编码获得的低频编码信息和根据低频分量和高频分量生成并用于获得所述高频分量的估计值的高频编码信息作为通过编码获得的代码(例如,参见专利文献1)。根据该方法,在高频编码信息中包括有计算高频分量的估计值必需的信息,例如振幅调节系数、频谱残差、以及获得高频的频率分量的比例因子。
此外,当执行解码时,基于通过对低频编码信息进行解码获得的低频分量和通过对高频编码信息进行解码获得的信息来估计高频分量,并且通过估计获得的高频分量与通过解码获得的低频分量被合成并变成通过解码获得的音频信号。
在该编码方法中,因为仅将用于获得高频分量的估计值的信息编码为关于高频的信号分量的信息,所以可以提高编码效率同时抑制音频质量的劣化。
引用列表
专利文献
专利文献1:WO2006/049205A
发明内容
本发明要解决的问题
在相关技术中,当执行解码时可以获得高音频质量的音频。然而,因为需要生成在音频信号的处理单元中计算高频分量的估计值的信息,所以高频编码信息的代码量不够小。
鉴于上述情况而做出本技术,其使得能够以较小的代码量获得高音频质量的音频。
问题的解决方案
根据本技术的第一方面的编码装置包括:子带划分单元,该子带划分单元对输入信号执行子带划分并生成输入信号的高频侧的子带的高频子带信号;计算单元,该计算单元基于根据输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在输入信号的处理目标的帧的紧前帧中的估计系数,来计算伪高频子带功率作为处理目标的帧的高频子带信号的高频子带功率的估计值;生成单元,当在处理目标的帧中启用对紧前帧的估计系数的重复利用时,该生成单元基于伪高频子带功率和根据高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据;低频编码单元,该低频编码单元对低频信号进行编码并生成低频编码数据;以及复用单元,该复用单元对数据和低频编码数据进行复用并生成输出代码串。
在编码装置中,还可以设置有:伪高频子带功率计算单元,该伪高频子带功率计算单元针对多个估计系数中的每一个、基于特征量和估计系数来计算伪高频子带功率;以及选择单元,该选择单元将由伪高频子带功率计算单元计算出的伪高频子带功率和高频子带功率进行比较并选择多个估计系数中的任一个。当禁止重复利用紧前帧的估计系数时,在生成单元中可以生成用于获得由选择单元选择的估计系数的数据。
在编码装置中,还可以设置有高频编码单元,该高频编码单元对数据进行编码并生成高频编码数据。在复用单元中,可以复用高频编码数据和低频编码数据并可以生成输出代码串。
当高频侧的子带的伪高频子带功率与高频子带功率的差的平方和等于或小于预定阈值时,启用对估计系数的重复利用。
根据表示伪高频子带功率与高频子带功率的相似度的评估值与预定阈值的比较结果来启用对估计系数的重复利用,相似度的评估值是根据高频侧的子带的伪高频子带功率和高频子带功率而计算的。
在生成单元中,可以生成针对包括输入信号的多个帧的处理目标部分的一种数据。
数据中可以包括在处理目标部分中指定如下部分的信息:所述部分包括选择相同估计系数的连续帧。
数据中可以包括一条针对所述部分用于指定估计系数的信息。
根据本技术的第一方面的编码方法和程序包括以下步骤:对输入信号执行频带划分并生成输入信号的高频侧的子带的高频子带信号;基于根据输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在输入信号的处理目标的帧的紧前帧中的估计系数,来计算伪高频子带功率作为处理目标的帧的高频子带信号的高频子带功率的估计值;当在处理目标的帧中启用对紧前帧的估计系数的重复利用时,基于伪高频子带功率和根据高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据;对低频信号进行编码并生成低频编码数据;以及对数据和低频编码数据进行复用并生成输出代码串。
在本技术的第一方面中,执行输入信号的频带划分并生成输入信号的高频侧的子带的高频子带信号。基于根据输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在输入信号的处理目标的帧的紧前帧中估计系数,来计算伪高频子带功率作为处理目标的帧的高频子带信号的高频子带功率的估计值。当在处理目标的帧中启用对紧前帧的估计系数的重复利用时,基于伪高频子带功率和根据高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据。对低频信号进行编码并生成低频编码数据。对数据和低频编码数据进行复用并生成输出代码串。
根据本技术的第二方面的解码装置包括:解复用单元,该解复用单元将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得估计系数的数据是根据基于处理目标的帧的高频子带功率的估计值的、在处理目标的帧中是否启用对下述估计系数的重复利用的确定结果而生成的,估计系数为在预先准备的多个估计系数中选择的在处理目标的帧的紧前帧中的估计系数,估计值是基于输入信号的特征量、紧前帧的估计系数和输入信号的处理目标的帧的高频子带功率而计算的;低频解码单元,该低频解码单元对低频编码数据进行解码并生成低频信号;高频信号生成单元,该高频信号生成单元基于根据数据所获得的估计系数和通过解码所获得的低频信号生成高频信号;以及合成单元,该合成单元基于高频信号和通过解码获得的低频信号生成输出信号。
当确定禁止重复利用紧前帧的估计系数时,包括在输入代码串中的数据是用于通过以下方式来获得从多个估计系数中选择的估计系数的数据:针对多个估计系数中的每一个计算高频子带功率的估计值,并将所计算的估计值与高频子带功率进行比较。
在解码装置中,还可以设置有数据解码单元,该数据解码单元对数据进行解码。
当估计值与高频子带功率的差的平方和等于或小于预定阈值时,可以确定启用对估计系数的重复利用。
可以针对包括输入信号的多个帧的处理目标部分生成一种数据。
数据中可以包括在处理目标部分中指定如下部分的信息:所述部分包括选择相同估计系数的连续帧。
数据中可以包括一条针对所述部分用于指定估计系数的信息。
根据本技术的第二方面的解码方法和程序包括以下步骤:将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得估计系数的数据是根据基于处理目标的帧的高频子带功率的估计值的、在处理目标的帧中是否启用对下述估计系数的重复利用的确定结果而生成的,估计系数为在预先准备的多个估计系数中选择的在处理目标的帧的紧前帧中的估计系数,估计值是基于输入信号的特征量、紧前帧的估计系数和输入信号的处理目标的帧的高频子带功率而计算的;对低频编码数据进行解码并生成低频信号;基于根据数据所获得的估计系数和通过解码所获得的低频信号来生成高频信号;以及基于高频信号和通过解码获得的低频信号来生成输出信号。
在本技术的第二方面中,将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得估计系数的数据是根据基于处理目标的帧的高频子带功率的估计值的、在处理目标的帧中是否启用对下述估计系数的重复利用的确定结果而生成的,估计系数为在预先准备的多个估计系数中选择的在处理目标的帧的紧前帧中的估计系数,估计值是基于输入信号的特征量、紧前帧的估计系数和输入信号的处理目标的帧的高频子带功率而计算的。对低频编码数据进行解码并生成低频信号。基于根据数据所获得的估计系数和通过解码所获得的低频信号来生成高频信号。基于高频信号和通过解码所获得的低频信号来生成输出信号。
本发明的效果
根据本技术的第一方面和第二方面,可以以较小的代码量获得高音频质量的音频。
附图说明
图1是示出了输入信号的子带的图。
图2是示出了使用可变长度法对高频分量进行编码的图。
图3是使用固定长度法对高频分量进行编码的图。
图4是示出了系数索引的重复利用的图。
图5是示出了应用本技术的编码装置的配置示例的图。
图6是示出了编码处理的流程图。
图7是示出了编码处理的流程图。
图8是示出了解码装置的配置示例的图。
图9是示出了计算机的配置示例的图。
具体实施方式
用于执行本发明的模式
以下,将参照附图描述应用本技术的实施例。
<本技术的概要>
[关于输入信号的编码]
本技术涉及使用音频信号例如音乐信号作为输入信号对输入信号进行编码。
在对输入信号进行编码的编码装置中,当执行编码时,如图1所示,将输入信号划分成具有预定带宽的多个频带(以下被称为子带)的子带信号。在图1中,竖轴表示输入信号的每个频率的功率,横轴表示输入信号的每个频率。此外,曲线C11表示输入信号的每个频率分量的功率,而垂直方向的虚线表示每个子带的边界位置。
如果将输入信号划分成各个子带的子带信号,则通过预定编码方法对输入信号的频率分量中等于或低于预定频率的低频侧的分量进行编码并生成低频解码数据。
在图1的示例中,频率等于或低于子带sb的上限频率的子带变成输入信号的低频分量,其中指定每个子带的索引为sb,频率高于子带sb的上限频率的子带变成输入信号的高频分量。
如果获得了低频编码数据,则基于输入信号的低频分量和高频分量来生成再现高频分量的每个子带的子带信号的信息,该信息通过预定编码方法进行适当编码并生成高频编码数据。
具体地,根据低频侧沿频率方向连续布置且具有最高频率的4个子带sb-3至sb的分量以及高频侧连续布置的(eb-(sb+1)+1)个子带sb+1至eb的分量,生成高频编码数据。
在本文中,子带sb+1是与子带sb相邻并且位于最靠近最低频侧的高频子带,并且子带eb是在连续布置的子带sb+1至eb中具有最高频率的子带。
通过对高频分量进行编码获得的高频编码数据是通过估计生成高频侧的子带ib(然而,sb+1≤ib≤eb)的子带信号的信息。在高频编码数据中,包括获得用于估计每个子带信号的估计系数的系数索引。
也就是说,在估计子带ib的子带信号中,使用包括与低频侧的子带kb(然而,sb-3≤kb≤sb)的子带信号的功率相乘的系数Aib(kb)和作为常数项的系数Bib的估计系数。包括在高频编码数据中的系数索引为获得包括每个子带ib的系数Aib(kb)和Bib的一组估计系数的信息,例如指定该组估计系数的信息。
如果以上述方式获得了低频编码数据和高频编码数据,则低频编码数据和高频编码数据被复用并变成输出代码串,然后输出该输出代码串。
同样地,获得估计系数的系数索引包括在高频编码数据中,使得与包括每帧的振幅调节系数或计算高频分量的比例因子的情况相比较,可以显著减少高频编码数据的代码量。
另外,已经接收到提供的输出代码串的解码装置对低频编码数据进行解码以获得包括低频侧的每个子带的子带信号的经解码的低频信号,并且根据经解码的低频信号和通过对高频编码数据进行解码获得的信息、通过估计来生成高频侧的每个子带的子带信号。此外,解码装置根据经解码的低频信号和包括通过估计获得的高频侧的每个子带的子带信号的经解码的高频信号来生成输出信号。以上述方式获得的输出信号为通过对经编码的输入信号进行解码获得的音频信号。
[关于输出代码串]
在输入信号的编码中,从针对输入信号的预定时间长度的每个部分即针对每帧预先准备的多个估计系数中,选择用于变成处理目标的帧的适当的估计系数(系数索引)。
在编码装置中,实际上高频编码数据包括当系数索引沿时间方向改变时的时间信息和改变后的系数索引的值而不是在高频编码数据中包括每帧的系数索引,使得代码量进一步减小。
特别地,当输入信号为其中每个频率分量沿时间方向的变化较小的平稳信号时,彼此相等的所选择的估计系数即系数索引沿时间方向通常是连续的。因此,为了减小包括在高频编码数据中的系数索引的时间方向的信息量,在对输入信号的高频分量执行编码时转换可变长度法和固定长度法。
[关于可变长度法]
以下,将描述使用可变长度法和固定长度法对高频分量进行编码。
当对高频分量进行编码时,对预定帧长度的每个部分执行可变长度法和固定长度法的转换。例如,在以下描述中,假设每隔16帧执行可变长度法与固定长度法的转换,与输入信号的16帧对应的部分也被称为处理目标部分。也就是说,在编码装置中,以16帧为单位对输出代码串进行输出作为处理目标部分。
首先,将描述可变长度法。在使用可变长度法对高频分量进行编码中,包括方法标记、系数索引、部分信息和数量信息的数据被编码并变成高频编码数据。
方法标记是表示生成高频编码数据的方法的信息,即表示在对高频分量进行编码时选择可变长度法与固定长度法中的哪个方法的信息。
此外,部分信息是表示包括在处理目标部分中并包括连续帧的部分即包括选择相同系数索引的帧的部分(以下也被称为连续帧部分)的长度的信息。此外,数量信息是表示包括在处理目标部分中的连续帧部分的数量的信息。
例如,在可变长度法中,如图2所示,包括在位置FST1与位置FSE1之间的16帧的部分变成一个处理目标部分。在图2中,水平方向表示时间,并且一个矩形表示一帧。此外,在表示帧的矩形中的数值表示指定针对相应帧所选择的估计系数的系数索引的值。
在使用可变长度法对高频分量进行编码中,首先,将处理目标部分划分成包括选择相同系数索引的连续帧的连续帧部分。也就是说,选择不同系数索引的相邻帧的边界位置变成每个连续帧部分的边界位置。
在本示例中,将处理目标部分划分成3个部分:从位置FST1到位置FC1的部分、从位置FC1到位置FC2的部分、以及从位置FC2到位置FSE1的部分。例如,在从位置FST1到位置FC1的连续帧部分中,在每帧中选择相同的系数索引“2”。
以这种方式,如果将处理目标部分划分成连续帧部分,则生成包括如下信息的数据:表示处理目标部分中的连续帧部分的数量的数量信息、在每个连续帧部分中选择的系数索引、表示每个连续帧部分的长度的部分信息;以及方法标记。
在本文中,因为将处理目标部分划分成3个连续的帧部分,示出“3”作为连续帧部分的数量的信息变成数量信息。在图2中,由“num_length=3”表示数量信息。
例如,以相应连续帧部分的帧为单位,在处理目标部分中的第一连续帧部分的部分信息变成长度“5”并在图2中由“length0=5”表示。每个部分信息可以被指定为:每个部分信息是从处理目标部分的头部开始的第几个连续帧部分的部分信息。换言之,在部分信息中还可以包括指定连续帧部分在处理目标部分中的位置的信息。
以这种方式,如果针对处理目标部分生成了包括数量信息、系数索引、部分信息和方法标记的数据,则该数据被编码并变成高频编码数据。此时,经编码的数据包括每个连续帧部分的系数索引。在这种情况下,当在多个帧中连续选择相同的系数索引时,不需要传输每个帧的系数索引。因此,可以减小待传输的输出代码串的数据量,并且可以有效执行编码和解码。
[关于固定长度法]
接着,将描述使用固定长度法对高频分量进行编码。
在固定长度法中,如图3所示,将包括16帧的处理目标部分平均划分成包括预定数量的帧的部分(以下被称为固定长度部分)。在图3中,水平方向表示时间,并且一个矩形表示一帧。此外,表示帧的矩形中的数值表示指定针对对应帧所选择的估计系数的系数索引的值。在图3中,与图2的情况下的部分对应的部分使用相同附图标记来表示,并且适当省略其描述。
在固定长度法中,将处理目标部分划分成一些固定长度部分。此时,确定固定长度部分的长度,使得在固定长度部分的各个帧中选择的系数索引相同并且固定长度部分的长度变成最长。
在图3的示例中,固定长度部分的长度(以下还被简称为固定长度)变成4帧,并且将处理目标部分平均划分成4个固定长度部分。也就是说,将处理目标部分划分成:从位置FST1到位置FC21的部分、从位置FC21到位置FC22的部分、从位置FC22到位置FC23的部分、以及从位置FC23到位置FSE1的部分。在这些固定长度部分中的系数索引从处理目标部分的头部的固定长度部分开始依次变成系数索引“1”、“2”、“2”和“3”。
以这种方式,如果将处理目标部分划分成一些固定长度部分,则生成包括系数索引、转换标记、方法标记和表示处理目标部分的固定长度部分的固定长度的固定长度索引的数据。
在此,转换标记是表示系数索引是否在固定长度部分的边界位置处——即预定固定长度部分的最终帧和在相应的固定长度部分之后的固定长度部分的头部的帧中——改变的信息。例如,当系数索引在从处理目标部分的头部开始的第(i+1)个和第(i+2)个固定长度部分的边界位置处改变时,第i(i=0,1,2,……)个转换标记gridflg_i变成“1”,而当系数索引未改变时第i个转换标记gridflg_i变成“0”。
在图3的示例中,处理目标部分的第一固定长度部分的边界位置(位置FC21)的转换标记gridflg_0变成“1”,这是因为第一固定长度部分的系数索引“1”与第二固定长度部分的系数索引“2”彼此不同。此外,位置FC22的转换标记gridflg_1变成“0”,这是因为第二固定长度部分的系数索引“2”与第三固定长度部分的系数索引“2”相同。
另外,固定长度索引的值变成根据固定长度获取的值。具体地,固定长度索引length_id变成满足固定长度fixed_length=16/2length_id的值。在图3的示例中,因为固定长度fixed_length为4,所以固定长度索引length_id变成2。
如果将处理目标部分划分成固定长度部分并且生成包括固定长度索引、系数索引、转换标记和方法标记的数据,则该数据被编码并变成高频编码数据。
在图3的示例中,包括如下内容的数据被编码并变成高频编码数据:位置FC21与位置FC23之间的转换标记gridflg_0=1、gridflg_1=0和gridflg_2=1;固定长度索引length_id=2;各个固定长度部分的系数索引“1”、“2”和“3”;以及表示固定长度法的方法标记。
在本文中,每个固定长度部分的边界位置的转换标记可以被指定如下:该转换标记是从处理目标部分的头部开始的第几个边界位置的转换标记。换言之,转换标记中还包括指定固定长度部分在处理目标部分中的边界位置的信息。
此外,按照选择系数索引的顺序即对固定长度部分进行布置的顺序来对包括在高频编码数据中的各个系数索引进行设置。在图3的示例中,系数索引按照系数索引“1”、“2”和“3”的顺序进行布置并包括在编码数据中。
在图3的示例中,从处理目标部分的头部开始的第二固定长度部分和第三固定长度部分的系数索引均为“2”。然而,仅一个系数索引“2”包括在高频编码数据中。当连续固定长度部分的系数索引相同时,即当连续固定长度部分的边界位置处的转换标记为0时,在高频编码数据中不包括数量与固定长度部分的数量相等的相同系数索引,而是在高频编码数据中包括一个系数索引。
同样地,如果高频编码数据是根据包括固定长度索引、系数索引、转换标记和方法标记的数据生成的,则不需要传输每帧的系数索引。因此,可以减小待传输的输出代码串的数据量。因此,可以有效地执行编码和解码。
[关于估计系数的重复利用]
此外,当帧的估计系数变成处理目标即在对输入信号进行编码时选择系数索引时,确定是否可以重复利用在处理目标的帧紧之前的帧中选择的系数索引并适当执行重复利用。
例如,如图4所示,假设在处理目标部分中的第一帧中选择了系数索引“2”。在图4中,水平方向表示时间,并且一个矩形表示一帧。此外,表示帧的矩形中的数值表示指定对应帧的估计系数的系数索引。
如果在处理目标部分的第一帧中选择了系数索引“2”,则选择下一帧的系数索引。然而,此时,确定是否启用对紧前帧的系数索引“2”的重复利用。
例如,由系数索引“2”指定的估计系数用于在当前时间点变成处理目标的处理目标部分的第二帧,估计第二帧的高频分量,并将估计结果与实际的高频分量相互比较。
根据比较结果,当使用由系数索引“2”指定的估计系数获得具有足够估计精度的高频分量时,确定启用对估计系数的系数索引的重复利用,第二帧的系数索引变成“2”。在图4的示例中,从处理目标部分的头部开始的第二帧的系数索引变成与紧前帧的系数索引相等的“2”。
与此同时,根据通过估计获得的高频分量与实际高频分量的比较结果,当未获得具有足够估计精度的高频分量时,选择预先准备的多个估计系数中最合适的估计系数的系数索引。
例如,在从处理目标部分的头部开始的第四帧中,确定禁止重复利用紧前帧的系数索引。鉴于此原因,选择与第三帧的系数索引“2”不同的系数索引“3”。
同样地,在使用由每帧的紧前帧的系数索引指定的估计系数执行高频分量的估计的情况下,当获得足够的估计精度时,重复利用紧前帧的系数索引。通过系数索引的重复利用,可以防止针对每帧所选择的系数索引沿时间方向过度改变。
因此,因为连续帧部分变得更长,可以进一步减小处理目标部分的高频编码数据中包括的系数索引的数量,并且可以进一步减小高频编码数据的数据量。
此外,根据估计系数的特性例如高频分量的估计误差不同。鉴于此原因,如果系数索引沿时间方向的改变过大,则可能在通过解码获得的音频信号中生成在解码之前的输入信号中未生成的频率包络的反常时间改变,并且关于听觉的音频质量可能劣化。这种音频质量劣化在高频分量的时间改变较小的平稳音频信号中是显著的。
然而,根据本技术,如果在获得足够的估计精度时重复利用系数索引,则可以防止系数索引过度改变。因此,可以抑制通过解码获得的音频的高频分量的反常改变,从而可以改进音频质量。
<第一实施例>
[编码装置的示例结构]
接着,将描述上述用于对输入信号进行编码的技术的具体实施方式。首先,将描述对输入信号进行编码的编码装置的配置。图5是示出了编码装置的配置示例的图。
编码装置11包括低通滤波器31、低频编码电路32、子带划分电路33、特征量计算电路34、伪高频子带功率计算电路35、伪高频子带功率差计算电路36、高频编码电路37以及复用电路38。在编码装置11中,将编码目标的输入信号提供给低通滤波器31和子带划分电路33。
低通滤波器31对提供的具有预定截止频率的输入信号进行滤波,并将由此获得具有低于截止频率的频率的信号(以下被称为低频信号)提供给低频编码电路32和子带划分电路33。
低频编码电路32对从低通滤波器31提供的低频信号进行编码并将由此获得的低频编码数据提供给复用电路38。
子带划分电路33将从低通滤波器31提供的低频信号平均划分成多个子带的子带信号(以下也被称为低频子带信号),并将所获得的低频子带信号提供给特征量计算电路34。低频子带信号是输入信号的低频侧的各个子带的信号。
此外,子带划分电路33将提供的输入信号平均划分成多个子带的子带信号,并将在所获得的子带信号中的高频侧的预定频带中包括的每个子带的子带信号提供给伪高频子带功率差计算电路36。以下,从子带划分电路33提供给伪高频子带功率差计算电路36的每个子带的子带信号也被称为高频子带信号。
特征量计算电路34基于从子带划分电路33提供的低频子带信号来计算特征量,并将特征量提供给伪高频子带功率计算电路35和伪高频子带功率差计算电路36。
伪高频子带功率计算电路35基于从特征量计算电路34提供的特征量来计算高频子带信号的功率(以下也被称为伪高频子带功率)的估计值,并且将该估计值提供给伪高频子带功率差计算电路36。在伪高频子带功率计算电路35中,记录通过统计学习获得的多组估计系数,并基于估计系数和特征量来计算伪高频子带功率。
伪高频子带功率差计算电路36计算从子带划分电路33提供的高频子带信号的功率(以下也被称为高频子带功率),并计算表示计算出的功率与伪高频子带功率的差的伪高频子带功率差的平方和。
伪高频子带功率差计算电路36包括计算单元51、确定单元52和生成单元53。
计算单元51从伪高频子带功率计算电路35获取由在处理目标的帧紧之前的帧中选择的系数索引指定的估计系数,并基于所获取的估计系数和从特征量计算电路34提供的特征量来计算伪高频子带功率。伪高频子带功率差计算电路36使用通过计算单元51计算的伪高频子带功率和从伪高频子带功率计算电路35提供的伪高频子带功率中的任一个来计算伪高频子带功率差的平方和。
确定单元52基于使用由计算单元51计算的伪高频子带功率所计算出的伪高频子带功率差的平方和来确定是否启用对系数索引的重复利用。伪高频子带功率差计算电路36基于伪高频子带功率差的平方和以及确定单元52的确定结果来选择输入信号的每帧的系数索引。
生成单元53基于在输入信号的处理目标部分的每帧中的系数索引的选择结果来执行可变长度法或固定长度法的转换,通过所选择的方法生成用于获得高频编码数据的数据,并且将所述数据提供给高频编码电路37。
高频编码电路37对从伪高频子带功率差计算电路36提供的数据进行编码,并且将由此获得的高频编码数据提供给复用电路38。复用电路38对从低频编码电路32提供的低频编码数据与从高频编码电路37提供的高频编码数据进行复用,并输出复用后的数据作为输出代码串。
[编码处理的描述]
如果提供了输入信号并指示对输入信号进行编码,则图5所示的编码装置11执行编码处理并向解码装置输出输出代码串。以下,将参照图6和图7的流程图来描述编码装置11的编码处理。对每一预定帧数即每一处理目标部分执行编码处理。
在步骤S11中,低通滤波器31使用预定截止频率对所提供的处理目标的帧的输入信号进行滤波,并且将由此获得的低频信号提供给低频编码电路32和子带划分电路33。
在步骤S12中,低频编码电路32对从低通滤波器31提供的低频信号进行编码并将由此获得的低频编码数据提供给复用电路38。
在步骤S13中,子带划分电路33将输入信号和低频信号平均划分成多个具有预定带宽的子带信号。
也就是说,子带划分电路33将提供的输入信号划分成各个子带的子带信号,并将所获得的高频侧的子带sb+1至eb的子带信号提供给伪高频子带功率差计算电路36。
此外,子带划分电路33将从低通滤波器31提供的低频信号划分成各个子带的子带信号,并将所获得的低频侧的子带sb-3至sb的子带信号提供给特征量计算电路34。
在步骤S14中,特征量计算电路34基于从子带划分电路33提供的低频子带信号来计算特征量,并将该特征量提供给伪高频子带功率计算电路35和伪高频子带功率差计算电路36。
例如,计算每个低频子带信号的功率作为特征量。以下,特别地,低频子带信号的功率也被称为低频子带功率。此外,每个子带的子带信号(例如低频子带信号或高频子带信号)的功率还被称为子带功率。
具体地,特征量计算电路34计算以下式(1)并计算通过分贝表示的处理目标的帧J的子带ib(然而,sb-3≤ib≤sb)的子带功率power(ib,J)。
[数学公式1]
(sb-3≤ib≤sb) (1)
在式(1)中,x(ib,n)表示子带ib的子带信号的值(样本的样本值),并且x(ib,n)中的n表示离散时间的索引。此外,式1中的FSIZE表示构成一帧的子带信号的样本的数量。
因此,通过对构成帧J的低频子带信号的每个样本的样本值的平方和值执行对数变换来计算帧J的低频子带功率power(ib,J)。以下,继续以在特征量计算电路34中计算低频子带功率作为特征量为假设进行描述。
在步骤S15中,计算单元51基于与从特征量计算电路34提供的特征量对应的低频子带功率和在变成处理目标的帧J紧之前的帧(J-1)中选择的系数索引来计算伪高频子带功率。
例如,计算单元51从伪高频子带功率计算电路35获取由在紧前帧(J-1)中选择的系数索引指定的一组估计系数。
此外,计算单元51根据所获取的估计系数和低频子带功率power(ib,J)来计算下式(2),并计算高频侧的每个子带的伪高频子带功率powerest(ib,J)(然而,sb+1≤ib≤eb)。
[数学公式2]
(sb+1≤ib≤eb) (2)
在式(2)中,系数Aib(kb)和系数Bib表示针对高频侧的子带ib准备的一组估计系数。也就是说,系数Aib(kb)是与子带kb(然而,sb-3≤kb≤sb)的低频子带功率power(kb,J)相乘的系数,而系数Bib为在线性组合子带kb的子带功率时使用的常数项。
因此,通过将低频侧的每个子带的低频子带功率乘以每个子带的系数Aib(kb)并且将系数Bib与低频子带功率乘以所述系数的和相加,获得高频侧的子带ib的伪高频子带功率powerest(ib,J)。
在步骤S16中,伪高频子带功率差计算电路36基于从子带划分电路33提供的高频子带信号和由计算单元51计算的伪高频子带功率来计算伪高频子带功率差。
具体地,伪高频子带功率差计算电路36对从子带划分电路33提供的高频子带信号执行与上述式(1)相同的操作,并计算帧J中的高频子带功率power(ib,J)(然而,sb+1≤ib≤eb)。
此外,伪高频子带功率差计算电路36计算下式(3)并计算作为高频子带功率power(ib,J)与伪高频子带功率powerest(ib,J)的差的伪高频子带功率差powerdiff(ib,J)。
[数学公式3]
powerdiff(ib,J)=power(ib,J)-powerest(jb,J)(sb+1≤ib≤eb) (3)
在步骤S17中,伪高频子带功率差计算电路36使用针对高频侧的每个子带ib(然而,sb+1≤ib≤eb)所获取的伪高频子带功率差功率来计算下式(4)并计算伪高频子带功率差的平方和。
[数学公式4]
在式(4)中,差的平方和E(J,id(J-1))表示针对由在处理目标的帧J紧之前的帧(J-1)中选择的系数索引id(J-1)指定的估计系数获取的帧J的伪高频子带功率差的平方和。
此外,在式(4)中,powerdiff(ib,J,id(J-1))表示针对由系数索引id(J-1)指定的估计系数所获取的帧J的高频侧的子带ib的伪高频子带功率差powerdiff(ib,J)。
以上述方式获得的差的平方和E(J,id(J-1))表示根据实际的高频子带信号计算出的帧J的高频子带功率与使用由在紧前帧(J-1)中选择的系数索引指定的估计系数计算出的伪高频子带功率的相似度。
也就是说,所述差的平方和表示高频子带功率的估计值与真实值的误差。因此,当差的平方和E(J,id(J-1))较小时,通过使用估计系数的操作获得与实际输入信号的高频分量接近的信号。
因此,当针对帧J计算出的差的平方和E(J,id(J-1))在一定程度上较小时,可以以足够的精度来估计高频分量,即使在帧J中使用在紧前帧(J-1)中选择的估计系数也如此。也就是说,启用对紧前帧(J-1)的估计系数(系数索引)的重复利用。
与此同时,如果差的平方和E(J,id(J-1))较大,则实际输入信号的高频分量与通过估计获得的高频分量的误差较大,并且在解码时可能产生关于听觉的音频质量的劣化。因此,在这种情况下,禁止重复利用系数索引。
在步骤S18中,确定单元52基于通过步骤S17的处理计算出的差的平方和E(J,id(J-1))来确定是否重复利用系数索引。例如,当差的平方和E(J,id(J-1))等于或小于预定阈值时,则确定重复利用系数索引。例如,阈值变成预定值如“3”。
当在步骤S18中确定启用对系数索引的重复利用时,在步骤S19中,伪高频子带功率差计算电路36选择在紧前帧(J-1)中选择的系数索引作为帧J的系数索引。也就是说,重复利用系数索引(估计系数)。
如果选择了帧J的系数索引,处理进行至步骤S24。在针对下一帧(J+1)执行步骤S15的处理中,将在步骤S19中选择的帧J的系数索引用作在处理目标的帧紧之前的帧中选择的系数索引。
与此同时,当在步骤S18中确定不重复利用系数索引时,在步骤S20中,伪高频子带功率计算电路35基于从特征量计算电路34提供的特征量来计算伪高频子带功率。
具体地,伪高频子带功率计算电路35针对预先记录的每个估计系数执行上述式(2)的操作,计算伪高频子带功率powerest(ib,J)并且将伪高频子带功率提供给伪高频子带功率差计算电路36。例如,当预先准备有系数索引为1至k(然而,2≤k)的一组k个估计系数时,针对该组k个估计系数来计算每个子带的伪高频子带功率。
在步骤S21中,伪高频子带功率差计算电路36基于从子带划分电路33提供的高频子带信号和从伪高频子带功率计算电路35提供的伪高频子带功率来计算伪高频子带功率差。在步骤S22中,伪高频子带功率差计算电路36针对每个估计系数计算伪高频子带功率差的平方和。
在步骤S21和S22中,执行与上述步骤S16和S17相同的处理。从而针对每组k个估计系数计算伪高频子带功率差的平方和(差的平方和)。
在步骤S23中,伪高频子带功率差计算电路36选择如下系数索引作为帧J的系数索引:其表示与在针对每组k个估计系数的差的平方和中具有最小值的差的平方和对应的估计系数。
在本文中,在计算具有最小值的差的平方和中使用的估计系数是如下估计系数:使得实际输入信号的高频分量与通过使用该估计系数进行估计所获得的高频分量的误差最小化。同样地,当不能重复利用估计系数(系数索引)时,选择预先记录的多组估计系数中的最适于处理目标的帧的一组估计系数。如果选择了系数索引,则处理进行至步骤S24。
在步骤S19或S23中,如果选择了用于处理目标的帧J的系数索引,则在步骤S24中,伪高频子带功率差计算电路36确定是否通过预定帧长度来执行处理。也就是说,确定是否针对构成处理目标部分的所有帧选择了系数索引。
当在步骤S24中确定未通过预定帧长度执行处理时,处理返回步骤S11并重复上述处理。也就是说,未变成处理目标的处理目标部分的帧变成下一个处理目标帧并选择对应帧的系数索引。
与此同时,当在步骤S24中确定通过预定帧长度执行处理时,处理进行至步骤S25。
在步骤S25中,生成单元53确定是否将生成高频编码数据的方法设置为固定长度法。
也就是说,生成单元53基于处理目标部分中的每帧的系数索引的选择结果来比较通过固定长度法生成的高频编码数据与通过可变长度法生成的高频编码数据的代码量。此外,当固定长度法的高频编码数据的代码量小于可变长度法的高频编码数据的代码量时,生成单元53确定将生成高频编码数据的方法设置为固定长度法。
当在步骤S25中确定将生成高频编码数据的方法设置为固定长度法时,处理进行至步骤S26。在步骤S26中,生成单元53生成包括固定长度索引、系数索引、转换标记以及表示选择固定长度法的方法标记的数据并将该数据提供给高频编码电路37。
在图3的示例中,生成单元53将固定长度设置为4帧并将从位置FST1到位置FSE1的处理目标部分划分成4个固定长度部分。此外,生成单元53生成包括如下内容的数据:固定长度索引“2”;系数索引“1”、“2”和“3”;转换标记“1”、“0”和“1”;以及方法标记。
在图3中,从处理目标部分的头部开始的第二固定长度部分和第三固定长度部分的系数索引二者均为“2”。然而,因为这些固定长度部分是连续布置的,所以在从生成单元53输出的数据中仅包括一个系数索引“2”。
在步骤S27中,高频编码电路37对从生成单元53提供的包括方法标记、固定长度索引、系数索引和转换标记的数据进行编码,并生成高频编码数据。例如,在必要时对方法标记、固定长度索引、系数索引和转换标记中的部分或全部的信息执行熵编码。
高频编码电路37将所生成的高频编码数据提供给复用电路38。然后,处理进行至步骤S30。
与此同时,当在步骤S25中确定不将生成高频编码数据的方法设定为固定长度法即将生成高频编码数据的方法设定为可变长度法时,处理进行至步骤S28。在步骤S28中,生成单元53生成包括系数索引、部分信息、数量信息以及表示选择可变长度法的方法标记的数据,并将该数据提供给高频编码电路37。
在图2的示例中,生成单元53将从位置FST1到位置FSE1的处理目标部分划分成3个连续帧部分。此外,生成单元53生成包括如下内容的数据:表示选择可变长度法的方法标记、表示作为连续帧部分的数量的“3”的数量信息“num_length=3”;表示各个连续帧部分的长度的部分信息“length0=5”和“length1=7”;以及这些连续帧部分的索引系数“2”、“5”和“1”。
各个连续帧部分的系数索引与部分信息相关联,并且可以指定特定连续帧部分的系数索引。在图2的示例中,因为可以根据处理目标部分的头部和下一连续帧部分的部分信息来指定构成处理目标部分的最终连续帧部分的帧的数量,所以不生成最终连续帧部分的部分信息。
在步骤S29中,高频编码电路37对从生成单元53提供的并包括方法标记、系数索引、部分信息和数量信息的数据进行编码,并生成高频编码数据。
例如,在步骤S29中,针对方法标记、系数索引、部分信息和数量信息中的部分或全部的信息执行熵编码。高频编码数据可以是根据其获得最佳估计系数的任何信息。例如,包括方法标记、系数索引、部分信息和数量信息的数据可以按照原样变成高频编码数据。同样地,甚至在上述步骤S27中,数据例如系数索引可以按照原样变成高频编码数据。
高频编码电路37将所生成的高频编码数据提供给复用电路38。然后,处理进行至步骤S30。
在步骤S27或S29中,如果生成了高频编码数据,则在步骤S30中,复用电路38对从低频编码电路32提供的低频编码数据和从高频编码电路37提供的高频编码数据进行复用。此外,复用电路38输出通过复用获得的输出代码串,并且编码处理结束。
以这种方式,当选择每个帧的系数索引时,编码装置11确定是否可以重复利用紧前帧的系数索引,并根据确定结果来重复利用系数索引。此外,编码装置11对包括所选择的系数索引的数据进行编码并生成高频编码数据。
同样地,对包括系数索引的数据进行编码以生成高频编码数据,使得与对用于高频的估计操作的数据例如比例因子进行编码的情况相比,可以减小高频编码数据的代码量。
另外,在必要时重复利用系数索引,使得可以防止系数索引沿时间方向过度改变,可以进一步减小高频编码数据的代码量,以及可以改进通过解码获得的音频的音频质量。
此外,在固定长度法与可变长度法中,针对每个处理目标部分选择减小代码量的方法并生成高频编码数据,使得可以减小输出代码串的代码量并可以有效执行音频的编码或解码。
已经描述了使用差的平方和E(j,(id(J-1))来确定是否启用对系数索引的重复利用的情况的示例。然而,可以使用表示实际高频分量与通过估计获得的高频分量的比较结果的任何因子。
例如,针对高频侧的每个子带ib(然而,sb+1≤ib≤eb)获得高频子带功率power(ib,J)与伪高频子带功率powerest(ib,J)的差,并且所述差可以用于确定是否可以重复利用作为所述差的均方值的残差均方值Resstd。
此外,可以使用作为高频侧的各个子带ib的高频子带功率与伪高频子带功率的差的绝对值中的最大值的残差最大值Resmax或作为各个子带ib的高频子带功率与伪高频子带功率的差的平均值的绝对值的残差平均值Resave。
此外,可以使用通过对残差均方值Resstd、残差最大值Resmax以及残差平均值Resave执行预定权重的加权相加(线性组合)获得的评估值Res来确定是否启用对系数索引的重复利用。当评估值Res增加时,实际高频分量与通过使用估计系数进行估计获得的高频分量的误差减小。
在这种情况下,伪高频子带功率差计算电路36使用通过在处理目标的帧J的紧前帧(J-1)中选择的系数索引指定的估计系数来计算评估值Res。此外,确定单元52将所获得的评估值Res与阈值(例如10)进行比较,并且当评估值Res等于或小于阈值时,确定启用对系数索引的重复利用。在这种情况下,帧(J-1)的系数索引还被选择(采用)作为帧J的系数索引。
[解码装置的示例结构]
接着,将描述接收从编码装置11输出的输出代码串并对输出代码串进行解码的解码装置。
例如,解码装置如图8所示的那样进行配置。
解码装置81包括解复用电路91、低频解码电路92、子带划分电路93、特征量计算电路94、高频解码电路95、经解码的高频子带功率计算电路96、经解码的高频信号生成电路97以及合成电路98。
解复用电路91使用从编码装置11接收的输出代码串作为输入代码串,并将该输入代码串解复用成高频编码数据和低频编码数据。此外,解复用电路91将通过解复用获得的低频编码数据提供给低频解码电路92并将通过解复用获得的高频编码数据提供给高频解码电路95。
低频解码电路92对从解复用电路91提供的低频编码数据进行解码,并将由此获得的经解码的输入信号的低频信号提供给子带划分电路93和合成电路98。
子带划分电路93将从低频解码电路92提供的经解码的低频信号平均划分成具有预定带宽的多个低频子带信号,并将所获得的低频子带信号提供给特征量计算电路94和经解码的高频信号生成电路97。
特征量计算电路94基于从子带划分电路93提供的低频子带信号来计算低频侧的每个子带的低频子带功率作为特征量,并将该低频子带功率提供给经解码的高频子带功率计算电路96。
高频解码电路95对从解复用电路91提供的高频编码数据进行解码,并将由此获得的数据和由包括在该数据中的系数索引指定的估计系数提供给经解码的高频子带功率计算电路96。也就是说,多个系数索引与由系数索引指定的估计系数相关联并被预先记录在高频解码电路95中,并且高频解码电路95输出与包括在高频编码数据中的系数索引对应的估计系数。
经解码的高频子带功率计算电路96基于从高频解码电路95提供的数据和估计系数以及从特征量计算电路94提供的低频子带功率来计算经解码的高频子带功率作为针对每帧的高频侧的每个子带的子带功率的估计值。例如,执行与上述式(2)相同的操作并计算经解码的高频子带功率。经解码的高频子带功率计算电路96将计算出的每个子带的经解码的高频子带功率提供给经解码的高频信号生成电路97。
经解码的高频信号生成电路97基于从子带划分电路93提供的低频子带信号和从经解码的高频子带功率计算电路96提供的经解码的高频子带功率来生成经解码的高频信号,并将该经解码的高频信号提供给合成电路98。
具体地,经解码的高频信号生成电路97计算低频子带信号的低频子带功率,并根据经解码的高频子带功率与低频子带功率的比率来对低频子带信号执行振幅调制。此外,经解码的高频信号生成电路97对经振幅调制的低频子带信号执行频率调制,并生成高频侧的每个子带的经解码的高频子带信号。以上述方式获得的经解码的高频子带信号是输入信号的高频侧的每个子带的高频子带信号的估计值。经解码的高频信号生成电路97将包括所获得的每个子带的经解码的高频子带信号的经解码的高频信号提供给合成电路98。
合成电路98将从低频解码电路92提供的经解码的低频信号与从经解码的高频信号生成电路97提供的经解码的高频信号进行合成,并输出合成后的信号作为输出信号。该输出信号是通过对经编码的输入信号进行解码获得的信号并且是包括高频分量和低频分量的信号。
可以通过硬件或通过软件执行上述一系列处理。在通过软件执行系列处理的情况下,将来自程序记录介质的构成软件的程序安装至嵌有专用硬件的计算机或可以通过安装各种程序来执行各种功能的通用个人计算机。
图9是示出了通过程序来执行上述系列处理的计算机的硬件的配置示例的框图。
在计算机中,CPU(中央处理单元)301、ROM(只读存储器)302、RAM(随机存取存储器)303通过总线304相互连接。
输入/输出接口305也连接至总线304。包括键盘、鼠标、麦克风等的输入单元306,包括显示器、扬声器等的输出单元307、包括硬盘、非易失性存储器等的记录单元308,包括网络接口等的通信单元309,驱动可拆卸介质311(例如磁盘、光盘、磁光盘或半导体存储器)的驱动器310连接至输入/输出接口305。
在如上配置的计算机中,CPU301经由输入/输出接口305和总线304将记录在记录单元308中的程序加载至RAM303并执行程序,从而执行上述系列处理。
将待由计算机(CPU301)执行的程序记录在作为封装介质(包括磁盘(包括软盘)、光盘(CD-ROM(只读光盘存储器)、DVD(数字多功能盘)等),磁光盘或半导体存储器)的可拆卸介质311中来提供,或通过有线或无线传输介质(例如局域网、因特网和数字卫星广播)来提供。
可以通过将可拆卸介质311安装至驱动器310、经由输入/输出接口305将程序安装在记录单元308中。此外,可以经由有线或无线传输介质通过通信单元309来接收程序并且将程序安装在记录单元308中。此外,可以预先将程序安装在ROM302或记录单元308中。
待由计算机执行的程序可以是用于按照根据本说明书中描述的顺序的时间顺序来执行操作的程序,或者可以是用于并行地执行操作或在必要时例如当存在呼叫时执行操作的程序。
本技术的实施例并不限于上述实施例,在不偏离本技术的主旨的前提下可以进行各种改变。
另外,本技术可以采取以下配置。
一种编码装置,包括:
子带划分单元,该子带划分单元对输入信号执行频带划分并生成所述输入信号的高频侧的子带的高频子带信号;
计算单元,该计算单元基于根据所述输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在所述输入信号的处理目标的帧的紧前帧中的估计系数,来计算伪高频子带功率作为所述处理目标的所述帧的高频子带信号的高频子带功率的估计值;
生成单元,当在所述处理目标的所述帧中启用对所述紧前帧的所述估计系数的重复利用时,所述生成单元基于所述伪高频子带功率和根据所述高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据;
低频编码单元,该低频编码单元对所述低频信号进行编码并生成低频编码数据;以及
复用单元,该复用单元对所述数据和所述低频编码数据进行复用并生成输出代码串。
根据[1]所述的编码装置,还包括:
伪高频子带功率计算单元,该伪高频子带功率计算单元针对多个估计系数中的每一个、基于所述特征量和所述估计系数来计算所述伪高频子带功率;以及
选择单元,该选择单元将由所述伪高频子带功率计算单元计算出的所述伪高频子带功率与所述高频子带功率进行比较并选择所述多个估计系数中的任一个,
其中,当禁止重复利用所述紧前帧的所述估计系数时,所述生成单元生成用于获得由所述选择单元选择的估计系数的数据。
根据[1]或[2]所述的编码装置,还包括:
高频编码单元,该高频编码单元对所述数据进行编码并生成高频编码数据,
其中,所述复用单元对所述高频编码数据和所述低频编码数据进行复用并生成所述输出代码串。
根据[1]至[3]中任一项所述的编码装置,
其中,当所述高频侧的子带的所述伪高频子带功率与所述高频子带功率的差的平方和等于或小于预定阈值时,启用对所述估计系数的重复利用。
根据[1]至[3]中任一项所述的编码装置,
其中,根据表示所述伪高频子带功率与所述高频子带功率的相似度的评估值与预定阈值的比较结果来启用对所述估计系数的重复利用,所述相似度的评估值是基于所述高频侧的所述子带的所述伪高频子带功率和所述高频子带功率而计算的。
根据[1]至[5]中任一项所述的编码装置,
其中,所述生成单元生成针对包括所述输入信号的多个帧的处理目标部分的一种数据。
根据[6]所述的编码装置,
其中,所述数据中包括在所述处理目标部分中指定如下部分的信息:所述部分包括选择相同估计系数的连续帧。
根据[7]所述的编码装置,
其中,所述数据中包括一条针对所述部分用于指定估计系数的信息。
一种编码方法,包括以下步骤:
对输入信号执行频带划分并生成所述输入信号的高频侧的子带的高频子带信号;
基于根据所述输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在所述输入信号的处理目标的帧的紧前帧中的估计系数,来计算伪高频子带功率作为所述处理目标的所述帧的所述高频子带信号的高频子带功率的估计值;
当在所述处理目标的所述帧中启用对所述紧前帧的所述估计系数的重复利用时,基于所述伪高频子带功率和根据所述高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据;
对所述低频信号进行编码并生成低频编码数据;以及
对所述数据和所述低频编码数据进行复用并生成输出代码串。
一种使计算机执行处理的程序,所述处理包括以下步骤:
对输入信号执行频带划分并生成所述输入信号的高频侧的子带的高频子带信号;
基于根据所述输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在所述输入信号的处理目标的帧的紧前帧中的估计系数,来计算伪高频子带功率作为所述处理目标的所述帧的所述高频子带信号的高频子带功率的估计值;
当在所述处理目标的所述帧中启用对所述紧前帧的所述估计系数的重复利用时,基于所述伪高频子带功率和根据所述高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据;
对所述低频信号进行编码并生成低频编码数据;以及
对所述数据和所述低频编码数据进行复用并生成输出代码串。
一种解码装置,包括:
解复用单元,该解复用单元将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得所述估计系数的所述数据是根据基于处理目标的帧的高频子带功率的估计值的、在所述处理目标的所述帧中是否启用对下述估计系数的重复利用的确定结果而生成的,所述估计系数在预先准备的多个估计系数中选择的在所述处理目标的所述帧的紧前帧中的估计系数,所述估计值是基于所述输入信号的特征量、所述紧前帧的所述估计系数和所述输入信号的所述处理目标的所述帧的高频子带功率而计算的;
低频解码单元,该低频解码单元对所述低频编码数据进行解码并生成所述低频信号;
高频信号生成单元,该高频信号生成单元基于根据所述数据所获得的估计系数和通过解码所获得的低频信号来生成高频信号;以及
合成单元,该合成单元基于所述高频信号和通过解码获得的所述低频信号来生成输出信号。
根据[11]生成的解码装置,
其中,当确定禁止重复利用所述紧前帧的所述估计系数时,包括在所述输入代码串中的所述数据是用于通过以下方式来获得从所述多个估计系数中选择的估计系数的数据:针对多个估计系数中的每一个计算所述高频子带功率的估计值,并将所计算的估计值与所述高频子带功率进行比较。
根据[11]或[12]所述的解码装置,还包括:
数据解码单元,该数据解码单元对所述数据进行解码。
根据[11]至[13]中任一项所述的解码装置,
其中,当所述估计值与所述高频子带功率的差的平方和等于或小于预定阈值时,确定启用对所述估计系数的重复利用。
根据[11]至[14]中任一项所述的解码装置,
其中,针对包括所述输入信号的多个帧的处理目标部分生成一种数据。
根据[15]所述的解码装置,
其中,所述数据中包括在所述处理目标部分中指定如下部分的信息:所述部分包括选择相同估计系数的连续帧。
根据[16]所述的解码装置,
其中,所述数据中包括一条针对所述部分用于指定估计系数的信息。
一种解码方法,包括以下步骤:
将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得所述估计系数的所述数据是根据基于处理目标的帧的高频子带功率的估计值的、在所述处理目标的所述帧中是否启用对下述估计系数的重复利用的确定结果而生成的,所述估计系数为在预先准备的多个估计系数中选择的在所述处理目标的所述帧的紧前帧中的估计系数,所述估计值是基于所述输入信号的特征量、所述紧前帧的所述估计系数和所述输入信号的所述处理目标的所述帧的高频子带功率而计算的;
对所述低频编码数据进行解码并生成所述低频信号;
基于根据所述数据所获得的估计系数和通过解码所获得的所述低频信号来生成高频信号;以及
基于所述高频信号和通过解码所获得的所述低频信号来生成输出信号。
一种使计算机执行处理的程序,包括以下步骤:
将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得所述估计系数的所述数据是根据基于处理目标的帧的高频子带功率的估计值的、在所述处理目标的所述帧中是否启用对下述估计系数的重复利用的确定结果而生成的,所述估计系数为在预先准备的多个估计系数中选择的在所述处理目标的所述帧的紧前帧中的估计系数,所述估计值是基于所述输入信号的特征量、所述紧前帧的所述估计系数和所述输入信号的所述处理目标的所述帧的高频子带功率而计算的;
对所述低频编码数据进行解码并生成所述低频信号;
基于根据所述数据所获得的估计系数和通过解码所获得的所述低频信号来生成高频信号;以及
基于所述高频信号和通过解码所获得的所述低频信号来生成输出信号。
附图标记列表
11编码装置
32低频编码电路
33子带划分电路
34特征量计算电路
35伪高频子带功率计算电路
36伪高频子带功率差计算电路
37高频编码电路
38复用电路
51计算单元
52确定单元
53生成单元
Claims (19)
1.一种编码装置,包括:
子带划分单元,所述子带划分单元对输入信号执行频带划分并生成所述输入信号的高频侧的子带的高频子带信号;
计算单元,所述计算单元基于根据所述输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在所述输入信号的处理目标的帧的紧前帧中的估计系数,来计算伪高频子带功率作为所述处理目标的所述帧的高频子带信号的高频子带功率的估计值;
生成单元,当在所述处理目标的所述帧中启用对所述紧前帧的所述估计系数的重复利用时,所述生成单元基于所述伪高频子带功率和根据所述高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据;
低频编码单元,所述低频编码单元对所述低频信号进行编码并生成低频编码数据;以及
复用单元,所述复用单元对所述数据和所述低频编码数据进行复用并生成输出代码串。
2.根据权利要求1所述的编码装置,还包括:
伪高频子带功率计算单元,所述伪高频子带功率计算单元针对多个估计系数中的每一个、基于所述特征量和所述估计系数来计算所述伪高频子带功率;以及
选择单元,所述选择单元将由所述伪高频子带功率计算单元计算出的所述伪高频子带功率和所述高频子带功率进行比较并选择所述多个估计系数中的任一个,
其中,当禁止重复利用所述紧前帧的所述估计系数时,所述生成单元生成用于获得由所述选择单元选择的估计系数的数据。
3.根据权利要求2所述的编码装置,还包括:
高频编码单元,所述高频编码单元对所述数据进行编码并生成高频编码数据,
其中,所述复用单元对所述高频编码数据和所述低频编码数据进行复用并生成所述输出代码串。
4.根据权利要求3所述的编码装置,
其中,当所述高频侧的子带的所述伪高频子带功率与所述高频子带功率的差的平方和等于或小于预定阈值时,启用对所述估计系数的重复利用。
5.根据权利要求3所述的编码装置,
其中,根据表示所述伪高频子带功率与所述高频子带功率的相似度的评估值与预定阈值的比较结果来启用对所述估计系数的重复利用,所述相似度的评估值是基于所述高频侧的所述子带的所述伪高频子带功率和所述高频子带功率而计算的。
6.根据权利要求3所述的编码装置,
其中,所述生成单元生成针对包括所述输入信号的多个帧的处理目标部分的一种数据。
7.根据权利要求6所述的编码装置,
其中,所述数据中包括在所述处理目标部分中指定如下部分的信息:所述部分包括选择相同估计系数的连续帧。
8.根据权利要求7所述的编码装置,
其中,所述数据中包括一条针对所述部分用于指定所述估计系数的信息。
9.一种编码方法,包括以下步骤:
对输入信号执行频带划分并生成所述输入信号的高频侧的子带的高频子带信号;
基于根据所述输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在所述输入信号的处理目标的帧的紧前帧中的估计系数,来计算伪高频子带功率作为所述处理目标的所述帧的所述高频子带信号的高频子带功率的估计值;
当在所述处理目标的所述帧中启用对所述紧前帧的所述估计系数的重复利用时,基于所述伪高频子带功率和根据所述高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据;
对所述低频信号进行编码并生成低频编码数据;以及
对所述数据和所述低频编码数据进行复用并生成输出代码串。
10.一种使计算机执行处理的程序,所述处理包括以下步骤:
对输入信号执行频带划分并生成所述输入信号的高频侧的子带的高频子带信号;
基于根据所述输入信号的低频信号所获得的特征量和在预先准备的多个估计系数中选择的在所述输入信号的处理目标的帧的紧前帧中的估计系数,来计算伪高频子带功率作为所述处理目标的所述帧的所述高频子带信号的高频子带功率的估计值;
当在所述处理目标的所述帧中启用对所述紧前帧的所述估计系数的重复利用时,基于所述伪高频子带功率和根据所述高频子带信号获得的高频子带功率来生成用于获得重复利用启用的估计系数的数据;
对所述低频信号进行编码并生成低频编码数据;以及
对所述数据和所述低频编码数据进行复用并生成输出代码串。
11.一种解码装置,包括:
解复用单元,所述解复用单元将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得所述估计系数的所述数据是根据基于处理目标的帧的高频子带功率的估计值的、在所述处理目标的所述帧中是否启用对下述估计系数的重复利用的确定结果而生成的,所述估计系数为在预先准备的多个估计系数中选择的在所述处理目标的所述帧的紧前帧中的估计系数,所述估计值是基于所述输入信号的特征量、所述紧前帧的所述估计系数和所述输入信号的所述处理目标的所述帧的高频子带功率而计算的;
低频解码单元,所述低频解码单元对所述低频编码数据进行解码并生成所述低频信号;
高频信号生成单元,所述高频信号生成单元基于根据所述数据所获得的估计系数和通过解码所获得的低频信号来生成高频信号;以及
合成单元,所述合成单元基于所述高频信号和通过解码所获得的所述低频信号来生成输出信号。
12.根据权利要求11所述的解码装置,
其中,当确定禁止重复利用所述紧前帧的所述估计系数时,包括在所述输入代码串中的所述数据是用于通过以下方式来获得从所述多个估计系数中选择的估计系数的数据:针对多个估计系数中的每一个计算所述高频子带功率的估计值,并将所计算的估计值与所述高频子带功率进行比较。
13.根据权利要求11所述的解码装置,还包括:
数据解码单元,所述数据解码单元对所述数据进行解码。
14.根据权利要求11所述的解码装置,
其中,当所述估计值与所述高频子带功率的差的平方和等于或小于预定阈值时,确定启用对所述估计系数的重复利用。
15.根据权利要求11所述的解码装置,
其中,针对包括所述输入信号的多个帧的处理目标部分生成一种数据。
16.根据权利要求15所述的解码装置,
其中,所述数据中包括在所述处理目标部分中指定如下部分的信息:所述部分包括选择相同估计系数的连续帧。
17.根据权利要求16所述的解码装置,
其中,所述数据中包括一条针对所述部分用于指定所述估计系数的信息。
18.一种解码方法,包括步骤:
将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得所述估计系数的所述数据是根据基于处理目标的帧的高频子带功率的估计值的、在所述处理目标的所述帧中是否启用对下述估计系数的重复利用的确定结果而生成的,所述估计系数为在预先准备的多个估计系数中选择的在所述处理目标的所述帧的紧前帧中的估计系数,所述估计值是基于所述输入信号的特征量、所述紧前帧的所述估计系数和所述输入信号的所述处理目标的所述帧的高频子带功率而计算的;
对所述低频编码数据进行解码并生成所述低频信号;
基于根据所述数据所获得的估计系数和通过解码所获得的所述低频信号来生成高频信号;以及
基于所述高频信号和通过解码所获得的所述低频信号来生成输出信号。
19.一种使计算机执行处理的程序,所述处理包括以下步骤:
将输入代码串解复用成用于获得估计系数的数据和通过对输入信号的低频信号进行编码所获得的低频编码数据,其中,用于获得所述估计系数的所述数据是根据基于处理目标的帧的高频子带功率的估计值的、在所述处理目标的所述帧中是否启用对下述估计系数的重复利用的确定结果而生成的,所述估计系数为在预先准备的多个估计系数中选择的在所述处理目标的所述帧的紧前帧中的估计系数,所述估计值是基于所述输入信号的特征量、所述紧前帧的所述估计系数和所述输入信号的所述处理目标的所述帧的高频子带功率而计算的;
对所述低频编码数据进行解码并生成所述低频信号;
基于根据所述数据所获得的估计系数和通过解码所获得的所述低频信号来生成高频信号;以及
基于所述高频信号和通过解码所获得的所述低频信号来生成输出信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011182448A JP5942358B2 (ja) | 2011-08-24 | 2011-08-24 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP2011-182448 | 2011-08-24 | ||
PCT/JP2012/070682 WO2013027629A1 (ja) | 2011-08-24 | 2012-08-14 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103733258A true CN103733258A (zh) | 2014-04-16 |
CN103733258B CN103733258B (zh) | 2016-09-14 |
Family
ID=47746376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280040030.4A Active CN103733258B (zh) | 2011-08-24 | 2012-08-14 | 编码装置和方法、解码装置和方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9390717B2 (zh) |
EP (1) | EP2750132A4 (zh) |
JP (1) | JP5942358B2 (zh) |
KR (1) | KR20140050044A (zh) |
CN (1) | CN103733258B (zh) |
BR (1) | BR112014003676A2 (zh) |
WO (1) | WO2013027629A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509465A (zh) * | 2017-09-15 | 2019-03-22 | 阿里巴巴集团控股有限公司 | 语音信号的处理方法、组件、设备及介质 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5975243B2 (ja) * | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6037156B2 (ja) | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
KR20150032649A (ko) | 2012-07-02 | 2015-03-27 | 소니 주식회사 | 복호 장치 및 방법, 부호화 장치 및 방법, 및 프로그램 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
BR112016014476B1 (pt) | 2013-12-27 | 2021-11-23 | Sony Corporation | Aparelho e método de decodificação, e, meio de armazenamento legível por computador |
KR102546098B1 (ko) * | 2016-03-21 | 2023-06-22 | 한국전자통신연구원 | 블록 기반의 오디오 부호화/복호화 장치 및 그 방법 |
EP3288031A1 (en) * | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
CN109389987B (zh) | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
JP7017960B2 (ja) | 2018-03-19 | 2022-02-09 | 株式会社エクセディ | ボールベアリングの保持構造 |
CN113518227B (zh) * | 2020-04-09 | 2023-02-10 | 于江鸿 | 数据处理的方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101178898A (zh) * | 2006-11-09 | 2008-05-14 | 索尼株式会社 | 频带扩展装置及方法、播放装置、方法、程序及记录介质 |
JP2009116371A (ja) * | 2001-11-14 | 2009-05-28 | Panasonic Corp | 符号化装置および復号化装置 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
WO2011043227A1 (ja) * | 2009-10-07 | 2011-04-14 | ソニー株式会社 | 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03254223A (ja) | 1990-03-02 | 1991-11-13 | Eastman Kodak Japan Kk | アナログデータ伝送方式 |
US5581653A (en) * | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
US5809173A (en) * | 1995-04-18 | 1998-09-15 | Advanced Micro Devices, Inc. | Method and apparatus for improved video decompression using previous frame DCT coefficients |
JPH1020888A (ja) | 1996-07-02 | 1998-01-23 | Matsushita Electric Ind Co Ltd | 音声符号化・復号化装置 |
JP3926726B2 (ja) | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
DE60323331D1 (de) * | 2002-01-30 | 2008-10-16 | Matsushita Electric Ind Co Ltd | Verfahren und vorrichtung zur audio-kodierung und -dekodierung |
JP2003255973A (ja) | 2002-02-28 | 2003-09-10 | Nec Corp | 音声帯域拡張システムおよび方法 |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
CN1328707C (zh) | 2002-07-19 | 2007-07-25 | 日本电气株式会社 | 音频解码设备以及解码方法 |
JP4728568B2 (ja) | 2002-09-04 | 2011-07-20 | マイクロソフト コーポレーション | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 |
JP3881943B2 (ja) | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
KR20050027179A (ko) | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
KR100587953B1 (ko) | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
WO2006000842A1 (en) | 2004-05-28 | 2006-01-05 | Nokia Corporation | Multichannel audio extension |
KR100608062B1 (ko) | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
EP2752843A1 (en) | 2004-11-05 | 2014-07-09 | Panasonic Corporation | Encoder, decoder, encoding method, and decoding method |
CN101048649A (zh) | 2004-11-05 | 2007-10-03 | 松下电器产业株式会社 | 可扩展解码装置及可扩展编码装置 |
US8082156B2 (en) | 2005-01-11 | 2011-12-20 | Nec Corporation | Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal |
NZ562182A (en) | 2005-04-01 | 2010-03-26 | Qualcomm Inc | Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal |
US20070005351A1 (en) | 2005-06-30 | 2007-01-04 | Sathyendra Harsha M | Method and system for bandwidth expansion for voice communications |
CN101297356B (zh) * | 2005-11-04 | 2011-11-09 | 诺基亚公司 | 用于音频压缩的方法和设备 |
JP4876574B2 (ja) | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US7953604B2 (en) | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7590523B2 (en) | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
ATE501505T1 (de) | 2006-04-27 | 2011-03-15 | Panasonic Corp | Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür |
WO2007148925A1 (en) * | 2006-06-21 | 2007-12-27 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
US8295507B2 (en) | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
EP2209116B8 (en) | 2007-10-23 | 2014-08-06 | Clarion Co., Ltd. | Device and method for high-frequency range interpolation of an audio signal |
WO2009093466A1 (ja) | 2008-01-25 | 2009-07-30 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
JP5203077B2 (ja) * | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
US8532983B2 (en) | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
US8600749B2 (en) | 2009-12-08 | 2013-12-03 | At&T Intellectual Property I, L.P. | System and method for training adaptation-specific acoustic models for automatic speech recognition |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8560330B2 (en) | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5975243B2 (ja) | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP6037156B2 (ja) | 2011-08-24 | 2016-11-30 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
-
2011
- 2011-08-24 JP JP2011182448A patent/JP5942358B2/ja active Active
-
2012
- 2012-08-14 WO PCT/JP2012/070682 patent/WO2013027629A1/ja active Application Filing
- 2012-08-14 KR KR1020147003279A patent/KR20140050044A/ko not_active Application Discontinuation
- 2012-08-14 US US14/237,933 patent/US9390717B2/en active Active
- 2012-08-14 CN CN201280040030.4A patent/CN103733258B/zh active Active
- 2012-08-14 EP EP12825891.0A patent/EP2750132A4/en not_active Ceased
- 2012-08-14 BR BR112014003676A patent/BR112014003676A2/pt not_active Application Discontinuation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009116371A (ja) * | 2001-11-14 | 2009-05-28 | Panasonic Corp | 符号化装置および復号化装置 |
CN101178898A (zh) * | 2006-11-09 | 2008-05-14 | 索尼株式会社 | 频带扩展装置及方法、播放装置、方法、程序及记录介质 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
US20110137659A1 (en) * | 2008-08-29 | 2011-06-09 | Hiroyuki Honma | Frequency Band Extension Apparatus and Method, Encoding Apparatus and Method, Decoding Apparatus and Method, and Program |
WO2011043227A1 (ja) * | 2009-10-07 | 2011-04-14 | ソニー株式会社 | 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509465A (zh) * | 2017-09-15 | 2019-03-22 | 阿里巴巴集团控股有限公司 | 语音信号的处理方法、组件、设备及介质 |
CN109509465B (zh) * | 2017-09-15 | 2023-07-25 | 阿里巴巴集团控股有限公司 | 语音信号的处理方法、组件、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2013044921A (ja) | 2013-03-04 |
US9390717B2 (en) | 2016-07-12 |
CN103733258B (zh) | 2016-09-14 |
BR112014003676A2 (pt) | 2017-03-21 |
JP5942358B2 (ja) | 2016-06-29 |
EP2750132A1 (en) | 2014-07-02 |
WO2013027629A1 (ja) | 2013-02-28 |
KR20140050044A (ko) | 2014-04-28 |
US20140205101A1 (en) | 2014-07-24 |
EP2750132A4 (en) | 2015-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103733258A (zh) | 编码装置和方法、解码装置和方法以及程序 | |
US10381018B2 (en) | Signal processing apparatus and signal processing method, encoder and encoding method, decoder and decoding method, and program | |
KR101340233B1 (ko) | 스테레오 부호화 장치, 스테레오 복호 장치 및 스테레오부호화 방법 | |
EP2693430B1 (en) | Encoding apparatus and method, and program | |
KR101975066B1 (ko) | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 | |
AU2012297804B2 (en) | Encoding device and method, decoding device and method, and program | |
JP5154934B2 (ja) | 知覚的歪みを最小化する結合オーディオ符号化 | |
US9361900B2 (en) | Encoding device and method, decoding device and method, and program | |
US20130159005A1 (en) | Audio decoding device, audio decoding method, audio decoding program, audio encoding device, audio encoding method, and audio encoding program | |
US6934650B2 (en) | Noise signal analysis apparatus, noise signal synthesis apparatus, noise signal analysis method and noise signal synthesis method | |
US9830919B2 (en) | Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method | |
CN104269173B (zh) | 切换模式的音频带宽扩展装置与方法 | |
JP6859379B2 (ja) | 快適雑音生成モード選択のための装置および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |