CN103297058A - 对音频信号解码的设备 - Google Patents
对音频信号解码的设备 Download PDFInfo
- Publication number
- CN103297058A CN103297058A CN2013101279328A CN201310127932A CN103297058A CN 103297058 A CN103297058 A CN 103297058A CN 2013101279328 A CN2013101279328 A CN 2013101279328A CN 201310127932 A CN201310127932 A CN 201310127932A CN 103297058 A CN103297058 A CN 103297058A
- Authority
- CN
- China
- Prior art keywords
- signal
- frequency
- decoding
- frequency band
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 181
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 64
- 230000001105 regulatory effect Effects 0.000 claims description 32
- 238000000034 method Methods 0.000 abstract description 208
- 230000000593 degrading effect Effects 0.000 abstract 1
- 238000006243 chemical reaction Methods 0.000 description 140
- 230000009466 transformation Effects 0.000 description 67
- 230000003750 conditioning effect Effects 0.000 description 43
- 238000010586 diagram Methods 0.000 description 32
- 230000000873 masking effect Effects 0.000 description 28
- 238000011426 transformation method Methods 0.000 description 24
- 238000000844 transformation Methods 0.000 description 22
- 239000000284 extract Substances 0.000 description 20
- 238000004458 analytical method Methods 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 9
- 239000000203 mixture Substances 0.000 description 9
- 239000002131 composite material Substances 0.000 description 8
- 238000000605 extraction Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000004804 winding Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种对音频信号解码的设备。在所述编码方法和设备中,可从音频信号检测一个或多个重要的频率分量,可对频率分量编码,然后可对音频信号的包络线编码。在解码方法和设备中,可通过考虑频率分量的能量值,调节包含一个或多个重要的频率分量的一个或多个频带的包络线来对音频信号解码。因此,即使使用少量比特对音频信号编码或解码,也可在不降低音频信号的声音质量的情况下使编码效率最大化。
Description
本申请是申请日为2008年5月8日、申请号为200880015354.6、题为“对音频信号编码和解码的方法和设备”的专利申请的分案申请。
技术领域
本发明总体构思涉及一种对音频信号(比如语音信号或音乐信号)进行编码和解码的方法和设备,更具体地讲,涉及在受限制的环境中对音频信号进行有效编码和解码的方法和设备。
背景技术
对音频信号编码或解码受到环境(比如数据大小或者数据传输率)的限制。因此,在这种受限制的环境中提高声音的质量非常重要。为此,必须以以下所述的方式执行编码:与对人识别音频信号而言不重要的音频信号的数据相比,将更多的比特分配给对人识别音频信号而言重要的音频信号的数据。
发明内容
本发明总体构思提供一种如下所述的方法和设备:从音频信号检测一个或多个重要的频率分量,对频率分量编码,然后对音频信号的包络线编码。
本发明总体构思还提供一种如下所述的方法和设备:考虑每个频率分量的能量值通过调节包含一个或多个重要的频率分量的一个或多个频带中的每个频带的包络线来对音频信号解码。
将在下面的描述中部分地阐述本发明总体构思的另外方面和/或效用,部分地,本发明总体构思的另外方面和/或效用从下面的描述是明显的,或通过实施本发明总体构思而得知。
可通过提供一种对音频信号编码的方法而获得本发明总体构思上述和/或其他方面和效用,所述方法包括:根据预定标准从接收的音频信号检测一个或多个频率分量,然后对检测的一个或多个音频分量编码,以预定频带为单位计算接收的信号的能量值,然后对计算的能量值编码。
还可通过提供一种对音频信号编码的方法来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:根据预定标准从接收的信号检测一个或多个频率分量,然后对检测的一个或多个频率分量编码,并提取接收的信号的包络线并对其编码。
还可通过提供一种对音频信号编码的方法来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:根据预定标准从多个接收的信号检测一个或多个频率分量,然后对检测的一个或多个频率分量编码,以预定频带为单位计算接收的信号中具有小于预定频率的频带的一个或多个信号的每个信号的能量值,然后对能量值编码,使用具有小于预定频率的一个或多个信号对具有大于预定频率的频带的一个或多个信号编码。
所述方法还可包括对一个或多个预定频带的一个或多个信号的每个信号的音调编码。
还可通过提供一种对音频信号解码的方法来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:对一个或多个频率分量解码,对将分别在频带产生的一个或多个信号中的每个信号的能量值解码,基于解码的能量值并考虑解码的频率分量的能量值来计算所述一个或多个信号的每个信号的能量值,分别产生频带的具有计算的能量值之一的一个或多个信号,混合频率分量和产生的信号。
在计算能量值期间,可通过从每个频带的解码的能量值减去每个频率分量的能量值计算将在每个频带产生的一个或多个信号的能量值,其中,每个频率分量包含在频带之一中。
在产生所述一个或多个信号期间,可任意产生所述一个或多个信号。
在产生所述一个或多个信号期间,还可通过复制与小于预定频率的频带相应的一个或多个信号产生所述一个或多个信号。
在产生所述一个或多个信号期间,还可使用与小于预定频率的频带相应的一个或多个信号产生一个或多个信号。
所述方法还可包括:对一个或多个预定频带的每个频带的音调解码。
在计算能量值期间,还可考虑所述一个或多个预定频带的每个频带的音调。
还可通过提供一种对音频信号解码的方法来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:对一个或多个频率分量解码,对音频 信号的一个或多个包络线编码,考虑各个频带的一个或多个频率分量的能量值调节各个频带的一个或多个包络线,混合所述一个或多个频率分量和调节的包络线。
在调节包络线期间,可调节每个频带的包络线,以使每个频带的解码的包络线的能量值等于,从包含所述一个或多个解码的频率分量的每个频带包络线的能量值,减去包含在频带中的所述一个或多个频率分量的每个频率分量的能量值而获得的值。
还可通过提供一种对音频信号解码的方法来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:对一个或多个频率分量解码,对小于预定频率的多个频带的每个频带的信号的能量值解码,基于解码的能量值之一并考虑一个或多个频率分量的每个频率分量的能量值计算将在每个频带产生的信号的能量值,在小于预定频率的每个频带产生具有计算的能量值之一的信号,使用小于预定频率的每个频带的信号对大于预定频率的每个频带的信号解码,考虑各个频带的所述一个或多个频率分量的能量值调节大于预定频率的每个频带的信号,混合所述一个或多个频率分量、产生的信号和调节的信号。
在计算能量值期间,可通过从每个频带的解码的能量值减去在各个频带中包含的一个或多个频率分量之一的能量值来计算将在每个频带产生的信号的能量值。
在产生信号期间,可通过复制小于预定频率的每个频带的信号产生信号。
在产生信号期间,还可通过使用小于预定频率的每个频带的信号产生信号。
所述方法还可包括:如果施加到对一个或多个频率分量解码过程中的帧与施加到产生信号的过程的帧或者对大于预定频率的每个频带的信号解码的过程的帧不相同,则执行帧同步。
还可通过提供一种上面记录有执行对音频信号编码的方法的计算机程序的计算机可读介质来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:根据预定标准从接收的信号检测一个或多个频率分量,然后对检测一个或多个音频分量编码,以预定频带为单位计算接收的信号的能量值,然后对计算的能量值编码。
还可通过提供一种上面记录有执行对音频信号编码的方法的计算机程序 的计算机可读介质来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:根据预定标准从接收的信号检测一个或多个频率分量,然后对检测的一个或多个频率分量编码,并提取接收的信号的包络线并对其编码。
还可通过提供一种上面记录有执行对音频信号编码的方法的计算机程序的计算机可读介质来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:根据预定标准从多个接收的信号检测一个或多个频率分量,然后对检测的一个或多个频率分量编码,以预定频带为单位计算接收的信号中具有小于预定频率的频带的一个或多个信号的每个信号的能量值,然后对能量值编码,使用具有小于预定频率的一个或多个信号对具有大于预定频率的频带的一个或多个信号编码。
还可通过提供一种上面记录有执行对音频信号解码的方法的计算机程序的计算机可读介质来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:对一个或多个频率分量解码,对将分别在频带产生的一个或多个信号中的每个信号的能量值解码,基于解码的能量值并考虑解码的一个或多个频率分量的能量值来计算所述一个或多个信号的每个信号的能量值,分别产生频带的具有计算的能量值之一的一个或多个信号,混合所述一个或多个频率分量和所述一个或多个产生的信号。
还可通过提供一种上面记录有执行对音频信号解码的方法的计算机程序的计算机可读介质来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:对一个或多个频率分量解码,对音频信号的一个或多个包络线编码,考虑各个频带的一个或多个频率分量的能量值调节各个频带的一个或多个包络线,混合所述一个或多个频率分量和所述一个或多个调节的包络线。
还可通过提供一种上面记录有执行对音频信号编码的方法的计算机程序的计算机可读介质来实现本发明总体构思的上述和/或其他方面和效用,所述方法包括:对一个或多个频率分量解码,对小于预定频率的多个频带的每个频带的信号的能量值解码,基于解码的能量值之一并考虑一个或多个频率分量的每个频率分量的能量值计算将在每个频带产生的信号的能量值,在小于预定频率的每个频带产生具有计算的能量值之一的信号,使用小于预定频率的每个频带的信号对大于预定频率的每个频带的信号解码,考虑各个频带的所述一个或多个频率分量的能量值调节大于预定频率的每个频带的信号,混合所述一个或多个频率分量、产生的信号和调节的信号。
还可通过提供一种对音频信号编码的设备来实现本发明总体构思的上述和/或其他方面和效用,所述设备包括:频率分量编码单元,根据预定标准从接收的信号检测一个或多个频率分量,然后对所述一个或多个音频分量编码;能量值编码单元,以预定频带为单位计算接收的信号的能量值,并对其编码。
还可通过提供一种对音频信号编码的设备来实现本发明总体构思的上述和/或其他方面和效用,所述设备包括:频率分量编码单元,根据预定标准从接收的信号检测一个或多个频率分量,然后对一个或多个频率分量编码;包络线编码单元,提取接收的信号的一个或多个包络线,并对其编码。
还可通过提供一种对音频信号编码的设备来实现本发明总体构思的上述和/或其他方面和效用,所述设备包括:频率分量编码单元,根据预定标准从多个接收的信号检测一个或多个频率分量,然后对频率分量编码;能量值编码单元,在接收的信号中在小于预定频率的频带计算一个或多个信号的能量值,并对其编码;带宽扩展编码单元,使用小于预定频率的频带的一个或多个信号对接收的信号中大于预定频率的频带的一个或多个信号编码。
还可通过提供一种对音频信号解码的设备来实现本发明总体构思的上述和/或其他方面和效用,所述设备包括:频率分量解码单元,对一个或多个频率分量解码;能量值解码单元,对将在多个频带中的每个频带产生的信号的能量值解码;能量值计算单元,基于解码的能量值并考虑解码的一个或多个频率分量的能量值来计算将在每个频带产生的信号的能量值;信号产生单元,产生具有每个频带的计算的能量值之一的信号;信号混合单元,混合所述一个或多个频率分量和产生的信号。
还可通过提供一种对音频信号解码的设备来实现本发明总体构思的上述和/或其他方面和效用,所述设备包括:频率分量解码单元,对一个或多个频率分量解码;包络线解码单元,对音频信号的包络线解码;包络线调节单元,考虑各个频带的一个或多个频率分量的能量值调节各个频带的包络线;信号混合单元,混合所述一个或多个频率分量和调节的包络线。
还可通过提供一种对音频信号解码的设备来实现本发明总体构思的上述和/或其他方面和效用,所述设备包括:频率分量解码单元,对一个或多个频率分量解码;能量值解码单元,对小于预定频率的多个频带的每个频带的信号的能量值解码;能量值计算单元,基于解码的能量值并考虑解码的频率分量的能量值计算将在每个频带产生的信号的能量值;信号产生单元,在小于 预定频率的每个频带产生具有计算的能量值之一的信号;带宽扩展解码单元,使用小于预定频率的每个频带的信号对大于预定频率的每个频带的信号解码;信号调节单元,考虑各个频带的所述一个或多个频率分量的能量值调节大于预定频率的每个频带的信号;信号混合单元,混合所述一个或多个频率分量、产生的信号和调节的信号。
附图说明
从下面结合附图对实施例的描述中,本发明总体构思的这些和/或其他方面和优点将会更清楚并更容易理解:
图1是根据本发明总体构思的实施例的对音频信号编码的设备的框图;
图2是根据本发明总体构思的另一实施例的对音频信号解码的设备的框图;
图3是根据本发明总体构思的另一实施例的对音频信号编码的设备的框图;
图4是根据本发明总体构思的另一实施例的对音频信号解码的设备的框图;
图5是根据本发明总体构思的另一实施例的对音频信号编码的设备的框图;
图6是根据本发明总体构思的另一实施例的对音频信号解码的设备的框图;
图7是根据本发明总体构思的另一实施例的对音频信号编码的设备的框图;
图8是根据本发明总体构思的另一实施例的对音频信号解码的设备的框图;
图9是根据本发明总体构思的另一实施例的对音频信号编码的设备的框图;
图10是根据本发明总体构思的另一实施例的对音频信号解码的设备的框图;
图11是根据本发明总体构思的另一实施例的对音频信号编码的设备的框图;
图12是根据本发明总体构思的另一实施例的对音频信号解码的设备的框图;
图13是根据本发明总体构思的另一实施例的在解码设备中包括的信号调节单元的框图;
图14是示出根据本发明总体构思的当在图2、6、8或10示出的信号产生单元从单个信号产生信号时施加增益的电路图;
图15是示出根据本发明总体构思的当在图2、6、8或10示出的信号产生单元从多个信号产生信号时施加增益的电路图;
图16是示出根据本发明总体构思的实施例的对音频信号编码的方法的流程图;
图17是示出根据本发明总体构思的实施例的对音频信号解码的方法的流程图;
图18是示出根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图;
图19是示出根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图;
图20是示出根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图;
图21是示出根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图;
图22是示出根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图;
图23是示出根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图;
图24是示出根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图;
图25是示出根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图;
图26是示出根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图;
图27是示出根据本发明总体构思的另一实施例的对音频信号解码的方 法的流程图;
图28是详细示出根据本发明总体构思的实施例的在图17、21、23或25示出的操作1720、2120、2325或2520的流程图;
图29是根据本发明总体构思的实施例的对音频信号编码的设备的框图;
图30是根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图。
具体实施方式
现在将详细描述本发明总体构思的实施例,其中,本发明总体构思的示例在附图中示出,相同的附图标号始终表示相同的部件。下面将参照附图来描述实施例以解释本发明总体构思。
图1是根据本发明总体构思的实施例的对音频信号编码的设备的框图。编码设备可包括第一变换单元100、第二变换单元105、频率分量检测单元110、频率分量编码单元115、能量值计算单元120、能量值编码单元125、音调编码单元130和复用单元135。
第一变换单元100可通过使用第一预定变换方法将通过输入端子IN接收的音频信号从时域变换到频域。音频信号的示例是语音信号和音乐信号。
第二变换单元105可通过使用与第一变换方法不同的第二变换方法将接收的音频信号从时域变换到频域,以应用心理声学模型。
第一变换单元100变换的信号可被用于对音频信号编码。通过第二变换单元105变换的信号可被用于通过将心理声学模型应用到音频信号来检测重要的频率分量。所述心理声学模型是指关于人类听觉系统的掩蔽效应的数学模型。
例如,第一变换单元100可通过将修改的离散余弦变换(MDCT)用作第一变换方法将音频信号变换到频域来用实数表示音频信号;第二变换单元105通过将修改的离散正弦变换(MDST)用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行离散傅里叶变换(DFT),然后量化MDCT系数,从而防止失配的发生。
频率分量检测单元110可通过使用第二变换单元105变换的信号,根据预定的标准从第一变换单元100变换的信号中检测一个或多个重要的频率分量。在这种情况下,频率分量检测单元110可使用各种方法检测重要的频率 分量。第一,可计算信号的信掩比(SMR),然后,如果SMR大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定频率分量是否重要。第三,可计算每个子带的信噪比(SNR),然后可将具有小SNR的子带中其峰值大于等于预定值的频率分量确定为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
频率分量编码单元115可对频率分量检测单元110检测的频率分量以及表示所述频率分量的位置的信息编码。
能量值计算单元120可计算在第一变换单元100变换的信号的每个频带的信号的能量值。这里,每个频带可以是在正交镜像滤波器(QMF)的情况下的比例因子频带或者是子带。
能量值编码单元125可对能量值计算单元120计算的频带的能量值和表示频带的位置的信息编码。
音调编码单元130可计算包含频率分量检测单元110检测的频率分量的每个频带的信号的音调,并对其编码。对于本发明总体发明构思,音调编码单元130并不是必不可少的,但是当解码设备(未示出)在具有频率分量的频带中从多个信号而非单个信号产生信号时,可需要音调编码单元130。例如,对于解码设备通过使用任意产生的信号和修补的信号在具有所述频率分量的频带中产生一个或多个信号而言,可需要音调编码单元130。
复用单元135可将可被频率分量编码单元115编码的所有频率分量和表示频率分量的位置的信息以及可被能量值编码单元125编码的频带的能量值和表示频带的位置的信息复用为比特流,然后通过输出端子OUT输出比特流。作为选择,被音调编码单元130编码的音调也可被复用到比特流。
图2是根据本发明总体构思的实施例的对音频信号解码的设备的框图。所述解码设备可包括解复用单元200、频率分量解码单元205、能量值解码单元210、信号产生单元215、信号调节单元220、信号混合单元225和逆变换单元230。
解复用单元200可通过输入端子IN从编码端接收比特流,然后可对接收的比特流解复用。例如,解复用单元200可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、频带的能量值、表示其能量值被编码 设备编码的频带的位置的信息和音调。
频率分量解码单元205可对根据预定标准被确定为重要的频率分量然后被编码设备编码的一个或多个预定频率分量解码。
能量值解码单元210可对每个频带的信号的能量值解码。
音调解码单元213可对包含频率分量解码单元205解码的频率分量的频带的信号的音调解码。然而,音调解码单元213对于本发明总体构思并不是必不可少的,但是在信号产生单元215从多个信号而非单个信号中产生信号时可需要音调解码单元213。例如,对于信号产生单元215通过使用任意产生的信号和修补的信号在包含频率分量解码单元205解码的频率分量的每个频带产生信号而言,会需要音调解码单元213。如果音调解码单元213被包括在本发明总体构思中,则信号调节单元220可考虑音调解码单元213解码的音调来调节信号产生单元215产生的信号。
信号产生单元215可为每个频带产生信号,其中,每个信号都具有能量值解码单元210解码的频带的能量值。
信号产生单元215可使用各种方法在频带中产生信号。第一,信号产生单元215可任意产生噪声信号,例如随机噪声信号。第二,如果预定频带中的信号是与大于预定频率的频带相应的高频信号,并且与小于预定频率的频带相应的低频信号已经被解码因而可用,则信号产生单元215可通过复制低频信号来产生信号。例如,通过修补(patch)或者交迭(fold)低频信号来产生信号。
信号调节单元220可调节信号产生单元215产生的信号中包含频率分量解码单元205解码的频率分量的频带的信号。这里,信号调节单元220可调节信号产生单元215产生的信号,从而可基于能量解码单元210解码的频带的能量值并考虑频率分量解码单元205解码的频率分量的能量值来调节信号的能量。稍后将参照图13来更详细地描述信号调节单元220。
然而,信号调节单元220可不调节信号产生单元215产生的信号中不包含频率分量解码单元205解码的频率分量的其他频带的信号。
信号混合单元225可针对包含解码的频率分量的频带输出混合信号调节单元220调节的信号和频率分量解码单元205解码的频率分量的结果,并可针对其他频带输出信号产生单元215产生的信号。
逆变换单元230可根据第一预定逆变换方法(图1的第一变换单元100 所执行的第一变换方法的逆运算)将从信号混合单元225输出的信号从频域变换到时域,然后通过输出端子OUT输出变换的信号。第一逆变换方法可以是逆修改的离散余弦变换(IMDCT)。
图3是根据本发明总体构思的另一实施例的对音频信号编码的设备的框图。编码设备可包括第一变换单元300、第二变换单元305、频率分量检测单元310、频率分量编码单元315、包络线(envelope)提取单元320、包络线编码单元325和复用单元330。
所述第一变换单元300可根据第一预定变换方法将通过输入端子IN接收的音频信号从时域变换到频域。所述音频信号可以是语音信号或者音乐信号。
第二变换单元305可通过使用与第一变换方法不同的第二变换方法将接收的音频信号从时域变换到频域,以应用心理声学模型。
第一变换单元300变换的信号可被用于对音频信号编码。第二变换单元305变换的信号可用于通过将心理声学模型应用到音频信号来检测重要的频率分量。所述心理声学模型是指关于人类听觉系统的掩蔽效应的数学模型。
例如,第一变换单元300可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;第二变换单元305通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后量化MDCT系数,从而防止失配的发生。
频率分量检测单元310可通过使用第二变换单元305变换的信号,根据预定的标准从第一变换单元300变换的信号中检测一个或多个重要的频率分量。在这种情况下,频率分量检测单元310可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果SMR大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定频率分量是否重要。第三,可计算每个子带的SNR,然后可将具有小SNR的子带中其峰值大于等于预定值的频率分量确定为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
频率分量编码单元315可对频率分量检测单元310检测的频率分量以及表示频率分量的位置的信息编码。
包络线提取单元320可提取第一变换单元300变换的信号的包络线。
包络线编码单元325可对包络线提取单元320提取的包络线进行编码。
复用单元330可将可被频率分量编码单元315编码的频率分量和表示频率分量的位置的信息以及被包络线编码单元325编码的包络线复用为比特流,然后可通过输出端子OUT输出比特流。
图4是根据本发明总体构思的实施例的对音频信号解码的设备的框图。解码设备可包括解复用单元400、频率分量解码单元405、包络线解码单元410、能量计算单元415、包络线调节单元420、信号混合单元425和逆变换单元430。
解复用单元400可通过输入端子IN从编码端接收比特流,然后可对比特流解复用。例如,解复用单元400可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息和被编码设备(未示出)编码的包络线。
频率分量解码单元405可对可根据预定标准被确定为重要的频率分量然后被编码设备编码的频率分量解码。
包络线解码单元410可对编码设备编码的包络线解码。
能量计算单元415可计算频率分量解码单元405解码的频率分量的能量值。
包络线调节单元420可调节包络线解码单元410解码的包络线中包含频率分量解码单元405解码的频率分量的一个或多个频带的一个或多个信号。这里,包络线调节单元420可执行包络线调节,以使每个频带的解码的包络线的能量值可等于通过从包含频率分量解码单元405解码的频率分量的每个频带的包络线的能量值,减去包含在频带中的每个频率分量的能量值而获得的值。
然而,包络线调节单元420可不调节包络线解码单元415解码的包络线中不包含频率分量解码单元405解码的频率分量的其他频带的信号。
信号混合单元425可针对包含解码的频率分量的频带,输出混合频率分量解码单元405解码的频率分量和通过包络线调节单元420调节的包络线的结果,并可针对其他频带输出包络线解码单元410解码的信号。
逆变换单元430可根据第一预定逆变换方法(图3的第一变换单元300 所执行的第一变换方法的逆运算)将从信号混合单元425输出的信号从频域变换到时域,然后可通过输出端子OUT输出变换的信号。第一逆变换方法可以是逆修改的离散余弦变换(IMDCT)。
图5是根据本发明总体构思的实施例的对音频信号编码的设备的框图。所述设备可包括第一变换单元500、第二变换单元505、频率分量检测单元510、频率分量编码单元515、能量值计算单元520、能量值编码单元525、第三变换单元530、带宽扩展编码单元535、音调编码单元540和复用单元545。
第一变换单元500可通过使用第一预定变换方法将通过输入端子IN接收的音频信号从时域变换到频域。音频信号的示例是语音信号和音乐信号。
第二变换单元505可通过使用与第一变换方法不同的第二变换方法将接收的音频信号从时域变换到频域,以应用心理声学模型。
第一变换单元500变换的信号可被用于对音频信号编码。第二变换单元505变换的信号可被用于通过将心理声学模型应用到音频信号来检测重要的频率分量。所述心理声学模型是指关于人类听觉系统的掩蔽效应的数学模型。
例如,第一变换单元500可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;第二变换单元505通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后量化MDCT系数,从而防止失配的发生。
频率分量检测单元510可通过使用第二变换单元505变换的信号,根据预定的标准从第一变换单元500变换的信号中检测一个或多个重要的频率分量。在这种情况下,频率分量检测单元510可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果SMR大于掩蔽值的倒数,则将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定频率分量是否重要。第三,可计算每个子带的SNR,并将具有小SNR的子带中其峰值大于等于预定值的频率分量确定为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的 结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
频率分量编码单元515可对频率分量检测单元510检测的频率分量以及表示频率分量的位置的信息编码。
能量值计算单元520可计算包含频率分量编码单元515编码的频率分量的频带或者与小于预定频率的频带相应的频带的信号的能量值。这里,每个频带可以是在QMF的情况下的比例因子频带或者是子带。
能量值编码单元525可对能量值计算单元520计算的频带的能量值和表示频带的位置的信息编码。
第三变换单元530可通过使用分析滤波器组以预定频带为单位来对接收的音频信号执行域变换,从而可在时域中表示所述信号。例如,第三变换单元530可以使用QMF执行域变换。
带宽扩展编码单元535可通过使用与小于预定频率的频带相应的低频信号,对包含频率分量检测单元510检测的频率分量的频带中与大于预定频率的频带相应的并由第三变换单元530变形的信号编码。对于编码,可对用于通过使用低频信号对大于预定频率的频带的信号解码的信息进行编码。
音调编码单元540可计算包含频率分量检测单元510检测的频率分量的频带中的并可被第一变换单元500变换的信号的音调,然后可对所述音调编码。对于本发明总体发明构思,音调编码单元540并不是必不可少的,但是在解码设备(未示出)使用多个信号而非单个信号在包含频率分量的频带产生信号时,可需要音调编码单元540。例如,如果解码设备通过使用随机产生的信号和修补的信号产生包含频率分量的频带,则可需要音调编码单元540。
复用单元545可将可被频率分量编码单元515编码的频率分量和表示频率分量的位置的信息、可被能量值编码单元525编码的每个频带的能量值以及表示每个频带的位置的信息、以及用于对大于预定频率的频带中不包含所述频率分量的频带的信号解码的信息(从低频信号产生并被带宽扩展编码单元535编码的信息)复用为比特流,然后可通过输出端子OUT输出比特流。作为选择,音调编码单元540编码的音调也可被复用到比特流。
图6是根据本发明总体构思的实施例的对音频信号解码的设备的框图。所述设备可包括解复用单元600、频率分量解码单元605、能量值解码单元610、音调解码单元613、信号产生单元615、信号调节单元620、第一信号 混合单元625、第一逆变换单元630、第二变换单元635、同步单元640、带宽扩展解码单元645、第二逆变换单元650和第二信号混合单元655。
解复用单元600可通过输入端子IN从编码端接收比特流,然后可对比特流解复用。例如,解复用单元600可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、频带的能量值、表示被编码设备(未示出)编码的频带的位置的信息、用于通过使用与小于预定频率的频带相应的信号对大于预定频率的频带中不包含所述频率分量的频带的信号解码的信息和音调。
频率分量解码单元605可对根据预定标准被确定为重要的频率分量然后被编码设备编码的一个或多个预定频率分量解码。
能量值解码单元610可对包含频率分量解码单元605解码的频率分量的频带或者与小于预定频率的频带的信号的能量值解码。
音调解码单元613可对包含频率分量解码单元605解码的频率分量的频带的信号的音调解码。然而,音调解码单元613对于本发明总体构思并不是必不可少的,但是在信号产生单元615从多个信号而非单个信号中产生信号时可需要音调解码单元613。例如,对于信号产生单元615通过使用任意产生的信号和修补的信号在包含频率分量解码单元605解码的频率分量的频带中产生一个或多个信号而言,需要音调解码单元613。如果音调解码单元613被包括在本发明总体构思中,则信号调节单元620可考虑音调解码单元613解码的音调来调节信号产生单元615产生的信号。
信号产生单元615可产生具有包含能量值解码单元610解码的频率分量的频带或者频带中小于预定频率的频带的能量值的信号。
信号产生单元615可使用各种方法以产生信号。第一,信号产生单元615可任意产生噪声信号,例如随机噪声信号。第二,如果预定频带的信号是与大于预定频率的频带相应的高频信号,并且与小于预定频率的频带相应的低频信号已经被解码因而可用,则信号产生单元615可通过复制低频信号来产生信号。例如,通过修补或者交迭低频信号来产生信号。
信号调节单元620可调节信号产生单元615产生的信号中包含频率分量解码单元605解码的频率分量的频带的信号。详细地讲,信号调节单元620可调节信号产生单元615产生的信号,从而可基于能量解码单元210解码的频带的能量值并考虑频率分量解码单元605解码的频率分量的能量值来调节 信号的能量值。稍后将参照图13来更详细地描述信号调节单元620。
第一信号混合单元625可针对包含解码的频率分量的频带输出混合信号调节单元620调节的信号和频率分量解码单元605解码的频率分量的结果,并可针对不包含解码的频率分量的其他频带中小于预定频率的频带输出信号产生单元615产生的信号。
逆变换单元630可根据第一预定逆变换方法(图5的第一变换单元500所执行的第一变换方法的逆运算)将从信号混合单元625输出的信号从频域变换到时域。第一逆变换方法可以是IMDCT。
第二变换单元635可通过使用分析滤波器组以预定频带为单位对第一逆变换单元630逆变换的信号执行域变换,从而在时域中表示所述信号。例如,第二变换单元635可使用QMF执行域变换。
如果施加到频率分量解码单元605的帧与施加到带宽扩展解码单元645的帧不相同,则同步单元640将施加到频率分量解码单元605的帧和施加到带宽扩展解码单元645的帧进行同步。这里,同步单元640可基于施加到频率分量解码单元605的帧处理施加到带宽扩展解码单元645的所有的帧或者其中的一些帧。
带宽扩展解码单元645可通过使用第二变换单元635变换的信号中与小于预定频率的频带相应的信号,来对大于预定频率的频带中不包含频率分量解码单元605解码的频率分量的频带的信号解码。对于解码,带宽扩展解码单元645使用解复用信息来通过使用小于预定频率的频带的信号对大于预定频率的频带的信号解码。
第二逆变换单元650可通过使用合成滤波器组对带宽扩展解码单元645解码的信号的域执行逆变换,其中,所述逆变换可以是第二变换单元635执行的变换的逆运算。
第二信号混合单元655可将通过第一逆变换单元630逆变换的信号和第二逆变换单元650逆变换的信号混合。第一逆变换单元630逆变换的信号可包括包含频率分量解码单元605解码的频率分量的频带的信号,和不包含解码的频率分量的其他频带中小于预定频率的频带的信号。此外,第二逆变换单元650逆变换的信号可包括不包含解码的频率分量的频带中大于预定频率频带的信号。因此,第二信号混合单元655可恢复整个频带的音频信号,并通过输出端子OUT输出恢复的信号。
图7是根据本发明总体构思的实施例的对音频信号编码的设备的框图。所述设备可包括第一变换单元700、第二变换单元705、频率分量检测单元710、频率分量编码单元715、能量值计算单元720、能量值编码单元725、第三变换单元730、带宽扩展编码单元735、音调编码单元740和复用单元745。
第一变换单元700可通过使用第一预定变换方法将通过输入端子IN接收的音频信号从时域变换到频域。音频信号的示例是语音信号和音乐信号。
第二变换单元705可通过使用与第一变换方法不同的第二变换方法将接收的音频信号从时域变换到频域,以应用心理声学模型。
第一变换单元700变换的信号可被用于对音频信号编码。第二变换单元705变换的信号可被用于通过将心理声学模型应用到音频信号来检测重要的频率分量。所述心理声学模型是指关于人类听觉系统的掩蔽效应的数学模型。
例如,第一变换单元700可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;第二变换单元705通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后量化MDCT系数,从而防止失配的发生。
频率分量检测单元710可通过使用第二变换单元705变换的信号,根据预定的标准从第一变换单元700变换的信号中检测一个或多个重要的频率分量。在这种情况下,频率分量检测单元710可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果SMR大于掩蔽值的倒数,则将信号确定为重要的频率分量。第二,考虑预定权值通过提取频谱峰值来确定频率分量是否重要。第三,可计算每个子带的SNR,然后可将具有小SNR的子带中其峰值大于等于预定值的频率分量确定为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
频率分量编码单元715可对频率分量检测单元710检测的频率分量以及表示频率分量的位置的信息编码。
能量值计算单元720可计算小于预定频率的频带的信号的能量值。这里,每个频带可以是在QMF的情况下的比例因子频带或者是子带。
能量值编码单元725可对能量值计算单元720计算的频带的能量值和表示所述频带的位置的信息编码。
第三变换单元730可通过使用分析滤波器组以预定频带为单位来对接收的音频信号执行域变换,从而可在时域中表示所述音频信号。例如,第三变换单元730可以使用QMF执行域变换。
带宽扩展编码单元735可通过使用与小于预定频率的频带相应的低频信号,对第三变换单元730变换的信号中与大于预定频率的频带相应的高频信号编码。对于编码,可对用于通过使用低频信号对大于第二频率的频带的信号解码的信息进行编码。
音调编码单元740可计算包含频率分量检测单元710检测的频率分量的频带的信号的音调,并对其编码。对于本发明总体发明构思,音调编码单元740并不是必不可少的,但是在解码设备(未示出)从多个信号而非单个信号在具有所述频率分量的频带产生信号时,可需要音调编码单元740。例如,对于解码设备通过使用任意产生的信号和修补的信号在具有所述频率分量的频带产生一个或多个信号而言,需要音调编码单元740。
复用单元745可将可被频率分量编码单元715编码的频率分量和表示频率分量的位置的信息、可被能量值编码单元725编码的频带的能量值和表示所述频带的位置的信息、以及可被带宽扩展编码单元735编码并用于使用低频信号对高频信号解码的信息复用为比特流,然后可通过输出端子OUT输出比特流。作为选择,音调编码单元740编码的音调也可被复用到比特流。
图8是根据本发明总体构思的实施例的对音频信号解码的设备的框图。解码设备可包括解复用单元800、频率分量解码单元805、能量值解码单元810、音调解码单元815、信号产生单元820、第一信号调节单元825、第一信号混合单元830、第一逆变换单元835、第二变换单元840、同步单元845、带宽扩展解码单元850、第二信号调节单元855、第二信号混合单元860、第二逆变换单元865和域合并单元870。
解复用单元800可通过输入端子IN从编码端接收比特流,然后可对比特流解复用。例如,解复用单元800可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、每个频带的能量值、表示能量值被编码设备(未 示出)编码的频带的位置的信息、用于通过使用具有小于预定频率的频带的信号对具有大于预定频率的频带的信号解码的信息和信号的音调。
频率分量解码单元805可对根据预定标准被确定为重要的频率分量然后被编码设备编码的一个或多个预定频率分量解码。
能量值解码单元810可对具有小于预定频率的频带的低频信号的频带的能量值解码。
音调解码单元815可对小于预定频率的频带中包含频率分量解码单元805解码的频率分量的频带的信号的音调解码。然而,音调解码单元815对于本发明总体构思并不是必不可少的,但是在信号产生单元820从多个信号而非单个信号中产生信号时可需要音调解码单元815。例如,对于信号产生单元820通过使用任意产生的信号和修补的信号在包含频率分量解码单元805解码的频率分量的频带产生一个或多个信号而言,会需要音调解码单元815。如果音调解码单元815被包括在本发明总体构思中,则第一信号调节单元825可考虑音调解码单元815解码的音调来调节信号产生单元820产生的信号。
信号产生单元820可为每个频带产生每个都具有能量值解码单元810解码的频带的能量值的信号。
信号产生单元820可使用各种方法以产生频带的信号。第一,信号产生单元820可任意产生噪声信号,例如随机噪声信号。第二,如果预定频带的信号已经被解码因而可用,则信号产生单元820可通过复制解码的信号来产生信号。例如,通过修补或者交迭解码的信号来产生信号。
第一信号调节单元825可在信号产生单元820产生的信号中调节小于预定频率的频带中包含频率分量解码单元805解码的频率分量的频带的信号。这里,第一信号调节单元825可调节信号产生单元820产生的信号,从而可基于能量值解码单元810解码的每个频带的能量值并考虑到频率分量解码单元805解码的频率分量的能量值来调节信号的能量值。稍后将参照图13来更详细地描述第一信号调节单元825。
第一信号混合单元830可在小于预定频率的频带中包含解码的频率分量的频带,输出混合频率分量解码单元805解码的频率分量和第一信号调节单元825调节的信号的结果,并可在不包含解码的频率分量的其他频带中输出信号产生单元820产生的信号。
第一逆变换单元835可根据预定第一逆变换方法对第一信号混合单元830恢复的低频信号执行从频域到时域的域变换,所述域变换可以是图7的第一变换单元700所执行的变换的逆运算。所述第一逆变换方法的示例是IMDCT。
第二变换单元840可通过使用分析滤波器组以预定频带为单位对第一逆变换单元835逆变换的低频信号执行域变换,从而在时域中表示所述信号。例如,第二变换单元840可应用QMF执行域变换。
如果施加到频率分量解码单元805的帧与施加到带宽扩展解码单元850的帧不相同,则同步单元845将施加到频率分量解码单元805的帧和施加到带宽扩展解码单元850的帧进行同步。这里,同步单元845可基于施加到频率分量解码单元805的帧处理施加到带宽扩展解码单元850的所有的帧或者其中的一些帧。
带宽扩展解码单元850可通过使用第二变换单元840变换的低频信号来对大于预定频率的频带相应的高频信号解码。对于解码,带宽扩展解码单元850使用信息通过利用解复用单元800解复用的低频信号对高频信号解码。
第二信号调节单元855可调节带宽扩展解码单元850解码的高频信号中包含频率分量解码单元805解码的频率分量的频带的信号。
首先,第二信号调节单元855可计算大于预定频率的频带的频率分量的能量值。此外,第二信号调节单元855可调节带宽扩展解码单元850解码的高频信号,从而第二信号调节单元855调节的频带的信号的能量值可等于通过从带宽扩展解码单元850解码的信号的能量值,减去在每个频带中包含的频率分量的能量值而获得的值。
第二信号混合单元860可在大于预定频率的频带中包含解码的频率分量的频带,输出混合频率分量解码单元805解码的频率分量和第二信号调节单元855调节的信号的结果,并可在不包含解码的频率分量的其他频带中输出带扩扩展解码单元850解码的信号。因此,第二信号混合单元860可恢复高频信号。
第二逆变换单元865可通过使用合成滤波器组对第二信号混合单元860恢复的高频信号的域执行逆变换,其中,所述逆变换是第二变换单元840执行的变换的逆运算。
域合并单元870可将第一逆变换单元835逆变换的低频信号和第二逆变 换单元865变换的高频信号混合,然后可通过输出端子OUT输出混合的结果。
图9是根据本发明总体构思的另一实施例的对音频信号编码的设备的框图。编码设备可包括域划分单元900、第一变换单元903、第二变换单元905、频率分量检测单元910、频率分量编码单元915、能量值计算单元920、能量值编码单元925、第三变换单元935、带宽扩展编码单元940、音调编码单元930和复用单元945。
域划分单元900将通过输入端子IN接收的信号基于预定频率划分为低频信号和高频信号。这里,低频信号具有小于第一频率的频带,高频信号具有大于第二频率的频带。在本发明总体构思的一方面,第一频率和第二频率可以是相同的频率,但是,应该理解,第一频率和第二频率也可以互不相同。
第一变换单元903可根据第一预定变换方法将从域划分单元900接收的低频信号从时域变换到频域。
第二变换单元905可根据与第一预定变换方法不同的第二预定变换方法将低频信号从时域变换到频域,以应用心理声学模型。
第一变换单元903变换的信号可被用于对低频信号进行编码。第二变换单元905变换的信号可被用于通过将心理声学模型应用到低频信号来检测一个或多个重要的频率分量。所述心理声学模型是指关于人类听觉系统的掩蔽效应的数学模型。
例如,第一变换单元903可通过将MDCT用作第一变换方法将低频信号变换到频域来用实数表示低频信号;第二变换单元905通过将MDST用作第二变换方法将低频信号变换到频域来用虚数表示低频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对低频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到低频信号而检测重要的频率分量。因此,由于还可表示低频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
频率分量检测单元910可通过使用第二变换单元905变换的信号,根据预定的标准从第一变换单元903变换的低频信号中检测一个或多个重要的频率分量。在这种情况下,频率分量检测单元910可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果SMR大于掩蔽值的倒数,则将信号确定为重要的频率分量。第二,可通过考虑预定权值而提取频谱峰 值来确定频率分量是否重要。第三,可计算每个子带的SNR,并将具有小SNR的子带中其峰值大于等于预定值的频率分量确定为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
频率分量编码单元915可对频率分量检测单元910检测的低频信号的频率分量以及表示频率分量的位置的信息编码。
能量值计算单元920可计算第一变换单元903变换的低频信号的每个频带的信号的能量值。这里,每个频带可以是在QMF的情况下的比例因子频带或者是子带。
能量值编码单元925可对能量值计算单元920计算的每个频带的能量值和表示频带的位置的信息编码。
音调编码单元930可计算包含频率分量检测单元910检测的频率分量的频带的信号的音调,并对其编码。对于本发明总体发明构思,音调编码单元930并不是必不可少的,但是在解码设备(未示出)从多个信号而非单个信号在具有频率分量的频带产生信号时,可需要音调编码单元930。例如,对于解码设备通过使用任意产生的信号和修补的信号在具有频率分量的频带产生一个或多个信号而言,可需要音调编码单元930。
第三变换单元935可通过使用分析滤波器组以预定频带为单位对从域划分单元900接收的高频信号执行域变换,从而可以在时域中表示所述高频信号。例如,第三变换单元935可以通过利用QMF执行域变换。
带宽扩展编码单元940可通过使用低频信号,对第三变换单元935变换的高频信号编码。对于编码,可产生用于通过使用低频信号对高频信号解码的信息,并对所述信息进行编码。
复用单元945可将可被频率分量编码单元915编码的所有频率分量和表示频率分量的位置的信息、可被能量值编码单元925编码的频带的能量值和表示频带的位置的信息、以及可被带宽扩展编码单元940编码并用于使用低频信号对高频信号解码的信息复用为比特流,然后可通过输出端子OUT输出比特流。作为选择,音调编码单元930编码的音调也可被复用到比特流。
图10是根据本发明总体构思的另一实施例的对音频信号解码的设备的框图。解码设备可包括解复用单元1000、频率分量解码单元1005、能量值解码单元1010、信号产生单元1015、信号调节单元1020、信号混合单元1025、 第一逆变换单元1030、第二变换单元1035、同步单元1040、带宽扩展解码单元1045、第二逆变换单元1050和域合并单元1055。
解复用单元1000可通过输入端子IN从编码端接收比特流,然后可对比特流解复用。例如,解复用单元1000可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、频带的能量值、表示其能量值可被编码设备(未示出)编码的频带的位置的信息、用于通过使用低频信号对高频信号编码的信息和信号的音调。
频率分量解码单元1005可针对具有小于预定频率的频带的低频信号对根据预定标准被确定为重要的频率分量然后被编码设备编码的一个或多个预定频率分量解码。
能量值解码单元1010可对小于预定频率的每个频带的信号的能量值解码。
信号产生单元1015可为每个频带产生每个都具有能量值解码单元1010解码的频带的能量值的信号。
信号产生单元1015可使用各种方法以产生信号。第一,信号产生单元1015可任意产生噪声信号,例如随机噪声信号。第二,如果预定频带的信号是与高频带相应的信号,并且与低频带相应的信号已经被解码因而可用,则信号产生单元1015可通过复制与低频带相应的信号来产生信号。例如,通过修补或者交迭与低频带相应的信号来产生信号。
信号调节单元1020可在信号产生单元1015产生的信号中调节包含频率分量解码单元1005解码的频率分量的频带的信号。这里,信号调节单元1020可调节信号产生单元1015产生的信号,从而可基于能量值解码单元1010解码的频带的能量值并考虑频率分量解码单元1005解码的频率分量的能量值来调节信号的能量。稍后将参照图13来更详细地描述信号调节单元1020。
然而,信号调节单元1020可以不调节信号产生单元1015产生的信号中不包含频率分量解码单元1005解码的频率分量的频带的其他信号。
信号混合单元1025可针对小于预定频率的频带中包含解码的频率分量的频带,输出混合频率分量解码单元1005解码的频率分量和信号调节单元1020调节的信号的结果,并可针对不包含解码的频率分量的其他频带输出信号产生单元1015产生的信号。因此,信号混合单元1025可恢复低频信号。
第一逆变换单元1030可根据第一预定逆变换方法(可以是图9的第一变 换单元903所执行的变换的逆运算)将信号混合单元1025输出的低频信号从频域变换到时域。所述第一逆变换方法可以是IMDCT。
第二变换单元1035可通过使用分析滤波器组以预定频带为单位对第一逆变换单元1030逆变换的低频信号执行域变换,从而可在时域中表示所述信号。例如,第二变换单元1035可应用QMF执行域变换。
如果施加到频率分量解码单元1005的帧与施加到带宽扩展解码单元1045的帧不相同,则同步单元1040将施加到频率分量解码单元1005的帧和施加到带宽扩展解码单元1045的帧进行同步。这里,同步单元1040可基于施加到频率分量解码单元1005的帧处理施加到带宽扩展解码单元1045的所有的帧或者其中的一些帧。
带宽扩展解码单元1045可通过使用第二变换单元1035变换的低频信号来对高频信号解码。对于解码,可使用用于通过使用解复用单元1000解复用的低频信号来对高频信号解码的信息。
第二逆变换单元1050可通过使用合成滤波器组以与第二变换单元1035执行变换的相反方式对带宽扩展解码单元1045解码的高频信号的域进行逆变换。
域合并单元1055可将第一逆变换单元1030逆变换的低频信号和第二逆变换单元1050逆变换的高频信号混合,然后可通过输出端子OUT输出混合的结果。
图11是根据本发明总体构思的另一实施例的对音频信号编码的设备的框图。编码设备可包括域划分单元1100、第一变换单元1103、第二变换单元1105、频率分量检测单元1110、频率分量编码单元1115、包络线提取单元1120、包络线编码单元1125、第三变换单元1130、带宽扩展编码单元1135和复用单元1140。
域划分单元1100将通过输入端子IN接收的信号基于预定频率划分为低频信号和高频信号。这里,低频信号具有小于预定第一频率的频带,高频信号具有大于预定第二频率的频带。在本发明总体构思的一方面,第一频率和第二频率可以相同,但是,应该理解,第一频率和第二频率也可以互不相同。
第一变换单元1103可使用第一预定变换方法将从域划分单元1100接收的低频信号从时域变换到频域。
第二变换单元1105可使用与第一变换方法不同的第二变换方法将接收 的低频信号从时域变换到频域,以应用心理声学模型。
第一变换单元1103变换的信号可被用于对低频信号进行编码。第二变换单元1105变换的信号可被用于通过将心理声学模型应用到低频信号来检测一个或多个重要的频率分量。所述心理声学模型是指关于人类听觉系统的掩蔽效应的数学模型。
例如,第一变换单元1103可通过将MDCT用作第一变换方法将低频信号变换到频域来用实数表示低频信号;第二变换单元1105通过将MDST用作第二变换方法将低频信号变换到频域来用虚数表示低频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对低频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到低频信号而检测重要的频率分量。因此,由于还可表示低频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
频率分量检测单元1110可通过使用第二变换单元1105变换的信号,根据预定的标准从第一变换单元1103变换的低频信号中检测一个或多个重要的频率分量。在这种情况下,频率分量检测单元1110可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果SMR大于掩蔽值的倒数,则将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定频率分量是否重要。第三,可计算每个子带的SNR,并将具有小SNR的子带中其峰值大于等于预定值的频率分量确定为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
频率分量编码单元1115可对频率分量检测单元1110检测的频率分量以及表示频率分量的位置的信息编码。
包络线提取单元1120可提取第一变换单元1130变换的低频信号的包络线。
包络线编码单元1125可对包络线提取单元1120提取的低频信号的包络线进行编码。
第三变换单元1130可通过使用分析滤波器组以预定频带为单位对可从域划分单元1100接收的高频信号执行域变换,从而可在时域中表示所述高频信号。例如,第三变换单元1130可以应用QMF执行域变换。
带宽扩展编码单元1135可通过使用低频信号对第三变换单元1130变换的高频信号编码。对于编码,可对通过使用低频信号对高频信号解码的信息进行编码。
复用单元1140可将被频率分量编码单元1115编码的频率分量和表示频率分量的位置的信息、包络线编码单元1125编码的低频信号的包络线、带宽扩展编码单元1135编码的低频信号、以及用于对高频信号解码的信息复用为比特流,然后可通过输出端子OUT输出比特流。
图12是根据本发明总体构思的另一实施例的对音频信号解码的设备的框图。解码设备可包括解复用单元1200、频率分量解码单元1205、包络线解码单元1210、能量计算单元1215、包络线调节单元1220、信号混合单元1225、第一逆变换单元1230、第二变换单元1235、同步单元1240、带宽扩展解码单元1245、第二逆变换单元1250和域合并单元1255。
解复用单元1200可通过输入端子IN从编码端接收比特流,然后可对比特流解复用。例如,解复用单元1200可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、可被编码设备(未示出)编码的低频信号的包络线、从低频信号产生以对高频信号解码的信息。这里,低频信号具有小于预定第一频率的频带,高频信号具有大于预定第二频率的频带。在本发明总体构思的一方面,第一频率和第二频率可以相同,但是,应该理解,第一频率和第二频率也可以互不相同。
频率分量解码单元1205可对根据预定标准在低频信号中被确定为重要的频率分量因此被编码设备(未示出)编码的频率分量解码。
包络线解码单元1210可对编码设备编码的低频信号的包络线解码。
能量计算单元1215可计算频率分量解码单元1205解码的频率分量的能量值。
包络线调节单元1220可调节包含频率分量解码单元1205解码的频率分量的频带中的包络线解码单元1210解码的低频信号的包络线。这里,包络线调节单元1220可调节包络线解码单元1210解码的包络线,从而每个频带的解码的包络线的能量值可等于通过从包含频率分量解码单元1205解码的频率分量的频带的解码的包络线的能量值,减去包含的频率分量的能量值而获得的值。
然而,包络线调节单元1220可不调节不包含频率分量解码单元1205解 码的频率分量的其他频带的包络线解码单元1215解码的包络线。
信号混合单元1225可在小于预定频率的频带中包含频率分量解码单元1205解码的频率分量的频带,输出混合频率分量解码单元1205解码的频率分量和包络线调节单元1220调节的包络线的结果,并可在小于预定频率的频带中不包含解码的频率分量的其他频带,输出包络线解码单元1210解码的信号。因此,信号混合单元1225可恢复低频信号。
第一逆变换单元1230可根据预定第一逆变换方法(可以是图11的第一变换单元1103所执行的变换的逆运算)将信号混合单元1225恢复的低频信号从频域变换到时域。所述第一逆变换方法的示例是IMDCT。
第二变换单元1235可通过使用分析滤波器组以预定频带为单位对第一逆变换单元1230逆变换的低频信号执行域变换,从而可在时域中表示所述信号。例如,第二变换单元1235可应用QMF执行域变换。
如果施加到频率分量解码单元1205的帧与施加到带宽扩展解码单元1245的帧不相同,则同步单元1240将施加到频率分量解码单元1205的帧和施加到带宽扩展解码单元1245的帧进行同步。同步单元1240可基于施加到频率分量解码单元1205的帧处理施加到带宽扩展解码单元1245的所有的帧或者其中的一些帧。
带宽扩展解码单元1245可通过使用第二变换单元1235变换的低频信号来对高频信号解码。对于解码,可使用用于通过使用解复用单元1200解复用的低频信号来对高频信号解码的信息。
第二逆变换单元1250可通过使用合成滤波器组对带宽扩展解码单元1245解码的高频信号的域执行逆变换,其中,所述逆变换是第二变换单元1235执行的变换的逆运算。
域合并单元1255可将第一逆变换单元1230逆变换的低频信号和第二逆变换单元1250逆变换的高频信号混合,然后可通过输出端子OUT输出混合的结果。
图13是详细示出根据本发明总体构思的另一实施例的解码设备中包括的信号调节单元220(620、825或1020)的框图。信号调节单元220(620、825或1020)可包括第一能量计算单元1300、第二能量计算单元1310、增益计算单元1320和增益施加单元1330。将参照图2、6、8、10和13来描述信号调节单元220(620、825或1020)。
第一能量计算单元1300可通过输入端子IN1接收通过信号产生单元215(615、820、或1015)在包含一个或多个频率分量的一个或多个频带产生的一个或多个信号,然后可计算一个或多个频带的信号的能量值。
第二能量计算单元1310可通过第二输入端子IN2接收频率分量解码单元205、605、805或1005解码的频率分量,然后可计算频率分量的能量值。
增益计算单元1320可通过输入端子IN3从能量值解码单元210、610、810或1010接收包含频率分量的频带的能量值,然后可计算接收的能量值的增益,所述增益可满足如下关系:第一能量计算单元1300计算的每个能量值可等于从能量值解码单元210、610、810或1010接收的能量值之一减去第二能量计算单元1310计算的能量值之一而获得的值。例如,增益计算单元1320可如下面所示来计算增益。
其中,Etarget表示从能量值解码单元210、610、810或1010接收的每个能量值,Ecore表示第二能量计算单元1310计算的每个能量值,Eseed表示第一能量计算单元1300计算的每个能量值。
如果考虑到信号音调来计算增益,则增益计算单元1320可通过第三输入端子IN3从能量值解码单元210、610、810或1010接收包含频率分量的频带的能量值,可通过第四输入端子IN4接收包含频率分量的频带的信号的音调,然后可使用接收的能量值、音调和第二能量计算单元1310计算的能量值来计算增益。
增益施加单元1330可通过第一输入端子IN1接收信号产生单元215、615、820或1015在包含频率分量的频带产生的信号,并将计算的增益施加到所述信号。
图14是示出根据本发明总体发明构思的实施例的当如2、6、8或10示出的信号产生单元215、615、820或1015只从单个信号产生信号时施加增益的电路图。
增益施加单元1330可通过第一输入端子IN1接收信号产生单元215、615、820或1015在包含一个或多个频率分量的频带产生的信号,然后将信号的值与增益计算单元1320计算的增益相乘。
第一信号混合单元1400可通过第二输入端子IN2接收频率分量解码单元 205、605、805或1005解码的频率分量,然后可混合频率分量和增益施加单元1330将其值与增益相乘的信号。
图15是示出根据本发明总体构思的实施例的当图2、6、8或10示出的信号产生单元215、615、820或1015从多个信号产生信号时施加增益的电路图。
首先,增益施加单元1330可通过第一输入端子IN1接收由信号产生单元215、615、820或1015任意产生的信号,然后将该信号的值与增益计算单元1320计算的第一增益相乘。
此外,增益施加单元1330可通过输入端子IN1’从下面的信号中接收信号,所述信号为:通过在预定频带复制信号产生单元215、615、820或1015产生的信号获得的信号、复制低频信号获得的信号、使用预定频带的信号产生的信号以及从低频信号产生的信号;然后增益施加单元1330可将接收的信号的值与增益计算单元1320计算的第二增益相乘。
第二混合单元1500可混合通过增益施加单元1330将其值与第一增益相乘的信号和通过增益施加单元1330将其值与第二增益相乘的信号。
第三混合单元1510可通过第二输入端子IN2接收频率分量解码单元205、605、805或1005解码的一个或多个频率分量,然后可混合频率分量和从第二混合单元1500接收的混合的信号。
图16是示出根据本发明总体发明构思的实施例的对音频信号编码的方法的流程图。
首先,可根据预定第一变换方法将接收的音频信号从时域变换到频域(操作1600)。这里,音频信号的示例是语音信号和音乐信号。
接下来,可根据可以与第一变换方法不同的预定第二变换方法将音频信号从时域变换到频域,以应用心理声学模型(操作1605)。
在操作1600变换的信号可被用于对音频信号编码,在操作1605变换的信号可被用于通过将心理声学模型应用到音频信号来检测重要的频率分量。这里,所述心理声学模型可以是关于人类听觉系统的掩蔽效应的数学模型。
例如,在操作1600,可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;在操作1605,通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的 结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
接下来,可通过使用在操作1605变换的信号,根据预定的标准从操作1600变换的信号中检测被确定为重要频率分量的一个或多个频率分量(操作1610)。在操作1610,可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果信号的该值大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定信号是否为重要的频率分量。第三,可计算每个子带的SNR,然后可从具有小SNR的子带中选择其峰值大于等于预定值的频率分量作为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
然后,可对在操作1610检测的频率分量以及表示频率分量的位置的信息编码(操作1615)。
接下来,可计算在操作1600变换的信号的频带中的信号的能量值(操作1620)。这里,频带可以是在QMF的情况下的比例因子频带或者是子带。
接下来,可对在操作1620计算的频带的能量值和表示频带的位置的信息编码(操作1625)。
接下来,可计算包含在操作1610检测的频率分量的频带的信号的音调,并对其编码(操作1630)。然而,对于本发明总体发明构思,操作1630并不是必不可少的,但是如果解码设备(未示出)从包含频率分量的频带中的多个信号而非单个信号产生信号,则可需要操作1630。例如,当解码设备通过使用任意产生的信号和修补的信号在包含频率分量的频带中产生一个或多个信号时,可执行操作1630。
接下来,可将在操作1615编码的频率分量和表示频率分量的位置的信息以及在操作1625编码的频带的能量值和表示频带的位置的信息一起复用为比特流(操作1635)。作为选择,在操作1635,还可将在操作1630编码的音调复用到比特流。
图17是示出根据本发明总体发明构思的实施例的对音频信号解码的方法的流程图。
可从编码端接收比特流,然后可对接收的比特流解复用(操作1700)。 例如,在操作1700,可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、每个频带的能量值、表示其能量值被编码设备(未示出)编码的一个或多个频带的位置的信息和信号音调。
接下来,可对根据预定标准被确定为重要的频率分量然后被编码设备编码的频率分量解码(操作1705)。
接下来,可对每个频带的信号的能量值解码(操作1710)。
接下来,可对包含在操作1705解码的频率分量的频带的信号的音调解码(操作1713)。然而,操作1713对于本发明总体构思并不是必不可少的,如果在操作1715从多个信号而非单个信号产生信号,则可需要操作1713。例如,当在操作1715,通过使用任意产生的噪声信号和修补的信号在包含在操作1705解码的频率分量的频带产生信号时,可有必要执行操作1713。如果包括操作1713,则在操作1720,当调节可在操作1715产生的信号时,可考虑在操作1713解码的音调。
接下来,可在每个频带产生信号(操作1715),其中,所述信号具有在操作1710解码的每个频带的能量值。
在操作1715,可使用各种方法在每个频带中产生信号。第一,可任意产生噪声信号。第二,如果预定频带的信号是与大于预定频率的频带相应的高频信号,并且与小于预定频率的频带相应的低频信号已经被解码因而可用,则可通过复制低频信号来产生信号。例如,通过修补或者交迭低频信号来产生信号。
然后,可确定每个频带是否包含在操作1705解码的频率分量(操作1718)。
如果在操作1718确定每个频带包含解码的频率分量,则可调节在操作1715产生的信号中包含频率分量的频带的信号(操作1720)。具体地讲,在操作1720,可调节在操作1715产生的信号,从而可基于在操作1710解码的每个频带的能量值并考虑在操作1705解码的频率分量的能量值来调节产生的信号的能量值。稍后将参照图28来更详细地描述操作1720。
然而,如果在操作1718确定每个频带不包含解码的频率分量,可不调节在操作1715产生的信号中不包含解码的频率分量的其他频带的信号。
接下来,可在包含解码的频率分量的频带输出混合在操作1705解码的频率分量和在操作1720调节的信号的结果,并可在不包含解码的频率分量的其 他频带输出在操作1715中产生的信号。
然后,可根据预定第一逆变换方法以图16示出的操作1600中执行的变换的相反方式将在操作1725输出的信号从频域变换到时域。第一逆变换方法的示例是IMDCT。
图18是根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图。
首先,可根据预定第一变换方法将接收的音频信号从时域变换到频域(操作1800)。这里,所述音频信号的示例是语音信号和音乐信号。
接下来,可根据可与第一变换方法不同的第二变换方法将音频信号从时域变换到频域,以应用心理声学模型(操作1805)。
在操作1800变换的信号可被用于对音频信号编码,在操作1805变换的信号可用于通过将心理声学模型应用到音频信号来检测重要的频率分量。这里,所述心理声学模型可以是关于人类听觉系统的掩蔽效应的数学模型。
例如,在操作1800,可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;在操作1805,通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
接下来,可通过使用在操作1805变换的信号,根据预定的标准从在操作1800变换的信号中检测被确定为重要的一个或多个频率分量(在操作1810)。在操作1810可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果信号的该值大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,可通过考虑预定权值而提取频谱峰值来确定信号是否为重要的频率分量。第三,可计算每个子带的SNR,然后可从具有小SNR的子带中选择峰值大于等于预定值的每个频率分量作为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
然后,可对在操作1810检测的频率分量以及表示频率分量的位置的信息编码(操作1815)。
接下来,可提取在操作1800变换的信号的包络线(操作1820)。
接下来,可对在操作1820提取的包络线进行编码(操作1825)。
然后,可将可在操作1815编码的频率分量和表示频率分量的位置的信息以及在操作1825编码的包络线复用为比特流(操作1830)。
图19是根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图。
首先,可从编码端接收比特流,然后可对比特流解复用(操作1900)。例如,可将比特流解复用为频率分量、表示频率分量的位置的信息和在编码设备(未示出)中编码的包络线。
接下来,可对根据预定标准被确定为重要然后被编码设备编码的频率分量解码(操作1905)。
接下来,可对编码设备编码的包络线解码(操作1910)。
接下来,可对在操作1905解码的频率分量的能量值解码(操作1915)。
接下来,可确定每个频带是否包含解码的频率分量(操作1918)。
如果在操作1918中确定每个频带包含解码的频率分量,则可调节在操作1910中解码的包络线中包含解码的频率分量的频带的信号的包络线(操作1920)。在操作1920,可控制在操作1910中每个频带的解码的包络线,从而所述包络线的能量值等于通过从包含解码的频率分量的每个频带的包络线的能量值,减去包含在每个频带中的频率分量的能量值而获得的值。如果在操作1918确定每个频带不包含频率分量,则可不调节在操作1915解码的包络线中在不包含解码的频率分量的其他频带中的信号的包络线。
然后,可在包含解码的频率分量的频带,输出混合在操作1905解码的频率分量和在操作1920调节的包络线的结果,并可在不包含解码的频率分量的其他频带输出在操作1910解码的信号。
然后,可根据预定第一逆变换方法以图18的操作1800执行变换的相反方式将在操作1925输出的信号从频域变换到时域(操作1930)。第一逆变换方法的示例是IMDCT。
图20是根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图。
首先,可根据预定第一变换方法将接收的音频信号从时域变换到频域(操作2000)。这里,音频信号的示例是语音信号和音乐信号。
接下来,可根据与第一变换方法不同的预定第二变换方法将音频信号从时域变换到频域,以应用心理声学模型(操作2005)。
在操作2000变换的信号可被用于对音频信号编码,在操作2005变换的信号可被用于通过将心理声学模型应用到音频信号来检测重要的频率分量。这里,所述心理声学模型可以是关于人类听觉系统的掩蔽效应的数学模型。
例如,在操作2000,可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;在操作2005,通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
接下来,可通过使用在操作2005变换的信号,根据预定的标准从在操作2000变换的信号中检测被确定为重要的频率分量(操作2010)。在操作2010,可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果信号的该值大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定信号是否为重要的频率分量。第三,可计算每个子带的SNR,然后可从具有小SNR的子带中选择其峰值大于等于预定值的频率分量作为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
然后,可对在操作2010检测的频率分量以及表示频率分量的位置的信息编码(操作2015)。
然后,可通过使用分析滤波器组以预定频带为单位来对音频信号执行域变换,从而可在时域中表示所述信号(操作2030)。例如,在操作2030,可以应用QMF执行域变换。
接下来,可通过使用与小于预定频率的频带相应的低频信号,对与不包含在操作2010检测的频率分量的频带中大于预定频率的频带相应的并在操作2030变换的信号编码(操作2035)。对于编码,可对用于通过使用低频信号对大于预定频率的频带的信号解码的信息进行编码。
接下来,可计算包含在操作2015编码的频率分量的一个或多个频带或小 于预定第一频率的频带的信号的能量值(操作2036)。这里,频带可以是在QMF情况下的一个比例因子频带或者一个子带。
接下来,可对在操作2036计算的频带的能量值和表示频带的位置的信息编码(操作2037)。
接下来,可计算在包含操作2010检测的频率分量的频带中在操作2000变换的信号中的信号的音调,然后可对其编码(操作2040)。然而,对于本发明总体发明构思,操作2040并不是必不可少的,但是如果解码设备(未示出)从多个信号而非单个信号在包含频率分量的频带产生信号,则可需要操作2040。例如,当解码设备通过使用任意产生的信号和修补的信号产生包含频率分量的频带的信号时,可执行操作2040。
然后,可将在操作2015编码的频率分量和表示编码的频率分量的位置的信息、在操作2037编码的频带的能量值以及表示频带的位置的信息、以及在操作2035编码的信号复用为比特流(操作2045),然后可输出比特流。作为选择,在操作2045,在操作2040编码的音调也可被复用到比特流。
图21是根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图。
首先,可从编码端接收比特流,然后可对比特流解复用(操作2100)。例如,在操作2100,可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、每个频带的能量值、表示其能量值可被编码设备(未示出)编码的一个或多个频带的位置的信息、用于通过使用与小于预定频率的频带相应的信号对大于预定频率的一个或多个频带中不包含一个或多个频率分量的频带的信号解码的信息和信号音调。
接下来,可对根据预定标准被确定为重要然后被编码设备编码的频率分量解码(操作2105)。
接下来,可根据预定第一逆变换方法以图20示出的操作2000中执行变换的相反方式,将在操作2105中的频率分量从频域变换到时域(操作2106)。第一逆变换方法的示例是IMDCT。
接下来,可通过使用分析滤波器组以预定频带为单位对在操作2106变换的信号执行域变换,从而在时域中表示所述信号(操作2107)。例如,可应用QMF执行域变换。
接下来,可确定在操作2105施加的帧与在操作2145施加的帧是否相同 (操作2108)。
如果在操作2108确定帧不相同,则可将在操作2105施加的帧和在操作2145施加的帧进行同步(操作2109)。在操作2109,可基于在操作2105施加的帧处理在操作2145施加的所有的帧或者其中的一些帧。
接下来,可对包含在操作2105解码的频率分量的频带或者小于预定频率的频带的信号的能量值解码(操作2110)。
接下来,可对包含解码的频率分量的频带的信号的音调解码(操作2113)。然而,操作2113对于本发明总体构思并不是必不可少的,但是如果在操作2115(稍后将描述)中从多个信号而非单个信号产生信号,则可需要操作2113。例如,当在操作2115通过使用任意产生的噪声信号和修补的信号在包含解码的频率分量的频带中产生信号时,可能需要执行操作2113。如果包括操作2113,则在将在稍后描述的操作2120中调节可在操作2115中产生的信号时,还可考虑在操作2113解码的音调。
接下来,在每个频带可产生具有包含解码的频率分量的频带或者小于预定频率的频带的能量值的信号(操作2115),所述能量值在操作2110中被解码。
在操作2115,可使用各种方法在每个频带产生信号。第一,可任意产生噪声信号。第二,如果预定频带的信号是与大于预定频率的频带相应的高频信号,并且与小于预定频率的频带相应的低频信号已经被解码因而可用,则可通过复制低频信号来产生信号。例如,通过修补或者交迭低频信号来产生信号。
然后,可确定每个频带是否包含在操作2105解码的频率分量(操作2118)。
如果在操作2118确定每个频带包含解码的频率分量,则可调节在操作2115产生的信号中包含频率分量的信号(操作2120)。具体地讲,在操作2120,可调节在操作2115产生的信号,从而可基于在操作2110解码的能量值并考虑在操作2105解码的频率分量的能量值调节产生的信号的能量值。将参照图28来更详细地描述操作2120。
然而,如果在操作2118确定每个频带不包含解码的频率分量,则可不调节在操作2115产生的信号中不包含解码的频率分量的其他频带的信号。
接下来,可在包含解码的频率分量的频带输出混合在操作2105解码的频 率分量和在操作2120调节的信号的结果,并可在不包含解码的频率分量的其他频带输出在操作2115产生的信号(操作2125)。
接下来,可确定大于预定频率的频带是否包含解码的频率分量(操作2134)。
如果在操作2143确定频带包含解码的频率分量,则可使用在操作2135变换的信号中与小于预定频率的频带相应的信号,对大于预定频率的频带中不包含解码的频率分量的频带的信号解码(操作2145)。对于解码,可使用用于通过使用与小于预定频率的频带相应的信号对于大于预定频率的频带相应的信号解码的信息,所述信息在操作2100被解复用。
然后,可以以在操作2135执行的变换的相反方式,使用合成滤波器组对在操作2145解码的信号的域进行逆变换(操作2150)。
然后,可将分别在操作2130和2150逆变换的信号混合在一起(操作2155)。在操作2130逆变换的信号可包括包含解码的频率分量的频带的信号和不包含解码的频率分量的其他频带中小于预定频率的频带的信号。此外,在操作2150逆变换的信号可包括不包含解码的频率分量的其他频带中大于预定频率的频带的信号。因此,在操作2155,通过混合所有频带的音频信号来恢复音频信号。
图22是根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图。
首先,可根据预定第一变换方法将接收的音频信号从时域变换到频域(操作2200)。这里,音频信号的示例是语音信号和音乐信号。
接下来,可根据可与第一变换方法不同的预定第二变换方法将音频信号从时域变换到频域以应用心理声学模型(操作2205)。
在操作2200变换的信号可被用于对音频信号编码,在操作2205变换的信号可被用于通过将心理声学模型应用到音频信号来检测重要的频率分量。这里,所述心理声学模型可以是关于人类听觉系统的掩蔽效应的数学模型。
例如,在操作2200,可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;在操作2205,通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测 重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
接下来,可通过使用在操作2205变换的信号,根据预定的标准从在操作2200变换的信号中检测被确定为重要的一个或多个频率分量。在操作2210,可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果信号的所述值大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定信号是否是重要的频率分量。第三,可计算每个子带的SNR,然后可从具有小SNR的子带中选择其峰值大于等于预定值的频率分量作为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
然后,可对在操作2210检测的频率分量以及表示频率分量的位置的信息编码(操作2215)。
接下来,可通过使用分析滤波器组以预定的频带为单位来对音频信号执行域变换,从而可在时域中表示音频信号(操作2218)。例如,在操作2218,可通过应用QMF来执行所述域变换。
接下来,可计算小于预定频率的频带的信号的能量值(操作2220)。这里,所述频带可以是在QMF的情况下的一个比例因子频带或者是一个子带。
接下来,可对在操作2200计算的频带的能量值和表示频带的位置的信息编码(操作2225)。
然后,可使用与小于预定频率的频带相应的低频信号来对于大于预定频率的频带相应的高频信号编码(操作2235)。对于编码,可产生用于使用低频信号对高频信号解码的信息,并对其编码。
接下来,可计算包含在操作2215检测的频率分量的频带的信号的音调,并对其编码(操作2240)。然而,对于本发明总体发明构思,操作2240并不是必不可少的,但是如果解码设备(未示出)从多个信号而非单个信号在具有频率分量的频带产生信号,则可需要操作2240。例如,当解码设备通过使用任意产生的信号和修补的信号在包含频率分量的频带产生信号时,可执行操作2240。
接下来,可将可在操作2215编码的频率分量和表示频率分量的位置的信息、可在操作2225编码的频带的能量值和表示频带的位置的信息、以及可用 于使用低频信号对高频信号解码的信息复用为比特流(操作2245)。作为选择,在操作2245,在操作2240编码的音调也可被复用到比特流。
图23是根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图。
首先,可从编码端接收比特流,然后可对比特流解复用(操作2300)。例如,在操作2300,可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、每个频带的能量值、表示其能量值可被编码设备(未示出)编码的频带的位置的信息、用于通过使用与小于预定频率的频带相应的信号对与大于预定频率的频带相应的信号解码的信息和信号音调。
接下来,可对根据预定标准在与小于预定频率的频带相应的低频信号中被确定为重要,然后被编码设备编码的频率分量解码(操作2305)。
接下来,可根据预定第一逆变换方法以在图22中示出的操作220中执行变换的相反方式将恢复的低频信号从频域变换到时域(操作2307)。所述第一逆变换方法的示例是IMDCT。
接下来,可通过使用分析滤波器组以在操作2307中执行变换的相反方式以预定频带为单位对低频信号的域执行变换,从而在时域中表示所述信号(操作2309)。例如,可在操作2309中应用QMF执行域变换。
接下来,可确定在操作2305中施加的帧是否与在操作2350中施加的帧相同(操作2311)。
如果在操作2311确定帧不相同,则可将在操作2305中施加的帧与在操作2350中施加的帧同步(操作2313)。在操作2313,可基于在操作2305施加的帧处理在操作2350中施加的所有帧或者其中的一些帧。
接下来,可对每个频带的低频信号的能量值解码(操作2314)。
接下来,可对小于预定频率的频带中包含在操作2305解码的频率分量的频带的信号的音调解码(操作2315)。然而,操作2315对于本发明总体构思并不是必不可少的,但是如果在稍后描述的操作2320从多个信号而非单个信号产生信号,则可需要操作2315。例如,在操作2320,当通过使用任意产生的噪声信号和修补的信号在包含解码的频率分量的频带产生信号时,可需要执行操作2315。如果包括操作2315,则当在操作2325调节在操作2320产生的信号时,也可考虑在操作2315解码的音调。
接下来,可在每个频带产生具有在操作2310解码的能量值的信号(操作 2320)。
在操作2320,可使用各种方法以在每个频带产生信号。第一,可任意产生噪声信号。第二,如果预定频带的信号已经被解码因而可用,则可通过复制解码的信号中的高度相关的信号来产生信号。例如,通过修补或者交迭已经解码的信号中的一个信号来产生信号。
然后,可确定小于第一频率的频带是否包含解码的频率分量(操作2323)。
如果在操作2323确定小于第一频率的频带包含解码的频率分量,则可调节操作2320产生的信号中小于第一频率的频带的信号(操作2325)。具体地讲,在操作2325,可调节在操作2320产生的信号,从而可基于在操作2310解码的每个频带的能量值并考虑在操作2305解码的频率分量的能量值来调节产生的信号的能量值。将参照图28更详细地描述操作2325。
然而,如果在操作2323确定小于第一频率的频带不包含解码的频率分量,则可不调节在操作2320产生的信号中不包含解码的频率分量的其他频带的信号。
接下来,可在小于预定频率的一个或多个频带中的包含解码的频率分量的频带,输出混合在操作2305解码的频率分量和在操作2325调节的信号的结果,并可在小于预定频率的频带中的不包含解码的频率分量的其他频带,输出在操作2320产生的信号(操作2330)。因此,可在操作2330恢复低频信号。
接下来,可对与大于预定频率的频带相应的高频信号编码。对于解码,可使用用于通过使用在操作2300解复用的低频信号对高频信号解码的信息。
接下来,可确定大于预定频率的频带是否包含解码的频率分量(操作2353)。
如果在2353确定频带包含解码的频率分量,则可调节在操作2350解码的一个或多个高频信号中包含解码的频率分量的频带的信号(操作2355)。
具体地讲,在操作2355,可计算大于预定频率的频带的一个或多个频率分量的能量值。然后,可调节在操作2350调节的高频信号,以使可被调节的高频信号的能量值等于从在操作2350解码的信号的能量值减去在每个频带中包含的频率分量的能量值,而获得的值。
接下来,可在大于预定频率的频带中的包含解码的频率分量的频带,输 出混合在操作2305解码的频率分量和在操作2355调节的信号的结果,并在大于预定频率的频带中的不包含解码的频率分量的其他频带,输出在操作2350解码的信号(操作2360)。因此,可在操作2360恢复高频信号。
然后,可以以与在操作2340执行的变换相反的方式使用合成滤波器组来逆变换恢复的高频信号的域(操作2365)。
然后,通过混合在操作2335逆变换的低频信号和在操作2365逆变换的高频信号来恢复原始音频信号(操作2370)。
图24是示出根据本发明另一实施例的对音频信号编码的方法的流程图。
首先,可基于预定频率将接收的信号划分为低频信号和高频信号(操作2400)。这里,低频信号对应于小于预定第一频率的频带,高频信号对应于大于预定第二频率的频带。在本发明总体发明构思的一方面,第一频率和第二频率可以相同,但是,应该理解,第一频率和第二频率也可互不相同。
接下来,可根据预定第一变换方法将在操作2400获得的低频信号从时域变换到频域(操作2403)。
接下来,可根据可与第一变换方法不同的预定第二变换方法将低频信号从时域变换到频域,以应用心理声学模型(操作2405)。
在操作2403变换的信号可被用于对低频信号编码,在操作2405变换的信号可被用于通过将心理声学模型应用到低频分量来检测重要的频率分量。这里,所述心理声学模型可以是关于人类听觉系统的掩蔽效应的数学模型。
例如,在操作2403,可通过将MDCT用作第一变换方法将低频信号变换到频域来用实数表示低频信号;在操作2405,通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
接下来,可通过使用在操作2405变换的信号,根据预定的标准从在操作2403变换的信号中检测被确定为重要的一个或多个频率分量(操作2410)。在操作2410,可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果信号的所述值大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定信号是否是重 要的频率分量。第三,可计算每个子带的SNR,然后可从具有小SNR的子带中选择其峰值大于等于预定值的频率分量作为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
然后,可对在操作2410检测的频率分量和表示频率分量的位置的信息编码(操作2415)。
接下来,可通过使用分析滤波器组以预定的频带为单位来对在操作2400获得的高频信号执行域变换,从而可在时域中表示音频信号(操作2418)。例如,在操作2418,可通过应用QMF来执行所述域变换。
接下来,可计算在操作2403中变换的低频信号的每个频带的一个或多个信号的能量值(操作2420)。这里,所述频带可以是在QMF的情况下的一个比例因子频带或者是一个子带。
接下来,可对在操作2420计算的频带的能量值和表示频带的位置的信息编码(操作2425)。
接下来,可计算包含在操作2410检测的频率分量的频带的一个或多个信号中每个信号的音调,并对其编码(操作2430)。然而,对于本发明总体发明构思,操作2430并不是必不可少的,但是如果解码设备(未示出)从多个信号而非单个信号在包含频率分量的频带产生信号,可需要操作2430。例如,当解码设备通过使用任意产生的信号和修补的信号在包含频率分量的频带产生信号时,可执行操作2430。
接下来,可使用低频信号对在操作2430变换的高频信号编码(操作2440)。对于编码,可产生通过使用低频信号对高频信号解码的信息,并对其编码。
接下来,可将在操作2415编码的频率分量和表示频率分量的位置的信息、可在操作2425编码的频带的能量值和表示频带的位置的信息、以及可用于使用低频信号对高频信号解码的编码信息复用为比特流,然后可输出比特流(操作2445)。作为选择,在操作2445,在操作2430编码的音调也可被复用到比特流。
图25是根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图。
首先,可从编码端接收比特流,然后可对比特流解复用(操作2500)。 例如,在操作2500,可将比特流解复用为一个或多个频率分量、表示频率分量的位置的信息、每个频带的能量值、表示其能量值可被编码设备(未示出)编码的频带的位置的信息、用于通过使用低频信号对高频信号解码的信息和信号音调。这里,低频信号对应于小于预定第一频率的频带,高频信号对应于大于预定第二频率的频带。在本发明总体发明构思的一方面,第一频率和第二频率可以相同,但是,应该理解,第一频率和第二频率也可互不相同。
接下来,可对根据预定标准被确定为重要然后被编码设备编码的频率分量解码(操作2505)。
接下来,可对小于预定频率的一个或多个频带中的每个频带的信号的能量值解码(操作2510)。
接下来,可以以频带为单位产生具有解码的能量值之一的信号。
在操作2515,可使用各种方法以在每个频带产生信号。第一,可任意产生噪声信号。第二,如果预定频带的信号对应于高频带,并且与低频带相应的信号已经被解码因而可用,则可通过复制与低频带相应的信号来产生信号。例如,可通过修补或者交迭与低频带相应的信号来产生信号。
然后,可确定小于预定频率的频带是否包含在操作2505解码的频率分量(操作2518)。
如果在操作2518确定频带包含解码的频率分量,则可调节在操作2515产生的信号中包含频率分量的频带的信号(操作2520)。具体地讲,在操作2520,可调节在操作2515产生的信号,从而可基于在操作2510解码的能量值并考虑在操作2505解码的频率分量的能量值来调节产生的信号的能量值。将参照图28更详细地描述操作2520。
然而,如果在操作2518确定频带不包含解码的频率分量,则可不调节在操作2515产生的信号中的频带的信号。
接下来,可在小于预定频率的频带中的包含解码的频率分量的频带,输出混合在操作2505解码的频率分量和在操作2520调节的信号的结果,并可在小于预定频率的频带中的不包含解码的频率分量的其他频带,输出在操作2515产生的信号(操作2525)。因此,可在操作2525恢复低频信号。
然后,可根据预定第一逆变换方法以可在操作2403中执行变换的相反方式将在操作2525输出的信号从频域变换到时域(操作2530)。所述第一逆变换方法的示例是IMDCT。
接下来,可通过使用分析滤波器组以在操作2530中执行变换的相反方式以预定频带为单位对低频信号的域执行变换,从而在时域中表示所述信号(操作2535)。例如,可在操作2535中应用QMF执行域变换。
接下来,可确定在操作2505中施加的帧是否与在操作2545中施加的帧相同(操作2538)。
如果在操作2538确定帧不相同,则可将在操作2505中施加的帧与在操作2545中施加的帧同步(操作2540)。在操作2540,可基于在操作2505施加的帧处理在操作2545中施加的所有帧或者其中的一些帧。
然后,可使用在操作2535执行的低频信号对高频信号解码(操作2545)。对于解码,可使用用于通过使用在操作2500解复用的低频信号对高频信号解码的信息。
接下来,可使用合成滤波器组以在操作2535执行变换的相反方式,对在操作2545解码的高频信号的域进行逆变换(操作2550)。
然后,可通过混合在操作2530逆变换的低频信号和在操作2550逆变换的高频信号来恢复原始音频信号(操作2555)。
图26是根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图。
首先,可将通过输入端子IN接收的信号基于预定频率划分为低频信号和高频信号(操作2600)。这里,低频信号对应于小于预定第一频率的频带,高频信号对应于大于预定第二频率的频带。第一频率和第二频率可以相同,但也可以互不相同。
接下来,可根据预定第一变换方法将在操作2600获得的低频信号从时域变换到频域(操作2603)。
接下来,可根据可与第一变换方法不同的预定第二变换方法将低频信号从时域变换到频域,以应用心理声学模型(操作2605)。
在操作2603变换的信号可被用于对低频信号进行编码,在操作2605变换的信号可被用于通过将心理声学模型应用到低频信号来检测重要的频率分量。这里,所述心理声学模型可以是关于人类听觉系统的掩蔽效应的数学模型。
例如,在操作2603,可通过将MDCT用作第一变换方法将低频信号变换到频域来用实数表示低频信号;在操作2605,通过将MDST用作第二变换 方法将低频信号变换到频域来用虚数表示低频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对低频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到低频信号而检测重要的频率分量。因此,由于还可表示低频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
接下来,可通过使用在操作2605变换的信号,根据预定的标准从操作2603变换的低频信号中检测被确定为重要的一个或多个频率分量(操作2610)。在操作2610,可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果信号的该值大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定信号是否为重要的频率分量。第三,可计算每个子带的SNR,然后可从具有小SNR的子带中选择其峰值大于等于预定值的频率分量作为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
然后,可对在操作2610检测的频率分量以及表示频率分量的位置的信息编码(操作2615)。
接下来,可提取在操作2603变换的低频信号的包络线(操作2620)。
接下来,可对提取的包络线进行编码(操作2625)。
接下来,可通过使用分析滤波器组以预定频带为单位对在操作2600获得的高频信号执行域变换,从而可在时域中表示所述信号(操作2630)。例如,可在操作2630应用QMF执行域变换。
接下来,可通过使用高频信号,对在操作2630变换的高频信号编码(操作2635)。对于编码,可产生通过使用低频信号对高频信号解码的信息,并对其编码。
然后,可将可在操作2605编码的频率分量和表示频率分量的位置的信息、在操作2625编码的低频信号的包络线、通过使用低频信号对在操作2635编码的高频信号解码的信息复用为比特流(操作2640)。
图27是根据本发明总体构思的另一实施例的对音频信号解码的方法的流程图。
首先,可从编码端接收比特流,然后可对比特流解复用(操作2700)。例如,在操作2700,可将比特流解复用为一个或多个频率分量、表示频率分 量的位置的信息、可被编码设备(未示出)编码的低频信号的包络线、使用低频信号对高频信号解码的信息。这里,低频信号对应于小于预定第一频率的频带,高频信号对应于大于预定第二频率的频带。在本发明总体构思的一方面,第一频率和第二频率可以相同,但是,应该理解,第一频率和第二频率也可以互不相同。
接下来,可对根据预定标准被确定为重要然后被编码设备编码的一个或多个频率分量解码(操作2705)。
接下来,可对编码设备编码的低频信号的包络线解码(操作2710)。
接下来,可计算在操作2705解码的频率分量的能量值(操作2715)。
然后,可确定小于预定频率的一个或多个频带是否包含解码的频率分量(操作2718)。
如果在操作2718确定频带包含解码的频率分量,则可调节在操作2710解码的包络线的频带的一个或多个包络线(操作2720)。具体地讲,在操作2720,可调节在操作2710解码的包络线,以使解码的包络线的能量值可等于从包含解码的频率分量的频带的解码的包络线的能量值减去解码的频率分量的能量值而获得的值。
然而,如果在操作2718确定频带不包含解码的频率分量,则可不调节在操作2710解码的包络线中的频带的一个或多个包络线。
接下来,可在小于预定频率的频带中包含解码的频率分量的频带输出混合在操作2705解码的频率分量和在操作2720调节的包络线的结果,并可在小于预定频率的频带中不包含解码的频率分量的其他频带输出在操作2710解码的信号(操作2725)。因此,可在操作2725恢复低频信号。
然后,可根据预定第一逆变换方法以可在图26的操作2603中执行变换的相反方式将恢复的低频信号从频域变换到时域(操作2730)。所述第一逆变换方法的示例是IMDCT。
接下来,可通过使用分析滤波器组以在操作2730执行变换的相反方式以预定频带为单位对低频信号的域执行变换,从而在时域中表示所述信号(操作2735)。例如,可在操作2735中应用QMF执行域变换。
接下来,可确定在操作2705中施加的帧是否与在操作2745中施加的帧相同(操作2738)。
如果在操作2738确定帧不相同,则可将在操作2705中施加的帧与在操 作2745中施加的帧同步(操作2740)。在操作2740,可基于在操作2705施加的帧处理在操作2745中施加的所有帧或者其中的一些帧。
然后,可使用在操作2735变换的低频信号恢复高频信号(操作2745)。对于解码,可使用用于通过使用在操作2700解复用的低频信号对高频信号解码的信息。
接下来,可使用合成滤波器组以在操作2735执行变换的相反方式,对在操作2745解码的高频信号的域执行逆变换(操作2750)。
然后,可通过混合在操作2730逆变换的低频信号和在操作2750逆变换的高频信号来恢复原始音频信号(操作2755)。
图28是详细示出根据本发明总体构思的实施例的分别在图17、21、23或25示出的操作1720、2120、2325或2520的流程图。
首先,在操作1715、2115、2320或2515,可接收在包含一个或多个频率分量的一个或多个频带的一个或多个信号,然后可计算频带的信号的能量值(操作2800)。
然后,可接收在操作1705、2105、2305或2505解码的一个或多个频率分量,然后可计算频率分量的能量值(操作2805)。
接下来,可计算包含在操作1710、2110、2310或2510解码的频率分量的频带的能量值的增益,以满足下面所述的关系:在操作2800计算的能量值可等于从在操作1710解码的能量值减去在操作2805计算的能量值而获得的值。例如,在操作2810,可如下面所示来计算能量值的增益:
其中,Etarget表示在操作1710、2110、2310或2510解码的能量值,Ecore表示在操作2805计算的能量值,Eseed表示在操作2800计算的能量值。
在操作2810,如果在操作2810的增益计算中考虑信号音调,则可接收包含在操作2805解码的频率分量的频带的能量值,可接收频带的信号的音调,然后可使用接收的能量值、接收的音调和在操作2805计算的能量值来计算增益。
然后,可将计算的每个频带的增益施加到在操作1715、2115、2320或2515产生的包含解码的频率分量的频带的一个或多个信号。
图29是根据本发明总体构思的实施例的对音频信号编码的设备的框图。 所述设备可包括第一变换单元2900、第二变换单元2905、频率分量检测单元2910、频率分量编码单元2915、第三变换单元2918、能量值计算单元2920、能量值编码单元2925、音调编码单元2930和复用单元2935。
第一变换单元2900可通过使用第一预定变换方法将通过输入端子IN接收的音频信号从时域变换到频域。音频信号的示例是语音信号和音乐信号。
第二变换单元2905可通过使用与第一变换方法不同的第二变换方法将接收的音频信号从时域变换到频域,以应用心理声学模型。
第一变换单元2900变换的信号可被用于对音频信号编码。第二变换单元2905变换的信号可被用于通过将心理声学模型应用到音频信号来检测重要的频率分量。所述心理声学模型是指关于人类听觉系统的掩蔽效应的数学模型。
例如,第一变换单元2900可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;第二变换单元2905通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
频率分量检测单元2910可通过使用第二变换单元2905变换的信号,根据预定的标准从第一变换单元2900变换的信号中检测一个或多个重要的频率分量。在这种情况下,频率分量检测单元2910可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果SMR大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定频率分量是否重要。第三,可计算每个子带的SNR,然后可将具有小SNR的子带中其峰值大于等于预定值的频率分量确定为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
频率分量编码单元2915可对频率分量检测单元2910检测的频率分量以及表示频率分量的位置的信息编码。
第三变换单元2918可通过使用分析滤波器组以预定频带为单位来对接收的音频信号执行域变换,从而可在时域中表示所述音频信号。例如,第三 变换单元2918可以使用QMF执行域变换。
能量值计算单元2920可计算包含频率分量编码单元2915编码的频率分量的频带或者与小于预定频率的频带相应的频带的信号的能量值。这里,每个频带可以是在QMF的情况下的比例因子频带或者是子带。
能量值编码单元2925可对能量值计算单元2920计算的频带的能量值和表示频带的位置的信息编码。
音调编码单元2930可计算包含频率分量检测单元2910检测的频率分量的频带的信号的音调,并对其编码,可在第一变换单元2900中对所述信号进行变换。对于本发明总体发明构思,音调编码单元2930并不是必不可少的,但是在解码设备(未示出)通过使用多个信号而非单个信号在包含频率分量的频带产生信号时,可需要音调编码单元2930。例如,如果解码设备通过使用任意产生的信号和修补的信号在包含频率分量的频带产生信号,则可能需要音调编码单元2930。
复用单元2935可将可被频率分量编码单元2915编码的频率分量和表示频率分量的位置的信息、可被能量值编码单元2925编码的每个频带的能量值和表示每个频带的位置的信息复用为比特流,然后可通过输出端子OUT输出比特流。作为选择,音调编码单元2930编码的音调也可被复用到比特流。
图30是根据本发明总体构思的另一实施例的对音频信号编码的方法的流程图。
首先,可根据预定第一变换方法将接收的音频信号从时域变换到频域(操作3000)。这里,音频信号的示例是语音信号和音乐信号。
接下来,可根据可与第一变换方法不同的预定第二变换方法将音频信号从时域变换到频域,以应用心理声学模型(操作3005)。
在操作3000变换的信号可被用于对音频信号编码,在操作3005变换的信号可被用于通过将心理声学模型应用到音频信号来检测重要的频率分量。这里,所述心理声学模型可以是关于人类听觉系统的掩蔽效应的数学模型。
例如,在操作3000,可通过将MDCT用作第一变换方法将音频信号变换到频域来用实数表示音频信号;在操作2005,通过将MDST用作第二变换方法将音频信号变换到频域来用虚数表示音频信号。这里,用作为使用MDCT的结果的实数表示的信号可被用于对音频信号编码,而用作为使用MDST的结果的虚数表示的信号可被用于通过将心理声学模型应用到音频信号而检测 重要的频率分量。因此,由于还可表示音频信号的相位信息,所以可以对与时域相应的信号执行DFT,然后可量化MDCT系数,从而防止失配的发生。
接下来,可通过使用在操作3005变换的信号,根据预定的标准从在操作3000变换的信号中检测被确定为重要的频率分量(操作3010)。在操作3010,可使用各种方法检测重要的频率分量。第一,可计算信号的SMR,然后,如果信号的该值大于掩蔽值的倒数,则可将信号确定为重要的频率分量。第二,通过考虑预定权值而提取频谱峰值来确定信号是否为重要的频率分量。第三,可计算每个子带的SNR,然后可从具有小SNR的子带中选择峰值大于等于预定值的频率分量作为重要的频率分量。可单独执行上述三种方法,或者可执行上述三种方法中一种方法或者至少两种方法的结合。上述三种方法只是示例,因而本发明总体构思并不限于此。
然后,可对在操作3010检测的频率分量以及表示频率分量的位置的信息编码(操作3015)。
然后,可通过使用分析滤波器组以预定频带为单位来对音频信号执行域变换,从而可在时域中表示所述信号(操作3018)。例如,在操作3018,可以应用QMF执行域变换。
接下来,可计算包含在操作3018编码的频率分量的一个或多个频带或小于预定第一频率的频带的信号的能量值(操作3020)。这里,频带可以是在QMF情况下的一个比例因子频带或者一个子带。
接下来,可对可在操作3020计算的频带的能量值和表示频带的位置的信息编码(操作3025)。
接下来,可计算包含在操作3010检测的频率分量的频带中并在操作3000变换的信号中的信号的音调,然后可对其编码(操作3030)。然而,对于本发明总体发明构思,操作3030并不是必不可少的,但如果解码设备(未示出)从多个信号而非单个信号在包含频率分量的频带产生信号,则可需要操作3030。例如,当解码设备通过使用随机产生的信号和修补的信号产生包含频率分量的频带的信号时,可执行操作3030。
然后,可将在操作3015编码的频率分量和表示编码的频率分量的位置的信息、在操作3025编码的频带的能量值以及表示频带的位置的信息复用为比特流,并可输出比特流(操作3035)。作为选择,在操作3035,在操作3030编码的音调也可被复用到比特流。
本发明总体构思还可被实现为包括具有信息处理功能的设备的计算机可读介质上的计算机可读代码。所述计算机可读代码可包括计算机可读记录介质和计算机可读传输介质。所述计算机可读记录介质可以是可存储稍后能由计算机系统读取的数据的任何数据存储装置。所述计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光学数据存储装置。所述计算机可读介质还可分布在联网的计算机系统中,从而以分布式方式来存储和执行计算机可读代码。所述计算机可读传输介质可传输载波或信号(例如,通过互联网的有线或无线的数据传输)。此外,本发明总体构思所属领域的程序员可容易地理解实现本发明总体构思的函数程序、代码和代码段。
在根据本发明总体构思的对音频信号编码的方法和设备中,可从音频信号检测一个或多个重要的频率分量,然后可对其编码,并可对音频信号的包络线编码。此外,根据所述方法和设备,通过考虑重要频率分量的能量值控制包含重要频率分量的一个或多个频带的一个或多个包络线,可对音频信号解码。
因此,即使使用少量的比特对音频信号编码或解码,也可在不降低音频信号的声音质量的情况下,使编码效率最大化。
尽管已经示出和描述了本发明总体构思的几个实施例,但是本领域的技术人员应该理解,在不脱离本发明总体构思的原理和精神的情况下,可对这些实施例进行各种改变,本发明总体构思的范围由权利要求及其等同物限定。
Claims (18)
1.一种对音频信号解码的设备,所述设备包括:
频率分量解码单元,对一个或多个频率分量解码;
能量值解码单元,对将在多个频带的每个频带产生的信号的能量值解码;
能量值计算单元,基于解码的能量值并考虑解码的所述一个或多个频率分量的能量值,计算将在每个频带产生的信号的能量值;
信号产生单元,在每个频带产生具有计算的能量值之一的信号。
2.如权利要求1所述的设备,其中,能量值计算单元通过从每个频带的解码的能量值减去各频带中包含的一个或多个频率分量之一的能量值,来计算将在每个频带产生的信号的能量值。
3.如权利要求1所述的设备,其中,由信号产生单元产生的信号被任意产生。
4.如权利要求1所述的设备,其中,通过复制小于预定频率的频带的一个或多个信号来获得由信号产生单元产生的信号。
5.如权利要求1所述的设备,其中,使用小于预定频率的频带的一个或多个信号来获得由信号产生单元产生的信号。
6.如权利要求1所述的设备,还包括:音调解码单元,对一个或多个预定频带的每个频带的音调解码。
7.如权利要求6所述的设备,其中,能量值计算单元考虑每个预定频带的音调,以计算将在每个频带产生的信号的能量值。
8.一种用于对音频信号解码的设备,所述设备包括:
频率分量解码单元,对一个或多个频率分量解码;
包络线解码单元,对音频信号的多个包络线解码;
包络线调节单元,考虑各个频带的一个或多个频率分量的能量值来调节多个各个频带的所述多个包络线。
9.如权利要求8所述的设备,其中,包络调节单元调节每个频带的包络线,以使每个频带的解码的包络线的能量值等于通过从包括解码的所述一个或多个频率分量的每个频带的包络线的能量值减去包含在频带中的所述一个或多个频率分量的每个频率分量的能量值而获得的值。
10.如权利要求8所述的设备,还包括:音调解码单元,对一个或多个预定频带的每个频带的音调解码。
11.一种对音频信号解码的设备,所述设备包括:
频率分量解码单元,对一个或多个频率分量解码;
能量值解码单元,对小于预定频率的多个频带中的每个频带的信号的能量值解码;
能量值计算单元,基于解码的能量值并考虑解码的频率分量的能量值,计算将在每个频带产生的信号的能量值;
信号产生单元,在小于预定频率的每个频带产生具有计算的能量值之一的信号;
带宽扩展解码单元,通过使用在小于所述预定频率的每个频带的信号对大于所述预定频率的每个频带的信号解码;
信号调整单元,考虑各个频带的所述一个或多个频率分量的能量值调节大于所述预定频率的每个频带的解码的信号。
12.如权利要求11所述的设备,其中,能量值计算单元通过从每个频带的解码的能量值减去包含在各个频带的一个或多个频率分量中的每个频率分量的能量值来计算将在每个频带产生的信号的能量值。
13.如权利要求11所述的设备,其中,由信号产生单元产生的信号被任意产生。
14.如权利要求11所述的设备,其中,通过复制小于所述预定频率的每个频带的信号来获得由信号产生单元产生的信号。
15.如权利要求11所述的设备,其中,使用小于所述预定频率的每个频带的信号来获得由信号产生单元产生的信号。
16.如权利要求11所述的设备,还包括:音调解码单元,对一个或多个预定频带的每个频带的音调解码。
17.如权利要求16所述的设备,其中,能量值计算单元考虑一个或多个预定频带的每个预定频带的音调,以计算将在每个频带产生的信号的能量值。
18.如权利要求11所述的设备,还包括:帧同步单元,如果施加到频率分量解码单元的帧与施加到信号产生单元或带宽扩展解码单元的帧不同,则执行帧同步。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2007-0044717 | 2007-05-08 | ||
KR1020070044717A KR101411900B1 (ko) | 2007-05-08 | 2007-05-08 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
CN2008800153546A CN101682333B (zh) | 2007-05-08 | 2008-05-08 | 对音频信号编码和解码的方法和设备 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008800153546A Division CN101682333B (zh) | 2007-05-08 | 2008-05-08 | 对音频信号编码和解码的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103297058A true CN103297058A (zh) | 2013-09-11 |
CN103297058B CN103297058B (zh) | 2017-03-01 |
Family
ID=39943698
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008800153546A Expired - Fee Related CN101682333B (zh) | 2007-05-08 | 2008-05-08 | 对音频信号编码和解码的方法和设备 |
CN201310127932.8A Expired - Fee Related CN103297058B (zh) | 2007-05-08 | 2008-05-08 | 对音频信号解码的设备 |
CN201310127779.9A Expired - Fee Related CN103258540B (zh) | 2007-05-08 | 2008-05-08 | 对音频信号编码的设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008800153546A Expired - Fee Related CN101682333B (zh) | 2007-05-08 | 2008-05-08 | 对音频信号编码和解码的方法和设备 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310127779.9A Expired - Fee Related CN103258540B (zh) | 2007-05-08 | 2008-05-08 | 对音频信号编码的设备 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20080281604A1 (zh) |
JP (4) | JP5296777B2 (zh) |
KR (1) | KR101411900B1 (zh) |
CN (3) | CN101682333B (zh) |
WO (1) | WO2008136645A1 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
EP2294770B1 (en) * | 2008-06-20 | 2013-08-07 | Rambus, Inc. | Frequency responsive bus coding |
GB2473267A (en) * | 2009-09-07 | 2011-03-09 | Nokia Corp | Processing audio signals to reduce noise |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US9666202B2 (en) | 2013-09-10 | 2017-05-30 | Huawei Technologies Co., Ltd. | Adaptive bandwidth extension and apparatus for the same |
CN105765655A (zh) * | 2013-11-22 | 2016-07-13 | 高通股份有限公司 | 高频带译码中的选择性相位补偿 |
EP3525206B1 (en) * | 2013-12-02 | 2021-09-08 | Huawei Technologies Co., Ltd. | Encoding method and apparatus |
EP2980794A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
KR101653916B1 (ko) | 2015-03-11 | 2016-09-09 | 문제선 | 안전 당김줄단속구가 구비된 블라인드 |
KR102570480B1 (ko) * | 2019-01-04 | 2023-08-25 | 삼성전자주식회사 | 오디오 신호 처리 방법 및 이를 지원하는 전자 장치 |
US11115731B1 (en) * | 2020-05-12 | 2021-09-07 | Amazon Technologies, Inc. | Wireless transmitter/receiver architecture for low-power wide area networks |
Family Cites Families (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5040217A (en) * | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
JP3371590B2 (ja) * | 1994-12-28 | 2003-01-27 | ソニー株式会社 | 高能率符号化方法及び高能率復号化方法 |
US5692102A (en) * | 1995-10-26 | 1997-11-25 | Motorola, Inc. | Method device and system for an efficient noise injection process for low bitrate audio compression |
JP3189660B2 (ja) * | 1996-01-30 | 2001-07-16 | ソニー株式会社 | 信号符号化方法 |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP4464488B2 (ja) * | 1999-06-30 | 2010-05-19 | パナソニック株式会社 | 音声復号化装置及び符号誤り補償方法、音声復号化方法 |
US20070110042A1 (en) * | 1999-12-09 | 2007-05-17 | Henry Li | Voice and data exchange over a packet based network |
US6968564B1 (en) * | 2000-04-06 | 2005-11-22 | Nielsen Media Research, Inc. | Multi-band spectral audio encoding |
JP3590342B2 (ja) * | 2000-10-18 | 2004-11-17 | 日本電信電話株式会社 | 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体 |
CN1232951C (zh) * | 2001-03-02 | 2005-12-21 | 松下电器产业株式会社 | 编码装置和译码装置 |
JP4506039B2 (ja) * | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
DE60204039T2 (de) * | 2001-11-02 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur kodierung und dekodierung von audiosignalen |
JP3923783B2 (ja) * | 2001-11-02 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置及び復号化装置 |
US7469206B2 (en) * | 2001-11-29 | 2008-12-23 | Coding Technologies Ab | Methods for improving high frequency reconstruction |
JP2003177791A (ja) * | 2001-12-07 | 2003-06-27 | Sony Corp | コンテンツ符号化装置、コンテンツ符号化方法、コンテンツ符号化プログラム、及びコンテンツ符号化プログラムが記録された記録媒体、並びにコンテンツ復号装置、コンテンツ復号方法、コンテンツ復号プログラム、及びコンテンツ復号プログラムが記録された記録媒体 |
CN1288625C (zh) * | 2002-01-30 | 2006-12-06 | 松下电器产业株式会社 | 音频编码与解码设备及其方法 |
JP3881946B2 (ja) * | 2002-09-12 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
CN1328707C (zh) * | 2002-07-19 | 2007-07-25 | 日本电气株式会社 | 音频解码设备以及解码方法 |
EP1527442B1 (en) * | 2002-08-01 | 2006-04-05 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and audio decoding method based on spectral band replication |
EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
JP4657570B2 (ja) * | 2002-11-13 | 2011-03-23 | ソニー株式会社 | 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体 |
KR100547113B1 (ko) | 2003-02-15 | 2006-01-26 | 삼성전자주식회사 | 오디오 데이터 인코딩 장치 및 방법 |
KR101015497B1 (ko) * | 2003-03-22 | 2011-02-16 | 삼성전자주식회사 | 디지털 데이터의 부호화/복호화 방법 및 장치 |
KR101169596B1 (ko) * | 2003-04-17 | 2012-07-30 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 신호 합성 |
EP1621047B1 (en) * | 2003-04-17 | 2007-04-11 | Koninklijke Philips Electronics N.V. | Audio signal generation |
US7548852B2 (en) * | 2003-06-30 | 2009-06-16 | Koninklijke Philips Electronics N.V. | Quality of decoded audio by adding noise |
FR2867649A1 (fr) * | 2003-12-10 | 2005-09-16 | France Telecom | Procede de codage multiple optimise |
EP1715587A4 (en) * | 2004-02-10 | 2009-01-07 | Panasonic Corp | CODE / DECODER ARRANGEMENT |
US20080260048A1 (en) * | 2004-02-16 | 2008-10-23 | Koninklijke Philips Electronics, N.V. | Transcoder and Method of Transcoding Therefore |
EP1758099A1 (en) * | 2004-04-30 | 2007-02-28 | Matsushita Electric Industrial Co., Ltd. | Scalable decoder and expanded layer disappearance hiding method |
JP4168976B2 (ja) * | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
JP2006018023A (ja) * | 2004-07-01 | 2006-01-19 | Fujitsu Ltd | オーディオ信号符号化装置、および符号化プログラム |
WO2006018748A1 (en) * | 2004-08-17 | 2006-02-23 | Koninklijke Philips Electronics N.V. | Scalable audio coding |
WO2006025313A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法 |
KR20070085788A (ko) * | 2004-11-05 | 2007-08-27 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 신호 속성들을 사용한 효율적인 오디오 코딩 |
US20090070118A1 (en) * | 2004-11-09 | 2009-03-12 | Koninklijke Philips Electronics, N.V. | Audio coding and decoding |
KR100721537B1 (ko) * | 2004-12-08 | 2007-05-23 | 한국전자통신연구원 | 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법 |
US8082156B2 (en) * | 2005-01-11 | 2011-12-20 | Nec Corporation | Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal |
EP1864281A1 (en) * | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
PL1875463T3 (pl) * | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
KR100803205B1 (ko) * | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
KR100717058B1 (ko) * | 2005-11-28 | 2007-05-14 | 삼성전자주식회사 | 고주파 성분 복원 방법 및 그 장치 |
US8321230B2 (en) * | 2006-02-06 | 2012-11-27 | France Telecom | Method and device for the hierarchical coding of a source audio signal and corresponding decoding method and device, programs and signals |
WO2007121778A1 (en) * | 2006-04-24 | 2007-11-01 | Nero Ag | Advanced audio coding apparatus |
JP4004526B1 (ja) * | 2006-05-18 | 2007-11-07 | シャープ株式会社 | 信号処理方法、信号処理装置及びコンピュータプログラム |
US20080208575A1 (en) * | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
-
2007
- 2007-05-08 KR KR1020070044717A patent/KR101411900B1/ko active IP Right Grant
- 2007-12-14 US US11/956,690 patent/US20080281604A1/en not_active Abandoned
-
2008
- 2008-05-08 JP JP2010507326A patent/JP5296777B2/ja not_active Expired - Fee Related
- 2008-05-08 CN CN2008800153546A patent/CN101682333B/zh not_active Expired - Fee Related
- 2008-05-08 CN CN201310127932.8A patent/CN103297058B/zh not_active Expired - Fee Related
- 2008-05-08 CN CN201310127779.9A patent/CN103258540B/zh not_active Expired - Fee Related
- 2008-05-08 WO PCT/KR2008/002572 patent/WO2008136645A1/en active Application Filing
-
2013
- 2013-06-13 JP JP2013125014A patent/JP2013174932A/ja active Pending
-
2015
- 2015-09-17 JP JP2015184515A patent/JP6178373B2/ja active Active
-
2017
- 2017-07-13 JP JP2017137414A patent/JP6386634B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
KR101411900B1 (ko) | 2014-06-26 |
CN101682333B (zh) | 2013-05-22 |
CN103258540A (zh) | 2013-08-21 |
JP2013174932A (ja) | 2013-09-05 |
JP2015228044A (ja) | 2015-12-17 |
CN103297058B (zh) | 2017-03-01 |
CN101682333A (zh) | 2010-03-24 |
US20080281604A1 (en) | 2008-11-13 |
JP5296777B2 (ja) | 2013-09-25 |
KR20080099081A (ko) | 2008-11-12 |
JP2010526346A (ja) | 2010-07-29 |
JP6386634B2 (ja) | 2018-09-05 |
CN103258540B (zh) | 2016-08-03 |
JP6178373B2 (ja) | 2017-08-09 |
WO2008136645A1 (en) | 2008-11-13 |
JP2017203995A (ja) | 2017-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101682333B (zh) | 对音频信号编码和解码的方法和设备 | |
CN101681623B (zh) | 对高频带编码和解码的方法和设备 | |
CN101183527B (zh) | 用于对高频信号进行编码和解码的方法和设备 | |
CN101093670B (zh) | 用于产生重建信号的方法 | |
CN101083076B (zh) | 使用带宽扩展技术对信号编码和解码的方法和设备 | |
CN101819780B (zh) | 局部复合调制的滤波器组 | |
CN102892070B (zh) | 多声道下混对象编码的增强编码和参数表示 | |
CN101933086B (zh) | 处理音频信号的方法和设备 | |
CN103262164B (zh) | 叉积增强的基于子带块的谐波换位 | |
CN103632678A (zh) | 叉积增强的谐波转置 | |
CN104428833A (zh) | 用于对多信道hoa音频信号进行编码以便降噪的方法和设备以及用于对多信道hoa音频信号进行解码以便降噪的方法和设备 | |
Schulz | Improving audio codecs by noise substitution | |
CN105229731A (zh) | 根据下混的音频场景的重构 | |
CN102576542A (zh) | 从窄频带信号确定上频带信号 | |
CN103366749B (zh) | 一种声音编解码装置及其方法 | |
EP1606797B1 (en) | Processing of multi-channel signals | |
CN101800049B (zh) | 编码装置和译码装置 | |
CN103366751B (zh) | 一种声音编解码装置及其方法 | |
Annadana et al. | New Results in Low Bit Rate Speech Coding and Bandwidth Extension | |
CN101552006A (zh) | 加窗信号mdct域的能量及相位调整方法及其装置 | |
CN101582259B (zh) | 立体声信号编解码方法、装置及编解码系统 | |
Park et al. | Artificial stereo extension based on Gaussian mixture model | |
CN109416915B (zh) | 用于处理多声道音频信号的装置和方法 | |
Ooi | Application of wavelets to speech coding | |
Annadana et al. | A Novel Audio Post-Processing Toolkit for the Enhancement of Audio Signals Coded at Low Bit Rates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170301 Termination date: 20200508 |