CN101583994B - 对音频和/或语音信号进行编码和/或解码的方法和设备 - Google Patents
对音频和/或语音信号进行编码和/或解码的方法和设备 Download PDFInfo
- Publication number
- CN101583994B CN101583994B CN2007800501018A CN200780050101A CN101583994B CN 101583994 B CN101583994 B CN 101583994B CN 2007800501018 A CN2007800501018 A CN 2007800501018A CN 200780050101 A CN200780050101 A CN 200780050101A CN 101583994 B CN101583994 B CN 101583994B
- Authority
- CN
- China
- Prior art keywords
- signal
- unit
- frequency domain
- territory
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 377
- 230000003595 spectral effect Effects 0.000 claims description 139
- 238000006243 chemical reaction Methods 0.000 claims description 73
- 230000009466 transformation Effects 0.000 abstract description 116
- 230000005236 sound signal Effects 0.000 abstract description 14
- 230000001131 transforming effect Effects 0.000 abstract description 2
- 238000001228 spectrum Methods 0.000 description 106
- 238000011426 transformation method Methods 0.000 description 62
- 238000013139 quantization Methods 0.000 description 52
- 238000010586 diagram Methods 0.000 description 42
- 230000000873 masking effect Effects 0.000 description 20
- 238000013178 mathematical model Methods 0.000 description 17
- 238000000844 transformation Methods 0.000 description 13
- 239000000284 extract Substances 0.000 description 11
- 238000000605 extraction Methods 0.000 description 10
- 230000008447 perception Effects 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 8
- 238000011002 quantification Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 5
- 230000032823 cell division Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种对语音信号和/或音频信号进行编码和/或解码的方法和设备。所述设备包括:第一域变换单元、频域编码单元和复用单元,用于对语音信号和/或音频信号进行编码。所述设备包括:解复用单元、频域解码单元和第二域逆变换单元,用于对语音信号和/或音频信号进行解码。所述方法和设备能够对所有语音信号、音频信号以及语音信号和音频信号的混频信号进行有效地编码或解码,并通过使用少量比特提高声音的质量。
Description
技术领域
本发明总体构思涉及编解码器,更具体地,涉及用于对语音信号和/或音频信号进行编码和解码的方法和设备。
背景技术
传统的编解码器分为语音编解码器和音频编解码器。语音编解码器主要用于通过使用语音语调模型对与从50Hz到7kHz范围的频带相应的信号进行编码和解码。通常,语音编解码器通过提取通过对声带和声强建模表示语音信号的参数来执行编码和解码。音频编解码器主要用于通过应用声学模型(例如,高效先进音频编码(HE-AAC))来对与从0Hz到24Hz范围的频带相应的信号进行编码和解码。音频编解码器通常利用人类听觉特征通过省略低敏感度信号来执行编码和解码。
然而,仅使用语音编解码器和音频编解码器中的一个难以有效执行语音信号和音频信号两者的编码和解码。语音编解码器适用于对语音信号进行编码和解码,但是如果将其用于对音频信号进行编码和解码,则声音质量降低。如果音频编解码器用于对音频信号进行编码和解码,则压缩效率优,但是如果将其用于对语音信号进行编码和解码,则压缩效率降低。因此,需要研究这样一种方法和设备:在使用少量比特提高声音质量的同时能够对语音信号、音频信号以及语音信号和音频信号的混合信号进行编码或解码。
发明内容
本发明总体构思提供了一种对语音信号和/或音频信号进行有效编码和/或解码的方法和设备。
将在接下来的描述中的一部分阐述本发明总体构思另外的方面和效用,还有一部分通过描述将是清楚的,或者可以通过本发明总体构思的实施而得知。
可通过提供对信号进行编码的方法来实现本发明总体构思的前述和/或其它方面和效用,所述方法包括:将输入信号变换到至少一个域;使用预定的单元中的输入信号或变换的信号确定将被编码的域;对分配到确定的域中的单元的信号进行编码。
还可通过提供对信号进行编码的方法来达到本发明总体构思的前述和/或其它方面和效用,所述方法包括:确定一个或更多域,在所述域中将输入信号编码到预定的单元中;将分配到预定的各个单元的信号变换到确定的域,并随后对变换的信号进行编码。
还可通过提供对信号进行解码的方法来达到本发明总体构思的前述和/或其它方面和效用,所述方法包括:确定多个域,在所述多个域中预定的单元的信号已经被分别编码;分别对预定的域中的信号进行解码;通过将解码的信号组合来恢复原始信号。
还可通过提供对信号进行编码的设备来达到本发明总体构思的前述和/或其它方面和效用,所述设备包括:变换单元,将输入信号变换到至少一个域并使用预定的单元中的输入信号或变换的信号确定将被编码的域;编码单元,对分配到确定的域中的单元的信号进行编码。
还可通过提供对信号进行解码的设备来达到本发明总体构思的前述和/或其它方面和效用,所述设备包括:解复用单元,确定多个域,在所述多个域中预定的单元的信号已经被分别编码;解码单元,分别对确定的域中的信号进行解码;变换单元,通过将解码的信号组合来恢复原始信号。
还可通过提供对信号进行编码和/或解码的设备来达到本发明总体构思的前述和/或其它方面和效用,所述设备包括:编码器,将输入信号变换到至少一个域并使用预定的单元中的输入信号或变换的信号确定将被编码的域,并且对分配到确定的域中的单元的信号进行编码;解码器,确定编码的信号被分配的确定的域,分别对确定的域中的信号进行解码,通过将解码的信号组合来恢复输入信号。
还可通过提供包含作为执行以下方法的程序的计算机可读代码的计算机可读介质来达到本发明总体构思的前述和/或其它方面和效用:将输入信号变换到至少一个域;使用预定的单元中的输入信号或变换的信号确定将被编码的域;对分配到确定的域中的单元的信号进行编码;确定多个域,在所述多个域中用于预定的单元的信号已经被分别编码;分别对预定的域中的信号进行解码;通过将解码的信号组合来恢复原始信号。
附图说明
通过下面结合附图对实施例进行的描述,本发明总体构思的这些和其它方面和效用将会变得清楚并更加易于理解,其中:
图1是示出根据本发明总体构思的实施例的音频和/或语音信号编码设备的框图;
图2是示出根据本发明总体构思的实施例的包括在图1中示出的音频和/或语音信号编码设备中的频域编码单元的框图;
图3是示出根据本发明总体构思的另一实施例的包括在图1中示出的音频和/或语音信号编码设备中的频域编码单元的框图;
图4是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图;
图5是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图;
图6是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图;
图7是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图;
图8是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图;
图9是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图;
图10是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图;
图11是示出根据本发明总体构思的实施例的音频和/或语音信号解码设备的框图;
图12是示出根据本发明总体构思的实施例的包括在图11中示出的音频和/或语音信号解码设备中的频域解码单元的框图;
图13是示出根据本发明总体构思的另一实施例的包括在图11中示出的音频和/或语音信号解码设备中的频域解码单元的框图;
图14是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图;
图15是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图;
图16是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图;
图17是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图;
图18是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图;
图19是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图;
图20是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图;
图21是示出根据本发明总体构思的实施例的音频和/或语音信号编码方法的流程图。
具体实施方式
将详细描述本发明总体构思的实施例,其示例在附图中表示,其中,相同的标号始终表示相同的部件。以下通过参考附图描述实施例以解释本发明总体构思。
图1是示出根据本发明总体构思的实施例的音频和/或语音信号编码设备的框图。编码设备包括第一域变换单元100、频域编码单元110和复用单元120。
第一域变换单元100将经由输入端子IN接收的输入信号从时域变换到频域,并随后将频带划分为子代。这里,第一域变换单元100根据第一变换方法将输入信号从时域变换到频域,还根据第二变换方法将输入信号从时域变换到频域,以将声学模型应用到输入信号,第二变换方法与第一变换方法不同。使用根据第一变换方法变换的信号对输入信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到输入信号。
例如,第一域变换单元100可通过将修正的离散余弦变换(MDCT)用作第一变换方法将输入信号变换到频域来使用实数表示输入信号,并通过将修正的离散正弦变换(MDST)用作第二变换方法将输入信号变换到频域来使用虚数表示输入信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对输入信号进行编码,作为使用MDST的结果的使用虚数表示的信号和实数一起用于将声学模型应用到输入信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行离散傅里叶变换(DFT),并随后对MDCT系数进行量化,从而避免发生失配。
频域编码单元110从由第一域变换单元100根据第一变换方法变换的信号的每个子带选择重要谱分量并对其进行量化,并随后提取剩余谱分量,计算并量化剩余谱分量的噪声等级。可如图2或图3中所示来构建频域编码单元110。
图2是示出根据本发明总体构思的实施例的频域编码单元110的框图。参照图1和图2,频域编码单元110包括声学模型应用单元200、重要谱分量选择单元210、量化单元220和噪声处理单元230。
声学模型应用单元200将声学模型应用到输入信号以去除由人类听觉特征引起的感知冗余。这里,声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
声学模型应用单元200通过应用使用人类听觉系统的声学模型从输入信号省略或排除低敏感度特殊信息,并分配指示频率单元中的感知强度的信号掩蔽比(SMR)。声学模型应用单元200通过使用根据第二变换方法变换的信号来应用声学模型。第二变换方法的示例是MDST。
重要谱分量选择单元210从在频域中表示并经由输入端子IN 1接收的信号的每个子带选择重要谱分量。在这种情况下,重要谱分量选择单元210可使用各种方法以选择重要谱分量。在第一种方法中,计算信号的SMR,随后,如果SMR大于掩蔽值的倒数,则确定信号为重要谱分量。在第二种方法中,通过在考虑预定权重的情况下提取谱峰来选择重要谱分量。在第三种方法中,计算每个子带的信号噪声比(SNR),随后,从具有小SNR的子带中选择峰值等于或大于预定值的谱分量。可单独执行上述三种方法,或者可执行三种方法中的一种或至少两种的组合。
量化单元220对由重要谱分量选择单元210通过使用由声学模型应用单元200分配的SMR来选择的重要谱分量进行量化,并随后经由输出端于OUT1输出量化结果。
噪声处理单元230从经由输入端子IN 1接收的在频域中表示的信号提取除了由重要谱分量选择单元210选择的重要谱分量之外的剩余谱分量,并随后计算并量化剩余谱分量的噪声等级。这里,噪声处理单元230经由输出端子OUT2输出量化结果。
图3是示出根据本发明总体构思的另一实施例的频域编码单元110的框图。参照图1和图3,频域编码单元110包括语音工具编码单元300、声学模型应用单元310、重要谱分量选择单元320、量化单元330和噪声处理单元340。
语音工具编码单元300通过将信号划分为短变换长度来对被确定为具有临界值的强攻击信号的信号进行精确编码,并在输出端子OUT3输出结果。这里,信号可以是根据第一变换方法变换的信号。
声学模型应用单元310将声学模型应用到输入信号以去除由人类听觉特征引起的感知冗余。另外,声学模型应用单元310计算分配给经由输入端子IN 2接收的在频域中表示的信号的各个子带的比特数。
声学模型应用单元310通过应用使用人类听觉系统的声学模型从输入信号省略或排除低敏感度特殊信息,并在改变SMR时分配指示频率单元中的感知强度的SMR。声学模型应用单元310通过使用根据第二变换方法变换的信号来应用声学模型。第二变换方法的示例是MDST。
重要谱分量选择单元320从经由输入端子IN 2接收的在频域中表示的信号的每个子带选择重要谱分量。在这种情况下,重要谱分量选择单元320可使用各种方法以选择重要谱分量。第一,计算信号的SMR,随后,如果SMR大于掩蔽值的倒数,则确定信号为重要谱分量。第二,通过在考虑预定权重的情况下提取谱峰来选择重要谱分量。第三,计算每个子带的信号噪声比(SNR),随后,从具有小SNR的子带中选择峰值等于或大于预定值的谱分量。可单独执行上述三种方法,或者可执行三种方法中的一种或至少两种的组合。
量化单元330对由重要谱分量选择单元320通过使用由声学模型应用单元310分配的SMR来选择的重要谱分量进行量化,并随后经由输出端子OUT4输出量化结果。
噪声处理单元340从经由输入端子IN 2接收的在频域中表示的信号提取除了由重要谱分量选择单元320选择的重要谱分量之外的剩余谱分量,并随后计算并量化剩余谱分量的噪声等级。这里,噪声处理单元340经由输出端子OUT5输出量化结果。
这里,可通过执行线性预测分析来计算噪声等级。使用自相关方法执行线性预测分析,但也可使用协方差方法或Durbin方法执行线性预测分析。线性预测允许编码单元预测在当前帧中存在的噪声分量的量。如果存在较多噪声分量,则剩余谱分量被直接发送而不改变它们的噪声等级。如果存在较少的噪声分量并存在较多的音调分量,则通过减小剩余谱分量的噪声等级来发送剩余谱分量。另外,在使用指示噪声快速改变的小窗口的情况下,通过另外减小剩余谱分量的噪声等级来直接发送剩余谱分量。
图1的复用单元120通过对频域编码单元110的编码结果进行复用来产生比特流,并经由输出端子OUT输出比特流。这里,频域编码单元110的编码结果表示这样的编码结果:由量化单元220在输出端子OUT1对重要谱分量量化的结果和由噪声处理单元230在输出端子OUT2对剩余谱分量量化的结果(见图2),或由语音工具编码单元300在输出端子OUT3的编码结果、由量化单元330在输出端子OUT4对重要谱分量量化的结果和由噪声处理单元340在输出端子OUT5对剩余谱分量量化的结果(见图3)。
图4是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图。音频和/或语音信号编码设备包括域变换单元400、模式确定单元410、时域编码单元420、频域编码单元430和复用单元440。
域变换单元400将经由输入端子IN 4接收的输入信号从时域变换到频域,将信号划分为子带单元,并随后将预定的一个或预定的几个子带从频域变换到时域。
域变换单元400可被实施为执行接收在时域中表示的信号以及在时域和频域两者中表示信号的各种变换方法。更具体地,各种变换方法是灵活的方法,在这些方法中,在时域中表示的信号被变换到频域,随后信号的时间分辨率在频带单元中被适当地控制,以表示频域中的信号的预定的一个或预定的几个子带。此外,域变换单元400使用虚数来产生将应用到声学模型的信号。这种变换方法的示例是频变调制重叠变换(FV-MLT)。
域变换单元400包括第一域变换单元403和第二域逆变换单元406。
第一域变换单元403将经由输入端子IN4接收的输入信号从时域变换到频域,并将信号划分为子带单元。这里,第一域变换单元403根据第一变换方法将输入信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将输入信号从时域变换到频域,以将声学模型应用到输入信号。使用根据第一变换方法变换的信号对输入信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到输入信号。
例如,第一域变换单元403可通过将MDCT用作第一变换方法将输入信号变换到频域来使用实数表示输入信号,并通过将MDST用作第二变换方法将输入信号变换到频域来使用虚数表示输入信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对输入信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到输入信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
第二域逆变换单元406根据第一变换方法的逆变换方法将由第一域变换单元403变换到频域的预定的子代从频域逆变换到时域。例如,第二域逆变换单元406执行作为第一变换方法的逆变换的修正的离散余弦逆变换(IMDCT)。
模式确定单元410确定在频域中对由第一域变换单元403变换到频域的信号的每个子带进行编码是否合适。换句话说,模式确定单元410基于预定的原理确定在频域还是在时域中对信号的每个子带进行编码。另外,模式确定单元410对指示由模式确定单元410为每个子带确定的域的标识符进行量化,并随后将量化结果输出到复用单元440。
当模式确定单元410确定是否在频域中对每个子带进行编码时,可使用与频域相应的并从第一域变换单元403接收的信号以及与时域相应的并经由输入端子IN4接收的信号中的一个或两者。
第二域逆变换单元406根据第一变换方法的逆变换方法将多个子带中由模式确定单元410确定不在频域中编码的子带从频域逆变换到时域。
时域编码单元420在时域中对由第二域逆变换单元406逆变换到时域的子带的一个或多个信号进行编码。
被确定不在频域中编码的子带的信号不仅可由时域编码单元420在时域中进行编码,还可由频域编码单元430在频域中进行编码。因此,不仅可在时域中对预定的子带进行编码,还可在频域中对预定的子带进行编码。在这种情况下,表示预定的子带的信号已经在时域和频域两者中进行编码的标识符被量化,随后,量化的结果被输出到复用单元440。
频域编码单元430在频域中对由模式确定单元410确定在频域中进行编码的子带进行编码。可如图2和图3所示构造频域编码单元430。
复用单元440通过对指示已经对每个子带进行编码的域的标识符量化的结果、由时域编码单元420编码的结果以及频域编码单元430的编码结果进行复用来产生比特流,并经由输出端子OUT输出比特流。这里,频域编码单元430的编码结果表示:由量化单元220对重要谱分量量化的结果和由噪声处理单元230对剩余谱分量量化的结果(见图2),或由语音工具编码单元300编码的结果、由量化单元330对重要谱分量量化的结果和由噪声处理单元340对剩余谱分量量化的结果(见图3)。
图5是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图。音频和/或语音信号编码设备包括立体声编码单元500、第一域变换单元510、频域编码单元520和复用单元530。
如果经由输入端子IN接收的输入信号是立体声信号,则立体声编码单元500通过分析输入信号来提取参数,并随后对输入信号下混频。提取的参数是解码端将从编码端接收的单信号上混频到立体声信号所需的信息。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。立体声编码单元500对参数进行量化并随后将量化结果输出到复用单元530。
第一域变换单元510将由立体声编码单元500下混频的信号从时域变换到频域,并随后将信号划分为子带单元。这里,第一域变换单元510根据第一变换方法将下混频的信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将输入信号从时域变换到频域,以将声学模型应用到输入信号。使用根据第一变换方法变换的信号对输入信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到输入信号。声学模型表示关于人类听觉系统的掩蔽反映的数学模型。
例如,第一域变换单元510可通过将修正的离散余弦变换(MDCT)用作第一变换方法将输入信号变换到频域来使用实数表示输入信号,并通过将修正的离散正弦变换(MDST)用作第二变换方法将输入信号变换到频域来使用虚数表示输入信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对输入信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到输入信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行离散傅里叶变换(DFT),并随后对MDCT系数进行量化,从而避免发生失配。
频域编码单元520从由第一域变换单元500根据第一变换方法变换的信号的每个子带选择重要谱分量并对其进行量化,并随后提取剩余谱分量,计算并量化剩余谱分量的噪声等级。可如图2或图3中所示来构建频域编码单元520。
复用单元530通过对由立体声编码单元500量化的参数以及频域编码单元520的编码结果进行复用来产生比特流,并随后经由输出端子OUT输出比特流。这里,频域编码单元520的编码结果表示:由量化单元220对重要谱分量量化的结果和由噪声处理单元230对剩余谱分量量化的结果(见图2),或由语音工具编码单元300编码的结果、由量化单元330对重要谱分量量化的结果和由噪声处理单元340对剩余谱分量量化的结果(见图3)。
图6是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图。音频和/或语音信号编码设备包括立体声编码单元500、域变换单元610、模式确定单元620、时域编码单元630、频域编码单元640和复用单元650。
如果经由输入端子IN接收的输入信号是立体声信号,则立体声编码单元600通过分析输入信号来提取参数,并随后对输入信号下混频。提取的参数是解码端将从编码端接收的单信号上混频到立体声信号所需的信息。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。立体声编码单元600对参数进行量化并随后将量化结果输出到复用单元650。
域变换单元610将由立体声编码单元600下混频的信号从时域变换到频域,将信号划分为子带单元,并对预定的一个或预定的几个子带进行逆变换。
这里,域变换单元610可被实施为执行接收在时域中表示的信号以及在时域和频域两者中表示信号的各种变换方法。更具体地,各种变换方法是灵活的方法,在这些方法中,在时域中表示的信号被变换到频域,随后信号的时间分辨率在频带单元中被适当地控制,以表示频域中的信号的预定的一个或预定的几个子带。此外,域变换单元610使用虚数来产生将应用到声学模型的信号。这种变换方法的示例是频变调制重叠变换(FV-MLT)。
域变换单元610包括第一域变换单元613和第二域逆变换单元616。
第一域变换单元613将由立体声编码单元600下混频的信号从时域变换到频域,并随后将信号划分为子带单元。这里,第一域变换单元613根据第一变换方法将下混频的信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将下混频的信号从时域变换到频域,以将声学模型应用到输入信号。使用根据第一变换方法变换的信号对下混频的信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到下混频的信号。
例如,第一域变换单元613可通过将MDCT用作第一变换方法将输入信号变换到频域来使用实数表示输入信号,并通过将MDST用作第二变换方法将下混频的信号变换到频域来使用虚数表示下混频的信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对下混频的信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到下混频的信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行离散傅里叶变换(DFT),并随后对MDCT系数进行量化,从而避免发生失配。
第二域逆变换单元616根据第一变换方法的逆变换方法将由第一域变换单元613变换到频域的预定的子带从频域逆变换到时域。例如,第二域逆变换单元616执行作为第一变换方法的逆变换的IMDCT。
模式确定单元620确定在频域中对由第一域变换单元613变换到频域的信号的每个子带进行编码是否合适。换句话说,模式确定单元620确定在频域还是在时域中对信号的每个子带进行编码。另外,模式确定单元620对指示由模式确定单元620为每个子带确定的域的标识符进行量化,并随后将量化结果输出到复用单元650。
当模式确定单元620确定是否在频域中对每个子带进行编码时,可使用与频域相应的并从第一域变换单元613接收的信号以及与时域相应的并从立体声编码单元600接收的信号中的一个或两者。
第二域逆变换单元616根据第一变换方法的逆变换方法将多个子带中由模式确定单元620确定不在频域中编码的子带从频域逆变换到时域。例如,第二域逆变换单元616通过执行IMDCT来将子带从频域逆变换到时域。
时域编码单元630在时域中对由第二域逆变换单元616逆变换到时域的子带的一个或多个信号进行编码。
被确定不在频域中编码的子带的信号不仅可由时域编码单元630在时域中进行编码,还可由频域编码单元640在频域中进行编码。因此,不仅可在时域中对预定的子带进行编码,还可在频域中对预定的子带进行编码。在这种情况下,表示预定的子带的信号已经在时域和频域两者中进行编码的标识符被量化,随后,量化的结果被输出到复用单元650。
频域编码单元640在频域中对由模式确定单元620确定在频域中进行编码的子带进行编码。可如图2和图3所示构造频域编码单元640。
复用单元650通过对由立体声编码单元600量化的参数、对指示对每个子带进行编码的域的标识符量化的结果、由时域编码单元630编码的结果以及频域编码单元640的编码结果进行复用来产生比特流,并经由输出端子OUT输出比特流。这里,频域编码单元640的编码结果表示:由量化单元220对重要谱分量量化的结果和由噪声处理单元230对剩余谱分量量化的结果(见图2),或由语音工具编码单元300编码的结果、由量化单元330对重要谱分量量化的结果和由噪声处理单元340对剩余谱分量量化的结果(见图3)。
图7是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图。音频和/或语音信号编码设备包括带划分单元700、第一域变换单元710、频域编码单元720、高频带编码单元730和复用单元740。
带划分单元700基于预定的频率将经由输入端子IN接收的输入信号划分为低频带信号和高频带信号。
第一域变换单元710将从带划分单元700接收的低频带信号从时域变换到频域,并随后将低频带信号划分为子带单元。这里,第一域变换单元710根据第一变换方法将低频带信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将低频带信号从时域变换到频域,以将声学模型应用到低频带信号。使用根据第一变换方法变换的信号对低频带信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到低频带信号。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
例如,第一域变换单元710可通过将MDCT用作第一变换方法将低频带信号变换到频域来使用实数表示低频带信号,并通过将MDST用作第二变换方法将低频带信号变换到频域来使用虚数表示低频带信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对低频带信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到低频带信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。
频域编码单元720从在频域中表示并从第一域变换单元710接收的信号的每个子带选择重要谱分量并对其进行,并随后提取剩余谱分量,计算并量化剩余谱分量的噪声等级。可如图2或图3中所示来构建频域编码单元720。
高频带编码单元730使用低频带信号对从带划分单元700接收的高频带信号进行编码。
复用单元740通过对由频域编码单元720编码的结果以及高频带编码单元730编码的结果进行复用来产生比特流,并随后经由输出端子OUT输出比特流。这里,频域编码单元720的编码结果表示:由量化单元220对重要谱分量量化的结果和由噪声处理单元230对剩余谱分量量化的结果(见图2),或由语音工具编码单元300编码的结果、由量化单元330对重要谱分量量化的结果和由噪声处理单元340对剩余谱分量量化的结果(见图3)。
图8是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图。音频和/或语音信号编码设备包括带划分单元800、域变换单元810、模式确定单元820、时域编码单元830、频域编码单元840、高频带编码单元850和复用单元860。
带划分单元800基于预定的频率将从输入端子IN接收的输入信号划分为低频带信号和高频带信号。
域变换单元810将从带划分单元800接收的低频带信号从时域变换到频域,将低频带信号划分为子带单元,并将预定的一个或预定的几个子带逆变换到时域。
这里,域变换单元810可被实施为执行接收在时域中表示的信号以及在时域和频域两者中表示信号的各种变换方法。更具体地,各种变换方法是灵活的方法,在这些方法中,在时域中表示的信号被变换到频域,随后信号的时间分辨率在频带单元中被适当地控制,以表示频域中的信号的预定的一个或预定的几个子带。此外,域变换单元810使用虚数来产生将应用到声学模型的信号。这种变换方法的示例是FV-MLT。
域变换单元810包括第一域变换单元813和第二域逆变换单元816。
第一域变换单元813将从带划分单元800接收的低频带信号从时域变换到频域,并随后将低频带信号划分为子带单元。这里,第一域变换单元813根据第一变换方法将低频带信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将低频带信号从时域变换到频域,以将声学模型应用到低频带信号。使用根据第一变换方法变换的信号对低频带信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到低频带信号。
例如,第一域变换单元813可通过将MDCT用作第一变换方法将低频带信号变换到频域来使用实数表示低频带信号,并通过将MDST用作第二变换方法将低频带信号变换到频域来使用虚数表示低频带信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对低频带信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到低频带信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。
第二域逆变换单元816根据第一变换方法的逆变换方法将由第一域变换单元813变换到频域的预定的一个或预定的几个子带从频域逆变换到时域。例如,第二域逆变换单元816执行作为第一变换方法的逆变换方法的IMDCT。
模式确定单元820确定在频域中对由第一域变换单元813变换到频域的低频带信号的每个子带进行编码是否合适。换句话说,模式确定单元820确定在频域还是在时域中对低频带信号的每个子带进行编码。另外,模式确定单元820对指示由模式确定单元820为每个子带确定的域的标识符进行量化,并随后将量化结果输出到复用单元860。
当模式确定单元820确定是否在频域中对每个子带进行编码时,可使用与频域相应的并从第一域变换单元813接收的信号以及与时域相应的并从带划分单元800接收的信号中的一个或两者。
第二域逆变换单元816根据第一变换方法的逆变换方法将多个子带中的由模式确定单元820确定不在频域中编码的子带从频域逆变换到时域。例如,第二域逆变换单元816通过执行IMDCT来将子带从频域逆变换到时域。
时域编码单元830在时域中对由第二域逆变换单元816逆变换到时域的子带的一个或多个信号进行编码。
在预定的一个或预定的几个子带的情况下,被确定不在频域中编码的子带的信号不仅可由时域编码单元830在时域中进行编码,还可由频域编码单元840在频域中进行编码。因此,不仅可在时域中对预定的子带进行编码,还可在频域中对预定的子带进行编码。在这种情况下,表示预定的子带的信号已经在时域和频域两者中进行编码的标识符被量化,随后,量化的结果被输出到复用单元860。
频域编码单元840在频域中对由模式确定单元820确定在频域中进行编码的子带进行编码。可如图2和图3所示构造频域编码单元840。
高频带编码单元850使用低频带信号对从带划分单元800接收的高频带信号进行编码。
复用单元860通过对指示对每个子带进行编码的域的标识符量化的结果、由时域编码单元830编码的结果、频域编码单元840编码的结果以及由高频带编码单元850编码的结果进行复用来产生比特流,并随后经由输出端子OUT输出比特流。这里,频域编码单元840的编码结果表示:由量化单元220对重要谱分量量化的结果和由噪声处理单元230对剩余谱分量量化的结果(见图2),或由语音工具编码单元300编码的结果、由量化单元330对重要谱分量量化的结果和由噪声处理单元340对剩余谱分量量化的结果(见图3)。
图9是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图。音频和/或语音信号编码设备包括立体声编码单元900、带划分单元910、第一域变换单元920、频域编码单元930、高频带编码单元940和复用单元950。
如果经由输入端子IN接收的输入信号是立体声信号,则立体声编码单元900通过分析输入信号来提取参数,并随后对输入信号下混频。提取的参数是解码端将从编码端接收的单信号上混频到立体声信号所需的信息。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。立体声编码单元900对参数进行量化并随后将量化结果输出到复用单元950。
带划分单元910基于预定的频率将由立体声编码单元900下混频的信号划分为低频带信号和高频带信号。
第一域变换单元920将从带划分单元910接收的低频带信号从时域变换到频域,并随后将信号划分为子带单元。这里,第一域变换单元920根据第一变换方法将低频带信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将低频带信号从时域变换到频域,以将声学模型应用到低频带信号。使用根据第一变换方法变换的信号对低频带信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到低频带信号。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
例如,第一域变换单元920可通过将MDCT用作第一变换方法将低频带信号变换到频域来使用实数表示低频带信号,并通过将MDST用作第二变换方法将低频带信号变换到频域来使用虚数表示低频带信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对低频带信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到低频带信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行离散傅里叶变换(DFT),并随后对MDCT系数进行量化,从而避免发生失配。
频域编码单元930从在频域中表示并从第一域变换单元920接收的信号的每个子带选择重要谱分量并对其进行量化,并随后提取剩余谱分量,计算并量化剩余谱分量的噪声等级。可如图2或图3中所示来构建频域编码单元930。
高频带编码单元940使用低频带信号对从带划分单元910接收的高频带信号进行编码。
复用单元950通过对由立体声编码单元900量化的参数、由频域编码单元930编码的结果以及由高频带编码单元940编码的结果进行复用来产生比特流,并随后经由输出端子OUT输出比特流。这里,频域编码单元930的编码结果表示:由量化单元220对重要谱分量量化的结果和由噪声处理单元230对剩余谱分量量化的结果(见图2),或由语音工具编码单元300编码的结果、由量化单元330对重要谱分量量化的结果和由噪声处理单元340对剩余谱分量量化的结果(见图3)。
图10是示出根据本发明总体构思的另一实施例的音频和/或语音信号编码设备的框图。音频和/或语音信号编码设备包括立体声编码单元1000、带划分单元1010、域变换单元1020、模式确定单元1030、时域编码单元1040、频域编码单元1050、高频带编码单元1060和复用单元1070。
如果经由输入端子IN接收的输入信号是立体声信号,则立体声编码单元1000通过分析输入信号来提取参数,并随后对输入信号下混频。提取的参数是解码端将从编码端接收的单信号上混频到立体声信号所需的信息。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。立体声编码单元1000对参数进行量化并随后将量化结果输出到复用单元1070。
带划分单元1010基于预定的频率将由立体声编码单元1000下混频的信号划分为低频带信号和高频带信号。
域变换单元1020将从带划分单元1010接收的低频带信号从时域变换到频域,将低频带信号划分为子带单元,并将预定的一个或预定的几个子带逆变换到时域。
这里,域变换单元1020可被实施为执行接收在时域中表示的信号以及在时域和频域两者中表示信号的各种变换方法。更具体地,各种变换方法是灵活的方法,在这些方法中,在时域中表示的信号被变换到频域,随后信号的时间分辨率在频带单元中被适当地控制,以表示频域中的信号的预定的一个或预定的几个子带。此外,域变换单元1020使用虚数来产生将应用到声学模型的信号。这种变换方法的示例是FV-MLT。
域变换单元1020包括第一域变换单元1023和第二域逆变换单元1026。
第一域变换单元1023将从带划分单元1010接收的低频带信号从时域变换到频域,并随后将信号划分为子带单元。这里,第一域变换单元1023根据第一变换方法将低频带信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将低频带信号从时域变换到频域,以将声学模型应用到低频带信号。使用根据第一变换方法变换的信号对低频带信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到低频带信号。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
例如,第一域变换单元1023可通过将MDCT用作第一变换方法将低频带信号变换到频域来使用实数表示低频带信号,并通过将MDST用作第二变换方法将低频带信号变换到频域来使用虚数表示低频带信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对低频带信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到低频带信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。
第二域逆变换单元1026根据第一变换方法的逆变换方法将由第一域变换单元1023变换到频域的预定的一个或预定的几个子带从频域逆变换到时域。例如,第二域逆变换单元1026执行作为第一变换方法的逆变换方法的IMDCT。
模式确定单元1030确定在频域中对由第一域变换单元1023变换到频域的低频带信号的每个子带进行编码是否合适。换句话说,模式确定单元1030确定在频域还是在时域中对低频带信号的每个子带进行编码。另外,模式确定单元1030对指示由模式确定单元1030为每个子带确定的域的标识符进行量化,并随后将量化结果输出到复用单元1070。
当模式确定单元1030确定是否在频域中对每个子带进行编码时,可使用与频域相应的并从第一域变换单元1023接收的信号以及与时域相应的并从带划分单元1010接收的信号中的一个或两者。
第二域逆变换单元1026根据第一变换方法的逆变换方法将多个子带中的由模式确定单元1030确定不在频域中编码的子带从频域逆变换到时域。例如,第二域逆变换单元1026通过执行IMDCT来逆变换子带。
时域编码单元1040在时域中对由第二域逆变换单元1026逆变换到时域的子带的一个或多个信号进行编码。
被确定不在频域中编码的子带的信号不仅可由时域编码单元1040在时域中进行编码,还可由频域编码单元1050在频域中进行编码。因此,不仅可在时域中对预定的子带进行编码,还可在频域中对预定的子带进行编码。在这种情况下,表示预定的子带的信号已经在时域和频域两者中进行编码的标识符被量化,随后,量化的结果被输出到复用单元1070。
频域编码单元1050在频域中对由模式确定单元1030确定在频域中进行编码的子带进行编码。可如图2或图3中所示来构建频域编码单元1050。
高频带编码单元1060通过使用低频带信号对从带划分单元1010接收的高频带信号进行编码。
复用单元1070通过对由立体声编码单元1000量化的参数、对指示已经对每个子带进行编码的域的标识符量化的结果、由时域编码单元1040编码的结果、由频域编码单元1050编码的结果以及由高频带编码单元1060编码的结果进行复用来产生比特流,并随后经由输出端子OUT输出比特流。这里,频域编码单元1050的编码结果表示:由量化单元220对重要谱分量量化的结果和由噪声处理单元230对剩余谱分量量化的结果(见图2),或由语音工具编码单元300编码的结果、由量化单元330对重要谱分量量化的结果和由噪声处理单元340对剩余谱分量量化的结果(见图3)。
图11是示出根据本发明总体构思的实施例的音频和/或语音信号解码设备的框图。音频和/或语音信号解码设备包括解复用单元1100、频域解码单元1110和第二域逆变换单元1120。
解复用单元1100经由输入端子IN接收来自编码端(未示出)的比特流并对所述比特流解复用。这里,从解复用单元1100输出的比特流的解复用结果包括对编码终端在频域中编码的重要谱分量量化的结果和对剩余谱分量的噪声等级量化的结果。此外,比特流的解复用结果还包括使用语音工具编码的结果。
频域解码单元1110对从解复用单元1100接收的由编码端在频域中编码的结果进行解码。更具体地,频域解码单元1110对从每个子带选择的重要谱分量以及剩余谱分量的噪声等级进行解码。可如图12或图13所示构造频域解码单元1110。
图12是示出根据本发明总体构思的实施例的包括在图11的音频和/或语音信号解码设备中的频域解码单元1110的框图。频域解码单元1110包括反量化单元1200和噪声解码单元1210。
反量化单元1200经由输入端子IN1接收量化重要谱分量的结果并随后将其反量化,其中,重要谱分量被使用不同数量的比特分别进行编码,所述比特通过应用声学模型而被分配,声学模型去除由人类听觉特征引起的感知冗余。这里,声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
噪声解码单元1210经由输入端子IN2接收除了重要谱分量之外的剩余谱分量的噪声等级的解复用结果,并随后对其解码。另外,噪声解码单元1210将解码的噪声等级与由反量化单元1200反量化的重要谱分量进行组合。噪声解码单元1210经由输出端子OUT1输出组合的结果。
图13是示出根据本发明总体构思的另一实施例的包括在图11的音频和/或语音信号解码设备中的频域解码单元1110的框图。频域解码单元1110包括反量化单元1300、噪声解码单元1310和语音工具解码单元1320。
反量化单元1300经由输入端子IN3接收反量化重要谱分量的结果并随后将其反量化,其中,重要谱分量被使用不同数量的比特分别进行编码,所述比特通过应用声学模型而被分配,声学模型去除由人类听觉特征引起的感知冗余。
噪声解码单元1310经由输入端子IN4接收除了重要谱分量之外的剩余谱分量的噪声等级的解复用结果,并随后对其解码。另外,噪声解码单元1310将解码的噪声等级与由反量化单元1300反量化的重要谱分量进行组合。
语音工具解码单元1320经由输入终端IN5接收由编码端(未示出)通过使用语音工具编码的结果,并随后对其解码。另外,语音工具解码单元1320将语音工具解码单元1320解码的结果与噪声解码单元1310组合的结果进行组合。这里,语音工具解码单元1320经由输出端子OUT2输出组合的结果。
参照图11,第二域逆变换单元1120根据第二逆变换方法将由频域解码单元1100解码的结果从频域逆变换到时域。这里,第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT(修正的离散余弦逆变换)。另外,第二域逆变换单元1120经由输出端子OUT输出逆变换的结果。例如,第二域逆变换单元1120通过执行IMDCT将作为在图12的噪声解码单元1210的输出端子OUT1接收的组合结果的信号以及作为在图13的语音工具解码单元1320的输出端子OUT2接收的组合结果的信号从频域逆变换到时域。
图14是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图。音频和/或语音信号解码设备包括解复用单元1400、模式确定单元1410、频域解码单元1420、时域解码单元1430和域变换单元1440。
解复用单元1400经由输入端子IN从编码端(未示出)接收比特流并随后对比特流解复用。从解复用单元1400输出的对比特流解复用的结果包括关于对每个子带已经进行编码的域的信息、由编码端在频域中对预定子带编码的结果以及编码端在时域中对预定子带编码的结果。
这里,在频域中编码的结果可包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
模式确定单元1410读取从解复用单元1400接收的关于对每个子带已经进行编码的域的信息,并随后确定每个子带已经在频域中还是在时域中被编码。
频域解码单元1420在频域中对由模式确定单元1410确定在频域中已经被编码的一个或更多子带进行解码。更具体地,频域解码单元1420对从每个子带选择的重要谱分量和剩余谱分量的噪声等级进行解码。可如图12或图13所示构造频域解码单元1420。
时域解码单元1430在时域中对由模式确定单元1410确定在时域中已经被编码的一个或更多子带进行解码。
可能的是,即使编码端确定特定子带在时域中被编码时,所述特定子带也可以在频域和时域两者中被编码。频域解码单元1420在频域中对特定子带的编码结果进行解码,时域解码单元1430在时域中对特定子带的编码结果进行解码。
域变换单元1440将时域解码单元1430解码的结果从时域变换到频域,并将频域解码单元1420解码的结果与从时域解码单元1430接收的信号变换到频域的结果组合,并随后将组合结果从频域变换到时域。
这里,域变换单元1440可被实施为执行接收以预定的带单元划分的多个信号以及在时域或频域中表示信号并随后将信号变换到时域的各种变换方法。这种变换方法的示例是FV-MLT。
域变换单元1440包括第二域变换单元1443和第二域逆变换单元1446。
第二域变换单元1443根据第二变换方法将由时域解码单元1430解码的信号从时域变换到频域。例如,第二变换方法可以是MDCT。
第二域逆变换单元1446将由频域解码单元1420解码的子带的信号与由第二域变换单元1443变换的子带的信号进行组合,并随后根据第二逆变换方法将组合结果从频域逆变换到时域。第二逆变换方法是上述第二变换方法的逆操作,可以是IMDCT。第二域逆变换单元1446经由输出端子OUT输出逆变换的结果。
图15是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图。音频和/或语音信号解码设备包括解复用单元1500、频域解码单元1510、第二域逆变换单元1520和立体声解码单元1530。
解复用单元1500经由输入端子IN从编码端(未示出)接收比特流并对比特流解复用。从解复用单元1500输出的对比特流解复用的结果包括编码端在频域中编码的结果和用于将单信号上混频到立体声信号的参数。在频域中编码的结果包含重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,比特流的复用结果还可包括使用语音工具编码的结果。
频域解码单元1510在频域中对从解复用单元1500接收的由编码端编码的结果进行解码。更具体地,频域解码单元1510对从每个子带选择的重要谱分量和剩余谱分量的噪声等级进行解码。可如图12或图13所示构造频域解码单元1510。
第二域逆变换单元1520根据第二逆变换方法将由频域解码单元1510解码的结果从频域逆变换到时域。第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
立体声解码单元1530通过使用用于上混频的参数来将由第二域逆变换单元1520逆变换的单信号上混频到立体声信号。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。立体声解码单元1530经由输出端子OUT输出上混频的立体声信号。
图16是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图。音频和/或语音信号解码设备包括解复用单元1600、模式确定单元1610、频域解码单元1620、时域解码单元1630、域变换单元1640和立体声解码单元1650。
解复用单元1600经由输入端子IN从编码端(未示出)接收比特流并对比特流解复用。这里,从解复用单元1600输出的解复用结果包括关于对每个子带已经进行编码的域的信息、由编码端在频域中对预定子带编码的结果、编码端在时域中对预定子带编码的结果以及将单信号上混频到立体声信号的参数。
这里,在频域中编码的结果可包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
模式确定单元1610读取从解复用单元1600接收的关于对每个子带已经进行编码的域的信息,并随后确定每个子带已经在频域中还是在时域中被编码。
频域解码单元1620在频域中对由模式确定单元1610确定在频域中已经被编码的一个或更多子带进行解码。更具体地,频域解码单元1620对从每个子带选择的重要谱分量和剩余谱分量的噪声等级进行解码。可如图12或图13所示构造频域解码单元1620。
时域解码单元1630在时域中对由模式确定单元1610确定在时域中已经被编码的一个或更多子带进行解码。
可能的是,即使编码端确定特定子带在时域中被编码时,所述特定子带也可以在频域和时域两者中被编码。频域解码单元1620在频域中对特定子带的编码结果进行解码,时域解码单元1630在时域中对特定子带的编码结果进行解码。
域变换单元1640将时域解码单元1630的解码结果从时域变换到频域,并将频域解码单元1620解码的结果与从时域解码单元1630接收的信号变换到频域的结果组合,并随后将组合结果从频域变换到时域。
这里,域变换单元1640可被实施为执行接收以预定的带单元划分的多个信号以及在时域或频域中表示信号并随后将信号变换到时域的各种变换方法。这种变换方法的示例是FV-MLT。
域变换单元1640包括第二域变换单元1643和第二域逆变换单元1646。
第二域变换单元1643根据第二变换方法将由时域解码单元1630解码的信号从时域变换到频域。例如,第二变换方法可以是MDCT。
第二域逆变换单元1646将由频域解码单元1620解码的子带的信号与由第二域变换单元1643变换的子带的信号进行组合,并随后根据第二逆变换方法将组合结果从频域逆变换到时域。第二逆变换方法是上述第二变换方法的逆操作,可以是IMDCT。
立体声解码单元1650通过使用用于将单信号上混频到立体声信号的参数来将由第二域逆变换单元1646逆变换的单信号上混频到立体声信号。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。另外,立体声解码单元1650经由输出端子OUT输出上混频的立体声信号。
图17是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图。音频和/或语音信号解码设备包括解复用单元1700、频域解码单元1710、高频带解码单元1720、第二域逆变换单元1730和带混频器1740。
解复用单元1700经由输入端子IN从编码端(未示出)接收比特流并对比特流解复用。这里,从解复用单元1700输出的对比特流解复用的结果包括由编码端在频域中编码的结果和用于使用低频带信号对高频带信号进行解码的信息。在频域中编码的结果包含重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,对比特流解复用的结果还可包括使用语音工具编码的结果。
频域解码单元1710对从解复用单元1700接收的由编码端在频域中编码的结果进行解码。更具体地,频域解码单元1710对从每个子带选择的重要谱分量和剩余谱分量的噪声等级进行解码。可如图12或图13所示构造频域解码单元1710。
第二域逆变换单元1730根据第二逆变换方法将由频域解码单元1710解码的结果从频域逆变换到时域。第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
高频带解码单元1720从解复用单元1700接收用于使用低频带信号对高频带信号进行解码的信息,并随后使用低频带信号产生高频带信号。
带混频器1740将由第二域逆变换单元1730逆变换的低频带信号与由高频带解码单元1720产生的高频带信号进行混频。随后,带混频器1740经由输出端子OUT输出混频的结果。
图18是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图。音频和/或语音信号解码设备包括解复用单元1800、模式确定单元1810、频域解码单元1820、时域解码单元1830、域变换单元1840、高频带解码单元1850和带混频器1860。
解复用单元1800经由输入端子IN从编码端(未示出)接收比特流并对比特流解复用。这里,从解复用单元1800输出的对比特流解复用的结果包括关于对每个子带已经进行编码的域的信息、由编码端在频域中对预定子带编码的结果、编码端在时域中对预定子带编码的结果以及用于使用低频带信号对高频带信号进行解码的信息。
这里,在频域中编码的结果可包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
模式确定单元1810读取从解复用单元1800接收的关于对每个子带已经进行编码的域的信息,并随后确定每个子带已经在频域中还是在时域中被编码。
频域解码单元1820在频域中对由模式确定单元1810确定在频域中已经被编码的一个或更多子带进行解码。更具体地,频域解码单元1820对从每个子带选择的重要谱分量和剩余谱分量的噪声等级进行解码。可如图12或图13所示构造频域解码单元1820。
时域解码单元1830在时域中对由模式确定单元1810确定在时域中已经被编码的一个或更多子带进行解码。
可能的是,即使编码端确定特定子带在时域中被编码时,所述特定子带也可以在频域和时域两者中被编码。频域解码单元1820在频域中对特定子带的编码结果进行解码,时域解码单元1830在时域中对特定子带的编码结果进行解码。
域变换单元1840将时域解码单元1830解码的结果从时域变换到频域,并将频域解码单元1820解码的结果与从时域解码单元1830接收的信号变换到频域的结果组合,并随后将组合结果从频域变换到时域。
这里,域变换单元1840可被实施为执行接收以预定的带单元划分的多个信号以及在时域或频域中表示信号并随后将信号变换到时域的各种变换方法。这种变换方法的示例是FV-MLT。
域变换单元1840包括第二域变换单元1843和第二域逆变换单元1846。
第二域变换单元1843根据第二变换方法将由时域解码单元1830解码的信号从时域变换到频域。例如,第二变换方法可以是MDCT。
第二域逆变换单元1846将由频域解码单元1820解码的子带的信号与由第二域变换单元1843变换的子带的信号进行组合,并随后根据第二逆变换方法将组合结果从频域逆变换到时域。第二逆变换方法是上述第二变换方法的逆操作,可以是IMDCT。
高频带解码单元1850从解复用单元1800接收用于使用低频带信号对高频带信号进行解码的信息,并随后使用低频带信号产生高频带信号。
带混频器1860将由第二域逆变换单元1846逆变换的低频带信号与由高频带解码单元1850产生的高频带信号进行组合。随后,带混频器1860经由输出端子OUT输出组合的结果。
图19是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图。音频和/或语音信号解码设备包括解复用单元1900、频域解码单元1910、第二域逆变换单元1920、高频带解码单元1930、带混频器1940和立体声解码单元1950。
解复用单元1900经由输入端子IN从编码端(未示出)接收比特流并对比特流解复用。这里,从解复用单元1900输出的对比特流解复用的结果包括由编码端在频域中编码的结果、用于使用低频带信号对高频带信号进行解码的信息以及用于将单信号上混频到立体声信号的参数。在频域中编码的结果包含重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,对比特流解复用的结果还可包括使用语音工具编码的结果。
频域解码单元1910对从解复用单元1900接收的由编码端在频域中编码的结果进行解码。更具体地,频域解码单元1910对从每个子带选择的重要谱分量和剩余谱分量的噪声等级进行解码。可如图12或图13所示构造频域解码单元1910。
第二域逆变换单元1920根据第二逆变换方法将由频域解码单元1910解码的结果从频域逆变换到时域。第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
高频带解码单元1930从解复用单元1900接收用于使用低频带信号对高频带信号进行解码的信息,并随后使用低频带信号产生高频带信号。
带混频器1940将由第二域逆变换单元1920逆变换的低频带信号与由高频带解码单元1930产生的高频带信号进行混频。
立体声解码单元1950通过使用从解复用单元1900接收的用于将单信号上混频到立体声信号的参数来将从带混频器1940接收的单信号上混频到立体声信号。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。另外,立体声解码单元1950经由输出端子OUT输出上混频的立体声信号。
图20是示出根据本发明总体构思的另一实施例的音频和/或语音信号解码设备的框图。音频和/或语音信号解码设备包括解复用单元2000、模式确定单元2010、频域解码单元2020、时域解码单元2030、域变换单元2040、高频带解码单元2050、带混频器2060和立体声解码单元2070。
解复用单元2000经由输入端子IN从编码端(未示出)接收比特流并对比特流解复用。这里,从解复用单元2000输出的解复用的结果包括关于对每个子带已经进行编码的域的信息、由编码端在频域中对预定子带编码的结果、编码端在时域中对预定子带编码的结果以及用于使用低频带信号对高频带信号进行解码的信息。
这里,在频域中编码的结果可包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
模式确定单元2010读取从解复用单元2000接收的关于对每个子带已经进行编码的域的信息,并随后确定每个子带已经在频域中还是在时域中被编码。
频域解码单元2020在频域中对由模式确定单元2010确定在频域中已经被编码的一个或更多子带进行解码。更具体地,频域解码单元2020对从每个子带选择的重要谱分量和剩余谱分量的噪声等级进行解码。可如图12或图13所示构造频域解码单元2020。
时域解码单元2030在时域中对由模式确定单元2010确定在时域中已经被编码的一个或更多子带进行解码。
可能的是,即使编码端确定特定子带在时域中被编码时,所述特定子带也可以在频域和时域两者中被编码。频域解码单元2020在频域中对特定子带的编码结果进行解码,时域解码单元2030在时域中对特定子带的编码结果进行解码。
域变换单元2040将时域解码单元2030解码的结果从时域变换到频域,并将频域解码单元2020解码的结果与从时域解码单元2030接收的信号变换到频域的结果组合,并随后将组合结果从频域变换到时域。
这里,域变换单元2040可被实施为执行接收以预定的带单元划分的多个信号以及在时域或频域中表示信号并随后将信号变换到时域的各种变换方法。这种变换方法的示例是FV-MLT。
域变换单元2040包括第二域变换单元2043和第二域逆变换单元2046。
第二域变换单元2043根据第二变换方法将由时域解码单元2030解码的信号从时域变换到频域。例如,第二变换方法可以是MDCT。
第二域逆变换单元2046将由频域解码单元2020解码的子带的信号与由第二域变换单元2043变换的子带的信号进行组合,并随后根据第二逆变换方法将组合结果从频域逆变换到时域。第二逆变换方法是上述第二变换方法的逆操作,可以是IMDCT。
高频带解码单元2050从解复用单元2000接收用于使用低频带信号对高频带信号进行解码的信息,并随后使用低频带信号产生高频带信号。
带混频器2060将由第二域逆变换单元2046逆变换的低频带信号与由高频带解码单元2050产生的高频带信号进行混频。
立体声解码单元2070通过使用从解复用单元2000接收的用于将单信号上混频到立体声信号的参数来将从带混频器2060接收的单信号上混频到立体声信号。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。另外,立体声解码单元2070经由输出端子OUT输出上混频的立体声信号。
图21是示出根据本发明总体构思的实施例的音频和/或语音信号编码方法的流程图。首先,将输入信号从时域变换到频域,并随后划分为子带单元(操作2100)。在操作2100,根据第一变换方法将输入信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将输入信号从时域变换到频域,以将声学模型应用到输入信号。使用根据第一变换方法变换的信号对输入信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到输入信号。
例如,在操作2100,可根据作为第一变换方法的MDCT通过将输入信号变换到频域来使用实数表示输入信号,并根据作为第二变换方法的MDST通过将输入信号变换到频域来使用虚数表示输入信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对输入信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到输入信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。
接下来,从在操作2100中根据第一变换方法变换的信号的每个子带选择重要谱分量,量化选择的分量,提取除了重要谱分量的剩余谱分量,并随后计算并量化剩余谱分量的噪声等级(操作2110)。可如根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程或根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程所述执行操作2110。
下面描述根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程。
首先,将声学模型应用到输入信号以去除由人类听觉特征引起的感知冗余。这里,声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
在操作2200,通过应用使用人类听觉系统的声学模型来省略低敏感度特殊信息,并以频率单元分配指示感知强度的信号掩蔽比(SMR)。在操作2200,通过使用根据第二变换方法变换的信号来应用声学模型。第二变换方法的示例是MDST。
在操作2200之后,从在频域中表示的信号的每个子带选择重要谱分量(操作2205)。在这种情况下,可使用各种方法以选择重要谱分量。第一,计算信号的SMR,随后,如果SMR大于掩蔽值的倒数,则确定信号为重要谱分量。第二,通过在考虑预定权重的情况下提取谱峰术选择重要谱分量。第三,计算每个子带的信号噪声比(SNR),随后,从具有小SNR的子带中选择峰值等于或大于预定值的谱分量。可单独执行上述三种方法,或者可执行三种方法中的一种或至少两种的组合。
接下来,使用在操作2200分配的SMR来对在操作2205选择的重要谱分量进行量化(操作2210)。
在操作2210之后,从在频域中表示的信号提取除了在操作2205选择的重要谱分量之外的剩余谱分量,并随后计算并量化剩余谱分量的噪声等级(操作2220)。
下面描述根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程。
首先,通过将信号划分为短变换长度来对被确定为强攻击信号的信号进行精确编码(操作2300)。
在操作2300之后,将声学模型应用到输入信号以去除由人类听觉特征引起的感知冗余(操作2305)。
在操作2305,通过应用使用人类听觉系统的声学模型省略低敏感度特殊信息,并在改变SMR时以频率单元分配指示感知强度的SMR。在操作2305,通过使用根据第二变换方法变换的信号来应用声学模型。第二变换方法的示例是MDST。
在操作2305之后,从在频域中表示的信号的每个子带选择重要谱分量(操作2310)。在这种情况下,可使用各种方法以选择重要谱分量。第一,计算信号的SMR,随后,如果SMR大于掩蔽值的倒数,则确定信号为重要谱分量。第二,通过在考虑预定权重的情况下提取谱峰来选择重要谱分量。第三,计算每个子带的信号噪声比(SNR),随后,从具有小SNR的子带中选择峰值等于或大于预定值的谱分量。可单独执行上述三种方法,或者可执行三种方法中的一种或至少两种的组合。
随后,使用在操作2305中分配的SMR来对在操作2310中选择的重要谱分量进行量化。
在操作2320之后,从在频域中表示的信号提取除了在操作2310中选择的重要谱分量之外的剩余谱分量,并随后以子带单元计算并量化剩余谱分量的噪声等级(操作2330)。
这里,可通过执行线性预测分析来计算噪声等级。使用自相关方法执行线性预测分析,但也可使用协方差方法或Durbin方法执行线性预测分析。线性预测允许编码单元预测在当前帧中存在的噪声分量的量。如果存在较多噪声分量,则剩余谱分量被直接发送而不改变它们的噪声等级。如果存在较少的噪声分量并且存在较多的音调分量,则通过减小剩余谱分量的噪声等级来发送剩余谱分量。另外,在指示噪声快速改变的小窗口的情况下,通过另外减小剩余谱分量的噪声等级来发送剩余谱分量。
接下来,参照图21,在操作2110编码的结果被复用为比特流(操作2120)。在操作2110编码的结果包括:在操作2210对重要谱分量量化的结果和在操作2220对剩余谱分量量化的结果,或包括在操作2300编码的结果、在操作2320对重要谱分量量化的结果和在操作2330对剩余谱分量量化的结果。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号编码方法的流程。首先,将输入信号从时域变换到频域,并随后划分为子带单元(操作2400)。在操作2400,根据第一变换方法将输入信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将输入信号从时域变换到频域,以将声学模型应用到输入信号。使用根据第一变换方法变换的信号对输入信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到输入信号。
例如,在操作2400,可根据作为第一变换方法的MDCT通过将输入信号变换到频域来使用实数表示输入信号,并根据作为第二变换方法的MDST通过将输入信号变换到频域来使用虚数表示输入信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对输入信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到输入信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
接下来,确定在频域中对在操作2400变换到频域的信号的每个子带进行编码是否合适(操作2410)。换句话说,在操作2410,基于预定的基准确定在频域还是在时域中对变换到频域的信号的每个子带进行编码。另外,在操作2410,对指示在此确定的每个子带的域的标识符进行量化。
在操作2410,可使用在操作2400变换到频域的信号和与时域相应的输入信号中的一个或两者,以确定是否将在频域中对预定子带编码。
如果在操作2410确定将在频域中对预定子带编码,则在频域中对其进行编码(操作2420)。如根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程或根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程所述执行操作2420。
如果在操作2410确定将不在频域中对预定子带编码,则根据第一变换方法的逆变换方法将其从频域逆变换到时域(操作2430)。例如,第一变换方法的逆变换方法可以是IMDCT。
操作2400和操作2430可被实施为执行接收在时域中表示的信号以及在时域和频域两者中表示信号的各种变换方法。更具体地,各种变换方法是灵活的方法,在这些方法中,在时域中表示的信号被变换到频域,随后信号的时间分辨率在频带单元中被适当地控制,以表示频域中的信号的预定的一个或预定的几个子带。此外,使用虚数应用到声学模型的信号被产生。这种变换方法的示例是FV-MLT。
接下来,在时域中对在操作2430中以子带单元被逆变换到时域的信号进行编码(操作2440)。
可能的是,即使在操作2410确定特定子带不在频域中被编码时,所述特定子带的信号可以在频域和时域两者中被编码。因此,一个或更多预定的子带不仅在时域中被编码,还在频域中被编码。在这种情况下,指示预定的子带的信号已经在时域和频域两者中进行编码的标识符被量化。
在操作2420或操作2440之后,将指示对每个子带进行编码的域的标识符的量化结果、操作2440编码的结果以及在操作2420编码的结果复用为比特流(操作2450)。操作2420的编码结果包括:在操作2210对重要谱分量量化的结果和在操作2220对剩余谱分量量化的结果,或包括在操作2300编码的结果、在操作2320对重要谱分量量化的结果和在操作2330对剩余谱分量量化的结果。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号编码方法的流程。首先,如果输入信号是立体声信号,则分析输入信号以提取参数,并随后对输入信号下混频(操作2500)。在操作2500提取的参数指示解码单元将从编码单元接收的单信号上混频到立体声信号所需的信息。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。另外,在操作2500对提取的参数进行量化。
将在操作2500下混频的信号从时域变换到频域,并随后将信号划分为子带单元(操作2510)。在操作2510,根据第一变换方法将在操作2500下混频的信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将输入信号从时域变换到频域,以将声学模型应用到输入信号。使用根据第一变换方法变换的信号对输入信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到输入信号。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
例如,在操作2510,根据用作为第一变换方法的MDCT通过将输入信号变换到频域来使用实数表示输入信号,并根据用作为第二变换方法的MDST通过将输入信号变换到频域来使用虚数表示输入信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对输入信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到输入信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。
接下来,从操作2100中根据第一变换方法变换的信号的每个子带选择重要谱分量,并量化选择的分量,提取除了重要谱分量之外的剩余谱分量,并随后计算并量化剩余谱分量的噪声等级(操作2520)。可如根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程或根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程中所述来执行操作2520。
接下来,在操作2500提取的参数和在操作2520量化的结果被复用为比特流(操作2530)。在操作2520的编码结果包括:在操作2210对重要谱分量量化的结果和在操作2220对剩余谱分量量化的结果,或包括在操作2300编码的结果、在操作2320对重要谱分量量化的结果和在操作2330对剩余谱分量量化的结果。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号编码方法的流程。首先,如果输入信号是立体声信号,则分析输入信号以提取参数,并随后对输入信号下混频(操作2600)。在操作2600提取的参数指示解码单元将从编码单元接收的单信号上混频到立体声信号所需的信息。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。另外,在操作2600对提取的参数进行量化。
将在操作2600下混频的信号从时域变换到频域,并随后将信号划分为子带单元(操作2610)。在操作2610,根据第一变换方法将在操作2600下混频的信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将在操作2600下混频的信号从时域变换到频域,以将声学模型应用到输入信号。使用根据第一变换方法变换的信号对输入信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到输入信号。
例如,在操作2610,根据用作为第一变换方法的MDCT通过将输入信号变换到频域来使用实数表示输入信号,并根据用作为第二变换方法的MDST通过将输入信号变换到频域来使用虚数表示输入信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对输入信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到输入信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
接下来,确定在频域中对在操作2610变换到频域的信号的每个子带进行编码是否合适(操作2610)。换句话说,在操作2620,基于预定的基准确定在频域还是在时域中对变换到频域的信号的每个子带进行编码。另外,在操作2620,对指示在此确定的每个子带的域的标识符进行量化。
在操作2620,可使用在操作2610变换到频域的信号和在操作2600被下混频的与时域相应的输入信号中的一个或两者,以确定是否将在频域中对预定子带编码。
如果在操作2620确定将在频域中对每个子带编码,则在频域中对其进行编码(操作2630)。如根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程或根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程所述执行操作2630。
如果在操作2620确定将不在频域中对每个子带编码,则根据第一变换方法的逆变换方法将其从频域逆变换到时域(操作2640)。例如,第一变换方法的逆变换方法可以是IMDCT。
操作2610和操作2640可被实施为接收在时域中表示的信号以及在时域和频域两者中表示信号的各种变换方法。更具体地,各种变换方法是灵活的方法,在这些方法中,在时域中表示的信号被变换到频域,随后信号的时间分辨率在频带单元中被适当地控制,以表示频域中的信号的预定的一个或预定的几个子带。此外,使用虚数应用到声学模型的信号被产生。这种变换方法的示例是FV-MLT。
接下来,在时域中对在操作2640中以子带单元被逆变换到时域的信号进行编码(操作2640)。
可能的是,即使在操作2620确定特定子带不在频域中被编码,所述特定子带的信号也可以在频域和时域两者中被编码。因此,一个或更多预定的子带不仅在时域中被编码,还在频域中被编码。在这种情况下,指示预定的子带的信号已经在时域和频域两者中进行编码的标识符被量化。
在操作2630或操作2650之后,将指示已经对每个子带进行编码的域的标识符的量化结果、操作2600编码的结果、操作2630编码的结果以及操作2650编码的结果复用为比特流。操作2630编码的结果包括:在操作2210对重要谱分量量化的结果和在操作2220对剩余谱分量量化的结果,或包括在操作2300编码的结果、在操作2320对重要谱分量量化的结果和在操作2330对剩余谱分量量化的结果。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号编码方法的流程。首先,基于预定频率将输入信号划分为低频带信号和高频带信号(操作2700)。
随后,将在操作2700获得的低频带信号从时域变换到频域,并随后将其划分为子带单元(操作2710)。在操作2700,根据第一变换方法将低频带信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将低频带信号从时域变换到频域,以将声学模型应用到低频带信号。使用根据第一变换方法变换的信号对低频带信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到低频带信号。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
例如,在操作2710,可通过根据作为第一变换方法的MDCT将输入信号变换到频域来使用实数表示低频带信号,并通过根据作为第二变换方法的MDST将输入信号变换到频域来使用虚数表示低频带信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对低频带信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到低频带信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。
接下来,从操作2710中根据第一变换方法变换的信号的每个子带中选择重要谱分量,并量化选择的分量,提取除了重要谱分量之外的剩余谱分量,并随后计算并量化编码剩余谱分量的噪声等级(操作2720)。可如根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程或根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程中所述来执行操作2720。
使用低频带信号对在操作2700获得的高频带信号进行编码(操作2730)。
随后,将操作2720编码的结果、操作2730编码的结果以及用于使用低频带信号对高频带信号进行解码的信息复用为比特流(操作2740)。操作2720编码的结果包括:在操作2210对重要谱分量量化的结果和在操作2220对剩余谱分量量化的结果,或包括在操作2300编码的结果、在操作2320对重要谱分量量化的结果和在操作2330对剩余谱分量量化的结果。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号编码方法的流程。首先,基于预定频率将输入信号划分为低频带信号和高频带信号(操作2800)。
随后,将在操作2800获得的低频带信号从时域变换到频域,并随后将其划分为子带单元(操作2810)。在操作2810,根据第一变换方法将低频带信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将低频带信号从时域变换到频域,以将声学模型应用到低频带信号。使用根据第一变换方法变换的信号对低频带信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到低频带信号。
例如,在操作2810,可通过根据作为第一变换方法的MDCT将输入信号变换到频域来使用实数表示低频带信号,并通过根据作为第二变换方法的MDST将输入信号变换到频域来使用虚数表示低频带信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对低频带信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到低频带信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
接下来,确定在频域中对在操作2810变换到频域的信号的每个子带进行编码是否合适(操作2820)。换句话说,在操作2820,基于预定的基准确定在频域还是在时域中对变换到频域的信号的每个子带进行编码。另外,在操作2820,对指示在此确定的每个子带的域的标识符进行量化。
在操作2820,可使用在操作2810变换到频域的信号和与时域相应的低频带信号中的一个或两者,以确定是否将在频域中对预定子带编码。
如果在操作2820确定将在频域中对每个子带编码,则在频域中对其进行编码(操作2830)。如根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程或根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程所述执行操作2830。
如果在操作2820确定将不在频域中对每个子带编码,则根据第一变换方法的逆变换方法将其从频域逆变换到时域(操作2840)。例如,第一变换方法的逆变换方法可以是IMDCT。
操作2810和操作2840可被实施为接收在时域中表示的信号以及在时域和频域两者中表示信号的各种变换方法。更具体地,各种变换方法是灵活的方法,在这些方法中,在时域中表示的信号被变换到频域,随后信号的时间分辨率在频带单元中被适当地控制,以表示频域中的信号的预定的一个或预定的几个子带。此外,使用虚数应用到声学模型的信号被产生。这种变换方法的示例是FV-MLT。
接下来,在时域中对在操作2840中以子带单元被逆变换到时域的信号进行编码(操作2850)。
可能的是,即使在操作2820确定特定子带不在频域中被编码时,所述特定子带的信号也可以在频域和时域两者中被编码。因此,一个或更多预定的子带不仅在时域中被编码,还在频域中被编码。在这种情况下,指示预定的子带的信号已经在时域和频域两者中进行编码的标识符被量化。
使用低频带信号对在操作2800获得的高频带信号进行编码(操作2860)。
在操作2830或操作2850之后,将指示对每个子带进行编码的域的标识符的量化结果、操作2830编码的结果、操作2850编码的结果以及用于使用低频带信号对高频带信号进行解码的信息复用为比特流(操作2870)。操作2830编码的结果包括:在操作2210对重要谱分量量化的结果和在操作2220对剩余谱分量量化的结果,或包括在操作2300编码的结果、在操作2320对重要谱分量量化的结果和在操作2330对剩余谱分量量化的结果。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号编码方法的流程。首先,如果输入信号是立体声信号,则分析输入信号以提取参数,并随后对输入信号下混频(操作2900)。在操作2900提取的参数指示解码单元将从编码单元接收的单信号上混频到立体声信号所需的信息。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。另外,在操作2900对提取的参数进行量化。
随后,基于预定频率将在操作2900下混频的信号划分为低频带信号和高频带信号(操作2910)。
随后,将在操作2910获得的低频带信号从时域变换到频域,并随后将其划分为子带单元(操作2920)。在操作2920,根据第一变换方法将低频带信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将低频带信号从时域变换到频域,以将声学模型应用到低频带信号。使用根据第一变换方法变换的信号对低频带信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到低频带信号。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
例如,在操作2920,可通过根据作为第一变换方法的MDCT将输入信号变换到频域来使用实数表示低频带信号,并通过根据作为第二变换方法的MDST将输入信号变换到频域来使用虚数表示低频带信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对低频带信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到低频带信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。
接下来,从操作2920中变换到频域的信号的每个子带中选择重要谱分量,并量化选择的分量,提取除了重要谱分量之外的剩余谱分量,并随后计算并量化剩余谱分量的噪声等级(操作2930)。可如根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程或根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程中所述来执行操作2930。
接下来,使用低频带信号对在操作2910获得的高频带信号进行编码(操作2940)。
接下来,将操作2900中参数量化的结果、操作2930编码的结果以及操作2940编码的结果复用为比特流。这里,操作2930编码的结果包括:在操作2210对重要谱分量量化的结果和在操作2220对剩余谱分量量化的结果,或包括在操作2300编码的结果、在操作2320对重要谱分量量化的结果和在操作2330对剩余谱分量量化的结果。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号编码方法的流程。首先,如果输入信号是立体声信号,则分析输入信号以提取参数,并随后对输入信号下混频(操作3000)。在操作3000提取的参数指示解码单元将从编码单元接收的单信号上混频到立体声信号所需的信息。参数的示例包括两个信道的能量等级之间的差或两个信道之间的相关性或相干性。另外,在操作3000对提取的参数进行量化。
接下来,基于预定频率将在操作3000下混频的信号划分为低频带信号和高频带信号(操作3010)。
随后,将在操作3010获得的低频带信号从时域变换到频域,并随后将其划分为子带单元(操作3020)。在操作3020,根据第一变换方法将低频带信号从时域变换到频域,并根据不同于第一变换方法的第二变换方法将低频带信号从时域变换到频域,以将声学模型应用到低频带信号。使用根据第一变换方法变换的信号对低频带信号进行编码,使用根据第二变换方法变换的信号以将声学模型应用到低频带信号。
例如,在操作3020,可通过根据作为第一变换方法的MDCT将输入信号变换到频域来使用实数表示低频带信号,并通过根据作为第二变换方法的MDST将输入信号变换到频域来使用虚数表示低频带信号。这里,作为使用MDCT的结果的使用实数表示的信号用于对低频带信号进行编码,作为使用MDST的结果的使用虚数表示的信号用于将声学模型应用到低频带信号。因此,由于还可表示输入信号的相位信息,故对与时域相应的信号执行DFT,并随后对MDCT系数进行量化,从而避免发生失配。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
接下来,确定在频域中对在操作3020变换到频域的信号的每个子带进行编码是否合适(操作3030)。换句话说,在操作3030,基于预定的基准确定在频域还是在时域中对变换到频域的信号的每个子带进行编码。另外,在操作3030,对指示在此确定的每个子带的域的标识符进行量化。
在操作3030,可使用在操作3020变换到频域的信号和在操作3020变换的与时域相应的低频带信号中的一个或两者,以确定是否将在频域中对预定子带编码。
如果在操作3020确定将在频域中对每个子带编码,则在频域中对其进行编码(操作3040)。如根据本发明总体构思的实施例的图21中示出的编码方法的操作2110的流程或根据本发明总体构思的另一实施例的图21中示出的音频和/或语音信号编码方法的操作2110的流程所述执行操作3040。
如果在操作3020确定将不在频域中对每个子带编码,则根据第一变换方法的逆变换方法将其从频域逆变换到时域(操作3050)。例如,第一变换方法的逆变换方法可以是IMDCT。
操作3020和操作3050可被实施为接收在时域中表示的信号以及在时域和频域两者中表示信号的各种变换方法。更具体地,各种变换方法是灵活的方法,在这些方法中,在时域中表示的信号被变换到频域,随后信号的时间分辨率在频带单元中被适当地控制,以表示频域中的信号的预定的一个或预定的几个子带。此外,使用虚数应用到声学模型的信号被产生。这种变换方法的示例是FV-MLT。
接下来,在时域中对在操作3050中以子带单元被逆变换到时域的信号进行编码(操作3060)。
可能的是,即使在操作3050确定特定子带不在频域中被编码时,所述特定子带的信号也可以在频域和时域两者中被编码。因此,一个或更多预定的子带不仅在时域中被编码,还在频域中被编码。在这种情况下,指示预定的子带的信号已经在时域和频域两者中进行编码的标识符被量化。
使用低频带信号对在操作3010获得的高频带信号进行编码(操作3070)。
随后,将操作3000中量化的参数、指示对每个子带进行编码的域的标识符的量化结果、操作3040编码的结果、操作3060编码的结果以及用于使用低频带信号对高频带信号进行解码的信息复用为比特流(操作3080)。操作3080编码的结果包括:在操作2210对重要谱分量量化的结果和在操作2220对剩余谱分量量化的结果,或包括在操作2300编码的结果、在操作2320对重要谱分量量化的结果和在操作2330对剩余谱分量量化的结果。
下面描述根据本发明总体构思的实施例的音频和/或语音信号解码方法的流程。首先,从编码端接收比特流并随后对所述比特流解复用(操作3100)。操作3100中的解复用结果包括由编码端对在频域中编码的重要谱分量量化的结果;对剩余谱分量的噪声等级量化的结果等。此外,解复用结果还可包括使用语音工具编码的结果。
接下来,在频域中对操作3100中被解复用的在频域中的编码结果进行解码(操作3110)。更具体地,在操作3110,对从每个子带选择的重要谱分量以及除了重要谱分量之外的剩余谱分量的噪声等级进行解码。可如根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程或根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程所述执行操作3110。
下面描述根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程。
首先,通过应用声学模型对使用分配的不同数量的比特被分别进行编码的重要谱分量的解复用结果进行反量化(操作3200),其中,声学模型去除由人类听觉特征引起的感知冗余。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
接下来,对在操作3200中反量化的除了重要谱分量之外的剩余谱分量的噪声等级的解复用结果进行解码(操作3210)。另外,在操作3210,将解码的噪声等级与在操作3200中解码的重要谱分量进行组合。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程。
首先,通过应用声学模型对使用分配的不同数量的比特被分别进行编码的重要谱分量的解复用结果进行反量化(操作3300),其中,声学模型去除由人类听觉特征引起的感知冗余。声学模型表示关于人类听觉系统的掩蔽反应的数学模型。
接下来,对在操作3300中反量化的除了重要谱分量之外的剩余谱分量的噪声等级的解复用结果进行解码(操作3310)。另外,在操作3310,将解码的噪声等级与在操作3200中解码的重要谱分量进行组合。
在操作3310之后,编码单元通过使用语音工具编码的结果的解复用结果被解码(操作3320)。另外,在操作3320,在操作3320的解码结果与在操作3310的混频结果进行组合。
接下来,根据第二逆变换方法将操作3110解码的结果从频域逆变换到时域(操作3120)。这里,第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。例如,在操作3120,通过使用IMDCT将操作3200中混频的结果从频域逆变换到时域,通过使用IMDCT将操作3320中混频的结果从频域逆变换到时域。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的流程。首先,从编码端接收比特流并随后对所述比特流解复用(操作3400)。操作3400中的解复用结果包括关于对每个子带已经进行编码的域的信息、由编码端在频域中对预定子带编码的结果以及编码端在时域中对预定子带编码的结果。
这里,编码终端在频域中编码的结果包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
接下来,读取关于对在操作3400解复用的每个子带已经进行编码的域的信息,以确定每个子带已经在频域中还是在时域中被编码(操作3410)。
如果在操作3410确定已经在频域中对一个或多个子带编码,则在频域中对子带进行解码(操作3420)。更具体地,在操作3420,从每个子带选择的重要谱分量被解码,除了重要谱分量之外的剩余谱分量的噪声等级被解码。可如根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程或根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程所述执行操作3420。
如果在操作3410确定已经在时域中对一个或多个子带编码,则在时域中对子带进行编码(操作3430)。
在预定的一个或预定的几个子带的情况下,即使确定特定子带在时域中被编码,所述特定子带也可以在频域和时域两者中被编码。在这种情况下,不仅在时域中的特定子带的编码结果被解码,而且在频域中的特定子带的编码结果被解码。
接下来,根据第二变换方法将操作3430解码的结果从时域变换到频域(操作3440)。第二变换方法的示例是MDCT。
接下来,将在操作3420解码的子带的信号与在操作3440变换的结果的信号进行组合,并随后根据第二逆变换方法将组合结果从频域逆变换到时域(操作3450)。第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
操作3440和操作3450可被实施为接收以预定的带单元划分并在时域或频域中表示的信号并随后将信号变换到时域的各种变换方法。这种变换方法的示例是FV-MLT。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的流程。首先,从编码端接收比特流并随后对所述比特流解复用(操作3500)。操作3500中解复用的结果包括编码端在频域中的编码结果以及用于将单信号上混频到立体声信号的参数。这里,编码端在频域中编码的结果包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
接下来,在频域中对在操作3500解复用的在频域中的编码结果进行解码。更具体地,在操作3510,从子带选择的重要谱分量和除了重要谱分量之外的剩余谱分量的噪声等级被解码。可如根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程或根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程所述执行操作3510。
接下来,根据第二逆变换方法将操作3510解码的结果从频域逆变换到时域(操作3520)。这里,第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
通过使用用于将单信号上混频到立体声信号的参数来将作为操作3520的逆变换结果的单信号上混频到立体声信号(操作3530)。参数的示例是两个信道的能量等级之间的差或两个信道之间的相关性或相干性。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的流程。首先,从编码端接收比特流并随后对所述比特流解复用(操作3600)。操作3600中解复用的结果包括关于对每个子带已经进行编码的域的信息、编码端在频域中对预定子带编码的结果以及编码端在时域中对预定子带编码的结果。
这里,编码端在频域中编码的结果包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
接下来,读取关于对在操作3400解复用的每个子带已经进行编码的域的信息,以确定每个子带已经在频域中还是在时域中被编码(操作3610)。
如果在操作3610确定已经在频域中对一个或多个子带编码,则在频域中对子带进行编码(操作3620)。更具体地,在操作3620,从每个子带选择的重要谱分量被解码,除了重要谱分量之外的剩余谱分量的噪声等级被解码。可如根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程或根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程所述执行操作3620。
如果在操作3610确定已经在时域中对一个或多个子带编码,则在时域中对子带进行解码(操作3630)。
在预定的一个或预定的几个子带的情况下,即使确定特定子带在时域中被编码,所述特定子带也可以已经在频域和时域两者中被编码。在这种情况下,不仅在时域中的特定子带的编码结果被解码,而且在频域中的特定子带的编码结果被解码。
接下来,根据第二变换方法将操作3630解码的结果从时域变换到频域(操作3640)。第二变换方法的示例是MDCT。
接下来,将在操作3620解码的子带的信号与在操作3640变换的结果的信号进行组合,并随后根据第二逆变换方法将组合结果从频域逆变换到时域(操作3650)。第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
操作3640和操作3650可被实施为接收以预定的带单元划分并在时域或频域中表示的信号并随后将信号变换到时域的各种变换方法。这种变换方法的示例是FV-MLT。
以下,通过使用用于将单信号上混频到立体声信号的参数来将作为操作3650的逆变换结果的单信号上混频到立体声信号(操作3660)。参数的示例是两个信道的能量等级之间的差或两个信道之间的相关性或相干性。
下面描述示出根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的流程。首先,从编码端接收比特流并随后对所述比特流解复用(操作3700)。操作3700中解复用的结果包括编码端在频域中编码的结果以及用于通过使用低频带信号对高频带信号进行解码的信息。这里,编码端在频域中编码的结果包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
接下来,在频域中对在操作3700解复用的在频域中编码的结果进行解码(操作3710)。更具体地,在操作3710,从子带选择的重要谱分量和除了重要谱分量之外的剩余谱分量的噪声等级被解码。可如根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程或根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程所述执行操作3710。
接下来,根据第二逆变换方法将操作3710解码的结果从频域逆变换到时域(操作3520)。这里,第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
随后,基于用于通过使用低频带信号对高频带信号进行解码的信息来使用作为操作3720逆变换的结果的低频带信号对高频带信号进行解码(操作3730)。
以下,将在操作3720中逆变换的低频带信号与在操作3730中解码的高频带信号进行混频(操作3740)。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的流程。首先,从编码端接收比特流并随后对所述比特流解复用(操作3800)。操作3800中解复用的结果包括关于对每个子带已经进行编码的域的信息、编码端在频域中对预定子带编码的结果以及编码端在时域中对预定子带编码的结果。
这里,编码端在频域中编码的结果包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
接下来,读取关于对在操作3800解复用的每个子带已经进行编码的域的信息,以确定每个子带已经在频域中还是在时域中被编码(操作3810)。
如果在操作3810确定已经在频域中对一个或多个子带编码,则在频域中对子带进行解码(操作3820)。更具体地,在操作3820,从每个子带选择的重要谱分量被解码,除了重要谱分量之外的剩余谱分量的噪声等级被解码。可如根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程或根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程所述执行操作3820。
如果在操作3810确定已经在时域中对一个或多个子带编码,则在时域中对子带进行解码(操作3830)。
在预定的一个或预定的几个子带的情况下,即使确定特定子带在时域中被编码时,所述特定子带可以已经在频域和时域两者中被编码。在这种情况下,不仅在时域中的特定子带的编码结果被解码,而且在频域中的特定子带的编码结果被解码。
接下来,根据第二变换方法将操作3830解码的结果从时域变换到频域(操作3840)。第二变换方法的示例是MDCT。
接下来,将在操作3820解码的子带的信号与在操作3840变换的结果的信号进行组合,并随后根据第二逆变换方法将组合结果从频域逆变换到时域(操作3850)。第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
操作3840和操作3850可被实施为接收以预定的带单元划分并在时域或频域中表示的信号并随后将信号变换到时域的各种变换方法。这种变换方法的示例是FV-MLT。
随后,基于用于通过使用低频带信号对高频带信号进行解码的信息来使用在操作3800解复用的低频带信号对高频带信号进行解码(操作3860)。
以下,将在操作3850中逆变换的低频带信号与在操作3860中解码的高频带信号进行组合(操作3870)。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的流程。首先,从编码端接收比特流并随后对所述比特流解复用(操作3900)。操作3900中解复用的结果包括编码端在频域中编码的结果、用于通过使用低频带信号对高频带信号进行解码的信息以及用于将单信号上混频到立体声信号的参数。这里,编码端在频域中编码的结果包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
接下来,在频域中对在操作3900解复用的结果进行解码(操作3910)。更具体地,在操作3910,从子带选择的重要谱分量和除了重要谱分量之外的剩余谱分量的噪声等级被解码。可如根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程或根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程所述执行操作3910。
接下来,根据第二逆变换方法将操作3910解码的结果从频域逆变换到时域(操作3520)。这里,第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
随后,基于用于通过使用低频带信号对高频带信号进行解码的信息来使用在操作3900解复用的低频带信号对高频带信号进行解码(操作3930)。
以下,将在操作3920中逆变换的低频带信号与在操作3930中解码的高频带信号进行混频(操作3940)。
接下来,通过使用用于将单信号上混频到立体声信号的参数来将作为操作3940的混频结果的单信号上混频到立体声信号(操作3950)。参数的示例是两个信道的能量等级之间的差或两个信道之间的相关性或相干性。
下面描述根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的流程。首先,从编码端接收比特流并随后对所述比特流解复用(操作4000)。操作4000中解复用的结果包括关于对每个子带已经进行编码的域的信息、编码端在频域中对预定子带编码的结果以及编码端在时域中对预定子带编码的结果。
这里,编码端在频域中编码的结果包括重要谱分量的量化结果和剩余谱分量的噪声等级的量化结果。此外,在频域中编码的结果可包括使用语音工具编码的结果。
接下来,读取关于对在操作4000解复用的每个子带已经进行编码的域的信息,以确定每个子带已经在频域中还是在时域中被编码(操作4010)。
如果在操作4010确定已经在频域中对一个或多个子带编码,则在频域中对子带进行解码(操作4020)。更具体地,在操作4020,从每个子带选择的重要谱分量被解码,除了重要谱分量之外的剩余谱分量的噪声等级被解码。可如根据本发明总体构思的实施例的音频和/或语音信号解码方法的操作3110的流程或根据本发明总体构思的另一实施例的音频和/或语音信号解码方法的操作3110的流程所述执行操作4020。
如果在操作4010确定已经在时域中对一个或多个子带编码,则在时域中对子带进行解码(操作4030)。
在预定的一个或预定的几个子带的情况下,即使确定特定子带在时域中被编码,所述特定子带也可以已经在频域和时域两者中被编码。在这种情况下,不仅在时域中的特定子带的编码结果被解码,而且在频域中的特定子带的编码结果被解码。
接下来,根据第二变换方法将操作4030解码的结果从时域变换到频域(操作4040)。第二变换方法的示例是MDCT。
接下来,将在操作4020解码的子带的信号与在操作4040变换的结果的信号进行组合,并随后根据第二逆变换方法将组合结果从频域逆变换到时域(操作4050)。第二逆变换方法是上述第二变换方法的逆操作。第二逆变换方法的示例是IMDCT。
操作4040和操作4050可被实施为接收以预定的带单元划分并在时域或频域中表示的信号并随后将信号变换到时域的各种变换方法。这种变换方法的示例是FV-MLT。
随后,基于用于通过使用低频带信号对高频带信号进行解码的信息来使用作为在操作4000解复用的结果的低频带信号对高频带信号进行解码(操作4060)。
接下来,将在操作4050中逆变换的低频带信号与在操作4060中解码的高频带信号进行混频(操作4070)。
以下,通过使用用于将单信号上混频到立体声信号的参数来将作为操作4070的逆变换结果的单信号上混频到立体声信号(操作4080)。参数的示例是两个信道的能量等级之间的差或两个信道之间的相关性或相干性。
本发明总体构思可被实施为计算机可读介质中的计算机可读代码,其中,计算机包括具有信息处理功能的设备。计算机可读介质可以是能够存储作为能够被计算机系统读取的程序的数据的任何记录设备,诸如,只读存储器(ROM)、随机访问存储器(RAM)、光盘(CD)ROM、磁带、软盘、光学数据存储装置等。另外,计算机可读介质可以是通过例如互联网发送数据的载波。
根据本发明总体构思的音频和/或语音信号编码和解码方法和设备能够对语音信号、音频信号以及语音信号和音频信号的混频信号进行有效编码或解码。另外,可使用少量比特来执行编码和解码,从而提高声音质量。可使用单编解码器来执行上述音频和/或语音信号编码和解码方法和设备的编码和/或解码操作。
虽然已经具体示出和描述了本发明总体构思的一些实施例,但是本领域的普通技术人员应该理解,在不脱离本发明总体构思的原理和精神的情况下,可以对这些实施例进行改变,在权利要求及其等同物中限定本发明总体构思的范围。
Claims (6)
1.一种对信号进行解码的方法,包括:
确定域,在所述域中预定的单元的信号的每一个已经被编码;
分别对预定的域中的预定的单元的信号进行解码;
使用预定的域中的解码的低频带信号来产生高频带信号;以及
通过使用用于将单信号上混频为立体声信号的参数来将包括预定的域中的解码的低频带信号和产生的高频带信号的单信号上混频为立体声信号。
2.如权利要求1所述的方法,其中,对确定的域中的信号进行解码的步骤包括使用频变调制重叠变换FV-MLT。
3.如权利要求1所述的方法,其中,确定预定的单元的信号的每一个已经被编码的域的步骤包括确定已经在时域中被编码的一个或更多单元的一个或更多信号中的预定的一个或预定的几个信号也已经在频域中被编码。
4.如权利要求1所述的方法,其中,分别对预定的域中的信号进行解码的步骤包括:
对被确定为已经在频域中编码的一个或更多单元的一个或更多谱分量进行解码;以及
对解码的谱分量之外的残余谱分量进行解码。
5.一种对信号进行解码的设备,包括:
解复用单元,确定域,在所述域中预定的单元的信号的每一个已经被编码;
解码单元,分别对确定的域中的预定的单元的信号进行解码;
高频带解码单元,使用预定的域中的解码的低频带信号对高频带信号进行解码;以及
带混频器,通过使用用于将单信号上混频为立体声信号的参数来将包括预定的域中的解码的低频带信号和产生的高频带信号的单信号上混频为立体声信号。
6.一种对信号进行编码和/或解码的设备,包括:
编码器,将输入信号变换到至少一个域并使用预定的单元中的输入信号或变换的信号确定将被编码的域,并且对分配到确定的域中的单元的信号进行编码;和
解码器,确定编码信号被分配的确定的域分别对确定的域中的信号进行解码,通过将解码的信号组合来恢复输入信号,其中,所述解码器包括:
解复用单元,确定域,在所述域中预定的单元的信号的每一个已经被编码;
解码单元,分别对确定的域中的预定的单元的信号进行解码;
高频带解码单元,使用预定的域中的解码的低频带信号对高频带信号进行解码;以及
带混频器,通过使用用于将单信号上混频为立体声信号的参数来将包括预定的域中的解码的低频带信号和产生的高频带信号的单信号上混频为立体声信号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310099796.6A CN103219010B (zh) | 2006-11-17 | 2007-11-16 | 对音频和/或语音信号进行编码和/或解码的方法和设备 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060114102 | 2006-11-17 | ||
KR1020060114102A KR101434198B1 (ko) | 2006-11-17 | 2006-11-17 | 신호 복호화 방법 |
KR10-2006-0114102 | 2006-11-17 | ||
PCT/KR2007/005764 WO2008060114A1 (en) | 2006-11-17 | 2007-11-16 | Method and apparatus to encode and/or decode audio and/or speech signal |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310099796.6A Division CN103219010B (zh) | 2006-11-17 | 2007-11-16 | 对音频和/或语音信号进行编码和/或解码的方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101583994A CN101583994A (zh) | 2009-11-18 |
CN101583994B true CN101583994B (zh) | 2013-05-01 |
Family
ID=39401877
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310099796.6A Active CN103219010B (zh) | 2006-11-17 | 2007-11-16 | 对音频和/或语音信号进行编码和/或解码的方法和设备 |
CN2007800501018A Active CN101583994B (zh) | 2006-11-17 | 2007-11-16 | 对音频和/或语音信号进行编码和/或解码的方法和设备 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310099796.6A Active CN103219010B (zh) | 2006-11-17 | 2007-11-16 | 对音频和/或语音信号进行编码和/或解码的方法和设备 |
Country Status (6)
Country | Link |
---|---|
US (2) | US20080120095A1 (zh) |
EP (1) | EP2089878A4 (zh) |
JP (3) | JP5357040B2 (zh) |
KR (1) | KR101434198B1 (zh) |
CN (2) | CN103219010B (zh) |
WO (1) | WO2008060114A1 (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
CA2672165C (en) * | 2006-12-12 | 2014-07-29 | Ralf Geiger | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
KR101261524B1 (ko) * | 2007-03-14 | 2013-05-06 | 삼성전자주식회사 | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 |
KR101452722B1 (ko) * | 2008-02-19 | 2014-10-23 | 삼성전자주식회사 | 신호 부호화 및 복호화 방법 및 장치 |
AU2009267518B2 (en) * | 2008-07-11 | 2012-08-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
KR101428487B1 (ko) * | 2008-07-11 | 2014-08-08 | 삼성전자주식회사 | 멀티 채널 부호화 및 복호화 방법 및 장치 |
ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
PL3002750T3 (pl) * | 2008-07-11 | 2018-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder i dekoder audio do kodowania i dekodowania próbek audio |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
ES2558229T3 (es) * | 2008-07-11 | 2016-02-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas |
KR101756834B1 (ko) * | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
KR101261677B1 (ko) | 2008-07-14 | 2013-05-06 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
US20110087494A1 (en) * | 2009-10-09 | 2011-04-14 | Samsung Electronics Co., Ltd. | Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme |
EP2362387A1 (en) * | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Watermark generator, watermark decoder, method for providing a watermark signal in dependence on binary message data, method for providing binary message data in dependence on a watermarked signal and computer program using a differential encoding |
BR122019026166B1 (pt) * | 2010-04-09 | 2021-01-05 | Dolby International Ab | sistema decodificador, aparelho e método para emitir um sinal de áudio estereofônico tendo um canal esquerdo e um canal direito e meio legível por computador não transitório |
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
KR101697550B1 (ko) * | 2010-09-16 | 2017-02-02 | 삼성전자주식회사 | 멀티채널 오디오 대역폭 확장 장치 및 방법 |
US8948138B2 (en) * | 2011-03-23 | 2015-02-03 | Telefonaktiebolaget L M Ericsson (Publ) | Signal compression for backhaul communications using linear transformations |
CN103220058A (zh) * | 2012-01-20 | 2013-07-24 | 旭扬半导体股份有限公司 | 音频数据与视觉数据同步装置及其方法 |
CN107516531B (zh) | 2012-12-13 | 2020-10-13 | 弗朗霍弗应用研究促进协会 | 语音声响编码装置和解码装置、语音声响编码和解码方法 |
CN103971692A (zh) * | 2013-01-28 | 2014-08-06 | 北京三星通信技术研究有限公司 | 音频处理方法、装置及系统 |
US9978381B2 (en) * | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
Family Cites Families (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3465341B2 (ja) * | 1994-04-28 | 2003-11-10 | ソニー株式会社 | オーディオ信号符号化方法 |
JP3158932B2 (ja) * | 1995-01-27 | 2001-04-23 | 日本ビクター株式会社 | 信号符号化装置及び信号復号化装置 |
JPH09127985A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
US6233550B1 (en) * | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
KR100935961B1 (ko) * | 2001-11-14 | 2010-01-08 | 파나소닉 주식회사 | 부호화 장치 및 복호화 장치 |
JP4308229B2 (ja) * | 2001-11-14 | 2009-08-05 | パナソニック株式会社 | 符号化装置および復号化装置 |
DE60323331D1 (de) * | 2002-01-30 | 2008-10-16 | Matsushita Electric Ind Co Ltd | Verfahren und vorrichtung zur audio-kodierung und -dekodierung |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
WO2003085643A1 (en) * | 2002-04-10 | 2003-10-16 | Koninklijke Philips Electronics N.V. | Coding of stereo signals |
JP4399185B2 (ja) * | 2002-04-11 | 2010-01-13 | パナソニック株式会社 | 符号化装置および復号化装置 |
CN1308913C (zh) * | 2002-04-11 | 2007-04-04 | 松下电器产业株式会社 | 编码设备、解码设备及其方法 |
US7191136B2 (en) * | 2002-10-01 | 2007-03-13 | Ibiquity Digital Corporation | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
EP2665294A2 (en) * | 2003-03-04 | 2013-11-20 | Core Wireless Licensing S.a.r.l. | Support of a multichannel audio extension |
AU2003208517A1 (en) * | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
JP2004302259A (ja) * | 2003-03-31 | 2004-10-28 | Matsushita Electric Ind Co Ltd | 音響信号の階層符号化方法および階層復号化方法 |
ATE359687T1 (de) * | 2003-04-17 | 2007-05-15 | Koninkl Philips Electronics Nv | Audiosignalgenerierung |
DE602004029786D1 (de) * | 2003-06-30 | 2010-12-09 | Koninkl Philips Electronics Nv | Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch |
KR100940531B1 (ko) * | 2003-07-16 | 2010-02-10 | 삼성전자주식회사 | 광대역 음성 신호 압축 및 복원 장치와 그 방법 |
JP2005057591A (ja) * | 2003-08-06 | 2005-03-03 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置及びオーディオ信号復号化装置 |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
JP4966013B2 (ja) * | 2003-10-30 | 2012-07-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
ATE447226T1 (de) * | 2004-01-28 | 2009-11-15 | Koninkl Philips Electronics Nv | Verfahren und vorrichtung zur zeitskalierung eines signals |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
US7639823B2 (en) * | 2004-03-03 | 2009-12-29 | Agere Systems Inc. | Audio mixing using magnitude equalization |
CA2555182C (en) * | 2004-03-12 | 2011-01-04 | Nokia Corporation | Synthesizing a mono audio signal based on an encoded multichannel audio signal |
US7739120B2 (en) * | 2004-05-17 | 2010-06-15 | Nokia Corporation | Selection of coding models for encoding an audio signal |
US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
WO2006000842A1 (en) * | 2004-05-28 | 2006-01-05 | Nokia Corporation | Multichannel audio extension |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
US8150042B2 (en) * | 2004-07-14 | 2012-04-03 | Koninklijke Philips Electronics N.V. | Method, device, encoder apparatus, decoder apparatus and audio system |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
KR100707173B1 (ko) * | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
JP2006243042A (ja) * | 2005-02-28 | 2006-09-14 | Sanyo Electric Co Ltd | 高域補間装置及び再生装置 |
KR100818268B1 (ko) * | 2005-04-14 | 2008-04-02 | 삼성전자주식회사 | 오디오 데이터 부호화 및 복호화 장치와 방법 |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
CN101297356B (zh) * | 2005-11-04 | 2011-11-09 | 诺基亚公司 | 用于音频压缩的方法和设备 |
US8081762B2 (en) * | 2006-01-09 | 2011-12-20 | Nokia Corporation | Controlling the decoding of binaural audio signals |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
KR20070115637A (ko) * | 2006-06-03 | 2007-12-06 | 삼성전자주식회사 | 대역폭 확장 부호화 및 복호화 방법 및 장치 |
KR101390188B1 (ko) * | 2006-06-21 | 2014-04-30 | 삼성전자주식회사 | 적응적 고주파수영역 부호화 및 복호화 방법 및 장치 |
WO2007148925A1 (en) * | 2006-06-21 | 2007-12-27 | Samsung Electronics Co., Ltd. | Method and apparatus for adaptively encoding and decoding high frequency band |
KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
KR101565919B1 (ko) * | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
CA2716817C (en) * | 2008-03-03 | 2014-04-22 | Lg Electronics Inc. | Method and apparatus for processing audio signal |
-
2006
- 2006-11-17 KR KR1020060114102A patent/KR101434198B1/ko active IP Right Grant
-
2007
- 2007-11-16 EP EP07834070A patent/EP2089878A4/en not_active Withdrawn
- 2007-11-16 US US11/941,249 patent/US20080120095A1/en not_active Abandoned
- 2007-11-16 JP JP2009537084A patent/JP5357040B2/ja active Active
- 2007-11-16 WO PCT/KR2007/005764 patent/WO2008060114A1/en active Application Filing
- 2007-11-16 CN CN201310099796.6A patent/CN103219010B/zh active Active
- 2007-11-16 CN CN2007800501018A patent/CN101583994B/zh active Active
-
2013
- 2013-08-29 JP JP2013178117A patent/JP6050199B2/ja active Active
-
2015
- 2015-06-03 JP JP2015113480A patent/JP6170520B2/ja active Active
-
2016
- 2016-10-14 US US15/294,112 patent/US20170032800A1/en not_active Abandoned
Non-Patent Citations (3)
Title |
---|
Frank Baumgarte and Christof Faller.Binaural Cue Coding—Part I: Psychoacoustic Fundamentals and Design Principles.《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》.2003,509-519. * |
Martin Dietz et al.Spectral Band Replication, a novel approach in audio coding.《Audio Engineering Society Convention Paper 5553,Presented at the 112th Convention 》.2002,1-8. * |
MartinDietzetal.SpectralBandReplication a novel approach in audio coding.《Audio Engineering Society Convention Paper 5553,Presented at the 112th Convention 》.2002 |
Also Published As
Publication number | Publication date |
---|---|
KR20080044707A (ko) | 2008-05-21 |
CN101583994A (zh) | 2009-11-18 |
JP6050199B2 (ja) | 2016-12-21 |
JP2014016628A (ja) | 2014-01-30 |
KR101434198B1 (ko) | 2014-08-26 |
JP2010510540A (ja) | 2010-04-02 |
JP6170520B2 (ja) | 2017-07-26 |
US20080120095A1 (en) | 2008-05-22 |
US20170032800A1 (en) | 2017-02-02 |
CN103219010B (zh) | 2017-05-31 |
EP2089878A4 (en) | 2011-01-19 |
WO2008060114A1 (en) | 2008-05-22 |
CN103219010A (zh) | 2013-07-24 |
JP5357040B2 (ja) | 2013-12-04 |
EP2089878A1 (en) | 2009-08-19 |
JP2015172779A (ja) | 2015-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101583994B (zh) | 对音频和/或语音信号进行编码和/或解码的方法和设备 | |
KR101238239B1 (ko) | 인코더 | |
KR100958144B1 (ko) | 오디오 압축 | |
CN101223577B (zh) | 对低比特率音频信号进行编码/解码的方法和设备 | |
CN1878001B (zh) | 对音频数据编码及解码的设备及方法 | |
CN105679327B (zh) | 用于对音频信号进行编码和解码的方法及设备 | |
KR101428487B1 (ko) | 멀티 채널 부호화 및 복호화 방법 및 장치 | |
KR101411901B1 (ko) | 오디오 신호의 부호화/복호화 방법 및 장치 | |
CN102708873A (zh) | 用于带宽扩展编码和解码的方法、设备和介质 | |
KR20100093504A (ko) | 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 | |
EP2814028A1 (en) | Audio and speech coding device, audio and speech decoding device, method for coding audio and speech, and method for decoding audio and speech | |
JP5629319B2 (ja) | スペクトル係数コーディングの量子化パラメータを効率的に符号化する装置及び方法 | |
CN101874266B (zh) | 用于处理信号的方法和装置 | |
US9830919B2 (en) | Acoustic signal coding apparatus, acoustic signal decoding apparatus, terminal apparatus, base station apparatus, acoustic signal coding method, and acoustic signal decoding method | |
KR102052144B1 (ko) | 음성 신호의 대역 선택적 양자화 방법 및 장치 | |
KR100911994B1 (ko) | Hht를 이용한 음성 및 오디오 신호의 부호화/복호화장치 및 방법 | |
WO2009022193A2 (en) | Devices, methods and computer program products for audio signal coding and decoding | |
US20100280830A1 (en) | Decoder | |
Motlíček et al. | Perceptually motivated sub-band decomposition for FDLP audio coding | |
KR20130012972A (ko) | 오디오/스피치 신호 부호화방법 | |
KR20090043352A (ko) | 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템 | |
KR20120089230A (ko) | 신호 복호화 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |