CN1310431C - 用于编码音频信号的设备和方法 - Google Patents
用于编码音频信号的设备和方法 Download PDFInfo
- Publication number
- CN1310431C CN1310431C CNB011338172A CN01133817A CN1310431C CN 1310431 C CN1310431 C CN 1310431C CN B011338172 A CNB011338172 A CN B011338172A CN 01133817 A CN01133817 A CN 01133817A CN 1310431 C CN1310431 C CN 1310431C
- Authority
- CN
- China
- Prior art keywords
- scale factor
- factor band
- signal
- maximum scale
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 47
- 238000004590 computer program Methods 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims abstract description 463
- 238000005070 sampling Methods 0.000 claims abstract description 43
- 238000004458 analytical method Methods 0.000 claims description 93
- 238000001228 spectrum Methods 0.000 claims description 71
- 230000001052 transient effect Effects 0.000 claims description 31
- 230000006641 stabilisation Effects 0.000 claims description 28
- 238000011105 stabilization Methods 0.000 claims description 28
- 230000003247 decreasing effect Effects 0.000 claims description 19
- 230000000694 effects Effects 0.000 claims description 14
- 230000008676 import Effects 0.000 claims description 6
- 230000009466 transformation Effects 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 17
- 238000011002 quantification Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 11
- 239000000523 sample Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 4
- 238000005096 rolling process Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
这里公开了一种音频信号编码设备,包括:初始最大标度因子频带计算部件,用于基于所述帧长度确定部件产生的结果和从编码模式信号部件输入的编码模式信息,参考存储在所述最大标度因子频带表存储部件中的初始最大标度因子频带信息和信号-屏蔽比阈值信息,为所述输入的音频信号计算初始最大标度因子频带;以及最大标度因子频带计算部件,用于基于由所述初始最大标度因子频带计算部件计算出的初始最大标度因子频带,按照由所述心理声学模型分析部件计算出的信号-屏蔽比信息,为所述音频信号计算最大标度因子频带,可以按照诸如比特率和取样频率这样的编码模式信息,自适应地计算音频信号的最大标度因子频带。
Description
技术领域
本发明涉及一种用于编码音频信号的设备和方法,更具体地说,涉及一种借助于按照运动图像专家组(Moving Picture Experts Group,MPEG)音频标准的时频变换、编码音频信号的设备和方法。
背景技术
迄今为止,已经提出了很多种类的音频信号编码方法,诸如用于按照与要压缩的音频信号相关的统计特性编码音频信号的熵编码法,以及按照人类的知觉(perceptual)特性编码音频信号的知觉编码法。MPEG音频标准积极采用例如执行压缩以去除由于屏蔽效应或低于最小可听阈值而人类的耳朵听不见的音频信号分量的知觉编码法。
这样一个编码方法包括步骤:(1)输入由多种音频信号分量组成的音频信号,以及(2)按照取样频率或帧长度(长度长的帧还是长度短的帧)给每种音频信号分量分配一预定值。例如,符合MPEG-2先进音频编码(AdvancedAudio Coding)的音频信号编码方法还包括步骤:按照图18所示的标度因子频带表给每种音频信号分量分配一预定值。图18所示的标度因子频带表包括多个要被指派给各个频率的最大标度因子频带,即关于短长度帧和长长度帧的该音频信号的各种音频信号分量。
常规的音频信号设备之一图示在图19中,它包括:输入部件a3、FFT分析部件300、心理声学模型分析部件330、帧长度确定部件310、编码模式信息输入部件320、最大标度因子频带计算部件340、最大标度因子频带表存储部件350、频谱处理部件360以及量化与编码部件370。在附图中,“maxSfb”用于指“标度因子频带”,“smr”用于指“信号-屏蔽比(Signal-to-Mask ratio)”。
输入部件a3起在其中输入音频信号的作用。FFT分析部件300起对从输入部件a3输入的音频信号执行快速富里叶变换、以生成关于该音频信号的频率信息的作用。帧长度确定部件310起判断从输入部件a3输入的音频信号是瞬态信号还是稳定信号的作用。这意味着帧长度确定部件310起在该音频信号被判断为瞬态信号时为该音频信号确定一短长度帧而在该音频信号被判断为稳定信号时为该音频信号确定一长长度帧的作用。
编码模式信息输入部件320起输入编码模式信息的作用。心理声学模型分析部件330按照预定心理声学模型,基于关于FFT分析部件300所生成的音频信号的频率信息、为该音频信号计算信号-屏蔽比信息。最大标度因子频带表存储部件350起存储初始最大标度因子频带信息的作用。该初始最大标度因子频带信息包括各自固定地一一对应地对应于诸如比特率和取样频率和帧长度之类的编码模式信息的多个预定的最大标度因子频带。
最大标度因子频带计算部件340基于由帧长度确定部件310产生的结果、和从编码模式信息输入部件320输入的编码模式信息,参考存储在最大标度因子频带表存储部件350中的初始最大标度因子频带信息为该音频信号计算最大标度因子频带。
频谱处理部件360基于由心理声学模型分析部件330计算出的信号-屏蔽比信息,起将从输入部件a3输入的音频信号划分成每个都对应于一标度因子频带的多个音频信号分量的作用,以及对直到对应于由最大标度因子频带计算部件340计算的最大标度因子频带的音频信号分量的各音频信号分量执行频谱处理,以生成音频信号数据。由频谱处理部件360执行的频谱处理包括改进的离散余弦变换(以下称为“MDCT”)处理以及瞬时噪声成形(以下称为“TNS”)处理。量化与编码部件370起量化和编码由频谱处理部件360生成的音频信号数据的作用,以生成要通过这里输出的编码音频信号。
在上述常规音频信号编码设备中,最大标度因子频带计算部件340通过基于关于该音频信号的帧长度和编码模式信息,从存储在最大标度因子频带表存储部件350中的固定地预定的最大标度因子频带中间选择关于该音频信号的最大标度因子频带,来计算最大标度因子频带。该初始最大标度因子频带信息包括各自固定地一一对应地对应于诸如比特率和取样频率和帧长度之类的编码模式信息、而另一方面在这里输入的音频信号互异的多个预定的最大标度因子频带。这意味着最大标度因子频带计算部件340基于诸如帧长度之类的编码模式信息以及不考虑该音频信号特性的编码模式信息,例如,该音频信号偏离任何频率范围与否,来计算最大标度因子频带。接着,频谱处理部件360和量化与编码部件370不管该音频信号偏离任何频率范围与否,都对直到对应于这样计算出的最大标度因子频带的音频信号分量的音频信号分量执行频谱处理,和量化和编码。
像从前述事实所了解的那样,这种类型的常规音频信号编码设备和传统编码方法遇到这样的缺陷,以至于该常规音频信号编码设备和传统编码方法可能在该音频信号偏离到例如低频范围时,执行不必要的对特别包括不可能由人耳听见的音频信号的该音频信号的所有音频信号分量的频谱处理,并量化和编码,从而使得难以有效率地执行对该音频信号的频谱处理,以及量化和编码该音频信号和增强该音频信号的质量。
本发明从一个角度克服了上述常规音频信号编码设备所固有的缺陷。
发明内容
因此,本发明的一个目的是提供一种音频信号编码设备和方法,用于将音频信号划分成各自对应于标度因子频带的多个音频信号分量、按照预定的心理声学模型计算关于该音频信号的最大标度因子频带和对直到对应于最大标度因子频带的一音频信号分量的各音频信号分量执行频谱处理,量化和编码。
本发明的另一个目的是提供一种音频信号编码设备和方法,它能够自适应地按照该音频信号的特性计算该音频信号的最大标度因子频带。
按照本发明的第一方面,提供一种音频信号编码设备,用于将音频信号划分成各自对应于要按照预定的心理声学模型编码的标度因子频带的多个音频信号分量,它包括:输入部件,用于在其中输入音频信号;帧长度确定部件,用于判断从输入部件输入的该音频信号是瞬态信号还是稳定信号,并在该音频信号被判断为瞬态信号时为该音频信号确定一短长度帧而在该音频信号被判断为稳定信号时为该音频信号确定一长长度帧;FFT分析部件,用于对从输入部件输入的音频信号执行快速富里叶变换、以生成关于该音频信号的频率信息;编码模式信息输入部件,用于输入编码模式信息;心理声学模型分析部件,用于按照预定心理声学模型,基于关于FFT分析部件所生成的音频信号的频率信息,为该音频信号计算信号-屏蔽比信息;最大标度因子频带表存储部件,用于存储初始最大标度因子频带信息和信号-屏蔽比阈值信息;初始最大标度因子频带计算部件,用于基于帧长度确定部件产生的结果和从编码模式信息部件输入的编码模式信息,参考存储在最大标度因子频带表存储部件中的初始最大标度因子频带信息和信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带;最大标度因子频带计算部件,用于基于由初始最大标度因子频带计算部件计算出的初始最大标度因子频带,按照由心理声学模型分析部件计算出的信号-屏蔽比信息,为该音频信号计算最大标度因子频带;频谱处理部件,用于基于由心理声学模型分析部件计算出的信号-屏蔽比信息,将从输入部件输入的音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,以及对直到对应于由该最大标度因子频带计算部件计算出的最大标度因子频带的一音频信号分量的各音频信号分量执行频谱处理以产生音频信号数据;以及量化与编码部件,用于量化和编码由频谱处理部件生成的该音频信号数据,以生成要通过其输出的编码音频信号,借此,最大标度因子频带计算部件响应在其中输入的音频信号自适应地计算最大标度因子频带。
在上述音频信号编码设备中,编码模式信息可以包括比特率信息和取样频率信息。最大标度因子频带表存储部件可以存储具有涉及比特率信息和取样信息的多个标度因子频带的初始最大标度因子频带信息,以及存储具有涉及比特率信息和取样信息的多个信号-屏蔽比阈值的信号-屏蔽比阈值信息。初始最大标度因子频带计算部件可以基于由帧长度确定部件产生的结果和从编码模式信息输入部件输入的包括比特率信息和取样频率信息的编码模式信息、参考存储在最大标度因子频带表存储部件中的初始最大标度因子频带信息和信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带。最大标度因子频带计算部件可以基于由心理声学模型分析部件计算出的信号-屏蔽比信息和初始最大标度因子频带计算部件计算出的初始最大标度因子频带、为该音频信号计算最大标度因子频带。
在上述音频编码设备中,所述编码模式信息还可以包括信道数。最大标度因子频带表存储部件可以存储具有涉及信道数目的多个标度因子频带的初始最大标度因子频带信息,以及存储具有涉及信道数目的多个信号-屏蔽比阈值的信号-屏蔽比阈值信息。初始最大标度因子频带计算部件可以基于由帧长度确定部件产生的结果、和包括从编码模式信息部件输入的信道数目的编码模式信息,参考存储在最大标度因子频带表存储部件中的初始最大标度因子频带信息和信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带。最大标度因子频带计算部件可以基于由心理声学模型分析部件计算出的信号-屏蔽比信息和初始最大标度因子频带计算部件计算出的初始最大标度因子频带、为该音频信号计算最大标度因子频带。
在上述音频信号编码设备中,信号-屏蔽比阈值信息可以包括示出多个信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表。最大标度因子频带表存储部件可以存储初始最大标度因子频带信息以及信号-屏蔽比阈值信息。初始最大标度因子频带计算部件可以基于由帧长度确定部件产生的结果、和从编码模式信息输入部件输入的编码模式信息,参考存储在最大标度因子频带表存储部件中的初始最大标度因子频带信息和信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带和信号屏蔽比阈值。最大标度因子频带计算部件可以基于由初始最大标度因子频带计算部件计算出的初始最大标度因子频带和信号-屏蔽比阈值,按照包含在由心理声学模型分析部件计算出的信号-屏蔽比信息中的、示出多个信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,通过下列步骤为该音频信号计算最大标度因子频带:(1)按照所述信号-屏蔽比表,确定对应于最大标度因子频带的信号-屏蔽比,其中所述最大标度因子频带的初始值就是由所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带;(2)判断在步骤(1)所确定的信号-屏蔽比是否大于信号-屏蔽比阈值;(2-1)如果在步骤(2)判断出信号-屏蔽比不大于信号-屏蔽比阈值,则将该最大标度因子频带递减一,并返回步骤(1);(3)重复步骤(1)至步骤(2-1),直到在步骤(2)判断出信号-屏蔽比大于信号-屏蔽比阈值;(4)如果在步骤(2)判断出所确定的信号-屏蔽比大于信号-屏蔽比阈值,则将该最大标度因子频带递增一;(5)将在步骤(4)递增一的这种最大标度因子频带输出到频谱处理部件。
按照本发明的第二方面,提供了一种用于将音频信号划分成各自对应于要按照预定的心理声学模型进行编码的标度因子频带的多个音频信号分量的音频信号编码方法,包括步骤:(A)在其中输入所述音频信号;(B)判断在所述步骤(A)输入的所述音频信号是瞬态信号还是稳定信号,并且当判断出所述音频信号是瞬态信号时确定所述音频信号的一短长度帧,而在判断出所述音频信号是稳定信号时确定所述音频信号的一长长度帧;(C)对在所述步骤(A)输入的所述音频信号执行快速富里叶分析、以生成关于所述音频信号的频率信息;(D)输入编码模式信息;(E)基于在所述步骤(C)生成的关于所述音频信号的所述频率信息,按照所述预定的心理声学模型,为所述音频信号计算信号-屏蔽比;(F)存储最大标度因子频带信息和信号-屏蔽比阈值信息;(G)基于在所述步骤(B)产生的结果和在所述步骤(D)中输入的所述编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为所述音频信号计算初始最大标度因子频带;(H)基于在所述步骤(G)中计算的所述初始最大标度因子频带,按照在所述步骤(E)计算出的所述信号-屏蔽比信息,为所述音频信号计算最大标度因子频带;(I)基于在所述步骤(E)计算出的信号-屏蔽比信息,将在所述步骤(A)中输入的所述音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,以及对直到对应于在所述步骤(H)计算出的所述最大标度因子频带的音频信号分量的所述音频信号分量执行频谱处理以产生音频信号数据;以及(J)量化和编码在所述步骤(I)中生成的所述音频信号数据,以生成要输出的编码音频信号。
在上述音频编码方法中,所述编码模式信息可包括比特率信息和取样频率信息,所述步骤(F)可以具有存储最大标度因子频带信息和信号-屏蔽比阈值信息的步骤,所述最大标度因子频带信息具有和比特率信息以及取样信息相关的多个标度因子频带,所述信号-屏蔽比阈值信息具有和比特率信息以及取样信息相关的多个信号-屏蔽比阈值;所述步骤(G)可以具有基于在所述步骤(B)产生的结果和在所述步骤(D)中输入的包括所述比特率信息和所述取样信息的编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为所述音频信号计算初始最大标度因子频带的步骤;并且所述步骤(H)具有可以基于在所述步骤(G)中计算的所述初始最大标度因子频带,以及所述步骤(E)计算出的所述信号-屏蔽比信息,为所述音频信号计算最大标度因子频带的步骤;
在上述音频编码方法中,所述编码模式信息还可包括信道数,所述步骤(F)可以具有存储最大标度因子频带信息和信号-屏蔽比阈值信息的步骤,所述最大标度因子频带信息具有和信道数相关的多个标度因子频带的步骤,所述信号-屏蔽比阈值信息具有和信道数相关的多个信号-屏蔽比阈值;所述步骤(G)可以具有基于在所述步骤(B)产生的结果和在所述步骤(D)中输入的包括所述信道数的编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为所述音频信号计算初始最大标度因子频带的步骤;并且所述步骤(H)可以具有基于在所述步骤(G)中计算的所述初始最大标度因子频带,以及在所述步骤(E)计算出的所述信号-屏蔽比信息,为所述音频信号计算最大标度因子频带的步骤;
在上述音频编码方法中,所述信号-屏蔽比阈值信息可包括示出多个信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,所述步骤(F)可以具有存储最大标度因子频带信息和信号-屏蔽比阈值信息的步骤;所述步骤(G)可以具有基于在所述步骤(B)产生的结果和在所述步骤(D)中输入的所述编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为所述音频信号计算初始最大标度因子频带和信号-屏蔽比阈值的步骤;并且所述步骤(H)可以具有步骤:根据在所述步骤(E)中计算的所述信号-屏蔽比信息中包括的示出在所述信号-屏蔽比和标度因子频带的关系的所述信号-屏蔽比表,并通过下列步骤基于在所述步骤(G)中计算的所述初始最大标度因子频带和所述信号-屏蔽比阈值,为所述音频信号计算最大标度因子频带的步骤:(H-1)按照信号-屏蔽比表确定对应于最大标度因子频带的一信号-屏蔽比,其中所述最大标度因子频带的初始值就是在步骤(G)计算出的所述初始最大标度因子频带;(H-2)判断在步骤(H-1)所确定的所述信号-屏蔽比是否大于所述信号-屏蔽比阈值;(H-2-1):如果在步骤(H-2)判断出所确定的所述信号-屏蔽比不大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递减一,并返回步骤(H-1);(H-3)重复步骤(H-1)至步骤(H-2-1),直到在步骤(H-2)判断出所确定的所述信号-屏蔽比大于所述信号-屏蔽比阈值;(H-4)如果在步骤(H-2)判断出所确定的所述信号-屏蔽比大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递增一;以及在步骤(H-5)将在步骤(H-4)递增一的这种所述最大标度因子频带输出到所述步骤(I)。
在上音频编码方法中,所述步骤(F)可以含有步骤:存储初始最大标度因子频带信息以及能量阈值信息,所述步骤(G)含有步骤:基于所述步骤(B)产生的结果,和在所述步骤(D)输入的所述编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息和能量阈值信息,为所述音频信号计算初始最大标度因子频带,以及(H)含有步骤:基于在所述步骤(C)中生成的所述频率信息计算示出多个能量值与标度因子频带之间的关系的能量值表,并通过下列步骤基于在所述步骤(G)中计算出的所述初始最大标度因子频带和所述能量阈值,参考示出能量值与标度因子频带之间的关系的所述能量值表,为所述音频信号计算最大标度因子频带:(H-1)按照所述能量表确定对应于最大标度因子频带的能量值,其中,所述最大标度因子频带的所述初始值是所述步骤(G)计算出的所述初始最大标度因子频带;(H-2)判断在所述步骤(H-1)所确定的所述能量值是否大于所述能量阈值;(H-2-1)如果在所述步骤(H-2)判断出所述能量值不大于所述能量阈值,则将所述最大标度因子频带递减一,并返回所述步骤(H-1);(H-3)重复所述步骤(H-1)至所述步骤(H-2-1),直到在所述步骤(H-2)判断出所述能量值大于所述能量阈值;(H-4)如果在所述步骤(H-2)判断出所述能量值大于所述能量阈值,则将所述最大标度因子频带递增一;和(H-5)将在所述步骤(H-4)递增一的这种所述最大标度因子频带输出到所述步骤(I)。
在上述音频编码方法中,所述信号-屏蔽比阈值信息可以包括示出多个信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,所述步骤(F)可以含有步骤:存储初始最大标度因子频带信息、信号-屏蔽比阈值信息和最小标度因子频带信息,所述步骤(G)含有步骤:基于所述步骤(B)产生的结果和在所述步骤(D)输入的所述编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息、所述信号-屏蔽比阈值信息和所述最小标度因子频带信息,为所述音频信号计算初始最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,以及所述步骤(H)含有步骤:基于在所述步骤(G)计算出的所述初始最大标度因子频带、所述信号-屏蔽比阈值和所述最小标度因子频带,按照包括在所述步骤(E)中计算的所述信号-屏蔽比信息中的表示信号屏蔽比和标度因子频带之间关系的所述信号-屏蔽比表,为所述音频信号计算最大标度因子频带,所述步骤为:(H-1)按照所述信号-屏蔽比表,确定对应于最大标度因子频带的信号-屏蔽比,其中,所述最大标度因子频带的所述初始值是在所述步骤(G)中计算出的所述初始最大标度因子频带;(H-2)判断在所述步骤(H-1)中确定的所述信号-屏蔽比是否大于所述信号-屏蔽比阈值;(H-2-1)如果在所述步骤(H-2)判断出所述信号-屏蔽比不大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递减一;(H-3)重复所述步骤(H-1)至所述步骤(H-2-1),直到在所述步骤(H-2)判断出所述信号-屏蔽比大于所述信号-屏蔽比阈值;(H-4)如果在所述步骤(H-2)判断出所述信号-屏蔽比大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递增一;(H-5)判断在所述步骤(H-4)递增一的这种所述最大标度因子频带是否小于所述最小标度因子频带;(H-6)如果在所述步骤(H-5)判断出所述最大标度因子频带小于所述最小标度因子频带,则将所述最小标度因子频带递增一,用这种递增了一的所述最小标度因子频带替代所述最大标度因子频带,并将这样替代过的所述最大标度因子频带输出到所述步骤(I);和(H-7)如果在所述步骤(H-5)判断出所述最大标度因子频带不小于所述最小标度因子频带,则将所述最大标度因子频带输出到所述步骤(I)。
根据本发明的第四实施例,提供了一种音频信号编码设备,用于将音频信号划分成各自对应于要按照预定的心理声学模型编码的标度因子频带的多个音频信号分量,它包括:计算机可用存储介质,其具有其中包括的计算机可读代码;和音频信号编码单元;所述音频信号编码单元包括:输入部件,用于在其中输入音频信号;帧长度确定部件,用于判断从所述输入部件输入的该音频信号是瞬态信号还是稳定信号,并在该音频信号被判断为瞬态信号时确定该音频信号的短长度帧而在该音频信号被判断为稳定信号时确定该音频信号的长长度帧;FFT分析部件,用于对从所述输入部件输入的所述音频信号执行快速富里叶变换、以生成关于该音频信号的频率信息;编码模式信息输入部件,用于输入编码模式信息;心理声学模型分析部件,用于按照所述预定心理声学模型,基于关于由所述FFT分析部件所生成的所述音频信号的所述频率信息,为该音频信号计算信号-屏蔽比信息;最大标度因子频带表存储部件,用于存储初始最大标度因子频带信息和信号-屏蔽比阈值信息;初始最大标度因子频带计算部件,用于基于所述帧长度确定部件产生的结果和从所述编码模式信息部件输入的所述编码模式信息,参考存储在所述最大标度因子频带表存储部件中的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带;最大标度因子频带计算部件,用于基于由所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带,按照由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息,为该音频信号计算最大标度因子频带;频谱处理部件,用于基于由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息,将从所述输入部件输入的所述音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,以及对直到对应于由该最大标度因子频带计算部件计算出的所述最大标度因子频带的一音频信号分量的所述各音频信号分量执行频谱处理以产生音频信号数据;以及量化与编码部件,用于量化和编码由所述频谱处理部件生成的该音频信号数据,以生成要通过其输出的编码音频信号,借此,所述最大标度因子频带计算部件响应在其中输入的所述音频信号自适应地计算所述最大标度因子频带,和所述计算机代码可由所述音频编码单元执行,以把音频信号划分成各自对应于要进行编码的标度因子频带的多个音频信号分量。
附图说明
从以下借助附图的下列描述,将会更清楚地理解根据本发明的、用于编码音频信号的设备和方法的特征和优点,在这些附图中:
图1是根据本发明的音频信号编码设备的第一实施例的示意图;
图2是解释存储在组成图1中所示的音频信号编码设备的一部分的最大标度因子频带表存储部件中的初始最大标度因子频带信息和信号-屏蔽比阈值信息的示意图;
图3是解释由图1中所示的音频信号编码设备所执行的最大标度因子频带计算过程的特性曲线图;
图4A和4B是解释由图2中所示的初始最大标度因子频带的表;
图5A和5B是解释由图2中所示的初始最大标度因子频带的表;
图6A和6B是解释由图2中所示的信号-屏蔽比阈值的表;
图7A和7B是解释由图2中所示的信号-屏蔽比阈值的表;
图8图示由图1中所示的音频信号编码设备所执行的音频信号编码方法的流程图;
图9是根据本发明的音频信号编码设备的第二实施例的示意图;
图10是解释由图9中所示的音频信号编码设备所执行的最大标度因子频带计算过程的模式图;
图11A和11B是解释存储在组成图9中所示的音频信号编码设备的一部分的最大标度因子频带表存储部件中的能量阈值信息的表;
图12A和12B是解释存储在组成图9中所示的音频信号编码设备的一部分的最大标度因子频带表存储部件中的能量阈值信息的表;
图13图示由图9中所示的音频信号编码设备所执行的音频信号编码方法的流程图;
图14是根据本发明的音频信号编码设备的第三实施例的示意图;
图15是解释由图14中所示的音频信号编码设备所执行的最大标度因子频带计算过程的模式图;
图16是解释存储在组成图14中所示的音频信号编码设备的一部分的最大标度因子频带表存储部件中的初始最大标度因子频带信息,信号-屏蔽比阈值信息和最小标度因子频带信息示意图;
图17图示由图14中所示的音频信号编码设备所执行的音频信号编码方法的流程图;
图18是包括被分配给用于常规音频信号编码过程中的各频率的多个最大标度因子频带表的标度因子频带表;以及
图19是常规音频信号编码设备的示意图。
具体实施方式
下列说明针对根据本发明的音频信号编码设备的多个实施例。
参考附图,特别是参考图1至图8,图示了根据本发明的音频信号编码设备的第一个优选实施例。该音频信号编码设备的第一个实施例图示在图1中,它包括:输入部件a1、FFT分析部件100、帧长度确定部件110、编码模式信息输入部件120、心理声学模型分析部件130、初始最大标度因子频带计算部件140、最大标度因子频带计算部件150、频谱处理部件160、量化与编码部件170以及最大标度因子频带表存储部件180。
输入部件a1适合于在其中输入音频信号。FFT分析部件100适合于对从输入部件a1输入的音频信号执行快速富里叶变换(以下称为“FFT分析”)、以生成关于该音频信号的频率信息。帧长度确定部件110用来确定适合该音频信号的帧长度。这意味着帧长度确定部件110适于判断从输入部件a1输入的音频信号是瞬态信号还是稳定信号,并且在该音频信号被判断为瞬态信号时确定该音频信号的短长度帧,而在该音频信号被判断为稳定信号时确定该音频信号的长长度帧。
编码模式信息输入部件120用于由操作员输入编码模式信息。这意味着编码模式信息输入部件120适合于输入诸如该音频信号的取样频率和比特率这样的编码模式信息。
心理声学模型分析部件130适于输入由FFT分析部件100所生成的音频信号的频率信息,并适合于按照熟知的预定心理声学模型,基于这样输入的频率信息,为该音频信号计算信号-屏蔽比信息(后面将要介绍)。最大标度因子频带表存储部件180适合于存储在图2中所示的初始最大标度因子频带信息410和信号-屏蔽比阈值信息420。在附图中,“smr”指的是“信号-屏蔽比”。
初始最大标度因子频带计算部件140适合于基于由帧长度确定部件110产生的结果和从编码模式信息输入部件120输入的编码模式信息,参考存储在最大标度因子频带表存储部件180中的初始最大标度因子频带信息410和信号-屏蔽比阈值信息420,计算该音频信号的最大标度因子频带。
最大标度因子频带计算部件150适合于基于由初始最大标度因子频带计算部件140计算的初始最大标度因子频带、按照心理声学模型分析部件130计算出的信号-屏蔽比信息,计算关于该音频信号的最大标度因子频带。
频谱处理部件160适合于基于由心理声学模型分析部件130计算出的信号-屏蔽比信息,将从输入部件a1输入的音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,以及适合于对直到对应于由最大标度因子频带计算部件150计算的最大标度因子频带的一音频信号分量的所有音频信号分量执行诸如MDCT和TNS这样的频谱处理,以生成音频信号数据。
量化与编码部件170适合于量化和编码由频谱处理部件160生成的音频信号数据,以生成要通过这里输出的编码音频信号。
如从前述说明中了解的那样,构造音频信号编码设备的第一实施例的最大标度因子频带计算部件150,适合于自适应地按照这里输入的特性即该音频信号的信号-屏蔽比信息,计算关于该音频信号的最大标度因子频带。
根据本发明,音频信号编码设备的第一实施例的所有功能都可以由个人计算机执行,该计算机包括中央处理器(以下称为“CPU”)、诸如声卡之类的声音装置以及诸如软盘、CD-ROM、DVD-ROM、硬盘之类的、可以让用于执行该音频信号编码设备的第一实施例的上述组成件的所有功能的计算机可读程序代码包含在其中计算机可读介质。
此外,该音频信号编码设备的第一实施例可以用在需要编码高质量声音信号或以复杂编码模式编码的音乐发行服务中。
以下将解释该音频信号编码设备的第一实施例的运行。
操作输入部件a1以在其中输入音频信号。操作帧长度确定部件110来判断从输入部件a1输入的音频信号是瞬态信号还是稳定信号,并且在该音频信号被判断为瞬态信号时为该音频信号确定一短长度帧,而在该音频信号被判断为稳定信号时为该音频信号确定一长长度帧。
运行FFT分析部件100来对从输入部件a1输入的音频信号执行FFT分析、以生成关于该音频信号的频率信息。运行心理声学模型分析部件130来输入关于FFT分析部件100所生成的音频信号的频率信息,以及按照熟知的预定心理声学模型,基于所输入的频率信息,计算音频信号的信号-屏蔽比信息。信号-屏蔽比信息包括示出用于确定各个标度因子频带的信号-屏蔽比的标度因子频带和多个信号屏蔽比之间的关系的信号-屏蔽比阈值信息。
运行编码模式信息输入部件120来按照操作员的操作,通过其输入诸如该音频信号的取样频率和比特率之类的编码模式信息。运行最大标度因子频带表存储部件180来存储初始最大标度因子频带信息410和信号-屏蔽比阈值信息420。
运行初始最大标度因子频带计算部件140来基于由帧长度确定部件110产生的结果,和从编码模式信息输入部件120输入的编码模式信息,参考存储在最大标度因子频带表存储部件180中的初始最大标度因子频带信息410和信号-屏蔽比阈值信息420,计算音频信号的最大标度因子频带。
然后,运行最大标度因子频带计算部件150来基于由初始最大标度因子频带计算部件140计算出的初始最大标度因子频带即42和信号-屏蔽比阈值即1.0,按照包括在由心理声学模型分析部件130计算出的信号-屏蔽比信息中的表示信号-屏蔽比和标度因子频带之间关系的信号-屏蔽比阈值信息,计算关于该音频信号的最大标度因子频带。
运行频谱处理部件160来基于由心理声学模型分析部件130计算出的信号-屏蔽比信息,将从输入部件a1输入的音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,并对直到对应于最大标度因子频带的一音频信号分量的音频信号分量执行诸如MDCT和TNS这样的频谱处理,以生成音频信号数据。
运行量化与编码部件170来量化和编码由频谱处理部件160生成的音频信号数据,以生成要通过这里输出的编码音频信号。
音频信号编码设备的第一实施例执行计算各个标度因子频带的信号-屏蔽比的时频变换型编码方法。但根据本发明的编码方法的特征不在于该音频信号编码设备按照心理声学模型给对应于各个标度因子频带的音频信号分量分配权值,而在于该音频信号编码设备确定一最大标度因子频带,和对直到对应于最大标度因子频带的一音频信号分量的音频信号分量执行频谱处理过程和编码过程。
在这个示例中,可以从对应于标度因子频带“0”的音频信号分量至对应于标度因子频带“42”的音频信号分量中获得该音频信号分量,如图3中所示。运行音频信号编码设备的第一实施例来对直到对应于最大标度因子频带的一音频信号分量的音频信号分量执行频谱处理,并量化和编码,借此,可以灵活地优化要处理和编码的目标频带,并减少不必要的过程。
现参考附图图3说明如何运行最大标度因子频带计算部件150来计算该音频信号的一最大标度因子频带。
图3是图示由心理声学模型分析部件130所计算出的信号-屏蔽比与标度因子频带之间的关系,以及由初始最大标度因子频带计算部件140所计算出的信号-屏蔽比阈值的图。
通过下列步骤(1)至(5),按照示出包括在由心理声学模型分析部件130所计算出的信号-屏蔽比信息中的信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比阈值信息,基于由初始最大标度因子频带计算部件140所计算出的初始最大标度因子频带和信号-屏蔽比阈值,最大标度因子频带计算部件150运行计算该音频信号的一最大标度因子频带。在这个示例中,假设初始最大标度因子频带计算部件140计算出该音频信号的初始最大标度因子频带“42”,和信号-屏蔽比阈值为“1.0”,如图3所示。
步骤(1):运行最大标度因子频带计算部件150来确定对应于一最大标度因子频带的信号-屏蔽比,其中,该最大标度因子频带的初始值是初始最大标度因子频带计算部件140所计算出的初始最大标度因子频带。
步骤(2):运行最大标度因子频带计算部件150来判断在步骤(1)所确定的信号-屏蔽比是否大于信号-屏蔽比阈值。
步骤(2-1):如果在步骤(2)判断出信号-屏蔽比不大于信号-屏蔽比阈值,则运行最大标度因子频带计算部件150来将该最大标度因子频带递减一,并返回步骤(1)。
步骤(3):运行最大标度因子频带计算部件150来重复步骤(1)至步骤(2-1),直到在步骤(2)判断出信号-屏蔽比大于信号-屏蔽比阈值。
步骤(4):如果在步骤(2)判断出信号-屏蔽比大于信号-屏蔽比阈值,则运行最大标度因子频带计算部件150来将该最大标度因子频带递增一。
在这个示例中,当最大标度因子频带是如图3所示的“38”时,信号-屏蔽比大于信号-屏蔽比阈值“1.0”。运行最大标度因子频带计算部件150来将该最大标度因子频带“38”递增一,得到最大标度因子频带“39”。
步骤(5):运行最大标度因子频带计算部件150来将在步骤(4)递增一的这种最大标度因子频带输出到频谱处理部件160。
在这个示例中,运行最大标度因子频带计算部件150来将最大标度因子频带“39”输出到频谱处理部件160。
下列说明针对初始最大标度因子频带信息410和信号-屏蔽比阈值信息420。
在初始最大标度因子频带信息410的一个示例中具有关于“信道数”和“帧长度”、涉及“比特率”和“取样频率”的多个标度因子频带,如图4和5所示。“比特率”、“取样频率”和“信道数”由编码模式信息输入部件120输入。图示在图4(a)的初始最大标度因子频带信息410具有关于信道数为“2(立体声的)”和长长度帧的、涉及比特率和取样频率的多个标度因子频带。图示在图4(b)的初始最大标度因子频带信息410具有关于信道数为“2(立体声的)”和短长度帧的、涉及比特率和取样频率的多个标度因子频带。图示在图5(a)的初始最大标度因子频带信息410具有关于信道数为“1(单声道的)”和长长度帧的、涉及比特率和取样频率的多个标度因子频带。图示在图5(b)的初始最大标度因子频带信息410具有关于信道数为“1(单声道的)”和短长度帧的、涉及比特率和取样频率的多个标度因子频带。
创建初始最大标度因子频带信息410,使得很难编码由于屏蔽效应或低于最小可听见的阈值而不可由人耳听见的音频信号分量。很难听见对应于高频带的音频信号分量,而另一方面,对应于低频带的音频信号分量又极容易听见。
在初始最大标度因子频带信息410中,降低初始最大标度因子频带,使得当例如降低“比特率”从而减少可用比特数时,很难编码对应于高频带的音频信号分量,而又极容易编码对应于低频带的音频信号分量。另一方面,提高初始最大标度因子频带,使得当例如降低“取样频率”从而确定帧长度为长长度帧并增加可用比特数时,编码对应于高频带的音频信号分量,以改善声音质量。
此外,提高初始最大标度因子频带,使得当“信道数”少从而减少每帧的可用比特数时,编码对应于高频带的音频信号分量,以改善声音质量。提高初始最大标度因子频带,使得当由于判断出该音频信号为瞬态信号,音频信号的短长度帧确定为“帧长度”,和对应于高频带的音频信号分量的能量高时,编码对应于高频带的音频信号分量,以改善声音质量。
在信号-屏蔽比阈值信息420的一个示例中具有关于“信道数”和“帧长度”的、涉及“比特率”和“取样频率”的多个信号-屏蔽比阈值,如图6和7所示。图示在图6(a)的信号-屏蔽比阈值信息420具有关于信道数为“2(立体声的)”和长长度帧的、涉及比特率和取样频率的多个信号-屏蔽比阈值。图示在图6(b)的信号-屏蔽比阈值信息420具有关于信道数为“2(立体声的)”和短长度帧的、涉及比特率和取样频率的多个信号-屏蔽比阈值。图示在图7(a)的信号-屏蔽比阈值信息420具有关于信道数为“1(单声道的)”和长长度帧的、有关于比特率和取样频率的多个信号-屏蔽比阈值。图示在图7(b)的信号-屏蔽比阈值信息420具有关于信道数为“1(单声道的)”和短长度帧的、有关于比特率和取样频率的多个信号-屏蔽比阈值。
创建信号-屏蔽比阈值信息420,使得很难编码由于屏蔽效应或低于最小可听见的阈值而不可由人耳听见的音频信号分量。很难听见对应于高频带的音频信号分量,而另一方面,对应于低频带的音频信号分量又极容易听见。
在信号-屏蔽比阈值信息420中,提高初始最大信号-屏蔽比阈值,使得当例如降低“比特率”从而减少可用比特数时,很难编码对应于高频带的音频信号分量,而主要编码对应于低频带的音频信号分量。另一方面,降低初始最大信号-屏蔽比阈值,使得当例如降低“取样频率”从而确定帧长度为长长度帧并增加可用比特数时,编码对应于高频带的音频信号分量,以改善声音质量。
此外,降低初始最大信号-屏蔽比阈值,使得当“信道数”少从而减少每帧的可用比特数时,编码对应于高频带的音频信号分量,以改善声音质量。也减少初始最大信号-屏蔽比阈值,使得当由于判断出该音频信号为瞬态信号,所以音频信号的短长度帧确定为“帧长度”,从而对应于高频带的音频信号分量的能量高时,编码对应于高频带的音频信号分量,以改善声音质量。
现在参考图8的流程图,它图示了由音频信号编码设备的第一实施例所执行的音频信号编码方法。
在步骤S100,运行FFT分析部件100来对音频信号执行FFT分析、以生成关于该音频信号的频率信息。从步骤S100前进到步骤S130,在其中,运行心理声学模型分析部件130来基于关于如步骤S100那样生成的音频信号的频率信息,为该音频信号计算信号-屏蔽比信息。该信号-屏蔽比信息包括示出用于确定各个标度因子频带的信号-屏蔽比的多个信号-屏蔽比和标度因子频带之间的关系的信号-屏蔽比阈值信息。
在步骤S110,运行帧长度确定部件110来判断该音频信号是瞬态信号还是稳定信号,并且当判断出该音频信号是瞬态信号时确定该音频信号的一短长度帧,而在判断出该音频信号是稳定信号时确定该音频信号的一长长度帧。
在步骤S120,运行编码模式信息输入部件120来通过其输入诸如该音频信号的取样频率和比特率之类的编码模式信息。
在步骤S140,运行初始最大标度因子频带计算部件140来基于在步骤S110由帧长度确定部件110产生的结果,以及在步骤S120从编码模式信息输入部件120输入的编码模式信息,参考存储在最大标度因子频带表存储部件180中的初始最大标度因子频带信息410和信号-屏蔽比阈值信息420,为该音频信号计算初始最大标度因子频带和信号-屏蔽比阈值。
从步骤S140前进到步骤S150,在其中,运行最大标度因子频带计算部件150,来基于在步骤S140由初始最大标度因子频带计算部件140计算出的初始最大标度因子频带和信号-屏蔽比阈值,按照包含在步骤S130中由心理声学模型分析部件130计算出的信号-屏蔽比信息中表示信号-屏蔽比和标度因子频带之间的关系的信号-屏蔽比阈值信息,计算关于该音频信号的最大标度因子频带。
步骤S150中所执行的过程将在以后详细进行说明。
在步骤S151,运行最大标度因子频带计算部件150来确定对应于最大标度因子频带的信号-屏蔽比,其中,该最大标度因子频带的初始值是由初始最大标度因子频带计算部件140计算出的初始最大标度因子频带。然后,运行最大标度因子频带计算部件150来判断这样确定的信号-屏蔽比是否大于信号-屏蔽比阈值。
从步骤S151前进到步骤S152,在其中,如果在步骤S151判断出该信号-屏蔽比不大于信号-屏蔽比阈值,则运行最大标度因子频带计算部件150来将该最大标度因子频带递减一并返回步骤S151。
重复步骤S151和步骤S152,直到在步骤S151判断出该信号-屏蔽比大于信号-屏蔽比阈值。
从步骤S151前进到步骤S153,在其中,如果在步骤S151判断出该信号-屏蔽比大于信号-屏蔽比阈值,则运行最大标度因子频带计算部件150来将该最大标度因子频带递增一。
步骤S150也即步骤S153前进到步骤S160,在其中,运行最大标度因子频带计算部件150来将在步骤S153中被递增一的最大标度因子频带输出到频谱处理部件160,并运行频谱处理部件160来基于在步骤S130由心理声学模型分析部件130计算出的信号-屏蔽比信息,将该音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,并对直到对应于在步骤S150由最大标度因子频带计算部件150计算的最大标度因子频带的一音频信号分量的音频信号分量执行诸如MDCT和TNS这样的频谱处理,以生成音频信号数据。
步骤S160前进到步骤S170,在其中,运行量化与编码部件170来量化和编码在步骤S160由频谱处理部件160生成的音频信号数据,以生成要通过这里输出的编码音频信号。
正如从前面的说明中所看见的那样,可以理解,根据本发明的音频信号编码设备的第一实施例将一音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,按照一预定心理声学模型计算该音频信号的最大标度因子频带,以及对直到对应于最大标度因子频带的音频信号分量的各音频信号分量执行频谱处理,并量化和编码该音频信号分量,以此来消除处理由于屏蔽效应或低于最小可听阈值而不可由人耳听见的音频信号分量的必要。
在根据本发明的音频信号编码设备的第一实施例中,初始最大标度因子频带计算部件140基于由帧长度确定部件110产生的结果和从编码模式信息输入部件120输入的编码模式信息,参考存储在最大标度因子频带表存储部件180中的初始最大标度因子频带信息410和信号-屏蔽比阈值信息420、计算音频信号的最大标度因子频带和信号-屏蔽比阈值,而最大标度因子频带计算部件150基于由初始最大标度因子频带计算部件140计算出的初始最大标度因子频带,按照包括示出由心理声学模型分析部件130计算出的信号-屏蔽比信息,计算关于该音频信号的最大标度因子频带。该编码模式信息可以包括比特率、取样频率和信道数。这意味着根据本发明的音频信号编码设备的第一实施例可以按照诸如音频信号的比特率、取样频率和信道数这样的编码模式信息,自适应地计算该音频信号的最大标度因子频带。
在根据本发明的音频信号编码设备的第一实施例中,最大标度因子频带计算部件150来确定对应于最大标度因子频带的信号-屏蔽比,并判断这样确定的信号-屏蔽比是否大于信号-屏蔽比阈值。最大标度因子频带计算部件150按一递减该最大标度因子频带,直到该信号-屏蔽比变成大于信号-屏蔽比阈值,并且当该信号-屏蔽比大于信号-屏蔽比阈值时,将该最大标度因子频带递增一。由于屏蔽效应或低于最小可听阈值,人耳难以听见比对应于最大标度因子频带的音频信号分量高的音频信号分量。这样构造的音频信号编码设备的第一实施例可以消除处理由于屏蔽效应或低于最小可听阈值而不可由人耳听见的音频信号分量的必要,从而提高该编码处理的效率。
为了实现本发明的目的,可以将上述超声波探头的第一实施例替换为以后将详细说明的该超声波探头的第二实施例。
参考接下来的附图,具体来说,就是参考图9至13,它们图示了根据本发明的音频信号编码设备的第二优选实施例。该音频信号编码设备的第二个实施例图示在图9中,它包括:输入部件a8、FFT分析部件800、帧长度确定部件810、编码模式信息输入部件820、心理声学模型分析部件830、初始最大标度因子频带计算部件840、最大标度因子频带计算部件850、频谱处理部件860、量化与编码部件870以及最大标度因子频带表存储部件880。
该音频信号编码设备的第二个实施例在结构上类似于第一实施例,但最大标度因子频带表存储部件880适合于存储初始最大标度因子频带信息和能量阈值信息,初始最大标度因子频带计算部件840适合于基于由帧长度确定部件810产生的结果,和从编码模式信息输入部件820输入的编码模式信息,参考存储在最大标度因子频带表存储部件880中的初始最大标度因子频带信息和能量阈值信息,计算音频信号的初始最大标度因子频带和能量阈值,最大标度因子频带计算部件850适合于基于由FFT分析部件800生成的频率信息,计算示出多个能量值和标度因子频带之间的关系的能量值表,并基于由初始最大标度因子频带计算部件840计算出的初始最大标度因子频带和能量阈值,参照如此计算的能量值表,计算最大标度因子频带。
以下将解释该音频信号编码设备的第二实施例的运行。
运行输入部件a8以在其中输入音频信号。运行帧长度确定部件810来判断从输入部件a8输入的音频信号是瞬态信号还是稳定信号,并且在该音频信号被判断为瞬态信号时确定音频信号一短长度帧,而在该音频信号被判断为稳定信号时确定音频信号一长长度帧。
运行FFT分析部件800来对从输入部件a8输入的音频信号执行FFT分析、以生成关于该音频信号的频率信息。运行心理声学模型分析部件830来输入关于FFT分析部件800所生成的音频信号的频率信息,以及按照熟知的预定心理声学模型,基于所输入的频率信息,为该音频信号计算信号-屏蔽比信息。运行编码模式信息输入部件820来按照操作员的操作,通过其输入诸如该音频信号的取样频率和比特率之类的编码模式信息。
运行最大标度因子频带表存储部件880来存储初始最大标度因子频带信息和能量阈值信息820E(未图示)。运行初始最大标度因子频带计算部件840来基于由帧长度确定部件810产生的结果,和从编码模式信息输入部件820输入的编码模式信息,参考存储在最大标度因子频带表存储部件880中的初始最大标度因子频带信息和能量阈值信息,为该音频信号计算初始最大标度因子频带和能量阈值。在这个示例中,假设初始最大标度因子频带计算部件840计算出该音频信号的初始最大标度因子频带为“42”和能量阈值为“10000”,如图10所示。
运行最大标度因子频带计算部件850来基于由FFT分析部件800生成的频率信息,计算示出多个能量值与标度因子频带之间的关系的能量表,并且基于由初始最大标度因子频带计算部件840计算出的初始最大标度因子频带即“42”和能量阈值即“10000”,参考这样计算的能量值表计算出一最大标度因子频带。运行最大标度因子频带计算部件850来按照下列公式(1)来计算该能量值表:
其中sfb用于指“标度因子频带”,
maxSfb用于指“初始最大标度因子频带”,
start|sfb|用于指标度因子频带的开始点,和
end|sfb|用于指标度因子频带的结束点。
运行频谱处理部件860来基于由心理声学模型分析部件830计算出的信号-屏蔽比信息,将从输入部件a8输入的音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,并对直到对应于由最大标度因子频带计算部件850计算的最大标度因子频带的一音频信号分量的音频信号分量执行诸如MDCT和TNS这样的频谱处理,以生成音频信号数据。
运行量化与编码部件870来量化和编码由频谱处理部件860生成的音频信号数据,以生成要通过这里输出的编码音频信号。
现参考附图图10说明如何运行最大标度因子频带计算部件850来计算该音频信号的一最大标度因子频带。
图10是图示由最大标度因子频带计算部件850所计算出的能量值与标度因子频带之间的关系,以及由初始最大标度因子频带计算部件840所计算出的能量阈值的曲线图。
通过下列步骤,运行最大标度因子频带计算部件850来基于FFT分析部件800产生的频率信息,计算示出多个能量值与标度因子频带之间的关系的能量表,然后基于由初始最大标度因子频带计算部件840计算出的初始最大标度因子频带和能量阈值,参考示出多个能量值与标度因子频带之间的关系的能量表计算一最大标度因子频带。
步骤(1):运行最大标度因子频带计算部件850来按照该能量表,计算对应于该音频信号的一最大标度因子频带的能量值,其中,该最大标度因子频带的初始值是由初始最大标度因子频带计算部件840所计算出的初始最大标度因子频带。
步骤(2):运行最大标度因子频带计算部件850来判断在步骤(1)所确定的能量值是否大于能量阈值。
步骤(2-1):如果在步骤(2)判断出能量值不大于能量阈值,则运行最大标度因子频带计算部件850来将该最大标度因子频带递减一,并返回步骤(1)。
步骤(3):运行最大标度因子频带计算部件850来重复步骤(1)至步骤(2-1),直到在步骤(2)判断出能量值大于能量阈值。
步骤(4):如果在步骤(2)判断出能量值大于能量阈值,则运行最大标度因子频带计算部件850来将该最大标度因子频带递增一。
在这个示例中,当最大标度因子频带是如图10所示的“38”时,能量值变成大于能量阈值“100000”。然后运行最大标度因子频带计算部件850来将该最大标度因子频带“38”递增一,得到最大标度因子频带“39”。
步骤(5):运行最大标度因子频带计算部件850来将在步骤(4)递增一的这种最大标度因子频带输出到频谱处理部件860。
在这个示例中,运行最大标度因子频带计算部件850来将最大标度因子0频带“39”输出到频谱处理部件860。
下列说明针对存储在最大标度因子频带表存储部件880中的初始最大标度因子频带信息和能量阈值信息820E。存储在最大标度因子频带表存储部件880中的初始最大标度因子频带信息在结构上类似于图4和5所示的初始最大标度因子频带信息410,而另一方面,存储在最大标度因子频带表存储部件880中的能量阈值信息420E具有多个涉及编码模式信息的能量阈值。
在能量阈值信息420E的一个示例中具有关于“信道数”和“帧长度”的、涉及“比特率”和“取样频率”的多个能量阈值,如图11和12所示。图示在图11(a)的能量阈值信息420E具有关于信道数为“2(立体声的)”和长长度帧的、有关于比特率和取样频率的多个能量阈值。图示在图11(b)的能量阈值信息420E具有关于信道数为“2(立体声的)”和短长度帧的、有关于比特率和取样频率的多个能量阈值。图示在图12(a)的能量阈值信息420E具有关于信道数为“1(单声道的)”和长长度帧的、有关于比特率和取样频率的多个能量阈值。图示在图12(b)的能量阈值信息420E具有关于信道数为“1(单声道的)”和短长度帧的、有关于比特率和取样频率的多个能量阈值。
创建在图11和12中所示的能量阈值信息420E,使得与图4和5中所示的初始最大标度因子频带信息410类似,很难编码由于屏蔽效应或低于最小可听见的阈值而不可由人耳听见的音频信号分量。很难听见对应于高频带的音频信号分量,而另一方面,对应于低频带的音频信号分量又极容易听见。
在能量阈值信息420E中,提高能量阈值,使得当例如降低“比特率”从而减少可用比特数时,很难编码对应于高频带的音频信号分量,而主要编码对应于低频带的音频信号分量。另一方面,降低能量阈值,使得当例如降低“取样频率”从而确定帧长度的该长长度帧并增加可用比特数时,编码对应于高频带的音频信号分量,以改善声音质量。
此外,降低能量阈值,使得当“信道数”少从而减少每帧的可用比特数时,编码对应于高频带的音频信号分量,以改善声音质量。也减少能量阈值,使得当由于判断出该音频信号为瞬态信号,所以音频信号的短长度帧确定为“帧长度”,从而对应于高频带的音频信号分量的能量高时,编码对应于高频带的音频信号分量,以改善声音质量。
现在参考图13的流程图,它图示了由音频信号编码设备的第二实施例所执行的音频信号编码方法。
在步骤S810,运行帧长度确定部件810来判断从输入部件a8输入的音频信号是瞬态信号还是稳定信号,并且当判断出该音频信号是瞬态信号时确定该音频信号的一短长度帧,而在判断出该音频信号是稳定信号时确定该音频信号的一长长度帧。
在步骤S800,运行FFT分析部件800来对从输入部件a8输入的音频信号执行FFT分析、以生成关于该音频信号的频率信息。步骤S800前进到步骤S830,其中,运行心理声学模型分析部件830来输入关于由FFT分析部件800生成的音频信号的频率信息,并基于这样输入的频率信息,按照熟知的预定心理声学模型,为该音频信号计算信号-屏蔽比信息。
在步骤S820,运行编码模式信息输入部件820来按照操作员的操作,通过其输入诸如该音频信号的取样频率和比特率之类的编码模式信息。
在步骤S840,运行初始最大标度因子频带计算部件840来基于在步骤S810由帧长度确定部件810产生的结果,和在步骤S820从编码模式信息输入部件820输入的编码模式信息,参考存储在最大标度因子频带表存储部件880中的初始最大标度因子频带信息和能量阈值信息,为该音频信号计算最大标度因子频带和能量阈值。
步骤S840前进到步骤S850,在其中,运行最大标度因子频带计算部件850来基于在步骤S800中由FFT分析部件800生成的频率信息,计算示出多个能量值和标度因子频带之间的关系的能量值表,并参考这样计算的能量值表,基于在步骤S840由初始最大标度因子频带计算部件840计算出的初始最大标度因子频带和能量阈值,计算一最大标度因子频带。
步骤S850中所执行的过程将在下面详细进行说明。
在步骤S851,运行最大标度因子频带计算部件850来基于在步骤S800中由FFT分析部件800生成的频率信息,计算示出多个能量值和标度因子频带之间的关系的能量值表,并按照该能量值表确定该音频信号对应于最大标度因子频带的能量值,其中,该最大标度因子频带的初始值是由初始最大标度因子频带计算部件840计算出的初始最大标度因子频带。
步骤S851前进到步骤S852,其中,运行最大标度因子频带计算部件850判断在步骤S851中确定的能量值是否大于能量阈值。
步骤S852前进到步骤S853,其中,如果在步骤S852判断出该能量值不大于能量阈值,则运行最大标度因子频带计算部件850来将该最大标度因子频带递减一并返回步骤S852。
重复步骤S853和步骤S852,直到在步骤S852判断出该能量值大于能量阈值。
步骤S852前进到步骤S854,其中,如果在步骤S852判断出该能量值大于能量阈值,则运行最大标度因子频带计算部件850来将该最大标度因子频带递增一,并将被递增一的最大标度因子频带输出到频谱处理部件860。
步骤S850即步骤S854前进到步骤S860,其中,运行频谱处理部件860来基于在步骤S830由心理声学模型分析部件830计算出的信号-屏蔽蔽信息,将从输入部件a8输入的该音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,并对直到对应于在步骤S850由最大标度因子频带计算部件850计算出的最大标度因子频带的一音频信号分量的音频信号分量执行诸如MDCT和TNS这样的频谱处理,以生成音频信号数据。
步骤S860前进到步骤S870,其中,运行量化与编码部件870来量化和编码在步骤S860由频谱处理部件860生成的音频信号数据,以生成要通过这里输出的编码音频信号。
正如从前面的说明中所看见的那样,可以理解,根据本发明的音频信号编码设备的第二实施例将输入的一音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,按照一预定心理声学模型计算该音频信号的最大标度因子频带,以及对直到对应于最大标度因子频带的音频信号分量的音频信号分量执行频谱处理,并量化和编码该音频信号分量,以此来消除处理由于屏蔽效应或低于最小可听阈值而不可由人耳听见的音频信号分量的必要。
在根据本发明的音频信号编码设备的第二实施例中,初始最大标度因子频带计算部件840基于由帧长度确定部件810产生的结果和从编码模式信息输入部件820输入的编码模式信息,参考存储在最大标度因子频带表存储部件880中的初始最大标度因子频带信息和能量阈值信息,为其中输入的音频信号计算一初始最大标度因子频带,而最大标度因子频带计算部件850计算示出多个能量值和标度因子频带之间的关系的能量值表,然后参考这样计算出的能量值表基于由初始最大标度因子频带计算部件840计算出的初始最大标度因子频带,计算关于该音频信号的最大标度因子频带。该编码模式信息可以包括比特率、取样频率和信道数。这意味着根据本发明的音频信号编码设备的第二实施例可以按照诸如音频信号的比特率、取样频率和信道数这样的编码模式信息,自适应地计算该音频信号的最大标度因子频带。
在根据本发明的音频信号编码设备的第二实施例中,运行最大标度因子频带计算部件850来确定对应于最大标度因子频带的能量值,并判断这样确定的能量值是否大于能量阈值。最大标度因子频带计算部件850按一递减该最大标度因子频带,直到该能量值变成大于能量阈值,并且当该能量值大于能量阈值时,将该最大标度因子频带递增一。由于屏蔽效应或低于最小可听阈值,人耳难以听见比对应于最大标度因子频带的音频信号分量高的音频信号分量。这样构造的音频信号编码设备的第二实施例可以消除处理由于屏蔽效应或低于最小可听阈值而不可由人耳听见的音频信号分量的必要,从而提高该编码处理的效率。
为了实现本发明的目的,可以将上述超声波探头的第二实施例替换为以后将详细说明的该超声波探头的第三实施例。
参考接下来的附图,具体来说,就是参考图14至17,它们图示了根据本发明的音频信号编码设备的第三优选实施例。该音频信号编码设备的第三实施例图示在图14中,它包括:输入部件a11、FFT分析部件1100、帧长度确定部件1110、编码模式信息输入部件1120、心理声学模型分析部件1130、初始最大标度因子频带计算部件1140、最大标度因子频带计算部件1150、频谱处理部件1160、量化与编码部件1170以及最大标度因子频带表存储部件1180。
该音频信号编码设备的第三实施例在结构上类似于第一实施例,但最大标度因子频带表存储部件1180适合于存储如图16所示的初始最大标度因子频带信息1310、信号-屏蔽比阈值信息1320和最小标度因子频带信息1330,初始最大标度因子频带计算部件1140适合于基于由帧长度确定部件1110产生的结果和从编码模式信息输入部件1120输入的编码模式信息,参考存储在最大标度因子频带表存储部件1180中的初始最大标度因子频带信息、信号-屏蔽比阈值信息和最小标度因子频带信息,计算音频信号的初始最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,而最大标度因子频带计算部件1150适合于基于由初始最大标度因子频带计算部件1140计算出的初始最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,按照包括在由心理声学模型分析部件1130计算出的信号-屏蔽比信息中表示信号-屏蔽比和标度因子频带之间的关系的信号-屏蔽比阈值信息,计算最大标度因子频带。
下列说明针对存储在最大标度因子频带表存储部件1180中的初始最大标度因子频带信息1310、信号-屏蔽比阈值信息1320和最小标度因子频带信息1330。初始最大标度因子频带信息1310在结构上类似于图4和5所示的初始最大标度因子频带信息410,信号-屏蔽比阈值信息1320在结构上类似于图6和7所示的信号-屏蔽比阈值信息420。最小标度因子频带信息1330在结构上类似于图4和5所示的初始最大标度因子频带信息410。在最小标度因子频带信息1330的一个示例中具有关于“信道数”和“帧长度”的、有关于诸如“比特率”和“取样频率”这样的多个最小标度因子频带。
以下将解释该音频信号编码设备的第三实施例的操作。
运行输入部件a11以在其中输入音频信号。运行帧长度确定部件1110来判断从输入部件a11输入的音频信号是瞬态信号还是稳定信号,并且在该音频信号被判断为瞬态信号时确定音频信号的一短长度帧,而在该音频信号被判断为稳定信号时确定音频信号的一长长度帧。
运行FFT分析部件1100来对从输入部件a11输入的音频信号执行FFT分析、以生成关于该音频信号的频率信息。运行心理声学模型分析部件1130来输入关于由FFT分析部件1100所生成的音频信号的频率信息,以及按照熟知的预定心理声学模型,基于所输入的频率信息,为该音频信号计算表示信号-屏蔽比和标度因子频带之间关系的信号-屏蔽比信息。运行编码模式信息输入部件1120来按照操作员的操作,通过其输入诸如该音频信号的取样频率和比特率之类的编码模式信息。
运行最大标度因子频带表存储部件1180来存储初始最大标度因子频带信息1310、信号-屏蔽比阈值信息1320和最小标度因子频带信息1330,如图16所示。运行初始最大标度因子频带计算部件1140来基于由帧长度确定部件1110产生的结果和从编码模式信息输入部件1120输入的编码模式信息,参考存储在最大标度因子频带表存储部件1180中的初始最大标度因子频带信息1310、信号-屏蔽比阈值信息1320和最小标度因子频带信息1330,为该音频信号计算初始最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带。运行最大标度因子频带计算部件1150来按照包括在由心理声学模型分析部件1130计算出的信号-屏蔽比信息中的表示信号-屏蔽比和标度因子频带之间的关系的信号-屏蔽比阈值信息,基于由初始最大标度因子频带计算部件1140计算出的初始最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,计算最大标度因子频带。
运行频谱处理部件1160来基于由心理声学模型分析部件1130计算出的信号-屏蔽比信息,将从输入部件a11输入的音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,并对直到对应于由最大标度因子频带计算部件计算的最大标度因子频带的一音频信号分量的音频信号分量执行诸如MDCT和TNS这样的频谱处理,以生成音频信号数据。
运行量化与编码部件1170来量化和编码由频谱处理部件1160生成的音频信号数据,以生成要通过这里输出的编码音频信号。
现参考附图图15说明如何运行最大标度因子频带计算部件1150来计算该音频信号的一最大标度因子频带。
图15是图示由最大标度因子频带计算部件1150所计算出的标度因子频带和能量值之间的关系,以及由初始最大标度因子频带计算部件1140所计算出的能量阈值的图。
通过下列步骤,运行最大标度因子频带计算部件1150来基于由初始最大标度因子频带计算部件1140计算出的最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,按照包含在由心理声学模型分析部件1130计算出的信号-屏蔽比信息中的表示信号-屏蔽比和标度因子频带之间的关系的信号-屏蔽比阈值信息,计算一最大标度因子频带。在这个示例中,假设最大标度因子频带为“13”、信号-屏蔽比阈值为“1.0”和最小标度因子频带为“11”。
步骤(1):运行最大标度因子频带计算部件1150来按照信号-屏蔽比阈值信息,确定对应于该音频信号的一最大标度因子频带的信号-屏蔽比,其中,该最大标度因子频带的初始值是初始最大标度因子频带计算部件1140所计算出的初始最大标度因子频带。
步骤(2):运行最大标度因子频带计算部件1150来判断在步骤(1)所确定的信号-屏蔽比是否大于信号-屏蔽比阈值。
步骤(2-1):如果在步骤(2)判断出信号-屏蔽比不大于信号-屏蔽比阈值,则运行最大标度因子频带计算部件1150来将该最大标度因子频带递减一。
步骤(3):运行最大标度因子频带计算部件1150来重复步骤(1)至步骤(2-1),直到在步骤(2)判断出信号-屏蔽比大于信号-屏蔽比阈值。
步骤(4):如果在步骤(2)判断出信号-屏蔽比大于信号-屏蔽比阈值,则运行最大标度因子频带计算部件1150来将该最大标度因子频带递增一。
在这个示例中,当最大标度因子频带是如图15所示的“6”时,信号-屏蔽比变成大于信号-屏蔽比阈值。然后运行最大标度因子频带计算部件1150来将该最大标度因子频带“6”递增一,得到最大标度因子频带“7”。
步骤(5):运行最大标度因子频带计算部件1150来判断在步骤(4)递增一的这种最大标度因子频带是否小于最小标度因子频带。
步骤(6):如果在步骤(5)判断出该最大标度因子频带小于最小标度因子频带,则运行最大标度因子频带计算部件1150来将该最小标度因子频带递增一,用这种递增了一的最小标度因子频带替代最大标度因子频带,并将这样替代过的最大标度因子频带输出到频谱处理部件1160。
步骤(7):如果在步骤(5)判断出该最大标度因子频带不小于最小标度因子频带,则运行最大标度因子频带计算部件1150来将该最大标度因子频带输出到频谱处理部件1160。
在这个示例中,在步骤(5)中,这种递增了一的最大标度因子频带”7”小于该最小标度因子频带“11”。运行最大标度因子频带计算部件1150来将该最小标度因子频带“11”递增一,用这种递增了一的最小标度因子频带“12”替代最大标度因子频带“7”,并将这样替代过的最大标度因子频带“12”输出到频谱处理部件1160。
这样构造的音频信号编码设备的第三实施例可以防止最大标度因子频带低到不能保证是要进行处理的音频信号分量的最小范围从而提高了声音质量。
参考图17的流程图,它图示了由音频信号编码设备的第三实施例所执行的音频信号编码方法。
在步骤S1110,运行帧长度确定部件1110来判断从输入部件a11输入的音频信号是瞬态信号还是稳定信号,并且当判断出该音频信号是瞬态信号时确定该音频信号的一短长度帧,而在判断出该音频信号是稳定信号时确定该音频信号的一长长度帧。
在步骤S1100,运行FFT分析部件1100来对从输入部件a11输入的音频信号执行FFT分析、以生成关于该音频信号的频率信息。步骤S1100前进到步骤S1130,在其中,运行心理声学模型分析部件1130来输入关于由FFT分析部件1100生成的音频信号的频率信息,并基于这样输入的频率信息,按照熟知的预定心理声学模型,为该音频信号计算信号-屏蔽比信息。
在步骤S1120,运行编码模式信息输入部件1120来按照操作员的操作,通过其输入诸如该音频信号的取样频率和比特率之类的编码模式信息。
在步骤S1140,运行初始最大标度因子频带计算部件1140来基于在步骤S1110由帧长度确定部件1110产生的结果以及在步骤S1120中从编码模式信息输入部件1120输入的编码模式信息,参考存储在最大标度因子频带表存储部件1180中的初始最大标度因子频带信息1310、信号-屏蔽比阈值信息1320和最小标度因子频带信息1330,为该音频信号计算最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带。
在步骤S1150,运行最大标度因子频带计算部件1150来基于在步骤S1140由初始最大标度因子频带计算部件1140计算出的初始最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,按照包含于在步骤S1130由心理声学模型分析部件1130计算出的信号-屏蔽比信息中的表示信号-屏蔽比和标度因子频带之间的关系的信号-屏蔽比阈值信息,计算一最大标度因子频带。
现在参考图15的附图来说明如何运行最大标度因子频带计算部件1150来为音频信号计算出一最大标度因子频带。
图15是示出由最大标度因子频带计算部件1150计算出的标度因子频带和能量值之间的关系,以及由初始最大标度因子频带计算部件1140计算出的的能量阈值的图。
运行最大标度因子频带计算部件1150来通过下列步骤按照包含在由心理声学模型分析部件1130计算出的信号-屏蔽比信息中的表示信号-屏蔽比和标度因子频带之间的关系的信号-屏蔽比阈值信息,基于由初始最大标度因子频带计算部件1140计算出的最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,计算出一最大标度因子频带。在这个示例中,假设初始最大标度因子频带为“13”、信号-屏蔽比阈值为“1.0”和最小标度因子频带为“11”。
在步骤S1151,运行最大标度因子频带计算部件1150来按照该信号-屏蔽比阈值信息确定对应于该音频信号的最大标度因子频带的信号-屏蔽比,其中,该最大标度因子频带的初始值是在步骤S1140由初始最大标度因子频带计算部件1140计算出的初始最大标度因子频带,然后运行最大标度因子频带计算部件1150来判断这样确定的信号-屏蔽比是否大于信号-屏蔽比阈值。在这个示例中,计算出的初始最大标度因子频带是“13”。
步骤S1151前进到步骤S1152,在其中,如果在步骤S1151判断出该信号-屏蔽比大于信号-屏蔽比阈值,则运行最大标度因子频带计算部件1150来将该最大标度因子频带递减1。
重复步骤S1152和步骤S1151,直到在步骤S1151判断出该信号-屏蔽比大于信号-屏蔽比阈值。
步骤S1151前进到步骤S1153,在其中,如果在步骤S1151判断出该信号-屏蔽比不大于信号-屏蔽比阈值,则运行最大标度因子频带计算部件1150来将该最大标度因子频带递增一。
在这个示例中,当最大标度因子频带是如图15所示的“6”时,信号-屏蔽比变成大于信号-屏蔽比阈值。然后运行最大标度因子频带计算部件1150来将该最大标度因子频带“6”递增一,得到最大标度因子频带“7”。
步骤S1153前进到步骤S1154,在其中,运行最大标度因子频带计算部件1150来判断在步骤S1153递增一的这种最大标度因子频带是否小于最小标度因子频带。
步骤S1154前进到步骤S1155,在其中,如果在步骤S1154判断出该最大标度因子频带小于最小标度因子频带,则运行最大标度因子频带计算部件1150来将该最小标度因子频带递增一,用这种递增了一的最小标度因子频带替代最大标度因子频带,并将这样替代过的最大标度因子频带输出到频谱处理部件1160。
在这个示例中,在步骤S1153中计算的最大标度因子频带”7”小于该最小标度因子频带“11”。最大标度因子频带计算部件1150来将该最小标度因子频带递增一,用这种递增了一的最小标度因子频带“12”替代最大标度因子频带“7”,并将这样替代过的最大标度因子频带“12”输出到频谱处理部件1160。
步骤S1154前进到步骤S1160,在其中,如果在步骤S1154判断出该最大标度因子频带不小于最小标度因子频带,则运行最大标度因子频带计算部件1150来将该最大标度因子频带输出到频谱处理部件1160。
步骤S1150即步骤S1154前进到步骤S1160,在其中,运行频谱处理部件1160来基于在步骤S1130由心理声学模型分析部件1130计算出的信号-屏蔽蔽信息,将从输入部件a11输入的音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,并对直到对应于在步骤S1150由最大标度因子频带计算部件1150计算出的最大标度因子频带的一音频信号分量的音频信号分量执行诸如MDCT和TNS这样的频谱处理,以生成音频信号数据。
步骤S1160前进到步骤S1170,在其中,运行量化与编码部件1170来量化和编码在步骤S1160由频谱处理部件1160生成的音频信号数据,以生成要通过这里输出的编码音频信号。
正如从前面的说明中所看见的那样,可以理解,根据本发明的音频信号编码设备的第三实施例将一音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,按照一预定心理声学模型计算该音频信号的最大标度因子频带,以及对直到对应于最大标度因子频带的音频信号分量的音频信号分量执行频谱处理,并量化和编码音频信号分量,以此来消除处理由于屏蔽效应或低于最小可听阈值而不可由人耳听见的音频信号分量的必要。
在根据本发明的音频信号编码设备的第三实施例中,初始最大标度因子频带计算部件1140基于由帧长度确定部件1110产生的结果和从编码模式信息输入部件1120输入的编码模式信息,参考存储在最大标度因子频带表存储部件1180中的初始最大标度因子频带信息、信号-屏蔽比阈值信息和最小标度因子频带信息,为其中输入的音频信号计算一初始最大标度因子频带,最大标度因子频带计算部件1150基于由初始最大标度因子频带计算部件1140计算出的初始最大标度因子频带和最小标度因子频带,按照由心理声学模型分析部件1130计算出的信号-屏蔽蔽信息,计算关于该音频信号的最大标度因子频带。该编码模式信息可以包括比特率、取样频率和信道数。这意味着根据本发明的音频信号编码设备的第三实施例可以按照诸如音频信号的比特率、取样频率和信道数这样的编码模式信息,自适应地计算该音频信号的最大标度因子频带。
在根据本发明的音频信号编码设备的第三实施例中,最大标度因子频带计算部件1150确定对应于最大标度因子频带的信号-屏蔽比,并判断这样确定的信号-屏蔽比是否大于信号-屏蔽比阈值。最大标度因子频带计算部件1150按一递减该最大标度因子频带,直到该信号-屏蔽比变成大于信号-屏蔽比阈值,并且当该信号-屏蔽比大于信号-屏蔽比阈值时,将该最大标度因子频带递增一。由于屏蔽效应或低于最小可听阈值,人耳难以听见比对应于最大标度因子频带的音频信号分量高的音频信号分量。此外,最大标度因子频带计算部件1150判断这种递增了的最大标度因子频带是否小于最小标度因子频带。如果判断出该最大标度因子频带小于最小标度因子频带,则运行最大标度因子频带计算部件1150来将该最小标度因子频带递增一,用这种递增了一的最小标度因子频带替代该最大标度因子频带。
这样构造的音频信号编码设备的第三实施例可以消除处理由于屏蔽效应或低于最小可听阈值而不可由人耳听见的音频信号分量的必要,从而提高该编码处理的效率。此外,这样构造的音频信号编码设备的第三实施例可以防止最大标度因子频带低到不能保证要进行处理的音频信号分量的最小范围,从而提高声音质量。
根据本发明,该音频信号编码设备的第二或第三实施例的所有功能都可以由个人计算机执行,该计算机包括以下称为“CPU”的中央处理器、诸如声卡之类的声音装置以及诸如软盘、CD-ROM、DVD-ROM、硬盘之类的、可以让用于执行该音频信号编码设备的第二或第三实施例的上述组成件的所有功能的计算机可读程序代码包含在其中计算机可读介质。
此外,该音频信号编码设备的第二或第三实施例可以用在需要编码高质量声音信号或以复杂编码模式编码的音乐发行业务中。
本领域的熟练技术人员将明白和预料,在不脱离本发明的前提下,可以对这里图解和说明的实施例进行变动和/或改变。因此,前面的说明只是说明性的,而非限制性的,并且本发明的真实精神和范围将由附属的权利要求书确定。
Claims (13)
1、一种音频信号编码设备,用于将音频信号划分成各自对应于要按照预定的心理声学模型编码的标度因子频带的多个音频信号分量,它包括:
输入部件,用于在其中输入音频信号;
帧长度确定部件,用于判断从所述输入部件输入的该音频信号是瞬态信号还是稳定信号,并在该音频信号被判断为瞬态信号时确定该音频信号的短长度帧而在该音频信号被判断为稳定信号时确定该音频信号的长长度帧;
FFT分析部件,用于对从所述输入部件输入的所述音频信号执行快速富里叶变换、以生成关于该音频信号的频率信息;
编码模式信息输入部件,用于输入编码模式信息;
心理声学模型分析部件,用于按照所述预定心理声学模型,基于关于由所述FFT分析部件所生成的所述音频信号的所述频率信息,为该音频信号计算信号-屏蔽比信息;
最大标度因子频带表存储部件,用于存储初始最大标度因子频带信息和信号-屏蔽比阈值信息;
初始最大标度因子频带计算部件,用于基于所述帧长度确定部件产生的结果和从所述编码模式信息部件输入的所述编码模式信息,参考存储在所述最大标度因子频带表存储部件中的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带;
最大标度因子频带计算部件,用于基于由所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带,按照由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息,为该音频信号计算最大标度因子频带;
频谱处理部件,用于基于由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息,将从所述输入部件输入的所述音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,以及对直到对应于由该最大标度因子频带计算部件计算出的所述最大标度因子频带的一音频信号分量的所述各音频信号分量执行频谱处理以产生音频信号数据;以及
量化与编码部件,用于量化和编码由所述频谱处理部件生成的该音频信号数据,以生成要通过其输出的编码音频信号,
借此,所述最大标度因子频带计算部件响应在其中输入的所述音频信号自适应地计算所述最大标度因子频带。
2、如权利要求1所述的音频信号编码设备,其中,所述编码模式信息包括比特率信息和取样频率信息,所述最大标度因子频带表存储部件存储具有涉及比特率信息和取样信息的多个标度因子频带的初始最大标度因子频带信息,以及存储具有涉及比特率信息和取样信息的多个信号-屏蔽比阈值的信号-屏蔽比阈值信息,所述初始最大标度因子频带计算部件基于由所述帧长度确定部件产生的结果和从所述编码模式信息输入部件输入的包括所述比特率信息和所述取样频率信息的所述编码模式信息,参考存储在所述最大标度因子频带表存储部件中的所述初始最大标度因子频带信息和信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带,和所述最大标度因子频带计算部件基于由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息和所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带、为该音频信号计算最大标度因子频带。
3、如权利要求2所述的音频信号编码设备,其中,所述编码模式信息还包括信道数,所述最大标度因子频带表存储部件存储具有涉及信道数目的多个标度因子频带的初始最大标度因子频带信息,以及存储具有涉及信道数目的多个信号-屏蔽比阈值的信号-屏蔽比阈值信息,所述初始最大标度因子频带计算部件基于由所述帧长度确定部件产生的结果、和包括从所述编码模式信息部件输入的信道数目的所述编码模式信息,参考存储在所述最大标度因子频带表存储部件中的所述初始最大标度因子频带信息和信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带,所述最大标度因子频带计算部件基于由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息和所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带、为该音频信号计算最大标度因子频带。
4、如权利要求1所述的音频信号编码设备,其中,所述信号-屏蔽比阈值信息包括示出多个信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,所述最大标度因子频带表存储部件存储初始最大标度因子频带信息以及信号-屏蔽比阈值信息,所述初始最大标度因子频带计算部件基于由所述帧长度确定部件产生的结果、和从所述编码模式信息输入部件输入的所述编码模式信息,参考存储在所述最大标度因子频带表存储部件中的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带和信号屏蔽比阈值,和所述最大标度因子频带计算部件基于由所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带和所述信号-屏蔽比阈值,按照包含在由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息中的、示出信号-屏蔽比与标度因子频带之间的关系的所述信号-屏蔽比表,通过下列步骤为该音频信号计算最大标度因子频带:
(1)按照所述信号-屏蔽比表,确定对应于最大标度因子频带的信号-屏蔽比,其中所述最大标度因子频带的初始值就是由所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带;
(2)判断在所述步骤(1)所确定的所述信号-屏蔽比是否大于所述信号-屏蔽比阈值;
(2-1)如果在所述步骤(2)判断出所述信号-屏蔽比不大于所述信号-屏蔽比阈值,则将该最大标度因子频带递减一,并返回所述步骤(1);
(3)重复所述步骤(1)至步骤(2-1),直到在所述步骤(2)判断出所述信号-屏蔽比大于所述信号-屏蔽比阈值;
(4)如果在所述步骤(2)判断出所确定的所述信号-屏蔽比大于所述信号-屏蔽比阈值,则将该最大标度因子频带递增一;
(5)将在所述步骤(4)递增一的所述最大标度因子频带输出到所述频谱处理部件。
5.如权利要求1所述的音频信号编码设备,其中,所述最大标度因子频带表存储部件存储初始最大标度因子频带信息以及能量阈值信息,所述初始最大标度因子频带计算部件基于由所述帧长度确定部件产生的结果和从所述编码模式信息输入部件输入的所述编码模式信息,参考存储在所述最大标度因子频带表存储部件中的所述初始最大标度因子频带信息和能量阈值信息,为所述音频信号计算初始最大标度因子频带和能量阈值,以及所述最大标度因子频带计算部件基于由所述快速富里叶分析部件生成的所述频率信息计算示出多个能量值与标度因子频带之间的关系的能量值表,并且通过下列步骤基于由所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带和所述能量阈值,参考示出能量值与标度因子频带之间的关系的所述能量值表,为所述音频信号计算最大标度因子频带的作用,所述步骤为:
(1)按照所述能量值表确定对应于最大标度因子频带的能量值,其中,所述最大标度因子频带的所述初始值是所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带;
(2)判断在所述步骤(1)所确定的所述能量值是否大于所述能量阈值;
(2-1)如果在所述步骤(2)判断出所述能量值不大于所述能量阈值,则将所述最大标度因子频带递减一,并返回所述步骤(1);
(3)重复所述步骤(1)至所述步骤(2-1),直到在所述步骤(2)判断出所述能量值大于所述能量阈值;
(4)如果在所述步骤(2)判断出所述能量值大于所述能量阈值,则将所述最大标度因子频带递增一;和
(5)将在所述步骤(4)递增一的这种所述最大标度因子频带输出到所述频谱处理部件。
6.如权利要求1所述的音频信号编码设备,其中,所述信号-屏蔽比阈值信息包括示出多个信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,所述最大标度因子频带表存储部件存储初始最大标度因子频带信息、信号-屏蔽比阈值信息和最小标度因子频带信息,所述初始最大标度因子频带计算部件基于由所述帧长度确定部件产生的结果,和从所述编码模式信息输入部件输入的所述编码模式信息,参考存储在所述最大标度因子频带表存储部件中的所述初始最大标度因子频带信息、所述信号-屏蔽比阈值信息和所述最小标度因子频带信息,为所述音频信号计算初始最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,以及所述最大标度因子频带计算部件通过下列步骤按照包含在由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息中的、示出信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,基于由所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带、所述信号-屏蔽比阈值和所述最小标度因子频带、为所述音频信号计算最大标度因子频带,所述步骤为:
(1)按照所述信号-屏蔽比表,确定对应于最大标度因子频带的信号-屏蔽比,其中,所述最大标度因子频带的所述初始值是所述初始最大标度因子频带计算部件所计算出的所述初始最大标度因子频带;
(2)判断在所述步骤(1)所确定的所述信号-屏蔽比是否大于所述信号-屏蔽比阈值;
(2-1)如果在所述步骤(2)判断出所述信号-屏蔽比不大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递减一;
(3)重复所述步骤(1)至所述步骤(2-1),直到在所述步骤(2)判断出所述信号-屏蔽比大于所述信号-屏蔽比阈值;
(4)如果在所述步骤(2)判断出所述信号-屏蔽比大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递增一;
(5)判断在所述步骤(4)递增一的这种所述最大标度因子频带是否小于所述最小标度因子频带;
(6)如果在所述步骤(5)判断出所述最大标度因子频带小于所述最小标度因子频带,则将所述最小标度因子频带递增一,用这种递增了一的所述最小标度因子频带替代所述最大标度因子频带,并将这样替代过的所述最大标度因子频带输出到所述频谱处理部件;
(7)如果在所述步骤(5)判断出所述最大标度因子频带不小于所述最小标度因子频带,则将所述最大标度因子频带输出到所述频谱处理部件。
7.一种用于将音频信号划分成各自对应于要按照预定的心理声学模型进行编码的标度因子频带的多个音频信号分量的音频信号编码方法,包括步骤:
(A)在其中输入所述音频信号;
(B)判断在所述步骤(A)输入的所述音频信号是瞬态信号还是稳定信号,并且当判断出所述音频信号是瞬态信号时确定所述音频信号的一短长度帧,而在判断出所述音频信号是稳定信号时确定所述音频信号的一长长度帧;
(C)对在所述步骤(A)输入的所述音频信号执行快速富里叶分析、以生成关于所述音频信号的频率信息;
(D)输入编码模式信息;
(E)基于在所述步骤(C)生成的关于所述音频信号的所述频率信息,按照所述预定的心理声学模型,为所述音频信号计算信号-屏蔽比;
(F)存储最大标度因子频带信息和信号-屏蔽比阈值信息;
(G)基于在所述步骤(B)产生的结果和在所述步骤(D)中输入的所述编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为所述音频信号计算初始最大标度因子频带;
(H)基于在所述步骤(G)中计算的所述初始最大标度因子频带,按照在所述步骤(E)计算出的所述信号-屏蔽比信息,为所述音频信号计算最大标度因子频带;
(I)基于在所述步骤(E)计算出的信号-屏蔽比信息,将在所述步骤(A)中输入的所述音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,以及对直到对应于在所述步骤(H)计算出的所述最大标度因子频带的音频信号分量的所述音频信号分量执行频谱处理以产生音频信号数据;以及
(J)量化和编码在所述步骤(I)中生成的所述音频信号数据,以生成要输出的编码音频信号。
8.如权利要求7所述的音频信号编码方法,其中,所述编码模式信息包括比特率信息和取样信息,所述步骤(F)含有步骤:存储具有涉及比特率信息和取样信息的多个标度因子频带的初始最大标度因子频带信息,以及存储具有有关于比特率信息和取样信息的多个信号-屏蔽比阈值的信号-屏蔽比阈值信息,所述步骤(G)含有步骤:基于在所述步骤(B)产生的结果,和在所述步骤(D)输入的包括所述比特率信息和所述取样频率信息的所述编码模式信息,参考在所述步骤(F)存储的所述初始最大标度因子频带信息和信号-屏蔽比阈值信息,为所述音频信号计算初始最大标度因子频带,以及所述步骤(H)含有步骤:基于在所述步骤(E)中计算出的所述信号-屏蔽比信息和在所述步骤(G)中计算出的所述初始最大标度因子频带、为所述音频信号计算最大标度因子频带。
9.如权利要求8所述的音频信号编码方法,其中,所述编码模式信息还包括信道数,所述步骤(F)含有步骤:存储具有涉及信道数的多个标度因子频带的初始最大标度因子频带信息,以及存储具有涉及信道数的多个信号-屏蔽比阈值的信号-屏蔽比阈值信息,所述步骤(G)含有步骤:基于所述步骤(B)产生的结果,和在所述步骤(D)输入的包括信道数的所述编码模式信息,参考在所述步骤(F)存储的所述初始最大标度因子频带信息和信号-屏蔽比阈值信息,为所述音频信号计算初始最大标度因子频带,以及所述(H)含有步骤:基于在所述步骤(E)中计算出的所述信号-屏蔽比信息和在所述步骤(G)中计算出的所述初始最大标度因子频带、为所述音频信号计算最大标度因子频带。
10.如权利要求7所述的音频信号编码方法,其中,所述信号-屏蔽比阈值信息包括示出多个信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,所述步骤(F)含有步骤:存储所述初始最大标度因子频带信息以及所述信号-屏蔽比阈值信息,所述步骤(G)含有步骤:基于所述步骤(B)产生的结果和在所述步骤(D)输入的所述编码模式信息,参考在所述步骤(F)存储的所述初始最大标度因子频带信息和信号-屏蔽比阈值信息,为所述音频信号计算初始最大标度因子频带和信号-屏蔽比阈值,以及所述步骤(H)含有步骤:按照包含在由所述步骤(E)中计算出的所述信号-屏蔽比信息中的、示出信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,基于在所述步骤(G)计算出的所述初始最大标度因子频带和所述信号-屏蔽比阈值,为所述音频信号计算最大标度因子频带,所述步骤为:
(H-1)按照所述信号-屏蔽比表,确定对应于最大标度因子频带的信号-屏蔽比,其中所述最大标度因子频带的初始值就是在所述步骤(G)中计算的所述初始最大标度因子频带的信号-屏蔽比;
(H-2)判断在所述步骤(H-1)中确定的所述信号-屏蔽比是否大于所述信号-屏蔽比阈值;
(H-2-1)如果在所述步骤(H-2)判断出所确定的所述信号-屏蔽比不大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递减一,并返回所述步骤(H-1);
(H-3)重复所述步骤(H-1)至所述步骤(H-2-1),直到在所述步骤(H-2)判断出所确定的所述信号-屏蔽比大于所述信号-屏蔽比阈值;
(H-4)如果在所述步骤(H-2)判断出所述信号-屏蔽比大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递增一;以及
(H-5)将在所述步骤(H-4)递增一的这种所述最大标度因子频带输出到所述步骤(I)。
11.如权利要求7所阐述的音频信号编码方法,其中,所述步骤(F)含有步骤:存储初始最大标度因子频带信息以及能量阈值信息,所述步骤(G)含有步骤:基于所述步骤(B)产生的结果,和在所述步骤(D)输入的所述编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息和能量阈值信息,为所述音频信号计算初始最大标度因子频带,以及(H)含有步骤:基于在所述步骤(C)中生成的所述频率信息计算示出多个能量值与标度因子频带之间的关系的能量值表,并通过下列步骤基于在所述步骤(G)中计算出的所述初始最大标度因子频带和所述能量阈值,参考示出能量值与标度因子频带之间的关系的所述能量值表,为所述音频信号计算最大标度因子频带:
(H-1)按照所述能量表确定对应于最大标度因子频带的能量值,其中,所述最大标度因子频带的所述初始值是所述步骤(G)计算出的所述初始最大标度因子频带;
(H-2)判断在所述步骤(H-1)所确定的所述能量值是否大于所述能量阈值;
(H-2-1)如果在所述步骤(H-2)判断出所述能量值不大于所述能量阈值,则将所述最大标度因子频带递减一,并返回所述步骤(H-1);
(H-3)重复所述步骤(H-1)至所述步骤(H-2-1),直到在所述步骤(H-2)判断出所述能量值大于所述能量阈值;
(H-4)如果在所述步骤(H-2)判断出所述能量值大于所述能量阈值,则将所述最大标度因子频带递增一;和
(H-5)将在所述步骤(H-4)递增一的这种所述最大标度因子频带输出到所述步骤(I)。
12.如权利要求7所述的音频信号编码方法,其中,所述信号-屏蔽比阈值信息包括示出多个信号-屏蔽比与标度因子频带之间的关系的信号-屏蔽比表,所述步骤(F)含有步骤:存储初始最大标度因子频带信息、信号-屏蔽比阈值信息和最小标度因子频带信息,所述步骤(G)含有步骤:基于所述步骤(B)产生的结果和在所述步骤(D)输入的所述编码模式信息,参考在所述步骤(F)中存储的所述初始最大标度因子频带信息、所述信号-屏蔽比阈值信息和所述最小标度因子频带信息,为所述音频信号计算初始最大标度因子频带、信号-屏蔽比阈值和最小标度因子频带,以及所述步骤(H)含有步骤:基于在所述步骤(G)计算出的所述初始最大标度因子频带、所述信号-屏蔽比阈值和所述最小标度因子频带,按照包括在所述步骤(E)中计算的所述信号-屏蔽比信息中的表示信号屏蔽比和标度因子频带之间关系的所述信号-屏蔽比表,为所述音频信号计算最大标度因子频带,所述步骤为:
(H-1)按照所述信号-屏蔽比表,确定对应于最大标度因子频带的信号-屏蔽比,其中,所述最大标度因子频带的所述初始值是在所述步骤(G)中计算出的所述初始最大标度因子频带;
(H-2)判断在所述步骤(H-1)中确定的所述信号-屏蔽比是否大于所述信号-屏蔽比阈值;
(H-2-1)如果在所述步骤(H-2)判断出所述信号-屏蔽比不大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递减一;
(H-3)重复所述步骤(H-1)至所述步骤(H-2-1),直到在所述步骤(H-2)判断出所述信号-屏蔽比大于所述信号-屏蔽比阈值;
(H-4)如果在所述步骤(H-2)判断出所述信号-屏蔽比大于所述信号-屏蔽比阈值,则将所述最大标度因子频带递增一;
(H-5)判断在所述步骤(H-4)递增一的这种所述最大标度因子频带是否小于所述最小标度因子频带;
(H-6)如果在所述步骤(H-5)判断出所述最大标度因子频带小于所述最小标度因子频带,则将所述最小标度因子频带递增一,用这种递增了一的所述最小标度因子频带替代所述最大标度因子频带,并将这样替代过的所述最大标度因子频带输出到所述步骤(I);和
(H-7)如果在所述步骤(H-5)判断出所述最大标度因子频带不小于所述最小标度因子频带,则将所述最大标度因子频带输出到所述步骤(I)。
13.一种音频信号编码设备,用于将音频信号划分成各自对应于要按照预定的心理声学模型编码的标度因子频带的多个音频信号分量,它包括:
计算机可用存储介质,其具有其中包含的计算机可读代码;和
音频信号编码单元;
所述音频信号编码单元包括:
输入部件,用于在其中输入所述音频信号;
帧长度确定部件,用于判断从所述输入部件输入的该音频信号是瞬态信号还是稳定信号,并在该音频信号被判断为瞬态信号时确定该音频信号的短长度帧而在该音频信号被判断为稳定信号时确定该音频信号的长度帧;
FFT分析部件,用于对从所述输入部件输入的所述音频信号执行快速富里叶变换、以生成关于该音频信号的频率信息;
编码模式信息输入部件,用于输入编码模式信息;
心理声学模型分析部件,用于按照所述预定心理声学模型,基于关于由所述FFT分析部件所生成的所述音频信号的所述频率信息,为该音频信号计算信号-屏蔽比信息;
最大标度因子频带表存储部件,用于存储初始最大标度因子频带信息和信号-屏蔽比阈值信息;
初始最大标度因子频带计算部件,用于基于所述帧长度确定部件产生的结果和从所述编码模式信息部件输入的所述编码模式信息,参考存储在所述最大标度因子频带表存储部件中的所述初始最大标度因子频带信息和所述信号-屏蔽比阈值信息,为该音频信号计算初始最大标度因子频带;
最大标度因子频带计算部件,用于基于由所述初始最大标度因子频带计算部件计算出的所述初始最大标度因子频带,按照由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息,为该音频信号计算最大标度因子频带;
频谱处理部件,用于基于由所述心理声学模型分析部件计算出的所述信号-屏蔽比信息,将从所述输入部件输入的所述音频信号划分成每个都对应于一标度因子频带的多个音频信号分量,以及对直到对应于由该最大标度因子频带计算部件计算出的所述最大标度因子频带的一音频信号分量的所述各音频信号分量执行频谱处理以产生音频信号数据;以及
量化与编码部件,用于量化和编码由所述频谱处理部件生成的该音频信号数据,以生成要通过其输出的编码音频信号,
借此,所述最大标度因子频带计算部件响应在其中输入的所述音频信号自适应地计算所述最大标度因子频带,和
所述计算机可读代码可由所述音频编码单元执行,以把音频信号划分成各自对应于要按照预定的心理声学模型编码的标度因子频带的多个音频信号分量。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000391855A JP2002196792A (ja) | 2000-12-25 | 2000-12-25 | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
JP391855/00 | 2000-12-25 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1361594A CN1361594A (zh) | 2002-07-31 |
CN1310431C true CN1310431C (zh) | 2007-04-11 |
Family
ID=18857937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB011338172A Expired - Fee Related CN1310431C (zh) | 2000-12-25 | 2001-12-21 | 用于编码音频信号的设备和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US6915255B2 (zh) |
EP (1) | EP1220203B1 (zh) |
JP (1) | JP2002196792A (zh) |
CN (1) | CN1310431C (zh) |
DE (1) | DE60106717T2 (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR0305555A (pt) * | 2002-07-16 | 2004-09-28 | Koninkl Philips Electronics Nv | Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado |
KR100477699B1 (ko) * | 2003-01-15 | 2005-03-18 | 삼성전자주식회사 | 양자화 잡음 분포 조절 방법 및 장치 |
US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
CN100339886C (zh) * | 2003-04-10 | 2007-09-26 | 联发科技股份有限公司 | 可以检测声音信号的暂态位置的编码器及编码方法 |
US7983909B2 (en) * | 2003-09-15 | 2011-07-19 | Intel Corporation | Method and apparatus for encoding audio data |
KR20050028193A (ko) * | 2003-09-17 | 2005-03-22 | 삼성전자주식회사 | 오디오 신호에 적응적으로 부가 정보를 삽입하기 위한방법, 오디오 신호에 삽입된 부가 정보의 재생 방법, 및그 장치와 이를 구현하기 위한 프로그램이 기록된 기록 매체 |
JP4168976B2 (ja) * | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
KR100682890B1 (ko) | 2004-09-08 | 2007-02-15 | 삼성전자주식회사 | 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치 |
EP1793372B1 (en) * | 2004-10-26 | 2011-12-14 | Panasonic Corporation | Speech encoding apparatus and speech encoding method |
DE102004059979B4 (de) * | 2004-12-13 | 2007-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Berechnung einer Signalenergie eines Informationssignals |
KR100851970B1 (ko) * | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US8204740B2 (en) * | 2006-02-06 | 2012-06-19 | Telefonaktiebolaget Lm Ericsson (Publ) | Variable frame offset coding |
US7966175B2 (en) * | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
US7953595B2 (en) * | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
US9031851B2 (en) * | 2007-09-20 | 2015-05-12 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
KR101479011B1 (ko) * | 2008-12-17 | 2015-01-13 | 삼성전자주식회사 | 다중 대역 스케쥴링 방법 및 이를 이용한 방송 서비스 시스템 |
US8311843B2 (en) * | 2009-08-24 | 2012-11-13 | Sling Media Pvt. Ltd. | Frequency band scale factor determination in audio encoding based upon frequency band signal energy |
US8386266B2 (en) * | 2010-07-01 | 2013-02-26 | Polycom, Inc. | Full-band scalable audio codec |
CN102831656B (zh) * | 2012-06-13 | 2017-05-24 | 中国计量大学 | 高速公路超速摄像监控系统兼顾自动计费刷卡缴费的方法 |
EP2943954B1 (en) * | 2013-01-08 | 2018-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Improving speech intelligibility in background noise by speech-intelligibility-dependent amplification |
US10460727B2 (en) * | 2017-03-03 | 2019-10-29 | Microsoft Technology Licensing, Llc | Multi-talker speech recognizer |
CN110265046B (zh) * | 2019-07-25 | 2024-05-17 | 腾讯科技(深圳)有限公司 | 一种编码参数调控方法、装置、设备及存储介质 |
CN111933162B (zh) * | 2020-08-08 | 2024-03-26 | 北京百瑞互联技术股份有限公司 | 一种优化lc3编码器残差编码和噪声估计编码的方法 |
CN112599139B (zh) | 2020-12-24 | 2023-11-24 | 维沃移动通信有限公司 | 编码方法、装置、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5649053A (en) * | 1993-10-30 | 1997-07-15 | Samsung Electronics Co., Ltd. | Method for encoding audio signals |
EP0918401A2 (en) * | 1997-11-20 | 1999-05-26 | Samsung Electronics Co., Ltd. | Scalable audio encoding/decoding method and apparatus |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5764698A (en) * | 1993-12-30 | 1998-06-09 | International Business Machines Corporation | Method and apparatus for efficient compression of high quality digital audio |
JP2778482B2 (ja) * | 1994-09-26 | 1998-07-23 | 日本電気株式会社 | 帯域分割符号化装置 |
EP0837608B1 (en) * | 1996-10-15 | 2005-12-28 | Matsushita Electric Industrial Co., Ltd. | Video and audio coding method and coding apparatus |
EP0966109B1 (en) * | 1998-06-15 | 2005-04-27 | Matsushita Electric Industrial Co., Ltd. | Audio coding method and audio coding apparatus |
JP3515903B2 (ja) * | 1998-06-16 | 2004-04-05 | 松下電器産業株式会社 | オーディオ符号化のための動的ビット割り当て方法及び装置 |
JP2000134105A (ja) * | 1998-10-29 | 2000-05-12 | Matsushita Electric Ind Co Ltd | オーディオ変換符号化に用いられるブロックサイズを決定し適応させる方法 |
JP4242516B2 (ja) * | 1999-07-26 | 2009-03-25 | パナソニック株式会社 | サブバンド符号化方式 |
JP4287545B2 (ja) * | 1999-07-26 | 2009-07-01 | パナソニック株式会社 | サブバンド符号化方式 |
US6678653B1 (en) * | 1999-09-07 | 2004-01-13 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for coding audio data at high speed using precision information |
JP2001094433A (ja) * | 1999-09-17 | 2001-04-06 | Matsushita Electric Ind Co Ltd | サブバンド符号化・復号方法 |
JP3639216B2 (ja) * | 2001-02-27 | 2005-04-20 | 三菱電機株式会社 | 音響信号符号化装置 |
-
2000
- 2000-12-25 JP JP2000391855A patent/JP2002196792A/ja not_active Withdrawn
-
2001
- 2001-12-06 DE DE60106717T patent/DE60106717T2/de not_active Expired - Fee Related
- 2001-12-06 EP EP01128475A patent/EP1220203B1/en not_active Expired - Lifetime
- 2001-12-21 CN CNB011338172A patent/CN1310431C/zh not_active Expired - Fee Related
- 2001-12-21 US US10/036,718 patent/US6915255B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5649053A (en) * | 1993-10-30 | 1997-07-15 | Samsung Electronics Co., Ltd. | Method for encoding audio signals |
EP0918401A2 (en) * | 1997-11-20 | 1999-05-26 | Samsung Electronics Co., Ltd. | Scalable audio encoding/decoding method and apparatus |
Also Published As
Publication number | Publication date |
---|---|
US20020116179A1 (en) | 2002-08-22 |
US6915255B2 (en) | 2005-07-05 |
CN1361594A (zh) | 2002-07-31 |
EP1220203A3 (en) | 2003-09-10 |
DE60106717D1 (de) | 2004-12-02 |
EP1220203B1 (en) | 2004-10-27 |
DE60106717T2 (de) | 2005-12-22 |
EP1220203A2 (en) | 2002-07-03 |
JP2002196792A (ja) | 2002-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1310431C (zh) | 用于编码音频信号的设备和方法 | |
CN1288622C (zh) | 编码设备和解码设备 | |
CN1288625C (zh) | 音频编码与解码设备及其方法 | |
CN1146203C (zh) | 用于音频编码的动态位分配装置和方法 | |
CN101048649A (zh) | 可扩展解码装置及可扩展编码装置 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1131598C (zh) | 可缩放的音频编码/解码方法和装置 | |
CN1172294C (zh) | 音频编码装置、音频编码方法、音频解码装置及音频解码方法 | |
CN1277180C (zh) | 用于适应音频信号的装置和方法 | |
CN1702974A (zh) | 用于对数字信号编码/解码的方法和设备 | |
CN1871501A (zh) | 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法 | |
CN1689069A (zh) | 声音编码设备和声音编码方法 | |
CN1669074A (zh) | 话音增强装置 | |
CN1606687A (zh) | 音频解码设备和方法 | |
CN1185625C (zh) | 语音编码方法及语音编码装置 | |
CN1910657A (zh) | 声频信号编码方法、声频信号解码方法、发送器、接收器和无线传声系统 | |
CN101048814A (zh) | 编码装置、解码装置、编码方法及解码方法 | |
CN1247415A (zh) | 声音编码方式、声音编码装置、以及数据记录媒体 | |
CN1281576A (zh) | 声音信号加工方法和声音信号加工装置 | |
CN1957399A (zh) | 语音/音频解码装置以及语音/音频解码方法 | |
CN1765072A (zh) | 多声道音频扩展支持 | |
CN101076853A (zh) | 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法 | |
CN1151491C (zh) | 音频编码装置和音频编码译码装置 | |
CN1223991C (zh) | 声频信号处理设备及方法 | |
CN1488135A (zh) | 线性预测编码参数的矢量量化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070411 Termination date: 20131221 |