CN1711588A - 音乐信息编码设备及方法和音乐信息解码设备及方法 - Google Patents
音乐信息编码设备及方法和音乐信息解码设备及方法 Download PDFInfo
- Publication number
- CN1711588A CN1711588A CN200380102961.3A CN200380102961A CN1711588A CN 1711588 A CN1711588 A CN 1711588A CN 200380102961 A CN200380102961 A CN 200380102961A CN 1711588 A CN1711588 A CN 1711588A
- Authority
- CN
- China
- Prior art keywords
- white noise
- frequency
- noise component
- index
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 36
- 230000005236 sound signal Effects 0.000 claims abstract description 50
- 230000009466 transformation Effects 0.000 claims description 21
- 238000010606 normalization Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 10
- 238000001228 spectrum Methods 0.000 description 12
- 238000013139 quantization Methods 0.000 description 7
- 238000011002 quantification Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 206010038743 Restlessness Diseases 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 235000020280 flat white Nutrition 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
在音乐信息编码设备中,当对包含白噪声分量的音频信号进行编码时,代码序列包含指示白噪声分量的能量水平的指数iL和指定随机数表的起始指数的指数iR。在音乐信息解码设备(20)中,白噪声产生单元(25)使用在代码序列C中包含的指数iL和iR,在时间轴产生与上述白噪声相同水平的白噪声信号Sw(t),并且加法器(26)将在时间轴的解码的声音信号Sf(t)相加,并将输出音乐信号So(t)输出。
Description
技术领域
本发明涉及一种音频信息编码设备和一种音频信息编码方法,都用于对含有白噪声分量的音频信息进行编码、一种存储由音频信息编码设备和方法产生的代码序列的记录介质、一种音频信息解码设备和一种音频信息解码方法,都用于对由音频信息编码设备和方法产生的代码序列进行解码、一种使计算机执行所述音频信息的编码或解码处理的程序。
本申请要求于2002年11月13日提交的申请号为2002-330024的日本专利申请的优先权,在此引入该申请公开的全部内容以作参考。
背景技术
为了编码输入的音频信号,迄今将音频信号在时间轴分割成每个有预定时间段(帧)的块。对帧逐个地进行修改的离散余弦变换(modified discretecosine transformation,MDCT)。因此时间序列信号变换为在频率轴的谱信号。(进行所谓的“谱变换”)。从而编码音频信号。
为了编码谱信号,分配比特给每一个通过对与一个帧相对应的时间序列信号执行谱变换得来的谱信号。也就是执行了指定的比特分配或者适应的比特分配。比如,为了编码MDCT处理产生的系数数据可以执行比特分配。在这种情况下,将适当数量的比特分配给通过对每一个块的时间轴信号执行MDCT处理而获得的MDCT系数数据。
关于比特分配的详细描述有,比如:R.Zelinski和P.Noll的“AdaptiveTransform Coding of Speech Signals(语言信号的适应性变换编码)”,IEEE(Institute of Electrical and Electronics Engineers,电气与电子工程师协会)Transaction of Accoustics,Speech and Signal Processing,Vol.ASSP-25,1977年8月,和麻省理工学院M.A.Kransner的“The Critical Band Coder DigitalEncoding of the Perceptual Requirements of the Audiotory System(声音系统的感性要求的关键频带编码器数字编码)”,ICASSP 1980。
任何输入到编码设备里的音频信号都包括诸如乐器和人的话音的声音的各种分量。即使麦克风只记录话音和钢琴声音,结果的信号也不会只表现为话音或钢琴声音。所述信号常常包含背景噪声,即,在使用记录设备时产生的声音,以及记录设备产生的电子噪声。
与话音和钢琴声音一样,对于编码设备这些噪声不过是线性波形信息。上述设备同样会对噪声分量执行频率编码。从波形再现性的角度来说这是正确的方法。但是从人的听觉特征角度来说这不能称为是有效的编码方法。
因此可以执行基于心理听觉模型的比特分配。这就是,对比人听不见任何东西的最低可听到水平更小的,或者比编码设备中任意设置的最小编码阈值更小的任何频率分量不进行比特分配。
图1示出了执行如上所述的这样的比特分配的传统编码设备的构造。在编码设备100中,如图1所示时间到频率变换单元101将输入音频信号Si(t)变换为谱信号F(f)。该谱信号提供给比特分配频带决定单元102。比特分配频带决定单元102分析谱信号F(f)。之后它将所述谱信号分成频率分量F(f0)和频率分量F(f1)。频率分量F(f0)处在相等或高于最低可听到水平的水平,或者在相等或高于最小编码阈值的水平,而且会经历比特分配。频率分量F(f1)不会经历比特分配。只有频率分量F(f0)被提供给规格化/量化(normalization/quantization)单元103。由此频率分量F(f1)被丢弃。
规格化/量化单元103对频率分量F(f0)进行规格化和量化,产生量化值Fq。该值Fq提供给编码单元104。编码单元104对量化值Fq编码而产生码序列C。记录/传输单元105将码序列C记录在记录介质(未示出)或者将码序列作为比特流BS来传输。
编码设备100产生的码序列C可以有如图2所示的这种格式。如图2所示,码序列C包含头部H、规格化信息SF、量化精度信息WL、和频率信息SP。
图3示出可以与编码设备100组和使用的解码设备的构造。如图3所示,在解码设备120中,接收/读取单元122将从编码设备100或记录介质(未示出)接收的比特流BS恢复成码序列C。码序列C提供给解码单元122。解码单元122将码序列C解码,生成量化值Fq。反规格化/反量化单元123对量化值Fq执行反规格化和反量化,从而产生频率分量F(f0)。频率到时间变换单元124将频率分量F(f0)变换为输出音频信号So(t)。输出音频信号So(t)从解码设备120输出。
图4示出对在所有帧里任何比最低可听到水平A更低水平的频率分量都不进行比特分配的情况。如图4所示,只有0.60f或更低的频率分量在第(n-1)帧编码,所有上至1.00f的频率分量在第n帧编码,并且只有0.55f或更低的频率分量在第(n+1)帧编码。结果特定频率的分量包含在某帧里,并且在其他中没有。但是对所有帧,码序列等同于包含所有频率分量,因为没有包含在码序列中的频率分量对人是完全听不见的。这样从码序列再现的音乐不会使听众感觉到任何心理上的听觉奇异。
当对所有等于或高于最低可听到水平的水平的频率分量进行编码时,也编码了那些并不重要的分量或不应当听到的白噪声。因此编码并不有效。假设频率分量以固定比特率编码,那么同样数量的比特分配给每一帧。因此如果比特率太低,某些帧可能不能具有某些比特,并且所述某些帧不能大到足够再现具有满意的质量的声音。
图5示出对任何具有比为每一帧设置的最低编码阈值a更小值的频率分量都不进行比特分配的情况。如图5所示,编码设备为第(n-1)帧设置最小编码阈值a(n-1)。该值a(n-1)视作对声音质量没有影响,即使它没有记录在第(n-1)帧中也如此。这是因为任何具有比这个值更低的频率的分量对声音质量并不重要。结果只有0.60f或更低的频率分量在第(n-1)帧中被编码。
如果在所有帧中没有编码的频率分量有相同的值,认为所有编码的频率分量等同于在经过低通滤波器之后编码的分量。从而可以认为在某些情况下频带变窄了。但是在考虑原来的频率分布和人的听觉特性时,这种变窄的频带的景象并不会有问题。
但是下面的帧,即第n帧,相对于第(n-1)帧具有小的能量和更多的频率分量没有编码。在具有大的能量的第(n+1)帧中,编码所有频率分量因为编码设备确定对于听觉感觉它们非常重要。
如果对于各个帧,包含在码序列中的频率分量非常不同,当它们再现的时候他们会破坏帧的连续性。可以通过明显的噪声来感觉他们。这种噪声与FM(调频)广播的、由于无线电波变化的情况而随时间变化的背景噪声类似。结果听众感觉到音乐包含特定的噪声,不可避免地感觉心理的听觉奇异。
在此,本申请人提交的日本专利申请公开第8-166799号介绍了一种防止噪音产生的技术。在这种技术中,记录和存储了已经对在前帧进行比特分配的带宽。决定了将对现在帧进行比特分配的带宽,并没有与那个带宽非常不同。这控制了再现频带的变化并且最终防止了噪声的产生。
在日本专利申请公开第8-166799号中披露的技术确实有助于稳定再现频带。但是,它不能够完全地解决听觉问题,因为它允许再现频带的波动。
为了稳定再现频带,可以记录固有地落入频带内的不必要的频率分量,或者可以不记录固有地落入频带内的必要的频率分量。从编码效率的角度来说,两者都不是想要的。
对于几个帧或者几十个帧,可以分析所有频率,并且应该进行比特分配的相同频率可以应用到所有的帧。但是从实时处理要求和合并在公共使用硬件中的存储器和处理器的成本的角度看,这种方法并不实用。而且这种方法似乎不增加编码效率。
发明内容
根据上述观点作出本发明。本发明的一个目的是提供一种音频信息编码设备和一种音频信息编码方法,两者有效地编码包含白噪声分量的音频信息并且能防止噪声的产生,即使再现频带从帧到帧变化,也如此。本发明的另一目的是提供一种存储由音频信息编码设备和方法产生的代码序列的记录介质。本发明的再一目的是提供一种音频信息解码设备和一种音频信息解码方法,两者解码由音频信息编码设备和方法产生的代码序列。本发明的再一目的是提供使计算机执行所述音频信息的编码或解码处理的程序。
为了达到上述的第一个目的,根据本发明,音频信息编码设备和音频信息编码方法将音频信号在时间轴分割成每个有预定时间段的块,对每一个块进行频率变换和编码,从而编码音频信号。为了编码音频信号,分析包含于音频信号中的白噪声分量,并且编码指示分析的白噪声分量的能量水平的指数。
可以根据块的高频带部分的能量分布,或者根据整个块的能量分布分析白噪声分量。
进一步,可以编码用于在解码端产生白噪声分量的随机数表的指数。
为了达到上述的第二个目的,根据本发明的记录介质存储代码序列。通过将音频信号在时间轴分割成每个有预定时间段的块、并且对每一个块进行频率变换和编码,从而编码音频信号、以及通过分析包含于音频信号中的白噪声、并且通过编码指示白噪声分量的能量水平的指数,而产生代码序列。
为了达到上述的第三个目的,根据本发明,音频信息解码设备和音频信息解码方法解码所编码的频率信号并且对所述信号进行反频率变换,从而产生时间轴的音频信号。在产生音频信号的过程中,根据指示编码的白噪声分量的能量水平的指数而产生在时间轴的白噪声分量,并且将通过反频率变换方式在时间轴产生的音频信号加入到时间轴的白噪声分量中。
根据随机数表的编码的指数可以产生白噪声分量。或者,根据包含在代码序列中的特定值可以产生白噪声分量。
在音频信息编码设备和方法以及音频信息解码设备和方法中,当编码了包含白噪声分量的音频信号时,在编码端白噪声分量的能量水平指数加入到代码序列中,在解码端产生与白噪声分量同样水平的白噪声,并且上述白噪声加入到时间轴的解码的音频信号中。
根据本发明的程序使计算机执行上述的音频信息编码处理或上述的音频信息解码处理。
本发明的其他目的以及本发明带来的优点通过下面的实施例具体地进行说明。
附图说明
图1示出了传统编码设备的构造简图;
图2示出了编码设备产生的代码序列示例;
图3示出了传统解码设备的构造简图;
图4示出了编码设备对任何处于比最低可听到水平更低的水平的频率分量不执行比特分配的情况;
图5示出了编码设备对任何具有比最小编码阈值更小的值的频率分量不执行比特分配的情况;
图6示出了在编码端每一帧的最小编码阈值和白噪声水平;
图7示出了在解码端产生的白噪声的示例;
图8示出了根据本发明实施例的音频信息编码设备的构造图;
图9示出了用于产生指数iL的白噪声水平表的示例;
图10示出了用于产生指数iR的随机指数表的示例;
图11示出了音频信息编码设备产生的代码序列的示例;
图12示出了根据本发明实施例的音频信息解码设备的构造图。
具体实施方式
以下,参照附图来详细说明本发明的实施例。所述实施例包括:音频信息编码设备和音频信息编码方法,两者有效地对包含白噪声分量的音频信息进行编码并且防止因为随时间的再现频带的波动而产生的噪声;以及音频信息解码设备和音频信息解码方法,两者将音频信息编码设备和方法产生的代码序列解码。首先,介绍音频信息编码方法以及音频信息解码方法的原理。之后,介绍音频信息编码设备以及音频信息解码设备的构造。
在根据本发明实施例的音频信息编码方法中,音频信号输入在时间轴分割成每个有预定时间段(帧)的块。帧逐个地经历修改的离散余弦变换(MDCT)。因此时间轴的时间序列信号变换为在频率轴的谱信号。(进行所谓的“谱变换”)。为了有效地编码信号,考虑到人的听觉特性,对小于最小编码阈值a的任何频率分量不进行比特分配,所述最小编码阈值a能够通过基于心理的听觉模型的比特分配而对每一帧设置。
如图6所述,为第(n-1)帧设置最小编码阈值a(n-1)。如果最小编码阈值a(n-1)不在第(n-1)帧中记录,则认为它不影响声音质量。这是因为任何含有比这个值更低的频率的分量对于声音质量并不重要。结果只对在第(n-1)帧中0.60f或更低的频率分量进行比特分配。
在下面帧中,即,第n帧,将最小编码阈值a设置在a(n)水平上,并且只对0.50f或更低的频率分量进行比特分配。
在第(n+1)帧中,将最小编码阈值a设置在a(n+1)水平上,并且只对所有上至0.10f的频率分量进行比特分配。
可以不丢弃并且不在代码序列中包含任何具有比最小编码阈值a更小的值的频率分量。在这种情况下,当再现频率分量时,再现频带随着帧而变化。结果不再保持帧的连续性。这让听众感觉到心理的听觉奇异。
为了防止这种情况发生,在本实施例中分析任何具有比最小编码阈值a更小的高频带频率分量中的白噪声分量。从而,在代码序列中包含通过量化区域的平均能量水平获得的满足下列条件的指数:
(a)其能量分布足够小并且平坦;
(b)其频率分量含有噪声。
区域频率分布可以平坦,并且在区域中,最高频率fmax相对于平均频率fave之比(fmax/fave)可以等于或小于3.0。在这种情况下,在这个区域的频率分量没有周期性并且包含噪声,正如试验证明的。
在图6所示的情况中,对第(n-1)帧、第n帧和第(n+1)帧,分别进行在高频带上都匹配平坦频率能量水平的每一个白噪声水平b(n-1)、b(n)和b(n+1)的检测。白噪声水平变成指数并且添加到代码序列中。
在根据本发明实施例的音频信息解码方法中,代码序列中的频率分量经历反谱变换而被解码。另外,产生具有由指数指示的能量水平的白噪声。
结果,如图7所示,在代码序列中包含的再现的频率分量的频带随着帧而变化。不用说,由于根据白噪声产生了伪高频分量,所以能有效地降低心理上的听觉怪异。
在不应该加入到编码端的代码序列中的任何频率分量的能量水平以及在解码端产生的白噪声的能量水平之间存在距离。该距离不会不利地影响听众部分的听觉感知,因为听觉奇异主要从某频带完全停止存在的事实来产生。
图8示出根据本实施例的执行上述处理的音频信息编码设备的构造。在图8所示的音频信息编码设备10中,时间到频率转换单元11将输入音频信号Si(t)转换成谱信号F(f)。谱信号F(f)提供给比特分配频带决定单元12。
比特分配频带决定单元12分析谱信号F(f)。之后它将所述谱信号分成频率分量F(f0)和频率分量F(f1)。频率分量F(f0)具有等于或大于最小编码阈值a的值,并且经历比特分配。频率分量F(f1)不进行比特分配。只有频率分量F(F0)提供给规格化/量化单元13。频率分量F(f1)提供给白噪声水平决定单元14。
规格化/量化单元13对频率分量F(f0)进行规格化和量化,产生量化的值Fq。值Fq提供给编码单元15。
白噪声水平决定单元14分析从频率分量F(f1)提取的白噪声分量,产生指数iL。通过量化白噪声水平获得的指数iL指示区域的平均能量水平,其满足上述条件。如果使用3比特代表指数iL,用于产生指数iL的白噪声水平表是图9中示出的类型的。在这个示例中,如果白噪声水平大约是8db,那么指数iL为3。
白噪声水平决定单元14也产生指数iR。指数iR指定必须用于在解码端产生白噪声的随机数表的起始指数iRT。指数iR可以用三比特表示。在这种情况下,用于产生指数iR的随机数指数表是在图10中示出的类型的。
编码单元15将从规格化/量化单元13来的量化的值Fq以及从白噪声水平决定单元14来的指数iL和iR编码。单元15产生代码序列C。记录/传输单元16在记录介质(未示出)上记录代码序列C或者将代码序列作为比特流BS传输。
编码设备10产生的代码序列C具有入图11所示的格式。如图11所示,代码序列C不仅包括头部H、规格化信息SF、量化精度信息WL和频率信息SP,还包括白噪声标记FL和白噪声信息WN。白噪声信息WN包括指数iL和iR。如果白噪声标记FL为“1”,那么代码序列C包含白噪声信息WN。如果白噪声标记FL为“0”,那么代码序列C不包含白噪声信息WN。在这种情况下,溢出比特用于编码频率分量F(f0)中。
可以不设置白噪声标记FL,在帧中的所有频率可以有等于或大于最小编码阈值a的值。在这种情况下,代码序列C可以包含前面帧的指数iL和iR。
图12示出可以与编码设备10组合使用的解码设备的构造。如图12所示的,在解码设备20中,接收/读取单元12将从编码设备10或者从记录介质(未示出)接收的比特流BS恢复成代码序列C。代码序列C提供给解码单元22。
解码单元22将代码序列C解码,产生量化的值Fq、指数iL和指数iR。量化的值Fq提供给反量化/反规格化单元23,指数iL和iR提供给白噪声产生单元25。
反量化/反规格化单元23对量化的值Fq进行反量化和反规格化,产生频率分量F(f0)。频率分量F(f0)提供给频率到时间变换单元24。
频率到时间变换单元24将频率分量F(f0)变换成时间轴的音频信号Sf(t)。音频信号Sf(t)提供给加法器26。
白噪声产生单元25根据下面等式从指数iL和iR产生白噪声信号Sw(t)。白噪声信号Sw(t)是对应于频率分量F(f1)的时间系列信号。信号Sw(t)提供给加法器26。
Sw(t)=LEV(iL)*RND(iRT+t) ……(1)
其中LEV(iL)是使用iL为参数的白噪声水平表LEV()的值。RND(iRT+t)是随机数表RND()的值,其使用通过将频率分量数t与指数iR在随机数表中指定的起始指数iRT相加而获得的值作为参数。将随机数表RND()的值规格化于,比如-1.0到1.0。
如此,从包含在代码序列C中的指数iR产生随机数表的开始指数iRT。从而能防止每次产生不同的白噪声。
在随机数表RND()中,iRT+t的值可以超过阵列元素的数量,Nrnd。如果是这种情况,通过从iRT+t的值中减去数量Nrnd获得的值被用作随机数表RND()的参数。就是说,iRT+t应该是0到Nrnd。
在这个实施例中,从包含在代码序列C中的指数iR产生随机数表的起始指数iRT。作为替代的,可以不在编码端产生指数iR,并且可以从通过在代码序列中加入特定的值而获得的值来产生起始指数iRT,比如对于一个帧,所有的规格化信息SF和所有的量化精度信息WL。在这种情况下,防止每次产生不同的白噪声也是可能的。
在每次允许产生不同的白噪声的情况下,在解码端可以产生随机数,从而产生起始指数iRT。
加法器26将从频率到时间变换单元24来的音频信号Sf(t)和从白噪声产生单元25来的白噪声信号Sw(t)在时间轴相加并且作为输出音频信号So(t)输出。
对应于白噪声信号Sw(t)的频率分量Fw和频率分量F(f0)可以在频率轴相加,并且所得分量可以经历时间到频率变换,从而产生输出音频信号So(t)。但是在与防止预回声(pre-echo)的增益控制/补偿处理组合使用时,或者象在比如日本专利申请公开第7-221648号中、日本专利申请公开第7-221649号中所述的情况或类似的情况下,这种方法会出现问题。虽然对应于白噪声信号Sw(t)的噪声分量Fw在频率轴被相加,其后在增益补偿电路里在时间轴的增益发生变化。结果没有产生白噪声信号。这就是在时间轴产生白噪声信号的原因。
如上所述,根据本实施例,在音频信息编码设备10和音频信息解码设备20中,为了编码包含白噪声分量的输入音频信息,两者都在编码端对所有的白噪声频率分量不进行编码。而是把白噪声水平的指数iL和随机数指数表中的指数iR包含在代码序列C中。这样在解码端,可产生与输入音频信号的白噪声有相同水平的白噪声,从而进行有效地编码。此外,即使再现频带随着帧而波动,还是能防止噪声产生。
本发明不仅限于参考于附图所描述的上述实施例。对于本专业的任何技术人员,在不脱离本发明的范围和精髓的情况下,明显地可以进行各种变形、替换或等价改动。
比如,上述每一个实施例都是硬件构成。但是,可以使用中央处理单元(CPU)执行计算机程序来进行任何的处理。在这种情况下,可以提供储存在记录介质上的,或者通过比如互联网的传输介质传输而来的计算机程序。
在上述实施例中,每一帧的音频信号包含白噪声。但是,本发明可以用于帧只由白噪声组成的情况。在这种情况下,分析每一帧的频率分量,并且通过量化满足下面条件的帧的平均能量水平获得的指数iL、或者随机数指数表中的指数iR包含在代码序列C中。
(c)在整个频带的能量分布足够小(±6dB,更多或更少);
(d)频率分量在整个频带包含噪声。
白噪声能够表示为“频率分量”和“白噪声水平的指数iL和随机数指数表的指数iR”的和。这样,频率分量顺序经历比特分配,第一个是最大能量的分量,然后是第二大能量的分量,等等。从而,可以保证要求的最低波形再现性,并且小能量的任何频率分量可以通过白噪声水平指数iL和随机数指数表指数iR进行替换。这不仅能够增强波形再现性,而且能够增强编码效率。如果比特速率足够高并且要求高波形再现性,许多比特可以分配给“频率分量”。如果比特速率非常低,“白噪声水平的指数iL和随机数指数表的指数iR”用于完成低速率编码。
产业上的可利用性
如上所述,即使再现频带随块而波动,本发明也可以有效地对包含白噪声分量的音频信号进行编码,并且防止噪音产生。这是因为白噪声分量的能量水平指数在编码端被加在代码序列中,在解码端产生与上述白噪声相同水平的白噪声,并且所述产生的白噪声在时间轴加入到解码的音频信号中。
Claims (18)
1、一种音频信息编码设备,所述音频信息编码设备将音频信号在时间轴分割成每个有预定时间段的块,并且频率变换和编码每一个块,所述设备包括:
白噪声分析装置,所述白噪声分析装置用于分析包含在音频信号中的白噪声分量;
白噪声编码装置,所述白噪声编码装置对指示由所述白噪声分析装置分析的白噪声分量的能量水平的指数进行编码。
2、根据权利要求1所述的音频信息编码设备,其中所述白噪声分析装置根据所述块的高频带部分的能量分布分析白噪声分量。
3、根据权利要求1所述的音频信息编码设备,其中所述白噪声分析装置根据整个块的能量分布分析白噪声分量。
4、根据权利要求1所述的音频信息编码设备,其中白噪声编码装置进一步对用于在解码端产生白噪声分量的随机数表的指数进行编码。
5、根据权利要求1所述的音频信息编码设备,进一步包括控制在时间轴的音频信号增益的增益控制装置。
6、一种音频信息编码方法,所述音频信息编码方法将音频信号在时间轴分割成每个有预定时间段的块,并且频率变换和编码每一个块,所述方法包括:
白噪声分析步骤,所述白噪声分析步骤用于分析包含在音频信号中的白噪声分量;
白噪声编码步骤,所述白噪声编码步骤对指示由所述白噪声分析步骤分析的白噪声分量的能量水平的指数进行编码。
7、根据权利要求6所述的音频信息编码方法,其中在所述白噪声编码步骤中进一步对用于在解码端产生白噪声分量的随机数表的指数进行编码。
8、一种使计算机执行音频信息编码处理的程序,将音频信号在时间轴分割成每个有预定时间段的块,并且频率变换和编码每一个块,该程序有:
白噪声分析步骤,所述白噪声分析步骤用于分析包含在音频信号中的白噪声分量;
白噪声编码步骤,所述白噪声编码步骤对指示由所述白噪声分析步骤分析的白噪声分量的能量水平的指数进行编码。
9、根据权利要求8所述的程序,其中在白噪声编码步骤中进一步编码用于在解码端产生白噪声分量的随机数表的指数。
10、一种记录介质,所述记录介质存储通过将音频信号在时间轴分割成每个有预定时间段的块、并且频率变换和编码每一个块、和通过分析包含在音频信号中的白噪声分量、和通过将指示白噪声分量的能量水平的指数进行编码而产生的代码序列。
11、根据权利要求10所述的记录介质,其中所述代码序列包括用于在解码端产生白噪声分量的随机数表的被编码的指数。
12、一种音频信息解码设备,所述音频信息解码设备用于解码所编码的频率信号、反频率变换所述解码的频率信号,从而在时间轴产生音频信号,所述设备包括:
白噪声产生装置,所述白噪声产生装置根据指示白噪声分量的能量水平的编码的指数在时间轴产生白噪声分量;
相加装置,所述相加装置将通过反频率变换在时间轴产生的音频信号与时间轴的白噪声分量相加。
13、根据权利要求12所述的音频信息解码设备,其中所述白噪声产生装置根据随机数表的编码的指数产生所述白噪声分量。
14、根据权利要求12所述的音频信息解码设备,其中所述白噪声产生装置根据包含在代码序列中的特定值产生所述白噪声分量。
15、根据权利要求14所述的音频信息解码设备,其中特定值是规格化信息或者量化精度信息。
16、根据权利要求12所述的音频信息解码设备,所述音频信息解码设备进一步包括用于补偿通过反频率变换在时间轴获得的音频信号的增益的增益补偿装置,其中所述相加装置把时间轴上的、补偿了增益的音频信号和时间轴上的白噪声分量相加。
17、一种音频信息解码方法,所述音频信息解码方法用于解码所编码的频率信号、反频率变换所述的解码的频率信号,从而在时间轴产生音频信号,所述方法包括:
白噪声产生步骤,所述白噪声产生步骤根据指示白噪声分量能量水平的编码的指数在时间轴产生白噪声分量;和
相加步骤,所述相加步骤将通过反频率变换在时间轴产生的音频信号与时间轴的白噪声分量相加。
18、一种使计算机执行音频信息解码处理的程序,将编码的频率信号解码、反频率变换所述的解码的频率信号,从而在时间轴产生音频信号,所述程序包括:
白噪声产生步骤,所述白噪声产生步骤根据指示白噪声分量的能量水平的编码的指数在时间轴产生白噪声分量;和
相加步骤,所述相加步骤将通过反频率变换在时间轴产生的音频信号与时间轴的白噪声分量相加。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP330024/2002 | 2002-11-13 | ||
JP2002330024A JP4657570B2 (ja) | 2002-11-13 | 2002-11-13 | 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1711588A true CN1711588A (zh) | 2005-12-21 |
CN100592388C CN100592388C (zh) | 2010-02-24 |
Family
ID=32310587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200380102961A Expired - Fee Related CN100592388C (zh) | 2002-11-13 | 2003-10-10 | 音乐信息编码设备及方法和音乐信息解码设备及方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7583804B2 (zh) |
EP (1) | EP1564724A4 (zh) |
JP (1) | JP4657570B2 (zh) |
KR (1) | KR20050074501A (zh) |
CN (1) | CN100592388C (zh) |
WO (1) | WO2004044891A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103297058B (zh) * | 2007-05-08 | 2017-03-01 | 三星电子株式会社 | 对音频信号解码的设备 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6426456B1 (en) | 2001-10-26 | 2002-07-30 | Motorola, Inc. | Method and apparatus for generating percussive sounds in embedded devices |
JP4737711B2 (ja) * | 2005-03-23 | 2011-08-03 | 富士ゼロックス株式会社 | 復号化装置、逆量子化方法、分布決定方法及びこのプログラム |
JPWO2009087923A1 (ja) * | 2008-01-11 | 2011-05-26 | 日本電気株式会社 | 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム |
US8665914B2 (en) | 2008-03-14 | 2014-03-04 | Nec Corporation | Signal analysis/control system and method, signal control apparatus and method, and program |
JP5773124B2 (ja) * | 2008-04-21 | 2015-09-02 | 日本電気株式会社 | 信号分析制御及び信号制御のシステム、装置、方法及びプログラム |
JP5609737B2 (ja) * | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
WO2012037515A1 (en) | 2010-09-17 | 2012-03-22 | Xiph. Org. | Methods and systems for adaptive time-frequency resolution in digital data coding |
US8838442B2 (en) | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9015042B2 (en) * | 2011-03-07 | 2015-04-21 | Xiph.org Foundation | Methods and systems for avoiding partial collapse in multi-block audio coding |
WO2012122299A1 (en) | 2011-03-07 | 2012-09-13 | Xiph. Org. | Bit allocation and partitioning in gain-shape vector quantization for audio coding |
KR102497153B1 (ko) * | 2012-01-18 | 2023-02-07 | 브이-노바 인터내셔널 리미티드 | 안정성 정보 및 트랜션트/확률적 정보의 구별되는 인코딩 및 디코딩 |
WO2014034697A1 (ja) * | 2012-08-29 | 2014-03-06 | 日本電信電話株式会社 | 復号方法、復号装置、プログラム、及びその記録媒体 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2581696B2 (ja) | 1987-07-23 | 1997-02-12 | 沖電気工業株式会社 | 音声分析合成器 |
JPS6428700U (zh) | 1987-08-12 | 1989-02-20 | ||
US5115240A (en) * | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
JP3133353B2 (ja) | 1991-02-13 | 2001-02-05 | 日本電気株式会社 | 音声符号化装置 |
US5692102A (en) | 1995-10-26 | 1997-11-25 | Motorola, Inc. | Method device and system for an efficient noise injection process for low bitrate audio compression |
JP3519859B2 (ja) | 1996-03-26 | 2004-04-19 | 三菱電機株式会社 | 符号器及び復号器 |
JP3318825B2 (ja) | 1996-08-20 | 2002-08-26 | ソニー株式会社 | デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置 |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US6779015B1 (en) * | 2000-06-22 | 2004-08-17 | Sony Corporation | Method for implementation of power calculation on a fixed-point processor using table lookup and linear approximation |
JP3508850B2 (ja) | 2000-08-11 | 2004-03-22 | 株式会社ケンウッド | 疑似背景雑音生成方法 |
WO2002071395A2 (en) * | 2001-03-02 | 2002-09-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for coding scaling factors in an audio coder |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
-
2002
- 2002-11-13 JP JP2002330024A patent/JP4657570B2/ja not_active Expired - Fee Related
-
2003
- 2003-10-10 EP EP03754092A patent/EP1564724A4/en not_active Ceased
- 2003-10-10 CN CN200380102961A patent/CN100592388C/zh not_active Expired - Fee Related
- 2003-10-10 KR KR1020057007168A patent/KR20050074501A/ko not_active Application Discontinuation
- 2003-10-10 WO PCT/JP2003/013084 patent/WO2004044891A1/ja active Application Filing
- 2003-10-10 US US10/534,175 patent/US7583804B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103297058B (zh) * | 2007-05-08 | 2017-03-01 | 三星电子株式会社 | 对音频信号解码的设备 |
Also Published As
Publication number | Publication date |
---|---|
EP1564724A1 (en) | 2005-08-17 |
WO2004044891A1 (ja) | 2004-05-27 |
KR20050074501A (ko) | 2005-07-18 |
EP1564724A4 (en) | 2007-08-29 |
JP4657570B2 (ja) | 2011-03-23 |
CN100592388C (zh) | 2010-02-24 |
US7583804B2 (en) | 2009-09-01 |
JP2004163696A (ja) | 2004-06-10 |
US20060153402A1 (en) | 2006-07-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1154087C (zh) | 提高低比特率音频编码系统音质的方法、编码器和译码器 | |
CN1244904C (zh) | 声频信号编码方法和设备 | |
CN101371447B (zh) | 使用扩展带频率编码的复变换信道编码 | |
CN101223582B (zh) | 一种音频编码方法、音频解码方法及音频编码器 | |
CN1038089C (zh) | 信号编码或译码装置及信号编码或译码方法 | |
CN101223570B (zh) | 获得用于数字媒体的高效编码的频带的频率分段 | |
CN1711588A (zh) | 音乐信息编码设备及方法和音乐信息解码设备及方法 | |
CN101055720A (zh) | 对音频信号编码和解码的方法和设备 | |
CN1878001A (zh) | 对音频数据编码及解码的设备及方法 | |
KR100707177B1 (ko) | 디지털 신호 부호화/복호화 방법 및 장치 | |
CN101933086A (zh) | 处理音频信号的方法和设备 | |
CN1465137A (zh) | 音频信号解码装置及音频信号编码装置 | |
CN1136235A (zh) | 数字音频信号编码和/或译码方法 | |
US20060212290A1 (en) | Audio coding apparatus and audio decoding apparatus | |
CN1117674A (zh) | 信号编码或解码设备以及记录媒介 | |
CN1249669C (zh) | 使用时间频率相关编码和/或解码数字音频的方法及装置 | |
KR20070037945A (ko) | 오디오 신호의 부호화/복호화 방법 및 장치 | |
CN1885724A (zh) | 产生音频信号比特流方法和设备及音频编解码方法和设备 | |
JP5587599B2 (ja) | 量子化方法、符号化方法、量子化装置、符号化装置、逆量子化方法、復号化方法、逆量子化装置、復号化装置、処理装置 | |
CN1823482A (zh) | 水印嵌入方法和装置 | |
CN1242624C (zh) | 编码装置与编码方法 | |
CN1524348A (zh) | 编码方法和装置以及解码方法和装置 | |
KR100682915B1 (ko) | 다채널 신호 부호화/복호화 방법 및 장치 | |
CN1918629A (zh) | 音频编码中的短窗分组方法 | |
CN101053020A (zh) | 利用信号属性的有效音频编码 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100224 Termination date: 20211010 |
|
CF01 | Termination of patent right due to non-payment of annual fee |