CN101595523A - 信号处理装置和方法以及程序 - Google Patents
信号处理装置和方法以及程序 Download PDFInfo
- Publication number
- CN101595523A CN101595523A CNA2008800035446A CN200880003544A CN101595523A CN 101595523 A CN101595523 A CN 101595523A CN A2008800035446 A CNA2008800035446 A CN A2008800035446A CN 200880003544 A CN200880003544 A CN 200880003544A CN 101595523 A CN101595523 A CN 101595523A
- Authority
- CN
- China
- Prior art keywords
- information
- gain control
- normalisation coefft
- signal
- code string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims description 50
- 238000000034 method Methods 0.000 title description 32
- 238000010606 normalization Methods 0.000 claims abstract description 119
- 238000012937 correction Methods 0.000 claims abstract description 16
- 230000009467 reduction Effects 0.000 claims abstract description 7
- 238000003672 processing method Methods 0.000 claims description 6
- 230000007115 recruitment Effects 0.000 claims description 4
- 238000000926 separation method Methods 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 73
- 230000003321 amplification Effects 0.000 description 16
- 238000003199 nucleic acid amplification method Methods 0.000 description 16
- 230000008859 change Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 230000000630 rising effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000011002 quantification Methods 0.000 description 5
- 230000007423 decrease Effects 0.000 description 3
- 230000005764 inhibitory process Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- UPLPHRJJTCUQAY-WIRWPRASSA-N 2,3-thioepoxy madol Chemical compound C([C@@H]1CC2)[C@@H]3S[C@@H]3C[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@](C)(O)[C@@]2(C)CC1 UPLPHRJJTCUQAY-WIRWPRASSA-N 0.000 description 1
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 1
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
来自输入端子(110)的编码的代码串在信号分离电路(101)中信号分离。代码串中的标准化系数信息发送到标准化系数折衷增益增加/减少电路(102),其中执行整数值增加或减少以调整信号水平。当标准化系数信息的减少量大于标准化系数信息并且在减少后的标准化系数信息的最小值执行截止时,标准化系数信息截止量计算电路(103)计算截止量。增益控制函数生成信息校正电路(104)根据截止量校正增益控制函数生成信息。
Description
技术领域
本发明涉及信号处理装置和信号处理方法以及程序,更具体地,涉及适于在增加/减少音量而不解码代码串的情况下使用的信号处理装置和信号处理方法以及程序。
背景技术
例如,即使在数据量减少到大约CD(致密盘)的数据量的1/10到1/20时,音频信号的高效编码也允许通过使用人的听力(听力特性等)的机制实现高质量的声音。当前,使用这种技术的产品在市场上分布,从而允许如在较小的记录介质上记录并且经由网络传送。
用于这种音频信号的高效编码的主要听力特性之一是同时和时间屏蔽(temporal masking)。
同时屏蔽是这样的听力特性,在同时存在不同频率的声音的情况下,当存在在大幅度声音的频率的附近的小幅度声音时,该小幅度声音被屏蔽,并且变得难以感知。
另一方面,时间屏蔽是在时间方向上的屏蔽效果和听力特性,例如,在大幅度声音之前或之后的时间存在的小幅度声音被屏蔽,难以感知。
对于时间屏蔽存在两种现象:向前屏蔽,其中时间上在前产生的声音屏蔽时间上在后产生的声音;以及向后屏蔽,其中时间上在后产生的声音屏蔽时间上在前产生的声音。
已知的是向前屏蔽对于几十msec(毫秒)量级的时段有效,而向后屏蔽对于大约1msec的极短的时段有效。
在典型的用于音频的高效编码方法中,在通过MDCT(修正的离散余弦变换)进行时间信号的正交变换后,对于多个MDCT系数的每一组,对获得的频率轴上的MDCT系数执行标准化,然而,执行量化和编码。这里,为了上述听力特性的有利使用,通过自适应地改变每组MDCT系数的量化的步骤的次数以及控制量化噪声的产生,有效地压缩了信号。
考虑如同时屏蔽的时间,将上述MDCT的变换长度设置为大约20到40msec以便有效工作。然而,在如由一对响板发出的具有尖锐上升(attack)的不稳定信号的情况下,产生的量化噪声(量化误差)在反MDCT变换后在一帧中均匀分布。图9和10示出了这种情况。
在用于实际编码装置的MDCT中,使用相邻的帧,其相互部分重叠。然而,为了简单,假设在各帧之间没有重叠,并且将以更一般的方式进行说明。
通过以上述方法对图9所示的时间轴上的输入信号(即,具有脉冲状上升的输入信号)进行编码获得图10所示的时间轴上的信号。如从图10显而易见,图中阴影面积所示的量化噪声(量化误差)沿着时间轴在该帧中均匀分布。此外,图9和10中的“帧”指示MDCT变换长度的帧,并且在下面的图11-13也类似。
关于这样产生的噪声,通常,时间上在上升前产生的噪声称为前回声噪声;另一方面,时间上在上升后产生的噪声称为后回声噪声。
上述时间屏蔽听觉屏蔽前回声噪声和后回声噪声的时段非常短,因此,这不能通过上述20到40msec的MDCT变换长度来防止。用于音频的一般高效编码方法尝试各种措施来将这种噪声限制到时间屏蔽有效的时段。
例如,MPEG1音频层III(MPEG:运动图像专家组),所谓的MP3通过利用子带滤波器组将输入PCM信号分解为相等的子带产生子带信号,然后取决于信号的稳定性,从两种不同长度的MDCT变换长度适当选择,采取措施来抑制前/后回声噪声。例如,当输入具有尖锐上升的不稳定信号时,通过选择短的MDCT变换长度,将产生前/后回声噪声的时段限制在短的MDCT帧内,并且防止感知到噪声。
另一方面,如专利文献1中所公开的,所谓的MD(MiniDiscTM)等中使用的编码方法通过利用子带滤波器组将输入PCM信号分解为相等的子带来产生子带信号,然后取决于信号的稳定性,沿着时间轴,执行改变子带信号的增益的增益控制,以使其成为稳定的子带信号,然后执行固定变换长度的MDCT并且执行标准化/量化/编码,采取措施来抑制前/后回声噪声。
图11、12和13是用于说明增益控制的效果的图。顺带提及,在上述专利文献1中,利用部分重叠的相邻帧进行说明。然而,这里,以各帧之间没有重叠的更一般的方式进行说明。
首先,编码装置获得图9的输入信号的增益控制函数,如图11的G_0(t)、G_1(t)和G_2(t)。
该增益控制函数对应于通过将沿着时间轴的每帧进一步平均再分为子帧、获得这些子帧内的最大幅度或功率、并且将获得的最大幅度或功率利用线性函数等内插获得的增益控制函数。首先,通过将输入信号乘以增益控制函数、放大小的幅度部分并且衰减大的幅度部分,在时间方向上将输入信号变为近似平的信号;然后,将该信号标准化、量化和编码,并且与增益函数生成信息和标准化信息一起多路复用,从而获得代码串。
解码装置对输入的代码串顺序执行信号分离(与多路复用相反的处理)、解码、去量化和去标准化(与标准化相反的处理)。通过到目前为止这些处理获得的时间轴上的信号如图12所示,并且在图12中的阴影面积中所示的量化误差均匀地分布在整个帧中。这里,通过从增益控制函数生成信息重新构造作为图11的增益控制函数的对应部分(counterpart)的反增益控制函数(具有相反的增益控制函数的值的函数),获得如图13所示的波形,该增益控制函数生成信息通过信号分离上述代码串,并且将图12的波形乘以反增益控制函数而获得。
如从图13显而易见,该图中的阴影面积中所示的量化误差以这样方式分布,与作为上升部分的脉冲前和后的附近的水平(level)相比,该水平在其它部分衰减,并且由于时间屏蔽的作用,可以显著抑制前回声噪声和后回声噪声。增益控制自身在编码装置的编码算法的优化内,并且根据电路大小和编码装置的应用,各种设置是可能的,例如,如如果充分分配了各个位并且量化误差的生成非常小,则不对具有大的上升的输入信号执行增益控制。
这样,在音频的高效编码的情况下,通过更好地利用听力特性,通过根据信号的属性适当地控制量化噪声的生成,变得可以有效地压缩信号。
同时,在这种用于音频信号的高效编码技术中,因为在编码/解码时需要相对大的计算量和存储器,所以提出了一种首先对编码的代码串执行简单的信号处理的技术。这是通过直接改变代码串中包括的参数等而不用执行以下处理,利用小的计算量和小的存储器执行期望的信号处理的技术,所述处理为在将代码串解码为时间轴上的信号后对代码串执行期望的信号处理,然后将信号重新编码。
例如,专利文献2公开了通过直接改变代码串中的标准化系数信息使得可能进行信号的滤波的技术。此外,专利文献3公开了通过直接改变代码串中的标准化系数信息使得可能进行信号的水平调整的技术。
[专利文献1]日本专利No.3263881
[专利文献2]日本专利No.3879249
[专利文献3]日本专利No.3879250
发明内容
本发明要解决的问题
同时,在采用上述增益控制技术的用于音频的高效编码方法的情况下,当直接应用在上述专利文献2和3中描述的技术时,取决于信号的属性可能出现各种问题。以下,将参照附图说明各种问题。
例如,假设在通过采用上述增益控制技术的用于音频的高效编码方法、通过编码如图9所示的脉冲状信号获得代码串的情况下,期望通过使用上述专利文献3,通过直接改变代码串中的标准化信息并且执行代码串的水平调整获得淡入(fade-in)的效果。
在解码装置解码代码串并且获得输出PCM信号后执行信号处理的结果如图14所示。
这是将解码装置的输出PCM信号乘以淡入函数Fi(t)的结果,该淡入函数Fi(t)随着时间在0到1.0的范围内逐渐增加。
当通过使用上述专利文献3中描述的技术、利用每帧的标准化系数信息的减法表示淡入函数Fi(t)的形状时,如图15所示。图15中的SFfi(帧)对应于通过重新采样Fi(t)获得的,该Fi(t)是以帧大小的间隔的离散时间的函数,并且将具有正整数的值表示为标准化系数信息的差值。
在上述专利文献1中描述的用于音频的高效编码方法中,上述标准化系数信息以6位2分贝步幅表示,如图16所示。在图16中,SF是为正整数的标准化系数信息,而SFval(SF)是为正实数的标准化系数。
图17示出了基于上述专利文献3中描述的技术、通过减去标准化系数信息实现淡入的处理。在该技术中,标准化系数用于在频域中标准化MDCT系数,并且为每个称为量化单元的单元获得,该量化单元是多个MDCT系数的集合。然而,这里为了简单,基于单个标准化系数进行说明。
图17中的SForg(帧)指示为每帧获得的标准化系数信息。
这里,关于具有帧号2的帧,它是由于如MDCT中的窗口和脉冲的位置关系的因素以及用于增益控制的算法,而没有对其执行增益控制的帧。
相反,当通过使用图15中说明的SFfi(帧)执行标准化系数信息的减法时,如图18所示。由于标准化系数信息是0和63之间的正整数,所以当作为减法的结果标准化系数信息变为负时,在0处截止(cut off)。Tsf指示截止的标准化系数信息的量。
图19指示包括其中上述标准化系数信息的减法结果变为负并且标准化系数信息在0处截止的帧的结果。
图19的SFm(帧)指示已经对其执行淡入处理的标准化系数信息。
图20A示出已经对其应用淡入处理的PCM信号,其中PCM信号已经通过解码与图14的代码串相同的代码串获得,以及图20B示出通过将代码串输入解码装置获得的输出PCM信号,已经对该代码串执行上述对于代码串的淡入处理。在具有帧号0和1的帧中,标准化系数被截止,然后执行反增益控制,结果,与图20A的脉冲信号相比,脉冲信号更大。另一方面,在帧号2中,没有执行增益控制,并且标准化系数没有截止,因此,幅度值对应于图20A的脉冲信号。
已经考虑这种情况实现了本发明,并且本发明的目的是提供一种信号处理装置、方法和程序,能够解决当直接处理通过使用增益控制的用于音频的高效编码方法编码的代码串并且应用信号处理(如淡入、淡出等)时出现的问题,并且能够输出高质量代码串。
解决问题的手段
为了解决上述问题,在对通过将输入数字信号划分为沿着时间轴的各块、沿着时间轴对每个块执行增益控制、利用正值对增益控制的信号分量执行标准化、量化标准化的信号分量、和执行编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得的代码串执行的信号处理中,所述增益控制函数生成信息生成用于执行增益控制的增益控制函数,本发明可以通过从代码串中的标准化系数信息中减去整数值或增加整数值到代码串中的标准化系数信息来执行编码的代码串的信号的水平调整,对于标准化系数信息的减少量大于标准化系数信息并且减少后的标准化系数信息在最小可能的值截止的情况,根据截止量修改增益控制函数生成信息。
这里,对于标准化系数信息的增加量大并且增加后的标准化信息在最大可能的值截止的情况,可以根据截止量修改增益控制函数生成信息。
本发明的效果
根据本发明,当直接处理代码串并且应用信号处理(如淡入、淡出等)时,可以通过根据标准化系数信息的截止量适当重写增益控制信息,抑制由于标准化系数信息的截止和反增益控制出现的信号的放大,并且输出已经对其执行了期望的信号处理的代码串。
附图说明
图1是示出作为本发明的实施例的信号处理装置的示意配置的方块图。
图2是示出本发明实施例的编码方法的代码串的格式示例的图。
图3是示出本发明实施例的4位增益控制水平信息表的示例的图。
图4A是示出本发明实施例的反增益控制函数的具体示例的图。
图4B是示出本发明实施例的反增益控制函数的具体示例的图。
图5是用于说明本发明实施例的增益控制函数生成信息修改电路的处理步骤的示例的流程图。
图6是用于说明由于本发明实施例的反增益控制而出现的整个帧的增益的放大量GM的计算的示例的流程图。
图7是用于说明标准化系数信息的增加结果和标准化系数信息的对应截止的图。
图8是示出标准化系数信息的截止的具体示例的图。
图9是示出恒定周期和恒定幅度的脉冲信号的图。
图10是示出在用于音频的一般高效编码中的解码信号中的回声噪声的生成的图。
图11是示出在输入脉冲信号的情况下的增益控制函数的示例的图。
图12是示出其中将量化误差增加到增益控制的信号的状态的图。
图13是示出用于抑制回声噪声的增益控制的效果的图。
图14是示出为每个时间样本执行淡入的函数的图。
图15是示出对应于淡入函数的标准化系数信息的减少的图。
图16是示出6位标准化系数表的示例的图。
图17是示出标准化系数信息的减少结果和标准化系数信息的对应截止的图。
图18是示出标准化系数信息的截止的具体示例的图。
图19是示出标准化系数信息的减少结果和标准化系数信息的对应截止的图。
图20A是示出如何依赖于标准化系数信息的截止和反增益控制之间的关系放大信号的图。
图20B是示出如何依赖于标准化系数信息的截止和反增益控制之间的关系放大信号的图。
标号说明
101信号分离电路
102标准化系数信息增加/减少电路
103标准化系数信息截止量计算电路
104增益控制函数生成信息修改电路
105多路复用电路
具体实施方式
以下,将参照附图详细描述应用了本发明的具体实施例。
图1是示意性示出在本发明实施例中使用的信号处理装置的配置的方块图。
图1所示的信号处理装置配置为具有信号分离电路101、标准化系数信息增加/减少电路102(标准化系数信息增加/减少部件)、标准化系数信息截止量计算电路103(截止量计算部件)、增益控制函数生成信息修改电路104(增益控制函数生成信息的修改部件)以及多路复用电路105。
信号分离电路101将从输入端子110输入的代码串信号分离,将标准化系数信息提供到标准化系数信息增加/减少电路102,并且将增益控制函数生成信息提供到增益控制函数生成信息修改电路104。稍后将描述从输入端子110输入到信号分离电路101的代码串的示例。
标准化系数信息增加/减少电路102基于从输入端子112给出的标准化系数信息增加/减少量,增加或减少标准化系数信息,并且作为计算结果,当超过标准化系数信息的可能的上限或可能的下限时,每个由上限或下限替代。将作为输出的标准化系数信息提供到增益控制函数生成信息修改电路104以及多路复用电路105。
被上限/下限替代前的标准化系数信息作为截止前标准化系数信息提供到标准化系数信息截止量计算电路103。
关于这里的标准化系数信息的增加/减少,可以使用如上所述的与图17一起描述的方法。
标准化系数信息截止量计算电路103比较从标准化系数信息增加/减少电路102输出的标准化系数信息和同样从标准化系数信息增加/减少电路102输出的截止前的标准化系数信息,并且计算标准化系数信息截止量以提供给增益控制函数生成信息修改电路104。
关于这里的标准化系数信息截止量的计算,可以使用如上所述与图18和19一起描述的方法。
增益控制函数生成信息修改电路104比较从信号分离电路101输出的增益控制函数生成信息与从标准化系数信息截止量计算电路103输出的标准化系数信息截止量,获得增益控制函数生成信息修改量,并且修改增益控制函数生成信息。稍后将描述增益控制函数生成信息修改电路104的详细操作等。
修改的增益控制函数生成信息提供到多路复用电路105。
多路复用电路105具有从标准化系数信息增加/减少电路102输出的标准化系数信息、从增益控制函数生成信息修改电路104输出的增益控制函数生成信息以及来自输入端子110的输入代码串作为输入,利用其每个重新从标准化系数信息增加/减少电路102和增益控制函数生成信息修改电路104获得的标准化系数信息和增益控制函数生成信息替代输入代码串的相应部分,执行多路复用,并且从输出端子115输出输出代码串。
这里,将使用图2说明要作为信号分离电路101的输入的上述代码串的示例。
图2示出了配置上述代码串的各帧之一,并且由报头、增益控制函数生成信息、标准化系数信息和标准化信号数据配置。
增益控制函数生成信息由增益控制改变点的数量、增益控制改变点位置信息和增益控制水平信息配置,并且增益控制改变点位置信息和增益控制水平信息的条数基于增益控制改变点的数量确定。
增益控制水平信息Glev是例如图3中的4位代码,并且其增益控制水平Gain通过以下等式作为Glev的函数获得。
Gain(Glev)=2^(Glev-4)
在图4A和4B中示出了基于图2的增益控制函数生成信息、由解码器生成的反增益控制函数的具体示例。
在图4A中,增益控制改变点的数量是2,并且两条增益控制改变点位置信息分别示出为Gloc[0]和Gloc[1],并且两条增益控制水平信息分别示出为Glev[0]和Glev[1]。
增益控制改变点位置信息Gloc指示将帧均匀再分为子帧的位置,并且如图4所示,在Gloc[0]的增益控制水平信息对应于Glev[0]。此外,在具有增益控制改变点位置信息Gloc的子帧之前的子帧的位置处的增益控制水平信息,是紧接在上述具有Gloc的子帧之后的下一具有Gloc的子帧的增益控制水平信息。
此外,如图4所示,在帧的末端的子帧的增益控制水平是1.0。
此外,图4中的反增益控制函数在关系上与图3所示的4位代码的增益控制水平信息相反,并且例如,Gain(3)的0.5是2.0乘以反增益控制函数的增益改变。
利用图4的增益控制函数,各个子帧的增益控制水平通过直线内插。然而,作为根据本发明的另一实施例,可以使用正弦函数等执行内插,或者不必执行内插。
图2的增益控制函数生成信息以上述格式记录,此外,该图2中的标准化信号数据对应于通过将输入PCM信号除以上述增益控制函数、然后通过标准化系数执行标准化获得的标准化信号数据。
作为本发明实施例的信号处理装置的示意性配置和方法将总结如下。也就是说,首先,作为用于获得要对其执行信号处理的代码串的编码方法,使用一种编码方法,其通过在编码输入PCM信号时,对每个时间块执行沿着时间轴的增益控制、通过利用正值执行增益控制后的信号分量的标准化、量化标准化的信号分量、和执行编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得代码串,所述增益控制函数生成信息生成用于执行增益控制的增益控制函数。当解码这种编码的串时,使用一种解码方法,其通过信号分离上述代码串,解码编码的信号分量,执行去量化,然后通过使用上述标准化系数信息执行去标准化,并且通过使用反增益控制函数执行反增益控制获得输出PCM信号,该反增益控制函数是上述使用增益控制函数生成信息的增益控制函数的对应部分。在本发明的实施例中,对通过上述编码方法编码的代码串执行信号处理,上述编码方法通过从上述代码串中减少整数或将整数增加到上述代码串来调整信号的水平,并且当上述标准化系数信息的减少量大于标准化系数信息,并且减少后的标准化系数信息在最小可能值截止时,根据截止量修改增益控制函数生成信息。
根据本发明实施例的这种配置,当利用小的计算量和存储器使用对通过用于音频的高效编码方法获得的代码串执行音量控制而不解码代码串时,该用于音频的高效编码方法通过调整标准化系数使用增益控制,变得可以通过根据标准化系数的截止量适当修改增益控制函数生成信息,抑制由标准化系数的截止和反增益控制导致的音量的过度放大,并且可以执行期望的音量控制。
在本发明实施例的说明中,使用通过对输入PCM信号执行增益控制、然后执行标准化并且执行量化和编码获得的代码串。然而,关于根据本发明的另一实施例,可以使用通过例如对输入PCM信号使用子带划分滤波器以获得子带信号、然后执行增益控制获得的代码串。
此外,作为根据本发明的另一实施例,还可以应用于通过对执行增益控制获得的信号执行如MDCT的时间-频率转换、并且对获得的MDCT系数的每个特定块执行标准化、量化和编码获得的代码串。
接着,下面将详细描述具有上述图1的配置的信号处理装置的增益控制函数生成信息修改电路104。
增益控制函数生成信息修改电路104是用于防止由上述标准化系数信息的截止和反增益控制导致的信号的过度放大的出现的电路。将参照图5和6的流程图说明其特定操作的步骤。
首先,在图5的步骤S1中,确定是否必需为要处理的帧修改增益控制函数生成信息。
步骤S1的Tsf是上述图17的标准化系数信息的截止量,并且作为标准化系数信息截止量计算电路103的输出获得。GM是由于反增益控制出现的整个帧的增益的放大量,并且将在图6的说明中描述。α是常数。
在步骤S1中,确定标准化系数信息的截止量Tsf是否大于α·GM,并且当判断为是(真)时,即,当判断标准化系数信息的截止量大于由于反增益控制出现的整个帧的增益的放大量时,执行步骤S2的处理。当在步骤S1中判断为否时,处理结束。
在步骤S2中,将用于增益控制改变点的数量的计数器J用0初始化,并且此后执行循环处理NGC次,其中NGC是增益控制改变点的数量,并且操作进行到步骤S3。
在步骤S3,判断增益控制水平信息Glev[J]是否小于4,即,执行用于放大反增益控制函数的增益的情况的判断处理。
当在步骤S3中判断为是时(Glev[J]小于4),执行步骤S4的处理,并且当判断为否时(Glev[J]为4或更大),进行到步骤S7。注意,在步骤S7,执行将用于增益控制改变点的数量的计数器J增加的处理(J=J+1)。
在步骤S4,执行用于增益放大的抑制处理。为了更精确,通过将标准化系数信息截止量Tsf除以3以使其为对应于增益控制水平信息的值、并且将该值增加到增益控制水平信息Glev[J](Glev[J]=Glev[J]+Tsf/3),执行增益放大的抑制处理。如从上述图16和3显而易见,标准化系数是2-dB步幅,而增益控制水平是6-dB步幅的值。在步骤S4的处理后,进行到步骤S5。
接着,在步骤S5和步骤S6,执行上述步骤S4的计算结果的截止。即,在步骤S5,确定在步骤S4处理后的增益控制水平信息Glev[J]是否超过15的截止值,并且当超过15时,进行到步骤S6以使得Glev[J]为15,然后进行到步骤S7(计数器J的增量处理)。当为15或更小时,直接进行到步骤S7。
这被执行使得作为到增益控制水平信息的增加的结果,Glev[J]不超过其最大可能的值。作为根据本发明实施例的另一示例,可以使得截止值小于15。执行增益控制以抑制前/后回声噪声,并且分别为编码和解码执行的增益控制和反增益控制理论上是无损处理。然而,如果这里对于增益控制水平信息的修改变得非常大,则增益控制和反增益控制之间的配对关系被严重破坏。
接着,参照图6的流程图,将进行由于反增益控制出现的整个帧的增益的放大量GM的计算的说明。
首先,在图6的步骤S11中,执行各种初始化。在图6的流程图中,I用作增益控制改变点的数量的计数器,并且J用作子帧的计数器。NGC是增益控制改变点的数量,并且NS是子帧的数量。GL是暂时保持增益控制改变点位置信息Gloc的变量。GM是通过流程图的处理获得的整个帧的增益的放大量,并且初始化为0。G是在计算增益的放大量GM时使用的增益控制水平信息的变量,并且初始化为0。
在步骤S11中执行初始化后,对每个子帧执行从步骤S12到步骤S19的循环处理。
在步骤S12,确定子帧计数器(子帧的位置)的值J是否匹配变量GL(其中保持的增益控制改变点位置信息Gloc),并且当为是时,即,子帧计数器的值J匹配增益控制改变点位置,进行到步骤S13,并且当前子帧中的增益控制水平信息的变量G更新。当在步骤S12中确定为否时,进行到步骤S17。
在步骤S13,通过从增益控制水平信息Glev[J]减去4获得的值分配给增益控制水平信息的变量G(G=Glev[J]-4),此外,增益控制改变点的数量的计数器递减(I=I-1)。
在步骤S13的处理后,根据步骤S14到步骤S16中的I更新GL的值。
也就是说,在步骤S14,确定I是否为0或更大,当为是时,进行到步骤S15,并且将对应于递减的I的增益控制改变点位置信息Gloc[I]分配给变量GL,并且进行到步骤S17。当在步骤S14确定为否时,在步骤S16使得GL为-1(GL=-1),并且进行到步骤S17。
在步骤S17,将当前子帧的增益控制水平信息G加到GM(GM=GM+G)。
在下一步骤S18,子帧计数器的值J递减(J=J-1),并且进行到步骤S19以确定J是否小于0(J<0)。当确定为否时,返回到上述步骤S12,并且当为是时,处理结束。
如上所述,为每个子帧更新GM,并且获得整个帧的增益的放大量。
因为考虑到由于标准化系数信息的截止量和反增益控制出现的整个帧的增益的放大量,需要修改增益控制函数生成信息,所以执行该处理。
这里,图4A和4B示出由于增益控制改变点位置信息的差导致的反增益函数之间的差。在图4B中的帧内的增益放大量大于图4A中的增益放大量。
这意味着,在编码的增益控制中,增益抑制量已经变大。在后者的情况下,标准化系数信息变小,因此,标准化系数信息的截止量变大。在这种情况下,根据标准化系数信息的截止量的增益控制函数信息的修改是不必要的。
以此方式,通过根据标准化系数信息的截止量适当修改增益控制函数生成信息,可以防止增益的过度放大。
在上述本发明的实施例中,在执行信号的水平调整而不解码代码串的情况下,由于在标准化系数信息的减法后的标准化系数信息的最小值处的截止,出现了问题,并且已经描述了其解决方法。另一方面,在使用标准化系数信息的加法放大信号的情况下,可能出现类似问题。
图7和8是示出在使用标准化系数信息的增加放大信号的情况下的问题。在头帧中,标准化系数信息的加法结果是67,出现4的截止。在这种情况下,当通过反增益控制存在信号的衰减时,不能通过标准化系数信息的增加获得信号的期望放大的结果。
同样在这种情况下,通过使用类似于上述本发明实施例的方法,通过适当修改增益控制函数生成信息,可以防止增益的过度衰减。
这里,根据上述本发明实施例的信号处理方法中的每个步骤可以提供作为要由计算机执行的程序。
根据上述本发明实施例,当直接处理通过使用增益控制的用于音频的高效编码方法编码的代码串并且应用信号处理(如淡入、淡出等)时,可以通过根据标准化系数信息的截止量适当重写增益控制信息,抑制由于标准化系数信息的截止和反增益控制而出现的信号的放大,并且输出已经对其执行了期望的信号处理的代码串。
注意,本发明不限于上述实施例,并且不用说各种修改是可能的,只要它们在本发明的范围内。
Claims (10)
1.一种信号处理装置,其对代码串执行信号处理,所述代码串通过将输入数字信号划分为沿着时间轴的各块、对沿着时间轴的每个块执行增益控制、利用正值对已经执行了增益控制的信号分量进行标准化、量化标准化的信号分量、和编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得,所述增益控制函数生成信息生成用于执行增益控制的增益控制函数,所述信号处理装置包括:
标准化系数信息增加/减少部件,用于通过从代码串中的标准化系数信息中减去整数值或增加整数值到代码串中的标准化系数信息来对编码的代码串调整信号水平;
截止量计算部件,用于对以下情况计算截止量,其中因为标准化系数信息的减少或增加量大,所以减少或增加后的标准化系数信息在其最小或最大可能值截止;以及
修改部件,用于根据来自截止量计算部件的截止量修改增益控制函数生成信息。
2.如权利要求1所述的信号处理装置,其中
所述截止量计算部件对以下情况计算截止量,其中标准化系数信息的减少量大于标准化系数信息,并且减少后的标准化系数信息在其最小可能值截止。
3.如权利要求1所述的信号处理装置,其中
所述截止量计算部件对以下情况计算截止量,其中标准化系数信息的增加量大,并且增加后的标准化系数信息在其最大可能值截止。
4.如权利要求1所述的信号处理装置,其中
对其执行增益控制的信号分量是通过对输入的数字信号使用子带划分滤波器获得的子带信号。
5.如权利要求1所述的信号处理装置,其中
被标准化的信号分量是通过在执行增益控制后执行MDCT(修正的离散余弦变换)获得的MDCT系数。
6.如权利要求5所述的信号处理装置,其中
对多个MDCT系数的每个执行标准化,并且作为标准化的输出获得多条标准化系数信息。
7.如权利要求1所述的信号处理装置,其中
只有当代码串包括增益控制函数生成信息时,才修改增益控制函数生成信息。
8.一种对代码串执行信号处理的信号处理方法,所述代码串通过将输入数字信号划分为沿着时间轴的各块、对沿着时间轴的每个块执行增益控制、利用正值对已经执行了增益控制的信号分量进行标准化、量化标准化的信号分量、和编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得,所述增益控制函数生成信息关于生成用于执行增益控制的增益控制函数,所述信号处理方法包括以下步骤:
通过从代码串中的标准化系数信息中减去整数值或增加整数值到代码串中的标准化系数信息来对编码的代码串调整信号水平;以及
如果标准化系数信息的减少量大于标准化系数信息并且减少后的标准化系数信息在其最小可能值截止,则根据截止量修改增益控制函数生成信息。
9.如权利要求8所述的信号处理方法,还包括以下步骤:如果标准化系数信息的增加量大并且增加后的标准化信息在其最大可能值截止,则根据截止量修改增益控制函数生成信息。
10.一种用于使得计算机执行要对代码串执行的信号处理的程序,所述代码串通过将输入数字信号划分为沿着时间轴的各块、对沿着时间轴的每个块执行增益控制、利用正值对已经执行了增益控制的信号分量进行标准化、量化标准化的信号分量、和编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得,所述增益控制函数生成信息关于生成用于执行增益控制的增益控制函数,所述程序使得计算机执行以下步骤:
通过从代码串中的标准化系数信息中减去整数值或增加整数值到代码串中的标准化系数信息来对编码的代码串调整信号水平;以及
如果标准化系数信息的减少量大于标准化系数信息并且减少后的标准化系数信息在其最小可能值截止,则根据截止量修改增益控制函数生成信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007197959A JP5045295B2 (ja) | 2007-07-30 | 2007-07-30 | 信号処理装置及び方法、並びにプログラム |
JP197959/2007 | 2007-07-30 | ||
PCT/JP2008/061613 WO2009016901A1 (ja) | 2007-07-30 | 2008-06-26 | 信号処理装置及び方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101595523A true CN101595523A (zh) | 2009-12-02 |
CN101595523B CN101595523B (zh) | 2012-04-18 |
Family
ID=40304138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008800035446A Expired - Fee Related CN101595523B (zh) | 2007-07-30 | 2008-06-26 | 信号处理装置和方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8478586B2 (zh) |
EP (1) | EP2088582A4 (zh) |
JP (1) | JP5045295B2 (zh) |
KR (1) | KR20100039824A (zh) |
CN (1) | CN101595523B (zh) |
HK (1) | HK1133945A1 (zh) |
WO (1) | WO2009016901A1 (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
US9875746B2 (en) * | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
CA3162763A1 (en) | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0653846B1 (en) | 1993-05-31 | 2001-12-19 | Sony Corporation | Apparatus and method for coding or decoding signals, and recording medium |
US5731767A (en) * | 1994-02-04 | 1998-03-24 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus, information recording medium, and information transmission method |
JP3263881B2 (ja) | 1994-02-04 | 2002-03-11 | ソニー株式会社 | 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法 |
TW384434B (en) * | 1997-03-31 | 2000-03-11 | Sony Corp | Encoding method, device therefor, decoding method, device therefor and recording medium |
JP3164038B2 (ja) | 1997-11-05 | 2001-05-08 | 日本電気株式会社 | 音声帯域分割復号装置 |
KR100304092B1 (ko) * | 1998-03-11 | 2001-09-26 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 |
JP3879250B2 (ja) | 1998-05-14 | 2007-02-07 | ソニー株式会社 | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 |
JP3879249B2 (ja) | 1998-05-14 | 2007-02-07 | ソニー株式会社 | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 |
US6353584B1 (en) * | 1998-05-14 | 2002-03-05 | Sony Corporation | Reproducing and recording apparatus, decoding apparatus, recording apparatus, reproducing and recording method, decoding method and recording method |
JP2000078017A (ja) * | 1998-09-02 | 2000-03-14 | Sony Corp | デコード方法及びデコード装置 |
US6353808B1 (en) * | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
DE60017825T2 (de) * | 1999-03-23 | 2006-01-12 | Nippon Telegraph And Telephone Corp. | Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür |
JP4639441B2 (ja) * | 1999-09-01 | 2011-02-23 | ソニー株式会社 | ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法 |
JP4441989B2 (ja) * | 2000-05-30 | 2010-03-31 | ソニー株式会社 | 符号化装置および符号化方法 |
WO2003077425A1 (fr) * | 2002-03-08 | 2003-09-18 | Nippon Telegraph And Telephone Corporation | Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques |
EP1489599B1 (en) * | 2002-04-26 | 2016-05-11 | Panasonic Intellectual Property Corporation of America | Coding device and decoding device |
JP4296752B2 (ja) * | 2002-05-07 | 2009-07-15 | ソニー株式会社 | 符号化方法及び装置、復号方法及び装置、並びにプログラム |
JP2004361602A (ja) * | 2003-06-04 | 2004-12-24 | Sony Corp | データ生成方法およびデータ生成装置、データ復元方法およびデータ復元装置、並びにプログラム |
US7595819B2 (en) * | 2003-07-31 | 2009-09-29 | Sony Corporation | Signal processing device and signal processing method, program, and recording medium |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
JP4899359B2 (ja) * | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US7860194B2 (en) * | 2005-11-11 | 2010-12-28 | Samsung Electronics Co., Ltd. | Method and apparatus for normalizing input metric to a channel decoder in a wireless communication system |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
JP5098492B2 (ja) * | 2007-07-30 | 2012-12-12 | ソニー株式会社 | 信号処理装置及び信号処理方法、並びにプログラム |
-
2007
- 2007-07-30 JP JP2007197959A patent/JP5045295B2/ja not_active Expired - Fee Related
-
2008
- 2008-06-26 EP EP08790628A patent/EP2088582A4/en not_active Withdrawn
- 2008-06-26 CN CN2008800035446A patent/CN101595523B/zh not_active Expired - Fee Related
- 2008-06-26 WO PCT/JP2008/061613 patent/WO2009016901A1/ja active Application Filing
- 2008-06-26 US US12/524,783 patent/US8478586B2/en not_active Expired - Fee Related
- 2008-06-26 KR KR1020097010316A patent/KR20100039824A/ko not_active Application Discontinuation
-
2010
- 2010-01-26 HK HK10100802.6A patent/HK1133945A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
EP2088582A4 (en) | 2012-08-01 |
WO2009016901A1 (ja) | 2009-02-05 |
US8478586B2 (en) | 2013-07-02 |
HK1133945A1 (en) | 2010-04-09 |
KR20100039824A (ko) | 2010-04-16 |
US20100106494A1 (en) | 2010-04-29 |
CN101595523B (zh) | 2012-04-18 |
JP5045295B2 (ja) | 2012-10-10 |
JP2009031675A (ja) | 2009-02-12 |
EP2088582A1 (en) | 2009-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101595523B (zh) | 信号处理装置和方法 | |
US9830915B2 (en) | Time domain level adjustment for audio signal decoding or encoding | |
EP3329592B1 (en) | Encoded audio metadata-based loudness equalization and dynamic equalization during drc | |
JP4579273B2 (ja) | ステレオ音響信号の処理方法と装置 | |
CN101443842B (zh) | 信息信号编码 | |
AU2010309894B2 (en) | Multi-mode audio codec and CELP coding adapted therefore | |
EP2002426B1 (en) | Audio signal loudness measurement and modification in the mdct domain | |
CN101161033A (zh) | 编码音频的节约式响度测量 | |
JP2022166205A (ja) | 入力オーディオ信号のダイナミックレンジを調整する方法、オーディオ信号処理装置及び記憶媒体 | |
CN104395958B (zh) | 数字音频信号中的有效前回声衰减 | |
US9741351B2 (en) | Adaptive quantization noise filtering of decoded audio data | |
KR20070028481A (ko) | 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 | |
JP6049762B2 (ja) | オーディオ処理 | |
CN104981981B (zh) | 数字音频信号中的前回声的有效衰减 | |
CN106575507A (zh) | 用于处理音频信号的方法和装置,音频解码器和音频编码器 | |
CN104584122A (zh) | 使用改进的概率分布估计的基于线性预测的音频编码 | |
CN101432803A (zh) | 编码方法和编码装置 | |
AU2005213767A1 (en) | Method and device for quantizing a data signal | |
US20110010167A1 (en) | Method for generating background noise and noise processing apparatus | |
Edler et al. | Perceptual audio coding using a time-varying linear pre-and post-filter | |
CN101960514A (zh) | 信号分析控制系统及其方法、信号控制装置及其方法和程序 | |
Oh et al. | Low power MPEG/audio encoders using simplified psychoacoustic model and fast bit allocation | |
CA2124713C (en) | Long term predictor | |
Nawab et al. | Efficient STFT approximation using a quantization and differencing method | |
KR101737254B1 (ko) | 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1133945 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1133945 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120418 Termination date: 20150626 |
|
EXPY | Termination of patent right or utility model |