CN101595523B - 信号处理装置和方法 - Google Patents

信号处理装置和方法 Download PDF

Info

Publication number
CN101595523B
CN101595523B CN2008800035446A CN200880003544A CN101595523B CN 101595523 B CN101595523 B CN 101595523B CN 2008800035446 A CN2008800035446 A CN 2008800035446A CN 200880003544 A CN200880003544 A CN 200880003544A CN 101595523 B CN101595523 B CN 101595523B
Authority
CN
China
Prior art keywords
information
gain control
signal
normalisation coefft
code string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008800035446A
Other languages
English (en)
Other versions
CN101595523A (zh
Inventor
本间弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN101595523A publication Critical patent/CN101595523A/zh
Application granted granted Critical
Publication of CN101595523B publication Critical patent/CN101595523B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

来自输入端子(110)的编码的代码串在信号分离电路(101)中信号分离。代码串中的标准化系数信息发送到标准化系数折衷增益增加/减少电路(102),其中执行整数值增加或减少以调整信号水平。当标准化系数信息的减少量大于标准化系数信息并且在减少后的标准化系数信息的最小值执行截止时,标准化系数信息截止量计算电路(103)计算截止量。增益控制函数生成信息校正电路(104)根据截止量校正增益控制函数生成信息。

Description

信号处理装置和方法
技术领域
本发明涉及信号处理装置和信号处理方法以及程序,更具体地,涉及适于在增加/减少音量而不解码代码串的情况下使用的信号处理装置和信号处理方法以及程序。 
背景技术
例如,即使在数据量减少到大约CD(致密盘)的数据量的1/10到1/20时,音频信号的高效编码也允许通过使用人的听力(听力特性等)的机制实现高质量的声音。当前,使用这种技术的产品在市场上分布,从而允许如在较小的记录介质上记录并且经由网络传送。 
用于这种音频信号的高效编码的主要听力特性之一是同时和时间屏蔽(temporal masking)。 
同时屏蔽是这样的听力特性,在同时存在不同频率的声音的情况下,当存在在大幅度声音的频率的附近的小幅度声音时,该小幅度声音被屏蔽,并且变得难以感知。 
另一方面,时间屏蔽是在时间方向上的屏蔽效果和听力特性,例如,在大幅度声音之前或之后的时间存在的小幅度声音被屏蔽,难以感知。 
对于时间屏蔽存在两种现象:向前屏蔽,其中时间上在前产生的声音屏蔽时间上在后产生的声音;以及向后屏蔽,其中时间上在后产生的声音屏蔽时间上在前产生的声音。 
已知的是向前屏蔽对于几十msec(毫秒)量级的时段有效,而向后屏蔽对于大约1msec的极短的时段有效。 
在典型的用于音频的高效编码方法中,在通过MDCT(修正的离散余弦变换)进行时间信号的正交变换后,对于多个MDCT系数的每一组,对获得的频率轴上的MDCT系数执行标准化,然而,执行量化和编码。这里,为了上述听力特性的有利使用,通过自适应地改变每组MDCT系数的量化的步骤的次数以及控制量化噪声的产生,有效地压缩了信号。 
考虑如同时屏蔽的时间,将上述MDCT的变换长度设置为大约20到40msec以便有效工作。然而,在如由一对响板发出的具有尖锐上升(attack)的不稳定信号的情况下,产生的量化噪声(量化误差)在反MDCT变换后在一帧中均匀分布。图9和10示出了这种情况。 
在用于实际编码装置的MDCT中,使用相邻的帧,其相互部分重叠。然而,为了简单,假设在各帧之间没有重叠,并且将以更一般的方式进行说明。 
通过以上述方法对图9所示的时间轴上的输入信号(即,具有脉冲状上升的输入信号)进行编码获得图10所示的时间轴上的信号。如从图10显而易见,图中阴影面积所示的量化噪声(量化误差)沿着时间轴在该帧中均匀分布。此外,图9和10中的“帧”指示MDCT变换长度的帧,并且在下面的图11-13也类似。 
关于这样产生的噪声,通常,时间上在上升前产生的噪声称为前回声噪声;另一方面,时间上在上升后产生的噪声称为后回声噪声。 
上述时间屏蔽听觉屏蔽前回声噪声和后回声噪声的时段非常短,因此,这不能通过上述20到40msec的MDCT变换长度来防止。用于音频的一般高效编码方法尝试各种措施来将这种噪声限制到时间屏蔽有效的时段。 
例如,MPEG1音频层III(MPEG:运动图像专家组),所谓的MP3通过利用子带滤波器组将输入PCM信号分解为相等的子带产生子带信号,然后取决于信号的稳定性,从两种不同长度的MDCT变换长度适当选择,采取措施来抑制前/后回声噪声。例如,当输入具有尖锐上升的不稳定信号时,通过选择短的MDCT变换长度,将产生前/后回声噪声的时段限制在短的MDCT帧内,并且防止感知到噪声。 
另一方面,如专利文献1中所公开的,所谓的MD(MiniDiscTM)等中使用的编码方法通过利用子带滤波器组将输入PCM信号分解为相等的子带来产生子带信号,然后取决于信号的稳定性,沿着时间轴,执行改变子带信号的增益的增益控制,以使其成为稳定的子带信号,然后执行固定变换长度的MDCT并且执行标准化/量化/编码,采取措施来抑制前/后回声噪声。 
图11、12和13是用于说明增益控制的效果的图。顺带提及,在上述专利文献1中,利用部分重叠的相邻帧进行说明。然而,这里,以各帧之间没有重叠的更一般的方式进行说明。 
首先,编码装置获得图9的输入信号的增益控制函数,如图11的G_0(t)、 G_1(t)和G_2(t)。 
该增益控制函数对应于通过将沿着时间轴的每帧进一步平均再分为子帧、获得这些子帧内的最大幅度或功率、并且将获得的最大幅度或功率利用线性函数等内插获得的增益控制函数。首先,通过将输入信号乘以增益控制函数、放大小的幅度部分并且衰减大的幅度部分,在时间方向上将输入信号变为近似平的信号;然后,将该信号标准化、量化和编码,并且与增益函数生成信息和标准化信息一起多路复用,从而获得代码串。 
解码装置对输入的代码串顺序执行信号分离(与多路复用相反的处理)、解码、去量化和去标准化(与标准化相反的处理)。通过到目前为止这些处理获得的时间轴上的信号如图12所示,并且在图12中的阴影面积中所示的量化误差均匀地分布在整个帧中。这里,通过从增益控制函数生成信息重新构造作为图11的增益控制函数的对应部分(counterpart)的反增益控制函数(具有相反的增益控制函数的值的函数),获得如图13所示的波形,该增益控制函数生成信息通过信号分离上述代码串,并且将图12的波形乘以反增益控制函数而获得。 
如从图13显而易见,该图中的阴影面积中所示的量化误差以这样方式分布,与作为上升部分的脉冲前和后的附近的水平(level)相比,该水平在其它部分衰减,并且由于时间屏蔽的作用,可以显著抑制前回声噪声和后回声噪声。增益控制自身在编码装置的编码算法的优化内,并且根据电路大小和编码装置的应用,各种设置是可能的,例如,如如果充分分配了各个位并且量化误差的生成非常小,则不对具有大的上升的输入信号执行增益控制。 
这样,在音频的高效编码的情况下,通过更好地利用听力特性,通过根据信号的属性适当地控制量化噪声的生成,变得可以有效地压缩信号。 
同时,在这种用于音频信号的高效编码技术中,因为在编码/解码时需要相对大的计算量和存储器,所以提出了一种首先对编码的代码串执行简单的信号处理的技术。这是通过直接改变代码串中包括的参数等而不用执行以下处理,利用小的计算量和小的存储器执行期望的信号处理的技术,所述处理为在将代码串解码为时间轴上的信号后对代码串执行期望的信号处理,然后将信号重新编码。 
例如,专利文献2公开了通过直接改变代码串中的标准化系数信息使得可能进行信号的滤波的技术。此外,专利文献3公开了通过直接改变代码串 中的标准化系数信息使得可能进行信号的水平调整的技术。 
[专利文献1]日本专利No.3263881 
[专利文献2]日本专利No.3879249 
[专利文献3]日本专利No.3879250 
发明内容
本发明要解决的问题 
同时,在采用上述增益控制技术的用于音频的高效编码方法的情况下,当直接应用在上述专利文献2和3中描述的技术时,取决于信号的属性可能出现各种问题。以下,将参照附图说明各种问题。 
例如,假设在通过采用上述增益控制技术的用于音频的高效编码方法、通过编码如图9所示的脉冲状信号获得代码串的情况下,期望通过使用上述专利文献3,通过直接改变代码串中的标准化信息并且执行代码串的水平调整获得淡入(fade-in)的效果。 
在解码装置解码代码串并且获得输出PCM信号后执行信号处理的结果如图14所示。 
这是将解码装置的输出PCM信号乘以淡入函数Fi(t)的结果,该淡入函数Fi(t)随着时间在0到1.0的范围内逐渐增加。 
当通过使用上述专利文献3中描述的技术、利用每帧的标准化系数信息的减法表示淡入函数Fi(t)的形状时,如图15所示。图15中的SFfi(帧)对应于通过重新采样Fi(t)获得的,该Fi(t)是以帧大小的间隔的离散时间的函数,并且将具有正整数的值表示为标准化系数信息的差值。 
在上述专利文献1中描述的用于音频的高效编码方法中,上述标准化系数信息以6位2分贝步幅表示,如图16所示。在图16中,SF是为正整数的标准化系数信息,而SFval(SF)是为正实数的标准化系数。 
图17示出了基于上述专利文献3中描述的技术、通过减去标准化系数信息实现淡入的处理。在该技术中,标准化系数用于在频域中标准化MDCT系数,并且为每个称为量化单元的单元获得,该量化单元是多个MDCT系数的集合。然而,这里为了简单,基于单个标准化系数进行说明。 
图17中的SForg(帧)指示为每帧获得的标准化系数信息。 
这里,关于具有帧号2的帧,它是由于如MDCT中的窗口和脉冲的位置 关系的因素以及用于增益控制的算法,而没有对其执行增益控制的帧。 
相反,当通过使用图15中说明的SFfi(帧)执行标准化系数信息的减法时,如图18所示。由于标准化系数信息是0和63之间的正整数,所以当作为减法的结果标准化系数信息变为负时,在0处截止(cut off)。Tsf指示截止的标准化系数信息的量。 
图19指示包括其中上述标准化系数信息的减法结果变为负并且标准化系数信息在0处截止的帧的结果。 
图19的SFm(帧)指示已经对其执行淡入处理的标准化系数信息。 
图20A示出已经对其应用淡入处理的PCM信号,其中PCM信号已经通过解码与图14的代码串相同的代码串获得,以及图20B示出通过将代码串输入解码装置获得的输出PCM信号,已经对该代码串执行上述对于代码串的淡入处理。在具有帧号0和1的帧中,标准化系数被截止,然后执行反增益控制,结果,与图20A的脉冲信号相比,脉冲信号更大。另一方面,在帧号2中,没有执行增益控制,并且标准化系数没有截止,因此,幅度值对应于图20A的脉冲信号。 
已经考虑这种情况实现了本发明,并且本发明的目的是提供一种信号处理装置、方法和程序,能够解决当直接处理通过使用增益控制的用于音频的高效编码方法编码的代码串并且应用信号处理(如淡入、淡出等)时出现的问题,并且能够输出高质量代码串。 
解决问题的手段 
为了解决上述问题,在对通过将输入数字信号划分为沿着时间轴的各块、沿着时间轴对每个块执行增益控制、利用正值对增益控制的信号分量执行标准化、量化标准化的信号分量、和执行编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得的代码串执行的信号处理中,所述增益控制函数生成信息生成用于执行增益控制的增益控制函数,本发明可以通过从代码串中的标准化系数信息中减去整数值或增加整数值到代码串中的标准化系数信息来执行编码的代码串的信号的水平调整,对于标准化系数信息的减少量大于标准化系数信息并且减少后的标准化系数信息在最小可能的值截止的情况,根据截止量修改增益控制函数生成信息。 
这里,对于标准化系数信息的增加量大并且增加后的标准化信息在最大可能的值截止的情况,可以根据截止量修改增益控制函数生成信息。 
本发明的效果 
根据本发明,当直接处理代码串并且应用信号处理(如淡入、淡出等)时,可以通过根据标准化系数信息的截止量适当重写增益控制信息,抑制由于标准化系数信息的截止和反增益控制出现的信号的放大,并且输出已经对其执行了期望的信号处理的代码串。 
附图说明
图1是示出作为本发明的实施例的信号处理装置的示意配置的方块图。 
图2是示出本发明实施例的编码方法的代码串的格式示例的图。 
图3是示出本发明实施例的4位增益控制水平信息表的示例的图。 
图4A是示出本发明实施例的反增益控制函数的具体示例的图。 
图4B是示出本发明实施例的反增益控制函数的具体示例的图。 
图5是用于说明本发明实施例的增益控制函数生成信息修改电路的处理步骤的示例的流程图。 
图6是用于说明由于本发明实施例的反增益控制而出现的整个帧的增益的放大量GM的计算的示例的流程图。 
图7是用于说明标准化系数信息的增加结果和标准化系数信息的对应截止的图。 
图8是示出标准化系数信息的截止的具体示例的图。 
图9是示出恒定周期和恒定幅度的脉冲信号的图。 
图10是示出在用于音频的一般高效编码中的解码信号中的回声噪声的生成的图。 
图11是示出在输入脉冲信号的情况下的增益控制函数的示例的图。 
图12是示出其中将量化误差增加到增益控制的信号的状态的图。 
图13是示出用于抑制回声噪声的增益控制的效果的图。 
图14是示出为每个时间样本执行淡入的函数的图。 
图15是示出对应于淡入函数的标准化系数信息的减少的图。 
图16是示出6位标准化系数表的示例的图。 
图17是示出标准化系数信息的减少结果和标准化系数信息的对应截止的图。 
图18是示出标准化系数信息的截止的具体示例的图。 
图19是示出标准化系数信息的减少结果和标准化系数信息的对应截止的图。 
图20A是示出如何依赖于标准化系数信息的截止和反增益控制之间的关系放大信号的图。 
图20B是示出如何依赖于标准化系数信息的截止和反增益控制之间的关系放大信号的图。 
标号说明 
101信号分离电路 
102标准化系数信息增加/减少电路 
103标准化系数信息截止量计算电路 
104增益控制函数生成信息修改电路 
105多路复用电路 
具体实施方式
以下,将参照附图详细描述应用了本发明的具体实施例。 
图1是示意性示出在本发明实施例中使用的信号处理装置的配置的方块图。 
图1所示的信号处理装置配置为具有信号分离电路101、标准化系数信息增加/减少电路102(标准化系数信息增加/减少部件)、标准化系数信息截止量计算电路103(截止量计算部件)、增益控制函数生成信息修改电路104(增益控制函数生成信息的修改部件)以及多路复用电路105。 
信号分离电路101将从输入端子110输入的代码串信号分离,将标准化系数信息提供到标准化系数信息增加/减少电路102,并且将增益控制函数生成信息提供到增益控制函数生成信息修改电路104。稍后将描述从输入端子110输入到信号分离电路101的代码串的示例。 
标准化系数信息增加/减少电路102基于从输入端子112给出的标准化系数信息增加/减少量,增加或减少标准化系数信息,并且作为计算结果,当超过标准化系数信息的可能的上限或可能的下限时,每个由上限或下限替代。将作为输出的标准化系数信息提供到增益控制函数生成信息修改电路104以及多路复用电路105。 
被上限/下限替代前的标准化系数信息作为截止前标准化系数信息提供 到标准化系数信息截止量计算电路103。 
关于这里的标准化系数信息的增加/减少,可以使用如上所述的与图17一起描述的方法。 
标准化系数信息截止量计算电路103比较从标准化系数信息增加/减少电路102输出的标准化系数信息和同样从标准化系数信息增加/减少电路102输出的截止前的标准化系数信息,并且计算标准化系数信息截止量以提供给增益控制函数生成信息修改电路104。 
关于这里的标准化系数信息截止量的计算,可以使用如上所述与图18和19一起描述的方法。 
增益控制函数生成信息修改电路104比较从信号分离电路101输出的增益控制函数生成信息与从标准化系数信息截止量计算电路103输出的标准化系数信息截止量,获得增益控制函数生成信息修改量,并且修改增益控制函数生成信息。稍后将描述增益控制函数生成信息修改电路104的详细操作等。 
修改的增益控制函数生成信息提供到多路复用电路105。 
多路复用电路105具有从标准化系数信息增加/减少电路102输出的标准化系数信息、从增益控制函数生成信息修改电路104输出的增益控制函数生成信息以及来自输入端子110的输入代码串作为输入,利用其每个重新从标准化系数信息增加/减少电路102和增益控制函数生成信息修改电路104获得的标准化系数信息和增益控制函数生成信息替代输入代码串的相应部分,执行多路复用,并且从输出端子115输出输出代码串。 
这里,将使用图2说明要作为信号分离电路101的输入的上述代码串的示例。 
图2示出了配置上述代码串的各帧之一,并且由报头、增益控制函数生成信息、标准化系数信息和标准化信号数据配置。 
增益控制函数生成信息由增益控制改变点的数量、增益控制改变点位置信息和增益控制水平信息配置,并且增益控制改变点位置信息和增益控制水平信息的条数基于增益控制改变点的数量确定。 
增益控制水平信息Glev是例如图3中的4位代码,并且其增益控制水平Gain通过以下等式作为Glev的函数获得。 
Gain(Glev)=2^(Glev-4) 
在图4A和4B中示出了基于图2的增益控制函数生成信息、由解码器生 成的反增益控制函数的具体示例。 
在图4A中,增益控制改变点的数量是2,并且两条增益控制改变点位置信息分别示出为Gloc[0]和Gloc[1],并且两条增益控制水平信息分别示出为Glev[0]和Glev[1]。 
增益控制改变点位置信息Gloc指示将帧均匀再分为子帧的位置,并且如图4所示,在Gloc[0]的增益控制水平信息对应于Glev[0]。此外,在具有增益控制改变点位置信息Gloc的子帧之前的子帧的位置处的增益控制水平信息,是紧接在上述具有Gloc的子帧之后的下一具有Gloc的子帧的增益控制水平信息。 
此外,如图4所示,在帧的末端的子帧的增益控制水平是1.0。 
此外,图4中的反增益控制函数在关系上与图3所示的4位代码的增益控制水平信息相反,并且例如,Gain(3)的0.5是2.0乘以反增益控制函数的增益改变。 
利用图4的增益控制函数,各个子帧的增益控制水平通过直线内插。然而,作为根据本发明的另一实施例,可以使用正弦函数等执行内插,或者不必执行内插。 
图2的增益控制函数生成信息以上述格式记录,此外,该图2中的标准化信号数据对应于通过将输入PCM信号除以上述增益控制函数、然后通过标准化系数执行标准化获得的标准化信号数据。 
作为本发明实施例的信号处理装置的示意性配置和方法将总结如下。也就是说,首先,作为用于获得要对其执行信号处理的代码串的编码方法,使用一种编码方法,其通过在编码输入PCM信号时,对每个时间块执行沿着时间轴的增益控制、通过利用正值执行增益控制后的信号分量的标准化、量化标准化的信号分量、和执行编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得代码串,所述增益控制函数生成信息生成用于执行增益控制的增益控制函数。当解码这种编码的串时,使用一种解码方法,其通过信号分离上述代码串,解码编码的信号分量,执行去量化,然后通过使用上述标准化系数信息执行去标准化,并且通过使用反增益控制函数执行反增益控制获得输出PCM信号,该反增益控制函数是上述使用增益控制函数生成信息的增益控制函数的对应部分。在本发明的实施例中,对通过上述编码方法编码的代码串执行信号处理,上述编码方法通过从上述代码串中减少整 数或将整数增加到上述代码串来调整信号的水平,并且当上述标准化系数信息的减少量大于标准化系数信息,并且减少后的标准化系数信息在最小可能值截止时,根据截止量修改增益控制函数生成信息。 
根据本发明实施例的这种配置,当利用小的计算量和存储器使用对通过用于音频的高效编码方法获得的代码串执行音量控制而不解码代码串时,该用于音频的高效编码方法通过调整标准化系数使用增益控制,变得可以通过根据标准化系数的截止量适当修改增益控制函数生成信息,抑制由标准化系数的截止和反增益控制导致的音量的过度放大,并且可以执行期望的音量控制。 
在本发明实施例的说明中,使用通过对输入PCM信号执行增益控制、然后执行标准化并且执行量化和编码获得的代码串。然而,关于根据本发明的另一实施例,可以使用通过例如对输入PCM信号使用子带划分滤波器以获得子带信号、然后执行增益控制获得的代码串。 
此外,作为根据本发明的另一实施例,还可以应用于通过对执行增益控制获得的信号执行如MDCT的时间-频率转换、并且对获得的MDCT系数的每个特定块执行标准化、量化和编码获得的代码串。 
接着,下面将详细描述具有上述图1的配置的信号处理装置的增益控制函数生成信息修改电路104。 
增益控制函数生成信息修改电路104是用于防止由上述标准化系数信息的截止和反增益控制导致的信号的过度放大的出现的电路。将参照图5和6的流程图说明其特定操作的步骤。 
首先,在图5的步骤S1中,确定是否必需为要处理的帧修改增益控制函数生成信息。 
步骤S1的Tsf是上述图17的标准化系数信息的截止量,并且作为标准化系数信息截止量计算电路103的输出获得。GM是由于反增益控制出现的整个帧的增益的放大量,并且将在图6的说明中描述。α是常数。 
在步骤S1中,确定标准化系数信息的截止量Tsf是否大于α·GM,并且当判断为是(真)时,即,当判断标准化系数信息的截止量大于由于反增益控制出现的整个帧的增益的放大量时,执行步骤S2的处理。当在步骤S1中判断为否时,处理结束。 
在步骤S2中,将用于增益控制改变点的数量的计数器J用0初始化,并 且此后执行循环处理NGC次,其中NGC是增益控制改变点的数量,并且操作进行到步骤S3。 
在步骤S3,判断增益控制水平信息Glev[J]是否小于4,即,执行用于放大反增益控制函数的增益的情况的判断处理。 
当在步骤S3中判断为是时(Glev[J]小于4),执行步骤S4的处理,并且当判断为否时(Glev[J]为4或更大),进行到步骤S7。注意,在步骤S7,执行将用于增益控制改变点的数量的计数器J增加的处理(J=J+1)。 
在步骤S4,执行用于增益放大的抑制处理。为了更精确,通过将标准化系数信息截止量Tsf除以3以使其为对应于增益控制水平信息的值、并且将该值增加到增益控制水平信息Glev[J](Glev[J]=Glev[J]+Tsf/3),执行增益放大的抑制处理。如从上述图16和3显而易见,标准化系数是2-dB步幅,而增益控制水平是6-dB步幅的值。在步骤S4的处理后,进行到步骤S5。 
接着,在步骤S5和步骤S6,执行上述步骤S4的计算结果的截止。即,在步骤S5,确定在步骤S4处理后的增益控制水平信息Glev[J]是否超过15的截止值,并且当超过15时,进行到步骤S6以使得Glev[J]为15,然后进行到步骤S7(计数器J的增量处理)。当为15或更小时,直接进行到步骤S7。 
这被执行使得作为到增益控制水平信息的增加的结果,Glev[J]不超过其最大可能的值。作为根据本发明实施例的另一示例,可以使得截止值小于15。执行增益控制以抑制前/后回声噪声,并且分别为编码和解码执行的增益控制和反增益控制理论上是无损处理。然而,如果这里对于增益控制水平信息的修改变得非常大,则增益控制和反增益控制之间的配对关系被严重破坏。 
接着,参照图6的流程图,将进行由于反增益控制出现的整个帧的增益的放大量GM的计算的说明。 
首先,在图6的步骤S11中,执行各种初始化。在图6的流程图中,I用作增益控制改变点的数量的计数器,并且J用作子帧的计数器。NGC是增益控制改变点的数量,并且NS是子帧的数量。GL是暂时保持增益控制改变点位置信息Gloc的变量。GM是通过流程图的处理获得的整个帧的增益的放大量,并且初始化为0。G是在计算增益的放大量GM时使用的增益控制水平信息的变量,并且初始化为0。 
在步骤S11中执行初始化后,对每个子帧执行从步骤S12到步骤S19的循环处理。 
在步骤S12,确定子帧计数器(子帧的位置)的值J是否匹配变量GL(其中保持的增益控制改变点位置信息Gloc),并且当为是时,即,子帧计数器的值J匹配增益控制改变点位置,进行到步骤S13,并且当前子帧中的增益控制水平信息的变量G更新。当在步骤S12中确定为否时,进行到步骤S17。 
在步骤S13,通过从增益控制水平信息Glev[J]减去4获得的值分配给增益控制水平信息的变量G(G=Glev[J]-4),此外,增益控制改变点的数量的计数器递减(I=I-1)。 
在步骤S13的处理后,根据步骤S14到步骤S16中的I更新GL的值。 
也就是说,在步骤S14,确定I是否为0或更大,当为是时,进行到步骤S15,并且将对应于递减的I的增益控制改变点位置信息Gloc[I]分配给变量GL,并且进行到步骤S17。当在步骤S14确定为否时,在步骤S16使得GL为-1(GL=-1),并且进行到步骤S17。 
在步骤S17,将当前子帧的增益控制水平信息G加到GM(GM=GM+G)。 
在下一步骤S18,子帧计数器的值J递减(J=J-1),并且进行到步骤S19以确定J是否小于0(J<0)。当确定为否时,返回到上述步骤S12,并且当为是时,处理结束。 
如上所述,为每个子帧更新GM,并且获得整个帧的增益的放大量。 
因为考虑到由于标准化系数信息的截止量和反增益控制出现的整个帧的增益的放大量,需要修改增益控制函数生成信息,所以执行该处理。 
这里,图4A和4B示出由于增益控制改变点位置信息的差导致的反增益函数之间的差。在图4B中的帧内的增益放大量大于图4A中的增益放大量。 
这意味着,在编码的增益控制中,增益抑制量已经变大。在后者的情况下,标准化系数信息变小,因此,标准化系数信息的截止量变大。在这种情况下,根据标准化系数信息的截止量的增益控制函数信息的修改是不必要的。 
以此方式,通过根据标准化系数信息的截止量适当修改增益控制函数生成信息,可以防止增益的过度放大。 
在上述本发明的实施例中,在执行信号的水平调整而不解码代码串的情况下,由于在标准化系数信息的减法后的标准化系数信息的最小值处的截止,出现了问题,并且已经描述了其解决方法。另一方面,在使用标准化系数信息的加法放大信号的情况下,可能出现类似问题。 
图7和8是示出在使用标准化系数信息的增加放大信号的情况下的问题。 在头帧中,标准化系数信息的加法结果是67,出现4的截止。在这种情况下,当通过反增益控制存在信号的衰减时,不能通过标准化系数信息的增加获得信号的期望放大的结果。 
同样在这种情况下,通过使用类似于上述本发明实施例的方法,通过适当修改增益控制函数生成信息,可以防止增益的过度衰减。 
这里,根据上述本发明实施例的信号处理方法中的每个步骤可以提供作为要由计算机执行的程序。 
根据上述本发明实施例,当直接处理通过使用增益控制的用于音频的高效编码方法编码的代码串并且应用信号处理(如淡入、淡出等)时,可以通过根据标准化系数信息的截止量适当重写增益控制信息,抑制由于标准化系数信息的截止和反增益控制而出现的信号的放大,并且输出已经对其执行了期望的信号处理的代码串。 
注意,本发明不限于上述实施例,并且不用说各种修改是可能的,只要它们在本发明的范围内。 

Claims (8)

1.一种信号处理装置,其对代码串执行信号处理,所述代码串通过将输入音频信号划分为沿着时间轴的各块、对沿着时间轴的每个块执行增益控制、利用正值对已经执行了增益控制的信号分量进行标准化、量化标准化的信号分量、和编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得,所述增益控制函数生成信息生成用于执行增益控制的增益控制函数,所述信号处理装置包括:
标准化系数信息增加/减少部件,用于通过从代码串中的标准化系数信息中减去整数值或增加整数值到代码串中的标准化系数信息来对编码的代码串调整信号水平;
截止量计算部件,用于对以下情况计算截止量,其中因为标准化系数信息的减少或增加量大,所以减少或增加后的标准化系数信息在其最小或最大可能值截止;以及
修改部件,用于根据来自截止量计算部件的截止量修改增益控制函数生成信息。
2.如权利要求1所述的信号处理装置,其中
所述截止量计算部件对以下情况计算截止量,其中标准化系数信息的减少量大于标准化系数信息,并且减少后的标准化系数信息在其最小可能值截止。
3.如权利要求1所述的信号处理装置,其中
对其执行增益控制的信号分量是通过对输入的音频信号使用子带划分滤波器获得的子带信号。
4.如权利要求1所述的信号处理装置,其中
被标准化的信号分量是通过在执行增益控制后执行MDCT(修正的离散余弦变换)获得的MDCT系数。
5.如权利要求4所述的信号处理装置,其中
对多个MDCT系数的每个执行标准化,并且作为标准化的输出获得多条标准化系数信息。
6.如权利要求1所述的信号处理装置,其中
只有当代码串包括增益控制函数生成信息时,才修改增益控制函数生成信息。
7.一种对代码串执行信号处理的信号处理方法,所述代码串通过将输入音频信号划分为沿着时间轴的各块、对沿着时间轴的每个块执行增益控制、利用正值对已经执行了增益控制的信号分量进行标准化、量化标准化的信号分量、和编码以及与增益控制函数生成信息和标准化系数信息一起多路复用而获得,所述增益控制函数生成信息关于生成用于执行增益控制的增益控制函数,所述信号处理方法包括以下步骤:
通过从代码串中的标准化系数信息中减去整数值或增加整数值到代码串中的标准化系数信息来对编码的代码串调整信号水平;以及
如果标准化系数信息的减少量大于标准化系数信息并且减少后的标准化系数信息在其最小可能值截止,则根据截止量修改增益控制函数生成信息。
8.如权利要求7所述的信号处理方法,还包括以下步骤:如果标准化系数信息的增加量大并且增加后的标准化信息在其最大可能值截止,则根据截止量修改增益控制函数生成信息。
CN2008800035446A 2007-07-30 2008-06-26 信号处理装置和方法 Expired - Fee Related CN101595523B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP197959/2007 2007-07-30
JP2007197959A JP5045295B2 (ja) 2007-07-30 2007-07-30 信号処理装置及び方法、並びにプログラム
PCT/JP2008/061613 WO2009016901A1 (ja) 2007-07-30 2008-06-26 信号処理装置及び方法、並びにプログラム

Publications (2)

Publication Number Publication Date
CN101595523A CN101595523A (zh) 2009-12-02
CN101595523B true CN101595523B (zh) 2012-04-18

Family

ID=40304138

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008800035446A Expired - Fee Related CN101595523B (zh) 2007-07-30 2008-06-26 信号处理装置和方法

Country Status (7)

Country Link
US (1) US8478586B2 (zh)
EP (1) EP2088582A4 (zh)
JP (1) JP5045295B2 (zh)
KR (1) KR20100039824A (zh)
CN (1) CN101595523B (zh)
HK (1) HK1133945A1 (zh)
WO (1) WO2009016901A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6531649B2 (ja) * 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
CN105849801B (zh) 2013-12-27 2020-02-14 索尼公司 解码设备和方法以及程序

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1124545A (zh) * 1994-02-04 1996-06-12 索尼公司 信息编码/译码方法和装置、信息记录媒体和信息传输方法
CN1236164A (zh) * 1998-05-14 1999-11-24 索尼公司 再现和记录装置、译码装置、记录装置、及其相应方法
CN1291766A (zh) * 1999-09-01 2001-04-18 索尼株式会社 数字信号处理设备和数字信号处理方法
CN1897467A (zh) * 2005-07-11 2007-01-17 索尼株式会社 信号编码、信号解码装置和方法、程序以及记录介质
CN1992533A (zh) * 2005-12-26 2007-07-04 索尼株式会社 信号编码设备和方法、信号译码设备和方法、程序及介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0653846B1 (en) 1993-05-31 2001-12-19 Sony Corporation Apparatus and method for coding or decoding signals, and recording medium
JP3263881B2 (ja) 1994-02-04 2002-03-11 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置並びに情報記録媒体及び情報伝送方法
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
JP3164038B2 (ja) 1997-11-05 2001-05-08 日本電気株式会社 音声帯域分割復号装置
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP3879249B2 (ja) 1998-05-14 2007-02-07 ソニー株式会社 エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP3879250B2 (ja) 1998-05-14 2007-02-07 ソニー株式会社 エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置
JP2000078017A (ja) * 1998-09-02 2000-03-14 Sony Corp デコード方法及びデコード装置
US6353808B1 (en) * 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
EP1047047B1 (en) * 1999-03-23 2005-02-02 Nippon Telegraph and Telephone Corporation Audio signal coding and decoding methods and apparatus and recording media with programs therefor
JP4441989B2 (ja) * 2000-05-30 2010-03-31 ソニー株式会社 符号化装置および符号化方法
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
JP2004361602A (ja) * 2003-06-04 2004-12-24 Sony Corp データ生成方法およびデータ生成装置、データ復元方法およびデータ復元装置、並びにプログラム
US7595819B2 (en) * 2003-07-31 2009-09-29 Sony Corporation Signal processing device and signal processing method, program, and recording medium
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7860194B2 (en) * 2005-11-11 2010-12-28 Samsung Electronics Co., Ltd. Method and apparatus for normalizing input metric to a channel decoder in a wireless communication system
JP5098492B2 (ja) * 2007-07-30 2012-12-12 ソニー株式会社 信号処理装置及び信号処理方法、並びにプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1124545A (zh) * 1994-02-04 1996-06-12 索尼公司 信息编码/译码方法和装置、信息记录媒体和信息传输方法
CN1236164A (zh) * 1998-05-14 1999-11-24 索尼公司 再现和记录装置、译码装置、记录装置、及其相应方法
CN1291766A (zh) * 1999-09-01 2001-04-18 索尼株式会社 数字信号处理设备和数字信号处理方法
CN1897467A (zh) * 2005-07-11 2007-01-17 索尼株式会社 信号编码、信号解码装置和方法、程序以及记录介质
CN1992533A (zh) * 2005-12-26 2007-07-04 索尼株式会社 信号编码设备和方法、信号译码设备和方法、程序及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JP特开2000-78017A 2000.03.14
JP特开2001-337699A 2001.12.07

Also Published As

Publication number Publication date
HK1133945A1 (en) 2010-04-09
KR20100039824A (ko) 2010-04-16
WO2009016901A1 (ja) 2009-02-05
EP2088582A4 (en) 2012-08-01
US20100106494A1 (en) 2010-04-29
JP5045295B2 (ja) 2012-10-10
US8478586B2 (en) 2013-07-02
EP2088582A1 (en) 2009-08-12
JP2009031675A (ja) 2009-02-12
CN101595523A (zh) 2009-12-02

Similar Documents

Publication Publication Date Title
CN101595523B (zh) 信号处理装置和方法
RU2608878C1 (ru) Регулировка уровня во временной области для декодирования или кодирования аудиосигналов
CN100589657C (zh) 编码音频的节约式响度测量方法及装置
JP7471356B2 (ja) 入力オーディオ信号のダイナミックレンジを調整する方法、オーディオ信号処理装置及び記憶媒体
CN101443842B (zh) 信息信号编码
JP4579273B2 (ja) ステレオ音響信号の処理方法と装置
CN105074818B (zh) 音频编码系统、用于产生比特流的方法以及音频解码器
JP3782103B2 (ja) アダプティブディザを減算し、埋没チャンネルビットを挿入し、フィルタリングすることによりマルチビット符号ディジタル音声を符号化する方法及び装置、及びこの方法のための符号化及び復号化装置。
US9741351B2 (en) Adaptive quantization noise filtering of decoded audio data
CA2422790A1 (en) Error concealment in relation to decoding of encoded acoustic signals
AU2010309894A1 (en) Multi-mode audio codec and CELP coding adapted therefore
KR20070028481A (ko) 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법
JP6049762B2 (ja) オーディオ処理
CN104981981B (zh) 数字音频信号中的前回声的有效衰减
CN104584122A (zh) 使用改进的概率分布估计的基于线性预测的音频编码
CN101432803A (zh) 编码方法和编码装置
AU2005213767A1 (en) Method and device for quantizing a data signal
WO2005027096A1 (en) Method and apparatus for encoding audio
CN101960514A (zh) 信号分析控制系统及其方法、信号控制装置及其方法和程序
Edler et al. Perceptual audio coding using a time-varying linear pre-and post-filter
Nawab et al. Efficient STFT approximation using a quantization and differencing method
CN102208901B (zh) 一种mp3解码过程中实现均衡器的方法
Chen et al. Fast time-frequency transform algorithms and their applications to real-time software implementation of AC-3 audio codec
KR20060006899A (ko) 디지털 볼륨 제어 장치 및 오디오 장치
KR20150112028A (ko) 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1133945

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1133945

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120418

Termination date: 20150626

EXPY Termination of patent right or utility model