CN102165519A - 处理信号的方法和装置 - Google Patents

处理信号的方法和装置 Download PDF

Info

Publication number
CN102165519A
CN102165519A CN2009801378698A CN200980137869A CN102165519A CN 102165519 A CN102165519 A CN 102165519A CN 2009801378698 A CN2009801378698 A CN 2009801378698A CN 200980137869 A CN200980137869 A CN 200980137869A CN 102165519 A CN102165519 A CN 102165519A
Authority
CN
China
Prior art keywords
ipd
value
signal
unit
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801378698A
Other languages
English (en)
Inventor
李显国
金东秀
尹圣龙
林宰显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority claimed from PCT/KR2009/005500 external-priority patent/WO2010036062A2/en
Publication of CN102165519A publication Critical patent/CN102165519A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了一种处理信号的方法。本发明包括接收(a)从多信道信号生成的下混信号,和(b)表示多信道信号的属性的空间信息,以便对下混信号进行上混;从空间信息的头部获得表示IPD值是否被用于空间信息的信道间相位差(IPD)编译标记;基于IPD编译标记从帧中获得表示IPD值是否被用于空间信息的帧的IPD模式标记;基于IPD模式标记从帧中的参数频带获得IPD值;通过将IPD值应用于下混信号而生成多信道信号,其中空间信息被划分为头部和多个帧,并且其中IPD值表示多信道信号的两个信道之间的相位差,并且其中参数频带是包括IPD值的频域的至少一个子频带。

Description

处理信号的方法和装置
技术领域
本发明涉及用于处理信号的装置及其方法。虽然本发明适用于宽的应用范围,但其尤其适用于增强信号的音质,并且以使用从移动输入信号的相位所生成的信号以及使用相移信号的信道间相位差值的方式更加完美地重建输入信号。
背景技术
通常,为了从单声道信号生成立体声信号,信号被使用解相关器进行编译。
并且,信号处理器能够使用信道间电平差值和信道间相关性值来编译信号。
发明内容
但是,在使用解相关器生成音频信号的情况下,该解相关器不能精确再现在信道信号之间存在的相位差或者延迟差。
在使用信道间电平差值和信道间相关性值来编译信号的情况下,不能恢复和反映输入信号的信道间相位差。因此,很难执行精确的声音图像定位(sound image localization)。并且,不能恢复输入信号的混响。
因此,本发明提出了一种用于处理信号的装置及其方法,其基本上消除了一个或多个由于相关技术的限制和缺点而引起的问题。
本发明的一个目的是提供一种用于处理信号的装置及其方法,通过其音质被增强,并且可以以重建和移动解码后的音频或者语音信号的相位的方式来提供接近于原始声音的信号。
因此,本发明提供以下的效果和/或优点。
第一,在按照本发明用于处理信号的方法和装置中,在通过基于相移标记移动解码后的音频信号或者语音信号的相位来执行解码时,能够有效地再现难以由解相关器有效再现的相位或者延迟差。
第二,在按照本发明用于处理信号的方法和装置中,基于信道间相位差(IPD)编译标记和信道间相位差(IPD)模式标记,难以使用信道间电平差值和信道间相关性值重建的混响被使用信道间相位差(IPD)值重建。并且,还能够清楚地执行声音图像定位。
第三,在按照本发明用于处理信号的方法和装置中,通过接收表示信道间相位差值是否被用于每个帧的信道间相位差模式标记,必要时能够使用信道间相位差值来解码信号。
第四,在按照本发明用于处理信号的方法和装置中,通过使用先前参数时隙(parameter time slot)的信道间相位差值来修改(平滑)当前参数时隙的信道间相位差值,能够除去噪声,该噪声可能从两个信道间相位信息之间的差值中瞬时生成。
第五,在按照本发明用于处理信号的方法和装置中,通过仅在满足预定条件的时候传送信道间相位差值,能够提高编译效率。并且,还能够解码接近于原始声音的信号。
第六,在按照本发明用于处理信号的方法和装置中,由编码器测量的信道间相位差值被转换为信道间电平差值,并且然后该转换的信息被传送。因此,即使使用不允许传输信道间相位差值的常规信号处理装置和方法,也能够重建具有增强的混响和接近于原始声音的声音图像定位的信号[向后兼容]。
附图说明
所附附图被包括以提供对本发明进一步的理解,并且被结合进和构成本说明书的一部分,其举例说明本发明的实施例,并且与说明书一起可以起解释本发明原理的作用。
在附图中:
图1是按照本发明的一个实施例,用于信号处理方法的概念的示意图;
图2是按照本发明的一个实施例,用于处理信号的装置的方框图;
图3是在信号中相位和时间之间的关系的图形;
图4是在图2中示出的IPD测量单元和IPD获得单元的详细方框图;
图5是按照本发明另一个实施例的信号处理装置的方框图;
图6是按照本发明另一个实施例的信号处理装置的方框图;
图7是按照现有技术的参数时隙的概念的示意图;
图8是按照本发明另一个实施例,用于修改(平滑)信道间相位差值的方法的示意图;
图9是按照在图8示出的本发明另一个实施例的信号处理装置的方框图;
图10是按照本发明另一个实施例,信号处理装置和方法所解决的问题的概念的示意图;
图11和图12是按照本发明另一个实施例的信号处理装置的方框图;
图13是按照本发明另一个实施例,使用全局帧(global frame)信道间相位差(IPD)值的概念的示意图;
图14是按照本发明另一个实施例的信号处理装置的方框图;
图15至17是按照本发明另一个实施例的信号处理装置的方框图;
图18是按照本发明另一个实施例,包括IPD编译标记获得单元、IPD模式标记获得单元、IPD获得单元和上混(upmixing)单元的产品的结构的示意图;
图19分别是按照本发明另一个实施例,包括IPD编译标记获得单元、IPD模式标记获得单元、IPD获得单元和上混单元的产品的关系的示意图;和
图20是按照本发明另一个实施例,包括IPD编译标记获得单元、IPD模式标记获得单元、IPD获得单元和上混单元的广播信号解码装置的简略方框图。
具体实施方式
本发明的另外的特点和优点将在随后的描述中阐述,并且部分地从该描述中将是清晰可见的,或者可以通过实践本发明获悉。通过尤其在所撰写的说明书及其权利要求以及所附附图中指出的结构,可以实现和获得本发明的目的和其他的优点。
为了实现这些和其他的优点,以及按照本发明的目的,如在此处实施和广泛地描述的,一种处理信号的方法,包括:接收(a)从多信道信号生成的下混信号,和(b)表示多信道信号的属性的空间信息,以便对下混信号进行上混;从空间信息的头部中获得表示IPD值是否被用于空间信息的信道间相位差(IPD)编译标记;基于IPD编译标记从帧中获得表示IPD值是否被用于空间信息的帧的IPD模式标记;基于IPD模式标记在帧中从参数频带获得IPD值;通过将IPD值应用于下混信号来生成多信道信号,其中空间信息被划分为头部和多个帧,并且其中IPD值表示在多信道信号的两个信道之间的相位差,并且其中参数频带是包括IPD值的频域的至少一个子频带。
该方法进一步包括按照量化模式标记,通过确定反量化程度(dequantization degree)来对IPD值进行反量化。
该量化模式标记是由量化距离确定的。
应该明白,上文的概述和下面的详细说明是示范性和说明性的,并且意欲对所要求保护的本发明提供进一步的说明。
现在将详细地进行介绍本发明的优选实施例,其例子被在所附附图中举例说明。首先,在本说明书和权利要求书中使用的术语或者措词不认为局限于常规的或者字典含义,并且应该认为是基于发明人能够恰当地定义该术语的概念以便以最好的方式描述发明人的发明的原则,匹配本发明的技术想法的含义和概念。在本公开中公开的实施例和在所附附图中示出的结构仅仅是一个优选实施例,并且不表示本发明的所有技术想法。因此,应该明白,本发明覆盖本发明的修改和变化,只要它们归入在提交本申请时所附权利要求书及其等效物的范围之内。
首先,应该明白,在本发明中概念“编译”包括编码和解码两者。
其次,在本公开中,“信息”是通常包括值、参数、系数、元素等等的术语,并且其含义可以认为偶尔地不同,本发明不限于此。在本公开中立体声信号被作为信号的例子,本发明的例子不限于此。例如,在本公开中的信号可以包括具有至少三个或更多个信道的多信道信号。
图1是按照本发明的一个实施例,用于信号处理方法的概念的示意图。
参考图1,空间信息可以被划分为头部和多个帧。在这种情况下,该空间信息是表示多信道信号(其是输入信号)的属性的信息。并且,该空间信息可以包括表示在多个信道中的两个信道之间电平差的信道间电平差值,表示在两个信道之间相关性的信道间相关性值,和表示在两个信道之间相位差的信道间相位差值。在通过上混来重建下混信号时这个空间信息是可使用的,该下混信号是由解码器从对多信道信号进行下混而生成的。
该空间信息的头部包括表示用于使用信道间相位差值的帧是否存在于整个帧中的信道间相位差编译标记(bsPhaseCoding)。尤其是,由于信道间相位差编译标记包括在该头部中,所以能够确定信道间相位差值是否被用于该空间信息的所有帧中的至少一个。该信道间相位差编译标记的含义在表1中示出。
[表1]
 bsPhaseCoding   含义
 1   这表示IPD编译被用于空间信息。即,这表示IPD值被用于所有帧中的至少一个。
 0   这表示IPD编译没有被用于空间信息。即,这表示IPD值没有被用于所有帧。
另外,信道间相位差模式标记(bsPhaseMode)表示信道间相位差值是否被用于帧,该信道间相位差模式标记(bsPhaseMode)包括在空间信息的每个帧中。只有在信道间相位差编译标记被设置为1的时候,即,信道间相位差编译标记表示IPD编码被用于空间信息的时候,该信道间相位差模式标记被包括在该帧中。该信道间相位差模式标记(bsPhaseMode)的详细含义在表2中示出。
[表2]
 bsPhaseMode  含义
 1  这表示IPD值被用于当前帧。
 0  这表示IPD值没有被用于当前帧。
现在参考图1,如果帧2的信道间相位差模式标记被设置为1[bsPhaseMode=1],则信道间相位差值(IPD)作为非零值包括在帧2中。如果帧3的信道间相位差模式标记被设置为0[bsPhaseMode=0],则帧3中的信道间相位差值(IPD)具有设置为0的值。
因此,该信道间相位差值是基于信道间相位差编译标记和信道间相位差模式标记而获得的,并且然后其被应用于下混信号以便上混为多信道信号。
图2是按照本发明的一个实施例,用于处理信号的装置的方框图。
参考图2,信号处理装置200包括下混单元210、空间信息生成单元220、信息获得单元230和上混单元240。
该下混单元210接收多信道信号的输入,并且然后能够生成下混信号(DMX)。在这种情况下,多信道信号包括具有至少三个或更多个信道的信号。并且,多信道信号可以包括具有单声道或者立体声信道的信号。该下混单元210能够通过下混多信道信号而生成下混信号,该下混信号具有的信道少于多信道信号的信道。
如在参考图1先前的描述中提及的,该空间信息生成单元220生成空间信息以稍后在解码器中对下混信号进行上混合。并且,这个空间信息可以表示多信道信号的属性。如在先前的描述中提及的,该空间信息可以包括信道间电平差值、信道间相关性值、信道间相位差值等等。在本公开中,该信道间相位差值参考在图2中示出的空间信息生成单元220详细地解释如下。
首先,该空间信息生成单元220包括IPD使用确定单元221、IPD值测量单元222、IPD模式标记生成单元223和IPD编译标记生成单元224。
该IPD使用确定单元221能够确定信道间相位差(IPD)值是否将被包括在空间信息中。尤其是,该IPD使用确定单元221能够基于多信道信号的特征,并且尤其是基于信道间相位差值和信道间电平差值的比率,来确定信道间相位差(IPD)值是否将被包括在空间信息中。例如,如果多信道信号是语音信号,则能够确定该信道间相位差(IPD)值将被包括在空间信息中。稍后将详细说明这些。
如果IPD使用确定单元221确定使用信道间相位差值,则该IPD值测量单元从输入给空间信息生成单元200的多信道信号中测量在两个信道之间的相位差。在这种情况下,测量的相位差可以包括相位和/或角度、时间差或者对应于角度或者时间差的索引值。在信号中,相位和时间具有密切关系,稍后参考图3详细地对其进行解释。
IPD模式标记生成单元223生成参考图1描述的信道间相位差模式标记(bsPhaseMode)。尤其是,该信道间相位差模式标记表示信道间相位差值是否被用于帧。并且,这个帧可以是信道间相位差值包括在其中的当前帧。因此,信道间相位差模式标记可以对于每个帧可变地存在。尤其,当信道间相位差编译标记表示IPD值没有被用于空间信息的所有帧的时候,信道间相位差模式标记可以不包括在该帧中。并且,信道间相位差模式标记可以具有设置为0或者1的值。
并且,IPD编译标记生成单元224生成参考图1描述的信道间相位差编译标记(bsPhaseCoding)。尤其是,由于生成了表示信道间相位差编译是否被用于空间信息的IPD编译标记,所以如果信道间相位差值被用于在图1中分割的空间信息的帧中的至少一个,则信道间相位差编译标记表示1是理所当然的事。
信息获得单元230从空间信息生成单元220接收空间信息的输入。在这种情况下,信道间相位差编译标记(bsPhaseCoding)和信道间相位差模式标记(bsPhaseMode)可以包括在空间信息和信道间相位(IPD)值中。信息获得单元230包括IPD编译标记获得单元231、IPD模式标记获得单元232和IPD值获得单元233。
该IPD编译标记获得单元231从空间信息的头部中获得信道间相位差编译标记,其表示信道间相位差值是否被用于空间信息的所有帧中的至少一个帧。该信道间相位差编译标记的含义在表1中示出。
该IPD模式标记获得单元232从空间信息的帧中获得信道间相位差模式标记,其表示信道间相位差值是否被用于该帧。尤其是,如果信道间相位差编译标记表示使用信道间相位差值[bsPhaseCoding=1],则该IPD模式标记获得单元232能够获得信道间相位差模式标记。
并且,该IPD值获得单元233能够基于信道间相位差模式标记而获得信道间相位差值。该信道间相位差值可以对于参数频带而存在。在本公开中,参数频带表示信道间相位差值被包括在其中的至少一个子频带。稍后将参考图7和图8详细地解释这些。
并且,该上混单元240能够通过将由信息获得单元230获得的信道间相位差值应用于从下混单元210输入的下混信号而生成多信道信号。在这种情况下,上混指的是应用上混矩阵以生成具有的信道比下混信号的信道多的信号。并且,上混信号表示该上混矩阵被应用于其的信号。多信道信号是具有的信道比下混信号的信道多的信号。并且,多信道信号可以表示上混矩阵本身被应用于其的信号。多信道信号可以包括通过对其应用上混矩阵而生成以便具有多个信道的QMF域信号,或者从QMF域信号转换为时域信号的最终信号。
因此,按照本发明的信号处理装置和方法基于信道间相位差编译标记和信道间相位差模式标记来使用信道间相位差值。因此,本发明使用信道间电平差值和信道间相关性值来恢复难以被恢复的混响。并且,本发明能够清楚地执行声音图像定位。
图3是在信号中相位和时间之间关系的图形。左边图形示出在相位-幅度域中的信号。信号(a)是没有相位变化地输入的信号。并且,信号(b)表示具有的相位比信号(a)进一步延迟π/2的信号。
同时,在图3中右边的图形示出在时间-幅度域中的信号,并且表示分别对应于左边图形中的信号(a)和(b)的信号(a)′和(b)′。尤其是,信号(b)是比信号(a)进一步延迟π/2的信号,其可以被表示为相当于信号(b)′,该信号(b)′是比信号(a)′进一步延迟33ms输入的信号。因此,在信号中相位和时间具有紧密的关系,并且即使它们被转换成相互对应的值,也能提供相同的效果。
图4是在图2中示出的IPD值测量单元222和IPD值获得单元233的详细方框图。参考图4,IPD测量单元410包括IPD值测量单元411、IPD量化单元412和IPD量化模式标记生成单元413。
IPD值测量单元411从输入的多信道信号测量信道间相位差值。如在先前的描述中提及的,该信道间相位差值可以包括相位角、时间延迟值或者对应于相位角或者时间延迟值的索引值。
IPD量化单元412量化由IPD值测量单元411测量的信道间相位差值。该IPD量化单元412可以进一步包括用于通过按照量化间隔的差分方法(difference method)来量化信道间相位差值的详细结构。例如,第一量化单元(在该图中未示出)能够使用精细的量化间隔(精细间隔)来量化信道间相位差值,并且第二量化单元能够使用粗略的量化间隔(粗略间隔)来量化信道间相位差值。
并且,该IPD量化模式标记生成单元413能够生成表示对信道间相位差值进行量化的方案的量化模式标记(IPD_quant_mode_flag)。尤其是,该量化模式标记能够表示信道间相位差值是被使用精细间隔还是粗略间隔而量化。
该信道间相位差值获得单元420包括IPD量化模式标记获得单元421、第一反量化单元422、第二反量化单元423和反量化IPD值获得单元424。
首先,该IPD量化模式标记获得单元421从编码器接收的空间信息中获得用于表示应用于信道间相位差值的量化方案的量化模式标记(IPD_quant_mode_flag)。该量化模式标记的含义在表3中示出。
[表3]
Figure BPA00001332405100111
如果量化模式标记被设置为0(IPD_quant_mode_flag=0),则第一反量化单元422接收信道间相位差值,然后使用粗略间隔对信道间相位差值进行反量化。相反地,如果量化模式标记被设置为1(IPD_quant_mode_flag=1),则第二反量化单元423接收信道间相位差值,然后使用精细间隔对信道间相位差值进行反量化。
随后,反量化IPD值获得单元424能够从第一反量化单元42或者第二反量化单元423获得反量化的信道间相位差值。
图5是使用相移标记补偿多信道信号的相位重建的信号处理装置500的方框图。
参考图5,信号处理装置500包括全局频带(global band)IPD值确定单元510、信号修改单元520、下混单元530、空间信息生成单元540、空间信息获得单元560和相移单元570。
首先,全局频带IPD值确定单元510接收多信道信号的输入。在这种情况下,多信道信号可以包括具有至少一个异相(out-of-phase)信道的信号,并且尤其是,可以包括立体声信号或者具有至少三个或更多个信道的信号。该全局频带IPD值确定单元510从多信道信号确定表示相位范围的相移标记,该相位范围被移动以使得输入的多信道信号同相(in phase)。
该相移标记可以包括表示多信道信号的相位已经移动的标记信息,并且能够进一步包括与相移有关的信息,诸如相移后的范围、相移后的信道信号、相移发生频带、对应于相移的时间信息等等,以及该标记信息。
首先,在相移标记仅仅表示标记信息的情况下,可以使用固定值移动多信道信号的相位。例如,在多信道信号是立体声信号的情况下,能够通过以以下的方式移动相位而生成多信道信号,即,通过将立体声信号的右信道的相位减少π/2,或者将其左信道的相位增加π/2,左信道和右信道变得相互正交。代替于被限制在π/2相移,能够通过移动相位以使得左信道和右信道变得相互正交来生成多信道信号。
在这种情况下,移动的相位均等地适用于多信道信号的整个频带。另外,代替于传送表示多信道信号的至少一个信道的相位被修改π/2的信息或者有关相位被移动变为正交的信息,能够稍后使用在解码器侧预置的信息,本发明不受限于此。
在这种情况下,信息传输大小可以被减小为小于在多个参数频带中的每个上携带信道间相位差值的信息传输大小。并且,还能够防止在对于每个参数频带应用信道间差值信息的情况下可能发生的相位差的问题。
此外,该相移标记可以进一步包括与相移有关的详细信息以及标记信息。在这种情况下,该详细信息可以包括相位的移动信息、有关相移信道信号的信息、有关频带的信息和发生相移的时间等等。
同时,该相移标记可以可变地表示对于每个帧多信道信号的相位的移动后范围。在相移标记仅仅包括标记信息的情况下,能够表示是否每帧移动相位。在相移标记包括标记信息和有关相移的详细信息的情况下,该详细信息可以表示每子频带或者每参数频带相位的移动后范围,或者可以表示每预定时间范围,例如,帧、时隙等等,可变地在相应时间上相位的移动后范围。
另外,该相移标记可以与参考图1至4解释的信道间相位差值并行使用。
该信号修改单元520接收相移标记和多信道信号。多信道信号能够使用相移标记通过修改至少一个信道的相位来生成相移的多信道信号。虽然在先前的描述中提及了修改多信道信号的相位以使得异相多信道信号变为同相多信道信号,并且生成与多信道信号有关的相移标记的方法,但同相多信道信号被故意地移动以变为异相信号,并且然后能够生成对应于异相信号的相移标记。
下混单元530接收相移的多信道信号的输入,并且然后能够通过下混输入的信号而生成下混信号。在这种情况下,多信道信号不局限于立体声信号,而是可以包括具有至少三个信道的信号。如果多信道信号是立体声信号,则该下混信号可以包括单声道信号。如果多信道信号是具有至少三个信道的信号,则该下混信号可以包括具有的信道少于多信道信号的信道的信号。
空间信息生成单元540能够通过接收相移的多信道信号的输入来生成表示多信道信号的属性的空间信息。该空间信息被提供给解码器,以将下混信号解码为相移的多信道信号,并且可以包括信道间电平差值、信道间相关性值、信道预测系数等等。因此,由本发明的空间信息生成单元540生成的空间信息可以不等于从无相移的多信道信号生成的空间信息。
另外,比特流生成单元(在该图中未示出)能够生成一个包含空间信息和相移标记的比特流,或者一个包含下混信号、空间信息和相移标记的比特流。
信息获得单元550从该比特流中获得空间信息和相移标记以对下混信号进行上混。
上混单元560具有在图2中示出的先前的上混单元240相同的结构,并且执行在图2中示出的先前的上混单元240相同的功能。上混的多信道信号可以是上混矩阵被应用于其的信号。上混的多信道信号可以是通过上混而生成的QMF域信号。并且,上混的多信道信号可以是作为时域信号而生成的最终信号。另外,由上混单元560上混的信号可以包括由信号修改单元520进行相移的多信道信号。
相移单元570从信息获得单元550接收相移标记的输入,并从上混单元560接收相移的多信道信号的输入。随后,该相移单元570通过将相移标记应用于相移的多信道信号而重建多信道信号的移动后的相位。
如在先前的描述中提及的,相移标记可以仅仅包括表示多信道信号的至少一个信道的相位是否被移动的标记信息,或者可以进一步包括与相移有关的详细信息。如果仅仅包括标记信息,则该相移单元570基于该标记信息确定是否去移动上混的多信道信号的相位,并且然后能够使用固定值来移动多信道信号的至少一个信道的相位。在这种情况下,代替于被编码器单独地测量和传送,由解码器预置的值可作为该固定值而使用。例如,能够将多信道信号的至少一个信道的相位增加或者减小π/2。在这种情况下,能够同样地将π/2应用于多信道信号的所有频带,另外,由于可以每帧确定相移标记,所以可以对于每个帧可变地表示多信道信号的相移的范围、或者是否存在相移。
图6是按照本发明的另一个实施例,使用相移标记补偿多信道信号的相位重建的信号处理装置600的方框图。
参考图6,信号处理装置600包括下混单元610、空间信息生成单元620、信号修改单元630、全局频带IPD值获得单元640、相移单元650和上混单元660。
首先,下混单元610通过下混所输入的多信道信号而生成下混信号DMX。在这种情况下,多信道信号是没有被移动相位而输入的信号。
空间信息生成620能够生成表示输入的多信道信号的属性的空间信息。这个空间信息具有与在图5示出的先前的空间信息相同的结构和功能,但是不同于从无相移的多信道信号生成的先前的空间信息。同时,该空间信息生成单元620包括全局频带IPD值确定单元621。这个全局频带IPD值确定单元621具有与在图5中示出的先前的全局频带IPD值确定单元相同的结构和功能,其细节在以下的描述中被省略。
信号修改单元630能够基于从全局频带IPD确定单元621输出的相移标记,通过修改从下混单元610输出的下混信号的至少一个信道的相位来生成相位修改后的下混信号DMX′。
随后,该全局频带IPD值获得单元640获得相移标记。相移单元650然后能够基于该相移标记,通过移动所输入的修改后下混信号DMX′的至少一个信道的相位来重建下混信号DMX。在这种情况下,其相位被相移单元650移动的下混信号可以等于输入给信号修改单元630的信号DMX。
该上混单元660能够通过从空间信息生成单元620接收空间信息,和从相移单元650接收下混信号DMX来解码多信道信号。
同时,按照本发明的信号处理装置和方法执行用于除去从信道间相位差值改变的点处瞬时生成的噪声的各种方法。这些参考图7至9解释如下。
首先,图7是参数时隙的概念的示意图,其中信号可以在时间-频率域中表示。
参考图7,参数集被应用于一个帧的N个时隙中的两个时隙(时隙2和时隙4)。并且,信号的整个频带被分成5个参数频带。因此,时间轴的单位是时隙,频率轴的单位是参数频带(pb),并且该参数频带可以是包括相同信道间相位差的至少一个频率域子频带。并且,被定义为使得参数集,并且尤其是,信道间相位差值被应用于其的时隙称作参数时隙。
图8是按照本发明另一个实施例的信息的方法的示意图。
参考图8,左下的图形示出在参数时隙中包括在第二参数频带中的信道间相位差值。应用于参数时隙[0]的信道间相位差值可以是10°,并且应用于参数时隙[1]的信道间相位差值可以是60°。因此,在信道间相位差值显著改变的点处,可能生成不期望的噪声。因此,按照本发明的信号处理方法和装置通过使用应用于先前参数时隙的信道间相位差值来平滑应用于当前参数时隙的信道间相位差值,从而提供除去噪声的效果。
现在参考图8,假设当前参数时隙是时隙[1],先前参数时隙可以是参数时隙[0]。观察图8中的右下图形,可以使用应用于先前参数时隙的信道间相位差值(10°)来平滑应用于当前参数时隙的信道间相位差值(60°)。因此,当前参数时隙的平滑后的信道间相位差值可以具有小于60°的值。
随后,通过内插和/或复制被应用于当前和/或先前参数时隙的平滑后的信道间相位差值,能够获得要应用于诸如时隙1、时隙3、…、时隙N的时隙(其被定义为不具有应用于其的参数集)的信道间相位差值。
图9是按照在图8中示出的本发明另一个实施例的信号处理装置的方框图。
参考图9,在图9中的下混单元910、IPD使用确定单元921、IPD值测量单元922、IPD模式标记生成单元923、IPD编译标记生成单元924、IPD编译标记获得单元931、IPD模式标记获得单元932、IPD值获得单元933和上混单元940分别具有与在图2中的下混单元210、IPD使用确定单元221、IPD值测量单元222、IPD模式标记生成单元223、IPD编译标记生成单元224、IPD编译标记获得单元231、IPD模式标记获得单元232、IPD值获得单元233和上混单元240相同的结构和功能。其细节在以下的描述中被省略。
信息获得单元930能够进一步包括IPD平滑单元934。IPD值平滑单元934能够使用应用于先前参数时隙的信道间相位差值,来修改(平滑)应用于当前参数时隙的信道间相位差值。这里,如果在应用于当前参数时隙的信道间相位差值和应用于先前参数时隙的信道间相位差值之间存在大的间隙,则能够防止可能生成噪声。
IPD值平滑单元934能够从应用于当前参数时隙的信道间相位差值生成用于表示多个信道中的两个信道之间角度的校正角度,并且然后能够使用先前参数时隙的校正角度来修改该校正角度。修改后的校正角度然后被输出给上混单元840。修改后的相位角度被上混单元640应用于下混信号以生成多信道信号。
在以下的描述中,在使用信道间电平差值和信道间相关性值,而不是通常使用信道间相位差值来编译信号的情况下,解释用于解决按照本发明的可能问题的各种实施例。
图10A和图10B是按照本发明另一个实施例的信号处理装置和方法所解决的问题的概念的示意图。
在许多种信号编译设备中,并且更加特别的,在由3GPP标准化的EAAC+,和由AAC+(AAC plus)和USAC使用的MPEG或者PS中,信道间电平差值和信道间相关性值仅仅用作为空间信息,而不是使用信道间相位差值。这归因于相位缠绕(phase wrapping)和音质恶化,在生成信道间相位差值时可能生成相位缠绕,从合成信道间相位差值中生成音质恶化。
但是,如果不使用信道间相位差值对多信道信号进行编译,则可能导致严重的声音图像定位问题。换句话说,主要使用信道间电平差值而编译的信号,诸如通过安排至少两个麦克风相互接近而记录的信号可能不会有问题。但是,除非使用信道间相位差值,否则在解码多信道信号时,不能对通过安排至少两个麦克风相互间隔开而记录的信号正确地执行声音图像定位。
图10A示出在没有信道间相位差值的情况下解码仅具有信道间相位差值的立体声信号的情形的结果。
参考图10A,原始信号是仅仅配置以信道间相位差值(IPD=30°)的信号。但是,如果仅使用信道间电平差值和信道间相关性值执行解码,没有有效的空间信息(IPD),不管原始信号,解码信号(合成信号)的声音图像位于立体声信号的中心。在这种情况下,虽然信道间相关性值影响声音图像定位,但不可能在没有信道间相位差值的情况下执行正确的声音图像定位。
图10B示出在没有信道间相位差值的情况下对具有信道间相位差值和信道间电平差值混合于其中的立体声信号进行解码的情形的结果。
参考图10B,立体声信号的声音图像定位被确定为是从信道间相位差值所确定的调整角度和从信道间电平差值所确定的调整角度的线性和。如图10B所示,如果原始立体声信号的左信号具有比其右信号大8dB的值,并且其比右信号快0.5ms,则8dB的电平差可以将声音图像从中心向左移动20°(-20°)。并且,0.5ms的时间差(等于“-10°”的信道间相位差值)能够将声音图像向左移动10°(-10°)。因此,该原始立体声信号(原始)位于-30°的位置上。但是,如果在没有信道间相位差值的情况下解码信号,则解码后的信号的声音图像位于-20°,不可能执行正确的声音图像定位。
因此,按照本发明另一个实施例的信号处理方法和装置提供用于另外解决声音图像定位问题的各种方法。
图11和图12是按照本发明另一个实施例的信号处理装置和方法的方框图。
首先,只有在基于多信道信号的信道间相位差值和多信道信号的信道间电平差值之间的比率满足预定条件的时候,能够使用信道间相位差值。
参考图11,信号处理装置1100包括下混单元1110、空间信息生成单元1120、信息获得单元1130和上混单元1140。
该下混单元1110和上混单元1140具有与在图2中的先前的下混单元210和先前的上混单元240相同的结构和功能。该空间信息生成单元1120包括ILD值测量单元1121、IPD值测量单元1122、信息确定单元1123和IPD标记生成单元1124。ILD值测量单元1121和IPD值测量单元1122分别测量来自多信道信号的信道间电平差值和信道间相位差值。在这种情况下,可以对于每个参数频带测量信道间电平差值和信道间相位差值。
该信息确定单元1123使用测量的信道间电平差值和测量的信道间相位差值来计算信号被声音图像定位到什么程度,并且还计算信道间电平/相位差信息与总的声音图像定位的比率。只有在信道间相位差值的比率高于另一个的时候,该信息确定单元1123然后确定使用该信道间相位差值。例如,如果测量的信道间相位差值对应于+20°,并且测量的信道间电平差值对应于具有4dB相移+10°的值,则在总的声音图像定位(20°+10°=30°)中信道间相位差值的贡献程度(contribution extent)和信道间电平差值的程度分别可以达到20/30和10/30。在这种情况下,由于信道间相位差值可以被认为是具有相对更大的重要性(significance),所以该信息确定单元1123能够确定进一步使用该信道间相位差值。
如果该信息确定单元1123确定进一步使用信道间相位差值,则该IPD标记生成单元1124能够生成表示信道间相位差值被使用的信道间相位差值标记。
同时,该信息获得单元1130可以包括IPD标记获得单元1131和IPD获得单元1132。该IPD标记获得单元1131获得信道间相位差值标记,然后确定信道间相位差值是否包括在空间信息中。如果该信道间相位差值标记被设置为1,则该IPD获得单元1132被激活,然后从空间信息中获得信道间相位差值。随后,该上混单元1140通过使用包括信道间相位差值的空间信息来对下混信号进行上混从而解码多信道信号。因此,相比没有使用信道间相位差值的情形,可以更加正确地执行声音图像定位。只有在满足预定条件的时候,该信道间相位差值被传送。因此,也能够提高编译效率。
其次,可以以等效的信道间电平差值代替信道间相位差值,反之亦然。在这种情况下,由于为声音图像定位所必需的信道间相位差值或者信道间电平差值可按照频率而改变,所以每频带定义的数据库被涉及到。
图12示出替代于信道间相位差值使用等效的信道间电平差值的信号处理装置1220。
参考图12,信号处理装置1200包括ILD值测量单元1210、IPD值测量单元1220、信息确定单元1230、IPD值转换单元1240和ILD值修改单元1250。
ILD值测量单元1210、IPD值测量单元1220和信息确定单元1230具有与先前的ILD值测量单元1110、先前的IPD值测量单元1120和先前的信息确定单元1130相同的结构和功能,其细节在以下的描述中被省略。在该信息确定单元1130确定使用信道间相位差值的情况下,测量的信道间相位差值被输入给该IPD值转换单元1240。
该IPD值转换单元1240将使用数据库在相应频带上测量的信道间相位差值转换为信道间电平差值ILD′。随后,ILD值修改单元1250通过将从信道间相位差值转换的信道间电平差值ILD′添加给从ILD值测量单元1210输入的信道间电平差值ILD,来计算修改的信道间电平差值ILD″。
因此,在将信道间相位差值转换为等效的信道间电平差值以便使用的情况下,能够在3GPP的HE AAC+或者USAC标准中的MPEG或PS中使用不接受信道间相位差值的接收的常规信号处理装置和方法来解码信号,通过反映信道间相位差值该信号的混响和声音图像定位被增强。
第三,通过将信道间相位差值共同地应用于至少一个或多个连续帧,能够增强正确的声音图像定位和编译效率。在预置的规范中,用于几个连续帧的信道间相位差值被称作全局帧信道间相位差值(全局帧IPD值)。
图13是按照本发明另一个实施例,使用全局帧信道间相位差(IPD)值的概念的示意图。在图13中,数字0至13分别地表示帧。阴影帧表示使用信道间相位差值的帧。无阴影帧表示不使用信道间相位差值的帧。它们可以基于在本公开中描述的信道间相位差模式标记(bsPhaseMode)来确定。
参考图13,在帧1至3和帧8至12仅使用信道间相位差值的情况下,代表值(representative value)被计算而无需传送用于每个帧的信道间相位差值,并且然后代表值被均等地应用于连续帧,该连续帧被确定为具有应用于其的信道间相位差值。全局帧信道间相位差值包括在连续帧中的第一个帧中。并且,每个帧能够包括表示是否使用全局帧信道间相位差值的全局帧信道间相位差标记。该全局帧信道间相位差标记的含义在表4中示出。
[表4]
  Global_frame_IPD_flag   含义
  1   使用全局帧信道间相位差值。
  0   不使用全局帧信道间相位差值。
例如,基于全局帧信道间相位差标记,帧0不使用全局帧信道间相位差值,但是,帧1使用全局帧信道间相位差值。因此,帧1包括全局帧信道间相位差值,并且相同的全局帧信道间相位差值适用于帧1至3。同样地,帧8包括全局帧信道间相位差值,并且相同的全局帧信道间相位差值适用于帧8至12。
图14是按照本发明一个实施例的使用全局帧信道间相位差值的信号编译装置1400的方框图。
参考图14,信号编译装置1400包括先前帧的全局帧IPD值接收单元1410、全局帧IPD值计算单元1420、全局帧IPD标记生成单元1430、全局帧IPD标记获得单元1440、全局帧IPD值获得单元1450和上混单元1460。
先前帧的全局帧IPD值接收单元1410接收先前帧的全局帧信道间相位差值。例如,如果当前帧是包括全局帧信道间相位差值的第一帧,则接收到的先前帧的全局帧信道间相位差值将不存在。相反地,如果当前帧是在包括全局帧信道间相位差值的连续帧之中的第二帧或者更高阶帧,则能够从先前帧接收全局帧信道间相位差值。
如果当前帧是包括全局帧信道间相位差值的第一帧,即,如果先前帧的全局帧信道间相位差值不存在,则全局帧ILD值计算单元1420能够计算全局帧信道间相位差值。当前帧的全局帧信道间相位差值可以包括为其使用了信道间相位差值的连续帧的信道间相位差值的平均值。
该全局帧IPD标记生成单元1430生成表示是否在当前帧中使用全局帧IPD值的全局帧IPD标记(global_frame_IPD_flag)。
随后,该全局帧IPD标记获得单元1440获得全局帧信道间相位差值。并且,该全局帧IPD值获得单元1450能够获得从先前帧全局帧IPD值接收单元1410输出的先前帧的全局帧信道间相位差值,或者从全局帧IPD值计算单元1420输出的当前帧的全局帧信道间相位差值。最好是,如果当前帧是具有信道间相位差值被应用于其的连续帧中的第一帧,则该全局帧IPD值获得单元1450获得先前帧的全局帧信道间相位差值。如果当前帧是第二帧或者更高阶帧,则该全局帧IPD值获得单元1450能够获得所计算的当前帧的全局帧信道间相位差值。
并且,该上混单元1460通过将全局帧信道间相位差值应用于下混信号而生成多信道信号。
第四,为了调整解码的多信道信号以具有与输入给编码器的多信道信号的混响最大限度接近的混响,能够调整信道间相关性值。现在参考图10B,在使用信道间相位差值和信道间相关性值来解码信号的情况下,生成了将混响扩大到大于原始信号的混响的问题。这个混响指的是由于周围环境而引起的仿佛信号存在于更宽或者更窄空间中的效果。在本公开中,混响的扩大指的是解码后的信号听起来仿佛是在宽阔的大厅中记录的,尽管原始信号是在窄的录音室中记录的。
在其中没有传送信道间相位差值的常规信号处理方法和装置中经常生成这个问题。但是,在传送信道间相位差值的情况下也可能生成这个问题。
可以以在图15中示出的方式解决这个问题。图15是按照本发明的另一个实施例的信号处理装置1500的方框图。
参考图15,信号处理装置1500包括ICC值测量单元1510、IPD值测量单元1520、ILD值测量单元1530、信息确定单元1540、ICC值修改单元1550、IPD模式标记生成单元1560、IPD模式标记获得单元1570、IPD值获得单元1580、ICC值获得单元1590和上混单元1595。
ICC值测量单元1510、IPD值测量单元1520和ILD值测量单元1530可以分别从多信道信号测量信道间相关性值、信道间相位差值和信道间电平差值。
该信息确定单元1540和IPD模式标记生成单元1560分别具有与在图11中先前的信息确定单元和先前的IPD标记生成单元1124相同的结构和功能。该信息确定单元1540计算测量信道间电平/相位差信息与总的声音图像定位的比率。只有在信道间相位差值的比率高于另一个的时候,该信息确定单元1540然后确定使用该信道间相位差值。该IPD模式标记生成单元1560生成表示是否使用信道间相位差值的信道间相位差模式标记。
如果该信息确定单元1540确定使用信道间相位差值,则该ICC值修改单元1550能够修改从ICC测量单元1510输入的信道间相关性值。最好是,测量的信道间相关性值可以不包括在使用信道间相位差值的参数频带中。为了解决混响扩大的问题,由信道间相关性值表示的值的大小可以被修改以便使用。
IPD标记获得单元1570和IPD值获得单元1580具有与在图11中先前的IPD标记获得单元1131和先前的IPD值获得单元1132相同的结构和功能,其细节在以下的描述中被省略。
如果IPD标记获得单元1570的信道间相位差标记表示使用信道间相位差值,则ICC值获得单元1590从ICC值修改单元1550接收修改后的信道间相关性值。
并且,该上混单元1595能够通过将信道间相位差值和修改后的信道间相关性值应用于接收到的下混信号而生成多信道信号。因此,能够在使用信道间相位差值的信号处理方法和装置中防止被信道间相关性值扩大的混响使信号失真。
第五,信道间相位差值能够使用以下特征:具有更简单声源的信号的重要性(significance)提高得更高。
图16是按照本发明的另一个实施例的信号处理装置1600的方框图。
参考图16,信号处理装置1600包括输入信号分类单元1610、IPD值测量单元1620、IPD标记生成单元1630、IPD标记获得单元1640、IPD值获得单元1650和上混单元1660。
该输入信号分类单元1610确定输入信号是仅包含语音的纯语音信号、音乐信号、还是具有语音和音乐信号相互混合的混合信号。最好是,该输入信号分类单元1610可以包括声音活动检测器(sound activity detector)(SAD)、语音和音乐分类器(speech and music classifier)(SMC)等等中的一个。
仅在输入信号被输入信号分类单元1610确定为是仅包含语音信号的信号(纯语音信号)的时候,IPD值测量单元1620测量信道间相位差值。
IPD标记生成单元1630、IPD标记获得单元1640、IPD值获得单元1650和上混单元1660分别具有与在图11中先前的IPD标记生成单元1124、先前的IPD标记获得单元1131、先前的IPD值获得单元1132和先前的上混单元1140相同的结构和功能,其细节在以下的描述中被省略。
尽管没有使用信道间相位差值,在其中包含各种信号的音乐信号或者具有语音和音乐信号混合在其中的混合信号使用信道间电平差值和信道间相关性值,使得声音图像定位达到规定的程度。但是,由于诸如语音信号这样的简单声源具有信道间相位差值重要性的相对高的重要性(significance),所以在没有信道间相位差值的情况下正确的声音图像定位是不可能的。因此,如果按照输入信号分类单元1610输入信号是语音信号,则使用信道间相位差值,借此可以借助于核心的正确的声音图像定位来解码多信道信号。
图17示出按照本发明另一个实施例的信号处理装置1700。
参考图17,信号处理装置1700包括多信道编码单元1710、带宽扩展信号编码单元1720、音频信号编码单元1730、语音信号编码单元1740、音频信号解码单元1750、语音信号解码单元1760、带宽扩展信号解码单元1770和多信道解码单元1780。
首先,由多信道编码单元1710从下混多信道信号中生成的下混信号被称作全频带下混信号。并且,由于高频带信号被从全频带下混信号中除去,所以仅具有低频带的下混信号被称作低频带下混信号。
多信道编码单元1710接收具有多个信道的多信道信号的输入。多信道编码单元1710通过对输入的多信道信号进行下混来生成全频带下混信号,以及生成对应于多信道信号的空间信息。在这种情况下,该空间信息可以包含信道电平差信息、信道预测系数、信道间相关性值、下混增益信息等等。
按照本发明的一个实施例的多信道编码单元1710确定是否使用信道间相位差值,然后测量信道间相位差值。多信道编码单元1710生成表示帧是否使用信道间相位差值的信道间相位差模式信息,以及生成表示使用信道间相位差值的帧是否存在于全部帧之中的信道间相位差编译信息。多信道编码单元1710然后能够与混合信息一起传送生成的信息。这些与参考图1至4的描述一样,并且其细节在以下的描述中被省略。
因此,多信道编码单元1710可以包括参考图1至4所描述的信号处理装置的编码设备,或者按照参考图5至16所描述的本发明另一个实施例的信号处理装置。
该带宽扩展信号编码单元1720接收全频带下混信号,并且然后能够生成对应于全频带下混信号中高频带信号的扩展信息。在这种情况下,该扩展信息是用于允许解码器侧将低频带下混合信号重建进全频带下混信号的信息,该低频带下混信号是除去高频带而生成的。并且,该扩展信息可以与该空间信息一起传送。
基于信号特征确定下混信号是通过音频信号编译方案还是语音信号编译方案来编译。并且,用于确定编译方案的模式信息被生成[在该图中未示出]。在这种情况下,该音频编译方案可以使用MDCT(修改的离散余弦变换),本发明不受限于此。并且,该语音编译方案可以遵循AMR-WB(自适应多速率宽带)标准,本发明不受限于此。
该音频信号编码单元1730按照音频信号编码方案,使用从带宽扩展信号编码单元1720输入的全频带下混信号和扩展信息来编码低频带下混信号(高频区域从其中除去)。
通过音频信号编译方案编译的信号可以包括音频信号或者具有部分包括在音频信号中的语音信号的信号。并且,该音频信号编码单元1730可以包括频域编码单元。
该语音信号编码单元1740按照语音信号编译方案,使用从带宽扩展信号编码单元1720输入的全频带下混信号和扩展信息来编码低频带下混信号(高频区域从其中除去)。
由语音信号编译方案编码的信号可以包括语音信号或者部分包含在语音信号中的音频信号。该语音信号编码单元1740能够进一步使用线性预测编译(LPC)方案。如果输入信号在时间轴上具有高冗余度,则可以通过用于从过去的信号中预测当前信号的线性预测来执行建模。在这种情况下,如果采用线性预测编译方案,编译效率可以提高。同时,该语音信号编码单元1740可以包括时域编码单元。
该音频信号解码单元1750按照音频信号编译方案来解码信号。输入到音频信号解码单元1750并由音频信号解码单元1750解码的信号可以包括音频信号或者具有部分包括在音频信号中的语音信号的信号。并且,该音频信号解码单元1750可以包括频域解码单元,并且能够使用IMDCT(修改的反离散系数变换)。
该语音信号解码单元1760按照语音信号编译方案来解码信号。由语音信号解码单元1760解码的信号可以包括语音信号或者具有部分包括在语音信号中的音频信号的信号。该语音信号解码单元1760可以包括时域解码单元,并且能够进一步使用线性预测编译(LPC)方案。
该带宽扩展解码单元1770接收低频带下混信号和扩展信息,该低频带下混信号是由音频信号解码单元1750或者语音信号解码单元1760解码的信号,然后该带宽扩展解码单元1770生成全频带下混信号,其中与编码时已经被除去的高频区域相对应的信号被重建。
能够使用整个低频带下混信号和扩展信息,或者部分地使用低频带下混信号来生成全频带下混信号。
多信道解码单元1780接收全频带下混信号、空间信息、信道间相位差值、信道间相位差模式标记和信道间相位差编译标记,然后通过将这些信息应用于全频带下混信号而生成下混信号。这个过程的细节参考图1至4详细描述,并且在以下的描述中被省略。
因此,在按照本发明的信号处理方法和装置中,使用信道间相位差值生成多信道信号,由此可以有效地再现现有技术的多信道解码器所难以再现的相位或者延迟差。
图18是按照本发明另一个实施例,包括IPD编译标记获得单元1841、IPD模式标记获得单元1842、IPD值获得单元1843和上混单元1844的产品的结构的示意图。并且,图19A和图19B是分别地按照本发明的另一个实施例,包括IPD编译标记获得单元1841、IPD模式标记获得单元1842、IPD值获得单元1843和上混单元1844的产品的关系的示意图。
参考图18,有线/无线通信单元1810通过有线/无线通信接收比特流。尤其是,有线/无线通信单元1810包括有线通信单元1811、红外通信单元1812、蓝牙单元1813和无线局域网通信单元1814中的至少一个。
用户认证单元1820接收用户信息的输入,然后执行用户认证。该用户认证单元1820可以包括指纹识别单元1821、虹膜识别单元1822、面部识别单元1823和语音识别单元1824中的至少一个。在这种情况下,用户认证可以以下述方式来执行:接收指纹信息、虹膜信息、面部轮廓信息或者语音信息的输入,将输入信息转换为用户信息,然后确定用户信息是否匹配注册的用户数据。
输入单元1830是允许用户输入不同种类的命令的输入设备。并且,该输入单元1830可以包括小键盘单元1831、触摸板单元1832和远程控制器单元1833中的至少一个,该输入单元1830的例子不受限于此。
信号解码单元1840包括IPD编译标记获得单元1841、IPD模式标记获得单元1842、IPD值获得单元1843和上混单元1844,其分别具有与在图2中同名的先前单元相同的结构和功能。并且,该信号解码单元1840的细节在以下的描述中被省略。
控制单元1850从输入设备接收输入信号,并且控制信号解码单元1840和输出单元1860的所有处理。如在先前的描述中提及的,如果用户输入,诸如输出信号的相移的“开/关”,元数据的输入/输出,信号解码单元的开/关操作等等,被从输入单元1830输入给控制单元1850,则该控制单元1850使用该用户输入来解码信号。
并且,该输出单元1860是用于输出由信号解码单元1840生成的输出信号等等的单元。该输出单元1860可以包括信号输出单元1861和显示单元1862。如果输出信号是音频信号,其经由信号输出单元1861而输出。如果输出信号是视频信号,其经由显示单元1862而输出。另外,如果元数据被输入给输入单元1830,则其经由显示单元1862而显示在屏幕上。
图19示出在终端之间或者在终端和服务器之间的关系,其对应于在图18中示出的产品。
参考图19A,可以观察到,可以经由有线/无线通信单元在第一终端1910和第二终端1920之间执行数据或者比特流的双向通信。在这种情况下,经由有线/无线通信单元交换的数据或者比特流可以具有在图1中示出的先前的本发明的比特流的结构,或者可以包括先前的数据,该先前的数据包含参考图5至16所描述的本发明的相移标记、全局帧信道间相移标记等等。参考图19B,可以观察到,可以在服务器1930和第一终端1940之间执行有线/无线通信。
图20是按照本发明另一个实施例,包括IPD编译标记获得单元2041、IPD模式标记获得单元2042、IPD值获得单元2043和上混合单元2044的广播信号解码装置的简略方框图。
参考图20,解复用器2020从调谐器2010接收与TV广播相关的多个数据。接收的数据被解复用器2020分解,并且然后由数据解码器2030解码。同时,由解复用器2020分解的数据可以存储在诸如HDD的存储介质2050中。
由解复用器2020分解的数据被输入给包括多信道解码单元2041和视频解码单元2042的信号解码单元2040,以被解码为音频信号和视频信号。按照本发明的一个实施例,该信号解码单元2040包括IPD编译标记获得单元2041、IPD模式标记获得单元2042、IPD获得单元2043和上混单元2044。它们具有与在图2中示出的同名的先前单元相同的结构和功能,并且其细节在以下的描述中被省略。该信号解码单元2040使用接收的信道间相位差值等等来解码信号。如果输入视频信号,则该信号解码单元2040解码和输出视频信号。如果生成元数据,则该信号解码单元2040以文本类型输出元数据。
如果解码视频信号,并且生成输出的视频信号和元数据,则输出单元2070显示输出的元数据。该输出单元2070包括扬声器单元(在图中未示出),并且经由包括在输出单元2070中的扬声器单元输出多信道信号,该多信道信号被使用信道间相位差值而解码。另外,由信号解码单元2040解码的数据可以存储在诸如HDD的存储介质2050中。
同时,该信号解码装置2000可以进一步包括能够对按照来自用户的信息输入而接收的多个数据进行控制的应用管理器2060。该应用管理器2060包括用户界面管理器2061和服务管理器2062。该用户界面管理器2061控制从用户接收信息输入的界面。例如,用户界面管理器2061能够控制显示在输出单元2070上的文本的字体类型、屏幕亮度、菜单配置等等。同时,如果广播信号被信号解码单元2040和输出单元2070解码和输出,则该服务管理器2062能够使用由用户输入的信息来控制接收的广播信号。例如,该服务管理器2062能够提供广播信道设置、报警功能设置、成人认证功能等等。从应用管理器2060输出的数据通过被传送给输出单元2070以及信号解码单元2040而可用。
因此,由于本发明的信号处理装置包括在实际的产品中,所以相比于用于仅使用信道间电平差值和信道间相关性值而上混的多信道信号的现有技术,本发明更好地改善了音质。另外,本发明允许用户收听更接近于原始输入信号的多信道信号。
本发明应用的解码/编码方法可以作为计算机可读代码在程序记录介质中实现。并且,具有本发明数据结构的多媒体数据可以存储在计算机可读的记录介质中。计算机可读的记录介质包括各种存储设备,由计算机系统可读的数据被存储在该存储设备中。计算机可读的介质例如包括ROM、RAM、CD-ROM、磁带、软盘、光数据存储设备等等,并且还包括载波型实现(例如,经由因特网的传输)。并且,由编码方法生成的比特流被存储在计算机可读的记录介质中,或者可以经由有线/无线通信网络而传送。
工业实用性
因此,本发明适用于信号编码/解码。
虽然已经参考其优选实施例在此处描述和举例说明了本发明,但对于本领域技术人员来说显而易见的是,不脱离本发明的精神和范围,可以在其中进行各种修改和变化。因此,本发明意欲覆盖归入所附权利要求和其等效物范围之内的本发明的改进和变化。

Claims (15)

1.一种处理信号的方法,包括:
接收:
从多信道信号生成的下混信号,以及
表示所述多信道信号的属性的空间信息,以便对所述下混信号进行上混;
从所述空间信息的头部获得表示IPD值是否被用于所述空间信息的信道间相位差(IPD)编译标记;
基于所述IPD编译标记从所述帧中获得表示所述IPD值是否被用于所述空间信息的帧的IPD模式标记;
基于所述IPD模式标记从帧中的参数频带获得所述IPD值;
通过将所述IPD值应用于所述下混信号而生成多信道信号,
其中所述空间信息被划分为头部和多个帧,并且
其中所述IPD值表示在所述多信道信号的两个信道之间的相位差,并且
其中所述参数频带是包括所述IPD值的频域的至少一个子频带。
2.根据权利要求1的方法,进一步包括:
按照量化模式标记,通过确定反量化程度来对所述IPD值进行反量化。
3.根据权利要求2的方法,其中所述量化模式标记是由量化距离确定的。
4.根据权利要求1的方法,其中当在所述IPD值和信道间电平差(ILD)值之间的比率超过阈值的时候,接收所述IPD值,并且
其中所述ILD值表示在所述下混信号中包括的所述多信道信号的两个信道之间的电平差。
5.根据权利要求1的方法,其中所述IPD值被包括在与所述ILD值兼容的帧中。
6.根据权利要求1的方法,其中所述IPD值对应于ILD值,所述ILD值表示在所述下混信号中包括的所述多信道信号的两个信道之间的电平差。
7.根据权利要求1的方法,进一步包括:
接收全局帧IPD标记,所述全局帧IPD标记表示所述IPD值是否表示被用于连续帧的全局帧IPD值,
其中基于所述全局帧IPD标记,通过将所述全局帧IPD值应用于所述下混信号的连续帧而生成所述多信道信号。
8.根据权利要求1的方法,进一步包括:
当特定的参数频带的IPD值超过阈值的时候,获得信道间相关性(ICC)值,所述信道间相关性(ICC)值表示作为下混信号的多信道信号的两个信道之间的相关性,
其中基于所述IPD值修改所述ICC值。
9.根据权利要求1的方法,其中当所述下混信号是语音信号的时候,获得所述IPD值。
10.一种处理信号的装置,包括:
信号接收单元,接收(a)从多信道信号生成的下混信号,和(b)表示所述多信道信号的属性的空间信息,以便对所述下混信号进行上混;
IPD编译标记获得单元,从所述空间信息的头部获得表示IPD值是否被用于所述空间信息的信道间相位差(IPD)编译标记;
IPD模式标记获得单元,基于所述IPD编译标记,从帧中获得表示所述IPD值是否被用于所述空间信息的帧的IPD模式标记;
IPD值获得单元,基于所述IPD模式标记,从所述帧中的参数频带获得所述IPD值;和
上混单元,通过将所述IPD值应用于所述下混信号而生成多信道信号,
其中所述空间信息被划分为头部和多个帧,并且
其中所述IPD值表示在所述多信道信号的两个信道之间的相位差,并且
其中所述参数频带是包括所述IPD值的频域的至少一个子频带。
11.根据权利要求10的装置,其中所述IPD值获得单元包括:
IPD量化模式标记获得单元,获得表示所述IPD值的反量化方法的量化模式标记,
粗略反量化单元,基于所述量化模式标记通过使用粗略反量化距离对所述IPD值进行反量化,
精细反量化单元,基于所述量化模式标记通过使用精细反量化距离对所述IPD值进行反量化,和
反量化IPD值获得单元,获得反量化的IPD值。
12.根据权利要求10的装置,当使用所述IPD值的时候,进一步包括:
ICC值获得单元,接收表示所述多信道信号的两个信道之间的相关性的信道间相关性(ICC)值,并且
其中基于所述IPD值修改所述ICC值。
13.根据权利要求10的装置,进一步包括:
全局帧IPD标记获得单元,接收全局帧IPD标记,所述全局帧IPD标记表示所述IPD值是否表示被用于连续帧的全局帧IPD值;和
全局帧IPD值获得单元,基于所述全局帧IPD标记,获得被应用于所述下混信号的连续帧的全局帧IPD值。
14.一种处理信号的方法,包括:
生成下混信号,所述下混信号对多信道信号进行下混;和
生成表示所述多信道信号的属性的空间信息,以便对所述下混信号进行上混,
其中生成空间信息的步骤包括:
测量表示所述多信道信号的两个信道之间的相位差的信道间相位差(IPD)值;
生成表示是否在帧中使用所述IPD值的IPD模式标记;
生成表示所述IPD值是否被用于空间信息的IPD编译标记;和
将所述IPD值和IPD模式标记包括进所述空间信息的帧中,并且将所述IPD编译标记包括进所述空间信息的头部中。
15.一种处理信号的装置,包括:
下混单元,生成下混信号,所述下混信号对多信道信号进行下混;和
空间信息生成单元,生成表示所述多信道信号的属性的空间信息,以便对所述下混信号进行上混,
其中所述空间信息生成单元包括:
IPD值测量单元,测量表示所述多信道信号的两个信道之间的相位差的信道间相位差(IPD)值;
IPD模式标记生成单元,生成表示是否在帧中使用所述IPD值的IPD模式标记;和
IPD编译标记生成单元,生成表示所述IPD值是否被用于所述空间信息的IPD编译标记,
其中所述IPD值和IPD模式标记被包括进所述空间信息的帧中,并且所述IPD编译标记被包括进所述空间信息的头部中。
CN2009801378698A 2008-09-25 2009-09-25 处理信号的方法和装置 Pending CN102165519A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10026208P 2008-09-25 2008-09-25
US61/100,262 2008-09-25
KR10-2009-0090515 2009-09-24
KR1020090090515A KR101108060B1 (ko) 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치
PCT/KR2009/005500 WO2010036062A2 (en) 2008-09-25 2009-09-25 A method and an apparatus for processing a signal

Publications (1)

Publication Number Publication Date
CN102165519A true CN102165519A (zh) 2011-08-24

Family

ID=42213076

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2009801378698A Pending CN102165519A (zh) 2008-09-25 2009-09-25 处理信号的方法和装置
CN200980137978XA Active CN102165520B (zh) 2008-09-25 2009-09-25 处理信号的方法和装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200980137978XA Active CN102165520B (zh) 2008-09-25 2009-09-25 处理信号的方法和装置

Country Status (4)

Country Link
JP (2) JP5426680B2 (zh)
KR (3) KR20100035121A (zh)
CN (2) CN102165519A (zh)
ES (1) ES2547232T3 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446507A (zh) * 2011-09-27 2012-05-09 华为技术有限公司 一种下混信号生成、还原的方法和装置
CN108475509A (zh) * 2016-05-31 2018-08-31 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN109215668A (zh) * 2017-06-30 2019-01-15 华为技术有限公司 一种声道间相位差参数的编码方法及装置
WO2019228423A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 立体声信号的编码方法和装置

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI1004215B1 (pt) 2009-04-08 2021-08-17 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para upmixagem de sinal de áudio downmix utilizando uma atenuação de valor de fase
KR101748760B1 (ko) 2011-03-18 2017-06-19 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
WO2013149670A1 (en) 2012-04-05 2013-10-10 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
EP2790419A1 (en) 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
EP2830047A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
MX354832B (es) * 2013-10-21 2018-03-21 Dolby Int Ab Estructura de decorrelador para la reconstruccion parametrica de señales de audio.
CN104681029B (zh) * 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954362A (zh) * 2004-05-19 2007-04-25 松下电器产业株式会社 音频信号编码装置及音频信号解码装置
CN101263742A (zh) * 2005-09-13 2008-09-10 皇家飞利浦电子股份有限公司 音频编码

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002208869A (ja) * 2001-01-09 2002-07-26 Sony Corp マルチバンド無線信号送受信装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8498422B2 (en) 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
WO2005086139A1 (en) * 2004-03-01 2005-09-15 Dolby Laboratories Licensing Corporation Multichannel audio coding
CN102122509B (zh) * 2004-04-05 2016-03-23 皇家飞利浦电子股份有限公司 多信道解码器和多信道解码方法
WO2006003813A1 (ja) 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR100917843B1 (ko) * 2006-09-29 2009-09-18 한국전자통신연구원 다양한 채널로 구성된 다객체 오디오 신호의 부호화 및복호화 장치 및 방법
KR100917845B1 (ko) * 2006-12-04 2009-09-18 한국전자통신연구원 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1954362A (zh) * 2004-05-19 2007-04-25 松下电器产业株式会社 音频信号编码装置及音频信号解码装置
CN101263742A (zh) * 2005-09-13 2008-09-10 皇家飞利浦电子股份有限公司 音频编码

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HEIKO PURNHAGEN: "Low Complexity Parametric Stereo Coding in MPEG-4", 《CONFERENCE ON DIGITAL AUDIO EFFECTS》 *
JEROEN BREEBAART: "Parametric Coding of Stereo Audio", 《EURASIP JOURNAL ON APPLIED SIGNAL PROCESSING 2005》 *
SOREN GERT WEINRICH: "Improved Externalization and Frontal Perception of Headphone Signals", 《AES》 *
WERNER OOMEN: "MPEG4-Ext2: CE on Low Complexity parametric stereo", 《CODING OF MOVING PICTURES AND AUDIO》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446507A (zh) * 2011-09-27 2012-05-09 华为技术有限公司 一种下混信号生成、还原的方法和装置
WO2013044826A1 (zh) * 2011-09-27 2013-04-04 华为技术有限公司 一种下混信号生成、还原的方法和装置
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
US9516447B2 (en) 2011-09-27 2016-12-06 Huawei Technologies Co., Ltd. Method and apparatus for generating and restoring downmixed signal
US11393480B2 (en) 2016-05-31 2022-07-19 Huawei Technologies Co., Ltd. Inter-channel phase difference parameter extraction method and apparatus
CN108475509A (zh) * 2016-05-31 2018-08-31 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN108475509B (zh) * 2016-05-31 2022-10-04 华为技术有限公司 一种声道间相位差参数的提取方法及装置
US11915709B2 (en) 2016-05-31 2024-02-27 Huawei Technologies Co., Ltd. Inter-channel phase difference parameter extraction method and apparatus
CN109215668A (zh) * 2017-06-30 2019-01-15 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
US11031021B2 (en) 2017-06-30 2021-06-08 Huawei Technologies Co., Ltd. Inter-channel phase difference parameter encoding method and apparatus
US11568882B2 (en) 2017-06-30 2023-01-31 Huawei Technologies Co., Ltd. Inter-channel phase difference parameter encoding method and apparatus
WO2019228423A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 立体声信号的编码方法和装置
US11587572B2 (en) 2018-05-31 2023-02-21 Huawei Technologies Co., Ltd. Stereo signal encoding method and apparatus

Also Published As

Publication number Publication date
JP2012503791A (ja) 2012-02-09
CN102165520B (zh) 2012-11-28
KR101108060B1 (ko) 2012-01-25
KR20100035122A (ko) 2010-04-02
JP5480274B2 (ja) 2014-04-23
JP2012503792A (ja) 2012-02-09
KR20100035120A (ko) 2010-04-02
ES2547232T3 (es) 2015-10-02
CN102165520A (zh) 2011-08-24
KR20100035121A (ko) 2010-04-02
JP5426680B2 (ja) 2014-02-26
KR101108061B1 (ko) 2012-01-25

Similar Documents

Publication Publication Date Title
CN102165520B (zh) 处理信号的方法和装置
US7542896B2 (en) Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
KR100987457B1 (ko) 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
US8831759B2 (en) Audio coding
CN101553867B (zh) 用于处理音频信号的方法和装置
US8060042B2 (en) Method and an apparatus for processing an audio signal
TWI396187B (zh) 用於將以物件為主之音訊信號編碼與解碼之方法與裝置
CN101542595B (zh) 用于编码和解码基于对象的音频信号的方法和装置
MXPA06014987A (es) Aparato y metodo para generar senal de control de sintetizador de multiples canales y aparato y metodo para sintetizar multiples canales.
CN105702258A (zh) 用于对音频信号进行编码和解码的方法及设备
CN101903943A (zh) 用于处理信号的方法和装置
US8346380B2 (en) Method and an apparatus for processing a signal
JP2021047432A (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器
US8271291B2 (en) Method and an apparatus for identifying frame type
Aggrawal et al. New Enhancements for Improved Image Quality and Channel Separation in the Immersive Sound Field Rendition (ISR) Parametric Multichannel Audio Coding System

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110824