CN102165520B - 处理信号的方法和装置 - Google Patents

处理信号的方法和装置 Download PDF

Info

Publication number
CN102165520B
CN102165520B CN200980137978XA CN200980137978A CN102165520B CN 102165520 B CN102165520 B CN 102165520B CN 200980137978X A CN200980137978X A CN 200980137978XA CN 200980137978 A CN200980137978 A CN 200980137978A CN 102165520 B CN102165520 B CN 102165520B
Authority
CN
China
Prior art keywords
ipd
value
unit
signal
spatial information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980137978XA
Other languages
English (en)
Other versions
CN102165520A (zh
Inventor
李显国
尹圣龙
金东秀
林宰显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority claimed from PCT/KR2009/005497 external-priority patent/WO2010036059A2/en
Publication of CN102165520A publication Critical patent/CN102165520A/zh
Application granted granted Critical
Publication of CN102165520B publication Critical patent/CN102165520B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Pure & Applied Mathematics (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了一种处理信号的方法。本发明包括:接收从多信道信号生成的下混信号和值示多信道信号的属性的空间信息,以上混所述下混信号;从空间信息的头部获得指示IPD值是否用于空间信息的信道间相位差(IPD)编译标记;基于IPD编译标记从空间信息的帧获得IPD模式标记,该IPD模式标记指示IPD值是否用于空间信息的帧;基于IPD模式标记获得在帧中参数时隙的参数频带的IPD值;通过使用先前的参数时隙的IPD值修改IPD值来平滑IPD值;以及通过将已平滑的IPD值应用于所述下混信号来生成多信道信号。

Description

处理信号的方法和装置
技术领域
本发明涉及用于处理信号的装置及其方法。虽然本发明适用于宽的应用范围,但是其特别适用于增强信号的声音质量,并且以使用从移动输入信号的相位生成的信号和使用相移信号的信道间相位差值的方式更加完美地重建输入信号。
背景技术
通常,为了从单声道信号生成立体声信号,使用解相关器来编译信号。
并且,信号处理器能够使用信道间电平差值和信道间相关值来编译信号。
发明内容
技术问题
然而,在使用解相关器生成音频信号的情况下,该解相关器不能精确再现在信道信号之间存在的相位或者延迟差。
在使用信道间电平差值和信道间相关值来编译信号的情况下,不能恢复和反映输入信号的信道间相位差。因此,难以执行精确的声音图像定位。并且,不能恢复输入信号的混响。
技术方案
因此,本发明针对一种用于处理信号的装置及其方法,其基本上消除了由于相关技术的限制和缺点而造成的一个或多个问题。
本发明的一个目的是提供一种用于处理信号的装置及其方法,由此增加了声音质量,并且可以以重建和移动解码的音频或者语音信号的相位的方式来提供与原始声音接近的信号。
有益效果
因此,本发明提供以下的效果和/或优点。
第一,在根据本发明用于处理信号的方法和装置中,在通过基于相移标记移动解码的音频信号或者语音信号的相位来执行解码时,能够有效地再现解相关器难以有效地再现的相位或者延迟差。
第二,在根据本发明用于处理信号的方法和装置中,基于信道间相位差(IPD)编译标记和信道间相位差(IPD)模式标记,使用信道间相位差(IPD)值来重建使用信道间电平差值和信道间相关值难以重建的混响。并且,还能够清楚地执行声音图像定位。
第三,在根据本发明用于处理信号的方法和装置中,通过接收指示信道间相位差值是否用于每个帧的信道间相位差模式标记,必要时,能够使用信道间相位差值来解码信号。
第四,在根据本发明用于处理信号的方法和装置中,通过使用先前的参数时隙的信道间相位差值来修改(平滑)当前的参数时隙的信道间相位差值,能够去除噪声,该噪声可能从在两个信道间相位信息之差而瞬时生成。
第五,在根据本发明用于处理信号的方法和装置中,通过仅当满足预定的条件时才传送信道间相位差值,能够提高编译效率。并且,还能够解码与原始声音接近的信号。
第六,在根据本发明用于处理信号的方法和装置中,由编码器测量的信道间相位差值被转换为信道间电平差值,并且然后传送已转换的信息。因此,即使使用不允许传送信道间相位差值的常规信号处理装置和方法,也能够重建具有增强混响和与原始声音接近的声音图像定位的信号[向后兼容性]。
附图说明
附图被包括以提供对本发明进一步的理解,并且被合并在本说明书中和构成本说明书的一部分,附图图示了本发明的实施例,并且与该描述一起可以用于解释本发明的原理。
在附图中:
图1是根据本发明的一个实施例的用于信号处理方法概念的视图;
图2是根据本发明的一个实施例的用于处理信号的装置的框图;
图3是在信号中相位和时间之间关系的图形;
图4是在图2中示出的IPD测量单元和IPD获得单元的详细框图;
图5是根据本发明另一个实施例的信号处理装置的框图;
图6是根据本发明另一个实施例的信号处理装置的框图;
图7是根据相关技术用于参数时隙概念的视图;
图8是根据本发明另一个实施例的用于修改(平滑)信道间相位差值的方法的示意图;
图9是根据图8中示出的本发明另一个实施例的信号处理装置的框图;
图10是根据本发明另一个实施例的通过信号处理装置和方法解决的问题的概念的视图;
图11和图12是根据本发明另一个实施例的信号处理装置的框图;
图13是根据本发明另一个实施例的用于使用全局帧信道间相位差(IPD)值的概念的视图;
图14是根据本发明另一个实施例的信号处理装置的框图;
图15至17是根据本发明另一个实施例的信号处理装置的框图;
图18是根据本发明另一个实施例的包括IPD编译标记获得单元、IPD模式标记获得单元、IPD获得单元和上混单元的产品的配置的示意图;
图19是根据本发明另一个实施例的用于分别包括IPD编译标记获得单元、IPD模式标记获得单元、IPD获得单元和上混单元的产品的关系的示意图;以及
图20是根据本发明另一个实施例的包括IPD编译标记获得单元、IPD模式标记获得单元、IPD获得单元和上混单元的广播信号解码装置的示意框图。
具体实施方式
本发明的附加特征和优点将在后面的描述中阐述,并且从该描述中在某种程度上将是显而易见,或者可以通过实施本发明获悉。通过在撰写的说明书及其权利要求书以及所附的附图中特别指出的结构,将实现和获得本发明的目的和其他优点。
为了实现这些和其他的优点,以及依据本发明的目的,如体现和广泛地描述的,一种处理信号的方法,包括:接收从多信道信号生成的下混信号和指示所述多信道信号的属性的空间信息,以上混所述下混信号;从空间信息的头部获得指示IPD值是否用于空间信息的信道间相位差(IPD)编译标记;基于IPD编译标记从空间信息的帧获得IPD模式标记,IPD模式标记指示IPD值是否用于空间信息的帧;基于IPD模式标记获得在帧中参数时隙的参数频带的IPD值;通过使用先前参数时隙的IPD值修改IPD值来平滑IPD值;以及通过将已平滑的IPD值应用于下混信号来生成多信道信号。该空间信息被划分为头部和多个帧,并且该IPD值指示在多信道信号的两个信道之间的相位差。该参数时隙指示应用了IPD值的时隙,并且该参数频带是包括IPD值的频域的至少一个子频带。
根据另一个实施例,本发明进一步包括:通过使用IPD值来生成指示多信道信号的两个信道之间的角度的校正角度;以及使用先前参数时隙的校正角度来修改校正角度。
根据另一个实施例,本发明进一步包括:通过使用IPD值和已平滑的IPD值中的至少一个来确定没有应用IPD值的时隙的IPD值。
应当明白,上文的一般描述和下面的详细描述是示例性和解释性的,并且意在对如要求保护的本发明提供进一步的解释。
发明模式
现在将详细地参照本发明的优选实施例,其例子在附图中被图示。首先,在本说明书和权利要求书中使用的术语或者措词不应当被解释为局限于一般的或者字典含义,并且应当被解释为是基于发明人能够恰当地定义该术语的概念以最佳方式描述发明人的发明的原则,匹配本发明的技术想法的含义和概念。在本公开中公开的实施例和附图中示出的配置仅仅是一个优选实施例,并且不表示本发明的所有技术想法。因此,应当明白,本发明覆盖本发明的修改和变化,只要它们归入在提交本申请的时间点所附的权利要求书及其等同物的范围之内。
首先,应当明白,本发明中的概念“编译”包括编码和解码两者。
其次,在本公开中,“信息”是通常包括值、参数、系数、要素等等的术语,并且其含义可以被解释为偶尔地不同,本发明不限于此。在本公开中立体声信号作为信号的例子,本发明的例子不限于此。例如,在本公开中的信号可以包括具有至少三个以上信道的多信道信号。
图1是根据本发明的一个实施例的用于信号处理方法的概念的视图。
参考图1,空间信息可以被划分为头部和多个帧。在这种情况下,该空间信息是指示作为输入信号的多信道信号的属性的信息。并且,该空间信息可以包括指示在多信道的两个信道之间电平差的信道间电平差值,指示在两个信道之间相关性的信道间相关值,和指示在两个信道之间相位差的信道间相位差值。这个空间信息可用于通过上混来重建下混信号,下混信号是由解码器从下混多信道信号生成的。
该空间信息的头部包括指示供使用信道间相位差值的帧是否存在于整个帧中的信道间相位差编译标记(bsPhaseCoding)。特别地,由于信道间相位差编译标记包括在该头部中,所以其能够确定信道间相位差值是否供该空间信息的所有帧中的至少一个使用。该信道间相位差编译标记的含义在表1中示出。
[表1]
Figure BPA00001332499600061
而且,信道间相位差模式标记(bsPhaseMode)指示信道间相位差值是否用于帧,信道间相位差模式标记被包括在空间信息的帧的每个中。仅当信道间相位差编译标记被设置为1时,即,该信道间相位差编译标记指示IPD编译用于空间信息,该信道间相位差模式标记才被包括在该帧中。该信道间相位差模式标记(bsPhaseMode)的详细含义在表2中示出。
[表2]
 bsPhaseMode  含义
 1  这指示IPD值用于当前的帧。
 0  这指示IPD值没有用于当前的帧。
现在参考图1,如果帧2的信道间相位差模式标记被设置为1[bsPhaseMode=1],则信道间相位差值(IPD)在帧2中作为非零值被包括。如果帧3的信道间相位差模式标记被设置为0[bsPhaseMode=0],则信道间相位差值(IPD)在该帧3中具有设置为0的值。
因此,该信道间相位差值是基于信道间相位差编译标记和信道间相位差模式标记获得的,并且然后应用于下混信号以上混到多信道信号中。
图2是根据本发明的一个实施例的用于处理信号的装置的框图。
参考图2,信号处理装置200包括下混单元210、空间信息生成单元220、信息获得单元230和上混单元240。
下混单元210接收多信道信号的输入,并且然后能够生成下混信号(DMX)。在这种情况下,多信道信号包括具有至少三个或三个以上信道的信号。并且,多信道信号可以包括具有单声道或者立体声信道的信号。下混单元210能够通过下混多信道信号来生成具有比多信道信号的信道更少信道的下混信号。
如参考图1先前的描述中提及的,空间信息生成单元220生成空间信息以稍后在解码器中上混所述下混信号。并且,这个空间信息可以指示多信道信号的属性。如在先前的描述中提及的,该空间信息可以包括信道间电平差值、信道间相关值、信道间相位差值等等。在本公开中,参考图2中示出的空间信息生成单元220详细地如下解释了信道间相位差值。
首先,空间信息生成单元220包括IPD使用确定单元221、IPD值测量单元222、IPD模式标记生成单元223和IPD编译标记生成单元224。
IPD使用确定单元221能够确定信道间相位差(IPD)值是否将包括在空间信息中。特别地是,IPD使用确定单元221能够基于多信道信号的特性,并且更特别地,基于信道间相位差值和信道间电平差值的比率,确定信道间相位差(IPD)值是否将包括在空间信息中。例如,如果多信道信号是语音信号,则其能够确定该信道间相位差(IPD)值将包括在空间信息中。稍后将对此进行详细解释。
如果IPD使用确定单元221确定使用该信道间相位差值,则IPD值测量单元从输入给空间信息生成单元200的多信道信号测量在两个信道之间的相位差。在这种情况下,所测量的相位差可以包括相位和/或角度、时间差或者与角度或者时间差相对应的索引值。在信号中,相位和时间具有密切关系,稍后将参考图3对其进行详细解释。
IPD模式标记生成单元223生成参考图1描述的信道间相位差模式标记(bsPhaseMode)。特别地,该信道间相位差模式标记指示该信道间相位差值是否用于帧。并且,这个帧可以是包括其中信道间相位差值的当前的帧。因此,该信道间相位差模式标记可以对于每个帧可变地存在。特别地,当该信道间相位差编译标记指示IPD值没有用于该空间信息的所有帧时,该信道间相位差模式标记可以不包括在该帧中。并且,该信道间相位差模式标记可以具有设置为0或者1的值。
并且,IPD编译标记生成单元224生成参考图1描述的信道间相位差编译标记(bsPhaseCoding)。特别地,由于IPD编译标记指示是否生成用于该空间信息的信道间相位差编译,所以如果该信道间相位差值用于图1中分割的空间信息的帧中的至少一个,则该信道间相位差编译标记指示1是必然的结果。
信息获得单元230从空间信息生成单元220接收空间信息的输入。在这种情况下,信道间相位差编译标记(bsPhaseCoding)和信道间相位差模式标记(bsPhaseMode)可以包括在空间信息和信道间相位(IPD)值中。信息获得单元230包括IPD编译标记获得单元231、IPD模式标记获得单元232和IPD值获得单元233。
IPD编译标记获得单元231从空间信息的头部获得信道间相位差编译标记,其指示信道间相位差值是否用于该空间信息的所有帧中的至少一个帧。信道间相位差编译标记的含义在表1中示出。
IPD模式标记获得单元232从空间信息的帧获得信道间相位差模式标记,其指示信道间相位差值是否用于该帧。特别地,如果信道间相位差编译标记指示使用信道间相位差值[bsPhaseCoding=1],则IPD模式标记获得单元232能够获得信道间相位差模式标记。
并且,IPD值获得单元233能够基于信道间相位差模式标记来获得信道间相位差值。对于参数频带,信道间相位差值可以存在。在本公开中,参数频带指示包括信道间相位差值的至少一个子频带。稍后将参考图7和图8对其进行详细解释。
并且,上混单元240能够通过将由信息获得单元230获得的信道间相位差值应用于从下混单元210输入的下混信号来生成多信道信号。在这种情况下,上混意指应用上混矩阵以生成具有比下混信号的信道更多信道的信号。并且,上混的信号指示应用上混矩阵的信号。多信道信号是具有比下混信号的信道更多信道的信号。并且,多信道信号可以指示应用上混矩阵本身的信号。多信道信号可以包括通过向其应用上混矩阵生成的具有多信道的QMF域信号,或者从QMF域信号变换为时域信号的最后信号。
因此,根据本发明的信号处理装置和方法基于信道间相位差编译标记和信道间相位差模式标记来使用信道间相位差值。因此,本发明使用信道间电平差值和信道间相关值来恢复难以被恢复的混响。并且,本发明能够清楚地执行声音图像定位。
图3是在信号中相位和时间之间关系的图形。左边图形示出了相位-幅度域中的信号。信号(a)是在没有相位变化的情况下输入的信号。并且,信号(b)指示具有比信号(a)相位进一步延迟了π/2的信号。
同时,图3中示出的右边图形指示时间幅度域中的信号,并且表示与左边图形中的信号(a)和(b)分别相对应的信号(a)′和(b)′。特别地,信号(b)是比信号(a)进一步延迟了π/2的信号,其可以表示等于作为比信号(a)′进一步延迟了33ms输入的信号的信号(b)′。因此,相位和时间在信号中具有紧密的关系,并且即使它们被变换成相互对应的值,也提供相同的效果。
图4是图2中示出的IPD值测量单元222和IPD值获得单元233的详细框图。参考图4,IPD测量单元410包括IPD值测量单元411、IPD量化单元412和IPD量化模式标记生成单元413。
IPD值测量单元411从所输入的多信道信号测量信道间相位差值。如在先前的描述中提及的,信道间相位差值可以包括相位角、时间延迟值或者与相位角或者时间延迟值相对应的索引值。
IPD量化单元412量化由IPD值测量单元411测量的信道间相位差值。IPD量化单元412可以进一步包括用于通过根据量化间隔的差分方法量化信道间相位差值的详细结构。例如,第一量化单元(图中未示出)能够使用精细的量化间隔(精细的间隔)来量化信道间相位差值,并且第二量化单元能够使用粗略的量化间隔(粗略的间隔)来量化信道间相位差值。
并且,IPD量化模式标记生成单元413能够生成指示量化信道间相位差值的方案的量化模式标记(IPD_quant_mode_flag)。特别地,该量化模式标记能够指示是使用精细的间隔还是粗略的间隔来量化信道间相位差值。
信道间相位差值获得单元420包括IPD量化模式标记获得单元421、第一反量化单元422、第二反量化单元423和反量化的IPD值获得单元424。
首先,IPD量化模式标记获得单元421从自编码器接收到的空间信息中获得指示应用于信道间相位差值的量化方案的量化模式标记(IPD_quant_mode_flag)。该量化模式标记的含义在表3中示出。
[表3]
Figure BPA00001332499600111
如果量化模式标记被设置为0(IPD_quant_mode_flag=0),则第一反量化单元422接收信道间相位差值,并且然后使用粗略的间隔来反量化信道间相位差值。相反地,如果量化模式标记被设置为1(IPD_quant_mode_flag=1),则第二反量化单元423接收信道间相位差值,并且然后使用精细的间隔来反量化信道间相位差值。
随后,已反量化的IPD值获得单元424能够从第一反量化单元42或者第二反量化单元423获得已反量化的信道间相位差值。
图5是使用相移标记来补偿多信道信号的相位重建的信号处理装置500的框图。
参考图5,信号处理装置500包括全局频带IPD值确定单元510、信号修改单元520、下混单元530、空间信息生成单元540、空间信息获得单元560和相移单元570。
首先,全局频带IPD值确定单元510接收多信道信号的输入。在这种情况下,多信道信号可以包括具有至少一个异相信道的信号,并且特别地,可以包括立体声信号或者具有至少三个或三个以上信道的信号。全局频带IPD值确定单元510从多信道信号确定指示相位程度的相移标记,其被移动使得所输入的多信道信号同相。
该相移标记可以包括指示已经移动了多信道信号的相位的标记信息,并且能够进一步包括与相移有关的信息,诸如相移程度、相移信道信号、相移发生频带、与相移等等相对应的时间信息以及标记信息。
首先,在相移标记仅仅指示标记信息的情况下,可以使用固定值来移动多信道信号的相位。例如,在多信道信号是立体声信号的情况下,能够通过以以下的方式移动相位来生成多信道信号,即,通过将立体声信号的右信道的相位减小π/2,或者将其左信道的相位增大π/2,左信道和右信道变得相互正交。不是局限于π/2相移,而是能够通过移动相位以使得左信道和右信道能够变得相互正交来生成多信道信号。
如此,该移动的相位同样适用于多信道信号的整个频带。而且,不是传送指示多信道信号中的至少一个信道的相位被修改了π/2的信息,或者有关相移以变为正交的信息,而是能够使用稍后在解码器侧中预置的信息,本发明不受限于此。
在这种情况下,可以将信息传输大小减小为小于在多个参数频带的每个上携带信道间相位差值的信息传输大小。并且,还能够防止在对于每个参数频带应用信道间差信息的情况下可能发生的相位差的问题。
此外,相移标记可以进一步包括与相移以及标记信息相关联的详细信息。在这种情况下,该详细信息可以包括相位的移动信息、有关相移信道信号的信息、有关频带的信息和发生相移的时间等等。
同时,相移标记可以可变地指示对于每个帧多信道信号的相位的移动程度。在相移标记仅仅包括标记信息的情况下,能够指示是否按照(per)帧移动相位。在相移标记包括标记信息和有关相移的详细信息的情况下,该详细信息可以指示按照子频带或者参数频带的相位的移动程度,或者可以指示可变地按照预定的时间范围,例如,帧、时隙等等,在相应的时间上相位的移动程度。
而且,相移标记可以与参考图1至4解释的信道间相位差值同时使用。
信号修改单元520接收相移标记和多信道信号。多信道信号能够通过使用相移标记修改至少一个信道的相位来生成相移的多信道信号。虽然在先前的描述中提及修改多信道信号的相位以使得异相的多信道信号能够变为同相多信道信号,并且生成与多信道信号有关的相移标记的方法,但是同相多信道信号被故意地移动以变为异相信号,并且然后能够生成与该异相信号相对应的相移标记。
下混单元530接收相移的多信道信号的输入,并且然后能够通过下混所输入的信号来生成下混信号。在这种情况下,多信道信号不局限于立体声信号,而是可以包括具有至少三个信道的信号。如果多信道信号是立体声信号,则下混信号可以包括单声道信号。如果多信道信号是具有至少三个信道的信号,则下混信号可以包括具有比多信道信号的信道更少信道的信号。
空间信息生成单元540能够通过接收相移的多信道信号的输入来生成指示多信道信号属性的空间信息。该空间信息被提供用于解码器,以将下混信号解码为相移的多信道信号,并且可以包括信道间电平差值、信道间相关值、信道预测系数等等。因此,由本发明的空间信息生成单元540生成的空间信息可以不必等于从无相移的多信道信号生成的空间信息。
另外,比特流生成单元(图中未示出)能够生成包含空间信息和相移标记的一个比特流,或者包含下混信号、空间信息和相移标记的一个比特流。
信息获得单元550从该比特流中获得空间信息和相移标记以上混所述下混信号。
上混单元560具有与图2中示出的以前的上混单元240相同的配置,并且执行与图2中示出的以前的上混单元240相同的功能。上混的多信道信号可以是应用了上混矩阵的信号。上混的多信道信号可以是通过上混生成的QMF域信号。并且,上混的多信道信号可以是作为时域信号生成的最后的信号。另外,由上混单元560上混的信号可以包括由信号修改单元520相移的多信道信号。
相移单元570从信息获得单元550接收相移标记的输入,并且从上混单元560接收相移的多信道信号的输入。随后,相移单元570通过将相移标记应用于相移的多信道信号来重建多信道信号的移动的相位。
如在先前的描述中提及的,相移标记可以仅仅包括指示是否移动了多信道信号的至少一个信道的相位的标记信息,或者可以进一步包括与该相移有关的详细信息。如果仅仅包括标记信息,则相移单元570基于该标记信息来确定是否移动上混的多信道信号的相位,并且然后能够使用固定值来移动多信道信号的至少一个信道的相位。在这种情况下,由解码器预置的值可作为固定值使用,而不是分别地由编码器测量和传送。例如,能够将多信道信号的至少一个信道的相位增加或者减小π/2。在这种情况下,能够同样地将π/2应用于多信道信号的所有频带。而且,由于相移标记可以按照帧确定,所以对于每个帧可以可变地指示多信道信号的相移的程度、或者存在或不存在相移。
图6是根据本发明的另一个实施例的用于使用相移标记来补偿多信道信号的相位重建的信号处理装置600的框图。
参考图6,信号处理装置600包括下混单元610、空间信息生成单元620、信号修改单元630、全局频带IPD值获得单元640、相移单元650和上混单元660。
首先,下混单元610通过下混输入的多信道信号来生成下混信号DMX。在这种情况下,多信道信号是在没有移动其相位的情况下输入的信号。
空间信息生成单元620能够生成指示所输入的多信道信号的属性的空间信息。这个空间信息具有与图5示出的以前的空间信息相同的配置和功能,但是,不同于正在从无相移的多信道信号生成的以前的空间信息。同时,空间信息生成单元620包括全局频带IPD值确定单元621。这个全局频带IPD值确定单元621具有与图5中示出的以前的全局频带IPD值确定单元相同的配置和功能,在以下的描述中省略了其细节。
信号修改单元630能够基于从全局频带IPD确定单元621输出的相移标记,通过修改从下混单元610输出的下混信号的至少一个信道的相位来生成相位修改的下混信号DMX′。
随后,全局频带IPD值获得单元640获得相移标记。然后,相移单元650能够基于该相移标记,通过移动所输入的修改下混信号DMX′的至少一个信道的相位来重建下混信号DMX。在这种情况下,由相移单元650移动了其相位的下混信号可以等于输入到信号修改单元630的信号DMX。
上混单元660能够通过从空间信息生成单元620接收空间信息并且从相移单元650接收下混信号DMX来解码多信道信号。
同时,根据本发明的信号处理装置和方法执行用于去除从信道间相位差值变化的点瞬时生成的噪声的各种方法。参考图7至9对此解释如下。
首先,图7是用于参数时隙的概念的视图,其中可以在时间-频率域中表示信号。
参考图7,参数集被应用于一个帧的N个时隙中的两个(时隙2和时隙4)。并且,信号的整个频带被划分成5个参数频带。因此,时间轴的单位是时隙,频率轴的单位是参数频带(pb),并且该参数频带可以是包括相同的信道间相位差的频率域子频带中的至少一个。并且,时隙称作参数时隙,其被定义为使得能够向其应用该参数集,并且更特别地,该信道间相位差值。
图8是用于根据本发明另一个实施例的信息方法的示意图。
参考图8,左下方的图形示出在参数时隙中的第二参数频带中包括的信道间相位差值。应用于参数时隙[0]的信道间相位差值可以是10°,并且应用于参数时隙[1]的信道间相位差值可以是60°。因此,在该信道间相位差值显著地变化的点上,可能生成意外的噪声。因此,根据本发明的该信号处理方法和装置通过使用应用于先前的参数时隙的信道间相位差值来平滑应用于当前的参数时隙的信道间相位差值,提供去除噪声的效果。
现在参考图8,假设当前的参数时隙是时隙[1],先前的参数时隙可以是参数时隙[0]。观察图8中的右下方的图形,可以使用应用于先前的参数时隙的信道间相位差值(10°)来平滑应用于当前的参数时隙的信道间相位差值(60°)。因此,当前的参数时隙的已平滑的信道间相位差值可以具有小于60°的值。
随后,通过内插和/或复制应用于当前的和/或先前的参数时隙的已平滑的信道间相位差值,能够获得要应用于诸如时隙1、时隙3、…、时隙N的时隙(其被定义为不具有向其应用的参数集)的信道间相位差值。
图9是根据图8中示出的本发明另一个实施例的信号处理装置的框图。
参考图9,图9中的下混单元910、IPD使用确定单元921、IPD值测量单元922、IPD模式标记生成单元923、IPD编译标记生成单元924、IPD编译标记获得单元931、IPD模式标记获得单元932、IPD值获得单元933和上混单元940具有分别与图2中的下混单元210、IPD使用确定单元221、IPD值测量单元222、IPD模式标记生成单元223、IPD编译标记生成单元224、IPD编译标记获得单元231、IPD模式标记获得单元232、IPD值获得单元233和上混单元240相同的配置和功能。在以下的描述中省略它们的细节。
信息获得单元930能够进一步包括IPD平滑单元934。IPD值平滑单元934能够使用应用于先前的参数时隙的信道间相位差值来修改(平滑)应用于当前的参数时隙的信道间相位差值。这里,如果在应用于当前的参数时隙的信道间相位差值和应用于先前的参数时隙的信道间相位差值之间存在大的间隙,则能够防止可能生成噪声。
IPD值平滑单元934能够从应用于当前的参数时隙的信道间相位差值来生成指示在多信道的两个之间的角度的校正角度,并且然后能够使用先前的参数时隙的校正角度来修改该校正角度。然后,将已修改的校正角度输出到上混单元840。上混单元640将已修改的相位角度应用于下混信号以生成多信道信号。
在以下的描述中,在使用信道间电平差值和信道间相关值,而不是通常使用信道间相位差值来编译信号的情况下,解释了用于解决根据本发明的可能的问题的各种实施例。
图10A和图10B是根据本发明另一个实施例的用于由信号处理装置和方法解决的问题的概念的视图。
在许多种信号编译设备中,并且更特别地,在由3GPP标准化的EAAC+,和由AAC加和USAC使用的MPEG或者PS中,信道间电平差值和信道间相关值仅仅用作空间信息,而不是使用信道间相位差值。这归因于相位缠绕以及从合成信道间相位差值中生成的声音质量退化,相位缠绕可能在生成信道间相位差值时生成。
但是,如果在没有使用信道间相位差值的情况下编译了多信道信号,则可能造成严重的声音图像定位问题。换句话说,主要地使用信道间电平差值来编译的信号,诸如通过安排至少两个麦克风相互接近而记录的信号可能不会有问题。但是,在解码多信道信号时,除非使用信道间相位差值,不能对通过将至少两个麦克风相互间隔开布置而记录的信号正确地执行声音图像定位。
图10A示出了在没有信道间相位差值的情况下解码仅具有信道间相位差值的立体声信号的情况的结果。
参考图10A,原始信号是仅仅以信道间相位差值(IPD=30°)配置的信号。但是,如果仅仅使用信道间电平差值和信道间相关值来执行解码,则没有有效的空间信息(IPD),不管该原始信号,解码的信号(合成信号)的声音图像位于立体声信号的中心。在这种情况下,虽然信道间相关值影响声音图像定位,但是在没有信道间相位差值的情况下不可能执行校正声音图像定位。
图10B示出了在没有信道间相位差值的情况下解码混合了信道间相位差值和信道间电平差值的立体声信号的情况的结果。
参考图10B,立体声信号的声音图像定位被确定为从信道间相位差值确定的调整角度和从信道间电平差值确定的调整角度的线性总和。如图10B所示,如果原始立体声信号的左侧信号具有比其右侧信号大8dB的值,并且比右侧信号快0.5ms,则8dB的电平差可以将声音图像从中心向左移动20°(-20°)。并且,0.5ms的时间差(等于“-10°”的信道间相位差值)能够将声音图像向左移动10°(-10°)。因此,原始立体声信号(原始的)位于-30°的位置上。但是,如果在没有信道间相位差值的情况下解码信号,则已解码的信号的声音图像位于-20°,不可能执行校正声音图像定位。
因此,根据本发明另一个实施例的信号处理方法和装置提供了用于另外解决声音图像定位问题的各种方法。
图11和图12是根据本发明另一个实施例的信号处理装置和方法的框图。
首先,仅当基于多信道信号的信道间相位差值和多信道信号的信道间电平差值之间的比率满足了预定条件时,才能够使用信道间相位差值。
参考图11,信号处理装置1100包括下混单元1110、空间信息生成单元1120、信息获得单元1130和上混单元1140。
下混单元1110和上混单元1140具有与图2中的以前的下混单元210和以前的上混单元240相同的配置和功能。空间信息生成单元1120包括ILD值测量单元1121、IPD值测量单元1122、信息确定单元1123和IPD标记生成单元1124。ILD值测量单元1121和IPD值测量单元1122分别从多信道信号测量信道间电平差值和信道间相位差值。在这种情况下,对于每个参数频带,可以测量信道间电平差值和信道间相位差值。
信息确定单元1123使用所测量的信道间电平差值和所测量的信道间相位差值来计算信号被声音图像定位到什么程度,并且还计算信道间电平/相位差信息与总的声音图像定位的比。仅当信道间相位差值的比高于另一个的时候,信息确定单元1123才确定使用该信道间相位差值。例如,如果所测量的信道间相位差值对应于+20°,并且所测量的信道间电平差值对应于具有4dB供相移+10°的值,则在总的声音图像定位(20°+10°=30°)中信道间相位差值的贡献程度和信道间电平差值的程度分别可以达到20/30和10/30。在这种情况下,由于信道间相位差值可以被认为是具有相对更大的重要性,所以信息确定单元1123能够确定进一步使用信道间相位差值。
如果信息确定单元1123确定进一步使用信道间相位差值,则IPD标记生成单元1124能够生成指示使用了信道间相位差值的信道间相位差值标记。
同时,信息获得单元1130可以包括IPD标记获得单元1131和IPD获得单元1132。IPD标记获得单元1131获得信道间相位差值标记,并且然后确定信道间相位差值是否包括在空间信息中。如果信道间相位差值标记被设置为1,则IPD获得单元1132被激活,并且然后从空间信息中获得信道间相位差值。随后,上混单元1140通过使用包括信道间相位差值的空间信息上混所述下混信号来解码多信道信号。因此,相比于没有使用信道间相位差值的情况,可以更加正确地执行声音图像定位。仅当满足预定的条件时,才传送信道间相位差值。因此,也能够提高编译效率。
其次,信道间相位差值可以以等效的信道间电平差值代替,并且反之亦然。在这种情况下,由于声音图像定位所必需的信道间相位差值或者信道间电平差值可以根据频率而变化,所以参考按照频带定义的数据库。
图12示出了使用替换信道间相位差值的等效的信道间电平差值的信号处理装置1220。
参考图12,信号处理装置1200包括ILD值测量单元1210、IPD值测量单元1220、信息确定单元1230、IPD值转换单元1240和ILD值修改单元1250。
ILD值测量单元1210、IPD值测量单元1220和信息确定单元1230具有与以前的ILD值测量单元1110、以前的IPD值测量单元1120和以前的信息确定单元1130相同的配置和功能,在以下的描述中省略了其细节。在信息确定单元1130确定使用信道间相位差值的情况下,所测量的信道间相位差值被输入到IPD值转换单元1240。
IPD值转换单元1240使用该数据库将对相应的频带测量的信道间相位差值转换为信道间电平差值ILD′。随后,ILD值修改单元1250通过将从信道间相位差值转换的信道间电平差值ILD′与从ILD值测量单元1210输入的信道间电平差值ILD相加来计算修改的信道间电平差值ILD″。
因此,在将信道间相位差值转换为等效的信道间电平差值而使用的情况下,能够在3GPP或者MPEG的HE AAC加中或者在USAC标准中的PS使用常规的信号处理装置和方法来解码信号,其中通过反映信道间相位差值来增强混响和声音图像定位,常规的信号处理装置和方法不接受信道间相位差值的接收。
第三,通过将信道间相位差值共同地应用于至少一个或多个连续帧,能够增强校正声音图像定位和编译效率。在预置的规范中,用于若干连续帧的信道间相位差值被称作全局帧信道间相位差值(全局帧IPD值)。
图13是根据本发明另一个实施例的用于使用全局帧信道间相位差(IPD)值的概念的视图。在图13中,数字0至13分别指示帧。阴影的帧指示使用信道间相位差值的帧。非阴影的帧指示不使用信道间相位差值的帧。它们可以基于在本公开中描述的信道间相位差模式标记(bsPhaseMode)来确定。
参考图13,在帧1至3和帧8至12仅仅使用信道间相位差值的情况下,在没有传送用于每个帧的信道间相位差值的情况下计算了代表值,并且然后将代表值同样应用于确定的连续帧以向其应用信道间相位差值。全局帧信道间相位差值包括在连续帧的第一个帧中。并且,每个帧能够包括指示是否使用全局帧信道间相位差值的全局帧信道间相位差标记。全局帧信道间相位差标记的含义在表4中示出。
[表4]
 Global_frame_IPD_flag   含义
 1   使用全局帧信道间相位差值。
 0   不使用全局帧信道间相位差值。
例如,基于全局帧信道间相位差标记,帧0不使用全局帧信道间相位差值,但是,帧1使用全局帧信道间相位差值。因此,帧1包括全局帧信道间相位差值,并且相同的全局帧信道间相位差值适用于帧1至3。同样地,帧8包括全局帧信道间相位差值,并且相同的全局帧信道间相位差值适用于帧8至12。
图14是根据本发明实施例的使用全局帧信道间相位差值的信号编译装置1400的框图。
参考图14,信号编译装置1400包括先前帧的全局帧IPD值接收单元1410、全局帧IPD值计算单元1420、全局帧IPD标记生成单元1430、全局帧IPD标记获得单元1440、全局帧IPD值获得单元1450和上混单元1460。
先前帧的全局帧IPD值接收单元1410接收先前帧的全局帧信道间相位差值。例如,如果当前的帧是包括全局帧信道间相位差值的第一帧,则接收到的先前帧的全局帧信道间相位差值将不存在。相反地,如果当前帧是在包括全局帧信道间相位差值的连续帧之中的第二或者高阶的帧,则能够从先前帧接收全局帧信道间相位差值。
如果当前的帧是包括全局帧信道间相位差值的第一帧,即,如果先前帧的全局帧信道间相位差值不存在,则全局帧ILD值计算单元1420能够计算全局帧信道间相位差值。当前帧的全局帧信道间相位差值可以包括使用了信道间相位差值的连续帧的信道间相位差值的平均值。
全局帧IPD标记生成单元1430生成指示在当前帧中是否使用全局帧IPD值的全局帧IPD标记(global_frame_IPD_flag)。
随后,全局帧IPD标记获得单元1440获得全局帧信道间相位差值。并且,全局帧IPD值获得单元1450能够获得从先前帧全局帧IPD值接收单元1410输出的先前帧的全局帧信道间相位差值,或者从全局帧IPD值计算单元1420输出的当前帧的全局帧信道间相位差值。优选地,如果当前帧是向其应用了信道间相位差值的连续帧的第一帧,则全局帧IPD值获得单元1450获得先前帧的全局帧信道间相位差值。如果当前帧是第二或者高阶的帧,则全局帧IPD值获得单元1450能够获得所计算的当前帧的全局帧信道间相位差值。
并且,上混单元1460通过将全局帧信道间相位差值应用于下混信号来生成多信道信号。
第四,为了调整解码的多信道信号以具有最大限度地接近于输入到编码器的多信道信号的混响,其能够调整信道间相关值。现在参考图10B,在使用信道间相位差值和信道间相关值来解码信号的情况下,造成使混响比原始信号的混响更大地增大问题。这个混响意指由于周围环境仿佛信号存在于更宽或者更窄的空间的效果。在本公开中,尽管原始信号记录在窄的录音室中,但是混响的增大意指听到解码的信号仿佛记录在宽的大厅中。
在常规的信号处理方法和装置中经常导致这个问题,其中没有传送信道间相位差值。但是,在传送信道间相位差值的情况下也可能造成这个问题。
这个问题可以以在图15中示出的方式解决。图15是根据本发明的另一个实施例的信号处理装置1500的框图。
参考图15,信号处理装置1500包括ICC值测量单元1510、IPD值测量单元1520、ILD值测量单元1530、信息确定单元1540、ICC值修改单元1550、IPD模式标记生成单元1560、IPD模式标记获得单元1570、IPD值获得单元1580、ICC值获得单元1590和上混单元1595。
ICC值测量单元1510、IPD值测量单元1520和ILD值测量单元1530可以分别从多信道信号测量信道间相关值、信道间相位差值和信道间电平差值。
信息确定单元1540和IPD模式标记生成单元1560分别地具有与图11中以前的信息确定单元和以前的IPD标记生成单元1124相同的配置和功能。信息确定单元1540计算测量信道间电平/相位差信息与总的声音图像定位的比。仅当信道间相位差值的比高于另一个时,信息确定单元1540才确定使用该信道间相位差值。IPD模式标记生成单元1560生成指示是否使用信道间相位差值的信道间相位差模式标记。
如果信息确定单元1540确定使用信道间相位差值,则ICC值修改单元1550能够修改从ICC测量单元1510输入的信道间相关值。优选地,所测量的信道间相关值可以不包括在使用信道间相位差值的参数频带中。为了解决混响增大的问题,由信道间相关值指示的值的大小可以被修改以使用。
IPD标记获得单元1570和IPD值获得单元1580具有与图11中以前的IPD标记获得单元1131和以前的IPD值获得单元1132相同的配置和功能,在以下的描述中省略其细节。
如果IPD标记获得单元1570的信道间相位差标记指示使用了信道间相位差值,则ICC值获得单元1590从ICC值修改单元1550接收已修改的信道间相关值。
并且,上混单元1595能够通过将信道间相位差值和已修改的信道间相关值应用于所接收到的下混信号来生成多信道信号。因此,能够防止信号在使用信道间相位差值的信号处理方法和装置中由于信道间相关值增大的混响而失真。
第五,信道间相位差值能够使用具有更简单的音源的信号的重要性提高更高的特征。
图16是根据发明的另一个实施例的信号处理装置1600的框图。
参考图16,信号处理装置1600包括输入信号分类单元1610、IPD值测量单元1620、IPD标记生成单元1630、IPD标记获得单元1640、IPD值获得单元1650和上混单元1660。
输入信号分类单元1610确定输入信号是否是仅仅包含语音的纯语音信号、音乐信号或者语音和音乐信号相互混合的混合信号。优选地,输入信号分类单元1610可以包括声音活动检测器(SAD)、语音和音乐分类器(SMC)等等中的一个。
仅当输入信号通过输入信号分类单元1610被确定为仅仅包含语音信号(纯语音信号)的信号时,IPD值测量单元1620测量信道间相位差值。
IPD标记生成单元1630、IPD标记获得单元1640、IPD值获得单元1650和上混单元1660分别具有与图11中以前的IPD标记生成单元1124、以前的IPD标记获得单元1131、以前的IPD值获得单元1132和以前的上混单元1140相同的配置和功能,在以下的描述中省略其细节。
尽管没有使用信道间相位差值,但是其中包含各种信号的音乐信号,或者其中混合了语音和音乐信号的混合信号使用信道间电平差值和信道间相关值来实现到预定程度的声音图像定位。但是,由于诸如语音信号这样的简单声源具有信道间相位差值重要性比较高的重要性,所以在没有信道间相位差值的情况下校正声音图像定位是不可能。因此,如果输入信号根据输入信号分类单元1610是语音信号,则使用信道间相位差值,由此可以利用核心校正声音图像定位来解码多信道信号。
图17示出了根据本发明另一个实施例的信号处理装置1700。
参考图17,信号处理装置1700包括多信道编码单元1710、带宽扩展信号编码单元1720、音频信号编码单元1730、语音信号编码单元1740、音频信号解码单元1750、语音信号解码单元1760、带宽扩展信号解码单元1770和多信道解码单元1780。
首先,由多信道编码单元1710从下混多信道信号生成的下混信号被称作整个频带下混信号。并且,由于从整个频带下混信号中去除了高频带信号,所以仅仅具有低频带的下混信号被称作低频带下混信号。
多信道编码单元1710接收具有多个信道的多信道信号的输入。多信道编码单元1710通过下混所输入的多信道信号来生成整个频带下混信号,并且还生成与多信道信号相对应的空间信息。在这种情况下,该空间信息可以包含信道电平差信息、信道预测系数、信道间相关值、下混增益信息等等。
根据本发明的一个实施例的多信道编码单元1710确定是否使用信道间相位差值,并且然后测量信道间相位差值。多信道编码单元1710生成指示帧是否使用信道间相位差值的信道间相位差模式信息,并且还生成指示使用信道间相位差值的帧是否存在于整个帧之中的信道间相位差编译信息。然后,多信道编码单元1710能够与混合信息一起传送所生成的信息。这与参考图1至4描述的几乎一样,并且在以下的描述中省略其细节。
因此,多信道编码单元1710可以包括参考图1至4描述的信号处理装置的编码设备,或者根据参考图5至16描述的本发明另一个实施例的信号处理装置。
带宽扩展信号编码单元1720接收整个频带下混信号,并且然后能够生成在整个频带下混信号中与高频带信号相对应的扩展信息。在这种情况下,该扩展信息是用于使得解码器侧能够将由于去除高频带而生成的低频频带下混信号重建到整个频带下混信号中的信息。并且,该扩展信息可以与该空间信息一起传送。
基于信号特性来确定是否将通过音频信号编译方案或者语音信号编译方案来编译下混信号。并且,生成用于确定编译方案的模式信息[图中未示出]。在这种情况下,音频编译方案可以使用MDCT(修改的离散余弦变换),本发明不受限于此。并且,语音编译方案可以遵循AMR-WB(自适应多速率宽带)标准,本发明不受限于此。
音频信号编码单元1730根据音频信号编译方案,使用从带宽扩展信号编码单元1720输入的扩展信息和整个频带下混信号来编码低频频带下混信号(从其去除了高频区域)。
通过音频信号编译方案编译的信号可以包括音频信号或者语音信号部分包括在音频信号中的信号。并且,音频信号编码单元1730可以包括频域编码单元。
语音信号编码单元1740根据语音信号编译方案,使用从带宽扩展信号编码单元1720输入的扩展信息和整个频带下混信号来编码低频带下混信号(从其去除了高频区域)。
由语音信号编译方案编码的信号可以包括语音信号或者部分包含在语音信号中的音频信号。语音信号编码单元1740能够进一步使用线性预测编译(LPC)方案。如果输入信号在时间轴上具有高的冗余度,则可以通过用于从过去的信号预测当前的信号的线性预测来执行建模。在这种情况下,如果采用线性预测编译方案,则可以提高编译效率。同时,语音信号编码单元1740可以包括时域编码单元。
音频信号解码单元1750根据音频信号编译方案来解码信号。由音频信号解码单元1750输入和解码的信号可以包括音频信号或者语音信号部分地包括在音频信号中的信号。并且,音频信号解码单元1750可以包括频域解码单元,并且能够使用IMDCT(逆修改的离散系数变换)。
语音信号解码单元1760根据语音信号编译方案来解码信号。由语音信号解码单元1760解码的信号可以包括语音信号或者音频信号部分地包括在语音信号中的信号。语音信号解码单元1760可以包括时域解码单元,并且能够进一步使用线性预测编译(LPC)方案。
带宽扩展解码单元1770接收低频带下混信号和扩展信息,该低频带下混信号是由音频信号解码单元1750或者语音信号解码单元1760解码的信号,并且然后生成整个频带下混信号,其中重建了与在编码时已经去除的高频区域相对应的信号。
能够使用整个低频带下混信号和扩展信息,或者部分地使用低频带下混信号来生成整个频带下混信号。
多信道解码单元1780接收整个频带下混信号、空间信息、信道间相位差值、信道间相位差模式标记和信道间相位差编译标记,并且然后通过将这些信息应用于整个频带下混信号来生成下混信号。这个过程的细节参考图1至4详细描述,并且在以下的描述中被省略。
因此,在根据本发明的信号处理方法和装置中,使用信道间相位差值来生成多信道信号,由此可以有效地再现由相关技术的多信道解码器难以再现的相位或者延迟差。
图18是根据本发明另一个实施例,包括IPD编译标记获得单元1841、IPD模式标记获得单元1842、IPD值获得单元1843和上混单元1844的产品的配置的示意图。并且,图19A和图19B是分别地根据本发明的另一个实施例,用于包括IPD编译标记获得单元1841、IPD模式标记获得单元1842、IPD值获得单元1843和上混单元1844的产品的关系的示意图。
参考图18,有线/无线通信单元1810通过有线/无线通信来接收比特流。特别地,有线/无线通信单元1810包括有线通信单元1811、红外通信单元1812、蓝牙单元1813和无线局域网(LAN)通信单元1814中的至少一个。
用户认证单元1820接收用户信息的输入,并且然后执行用户认证。用户认证单元1820可以包括指纹识别单元1821、虹膜识别单元1822、面部识别单元1823和语音识别单元1824中的至少一个。在这种情况下,可以以接收指纹信息、虹膜信息、面部轮廓信息或者语音信息的输入,将所输入的信息转换为用户信息,并且然后确定用户信息是否匹配注册的用户数据的方式来执行用户认证。
输入单元1830是用于使得用户能够输入不同种类的命令的输入设备。并且,输入单元1830可以包括小键盘单元1831、触摸板单元1832和远程控制器单元1833中的至少一个,输入单元1830的例子不受限于此。
信号解码单元1840包括IPD编译标记获得单元1841、IPD模式标记获得单元1842、IPD值获得单元1843和上混单元1844,其分别地具有与图2中以前同名的单元相同的配置和功能。并且,在以下的描述中省略了信号解码单元1840的细节。
控制单元1850从输入设备接收输入信号,并且控制信号解码单元1840和输出单元1860的所有过程。如在先前的描述中提及的,如果诸如输出信号的相移的“开/关”、元数据的输入/输出、信号解码单元的开/关操作等等的用户输入从输入单元1830输入到控制单元1850,则控制单元1850使用该用户输入来解码信号。
并且,输出单元1860是用于输出由信号解码单元1840生成的输出信号等等的元件。输出单元1860可以包括信号输出单元1861和显示单元1862。如果输出信号是音频信号,则其经由信号输出单元1861输出。如果输出信号是视频信号,则其经由显示单元1862输出。而且,如果元数据被输入到输入单元1830,则其经由显示单元1862显示在屏幕上。
图19示出了在终端之间或者在终端和服务器之间的关系,其对应于图18中示出的产品。
参考图19A,可以观察到,可以经由有线/无线通信单元在第一终端1910和第二终端1920之间执行数据或者比特流的双向通信。在这种情况下,经由有线/无线通信单元交换的数据或者比特流可以具有图1中示出的本发明的以前的比特流的结构,或者可以包括含有参考图5至16描述的本发明的相移标记、全局帧信道间相移标记等等的以前的数据。参考图19B,可以观察到,可以在服务器1930和第一终端1940之间执行有线/无线通信。
图20是根据本发明另一个实施例,包括IPD编译标记获得单元2041、IPD模式标记获得单元2042、IPD值获得单元2043和上混单元2044的广播信号解码装置的示意框图。
参考图20,解复用器2020从调谐器2010接收与TV广播相关的多个数据。所接收到的数据通过解复用器2020分解,并且然后由数据解码器2030解码。同时,由解复用器2020分解的数据可以被存储在诸如HDD的储存介质2050中。
由解复用器2020分解的数据被输入到包括多信道解码单元2041和视频解码单元2042的信号解码单元2040,以解码为音频信号和视频信号。根据本发明的一个实施例,信号解码单元2040包括IPD编译标记获得单元2041、IPD模式标记获得单元2042、IPD获得单元2043和上混单元2044。它们具有与图2中示出同名的以前的单元相同的配置和功能,并且在以下的描述中省略其细节。信号解码单元2040使用所接收到的信道间相位差值等等来解码信号。如果输入了视频信号,则信号解码单元2040解码和输出视频信号。如果生成了元数据,则信号解码单元2040输出文本类型的元数据。
如果解码了视频信号,并且生成输出的视频信号和元数据,则输出单元2070显示所输出的元数据。输出单元2070包括扬声器单元(图中未示出),并且经由在输出单元2070中包括的扬声器单元输出多信道信号,使用信道间相位差值来解码多信道信号。而且,由信号解码单元2040解码的数据可以被存储在诸如HDD的储存介质2050中。
同时,信号解码装置2000可以进一步包括能够控制根据来自用户的信息输入接收到的多个数据的应用管理器2060。应用管理器2060包括用户界面管理器2061和服务管理器2062。该用户界面管理器2061控制用于从用户接收信息输入的界面。例如,用户界面管理器2061能够控制在输出单元2070上显示的文本的字体类型、屏幕亮度、菜单配置等等。同时,如果广播信号由信号解码单元2040和输出单元2070解码和输出,则服务管理器2062能够使用由用户输入的信息来控制接收到的广播信号。例如,服务管理器2062能够提供广播信道设置、报警功能设置、成人认证功能等等。从应用管理器2060输出的数据通过传送到输出单元2070以及信号解码单元2040而可使用。
因此,由于本发明的信号处理装置被包括在实际的产品中,所以相比于仅仅使用信道间电平差值和信道间相关值的多信道信号的相关技术的声音质量,本发明更好地改善了声音质量。而且,本发明使得用户能够收听更接近于原始输入信号的多信道信号。
应用了解码/编码方法的本发明可以作为计算机可读代码在程序记录介质中实现。并且,具有本发明数据结构的多媒体数据可以被存储在计算机可读记录介质中。计算机可读记录介质包括各种各样的储存设备,由计算机系统可读的数据被存储在所述储存设备中。计算机可读介质例如包括ROM、RAM、CD-ROM、磁带、软盘、光数据储存设备等等,并且还包括载波型实现(例如,经由因特网的传输)。并且,通过编码方法生成的比特流被存储在计算机可读的记录介质中,或者可以经由有线/无线通信网络传送。
工业实用性
因此,本发明适用于信号编码/解码。
虽然已经参考本发明的优选实施例在此处描述和图示了本发明,但是对于本领域技术人员来说将显而易见的是,在不脱离本发明的精神和范围的情况下,可以在其中进行各种修改和变化。因此,本发明意在覆盖归入所附的权利要求和其等同物范围之内的本发明的改进和变化。

Claims (10)

1.一种处理信号的方法,包括:
接收从多信道信号生成的下混信号和指示所述多信道信号的属性的空间信息,以上混所述下混信号;
从所述空间信息的头部获得指示信道间相位差(IPD)编译是否用于所述空间信息的IPD编译标记;
基于所述IPD编译标记从所述空间信息的帧获得IPD模式标记,所述IPD模式标记指示IPD值是否用于所述空间信息的帧;
基于所述IPD模式标记,获得应用于所述帧中的当前的参数时隙的IPD值;
通过使用应用于先前的参数时隙的IPD值修改所述IPD值来平滑所述IPD值;以及
通过将已平滑的IPD值应用于所述下混信号来生成多信道信号,
其中,所述空间信息被划分为所述头部和多个帧,
其中,所述IPD值指示所述多信道信号的两个信道之间的相位差,
其中,所述参数时隙指示应用了所述IPD值的时隙。
2.根据权利要求1所述的方法,所述平滑所述IPD值包括:
通过使用所述IPD值来生成指示所述多信道信号的两个信道之间的角度的校正角度;以及
使用所述先前的参数时隙的校正角度来修改所述校正角度;
其中,所述先前的参数时隙的校正角度是通过使用应用于先前的参数时隙的所述IPD值来产生的;以及
其中,所述修改的校正角度被用于所述平滑的IPD值。
3.根据权利要求1所述的方法,进一步包括:通过使用所述IPD值和所述已平滑的IPD值中的至少一个,确定没有应用所述IPD值的时隙的IPD值。
4.根据权利要求1所述的方法,其中,当所述IPD值和信道间电平差(ILD)值之间的比率超过阈值时,接收所述IPD值,以及
其中,所述ILD值指示在所述下混信号中包括的所述多信道信号的两个信道之间的电平差。
5.一种用于处理信号的装置,包括:
信号接收单元,所述信号接收单元接收从多信道信号生成的下混信号和指示所述多信道信号的属性的空间信息,以上混所述下混信号;
IPD编译标记获得单元,所述IPD编译标记获得单元从所述空间信息的头部获得指示IPD编译是否用于所述空间信息的信道间相位差(IPD)编译标记;
IPD模式标记获得单元,所述IPD模式标记获得单元基于所述IPD编译标记从所述空间信息的帧获得IPD模式标记,所述IPD模式标记指示所述IPD是否用于所述空间信息的帧;
IPD获得单元,所述IPD获得单元基于所述IPD模式标记获得应用于当前参数时隙的IPD值;
IPD平滑单元,所述IPD平滑单元通过使用应用于先前的参数时隙的IPD值修改所述IPD值来平滑所述IPD值;以及
上混单元,所述上混单元通过将已平滑的IPD值应用于所述下混信号来生成所述多信道信号,
其中,所述空间信息被划分为头部和多个帧,
其中,所述IPD值指示所述多信道信号的两个信道之间的相位差,
其中,所述参数时隙指示应用了所述IPD值的时隙。
6.根据权利要求5所述的装置,其中,所述IPD平滑单元包括:
校正角度生成单元,所述校正角度生成单元通过使用所述IPD值来生成指示所述多信道信号的两个信道之间的角度的校正角度;以及
校正角度修改单元,所述校正角度修改单元通过使用所述先前的参数时隙的校正角度来修改所述校正角度;
其中,所述先前的参数时隙的校正角度是通过使用应用于先前的参数时隙的所述IPD值来产生的;以及
其中,所述修改的校正角度被用于所述平滑的IPD值。
7.根据权利要求5所述的装置,进一步包括:IPD内插单元,所述IPD内插单元通过使用所述IPD值和所述已平滑的IPD值中的至少一个来确定没有应用所述IPD值的时隙的IPD值。
8.根据权利要求5所述的装置,其中,当所述IPD值和信道间电平差(ILD)值之间的比率超过阈值时,接收所述IPD值,以及
其中,所述ILD值指示在所述下混信号中包括的所述多信道信号的两个信道之间的电平差。
9.一种处理信号的方法,包括:
通过下混多信道信号来生成下混信号;以及
生成指示所述多信道信号的属性的空间信息,以上混所述下混信号,
其中,所述生成空间信息包括:
测量指示所述多信道信号的两个信道之间的相位差的信道间相位差(IPD)值,
测量指示所述多信道信号的所述两个信道之间的电平差的信道间电平差(ILD)值,
当所述IPD值和所述ILD值之间的比率超过阈值时,生成指示所述IPD值是否用于所述空间信息的IPD编译标记,
生成指示所述IPD值是否用于帧的IPD模式标记,以及
将所述IPD值和所述IPD模式标记包含在所述空间信息的所述帧中,并且将所述IPD编译标记包含在所述空间信息的所述头部中。
10.一种用于处理信号的装置,包括:
下混单元,所述下混单元通过下混多信道信号来生成下混信号;以及
空间信息生成单元,所述空间信息生成单元生成指示所述多信道信号的属性的空间信息,以上混所述下混信号,
其中,所述空间信息生成单元包括:
IPD值测量单元,所述IPD值测量单元测量指示所述多信道信号的两个信道之间的相位差的信道间相位差(IPD)值,
ILD值测量单元,所述ILD值测量单元测量指示所述多信道信号的所述两个信道之间的电平差的信道间电平差(ILD)值,
IPD编译标记生成单元,所述IPD编译标记生成单元当所述IPD值和所述ILD值之间的比率超过阈值时,生成指示所述IPD值是否用于所述空间信息的IPD编译标记,以及
IPD模式标记生成单元,所述IPD模式标记生成单元生成指示所述IPD值是否用于帧的IPD模式标记,
其中,所述IPD值和所述IPD模式标记包含在所述空间信息的所述帧中,以及
其中,所述IPD编译标记包含在所述空间信息的所述头部中。
CN200980137978XA 2008-09-25 2009-09-25 处理信号的方法和装置 Active CN102165520B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10026208P 2008-09-25 2008-09-25
US61/100,262 2008-09-25
KR1020090090518A KR101108061B1 (ko) 2008-09-25 2009-09-24 신호 처리 방법 및 이의 장치
KR10-2009-0090518 2009-09-24
PCT/KR2009/005497 WO2010036059A2 (en) 2008-09-25 2009-09-25 A method and an apparatus for processing a signal

Publications (2)

Publication Number Publication Date
CN102165520A CN102165520A (zh) 2011-08-24
CN102165520B true CN102165520B (zh) 2012-11-28

Family

ID=42213076

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200980137978XA Active CN102165520B (zh) 2008-09-25 2009-09-25 处理信号的方法和装置
CN2009801378698A Pending CN102165519A (zh) 2008-09-25 2009-09-25 处理信号的方法和装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2009801378698A Pending CN102165519A (zh) 2008-09-25 2009-09-25 处理信号的方法和装置

Country Status (4)

Country Link
JP (2) JP5480274B2 (zh)
KR (3) KR101108060B1 (zh)
CN (2) CN102165520B (zh)
ES (1) ES2547232T3 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2452569T3 (es) * 2009-04-08 2014-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor fase
KR101742136B1 (ko) 2011-03-18 2017-05-31 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CN102446507B (zh) 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
JP5977434B2 (ja) * 2012-04-05 2016-08-24 ホアウェイ・テクノロジーズ・カンパニー・リミテッド パラメトリック空間オーディオ符号化および復号化のための方法、パラメトリック空間オーディオ符号器およびパラメトリック空間オーディオ復号器
EP2790419A1 (en) * 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
EP2830049A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
KR101805327B1 (ko) * 2013-10-21 2017-12-05 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성을 위한 역상관기 구조
CN104681029B (zh) 2013-11-29 2018-06-05 华为技术有限公司 立体声相位参数的编码方法及装置
CN107452387B (zh) 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN108694955B (zh) * 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
CN109215668B (zh) * 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN110556118B (zh) * 2018-05-31 2022-05-10 华为技术有限公司 立体声信号的编码方法和装置
CN111819863A (zh) * 2018-11-13 2020-10-23 杜比实验室特许公司 用音频信号及相关联元数据表示空间音频

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1486538A (zh) * 2001-01-09 2004-03-31 索尼公司 多频带无线信号发送机/接收机
CN1647156A (zh) * 2002-04-22 2005-07-27 皇家飞利浦电子股份有限公司 参数多声道音频表示
WO2006003813A1 (ja) * 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
JP5032977B2 (ja) * 2004-04-05 2012-09-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネル・エンコーダ
DE602005022235D1 (de) * 2004-05-19 2010-08-19 Panasonic Corp Audiosignalkodierer und Audiosignaldekodierer
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
KR101562379B1 (ko) * 2005-09-13 2015-10-22 코닌클리케 필립스 엔.브이. 공간 디코더 유닛 및 한 쌍의 바이노럴 출력 채널들을 생성하기 위한 방법
WO2008039038A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi-object audio signal with various channel
KR100917845B1 (ko) * 2006-12-04 2009-09-18 한국전자통신연구원 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1486538A (zh) * 2001-01-09 2004-03-31 索尼公司 多频带无线信号发送机/接收机
CN1647156A (zh) * 2002-04-22 2005-07-27 皇家飞利浦电子股份有限公司 参数多声道音频表示
WO2006003813A1 (ja) * 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置

Also Published As

Publication number Publication date
CN102165520A (zh) 2011-08-24
JP2012503791A (ja) 2012-02-09
ES2547232T3 (es) 2015-10-02
JP5480274B2 (ja) 2014-04-23
KR20100035120A (ko) 2010-04-02
JP5426680B2 (ja) 2014-02-26
KR20100035122A (ko) 2010-04-02
CN102165519A (zh) 2011-08-24
KR101108061B1 (ko) 2012-01-25
KR101108060B1 (ko) 2012-01-25
KR20100035121A (ko) 2010-04-02
JP2012503792A (ja) 2012-02-09

Similar Documents

Publication Publication Date Title
CN102165520B (zh) 处理信号的方法和装置
KR100987457B1 (ko) 오브젝트 기반 오디오 신호를 인코딩 및 디코딩하는 방법 및 장치
US7542896B2 (en) Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
CN101836250B (zh) 用于处理信号的方法及装置
TWI396187B (zh) 用於將以物件為主之音訊信號編碼與解碼之方法與裝置
CN101542595B (zh) 用于编码和解码基于对象的音频信号的方法和装置
US8060042B2 (en) Method and an apparatus for processing an audio signal
EP2169666B1 (en) A method and an apparatus for processing a signal
CN102460570A (zh) 用于对音频信号进行编码和解码的方法及设备
MXPA06014987A (es) Aparato y metodo para generar senal de control de sintetizador de multiples canales y aparato y metodo para sintetizar multiples canales.
CN111128205A (zh) 音频解码器、音频编码器、方法和计算机可读存储介质
CN105190747A (zh) 用于空间音频对象编码中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法
CN104838442A (zh) 用于反向兼容多重分辨率空间音频对象编码的编码器、译码器及方法
KR101062353B1 (ko) 오디오 신호의 디코딩 방법 및 그 장치
CN101162904A (zh) 一种空间参数立体声编解码方法及其装置
KR102471718B1 (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
Rumsey Audio bit rates
Dubey et al. A Novel Very Low Bit Rate Multi-Channel Audio Coding Scheme Using Accurate Temporal Envelope Coding and Signal Synthesis Tools
Aggrawal et al. New Enhancements for Improved Image Quality and Channel Separation in the Immersive Sound Field Rendition (ISR) Parametric Multichannel Audio Coding System
Chiang et al. Advances in Low Bit-Rate Audio Coding: A Digest of Selected Papers from Recent AES Conventions
Brandenburg Parametric Coding of High-Quality Audio

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant