CN102446507A - 一种下混信号生成、还原的方法和装置 - Google Patents

一种下混信号生成、还原的方法和装置 Download PDF

Info

Publication number
CN102446507A
CN102446507A CN201110289391XA CN201110289391A CN102446507A CN 102446507 A CN102446507 A CN 102446507A CN 201110289391X A CN201110289391X A CN 201110289391XA CN 201110289391 A CN201110289391 A CN 201110289391A CN 102446507 A CN102446507 A CN 102446507A
Authority
CN
China
Prior art keywords
frequency
channel
signal
channel signals
frequency band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201110289391XA
Other languages
English (en)
Other versions
CN102446507B (zh
Inventor
吴文海
苗磊
郎玥
大卫·维雷特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201110289391XA priority Critical patent/CN102446507B/zh
Publication of CN102446507A publication Critical patent/CN102446507A/zh
Priority to PCT/CN2012/082180 priority patent/WO2013044826A1/zh
Priority to ES12834659.0T priority patent/ES2569384T3/es
Priority to EP12834659.0A priority patent/EP2722845B1/en
Application granted granted Critical
Publication of CN102446507B publication Critical patent/CN102446507B/zh
Priority to US14/227,695 priority patent/US9516447B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)

Abstract

本发明实施例提供了一种下混信号的生成方法,包括:对接收的左声道信号和右声道信号进行时频变换得到频域信号,将所述频域信号划分成若干频带;计算每个频带的声道能量比和声道相位差;根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差;根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。该方法有效的提高了立体声编解码的质量。

Description

一种下混信号生成、还原的方法和装置
技术领域
本发明涉及立体声编码解码领域,具体涉及一种下混信号生成、还原的方法和装置。
背景技术
在现有立体声编码方法中,绝大多数方法都是将左右两路声道信号下混得到一个单声道信号,而将左右声道的声场信息作为边带信号传输。左右声道的声场信息通常包括左右声道的能量比、左右声道的相位差、左右声道的互相关参数,及第一声道或第二声道与下混信号的相位差参数。现有方法将这些参数作为边信息进行编码并发送到解码端,以恢复立体声信号。
在这类方法中,下混方法、左右声道的声场信息提取及合成都属于核心技术,目前业界也有许多研究成果。现有的立体声下混方法可以分为被动下混和主动下混两种。
被动下混算法比较简单、延时较低,下混因子一般采用0.5来计算。
m(n)=0.5·(x1(n)+x2(n))。
其中x1(n)、x2(n)分别表示左声道信号、右声道信号,m(n)表示下混信号。
当左右声道完全反相且幅度相同时,下混信号为0,解码端根本没有办法恢复左右两路声道。即使不完全反相,也会带来下混信号能量缺失。
为了解决被动算法造成的下混信号能量缺失问题,主动下混算法首先将左右两路信号进行时频变换,在频域调整信号的幅度和或相位,从而最大程度的保持下混信号的能量。以下是一个调整相位的例子:
首先对左信号、右信号进行时频变换得到X1(k)、X2(k),在频域计算每个子带内的相位差;再根据相位差对右路信号进行相位旋转,得到相位旋转后的信号
Figure BDA0000094556010000021
旋转后右声道信号的相位和左路信号相位保持一致。然后根据如下公式将相位调整后的
Figure BDA0000094556010000022
与X1(k)相加并乘以0.5后得到频域的下混信号,
Figure BDA0000094556010000023
最后通过时频逆变换得到时域的下混信号。这种方法能解决左右声道信号反相的能量缺失问题。
但现有的下混方法存在左右声道反相且经常跳变以及左右声道相位差别变换较快的立体声信号的下混性能问题,降低了立体声编解码的主观质量。
发明内容
本发明实施例提供了一种下混信号生成、还原的方法和装置,以提高立体声编解码的质量。
本发明实施例提供了一种下混信号的生成方法,方法包括:对左声道信号和右声道信号进行时频变换得到频域信号,将所述频域信号划分成若干频带;计算每个频带的声道能量比和声道相位差,所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差,所述第一声道信号是所述左声道信号或所述右声道信号;根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
本发明实施例提供了下混信号的生成装置,包括:时频变换单元,用于对接收的左声道信号和右声道信号进行时频变换得到频域信号,将所述频域信号划分成若干频带;频带计算单元,用于计算每个频带的声道能量比和声道相位差,所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;相位差计算单元,用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差,所述第一声道信号是所述左声道信号或所述右声道信号;频域下混信号计算单元:下混信号计算单元,用于根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
本发明实施例提供了一种下混信号的还原方法,包括:根据下混信号的频域信号幅度、接收到的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度,所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息;根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号,根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。
本发明实施例提供了一种下混信号的还原装置,其特征在于,包括:信号幅度计算单元:用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度,所述声道量比反映了左声道信号和右声道信号在每个频带的能量比信息;信号相位计算单元:用于根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;频域信号计算单元:用于根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号,根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。
本发明实施例的方法和装置,减少左右声道反相、跳变及左右声道相位差别变换较快等因素对下混性能的干扰,有效的提高了立体声编解码的质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明下混信号的生成方法的一个实施例的流程图;
图2为本发明下混信号的生成装置的一个实施例的结构图;
图3为本发明下混信号的还原方法的一个实施例的流程图;
图4为本发明下混信号的还原装置的一个实施例的结构图。
本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种下混信号的生成方法,方法包括:
对接收的左声道信号和右声道信号进行时频变换得到频域信号,将所述频域信号划分成若干频带;
计算每个频带的声道能量比(Channel Level Difference,CLD)和声道相位差(Internal Phase Difference,IPD),所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;
根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差,所述第一声道信号是所述左声道信号或所述右声道信号;
根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
请参考附图1,图1为由左声道信号和右声道信号生成下混信号方法的一个实施例的流程图,步骤包括:
S101对接收的左声道信号和右声道信号进行时频变换得到频域信号,将所述频域信号划分成若干频带;
S103计算每个频带的声道能量比和声道相位差;
S105计算下混信号和第一声道信号在每个频带的相位差;
S107计算频域下混信号。
S101对左声道信号和右声道信号进行时频变换,在具体的实施方法中,可以使用傅立叶变换(Fourier Transform,FT)、快速傅立叶变换(FastFourier Transform,FFT)、正交镜像变换(Quadrature Mirror Filterbanks,QMF)等变换方法。左声道信号和右声道信号变换到频域,分别得到L(k)和R(k)。
将频域信号分成若干频带,在本发明的一个实施例中,频带宽度为1。设k为频率点索引,b为频带索引,kb为第b个频带的起始频率点索引。
S103计算每个频带的CLD和IPD,包括根据如下公式计算:
CLD ( b ) = 10 log 10 Σ k = k b k b + 1 - 1 X 1 ( k ) X 1 * ( k ) Σ k = k b k b + 1 - 1 X 2 ( k ) X 2 * ( k ) ;
IPD(b)=∠cor(b),其中 cor ( b ) = Σ k = k b k = k b + 1 - 1 X 1 ( k ) * X 2 * ( k ) .
其中,X1(k)是左声道信号,X2(k)是右声道信号。
S105计算下混信号和第一声道信号在每个频带的相位差。
实施例1:在本发明的一个实施例中,第一声道是左声道。
所述下混信号和左声道信号在每个频带的相位差根据如下公式计算:
θ ( b ) = 1 1 + c ( b ) · IPD ( b ) ;
其中c(b)=10CLD(b)10
CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
左声道信号能量越大,所述下混信号与左声道的相位差越小;而当右声道能量越大时,下混信号与左声道的相位差越大,下混信号与右信道的相位差越小。下混信号与左声道的相位差和左声道信号能量成正向关系,下混信号与左声道的相位差和右声道能量成反向关系,下混信号与左声道的相位差和声道相位差成正向关系。
S107计算频域下混信号,所述频域下混信号根据如下公式计算:
M r ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L r ( k ) cos ( θ ( b ) ) + L i ( k ) sin ( θ ( b ) ) ) ;
M i ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L i ( k ) cos ( θ ( b ) ) - L r ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
实施例2:在本发明的另一个实施例中,第一声道是右声道。
所述下混信号和右声道信号在每个频带的相位差根据如下公式计算:
θ ( b ) = c ( b ) 1 + c ( b ) · IPD ( b ) ;
其中c(b)=10CLD(b)10
CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
左声道信号能量越大,所述下混信号与右声道的相位差越大,下混信号与左声道的相位差越小;而当右声道能量越大时,下混信号与右声道的相位差越小。所述下混信号与右声道的相位差与右声道的能量成反向关系,所述下混信号与右声道的相位差与左声道的能量成正向关系,与所述声道相位差成正向关系。
S107计算频域下混信号,所述频域下混信号根据如下公式计算:
M i ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R i ( k ) cos ( θ ( b ) ) - R r ( k ) sin ( θ ( b ) ) ) ;
M r ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R r ( k ) cos ( θ ( b ) ) + R i ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
实施例3:在本发明的再一个实施例中,第一声道是左声道和右声道中信号幅度更大的声道。
如果左声道信号的幅度大于右声道信号的幅度,第一声道是左声道,下混信号和所述左声道和右声道中信号幅度更大的声道的相位差根据如下公式计算:
θ ( b ) = 1 1 + c ( b ) · IPD ( b ) ;
其中c(b)=10CLD(b)/10
S107计算频域下混信号,所述频域下混信号根据如下公式计算:
M r ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L r ( k ) cos ( θ ( b ) ) + L i ( k ) sin ( θ ( b ) ) ) ;
M i ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L i ( k ) cos ( θ ( b ) ) - L r ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
如果右声道信号的幅度大于左声道信号的幅度,第一声道是右声道,下混信号和所述左声道和右声道中信号幅度更大的声道的相位差根据如下公式计算:
θ ( b ) = c ( b ) 1 + c ( b ) · IPD ( b ) ;
其中c(b)=10CLD(b)/10
S107计算频域下混信号,所述频域下混信号根据如下公式计算:
; M i ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R i ( k ) cos ( θ ( b ) ) - R r ( k ) sin ( θ ( b ) ) )
M r ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R r ( k ) cos ( θ ( b ) ) + R i ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
本发明实施例的下混信号生成方法不仅具有实施例1和实施例2的优点,还能有效解决小信号相位变换较快影响立体声下混性能的问题。
实施例4:本发明的又一个实施例中,在所述根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后,还包括:所述下混信号和第一声道的相位差根据群相位更新,所述群相位反映了左声道信号和右声道信号的频域包络相似性。
在本发明的一个实施例中,群相位θg是各个频带IPD的均值。
若第一声道是左声道:所述下混信号和左声道信号在每个频带的相位差根据如下公式计算:
θ ( b ) = 1 1 + c ( b ) · ( IPD ( b ) - θ g ) ;
其中c(b)=10CLD(b)/10
CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
左声道信号能量越大,所述下混信号与左声道的相位差越小;而当右声道能量越大时,下混信号与右声道的相位差越小。
S107计算频域下混信号,所述频域下混信号根据如下公式计算:
M r ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L r ( k ) cos ( θ ( b ) ) + L i ( k ) sin ( θ ( b ) ) ) ;
M i ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L i ( k ) cos ( θ ( b ) ) - L r ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
若第一声道是右声道,所述下混信号和右声道信号在每个频带的相位差根据如下公式计算:
θ ( b ) = c ( b ) 1 + c ( b ) · IPD ( b ) ;
其中c(b)=10CLD(b)/10
左声道信号能量越大,所述下混信号与左声道信号的相位差越小;而当右声道能量越大时,下混信号与右声道信号的相位差越小。
S107计算频域下混信号,所述频域下混信号根据如下公式计算:
M i ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R i ( k ) cos ( θ ( b ) ) - R r ( k ) sin ( θ ( b ) ) ) ;
M r ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R r ( k ) cos ( θ ( b ) ) + R i ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
在所述S107计算频域下混信号之后,本发明实施例的方法还包括:
通过频时变换得到下混信号的时域下混信号;
通过单声道编码器得到时域下混信号的下混单声道比特流,本发明实施例的单声道编码器包括ITU-T G.711.1或者G.722等。
当所述单声道编码器和下混信号中使用的频域变换相同时,可不需进行频时变换直接对频域下混信号进行编码。
为了保持编码端和解码端CLD,IPD的一致性,本发明实施例采用量化后的CLD,IPD进行下混。量化后的CLD,IPD得到的立体声参数比特流,和下混单声道比特流一并发送到解码端。
本发明实施例提供了一种下混信号的生成装置,包括:201时频变换单元:用于对接收的左声道信号和右声道信号进行时频变换得到频域信号,将所述频域信号划分成若干频带;203频带计算单元:用于计算每个频带的声道能量比和声道相位差,所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;205相位差计算单元:用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差,所述第一声道信号是所述左声道信号或所述右声道信号;频域下混信号计算单元:207下混信号计算单元,用于根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
所述205相位差计算单元用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差包括:用于根据声道能量比和声道相位差计算所述下混信号和左声道和右声道中信号幅度更大的声道信号在每个频带的相位差。
在所述第一声道是所述左声道时,所述相位差计算单元用于根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差具体包括,根据如下公式计算:
c(b)=10CLD(b)/10
θ ( b ) = 1 1 + c ( b ) · IPD ( b ) ;
其中,CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
在第一声道是所述右声道时,所述相位差计算单元用于根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差具体包括,根据如下公式计算:
c(b)=10CLD(b)/10
θ ( b ) = c ( b ) 1 + c ( b ) · IPD ( b ) ;
CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
所述相位差计算单元在用于根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后,还用于:将所述下混信号和第一声道的相位差根据群相位更新,所述群相位反映了左声道信号和右声道信号的频域包络相似性。
在所述第一声道是所述左声道时,所述下混信号计算单元,用于根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号具体包括,根据如下公式计算:
M r ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L r ( k ) cos ( θ ( b ) ) + L i ( k ) sin ( θ ( b ) ) ) ;
M i ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L i ( k ) cos ( θ ( b ) ) - L r ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
在所述第一声道是所述右声道时,所述述下混信号计算单元,用于根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号具体包括,根据如下公式计算:
M i ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R i ( k ) cos ( θ ( b ) ) - R r ( k ) sin ( θ ( b ) ) ) ;
M r ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R r ( k ) cos ( θ ( b ) ) + R i ( k ) sin ( θ ( b ) ) ) ;
其中,k为频率点索引,Rr(k)是右声道信号时频变换第k个频率点的实部,Ri(k)是右声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
本发明实施例提出了一种下混信号的还原方法,如图3所示,图3提供了本发明方法的一个实施例的流程图,包括:
S301根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度;
S303根据所述下混信号的频域信号相位、接收的声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;
S305根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号,根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。
在本发明的一个实施例中,通过单声道解码器解码得到下混单声道时域信号,通过解量化器解码得到立体声参数CLD,IPD。下混时域信号通过时频变换可得到频域信号。
S301所述根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度具体包括,根据如下公式计算:
c(b)=10CLD(b)/10
| L ( k ) | = c ( b ) 1 + c ( b ) · | M ( k ) | ,
| R ( k ) | = 1 1 + c ( b ) · | M ( k ) |
其中,k为频率点索引,CLD(b)是所述声道能量比在第b个频带的声道能量比,c(b)是用于计算的中间值变量,|M(k)|是下混信号M(k)在频率点k的频域信号幅度,|L(k)|是左声道道信号L(k)在频率点k的频域信号幅度,|R(k)|是右声道信号R(k)在频率点k的频域信号幅度。
S303所述根据下混信号的频域信号相位、声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位具体包括,根据如下公式计算:
c(b)=10CLD(b)/10
∠ L ( k ) = ∠ M ( k ) + 1 1 + c ( b ) · IPD ( b ) ;
∠ R ( k ) = ∠ M ( k ) - c ( b ) 1 + c ( b ) · IPD ( b )
c(b)是用于计算的中间值变量,IPD(b)是所述声道相位差在第b个频带的声道相位差,∠M(k)是下混信号M(k)在频率点k的频域信号相位,∠L(k)是左声道信号L(k)在频率点k的频域信号相位,∠R(k)是右声道信号R(k)在频率点k的频域信号相位。
在本发明的一个实施例中,IPD的取值在(-pi,pi]。
在S305根据根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号,根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号之后,频域信号通过频时变换得到左右声道时域解码信号。
本发明实施例提供了一种下混信号的还原装置,包括:401信号幅度计算单元:用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度,所述声道量比反映了左声道信号和右声道信号在每个频带的能量比信息;403信号相位计算单元:用于根据所述下混信号的频域信号相位、接收的声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;405频域信号合成单元:用于根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号,根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。
401所述信号幅度计算单元用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度具体包括,根据如下公式计算:
c(b)=10CLD(b)/10
| L ( k ) | = c ( b ) 1 + c ( b ) · | M ( k ) | ,
| R ( k ) | = 1 1 + c ( b ) · | M ( k ) |
其中,k为频率点索引,CLD(b)是所述声道能量比在第b个频带的声道能量比,c(b)是用于计算的中间值变量,|M(k)|是下混信号M(k)在频率点k的频域信号幅度,|L(k)|是左声道道信号L(k)在频率点k的频域信号幅度,|R(k)|是右声道信号R(k)在频率点k的频域信号幅度。
403所述信号相位计算单元用于根据下混信号的频域信号相位、声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位具体包括,根据如下公式计算:
c(b)=10CLD(b)/10
∠ L ( k ) = ∠ M ( k ) + 1 1 + c ( b ) · IPD ( b ) ;
∠ R ( k ) = ∠ M ( k ) - c ( b ) 1 + c ( b ) · IPD ( b )
c(b)是用于计算的中间值变量,IPD(b)是所述声道相位差在第b个频带的声道相位差,∠M(k)是下混信号M(k)在频率点k的频域信号相位,∠L(k)是左声道信号L(k)在频率点k的频域信号相位,∠R(k)是右声道信号R(k)在频率点k的频域信号相位。
本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (20)

1.一种下混信号的生成方法,其特征在于,方法包括:
对左声道信号和右声道信号进行时频变换得到频域信号,将所述频域信号划分成若干频带;
计算每个频带的声道能量比和声道相位差,所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;
根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差,所述第一声道信号是所述左声道信号或所述右声道信号;
根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
2.根据权利要求1所述的方法,其特征在于,所述第一声道信号是左声道信号、右声道信号中信号幅度更大的信号,所述根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差包括:根据声道能量比和声道相位差计算所述下混信号和左声道信号、右声道信号中信号幅度更大的信号在每个频带的相位差。
3.根据权利要求1或2所述的方法,其特征在于,所述第一声道是所述左声道,所述根据声道能量比和声道相位差计算所述下混信号和第一声道信号在每个频带的相位差包括,根据如下公式计算:
c(b)=10CLD(b)/10
θ ( b ) = 1 1 + c ( b ) · IPD ( b ) ;
其中,CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
4.根据权利要求3所述的方法,其特征在于,所述第一声道是所述左声道,所述根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括,根据如下公式计算:
M r ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L r ( k ) cos ( θ ( b ) ) + L i ( k ) sin ( θ ( b ) ) ) ;
M i ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L i ( k ) cos ( θ ( b ) ) - L r ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
5.根据权利要求1或2所述的方法,其特征在于,所述第一声道是所述右声道,所述根据所述声道能量比和所述声道相位差计算下混信号和第一声道信号在每个频带的相位差包括,根据如下公式计算:
c(b)=10CLD(b)/10
θ ( b ) = c ( b ) 1 + c ( b ) · IPD ( b ) ;
CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
6.根据权利要求5所述的方法,其特征在于,所述第一声道是所述右声道,所述根据所述左声道信号、右声道信号、所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括,根据如下公式计算:
M i ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R i ( k ) cos ( θ ( b ) ) - R r ( k ) sin ( θ ( b ) ) ) ;
M r ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R r ( k ) cos ( θ ( b ) ) + R i ( k ) sin ( θ ( b ) ) ) ;
其中,k为频率点索引,Rr(k)是右声道信号时频变换第k个频率点的实部,Ri(k)是右声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
7.根据权利要求4或6所述的方法,其特征在于,在所述根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后,还包括:所述下混信号和第一声道在每个频带的相位差根据群相位更新,所述群相位反映了左声道信号和右声道信号的频域包络相似性,根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号包括:根据所述左声道信号、右声道信号、以及更新后的所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
8.一种下混信号的生成装置,其特征在于,包括:时频变换单元,用于对接收的左声道信号和右声道信号进行时频变换得到频域信号,将所述频域信号划分成若干频带;频带计算单元,用于计算每个频带的声道能量比和声道相位差,所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;相位差计算单元,用于根据所述声道能量比和所述声道相位差计算所述下混信号和第一声道信号在每个频带的相位差,所述第一声道信号是所述左声道信号或所述右声道信号;下混信号计算单元,用于根据所述左声道信号、右声道信号、以及所述下混信号和第一声道信号在每个频带的相位差计算频域下混信号。
9.根据权利要求8所述的装置,其特征在于,所述相位差计算单元用于根据所述声道能量比和所述声道相位差计算所述下混信号和左声道信号、右声道信号中幅度更大的声道信号在每个频带的相位差。
10.根据权利要求8或9所述的装置,其特征在于,所述第一声道是所述右声道,所述相位差计算单元用于根据如下公式计算下混信号和第一声道信号在每个频带的相位差:
c(b)=10CLD(b)/10
θ ( b ) = c ( b ) 1 + c ( b ) · IPD ( b ) ;
CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
11.根据权利要求10所述的装置,其特征在于,所述第一声道是所述左声道,所述下混信号计算单元用于根据如下公式计算频域下混信号:
M r ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L r ( k ) cos ( θ ( b ) ) + L i ( k ) sin ( θ ( b ) ) ) ;
M i ( k ) = 0.5 ( 1 + R mag ( k ) L mag ( k ) ) ( L i ( k ) cos ( θ ( b ) ) - L r ( k ) sin ( θ ( b ) ) ) .
k为频率点索引,Lr(k)是左声道信号时频变换第k个频率点的实部,Li(k)是左声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
12.根据权利要求8或9所述的装置,其特征在于,所述第一声道是所述左声道,所述相位差计算单元用于根据如下公式计算所述下混信号和第一声道信号在每个频带的相位差:
c(b)=10CLD(b)/10
θ ( b ) = 1 1 + c ( b ) · IPD ( b ) ;
其中,CLD(b)是第b个频带的所述声道能量比,c(b)是用于计算的中间值变量,IPD(b)是第b个频带的所述声道相位差,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
13.根据权利要求12所述的装置,其特征在于,所述第一声道是所述右声道,所述述下混信号计算单元,用于根据如下公式计算频域下混信号:
M i ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R i ( k ) cos ( θ ( b ) ) - R r ( k ) sin ( θ ( b ) ) ) ;
M r ( k ) = 0.5 ( 1 + L mag ( k ) R mag ( k ) ) ( R r ( k ) cos ( θ ( b ) ) - R i ( k ) sin ( θ ( b ) ) ) ;
其中,k为频率点索引,取自然数,Rr(k)是右声道信号时频变换第k个频率点的实部,Ri(k)是右声道信号时频变换第k个频率点的虚部,Rmag(k)是右声道信号时频变换第k个频率点的幅度,Lmag(k)是左声道信号时频变换第k个频率点的幅度,Mi(k)是下混信号时频变换第k个频率点的实部,Mr(k)是下混信号时频变换第k个频率点的虚部,θ(b)是所述下混信号和第一声道信号在第b个频带的相位差。
14.根据权利要求11或13所述的装置,其特征在于,所述相位差计算单元在用于根据声道能量比和声道相位差计算下混信号和第一声道信号在每个频带的相位差之后,还用于:将所述下混信号和第一声道的相位差根据群相位更新,所述群相位反映了左声道信号和右声道信号的频域包络相似性。
15.一种下混信号的还原方法,其特征在于,包括:
根据下混信号的频域信号幅度、接收到的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度,所述声道能量比反映了左声道信号和右声道信号在每个频带的能量比信息;
根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;
根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号,根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。
16.根据权利要求15所述的方法,其特征在于,所述根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度具体包括,根据如下公式计算:
c(b)=10CLD(b)/10
| L ( k ) | = c ( b ) 1 + c ( b ) · | M ( k ) | ,
| R ( k ) | = 1 1 + c ( b ) · | M ( k ) |
其中,k为频率点索引,CLD(b)是所述声道能量比在第b个频带的声道能量比,c(b)是用于计算的中间值变量,|M(k)|是下混信号M(k)在频率点k的频域信号幅度,|L(k)|是左声道道信号L(k)在频率点k的频域信号幅度,|R(k)|是右声道信号R(k)在频率点k的频域信号幅度。
17.根据权利要求15所述的方法,其特征在于,所述根据下混信号的频域信号相位、声道能量比和声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位具体包括,根据如下公式计算:
c(b)=10CLD(b)/10
∠ L ( k ) = ∠ M ( k ) + 1 1 + c ( b ) · IPD ( b ) ;
∠ R ( k ) = ∠ M ( k ) - c ( b ) 1 + c ( b ) · IPD ( b )
c(b)是用于计算的中间值变量,IPD(b)是所述声道相位差在第b个频带的声道相位差,∠M(k)是下混信号M(k)在频率点k的频域信号相位,∠L(k)是左声道信号L(k)在频率点k的频域信号相位,∠R(k)是右声道信号R(k)在频率点k的频域信号相位。
18.一种下混信号的还原装置,其特征在于,包括:信号幅度计算单元:用于根据所述下混信号的频域信号幅度、接收的声道能量比分别计算左声道信号的频域信号幅度、右声道信号的频域信号幅度,所述声道量比反映了左声道信号和右声道信号在每个频带的能量比信息;信号相位计算单元:用于根据所述下混信号的频域信号相位、所述声道能量比和接收到的声道相位差分别计算左声道信号的频域信号相位、右声道信号的频域信号相位,所述声道相位差反映了左声道信号和右声道信号在每个频带的相位差信息;频域信号计算单元:用于根据左声道信号的频域信号幅度、频域信号相位合成左声道信号的频域信号,根据右声道信号的频域信号幅度、频域信号相位合成右声道信号的频域信号。
19.根据权利要求18所述的装置,其特征在于,所述信号幅度计算单元用于根据如下公式计算左声道信号的频域信号幅度、右声道信号的频域信号幅度:
c(b)=10CLD(b)/10
| L ( k ) | = c ( b ) 1 + c ( b ) · | M ( k ) | ,
| R ( k ) | = 1 1 + c ( b ) · | M ( k ) |
其中,k为频率点索引,CLD(b)是所述声道能量比在第b个频带的声道能量比,c(b)是用于计算的中间值变量,|M(k)|是下混信号M(k)在频率点k的频域信号幅度,|L(k)|是左声道道信号L(k)在频率点k的频域信号幅度,|R(k)|是右声道信号R(k)在频率点k的频域信号幅度。
20.根据权利要求18所述的装置,其特征在于,所述信号相位计算单元用于根据如下公式计算左声道信号的频域信号相位、右声道信号的频域信号相位:
c(b)=10CLD(b)/10
∠ L ( k ) = ∠ M ( k ) + 1 1 + c ( b ) · IPD ( b ) ;
∠ R ( k ) = ∠ M ( k ) - c ( b ) 1 + c ( b ) · IPD ( b )
c(b)是用于计算的中间值变量,IPD(b)是所述声道相位差在第b个频带的声道相位差,∠M(k)是下混信号M(k)在频率点k的频域信号相位,∠L(k)是左声道信号L(k)在频率点k的频域信号相位,∠R(k)是右声道信号R(k)在频率点k的频域信号相位。
CN201110289391XA 2011-09-27 2011-09-27 一种下混信号生成、还原的方法和装置 Active CN102446507B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201110289391XA CN102446507B (zh) 2011-09-27 2011-09-27 一种下混信号生成、还原的方法和装置
PCT/CN2012/082180 WO2013044826A1 (zh) 2011-09-27 2012-09-27 一种下混信号生成、还原的方法和装置
ES12834659.0T ES2569384T3 (es) 2011-09-27 2012-09-27 Método y equipo para generar una señal downmix
EP12834659.0A EP2722845B1 (en) 2011-09-27 2012-09-27 Method and apparatus for generating downmix signal
US14/227,695 US9516447B2 (en) 2011-09-27 2014-03-27 Method and apparatus for generating and restoring downmixed signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110289391XA CN102446507B (zh) 2011-09-27 2011-09-27 一种下混信号生成、还原的方法和装置

Publications (2)

Publication Number Publication Date
CN102446507A true CN102446507A (zh) 2012-05-09
CN102446507B CN102446507B (zh) 2013-04-17

Family

ID=46008959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110289391XA Active CN102446507B (zh) 2011-09-27 2011-09-27 一种下混信号生成、还原的方法和装置

Country Status (5)

Country Link
US (1) US9516447B2 (zh)
EP (1) EP2722845B1 (zh)
CN (1) CN102446507B (zh)
ES (1) ES2569384T3 (zh)
WO (1) WO2013044826A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013044826A1 (zh) * 2011-09-27 2013-04-04 华为技术有限公司 一种下混信号生成、还原的方法和装置
CN103971692A (zh) * 2013-01-28 2014-08-06 北京三星通信技术研究有限公司 音频处理方法、装置及系统
CN105917406A (zh) * 2013-10-21 2016-08-31 杜比国际公司 音频信号的参数化重构
CN106303896A (zh) * 2016-09-30 2017-01-04 北京小米移动软件有限公司 播放音频的方法和装置
CN107610710A (zh) * 2017-09-29 2018-01-19 武汉大学 一种面向多音频对象的音频编码及解码方法
CN108475509A (zh) * 2016-05-31 2018-08-31 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN110114826A (zh) * 2016-11-08 2019-08-09 弗劳恩霍夫应用研究促进协会 使用相位补偿对多声道信号进行下混合或上混合的装置和方法
WO2019227931A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 一种下混信号的计算方法及装置
CN110556116A (zh) * 2018-05-31 2019-12-10 华为技术有限公司 计算下混信号和残差信号的方法和装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3045915A1 (fr) * 2015-12-16 2017-06-23 Orange Traitement de reduction de canaux adaptatif pour le codage d'un signal audio multicanal
JP2020170939A (ja) * 2019-04-03 2020-10-15 ヤマハ株式会社 音信号処理装置、及び音信号処理方法
CN115037380B (zh) * 2022-08-10 2022-11-22 之江实验室 幅度相位可调的集成微波光子混频器芯片及其控制方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102157150A (zh) * 2010-02-12 2011-08-17 华为技术有限公司 立体声解码方法及装置
CN102157149A (zh) * 2010-02-12 2011-08-17 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
CN102157152A (zh) * 2010-02-12 2011-08-17 华为技术有限公司 立体声编码的方法、装置
CN102165519A (zh) * 2008-09-25 2011-08-24 Lg电子株式会社 处理信号的方法和装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7756713B2 (en) * 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
KR101444102B1 (ko) * 2008-02-20 2014-09-26 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102165519A (zh) * 2008-09-25 2011-08-24 Lg电子株式会社 处理信号的方法和装置
CN102157150A (zh) * 2010-02-12 2011-08-17 华为技术有限公司 立体声解码方法及装置
CN102157149A (zh) * 2010-02-12 2011-08-17 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
CN102157152A (zh) * 2010-02-12 2011-08-17 华为技术有限公司 立体声编码的方法、装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JEROEN BREEBAART: "Parametric Coding of Stereo Audio", 《EURASIP JOURNAL ON APPLIED SIGNAL PROCESSING 2005》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9516447B2 (en) 2011-09-27 2016-12-06 Huawei Technologies Co., Ltd. Method and apparatus for generating and restoring downmixed signal
WO2013044826A1 (zh) * 2011-09-27 2013-04-04 华为技术有限公司 一种下混信号生成、还原的方法和装置
CN103971692A (zh) * 2013-01-28 2014-08-06 北京三星通信技术研究有限公司 音频处理方法、装置及系统
CN105917406B (zh) * 2013-10-21 2020-01-17 杜比国际公司 音频信号的参数化重构
CN105917406A (zh) * 2013-10-21 2016-08-31 杜比国际公司 音频信号的参数化重构
US11769516B2 (en) 2013-10-21 2023-09-26 Dolby International Ab Parametric reconstruction of audio signals
US11450330B2 (en) 2013-10-21 2022-09-20 Dolby International Ab Parametric reconstruction of audio signals
US10614825B2 (en) 2013-10-21 2020-04-07 Dolby International Ab Parametric reconstruction of audio signals
CN108475509B (zh) * 2016-05-31 2022-10-04 华为技术有限公司 一种声道间相位差参数的提取方法及装置
US11915709B2 (en) 2016-05-31 2024-02-27 Huawei Technologies Co., Ltd. Inter-channel phase difference parameter extraction method and apparatus
US11393480B2 (en) 2016-05-31 2022-07-19 Huawei Technologies Co., Ltd. Inter-channel phase difference parameter extraction method and apparatus
CN108475509A (zh) * 2016-05-31 2018-08-31 华为技术有限公司 一种声道间相位差参数的提取方法及装置
CN106303896A (zh) * 2016-09-30 2017-01-04 北京小米移动软件有限公司 播放音频的方法和装置
US12100402B2 (en) 2016-11-08 2024-09-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
CN110114826A (zh) * 2016-11-08 2019-08-09 弗劳恩霍夫应用研究促进协会 使用相位补偿对多声道信号进行下混合或上混合的装置和方法
CN110114826B (zh) * 2016-11-08 2023-09-05 弗劳恩霍夫应用研究促进协会 使用相位补偿对多声道信号进行下混合或上混合的装置和方法
CN107610710A (zh) * 2017-09-29 2018-01-19 武汉大学 一种面向多音频对象的音频编码及解码方法
CN110556116B (zh) * 2018-05-31 2021-10-22 华为技术有限公司 计算下混信号和残差信号的方法和装置
US11869517B2 (en) 2018-05-31 2024-01-09 Huawei Technologies Co., Ltd. Downmixed signal calculation method and apparatus
CN110556116A (zh) * 2018-05-31 2019-12-10 华为技术有限公司 计算下混信号和残差信号的方法和装置
US11961526B2 (en) 2018-05-31 2024-04-16 Huawei Technologies Co., Ltd. Method and apparatus for calculating downmixed signal and residual signal
WO2019227931A1 (zh) * 2018-05-31 2019-12-05 华为技术有限公司 一种下混信号的计算方法及装置

Also Published As

Publication number Publication date
US9516447B2 (en) 2016-12-06
EP2722845B1 (en) 2016-02-10
EP2722845A1 (en) 2014-04-23
WO2013044826A1 (zh) 2013-04-04
ES2569384T3 (es) 2016-05-10
CN102446507B (zh) 2013-04-17
US20140211947A1 (en) 2014-07-31
EP2722845A4 (en) 2014-08-13

Similar Documents

Publication Publication Date Title
CN102446507B (zh) 一种下混信号生成、还原的方法和装置
CN102157149B (zh) 立体声信号下混方法、编解码装置和编解码系统
CN102148035B (zh) 使用复值滤波器组的音频信号的编码和解码
CN101682333B (zh) 对音频信号编码和解码的方法和设备
CN103262164B (zh) 叉积增强的基于子带块的谐波换位
CN102892070B (zh) 多声道下混对象编码的增强编码和参数表示
US8798276B2 (en) Method and apparatus for encoding multi-channel audio signal and method and apparatus for decoding multi-channel audio signal
CN102027537B (zh) 利用谐波带宽扩充及非谐波带宽扩充的组合、基于输入信号表示型态产生扩充带宽信号的表示型态的装置、方法
EP3025336B1 (en) Reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
CN102257567B (zh) 音响信号处理装置、音响编码装置及音响解码装置
CN103403799B (zh) 用于针对合成统一语音和音频编解码器(usac)处理音频信号和提供较高时间粒度的设备和方法
CN102138342A (zh) 用于合并空间音频流的设备
CN103632678A (zh) 叉积增强的谐波转置
CN103366755A (zh) 对音频信号进行编码和解码的方法和设备
CN103714822B (zh) 基于silk编解码器的子带编解码方法及装置
CN103366749A (zh) 一种声音编解码装置及其方法
US9305556B2 (en) Apparatus and method for encoding and decoding multi-channel audio signal
CN102682779B (zh) 面向3d音频的双声道编解码方法和编解码器
CN106165451A (zh) 对高阶高保真立体声信号应用动态范围压缩的方法和设备
CN101604983B (zh) 编解码装置、系统及其方法
CN101604524B (zh) 立体声编码方法及其装置、立体声解码方法及其装置
CN101582259B (zh) 立体声信号编解码方法、装置及编解码系统
AU2014314477B2 (en) Frequency band table design for high frequency reconstruction algorithms
CN103415883B (zh) 用于低频效果声道的减少复杂性变换
Helmrich Efficient Perceptual Audio Coding Using Cosine and Sine Modulated Lapped Transforms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant