WO2010099752A1 - 一种立体声编码方法、装置和编码器 - Google Patents
一种立体声编码方法、装置和编码器 Download PDFInfo
- Publication number
- WO2010099752A1 WO2010099752A1 PCT/CN2010/070873 CN2010070873W WO2010099752A1 WO 2010099752 A1 WO2010099752 A1 WO 2010099752A1 CN 2010070873 W CN2010070873 W CN 2010070873W WO 2010099752 A1 WO2010099752 A1 WO 2010099752A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- energy
- scaling factor
- signal
- right channel
- cross
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereophonic System (AREA)
Description
一种立体声编码方法、 装置和编码器 本申请要求于 2009年 3月 4日提交中国专利局,申请号为 200910118870.8, 发明名称为"一种立体声编码方法、 装置和编码器"的中国专利申请的优先权, 其全部内容通过引用结合在本申请中。 技术领域
本发明涉及通信技术领域,尤其涉及一种立体声编码方法、装置和编码器。 背景技术
立体声编码技术将左、 右声道信号下混成第一单声道信号; 然后再对第一 单声道信号与左右声道信号之间的能量关系进行编码;对第一单声道信号进行 调整, 得到第二单声道信号; 对第二单声道信号与左, 右声道的差值分别进行 编码。 在解码端用这些信息来重建声音信号, 可以获得很好的立体声效果。 在现有的立体声编码技术中, 需要确定缩放因子才能对第一单声道信号进 行调整。 为确定最佳的缩放因子,现有技术采用将所有可能的缩放因子进行计 算和比较, 因此, 需要的计算量和复杂度非常高, 占用了较多的系统资源。 发明内容
本发明实施例提供了一种立体声编码方法、装置和编码器, P争低了确定缩 放因子的复杂度, 减小了需要的计算量和复杂度,从而在较大程度上节省了系 统资源。 为实现上述目的, 本发明实施例采用以下技术方案:
一方面, 本发明实施例提供了一种立体声编码方法, 包括: 获得第一单声道信号与左声道信号的左声道能量关系系数以及所述第一 单声道信号与右声道信号的右声道能量关系系数,所述第一单声道信号为立体
声左右声道信号混合生成;
分别获得位于波谷位置的所述第一单声道信号各子带关于左声道能量关 系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于右声 道能量关系系数的右能量和;
根据所述左声道能量关系系数互相关在波谷位置的第一单声道信号的各 子带和所述左声道信号的各子带;以及根据所述右声道能量关系系数互相关在 波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得到互相关 结果;
采用所述左、 右能量和以及所述互相关结果, 获取缩放因子;
根据所述缩放因子对所述立体声的左右声道信号进行编码。
一方面, 本发明实施例提供了一种立体声编码装置, 包括:
能量关系获取模块,用于获得第一单声道信号与左声道信号的左声道能量 关系系数以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述 第一单声道信号为立体声左右声道信号混合生成;
能量和获取模块,用于分别获得位于波谷位置的所述第一单声道信号各子 带关于所述能量关系获耳 莫块生成的左声道能量关系系数的左能量和,以及位 于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的 右声道能量关系系数的右能量和;
互相关模块,用于根据所述能量关系获 莫块获得的左声道能量关系系数 互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带;以 及根据所述能量关系获取模块获得的右声道能量关系系数互相关在波谷位置 的第一单声道信号的各子带和所述右声道信号的各子带, 得到互相关结果;
缩放因子获取模块, 用于根据所述能量和获取模块生成的左、右能量和与 互相关模块生成的互相关结果, 获取缩放因子。
编码模块, 用于根据所述缩放因子对所述立体声的左右声道信号进行编 码。
另一方面, 本发明实施例提供了一种编码器, 包括:
能量关系获取模块,用于获得第一单声道信号与左声道信号的左声道能量 关系系数以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述 第一单声道信号为立体声左右声道信号混合生成;
能量和获取模块,用于分别获得位于波谷位置的所述第一单声道信号各子 带关于所述能量关系获耳 莫块生成的左声道能量关系系数的左能量和,以及位 于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的 右声道能量关系系数的右能量和;
互相关模块,用于根据所述能量关系获取模块获得的左声道能量关系系数 互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带;以 及根据所述能量关系获取模块获得的右声道能量关系系数互相关在波谷位置 的第一单声道信号的各子带和所述右声道信号的各子带, 得到互相关结果; 缩放因子获取模块, 用于根据所述能量和获取模块生成的左、右能量和与 互相关模块生成的互相关结果, 获取缩放因子。
编码模块, 用于根据所述缩放因子对所述立体声的左右声道信号进行编 码。
本发明实施例提供的立体声编码方法、装置和编码器,通过降低确定缩放 因子的复杂度, 与现有技术相比, 减小了立体声编码的计算量和复杂度, 在较
大程度上节省了系统资源。 附图说明
图 1为本发明实施例一提供的一种立体声编码方法的流程图;
图 2为本发明实施例二提供的确定最佳缩放因子的步骤的流程图; 图 3 为本发明实施例二提供的根据所述左、 右能量和以及所述互相关结 果, 确定所述缩放因子所在的范围的步骤的流程图;
图 4 为本发明实施例二提供的在所述范围内确定最佳缩放因子的步骤的 流程图;
图 5为本发明实施例五提供的一种立体声编码装置的结构图; 图 6为本发明实施例五提供的缩放因子获取模块的结构图; 图 7为本发明实施例六提供的缩放因子范围确定单元的结构图; 图 8为本发明实施例六提供的最佳缩放因子确定单元的结构图。 具体实施方式
为使本发明实施例的目的、技术方案及优点更加清楚明白, 以下参照附图, 对本发明实施例作进一步地伴细说明。
如图 1所示, 本发明实施例一提供了一种立体声编码方法, 包括:
101、 获得第一单声道信号与左声道信号间的左声道能量关系系数以及所 述第一单声道信号与右声道信号间的右声道能量关系系数,所述第一单声道信 号为立体声左右声道信号下混合生成得到; 在本发明实施例中, 首先将左、右声道信号下混成一路单声道信号, 并将 所述单声道信号变换至 MDCT域,对 MDCT域的单声道信号进行编码后,再进行 本地解码,从而得到单声道 monoc信号,该单声道 monoc信号即为第一单声道
信号;分别计算所述第一单声道信号与左、右声道信号间的能量关系( pann ing ) 系数, 所述能量关系系数包括: 左声道能量关系系数和右声道能量关系系数。
102、 分别获得位于波谷位置的所述第一单声道信号各子带关于左声道能 量关系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于 右声道能量关系系数的右能量和;
利用下式获取左能量和,即波谷位置的所述第一单声道信号与左声道能量 关系系数的乘积的能量和 ml _e;
ml _ e - ( ( ) * w/ ) 2 其中, m (n)为所述波谷位置的单声道信号, wl 为波谷位置所在子带对应 的左声道能量关系系数;
利用下式获取右能量和,即波谷位置的所述第一单声道信号与右声道能量 关系系数的乘积的能量和 mr _ e
mr _e = ^(w(w) * vr)2 其中, m (n)为所述波谷位置的单声道信号, wr 为波谷位置所在子带对应 的右声道能量关系系数;
103、 根据所述左声道能量关系系数的互相关在波谷位置的第一单声道信 号的各子带和所述左声道信号的各子带;以及根据所述右声道能量关系系数的 互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得 到互相关结果;
利用下式使左声道能量关系系数的互相关在波谷位置的第一单声道信号 的各子带和所述左声道信号的各子带, 得到左互相关结果 l _m;
I _m = ^w(w) * v/
其中, m (n)为所述波谷位置的单声道信号, wl 为波谷位置所在子带对应 的左声道能量关系系数, 1 (n)为所述波谷位置的左声道信号;
利用下式使所述右声道能量关系系数互相关在波谷位置的第一单声道信 号的各子带和所述右声道信号的各子带, 得到右互相关结果 r_m;
r _ m = ^ m(n) * wr * r{ri) 其中, m (n)为所述波谷位置的单声道信号, wr 为波谷位置所在子带对应 的右声道能量关系系数, r (n)为所述波谷位置的右声道信号;
104、 采用所述左、 右能量和以及所述互相关结果, 获取缩放因子; 将步骤 102、 步骤 103计算得到的 ml _e、 mr_e、 l _m、 r_m代入下式, 计 算得到缩放因子的值 mu 11;
, I πι - r m
mult - ~ = =——
ml _e -\- mr _e
105、 根据所述缩放因子对所述立体声的左右声道信号进行编码。
使用所述缩放因子和所述能量关系 (panning ) 系数调整所述第一单声道 信号, 得到第二单声道信号, 所述第二单声道信号包括: 第二单声道左信号和 第二单声道右信号; 对左声道信号与所述第二左单声道信号的差值、右声道信 号与所述第二右单声道信号的差值分别进行编码。
在本发明实施例一提供的立体声编码方法中,利用波谷位置的单声道信号 与左声道能量关系系数、右声道能量关系系数的乘积的能量和, 波谷位置的单 声道信号与左、 右声道信号的互相关值来直接计算缩放因子,大大简化了现有 技术中确定缩放因子的复杂度,从而在整体上减小来立体声编码的计算量和复 杂度, 显著的节省了系统资源。
在本发明实施例一中计算得到的缩放因子可以直接用于对第一声道信号
的调整过程。 为了取得更好的调整效果, 在本发明实施例二中, 提供了一种更 为精确的确定最佳缩放因子的方法, 由于其他步骤均与本发明实施例一相同, 因此, 下面仅对本发明实施例二中确定最佳缩放因子的方法进行描述。
如图 2所示, 本发明实施例二确定最佳缩放因子的步骤包括:
201、 根据所述左、 右能量和以及所述互相关结果, 确定所述缩放因子所 在的范围;
202、 在所述范围内确定最佳缩放因子。
从码本里所述范围内所有的缩放因子中选取一个最佳的缩放因子。下面将 结合附图对上述步骤分别进行伴细描述。
如图 3所示, 在本发明实施例二中, 根据所述左、右能量和以及所述互相 关结果, 确定所述缩放因子所在的范围的步骤包括:
301、 根据所述左、 右能量和以及所述互相关结果, 计算初始缩放因子的 值;
将将步骤 102、 步骤 103计算得到的 ml _e、 mr_e、 l _m、 r_m代入下式, 计算得到初始缩放因子的值 m u 11。
Ί I πι - r m
mult - ~ = =——
ml _e -\- mr _e
302、 对所述初始缩放因子的值进行量化, 得到量化索引;
利用缩放因子量化器对所述初始缩放因子的值进行量化,从而获得初始缩 放因子的量化索引;
303、 根据所述的量化索引, 在缩放因子码本中, 确定最佳缩放因子的搜 索范围。
在所述缩放因子码本中,所有的缩放因子按照其对应的量化索引递增的顺
序排列, 因此可以确定, 最佳的缩放因子为所得到的初始缩放因子、初始缩放 因子的量化索引减一所对应的缩放因子、初始缩放因子的量化索 )加一所对应 的缩放因子三者中的其中一个;
或者还可以将所述搜索范围按照以下方式设定,先从初始缩放因子的量化 索引减一所对应的缩放因子、初始缩放因子的量化索 ^ )加一所对应的缩放因子 中找出与初始缩放因子距离最近的一个(即与初始缩放因子之差的绝对值最小 的一个), 将其与初始缩放因子一起作为缩放因子的搜索范围;
若所述初始缩放因子的量化索引为码本中的最小索引,则最佳的缩放因子 为所得到的初始缩放因子、初始缩放因子的量化索引加一所对应的缩放因子两 者中的其中一个;
若所述初始缩放因子的量化索引为码本中的最大索引,则最佳的缩放因子 为所得到的初始缩放因子、初始缩放因子的量化索引减一所对应的缩放因子两 者中的其中一个。
如图 4所示,在本发明实施例二中,在所述范围内确定最佳缩放因子的步 骤包括:
401、 根据所述范围内的缩放因子, 分别计算预测误差能量;
将所述范围内的缩放因子,分别代入下式,计算各个缩放因子所对应的预 测误差能量 di s t ; dist =∑ ( (") - wl * M{n)f + (r(") - wr * M{n)f 其中, l (n)为波谷位置的左声道信号, r (n)为波谷位置的右声道信号, wl 为波谷位置所在子带对应的左声道能量关系系数, wr 为波谷位置所在子带对 应的右声道能量关系系数, M ( n ) 为所述波谷位置的第一单声道信号 m ( n )
与缩放因子的乘积;
402、 从所述预测误差能量中, 选取最小的预测误差能量;
将根据上式得到的预测误差能量进行排序, 获取最小的预测误差能量;
403、 所述最小的预测误差能量所对应的缩放因子即为最佳缩放因子。 找到计算得到所述最小的预测误差能量所用到的缩放因子,所述缩放因子 即为最佳缩放因子。
在本发明实施例二中,通过先确定缩放因子的搜索范围, 然后从所述搜索 范围内的缩放因子中选取最佳缩放因子, 与现有技术相关系, 简化了确定缩放 因子的复杂度,从而在整体上减小来立体声编码的计算量和复杂度,显著的节 省了系统资源。
在本发明实施例二计算初始缩放因子的过程中, 需要用到左、右声道的能 量关系系数。 在本发明实施例三计算初始缩放因子的过程中, 可以将所述左、 右声道的能量关系系数均设为 1, 计算初始缩放因子, 并最终确定最佳缩放因 子。
在本发明实施例四计算初始缩放因子的过程中,可以将所述左声道的能量 关系系数设为频带内左声道能量关系系数的平均值,将所述右声道能量关系系 数设为频带内右声道能量关系系数的平均值,计算初始缩放因子, 并最终确定 最佳缩放因子。
由于本发明实施例三、本发明实施例四仅在左、右声道的能量关系系数的 选取中, 与本发明实施例一有所不同, 其余步骤均与本发明实施例一相同, 因 此不再过多复述。
基于上述方法实施例,本发明实施例五提供了一种立体声编码装置,如图
5所示, 该装置包括:
能量关系获取模块 501, 用于获得第一单声道信号与左声道信号间的左声 道能量关系系数以及所述第一单声道信号与右声道信号间的右声道能量关系 系数, 所述第一单声道信号为根据立体声左右声道信号下混合生成得到; 能量和获取模块 502, 用于分别获得位于波谷位置的所述第一单声道信号 各子带关于所述能量关系获取模块 501 生成的左声道能量关系系数的左能量 和,以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模 块 501生成的右声道能量关系系数的右能量和;
互相关模块 503 , 用于根据所述能量关系获取模块 502获得的左声道能量 关系系数的互相关在波谷位置的第一单声道信号的各子带和所述左声道信号 的各子带;以及根据所述能量关系获耳 莫块 502获得的右声道能量关系系数的 互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得 到互相关结果;
缩放因子获取模块 504, 用于根据所述能量和获取模块 502生成的左、 右 能量和与互相关模块 503生成的左、 右互相关, 获取缩放因子的值。
编码模块 505, 用于根据所述缩放因子获耳 莫块 504得到的缩放因子对所 述立体声的左右声道信号进行编码。
在本发明实施例五提供的立体声编码装置中,利用波谷位置的单声道信号 与左、右声道能量关系系数的乘积的能量和, 波谷位置的单声道信号与左、右 声道信号的互相关值来直接计算缩放因子,大大简化了现有技术中确定缩放因 子的复杂度,从而在整体上减小来立体声编码的计算量和复杂度,显著的节省 了系统资源。
在所述缩放因子获耳 莫块 504 中计算得到的缩放因子可以直接用于编码 模块 505中对所述立体声的左右声道信号进行编码。 为了取得更好的效果,在 本发明实施例六中, 如图 6所示, 所述缩放因子获取模块 504, 包括:
缩放因子范围确定单元 601,用于根据所述能量和获取模块 502生成的左、 右能量和与互相关模块 503 生成的互相关结果, 确定所述缩放因子的所在范 围;
最佳缩放因子确定单元 602, 用于在所述缩放因子范围确定单元 601确定 的范围内确定最佳缩放因子。
如图 7所示, 在本发明实施例六中, 所述缩放因子范围确定单元 601, 包 括:
初始缩放因子求取单元 701, 用于根据所述能量和获取模块生成的左、 右 能量和与互相关模块生成的互相关结果, 计算初始缩放因子的值;
量化单元 702, 用于对所述初始缩放因子求取单元 701所得到的初始缩放 因子的值进行量化, 得到量化索引;
范围确定单元 703, 用于根据所述量化单元 702得到的量化索引, 在缩放 因子码本中, 确定缩放因子的搜索范围。
如图 8所示,在本发明实施例六中,所述最佳缩放因子确定单元 602包括: 预测误差能量计算单元 801, 用于根据所述范围内的缩放因子, 分别计算 预测误差能量;
最小预测误差能量选取单元 802, 用于从所述预测误差能量计算单元 801 得到的预测误差能量中, 选取最小的预测误差能量;
确定最佳缩放因子单元 803, 用于将所述最小预测误差能量选取单元 802
选取的最小的预测误差能量所对应的缩放因子确定为最佳缩放因子。 本发明实施例六提供的立体编码装置, 通过先确定缩放因子的搜索范围, 然后从所述搜索范围内的缩放因子中选取最佳缩放因子, 与现有技术相比, 简 化了确定缩放因子的复杂度,从而在整体上减小来立体声编码的计算量和复杂 度, 显著的节省了系统资源。
本发明实施例七提供了一种编码器, 包括:
能量关系获取模块 501, 用于获得第一单声道信号与左声道信号间的左声 道能量关系系数以及所述第一单声道信号与右声道信号间的右声道能量关系 系数, 所述第一单声道信号为根据立体声左右声道信号下混合生成得到; 能量和获取模块 502, 用于分别获得位于波谷位置的所述第一单声道信号 各子带关于所述能量关系获取模块 501 生成的左声道能量关系系数的左能量 和,以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模 块 501生成的右声道能量关系系数的右能量和;
互相关模块 503 , 用于根据所述能量关系获取模块 502获得的左声道能量 关系系数的互相关在波谷位置的第一单声道信号的各子带和所述左声道信号 的各子带;以及根据所述能量关系获耳 莫块 502获得的右声道能量关系系数的 互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得 到互相关结果;
缩放因子获取模块 504, 用于根据所述能量和获取模块 502生成的左、 右 能量和与互相关模块 503生成的左、 右互相关, 获取缩放因子的值。
编码模块 505, 用于根据所述缩放因子获取模块 504得到的缩放因子对所 述立体声的左右声道信号进行编码。
在本发明实施例七提供的编码器中,大大简化了现有技术中确定缩放因子 的复杂度,从而在整体上减小来立体声编码的计算量和复杂度,显著的节省了 系统资源。
本发明实施例八提供了一种立体声编码方法, 包括:
步骤 601 : 采用单声道信号和左声道能量关系系数获得位于波谷位置的左 声道信号的预测值的能量和,以及采用单声道信号和右声道能量关系系数获得 位于波谷位置的的右声道信号的预测值的能量和,所述单声道信号根据立体声 左右声道信号下混得到。
获得第一单声道信号与左声道信号间的左声道能量关系系数以及所述第 一单声道信号与右声道信号间的右声道能量关系系数,所述第一单声道信号根 据立体声左右声道信号下混得到,分别获得位于波谷位置的所述左声道信号的 预测值的能量和, 以及位于波谷位置的所述右声道信号的能量和。
利用下式获取所述能量和,即波谷位置的所述单声道信号与左声道能量关 系系数的乘积的能量和 ml _e; 以及波谷位置的所述单声道信号与右声道能量 关系系数的乘积的能量和 mr _ e。
ml _ e = (m (n ) * wl ) 2 mr _e = (m(n) :¥ wr)2
, 以及 - , 其中,
m (n)为所述波谷位置的单声道信号, wl 为波谷位置所在子带对应的左声 道能量关系系数, wr为波谷位置所在子带对应的右声道能量关系系数。
步骤 602: 使用所述单声道信号和所述左声道能量关系系数得到位于所述 波谷位置的所述左声道信号的预测值和所述左声道信号的互相关结果,以及使 用所述单声道信号和所述右声道能量关系系数得到位于所述波谷位置的所述 右声道信号的预测值和所述右声道信号的互相关结果。
采用所述单声道信号与所述左声道能量关系系数进行乘积运算得到所述 左声道信号的预测值,以及采用所述单声道信号与所述右声道能量关系系数进 行乘积运算得到所述右声道信号的预测值,根据所述左声道信号的预测值得到 位于波谷位置的所述左声道信号的预测值和所述左声道信号的各子带的相关 值的和,根据所述右声道信号的预测值得到位于波谷位置的所述右声道信号的 预测值和所述右声道信号的各子带的相关值的和。即计算波谷位置所述左声道 的预测值和所述左声道信号的各子带的相关值的和,以及计算波谷位置所述右 声道的预测值和所述右声道信号的各子带的相关值的和,得到互相关结果。其 中左声道信号的预测值为单声道信号与左声道能量关系系数的乘积。其中右声 道信号的预测值为单声道信号与右声道能量关系系数的乘积。
可利用下式表示:
/ w = m(n) 1(ή) r w = m(n) * wr * r(n)
, 以及 — , 其中,
m (n)为所述波谷位置的单声道信号, wl 为波谷位置所在子带对应的左声 道能量关系系数, l (n)为所述波谷位置的左声道信号, wr 为波谷位置所在子 带对应的右声道能量关系系数, r (n)为所述波谷位置的右声道信号。
步骤 603: 采用所述能量和以及所述互相关结果, 获取缩放因子; 根据根据所述能量和以及所述互相关结果,计算初始缩放因子的值,对所 述初始缩放因子的值进行量化, 得到量化索引, 根据所述的量化索引, 在缩放 因子码本中, 确定缩放因子的搜索范围, 在所述范围内确定最佳缩放因子。 所 述在所述范围内确定最佳缩放因子包括:根据所述范围内的缩放因子,分别计 算预测误差能量, 从所述预测误差能量中, 选取最小的预测误差能量, 所述最 小的预测误差能量所对应的缩放因子即为最佳缩放因子。
步骤 604: 根据所述缩放因子对所述立体声的左右声道信号进行编码。 其中步骤 603和步骤 604和上述各方法实施例相同。 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤 是可以通过程序来指令相关的硬件完成,所述的程序可以存储于计算机可读存 储介质中, 如 R0M/RAM、 磁碟或光盘等。 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到 变化或替换, 都应涵盖在本发明的保护范围之内。 因此, 本发明的保护范围应 所述以权利要求的保护范围为准。
Claims
1、 一种立体声编码方法, 其特征在于, 包括:
获得第一单声道信号与左声道信号间的左声道能量关系系数以及所述第 一单声道信号与右声道信号间的右声道能量关系系数,所述第一单声道信号根 据为立体声左右声道信号下混混合生成得到;
分别获得位于波谷位置的所述第一单声道信号各子带关于左声道能量关 系系数的左能量和,以及位于波谷位置的所述第一单声道信号各子带关于右声 道能量关系系数的右能量和;
根据所述左声道能量关系系数的互相关在波谷位置的第一单声道信号的 各子带和所述左声道信号的各子带,; 以及根据所述右声道能量关系系数的互 相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带,得到 互相关结果;
采用所述左、 右能量和以及所述互相关结果, 获取缩放因子;
根据所述缩放因子对所述立体声的左右声道信号进行编码。
2、根据权利要求 1所述的立体声编码方法,其特征在于,所述根据所述左、 右能量和以及所述互相关结果, 获取缩放因子的步骤包括:
根据所述左使用所述左、右能量和以及所述互相关结果,确定所述缩放因 子所在的范围;
在所述范围内确定最佳缩放因子。
3、 据权利要求 2所述的立体声编码方法, 其特征在于, 所述根据所述左、 右能量和以及所述互相关结果, 确定所述缩放因子的范围的步骤包括:
根据根据所述左、右能量和以及所述互相关结果,计算初始缩放因子的值; 对所述初始缩放因子的值进行量化, 得到量化索引;
根据所述的量化索引, 在缩放因子码本中, 确定缩放因子的搜索范围。
4、根据权利要求 3所述的立体声编码方法, 其特征在于, 所述在所述范围 内确定最佳缩放因子的步骤包括:
根据所述范围内的缩放因子, 分别计算预测误差能量;
从所述预测误差能量中, 选取最小的预测误差能量;
所述最小的预测误差能量所对应的缩放因子即为最佳缩放因子。
5、根据权利要求 4所述的立体声编码方法, 其特征在于, 所述左声道能量 关系系数和右声道能量关系系数均为 1。
6、根据权利要求 4所述的立体声编码方法, 其特征在于, 所述左声道能量 关系系数为频带内左声道能量关系系数的平均值,所述右声道能量关系系数为 频带内右声道能量关系系数的平均值。
7、 一种立体声编码装置, 其特征在于, 包括:
能量关系获取模块,用于获得第一单声道信号与左声道信号的左声道能量 关系系数以及所述第一单声道信号与右声道信号的右声道能量关系系数,所述 第一单声道信号为立体声左右声道信号混合生成;
能量和获取模块,用于分别获得位于波谷位置的所述第一单声道信号各子 带关于所述能量关系获耳 莫块生成的左声道能量关系系数的左能量和,以及位 于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的 右声道能量关系系数的右能量和;
互相关模块,用于根据所述能量关系获取模块获得的左声道能量关系系数 互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带;以 及根据所述能量关系获取模块获得的右声道能量关系系数互相关在波谷位置 的第一单声道信号的各子带和所述右声道信号的各子带, 得到互相关结果; 缩放因子获取模块, 用于根据所述能量和获取模块生成的左、右能量和与 互相关模块生成的互相关结果, 获取缩放因子。
编码模块,用于根据所述缩放因子获 莫块得到的缩放因子对所述立体声 的左右声道信号进行编码。
8、根据权利要求 7所述的立体声编码装置, 其特征在于, 所述缩放因子获 莫块包括:
缩放因子范围确定单元, 用于根据所述能量和获取模块生成的左、右能量 和与互相关模块生成的互相关结果, 确定所述缩放因子的所在范围;
最佳缩放因子确定单元,用于在所述缩放因子范围确定单元确定的范围内 确定最佳缩放因子。
9、根据权利要求 8所述的立体声编码装置, 其特征在于, 所述缩放因子范 围确定单元包括:
初始缩放因子求取单元, 用于根据所述能量和获取模块生成的左、右能量
和与互相关模块生成的互相关结果, 计算初始缩放因子的值。
量化单元,用于对所述初始缩放因子求取单元所得到的初始缩放因子的值 进行量化, 得到量化索引;
范围确定单元, 用于根据所述量化单元得到的量化索引,在缩放因子码本 中, 确定缩放因子的搜索范围。
10、 根据权利要求 8所述的立体声编码装置, 其特征在于, 所述最佳缩放 因子确定单元包括:
预测误差能量计算单元, 用于根据所述范围内的缩放因子,分别计算预测 误差能量;
最小预测误差能量选取单元,用于从所述预测误差能量计算单元得到的预 测误差能量中, 选取最小的预测误差能量;
确定最佳缩放因子单元,用于将所述最小预测误差能量选取单元选取的最 小的预测误差能量所对应的缩放因子确定为最佳缩放因子。
11、 一种编码器, 其特征在于, 包括如权利要求 7至权利要求 10任意一项 权利要求所述的立体声编码装置。
12、 一种立体声编码方法, 其特征在于, 包括:
采用第一单声道信号信号和左、右声道能量关系系数分别获得位于波谷位 置的左、右声道信号的预测值的能量和,其中所述第一单声道信号信号根据立 体声左右声道信号下混得到。
使用所述第一单声道信号信号和所述左、右声道能量关系系数分别得到位 于所述波谷位置的所述左声道信号的预测值与左声道信号以及所述右声道信 号的预测值与右声道信号的互相关结果;
采用所述左、右声道信号的预测值的能量和以及所述左声道信号的预测值 与左声道信号以及所述右声道信号的预测值与右声道信号的互相关结果,获取 缩放因子;
根据所述缩放因子对所述立体声的左右声道信号进行编码。
13、 如权利要求 12所述的方法, 其特征在于, 所述使用所述第一单声道信 号信号和所述左、右声道能量关系系数分别得到位于所述波谷位置的所述左声 道信号的预测值与左声道信号以及所述右声道信号的预测值与右声道信号的 互相关结果包括:
采用所述第一单声道信号信号与所述左声道能量关系系数进行乘积运算 得到所述左声道信号的预测值,以及采用所述第一单声道信号信号与所述右声 道能量关系系数进行乘积运算得到所述右声道信号的预测值;
根据所述左声道信号的预测值得到位于波谷位置的所述左声道信号的预 测值和所述左声道信号的各子带的相关值的和,根据所述右声道信号的预测值 得到位于波谷位置的所述右声道信号的预测值和所述右声道信号的各子带的 相关值的和。
14、 如权利要求 13所述的方法, 其特征在于, 所述使用所述第一单声道 信号信号和所述左、右声道能量关系系数分别得到位于所述波谷位置的所述左 声道信号的预测值与左声道信号以及所述右声道信号的预测值与右声道信号 的互相关结果包括:
ml _ e = ~ m (" ) * wl ) 2 mr _e = (m(n) * wr)2
, 以及 - , 其中,
m(n)为所述波谷位置的第一单声道信号信号, wl为波谷位置所在子带对应 的左声道能量关系系数, l(n)为所述波谷位置的左声道信号, wr为波谷位置所 在子带对应的右声道能量关系系数, r(n)为所述波谷位置的右声道信号。
15、 如权利要求 13所述的方法, 其特征在于, 所述采用第一单声道信号 信号和左、右声道能量关系系数分别获得位于波谷位置的左、右声道信号的预 测值的能量和包括:
/ w = m(n) 1(ή) r w = m(n) * wr * r(n)
, 以及 — , 其中,
m(n)为所述波谷位置的第一单声道信号信号, wl为波谷位置所在子带对应 的左声道能量关系系数, wr为波谷位置所在子带对应的右声道能量关系系数。
16、据权利要求 12所述的立体声编码方法,其特征在于,所述采用所述左、 右声道信号的预测值的能量和以及所述左声道信号的预测值与左声道信号以 及所述右声道信号的预测值与右声道信号的互相关结果, 获取缩放因子包括: 根据所述能量和以及所述互相关结果, 计算初始缩放因子的值;
对所述初始缩放因子的值进行量化, 得到量化索引;
根据所述的量化索引, 在缩放因子码本中, 确定缩放因子的搜索范围;
在所述范围内确定最佳缩放因子。
17、根据权利要求 16所述的立体声编码方法, 其特征在于, 所述在所述范 围内确定最佳缩放因子包括:
根据所述范围内的缩放因子, 分别计算预测误差能量;
从所述预测误差能量中, 选取最小的预测误差能量;
所述最小的预测误差能量所对应的缩放因子即为最佳缩放因子。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP10748342.2A EP2405424B1 (en) | 2009-03-04 | 2010-03-04 | Stereo coding method, device and encoder |
EP14174097.7A EP2793228B1 (en) | 2009-03-04 | 2010-03-04 | Stereo encoding method, stereo encoding device |
ES10748342.2T ES2529732T3 (es) | 2009-03-04 | 2010-03-04 | Método de codificación estéreo, dispositivo y codificador |
US13/224,806 US9064488B2 (en) | 2009-03-04 | 2011-09-02 | Stereo encoding method, stereo encoding device, and encoder |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910118870.8 | 2009-03-04 | ||
CN2009101188708A CN101826326B (zh) | 2009-03-04 | 2009-03-04 | 一种立体声编码方法、装置和编码器 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US13/224,806 Continuation US9064488B2 (en) | 2009-03-04 | 2011-09-02 | Stereo encoding method, stereo encoding device, and encoder |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2010099752A1 true WO2010099752A1 (zh) | 2010-09-10 |
Family
ID=42690218
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/CN2010/070873 WO2010099752A1 (zh) | 2009-03-04 | 2010-03-04 | 一种立体声编码方法、装置和编码器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US9064488B2 (zh) |
EP (2) | EP2405424B1 (zh) |
CN (1) | CN101826326B (zh) |
ES (1) | ES2529732T3 (zh) |
WO (1) | WO2010099752A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101826326B (zh) | 2009-03-04 | 2012-04-04 | 华为技术有限公司 | 一种立体声编码方法、装置和编码器 |
KR101662681B1 (ko) | 2012-04-05 | 2016-10-05 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 멀티채널 오디오 인코더 및 멀티채널 오디오 신호 인코딩 방법 |
JP6302071B2 (ja) | 2013-09-13 | 2018-03-28 | サムスン エレクトロニクス カンパニー リミテッド | 無損失符号化方法及び無損失復号化方法 |
KR102636396B1 (ko) * | 2015-09-25 | 2024-02-15 | 보이세지 코포레이션 | 스테레오 사운드 신호를 1차 및 2차 채널로 시간 영역 다운 믹싱하기 위해 좌측 및 우측 채널들간의 장기 상관 차이를 이용하는 방법 및 시스템 |
CN117133297A (zh) * | 2017-08-10 | 2023-11-28 | 华为技术有限公司 | 时域立体声参数的编码方法和相关产品 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5636324A (en) * | 1992-03-30 | 1997-06-03 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for stereo audio encoding of digital audio signal data |
JP2003228397A (ja) * | 2002-02-05 | 2003-08-15 | Matsushita Electric Ind Co Ltd | インテンシティステレオ符号化のための位相検出方法および装置 |
WO2008016097A1 (fr) * | 2006-08-04 | 2008-02-07 | Panasonic Corporation | dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci |
CN101188878A (zh) * | 2007-12-05 | 2008-05-28 | 武汉大学 | 一种立体声音频信号的空间参数量化及熵编码方法及其所用系统结构 |
US20080204456A1 (en) * | 2007-02-28 | 2008-08-28 | Markus Sapp | Methods and graphical user interfaces for displaying balance and correlation information of signals |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202248A (ja) * | 2004-01-16 | 2005-07-28 | Fujitsu Ltd | オーディオ符号化装置およびオーディオ符号化装置のフレーム領域割り当て回路 |
CN1973320B (zh) * | 2004-04-05 | 2010-12-15 | 皇家飞利浦电子股份有限公司 | 立体声编码和解码的方法及其设备 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US8200351B2 (en) | 2007-01-05 | 2012-06-12 | STMicroelectronics Asia PTE., Ltd. | Low power downmix energy equalization in parametric stereo encoders |
BR122020009732B1 (pt) * | 2008-05-23 | 2021-01-19 | Koninklijke Philips N.V. | Método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de downmix mono com base em parâmetros espaciais, meio legível por computador não transitório, aparelho de downmix estéreo paramétrico para a geração de um sinal de downmix mono a partir de um sinal esquerdo e de um sinal direito com base em parâmetros espaciais e método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base em parâmetros espaciais |
US8023660B2 (en) * | 2008-09-11 | 2011-09-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues |
CN101826326B (zh) | 2009-03-04 | 2012-04-04 | 华为技术有限公司 | 一种立体声编码方法、装置和编码器 |
-
2009
- 2009-03-04 CN CN2009101188708A patent/CN101826326B/zh active Active
-
2010
- 2010-03-04 EP EP10748342.2A patent/EP2405424B1/en active Active
- 2010-03-04 EP EP14174097.7A patent/EP2793228B1/en active Active
- 2010-03-04 ES ES10748342.2T patent/ES2529732T3/es active Active
- 2010-03-04 WO PCT/CN2010/070873 patent/WO2010099752A1/zh active Application Filing
-
2011
- 2011-09-02 US US13/224,806 patent/US9064488B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5636324A (en) * | 1992-03-30 | 1997-06-03 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for stereo audio encoding of digital audio signal data |
JP2003228397A (ja) * | 2002-02-05 | 2003-08-15 | Matsushita Electric Ind Co Ltd | インテンシティステレオ符号化のための位相検出方法および装置 |
WO2008016097A1 (fr) * | 2006-08-04 | 2008-02-07 | Panasonic Corporation | dispositif de codage audio stéréo, dispositif de décodage audio stéréo et procédé de ceux-ci |
US20080204456A1 (en) * | 2007-02-28 | 2008-08-28 | Markus Sapp | Methods and graphical user interfaces for displaying balance and correlation information of signals |
CN101188878A (zh) * | 2007-12-05 | 2008-05-28 | 武汉大学 | 一种立体声音频信号的空间参数量化及熵编码方法及其所用系统结构 |
Non-Patent Citations (1)
Title |
---|
See also references of EP2405424A4 * |
Also Published As
Publication number | Publication date |
---|---|
CN101826326B (zh) | 2012-04-04 |
ES2529732T3 (es) | 2015-02-25 |
EP2405424A4 (en) | 2012-01-25 |
CN101826326A (zh) | 2010-09-08 |
US9064488B2 (en) | 2015-06-23 |
US20110317843A1 (en) | 2011-12-29 |
EP2793228A1 (en) | 2014-10-22 |
EP2405424A1 (en) | 2012-01-11 |
EP2793228B1 (en) | 2019-05-08 |
EP2405424B1 (en) | 2014-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102205596B1 (ko) | 다중 채널 신호 인코딩 방법 및 인코더 | |
TWI653627B (zh) | 用以估計通道間時間差的裝置及方法與相關電腦程式 | |
TWI541797B (zh) | 使用時間雜訊修補成形以編碼及解碼已被編碼音訊的裝置及方法 | |
RU2439718C1 (ru) | Способ и устройство для обработки звукового сигнала | |
US7573912B2 (en) | Near-transparent or transparent multi-channel encoder/decoder scheme | |
JP5480274B2 (ja) | 信号処理方法及び装置 | |
Ravelli et al. | Union of MDCT bases for audio coding | |
EP1852851A1 (en) | An enhanced audio encoding/decoding device and method | |
TWI714046B (zh) | 用於估計聲道間時間差的裝置、方法或計算機程式 | |
TWI669704B (zh) | 用於具有具改良式中間/側邊決定之全域ild的mdct m/s立體聲之設備、系統及方法、以及相關電腦程式 | |
CN104170009A (zh) | 感知音频编解码器中的谐波信号的相位相干性控制 | |
WO2010099752A1 (zh) | 一种立体声编码方法、装置和编码器 | |
KR101837686B1 (ko) | 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법 | |
MX2015001396A (es) | Metodo y descodificador para un concepto parametrico de codificacion de objeto de audio espacial generalizado para casos de mezcla descendente/mezcla ascendente de multicanal. | |
JP6804666B2 (ja) | マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器 | |
KR20060109298A (ko) | 멀티채널 오디오 신호에 대한 서브밴드별 공간 정보의적응적 양자화 | |
WO2012006942A1 (zh) | 一种音频数据的编码方法及装置 | |
WO2013189030A1 (zh) | 对单声道或立体声进行编码的方法 | |
JP2002132295A (ja) | ステレオオーディオ信号高能率符号化装置 | |
Beack et al. | Angle‐Based Virtual Source Location Representation for Spatial Audio Coding | |
KR102353050B1 (ko) | 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스 | |
JP5799824B2 (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
WO2016023322A1 (zh) | 多声道声音信号编码方法、解码方法及装置 | |
Hansen et al. | Fine-grain scalable audio coding based on envelope restoration and the SPIHT algorithm | |
Cantzos | Psychoacoustically-Driven Multichannel Audio Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 10748342 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
WWE | Wipo information: entry into national phase |
Ref document number: 2010748342 Country of ref document: EP |