CN110462733B - 多声道信号的编解码方法和编解码器 - Google Patents

多声道信号的编解码方法和编解码器 Download PDF

Info

Publication number
CN110462733B
CN110462733B CN201880022744.XA CN201880022744A CN110462733B CN 110462733 B CN110462733 B CN 110462733B CN 201880022744 A CN201880022744 A CN 201880022744A CN 110462733 B CN110462733 B CN 110462733B
Authority
CN
China
Prior art keywords
channel signal
signal
target
attenuation factor
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880022744.XA
Other languages
English (en)
Other versions
CN110462733A (zh
Inventor
刘泽新
苗磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN110462733A publication Critical patent/CN110462733A/zh
Application granted granted Critical
Publication of CN110462733B publication Critical patent/CN110462733B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Abstract

一种多声道信号的编解码方法和编解码器,该编码方法包括:确定多声道信号中的第一声道信号和第二声道信号的下混信号以及第一声道信号和第二声道信号的初始混响增益参数;根据第一声道信号、第二声道信号分别与下混信号的相关性,以及初始混响增益参数,确定第一声道信号和第二声道信号的目标混响增益参数;根据下混信号和目标混响增益参数,对第一声道信号和第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。该编解码方法和编解码器能够提高混响处理后得到的声道信号的质量。

Description

多声道信号的编解码方法和编解码器
本申请要求于2017年03月31日提交中国专利局、申请号为201710205821.2、申请名称为“多声道信号的编解码方法和编解码器”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及音频编码领域,并且更具体地,涉及一种多声道信号的编解码方法和编解码器。
背景技术
随着生活质量的提高,人们对高质量音频的需求不断增加。相对于单声道音频,立体声音频具有各声源的方位感和分布感,能够提高声音的清晰度、可懂度及临场感,因而备受人们青睐。
立体声处理技术主要有和差(Mid/Sid,MS)编码、强度立体声(Intensity Stereo,IS)编码以及参数立体声(Parametric Stereo,PS)编码等。
现有技术在采用PS编码对声道信号进行编码时,编码端会对多个声道信号进行空间参数分析,得到多个声道信号的混响增益参数以及其它空间参数,并对多个声道信号的混响增益参数以及其它空间参数进行编码,以便解码端在解码时能够根据声道信号的混响增益参数对解码得到的多个声道信号进行混响处理,以增加听觉效果。但是,在某些情况下,例如,当多声道信号之间的相关性较低时,根据多个声道信号对应的混响增益参数对解码得到的多个声道信号进行混响处理时,反而会导致更差的听觉效果。
发明内容
本申请提供一种多声道信号的编解码方法和编解码器,以提高声道信号的质量。
第一方面,提供了一种多声道信号的编码方法,该方法包括:确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数;根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,以及所述初始混响增益参数,确定所述第一声道信号和所述第二声道信号的目标混响增益参数;根据所述下混信号和所述目标混响增益参数,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
本申请中,在确定声道信号的目标混响增益参数时,考虑到了声道信号与下混信号的相关性,这样能够在根据目标混响增益参数对声道信号进行混响处理时取得更好的处理效果,从而提升混响处理后的声道信号的质量。
上述第一声道信号或者第二声道信号与下混信号的相关性可以根据第一声道信号或者第二声道信号的能量与下混信号的能量的差异来确定,也可以根据第一声道信号或者第二声道信号的幅度与下混信号的幅度的差异来确定。
结合第一方面,在第一方面的某些实现方式中,所述第一声道信号、所述第二声道信号以及所述下混信号是经过归一化处理之后得到的声道信号。
结合第一方面,在第一方面的某些实现方式中,所述根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,以及所述初始混响增益参数,确定所述第一声道信号和所述第二声道信号的目标混响增益参数,包括:根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定目标衰减因子;根据所述目标衰减因子对所述初始混响增益参数进行调整,得到所述目标混响增益参数。
通过衰减因子能够实现根据声道信号与下混信号的相关性的大小来灵活调整声道信号的初始混响增益参数。
通过声道信号的能量能够较为方便地衡量第一声道信号、第二声道信号与下混信号的相关性,也就是说通过比较声道信号与下混信号的能量的差异,能够方便地确定目标衰减因子。具体地,当第一声道信号或者第二声道信号的能量与下混信号的相差较大(大于给定阈值)时可以认为第一声道信号和第二声道信号与下混信号的相关性较弱,这时可以确定一个较大的目标衰减因子,而当第一声道信号或者第二声道信号的能量与下混信号的相差较小(小于给定阈值)时可以认为第一声道信号和第二声道信号与下混信号的相关性较弱,这时可以确定一个较小的目标衰减因子。
上述根据第一声道信号、第二声道信号分别与下混信号的相关性,确定目标衰减因子既可以根据声道信号与下信号的相关性来计算目标衰减因子,也可以是考虑到声道信号与下混信号的相关性之后直接将预设的衰减因子确定为目标衰减因子。
结合第一方面,在第一方面的某些实现方式中,所述第一声道信号和所述第二声道信号均包含多个频点,所述根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定目标衰减因子,包括:确定所述第一声道信号和所述第二声道信号分别与所述下混信号在所述多个频点的能量的差异值;根据所述差异值确定所述目标衰减因子。
通过比较第一声道信号、第二声道信号分别与下混信号在多个频点的能量的差异值,能够较为方便地确定第一声道信号、第二声道信号的能量分别与下混信号的能量的差异,进而确定衰减因子,而不必比较第一声道信号、第二声道信号分别与下混信号在全部频带上的能量的差异。
结合第一方面,在第一方面的某些实现方式中,所述确定所述第一声道信号和所述第二声道信号分别与所述下混信号在所述多个频点的能量的差异值,包括:确定所述第一声道信号的能量与所述下混信号的能量的第一差异值,所述第一差异值用于指示所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;确定所述第二声道信号的能量与所述下混信号的能量的第二差异值,所述第二差异值用于指示所述第二声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;所述根据所述差异值确定所述目标衰减因子,包括:根据所述第一差异值和所述第二差异值的比值,确定所述目标衰减因子。
可替换地,还可以直接根据所述第一差异值和所述第二差异值,确定所述目标衰减因子。
结合第一方面,在第一方面的某些实现方式中,在根据所述差异值确定所述目标衰减因子之前,所述方法还包括:确定所述差异值大于预设阈值。
只有在第一声道信号、第二声道信号分别与下混信号的能量的差异值比较大时才会确定目标衰减因子,并根据目标衰减因子对初始混响增益参数进行调整,而在差值较小的情况下,可以不对初始混响增益参数进行调整,从而提高了编码效率。
而当多个声道信号与下混信号的能量的差异值小于预设阈值时,可以直接将多个声道信号的初始混响增益参数确定为该多个声道信号的目标混响增益参数。
结合第一方面,在第一方面的某些实现方式中,所述下混信号的能量是根据根据所述第一声道信号和第二声道信号的能量确定的。
通过第一声道信号和第二声道信号的能量能够计算下混信号的能量,而不用再通过下混信号本身计算,能够简化一定的计算过程。
结合第一方面,在第一方面的某些实现方式中,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述多个声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
当目标衰减因子包括多个衰减因子时,能够根据目标衰减因子对混响增益参数进行更灵活的调整。
结合第一方面,在第一方面的某些实现方式中,所述第一声道信号和第二声道信号所在的频段包含第一频段和第二频段,所述第一频段中的子带对应的衰减因子小于或者等于第二频段中的子带对应的衰减因子,其中,所述第一频段的频率小于所述第二频段的频率。
通过为高频和低频子带对应的混响增益参数设置不同的大小的衰减因子,能够对低频子带和高频子带对应的混响增益参数进行不同程度的调整,能够在进行混响处理时取得更好的处理效果。
第二方面,提供了一种多声道信号的解码方法,该方法包括:确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数;根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号;根据所述下混信号、所述初始混响增益参数以及所述标识信息,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
上述第一声道信号或者第二声道信号与下混信号的相关性可以根据第一声道信号或者第二声道信号的能量与下混信号的能量的差异来确定,也可以根据第一声道信号或者第二声道信号的幅度与下混信号的幅度的差异来确定。
在本申请中,能够根据声道信号与下混信号的相关性来确定需要调整初始混响增益参数的声道信号,使得解码端能够先对某些声道信号的初始混响增益参数进行调整后再对这些声道信号进行混响处理,能够提升混响处理后的声道信号的质量。
结合第二方面,在第二方面的某些实现方式中,所述根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,包括:根据所述第一声道信号、所述第二声道信号的能量分别与所述下混信号的能量的相关性,确定所述第一声道信号和所述第二声道信号的标识信息。
通过声道信号以及下混信号的能量能够较为方便地衡量第一声道信号、第二声道信号分别与下混信号的相关性,从而能够较为方便地确定需要调整初始混响增益参数的声道信号。
结合第二方面,在第二方面的某些实现方式中,所述第一声道信号、所述第二声道信号分别与所述下混信号的能量的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,包括:确定第一差异值和第二差异值,所述第一差异值为所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和,所述第二差异值为所述第二声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;根据所述第一差异值和所述第二差异值确定所述第一声道信号和所述第二声道信号的标识信息。
应理解,上述第一声道信号、第二声道信号以及下混信号的能量值可以是经过归一化处理后的数值。
通过比较第一声道信号、第二声道信号分别与下混信号在多个频点的能量的差值,能够较为方便地确定第一声道信号、第二声道信号分别与下混信号的能量的差异,进而确定需要调整初始混响增益参数的声道信号,而不必比较第一声道信号、第二声道信号分别与下混信号在全部频带上的能量的差异。
结合第二方面,在第二方面的某些实现方式中,根据所述第一差异值和所述第二差异值确定所述第一声道信号和所述第二声道信号的标识信息,包括:将所述第一差异值和所述第二差异值中的最大差异值确定为目标差异值;根据目标差异值确定所述标识信息,所述标识信息具体用于指示所述目标差异值对应的声道信号,所述目标差异值对应的声道信号为需要调整初始混响增益参数的声道信号。
结合第二方面,在第二方面的某些实现方式中,所述方法还包括:根据所述第一差异值和所述第二差异值确定目标衰减因子,所述目标衰减因子用于对所述目标声道信号的初始混响增益参数进行调整;对所述目标衰减因子进行量化,并将量化后的目标衰减因子写入所述码流。
通过衰减因子能够实现根据声道信号与下混信号的相关性的大小来灵活调整声道信号的初始混响增益参数。
结合第二方面,在第二方面的某些实现方式中,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
当目标衰减因子包括多个衰减因子时,能够根据目标衰减因子对混响增益参数进行更灵活的调整。
结合第二方面,在第二方面的某些实现方式中,所述目标声道信号包含第一频段和第二频段,所述第一频段中的子带对应的衰减因子小于或者等于第二频段中的子带对应的衰减因子,其中,所述第一频段的频率小于所述第二频段的频率。
通过为高频和低频子带对应的混响增益参数设置不同的大小的衰减因子,能够对低频子带和高频子带对应的混响增益参数进行不同程度的调整,能够在进行混响处理时取得更好的处理效果。
结合第二方面,在第二方面的某些实现方式中,所述下混信号的能量是根据所述第一声道信号和所述第二声道信号的能量确定的。
通过多个声道信号的能量来估计或者推导下混信号的能量,能够节省一定的计算量。
第三方面,提供了一种多声道信号的解码方法,该方法包括:获取码流;根据所述码流确定多声道信号中的第一声道信号和第二声道信号的下混信号、所述第一声道信号和所述第二声道信号的初始混响增益参数以及所述第一声道信号和所述第二声道信号的标识信息,其中,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号;根据所述标识信息确定所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号为目标声道信号;对所述目标声道信号的初始混响增益参数进行调整。
本申请中,能够通过标识信息确定需要调整初始混响增益参数的声道信号,并在对该声道信号进行混响处理之前调整该声道信号的初始混响增益参数,能够提升混响处理后的声道信号的质量。
结合第三方面,在第三方面的某些实现方式中,所述对所述目标声道信号的初始混响增益参数进行调整,包括:确定目标衰减因子;根据所述目标衰减因子对所述目标声道信号的初始混响增益参数进行调整,得到所述目标声道信号的目标混响增益参数。
通过衰减因子能够实现根据声道信号与下混信号的相关性的大小来灵活调整声道信号的初始混响增益参数。
结合第三方面,在第三方面的某些实现方式中,所述确定目标衰减因子,包括:将预设的衰减因子确定为所述目标衰减因子。
通过预设设置衰减因子,能够简化确定目标衰减因子的过程,进而提高解码的效率。
结合第三方面,在第三方面的某些实现方式中,所述确定目标衰减因子,包括:根据所述码流获取所述目标衰减因子。
当码流中包含目标衰减因子时,可以直接通过在码流中获取目标衰减因子也能够简化确定目标衰减因子的过程,能够提高解码的效率。
结合第三方面,在第三方面的某些实现方式中,所述确定目标衰减因子,包括:从所述码流获取所述第一声道信号和所述第二声道信号的声道间电平差;根据所述声道间电平差确定所述目标衰减因子,或者,根据所述声道间电平差以及所述下混信号,确定所述目标衰减因子。
通过根据声道间电平差、下混信号等能够更为灵活更准确地确定目标衰减因子,进而能够根据该衰减因子对声道信号的初始混响参数进行更准确的调整。
结合第三方面,在第三方面的某些实现方式中,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
当目标衰减因子包括多个衰减因子时,能够根据目标衰减因子对混响增益参数进行更灵活的调整。
结合第三方面,在第三方面的某些实现方式中,所述目标声道信号包含第一频段和第二频段,所述第一频段中的子带对应的衰减因子小于或者等于所述第二频段中的子带对应的衰减因子,其中,所述第一频段的频率小于所述第二频段的频率。
通过为高频和低频子带对应的混响增益参数设置不同的大小的衰减因子,能够对低频子带和高频子带对应的混响增益参数进行不同程度的调整,能够在进行混响处理时取得更好的处理效果。
第四方面,提供了一种编码器,所述编码器包括用于执行所述第一方面或其各种实现方式中的方法的模块或单元。
第五方面,提供了一种编码器,所述编码器包括用于执行所述第二方面或其各种实现方式中的方法的模块或单元。
第六方面,提供了一种解码器,所述编码器包括用于执行所述第三方面或其各种实现方式中的方法的模块或单元。
第七方面,提供了一种编码器,包括存储器和处理器,所述存储器用于存储程序,所述处理器用于执行程序,当所述程序被执行时,所述处理器执行第一方面或其各种实现方式中的方法。
第八方面,提供了一种编码器,包括存储器和处理器,所述存储器用于存储程序,所述处理器用于执行程序,当所述程序被执行时,所述处理器执行第二方面或其各种实现方式中的方法。
第九方面,提供了一种解码器,包括存储器和处理器,所述存储器用于存储程序,所述处理器用于执行程序,当所述程序被执行时,所述处理器执行第三方面或其各种实现方式中的方法。
第十方面,提供一种计算机可读介质,所述计算机可读介质存储用于设备执行的程序代码,所述程序代码包括用于执行第一方面或其各种实现方式中的方法的指令。
第十一方面,提供一种计算机可读介质,所述计算机可读介质存储用于设备执行的程序代码,所述程序代码包括用于执行第二方面或其各种实现方式中的方法的指令。
第十二方面,提供一种计算机可读介质,所述计算机可读介质存储用于设备执行的程序代码,所述程序代码包括用于执行第三方面或其各种实现方式中的方法的指令。
附图说明
图1是现有技术对左右声道信号进行编码的示意性流程图。
图2是现有技术对左右声道信号进行解码的示意性流程图。
图3是本申请实施例的多声道信号的编码方法的示意性流程图。
图4是本申请实施例的多声道信号的解码方法的示意性流程图。
图5是本申请实施例的多声道信号的编码方法的示意性流程图。
图6是本申请实施例的多声道信号的编码方法的示意性流程图。
图7是本申请实施例的多声道信号的解码方法的示意性流程图。
图8是本申请实施例的编码器的示意性框图。
图9是本申请实施例的编码器的示意性框图。
图10是本申请实施例的解码器的示意性框图。
图11是本申请实施例的编码器的示意性框图。
图12是本申请实施例的编码器的示意性框图。
图13是本申请实施例的解码器的示意性框图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。为了更好地理解本申请实施例的多声道信号的编解码方法,下面先结合图1和图2对现有技术中对多声道信号进行编码和解码的方法进行简单的介绍。
图1示出了现有技术中对左右声道信号进行编码的过程。图1所示的编码过程具体包括:
110、对左声道信号(图中用L表示)和右声道信号(图中用R表示)进行空间参数分析以及下混处理。
具体地,步骤110具体包括:对左声道信号和右声道信号进行空间参数分析,获得左声道信号和右声道信号的空间参数;对左声道信号和右声道信号进行下混处理,得到下混信号(经过下混处理后得到的下混信号为单声道音频信号,通过下混处理将原来的两路声道音频信号变成了一路声道音频信号)。
空间参数(也可以称为空间感知参数)包含声道间相关性(Inter-channelCoherent,IC)、声道间电平差(Inter-channel Level Difference,ILD)、声道间时间差(Inter-channel Time Difference,ITD)以及声道间相位差(Inter-channel PhaseDifference,IPD)等。
其中,IC描述了声道间的互相关或相干性,该参数决定了声场范围的感知,可以提高音频信号空间感和声响稳定性。ILD用于分辨立体声源的水平方向角度,描述了声道间的强度差别,该参数将影响整个频谱的频率成分。ITD和IPD为表示声源水平方位的空间参数,描述了声道间的时间和相位差别,该参数主要影响2kHz以下的频率成分。对于两路声道信号而言,ITD可以表示立体声的左右声道信号之间的时间延时,IPD可以表示立体声的左右声道信号在时间对齐后的波形相似性。ILD、ITD和IPD能够决定人耳对声源位置的感知,可以有效确定声场位置,对立体声信号的恢复具有重要作用。
120、对下混信号进行编码,得到比特流。
130、对空间参数进行编码,得到比特流。
140、将对下混信号及空间参数编码得到的比特流进行复用得到码流。
编码得到的码流可以存储或者传输给解码端设备。
图2示出了现有技术中对左右声道信号进行解码的过程。图2所示的解码过程具体包括:
210、对比特流解复用,分别得到下混信号编码得到的码流以及空间参数编码得到的码流。
220、解码码流,得到左声道信号和右声道信号的下混信号,以及左声道信号和右声道信号的空间参数。
上述空间参数包括左声道信号和右声道信号的IC。
230、根据前面帧的下混信号和空间参数,得到去相关信号。
根据解码的当前帧的下混信号和去相关信号,得到左右声道信号;
240、根据空间参数及左右声道信号,得到最终输出的左右声道信号(图2中分别用L’和R’表示)。
应理解,步骤240中的左声道信号和右声道信号(在图2中分别用L’和R’表示)是解码得到的,与编码端编码的左右声道信号相比可能会有一定的失真。
具体地,可以通过对下混信号进行滤波处理,然后利用声道间相关性参数对滤波后得到的下混信号进行修正得到去相关信号。
生成去相关信号的目的是为了在解码端增加最终生成的立体声信号的混响感,增加立体声信号的声场宽度,使得输出的音频信号的听觉更加圆润饱满。所谓混响感,实质上是原始音频信号通过不同的反射折射等延时后和原始音频信号叠加在一起进入人耳的一种效果。
现有技术在获取IC后,没有考虑到不同声道间信号的相关性对该IC进行自适应的调整,这样在根据原来获取的IC对声道信号进行混响处理时反而可能会导致较差的听觉效果。例如,当不同声道信号之间的相关性较低时,如果仍采用之前获取的IC对去相关信号进行修正,然后再利用去相关信号对不同声道信号进行相同的混响处理的话就会导致解码端最终输出的声道信号的质量较差。也就是说,由于不同声道信号之间的差异较大,如果仍采用之前较大的IC修正后的去相关信号对不同声道信号进行混响处理的话,不仅不会增加声道信号的混响效果,还可能会导致输出的声道信号失真。
因此,本申请实施例提出了一种多声道信号的编解码方法,该方法能够根据不同声道信号之间的相关性,对混响增益参数进行相应的调整,并利用调整后的混响增益参数对去相关信号进行修正,然后再用该去相关信号对不同的声道信号进行混响处理,这样,在对不同声道信号进行混响处理时就考虑到了不同声道信号之间的相关性,使得输出的声道信号的质量更好。
图3是本申请实施例的多声道信号的编码方法的示意性流程图。图3的方法可以由编码端设备或者编码器来执行,图3的方法包括:
310、确定多声道信号中的第一声道信号和第二声道信号的下混信号以及第一声道信号和第二声道信号的初始混响增益参数。
应理解,在本申请实施例中,对确定下混信号与确定初始混响增益参数的先后顺序不做限定,既可以是同时进行,也可以是依次进行。
上述初始混响增益参数可以是指对第一声道信号和第二声道信号进行空间参数分析后获得的混响增益参数。
具体地,可以通过对上述多个声道信号进行下混处理得到下混信号;通过对上述第一声道信号和第二声道信号进行空间参数分析来获取该第一声道信号和第二声道信号的空间参数,该空间参数中包含第一声道信号和第二声道信号的初始混响增益参数。
应理解,上述第一声道信号和第二声道信号可以对应相同的空间参数,相应地,第一声道信号和第二声道信号也可以对应相同的初始混响增益参数。也就是说,第一声道信号的空间参数与第二声道信号的空间参数可以相同,第一声道信号的初始混响增益参数与第二声道信号的初始混响增益参数也可以相同。
进一步地,假设第一声道信号和第二声道信号均包含10个子带,每个子带分别对应1个混响增益参数,那么,第一声道信号和第二声道信号的索引值相同的子带对应的混响增益参数可以是相同的。
另外,上述第一声道信号、第二声道信号以及下混信号可以是经过归一化处理之后得到的声道信号。
320、根据第一声道信号、第二声道信号分别与下混信号的相关性,以及初始混响增益参数,确定第一声道信号和第二声道信号的目标混响增益参数。
可选地,第一声道信号或者第二声道信号与下混信号的相关性可以根据第一声道信号或者第二声道信号的能量与下混信号的能量的差异来确定,也可以根据第一声道信号或者第二声道信号的幅度与下混信号的幅度的差异来确定。
具体地,当第一声道信号的能量或者幅度与下混信号的能量或者幅度的差异较小时可以认为第一声道信号与下混信号的相关性较大,而当第一声道信号的能量或者幅度与下混信号的能量或者幅度的差异较大时可以认为第一声道信号与下混信号的相关性较小。
上述第一声道信号或者第二声道信号的能量与下混信号的能量差异具体可以是指第一声道信号或者第二声道信号的能量与下混信号的能量之间的差值,同样,上述第一声道信号和第二声道信号的幅度与下混信号的幅度的差异具体可以是指第一声道信号或者第二声道信号的幅度与下混信号的幅度的差值。
另外,上述第一声道信号或者第二声道信号与下混信号的相关性还可以是指第一声道信号或者第二声道信号的相位、周期与下混信号的相位、周期的差异等。
330、根据下混信号和目标混响增益参数,对第一声道信号和第二声道信号进行量化,
并将量化后的第一声道信号和第二声道信号写入码流。
应理解,当多声道信号的数目多于两路时,例如,当多声道信号包括第一声道信号、第二声道信号、第三声道信号以及第四声道信号时,可以对第一声道信号和第二声道信号采用图3的方法进行处理,对第三声道信号和第四声道信号也采用图3的方法进行处理。
本申请中,在确定声道信号的目标混响增益参数时,考虑到了声道信号与下混信号的相关性,这样能够在根据目标混响增益参数对声道信号进行混响处理时取得较好的处理效果,从而提升混响处理后的声道信号的质量。
可选地,作为一个实施例,根据第一声道信号、第二声道信号分别与下混信号的相关性,以及初始混响增益参数,确定第一声道信号和第二声道信号的目标混响增益参数,包括:根据第一声道信号、第二声道信号分别与下混信号的相关性,确定目标衰减因子;根据该目标衰减因子对上述初始混响增益参数进行调整,得到目标混响增益参数。
具体而言,上述根据第一声道信号、第二声道信号分别与下混信号的相关性,确定目标衰减因子既可以根据声道信号与下信号的相关性来计算目标衰减因子,也可以是考虑到声道信号与下混信号的相关性之后直接将预设的衰减因子确定为目标衰减因子。
通过衰减因子能够实现根据声道信号与下混信号的相关性的大小来灵活调整声道信号的初始混响增益参数。
例如,当上述第一声道信号和第二声道信号与下混信号的相关性较大时(此时也可以认为第一声道信号与第二声道信号比较相近),可以确定一个数值较小的目标衰减因子,而当上述第一声道信号和第二声道信号与下混信号的相关性较小时(此时也可以认为第一声道信号与第二声道信号相差较大),可以确定一个数值较大的目标衰减因子。
在一些实施例中,上述多个声道信号与下混信号的相关性可以是指上述多个声道信号的能量与下混信号的能量的差异,或者是指上述多个声道信号的幅度与下混信号的幅度的差异。上述多个声道信号的能量与下混信号的能量差异具体可以是多个声道信号的能量与下混信号的能量之间的差值,同样,上述多个声道信号的幅度与下混信号的幅度的差异具体可以是多个声道信号的幅度与下混信号的幅度的差值。另外,上述多个声道信号与下混信号的相关性还可以是多个声道信号的相位或者周期与下混信号的相位或者周期的差异等。
在一些实施例中,可以根据第一声道信号或者第二声道信号的能量与下混信号的能量的差异确定第一声道信号或者第二声道信号与下混信号的相关性,进而再确定目标衰减因子。
通过声道信号以及下混信号的能量能够较为方便地衡量第一声道信号、第二声道信号分别与下混信号的相关性,也就是说通过比较第一声道信号或者第二声道信号与下混信号的能量的差异,能够较为方便地确定目标衰减因子。
可选地,作为一个实施例,第一声道信号和第二声道信号均包含多个频点,根据第一声道信号、第二声道信号分别与下混信号的相关性,确定目标衰减因子,包括:确定第一声道信号和第二声道信号分别与下混信号在多个频点的能量的差异值;根据差异值确定目标衰减因子。
上述第一声道信号与下混信号在多个频点的能量的差异值可以是指第一声道信号和下混信号分别多个相同频点的能量的差异值。例如,第一声道信号包括三个频点(第一频点、第二频点和第三频点),那么,第一声道信号与下混信号在这三个频点的能量的差异值具体是指第一声道信号与下混信号在第一频点的差异值,第一声道信号与下混信号在第二频点的差异值,第一声道信号与下混信号在第三频点的差异值。
类似地,上述第二声道信号与下混信号在多个频点的能量的差异值可以是指第二声道信号和下混信号分别多个相同频点的能量的差异值。
可选地,上述第一声道信号与下混信号在多个频点的能量的差异值可以是指第一声道信号与下混信号分别在多个频点的能量的差值的绝对值的和,类似地,第二声道信号与下混信号在多个频点的能量的差异值可以是指第二声道信号与下混信号分别在多个频点的能量的差值的绝对值的和。
应理解,上述第一声道信号、第二声道信号以及下混信号的能量值可以是经过归一化处理后的数值。
通过比较第一声道信号、第二声道信号分别与下混信号在多个频点的能量的差异值,能够较为方便地确定第一声道信号、第二声道信号的能量分别与下混信号的能量的差异,进而确定衰减因子,而不必比较第一声道信号、第二声道信号分别与下混信号在全部频带上的能量的差异。
可选地,作为一个实施例,确定第一声道信号和所述第二声道信号的分别与下混信号的在多个频点的能量的差异值,包括:确定第一声道信号的能量与下混信号的能量的第一差异值,第一差异值用于指示第一声道信号与下混信号分别在多个频点的能量的差值的绝对值的和;确定第二声道信号的能量与下混信号的能量的第二差异值,第二差异值用于指示第一声道信号与下混信号分别在多个频点的能量的差值的绝对值的和;根据第一差异值和第二异差值确定目标衰减因子。
根据第一差异值和第二异差值确定目标衰减因子可以包括:根据第一差异值和第二差异值的比值确定目标衰减因子。
具体地,当上述第一声道信号为左声道信号,第二声道信号为右声道信号时,可以根据下列公式计算第一差异值和第二差异值。
Figure GPA0000275406720000121
Figure GPA0000275406720000131
其中,diff_l_h为第一差异值,diff_r_h为第二差异值,左声道信号和右声道信号的频段包括高频部分和低频部分,M1为高频部分的起始频点,M2为高频部分的结束频点,mag_l[k]为左声道信号在M1和M2之间的某个频点的能量或者幅度值,mag_r[k]为右声道信号在M1和M2之间的索引为k的频点的能量或者幅度值,mag_dmx[k]为下混信号在M1和M2之间的索引为k的频点的能量或幅度值,其中,mag_dmx[k]可以通过下混信号本身计算得到,也可以根据左右声道信号的能量或者幅度值计算得到的。
在根据第一差异值和第二差异值确定目标衰减因子时,可以直接将第一差异值与第二差异值的比值确定为目标衰减因子。例如,第一差异值为a,第二差异值为b,当a<b时,将a/b确定为目标衰减因子,当a>b时,将b/a确定为目标衰减因子。另外,在根据第一差异值和第二差异值确定了目标衰减因子后,可以再对目标衰减因子与之前帧的衰减因子进行一些平滑处理,利用平滑处理后的目标衰减因子再对上述多个声道信号的初始混响增益参数进行调整。
可选地,作为一个实施例,在根据上述差异值确定目标衰减因子之前,图3方法还包括:确定该差异值大于预设阈值。
应理解,这里的差异值大于预设阈值可以是指第一声道信号和第二声道信号分别与下混信号的能量的差异值均大于同一个预设阈值,也可以是指第一声道信号与下混信号的能量的差异大于预设的第一阈值,而第二声道信号与下混信号的能量的差异大于预设的第二阈值。
只有在第一声道信号、第二声道信号分别与下混信号的能量的差异值比较大时才会确定目标衰减因子,并根据目标衰减因子对初始混响增益参数进行调整,而在差值较小的情况下,可以不对初始混响增益参数进行调整,从而提高了编码效率。
例如,当第一声道信号与下混信号的能量的差异值大于第一声道信号能量的M(M位于0.5-1之间)倍时就可以认为第一声道与下混信号的能量的差异值大于预设阈值,此时,该预设阈值为第一声道信号能量的M倍。或者,当第一声道信号与下混信号的能量的差异值与第一声道信号的能量的比值大于M时也可以认为第一声道与下混信号的能量的差异值大于预设阈值。
而当多个声道信号与下混信号的能量的差异值小于预设阈值时,可以直接将多个声道信号的初始混响增益参数确定为该多个声道信号的目标混响增益参数。
可选地,作为一个实施例,下混信号的能量是根据所述第一声道信号和第二声道信号的能量确定的。
通过第一声道信号和第二声道信号的能量能够计算下混信号的能量,而不用再通过下混信号本身计算,能够简化一定的计算过程。
当然,在本申请实施例中,也可以直接根据下混信号本身来计算下混信号的能量。
可选地,作为一个实施例,上述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述多个声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
例如,上述第一声道信号和第二声道信号包含的子带的索引为0-9,第一声道信号和第二声道信号均包含10个混响增益参数,每个子带对应一个混响增益参数,目标衰减因子包含5个衰减因子,每个衰减因子对应两个子带,或者目标衰减因子包含10个衰减因子,每个衰减因子对应一个子带。
另外,当目标衰减因子包括多个衰减因子时,能够根据目标衰减因子对混响增益参数进行更灵活的调整。例如,多个声道信号的索引为0-4的子带对应的混响增益参数需要进行较小的调整,而声道信号的索引为5-9对应的混响增益参数需要进行较大的调整,那么,可以为索引为0-4的子带对应的混响增益参数设置较小的衰减因子,而为索引为5-9的子带对应的混响增益参数设置较大的衰减因子。
可选地,作为一个实施例,上述第一声道信号和第二声道信号(第一声道信号和第二声道信号占用的频段相同)包含第一频段和第二频段,第一频段中的子带对应的衰减因子小于或者等于第二频段中的子带对应的衰减因子,其中,第一频段的频率小于第二频段的频率。
例如,上述第一声道信号和第二声道信号所在的频段包括低频部分和高频部分,目标衰减因子包括多个衰减因子,其中,低频部分对应至少一个衰减因子,高频部分对应至少一个衰减因子,低频部分对应的衰减因子小于高频部分对应的衰减因子。
通过为高频和低频子带对应的混响增益参数设置不同的大小的衰减因子,能够对低频子带和高频子带对应的混响增益参数进行不同程度的调整,能够在进行混响处理时取得更好的处理效果。
图4示出了本申请实施例的多声道信号的编码方法的示意性流程图。在图4中,声道信号包括左声道信号和右声道信号,对左声道信号和右声道信号进行编码的过程具体包括:
410、计算左声道信号和右声道信号的空间参数。
上述空间参数包含了左声道信号和右声道信号的初始混响增益参数以及其它空间参数。
420、对左声道信号(图中用L表示)和右声道信号(图中用R表示)进行下混处理,得到下混信号。
430、确定左声道信号和右声道信号的能量分别与下混信号的能量的差值;
具体地,可以将左右声道信号分为高频部分和低频部分,将左右声道信号与下混信号在高频部分的能量的差值确定为左右声道信号的能量与下混信号的能量的差值。
440、根据左右声道信号的能量分别与下混信号的能量的差值,对左声道信号和右声道信号的混响增益参数进行调整。
具体而言,编码端可以根据左右声道信号的能量分别与下混信号的能量的差值,确定目标衰减因子,根据目标衰减因子对左右声道信号的混响增益参数进行调整。
450、对下混信号、调整后的混响增益参数以及其它空间参数进行量化,得到码流。
图5示出了本申请实施例的多声道信号的解码方法的示意性流程图。在图5中,声道信号包括左声道信号和右声道信号,图5可以对图4中的编码方法编码生成的码流进行解码,图5的解码过程具体包括:
510、获取左声道信号和右声道信号的码流。
520、解码码流获取下混信号。
530、解码码流获取左声道信号和右声道信号的空间参数。
该空间参数中包括经过编码端调整后的混响增益参数,也就是说,编码端是对调整后的混响增益参数进行编码,这样,解码端在对码流进行解码后就得到了编码端调整后的混响增益参数。
步骤520与步骤530没有先后关系,可以同时进行。
540、对解码得到的空间参数进行后续处理(例如,平滑滤波)。
550、根据解码得到的下混信号和混响增益参数(该混响增益参数是经过编码端调整后的混响增益参数),得到去相关信号。
560、根据步骤540处理过的空间参数及下混信号,进行上混处理,得到左声道信号和右声道信号。
570、根据去相关信号分别对左声道信号和右声道信号进行混响处理。
在图5所示的方法中,对左声道信号和右声道信号进行混响处理时依据的混响增益参数已经根据左右声道信号与下混信号的相关性进行了调整,这样就能根据左右声道信号之间的差异来进行相应的混响处理,提高了混响处理后得到的声道信号的质量。
图3的编码方法是编码端确定是否需要对声道信号的初始混响增益参数进行调整,如果需要调整的话就在编码端对声道信号的初始混响增益参数进行调整,并对调整后的混响增益参数进行编码,使得解码端直接根据解码得到的混响增益参数执行混响处理即可。
事实上,编码端也可以只确定声道信号的初始混响增益参数是否需要调整,如果需要调整的话就向编码端发送相应的指示信息,解码端在接收到该指示信息后,由解码端完成对声道信号的初始混响增益参数进行调整。
图6是本申请实施例的多声道信号的编码方法的示意性流程图。图6的方法包括:
610、确定多声道信号中的第一声道信号和第二声道信号的下混信号以及第一声道信号和第二声道信号的初始混响增益参数。
具体地,可以通过第一声道信号和第二声道信号进行下混处理得到下混信号,通过对第一声道信号和第二声道信号进行空间参数分析来获取空间参数,其中空间参数中包含第一声道信号和第二声道信号的初始混响增益参数。
应理解,确定下混信号与确定初始混响增益参数既可以是同时进行,也可以是依次进行。
应理解,上述第一声道信号和第二声道信号可以对应相同的空间参数,具体地,第一声道信号和第二声道信号也对应相同的初始混响增益参数。也就是说,第一声道信号的空间参数与第二声道信号的空间参数相同,第一声道信号的初始混响增益参数与第二声道信号的初始混响增益参数相同。
进一步地,假设第一声道信号和第二声道信号均包含10个子带,每个子带分别对应1个混响增益参数,那么,第一声道信号和第二声道信号的索引值相同的子带对应的混响增益参数可以是相同的。
620、根据第一声道信号、第二声道信号分别与下混信号的相关性,确定第一声道信号和所述第二声道信号的标识信息,该标识信息用于指示第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号。
可选地,第一声道信号或者第二声道信号与下混信号的相关性可以根据第一声道信号或者第二声道信号的能量与下混信号的能量的差异来确定,也可以根据第一声道信号或者第二声道信号的幅度与下混信号的幅度的差异来确定。
具体地,当第一声道信号的能量或者幅度与下混信号的能量或者幅度的差异较小时可以认为第一声道信号与下混信号的相关性较大,而当第一声道信号的能量或者幅度与下混信号的能量或者幅度的差异较大时可以认为第一声道信号与下混信号的相关性较小。
上述第一声道信号或者第二声道信号的能量与下混信号的能量差异具体可以是值第一声道信号或者第二声道信号的能量与下混信号的能量之间的差值,同样,上述第一声道信号和第二声道信号的幅度与下混信号的幅度的差异具体可以是指第一声道信号或者第二声道信号的幅度与下混信号的幅度的差值。
另外,上述第一声道信号或者第二声道信号与下混信号的相关性还可以是指第一声道信号或者第二声道信号的相位、周期与下混信号的相位、周期的差异等。
上述第一声道信号、第二声道信号以及下混信号可以是经过归一化处理之后得到的声道信号。
具体地,上述标识信息可以指示第一声道信号或者第二声道信号为需要调整初始混响增益参数的声道信号,也可以指示第一声道信号和第二声道信号为需要调整混响增益参数的声道信号,或者,也可以指示第一声道信号和第二声道信号均不需要调整混响增益参数。
在一些实施例中,标识信息可以通过标识位的取值来指示多个声道信号中需要调整初始混响增益参数的声道信号。例如,该标识信息的标识位占用两个比特,当标识位的取值为00时表示第一声道信号和第二声道信号的初始混响增益参数均不需要调整;当标识位的取值为01表示仅第一声道信号的初始混响增益参数需要调整;当标识位的取值为10时表示仅第二声道信号的初始混响增益参数需要调整;当标识位的取值为11时表示第一声道信号和第二声道信号的初始混响增益参数均需要调整。
在一些实施例中,根据第一声道信号、第二声道信号分别与下混信号的相关性,确定第一声道信号和第二声道信号的标识信息,包括:根据第一声道信号、第二声道信号的能量分别与下混信号的能量的相关性,确定第一声道信号和第二声道信号的标识信息。
通过声道信号以及下混信号的能量能够较为方便地衡量第一声道信号、第二声道信号分别与下混信号的相关性,从而能够较为方便地确定需要调整初始混响增益参数的声道信号。
在一些实施例中,下混信号的能量或者幅值可以根据第一声道信号和第二声道信号的能量来计算,从而简化一定的计算过程。或者,也可以直接根据下混信号本身来计算下混信号的能量。
630、根据下混信号、初始混响增益参数以及标识信息,对第一声道信号和第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
本申请中,通过判断声道信号与下混信号的能量的差值的大小与预设阈值的关系,能够在声道信号与下混信号的能量差异较大的情况下,将该声道信号确定为需要调整混响增益参数的声道信号,使得解码端能够先对该声道信号的初始混响增益参数进行调整后再对该声道信号进行混响处理,能够提升混响处理后的声道信号的质量。
可选地,作为一个实施例,根据第一声道信号、第二声道信号分别与下混信号的能量的相关性,确定第一声道信号和第二声道信号的标识信息,包括:确定第一差异值和第二差异值,第一差异值为第一声道信号与下混信号分别在多个频点的能量的差值的绝对值的和,第二差异值为第二声道信号与下混信号分别在多个频点的能量的差值的绝对值的和;根据第一差异值和第二差异值确定第一声道信号和第二声道信号的标识信息。
通过比较第一声道信号、第二声道信号分别与下混信号在多个频点的能量的差值,能够较为方便地确定第一声道信号、第二声道信号分别与下混信号的能量的差异,进而确定需要调整初始混响增益参数的声道信号,而不必比较第一声道信号、第二声道信号分别与下混信号在全部频带上的能量的差异。
可选地,根据第一差异值和第二差异值确定第一声道信号和第二声道信号的标识信息,包括:将第一差异值和第二差异值中的最大差异值确定为目标差异值;根据目标差异值确定所述标识信息,所述标识信息具体用于指示所述目标差异值对应的目标声道信号,所述目标差异值对应的声道信号为需要调整初始混响增益参数的声道信号。
具体地,当第一声道信号与下混信号在多个频点的能量的差值的绝对值的和大于第二声道信号与下混信号在多个频点的能量的差值的绝对值的和时,可以将第一声道信号确定为需要调整初始混响增益参数的声道信号。
而当多第一声道信号和第二声道信号分别与下混信号在多个频点的能量的差值的绝对值的和均比较大(例如,均大于预设阈值)时,可以确定另一个标识信息,该标识信息指示第一声道信号和第二声道信号的初始混响增益参数均需要调整。
具体地,在一些实施例中,根据第一声道信号或者第二声道信号与下混信号分别在多个频点的能量的差值的绝对值的和,确定第一声道信号和第二声道信号的标识信息,包括:在第一声道信号与下混信号分别在多个频点的能量的差值的绝对值的和大于预设阈值的情况下,生成第一标识信息,第一标识信息用于指示第一声道信号的初始混响增益参数需要调整;在第二声道信号与下混信号分别在多个频点的能量的差值的绝对值的和大于预设阈值的情况下,生成第二标识信息,第二标识信息用于指示第二声道信号的初始混响增益参数需要调整。
通过判断声道信号与下混信号的能量的差异值的大小与预设阈值的关系,能够在声道信号与下混信号的能量差异较大的情况下,将该声道信号确定为需要调整混响增益参数的声道信号,使得解码端能够先对该声道信号的初始混响增益参数进行调整后再对该声道信号进行混响处理,能够提升混响处理后的声道信号的质量。
应理解,上述第一声道信号和第二声道信号的标识信息既可以是一个标识信息,也可以是两个标识信息。例如,当第一声道信号和第二声道信号的初始混响增益参数均需要调整时,第一声道信号和第二声道信号的标识信息可以是一个标识信息,该标识信息指示第一声道信号和第二声道信号的初始混响增益参数均需要调整;或者,第一声道信号和第二声道信号的标识信息为两个标识信息,分别为第一标识信息和第二标识信息,第一标识信息用于指示第一声道信号的初始混响增益参数需要调整,第二标识信息用于指示第二声道信号的初始混响增益参数需要调整。当某个声道信号没有对应的标识信息时说明该声道信号的初始混响增益参数不需要调整,也就是说,当上述标识信息只包含第一标识信息时,那么第一声道信号和第二声道信号中只有第一声道信号的初始混响增益参数需要调整。
可选地,在一些实施例中,当第一声道信号的初始混响增益参数需要调整时,图6的方法还包括:根据上述第一差异值和第二差异值确定目标衰减因子,该目标衰减因子用于对目标声道信号的初始混响增益参数进行调整;对目标衰减因子进行量化,并将量化后的目标衰减因子写入码流。
通过衰减因子能够实现根据声道信号与下混信号的相关性的大小来灵活调整声道信号的初始混响增益参数。
应理解,上述第一差异值和第二差异值可以参照上文中的公式(1)和公式(2)进行计算。
在根据上述第一差异值和第二差异值确定目标衰减因子时可以根据第一差异值和第二差异值的比值来确定目标衰减因子。
在一些实施例中,上述目标衰减因子包括多个衰减因子,多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。例如,多声道信号包含多个子带,相邻的子带可以对应一个衰减因子。
当目标衰减因子包括多个衰减因子时,能够根据目标衰减因子对混响增益参数进行更灵活的调整。
在另一些实施例中,目标声道信号包含第一频段和第二频段,第一频段中的子带对应的衰减因子小于或者等于第二频段中的子带对应的衰减因子,其中,第一频段的频率小于第二频段的频率。
通过为高频和低频子带对应的混响增益参数设置不同的大小的衰减因子,能够对低频子带和高频子带对应的混响增益参数进行不同程度的调整,能够在进行混响处理时取得更好的处理效果。
例如,上述目标声道信号所在的频段包括低频部分和高频部分,目标衰减因子包括多个衰减因子,其中,低频部分对应至少一个衰减因子,高频部分对应至少一个衰减因子,低频部分对应的衰减因子小于高频部分对应的衰减因子。
在一些实施例中,下混信号的能量是根据所述第一声道信号和第二声道信号的能量确定的。
通过第一声道信号和第二声道信号的能量能够计算下混信号的能量,而不用再通过下混信号本身计算,能够简化一定的计算过程。
上文结合图6对本申请实施例的编码方法进行了详细的描述,下面结合图7对本申请实施例的解码方法进行描述,应理解,图7中的解码方法与图6中的编码方法是相对应的,为了简洁,下面适当省略重复的描述。
图7示出了本申请实施例的多声道信号的解码方法的示意性流程图。图7的方法可以由解码端设备或者解码器执行,图7的方法具体包括:
710、获取码流。
720、根据码流确定多声道信号中的第一声道信号和第二声道信号的下混信号、第一声道信号和第二声道信号的初始混响增益参数以及第一声道信号和第二声道信号的标识信息,其中,所述标识信息用于指示所述第一声道信号和第二声道信号中需要调整初始混响增益参数的声道信号。
730、根据标识信息确定第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号为目标声道信号。
740、对目标声道信号的初始混响增益参数进行调整。
本申请中,能够通过标识信息确定需要调整初始混响增益参数的声道信号,并在对该声道信号进行混响处理之前调整该声道信号的初始混响增益参数,能够提升混响处理后的声道信号的质量。
可选地,作为一个实施例,对目标声道信号的初始混响增益参数进行调整,包括:确定目标衰减因子;根据目标衰减因子对目标声道信号的初始混响增益参数进行调整,得到目标声道信号的目标混响增益参数。
通过衰减因子能够实现根据声道信号与下混信号的相关性的大小来灵活调整声道信号的初始混响增益参数。
解码端在确定衰减因子时,可以将预设的衰减因子确定为目标衰减因子。或者是解码端直接根据预设的衰减因子对目标声道信号的初始混响增益参数进行调整。
通过预先设置衰减因子,能够简化确定目标衰减因子的过程,进而提高解码的效率。
在一些实施例中,解码端可以从多个声道信号的码流中获取目标衰减因子,也就是说通过解码多个声道信号的码流来获取目标衰减因子,在这种情况下,解码端已经确定了目标衰减因子,并且将目标衰减因子编码得到码流传输到解码端,这样解码端不必再计算目标衰减因子,而是直接从码流中解码获得目标衰减因子。
当码流中包含目标衰减因子时,可以直接通过在码流中获取目标衰减因子也能够简化确定目标衰减因子的过程,能够提高解码的效率。
可选地,作为一个实施例,确定目标衰减因子具体包括:从码流获取第一声道信号和第二声道信号的声道间电平差;根据声道间电平差确定目标衰减因子,或者,根据声道间电平差和下混信号确定目标衰减因子。
通过根据声道间电平差、下混信号等能够更为灵活更准确地确定目标衰减因子,进而能够根据该衰减因子对声道信号的初始混响参数进行更准确的调整。
具体地,当声道间电平差较大时,可以认为第一声道信号与第二声道信号之间的差异较大,相关性较小,此时可以确定一个数值较大的衰减因子作为目标衰减因子。
另外,在根据下混信号确定目标衰减因子时,可以利用下混信号的周期性和谐波性来确定目标衰减因子。例如,当下混信号的周期性或者谐波性较好时,可以认为第一声道信号与第二声道信号之间的差异较小,相关性较大,此时可以确定一个数值较小的衰减因子作为目标衰减因子。
可选地,作为一个实施例,上述目标衰减因子包括多个衰减因子,其中,该多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。例如,第一声道信号和第二声道信号包含多个子带,相邻的多个子带可以对应一个衰减因子。
当目标衰减因子包括多个衰减因子时,能够根据目标衰减因子对混响增益参数进行更灵活的调整。
在另一些实施例中,目标声道信号包含第一频段和第二频段,第一频段中的子带对应的衰减因子小于或者等于第二频段中的子带对应的衰减因子,其中,第一频段的频率小于第二频段的频率。
通过为高频和低频子带对应的混响增益参数设置不同的大小的衰减因子,能够对低频子带和高频子带对应的混响增益参数进行不同程度的调整,能够在进行混响处理时取得更好的处理效果。
例如,目标声道信号所在的频段包括低频部分和高频部分,目标衰减因子包括多个衰减因子,其中,低频部分对应至少一个衰减因子,高频部分对应至少一个衰减因子,低频部分对应的衰减因子小于高频部分对应的衰减因子。
上文结合图3至图7对本申请实施例的编解码方法进行了详细的描述,下面结合图8至图13对本申请实施例的编码器和解码器进行描述,应理解,图8至图13中的编码器和解码器能够实现本申请实施例的编解码方法中由编码器和解码器执行的步骤。为了简洁,下面适当省略重复的描述。
图8是本申请实施例的编码器的示意性框图。图8的编码器800包括:
处理单元810,用于确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数;
所述处理单元810还用于根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,以及所述初始混响增益参数,确定所述第一声道信号和所述第二声道信号的目标混响增益参数;
编码单元820,用于根据所述下混信号和所述目标混响增益参数,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
上述编码器800可以对应于图3的多声道信号的编码方法,编码器800可以执行图3中的多声道信号的编码方法。
本申请中,在确定声道信号的目标混响增益参数时,考虑到了声道信号与下混信号的相关性,这样能够在根据目标混响增益参数对声道信号进行混响处理时取得较好的处理效果,从而提升混响处理后的声道信号的质量。
可选地,作为一个实施例,所述处理单元810具体用于:根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定目标衰减因子;根据所述目标衰减因子对所述初始混响增益参数进行调整,得到所述目标混响增益参数。
可选地,作为一个实施例,所述第一声道信号和所述第二声道信号均包含多个频点,所述处理单元810具体用于:确定所述第一声道信号和所述第二声道信号的能量分别与所述下混信号在所述多个频点的能量的差异值;根据所述差异值确定所述目标衰减因子。
可选地,作为一个实施例,所述处理单元810具体用于:确定所述第一声道信号的能量与所述下混信号的能量的第一差异值,所述第一差异值用于指示所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;确定所述第二声道信号的能量与所述下混信号的能量的第二差异值,所述第二差异值用于指示所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;根据所述第一差异值和所述第二差异值的比值,确定所述目标衰减因子。
可选地,作为一个实施例,在根据所述差异值确定所述目标衰减因子之前,所述处理单元810具体还用于:确定所述差异值大于预设阈值。
可选地,作为一个实施例,所述下混信号的能量是根据所述第一声道信号和第二声道信号的能量确定的。
可选地,作为一个实施例,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述多个声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
图9是本申请实施例的编码器的示意性框图。图9的编码器900包括:
处理单元910,用于确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数;
所述处理单元910还用于根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号;
编码单元920,用于根据所述下混信号、所述初始混响增益参数以及所述标识信息,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
在本申请中,能够根据声道信号与下混信号的相关性来确定需要调整初始混响增益参数的声道信号,使得解码端能够先对某些声道信号的初始混响增益参数进行调整后再对这些声道信号进行混响处理,能够提升混响处理后的声道信号的质量。
应理解,上述编码器900可以对应于图6的多声道信号的编码方法,编码器900可以执行图6中的多声道信号的编码方法。
可选地,作为一个实施例,所述处理单元910具体用于:根据所述第一声道信号、所述第二声道信号的能量分别与所述下混信号的能量的相关性,确定所述第一声道信号和所述第二声道信号的标识信息。
可选地,作为一个实施例,处理单元910具体用于:确定第一差异值和第二差异值,所述第一差异值为所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和,所述第二差异值为所述第二声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;根据所述第一差异值和所述第二差异值确定所述第一声道信号和所述第二声道信号的标识信息。
可选地,作为一个实施例,处理单元910具体用于:将所述第一差异值和所述第二差异值中的最大差异值确定为目标差异值;根据目标差异值确定所述标识信息,所述标识信息具体用于指示所述目标差异值对应的声道信号,所述目标差异值对应的声道信号为需要调整初始混响增益参数的声道信号。
可选地,作为一个实施例,所述处理单元910具体还用于:根据所述第一差异值和所述第二差异值确定目标衰减因子,所述目标衰减因子用于对所述目标声道信号的初始混响增益参数进行调整;对所述目标衰减因子进行量化,并将量化后的目标衰减因子写入所述码流。
可选地,作为一个实施例,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
可选地,作为一个实施例,所述下混信号的能量是根据所述第一声道信号和所述第二声道信号的能量确定的。
图10是本申请实施例的解码器的示意性框图。图10的解码器1000包括:
获取单元1010,用于获取码流;
处理单元1020,用于根据所述码流确定多声道信号中的第一声道信号和第二声道信号的下混信号、所述第一声道信号和所述第二声道信号的初始混响增益参数以及所述第一声道信号和所述第二声道信号的标识信息,其中,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号;
所述处理单元1020还用于根据所述标识信息确定所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号为目标声道信号;
所述处理单元1020还用于对所述目标声道信号的初始混响增益参数进行调整。
本申请中,能够通过标识信息确定需要调整初始混响增益参数的声道信号,并在对该声道信号进行混响处理之前调整该声道信号的初始混响增益参数,能够提升混响处理后的声道信号的质量。
应理解,上述解码器1000可以对应于图7的多声道信号的解码方法,解码器1000可以执行图7中的多声道信号的解码方法。
可选地,作为一个实施例,所述处理单元1020具体用于:确定目标衰减因子;根据所述目标衰减因子对所述目标声道信号的初始混响增益参数进行调整,得到所述目标声道信号的目标混响增益参数。
可选地,作为一个实施例,所述处理单元1020具体用于:将预设的衰减因子确定为所述目标衰减因子。
可选地,作为一个实施例,所述处理单元1020具体用于:根据所述码流获取所述目标衰减因子。
可选地,作为一个实施例,所述处理单元1020具体用于:从所述码流获取所述第一声道信号和所述第二声道信号的声道间电平差;根据所述声道间电平差确定所述目标衰减因子,或者,根据所述声道间电平差以及所述下混信号,确定所述目标衰减因子。
可选地,作为一个实施例,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
图11是本申请实施例的编码器的示意性框图。图11的编码器1100包括:
存储器1110,用于存储程序;
处理器1120,用于执行程序,当所述程序被执行时,所述处理器1120用于确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数;根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,以及所述初始混响增益参数,确定所述第一声道信号和所述第二声道信号的目标混响增益参数;根据所述下混信号和所述目标混响增益参数,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
上述编码器1100可以对应于图3的多声道信号的编码方法,编码器1100可以执行图3中的多声道信号的编码方法。
本申请中,在确定声道信号的目标混响增益参数时,考虑到了声道信号与下混信号的相关性,这样能够在根据目标混响增益参数对声道信号进行混响处理时取得更好的处理效果,从而提升混响处理后的声道信号的质量。
可选地,作为一个实施例,所述处理器1120具体用于:根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定目标衰减因子;根据所述目标衰减因子对所述初始混响增益参数进行调整,得到所述目标混响增益参数。
可选地,作为一个实施例,所述第一声道信号和所述第二声道信号均包含多个频点,所述处理器1120具体用于:确定所述第一声道信号和所述第二声道信号的能量分别与所述下混信号在所述多个频点的能量的差异值;根据所述差异值确定所述目标衰减因子。
可选地,作为一个实施例,所述处理器1120具体用于:确定所述第一声道信号的能量与所述下混信号的能量的第一差异值,所述第一差异值用于指示所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;确定所述第二声道信号的能量与所述下混信号的能量的第二差异值,所述第二差异值用于指示所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;根据所述第一差异值和所述第二差异值的比值,确定所述目标衰减因子。
可选地,作为一个实施例,在根据所述差异值确定所述目标衰减因子之前,所述处理器1120具体还用于:确定所述差异值大于预设阈值。
可选地,作为一个实施例,所述下混信号的能量是根据所述第一声道信号和第二声道信号的能量确定的。
可选地,作为一个实施例,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述多个声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
图12是本申请实施例的编码器的示意性框图。图12的编码器1200包括:
存储器1210,用于存储程序;
处理器1220,用于执行程序,当所述程序被执行时,所述处理器1220用于确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数;根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号;根据所述下混信号、所述初始混响增益参数以及所述标识信息,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
在本申请中,能够根据声道信号与下混信号的相关性来确定需要调整初始混响增益参数的声道信号,使得解码端能够先对某些声道信号的初始混响增益参数进行调整后再对这些声道信号进行混响处理,能够提升混响处理后的声道信号的质量。
应理解,上述编码器1200可以对应于图6的多声道信号的编码方法,编码器1200可以执行图6中的多声道信号的编码方法。
可选地,作为一个实施例,所述处理器1220具体用于:根据所述第一声道信号、所述第二声道信号的能量分别与所述下混信号的能量的相关性,确定所述第一声道信号和所述第二声道信号的标识信息。
可选地,作为一个实施例,处理器1220具体用于:确定第一差异值和第二差异值,所述第一差异值为所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和,所述第二差异值为所述第二声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;根据所述第一差异值和所述第二差异值确定所述第一声道信号和所述第二声道信号的标识信息。
可选地,作为一个实施例,处理器1220具体用于:将所述第一差异值和所述第二差异值中的最大差异值确定为目标差异值;根据目标差异值确定所述标识信息,所述标识信息具体用于指示所述目标差异值对应的声道信号,所述目标差异值对应的声道信号为需要调整初始混响增益参数的声道信号。
可选地,作为一个实施例,所述处理器1220具体还用于:根据所述第一差异值和所述第二差异值确定目标衰减因子,所述目标衰减因子用于对所述目标声道信号的初始混响增益参数进行调整;对所述目标衰减因子进行量化,并将量化后的目标衰减因子写入所述码流。
可选地,作为一个实施例,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
可选地,作为一个实施例,所述下混信号的能量是根据所述第一声道信号和所述第二声道信号的能量确定的。
图13是本申请实施例的解码器的示意性框图。图13的解码器1300包括:
存储器1310,用于存储程序;
处理器1320,用于执行程序,当所述程序被执行时,所述处理器1320用于获取码流;根据所述码流确定多声道信号中的第一声道信号和第二声道信号的下混信号、所述第一声道信号和所述第二声道信号的初始混响增益参数以及所述第一声道信号和所述第二声道信号的标识信息,其中,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号;根据所述标识信息确定所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号为目标声道信号;对所述多个声道信号的初始混响增益参数进行调整。
本申请中,能够通过标识信息确定需要调整初始混响增益参数的声道信号,并在对该声道信号进行混响处理之前调整该声道信号的初始混响增益参数,能够提升混响处理后的声道信号的质量。
应理解,上述解码器1300可以对应于图7的多声道信号的解码方法,解码器1300可以执行图7中的多声道信号的解码方法。
可选地,作为一个实施例,所述处理器1320具体用于:确定目标衰减因子;根据所述目标衰减因子对所述目标声道信号的初始混响增益参数进行调整,得到所述目标声道信号的目标混响增益参数。
可选地,作为一个实施例,所述处理器1320具体用于:将预设的衰减因子确定为所述目标衰减因子。
可选地,作为一个实施例,所述处理器1320具体用于:根据所述码流获取所述目标衰减因子。
可选地,作为一个实施例,所述处理器1320具体用于:从所述码流获取所述第一声道信号和所述第二声道信号的声道间电平差;根据所述声道间电平差确定所述目标衰减因子,或者,根据所述声道间电平差以及所述下混信号,确定所述目标衰减因子。
可选地,作为一个实施例,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (40)

1.一种多声道信号的编码方法,其特征在于,包括:
确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数,所述初始混响增益参数是经过空间参数分析后获得的混响增益参数;
根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,以及所述初始混响增益参数,确定所述第一声道信号和所述第二声道信号的目标混响增益参数;
根据所述下混信号和所述目标混响增益参数,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,以及所述初始混响增益参数,确定所述第一声道信号和所述第二声道信号的目标混响增益参数,包括:
根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定目标衰减因子;
根据所述目标衰减因子对所述初始混响增益参数进行调整,得到所述目标混响增益参数。
3.如权利要求2所述的方法,其特征在于,所述第一声道信号和所述第二声道信号均包含多个频点,所述根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定目标衰减因子,包括:
确定所述第一声道信号和所述第二声道信号分别与所述下混信号在所述多个频点的能量的差异值;
根据所述差异值确定所述目标衰减因子。
4.如权利要求3所述的方法,其特征在于,所述确定所述第一声道信号和所述第二声道信号分别与所述下混信号在所述多个频点的能量的差异值,包括:
确定所述第一声道信号的能量与所述下混信号的能量的第一差异值,所述第一差异值用于指示所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;
确定所述第二声道信号的能量与所述下混信号的能量的第二差异值,所述第二差异值用于指示所述第二声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;
所述根据所述差异值确定所述目标衰减因子,包括:
根据所述第一差异值和所述第二差异值的比值,确定所述目标衰减因子。
5.如权利要求3或4所述的方法,其特征在于,在根据所述差异值确定所述目标衰减因子之前,所述方法还包括:
确定所述差异值大于预设阈值。
6.如权利要求3或4所述的方法,其特征在于,所述下混信号的能量是根据所述第一声道信号和第二声道信号的能量确定的。
7.如权利要求2-4中任一项所述的方法,其特征在于,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述多个声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
8.一种多声道信号的编码方法,其特征在于,包括:
确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数,所述初始混响增益参数是经过空间参数分析后获得的混响增益参数;
根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号;
根据所述下混信号、所述初始混响增益参数以及所述标识信息,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
9.如权利要求8所述的方法,其特征在于,所述根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,包括:
根据所述第一声道信号、所述第二声道信号的能量分别与所述下混信号的能量的相关性,确定所述第一声道信号和所述第二声道信号的标识信息。
10.如权利要求9所述的方法,其特征在于,所述根据所述第一声道信号、所述第二声道信号分别与所述下混信号的能量的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,包括:
确定第一差异值和第二差异值,所述第一差异值为所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和,所述第二差异值为所述第二声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;
根据所述第一差异值和所述第二差异值确定所述第一声道信号和所述第二声道信号的标识信息。
11.如权利要求10所述的方法,其特征在于,根据所述第一差异值和所述第二差异值确定所述第一声道信号和所述第二声道信号的标识信息,包括:
将所述第一差异值和所述第二差异值中的最大差异值确定为目标差异值;
根据目标差异值确定所述标识信息,所述标识信息具体用于指示所述目标差异值对应的声道信号,所述目标差异值对应的声道信号为需要调整初始混响增益参数的声道信号。
12.如权利要求11所述的方法,其特征在于,所述方法还包括:
根据所述第一差异值和所述第二差异值确定目标衰减因子,所述目标衰减因子用于对所述目标声道信号的初始混响增益参数进行调整;
对所述目标衰减因子进行量化,并将量化后的目标衰减因子写入所述码流。
13.如权利要求12所述的方法,其特征在于,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
14.如权利要求9-13中任一项所述的方法,其特征在于,所述下混信号的能量是根据所述第一声道信号和所述第二声道信号的能量确定的。
15.一种多声道信号的解码方法,其特征在于,包括:
获取码流;
根据所述码流确定多声道信号中的第一声道信号和第二声道信号的下混信号、所述第一声道信号和所述第二声道信号的初始混响增益参数以及所述第一声道信号和所述第二声道信号的标识信息,其中,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号,所述初始混响增益参数是经过空间参数分析后获得的混响增益参数;
根据所述标识信息确定所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号为目标声道信号;
对所述目标声道信号的初始混响增益参数进行调整。
16.如权利要求15所述的方法,其特征在于,所述对所述目标声道信号的初始混响增益参数进行调整,包括:
确定目标衰减因子;
根据所述目标衰减因子对所述目标声道信号的初始混响增益参数进行调整,得到所述目标声道信号的目标混响增益参数。
17.如权利要求16所述的方法,其特征在于,所述确定目标衰减因子,包括:
将预设的衰减因子确定为所述目标衰减因子。
18.如权利要求16所述的方法,其特征在于,所述确定目标衰减因子,包括:
根据所述码流获取所述目标衰减因子。
19.如权利要求16所述的方法,其特征在于,所述确定目标衰减因子,包括:
从所述码流获取所述第一声道信号和所述第二声道信号的声道间电平差;
根据所述声道间电平差确定所述目标衰减因子,或者,
根据所述声道间电平差以及所述下混信号,确定所述目标衰减因子。
20.如权利要求16-19中任一项所述的方法,其特征在于,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
21.一种编码器,其特征在于,包括:
处理单元,用于确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数,所述初始混响增益参数是经过空间参数分析后获得的混响增益参数;
所述处理单元还用于根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,以及所述初始混响增益参数,确定所述第一声道信号和所述第二声道信号的目标混响增益参数;
编码单元,用于根据所述下混信号和所述目标混响增益参数,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
22.如权利要求21所述的编码器,其特征在于,所述处理单元具体用于:
根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定目标衰减因子;
根据所述目标衰减因子对所述初始混响增益参数进行调整,得到所述目标混响增益参数。
23.如权利要求22所述的编码器,其特征在于,所述第一声道信号和所述第二声道信号均包含多个频点,所述处理单元具体用于:
确定所述第一声道信号和所述第二声道信号的能量分别与所述下混信号在所述多个频点的能量的差异值;
根据所述差异值确定所述目标衰减因子。
24.如权利要求23所述的编码器,其特征在于,所述处理单元具体用于:
确定所述第一声道信号的能量与所述下混信号的能量的第一差异值,所述第一差异值用于指示所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;
确定所述第二声道信号的能量与所述下混信号的能量的第二差异值,所述第二差异值用于指示所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;
根据所述第一差异值和所述第二差异值的比值,确定所述目标衰减因子。
25.如权利要求23或24所述的编码器,其特征在于,在根据所述差异值确定所述目标衰减因子之前,所述处理单元具体还用于:
确定所述差异值大于预设阈值。
26.如权利要求23或24中任一项所述的编码器,其特征在于,所述下混信号的能量是根据所述第一声道信号和第二声道信号的能量确定的。
27.如权利要求22-24中任一项所述的编码器,其特征在于,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述多个声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
28.一种编码器,其特征在于,包括:
处理单元,用于确定多声道信号中的第一声道信号和第二声道信号的下混信号以及所述第一声道信号和所述第二声道信号的初始混响增益参数,所述初始混响增益参数是经过空间参数分析后获得的混响增益参数;
所述处理单元还用于根据所述第一声道信号、所述第二声道信号分别与所述下混信号的相关性,确定所述第一声道信号和所述第二声道信号的标识信息,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号;
编码单元,用于根据所述下混信号、所述初始混响增益参数以及所述标识信息,对所述第一声道信号和所述第二声道信号进行量化,并将量化后的第一声道信号和第二声道信号写入码流。
29.如权利要求28所述的编码器,其特征在于,所述处理单元具体用于:
根据所述第一声道信号、所述第二声道信号的能量分别与所述下混信号的能量的相关性,确定所述第一声道信号和所述第二声道信号的标识信息。
30.如权利要求29所述的编码器,其特征在于,处理单元具体用于:
确定第一差异值和第二差异值,所述第一差异值为所述第一声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和,所述第二差异值为所述第二声道信号与所述下混信号分别在多个频点的能量的差值的绝对值的和;
根据所述第一差异值和所述第二差异值确定所述第一声道信号和所述第二声道信号的标识信息。
31.如权利要求30所述的编码器,其特征在于,处理单元具体用于:
将所述第一差异值和所述第二差异值中的最大差异值确定为目标差异值;
根据目标差异值确定所述标识信息,所述标识信息具体用于指示所述目标差异值对应的声道信号,所述目标差异值对应的声道信号为需要调整初始混响增益参数的声道信号。
32.如权利要求31所述的编码器,其特征在于,所述处理单元还用于:
根据所述第一差异值和所述第二差异值确定目标衰减因子,所述目标衰减因子用于对所述目标声道信号的初始混响增益参数进行调整;
对所述目标衰减因子进行量化,并将量化后的目标衰减因子写入所述码流。
33.如权利要求32所述的编码器,其特征在于,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
34.如权利要求29-33中任一项所述的编码器,其特征在于,所述下混信号的能量是根据所述第一声道信号和所述第二声道信号的能量确定的。
35.一种解码器,其特征在于,包括:
获取单元,用于获取码流;
处理单元,用于根据所述码流确定多声道信号中的第一声道信号和第二声道信号的下混信号、所述第一声道信号和所述第二声道信号的初始混响增益参数以及所述第一声道信号和所述第二声道信号的标识信息,其中,所述标识信息用于指示所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号,所述初始混响增益参数是经过空间参数分析后获得的混响增益参数;
所述处理单元还用于根据所述标识信息确定所述第一声道信号和所述第二声道信号中需要调整初始混响增益参数的声道信号为目标声道信号;
所述处理单元还用于对所述目标声道信号的初始混响增益参数进行调整。
36.如权利要求35所述的解码器,其特征在于,所述处理单元具体用于:
确定目标衰减因子;
根据所述目标衰减因子对所述目标声道信号的初始混响增益参数进行调整,得到所述目标声道信号的目标混响增益参数。
37.如权利要求36所述的解码器,其特征在于,所述处理单元具体用于:
将预设的衰减因子确定为所述目标衰减因子。
38.如权利要求36所述的解码器,其特征在于,所述处理单元具体用于:
根据所述码流获取所述目标衰减因子。
39.如权利要求36所述的解码器,其特征在于,所述处理单元具体用于:
从所述码流获取所述第一声道信号和所述第二声道信号的声道间电平差;
根据所述声道间电平差确定所述目标衰减因子,或者,
根据所述声道间电平差以及所述下混信号,确定所述目标衰减因子。
40.如权利要求36-39中任一项所述的解码器,其特征在于,所述目标衰减因子包括多个衰减因子,所述多个衰减因子中的每个衰减因子分别对应所述目标声道信号的至少一个子带,并且任意一个子带仅对应一个衰减因子。
CN201880022744.XA 2017-03-31 2018-03-01 多声道信号的编解码方法和编解码器 Active CN110462733B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2017102058212 2017-03-31
CN201710205821.2A CN108665902B (zh) 2017-03-31 2017-03-31 多声道信号的编解码方法和编解码器
PCT/CN2018/077782 WO2018177066A1 (zh) 2017-03-31 2018-03-01 多声道信号的编解码方法和编解码器

Publications (2)

Publication Number Publication Date
CN110462733A CN110462733A (zh) 2019-11-15
CN110462733B true CN110462733B (zh) 2022-05-10

Family

ID=63674221

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201710205821.2A Active CN108665902B (zh) 2017-03-31 2017-03-31 多声道信号的编解码方法和编解码器
CN201880022744.XA Active CN110462733B (zh) 2017-03-31 2018-03-01 多声道信号的编解码方法和编解码器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201710205821.2A Active CN108665902B (zh) 2017-03-31 2017-03-31 多声道信号的编解码方法和编解码器

Country Status (8)

Country Link
US (2) US11386907B2 (zh)
EP (2) EP3917171B1 (zh)
JP (3) JP6804666B2 (zh)
KR (1) KR102281097B1 (zh)
CN (2) CN108665902B (zh)
BR (1) BR112019020468A2 (zh)
ES (1) ES2882626T3 (zh)
WO (1) WO2018177066A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665902B (zh) * 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN108694955B (zh) 2017-04-12 2020-11-17 华为技术有限公司 多声道信号的编解码方法和编解码器
CN111654745B (zh) * 2020-06-08 2022-10-14 海信视像科技股份有限公司 多声道的信号处理方法及显示设备
CN113985780B (zh) * 2021-10-28 2024-01-12 中国人民解放军战略支援部队信息工程大学 多通道远程控制装置及方法、存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665902A (zh) * 2017-03-31 2018-10-16 华为技术有限公司 多声道信号的编解码方法和编解码器

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ITMI20031258A1 (it) 2003-06-20 2004-12-21 Nextec Srl Procedimento e macchina per impermeabilizzare semilavorati di calzature, capi ed accessori di abbigliamento, e semilavorati ottenuti con tale procedimento o macchina.
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
CA2572805C (en) * 2004-07-02 2013-08-13 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
EP1913576A2 (en) * 2005-06-30 2008-04-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP2007025290A (ja) * 2005-07-15 2007-02-01 Matsushita Electric Ind Co Ltd マルチチャンネル音響コーデックにおける残響を制御する装置
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
KR101277041B1 (ko) * 2005-09-01 2013-06-24 파나소닉 주식회사 멀티 채널 음향 신호 처리 장치 및 방법
WO2007049881A1 (en) 2005-10-26 2007-05-03 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
CN101356573B (zh) * 2006-01-09 2012-01-25 诺基亚公司 对双耳音频信号的解码的控制
US8560303B2 (en) * 2006-02-03 2013-10-15 Electronics And Telecommunications Research Institute Apparatus and method for visualization of multichannel audio signals
US7965848B2 (en) 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
CN101166377A (zh) * 2006-10-17 2008-04-23 施伟强 一种多语种环绕立体声的低码率编解码方案
KR20080052813A (ko) * 2006-12-08 2008-06-12 한국전자통신연구원 채널별 신호 분포 특성을 반영한 오디오 코딩 장치 및 방법
KR20080066537A (ko) * 2007-01-12 2008-07-16 엘지전자 주식회사 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
CN101149925B (zh) * 2007-11-06 2011-02-16 武汉大学 一种用于参数立体声编码的空间参数选取方法
CN101572088A (zh) * 2008-04-30 2009-11-04 北京工业大学 立体声编解码方法、编解码器及编解码系统
EP2144229A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient use of phase information in audio encoding and decoding
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
CN103561378B (zh) 2008-07-31 2015-12-23 弗劳恩霍夫应用研究促进协会 双耳信号的信号生成
CN101673548B (zh) * 2008-09-08 2012-08-08 华为技术有限公司 参数立体声编码方法、装置和参数立体声解码方法、装置
KR101342425B1 (ko) * 2008-12-19 2013-12-17 돌비 인터네셔널 에이비 다중-채널의 다운믹싱된 오디오 입력 신호에 리버브를 적용하기 위한 방법 및 다중-채널의 다운믹싱된 오디오 입력 신호에 리버브를 적용하도록 구성된 리버브레이터
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN102307323B (zh) * 2009-04-20 2013-12-18 华为技术有限公司 对多声道信号的声道延迟参数进行修正的方法
JP5793675B2 (ja) 2009-07-31 2015-10-14 パナソニックIpマネジメント株式会社 符号化装置および復号装置
JP5645951B2 (ja) * 2009-11-20 2014-12-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ダウンミックス信号表現に基づくアップミックス信号を提供する装置、マルチチャネルオーディオ信号を表しているビットストリームを提供する装置、方法、コンピュータプログラム、および線形結合パラメータを使用してマルチチャネルオーディオ信号を表しているビットストリーム
US8540177B2 (en) * 2009-11-20 2013-09-24 Penta TMR Inc. Vertical feed mixer having cutout edge
JP5333257B2 (ja) 2010-01-20 2013-11-06 富士通株式会社 符号化装置、符号化システムおよび符号化方法
CN102157151B (zh) * 2010-02-11 2012-10-03 华为技术有限公司 一种多声道信号编码方法、解码方法、装置和系统
JP5299327B2 (ja) 2010-03-17 2013-09-25 ソニー株式会社 音声処理装置、音声処理方法、およびプログラム
CN103403800B (zh) * 2011-02-02 2015-06-24 瑞典爱立信有限公司 确定多声道音频信号的声道间时间差
KR101842258B1 (ko) * 2011-09-14 2018-03-27 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
EP2917908A1 (de) 2012-11-09 2015-09-16 Storming Swiss Sàrl Nichtlineare inverse kodierung von multikanal-signalen
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
CN105074818B (zh) * 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
EP2840811A1 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
CN103700372B (zh) * 2013-12-30 2016-10-05 北京大学 一种基于正交解相关技术的参数立体声编码、解码方法
CN104995915B (zh) * 2015-02-05 2018-11-30 华为技术有限公司 编解码方法和编解码器
CN105405445B (zh) * 2015-12-10 2019-03-22 北京大学 一种基于声道间传递函数的参数立体声编码、解码方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665902A (zh) * 2017-03-31 2018-10-16 华为技术有限公司 多声道信号的编解码方法和编解码器

Also Published As

Publication number Publication date
BR112019020468A2 (pt) 2020-04-28
CN108665902B (zh) 2020-12-01
EP3588497B1 (en) 2021-05-12
JP7035154B2 (ja) 2022-03-14
US20220310104A1 (en) 2022-09-29
CN108665902A (zh) 2018-10-16
EP3588497A1 (en) 2020-01-01
EP3588497A4 (en) 2020-01-15
US11894001B2 (en) 2024-02-06
JP2020512590A (ja) 2020-04-23
KR102281097B1 (ko) 2021-07-22
JP2022084671A (ja) 2022-06-07
US11386907B2 (en) 2022-07-12
WO2018177066A1 (zh) 2018-10-04
EP3917171B1 (en) 2024-04-24
EP3917171A1 (en) 2021-12-01
JP6804666B2 (ja) 2020-12-23
KR20190122839A (ko) 2019-10-30
JP2021047432A (ja) 2021-03-25
ES2882626T3 (es) 2021-12-02
JP7436541B2 (ja) 2024-02-21
CN110462733A (zh) 2019-11-15
US20200027466A1 (en) 2020-01-23

Similar Documents

Publication Publication Date Title
CN110495105B (zh) 多声道信号的编解码方法和编解码器
JP6641018B2 (ja) チャネル間時間差を推定する装置及び方法
CN110462733B (zh) 多声道信号的编解码方法和编解码器
CN108475509B (zh) 一种声道间相位差参数的提取方法及装置
EP2690622B1 (en) Audio decoding device and audio decoding method
CN109427338B (zh) 立体声信号的编码方法和编码装置
JP2024059683A (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号化方法、符号器、及び復号器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant