CN113129913B - 音频信号的编解码方法和编解码装置 - Google Patents

音频信号的编解码方法和编解码装置 Download PDF

Info

Publication number
CN113129913B
CN113129913B CN201911418539.8A CN201911418539A CN113129913B CN 113129913 B CN113129913 B CN 113129913B CN 201911418539 A CN201911418539 A CN 201911418539A CN 113129913 B CN113129913 B CN 113129913B
Authority
CN
China
Prior art keywords
current frame
frequency band
value
frequency domain
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911418539.8A
Other languages
English (en)
Other versions
CN113129913A (zh
Inventor
张德军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201911418539.8A priority Critical patent/CN113129913B/zh
Priority to EP20911265.5A priority patent/EP4075429A4/en
Priority to PCT/CN2020/141249 priority patent/WO2021136344A1/zh
Publication of CN113129913A publication Critical patent/CN113129913A/zh
Priority to US17/853,173 priority patent/US20220335961A1/en
Application granted granted Critical
Publication of CN113129913B publication Critical patent/CN113129913B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0224Processing in the time domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Abstract

本申请提供了一种音频信号的编解码方法和编解码装置。该音频信号的编码方法,包括:获取当前帧的目标频域系数及所述当前帧的参考目标频域系数;根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,其中,所述代价函数用于确定在对所述当前帧的目标频域系数进行编码时是否对所述当前帧进行长时预测LTP处理;根据所述代价函数,对所述当前帧的目标频域系数进行编码。本申请实施例中的编码方法能够提高音频信号的编解码效率。

Description

音频信号的编解码方法和编解码装置
技术领域
本申请涉及音频信号编解码技术领域,并且更具体地,涉及一种音频信号的编解码方法和编解码装置。
背景技术
随着生活质量的提高,人们对高质量音频的需求不断增大。为了利用有限的带宽更好地传输音频信号,通常需要先对音频信号进行编码,然后将编码处理后的码流传输到解码端。解码端对接收到的码流进行解码处理,得到解码后的音频信号,解码后的音频信号用于回放。
音频信号的编码技术有很多种。其中,频域编解码技术就是一种常见的音频编解码技术。频域编解码技术中,利用音频信号中的短时相关性和长时相关性进行压缩编解码。
因此,如何提高对音频信号进行频域编解码时的编解码效率,成为一个亟需解决的技术问题。
发明内容
本申请提供一种音频信号的编解码方法和编解码装置,能够提高音频信号的编解码效率。
第一方面,提供了一种音频信号的编码方法,该方法包括:获取当前帧的目标频域系数及所述当前帧的参考目标频域系数;根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,其中,所述代价函数用于确定在对所述当前帧的目标频域系数进行编码时是否对所述当前帧进行长时预测LTP处理;根据所述代价函数,对所述当前帧的目标频域系数进行编码。
在本申请实施例中,根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,根据所述代价函数,可以对适合进行LTP处理的信号进行LTP处理(对不适合进行LTP处理的信号不进行LTP处理),可以有效地利用信号的长时相关性降低信号中冗余信息,从而可以提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
可选地,所述当前帧的目标频域系数及所述参考目标频域系数可以是根据滤波参数处理后得到的,所述滤波参数可以是通过对所述当前帧的频域系数进行滤波处理后得到的,所述当前帧的频域系数可以是通过将所述当前帧的时域信号进行时频变换后得到的,所述时频变换可以是MDCT,DCT,FFT等变换方式。
其中,所述参考目标频域系数可以是指所述当前帧的参考信号的目标频域系数。
可选地,所述滤波处理可以包括时域噪声整形(temporary noise shaping,TNS)处理和/或频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
结合第一方面,在第一方面的某些实现方式中,所述代价函数包括所述当前帧的高带的代价函数、所述当前帧的低频带的代价函数或所述当前帧的全频带的代价函数中的至少一项,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
在本申请实施例中,根据所述代价函数,可以对所述当前帧中适合进行LTP处理的频带(即低频带、高频带或全频带中的一项)进行LTP处理(对不适合进行LTP处理的频带不进行LTP处理),可以更有效地利用信号的长时相关性降低信号中冗余信息,从而可以进一步提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
结合第一方面,在第一方面的某些实现方式中,所述代价函数为所述当前帧的当前频带的预测增益,或者,所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值;其中,所述估计残差频域系数为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值,所述预测频域系数是根据所述当前帧的当前频带的参考频域系数与所述预测增益获得的,所述当前频带为所述低频带、高频带或全频带。
结合第一方面,在第一方面的某些实现方式中,所述根据所述代价函数,对所述当前帧的目标频域系数进行编码,包括:根据所述代价函数,确定第一标识和/或第二标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,所述第二标识用于指示所述当前帧中进行LTP处理的频带;根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码。
结合第一方面,在第一方面的某些实现方式中,所述根据所述代价函数,确定第一标识和/或第二标识,包括:当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值,所述第二标识为第四值;其中,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;或当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理,所述第一值用于指示对所述当前帧进行LTP处理;或当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值,所述第二值用于指示不对所述当前帧进行LTP处理;或当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
结合第一方面,在第一方面的某些实现方式中,所述根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码,包括:当所述第一标识为第一值时,根据所述第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;对所述当前帧的残差频域系数进行编码;将所述第一标识及所述第二标识的值写入码流;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;将所述第一标识的值写入码流。
结合第一方面,在第一方面的某些实现方式中,所述根据所述代价函数,对所述当前帧的目标频域系数进行编码,包括:根据所述代价函数,确定第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;根据所述第一标识,对所述当前帧的目标频域系数进行编码。
结合第一方面,在第一方面的某些实现方式中,所述根据所述代价函数,确定第一标识,包括:当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值;其中,所述第一值用于指示对所述低频带进行LTP处理;或当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理;或当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
结合第一方面,在第一方面的某些实现方式中,所述根据所述第一标识,对所述当前帧的目标频域系数进行编码,包括:根据所述第一标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;对所述当前帧的残差频域系数进行编码;将所述第一标识的值写入码流;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;将所述第一标识的值写入码流。
结合第一方面,在第一方面的某些实现方式中,所述第一条件为所述低频带的代价函数大于或等于第一阈值,所述第二条件为所述高频带的代价函数大于或等于第二阈值,所述第三条件为所述全频带的代价函数大于或等于所述第三阈值;或者,所述第一条件为所述低频带的代价函数小于第四阈值,所述第二条件为所述高频带的代价函数小于所述第四阈值,所述第三条件为所述全频带的代价函数大于或等于第五阈值。
结合第一方面,在第一方面的某些实现方式中,所述方法还包括:根据所述参考信号的频谱系数,确定所述截止频点。
在本申请实施例中,根据所述参考信号的频谱系数,确定所述截止频点,可以更准确地确定出适合进行LTP处理的频带,可以提高LTP处理的效率,从而可以进一步地提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
结合第一方面,在第一方面的某些实现方式中,所述根据所述参考信号的频谱系数,确定所述截止频点,包括:根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
结合第一方面,在第一方面的某些实现方式中,所述截止频点为预设值。
在本申请实施例中,根据经验或结合实际情况预先设定所述截止频点,可以更准确地确定出适合进行LTP处理的频带,可以提高LTP处理的效率,从而可以进一步地提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
第二方面,提供了一种音频信号的解码方法,该方法包括:解析码流得到当前帧的解码频域系数;解析码流得到第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数。
在本申请实施例中,通过对适合进行LTP处理的信号进行LTP处理(对不适合进行LTP处理的信号不进行LTP处理),可以有效地降低信号中冗余信息,从而可以提高编解码的压缩效率,因此,能够提高音频信号的编解码效率。
可选地,所述当前帧的解码频域系数可以为所述当前帧的残差频域系数或所述当前帧的解码频域系数为所述当前帧的目标频域系数。
可选地,还可以解析码流得到滤波参数。
其中,所述滤波参数可以用于对所述当前帧的频域系数进行滤波处理,所述滤波处理可以包括时域噪声整形(temporary noise shaping,TNS)处理和/或频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
结合第二方面,在第二方面的某些实现方式中,所述当前帧中进行LTP处理的频带包括高频带、低频带或全频带,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
在本申请实施例中,根据所述代价函数,可以对所述当前帧中适合进行LTP处理的频带(即低频带、高频带或全频带中的一项)进行LTP处理(对不适合进行LTP处理的频带不进行LTP处理),可以更有效地利用信号的长时相关性降低信号中冗余信息,从而可以进一步提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
结合第二方面,在第二方面的某些实现方式中,当所述第一标识为第一值时,所述当前帧的解码频域系数为所述当前帧的残差频域系数;当所述第一标识为第二值时,所述当前帧的解码频域系数为所述当前帧的目标频域系数。
结合第二方面,在第二方面的某些实现方式中,所述解析码流得到第一标识,包括:解析码流得到第一标识;当所述第一标识为第一值时,解析码流得到第二标识,所述第二标识用于指示所述当前帧中进行LTP处理的频带。
结合第二方面,在第二方面的某些实现方式中,所述根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数,包括:当所述第一标识为第一值,且所述第二标识为第四值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第一值,且所述第二标识为第三值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第三值用于指示对所述全频带进行LTP处理;根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
结合第二方面,在第二方面的某些实现方式中,所述根据所述第一标识,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,包括:当所述第一标识为第一值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述低频带进行LTP处理;根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第三值时,获得所述当前帧的参考目标频域系数,所述第三值用于指示对所述全频带进行LTP处理;根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
结合第二方面,在第二方面的某些实现方式中,所述获得所述当前帧的参考目标频域系数,包括:解析码流得到所述当前帧的基音周期;根据所述当前帧的基音周期,确定所述当前帧的参考频域系数;对所述参考频域系数进行处理,得到所述参考目标频域系数。
结合第二方面,在第二方面的某些实现方式中,所述方法还包括:根据所述参考信号的频谱系数,确定所述截止频点。
在本申请实施例中,根据所述参考信号的频谱系数,确定所述截止频点,可以更准确地确定出适合进行LTP处理的频带,可以提高LTP处理的效率,从而可以进一步地提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
结合第二方面,在第二方面的某些实现方式中,所述根据所述参考信号的频谱系数,确定所述截止频点,包括:根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
结合第二方面,在第二方面的某些实现方式中,所述截止频点为预设值。
在本申请实施例中,根据经验或结合实际情况预先设定所述截止频点,可以更准确地确定出适合进行LTP处理的频带,可以提高LTP处理的效率,从而可以进一步地提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
第三方面,提供了一种音频信号的编码装置,包括:获取模块,用于获取当前帧的目标频域系数及所述当前帧的参考目标频域系数;处理模块,用于根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,其中,所述代价函数用于确定在对所述当前帧的目标频域系数进行编码时是否对所述当前帧进行长时预测LTP处理;编码模块,用于根据所述代价函数,对所述当前帧的目标频域系数进行编码。
在本申请实施例中,根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,根据所述代价函数,可以对适合进行LTP处理的信号进行LTP处理(对不适合进行LTP处理的信号不进行LTP处理),从而可以提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
可选地,所述当前帧的目标频域系数及所述参考目标频域系数可以是根据滤波参数处理后得到的,所述滤波参数可以是通过对所述当前帧的频域系数进行滤波处理后得到的,所述当前帧的频域系数可以是通过将所述当前帧的时域信号进行时频变换后得到的,所述时频变换可以是MDCT,DCT,FFT等变换方式。
其中,所述参考目标频域系数可以是指所述当前帧的参考信号的目标频域系数。
可选地,所述滤波处理可以包括时域噪声整形(temporary noise shaping,TNS)处理和/或频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
结合第三方面,在第三方面的某些实现方式中,所述代价函数包括所述当前帧的高频带的代价函数、所述当前帧的低频带的代价函数或所述当前帧的全频带的代价函数中的至少一项,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
在本申请实施例中,根据所述代价函数,可以对所述当前帧中适合进行LTP处理的频带(即低频带、高频带或全频带中的一项)进行LTP处理(对不适合进行LTP处理的频带不进行LTP处理),从而可以提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
结合第三方面,在第三方面的某些实现方式中,所述代价函数为所述当前帧的当前频带的预测增益,或者,所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值;其中,所述估计残差频域系数为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值,所述预测频域系数是根据所述当前帧的当前频带的参考频域系数与所述预测增益获得的,所述当前频带为所述低频带、高频带或全频带。
结合第三方面,在第三方面的某些实现方式中,所述编码模块具体用于:根据所述代价函数,确定第一标识和/或第二标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,所述第二标识用于指示所述当前帧中进行LTP处理的频带;根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码。
结合第三方面,在第三方面的某些实现方式中,所述编码模块具体用于:当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值,所述第二标识为第四值;其中,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;或当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理,所述第一值用于指示对所述当前帧进行LTP处理;或当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值,所述第二值用于指示不对所述当前帧进行LTP处理;或当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
结合第三方面,在第三方面的某些实现方式中,所述编码模块具体用于:当所述第一标识为第一值时,根据所述第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;对所述当前帧的残差频域系数进行编码;将所述第一标识及所述第二标识的值写入码流;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;将所述第一标识的值写入码流。
结合第三方面,在第三方面的某些实现方式中,所述编码模块具体用于:根据所述代价函数,确定第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;根据所述第一标识,对所述当前帧的目标频域系数进行编码。
结合第三方面,在第三方面的某些实现方式中,所述编码模块具体用于:当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值;其中,所述第一值用于指示对所述低频带进行LTP处理;或当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理;或当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
结合第三方面,在第三方面的某些实现方式中,所述编码模块具体用于:根据所述第一标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;对所述当前帧的残差频域系数进行编码;将所述第一标识的值写入码流;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;将所述第一标识的值写入码流。
结合第三方面,在第三方面的某些实现方式中,所述第一条件为所述低频带的代价函数大于或等于第一阈值,所述第二条件为所述高频带的代价函数大于或等于第二阈值,所述第三条件为所述全频带的代价函数大于或等于所述第三阈值;或者,所述第一条件为所述低频带的代价函数小于第四阈值,所述第二条件为所述高频带的代价函数小于所述第四阈值,所述第三条件为所述全频带的代价函数大于或等于第五阈值。
结合第三方面,在第三方面的某些实现方式中,所述处理模块还用于:根据所述参考信号的频谱系数,确定所述截止频点。
在本申请实施例中,根据所述参考信号的频谱系数,确定所述截止频点,可以更准确地确定出适合进行LTP处理的频带,可以提高LTP处理的效率,从而可以进一步地提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
结合第三方面,在第三方面的某些实现方式中,所述处理模块具体用于:根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
结合第三方面,在第三方面的某些实现方式中,所述截止频点为预设值。
在本申请实施例中,根据经验或结合实际情况预先设定所述截止频点,可以更准确地确定出适合进行LTP处理的频带,可以提高LTP处理的效率,从而可以进一步地提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
第四方面,提供了一种音频信号的解码装置,包括:解码模块,用于解析码流得到当前帧的解码频域系数;所述解码模块,还用于解析码流得到第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;处理模块,用于根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数。
在本申请实施例中,通过对适合进行LTP处理的信号进行LTP处理(对不适合进行LTP处理的信号不进行LTP处理),可以有效地降低信号中冗余信息,从而可以提高编解码的压缩效率,因此,能够提高音频信号的编解码效率。
可选地,所述当前帧的解码频域系数可以为所述当前帧的残差频域系数或所述当前帧的解码频域系数为所述当前帧的目标频域系数。
可选地,还可以解析码流得到滤波参数。
其中,所述滤波参数可以用于对所述当前帧的频域系数进行滤波处理,所述滤波处理可以包括时域噪声整形(temporary noise shaping,TNS)处理和/或频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
结合第四方面,在第四方面的某些实现方式中,所述当前帧中进行LTP处理的频带包括高频带、低频带或全频带,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
在本申请实施例中,根据所述代价函数,可以对所述当前帧中适合进行LTP处理的频带(即低频带、高频带或全频带中的一项)进行LTP处理(对不适合进行LTP处理的频带不进行LTP处理),可以更有效地利用信号的长时相关性降低信号中冗余信息,从而可以进一步提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
结合第四方面,在第四方面的某些实现方式中,当所述第一标识为第一值时,所述当前帧的解码频域系数为所述当前帧的残差频域系数;当所述第一标识为第二值时,所述当前帧的解码频域系数为所述当前帧的目标频域系数。
结合第四方面,在第四方面的某些实现方式中,所述解码模块具体用于:解析码流得到第一标识;当所述第一标识为第一值时,解析码流得到第二标识,所述第二标识用于指示所述当前帧中进行LTP处理的频带。
结合第四方面,在第四方面的某些实现方式中,所述处理模块具体用于:当所述第一标识为第一值,且所述第二标识为第四值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第一值,且所述第二标识为第三值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第三值用于指示对所述全频带进行LTP处理;根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
结合第四方面,在第四方面的某些实现方式中,所述处理模块具体用于:当所述第一标识为第一值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述低频带进行LTP处理;根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第三值时,获得所述当前帧的参考目标频域系数,所述第三值用于指示对所述全频带进行LTP处理;根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
结合第四方面,在第四方面的某些实现方式中,所述处理模块具体用于:解析码流得到所述当前帧的基音周期;根据所述当前帧的基音周期,确定所述当前帧的参考频域系数;对所述参考频域系数进行处理,得到所述参考目标频域系数。
结合第四方面,在第四方面的某些实现方式中,所述处理模块还用于:根据所述参考信号的频谱系数,确定所述截止频点。
在本申请实施例中,根据所述参考信号的频谱系数,确定所述截止频点,可以更准确地确定出适合进行LTP处理的频带,可以提高LTP处理的效率,从而可以进一步地提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
结合第四方面,在第四方面的某些实现方式中,所述处理模块具体用于:根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
结合第四方面,在第四方面的某些实现方式中,所述截止频点为预设值。
在本申请实施例中,根据经验或结合实际情况预先设定所述截止频点,可以更准确地确定出适合进行LTP处理的频带,可以提高LTP处理的效率,从而可以进一步地提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
第五方面,提供一种编码装置,所述编码装置包括存储介质和中央处理器,所述存储介质可以是非易失性存储介质,所述存储介质中存储有计算机可执行程序,所述中央处理器与所述非易失性存储介质连接,并执行所述计算机可执行程序以实现所述第一方面或者其各种实现方式中的方法。
第六方面,提供一种编码装置,所述编码装置包括存储介质和中央处理器,所述存储介质可以是非易失性存储介质,所述存储介质中存储有计算机可执行程序,所述中央处理器与所述非易失性存储介质连接,并执行所述计算机可执行程序以实现所述第二方面或者其各种实现方式中的方法。
第七方面,提供一种计算机可读存储介质,所述计算机可读介质存储用于设备执行的程序代码,所述程序代码包括用于执行第一方面或其各种实现方式中的方法的指令。
第八方面,提供一种计算机可读存储介质,所述计算机可读介质存储用于设备执行的程序代码,所述程序代码包括用于执行第二方面或其各种实现方式中的方法的指令。
第九方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储了程序代码,其中,所述程序代码包括用于执行第一方面或第二方面中的任意一种方法的部分或全部步骤的指令。
第十方面,本申请实施例提供一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面或第二方面中的任意一种方法的部分或全部步骤。
在本申请实施例中,根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,根据所述代价函数,可以对适合进行LTP处理的信号进行LTP处理(对不适合进行LTP处理的信号不进行LTP处理),可以有效地利用信号的长时相关性降低信号中冗余信息,从而可以提高音频信号编解码的压缩性能,因此,能够提高音频信号的编解码效率。
附图说明
图1是一种音频信号的编解码系统的结构示意图;
图2是一种音频信号的编码方法的示意性流程图;
图3是一种音频信号的解码方法的示意性流程图;
图4是本申请实施例的移动终端的示意图;
图5是本申请实施例的网元的示意图;
图6是本申请一个实施例的音频信号的编码方法的示意性流程图;
图7是本申请另一个实施例的音频信号的编码方法的示意性流程图;
图8是本申请一个实施例的音频信号的解码方法的示意性流程图;
图9是本申请另一个实施例的音频信号的解码方法的示意性流程图;
图10是本申请实施例的编码装置的示意性框图;
图11是本申请实施例的解码装置的示意性框图;
图12是本申请实施例的编码装置的示意性框图;
图13是本申请实施例的解码装置的示意性框图;
图14是本申请实施例的终端设备的示意图;
图15是本申请实施例的网络设备的示意图;
图16是本申请实施例的网络设备的示意图;
图17是本申请实施例的终端设备的示意图;
图18是本申请实施例的网络设备的示意图;
图19是本申请实施例的网络设备的示意图。
具体实施方式
下面将结合附图,对本申请中的技术方案进行描述。
本申请实施例中的音频信号可以为单声道音频信号,或者,也可以为立体声信号。其中,立体声信号可以是原始的立体声信号,也可以是多声道信号中包括的两路信号(左声道信号和右声道信号)组成的立体声信号,还可以是由多声道信号中包含的至少三路信号产生的两路信号组成的立体声信号,本申请实施例中对此并不限定。
为了便于描述,本申请实施例仅以(包括左声道信号和右声道信号的)立体声信号为例进行说明。本领域技术人员可以理解,下述实施例仅为示例而非限定,本申请实施例中的方案同样适用于单声道音频信号及其他立体声信号,本申请实施例中对此并不限定。
图1为本申请一个示例性实施例的音频编解码系统的结构示意图。该音频编解码系统包括编码组件110和解码组件120。
编码组件110用于对当前帧(音频信号)在频域上进行编码。可选地,编码组件110可以通过软件实现;或者,也可以通过硬件实现;或者,还可以通过软硬件结合的形式实现,本申请实施例中对此不作限定。
编码组件110对当前帧在频域上进行编码时,在一种可能的实现方式中,可以包括如图2所示的步骤。
S210,将当前帧由时域信号转换为频域信号。
S220,对当前帧进行滤波处理,得到当前帧的频域系数。
S230,对当前帧进行长时预测(long term prediction,LTP)判决,得到LTP标识。
其中,当所述LTP标识为第一值(例如,所述LTP标识为1)时,可以执行S250;当所述LTP标识为第二值(例如,所述LTP标识为0)时,可以执行S240。
S240,对当前帧的频域系数进行编码,得到所述当前帧的编码参数。接下来,可以执行S280。
S250,对当前帧进行立体声编码,得到当前帧的频域系数。
S260,对当前帧的频域系数进行LTP处理,得到当前帧的残差频域系数。
S270,对当前帧的残差频域系数进行编码,得到当前帧的编码参数。
S280,将当前帧的编码参数及LTP标识写入码流。
需要说明的是,图2中所示的编码方法仅为示例而非限定,本申请实施例对图2中各步骤的执行顺序并不限定,图2中所示的编码方法也可以包括更多或更少的步骤,本申请实施例中对此并不限定。
例如,在图2所示的编码方法中,也可以先执行S250,对当前帧进行LTP处理,再执行S260,对当前帧进行立体声编码。
再例如,图2所示的编码方法也可以对单声道信号进行编码,此时,图2中所示的编码方法可以不执行S250,即不对单声道信号进行立体声编码。
解码组件120用于对编码组件110生成的编码码流进行解码,得到当前帧的音频信号。
可选地,编码组件110与解码组件120可以通过有线或无线的方式相连,解码组件120可以通过其与编码组件110之间的连接获取编码组件110生成的编码码流;或者,编码组件110可以将生成的编码码流存储至存储器,解码组件120读取存储器中的编码码流。
可选地,解码组件120可以通过软件实现;或者,也可以通过硬件实现;或者,还可以通过软硬件结合的形式实现,本申请实施例中对此不作限定。
解码组件120对当前帧(音频信号)在频域上进行解码时,在一种可能的实现方式中,可以包括如图3所示的步骤。
S310,解析码流,得到当前帧的编码参数及LTP标识。
S320,根据LTP标识进行LTP处理,确定是否对当前帧的编码参数进行LTP合成。
其中,当所述LTP标识为第一值(例如,所述LTP标识为1)时,则在S310中解析码流得到的是当前帧的残差频域系数,此时可以执行S340;当所述LTP标识为第二值(例如,所述LTP标识为0)时,则在S310中解析码流得到的是当前帧的目标频域系数,此时可以执行S330。
S330,对当前帧的目标频域系数进行逆滤波处理,得到当前帧的频域系数。接下来,可以执行S370。
S340,对当前帧的残差频域系数进行LTP合成,得到更新后的残差频域系数。
S350,对更新后的残差频域系数进行立体声解码,得到当前帧的目标频域系数。
S360,对当前帧的目标频域系数进行逆滤波处理,得到当前帧的频域系数。
S370,对当前帧的频域系数进行转换,获得时域合成信号。
需要说明的是,图3中所示的解码方法仅为示例而非限定,本申请实施例对图3中各步骤的执行顺序并不限定,图3中所示的解码方法也可以包括更多或更少的步骤,本申请实施例中对此并不限定。
例如,在图3所示的解码方法中,也可以先执行S350,对残差频域系数进行立体声解码,再执行S340,对残差频域系数进行LTP合成。
再例如,图3所示的解码方法也可以对单声道信号进行解码,此时,图3中所示的解码方法可以不执行S350,即不对单声道信号进行立体声解码。
可选地,编码组件110和解码组件120可以设置在同一设备中;或者,也可以设置在不同设备中。设备可以为手机、平板电脑、膝上型便携计算机和台式计算机、蓝牙音箱、录音笔、可穿戴式设备等具有音频信号处理功能的终端,也可以是核心网、无线网中具有音频信号处理能力的网元,本实施例对此不作限定。
示意性地,如图4所示,本实施例以编码组件110设置于移动终端130中、解码组件120设置于移动终端140中,移动终端130与移动终端140是相互独立的具有音频信号处理能力的电子设备,例如可以是手机,可穿戴设备,虚拟现实(virtual reality,VR)设备,或增强现实(augmented reality,AR)设备等等,且移动终端130与移动终端140之间通过无线或有线网络连接为例进行说明。
可选地,移动终端130可以包括采集组件131、编码组件110和信道编码组件132,其中,采集组件131与编码组件110相连,编码组件110与编码组件132相连。
可选地,移动终端140可以包括音频播放组件141、解码组件120和信道解码组件142,其中,音频播放组件141与解码组件120相连,解码组件120与信道解码组件142相连。
移动终端130通过采集组件131采集到音频信号后,通过编码组件110对该音频信号进行编码,得到编码码流;然后,通过信道编码组件132对编码码流进行编码,得到传输信号。
移动终端130通过无线或有线网络将该传输信号发送至移动终端140。
移动终端140接收到该传输信号后,通过信道解码组件142对传输信号进行解码得到码码流;通过解码组件110对编码码流进行解码得到音频信号;通过音频播放组件播放该音频信号。可以理解的是,移动终端130也可以包括移动终端140所包括的组件,移动终端140也可以包括移动终端130所包括的组件。
示意性地,如图5所示,以编码组件110和解码组件120设置于同一核心网或无线网中具有音频信号处理能力的网元150中为例进行说明。
可选地,网元150包括信道解码组件151、解码组件120、编码组件110和信道编码组件152。其中,信道解码组件151与解码组件120相连,解码组件120与编码组件110相连,编码组件110与信道编码组件152相连。
信道解码组件151接收到其它设备发送的传输信号后,对该传输信号进行解码得到第一编码码流;通过解码组件120对编码码流进行解码得到音频信号;通过编码组件110对该音频信号进行编码,得到第二编码码流;通过信道编码组件152对该第二编码码流进行编码得到传输信号。
其中,其它设备可以是具有音频信号处理能力的移动终端;或者,也可以是具有音频信号处理能力的其它网元,本实施例对此不作限定。
可选地,网元中的编码组件110和解码组件120可以对移动终端发送的编码码流进行转码。
可选地,本申请实施例中可以将安装有编码组件110的设备称为音频编码设备,在实际实现时,该音频编码设备也可以具有音频解码功能,本申请实施对此不作限定。
可选地,本申请实施例仅以立体声信号为例进行说明,在本申请中,音频编码设备还可以处理单声道信号或多声道信号,该多声道信号包括至少两路声道信号。
本申请提出了一种音频信号的编解码方法和编解码装置,对当前帧的频域系数进行滤波处理得到滤波参数,并使用所述滤波参数对所述当前帧的频域系数及所述参考频域系数进行滤波处理,可以减少写入码流的比特(bit),从而可以提高编解码的压缩效率,因此,能够提高音频信号的编解码效率。
图6是本申请实施例的音频信号的编码方法600的示意性流程图。该方法600可以由编码端执行,该编码端可以是编码器或者是具有编码音频信号功能的设备。该方法600具体包括:
S610,获取当前帧的目标频域系数及所述当前帧的参考目标频域系数。
可选地,所述当前帧的目标频域系数及所述参考目标频域系数可以是根据滤波参数处理后得到的,所述滤波参数可以是通过对所述当前帧的频域系数进行滤波处理后得到的,所述当前帧的频域系数可以是通过将所述当前帧的时域信号进行时频变换后得到的,所述时频变换可以是MDCT,DCT,FFT等变换方式。
其中,所述参考目标频域系数可以是指所述当前帧的参考信号的目标频域系数。
可选地,所述滤波处理可以包括时域噪声整形(temporary noise shaping,TNS)处理和/或频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
S620,根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数。
其中,所述代价函数可以用于确定在对所述当前帧的目标频域系数进行编码时是否对所述当前帧进行长时预测(long term prediction,LTP)处理。
可选地,所述代价函数可以包括高频带的代价函数、低频带的代价函数或所述当前帧的全频带的代价函数中的至少两项。
其中,所述高频带可以为所述当前帧的全频带中大于截止频点的频带,所述低频带可以为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点可以用于划分所述低频带和所述高频带。
可选地,所述代价函数可以为所述当前帧的当前频带的预测增益。
例如,高频带的代价函数可以为所述高频带的预测增益,所述低频带的代价函数可以为所述低频带的预测增益,所述全频带的代价函数可以为所述全频带的预测增益。
或者,所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值。
其中,所述估计残差频域系数可以为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值,所述预测频域系数可以是根据所述当前帧的当前频带的参考频域系数与预测增益获得的,所述当前频带为所述低频带、高频带或全频带。
例如,所述预测频域系数可以是所述当前帧的当前频带的参考频域系数与所述预测增益的乘积。
例如,所述高频带的代价函数可以为所述高频带的残差频域系数的能量与所述高频带信号的能量的比值,所述低频带的代价函数可以为所述低频带的残差频域系数的能量与所述低频带信号的能量的比值,所述全频带的代价函数可以为所述全频带的残差频域系数的能量与所述全频带信号的能量的比值。
在本申请实施例中,上述截止频点可以通过以下两种方式确定:
方式一:
可以根据所述参考信号的频谱系数,确定所述截止频点。
进一步地,可以根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
其中,所述预设条件可以为所述顶峰因子集合中大于第六阈值中的(一个或多个)顶峰因子中的最大值。
例如,可以根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;将所述顶峰因子集合中大于第六阈值的(一个或多个)顶峰因子的最大值,作为所述截止频点。
方式二:
所述截止频点可以为预设值。具体地,可以根据经验,将所述截止频点预先设定为预设值。
例如,假设当前帧的处理信号为48k赫兹(Hz)的采样信号,经过480点MDCT变换,获得480点MDCT系数,则截止频点的索引可以预先设定为200,其对应的截止频率为10kHz。
S630,根据所述代价函数,对所述当前帧的目标频域系数进行编码。
可选地,可以根据所述代价函数,确定标识,接下来,可以根据确定出的所述标识,对所述当前帧的目标频域系数进行编码。
具体地,根据确定出的标识不同,可以分为以下两种方式对所述当前帧的目标频域系数进行编码:
方式一:
可选地,可以根据所述代价函数,确定第一标识和/或第二标识;可以根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码。
其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,所述第二标识可以用于指示所述当前帧中进行LTP处理的频带。
可选地,在方式一中,所述第一标识及所述第二标识可以取不同的值,这些不同的值可以分别表示不同的含义。
例如,所述第一标识可以为第一值或第二值,所述第二标识可以为第三值或第四值。
其中,所述第一值可以为1,用于指示对所述当前帧进行LTP处理,所述第二值可以为0,用于指示不对所述当前帧进行LTP处理,所述第三值可以为2,用于指示对所述全频带进行LTP处理,所述第四值可以为3,用于指示对所述低频带进行LTP处理。
需要说明的是,上述实施例中示出的所述第一标识及所述第二标识的上述取值仅为示例而非限定。
进一步地,根据确定出的所述第一标识和/或所述第二标识不同,可以分为以下几种情况:
情况一:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,可以确定所述第一标识为第一值,所述第二标识为第四值。
此时,可以根据所述第二标识,对所述当前帧的低频带进行LTP处理,得到所述低频带的残差频域系数;接下来,可以对所述低频带的残差频域系数及所述高频带的目标频域系数进行编码,并将所述第一标识及所述第二标识的值写入码流。
情况二:
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,可以确定所述第一标识为第一值,所述第二标识为第三值。
此时,可以根据所述第二标识,对所述当前帧的全频带进行LTP处理,得到所述全频带的残差频域系数;接下来,可以对所述全频带的残差频域系数进行编码,并将所述第一标识及所述第二标识的值写入码流。
情况三:
当所述低频带的代价函数不满足所述第一条件时,可以确定所述第一标识为第二值。
此时,可以对所述当前帧的目标频域系数进行编码(而不需要对所述当前帧进行LTP处理,得到所述当前帧的残差频域系数后,再对所述当前帧的残差频域系数进行编码),并将所述第一标识的值写入码流。
情况四:
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,可以确定所述第一标识为第二值。
此时,可以对所述当前帧的目标频域系数进行编码,并将所述第一标识的值写入码流。
情况五:
当所述全频带的代价函数满足所述第三条件时,可以确定所述第一标识为第一值,所述第二标识为第三值。
此时,可以根据所述第二标识,对所述当前帧的全频带进行LTP处理,得到所述全频带的残差频域系数;接下来,可以对所述全频带的残差频域系数进行编码,并将所述第一标识及所述第二标识的值写入码流。
在上述方式一中,当代价函数的定义不同时,所述第一条件、所述第二条件及所述第三条件也可以不同。
例如,当所述代价函数为所述当前帧的当前频带的预测增益时,所述第一条件可以为所述低频带的代价函数大于或等于第一阈值,所述第二条件可以为所述高频带的代价函数大于或等于第二阈值,所述第三条件可以为所述全频带的代价函数大于或等于所述第三阈值。
再例如,当所述代价函数为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值时,所述第一条件可以为所述低频带的代价函数小于第四阈值,所述第二条件可以为所述高频带的代价函数小于所述第四阈值,所述第三条件可以为所述全频带的代价函数大于或等于第五阈值。
其中,所述第一阈值、所述第二阈值、所述第三阈值、所述第四阈值及所述第五阈值均可以预先设定为0.5。
或者,所述第一阈值可以预先设定为0.45、所述第二阈值可以预先设定为0.5、所述第三阈值可以预先设定为0.55、所述第四阈值可以预先设定为0.6,所述第五阈值可以预先设定为0.65。
或者,所述第一阈值可以预先设定为0.4、所述第二阈值可以预先设定为0.4、所述第三阈值可以预先设定为0.5、所述第四阈值可以预先设定为0.6,所述第五阈值可以预先设定为0.7。
应理解,上述实施例中的取值仅为示例而非限定,所述第一阈值、所述第二阈值、所述第三阈值、所述第四阈值及所述第五阈值的取值均可以根据经验(或结合实际情况)预先设定,本申请实施例中对此并不限定。
方式二:
可选地,可以根据所述代价函数,确定第一标识;可以根据所述第一标识,对所述当前帧的目标频域系数进行编码。
其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识可以用于指示是否对所述当前帧进行LTP处理以及所述当前帧中进行LTP处理的频带。
可选地,在方式二中,所述第一标识也可以取不同的值,这些不同的值也可以分别表示不同的含义。
例如,所述第一标识可以为第一值或第二值,所述第二标识可以为第三值或第四值。
其中,所述第一值可以为1,用于指示(对所述当前帧进行LTP处理且)对所述低频带进行LTP处理,所述第二值可以为0,用于指示不对所述当前帧进行LTP处理,所述第三值可以为2,用于指示(对所述当前帧进行LTP处理且)对所述全频带进行LTP处理。
需要说明的是,上述实施例中示出的所述第一标识的上述取值仅为示例而非限定。
进一步地,根据确定出的所述第一标识不同,可以分为以下几种情况:
情况一:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,可以确定所述第一标识为第一值。
此时,可以根据所述第一标识,对所述当前帧的低频带进行LTP处理,得到所述低频带的残差频域系数;接下来,可以对所述低频带的残差频域系数及所述高频带的目标频域系数进行编码,并将所述第一标识的值写入码流。
情况二:
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,可以确定所述第一标识为第三值。
此时,可以根据所述第一标识,对所述当前帧的全频带进行LTP处理,得到所述全频带的残差频域系数;接下来,可以对所述全频带的残差频域系数进行编码,并将所述第一标识的值写入码流。
情况三:
当所述低频带的代价函数不满足所述第一条件时,可以确定所述第一标识为第二值。
此时,可以对所述当前帧的目标频域系数进行编码,并将所述第一标识的值写入码流。
情况四:
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,可以确定所述第一标识为第二值。
此时,可以对所述当前帧的目标频域系数进行编码(而不需要对所述当前帧进行LTP处理,得到所述当前帧的残差频域系数后,再对所述当前帧的残差频域系数进行编码),并将所述第一标识的值写入码流。
情况五:
当所述全频带的代价函数满足所述第三条件时,可以确定所述第一标识为第三值。
此时,可以根据所述第一标识,对所述当前帧的全频带进行LTP处理,得到所述全频带的残差频域系数;接下来,可以对所述全频带的残差频域系数进行编码,并将所述第一标识的值写入码流。
在上述方式二中,当代价函数的定义不同时,所述第一条件、所述第二条件及所述第三条件也可以不同。
例如,当所述代价函数为所述当前帧的当前频带的预测增益时,所述第一条件可以为所述低频带的代价函数大于或等于第一阈值,所述第二条件可以为所述高频带的代价函数大于或等于第二阈值,所述第三条件可以为所述全频带的代价函数大于或等于所述第三阈值。
再例如,当所述代价函数为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值时,所述第一条件可以为所述低频带的代价函数小于第四阈值,所述第二条件可以为所述高频带的代价函数小于所述第四阈值,所述第三条件可以为所述全频带的代价函数大于或等于第五阈值。
其中,所述第一阈值、所述第二阈值、所述第三阈值、所述第四阈值及所述第五阈值均预先设定为0.5。
或者,所述第一阈值可以预先设定为0.45、所述第二阈值可以预先设定为0.5、所述第三阈值可以预先设定为0.55、所述第四阈值可以预先设定为0.6,所述第五阈值可以预先设定为0.65。
或者,所述第一阈值可以预先设定为0.4、所述第二阈值可以预先设定为0.4、所述第三阈值可以预先设定为0.5、所述第四阈值可以预先设定为0.6,所述第五阈值可以预先设定为0.7。
应理解,上述实施例中的取值仅为示例而非限定,所述第一阈值、所述第二阈值、所述第三阈值、所述第四阈值及所述第五阈值的取值均可以根据经验(或结合实际情况)预先设定,本申请实施例中对此并不限定。
下面结合图7,以立体声信号(即当前帧包括左声道信号和右声道信号)为例,对本申请实施例的音频信号的编码方法的详细过程进行描述。
应理解,图7所示的实施例仅为示例而非限定,本申请实施例中的音频信号也可以为单声道信号或多声道信号,本申请实施例中对此并不限定。
图7是本申请实施例的音频信号的编码方法的示意性流程图。该方法700可以由编码端执行,该编码端可以是编码器或者是具有编码音频信号功能的设备。该方法700具体包括:
S710,获取当前帧的目标频域系数。
可选地,可以通过MDCT变换将所述当前帧的左声道信号和右声道信号从时域转换到频域,得到所述左声道信号的MDCT系数及所述右声道信号的MDCT系数,即所述左声道信号的频域系数及所述右声道信号的频域系数。
接下来,可以对所述当前帧的频域系数进行TNS处理,获得线性预测编码(linearprediction coding,LPC)系数(即TNS参数),从而可以实现对所述当前帧进行噪声整形的目的。所述TNS处理是指对所述当前帧的频域系数进行LPC分析,LPC分析的具体方法可以参照现有技术,这里不再赘述。
另外,由于不是对每帧信号都适合进行TNS处理,还可以使用TNS标识用来指示是否对当前帧进行TNS处理。例如,当TNS标识为0时,不对当前帧进行TNS处理;当TNS标识为1时,利用获得的LPC系数对当前帧的频域系数进行TNS处理,获得处理后的当前帧的频域系数。其中,所述TNS标识是根据所述当前帧的输入信号(即所述当前帧的左声道信号和右声道信号)计算得到的,具体方法可以参照现有技术,这里不再赘述。
接下来,还可以对处理后的所述当前帧的频域系数进行FDNS处理,获得时域LPC系数,然后将时域LPC系数转换到频域,获得频域FDNS参数。所述FDNS处理是频域噪声整形技术,一种实现方式是计算处理后的所述当前帧的频域系数的能量谱,利用该能量谱获得自相关系数,并根据该自相关系数获得时域LPC系数,然后将时域LPC系数转换到频域,获得频域FDNS参数。FDNS处理的具体方法可以参照现有技术,这里不再赘述。
需要说明的是,在本申请实施例中,对TNS处理和FDNS处理的执行顺序并不限定,例如,也可以对所述当前帧的频域系数先进行FDNS处理,再进行TNS处理,本申请实施例中对此并不限定。
在本申请实施例中,为了便于理解,上述TNS参数及FDNS参数也可以称为滤波参数,上述TNS处理及FDNS处理也可以称为滤波处理。
此时,可以利用TNS参数及FDNS参数对所述当前帧的频域系数进行处理,得到所述当前帧的目标频域系数。
为便于描述,在本申请实施例中,所述当前帧的目标频域系数可以表示为X[k],所述当前帧的目标频域系数可以包括左声道信号的目标频域系数与右声道信号的目标频域系数,所述左声道信号的目标频域系数可以表示为XL[k],所述右声道信号的目标频域系数可以表示为XR[k],k=0,1,…,W,其中,k,W均为正整数,0≤k≤W,W可以为需要进行MDCT变换的点数(或者,W也可以为需要进行编码的MDCT系数的个数)。
S720,获取所述当前帧的参考目标频域系数。
可选地,可以通过基音周期搜索获得最佳基音周期;根据所述最佳基音周期从历史缓冲区中获得所述当前帧的参考信号ref[j]。其中,在基音周期搜索时可以采用任意基音周期搜索方法,本申请实施例中对此并不限定
ref[j]=syn[L-N-K+j],j=0,1,...,N-1
其中,历史缓冲区信号syn存储的是经过MDCT反变换获得的合成时域信号,长度为L=2N,N为帧长,K为基音周期。
历史缓冲区信号syn是通过对算术编码的残差信号进行解码,并进行LTP合成,然后利用上述S710获得的TNS参数和FDNS参数进行TNS逆处理和FDNS逆处理,然后经过MDCT反变换获得时域合成信号,并保存到历史缓冲区syn中。其中,TNS逆处理指的是与TNS处理(滤波)相反的操作,以获得经过TNS处理前的信号,FDNS逆处理指的是与FDNS处理(滤波)相反的操作,以获得经过FDNS处理前的信号。TNS逆处理和FDNS逆处理的具体方法可以参照现有技术,这里不再赘述。
可选地,对参考信号ref[j]进行MDCT变换,并利用上述S710获得的(对当前帧的频域系数X[k]进行分析后获得的)滤波参数对参考信号ref[j]的频域系数进行滤波处理。
首先,可以使用TNS标识以及上述S710获得的(对当前帧的频域系数X[k]进行分析后获得的)TNS参数对参考信号ref[j]的MDCT系数进行TNS处理,得到TNS处理后的参考频域系数。
例如,当TNS标识为1时,利用TNS参数对参考信号的MDCT系数进行TNS处理。
接下来,可以使用上述S710获得的(对当前帧的频域系数X[k]进行分析后获得的)FDNS参数对上述TNS处理后的参考频域系数进行FDNS处理,得到FDNS处理后的参考频域系数,即所述参考目标频域系数Xref[k]。
需要说明的是,在本申请实施例中,对TNS处理和FDNS处理的执行顺序并不限定,例如,也可以对所述参考频域系数(即所述参考信号的MDCT系数)先进行FDNS处理,再进行TNS处理,本申请实施例中对此并不限定。
S730,对所述当前帧进行频域LTP判决。
可选地,可以利用所述当前帧的目标频域系数X[k]及所述参考目标频域系数Xref[k],计算所述当前帧的LTP预测增益。
例如,可以使用下述公式计算所述当前帧的左声道信号(或右声道信号)的LTP预测增益:
/>
其中,gi可以为左声道(或右声道信号)的第i个子帧的LTP预测增益,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。需要说明的是,在本申请实施例中,部分帧可能会被分为若干个子帧,部分帧只有一个子帧,为了表述方便,这里统一以第i个子帧进行描述,当只有一个子帧时,i等于0。
可选地,可以根据所述当前帧的LTP预测增益,确定当前帧的LTP标识。其中,所述LTP标识可以用于指示是否对所述当前帧进行LTP处理。
需要说明的是,当所述当前帧包括左声道信号和右声道信号时,所述当前帧的LTP标识可以包括以下两种方式进行指示。
方式一:
所述当前帧的LTP标识可以用于指示是否同时对所述当前帧进行LTP处理。
进一步地,所述LTP标识可以包括如图6方法600中的实施例所述第一标识和/或第二标识。
例如,所述LTP标识可以包括第一标识和第二标识。其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,所述第二标识可以用于指示所述当前帧中进行LTP处理的频带。
再例如,所述LTP标识可以为第一标识。其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,且在对所述当前帧进行LTP处理的情况下,还可以指示所述当前帧中进行LTP处理的频带(例如,所述当前帧的高频带、低频带或全频带)。
方式二:
所述当前帧的LTP标识可以分为左声道LTP标识和右声道LTP标识,所述左声道LTP标识可以用于指示是否对所述左声道信号进行LTP处理,所述右声道LTP标识可以用于指示是否对所述右声道信号进行LTP处理。
进一步地,如图6方法600中的实施例所述,所述左声道LTP标识可以包括左声道的第一标识和/或所述左声道的第二标识,所述右声道LTP标识可以包括右声道的第一标识和/或所述右声道的第二标识。
下面以所述左声道LTP标识为例进行说明,所述右声道LTP标识与所述左声道LTP标识类似,这里不再赘述。
例如,所述左声道LTP标识可以包括左声道的第一标识和左声道的第二标识。其中,所述左声道的第一标识可以用于指示是否对所述左声道进行LTP处理,所述第二标识可以用于指示所述左声道中进行LTP处理的频带。
再例如,所述左声道LTP标识可以为左声道的第一标识。其中,所述左声道的第一标识可以用于指示是否对所述左声道进行LTP处理,且在对所述左声道进行LTP处理的情况下,还可以指示所述左声道中进行LTP处理的频带(例如,所述左声道的高频带、低频带或全频带)。
关于上述两种方式中的第一标识及第二标识的具体描述可以参考图6中的实施例,这里不再赘述。
在方法700的实施例中,所述当前帧的LTP标识可以采用方式一进行指示,应理解,方法700中的实施例仅为示例而非限定,方法700中的所述当前帧的LTP标识也可以采用方式二进行指示,本申请实施例中对此并不限定。
例如,在方法700中,可以对当前帧的左声道及右声道的所有子帧计算LTP预测增益,如果有任意子帧的频域预测增益gi小于预设的阈值,则可以将当前帧LTP标识设置为0,即对当前帧关闭LTP模块,则可以对所述当前帧的目标频域系数进行编码;否则,如果所述当前帧的所有子帧的频域预测增益均大于所述预设的阈值,则可以将当前帧LTP标识设置为1,即对当前帧打开LTP模块,此时,继续执行下述S740。
其中,所述预设的阈值可以结合实际情况进行设置。例如,所述预设的阈值可以设置为0.5、0.4或0.6。
在本申请实施例中,还可以将所述当前帧的带宽分为高频带、低频带及全频带。
可选地,可以计算所述左声道信号(和/或所述右声道信号)的代价函数,根据所述代价函数,确定是否对所述当前帧进行LTP处理,并在对所述当前帧进行LTP处理的情况下,根据所述代价函数,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数。
例如,对所述高频带进行LTP处理时,可以得到所述高频带的残差频域系数;对所述低频带进行LTP处理时,可以得到所述低频带的残差频域系数;对所述全频带进行LTP处理时,可以得到所述全频带的残差频域系数。
其中,所述代价函数可以包括高频带的代价函数、低频带的代价函数和/或所述当前帧的全频带的代价函数,所述高频带可以为所述当前帧的全频带中大于截止频点的频带,所述低频带可以为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点可以用于划分所述低频带和所述高频带。
在本申请实施例中,上述截止频点可以通过以下两种方式确定:
方式一:
可以根据所述参考信号的频谱系数,确定所述截止频点。
可选地,可以根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
进一步地,可以根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;将所述顶峰因子集合中满足预设条件的顶峰因子的最大值,作为所述截止频点。
其中,所述预设条件可以为所述顶峰因子集合中大于第六阈值中的(一个或多个)顶峰因子中的最大值。
例如,可以通过以下公式计算顶峰因子集合:
P=argk{((Xref[k]>Xref[k-1])and(Xref[k]>Xref[k=1]))>0,k=0,1,...,M-1}
其中,CFp为顶峰因子集合,P为满足条件的k值集合,w为滑动窗口的大小,p为集合P中的一个元素。
则,低频MDCT系数的截止频点系数索引值stopLine可以通过下式确定:
stopLine=max{p|CFp>thr6,p∈P}
其中,thr6为所述第六阈值。
方式二:
所述截止频点可以为预设值。具体地,可以根据经验,将所述截止频点预先设定为预设值。
例如,假设当前帧的处理信号为48k赫兹(Hz)的采样信号,经过480点MDCT变换,获得480点MDCT系数,则截止频点的索引可以预先设定为200,其对应的截止频率为10kHz。
下面以所述左声道信号为例进行说明,也就是说,下述描述并不限定是所述左声道信号或所述右声道信号,在本申请实施例中,所述左声道信号与所述右声道信号处理方法相同。
可以计算高频带的代价函数、低频带的代价函数或所述当前帧的全频带的代价函数中的至少两项。
可选地,可以通过以下两种方法计算代价函数:
方法一:
可选地,所述代价函数可以为所述当前帧的当前频带的预测增益。
例如,高频带的代价函数可以为所述高频带的预测增益,所述低频带的代价函数可以为所述低频带的预测增益,所述全频带的代价函数可以为所述全频带的预测增益。
例如,可以通过以下公式计算所述代价函数:
其中,X[k]为所述当前帧的左声道的目标频域系数,Xref[k]为所述参考目标频域系数,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,gLFi为第i子帧的低频带的预测增益,gHFi为第i子帧的高频带的预测增益,gFBi第i子帧的全频预测增益,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
方法二:
可选地,所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值。
其中,所述估计残差频域系数可以为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值,所述预测频域系数可以是根据所述当前帧的当前频带的参考频域系数与预测增益获得的,所述当前频带为所述低频带、高频带或全频带。
例如,所述预测频域系数可以是所述当前帧的当前频带的参考频域系数与预测增益的乘积。
例如,所述高频带的代价函数可以为所述高频带的残差频域系数的能量与所述高频带信号的能量的比值,所述低频带的代价函数可以为所述低频带的残差频域系数的能量与所述低频带信号的能量的比值,所述全频带的代价函数可以为所述全频带的残差频域系数的能量与所述全频带信号的能量的比值。
例如,可以通过以下公式计算所述代价函数:
其中,rHFi为所述高频带的残差频域系数的能量与所述高频带信号的能量的比值,rLFi为所述低频带的残差频域系数的能量与所述低频带信号的能量的比值,rFBi所述全频带的残差频域系数的能量与所述全频带信号的能量的比值,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,gLFi为第i子帧的低频带的预测增益,gHFi为第i子帧的高频带的预测增益,gFBi第i子帧的全频预测增益,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
进一步地,可以根据所述代价函数,确定第一标识和/或第二标识。
具体地,根据确定出的标识不同,可以分为以下两种方式对所述当前帧的目标频域系数进行编码:
方式一:
可选地,可以根据所述代价函数,确定第一标识和/或第二标识;可以根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码。
其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,所述第二标识可以用于指示所述当前帧中进行LTP处理的频带。
可选地,在方式一中,所述第一标识及所述第二标识可以取不同的值,这些不同的值可以分别表示不同的含义。
例如,所述第一标识可以为第一值或第二值,所述第二标识可以为第三值或第四值。
其中,所述第一值可以用于指示对所述当前帧进行LTP处理,所述第二值可以用于指示不对所述当前帧进行LTP处理,所述第三值可以用于指示对所述全频带进行LTP处理,所述第四值可以用于指示对所述低频带进行LTP处理。
例如,所述第一值可以为1,所述第二值可以为0,所述第三值可以为2,所述第四值可以为3。
需要说明的是,上述实施例中示出的所述第一标识及所述第二标识的上述取值仅为示例而非限定。
进一步地,根据确定出的所述第一标识和/或所述第二标识不同,可以分为以下几种情况:
情况一:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,则所述第一标识可以为第一值,所述第二标识可以为第四值。
情况二:
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,则所述第一标识可以为第一值,所述第二标识可以为第三值。
情况三:
当所述低频带的代价函数不满足所述第一条件时,则所述第一标识可以为第二值。
情况四:
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,则所述第一标识可以为第二值。
情况五:
当所述全频带的代价函数满足所述第三条件时,则所述第一标识可以为第一值,所述第二标识可以为第三值。
在上述方式一中,当代价函数的定义不同时,所述第一条件、所述第二条件及所述第三条件也可以不同。
例如,当所述代价函数为所述当前帧的当前频带的预测增益时,所述第一条件可以为所述低频带的代价函数大于或等于第一阈值,所述第二条件可以为所述高频带的代价函数大于或等于第二阈值,所述第三条件可以为所述全频带的代价函数大于或等于所述第三阈值。
再例如,当所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值时,所述第一条件可以为所述低频带的代价函数小于第四阈值,所述第二条件可以为所述高频带的代价函数小于所述第四阈值,所述第三条件可以为所述全频带的代价函数大于或等于第五阈值。
其中,所述第一阈值、所述第二阈值、所述第三阈值、所述第四阈值及所述第五阈值均预先设定为0.5。
或者,所述第一阈值可以预先设定为0.45、所述第二阈值可以预先设定为0.5、所述第三阈值可以预先设定为0.55、所述第四阈值可以预先设定为0.6,所述第五阈值可以预先设定为0.65。
或者,所述第一阈值可以预先设定为0.4、所述第二阈值可以预先设定为0.4、所述第三阈值可以预先设定为0.5、所述第四阈值可以预先设定为0.6,所述第五阈值可以预先设定为0.7。
应理解,上述实施例中的取值仅为示例而非限定,所述第一阈值、所述第二阈值、所述第三阈值、所述第四阈值及所述第五阈值的取值均可以根据经验(或结合实际情况)预先设定,本申请实施例中对此并不限定。
方式二:
可选地,可以根据所述代价函数,确定第一标识;可以根据所述第一标识,对所述当前帧的目标频域系数进行编码。
其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识可以用于指示是否对所述当前帧进行LTP处理以及所述当前帧中进行LTP处理的频带。
可选地,在方式二中,所述第一标识也可以取不同的值,这些不同的值也可以分别表示不同的含义。
例如,所述第一标识可以为第一值或第二值,所述第二标识可以为第三值或第四值。
其中,所述第一值可以用于指示(对所述当前帧进行LTP处理且)对所述低频带进行LTP处理,所述第二值可以用于指示不对所述当前帧进行LTP处理,所述第三值可以用于指示(对所述当前帧进行LTP处理且)对所述全频带进行LTP处理。
例如,所述第一值可以为1,所述第二值可以为0,所述第三值可以为2。
需要说明的是,上述实施例中示出的所述第一标识的上述取值仅为示例而非限定。
进一步地,根据确定出的所述第一标识不同,可以分为以下几种情况:
情况一:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,则所述第一标识可以为第一值。
情况二:
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,则所述第一标识可以为第三值。
情况三:
当所述低频带的代价函数不满足所述第一条件时,则所述第一标识可以为第二值。
情况四:
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,则所述第一标识可以为第二值。
情况五:
当所述全频带的代价函数满足所述第三条件时,则所述第一标识可以为第三值。
在上述方式二中,当代价函数的定义不同时,所述第一条件、所述第二条件及所述第三条件也可以不同。
例如,当所述代价函数为所述当前帧的当前频带的预测增益时,所述第一条件可以为所述低频带的代价函数大于或等于第一阈值,所述第二条件可以为所述高频带的代价函数大于或等于第二阈值,所述第三条件可以为所述全频带的代价函数大于或等于所述第三阈值。
再例如,当所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值时,所述第一条件可以为所述低频带的代价函数小于第四阈值,所述第二条件可以为所述高频带的代价函数小于所述第四阈值,所述第三条件可以为所述全频带的代价函数大于或等于第五阈值。
其中,所述第一阈值、所述第二阈值、所述第三阈值、所述第四阈值及所述第五阈值均预先设定为0.5。
或者,所述第一阈值可以预先设定为0.45、所述第二阈值可以预先设定为0.5、所述第三阈值可以预先设定为0.55、所述第四阈值可以预先设定为0.6,所述第五阈值可以预先设定为0.65。
或者,所述第一阈值可以预先设定为0.4、所述第二阈值可以预先设定为0.4、所述第三阈值可以预先设定为0.5、所述第四阈值可以预先设定为0.6,所述第五阈值可以预先设定为0.7。
应理解,上述实施例中的取值仅为示例而非限定,所述第一阈值、所述第二阈值、所述第三阈值、所述第四阈值及所述第五阈值的取值均可以根据经验(或结合实际情况)预先设定,本申请实施例中对此并不限定。
需要说明的是,当所述第一标识指示不对所述当前帧进行LTP处理时,可以继续执行下述S740,并在执行完S740后直接对所述当前帧的目标频域系数进行编码;否则,可以直接执行下述S750(即不执行下述S740)。
S740,对所述当前帧进行立体声处理。
可选地,可以计算所述当前帧的左声道与所述当前帧的右声道的强度电平差(intensity level difference,ILD)。
例如,可以利用以下公式计算所述当前帧的左声道与所述当前帧的右声道的ILD:
其中,XL[k]为所述左声道信号的目标频域系数,XR[k]为所述右声道信号的目标频域系数,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
可选地,可以利用上述公式计算得到的ILD,调整左声道信号的能量及右声道信号的能量。具体的调整方法如下:
根据ILD计算左声道信号的能量及右声道信号的能量的比值。
例如,可以通过以下公式计算计算左声道信号的能量及右声道信号的能量的比值,可以将该比值记为nrgRatio:
如果比值nrgRatio大于1.0,则通过下述公式调整右声道的MDCT系数:
其中,公式左侧的XrefR[k]代表调整后的右声道的MDCT系数,公式右侧的XR[k]代表调整前的右声道的MDCT系数。
如果nrgRatio小于1.0,则通过下述公式调整左声道的MDCT系数:
其中,公式左侧的XrefL[k]代表调整后的左声道的MDCT系数,公式右侧的XL[k]代表调整前的左声道的MDCT系数。
根据调整后的左声道信号的目标频域系数XrefR[k]和调整后的右声道信号的目标频域系数XrefL[k],计算所述当前帧的和差立体声(mid/side stereo,MS)信号:
其中,XM[k]为M通道的和差立体声信号,XS[k]为S通道的和差立体声信号,XrefL[k]为调整后的所述左声道信号的目标频域系数,XrefR[k]为调整后的所述右声道信号的目标频域系数,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
S750,对所述当前帧进行立体声判决。
可选地,可以对所述左声道信号的目标频域系数XL[k]进行标量量化和算术编码,得到所述左声道信号量化需要的比特数,可以将所述左声道信号量化需要的比特数记为bitL。
可选地,也可以对所述右声道信号的目标频域系数XR[k]进行标量量化和算术编码,得到所述右声道信号量化需要的比特数,可以将所述右声道信号量化需要的比特数记为bitR。
可选地,也可以对所述和差立体声信号XM[k]进行标量量化和算术编码,得到所述XM[k]量化需要的比特数,可以将所述XM[k]量化需要的比特数记为bitM。
可选地,还可以对所述和差立体声信号XS[k]进行标量量化和算术编码,得到所述XS[k]量化需要的比特数,可以将所述XS[k]量化需要的比特数记为bitS。
上述量化过程和比特估计过程具体可以参照现有技术,这里不再赘述。
此时,如果bitL+bitR大于bitM+bitS,则可以将立体声编码标识stereoMode设置为1,以表示后续编码时,需要对所述立体声信号XM[k]和XS[k]进行编码。
否则,可以将所述立体声编码标识stereoMode设置为0,以表示后续编码时,需要对XL[k]和XR[k]进行编码。
需要说明的是,在本申请实施例中,还可以对当前帧的目标频域进行LTP处理后,再对LTP处理后的所述当前帧的左声道信号和右声道信号进行立体声判决,即先执行S760,再执行S750。
S760,对所述当前帧的目标频域系数进行LTP处理。
可选地,对所述当前帧的目标频域系数进行LTP处理,可以分为以下两种情况:
情况一:
如果所述当前帧的LTP标识enableRALTP为1,且立体声编码标识stereoMode为0时,对XL[k]和XR[k]分别进行LTP处理:
XL[k]=XL[k]-gLi*XrefL[k]
XR[k]=XR[k]-gRi*XrefR[k]
其中,上述公式左侧的XL[k]为LTP合成后得到的所述左声道的残差频域系数,上述公式右侧的XL[k]为左声道信号的目标频域系数,上述公式左侧的XR[k]为LTP合成后得到的所述右声道的残差频域系数,上述公式右侧的XR[k]为右声道信号的目标频域系数,XrefL为左声道经过TNS和FDNS处理后的参考信号,XrefR为右声道经过TNS和FDNS处理后的参考信号,gLi可以为左声道的第i个子帧的LTP预测增益,gRi可以为右声道信号的第i个子帧的LTP预测增益,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
进一步地,在本申请实施例中,还可以根据前述S730中确定的第一标识和/或第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数。
例如,对所述高频带进行LTP处理时,可以得到所述高频带的残差频域系数;对所述低频带进行LTP处理时,可以得到所述低频带的残差频域系数;对所述全频带进行LTP处理时,可以得到所述全频带的残差频域系数。
下面以所述左声道信号为例进行说明,也就是说,下述描述并不限定是所述左声道信号或所述右声道信号,在本申请实施例中,所述左声道信号与所述右声道信号处理方法相同。
例如,当所述第一标识和/或所述第二标识满足所述S730中根据确定出的标识对所述当前帧的目标频域系数进行编码的方式一中的情况一时,可以通过下述公式对低频带进行LTP处理:
其中,XrefL为左声道的参考目标频域系数,gLFi为左声道第i子帧的低频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
当所述第一标识和/或所述第二标识满足所述S730中根据确定出的标识对所述当前帧的目标频域系数进行编码的方式一中的情况二或情况五时,可以通过下述公式对全频带进行LTP处理:
XL[k]=XL[k]-gFBi*XrefL[k]
其中,XrefL为左声道的参考目标频域系数,gFBi为左声道第i子帧的全频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
再例如,当所述第一标识满足所述S730中根据确定出的标识对所述当前帧的目标频域系数进行编码的方式二中的情况一时,可以通过下述公式对低频带进行LTP处理:
其中,XrefL为左声道的参考目标频域系数,gLFi为左声道第i子帧的低频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
当所述第一标识满足所述S730中根据确定出的标识对所述当前帧的目标频域系数进行编码的方式二中的情况二或情况五时,可以通过下述公式对全频带进行LTP处理:
XL[k]=XL[k]-gFBi*XrefL[k]
其中,XrefL为左声道的参考目标频域系数,gFBi为左声道第i子帧的全频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
接下来,可以对LTP处理后的XL[k]和XR[k](即所述左声道信号的残差频域系数XL[k]及右声道信号的残差频域系数XR[k])进行算术编码。
情况二:
如果所述当前帧的LTP标识enableRALTP为1,且立体声编码标识stereoMode为1时,对XM[k]和XS[k]分别进行LTP处理:
XM[k]=XM[k]-gMi*XrefM[k]
XS[k]=XS[k]-gSi*XrefS[k]
其中,上述公式左侧的XM[k]为LTP合成后得到的M通道的残差频域系数,上述公式右侧的XM[k]为M通道的残差频域系数,上述公式左侧的XS[k]为LTP合成后得到的S通道的残差频域系数,上述公式右侧的XS[k]为S通道的残差频域系数,gMi为M通道第i子帧的LTP预测增益,gSi为M通道第i子帧的LTP预测增益,M为参与LTP处理的MDCT系数的个数,i及k为正整数,且0≤k≤M,XrefM和XrefS为经过和差立体声处理后的参考信号,具体如下:
进一步地,在本申请实施例中,还可以根据前述S730中确定的第一标识和/或第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数。
例如,对所述高频带进行LTP处理时,可以得到所述高频带的残差频域系数;对所述低频带进行LTP处理时,可以得到所述低频带的残差频域系数;对所述全频带进行LTP处理时,可以得到所述全频带的残差频域系数。
下面以所述M声道信号为例进行说明,也就是说,下述描述并不限定是所述M声道信号或所述S声道信号,在本申请实施例中,所述M声道信号与所述S声道信号处理方法相同。
例如,当所述第一标识和/或所述第二标识满足所述S730中根据确定出的标识对所述当前帧的目标频域系数进行编码的方式一中的情况一时,可以通过下述公式对低频带进行LTP处理:
其中,XrefM为M通道的参考目标频域系数,gLFi为M通道第i子帧的低频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
当所述第一标识和/或所述第二标识满足所述S730中根据确定出的标识对所述当前帧的目标频域系数进行编码的方式一中的情况二或情况五时,可以通过下述公式对全频带进行LTP处理:
XM[k]=XM[k]-gFBi*XrefM[k]
其中,XrefM为M通道的参考目标频域系数,gFBi为M通道第i子帧的全频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
再例如,当所述第一标识满足所述S730中根据确定出的标识对所述当前帧的目标频域系数进行编码的方式二中的情况一时,可以通过下述公式对低频带进行LTP处理:
其中,XrefM为M通道的参考目标频域系数,gLFi为M通道第i子帧的低频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
当所述第一标识满足所述S730中根据确定出的标识对所述当前帧的目标频域系数进行编码的方式二中的情况二或情况五时,可以通过下述公式对全频带进行LTP处理:
XM[k]=XM[k]-gFBi*XrefM[k]
其中,XrefM为M通道的参考目标频域系数,gFBi为M通道第i子帧的全频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
接下来,可以对LTP处理后的XM[k]和XS[k](即所述当前帧的残差频域系数)进行算术编码。
图8是本申请实施例的音频信号的解码方法800的示意性流程图。该方法800可以由解码端执行,该解码端可以是解码器或者是具有解码音频信号功能的设备。该方法800具体包括:
S810,解析码流得到当前帧的解码频域系数。
可选地,还可以解析码流得到滤波参数。
其中,所述滤波参数可以用于对所述当前帧的频域系数进行滤波处理,所述滤波处理可以包括时域噪声整形(temporary noise shaping,TNS)处理和/或频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
可选地,在S810中,解析码流可以得到当前帧的残差频域系数。
S820,解析码流得到第一标识。
其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识可以用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带。
例如,当所述第一标识为第一值时,所述当前帧的解码频域系数为所述当前帧的残差频域系数,所述第一值可以用于指示对所述当前帧进行长时预测LTP处理。
当所述第一标识为第二值时,所述当前帧的解码频域系数为所述当前帧的目标频域系数,所述第二值可以用于指示不对所述当前帧进行长时预测LTP处理。
可选地,所述当前帧中进行LTP处理的频带可以包括高频带、低频带或全频带。其中,所述高频带可以为所述当前帧的全频带中大于截止频点的频带,所述低频带可以为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点可以用于划分所述低频带和所述高频带。
在本申请实施例中,上述截止频点可以通过以下两种方式确定:
方式一:
可以根据所述参考信号的频谱系数,确定所述截止频点。
进一步地,可以根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
其中,所述预设条件可以为所述顶峰因子集合中大于第六阈值中的(一个或多个)顶峰因子中的最大值。
例如,可以根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;将所述顶峰因子集合中大于第六阈值的(一个或多个)顶峰因子的最大值,作为所述截止频点。
方式二:
所述截止频点可以为预设值。具体地,可以根据经验,将所述截止频点预先设定为预设值。
例如,假设当前帧的处理信号为48k赫兹(Hz)的采样信号,经过480点MDCT变换,获得480点MDCT系数,则截止频点的索引可以预先设定为200,其对应的截止频率为10kHz。
S830,根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数。
可选地,根据S820中确定出的所述第一标识不同,可以分为以下两种方式:
方式一:
可选地,可以解析码流得到第一标识;当所述第一标识为第一值时,可以解析码流得到第二标识。
其中,所述第二标识可以用于指示所述当前帧中进行LTP处理的频带。
可选地,在方式一中,所述第一标识及所述第二标识可以取不同的值,这些不同的值可以分别表示不同的含义。
例如,所述第一标识可以为第一值或第二值,所述第二标识可以为第三值或第四值。
其中,所述第一值可以为1,用于指示对所述当前帧进行LTP处理,所述第二值可以为0,用于指示不对所述当前帧进行LTP处理,所述第三值可以为2,用于指示对所述全频带进行LTP处理,所述第四值可以为3,用于指示对所述低频带进行LTP处理。
需要说明的是,上述实施例中示出的所述第一标识及所述第二标识的上述取值仅为示例而非限定。
进一步地,根据确定出的所述第一标识和/或所述第二标识不同,可以分为以下几种情况:
情况一:
当所述第一标识为第一值,且所述第二标识为第四值时,获得所述当前帧的参考目标频域系数。
接下来,可以对所述低频带的预测增益、所述当前帧的参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;并对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数。
情况二:
当所述第一标识为第一值,且所述第二标识为第三值时,获得所述当前帧的参考目标频域系数。
接下来,可以对所述全频带的预测增益、所述当前帧的参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;并对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数。
情况三:
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数。
其中,(对所述当前帧的目标频域系数进行的)所述处理可以是逆滤波处理,所述逆滤波处理可以包括逆时域噪声整形(temporary noise shaping,TNS)处理和/或逆频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述逆滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
方式二:
可选地,可以解析码流得到第一标识。
其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识可以用于指示是否对所述当前帧进行LTP处理以及所述当前帧中进行LTP处理的频带。
可选地,在方式二中,所述第一标识也可以取不同的值,这些不同的值也可以分别表示不同的含义。
例如,所述第一标识可以为第一值或第二值,所述第二标识可以为第三值或第四值。
其中,所述第一值可以为1,用于指示(对所述当前帧进行LTP处理且)对所述低频带进行LTP处理,所述第二值可以为0,用于指示不对所述当前帧进行LTP处理,所述第三值可以为2,用于指示(对所述当前帧进行LTP处理且)对所述全频带进行LTP处理。
需要说明的是,上述实施例中示出的所述第一标识的上述取值仅为示例而非限定。
进一步地,根据确定出的所述第一标识不同,可以分为以下几种情况:
情况一:
当所述第一标识为第一值时,获得所述当前帧的参考目标频域系数。
接下来,可以对所述低频带的预测增益、所述当前帧的参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;并对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数。
情况二:
当所述第一标识为第三值时,获得所述当前帧的参考目标频域系数。
接下来,可以对所述全频带的预测增益、所述当前帧的参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;并对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数。
情况三:
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数。
其中,(对所述当前帧的目标频域系数进行的)所述处理可以是逆滤波处理,所述逆滤波处理可以包括逆时域噪声整形(temporary noise shaping,TNS)处理和/或逆频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述逆滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
具体地,上述方式一或方式二中,可以通过以下方法获得所述当前帧的参考目标频域系数:
解析码流得到所述当前帧的基音周期;根据所述当前帧的基音周期确定所述当前帧的参考信号,对所述当前帧的参考信号进行转换,就可以得到所述当前帧的参考频域系数;根据所述滤波参数,对所述参考频域系数进行滤波处理,得到所述参考目标频域系数。其中,对所述当前帧的参考信号进行的转换可以是时频变换,所述时频变换可以是MDCT,DCT,FFT等变换方式。
下面结合图9,以立体声信号(即当前帧包括左声道信号和右声道信号)为例,对本申请实施例的音频信号的解码方法的详细过程进行描述。
应理解,图9所示的实施例仅为示例而非限定,本申请实施例中的音频信号也可以为单声道信号或多声道信号,本申请实施例中对此并不限定。
图9是本申请实施例的音频信号的解码方法的示意性流程图。该方法900可以由解码端执行,该解码端可以是解码器或者是具有解码音频信号功能的设备。该方法900具体包括:
S910,解析码流得到当前帧的目标频域系数。
可选地,解析码流还可以得到变换系数。
其中,所述滤波参数可以用于对所述当前帧的频域系数进行滤波处理,所述滤波处理可以包括时域噪声整形(temporary noise shaping,TNS)处理和/或频域噪声整形(frequency domain noise shaping,FDNS)处理,或者,所述滤波处理也可以包括其他处理,本申请实施例中对此并不限定。
可选地,在S910中,解析码流可以得到当前帧的残差频域系数。
具体的解析码流的方法可以参照现有技术,这里不再赘述。
S920,解析码流得到所述当前帧的LTP标识。
其中,所述LTP标识可以用于指示是否对所述当前帧进行长时预测LTP处理。
例如,当所述LTP标识为第一值时,解析码流得到当前帧的残差频域系数,所述第一值可以用于指示对所述当前帧进行长时预测LTP处理。
当所述LTP标识为第二值时,解析码流得到当前帧的目标频域系数,所述第二值可以用于指示不对所述当前帧进行长时预测LTP处理。
需要说明的是,当所述当前帧包括左声道信号和右声道信号时,所述当前帧的LTP标识可以包括以下两种方式进行指示。
方式一:
所述当前帧的LTP标识可以用于指示是否同时对所述当前帧进行LTP处理。
进一步地,所述LTP标识可以包括如图6方法600中的实施例所述第一标识和/或第二标识。
例如,所述LTP标识可以包括第一标识和第二标识。其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,所述第二标识可以用于指示所述当前帧中进行LTP处理的频带。
再例如,所述LTP标识可以为第一标识。其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,且在对所述当前帧进行LTP处理的情况下,还可以指示所述当前帧中进行LTP处理的频带(例如,所述当前帧的高频带、低频带或全频带)。
方式二:
所述当前帧的LTP标识可以分为左声道LTP标识和右声道LTP标识,所述左声道LTP标识可以用于指示是否对所述左声道信号进行LTP处理,所述右声道LTP标识可以用于指示是否对所述右声道信号进行LTP处理。
进一步地,如图6方法600中的实施例所述,所述左声道LTP标识可以包括左声道的第一标识和/或所述左声道的第二标识,所述右声道LTP标识可以包括右声道的第一标识和/或所述右声道的第二标识。
下面以所述左声道LTP标识为例进行说明,所述右声道LTP标识与所述左声道LTP标识类似,这里不再赘述。
例如,所述左声道LTP标识可以包括左声道的第一标识和左声道的第二标识。其中,所述左声道的第一标识可以用于指示是否对所述左声道进行LTP处理,所述第二标识可以用于指示所述左声道中进行LTP处理的频带。
再例如,所述左声道LTP标识可以为左声道的第一标识。其中,所述左声道的第一标识可以用于指示是否对所述左声道进行LTP处理,且在对所述左声道进行LTP处理的情况下,还可以指示所述左声道中进行LTP处理的频带(例如,所述左声道的高频带、低频带或全频带)。
关于上述两种方式中的第一标识及第二标识的具体描述可以参考图6中的实施例,这里不再赘述。
在方法900的实施例中,所述当前帧的LTP标识可以采用方式一进行指示,应理解,方法900中的实施例仅为示例而非限定,方法900中的所述当前帧的LTP标识也可以采用方式二进行指示,本申请实施例中对此并不限定。
在本申请实施例中,还可以将所述当前帧的带宽分为高频带、低频带及全频带。
此时,可以解析码流得到第一标识。
其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识可以用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带。
可选地,所述当前帧中进行LTP处理的频带可以包括高频带、低频带或全频带。其中,所述高频带可以为所述当前帧的全频带中大于截止频点的频带,所述低频带可以为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点可以用于划分所述低频带和所述高频带。
在本申请实施例中,上述截止频点可以通过以下两种方式确定:
方式一:
可以根据所述参考信号的频谱系数,确定所述截止频点。
可选地,可以根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
进一步地,可以根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;将所述顶峰因子集合中满足预设条件的顶峰因子的最大值,作为所述截止频点。
其中,所述预设条件可以为所述顶峰因子集合中大于第六阈值中的(一个或多个)顶峰因子中的最大值。
例如,可以通过以下公式计算顶峰因子集合:
P=argk{((Xref[k]>Xref[k-1])and(Xref[k]>Xref[k=1]))>0,k=0,1,...,M-1}
其中,CFp为顶峰因子集合,P为满足条件的k值集合,w为滑动窗口的大小,p为集合P中的一个元素。
则,低频MDCT系数的截止频点系数索引值stopLine可以通过下式确定:
stopLine=max{p|CFp>thr6,p∈P}
其中,thr6为所述第六阈值。
方式二:
所述截止频点可以为预设值。具体地,可以根据经验,将所述截止频点预先设定为预设值。
例如,假设当前帧的处理信号为48k赫兹(Hz)的采样信号,经过480点MDCT变换,获得480点MDCT系数,则截止频点的索引可以预先设定为200,其对应的截止频率为10kHz。
进一步地,可以根据所述第一标识,确定是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带。
具体地,根据解码出的所述第一标识不同,可以分为以下两种方式:
方式一:
可选地,可以解析码流得到第一标识;当所述第一标识为第一值时,可以解析码流得到第二标识。
其中,所述第二标识可以用于指示所述当前帧中进行LTP处理的频带。
可选地,在方式一中,所述第一标识及所述第二标识可以取不同的值,这些不同的值可以分别表示不同的含义。
例如,所述第一标识可以为第一值或第二值,所述第二标识可以为第三值或第四值。
其中,所述第一值可以用于指示对所述当前帧进行LTP处理,所述第二值可以用于指示不对所述当前帧进行LTP处理,所述第三值可以用于指示对所述全频带进行LTP处理,所述第四值可以用于指示对所述低频带进行LTP处理。
例如,所述第一值可以为1,所述第二值可以为0,所述第三值可以为2,所述第四值可以为3。
需要说明的是,上述实施例中示出的所述第一标识及所述第二标识的上述取值仅为示例而非限定。
进一步地,根据解析码流得到的所述第一标识和/或所述第二标识不同,可以分为以下几种情况:
情况一:
当所述第一标识为第一值,且所述第二标识为第四值时,获得所述当前帧的参考目标频域系数。
情况二:
当所述第一标识为第一值,且所述第二标识为第三值时,获得所述当前帧的参考目标频域系数。
情况三:
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数。
方式二:
可选地,可以解析码流得到第一标识。
其中,所述第一标识可以用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识可以用于指示是否对所述当前帧进行LTP处理以及所述当前帧中进行LTP处理的频带。
可选地,在方式二中,所述第一标识也可以取不同的值,这些不同的值也可以分别表示不同的含义。
例如,所述第一标识可以为第一值或第二值,所述第二标识可以为第三值或第四值。
其中,所述第一值可以用于指示(对所述当前帧进行LTP处理且)对所述低频带进行LTP处理,所述第二值可以用于指示不对所述当前帧进行LTP处理,所述第三值可以用于指示(对所述当前帧进行LTP处理且)对所述全频带进行LTP处理。
例如,所述第一值可以为1,所述第二值可以为0,所述第三值可以为2。
需要说明的是,上述实施例中示出的所述第一标识的上述取值仅为示例而非限定。
进一步地,根据确定出的所述第一标识不同,可以分为以下几种情况:
情况一:
当所述第一标识为第一值时,获得所述当前帧的参考目标频域系数。
情况二:
当所述第一标识为第三值时,获得所述当前帧的参考目标频域系数。
情况三:
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数。
S930,获取所述当前帧的参考目标频域系数。
具体地,可以通过以下方法获得所述当前帧的参考目标频域系数:
解析码流得到所述当前帧的基音周期;根据所述当前帧的基音周期确定所述当前帧的参考信号,对所述当前帧的参考信号进行转换,就可以得到所述当前帧的参考频域系数;根据所述滤波参数,对所述参考频域系数进行滤波处理,得到所述参考目标频域系数。其中,对所述当前帧的参考信号进行的转换可以是时频变换,所述时频变换可以是MDCT,DCT,FFT等变换方式。
例如,可以通过解析码流得到所述当前帧的基音周期;根据所述基音周期从历史缓冲区中获得所述当前帧的参考信号ref[j]。其中,在基音周期搜索时可以采用任意基音周期搜索方法,本申请实施例中对此并不限定。
ref[j]=syn[L-N-K+j],j=0,1,...,N-1
其中,历史缓冲区信号syn存储的是经过MDCT反变换获得的解码时域信号,长度为L=2N,N为帧长,K为基音周期。
历史缓冲区信号syn是通过对算术编码的残差信号进行解码,并进行LTP合成,然后利用上述S710获得的TNS参数和FDNS参数进行TNS逆处理和FDNS逆处理,然后经过MDCT反变换获得时域合成信号,并保存到历史缓冲区syn中。其中,TNS逆处理指的是与TNS处理(滤波)相反的操作,以获得经过TNS处理前的信号,FDNS逆处理指的是与FDNS处理(滤波)相反的操作,以获得经过FDNS处理前的信号。TNS逆处理和FDNS逆处理的具体方法可以参照现有技术,这里不再赘述。
可选地,对参考信号ref[j]进行MDCT变换,并利用上述S910获得的所述滤波参数对参考信号ref[j]的频域系数进行滤波处理,得到所述参考信号ref[j]的目标频域系数。
首先,可以使用TNS标识以及TNS参数对参考信号ref[j]的MDCT系数(即所述参考频域系数)进行TNS处理,得到TNS处理后的参考频域系数。
例如,当TNS标识为1时,利用TNS参数对参考信号的MDCT系数进行TNS处理。
接下来,可以使用FDNS参数对上述TNS处理后的参考频域系数进行FDNS处理,得到FDNS处理后的参考频域系数,即所述参考目标频域系数Xref[k]。
需要说明的是,在本申请实施例中,对TNS处理和FDNS处理的执行顺序并不限定,例如,也可以对所述参考频域系数(即所述参考信号的MDCT系数)先进行FDNS处理,再进行TNS处理,本申请实施例中对此并不限定。
特别地,当所述当前帧包括左声道信号和右声道信号时,所述参考目标频域系数Xref[k]包括左声道的参考目标频域系数XrefL[k]和右声道的参考目标频域系数XrefR[k]。
下面图9中以所述当前帧包括左声道信号和右声道信号为例,对本申请实施例的音频信号的解码方法的详细过程进行描述,应理解,图9所示的实施例仅为示例而非限定。
S940,对所述当前帧的残差频域系数进行LTP合成。
可选地,可以解析码流得到立体声编码标识stereoMode。
根据所述立体声编码标识stereoMode不同,可以分为以下两种情况:
情况一:
若所述立体声编码标识stereoMode为0,则S910中解析码流得到的所述当前帧的目标频域系数为所述当前帧的残差频域系数,例如,所述左声道信号的残差频域系数可以表示为XL[k],右声道信号的残差频域系数可以表示为XR[k]。
此时,可以对所述左声道信号的残差频域系数XL[k]和右声道信号的残差频域系数XR[k]进行LTP合成。
例如,可以使用下述公式进行LTP合成:
XL[k]=XL[k]+gLi*XrefL[k]
XR[k]=XR[k]+gRi*XrefR[k]
其中,上述公式左侧的XL[k]为LTP合成后得到的所述左声道的目标频域系数,上述公式右侧的XL[k]为左声道信号的目标频域系数,上述公式左侧的XR[k]为LTP合成后得到的所述右声道的目标频域系数,上述公式右侧的XR[k]为右声道信号的目标频域系数,XrefL为左声道的参考目标频域系数,XrefR为右声道的参考目标频域系数,gLi为左声道第i子帧的LTP预测增益,gRi为右声道第i子帧的LTP预测增益,M为参与LTP处理的MDCT系数的个数,i及k为正整数,且0≤k≤M。
进一步地,在本申请实施例中,还可以根据前述S920中解析码流得到的第一标识和/或第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP合成,得到所述当前帧的残差频域系数。
下面以所述左声道信号为例进行说明,也就是说,下述描述并不限定是所述左声道信号或所述右声道信号,在本申请实施例中,所述左声道信号与所述右声道信号处理方法相同。
例如,当解析码流得到的所述第一标识和/或所述第二标识满足所述S920中方式一中的情况一时,可以通过下述公式对低频带进行LTP合成:
其中,上述公式左侧的XL[k]为LTP合成后得到的所述左声道的残差频域系数,上述公式右侧的XL[k]为左声道信号的目标频域系数,XrefL为左声道的参考目标频域系数,gLFi为左声道第i子帧的低频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
当解析码流得到的所述第一标识和/或所述第二标识满足所述S920中方式一中的情况二或情况五时,可以通过下述公式对全频带进行LTP合成:
XL[k]=XL[k]+gFBi*XrefL[k]
其中,上述公式左侧的XL[k]为LTP合成后得到的所述左声道的残差频域系数,上述公式右侧的XL[k]为左声道信号的目标频域系数,XrefL为左声道的参考目标频域系数,gFBi为左声道第i子帧的全频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
再例如,当解析码流得到的所述第一标识和/或所述第二标识满足所述S920中方式二中的情况一时,可以通过下述公式对低频带进行LTP处理:
其中,XrefL为左声道的参考目标频域系数,gLFi为左声道第i子帧的低频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
当解析码流得到的所述第一标识和/或所述第二标识满足所述S920中方式二中的情况二或情况五时,可以通过下述公式对全频带进行LTP处理:
XL[k]=XL[k]+gFBi*XrefL[k]
其中,XrefL为左声道的参考目标频域系数,gFBi为左声道第i子帧的全频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
情况二:
若所述立体声编码标识stereoMode为1,则S910中解析码流得到的所述当前帧的目标频域系数为所述当前帧的和差立体声信号的残差频域系数,例如,所述当前帧的和差立体声信号的残差频域系数可以表示为XM[k]和XS[k]。
此时,可以对所述当前帧的和差立体声信号的残差频域系数XM[k]和XS[k]进行LTP合成。
例如,可以使用下述公式进行LTP合成:
XM[k]=XM[k]+gMi*XrefM[k]
XS[k]=XS[k]+gSi*XrefS[k]
其中,上述公式左侧的XM[k]为LTP合成后得到的所述当前帧的M通道的和差立体声信号,上述公式右侧的XM[k]为所述当前帧的M通道的残差频域系数,上述公式左侧的XS[k]为LTP合成后得到的所述当前帧的S通道的和差立体声信号,上述公式右侧的XS[k]为所述当前帧的S通道的残差频域系数,gMi为M通道第i子帧的LTP预测增益,gSi为M通道第i子帧的LTP预测增益,M为参与LTP处理的MDCT系数的个数,i及k为正整数,且0≤k≤M,XrefM和XrefS为和差立体声处理后的参考信号,具体如下:
进一步地,在本申请实施例中,还可以根据前述S920中解析码流得到的第一标识和/或第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP合成,得到所述当前帧的残差频域系数。
下面以所述M声道信号为例进行说明,也就是说,下述描述并不限定是所述M声道信号或所述S声道信号,在本申请实施例中,所述M声道信号与所述S声道信号处理方法相同。
例如,当解析码流得到的所述第一标识和/或所述第二标识满足所述S920中方式一中的情况一时,可以通过下述公式对低频带进行LTP处理:
其中,XrefM为M通道的参考目标频域系数,gLFi为M通道第i子帧的低频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
当解析码流得到的所述第一标识和/或所述第二标识满足所述S920中方式一中的情况二或情况五时,可以通过下述公式对全频带进行LTP处理:
XM[k]=XM[k]+gFBi*XrefM[k]
其中,XrefM为M通道的参考目标频域系数,gFBi为M通道第i子帧的全频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
再例如,当解析码流得到的所述第一标识和/或所述第二标识满足所述S920中方式二中的情况一时,可以通过下述公式对低频带进行LTP处理:
其中,XrefL为M通道的参考目标频域系数,gLFi为M通道第i子帧的低频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
当解析码流得到的所述第一标识和/或所述第二标识满足所述S920中方式二中的情况二或情况五时,可以通过下述公式对全频带进行LTP处理:
XM[k]=XM[k]+gFBi*XrefM[k]
其中,XrefM为M通道的参考目标频域系数,gFBi为M通道第i子帧的全频带预测增益,stopLine为低频MDCT系数的截止频点系数索引值,stopLine=M/2,,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
需要说明的是,在本申请实施例中,还可以对所述当前帧的残差频域系数进行立体声解码后,再对所述当前帧的残差频域系数进行LTP合成,即先执行S950,再执行S940。
S950,对所述当前帧的目标频域系数进行立体声解码。
可选地,若所述立体声编码标识stereoMode为1,则可以通过以下公式确定立体声编码后的所述当前帧的目标频域系数XL[k]和XR[k]:
其中,XM[k]为LTP合成后得到的所述当前帧的M通道的和差立体声信号,XS[k]为LTP合成后得到的所述当前帧的S通道的和差立体声信号,M为参与LTP处理的MDCT系数的个数,k为正整数,且0≤k≤M。
进一步地,若所述当前帧的LTP标识enableRALTP为0,则可以解析码流得到所述当前帧的左声道与所述当前帧的右声道的强度电平差ILD,获得左声道信号的能量及右声道信号的能量的比值nrgRatio,并更新左声道的MDCT参数及右声道MDCT参数(即左声道的目标频域系数及右声道的目标频域系数)。
例如,如果nrgRatio小于1.0,则通过下述公式调整左声道的MDCT系数:
其中,公式左侧的XrefL[k]代表调整后的左声道的MDCT系数,公式右侧的XL[k]代表调整前的左声道的MDCT系数。
如果比值nrgRatio大于10,则通过下述公式调整右声道的MDCT系数:
其中,公式左侧的XrefR[k]代表调整后的右声道的MDCT系数,公式右侧的XR[k]代表调整前的右声道的MDCT系数。
如果当前帧LTP标识enableRALTP为1,则不调整左声道的MDCT参数XL[k]及右声道MDCT参数XR[k]。
S960,对所述当前帧的目标频域系数进行逆滤波处理。
对上述立体声编码后的所述当前帧的目标频域系数进行逆滤波处理,得到所述当前帧的频域系数。
例如,可以对左声道的MDCT参数XL[k]及右声道MDCT参数XR[k]进行逆FDNS处理和逆TNS处理,就可以得到所述当前帧的频域系数。
接下来,对所述当前帧的频域系数进行MDCT逆操作,就可以得到所述当前帧的时域合成信号。
上文结合图1至图9对本申请实施例的音频信号的编码方法和解码方法进行了详细的描述。下面结合图10至图13对本申请实施例的音频信号的编码装置和解码装置进行描述,应理解,图10至图13中的编码装置与本申请实施例的音频信号的编码方法是对应的,并且该编码装置可以执行本申请实施例的音频信号的编码方法。而图10至图13中的解码装置与本申请实施例的音频信号的解码方法是对应的,并且该解码装置可以执行本申请实施例的音频信号的解码方法。为了简洁,下面适当省略重复的描述。
图10是本申请实施例的编码装置的示意性框图。图10所示的编码装置1000包括:
获取模块1010,用于获取当前帧的目标频域系数及所述当前帧的参考目标频域系数;
处理模块1020,用于根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,其中,所述代价函数用于确定在对所述当前帧的目标频域系数进行编码时是否对所述当前帧进行长时预测LTP处理;
编码模块1030,用于根据所述代价函数,对所述当前帧的目标频域系数进行编码。
可选地,所述代价函数包括所述当前帧的高频带的代价函数、所述当前帧的低频带的代价函数或所述当前帧的全频带的代价函数中的至少一项,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
可选地,所述代价函数为所述当前帧的当前频带的预测增益,或者,所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值;其中,所述估计残差频域系数为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值,所述预测频域系数是根据所述当前帧的当前频带的参考频域系数与所述预测增益获得的,所述当前频带为所述低频带、高频带或全频带。
可选地,所述编码模块1030具体用于:根据所述代价函数,确定第一标识和/或第二标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,所述第二标识用于指示所述当前帧中进行LTP处理的频带;
根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码。
可选地,所述编码模块1030具体用于:当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值,所述第二标识为第四值;其中,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理,所述第一值用于指示对所述当前帧进行LTP处理;或
当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
可选地,所述编码模块1030具体用于:
当所述第一标识为第一值时,根据所述第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;
对所述当前帧的残差频域系数进行编码;
将所述第一标识及所述第二标识的值写入码流;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;
将所述第一标识的值写入码流。
可选地,所述编码模块1030具体用于:
根据所述代价函数,确定第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;
根据所述第一标识,对所述当前帧的目标频域系数进行编码。
可选地,所述编码模块1030具体用于:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值;其中,所述第一值用于指示对所述低频带进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理;或
当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
可选地,所述编码模块1030具体用于:
根据所述第一标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;
对所述当前帧的残差频域系数进行编码;
将所述第一标识的值写入码流;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;
将所述第一标识的值写入码流。
可选地,所述第一条件为所述低频带的代价函数大于或等于第一阈值,所述第二条件为所述高频带的代价函数大于或等于第二阈值,所述第三条件为所述全频带的代价函数大于或等于所述第三阈值;或者,所述第一条件为所述低频带的代价函数小于第四阈值,所述第二条件为所述高频带的代价函数小于所述第四阈值,所述第三条件为所述全频带的代价函数大于或等于第五阈值。
可选地,所述处理模块1020还用于:根据所述参考信号的频谱系数,确定所述截止频点。
可选地,所述处理模块1020具体用于:
根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;
根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
可选地,所述截止频点为预设值。
图11是本申请实施例的解码装置的示意性框图。图11所示的解码装置1100包括:
解码模块1110,用于解析码流得到当前帧的解码频域系数;
所述解码模块1110,还用于解析码流得到第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;
处理模块1120,用于根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数。
可选地,所述当前帧中进行LTP处理的频带包括高频带、低频带或全频带,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
可选地,当所述第一标识为第一值时,所述当前帧的解码频域系数为所述当前帧的残差频域系数;当所述第一标识为第二值时,所述当前帧的解码频域系数为所述当前帧的目标频域系数。
可选地,所述解码模块1110具体用于:解析码流得到第一标识;当所述第一标识为第一值时,解析码流得到第二标识,所述第二标识用于指示所述当前帧中进行LTP处理的频带。
可选地,所述处理模块1120具体用于:当所述第一标识为第一值,且所述第二标识为第四值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第一值,且所述第二标识为第三值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第三值用于指示对所述全频带进行LTP处理;根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
可选地,所述处理模块1120具体用于:当所述第一标识为第一值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述低频带进行LTP处理;
根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第三值时,获得所述当前帧的参考目标频域系数,所述第三值用于指示对所述全频带进行LTP处理;
根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
可选地,所述处理模块1120具体用于:解析码流得到所述当前帧的基音周期;根据所述当前帧的基音周期,确定所述当前帧的参考频域系数;对所述参考频域系数进行处理,得到所述参考目标频域系数。
可选地,所述处理模块1120还用于:根据所述参考信号的频谱系数,确定所述截止频点。
可选地,所述处理模块1120具体用于:根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;
根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
可选地,所述截止频点为预设值。
图12是本申请实施例的编码装置的示意性框图。图12所示的编码装置1200包括:
存储器1210,用于存储程序。
处理器1220,用于执行所述存储器1210中存储的程序,当所述存储器1210中的程序被执行时,所述处理器1220具体用于:获取当前帧的目标频域系数及所述当前帧的参考目标频域系数;根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,其中,所述代价函数用于确定在对所述当前帧的目标频域系数进行编码时是否对所述当前帧进行长时预测LTP处理;根据所述代价函数,对所述当前帧的目标频域系数进行编码。
图13是本申请实施例的解码装置的示意性框图。图13所示的解码装置1300包括:
存储器1310,用于存储程序。
处理器1320,用于执行所述存储器1310中存储的程序,当所述存储器1310中的程序被执行时,所述处理器1320具体用于:解析码流得到当前帧的解码频域系数;解析码流得到第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数。
应理解,本申请实施例中的音频信号的编码方法以及音频信号的解码方法可以由下图14至图16中的终端设备或者网络设备执行。另外,本申请实施例中的编码装置和解码装置还可以设置在图14至图16中的终端设备或者网络设备中,具体地,本申请实施例中的编码装置可以是图14至图16中的终端设备或者网络设备中的音频信号编码器,本申请实施例中的解码装置可以是图14至图16中的终端设备或者网络设备中的音频信号解码器。
如图14所示,在音频通信中,第一终端设备中的音频信号编码器对采集到的音频信号进行编码,第一终端设备中的信道编码器可以对音频信号编码器得到的码流再进行信道编码,接下来,第一终端设备信道编码后得到的数据通过第一网络设备和第二网络设备传输到第二网络设备。第二终端设备在接收到第二网络设备的数据之后,第二终端设备的信道解码器进行信道解码,得到音频信号编码码流,第二终端设备的音频信号解码器再通过解码恢复出音频信号,由终端设备进行该音频信号的回放。这样就在不同的终端设备完成了音频通信。
应理解,在图14中,第二终端设备也可以对采集到的音频信号进行编码,最终通过第二网络设备和第二网络设备将最终编码得到的数据传输给第一终端设备,第一终端设备通过对数据进行信道解码和解码得到音频信号。
在图14中,第一网络设备和第二网络设备可以是无线网络通信设备或者有线网络通信设备。第一网络设备和第二网络设备之间可以通过数字信道进行通信。
图14中的第一终端设备或者第二终端设备可以执行本申请实施例的音频信号的编解码方法,本申请实施例中的编码装置、解码装置可以分别是第一终端设备或者第二终端设备中的音频信号编码器、音频信号解码器。
在音频通信中,网络设备可以实现音频信号编解码格式的转码。如图15所示,如果网络设备接收到的信号的编解码格式为其它音频信号解码器对应的编解码格式,那么,网络设备中的信道解码器对接收到的信号进行信道解码,得到其它音频信号解码器对应的编码码流,其它音频信号解码器对该编码码流进行解码,得到音频信号,音频信号编码器再对音频信号进行编码,得到音频信号的编码码流,最后,信道编码器再对音频信号的编码码流进行信道编码,得到最终的信号(该信号可以传输给终端设备或者其它的网络设备)。应理解,图15中的音频信号编码器对应的编解码格式与其它音频信号解码器对应的编解码格式不同。假设其它音频信号解码器对应的编解码格式为第一编解码格式,音频信号编码器对应的编解码格式为第二编解码格式,那么在图15中,通过网络设备就实现了将音频信号由第一编解码格式转化为第二编解码格式。
类似的,如图16所示,如果网络设备接收到的信号的编解码格式与音频信号解码器对应的编解码格式相同,那么,在网络设备的信道解码器进行信道解码得到音频信号的编码码流之后,可以由音频信号解码器对音频信号的编码码流进行解码,得到音频信号,接下来,再由其它音频信号编码器按照其它的编解码格式对该音频信号进行编码,得到其它音频信号编码器对应的编码码流,最后,信道编码器再对其它音频信号编码器对应的编码码流进行信道编码,得到最终的信号(该信号可以传输给终端设备或者其它的网络设备)。与图15中的情况相同,图16中的音频信号解码器对应的编解码格式与其它音频信号编码器对应的编解码格式也是不同的。如果其它音频信号编码器对应的编解码格式为第一编解码格式,音频信号解码器对应的编解码格式为第二编解码格式,那么在图16中,通过网络设备就实现了将音频信号由第二编解码格式转化为第一编解码格式。
在图15和图16中,其它音频编解码器和音频编解码器分别对应不同的编解码格式,因此,经过其它音频编解码器和音频编解码器的处理就实现了音频信号编解码格式的转码。
还应理解,图15中的音频信号编码器能够实现本申请实施例中的音频信号的编码方法,图16中的音频信号解码器能够实现本申请实施例的音频信号的解码方法。本申请实施例中的编码装置可以是图15中的网络设备中的音频信号编码器,本申请实施例中的解码装置可以是图15中的网络设备中的音频信号解码器。另外,图15和图16中的网络设备具体可以是无线网络通信设备或者有线网络通信设备。
应理解,本申请实施例中的音频信号的编码方法以及音频信号的解码方法也可以由下图17至图19中的终端设备或者网络设备执行。另外,本申请实施例中的编码装置和解码装置还可以设置在图17至图19中的终端设备或者网络设备中,具体地,本申请实施例中的编码装置可以是图17至图19中的终端设备或者网络设备中的多声道编码器中的音频信号编码器,本申请实施例中的解码装置可以是图17至图19中的终端设备或者网络设备中的多声道编码器中的音频信号解码器。
如图17所示,在音频通信中,第一终端设备中的多声道编码器中的音频信号编码器对由采集到的多声道信号生成的音频信号进行音频编码,多声道编码器得到的码流包含音频信号编码器得到的码流,第一终端设备中的信道编码器可以对多声道编码器得到的码流再进行信道编码,接下来,第一终端设备信道编码后得到的数据通过第一网络设备和第二网络设备传输到第二网络设备。第二终端设备在接收到第二网络设备的数据之后,第二终端设备的信道解码器进行信道解码,得到多声道信号的编码码流,多声道信号的编码码流包含了音频信号的编码码流,第二终端设备的多声道解码器中的音频信号解码器再通过解码恢复出音频信号,多声道解码器根据恢复出音频信号解码得到多声道信号,由第二终端设备进行该多声道信号的回放。这样就在不同的终端设备完成了音频通信。
应理解,在图17中,第二终端设备也可以对采集到的多声道信号进行编码(具体由第二终端设备中的多声道编码器中的音频信号编码器对由采集到的多声道信号生成的音频信号进行音频编码,然后再由第二终端设备中的信道编码器对多声道编码器得到的码流进行信道编码),最终通过第二网络设备和第二网络设备传输给第一终端设备,第一终端设备通过信道解码和多声道解码得到多声道信号。
在图17中,第一网络设备和第二网络设备可以是无线网络通信设备或者有线网络通信设备。第一网络设备和第二网络设备之间可以通过数字信道进行通信。
图17中的第一终端设备或者第二终端设备可以执行本申请实施例的音频信号的编解码方法。另外,本申请实施例中的编码装置可以是第一终端设备或者第二终端设备中的音频信号编码器,本申请实施例中的解码装置可以是第一终端设备或者第二终端设备中的音频信号解码器。
在音频通信中,网络设备可以实现音频信号编解码格式的转码。如图18所示,如果网络设备接收到的信号的编解码格式为其它多声道解码器对应的编解码格式,那么,网络设备中的信道解码器对接收到的信号进行信道解码,得到其它多声道解码器对应的编码码流,其它多声道解码器对该编码码流进行解码,得到多声道信号,多声道编码器再对多声道信号进行编码,得到多声道信号的编码码流,其中多声道编码器中的音频信号编码器对由多声道信号生成的音频信号进行音频编码得到音频信号的编码码流,多声道信号的编码码流包含了音频信号的编码码流,最后,信道编码器再对编码码流进行信道编码,得到最终的信号(该信号可以传输给终端设备或者其它的网络设备)。
类似的,如图19所示,如果网络设备接收到的信号的编解码格式与多声道解码器对应的编解码格式相同,那么,在网络设备的信道解码器进行信道解码得到多声道信号的编码码流之后,可以由多声道解码器对多声道信号的编码码流进行解码,得到多声道信号,其中多声道解码器中的音频信号解码器对多声道信号的编码码流中的音频信号的编码码流进行音频解码,接下来,再由其它多声道编码器按照其它的编解码格式对该多声道信号进行编码,得到其它多声道编码器对应的多声道信号的编码码流,最后,信道编码器再对其它多声道编码器对应的编码码流进行信道编码,得到最终的信号(该信号可以传输给终端设备或者其它的网络设备)。
应理解,在图18和图19中,其它多声道编解码器和多声道编解码器分别对应不同的编解码格式。例如,在图18中,其它音频信号解码器对应的编解码格式为第一编解码格式,多声道编码器对应的编解码格式为第二编解码格式,那么在图18中,通过网络设备就实现了将音频信号由第一编解码格式转化为第二编解码格式。类似地,在图19中,假设多声道解码器对应的编解码格式为第二编解码格式,其它音频信号编码器对应的编解码格式为第一编解码格式,那么在图19中,通过网络设备就实现了将音频信号由第二编解码格式转化为第一编解码格式。因此,经过其它多声道编解码器和多声道编解码的处理就实现了音频信号编解码格式的转码。
还应理解,图18中的音频信号编码器能够实现本申请中的音频信号的编码方法,图19中的音频信号解码器能够实现本申请中的音频信号的解码方法。本申请实施例中的编码装置可以是图19中的网络设备中的音频信号编码器,本申请实施例中的解码装置可以是图19中的网络设备中的音频信号解码器。另外,图18和图19中的网络设备具体可以是无线网络通信设备或者有线网络通信设备。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (44)

1.一种音频信号的编码方法,其特征在于,包括:
获取当前帧的目标频域系数及所述当前帧的参考目标频域系数;
根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,其中,所述代价函数用于确定在对所述当前帧的目标频域系数进行编码时是否对所述当前帧进行长时预测LTP处理;
根据所述代价函数,对所述当前帧的目标频域系数进行编码,其中,第一标识是根据所述代价函数确定的,当所述第一标识为第一值时,所述第一标识用于指示对所述当前帧的残差频域系数进行编码,当所述第一标识为第二值时,所述第一标识用于指示对所述当前帧的目标频域系数进行编码。
2.根据权利要求1所述的编码方法,其特征在于,所述代价函数包括所述当前帧的高频带的代价函数、所述当前帧的低频带的代价函数或所述当前帧的全频带的代价函数中的至少一项,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
3.根据权利要求2所述的编码方法,其特征在于,所述代价函数为所述当前帧的当前频带的预测增益,或者,所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值;其中,所述估计残差频域系数为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值,所述预测频域系数是根据所述当前帧的当前频带的参考频域系数与所述预测增益获得的,所述当前频带为所述低频带、高频带或全频带。
4.根据权利要求2或3所述的编码方法,其特征在于,所述根据所述代价函数,对所述当前帧的目标频域系数进行编码,包括:
根据所述代价函数,确定所述第一标识和/或第二标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,所述第二标识用于指示所述当前帧中进行LTP处理的频带;
根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码。
5.根据权利要求4所述的编码方法,其特征在于,所述根据所述代价函数,确定第一标识和/或第二标识,包括:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值,所述第二标识为第四值;其中,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理,所述第一值用于指示对所述当前帧进行LTP处理;或
当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
6.根据权利要求4所述的编码方法,其特征在于,所述根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码,包括:
当所述第一标识为第一值时,根据所述第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;
对所述当前帧的残差频域系数进行编码;
将所述第一标识及所述第二标识的值写入码流;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;
将所述第一标识的值写入码流。
7.根据权利要求2或3所述的编码方法,其特征在于,所述根据所述代价函数,对所述当前帧的目标频域系数进行编码,包括:
根据所述代价函数,确定所述第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;
根据所述第一标识,对所述当前帧的目标频域系数进行编码。
8.根据权利要求7所述的编码方法,其特征在于,所述根据所述代价函数,确定第一标识,包括:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值;其中,所述第一值用于指示对所述低频带进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理;或
当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
9.根据权利要求7所述的编码方法,其特征在于,所述根据所述第一标识,对所述当前帧的目标频域系数进行编码,包括:
根据所述第一标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;
对所述当前帧的残差频域系数进行编码;
将所述第一标识的值写入码流;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;
将所述第一标识的值写入码流。
10.根据权利要求5或8所述的编码方法,其特征在于,所述第一条件为所述低频带的代价函数大于或等于第一阈值,所述第二条件为所述高频带的代价函数大于或等于第二阈值,所述第三条件为所述全频带的代价函数大于或等于第三阈值;或者,
所述第一条件为所述低频带的代价函数小于第四阈值,所述第二条件为所述高频带的代价函数小于所述第四阈值,所述第三条件为所述全频带的代价函数大于或等于第五阈值。
11.根据权利要求2或3所述的编码方法,其特征在于,所述参考目标频域系数为所述当前帧的参考信号的目标频域系数,所述方法还包括:
根据所述参考信号的频谱系数,确定所述截止频点。
12.根据权利要求11所述的编码方法,其特征在于,所述根据所述参考信号的频谱系数,确定所述截止频点,包括:
根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;
根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
13.根据权利要求2或3所述的编码方法,其特征在于,所述截止频点为预设值。
14.一种音频信号的解码方法,其特征在于,包括:
解析码流得到当前帧的解码频域系数;
解析码流得到第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;
根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数,其中,当所述第一标识为第一值时,所述当前帧的解码频域系数为所述当前帧的残差频域系数,当所述第一标识为第二值时,所述当前帧的解码频域系数为所述当前帧的目标频域系数。
15.根据权利要求14所述的解码方法,其特征在于,所述当前帧中进行LTP处理的频带包括高频带、低频带或全频带,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
16.根据权利要求15所述的解码方法,其特征在于,所述解析码流得到第一标识,包括:
解析码流得到第一标识;
当所述第一标识为第一值时,解析码流得到第二标识,所述第二标识用于指示所述当前帧中进行LTP处理的频带。
17.根据权利要求16所述的解码方法,其特征在于,所述根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数,包括:
当所述第一标识为第一值,且所述第二标识为第四值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;
根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第一值,且所述第二标识为第三值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第三值用于指示对所述全频带进行LTP处理;
根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
18.根据权利要求15所述的解码方法,其特征在于,所述根据所述第一标识,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,包括:
当所述第一标识为第一值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述低频带进行LTP处理;
根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第三值时,获得所述当前帧的参考目标频域系数,所述第三值用于指示对所述全频带进行LTP处理;
根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
19.根据权利要求17或18所述的解码方法,其特征在于,所述获得所述当前帧的参考目标频域系数,包括:
解析码流得到所述当前帧的基音周期;
根据所述当前帧的基音周期,确定所述当前帧的参考频域系数;
对所述参考频域系数进行处理,得到所述参考目标频域系数。
20.根据权利要求17或18所述的解码方法,其特征在于,所述参考目标频域系数为所述当前帧的参考信号的目标频域系数,所述方法还包括:
根据所述参考信号的频谱系数,确定所述截止频点。
21.根据权利要求20所述的解码方法,其特征在于,所述根据所述参考信号的频谱系数,确定所述截止频点,包括:
根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;
根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
22.根据权利要求15至18中任一项所述的解码方法,其特征在于,所述截止频点为预设值。
23.一种音频信号的编码装置,其特征在于,包括:
获取模块,用于获取当前帧的目标频域系数及所述当前帧的参考目标频域系数;
处理模块,用于根据所述当前帧的目标频域系数及所述参考目标频域系数,计算代价函数,其中,所述代价函数用于确定在对所述当前帧的目标频域系数进行编码时是否对所述当前帧进行长时预测LTP处理;
编码模块,用于根据所述代价函数,对所述当前帧的目标频域系数进行编码,其中,第一标识是根据所述代价函数确定的,当所述第一标识为第一值时,所述第一标识用于指示对所述当前帧的残差频域系数进行编码,当所述第一标识为第二值时,所述第一标识用于指示对所述当前帧的目标频域系数进行编码。
24.根据权利要求23所述的编码装置,其特征在于,所述代价函数包括所述当前帧的高频带的代价函数、所述当前帧的低频带的代价函数或所述当前帧的全频带的代价函数中的至少一项,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
25.根据权利要求24所述的编码装置,其特征在于,所述代价函数为所述当前帧的当前频带的预测增益,或者,所述代价函数为所述当前帧的当前频带的估计残差频域系数的能量与所述当前频带的目标频域系数的能量的比值;其中,所述估计残差频域系数为所述当前频带的目标频域系数与所述当前频带的预测频域系数之间的差值,所述预测频域系数是根据所述当前帧的当前频带的参考频域系数与所述预测增益获得的,所述当前频带为所述低频带、高频带或全频带。
26.根据权利要求24或25所述的编码装置,其特征在于,所述编码模块具体用于:
根据所述代价函数,确定所述第一标识和/或第二标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,所述第二标识用于指示所述当前帧中进行LTP处理的频带;
根据所述第一标识和/或所述第二标识,对所述当前帧的目标频域系数进行编码。
27.根据权利要求26所述的编码装置,其特征在于,所述编码模块具体用于:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值,所述第二标识为第四值;其中,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理,所述第一值用于指示对所述当前帧进行LTP处理;或
当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第一值,所述第二标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
28.根据权利要求26所述的编码装置,其特征在于,所述编码模块具体用于:
当所述第一标识为第一值时,根据所述第二标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;
对所述当前帧的残差频域系数进行编码;
将所述第一标识及所述第二标识的值写入码流;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;
将所述第一标识的值写入码流。
29.根据权利要求24或25所述的编码装置,其特征在于,所述编码模块具体用于:
根据所述代价函数,确定所述第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;
根据所述第一标识,对所述当前帧的目标频域系数进行编码。
30.根据权利要求29所述的编码装置,其特征在于,所述编码模块具体用于:
当所述低频带的代价函数满足第一条件且所述高频带的代价函数不满足第二条件时,确定所述第一标识为第一值;其中,所述第一值用于指示对所述低频带进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述高频带的代价函数满足所述第二条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理;或
当所述低频带的代价函数不满足所述第一条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述低频带的代价函数满足所述第一条件且所述全频带的代价函数不满足第三条件时,确定所述第一标识为第二值;其中,所述第二值用于指示不对所述当前帧进行LTP处理;或
当所述全频带的代价函数满足所述第三条件时,确定所述第一标识为第三值;其中,所述第三值用于指示对所述全频带进行LTP处理。
31.根据权利要求29所述的编码装置,其特征在于,所述编码模块具体用于:
根据所述第一标识,对所述当前帧的所述高频带、所述低频带或所述全频带中的至少一项进行LTP处理,得到所述当前帧的残差频域系数;
对所述当前帧的残差频域系数进行编码;
将所述第一标识的值写入码流;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行编码;
将所述第一标识的值写入码流。
32.根据权利要求27或30所述的编码装置,其特征在于,所述第一条件为所述低频带的代价函数大于或等于第一阈值,所述第二条件为所述高频带的代价函数大于或等于第二阈值,所述第三条件为所述全频带的代价函数大于或等于第三阈值;或者,
所述第一条件为所述低频带的代价函数小于第四阈值,所述第二条件为所述高频带的代价函数小于所述第四阈值,所述第三条件为所述全频带的代价函数大于或等于第五阈值。
33.根据权利要求24或25所述的编码装置,其特征在于,所述参考目标频域系数为所述当前帧的参考信号的目标频域系数,所述处理模块还用于:
根据所述参考信号的频谱系数,确定所述截止频点。
34.根据权利要求33所述的编码装置,其特征在于,所述处理模块具体用于:
根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;
根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
35.根据权利要求24至32中任一项所述的编码装置,其特征在于,所述截止频点为预设值。
36.一种音频信号的解码装置,其特征在于,包括:
解码模块,用于解析码流得到当前帧的解码频域系数;
所述解码模块,还用于解析码流得到第一标识,所述第一标识用于指示是否对所述当前帧进行LTP处理,或者,所述第一标识用于指示是否对所述当前帧进行LTP处理、和/或所述当前帧中进行LTP处理的频带;
处理模块,用于根据所述第一标识,对所述当前帧的解码频域系数进行处理,得到所述当前帧的频域系数,其中,当所述第一标识为第一值时,所述当前帧的解码频域系数为所述当前帧的残差频域系数,当所述第一标识为第二值时,所述当前帧的解码频域系数为所述当前帧的目标频域系数。
37.根据权利要求36所述的解码装置,其特征在于,所述当前帧中进行LTP处理的频带包括高频带、低频带或全频带,所述高频带为所述当前帧的全频带中大于截止频点的频带,所述低频带为所述当前帧的全频带中小于或等于所述截止频点的频带,所述截止频点用于划分所述低频带和所述高频带。
38.根据权利要求37所述的解码装置,其特征在于,所述解码模块具体用于:
解析码流得到第一标识;
当所述第一标识为第一值时,解析码流得到第二标识,所述第二标识用于指示所述当前帧中进行LTP处理的频带。
39.根据权利要求38所述的解码装置,其特征在于,所述处理模块具体用于:
当所述第一标识为第一值,且所述第二标识为第四值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第四值用于指示对所述低频带进行LTP处理;
根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第一值,且所述第二标识为第三值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述当前帧进行LTP处理,所述第三值用于指示对所述全频带进行LTP处理;
根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
40.根据权利要求37所述的解码装置,其特征在于,所述处理模块具体用于:
当所述第一标识为第一值时,获得所述当前帧的参考目标频域系数,所述第一值用于指示对所述低频带进行LTP处理;
根据所述低频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第三值时,获得所述当前帧的参考目标频域系数,所述第三值用于指示对所述全频带进行LTP处理;
根据所述全频带的预测增益、所述参考目标频域系数及所述当前帧的残差频域系数进行LTP合成,得到所述当前帧的目标频域系数;
对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数;或
当所述第一标识为第二值时,对所述当前帧的目标频域系数进行处理,得到所述当前帧的频域系数,所述第二值用于指示不对所述当前帧进行LTP处理。
41.根据权利要求39或40所述的解码装置,其特征在于,所述处理模块具体用于:
解析码流得到所述当前帧的基音周期;
根据所述当前帧的基音周期,确定所述当前帧的参考频域系数;
对所述参考频域系数进行处理,得到所述参考目标频域系数。
42.根据权利要求39或40所述的解码装置,其特征在于,所述参考目标频域系数为所述当前帧的参考信号的目标频域系数,所述处理模块还用于:
根据所述参考信号的频谱系数,确定所述截止频点。
43.根据权利要求42所述的解码装置,其特征在于,所述处理模块具体用于:
根据所述参考信号的频谱系数,确定所述参考信号对应的顶峰因子集合;
根据所述顶峰因子集合中满足预设条件的顶峰因子,确定所述截止频点。
44.根据权利要求37至40中任一项所述的解码装置,其特征在于,所述截止频点为预设值。
CN201911418539.8A 2019-12-31 2019-12-31 音频信号的编解码方法和编解码装置 Active CN113129913B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201911418539.8A CN113129913B (zh) 2019-12-31 2019-12-31 音频信号的编解码方法和编解码装置
EP20911265.5A EP4075429A4 (en) 2019-12-31 2020-12-30 AUDIO SIGNAL ENCODING AND DECODING METHOD AND AUDIO SIGNAL ENCODING AND DECODING DEVICE
PCT/CN2020/141249 WO2021136344A1 (zh) 2019-12-31 2020-12-30 音频信号的编解码方法和编解码装置
US17/853,173 US20220335961A1 (en) 2019-12-31 2022-06-29 Audio signal encoding method and apparatus, and audio signal decoding method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911418539.8A CN113129913B (zh) 2019-12-31 2019-12-31 音频信号的编解码方法和编解码装置

Publications (2)

Publication Number Publication Date
CN113129913A CN113129913A (zh) 2021-07-16
CN113129913B true CN113129913B (zh) 2024-05-03

Family

ID=76685866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911418539.8A Active CN113129913B (zh) 2019-12-31 2019-12-31 音频信号的编解码方法和编解码装置

Country Status (4)

Country Link
US (1) US20220335961A1 (zh)
EP (1) EP4075429A4 (zh)
CN (1) CN113129913B (zh)
WO (1) WO2021136344A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113129910A (zh) * 2019-12-31 2021-07-16 华为技术有限公司 音频信号的编解码方法和编解码装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124093A (ja) * 1996-10-16 1998-05-15 Ricoh Co Ltd 音声圧縮符号化方法および装置
JP2003271199A (ja) * 2002-03-15 2003-09-25 Nippon Hoso Kyokai <Nhk> オーディオ信号の符号化方法及び符号化装置
CN1677490A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
CN101599272A (zh) * 2008-12-30 2009-12-09 华为技术有限公司 基音搜索方法及装置
CN101615395A (zh) * 2008-12-31 2009-12-30 华为技术有限公司 信号编码、解码方法及装置、系统
CN101939781A (zh) * 2008-01-04 2011-01-05 杜比国际公司 音频编码器和解码器
CN102124517A (zh) * 2008-07-11 2011-07-13 弗朗霍夫应用科学研究促进协会 具有共用预处理的低比特率音频编码/解码方案

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2012201692B2 (en) * 2008-01-04 2013-05-16 Dolby International Ab Audio Encoder and Decoder
US11380340B2 (en) * 2016-09-09 2022-07-05 Dts, Inc. System and method for long term prediction in audio codecs

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10124093A (ja) * 1996-10-16 1998-05-15 Ricoh Co Ltd 音声圧縮符号化方法および装置
JP2003271199A (ja) * 2002-03-15 2003-09-25 Nippon Hoso Kyokai <Nhk> オーディオ信号の符号化方法及び符号化装置
CN1677490A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
CN101393743A (zh) * 2007-09-19 2009-03-25 中兴通讯股份有限公司 一种可配置参数的立体声编码装置及其编码方法
CN101939781A (zh) * 2008-01-04 2011-01-05 杜比国际公司 音频编码器和解码器
CN102124517A (zh) * 2008-07-11 2011-07-13 弗朗霍夫应用科学研究促进协会 具有共用预处理的低比特率音频编码/解码方案
CN101599272A (zh) * 2008-12-30 2009-12-09 华为技术有限公司 基音搜索方法及装置
CN101615395A (zh) * 2008-12-31 2009-12-30 华为技术有限公司 信号编码、解码方法及装置、系统

Also Published As

Publication number Publication date
WO2021136344A1 (zh) 2021-07-08
US20220335961A1 (en) 2022-10-20
CN113129913A (zh) 2021-07-16
EP4075429A1 (en) 2022-10-19
EP4075429A4 (en) 2023-01-18

Similar Documents

Publication Publication Date Title
TW201923750A (zh) 使用不同時間/頻率解析度編碼或解碼方向性音訊寫碼參數之設備及方法
EP1987595B1 (en) Method and apparatus for processing an audio signal
KR101370192B1 (ko) 오디오 코덱을 갖는 보청기 및 방법
KR20100095585A (ko) 신호 처리 방법 및 장치
KR20100086001A (ko) 오디오 신호 처리 방법 및 장치
JP2011013560A (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
US11640825B2 (en) Time-domain stereo encoding and decoding method and related product
WO2010139257A1 (zh) 压缩编码和解码的方法、编码器和解码器以及编码装置
KR100682915B1 (ko) 다채널 신호 부호화/복호화 방법 및 장치
KR102288111B1 (ko) 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치
CN113129913B (zh) 音频信号的编解码方法和编解码装置
KR102380642B1 (ko) 스테레오 신호 인코딩 방법 및 인코딩 장치
KR102380454B1 (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
WO2021136343A1 (zh) 音频信号的编解码方法和编解码装置
CN110728986B (zh) 立体声信号的编码方法、解码方法、编码装置和解码装置
KR102353050B1 (ko) 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스
KR100903109B1 (ko) 오디오 신호의 무손실 부호화/복호화 장치 및 그 방법
CN110660400B (zh) 立体声信号的编码、解码方法、编码装置和解码装置
KR20230020554A (ko) 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품
JP7318645B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
KR101644883B1 (ko) 오디오 신호 처리 방법 및 장치
CN115410585A (zh) 音频数据编解码方法和相关装置及计算机可读存储介质
JP2004170494A (ja) 音声符号化装置,音声符号化方法
KR20100054749A (ko) 신호의 처리 방법 및 이의 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant