CN113192517A - 一种音频编解码方法和音频编解码设备 - Google Patents
一种音频编解码方法和音频编解码设备 Download PDFInfo
- Publication number
- CN113192517A CN113192517A CN202010033973.0A CN202010033973A CN113192517A CN 113192517 A CN113192517 A CN 113192517A CN 202010033973 A CN202010033973 A CN 202010033973A CN 113192517 A CN113192517 A CN 113192517A
- Authority
- CN
- China
- Prior art keywords
- frequency region
- parameter
- current frequency
- component
- tone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 230000005236 sound signal Effects 0.000 claims abstract description 54
- 230000015654 memory Effects 0.000 claims description 37
- 238000001228 spectrum Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000011022 operating instruction Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本申请实施例公开了一种音频编解码方法和音频编解码设备,能够提高音频信号的解码质量。本申请实施例提供一种音频编码方法,所述方法包括:获取音频信号的当前帧,所述当前帧包括高频带信号;根据所述高频带信号获得所述当前帧的高频带参数,所述高频带参数用于表示所述高频带信号包括的音调成分的位置、数量以及幅度或能量;对所述高频带编码参数进行码流复用,以得到编码码流。
Description
技术领域
本申请涉及音频信号编解码技术领域,尤其涉及一种音频编解码方法和音频编解码设备。
背景技术
随着生活质量的提高,人们对高质量音频的需求不断增大。为了利用有限的带宽更好地传输音频信号,通常需要先对音频信号进行编码,然后将编码处理后的码流传输到解码端。解码端对接收到的码流进行解码处理,得到解码后的音频信号,解码后的音频信号用于回放。
其中,如何提高解码音频信号的质量,成为一个亟需解决的技术问题。
发明内容
本申请实施例提供了一种音频编解码方法和音频编解码设备,能够提高解码音频信号的质量。
为解决上述技术问题,本申请实施例提供以下技术方案:
第一方面,提供了一种音频编码方法,所述方法包括:获取音频信号的当前帧,所述当前帧包括高频带信号;根据所述高频带信号获得所述当前帧的高频带参数,所述高频带参数用于表示所述高频带信号包括的音调成分的位置、数量以及幅度或能量;对所述高频带编码参数进行码流复用,以得到编码码流。
结合第一方面,在一种实施方式中,所述高频带参数包括音调成分的位置数量参数、以及所述音调成分的幅度参数或能量参数。
结合第一方面或第一方面的前述实施方式,在一种实施方式中,所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带,所述根据所述高频带信号获得所述当前帧的高频带参数包括:根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
结合第一方面或第一方面的前述实施方式,在一种实施方式中,所述根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数前,所述方法包括:确定所述当前频率区域内是否包括音调成分;在所述当前频率区域内包括音调成分时,根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
结合第一方面或第一方面的前述实施方式,在一种实施方式中,所述当前帧的高频带参数还包括音调成分指示信息,所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分。
结合第一方面或第一方面的前述实施方式,在一种实施方式中,所述根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数包括:根据所述至少一个频率区域中的当前频率区域的高频带信号在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种;根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
结合第一方面或第一方面的前述实施方式,在一种实施方式中,根据所述至少一个频率区域中的当前频率区域的高频带信号在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种包括:根据所述至少一个频率区域中的当前频率区域的功率谱、能量谱或幅度谱中的至少一种在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种。
结合第一方面或第一方面的前述实施方式,在一种实施方式中,所述根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数包括:根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息;根据所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
结合第一方面或第一方面的前述实施方式,在一种实施方式中,所述当前频率区域的音调成分的位置数量参数包括N个比特位,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应;其中,若所述当前频率区域包括的第一子带存在峰值,则所述N个比特位中与所述第一子带对应的比特位的值为第一值;或若所述当前频率区域包括的第二子带不存在峰值,则所述N个比特位中与所述第二子带对应的比特位的值为第二值,所述第一值与所述第二值不同。
结合第一方面或第一方面的前述实施方式,在一种实施方式中,所述高频带参数还包括所述高频带信号的噪声基底参数。
第二方面,提供了一种音频解码方法,包括:获取编码码流;对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数,所述高频带参数用于表示所述当前帧的高频带信号包括的音调成分的位置、数量以及幅度或能量;根据所述高频带参数获得所述当前帧的重建高频带信号;根据所述当前帧的重建高频带信号获得所述当前帧的音频输出信号。
结合第二方面,在一种实施方式中,所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数和所述音调成分的幅度参数或能量参数。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,将所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带;所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数包括所述至少一个频率区域各自的音调成分的位置数量参数,所述当前帧的高频信号的音调成分的幅度参数或能量参数包括所述至少一个频率区域各自的音调成分的幅度参数或能量参数。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数包括:获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;根据所述当前频率区域的音调成分的位置数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述根据所述当前频率区域的音调成分的位置数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数,包括:根据所述当前频率区域的音调成分的位置数量参数,确定所述当前频率区域的音调成分的数量参数;根据所述当前频率区域的音调成分的数量参数,从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数包括:获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;根据所述当前频率区域的音调成分的位置数量参数,确定当前频率区域的音调成分的位置参数和当前频率区域的音调成分的数量参数;根据所述当前频率区域的音调成分的数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数前包括:获取所述当前频率区域的音调成分指示信息;所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分;当所述当前频率区域内包括音调成分时,获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数包括:根据所述当前频率区域包括的子带数量从所述编码码流中读取N个比特位,所述N个比特位为所述当前频率区域的音调成分的位置数量参数,其中,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述根据所述高频带参数获得所述当前帧的重建高频带信号包括:根据所述当前频率区域的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置;根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述根据所述当前频率区域的高频信号的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置包括:根据所述当前频率区域的高频信号的音调成分的位置数量参数,确定所述当前频率区域的音调成分的位置参数;根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述根据所述高频带参数获得所述当前帧的重建高频带信号包括:根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置;根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述当前频率区域的音调成分的位置参数用于指示所述当前频率区域中包括音调成分的子带的序号。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述当前频率区域中音调成分位置位于所述当前频率区域中音调成分所在子带的指定位置。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述子带的指定位置为子带的中心位置。
结合第二方面或第二方面的前述实施方式,在一种实施方式中,所述根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度获得所述重建高频带信号包括:根据如下计算式确定音调成分的位置的频域信号:
pSpectralData[tone_pos]=tone_val
其中,pSpectralData表示所述当前频率区域的重建高频带频域信号,tone_val表示所述当前频率区域内音调成分的位置对应的幅度值,tone_pos表示所述当前频率区域内音调成分的位置。
第三方面,提供了一种音频编码器,包括:信号获取单元,用于获取音频信号的当前帧,所述当前帧包括高频带信号;参数获取单元,用于根据所述高频带信号获得所述当前帧的高频带参数,所述高频带参数用于表示所述高频带信号包括的音调成分的位置、数量以及幅度或能量;编码单元,用于对所述高频带编码参数进行码流复用,以得到编码码流。
结合第三方面,在一种实施方式中,所述高频带参数包括音调成分的位置数量参数、以及所述音调成分的幅度参数或能量参数。
结合第三方面或第三方面的前述实施方式,在一种实施方式中,所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带;所述参数获取单元,具体用于:根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
结合第三方面或第三方面的前述实施方式,在一种实施方式中,所述音频编码器还包括:确定单元,用于确定所述当前频率区域内是否包括音调成分;所述参数获取单元,具体用于在所述当前频率区域内包括音调成分时,根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
结合第三方面或第三方面的前述实施方式,在一种实施方式中,所述当前帧的高频带参数还包括音调成分指示信息,所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分。
结合第三方面或第三方面的前述实施方式,在一种实施方式中,所述参数获取单元,具体用于:根据所述至少一个频率区域中的当前频率区域的高频带信号在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种;根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
结合第三方面或第三方面的前述实施方式,在一种实施方式中,所述参数获取单元,具体用于:根据所述至少一个频率区域中的当前频率区域的功率谱、能量谱或幅度谱中的至少一种在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种。
结合第三方面或第三方面的前述实施方式,在一种实施方式中,所述参数获取单元,具体用于:根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息;根据所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
结合第三方面或第三方面的前述实施方式,在一种实施方式中,所述当前频率区域的音调成分的位置数量参数包括N个比特位,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应;其中,若所述当前频率区域包括的第一子带存在峰值,则所述N个比特位中与所述第一子带对应的比特位的值为第一值;或若所述当前频率区域包括的第二子带不存在峰值,则所述N个比特位中与所述第二子带对应的比特位的值为第二值,所述第一值与所述第二值不同。
结合第三方面或第三方面的前述实施方式,在一种实施方式中,所述高频带参数还包括所述高频带信号的噪声基底参数。
第四方面提供了一种音频解码器,包括:接收单元,用于获取编码码流;解复用单元,用于对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数,所述高频带参数用于表示所述当前帧的高频带信号包括的音调成分的位置、数量以及幅度或能量;重建单元,用于根据所述高频带参数获得所述当前帧的重建高频带信号;根据所述当前帧的重建高频带信号获得所述当前帧的音频输出信号。
结合第四方面,在一种实施方式中,所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数和所述音调成分的幅度参数或能量参数。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,将所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带;所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数包括所述至少一个频率区域各自的音调成分的位置数量参数,所述当前帧的高频信号的音调成分的幅度参数或能量参数包括所述至少一个频率区域各自的音调成分的幅度参数或能量参数。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述解复用单元,具体用于:获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;根据所述当前频率区域的音调成分的位置数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述解复用单元,具体用于:根据所述当前频率区域的音调成分的位置数量参数,确定所述当前频率区域的音调成分的数量参数;根据所述当前频率区域的音调成分的数量参数,从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述解复用单元,具体用于:获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;根据所述当前频率区域的音调成分的位置数量参数,确定当前频率区域的音调成分的位置参数和当前频率区域的音调成分的数量参数;根据所述当前频率区域的音调成分的数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述解复用单元,具体用于:获取所述当前频率区域的音调成分指示信息;所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分;当所述当前频率区域内包括音调成分时,获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述解复用单元,具体用于:根据所述当前频率区域包括的子带数量从所述编码码流中读取N个比特位,所述N个比特位为所述当前频率区域的音调成分的位置数量参数,其中,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述重建单元,具体用于:根据所述当前频率区域的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置;根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述重建单元,具体用于:根据所述当前频率区域的高频信号的音调成分的位置数量参数,确定所述当前频率区域的音调成分的位置参数;根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述重建单元,具体用于:根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置;根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述当前频率区域的音调成分的位置参数用于指示所述当前频率区域中包括音调成分的子带的序号。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述当前频率区域中音调成分位置位于所述当前频率区域中音调成分所在子带的指定位置。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述子带的指定位置为子带的中心位置。
结合第四方面或第四方面的前述实施方式,在一种实施方式中,所述根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度获得所述重建高频带信号包括:根据如下计算式确定音调成分的位置的频域信号:
pSpectralData[tone_pos]=tone_val
其中,pSpectralData表示所述当前频率区域的重建高频带频域信号,tone_val表示所述当前频率区域内音调成分的位置对应的幅度值,tone_pos表示所述当前频率区域内音调成分的位置。
第五方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第二方面所述的方法。
第六方面,本申请实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面或第二方面所述的方法。
第七方面,本申请实施例提供了一种音频编码器,包括处理器和存储器;所述存储器用于存储指令;所述处理器用于执行所述存储器中的所述指令,使得所述音频编码器执行如前述第一方面的任一项方法。
第八方面,本申请实施例提供了一种音频解码器,包括处理器和存储器;所述存储器用于存储指令;所述处理器用于执行所述存储器中的所述指令,使得所述音频解码器执行如前述第二方面的任一项方法。
第九方面,本申请实施例提供一种通信装置,该通信装置可以包括音频编解码设备或者芯片等实体,所述通信装置包括:处理器,可选的,还包括存储器;所述存储器用于存储指令;所述处理器用于执行所述存储器中的所述指令,使得所述通信装置执行如前述第一方面或第二方面中任一项所述的方法。
第十方面,本申请提供了一种芯片系统,该芯片系统包括处理器,用于支持音频编解码设备实现上述方面中所涉及的功能,例如,发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器,用于保存音频编解码设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。
从上可知,本发明实施例中音频编码器会对高频带信号中的音调成分的位置、数量以及幅度或能量进行编码,从而使得音频解码器根据音调成分的位置、数量以及幅度或能量恢复音调成分,使得恢复的音调成分的位置和能量更准确,从而提高了解码信号的质量。
附图说明
图1为本申请实施例提供的一种音频编解码系统的结构示意图;
图2为本申请实施例提供的一种音频编码方法的示意性流程图;
图3为本申请实施例提供的一种音频解码方法的示意性流程图;
图4为本申请实施例的移动终端的示意图;
图5为本申请实施例的网元的示意图;
图6为本申请实施例提供的一种音频编码设备的组成结构示意图;
图7为本申请实施例提供的一种音频解码设备的组成结构示意图;
图8为本申请实施例提供的另一种音频编码设备的组成结构示意图;
图9为本申请实施例提供的另一种音频解码设备的组成结构示意图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
本申请实施例中的音频信号是指音频编码设备中的输入信号,该音频信号中可以包括多个帧,例如当前帧可以特指音频信号中的某一个帧,本申请实施例中以当前帧音频信号的编解码进行示例说明,音频信号中当前帧的前一帧或者后一帧都可以根据该当前帧音频信号的编解码方式进行相应的编解码,对于音频信号中当前帧的前一帧或者后一帧的编解码过程不再逐一说明。另外,本申请实施例中的音频信号可以是单声道音频信号,或者,也可以为立体声信号。其中,立体声信号可以是原始的立体声信号,也可以是多声道信号中包括的两路信号(左声道信号和右声道信号)组成的立体声信号,还可以是由多声道信号中包含的至少三路信号产生的两路信号组成的立体声信号,本申请实施例中对此并不限定。
图1为本申请一个示例性实施例的音频编解码系统的结构示意图。该音频编解码系统包括编码组件110和解码组件120。
编码组件110用于对当前帧(音频信号)在频域或时域上进行编码。可选地,编码组件110可以通过软件实现;或者,也可以通过硬件实现;或者,还可以通过软硬件结合的形式实现,本申请实施例中对此不作限定。
编码组件110对当前帧在频域或时域上进行编码时,在一种可能的实现方式中,可以包括如图2所示的步骤。
在本申请实施例中,编码组件110在完成编码之后,可以生成编码码流,编码组件110可以向解码组件120发送编码码流,从而使得解码组件120可以接收到该编码码流,再由解码组件120从编码码流中得到音频输出信号。
需要说明的是,图2中所示的编码方法仅为示例而非限定,本申请实施例对图2中各步骤的执行顺序并不限定,图2中所示的编码方法也可以包括更多或更少的步骤,本申请实施例中对此并不限定。
可选地,编码组件110与解码组件120可以通过有线或无线的方式相连,解码组件120可以通过其与编码组件110之间的连接获取编码组件110生成的编码码流;或者,编码组件110可以将生成的编码码流存储至存储器,解码组件120读取存储器中的编码码流。
可选地,解码组件120可以通过软件实现;或者,也可以通过硬件实现;或者,还可以通过软硬件结合的形式实现,本申请实施例中对此不作限定。
解码组件120对当前帧(音频信号)在频域或时域上进行解码时,在一种可能的实现方式中,可以包括如图3所示的步骤。
可选地,编码组件110和解码组件120可以设置在同一设备中;或者,也可以设置在不同设备中。设备可以为手机、平板电脑、膝上型便携计算机和台式计算机、蓝牙音箱、录音笔、可穿戴式设备等具有音频信号处理功能的终端,也可以是核心网、无线网中具有音频信号处理能力的网元,本实施例对此不作限定。
示意性地,如图4所示,本实施例以编码组件110设置于移动终端130中、解码组件120设置于移动终端140中,移动终端130与移动终端140是相互独立的具有音频信号处理能力的电子设备,例如可以是手机,可穿戴设备,虚拟现实(virtual reality,VR)设备,或增强现实(augmented reality,AR)设备等等,且移动终端130与移动终端140之间通过无线或有线网络连接为例进行说明。
可选地,移动终端130可以包括采集组件131、编码组件110和信道编码组件132,其中,采集组件131与编码组件110相连,编码组件110与编码组件132相连。
可选地,移动终端140可以包括音频播放组件141、解码组件120和信道解码组件142,其中,音频播放组件141与解码组件120相连,解码组件120与信道解码组件142相连。
移动终端130通过采集组件131采集到音频信号后,通过编码组件110对该音频信号进行编码,得到编码码流;然后,通过信道编码组件132对编码码流进行编码,得到传输信号。
移动终端130通过无线或有线网络将该传输信号发送至移动终端140。
移动终端140接收到该传输信号后,通过信道解码组件142对传输信号进行解码得到码码流;通过解码组件110对编码码流进行解码得到音频信号;通过音频播放组件播放该音频信号。可以理解的是,移动终端130也可以包括移动终端140所包括的组件,移动终端140也可以包括移动终端130所包括的组件。
示意性地,如图5所示,以编码组件110和解码组件120设置于同一核心网或无线网中具有音频信号处理能力的网元150中为例进行说明。
可选地,网元150包括信道解码组件151、解码组件120、编码组件110和信道编码组件152。其中,信道解码组件151与解码组件120相连,解码组件120与编码组件110相连,编码组件110与信道编码组件152相连。
信道解码组件151接收到其它设备发送的传输信号后,对该传输信号进行解码得到第一编码码流;通过解码组件120对编码码流进行解码得到音频信号;通过编码组件110对该音频信号进行编码,得到第二编码码流;通过信道编码组件152对该第二编码码流进行编码得到传输信号。
其中,其它设备可以是具有音频信号处理能力的移动终端;或者,也可以是具有音频信号处理能力的其它网元,本实施例对此不作限定。
可选地,网元中的编码组件110和解码组件120可以对移动终端发送的编码码流进行转码。
可选地,本申请实施例中可以将安装有编码组件110的设备称为音频编码设备,在实际实现时,该音频编码设备也可以具有音频解码功能,本申请实施对此不作限定。
可选地,本申请实施例中可以将安装有解码组件120的设备称为音频解码设备,在实际实现时,该音频解码设备也可以具有音频编码功能,本申请实施对此不作限定。
图2描述了本发明一个实施例提供的音频编码方法的流程,包括:
201、获取音频信号的当前帧,所述当前帧包括高频带信号。
其中,当前帧可以是音频信号中的任意一个帧,在当前帧中可以包括高频带信号和低频带信号,其中,高频带信号和低频带信号的划分可以通过频带阈值确定,高于该频带阈值的信号为高频带信号,低于该频带阈值的信号为低频带信号,对于频带阈值的确定可以根据传输带宽、编码组件110和解码组件120的数据处理能力来确定,此处不做限定。
其中高频带信号和低频带信号是相对的,例如低于某个频率的信号为低频带信号,但是高于该频率的信号为高频带信号(该频率对应的信号既可以划到低频带信号,也可以划到高频带信号)。该频率根据当前帧的带宽不同会有不同。例如,在当前帧为0-8khz的宽带信号时,该频率可以为4khz;在当前帧为0-16khz的超宽带信号时,该频率可以为8khz。
202、根据所述高频带信号获得所述当前帧的高频带参数,所述高频带参数用于表示所述高频带信号包括的音调成分的位置、数量以及幅度或能量。
具体地,所述高频带参数包括音调成分的位置数量参数、以及所述音调成分的幅度参数或能量参数。其中,位置数量参数表示由同一个参数表示音调成分的位置和音调成分的数量。在另一种实施方式中,高频带参数包括音调成分的位置参数、音调成分的数量参数以及所述音调成分的幅度参数或能量参数;在这种情况下,音调成分的位置和数量采用不同的参数表示。
在一种具体实施方式中,所述高频带信号对应的高频带包括至少一个频率区域(Tile),一个所述频率区域包括至少一个子带,所述根据所述高频带信号获得所述当前帧的高频带参数包括:根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
在另一种实施方式中,所述根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数前,所述方法包括:确定所述当前频率区域内是否包括音调成分;在所述当前频率区域内包括音调成分时,根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。从而仅获取具有音调成分的频率区域的参数,从而提高编码效率。
相应地,所述当前帧的高频带参数还包括音调成分指示信息,所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分。使得音频解码器可以根据该指示信息进行解码,提高解码效率。
其中,在一个实施方式中,所述根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数包括:根据所述至少一个频率区域中的当前频率区域的高频带信号在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种;根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
其中,进行峰值搜索的高频带信号可以是频域信号,也可以是时域信号。
具体地,在一个实施方式中,所述峰值搜索具体可以根据当前频率区域的功率谱、能量谱或幅度谱中的至少一种进行。
其中,在一个实施方式中,所述根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数包括:根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息;根据所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
203、对所述高频带编码参数进行码流复用,以得到编码码流。
其中,在一个实施方式中,所述当前频率区域的音调成分的位置数量参数包括N个比特位,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应;其中,若所述当前频率区域包括的第一子带存在峰值,则所述N个比特位中与所述第一子带对应的比特位的值为第一值;或若所述当前频率区域包括的第二子带不存在峰值,则所述N个比特位中与所述第二子带对应的比特位的值为第二值,所述第一值与所述第二值不同。
在一个实施方式中,所述高频带参数还可以包括所述高频带信号的噪声基底参数。
在本发明的另一个实施例中,音频编码方法可以包括如下流程:
1、获取音频信号的高频带信号。
2、根据高频带信号,确定高频带参数。其中,具体可以包括如下4种情况。
情况1:高频带参数包括音调成分的位置参数、数量参数、幅度参数。
根据高频带信号,确定高频带参数,具体地可以是:
先根据高频带信号,获取高频带信号的功率谱。
再根据高频带信号的功率谱进行峰值搜索,得到峰值数量信息、峰值位置信息以及峰值幅度信息。其中,峰值搜索的方式有很多种,本发明实施例对峰值搜索的具体方式不做限定。例如,如果当前频点对应的功率谱的值与左、右相邻频点对应的功率谱的值相差较大,则该频点为峰值。
然后再根据峰值位置、峰值幅度以及峰值个数中的至少一种进行筛选,确定音调成分的位置参数、数量参数、幅度参数。
例如,根据峰值幅度进行筛选,可以是:将峰值幅度大于预先设定的阈值作为预设条件。
具体地,可以将符合预设条件的峰值数量作为音调成分的数量参数。
将对应的峰值位置作为音调成分的位置参数,或者根据对应的峰值位置确定音调成分的位置参数。例如根据对应的峰值位置得到峰值位置对应的子带序号,将峰值位置对应的子带序号作为音调成分的位置参数。
将对应的峰值幅度作为音调成分的幅度参数或者根据对应的峰值幅度确定音调成分的幅度参数。峰值幅度可以由频域信号的能量表征,也可以由频域信号的功率表征。可以用音调成分的能量参数替换音调成分的幅度参数,作为高频带参数。
如果在编码的过程中,将高频带划分成K个频率区域(tile),每一个频率区域内又划分为N个子带。根据高频带信号确定高频带参数,也可以在各个频率区域内进行。其中,K和N均为大于或等于1的整数。
情况2:高频带参数包括音调成分的位置数量参数、幅度参数。
在编码的过程中,可以将高频带划分成K个频率区域(tile),每一个频率区域内又划分为N个子带。高频带参数的确定,可以以频率区域为单位进行。这里以一个频率区域为例。根据高频带信号确定高频带参数的方法,具体地可以是:
先根据高频带信号,获取高频带信号的功率谱。
再根据高频带信号的功率谱进行峰值搜索,得到峰值数量信息、峰值位置信息以及峰值幅度信息。
峰值搜索是以频率区域为单位进行的。对一个频率区域内的高频带信号的功率谱进行峰值搜索,得到频率区域内的峰值数量信息、峰值位置信息以及峰值幅度信息。
根据峰值位置、峰值幅度以及峰值个数中的至少一种进行筛选,确定音调成分的位置数量参数、幅度参数。
根据峰值位置、峰值幅度以及峰值个数中的至少一种进行筛选,确定音调成分的位置参数、数量参数、幅度参数。
音调成分的位置参数可以是频率区域内存在峰值的子带的序号。音调成分的数量参数是频率区域内存在峰值的子带的数量。音调成分的幅度参数可以等于频率区域内存在峰值的子带的峰值幅度或者根据频率区域内存在峰值的子带的峰值幅度计算得到的。峰值幅度可以由频域信号的能量表征,也可以由频域信号的功率表征。可以用音调成分的能量参数替换音调成分的幅度参数,作为高频带参数。
根据音调成分的位置参数,确定音调成分的位置数量参数。
音调成分的位置数量参数可以由N位比特序列表示,N为一个频率区域内的子带个数。一种可能的情况是:比特序列由低位到高位分别表示子带的序号从小到大。另一种可能的情况是:比特序列由低位到高位分别表示子带的序号从大到小。除此之外,还可以预先规定比特序列的每一位所对应的子带的序号。
根据频率区域内存在峰值的子带的序号,判断N位比特序列中各个比特位对应的子带中是否存在峰值,得到N位比特序列,即音调成分的位置数量参数。如果比特位对应的子带序号等于频率区域内存在峰值的子带的序号,则比特位的值为1,否则该比特位的值为0。
例如,一个频率区域内的子带个数为5,音调成分的位置数量参数由5位比特序列表示,5位比特序列值的二进制表示为10011。假设5位比特序列由低位到高位分别表示子带的序号从小到大,则该比特序列的值表示频率区域内的第0、1、4子带存在峰值,即存在峰值的子带的序号为0、1、4。
情况3:高频带参数还可以包括噪声基底参数。情况3可以结合情况1或情况2实现。
根据所述高频带信号根据高频带信号,确定高频带参数,还包括:
根据所述高频带信号的功率谱,得到噪声基底的功率谱估计值;
根据噪声基底的功率谱估计值,得到待编码的噪声基底参数;
对所述待编码的噪声基底参数进行量化编码,以得到所述噪声基底参数。
情况4:高频带参数还可以包括信号类型信息。情况3可以结合情况1-3实现。
根据所述高频带信号根据高频带信号,确定高频带参数,还包括:根据音调成分的数量参数或者音调成分的位置数量参数,确定信号类型信息。具体地:
根据音调成分的数量参数,确定信号类型信息。例如,如果音调成分的数量参数的值大于0,则信号类型信息指示为音调信号类型。
根据音调成分的位置数量参数,确定信号类型信息。可以是,根据音调成分的位置数量参数得到音调成分的数量参数;根据音调成分的数量参数,确定信号类型信息。值得注意的是,如果在确定音调成分的位置数量参数已经获得了音调成分的数量参数,则不需要根据音调成分的位置数量参数得到音调成分的数量参数,直接根据音调成分的数量参数,确定信号类型信息即可。
信号类型信息可以用是否存在音调成分的标志来表示。是否存在音调成分的标志也可以称为音调成分指示信息。
例如,是否存在音调成分的标志值为1,表示存在音调成分。
如果是按照频率区域进行编码,信号类型信息的确定也要按照频率区域进行。信号类型信息可以用频率区域内是否存在音调成分的标志来表示。例如,频率区域内是否存在音调成分的标志值为1,表示该频率区域内存在音调成分。
3、对高频带参数进行码流复用,以得到编码码流。
针对情况4的特殊处理:如果信号类型信息指示为音调信号类型,则需要将信号类型信息和除信号类型信息外的高频带参数写入码流。否则,将信号类型信息写入码流。如果是按照频率区域进行编码,则对频率区域依次进行处理:如果频率区域对应的信号类型信息指示为音调信号类型,则需要将信号类型信息和除信号类型信息外的高频带参数写入码流;否则,将信号类型信息写入码流。
从上可知,本发明实施例中音频编码器会对高频带信号中的音调成分的位置、数量以及幅度或能量进行编码,从而使得音频解码器根据音调成分的位置、数量以及幅度或能量恢复音调成分,使得恢复的音调成分的位置和能量更准确,从而提高了解码信号的质量。
图3描述了本发明一个实施例提供的音频解码方法的流程,包括:
301、获取编码码流。
302、对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数,所述高频带参数用于表示所述当前帧的高频带信号包括的音调成分的位置、数量以及幅度或能量。
具体地,所述高频带参数包括音调成分的位置数量参数、以及所述音调成分的幅度参数或能量参数。其中,位置数量参数表示由同一个参数表示音调成分的位置和音调成分的数量。在另一种实施方式中,高频带参数包括音调成分的位置参数、音调成分的数量参数以及所述音调成分的幅度参数或能量参数;在这种情况下,音调成分的位置和数量采用不同的参数表示。
在一个实施方式中,所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带;相应地,所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数包括所述至少一个频率区域各自的音调成分的位置数量参数,所述当前帧的高频信号的音调成分的幅度参数或能量参数包括所述至少一个频率区域各自的音调成分的幅度参数或能量参数。
在一个实施方式中,所述对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数包括:获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;根据所述当前频率区域的音调成分的位置数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
在一个实施方式中,所述根据所述当前频率区域的音调成分的位置数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数,包括:根据所述当前频率区域的音调成分的位置数量参数,确定所述当前频率区域的音调成分的数量参数;根据所述当前频率区域的音调成分的数量参数,从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
在一个实施方式中,所述对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数包括:获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;根据所述当前频率区域的音调成分的位置数量参数,确定当前频率区域的音调成分的位置参数和当前频率区域的音调成分的数量参数;根据所述当前频率区域的音调成分的数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
在一个实施方式中,所述获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数前包括:获取所述当前频率区域的音调成分指示信息;所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分;当所述当前频率区域内包括音调成分时,获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数。从而可以仅对包括了音调成分的频率区域进行音调成分的参数的解码,提高解码效率。
在一个实施方式中,所述根据所述高频带参数获得所述当前帧的重建高频带信号包括:根据所述当前频率区域的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置;根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
具体地,所述根据所述当前频率区域的高频信号的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置可以包括:根据所述当前频率区域的高频信号的音调成分的位置数量参数,确定所述当前频率区域的音调成分的位置参数;根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置。
303、根据所述高频带参数获得所述当前帧的重建高频带信号。
在一个实施方式中,所述根据所述高频带参数获得所述当前帧的重建高频带信号具体可以包括:根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置;根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
具体地,所述根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度获得所述重建高频带信号可以采用如下方式进行:
根据如下计算式确定音调成分的位置的频域信号:
pSpectralData[tone_pos]=tone_val
其中,pSpectralData表示所述当前频率区域的重建高频带频域信号,tone_val表示所述当前频率区域内音调成分的位置对应的幅度值,tone_pos表示所述当前频率区域内音调成分的位置。
304、根据所述当前帧的重建高频带信号获得所述当前帧的音频输出信号。
在一个实施例中,所述当前频率区域的音调成分的位置数量参数包括N个比特位,相应地,所述获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数包括:根据所述当前频率区域包括的子带数量从所述编码码流中读取N个比特位,所述N个比特位为所述当前频率区域的音调成分的位置数量参数,其中,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应。
在一个实施方式中,所述当前频率区域的音调成分的位置参数用于指示所述当前频率区域中包括音调成分的子带的序号。
在一个实施方式中,所述当前频率区域中音调成分位置位于所述当前频率区域中音调成分所在子带的指定位置。例如,所述子带的指定位置可以为子带的中心位置,或子带的起始位置,或子带的结束位置。
本发明另一个实施例提供了一个音频解码方法,包括如下流程:
1、获取编码码流。
2、根据编码码流,得到高频带参数。
其中,高频带可以划分成K个频率区域(tile),每一个频率区域内又划分为N个子带。高频带参数的确定,可以以频率区域为单位进行。下面均以一个频率区域内根据编码码流得到高频带参数的方法为例。不同频率区域根据编码码流得到高频带参数的方法可以相同也可以不同。
情况1,可以通过如下流程获得高频带参数:
解析码流,确定音调成分的位置参数、数量参数、幅度参数。
解析码流,确定音调成分的数量参数。
根据音调成分的数量参数,解析码流,确定音调成分的位置参数。
根据音调成分的数量参数,解析码流,确定音调成分的幅度参数。
情况2,可以通过如下流程获得高频带参数:
解析码流,确定音调成分的位置数量参数。
音调成分的位置数量参数表征了音调成分的位置信息和音调成分的数量信息。解码侧解析码流,先获得音调成分的位置数量参数。音调成分的位置数量参数可以由N位比特序列表示,N为一个频率区域内的子带个数。
具体地,先根据频域分辨率确定频率区域内的子带个数num_subband;然后,根据频率区域内的子带个数num_subband,从码流中读取num_subband个比特位,即为音调成分的位置数量参数。
其中,频域分辨率tone_res[p]可以是预先设定的,也可以是从获得的编码码流中解析得到的。假设第p个频率区域的频带宽度为tile_width[p],则频率区域内的子带个数,可以是
num_subband=tile_width[p]/tone_res[p]
例如,频率区域内的子带个数为5,从码流中读取5个比特位,得到的音调成分的位置数量参数的二进制表示为10011。
频率区域内的子带个数num_subband还可以是预设的,可以直接根据频率区域内的子带个数num_subband,从码流中读取num_subband个比特位,即为音调成分的位置数量参数。
解析码流,确定音调成分的幅度参数。
首先,根据音调成分的位置数量参数得到音调成分的数量参数。
具体地,可以是:根据音调成分的位置数量参数,确定频率区域内存在音调成分的子带的数量,即音调成分的数量参数tone_cnt[p]。频率区域内存在音调成分的子带的数量等于音调成分的位置数量参数的二进制表示中取值为1的比特位的个数。
例如,音调成分的位置数量参数的二进制表示为10011。那么,频率区域内存在音调成分的子带的数量等于3,即音调成分的位置参数tone_cnt[p]=3。
当然,也可以用0表示子带存在音调成分,那么音调成分的位置数量参数的二进制表示为10011时频率区域内存在音调成分的子带的数量等于2,即音调成分的位置参数tone_cnt[p]=2。
然后,根据音调成分的数量参数解析码流,确定音调成分的幅度参数。
具体地,可以是:根据预先设定的比特数从码流中依次解析音调成分的幅度参数,音调成分的幅度参数的个数等于音调成分的数量参数。音调成分的幅度参数tone_val_q[p][i],i=0,…,tone_cnt[p]-1。
情况3:高频带参数还可以包括音调成分的位置数量参数、幅度参数。根据编码码流,得到高频带参数,还包括:解析码流,确定噪声基底参数。具体地,可以是:根据预先设定的比特数从码流中解析噪声基底参数noise_floor[p]。
情况4:高频带参数还包括信号类型信息。根据编码码流,得到高频带参数,还包括:解析码流,确定信号类型信息。
根据编码码流,得到高频带参数,具体地可以是:
解析码流,确定信号类型信息。
信号类型信息可以是指示该频率区域内是否存在音调成分的标志,也可以称为音调成分指示信息。
根据信号类型信息,判断是否需要解码除信号类型信息外的其他高频带参数。
如果频率区域内是否存在音调成分的标志值为1,即信号类型信息指示为音调信号类型,则继续进行码流解析。
解析码流,确定除信号类型信息外的其他高频带参数。
解析码流,确定除信号类型信息外的其他高频带参数的方法可以是解码侧的情况1、情况2、情况3的任意一种。
3、根据高频带参数,得到重建的高频带信号。
高频带可以划分成K个频率区域(tile),每一个频率区域内又划分为N个子带。高频带信号的重建,可以以频率区域为单位进行。下面均以一个频率区域内根据高频带参数得到重建的高频带信号的方法为例。不同频率区内域根据高频带参数得到重建的高频带信号的方法可以相同也可以不相同。根据各个频率区域内重建的高频带信号,获得重建的高频带信号。高频带信号可以是频域信号,也可以是时域信号
针对情况1:根据音调成分的数量参数、位置参数和音调成分的幅度参数,重建高频带信号。
例如,音调成分的位置参数表征了音调成分的位置对应的子带序号。音调成分的数量参数表征了音调成分的数量。根据音调成分的数量参数、位置参数和音调成分的幅度参数,重建当前帧的高频带信号。
具体地,可以是:
tone_pos=tile[p]+(sfb+0.5)*tone_res[p]
tone_val=pow(2.0,0.25*tone_val_q[p][tone_idx]–4.0)
pSpectralData[tone_pos]=tone_val
其中,tile[p]为第p个频率区域的起始频点,sfb为音调成分的位置参数(即音调成分的位置对应的子带序号),tone_res[p]为子带的频域分辨率,tone_pos表示第p个频率区域内第tone_idx个音调成分对应的音调成分的位置。tone_val_q[p][tone_idx]表示第p个频率区域内的第tone_idx个音调成分对应的音调成分的幅度参数,tone_val表示第p个频率区域内第tone_idx个音调成分对应的幅度值。pSpectralData[tone_pos]表示音调成分的位置tone_pos对应的频域信号。tone_idx的取值范围属于[0,tone_cnt[p]-1],tone_cnt[p]为音调成分的数量参数。
在高频带范围内,如果频点号不等于音调成分位置tone_pos,则该频点上的频域信号可以直接设置为0。本发明对不存在音调成分的其他频点的重建方法不做限定。
针对情况2:音调成分的位置数量参数、幅度参数,重建当前帧的高频带信号。
(1)根据音调成分的位置数量参数,确定音调成分的位置参数。
音调成分的位置数量参数可以由N位比特序列表示,N为一个频率区域内的子带个数。具体地,可以是对音调成分的位置数量参数进行移位操作,以确定频率区域内存在音调成分的子带序号以及存在音调成分的子带数量。频率区域内存在音调成分的子带序号即为音调成分的位置参数。频率区域内存在音调成分的子带数量即为音调成分的数量参数。
一种可能的情况是:比特序列由低位到高位分别表示子带的序号从小到大。例如,频率区域内的子带个数为5,5位比特序列的最低比特位对应子带的序号为0,5位比特序列的最高比特位对应子带的序号为4。这种情况下,如果音调成分的位置数量参数的二进制表示为10011,频率区域内存在音调成分的子带序号分别为0、1、4。
另一种可能的情况是:比特序列由低位到高位分别表示子带的序号从大到小。例如,频率区域内的子带个数为5,5位比特序列的最低比特位对应子带的序号为4,5位比特序列的最高比特位对应子带的序号为0。这种情况下,如果音调成分的位置数量参数的二进制表示为10011,频率区域内存在音调成分的子带序号分别为0、3、4。
除此之外,比特序列的每一位所对应的子带的序号还可以是预先规定的,本发明不做限定。
根据音调成分的位置数量参数确定音调成分的位置参数的同时,可以获得音调成分的数量参数。频率区域内存在音调成分的子带序号的个数即音调成分的数量参数。
(2)根据音调成分的位置参数和音调成分的幅度参数,重建高频带信号。
计算音调成分的位置。
具体地可以是:根据音调成分的位置参数计算音调成分位置。
tone_pos=tile[p]+(sfb+0.5)*tone_res[p]
其中,tile[p]为第p个频率区域的起始频点,sfb为频率区域内存在音调成分的子带序号,tone_res[p]为第p个频率区域的频域分辨率。频率区域内存在音调成分的子带序号即为音调成分的位置参数。0.5表示存在音调成份的子带中音调成分的位置位于子带的中心。当然重建的音调成分也可以位于子带的其他位置。
计算音调成分的幅度。
具体地可以是:根据音调成分的幅度参数计算音调成分的幅度。
具体地,可以是:
tone_val=pow(2.0,0.25*tone_val_q[p][tone_idx]–4.0)
其中,tone_val_q[p][tone_idx]表示第p个频率区域内的第tone_idx个位置参数对应的幅度参数,tone_val表示第p个频率区域内第tone_idx个位置参数对应的频点的幅度值。
tone_idx的取值范围属于[0,tone_cnt[p]-1],tone_cnt[p]为音调成分的数量参数。
根据音调成分的位置和音调成分的幅度,重建高频带信号
音调成分的位置tone_pos对应的频域信号,满足:
pSpectralData[tone_pos]=tone_val
其中,pSpectralData[tone_pos]表示音调成分的位置tone_pos对应的频域信号,tone_val表示第p个频率区域内第tone_idx个位置参数对应的频点的幅度值。tone_pos表示第p个频率区域内第tone_idx个位置参数对应的音调成分的位置。
在高频带范围内,如果频点号不等于音调成分的位置tone_pos,则该频点的频域信号可以直接设置为0。本发明对不存在音调成分的其他频点的重建方法不做限定。
4、根据重建的高频带信号,得到当前帧的音频信号。
本发明第三个实施例提供了一个音频解码方法,包括如下流程:
1、获取编码码流。
2、根据编码码流,得到高频带参数。
其中,高频带可以划分成K个频率区域(tile),每一个频率区域内又划分为N个子带。高频带参数的确定,可以以频率区域为单位进行。下面均以一个频率区域内根据编码码流得到高频带参数的方法为例。
(1)解析码流,确定音调成分的位置数量参数。
音调成分的位置数量参数表征了音调成分的位置信息和音调成分的数量信息。解码侧解析码流,先获得音调成分的位置数量参数。音调成分的位置数量参数可以由N位比特序列表示,N为一个频率区域内的子带个数。
具体地,先根据频域分辨率确定频率区域内的子带个数num_subband;然后,根据频率区域内的子带个数num_subband,从码流中读取num_subband个比特位,即为音调成分的位置数量参数。
其中,频域分辨率tone_res[p]可以是预先设定的,也可以是从获得的编码码流中解析得到的。假设第p个频率区域的频带宽度为tile_width[p],则频率区域内的子带个数,可以是
num_subband=tile_width[p]/tone_res[p]
例如,频率区域内的子带个数为5,从码流中读取5个比特位,得到的音调成分的位置数量参数的二进制表示为10011。
频率区域内的子带个数num_subband还可以是预设的,可以直接根据频率区域内的子带个数num_subband,从码流中读取num_subband个比特位,即为音调成分的位置数量参数。
(2)根据音调成分的位置数量参数,确定音调成分的位置参数和音调成分的数量参数。
音调成分的位置数量参数可以由N位比特序列表示,N为一个频率区域内的子带个数。具体地,可以是对音调成分的位置数量参数进行移位操作,以确定频率区域内存在音调成分的子带序号以及存在音调成分的子带数量。频率区域内存在音调成分的子带序号即为音调成分的位置参数。频率区域内存在音调成分的子带数量即为音调成分的数量参数。
一种可能的情况是:比特序列由低位到高位分别表示子带的序号从小到大。例如,频率区域内的子带个数为5,5位比特序列的最低比特位对应子带的序号为0,5位比特序列的最高比特位对应子带的序号为4。这种情况下,如果音调成分的位置数量参数的二进制表示为10011,频率区域内存在音调成分的子带序号分别为0、1、4。
另一种可能的情况是:比特序列由低位到高位分别表示子带的序号从大到小。例如,频率区域内的子带个数为5,5位比特序列的最低比特位对应子带的序号为4,5位比特序列的最高比特位对应子带的序号为0。这种情况下,如果音调成分的位置数量参数的二进制表示为10011,频率区域内存在音调成分的子带序号分别为0、3、4。
除此之外,比特序列的每一位所对应的子带的序号还可以是预先规定的,本发明不做限定。
根据音调成分的位置数量参数确定音调成分的位置参数的同时,可以获得音调成分的数量参数。频率区域内存在音调成分的子带序号的个数即音调成分的数量参数。
具体地,可以是:根据音调成分的位置数量参数,确定频率区域内存在音调成分的子带的数量,即音调成分的数量参数tone_cnt[p]。频率区域内存在音调成分的子带的数量等于音调成分的位置数量参数的二进制表示中取值为1的比特位的个数。
例如,音调成分的位置数量参数的二进制表示为10011。那么,频率区域内存在音调成分的子带的数量等于3,即音调成分的位置参数tone_cnt[p]=3。
当然,也可以用0表示子带存在音调成分,那么音调成分的位置数量参数的二进制表示为10011时频率区域内存在音调成分的子带的数量等于2,即音调成分的位置参数tone_cnt[p]=2。
(3)根据音调成分的数量参数,解析码流,确定音调成分的幅度参数。
具体地,可以是:根据预先设定的比特数从码流中依次解析音调成分的幅度参数,音调成分的幅度参数的个数等于音调成分的数量参数。音调成分的幅度参数tone_val_q[p][i],i=0,…,tone_cnt[p]-1。
3、根据高频带参数,得到重建的高频带信号。
高频带可以划分成K个频率区域(tile),每一个频率区域内又划分为N个子带。高频带信号的重建,可以以频率区域为单位进行。下面均以一个频率区域内根据高频带参数得到重建的高频带信号的方法为例。根据各个频率区域内重建的高频带信号,获得重建的高频带信号。高频带信号可以是频域信号,也可以是时域信号。
具体地,可以是根据音调成分的位置参数、数量参数、幅度参数,重建当前帧的高频带信号。音调成分的数量参数表证了音调成分的数量。一个位置上的音调成分的重建方法,具体的可以是:
(1)计算音调成分的位置。
具体地可以是:根据音调成分的位置参数计算音调成分位置。
tone_pos=tile[p]+(sfb+0.5)*tone_res[p]
其中,tile[p]为第p个频率区域的起始频点,sfb为频率区域内存在音调成分的子带序号,tone_res[p]为第p个频率区域的频域分辨率。频率区域内存在音调成分的子带序号即为音调成分的位置参数。0.5表示存在音调成份的子带中音调成分的位置位于子带的中心。当然重建的音调成分也可以位于子带的其他位置。
(2)计算音调成分的幅度。
具体地可以是:根据音调成分的幅度参数计算音调成分的幅度。
具体地,可以是:
tone_val=pow(2.0,0.25*tone_val_q[p][tone_idx]–4.0)
其中,tone_val_q[p][tone_idx]表示第p个频率区域内的第tone_idx个位置参数对应的幅度参数,tone_val表示第p个频率区域内第tone_idx个位置参数对应的频点的幅度值。
tone_idx的取值范围属于[0,tone_cnt[p]-1],tone_cnt[p]为音调成分的数量。
(3)根据音调成分的位置和音调成分的幅度,重建高频带信号。
音调成分的位置tone_pos对应的频域信号,满足:
pSpectralData[tone_pos]=tone_val
其中,pSpectralData[tone_pos]表示音调成分的位置tone_pos对应的频域信号,tone_val表示第p个频率区域内第tone_idx个位置参数对应的频点的幅度值。tone_pos表示第p个频率区域内第tone_idx个位置参数对应的音调成分的位置。
在高频带范围内,如果频点号不等于音调成分的位置tone_pos,则该频点的频域信号可以直接设置为0。本发明对不存在音调成分的其他频点的重建方法不做限定。
4、根据重建的高频带信号,得到当前帧的音频信号。
从上可知,本发明实施例中音频编码器会对高频带信号中的音调成分的位置、数量以及幅度或能量进行编码,从而使得音频解码器根据音调成分的位置、数量以及幅度或能量恢复音调成分,使得恢复的音调成分的位置和能量更准确,从而提高了解码信号的质量。
图6描述了本发明一个实施例提供的音频编码器的结构,包括:
信号获取单元601,用于获取音频信号的当前帧,所述当前帧包括高频带信号;
参数获取单元602,用于根据所述高频带信号获得所述当前帧的高频带参数,所述高频带参数用于表示所述高频带信号包括的音调成分的位置、数量以及幅度或能量;
编码单元603,用于对所述高频带编码参数进行码流复用,以得到编码码流。
在一个实施方式中,所述音频编码器还可以包括:确定单元,用于确定所述当前频率区域内是否包括音调成分;所述参数获取单元,具体用于在所述当前频率区域内包括音调成分时,根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
其中,音频编码器的具体实现可以参考前述的音频编码方法,此处不再赘述。
从上可知,本发明实施例中音频编码器会对高频带信号中的音调成分的位置、数量以及幅度或能量进行编码,从而使得音频解码器根据音调成分的位置、数量以及幅度或能量恢复音调成分,使得恢复的音调成分的位置和能量更准确,从而提高了解码信号的质量。
图7描述了本发明一个实施例提供的音频解码器的结构,包括:
接收单元701,用于获取编码码流;
解复用单元702,用于对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数,所述高频带参数用于表示所述当前帧的高频带信号包括的音调成分的位置、数量以及幅度或能量;
重建单元703,用于根据所述高频带参数获得所述当前帧的重建高频带信号;根据所述当前帧的重建高频带信号获得所述当前帧的音频输出信号。
其中,音频解码器的具体实现可以参考前述的音频编码方法,此处不再赘述。
从上可知,本发明实施例中音频编码器会对高频带信号中的音调成分的位置、数量以及幅度或能量进行编码,从而使得音频解码器根据音调成分的位置、数量以及幅度或能量恢复音调成分,使得恢复的音调成分的位置和能量更准确,从而提高了解码信号的质量。
需要说明的是,上述装置各模块/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其带来的技术效果与本申请方法实施例相同,具体内容可参见本申请前述所示的方法实施例中的叙述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储有程序,该程序执行包括上述方法实施例中记载的部分或全部步骤。
接下来介绍本申请实施例提供的另一种音频编码设备,请参阅图8所示,音频编码设备800包括:
接收器801、发射器802、处理器803和存储器804(其中音频编码设备800中的处理器803的数量可以一个或多个,图8中以一个处理器为例)。在本申请的一些实施例中,接收器801、发射器802、处理器803和存储器804可通过总线或其它方式连接,其中,图8中以通过总线连接为例。
存储器804可以包括只读存储器和随机存取存储器,并向处理器803提供指令和数据。存储器804的一部分还可以包括非易失性随机存取存储器(non-volatile randomaccess memory,NVRAM)。存储器804存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
处理器803控制音频编码设备的操作,处理器803还可以称为中央处理单元(central processing unit,CPU)。具体的应用中,音频编码设备的各个组件通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都称为总线系统。
上述本申请实施例揭示的方法可以应用于处理器803中,或者由处理器803实现。处理器803可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器803中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器803可以是通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器804,处理器803读取存储器804中的信息,结合其硬件完成上述方法的步骤。
接收器801可用于接收输入的数字或字符信息,以及产生与音频编码设备的相关设置以及功能控制有关的信号输入,发射器802可包括显示屏等显示设备,发射器802可用于通过外接接口输出数字或字符信息。
本申请实施例中,处理器803,用于执行前述图2所示的音频编码方法。
接下来介绍本申请实施例提供的另一种音频解码设备,请参阅图9所示,音频解码设备900包括:
接收器901、发射器902、处理器903和存储器904(其中音频解码设备900中的处理器903的数量可以一个或多个,图9中以一个处理器为例)。在本申请的一些实施例中,接收器901、发射器902、处理器903和存储器904可通过总线或其它方式连接,其中,图9中以通过总线连接为例。
存储器904可以包括只读存储器和随机存取存储器,并向处理器903提供指令和数据。存储器904的一部分还可以包括NVRAM。存储器904存储有操作系统和操作指令、可执行模块或者数据结构,或者它们的子集,或者它们的扩展集,其中,操作指令可包括各种操作指令,用于实现各种操作。操作系统可包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
处理器903控制音频解码设备的操作,处理器903还可以称为CPU。具体的应用中,音频解码设备的各个组件通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都称为总线系统。
上述本申请实施例揭示的方法可以应用于处理器903中,或者由处理器903实现。处理器903可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器903中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器903可以是通用处理器、DSP、ASIC、FPGA或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器904,处理器903读取存储器904中的信息,结合其硬件完成上述方法的步骤。
本申请实施例中,处理器903,用于执行前述图3所示的音频解码方法。
在另一种可能的设计中,当音频编码设备或音频解码设备为终端内的芯片时,芯片包括:处理单元和通信单元,所述处理单元例如可以是处理器,所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令,以使该终端内的芯片执行上述第一方面任意一项的方法。可选地,所述存储单元为所述芯片内的存储单元,如寄存器、缓存等,所述存储单元还可以是所述终端内的位于所述芯片外部的存储单元,如只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)等。
其中,上述任一处提到的处理器,可以是一个通用中央处理器,微处理器,ASIC,或一个或多个用于控制上述第一方面方法的程序执行的集成电路。
另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本申请提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用CPU、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本申请而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、U盘、移动硬盘、ROM、RAM、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(Solid State Disk,SSD))等。
Claims (53)
1.一种音频编码方法,其特征在于,所述方法包括:
获取音频信号的当前帧,所述当前帧包括高频带信号;
根据所述高频带信号获得所述当前帧的高频带参数,所述高频带参数用于表示所述高频带信号包括的音调成分的位置、数量以及幅度或能量;
对所述高频带编码参数进行码流复用,以得到编码码流。
2.根据权利要求1所述的方法,其特征在于,所述高频带参数包括音调成分的位置数量参数、以及所述音调成分的幅度参数或能量参数。
3.根据权利要求2所述的方法,其特征在于,所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带,所述根据所述高频带信号获得所述当前帧的高频带参数包括:
根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数前,所述方法包括:
确定所述当前频率区域内是否包括音调成分;
在所述当前频率区域内包括音调成分时,根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
5.根据权利要求4所述的方法,其特征在于,所述当前帧的高频带参数还包括音调成分指示信息,所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分。
6.根据权利要求3至5任一所述的方法,其特征在于,所述根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数包括:
根据所述至少一个频率区域中的当前频率区域的高频带信号在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种;
根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
7.根据权利要求6所述的方法,其特征在于,根据所述至少一个频率区域中的当前频率区域的高频带信号在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种包括:
根据所述至少一个频率区域中的当前频率区域的功率谱、能量谱或幅度谱中的至少一种在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种。
8.根据权利要求6所述的方法,其特征在于,所述根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数包括:
根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息;
根据所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
9.根据权利要求3至8任一所述所述的方法,其特征在于,所述当前频率区域的音调成分的位置数量参数包括N个比特位,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应;其中,若所述当前频率区域包括的第一子带存在峰值,则所述N个比特位中与所述第一子带对应的比特位的值为第一值;或若所述当前频率区域包括的第二子带不存在峰值,则所述N个比特位中与所述第二子带对应的比特位的值为第二值,所述第一值与所述第二值不同。
10.根据权利要求1至9任一所述的方法,其特征在于,所述高频带参数还包括所述高频带信号的噪声基底参数。
11.一种音频解码方法,其特征在于,包括:
获取编码码流;
对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数,所述高频带参数用于表示所述当前帧的高频带信号包括的音调成分的位置、数量以及幅度或能量;
根据所述高频带参数获得所述当前帧的重建高频带信号;
根据所述当前帧的重建高频带信号获得所述当前帧的音频输出信号。
12.根据权利要求11所述的方法,其特征在于,所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数和所述音调成分的幅度参数或能量参数。
13.根据权利要求12所述的方法,其特征在于,将所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带;
所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数包括所述至少一个频率区域各自的音调成分的位置数量参数,所述当前帧的高频信号的音调成分的幅度参数或能量参数包括所述至少一个频率区域各自的音调成分的幅度参数或能量参数。
14.根据权利要求13所述的方法,其特征在于,所述对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数包括:
获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;
根据所述当前频率区域的音调成分的位置数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
15.根据权利要求14所述的方法,其特征在于,所述根据所述当前频率区域的音调成分的位置数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数,包括:
根据所述当前频率区域的音调成分的位置数量参数,确定所述当前频率区域的音调成分的数量参数;
根据所述当前频率区域的音调成分的数量参数,从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
16.根据权利要求13所述的方法,其特征在于,所述对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数包括:
获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;
根据所述当前频率区域的音调成分的位置数量参数,确定当前频率区域的音调成分的位置参数和当前频率区域的音调成分的数量参数;
根据所述当前频率区域的音调成分的数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
17.根据权利要求14至16任一所述的方法,其特征在于,
所述获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数前包括:
获取所述当前频率区域的音调成分指示信息;
所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分;
当所述当前频率区域内包括音调成分时,获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数。
18.根据权利要求14至17任一所述的方法,其特征在于,所述获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数包括:
根据所述当前频率区域包括的子带数量从所述编码码流中读取N个比特位,所述N个比特位为所述当前频率区域的音调成分的位置数量参数,其中,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应。
19.根据权利要求14,15,17和18任一所述的方法,其特征在于,所述根据所述高频带参数获得所述当前帧的重建高频带信号包括:
根据所述当前频率区域的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置;
根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;
根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
20.根据权利要求19所述的方法,其特征在于,所述根据所述当前频率区域的高频信号的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置包括:
根据所述当前频率区域的高频信号的音调成分的位置数量参数,确定所述当前频率区域的音调成分的位置参数;
根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置。
21.根据权利要求16至18任一所述的方法,其特征在于,所述根据所述高频带参数获得所述当前帧的重建高频带信号包括:
根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置;
根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;
根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
22.根据权利要求16至21任一所述的方法,其特征在于,所述当前频率区域的音调成分的位置参数用于指示所述当前频率区域中包括音调成分的子带的序号。
23.根据权利要求20或21任一所述的方法,其特征在于,所述当前频率区域中音调成分位置位于所述当前频率区域中音调成分所在子带的指定位置。
24.根据权利要求23所述的方法,其特征在于,所述子带的指定位置为子带的中心位置。
25.根据权利要求19至21任一所述的方法,其特征在于,所述根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度获得所述重建高频带信号包括:
根据如下计算式确定音调成分的位置的频域信号:
pSpectralData[tone_pos]=tone_val
其中,pSpectralData表示所述当前频率区域的重建高频带频域信号,tone_val表示所述当前频率区域内音调成分的位置对应的幅度值,tone_pos表示所述当前频率区域内音调成分的位置。
26.一种音频编码器,其特征在于,包括:
信号获取单元,用于获取音频信号的当前帧,所述当前帧包括高频带信号;
参数获取单元,用于根据所述高频带信号获得所述当前帧的高频带参数,所述高频带参数用于表示所述高频带信号包括的音调成分的位置、数量以及幅度或能量;
编码单元,用于对所述高频带编码参数进行码流复用,以得到编码码流。
27.根据权利要求26所述的音频编码器,其特征在于,所述高频带参数包括音调成分的位置数量参数、以及所述音调成分的幅度参数或能量参数。
28.根据权利要求27所述的音频编码器,其特征在于,所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带;
所述参数获取单元,具体用于:
根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
29.根据权利要求28所述的音频编码器,其特征在于,所述音频编码器还包括:
确定单元,用于确定所述当前频率区域内是否包括音调成分;
所述参数获取单元,具体用于在所述当前频率区域内包括音调成分时,根据所述至少一个频率区域中的当前频率区域的高频带信号,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
30.根据权利要求29所述的音频编码器,其特征在于,所述当前帧的高频带参数还包括音调成分指示信息,所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分。
31.根据权利要求28至30任一所述的音频编码器,其特征在于,所述参数获取单元,具体用于:
根据所述至少一个频率区域中的当前频率区域的高频带信号在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种;
根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
32.根据权利要求31所述的音频编码器,其特征在于,所述参数获取单元,具体用于:
根据所述至少一个频率区域中的当前频率区域的功率谱、能量谱或幅度谱中的至少一种在所述当前频率区域内进行峰值搜索,以获得所述当前区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种。
33.根据权利要求31所述的音频编码器,其特征在于,所述参数获取单元,具体用于:
根据所述当前频率区域的峰值数量信息、峰值位置信息以及峰值幅度信息中的至少一种,确定所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息;
根据所述当前频率区域的音调成分的位置信息,数量信息以及幅度信息确定所述当前频率区域的音调成分的位置数量参数和所述当前频率区域的音调成分的幅度参数或能量参数。
34.根据权利要求28至33任一所述所述的音频编码器,其特征在于,所述当前频率区域的音调成分的位置数量参数包括N个比特位,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应;其中,若所述当前频率区域包括的第一子带存在峰值,则所述N个比特位中与所述第一子带对应的比特位的值为第一值;或若所述当前频率区域包括的第二子带不存在峰值,则所述N个比特位中与所述第二子带对应的比特位的值为第二值,所述第一值与所述第二值不同。
35.根据权利要求26至34任一所述的音频编码器,其特征在于,所述高频带参数还包括所述高频带信号的噪声基底参数。
36.一种音频解码器,其特征在于,包括:
接收单元,用于获取编码码流;
解复用单元,用于对所述编码码流进行码流解复用,以得到音频信号的当前帧的高频带参数,所述高频带参数用于表示所述当前帧的高频带信号包括的音调成分的位置、数量以及幅度或能量;
重建单元,用于根据所述高频带参数获得所述当前帧的重建高频带信号;根据所述当前帧的重建高频带信号获得所述当前帧的音频输出信号。
37.根据权利要求36所述的音频解码器,其特征在于,所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数和所述音调成分的幅度参数或能量参数。
38.根据权利要求37所述的音频解码器,其特征在于,将所述高频带信号对应的高频带包括至少一个频率区域,一个所述频率区域包括至少一个子带;
所述高频带参数包括所述当前帧的高频信号的音调成分的位置数量参数包括所述至少一个频率区域各自的音调成分的位置数量参数,所述当前帧的高频信号的音调成分的幅度参数或能量参数包括所述至少一个频率区域各自的音调成分的幅度参数或能量参数。
39.根据权利要求38所述的音频解码器,其特征在于,所述解复用单元,具体用于:
获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;
根据所述当前频率区域的音调成分的位置数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
40.根据权利要求39所述的音频解码器,其特征在于,所述解复用单元,具体用于:
根据所述当前频率区域的音调成分的位置数量参数,确定所述当前频率区域的音调成分的数量参数;
根据所述当前频率区域的音调成分的数量参数,从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
41.根据权利要求38所述的音频解码器,其特征在于,所述解复用单元,具体用于:
获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数;
根据所述当前频率区域的音调成分的位置数量参数,确定当前频率区域的音调成分的位置参数和当前频率区域的音调成分的数量参数;
根据所述当前频率区域的音调成分的数量参数从所述编码码流中解析所述当前频率区域的音调成分的幅度参数或能量参数。
42.根据权利要求39至41任一所述的音频解码器,其特征在于,解复用单元,具体用于:获取所述当前频率区域的音调成分指示信息;所述音调成分指示信息用于指示所述当前频率区域内是否包括音调成分;当所述当前频率区域内包括音调成分时,获取所述至少一个频率区域的当前频率区域的音调成分的位置数量参数。
43.根据权利要求39至42任一所述的音频解码器,其特征在于,所述解复用单元,具体用于:
根据所述当前频率区域包括的子带数量从所述编码码流中读取N个比特位,所述N个比特位为所述当前频率区域的音调成分的位置数量参数,其中,N为所述当前频率区域包括的子带数量,所述N个比特位与所述当前频率区域包括的子带一一对应。
44.根据权利要求39,40,42和43任一所述的音频解码器,其特征在于,所述重建单元,具体用于:
根据所述当前频率区域的音调成分的位置数量参数确定所述当前频率区域中音调成分的位置;
根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;
根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
45.根据权利要求44所述的音频解码器,其特征在于,所述重建单元,具体用于:
根据所述当前频率区域的高频信号的音调成分的位置数量参数,确定所述当前频率区域的音调成分的位置参数;
根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置。
46.根据权利要求41至43任一所述的音频解码器,其特征在于,所述重建单元,具体用于:
根据所述当前频率区域的音调成分的位置参数,确定所述当前频率区域中音调成分位置;
根据所述当前频率区域的音调成分的幅度参数或能量参数确定所述音调成分的位置对应的幅度或能量;
根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度或能量获得所述重建高频带信号。
47.根据权利要求41至46任一所述的音频解码器,其特征在于,所述当前频率区域的音调成分的位置参数用于指示所述当前频率区域中包括音调成分的子带的序号。
48.根据权利要求45或46任一所述的音频解码器,其特征在于,所述当前频率区域中音调成分位置位于所述当前频率区域中音调成分所在子带的指定位置。
49.根据权利要求48所述的音频解码器,其特征在于,所述子带的指定位置为子带的中心位置。
50.根据权利要求44至49任一所述的音频解码器,其特征在于,所述根据所述当前频率区域中音调成分的位置和所述音调成分的位置对应的幅度获得所述重建高频带信号包括:
根据如下计算式确定音调成分的位置的频域信号:
pSpectralData[tone_pos]=tone_val
其中,pSpectralData表示所述当前频率区域的重建高频带频域信号,tone_val表示所述当前频率区域内音调成分的位置对应的幅度值,tone_pos表示所述当前频率区域内音调成分的位置。
51.一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行如权利要求1至25任意一项所述的方法。
52.一种音频编码设备,其特征在于,包括至少一个处理器,所述至少一个处理器用于与存储器耦合,读取并执行所述存储器中的指令,以实现如权利要求1至10任一所述的方法。
53.一种音频解码设备,其特征在于,包括至少一个处理器,所述至少一个处理器用于与存储器耦合,读取并执行所述存储器中的指令,以实现如权利要求11至15中任一项所述的方法。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010033973.0A CN113192517B (zh) | 2020-01-13 | 2020-01-13 | 一种音频编解码方法和音频编解码设备 |
PCT/CN2021/071327 WO2021143691A1 (zh) | 2020-01-13 | 2021-01-12 | 一种音频编解码方法和音频编解码设备 |
EP21740645.3A EP4080503A4 (en) | 2020-01-13 | 2021-01-12 | AUDIO ENCODING AND DECODING METHODS AND AUDIO ENCODING AND DECODING DEVICES |
KR1020227026986A KR20220117340A (ko) | 2020-01-13 | 2021-01-12 | 오디오 인코딩 및 디코딩 방법과 오디오 인코딩 및 디코딩 디바이스 |
JP2022542159A JP2023509201A (ja) | 2020-01-13 | 2021-01-12 | オーディオ符号化及び復号方法、並びにオーディオ符号化及び復号デバイス |
US17/862,712 US11887610B2 (en) | 2020-01-13 | 2022-07-12 | Audio encoding and decoding method and audio encoding and decoding device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010033973.0A CN113192517B (zh) | 2020-01-13 | 2020-01-13 | 一种音频编解码方法和音频编解码设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113192517A true CN113192517A (zh) | 2021-07-30 |
CN113192517B CN113192517B (zh) | 2024-04-26 |
Family
ID=76863583
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010033973.0A Active CN113192517B (zh) | 2020-01-13 | 2020-01-13 | 一种音频编解码方法和音频编解码设备 |
Country Status (6)
Country | Link |
---|---|
US (1) | US11887610B2 (zh) |
EP (1) | EP4080503A4 (zh) |
JP (1) | JP2023509201A (zh) |
KR (1) | KR20220117340A (zh) |
CN (1) | CN113192517B (zh) |
WO (1) | WO2021143691A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113808597A (zh) * | 2020-05-30 | 2021-12-17 | 华为技术有限公司 | 一种音频编码方法和音频编码装置 |
CN113808596A (zh) * | 2020-05-30 | 2021-12-17 | 华为技术有限公司 | 一种音频编码方法和音频编码装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6226604B1 (en) * | 1996-08-02 | 2001-05-01 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
JP2003233395A (ja) * | 2002-02-07 | 2003-08-22 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム |
US20080270125A1 (en) * | 2007-04-30 | 2008-10-30 | Samsung Electronics Co., Ltd | Method and apparatus for encoding and decoding high frequency band |
US20090248404A1 (en) * | 2006-07-12 | 2009-10-01 | Panasonic Corporation | Lost frame compensating method, audio encoding apparatus and audio decoding apparatus |
CN102194458A (zh) * | 2010-03-02 | 2011-09-21 | 中兴通讯股份有限公司 | 频带复制方法、装置及音频解码方法、系统 |
CN103098130A (zh) * | 2010-10-06 | 2013-05-08 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法以及解码方法 |
CN104103276A (zh) * | 2013-04-12 | 2014-10-15 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN104584124A (zh) * | 2013-01-22 | 2015-04-29 | 松下电器产业株式会社 | 带宽扩展参数生成装置、编码装置、解码装置、带宽扩展参数生成方法、编码方法、以及解码方法 |
CN106133831A (zh) * | 2014-07-25 | 2016-11-16 | 松下电器(美国)知识产权公司 | 音响信号编码装置、音响信号解码装置、音响信号编码方法以及音响信号解码方法 |
JP2019070823A (ja) * | 2014-07-25 | 2019-05-09 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08162963A (ja) * | 1994-11-30 | 1996-06-21 | Sony Corp | データ符号化装置および復号装置 |
JP4736812B2 (ja) * | 2006-01-13 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US20080027012A1 (en) | 2006-07-24 | 2008-01-31 | Heejin Kim | Bridged carbamate macrolides |
JP2008096567A (ja) * | 2006-10-10 | 2008-04-24 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム |
KR101411901B1 (ko) * | 2007-06-12 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
KR102123770B1 (ko) * | 2012-03-29 | 2020-06-16 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 하모닉 오디오 신호의 변환 인코딩/디코딩 |
BR122020016403B1 (pt) * | 2013-06-11 | 2022-09-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Aparelho de decodificação de sinal de áudio, aparelho de codificação de sinal de áudio, método de decodificação de sinal de áudio e método de codificação de sinal de áudio |
EP2830065A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
BR112016020988B1 (pt) * | 2014-03-14 | 2022-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Método e codificador para codificação de um sinal de áudio, e, dispositivo de comunicação |
EP2980792A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
JP6769299B2 (ja) * | 2016-12-27 | 2020-10-14 | 富士通株式会社 | オーディオ符号化装置およびオーディオ符号化方法 |
CN113593586A (zh) * | 2020-04-15 | 2021-11-02 | 华为技术有限公司 | 音频信号编码方法、解码方法、编码设备以及解码设备 |
-
2020
- 2020-01-13 CN CN202010033973.0A patent/CN113192517B/zh active Active
-
2021
- 2021-01-12 JP JP2022542159A patent/JP2023509201A/ja active Pending
- 2021-01-12 WO PCT/CN2021/071327 patent/WO2021143691A1/zh unknown
- 2021-01-12 KR KR1020227026986A patent/KR20220117340A/ko active Search and Examination
- 2021-01-12 EP EP21740645.3A patent/EP4080503A4/en active Pending
-
2022
- 2022-07-12 US US17/862,712 patent/US11887610B2/en active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6226604B1 (en) * | 1996-08-02 | 2001-05-01 | Matsushita Electric Industrial Co., Ltd. | Voice encoder, voice decoder, recording medium on which program for realizing voice encoding/decoding is recorded and mobile communication apparatus |
JP2003233395A (ja) * | 2002-02-07 | 2003-08-22 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム |
US20090248404A1 (en) * | 2006-07-12 | 2009-10-01 | Panasonic Corporation | Lost frame compensating method, audio encoding apparatus and audio decoding apparatus |
US20080270125A1 (en) * | 2007-04-30 | 2008-10-30 | Samsung Electronics Co., Ltd | Method and apparatus for encoding and decoding high frequency band |
CN101681623A (zh) * | 2007-04-30 | 2010-03-24 | 三星电子株式会社 | 对高频带编码和解码的方法和设备 |
CN102750954A (zh) * | 2007-04-30 | 2012-10-24 | 三星电子株式会社 | 对高频带编码和解码的方法和设备 |
CN102194458A (zh) * | 2010-03-02 | 2011-09-21 | 中兴通讯股份有限公司 | 频带复制方法、装置及音频解码方法、系统 |
CN103098130A (zh) * | 2010-10-06 | 2013-05-08 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法以及解码方法 |
CN104584124A (zh) * | 2013-01-22 | 2015-04-29 | 松下电器产业株式会社 | 带宽扩展参数生成装置、编码装置、解码装置、带宽扩展参数生成方法、编码方法、以及解码方法 |
CN104103276A (zh) * | 2013-04-12 | 2014-10-15 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN106133831A (zh) * | 2014-07-25 | 2016-11-16 | 松下电器(美国)知识产权公司 | 音响信号编码装置、音响信号解码装置、音响信号编码方法以及音响信号解码方法 |
JP2019070823A (ja) * | 2014-07-25 | 2019-05-09 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 音響信号符号化装置、音響信号復号装置、音響信号符号化方法および音響信号復号方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2023509201A (ja) | 2023-03-07 |
KR20220117340A (ko) | 2022-08-23 |
EP4080503A1 (en) | 2022-10-26 |
US11887610B2 (en) | 2024-01-30 |
US20220343926A1 (en) | 2022-10-27 |
CN113192517B (zh) | 2024-04-26 |
WO2021143691A1 (zh) | 2021-07-22 |
EP4080503A4 (en) | 2023-05-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1878001B (zh) | 对音频数据编码及解码的设备及方法 | |
US7433824B2 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
JP5688861B2 (ja) | レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化 | |
EP1400954A2 (en) | Entropy coding by adapting coding between level and run-length/level modes | |
JP5162588B2 (ja) | 音声符号化システム | |
RU2707722C2 (ru) | Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования | |
US10089997B2 (en) | Method for predicting high frequency band signal, encoding device, and decoding device | |
CN111316353B (zh) | 确定空间音频参数编码和相关联的解码 | |
CN113192521A (zh) | 一种音频编解码方法和音频编解码设备 | |
KR101647576B1 (ko) | 스테레오 오디오 신호 인코더 | |
RU2702265C1 (ru) | Способ и устройство обработки сигналов | |
CN114550732B (zh) | 一种高频音频信号的编解码方法和相关装置 | |
CN113192523A (zh) | 一种音频编解码方法和音频编解码设备 | |
US11887610B2 (en) | Audio encoding and decoding method and audio encoding and decoding device | |
CN100489964C (zh) | 音频解码 | |
CN100574114C (zh) | 编码方法和设备以及解码方法和设备 | |
CN113113032A (zh) | 一种音频编解码方法和音频编解码设备 | |
WO2019243670A1 (en) | Determination of spatial audio parameter encoding and associated decoding | |
CN113948094A (zh) | 音频编解码方法和相关装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |