WO2017186040A1 - 一种音频信号编码、解码方法及音频信号编码器、解码器 - Google Patents

一种音频信号编码、解码方法及音频信号编码器、解码器 Download PDF

Info

Publication number
WO2017186040A1
WO2017186040A1 PCT/CN2017/081114 CN2017081114W WO2017186040A1 WO 2017186040 A1 WO2017186040 A1 WO 2017186040A1 CN 2017081114 W CN2017081114 W CN 2017081114W WO 2017186040 A1 WO2017186040 A1 WO 2017186040A1
Authority
WO
WIPO (PCT)
Prior art keywords
mode
bits
bit
value
decoding
Prior art date
Application number
PCT/CN2017/081114
Other languages
English (en)
French (fr)
Inventor
李海婷
张兴涛
苗磊
Original Assignee
华为技术有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 华为技术有限公司 filed Critical 华为技术有限公司
Publication of WO2017186040A1 publication Critical patent/WO2017186040A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Definitions

  • the present invention relates to the field of data processing technologies, and in particular, to an audio signal encoding and decoding method, an audio signal encoder, and a decoder.
  • the audio codec is obtained by encoding and compressing a digital audio signal in a Pulse Code Modulation (PCM) domain to obtain a code stream signal, and then encoding and transmitting the code stream signal according to a certain format, and the decoding end receives the code according to the received code.
  • the code stream signal is decoded to recover the digital audio signal of the PCM domain.
  • PCM Pulse Code Modulation
  • the commonly used codec modes are a mono codec mode and a stereo codec mode (the stereo codec mode may also be referred to as a two-channel codec mode). Therefore, it is necessary to identify whether it is a mono coding mode or a stereo coding mode.
  • the existing stereo encoder will down-mix the stereo signal to obtain a mono signal, and then encode and encode the mono signal obtained by downmixing using a mono encoder of a certain encoding rate.
  • the parameter information or the residual signal between the two channels of the stereo signal, and then the encoded mono signal and the encoded residual signal constitute the entire stereo code stream, and the stereo coding rate is obtained by downmixing.
  • N stereo streams with the same stereo coding rate may be encoded using N different mono coding modes, and different mono coding modes have different coding rates.
  • the Log2(N) mode bits In order to identify the mono codec mode in the stereo codec mode, it is necessary to use the Log2(N) mode bits to identify the mono codec mode in the code stream, and convert the single in the stereo codec mode each time.
  • the channel coding and decoding mode it is necessary to modify the value of the mode bit. The more coding modes provided, the more bits need to be modified, which will greatly affect the encoding and decoding speed, and when encoding and decoding. If the increase or decrease of the mode bit is required, the value of the mode bit corresponding to the codec mode for identifying other original codes also needs to be changed, thus affecting the compatibility of the codec scheme.
  • the embodiment of the present invention provides an audio signal encoding and decoding method, and an audio signal encoder and a decoder, which are used to solve the problem in the prior art that when the mode bit needs to be increased or decreased due to the increase or decrease of the codec mode, The value of the mode bit corresponding to the codec mode used to identify other original codes also needs to be changed, thereby affecting the compatibility of the codec scheme, and improving the codec speed.
  • an audio signal encoding method including:
  • the current encoding mode is determined in the N encoding modes included in the Q channel encoding mode, where Q is a positive integer greater than 1, and N is a positive integer greater than 1. ;
  • the code stream includes a mode bit
  • the mode bit in the code stream is used to identify the current coding mode, and the length of the mode bit in the code stream i, when i is greater than 1 and less than N-1, and N is greater than 3, the i-1 values of the first i-1 bits of the i bits of the mode bits in the code stream are the same, i The value on the i-th bit of the bit is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value.
  • the length of the mode bit is i means that the mode bit has i bits.
  • the N coding modes used are identified by the value of the mode bit in the code stream, and different coding modes can be identified by setting values on different bits of the mode bits in the code stream, which can be increased or decreased.
  • the mode bit it is not necessary to change the value used to identify other original mode bits, and freely identify multiple coding modes, thereby solving the compatibility problem of the coding scheme.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • a mode bit in the code stream when i is equal to N, includes N bits, N-1 values on the first N-1 bits of the N bits are the same, and the value on the Nth bit of the N bits is different from the value on any of the N-1 bits.
  • the value on the Nth bit is a preset value.
  • the Nth bit can be located after the N-1 bits, and the N coding modes used are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, and freely identify multiple encoding modes to solve the compatibility problem of the encoding scheme.
  • a mode bit in the code stream includes N-1 bits, the N-2 values of the first N-2 bits of the N-1 bits are the same, and the values of the N-1th bits of the N-1 bits are different.
  • the value on any of the N-2 bits, the value on the N-1th bit is a preset value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the current coding manner for the embedded coding mode is coded using the P channel coding mode, and P is a positive integer smaller than Q.
  • the N encoding The method includes at least two types of embedded coding modes, and at least two types of embedded coding modes have different bit lengths, and at least two types of embedded coding modes use different P-channel coding modes.
  • a sixth possible implementation manner of the first aspect When the code rate of the P channel coding mode used by the mode is larger, the length of the bit corresponding to one of the coding modes is longer, or the length of the bit corresponding to one of the coding modes is shorter.
  • the N encoding Non-embedded Entry coding is a method of encoding without using a mono encoding method and encoding using only a multi-channel encoding method.
  • the non-embedded coding mode corresponds to a mode bit length of 1;
  • the length of the bit corresponding to the non-embedded coding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded coding mode is N-1, and the mode bit corresponding to the non-embedded coding mode
  • the N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • an audio signal decoding method including:
  • the current decoding mode is determined according to the value on the mode bit in the code stream, the Q channel decoding mode includes N decoding modes, and the current decoding mode is N decoding modes.
  • the length of the mode bit in the code stream is i
  • Q is a positive integer greater than 1
  • N is a positive integer greater than 1, wherein when i is greater than 1 and less than N-1, and N is greater than 3
  • the i-1 values on the first i-1 bits of the i bits of the mode bits in the code stream are the same, and the value on the i th bit of the i bits is different from i-1 bits.
  • a value on any bit in the bit, the value on the i-th bit is a preset value;
  • the code stream is decoded according to the current decoding mode.
  • the value of the mode bit in the code stream is used to identify the N types of decoding modes used. When the mode bits are added or decreased, the value of the bit used to identify other original modes does not need to be changed.
  • the decoding method solves the compatibility problem of the decoding scheme.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • the mode bit in the code stream when i is equal to N, includes N bits, N-1 values on the first N-1 bits of the N bits are the same, and the value on the Nth bit of the N bits is different from the value on any of the N-1 bits.
  • the value on the Nth bit is a preset value.
  • the Nth bit can be located after the N-1 bits, and the N types of decoding modes are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, freely identify multiple decoding modes, and solve the compatibility problem of the decoding scheme.
  • a mode bit in the code stream includes N-1 bits, the N-2 values of the first N-2 bits of the N-1 bits are the same, and the values of the N-1th bits of the N-1 bits are different.
  • the value on any of the N-2 bits, the value on the N-1th bit is a preset value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the current decoding manner For embedding uses the P channel decoding method for decoding, and P is a positive integer smaller than Q.
  • the N decoding The method includes at least two types of embedded decoding modes, and at least two types of embedded decoding modes have different bit lengths, and the P channel decoding modes used by at least two embedded decoding modes have different code rates.
  • a sixth possible implementation manner of the second aspect When the code rate of the P channel decoding method used by the mode is larger, the length of the bit corresponding to one of the decoding modes is longer, or the length of the bit corresponding to one of the decoding modes is shorter.
  • the N decoding The method includes non-embedded decoding.
  • the non-embedded decoding mode corresponds to a mode bit length of 1;
  • the length of the bit corresponding to the non-embedded decoding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded decoding mode is N-1, and the mode bit corresponding to the non-embedded decoding mode
  • N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • an audio signal encoder including:
  • a determining unit configured to determine an encoding mode of the audio signal; when the encoding mode of the audio signal is a Q channel encoding mode, determining a current encoding mode among the N encoding modes included in the Q channel encoding mode, where Q is greater than a positive integer of 1, N is a positive integer greater than one;
  • a coding unit configured to encode the audio signal according to a current coding manner determined by the determining unit, to obtain a code stream of the audio signal, where the code stream includes a mode bit, and the mode bit in the code stream is used to identify the current coding mode,
  • the length of the mode bit in the code stream is i, when i is greater than 1 and less than N-1, and N is greater than 3, the first i-1 bits of the i bits of the mode bit in the code stream
  • the i-1 values are the same, the value on the i-th bit of the i bits is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value.
  • the N coding modes used are identified by the value of the mode bit in the code stream, and different coding modes can be identified by setting values on different bits of the mode bits in the code stream, which can be increased or decreased.
  • the mode bit it is not necessary to change the value used to identify other original mode bits, and freely identify multiple coding modes, thereby solving the compatibility problem of the coding scheme.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • a mode bit in the code stream when i is equal to N, includes N bits, N-1 values on the first N-1 bits of the N bits are the same, and the value on the Nth bit of the N bits is different from the value on any of the N-1 bits.
  • the value on the Nth bit is a preset value.
  • the Nth bit can be located at the N-1 ratio
  • the N coding modes used are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, it is not necessary to change the bits used to identify other original modes. Value, free identification of multiple encoding methods, to solve the compatibility of the encoding scheme.
  • a mode bit in the code stream includes N-1 bits, the N-2 values of the first N-2 bits of the N-1 bits are the same, and the values of the N-1th bits of the N-1 bits are different.
  • the value on any of the N-2 bits, the value on the N-1th bit is a preset value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the current coding manner for the embedded coding mode is coded using the P channel coding mode, and P is a positive integer smaller than Q.
  • the N encoding The method includes at least two types of embedded coding modes, and at least two types of embedded coding modes have different bit lengths, and at least two types of embedded coding modes use different P-channel coding modes.
  • one of the coding modes in the two coding manners of the at least two embedded coding modes, one of the coding modes When the code rate of the P channel coding mode used by the mode is larger, the length of the bit corresponding to one of the coding modes is longer, or the length of the bit corresponding to one of the coding modes is shorter.
  • the N encoding The method includes non-embedded coding.
  • the length of the bit corresponding to the non-embedded coding mode is 1; or
  • the length of the bit corresponding to the non-embedded coding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded coding mode is N-1, and the mode bit corresponding to the non-embedded coding mode
  • the N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • an audio signal decoder including:
  • a receiving unit configured to receive a code stream of the audio signal
  • a determining unit configured to determine a current decoding mode according to a value on a mode bit in the code stream when determining a decoding mode of the code stream is a Q channel decoding mode, where the Q channel decoding mode includes N decoding modes, and a current decoding mode It is one of N decoding modes.
  • the length of the mode bit in the code stream is i, Q is a positive integer greater than 1, and N is a positive integer greater than 1, where i is greater than 1 and less than N-1.
  • the i-1 values on the first i-1 bits of the i bits of the mode bits in the code stream are the same, and the values on the i th bit of the i bits are different from a value on any one of the i-1 bits, and the value on the i-th bit is a preset value;
  • a decoding unit configured to decode the code stream according to a current decoding manner determined by the determining unit.
  • the value of the mode bit in the code stream is used to identify the N types of decoding modes used. When the mode bits are added or decreased, the value of the bit used to identify other original modes does not need to be changed.
  • the decoding method solves the compatibility problem of the decoding scheme.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • a mode bit in the code stream when i is equal to N, includes N bits, N-1 values on the first N-1 bits of the N bits are the same, and the value on the Nth bit of the N bits is different from the value on any of the N-1 bits.
  • the value on the Nth bit is a preset value.
  • the Nth bit can be located after the N-1 bits, and the N types of decoding modes are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, freely identify multiple decoding modes, and solve the compatibility problem of the decoding scheme.
  • a mode bit in the code stream includes N-1 bits, the N-2 values of the first N-2 bits of the N-1 bits are the same, and the values of the N-1th bits of the N-1 bits are different.
  • the value on any of the N-2 bits, the value on the N-1th bit is a preset value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the current coding manner for the embedded decoding mode uses the P channel decoding method for decoding, and P is a positive integer smaller than Q.
  • the N decoding The method includes at least two types of embedded decoding modes, and at least two types of embedded decoding modes have different bit lengths, and the P channel decoding modes used by at least two embedded decoding modes have different code rates.
  • a sixth possible implementation manner of the fourth aspect When the code rate of the P channel decoding method used by the mode is larger, the length of the bit corresponding to one of the decoding modes is longer, or the length of the bit corresponding to one of the decoding modes is shorter.
  • the N decoding The method includes non-embedded decoding.
  • the length of the bit corresponding to the non-embedded decoding mode is 1; or
  • the length of the bit corresponding to the non-embedded decoding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded decoding mode is N-1, and the mode bit corresponding to the non-embedded decoding mode
  • N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bit is a reserved bit, a specified bit, or an extended bit.
  • a fifth aspect provides an audio signal coding method, including:
  • the current coding mode is determined in the N coding modes included in the Q channel coding mode, and the current coding mode is the i-th coding mode among the N coding modes, where Q is a positive integer greater than 1, N is a positive integer greater than 1, and i is a positive integer less than or equal to N;
  • the index of the i-th encoding mode may be i or i-1, and the index value starts from 1. Start with 0.
  • the index i may be located in a preset index table, and the index i in the index table corresponds to N coding modes included in the Q channel coding mode.
  • the index 1 corresponds to the first of the N coding modes.
  • index 2 corresponds to the second coding mode of the N coding modes, and so on, and the corresponding coding mode is searched by index.
  • the code stream includes a mode bit
  • the mode bit in the code stream is used to identify the current coding mode, where i is greater than 1 and less than N
  • the mode bits in the code stream include i bits, the i-1 values on the first i-1 bits of the i bits are the same, and the i-th bit of the i bits The value on the bit is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value.
  • the i-th coding mode of the N coding modes used is identified by the value of the mode bit in the code stream, and different coding modes can be identified by setting values on different bits of the mode bits in the code stream.
  • the mode bit is increased or decreased, the value on the bit used to identify other original modes does not need to be changed, and multiple coding modes are freely identified, thereby solving the compatibility problem of the coding scheme.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • the mode bit in the code stream when i is equal to N, and N is greater than 2, the mode bit in the code stream includes N-1 bits, N-1 values on the N-1 bits are the same, and values on each of the N-1 bits are different from the preset values.
  • the N-1 bits may be located before the Nth bit, and the N coding modes used are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, and freely identify multiple encoding modes to solve the compatibility problem of the encoding scheme.
  • the mode bit in the code stream further includes the Nth bit Bit, the value on the Nth bit is the default value.
  • the N encoding The method includes an embedded coding mode, and the embedded coding mode uses a P channel coding mode for coding, and P is a positive integer smaller than Q.
  • the embedded coding mode is at least two, and in the at least two embedded coding modes, When the code rate of the P channel coding mode used in one of the coding modes is larger, the number of bits of the mode corresponding to one of the coding modes is larger, or the bit of the mode corresponding to one of the coding modes The fewer the number of bits.
  • the N encoding Non-embedded Entry coding is a method of encoding without using a mono encoding method and encoding using only a multi-channel encoding method.
  • the non-embedded coding mode is the Nth coding mode of the N coding modes.
  • the non-embedded coding method is the first coding method among the N coding methods.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • an audio signal decoding method including:
  • the current decoding mode is determined according to the value on the mode bit in the code stream, the Q channel decoding mode includes N decoding modes, and the current decoding mode is N decoding modes.
  • the i-th decoding method wherein Q is a positive integer greater than 1, N is a positive integer greater than 1, and i is a positive integer less than or equal to N, wherein i is greater than 1 and less than N, and N is greater than 2
  • the mode bit in the code stream includes i bits
  • the i-1 values on the first i-1 bits of the i bits are the same, and the values on the i-th bit of the i bits are different.
  • the value of any one of the i-1 bits, the value of the i-th bit is a preset value; the index of the i-th decoding mode may be i, or may be an index value of i-1. Start with 1 or start with 0.
  • the index i may be located in a preset index table, and the index i in the index table corresponds to N decoding modes included in the Q channel decoding mode. For example, the index 1 corresponds to the first of the N decoding modes.
  • the index 2 corresponds to the second decoding method of the N decoding methods, and so on, and the corresponding decoding method is searched by the index.
  • the code stream is decoded according to the current decoding mode.
  • the i-th decoding mode of the N decoding modes used is identified by the value of the i mode bits in the code stream, so that when the mode bits are increased or decreased, it is not necessary to change the mode bits used to identify other original modes.
  • the value on the bit freely identifies multiple decoding methods, and solves the compatibility problem of the decoding scheme.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • the mode bit in the code stream when i is equal to N, and N is greater than 2, the mode bit in the code stream includes N-1 bits, N-1 values on the N-1 bits are the same, and values on each of the N-1 bits are different from the preset values.
  • the N-1 bits may be located before the Nth bit, and the N coding modes used are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, freely identify multiple decoding modes, and solve the compatibility problem of the decoding scheme.
  • the mode bit when i is equal to N, the mode bit further includes the Nth bit, the Nth The value on each bit is the default value.
  • the N decoding The method includes an embedded decoding mode, and the embedded decoding mode uses a P channel decoding method for decoding, and P is a positive integer smaller than Q.
  • the embedded decoding manner is at least two, and in the at least two embedded decoding manners, In one of them
  • the code rate of the P channel decoding method used by the decoding method is larger, the number of bits of the bit corresponding to one of the decoding modes is larger, or the number of bits of the mode corresponding to one of the decoding modes The less.
  • the N decoding The method includes non-embedded decoding.
  • the non-embedded decoding mode is the Nth decoding mode of the N decoding modes.
  • the non-embedded decoding method is the first decoding method among the N types of decoding methods.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • an audio signal encoder including:
  • a determining unit configured to determine an encoding mode of the audio signal; when the encoding mode of the audio signal is a Q channel encoding mode, determining a current encoding mode in the N encoding modes included in the Q channel encoding mode, the current encoding mode is N
  • the i-th encoding method of the encoding method wherein Q is a positive integer greater than 1, N is a positive integer greater than 1, and i is a positive integer less than or equal to N; the index of the i-th encoding mode may be i, It can also be i-1. The index value starts from 1, or starts from 0.
  • the index i can be located in a preset index table, and the index i in the index table and the N coding modes included in the Q channel coding mode.
  • index 1 corresponds to the first coding mode of the N coding modes
  • index 2 corresponds to the second coding mode of the N coding modes, and so on, and the corresponding coding mode is searched by index. .
  • a coding unit configured to encode an audio signal according to a current coding manner, to obtain a code stream of the audio signal, where the code stream includes a mode bit, and a mode bit in the code stream is used to identify a current coding mode, where
  • the mode bits in the code stream include i bits, and the i-1 values on the first i-1 bits of the i bits are the same, i bits The value on the i-th bit is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value.
  • the i-th coding mode of the N coding modes used is identified by the value of the mode bit in the code stream, and different coding modes can be identified by setting values on different bits of the mode bits in the code stream.
  • the mode bit is increased or decreased, the value on the bit used to identify other original modes does not need to be changed, and multiple coding modes are freely identified, thereby solving the compatibility problem of the coding scheme.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • the mode bit in the code stream when i is equal to N, and N is greater than 2, the mode bit in the code stream includes N-1 bits, N-1 values on the N-1 bits are the same, and values on each of the N-1 bits are different from the preset values.
  • the N-1 bits may be located before the Nth bit, and the N coding modes used are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, and freely identify multiple encoding modes to solve the compatibility problem of the encoding scheme.
  • the mode bit in the code stream further includes the Nth bit Bit, the value on the Nth bit is the default value.
  • the N encoding The method includes an embedded coding mode, and the embedded coding mode uses a P channel coding mode for coding, and P is a positive integer smaller than Q.
  • the embedded coding mode is at least two, and in the at least two embedded coding modes, When the code rate of the P channel coding mode used in one of the coding modes is larger, the number of bits of the mode corresponding to one of the coding modes is larger, or the bit of the mode corresponding to one of the coding modes The fewer the number of bits.
  • the N encoding The method includes non-embedded coding.
  • the non-embedded coding mode is the Nth coding mode of the N coding modes.
  • the non-embedded coding method is the first coding method among the N coding methods.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • an audio signal decoder including:
  • a receiving unit configured to receive a code stream of the audio signal
  • a determining unit configured to determine a current decoding mode according to a value on a mode bit in the code stream when determining a decoding mode of the code stream is a Q channel decoding mode, where the Q channel decoding mode includes N decoding modes, and a current decoding mode
  • the i-th decoding mode of the N decoding modes where Q is a positive integer greater than 1, N is a positive integer greater than 1, and i is a positive integer less than or equal to N, where i is greater than 1 and less than N
  • the mode bits in the code stream include i bits, the i-1 values on the first i-1 bits of the i bits are the same, and the i-th bit of the i bits
  • the value on the bit is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value; the index i may be located in a preset index table in the index table.
  • the index i corresponds to the N decoding modes included in the Q channel decoding mode.
  • the index 1 corresponds to the first decoding mode of the N decoding modes
  • the index 2 corresponds to the first of the N decoding modes.
  • Two kinds of decoding methods, and so on, are used to search for the corresponding decoding mode through an index.
  • a decoding unit configured to decode the code stream according to a current decoding manner determined by the determining unit.
  • the i-th decoding mode of the N decoding modes used is identified by the value of the i mode bits in the code stream, so that when the mode bits are increased or decreased, it is not necessary to change the mode bits used to identify other original modes.
  • the value on the bit freely identifies multiple decoding methods, and solves the compatibility problem of the decoding scheme.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • the mode bit in the code stream when i is equal to N, and N is greater than 2, the mode bit in the code stream includes N-1 bits, N-1 values on the N-1 bits are the same, and values on each of the N-1 bits are different from the preset values.
  • the N-1 bits may be located before the Nth bit, and the N coding modes used are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, freely identify multiple decoding modes, and solve the compatibility problem of the decoding scheme.
  • the mode bit when i is equal to N, the mode bit further includes an Nth bit, and the value on the Nth bit is a preset value.
  • the N decoding The method includes an embedded decoding mode, and the embedded decoding mode uses a P channel decoding method for decoding, and P is a positive integer smaller than Q.
  • the embedded decoding manner is at least two, and in the at least two embedded decoding manners, When the code rate of the P channel decoding mode used in one of the decoding modes is larger, the number of bits of the bit mode corresponding to one of the decoding modes is larger, or the bit of the mode bit corresponding to one of the decoding modes The fewer the number of bits.
  • the N decoding The method includes non-embedded decoding.
  • the non-embedded decoding mode is the Nth decoding mode of the N decoding modes.
  • the non-embedded decoding method is the first decoding method among the N types of decoding methods.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • an audio signal encoder including:
  • the processor is configured to read the code in the memory for performing: determining an encoding mode of the audio signal; and determining, in the Q channel encoding mode, the N encoding modes included in the Q channel encoding mode
  • the current encoding mode wherein Q is a positive integer greater than 1, and N is a positive integer greater than 1; the processor encodes the audio signal according to a current encoding manner, thereby obtaining a code stream of the audio signal, wherein the code stream includes a mode bit
  • the mode bit in the code stream is used to identify the current coding mode.
  • the length of the mode bit in the code stream is i. When i is greater than 1 and less than N-1, and N is greater than 3, the mode bit in the code stream.
  • the i-1 values on the first i-1 bits of the i bits are the same, and the value on the i th bit of the i bits is different from any of the i-1 bits. Value, the value on the ith bit is the default value.
  • the N coding modes used are identified by the value of the mode bit in the code stream, and different coding modes can be identified by setting values on different bits of the mode bits in the code stream, which can be increased or decreased.
  • the mode bit it is not necessary to change the value used to identify other original mode bits, and freely identify multiple coding modes, thereby solving the compatibility problem of the coding scheme.
  • the mode bit in the code stream when i is equal to 1, includes 1 bit, and the value on the 1 bit is a preset value.
  • a mode bit in the code stream when i is equal to N, includes N bits, N-1 values on the first N-1 bits of the N bits are the same, and the value on the Nth bit of the N bits is different from the value on any of the N-1 bits.
  • the value on the Nth bit is a preset value.
  • the Nth bit can be located after the N-1 bits, and the N coding modes used are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, and freely identify multiple encoding modes to solve the compatibility problem of the encoding scheme.
  • a mode bit in the code stream includes N-1 bits, the N-2 values of the first N-2 bits of the N-1 bits are the same, and the values of the N-1th bits of the N-1 bits are different.
  • the value on any of the N-2 bits, the value on the N-1th bit is a preset value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the current coding manner for the embedded coding mode is coded using the P channel coding mode, and P is a positive integer smaller than Q.
  • the N encoding The method includes at least two types of embedded coding modes, and at least two types of embedded coding modes have different bit lengths, and at least two types of embedded coding modes use different P-channel coding modes.
  • a sixth possible implementation manner of the ninth aspect When the code rate of the P channel coding mode used by the mode is larger, the length of the bit corresponding to one of the coding modes is longer, or the length of the bit corresponding to one of the coding modes is shorter.
  • the N encoding The method includes non-embedded coding.
  • the length of the bit corresponding to the non-embedded coding mode is 1; or
  • the length of the bit corresponding to the non-embedded coding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded coding mode is N-1, and the mode bit corresponding to the non-embedded coding mode
  • the N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • an audio signal decoder including:
  • Transceiver processor and memory.
  • the transceiver receives the code stream of the audio signal; the processor is configured to read the code in the memory for execution: when determining that the decoding mode of the code stream is the Q channel decoding mode, determining according to the value of the mode bit in the code stream
  • the current decoding mode, the Q channel decoding mode includes N decoding modes, and the current decoding mode is one of N decoding modes.
  • the length of the mode bit in the code stream is i, and Q is a positive integer greater than 1, and N is a positive integer greater than 1, wherein i-1 on the first i-1 bits of the i bits of the mode bits in the code stream when i is greater than 1 and less than N-1, and N is greater than 3.
  • the values are the same, the value on the i-th bit of the i bits is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value; the processor determines The current decoding mode decodes the code stream.
  • the value of the mode bit in the code stream is used to identify the N types of decoding modes used. When the mode bits are added or decreased, the value of the bit used to identify other original modes does not need to be changed. Decoding method, solution The compatibility problem of the decoding scheme is decided.
  • the mode bit in the code stream includes 1 bit, and the value on the 1 bit is a preset value.
  • a mode bit in the code stream when i is equal to N, includes N bits, N-1 values on the first N-1 bits of the N bits are the same, and the value on the Nth bit of the N bits is different from the value on any of the N-1 bits.
  • the value on the Nth bit is a preset value.
  • the Nth bit can be located after the N-1 bits, and the N types of decoding modes are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, freely identify multiple decoding modes, and solve the compatibility problem of the decoding scheme.
  • a mode bit in the code stream includes N-1 bits, the N-2 values of the first N-2 bits of the N-1 bits are the same, and the values of the N-1th bits of the N-1 bits are different.
  • the value on any of the N-2 bits, the value on the N-1th bit is a preset value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the embedded decoding method uses the P channel decoding method for decoding, and P is a positive integer smaller than Q.
  • the N decoding The method includes at least two types of embedded decoding modes, and at least two types of embedded decoding modes have different bit lengths, and the P channel decoding modes used by at least two embedded decoding modes have different code rates.
  • one of the decoding modes is performed in the two decoding modes of the at least two embedded decoding modes.
  • the code rate of the P channel decoding method used by the mode is larger, the length of the bit corresponding to one of the decoding modes is longer, or the length of the bit corresponding to one of the decoding modes is shorter.
  • the N decoding The method includes non-embedded decoding.
  • the length of the bit corresponding to the non-embedded decoding mode is 1; or
  • the length of the bit corresponding to the non-embedded decoding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded decoding mode is N-1, and the mode bit corresponding to the non-embedded decoding mode
  • N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bit The reserved bits, the specified bits, or the bits obtained after the expansion.
  • a computer storage medium for storing a calculation performed by a processor for the ninth aspect Machine software instructions for performing the method provided by the first aspect.
  • a computer storage medium for storing computer software instructions for execution by a processor of the tenth aspect for performing the method provided by the second aspect.
  • an audio signal encoder including:
  • the processor is operative to read the code in the memory for performing the methods provided by the fifth aspect and the possible implementations of the fifth aspect.
  • an audio signal decoder comprising:
  • Transceiver processor and memory.
  • the transceiver receives the code stream of the audio signal; the processor is operative to read the code in the memory for performing the methods provided by the sixth aspect and the possible implementations of the sixth aspect.
  • a fifteenth aspect a computer storage medium for storing processor software executed by a processor provided by the thirteenth aspect and a possible implementation of the thirteenth aspect for performing the fifth aspect and the fifth Aspects of possible implementations of the methods provided.
  • a computer storage medium for storing computer software instructions for execution by a processor provided by the fourteenth aspect and a possible implementation of the fourteenth aspect for performing the sixth aspect and the sixth Aspects of possible implementations of the methods provided.
  • the embodiment of the present invention indicates that, by determining the encoding mode of the audio signal, when the encoding mode of the audio signal is the Q channel encoding mode, the current encoding mode is determined in the N encoding modes included in the Q channel encoding mode, according to the current encoding.
  • the method encodes the signal to obtain the code stream of the audio signal.
  • the N coding modes used are identified by the value of the mode bit in the code stream, and different coding modes can be identified by setting values on different bits of the mode bits in the code stream, which can be increased or decreased. When the mode bit is used, it is not necessary to change the value used to identify other original mode bits, and freely identify multiple coding modes, thereby solving the compatibility problem of the coding scheme.
  • FIG. 1 is a system architecture diagram of an audio signal encoding and decoding according to an embodiment of the present invention
  • FIG. 2 is a schematic flowchart of an audio signal coding method according to an embodiment of the present invention.
  • FIG. 3 is a schematic structural diagram of a code stream format according to an embodiment of the present disclosure.
  • FIG. 4 is a schematic structural diagram of a code stream format according to an embodiment of the present disclosure.
  • FIG. 5 is a schematic structural diagram of a code stream format according to an embodiment of the present disclosure.
  • FIG. 6 is a schematic structural diagram of a code stream format according to an embodiment of the present disclosure.
  • FIG. 7 is a schematic flowchart of a method for decoding an audio signal according to an embodiment of the present invention.
  • FIG. 8 is a schematic structural diagram of a code stream extension according to an embodiment of the present invention.
  • 9a to 9c are schematic diagrams showing the structure of a code stream decoding according to an embodiment of the present invention.
  • FIG. 10 is a schematic structural diagram of a code stream extension according to an embodiment of the present invention.
  • FIG. 11 is a schematic structural diagram of a code stream decoding according to an embodiment of the present invention.
  • FIG. 12 is a schematic structural diagram of an audio signal encoder according to an embodiment of the present disclosure.
  • FIG. 13 is a schematic structural diagram of an audio signal decoder according to an embodiment of the present disclosure.
  • FIG. 14 is a schematic structural diagram of an audio signal encoder according to an embodiment of the present invention.
  • FIG. 15 is a schematic structural diagram of an audio signal decoder according to an embodiment of the present invention.
  • the embodiment of the present invention is applicable to an audio signal codec, such as the system architecture diagram shown in FIG. 1, the audio signal codec includes an audio signal encoder 101 and an audio signal decoder 102.
  • the audio signal encoder 101 is configured to obtain a code stream signal after encoding and compressing the digital audio information, and then package and transmit the code stream signal according to a certain format.
  • the audio signal decoder 102 performs decoding according to a certain order rule according to the received code stream signal, and recovers the digital audio signal.
  • FIG. 2 shows a flow of an audio signal encoding method provided by an embodiment of the present invention, which may be performed by an audio signal encoder.
  • Step 201 determining an encoding mode of the audio signal.
  • Step 202 When the encoding mode of the audio signal is the Q channel encoding mode, determine the current encoding mode among the N encoding modes included in the Q channel encoding mode.
  • Step 203 encode the signal according to a current encoding manner, thereby obtaining a code stream of the audio signal.
  • the coding mode of the audio signal includes a Q channel coding mode, and Q is a positive integer greater than 1, the Q channel coding mode includes N coding modes, and N is a positive integer.
  • the current encoding mode may be determined from the N encoding modes included in the Q channel encoding mode, and the audio signal is encoded by using the current encoding mode.
  • the code stream of the audio signal can be obtained.
  • the coding mode of the audio signal may also include a P channel coding mode, and P is a positive integer smaller than Q.
  • the Q channel coding mode may be a stereo coding mode
  • the P channel coding mode may be a single Channel coding mode
  • the coding mode in the mono coding mode includes mono coding mode coding
  • the coding mode in the stereo coding mode includes embedded coding mode
  • the embedded coding mode uses mono coding mode
  • the stereo coding mode also Non-embedded encoding can be included, and mono encoding is not used in non-embedded encoding.
  • the encoding mode of the audio signal may also include an L channel encoding mode, L is a positive integer less than Q, and L is not P.
  • a mode bit is included in the encoded stream described above.
  • the current coding mode determined from the N coding modes is identified by the value on the mode bit in the code stream, and the mode bit length in the code stream is i.
  • the i-1 values of the first i-1 bits of the i bits of the mode bits in the code stream are the same, i bits of The value on the i-th bit is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value.
  • the preset value is a binary number and can be 1 or 0.
  • i is equal to 3
  • the mode bit has 3 bits
  • the value on the 3 bits may be 001 or 110.
  • the current coding mode may also be the i-th coding mode of the N coding modes, and the index of the i-th coding mode may be i or i-1.
  • the index value starts at 1 and starts at 0.
  • the index i may be located in a preset index table, where the index i is associated with the N coding modes included in the Q channel coding mode, for example, the index 1 corresponds to the first of the N coding modes.
  • the coding method, index 2 corresponds to the second coding mode of the N coding modes, and so on, and searches for the corresponding coding mode by index.
  • the mode bit in the code stream has only 1 bit, that is, when i is equal to 1, the manner in the code stream is
  • the special bit includes 1 bit, and the value on 1 bit is a preset value.
  • the value on the 1 bit is a binary number, which can be 1 or 0.
  • the preset value can be used to identify which encoding method is used.
  • the mode bit in the code stream includes N bits, the N-1 values on the first N-1 bits of the N bits are the same, and the Nth bit of the N bits
  • the value on the value is different from the value on any of the N-1 bits, and the value on the Nth bit is a preset value.
  • N is equal to 4, and the N-1 values on the first N-1 bits may all be 0 or 1, and the value on the Nth bit is different from any of the N-1 values. It can be 0001 or 1110.
  • the Nth bit can be located after the N-1 bits, and the N coding modes used are identified by the values on the N bits in the code stream, so that when the mode bits are increased or decreased, It is necessary to change the value used to identify other original mode bits, and freely identify multiple encoding modes to solve the compatibility problem of the encoding scheme.
  • the mode bits in the code stream include N-1 bits, and the N-2 values on the first N-2 bits of the N-1 bits are the same.
  • the value on the N-1th bit of the N-1 bits is different from the value on any of the N-2 bits, and the value on the N-1th bit is a preset value.
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the preset value may be a first preset value, and a value of the mode bit different from the first preset value is a second preset value.
  • the code stream further includes a mode bit, where the value on the mode bit is used to identify an encoding mode of the audio signal, and the value on the mode bit may be a third preset value, the third preset The value is used to identify the Q channel encoding mode.
  • the value of the mode bit is a binary number, and the number of bits of the mode bit may be one or plural, which is not limited herein. If the value of the mode bit is 1, the coding mode of the audio signal is the Q channel coding mode, and when the value of the mode bit is 0, the coding mode of the audio signal is the P channel coding mode. Is a positive integer less than Q.
  • the current coding mode is an embedded coding mode
  • the embedded coding mode uses P channel coding mode for coding. That is to say, there are various code rates of the P channel coding mode. Accordingly, there are multiple code rates corresponding to the embedded coding mode, and the embedded coding mode is performed by using P channel coding modes corresponding to different code rates.
  • the way of coding includes at least two types of embedded coding modes, where the lengths of the at least two embedded coding modes are different, and the P channel coding modes used by the at least two embedded coding modes are The code rate is different.
  • the N coding modes include two types of embedded coding modes.
  • the length of the bit corresponding to the first coding mode is 1 and the length of the second coding mode may be 2; the first coding mode
  • the code rate of the P channel coding method used is different from the P channel coding method used in the second coding mode.
  • the length of the bit corresponding to one of the coding modes is larger. Long, or, one of the encoding methods corresponds to the shorter the length of the bit.
  • the foregoing N coding modes may be non-embedded coding modes, and the non-embedded coding mode is used.
  • the length of the bit corresponding to the non-embedded coding mode is 1; or the length of the bit corresponding to the non-embedded coding mode is N; or, when N is greater than 2, the non-embedded coding mode
  • the length of the corresponding mode bit is N-1
  • the mode corresponding to the non-embedded coding mode includes N-1 bits, and the N-1 values on the N-1 bits are the same, N-1 bits. The value on each bit in the bit is different from the preset value.
  • the encoding mode of the audio signal includes the P channel encoding mode and the Q channel encoding mode
  • the bit rate of the P channel encoding mode in the P channel encoding mode is K. M kb/s
  • the code rate corresponding to the N coding modes included in the Q channel coding mode is also K M kb/s
  • the code rate of the P channel coding method used in different embedded coding modes is K Mi Kb/s.
  • the value on the mode bit uses 1 to identify the Q channel coding mode and 0 to identify the P channel coding mode.
  • the length of the mode bit is i, the value on the mode bit uses 0 before the i-1 bit, and the 1st bit uses 1.
  • the non-embedded coding mode is the Nth coding mode of the N coding modes.
  • i is equal to N
  • the value of the first i-1 bits in the usage mode bit is 0 to identify the non-embedded coding mode.
  • the length of the mode bit is i
  • the value on the mode bit uses 0 before the i-1 bit
  • the 1st bit uses 1.
  • the non-embedded coding mode is the Nth coding mode among the N coding modes, and the value of the first i-1 bits in the usage mode bit is 0, and the value on the i th bit is 1 This non-embedded encoding method.
  • the length of the mode bit is i
  • the value of the mode bit is 0 before the i-1 bit
  • the 1st bit is 1.
  • the non-embedded coding mode is the first coding mode among the N coding modes
  • the value of the first bit in the usage mode bit is 1 to identify the non-embedded coding mode.
  • the code stream format in the foregoing embodiment is only an exemplary function.
  • the value on the i-1th bit before the mode bit and the value on the i-th bit may be combined according to a specific situation to identify N encoding methods.
  • the multi-channel code stream information in FIGS. 3 to 6 described above may be parameter information and/or residual signal information between the multi-channels.
  • the bit in the above manner may be a reserved bit, a designated bit, or a bit obtained after expansion. If the code stream further includes a mode bit, the mode bit may be located after the mode bit, and the mode bit may be a reserved bit, a specified bit or an extended bit, that is, After the bits in the code stream are extended later, they are also used as mode bits and/or mode bits.
  • the above embodiment shows that, by determining the encoding mode of the audio signal, when the encoding mode of the audio signal is the Q channel encoding mode, the current encoding mode is determined in the N encoding modes included in the Q channel encoding mode, according to the current encoding mode.
  • the signal is encoded to obtain the code stream of the audio signal.
  • the value of the mode bit in the code stream identifies the coding mode of the index of i in the N coding modes used, and different coding modes can be identified by setting values on different bits of the mode bits in the code stream.
  • the mode bit is increased or decreased, the value on the bit used to identify other original modes does not need to be changed, and multiple coding modes are freely identified, thereby solving the compatibility problem of the coding scheme.
  • FIG. 7 shows a flow of an audio signal decoding method provided by an embodiment of the present invention, which may be performed by an audio signal decoder.
  • the process specifically includes:
  • Step 701 Receive a code stream of an audio signal.
  • Step 702 When determining that the decoding mode of the code stream is the Q channel decoding mode, determining the current decoding mode according to the value on the mode bit in the code stream.
  • Step 703 Decode the code stream according to the current decoding mode.
  • the decoding mode of the code stream may be a Q channel decoding mode or a P channel decoding mode, where Q is A positive integer greater than 1, and P is a positive integer less than Q.
  • the P channel can be mono and the Q channel can be multi-channel.
  • the Q channel decoding mode includes a decoding mode in N. After reading the code stream of the received audio signal, determining that the decoding mode of the code stream is a Q channel decoding mode, if there is a mode bit in the code stream, the current decoding mode may be determined according to the value on the mode bit. Finally, the code stream is decoded according to the determined current decoding mode.
  • the current decoding mode is one of N decoding modes.
  • the length of the mode bit in the code stream is i, and N is a positive integer greater than 1, when i is greater than 1 and less than N-1, and N is greater than 3.
  • the i-1 values on the first i-1 bits of the i bits of the mode bits in the code stream are the same, and the value on the i th bit of the i bits is different from i-1 bits.
  • the value on any bit in the bit, the value on the ith bit is the default value.
  • the preset value is a binary number and can be 1 or 0. For example, i is equal to 3, and the mode bit has 3 bits, and the value on the 3 bits may be 001 or 110.
  • the Q channel decoding mode may be a stereo decoding mode
  • the P channel decoding mode may be a mono decoding mode
  • the decoding mode in the mono decoding mode includes a mono decoding mode decoding.
  • the decoding mode in the stereo decoding mode includes an embedded decoding mode
  • the embedded decoding mode uses a mono decoding mode
  • the stereo decoding mode may also include a non-embedded decoding mode
  • the non-embedded decoding mode does not use a mono decoding mode.
  • the decoding mode of the audio signal may also include an L channel decoding mode, L is a positive integer less than Q, and L is not P.
  • the mode bit in the code stream has only 1 bit, that is, when i is equal to 1, the mode bit in the code stream includes 1 bit, and the value on 1 bit is a preset value.
  • the value of the one bit is a binary number, which can be 1 or 0.
  • the preset value can be used to identify which decoding mode is needed for decoding.
  • the mode bit in the code stream includes N bits, the N-1 values on the first N-1 bits of the N bits are the same, and the Nth bit of the N bits
  • the value on the value is different from the value on any of the N-1 bits, and the value on the Nth bit is a preset value.
  • N is equal to 4
  • the N-1 values on the first N-1 bits may all be 0 or 1
  • the value on the Nth bit is different from any of the N-1 values. It can be 0001 or 1110.
  • the Nth bit can be located after the N-1 bits, and the N types of decoding modes to be used are identified by the values on the N bits in the code stream, which can be implemented when the mode bits are increased or decreased. There is no need to change the value used to identify other original mode bits, and freely identify multiple decoding modes, which solves the compatibility problem of the decoding scheme.
  • the mode bits in the code stream include N-1 bits, and the N-2 values on the first N-2 bits of the N-1 bits are the same.
  • the value on the N-1th bit of the N-1 bits is different from the value on any of the N-2 bits, and the value on the N-1th bit is a preset value.
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the preset value may be a first preset value, and a value of the mode bit different from the first preset value is a second preset value.
  • the mode stream may further have a mode bit, where the value on the mode bit is used to identify a decoding mode of the audio signal, and the value on the mode bit may be a third preset value, the third preset Value is used to identify Q channel decoding mode.
  • the value of the mode bit is a binary number, and the number of bits of the mode bit may be one or plural, which is not limited herein. If the value of the mode bit is 1, it indicates that the decoding mode of the audio signal is the Q channel decoding mode, and when the value of the mode bit is 0, it indicates that the decoding mode of the audio signal is the P channel decoding mode, and the P Is a positive integer less than Q.
  • the current decoding method is an embedded decoding method, and the embedded decoding method performs decoding using a P channel decoding method. That is to say, there are multiple code rates of the P channel decoding mode. Accordingly, the embedded decoding mode has multiple code rates, and the P is a positive integer smaller than Q, and the embedded decoding mode uses different codes.
  • the method of decoding the P channel decoding method corresponding to the rate.
  • the foregoing N decoding modes include at least two types of embedded decoding modes, where the lengths of the bits corresponding to the at least two embedded decoding modes are different, and the P channel decoding modes used by the at least two embedded decoding modes are The code rate is different.
  • the N decoding modes include two types of embedded decoding modes.
  • the length of the bit corresponding to the first decoding mode is 1 and the length of the second decoding mode may be 2; the first decoding mode
  • the bit rate of the P channel decoding method used is different from the P channel decoding method used in the second decoding method.
  • the length of the bit mode corresponding to one of the decoding modes is larger. Long, or, one of the decoding modes corresponds to the shorter the length of the bit.
  • the non-embedded decoding mode may be a non-embedded decoding mode.
  • the non-embedded decoding mode corresponds to a mode bit length of 1; or, non-embedded decoding.
  • the length of the bit corresponding to the mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded decoding mode is N-1, and the mode bit corresponding to the non-embedded decoding mode includes N-1.
  • the bits are N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bit in the code stream with a code rate of K M kb/s is read, and if the value of the mode bit is 0, The code stream is then decoded using the P channel decoding mode of the P channel decoding mode at a K M kb/s code rate.
  • the P-channel decoding mode with a code rate of K Mi kb/s is used and the embedded decoding process is performed in combination with the multi-channel information in the code stream.
  • non-embedded decoding processing is performed.
  • the mode bit in the code stream of K M kb/s is read, and if the value of the mode bit is 0, then K M kb
  • the code stream is decoded using the P channel decoding mode of the P channel decoding mode at /s code rate.
  • the P channel decoding method with a code rate of K Mi kb/s is used and the multi-channel information in the code stream is used for embedding. Decoding processing.
  • non-embedded multi-channel decoding processing is performed.
  • the mode bit in the code stream of K M kb/s is read, and if the value of the mode bit is 0, then K M kb
  • the code stream is decoded using the P channel decoding mode of the P channel decoding mode at /s code rate.
  • the P channel decoding mode with a code rate of K Mi-1 kb/s is used and combined with the bit stream.
  • the channel information is subjected to embedded decoding processing.
  • the mode bit in the code stream of K M kb/s is read, and if the value of the mode bit is 0, then K M kb
  • the code stream is decoded using the P channel decoding mode of the P channel decoding mode at /s code rate.
  • the P channel decoding mode with a code rate of K Mi-1 kb/s is used and combined with the bit stream.
  • the channel information is subjected to embedded decoding processing.
  • the above embodiment shows that, by receiving the code stream of the audio signal, when determining that the decoding mode of the code stream is the Q channel decoding mode, the current decoding mode is determined according to the value on the mode bit in the code stream, and the code is coded according to the current decoding mode.
  • the stream is decoded.
  • the N types of decoding modes are identified by the value of the mode bits in the code stream, and the different decoding modes can be identified by the values on different bits of the mode bits in the code stream, which can be implemented in an increasing or decreasing manner. When the bit is used, it is not necessary to change the value used to identify other original mode bits, and freely identify multiple decoding modes, thereby solving the compatibility problem of the decoding scheme.
  • the code stream of the audio signal includes a mode bit and a mode bit.
  • the value of the mode bit is a third preset value
  • the value of the first i-1 bit on the mode bit is the first preset value
  • the value of the i th bit is the second preset value
  • the three preset values indicate that the codec mode of the audio signal is the Q channel codec mode
  • the third preset value of 0 indicates that the codec mode of the audio signal is the P channel codec mode.
  • the first preset value is 0, and the second preset value is 1.
  • the code stream obtained by the embodiment of the present invention is a code stream that is extended by the existing P channel code stream.
  • the Q channel coding mode includes N coding modes, and N is an integer greater than or equal to zero, then:
  • the mode bit is The upper value is 1, and the first bit in the mode bit is 1, and the code stream further includes partial code stream information and multi-channel code stream encoded by the P channel coding mode with a code rate of K Mi kb/s. information.
  • the mode bit is The upper value is 1, and the first bit in the mode bit is 1, and the code stream further includes partial code stream information and multi-channel code stream encoded by the P channel coding mode with a code rate of K Mi kb/s. information.
  • the code rate of the P channel coding mode used in the Q channel coding mode is K Mi kb/s
  • i is an integer greater than or equal to 2 and less than or equal to N and the code before the mode bit
  • the value on the mode bit is 1
  • the first i-1 bits in the mode bit are 0,
  • the i-th bit is 1, and the code rate includes the code rate K Mi kb/s.
  • the code rate of the P channel coding mode used in the Q channel coding mode is K Mi kb/s
  • i is an integer greater than or equal to 2 and less than or equal to N and the code before the mode bit
  • the value on the mode bit is 1
  • the first i-1 bits in the mode bit are 0,
  • the i-th bit is 1, and the code stream also includes the code rate K Mi kb/s.
  • the code stream also includes the non-embedded code stream. information.
  • an audio codec has a coding rate of only 16.4 kb/s before the extension, and only a mono coding mode.
  • the new code stream structure can support a mono coding mode and a stereo coding mode.
  • the stereo coding mode can include an embedded coding mode and a non-embedded coding mode.
  • a method for spreading a mono code stream with a code rate of 16.4 kb/s may specifically be:
  • the 2 bits of the bandwidth flag information, the mode bit, and the mono channel stream information having a code rate of 16.4 kb/s constitute a code stream having an extended code rate of 16.4 kb/s, wherein The value on the mode bit is 0.
  • the 2 bits of the bandwidth flag information, the mode bit, the mode bit, and the code rate of the 13.2 kb/s channel stream and the code rate are 3 kb.
  • the stereo extension information of /s constitutes a code stream with an extended code rate of 16.4 kb/s, wherein the value on the mode bit is 1, and the value on the mode bit is 1.
  • the 2 bits bandwidth flag information, the mode bit mode bit, and the non-embedded code stream information other than the bandwidth information with a code rate of 16.2 kb/s constitute an extended code rate of 16.4.
  • an audio codec has a coding rate of only 24.4 kb/s before the extension, and only the mono coding mode.
  • the new code stream structure can support the mono coding mode and the stereo coding mode.
  • the stereo coding mode can include two embedded coding modes and one non-embedded coding mode.
  • a method for spreading a mono code stream with a code rate of 24.4 kb/s may specifically be:
  • the 2 bits bandwidth flag information mode bit and the mono channel stream information having a code rate of 24.4 kb/s constitute a code stream with an extended code rate of 24.4 kb/s, wherein the mode The value on the bit is 0.
  • the 2 bit bandwidth flag information, mode bits, mode bits, and code rate are 16.4 kb/
  • the mono stream information of s and the stereo extension information with a code rate of 7.95 kb/s constitute a code stream with an extended code rate of 24.4 kb/s, wherein the value on the mode bit is 1, and the mode bit is The value is 1.
  • the bit stream information of the 2 bits bandwidth, the mode bit, the mode bit, and the bit rate of the 13.2 kb/s code rate and the code rate are 10.95 kb.
  • the stereo extension information of /s constitutes a code stream with an extended code rate of 24.4 kb/s, wherein the value on the mode bit is 1, and the value on the mode bit is 01.
  • the 2 bits bandwidth flag information, the mode bit mode bit, and the non-embedded code stream information except the bandwidth information of the code rate of 24.15 kb/s are expanded to be 24.4.
  • the value of the read mode bit is 1, and the decoding mode of the code stream is determined to be a Q channel decoding mode. For example, if the i-th bit in the mode bit in the code stream is 1, the value of the mode bit is reset to 0, and then the code stream is decoded using an embedded decoding method with index i. Q channel decoding signal.
  • the value of the read mode bit is 1, and the decoding mode of the code stream is determined to be the Q channel decoding mode. If the value of the mode bit is all 0, the non-embedded decoding mode is used.
  • the code stream is decoded to obtain a Q channel decoded signal.
  • the decoding end receives a code stream having a code rate of 16.4 kb/s, and the code stream reading may specifically be:
  • the received code stream is a 16.4 kbps mono stream.
  • the code stream can be decoded using a mono decoding mode in the mono decoding mode.
  • the value of the mode bit is 1, the value on the mode bit needs to be read. If there is only 1 bit in the mode bit and the value is 0, the mono decoding mode with a code rate of 13.2 kbps is used. Embedded decoding is performed by combining a stereo spreading stream with a bit rate of 3 kbps.
  • the Q channel coding mode includes N coding modes, and N is an integer greater than or equal to zero, then:
  • the mode bit is The upper value is 1, and the first bit in the mode bit is 1, and the code stream further includes partial code stream information and multi-channel code stream encoded by the P channel coding mode with a code rate of K Mi kb/s. information.
  • the mode bit is The upper value is 1, and the first bit in the mode bit is 1, and the code stream further includes partial code stream information and multi-channel code stream encoded by the P channel coding mode with a code rate of K Mi kb/s. information.
  • the code rate of the P channel coding mode used in the Q channel coding mode is K Mi kb/s
  • i is an integer greater than or equal to 2 and less than or equal to N and the code before the mode bit
  • the value on the mode bit is 1
  • the first i-1 bits in the mode bit are 0,
  • the i-th bit is 1, and the code stream also includes the code rate K Mi kb/s.
  • the code rate of the P channel coding mode used in the Q channel coding mode is K Mi kb/s
  • i is an integer greater than or equal to 2 and smaller than N
  • the code stream before the mode bit When the format is different, the value on the mode bit is 1, the first i-1 bits in the mode bit are 0, the i-th bit is 1, and the code stream also includes the code rate K Mi kb/s. Partial stream information and multi-channel stream information encoded by the P channel encoding method.
  • the value on the mode bit is 1, and when i is equal to N, the first i-1 values in the mode bit are all 0.
  • the value of i bits is 1, and the code stream also includes non-embedded code stream information.
  • an audio codec has a coding rate of only 16.4 kb/s before the extension, and only a mono coding mode.
  • the new code stream structure can support a mono coding mode and a stereo coding mode.
  • the stereo coding mode can include an embedded coding mode and a non-embedded coding mode.
  • a method for spreading a mono code stream with a code rate of 16.4 kb/s may specifically be:
  • the 2 bits of the bandwidth flag information, the mode bit, and the mono channel stream information having a code rate of 16.4 kb/s constitute a code stream having an extended code rate of 16.4 kb/s, wherein The value on the mode bit is 0.
  • the 2 bits of the bandwidth flag information, the mode bit, the mode bit, and the code rate of the 13.2 kb/s channel stream and the code rate are 3 kb.
  • the stereo extension information of /s constitutes a code stream with an extended code rate of 16.4 kb/s, wherein the value on the mode bit is 1, and the value on the mode bit is 1.
  • the 2 bits bandwidth flag information, the mode bit mode bit, and the non-embedded code stream information other than the bandwidth information with a code rate of 16.2 kb/s constitute an extended code rate of 16.4.
  • an audio codec has a coding rate of only 24.4 kb/s before the extension, and only the mono coding mode.
  • the new code stream structure can support the mono coding mode and the stereo coding mode.
  • the stereo coding mode can include two embedded coding modes and one non-embedded coding mode.
  • a method for spreading a mono code stream with a code rate of 24.4 kb/s may specifically be:
  • the 2 bits bandwidth flag information mode bit and the mono channel stream information having a code rate of 24.4 kb/s constitute a code stream with an extended code rate of 24.4 kb/s, wherein the mode The value on the bit is 0.
  • the 2 bit bandwidth flag information, mode bits, mode bits, and code rate are 16.4 kb/
  • the mono stream information of s and the stereo extension information with a code rate of 7.95 kb/s constitute a code stream with an extended code rate of 24.4 kb/s, wherein the value on the mode bit is 1, and the mode bit is The value is 1.
  • the bit stream information of the 2 bits bandwidth, the mode bit, the mode bit, and the bit rate of the 13.2 kb/s code rate and the code rate are 10.95 kb.
  • the stereo extension information of /s constitutes a code stream with an extended code rate of 24.4 kb/s, wherein the value on the mode bit is 1, and the value on the mode bit is 10.
  • the 2 bits bandwidth flag information, the mode bit mode bit, and the non-embedded code stream information except the bandwidth information of the code rate of 24.15 kb/s are expanded to be 24.4.
  • the value of the read mode bit is 1, and the decoding mode of the code stream is determined to be the Q channel decoding mode. If the i-th bit in the mode bit in the code stream is 1, The value of the mode bit is reset to 0, and then the code stream is decoded using an embedded decoding method indexed i to obtain a Q channel decoded signal.
  • the value of the read mode bit is 1, and the decoding mode of the code stream is determined to be the Q channel decoding mode. If the value of the mode bit is 01, the non-embedded decoding mode is used.
  • the code stream is decoded to obtain a Q channel decoded signal.
  • the decoding end receives a code stream having a code rate of 16.4 kb/s, and the code stream reading may specifically be:
  • the received code stream is a 16.4 kbps mono stream.
  • the code stream can be decoded using a mono decoding mode in the mono decoding mode.
  • the value of the mode bit is 1, the value on the mode bit needs to be read. If there is only 1 bit in the mode bit and the value is 1, the mono decoding mode with a code rate of 13.2 kbps is used. Combines stereo with a bit rate of 3kbps The extended code stream is embedded for decoding.
  • non-embedded decoding with a code rate of 16.4 kb/s is performed.
  • the Q channel coding mode includes N coding modes, and N is an integer greater than or equal to zero, then:
  • the code rate of the P channel coding mode used in the Q channel coding mode is K Mi kb/s
  • the mode bit is The first bit in the bit is 1
  • the code stream further includes partial stream information and multi-channel stream information encoded in the P channel coding mode with a code rate of K Mi kb/s.
  • the code rate of the P channel coding mode used in the Q channel coding mode is K Mi kb/s
  • i is an integer greater than or equal to 2 and less than or equal to N and the code before the mode bit
  • the value on the mode bit is 1
  • the first i-1 bits in the mode bit are 0,
  • the i-th bit is 1, and the code stream also includes the code rate K Mi kb/s.
  • the code stream also includes the non-embedded code stream. information.
  • the value of the read mode bit is 1, and the decoding mode of the code stream is determined to be the Q channel decoding mode. If the i-th bit in the mode bit in the code stream is 1, The value of the mode bit is reset to 0, and then the code stream is decoded using an embedded decoding method indexed i to obtain a Q channel decoded signal.
  • the value of the read mode bit is 1, and the decoding mode of the code stream is determined to be the Q channel decoding mode. If the value of the mode bit is all 0, the non-embedded decoding mode is used.
  • the code stream is decoded to obtain a Q channel decoded signal.
  • the Q channel coding mode includes N coding modes, and N is an integer greater than or equal to zero, then:
  • the code rate of the P channel coding mode used in the Q channel coding mode is K Mi kb/s
  • the mode bit is The first bit in the bit is 1
  • the code stream further includes partial stream information and multi-channel stream information encoded in the P channel coding mode with a code rate of K Mi kb/s.
  • the code rate of the P channel coding mode used in the Q channel coding mode is K Mi kb/s
  • i is an integer greater than or equal to 2 and less than or equal to N and the code before the mode bit
  • the value on the mode bit is 1
  • the first i-1 bits in the mode bit are 0,
  • the i-th bit is 1, and the code stream also includes the code rate K Mi kb/s.
  • the code stream also includes non-embedded code stream information.
  • the value of the read mode bit is 1, and the decoding mode of the code stream is determined to be the Q channel decoding mode. If the i-th bit in the mode bit in the code stream is 1, The value of the mode bit is reset to 0, and then the code stream is decoded using an embedded decoding method indexed i to obtain a Q channel decoded signal.
  • the value of the read mode bit is 1, and the decoding mode of the code stream is determined to be the Q channel decoding mode. If the first i-1 bits in the mode bit are 0, the ith When the bit is 1, the code stream is decoded using a non-embedded decoding method to obtain a Q channel decoded signal.
  • FIG. 12 shows an audio signal encoder provided by an embodiment of the present invention, which can be used to perform a process of encoding an audio signal.
  • the audio signal encoder specifically includes:
  • a determining unit 1201 configured to determine an encoding mode of the audio signal; when the encoding mode of the audio signal is a Q channel encoding mode, determining a current encoding mode among the N encoding modes included in the Q channel encoding mode, where Q is a positive integer greater than 1, and N is a positive integer greater than one;
  • the encoding unit 1202 is configured to encode the audio signal according to the current encoding manner determined by the determining unit 1201, thereby obtaining a code stream of the audio signal, where the code stream includes a mode bit, and the mode bit in the code stream is used to identify the current encoding.
  • the length of the mode bit in the code stream is i, when i is greater than 1 and less than N-1, and N is greater than 3, the mode bit in the code stream includes i bits, and the i bits of the i bit - i-1 values on the same bit are the same, the value on the i-th bit of the i bits is different from the value on any of the i-1 bits, the i-th bit The value is the default value.
  • the mode bit in the code stream includes 1 bit, and the value on 1 bit is a preset value.
  • the mode bit in the code stream includes N bits, the N-1 values on the first N-1 bits of the N bits are the same, and the Nth of the N bits The value on one bit is different from the value on any of the N-1 bits, and the value on the Nth bit is a preset value.
  • the mode bits in the code stream include N-1 bits, and N-2 on the first N-2 bits of the N-1 bits
  • the values are the same, the value on the N-1th bit of the N-1 bits is different from the value on any of the N-2 bits, and the value on the N-1th bit is pre- Set value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the N coding modes include an embedded coding mode
  • the current coding mode is an embedded coding mode
  • the embedded coding mode uses a P channel coding mode for coding, and P is a positive integer smaller than Q.
  • the N coding modes include at least two embedded coding modes, the lengths of the bits corresponding to the at least two embedded coding modes are different, and the code rates of the P channel coding modes used by at least two embedded coding modes are used. different.
  • the length of the bit corresponding to one of the coding modes is larger. Long, or, one of the encoding methods corresponds to the shorter the length of the bit.
  • the N coding modes include a non-embedded coding mode.
  • the length of the bit corresponding to the non-embedded coding mode is 1; or,
  • the length of the bit corresponding to the non-embedded coding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded coding mode is N-1, and the mode bit corresponding to the non-embedded coding mode Including N-1
  • the bits, N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bits are reserved bits, designated bits or extended bits.
  • FIG. 13 shows an audio signal decoder provided by an embodiment of the present invention, which can be used to perform a process of decoding audio signals.
  • the audio signal decoder specifically includes:
  • the receiving unit 1301 is configured to receive a code stream of the audio signal
  • the determining unit 1302 is configured to determine a current decoding mode according to a value on a mode bit in the code stream when determining that the decoding mode of the code stream is the Q channel decoding mode, where the Q channel decoding mode includes N decoding modes, and current decoding The mode is one of N decoding modes.
  • the length of the mode bit in the code stream is i, Q is a positive integer greater than 1, and N is a positive integer greater than 1, where i is greater than 1 and less than N-1 And when N is greater than 3, the mode bits in the code stream include i bits, the i-1 values on the first i-1 bits of the i bits are the same, and the i-th bit of the i bits The value on the bit is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value;
  • the decoding unit 1303 is configured to decode the code stream according to the current decoding mode determined by the determining unit 1302.
  • the mode bit in the code stream includes 1 bit, and the value on 1 bit is a preset value.
  • the mode bit in the code stream includes N bits, the N-1 values on the first N-1 bits of the N bits are the same, and the Nth of the N bits The value on one bit is different from the value on any of the N-1 bits, and the value on the Nth bit is a preset value.
  • the mode bits in the code stream include N-1 bits, and N-2 on the first N-2 bits of the N-1 bits
  • the values are the same, the value on the N-1th bit of the N-1 bits is different from the value on any of the N-2 bits, and the value on the N-1th bit is pre- Set value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the current coding mode is an embedded decoding mode
  • the embedded decoding mode uses a P channel decoding mode for decoding, and P is a positive integer smaller than Q.
  • the N decoding modes include at least two types of embedded decoding modes, and the bit lengths of the at least two embedded decoding modes are different, and the bit rate of the P channel decoding mode used by at least two embedded decoding modes is used. different.
  • the length of the bit corresponding to one of the decoding modes is larger. Long, or, one of the decoding modes corresponds to the shorter the length of the bit.
  • the N decoding modes include a non-embedded decoding mode.
  • the length of the bit corresponding to the non-embedded decoding mode is 1; or,
  • the length of the bit corresponding to the non-embedded decoding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded decoding mode is N-1, and the mode bit corresponding to the non-embedded decoding mode
  • N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bits are reserved bits, designated bits or extended bits.
  • the audio signal encoder 1400 can include a processor 1402 and a memory 1403.
  • the processor 1402 is configured to control an audio signal
  • the operation of the encoder 1400; the memory 1403 may include a read only memory and a random access memory storing instructions and data that the processor 1402 can execute.
  • a portion of the memory 1403 may also include non-volatile line random access memory (NVRAM).
  • the components such as the processor 1402 and the memory 1403 are connected by a bus 1409.
  • the bus 1409 may include a power bus, a control bus, and a status signal bus in addition to the data bus.
  • the audio signal encoder 1400 can also include a receiver and a transmitter, the receiver can be used to receive an audio signal, and the transmitter is configured to transmit a code stream of the audio signal.
  • An audio signal encoding method disclosed in the embodiment of the present invention may be applied to the processor 1402 or implemented by the processor 1402.
  • each step of the processing flow may be completed by an integrated logic circuit of hardware in the processor 1402 or an instruction in the form of software.
  • the processor 1402 can be a general purpose processor, a digital signal processor, an application specific integrated circuit, a field programmable gate array or other programmable logic device, a discrete gate or transistor logic device, a discrete hardware component, and can implement or perform the embodiments of the present invention.
  • a general purpose processor can be a microprocessor or any conventional processor or the like.
  • the steps of the method disclosed in the embodiments of the present invention may be directly implemented as a hardware processor, or may be performed by a combination of hardware and software modules in the processor.
  • the software module can be located in a conventional storage medium such as random access memory, flash memory, read only memory, programmable read only memory or electrically erasable programmable memory, registers, and the like.
  • the storage medium is located in the memory 1403, and the processor 1402 reads the information stored in the memory 1403, and performs the steps of an audio signal encoding method in combination with its hardware.
  • the processor 1402 determines an encoding mode of the audio signal; when the encoding mode of the audio signal is the Q channel encoding mode, determining a current encoding mode among the N encoding modes included in the Q channel encoding mode, where Q is greater than a positive integer of 1, N being a positive integer greater than one; the processor 1402 encoding the audio signal according to the determined current encoding manner, thereby obtaining a code stream of the audio signal, wherein the code stream includes a mode bit, in the code stream
  • the mode bit is used to identify the current coding mode.
  • the mode bit length in the code stream is i. When i is greater than 1 and less than N-1, and N is greater than 3, the mode bit in the code stream includes i bits. Bit, the i-1 values on the first i-1 bits of the i bits are the same, and the value on the i th bit of the i bits is different from any of the i-1 bits.
  • the value of the ith bit is the default value.
  • the mode bit in the code stream includes 1 bit, and the value on 1 bit is a preset value.
  • the mode bit in the code stream includes N bits, the N-1 values on the first N-1 bits of the N bits are the same, and the Nth of the N bits The value on one bit is different from the value on any of the N-1 bits, and the value on the Nth bit is a preset value.
  • the mode bits in the code stream include N-1 bits, and N-2 on the first N-2 bits of the N-1 bits
  • the values are the same, the value on the N-1th bit of the N-1 bits is different from the value on any of the N-2 bits, and the value on the N-1th bit is pre- Set value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the current coding mode is an embedded coding mode
  • the embedded coding mode is coded by using a P channel coding mode, where P is a positive integer smaller than Q.
  • the N coding modes include at least two embedded coding modes, the lengths of the bits corresponding to the at least two embedded coding modes are different, and the code rates of the P channel coding modes used by at least two embedded coding modes are used. different.
  • one of the coding modes is used when the code rate of the P channel coding method used is larger, the length of the bit corresponding to one of the coding modes is longer, or the length of the bit corresponding to one of the coding modes is shorter.
  • the N coding modes include a non-embedded coding mode.
  • the length of the bit corresponding to the non-embedded coding mode is 1; or,
  • the length of the bit corresponding to the non-embedded coding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded coding mode is N-1, and the mode bit corresponding to the non-embedded coding mode
  • the N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bits are reserved bits, designated bits or extended bits.
  • the audio signal decoder 1500 can include a transceiver 1501, a processor 1502, and a memory 1503.
  • the processor 1502 is for controlling the operation of the audio signal decoder 1500;
  • the memory 1503 may include a read only memory and a random access memory, and stores instructions and data that the processor 1502 can execute.
  • a portion of the memory 1503 may also include non-volatile line random access memory (NVRAM).
  • the components such as the transceiver 1501, the processor 1502, and the memory 1503 are connected by a bus 1509.
  • the bus 1509 may include a power bus, a control bus, and a status signal bus in addition to the data bus. However, for clarity of description, various buses are labeled as bus 1509 in the figure.
  • An audio signal decoding method disclosed in the embodiment of the present invention may be applied to the processor 1502 or implemented by the processor 1502.
  • each step of the processing flow may be completed by an integrated logic circuit of hardware in the processor 1502 or an instruction in the form of software.
  • the processor 1502 can be a general purpose processor, a digital signal processor, an application specific integrated circuit, a field programmable gate array or other programmable logic device, a discrete gate or transistor logic device, a discrete hardware component, and can implement or perform the embodiments of the present invention.
  • a general purpose processor can be a microprocessor or any conventional processor or the like.
  • the steps of the method disclosed in the embodiments of the present invention may be directly implemented as a hardware processor, or may be performed by a combination of hardware and software modules in the processor.
  • the software module can be located in a conventional storage medium such as random access memory, flash memory, read only memory, programmable read only memory or electrically erasable programmable memory, registers, and the like.
  • the storage medium is located in the memory 1503, and the processor 1502 reads the information stored in the memory 1503, and performs the steps of an audio signal decoding method in combination with its hardware.
  • the transceiver 1501 receives a code stream of an audio signal; the processor 1502 determines a current decoding mode according to a value on a mode bit in the code stream when determining that the decoding mode of the code stream is the Q channel decoding mode, Q sound
  • the channel decoding mode includes N decoding modes, and the current decoding mode is one of N decoding modes.
  • the length of the mode bit in the code stream is i, Q is a positive integer greater than 1, and N is a positive integer greater than 1.
  • the mode bits in the code stream include i bits, i-1 values on the first i-1 bits of i bits Similarly, the value on the i-th bit of the i bits is different from the value on any of the i-1 bits, and the value on the i-th bit is a preset value; the processor 1502 The code stream is decoded according to the determined current decoding mode.
  • the mode bit in the code stream includes 1 bit, and the value on 1 bit is a preset value.
  • the mode bit in the code stream includes N bits, the N-1 values on the first N-1 bits of the N bits are the same, and the Nth of the N bits The value on one bit is different from the value on any of the N-1 bits, and the value on the Nth bit is a preset value.
  • the mode bits in the code stream include N-1 bits, N-2 values on the first N-2 bits of the N-1 bits are the same, and values on the N-1th bit of the N-1 bits are different from those in the N-2 bits.
  • a value on one bit, the value on the N-1th bit is a preset value; or,
  • the mode bits in the code stream include only N-1 bits, the N-1 values on the N-1 bits are the same, and the N-1 bits are The value on each bit in the bit is different from the preset value.
  • the current coding mode is an embedded decoding mode
  • the embedded decoding mode uses a P channel decoding mode for decoding, and P is a positive integer smaller than Q.
  • the N decoding modes include at least two types of embedded decoding modes, and the bit lengths of the at least two embedded decoding modes are different, and the bit rate of the P channel decoding mode used by at least two embedded decoding modes is used. different.
  • the length of the bit corresponding to one of the decoding modes is larger. Long, or, one of the decoding modes corresponds to the shorter the length of the bit.
  • the N decoding modes include a non-embedded decoding mode.
  • the length of the bit corresponding to the non-embedded decoding mode is 1; or,
  • the length of the bit corresponding to the non-embedded decoding mode is N; or, when N is greater than 2, the length of the bit corresponding to the non-embedded decoding mode is N-1, and the mode bit corresponding to the non-embedded decoding mode
  • N-1 bits are included, the N-1 values on the N-1 bits are the same, and the values on each of the N-1 bits are different from the preset values.
  • the mode bits are reserved bits, designated bits or extended bits.
  • embodiments of the present invention can be provided as a method, or a computer program product. Accordingly, the present invention may take the form of an entirely hardware embodiment, an entirely software embodiment, or a combination of software and hardware. Moreover, the invention can take the form of a computer program product embodied on one or more computer-usable storage media (including but not limited to disk storage, CD-ROM, optical storage, etc.) including computer usable program code.
  • a computer program product embodied on one or more computer-usable storage media (including but not limited to disk storage, CD-ROM, optical storage, etc.) including computer usable program code.
  • the computer program instructions can also be stored in a computer readable memory that can direct a computer or other programmable data processing device to operate in a particular manner, such that the instructions stored in the computer readable memory produce an article of manufacture comprising the instruction device.
  • the apparatus is implemented in a block or blocks of a flow or a flow and/or block diagram of the flowchart.
  • These computer program instructions can also be loaded onto a computer or other programmable data processing device such that a series of operational steps are performed on a computer or other programmable device to produce computer-implemented processing for execution on a computer or other programmable device.
  • the instructions provide steps for implementing functions in one or more blocks of a flow or a flow and/or block diagram of a flowchart.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种音频信号编码、解码方法及音频信号编码器、解码器,该音频信号编码方法包括确定音频信号的编码模式(201),在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式(202),根据当前编码方式对信号进行编码,从而获得音频信号的码流(203)。通过码流中的方式比特位上的值标识出所使用的N种编码方式,通过设置码流中的方式比特位上不同比特位上的值可以标识出不同的编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。

Description

一种音频信号编码、解码方法及音频信号编码器、解码器
本申请要求在2016年4月29日提交中华人民共和国知识产权局、申请号为201610284150.9、发明名称为“一种音频信号编码、解码方法及音频信号编码器、解码器”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种音频信号编码、解码方法及音频信号编码器、解码器。
背景技术
音频编解码器,是将脉冲编码调制(Pulse Code Modulation,PCM)域的数字音频信号经过编码压缩以后得到码流信号,然后将码流信号按照一定的格式进行封装并传输,解码端根据接收到的码流信号进行解码,从而恢复出PCM域的数字音频信号。
现有的编解码器,常用的编解码模式有单声道编解码模式和立体声编解码模式(立体声编解码模式也可称为两声道编解码模式)。因此,需要标识是单声道编码模式还是立体声编码模式。
另外,现有的立体声编码器,会将立体声信号进行下混后获得单声道信号,然后使用某一编码速率的单声道编码器对下混后获得的单声道信号进行编码,并编码立体声信号的两个声道间的参数信息或残差信号,然后将编码后的单声道信号与编码后的残差信号一起构成整个立体声码流,立体声的编码速率为下混后获得的单声道编码速率与参数信息或残差信号编码速率之和。由于这种立体声编码模式使用了单声道编码方式进行编码的方式,可以称为嵌入式编码方式。
对于立体声编解码模式,具有相同立体声编码速率的N个立体声码流可能是采用N种不同的单声道编码方式编码的,不同的单声道编码方式的编码速率不同。为了标识立体声编解码模式下的单声道编解码方式,需要在码流中使用Log2(N)个方式比特位对单声道编解码方式进行标识,并且每次变换立体声编解码模式下的单声道编解码方式时,就需要修改方式比特位的值,提供的编码方式越多,需要修改的比特位个数也就越多,这将会大大影响编解码速度,并且,当编解码方式的增加或减少导致需要增加或减少方式比特位时,会导致用于标识其它原本的编解码方式对应的方式比特位上的值也需要改变,因此会影响编解码方案的兼容性。
发明内容
本发明实施例提供一种音频信号编码、解码方法及音频信号编码器、解码器,用以解决现有技术中存在的在因编解码方式的增加或减少导致需要增加或减少方式比特位时,会导致用于标识其它原本的编解码方式对应的方式比特位上的值也需要改变,从而影响编解码方案的兼容性的问题,同时提高了编解码速度。
第一方面,提供的一种音频信号编码方法,包括:
确定音频信号的编码模式;
在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,其中,Q为大于1的正整数,N为大于1的正整数;
根据当前编码方式对音频信号进行编码,从而获得音频信号的码流,其中,码流包括方式比特位,码流中的方式比特位用于标识当前编码方式,码流中的方式比特位的长度为i,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。
其中,方式比特位的长度为i指的是方式比特位的具有i个比特位。
通过码流中的方式比特位上的值标识出所使用的N种编码方式,通过设置码流中的方式比特位上不同比特位上的值可以标识出不同的编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第一方面,在第一方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第一方面或者第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。该第N个比特位可以位于该N-1个比特位之后,通过码流中的N个比特位上的值标识出所使用的N种编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第一方面或者第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第一方面或者第一方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第一方面的第四种可能的实现方式中,当前编码方式为嵌入式编码方式,该嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
结合第一方面或者第一方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第一方面的第五种可能的实现方式中,N种编码方式包括至少两种嵌入式编码方式,至少两种嵌入式编码方式对应的方式比特位的长度不同,至少两种嵌入式编码方式所使用的P声道编码方式的码率不同。
结合第一方面或者第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,对于至少两种嵌入式编码方式中的两种编码方式,在其中一个编码方式所使用的P声道编码方式的码率越大时,其中一个编码方式对应的方式比特位的长度越长,或者,其中一个编码方式对应的方式比特位的长度越短。
结合第一方面或者第一方面的第一种可能的实现方式至第六种可能的实现方式中任意一种可能的实现方式,在第一方面的第七种可能的实现方式中,N种编码方式包括非嵌 入式编码方式。该非嵌入式编码方式为没有使用单声道编码方式进行编码,只使用多声道编码方式进行编码的方式。
结合第一方面或者第一方面的第七种可能的实现方式,在第一方面的第八种可能的实现方式中,非嵌入式编码方式对应的方式比特位的长度为1;或者,
非嵌入式编码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式编码方式对应的方式比特位的长度为N-1,非嵌入式编码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第一方面或者第一方面的第一种可能的实现方式至第八种可能的实现方式中任意一种可能的实现方式,在第一方面的第九种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第二方面,提供了一种音频信号解码方法,包括:
接收音频信号的码流;
在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式,Q声道解码模式包括N种解码方式,当前解码方式是N种解码方式中的一种,码流中的方式比特位的长度为i,Q为大于1的正整数,N为大于1的正整数,其中,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值;
根据当前解码方式对码流进行解码。
通过码流中方式比特位上的值标识出所使用的N种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第二方面,在第二方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第二方面或者第二方面的第一中可能的实现方式,在第二方面的第二种可能的实现方式中,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。该第N个比特位可以位于该N-1个比特位之后,通过码流中的N个比特位上的值标识出所使用的N种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第二方面或者第二方面的第一种可能的实现方式,在第二方面的第三种可能的实现方式中,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第二方面或者第二方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第二方面的第四种可能的实现方式中,当前解码方式为嵌入 式解码方式,该嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
结合第二方面或者第二方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第二方面的第五种可能的实现方式中,N种解码方式包括至少两种嵌入式解码方式,至少两种嵌入式解码方式对应的方式比特位的长度不同,至少两种嵌入式解码方式所使用的P声道解码方式的码率不同。
结合第二方面或者第二方面的第五种可能的实现方式,在第二方面的第六种可能的实现方式中,对于至少两种嵌入式解码方式中的两种解码方式,在其中一个解码方式所使用的P声道解码方式的码率越大时,其中一个解码方式对应的方式比特位的长度越长,或者,其中一个解码方式对应的方式比特位的长度越短。
结合第二方面或者第二方面的第一种可能的实现方式至第六种可能的实现方式中任意一种可能的实现方式,在第二方面的第七种可能的实现方式中,N种解码方式包括非嵌入式解码方式。
结合第二方面或者第二方面的第七种可能的实现方式,在第二方面的第八种可能的实现方式中,非嵌入式解码方式对应的方式比特位的长度为1;或者,
非嵌入式解码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式解码方式对应的方式比特位的长度为N-1,非嵌入式解码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第二方面或者第二方面的第一种可能的实现方式至第八种可能的实现方式中任意一种可能的实现方式,在第二方面的第九种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第三方面,提供了一种音频信号编码器,包括:
确定单元,用于确定音频信号的编码模式;在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,其中,Q为大于1的正整数,N为大于1的正整数;
编码单元,用于根据确定单元确定的当前编码方式对音频信号进行编码,从而获得音频信号的码流,其中,码流包括方式比特位,码流中的方式比特位用于标识当前编码方式,码流中的方式比特位的长度为i,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。
通过码流中的方式比特位上的值标识出所使用的N种编码方式,通过设置码流中的方式比特位上不同比特位上的值可以标识出不同的编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第三方面,在第三方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第三方面或者第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式中,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。该第N个比特位可以位于该N-1个比 特位之后,通过码流中的N个比特位上的值标识出所使用的N种编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第三方面或者第三方面的第一种可能的实现方式,在第三方面的第三种可能的实现方式中,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第三方面或者第三方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第三方面的第四种可能的实现方式中,当前编码方式为嵌入式编码方式,该嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
结合第三方面或者第三方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第三方面的第五种可能的实现方式中,N种编码方式包括至少两种嵌入式编码方式,至少两种嵌入式编码方式对应的方式比特位的长度不同,至少两种嵌入式编码方式所使用的P声道编码方式的码率不同。
结合第三方面或者第三方面的第五种可能的实现方式,在第三方面的第六种可能的实现方式中,对于至少两种嵌入式编码方式中的两种编码方式,在其中一个编码方式所使用的P声道编码方式的码率越大时,其中一个编码方式对应的方式比特位的长度越长,或者,其中一个编码方式对应的方式比特位的长度越短。
结合第三方面或者第三方面的第一种可能的实现方式至第六种可能的实现方式中任意一种可能的实现方式,在第三方面的第七种可能的实现方式中,N种编码方式包括非嵌入式编码方式。
结合第三方面或者第三方面的第七种可能的实现方式,在第三方面的第八种可能的实现方式中,非嵌入式编码方式对应的方式比特位的长度为1;或者,
非嵌入式编码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式编码方式对应的方式比特位的长度为N-1,非嵌入式编码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第三方面或者第三方面的第一种可能的实现方式至第八种可能的实现方式中任意一种可能的实现方式,在第三方面的第九种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第四方面,提供了一种音频信号解码器,包括:
接收单元,用于接收音频信号的码流;
确定单元,用于在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式,Q声道解码模式包括N种解码方式,当前解码方式是N种解码方式中的一种,码流中的方式比特位的长度为i,Q为大于1的正整数,N为大于1的正整数,其中,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值;
解码单元,用于根据确定单元确定的当前解码方式对码流进行解码。
通过码流中方式比特位上的值标识出所使用的N种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第四方面,在第四方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第四方面或者第四方面的第一种可能的实现方式,在第四方面的第二种可能的实现方式中,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。该第N个比特位可以位于该N-1个比特位之后,通过码流中的N个比特位上的值标识出所使用的N种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第四方面或者第四方面的第一种可能的实现方式,在第四方面的第三种可能的实现方式中,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第四方面或者第四方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第四方面的第四种可能的实现方式中,当前编码方式为嵌入式解码方式,该嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
结合第四方面或者第四方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第四方面的第五种可能的实现方式中,N种解码方式包括至少两种嵌入式解码方式,至少两种嵌入式解码方式对应的方式比特位的长度不同,至少两种嵌入式解码方式所使用的P声道解码方式的码率不同。
结合第四方面或者第四方面的第五种可能的实现方式,在第四方面的第六种可能的实现方式中,对于至少两种嵌入式解码方式中的两种解码方式,在其中一个解码方式所使用的P声道解码方式的码率越大时,其中一个解码方式对应的方式比特位的长度越长,或者,其中一个解码方式对应的方式比特位的长度越短。
结合第四方面或者第四方面的第一种可能的实现方式至第六种可能的实现方式中任意一种可能的实现方式,在第四方面的第七种可能的实现方式中,N种解码方式包括非嵌入式解码方式。
结合第四方面或者第四方面的第七种可能的实现方式,在第四方面的第八种可能的实现方式中,非嵌入式解码方式对应的方式比特位的长度为1;或者,
非嵌入式解码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式解码方式对应的方式比特位的长度为N-1,非嵌入式解码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第四方面或者第四方面的第一种可能的实现方式至第八种可能的实现方式中任 意一种可能的实现方式,在第四方面的第九种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第五方面,提供的一种音频信号编码方法,包括:
确定音频信号的编码模式;
在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,当前编码方式为N种编码方式中第i种编码方式,其中,Q为大于1的正整数,N为大于1的正整数,i为小于或者等于N的正整数;第i种编码方式的索引可以为i,也可以为i-1,索引值从1开始,从0开始。该索引i可以位于预设的索引表中,该索引表中的索引i与Q声道编码模式所包括的N种编码方式相对应,比如,索引1对应着该N种编码方式中的第1种编码方式,索引2对应着该N种编码方式中的第2种编码方式,依次类推,通过索引查找相对应的编码方式。
根据当前编码方式对音频信号进行编码,从而获得音频信号的码流,其中,码流包括方式比特位,码流中的方式比特位用于标识当前编码方式,其中,在i大于1并且小于N,并且N大于2时,码流中的方式比特位包括i个比特位,i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。
通过码流中的方式比特位上的值标识出所使用的N种编码方式中第i种编码方式,通过设置码流中的方式比特位上不同比特位上的值可以标识出不同的编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第五方面,在第五方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第五方面或者第五方面的第一种可能的实现方式,在第五方面的第二种可能的实现方式中,在i等于N,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。该N-1个比特位可以位于该第N个比特位之前,通过码流中的N个比特位上的值标识出所使用的N种编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第五方面或者第五方面的第二种可能的实现方式,在第五方面的第三种可能的实现方式中,在i等于N时,码流中的方式比特位还包括第N个比特位,第N个比特位上的值为预设值。
结合第五方面或者第五方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第五方面的第四种可能的实现方式中,N种编码方式包括嵌入式编码方式,该嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
结合第五方面或者第五方面的第四种可能的实现方式,在第五方面的第五种可能的实现方式中,嵌入式编码方式为至少两种,在至少两种嵌入式编码方式中,在其中一个编码方式所使用的P声道编码方式的码率越大时,其中一个编码方式对应的方式比特位的比特位个数越多,或者,其中一个编码方式对应的方式比特位的比特位个数越少。
结合第五方面或者第五方面的第一种可能的实现方式至第五种可能的实现方式中任意一种可能的实现方式,在第五方面的第六种可能的实现方式中,N种编码方式包括非嵌 入式编码方式。该非嵌入式编码方式为没有使用单声道编码方式进行编码,只使用多声道编码方式进行编码的方式。
结合第五方面或者第五方面的第六种可能的实现方式,在第五方面的第七种可能的实现方式中,非嵌入式编码方式为N种编码方式中第N种编码方式;或者,
非嵌入式编码方式为N种编码方式中第1种编码方式。
结合第五方面或者第五方面的第一种可能的实现方式至第七种可能的实现方式中任意一种可能的实现方式,在第五方面的第八种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第六方面,提供了一种音频信号解码方法,包括:
接收音频信号的码流;
在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式,Q声道解码模式包括N种解码方式,当前解码方式为N种解码方式中的第i种解码方式,其中,Q为大于1的正整数,N为大于1的正整数,i为小于或者等于N的正整数,其中,在i大于1并且小于N,并且N大于2时,码流中的方式比特位包括i个比特位,i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值;该第i种解码方式的索引可以为i,也可以为i-1.索引值从1开始,或者从0开始。该索引i可以位于预设的索引表中,该索引表中的索引i与Q声道解码模式所包括的N种解码方式相对应,比如,索引1对应着该N种解码方式中的第1种解码方式,索引2对应着该N种解码方式中的第2种解码方式,依次类推,通过索引查找相对应的解码方式。
根据当前解码方式对码流进行解码。
通过码流中的i个方式比特位上的值标识出所使用的N种解码方式中第i种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第六方面,在第六方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第六方面或者第六方面的第一中可能的实现方式,在第六方面的第二种可能的实现方式中,在i等于N,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。该N-1个比特位可以位于该第N个比特位之前,通过码流中的N个比特位上的值标识出所使用的N种编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第六方面或者第六方面的第二种可能的实现方式,在第六方面的第三种可能的实现方式中,在i等于N时,方式比特位还包括第N个比特位,第N个比特位上的值为预设值。
结合第六方面或者第六方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第六方面的第四种可能的实现方式中,N种解码方式包括嵌入式解码方式,该嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
结合第六方面或者第六方面的第四种可能的实现方式,在第六方面的第五种可能的实现方式中,嵌入式解码方式为至少两种,在至少两种嵌入式解码方式中,在其中一个 解码方式所使用的P声道解码方式的码率越大时,其中一个解码方式对应的方式比特位的比特位个数越多,或者,其中一个解码方式对应的方式比特位的比特位个数越少。
结合第六方面或者第六方面的第一种可能的实现方式至第五种可能的实现方式中任意一种可能的实现方式,在第六方面的第六种可能的实现方式中,N种解码方式包括非嵌入式解码方式。
结合第六方面或者第六方面的第六种可能的实现方式,在第六方面的第七种可能的实现方式中,非嵌入式解码方式为N种解码方式中第N种解码方式;或者,
非嵌入式解码方式为N种解码方式中第1种解码方式。
结合第六方面或者第六方面的第一种可能的实现方式至第七种可能的实现方式中任意一种可能的实现方式,在第六方面的第八种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第七方面,提供了一种音频信号编码器,包括:
确定单元,用于确定音频信号的编码模式;在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,当前编码方式为N种编码方式中第i种编码方式,其中,Q为大于1的正整数,N为大于1的正整数,i为小于或者等于N的正整数;该第i种编码方式的索引可以为i,也可以为i-1.索引值从1开始,或者从0开始,该索引i可以位于预设的索引表中,该索引表中的索引i与Q声道编码模式所包括的N种编码方式相对应,比如,索引1对应着该N种编码方式中的第1种编码方式,索引2对应着该N种编码方式中的第2种编码方式,依次类推,通过索引查找相对应的编码方式。
编码单元,用于根据当前编码方式对音频信号进行编码,从而获得音频信号的码流,其中,码流包括方式比特位,码流中的方式比特位用于标识当前编码方式,其中,在i大于1并且小于N,并且N大于2时,码流中的方式比特位包括i个比特位,i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。
通过码流中的方式比特位上的值标识出所使用的N种编码方式中第i种编码方式,通过设置码流中的方式比特位上不同比特位上的值可以标识出不同的编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第七方面,在第七方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第七方面或者第七方面的第一种可能的实现方式,在第七方面的第二种可能的实现方式中,在i等于N,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。该N-1个比特位可以位于该第N个比特位之前,通过码流中的N个比特位上的值标识出所使用的N种编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第七方面或者第七方面的第二种可能的实现方式,在第七方面的第三种可能的实现方式中,在i等于N时,码流中的方式比特位还包括第N个比特位,第N个比特位上的值为预设值。
结合第七方面或者第七方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第七方面的第四种可能的实现方式中,N种编码方式包括嵌入式编码方式,该嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
结合第七方面或者第七方面的第四种可能的实现方式,在第七方面的第五种可能的实现方式中,嵌入式编码方式为至少两种,在至少两种嵌入式编码方式中,在其中一个编码方式所使用的P声道编码方式的码率越大时,其中一个编码方式对应的方式比特位的比特位个数越多,或者,其中一个编码方式对应的方式比特位的比特位个数越少。
结合第七方面或者第七方面的第一种可能的实现方式至第五种可能的实现方式中任意一种可能的实现方式,在第七方面的第六种可能的实现方式中,N种编码方式包括非嵌入式编码方式。
结合第七方面或者第七方面的第六种可能的实现方式,在第七方面的第七种可能的实现方式中,非嵌入式编码方式为N种编码方式中第N种编码方式;或者,
非嵌入式编码方式为N种编码方式中第1种编码方式。
结合第七方面或者第七方面的第一种可能的实现方式至第七种可能的实现方式中任意一种可能的实现方式,在第七方面的第八种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第八方面,提供了一种音频信号解码器,包括:
接收单元,用于接收音频信号的码流;
确定单元,用于在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式,Q声道解码模式包括N种解码方式,当前解码方式为N种解码方式中的第i种解码方式,其中,Q为大于1的正整数,N为大于1的正整数,i为小于或者等于N的正整数,其中,在i大于1并且小于N,并且N大于2时,码流中的方式比特位包括i个比特位,i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值;该索引i可以位于预设的索引表中,该索引表中的索引i与Q声道解码模式所包括的N种解码方式相对应,比如,索引1对应着该N种解码方式中的第1种解码方式,索引2对应着该N种解码方式中的第2种解码方式,依次类推,通过索引查找相对应的解码方式。
解码单元,用于根据确定单元确定的当前解码方式对码流进行解码。
通过码流中的i个方式比特位上的值标识出所使用的N种解码方式中第i种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第八方面,在第八方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第八方面或者第八方面的第一种可能的实现方式,在第八方面的第二种可能的实现方式中,在i等于N,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。该N-1个比特位可以位于该第N个比特位之前,通过码流中的N个比特位上的值标识出所使用的N种编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第八方面或者第八方面的第二种可能的实现方式,在第八方面的第三种可能的 实现方式中,在i等于N时,方式比特位还包括第N个比特位,第N个比特位上的值为预设值。
结合第八方面或者第八方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第八方面的第四种可能的实现方式中,N种解码方式包括嵌入式解码方式,该嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
结合第八方面或者第八方面的第四种可能的实现方式,在第八方面的第五种可能的实现方式中,嵌入式解码方式为至少两种,在至少两种嵌入式解码方式中,在其中一个解码方式所使用的P声道解码方式的码率越大时,其中一个解码方式对应的方式比特位的比特位个数越多,或者,其中一个解码方式对应的方式比特位的比特位个数越少。
结合第八方面或者第八方面的第一种可能的实现方式至第五种可能的实现方式中任意一种可能的实现方式,在第八方面的第六种可能的实现方式中,N种解码方式包括非嵌入式解码方式。
结合第八方面或者第八方面的第六种可能的实现方式,在第八方面的第七种可能的实现方式中,非嵌入式解码方式为N种解码方式中第N种解码方式;或者,
非嵌入式解码方式为N种解码方式中第1种解码方式。
结合第八方面或者第八方面的第一种可能的实现方式至第七种可能的实现方式中任意一种可能的实现方式,在第八方面的第八种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第九方面,提供一种音频信号编码器,包括:
处理器用于读取存储器中代码,以用于执行:确定音频信号的编码模式;在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,其中,Q为大于1的正整数,N为大于1的正整数;处理器根据当前编码方式对音频信号进行编码,从而获得音频信号的码流,其中,码流包括方式比特位,码流中的方式比特位用于标识当前编码方式,码流中的方式比特位的长度为i,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。
通过码流中的方式比特位上的值标识出所使用的N种编码方式,通过设置码流中的方式比特位上不同比特位上的值可以标识出不同的编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第九方面,在第九方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第九方面或者第九方面的第一种可能的实现方式,在第九方面的第二种可能的实现方式中,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。该第N个比特位可以位于该N-1个比特位之后,通过码流中的N个比特位上的值标识出所使用的N种编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
结合第九方面或者第九方面的第一种可能的实现方式,在第九方面的第三种可能的实现方式中,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第九方面或者第九方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第九方面的第四种可能的实现方式中,当前编码方式为嵌入式编码方式,该嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
结合第九方面或者第九方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第九方面的第五种可能的实现方式中,N种编码方式包括至少两种嵌入式编码方式,至少两种嵌入式编码方式对应的方式比特位的长度不同,至少两种嵌入式编码方式所使用的P声道编码方式的码率不同。
结合第九方面或者第九方面的第五种可能的实现方式,在第九方面的第六种可能的实现方式中,对于至少两种嵌入式编码方式中的两种编码方式,在其中一个编码方式所使用的P声道编码方式的码率越大时,其中一个编码方式对应的方式比特位的长度越长,或者,其中一个编码方式对应的方式比特位的长度越短。
结合第九方面或者第九方面的第一种可能的实现方式至第六种可能的实现方式中任意一种可能的实现方式,在第九方面的第七种可能的实现方式中,N种编码方式包括非嵌入式编码方式。
结合第九方面或者第九方面的第七种可能的实现方式,在第九方面的第八种可能的实现方式中,非嵌入式编码方式对应的方式比特位的长度为1;或者,
非嵌入式编码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式编码方式对应的方式比特位的长度为N-1,非嵌入式编码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第九方面或者第九方面的第一种可能的实现方式至第八种可能的实现方式中任意一种可能的实现方式,在第九方面的第九种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第十方面,提供一种音频信号解码器,包括:
收发器、处理器和存储器。
收发器接收音频信号的码流;处理器用于读取存储器中代码,以用于执行:在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式,Q声道解码模式包括N种解码方式,当前解码方式是N种解码方式中的一种,码流中的方式比特位的长度为i,Q为大于1的正整数,N为大于1的正整数,其中,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值;处理器根据确定的当前解码方式对码流进行解码。通过码流中方式比特位上的值标识出所使用的N种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解 决了解码方案的兼容性问题。
结合第十方面,在第十方面的第一种可能的实现方式中,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
结合第十方面或者第十方面的第一种可能的实现方式,在第十方面的第二种可能的实现方式中,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。该第N个比特位可以位于该N-1个比特位之后,通过码流中的N个比特位上的值标识出所使用的N种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
结合第十方面或者第十方面的第一种可能的实现方式,在第十方面的第三种可能的实现方式中,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第十方面或者第十方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第十方面的第四种可能的实现方式中,当前解码方式为嵌入式解码方式,该嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
结合第十方面或者第十方面的第一种可能的实现方式至第三种可能的实现方式中任意一种可能的实现方式,在第十方面的第五种可能的实现方式中,N种解码方式包括至少两种嵌入式解码方式,至少两种嵌入式解码方式对应的方式比特位的长度不同,至少两种嵌入式解码方式所使用的P声道解码方式的码率不同。
结合第十方面或者第十方面的第五种可能的实现方式,在第十方面的第六种可能的实现方式中,对于至少两种嵌入式解码方式中的两种解码方式,在其中一个解码方式所使用的P声道解码方式的码率越大时,其中一个解码方式对应的方式比特位的长度越长,或者,其中一个解码方式对应的方式比特位的长度越短。
结合第十方面或者第十方面的第一种可能的实现方式至第六种可能的实现方式中任意一种可能的实现方式,在第十方面的第七种可能的实现方式中,N种解码方式包括非嵌入式解码方式。
结合第十方面或者第十方面的第七种可能的实现方式,在第十方面的第八种可能的实现方式中,非嵌入式解码方式对应的方式比特位的长度为1;或者,
非嵌入式解码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式解码方式对应的方式比特位的长度为N-1,非嵌入式解码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
结合第十方面或者第十方面的第一种可能的实现方式至第八种可能的实现方式中任意一种可能的实现方式,在第十方面的第九种可能的实现方式中,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
第十一方面,提供一种计算机存储介质,用于储存用于第九方面的处理器执行的计算 机软件指令,以用于执行第一方面提供的方法。
第十二方面,提供一种计算机存储介质,用于储存用于第十方面的处理器执行的计算机软件指令,以用于执行第二方面提供的方法。
第十三方面,提供一种音频信号编码器,包括:
处理器用于读取存储器中代码,以用于执行第五方面以及第五方面可能的实现方式提供的方法。
第十四方面,提供一种音频信号解码器,包括:
收发器、处理器和存储器。
收发器接收音频信号的码流;处理器用于读取存储器中代码,以用于执行第六方面以及第六方面可能的实现方式提供的方法。
第十五方面,提供一种计算机存储介质,用于储存用于第十三方面以及第十三方面可能的实现方式提供的处理器执行的计算机软件指令,以用于执行第五方面以及第五方面可能的实现方式提供的方法。
第十六方面,提供一种计算机存储介质,用于储存用于第十四方面以及第十四方面可能的实现方式提供的处理器执行的计算机软件指令,以用于执行第六方面以及第六方面可能的实现方式提供的方法。
本发明实施例表明,通过确定音频信号的编码模式,在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,根据当前编码方式对信号进行编码,从而获得音频信号的码流。通过码流中的方式比特位上的值标识出所使用的N种编码方式,通过设置码流中的方式比特位上不同比特位上的值可以标识出不同的编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。
图1为本发明实施例提供的一种适应于音频信号编解码的系统架构图;
图2为本发明实施例提供的一种音频信号编码方法的流程示意图;
图3为本发明实施例提供的一种码流格式的结构示意图;
图4为本发明实施例提供的一种码流格式的结构示意图;
图5为本发明实施例提供的一种码流格式的结构示意图;
图6为本发明实施例提供的一种码流格式的结构示意图;
图7为本发明实施例提供的一种音频信号解码方法的流程示意图;
图8a至图8f为本发明实施例提供的一种码流扩展的结构示意图;
图9a至图9c为本发明实施例提供的一种码流解码的结构示意图;
图10a至图10d为本发明实施例提供的一种码流扩展的结构示意图;
图11a至图11c为本发明实施例提供的一种码流解码的结构示意图;
图12为本发明实施例提供的一种音频信号编码器的结构示意图;
图13为本发明实施例提供的一种音频信号解码器的结构示意图;
图14为本发明实施例提供的一种音频信号编码器的结构示意图;
图15为本发明实施例提供的一种音频信号解码器的结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
本发明实施例适用于音频信号编解码器,如图1所示的系统架构图,该音频信号编解码器包括音频信号编码器101和音频信号解码器102。音频信号编码器101用来将数字音频信息经过编码压缩以后得到码流信号,然后将码流信号按照一定的格式进行封装并传输。而音频信号解码器102是根据接收到的码流信号进行按照一定的顺序规则进行解码,恢复出数字音频信号。
基于上述描述,图2示出了本发明实施例提供的一种音频信号编码方法的流程,该流程可以由音频信号编码器执行。
如图2所示,该流程的具体步骤包括:
步骤201,确定音频信号的编码模式。
步骤202,在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式。
步骤203,根据当前编码方式对信号进行编码,从而获得音频信号的码流。
在本发明实施例中,音频信号的编码模式包括Q声道编码模式,Q为大于1的正整数,该Q声道编码模式包含有N种编码方式,N为正整数。在确定出音频信号的编码模式为Q声道编码模式时,可以从Q声道编码模式所包括的N种编码方式中的确定出当前编码方式,使用该当前编码方式对该音频信号进行编码,可以获得音频信号的码流。
应理解,音频信号的编码模式也可以包括P声道编码模式,P为小于Q的正整数,在具体实现方式中,Q声道编码模式可以是立体声编码模式,P声道编码模式可以是单声道编码模式,单声道编码模式中的编码方式包括单声道编码方式编码,立体声编码模式中的编码方式包括嵌入式编码方式,嵌入式编码方式使用单声道编码方式,立体声编码模式也可以包括非嵌入式编码方式,非嵌入式编码方式中不使用单声道编码方式。
音频信号的编码模式还可以包括L声道编码模式,L为小于Q的正整数,且L不为P。
在上述编码后的码流中包括方式比特位。为了能够区别N种编码方式,通过码流中的方式比特位上的值标识从N种编码方式中确定的当前编码方式,码流中的方式比特位的长度为i。在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。该预设值为二进制数,可以为1或0。比如:i等于3,该方式比特位有3个比特位,该3个比特位上的值可以是001或110。
为了更好的从N种编码方式中确定出当前编码方式,当前编码方式也可以为N种编码方式中第i种编码方式,第i种编码方式的索引可以为i,也可以为i-1,索引值从1开始,从0开始。该索引i可以位于预设的索引表中,在索引表中索引i与Q声道编码模式所包括的N种编码方式相关联,比如,索引1对应着该N种编码方式中的第1种编码方式,索引2对应着该N种编码方式中的第2种编码方式,依次类推,通过索引查找相对应的编码方式。
优选地,当码流中方式比特位只有1个比特位时,即在i等于1时,码流中的方式比 特位包括1个比特位,1个比特位上的值为预设值。该1个比特位上的值为二进制数,可以为1或0,通过该预设值可以标识出使用的是那种编码方式。
进一步地,码流中方式比特位上的值有多种组合方式,下面将分为多种方式进行详细描述:
方式一
在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。比如:N等于4,前N-1个比特位上的N-1个值可以都为0或1,第N个比特位上的值为不同于该N-1个值中任一值。可以是0001或1110。该第N个比特位可以位于该N-1个比特位之后,通过码流中的N个比特位上的值标识出所使用的N种编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
方式二
在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值。
方式三
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
在本发明实施例中上述预设值可以为第一预设值,上述方式比特位中不同于该第一预设值的值为第二预设值。
优选地,上述码流中还可以包括模式比特位,该模式比特位上的值用于标识音频信号的编码模式,该模式比特位上的值可以为第三预设值,该第三预设值用于标识Q声道编码模式。该模式比特位上的值是二进制数,该模式比特位的比特数可以是1个,也可以是多个,在此不做限定。如模式比特位上的值为1时表示该音频信号的编码模式为Q声道编码模式,模式比特位上的值为0时,表示该音频信号的编码模式为P声道编码模式,该P为小于Q的正整数。
为了实现通过一种编码器对不同编码码率的信号进行编码,当前编码方式为嵌入式编码方式,该嵌入式编码方式使用P声道编码方式进行编码。也就是说,P声道编码方式的码率有多种,相应地,嵌入式编码方式对应的码率有多种,该嵌入式编码方式为使用不同的码率对应的P声道编码方式进行编码的方式。其中,上述N种编码方式包括至少两种嵌入式编码方式,该至少两种嵌入式编码方式对应的方式比特位的长度不同,该至少两种嵌入式编码方式所使用的P声道编码方式的码率不同。比如,N种编码方式包括两种嵌入式编码方式,第一种编码方式对应的方式比特位的长度为1,第二种编码方式对应的方式比特位的长度可以为2;第一种编码方式所使用的P声道编码方式的码率与第二种编码方式所使用的P声道编码方式不同。
具体的,对于至少两种嵌入式编码方式中的两种编码方式,在其中一个编码方式所使用的P声道编码方式的码率越大时,其中一个编码方式对应的方式比特位的长度越长,或者,其中一个编码方式对应的方式比特位的长度越短。
进一步地,上述N种编码方式可以为非嵌入式编码方式,在使用该非嵌入式编码方式 进行编码时,该非嵌入式编码方式对应的方式比特位的长度为1;或者,非嵌入式编码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式编码方式对应的方式比特位的长度为N-1,非嵌入式编码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
举例来说,如图3所示的码流格式,音频信号的编码模式包括P声道编码模式和Q声道编码模式,在P声道编码模式下的P声道编码方式的码率为KMkb/s,在Q声道编码模式所包含的N种编码方式对应的码率也为KMkb/s,不同的嵌入式编码方式中使用的P声道编码方式的码率为KM-ikb/s。模式比特位上的值使用1标识Q声道编码模式,使用0标识P声道编码模式。方式比特位的长度为i,方式比特位上的值前i-1个比特位使用0,第i位比特位使用1。其中,非嵌入式编码方式为N种编码方式中的第N种编码方式,i等于N时,使用方式比特位中的前i-1个比特位上的值都为0标识非嵌入式编码方式。
在如图4所示的码流格式中,方式比特位的长度为i,方式比特位上的值前i-1个比特位使用0,第i个比特位使用1。其中,非嵌入式编码方式为N种编码方式中的第N种编码方式,使用方式比特位中的前i-1个比特位上的值为0,第i个比特位上的值为1标识该非嵌入式编码方式。
在如图5或图6所示的码流格式中,方式比特位的长度为i,方式比特位上值前i-1个比特位使用0,第i个比特位使用1。其中,非嵌入式编码方式为N种编码方式中的第1种编码方式,使用方式比特位中的第1个比特位上的值为1标识该非嵌入式编码方式。
上述实施例中的码流格式仅是示例作用,在实际应用时,可以根据具体的情况使用方式比特位前i-1个比特位上的值和第i个比特位上的值进行组合来标识N种编码方式。上述图3至图6中的多声道码流信息可以是多声道间的参数信息和/或残差信号信息。
在本发明实施例中,上述方式比特位可以为预留的比特位、指定的比特位或拓展后得到的比特位。若码流中还包括模式比特位,则该方式比特位可以位于该模式比特位之后,该模式比特位可以为预留的比特位、指定的比特位或拓展后得到的比特位,也就是说,在后期将码流中的比特位进行拓展后,也是使用作为模式比特位和/或方式比特位。
上述实施例表明,通过确定音频信号的编码模式,在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,根据当前编码方式对信号进行编码,从而获得音频信号的码流。通过码流中的方式比特位上的值标识出所使用的N种编码方式中索引为i的编码方式,通过设置码流中的方式比特位上不同比特位上的值可以标识出不同的编码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种编码方式,解决了编码方案的兼容性问题。
相应地,图7示出了本发明实施例提供的一种音频信号解码方法的流程,该流程可以由音频信号解码器执行。
如图7所示,该流程具体包括:
步骤701,接收音频信号的码流。
步骤702,在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式。
步骤703,根据当前解码方式对码流进行解码。
在本发明实施例中,码流的解码模式可以是Q声道解码模式或P声道解码模式,Q为 大于1的正整数,P为小于Q的正整数。比如,P声道可以为单声道,Q声道可以为多声道。其中,Q声道解码模式包括N中解码方式。在读取接收到的音频信号的码流之后确定该码流的解码模式为Q声道解码模式,若码流中存在方式比特位时,可以根据方式比特位上的值确定出当前解码方式,最后根据该确定出的当前解码方式对该码流进行解码。其中,当前解码方式是N种解码方式中的一种,码流中的方式比特位的长度为i,N为大于1的正整数,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。该预设值为二进制数,可以为1或0。比如:i等于3,该方式比特位有3个比特位,该3个比特位上的值可以是001或110。
应理解,在具体实现方式中,Q声道解码模式可以是立体声解码模式,P声道解码模式可以是单声道解码模式,单声道解码模式中的解码方式包括单声道解码方式解码,立体声解码模式中的解码方式包括嵌入式解码方式,嵌入式解码方式使用单声道解码方式,立体声解码模式也可以包括非嵌入式解码方式,非嵌入式解码方式中不使用单声道解码方式。
音频信号的解码模式还可以包括L声道解码模式,L为小于Q的正整数,且L不为P。
优选地,当码流中方式比特位只有1个比特位时,即在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。该1个比特位上的值为二进制数,可以为1或0,通过该预设值可以标识出需要使用那种解码方式进行解码。
进一步地,码流中方式比特位上的值有多种组合方式,下面将分为多种方式进行详细描述:
方式一
在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。比如:N等于4,前N-1个比特位上的N-1个值可以都为0或1,第N个比特位上的值为不同于该N-1个值中任一值。可以是0001或1110。该第N个比特位可以位于该N-1个比特位之后,通过码流中的N个比特位上的值标识出需要使用的N种解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
方式二
在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值。
方式三
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
在本发明实施例中上述预设值可以为第一预设值,上述方式比特位中不同于该第一预设值的值为第二预设值。
优选地,上述码流中还可以存在模式比特位,该模式比特位上的值用于标识音频信号的解码模式,该模式比特位上的值可以为第三预设值,该第三预设值用于标识Q声道解码 模式。该模式比特位上的值是二进制数,该模式比特位的比特数可以是1个,也可以是多个,在此不做限定。如模式比特位上的值为1时表示该音频信号的解码模式为Q声道解码模式,模式比特位上的值为0时,表示该音频信号的解码模式为P声道解码模式,该P为小于Q的正整数。
上述当前解码方式为嵌入式解码方式,该嵌入式解码方式使用P声道解码方式进行解码。也就是说,P声道解码方式的码率有多种,相应地,嵌入式解码方式对应的码率有多种,该P为小于Q的正整数,该嵌入式解码方式为使用不同的码率对应的P声道解码方式进行解码的方式。其中,上述N种解码方式包括至少两种嵌入式解码方式,该至少两种嵌入式解码方式对应的方式比特位的长度不同,该至少两种嵌入式解码方式所使用的P声道解码方式的码率不同。比如,N种解码方式包括两种嵌入式解码方式,第一种解码方式对应的方式比特位的长度为1,第二种解码方式对应的方式比特位的长度可以为2;第一种解码方式所使用的P声道解码方式的码率与第二种解码方式所使用的P声道解码方式不同。
具体的,对于至少两种嵌入式解码方式中的两种解码方式,在其中一个解码方式所使用的P声道解码方式的码率越大时,其中一个解码方式对应的方式比特位的长度越长,或者,其中一个解码方式对应的方式比特位的长度越短。
进一步地,上述N种解码方式可以为非嵌入式解码方式,在使用该非嵌入式解码方式进行解码时,该非嵌入式解码方式对应的方式比特位的长度为1;或者,非嵌入式解码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式解码方式对应的方式比特位的长度为N-1,非嵌入式解码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
举例来说,当接收到的码流的码流格式为如图3所示时,读取码率为KMkb/s的码流中的模式比特位,如果模式比特位的值为0,则在KMkb/s码率下使用P声道解码模式的P声道解码方式对该码流进行解码。
如果模式比特位的值为1,则读取方式比特位上的值:
若方式比特位中的第i个方式比特位上的值为1,则使用码率为KM-ikb/s的P声道解码方式并结合码流中的多声道信息进行嵌入式解码处理。
若方式比特位中的前i-1个比特位上的值为0且i小于N,则继续读取下一位比特位。
若方式比特位中的第i个标志比特位的值为0且i等于N,则进行非嵌入式解码处理。
当接收到的码流的码流格式如图4所示时,读取码率为KMkb/s的码流中的模式比特位,如果模式比特位的值为0,则在KMkb/s码率下使用P声道解码模式的P声道解码方式对该码流进行解码。
如果模式比特位的值为1,则读取方式比特位上的值:
若方式比特位中的第i个标志比特位的值为1且i小于等于N,则使用码率为KM-ikb/s的P声道解码方式并结合码流中的多声道信息进行嵌入式解码处理。
若方式比特位中的第i个标志比特位的值为1且i等于N,则进行非嵌入式多声道解码处理。
当接收到的码流的码流格式如图5所示时,读取码率为KMkb/s的码流中的模式比特位,如果模式比特位的值为0,则在KMkb/s码率下使用P声道解码模式的P声道解码方式对该码流进行解码。
如果模式比特位的值为1,则读取方式比特位上的值:
若方式比特位中的第i个标志比特位的值为1且i等于1,则进行非嵌入式多声道解码处理。
若方式比特位中的第i个标志比特位的值为C且i大于等于2小于等于N,则使用码率为KM-i-1kb/s的P声道解码方式并结合码流中的多声道信息进行嵌入式解码处理。
当接收到的码流的码流格式如图6所示时,读取码率为KMkb/s的码流中的模式比特位,如果模式比特位的值为0,则在KMkb/s码率下使用P声道解码模式的P声道解码方式对该码流进行解码。
如果模式比特位的值为1,则读取方式比特位上的值:
若方式比特位中的第i个标志比特位的值为1且i等于1,则进行非嵌入式多声道解码处理。
若方式比特位中的第i个标志比特位的值为C且i大于等于2小于等于N,则使用码率为KM-i-1kb/s的P声道解码方式并结合码流中的多声道信息进行嵌入式解码处理。
上述实施例表明,通过接收音频信号的码流,在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式,根据当前解码方式对码流进行解码。通过码流中的方式比特位上的值标识出所使用的N种解码方式,通过码流中的方式比特位上不同比特位上的值可以标识出不同的解码方式,可以实现在增加或减少方式比特位时,不需要改变用于标识其它原本的方式比特位上的值,自由的标识多种解码方式,解决了解码方案的兼容性问题。
为了更好的解释本发明实施例,下面将在具体的实施场景下描述音频信号编解码器进行音频信号编码和音频信号解码的流程。
在本发明实施例中,音频信号的码流中包括模式比特位和方式比特位。模式比特位上的值为第三预设值,方式比特位上前i-1个比特位上的值为第一预设值,第i个比特位上的值为第二预设值,第三预设值为1时表示音频信号的编解码模式为Q声道编解码模式,第三预设值为0时表示音频信号的编解码模式为P声道编解码模式。第一预设值为0,第二预设值为1。通过本发明实施例获取的码流是通过现有的P声道的码流进行扩展的码流。
场景一
在使用Q声道编码模式时:若Q声道编码模式下包含N种编码方式,N为大于或者等于零的整数,则:
如图8a所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,i等于1且模式比特位之前的码流格式相同时,模式比特位上的值为1,方式比特位中的第1个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图8b所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,i等于1且模式比特位之前的码流格式不同时,模式比特位上的值为1,方式比特位中的第1个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图8c所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,若i为大于等于2小于等于N的整数且模式比特位之前的码流格式相同时,模式比特位上的值为1,方式比特位中的前i-1个比特位为0,第i个比特位为1,码流中还包括码率为 KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图8d所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,若i为大于等于2小于等于N的整数且模式比特位之前的码流格式不同时,模式比特位上的值为1,方式比特位中的前i-1个比特位为0,第i个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图8e所示,若Q声道编码模式下使用非嵌入式编码方式,则模式比特位上的值为1,方式比特位上的值全部为0,该码流还包括非嵌入式码流信息。
例如,一种音频编解码器,未扩展前16.4kb/s的编码码率只有单声道编码模式,码流扩展后,新的码流结构可以支持包括单声道编码模式以及立体声编码模式,且立体声编码模式中可以包含一种嵌入式编码方式和一种非嵌入式编码方式。编码码率16.4kb/s的单声道码流扩展的方法,具体地可以是:
在使用单声道编码模式时,由2bits带宽标志位信息、模式比特位和码率为16.4kb/s的单声道码流信息构成扩展后码率为16.4kb/s的码流,其中,模式比特位上的值为0。
在使用立体声编码模式时,若采用嵌入式编码方式编码,则由2bits带宽标志位信息、模式比特位、方式比特位、码率为13.2kb/s的单声道码流信息和码率为3kb/s的立体声扩展信息构成扩展后码率为16.4kb/s的码流,其中,模式比特位上的值为1、方式比特位上的值为1。
若采用非嵌入式编码方式,则由2bits带宽标志位信息、模式比特位方式比特位和码率为16.2kb/s的除带宽信息之外的非嵌入式码流信息构成扩展后码率为16.4kb/s的码流,其中模式比特位上的值为1,方式比特位上的值为01。
例如,一种音频编解码器,未扩展前24.4kb/s的编码码率只有单声道编码模式,码流扩展后,新的码流结构可以支持包括单声道编码模式以及立体声编码模式,且立体声编码模式中可以包含两种嵌入式编码方式和一种非嵌入式编码方式。编码码率24.4kb/s的单声道码流扩展的方法,具体地可以是:
在使用单声道编码模式时,由2bits带宽标志位信息模式比特位和码率为24.4kb/s的单声道码流信息构成扩展后码率为24.4kb/s的码流,其中,模式比特位上的值为0。
在使用立体声编码模式时,若采用嵌入式立体声编码,采用编码速率为16.4kbps的单声道编码方式时,则由2bits带宽标志位信息、模式比特位、方式比特位、码率为16.4kb/s的单声道码流信息和码率为7.95kb/s的立体声扩展信息构成扩展后码率为24.4kb/s的码流,其中,模式比特位上的值为1、方式比特位上的值为1。
采用编码速率为13.2kbps的单声道编码方式时,则由2bits带宽标志位信息、模式比特位、方式比特位、码率为13.2kb/s的单声道码流信息和码率为10.95kb/s的立体声扩展信息构成扩展后码率为24.4kb/s的码流,其中,模式比特位上的值为1、方式比特位上的值为01。
若采用非嵌入式编码方式,则由2bits带宽标志位信息、模式比特位方式比特位和码率为24.15kb/s的除带宽信息之外的非嵌入式码流信息构成扩展后码率为24.4kb/s的码流,其中模式比特位上的值为1,方式比特位上的值为001。
相应地,解码端的处理过程为:
如图9a所示,读取到模式比特位的值为1,确定该码流的解码模式为Q声道解码模 式,若码流中的方式比特位中的第i个比特位为1,则将模式比特位的值重置为0,以及然后使用索引为i的嵌入式解码方式对该码流进行解码得到Q声道解码信号。
如图9b所示,读取到模式比特位的值为1,确定该码流的解码模式为Q声道解码模式,若方式比特位上的值全部为0,则使用非嵌入式解码方式对该码流进行解码得到Q声道解码信号。
例如,一种音频编解码器,解码端接收到码率为16.4kb/s的码流,码流读取具体地可以是:
读取模式比特位。若模式比特位的值为0,则接收到的码流为16.4kbps的单声道码流。可使用单声道解码模式下的单声道解码方式对该码流解码。
若模式比特位的值为1,则需要读取方式比特位上的值,若方式比特位中的只有1个比特位,且值为0,则使用码率为13.2kbps的单声道解码方式结合码率为3kbps的立体声扩展码流进行嵌入式解码。
若方式比特位中的只有1个比特位,且值为1,则进行码率为16.4kb/s的非嵌入式解码。
场景二
在使用Q声道编码模式时:若Q声道编码模式下包含N种编码方式,N为大于或者等于零的整数,则:
如图8a所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,i等于1且模式比特位之前的码流格式相同时,模式比特位上的值为1,方式比特位中的第1个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图8b所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,i等于1且模式比特位之前的码流格式不同时,模式比特位上的值为1,方式比特位中的第1个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图8c所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,若i为大于等于2小于等于N的整数且模式比特位之前的码流格式相同时,模式比特位上的值为1,方式比特位中的前i-1个比特位为0,第i个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图8d所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,若i为大于等于2小于N的整数且模式比特位之前的码流格式不同时,模式比特位上的值为1,方式比特位中的前i-1个比特位为0,第i个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图8f所示,若Q声道编码模式下使用非嵌入式编码方式,则模式比特位上的值为1,i等于N时,方式比特位中前i-1个值全部为0,第i个比特位的值为1,该码流还包括非嵌入式码流信息。
例如,一种音频编解码器,未扩展前16.4kb/s的编码码率只有单声道编码模式,码流扩展后,新的码流结构可以支持包括单声道编码模式以及立体声编码模式,且立体声编码模式中可以包含一种嵌入式编码方式和一种非嵌入式编码方式。编码码率16.4kb/s的单声道码流扩展的方法,具体地可以是:
在使用单声道编码模式时,由2bits带宽标志位信息、模式比特位和码率为16.4kb/s的单声道码流信息构成扩展后码率为16.4kb/s的码流,其中,模式比特位上的值为0。
在使用立体声编码模式时,若采用嵌入式编码方式编码,则由2bits带宽标志位信息、模式比特位、方式比特位、码率为13.2kb/s的单声道码流信息和码率为3kb/s的立体声扩展信息构成扩展后码率为16.4kb/s的码流,其中,模式比特位上的值为1、方式比特位上的值为1。
若采用非嵌入式编码方式,则由2bits带宽标志位信息、模式比特位方式比特位和码率为16.2kb/s的除带宽信息之外的非嵌入式码流信息构成扩展后码率为16.4kb/s的码流,其中模式比特位上的值为1,方式比特位上的值为01。
例如,一种音频编解码器,未扩展前24.4kb/s的编码码率只有单声道编码模式,码流扩展后,新的码流结构可以支持包括单声道编码模式以及立体声编码模式,且立体声编码模式中可以包含两种嵌入式编码方式和一种非嵌入式编码方式。编码码率24.4kb/s的单声道码流扩展的方法,具体地可以是:
在使用单声道编码模式时,由2bits带宽标志位信息模式比特位和码率为24.4kb/s的单声道码流信息构成扩展后码率为24.4kb/s的码流,其中,模式比特位上的值为0。
在使用立体声编码模式时,若采用嵌入式立体声编码,采用编码速率为16.4kbps的单声道编码方式时,则由2bits带宽标志位信息、模式比特位、方式比特位、码率为16.4kb/s的单声道码流信息和码率为7.95kb/s的立体声扩展信息构成扩展后码率为24.4kb/s的码流,其中,模式比特位上的值为1、方式比特位上的值为1。
采用编码速率为13.2kbps的单声道编码方式时,则由2bits带宽标志位信息、模式比特位、方式比特位、码率为13.2kb/s的单声道码流信息和码率为10.95kb/s的立体声扩展信息构成扩展后码率为24.4kb/s的码流,其中,模式比特位上的值为1、方式比特位上的值为10。
若采用非嵌入式编码方式,则由2bits带宽标志位信息、模式比特位方式比特位和码率为24.15kb/s的除带宽信息之外的非嵌入式码流信息构成扩展后码率为24.4kb/s的码流,其中模式比特位上的值为1,方式比特位上的值为110。
相应地,解码端的处理过程为:
如图9a所示,读取到模式比特位的值为1,确定该码流的解码模式为Q声道解码模式,若码流中的方式比特位中的第i个比特位为1,则将模式比特位的值重置为0,以及然后使用索引为i的嵌入式解码方式对该码流进行解码得到Q声道解码信号。
如图9c所示,读取到模式比特位的值为1,确定该码流的解码模式为Q声道解码模式,若方式比特位上的值为01,则使用非嵌入式解码方式对该码流进行解码得到Q声道解码信号。
例如,一种音频编解码器,解码端接收到码率为16.4kb/s的码流,码流读取具体地可以是:
读取模式比特位。若模式比特位的值为0,则接收到的码流为16.4kbps的单声道码流。可使用单声道解码模式下的单声道解码方式对该码流解码。
若模式比特位的值为1,则需要读取方式比特位上的值,若方式比特位中的只有1个比特位,且值为1,则使用码率为13.2kbps的单声道解码方式结合码率为3kbps的立体声 扩展码流进行嵌入式解码。
若方式比特位中的只有1个比特位,且值为0,则进行码率为16.4kb/s的非嵌入式解码。
场景三
下面以预留比特位在码流中位于首位为例,描述编码后将单声道码流扩展为立体声码流的码流格式,具体为:
在使用Q声道编码模式时:若Q声道编码模式下包含N种编码方式,N为大于或者等于零的整数,则:
如图10a所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,若i等于1且时,模式比特位上的值为1,方式比特位中的第1个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图10b所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,若i为大于等于2小于等于N的整数且模式比特位之前的码流格式相同时,模式比特位上的值为1,方式比特位中的前i-1个比特位为0,第i个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图10c所示,若Q声道编码模式下使用非嵌入式编码方式,则模式比特位上的值为1,方式比特位上的值全部为0,该码流还包括非嵌入式码流信息。
相应地,解码端的处理过程为:
如图11a所示,读取到模式比特位的值为1,确定该码流的解码模式为Q声道解码模式,若码流中的方式比特位中的第i个比特位为1,则将模式比特位的值重置为0,以及然后使用索引为i的嵌入式解码方式对该码流进行解码得到Q声道解码信号。
如图11b所示,读取到模式比特位的值为1,确定该码流的解码模式为Q声道解码模式,若方式比特位上的值全部为0,则使用非嵌入式解码方式对该码流进行解码得到Q声道解码信号。
场景四
下面以预留比特位在码流中位于首位为例,描述编码后将单声道码流扩展为立体声码流的码流格式,具体为:
在使用Q声道编码模式时:若Q声道编码模式下包含N种编码方式,N为大于或者等于零的整数,则:
如图10a所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,若i等于1且时,模式比特位上的值为1,方式比特位中的第1个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图10b所示,当Q声道编码模式下所使用的P声道编码方式的码率为KM-ikb/s时,若i为大于等于2小于等于N的整数且模式比特位之前的码流格式相同时,模式比特位上的值为1,方式比特位中的前i-1个比特位为0,第i个比特位为1,码流中还包括码率为KM-ikb/s的P声道编码方式编码的部分码流信息和多声道码流信息。
如图10d所示,若Q声道编码模式下使用非嵌入式编码方式,则模式比特位上的值为1,方式比特位中的前i-1个比特位为0,第i个比特位为1,该码流还包括非嵌入式码流信息。
相应地,解码端的处理过程为:
如图11a所示,读取到模式比特位的值为1,确定该码流的解码模式为Q声道解码模式,若码流中的方式比特位中的第i个比特位为1,则将模式比特位的值重置为0,以及然后使用索引为i的嵌入式解码方式对该码流进行解码得到Q声道解码信号。
如图11c所示,读取到模式比特位的值为1,确定该码流的解码模式为Q声道解码模式,若方式比特位中的前i-1个比特位为0,第i个比特位为1,则使用非嵌入式解码方式对该码流进行解码得到Q声道解码信号。
基于相同的技术构思,图12示出了本发明实施例提供的一种音频信号编码器,该音频信号编码器可以用于执行音频信号编码的流程。
如图12所示,该音频信号编码器具体包括:
确定单元1201,用于确定音频信号的编码模式;在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,其中,Q为大于1的正整数,N为大于1的正整数;
编码单元1202,用于根据确定单元1201确定的当前编码方式对音频信号进行编码,从而获得音频信号的码流,其中,码流包括方式比特位,码流中的方式比特位用于标识当前编码方式,码流中的方式比特位的长度为i,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位包括i个比特位,i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。
优选地,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
优选地,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。
优选地,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
优选地,N种编码方式包括嵌入式编码方式,当前编码方式为嵌入式编码方式,该嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
优选地,N种编码方式包括至少两种嵌入式编码方式,至少两种嵌入式编码方式对应的方式比特位的长度不同,至少两种嵌入式编码方式所使用的P声道编码方式的码率不同。
优选地,对于至少两种嵌入式编码方式中的两种编码方式,在其中一个编码方式所使用的P声道编码方式的码率越大时,其中一个编码方式对应的方式比特位的长度越长,或者,其中一个编码方式对应的方式比特位的长度越短。
优选地,N种编码方式包括非嵌入式编码方式。
优选地,非嵌入式编码方式对应的方式比特位的长度为1;或者,
非嵌入式编码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式编码方式对应的方式比特位的长度为N-1,非嵌入式编码方式对应的方式比特位包括N-1个 比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
优选地,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
基于相同的技术构思,图13示出了本发明实施例提供的一种音频信号解码器,该音频信号解码器可以用于执行音频信号解码的流程。
如图13所示,该音频信号解码器具体包括:
接收单元1301,用于接收音频信号的码流;
确定单元1302,用于在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式,Q声道解码模式包括N种解码方式,当前解码方式是N种解码方式中的一种,码流中的方式比特位的长度为i,Q为大于1的正整数,N为大于1的正整数,其中,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位包括i个比特位,i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值;
解码单元1303,用于根据确定单元1302确定的当前解码方式对码流进行解码。
优选地,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
优选地,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。
优选地,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
优选地,当前编码方式为嵌入式解码方式,该嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
优选地,N种解码方式包括至少两种嵌入式解码方式,至少两种嵌入式解码方式对应的方式比特位的长度不同,至少两种嵌入式解码方式所使用的P声道解码方式的码率不同。
优选地,对于至少两种嵌入式解码方式中的两种解码方式,在其中一个解码方式所使用的P声道解码方式的码率越大时,其中一个解码方式对应的方式比特位的长度越长,或者,其中一个解码方式对应的方式比特位的长度越短。
优选地,N种解码方式包括非嵌入式解码方式。
优选地,非嵌入式解码方式对应的方式比特位的长度为1;或者,
非嵌入式解码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式解码方式对应的方式比特位的长度为N-1,非嵌入式解码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
优选地,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
基于相同构思,参见图14,为本发明实施例提供的一种音频信号编码器1400。该音频信号编码器1400可包括:处理器1402和存储器1403。处理器1402用于控制音频信号 编码器1400的操作;存储器1403可以包括只读存储器和随机存取存储器,存储有处理器1402可以执行的指令和数据。存储器1403的一部分还可以包括非易失行随机存取存储器(NVRAM)。处理器1402和存储器1403等各组件通过总线1409连接,其中总线1409除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图中将各种总线都标为总线1409。该音频信号编码器1400还可包括:接收器和发送器,接收器可用于接收音频信号,发送器用于发送音频信号的码流。
本发明实施例揭示的一种音频信号编码方法可以应用于处理器1402中,或者由处理器1402实现。在实现过程中,处理流程的各步骤可以通过处理器1402中的硬件的集成逻辑电路或者软件形式的指令完成。处理器1402可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1403,处理器1402读取存储器1403中存储的信息,结合其硬件完成一种音频信号编码方法的步骤。
所述处理器1402确定音频信号的编码模式;在音频信号的编码模式为Q声道编码模式时,在Q声道编码模式所包括的N种编码方式中确定当前编码方式,其中,Q为大于1的正整数,N为大于1的正整数;所述处理器1402根据确定的当前编码方式对音频信号进行编码,从而获得音频信号的码流,其中,码流包括方式比特位,码流中的方式比特位用于标识当前编码方式,码流中的方式比特位的长度为i,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位包括i个比特位,i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值。
优选地,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
优选地,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。
优选地,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位,N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
优选地,当前编码方式为嵌入式编码方式,该嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
优选地,N种编码方式包括至少两种嵌入式编码方式,至少两种嵌入式编码方式对应的方式比特位的长度不同,至少两种嵌入式编码方式所使用的P声道编码方式的码率不同。
优选地,对于至少两种嵌入式编码方式中的两种编码方式,在其中一个编码方式所使 用的P声道编码方式的码率越大时,其中一个编码方式对应的方式比特位的长度越长,或者,其中一个编码方式对应的方式比特位的长度越短。
优选地,N种编码方式包括非嵌入式编码方式。
优选地,非嵌入式编码方式对应的方式比特位的长度为1;或者,
非嵌入式编码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式编码方式对应的方式比特位的长度为N-1,非嵌入式编码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
优选地,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
基于相同构思,参见图15,为本发明实施例提供的一种音频信号解码器1500。该音频信号解码器1500可包括:收发器1501、处理器1502和存储器1503。处理器1502用于控制音频信号解码器1500的操作;存储器1503可以包括只读存储器和随机存取存储器,存储有处理器1502可以执行的指令和数据。存储器1503的一部分还可以包括非易失行随机存取存储器(NVRAM)。收发器1501、处理器1502和存储器1503等各组件通过总线1509连接,其中总线1509除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图中将各种总线都标为总线1509。
本发明实施例揭示的一种音频信号解码方法可以应用于处理器1502中,或者由处理器1502实现。在实现过程中,处理流程的各步骤可以通过处理器1502中的硬件的集成逻辑电路或者软件形式的指令完成。处理器1502可以是通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1503,处理器1502读取存储器1503中存储的信息,结合其硬件完成一种音频信号解码方法的步骤。
所述收发器1501接收音频信号的码流;所述处理器1502在确定码流的解码模式为Q声道解码模式时,根据码流中的方式比特位上的值确定当前解码方式,Q声道解码模式包括N种解码方式,当前解码方式是N种解码方式中的一种,码流中的方式比特位的长度为i,Q为大于1的正整数,N为大于1的正整数,其中,在i大于1并且小于N-1,并且N大于3时,码流中的方式比特位包括i个比特位,i个比特位的前i-1个比特位上的i-1个值相同,i个比特位的第i个比特位上的值不同于i-1个比特位中任一比特位上的值,第i个比特位上的值为预设值;所述处理器1502根据确定的当前解码方式对码流进行解码。
优选地,在i等于1时,码流中的方式比特位包括1个比特位,1个比特位上的值为预设值。
优选地,在i等于N时,码流中的方式比特位包括N个比特位,N个比特位的前N-1个比特位上的N-1个值相同,N个比特位的第N个比特位上的值不同于N-1个比特位中任一比特位上的值,第N个比特位上的值为预设值。
优选地,在i等于N-1,并且N大于2时,码流中的方式比特位包括N-1个比特位, N-1个比特位的前N-2个比特位上的N-2个值相同,N-1个比特位的第N-1个比特位上的值不同于N-2个比特位中任一比特位上的值,第N-1个比特位上的值为预设值;或者,
在i等于N-1,并且N大于2时,码流中的方式比特位仅包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
优选地,当前编码方式为嵌入式解码方式,该嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
优选地,N种解码方式包括至少两种嵌入式解码方式,至少两种嵌入式解码方式对应的方式比特位的长度不同,至少两种嵌入式解码方式所使用的P声道解码方式的码率不同。
优选地,对于至少两种嵌入式解码方式中的两种解码方式,在其中一个解码方式所使用的P声道解码方式的码率越大时,其中一个解码方式对应的方式比特位的长度越长,或者,其中一个解码方式对应的方式比特位的长度越短。
优选地,N种解码方式包括非嵌入式解码方式。
优选地,非嵌入式解码方式对应的方式比特位的长度为1;或者,
非嵌入式解码方式对应的方式比特位的长度为N;或者,在N大于2时,非嵌入式解码方式对应的方式比特位的长度为N-1,非嵌入式解码方式对应的方式比特位包括N-1个比特位,N-1个比特位上的N-1个值相同,N-1个比特位中每一比特位上的值均不同于预设值。
优选地,方式比特位为预留的比特位、指定的比特位或拓展后得到的比特位。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (36)

  1. 一种音频信号编码方法,其特征在于,包括:
    确定音频信号的编码模式;
    在所述音频信号的编码模式为Q声道编码模式时,在所述Q声道编码模式所包括的N种编码方式中确定当前编码方式,其中,Q为大于1的正整数,N为大于1的正整数;
    根据所述当前编码方式对所述音频信号进行编码,从而获得所述音频信号的码流,其中,所述码流包括方式比特位,所述码流中的方式比特位用于标识所述当前编码方式,所述码流中的方式比特位的长度为i,在i大于1并且小于N-1,并且N大于3时,所述码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,所述i个比特位的第i个比特位上的值不同于所述i-1个比特位中任一比特位上的值,所述第i个比特位上的值为预设值。
  2. 根据权利要求1所述的方法,其特征在于,在i等于1时,所述码流中的方式比特位包括1个比特位,所述1个比特位上的值为所述预设值。
  3. 根据权利要求1或2所述的方法,其特征在于,在i等于N时,所述码流中的方式比特位包括N个比特位,所述N个比特位的前N-1个比特位上的N-1个值相同,所述N个比特位的第N个比特位上的值不同于所述N-1个比特位中任一比特位上的值,所述第N个比特位上的值为所述预设值。
  4. 根据权利要求1或2所述的方法,其特征在于,在i等于N-1,并且N大于2时,所述码流中的方式比特位包括N-1个比特位,所述N-1个比特位的前N-2个比特位上的N-2个值相同,所述N-1个比特位的第N-1个比特位上的值不同于所述N-2个比特位中任一比特位上的值,所述第N-1个比特位上的值为所述预设值;或者,
    在i等于N-1,并且N大于2时,所述码流中的方式比特位仅包括N-1个比特位,所述N-1个比特位上的N-1个值相同,所述N-1个比特位中每一比特位上的值均不同于所述预设值。
  5. 根据权利要求1至4任一项所述的方法,其特征在于,所述当前编码方式为嵌入式编码方式,所述嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
  6. 根据权利要求1至4任一项所述的方法,其特征在于,所述N种编码方式包括至少两种嵌入式编码方式,所述至少两种嵌入式编码方式对应的方式比特位的长度不同,所述至少两种嵌入式编码方式所使用的P声道编码方式的码率不同。
  7. 根据权利要求6所述的方法,其特征在于,对于所述至少两种嵌入式编码方式中的两种编码方式,在其中一个编码方式所使用的P声道编码方式的码率越大时,所述其中一个编码方式对应的方式比特位的长度越长,或者,所述其中一个编码方式对应的方式比特位的长度越短。
  8. 根据权利要求1至7任一项所述的方法,其特征在于,所述N种编码方式包括非嵌入式编码方式。
  9. 根据权利要求8所述的方法,其特征在于,所述非嵌入式编码方式对应的方式比特位的长度为1;或者,
    所述非嵌入式编码方式对应的方式比特位的长度为N;或者,
    在N大于2时,所述非嵌入式编码方式对应的方式比特位的长度为N-1,所述非嵌入式编码方式对应的方式比特位仅包括N-1个比特位,所述N-1个比特位上的N-1个值相同,所述N-1个比特位中每一比特位上的值均不同于所述预设值。
  10. 一种音频信号解码方法,其特征在于,包括:
    接收音频信号的码流;
    在确定所述码流的解码模式为Q声道解码模式时,根据所述码流中的方式比特位上的值确定当前解码方式,所述Q声道解码模式包括N种解码方式,所述当前解码方式是所述N种解码方式中的一种,所述码流中的方式比特位的长度为i,Q为大于1的正整数,N为大于1的正整数,其中,在i大于1并且小于N-1,并且N大于3时,所述码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,所述i个比特位的第i个比特位上的值不同于所述i-1个比特位中任一比特位上的值,所述第i个比特位上的值为预设值;
    根据所述当前解码方式对所述码流进行解码。
  11. 根据权利要求10所述的方法,其特征在于,在i等于1时,所述码流中的方式比特位包括1个比特位,所述1个比特位上的值为所述预设值。
  12. 根据权利要求10或11所述的方法,其特征在于,在i等于N时,所述码流中的方式比特位包括N个比特位,所述N个比特位的前N-1个比特位上的N-1个值相同,所述N个比特位的第N个比特位上的值不同于所述N-1个比特位中任一比特位上的值,所述第N个比特位上的值为所述预设值。
  13. 根据权利要求10或11所述的方法,其特征在于,在i等于N-1,并且N大于2时,所述码流中的方式比特位包括N-1个比特位,所述N-1个比特位的前N-2个比特位上的N-2个值相同,所述N-1个比特位的第N-1个比特位上的值不同于所述N-2个比特位中任一比特位上的值,所述第N-1个比特位上的值为所述预设值;或者,
    在i等于N-1,并且N大于2时,所述码流中的方式比特位仅包括N-1个比特位,所述N-1个比特位上的N-1个值相同,所述N-1个比特位中每一比特位上的值均不同于所述预设值。
  14. 根据权利要求10至13任一项所述的方法,其特征在于,所述当前解码方式为嵌入式解码方式,所述嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
  15. 根据权利要求10至13任一项所述的方法,其特征在于,所述N种解码方式包括至少两种嵌入式解码方式,所述至少两种嵌入式解码方式对应的方式比特位的长度不同,所述至少两种嵌入式解码方式所使用的P声道解码方式的码率不同。
  16. 根据权利要求15所述的方法,其特征在于,对于所述至少两种嵌入式解码方式中的两种解码方式,在其中一个解码方式所使用的P声道解码方式的码率越大时,所述其中一个解码方式对应的方式比特位的长度越长,或者,所述其中一个解码方式对应的方式比特位的长度越短。
  17. 根据权利要求10至16任一项所述的方法,其特征在于,所述N种解码方式包括非嵌入式解码方式。
  18. 根据权利要求17所述的方法,其特征在于,所述非嵌入式解码方式对应的方式比特位的长度为1;或者,
    所述非嵌入式解码方式对应的方式比特位的长度为N;或者,
    在N大于2时,所述非嵌入式解码方式对应的方式比特位的长度为N-1,所述非嵌入式解码方式对应的方式比特位包括N-1个比特位,所述N-1个比特位上的N-1个值相同,所述N-1个比特位中每一比特位上的值均不同于所述预设值。
  19. 一种音频信号编码器,其特征在于,包括:
    确定单元,用于确定音频信号的编码模式;在所述音频信号的编码模式为Q声道编码模式时,在所述Q声道编码模式所包括的N种编码方式中确定当前编码方式,其中,Q为大于1的正整数,N为大于1的正整数;
    编码单元,用于根据所述确定单元确定的当前编码方式对所述音频信号进行编码,从而获得所述音频信号的码流,其中,所述码流包括方式比特位,所述码流中的方式比特位用于标识所述当前编码方式,所述码流中的方式比特位的长度为i,在i大于1并且小于N-1,并且N大于3时,所述码流中的方式比特位包括i个比特位,所述i个比特位的前i-1个比特位上的i-1个值相同,所述i个比特位的第i个比特位上的值不同于所述i-1个比特位中任一比特位上的值,所述第i个比特位上的值为预设值。
  20. 根据权利要求19所述的编码器,其特征在于,在i等于1时,所述码流中的方式比特位包括1个比特位,所述1个比特位上的值为所述预设值。
  21. 根据权利要求19或20所述的编码器,其特征在于,在i等于N时,所述码流中的方式比特位包括N个比特位,所述N个比特位的前N-1个比特位上的N-1个值相同,所述N个比特位的第N个比特位上的值不同于所述N-1个比特位中任一比特位上的值,所述第N个比特位上的值为所述预设值。
  22. 根据权利要求19或20所述的编码器,其特征在于,在i等于N-1,并且N大于2时,所述码流中的方式比特位包括N-1个比特位,所述N-1个比特位的前N-2个比特位上的N-2个值相同,所述N-1个比特位的第N-1个比特位上的值不同于所述N-2个比特位中任一比特位上的值,所述第N-1个比特位上的值为所述预设值;或者,
    在i等于N-1,并且N大于2时,所述码流中的方式比特位仅包括N-1个比特位,所述N-1个比特位上的N-1个值相同,所述N-1个比特位中每一比特位上的值均不同于所述预设值。
  23. 根据权利要求19至22任一项所述的编码器,其特征在于,所述当前编码方式为嵌入式编码方式,所述嵌入式编码方式使用P声道编码方式进行编码,P为小于Q的正整数。
  24. 根据权利要求23所述的编码器,其特征在于,所述N种编码方式包括至少两种嵌入式编码方式,所述至少两种嵌入式编码方式对应的方式比特位的长度不同,所述至少两种嵌入式编码方式所使用的P声道编码方式的码率不同。
  25. 根据权利要求24所述的编码器,其特征在于,对于所述至少两种嵌入式编码方式中的两种编码方式,在其中一个编码方式所使用的P声道编码方式的码率越大时,所述其中一个编码方式对应的方式比特位的长度越长,或者,所述其中一个编码方式对应的方式比特位的长度越短。
  26. 根据权利要求19至25任一项所述的编码器,其特征在于,所述N种编码方式包括非嵌入式编码方式。
  27. 根据权利要求19至25任一项所述的编码器,其特征在于,所述非嵌入式编码方式对应的方式比特位的长度为1;或者,
    所述非嵌入式编码方式对应的方式比特位的长度为N;或者,在N大于2时,所述非嵌入式编码方式对应的方式比特位的长度为N-1,所述非嵌入式编码方式对应的方式比特位包括N-1个比特位,所述N-1个比特位上的N-1个值相同,所述N-1个比特位中每一比特位上的值均不同于所述预设值。
  28. 一种音频信号解码器,其特征在于,包括:
    接收单元,用于接收音频信号的码流;
    确定单元,用于在确定所述码流的解码模式为Q声道解码模式时,根据所述码流中的方式比特位上的值确定当前解码方式,所述Q声道解码模式包括N种解码方式,所述当前解码方式是所述N种解码方式中的一种,所述码流中的方式比特位的长度为i,Q为大于1的正整数,N为大于1的正整数,其中,在i大于1并且小于N-1,并且N大于3时,所述码流中的方式比特位的i个比特位的前i-1个比特位上的i-1个值相同,所述i个比特位的第i个比特位上的值不同于所述i-1个比特位中任一比特位上的值,所述第i个比特位上的值为预设值;
    解码单元,用于根据所述确定单元确定的所述当前解码方式对所述码流进行解码。
  29. 根据权利要求28所述的解码器,其特征在于,在i等于1时,所述码流中的方式比特位包括1个比特位,所述1个比特位上的值为所述预设值。
  30. 根据权利要求28或29所述的解码器,其特征在于,在i等于N时,所述码流中的方式比特位包括N个比特位,所述N个比特位的前N-1个比特位上的N-1个值相同,所述N个比特位的第N个比特位上的值不同于所述N-1个比特位中任一比特位上的值,所述第N个比特位上的值为所述预设值。
  31. 根据权利要求28或29所述的解码器,其特征在于,在i等于N-1,并且N大于2时,所述码流中的方式比特位包括N-1个比特位,所述N-1个比特位的前N-2个比特位上的N-2个值相同,所述N-1个比特位的第N-1个比特位上的值不同于所述N-2个比特位中任一比特位上的值,所述第N-1个比特位上的值为所述预设值;或者,
    在i等于N-1,并且N大于2时,所述码流中的方式比特位仅包括N-1个比特位,所述N-1个比特位上的N-1个值相同,所述N-1个比特位中每一比特位上的值均不同于所述预设值。
  32. 根据权利要求28至31任一项所述的解码器,其特征在于,所述当前编码方式为嵌入式解码方式,所述嵌入式解码方式使用P声道解码方式进行解码,P为小于Q的正整数。
  33. 根据权利要求28至31任一项所述的解码器,其特征在于,所述N种解码方式包括至少两种嵌入式解码方式。
  34. 根据权利要求33所述的解码器,其特征在于,对于所述至少两种嵌入式解码方式中的两种解码方式,在其中一个解码方式所使用的P声道解码方式的码率越大时,所述其中一个解码方式对应的方式比特位的长度越长,或者,所述其中一个解码方式对应的方式比特位的长度越短。
  35. 根据权利要求29至34任一项所述的解码器,其特征在于,所述N种解码方式包括非嵌入式解码方式。
  36. 根据权利要求35所述的解码器,其特征在于,所述非嵌入式解码方式对应的方式比特位的长度为1;或者,
    所述非嵌入式解码方式对应的方式比特位的长度为N;或者,在N大于2时,所述非嵌入式解码方式对应的方式比特位的长度为N-1,所述非嵌入式解码方式对应的方式比特位包括N-1个比特位,所述N-1个比特位上的N-1个值相同,所述N-1个比特位中每一比特位上的值均不同于所述预设值。
PCT/CN2017/081114 2016-04-29 2017-04-19 一种音频信号编码、解码方法及音频信号编码器、解码器 WO2017186040A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610284150.9A CN107342090B (zh) 2016-04-29 2016-04-29 一种音频信号编码、解码方法及音频信号编码器、解码器
CN201610284150.9 2016-04-29

Publications (1)

Publication Number Publication Date
WO2017186040A1 true WO2017186040A1 (zh) 2017-11-02

Family

ID=60160764

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/081114 WO2017186040A1 (zh) 2016-04-29 2017-04-19 一种音频信号编码、解码方法及音频信号编码器、解码器

Country Status (2)

Country Link
CN (1) CN107342090B (zh)
WO (1) WO2017186040A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114495951A (zh) * 2020-11-11 2022-05-13 华为技术有限公司 音频编解码方法和装置
CN117476024B (zh) * 2023-11-29 2024-09-27 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、装置、可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1325574A (zh) * 1998-09-01 2001-12-05 艾利森电话股份有限公司 使用先验知识进行编解码器模式解码
CN101390158A (zh) * 2006-02-24 2009-03-18 法国电信公司 信号包络的量化索引的二进制编码方法、解码信号包络的方法、及相应的编码和解码模块
CN101547010A (zh) * 2008-03-24 2009-09-30 华为技术有限公司 编码解码系统、方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001276588A1 (en) * 2001-01-11 2002-07-24 K. P. P. Kalyan Chakravarthy Adaptive-block-length audio coder
CN101807400B (zh) * 2010-01-08 2012-04-25 中国科学院软件研究所 一种基于擦除编码的自适应语音多播传输方法
CN102610231B (zh) * 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1325574A (zh) * 1998-09-01 2001-12-05 艾利森电话股份有限公司 使用先验知识进行编解码器模式解码
CN101390158A (zh) * 2006-02-24 2009-03-18 法国电信公司 信号包络的量化索引的二进制编码方法、解码信号包络的方法、及相应的编码和解码模块
CN101547010A (zh) * 2008-03-24 2009-09-30 华为技术有限公司 编码解码系统、方法及装置

Also Published As

Publication number Publication date
CN107342090A (zh) 2017-11-10
CN107342090B (zh) 2020-08-25

Similar Documents

Publication Publication Date Title
JP5442995B2 (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
JP2006031012A5 (zh)
US9570082B2 (en) Method, medium, and apparatus encoding and/or decoding multichannel audio signals
CN108777606B (zh) 解码方法、设备及可读存储介质
US20130013979A1 (en) Magnetic disk controller to process plural data sets for recording onto a medium
JP4875204B2 (ja) 符号化オーディオデータを処理するための装置及び方法
JP2005510102A (ja) データフレームが符号化された付加データを含んでいるか否かを判定する方法及び装置
EP3072238B1 (en) Devices and methods for facilitating data inversion to limit both instantaneous current and signal transitions
WO2017186040A1 (zh) 一种音频信号编码、解码方法及音频信号编码器、解码器
JP7389651B2 (ja) デジタルオーディオ信号における可変アルファベットサイズ
WO2022095173A1 (zh) 解码方法、解码装置及可读存储介质
WO2008151568A1 (fr) Procédé et système de compensation de trame
KR20150009474A (ko) 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
US20240062766A1 (en) Method, system, and medium of adding additional information to lc3 audio code stream
US9070483B2 (en) Encoding and decoding redundant bits to accommodate memory cells having stuck-at faults
JP5384943B2 (ja) オーディオデータ符号化及び/または復号化方法、記録媒体及びシステム
US9460725B2 (en) Method, medium, and apparatus encoding and/or decoding extension data for surround
KR101434834B1 (ko) 다채널 오디오 신호의 부호화/복호화 방법 및 장치
JP2009266345A (ja) 情報処理装置、情報処理方法
JP2011505109A (ja) 分割された並列的なエンコーディング動作を伴う畳込みエンコーディング
US10255944B2 (en) Systems and methods for reading and decoding encoded data from a storage device
US20160105200A1 (en) Apparatus and method for processing trace data streams
RU2019125257A (ru) Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока
JP2006154115A (ja) 半導体集積回路装置および情報記録媒体
KR20050077109A (ko) Mpeg 오디오 디코딩 방법

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17788692

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 17788692

Country of ref document: EP

Kind code of ref document: A1