WO2005078703A1 - Verfahren und vorrichtung zum quantisieren eines informationssignals - Google Patents

Verfahren und vorrichtung zum quantisieren eines informationssignals Download PDF

Info

Publication number
WO2005078703A1
WO2005078703A1 PCT/EP2005/001343 EP2005001343W WO2005078703A1 WO 2005078703 A1 WO2005078703 A1 WO 2005078703A1 EP 2005001343 W EP2005001343 W EP 2005001343W WO 2005078703 A1 WO2005078703 A1 WO 2005078703A1
Authority
WO
WIPO (PCT)
Prior art keywords
audio
values
value
block
threshold
Prior art date
Application number
PCT/EP2005/001343
Other languages
English (en)
French (fr)
Inventor
Gerald Schuller
Stefan Wabnik
Jens Hirschfeld
Wolfgang Fiesel
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN200580004688XA priority Critical patent/CN1918630B/zh
Priority to DE502005001821T priority patent/DE502005001821D1/de
Priority to JP2006552545A priority patent/JP4444295B2/ja
Priority to BRPI0506627A priority patent/BRPI0506627B1/pt
Priority to EP05715289A priority patent/EP1697929B1/de
Priority to AU2005213767A priority patent/AU2005213767B2/en
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority to CA2555639A priority patent/CA2555639C/en
Publication of WO2005078703A1 publication Critical patent/WO2005078703A1/de
Priority to US11/460,433 priority patent/US7464027B2/en
Priority to IL177164A priority patent/IL177164A/en
Priority to NO20064091A priority patent/NO337836B1/no
Priority to HK07100911A priority patent/HK1093814A1/xx

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding

Definitions

  • the present invention relates generally to quantizers or the quantization of information signals and, in exemplary embodiments, to the quantization of audio signals, as used, for example, for data compression of audio signals or for audio coding. In a specific embodiment, the present invention relates to audio coding with a short delay time.
  • the currently best known audio compression process is the MPEG-1 Layer III.
  • the sampling or audio values of an audio signal are encoded with loss in an encoded signal.
  • irrelevance and redundancy of the original audio signal are reduced or ideally removed during the compression.
  • a psychoacoustic model recognizes simultaneous and temporal masking, i.e. a temporally changing masking threshold which is dependent on the audio signal is calculated or determined, which indicates the volume at which tones of a certain frequency are only perceptible to the human ear.
  • This information is in turn used to encode the signal by quantizing the spectral values of the audio signal more precisely, less precisely or not at all, depending on the masking threshold, and integrating them into the encoded signal.
  • Audio compression methods such as the MP3 format, are then limited in their applicability when it comes to compressing audio data over a bit rate-limited transmission channel, on the one hand, but transmitting it with the shortest possible delay time.
  • the delay time doesn't matter Role, such as in the archiving of audio information.
  • audio coders with low delay sometimes also called “ultra low delay coders” are necessary where time-critical transmissions of audio signals are concerned, such as teleconferencing, wireless speakers or microphones.
  • the article by Schuller G. etc. “Perceptual Audio Coding using Adaptive Pre- and Post-Filters and Lossless Compression", IEEE Transactions on Speech and Audio Processing, Vol. 10, No. 6, September 2002, pp. 379-390, a Audio coding proposed, in which the irrelevance reduction and the redundancy reduction are not carried out based on a single transformation, but on two separate transformations.
  • the coding is based on an audio signal 902 which has already been sampled and is therefore already available as a sequence 904 of audio or sample values 906, the sequence in time of the audio values 906 being indicated by an arrow 908.
  • a listening threshold is calculated using a psychoacoustic model. For example, FIG.
  • FIG. 13 shows a diagram in which the spectrum is represented by the frequency f with the curve a a signal block from 128 audio values 906 and at b the masking threshold, as calculated by a psychoacoustic model, is plotted in logarithmic units, as already mentioned, the masking threshold indicates to what intensity frequencies are inaudible to the human ear All tones are below the masking threshold B.
  • an irrelevance reduction is now achieved by controlling a parameterizable filter followed by a quantizer.
  • parameterization is calculated such that the frequency response the same to the I nversen des Amount corresponds to the masking threshold. This parameterization is indicated in FIG. 12 by x # (i).
  • quantization takes place with a constant step size, for example a rounding operation to the nearest integer.
  • the resulting quantization noise is white noise.
  • the filtered signal is "re-transformed" again with a parameterizable filter, the transfer function of which is set to the amount of the masking threshold itself. In this way, not only is the filtered signal decoded again, but also the quantizing noise on the decoder side is adapted to the shape of the masking threshold - If the masking threshold corresponds exactly, a gain value a # is also calculated on the encoder side for each parameter set or for each parameterization, which is applied to the filtered signal before quantization.
  • the gain value becomes the decoder side so that the inverse transformation can be carried out a and the parameterization x are transmitted to the encoder as page information 910 in addition to the actual main data, namely the quantized, filtered audio values 912.
  • this data ie page information 910 u nd main data 912, still subjected to lossless compression, namely entropy coding, whereby the coded signal is obtained.
  • the article suggests a size of 128 samples 906 as the block size. This enables a relatively short delay of 8 ms at a sampling rate of 32 kHz.
  • the article also describes that to increase the efficiency of the page information coding, the page information, namely the coefficients x # and a #, are only transmitted if there is sufficient change compared to a previously transmitted parameter set, ie if the Change exceeds a certain threshold. moreover describes that the implementation is preferably carried out so that a current parameter set is not applied directly to all samples belonging to the respective block, but that a linear interpolation of the filter coefficients x # is used in order to avoid audible artifacts.
  • a lattice structure is proposed for the filter in order to prevent the occurrence of instabilities.
  • the article still suggests to selectively multiply or weaken the filtered signal scaled with the time-dependent gain factor a by a factor not equal to 1, so that audible interference arise, but the bit rate can be reduced at difficult to encode locations of the audio signal.
  • a problem with the above scheme is that due to the need to transmit the masking threshold or the transfer function of the encoder-side filter, hereinafter referred to as pre-filter to have to, the transmission channel is loaded relatively high, although the filter coefficients are only transmitted when a predetermined threshold is exceeded.
  • Another disadvantage of the above coding scheme is that due to the fact that the masking threshold or the inverse thereof must be made available on the decoding side by the parameter set x # to be transmitted, a compromise between on the one hand the lowest possible bit rate or a high compression ratio and others - On the one hand, the most accurate approximation or parameterization of the masking threshold or the inverse of it must be made. It is therefore inevitable that the audio coding scheme given above to the masking threshold adapted quantization noise at some frequency ranges exceeds the masking threshold and therefore leads to audible audio interference for the listener. 13 shows, for example with curve c, the parameterized frequency response of the decoder-side parameterizable filter.
  • the transfer function of the decoder-side filter hereinafter also referred to as the post filter
  • the masking threshold b exceeds the masking threshold b.
  • the problem is exacerbated by the fact that the parameterization is only transmitted intermittently if there is enough change between the parameterizations and is interpolated in between.
  • An interpolation of the filter coefficients x # as proposed in the article, alone leads to audible disturbances if the amplification value a # is kept constant from support point to support point or from new parameterization to new parameterization.
  • the interpolation proposed in the article is also applied to the side information value a # , ie the transmitted gain values, audible audio artifacts can remain in the audio signal arriving on the decoder side.
  • a further problem with the audio coding scheme according to FIGS. 12 and 13 is that the filtered signal can take on an unforeseeable form due to the frequency-selective filtering, in which a single or individual audio values of the coded signal change due to a random superposition of many individual harmonics add up to very high values which, due to their rare occurrence, in turn lead to a poorer compression ratio in the subsequent redundancy reduction.
  • the object of the present invention is to provide a method and a device for quantizing an information signal, so that with only a slight deterioration in the quality of the original information a higher data compression of the information signal can be realized.
  • Quantizing an information signal of a sequence of information values in accordance with the invention comprises frequency-selective filtering of the sequence of information values in order to obtain a sequence of filtered information values, and quantizing the filtered information values in order to obtain a sequence of quantized information values by means of a quantization stage function which the filtered ones Maps information values to the quantized information values, and their course is steeper below a threshold information value than above the threshold information value.
  • frequency-selective filtering of an audio signal results in artificially generated artifacts in the resulting filtered information signal, at which individual information values assume values that are significantly higher than the maximum values of the original signal due to a random constructive interference of all or many harmonics. such as more than twice as high.
  • a truncation of the filtered information signal above a suitable threshold which is, for example, twice as large as the largest possible value of the original information signal to be filtered, so that the artifacts artificially generated by the frequency-selective filtering from the filtered Information signal are removed or smoothed, after back filtering hardly leads to an impairment of the quality of the information signal filtered back after quantization, but cutting off or increasing the quantization step size above a suitable one Threshold offers enormous savings in a bit representation of the filtered information signal.
  • the information signal is an audio signal in which the selective quantization above or below a certain threshold leads to a barely audible reduction in audio quality with a simultaneous enormous reduction in the bit representation.
  • the quantization level function can alternatively be provided to quantize all audio values to a highest quantization level above the threshold value, or a quantization level function is used which is flatter above the threshold value or has a larger quantization step size above the threshold value, so that the artificial generated artifacts can be quantized more coarsely.
  • FIG. 1 is a block diagram of an audio encoder according to an embodiment of the present invention.
  • FIG. 2 is a flow chart illustrating the operation of the audio encoder of FIG. 1 at the data input;
  • FIG. 3 shows a flowchart to illustrate the mode of operation of the audio encoder from FIG. 1 with regard to the evaluation of the incoming audio signal by a psychoacoustic model
  • FIG. 4 is a flowchart to illustrate the operation of the audio encoder of FIG. 1 with regard to the application of the psychoacoustic table model received parameters on the incoming audio signal;
  • Fig. 5a is a schematic diagram illustrating the incoming audio signal, the sequence of audio values from which it is composed, and the working steps of Fig. 4 in relation to the audio values;
  • 5b is a schematic diagram to illustrate the structure of the coded signal
  • FIG. 6 shows a flowchart to illustrate the mode of operation of the audio encoder from FIG. 1 with regard to the final processing up to the coded signal;
  • FIG. 7a shows a diagram in which an exemplary embodiment of a quantization level function is shown
  • FIG. 7b shows a diagram in which a further exemplary embodiment for a quantization level function is shown
  • FIG. 8 shows a block diagram of an audio decoder, which is capable of decoding an audio signal encoded by the audio encoder of FIG. 1, according to an exemplary embodiment of the present invention
  • Fig. 9 is a flow chart illustrating the operation of the decoder of Fig. 8 at the data input;
  • Fig. 10 is a flow chart illustrating the operation of the decoder of Fig. 8 with respect to the intermediate storage of the pre-decoded, quantized, filtered audio data and the Processing of audio blocks without associated page information;
  • FIG. 11 shows a flow chart to illustrate the mode of operation of the decoder from FIG. 8 with regard to the actual back-filtering
  • FIG. 12 is a schematic diagram illustrating a conventional audio coding scheme with a short delay time
  • FIG. 13 shows a diagram in which, by way of example, a spectrum of an audio signal, a listening threshold thereof and the transfer function of the post filter are shown in the decoder.
  • the audio encoder which is generally indicated at 10, first comprises a data input 12, at which it receives the audio signal to be encoded, which, as will be explained in more detail later with reference to FIG. 5a, consists of a sequence of audio values or samples there is, and a data output at which the coded signal is output, the information content of which is discussed in more detail with reference to FIG. 5b.
  • the audio encoder 10 of FIG. 1 is divided into an irrelevance reduction part 16 and a redundancy reduction part 18.
  • the irrelevance reduction part 16 comprises a device 20 for determining a monitoring threshold, a device 22 for calculating a gain value, a device 24 for calculating a parameterization, and a reference point comparison device 26, a quantizer 28 and a parameterizable pre-filter 30 as well as an input FIFO (first-in-first-out) buffer 32, a buffer or memory 38 and a multiplier or a multip Licensing device 40.
  • the redundancy reduction part 18 comprises a compressor 34 and a bit rate controller 36.
  • Irrelevance reduction part 16 and redundancy reduction part 18 are connected in series in this order between data input 12 and data output 14.
  • the data input 12 is connected to a data input of the device 20 for determining a listening threshold and a data input of the input buffer 32.
  • a data output of the device 20 for determining a monitoring threshold is connected to an input of the device 24 for calculating a parameterization and to a data input of the device 22 for calculating a gain value in order to forward a determined monitoring threshold to the same.
  • the devices 22 and 24 calculate a parameterization or a gain value on the basis of the listening threshold and are connected to the reference point comparison device 26 in order to forward these results to the same.
  • the reference point comparison device 26 forwards the results calculated by the devices 22 and 24 as input parameters or parameterization to the parameterizable pre-filter 30.
  • the parameterizable pre-filter 30 is connected between a data output of the input buffer 32 and a data input of the buffer 38.
  • the multiplier 40 is connected between a data output of the buffer 38 and the quantizer 28.
  • the quantizer 28 forwards multiplied or scaled, but in any case quantized, filtered audio values to the redundancy reduction part 18, to be precise to a data input of the compressor 34.
  • the reference point comparison device 26 forwards information to the redundancy reduction part 18, from which the data is transmitted the parameterizable pre-filter 30 forwarded input parameters can be derived, specifically to a further data input of the compressor 34.
  • the bit rate control is connected via a control connection to a control input of the multiplier 40 in order to do so ensure that the quantized, filtered audio values, as they are obtained from the pre-filter 30, are multiplied by the multiplier 40 by a suitable multiplier, as will be discussed in more detail below.
  • the bit rate controller 36 is connected between a data output of the compressor 34 and the data output 14 of the audio encoder 10 in order to suitably determine the multiplier for the multiplier 40.
  • the multiplier is initially set to an appropriate scaling factor, such as 1.
  • buffer 38 continues to store each filtered audio value to give bit rate controller 36 the opportunity to use the multiplier as described below change another iteration of a block of audio values. If such a change is not indicated by the bit rate controller 36, the buffer 38 can release the memory occupied by this block.
  • the audio signal when it reaches the data input 12, has already been obtained from an analog audio signal by audio signal sampling 50.
  • the audio signal sampling is carried out at a predetermined sampling frequency, which is usually between 32-48 kHz. Consequently, an audio signal is present at data input 12, which consists of a sequence of sampling or audio values.
  • the coding of the audio signal does not take place in a block-based manner, the audio values at the data input 12 are first combined in a step 52 to form audio blocks.
  • the summary of the audio blocks is only for the purpose of determining the listening threshold. le and takes place in an input stage of the device 20 for determining a listening threshold.
  • 5a shows the sequence of samples at 54, each sample being illustrated by a rectangle 56.
  • the samples are numbered for purposes of illustration, only some of the samples of the sequence 54 being shown for reasons of clarity.
  • 128 consecutive samples are combined to form a block, the 128 samples immediately following forming the next block.
  • the combination into blocks could also be carried out differently, for example by overlapping blocks or spaced blocks and blocks with a different block size, although the block size of 128 is again preferred because it is a good compromise between the one high audio quality and, on the other hand, the lowest possible delay time.
  • the incoming audio values are buffered or buffered 54 in the input buffer 32 until the parameterizable pre-filter 30 is compared by the reference point comparison.
  • direction 26 has received input parameters in order to carry out a prefiltration, as will be described below.
  • the device 20 for determining a monitoring threshold begins its processing immediately after sufficient audio values have been received at the data input 12 to form an audio block or to form the next audio block, which the device 20 confirms by a check monitored in step 60. If a complete audio block that can be edited is not yet available, the device 20 waits.
  • the device 20 calculates a monitoring threshold in a step 62 on the basis of a suitable psychoacoustic model in a step 62 based on a suitable psychoacoustic model.
  • a suitable psychoacoustic model in a step 62 based on a suitable psychoacoustic model.
  • the masking threshold which is determined in step 62, is a frequency-dependent function that can vary for successive audio blocks and can also vary significantly from audio signal to audio signal, such as from rock to classical music pieces.
  • the listening threshold specifies a threshold value for each frequency, below which the human ear cannot perceive interference.
  • amplification value a or a parameter set from N parameters x (i) (i 1, ... from the calculated listening threshold M (f) (where f is the frequency). , N).
  • the device 24 now calculates the parameterization aj; such that the transfer function H (f) of the parameterizable pre-filter 30 is approximately equal to the inverse of the amount of the masking threshold M (f), i.e. so that
  • the filter coefficients aj obtained as follows: the inverse discrete Fourier transform of
  • the target autocorrelation function r ⁇ i) gives the frequency for the block at time t. Then the a are obtained by solving the linear system of equations:
  • a lattice structure is preferably used for the filter 30, the filter coefficients for the lattice structure being reflected in parameters are re-parameterized.
  • the filter coefficients for the lattice structure being reflected in parameters are re-parameterized.
  • the device 22 calculates a noise power limit, namely a limit which indicates which noise power the quantizer 28 in may introduce the audio signal filtered by the pre-filter 30 so that the quantization noise after the back or post-filtering on the decoder side is below the listening threshold M (f) or exactly on the same.
  • the device 22 calculates this noise power limit as the area below the square of the amount of the listening threshold M, i.e. as
  • the quantization noise is the noise caused by the quantizer 28.
  • the noise caused by the quantizer 28 is, as will be described later, white noise and is therefore frequency-independent.
  • the quantization noise power is the power of the quantization noise.
  • the device 22 calculates the noise power limit in addition to the gain value a. Furthermore, although it is possible for the reference point comparison device 26 to calculate the noise power limit again from the gain value a obtained from the device 22, it is also possible that In addition to the gain value a of the reference point comparison device 26, the device 22 also immediately transmits the determined noise power limit.
  • the reference point comparison device 26 After calculating the gain value and the parameterization, the reference point comparison device 26 then checks in a step 66 whether the parameterization just calculated differs by more than a predetermined threshold from the current parameterization that was last passed on to the parameterizable pre-filter. If the check in step 66 shows that the parameterization just calculated differs from the current one by more than the predetermined threshold, the filter coefficients just calculated and the gain value or the noise power limit just calculated are temporarily stored in the reference point comparison device 26 for an interpolation which is still to be discussed and the reference point comparison device 26 transfers the filter coefficients that have just been calculated in a step 68 and the gain value that has just been calculated in a step 70 to the pre-filter 30.
  • the node comparison device (26) transfers to the pre-filter 30 in step 72, instead of the parameterization just calculated, only the current node parameterization, ie the parameterization that last led to a positive result in step 66, that is to say that it differed from a previous interpolation point parameterization by more than a predetermined threshold.
  • the process of Fig. 3 returns to processing the next audio block, i.e. to query 60, back.
  • the pre-filter 30 applies this node parameterization to all samples of this audio block located in the FIFO 32, as will be described in more detail below, whereby this current block is removed from the FIFO 32 and the quantizer 28 produces a resultant one Receives audio block from pre-filtered audio values.
  • FIG. 4 shows the mode of operation of the parameterizable pre-filter 30 in more detail in the event that it receives the parameterization and the gain value which have just been calculated because they differ sufficiently from the current reference point parameterization.
  • processing according to FIG. 4 does not take place for each of the successive audio blocks, but rather only for audio blocks in which the associated parameterization differs sufficiently from the current node parameterization.
  • the other audio blocks, as just described are pre-filtered by applying the current reference point parameterization and the associated current amplification value to all samples of these audio blocks.
  • the parameterizable pre-filter 30 now monitors whether a transfer of just calculated filter coefficients from the Node comparison device 26 has taken place or from older node parameterizations. The pre-filter 30 carries out the monitoring 80 until such a transfer has taken place.
  • the parameterizable pre-filter 30 begins processing the current audio block of audio values that is currently in the buffer memory 32, that is to say the one for which the parameterization has just been calculated.
  • FIG. 5a has, for example, illustrated that all audio values 56 before the audio value with the number 0 have already been processed and therefore the memory 32 has already been processed have happened.
  • the processing of the block of audio values before the audio value with the number 0 was triggered at the time because the parameterization that was calculated for the audio block before the block 0, namely x o (i), differs by more than the predetermined threshold from the previously defined to the pre-filter 30 base parameterization.
  • the parameterization xo (i) is therefore a support parameterization, as it is referred to in the present invention.
  • the processing of the audio values in the audio block before the audio value 0 was carried out based on the parameter set a 0 , xo (i).
  • the pre-filter 30 determines in step 84 the noise power limit qi corresponding to the gain value ai. This can be done by the reference point comparison device 26 forwarding this value to the pre-filter 30, or by recalculating this value by the pre-filter 30, as was described with reference to step 64 above.
  • an index j is then initialized to a sample value in a step 86 in order to point to the oldest sample value remaining in the FIFO memory 32 or the first sample value of the current audio block “block 1”, ie in the present example from FIG. 5a Sampling value 128.
  • the parameterizable pre-filter carries out an interpolation between the filter coefficients x 0 and Xi, with parameterization x 0 as a base value at the base with audio value number 127 of the previous block 0 and parameterization xi as base value at the base Audio value number 255 of the current block 1 applies.
  • These audio value positions 127 and 255 are also referred to below as support point 0 and support point 1, the support point parameterizations relating to the support points being indicated by the arrows 90 and 92.
  • the parameterizable pre-filter 30 performs an interpolation between the noise power limit qi and qo in order to obtain an interpolated noise power limit at the scanning position j, ie q (t j ).
  • the parameterizable pre-filter 30 then calculates the gain value for the sampling position j on the basis of the interpolated noise power limit and the quantization noise power, and preferably also the interpolated filter coefficient, namely, for example, depending on the root
  • Quantization noise power . ,. , To which end the execution q (t 3) approximations to step 64 of FIG. 3 is referenced.
  • the parameterizable pre-filter 30 then applies the calculated gain value and the interpolated filter coefficients to the sample at the sample position j in order to obtain a filtered sample value for this sample position, namely s' (t-,).
  • the parameterizable pre-filter 30 checks whether the scanning position j has reached the current interpolation point, ie interpolation point 1, in the case of FIG. 5a the scanning position 255, ie the scanning value for which the parameterizable pre-filter 30 is transmitted. parameterization plus gain value should apply immediately, ie without interpolation. If this is not the case, the parameterizable pre-filter 30 increases or increments the index j by 1, the steps 88-96 being repeated again.
  • step 100 the parameterizable pre-filter applies the gain value last transmitted by the reference point comparison device 26 and the filter coefficients last transmitted by the interpolation point comparator 26 immediately without interpolation to the sample value at the new interpolation point, whereupon the current block, ie in the present case block 1, has been processed and the process again at step 80 with respect to the subsequent block to be processed is carried out, which, depending on whether the parameterization of the next audio block block 2 differs sufficiently from the parameterization x ⁇ (i), may also be this next audio block block 2 or is a later audio block.
  • the purpose of the filtering is to filter the audio signal at the input 12 with an adaptive filter, the transfer function of which is constantly adapted as optimally as possible to the inverse of the listening threshold, which also changes over time.
  • the reason for this is that on the decoder side the back-filtering by an adaptive filter, the transfer function of which is accordingly constantly adapted to the listening threshold, the white quantization noise introduced by quantization of the filtered audio signal, i.e. the quantization noise, which is constant in frequency, shapes, namely adapts to the shape of the listening threshold.
  • the application of the gain value in steps 94 and 100 in the pre-filter 30 consists in multiplying the audio signal or the filtered audio signal, ie the sample values s or the filtered sample values s', by the gain factor.
  • the purpose is to thereby as far as possible the quantization noise, which is inserted into the filtered audio signal by the quantization described below, and which is adapted to the shape of the monitoring threshold on the decoder side set so high that it does not exceed the listening threshold. This can be illustrated by the Parseval 'see formula, according to which the square of a function is equal to the square of the Fourier transform.
  • the quantization noise power is also reduced, namely by the factor a "2 , where a is the gain value. Consequently, by using the gain value in the pre-filter 30, the quantization noise power can be set optimally high, which is synonymous with the fact that the quantization step size increases and thus the number of quantization stages to be encoded is reduced, which in turn increases the compression in the subsequent redundancy reduction part.
  • the effect of the prefilter can be viewed as a normalization of the signal to its masking threshold, so that the level of the quantization disturbances or the quantization noise can be kept constant both in time and in frequency. Since the audio signal is in the time domain, the quantization can therefore be carried out step by step with a uniform constant quantization, as will be described below. In this way, any irrelevance is ideally removed from the audio signal and a lossless compression scheme can be used to also remove the remaining redundancy in the pre-filtered and quantized audio signal, as will be described below.
  • the filter coefficients and gain values a 0 , ai, x 0 , Xi used must of course be available as side information on the decoder side, but this reduces the transmission effort will mean that new filter coefficients and new gain values are not simply reused for each block. Rather, a threshold value check 66 takes place in order to transmit the parameterizations as page information only when there is a sufficient change in parameterization, and otherwise the page information or parameterizations are not transmitted. On the audio blocks for which the parameterizations have been transferred, an interpolation from the old to the new parameterization takes place over the area of these blocks. The filter coefficients are interpolated in the manner described above with reference to step 88.
  • the interpolation with regard to the amplification takes place via a detour, namely via a linear interpolation 90 of the noise power limit q 0 , qi.
  • a detour namely via a linear interpolation 90 of the noise power limit q 0 , qi.
  • the linear interpolation leads to a better hearing result or less audible artifacts with regard to the noise power limit.
  • the filtered sample values output by the parameterizable pre-filter 30 are stored in the buffer 38 and at the same time passed from the buffer 38 to the multiplier 40, where, since it is their first pass, they are initially unchanged, namely with a scaling factor of one are passed through the multiplier 40 to the quantizer 28.
  • the filtered audio values above an upper barrier are cut off in a step 110 and then quantized in a step 112.
  • the two steps 110 and 112 are carried out by the quantizer 28.
  • the two steps 110 and 112 are preferably carried out by the quantizer 28 in one step in that the filtered audio values s' are quantized with a quantization stage function which For example, in a floating point representation, filtered sample values s' are mapped to a plurality of integer quantization level values or indices and, starting from a certain threshold value for the filtered sample values, run flat, so that filtered sample values that are larger than the threshold value are quantized to one and the same quantization level become.
  • a quantization level function is shown in FIG. 7a.
  • the quantized filtered samples are designated ⁇ 'in FIG. 7a.
  • the quantization level function is preferably a quantization level function with a constant step size below the threshold, i.e. the jump to the next quantization level always takes place after a constant interval along the input values S '.
  • the step size to the threshold value is set in such a way that the number of quantization stages preferably corresponds to a power of 2.
  • the threshold value is smaller, so that a maximum value of the displayable range of the floating point representation exceeds the threshold value.
  • the threshold value is that it has been observed that the filtered audio signal, which is output by the pre-filter 30, has individual audio values which add up to very large values due to an unfavorable accumulation of harmonics. It has also been observed that clipping these values, as achieved by the quantization level function shown in Fig. 7a, results in high data reduction, but only a minor degradation in audio quality. Rather, these isolated points in the filtered audio signal are created artificially by the frequency-selective filtering in the parameterizable filter 30, so that cutting them off only slightly impairs the audio quality. A somewhat more concrete example of the quantization level function shown in FIG.
  • Fig. 7a would be one which rounds all filtered sample values s' to the nearest integer up to the threshold value, and from then on quantizes all the filtered sample values above it to the highest quantization level, such as eg 256. This case is shown in Fig. 7a.
  • FIG. 7b Another example of a possible quantization level function would be that shown in Fig. 7b.
  • the quantization level function of FIG. 7b corresponds to that of FIG. 7a.
  • the quantization stage function continues with a slope that is smaller than the slope in the area below the threshold value.
  • the quantization step size is larger above the threshold value. This achieves an effect similar to that of the quantization function of FIG. 7a, but with more effort on the one hand due to the different step sizes of the quantization level function above and below the threshold value and on the other hand an improved audio quality, since very high filtered audio values s' are not completely cut off , but only be quantized with a larger quantization step size.
  • the compressor 34 therefore makes a first compression attempt and compresses side information including the gain values a o and ai at the interpolation points, such as 127 and 255, and the filter coefficients. ten x 0 and x ⁇ at the support points and the quantized, filtered sample values ⁇ 'in a preliminary filtered signal.
  • the compressor 34 is a loss-free encoder, such as a Huffman or arithmetic encoder with or without prediction and / or adaptation.
  • the memory 38 through which the sampled audio values ⁇ 'pass, serves as a buffer for a suitable block size, with which the compressor 34 processes the quantized, filtered and, if necessary, scaled audio values ⁇ ' output by the quantizer 28 as described below.
  • the block size may differ from the block size of the audio blocks as used by the device 20.
  • the bit rate controller 36 controlled the multiplier 40 with a multiplier of 1, so that the filtered audio values from the pre-filter 30 pass unchanged to the quantizer 28 and from there to the compressor 34 as quantized, filtered audio values.
  • the compressor 34 monitors whether a certain compression block size, ie a certain number of quantized, sampled audio values, has been encoded in the preliminary coded signal or whether further quantized, filtered audio values ⁇ 'in the current preliminary coded signal are to be coded. If the compression block size has not been reached, the compressor 34 continues to perform the current compression 114.
  • the bit rate controller 36 checks in a step 118 whether the bit quantity required for the compression is larger than a bit quantity prescribed by a desired bit rate. If this is not the case, the bit rate controller 36 checks in a step 120 whether the required bit quantity is smaller than the bit quantity prescribed by the desired bit rate. If this is the case, the bit rate controller 36 adds fill bits to the coded signal in step 122 until the prescribed bit quantity is reached by the desired bit rate. The coded signal is then output in step 124.
  • bit rate controller 36 could send the compression block of filtered audio values ⁇ ', which is still stored in the memory 38 and is the basis for the compression, multiplied by a multiplier greater than 1 by the multiplier 40 to the quantizer 28 in order to repeat the steps 110-118 forward until the bit quantity prescribed by the desired bit rate is reached, as indicated by a dashed step 125.
  • step 118 if the check in step 118 reveals that the required bit quantity is greater than that prescribed by the desired bit rate, the bit rate controller 36 changes the multiplier for the multiplier 40 to a factor between 0 and 1 exclusively. It does this in step 126.
  • the bit rate controller 36 ensures that the memory 38 outputs the last compression block of the filtered audio values ⁇ 'on which the compression is based, the latter then being multiplied by the factor set in step 126 and fed again to the quantizer 28 steps 110-118 are then carried out again and the previously coded signal is rejected.
  • step 114 the factor used in step 126 (or step 125) is of course also incorporated into the coded signal.
  • step 126 The sense of the procedure after step 126 is that the factor increases the effective step size of the quantizer 28. This means that the resulting quantization noise is evenly above the masking threshold, which leads to audible interference or audible rem noise, but results in a reduced bit rate. If, after repeating steps 110-116 in step 118, it is again determined that the required bit quantity is greater than that prescribed by the desired bit rate, the factor is further reduced in step 126, etc.
  • the next compression block is carried out by the subsequent quantized, filtered audio values ⁇ '.
  • FIG. 5b once again illustrates the resulting encoded signal, indicated generally at 130.
  • the encoded signal includes page information and intermediate main data.
  • the side information includes information from which the value of the gain value and the value of the filter coefficients can be derived for special audio blocks, namely audio blocks in which there has been a significant change in the filter coefficients as a result of audio blocks. If necessary, the side information also includes further information relating to the gain value used for the bit control. Because of the mutual dependency between the gain value and the noise power limit q, the side information can optionally include the noise power limit q # or only the latter in addition to the gain value a # for a support point #.
  • the side information is preferably arranged within the coded signal in such a way that the side information on filter coefficients and associated gain value or associated noise level are arranged in front of the main data for the audio block of quantized, filtered audio values ⁇ ', from which these filter coefficients with the associated gain value or associated noise power limit have been derived, i.e. the side information a 0 , x 0 (i) after the block -1 and the Side information ai, x x (i) after block 1.
  • the main data ie the quantized, filtered audio values ⁇ '
  • the main data are exclusive of an audio block of the type in which there is a significant change in the filter coefficients as a result of audio blocks up to and including the next audio block of this type, in Fig. 5b for example the audio values ⁇ '(t 0 ) - ⁇ ' (t 255 ), always between the side information block 132 to the former of these two audio blocks (block -1) and the another side information block 134 to the second of these two audio blocks (block 1).
  • the audio values ⁇ '(t 0 ) - ⁇ ' (t ⁇ 27 ) are as in v 5a mentioned above was obtained or decodable solely by means of the side information 132, while the audio values ⁇ '(t ⁇ 28 ) - ⁇ ' (t 255 ) by interpolation using the side information 132 as reference values at the reference point with the sample number 127 and by means of the side information 134 as base values at the base with the sample number 255 have been obtained and can therefore only be decoded with both side information.
  • the side information relating to the gain value or the noise power limit and the filter coefficients is not always integrated independently in each side information block 132 and 134. Rather, this page information is transmitted in differences from the previous page information block.
  • the side information block 132 contains, for example, gain value a 0 and filter coefficient x 0 with respect to the support point at time t_ ⁇ . In the page information block 132, these values can be derived from the block itself. However, from page information block 134 are the Page information regarding the support point at time t 255 can no longer be derived from this block alone.
  • the side information block 134 only contains information about differences of the gain value ai of the support point at time t 2 ss to the gain value of the support point at time t 0 and the differences of the filter coefficients Xi to the filter coefficients x 0 .
  • the page information block 134 consequently only contains the information relating to ai-ao and x ⁇ (i) -xo (i).
  • the filter coefficients and the gain value or the noise power limit should be transmitted in full and not just as a difference to the previous interpolation point, eg every second, in order to enable a receiver or decoder to latch into a running stream of coding data, as will be discussed below.
  • an exemplary embodiment for an audio decoder is described below which is suitable for decoding the encoded signal generated by the audio encoder 10 of FIG. 1 into a decoded, playable or further processable audio signal.
  • the decoder indicated generally at 210, includes a decompressor 212, a FIFO memory 214, a multiplier 216 and a parameterizable post filter 218.
  • Decompressors 212, FIFO memory 214, multiplier 216 and parameterizable post filter 218 are connected in this order between a data input 220 and a data output 222 of the decoder 210, the coded signal is obtained at the data input 220 and the decoded audio signal is output at the data output 222, which only differs from the original audio signal at the data input 12 of the audio encoder 10 by the quantization noise generated by the quantizer 28 in the audio encoder 10.
  • the decompressor 212 is connected at a further data output to a control input of the multiplier 216 in order to forward a multiplier to the same, and via a further data output to a parameterization input of the parameterizable post filter 218.
  • the decompressor 212 first decompresses the compressed signal present at the data input 220 in a step 224 in order to supply the quantized, filtered audio data, namely the sample values ⁇ ′, and the associated page information in the page information blocks 132 , 134, which indicate the filter coefficients and gain values or, instead of the gain values, the noise power limits at the reference points.
  • the decompressor 212 checks the decompressed signal in the order of its arrival whether it contains page information with filter coefficients, in a self-contained form without reference to a previous page information block. In other words, the decompressor 212 searches for the first page information block 132. As soon as the decompressor 212 has found what it is looking for, the quantized, filtered audio values ⁇ 'are stored in the FIFO memory 214 in a step 228. saved.
  • step 228 If a complete audio block of quantized, filtered audio values ⁇ 'has been stored during step 228 without a side information block immediately following, then this is first of all step 228 by means of the information about parameterization and gain value contained in the page information received in step 226 post-filtered in the post-filter and amplified in multiplier 216, whereby it is decoded and thus the associated decoded audio block is obtained.
  • the decompressor 212 monitors the decompressed signal for the appearance of any kind of page information block, namely with absolute filter coefficients or filter coefficient differences towards a previous page information block.
  • the decompressor 212 would recognize the appearance of the side information block 134 upon detection of the side information block 132 in step 226 in step 230.
  • the block of quantized, filtered audio values ⁇ '(t 0 ) - ⁇ ' (t ⁇ 27 ) would have been decoded in step 228, using the side information 132.
  • Step 232 is freely omitted if the current page information block is a self-contained page information block without differences, which, as described above, is the case, for example, every second can.
  • side information blocks 132 in which the parameter values can be derived absolutely, ie without relation to another side information block, are arranged at sufficiently small intervals so that the switch-on time or the dead time when Switching on the audio encoder 210 is not too great in the case of a radio transmission or radio transmission, for example.
  • the number of intervening side information blocks 134 with the difference values are also arranged in a fixed predetermined number between the side information blocks 132 so that the decoder knows when a side information block of the type 132 is expected again in the encoded signal.
  • the different types of page information blocks are indicated by corresponding flags.
  • a sample index j is initially initialized to 0 in step 234. This value corresponds to the sample position of the first sample value in the audio block currently remaining in the FIFO 214, to which the current page information relates.
  • Step 234 is performed by the parameterizable post filter 218.
  • the post filter 218 then carries out a calculation of the noise power limit at the new support point in a step 236, this step corresponding to step 84 of FIG.
  • the post filter 218 then performs interpolations with respect to the filter coefficients and noise power limits that correspond to the interpolations 88 and 90 of FIG. 4.
  • the subsequent calculation of the gain value for the sample position j based on the interpolated noise power limit and the interpolated filter coefficients from steps 238 and 240 in step 242 corresponds to step 92 of FIG. 4.
  • the post filter 218 then applies the gain value calculated in step 242 and the interpolated filter coefficients to the sample value at the sample position j. This step differs from step 94 of FIG.
  • the interpolated filter coefficients are applied to the quantized, filtered sample values ⁇ 'in such a way that the transfer function of the parameterizable post filter does not correspond to the inverse of the monitoring threshold, but to the monitoring threshold itself.
  • the post-filter does not perform a multiplication by the gain value, but a division by the gain value on the quantized, filtered sample value ⁇ 'or already filtered back, quantized, filtered sample value at position j.
  • step 248 If the post filter 218 has not yet reached the current support point with the scanning position j, which checks the same in step 246, it increments the scanning position index j in step 248 and starts steps 238-246 again. Only when the support point is reached does it apply the gain value and the filter coefficients of the new support point to the sample value at the support point, namely in step 250.
  • the application comprises, instead of multiplication, division by means of the gain value and filtering a transfer function equal to the listening threshold and not the inverse of the latter.
  • the current audio block is decoded by interpolation between two reference point parameterizations.
  • the filtering and the application of the gain value in steps 218 and 224 adapt the noise introduced by the quantization during the coding in steps 110 and 112 both in form and in height to the listening threshold. It should also be pointed out that in the event that the quantized, filtered audio values have been subjected to a further multiplication in step 126 due to the bit rate control prior to encoding in the encoded signal, this factor can also be taken into account in steps 218 and 224 , Alternatively, the audio values obtained by the process of FIG. 11 can of course be subjected to a further multiplication in order to amplify the audio values weakened again for the sake of a low bit rate.
  • the parameterization intended for an audio block or the gain value determined for this audio block can also be applied directly to another value, such as the audio value in the middle of the audio block, such as the 64th audio value in the case of the above block size of 128 audio values.
  • the present invention has been described above with reference to a specific audio coding scheme that enables short delay times, the present invention is of course also applicable to other audio codes.
  • an audio coding scheme would also be conceivable in which the coded signal consists of the quantized, filtered audio values per se without any redundancy. danzreductions is carried out. Accordingly, it would also be conceivable to carry out the frequency-selective filtering differently from the manner described above, namely on the encoder side with a transfer function equal to the inverse of the listening threshold and on the decoder side with a transfer function equal to the listening threshold.
  • the present invention is not limited to audio signals. It is also applicable to other information signals, namely for example video signals consisting of a sequence of frames, i.e. a sequence of pixel arrays.
  • the above audio coding scheme provides a possibility for limiting the bit rate in an audio encoder with a very short delay time.
  • the bit rate peaks that arise during coding depending on the audio signal are avoided by limiting the output value range of the pre-filter.
  • an upper limit for the bit rate of the transmission can always be observed, which often for example exists in wireless transmission media.
  • the change in the quantization level function above the threshold is a suitable means of limiting the bit rate to the permissible maximum.
  • the encoder consisted of a pre-filter that appropriately shapes the audio signal, a quantizer with a quantizer level height, followed by an entropy encoder.
  • the quantizer generates values, which are also called indices.
  • higher indices also mean a higher bit rate associated therewith, which was avoided, however, by limiting the area of the indices (FIG. 7a) or thinning them out (FIG. 7b), but with the possibility of deteriorating the audio quality.
  • the quantizer would respond to a signal, for example, in order to either keep the quantization stage function constant 7a or 7b, so that the quantizer could be informed by the signal to carry out the quantization step reduction above the threshold value or the cutting off above the threshold value with a slight deterioration in audio quality.
  • the threshold value could be gradually be gradually reduced. In this case, the threshold reduction instead of the factor reduction of step 126 could be performed.
  • the preliminarily compressed signal could only be subjected to a selective threshold quantization in a modified step 126 if the bit rate is still too high (118).
  • the filtered audio values would then be quantized using the quantization level function, which has a flatter course above the audio threshold. Further bit rate reductions could be carried out in the modified step 126 by reducing the threshold value and thus a further modification of the quantization level function.
  • the quantization scheme according to the invention can also be implemented in software.
  • the implementation can take place on a digital storage medium, in particular a floppy disk or a CD with electronically readable control signals, which can cooperate with a programmable computer system in such a way that the corresponding method is carried out.
  • the invention thus also consists in a computer program product with program code stored on a machine-readable carrier for carrying out the method according to the invention when the computer program product runs on a computer.
  • the invention can thus be implemented as a computer program with a program code for carrying out the method if the computer program runs on a computer.
  • the scheme according to the invention can also be implemented in software.
  • the implementation can take place on a digital storage medium, in particular a floppy disk or a CD with electronically readable control signals, which can interact with a programmable computer system in such a way that the corresponding method is carried out.
  • the invention thus also consists in a computer program product with program code stored on a machine-readable carrier for carrying out the method according to the invention when the computer program product runs on a computer.
  • the invention can thus be implemented as a computer program with a program code for carrying out the method if the computer program runs on a computer.

Abstract

Ein Quantisieren eines Informationssignals einer Folge von Informationswerten umfaßt das frequenzselektive Filtern der Folge von Informationswerten, um eine Folge von gefilterten Informationswerten zu erhalten, sowie das Quantisieren der gefilterten Informationswerte, um eine Folge von quantisierten Informationswerten zu erhalten, mittels einer Quantisierungsstufenfunktion, die die gefilterten Informationswerte auf die quantisierten Informationswerte abbildet, und deren Verlauf unterhalb eines Schwelleninformationswerts steiler ist als oberhalb des Schwelleninformationswerts.

Description

Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
Beschreibung
Die vorliegende Erfindung bezieht sich allgemein auf Quan- tisierer bzw. die Quantisierung von Informationssignalen und in Ausführungsbeispielen auf die Quantisierung von Audiosignalen, wie sie beispielsweise zur Datenkompression von Audiosignalen bzw. zur Audiocodierung verwendet wird. In einem speziellen Ausführungsbeispiel bezieht sich die vorliegende Erfindung auf eine Audiocodierung mit kurzer Verzögerungszeit .
Das derzeit bekannteste Audiokompressionsverfahren ist das MPEG-1 Layer III. Bei diesem Kompressionsverfahren werden die Abtast- bzw. Audiowerte eines Audiosignals verlustbehaftet in ein codiertes Signal codiert. Anders ausgedrückt werden bei der Kompression Irrelevanz und Redundanz des ursprünglichen Audiosignals reduziert bzw. idealer Weise entfernt. Um dies zu erzielen, werden durch ein psychoakus- tisches Modell simultane und zeitliche Maskierungen erkannt, d.h. es wird eine sich zeitlich ändernde, vom Audiosignal abhängige Maskierungsschwelle berechnet bzw. bestimmt, die angibt, ab welcher Lautstärke Töne einer bestimmten Frequenz für das menschliche Gehör erst wahrnehmbar sind. Diese Information wird wiederum zur Codierung des Signals verwendet, indem die Spektralwerte des Audiosignals abhängig von der Maskierungsschwelle genauer, weniger genau oder gar nicht quantisiert und in das codierte Signal eingebunden werden.
Audiokompressionsverfahren, wie das MP3-Format, erfahren dann eine Grenze in ihrer Anwendbarkeit, wenn es darum geht, Audiodaten über einen bitratenbegrenzten Übertragungskanal einerseits komprimiert, andererseits aber mit möglichst geringer Verzögerungszeit zu übertragen. Bei einigen Anwendungen spielt die Verzögerungszeit keine Rolle, wie z.B. bei der Archivierung von Audioinformationen. Audiocoder mit niedriger Verzögerung, manchmal auch „Ultra Low Delay Coder" genannt, sind jedoch dort notwendig, wo es um zeitkritische Übertragungen von Audiosignalen geht, wie z.B. beim Tele-Conferencing, bei drahtlosen Lautsprechern oder Mikrophonen. Für diese Anwendungsgebiete wird in dem Artikel von Schuller G. usw. „Perceptual Audio Coding using Adaptive Pre- and Post-Filters and Lossless Compression", IEEE Transactions on Speech and Audio Proc- essing, Bd. 10, Nr. 6, September 2002, S. 379 - 390, eine Audiocodierung vorgeschlagen, bei der die Irrelevanzreduktion und die Redundanzreduktion nicht basierend auf einer einzigen Transformation, sondern auf zwei getrennten Transformationen durchgeführt werden.
Das Prinzip wird im folgenden Bezug nehmend auf die Fig. 12 und 13 erläutert. Die Codierung geht von einem Audiosignal 902 aus, das bereits abgetastet worden ist und deshalb bereits als eine Folge 904 von Audio- bzw. Abtastwerten 906 vorliegt, wobei durch einen Pfeil 908 die zeitliche Reihenfolge der Audiowerte 906 angedeutet ist. Für aufeinanderfolgende Blöcke von Audiowerten 906, die mit aufsteigender Nummerierung mit „Block#" gekennzeichnet sind, wird mittels eines psychoakustischen Modells eine Mithörschwelle berech- net. Fig. 13 zeigt beispielsweise ein Diagramm, bei dem über die Frequenz f mit der Kurve a das Spektrum eines Signalblocks aus 128 Audiowerten 906 und bei b die Maskierungsschwelle, wie sie durch ein psychoakustisches Modell berechnet worden ist, in logarithmischen Einheiten aufge- tragen ist. Die Maskierungsschwelle zeigt, wie bereits erwähnt, an, bis zu welcher Intensität Frequenzen für das menschliche Ohr unhörbar sind, nämlich alle Töne unterhalb der Maskierungsschwelle b. Basierend auf den für jeden Block berechneten Mithörschwellen wird nun eine Irrelevanz- reduktion durch Steuerung eines parametrisierbaren Filters gefolgt von einem Quantisierer erzielt. Für ein parametri- sierbares Filter wird eine Parametrisierung derart berechnet, daß die Frequenzantwort desselben dem Inversen des Betrags der Maskierungsschwelle entspricht. Diese Paramet- risierung ist in Fig. 12 durch x#(i) angedeutet.
Nach der Filterung der Audiowerte 906 erfolgt eine Quanti- sierung mit konstanter Schrittweite, beispielsweise eine Rundungsoperation auf die nächste Ganzzahl. Das hierdurch hervorgerufene Quantisierungsrauschen ist weißes Rauschen. Decoderseitig wird das gefilterte Signal wieder mit einem parametrisierbaren Filter „rücktransformiert", dessen Übertragungsfunktion auf den Betrag der Maskierungsschwelle selbst eingestellt wird. Hierdurch wird nicht nur das gefilterte Signal wieder dekodiert sondern auch das Quantisierungsrauschen decoderseitig an die Form der Maskierungsschwelle angepaßt. Damit das Quantisierungsrauschen mög- liehst genau der Maskierungsschwelle entspricht, wird codiererseitig zu jedem Parametersatz bzw. zu jeder Para- metrisierung ferner ein Verstärkungswert a# berechnet, der vor der Quantisierung auf das gefilterte Signal angewendet wird. Damit decodiererseitig die Rücktransformation durch- geführt werden kann, werden der Verstärkungswert a und die Parametrisierung x als Seiteninformationen 910 neben den eigentlichen Hauptdaten, nämlich den quantisierten, gefilterten Audiowerten 912, zum Codierer übertragen. Zur Redundanzreduktion 914 werden diese Daten, d.h. Seiteninformati- onen 910 und Hauptdaten 912, noch einer verlustlosen Kompression, nämlich einer Entropiecodierung, unterzogen, wodurch das codierte Signal erhalten wird.
Obiger Artikel schlägt als Blockgröße eine Größe von 128 Abtastwerten 906 vor. Hierdurch wird eine relativ kurze Verzögerung von 8 ms bei 32 kHz Abtastrate ermöglicht. Bezüglich der detaillierten Implementierung wird in dem Artikel noch beschrieben, daß zur Effizienzsteigerung der Seiteninformationscodierung die Seiteninformationen, näm- lieh die Koeffizienten x# und a# nur dann übertragen werden, wenn genügend Änderung im Vergleich zu einem vorher übertragenen Parametersatz vorhanden ist, d.h. wenn die Änderung einen bestimmten Schwellwert überschreitet. Zudem wird beschrieben, daß die Implementierung vorzugsweise so vorgenommen wird, daß ein aktueller Parametersatz nicht unmittelbar auf alle zu dem jeweiligen Block gehörenden Abtastwerte angewendet wird, sondern daß eine lineare Interpolation der Filterkoeffizienten x# verwendet wird, um hörbare Artefakte zu vermeiden. Um die lineare Interpolation der Filterkoeffizienten durchzuführen, wird eine Lattice-Struktur für das Filter vorgeschlagen, um das Auftreten von Instabilitäten zu verhindern. Für den Fall, daß ein codiertes Signal mit einer gesteuerten Bitrate erwünscht ist, schlägt der Artikel noch vor, das gefilterte und mit dem zeitabhängigen Verstärkungsfaktor a skalierte Signal selektiv noch mit einem Faktor ungleich 1 zu multiplizieren bzw. zu schwächen, so daß zwar hörbare Störungen entstehen, aber die Bitrate an aufwendig zu codierenden Stellen des Audiosignals reduziert werden kann.
Obwohl das in dem oben zitierten Artikel beschriebene Audiocodierungsschema die Verzögerungszeit für viele Anwen- düngen bereits ausreichend reduziert, besteht ein Problem bei obigem Schema darin, daß aufgrund der Notwendigkeit, die Maskierungsschwelle bzw. die Übertragungsfunktion des codiererseitigen Filters, im folgenden als Prefilter bezeichnet, übertragen zu müssen, der Übertragungskanal relativ hoch belastet wird, obgleich ja die Filterkoeffizienten nur bei Überschreiten einer vorbestimmten Schwelle übertragen werden.
Ein weiterer Nachteil obigen Codierschemas besteht darin, daß aufgrund der Tatsache, daß die Maskierungsschwelle bzw. das Inverse hiervon durch den zu übertragenden Parametersatz x# decodierseitig zur Verfügung gestellt werden muß, ein Kompromiß zwischen einerseits einer möglichst niedrigen Bitrate bzw. einem hohen Kompressionsverhältnis und ande- rerseits einer möglichst genauen Approximation bzw. Para- metrisierung der Maskierungsschwelle bzw. dem Inversen hiervon zu treffen ist. Unvermeidlich ist es deshalb, daß das durch obiges Audiocodierschema an die Maskierungs- schwelle angepaßte Quantisierungsrauschen an einigen Frequenzbereichen die Maskierungsschwelle überschreitet und deshalb für den Hörer zu hörbaren Audiostörungen führt. Fig. 13 zeigt beispielsweise mit der Kurve c die parametri- sierte Frequenzantwort des decoderseitigen parametrisierbaren Filters. Wie es zu sehen ist, gibt es Bereiche, an denen die Übertragungsfunktion des decoderseitigen Filters, im folgenden auch als Postfilter bezeichnet, die Maskierungsschwelle b überschreitet. Das Problem vergrößert sich nun dadurch, daß die Parametrisierung nur intermittierend bei genügend Änderung zwischen den Parametrisierungen übertragen und dazwischen interpoliert wird. Eine Interpolation der Filterkoeffizienten x#, wie in dem Artikel vorgeschlagen, allein führt bei Konstanthalten des Verstärkungswertes a# von Stützstelle zu Stützstelle bzw. von neuer Parametrisierung zu neuer Parametrisierung zu hörbaren Störungen. Auch wenn die in dem Artikel vorgeschlagene Interpolation auch auf den Seiteninformationswert a#, d.h. die übertragenen Verstärkungswerte, angewendet wird, können in dem decodiererseitig ankommenden Audiosignal hörbare Audioartefakte verbleiben.
Ein weiteres Problem bei dem Audiocodierschema nach Fig. 12 bzw. 13 besteht darin, daß das gefilterte Signal aufgrund der frequenzselektiven Filterung eine nicht vorhersehbare Form annehmen kann, bei der sich insbesondere aufgrund einer zufälligen Überlagerung vieler einzelner Oberwellen ein einzelner oder einzelne Audiowerte des codierten Signals zu sehr hohen Werten aufsummieren, die aufgrund ihres seltenen Auftretens wiederum bei der anschließenden Redundanzreduktion zu einem schlechteren Kompressionsverhältnis führen.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein Verfahren und eine Vorrichtung zum Quantisieren eines Informationssignals zu schaffen, so daß bei nur geringfügiger Qualitätsverschlechterung des ursprünglichen Informati- onssignals eine höhere Datenkompression des Informationssignals realisierbar ist.
Diese Aufgabe wird durch ein Verfahren gemäß Anspruch 12 und eine Vorrichtung gemäß Anspruch 1 gelöst.
Ein erfindungsgemäßes Quantisieren eines Informationssignals einer Folge von Informationswerten umfaßt das frequenzselektive Filtern der Folge von Informationswerten, um eine Folge von gefilterten Informationswerten zu erhalten, sowie das Quantisieren der gefilterten Informationswerte, um eine Folge von quantisierten Informationswerten zu erhalten, mittels einer Quantisierungsstufenfunktion, die die gefilterten Informationswerte auf die quantisierten Informationswerte abbildet, und deren Verlauf unterhalb eines Schwelleninformationswerts steiler ist als oberhalb des Schwelleninformationswerts.
Es ist beobachtet worden, daß durch das frequenzselektive Filtern eines Audiosignals in dem resultierenden gefilterten Informationssignal künstlich erzeugte Artefakte entstehen, an denen einzelne Informationswerte aufgrund einer zufälligen konstruktiven Interferenz aller oder vieler Oberwellen Werte annehmen, die bedeutend höher als die maximalen Werte des ursprünglichen Signals sind, wie z.B. mehr als zweimal so hoch. Es ist nun der Kerngedanke der vorliegenden Erfindung, daß ein Abschneiden des gefilterten Informationssignals oberhalb einer geeigneten Schwelle, die beispielsweise zweimal so viel wie der größte mögliche Wert des zu filternden ursprünglichen Informationssignals beträgt, so daß die durch das frequenzselektive Filtern künstlich erzeugten Artefakte aus dem gefilterten Informationssignal entfernt bzw. geglättet werden, nach Rückfilterung kaum zu einer Beeinträchtigung der Qualität des nach Quantisierung rückgefilterten Informationssignals führt, wohingegen aber das Abschneiden oder das Vergrößern der Quantisierungsschrittweite oberhalb einer geeigneten Schwelle enorme Einsparungen in einer Bitdarstellung des gefilterten Informationssignals bietet.
Gemäß einem bevorzugten Ausführungsbeispiel ist das Infor- mationssignal ein Audiosignal, bei dem die selektive Quantisierung ober- bzw. unterhalb einer bestimmten Schwelle zu einer kaum hörbaren Audioqualitätsverringerung bei gleichzeitiger enormer Reduzierung der Bitdarstellung führt.
Die Quantisierungsstufenfunktion kann hierzu alternativ vorgesehen sein, um oberhalb des Schwellwertes alle Audiowerte auf eine höchste Quantisierungsstufe zu quantisieren, oder es wird eine Quantisierungsstufenfunktion verwendet, die oberhalb des Schwellwertes flacher verläuft bzw. ober- halb des Schwellwertes eine größere Quantisierungsschrittweite aufweist, so daß die künstlich erzeugten Artefakte gröber quantisiert werden.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen näher erläutert. Es zeigen:
Fig. 1 ein Blockschaltbild eines Audiocodierers gemäß einem Ausführungsbeispiel der vorliegenden Erfin- düng;
Fig. 2 ein Flußdiagramm zur Veranschaulichung der Arbeitsweise des Audiocodierers von Fig. 1 am Dateneingang;
Fig. 3 ein Flußdiagramm zur Veranschaulichung der Arbeitsweise des Audiocodierers von Fig. 1 im Hinblick auf die Auswertung des eingehenden Audiosignals durch ein psychoakustisches Modell;
Fig. 4 ein Flußdiagramm zur Veranschaulichung der Arbeitsweise des Audiocodierers von Fig. 1 im Hinblick auf die Anwendung der durch das psychoakus- tische Modell erhaltenen Parameter auf das eingehende Audiosignal ;
Fig. 5a ein schematisches Diagramm zur Veranschaulichung des eingehenden Audiosignais, der Folge von Audiowerten, aus der dasselbe besteht, und der Arbeitsschritte von Fig. 4 in Relation zu den Audiowerten;
Fig. 5b ein schematisches Diagramm zur Veranschaulichung des Aufbaus des codierten Signals;
Fig. 6 ein Flußdiagramm zur Veranschaulichung der Arbeitsweise des Audiocodierers von Fig. 1 im Hin- blick auf die Endverarbeitung bis zum codierten Signal;
Fig. 7a ein Diagramm n dem ein Ausfuhrungsbeispiel für eine Quantisierungsstufenfunktion gezeigt ist;
Fig. 7b ein Diagramm in dem ein weiteres Ausfuhrungsbeispiel für eine Quantisierungsstufenfunktion gezeigt ist;
Fig. 8 ein Blockschaltbild eines Audiodecodierers, der zur Decodierung eines durch den Audiocodierer von Fig. 1 codierten Audiosignais in der Lage ist, gemäß einem Ausfuhrungsbeispiel der vorliegenden Erfindung;
Fig. 9 ein Flußdiagramm zur Veranschaulichung der Arbeitsweise des Decodierers von Fig. 8 am Dateneingang;
Fig. 10 ein Flußdiagramm zur Veranschaulichung der Arbeitsweise des Decodierers von Fig. 8 im Hinblick auf die Zwischenspeicherung der vordecodierten, quantisierten, gefilterten Audiodaten und der Verarbeitung der Audioblöcke ohne zugehörige Seiteninformationen;
Fig. 11 ein Flußdiagramm zur Veranschaulichung der Ar- beitsweise des Decodierers von Fig. 8 im Hinblick auf die eigentliche Rückfilterung;
Fig. 12 ein schematisches Diagramm zur Veranschaulichung eines herkömmlichen Audiocodierschemas mit kurzer Verzögerungszeit; und
Fig. 13 ein Diagramm, in dem exemplarisch ein Spektrum eines Audiosignals, eine Mithörschwelle desselben und die Übertragungsfunktion des Postfilters im Decodierer gezeigt sind.
Fig. 1 zeigt einen Audiocodierer gemäß einem Ausführungsbeispiel der vorliegenden Erfindung. Der Audiocodierer, der allgemein mit 10 angezeigt ist, umfaßt zunächst einen Dateneingang 12, an dem derselbe das zu codierende Audiosignal empfängt, das, wie es später Bezug nehmend auf Fig. 5a noch näher erläutert werden wird, aus einer Folge von Audiowerten bzw. Abtastwerten besteht, sowie einen Datenausgang, an dem das codierte Signal ausgegeben wird, dessen Informationsinhalt Bezug nehmend auf Fig. 5b näher erörtert wird.
Der Audiocodierer 10 von Fig. 1 gliedert sich in einen Irrelevanzreduktionsteil 16 und einen Redundanzreduktions- teil 18. Der Irrelevanzreduktionsteil 16 umfaßt eine Einrichtung 20 zum Ermitteln einer Mithörschwelle, eine Einrichtung 22 zur Berechnung eines Verstärkungswertes, eine Einrichtung 24 zur Berechnung einer Parametrisierung, eine Stützstellenvergleichseinrichtung 26, einen Quantisierer 28 und ein parametrisierbares Prefilter 30 sowie einen Ein- gangs-FIFO- (first-in-first-out ) Puffer 32, einen Buffer oder Speicher 38 und einen Multiplizierer oder eine Multip- liziereinrichtung 40. Der Redundanzreduktionsteil 18 umfaßt einen Komprimierer 34 und eine Bitratensteuerung 36.
Irrelevanzreduktionsteil 16 und Redundanzreduktionsteil 18 sind seriell in dieser Reihenfolge zwischen Dateneingang 12 und Datenausgang 14 geschaltet. Insbesondere ist der Dateneingang 12 mit einem Dateneingang der Einrichtung 20 zum Ermitteln einer Mithörschwelle und einem Dateneingang des Eingangspuffers 32 verbunden. Ein Datenausgang der Einrich- tung 20 zum Ermitteln einer Mithörschwelle ist mit einem Eingang der Einrichtung 24 zur Berechnung einer Parametrisierung sowie mit einem Dateneingang der Einrichtung 22 zur Berechnung eines Verstärkungswertes verbunden, um an dieselben eine ermittelte Mithörschwelle weiterzuleiten. Die Einrichtungen 22 und 24 berechnen basierend auf der Mithörschwelle eine Parametrisierung bzw. einen Verstärkungswert und sind mit der Stützstellenvergleichseinrichtung 26 verbunden, um an dieselbe diese Ergebnisse weiterzuleiten. Die Stützstellenvergleichseinrichtung 26 leitet je nach einem Vergleichsergebnis, wie es im folgenden noch erörtert werden wird, die von den Einrichtungen 22 und 24 berechneten Ergebnisse als Eingangsparameter bzw. Parametrisierung an das parametrisierbare Prefilter 30 weiter. Das paramet- risierbare Prefilter 30 ist zwischen einen Datenausgang des Eingangspuffers 32 und einen Dateneingang des Buffers 38 geschaltet. Zwischen einen Datenausgang des Buffers 38 und den Quantisierer 28 ist der Multiplizierer 40 geschaltet. Der Quantisierer 28 leitet an den Redundanzreduktionsteil 18 gegebenenfalls multiplizierte bzw. skalierte, auf jeden Fall aber quantisierte, gefilterte Audiowerte weiter, und zwar genau genommen an einen Dateneingang des Komprimierers 34. Die Stützstellenvergleichseinrichtung 26 leitet an den Redundanzreduktionsteil 18 Informationen weiter, aus denen die an das parametrisierbare Prefilter 30 weitergeleiteten Eingangsparameter herleitbar sind, und zwar genau genommen an einen weiteren Dateneingang des Komprimierers 34. Die Bitratensteuerung ist über eine Steuerverbindung mit einem Steuereingang des Multiplizierer 40 verbunden, um dafür zu sorgen, dass die quantisierten, gefilterten Audiowerte, wie sie von dem Prefilter 30 erhalten werden, durch den Multiplizierer 40 mit einem geeigneten Multiplikator multipliziert werden, wie es im folgenden noch detaillierter erör- tert wird. Die Bitratensteuerung 36 ist zwischen einen Datenausgang des Komprimierers 34 und den Datenausgang 14 des Audiocodierers 10 geschaltet, um den Multiplikator für den Multiplizierer 40 geeignet zu bestimmen. Beim ersten Durchlauf jeden Audiowerts durch den Quantisierer 40 ist der Multiplikator zunächst auf einen geeigneten Skalierungsfaktor eingestellt, wie z.B. 1. Der Buffer 38 speichert jedoch weiterhin jeden gefilterten Audiowert, um der Bitratensteuerung 36, wie im folgenden beschrieben, Gelegenheit zu geben, den Multiplikator für einen weiteren Durchlauf eines Blocks von Audiowerten zu ändern. Wird eine solche Änderung durch die Bitratensteuerung 36 nicht angezeigt, so kann der Buffer 38 den durch diesen Block eingenommenen Speicher freigeben.
Nachdem im Vorhergehenden der Aufbau des Audiocodierers von Fig. 1 beschrieben worden ist, wird im folgenden Bezug nehmend auf die Fig. 2 - 7b dessen Funktionsweise beschrieben.
Wie es Fig. 2 zu entnehmen ist, ist das Audiosignal, wenn es den Dateneingang 12 erreicht, bereits durch Audiosignalabtastung 50 aus einem analogen Audiosignal erhalten worden. Die Audiosignalabtastung wird mit einer vorbestimmten Abtastfrequenz durchgeführt, die üblicherweise zwischen 32 - 48 kHz liegt. Am Dateneingang 12 liegt folglich ein Audiosignal an, das aus einer Folge von Abtast- bzw. Audiowerten besteht. Obwohl, wie es aus der folgenden Beschreibung noch deutlich werden wird, die Codierung des Audiosignals nicht blockbasiert stattfindet, werden die Audiowerte am Dateneingang 12 zunächst in einem Schritt 52 zu Audioblöcken zusammengefaßt. Die Zusammenfassung zur Audioblöcken geschieht, wie es aus folgender Beschreibung deutlich wird, lediglich zu Zwecken der Bestimmung der Mithörschwel- le und findet in einer Eingangsstufe der Einrichtung 20 zum Ermitteln einer Mithörschwelle statt. Bei dem vorliegenden Ausführungsbeispiel wird exemplarisch davon ausgegangen, daß jeweils 128 aufeinanderfolgende Audiowerte zu Audioblö- cken zusammengefaßt werden, und daß die Zusammenfassung derart stattfindet, daß aufeinanderfolgende Audioblöcke sich einerseits nicht überlappen und andererseits unmittelbar benachbart zueinander sind. Dies sei anhand von Fig. 5a noch einmal kurz exemplarisch erläutert.
Fig. 5a zeigt mit 54 die Folge von Abtastwerten an, wobei jeder Abtastwert durch ein Rechteck 56 veranschaulicht ist. Die Abtastwerte sind zu Zwecken der Veranschaulichung numeriert, wobei aus Übersichtlichkeitsgründen wiederum nur einige der Abtastwerte der Folge 54 gezeigt sind. Wie es durch geschweifte Klammern oberhalb der Folge 54 gezeigt ist, sind gemäß vorliegendem Ausführungsbeispiel jeweils 128 aufeinanderfolgende Abtastwerte zu einem Block zusammengefaßt, wobei die unmittelbar darauffolgenden 128 Ab- tastwerte den nächsten Block bilden. Lediglich vorsichtshalber wird darauf hingewiesen, daß die Zusammenfassung zu Blöcken auch anders vorgenommen werden könnte, beispielsweise durch überlappende Blöcke oder beabstandete Blöcke und Blöcke mit einer anderen Blockgröße, obwohl die Block- große von 128 wiederum bevorzugt ist, da sie einen guten Kompromiß zwischen einerseits einer hohen Audioqualität und andererseits einer möglichst niedrigen Verzögerungszeit liefert .
Während die in dem Schritt 52 in der Einrichtung 20 zusammengefaßten Audioblöcke in der Einrichtung 20 zum Ermitteln einer Mithörschwelle blockweise verarbeitet werden, werden in dem Eingangspuffer 32 die eingehenden Audiowerte solange gepuffert bzw. zwischengespeichert 54, bis das parametri- sierbare Prefilter 30 von der Stützstellenvergleichsein- richtung 26 Eingangsparameter erhalten hat, um eine Prefil- terung vorzunehmen, wie es im folgenden noch beschrieben wird. Wie es Fig. 3 zu entnehmen ist, beginnt die Einrichtung 20 zum Ermitteln einer Mithörschwelle ihre Bearbeitung unmittelbar, nachdem genügend Audiowerte am Dateneingang 12 eingegangen sind, um einen Audioblock zu bilden bzw. den nächsten Audioblock zu bilden, was die Einrichtung 20 durch eine Überprüfung in Schritt 60 überwacht. Ist ein bearbeitbarer vollständiger Audioblock noch nicht vorhanden, wartet die Einrichtung 20. Ist ein vollständiger zu bearbeitender Audioblock vorhanden, so berechnet die Einrichtung 20 zum Ermitteln einer Mithörschwelle in einem Schritt 62 auf der Basis eines geeigneten psychoakustischen Modells in einem Schritt 62 eine Mithörschwelle. Zur Veranschaulichung der Mithörschwelle wird wiederum auf Fig. 12 und insbesondere die Kurve b verwiesen, die auf der Grundlage eines psychoakustischen Modells beispielsweise bezüglich eines aktuellen Audioblocks mit einem Spektrum a erhalten worden ist. Die Maskierungsschwelle, die in Schritt 62 ermittelt wird, ist eine frequenzabhängige Funktion, die für aufeinander- folgende Audioblöcke variieren kann, und auch von Audiosignal zu Audiosignal, wie z.B. von Rock- zu Klassikmusikstücken, deutlich variieren kann. Die Mithörschwelle gibt für jede Frequenz einen Schwellwert an, unterhalb dessen das menschliche Gehör Störungen nicht wahrnehmen kann.
In einem darauffolgenden Schritt 64 berechnen die Einrichtung 24 und die Einrichtung 22 aus der berechneten Mithörschwelle M(f) (wobei f die Frequenz angebe) einen Verstärkungswert a bzw. einen Parametersatz aus N Parametern x(i) (i = 1, ... , N) . Die Parametrisierung x(i), die die Einrichtung 24 in Schritt 64 berechnet, ist für das parametrisierbare Prefilter 30 vorgesehen, das beispielsweise in einer Adaptivfilterstruktur ausgeführt ist, wie sie bei der LPC-Codierung verwendet wird (LPC = linear predictive coding = lineare Prädiktionscodierung) ausgeführt. Seien beispielsweise s (n) mit n = 0, ... 127 die 128 Audiowerte des augenblicklichen Audioblocks und s' (n) die sich ergebenden gefilterten 128 Audiowerte, dann ist das Filter beispielsweise derart ausgeführt, daß folgende Gleichung erfüllt ist: s'(n) = s(n) - X a^s(n - k) , =l
wobei K die Filterordnung ist und a]; mit k = 1, ..., K die Filterkoeffizienten sind und der Index t veranschaulichen soll, daß sich die Filterkoeffizienten bei aufeinanderfolgenden Audioblöcken ändern. Die Einrichtung 24 berechnet nun die Parametrisierung aj; derart, daß die Übertragungsfunktion H(f) des parametrisierbaren Prefilters 30 in etwa gleich dem Inversen des Betrags der Maskierungsschwelle M(f) ist, d.h. so daß
Figure imgf000016_0001
gilt, wobei die Abhängigkeit von t wiederum veranschaulichen soll, daß für verschiedene Audioblöcke sich die Maskierungsschwelle M(f) ändert. Bei Implementierung des Prefilters 30 als das oben erläuterte adaptive Filter werden die Filterkoeffizienten aj; folgendermaßen erhalten: die inverse diskrete Fourier-Transformation von |M(f, t)| über der Frequenz für den Block zum Zeitpunkt t ergibt die Zielautokorrelationsfunktion r^i). Dann werden die a durch Lösen des linearen Gleichungssystems erhalten:
Figure imgf000016_0002
Damit aber bei der noch im folgenden näher beschriebenen linearen Interpolation zwischen den Parametrisierungen keine Instabilitäten auftreten, wird vorzugsweise für das Filter 30 eine Lattice-Struktur verwendet, wobei die Filterkoeffizienten für die Lattice-Struktur in Reflekti- onskoeffizienten umparametrisiert werden. Bezüglich näherer Details im Hinblick auf die Ausgestaltung des Prefilters, die Berechnung der Koeffizienten und die Umparametrisierung wird auf den in der Beschreibungseinleitung erwähnten Artikel von Schuller usw. und insbesondere auf Seite 381, Gliederungspunkt III, verwiesen, welcher hiermit diesbezüglich unter Bezugnahme aufgenommen wird.
Während folglich die Einrichtung 24 eine Parametrisierung für das parametrisierbare Prefilter 30 derart berechnet, daß dessen Übertragungsfunktion gleich dem Inversen der Maskierungsschwelle ist, berechnet die Einrichtung 22 basierend auf der .Mithörschwelle eine Rauschleistungsgrenze, nämlich eine Grenze, die angibt, welche Rauschleistung der Quantisierer 28 in das durch das Prefilter 30 gefilterte Audiosignal einführen darf, damit das Quantisierungsrauschen nach der Rück- bzw. Postfilterung auf Decoderseite unterhalb der Mithörschwelle M(f) oder genau auf derselben liegt. Die Einrichtung 22 berechnet diese Rauschleistungs- grenze als die Fläche unterhalb des Betragsquadrats der Mithörschwelle M, d.h. als |M(f)| . Den Verstärkungswert a berechnet die Einrichtung 22 aus der Rauschleistungsgrenze, indem sie die Wurzel aus dem Bruch von Quantisierungsrauschleistung durch Rauschleistungsgrenze berechnet. Das Quantisierungsrauschen ist das durch den Quantisierer 28 hervorgerufene Rauschen. Das durch den Quantisierer 28 hervorgerufene Rauschen ist, wie es noch beschrieben werden wird, weißes Rauschen und somit frequenzunabhängig. Die Quantisierungsrauschleistung ist die Leistung des Quanti- sierungsrauschens .
Wie es aus der vorhergehenden Beschreibung deutlich wurde, berechnet die Einrichtung 22 neben dem Verstärkungswert a auch die Rauschleistungsgrenze. Obwohl es möglich ist, daß die Stützstellenvergleichseinrichtung 26 aus dem von der Einrichtung 22 erhaltenen Verstärkungswert a erneut die Rauschleistungsgrenze berechnet, ist es ferner möglich, daß die Einrichtung 22 neben dem Verstärkungswert a der Stütz- stellenvergleichseinrichtung 26 auch gleich die ermittelte Rauschleistungsgrenze übermittelt .
Nach der Berechnung des Verstärkungswertes sowie der Parametrisierung überprüft daraufhin die Stützstellenver- gleichseinrichtung 26 in einem Schritt 66, ob sich die soeben berechnete Parametrisierung um mehr als eine vorbestimmte Schwelle von der aktuellen, zuletzt an das paramet- risierbare Prefilter weitergeleiteten Parametrisierung unterscheidet. Ergibt die Überprüfung in Schritt 66, daß sich die soeben berechnete Parametrisierung um mehr als die vorbestimmte Schwelle von der aktuellen unterscheidet, so werden die soeben berechneten Filterkoeffizienten und der soeben berechnete Verstärkungswert bzw. die Rauschleistungsgrenze in der Stützstellenvergleichseinrichtung 26 für eine noch zu erörternde Interpolation zwischengespeichert und die Stützstellenvergleichseinrichtung 26 übergibt in einem Schritt 68 die soeben berechneten Filterkoeffizienten und in einem Schritt 70 den soeben berechneten Verstärkungswert an das Prefilter 30. Ist dies jedoch nicht der Fall, und die soeben berechnete Parametrisierung unterscheidet sich nicht um mehr als die vorbestimmte Schwelle von der aktuellen, übergibt die Stützstellenvergleichsein- richtung (26) an das Prefilter 30 in Schritt 72 an Stelle der soeben berechneten Parametrisierung nur die aktuelle Stützstellenparametrisierung, d.h. diejenige Parametrisierung, die das letzte Mal im Schritt 66 zu einem positiven Ergebnis führte, sich also um mehr als eine vorbestimmte Schwelle von einer vorhergehenden Stützstellenparametrisierung unterschied. Nach den Schritten 70 und 72 kehrt der Prozeß von Fig. 3 zur Bearbeitung des nächsten Audioblocks, d.h. zur Abfrage 60, zurück.
In dem Fall, daß sich die soeben berechnete Parametrisierung nicht von der aktuellen Stützstellen-Parametrisierung unterschied, und demzufolge das Prefilter 30 in Schritt 72 wieder die bereits zuvor für zumindest den letzten Audio- block erhaltene Stützstellenparametrisierung erhält, wendet das Prefilter 30 diese Stützstellenparametrisierung auf alle Abtastwerte dieses sich in dem FIFO 32 befindlichen Audioblocks an, wie es im folgenden noch näher beschrieben wird, wodurch dieser aktuelle Block aus dem FIFO 32 entnommen wird und der Quantisierer 28 einen sich ergebenden Audioblock von pregefilterten Audiowerten erhält.
Fig. 4 stellt die Arbeitsweise des parametrisierbaren Prefilters 30 näher für den Fall dar, daß dieselbe die soeben berechnete Parametrisierung und den soeben berechneten Verstärkungswert erhält, weil dieselben sich von der aktuellen Stützstellenparametrisierung ausreichend unterschieden. Wie es Bezug nehmend auf Fig. 3 beschrieben worden ist, erfolgt also nicht zu jedem der aufeinanderfolgenden Audioblöcke eine Verarbeitung nach Fig. 4, sondern nur zu Audioblöcken, bei denen sich die zugehörige Parametrisierung ausreichend von der aktuellen Stützstellenparametrisierung unterschied. Die anderen Audioblöcke werden, wie soeben beschrieben, dadurch pregefiltert, daß die jeweils aktuelle Stützstellenparametrisierung und der zugehörige jeweils aktuelle Verstärkungswert auf alle Abtastwerte dieser Audioblöcke angewendet werden In einem Schritt 80 überwacht nun das parametrisierbare Prefilter 30, ob eine Übergabe von soeben berechneten Filterkoeffizienten von der Stützstellenvergleichseinrich- tung 26 stattgefunden hat oder von älteren Stützstellenpa- rametrisierungen. Das Prefilter 30 führt die Überwachung 80 solange durch, bis eine solche Übergabe stattgefunden hat.
Sobald eine solche Übergabe stattgefunden hat, beginnt das parametrisierbare Prefilter 30 mit der Bearbeitung des aktuellen Audioblocks von Audiowerten, der sich gerade in dem Zwischenspeicher 32 befindet, also demjenigen, zu dem die Parametrisierung gerade berechnet worden ist. In Fig. 5a ist beispielsweise veranschaulicht worden, daß alle Audiowerte 56 vor dem Audiowert mit der Nummer 0 bereits verarbeitet worden sind und deshalb den Speicher 32 bereits passiert haben. Die Verarbeitung des Blocks von Audiowerten vor dem Audiowert mit der Nummer 0 ist damals ausgelöst worden, weil die Parametrisierung, die für den Audioblock vor dem Block 0 berechnet worden ist, nämlich xo(i), sich um mehr als die vorbestimmte Schwelle von der zuvor zum Prefilter 30 weitergeleiteten Stützstellen-Parametrisierung unterschied. Die Parametrisierung xo(i) ist also eine Stützstellenparametrisierung, wie sie in der vorliegenden Erfindung bezeichnet wird. Die Verarbeitung der Audiowerte in dem Audioblock vor dem Audiowert 0 wurde basierend auf dem Parametersatz a0, xo(i) durchgeführt.
In Fig. 5a wird davon ausgegangen, daß die Parametrisierung, die zu Block 0 mit den Audiowerten 0 - 127 berechnet worden ist, sich um weniger als die vorbestimmte Schwelle von der Parametrisierung xo(i) unterschied, die sich auf den Block davor bezog. Dieser Block 0 wurde deshalb ebenfalls bereits von dem Prefilter 30 aus dem FIFO 32 entnommen, hinsichtlich all seiner Abtastwerte 0-127 mittels der in Schritt 72 zugeführten Parametrisierung x0(i) gleichermaßen verarbeitet, wie es durch den mit „direkte Anwendung" beschriebenen Pfeil 81 angedeutet ist, und dann an den Quantisierer 28 weitergegeben.
Die zu dem sich immer noch in dem FIFO 32 befindlichen Block 1 berechnete Parametrisierung unterschied sich jedoch nach dem exemplarischen Beispiel von Fig. 5a demgegenüber um mehr als die vorbestimmte Schwelle von der Parametrisierung xo(i) und wurde deshalb in Schritt 68 an das Prefilter 30 als Parametrisierung Xι(i) zusammen mit dem Verstärkungswert ai (Schritt 70) und gegebenenfalls der zugehörigen Rauschleistungsgrenze weitergeleitet, wobei die Indizes von a und x in Fig. 5a ein Index für die Stützstellen sein sollen, wie sie bei der später zu erörternden Interpolation verwendet werden, die bezüglich der Abtastwerte 128-255 im Block 1 durchgeführt, durch einen Pfeil 82 versinnbildlicht und durch die aus Schritt 80 folgenden Schritte in Fig. 4 verwirklicht wird. Mit Auftreten des Audioblocks mit Nummer 1 würde folglich die Bearbeitung bei Schritt 80 beginnen.
Zur Zeit der Weiterleitung des Parametersatzes ai, xλ befinden sich im Speicher 32 folglich nur noch die Audiowerte 128 - 255, d.h. der aktuelle Audioblock nach dem zuletzt durch das Prefilter 30 verarbeiteten Audioblock 0. Nachdem nun die Übergabe von Stützstellenparametern xι(i) in Schritt 80 festgestellt worden ist, ermittelt das Pre- filter 30 in Schritt 84 die zu dem Verstärkungswert ai korrespondierende Rauschleistungsgrenze qi. Dies kann dadurch geschehen, daß die Stützstellenvergleichseinrich- tung 26 diesen Wert an das Prefilter 30 weiterleitet, oder durch erneute Berechnung dieses Wertes durch das Prefilter 30, wie es im Vorhergehenden Bezug nehmend auf Schritt 64 beschrieben worden ist.
Danach wird in einem Schritt 86 ein Index j auf einen Abtastwert initialisiert, um auf den ältesten in dem FIFO- Speicher 32 verbliebenen Abtastwert bzw. den ersten Abtastwert des aktuellen Audioblocks „Block 1" zu zeigen, d.h. im vorliegenden Beispiel von Fig. 5a den Abtastwert 128. In einem Schritt 88 führt das parametrisierbare Prefilter eine Interpolation zwischen den Filterkoeffizienten x0 und Xi durch, wobei dabei die Parametrisierung x0 als Stützwert an der Stützstelle mit Audiowertnummer 127 des vorhergehenden Blocks 0 und die Parametrisierung xi als Stützwert an der Stützstelle mit Audiowertnummer 255 des aktuellen Blocks 1 gilt. Diese Audiowertpositionen 127 und 255 werden im folgenden auch als Stützstelle 0 und Stützstelle 1 bezeichnet, wobei in Fig. 5a die sich auf die Stützstellen beziehenden Stützstellenparametrisierungen durch die Pfeile 90 und 92 angedeutet sind.
Das parametrisierbare Prefilter 30 führt in dem Schritt 88 die Interpolation der Filterkoeffizienten x0, xi zwischen den beiden Stützstellen in Form einer linearen Interpolati- on durch, um den interpolierten Filterkoeffizienten an der Abtastposition j zu erhalten, d.h. x(t-,) (i) mit i = 1...N.
Danach, nämlich in Schritt 90, führt das parametrisierbare Prefilter 30 eine Interpolation zwischen der Rauschleistungsgrenze qi und qo durch, um eine interpolierte Rauschleistungsgrenze an der Abtastposition j zu erhalten, d.h. q(tj) .
In einem Schritt 92 berechnet daraufhin das parametrisierbare Prefilter 30 den Verstärkungswert für die Abtastposition j auf der Basis der interpolierten Rauschleistungsgrenze und der Quantisierungsrauschleistung sowie vorzugsweise auch den interpolierten Filterkoeffizienten, nämlich beispielsweise abhängig von der Wurzel aus
Quantisierungsrauschleistung , . , . , wobei hierzu auf die Ausfüh- q(t3 ) rungen zu Schritt 64 von Fig. 3 verwiesen wird.
In einem Schritt 94 wendet daraufhin das parametrisierbare Prefilter 30 den berechneten Verstärkungswert sowie die interpolierten Filterkoeffizienten auf den Abtastwert an der Abtastposition j an, um einen gefilterten Abtastwert für diese Abtastposition zu erhalten, nämlich s' (t-,) .
In einem Schritt 96 überprüft das parametrisierbare Prefilter 30 daraufhin, ob die Abtastposition j die aktuelle Stützstelle, d.h. Stützstelle 1, erreicht hat, in dem Fall von Fig. 5a die Abtastposition 255, d.h. den Abtastwert, für den die dem parametrisierbaren Prefilter 30 übermittel- te Parametrisierung plus Verstärkungswert unmittelbar, d.h. ohne Interpolation, gelten soll. Ist dies nicht der Fall, so erhöht bzw. inkrementiert das parametrisierbare Prefilter 30 den Index j um 1, wobei die Schritte 88 - 96 erneut wiederholt werden. Fällt die Überprüfung im Schritt 96 jedoch positiv aus, so wendet in Schritt 100 das parametrisierbare Prefilter den von der Stützstellenvergleichsein- richtung 26 zuletzt übermittelten Verstärkungswert und die von der Stützstellenvergleichseinrichtung 26 zuletzt übermittelten Filterkoeffizienten unmittelbar ohne Interpolation auf den Abtastwert an der neuen Stützstelle an, woraufhin der aktuelle Block, d.h. in dem vorliegenden Fall der Block 1, abgearbeitet ist, und der Prozeß von neuem bei Schritt 80 bezüglich des nachfolgenden zu verarbeitenden Blocks durchgeführt wird, der je nach dem, ob sich die Parametrisierung des nächsten Audioblocks Block 2 ausreichend von der Parametrisierung xι(i) unterscheidet, gegebe- nenfalls eben dieser nächste Audioblock Block 2 sein kann oder aber ein späterer Audioblock ist.
Bevor Bezug nehmend auf Fig. 5 das weitere Vorgehen bei der Verarbeitung der gefilterten Abtastwerte s' beschrieben wird, wird im folgenden Zweck und Hintergrund der Vorgehensweise nach den Fig. 3 und 4 beschrieben. Sinn und Zweck der Filterung besteht darin, das Audiosignal am Eingang 12 mit einem adaptiven Filter zu filtern, dessen Übertragungsfunktion ständig möglichst optimal an das Inverse der Mithörschwelle angepaßt ist, die sich ja ebenfalls in der Zeit ändert. Der Grund hierfür besteht darin, daß decoderseitig die Rückfilterung durch ein adaptives Filter, dessen Übertragungsfunktion dementsprechend ständig an die Mithörschwelle angepaßt ist, das durch eine Quantisierung des gefilterten Audiosignals eingeführte weiße Quantisierungsrauschen, d.h. das in der Frequenz konstante Quantisierungsrauschen, formt, nämlich an die Form der Mithörschwelle anpaßt.
Die Anwendung des Verstärkungswertes in den Schritten 94 und 100 im Prefilter 30 besteht in einer Multiplikation des Audiosignals bzw. des gefilterten Audiosignals, d.h. der Abtastwerte s oder der gefilterten Abtastwerte s' , mit dem Verstärkungsfaktor. Der Sinn besteht darin, hierdurch das Quantisierungsrauschen, das durch die anschließend näher beschriebene Quantisierung in das gefilterte Audiosignal eingefügt wird, und das durch die Rückfilterung decoderseitig an die Form der Mithörschwelle angepaßt wird, möglichst so hoch einzustellen, daß es die Mithörschwelle dennoch nicht überschreitet. Veranschaulichend läßt sich dies durch die Parseval' sehe Formel, nach welcher das Betragsquadrat einer Funktion gleich dem Betragsquadrat der Fourier- Transformierten ist. Wenn also decoderseitig die Multiplikation des Audiosignals im Prefilter mit dem Verstärkungswert wieder rückgängig gemacht wird, indem das gefilterte Audiosignal mit dem Verstärkungswert dividiert wird, reduziert sich damit die Quantisierungsrauschleistung eben- falls, nämlich um den Faktor a"2, wobei a der Verstärkungswert ist. Folglich kann durch die Anwendung des Verstärkungswertes in dem Prefilter 30 die Quantisierungsrauschleistung optimal hoch eingestellt werden, was gleichbedeutend damit ist, daß die Quantisierungsschrittweite erhöht und damit die Anzahl der zu codierenden Quantisierungsstufen reduziert wird, was wiederum die Kompression in dem anschließenden Redundanzreduktionsteil erhöht.
Anders ausgedrückt, kann der Effekt des Prefilters als eine Normierung des Signals an seine Maskierungsschwelle angesehen werden, so daß der Pegel der Quantisierungsstörungen bzw. des Quantisierungsrauschens sowohl in Zeit auch Frequenz konstant gehalten werden kann. Da das Audiosignal im Zeitbereich vorliegt, kann deshalb die Quantisierung mit einer gleichmäßigen konstanten Quantisierung schrittweise durchgeführt werden, wie es im folgenden noch beschrieben wird. Auf diese Weise wird idealerweise jegliche Irrelevanz aus dem Audiosignal entfernt, und es kann ein verlustfreies Kompressionsschema verwendet werden, um auch noch die verbleibende Redundanz in dem pregefilterten und quantisierten Audiosignal zu entfernen, wie es im folgenden noch beschrieben wird.
Anhand von Fig. 5a soll ferner noch einmal deutlich hervor- gehoben werden, daß freilich die verwendeten Filterkoeffizienten und Verstärkungswerte a0, ai, x0, Xi als Seiteninformationen decoderseitig zur Verfügung stehen müssen, daß aber der Übertragungsaufwand hierzu dadurch verringert wird, daß neue Filterkoeffizienten und neue Verstärkungswerte nicht einfach für jeden Block neu verwendet werden. Vielmehr findet eine Schwellwertüberprüfung 66 statt, um nur bei ausreichender Parametrisierungsänderung die Para- metrisierungen als Seiteninformationen zu übertragen, und ansonsten werden die Seiteninformationen bzw. Parametrisierungen nicht übertragen. An den Audioblöcken, für die die Parametrisierungen übertragen wurden, findet über den Bereich dieser Blöcke eine Interpolation von der alten zu der neuen Parametrisierung statt. Die Interpolation der Filterkoeffizienten findet auf die im Vorhergehenden Bezug nehmend auf den Schritt 88 beschriebene Weise statt. Die Interpolation im Hinblick auf die Verstärkung findet über einen Umweg statt, nämlich über eine lineare Interpolation 90 der Rauschleistungsgrenze q0, qi . Im Vergleich zu einer unmittelbaren Interpolation über den Verstärkungswert führt die lineare Interpolation bezüglich der Rauschleistungsgrenze zu einem besseren Hörergebnis bzw. weniger hörbaren Artefakten.
Im folgenden wird nun anhand von Fig. 6 die weitere Verarbeitung des pre- bzw. vorgefilterten Signals beschrieben, welche im wesentlichen eine Quantisierung und eine Redundanzreduktion umfaßt. Zunächst werden die von dem paramet- risierbaren Prefilter 30 ausgegebenen gefilterten Abtastwerte in dem Buffer 38 gespeichert und gleichzeitig von dem Buffer 38 zu dem Multiplizierer 40 durchgelassen, wo sie wiederum, da es ihr erster Durchlauf ist, zunächst unverändert, nämlich mit einem Skalierungsfaktor von Eins, durch den Multiplizierer 40 an den Quantisierer 28 weitergegeben werden. Dort werden die gefilterten Audiowerte oberhalb einer oberen Schranke in einem Schritt 110 abgeschnitten und daraufhin in einem Schritt 112 quantisiert. Die beiden Schritte 110 und 112 werden von dem Quantisierer 28 ausge- führt. Insbesondere werden die beiden Schritte 110 und 112 von dem Quantisierer 28 bevorzugter Weise in einem Schritt ausgeführt, indem die gefilterten Audiowerte s' mit einer Quantisierungsstufenfunktion quantisiert werden, die die beispielsweise in einer Fließkommadarstellung vorliegenden gefilterten Abtastwerte s' auf eine Mehrzahl von ganzzahligen Quantisierungsstufenwerten bzw. -indizes abbildet und ab einem gewissen Schwellwert für die gefilterten Abtastwerte flach verläuft, so daß gefilterte Abtastwerte, die größer als der Schwellwert sind, auf ein und dieselbe Quantisierungsstufe quantisiert werden. Ein Beispiel für eine solche Quantisierungsstufenfunktion ist in Fig. 7a dargestellt .
Die quantisierten gefilterten Abtastwerte sind in Fig. 7a mit σ' bezeichnet. Die Quantisierungsstufenfunktion ist vorzugsweise eine Quantisierungsstufenfunktion mit unterhalb des Schwellwertes konstanter Schrittweite, d.h. der Sprung auf die nächste Quantisierungsstufe findet stets nach einem konstanten Intervall entlang der Eingangswerte S' statt. In der Implementierung wird die Schrittweite zum Schwellwert derart eingestellt, daß die Anzahl an Quantisierungsstufen vorzugsweise einer Potenz von 2 entspricht. Im Vergleich zur Fließkommadarstellung der eingehenden gefilterten Abtastwerte s' ist der Schwellwert kleiner, so daß ein Maximalwert des darstellbaren Bereichs der Fließkommadarstellung den Schwellwert übertrifft.
Der Grund für den Schwellwert besteht darin, daß beobachtet worden ist, daß das gefilterte Audiosignal, das von dem Prefilter 30 ausgegeben wird, vereinzelt Audiowerte aufweist, die sich aufgrund einer ungünstigen Akkumulation von Oberwellen zu sehr großen Werten aufsummieren. Ferner ist beobachtet worden, daß ein Abschneiden dieser Werte, wie es durch die in Fig. 7a gezeigte Quantisierungsstufenfunktion erzielt wird, zu einer hohen Datenreduktion, aber nur zu einer geringfügigen Beeinträchtigung der Audioqualität führt. Vielmehr entstehen diese vereinzelten Stellen im gefilterten Audiosignal künstlich durch die frequenzselektive Filterung im parametrisierbaren Filter 30, so daß ein Abschneiden derselben die Audioqualität nur geringfügig beeinträchtigt . Ein etwas konkreteres Beispiel für die in Fig. 7a gezeigte Quantisierungsstufenfunktion wäre eine solche, die bis zum Schwellwert alle gefilterten Abtastwerte s' auf die nächst- gelegene Ganzzahl rundet, und von da an alle darüberliegen- den gefilterten Abtastwerte auf die höchste Quantisierungsstufe quantisiert, wie z.B. 256. Dieser Fall ist in Fig. 7a dargestellt.
Ein weiteres Beispiel für eine mögliche Quantisierungsstufenfunktion wäre die in Fig. 7b gezeigte. Bis zum Schwellwert entspricht die Quantisierungsstufenfunktion von Fig. 7b derjenigen von Fig. 7a. Anstatt jedoch für Abtastwerte s' oberhalb des Schwellwertes abrupt flach zu verlaufen, verläuft die Quantisierungsstufenfunktion mit einer Steilheit weiter, die kleiner ist als die Steilheit im Bereich unterhalb des Schwellwertes. Anders ausgedrückt ist oberhalb des Schwellwertes die Quantisierungsschrittweite größer. Hierdurch wird ein ähnlicher Effekt erzielt wie mit der Quantisierungsfunktion von Fig. 7a, jedoch mit einerseits mehr Aufwand aufgrund der verschiedenen Schrittweiten der Quantisierungsstufenfunktion oberhalb und unterhalb des Schwellwertes und andererseits einer besserten Audioqualität, da sehr hohe gefilterte Audiowerte s' nicht vollstän- dig abgeschnitten werden, sondern lediglich mit einer größeren Quantisierungsschrittweite quantisiert werden.
Wie es im Vorhergehenden schon beschrieben worden ist, müssen decoderseitig nicht nur die quantisierten und gefil- terten Audiowerte σ' zur Verfügung stehen, sondern ferner auch die Eingangsparameter für das Prefilter 30, die der Filterung dieser Werte zugrundegelegt worden sind, nämlich die Stützstellenparametrisierung inklusive eines Hinweises auf den zugehörigen Verstärkungswert. In einem Schritt 114 unternimmt deshalb der Komprimierer 34 einen ersten Komprimierungsversuch und komprimiert dabei Seiteninformationen beinhaltend die Verstärkungswerte ao und ai an den Stützstellen, wie z.B. 127 und 255, sowie die Filterkoeffizien- ten x0 und xλ an den Stützstellen und die quantisierten, gefilterten Abtastwerte σ' in ein vorläufiges gefiltertes Signal. Der Komprimierer 34 ist dabei ein verlustfrei arbeitender Codierer, wie z.B. ein Huffman- oder arithmeti- scher Codierer mit oder ohne Prädiktion und/oder Adaption.
Der Speicher 38, den die abgetasteten Audiowerte σ' durchlaufen, dient als Zwischenspeicher für eine geeignete Blockgröße, mit welcher der Komprimierer 34 die von dem Quantisierer 28 ausgegebenen quantisierten, gefilterten und, wie im folgenden beschriebenen gegebenenfalls skalierten, Audiowerte σ' verarbeitet. Die Blockgröße kann sich von der Blockgröße der Audioblöcke, wie sie von der Einrichtung 20 verwendet werden, unterscheiden.
Wie bereits erwähnt hat für den ersten Komprimierungsversuch die Bitratensteuerung 36 den Multiplizierer 40 mit einem Multiplikator von 1 angesteuert, so daß die gefilterten Audiowerte von dem Prefilter 30 unverändert zu dem Quantisierer 28 und von dort aus als quantisierte, gefilterte Audiowerte zu dem Komprimierer 34 gelangen. Der Komprimierer 34 überwacht in einem Schritt 116, ob eine gewisse Kompressionsblockgröße, d.h. eine gewisse Anzahl von quantisierten, abgetasteten Audiowerten, in das vorläu- fige codierte Signal codiert worden ist, oder ob weitere quantisierte, gefilterte Audiowerte σ' in das aktuelle vorläufige codierte Signal zu codieren sind. Ist die Kompressionsblockgröße nicht erreicht, führt der Komprimierer 34 die aktuelle Kompression 114 weiter durch. Ist die Kompressionsblockgröße jedoch erreicht, überprüft in einem Schritt 118 die Bitratensteuerung 36, ob die für die Komprimierung benötigte Bitmenge größer als eine von einer erwünschten Bitrate vorgeschriebene Bitmenge ist. Ist dies nicht der Fall, überprüft die Bitratensteuerung 36 in einem Schritt 120, ob die benötigte Bitmenge kleiner als die durch die erwünschte Bitrate vorgeschriebene Bitmenge ist. Ist dies der Fall, fügt die Bitratensteuerung 36 das codierte Signal in Schritt 122 mit Füllbits auf, bis die durch die erwünschte Bitrate vorgeschriebene Bitmenge erreicht ist. Anschließend erfolgt in Schritt 124 die Ausgabe des codierten Signals. Alternativ zu Schritt 122 könnte die Bitratensteuerung 36 den in dem Speicher 38 noch gespeicherten, zuletzt der Kompression zugrundeliegenden Kompressionsblock von gefilterten Audiowerten σ' in mit einem Multiplikator größer 1 durch den Multiplizierer 40 multiplizierter Form an den Quantisierer 28 zum erneuten Durchlaufen der Schritte 110 - 118 weiterleiten, bis die durch die erwünschte Bitrate vorgeschriebene Bitmenge erreicht ist, wie es durch einen gestrichelten Schritt 125 angezeigt ist.
Ergibt jedoch die Überprüfung in Schritt 118, daß die benötigte Bitmenge größer als die von der erwünschten Bitrate vorgeschriebene ist, ändert die Bitratensteuerung 36 den Multiplikator für den Multiplizierer 40 auf einen Faktor zwischen 0 und 1 ausschließlich. Dies führt sie in Schritt 126 durch. Nach dem Schritt 126 sorgt die Bitra- tensteuerung 36 dafür, daß der Speicher 38 den letzten der Kompression zugrundeliegenden Kompressionsblock von gefilterten Audiowerten σ' erneut ausgibt, wobei dieselben daraufhin mit dem in Schritt 126 eingestellten Faktor multipliziert werden und erneut dem Quantisierer 28 zuge- führt werden, woraufhin die Schritte 110 - 118 erneut durchgeführt werden und das bisher vorläufig kodierte Signal verworfen wird.
Es wird darauf hingewiesen, daß bei erneutem Durchführen der Schritte 110 - 116 in dem Schritt 114 freilich auch der in dem Schritt 126 (oder dem Schritt 125) verwendete Faktor in das codierte Signal eingebunden wird.
Der Sinn der Vorgehensweise nach Schritt 126 besteht darin, daß durch den Faktor die effektive Schrittweite des Quanti- sierers 28 erhöht wird. Dies bedeutet, daß das resultierende Quantisierungsrauschen gleichmäßig oberhalb der Maskierungsschwelle liegt, was zu hörbaren Störungen bzw. hörba- rem Rauschen führt, aber dafür eine reduzierte Bitrate ergibt. Wird nach erneutem Durchlaufen der Schritte 110 - 116 in Schritt 118 erneut festgestellt, daß die benötigte Bitmenge größer als die von der gewünschten Bitrate vorge- schriebene ist, wird der Faktor in Schritt 126 weiter reduziert usw.
Wenn die Daten schließlich bei Schritt 124 als codiertes Signal ausgegeben werden, wird der nächste Kompressions- block von den darauffolgenden quantisierten, gefilterten Audiowerten σ' durchgeführt.
Es wird noch darauf hingewiesen, dass auch ein anderer vorinitialisierte Wert für den Multiplikationsfaktor ver- wendet werden könnte als 1, nämlich beispielsweise 1. Dann fände auf jeden Fall, also ganz oben in Fig. 6, vorab eine Skalierung statt.
Fig. 5b veranschaulicht noch einmal das sich ergebende codierte Signal, das allgemein mit 130 angezeigt ist. Das codierte Signal umfaßt Seiteninformationen und dazwischenliegende Hauptdaten. Die Seiteninformationen umfassen, wie bereits erwähnt, Informationen, aus denen für spezielle Audioblöcke, nämlich Audioblöcke, bei denen sich in der Folge von Audioblöcken eine signifikante Änderung in den Filterkoeffizienten ergeben hat, der Wert des Verstärkungswertes und der Wert der Filterkoeffizienten hergeleitet werden kann. Gegebenenfalls umfassen die Seiteninformationen ferner weitere Informationen, die sich auf den für die Bitsteuerung verwendeten Verstärkungswert beziehen. Aufgrund der gegenseitigen Abhängigkeit zwischen Verstärkungswert und Rauschleistungsgrenze q können die Seiteninformationen wahlweise neben dem Verstärkungswert a# zu einer Stützstelle # auch die Rauschleistungsgrenze q# umfassen, oder auch nur letztere. Innerhalb des codierten Signals sind die Seiteninformationen vorzugsweise derart angeordnet, daß die Seiteninformationen zu Filterkoeffizienten und zugehörigem Verstärkungswert bzw. zugehöriger Rauschleis- tungsgrenze vor den Hauptdaten zu dem Audioblock von quantisierten, gefilterten Audiowerten σ' angeordnet sind, aus dem diese Filterkoeffizienten mit zugehörigem Verstärkungswert bzw. zugehöriger Rauschleistungsgrenze abgeleitet worden sind, also die Seiteinformationen a0, x0(i) nach dem Block -1 und die Seiteinformationen ai, xx (i) nach dem Block 1. Anders ausgedrückt sind die Hauptdaten, d.h. die quantisierten, gefilterten Audiowerte σ' , ab exklusive einem Audioblock der Art, bei der sich eine in der Folge von Audioblöcken signifikante Änderung in den Filterkoeffizienten ergeben hat, bis zu einschießlich dem nächsten Audioblock dieser Art, in Fig. 5b beispielsweise die Audiowerte σ' (t0) - σ' (t255) , immer zwischen dem Seiteninformationsblock 132 zu dem ersteren dieser beiden Audioblöcke (Block -1) und dem weiteren Seiteninformationsblock 134 zu dem zweiten dieser beiden Audioblöcke (Block 1) angeordnet.. Die Audiowerte σ' (t0) - σ' (tι27) sind wie im vorhergehenden bezugnehmend auf Fig. 5a erwähnt allein mittels der Seiteninformationen 132 erhalten worden bzw. dekodierbar, während die Audiowerte σ' (tι28) - σ' (t255) durch Interpolation mittels der Seiteninformationen 132 als Stützwerte an der Stützstelle mit der Abtastwertnummer 127 und mittels der Seiteninformationen 134 als Stützwerte an der Stützstelle mit der Abtastwertnummer 255 erhalten worden sind und somit nur miteis beider Seiteninformationen dekodierbar sind.
Ferner werden die Seiteninformationen betreffend den Verstärkungswert bzw. die Rauschleistungsgrenze und die Fil- terkoeffizienten in jedem Seiteninformationsblock 132 und 134 nicht immer unabhängig voneinander eingebunden. Vielmehr werden diese Seiteninformationen in Differenzen zu dem vorhergehenden Seiteninformationsblock übertragen. In Fig. 5b enthält beispielsweise der Seiteninformationsblock 132 Verstärkungswert a0 und Filterkoeffizienten x0 bezüglich der Stützstelle zum Zeitpunkt t_ι. In dem Seiteninformationsblock 132 sind diese Werte aus dem Block selbst herleitbar. Aus dem Seiteninformationsblock 134 sind jedoch die Seiteninformationen betreffend die Stützstelle zum Zeitpunkt t255 nicht mehr aus diesem Block allein herleitbar. Vielmehr umfaßt der Seiteninformationsblock 134 lediglich Informationen über Differenzen des Verstärkungswertes ai der Stützstelle zum Zeitpunkt t2ss zu dem Verstärkungswert der Stützstelle zum Zeitpunkt t0 und die Differenzen der Filterkoeffizienten Xi zu den Filterkoeffizienten x0. Der Seiteninformationsblock 134 enthält folglich lediglich die Informationen zu ai - ao und xι(i) - xo(i). Zu intermittie- renden Zeitpunkten sollten jedoch die Filterkoeffizienten und der Verstärkungswert bzw. die Rauschleistungsgrenze voll und nicht nur als Differenz zur vorhergehenden Stützstelle übertragen werden, wue z.B. jede Sekunde, um einem Empfänger bzw. Dekodierer das einklinken in einen laufenden Strom von Codierungsdaten zu ermöglichen, wie es im folgenden noch erörtert wird.
Diese Art des Einbindens der Seiteninformationen in die Seiteninformationsblöcke 132 und 134 bietet den Vorteil der Möglichkeit einer höheren Komprimierungsrate. Der Grund dafür besteht darin, daß, obwohl die Seiteninformationen möglichst nur dann übertragen werden, wenn sich eine ausreichende Änderung der Filterkoeffizienten zu den Filterkoeffizienten einer vorhergehenden Stützstelle ergeben hat, sich der Aufwand der Differenzbildung codiererseitig bzw. Summenbildung decodierseitig lohnt, da die sich ergebenden Differenzen trotz der Abfrage in Schritt 66 klein sind, um somit Vorteile bei der Entropiecodierung zu ermöglichen.
Nachdem im Vorhergehenden ein Ausführungsbeispiel für einen Audiocodierer beschrieben worden ist, wird im folgenden ein Ausführungsbeispiel für einen Audiodecodierer beschrieben, der geeignet ist, das durch den Audiocodierer 10 von Fig. 1 erzeugte codierte Signal in ein decodiertes, abspielbares bzw. weiterverarbeitbares Audiosignal zu decodieren.
Der Aufbau dieses Decodierers ist in Fig. 8 gezeigt. Der Decodierer, der allgemein mit 210 angezeigt ist, umfaßt einen Dekomprimierer 212, einen FIFO-Speicher 214, einen Multiplizierer 216 und ein parametrisierbares Postfilter 218. Dekomprimierer 212, FIFO-Speicher 214, Multiplizierer 216 und parametrisierbares Postfilter 218 sind in dieser Reihenfolge zwischen einen Dateneingang 220 und einen Datenausgang 222 des Decodierers 210 geschaltet, wobei am Dateneingang 220 das codierte Signal erhalten wird und am Datenausgang 222 das decodierte Audiosignal ausgegeben wird, das sich lediglich durch das durch den Quantisierer 28 im Audiocodierer 10 erzeugte Quantisierungsrauschen von dem ursprünglichen Audiosignal am Dateneingang 12 des Audiocodierers 10 unterscheidet. Der Dekomprimierer 212 ist an einem weiteren Datenausgang mit einem Steuereingang des Multiplizierers 216 verbunden, um an denselben einen Multi- plikator weiterzuleiten, und über einen weiteren Datenausgang mit einem Parametrisierungseingang des parametrisierbaren Postfilters 218.
Wie es in Fig. 9 gezeigt ist, dekomprimiert der Dekompri- mierer 212 in einem Schritt 224 zunächst das am Dateneingang 220 anliegende komprimierte Signal, um an die quantisierten, gefilterten Audiodaten, nämlich die Abtastwerte σ' , sowie die dazugehörigen Seiteninformationen in den Seiteninformationsblöcken 132, 134 zu gelangen, die ja die Filterkoeffizienten und Verstärkungswerte oder, anstelle der Verstärkungswerte, die Rauschleistungsgrenzen, an den Stützstellen anzeigen.
Wie es in Fig. 10 gezeigt ist, überprüft der Dekomprimierer 212 in einem Schritt 226 das dekomprimierte Signal in der Reihenfolge seiner Ankunft, ob darin Seiteninformationen mit Filterkoeffizienten enthalten sind, und zwar in in sich abgeschlossener Form ohne Differenzbezugnahme auf einen vorhergehenden Seiteninformationsblock. Anders ausgedrückt, sucht der Dekomprimierer 212 nach dem ersten Seiteninformationsblock 132. Sobald der Dekomprimierer 212 fündig geworden ist, werden die quantisierten, gefilterten Audiowerte σ' in einem Schritt 228 in dem FIFO-Speicher 214 zwischen- gespeichert. Ist während des Schrittes 228 ein vollständiger Audioblock von quantisierten, gefilterten Audiowerte σ' eingespeichert worden, ohne daß unmittelbar ein Seiteninformationsblock folgt, so wird dieser innerhalb des Schrit- tes 228 zunächst mittels der in in dem Schritt 226 empfangenen Seiteninformationen enthaltenen Informationen über Parametrisierung und Verstärkungswert in dem Postfilter postgefiltert und im Multiplizierer 216 verstärkt, wodurch er dekodiert und damit der zugehörige dekodierte Audioblock erhalten wird.
In einem Schritt 230 überwacht der Dekomprimierer 212 das dekomprimierte Signal auf das Auftauchen eines irgendwie gearteten Seiteninformationsblocks, nämlich mit absoluten Filterkoeffizienten oder Filterkoeffizienten-Differenzen zu einem vorhergehenden Seiteninformationsblock hin. In dem Beispiel von Fig. 5b würde beispielsweise der Dekomprimierer 212 auf die Erkennung des Seiteninformationsblocks 132 im Schritt 226 in dem Schritt 230 das Auftauchen des Sei- teninformationsblocks 134 erkennen. Dabei wäre bereits in Schritt 228 der Block von quantisierten, gefilterten Audiowerten σ' (t0) - σ' (tι27) dekodiert worden, und zwar unter Verwendung der Seiteninformationen 132. Solange der Seiteninformationsblock 134 im dekomprimierten Signal also noch nicht auftritt, wird die Zwischenspeicherung und die eventuelle Dekodierung von Blöcken vermittels der Seiteninformationen aus Schritt 226, wie es im vorhergehenden beschrieben wurde, im Schritt 228 fortgesetzt.
Sobald der Seiteninformationsblock 134 auftritt, berechnet der Dekomprimierer 212 im Schritt 232 durch Summieren der Differenzwerte in dem Seiteninformationsblock 134 zu den Parameterwerten in dem Seiteninformationsblock 132 die Parameterwerte an der Stützstelle 1, d.h. ai, xι(i). Frei- lieh entfällt der Schritt 232 falls der aktuelle Seiteninformationsblock ein in sich abgeschlossener Seiteninformationsblock ohne Differenzen ist, was, wie im vorhergehenden beschrieben beispielsweise alle Sekunde der Fall sein kann. Damit die Wartezeit für den Decodierer 210 nicht zu lange ist, werden Seiteninformationsblöcke 132, bei denen die Parameterwerte absolut, d.h. ohne Relation zu einem anderen Seiteninformationsblock, herleitbar sind, in genü- gend kleinen Abständen angeordnet, so daß die Einschaltzeit bzw. die Totzeit beim Einschalten des Audiocodierers 210 bei beispielsweise einer Funkübertragung oder Rundfunkübertragung nicht zu groß ist. Vorzugsweise sind auch die Anzahl der dazwischen angeordneten Seiteninformationsblöcke 134 mit den Differenzwerten in einer festen vorbestimmten Anzahl zwischen den Seiteninformationsblöcken 132 angeordnet, so daß der Decodierer weiß, wann wieder ein Seiteninformationsblock der Art 132 in dem codierten Signal zu erwarten ist. Alternativ werden die verschiedenen Seitenin- formationsblocktypen durch entsprechende Flags angezeigt.
Wie es nun in Fig. 11 gezeigt ist, wird, nachdem nun ein Seiteninformationsblock für eine neue Stützstelle erreicht worden ist, und zwar insbesonder nach Schritt 226 oder 232, zunächst ein Abtastwertindex j auf 0 im Schritt 234 initialisiert. Dieser Wert entspricht der Abtastposition des ersten Abtastwertes in dem aktuell in dem FIFO 214 verbliebenen Audioblock, auf den sich die aktuellen Seiteninformationen beziehen. Schritt 234 wird von dem parametrisierba- ren Postfilter 218 durchgeführt. Das Postfilter 218 führt danach in einem Schritt 236 eine Berechnung der Rauschleistungsgrenze an der neuen Stützstelle durch, wobei dieser Schritt dem Schritt 84 von Fig. 4 entspricht und gegebenenfalls entfallen kann, wenn beispielsweise die Rauchleis- tungsgrenze an den Stützstellen zusätzlich zu den Verstärkungswerten übertragen wird. In nachfolgenden Schritten 238 und 240 führt daraufhin das Postfilter 218 Interpolationen bezüglich der Filterkoeffizienten und der Rauschleistungsgrenzen durch, die den Interpolationen 88 und 90 von Fig. 4 entsprechen. Die nachfolgende Berechnung des Verstärkungswertes für die Abtastposition j auf der Basis der interpolierten Rauschleistungsgrenze und den interpolierten Filterkoeffizienten aus den Schritten 238 und 240 in Schritt 242 entspricht dem Schritt 92 von Fig. 4. In einem Schritt 244 wendet daraufhin das Postfilter 218 den in Schritt 242 berechneten Verstärkungswert sowie die interpolierten Filterkoeffizienten auf den Abtastwert an der Abtastpositi- on j an. Dieser Schritt unterscheidet sich von dem Schritt 94 von Fig. 4 dadurch, daß die interpolierten Filterkoeffizienten derart auf die quantisierten, gefilterten Abtastwerte σ' angewendet werden, daß die Übertragungsfunktion des parametrisierbaren Postfilters nicht dem Inversen der Mithörschwelle, sondern der Mithörschwelle selbst entspricht. Ferner führt das Postfilter nicht eine Multiplikation mit dem Verstärkungswert, sondern eine Division durch den Verstärkungswert an dem quantisierten, gefilterten Abtastwert σ' oder bereits zurückgefilterten, quantisier- ten, gefilterten Abtastwert an der Position j durch.
Hat das Postfilter 218 noch nicht die aktuelle Stützstelle mit der Abtastposition j erreicht, was dasselbe in Schritt 246 überprüft, inkrementiert es in Schritt 248 den Abtast- positionsindex j und beginnt die Schritte 238 - 246 von neuem. Erst wenn die Stützstelle erreicht ist, wendet sie den Verstärkungswert und die Filterkoeffizienten der neuen Stützstelle auf den Abtastwert an der Stützstelle an, nämlich in Schritt 250. Wiederum umfaßt die Anwendung wie im Schritt 218 anstatt einer Multiplikation eine Division mittels des Verstärkungswertes und eine Filterung mit einer Übertragungsfunktion gleich der Mithörschwelle und nicht dem Inversen letztgenannter. Nach Schritt 250 ist der aktuelle Audioblock durch Interpolation zwischen zwei Stützstellenparametrisierungen dekodiert.
Wie bereits erwähnt, wird durch die Filterung und die Anwendung des Verstärkungswertes in den Schritten 218 und 224 das durch die Quantisierung bei der Codierung in Schritt 110 bzw. 112 eingefügte Rauschen sowohl in Form als auch in Höhe an die Mithörschwelle angepaßt. Es wird noch darauf hingewiesen, daß in dem Fall, daß die quantisierten, gefilterten Audiowerte aufgrund der Bitratensteuerung vor der Codierung in das codierte Signal noch einer weiteren Multiplikation in Schritt 126 unterzogen worden sind, dieser Faktor in den Schritten 218 und 224 ebenfalls berücksichtigt werden kann. Alternativ können freilich die durch den Prozeß von Fig. 11 erhaltenen Audiowerte einer weiteren Multiplikation unterzogen werden, um die um einer niedrigem Bitrate willen geschwächten Audio- werte wieder entsprechend zu verstärken.
Hinsichtlich der Figuren 3, 4, 6 und 9 - 11 wird darauf hingewiesen, daß dieselben Flußdiagramme zeigen, welche die Arbeitsweise des Codierers von Fig. 1 oder des Decodierers von Fig. 8 veranschaulichen, und daß jeder der in diesen Flußdiagrammen durch einen Block dargestellten Schritte wie beschrieben in einer entsprechenden Einrichtung implementiert ist, wie es im vorhergehenden beschrieben wurde. Die Implementierung der einzelnen Schritte kann dabei in Hard- wäre, als ASIC-Schaltungsteil, oder in Software, als Unterroutinen, realisiert sein. Insbesondere zeigen in diesen Figuren die in den Blöcken eingeschrieben Erläuterungen grob an, auf welchen Vorgang sich der jeweilige Schritt bezieht, der dem jeweiligen Block entspricht, während die Pfeile zwischen den Blöcken die Reihenfolge der Schritte bei Betrieb des Codierers bzw. Dekodierers veranschaulichen.
Bezug nehmend auf die vorhergehende Beschreibung wird noch darauf hingewiesen, daß das oben dargestellte Codierschema in verschiedener Hinsicht variiert werden kann. Beispielsweise ist es nicht notwendig, daß eine Parametrisierung und ein Verstärkungswert oder eine Rauschleistungsgrenze, wie sie für einen bestimmten Audioblock bestimmt worden sind, als für einen bestimmten Audiowert unmittelbar gültig angesehen werden sollen, wie in dem vorhergehenden Ausführungsbeispiel der jeweils letzte Audiowert jedes Audioblocks, d.h. des 128sten Werts in diesem Audioblock, so daß für diesen Audiowert die Interpolation unterbleiben kann. Vielmehr ist es möglich, diese Stützstellenparameterwerte auf eine Stützstelle zu beziehen, die sich zeitlich zwischen den Abtastzeitpunkten tn mit n = 0, ..., 127 der Audiowerte dieses Audioblocks befindet, so daß für jeden Audiowert eine Interpolation notwendig wäre. Insbesondere kann die für einen Audioblock bestimmte Parametrisierung bzw. der für diesen Audioblock bestimmte Verstärkungswert auch auf einen anderen Wert unmittelbar angewendet werden, wie z.B. den Audiowert in der Mitte des Audioblocks, wie z.B. den 64sten Audiowert in dem Fall der obigen Blockgröße von 128 Audiowerten.
Ferner wird darauf hingewiesen, daß sich obiges Ausfüh- rungsbeispiel auf ein Audiocodierungsschema bezog, das darauf ausgelegt war, ein codiertes Signal mit einer gesteuerten Bitrate zu erzeugen. Die Steuerung der Bitrate ist aber nicht in jedem Anwendungsfall erforderlich. Deshalb können die entsprechenden Schritte 116 - 122 und 126 bzw. 125 auch weggelassen werden.
Hinsichtlich des Bezug nehmend auf den Schritt 114 erwähnten Komprimierungsschemas wird der Vollständigkeit halber auch auf das in der Beschreibungseinleitung beschriebene Dokument von Schuller et.al. verwiesen, und insbesondere auf Gliederungspunkt IV, dessen Inhalt hiermit bezüglich der Redundanzreduktion mittels verlustloser Codierung hiermit unter Bezugnahme aufgenommen wird.
Bezug nehmend auf die vorhergehende Beschreibung wird ferner auf folgendes hingewiesen. Obwohl im Vorhergehenden die vorliegende Erfindung Bezug nehmend auf ein spezielles Audiocodierschema beschrieben worden ist, das kurze Verzögerungszeiten ermöglicht, ist die vorliegenden Erfindung freilich auch bei anderen Audiocodierungen anwendbar. So wäre beispielsweise auch ein Audiocodierungsschema denkbar, bei dem das codierte Signal aus den quantisierten, gefilterten Audiowerten an sich besteht, ohne daß eine Redun- danzreduktion durchgeführt wird. Demgemäß wäre es aber auch denkbar, die frequenzselektive Filterung anders als die im Vorhergehenden beschriebene Weise, nämlich codiererseitig mit einer Übertragungsfunktion gleich dem Inversen der Mithörschwelle und decoderseitig mit einer Übertragungsfunktion gleich der Mithörschwelle, durchzuführen.
Ferner können einzelne Aspekte obiger Ausführungsbeispiele auch weggelassen werden. So ist es beispielsweise unter Verringerung des Kompressionsverhältnisses ebenfalls möglich, die Seiteninformationen bezüglich jeden Audioblocks zu übermitteln, die Interpolation wegzulassen und/oder die Parameter in den Seiteninformationen immer in in sich abgeschlossenen Seiteninformationsblöcken zu übertragen und nicht als Differenzen, die sich auf vorhergehende Seiteninformationsblöcke beziehen.
Ferner ist die vorliegende Erfindung nicht auf Audiosignale begrenzt. Sie ist ferner auch bei anderen Informationssig- nalen anwendbar, nämlich beispielweise bei Videosignalen bestehend aus einer Folge von Frames, d.h. einer Folge von Pixelarrays .
Jedenfalls liefert aber obiges Audiocodierungsschema eine Möglichkeit zur Begrenzung der Bitrate bei einem Audiocodierer mit sehr geringer Verzögerungszeit. Die bei der Codierung abhängig vom Audiosignal entstehenden Bitraten- Spitzen werden dadurch vermieden, daß der Ausgangswertebereich des Prefilters begrenzt wird. Wiewohl es folglich der Natur der zu übertragenden Audiosignale entspricht, daß sie zu unterschiedlich hohen Bitraten für die Übertragung führen, nämlich komplexere Audiosignale zu höheren Bitraten und weniger komplexe zu geringern Bitraten, kann stets eine Obergrenze für die Bitrate der Übertragung eingehalten werden, die oftmals beispielsweise bei drahtlosen Übertragungsmedien existiert. Die Änderung der Quantisierungsstufenfunktion oberhalb der Schwelle ist ein geeignetes Mittel, um die Bitrate auf das zulässige Maximum zu begrenzen. Bei obigen Ausführungsbeispielen bestand der Codierer aus einem Prefilter, das das Audiosignal geeignet formt, einem Quantisierer mit einer Quantisiererungsstufenhöhe, gefolgt von einem Entropiecodierer . Der Quantisierer erzeugte Werte, die auch Indizes genannt werden. Im allgemeinen bedeuten höhere Indizes auch eine höhere damit verbundene Bitrate, die jedoch dadurch vermieden wurde, daß der Bereich der Indizes begrenzt (Fig. 7a) bzw. ausgedünnt (Fig. 7b) wurde, allerdings mit der Möglichkeit der Verschlechterung der Audioqualität.
Ferner wird Bezug nehmend auf das vorhergehende Ausführungsbeispiel noch auf folgendes hingewiesen. Obwohl im Vorhergehenden beschrieben worden ist, daß der Schwellwert bei der Quantisierung immer konstant bleibt bzw. auch die Quantisierungsstufenfunktion immer konstant bleibt, d.h. stets die in dem gefilterten Audiosignal erzeugten Artefakte mit gröberer Quantisierung quantisiert bzw. abgeschnit- ten werden, wodurch die Audioqualität gegebenenfalls hörbar verschlechtert werden könnte, ist es ferner möglich, diese Maßnahme erst dann zu verwenden, wenn es die Komplexität des Audiosignals erfordert, nämlich dann, wenn die zur Codierung notwendige Bitrate eine erwünschte Bitrate über- schreitet. In diesem Fall könnte zusätzlich zu den in Fig. 7a und 7b gezeigten Quantisierungsstufenfunktionen beispielsweise eine solche mit einer über den ganzen möglichen Wertebereich am Ausgang des Prefilters konstanten Quantisierungsschrittweite verwendet werden und der Quantisierer würde beispielsweise auf ein Signal ansprechen, um entweder die Quantisierungsstufenfunktion mit stets konstanter Quantisierungsschrittweite oder eine der Quantisierungsstufenfunktionen nach Fig. 7a oder 7b zu verwenden, so daß durch das Signal dem Quantisierer mitgeteilt werden könnte, bei geringfügiger Audioqualitätsverschlechterung die Quantisierungsstufenverringerung oberhalb des Schwellwertes bzw. das Abschneiden oberhalb des Schwellwertes durchzuführen. Alternativ könnte auch graduell der Schwellwert all- mählich verringert werden. In diesem Fall könnte die Schwellwertverringerung anstatt der Faktorverringerung von Schritt 126 durchgeführt werden. Nach einem ersten Komprimierungsversuch ohne Schritt 110 könnte also das vorläufig komprimierte Signal lediglich erst dann in einem modifizierten Schritt 126 einer selektiven Schwellwertquantisierung unterzogen werden, wenn die Bitrate immer noch zu hoch ist (118) . In einem erneuten Durchgang würden dann die gefilterten Audiowerte mit der Quantisierungsstufenfunktion quantisiert werden, die einen flacheren Verlauf oberhalb der Audioschwelle aufweist. Weitere Bitratenreduktionen könnten in dem modifizierten Schritt 126 noch durch Reduzieren des Schwellwertes und damit einer weiteren Modifikation der Quantisierungsstufenfunktion durchgeführt werden.
Insbesondere wird darauf hingewiesen, dass abhängig von den Gegebenheiten das erfindungsgemäße Quantisierungsschema auch in Software implementiert sein kann. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder einer CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, daß das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computerprogrammprodukt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computerprogrammprodukt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computerprogramm auf einem Computer abläuft.
Insbesondere können obige Verfahrensschritte in den Blöcken der Flußdiagramme einzeln oder zu mehreren in Unterpro- grammroutinen implementiert sein. Alternativ ist freilich auch eine Implementierung einer erfindungsgemäßen Vorrichtung in Form einer Integrierten Schaltung möglich, bei der diese Blöcke beispielsweise als einzelne Schaltungsteile einer ASIC implementiert sind.
Insbesondere wird darauf hingewiesen, dass abhängig von den Gegebenheiten das erfindungsgemäße Schema auch in Software implementiert sein kann. Die Implementation kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder einer CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das entsprechende Verfahren ausgeführt wird. Allgemein besteht die Erfindung somit auch in einem Computerprogrammprodukt mit auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfahrens, wenn das Computerpro- grammprodukt auf einem Rechner abläuft. In anderen Worten ausgedrückt kann die Erfindung somit als ein Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computerprogramm auf einem Computer abläuft.

Claims

Patentansprüche
1. Vorrichtung zum Quantisieren eines Informationssignals einer Folge von Informationswerten, wobei das Informa- tionssignal ein Audiosignal ist und die Informationswerte Audiowerte sind, mit folgenden Merkmalen: eine Einrichtung zum Ermitteln einer Mithorschwelle für einen Block von Audiowerten einer Folge von Audio- werten; eine Einrichtung zum Berechnen einer Version einer Parametrisierung eines parametrisierbaren Filters, so daß dessen Ubertragungsfunktion in etwa dem Inversen des Betrags der ersten Mithorschwelle entspricht; eine Einrichtung zum frequenzselektiven Filtern der Folge von Audiowerten, um eine Folge von gefilterten Audiowerten zu erhalten; eine Einrichtung zum Quantisieren der gefilterten Audiowerte, um eine Folge von quantisierten Audiowerten zu erhalten, mittels einer Quantisierungsstufenfunkti- on, die die gefilterten Audiowerte auf die quantisier- ten Audiowerte abbildet, und deren Verlauf unterhalb eines Schwellemnformationswerts steiler ist als oberhalb des Schwellemnformationswerts; wobei die Einrichtung zum frequenzselektiven Filtern folgende Einrichtung aufweist: eine Einrichtung zum Filtern eines vorbestimmten Blocks von Audiowerten der Folge von Audiowerten mit dem parametrisierbaren Filter unter Verwen- düng einer vorbestimmten Parametrisierung, die in vorbestimmter Weise von der Version der Parametrisierung abhangt, um einen Block der gefilterten Audiowerte zu erhalten.
2. Vorrichtung gemäß Anspruch 1, bei der die Einrichtung zum Ermitteln einer Mithorschwelle ausgebildet ist, um ferner eine weitere, zweite Mithorschwelle für einen weiteren, zweiten Block von Audiowerten zu ermitteln, und die Einrichtung zum Berechnen ausgebildet ist, um eine Version einer weiteren, zweiten Parametrisierung des parametrisierbaren Filters zu berechnen, so daß dessen Ubertragungsfunktion in etwa dem Inversen des Betrags der zweiten Mithorschwelle entspricht, wobei die Einrichtung zum frequenzselektiven Filtern folgende Einrichtungen aufweist: eine Einrichtung zum Interpolieren zwischen der Versi- on der ersten Parametrisierung und der Version der zweiten Parametrisierung, um für einen vorbestimmten Audiowert des vorbestimmten Blocks von Audiowerten eine Version einer interpolierten Parametrisierung zu erhalten; und eine Einrichtung zum Anwenden der Version der interpolierten Parametrisierung auf den vorbestimmten Audiowert des vorbestimmten Blocks von Audiowerten.
3. Vorrichtung gemäß Anspruch 2, die ferner eine Einrichtung (22) zum Ermitteln einer ersten Rauschleistungs- grenze abhangig von der ersten Maskierungsschwelle und einer zweiten Rauschleistungsgrenze abhangig von der zweiten Maskierungsschwelle aufweist, und bei der die Einrichtung zum Filtern eine Einrichtung (90) zum Interpolieren zwischen der ersten Rauschleistungsgrenze und der zweiten Rauschleistungsgrenze, um für einen vorbestimmten Audiowert des vorbestimmten Blocks von Audiowerten eine interpolierte Rauschleistungsgrenze zu erhalten, eine Einrichtung (92) zum Ermitteln eines Zwischenskalierungswerts abhangig von einer durch eine Quantisierung gemäß einer vorbestimmten Quantisierungsvorschrift hervorgerufenen Quantisierungs- rauschleistung und der interpolierten Rauschleistungsgrenze, und eine Einrichtung (94) zum Anwenden des Zwischenskalierungswerts auf den vorbestimmten Audiowert, um einen skalierten, gefilterten Audiowerte zu erhalten, aufweist.
4. Vorrichtung gemäß Anspruch 3, bei der die Einrichtung zum Interpolieren zwischen der ersten Rauschleistungsgrenze und der zweiten Rauschleistungsgrenze eine li- neare Interpolation durchfuhrt.
5. Vorrichtung gemäß Anspruch -3 oder 4, bei der die Einrichtung zum Ermitteln des Zwischenskalierungswer- tes eine Einrichtung zum Bilden der Wurzel aus dem Quotienten des Quantisierungsrauschens dividiert durch die interpolierte Rauschleistungsgrenze aufweist.
6. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Einrichtung zum Quantisieren ausgebildet, um das Quantisieren ansprechend auf ein Steuersignal durchzufuhren .
7. Vorrichtung gemäß einem der vorhergehenden Ansprüche, die ferner eine Verlustloskomprimierungseinrichtung zum Komprimieren der gefilterten Audiowerte in einen komprimierten Audiostrom aufweist, wobei die Komprimierungseinrichtung ausgebildet ist, um eine Bitrate des komprimierten Audiostroms zu steuern, und um in dem Fall, daß die Bitrate großer als ein Steuerwert ist, das Steuersignal an die Einrichtung zum Quantisieren zu senden.
8. Vorrichtung gemäß einem der vorhergehenden Ansprüche, bei der die Quantisierungsstufenfunktion oberhalb des Schwellemnformationswertes flach verlauft, so daß gefilterte Audiowerte großer dem Schwelleninformationswert auf einen maximalen Quantisierungsstufenwert quantisiert werden. Verfahren zum Quantisieren eines Informationssignals einer Folge von Informationswerten, wobei das Informa- tionssignal ein Audiosignal ist und die Informations- werte Audiowerte sind, mit folgenden Schritten:
frequenzselektives Filtern der Folge von Audiowerten, um eine Folge von gefilterten Audiowerten zu erhalten;
Quantisieren der gefilterten Audiowerte, um eine Folge von quantisierten Audiowerten zu erhalten, mittels einer Quantisierungsstufenfunktion, die die gefilterten Audiowerte auf die quantisierten Audiowerte abbildet, und deren Verlauf unterhalb eines Schwellenmformati- onswerts steiler ist als oberhalb des Schwellemnformationswerts;
Ermitteln einer Mithorschwelle für einen Block von Audiowerten; und
Berechnen einer Version einer Parametrisierung eines parametrisierbaren Filters, so daß dessen Ubertra- gungsfunktion in etwa dem Inversen des Betrags der ersten Mithorschwelle entspricht,
wobei der Schritt des frequenzselektiven Filterns folgenden Schritt aufweist:
Filtern eines vorbestimmten Blocks von Audiower- ten der Folge von Audiowerten mit dem parametrisierbaren Filter unter Verwendung einer vorbestimmten Parametrisierung, die in vorbestimmter Weise von der Version der Parametrisierung abhangt, um einen Block der gefilterten Audiowerte zu erhalten.
10. Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens nach Anspruch 9, wenn das Computer- Programm auf einem Computer abläuft.
PCT/EP2005/001343 2004-02-13 2005-02-10 Verfahren und vorrichtung zum quantisieren eines informationssignals WO2005078703A1 (de)

Priority Applications (11)

Application Number Priority Date Filing Date Title
DE502005001821T DE502005001821D1 (de) 2004-02-13 2005-02-10 Verfahren und vorrichtung zum quantisieren eines informationssignals
JP2006552545A JP4444295B2 (ja) 2004-02-13 2005-02-10 情報信号を量子化するための方法および装置
BRPI0506627A BRPI0506627B1 (pt) 2004-02-13 2005-02-10 método e dispositivo para quantizar um sinal de informações
EP05715289A EP1697929B1 (de) 2004-02-13 2005-02-10 Verfahren und vorrichtung zum quantisieren eines informationssignals
AU2005213767A AU2005213767B2 (en) 2004-02-13 2005-02-10 Method and device for quantizing a data signal
CN200580004688XA CN1918630B (zh) 2004-02-13 2005-02-10 量化信息信号的方法和设备
CA2555639A CA2555639C (en) 2004-02-13 2005-02-10 Method and device for quantizing a data signal
US11/460,433 US7464027B2 (en) 2004-02-13 2006-07-27 Method and device for quantizing an information signal
IL177164A IL177164A (en) 2004-02-13 2006-07-31 Method and device for quantizing an information signal
NO20064091A NO337836B1 (no) 2004-02-13 2006-09-12 Kvantisering av datasignaler
HK07100911A HK1093814A1 (en) 2004-02-13 2007-01-25 Method and device for quantizing a data signal

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004007184A DE102004007184B3 (de) 2004-02-13 2004-02-13 Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
DE102004007184.5 2004-02-13

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11/460,433 Continuation US7464027B2 (en) 2004-02-13 2006-07-27 Method and device for quantizing an information signal

Publications (1)

Publication Number Publication Date
WO2005078703A1 true WO2005078703A1 (de) 2005-08-25

Family

ID=34853461

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2005/001343 WO2005078703A1 (de) 2004-02-13 2005-02-10 Verfahren und vorrichtung zum quantisieren eines informationssignals

Country Status (16)

Country Link
US (1) US7464027B2 (de)
EP (1) EP1697929B1 (de)
JP (1) JP4444295B2 (de)
KR (1) KR100813193B1 (de)
CN (1) CN1918630B (de)
AT (1) ATE377243T1 (de)
AU (1) AU2005213767B2 (de)
BR (1) BRPI0506627B1 (de)
CA (1) CA2555639C (de)
DE (2) DE102004007184B3 (de)
ES (1) ES2294685T3 (de)
HK (1) HK1093814A1 (de)
IL (1) IL177164A (de)
NO (1) NO337836B1 (de)
RU (1) RU2337413C2 (de)
WO (1) WO2005078703A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007131564A1 (de) * 2006-05-12 2007-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004009955B3 (de) 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7627481B1 (en) 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
JP4640020B2 (ja) * 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
EP1852848A1 (de) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Verfahren und Vorrichtung für verlustfreie Kodierung eines Quellensignals unter Verwendung eines verlustbehafteten kodierten Datenstroms und eines verlustfreien Erweiterungsdatenstroms
EP2122615B1 (de) * 2006-10-20 2011-05-11 Dolby Sweden AB Vorrichtung und verfahren zum codieren eines informationssignals
US7823092B1 (en) * 2007-11-23 2010-10-26 Altera Corporation Method and apparatus for implementing a parameterizable filter block with an electronic design automation tool
EP2830059A1 (de) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Rauschfüllungsenergieanpassung
PL3413307T3 (pl) * 2014-07-25 2021-01-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do kodowania sygnałów audio, urządzenie do dekodowania sygnałów audio i ich sposoby
DE102014220687A1 (de) * 2014-10-13 2016-04-14 Continental Automotive Gmbh Kommunikationsvorrichtung für ein Fahrzeug und Verfahren zum Kommunizieren
RU2754497C1 (ru) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000063886A1 (en) * 1999-04-16 2000-10-26 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
EP1160770A2 (de) * 2000-06-02 2001-12-05 Lucent Technologies Inc. Perzeptuelle Kodierung von Audiosignalen unter Verwendung von getrennter Reduzierung von Irrelevanz und Redundanz

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3506912A1 (de) 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
DE3820037A1 (de) 1988-06-13 1989-12-14 Ant Nachrichtentech Bildcodierverfahren und einrichtung
DE3820038A1 (de) * 1988-06-13 1989-12-14 Ant Nachrichtentech Verfahren zur aufbereitung und uebertragung einer bildsequenz
JP3186290B2 (ja) * 1993-01-20 2001-07-11 ソニー株式会社 符号化方法、符号化装置、復号化装置及び記録媒体
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
DE19549621B4 (de) 1995-10-06 2004-07-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Codieren von Audiosignalen
GB2307833B (en) * 1995-12-01 2000-06-07 Geco As A data compression method and apparatus for seismic data
DE69724819D1 (de) * 1996-07-05 2003-10-16 Univ Manchester Sprachkodier- und dekodiersystem
US6370477B1 (en) 1996-11-22 2002-04-09 Schlumberger Technology Corporation Compression method and apparatus for seismic data
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6195633B1 (en) * 1998-09-09 2001-02-27 Sony Corporation System and method for efficiently implementing a masking function in a psycho-acoustic modeler
KR100440896B1 (ko) * 1998-12-30 2004-09-18 주식회사 대우일렉트로닉스 양자화복호화장치
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
EP1228569A1 (de) 1999-10-30 2002-08-07 STMicroelectronics Asia Pacific Pte Ltd. Verfahren zur frequenzkoeffizientenkodierung in einem ac- 3 kodierer
EP1377070A4 (de) * 2001-03-28 2010-08-11 Sony Corp Quantisierungsvorrichtung, quantisierungsverfahren, quantisierungsprogramm und aufzeichnungsmedium
DE10217297A1 (de) * 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000063886A1 (en) * 1999-04-16 2000-10-26 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
EP1160770A2 (de) * 2000-06-02 2001-12-05 Lucent Technologies Inc. Perzeptuelle Kodierung von Audiosignalen unter Verwendung von getrennter Reduzierung von Irrelevanz und Redundanz

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SCHULLER G D T ET AL: "PERCEPTUAL AUDIO CODING USING ADAPTIVE PRE- AND POST-FILTERS AND LOSSLESS COMPRESSION", IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, IEEE INC. NEW YORK, US, vol. 10, no. 6, September 2002 (2002-09-01), pages 379 - 390, XP001219570, ISSN: 1063-6676 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007131564A1 (de) * 2006-05-12 2007-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
NO20084786L (no) * 2006-05-12 2008-12-11 Fraunhofer Ges Forschung Koding av informasjonssignal
JP2009537033A (ja) * 2006-05-12 2009-10-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 情報信号符号化
AU2007250308B2 (en) * 2006-05-12 2010-05-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal coding
NO340674B1 (no) * 2006-05-12 2017-05-29 Fraunhofer Ges Forschung Koding av informasjonssignal
US9754601B2 (en) 2006-05-12 2017-09-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal encoding using a forward-adaptive prediction and a backwards-adaptive quantization
US10446162B2 (en) 2006-05-12 2019-10-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. System, method, and non-transitory computer readable medium storing a program utilizing a postfilter for filtering a prefiltered audio signal in a decoder

Also Published As

Publication number Publication date
CA2555639C (en) 2012-07-10
IL177164A (en) 2010-11-30
ATE377243T1 (de) 2007-11-15
EP1697929B1 (de) 2007-10-31
AU2005213767B2 (en) 2008-04-10
CN1918630A (zh) 2007-02-21
KR100813193B1 (ko) 2008-03-13
NO20064091L (no) 2006-11-10
JP4444295B2 (ja) 2010-03-31
JP2007522509A (ja) 2007-08-09
CN1918630B (zh) 2010-04-14
KR20060113999A (ko) 2006-11-03
BRPI0506627B1 (pt) 2018-10-09
BRPI0506627A (pt) 2007-05-02
NO337836B1 (no) 2016-06-27
EP1697929A1 (de) 2006-09-06
ES2294685T3 (es) 2008-04-01
HK1093814A1 (en) 2007-03-09
DE502005001821D1 (de) 2007-12-13
RU2337413C2 (ru) 2008-10-27
DE102004007184B3 (de) 2005-09-22
US20070043557A1 (en) 2007-02-22
AU2005213767A1 (en) 2005-08-25
RU2006132742A (ru) 2008-03-20
CA2555639A1 (en) 2005-08-25
US7464027B2 (en) 2008-12-09
IL177164A0 (en) 2006-12-10

Similar Documents

Publication Publication Date Title
EP1687808B1 (de) Audiocodierung
EP1697929B1 (de) Verfahren und vorrichtung zum quantisieren eines informationssignals
DE60214027T2 (de) Kodiervorrichtung und dekodiervorrichtung
EP1697928B1 (de) Audiokodierung
EP2022043B1 (de) Informationssignalcodierung
EP0954909B1 (de) Verfahren zum codieren eines audiosignals
DE60214599T2 (de) Skalierbare audiokodierung
EP1025646B1 (de) Verfahren und vorrichtung zum codieren von audiosignalen sowie verfahren und vorrichtungen zum decodieren eines bitstroms
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE60307252T2 (de) Einrichtungen, verfahren und programme zur kodierung und dekodierung
DE69726661T2 (de) Verfahren und vorrichtung zur kodierung eines digitalen informationssignales
EP1687810B1 (de) Vorrichtung und verfahren zum ermitteln einer quantisierer-schrittweite
DE19736669C1 (de) Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
WO2008058754A2 (de) Vorrichtung zum kodieren und dekodieren
EP1112621A1 (de) Vorrichtung und verfahren zum entropie-codieren von informationswörtern und vorrichtung und verfahren zum decodieren von entropie-codierten informationswörtern
WO2005083678A1 (de) Vorrichtung und verfahren zum verarbeiten eines multikanalsignals
EP0910928A1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
WO2001043503A2 (de) Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals
DE102012009435A1 (de) Vorrichtung und Verfahren zum Streaming hybridcodierter Audiodaten
DE69636272T2 (de) Audiokodier- und -dekodiergerät
DE202004002269U1 (de) Vorrichtung zum Quantisieren eines Informationssignals
DE202004002264U1 (de) Audiocodierung
EP0905918A2 (de) Verfahren und Vorrichtung zum Kodieren von Audiosignalen
DE19515805C2 (de) Verfahren zur Datenreduktion eines digitalisierten Tonsignals
DE3440615C1 (de) Verfahren zum Übertragen und Speichern von Tonsignalen und Einrichtung zur Durchführung des Verfahrens

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DPEN Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2005715289

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 11460433

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 177164

Country of ref document: IL

WWE Wipo information: entry into national phase

Ref document number: 2005213767

Country of ref document: AU

Ref document number: 2181/KOLNP/2006

Country of ref document: IN

WWE Wipo information: entry into national phase

Ref document number: 1020067015896

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 2555639

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: PA/a/2006/009110

Country of ref document: MX

WWE Wipo information: entry into national phase

Ref document number: 200580004688.X

Country of ref document: CN

Ref document number: 2006552545

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Ref document number: DE

ENP Entry into the national phase

Ref document number: 2005213767

Country of ref document: AU

Date of ref document: 20050210

Kind code of ref document: A

WWP Wipo information: published in national office

Ref document number: 2005213767

Country of ref document: AU

WWP Wipo information: published in national office

Ref document number: 2005715289

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2006132742

Country of ref document: RU

WWP Wipo information: published in national office

Ref document number: 1020067015896

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 11460433

Country of ref document: US

ENP Entry into the national phase

Ref document number: PI0506627

Country of ref document: BR

WWG Wipo information: grant in national office

Ref document number: 2005715289

Country of ref document: EP