EP0423050A1 - Dispositif de compression d'un signal audio-numérique transformé, à quantification adaptative sur critère psycho-auditif - Google Patents
Dispositif de compression d'un signal audio-numérique transformé, à quantification adaptative sur critère psycho-auditif Download PDFInfo
- Publication number
- EP0423050A1 EP0423050A1 EP90460037A EP90460037A EP0423050A1 EP 0423050 A1 EP0423050 A1 EP 0423050A1 EP 90460037 A EP90460037 A EP 90460037A EP 90460037 A EP90460037 A EP 90460037A EP 0423050 A1 EP0423050 A1 EP 0423050A1
- Authority
- EP
- European Patent Office
- Prior art keywords
- coding
- signal
- information
- transformed
- band
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 20
- 230000006835 compression Effects 0.000 title claims abstract description 5
- 238000007906 compression Methods 0.000 title claims abstract description 5
- 238000013139 quantization Methods 0.000 title claims description 14
- 230000003044 adaptive effect Effects 0.000 title abstract description 10
- 238000001228 spectrum Methods 0.000 claims abstract description 30
- 230000003595 spectral effect Effects 0.000 claims abstract description 29
- 230000005540 biological transmission Effects 0.000 claims abstract description 23
- 230000008030 elimination Effects 0.000 claims abstract description 11
- 238000003379 elimination reaction Methods 0.000 claims abstract description 11
- 230000000873 masking effect Effects 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 19
- 230000009466 transformation Effects 0.000 claims description 17
- 238000011002 quantification Methods 0.000 claims description 7
- 230000007480 spreading Effects 0.000 claims description 7
- 238000003892 spreading Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 abstract description 8
- 238000003860 storage Methods 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 12
- 230000000875 corresponding effect Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 2
- 241000251184 Rajiformes Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Definitions
- the field of the invention is that of compression of digital audio signals.
- the invention applies in particular to the transmission of sound signals on digital channels, as well as to devices for storing digital sound signals.
- the invention relates to a bit allocation device, allowing adaptive quantification of an audio-digital signal, after it has been transformed in the frequency domain and cut into frequency bands.
- the invention can for example be implemented in direct satellite broadcasting systems, such as those developed in the European project DAB (Digital Audio Broadcasting / Diffusion Audio Numécher), or in ISDN broadcasting systems, and high-fidelity distribution. It also applies in particular to storage devices, such as digital disks.
- Digital audio signals have many advantages over analog signals, particularly with regard to sound fidelity, preservation of initial quality and flexibility of use. However, the bit rate resulting from the conversion to digital of audio signals is very important, in particular for high quality signals, whose bandwidth is greater than 15 kHz.
- Transformation coding techniques have been widely applied to the image or speech fields; they have recently also been applied to the processing of audio signals, mainly musical.
- the signal is first cut into time blocks, then is subjected to a time / frequency transformation. These are the coefficients of the transformed blocks which are coded and transmitted.
- an inverse transformation delivers the decoded and reconstructed signal.
- the application of the mathematical transformation achieves a concentration of the energy of the source signal on the most important coefficients, and thus allows a reduction of the flow by controlling and minimizing the auditory degradation, in particular by selective elimination of some of the transformed coefficients.
- the fact of working in the frequency domain promotes the taking into account of the perceptual and psycho-auditory properties which are mainly related to the spectral nature of the sound.
- the taking into account of psycho-auditory criteria rests, in most of the existing devices, on the analysis of ZWICKER ("Psychoacoustics"; Ed. Masson 1981), based on the concept of masking of the inaudible spectral components.
- the known devices produced on these principles differ from each other on certain design biases: - the transmission or not of auxiliary information to the main information; - the use or not of techniques remedying the effect of transmission disturbances; - the techniques of taking into account psycho-auditory criteria to carry out the reduction in bit rate and the localization of their implementation in the coding and decoding chains of the signal; - the coding modes for compressing the main information, and, where appropriate, the auxiliary information transmitted.
- the sound signal is cut out successively. in blocks of samples, the time-frequency transformation and a predictive and adaptive coding of the most significant coefficients of each block, using the stationarity of the signal.
- the auxiliary information is transmitted during the transition blocks, which make it impossible to take into account an interblock correlation. In all other situations, this auxiliary information is only used to control the bit allocation module supplying the main signal quantizer.
- This device allows a reduction in flow. However, it leads to a chain degradation of the reconstruction of the blocks received, when an error occurs, because this error is passed on to the next block, and so on, via the feedback loop of the auxiliary information controlling the bit allocator and the decoder quantizer.
- auxiliary information is transmitted for each block, by adaptive coding.
- Such a device is for example described in the article by BOCHOW "Multiprocessor Implementation of an ATC Audio Codec” (Transformation of an audio coder / decoder with adaptive coding by transformation) (Proceedings of the Congress ICASSP 1989; Glasgow).
- a drawback of this device is that the continuous coding of the auxiliary information requires a high bit rate, to the detriment of the bit rate allocated to the main information.
- JOHNSTON's document "Transform Coding of Audio Signals Using Perceptual Noise Criteria” ((IEEE Journal on Selected Areas in Communication, Vol. 6, No. 2, February 1988; pp. 314-323), presents a device for rate reduction by adaptive quantification comprising an implementation of the masking thresholds according to ZWICKER analysis, in the form of a prediction algorithm at the level of the quantizer of the main signal. to minimize the noise / masking threshold ratio.
- the auxiliary information is transmitted continuously.
- This device also has variable length coding, or HUFFMAN coding at the output of the quantizer, quite complex to implement.
- the object of the invention is in particular to overcome the drawbacks of these various known devices.
- the objective of the invention is to provide a device for compressing a digital audio signal, using a device for allocating available bits for the transmission or storage of the signal, controlling means for adaptive quantification of the signal. , to allow a significant reduction speed while maintaining the quality of the starting signal as much as possible.
- the invention also aims to provide such a device for allocating bits, the operating principle of which takes account of psychoauditive criteria.
- Another objective of the invention is to minimize the chain degradation phenomena when the signal is reconstituted when a disturbance generating errors or interference occurs in the transmission channel.
- An additional objective of the invention is to provide, in one of the advantageous embodiments of the invention, a principle of joint transmission of main information and auxiliary information, by optimizing the throughput of the auxiliary information, then of the main information.
- the invention also aims to allow the use of a fixed number of bits for coding each block of information.
- a bit allocation device of the type ensuring the control of compression quantization means of a transformed digital audio signal, intended for be transmitted through a limited bit rate channel or stored on a digital information medium, in which the allocation consists notably of assigning to each band of a set of adjacent bands covering the whole spectrum of the transformed signal, a number of specific bits for the expression of the transformed coefficients of said signal, as a function of auxiliary information corresponding to the description of the spectrum of said transformed signal, said device being informed by means of prior elimination of spectral components of said transformed signal as a function of a psycho-auditory criterion.
- said device comprises (in known manner) means for calculating the masking threshold of spectral components on psycho-auditory criteria, for optimizing the allocation of the bits in each of said bands.
- said psycho-auditory criterion operates according to the ZWICKER psycho-auditory masking criteria.
- said quantization means comprise at least two distinct quantifiers and means for the selective allocation of one of said quantifiers to each of said bands of the spectrum of said transformed signal as a function of the number of components stored in said strip, after said elimination of the masked coefficients.
- said device comprises means for minimizing a quantization noise / masking threshold ratio in each of said bands.
- said quantization noise is determined as a function of at least one of the three pieces of information belonging to the group comprising: - the standard deviation of said spectral components not eliminated in said band; - a performance factor of said quantizer selected for said band; - spectral spreading information of said band.
- said information provided by said means for prior elimination of spectral components is produced by means of coding the lengths of sequences for coding the indices of said masked spectral components.
- said means for coding the lengths of sequences use a variable length code of the type of HUFFMAN codes.
- said means for coding the lengths of sequences deliver a specific code word for coding the frequency bands from which all of said components are eliminated.
- said means for coding the lengths of sequences are activated by selection means, as a function of a bit rate gain information provided by said coding.
- said device cooperates with means for coding said auxiliary information corresponding to the description of the spectrum.
- said coding means comprise predictive coding means.
- said predictive coding means comprise means belonging to the group comprising logarithmic conversion means, differential MIC coding means, and coding means by variable length code, of the type of HUFFMAN codes.
- said coding means also comprise coding means without interblock memory, said predictive coding means and said coding means without memory being selected according to a predetermined criterion.
- this predetermined criterion is a criterion of lower bit rate and / or a criterion of minimizing the effect of transmission errors.
- At least one of the pieces of information belonging to the group comprising said auxiliary information corresponding to the description of the spectrum, said information provided by said means for eliminating inaudible components and spectral spreading information, is transmitted or stored together with each of the main information blocks.
- said transformed digital signal is produced by transformation coding means using a transform of the type of the modified discrete cosine transform of PRINCEN and BRADLEY.
- said transformation coding means comprise means for windowing softened the time signal showing symmetry in said transformed signal.
- the device of FIG. 1 allows the coding of audio-digital data according to the method of the invention.
- the input signal x (n) 10 sampled at a frequency greater than or equal to 32 kHz, is applied to the transformation module 11.
- the sampling frequency corresponds to that used for high fidelity sound.
- the transform developed by PRINCEN and BRADLEY (“Adaptive Transform Coding incorporating Time Domain Aliasing Cancellation") is advantageously used. temporal phenomena due to aliasing); in Speech Communication; December 1987), also called transformed into modified discrete cosine (TCDM). This transform corresponds to a projection on a cosine basis.
- the transform coefficients are defined by: with: N: size of the transform block, h (n): block weighting window, m: number of the transform block.
- the TCDM used works in perfect synergy with this type of softened window. Indeed, this type of window makes it possible to obtain, after transformation, N / 2 unique coefficients, the N / 2 other coefficients being identical, except for the sign. On the contrary, a rectangular window would cause a spectral spread compared to the original signal. Because its implementation also requires inter-block overlap worth 50% of the size of the blocks, the number of transformed coefficients is identical to the number of original samples of the source signal to be transmitted to each block. This inter-block overlap is necessary to ensure perfect reconstruction of the signal.
- a first block 14 first of all eliminates the inaudible spectral components in the transformed signal 12.
- This elimination operation is based for example on the analysis of ZWICKER, as detailed below. This analysis makes it possible to distinguish in an audio signal masked lines, corresponding to inaudible frequencies. The transform coefficients corresponding to these inaudible components are not transmitted.
- the TCDM is characterized by good frequency separation, the number of lines eliminated can be significant. This results in a significant reduction in the number of values to be transmitted.
- the quantifiers used for the transmitted coefficients can be optimized accordingly.
- the module for removing masked lines 14 is more precisely described below, in conjunction with FIG. 2.
- the preserved spectral lines supplied at the output of module 14 serve as input to module 15 for calculating and coding the auxiliary information.
- the auxiliary information generated by the module 15 is calculated by frequency bands of unequal widths and can be coded by two different modes. If the signal is stationary, the coding takes place with respect to the preceding blocks (taking into account the inter-frame correlation), otherwise the current block is a transition block and the coding takes place without taking into account the inter-frame memory. blocks.
- the outputs of the module 14 for eliminating masked lines and of the module 15 for calculating and coding the auxiliary information supply the module 16 for allocating the bits driving the quantizer 17.
- the output of the block 16 for allocating bits provides information 18 of the number of bits R available for the expression of each of the coefficients y (k) of the transformed signal 12. This allocation of bits is dynamic: it varies from one block to the next. In addition, it is designed to ensure masking of quantization noise.
- the bit allocation module 16 also has as input the values of the spectral spreading function measured by frequency bands supplied by a module 13 for calculating and coding the spectral spreading, on the coefficients of the transformed signal 12. This makes it possible to characterize the nature of the spectrum, and in particular whether it is highly concentrated or not.
- bit allocation module 16 The operation of the bit allocation module 16 is developed below.
- the coefficients y (k) of signal 12 are quantified, based on information 18 of the number of bits R allocated.
- the information 19 obtained at the output of the encoder 15 of the auxiliary information as well as the information for eliminating the masked lines coming from the module 14 makes it possible to choose, for the current block , one of several quantifiers available, as will be seen below.
- Decoding is done completely symmetrically to coding.
- FIG. 2 shows the functional diagram of the module 14 for eliminating masked lines.
- This module 14 is to discriminate inaudible lines due to masking phenomena, so that only perceptually useful information is transmitted.
- This procedure is particularly advantageous for broad spectrum sounds, rich in harmonics. A large number of coefficients is then masked. It is precisely this type of signal which requires a higher bit rate, due to the amount of information to be transmitted.
- This device includes a module for detecting masked lines.
- This detection relates to the real spectrum and is only carried out at the coder. It uses frequency masking curves, according to ZWICKER analysis. As illustrated in FIG. 5, it appears that for each line 51 transmitted, the lines being under a line 52 of - 25 dB per critical band upstream of the line and under a line 53 of - 10 dB per critical band downstream, are inaudible. These two slopes correspond respectively to the anterior and posterior frequency masking.
- the spectrum is divided into 24 critical bands B1, B2, B3 and multiplied by the ear transmission factor a0 for each of said bands.
- the masking threshold calculation is separated into “critical intra-band” and “critical inter-band” masking.
- In-band masking corresponds to the overall masking effect of all the lines 511, 512 inside the same band B2.
- the calculation of the intra-band masking threshold is carried out by summing the contribution of each coefficient y (k) of the transformed signal.
- s in k (i) ⁇ . (y (k) 2.a0 (j)) with b b (j) ⁇ i ⁇ k-3 and k + 3 ⁇ i ⁇ b h (j) where ⁇ is a constant offset corresponding to - 30 dB.
- each coefficient y (k) does not affect the masking threshold of the 4 closest coefficients. This is necessary to avoid unwanted zeroing that may occur around the peaks of the spectrum.
- Inter-band masking results from taking into account, in each band B2, the masking effect of the adjacent bands. In fact, only the posterior masking (that of the lines 513 of the band B3) is considered for the calculation of the inter-band masking threshold.
- the anterior masking (band B1) is too weak to significantly modify the number of masked lines per block (-25 dB per band critical instead of -10 dB).
- the energy of the coefficient y (i), multiplied by the transmission factor a0 (j), is then compared to the masking threshold thus defined. If a0 (j) .y2 (i)> s (i), the coefficient y (i) is assumed to be masked.
- This function is carried out by the sub-module 21 of FIG. 2.
- This figure details the main sub-modules constituting the module 14 for removing the masked lines of FIG. 1.
- the detection of the masked lines in the sub-module 14 is followed by coding of the indices of the masked lines, carried out by block 20.
- This coding necessary for indicating to the decoder the numbers of the masked coefficients, for example calls on the technique of coding lengths in a row ("Run Length Coding").
- I m (k) be a bit worth 1 if the coefficient y (k) is hidden.
- variable-length coding of the sub-module 23 is advantageously ensured by a Huffman code calculated from an experimental probability density.
- the coding of the sequences does not start until the first masked line.
- the number of this one is transmitted on 9 bits.
- the "Run Length Coding" consists simply in searching for all the sequences of 0 and 1 and in associating with them the corresponding Huffman code word.
- the length of the sequences is limited to maximum values: 64 coefficients for the sequences of 0 and 128 coefficients for the sequences of 1. If these limits are exceeded, a sequence of zero length and inverse state is transmitted. To this zero-length sequence is associated a Huffman codeword, also calculated (offline) according to the occurrence of the sequence.
- the flow of auxiliary information can be significant.
- the gain in their non-transmission may be zero, or even negative. It is therefore advisable not to proceed with this non-transmission or at least to restrict it to certain frequency zones.
- R0 is the total number of bits per block, .
- R ifs is the number of bits necessary for the transmission of the auxiliary description information of the spectrum.
- R ifs is actually the value at the previous block.
- R2 (k) (R0-R ifs -R im ) (N / 2-N rm ) or .
- R im is the auxiliary bit rate for coding the lengths of sequences, .
- N rm is the number of masked lines.
- the coding validation sub-module 25 controls the variable length coding sub-module 23, depending on whether or not the coding is necessary.
- the average auxiliary bit rate is of the order of 0.8 bits per masked line. This low value proves the advantage of using the coding of the lengths of sequences.
- FIG. 3 represents the detailed functional diagram of the module 15 for calculating and coding the auxiliary information.
- auxiliary information is necessary for the calculation of the allocation of the bits and for the quantification of the coefficients.
- This auxiliary information 19 in fact constitutes a more or less precise descriptor of the spectrum of the signal.
- the spectrum descriptor is calculated in a sub-module 31 by frequency bands of unequal widths.
- the spectrum is divided for example into 50 frequency groups.
- the limits, b if b (j) and b if h (j), of these bands respect those of the critical bands.
- N if (j) is the number of unmasked coefficients in the band j.
- the originality of the coding of this information lies in taking into account the correlation existing between the successive transform blocks by means of predictive coding.
- the coder takes advantage of all the correlations of the signal (short term and longer term).
- the coding of the auxiliary information is usually carried out without taking account of the perceptual properties, unlike the quantification of the coefficients. However, as many bits as possible should be reserved for the bit rate of the main signal 101, and therefore the bit rate of the auxiliary information 19 should be reduced.
- this predictive coding comprises an operator 41 for conversion on a logarithmic scale followed by the Differential MIC code and a variable length coding device 43.
- the prediction is performed by a predictor 44 of order 1.
- the prediction coefficient a1 can take a value between 0.95 and 1.
- the input of this predictor 44 is the previous quantized value log ( ⁇ ′ (m, j) ).
- variable length coding 43 (HUFFMAN coding) which makes it possible to reduce the transmission rate of the spectrum descriptors to approximately 2.5 bits per value ⁇ ′ (m, j).
- the value log ( ⁇ ′ (m, j)) is obtained by the summation 46 of the value provided by an inverse quantizer 47, corresponding to the value that will be obtained at decoding, and of the previous value coming from the predictor 44.
- the prediction relates to the last non-zero value ⁇ ′ (m-p, j) transmitted.
- This second coding 34 is similar to the previous one. Prediction occurs frequently rather than being performed on successive transform blocks.
- e (m, j) is coded by a uniform quantizer having for example a dynamic range of 100 dB and 50 quantization levels.
- the output code words also undergo HUFFMAN coding.
- the first value ⁇ (m, 1) is transmitted separately.
- a module 33 for choosing the type of coding selects the best coding, according to the number of bits spent. If the bit rate necessary for inter-frame coding exceeds a previously fixed threshold, the second type of coding 34 is used. This choice is transmitted to the decoder using a decision bit 35.
- Predictor 44 in Figure 4 is a first-order autoregressive predictor (AR (1)) with a prediction coefficient very close to 1. Consequently, the effect of transmission errors is likely to propagate indefinitely. Since the auxiliary information is of major importance, inter alia for the allocation of the bits, it is necessary to reinitialize the inter-frame coding. For this purpose, for all blocks of rank multiple of 16, coding without interblock memory is used, even if the signal is stationary.
- AR (1) autoregressive predictor
- the coefficients y (k) 12 are coded using non-uniform adaptive quantifiers.
- the adaptation is carried out by the quantified spectrum descriptor ⁇ ′ (m, j), where j is the number of the band to which y (k) belongs.
- Each value ⁇ ′ (m, j) represents a variable number, N si (j), of non-zero coefficients y (k), due to the variable width of the frequency bands and the device for detecting masked lines.
- the performance of the quantifiers varies according to the number of coefficients to be quantized N si (j).
- Figure 6 shows the block diagram of the quantizer selection module to use.
- a second selector 64 makes it possible to choose, in each set of quantizers 651 to 656, the optimal quantizer, as a function of the number of bits R 18.
- the optimization of the choice of the quantizer is carried out as a function of the number of coefficients to be quantified and the number of bits allocated by the bit allocation module.
- FIG. 7 shows the device for allocating bits to each band according to the invention.
- Bit allocation is designed to accomplish spectral shaping of quantization noise based on perceptual criteria. It minimizes the noise / masking threshold ratio. This procedure is carried out at the coder and at the decoder and is based on the spectrum descriptor previously transmitted.
- the allocation of the bits comprises a module 71 for calculating the masking threshold S (k) - calculation similar to that performed for the detection of masked lines - and a module 72 for quantifying the ratio ⁇ (k) . ⁇ (k). ⁇ 2 (k) / S (k) comparable to that described by Yannick MAHIEUX in the article "Transform Coding of Audio Signals Using Correlation between successive Transform Blocks” (Coding by transformation of audio signals using the correlation between successive transformed blocks) ( Proceedings of the ICASSP congress, 1989, Glasgow).
- ⁇ 2 (k) is the square of the spectrum descriptor, extended to all the coefficients y (k) of the band. This is the essential element of the report to be quantified. Since the coefficients are coded with different sets of quantifiers (according to N if (j)), it is necessary to include the relative performances of each set of quantifiers in the allocation of the bits, according to the work of JAYANT and NOLL : "Digital Coding of Waveforms"(1984; Prentice Hall Signal Processing Series).
- the function ⁇ (k) is equal to the performance factor of the quantifier to be used for the coefficient y (k).
- a table 73 comprises for example 5 values of ⁇ (k) calculated beforehand. This table is addressed by the number of non-zero coefficients. Taking into account the real performances of the quantizer sets allows a very significant improvement in the quality of the coding.
- the module 74 for calculating the function ⁇ (k) takes account of the spectral spreading function ⁇ , also according to JAYANT and NOLL. This function indicates whether the spectrum is concentrated or not and is calculated at the coder by:
- ⁇ is calculated in 4 frequency bands of equal width. These 4 values are transmitted to the decoder using a uniform quantization on 6 bits.
- the function ⁇ (k) is calculated according to the value of ⁇ via a non-linear function.
- the role of ⁇ (k) is to force the allocation of the bits to grant a greater number of bits to the areas of the spectrum which contain peaks.
- the coefficients y (k) corresponding to the pure sounds contained in the signal must be coded with better precision, the masking threshold then having a level relative to that of the signal, lower than in the case of a spectrum. noise.
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
- Le domaine de l'invention est celui de la compression de signaux audio numériques. L'invention s'applique notamment à la transmission de signaux sonores sur canaux numériques, ainsi qu'aux dispositifs de stockage de signaux sonores numériques.
- Plus précisément, l'invention concerne un dispositif d'allocation de bits, permettant une quantification adaptative d'un signal audio-numérique, après que celui-ci a été transformé dans le domaine fréquentiel et découpé en bandes de fréquence.
- L'invention peut par exemple être mise en oeuvre dans les systèmes de diffusion directe par satellite, tels que ceux développés dans le projet européen DAB (Digital Audio Broadcasting/Diffusion Audio Numérique), ou encore dans des systèmes de diffusion par RNIS, et de distribution haute-fidélité. Elle s'applique également notamment aux dispositifs de stockage, tels que les disques numériques.
- Les signaux audio numériques présentent de nombreux avantages par rapport aux signaux analogiques, notamment en ce qui concerne la fidélité du son, la conservation de la qualité initiale et la souplesse d'utilisation. Toutefois, le débit résultant de la conversion en numérique des signaux audio est très important, en particulier pour les signaux haute qualité, dont la largeur de bande est supérieure à 15 kHz.
- Il est alors nécessaire de faire appel à des techniques de réduction de débit.
- De façon connue et largement répandue, les techniques utilisées font appel à des algorithmes de transformation mathématique du signal audio-numérique source. Les techniques de codage par transformée ont été largement appliquées aux domaines de l'image, ou de la parole; elles sont depuis peu également appliquées au traitement des signaux audio, principalement musicaux.
- Dans les codeurs existants mettant en oeuvre ces techniques, le signal subit d'abord une découpe en blocs temporels, puis est soumis à une transformation temps/fréquence. Ce sont les coefficients des blocs transformés qui sont codés et transmis. Au décodeur, une transformation inverse délivre le signal décodé et reconstruit.
- L'application de la transformation mathématique accomplit une concentration de l'énergie du signal source sur les coefficients les plus importants, et permet ainsi une réduction du débit en contrôlant et minimisant la dégradation auditive, notamment par élimination sélective de certains des coefficients transformés. En effet, le fait de travailler dans le domaine fréquentiel favorise la prise en compte des propriétés perceptuelles et psycho-auditives qui sont principalement liées à la nature spectrale du son. La prise en compte de critères psycho-auditifs repose, dans la plupart des dispositifs existants, sur l'analyse de ZWICKER ("Psychoacoustique" ; Ed. Masson 1981), fondée sur le concept de masquage des composantes spectrales inaudibles.
- Les dispositifs connus réalisés sur ces principes diffèrent entre eux sur certains partis pris de conception :
- la transmission ou non d'une information auxiliaire à l'information principale ;
- l'utilisation ou non de techniques remédiant à l'effet des perturbations de transmission ;
- les techniques de prise en compte des critères psycho-auditifs pour effectuer la réduction de débit et la localisation de leur mise en oeuvre dans les chaînes de codage et de décodage du signal ;
- les modes de codage de compression des informations principales, et, le cas échéant, des informations auxiliaires transmises. - Ainsi, dans un premier dispositif connu de ce type, tel que décrit dans le document de brevet français FR 89 06194, "Procédé et installation à codage des signaux sonores", au nom des déposants, on met en oeuvre successivement le découpage du signal sonore en blocs d'échantillons, la transformation temps-fréquence et un codage prédictif et adaptatif des coefficients les plus significatifs de chaque bloc, utilisant la stationnarité du signal. Dans ce dispositif, l'information auxiliaire est transmise lors des blocs de transition, qui rendent impossible la prise en compte d'une corrélation interblocs. Dans toutes les autres situations, cette information auxiliaire sert seulement à piloter le module d'allocation de bits alimentant le quantificateur de signal principal. Ce dispositif permet une diminution du débit. Toutefois, il entraîne une dégradation en chaîne de la reconstitution des blocs reçus, lorsqu'une erreur se produit, du fait que cette erreur se répercute sur le bloc suivant, et ainsi de suite, via le rebouclage d'élaboration de l'information auxiliaire pilotant l'allocateur de bits et le quantificateur du décodeur.
- On connaît également des dispositifs dans lesquels une information auxiliaire est transmise pour chaque bloc, par codage adaptatif. Un tel dispositif est par exemple décrit dans l'article de BOCHOW "Multiprocessor Implementation of an ATC Audio Codec" (Implantation multiprocesseur d'un codeur/décodeur audio à codage adaptatif par transformation) (Actes du Congrès ICASSP 1989; Glasgow). Un inconvénient de ce dispositif est que le codage en continu de l'information auxiliaire réclame un débit élevé, au détriment du débit alloué à l'information principale.
- Le document de JOHNSTON, "Transform Coding of Audio Signals Using Perceptual Noise Criteria"( (Codage par transformation de signaux utilisant des critères psychoacoustiques) (IEEE Journal on Selected Areas in Communication, Vol.6, N°2, Février 1988; pp.314-323), présente un dispositif de réduction de débit par quantification adaptative comportant une mise en oeuvre des seuils de masquage selon l'analyse de ZWICKER, sous forme d'un algorithme de prédiction au niveau du quantificateur du signal principal. Cet algorithme vise à minimiser le rapport bruit/seuil de masquage. De même que dans le dispositif de BOCHOW, l'information auxiliaire est transmise en continu. Ce dispositif présente d'autre part un codage à longueur variable, ou codage de HUFFMAN en sortie du quantificateur, assez complexe à mettre en oeuvre.
- L'invention a notamment pour but de pallier les inconvénients de ces différents dispositifs connus.
- Plus précisément, l'objectif de l'invention est de fournir un dispositif de compression d'un signal audionumérique, en utilisant un dispositif d'allocation de bits disponibles pour la transmission ou le stockage du signal, pilotant des moyens de quantification adaptative du signal, afin de permettre une réduction importante du débit tout en conservant au maximum la qualité du signal de départ.
- L'invention a également pour objectif de fournir un tel dispositif d'allocation de bits dont le principe de fonctionnement tienne compte de critères psychoauditifs.
- Un autre objectif de l'invention est de minimiser les phénomènes de dégradation en chaîne à la reconstitution du signal lorsqu'une perturbation génératrice d'erreurs ou de brouillage se produit dans le canal de transmission.
- Un objectif complémentaire de l'invention est de fournir, dans un des modes de réalisation avantageux de l'invention un principe de transmission conjointe d'informations principales et d'informations auxiliaires, en optimisant le débit des informations auxiliaires, puis des informations principales.
- L'invention a également pour objectif de permettre l'utilisation d'un nombre de bits fixe pour le codage de chaque bloc d'informations.
- Ces objectifs, ainsi que d'autres qui apparaîtront par la suite, sont atteints à l'aide d'un dispositif d'allocation de bits, du type assurant le pilotage de moyens de quantification de compression d'un signal audionumérique transformé, destiné à être transmis à travers un canal à débit limité ou stocké sur un support d'informations numériques, dans lequel l'allocation consiste notamment à affecter à chaque bande d'un jeu de bandes adjacentes couvrant la totalité du spectre du signal transformé, un nombre de bits spécifique pour l'expression des coefficients transformés dudit signal, en fonction d'une information auxiliaire correspondant à la description du spectre dudit signal transformé, ledit dispositif étant informé par des moyens d'élimination préalable de composantes spectrales dudit signal transformé en fonction d'un critère psycho-auditif.
- Cette élimination de composantes spectrales pour l'élaboration de l'information auxiliaire permet une optimisation a priori de l'opération de quantification.
- Avantageusement, ledit dispositif comporte (de façon connue) des moyens de calcul du seuil de masquage de composantes spectrales sur critère psycho-auditif, pour l'optimisation de l'allocation des bits dans chacune desdites bandes.
- De façon préférentielle, ledit critère psycho-auditif fonctionne selon le critère de masquage psycho-auditif de ZWICKER.
- Selon une caractéristique importante de l'invention, lesdits moyens de quantification comportent au moins deux quantificateurs distincts et des moyens d'affectation sélective de l'un desdits quantificateurs à chacune desdites bandes du spectre dudit signal transformé en fonction du nombre de composantes conservées dans ladite bande, après ladite élimination des coefficients masqués.
- Dans un mode de réalisation préférentiel de l'invention, ledit dispositif comprend des moyens de minimisation d'un rapport bruit de quantification/seuil de masquage dans chacune desdites bandes.
- De façon avantageuse, ledit bruit de quantification est déterminé en fonction d'au moins une des trois informations appartenant au groupe comprenant:
- l'écart-type desdites composantes spectrales non éliminées dans ladite bande ;
- un facteur de performance dudit quantificateur sélectionné pour ladite bande ;
- une information d'étalement spectral de ladite bande. - Selon une autre caractéristique de l'invention, ladite information fournie par lesdits moyens d'élimination préalable de composantes spectrales est élaborée par des moyens de codage des longueurs de suites pour le codage des indices desdites composantes spectrales masquées.
- Préférentiellement, lesdits moyens de codage des longueurs de suites utilisent un code à longueur variable du type des codes de HUFFMAN.
- Selon une caractéristique avantageuse, lesdits moyens de codage des longueurs de suites délivrent un mot de code spécifique pour le codage des bandes de fréquence dont toutes lesdites composantes sont éliminées.
- De façon avantageuse, lesdits moyens de codage des longueurs de suites sont activées par des moyens de sélection, en fonction d'une information de gain de débit apporté par ledit codage.
- Selon une autre caractéristique importante de l'invention, ledit dispositif coopère avec des moyens de codage desdites informations auxiliaires correspondant à la description du spectre.
- De cette façon, il est possible de transmettre en permanence une information auxiliaire, sans que cela ne nuise de façon importante au débit de l'information principale.
- De façon préférentielle, lesdits moyens de codage comprennent des moyens de codage prédictif.
- Ainsi, les risques de dégradation en chaîne sont supprimés en ce qui concerne l'information principale. Cela ne peut se produire, dans l'invention, que sur l'information auxiliaire.
- Avantageusement, lesdits moyens de codage prédictif comprennent des moyens appartenant au groupe comprenant les moyens de conversion logarithmique, les moyens de codage MIC différentiel, et les moyens de codage par code à longueur variable, du type des codes de HUFFMAN.
- Préférentiellement, lesdits moyens de codage comprennent également des moyens de codage sans mémoire interblocs, lesdits moyens de codage prédictif et lesdits moyens de codage sans mémoire étant sélectionnés selon un critère prédéterminé.
- Avantageusement, ce critère prédéterminé est un critère de moindre débit et/ou un critère de minimisation de l'effet des erreurs de transmission.
- Selon une caractéristique avantageuse de l'invention, au moins une des informations appartenant au groupe comprenant ladite information auxiliaire correspondant à la description du spectre, ladite information fournie par lesdits moyens d'élimination des composantes inaudibles et une information d'étalement spectral, est transmise ou stockée conjointement à chacun des blocs d'information principale.
- Selon une autre caractéristique de l'invention, ledit signal numérique transformé est élaboré par des moyens de codage par transformation utilisant une transformée du type de la transformée en cosinus discrète modifiée de PRINCEN et BRADLEY.
- De façon avantageuse, lesdits moyens de codage par transformation comportent des moyens de fenêtrage adouci du signal temporel faisant apparaître une symétrie dans ledit signal transformé.
- Préférentiellement, lesdits moyens de fenêtrage utilisent une fenêtre définie par :
F(n) = √2.sin(π(n+0,5)/N) n = 0,....,N-1
où N est le nombre d'échantillons de ladite fenêtre. - D'autres caractéristiques et avantages de l'invention apparaîtront à la lecture suivante d'un mode de réalisation préférentiel de l'invention, donné à titre illustratif et non limitatif, et des dessins annexés, dans lesquels :
- - la figure 1 est le synoptique d'un dispositif de codage de signaux audionumériques comprenant un dispositif d'allocation de bits selon l'invention ;
- - la figure 2 est le schéma fonctionnel du module d'élimination des raies masquées ;
- - la figure 3 représente le schéma fonctionnel détaillé du module de calcul et de codage de l'information auxiliaire ;
- - la figure 4 est le schéma fonctionnel du module de codage prédictif de l'information auxiliaire ;
- - la figure 5 est un schéma illustrant le principe d'élimination des raies masquées d'après l'analyse de ZWICKER.
- - la figure 6 présente le schéma fonctionnel du module de sélection d'un quantificateur parmi plusieurs ;
- - la figure 7 est le schéma fonctionnel du dispositif d'allocation de bits à chaque bande.
- Le dispositif de la figure 1 permet le codage de données audio-numériques selon le procédé de l'invention. Le signal d'entrée x(n) 10, échantillonné à une fréquence supérieure ou égale à 32 kHz, est appliqué au module de transformation 11. La fréquence d'échantillonnage correspond à celle utilisée pour le son haute fidélité.
- Dans un mode de réalisation préférentiel du module de transformation 11, on utilise avantageusement la transformée mise au point par PRINCEN et BRADLEY ("Adaptative Transform Coding incorporating Time Domain Aliasing Cancellation" (Codage adaptatif par transformation à annulation dans le domaine temporel des phénomènes dus au repliement du spectre) ; in Speech Communication ; Décembre 1987), encore appelée transformée en cosinus discrète modifiée (TCDM). Cette transformée correspond à une projection sur une base en cosinus. Les coefficients de transformée sont définis par :
N : taille du bloc de transformée,
h(n) : fenêtre de pondération des blocs,
m : numéro du bloc de transformée. - Son avantage principal est lié au fait qu'elle autorise l'emploi de fenêtres de pondération h(n) performantes sur le plan spectral réalisant ainsi une excellente séparation des canaux de transformée. La concentration d'énergie est alors plus forte qu'avec la transformée de Fourier discrète (TFD) par exemple, et les coefficients à coder sont très proches du spectre véritable.
- Avant d'être transformé, le bloc d'échantillons temporels est donc pondéré par une fenêtre h(n). On utilise une fenêtre "adoucie", par exemple une fenêtre de forme sinusoïdale, définie par : h(n) = √2 sin(π(n+0,5)/N), n variant de 0 à N-1, N étant le nombre d'échantillons par blocs temporels. La TCDM utilisée fonctionne en parfaite synergie avec ce type de fenêtre adoucie. En effet, ce type de fenêtre permet d'obtenir, après transformation, N/2 coefficients uniques, les N/2 autres coefficients étant identiques, au signe près. Au contraire, une fenêtre rectangulaire entraînerait un étalement spectral par rapport au signal d'origine. Du fait que sa mise en oeuvre réclame d'autre part un recouvrement interblocs valant 50 % de la taille des blocs, le nombre de coefficients transformés est identique au nombre d'échantillons d'origine du signal source à transmettre à chaque bloc. Ce chevauchement interblocs est nécessaire pour assurer la parfaite reconstruction du signal.
- Les coefficients y(k) 12 sortant du module de transformation 11 sont ensuite présentés aux entrées des divers modules de codage 13,14,15,16,17.
- Un premier bloc 14 réalise tout d'abord l'élimination des composantes spectrales inaudibles dans le signal transformé 12.
- Cette opération d'élimination se base par exemple sur l'analyse de ZWICKER, comme détaillé plus loin. Cette analyse permet de distinguer dans un signal audio des raies masquées, correspondant à des fréquences inaudibles. Les coefficients de transformées correspondant à ces composantes inaudibles ne sont pas transmis.
- La TCDM étant caractérisée par une bonne séparation en fréquence, le nombre de raies éliminées peut être important. Il en résulte une réduction significative du nombre de valeurs à transmettre. De plus, ces coefficients non transmis étant en général de niveau faible, les quantificateurs utilisés pour les coefficients transmis peuvent être optimisés en conséquence.
- Le module d'élimination des raies masquées 14 est plus précisément décrit plus loin, en liaison avec la figure 2.
- Les raies spectrales conservées fournies en sortie du module 14 servent d'entrée au module 15 de calcul et de codage de l'information auxiliaire. L'information auxiliaire générée par le module 15 est calculée par bandes de fréquence de largeurs inégales et peut être codée par deux modes différents. Si le signal est stationnaire, le codage a lieu par rapport aux blocs précédents (prise en compte de la corrélation inter-trames), sinon le bloc courant est un bloc de transition et le codage a lieu sans prise en compte de la mémoire inter-blocs.
- Ces moyens de codage sont décrits plus précisément par la suite, en liaison avec la figure 3.
- Les sorties du module 14 d'élimination des raies masquées et du module 15 de calcul et de codage de l'information auxiliaire alimentent le module 16 d'allocation des bits pilotant le quantificateur 17. La sortie du bloc 16 d'allocation de bits fournit une information 18 du nombre de bits R disponible pour l'expression de chacun des coefficients y(k) du signal transformé 12. Cette allocation de bits est dynamique : elle varie d'un bloc au suivant. De plus, elle est conçue pour assurer le masquage du bruit de quantification.
- Le module d'allocation des bits 16 a également comme entrée les valeurs de la fonction d'étalement spectral mesurée par bandes de fréquence fournie par un module 13 de calcul et de codage de l'étalement spectral, sur les coefficients du signal transformé 12. Ceci permet de caractériser la nature du spectre, et notamment s'il est fortement concentré ou non.
- Le fonctionnement du module d'allocation des bits 16 est développé plus loin.
- Enfin, il est procédé dans le module 17 à la quantification des coefficients y(k) du signal 12, d'après l'information 18 du nombre de bits R alloué. De plus, selon une caractéristique importante de l'invention, l'information 19 obtenue en sortie du codeur 15 de l'information auxiliaire ainsi que l'information d'élimination des raies masquées issue du module 14 permettent de choisir, pour le bloc courant, un quantificateur parmi plusieurs quantificateurs disponibles, comme on le verra ci-après.
- Le décodage se fait de façon tout à fait symétrique au codage.
- La figure 2 présente le schéma fonctionnel du module 14 d'élimination des raies masquées.
- La fonction de ce module 14 est de discriminer les raies inaudibles du fait des phénomènes de masquage, afin que ne soit transmise que l'information perceptuellement utile.
- Cette procédure est particulièrement avantageuse pour les sons à spectre large, riches en harmoniques. Un nombre important de coefficients est alors masqué. C'est justement ce type de signal qui réclame un débit plus fort, du fait de la quantité d'information à transmettre.
- Ce dispositif comprend un module de détection des raies masquées. Cette détection porte sur le spectre réel et n'est effectuée qu'au codeur. Elle fait appel aux courbes de masquage fréquentiel, d'après l'analyse de ZWICKER. Comme illustré en figure 5, il apparaît que pour chaque raie 51 émise, les raies se trouvant sous une ligne 52 de - 25 dB par bande critique en amont de la raie et sous une ligne 53 de - 10 dB par bande critique en aval, sont inaudibles. Ces deux pentes correspondent respectivement aux masquages fréquentiels antérieur et postérieur.
- Le spectre est partagé en 24 bandes critiques B₁,B₂,B₃ et multiplié par le facteur a₀ de transmission de l'oreille pour chacune desdites bandes.
- Le calcul du seuil de masquage est séparé en masquage "intra-bande critique" et "inter-bandes critiques".
- Le masquage intrabande correspond à l'effet global de masquage de toutes les raies 51₁,51₂ à l'intérieur d'une même bande B₂. Le calcul du seuil de masquage intra-bande est réalisé par sommation de la contribution de chaque coefficient y(k) du signal transforme.
- Si l'on considère la bande critique j, délimitée par bb(j), limite inférieure, et bh(j), borne supérieure, la contribution du coefficient y(k) au seuil de masquage intrabande sin(i) est donnée par :
sin k(i) = Θ.(y(k)².a₀(j))
avec bb(j)≦i≦k-3 et k+3≦i≦bh(j)
où Θ est un décalage constant correspondant à - 30 dB. - Ainsi que l'on peut le constater, chaque coefficient y(k) n'affecte pas le seuil de masquage des 4 coefficients les plus proches. Cette précaution est nécessaire pour éviter des mises à zéro intempestives pouvant se produire autour des pics du spectre.
-
- Le masquage interbande résulte de la prise en compte, dans chaque bande B₂, de l'effet de masquage des bandes adjacentes. En fait, seul le masquage postérieur (celui des raies 51₃ de la bande B₃) est considéré pour le calcul du seuil de masquage inter-bandes. Le masquage antérieur (bande B₁) est trop faible pour modifier sensiblement le nombre de raies masquées par bloc (-25 dB par bande critique au lieu de -10 dB).
-
-
- Finalement, pour le coefficient y(i), de la bande critique j, le seuil de masquage final est obtenu par sommation :
s(i) = sin(i) + sout(j) - L'énergie du coefficient y(i), multiplié par le facteur de transmission a₀(j), est alors comparée au seuil de masquage ainsi défini. Si a₀(j).y² (i)>s(i), le coefficient y(i) est supposé masqué.
- Cette fonction est réalisée par le sous-module 21 de la figure 2. Cette figure détaille les sous-modules principaux constitutifs du module 14 d'élimination des raies masquées de la figure 1.
- Avantageusement, la détection des raies masquées dans le sous-module 14 est suivie d'un codage des indices des raies masquées, réalisé par le bloc 20. Ce codage, nécessaire pour indiquer au décodeur les numéros des coefficients masqués, fait par exemple appel à la technique de codage des longueurs de suite ("Run Length Coding").
- Soit Im(k), un bit valant 1 si le coefficient y(k) est masqué. La série des {Im(k),k=0,...,N/2) présente des suites ininterrompues de 0 et de 1, plus ou moins longues formées dans un sous-module 22. C'est la longueur des suites qui est transmise à l'aide d'un code à longueur variable 23. Si de nombreuses raies de même état se suivent sans discontinuité, alors le débit à allouer à cette information auxiliaire peut être faible.
- Le codage à longueur variable du sous-module 23 est assuré avantageusement par un code de Huffman calculé à partir d'une densité de probabilité expérimentale.
- Le codage des suites ne débute qu'à partir de la première raie masquée. Le numéro de celle-ci est transmis sur 9 bits.
- Au codeur, le "Run Length Coding" consiste simplement à rechercher toutes les suites de 0 et de 1 et à leur associer le mot de code de Huffman correspondant.
- La longueur des suites est limitée à des valeurs maximales : 64 coefficients pour les suites de 0 et 128 coefficients pour les suites de 1. Si ces limites sont dépassées, une suite de longueur nulle et d'état inverse, est transmise. A cette suite de longueur nulle est associée un mot de code de Huffman, calculé lui aussi (hors ligne) d'après l'occurence de la suite.
- Au décodeur, après réception du numéro de la première raie masquée, il suffit de procéder au décodage des codes de Huffman. Les suites de codes de longueurs de 0 et de 1 permet de reconstituer exactement la série {Im(k)}.
- Si les suites de 0 et de 1 sont très morcelées, le débit d'informations auxiliaires peut être important. Pour un faible nombre de raies masquées, le gain de leur non-transmission peut-être nul, voire négatif. Il convient alors de ne pas procéder à cette non-transmission ou tout au moins de la restreindre à certaines zones fréquentielles.
- Pour cela, le nombre moyen de bits par coefficients est calculé dans les 2 cas :
- transmission de tous les coefficients :
R₁(k) = (R₀ - Rifs)/(N/2)
où . R₀ est le nombre total de bits par bloc,
. Rifs est le nombre de bits nécessaire à la transmission de l'information auxiliaire de description du spectre. Rifs est en fait la valeur au bloc précédent.
- non-transmission des raies masquées par utilisation du codage des longueurs de suite :
R₂(k) = (R₀-Rifs-Rim)(N/2-Nrm)
où . Rim est le débit auxiliaire pour le codage des longueurs de suites,
. Nrm est le nombre de raies masquées. - La non-transmission des raies masquées est effectuée pour toute la bande considérée, si le sous-module 24 de calcul du débit et de test établit que :
Rim < Nrm.(2(R₀-Rifs)/N) - Si cette condition n'est pas respectée, ce test est accompli dans 4 sous-bandes de fréquence de la bande considérée, de largeurs égales. Lors de la recherche des suites de 0 et de 1, les valeurs "locales" Rim(l) et Nrm(l) (l = 1,...,4) sont calculées.
- Si Rim(l) < Nrm(l).(2(R₀-ifs/N), c'est-à-dire si le gain en bits est positif pour la sous-bande l de fréquence considérée, le "Run Length Coding" est appliqué aux coefficients de cette sous-bande l.
- Sinon tous les coefficients de cette bande sont considérés comme étant non masqués et l'indice du premier coefficient forcé à 0 est modifié en conséquence.
- Le sous-module 25 de validation du codage pilote le sous-module 23 de codage à longueur variable, en fonction de la nécessité ou non de réaliser le codage.
- Le débit auxiliaire moyen est de l'ordre de 0,8 bits par raie masquée. Cette faible valeur prouve l'intérêt de l'utilisation du codage des longueurs de suites.
- La figure 3 représente le schéma fonctionnel détaillé du module 15 de calcul et de codage de l'information auxiliaire.
- La transmission d'une information auxiliaire est nécessaire au calcul de l'allocation des bits et à la quantification des coefficients. Cette information auxiliaire 19 constitue en fait un descripteur plus ou moins précis du spectre du signal.
- Dans le mode de réalisation décrit, le descripteur de spectre est calculé dans un sous-module 31 par bandes de fréquence de largeurs inégales. Le spectre est partagé par exemple en 50 groupes de fréquence.
- Les limites, bsi b(j) et bsi h(j), de ces bandes respectent celles des bandes critiques. Les bandes les plus étroites (j = 1,...,14) ont la même largeur que les bandes critiques correspondantes. Les autres bandes ont une largeur croissante qui atteint pour la dernière (j = 50) 562,5 Hz (c'est-à-dire 18 coefficients).
-
- Nsi(j) est le nombre de coefficients non masqués dans la bande j.
- L'originalité du codage de cette information, selon l'invention, réside dans la prise en compte de la corrélation existant entre les blocs de transformée successifs au moyen d'un codage prédictif. Ainsi, le codeur profite de toutes les corrélations du signal (à court terme et à plus long terme).
- Le codage de l'information auxiliaire est habituellement effectué sans tenir compte des propriétés perceptuelles, à la différence de la quantification des coefficients. Il convient cependant de réserver le plus de bits possible au débit du signal principal 101, et donc de réduire le débit de l'information auxiliaire 19.
- Un codage direct des composantes du descripteur de spectre σ(m,j) (m numéro de bloc) réclame un débit élevé. Cependant, les signaux étant en général fortement stationnaires, le descripteur de spectre est très corrélé d'un bloc au suivant.
- Le moyen le plus direct pour profiter de cette stationnarité est d'effectuer un codage prédictif 32. Du fait de la grande dynamique spectrale, il est préférable d'appliquer la prédiction à σ(m,j) exprimé en dB. En effet, c'est plutôt le rapport σ(m,j)/σ(m-1,j) qui présente un gain de prédiction élevé, que la différence σ(m,j)-a(m-1,j).
- Comme représenté en figure 4, ce codage prédictif comporte un opérateur 41 de conversion sur une échelle logarithmique suivi du code MIC Différentiel et d'un dispositif 43 de codage à longueur variable.
- La prédiction est réalisée par un prédicteur 44 d'ordre 1. Le coefficient de prédiction a₁ peut prendre une valeur entre 0,95 et 1. L'entrée de ce prédicteur 44 est la valeur quantifiée précédente log(σ′(m,j)).
- L'erreur de prédiction
e(m,j) = log(σ(m,j)) - a₁.log(σ′(m-1,j))
avec j = 1,....,50
est quantifiée par un quantificateur uniforme 45 ayant par exemple 32 niveaux pour une dynamique de (-2,2]. - Puisque le signal est stationnaire sur des durées importantes, la densité de probabilité des mots de code en sortie du quantificateur 45 est très concentrée. Par conséquent, ces mots de code subissent un codage à longueur variable 43 (codage de HUFFMAN) qui permet de réduire le débit de transmission des descripteurs de spectre à environ 2,5 bits par valeur σ′(m,j).
- La valeur log (σ′(m,j)) est obtenue par la sommation 46 de la valeur fournie par un quantificateur inverse 47, correspondant à la valeur que l'on obtiendra au décodage, et de la valeur précédente issue du prédicteur 44.
- Si une bande de fréquence est entièrement masquée (Nsi(j) = 0), il n'est pas nécessaire de transmettre un mot de code pour la bande j. En effet, la valeur de σ(m,j) est dans ce cas connue au décodeur au moyen de l'information concernant les raies masquées.
- Toutefois, pour éviter qu'une erreur de transmission sur les bits I(m,k) se répercute sur les valeurs σ′(m,j), une redondance est volontairement introduite dans le codage : si Nsi = 0, un mot de code spécifique est transmis, calculé en fonction de ses occurrences, comme les autres modes de code.
- Ainsi, lorsque la bande cesse d'être entièrement masquée, la prédiction porte sur la dernière valeur non nulle σ′(m-p,j) transmise.
- Lors des transitions spectrales (non-stationnarités du signal), cette procédure de quantification n'est plus valable car elle réclame un débit trop important pour conserver la même précision de quantification. Il est alors nécessaire de faire appel à un codage sans mémoire de σ(m,j), mis en oeuvre dans le sous-module 34.
- Ce second codage 34 est similaire au précédent. La prédiction a lieu fréquentiellement au lieu d'être effectuée sur les blocs de transformée successifs. L'erreur de prédiction est calculée par :
e(m,j) = log(σ(m,j)) - log(σ′(m,j-1)) - e(m,j) est codée par un quantificateur uniforme ayant par exemple une dynamique de 100 dB et 50 niveaux de quantification. Les mots de code en sortie subissent aussi un codage de HUFFMAN.
- La première valeur σ(m,1) est transmise séparément.
- Un module 33 de choix du type de codage sélectionne le meilleur codage, d'après le nombre de bits dépensés. Si le débit nécessaire au codage inter-trames dépasse un seuil préalablement fixé, le second type de codage 34 est employé. Ce choix est transmis au décodeur à l'aide d'un bit de décision 35.
- Il est également possible de tenir compte, pour la sélection du type de codage, d'un autre critère que celui de la minimisation du débit. On peut par exemple agir de façon à minimiser l'effet des erreurs de transmission.
- Le prédicteur 44 de la figure 4 est un prédicteur auto-regressif d'ordre 1 (AR(1)) avec un coefficient de prédiction très proche de 1. Par conséquent, l'effet des erreurs de transmission risque de se propager indéfiniment. Puisque l'information auxiliaire a une importance majeure, entre autres pour l'allocation des bits, il est nécessaire de réinitialiser le codage inter-trames. A cet effet, pour tous les blocs de rang multiple de 16, le codage sans mémoire interblocs, est utilisé, même si le signal est stationnaire.
- Les coefficients y(k) 12 sont codés au moyen de quantificateurs adaptatifs non uniformes. L'adaptation est réalisée par le descripteur de spectre quantifié σ′(m,j), où j est le numéro de la bande à laquelle appartient y(k).
- Chaque valeur σ′(m,j) représente un nombre variable, Nsi(j), de coefficients y(k) non nuls, du fait de la largeur variable des bandes de fréquence et du dispositif de détection des raies masquées. Les performances des quantificateurs varient en fonction du nombre de coefficients à quantifier Nsi(j).
- Selon l'invention, et de façon à optimiser le système de codage, plusieurs jeux de quantificateurs sont disponibles, en fonction de Nsi(j). La figure 6 présente le schéma fonctionnel du module de sélection du quantificateur à utiliser.
- Par exemple, dans la configuration suivante, 5 jeux 61₁ à 61₅ de quantificateurs sont disponibles. Un module 62 de test sur la valeur Nsl(j) pilote un sélecteur 63, selon les critères suivants :
- le premier pour les bandes ayant 1 coefficient non nul : Nsi(j) = 1 ;
- le second jeu pour : Nsi(j) = 2 ;
- le troisième jeu pour : 6 > Nsi(j) > 2 ;
- le quatrième jeu pour : 10 > Nsi(j) > 5 ;
- le cinquième jeu pour : Nsi(j) > 9. - Dans chaque cas, des quantificateurs optimaux pour un nombre de bits variant par exemple entre 1 et 6 bits, ont été calculés. Un second sélecteur 64 permet de choisir, dans chaque jeu de quantificateurs 65₁ à 65₆, le quantificateur optimal, en fonction du nombre de bits R 18. Ainsi, l'optimisation du choix du quantificateur est réalisée en fonction du nombre de coefficients à quantifier et du nombre de bits alloués par le module d'allocation de bits.
- La figure 7 présente le dispositif d'allocation des bits à chaque bande selon l'invention.
- L'allocation des bits est conçue pour accomplir la mise en forme spectrale du bruit de quantification d'après des critères perceptuels. Elle minimise le rapport bruit/seuil de masquage. Cette procédure est effectuée au codeur et au décodeur et est basée sur le descripteur de spectre préalablement transmis.
- L'allocation des bits comporte un module 71 de calcul du seuil de masquage S(k) - calcul similaire à celui effectué pour la détection des raies masquées - et un module 72 de quantification du rapport α(k).β(k).σ² (k)/S(k) comparable à celui décrit par Yannick MAHIEUX dans l'article "Transform Coding of Audio Signals Using Correlation between successive Transform Blocks" (Codage par transformation de signaux audio utilisant la corrélation entre les blocs transformés successifs) (Actes du congrès ICASSP, 1989, Glasgow).
- σ² (k) est le carré du descripteur de spectre, étendu à tous les coefficients y(k) de la bande. Il s'agit de l'élément essentiel du rapport à quantifier. Puisque les coefficients sont codés avec des jeux de quantificateurs différents (selon Nsi(j)), il est nécessaire d'inclure les performances relatives de chaque jeu de quantificateurs dans l'allocation des bits, d'après l'ouvrage de JAYANT et NOLL : "Digital Coding of Waveforms" (Codage numérique de formes d'onde) (1984 ; Prentice Hall Signal Processing Series).
- La fonction α(k) est égale au facteur de performance du quantificateur à utiliser pour le coefficient y(k). Une table 73 comporte par exemple 5 valeurs de α(k) calculées préalablement. Cette table est adressée par le nombre de coefficients non nuls. La prise en compte des performances réelles des jeux de quantificateurs permet une amélioration très sensible de la qualité du codage.
-
- Pour l'allocation des bits, γ est calculé dans 4 bandes de fréquence de largeur égales. Ces 4 valeurs sont transmises au décodeur à l'aide d'une quantification uniforme sur 6 bits.
- Dans chacune de ces 4 bandes de fréquence, la fonction β(k) est calculée d'après la valeur de γ par l'intermédiaire d'une fonction non linéaire. Le rôle de β(k) est de forcer l'allocation des bits à accorder un nombre de bits plus important aus zones du spectre qui contiennent des pics. En effet, les coefficients y(k) correspondant aux sons purs contenus dans le signal doivent être codés avec une meilleure précision, le seuil de masquage ayant alors un niveau par rapport à celui du signal, plus faible que dans le cas d'un spectre de bruit.
- La détection explicite des composantes spectrales inaudibles, ainsi que l'utilisation de la corrélation interblocs, permettent de réduire le débit d'un signal haute qualité, de fréquence d'échantillonnage d'origine supérieure à 32 kHz, à une valeur voisine de 64 kbits/s tout en conservant, d'un point de vue résultat auditif, la qualité du signal de départ.
Claims (19)
dispositif caractérisé en ce qu'il est informé par des moyens (14; 20,21) d'élimination préalable de composantes spectrales dudit signal transformé en fonction d'un critère psycho-auditif.
- l'écart-type desdites composantes spectrales non éliminées dans ladite bande ;
- un facteur de performance dudit quantificateur sélectionné pour ladite bande ;
- une information d'étalement spectral de ladite bande.
F(n) = √2.sin(π(n+0,5)/N) n = 0,....,N-1
où N est le nombre d'échantillons de ladite fenêtre.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR8913649 | 1989-10-13 | ||
FR8913649A FR2653280B1 (fr) | 1989-10-13 | 1989-10-13 | Dispositif d'allocation de bits pour signal audio-numerique transforme, a quantification adaptative sur critere psycho-auditif. |
Publications (2)
Publication Number | Publication Date |
---|---|
EP0423050A1 true EP0423050A1 (fr) | 1991-04-17 |
EP0423050B1 EP0423050B1 (fr) | 1994-12-14 |
Family
ID=9386536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP90460037A Expired - Lifetime EP0423050B1 (fr) | 1989-10-13 | 1990-10-12 | Dispositif de compression d'un signal audio-numérique transformé, à quantification adaptative sur critère psycho-auditif |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP0423050B1 (fr) |
JP (1) | JP3168578B2 (fr) |
DE (1) | DE69015105T2 (fr) |
FR (1) | FR2653280B1 (fr) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0554081A1 (fr) * | 1992-01-29 | 1993-08-04 | Sony Corporation | Appareil et procédé pour la compression de données |
EP0554858A2 (fr) * | 1992-02-05 | 1993-08-11 | Sony Corporation | Appareil de lecture de disque et appareil d'enregistrement de disque |
EP0575110A2 (fr) * | 1992-06-16 | 1993-12-22 | Sony Corporation | Compression et décompression de signaux numériques |
US5461378A (en) * | 1992-09-11 | 1995-10-24 | Sony Corporation | Digital signal decoding apparatus |
US5548574A (en) * | 1993-03-09 | 1996-08-20 | Sony Corporation | Apparatus for high-speed recording compressed digital audio data with two dimensional blocks and its compressing parameters |
US5581654A (en) * | 1993-05-25 | 1996-12-03 | Sony Corporation | Method and apparatus for information encoding and decoding |
US5608713A (en) * | 1994-02-09 | 1997-03-04 | Sony Corporation | Bit allocation of digital audio signal blocks by non-linear processing |
US5642111A (en) * | 1993-02-02 | 1997-06-24 | Sony Corporation | High efficiency encoding or decoding method and device |
US5684923A (en) * | 1992-11-11 | 1997-11-04 | Sony Corporation | Methods and apparatus for compressing and quantizing signals |
US5752224A (en) * | 1994-04-01 | 1998-05-12 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus information transmission method and information recording medium |
US5758316A (en) * | 1994-06-13 | 1998-05-26 | Sony Corporation | Methods and apparatus for information encoding and decoding based upon tonal components of plural channels |
US5781586A (en) * | 1994-07-28 | 1998-07-14 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium |
WO1998033284A2 (fr) * | 1997-01-27 | 1998-07-30 | British Broadcasting Corporation | Compression audio |
US5819214A (en) * | 1993-03-09 | 1998-10-06 | Sony Corporation | Length of a processing block is rendered variable responsive to input signals |
US5832426A (en) * | 1994-12-15 | 1998-11-03 | Sony Corporation | High efficiency audio encoding method and apparatus |
US5870703A (en) * | 1994-06-13 | 1999-02-09 | Sony Corporation | Adaptive bit allocation of tonal and noise components |
USRE36559E (en) * | 1989-09-26 | 2000-02-08 | Sony Corporation | Method and apparatus for encoding audio signals divided into a plurality of frequency bands |
US6097880A (en) * | 1996-08-20 | 2000-08-01 | Sony Corporation | Digital signal processing method, digital signal processing apparatus, digital signal recording method, digital signal recording apparatus, recording medium, digital signal transmission method and digital signal transmission apparatus |
US6647063B1 (en) | 1994-07-27 | 2003-11-11 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus and recording medium |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2687871B1 (fr) * | 1992-02-25 | 1995-07-07 | France Telecom | Procede et dispositif de filtrage pour la reduction des preechos d'un signal audio-numerique. |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0111612A1 (fr) * | 1982-11-26 | 1984-06-27 | International Business Machines Corporation | Procédé et dispositif de codage d'un signal vocal |
EP0309974A1 (fr) * | 1987-09-30 | 1989-04-05 | Deutsche Thomson-Brandt GmbH | Procédé pour transmettre un signal audible |
-
1989
- 1989-10-13 FR FR8913649A patent/FR2653280B1/fr not_active Expired - Lifetime
-
1990
- 1990-10-12 EP EP90460037A patent/EP0423050B1/fr not_active Expired - Lifetime
- 1990-10-12 DE DE69015105T patent/DE69015105T2/de not_active Expired - Lifetime
- 1990-10-15 JP JP27347390A patent/JP3168578B2/ja not_active Expired - Lifetime
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0111612A1 (fr) * | 1982-11-26 | 1984-06-27 | International Business Machines Corporation | Procédé et dispositif de codage d'un signal vocal |
EP0309974A1 (fr) * | 1987-09-30 | 1989-04-05 | Deutsche Thomson-Brandt GmbH | Procédé pour transmettre un signal audible |
Non-Patent Citations (2)
Title |
---|
ICASP - 1989 INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, Glasgow, 23 - 26 mai 1989, pages 1981-1984, IEEE, New York, US; B. BOCHOW et al.: "Multiprocessor implementation of an ATC autio codec" * |
IEEE JOURNAL ON SELECTED AREAS IN COMMUNICATIONS, vol. 6, no. 2, février 1988, pages 410-424, IEEE, New York, US; T. TANIGUCHI et al.: "ADPCM with a multiquantizer for speech coding" * |
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE36559E (en) * | 1989-09-26 | 2000-02-08 | Sony Corporation | Method and apparatus for encoding audio signals divided into a plurality of frequency bands |
EP0554081A1 (fr) * | 1992-01-29 | 1993-08-04 | Sony Corporation | Appareil et procédé pour la compression de données |
US5301205A (en) * | 1992-01-29 | 1994-04-05 | Sony Corporation | Apparatus and method for data compression using signal-weighted quantizing bit allocation |
CN1046608C (zh) * | 1992-01-29 | 1999-11-17 | 索尼公司 | 采用加权信号量化位分配进行数据压缩的装置和方法 |
EP0554858A2 (fr) * | 1992-02-05 | 1993-08-11 | Sony Corporation | Appareil de lecture de disque et appareil d'enregistrement de disque |
EP0554858A3 (en) * | 1992-02-05 | 1994-11-30 | Sony Corp | Disc reproducing apparatus and disc recording apparatus |
US5410526A (en) * | 1992-02-05 | 1995-04-25 | Sony Corporation | Disc reproducing apparatus and disc recording apparatus |
EP0575110A2 (fr) * | 1992-06-16 | 1993-12-22 | Sony Corporation | Compression et décompression de signaux numériques |
EP0575110A3 (fr) * | 1992-06-16 | 1994-01-26 | Sony Corporation | Compression et décompression de signaux numériques |
US5583967A (en) * | 1992-06-16 | 1996-12-10 | Sony Corporation | Apparatus for compressing a digital input signal with signal spectrum-dependent and noise spectrum-dependent quantizing bit allocation |
US5461378A (en) * | 1992-09-11 | 1995-10-24 | Sony Corporation | Digital signal decoding apparatus |
US5684923A (en) * | 1992-11-11 | 1997-11-04 | Sony Corporation | Methods and apparatus for compressing and quantizing signals |
US5642111A (en) * | 1993-02-02 | 1997-06-24 | Sony Corporation | High efficiency encoding or decoding method and device |
US5819214A (en) * | 1993-03-09 | 1998-10-06 | Sony Corporation | Length of a processing block is rendered variable responsive to input signals |
US5548574A (en) * | 1993-03-09 | 1996-08-20 | Sony Corporation | Apparatus for high-speed recording compressed digital audio data with two dimensional blocks and its compressing parameters |
US5581654A (en) * | 1993-05-25 | 1996-12-03 | Sony Corporation | Method and apparatus for information encoding and decoding |
US5608713A (en) * | 1994-02-09 | 1997-03-04 | Sony Corporation | Bit allocation of digital audio signal blocks by non-linear processing |
US5752224A (en) * | 1994-04-01 | 1998-05-12 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus information transmission method and information recording medium |
US5870703A (en) * | 1994-06-13 | 1999-02-09 | Sony Corporation | Adaptive bit allocation of tonal and noise components |
US5758316A (en) * | 1994-06-13 | 1998-05-26 | Sony Corporation | Methods and apparatus for information encoding and decoding based upon tonal components of plural channels |
US6647063B1 (en) | 1994-07-27 | 2003-11-11 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus and recording medium |
US5781586A (en) * | 1994-07-28 | 1998-07-14 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and information recording medium |
US5832426A (en) * | 1994-12-15 | 1998-11-03 | Sony Corporation | High efficiency audio encoding method and apparatus |
US6097880A (en) * | 1996-08-20 | 2000-08-01 | Sony Corporation | Digital signal processing method, digital signal processing apparatus, digital signal recording method, digital signal recording apparatus, recording medium, digital signal transmission method and digital signal transmission apparatus |
WO1998033284A3 (fr) * | 1997-01-27 | 1999-01-14 | British Broadcasting Corp | Compression audio |
WO1998033284A2 (fr) * | 1997-01-27 | 1998-07-30 | British Broadcasting Corporation | Compression audio |
Also Published As
Publication number | Publication date |
---|---|
JPH03167927A (ja) | 1991-07-19 |
FR2653280A1 (fr) | 1991-04-19 |
FR2653280B1 (fr) | 1992-01-10 |
DE69015105D1 (de) | 1995-01-26 |
DE69015105T2 (de) | 1995-07-20 |
EP0423050B1 (fr) | 1994-12-14 |
JP3168578B2 (ja) | 2001-05-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0423050B1 (fr) | Dispositif de compression d'un signal audio-numérique transformé, à quantification adaptative sur critère psycho-auditif | |
US5185800A (en) | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion | |
US5623577A (en) | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions | |
CA2027136C (fr) | Codage perceptif des signaux audio | |
US5632003A (en) | Computationally efficient adaptive bit allocation for coding method and apparatus | |
EP1107230A1 (fr) | Procédé de traitement de plusieurs flux binaires de données audio | |
EP0064119A2 (fr) | Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné | |
US5982817A (en) | Transmission system utilizing different coding principles | |
PL207862B1 (pl) | Nadajnik kodowania fonii i odbiornik dekodowania fonii, zwłaszcza dla cyfrowych systemów kodowania fonii w telekomunikacji | |
FR2961980A1 (fr) | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique | |
EP2979266B1 (fr) | Mixage partiel optimisé de flux audio codés selon un codage par sous-bandes | |
WO1998047134A1 (fr) | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc 'avant' et 'arriere' | |
FR2674710A1 (fr) | Procede et systeme de traitement des preechos d'un signal audio-numerique code par transformee frequentielle. | |
Johnson et al. | Adaptive transform coding incorporating time domain aliasing cancellation | |
EP2232489A1 (fr) | Codage/decodage par transformee, a fenetres adaptatives | |
CA2165450C (fr) | Affectation adaptative de bits efficace au point de vue calcul et qui tient compte des distorsions spectrales de decodage pour methode et appareil de codage | |
EP2979437B1 (fr) | Mixage optimisé de flux audio codés selon un codage par sous-bandes | |
WO2023165946A1 (fr) | Codage et décodage optimisé d'un signal audio utilisant un auto-encodeur à base de réseau de neurones | |
FR2494529A1 (fr) | Systeme de transmission numerique a codage adaptatif d'informations analogiques echantillonnees et transformees par transformation orthogonale | |
EP0891617B1 (fr) | Systeme de codage et systeme de decodage d'un signal, notamment d'un signal audionumerique | |
Thibolet et al. | A comparison of the performance of four low-bit-rate speech waveform coders | |
Teh et al. | Subband coding of high-fidelity quality audio signals at 128 kbps | |
Trinkaus et al. | An algorithm for compression of wideband diverse speech and audio signals | |
JPH08275931A (ja) | 短期スペクトラム及び音響心理モデルによるオーディオ信号の符号化方法及び装置 | |
Mahieux | High quality audio transform coding at 64 kbit/s |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): DE GB IT NL |
|
17P | Request for examination filed |
Effective date: 19910911 |
|
17Q | First examination report despatched |
Effective date: 19930823 |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: FRANCE TELECOM |
|
GRAA | (expected) grant |
Free format text: ORIGINAL CODE: 0009210 |
|
AK | Designated contracting states |
Kind code of ref document: B1 Designated state(s): DE GB IT NL |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: NL Effective date: 19941214 |
|
REF | Corresponds to: |
Ref document number: 69015105 Country of ref document: DE Date of ref document: 19950126 |
|
ITF | It: translation for a ep patent filed | ||
GBT | Gb: translation of ep patent filed (gb section 77(6)(a)/1977) |
Effective date: 19950123 |
|
NLV1 | Nl: lapsed or annulled due to failure to fulfill the requirements of art. 29p and 29m of the patents act | ||
PLBE | No opposition filed within time limit |
Free format text: ORIGINAL CODE: 0009261 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT |
|
26N | No opposition filed | ||
REG | Reference to a national code |
Ref country code: GB Ref legal event code: IF02 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: GB Payment date: 20090928 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: DE Payment date: 20091118 Year of fee payment: 20 |
|
PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] |
Ref country code: IT Payment date: 20091007 Year of fee payment: 20 |
|
REG | Reference to a national code |
Ref country code: GB Ref legal event code: PE20 Expiry date: 20101011 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: GB Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION Effective date: 20101011 |
|
PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] |
Ref country code: DE Free format text: LAPSE BECAUSE OF EXPIRATION OF PROTECTION Effective date: 20101012 |