EP2589045A1 - Codage/décodage prédictif linéaire adaptatif - Google Patents

Codage/décodage prédictif linéaire adaptatif

Info

Publication number
EP2589045A1
EP2589045A1 EP11737984.2A EP11737984A EP2589045A1 EP 2589045 A1 EP2589045 A1 EP 2589045A1 EP 11737984 A EP11737984 A EP 11737984A EP 2589045 A1 EP2589045 A1 EP 2589045A1
Authority
EP
European Patent Office
Prior art keywords
filter
current block
modified
signal
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP11737984.2A
Other languages
German (de)
English (en)
Other versions
EP2589045B1 (fr
Inventor
Pierrick Philippe
David Virette
Claude Lamblin
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of EP2589045A1 publication Critical patent/EP2589045A1/fr
Application granted granted Critical
Publication of EP2589045B1 publication Critical patent/EP2589045B1/fr
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Definitions

  • the object of the invention relates to the field of encoding / decoding audio and / or video data.
  • the invention may relate to the coding of sounds with alternating speech and music.
  • CELP Code-excited linear prediction
  • CELP coders are predictive coders and are intended to model the production of speech from various elements such as:
  • a stochastic excitation for example a white noise or an algebraic excitation
  • a long-term prediction to model the vibration of the vocal cords, in period voiced in particular
  • a short-term prediction in the form of a P-LPC (Linear Predictive Coding) filter, for modeling vocal tract modifications, such as the pronunciation of voiced consonants.
  • P-LPC Linear Predictive Coding
  • This number of coefficients P is chosen in order to correctly model the formational structure of the speech signal. Since the speech signal generally has four formants in the frequency band 0 to 4 kHz, ten filter coefficients correctly model this structure (two coefficients are necessary to model each formant).
  • an LPC order of 16 coefficients is typically employed.
  • the spectrum of a speech signal (in solid lines) is superimposed (in dotted lines) on the frequency response of an LPC filter modeling its spectral envelope.
  • the power of the residual signal r can be small and its spectrum flat, by a judicious choice of the coefficients ⁇ ,.
  • the residual signal is then easier to encode than the signal itself. It can be easily modeled by a strongly periodic harmonic signal, as shown in FIG. X (J) is the spectrum of the original signal s (black line) and E (/) is the spectrum of the residual signal r (in gray line).
  • the coefficients a are typically calculated by a correlation measurement on the signal s "(and by applying a Levinson-Durbin type algorithm to invert the Wiener-Hopf equations).
  • vocal tract modeling by the short-term prediction that models the spectral envelope in the form of a LPC filter
  • transform coding may be added in cases where the sounds do not respond to the speech production model.
  • CELP + TCX for "Transform Coded eXcitation”
  • the quality of the coding according to the AMR WB + is satisfactory for the audio signals consisting of speech mixtures with background noise or speech with musical background, so typically for the signals where the speech dominates in energy.
  • the envelope transmitted in LPC form is a relevant parameter since the signal consists mainly of speech which is described well thanks to a LPC envelope of a given order.
  • the envelope indeed describes the formants (related to the resonance frequencies of the vocal tract) as a function of the number of coefficients chosen.
  • the LPC envelope estimated and transmitted to the encoder is no longer sufficient.
  • the audio signal is then often too complex to be limited, for example, to five formants, and its evolution over time makes a fixed number of coefficients is not adapted.
  • the use of past information does not make it possible to anticipate the evolutions of the audio signal because using a backward predictor is relevant for a stationary signal but the spectrum at a given frame is precisely modeled and can be used to a next frame only if the statistical and especially spectral properties of the signal remain stable. Otherwise, the estimated LPC filter is irrelevant to the frame under consideration and the residual signal remains difficult to encode. The rear predictor loses all its interest.
  • a solution recommended in the state of the art is therefore to use a switch between a prediction filter "before", calculated on the current frame, and a prediction filter, calculated on the previously received signal.
  • the encoder analyzes the signal and decides whether the signal is stationary or not. If the signal is stationary, the back filter is used. Otherwise, a forward filter with few coefficients is transmitted to the decoder.
  • Such an embodiment makes it possible to precisely control the quality of the signal residual to be encoded. It is implemented in the ITU-T G.729-E standard, in which a decision on stationarity of the signal results in an estimated "back” filter with 30 coefficients, or an estimated “forward” filter with 10 coefficients.
  • the present invention improves the situation.
  • a method of encoding a digital audio signal comprising a succession of consecutive blocks of data, from a predictive filter.
  • the method within the meaning of the invention comprises in particular the use of a modified predictive filter for the coding of at least one current block.
  • This modified filter is constructed by the combination of:
  • the invention has many advantages: it makes it possible in particular not to switch abruptly from a rear filter to a front filter, but may for example offer the possibility of a transition by such a modified filter, in particular between the use of a rear filter and that of a front filter. It also avoids the passage through a filter before few coefficients to code a stationary signal with a complex envelope while it is only slightly disturbed by non-stationarity.
  • Another advantage is to enrich a rear filter by producing an optimum coding quality without necessarily transmitting a complete front filter, in particular with as many coefficients as for example a front filter.
  • Another advantage is to allow more choice to the encoder with different categories of filters: rear, front and modified.
  • Enrichment parameters include the coefficients of a modifying filter, and the modified filter is constructed by a combination of back filter and modifier filter.
  • This combination may be, in an exemplary embodiment described below, a convolution of the rear filter by the modifying filter. Alternatively, in another space, it may be a multiplication for example, or other.
  • Such an embodiment has the advantage of allowing a simplification of the calculation operations with a decoder receiving the aforementioned parameters.
  • the method may comprise, for the coding of a current block, a choice based on at least one predetermined criterion, a predictive filter of at least:
  • a front filter adapted for the current block
  • a modified filter estimated on the basis of a back filter and as a function of the signal in the current block.
  • This criterion can for example take into account a stationarity of the signal between the past block and the current block, for the choice of one of the filters from a rear filter, a front filter and a modified filter.
  • the predetermined criterion may comprise an estimate of a prediction gain based on a ratio between the power of the signal in the current block and the power of a residual signal after filtering this signal using each of the rear filters. , before and modified. Such an embodiment will be described in detail below, in particular with reference to FIGS. 4 and 5.
  • the aforementioned criterion can also take into account a number of parameters to be sent to a decoder for the decoding of a current block and comprising at least coefficients that comprise the filter to choose.
  • the predetermined criterion may include an optimum search between:
  • the method then comprises the steps:
  • c) calculating a plurality of modified filters of respective distinct orders, each estimated on the basis of a backward filter determined in step b) and as a function of the signal in a current block to be coded, d) comparing, for the same number of parameters to be sent to a decoder, this number being determined according to the filter orders, the performance of at least two filters among the front filters, the rear filters and the modified filters determined in steps a), b) and c ), and e) selecting, for the coding of a current block, a predictive filter having the best performance according to the comparison of step d), for a given number of parameters to be sent to a decoder.
  • the modifying filter can be estimated by any technique, such as for example:
  • the method may further comprise communication to a decoder of information of the type: choice of a front filter for a current block, with a transmission of parameters representing coefficients of the front filter,
  • the present invention thus also aims at a method of decoding a digital audio signal comprising a succession of consecutive blocks of data, the method using a predictive filter for the decoding of a current block, the method comprising in particular:
  • the decoding method may then comprise a step in which, for the decoding of at least one given current block, the predicted filter thus modified is used instead.
  • this combination may consist of a multiplication or convolution (or other) of the rear filter by the modifying filter.
  • the decoder may also use a rear filter or a front filter, according to the information received from the encoder.
  • the back filter can be reconstructed based on previously decoded data. For example, it is possible to use the residual signal that the decoder has received from the encoder, for a past block, if the order of the rear filter to be reconstructed is higher than a previously constructed filter for this past block.
  • the decoding method may thus comprise the steps, for the determination of the rear filter: determining a rear filter order, as a function of said received information, and estimating the rear filter, from previously decoded data and using this order of filtered.
  • the "filter order" information may be transmitted directly from an encoder to the decoder, or may consist of implicit information.
  • the decoder can be programmed to compute a NI coefficients back filter if a modified filter is to be constructed and calculate a N2 coefficients back filter for example if it is intended to use only a back filter for decoding.
  • the invention proposes a combination of rear filter and a modifying filter chosen to complement each other and to create a modified filter of better quality than the rear filter, since it is a version of the rear filter, enriched. by an update resulting from the characteristics taken from the current block.
  • the signal envelope is precisely described (for any type of signal), with an optimal transmission rate, whether in the form of a front filter, a rear filter or again a modified filter.
  • the transition between filter is smooth compared to the prior art and thus avoids the discontinuity effect described above with reference to the prior art.
  • the coding quality resulting from the use of the invention is then improved.
  • Figure 3 schematically illustrates a succession of blocks signal in the form of a frame, for the choice of a relevant filter, in particular for coding the signal
  • FIG. 4 illustrates an example of a prediction gain offered by the choice of a modified filter A 15 or a rear filter B 15 or a front filter Fi, depending on the order of this filter
  • FIG. 5 illustrates an example of a prediction gain that a filter offers as a function of the bit rate requested by the choice of this filter, necessary for the transmission of its coefficients (or of its parameters of enrichment of the back filter to be transmitted, for example in the form of ISF indices for a modified filter A i5, as will be seen in an exemplary embodiment described below),
  • FIG. 6A schematically illustrates an encoding device in one embodiment of the invention
  • FIG. 6B schematically illustrates the steps of an encoding method in an embodiment of the invention
  • FIG. 7A schematically illustrates a decoding device in one embodiment of the invention
  • FIG. 7B schematically illustrates the steps of a decoding method in an embodiment of the invention.
  • the notations used in the following are thus defined:
  • LPC Linear Predictive Coding
  • This technique can therefore be of the CELP type, for example according to the G.729, AMR or AMR-WB standards, or else a complementary coding transform can be used, for example in the sense of the G.718, G.729.1, AMR standards.
  • WB +, MPEG-D "Unified Speech and Audio Coding").
  • the filtering is intended to separate the signal to be coded into two components:
  • the LPC filter A (z) is thus of the form:
  • the number P denotes the number of non-zero coefficients. It is called "the order of the filter". Usually, a good number for a narrow-band speech signal (sampled at 8 kHz) is 10. This order can be increased, however, to better model the spectrum. signal and in particular to accentuate the precision of its envelope. It can also be increased if the signal sampling frequency is higher.
  • the residual signal can also be presented in the perceptual weighted domain.
  • a modification of this filter is used to better take into account the properties of the human ear during the coding of the residual.
  • the coefficients a t of the LPC filter are commonly estimated by identifying the audio signal and its least squares prediction. We therefore seek the coefficients a t minimizing the quadratic error of the passed audio signal, through the filter A (z). It is therefore sought to minimize the power of the signal r n . This power is estimated over a certain period representing a number of samples N. The coefficients are therefore valid for this period of time.
  • This estimation of LPC filter coefficients is thus carried out by estimating the autocorrelation terms of the signal x n , and by solving the equations of Yule Walker or Wiener Hopf, typically by a fast algorithm of the Levinson Durbin type, as described by example in the reference:
  • the estimation of the coefficients of the LPC filter can be performed on the current signal x n , on a frame representing a set of samples, or on a version of the signal x m (m ⁇ n) resulting from a previous local decoding ( complete or partial) of the signal in coded form.
  • Local decoding is obtained by decoding the encoded parameters at the encoder. This local decoding makes it possible to recover, at the level of the coder, the information that can be used by the decoder in the same way.
  • the LPC filter is calculated on the original samples of the current frame (t-frame), or previous frames (t-1, t-2, etc.): in such cases, it is a LPC filter "Before” and its coefficients (hereinafter referred to as ”) shall be communicated to the decoder, or
  • the LPC filter can be calculated from locally decoded samples, thus older than the current frame (t-1, t-2, etc.): in this case, it is a "backward" LPC filter and the decoder is also capable of estimating the coefficients (denoted b n ) of the same LPC filter, which therefore does not need to be communicated to the decoder.
  • the performance of the LPC filter can then be evaluated by estimating the power of the residual signal (i.e. the signal strength resulting from the filtering of the original signal of the current frame by the LPC filter considered).
  • the ratio of the power of the original signal divided by the power of the residual signal gives a quantity called "prediction gain", often expressed in dB.
  • the LPC filters are estimated in forward mode, on the current frame, and in backward mode on the decoded previous frame. Their own prediction gain is then calculated.
  • the gain of the front LPC filter is always better than the gain of the rear LPC filter for a given order.
  • the rear LPC filter is not adapted to treat the current frame, but rather the previous frame.
  • it often happens (as in the case presented here as an example), in particular when the signal is stationary, that the gain of a rear LPC filter is greater than the prediction gain of a front LPC filter. lower order.
  • the prediction gain is greater in the backward mode with an order 24 than in the forward mode with an order of 10 or 16.
  • the filter flO requires the transmission of its coefficients to the decoder, while the filter b24 is computable to the decoder without the need to transmit additional information. Nevertheless, the filter b24 has a much lower prediction gain than the prediction gain of the filter f24 (before filter of the same length).
  • This filter A hereinafter called “modified filter” is then used by the (possibly weighted) coder to calculate the residue.
  • An inverted version (1 / A (z)) of this filter is used at the decoder to reshape the spectrum of the signal.
  • the modifying filter can be calculated conventionally by the Levinson Durbin algorithm acting on the signal derived from the filtering of the signal of the current frame by the determined back filter.
  • the modifying filter can be determined on the basis of an analysis of a residual signal obtained after filtering the current block by a back filter calculated for a past block.
  • the modifying filter (M) can be estimated by "deconvolution".
  • the modifying filter can be estimated, according to this first option, by deconvolving a front filter adapted for filtering the current block, by a back filter calculated for a past block.
  • the modifying filter can be estimated by a least squares Wiener identification method in which the autocorrelation terms of the filter are calculated. rear (r 0 , r hr J ), and the cross-correlation between the target front filter and the back filter ( ⁇ 3 ⁇ 4, ⁇ 3 ⁇ 4 ... Cq.j), the filter M then being obtained by the matrix product next: m 0 1 1 q-2 1 ⁇ ql c o
  • this second option can be implemented by least squares identification, by calculating autocorrelation terms of coefficients of the back filter and intercorrelation between the modified filter and the back filter.
  • the second option can be executed in practice by a fast algorithm (of the type used for the identification of the LPC coefficients and based on the autocorrelation of the signal). Nevertheless, the first option of deconvolution can be as advantageous.
  • the filter M obtained by any of these techniques is then typically quantified in a form suitable for the transmission of the LPC filter coefficients (for example using a conversion of the LSF, LSP or ISF type (for "line spectral frequencies", or “peers”)). Once quantized, these coefficients are convoluted with the rear filter B to obtain a filter A (z) which can be reproduced identically to the decoder.
  • the performances of the obtained filter are compared with those of the quantized before filter (F) containing the same number of coefficients as the calculated filter M. If the number of bits used to transmit a filter depends only on the length of the filter (which is often the case in speech / audio coding), then the performances between the filter A and the filter F can be directly compared by their prediction gain, calculated on the original signal x n . So :
  • the filter M is transmitted, and, if not, the filter F is transmitted.
  • the filter A is of a higher order than the filter F (thus rendering its estimate expensive for the decoder since it involves the estimation of the filter B and the decoding of the filter M), the filter A is selected only if its gain of prediction is much higher than the filter F (a few dB).
  • An embodiment presented hereinafter therefore considers the calculation of a plurality of rear filters, before and modifying.
  • the number of front filters is not necessarily the same as the number of back filters.
  • a set of back filters determined is calculated, according to the method presented above, a set of quantized modifying filters. It is advisable to choose modifying filters with orders identical to the orders of the filters before F already calculated (pf 0 , pfi, pf 2 , pf 3 ) -
  • the convolution of the rear filters (B) and the modified filters (M) then gives a set of combined filters (A) whose performances are compared with those of the front filters (in particular those of the front filters having an order identical to the modified filter M).
  • FIG. 4 shows the performances of the back filters calculated at 5 different orders (from B 0 of order pbo to B 4 of order pb 4 ). It is observed that the filter B 4 has poorer performance than the filter B 3 . This filter, like any rear filter performance lower than a rear filter of lower order, is immediately removed from later considerations. This avoids unnecessarily calculating modified filters based on this filter B 4 .
  • the performances of the filters calculated beforehand with 4 different orders (of F 0 of order pf 0 to F 3 of order pf 3 ) are also represented.
  • the abscissa of the graph of Figure 4 represents the order of prediction and the ordinate, the prediction gain.
  • a filter modifying (Mi ; 0 ) of order pf 0 is calculated to obtain a first filter A 0 .
  • a filter modifying (M 2> 0 ) of order pf 0 is calculated to obtain a second filter
  • a filter modifying (M 3> 0 ) of order pf 0 is calculated to obtain a third filter A 2 .
  • a filter modifying (M 3> i) of order pfi is calculated to obtain a fourth filter A 3 .
  • the filters A 0 , A 1 and A 2 therefore have an identical transmission cost because they require the transport of pfo coefficients. This transmission cost can be considered identical to that of the filter F 0 .
  • the transmission cost of the filter A 3 is comparable to the transmission cost of the filter Fj.
  • the filters By positioning the filters in the rate / gain coding scheme (FIG. 5), the best possibilities for coding the LPC envelope are finally selected. It appears that the relevant configurations are then the filters B 3 , A 0 or A 2 , F ⁇ , F 2 and F 3 . Other configurations, offering lower performance for the same or higher throughput, can be eliminated.
  • the choice of the filter A 0 requires the calculation of the filter B ⁇ and the decoding of a filter modifying order pf 0
  • the choice of the filter A 2 requires the calculation of the filter B 2 and the decoding of a filter modifying order pf 0 : this choice therefore implies more complexity than that of the filter A 0 for identical performance
  • the choice of the filter B 3 requires the calculation of a high order filter pb 3 and therefore has more complexity.
  • d represents the number of bits allocated to the transmission of the residue. This number can be estimated, knowing the total bit rate, for the coding of the audio frame (T), the number of samples it comprises (N) and the bit rate required for the coding of the LPC (R) filter, as follows:
  • the filter of index 2 If this quantity is positive, one will choose the filter of index 2 (if not, the filter of index 1).
  • the type of front / rear / combined filter can change from one frame to the next, depending on the choice made at the encoder. However, care should be taken to avoid configuration changes which are too fast if the prediction gains are not sufficiently different, in particular between the configuration used on the previous frame and the configuration giving the best performance on the current frame.
  • a change is useful only beyond a certain threshold (for example 1 dB).
  • the encoder must inform the decoder so that it can calculate the chosen LPC filter.
  • Useful information for this purpose is for example:
  • read index__pf 1 filter order before or read f [pf] ISF ... number of bits, depends on ⁇
  • the filter coefficients are assumed to be quantized in their ISF form. They are grouped together to be coded together.
  • a typical configuration used in the AMR-WB (3GPP) encoder is repeated in this embodiment. It is 46 bits for 16 LPC coefficients represented as ISF. For 10 coefficients, we will use 18 bits for example.
  • Reading the 2-bit index_pb flag is associated with a corresponding number of filter coefficients. For example, the following association can be provided:
  • index_pf flag can be represented on a single bit:
  • the coefficients f n are interpreted as the coefficients of the filter modifying the rear filter. Otherwise the coefficients f n are interpreted as front filter coefficients.
  • the syntax presented above can be arranged, or even simplified, if we reduce the number of combinations.
  • the index_pb field can be omitted if only one possible back filter order is considered.
  • the order of the rear filter can be implicitly set to 16.
  • a single length can be envisaged, for example 16.
  • the decoder On decoding, the decoder, on reading the information indicating the use of the rear filter and its order, calculates the rear filter of the order indicated on the decoded samples beforehand.
  • the decoder On receipt of the presence indication and the order of a filter, it decodes the transmitted ISF indices to convert the filter into LPC filter coefficients. Of course, here, if only the back filter is signaled (without ISF indexes), the decoder understands that the filter used is finally only the rear filter (B). If the two filters are transmitted (with the ISF indices), the decoder understands that the filter A used is the "modified" filter (obtained by the convolution of the front and back filters (B * M), the filter M being interpreted as the modifying filter).
  • the decoder understands that the filter used is the front filter alone.
  • the present invention provides an alternative to the coding of the LPC envelope, a critical element for the quality of coding, especially in audio coding.
  • an alternative mode of coding the LPC envelope does not cause any difficulty compared to current techniques: the encoder can always choose the standard mode LPC forward, as a fallback position.
  • the decoder is able to use rear filters, especially when the signal is stationary. Nevertheless, he is also able to take advantage of both approaches by combining them.
  • the performance of the LPC filter is further increased by increasing its accuracy to produce improved quality.
  • the present invention also provides a device for encoding a signal for implementing the above coding method.
  • An exemplary embodiment is shown in FIG. 6A and such an encoder D1 comprises, for example:
  • CALC means for calculating a modified filter A on the basis of a rear filter and at least a function of the signal in the current block SGN-Tn (in a current frame Tn for example), and
  • the encoder device determines a prediction gain Gp for a given bit rate d, by considering several types of filters before F, rear B and modified A and retains in step 12 the filter having for example the best prediction gain at this given rate d.
  • the best candidate filter is a modified filter A (step 13)
  • the construction thereof implies a filter modifying Mj, the order j of this modifying filter being able to be chosen according to the order i of the rear filter Bi on the base of which is built the modified filter A.
  • the coefficients of the filter modifying Mj and the order i of the filter Bi can then be sent to a decoder device D2.
  • the present invention also relates to a computer program comprising instructions for the implementation of these steps, when this program is executed by a processor, for example of such an encoding device Dl.
  • a processor for example of such an encoding device Dl.
  • the flowchart shown in Figure 6B may illustrate the general algorithm of such a program.
  • the present invention also relates to the decoding device D2 of an encoded signal for implementing the decoding method.
  • a device comprises at least: REC information receiving means (for example information representing the coefficients of the filter modifying Mj (in the form of ISF for example) and the order i of the filter rear Bi), for the calculation of a modified predictive filter A,
  • the decoder device receives in step 20 information (for example from the coder D1), this information may comprise here:
  • this rear filter Bi is calculated from previously decoded data (for example from a previous frame ⁇ ⁇ _ ⁇ ) and using the filter order i.
  • the modifying filter Mj and the rear filter Bi thus calculated are combined (for example by convolution) to obtain, in step 23, the modified filter A used for decoding the signal by the decoder device D2.
  • step 24 for a current frame to be delivered.
  • the present invention also relates to a computer program comprising instructions for the implementation of these steps, when this program is executed by a processor, for example such a decoding device D2.
  • a processor for example such a decoding device D2.
  • FIG. 7B can illustrate the general algorithm of such a program.
  • the program for implementing the encoding method (FIG. 6B) and the program for implementing the decoding method (FIG. 7B) can be grouped together in the same general computer program within the meaning of the invention .
  • the present invention is not limited to the embodiment described above by way of example; it extends to other variants.
  • the criterion for choosing a filter illustrated in FIG. 5 may not be simply limited to the best prediction gain for a given flow rate.
  • another criterion that may be taken into consideration may be the complexity of calculations to the encoder or decoder.
  • the modified filters A 0 and A 2 are the best candidates for the flow rate d 0 . It will then be chosen preferentially the filter A 0 , less complex than the filter A 2 , and nevertheless offering the same performance in terms of prediction gain.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

La présente invention concerne un codage/décodage d'un signal audio numérique comportant une succession de blocs consécutifs de données, à partir d'un filtre prédictif. Au sens de l'invention, on utilise un filtre prédictif modifié (A), pour le codage d'au moins un bloc courant (Tn), le filtre modifié (A) étant construit par la combinaison de : un filtre arrière (Bi) calculé pour un bloc passé, précédant le bloc courant, et de paramètres d'enrichissement (Mj) du filtre arrière, déterminés en fonction du signal dans le bloc courant et comportant les coefficients d'un filtre modifiant (M).

Description

Codage/décodage prédictif linéaire adaptatif
L'objet de l'invention concerne le domaine du codage/décodage de données audio et/ou vidéo.
Dans un exemple d'application, l'invention peut porter sur le codage des sons présentant des alternances de parole et de musique. Pour coder efficacement des signaux de parole seuls ou superposés avec un son quelconque, les techniques de type CELP (pour « Code-excited linear prédiction ») sont généralement préconisées.
Les codeurs CELP sont des codeurs prédictifs et ont pour but de modéliser la production de la parole à partir de divers éléments tels que :
une excitation stochastique (par exemple un bruit blanc ou une excitation algébrique) modélisant le flux d'air sortant des poumons en périodes voisées et/ou non voisées, une prédiction à long-terme pour modéliser la vibration des cordes vocales, en période voisée en particulier, et
une prédiction à court-terme, sous forme d'un filtre LPC à P coefficients (LPC pour « Linear Prédictive Coding »), pour modéliser les modifications du conduit vocal, comme par exemple la prononciation de consonnes voisées.
Ce nombre de coefficients P est choisi afin de bien modéliser la structure formantique du signal de parole. Le signal de parole ayant en général quatre formants dans la bande de fréquences 0 à 4 kHz, dix coefficients de filtres modélisent correctement cette structure (deux coefficients sont nécessaires pour modéliser chaque formant).
Pour un signal large bande échantillonné à 16 kHz, un ordre LPC de 16 coefficients est typiquement employé.
On présente en référence à la figure 1 , le spectre d'un signal de parole (en trait plein) auquel on superpose (en traits pointillés) la réponse en fréquence d'un filtre LPC modélisant son enveloppe spectrale.
Un signal de parole échantillonné s„, filtré par un tel filtre LPC, présente un signal résiduel r„ tel que : r n = ai étant les coefficients du filtre.
La puissance du signal résiduel r„ peut être faible et son spectre aplati, par un choix judicieux des coefficients α,.
Le signal résiduel est alors plus simple à coder que le signal s„ lui-même. Il peut se modéliser facilement par un signal harmonique, fortement périodique, comme représenté sur la figure 2, où X(J) est le spectre du signal d'origine s (trait noir) et E(/) est le spectre du signal résiduel r (en trait gris).
Les coefficients a, sont typiquement calculés par une mesure de corrélation sur le signal s„ (et par application d'un l'algorithme de type de Levinson-Durbin pour inverser les équations de Wiener- Hopf).
Deux éléments principaux sont alors constitutifs des codées CELP :
une modélisation du conduit vocal, par la prédiction court terme qui modélise l'enveloppe spectrale sous forme d'un filtre LPC et
une modélisation de l'excitation passant au travers du conduit vocal, qu'elle soit voisée ou non.
Ces deux éléments paramétriques, même s'ils modélisent correctement les signaux vocaux, n'ont pas vocation à reproduire fidèlement les signaux audio musicaux ou mélangés (avec superpositions de différents éléments sonores de parole et musicaux). En particulier, le filtre LPC modélisant l'enveloppe spectrale n'est plus adapté au signal simple de voix et l'excitation ne répond plus au modèle voisé/non voisé.
Il a été proposé, notamment dans l'implémentation du codeur 3GPP AMR WB+, un codage de signal mixte parole/ audio qui est amélioré en particulier par un meilleur codage de l'excitation. Le codage par l'enveloppe LPC est conservé, mais le codage de l'excitation est amélioré.
Outre la modélisation par un prédicteur à long-terme et de l'excitation stochastique, un codage par transformée peut être ajouté dans les cas où les sons ne répondent pas au modèle de production de la parole. On parle de codage dit « CELP + TCX » (pour « Transform Coded eXcitation »). Une telle technique consiste en les étapes suivantes :
estimation au codage de l'enveloppe LPC du signal à coder avec un nombre de coefficients fixé,
sélection du modèle d'excitation (modèle voisé/ non voisé paramétrique ou codage par transformée), et
transmission du mode sélectionné, de l'excitation codée et de l'enveloppe LPC.
Grâce à ce choix de codage pour l'excitation, la qualité du codage selon l'AMR WB+ est satisfaisante pour les signaux audio consistant en des mélanges parole avec bruit de fond ou parole avec fond musical, donc typiquement pour les signaux où la parole domine en énergie. En effet, pour ces signaux, l'enveloppe transmise sous forme LPC est un paramètre pertinent puisque le signal est principalement constitué de parole qui se décrit bien grâce à une enveloppe LPC d'un ordre donné. L'enveloppe décrit en effet les formants (liés aux fréquences de résonnance du conduit vocal) en fonction du nombre de coefficients choisis.
En revanche, pour des signaux avec une composante faible en signal de parole - voire pour des signaux n'étant pas constitués principalement de voix - l'enveloppe LPC estimée et transmise au codeur n'est plus suffisante. Le signal audio est alors souvent trop complexe pour se limiter, par exemple, à cinq formants, et son évolution dans le temps fait qu'un nombre de coefficients fixé n'est pas adapté.
Ainsi, pour coder un son complexe, du fait de la limitation au niveau du codage de l'enveloppe, l'effort de codage est reporté au niveau du codage de l'excitation et le codeur perd alors de son efficacité.
Une solution consisterait à adapter au cours du temps le nombre de coefficients LPC transmis, pour les portions du signal audio qui requièrent une bonne précision pour l'enveloppe. Cette approche n'est cependant pas viable car dans un système de codage à bas débit, une meilleure précision de codage sur l'enveloppe retirerait du débit disponible pour le codage de l'excitation et la qualité ressentie ne serait alors pas améliorée pour autant.
Une autre solution consisterait à effectuer une prédiction linéaire avec une analyse "arrière" telle que l'estimation de l'enveloppe LPC ne porte plus sur le signal à coder mais sur un signal décodé préalablement, ce signal « précédent » pouvant être disponible à l'identique au codeur et au décodeur. On peut alors économiser la transmission de l'enveloppe LPC car il est possible de la reconstituer sans information au décodeur, cette économie pouvant servir à mieux modéliser l'excitation par exemple. Pour ce qui concerne le codage des sons musicaux, cette prédiction linéaire avec analyse "arrière" permet potentiellement d'augmenter le nombre de coefficients de filtres modélisant l'enveloppe. Typiquement, un ordre de 50 peut être utilisé pour bien modéliser un signal musical et permettre un codage aisé du signal résiduel d'excitation.
En revanche, l'utilisation d'une information passée ne permet pas d'anticiper les évolutions du signal audio car utiliser un prédicteur arrière est pertinent pour un signal stationnaire mais le spectre à une trame donnée n'est précisément modélisé et peut être utilisé pour une trame suivante que si les propriétés statistiques et notamment spectrales du signal demeurent stables. Sinon, le filtre LPC estimé n'est pas pertinent pour la trame considérée et le signal résiduel reste alors difficile à encoder. Le prédicteur arrière perd donc tout son intérêt.
Une solution préconisée dans l'état de l'art est donc d'utiliser une commutation entre un filtre de prédiction "avant", calculé sur la trame courante, et un filtre de prédiction arrière, calculé sur le signal reçu au préalable. L'encodeur analyse le signal et décide si le signal est stationnaire ou non. Si le signal est stationnaire, le filtre arrière est utilisé. Sinon, un filtre avant à peu de coefficients est transmis au décodeur. Une telle réalisation permet de contrôler précisément la qualité du signal résiduel à encoder. Elle est mise en œuvre dans la norme ITU-T G.729-E, dans laquelle une décision sur la stationnarité du signal résulte dans un filtre estimé « arrière » avec 30 coefficients, ou un filtre estimé « en avant » à 10 coefficients.
L'inconvénient de cette technique est principalement de faire cohabiter ces deux techniques d'estimation. Un choix discontinu doit être effectué, suivant la stationnarité du signal. Dans le cas d'une non-stationnarité "légère" comme l'apparition d'un instrument dans un ensemble musical, il conviendrait de considérer ce nouvel événement dans le signal et donc envoyer un nouveau filtre avant. Toutefois, on peut néanmoins considérer que le signal est suffisamment stable pour que le filtre arrière soit approprié. Face à une telle situation à dilemme, le système de codage tend à changer souvent de configuration au cours du temps, de façon relativement imprévisible, ce qui engendre des distorsions. En effet, changer trop souvent de traitement au cours du temps n'est pas efficace, la solution retenue n'étant pas forcément la meilleure.
En résumé, l'état de l'art préconise :
un prédicteur avant fixe, à peu de coefficients de filtre, modélisant grossièrement l'enveloppe,
un prédicteur arrière fixe, présentant un nombre élevé de coefficients, mais ne pouvant pas modéliser les variations de signal d'une trame à l'autre,
une alternance entre les deux types de prédicteurs qui génère parfois des discontinuités gênantes.
La présente invention vient améliorer la situation.
Elle propose à cet effet un procédé de codage d'un signal audio numérique comportant une succession de blocs consécutifs de données, à partir d'un filtre prédictif. Le procédé au sens de l'invention comporte en particulier l'utilisation d'un filtre prédictif modifié pour le codage d'au moins un bloc courant. Ce filtre modifié est construit par la combinaison de :
un filtre arrière calculé pour un bloc passé, précédant le bloc courant, et
de paramètres d'enrichissement du filtre arrière, déterminés en fonction du signal dans le bloc courant et comportant les coefficients d'un filtre modifiant (M),
L'invention présente de nombreux avantages : elle permet en particulier de ne pas passer abruptement d'un filtre arrière à un filtre avant, mais peut par exemple offrir la possibilité d'une transition par un tel filtre modifié notamment entre l'utilisation d'un filtre arrière et celle d'un filtre avant. Elle permet également d'éviter le passage par un filtre avant à peu de coefficients pour coder un signal stationnaire doté d'une enveloppe complexe alors que celui-ci n'est que faiblement perturbé par une non stationnarité.
Un autre avantage est d'enrichir un filtre arrière en produisant une qualité de codage optimum sans nécessairement transmettre un filtre avant complet, en particulier avec autant de coefficients par exemple qu'un filtre avant.
Un autre avantage, de fait, est de permettre plus de choix au codeur avec différentes catégories de filtres : arrière, avant et modifiés.
Les paramètres d'enrichissement comportent les coefficients d'un filtre modifiant, et le filtre modifié est construit par une combinaison entre filtre arrière et de filtre modifiant.
Cette combinaison peut être, dans un exemple de réalisation décrit ci-après, une convolution du filtre arrière par le filtre modifiant. En variante, dans un autre espace, il peut s'agir d'une multiplication par exemple, ou autre.
Une telle réalisation présente l'avantage de permettre une simplification des opérations de calcul auprès d'un décodeur recevant les paramètres précités.
Ainsi, dans un mode de réalisation, le procédé peut comporter, pour le codage d'un bloc courant, un choix basé sur au moins un critère prédéterminé, d'un filtre prédictif parmi au moins :
un filtre arrière, calculé pour un bloc passé, précédant le bloc courant, et
un filtre avant, adapté pour le bloc courant, et
un filtre modifié, estimé sur la base d'un filtre arrière et en fonction du signal dans le bloc courant.
Ce critère peut par exemple tenir compte d'une stationnarité du signal entre le bloc passé et le bloc courant, pour le choix de l'un des filtres parmi un filtre arrière, un filtre avant et un filtre modifié.
Dans une réalisation particulière, le critère prédéterminé peut comporter une estimation d'un gain de prédiction basée sur un rapport entre la puissance du signal dans le bloc courant et la puissance d'un signal résiduel après filtrage de ce signal en utilisant chacun des filtre arrière, avant et modifié. Une telle réalisation sera décrite en détails plus loin, notamment en référence aux figures 4 et 5.
Le critère précité peut tenir compte en outre d'un nombre de paramètres à envoyer à un décodeur pour le décodage d'un bloc courant et comportant au moins des coefficients que comporte le filtre à choisir. Ainsi, dans une telle réalisation, le critère prédéterminé peut comporter une recherche d'optimum entre :
le gain de prédiction qu'offre un filtre à choisir, d'une part, et
un débit adapté pour la transmission des paramètres nécessaires à un décodeur pour reconstruire ce filtre.
Ainsi, dès lors qu'un choix peut être effectué pour le type de filtre à utiliser, il est possible de baser aussi ce choix sur l'ordre du filtre à choisir et, dans une réalisation particulière, le procédé comporte alors les étapes :
a) déterminer une pluralité de filtres avant d'ordres respectifs distincts,
b) déterminer une pluralité de filtres arrière d'ordres respectifs distincts,
c) calculer une pluralité de filtres modifiés d'ordres respectifs distincts, estimés chacun sur la base d'un filtre arrière déterminé à l'étape b) et en fonction du signal dans un bloc courant à coder, d) comparer, pour un même nombre de paramètres à envoyer à un décodeur, ce nombre étant déterminé en fonction des ordres de filtre, les performances d'au moins deux filtres parmi les filtres avant, les filtres arrière et les filtres modifiés déterminés aux étapes a), b) et c), et e) sélectionner, pour le codage d'un bloc courant, un filtre prédictif présentant les meilleures performances selon la comparaison de l'étape d), pour un nombre donné de paramètres à envoyer à un décodeur.
Le filtre modifiant peut être estimé par une technique quelconque, telle que par exemple :
par déconvolution d'un filtre avant adapté pour le filtrage du bloc courant, par ledit filtre arrière calculé pour un bloc passé, ou encore
sur la base d'une analyse d'un signal résiduel obtenu après filtrage du bloc courant par le filtre arrière précité, ou encore
par identification au sens des moindres carrés, en calculant des termes d'autocorrélation de coefficients du filtre arrière et d'intercorrélation entre le filtre modifié et le filtre arrière.
Une fois que les coefficients du filtre modifiant sont déterminés par l'une de ces techniques, le procédé peut comporter en outre une communication à un décodeur, d'informations de type : choix d'un filtre avant pour un boc courant, avec une transmission de paramètres représentant des coefficients du filtre avant,
ou choix d'un filtre arrière ou d'un filtre modifié pour un bloc courant, avec, dans le cas d'un choix d'un filtre modifié, une transmission de paramètres représentant des coefficients du filtre modifiant.
La présente invention vise alors aussi un procédé de décodage d'un signal audio numérique comportant une succession de blocs consécutifs de données, le procédé utilisant un filtre prédictif pour le décodage d'un bloc courant, le procédé comportant en particulier :
une réception d'informations pour le calcul d'un filtre prédictif modifié basé sur la combinaison de :
* un filtre arrière, calculé pour un bloc passé, précédant le bloc courant, et
* des paramètres d'enrichissement du filtre arrière, issus des informations reçues comportant des coefficients de filtre, pour former un filtre modifiant (M) comportant lesdits coefficients,
Finalement, le procédé de décodage peut alors comporter une étape dans laquelle, pour le décodage d'au moins un bloc courant donné, on utilise plutôt le filtre prédictif ainsi modifié.
Par exemple, cette combinaison peut consister en une multiplication ou en une convolution (ou autres) du filtre arrière par le filtre modifiant.
Bien entendu, pour d'autres blocs courants, le décodeur pourra utiliser aussi un filtre arrière ou un filtre avant, selon les informations reçues du codeur.
En particulier, au décodage, le filtre arrière peut être reconstruit sur la base de données précédemment décodées. Par exemple, il est possible d'utiliser le signal résiduel que le décodeur a reçu du codeur, pour un bloc passé, si l'ordre du filtre arrière à reconstruire est plus élevé qu'un filtre précédemment construit pour ce bloc passé.
Le procédé de décodage peut comporter ainsi les étapes, pour la détermination du filtre arrière : détermination d'un ordre du filtre arrière, en fonction desdites informations reçues, et estimation du filtre arrière, à partir de données précédemment décodées et en utilisant cet ordre de filtre.
L'information d' « ordre de filtre » peut être transmise directement d'un codeur au décodeur, ou encore consister en une information implicite. Par exemple dans ce dernier cas, le décodeur peut être programmé pour calculer un filtre arrière à NI coefficients si un filtre modifié doit être construit et calculer un filtre arrière à N2 coefficients par exemple s'il n'est prévu d'utiliser qu'un simple filtre arrière pour le décodage.
Ainsi, l'invention propose une combinaison de filtre arrière et d'un filtre modifiant choisis pour se compléter et pour créer un filtre modifié de meilleure qualité que le filtre arrière, puisqu'il s' agit d'une version du filtre arrière, enrichie par une mise à jour issue des caractéristiques tirées du bloc courant. Selon l'un des avantages de l'invention, l'enveloppe de signal est précisément décrite (pour tout type de signal), avec un débit de transmission optimal, que ce soit sous la forme d'un filtre avant, un filtre arrière ou encore un filtre modifié. De plus, la transition entre filtre (que ce soit avant, arrière ou modifié) s'effectue en douceur par rapport à l'art antérieur et on évite ainsi l'effet de discontinuité décrit précédemment en référence à art antérieur.
La qualité de codage résultant de l'utilisation de l'invention est alors améliorée.
D'autres caractéristiques et avantages de l'invention apparaîtront à l'examen de la description détaillée ci-après, et des dessins annexés sur lesquels, outre les figures 1 et 2 présentées ci-avant : la figure 3 illustre schématiquement une succession de blocs de signal sous forme de trame, pour le choix d'un filtre pertinent notamment pour le codage du signal,
la figure 4 illustre un exemple de gain de prédiction qu'offre le choix d'un filtre modifié Ai5 ou d'un filtre arrière Bi5 ou d'un filtre avant Fi, en fonction de l'ordre de ce filtre, la figure 5 illustre un exemple de gain de prédiction qu'offre un filtre en fonction du débit que sollicite le choix de ce filtre, nécessaire pour la transmission de ses coefficients (ou de ses paramètres d'enrichissement de filtre arrière à transmettre par exemple sous la forme d'indices ISF pour un filtre modifié Ai5 comme on le verra dans un exemple de réalisation décrit ci-après),
la figure 6 A illustre schématiquement un dispositif d'encodage dans un mode de réalisation de l'invention,
la figure 6B illustre schématiquement les étapes d'un procédé d'encodage dans un mode de réalisation de l'invention,
la figure 7A illustre schématiquement un dispositif de décodage dans un mode de réalisation de l'invention,
la figure 7B illustre schématiquement les étapes d'un procédé de décodage dans un mode de réalisation de l'invention. Les notations utilisées dans ce qui suit sont ainsi définies :
Fj pour un filtre avant (« Forward » en anglais) d'ordre i,
Bj pour un filtre arrière (« Backward » en anglais) d'ordre i,
Aj pour un filtre modifié d'ordre i, correspondant donc à une version enrichie d'un filtre arrière Bj par l'utilisation d'un filtre modifiant décrit en détail plus loin, et
Mj pour un filtre modifiant d'ordre i.
Dans l'exemple de réalisation décrit ci-après, on se place dans le cadre d'un codage utilisant des filtres LPC (pour « Linear Prédictive Coding »). Cette technique peut donc être du type CELP, par exemple selon les normes G.729, AMR, AMR-WB, ou encore utiliser une transformée de codage en complément, comme par exemple au sens des normes G.718, G.729.1, AMR WB+, MPEG-D (« Unified Speech and Audio Coding »).
Dans un système à base de filtres LPC, le filtrage a pour vocation de séparer le signal à coder en deux composantes :
l'enveloppe spectrale, modélisée par ce filtre composé de ses P coefficients at, et le signal résiduel restant à coder (et correspondant à un signal plus efficace à transmettre car allégé de son enveloppe spectrale), comme suit :
où rn exprime ici le signal résiduel, calculé sur le signal audio d'entrée x„, par convolution avec le filtre de coefficients aj.
Cette équation peut s'exprimer au travers de sa transformée en z, notée :
E ( z) = X ( z) 1 -∑««*"' X ( z) A ( z)
Le filtre LPC A(z) est ainsi de la forme :
Le nombre P désigne le nombre de coefficients non nuls. Il est appelé « l'ordre du filtre ». Habituellement, un nombre judicieux pour un signal de parole en bande étroite (échantillonnée à 8 kHz) est de 10. Cet ordre peut être augmenté néanmoins afin de mieux modéliser le spectre du signal et notamment accentuer la précision de son enveloppe. Il peut aussi être augmenté si la fréquence d'échantillonnage du signal est plus élevée.
Le signal résiduel peut aussi être présenté dans le domaine pondéré perceptuel. Ainsi, au lieu d'appliquer le filtre LPC tel quel, une modification de ce filtre est utilisée afin de mieux prendre en compte les propriétés de l'oreille humaine lors du codage du résiduel. Typiquement, on utilise une pondération perceptive, en utilisant le filtre W(z) '■ {ζ) = Α{ζ / γ) {ou W(z) = A i 7l ) où y, γΐ5 γ2 sont des coefficients à valeur réelle compris typiquement entre 0,9 et 1.
Les coefficients at du filtre LPC sont communément estimés en identifiant le signal audio et sa prédiction réalisée au sens des moindres carrés. On cherche donc les coefficients at minimisant l'erreur quadratique du signal audio passé, au travers du filtre A(z). On cherche donc à minimiser la puissance du signal rn . Cette puissance est estimée sur une certaine durée représentant un nombre d'échantillons N. Les coefficients sont donc valables pour cette période de temps. Cette estimation de coefficients de filtre LPC est ainsi réalisée par l'estimation des termes d'autocorrélation du signal xn, et par la résolution des équations de Yule Walker ou Wiener Hopf, typiquement par un algorithme rapide de type Levinson Durbin, comme décrit par exemple dans la référence :
"Linear prédiction a tutorial review", John Makhoul, Proceedings of the IEEE, 63 (5):561-580, Avril 1975.
D'autres algorithmes peuvent néanmoins être employés pour l'estimation des coefficients at, par exemple par estimation spectrale ou par la méthode de covariance.
L'estimation des coefficients du filtre LPC peut être réalisée sur le signal courant xn, sur une trame représentant un ensemble d'échantillons, ou encore sur une version du signal xm (m<n) résultant d'un décodage local précédent (complet ou partiel) du signal sous forme codée. Le décodage local est obtenu par décodage des paramètres encodés au niveau de l'encodeur. Ce décodage local permet de récupérer au niveau du codeur les informations exploitables par le décodeur à l'identique.
On se réfère à la figure 3 pour décrire comment utiliser des informations disponibles pour le calcul du filtre LPC : le filtre LPC est calculé sur les échantillons originaux de la trame en cours (trame t), ou des trames antérieures (t-1, t-2, etc.) : dans de tels cas, il s'agit d'un filtre LPC « avant » et ses coefficients (notés ci-après „) doivent être communiqués au décodeur, ou
le filtre LPC peut être calculé à partir des échantillons localement décodés, donc antérieurs à la trame en cours (t-1, t-2, etc.) : dans ce cas, il s'agit d'un filtre LPC « arrière » et le décodeur est aussi capable d'estimer les coefficients (notés bn) du même filtre LPC, lequel n'a donc pas besoin d'être communiqué au décodeur.
Les performances du filtre LPC, ou une version pondérée de celui-ci, peuvent ensuite être évaluées en estimant la puissance du signal résiduel (c'est-à-dire la puissance du signal résultant du filtrage du signal original de la trame en cours par le filtre LPC considéré). Le rapport de la puissance du signal original divisée par la puissance du signal résiduel donne une quantité appelée « gain de prédiction », souvent exprimé en dB.
On présente, dans la table suivante, un exemple numérique donnant les gains de prédiction obtenus pour les filtres avant et arrière pour différents ordres.
Dans ce mode de réalisation, les filtres LPC sont estimés en mode avant, sur la trame courante, et en mode arrière sur la trame précédente décodée. Leur gain de prédiction propre est ensuite calculé. Les ordres utilisés vont de p=4 à p=32, dans le tableau ci-après.
On constate ainsi que le gain du filtre LPC avant est toujours meilleur que le gain du filtre LPC arrière pour un ordre donné. Cette observation s'explique par le fait que le filtre LPC arrière n'est pas adapté pour traiter la trame courante, mais plutôt la trame précédente. En revanche, il arrive souvent (comme dans le cas présenté ici à titre d'exemple), en particulier lorsque le signal est bien stationnaire, que le gain d'un filtre LPC arrière soit supérieur au gain de prédiction d'un filtre LPC avant d'ordre inférieur. Dans l'exemple du tableau ci-avant, le gain de prédiction est plus important en mode arrière avec un ordre 24, qu'en mode avant avec un ordre de 10 ou 16.
On comprendra alors qu'il est avantageux de choisir le filtre LPC arrière d'ordre 24 (b24) par rapport au filtre avant d'ordre 10 (flO) pour le codage. De plus, le filtre flO requiert la transmission de ses coefficients au décodeur, alors que le filtre b24 est calculable au décodeur sans nécessité de transmettre d'information supplémentaire. Néanmoins, le filtre b24 a un gain de prédiction bien plus faible que le gain de prédiction du filtre f24 (filtre avant pourtant de même longueur).
Ainsi, il est proposé dans ce mode de réalisation de ne pas baser la représentation du filtre LPC seulement sur un filtre arrière, mais de lui adjoindre un filtre modifiant (M) transmis au décodeur. Le filtre LPC finalement utilisé (A) découle alors de la combinaison du filtre arrière (B) et du filtre modifiant M, comme suit :
A ( z) = M ( z) B ( z)
Ce filtre A, appelé ci-après « filtre modifié », est alors utilisé au codeur (éventuellement pondéré) pour calculer le résidu. Une version inversée (1/A(z)) de ce filtre est utilisée au décodeur pour remettre en forme le spectre du signal.
Pour le calcul du filtre modifiant M, différentes modes de réalisation sont possibles.
Dans une première approche, le filtre modifiant peut être calculé de façon classique par l'algorithme de Levinson Durbin agissant sur le signal issu du filtrage du signal de la trame courante par le filtre arrière déterminé.
Ainsi, en termes plus génériques, le filtre modifiant peut être déterminé sur la base d'une analyse d'un signal résiduel obtenu après filtrage du bloc courant par un filtre arrière calculé pour un bloc passé.
Dans une seconde approche, le filtre modifiant M peut être calculé par approximation d'un filtre avant cible d'ordre équivalent. En effet, si q est l'ordre du filtre modifiant M et r l'ordre du filtre arrière B, il est possible de déterminer, pour la trame courante, le filtre modifié A d'ordre p=q+r-l. Le filtre modifiant (M) peut être estimé par "déconvolution".
En effet, il peut être estimé par exemple, selon une première option, par déconvolution de type déterministe, en calculant alors le filtre 1/B(z) (par division polynomiale) que l'on multiplie par le filtre F(z) pour obtenir un filtre M dont le produit avec le filtre arrière B donne une approximation de la réponse fréquentielle du filtre F : le filtre B(z) étant issu d'une analyse LPC, le filtre inverse 1/B(z) est donc stable et peut alors être inversé.
Ainsi, en termes génériques, le filtre modifiant peut être estimé, selon cette première option, par déconvolution d'un filtre avant adapté pour le filtrage du bloc courant, par un filtre arrière calculé pour un bloc passé.
Selon une deuxième option, le filtre modifiant peut être estimé par une méthode d'identification de Wiener au sens des moindres carrés dans laquelle on calcule les termes d'autocorrélation du filtre arrière (r0, rh r?J), ainsi que l'intercorrélation entre le filtre avant cible et le filtre arrière (<¾,<¾... Cq.j) , le filtre M étant alors obtenu par le produit matriciel suivant : m0 1 1 q-2 1~ q-l co
m1 1 ro ri q-2 ci
m2 1 ro ri C2
ri ri
mq-i
Ainsi, en termes génériques, cette deuxième option peut être mise en œuvre par identification au sens des moindres carrés, en calculant des termes d'autocorrélation de coefficients du filtre arrière et d'intercorrélation entre le filtre modifié et le filtre arrière.
La deuxième option peut être exécutée en pratique par un algorithme rapide (du type utilisé pour l'identification des coefficients LPC et basé sur l'autocorrélation du signal). Néanmoins, la première option de déconvolution peut être aussi avantageuse.
Le filtre M obtenu par l'une quelconque de ces techniques est ensuite quantifié typiquement sous une forme propre à la transmission des coefficients de filtres LPC (par exemple en utilisant une conversion de type LSF, LSP ou ISF (pour « line spectral frequencies », ou « pairs »)). Une fois quantifiés, ces coefficients sont convolués au filtre arrière B pour obtenir un filtre A(z) qui pourra être reproduit à l'identique au décodeur.
Ensuite, les performances du filtre obtenu sont comparées avec celles du filtre avant quantifié (F) contenant le même nombre de coefficients que le filtre M calculé. Si le nombre de bits utilisés pour transmettre un filtre ne dépend que de la longueur du filtre (ce qui est souvent le cas en codage de parole/audio), alors les performances entre le filtre A et le filtre F peuvent être directement comparées par leur gain de prédiction, calculé sur le signal original xn. Ainsi :
si le filtre A dispose d'un gain de codage supérieur au filtre F, alors le filtre M est transmis, et, dans le cas contraire, le filtre F est transmis.
Préférentiellement, le filtre A étant d'un ordre supérieur au filtre F (rendant donc son estimation coûteuse au décodeur car faisant intervenir l'estimation du filtre B et le décodage du filtre M), on ne sélectionne le filtre A que si son gain de prédiction est bien supérieur à celui du filtre F (de quelques dB).
On a décrit ci-avant comment pouvait être construit un filtre avant à partir d'un filtre arrière choisi. On décrit maintenant comment choisir une entité « filtre arrière ou filtre avant issu de ce filtre arrière », parmi plusieurs possibilités.
Un mode de réalisation présenté ci-après considère donc le calcul d'une pluralité de filtres arrière, avant et modifiant.
On calcule ainsi à plusieurs ordres des filtres arrière (B) pb0, pbh pb2, pb3, .. ..
On calcule aussi à plusieurs ordres des filtres avant quantifiés (F) pf0, pfi, pf2, pf3,- -■
Le nombre de filtres avant n'est pas nécessairement identique au nombre de filtres arrière.
Pour un ensemble de filtres arrière déterminé, on calcule, suivant le procédé présenté précédemment, un ensemble de filtres modifiants quantifiés. Il est judicieux de choisir des filtres modifiants ayant des ordres identiques aux ordres des filtres avant F déjà calculés (pf0, pfi, pf2, pf3)-
La convolution des filtres arrière (B) et des filtres modifiés (M) donne alors un ensemble de filtres combinés (A) dont les performances sont comparées à celles des filtres avant (en particulier à celles des filtres avant ayant un ordre identique au filtre modifié M).
On a représenté sur la figure 4 les performances des filtres arrière calculés à 5 ordres différents (de B0 d'ordre pbo à B4 d'ordre pb4). On observe que le filtre B4 a de moins bonnes performances que le filtre B3. Ce filtre, comme tout filtre arrière de performance inférieure à un filtre arrière d'ordre d'inférieur, est d'emblée éliminé des considérations ultérieures. On évite ainsi de calculer inutilement des filtres modifiés basés sur ce filtre B4. On a représenté aussi les performances des filtres avant calculés à 4 ordres différents (de F0 d'ordre pf0 à F3 d'ordre pf3). L'abscisse du graphe de la figure 4 représente l'ordre de prédiction et l'ordonnée, le gain de prédiction.
Sur la base du filtre Bi, on calcule un filtre modifiant (Mi;0) d'ordre pf0 pour obtenir un premier filtre A0.
Sur la base du filtre B2, on calcule un filtre modifiant (M2>0) d'ordre pf0 pour obtenir un second filtre
Sur la base du filtre B3 on calcule un filtre modifiant (M3>0) d'ordre pf0 pour obtenir un troisième filtre A2.
Sur la base du filtre B3, on calcule un filtre modifiant (M3>i) d'ordre pfi pour obtenir un quatrième filtre A3.
Les filtres A0, A1 et A2 ont donc un coût de transmission identique, car ils nécessitent le transport de pfo coefficients. Ce coût de transmission peut être considéré identique à celui du filtre F0.
De même, le coût de transmission du filtre A3 est assimilé au coût de transmission du filtre Fj. En positionnant les filtres dans le plan débit/gain de codage (figure 5), on sélectionne finalement les meilleures possibilités pour le codage de l'enveloppe LPC. Il apparaît que les configurations pertinentes sont alors les filtres B3, A0 ou A2, F}, F2 et F3. Les autres configurations, offrant des performances inférieures pour un débit identique ou supérieur, peuvent donc être éliminées.
Ainsi, pour un débit limité à d0, on pourra choisir les filtres A0 ou A2, ou alors le filtre B3. En effet, il apparaît que ce sont les filtres qui offrent le meilleur gain de prédiction pour une sollicitation de débit d0 relativement modeste. Pour ce dernier choix, il peut être pris en compte un critère de complexité, en particulier au décodeur, car :
le choix du filtre A0 nécessite le calcul du filtre B} et le décodage d'un filtre modifiant d'ordre pf0
le choix du filtre A2 nécessite le calcul du filtre B2 et le décodage d'un filtre modifiant d'ordre pf0 : ce choix implique donc plus de complexité que celui du filtre A0 pour une performance identique
le choix du filtre B3 nécessite le calcul d'un filtre d'ordre élevé pb3 et présente donc plus de complexité.
Si la solution retenue dépend de la complexité admise au décodeur, on retient dans cet exemple le filtre A0.
Dans la réalisation ci-dessus, des configurations de même débit étaient comparées entre elles. Bien entendu, il est possible de comparer aussi des configurations ayant des débits différents. A cet effet, on utilise la relation ci-après donnant le rapport signal à bruit d'un signal codé par prédiction linéaire :
SNR = GP + 6.02 d
où d représente le nombre de bits affectés à la transmission du résidu. Ce nombre peut être estimé, connaissant le débit total, pour le codage de la trame audio (T), le nombre d'échantillons qu'elle comporte (N) et le débit nécessaire au codage du filtre LPC (R), comme suit :
r = ( T- R ) /N
Ainsi pour comparer deux configurations à débits différents, on peut comparer leur rapport signal à bruit :
SNR2- SNR] = GP2 - Gpi + 6.02(Rj - R2)/N
Si cette quantité est positive, on choisira le filtre d'indice 2 (sinon, le filtre d'indice 1). En fonctionnement dynamique, le type de filtre avant/arrière/combiné peut changer d'une trame à la suivante, selon le choix effectué au codeur. On veillera cependant à éviter les changements de configuration trop rapides si les gains de prédiction ne sont pas suffisamment différents, en particulier entre la configuration utilisée sur la trame précédente et la configuration donnant les meilleures performances sur la trame courante.
Typiquement, un changement n'est utile qu'au-delà d'un certain seuil (par exemple 1 dB).
En outre, le codeur doit informer le décodeur afin qu'il puisse calculer le filtre LPC choisi. Des informations utiles à cet effet sont par exemple :
la présence d'un filtre arrière B,
la présence d'un filtre avant F,
l'ordre du filtre arrière utilisé,
l'ordre du filtre avant utilisé,
l'ordre du filtre modifiant M,
les coefficients du filtre avant,
les coefficients du filtre modifiant.
Toutefois, elles ne sont pas toutes nécessaires, pour une configuration donnée. On envisage les trois possibilités suivantes :
filtre avant
filtre arrière
filtre arrière plus filtre modifiant.
Une syntaxe efficace peut se présenter comme suit :
Code Nb Remarque
si (B) 1 présence du filtre arrière t r
lecture index__pb 2 ordre du filtre arrière
1
si (F) 1 présence du filtre i r
lecture index__pf 1 ordre du filtre avant ou lecture des f[pf] ISF,... nombre de bits, dépend de } Dans cet exemple, les coefficients de filtres sont supposés quantifiés sous leur forme ISF. Ils sont regroupés pour être codés conjointement. Une configuration typique utilisée dans le codeur AMR- WB (3GPP) est reprise dans cet exemple de réalisation. Elle est de 46 bits pour 16 coefficients LPC représentés sous la forme ISF. Pour 10 coefficients, on utilisera plutôt 18 bits par exemple.
La lecture de l'indicateur index_pb sur 2 bits est associée à un nombre de coefficients de filtre correspondant. Par exemple, on peut prévoir l'association suivante :
De même, l'indicateur index_pf peut être représenté sur un seul bit :
Si le filtre B est à estimer, les coefficients fn sont interprétés comme les coefficients du filtre modifiant le filtre arrière. Sinon les coefficients fn sont interprétés comme des coefficients de filtre avant.
La syntaxe présentée ci-dessus peut être aménagée, ou même simplifiée, si on réduit le nombre de combinaisons. Par exemple, le champ index_pb peut être omis s'il n'est envisagé qu'un seul ordre de filtre arrière possible. Par exemple, si le filtre B doit être transmis, l'ordre du filtre arrière pourra être implicitement fixé à 16. De même, pour le filtre avant F ou modifiant M, une seule longueur peut être envisagée, par exemple 16.
La syntaxe se simplifie alors comme suit :
Au décodage, le décodeur, sur lecture de l'information indiquant l'utilisation du filtre arrière et de son ordre, calcule le filtre arrière de l'ordre indiqué sur les échantillons décodés au préalable.
Sur réception de l'indication de présence et de l'ordre d'un filtre, il décode les indices ISF transmis pour convertir le filtre en coefficients de filtres LPC. Bien entendu, ici, si seul le filtre arrière est signalé (sans indices ISF), le décodeur comprend que le filtre utilisé n'est finalement que le filtre arrière (B). Si les deux filtres sont transmis (avec les indices ISF), le décodeur comprend que le filtre A utilisé est le filtre « modifié » (obtenu par la convolution des filtres avant et arrière (B*M), le filtre M étant interprété comme le filtre modifiant).
Si seul le filtre avant est transmis avec son ordre, le décodeur comprend que le filtre utilisé est le filtre avant seul.
Ainsi, la présente invention propose une alternative au codage de l'enveloppe LPC, élément critique pour la qualité d'un codage notamment en codage audio. Du fait de la syntaxe légère proposée, un mode alternatif de codage de l'enveloppe LPC n'entraîne aucune difficulté par rapport aux techniques actuelles : le codeur peut toujours choisir le mode standard LPC avant, comme position de repli. De même, tout comme l'état de l'art, le décodeur est capable d'utiliser des filtres arrière, notamment lorsque le signal est stationnaire. Néanmoins, il est aussi capable de tirer avantage des deux approches en les combinant. Ainsi, on augmente encore les performances du filtre LPC en augmentant sa précision pour produire une qualité améliorée.
Par opposition à l'état de l'art, le fait de compléter un filtre arrière avec un filtre modifiant, entraîne moins de variations brusques dans le traitement des trames (plus de commutation avant/arrière brusque d'une trame à la suivante). Ici encore, une amélioration de qualité est apportée.
La présente invention vise aussi un dispositif d'encodage d'un signal pour la mise en œuvre du procédé de codage ci-avant. Un exemple de réalisation est représenté sur la figure 6A et un tel codeur Dl comporte par exemple :
des moyens CALC pour calculer un filtre modifié A sur la base d'un filtre arrière et au moins en fonction du signal dans le bloc courant SGN-Tn (dans une trame courante Tn par exemple), et
des moyens de codage COD d'au moins un bloc courant en utilisant ce filtre modifié A.
Ainsi, en référence à la figure 6B, le dispositif encodeur, sur la base d'un signal SGN dans une trame courante Tn à l'étape 10, détermine un gain de prédiction Gp pour un débit donné d, en envisageant plusieurs types de filtres avant F, arrière B et modifiés A et retient à l'étape 12 le filtre présentant par exemple le meilleur gain de prédiction, à ce débit donné d. Si le meilleur filtre candidat est un filtre modifié A (étape 13), la construction de celui-ci implique un filtre modifiant Mj, l'ordre j de ce filtre modifiant pouvant être choisi en fonction de l'ordre i du filtre arrière Bi sur la base duquel est construit le filtre modifié A. A l'étape 14, les coefficients du filtre modifiant Mj et l'ordre i du filtre Bi peuvent être alors envoyés à un dispositif décodeur D2. La présente invention vise aussi un programme informatique comportant des instructions pour la mise en œuvre de ces étapes, lorsque ce programme est exécuté par un processeur, par exemple d'un tel dispositif d'encodage Dl. Ainsi, l'organigramme représenté sur la figure 6B peut illustrer l'algorithme général d'un tel programme.
La présente invention vise aussi le dispositif de décodage D2 d'un signal encodé pour la mise en œuvre du procédé de décodage. En référence à la figure 7A, un tel dispositif comporte au moins : des moyens de réception REC d'informations (par exemple des informations représentant les coefficients du filtre modifiant Mj (sous forme d'ISF par exemple) et l'ordre i du filtre arrière Bi), pour le calcul d'un filtre prédictif modifié A,
des moyens de calcul CALC de ce filtre modifié A, basé sur :
* un filtre arrière Bi, calculé pour un bloc passé, précédant le bloc courant, et
* des paramètres d'enrichissement du filtre arrière Bi, issus des informations reçues, et des moyens de décodage DEC d'au moins un bloc courant en utilisant le filtre modifié A.
Ainsi, en référence à la figure 7B, le dispositif décodeur reçoit à l'étape 20 des informations (par exemple issues du codeur Dl), ces informations peuvent comporter ici :
les paramètres d'enrichissement précités, sous la forme de coefficients d'un filtre modifiant Mj,
ainsi, qu'un ordre i de filtre arrière Bi à calculer.
A l'étape 21, ce filtre arrière Bi est calculé, à partir de données précédemment décodées (par exemple d'une trame précédente Τη_γ ) et en utilisant l'ordre i de filtre. A l'étape 22, le filtre modifiant Mj et le filtre arrière Bi ainsi calculé sont combinés (par exemple par convolution) pour obtenir à l'étape 23 le filtre modifié A servant au décodage du signal par le dispositif décodeur D2
(étape 24), pour une trame courante à délivrer^ .
La présente invention vise aussi un programme informatique comportant des instructions pour la mise en œuvre de ces étapes, lorsque ce programme est exécuté par un processeur, par exemple d'un tel dispositif de décodage D2. Ainsi, l'organigramme représenté sur la figure 7B peut illustrer l'algorithme général d'un tel programme.
Le programme pour la mise en œuvre du procédé d'encodage (figure 6B) et le programme pour la mise en œuvre du procédé de décodage (figure 7B) peuvent être regroupés au sein d'un même programme informatique général au sens de l'invention. Bien entendu, la présente invention ne se limite pas à la forme de réalisation décrite ci-avant à titre d'exemple ; elle s'étend à d'autres variantes.
Ainsi par exemple, le critère de choix d'un filtre illustré par la figure 5 peut ne pas se limiter simplement au meilleur gain de prédiction pour un débit donné. Outre le seuil en dB à fixer pour passer d'un filtre arrière à un filtre modifié (ou d'un filtre modifié à un filtre avant) sans perception audible pour un utilisateur, un autre critère pouvant être pris en considération peut être la complexité des calculs à mener au codeur ou au décodeur. Ainsi, en référence à nouveau à la figure 5, les filtres modifiés A0 et A2 sont les meilleurs candidats au débit d0. Il sera alors choisi préférentiellement le filtre A0, moins complexe que le filtre A2, et offrant néanmoins les mêmes performances en termes de gain de prédiction.

Claims

REVENDICATIONS
1. Procédé de codage d'un signal audio numérique comportant une succession de blocs consécutifs de données, à partir d'un filtre prédictif,
caractérisé en ce qu'il comporte l'utilisation d'un filtre prédictif modifié (A), pour le codage d'au moins un bloc courant, ledit filtre modifié (A) étant construit par la combinaison de :
un filtre arrière (B) calculé pour un bloc passé, précédant le bloc courant, et
de paramètres d'enrichissement (M) du filtre arrière déterminés, en fonction du signal dans le bloc courant et comportant les coefficients d'un filtre modifiant (M).
2. Procédé selon la revendication 1, caractérisé en ce qu'il comporte, pour le codage d'un bloc courant, un choix basé sur au moins un critère prédéterminé, d'un filtre prédictif parmi au moins : un filtre arrière (B), calculé pour un bloc passé, précédant le bloc courant, et
un filtre avant (F), adapté pour le bloc courant, et
un filtre modifié (A), estimé sur la base d'un filtre arrière et en fonction du signal dans le bloc courant.
3. Procédé selon la revendication 2, caractérisé en ce que ledit critère tient compte d'une stationnarité du signal entre le bloc passé et le bloc courant, pour le choix de l'un des filtres parmi un filtre arrière, un filtre avant et un filtre modifié.
4. Procédé selon la revendication 3, caractérisé en ce que le critère prédéterminé comporte une estimation d'un gain de prédiction basée sur un rapport entre la puissance du signal dans le bloc courant et la puissance d'un signal résiduel après filtrage de ce signal en utilisant chacun desdits filtre arrière, avant et modifié.
5. Procédé selon l'une des revendications 3 et 4, caractérisé en ce que ledit critère tient compte en outre d'un nombre de paramètres à envoyer à un décodeur pour le décodage d'un bloc courant et comportant au moins des coefficients que comporte le filtre à choisir.
6. Procédé selon la revendication 5, prise en combinaison avec la revendication 4, caractérisé en ce que le critère prédéterminé comporte une recherche d'optimum entre :
le gain de prédiction qu'offre le filtre, et
un débit adapté pour la transmission desdits paramètres.
7. Procédé selon l'une des revendications précédentes, caractérisé en ce qu'il comporte les étapes : a) déterminer une pluralité de filtres avant (F0, Fl, F2, F3) d'ordres respectifs distincts, b) déterminer une pluralité de filtres arrière (B0, B l, B2, B3) d'ordres respectifs distincts, c) calculer une pluralité de filtres modifiés (A0, Al, A2, A3) d'ordres respectifs distincts, estimés chacun sur la base d'un filtre arrière déterminé à l'étape b) et en fonction du signal dans un bloc courant,
d) comparer, pour un même nombre de paramètres à envoyer à un décodeur, ce nombre étant déterminé en fonction desdits ordres de filtre, les performances d'au moins deux filtres parmi lesdits filtres avant, lesdits filtres arrière et lesdits filtres modifiés, et
e) sélectionner, pour le codage d'un bloc courant, un filtre prédictif présentant les meilleures performances selon la comparaison de l'étape d), pour un nombre donné de paramètres à envoyer à un décodeur.
8. Procédé selon la revendication 1, caractérisé en ce que le filtre modifiant (M) est estimé par déconvolution d'un filtre avant (F) adapté pour le filtrage du bloc courant, par ledit filtre arrière calculé pour un bloc passé.
9. Procédé selon la revendication 1, caractérisé en ce que le filtre modifiant (M) est déterminé sur la base d'une analyse d'un signal résiduel obtenu après filtrage du bloc courant par ledit filtre arrière calculé pour un bloc passé.
10. Procédé selon la revendication 1, caractérisé en ce que le filtre modifiant (M) est estimé par identification au sens des moindres carrés, en calculant des termes d'autocorrélation de coefficients du filtre arrière (B) et d'intercorrélation entre le filtre modifié (A) et le filtre arrière (B).
11. Procédé selon la revendication 1, caractérisé en ce qu'il comporte en outre une communication à un décodeur, d'informations de type :
choix d'un filtre avant pour un bloc courant, avec une transmission de paramètres représentant des coefficients du filtre avant,
ou choix d'un filtre arrière ou d'un filtre modifié pour un bloc courant, avec, dans le cas d'un choix d'un filtre modifié, une transmission de paramètres représentant des coefficients dudit filtre modifiant (M).
12. Procédé de décodage d'un signal audio numérique comportant une succession de blocs consécutifs de données, le procédé utilisant un filtre prédictif pour le décodage d'un bloc courant, caractérisé en ce qu'il comporte :
une réception d'informations pour le calcul d'un filtre prédictif modifié (A) basé sur la combinaison de :
* un filtre arrière (B), calculé pour un bloc passé, précédant le bloc courant, et
* des paramètres d'enrichissement (M) du filtre arrière, issus des informations reçues, comportant des coefficients de filtre, pour former un filtre modifiant (M) comportant lesdits coefficients,
et une utilisation dudit filtre prédictif ainsi modifié (A) pour le décodage d'au moins un bloc courant.
13. Procédé selon la revendication 12, caractérisé en ce qu'il comporte les étapes, pour la détermination du filtre arrière (B) :
détermination d'un ordre du filtre arrière (B), en fonction desdites informations reçues, et calcul du filtre arrière, à partir de données précédemment décodées et en utilisant ledit ordre de filtre.
14. Dispositif d'encodage d'un signal pour la mise en œuvre du procédé selon l'une des revendications 1 à 11, caractérisé en ce qu'il comporte au moins :
des moyens adaptés de calcul d'un filtre modifié sur la base d'un filtre arrière et au moins en fonction du signal dans le bloc courant, et
des moyens de codage d'au moins un bloc courant en utilisant ledit filtre modifié.
15. Dispositif de décodage d'un signal pour la mise en œuvre du procédé selon l'une des revendications 12 à 13, caractérisé en ce qu'il comporte au moins :
des moyens de réception d'informations pour le calcul d'un filtre prédictif modifié (A) des moyens adaptés de calcul dudit filtre modifié, basé sur :
* un filtre arrière (B), calculé pour un bloc passé, précédant le bloc courant, et
* des paramètres d'enrichissement (M) du filtre arrière, issus des informations reçues, et des moyens de décodage d'au moins un bloc courant en utilisant ledit filtre modifié.
16. Programme informatique comportant des instructions pour la mise en œuvre du procédé de codage selon l'une des revendications 1 à 11 et/ou pour la mise en œuvre du procédé de décodage selon l'une des revendications 12 à 13, lorsque ce programme est exécuté par un processeur.
EP11737984.2A 2010-06-29 2011-06-17 Codage/décodage prédictif linéaire adaptatif Active EP2589045B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR1055206A FR2961937A1 (fr) 2010-06-29 2010-06-29 Codage/decodage predictif lineaire adaptatif
PCT/FR2011/051393 WO2012001260A1 (fr) 2010-06-29 2011-06-17 Codage/decodage predictif lineaire adaptatif

Publications (2)

Publication Number Publication Date
EP2589045A1 true EP2589045A1 (fr) 2013-05-08
EP2589045B1 EP2589045B1 (fr) 2014-04-16

Family

ID=42989275

Family Applications (1)

Application Number Title Priority Date Filing Date
EP11737984.2A Active EP2589045B1 (fr) 2010-06-29 2011-06-17 Codage/décodage prédictif linéaire adaptatif

Country Status (4)

Country Link
US (1) US9620139B2 (fr)
EP (1) EP2589045B1 (fr)
FR (1) FR2961937A1 (fr)
WO (1) WO2012001260A1 (fr)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
EP3270376B1 (fr) * 2015-04-13 2020-03-18 Nippon Telegraph and Telephone Corporation Codage prédictif linéaire d'un signal sonore

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4328585A (en) * 1980-04-02 1982-05-04 Signatron, Inc. Fast adapting fading channel equalizer
US5533052A (en) * 1993-10-15 1996-07-02 Comsat Corporation Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation
JP3064947B2 (ja) * 1997-03-26 2000-07-12 日本電気株式会社 音声・楽音符号化及び復号化装置
FR2762464B1 (fr) * 1997-04-16 1999-06-25 France Telecom Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere"
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
US7302387B2 (en) * 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
DE102004025471A1 (de) * 2004-05-21 2005-12-15 Micronas Gmbh Verfahren bzw. adaptives Filter zum Verarbeiten einer Folge aus Eingabe-Daten eines Funksystems
KR101393298B1 (ko) * 2006-07-08 2014-05-12 삼성전자주식회사 적응적 부호화/복호화 방법 및 장치
EP1883067A1 (fr) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Méthode et appareil pour l'encodage sans perte d'un signal source, utilisant un flux de données encodées avec pertes et un flux de données d'extension sans perte.
JP4299323B2 (ja) * 2006-08-04 2009-07-22 株式会社日立国際電気 通信システム
EP2054876B1 (fr) * 2006-08-15 2011-10-26 Broadcom Corporation Dissimulation de perte de paquets pour codage predictif de sous-bande a base d'extrapolation de guide d'ondes audio pleine bande

Also Published As

Publication number Publication date
FR2961937A1 (fr) 2011-12-30
US20130103408A1 (en) 2013-04-25
WO2012001260A1 (fr) 2012-01-05
EP2589045B1 (fr) 2014-04-16
US9620139B2 (en) 2017-04-11

Similar Documents

Publication Publication Date Title
EP1994531B1 (fr) Codage ou decodage perfectionnes d&#39;un signal audionumerique, en technique celp
TWI413107B (zh) 具有多重階段編碼簿及冗餘編碼之子頻帶語音編碼/解碼的方法
JP2020109529A (ja) 復号方法、コンピュータプログラム及び復号システム
JP6692948B2 (ja) 異なるサンプリングレートを有するフレーム間の移行による音声信号の線形予測符号化および復号のための方法、符号器および復号器
EP1692689B1 (fr) Procede de codage multiple optimise
EP1997103B1 (fr) Procede de codage d&#39;un signal audio source, dispositif de codage, procede et dispositif de decodage, signal, produits programme d&#39;ordinateur correspondants
EP3175444B1 (fr) Gestion de la perte de trame dans un contexte de transition fd/lpd
EP2080194B1 (fr) Attenuation du survoisement, notamment pour la generation d&#39;une excitation aupres d&#39;un decodeur, en absence d&#39;information
EP3175443B1 (fr) Détermination d&#39;un budget de codage d&#39;une trame de transition lpd/fd
EP2795618B1 (fr) Procédé de détection d&#39;une bande de fréquence prédéterminée dans un signal de données audio, dispositif de détection et programme d&#39;ordinateur correspondant
EP1875465A1 (fr) Procede d&#39;adaptation pour une interoperabilite entre modeles de correlation a cout terme de signaux numeriques
FR2880724A1 (fr) Procede et dispositif de codage optimise entre deux modeles de prediction a long terme
EP2345029B1 (fr) Procédé, programme informatique et entité de décodage d&#39;un signal audio numérique
EP2589045B1 (fr) Codage/décodage prédictif linéaire adaptatif
KR102099293B1 (ko) 오디오 인코더 및 오디오 신호를 인코딩하는 방법
Tosun Dynamically adding redundancy for improved error concealment in packet voice coding
WO2013135997A1 (fr) Modification des caractéristiques spectrales d&#39;un filtre de prédiction linéaire d&#39;un signal audionumérique représenté par ses coefficients lsf ou isf
FR2737360A1 (fr) Procedes de codage et de decodage de signaux audiofrequence, codeur et decodeur pour la mise en oeuvre de tels procedes
FR2980620A1 (fr) Traitement d&#39;amelioration de la qualite des signaux audiofrequences decodes
FR3018942A1 (fr) Estimation d&#39;un bruit de codage introduit par un codage en compression de type micda

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20121227

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

RAP1 Party data changed (applicant data changed or rights of an application transferred)

Owner name: ORANGE

DAX Request for extension of the european patent (deleted)
GRAP Despatch of communication of intention to grant a patent

Free format text: ORIGINAL CODE: EPIDOSNIGR1

RIC1 Information provided on ipc code assigned before grant

Ipc: G10L 19/06 20130101AFI20131010BHEP

Ipc: G10L 19/18 20130101ALN20131010BHEP

INTG Intention to grant announced

Effective date: 20131113

GRAS Grant fee paid

Free format text: ORIGINAL CODE: EPIDOSNIGR3

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC MK MT NL NO PL PT RO RS SE SI SK SM TR

REG Reference to a national code

Ref country code: GB

Ref legal event code: FG4D

Free format text: NOT ENGLISH

REG Reference to a national code

Ref country code: CH

Ref legal event code: EP

REG Reference to a national code

Ref country code: AT

Ref legal event code: REF

Ref document number: 662968

Country of ref document: AT

Kind code of ref document: T

Effective date: 20140515

REG Reference to a national code

Ref country code: IE

Ref legal event code: FG4D

Free format text: LANGUAGE OF EP DOCUMENT: FRENCH

REG Reference to a national code

Ref country code: DE

Ref legal event code: R096

Ref document number: 602011006255

Country of ref document: DE

Effective date: 20140528

REG Reference to a national code

Ref country code: AT

Ref legal event code: MK05

Ref document number: 662968

Country of ref document: AT

Kind code of ref document: T

Effective date: 20140416

REG Reference to a national code

Ref country code: NL

Ref legal event code: VDEP

Effective date: 20140416

REG Reference to a national code

Ref country code: LT

Ref legal event code: MG4D

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: NO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140716

Ref country code: IS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140816

Ref country code: BG

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140716

Ref country code: CY

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: GR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140717

Ref country code: NL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: LT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: FI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: HR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: PL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: LV

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: SE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: AT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: RS

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: ES

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: PT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140818

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602011006255

Country of ref document: DE

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: CZ

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: LU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140617

Ref country code: RO

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: MC

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: DK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: SK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: EE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

REG Reference to a national code

Ref country code: CH

Ref legal event code: PL

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

26N No opposition filed

Effective date: 20150119

REG Reference to a national code

Ref country code: IE

Ref legal event code: MM4A

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IE

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20140617

Ref country code: LI

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20140630

Ref country code: CH

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES

Effective date: 20140630

REG Reference to a national code

Ref country code: DE

Ref legal event code: R097

Ref document number: 602011006255

Country of ref document: DE

Effective date: 20150119

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 5

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SI

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MT

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: SM

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 6

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: TR

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

Ref country code: BE

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140630

Ref country code: HU

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT; INVALID AB INITIO

Effective date: 20110617

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 7

REG Reference to a national code

Ref country code: FR

Ref legal event code: PLFP

Year of fee payment: 8

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: MK

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: AL

Free format text: LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT

Effective date: 20140416

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 20240521

Year of fee payment: 14

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 20240521

Year of fee payment: 14

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: FR

Payment date: 20240522

Year of fee payment: 14