WO2002069328A1 - Reconstruction spectrale et codage d'un signal a spectre incomplet - Google Patents

Reconstruction spectrale et codage d'un signal a spectre incomplet Download PDF

Info

Publication number
WO2002069328A1
WO2002069328A1 PCT/FR2002/000618 FR0200618W WO02069328A1 WO 2002069328 A1 WO2002069328 A1 WO 2002069328A1 FR 0200618 W FR0200618 W FR 0200618W WO 02069328 A1 WO02069328 A1 WO 02069328A1
Authority
WO
WIPO (PCT)
Prior art keywords
spectral
band
signal
audio signal
spectrum
Prior art date
Application number
PCT/FR2002/000618
Other languages
English (en)
Inventor
Pierrik Philippe
Patrice Collen
Original Assignee
France Telecom Sa
Telediffusion De France Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom Sa, Telediffusion De France Sa filed Critical France Telecom Sa
Publication of WO2002069328A1 publication Critical patent/WO2002069328A1/fr

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Definitions

  • the present invention relates to a method and a device for spectral reconstruction of an incomplete spectrum signal. More particularly, the present invention finds application in the improvement of the decoding of an audio signal encoded by an encoder with spectral band limitation, in particular an encoder with reduction in bit rate of the transform type.
  • the invention relates to a decoding device comprising this spectral reconstruction device as well as a coding / decoding system.
  • the audio signal In bit rate reduction audio coding, the audio signal often has to undergo bandwidth limitation when the bit rate becomes low. This bandwidth limitation is necessary to avoid the introduction of audible quantization noise into the coded signal. It is therefore desirable to regenerate as far as possible the high frequency content of the original signal.
  • This technique is based on an analysis in sub-bands and a complex harmonic duplication. It implements phase and amplitude adjustment methods which are costly in computation. In addition, the spectral weighting factors only roughly model the spectral envelope.
  • a spectral enrichment technique applied in particular to improving the decoding of an audio signal coded by an encoder with limitation of spectral band, in which information describing the spectral envelope of a signal before coding is transmitted to the decoder or is reconstituted by the latter.
  • the spectrum of the decoded low-frequency signal is whitened by a whitening filter with a reverse (or approximately inverse) transfer function to the envelope function.
  • the bleached spectrum is transposed to the high frequencies.
  • the resulting transposed spectrum signal is shaped by means of a shaping filter, the transfer function of which is estimated from information describing the spectral envelope of the signal before coding.
  • Spectral bleaching well known in the field of audio coding, can be carried out, for example, by LPC filtering (Linear Predictive Coding), as described in the article by J. Makhoul entitled “Linear Prediction: a tutorial review", Proceedings of the IEEE, Vol. 63, N ° 4, pp 561-580.
  • This technique makes it possible to perform an efficient spectral reconstruction with a device of low complexity.
  • the spectral shaping of the reconstructed signal is more precise and simpler than with prior techniques.
  • the decoded signal can undergo notable spectral distortions. For example, certain frequency bands, judged not perceptible by the psycho-acoustic model, are not transmitted. In addition, it can be filtered, certain frequency bands having suffered a loss of energy. The spectral whitening of such a signal is therefore very delicate and requires a whitening filter using a large number of coefficients.
  • Fig. 2 represents the spectrum of a signal from a decoder in an ideal transmission case. This signal is an audio signal with a band limited to the 0-5 kHz band. The envelope corresponding to this signal is also shown in FIG. 2.
  • the envelope is modeled in the form of a filter whose coefficients are estimated from the limited band signal.
  • the residual whitened signal which is shown in FIG. 3.
  • Fig. 4 represents the spectrum of a limited band audio signal of the same type as that shown in FIG. 2, but for which a frequency band has not been transmitted. The spectral bleaching operation is disturbed by the presence of such a frequency hole.
  • Fig. 5 represents the corresponding bleached signal. Too much energy is observed in the frequency bands adjacent to the non-transmitted band, the poles of the whitening filter tending to increase the energy of the low energy frequency zones.
  • the problem underlying the invention is, in the context of the spectral reconstruction of a signal with bleaching of a spectral content to be transposed, the optimization of the bleaching of signals having undergone significant spectral distortions.
  • the problem underlying the invention is solved by a method of spectral reconstruction of an audio signal with limited band, for example of an audio signal resulting from coding with limitation of spectrum of a source signal, the spectrum of said limited band audio signal being limited to a first spectral band, said first spectral band possibly comprising frequency holes in sub-bands of said first spectral band, said method comprising:
  • a spectral bleaching step for whitening the spectral content of the first spectral band, using information giving the spectral envelope of the limited band audio signal corrected by said correction step.
  • the spectral reconstruction method further comprises:
  • the spectral whitening step is advantageously carried out by filtering the limited band audio signal by means of a whitening filter whose transfer function is the inverse of the spectral envelope of the audio band signal limited corrected by said correction step.
  • the spectral whitening step is carried out by filtering the limited band audio signal corrected by said correction step by means of a whitening filter whose transfer function is the inverse of the spectral envelope of the band limited audio signal corrected by said correcting step.
  • said components injected into said sub-bands are noise components.
  • said components injected into said sub-bands are harmonic components relating to known components of the limited band audio signal.
  • the components injected into a sub-band are obtained by translation possibly followed by a reversal of the spectral content of a spectral band adjacent to said sub-band.
  • the invention is also defined by a device for spectral reconstruction of an audio signal with limited band, for example of an audio signal resulting from a coding with spectrum limitation of a source signal, comprising means for implementing the steps of the process defined above.
  • this reconstruction device comprises:
  • the invention is also defined by a device for decoding an audio signal encoded by spectrum limitation coding of a source signal, this device comprising a decoder adapted to supply a limited band audio signal and a spectral reconstruction device such as defined above.
  • said decoder is adapted to supply the correction module with information relating to the power of the components to be injected.
  • an audio coding / decoding system comprising a spectrum limiting audio coder suitable for coding a source signal and a decoding device as defined above.
  • This system can also comprise means adapted to transmit spectral envelope information in the band not transmitted by the coder.
  • FIG. . 1 schematically represents a device for spectral reconstruction of an audio signal according to the invention
  • Fig. 2 represents the spectrum of a signal emitted by a decoder in an ideal transmission case
  • Fig. 3 represents the spectrum of the signal of FIG. 2 after spectral bleaching
  • Fig. 4 represents the spectrum of a signal emitted by a decoder in the case where a frequency band has not been transmitted
  • Fig. 5 represents the spectrum of the signal of FIG. 4 after spectral bleaching
  • Figs. 6a to 6d schematically illustrate a method of spectral reconstruction according to a first embodiment of the invention
  • Figs. 7a to 7d schematically illustrate a method of spectral reconstruction according to a second embodiment of the invention.
  • the spectral reconstruction method according to the invention can be applied to a signal resulting from the decoding of an audio signal encoded by an encoder with spectral band limitation, in particular an encoder by transform, such as for example an encoder of MPEG-4 type. AAC.
  • an audio signal is coded by an encoder 100, for example a transform encoder, such as MPEG-4 AAC.
  • an encoder 100 for example a transform encoder, such as MPEG-4 AAC.
  • the data is decoded in the decoder 1 10 under the shape of spectral components. These generally correspond to the spectrum of an audio signal with limited band, which can moreover have missing sub-bands or "frequency gaps" in the band.
  • the spectral components are transmitted to a first module 120 adapted to detect the presence of frequency holes and to fill them by injecting noise components or harmonics of known components.
  • the module 120 will fill a frequency hole by transposing the spectral content of a band adjacent to this hole.
  • This transposition can be a simple translation or a translation combined with a reversal.
  • the power of the signal to be injected is determined by interpolation from the power values of the known components.
  • the power level of the signal to be injected has been previously determined at the level of the coder and transmitted in the form of auxiliary information to the decoder. After decoding, this auxiliary information is supplied to the module 120. This variant is symbolized by the link 1 15.
  • the module 130 is a spectral envelope estimation module operating on the limited band signal and the spectral holes of which have been filled. It can, for example, model the spectral envelope by an LPC analysis after conversion in the time domain of the spectrum provided by the module 120. This gives the coefficients of a filter modeling the spectral envelope in the signal band.
  • the module 150 is a whitening filter whose transfer function is the inverse of the transfer function of this envelope modeling filter. According to a first variant, the whitening filter receives the signal represented by the original spectrum having frequency holes, as supplied by the decoder 1 10. This variant is represented in broken lines by the link 1 1 1, According to another embodiment , the whitening filter receives the signal corresponding to the spectrum whose holes have been filled, as supplied by the module 120. This embodiment is represented by the link 121.
  • the module 160 is a spectral transposition module. Its function is to copy all or part of the signal band into a target band.
  • the transposition operation is for example a translation or a reversal followed by a translation in a target band.
  • the module 170 is a spectral shaping filter receiving spectral envelope information in the target band.
  • This information can be transmitted by a module 105 attached to the coder, adapted to perform an envelope modeling of the full band audio signal. Only the information relating to the spectral band not coded by the encoder 100 is transmitted by the module 170.
  • the spectral envelope information in the target band can be extrapolated from the spectral envelope information in the limited band. In this case, the module 130 performs this extrapolation and transmits the extrapolated information to the module 170. This embodiment is symbolized by the link in broken lines 135.
  • the module 120 is a correction module suitable for analyzing the signal from the decoder 110, in order to determine if one or more frequency bands have not been transmitted, for correcting this signal, by adding components to the absent frequency band or bands .
  • the signal at the output of the decoder 110 is incomplete or limited spectrum, capable of spectral enrichment.
  • the spectrum of this signal may include one or more frequency holes.
  • it may be an audio signal with a band limited to the 0 to 5 kHz band with a frequency hole, like the one shown in FIG. 4.
  • the correction module 120 analyzes the signal from the decoder 110 in order to search for any missing frequency bands. When it detects them, it injects spectral components into the missing frequency band or bands.
  • the respective powers of the components to be injected may have been previously determined at the level of the coder and transmitted as auxiliary information to the decoder. Alternatively, the respective powers of the components to be injected can be estimated from the received signal. These can be calculations based on averages, estimates made from frequency bands adjacent to non-transmitted bands, interpolations, or comparisons with a dictionary of waveforms.
  • the components injected into the signal by the module 120 can be either noise components or harmonic components of known components of the decoded signal.
  • the components to be injected can be the spectral components of an adjacent spectral band which is subjected to a translation operation, possibly combined with an inversion operation.
  • a corrected signal is thus obtained having a spectrum whose holes have been filled.
  • the spectral envelope estimation module 130 estimates the spectral envelope of the corrected signal in the limited band. The latter estimates the coefficients of the whitening filter on the basis of this corrected signal.
  • the signal from the decoder, whether corrected or not, is filtered by the whitening filter 150, the transfer function of which is obtained from the estimation of the spectral envelope, carried out by the module 130.
  • the whitened spectrum signal is subjected to spectral transposition by the transposition module 160.
  • the signal with offset spectrum obtained is typically a signal with spectrum translated towards high frequencies, for example towards the band 5 at 10 kHz in the case of the example of FIG. 4.
  • This shifted spectrum signal is filtered by the shaping filter 170, the transfer function of which is estimated from information describing the spectral envelope of the target band.
  • the signal thus filtered constitutes a spectral enrichment signal which is added, thanks to the summator 180, to the limited band signal originating, as the case may be, from the decoder via the link 1 1 1 or from the module 120 via the link 121.
  • Figs. 6a to 6d illustrate the reconstruction method according to a first embodiment of the invention.
  • the link 1 1 1 exists and the link 121 is absent.
  • Fig. 6a represents the spectrum of a band-limited signal [0, B] having a frequency hole B ', for example the spectrum of the signal at the output of the audio decoder 1 10.
  • FIG. 6b represents the spectrum of the signal at the output of the correction module 120. The frequency gap has been filled here by injection of harmonics.
  • the module 130 determines the coefficients of the whitening filter from this corrected signal.
  • Fig. 6c represents the spectrum of the signal at the output of the whitening filter.
  • Fig. 6d represents the spectrum of the signal after spectral transposition, at the output of the transposition module 160. This signal will be reshaped by the filter 170 to provide a spectral enrichment signal which will be added to the initial signal.
  • Figs. 7a to 7d illustrate the reconstruction method according to a second embodiment of the invention.
  • the link 121 exists and the link 1 1 1 is absent.
  • Figs. 7a and 7b recall the spectrum of the signal at the output of the decoder and of the correction module.
  • Fig. 7c represents the spectrum of the signal at the output of the whitening filter. Note that the whitened signal no longer has a frequency hole.
  • Fig. 7d represents the spectrum of the signal after spectral transposition, at the output of the transposition module 160. This signal will be reshaped by the filter 170 to provide a spectral enrichment signal which will be added to the initial signal.
  • the device according to the invention has been shown in the form of functional modules, it goes without saying that all or part of this device can be produced by means of a single processor or a plurality of dedicated or non-dedicated processors.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention a trait à un procédé de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, le spectre dudit signal audio à bande limitée à une première bande spectrale pouvant comprendre des trous fréquentiels dans des sous-bandes de ladite première bande spectrale, ledit procédé comprenant: - une étape de correction (120) dudit signal audio à bande limitée adaptée à injecter des composantes spectrales dans lesdites sous-bandes; - une étape de blanchiment spectral (150) par un filtre blanchisseur pour blanchir le contenu spectral de la première bande spectrale, la fonction de transfert dudit filtre blanchisseur étant obtenue à partir d'une information donnant l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction. L'invention concerne également un dispositif de reconstruction spectrale correspondant, un dispositif de décodage comprenant ce dernier ainsi qu'un système de codage/décodage.

Description

RECONSTRUCTION SPECTRALE ET CODAGE D UN SIGNAL A SPECTRE INCOMPLET
La présente invention concerne un procédé et un dispositif de reconstruction spectrale d'un signal à spectre incomplet. Plus particulièrement, la présente invention trouve application dans l'amélioration du décodage d'un signal audio codé par un codeur à limitation de bande spectrale, notamment un codeur à réduction de débit du type par transformée. L'invention concerne un dispositif de décodage comprenant ce dispositif de reconstruction spectrale ainsi qu'un système de codage/ décodage.
En codage audio à réduction de débit, le signal audio doit souvent subir une limitation de bande passante lorsque le débit binaire devient faible. Cette limitation de bande passante est nécessaire pour éviter l'introduction de bruit de quantification audible dans le signal codé. Il est alors souhaitable de régénérer dans la mesure du possible le contenu haute fréquence du signal original.
Est connu de l'état de la technique, et notamment du document WO-A-9857436, le fait de régénérer le contenu spectral haute fréquence du signal original en procédant à une transposition harmonique du spectre basse fréquence du signal décodé vers les hautes fréquences. Cette transposition est effectuée en recopiant la valeur spectrale d'un fondamental à f à toutes les fréquences de la série harmonique n*fk. La forme du spectre haute fréquence ainsi obtenue est ajustée en appliquant des facteurs de pondération spectrale.
Cette technique est fondée sur une analyse en sous-bandes et une duplication harmonique complexe. Elle met en oeuvre des méthodes d'ajustement de phase et d'amplitude coûteuses en calcul. En outre, les facteurs de pondération spectrale ne modélisent que grossièrement l'enveloppe spectrale.
Plus récemment, a été proposée dans la demande française non publiée N° 0005023, déposée par la demanderesse, une technique d'enrichissement spectral, s'appliquant notamment à l'amélioration du décodage d'un signal audio codé par un codeur à limitation de bande spectrale, dans laquelle une information décrivant l'enveloppe spectrale d'un signal avant codage est transmise au décodeur ou est reconstituée par ce dernier. Le spectre du signal basse fréquence décodé est blanchi par le biais d'un filtre blanchisseur de fonction de transfert inverse (ou approximativement inverse) à la fonction d'enveloppe. Le spectre blanchi est transposé vers les hautes fréquences. Le signal à spectre transposé résultant est mis en forme par le biais d'un filtre de mise en forme dont la fonction de transfert est estimée à partir de l'information décrivant l'enveloppe spectrale du signal avant codage. Le signal résultant est ajouté au signal à spectre limité par un sommateur pour générer un signal reconstruit spectralement. Le blanchiment spectral, bien connu dans le domaine du codage audio, peut être réalisé, par exemple, par filtrage LPC (Linear Prédictive Coding), tel que décrit dans l'article de J. Makhoul intitulé « Linear Prédiction : a tutorial review », Proceedings of the IEEE, Vol. 63, N°4, pp 561-580.
Cette technique permet de réaliser une reconstruction spectrale performante avec un dispositif de faible complexité. En outre, la mise en forme spectrale du signal reconstruit est plus précise et plus simple qu'avec les techniques antérieures.
Cependant, lorsque le codeur utilisé est un codeur par transformée, comme par exemple un codeur de type MPEG-4 AAC, le signal décodé peut subir des distorsions spectrales notables. Par exemple, certaines bandes fréquentielles, jugées non perceptibles par le modèle psycho-acoustique, ne sont pas transmises. En outre, il peut être filtré, certaines bandes fréquentielles ayant subi une perte d'énergie. Le blanchiment spectral d'un tel signal est alors très délicat et requiert un filtre blanchisseur utilisant un grand nombre de coefficients. La Fig. 2 représente le spectre d'un signal issu d'un décodeur dans un cas de transmission idéale. Ce signal est un signal audio à bande limitée à la bande 0-5 kHz. L'enveloppe correspondant à ce signal est également représentée à la Fig. 2. Suivant la technique de reconstruction spectrale basée sur le blanchiment du contenu spectral à transposer, l'enveloppe est modélisée sous la forme d'un filtre dont les coefficients sont estimés à partir du signal à bande limitée. En appliquant le filtre inverse sur ce signal, on obtient le signal résiduel blanchi qui est représenté à la Fig. 3.
La Fig. 4 représente le spectre d'un signal audio à bande limitée du même type que celui représenté à la Fig. 2, mais pour lequel une bande de fréquences n'a pas été transmise. L'opération de blanchiment spectral est perturbée par la présence d'un tel trou fréquentiel.
La Fig. 5 représente le signal blanchi correspondant. On observe une énergie trop forte dans les bandes fréquentielles adjacentes à la bande non transmise, les pôles du filtre blanchisseur tendant à augmenter l'énergie des zones fréquentielles de faible énergie.
Le problème à la base de l'invention est, dans le cadre de la reconstruction spectrale d'un signal avec blanchiment d'un contenu spectral à transposer, l'optimisation du blanchiment de signaux ayant subi des distorsions spectrales notables. Le problème à la base de l'invention est résolu par un procédé de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, le spectre dudit signal audio à bande limitée étant limité à une première bande spectrale, ladite première bande spectrale pouvant comprendre des trous fréquentiels dans des sous-bandes de ladite première bande spectrale, ledit procédé comprenant :
- une étape de correction dudit signal audio à bande limitée adaptée à injecter des composantes spectrales dans lesdites sous-bandes ;
- une étape de blanchiment spectral pour blanchir le contenu spectral de la première bande spectrale, utilisant une information donnant l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.
Avantageusement, le procédé de reconstruction spectrale comprend en outre :
- une étape de transposition du contenu spectral blanchi de ladite première bande spectrale dans une seconde bande spectrale pour générer un signal à spectre transposé, de spectre limité à ladite seconde bande spectrale ; - une étape de mise en forme du spectre dudit signal à spectre transposé pour obtenir un signal d'enrichissement ;
- une étape de combinaison dudit signal à bande limitée et dudit signal d'enrichissement pour produire un signal à spectre reconstruit. Selon un premier mode de réalisation, l'étape de blanchiment spectral est avantageusement effectuée en filtrant le signal audio à bande limitée au moyen d'un filtre blanchisseur dont la fonction de transfert est l'inverse de l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.
Selon un second mode de réalisation, l'étape de blanchiment spectral est effectuée en filtrant le signal audio à bande limitée corrigé par ladite étape de correction au moyen d'un filtre blanchisseur dont la fonction de transfert est l'inverse de l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.
Selon une première variante, lesdites composantes injectées dans lesdites sous- bandes sont des composantes de bruit.
Selon un seconde variante, lesdites composantes injectées dans lesdites sous- bandes sont des composantes harmoniques relatives à des composantes connues du signal audio à bande limitée.
Selon une troisième variante, les composantes injectées dans une sous-bande sont obtenues par translation suivie éventuellement d'un retournement du contenu spectral d'une bande spectrale adjacente à ladite sous-bande.
L'invention est également définie par un dispositif de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, comprenant des moyens pour mettre en œuvre les étapes du procédé défini ci-dessus.
Avantageusement, ce dispositif de reconstruction comprend:
- un filtre blanchisseur pour exécuter ladite étape de blanchiment du contenu spectral ;
- un module de transposition du contenu spectral pour exécuter ladite étape de transposition du contenu spectral ;
- un filtre de mise en forme pour exécuter ladite étape de mise en forme ;
- un module de correction pour exécuter ladite étape de correction, la fonction de transfert dudit filtre blanchisseur étant obtenue à partir d'une information issue dudit module de correction. L'invention est également définie par un dispositif de décodage d'un signal audio codé par codage à limitation de spectre d'un signal source, ce dispositif comprenant un décodeur adapté à fournir un signal audio à bande limitée et un dispositif de reconstruction spectrale tel que défini ci-dessus. Avantageusement, ledit décodeur est adapté à fournir au module de correction une information relative à la puissance des composantes à injecter.
Enfin, l'invention est définie par un système de codage/décodage audio, comprenant un codeur audio à limitation de spectre adapté à coder un signal source et un dispositif de décodage comme défini ci-dessus. Ce système peut comprendre en outre des moyens adaptés à transmettre une information d'enveloppe spectrale dans la bande non transmise par le codeur.
Les caractéristiques de l'invention mentionnées ci-dessus, ainsi que d'autres, apparaîtront plus clairement à la lecture de la description suivante d'un exemple de réalisation, ladite description étant faite en relation avec les dessins joints, parmi lesquels: la Fig. 1 représente schématiquement un dispositif de reconstruction spectrale d'un signal audio selon l'invention ; la Fig. 2 représente le spectre d'un signal émis par un décodeur dans un cas de transmission idéale ; la Fig. 3 représente le spectre du signal de la Fig. 2 après blanchiment spectral ; la Fig. 4 représente le spectre d'un signal émis par un décodeur dans le cas où une bande de fréquences n'a pas été transmise ; et la Fig. 5 représente le spectre du signal de la Fig. 4 après blanchiment spectral, les Figs. 6a à 6d illustrent schématiquement un procédé de reconstruction spectrale selon un premier mode de réalisation de l'invention ; la Figs. 7a à 7d illustrent schématiquement un procédé de reconstruction spectrale selon un second mode de réalisation de l'invention.
Le procédé de reconstruction spectrale selon l'invention peut s'appliquer à un signal issu du décodage d'un signal audio codé par un codeur à limitation de bande spectrale, notamment un codeur par transformée, comme par exemple un codeur de type MPEG-4 AAC.
En référence à la Fig. 1 , un signal audio est codé par un codeur 100, par exemple un codeur par transformée, tel que le MPEG-4 AAC. Après transmission du signal codé par un moyen quelconque, les données sont décodées dans le décodeur 1 10 sous la forme de composante spectrales. Celles-ci correspondent en général au spectre d'un signal audio à bande limitée, pouvant en outre présenter des sous-bandes manquantes ou « trous fréquentiels » dans la bande.
Les composantes spectrales sont transmises à un premier module 120 adapté à détecter la présence de trous fréquentiels et à les combler en injectant des composantes de bruit ou des harmoniques de composantes connues. Alternativement, le module 120 comblera un trou fréquentiel par transposition du contenu spectral d'une bande adjacente à ce trou. Cette transposition peut être une simple translation ou une translation combinée avec un retournement. Selon une première variante, la puissance du signal à injecter est déterminée par interpolation à partir des valeurs de puissance des composantes connues. Selon une seconde variante, le niveau de puissance du signal à injecter a été préalablement déterminé au niveau du codeur et transmis sous la forme d'une information auxiliaire au décodeur. Après décodage, cette information auxiliaire est fournie au module 120. Cette variante est symbolisée par la liaison 1 15.
Le module 130 est un module d'estimation d'enveloppe spectrale opérant sur le signal à bande limitée et dont les trous spectraux ont été comblés. Il peut, par exemple, modéliser l'enveloppe spectrale par une analyse LPC après conversion dans le domaine temporel du spectre fourni par le module 120. On obtient ainsi les coefficients d'un filtre modélisant l'enveloppe spectrale dans la bande du signal. Le module 150 est un filtre blanchisseur dont la fonction de transfert est l'inverse de la fonction de transfert de ce filtre de modélisation d'enveloppe. Selon une première variante, le filtre blanchisseur reçoit le signal représenté par le spectre original présentant des trous fréquentiels , tel que fourni par le décodeur 1 10. Cette variante est représentée en traits interrompus par la liaison 1 1 1, Selon un autre mode de réalisation, le filtre blanchisseur reçoit le signal correspondant au spectre dont les trous ont été comblés, tel que fourni par le module 120. Ce mode de réalisation est représentée par la liaison 121.
Le module 160 est un module de transposition spectrale. Il a pour fonction de recopier toute ou partie de la bande du signal dans une bande cible. L'opération de transposition est par exemple une translation ou un retournement suivi d'une translation dans une bande cible.
Le module 170 est un filtre de mise en forme spectrale recevant une information d'enveloppe spectrale dans la bande cible. Cette information peut être transmise par un module 105 adjoint au codeur, adapté à effectuer une modélisation d'enveloppe du signal audio pleine bande. Seule l'information relative à la bande spectrale non codée par le codeur 100 est transmise par le module 170. Alternativement, l'information d'enveloppe spectrale dans la bande cible peut être extrapolée à partir de l'information d'enveloppe spectrale dans la bande limitée. Dans ce cas, le module 130 effectue cette extrapolation et transmet l'information extrapolée au module 170. Ce mode de réalisation est symbolisé par la liaison en traits discontinus 135.
Le module 120 est un module de correction adapté à analyser le signal issu du décodeur 110, afin de déterminer si une ou plusieurs bandes fréquentielles n'ont pas été transmises, à corriger ce signal, en ajoutant des composantes dans la ou les bandes fréquentielles absentes.
Le signal en sortie du décodeur 1 10 est à spectre incomplet ou limité, susceptible d'enrichissement spectral. En outre, le spectre de ce signal peut comporter un ou plusieurs trous fréquentiels. Par exemple, il peut s'agir d'un signal audio à bande limitée à la bande 0 à 5 kHz avec un trou fréquentiel, comme celui qui est représenté à la Fig. 4.
Le module de correction 120 analyse le signal issu du décodeur 110 afin de rechercher d'éventuelles bandes fréquentielles manquantes. Lorsqu'il en détecte, il injecte des composantes spectrales dans la ou les bandes fréquentielles manquantes. Les puissances respectives des composantes à injecter peut avoir été préalablement déterminées au niveau du codeur et transmises comme information auxiliaire au décodeur. Alternativement, les puissances respectives des composantes à injecter peuvent être estimées à partir du signal reçu. Il peut s'agir de calculs basés sur des moyennes, d'estimations effectuées à partir des bandes de fréquences adjacentes à des bandes non transmises, d'interpolations, ou de comparaisons avec un dictionnaire de formes d'ondes.
Les composantes injectées dans le signal par le module 120 peuvent être, soit des composantes de bruit, soit des composantes harmoniques de composantes connues du signal décodé. Les composantes à injecter peuvent être les composantes spectrales d'une bande spectrale adjacente que l'on soumet à une opération de translation, combinée éventuellement à une opération de retournement.
On obtient ainsi un signal corrigé ayant un spectre dont les trous ont été comblés. Le module d'estimation d'enveloppe spectrale 130 estime l'enveloppe spectrale du signal corrigé dans la bande limitée. Ce dernier estime les coefficients du filtre blanchisseur sur la base de ce signal corrigé.
Le signal issu du décodeur, corrigé ou non, est filtré par le filtre blanchisseur 150 dont la fonction de transfert est obtenue à partir de l'estimation de l'enveloppe spectrale, effectuée par le module 130. Le signal de spectre blanchi est soumis à transposition spectrale par le module de transposition 160. Le signal à spectre décalé obtenu est typiquement un signal à spectre translaté vers les hautes fréquences, par exemple vers la bande 5 à 10 kHz dans le cas de l'exemple de la Fig. 4. Ce signal à spectre décalé est filtré par le filtre de mise en forme 170 dont la fonction de transfert est estimée à partir de l'information décrivant l'enveloppe spectrale de la bande cible. Le signal ainsi filtré constitue un signal d'enrichissement spectral qui est ajouté, grâce au sommateur 180, au signal à bande limitée issu, selon le cas, du décodeur via la liaison 1 1 1 ou du module 120 via la liaison 121. On obtient en sortie du sommateur un signal reconstruit spectralement.
Les Figs. 6a à 6d illustrent le procédé de reconstruction selon un premier mode de réalisation de l'invention. Dans ce mode de réalisation, la liaison 1 1 1 existe et la liaison 121 est absente.
La Fig. 6a représente le spectre d'un signal à bande limitée [0,B] présentant un trou fréquentiel B', par exemple le spectre du signal en sortie du décodeur audio 1 10. La Fig. 6b représente le spectre du signal en sortie du module de correction 120. Le trou fréquentiel a été comblé ici par injection d'harmoniques. Le module 130 détermine les coefficients du filtre blanchisseur à partir de ce signal corrigé. La Fig. 6c représente le spectre du signal en sortie du filtre blanchisseur. La Fig. 6d représente le spectre du signal après transposition spectrale, en sortie du module de transposition 160. Ce signal sera remis en forme par le filtre 170 pour fournir un signal d'enrichissement spectral qui sera ajouté au signal initial.
Les Figs. 7a à 7d illustrent le procédé de reconstruction selon un second mode de réalisation de l'invention. Dans ce mode de réalisation, la liaison 121 existe et la liaison 1 1 1 est absente.
Les Figs. 7a et 7b rappellent le spectre du signal en sortie du décodeur et du module de correction.
La Fig. 7c représente le spectre du signal en sortie du filtre blanchisseur. On notera que le signal blanchi ne présente plus de trou fréquentiel. La Fig. 7d représente le spectre du signal après transposition spectrale, en sortie du module de transposition 160. Ce signal sera remis en forme par le filtre 170 pour fournir un signal d'enrichissement spectral qui sera ajouté au signal initial.
Bien que le dispositif selon l'invention ait été représenté sous la forme de modules fonctionnels, il va de soi que tout ou partie de ce dispositif peut être réalisé au moyen d'un processeur unique ou une pluralité de processeurs dédiés ou non.

Claims

REVENDICATIONS
1) Procédé de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, le spectre dudit signal audio à bande limitée étant limité à une première bande spectrale, ladite première bande spectrale pouvant comprendre des trous fréquentiels dans des sous-bandes de ladite première bande spectrale, ledit procédé étant caractérisé en ce qu'il comprend :
- une étape de correction (120) dudit signal audio à bande limitée adaptée à injecter des composantes spectrales dans lesdites sous-bandes ;
- une étape de blanchiment spectral (150) pour blanchir le contenu spectral de la première bande spectrale, utilisant une information donnant l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.
2) Procédé de reconstruction spectrale selon la revendication 1 , caractérisée en ce qu'il comprend en outre : - une étape de transposition (160) du contenu spectral blanchi de ladite première bande spectrale dans une seconde bande spectrale pour générer un signal à spectre transposé, de spectre limité à ladite seconde bande spectrale ;
- une étape de mise en forme (170) du spectre dudit signal à spectre transposé pour obtenir un signal d'enrichissement ; - une étape de combinaison (180) dudit signal à bande limitée et dudit signal d'enrichissement pour produire un signal à spectre reconstruit.
3) Procédé de reconstruction spectrale selon la revendication 1 ou 2, caractérisé en ce que ladite étape de blanchiment spectral est effectuée en filtrant le signal audio à bande limitée au moyen d'un filtre blanchisseur dont la fonction de transfert est l'inverse de l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.
4) Procédé de reconstruction spectrale selon la revendication 1 ou 2, caractérisé en ce que ladite étape de blanchiment spectral est effectuée en filtrant le signal audio à bande limitée corrigé par ladite étape de correction au moyen d'un filtre blanchisseur dont la fonction de transfert est l'inverse de l'enveloppe spectrale du signal audio à bande limitée corrigé par ladite étape de correction.
5) Procédé de reconstruction spectrale selon l'une des revendications précédentes, caractérisé en ce que lesdites composantes injectées dans lesdites sous- bandes sont des composantes de bruit.
6) Procédé de reconstruction spectrale selon l'une des revendications 1 à 4, caractérisé en ce que lesdites composantes injectées dans lesdites sous-bandes sont des composantes harmoniques relatives à des composantes connues du signal audio à bande limitée.
7) Procédé de reconstruction spectrale selon l'une des revendications 1 à 4, caractérisé en ce que les composantes injectées dans une sous-bande sont obtenues par translation suivie éventuellement d'un retournement du contenu spectral d'une bande spectrale adjacente à ladite sous-bande.
8) Dispositif de reconstruction spectrale d'un signal audio à bande limitée, par exemple d'un signal audio issu d'un codage à limitation de spectre d'un signal source, caractérisé en ce qu'il comprend des moyens pour mettre en œuvre les étapes du procédé selon l'une quelconque des revendications 1 à 7.
9) Dispositif de reconstruction spectrale selon la revendication 8, caractérisé en ce qu'il comprend: - un filtre blanchisseur (150) pour exécuter ladite étape de blanchiment du contenu spectral ;
- un module de transposition du contenu spectral (160) pour exécuter ladite étape de transposition du contenu spectral ;
- un filtre de mise en forme (170) pour exécuter ladite étape de mise en forme ; - un module de correction (120) pour exécuter ladite étape de correction, la fonction de transfert dudit filtre blanchisseur étant obtenue à partir d'une information issue dudit module de correction. 10) Dispositif de décodage d'un signal audio codé par codage à limitation de spectre d'un signal source, caractérisé en ce qu'il comporte un décodeur adapté à fournir un signal audio à bande limitée et un dispositif de reconstruction spectrale selon la revendication 8 ou 9.
1 1) Dispositif de décodage d'un signal audio codé par codage à limitation de spectre d'un signal source, caractérisé en ce qu'il comporte un décodeur adapté à fournir un signal audio à bande limitée et un dispositif de reconstruction spectrale selon la revendication 9 et que ledit décodeur est adapté à fournir au module de correction une information relative à la puissance des composantes à injecter.
12) Système de codage/décodage audio, caractérisé en ce qu'il comprend un codeur audio à limitation de spectre adapté à coder un signal source et un dispositif de décodage selon la revendication 10 à 1 1.
13) Système de codage/décodage audio selon la revendication 12, caractérisé en ce qu'il comprend en outre des moyens (105) adaptés à transmettre une information d'enveloppe spectrale dans la bande non transmise par le codeur.
PCT/FR2002/000618 2001-02-23 2002-02-18 Reconstruction spectrale et codage d'un signal a spectre incomplet WO2002069328A1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0102680A FR2821501B1 (fr) 2001-02-23 2001-02-23 Procede et dispositif de reconstruction spectrale d'un signal a spectre incomplet et systeme de codage/decodage associe
FR01/02680 2001-02-23

Publications (1)

Publication Number Publication Date
WO2002069328A1 true WO2002069328A1 (fr) 2002-09-06

Family

ID=8860515

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2002/000618 WO2002069328A1 (fr) 2001-02-23 2002-02-18 Reconstruction spectrale et codage d'un signal a spectre incomplet

Country Status (2)

Country Link
FR (1) FR2821501B1 (fr)
WO (1) WO2002069328A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8818541B2 (en) 2009-01-16 2014-08-26 Dolby International Ab Cross product enhanced harmonic transposition

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1642265B1 (fr) * 2003-06-30 2010-10-27 Koninklijke Philips Electronics N.V. Ajout de bruit pour ameliorer la qualite de donnees audio decodees
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998057436A2 (fr) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Amelioration de codage de la source par reproduction de la bande spectrale
WO2000045379A2 (fr) * 1999-01-27 2000-08-03 Coding Technologies Sweden Ab Amelioration de la performance perceptive dans des methodes de codage sbr et des methodes hfr connexes par addition adaptative de bruits de fond et par limitation de la substitution des parasites

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998057436A2 (fr) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Amelioration de codage de la source par reproduction de la bande spectrale
WO2000045379A2 (fr) * 1999-01-27 2000-08-03 Coding Technologies Sweden Ab Amelioration de la performance perceptive dans des methodes de codage sbr et des methodes hfr connexes par addition adaptative de bruits de fond et par limitation de la substitution des parasites

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8818541B2 (en) 2009-01-16 2014-08-26 Dolby International Ab Cross product enhanced harmonic transposition
US9799346B2 (en) 2009-01-16 2017-10-24 Dolby International Ab Cross product enhanced harmonic transposition
US10192565B2 (en) 2009-01-16 2019-01-29 Dolby International Ab Cross product enhanced harmonic transposition
US10586550B2 (en) 2009-01-16 2020-03-10 Dolby International Ab Cross product enhanced harmonic transposition
US11031025B2 (en) 2009-01-16 2021-06-08 Dolby International Ab Cross product enhanced harmonic transposition
US11682410B2 (en) 2009-01-16 2023-06-20 Dolby International Ab Cross product enhanced harmonic transposition
US11935551B2 (en) 2009-01-16 2024-03-19 Dolby International Ab Cross product enhanced harmonic transposition

Also Published As

Publication number Publication date
FR2821501B1 (fr) 2004-07-16
FR2821501A1 (fr) 2002-08-30

Similar Documents

Publication Publication Date Title
EP1905010B1 (fr) Codage/décodage audio hiérarchique
EP1316087B1 (fr) Dissimulation d'erreurs de transmission dans un signal audio
FR2929466A1 (fr) Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2104936B1 (fr) Codage par transformee, utilisant des fenetres de ponderation et a faible retard
EP2867893B1 (fr) Atténuation efficace de pré-échos dans un signal audionumérique
EP0782128A1 (fr) Procédé d'analyse par prédiction linéaire d'un signal audiofréquence, et procédés de codage et de décodage d'un signal audiofréquence en comportant application
FR2596936A1 (fr) Systeme de transmission d'un signal vocal
FR2907586A1 (fr) Synthese de blocs perdus d'un signal audionumerique,avec correction de periode de pitch.
EP1275109B1 (fr) Methode et dispositif d'enrichissement spectral
FR3024582A1 (fr) Gestion de la perte de trame dans un contexte de transition fd/lpd
EP2347411B1 (fr) Attenuation de pre-echos dans un signal audionumerique
WO2002069328A1 (fr) Reconstruction spectrale et codage d'un signal a spectre incomplet
EP2652735B1 (fr) Codage perfectionne d'un etage d'amelioration dans un codeur hierarchique
EP2171713B1 (fr) Codage de signaux audionumériques
EP0989544A1 (fr) Dispositif et procédé de filtrage d'un signal de parole, récepteur et système de communications téléphonique
EP1362344A1 (fr) Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies
WO2002069327A1 (fr) Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant
EP1192619B1 (fr) Codage et decodage audio par interpolation
US6606591B1 (en) Speech coding employing hybrid linear prediction coding
EP1192618B1 (fr) Codage audio avec liftrage adaptif
WO2014009657A1 (fr) Traitement d'amelioration de la qualite des signaux audiofrequences
EP1192621B1 (fr) Codage audio avec composants harmoniques
CA2079884A1 (fr) Procede et dispositif de codage bas debit de la parole
FR2697937A1 (fr) Procédé de discrimination de la parole en présence de bruits ambiants et vocodeur à faible débit pour la mise en Óoeuvre du procédé.
EP1194923A1 (fr) Procedes et dispositifs d'analyse et de synthese audio

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP