FR2821475A1 - Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques - Google Patents

Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques Download PDF

Info

Publication number
FR2821475A1
FR2821475A1 FR0102681A FR0102681A FR2821475A1 FR 2821475 A1 FR2821475 A1 FR 2821475A1 FR 0102681 A FR0102681 A FR 0102681A FR 0102681 A FR0102681 A FR 0102681A FR 2821475 A1 FR2821475 A1 FR 2821475A1
Authority
FR
France
Prior art keywords
spectral
band
channel
signal
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR0102681A
Other languages
English (en)
Other versions
FR2821475B1 (fr
Inventor
Pierrick Philippe
Patrice Collen
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Priority to FR0102681A priority Critical patent/FR2821475B1/fr
Priority to PCT/FR2002/000619 priority patent/WO2002069326A1/fr
Priority to EP02706874A priority patent/EP1362344A1/fr
Publication of FR2821475A1 publication Critical patent/FR2821475A1/fr
Application granted granted Critical
Publication of FR2821475B1 publication Critical patent/FR2821475B1/fr
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

L'invention a trait à un procédé de reconstruction d'au moins une voie d'un signal audio à plusieurs voies, en particulier d'un signal stéréo, à partir d'un signal composite pouvant comporter des composantes monophoniques et des composantes spatiales, le procédé comprenant, pour au moins une composante :- une étape de blanchiment spectral de ladite composante pour obtenir un signal blanchi;- une étape de mise en forme du spectre du signal blanchi au moyen d'un filtre d'enveloppe ayant pour caractéristique au moins une partie de l'enveloppe spectrale de la voie à reconstruire.L'invention concerne également un dispositif de reconstruction d'un signal à plusieurs voies adapté à mettre en oeuvre les étapes de ce procédé, un dispositif de décodage le comprenant, un dispositif de codage associé, un système de codage/ décodage les incluant et un signal codé.

Description

<Desc/Clms Page number 1>
La présente invention concerne un procédé et un dispositif de reconstruction spectrale d'un signal audio à plusieurs voies, notamment d'un signal stéréophonique.
L'invention concerne également un dispositif de décodage comprenant ce dispositif de reconstruction, un dispositif de codage associé et un système de codage/décodage les incluant.
Dans l'état de la technique de la transmission de signaux audio, il est connu de coder le signal à l'émission et de le décoder à la réception. Ce codage peut être un codage à réduction de débit. Par débit, on entend la quantité d'information transmise par unité de temps, généralement exprimée en kbits/s. Dans ce qui suit, on désignera l'importance de la transmission d'une information en terme de débit par l'expression coût en transmission , exprimée en kbits/s. Des codeurs à réduction de débit connus sont par exemple les codeurs de type par transformée, les codeurs de type CELP et même des codeurs de type paramétrique, comme un codeur de type MPEG4 paramétrique.
En codage audio à réduction de débit, le signal audio doit souvent subir une limitation de bande passante lorsque le débit binaire devient faible. Cette limitation de bande passante est nécessaire pour éviter l'introduction de bruit de quantification audible dans le signal codé. Il est alors souhaitable de régénérer dans la mesure du possible le contenu haute fréquence du signal original.
Il est connu de l'état de la technique, et notamment du document WO-A- 9857436, le fait de régénérer le contenu spectral haute fréquence du signal original en procédant à une transposition harmonique du spectre basse fréquence du signal décodé vers les hautes fréquences. Cette transposition est effectuée en recopiant la valeur spectrale d'un fondamental à fk à toutes les fréquences de la série harmonique n*fk. La forme du spectre haute fréquence ainsi obtenue est ajustée en appliquant des facteurs de pondération spectrale.
Cette technique est fondée sur une analyse en sous-bandes et une duplication harmonique complexe. Elle met en oeuvre des méthodes d'ajustement de phase et d'amplitude coûteuses en calcul. En outre, les facteurs de pondération spectrale ne modélisent que grossièrement l'enveloppe spectrale.
Lorsque des signaux audio stéréophoniques sont transmis avec des procédés de codage audio à réduction de débit de l'état de la technique, le contenu stéréophonique est généralement fortement altéré. En effet, si le débit de transmission est insuffisant, on tend à ne transmettre que des signaux à faible contenu stéréophonique.
<Desc/Clms Page number 2>
Figure img00020001
Il est connu du domaine du traitement de signaux stéréophoniques une technique appelée M/S stéréo (mid-side stéréo) selon laquelle sont transmis des signaux correspondant à la moitié respectivement de la somme et de la différence des voies gauche et droite. Au décodage, les voies gauche et droite sont reconstituées à partir de ces signaux. Lorsque les voies gauche et droite sont fortement corrélées, le terme de différence sera faible et pourra donc être transmis à faible coût. Cependant, à très faible débit, le terme de différence est quantifié à zéro. Au décodage, on obtient alors un signal monophonique.
Une autre technique connue dans le domaine du traitement de signaux stéréophoniques est la stéréo d'intensité dans laquelle, au dessus d'une certaine fréquence, on transmet un signal audio monophonique, correspondant généralement à une pondération des voies gauche et droite, avec des facteurs de gain qui décrivent les rapports d'énergie originaux entre les deux voies. Au décodage, l'application sélective par bandes de fréquences de gains différents pour chaque voie audio permet de recréer une impression de signal stéréophonique. Cependant, là encore, à bas débit, la partie stéréo en basse fréquence risque d'être de mauvaise qualité. Si la limite fréquentielle au delà de laquelle on applique la technique de stéréo d'intensité est abaissée, le contenu stéréophonique est dégradé car l'utilisation de facteurs de gains ne permet qu'une reconstitution grossière du contenu stéréo. Le coût en transmission des facteurs de gain devient important si l'on souhaite une reconstitution plus fine du contenu stéréo. En outre, l'application de gains différents par sous-bandes tend à créer des discontinuités.
Le problème à la base de l'invention est de fournir un procédé et un dispositif de reconstruction d'un signal stéréo, et de manière plus générale d'un signal audio à plusieurs voies, permettant une reconstitution du contenu stéréophonique, en particulier pour les hautes fréquences, et ne nécessitant qu'une faible quantité de données à transmettre.
Ce problème est résolu par un procédé de reconstruction d'au moins une voie d'un signal audio à plusieurs voies, en particulier d'un signal stéréo, à partir d'un signal composite pouvant comporter des composantes monophoniques (M) et des composantes spatiales (Vh caractérisé en ce que, pour au moins une composante, il comprend : - une étape de blanchiment spectral de ladite composante pour obtenir un signal blanchi ;
<Desc/Clms Page number 3>
- une étape de mise en forme du spectre du signal blanchi au moyen d'un filtre d'enveloppe ayant pour caractéristique au moins une partie de l'enveloppe spectrale (e (V,)) de la voie à reconstruire.
Selon un premier mode de réalisation, le signal composite comprend au moins une composante monophonique (M) dans une première bande spectrale (bei), l'étape de blanchiment spectral fournit un signal monophonique blanchi et l'étape de mise en forme utilise un filtre d'enveloppe ayant pour caractéristique l'enveloppe spectrale de la voie à reconstruire dans ladite première bande.
Selon un second mode de réalisation, le signal composite comprend plusieurs composantes spatiales (Vh, chaque composante spatiale étant associée à une voie et au moins une composante spatiale ayant un spectre limité à une seconde bande spectrale, la reconstruction de la voie associée à la composante spatiale à spectre limité comprenant : - une étape de transposition de tout ou partie du contenu spectral de ladite composante spatiale dans une troisième bande spectrale distincte de ladite seconde bande spectrale pour fournir une composante à spectre transposé ; - une étape de blanchiment spectral avant ou après l'étape de transposition de sorte que la composante à spectre transposé est blanchie ;
Figure img00030001

- une étape de mise en forme du spectre de la composante à spectre transposé et blanchi au moyen d'un filtre d'enveloppe ayant pour caractéristique l'enveloppe spectrale de la voie à reconstruire dans ladite troisième bande. Avantageusement, la seconde bande spectrale (B2) est une bande basse fréquence et la troisième bande spectrale (B3) est adjacente à seconde.
Selon un troisième mode de réalisation, les composantes du signal composite sont issues du décodage d'un signal source à plusieurs voies codé par un codeur à limitation de spectre. Pour la reconstruction de la voie à reconstruire, la caractéristique du filtre d'enveloppe est obtenue à partir d'une information donnant l'enveloppe spectrale de la voie correspondante du signal source dans les première et troisième bandes.
L'invention est également définie par un dispositif de reconstruction d'au moins une voie d'un signal audio à plusieurs voies, en particulier d'un signal stéréo, à partir d'un signal composite pouvant comporter des composantes monophoniques et des composantes spatiales, le dispositif comprenant des moyens pour mettre en oeuvre les étapes du procédé défini ci-dessus.
<Desc/Clms Page number 4>
L'invention est également définie par un dispositif de codage d'un signal audio source à plusieurs voies, au moins une première bande spectrale dudit signal étant codée en monophonique, le dispositif fournissant en outre une information d'enveloppe spectrale pour au moins une voie dans ladite première bande.
L'invention est également définie par un dispositif de codage à limitation de spectre d'un signal audio source à plusieurs voies, le spectre d'au moins une voie étant limité à une seconde bande spectrale par le codage, le dispositif fournissant en outre une information d'enveloppe spectrale de ladite voie dans une bande distincte de ladite seconde bande.
L'invention est également définie par un dispositif de codage à limitation de spectre d'un signal audio source à plusieurs voies, au moins une première bande spectrale dudit signal étant codée en monophonique, le spectre d'au moins une voie étant limité par le codage à une seconde bande spectrale, distincte de la première, le dispositif fournissant en outre une information d'enveloppe spectrale de ladite voie dans la première bande et dans une troisième bande distincte desdites première et seconde bandes.
Avantageusement, pour au moins une première voie et une seconde voie, l'information d'enveloppe spectrale de la seconde voie est transmise sous forme de différence avec celle de la première voie.
L'invention est également définie par un signal issu d'un dispositif de codage à limitation de spectre tel que défini ci-dessus, le signal comportant au moins pour une première bande spectrale une composante monophonique codée ainsi qu'une information d'enveloppe spectrale codée relative à l'enveloppe spectrale d'une voie audio dans ladite première bande.
L'invention est également définie par un signal issu d'un dispositif de codage à limitation de spectre tel que défini ci-dessus, le signal comportant au moins pour une seconde bande spectrale une composante spatiale codée relative à une voie audio ainsi qu'une information d'enveloppe spectrale codée relative à l'enveloppe spectrale de ladite voie audio dans une bande distincte de ladite seconde bande.
L'invention est également définie par un signal issu d'un dispositif de codage à limitation de spectre tel que défini ci-dessus, le signal comportant au moins, pour une première bande spectrale, une composante monophonique et, pour une seconde bande spectrale distincte de la première, une composante spatiale codée relative à une voie audio, ainsi qu'une information d'enveloppe spectrale de ladite voie dans la première
<Desc/Clms Page number 5>
bande et dans une troisième bande spectrale distincte desdites première et seconde bandes.
L'invention est également définie par un dispositif de décodage d'un signal audio à plusieurs voies codé, le dispositif comprenant un décodeur adapté à fournir à partir du signal codé un signal composite pouvant comporter des composantes monophoniques et des composantes spatiales, et un dispositif de reconstruction tel que défini plus haut.
L'invention est également définie par un dispositif de décodage comprenant un premier décodeur adapté à fournir, à partir dudit signal défini plus haut, un signal composite pouvant comporter des composantes monophoniques et des composantes spatiales ainsi qu'un second décodeur adapté à fournir, à partir dudit signal, une information d'enveloppe spectrale.
Enfin, l'invention est encore définie par un système de codage/décodage d'un signal audio à plusieurs voies, comprenant un dispositif de codage et un dispositif de décodage comme définis plus haut.
De manière générale, grâce au procédé et au dispositif de reconstruction selon l'invention, le contenu stéréophonique, notamment le contenu stéréophonique haute fréquence peut être reconstitué lors du décodage sans ou avec une transmission minimale des informations liées au contenu haute fréquence des signaux originaux. La forme spectrale de signaux stéréophoniques haute fréquence peut être modélisée par le biais de deux filtres, un filtre pour chaque voie. Des informations d'enveloppe peuvent être transmises à faible coût, car l'on peut facilement mesurer les différences entre deux enveloppes et tirer ainsi parti des redondances éventuelles entre les formes spectrales modélisées. Une seule voie peut être transmise, l'autre voie pouvant être reconstruite par blanchiment du signal transmis et application d'un filtre d'enveloppe.
Les informations d'enveloppe relatives à la voie non transmise ont un coût de transmission très faible.
Les caractéristiques de l'invention mentionnées ci-dessus, ainsi que d'autres, apparaîtront plus clairement à la lecture de la description suivante d'un exemple de réalisation, ladite description étant faite en relation avec les dessins joints, parmi lesquels : la Fig. 1 représente schématiquement un dispositif de reconstruction d'un signal audio stéréophonique selon un premier mode de réalisation de l'invention ;
<Desc/Clms Page number 6>
les Figs. 2a à 2c illustrent le traitement effectué par le dispositif de reconstruction de la Fig. 1 ; la Fig. 3 représente schématiquement un dispositif de reconstruction d'un signal audio stéréophonique selon un second mode de réalisation de l'invention ; les Figs. 4a à 4d illustrent le traitement effectué par le dispositif de reconstruction de la Fig. 3 ; la Fig. 5 représente schématiquement un dispositif de reconstruction d'un signal audio stéréophonique selon un troisième mode de réalisation de l'invention ; les Figs. 6a à 6d illustrent le traitement effectué par le dispositif de reconstruction de la Fig. 5.
Le dispositif de reconstruction spectrale selon l'invention peut s'appliquer à la reconstruction spectrale d'un signal audio stéréophonique issu du décodage d'un signal codé par un codeur à limitation de bande spectrale. Il peut s'agir de tout type de codeur à réduction de débit. Le codeur peut être de type par transformée (MPEG1, MPEG2 ou MPEG4-GA), de type CELP (ITU G72X), ou même de type paramétrique (MPEG4 paramétrique). L'invention peut également s'appliquer à des signaux qui n'ont pas préalablement fait l'objet d'un codage, par exemple, des signaux ayant simplement subi un sous-échantillonnage et une altération de leur contenu stéréophonique.
La Fig. 1 décrit un premier mode de réalisation de l'invention. Le signal est codé par un codeur 100 et, après transmission du signal codé par un moyen quelconque, le signal codé est décodé par un décodeur 110.
Après décodage dans le décodeur 110, une reconstruction du contenu stéréophonique d'un signal audio et plus généralement des différentes voies d'un signal audio multi-voie est effectuée par les modules 150,155, 150,, 1151, 175 et les sommateurs 180,. Pour des raisons de simplification, seule une voie i a été représentée (par exemple la voie droite d'un signal stéréo).
Le signal décodé par le module 110 comporte une composante monophonique
Figure img00060001

L (M) et une composante spatiale Vi, associée à la voie i à reconstruire, comme illustré en Fig. 2a. La composante monophonique peut être une composante commune à plusieurs voies, par exemple une somme de plusieurs voies ou encore le signal d'une voie prépondérante parmi une ensemble de voies. Typiquement, la composante VIL sera un signal basse fréquence à bande limitée (B2) et le signal monophonique (M) occupera une bande (B 1) adjacente à la première.
<Desc/Clms Page number 7>
Le spectre de la partie monophonique (M) est blanchi à l'aide d'un filtre blanchisseur 150. On sait que sous certaines hypothèses de stationnarité, un signal peut être modélisé comme le résultat du filtrage d'un signal d'excitation par un filtre d'enveloppe spectrale. Si l'on dispose d'une description de l'enveloppe spectrale du signal, il est possible de blanchir son spectre en le faisant passer dans un filtre
Figure img00070001

blanchisseur de fonction de transfert (approximativement) inverse à la fonction d'enveloppe. On obtient ainsi une approximation du signal d'excitation initial, débarrassée de l'influence de la forme spectrale dans la bande considérée.
Le module 155 est un module d'estimation d'enveloppe spectrale pour le signal monophonique dans la bande BI. Il peut par exemple modéliser les enveloppes par une analyse LPC, telle que décrite dans l'article de J. Makhoul, intitulé Linear Prediction : a tutorial review , Proceedings of the IEEE, Vol. 63, N'4, pp 561-580.
La composante spatiale ViL et la composante monophonique blanchie sont représentés en Fig. 2b. La composante monophonique blanchie est soumise à une étape d'enveloppe spectrale dans le filtre d'enveloppe 170,. Ce filtre d'enveloppe a pour caractéristique l'enveloppe spectrale de la voie i originale dans la bande BI.
Selon une première variante de réalisation, des moyens d'estimation spectrale 105 associés au codeur effectue une estimation spectrale des différentes voies dans la bande BI et fournissent des informations décrivant les enveloppes des différentes voies dans cette bande. Avantageusement, les enveloppes sont codées de manière différentielle. Autrement dit, l'enveloppe d'une première voie est codée et celles des autres voies sont codées par différence, de manière à tirer profit de la similarité des enveloppes pour réduire la redondance dans l'information à transmettre. Du côté du décodeur, les informations relatives aux différentes enveloppes sont décodées dans le module 175. Les informations décodées e (V,) sont par exemple des coefficients LPC.
Elles sont fournies au filtre d'enveloppe 170i.
Selon une seconde variante de réalisation, l'enveloppe spectrale de la voie i est obtenue comme l'extrapolée, dans la bande Bi, de l'enveloppe spectrale de la composante spatiale VL, dans la bande B2. Cette variante est symbolisée en traits discontinus par le module d'extrapolation 115, recevant la composante ViL et fournissant l'enveloppe extrapolée au filtre d'enveloppe 170,.
La composante spatiale ViL est ensuite ajoutée au moyen du sommateur 180. à la composante monophonique mise en forme pour fournir une voie reconstruite V,. Le spectre de la voie reconstruite est illustré en Fig. 2c.
<Desc/Clms Page number 8>
Figure img00080001
Un cas particulier important est celui où la largeur de bande 82 est nulle, c'est-àdire celui où seule une composante monophonique est transmise. Cette composante monophonique peut correspondre à une voie ou à une somme de voies, comme vu plus haut. Les différentes voies sont reconstruites grâce à la mise en forme du signal monophonique blanchi par leurs enveloppes spectrales respectives. Ainsi, pour un signal stéréo, on peut reconstruire la voie gauche à partir de la voie droite, ou bien les voies droite et gauche à partir de la voie somme. On recrée ainsi un effet stéréo à partir d'un signal transmis en mono.
La Fig. 3 décrit un second mode de réalisation de l'invention. Les modules portant les mêmes références que sur la Fig. 1 ont une fonction identique à celle déjà décrite. Pour des raisons de simplification, seule la reconstruction d'une voie i a été représentée.
Dans ce mode de réalisation, le décodeur 110 fournit des composantes spatiales à spectres limités. Ce sera typiquement le cas si le codeur 100 est un codeur à limitation de spectre. Nous considérerons une composante spatiale VIL de spectre limité à la bande B2, comme représenté en Fig. 4a.
Le module 160j est un module de transposition spectrale. Sa fonction est de recopier le contenu spectral d'une partie au moins de la bande B2, dite bande source, dans un seconde bande B3, dite bande cible. L'opération de transposition est par exemple une simple translation de spectre dans la bande cible ou bien la combinaison d'un retournement et d'une translation. Typiquement, la bande B2 est une bande basse fréquence et la bande cible est adjacente à cette dernière. L'opération de transposition spectrale a été illustrée en Fig. 4b.
Le signal obtenu en sortie de 160i est un signal à spectre limité à la bande B3. Il est soumis à un blanchiment spectral dans le filtre blanchisseur 150,. Selon une première variante, la caractéristique du filtre blanchisseur est l'inverse de l'enveloppe
Figure img00080002

spectrale de la composante spatiale transposée dans la bande 83. Le module 1 15j estime les coefficients du filtre blanchisseur et les fournit à ce dernier. Alternativement, les coefficients du filtre 150j sont obtenus à partir de l'enveloppe spectrale de la voie i dans la bande source. Il faut noter que l'ordre des modules de blanchiment spectral (150i) et de transposition spectrale (160,) peut être interverti.
L'ordre choisi dépend notamment de la précision de blanchiment souhaitée. Le résultat du blanchiment spectral est illustré en Fig. 4c.
<Desc/Clms Page number 9>
La composante spatiale à spectre transposé et blanchi est soumise à une étape de mise en forme spectrale dans le filtre d'enveloppe 170,. Ce filtre d'enveloppe a pour caractéristique l'enveloppe spectrale de la voie i originale dans la bande B3.
Les informations relatives aux différentes enveloppes sont décodées dans le module 175. Les informations décodées e (Vi) sont par exemple des coefficients LPC.
Elles sont fournies au filtre d'enveloppe 170,.
Selon une seconde variante de réalisation, l'enveloppe spectrale de la voie i est obtenue comme l'extrapolée, dans la bande B3, de l'enveloppe spectrale de la composante spatiale Vi L, dans la bande B2. Cette variante est symbolisée par la liaison en traits discontinus entre le module 115j et le filtre d'enveloppe 170,.
La composante spatiale Vi L est ensuite ajoutée au moyen du sommateur 181, au signal issu du filtre 170, pour fournir une voie reconstruite Vi. Le spectre de la voie reconstruite est illustré en Fig. 4d.
La Fig. 5 décrit un troisième mode de réalisation de l'invention. Les modules portant les mêmes références que celles de la Fig. 1 ou de la Fig. 3 ont une fonction identique à celle déjà décrite. Pour des raisons de simplification, seule la reconstruction d'une voie i a été représentée.
Dans ce mode de réalisation, le décodeur 110 fournit une composante monophonique M ainsi que des composantes spatiales à spectres limités ViL. La composante monophonique peut être commune à plusieurs ou à toutes les voies. On a illustré en Fig. 6a une composante spatiale à spectre limité V, L ainsi que la composante monophonique M. La composante spatiale (par exemple relative à une voie d'un signal stéréo) du signal occupe une bande basse fréquence. Dans les plus hautes fréquences (bande spectrale BI) le signal est codé en monophonique.
En sortie du décodeur 110, la composante monophonique M, d'une part, et la composante spatiale ViL, d'autre part, subissent des traitements distincts. La composante monophonique est blanchie au moyen du filtre blanchisseur 150 comme dans la Fig. 1. La composante spatiale, quant à elle, fait l'objet d'une transposition de tout ou partie de son contenu spectral dans une bande cible B3, typiquement contiguë à la bande monophonique BI, comme représenté en Fig. 6b. Selon une première variante, la bande source du contenu spectral est incluse dans la bande B2. Selon une seconde variante, non représentée, la bande source est incluse dans la bande B2+Bl, autrement dit au moins une partie du contenu spectral de la bande monophonique peut
Figure img00090001

être également transposée. Le signal en sortie de 160, possède un spectre limité à la
<Desc/Clms Page number 10>
Figure img00100001

bande 83. Il est blanchi dans le filtre blanchisseur 150, dont la fonction de transfert est déterminée à partir du module d'estimation spectrale 115, ou, alternativement, par une information d'enveloppe spectrale de la voie i originale dans la bande source donnée par le module de décodage 175. La fonction de transfert du filtre 150, est donnée par l'inverse de l'enveloppe spectrale dans la bande source. Là aussi l'ordre du module de transposition 160i et du module de blanchiment 150, peut être inversé. La Fig. 6c illustre le résultat des opérations de blanchiment dans les bandes BI et B2. Les composantes monophonique et spatiale blanchies sont combinées dans le sommateur 180i et la somme est filtrée par le filtre d'enveloppe 170j. Selon une première variante, la fonction de transfert de ce filtre est donnée par une information d'enveloppe spectrale de la voie i originale, dans la bande B) +B3, fournie par le module de décodage d'enveloppe 175. Comme indiqué plus haut, les enveloppes des différentes voies peuvent être codées en 105 sous forme de différences.
Selon une seconde variante, la fonction de transfert du filtre d'enveloppe 170i L est l'extrapolée, dans la bande BI+B3, de l'enveloppe spectrale de la composante Viel.
Dans ce cas, et si la fonction du filtre blanchisseur 150i est donnée par le module d'estimation 115,, on voit que les modules 105 et 175 ne sont pas nécessaires.
La composante spatiale V, est combinée au signal issu de 170i au moyen du sommateur 18 1 i pour fournir une voie reconstruite Vi dont le spectre est représenté en Fig. 6d.
On notera que, dans les trois modes de réalisation décrits ci-dessus, les filtres d'enveloppe peuvent être appliqués dans le domaine temporel ou dans le domaine fréquentiel.
Bien que le dispositif selon l'invention ait été représenté sous la forme de modules fonctionnels, il va de soi que tout ou partie de ce dispositif peut être réalisé au moyen d'un processeur unique ou une pluralité de processeurs dédiés ou non.

Claims (22)

  1. Figure img00110001
    REVENDICATIONS 1) Procédé de reconstruction d'au moins une voie d'un signal audio à plusieurs voies, en particulier d'un signal stéréo, à partir d'un signal composite pouvant comporter des composantes monophoniques (M) et des composantes spatiales (VIL) caractérisé en ce que, pour au moins une composante, il comprend : - une étape de blanchiment spectral (150, 150i) de ladite composante pour obtenir un signal blanchi ; - une étape de mise en forme (170, 170 ;) du spectre du signal blanchi au moyen d'un filtre d'enveloppe ayant pour caractéristique au moins une partie de l'enveloppe spectrale (e (VÙ) de la voie à reconstruire.
  2. 2) Procédé de reconstruction selon la revendication 1, caractérisé en ce que le signal composite comprend au moins une composante monophonique (M) dans une première bande spectrale (BI), l'étape de blanchiment spectral (150) fournissant un signal monophonique blanchi et l'étape de mise en forme (170i) utilisant un filtre d'enveloppe ayant pour caractéristique l'enveloppe spectrale de la voie à reconstruire dans ladite première bande.
  3. 3) Procédé de reconstruction selon la revendication 1, caractérisé en ce que le signal composite comprend plusieurs composantes spatiales (Vh, chaque composante spatiale étant associée à une voie et au moins une composante spatiale ayant un spectre limité à une seconde bande spectrale, la reconstruction de la voie associée à la composante spatiale à spectre limité comprenant : - une étape de transposition (160i) de tout ou partie du contenu spectral de ladite composante spatiale dans une troisième bande spectrale distincte de ladite seconde bande spectrale pour fournir une composante à spectre transposé ; - une étape de blanchiment spectral (150i) avant ou après l'étape de transposition de sorte que la composante à spectre transposé est blanchie ; - une étape de mise en forme du spectre (170,) de la composante à spectre transposé et blanchi au moyen d'un filtre d'enveloppe ayant pour caractéristique l'enveloppe spectrale de la voie à reconstruire dans ladite troisième bande.
    <Desc/Clms Page number 12>
  4. 4) Procédé de reconstruction selon la revendication 3, caractérisé en ce que la seconde bande spectrale (B2) est une bande basse fréquence et la troisième bande spectrale (B3) est adjacente à seconde.
  5. 5) Procédé de reconstruction selon la revendication 1, caractérisé en ce que le signal composite comprend au moins une composante monophonique (M) à spectre
    Figure img00120001
    limité à une première bande spectrale (BI) et une pluralité de composantes spatiales (Vh à spectres limités, chaque composante étant associée à une voie (i), la reconstruction d'une voie associée à une composante spatiale à spectre limité à une seconde bande spectrale comprenant : - une étape de transposition (160,) de tout ou partie du contenu spectral de ladite composante spatiale ou de la composante monophonique dans une troisième bande spectrale distincte desdites première et seconde bandes spectrales pour fournir une composante spatiale à spectre transposé ; - une étape de blanchiment spectral de la composante monophonique blanchie (150) et de ladite composante spatiale (150,) avant ou après l'étape de transposition, de sorte que la composante monophonique, d'une part, et la composante spatiale à spectre transposé, d'autre part, sont blanchies ; - une étape de mise en forme du spectre (170,) de la composante monophonique blanchie et du spectre de la composante spatiale à spectre transposé et blanchi par un filtre d'enveloppe ayant pour caractéristique l'enveloppe spectrale de la voie à reconstruire dans lesdites première et troisième bandes.
  6. 6) Procédé de reconstruction selon la revendication 5, caractérisé en ce que la seconde bande spectrale (B2) est une bande basse fréquence, la première bande (BI) est adjacente à la seconde et la troisième bande (B3) est adjacente à la première.
  7. 7) Procédé de reconstruction selon la revendication 6, caractérisé en ce que l'étape de blanchiment spectral est effectuée sur la composante monophonique et sur ladite composante spatiale à spectre limité au moyen d'un premier filtre blanchisseur ayant pour caractéristique l'inverse de l'enveloppe spectrale du signal monophonique dans la première bande et un second filtre blanchisseur ayant pour caractéristique l'inverse de l'enveloppe spectrale de ladite composante spatiale dans la seconde bande.
    <Desc/Clms Page number 13>
  8. 8) Procédé de reconstruction selon l'une des revendications 3 à 7, les composantes spatiales du signal composite étant issues du décodage d'un signal source à plusieurs voies codé par un codeur à limitation de spectre, caractérisé en ce que l'étape de blanchiment spectral de ladite composante spatiale est effectuée au moyen d'un filtre blanchisseur dont la caractéristique est obtenue au moyen d'une information donnant l'enveloppe spectrale de la voie correspondante du signal source.
  9. 9) Procédé de reconstruction selon l'une des revendications 3 à 7, caractérisé en ce que pour la reconstruction de ladite voie, la caractéristique du filtre d'enveloppe est extrapolée à partir de l'enveloppe spectrale de ladite composante spatiale dans la seconde bande.
  10. 10) Procédé de reconstruction selon la revendication 3 ou 4, les composantes spatiales du signal composite étant issues du décodage d'un signal source à plusieurs voies codé par un codeur à limitation de spectre, caractérisé en ce que pour la reconstruction de ladite voie, la caractéristique du filtre d'enveloppe est obtenue à partir d'une information donnant l'enveloppe spectrale de la voie correspondante du signal source dans la troisième bande.
  11. 11) Procédé de reconstruction selon l'une des revendications 5 à 9, les composantes du signal composite étant issues du décodage d'un signal source à plusieurs voies codé par un codeur à limitation de spectre, caractérisé en ce que pour la reconstruction de ladite voie, la caractéristique du filtre d'enveloppe est obtenue à partir d'une information donnant l'enveloppe spectrale de la voie correspondante du signal source dans les première et troisième bandes.
  12. 12) Dispositif de reconstruction d'au moins une voie d'un signal audio à plusieurs voies, en particulier d'un signal stéréo, à partir d'un signal composite pouvant comporter des composantes monophoniques et des composantes spatiales, caractérisé en ce qu'il comprend des moyens pour mettre en oeuvre les étapes du procédé selon l'une des revendications précédentes.
    <Desc/Clms Page number 14>
  13. 13) Dispositif de codage d'un signal audio source à plusieurs voies, au moins une première bande spectrale dudit signal étant codée en monophonique, caractérisé en ce qu'il fournit en outre une information d'enveloppe spectrale pour au moins une voie dans ladite première bande.
  14. 14) Dispositif de codage à limitation de spectre d'un signal audio source à plusieurs voies, le spectre d'au moins une voie étant limité à une seconde bande spectrale par le codage, caractérisé en ce qu'il fournit en outre une information d'enveloppe spectrale de ladite voie dans une bande distincte de ladite seconde bande.
  15. 15) Dispositif de codage à limitation de spectre d'un signal audio source à plusieurs voies, au moins une première bande spectrale dudit signal étant codée en monophonique, le spectre d'au moins une voie étant limité par le codage à une seconde bande spectrale, distincte de la première, caractérisé en ce qu'il fournit en outre une information d'enveloppe spectrale de ladite voie dans la première bande et dans une troisième bande distincte desdites première et seconde bandes.
  16. 16) Dispositif de codage selon l'une des revendications 13 à 15, caractérisé en ce que, pour au moins une première voie et une seconde voie, l'information d'enveloppe spectrale de la seconde voie est transmise sous forme de différence avec celle de la première voie.
  17. 17) Signal issu d'un dispositif de codage à limitation de spectre selon la revendication 13 ou 16 en dépendance de 13, caractérisé en ce qu'il comporte au moins pour une première bande spectrale une composante monophonique codée ainsi qu'une information d'enveloppe spectrale codée relative à l'enveloppe spectrale d'une voie audio dans ladite première bande.
  18. 18) Signal issu d'un dispositif de codage à limitation de spectre selon la revendication 14 ou 16 en dépendance de 14, caractérisé en ce qu'il comporte au moins pour une seconde bande spectrale une composante spatiale codée relative à une voie audio ainsi qu'une information d'enveloppe spectrale codée relative à l'enveloppe spectrale de ladite voie audio dans une bande distincte de ladite seconde bande.
    <Desc/Clms Page number 15>
  19. 19) Signal issu d'un dispositif de codage à limitation de spectre selon la revendication 15 ou 16 en dépendance de 15, caractérisé en ce qu'il comporte au moins, pour une première bande spectrale, une composante monophonique et, pour une seconde bande spectrale distincte de la première, une composante spatiale codée relative à une voie audio, ainsi qu'une information d'enveloppe spectrale de ladite voie dans la première bande et dans une troisième bande spectrale distincte desdites première et seconde bandes.
  20. 20) Dispositif de décodage d'un signal audio à plusieurs voies codé, caractérisé en ce qu'il comprend un décodeur adapté à fournir à partir du signal codé un signal composite pouvant comporter des composantes monophoniques et des composantes spatiales et un dispositif de reconstruction selon la revendication 12.
  21. 21) Dispositif de décodage d'un signal selon l'une des revendications 17 à 19, caractérisé en ce qu'il comprend un premier décodeur (110) adapté à fournir, à partir dudit signal, un signal composite pouvant comporter des composantes monophoniques et des composantes spatiales ainsi qu'un second décodeur (175) adapté à fournir, à partir dudit signal, une information d'enveloppe spectrale.
  22. 22) Système de codage/décodage d'un signal audio à plusieurs voies, caractérisé en ce qu'il comprend un dispositif de codage selon l'une des revendications 13 à 16 et un dispositif de décodage selon la revendication 20 ou 21.
FR0102681A 2001-02-23 2001-02-23 Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques Expired - Fee Related FR2821475B1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
FR0102681A FR2821475B1 (fr) 2001-02-23 2001-02-23 Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
PCT/FR2002/000619 WO2002069326A1 (fr) 2001-02-23 2002-02-18 Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies
EP02706874A EP1362344A1 (fr) 2001-02-23 2002-02-18 Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0102681A FR2821475B1 (fr) 2001-02-23 2001-02-23 Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques

Publications (2)

Publication Number Publication Date
FR2821475A1 true FR2821475A1 (fr) 2002-08-30
FR2821475B1 FR2821475B1 (fr) 2003-05-09

Family

ID=8860516

Family Applications (1)

Application Number Title Priority Date Filing Date
FR0102681A Expired - Fee Related FR2821475B1 (fr) 2001-02-23 2001-02-23 Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques

Country Status (3)

Country Link
EP (1) EP1362344A1 (fr)
FR (1) FR2821475B1 (fr)
WO (1) WO2002069326A1 (fr)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004086817A2 (fr) * 2003-03-24 2004-10-07 Koninklijke Philips Electronics N.V. Codage de signal principal et de signal lateral representant un signal multivoie
CN113286252A (zh) * 2021-07-23 2021-08-20 科大讯飞(苏州)科技有限公司 一种声场重建方法、装置、设备及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2857552B1 (fr) * 2003-07-11 2006-05-05 France Telecom Procede de decodage d'un signal permettant de reconstituer une scene sonore a transformation temps-frequence faible complexite, et dispositif correspondant
EP3598446B1 (fr) 2009-01-16 2021-12-22 Dolby International AB Transposition harmonique améliorée par produit croisé
CN115472171A (zh) * 2021-06-11 2022-12-13 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990016136A1 (fr) * 1989-06-15 1990-12-27 British Telecommunications Public Limited Company Codage polyphonique
EP0797324A2 (fr) * 1996-03-22 1997-09-24 Lucent Technologies Inc. Méthode améliorée de codage stéréo combiné utilisant une mise en forme d'enveloppe temporelle
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
WO1998057436A2 (fr) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Amelioration de codage de la source par reproduction de la bande spectrale

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990016136A1 (fr) * 1989-06-15 1990-12-27 British Telecommunications Public Limited Company Codage polyphonique
EP0797324A2 (fr) * 1996-03-22 1997-09-24 Lucent Technologies Inc. Méthode améliorée de codage stéréo combiné utilisant une mise en forme d'enveloppe temporelle
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
WO1998057436A2 (fr) * 1997-06-10 1998-12-17 Lars Gustaf Liljeryd Amelioration de codage de la source par reproduction de la bande spectrale

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004086817A2 (fr) * 2003-03-24 2004-10-07 Koninklijke Philips Electronics N.V. Codage de signal principal et de signal lateral representant un signal multivoie
WO2004086817A3 (fr) * 2003-03-24 2005-02-10 Koninkl Philips Electronics Nv Codage de signal principal et de signal lateral representant un signal multivoie
CN113286252A (zh) * 2021-07-23 2021-08-20 科大讯飞(苏州)科技有限公司 一种声场重建方法、装置、设备及存储介质
CN113286252B (zh) * 2021-07-23 2021-11-16 科大讯飞(苏州)科技有限公司 一种声场重建方法、装置、设备及存储介质

Also Published As

Publication number Publication date
FR2821475B1 (fr) 2003-05-09
EP1362344A1 (fr) 2003-11-19
WO2002069326A1 (fr) 2002-09-06

Similar Documents

Publication Publication Date Title
EP2104936B1 (fr) Codage par transformee, utilisant des fenetres de ponderation et a faible retard
EP1905010B1 (fr) Codage/décodage audio hiérarchique
EP2005420B1 (fr) Dispositif et procede de codage par analyse en composante principale d&#39;un signal audio multi-canal
EP1989706B1 (fr) Dispositif de ponderation perceptuelle en codage/decodage audio
EP2304721B1 (fr) Synthese spatiale de signaux audio multicanaux
EP2489039B1 (fr) Codage/décodage paramétrique bas débit optimisé
FR2898725A1 (fr) Dispositif et procede de codage gradue d&#39;un signal audio multi-canal selon une analyse en composante principale
FR2875351A1 (fr) Procede de traitement de donnees par passage entre domaines differents de sous-bandes
EP3391370A1 (fr) Traitement de réduction de canaux adaptatif pour le codage d&#39;un signal audio multicanal
EP1275109B1 (fr) Methode et dispositif d&#39;enrichissement spectral
CA2300647A1 (fr) Procedes de codage, de decodage et de transcodage audio
EP2345029B1 (fr) Procédé, programme informatique et entité de décodage d&#39;un signal audio numérique
FR2821475A1 (fr) Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
WO2023165946A1 (fr) Codage et décodage optimisé d&#39;un signal audio utilisant un auto-encodeur à base de réseau de neurones
EP0891617B1 (fr) Systeme de codage et systeme de decodage d&#39;un signal, notamment d&#39;un signal audionumerique
EP2126905B1 (fr) Procédés et dispositifs d&#39;encodage et décodage de signaux audio, signal audio encodé
FR2911227A1 (fr) Codage par transformee, utilisant des fenetres de ponderation et a faible retard
WO2011073600A1 (fr) Codage/decodage parametrique stereo avec optimisation du traitement de reduction des canaux
FR2821476A1 (fr) Procede de reconstruction spectrale de signal audio a spectre incomplet et dispositif correspondant
FR2821501A1 (fr) Procede et dispositif de reconstruction spectrale d&#39;un signal a spectre incomplet et systeme de codage/decodage associe
FR2857552A1 (fr) Procede de decodage d&#39;un signal permettant de reconstituer une scene sonore a transformation temps-frequence faible complexite, et dispositif correspondant
FR2773653A1 (fr) Dispositifs de codage/decodage de donnees, et supports d&#39;enregistrement memorisant un programme de codage/decodage de donnees au moyen d&#39;un filtre de ponderation frequentielle

Legal Events

Date Code Title Description
ST Notification of lapse

Effective date: 20081031