EP0341129A1 - Procédé et dispositif de codage de l'énergie du signal vocal dans des vocodeurs à très faibles débits - Google Patents

Procédé et dispositif de codage de l'énergie du signal vocal dans des vocodeurs à très faibles débits Download PDF

Info

Publication number
EP0341129A1
EP0341129A1 EP89401169A EP89401169A EP0341129A1 EP 0341129 A1 EP0341129 A1 EP 0341129A1 EP 89401169 A EP89401169 A EP 89401169A EP 89401169 A EP89401169 A EP 89401169A EP 0341129 A1 EP0341129 A1 EP 0341129A1
Authority
EP
European Patent Office
Prior art keywords
vector
windows
vectors
energy
base
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
EP89401169A
Other languages
German (de)
English (en)
Other versions
EP0341129B1 (fr
Inventor
Denis Rochette
Pierre André Laurent
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thales SA
Original Assignee
Thomson CSF SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson CSF SA filed Critical Thomson CSF SA
Publication of EP0341129A1 publication Critical patent/EP0341129A1/fr
Application granted granted Critical
Publication of EP0341129B1 publication Critical patent/EP0341129B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0018Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis

Definitions

  • the register 43 On each comparison the content of register 43 is updated by the result of the summation obtained at the output of the summing circuit 41 if this result is lower than the content existing in the register 43. In this way after each progression of the address counter 34, the register 43 keeps in memory the sum of the squares obtained from the summing circuit 41 which is the highest s small among all the sums already made since the beginning of the addressing of the estimated vectors in the memory 33. In parallel with each update of the content of the register 43 the content of the register 44 is replaced by the address of the corresponding vector which has been read from memory 33. The number of the VME vector coded on N bits is thus obtained directly in register 44.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Le procédé consiste à analyser les signaux vocaux dans des fenêtres consécutives, à quantifier sur un nombre déterminé m de niveaux le signal vocal dans chacune des fenêtres, et à mesurer dans chacune des fenêtres la valeur moyenne efficace des échantillons du signal vocal. Il consiste ensuite à construire, dans un espace vectoriel à n dimensions ayant pour première base les vecteurs unitaires (E₀ à E<sub>n-1</sub>) des énergies mesurées sur n fenêtres consécutives, un vecteur énergie E résultant correspondant à la somme de n vecteurs énergie mesurés respectivement dans n fenêtres d'analyse du signal vocal puis à opérer dans cet espace un changement de base ayant pour premier axe principal un axe orienté de vecteur unitaire ayant pour composantes les vecteurs unitaires de la première base pour projeter dans la nouvelle base obtenue le vecteur énergie résultant. Des codages sur q bits tels que 2<sup>q</sup> = m de la composante du vecteur résultant projeté sur l'axe principal de la nouvelle base et sur un nombre réduit de bits inférieurs à q, des composantes du vecteur énergie projeté sur les n-1 autres axes principaux de l'espace vectoriel défini dans la nouvelle base sont ensuite effectués. Une réalisation d'un dispositif correspondant à n = 3 est décrite.Applications : vocodeurs pour transmissions numériques à faibles débits.

Description

  • La présente invention concerne un procédé et un dispositif de codage de l'énergie du signal vocal dans des vocodeurs à très faibles débits.
  • Elle s'applique notamment à la réalisation de dispositifs vocodeurs à prédiction linéaire du type de ceux qui sont décrits dans les "Revues Techniques THOMSON-CSF" vol. 14 n°3 Septembre 1982 pages 715 à 731 et vol. 15 n°2 pages 495 à 516 éditées par MASSON, 120 boulevard Saint Germain 75280 Paris.
  • Dans ces dispositifs le signal vocal est découpé en tranches de temps ou fenêtres de longueurs fixes d'environ 20 millisecondes dans les vocodeurs d'émission,et chaque fenêtre de signal est analysée pour extraire les paramètres nécessaires à la commande des filtres numériques des vocodeurs de réception. Ces paramètres se composent, des coefficients de commande des filtres de réception, de la valeur moyenne efficace VME du signal vocal et d'une indication sur la nature voisée ou non du signal vocal.
  • Pour coder numériquement le signal de parole de façon à assurer des liaisons à très faible débit, typiquement moins de 1000 bits/s, la méthode de codage du paramètre VME consiste à quantifier le paramètre VME sur 32 valeurs (0 à 31) selon une échelle logarithmique normalisée par la norme OTAN "Stanag 4198" relative au codage prédictif linéaire d'ordre 10 dont une description figure dans l'article de M TREMAIN ayant pour titre "The Government Standard Linear Predictive Coding Algorithm- LPC 10" et qui est publié dans la revue Speech Technology April 1982 pages 40-49.
  • Le signal VME quantifié est ensuite codé sur 11 bits durant trois fenêtres consécutives. La valeur moyenne efficace de la fenêtre du milieu est codée sur 5 bits et celle de chacune des fenêtres extrêmes est codée par une méthode de codage différentielle sur 3 bits par rapport à la valeur moyenne efficace de la fenêtre médiane. Une description de ce procédé de codage peut être trouvée dans un article publié par les auteurs Wong D, Juang BH Gray AH dans la revue IEEE Transactions on ASSP vol. 30, 1982 pages 770-780 ayant pour titre "An 800 bits/s Vector Quantization LPC Vocoder".
  • Cependant, le codage sur 11 bits du paramètre VME limite les possibilités de réduction de débit des vocodeurs notamment aux bas débits inférieurs à 800 bits/secondes.
  • Le but de l'invention est de pallier l'inconvénient précité.
  • A cet effet, l'invention a pour objet, un procédé de codage de l'énergie de signaux vocaux dans des vocodeurs à très faibles débits du type consistant à analyser les signaux vocaux dans des fenêtres consécutives, à quantifier sur un nombre déterminé m de niveaux le signal vocal dans chacune des fenêtres, et à mesurer dans chacune des fenêtres la valeur moyenne efficace des échantillons du signal vocal caractérisé en ce qu'il consiste à construire, dans un espace vectoriel à n dimensions ayant pour première base les vecteurs unitaires (e₁ à en) des énergies mesurées sur n fenêtres consécutives, un vecteur énergie résultant correspondant à la somme de n vecteurs énergie mesurés respectivement dans n fenêtres d'analyse du signal vocal, à opérer dans cet espace un changement de base ayant pour premier axe principal un axe orienté de vecteur unitaire ayant pour composantes les vecteurs unitaires de la première base, à projeter dans la nouvelle base obtenue le vecteur énergie résultant, et à coder sur q bits tels que 2q = m la composante du vecteur résultant projeté sur l'axe principal de la nouvelle base et sur un nombre réduit de bits inférieurs à q, les composantes du vecteur énergie projeté sur les n-1 autres axes principaux de l'espace vectoriel défini dans la nouvelle base.
  • L'invention a également pour objet un dispositif pour la mise en oeuvre du procédé précité.
  • D'autres caractéristiques et avantages de l'invention apparaîtront ci-après à l'aide de la description faite en regard des dessins annexés qui représentent.
    • La figure 1 le principe de codage mis en oeuvre par l'invention dans un espace à deux dimensions.
    • La figure 2 le principe de codage mis en oeuvre par l'invention dans un espace à trois dimensions.
    • La figure 3 un tableau récapitulatif des énergies portées par les axes principaux de l'espace à trois dimensions défini dans la nouvelle base.
    • La figure 4 un dispositif mis en oeuvre par l'invention pour mesurer l'énergie des échantillons du signal à l'intérieur de chaque fenêtre de signal.
    • La figure 5 un dispositif de codage du paramètre VME selon l'invention.
    • La figure 6 un dispositif de décodage du paramètre VME selon l'invention.
    • Les figures 7 et 8 des deuxième et troisième variantes de réalisation de dispositifs de codage du paramètre VME selon l'invention.
  • Le procédé selon l'invention repose sur la constatation que l'énergie contenue dans le signal vocal varie très lentement au cours du temps, de sorte que les énergies E₀, E₁ et E₂ des échantillons quantifiés dans chaque fenêtre de signal peuvent être considérées comme fortement corrélées les unes aux autres. Il est possible de constater en effet, en considérant seulement un nombre très important de groupes de deux fenêtres successives, et en référençant le vecteur énergie correspondant de chaque groupe dans un espace vectoriel orthonormé à deux dimensions où les énergies E₁ et E₂ de chaque fenêtre représentent les projections du vecteur énergie E de chaque groupe dans la base représentative de cet espace, les origines des vecteurs énergie E de tous les groupes étant confondues avec celle de l'espace vectoriel à deux dimensions, que les extrémités des vecteurs énergie E se répartissent, de la façon représentée à la figure 1, dans un domaine (D) du plan formé par les deux vecteurs E₁ et E₂, sensiblement symétriques par rapport à une bissectrice E′₁ de l'angle (E₁, E₂) formé par les deux vecteurs, en étant très allongé dans la direction de la bissectrice et par contre aplati dans la direction normale à celle-ci.
  • La même constatation peut être faite en analysant l'énergie du signal de parole par groupes de n fenêtres successives.Par exemple, sur un nombre très grand d'observations on peut remarquer, en référençant comme sur la figure 2 les énergies E₀ E₁ et E₂ dans un espace à 3 dimensions, que les extrémités des vecteurs résultant chacun de la somme de trois vecteurs E₀, E₁ et E₂ sont toutes contenues dans un domaine ou "nuage" comportant trois axes d'inertie principaux.
  • Sur les axes E₀, E₁ et E₂ du trièdre représenté à la figure 2, le vecteur unitaire du premier axe d'inertie a pour composantes (3, 3, 3), le vecteur unitaire du deuxième axe d'inertie a pour composantes (-2, 0, 2) et le vecteur unitaire du troisième axe d'inertie a pour composantes (-6, 2x6, -6). Comme indiqué dans le tableau de la figure 3, il apparaît qu'en projetant l'énergie de chaque vecteur E de composantes E₀, E₁, E₂ sur chaque axe d'inertie, que les pourcentages des énergies des vecteurs projetés sont de 90% pour le premier axe, 8% pour le deuxième et 2% seulement pour le troisième. Il apparaît, qu'une économie en bits de codage peut être réalisée en ne codant pas les composantes E₀, E₁ et E₂ dans tout l'espace de codage maximal formé par le cube dont les longueurs des côtés représentent les énergies maximales E0max, E1max et E2max que peut prendre le signal de parole selon trois fenêtres consécutives, mais en codant par contre leur résultante E dans la nouvelle base orthonormée formée par les 3 vecteurs unitaires formant les axes principaux d'inertie, ce qui n'occupe qu'un faible volume du cube défini précédemment.
  • En notant par P, la matrice des composantes des 3 vecteurs unitaires telle que :
    Figure imgb0001
    avec a=3 , b=-2 et c=-6
    et en notant par (E′₀, E′₁ et E′₂) les composantes dans la nouvelle base du vecteur résultant de l'addition des trois vecteurs E₀, E₁ et E₂, le vecteur de composantes (E′₀, E′₁ et E′₂) vérifie la relation matricielle suivante :
    [E′] = P⁻¹x[E] =tP x [E].
  • Dans cette relation la matrice [E′] a pour vecteurs colonnes les composantes E′₀, E′₁ et E′₂, la matrice [E] a pour vecteurs colonnes la composantes E₀, E₁ et E₂, ettP désigne la matrice transposée de P.
  • A titre d'exemple, les transformations précédentes permettent, en limitant les valeurs de E′₀ entre 0 et 54, de coder celle-ci sur seulement 4 bits selon une échelle linéaire comprise entre ces deux valeurs et en troncaturant les valeurs E′₁ et E′₂ entre les valeurs -16 et +16, celles-ci, peuvent être codées respectivement sur 3 bits et 2 bits selon également une échelle linéaire comprise également entre ces 2 valeurs. Le résultat est alors l'obtention de 3 valeurs codées (E˝₀, E˝₁ et E˝₂) sur un total de seulement 9 bits au lieu de 11 dans l'art antérieur ce qui est suffisant pour assurer des transmissions à 800 bits/s de bonne qualité.
  • En réception les opérations effectuées sont les opérations inverses du codage. A partir des valeurs codées E˝₀, E˝₁ et E˝₂ le procédé détermine dans une première étape le vecteur de composante E′₀, E′₁ et E′₂ exprimé dans la base des vecteurs unitaires des axes principaux d'inertie. Puis selon une deuxième étape, il multiplie la matrice P par le vecteur de composantes E′₀, E′₁, E′₂ pour obtenir un vecteur de composantes E₀, E₁ et E₂. Enfin, selon une troisième étape il applique aux composantes E₀, E₁ et E₂ la loi de décodage de la norme de codage prédictif linéaire d'ordre 10, pour obtenir les trois valeurs efficaces VME₀, VME₁ et VME₂ des trois fenêtres de signal consécutives traitées.
  • Un dispositif de codage correspondant est représenté aux figures 4 et 5. Sur la figure 4 le dispositif de mesure de l'énergie des échantillons du signal vocal comprend un circuit accumulateur 1, représenté à l'intérieur d'une ligne fermée en pointillés, ce circuit étant couplé à deux registres 2 et 3 reliés en série. Le circuit accumulateur 1 se compose, de façon connue, d'un registre accumulateur 4 et d'un circuit additionneur 5. Chaque échantillon Si du signal vocal est appliqué sur une première entrée d'opérande du circuit additionneur 5 et est additionné au contenu du registre accumulateur 4 qui est appliqué sur la deuxième entrée d'opérande du circuit additionneur 5. Le cumul des échantillons Si d'une fenêtre a ainsi lieu dans le registre accumulateur 4 pendant toute la durée de la fenêtre. A la fin de chaque fenêtre le contenu de l'accumulateur 4 est transféré dans le registre 2 pour être ensuite chargé à la fenêtre suivante dans le registre 3. En régime établi, les contenus des registres 3, 2 et 4 indiquent en permanence en fin de fenêtre, les énergies respectives E₀ E₁ et E₂ contenues dans trois fenêtres consécutives d'exploration du signal vocal. Ces valeurs d'énergies E₀, E₁, E₂ sont appliquées au dispositif de codage de la figure 5, aux entrées correspondantes d'un circuit additionneur 6. Le dispositif de codage comprend également trois voies de traitement 7, 8 et 9 représentées à l'intérieur de lignes fermées en pointillées. La voie 7 comprend, un circuit atténuateur 10 de rapport d'atténuation 3, un étage limiteur 11 et un codeur 12. L'ensemble des éléments 10, 11, 12 sont couplés entre eux, dans cet ordre, et en série à la sortie du circuit additionneur 6. La voie 8 comprend un circuit amplificateur 13 de gain 3, couplé à un circuit atténuateur 15 de rapport d'atténuation 6 au travers d'un circuit soustracteur 14. Le circuit soustracteur 14 comporte une première entrée d'opérande, marquée "+" qui est reliée à la sortie du circuit amplificateur 13 et une deuxième entrée d'opérande marquée "-" qui est reliée à la sortie du circuit additionneur 6.
  • La voie 9 comprend un circuit atténuateur 16 de rapport d'atténuation 2 couplé à la sortie d'un circuit additionneur 17. Un circuit aiguilleur 18 applique l'un ou l'autre des signaux obtenus en sortie des voies 8 et 9 à l'entrée d'un codeur 19 au travers d'un étage limiteur 20.
  • Le décodeur de réception est représenté à la figure 6. Il comprend un ensemble de trois voies de réceptions 21, 22 et 23 représentées à l'intérieur de lignes fermées en pointillées.
  • La première voie 21 comprend, reliés en série, un circuit d'atténuation 24 de rapport d'atténuation 3 et deux circuits soustracteurs 25 et 26.
  • La deuxième voie 22 comprend reliés en série, un circuit atténuation 27 de rapport d'atténuation 2, un circuit additionneur 28 et un circuit soustracteur 29;
    la troisième voie 23 comprend, reliés en série un circuit d'atténuation 30 de rapport d'atténuation 6, un amplificateur 31 de gain 2 et un circuit additionneur 32.
  • Le circuit soustracteur 25 est relié par une première entrée d'opérande marquée "+" à la sortie du circuit atténuateur 24 et par une deuxième entrée d'opérande marquée "-" à la sortie du circuit atténuateur 27. Le résultat de la soustraction effectuée par le circuit soustracteur 25 est appliqué sur une première entrée d'opérande marquée "+" du circuit soustracteur 26. La deuxième entrée d'opérande marquée "-" du circuit soustracteur 26 est reliée à la sortie du circuit atténuateur 30. La sortie du circuit soustracteur 26 fournit l'énergie E₀ de la première fenêtre du signal vocal. Le circuit additionneur 28 possède une première entrée d'opérande reliée à la sortie du circuit atténuateur 27 et une deuxième entrée d'opérande reliée à la sortie du circuit atténuateur 24. Le résultat obtenu à la sortie du circuit additionneur 28 est appliqué sur une première entrée d'opérande marquée "+" du circuit soustracteur 29. La deuxième entrée d'opérande marquée "-" du circuit soustracteur 29 est reliée à la sortie du circuit atténuateur 30. L'énergie E₂ du signal est obtenue à la sortie du circuit soustracteur 29. Enfin le circuit additionneur 32 est relié par une première entrée d'opérande à la sortie de l'amplificateur 31 et par une deuxième entrée d'opérande à la sortie du circuit atténuateur 24. L'énergie E₁ du signal est obtenue à la sortie du circuit additionneur 23.
  • Plutôt que de réaliser un codage scalaire du vecteur E′₀, E′₁, E′₂ dans la base des trois vecteurs unitaires des axes principaux d'inertie, une deuxième variante de mise en oeuvre du procédé selon l'invention peut consister à effectuer, comme le montre la figure 7, un codage vectoriel du vecteur (E′₀, E′₁, E′₂), en cherchant le plus proche vecteur du vecteur (E′₀, E′₁, E′₂) parmi 2N vecteurs dont les extrémités coïncideraient avec les noeuds d'un sous-ensemble borné d'un réseau cubique à face centrée, de façon à obtenir un codage sur N bits. Ce mode de codage est réalisé par les circuits de la figure 7, qui comprennent une mémoire morte programmable 33 adressée par un compteur d'adresse 34, trois circuits soustracteurs 35 à 37, trois circuits d'élévation au carré 38 à 40, un circuit sommateur 41, un circuit comparateur 42, et deux registres 43 et 44. La mémoire morte 33 contient les trois composantes des 2N vecteurs estimés (E₀, E₁ et E₂) et ceux-ci sont adressés par le compteur d'adresse à N bits 24. Chacune des composantes lues dans la mémoire 33 est appliquée respectivement sur une première entrée d'opérande des circuits soustracteurs 35 à 37. Les composantes E₀, E₁ et E₂ de l'énergie du signal vocal de chacune des trois fenêtres sont appliquées respectivement sur les deuxièmes entrées d'opérande des circuits soustracteurs 35 à 37. Les résultats des soustractions effectuées par les circuits soustracteurs 35 à 37 sont appliqués respectivement sur l'entrée des circuits d'élévation au carré 38 à 40, et les résultats des élévations au carré sont appliqués aux entrées du circuit sommateur 41. Les sommes des carrés des différences entre, chaque composante (E₀, E₁, E₂) d'un vecteur représentant les énergies du signal vocal dans trois fenêtres consécutives et les composantes E₀, E₁, E₂ d'un vecteur estimé adressé par le compteur d'adresses 34, sont appliquées successivement par la sortie du circuit sommateur 41 sur une première entrée de comparaison d'un circuit comparateur 42 pour être comparées au contenu du registre 43 qui est appliqué sur la deuxième entrée de comparaison du comparateur 42. A chaque comparaison le contenu du registre 43 est mis à jour par le résultat de la sommation obtenu à la sortie du circuit sommateur 41 si ce résultat est inférieur au contenu existant dans le registre 43. De la sorte après chaque progression du compteur d'adresse 34, le registre 43 garde en mémoire la somme des carrés obtenue du circuit sommateur 41 qui est la plus petite parmi toutes les sommes déjà effectuées depuis le début de l'adressage des vecteurs estimés dans la mémoire 33. Parallèlement à chaque mise à jour du contenu du registre 43 le contenu du registre 44 est remplacé par l'adresse du vecteur correspondant qui a été lu dans la mémoire 33. On obtient ainsi directement dans le registre 44 le n° du vecteur VME codé sur N bits.
  • Une troisième variante de mise en oeuvre du procédé selon l'invention est représenté à la figure 8. Comme cette troisième variante découle du mode de réalisation de la deuxième variante décrite précédemment les éléments homologues de la figure 7 sont représentés sur la figure 8 avec les mêmes références. Cette troisième variante diffère de la précédente par le fait que l'espace de la mémoire 33 est partagé en trois sous espaces mémoires 33a, 33b et 33c. Dans ce cas les N/3 premiers bits du compteur d'adresse 34 adressent les sous espaces 33a, les N/3 bits suivants adressent le deuxième sous-espace et N/3 bits restants adressent le sous-espace 33c. Ceci permet d'avoir une représentation vectoriel des vecteurs dans un espace à trois dimensions ayant la forme d'un réseau cubique à face centrée, en affectant à chaque vecteur un groupe et un sous groupe de cet espace. En affectant les groupes du réseau cubique à l'espace mémoire 33a les sous groupes à l'espace mémoire 33b, 2N/3 vecteurs énergie estimés peuvent être codés dans l'espace mémoire 33a et 2N/3 vecteurs énergie estimés peuvent être codés dans l'espace mémoire 33b. Les 2N/3 vecteurs restants sont codés dans l'espace mémoire 33c. Pour N = 9 on obtient ainsi 8 groupes comportant chacun 8 sous groupes de 8 vecteurs chacun.
  • De manière similaire au dispositif représenté à la figure 7 l'énergie du signal vocal de composante E₀, E₁ et E₂ est mesurée par les circuits 35 à 43 relativement à l'énergie des vecteurs estimés correspondants formée successivement au travers d'un multiplexeur 45 par les mémoires 33a, 33b et 33c.
  • On définit ainsi successivement le groupe, le sous groupe puis le vecteur du sous groupe qui possède l'énergie la plus proche du vecteur de composante E₀, E₁ et E₂. Les numéros de groupe sous groupe et de vecteur à l'intérieur d'un sous groupe sont enregistrés respectivement dans le registre 44 qui a sur la figure 8 la forme d'un banc de registres composés des registres 44a, 44b et 44c. Des portes ET 48, 49 et 50 permettent le transfert des adresses groupe, sous groupe et vecteur à l'intérieur d'un groupe, chaque fois que le résultat de la comparaison effectuée par le comparateur 42 indique que la somme formée par le sommateur 41 est inférieure au contenu du registre 43.

Claims (8)

1. Procédé de codage de l'énergie de signaux vocaux dans des vocodeurs à très faibles débits du type consistant à analyser les signaux vocaux dans des fenêtres consécutives, à quantifier sur un nombre déterminé m de niveaux le signal vocal dans chacune des fenêtres, et à mesurer (1, 2, 3) dans chacune des fenêtres la valeur moyenne efficace des échantillons du signal vocal caractérisé en ce qu'il consiste à construire, dans un espace vectoriel à n dimensions ayant pour première base les vecteurs unitaires (e₁ à en) des énergies mesurées sur n fenêtres consécutives, un vecteur énergie résultant correspondant à la somme de n vecteurs énergie mesurés respectivement dans n fenêtres d'analyse du signal vocal, à opérer dans cet espace un changement de base ayant pour premier axe principal un axe orienté de vecteur unitaire ayant pour composantes les vecteurs unitaires de la première base, à projeter (6, 7, 8, 9) dans la nouvelle base obtenue le vecteur énergie résultant, et à coder sur q bits tels que 2q = m la composante du vecteur résultant projeté sur l'axe principal de la nouvelle base et sur un nombre réduit de bits inférieurs à q, les composantes du vecteur énergie projeté sur les n-1 autres axes principaux de l'espace vectoriel défini dans la nouvelle base.
2. Procédé selon la revendication 1, caractérisé en ce que l'espace vectoriel est un espace à trois dimensions, et en ce que les vecteurs unitaires portés par axes principaux de la nouvelle base ont pour composante dans la base définie par les vecteurs de l'espace à trois dimensions représentant les énergies mesurées sur 3 fenêtres consécutives, respectivement (3, 3, 3) pour le premier axe principal (-2, 0, 2) pour le deuxième axe principal, et (-6,2x6-6) pour le troisième axe principal.
3. Procédé selon la revendication 2, caractérisé en ce que le codage du vecteur énergie résultant projeté sur les premier, deuxième et troisième axes principaux ont des longueurs respectives de 4, 3 et 2 bits.
4. Dispositif de codage de l'énergie d'un signal vocal dans un vocodeur à très faibles débits, comprenant des moyens pour quantifier sur un nombre déterminé m de niveaux le signal vocal dans un nombre déterminé de fenêtres consécutives du signal vocal, des moyens (1, 2, 3, 4, 5) pour mesurer dans chacune des fenêtres la valeur moyenne efficace des échantillons du signal vocal, des moyens de calcul matriciel (6, 7, 8, 9 ; 33...44) pour projeter, dans une base vectorielle ayant pour premier axe principal un axe orienté de vecteur utilitaire ayant pour composantes les vecteurs unitaires d'une première base représentant respectivement les énergies mesurées à l'intérieur des fenêtres de mesure, le vecteur d'énergie résultant de la somme des vecteurs énergie mesurés dans chaque fenêtre du signal vocal, et des moyens de codage (12, 19)de chaque composante du vecteur projetée dans la nouvelle base vectorielle.
5. Dispositif selon la revendication 4, caractérisé en ce que pour n = 3 les moyens de calcul matriciel (6, 7, 8, 9 ; 33...44) effectuent le produit matriciel
[E′] = P⁻¹[E]
où [E] est le vecteur colonne formés par les composantes E₀, E₁, E₂ des énergies mesurées sur trois fenêtres successives et
Figure imgb0002
avec a=3,b=-2 et c=-6
6. Dispositif selon la revendication 4, caractérisé en ce qu'il comprend des moyens (35,...44) pour rechercher dans un ensemble de 2N vecteurs, préenregistrés dans une mémoire (33) et dont les extrémités coïncident avec les noeuds d'un sous ensemble borné d'un réseau cubique à face centrée, le vecteur qui a les composantes dans la nouvelle base les plus proches des composantes E₀, E₁ et E₂ des énergies mesurées sur trois fenêtres successives du signal vocal, de manière à représenter le code du vecteur résultant sur N bits.
7. Dispositif selon la revendication 6, caractérisé en ce que la mémoire (33) est organisée en N/3 groupes, N/3 sous groupes de N/3 vecteurs chacun.
8. Dispositif selon l'une quelconque des revendications 6 et 7, caractérisé en ce qu'il comprend
- un compteur d'adresse pour adresser les vecteurs préenregistrés dans la mémoire (33)
- des circuits soustracteurs (35, 36, 37) pour comparer les N valeurs moyennes efficaces du signal vocales fournies par N fenêtres, aux N composantes respectives des vecteurs lus dans la mémoire (33)
- et un circuit de décision (42, 43, 44) pour repérer le vecteur lu dans la mémoire (33) qui possède les composantes lues les plus proches des N valeurs moyennes efficaces mesurées du signal vocal.
EP89401169A 1988-05-04 1989-04-25 Procédé et dispositif de codage de l'énergie du signal vocal dans des vocodeurs à très faibles débits Expired - Lifetime EP0341129B1 (fr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR8806002A FR2631146B1 (fr) 1988-05-04 1988-05-04 Procede et dispositif de codage de l'energie du signal vocal dans des vocodeurs a tres faibles debits
FR8806002 1988-05-04

Publications (2)

Publication Number Publication Date
EP0341129A1 true EP0341129A1 (fr) 1989-11-08
EP0341129B1 EP0341129B1 (fr) 1993-06-23

Family

ID=9365992

Family Applications (1)

Application Number Title Priority Date Filing Date
EP89401169A Expired - Lifetime EP0341129B1 (fr) 1988-05-04 1989-04-25 Procédé et dispositif de codage de l'énergie du signal vocal dans des vocodeurs à très faibles débits

Country Status (7)

Country Link
US (1) US5016278A (fr)
EP (1) EP0341129B1 (fr)
JP (1) JPH01319100A (fr)
CA (1) CA1312380C (fr)
DE (1) DE68907267T2 (fr)
ES (1) ES2041425T3 (fr)
FR (1) FR2631146B1 (fr)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5255339A (en) * 1991-07-19 1993-10-19 Motorola, Inc. Low bit rate vocoder means and method
US5473731A (en) * 1993-07-20 1995-12-05 Intel Corporation Lattice based dynamic programming classification system
FR2738383B1 (fr) * 1995-09-05 1997-10-03 Thomson Csf Procede de quantification vectorielle de vocodeurs bas debit
FR2778041A1 (fr) * 1998-04-24 1999-10-29 Thomson Csf Procede de neutrodynage du tube d'un emetteur
US6192283B1 (en) 1998-07-31 2001-02-20 Siemens Energy & Automation, Inc. Method and apparatus for adaptive control of a system or device
FR2788390B1 (fr) 1999-01-12 2003-05-30 Thomson Csf Emetteur de radiodiffusion en ondes courtes a haut rendement optimise pour les emissions de type numerique
FR2790343B1 (fr) 1999-02-26 2001-06-01 Thomson Csf Systeme pour l'estimation du gain complexe d'un canal de transmission
FR2799592B1 (fr) 1999-10-12 2003-09-26 Thomson Csf Procede de construction et de codage simple et systematique de codes ldpc

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2608244A1 (de) * 1976-02-28 1977-09-15 Licentia Gmbh Verfahren zur analyse und synthese des differenzsignals bei praediktionsvocodern

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2608244A1 (de) * 1976-02-28 1977-09-15 Licentia Gmbh Verfahren zur analyse und synthese des differenzsignals bei praediktionsvocodern

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PROCEEDINGS OF THE IEEE, vol. 73, no. 11, novembre 1985, pages 1551-1588, IEEE, New York, US; J. MAKHOUL et al.: "Vector quantization in speech coding" *

Also Published As

Publication number Publication date
FR2631146B1 (fr) 1991-05-10
US5016278A (en) 1991-05-14
FR2631146A1 (fr) 1989-11-10
ES2041425T3 (es) 1993-11-16
DE68907267T2 (de) 1993-09-30
DE68907267D1 (de) 1993-07-29
CA1312380C (fr) 1993-01-05
EP0341129B1 (fr) 1993-06-23
JPH01319100A (ja) 1989-12-25

Similar Documents

Publication Publication Date Title
EP0608174B1 (fr) Systeme de codage-décodage prédictif d&#39;un signal numérique de parole par transformée adaptative à codes imbriqués
EP0749626B1 (fr) Procede de codage de parole a prediction lineaire et excitation par codes algebriques
EP0064119B1 (fr) Perfectionnement aux procédés de codage de la voix et dispositif de mise en oeuvre du procédé perfectionné
EP0768770B1 (fr) Procédé et dispositif de création d&#39;un bruit de confort dans un système de transmission numérique de parole
EP0666557B1 (fr) Interpolation de formes d&#39;onde par décomposition en bruit et en signaux périodiques
EP1692689B1 (fr) Procede de codage multiple optimise
EP0801790B1 (fr) Procede de codage de parole a analyse par synthese
FR2706064A1 (fr) Procédé et dispositif de quantitication vectorielle.
EP0721180B1 (fr) Procédé de codage de parole à analyse par synthèse
EP0481895B1 (fr) Procédé de transmission, à bas débit, par codage CELP d&#39;un signal de parole et système correspondant
EP0428445B1 (fr) Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit
EP0341129B1 (fr) Procédé et dispositif de codage de l&#39;énergie du signal vocal dans des vocodeurs à très faibles débits
EP0801788A1 (fr) Procede de codage de parole a analyse par synthese
FR2981781A1 (fr) Codage hierarchique perfectionne
EP0506535A1 (fr) Procédé et système de traitement des pré-échos d&#39;un signal audio-numérique codé par transformée fréquentielle
EP0334714A1 (fr) Codeur différentiel à filtre prédicteur auto adaptatif et décodeur utilisable en liaison avec un tel codeur
EP0347307B1 (fr) Procédé de codage et codeur de parole à prédiction linéaire
EP0585434B1 (fr) Procede et dispositif de filtrage pour la reduction des preechos d&#39;un signal audio-numerique
EP0821345B1 (fr) Procédé d&#39;extraction de la fréquence fondamentale d&#39;un signal de parole
FR2961937A1 (fr) Codage/decodage predictif lineaire adaptatif
EP0469997B1 (fr) Procédé de codage et codeur de parole à analyse par prédiction linéaire
EP0596785A1 (fr) Procédé de discrimination de la parole en présence de bruits ambiants et vocodeur à faible débit pour la mise en oeuvre du procédé
EP0543700A2 (fr) Procédé de quantification de l&#39;énergie du signal de parole dans un vocodeur à très large débit
FR2581272A1 (fr) Procede de codage mic differentiel et installation de transmission d&#39;information utilisant un tel codage.
FR2709387A1 (fr) Système de communication radio.

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): BE DE ES GB IT

17P Request for examination filed

Effective date: 19900327

17Q First examination report despatched

Effective date: 19910528

GRAA (expected) grant

Free format text: ORIGINAL CODE: 0009210

AK Designated contracting states

Kind code of ref document: B1

Designated state(s): BE DE ES GB IT

ITF It: translation for a ep patent filed
REF Corresponds to:

Ref document number: 68907267

Country of ref document: DE

Date of ref document: 19930729

GBT Gb: translation of ep patent filed (gb section 77(6)(a)/1977)

Effective date: 19930819

REG Reference to a national code

Ref country code: ES

Ref legal event code: FG2A

Ref document number: 2041425

Country of ref document: ES

Kind code of ref document: T3

RAP2 Party data changed (patent owner data changed or rights of a patent transferred)

Owner name: THOMSON-CSF

PLBE No opposition filed within time limit

Free format text: ORIGINAL CODE: 0009261

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: ES

Free format text: LAPSE BECAUSE OF THE APPLICANT RENOUNCES

Effective date: 19940426

26N No opposition filed
PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: DE

Payment date: 19950315

Year of fee payment: 7

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: GB

Payment date: 19950317

Year of fee payment: 7

PGFP Annual fee paid to national office [announced via postgrant information from national office to epo]

Ref country code: BE

Payment date: 19950403

Year of fee payment: 7

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: GB

Effective date: 19960425

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: BE

Effective date: 19960430

BERE Be: lapsed

Owner name: THOMSON-CSF

Effective date: 19960430

GBPC Gb: european patent ceased through non-payment of renewal fee

Effective date: 19960425

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: DE

Effective date: 19970101

REG Reference to a national code

Ref country code: ES

Ref legal event code: FD2A

Effective date: 19991102

PG25 Lapsed in a contracting state [announced via postgrant information from national office to epo]

Ref country code: IT

Free format text: LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES;WARNING: LAPSES OF ITALIAN PATENTS WITH EFFECTIVE DATE BEFORE 2007 MAY HAVE OCCURRED AT ANY TIME BEFORE 2007. THE CORRECT EFFECTIVE DATE MAY BE DIFFERENT FROM THE ONE RECORDED.

Effective date: 20050425