EP0208712B1

EP0208712B1 - Procede et appareil adaptatifs de codage de la parole

Info

Publication number: EP0208712B1
Application number: EP86900480A
Authority: EP
Inventors: Israel Bernard Zibman; Baruch Mazor; Dale E. Veeneman
Original assignee: GTE Laboratories Inc
Current assignee: Verizon Laboratories Inc
Priority date: 1984-12-20
Filing date: 1985-12-11
Publication date: 1993-04-07
Anticipated expiration: 2005-12-11
Also published as: EP0208712A4; DE3587251T2; EP0208712A1; DE3587251D1; WO1986003872A1

Abstract

Une transformée de Fourier (28) de la parole est introduite dans un codeur (Fig.1) de la parole. La transformée de Fourier est égalisée (30) en normalisant les coefficients du spectre jusqu'à obtenir une courbe approximée de la forme du spectre. La courbe et le spectre égalisé sont codés. Dans un système, des facteurs d'échelle (45) sont générés et codés pour chaque sous-bande d'une pluralité de sous-bandes d'un spectre de parole obtenu par une transformée de Fourier. Le spectre est égalisé (46) sur la base de ces facteurs d'échelle (46). Les coefficients d'un nombre limité de sous-bandes (48) déterminé par les facteurs d'échelle sont codés (50). Le nombre de bits utilisé pour coder chaque coefficient de chaque sous-bande transmise est déterminé par le facteur d'échelle pour chaque sous-bande. Au niveau du récepteur, les coefficients des sous-bandes non transmises sont calculés par approximation selon une technique de reproduction de liste (54).

Claims

Codeur de la parole comprenant :
un moyen de transformation de Fourier (28) assurant une transformation discrète de Fourier d'un signal de parole entrant pour engendrer un spectre transformé discret de coefficients;
un moyen de normalisation (30) pour modifier le spectre transforme pour obtenir un spectre normalisé plus plat et pour coder une fonction par laquelle le spectre discret est modifié; et
un moyen (30) pour coder au moins une partie du spectre,
caractérisé en ce que
le dit moyen de normalisation (30) comprend un moyen (44) pour définir l'enveloppe approximée du spectre discret dans chacune d'une pluralité de sous-bandes de coefficients et pour coder l'enveloppe définie de chaque sous-bande de coefficients et un moyen pour établir chaque coefficient du spectre par rapport à l'enveloppe définie de la sous-bande respective de coefficients; et
le dit moyen (30) pour coder code les coefficients établis du spectre à l'intérieur de chaque sous-bande dans un nombre de binons déterminé par l'enveloppe définie de la sous-bande.
Système de codage de la parole selon la revendication 1 dans lequel le nombre déterminé de binons pour une pluralité de sous-bandes est zéro, de telle façon que les coefficients établis pour ces sous-bandes ne soient pas transmis.
Système de codage de la parole selon la revendication 2 dans lequel les coefficients établis de différentes sous-bandes sont codés en différents nombres de binons autres que zéro.
Système de codage de la parole selon la revendication 2 dans lequel la parole codée est codée en copiant des sous-bandes des coefficients transmis en tant que substituts pour les sous-bandes de coefficients non-transmis, les coefficients transmis étant copiés de telle façon que la n^ième sous-bandes qui est transmisé soit copiée en tant que n^ième sous-bande qui n'est pas transmisé.
Système de codage de la parole selon la revendication 1 dans lequel les coefficients des différentes sous-bandes sont codés en différents nombres de binons autres que zéro.
Système de codage de la parole selon la revendication 1 dans lequel :
le moyen de codage (30) code les coefficients établis de moins de toutes les sous-bandes, les coefficients établis codes étant ceux correspondant aux enveloppes définies de plus grande amplitude, les coefficients établis des sous-bandes correspondant aux enveloppes définies de plus grande amplitude étant codés en plus de binons que les coefficients des sous-bandes correspondant aux enveloppes définies d'amplitude plus petite.
Système de codage de la parole selon la revendication 6 dans lequel la parole codée est décodée en copiant des sous-bandes de coefficients transmis en tant que substituts pour des sous-bandes de coefficients non-transmis, les coefficients transmis étant copiés de telle manière que la n^ième sous-bande qui est transmisé soit copiée en tant que n^ième sous-bande qui n'est pas transmise.
Système de codage de la parole selon la revendication 6 dans lequel le moyen de transformation (28) réalise une transformation discrète de Fourier.
Système de codage de la parole selon la revendication 1 dans lequel le moyen de normalisation comprend :
un moyen (44) pour déterminer l'amplitude maximale du spectre discret à l'intérieur de chacune d'une pluralité de régions du spectre; et
un moyen pour coder en numérique l'amplitude maximale de chaque région; et
un moyen (45) pour établir chaque coefficient du spectre discret dans chaque région par rapport à l'amplitude maximale de chaque région pour obtenir un premier ensemble de coefficients normalisés.
Système de codage de la parole selon la revendication 9 dans lequel le moyen de normalisation comprend, en outre :
un moyen pour déterminer l'amplitude maximale du premier ensemble de sorties normalisées dans chacune d'une pluralité de sous-régions du spectre;
un moyen pour coder en numérique l'amplitude maximale de chaque sous-région; et
un moyen pour établir chaque sortie du premier ensemble de sorties normalisées par rapport à l'amplitude maximale de chaque sous-région pour obtenir un deuxième sous-ensemble de sorties normalisées.
Codeur de la parole selon la revendication 10 dans lequel chacune des amplitudes maximales est codée de façon logarithmique.
Codeur de la parole selon la revendation 10 dans lequel l'amplitude maximale est déterminée pour chacune des quatre régions correspondantes aux premiers quatre formants.
Système de codage de la parole selon la revendication 10 dans lequel seule une bande de base du spectre normalisé est codée.
Procédé de codage de la parole comprenant les étapes suivantes :
réalisation d'une transformation discrète de Fourier d'une fenêtre de parole pour engendrer un spectre transforme discret;
obtention d'un spectre normalisé en définissant au moins une courbe approximant l'amplitude du spectre discret, en codant en numérique la courbe définie et en définissant le spectre discret par rapport à la courbe définie; et
codage d'au moins une partie du spectre normalisé.
caractérisé en ce que
le spectre normalisé est obtenu en définissant l'enveloppe approximée du spectre discret dans chacune d'une pluralité de sous-bandes de coefficients et en codant en numérique l'enveloppe définie de chaque sous-bande de coefficients et en établissant chaque coefficient par rapport à l'amplitude définie de la sous-bande respective de coefficients; et
les coefficients établis à l'intérieur de chaque sous-bande sont codés en un nombre de binons déterminé par l'enveloppe définie de la sous-bande.
Procédé selon la revendication 14 dans lequel le nombre de binons déterminé pour une pluralité de sous-bandes est zéro, de telle façon que les coefficients établis pour ces sous-bandes ne soient pas transmis.
Procédé selon la revendication 15 dans lequel les coefficients établis de différentes sous-bandes sont codés en différents nombres de binons autres que zéro.
Procédé selon la revendication 15 dans lequel la parole codée est décodée par copie de sous-bandes de coefficients transmis en tant que substituts pour des sous-bandes de coefficients non-transmis, les coefficients transmis étant copiés de telle façon que la n^ième sous-bande qui est transmisé soit copiée en tant que n^ième sous-bande qui n'est pas transmisé.
Procédé selon la revendication 14 dans lequel le spectre normalisé est obtenu en :
déterminant une amplitude maximale du spectre discret à l'intérieur de chacune d une pluralité de régions du spectre;
codant en numérique l'amplitude maximale de chaque région; et
établissant chaque coefficient du spectre discret dans chaque région par rapport à l'amplitude maximale de chaque région pour déterminer un ensemble de coefficients normalisés.