FR2702075A1 - Procédé de génération d'un filtre de pondération spectrale du bruit dans un codeur de la parole. - Google Patents

Procédé de génération d'un filtre de pondération spectrale du bruit dans un codeur de la parole. Download PDF

Info

Publication number
FR2702075A1
FR2702075A1 FR9401450A FR9401450A FR2702075A1 FR 2702075 A1 FR2702075 A1 FR 2702075A1 FR 9401450 A FR9401450 A FR 9401450A FR 9401450 A FR9401450 A FR 9401450A FR 2702075 A1 FR2702075 A1 FR 2702075A1
Authority
FR
France
Prior art keywords
filter
term
noise
coefficients
spectral weighting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9401450A
Other languages
English (en)
Other versions
FR2702075B1 (fr
Inventor
Ira A Gerson
Mark A Jasiuk
Matthew A Hartman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of FR2702075A1 publication Critical patent/FR2702075A1/fr
Application granted granted Critical
Publication of FR2702075B1 publication Critical patent/FR2702075B1/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

Procédé de codage digital de la parole utilisant un filtre d'ordre R pour modéliser la réponse en fréquences de plusieurs filtres, constituant ainsi un filtre assurant la commande de plusieurs filtres sans leur complexité. Le filtre d'ordre R peut être utilisé comme filtre de pondération spectrale du bruit (132) ou comme une combinaison d'un filtre de pointeur de court terme et d'un filtre de pondération spectrale du bruit, référencé comme le filtre de synthèse à pondération spectrale du bruit (426) selon le mode de mise en œuvre utilisé. En général, le procédé modélise la réponse en fréquence des L filtres d'ordre P par un seul filtre d'ordre R où l'ordre R est inférieur strict à L x P. Alors, ce procédé améliore la commande d'un filtre de codeur de la parole sans l'augmentation correspondante de la complexité du codeur de la parole.

Description

PROCÉDÉ DE GÉNÉRATION D'UN FILTRE DE PONDÉRATION SPECTRALE
DU BRUIT DANS UN CODEUR DE LA PAROLE
La présente invention concerne, de f açon globale, un codeur de la parole et, plus particulièrement, un procédé amélioré de génération d'un filtre de pondération spectrale
du bruit pour une utilisation dans un codeur de la parole.
La prédiction linéaire à excitation par code (CELP) est une technique de codage de la parole utilisée pour produire une parole de synthèse de haute qualité Cette classe de codage de la parole, connue de même comme prédiction linéaire à excitation par vecteur, est utilisée dans de nombreuses applications de communication et de synthèse de la parole La CELP peut être appliquée, en particulier, aux systèmes de cryptage digital de la parole15 et de communication digitale par radiotéléphone dans lesquels la qualité de la parole, le débit de données, la
taille et le coût sont des buts importants.
Dans un codeur de la parole à CELP, les pointeurs de long terme (" caractéristique globale ") et de court terme (" caractéristique phonétique ") modélisant les caractéristiques du signal d'entrée de la parole sont
incorporés dans un ensemble de filtres variables dans le temps, en fait un filtre de long terme et un filtre de court terme Un signal d'excitation pour les filtres est25 choisi à partir d'une matrice de codage des séquences d'innovation stockées ou vecteurs de code.
Pour chaque trame de la parole, le codeur de la parole applique un vecteur individuel de code aux filtres pour générer un signal reconstitué de la parole Le signal30 reconstitué de la parole est comparé au signal originel d'entrée de la parole créant un signal d'erreur Le signal d'erreur est alors pondéré en traversant un filtre de pondération spectrale du bruit possédant une réponse basée
2 2702075
sur la perception auditive humaine Le signal optimal d'excitation est déterminé par le choix d'un vecteur de code produisant le signal d'erreur pondéré avec l'amplitude
minimale pour la trame de courant de la parole.
Pour chaque trame de la parole, un ensemble de paramètres linéaires de codage de pointeur sont produits par un analyseur de coefficient Les paramètres incluent usuellement des coefficients pour le long terme, le court
terme et les filtres de pondération spectrale du bruit.
Les opérations de filtrage dues à un filtre de pondération spectrale du bruit peuvent constituer une partie importante de la complexité globale de calcul d'un codeur de la parole car un signal d'erreur pondéré de façon spectrale a besoin d'être calculé pour chaque vecteur de15 code à partir d'une matrice de code de séquences d'innovation Usuellement, un compromis entre la commande affectée et la complexité due aux filtres de pondération spectrale du bruit a besoin d'être trouvé Une technique pouvant permettre une commande améliorée de la conformation20 en fréquence introduite par le filtre de pondération spectrale du bruit, sans l'accroissement correspondant de
la complexité du filtre de pondération, représenterait une innovation utile dans le domaine de l'art du codage de la parole.
La Figure 1 est un synoptique d'un codeur de la parole dans lequel la présente invention peut être utilisée; la Figure 2 est un organigramme de processus illustrant la séquence globale des opérations de codage de la parole effectuées selon un mode de mise en oeuvre de la présente invention; la Figure 3 est un organigramme de processus illustrant la séquence de génération de coefficients
3 2702075
combinés de filtre spectral du bruit selon la présente invention; la Figure 4 est un synoptique d'un mode de mise en oeuvre d'un codage de la parole selon la présente invention; la Figure 5 est un organigramme de processus illustrant la séquence globale des opérations de codage de la parole effectuées selon un mode de mise en oeuvre de la présente invention; la Figure 6 est un synoptique de configurations particulières de filtre de pondération spectrale du bruit selon la présente invention; et la Figure 7 est un synoptique de configurations particulières de filtre de pondération spectrale du bruit
selon la présente invention.
Cette description inclut un procédé de codage digital de la parole Ce procédé comprend la modélisation de la
réponse en fréquence de multiples filtres par un filtre d'ordre R, fournissant ainsi un filtre qui assure la20 commande de multiples filtres sans la complexité de multiples filtres Le filtre d'ordre R peut être utilisé comme filtre de pondération spectrale du bruit ou comme une combinaison d'un filtre pointeur de court terme et d'un filtre de pondération spectrale du bruit selon le mode de25 mise en oeuvre utilisé La combinaison du filtre pointeur de court terme et du filtre de pondération spectrale du bruit est référencée comme filtre de synthèse à pondération spectrale du bruit En général, le procédé modélise la réponse en fréquence de L filtres d'ordre P par un seul30 filtre d'ordre R o R < L x P Dans le mode de mise en oeuvre préféré, L = 2 L'équation suivante illustre le procédé utilisé dans la présente invention:
4 2702075
La 2 l = 1 o: i 1 = et 1 2 a 3 2 a 2 2 O La Figure 1 est un synoptique d'un premier mode de mise en oeuvre d'un codeur de la parole utilisant la présente invention Un signal acoustique d'entrée à analyser est appliqué à un codeur de la parole 100 par un microphone 102 Le signal d'entrée, usuellement un signal10 vocal, est alors appliqué au filtre 104 Le filtre 104 présentera, en général, des caractéristiques de filtre
passe-bande Cependant, si la largeur de bande de la parole est déjà adaptée, le filtre 104 peut comprendre une connexion directe par câble.
Un convertisseur analogique/digital (A/D) 108 convertit le signal analogique vocal 152 sortant du filtre 104 en une séquence de M échantillons d'impulsions, l'amplitude de chaque échantillon d'impulsions est alors représentée par un code numérique, comme cela étant connu20 dans le domaine de l'art L'horloge d'échantillonnage SC détermine le taux d'échantillonnage du convertisseur A/D 108 Dans le mode de mise en oeuvre préféré, l'horloge SC tourne à 8 k Hz L'horloge d'échantillonnage SC est générée
en conjonction avec l'horloge de trame FC dans le module25 d'horloge 112.
La sortie numérique de l'A/D 108, référencée comme vecteur d'entrée de la parole, s(n) 158, est appliquée à l'analyseur de coefficient 110 Ce vecteur d'entrée de la parole s(n) 158 est obtenu, de façon répétitive, dans des trames séparées, c-à-d des intervalles de temps, dont la
longueur est déterminée par l'horloge de trame FC.
Pour chaque bloc de la parole, un ensemble de paramètres linéaires de codage de pointeur (LPC) est produit par l'analyseur de coefficient 110 Les coefficients de pointeur de court terme 160 (STP), les coefficients de pointeur de long terme 162 (LTP) et le facteur de gain d'excitation g 166 sont appliqués un multiplexeur 150 et sont envoyés sur le canal pour le synthétiseur de la parole Le vecteur d'entrée de la parole s(n) 158 est appliqué, de même, à un soustracteur 130 dont
la fonction sera ensuite décrite.
Le bloc de base de stockage de vecteur 114 contient un ensemble de M vecteurs de base Vm(n) dans lesquels 1 < m < M comprenant chacun N échantillons o 1 < N < N. Ces vecteurs de base sont utilisés par le générateur de matrice de codage 120 pour générer un ensemble de 2 M vecteurs d'excitation pseudo-aléatoires ui(n) o O < i < 2 m_ 1 Chacun des M vecteurs de base est constitué d'une série
d'échantillons blancs aléatoires de Gauss bien que d'autres types de vecteurs de base puissent être utilisés.
Le générateur de matrice de codage 120 utilise les M vecteurs de base Vm(n) et un ensemble de deux M mots de codage d'excitation Ii o O < i < 2 M-1 pour générer les 225 vecteurs d'excitation ui(n) Dans le présent mode de mise en oeuvre, chaque mot de codage Ii est égal à son index i, c'est-à-dire Ii = i Si le signal d'excitation est codé selon un taux de 0,25 bit par échantillon pour chacun des 40 échantillons (tel que M = 10), alors il y aura 10
vecteurs de base utilisés pour générer les 1024 vecteurs d'excitation.
Pour chaque vecteur individuel d'excitation ui(n), un vecteur reconstitué de la parole s'i(n) est généré pour être comparé au vecteur d'entrée de la parole s(n) Le bloc de gain 122 cadre le vecteur d'excitation ui(n) par le facteur de gain d'excitation gi qui est constant pour la trame Le signal d'excitation cadré gjui(n) 168 est alors filtré par le filtre de pointeur de long terme 124 et le filtre de pointeur de court terme 126 pour générer le vecteur reconstitué de la parole s'i(n) 170 Le filtre de pointeur de long terme 124 utilise les coefficients de pointeur de long terme 162 pour introduire la périodicité vocale et le filtre de pointeur de court terme 126 utilise les coefficients de pointeur de court terme pour introduire l'enveloppe spectrale Remarquons que les blocs 124 et 126 sont, en fait, des filtres récursifs contenant le pointeur de long terme et le pointeur de court terme dans leurs
circuits respectifs de rétroaction.
Le vecteur reconstitué de la parole s'i(n) 170 pour le ième vecteur de codage d'excitation est comparé au même bloc du vecteur d'entrée de la parole s(n) 158 en soustrayant ces deux signaux dans le soustracteur 130 Le vecteur de différence ei(n) 172 représente la différence entre les blocs d'origine et reconstitué de la parole Le vecteur de différence ei(n) 172 est pondéré par le filtre de pondération spectrale du bruit 132 à l'aide des coefficients de filtre de pondération spectrale du bruit25 164 générés par l'analyseur de coefficient 110 La pondération spectrale du bruit accentue les fréquences
auxquelles l'erreur est plus perceptible par l'oreille humaine et atténue les autres fréquences Un procédé plus efficace pour effectuer la pondération spectrale du bruit30 est l'objet de cette invention.
Un calculateur d'amplitude 134 calcule l'amplitude du vecteur de différence à pondération spectrale du bruit e'i(n) 174 et applique ce signal d'erreur Ei 176 à une commande de recherche de matrice de codage 140 La commande35 de recherche de matrice de codage 140 compare le ième
7 2702075
signal d'erreur pour le présent vecteur d'excitation ui(n) avec les signaux d'erreur précédents pour déterminer le
vecteur d'excitation produisant l'erreur pondérée minimale.
Le code du ième vecteur d'excitation possédant une erreur minimale est alors généré sur le canal comme meilleur code d'excitation I 178 En option, la commande de recherche 140 peut déterminer un mot de codage particulier fournissant un signal d'erreur présentant certains critères prédéterminés
tel que celui rencontrant un seuil d'erreur prédéterminé.
La Figure 2 représente un organigramme de processus illustrant la séquence globale des opérations de codage de la parole effectuées selon le premier mode de mise en
oeuvre de la présente invention illustré sur la Figure 1.
Le processus commence en 201 Le bloc de fonction 203
reçoit des données de la parole selon la description de la Figure 1 Le bloc de fonction 205 détermine les
coefficients de pointeur de court terme et de long terme. Cela est effectué dans l'analyseur de coefficient 110 de la Figure 1 Des procédés de détermination des coefficients de20 pointeur de court terme et de long terme sont contenus dans l'article intitulé " Codage par Pointeur de la Parole à Faibles Cadences Binaires ", Comm IEEE sur les Trans, Vol Com-30, pages 600-14, Avril 1982 par B S Atal Le pointeur de court terme A(z) est défini par les25 coefficients de l'équation suivante: A(z) = 1 az i= 1 Le bloc de fonction 207 génère un ensemble de coefficients provisoires de filtre de pondération spectrale du bruit caractérisant au moins un premier et un second30 ensemble de filtres Les filtres peuvent être d'un ordre quelconque, c-à-d le premier filtre est d'ordre F et le second filtre est d'ordre J o R < F + J Le mode de mise
8 2702075
en oeuvre préféré utilise deux filtres d'ordre J o J = P. Les filtres utilisant ces coefficients sont de la forme II(Z)= AlAZl o 1 2 a 2 2 a 3 2 o H(z), qui est un montage en cascade d'au moins un premier et un second ensemble de filtres d'ordre J, est défini comme filtre provisoire de pondération spectrale du bruit Remarquons que les coefficients du filtre provisoire de pondération spectrale du bruit dépendent des coefficients de pointeur de court terme générés dans le bloc de fonction 205 Ce filtre provisoire de pondération spectrale du bruit H(z) est directement utilisé dans des
mises en oeuvre de codeur de la parole précédents.
Afin de réduire la complexité de calcul due à la pondération spectrale du bruit, la réponse en fréquence de H(z) est modélisée par un seul filtre d'ordre R Hs(z) qui est le filtre combiné de pondération spectrale du bruit sous la forme Hl (Z) =R
1-1:az-
i= 1 Remarquons que bien que H,(z) soit illustré comme un filtre à pôle, Hs(z) peut être aussi conçu comme un filtre à valeur de zéro Le bloc de fonction 209 génère les coefficients du filtre H 5 (z) Le processus de génération des coefficients pour le filtre combiné de pondération spectrale du bruit est illustré de façon détaillée sur la25 Figure 3 Remarquons que le modèle à plusieurs pôles d'ordre R est d'un ordre inférieur au filtre provisoire de
pondération spectrale du bruit entraînant des économies de calcul.
9 2702075
Le bloc de fonction 211 fournit des vecteurs d'excitation en réponse à la réception des données de la
parole selon la description de la Figure 1 Le bloc de fonction 213 filtre les vecteurs d'excitation via les 5 filtres de pointeur de long terme 124 et de court terme
126. Le bloc de fonction 215 compare les vecteurs filtrés d'excitation générés par le bloc de fonction 213 et selon
la description de la Figure 1, formant un vecteur de10 différence Le bloc de fonction 217 filtre le vecteur de différence à l'aide des coefficients du filtre combiné de
pondération spectrale du bruit générés dans le bloc de fonction 209 pour former un vecteur de différence à pondération spectrale du bruit Le bloc de fonction 21915 calcul l'amplitude du vecteur de différence à pondération spectrale du bruit selon la description de la Figure 1 et
forme un signal d'erreur Le bloc de fonction 221 choisit un code d'excitation I à l'aide du signal d'erreur selon la description de la Figure 1 Le processus s'arrête en 223.
La Figure 3 est une illustration de l'organigramme du processus 300 décrivant les détails pouvant être utilisés dans la mise en oeuvre du bloc de fonction 209 de la Figure 2 Le processus commence en 301 Etant donné le filtre provisoire de pondération spectrale du bruit H(z), le bloc de fonction 303 génère une réponse d'impulsions h(z) de H(z) pour K échantillons o:
H(Z) = O
o:
0 < U < 1;
rzl P 1 Saf XZ i= 1
et o on trouve au moins deux termes de non annulation c-à-
d ai; a 2 avec ai > O et a 2 > O ou a 2 # a 3 avec a 2 > O et a 3 > O Le bloc de fonction 305 fait automatique correspondre la réponse d'impulsions h(n) formant une auto- corrélation de la forme: K-i Rhh(i) = i(n)h(n +i) n= 1 o O < i < R et R < K
Le bloc de fonction 307 calcule, à l'aide de l'auto-
corrélation et de la procédure récursive de Levinson, les coefficients de Hs(Z) qui est le filtre combiné de pondération spectrale du bruit de la forme:
_ 1
R f i= 1 La Figure 4 est un synoptique générique d'un second mode de mise en oeuvre d'un codeur de la parole selon la présente invention Le codeur de la parole 400 est similaire au codeur de la parole 100 à l'exception des différences expliquées ci-dessous Tout d'abord, le filtre de pondération spectrale du bruit 132 de la Figure 1 est20 remplacé par deux filtres précédant le soustracteur 430 sur la Figure 4 Ces deux filtres sont le filtrel de synthèse à pondération spectrale du bruit 468 et le filtre 2 de synthèse à pondération spectrale du bruit 426 Ensuite, ces filtres sont respectivement référencés comme filtrel et25 filtre 2 Le filtrel 468 et le filtre 2 426 diffèrent du filtre de pondération spectrale du bruit de la Figure 1 en ce que chacun comprend un filtre de synthèse de court terme et un filtre de synthèse pondéré de court terme en plus
11 2702075
d'un filtre de pondération spectrale du bruit Le filtre résultant est référencé, de façon générique, comme un filtre de synthèse à pondération spectrale du bruit De façon spécifique, il peut être mise en oeuvre comme filtre provisoire de synthèse à pondération spectrale du bruit ou comme un filtre de synthèse combiné à pondération spectrale du bruit Le filtrel 468 est précédé par un filtre d'inversion de court terme 470 De plus, le pointeur de
court terme 126 de la Figure 1 est éliminé de la Figure 4.
Le filtrel et le filtre 2 sont identiques sauf pour leurs positions respectives sur la Figure 4 Deux configurations
spécifiques de ces filtres sont illustrées sur les Figures 6 et 7.
L'analyseur de coefficient 410 génère des coefficients de pointeur de court terme 458, des coefficients de filtrel 460, des coefficients de filtre 2 462, des coefficients de pointeur de long terme 464 et un facteur de gain d'excitation g 466 Le procédé de génération des coefficients pour le filtrel et pour le20 filtre 2 est illustré sur la Figure 5 Le codeur de la parole 400 peut produire les mêmes résultats que le codeur
de la parole 100 tout en réduisant potentiellement le nombre de calculs nécessaires Alors, le codeur de la parole 400 peut être préféré au codeur de la parole 100 La25 description des blocs de fonction identiques, à la fois, dans le codeur de la parole 100 et le codeur de la parole
400 ne sera pas répétée pour plus d'efficacité.
La Figure 5 est un organigramme du processus illustrant le procédé de génération des coefficients pour HE(z) qui est le filtre de synthèse combiné à pondération spectrale du bruit Le processus commence en 501 Le bloc de fonction 503 génère les coefficients pour un filtre d'ordre P de pointeur de court terme A(z) Le bloc de fonction 505 génère des coefficients pour un filtre
12 2702075
provisoire de synthèse à pondération spectrale du bruit H(z) de la forme: H(z)= Al-l AlZl l l a 2 J ou: O < an < 1; la -Iaic 4 z' 0 1; 4 i= Pour un H(z), le bloc de fonction 509 génère des coefficients pour un filtre d'ordre R de synthèse combiné à pondération spectrale du bruit Hs(z) modélisant la réponse10 en fréquence du filtre H(z) Les coefficients sont générés par auto-correlation de la réponse d'impulsions h(z) de
H(z) et à l'aide d'un procédé récursif pour trouver les coefficients Le mode de mise en oeuvre préféré utilise le procédé récursif de Levinson qui est connu de l'homme de15 l'art moyen Le processus prend fin en 511.
Les Figures 6 et 7 illustrent respectivement la première et la seconde configurations pouvant être utilisée
dans le filtrel de synthèse pondérée 468 et le filtre 2 de synthèse pondérée 426 de la Figure 4.
Dans la configuration 1 de la Figure 6 A, le filtre 2 de synthèse pondérée 426 contient le filtre provisoire de synthèse à pondération spectrale du bruit H(z) qui est un montage en cascade de trois filtres Le filtre de synthèse de court terme pondéré par al, A(z/a 1) 611, le filtre25 d'inversion de court terme pondéré par a 2, 1/A(z/a 2) 613 et le filtre de synthèse de court terme pondéré par a 3, A(z/a 3) 615 o O < a 3 < a 2 < a 1 < 1 Le filtrel de synthèse pondérée 468 de la Figure 6 A est identique au filtre 2 de
13 2702075
synthèse pondérée 426 à l'exception du fait qu'il est précédé par un filtre d'inversion de court terme 1/A(z) 603
et qu'il est placé dans le circuit d'entrée de la parole.
H(z) est, dans ce cas, un montage en cascade des filtres 605, 607 et 609. Sur la Figure 6 B, le filtre provisoire de synthèse à pondération spectrale du bruit H(z) 468 et 426 est remplacé par un seul filtre de synthèse combiné à pondération spectrale du bruit H,(z) 619 et 621 Hs(z) modélise la réponse en fréquence de H(z) qui est un montage en cascade des filtres 605, 607 et 609 ou, de façon équivalente, des filtres 611, 613 et 615 sur la Figure 6 A Les détails de la génération des coefficients du filtre H,(z) sont exposés
sur la Figure 5.
La configuration 2 de la Figure 7 A est un cas particulier de la configuration 1 o a 3 O Le f iltre 2 de
synthèse pondérée 426 contient le filtre provisoire de synthèse à pondération spectrale du bruit H(z) qui est un montage en cascade de deux filtres: le filtre de synthèse20 de court terme pondéré par a,, A(z/al) 729 et le filtre d'inversion de court terme pondéré par a 2, 1/A(z/a 2) 731.
Le filtrel de synthèse pondérée 468 de la Figure 7 A est identique au filtre 2 de synthèse pondérée 426 excepté le fait qu'il est précédé d'un filtre d'inversion de court25 terme 1/A(z) 703 et qu'il est placé dans le circuit d'entrée de la parole H(z) est, dans ce cas, un montage en
cascade des filtres 725 et 727.
Sur la Figure 7 B, le filtre provisoire de synthèse à pondération spectrale du bruit H 1 (z) 468 et 426 de la Figure 7 A est remplacé par un seul filtre de synthèse combiné à pondération spectrale du bruit Hs(z) 719 et 721 HS(z) modélise la réponse en fréquence de H(z) qui est un montage en cascade des filtres 725 et 727 ou, de façon équivalente, des filtres 729 et 731 de la Figure 7 A Les détails de génération des coefficients de filtre H,(z) se trouvent sur
la Figure 5.
La génération du filtre combiné de pondération spectrale du bruit, à partir du filtre provisoire de pondération spectrale du bruit de la forme décrite, crée un filtre efficace remplissant la commande de deux ou de plusieurs filtres d'ordre J sans la complexité d'un filtre d'ordre R Cela fournit un filtre plus efficace sans l'augmentation correspondante de la complexité du codeur de10 la parole De la même façon, la génération du filtre de synthèse combiné à pondération spectrale du bruit à partir du filtre provisoire de synthèse à pondération spectrale du bruit de la forme décrite crée un filtre efficace présentant la commande d'un filtre d'ordre P et d'un ou de15 plusieurs filtres d'ordre J combinés en un filtre d'ordre R Cela fournit un filtre plus efficace sans l'augmentation
correspondante de la complexité du codeur de la parole.

Claims (4)

REVEND Ie ATIONS
1 Procédé de codage de la paro 2702075 térse par les étapes suivantes: la récetssion ( 203) des données de la parole; la constitution ( 211) de vecteur d'excitation en rép Donse à ladite étape de rêo on; la détermination ( 205) de coefficients de pointelur de court terme et de long terme pour une utilisation par un filtre de pointeur de long terme et de court terme d'ordre P; le filtrage ( 213) desdits vecteurs d'excitation à l'aide dudit filtre de pointeur de long terme et dudit filtre de pointeur de court terme, formant des vecteurs d'excitation filtrés; la détermination des coefficients pour un filtre de pondération spectrale du bruit comprenant les étapes suivantes: la génération ( 207) d'un filtre provisoire de
pondération spectrale du bruit ccmprenant un premier f-i-'-
d'ordre F et un second filtre d'ordre J selon lesdits coefficients de filtre de court terme d'ordre P; et la génération ( 209) des coefficients de Pondération spectrale du bruit à l'aide d'un modèle à plusieurs pôles d'ordre R dudit filtre provisoire de pond Sration spectrale du bruit o R < F + J; la comparaison ( 215) desdits vecteurs d'excitation filtrés avec lesdites données de la parole reçues pour former un vecteur de différence; le filtrage ( 217) dudit vecteur de difference à l'aide d'un filtre selon lesdits coefficients de filtre de pondération spectrale du bruit pour former un vecteur de différence; le calcul ( 217) de l'amplitude dudit vecteur de 0 différence filtré pour former un signal d'erreur; et le choix ( 221) d'un code d'excitation I à l'aide du signal d'erreur représentant les données de la parole recues.
2 Procédé de codage de la parole selon la revendication 1, selon lequel ladite étape de génération ( 209) des coefficients de pondération spectrale du bruit est caractérisée, de plus, par les étapes suivantes: la génération ( 303) d'une réponse d'impulsions du filtre provisoire de pondération spectrale du bruit; l'auto-corrélation ( 305) de ladite réponse d'impulsions formant une auto-corrélation Rhh(i); et le calcul ( 307) des coefficients d'un modèle à plusieurs poles d'ordre R à l'aide du procédé récursif et de l'auto-corrélation.
3 Procédé de codage de la parole selon la revendication 2, caractérisé en ce que ledit procédé récursif est un
procédé récursif de Levinson.
4 Procédé de codage de la parole, caractérisé par les étapes suivantes la réception des données de la parole; la constitution de vecteurs d'excitation; la génération de coefficients de filtre pour un filtre combiné de pondération spectrale du bruit et de court terme comprenant les étapes suivantes: la génération d'un filtre de court terme d'ordre P; la génération d'un filtre provisoire de pondération spectrale du bruit comprenant un premier filtre d'ordre F et un second filtre d'ordre J, chaque filtre dépendant dudit filtre de court terme d'ordre P; et la génération de coefficients pour un filtre combiné de court terme et de pondération spectrale du bruit à plusieurs pôles d'ordre R à lt'aide dudit filtre de court terme d'ordre P et dudit filtre provisoire de pondération spectrale du bruit o R < P + F + J; le filtrage desdites données de la parole reçues; le filtrage desdits vecteurs d'excitation à l'aide d'un filtre de pointeur de long terme et dudit filtre combiné de court terme et de pondération spectrale du bruit pour former des vecteurs d'excitation filtrés; la comparaison desdits vecteurs d'excitation filtrés avec lesdites données de la parole revues et filtrées pour former un vecteur de différence; le calcul de l'amplitude dudit vecteur de différence pour former un signal d'erreur; et le choix à l'aide du signal d'erreur d'un code d'excitation I représentant les données de la parole reçues. no Procédé de codage de la parole selon la revendication 4, selon lequel ladite étape de génération des coefficients pour un filtre combiné de court terme et de pondération spectrale du bruit à plusieurs pôles d'ordre R, procédé caractérisé, de plus, par les étapes suivantes: la génération ( 303) de la réponse d'impulsions du filtre provisoire de pondération spectrale du bruit; l'auto-corrélation ( 305) de ladite réponse d'impulsions pour former une auto-corrélation Rhh(i); et le calcul ( 307)des coefficients du filtre à plusieurs pôles d'ordre R à l'aide d'un procédé récursif et
de l'auto-corrélation.
FR9401450A 1993-02-23 1994-02-09 Procede de generation d'un filtre de ponderation spectrale du bruit dans un codeur de la parole. Expired - Lifetime FR2702075B1 (fr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/021,364 US5434947A (en) 1993-02-23 1993-02-23 Method for generating a spectral noise weighting filter for use in a speech coder

Publications (2)

Publication Number Publication Date
FR2702075A1 true FR2702075A1 (fr) 1994-09-02
FR2702075B1 FR2702075B1 (fr) 1996-04-26

Family

ID=21803778

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9401450A Expired - Lifetime FR2702075B1 (fr) 1993-02-23 1994-02-09 Procede de generation d'un filtre de ponderation spectrale du bruit dans un codeur de la parole.

Country Status (11)

Country Link
US (2) US5434947A (fr)
JP (2) JP3070955B2 (fr)
CN (1) CN1074846C (fr)
AU (1) AU669788B2 (fr)
BR (1) BR9404230A (fr)
CA (1) CA2132006C (fr)
DE (2) DE4491015T1 (fr)
FR (1) FR2702075B1 (fr)
GB (1) GB2280828B (fr)
SE (1) SE517793C2 (fr)
WO (1) WO1994019790A1 (fr)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5708756A (en) * 1995-02-24 1998-01-13 Industrial Technology Research Institute Low delay, middle bit rate speech coder
EP0763818B1 (fr) * 1995-09-14 2003-05-14 Kabushiki Kaisha Toshiba Procédé et filtre pour accentuer des formants
US5963899A (en) * 1996-08-07 1999-10-05 U S West, Inc. Method and system for region based filtering of speech
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search
GB2352949A (en) * 1999-08-02 2001-02-07 Motorola Ltd Speech coder for communications unit
US6801931B1 (en) * 2000-07-20 2004-10-05 Ericsson Inc. System and method for personalizing electronic mail messages by rendering the messages in the voice of a predetermined speaker
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US7337110B2 (en) * 2002-08-26 2008-02-26 Motorola, Inc. Structured VSELP codebook for low complexity search
WO2004027754A1 (fr) * 2002-09-17 2004-04-01 Koninklijke Philips Electronics N.V. Procede de synthese d'un signal vocal non voise
EP1513137A1 (fr) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Système de traitement de la parole à excitation à impulsions multiples
WO2006079348A1 (fr) * 2005-01-31 2006-08-03 Sonorit Aps Procede de generation de trames de masquage dans un systeme de communication
US8725506B2 (en) * 2010-06-30 2014-05-13 Intel Corporation Speech audio processing
WO2012000882A1 (fr) 2010-07-02 2012-01-05 Dolby International Ab Post-filtre de basses sélectif
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
JP6077166B2 (ja) * 2016-07-10 2017-02-08 有限会社技研産業 放射線遮蔽材料及び放射線遮蔽建材

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0415675A2 (fr) * 1989-09-01 1991-03-06 AT&T Corp. Codage utilisant une excitation stochastique soumise à des limitations
US5125030A (en) * 1987-04-13 1992-06-23 Kokusai Denshin Denwa Co., Ltd. Speech signal coding/decoding system based on the type of speech signal

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL188189C (nl) * 1979-04-04 1992-04-16 Philips Nv Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
JPH0738119B2 (ja) * 1986-07-30 1995-04-26 日本電気株式会社 音声波形符号復号化装置
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
JPH04207410A (ja) * 1990-11-30 1992-07-29 Canon Inc デジタルフイルタ装置
JPH06138896A (ja) * 1991-05-31 1994-05-20 Motorola Inc 音声フレームを符号化するための装置および方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5125030A (en) * 1987-04-13 1992-06-23 Kokusai Denshin Denwa Co., Ltd. Speech signal coding/decoding system based on the type of speech signal
EP0415675A2 (fr) * 1989-09-01 1991-03-06 AT&T Corp. Codage utilisant une excitation stochastique soumise à des limitations

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
B.S. ATAL: "Predictive coding of speech at low bit rates", IEEE TRANSACTIONS ON COMMUNICATIONS, vol. 30, no. 4, April 1982 (1982-04-01), pages 600 - 614 *
I.S. DEDES ET AL.: "Variable bit rate adaptive predictive coder", IEEE TRANSACTIONS ON SIGNAL PROCESSING, vol. 40, no. 3, March 1992 (1992-03-01), NEW YORK, pages 511 - 517 *
V.IYENGAR ET AL.: "A low delay 16 kbits/sec speech coder", ICASSP 88, vol. 1, 11 April 1988 (1988-04-11), NEW YORK, pages 243 - 246 *

Also Published As

Publication number Publication date
GB2280828A (en) 1995-02-08
DE4491015C2 (de) 1996-10-24
GB9420077D0 (en) 1994-11-23
AU6125594A (en) 1994-09-14
JP2000155597A (ja) 2000-06-06
JP3070955B2 (ja) 2000-07-31
SE9403630L (sv) 1994-12-21
DE4491015T1 (de) 1995-09-21
GB2280828B (en) 1997-07-30
FR2702075B1 (fr) 1996-04-26
CA2132006A1 (fr) 1994-09-01
US5434947A (en) 1995-07-18
SE517793C2 (sv) 2002-07-16
AU669788B2 (en) 1996-06-20
CA2132006C (fr) 1998-04-28
US5570453A (en) 1996-10-29
WO1994019790A1 (fr) 1994-09-01
CN1074846C (zh) 2001-11-14
SE9403630D0 (sv) 1994-10-24
JP3236592B2 (ja) 2001-12-10
BR9404230A (pt) 1999-06-15
JPH07506202A (ja) 1995-07-06
CN1104010A (zh) 1995-06-21

Similar Documents

Publication Publication Date Title
FR2702075A1 (fr) Procédé de génération d&#39;un filtre de pondération spectrale du bruit dans un codeur de la parole.
EP0608174B1 (fr) Systeme de codage-décodage prédictif d&#39;un signal numérique de parole par transformée adaptative à codes imbriqués
US5903866A (en) Waveform interpolation speech coding using splines
EP0749626B1 (fr) Procede de codage de parole a prediction lineaire et excitation par codes algebriques
JPH11249698A (ja) 音声音楽信号の符号化装置および復号装置
FR2706064A1 (fr) Procédé et dispositif de quantitication vectorielle.
EP0865029B1 (fr) Interpolation de formes d&#39;onde par décomposition en bruit et en signaux périodiques
JP3268360B2 (ja) 改良されたロングターム予測器を有するデジタル音声コーダ
EP0428445B1 (fr) Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit
EP1385150B1 (fr) Procédé et dispositif pour la caractérisation des signaux audio transitoires
EP0195441B1 (fr) Procédé de codage à faible débit de la parole à signal multi-impulsionnel d&#39;excitation
EP2652735B1 (fr) Codage perfectionne d&#39;un etage d&#39;amelioration dans un codeur hierarchique
EP0616315A1 (fr) Dispositif de codage et de décodage numérique de la parole, procédé d&#39;exploration d&#39;un dictionnaire pseudo-logarithmique de délais LTP, et procédé d&#39;analyse LTP
JP3462464B2 (ja) 音声符号化方法、音声復号化方法及び電子装置
JPH0738116B2 (ja) マルチパルス符号化装置
WO2011144863A1 (fr) Codage avec mise en forme du bruit dans un codeur hierarchique
EP1605440A1 (fr) Procédé de séparation de signaux sources à partir d&#39;un signal issu du mélange
EP0734013B1 (fr) Determination d&#39;un vecteur d&#39;excitation dans un codeur CELP
EP1192619B1 (fr) Codage et decodage audio par interpolation
JP4007730B2 (ja) 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体
JP2003029798A (ja) 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体
FR2709366A1 (fr) Procédé de stockage de vecteurs de coefficient de réflexion.
FR2737360A1 (fr) Procedes de codage et de decodage de signaux audiofrequence, codeur et decodeur pour la mise en oeuvre de tels procedes
EP0454552A2 (fr) ProcédÀ© et dispositif de codage bas débit de la parole
EP0596785A1 (fr) Procédé de discrimination de la parole en présence de bruits ambiants et vocodeur à faible débit pour la mise en oeuvre du procédé

Legal Events

Date Code Title Description
TP Transmission of property