FR2729245A1 - Procede de codage de parole a prediction lineaire et excitation par codes algebriques - Google Patents
Procede de codage de parole a prediction lineaire et excitation par codes algebriques Download PDFInfo
- Publication number
- FR2729245A1 FR2729245A1 FR9500133A FR9500133A FR2729245A1 FR 2729245 A1 FR2729245 A1 FR 2729245A1 FR 9500133 A FR9500133 A FR 9500133A FR 9500133 A FR9500133 A FR 9500133A FR 2729245 A1 FR2729245 A1 FR 2729245A1
- Authority
- FR
- France
- Prior art keywords
- sep
- integer
- excitation
- pulse
- posi
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005284 excitation Effects 0.000 title claims abstract description 52
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000008569 process Effects 0.000 title description 4
- 239000011159 matrix material Substances 0.000 claims abstract description 43
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 28
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 28
- 230000004044 response Effects 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 33
- 238000004364 calculation method Methods 0.000 claims description 27
- 230000003247 decreasing effect Effects 0.000 claims description 14
- 238000009825 accumulation Methods 0.000 claims description 13
- 238000007792 addition Methods 0.000 claims description 5
- 239000002131 composite material Substances 0.000 claims description 2
- 238000011002 quantification Methods 0.000 claims 1
- 230000015654 memory Effects 0.000 description 24
- 238000012360 testing method Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 10
- 230000007774 longterm Effects 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 8
- 230000036961 partial effect Effects 0.000 description 7
- 230000001934 delay Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000566613 Cardinalis Species 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
- G10L2019/0008—Algebraic codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
- G10L2019/0014—Selection criteria for distances
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Le procédé utilise la technique de codage CELP à répertoire algébrique. La recherche de l'excitation CELP comporte un calcul de certaines composantes de la matrice de covariance U = H**T.H où H désigne une matrice triangulaire inférieure de Toeplitz formée à partir de la réponse impulsionnelle d'un filtre composé de filtres de synthèse et d'un filtre de pondération perceptuelle. Les composantes mémorisées de la matrice de covariance sont seulement celles de la forme U(posi,p , posi,p ), et celles de la forme U(posi,p , posj,q ), posi,p ), posj,q , désignant respectivement la position i et la position j pour les impulsions p et q dans les codes du répertoire algébrique.
Description
PROCEDE DE CODAGE DE PAROLE A PREDICTION LINEAIRE
ET EXCITATION PAR CODES ALGEBRIQUES
La présente invention concerne un procédé de codage numérique, en particulier de signaux de parole.
ET EXCITATION PAR CODES ALGEBRIQUES
La présente invention concerne un procédé de codage numérique, en particulier de signaux de parole.
Une des meilleures méthodes actuelles de compression des signaux pour réduire le débit tout en maintenant une bonne qualité est la technique de prédiction linéaire à excitation par codes CELP (Code Excited Linear Prediction).
Ce type de codage est largement utilisé, essentiellement dans des systèmes de transmission par voie terrestre ou satellite, ou dans des applications de stockage. Toutefois, la première génération de codeurs CELP qui utilisait des répertoires stochastiques était très complexe à mettre en oeuvre et nécessitait de grandes capacités de mémoire. Une deuxième génération de codeurs CELP est alors apparue : les codeurs
CELP à répertoire algébrique. Ils sont moins complexes à mettre en oeuvre et nécessitent moins de mémoire, mais les gains sont encore insuffisants.
CELP à répertoire algébrique. Ils sont moins complexes à mettre en oeuvre et nécessitent moins de mémoire, mais les gains sont encore insuffisants.
La technologie du codage CELP à répertoire algébrique a encore été améliorée par l'introduction des codeurs ACELP (Algebraic Code Excited Linear Prediction) qui utilisent un répertoire algébrique associé à une recherche focalisée à seuils adaptatifs permettant d'ajuster la complexité du calcul. Cependant, la quantité de mémoire vive requise reste encore importante.
Les codeurs CELP appartiennent à la famille des codeurs à analyse par synthèse, dans lesquels on utilise le modèle de synthèse au codeur. Les signaux à coder peuvent être échantillonnés à la fréquence téléphonique (Fe=8kHz) ou une fréquence plus élevée, par exemple à 16 kHz pour le codage en bande élargie (bande passante de O à 7 kHz). Selon l'application et la qualité désirée, le taux de compression varie de 1 à 16 : les codeurs CELP fonctionnent à des débits de 2 à 16 kbit/s en bande téléphonique, et à des débits de 16 à 32 kbit/s en bande élargie.
Dans un codeur numérique de type CELP, le signal de parole est échantillonné et converti en une suite de trames de L échantillons. Chaque trame est synthétisée en filtrant une forme d'onde extraite d'un répertoire (appelé aussi dictionnaire), multipliée par un gain, à travers deux filtres variant dans le temps. Le répertoire d'excitation est un ensemble de K codes ou formes d'ondes de L échantillons. Les formes d'ondes sont numérotées par un index entier k, k allant de O à K-l, K étant la taille du répertoire. Le premier filtre est le filtre de prédiction à long terme. Une analyse 'LTP' (Long Term Prediction) permet d'évaluer les paramètres de ce prédicteur à long terme et ainsi d'exploiter la périodicité des sons voisés (par exemple : les voyelles) cette corrélation à long terme est due à la vibration des cordes vocales.Le second filtre est le filtre de prédiction à court terme. Les méthodes d'analyse par prédiction linéaire "LPC" (Linear Prediction Coding) permettent d'obtenir ces paramètres de prédiction à court terme, représentatifs de la fonction de transfert du conduit vocal et caractéristiques du spectre du signal. Le procédé utilisé pour déterminer la séquence d'innovation est la méthode d'analyse par synthèse : au codeur, toutes les séquences d'innovation du répertoire d'excitation sont filtrées par les deux filtres LTP et LPC, et la forme d'onde sélectionnée est celle produisant le signal synthétique le plus proche du signal de parole original selon un critère de pondération perceptuelle.
Dans un codeur CELP, l'excitation du modèle de synthèse est donc constituée par des formes d'ondes extraites d'un répertoire. Selon le type de ce répertoire, on distingue deux sortes de codeurs CELP. Les répertoires des premiers codeurs CELP étaient constitués de formes d'ondes stochastiques. Ces répertoires sont obtenus soit par apprentissage soit par génération aléatoire. Leur inconvénient majeur est leur manque de structure qui nécessite de les stocker et entraîne une complexité de mise en oeuvre élevée. Le répertoire d'excitation du premier codeur CELP était un dictionnaire stochastique, composé d'un ensemble de 1024 formes d'ondes de 40 échantillons gaussiens.
Ce codeur CELP ne fonctionnait pas en temps réel sur les calculateurs les plus puissants de l'époque. D'autres dictionnaires stochastiques permettant de diminuer et la mémoire et le temps de calcul nécessaires ont été introduits ; cependant, tant la complexité que la capacité de mémoire requise restaient importantes.
Pour remédier à cet inconvénient, une autre catégorie de répertoires a été proposée : les répertoires algébriques fortement structurés qui n'ont pas besoin d'être stockés et dont la structure permet de développer des algorithmes rapides pour leur mise en oeuvre. A. Gersho, dans son article Avances in Speech and Audio Compression1 (Proc.IEEE,
Vol.82, N06, Juin 1994, pages 900-918), a présenté une bonne synthèse des travaux en codage CELP et établit un inventaire des différents répertoires proposés dans la littérature. Un des codeurs CELP utilisant un répertoire algébrique est le codeur ACELP.
Vol.82, N06, Juin 1994, pages 900-918), a présenté une bonne synthèse des travaux en codage CELP et établit un inventaire des différents répertoires proposés dans la littérature. Un des codeurs CELP utilisant un répertoire algébrique est le codeur ACELP.
Les codeurs ACELP (voir WO 91/13432) ont été proposés comme candidats à plusieurs normalisations: normalisation UIT (Union Internationale des Télécommunications) à 8kbit/s, normalisation UIT pour la visiophonie RTC à 6,8 kbit/s-5,4 kbit/s. Les modules de prédiction à court terme, d'analyse
LTP et de pondération perceptuelle sont similaires à ceux utilisés dans un codeur CELP classique. L'originalité du codeur ACELP réside dans le module de recherche du signal d'excitation. Le codeur ACELP présente deux intérêts majeurs : une grande flexibilité en débit et une complexité de mise en oeuvre ajustable. La flexibilité en débit provient de la méthode de génération du répertoire. La possibilité de régler la complexité est due à la procédure de sélection de la forme d'onde qui utilise une recherche focalisée à seuils adaptatifs.
LTP et de pondération perceptuelle sont similaires à ceux utilisés dans un codeur CELP classique. L'originalité du codeur ACELP réside dans le module de recherche du signal d'excitation. Le codeur ACELP présente deux intérêts majeurs : une grande flexibilité en débit et une complexité de mise en oeuvre ajustable. La flexibilité en débit provient de la méthode de génération du répertoire. La possibilité de régler la complexité est due à la procédure de sélection de la forme d'onde qui utilise une recherche focalisée à seuils adaptatifs.
Dans un codeur ACELP, le répertoire d'excitation est un ensemble virtuel (dans le sens où il n'est pas stocké), généré algébriquement. Le générateur de codes algébriques produit en réponse à un index k, k variant de 0 à K-1, un vecteur code de L échantillons ayant très peu de composantes non nulles. Soit N le nombre de composantes non nulles. Dans certaines applications, la dimension des mots de code est étendue à L+N, et les N dernières composantes sont nulles.
On suppose ici, sans affecter la généralité de l'exposé, que
L est un multiple de N. Les mots de code ck sont donc composés de N impulsions. Les amplitudes des impulsions sont fixes (par exemple #1). Les positions autorisées pour l'impulsion p sont de la forme
posi,p = Ni + p (1) i allant de 0 à L'-l, où L'= L/N. Dans le cas où L'=(L+N)/N, la position peut être supérieure ou égale à L, et l'impulsion correspondante est alors simplement annulée. L'index de la forme d'onde ck est obtenu de manière directe par la relation
et la taille du répertoire est de : K = (L')N.
L est un multiple de N. Les mots de code ck sont donc composés de N impulsions. Les amplitudes des impulsions sont fixes (par exemple #1). Les positions autorisées pour l'impulsion p sont de la forme
posi,p = Ni + p (1) i allant de 0 à L'-l, où L'= L/N. Dans le cas où L'=(L+N)/N, la position peut être supérieure ou égale à L, et l'impulsion correspondante est alors simplement annulée. L'index de la forme d'onde ck est obtenu de manière directe par la relation
et la taille du répertoire est de : K = (L')N.
La sélection d'une forme d'onde dans un répertoire
CELP s'effectue en recherchant celle qui minimise l'erreur quadratique entre le signal original pondéré et le signal synthétique pondéré. Ceci revient à maximiser la quantité Crk=Pk2 /ak2, où Pk= ( D.ckT), et ak2=|ck.HT|2 =(ck.U.ckT), et (.)T désigne la transposition matricielle. D est un vecteurcible qui dépend du signal d'entrée, du signal synthétique passé et du filtre composé des filtres de synthèse et de pondération perceptuelle. Soit h le vecteur de la réponse impulsionnelle de ce filtre composé
h = (h(0) ,h(l) h(L-l)
H est la matrice LxL triangulaire inférieure de Toeplitz formée à partir de cette réponse impulsionnelle.U = HT.H est la matrice de covariance de h. En notant U(i,j) l'élément de la matrice U à la ligne i et à la colonne j (0Si,j < L), l'élément U(i,j) est égal à
CELP s'effectue en recherchant celle qui minimise l'erreur quadratique entre le signal original pondéré et le signal synthétique pondéré. Ceci revient à maximiser la quantité Crk=Pk2 /ak2, où Pk= ( D.ckT), et ak2=|ck.HT|2 =(ck.U.ckT), et (.)T désigne la transposition matricielle. D est un vecteurcible qui dépend du signal d'entrée, du signal synthétique passé et du filtre composé des filtres de synthèse et de pondération perceptuelle. Soit h le vecteur de la réponse impulsionnelle de ce filtre composé
h = (h(0) ,h(l) h(L-l)
H est la matrice LxL triangulaire inférieure de Toeplitz formée à partir de cette réponse impulsionnelle.U = HT.H est la matrice de covariance de h. En notant U(i,j) l'élément de la matrice U à la ligne i et à la colonne j (0Si,j < L), l'élément U(i,j) est égal à
Dans un codeur ACELP, si la forme d'onde ck est composée de N impulsions de positions posi(q,k),q et d'amplitude Sq (Osq < N), le produit scalaire Pk du vecteurcible D avec une forme d'onde ck et l'énergie ak2 de la forme d'onde filtrée Cfr ont pour expression
Un des avantages du répertoire ACELP est qu'il donne lieu à une méthode sous-optimale efficace de sélection de la meilleure forme d'onde. Cette recherche s'effectue en imbriquant les boucles de recherche des impulsions.Pour une boucle d'ordre q, l'indice iq=(posi,q-q)/N codant la position varie dans l'ensemble [0,. .,L-1]. On accélère l'exploration en calculant avant d'entrer dans la procédure de recherche un seuil adaptatif pour chaque boucle. On n'entre dans la boucle de recherche de l'impulsion q que si une quantité partielle Crk(q-1). calculée à partir des impulsions 0 à q-1 précédemment déterminées dans les boucles supérieures, dépasse un seuil calculé pour la boucle q-1. La quantité partielle peut être : Crk(q-1)=Pk(q-1)/αk(q-1) ou Crk(q-1)=Pk(q-1), où ak2 (q-i) est l'énergie de la forme d'onde composée des impulsions 0 à q-l de ck filtrée, et Pk(q-1) est le produit scalaire du vecteur-cible D avec la forme d'onde composée des impulsions 0 à q-l de ck.
Le calcul des critères partiels est simplifié par le caractère récursif de Pk(q) et ak2 (q). En effet, les suites [Pk(q)]q=0,...,N-1 et [α]k(q)q=0,...,N-1 récurrence de la manière suivante
Pk(0)=S0.D(posi(o,k),o) et Pk(q)=Pk(q-1)+Sq.D(posi(q,k),q) αk(0)=S0.U(opsi(o,k),o, posi(o,k),o et
Pk(0)=S0.D(posi(o,k),o) et Pk(q)=Pk(q-1)+Sq.D(posi(q,k),q) αk(0)=S0.U(opsi(o,k),o, posi(o,k),o et
où posi(p,k),p est la position de la p-ième impulsion de ck et Sp son amplitude. L'énergie αk de la forme d'onde Ck filtrée et le produit scalaire Pk de ck avec le vecteurcible D sont obtenus à l'issue de la récurrence (q=N-l).
Le calcul des K suites {αk(q)}q=0,...N-1, pour k variant de 0 à K-l, nécessite de connaître des éléments de la matrice U de covariance de la réponse impulsionnelle h du filtre composé. Dans le codeur ACELP antérieur, tous les éléments U(i,j) de la matrice U sont calculés et stockés. La matrice U possède les propriétés suivantes qui sont utilisées lors du calcul de ses L2 éléments
- propriété de symétrie :
U(i,j) = U(j,i), pour 0#i,j < L
- propriété de récurrence sur les diagonales
U(i-l,j-l)=U(i,j)+h(L-i).h(L-j), pour 0 < i,j < L
et U(i,L-1)=h(0).h(L-1-i), pour OSi < L
Cependant, un calcul de la matrice U exploitant au maximum ces deux propriétés nécessite encore
.L(L+1)/2 multiplications et L(L-1)/2 additions,
72 chargements en mémoire.
- propriété de symétrie :
U(i,j) = U(j,i), pour 0#i,j < L
- propriété de récurrence sur les diagonales
U(i-l,j-l)=U(i,j)+h(L-i).h(L-j), pour 0 < i,j < L
et U(i,L-1)=h(0).h(L-1-i), pour OSi < L
Cependant, un calcul de la matrice U exploitant au maximum ces deux propriétés nécessite encore
.L(L+1)/2 multiplications et L(L-1)/2 additions,
72 chargements en mémoire.
En conclusion, la technique ACELP nécessite un grand nombre de chargements en mémoire et une mémoire de taille importante. I1 faut en effet stocker :
- le signal d'entrée (typiquement 80 à 360 mots de 16 bits),
- la matrice de covariance (402 à 602 mots de 16 bits),
- les signaux intermédiaires et leurs mémoires (typiquement 2 à 3K mots de 16 bits),
- le signal de sortie (typiquement 80 à 200 mots ou octets).
- le signal d'entrée (typiquement 80 à 360 mots de 16 bits),
- la matrice de covariance (402 à 602 mots de 16 bits),
- les signaux intermédiaires et leurs mémoires (typiquement 2 à 3K mots de 16 bits),
- le signal de sortie (typiquement 80 à 200 mots ou octets).
Il apparaît clairement que la taille de la matrice de covariance occupe une place prépondérante. On note que, pour une application donnée, 1 ' espace mémoire nécessaire pour les signaux intermédiaires est incompressible ; si on veut réduire la taille mémoire globale, il semble donc qu'il ne soit possible que de jouer sur la taille de la mémoire nécessaire à la matrice de covariance. Or, jusqu'à présent, les experts savaient que cette matrice était symétrique par rapport à la diagonale principale et que certains termes n'étaient pas utiles, mais ils pensaient que ces derniers étaient disposés dans la matrice sans un ordre déterminé.
Une première idée pour diminuer l'espace mémoire nécessaire pour la matrice de covariance reposait sur lexploi- tation de la propriété de symétrie de cette matrice. Mais, l'expérience a montré que le stockage de la demi-matrice entraîne des calculs d'adresse plus compliqués lors de la recherche de l'excitation ACELP, module déjà très complexe (50% du temps CPU typiquement). Le gain en mémoire perdait alors tout intérêt face à l'augmentation de la complexité.
Un but principal de la présente invention est de proposer un procédé de codage de type ACELP qui réduise notablement la taille de la mémoire nécessaire au codeur.
L'invention propose ainsi un procédé de codage de parole à prédiction linéaire et excitation par codes (CELP), dans lequel on numérise un signal de parole en trames successives de L échantillons, on détermine de manière adaptative d'une part des paramètres de synthèse définissant des filtres de synthèse, et d'autre part des paramètres d'excitation incluant pour chaque trame des positions d'impulsions d'un code d'excitation de L échantillons appartenant à un répertoire algébrique prédéterminé et un gain d'excitation associé, et on transmet des valeurs de quantification représentatives des paramètres déterminés.Le répertoire algébrique est défini à partir d'au moins un groupe de N ensembles de positions d'impulsion possibles dans des codes d'au moins L échantillons, un code du répertoire étant représenté par N positions d'impulsion appartenant respectivement aux N ensembles d'un groupe. La détermination des paramètres d'excitation relatifs à une trame comporte la sélection d'un code du répertoire qui maximise la quantité Pk2/ak2 dans laquelle Pk= D.ckT désigne le produit scalaire entre le code ck du répertoire et un vecteur cible D dépendant du signal de parole de la trame et des paramètres de synthèse, et ak2 désigne l'énergie sur la trame du code Ck filtré par un filtre composé des filtres de synthèse et d'un filtre de pondération perceptuelle. Le calcul des énergies ak2 comporte un calcul et une mémorisation de composantes d'une matrice de covariance U = HT.H où H désigne une matrice triangulaire inférieure de Toeplitz à L lignes et L colonnes formée à partir de la réponse impulsionnelle h(O), h(1) , . ., h < L-1) dudit filtre composé. Les composantes mémorisées de la matrice de covariance sont seulement, pour au moins un groupe de N ensembles, celles de la forme
avec OSp < N et celles de la forme
avec OSp < q < N, Posiez et posj,q désignant respectivement les positions d'ordre i et j dans les ensembles dudit groupe contenant des positions possibles pour les impulsions p et q des codes du répertoire.
avec OSp < N et celles de la forme
avec OSp < q < N, Posiez et posj,q désignant respectivement les positions d'ordre i et j dans les ensembles dudit groupe contenant des positions possibles pour les impulsions p et q des codes du répertoire.
De cette façon, on ne stocke que les termes effectivement utilisés lors de la recherche de l'excitation ACELP, ce qui permet de réduire considérablement la mémoire nécessaire. Par exemple, dans le cas où le répertoire algébrique a la structure (1) définie ci-dessus avec un seul groupe de
N ensembles, le nombre d'éléments de la matrice U à stocker et de L+L2 (N-l)/2N au lieu de L2 dans le cas du codeur ACELP antérieur, de sorte que la réduction d'espace mémoire est de tL2(N+1)/2N]-L mots de mémoire vive, soit plusieurs kilooctets pour les valeurs habituelles de L et N.
N ensembles, le nombre d'éléments de la matrice U à stocker et de L+L2 (N-l)/2N au lieu de L2 dans le cas du codeur ACELP antérieur, de sorte que la réduction d'espace mémoire est de tL2(N+1)/2N]-L mots de mémoire vive, soit plusieurs kilooctets pour les valeurs habituelles de L et N.
De préférence, les composantes mémorisées de la matrice de covariance sont structurées, pour un groupe, sous la forme de N vecteurs de corrélations et N(N-1)/2 matrices de corrélations. Chaque vecteur de corrélations Rp,p est associé à un numéro d'impulsion p dans les codes du répertoire (OSp < N), et est de dimension Lp' égale au cardinal de l'ensemble dudit groupe contenant des positions possibles pour l'impulsion p, avec des composantes i (OSi < Lp") de la forme Rp,p(i) = U(posi,p,posi,p).Chaque matrice de corrélations Rp,q est associée à deux numéros d'impulsion différents p,q dans les codes du répertoire (Osp < q < N), et a
LP' lignes et Lq colonnes avec des composantes de la forme
Rp,q(i,j)=U(posi,p,posj,q) à la ligne i et à la colonne j (0#i < Lp' et 0#j < Lq'). Ce mode de rangement des composantes de la matrice de covariance facilite leur accès lors de la recherche de l'excitation ACELP, de façon à réduire ou au moins ne pas accroître la complexité de ce module.
LP' lignes et Lq colonnes avec des composantes de la forme
Rp,q(i,j)=U(posi,p,posj,q) à la ligne i et à la colonne j (0#i < Lp' et 0#j < Lq'). Ce mode de rangement des composantes de la matrice de covariance facilite leur accès lors de la recherche de l'excitation ACELP, de façon à réduire ou au moins ne pas accroître la complexité de ce module.
Le procédé selon l'invention est applicable à divers types de codes algébriques, c'est-à-dire quelle que soit la structure des ensembles de positions possibles pour les différentes impulsions des codes du répertoire. La procédure de calcul des vecteurs de corrélations et des matrices de corrélations peut être rendue relativement simple et efficace lorsque, dans un groupe de N ensembles, les ensembles de positions possibles pour une impulsion des codes du répertoire ont tous le même cardinal L' et que la position d'ordre i dans l'ensemble des positions possibles pour l'impulsion p (OSi < L, Osp < N) est donnée par POSj,p= 8. 6.(iN+p)+ 6 et E étant deux entiers tels que 6,o et 20.
D'autres particularités et avantages de la présente invention apparaîtront dans la description ci-après d'exemples de réalisation préférés, mais non limitatifs, en référence aux dessins annexés, dans lesquels :
- les figures 1 et 2 sont des schémas synoptiques d'un décodeur et d'un codeur CELP utilisant un répertoire algébrique conformément à l'invention
- les figures 3 et 4 sont des organigrammes illustrant le calcul des vecteurs de corrélations et des matrices de corrélations dans un premier mode de réalisation de l'invention ;;
- les figures 5A et 5B, qui se placent l'une audessus de l'autre, montrent un organigramme de la procédure de recherche de l'excitation dans le premier mode de réalisation
- les figures 6 à 8 sont des organigrammes illustrant le calcul des vecteurs de corrélations et des matrices de corrélations dans un second mode de réalisation de l'invention ; et
- la figure 9 est un organigramme illustrant une procédure sous-optimale de recherche de l'excitation dans le second mode de réalisation.
- les figures 1 et 2 sont des schémas synoptiques d'un décodeur et d'un codeur CELP utilisant un répertoire algébrique conformément à l'invention
- les figures 3 et 4 sont des organigrammes illustrant le calcul des vecteurs de corrélations et des matrices de corrélations dans un premier mode de réalisation de l'invention ;;
- les figures 5A et 5B, qui se placent l'une audessus de l'autre, montrent un organigramme de la procédure de recherche de l'excitation dans le premier mode de réalisation
- les figures 6 à 8 sont des organigrammes illustrant le calcul des vecteurs de corrélations et des matrices de corrélations dans un second mode de réalisation de l'invention ; et
- la figure 9 est un organigramme illustrant une procédure sous-optimale de recherche de l'excitation dans le second mode de réalisation.
Le processus de synthèse de parole mis en oeuvre dans un codeur et un décodeur CELP est illustré sur la figure 1.
Un générateur d'excitation 10 délivre un code d'excitation Ck appartenant à un répertoire prédéterminé en réponse à un index k. Un amplificateur 12 multiplie ce code d'excitation par un gain d'excitation ss, et le signal résultant est soumis à un filtre 14 de synthèse à long terme. Le signal de sortie u du filtre 14 est à son tour soumis à un filtre 16 de synthése à court terme, dont la sortie s constitue ce qu'on considère ici comme le signal de parole synthétisé. Bien entendu, d'autres filtres peuvent également être mis en oeuvre au niveau du décodeur, par exemple des post-filtres, comme il est bien connu dans le domaine du codage de la parole.
Les signaux précités sont des signaux numériques représentés par exemple par des mots de 16 bits à une cadence d6chantillonnage Fe égale par exemple à 8 kHz. Les filtres de synthèse 14, 16 sont en général des filtres purement récursifs. Le filtre 14 de synthèse à long terme a typiquement une fonction de transfert de la forme 1/B(z) avec B(z)=1-Gz-T. Le retard T et le gain G constituent des paramètres de prédiction à long terme (LTP) qui sont déterminés d'une manière adaptative par le codeur. Les paramètres LPC du filtre 16 de synthèse à court terme sont déterminés au codeur par une prédiction linéaire du signal de parole.La fonction de transfert du filtre 16 est ainsi de la forme 1/A(z) avec
dans le cas d'une prédiction linéaire d'ordre P (P-10 typiquement), ai représentant le i-ième coefficient de prédiction linéaire.
dans le cas d'une prédiction linéaire d'ordre P (P-10 typiquement), ai représentant le i-ième coefficient de prédiction linéaire.
La figure 2 montre le schéma d'un codeur CELP. Le signal de parole s s(n) est un signal numérique, par exemple fourni par un convertisseur analogique-numérique 20 traitant le signal de sortie amplifié et filtré d'un microphone 22.
Le signal s < n) est numérisé en trames successives de A échantillons elles-mêmes divisées en sous-trames, ou trames d'excitation, de L échantillons (par exemple A=240, L=40).
Les paramètres LPC, LTP et EXC (index k et gain d'excitation ss) sont obtenus au niveau du codeur par trois modules d'analyse respectifs 24, 26, 28. Ces paramètres sont ensuite quantifiés de façon connue en vue d'une transmission numérique efficace, puis soumis à un multiplexeur 30 qui forme le signal de sortie du codeur. Ces paramètres sont également fournis à un module 32 de calcul d'états initiaux de certains filtres du codeur. Ce module 32 comprend essentiellement une chaîne de décodage telle que celle représentée sur la figure 1. Le module 32 permet de connaître au niveau du codeur les états antérieurs des filtres de synthèse 14, 16 du décodeur, déterminés en fonction des paramètres de synthèse et d'excitation antérieurs à la soustrame considérée.
Dans une première étape du processus de codage, le module 24 d'analyse à court terme détermine les paramètres
LPC (coefficients ai du filtre de synthèse à court terme) en analysant les corrélations à court terme du signal de parole s(n). Cette détermination est effectuée par exemple une fois par trame de A échantillons, de manière à s'adapter à l'évolution du contenu spectral du signal de parole. Les méthodes d'analyse LPC sont bien connues dans la technique, et ne seront donc pas détaillées ici. On pourra par exemple se reporter à l'ouvrage "Digital Processing of Speech Signals" de L.R. Rabiner et R.W. Shafer, Prentice-Hall Int., 1978.
LPC (coefficients ai du filtre de synthèse à court terme) en analysant les corrélations à court terme du signal de parole s(n). Cette détermination est effectuée par exemple une fois par trame de A échantillons, de manière à s'adapter à l'évolution du contenu spectral du signal de parole. Les méthodes d'analyse LPC sont bien connues dans la technique, et ne seront donc pas détaillées ici. On pourra par exemple se reporter à l'ouvrage "Digital Processing of Speech Signals" de L.R. Rabiner et R.W. Shafer, Prentice-Hall Int., 1978.
L'étape suivante du codage consiste en la détermination des paramètres LTP de synthèse à long terme. Ceux-ci sont par exemple déterminés une fois par sous-trame de L échantillons. Un soustracteur 34 soustrait du signal de parole s(n) la réponse à un signal d'entrée nul du filtre de synthèse à court terme 16. Cette réponse est déterminée par un filtre 36 de fonction de transfert l/A(z) dont les coefficients sont donnés par les paramètres LPC qui ont été déter
A minés par le module 24, et dont les états initiaux s sont fournis par le module 32 de façon à correspondre aux P derniers échantillons du signal synthétique. Le signal de sortie du soustracteur 34 est soumis à un filtre 38 de pondération perceptuelle. La fonction de transfert W(z) de ce filtre de pondération perceptuelle est déterminée à partir des paramètres LPC.Une possibilité est de prendre W(z)=A(z)/A(z/r), où y est un coefficient de l'ordre de 0,8. Le rôle du filtre de pondération perceptuelle 38 est d'accentuer les portions du spectre où les erreurs sont les plus perceptibles.
A minés par le module 24, et dont les états initiaux s sont fournis par le module 32 de façon à correspondre aux P derniers échantillons du signal synthétique. Le signal de sortie du soustracteur 34 est soumis à un filtre 38 de pondération perceptuelle. La fonction de transfert W(z) de ce filtre de pondération perceptuelle est déterminée à partir des paramètres LPC.Une possibilité est de prendre W(z)=A(z)/A(z/r), où y est un coefficient de l'ordre de 0,8. Le rôle du filtre de pondération perceptuelle 38 est d'accentuer les portions du spectre où les erreurs sont les plus perceptibles.
L'analyse LTP en boucle fermée effectuée par le module 26 consiste, de façon classique, à sélectionner pour chaque sous-trame le retard T qui maximise la corrélation normalisée
où x' x(n) désigne le signal de sortie du filtre 38 pendant la sous-trame considérée, et yT(n) désigne le produit de convolution u(n-T)*h'(n). Dans l'expression ci-dessus, h' < O), h'(1),...,h'(L-1) désigne la réponse impulsionnelle du filtre de synthèse pondéré, de fonction de transfert W(z)/A(z).
où x' x(n) désigne le signal de sortie du filtre 38 pendant la sous-trame considérée, et yT(n) désigne le produit de convolution u(n-T)*h'(n). Dans l'expression ci-dessus, h' < O), h'(1),...,h'(L-1) désigne la réponse impulsionnelle du filtre de synthèse pondéré, de fonction de transfert W(z)/A(z).
Cette réponse impulsionnelle h' est obtenue par un module 40 de calcul de réponses impulsionnelles, en fonction des paramètres LPC qui ont été déterminés pour la sous-trame. Les échantillons u(n-T) sont les états antérieurs du filtre 14 de synthèse à long terme, fournis par le module 32. Pour les retards T inférieurs à la longueur d'une sous-trame, les échantillons manquants u(n-T) sont obtenus par interpolation sur la base des échantillons antérieurs, ou à partir du signal de parole. Les retards T, entiers ou fractionnaires, sont sélectionnés dans une fenêtre déterminée, allant par exemple de 20 à 143 échantillons.Pour réduire la plage de recherche en boucle fermée, et donc pour réduire le nombre de convolutions yT(n) à calculer, on peut d'abord déterminer un retard T1 en boucle ouverte par exemple une fois par trame, puis sélectionner les retards en boucle fermée pour chaque sous-trame dans un intervalle réduit autour de T1. La recherche en boucle ouverte consiste plus simplement à déterminer le retard T1 qui maximise l'autocorrélation du signal de parole s(n) éventuellement filtré par le filtre inverse de fonction de transfert A(z).Une fois que le retard T a été déterminé, le gain G de prédiction à long terme est obtenu par :
Pour rechercher l'excitation CELP relative à une sous-trame, le signal GyT(n), qui a été calculé par le module 26 pour le retard optimal T, est d'abord soustrait du signal x'(n) par le soustracteur 42. Le signal résultant x(n) est soumis à un filtre à rebours 44 qui fournit un signal D(n) donné par :
où h(O), h(1),..., h(L-l) désigne la réponse impulsionnelle du filtre composé des filtres de synthèse et du filtre de pondération perceptuelle, calculée par le module 40. En d'autres termes, le filtre composé a pour fonction de transfert W(z)/[A(z).B(z)]. En notation matricielle, on a donc :
D = (D(O), D(1),..., D(L-1)) = x.H avec x = (x(0), x(1),..., x(L-1))
D = (D(O), D(1),..., D(L-1)) = x.H avec x = (x(0), x(1),..., x(L-1))
<tb> <SEP> h(0) <SEP> O <SEP> .<SEP> . <SEP> 0
<tb> <SEP> h(l) <SEP> h(O) <SEP> O
<tb> et <SEP> H <SEP> = <SEP> | <SEP> .
<tb> <SEP> h(L-2) <SEP> h(0) <SEP> 0 <SEP>
<tb> <SEP> \h(L-1) <SEP> h(L-2) <SEP> . <SEP> . <SEP> h(l)h(0) <SEP>
<tb>
<tb> <SEP> h(l) <SEP> h(O) <SEP> O
<tb> et <SEP> H <SEP> = <SEP> | <SEP> .
<tb> <SEP> h(L-2) <SEP> h(0) <SEP> 0 <SEP>
<tb> <SEP> \h(L-1) <SEP> h(L-2) <SEP> . <SEP> . <SEP> h(l)h(0) <SEP>
<tb>
Le vecteur D constitue un vecteur-cible pour le module 28 de recherche de l'excitation. Ce module 28 détermine un mot de code du répertoire qui maximise la corrélation normalisée Pk2/ak2 dans laquelle :
K K
αK = ck.HT.H.ckT = ck.U.ckT
L'indice k optimal ayant été déterminé, le gain d'excitation ss est pris égal à = Pk/ak2.
K K
αK = ck.HT.H.ckT = ck.U.ckT
L'indice k optimal ayant été déterminé, le gain d'excitation ss est pris égal à = Pk/ak2.
Le répertoire algébrique des codes d'excitation possible est défini à partir d'au moins un groupe de N ensembles Eow E1,..., EN-1 de positions possibles pour des impulsions d'ordre 0,1,...,N-1 et d'amplitude S0, S1,...,SN-1 dans des codes d'au moins L échantillons. Un code du répertoire est représenté par N positions d' impulsions appartenant respectivement aux ensembles E0, E1,..., ENl d'un même groupe de N ensembles. Dans le cas général, els cardinaux L'0, L'1,...,
L'N-1 des ensembles E0, E1,..., EN-1 peuvent être égaux ou différents, et ces ensembles peuvent être disjoints ou non.
L'N-1 des ensembles E0, E1,..., EN-1 peuvent être égaux ou différents, et ces ensembles peuvent être disjoints ou non.
Dans le premier mode de réalisation ci-après, on supposera qu'il y a un seul groupe dont les N ensembles E0,
E1,..., EN-1 ont tous le même cardinal L', et que la position d'ordre i dans l'ensemble Ep des positions possibles pour l'impulsion p (0#i < L', 0#p < N) est donnés par :
posi,p = #. (iN+p)+# (2) 6 et étant deux entiers tels que
Après avoir calculé et mémorisé certains termes de la matrice de covariance U, le module 28 procède à la recherche du code d'excitation pour la sous-trame courante.
Les composantes mémorisées de la matrice de covariance sont d'une part celles de la forme :
structurées sous la forme de N vecteurs de corrélations Rp,p (0#p < N) à L' composantes, et d'autre part celles de la forme::
structurées sous la forme de N(N-1)/2 matrices de corrélations Rp,q (0#p < q < N) à L lignes et L' colonnes.
E1,..., EN-1 ont tous le même cardinal L', et que la position d'ordre i dans l'ensemble Ep des positions possibles pour l'impulsion p (0#i < L', 0#p < N) est donnés par :
posi,p = #. (iN+p)+# (2) 6 et étant deux entiers tels que
Après avoir calculé et mémorisé certains termes de la matrice de covariance U, le module 28 procède à la recherche du code d'excitation pour la sous-trame courante.
Les composantes mémorisées de la matrice de covariance sont d'une part celles de la forme :
structurées sous la forme de N vecteurs de corrélations Rp,p (0#p < N) à L' composantes, et d'autre part celles de la forme::
structurées sous la forme de N(N-1)/2 matrices de corrélations Rp,q (0#p < q < N) à L lignes et L' colonnes.
Le calcul des N vecteurs de corrélations Rp,p est effectué par le module 28 de la manière illustrée sur la figure 3. Ce calcul comprend une boucle indexée par un entier i décroissant de L'-l à 0. A l'initialisation 50 de cette boucle, la variable entière k est prise égale à L-8L'N- (on suppose ici L-#L'N-# # O), et la variable d'accumulation cor est prise égale à 0. Dans l'itération i de la boucle, les composantes Rp p(i) sont calculées successivement pour p décroissant de N-l à 0. La variable p est d'abord prise égale á N-1 (étape 52). Les instructions cor = cor+h(k).h(k) et k=k+l (étape 54) sont effectuées 8 fois (si L-8L'N- < O, les termes h(k) avec k < O sont pris égaux à O). Ensuite (étape 56), la composante Rp,p(i) est prise égale à la variable d'accumulation cor, et l'entier p est décrémenté d'une unité.
Le test 58 est alors effectué sur la variable entière p. Si p#0, on revient à l'étape 54 pour 6 exécutions des instructions correspondantes. Si le test 58 montre que p < O, la variable entière i est décrémentée d'une unité (étape 60), puis comparée à O au test 62. Si i20, on revient avant l'étape 52 pour effectuer l'itération suivante dans la boucle. Le calcul des N vecteurs de corrélations est terminé lorsque le test 62 montre que i < O.
Ce calcul des N vecteurs de corrélations nécessite de l'ordre de #L'N additions, 8L'N multiplications et L'N chargements en mémoire. On remarquera que l'initialisation 50 du calcul pourrait être différente. Par exemple, l'entier k peut également être initialisé à L-8L'N à l'étape 50, chaque itération dans les boucles indexées par p décroissant de N-l à O étant alors constituée par #-# exécutions de l'étape 54, suivies par l'étape 56 suivie par exécutions de l'étape 54. Le calcul reste correct parce qu'au total 6 étapes 54 sont effectuées entre deux mémorisations successives de termes Rp,p < i).
Le calcul des N(N-1)/2 matrices de corrélations Rp,q peut être effectué par le module 28 de la manière illustrée sur la figure 4. Pour chaque valeur de l'entier t comprise entre 1 et N-1 et de l'entier d' comprise entre 0 et L'-l, ce calcul comprend une boucle Bt,d'' indexée par un entier i décroissant de L'-l-d' à 0. A l'initialisation 70 du calcul, l'entier t est pris égal à 1. L'entier d' est ensuite pris égal à O à l'étape 72. L'étape 74 correspond à l'initialisation de la boucle indexée par l'entier i.
L'entier i est initialisé à L'-l-d', l'entier j à L'-1, l'entier d à #.(t+d'N), l'entier k à L-#L'N-#, et la variable d'accumulation cor à 0. Dans l'itération i de la boucle
Bt,d'' les composantes Rp,p+t(i,i+d') sont calculées successivement pour p décroissant de N-l-t à 0 puis, si i > O, les composantes Rq.q+n-t(i+d',i-1) sont calculées successivement pour q décroissant de t-l à O. L'itération i commence par l'initialisation 76 des variables entières q et p à N-1 et N-1-t, respectivement. On exécute alors 8 fois l'étape 78 consistant à ajouter le terme h(k).h(k+d) à la variable d'accumulation cor et à incrémenter la variable k d'une unité.A l'étape 80, la composante Rp,q(i,j) est prise égale à la variable d'accumulation cor, et les entiers p et q sont chacun décrémentés dune unité. On effectue ensuite le test 82 sur l'entier p. Si p20, on retourne avant l'étape 78 qui sera de nouveau exécutée 8 fois. Si le test 82 montre que p < O, on effectue le test 84 sur l'entier i. Si i > O, on passe à l'étape 86 où l'entier p' est initialisé à N-1, l'entier q restant égal à t-l. L'étape 86 est suivie par 6 exécutions successives de l'étape 88 consistant, comme l'étape 78, à ajouter h(k).h(k+d) à la variable d'accumulation cor et à incrémenter la variable entière k d'une unité.Ensuite, la composante Rq,p ) est prise égale à la variable d'accumulation cor, et les entiers p' et q sont chacun décrémentés d'une unité, à l'étape 90. On effectue ensuite le test 92 sur la valeur de l'entier q. Si q20, on revient avant l'étape 88 qui sera de nouveau exécutée 6 fois. Si le test 92 montre que q < 0, les entiers i et j sont chacun décrémentés d'une unité à l'étape 94, puis on revient avant l'étape 76 pour l'exécution de l'itération suivante dans la boucle Bt d. Cette boucle est terminée lorsque le test 84 montre que isO. L'entier d' est alors incrémenté d'une unité (étape 96), puis comparé au nombre L' (test 98). Si d' < L', on revient avant l'étape 74 pour effectuer une autre boucle
Bt,d' indexée par l'entier i.Si le test 98 montre que d'=L', l'entier t est incrémenté d'une unité (étape 100), puis comparé au nombre N (test 102). Si t < N on revient avant l'étape 72 pour calculer les composantes des matrices Rp,p+t et Rq q+N-t pour la nouvelle valeur de t. Le calcul des N(N1)/2 matrices de corrélations est terminé lorsque le test 102 montre que t=N.
Bt,d'' les composantes Rp,p+t(i,i+d') sont calculées successivement pour p décroissant de N-l-t à 0 puis, si i > O, les composantes Rq.q+n-t(i+d',i-1) sont calculées successivement pour q décroissant de t-l à O. L'itération i commence par l'initialisation 76 des variables entières q et p à N-1 et N-1-t, respectivement. On exécute alors 8 fois l'étape 78 consistant à ajouter le terme h(k).h(k+d) à la variable d'accumulation cor et à incrémenter la variable k d'une unité.A l'étape 80, la composante Rp,q(i,j) est prise égale à la variable d'accumulation cor, et les entiers p et q sont chacun décrémentés dune unité. On effectue ensuite le test 82 sur l'entier p. Si p20, on retourne avant l'étape 78 qui sera de nouveau exécutée 8 fois. Si le test 82 montre que p < O, on effectue le test 84 sur l'entier i. Si i > O, on passe à l'étape 86 où l'entier p' est initialisé à N-1, l'entier q restant égal à t-l. L'étape 86 est suivie par 6 exécutions successives de l'étape 88 consistant, comme l'étape 78, à ajouter h(k).h(k+d) à la variable d'accumulation cor et à incrémenter la variable entière k d'une unité.Ensuite, la composante Rq,p ) est prise égale à la variable d'accumulation cor, et les entiers p' et q sont chacun décrémentés d'une unité, à l'étape 90. On effectue ensuite le test 92 sur la valeur de l'entier q. Si q20, on revient avant l'étape 88 qui sera de nouveau exécutée 6 fois. Si le test 92 montre que q < 0, les entiers i et j sont chacun décrémentés d'une unité à l'étape 94, puis on revient avant l'étape 76 pour l'exécution de l'itération suivante dans la boucle Bt d. Cette boucle est terminée lorsque le test 84 montre que isO. L'entier d' est alors incrémenté d'une unité (étape 96), puis comparé au nombre L' (test 98). Si d' < L', on revient avant l'étape 74 pour effectuer une autre boucle
Bt,d' indexée par l'entier i.Si le test 98 montre que d'=L', l'entier t est incrémenté d'une unité (étape 100), puis comparé au nombre N (test 102). Si t < N on revient avant l'étape 72 pour calculer les composantes des matrices Rp,p+t et Rq q+N-t pour la nouvelle valeur de t. Le calcul des N(N1)/2 matrices de corrélations est terminé lorsque le test 102 montre que t=N.
Ce calcul des N(N-1)/2 matrices de corrélations nécessite seulement de l'ordre de #L'N(N-1)/2 additions, #L'N(N-1)/2 multiplications et L'2N(N-1)/2 chargements en mémoire.
La recherche du code d'excitation peut être effectuée par le module 28 conformément à 1'organigramme représenté sur les figures SA et 5B. A l'étape 120, on calcule d'abord
N-l seuils partiels T(0),...,T(N-2), et on initialise le seuil T(N-1) à une valeur négative, par exemple -1. Les seuils partiels T(O),...,T(N-2) sont positifs et calculés en fonction du vecteur d'entrée D et du compromis visé entre l'efficacité de la recherche de l'excitation et la simplicité de cette recherche. Des valeurs élevées des seuils partiels tendent à diminuer la quantité de calculs nécessaires à la recherche de l'excitation, tandis que des valeurs faibles des seuils partiels conduisent à une recherche plus exhaustive dans le répertoire ACELP.
N-l seuils partiels T(0),...,T(N-2), et on initialise le seuil T(N-1) à une valeur négative, par exemple -1. Les seuils partiels T(O),...,T(N-2) sont positifs et calculés en fonction du vecteur d'entrée D et du compromis visé entre l'efficacité de la recherche de l'excitation et la simplicité de cette recherche. Des valeurs élevées des seuils partiels tendent à diminuer la quantité de calculs nécessaires à la recherche de l'excitation, tandis que des valeurs faibles des seuils partiels conduisent à une recherche plus exhaustive dans le répertoire ACELP.
La recherche du code d'excitation comprend N boucles
Bo, B1 ..., BN-1 imbriquées les unes dans les autres. A l'initialisation 1220 de la boucle Bg, l'index i0 est pris égal à 0. L'itération d'index i0 dans la boucle B0 comprend une étape 1240 de calcul de deux termes P(O) et α(0) selon :
P(0) = S0.D(#i0N+#) α(0) = S0.R0,0(i0)
On effectue ensuite la comparaison 1260 entre les quantités P(0) et T(p).α(0). Si P(0) < T(0).α(0), alors on passe à l'étape 1300 d'incrémentation de l'index i0 puis au test 1320 où l'index i0 est comparé au nombre L'. Lorsque i0 devient égal à La, la recherche de l'excitation est terminée.
Bo, B1 ..., BN-1 imbriquées les unes dans les autres. A l'initialisation 1220 de la boucle Bg, l'index i0 est pris égal à 0. L'itération d'index i0 dans la boucle B0 comprend une étape 1240 de calcul de deux termes P(O) et α(0) selon :
P(0) = S0.D(#i0N+#) α(0) = S0.R0,0(i0)
On effectue ensuite la comparaison 1260 entre les quantités P(0) et T(p).α(0). Si P(0) < T(0).α(0), alors on passe à l'étape 1300 d'incrémentation de l'index i0 puis au test 1320 où l'index i0 est comparé au nombre L'. Lorsque i0 devient égal à La, la recherche de l'excitation est terminée.
Sinon, on revient avant l'étape 1240 pour procéder à l'itération suivante dans la boucle Bo. Si la comparaison 1260 montre que P(0)#T(0).α(0), alors la boucle B1 est exécutée. Les boucles Bq pour O < q < N-1 se composent d'instructions identiques ::
- une initialisation 122q, où on prend iq=O
- pour l'itération d'index i le calcul 124q des deux quantités P(q) et a2 a2(q) selon
P(q) = P(q-1)+Sq.D[#(iqN+q)+#]
- une initialisation 122q, où on prend iq=O
- pour l'itération d'index i le calcul 124q des deux quantités P(q) et a2 a2(q) selon
P(q) = P(q-1)+Sq.D[#(iqN+q)+#]
- pour l'itération d'index i une comparaison 126q entre les quantités P(q) et T(q).a2(q) ;
- si la comparaison 126q montre que p2(q)#T(q).α(q), passage à la boucle Bq+1
- si la comparaison 126q montre que P(q) < T(q).α(q), incrémentation 130q de l'index iq, puis comparaison 132q entre l'index i et le nombre L'
- si la comparaison 132q montre que iq < L'r retour avant l'étape 124q pour l'itération suivante ;; et
- si la comparaison 132q montre que iq=L', passage à l'étape 130q-1 d'incrémentation de l'index iq~l de la boucle supérieure.
- si la comparaison 126q montre que p2(q)#T(q).α(q), passage à la boucle Bq+1
- si la comparaison 126q montre que P(q) < T(q).α(q), incrémentation 130q de l'index iq, puis comparaison 132q entre l'index i et le nombre L'
- si la comparaison 132q montre que iq < L'r retour avant l'étape 124q pour l'itération suivante ;; et
- si la comparaison 132q montre que iq=L', passage à l'étape 130q-1 d'incrémentation de l'index iq~l de la boucle supérieure.
La boucle BN-1 se compose des mêmes instructions que les boucles précédentes. Toutefois, si la comparaison 126N-1 montre que P(N-1)#T(N-1).α(N-1), alors on exécute une étape 128 avant de passer à l'étape 130N-1 d'incrémentation de l'index iNl. Cette étape 128 consiste d'une part à mettre à jour le seuil T(N-1) selon : T(N-1) = P2(N-1)/α(N-1), et d'autre part à mémoriser les paramètres relatifs au code qui vient d'être testé. Ces paramètres comprennent le gain d'excitation ss pris égal à P(N-1)/α(N-1), et les N index i0,i1,...,iN-1 permettant de trouver les positions des N impulsions du code.Les N index i0,i1,...,iN-1 peuvent être compilés en un index global k donné par :
cet index k étant codé sur N.log2 < L') bits.
cet index k étant codé sur N.log2 < L') bits.
On constate que le rangement des composantes en matrices de corrélations permet, au cours de la recherche en boucles imbriquées, d'adresser les composantes nécessaires de la matrice U pour une boucle par une simple incrémentation des pointeurs iq d'une unité, au lieu d'avoir à faire des calculs d'adresses plus compliqués comme dans le cas du codeur ACELP antérieur.
I1 est possible d'assigner plusieurs valeurs pour l'amplitude d'une ou plusieurs impulsions des codes du répertoire. Dans ce cas, on attribue de préférence les derniers numéros d'ordre aux impulsions en question. S'il y a n q valeurs d'amplitude possibles pour l'impulsion q, on exécute alors nq fois la boucle B q de l'organigramme des figures SA et 5B avec à chaque fois une valeur différente de l'amplitude Sq, et on mémorise en outre à l'étape 128 le nombre de fois que la boucle Bq a été exécutée avant de rencontrer une valeur supérieure de P2(N-l)/a2(N-l)* Ce nombre sera également transmis au décodeur qui pourra donc retrouver l'amplitude S à appliquer à l'impulsion correspondante du code d'excitation.
En référence à la figure 1, le décodeur ACELP comprend un démultiplexeur 8 recevant le flux binaire issu du codeur. Les valeurs quantifiées des paramètres d'excitation EXC et des paramètres de synthèse LTP et LPC sont fournies au générateur 10, à l'amplificateur 12 et aux filtres 14, 16 pour reconstituer le signal synthétique ^, qui peut par exemple être converti en analogique par le convertisseur 18 avant d'être amplifié puis appliqué à un haut-parleur 19 pour restituer la parole originale.
Dans un second mode de réalisation de l'invention, on considère un répertoire algébrique constitué à partir de
M groupes de N ensembles {EO(m), E1(m),...,EN-1(m)} (0#m < M) de positions possibles pour les impulsions 0,1,...,N-1 des codes. Les MN ensembles ont tous le même cardinal L, et la position d'ordre i dans l'ensemble Ep (m) du groupe m contenant des positions possibles pour l'impulsion p(0#i < L', 0#p < N, OSm < M) est donnée par posi,p(m) = #. (iN+p)+#(m) (2m) 8 et #(0),...,#(m-1) étant des entiers tels que 0##(0) < ... < # < M-l) < 8 Un code du répertoire est alors caractérisé par un index de groupe m et par N index de position i.
M groupes de N ensembles {EO(m), E1(m),...,EN-1(m)} (0#m < M) de positions possibles pour les impulsions 0,1,...,N-1 des codes. Les MN ensembles ont tous le même cardinal L, et la position d'ordre i dans l'ensemble Ep (m) du groupe m contenant des positions possibles pour l'impulsion p(0#i < L', 0#p < N, OSm < M) est donnée par posi,p(m) = #. (iN+p)+#(m) (2m) 8 et #(0),...,#(m-1) étant des entiers tels que 0##(0) < ... < # < M-l) < 8 Un code du répertoire est alors caractérisé par un index de groupe m et par N index de position i.
Une procédure de codage optimale comparable à celle précédemment décrite conduit au calcul de M groupes de N vesteurs de corrélations Rp,p(m) (0#m < M), 0#p < N) :
Rp,p(m)(i) = U(posi,p(m), posi,p(m), et de M groupes de N(N-1)/2 matrices de corrélations Rp q(m) (0#m < M, 0#p < q < N) :
Rp,q(m)(i,j) = U(posi,p(m), posj,q(m)).
Rp,p(m)(i) = U(posi,p(m), posi,p(m), et de M groupes de N(N-1)/2 matrices de corrélations Rp q(m) (0#m < M, 0#p < q < N) :
Rp,q(m)(i,j) = U(posi,p(m), posj,q(m)).
Pour calculer les composantes des M groupes de vecteurs de corrélations, on peut procéder conformément à l'organigramme de la figure 3 avec les modifications suivantes :
- la variable entière k est intialisée à L-8L'N à l'initialisation 50 de la boucle de calcul ; et
- les 6 exécutions de l'étape 54 et l'étape 56 sont remplacées par la séquence représentée sur la figure 6 : l'étape 54 est d'abord exécutée #-#(M-1 fois avant de prendre Rp,p(M-1) (i)=cor à l'étape 55M-1 ; ensuite, pour m décroissant de M-2 à O, on exécute #(m+1). (m) fois l'étape 54 puis on prend Rp,p (m) (i)=cor à l'étape 55m @ enfin on exécute encore #(0) fois l'étape 54 avant de décrémenter l'entier p à l'étape 57.
- la variable entière k est intialisée à L-8L'N à l'initialisation 50 de la boucle de calcul ; et
- les 6 exécutions de l'étape 54 et l'étape 56 sont remplacées par la séquence représentée sur la figure 6 : l'étape 54 est d'abord exécutée #-#(M-1 fois avant de prendre Rp,p(M-1) (i)=cor à l'étape 55M-1 ; ensuite, pour m décroissant de M-2 à O, on exécute #(m+1). (m) fois l'étape 54 puis on prend Rp,p (m) (i)=cor à l'étape 55m @ enfin on exécute encore #(0) fois l'étape 54 avant de décrémenter l'entier p à l'étape 57.
Pour calculer les composantes des M groupes de matrice d'intercorrélations, on peut procéder conformément à l'organigramme de la figure 4 avec les modifications suivantes
- la variable entière k est initialisée à L-8L'N à l'initialisation 74 d'une boucle Bt,d ;
- les 8 exécutions de l'étape 78 et l'étape 80 sont remplacées par la séquence représentée sur la figure 7 l'étape 78 est d'abord exécutée 6-(M-1) fois avant de prendre Rp, q (M-I) (i,j)=cor à l'étape 79M-1 ; ensuite, pour m décroissant de M-2 à O, on exécute #(m+1)-#(m) fois l'étape 78 puis on prend Rp, q{m)(i,j)=cor à l'étape 79m ; enfin on exécute encore (0) fois l'étape 78 avant de décrémenter les entiers p et q à l'étape 81 ; et
- les 6 exécutions de l'étape 88 et l'étape 90 sont remplacées par la séquence représentée sur la figure 8 l'étape 88 est d'abord exécutée & < M-1) fois avant de prendre Rq,p,(M-1)(j,i-1)=cor à l'étape 89M-1 ; ensuite, pour m décroissant de M-2 à 0, on exécute #(m+1)-#(m) fois l'étape 88 puis on prend Rq,p,(m)(j,i-1)=cor à l'étape 89m ; enfin on exécute encore < O) fois l'étape 88 avant de décrémenter les entiers p et q à l'étape 91.
- la variable entière k est initialisée à L-8L'N à l'initialisation 74 d'une boucle Bt,d ;
- les 8 exécutions de l'étape 78 et l'étape 80 sont remplacées par la séquence représentée sur la figure 7 l'étape 78 est d'abord exécutée 6-(M-1) fois avant de prendre Rp, q (M-I) (i,j)=cor à l'étape 79M-1 ; ensuite, pour m décroissant de M-2 à O, on exécute #(m+1)-#(m) fois l'étape 78 puis on prend Rp, q{m)(i,j)=cor à l'étape 79m ; enfin on exécute encore (0) fois l'étape 78 avant de décrémenter les entiers p et q à l'étape 81 ; et
- les 6 exécutions de l'étape 88 et l'étape 90 sont remplacées par la séquence représentée sur la figure 8 l'étape 88 est d'abord exécutée & < M-1) fois avant de prendre Rq,p,(M-1)(j,i-1)=cor à l'étape 89M-1 ; ensuite, pour m décroissant de M-2 à 0, on exécute #(m+1)-#(m) fois l'étape 88 puis on prend Rq,p,(m)(j,i-1)=cor à l'étape 89m ; enfin on exécute encore < O) fois l'étape 88 avant de décrémenter les entiers p et q à l'étape 91.
Une fois que les vecteurs de corrélations et les matrices de corrélations ont été calculés, la recherche de l'excitation peut être simplement effectuée en exécutant une fois pour chacun des M groupes la recherche en boucles imbriquées représentée sur les figures 5A et 5B. Il suffit alors de mémoriser à l'étape 128 le nombre de fois que la recherche en boucles imbriquées a été entièrement exécutée avant la recherche courante pour obtenir l'index m du groupe permettant de reconstituer le code d'excitation sélectionné.
On comprend donc que le second mode de réalisation généralise le premier qui correspond au cas particulier M=l.
Le second mode de réalisation avec M > 1 permet cependant de mettre en oeuvre une procédure de recherche sousoptimale qui procure encore d' importants gains en espace mémoire. Cette procédure consiste à ne mémoriser les vecteurs de corrélations Rp p(m) et les matrices de corrélations
Rp,q (m) que pour z des index de groupe m (1# < M). Le gain supplémentaire en espace mémoire est alors d'un facteur /M.
Rp,q (m) que pour z des index de groupe m (1# < M). Le gain supplémentaire en espace mémoire est alors d'un facteur /M.
Cette procédure revient à subdiviser la matrice de cova riance U en sous-blocs avec l'approximation U(i,j)=U(i-1,j-1) au sein de chaque sous-bloc. Si le nombre d'impulsions N est important, on aura intérêt à ne pas prendre une valeur trop faible du rapport R/M afin de ne pas trop dégrader la qualité du codage. Un ajustement des nombres p et M permet de déterminer un compromis entre la qualité du codage et l'espace mémoire nécessaire.
Lorsque cette procédure sous-optimale est mise en oeuvre, on shunte les étapes 55m, 79m et 89m (figures 6 à 8) relatives à ceux des index m pour lesquels on ne mémorise pas les vecteurs de corrélations Rp,p p(m) et les matrices de corrélations Rp,q(m)
Si, pour simplifier l'exposé sans en affecter la généralité, on considère le cas (M=2, =1} dans lequel on ne mémorise que les composantes des vecteurs Rp,p(0) et des matrices Rp, q (O), la recherche de l'excitation peut être effectuée conformément à l'organigramme des figures SA et 5B en modifiant les boucles Bq(0#q < N) de la manière indiquée sur la figure 9. A l'étape 124q, les termes P(q) et a2 (q) sont calculés comme dans le cas des figures 5A et 5B relativement au groupe m=O.Si le test 126q montre que P2(q)/a2(q) est supérieur au seuil T(q), on exécute les boucles inférieures en commençant par Bq+1 ou, si q=N-l, on effectue la mise à jour 128 du seuil et des paramètres d'excitation qui comprennent en outre l'index m alors pris égal à 0. On passe ensuite à l'étape 125q, qui est exécutée directement si le test 126q montre que P(q) < T(q).α(q). A l'étape 125q, on calcule le terme P(q) relativement au groupe m=l. Le terme correspondant a2 (q) n'est pas recalculé étant donné que, dans l'approximation utilisée, on le considère égal au terme a2 (q) précédemment calculé pour m=O.Le test 127q consiste ensuite à comparer P(q) et T(q).α(q). Si P(q)/α(q) est supérieur au seuil T(q), on exécute les boucles inférieures en commençant par Bq+1 ou, Si q=N-l, on effectue la mise à jour 128 du seuil et des paramètres d'excitation, qui comprennent l'index m alors pris égal à 1. On passe ensuite à l'incrémentation 130q de 1'entier i qui est exécutée directement si le test 127q montre que P(q) < T(q).α(q).
Si, pour simplifier l'exposé sans en affecter la généralité, on considère le cas (M=2, =1} dans lequel on ne mémorise que les composantes des vecteurs Rp,p(0) et des matrices Rp, q (O), la recherche de l'excitation peut être effectuée conformément à l'organigramme des figures SA et 5B en modifiant les boucles Bq(0#q < N) de la manière indiquée sur la figure 9. A l'étape 124q, les termes P(q) et a2 (q) sont calculés comme dans le cas des figures 5A et 5B relativement au groupe m=O.Si le test 126q montre que P2(q)/a2(q) est supérieur au seuil T(q), on exécute les boucles inférieures en commençant par Bq+1 ou, si q=N-l, on effectue la mise à jour 128 du seuil et des paramètres d'excitation qui comprennent en outre l'index m alors pris égal à 0. On passe ensuite à l'étape 125q, qui est exécutée directement si le test 126q montre que P(q) < T(q).α(q). A l'étape 125q, on calcule le terme P(q) relativement au groupe m=l. Le terme correspondant a2 (q) n'est pas recalculé étant donné que, dans l'approximation utilisée, on le considère égal au terme a2 (q) précédemment calculé pour m=O.Le test 127q consiste ensuite à comparer P(q) et T(q).α(q). Si P(q)/α(q) est supérieur au seuil T(q), on exécute les boucles inférieures en commençant par Bq+1 ou, Si q=N-l, on effectue la mise à jour 128 du seuil et des paramètres d'excitation, qui comprennent l'index m alors pris égal à 1. On passe ensuite à l'incrémentation 130q de 1'entier i qui est exécutée directement si le test 127q montre que P(q) < T(q).α(q).
Exemple 1
Dans ce premier exemple mettant en oeuvre le premier mode de réalisation décrit ci-dessus, on utilise des trames de 30 ms (soit A=240 échantillons à 8kHz), subdivisées en sous-trames de 5ms (L=40). Le répertoire ACELP comprend des codes de N=4 impulsions ayant chacune L'=11 positions possibles données par la relation (2) avec 6=1 et t=0. Si une impulsion occupe la dernière position, qui est supérieure ou égale à L=40, son amplitude est annulée par le décodeur.
Dans ce premier exemple mettant en oeuvre le premier mode de réalisation décrit ci-dessus, on utilise des trames de 30 ms (soit A=240 échantillons à 8kHz), subdivisées en sous-trames de 5ms (L=40). Le répertoire ACELP comprend des codes de N=4 impulsions ayant chacune L'=11 positions possibles données par la relation (2) avec 6=1 et t=0. Si une impulsion occupe la dernière position, qui est supérieure ou égale à L=40, son amplitude est annulée par le décodeur.
Un code d'excitation correspond à un code tronqué du répertoire (échantillons O à L-1=39 seulement), et peut donc contenir 0, 1, 2, 3 ou 4 impulsions. La répartition des impulsions dans une sous-trame est présentée dans le tableau
I. L'allocation du débit binaire par trame est présentée dans le tableau II. 204 bits par trame correspondent à un débit binaire de 6,8 kbit/s.
I. L'allocation du débit binaire par trame est présentée dans le tableau II. 204 bits par trame correspondent à un débit binaire de 6,8 kbit/s.
<tb>
p <SEP> | <SEP> Sp <SEP> | <SEP> EP <SEP> = <SEP> {posi,p}
<tb> <SEP> 0 <SEP> +1 <SEP> O <SEP> 4 <SEP> 8 <SEP> 12 <SEP> 16 <SEP> 20 <SEP> | <SEP> 24 <SEP> | <SEP> 28 <SEP> | <SEP> 32 <SEP> | <SEP> 36 <SEP> | <SEP> (40) <SEP>
<tb> <SEP> 1 <SEP> -1 <SEP> 1 <SEP> 5 <SEP> 9 <SEP> 13 <SEP> 17 <SEP> 21 <SEP> 25 <SEP> 29 <SEP> 33 <SEP> 37 <SEP> (41)
<tb> <SEP> 2 <SEP> +1 <SEP> 2 <SEP> 6 <SEP> 10 <SEP> 14 <SEP> 18 <SEP> 22 <SEP> 26 <SEP> 30 <SEP> 34 <SEP> 38 <SEP> (42)
<tb> <SEP> 3 <SEP> # <SEP> <SEP> 3 <SEP> 7 <SEP> ll <SEP> <SEP> 15 <SEP> 19 <SEP> 23 <SEP> 27 <SEP> 31 <SEP> 35 <SEP> 39 <SEP> (43)
<tb> <SEP> i <SEP> O <SEP> | <SEP> 1 <SEP> 2 <SEP> 3 <SEP> 4 <SEP> 5 <SEP> 6 <SEP> 7 <SEP> 8 <SEP> 9 <SEP> 10
<tb>
TABLEAU I
<tb> <SEP> 0 <SEP> +1 <SEP> O <SEP> 4 <SEP> 8 <SEP> 12 <SEP> 16 <SEP> 20 <SEP> | <SEP> 24 <SEP> | <SEP> 28 <SEP> | <SEP> 32 <SEP> | <SEP> 36 <SEP> | <SEP> (40) <SEP>
<tb> <SEP> 1 <SEP> -1 <SEP> 1 <SEP> 5 <SEP> 9 <SEP> 13 <SEP> 17 <SEP> 21 <SEP> 25 <SEP> 29 <SEP> 33 <SEP> 37 <SEP> (41)
<tb> <SEP> 2 <SEP> +1 <SEP> 2 <SEP> 6 <SEP> 10 <SEP> 14 <SEP> 18 <SEP> 22 <SEP> 26 <SEP> 30 <SEP> 34 <SEP> 38 <SEP> (42)
<tb> <SEP> 3 <SEP> # <SEP> <SEP> 3 <SEP> 7 <SEP> ll <SEP> <SEP> 15 <SEP> 19 <SEP> 23 <SEP> 27 <SEP> 31 <SEP> 35 <SEP> 39 <SEP> (43)
<tb> <SEP> i <SEP> O <SEP> | <SEP> 1 <SEP> 2 <SEP> 3 <SEP> 4 <SEP> 5 <SEP> 6 <SEP> 7 <SEP> 8 <SEP> 9 <SEP> 10
<tb>
TABLEAU I
<tb> <SEP> Paramètres <SEP> Sous-trames <SEP> Sous-trames <SEP> Total <SEP> par
<tb> <SEP> 1 <SEP> et <SEP> 4 <SEP> 2,3,5 <SEP> et <SEP> 6 <SEP> trame
<tb> <SEP> LPC <SEP> 30
<tb> Retard <SEP> LTP(T) <SEP> 8 <SEP> 5 <SEP> 36
<tb> <SEP> impulsions <SEP> 14+1 <SEP> 14+1 <SEP> 90
<tb> <SEP> signe <SEP> de <SEP> ss <SEP> 1 <SEP> 1 <SEP> 6
<tb> gains <SEP> G <SEP> et <SEP> B <SEP> 7 <SEP> 7 <SEP> 42
<tb> <SEP> Total <SEP> 204
<tb>
TABLEAU II
De façon connue, les coefficients LPC sont convertis sous forme de paramètres de raies spectrales (LSP) quantifiés vectoriellement. Les retards LTP, qui peuvent prendre 256 valeurs entières ou fractionnaires entre 19% et 143 sont quantifiés sur 8 bits.Ces 8 bits sont transmis dans les sous-trames 1 et 4 et, pour les autres sous-trames, une valeur différentielle est codée sur 5 bits seulement. Le répertoire contient K=(L')N=14641 mots de code. 14 bits sont donc nécessaires pour coder les positions, plus un bit donnant le signe de l'impulsion p=3.
<tb> <SEP> 1 <SEP> et <SEP> 4 <SEP> 2,3,5 <SEP> et <SEP> 6 <SEP> trame
<tb> <SEP> LPC <SEP> 30
<tb> Retard <SEP> LTP(T) <SEP> 8 <SEP> 5 <SEP> 36
<tb> <SEP> impulsions <SEP> 14+1 <SEP> 14+1 <SEP> 90
<tb> <SEP> signe <SEP> de <SEP> ss <SEP> 1 <SEP> 1 <SEP> 6
<tb> gains <SEP> G <SEP> et <SEP> B <SEP> 7 <SEP> 7 <SEP> 42
<tb> <SEP> Total <SEP> 204
<tb>
TABLEAU II
De façon connue, les coefficients LPC sont convertis sous forme de paramètres de raies spectrales (LSP) quantifiés vectoriellement. Les retards LTP, qui peuvent prendre 256 valeurs entières ou fractionnaires entre 19% et 143 sont quantifiés sur 8 bits.Ces 8 bits sont transmis dans les sous-trames 1 et 4 et, pour les autres sous-trames, une valeur différentielle est codée sur 5 bits seulement. Le répertoire contient K=(L')N=14641 mots de code. 14 bits sont donc nécessaires pour coder les positions, plus un bit donnant le signe de l'impulsion p=3.
Dans cet exemple 1, la mise en oeuvre de l'invention permet de diviser par 2,5 la taille de la mémoire requise au codeur pour stocker les composantes de la matrice de covariance, tout en obtenant des signaux de sortie identiques à ceux que permettait d'obtenir le codeur ACELP antérieur. La mémoire vive nécessaire pour stocker les données et variables utile au codeur et les composantes de la matrice de covariance est ainsi réduite de 2264+1936=4200 mots de 16 bits à 2264+770=3034 mots de 16 bits, ce qui permet un adressage sur 12 bits compatible avec les mémoires RAM statiques et les processeurs de traitement numérique (DSP) courants.
Exemple 2
Dans ce second exemple mettant en oeuvre le premier mode de réalisation décrit ci-dessus, on utilise des trames de 30 ms (A=240) subdivisées en sous-trames de 6ms (L=48).
Dans ce second exemple mettant en oeuvre le premier mode de réalisation décrit ci-dessus, on utilise des trames de 30 ms (A=240) subdivisées en sous-trames de 6ms (L=48).
Le répertoire ACELP comprend des codes de N=3 impulsions ayant chacune L'=16 positions possibles données par la relation (2) avec #=1 et=O. Comme & 'N=L, les mots de codes ne sont pas tronqués pour obtenir l'excitation qui comporte toujours N=3 impulsions.
Les paramètres LPC et LTP sont déterminés de façon semblable à l'exemple 1. Le répertoire contient K=(L' )N=4096 mots de code. 12 bits sont donc nécessaires pour coder les positions. Le débit binaire est alors de 158 bits par trame, soit 5,3 kbit/s.
Dans cet exemple 2, la mise en oeuvre de l'invention permet de diviser par 2,8 la mémoire requise au codeur pour stocker les composantes de la matrice de covariance tout en obtenant des signaux de sortie identiques (gain de 1488 mots de 16 bits permettant un adressage sur 12 bits dans la mémorie vive).
Exemple 3
Dans ce troisième exemple mettant en oeuvre le second mode de réalisation avec la procédure de recherche sous-optimale ( =1), on utilise des trames de 30ms (A=240) subdivisées en sous-trames de 7,5 ms (L=60). Le répertoire ACELP est construit à partir de M=2 groupes de N=4 ensembles de positions de cardinal L'=8. Les positions sont données par les relations (2m) avec 6=2, #(0) =0 et t(l)=l. Les mots de code du répertoire ont une longueur & 'N=64 supérieure à la longueur L d'une sous-trame. Ils doivent donc être tronqués (échantillons O à L-1=59 seulement) pour obtenir une excitation contenant 2, 3 ou 4 impulsions.La répartition des impulsions dans une sous-trame est présentée dans le tableau
III pour le groupe m=O et dans le tableau IV pour le groupe m=l.
Dans ce troisième exemple mettant en oeuvre le second mode de réalisation avec la procédure de recherche sous-optimale ( =1), on utilise des trames de 30ms (A=240) subdivisées en sous-trames de 7,5 ms (L=60). Le répertoire ACELP est construit à partir de M=2 groupes de N=4 ensembles de positions de cardinal L'=8. Les positions sont données par les relations (2m) avec 6=2, #(0) =0 et t(l)=l. Les mots de code du répertoire ont une longueur & 'N=64 supérieure à la longueur L d'une sous-trame. Ils doivent donc être tronqués (échantillons O à L-1=59 seulement) pour obtenir une excitation contenant 2, 3 ou 4 impulsions.La répartition des impulsions dans une sous-trame est présentée dans le tableau
III pour le groupe m=O et dans le tableau IV pour le groupe m=l.
<tb> p <SEP> | <SEP> Sp <SEP> | <SEP> Ep <SEP> (0) <SEP> = <SEP> {posi.p <SEP> (0) <SEP> }
<tb> <SEP> ~ <SEP> #1 <SEP> <SEP> 0 <SEP> 8 <SEP> 16 <SEP> 24 <SEP> 32 <SEP> 40 <SEP> 48 <SEP> 56
<tb> <SEP> 1 <SEP> tl <SEP> 2 <SEP> 10 <SEP> 18 <SEP> 26 <SEP> 34 <SEP> 42 <SEP> 50 <SEP> 58
<tb> <SEP> 2 <SEP> +1 <SEP> 4 <SEP> 12 <SEP> 20 <SEP> 28 <SEP> 36 <SEP> 44 <SEP> 52 <SEP> (60)
<tb> <SEP> 3 <SEP> +1 <SEP> 6 <SEP> 14 <SEP> 22 <SEP> 30 <SEP> 38 <SEP> 46 <SEP> 54 <SEP> (62)
<tb> <SEP> i <SEP> 0 <SEP> 1 <SEP> 2 <SEP> 3 <SEP> 4 <SEP> 5 <SEP> 6 <SEP> 7
<tb>
<tb> <SEP> ~ <SEP> #1 <SEP> <SEP> 0 <SEP> 8 <SEP> 16 <SEP> 24 <SEP> 32 <SEP> 40 <SEP> 48 <SEP> 56
<tb> <SEP> 1 <SEP> tl <SEP> 2 <SEP> 10 <SEP> 18 <SEP> 26 <SEP> 34 <SEP> 42 <SEP> 50 <SEP> 58
<tb> <SEP> 2 <SEP> +1 <SEP> 4 <SEP> 12 <SEP> 20 <SEP> 28 <SEP> 36 <SEP> 44 <SEP> 52 <SEP> (60)
<tb> <SEP> 3 <SEP> +1 <SEP> 6 <SEP> 14 <SEP> 22 <SEP> 30 <SEP> 38 <SEP> 46 <SEP> 54 <SEP> (62)
<tb> <SEP> i <SEP> 0 <SEP> 1 <SEP> 2 <SEP> 3 <SEP> 4 <SEP> 5 <SEP> 6 <SEP> 7
<tb>
<tb> p <SEP> | <SEP> Sp <SEP> | <SEP> Ep <SEP> (1) <SEP> = <SEP> {posi,p <SEP> (1) <SEP> }
<tb> 0 <SEP> tl <SEP> 1 <SEP> 9 <SEP> 17 <SEP> 25 <SEP> | <SEP> 33 <SEP> | <SEP> 41 <SEP> 49 <SEP> | <SEP> 57
<tb> 1 <SEP> il <SEP> 3 <SEP> 11 <SEP> 19 <SEP> 27 <SEP> 35 <SEP> 43 <SEP> 51 <SEP> 59
<tb> 2 <SEP> +1 <SEP> 5 <SEP> 13 <SEP> 21 <SEP> 29 <SEP> 37 <SEP> 45 <SEP> 53 <SEP> (61)
<tb> 3 <SEP> il <SEP> 7 <SEP> 15 <SEP> 23 <SEP> 31 <SEP> 39 <SEP> 47 <SEP> 55 <SEP> (63)
<tb> <SEP> i <SEP> | <SEP> 0 <SEP> 1 <SEP> 2 <SEP> 3 <SEP> 4 <SEP> 5 <SEP> 6 <SEP> 7
<tb>
TABLEAU IV
Le répertoire contient K=M. (L' )N=8192 mots de code.
<tb> 0 <SEP> tl <SEP> 1 <SEP> 9 <SEP> 17 <SEP> 25 <SEP> | <SEP> 33 <SEP> | <SEP> 41 <SEP> 49 <SEP> | <SEP> 57
<tb> 1 <SEP> il <SEP> 3 <SEP> 11 <SEP> 19 <SEP> 27 <SEP> 35 <SEP> 43 <SEP> 51 <SEP> 59
<tb> 2 <SEP> +1 <SEP> 5 <SEP> 13 <SEP> 21 <SEP> 29 <SEP> 37 <SEP> 45 <SEP> 53 <SEP> (61)
<tb> 3 <SEP> il <SEP> 7 <SEP> 15 <SEP> 23 <SEP> 31 <SEP> 39 <SEP> 47 <SEP> 55 <SEP> (63)
<tb> <SEP> i <SEP> | <SEP> 0 <SEP> 1 <SEP> 2 <SEP> 3 <SEP> 4 <SEP> 5 <SEP> 6 <SEP> 7
<tb>
TABLEAU IV
Le répertoire contient K=M. (L' )N=8192 mots de code.
13 bits sont donc nécessaires pour coder les positions, plus 4 bits donnant les signes des impulsions. Les paramètres de synthèse étant codés comme dans le cas des exemples 1 et 2, le codeur produit 153 bits par trame, ce qui représente un débit de 5,1 kbit/s.
Dans cet exemple, la mise en oeuvre de l'invention permet de diviser par 9,8 la taille de la mémoire requise au codeur pour stocker les composantes de la matrice de covariance, la réduction de mémoire vive requise étant de 3680 mots de 16 bits (416 composantes utiles de la matrice U au lieu de (#L'N)=4096). Le second mode de réalisation de l'invention, appliqué sans la procédure sous-optimale, nécessiterait de stocker 832 composantes de la matrice U.
Claims (7)
1. Procédé de codage de parole à prédiction linéaire et excitation par codes (CELP), dans lequel on numérise un signal de parole en trames successives de L échantillons, on détermine de manière adaptative d'une part des paramètres de synthèse définissant des filtres de synthèse, et d'autre part des paramètres d'excitation incluant pour chaque trame des positions d'impulsions d'un code d'excitation de L échantillons appartenant à un répertoire algébrique prédéterminé et un gain d'excitation associé, et on transmet des valeurs de quantification représentatives des paramètres déterminés, dans lequel le répertoire algébrique est défini à partir d'au moins un groupe de N ensembles (Eo E1, ....
avec 0#p < q < N, posi,p et posj,q deésignant respectivement les positions d'ordre i et j dans les ensembles (EptEq) dudit groupe contenant des positions possibles pour les impulsions p et q des codes du répertoire.
avec OSptN et celles de la forme :
caractérisé en ce que les composantes mémorisées de la matrice de covariance sont seulement, pour au moins un groupe de N ensembles, celles de la forme
N ensembles de positions d'un groupe, et dans lequel la détermination des paramètres d'excitation relatifs à une trame comporte la sélection d'un code du répertoire qui 2 maximise la quantité Pk2/a k2 dans laquelle Pk = D.ckT désigne le produit scalaire entre le code ck du répertoire et un vecteur cible D dépendant du signal de parole de la trame et des paramètres de synthèse, et ak2 désigne l'énergie sur la trame du code ck filtré par un filtre composé des filtres de synthèse et d'un filtre de pondération perceptuelle, le calcul des énergies α;k comportant un calcul et une mémorisation de composantes d'une matrice de covariance U = HT H où H désigne une matrice triangulaire inférieure de Toeplitz à L lignes et L colonnes formée à partir de la réponse impulsionnelle h(O), h(l),..., h(L-l) dudit filtre composé,
EN-l) de positions d'impulsion possibles dans des codes d'au moins L échantillons, un code du répertoire étant représenté par N positions d'impulsion appartenant respectivement aux
2. Procédé selon la revendication 1, caractérisé en ce que, pour un groupe de N ensembles, lesdites composantes mémorisées de la matrice de covariance sont structurées sous la forme de N vecteurs de corrélations et N(N-l)/2 matrices de corrélations, chaque vecteur de corrélations Rp,p étant associé à un numéro d'impulsion p dans les codes du répertoire (0 # p < N) et étant de dimension Lp' égale au cardinal de l'ensemble (Ep) dudit groupe qui contient des positions possibles pour l'impulsion p, avec des composantes i (0#i < Lp') de la forme Rp,p (i)=U(posi.p.posi.p) , et chaque matrice de corrélations Rp,q étant associée à deux numéros d'impulsion différents p,q dans les codes du répertoire (0#p < q < N) et ayant Lp' lignes et Lq colonnes, avec des composantes de la forme Rp.q (i.j) = U(posi.p.posj.q) à la ligne i et à la colonne j (Osi < Lp' et
3.Procédé selon la revendication 2, caractérisé en ce que les ensembles (E0, E1, ..., EN-1) dudit groupe qui contiennent des positions possibles pour une impulsion des codes du répertoire ont tous le même cardinal L', la position d'ordre i dans l'ensemble (Ep) des positions possibles pour l'impulsion p (0#i < L', Osp < N) étant donnée par :
posi.p= #.(iN+p) + #, 8 et étant deux entiers tels que 6 > O et 2 O.
4. Procédé selon la revendication 2, caractérisé en ce que le répertoire algébrique est défini à partir de M groupes de N ensembles de L positions possibles pour une impulsion d'un code du répertoire, avec M > 1, la position d'ordre i dans l'ensemble (Ep (m) ) du groupe m contenant des positions possibles pour l'impulsion p (0#i < L' , 0#m < M, 0#p < N) étant donnée par: posi,p (m) = #. (iN+p) +# (m) #, # (0) ,..., # (M-1) étant des entiers tels que 0 # < # (M-1) < #.
5. Procédé selon la revendication 4, caractérisé en ce que les vecteurs de corrélations (Rp,p (m)) et les matrices de corrélations (Rp.q (m)) sont mémorisés seulement pour F des groupes, étant un entier tel que 1 l4LM.
6. Procédé selon la revendication 3, 4 ou 5, caractérisé en ce que le calcul des N vecteurs de corrélations relatifs à un groupe comprend une initialisation d'une variable entière k et d'une variable d'accumulation cor, et une boucle indexée par un entier i décroissant de L'-l à 0, l'itération i dans ladite boucle comprenant les calculs successifs des composantes Rp,p < i) desdits vecteurs pour p décroissant de N-l à 0, une composante Rp ,p pris étant prise égale à la variable d'accumulation cor après # incrémentations de la variable entière k et 8 additions correspondantes des termes h(k).h(k) à la variable d'accumulation cor.
7. Procédé selon la revendication 3, 4 ou 5, caractérisé en ce que le calcul des N(N-1)/2 matrices de corrélations relatives à un groupe comprend, pour tout entier t dans l'intervalle [1, N-1] et tout entier d dans l'intervalle [0,L'-1], une initialisation d'une variable entière k et d'une variable d'accumulation cor, et une boucle < Bt,d.) indexée par un entier i décroissant de L'-1-d' à 0, l'itération i dans ladite boucle comprenant les calculs successifs des composantes Rp,p+t (i,i+d') desdites matrices pour p décroissant de N-l-t à O puis, si i > O, les calculs successifs des composantes Rq,q+N-t (i+d',i-1) desdites matrices pour q décroissant de t-1 à 0, une composante
Rp,p+t (i,i+d') ou Rq.q+N-t (i+d',i-1) étant prise égale à la variable d'accumulation cor après s incrémentations de la variable entière k et 8 additions correspondantes des termes h(k).h(k+d) à la variable d'accumulation cor, avec d = #. (t+d'N).
Priority Applications (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9500133A FR2729245B1 (fr) | 1995-01-06 | 1995-01-06 | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
EP96901020A EP0749626B1 (fr) | 1995-01-06 | 1996-01-04 | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
CA002182386A CA2182386C (fr) | 1995-01-06 | 1996-01-04 | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
DE69604729T DE69604729T2 (de) | 1995-01-06 | 1996-01-04 | Verfahren zur sprachkodierung mittels linearer prädiktion und anregung durch algebraische kodes |
JP52078896A JP3481251B2 (ja) | 1995-01-06 | 1996-01-04 | 代数的符号励振線形予測音声符号化方法 |
PCT/FR1996/000017 WO1996021221A1 (fr) | 1995-01-06 | 1996-01-04 | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
US08/682,721 US5717825A (en) | 1995-01-06 | 1996-01-04 | Algebraic code-excited linear prediction speech coding method |
KR1019960704904A KR100389693B1 (ko) | 1995-01-06 | 1996-01-04 | 선형예측및대수코드여기를사용하는음성코딩방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9500133A FR2729245B1 (fr) | 1995-01-06 | 1995-01-06 | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
Publications (2)
Publication Number | Publication Date |
---|---|
FR2729245A1 true FR2729245A1 (fr) | 1996-07-12 |
FR2729245B1 FR2729245B1 (fr) | 1997-04-11 |
Family
ID=9474930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FR9500133A Expired - Lifetime FR2729245B1 (fr) | 1995-01-06 | 1995-01-06 | Procede de codage de parole a prediction lineaire et excitation par codes algebriques |
Country Status (8)
Country | Link |
---|---|
US (1) | US5717825A (fr) |
EP (1) | EP0749626B1 (fr) |
JP (1) | JP3481251B2 (fr) |
KR (1) | KR100389693B1 (fr) |
CA (1) | CA2182386C (fr) |
DE (1) | DE69604729T2 (fr) |
FR (1) | FR2729245B1 (fr) |
WO (1) | WO1996021221A1 (fr) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0930608A1 (fr) * | 1998-01-13 | 1999-07-21 | Lucent Technologies Inc. | Vocoder à codage par vecteurs d'excitation résistant aux erreurs |
Families Citing this family (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2729246A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
FR2729247A1 (fr) * | 1995-01-06 | 1996-07-12 | Matra Communication | Procede de codage de parole a analyse par synthese |
US5646867A (en) * | 1995-07-24 | 1997-07-08 | Motorola Inc. | Method and system for improved motion compensation |
JP3094908B2 (ja) * | 1996-04-17 | 2000-10-03 | 日本電気株式会社 | 音声符号化装置 |
JP3707154B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | 音声符号化方法及び装置 |
DE19641619C1 (de) * | 1996-10-09 | 1997-06-26 | Nokia Mobile Phones Ltd | Verfahren zur Synthese eines Rahmens eines Sprachsignals |
US5970444A (en) * | 1997-03-13 | 1999-10-19 | Nippon Telegraph And Telephone Corporation | Speech coding method |
US5924062A (en) * | 1997-07-01 | 1999-07-13 | Nokia Mobile Phones | ACLEP codec with modified autocorrelation matrix storage and search |
US6266412B1 (en) * | 1998-06-15 | 2001-07-24 | Lucent Technologies Inc. | Encrypting speech coder |
US6556966B1 (en) | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
US6714907B2 (en) * | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
JP4005359B2 (ja) | 1999-09-14 | 2007-11-07 | 富士通株式会社 | 音声符号化及び音声復号化装置 |
WO2001024166A1 (fr) * | 1999-09-30 | 2001-04-05 | Stmicroelectronics Asia Pacific Pte Ltd | Codeur audio g.723.1 |
JP3449339B2 (ja) * | 2000-06-08 | 2003-09-22 | 日本電気株式会社 | 復号化装置および復号化方法 |
US7363219B2 (en) * | 2000-09-22 | 2008-04-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
JP3449348B2 (ja) * | 2000-09-29 | 2003-09-22 | 日本電気株式会社 | 相関行列学習方法および装置ならびに記憶媒体 |
JP3536921B2 (ja) * | 2001-04-18 | 2004-06-14 | 日本電気株式会社 | 相関行列学習方法、装置及びプログラム |
DE10140507A1 (de) * | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
US7383283B2 (en) * | 2001-10-16 | 2008-06-03 | Joseph Carrabis | Programable method and apparatus for real-time adaptation of presentations to individuals |
US8655804B2 (en) | 2002-02-07 | 2014-02-18 | Next Stage Evolution, Llc | System and method for determining a characteristic of an individual |
US8195597B2 (en) * | 2002-02-07 | 2012-06-05 | Joseph Carrabis | System and method for obtaining subtextual information regarding an interaction between an individual and a programmable device |
JP4290917B2 (ja) * | 2002-02-08 | 2009-07-08 | 株式会社エヌ・ティ・ティ・ドコモ | 復号装置、符号化装置、復号方法、及び、符号化方法 |
US7003461B2 (en) * | 2002-07-09 | 2006-02-21 | Renesas Technology Corporation | Method and apparatus for an adaptive codebook search in a speech processing system |
EP1383109A1 (fr) * | 2002-07-17 | 2004-01-21 | STMicroelectronics N.V. | Procédé et dispositif d'encodage de la parole à bande élargie |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
GB0307752D0 (en) * | 2003-04-03 | 2003-05-07 | Seiko Epson Corp | Apparatus for algebraic codebook search |
FI118835B (fi) * | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
KR100668299B1 (ko) * | 2004-05-12 | 2007-01-12 | 삼성전자주식회사 | 구간별 선형양자화를 이용한 디지털 신호 부호화/복호화방법 및 장치 |
SG123639A1 (en) | 2004-12-31 | 2006-07-26 | St Microelectronics Asia | A system and method for supporting dual speech codecs |
JP3981399B1 (ja) * | 2006-03-10 | 2007-09-26 | 松下電器産業株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
KR101542069B1 (ko) * | 2006-05-25 | 2015-08-06 | 삼성전자주식회사 | 고정 코드북 검색 방법 및 장치와 그를 이용한 음성 신호의부호화/복호화 방법 및 장치 |
RU2439721C2 (ru) | 2007-06-11 | 2012-01-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Аудиокодер для кодирования аудиосигнала, имеющего импульсоподобную и стационарную составляющие, способы кодирования, декодер, способ декодирования и кодированный аудиосигнал |
CN101842833B (zh) * | 2007-09-11 | 2012-07-18 | 沃伊斯亚吉公司 | 语音和音频编码中快速代数码本搜索的方法和设备 |
ATE500588T1 (de) | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
CN101615394B (zh) | 2008-12-31 | 2011-02-16 | 华为技术有限公司 | 分配子帧的方法和装置 |
WO2012095924A1 (fr) * | 2011-01-14 | 2012-07-19 | パナソニック株式会社 | Dispositif de codage, dispositif de traitement de communication et procédé de codage |
CN102623012B (zh) * | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
WO2014053261A1 (fr) * | 2012-10-05 | 2014-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Appareil pour coder un signal de parole employant acelp dans le domaine d'autocorrélation |
EP2919232A1 (fr) * | 2014-03-14 | 2015-09-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codeur, décodeur et procédé de codage et de décodage |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0296764A1 (fr) * | 1987-06-26 | 1988-12-28 | AT&T Corp. | Vocoder à prédiction linéaire excité par codes |
EP0379296A2 (fr) * | 1989-01-17 | 1990-07-25 | AT&T Corp. | Codeur à prédiction linéaire excité par codes pour signaux de paroles ou à basse fréquence fonctionnant avec un faible retard |
EP0424121A2 (fr) * | 1989-10-17 | 1991-04-24 | Kabushiki Kaisha Toshiba | Dispositif de codage de la parole |
WO1991013432A1 (fr) * | 1990-02-23 | 1991-09-05 | Universite De Sherbrooke | Manuel de codage dynamique pour une articulation efficace, avec codage base sur des codes algebriques |
EP0497479A1 (fr) * | 1991-01-28 | 1992-08-05 | AT&T Corp. | Méthode et appareil de génération d'information pour accélérer une recherche dans un dictionnaire de représentant à faible densité |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1229681A (fr) * | 1984-03-06 | 1987-11-24 | Kazunori Ozawa | Methode et appareil de codage de signaux dans la bande de frequences vocales |
CA1255802A (fr) * | 1984-07-05 | 1989-06-13 | Kazunori Ozawa | Codage et decodage de signaux a faible debit binaire utilisant un nombre restreint d'impulsions d'excitation |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
EP0422232B1 (fr) * | 1989-04-25 | 1996-11-13 | Kabushiki Kaisha Toshiba | Codeur vocal |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
FR2700632B1 (fr) * | 1993-01-21 | 1995-03-24 | France Telecom | Système de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués. |
-
1995
- 1995-01-06 FR FR9500133A patent/FR2729245B1/fr not_active Expired - Lifetime
-
1996
- 1996-01-04 US US08/682,721 patent/US5717825A/en not_active Expired - Lifetime
- 1996-01-04 JP JP52078896A patent/JP3481251B2/ja not_active Expired - Lifetime
- 1996-01-04 EP EP96901020A patent/EP0749626B1/fr not_active Expired - Lifetime
- 1996-01-04 DE DE69604729T patent/DE69604729T2/de not_active Expired - Lifetime
- 1996-01-04 WO PCT/FR1996/000017 patent/WO1996021221A1/fr active IP Right Grant
- 1996-01-04 CA CA002182386A patent/CA2182386C/fr not_active Expired - Lifetime
- 1996-01-04 KR KR1019960704904A patent/KR100389693B1/ko not_active IP Right Cessation
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0296764A1 (fr) * | 1987-06-26 | 1988-12-28 | AT&T Corp. | Vocoder à prédiction linéaire excité par codes |
EP0379296A2 (fr) * | 1989-01-17 | 1990-07-25 | AT&T Corp. | Codeur à prédiction linéaire excité par codes pour signaux de paroles ou à basse fréquence fonctionnant avec un faible retard |
EP0424121A2 (fr) * | 1989-10-17 | 1991-04-24 | Kabushiki Kaisha Toshiba | Dispositif de codage de la parole |
WO1991013432A1 (fr) * | 1990-02-23 | 1991-09-05 | Universite De Sherbrooke | Manuel de codage dynamique pour une articulation efficace, avec codage base sur des codes algebriques |
EP0497479A1 (fr) * | 1991-01-28 | 1992-08-05 | AT&T Corp. | Méthode et appareil de génération d'information pour accélérer une recherche dans un dictionnaire de représentant à faible densité |
Non-Patent Citations (2)
Title |
---|
DELPRAT ET AL.: "A 6 kbps regular pulse CELP coder for mobile radio communications", ADVANCES IN SPEECH CODING, 1 January 1991 (1991-01-01), BOSTON, US, pages 179 - 188 * |
STEGER: "On the use of a constant autocorrelation codebook for CELP coding", SIGNAL PROCESSING VI, PROCEEDINGS OF EUSIPCO 92, vol. 1, 24 August 1992 (1992-08-24) - 27 August 1992 (1992-08-27), BRUXELLES, BE, pages 467 - 470 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0930608A1 (fr) * | 1998-01-13 | 1999-07-21 | Lucent Technologies Inc. | Vocoder à codage par vecteurs d'excitation résistant aux erreurs |
Also Published As
Publication number | Publication date |
---|---|
DE69604729D1 (de) | 1999-11-25 |
DE69604729T2 (de) | 2002-07-25 |
EP0749626A1 (fr) | 1996-12-27 |
WO1996021221A1 (fr) | 1996-07-11 |
US5717825A (en) | 1998-02-10 |
JP3481251B2 (ja) | 2003-12-22 |
CA2182386C (fr) | 2003-09-09 |
KR970701901A (ko) | 1997-04-12 |
CA2182386A1 (fr) | 1996-07-11 |
FR2729245B1 (fr) | 1997-04-11 |
KR100389693B1 (ko) | 2003-12-01 |
EP0749626B1 (fr) | 1999-10-20 |
JPH10502191A (ja) | 1998-02-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0749626B1 (fr) | Procede de codage de parole a prediction lineaire et excitation par codes algebriques | |
EP0608174B1 (fr) | Systeme de codage-décodage prédictif d'un signal numérique de parole par transformée adaptative à codes imbriqués | |
KR930010399B1 (ko) | 특정 여기 코드 워드 선택 방법 | |
FR2731548A1 (fr) | Recherche profondeur d'abord dans un repertoire algebrique pour un encodage rapide de la paroie | |
EP0801790B1 (fr) | Procede de codage de parole a analyse par synthese | |
FR2742568A1 (fr) | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application | |
FR2706064A1 (fr) | Procédé et dispositif de quantitication vectorielle. | |
EP1994531A2 (fr) | Codage/decodage perfectionnes d'un signal audionumerique, en technique celp | |
EP0801788B1 (fr) | Procede de codage de parole a analyse par synthese | |
EP0721180B1 (fr) | Procédé de codage de parole à analyse par synthèse | |
EP0428445B1 (fr) | Procédé et dispositif de codage de filtres prédicteurs de vocodeurs très bas débit | |
WO2005066936A1 (fr) | Transcodage entre indices de dictionnaires multi-impulsionnels utilises en codage en compression de signaux numeriques | |
EP1836699B1 (fr) | Procédé et dispositif de codage audio optimisé entre deux modèles de prediction à long terme | |
FR2702590A1 (fr) | Dispositif de codage et de décodage numériques de la parole, procédé d'exploration d'un dictionnaire pseudo-logarithmique de délais LTP, et procédé d'analyse LTP. | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
WO2011144863A1 (fr) | Codage avec mise en forme du bruit dans un codeur hierarchique | |
EP0796490B1 (fr) | Methode et dispositif de prediction de signal pour un codeur de parole | |
JP4007730B2 (ja) | 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体 | |
JP3284874B2 (ja) | 音声符号化装置 | |
FR2709366A1 (fr) | Procédé de stockage de vecteurs de coefficient de réflexion. | |
WO2002029786A1 (fr) | Procede et dispositif de codage segmental d'un signal audio | |
FR2709387A1 (fr) | Système de communication radio. | |
FR2980620A1 (fr) | Traitement d'amelioration de la qualite des signaux audiofrequences decodes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TP | Transmission of property |